論文の概要: Knot-10:A Tightness-Stratified Benchmark for Real-World Knot Classification with Topological Difficulty Analysis
- arxiv url: http://arxiv.org/abs/2603.23286v2
- Date: Wed, 25 Mar 2026 17:39:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 14:25:26.0853
- Title: Knot-10:A Tightness-Stratified Benchmark for Real-World Knot Classification with Topological Difficulty Analysis
- Title(参考訳): Knot-10:トポロジ的難易度分析を用いた実世界のノット分類のためのトポロジカルベンチマーク
- Authors: Shiheng Nie, Yunguang Yue,
- Abstract要約: 我々はKnots-10ベンチマークを導入し、配置指向の分割で1,440枚の画像で構成され、ゆるく結びついた結び目でトレーニングし、タイトな服装でテストする。
Swin-T と TransFG はどちらも平均97.2%の精度であり、PMG は94.5%であり、ジグソーシャッフルが連続性を阻害するという仮説と一致している。
分類精度を向上することなく埋め込みトポロジーアライメントを改善するTACA正則化を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Physical knot classification is a fine-grained visual classification (FGVC) scenario in which appearance cues are deliberately suppressed: different classes share the same rope material, color, and background, and class identity resides primarily in crossing structure. We introduce the Knots-10 benchmark, comprising 1,440 images with a deployment-oriented split that trains on loosely tied knots and tests on tightly dressed ones. Swin-T and TransFG both average 97.2% accuracy; PMG scores 94.5%, consistent with the hypothesis that jigsaw shuffling disrupts crossing continuity. McNemar tests cannot separate four of the five general-purpose backbones, so small ranking margins should be interpreted with caution. A Mantel permutation test shows that topological distance significantly correlates with confusion patterns in three of the five models (p < 0.01). We propose TACA regularization, which improves embedding-topology alignment from rho=0.46 to rho=0.65 without improving classification accuracy; a random-distance ablation yields comparable alignment, indicating the benefit is likely driven by generic regularization. A pilot cross-domain test with 100 phone photographs reveals a 58-69 percentage-point accuracy drop, exposing rope appearance bias as the dominant failure mode.
- Abstract(参考訳): 物理的結び目分類(英: physical knot classification)とは、視覚的分類(FGVC)のシナリオであり、異なるクラスが同じロープ素材、色、背景を共有し、クラスアイデンティティが主に交差構造に存在する。
我々はKnots-10ベンチマークを導入し、配置指向の分割で1,440枚の画像で構成され、ゆるく結びついた結び目でトレーニングし、タイトな服装でテストする。
Swin-T と TransFG はどちらも平均97.2%の精度であり、PMG は94.5%であり、ジグソーシャッフルが連続性を阻害するという仮説と一致している。
McNemarテストは5つの汎用バックボーンのうち4つを分離できないため、小さなランキングマージンを慎重に解釈する必要がある。
マンテル置換試験は、トポロジカル距離が5つのモデルのうち3つのモデル(p < 0.01)の混乱パターンと著しく相関していることを示している。
本稿では,Rho=0.46からRho=0.65への埋め込み位相アライメントを改善するTACA正則化を提案する。
100枚の電話写真によるパイロットクロスドメインテストでは、58-69ポイントの精度低下が示され、ロープの出現バイアスが支配的な障害モードとなっている。
関連論文リスト
- Fair Lung Disease Diagnosis from Chest CT via Gender-Adversarial Attention Multiple Instance Learning [6.302369456012738]
胸部CTボリュームからの多型肺疾患診断のためのフェアネス・アウェア・フレームワークについて検討した。
この課題は、CTスキャンを健康、新型コロナウイルス、腺癌、扁平上皮癌という4つのカテゴリに分類する必要がある。
我々のアプローチは、何百ものスライスにまたがるまばらな病理信号と、病気の階級と性別にまたがる深刻な人口不均衡の2つの問題に対処する。
論文 参考訳(メタデータ) (2026-03-13T13:42:52Z) - A Unified Framework for Joint Detection of Lacunes and Enlarged Perivascular Spaces [3.9313804276175506]
脳小血管疾患(CSVD)マーカー,特にEPVSとlacunaeは,医用画像解析においてユニークな課題である。
本稿では,Zero-Gated CrossTask Attention が高密度EPVSコンテキストを利用してスパースラグーン検出を誘導する形態分離フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-04T16:30:46Z) - Margin-Consistent Deep Subtyping of Invasive Lung Adenocarcinoma via Perturbation Fidelity in Whole-Slide Image Analysis [15.00702842825464]
浸潤性肺腺癌亜型に対する全スライディング画像分類は, 実際の画像摂動に対して脆弱である。
本研究では,143枚の全スライディング画像から203,226枚のパッチに対して評価したマージン整合性フレームワークを提案する。
提案手法は,Kendall相関によるトレーニング中の0.88,バリデーション時の0.64の頑健な特徴-論理空間アライメントを実現する。
論文 参考訳(メタデータ) (2026-02-27T20:47:15Z) - Variational Supervised Contrastive Learning [50.79938854370321]
本稿では,教師付きコントラスト学習を潜在クラス変数に対する変分推論として再構成した変分教師付きコントラスト学習(VarCon)を提案する。
VarConは対照的な学習フレームワークの最先端のパフォーマンスを達成し、ImageNet-1Kでは79.36%、CIFAR-100では78.29%、ResNet-50エンコーダでは78.29%に達した。
論文 参考訳(メタデータ) (2025-06-09T04:19:12Z) - Partial and Asymmetric Contrastive Learning for Out-of-Distribution
Detection in Long-Tailed Recognition [80.07843757970923]
既存のOOD検出手法は,トレーニングセットが長距離分布している場合,大幅な性能劣化に悩まされていることを示す。
本稿では,部分的および非対称的な教師付きコントラスト学習(PASCL)を提案する。
我々の手法は従来の最先端の手法を1.29%$, $1.45%$, $0.69%$異常検出偽陽性率(FPR)と$3.24%$, 4,.06%$, 7,89%$in-distributionで上回ります。
論文 参考訳(メタデータ) (2022-07-04T01:53:07Z) - (Certified!!) Adversarial Robustness for Free! [116.6052628829344]
逆方向の摂動が0.5の2ノルム以内であることに制約された場合,ImageNetでは71%の精度が証明された。
これらの結果は,モデルパラメータの微調整や再学習を必要とせず,事前学習した拡散モデルと画像分類器のみを用いて得られる。
論文 参考訳(メタデータ) (2022-06-21T17:27:27Z) - Semi-supervised learning for generalizable intracranial hemorrhage
detection and segmentation [0.0]
本研究は頭蓋内出血の検出・分節化のための半教師付き学習モデルの開発と評価である。
最初の「教師」ディープラーニングモデルは、2010年から2017年にかけて米国のある機関から収集された457ピクセルの頭部CTスキャンに基づいて訓練された。
2つ目の"学生"モデルは、このピクセルラベル付きデータセットと擬似ラベル付きデータセットの組み合わせでトレーニングされた。
論文 参考訳(メタデータ) (2021-05-03T00:14:43Z) - Selective Classification Can Magnify Disparities Across Groups [89.14499988774985]
選択的分類は平均的精度を向上させることができるが、既存の精度格差を同時に増大させることができる。
禁忌の増大は、一部のグループでのアキュラシーを減少させることもある。
我々は,グループ間で類似のフルカバレッジ精度を実現する分散ロバストモデルを訓練し,選択分類が各グループを均一に改善することを示す。
論文 参考訳(メタデータ) (2020-10-27T08:51:30Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。