論文の概要: Geometry-Guided Self-Supervision for Ultra-Fine-Grained Recognition with Limited Data
- arxiv url: http://arxiv.org/abs/2604.19345v1
- Date: Tue, 21 Apr 2026 11:27:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.740027
- Title: Geometry-Guided Self-Supervision for Ultra-Fine-Grained Recognition with Limited Data
- Title(参考訳): 限られたデータを用いた超微細粒認識のための幾何学誘導自己スーパービジョン
- Authors: Shijie Wang, Yadan Luo, Zijian Wang, Haojie Li, Zi Huang, Mahsa Baktashmotlagh,
- Abstract要約: 本稿では,非常に類似した物体の内在的幾何学的特徴について検討する。
GAEor(Geometric Attribute Exploration Network)と呼ばれる,汎用的な自己管理型フレームワークを導入する。
GAEorは、新しい代替認識手段として幾何学的属性を生成する。
- 参考スコア(独自算出の注目度): 73.20753799870282
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper investigates the intrinsic geometrical features of highly similar objects and introduces a general self-supervised framework called the Geometric Attribute Exploration Network (GAEor), which is designed to address the ultra-fine-grained visual categorization (Ultra-FGVC) task in data-limited scenarios. Unlike prior work that often captures subtle yet critical distinctions, GAEor generates geometric attributes as novel alternative recognition cues. These attributes are determined by various details within the object, aligned with its geometric patterns, such as the intricate vein structures in soybean leaves. Crucially, each category exhibits distinct geometric descriptors that serve as powerful cues, even among objects with minimal visual variation -- a factor largely overlooked in recent research. GAEor discovers these geometric attributes by first amplifying geometry-relevant details via visual feedback from a backbone network, then embedding the relative polar coordinates of these details into the final representation. Extensive experiments demonstrate that GAEor significantly sets new state-of-the-art records in five widely-used Ultra-FGVC benchmarks.
- Abstract(参考訳): 本稿では,非常に類似したオブジェクトの内在的な幾何学的特徴を考察し,データ限定シナリオにおける超きめ細かな視覚的分類(Ultra-FGVC)タスクに対処するGeometric Attribute Exploration Network (GAEor)と呼ばれる,汎用的な自己監督型フレームワークを提案する。
微妙だが批判的な区別をしばしば捉える以前の作品とは異なり、GAEorは幾何学的属性を新しい代替認識手段として生成する。
これらの属性は、大豆の葉の複雑な静脈構造などの幾何学的パターンに沿って、オブジェクト内の様々な詳細によって決定される。
重要な点として、各カテゴリは、視覚的変化が最小限であるオブジェクトであっても、強力な手がかりとして機能する異なる幾何学的記述子を示す。
GAEorはこれらの幾何学的属性を発見し、まず背骨ネットワークからの視覚的フィードバックによって幾何学的関連の詳細を増幅し、次にこれらの詳細の相対的な極座標を最終表現に埋め込む。
GAEorは5つの広く使われているUltra-FGVCベンチマークにおいて、新しい最先端のレコードを著しく設定している。
関連論文リスト
- Zero-shot Generalizable Graph Anomaly Detection with Mixture of Riemannian Experts [33.295461492913354]
Graph Anomaly Detection (GAD)は、グラフデータの不規則なパターンを特定することを目的としている。
既存のゼロショットGAD法は、様々な異常パターンの固有の幾何学的差異を無視している。
ゼロショット一般化可能なグラフ異常検出のための新しいフレームワークであるGAD-MoREを提案する。
論文 参考訳(メタデータ) (2026-02-06T16:46:30Z) - GeoGNN: Quantifying and Mitigating Semantic Drift in Text-Attributed Graphs [59.61242815508687]
テキスト分散グラフ(TAG)上のグラフニューラルネットワーク(GNN)は、事前訓練された言語モデル(PLM)を使用してノードテキストを符号化し、これらの埋め込みを線形近傍アグリゲーションを通じて伝播する。
本研究は,意味的ドリフトの度合いを計測する局所PCAベースの計量を導入し,異なる凝集機構が多様体構造にどのように影響するかを解析するための最初の定量的枠組みを提供する。
論文 参考訳(メタデータ) (2025-11-12T06:48:43Z) - VGD: Visual Geometry Gaussian Splatting for Feed-Forward Surround-view Driving Reconstruction [26.668204454537246]
我々は,この課題に対処すべく,新しいフィードフォワードエンドツーエンド学習フレームワークであるtextbfVisual Gaussian Driving (VGD)を紹介した。
提案手法は, 客観的指標と主観的品質の両方において, 種々の条件下で, 最先端の手法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2025-10-22T13:28:49Z) - Geometry-Editable and Appearance-Preserving Object Compositon [67.98806888489385]
汎用オブジェクト合成(GOC)は、対象オブジェクトを望まれる幾何学的性質を持つ背景シーンにシームレスに統合することを目的としている。
近年のアプローチは意味的埋め込みを導出し、それらを高度な拡散モデルに統合し、幾何学的に編集可能な生成を可能にする。
本稿では,まずセマンティックな埋め込みを活用して,所望の幾何学的変換を暗黙的にキャプチャするDistangled Geometry-editable and Outearance-Preserving Diffusionモデルを提案する。
論文 参考訳(メタデータ) (2025-05-27T09:05:28Z) - Global graph features unveiled by unsupervised geometric deep learning [0.0]
GAUDIは,局所的な詳細とグローバルな構造の両方を捉えるために設計された,教師なしの新たなディープラーニングフレームワークである。
GAUDIはそれらを構造的かつ連続的な潜伏空間の近傍領域に一貫してマッピングし、事実上ノイズからプロセスレベルの特徴を引き離す。
我々は,小世界のモデリング,タンパク質集合体のキャラクタリゼーション,Vicsekモデルにおける集団運動の解析,脳接続の年齢変化の同定など,複数のアプリケーションにまたがるGAUDIの汎用性を実証した。
論文 参考訳(メタデータ) (2025-03-07T16:38:41Z) - Manifold Integrated Gradients: Riemannian Geometry for Feature Attribution [8.107199775668942]
Integrated Gradients (IG)は、ブラックボックス深層学習モデルの一般的な特徴属性法である。
我々は、IGに関連する2つの主要な課題に対処する。ノイズの多い特徴可視化の生成と、敵の帰属攻撃に対する脆弱性である。
提案手法は,データ多様体の内在的幾何とより密接に関連し,経路に基づく特徴属性の適応を伴う。
論文 参考訳(メタデータ) (2024-05-16T04:13:17Z) - A Survey of Geometric Graph Neural Networks: Data Structures, Models and Applications [71.809127869349]
本稿では、幾何学的メッセージパッシングの観点から、既存のモデルの統一的なビューを提供するデータ構造として幾何学的グラフを定式化する。
また、方法論開発と実験評価の後の研究を促進するために、アプリケーションと関連するデータセットを要約する。
論文 参考訳(メタデータ) (2024-03-01T12:13:04Z) - The geometry of hidden representations of large transformer models [43.16765170255552]
大規模トランスは、さまざまなデータタイプをまたいだ自己教師型データ分析に使用される強力なアーキテクチャである。
データセットのセマンティック構造は、ある表現と次の表現の間の変換のシーケンスから現れることを示す。
本研究は,データセットのセマンティクス情報が第1ピークの終わりによりよく表現されることを示し,この現象を多種多様なデータセットで訓練された多くのモデルで観測できることを示した。
論文 参考訳(メタデータ) (2023-02-01T07:50:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。