論文の概要: Drawing Attention to Detail: Pose Alignment through Self-Attention for
Fine-Grained Object Classification
- arxiv url: http://arxiv.org/abs/2302.04800v1
- Date: Thu, 9 Feb 2023 17:47:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-10 14:58:21.140186
- Title: Drawing Attention to Detail: Pose Alignment through Self-Attention for
Fine-Grained Object Classification
- Title(参考訳): 詳細への描画注意:細粒度オブジェクト分類のための自己注意による詩のアライメント
- Authors: Salwa Al Khatib, Mohamed El Amine Boudjoghra, Jameel Hassan
- Abstract要約: 本稿では,エンド・ツー・エンドの注意に基づくアライメント・モジュールを提案する。
グラフマッチングコンポーネントを自己認識機構で置き換える。
注目モジュールは、グローバルな損失に貢献する前に、互いに参加しながら部品の最適配置を学習することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intra-class variations in the open world lead to various challenges in
classification tasks. To overcome these challenges, fine-grained classification
was introduced, and many approaches were proposed. Some rely on locating and
using distinguishable local parts within images to achieve invariance to
viewpoint changes, intra-class differences, and local part deformations. Our
approach, which is inspired by P2P-Net, offers an end-to-end trainable
attention-based parts alignment module, where we replace the graph-matching
component used in it with a self-attention mechanism. The attention module is
able to learn the optimal arrangement of parts while attending to each other,
before contributing to the global loss.
- Abstract(参考訳): オープンワールドにおけるクラス内変異は、分類タスクに様々な課題をもたらす。
これらの課題を克服するために、きめ細かい分類を導入し、多くのアプローチが提案された。
画像内の識別可能な局所的な部分の配置と利用に依存して、視点の変化、クラス内の違い、局所的な部分の変形を実現する。
我々のアプローチはP2P-Netにインスパイアされたもので、エンドツーエンドでトレーニング可能なアテンションベースのアライメントモジュールを提供しています。
注目モジュールは、グローバルな損失に貢献する前に、互いに参加しながら部品の最適配置を学習することができる。
関連論文リスト
- Point Cloud Understanding via Attention-Driven Contrastive Learning [64.65145700121442]
トランスフォーマーベースのモデルは、自己認識機構を活用することにより、先進的なポイントクラウド理解を持つ。
PointACLは、これらの制限に対処するために設計された、注意駆動のコントラスト学習フレームワークである。
本手法では, 注意駆動型動的マスキング手法を用いて, モデルが非集中領域に集中するように誘導する。
論文 参考訳(メタデータ) (2024-11-22T05:41:00Z) - Part-guided Relational Transformers for Fine-grained Visual Recognition [59.20531172172135]
識別的特徴を学習し,特徴変換モジュールとの相関関係を探索するフレームワークを提案する。
提案手法は,3-of-the-levelオブジェクト認識において,部分ブランチの追加に頼らず,最先端の性能に達する。
論文 参考訳(メタデータ) (2022-12-28T03:45:56Z) - Part-aware Prototypical Graph Network for One-shot Skeleton-based Action
Recognition [57.86960990337986]
ワンショットスケルトンに基づくアクション認識は、ベースクラスから新しいクラスへの変換可能な表現を学習する上で、ユニークな課題となる。
単発骨格に基づく行動認識のためのパートアウェアなプロトタイプ表現を提案する。
本手法の有効性を2つの公開骨格に基づく行動認識データセットに示す。
論文 参考訳(メタデータ) (2022-08-19T04:54:56Z) - Improving Few-Shot Part Segmentation using Coarse Supervision [32.34210260693939]
重要な課題は、これらのアノテーションが異なるタスクと異なるラベルスタイルで収集され、簡単にパートラベルにマッピングできないことである。
我々は,ラベル形式と部分分割モデルとの依存関係を共同で学習し,多様なラベルからの監督を活用できるようにする。
提案手法は,スパーススーパービジョンを利用するために手動で設計した損失関数に依存するマルチタスク学習,半教師付き学習,競争的手法に基づくベースラインよりも優れている。
論文 参考訳(メタデータ) (2022-04-11T20:25:14Z) - Fine-Grained Object Classification via Self-Supervised Pose Alignment [42.55938966190932]
我々は,クラス間の自己教師型ポーズアライメントのための局所部分のグローバルな構成を明らかにするために,新しいグラフベースのオブジェクト表現を学習する。
提案手法を3つの評価対象分類ベンチマークで評価し,最先端性能を継続的に達成した。
論文 参考訳(メタデータ) (2022-03-30T01:46:19Z) - Transfer beyond the Field of View: Dense Panoramic Semantic Segmentation
via Unsupervised Domain Adaptation [30.104947024614127]
パノラマ的セマンティックセグメンテーションのための教師なしドメイン適応のタスクを形式化する。
DensePASSはドメイン横断条件下でのパノラマセグメンテーションのための新しいデータセットである。
P2PDAはPinhole-to-Panoramicセマンティックセグメンテーションのための汎用フレームワークである。
論文 参考訳(メタデータ) (2021-10-21T11:22:05Z) - Feature Boosting, Suppression, and Diversification for Fine-Grained
Visual Classification [0.0]
識別的局所領域からの特徴表現の学習は、きめ細かい視覚的分類において重要な役割を担っている。
既存の畳み込みニューラルネットワークに簡単に接続できる2つの軽量モジュールを導入する。
本手法は,いくつかのベンチマークきめ細かなデータセットにおいて最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-03-04T01:49:53Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z) - SceneEncoder: Scene-Aware Semantic Segmentation of Point Clouds with A
Learnable Scene Descriptor [51.298760338410624]
本研究では,グローバル情報の効果を高めるために,シーン認識型ガイダンスを付加するSceneEncoderモジュールを提案する。
モジュールはシーン記述子を予測し、シーンに存在するオブジェクトのカテゴリを表現することを学習する。
また,同じラベルを持つ隣接点に対する特徴の識別を伝搬する領域類似度損失を設計する。
論文 参考訳(メタデータ) (2020-01-24T16:53:30Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。