論文の概要: Self-Attention with State-Object Weighted Combination for Compositional Zero Shot Learning
- arxiv url: http://arxiv.org/abs/2512.18969v1
- Date: Mon, 22 Dec 2025 02:30:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.589324
- Title: Self-Attention with State-Object Weighted Combination for Compositional Zero Shot Learning
- Title(参考訳): 合成ゼロショット学習のための状態物体重み付けによる自己注意
- Authors: Cheng-Hong Chang, Pei-Hsuan Tsai,
- Abstract要約: 状態とオブジェクトの両方を同時に認識する能力は、依然としてあまり一般的ではない。
これを解決する1つのアプローチは、トレーニング中に状態とオブジェクトを単一のカテゴリとして扱うことである。
このアプローチは、すべての可能な組み合わせに対して包括的なデータを必要とするため、データ収集とトレーニングにおいて課題となる。
本研究では,コンポジション認識精度を向上しつつ,状態とオブジェクトの重み付けを考慮したKG-SPの強化であるSASOWを提案する。
- 参考スコア(独自算出の注目度): 1.9336815376402718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object recognition has become prevalent across various industries. However, most existing applications are limited to identifying objects alone, without considering their associated states. The ability to recognize both the state and object simultaneously remains less common. One approach to address this is by treating state and object as a single category during training. However, this approach poses challenges in data collection and training since it requires comprehensive data for all possible combinations. Compositional Zero-shot Learning (CZSL) emerges as a viable solution by treating the state and object as distinct categories during training. CZSL facilitates the identification of novel compositions even in the absence of data for every conceivable combination. The current state-of-the-art method, KG-SP, addresses this issue by training distinct classifiers for states and objects, while leveraging a semantic model to evaluate the plausibility of composed compositions. However, KG-SP's accuracy in state and object recognition can be further improved, and it fails to consider the weighting of states and objects during composition. In this study, we propose SASOW, an enhancement of KG-SP that considers the weighting of states and objects while improving composition recognition accuracy. First, we introduce self-attention mechanisms into the classifiers for states and objects, leading to enhanced accuracy in recognizing both. Additionally, we incorporate the weighting of states and objects during composition to generate more reasonable and accurate compositions. Our validation process involves testing SASOW on three established benchmark datasets. Experimental outcomes affirm when compared against OW-CZSL approach, KG-SP, SASOW showcases improvements of 2.1%, 1.7%, and 0.4% in terms of accuracy for unseen compositions across the MIT-States, UT Zappos, and C-GQA datasets, respectively.
- Abstract(参考訳): 物体認識は様々な産業で普及している。
しかし、既存のほとんどのアプリケーションは、関連する状態を考慮せずに、オブジェクトのみを識別することに制限されている。
状態とオブジェクトの両方を同時に認識する能力は、依然としてあまり一般的ではない。
これを解決する1つのアプローチは、トレーニング中に状態とオブジェクトを単一のカテゴリとして扱うことである。
しかしながら、このアプローチは、すべての可能な組み合わせに対して包括的なデータを必要とするため、データ収集とトレーニングにおいて課題となる。
コンポジションゼロショット学習(CZSL)は、トレーニング中に状態とオブジェクトを別のカテゴリとして扱うことで、実行可能なソリューションとして現れる。
CZSLは、知覚可能な組み合わせごとにデータがない場合でも、新規な組成物の同定を容易にする。
現在の最先端手法であるKG-SPは、コンポジションの妥当性を評価するために意味モデルを活用しながら、状態とオブジェクトの異なる分類器を訓練することでこの問題に対処する。
しかし、KG-SPの状態認識と物体認識の精度はさらに向上し、組成中の状態と物体の重み付けを考慮できない。
本研究では,コンポジション認識精度を向上しつつ,状態とオブジェクトの重み付けを考慮したKG-SPの強化であるSASOWを提案する。
まず、状態と物体の分類器に自己認識機構を導入し、両者を認識する精度を高めた。
さらに,合成中の状態や物体の重み付けを組み込んで,より合理的で正確な組成を生成する。
我々の検証プロセスでは、SASOWを3つの確立されたベンチマークデータセットでテストする。
OW-CZSLアプローチ、KG-SP、SASOWと比較すると、MIT-States、UT Zappos、C-GQAデータセットの可視成分の精度の点で、それぞれ2.1%、1.7%、0.4%の改善が見られる。
関連論文リスト
- Object-Centric Conformance Alignments with Synchronization (Extended Version) [57.76661079749309]
対象中心のペトリネットが一対多の関係を捉える能力と,その同一性に基づいたオブジェクトの比較と同期を行う識別子を持つペトリネットの能力を組み合わせた,新たな形式主義を提案する。
我々は、満足度変調理論(SMT)の符号化に基づく、そのようなネットに対する適合性チェック手法を提案する。
論文 参考訳(メタデータ) (2023-12-13T21:53:32Z) - Recognizing Unseen States of Unknown Objects by Leveraging Knowledge Graphs [1.182724861452868]
我々は,オブジェクトの知識や推定に頼らずに,あるオブジェクトの状態を予測する最初のオブジェクト非依存状態分類法(OaSC)を提案する。
提案手法の各種環境における性能について検討した。
提案したOaSC法は,すべてのデータセットやベンチマークにおける既存手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2023-07-22T22:19:11Z) - Generalised Co-Salient Object Detection [50.876864826216924]
本稿では,従来のCo-Salient Object Detection(CoSOD)設定における仮定を緩和する新しい設定を提案する。
我々はこの新たな設定を一般共分散オブジェクト検出(GCoSOD)と呼ぶ。
本稿では,コサリエントオブジェクトのイメージ間欠如の認識をCoSODモデルに再現する,新しいランダムサンプリングに基づく一般CoSODトレーニング(Generalized CoSOD Training, GCT)手法を提案する。
論文 参考訳(メタデータ) (2022-08-20T12:23:32Z) - Siamese Contrastive Embedding Network for Compositional Zero-Shot
Learning [76.13542095170911]
合成ゼロショット学習(CZSL)は、学習中に目に見える状態と対象から形成される見えない構成を認識することを目的としている。
本稿では,未知の合成認識のための新しいSiamese Contrastive Embedding Network(SCEN)を提案する。
提案手法は,3つの挑戦的ベンチマークデータセットに対して,最先端のアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2022-06-29T09:02:35Z) - KG-SP: Knowledge Guided Simple Primitives for Open World Compositional
Zero-Shot Learning [52.422873819371276]
オープンワールドコンポジションゼロショット学習(OW-CZSL)の目的は、画像中の状態とオブジェクトの合成を認識することである。
ここでは、単純なCZSLベースラインを再検討し、プリミティブ、すなわち状態とオブジェクトを独立して予測する。
出力空間から不可能な構成を除去するために, 外部知識を用いて各構成の有効性を推定する。
我々のモデルであるKG-SPはOW-CZSLとpCZSLの両方で技術の状態を達成する。
論文 参考訳(メタデータ) (2022-05-13T17:18:15Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。