Fugu-MT 論文翻訳(概要): Compositional Zero-Shot Learning with Contextualized Cues and Adaptive Contrastive Training

論文の概要: Compositional Zero-Shot Learning with Contextualized Cues and Adaptive Contrastive Training

arxiv url: http://arxiv.org/abs/2412.07161v1
Date: Tue, 10 Dec 2024 03:41:20 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-11 22:09:45.21312
Title: Compositional Zero-Shot Learning with Contextualized Cues and Adaptive Contrastive Training
Title（参考訳）: コンテクスト化キューを用いた構成ゼロショット学習と適応的コントラスト学習
Authors: Yun Li, Zhe Liu, Lina Yao,
Abstract要約: 本稿では,コンポジションゼロショット学習(CZSL)における属性とオブジェクト(ULAO)の理解とリンクに関する新しい枠組みを紹介する。 ULAOは2つの革新的なモジュールから構成されている。理解属性とオブジェクト(UAO)モジュールは、逐次原始予測によって原始的理解を改善し、認識されたオブジェクトを属性分類の文脈的ヒントとして活用する。 Linking Attributes and Objects (LAO)モジュールは、調整されたハードネガティブ生成と適応的損失調整を含む新しいコントラスト学習戦略を通じて、属性オブジェクトのリンク理解を改善する。
参考スコア（独自算出の注目度）: 17.893694262999826
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Compositional Zero-Shot Learning (CZSL) aims to recognize unseen combinations of seen attributes and objects. Current CLIP-based methods in CZSL, despite their advancements, often fail to effectively understand and link the attributes and objects due to inherent limitations in CLIP's pretraining mechanisms. To address these shortcomings, this paper introduces a novel framework, Understanding and Linking Attributes and Objects (ULAO) in CZSL, which comprises two innovative modules. The Understanding Attributes and Objects (UAO) module improves primitive understanding by sequential primitive prediction and leveraging recognized objects as contextual hints for attribute classification. Concurrently, the Linking Attributes and Objects (LAO) module improves the attribute-object linkage understanding through a new contrastive learning strategy that incorporates tailored hard negative generation and adaptive loss adjustments. We demonstrate our model's superiority by showcasing its state-of-the-art performance across three benchmark datasets in both Closed-World (CW) and Open-World (OW) scenarios.
Abstract（参考訳）: 合成ゼロショット学習(CZSL)は、目に見えない属性とオブジェクトの組み合わせを認識することを目的としている。 CZSLの現在のCLIPベースのメソッドは、その進歩にもかかわらず、CLIPの事前学習メカニズムに固有の制限があるため、属性とオブジェクトを効果的に理解しリンクできないことが多い。本稿では,2つの革新的なモジュールからなるCZSLの新規なフレームワーク,Attributes and Objects(ULAO)を紹介する。 Understanding Attributes and Objects (UAO)モジュールは、逐次原始的予測によって原始的理解を改善し、認識されたオブジェクトを属性分類の文脈的ヒントとして活用する。同時に、Linking Attributes and Objects (LAO)モジュールは、調整されたハードネガティブ生成と適応的損失調整を含む新しいコントラスト学習戦略を通じて、属性オブジェクトのリンケージ理解を改善する。閉鎖ワールド(CW)とオープンワールド(OW)の両方のシナリオにおいて、3つのベンチマークデータセットにまたがって、最先端のパフォーマンスを示すことで、モデルの優位性を実証する。

関連論文リスト

Real Classification by Description: Extending CLIP's Limits of Part Attributes Recognition [1.2499537119440243]
本稿では,視覚言語モデル(VLM)がオブジェクトのクラス名を除いた記述的属性のみに基づいてオブジェクトを分類する能力を評価する新しいタスクである記述によるゼロショットの「リアル」分類に取り組む。我々は、オブジェクト名を省略し、真にゼロショット学習を促進する6つの人気のあるきめ細かいベンチマークに関する記述データをリリースする。修正されたCLIPアーキテクチャを導入し、複数の解像度を活用し、きめ細かい部分属性の検出を改善する。
論文参考訳（メタデータ） (2024-12-18T15:28:08Z)
Point Cloud Understanding via Attention-Driven Contrastive Learning [64.65145700121442]
トランスフォーマーベースのモデルは、自己認識機構を活用することにより、先進的なポイントクラウド理解を持つ。 PointACLは、これらの制限に対処するために設計された、注意駆動のコントラスト学習フレームワークである。本手法では, 注意駆動型動的マスキング手法を用いて, モデルが非集中領域に集中するように誘導する。
論文参考訳（メタデータ） (2024-11-22T05:41:00Z)
Leveraging MLLM Embeddings and Attribute Smoothing for Compositional Zero-Shot Learning [21.488599805772054]
合成ゼロショット学習は、見かけの合成から学んだ属性やオブジェクトの新規な構成を認識することを目的としている。以前の作業では、同じ属性を共有するイメージペア間の共有部分と排他的部分を抽出することで、属性とオブジェクトをアンタングルにする。本稿では,MLLM (Multimodal Large Language Model) という新しいフレームワークを提案する。
論文参考訳（メタデータ） (2024-11-18T07:55:54Z)
Cross-composition Feature Disentanglement for Compositional Zero-shot Learning [49.919635694894204]
合成ゼロショット学習(CZSL)において、プリミティブ(属性とオブジェクト)の視覚的特徴の歪みは例外的な結果を示した。本稿では,複数のプリミティブ・シェアリング・コンポジションを入力とし,これらのコンポジションにまたがって一般化されるような不整合プリミティブ・コンポジションを制約するクロス・コンポジション・コンストラクション・ディエンタングルメントの解を提案する。
論文参考訳（メタデータ） (2024-08-19T08:23:09Z)
CSCNET: Class-Specified Cascaded Network for Compositional Zero-Shot Learning [62.090051975043544]
属性とオブジェクト(A-O)の絡み合いは、合成ゼロショット学習(CZSL)の基本的かつ重要な問題である CZSL(Class-specified Cascaded Network, CSCNet)のための新しいA-O不整合フレームワークを提案する。
論文参考訳（メタデータ） (2024-03-09T14:18:41Z)
Hierarchical Visual Primitive Experts for Compositional Zero-Shot Learning [52.506434446439776]
合成ゼロショット学習(CZSL)は、既知のプリミティブ(属性とオブジェクト)の事前知識で構成を認識することを目的としている。このような問題に対処するために,コンポジショントランスフォーマー(CoT)と呼ばれるシンプルでスケーラブルなフレームワークを提案する。提案手法は,MIT-States,C-GQA,VAW-CZSLなど,いくつかのベンチマークでSoTA性能を実現する。
論文参考訳（メタデータ） (2023-08-08T03:24:21Z)
Learning Conditional Attributes for Compositional Zero-Shot Learning [78.24309446833398]
合成ゼロショット学習(CZSL)は、新しい合成概念を認識するためにモデルを訓練することを目的としている。課題の1つは、異なる物体、例えば「濡れたリンゴ」と「濡れた猫」の属性をモデル化することである。我々は、属性が認識対象と入力画像に条件付けされていることを議論し、条件付き属性の埋め込みを学習する。
論文参考訳（メタデータ） (2023-05-29T08:04:05Z)
Learning Invariant Visual Representations for Compositional Zero-Shot Learning [30.472541551048508]
合成ゼロショット学習 (CZSL) は,目に見える対象の合成から学習した知識を用いて,新しい構成を認識することを目的としている。本稿では,異なる領域を表現レベルと勾配レベルで整列させる不変な特徴学習フレームワークを提案する。 2つのCZSLベンチマーク実験により,提案手法が従来の最先端技術よりも大幅に優れていることが示された。
論文参考訳（メタデータ） (2022-06-01T11:33:33Z)
Attribute-Modulated Generative Meta Learning for Zero-Shot Classification [52.64680991682722]
ゼロショット学習のためのAttribute-Modulated GenerAtive Meta-modelを提案する。本モデルは属性対応変調ネットワークと属性対応生成ネットワークから構成される。実験により,AMAZはZSLで3.8%,ZSLで5.1%改善し,ZSL設定を一般化した。
論文参考訳（メタデータ） (2021-04-22T04:16:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。