Fugu-MT 論文翻訳(概要): MAC: A Benchmark for Multiple Attributes Compositional Zero-Shot Learning

論文の概要: MAC: A Benchmark for Multiple Attributes Compositional Zero-Shot Learning

arxiv url: http://arxiv.org/abs/2406.12757v1
Date: Tue, 18 Jun 2024 16:24:48 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-19 18:09:06.881573
Title: MAC: A Benchmark for Multiple Attributes Compositional Zero-Shot Learning
Title（参考訳）: MAC: 合成ゼロショット学習のためのマルチ属性ベンチマーク
Authors: Shuo Xu, Sai Wang, Xinyue Hu, Yutian Lin, Bo Du, Yu Wu,
Abstract要約: 合成ゼロショット学習(CZSL)は、意味的プリミティブ(属性とオブジェクト)を無視して学習し、見知らぬ属性オブジェクトの合成を認識することを目的としている。我々は18,217のイメージと11,067のコンポジションを含む多属性合成データセットを紹介した。我々のデータセットは、より深い意味理解と高次属性関連をサポートし、CZSLタスクのより現実的で挑戦的なベンチマークを提供する。
参考スコア（独自算出の注目度）: 33.12021227971062
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Compositional Zero-Shot Learning (CZSL) aims to learn semantic primitives (attributes and objects) from seen compositions and recognize unseen attribute-object compositions. Existing CZSL datasets focus on single attributes, neglecting the fact that objects naturally exhibit multiple interrelated attributes. Real-world objects often possess multiple interrelated attributes, and current datasets' narrow attribute scope and single attribute labeling introduce annotation biases, undermining model performance and evaluation. To address these limitations, we introduce the Multi-Attribute Composition (MAC) dataset, encompassing 18,217 images and 11,067 compositions with comprehensive, representative, and diverse attribute annotations. MAC includes an average of 30.2 attributes per object and 65.4 objects per attribute, facilitating better multi-attribute composition predictions. Our dataset supports deeper semantic understanding and higher-order attribute associations, providing a more realistic and challenging benchmark for the CZSL task. We also develop solutions for multi-attribute compositional learning and propose the MM-encoder to disentangling the attributes and objects.
Abstract（参考訳）: 合成ゼロショット学習(CZSL)は、目に見えない属性オブジェクトの合成から意味的プリミティブ(属性とオブジェクト)を学習することを目的としている。既存のCZSLデータセットは単一の属性に焦点を当てており、オブジェクトが自然に複数の相互関連属性を示すという事実を無視している。現実世界のオブジェクトは、しばしば複数の相互関連属性を持ち、現在のデータセットの狭い属性スコープと単一属性ラベルは、アノテーションバイアスを導入し、モデルのパフォーマンスと評価を損なう。これらの制約に対処するため、多属性合成(MAC)データセットを導入し、18,217のイメージと11,067のコンポジションを包括的、代表的、多彩な属性アノテーションで包含する。 MACは、オブジェクトあたり平均30.2の属性と、属性あたり65.4のオブジェクトを含み、より優れたマルチ属性合成予測を促進する。我々のデータセットはより深い意味理解と高次属性関連をサポートし、CZSLタスクのより現実的で挑戦的なベンチマークを提供する。また,多属性合成学習のためのソリューションを開発し,属性とオブジェクトをアンタングするMMエンコーダを提案する。

関連論文リスト

A Conditional Probability Framework for Compositional Zero-shot Learning [86.86063926727489]
合成ゼロショット学習(CZSL)は、既知の合成から知識を活用することで、既知のオブジェクトと属性の見知らぬ組み合わせを認識することを目的としている。従来のアプローチは、主に属性とオブジェクトを分離することに焦点を当て、学習中にそれらを独立したエンティティとして扱う。属性オブジェクトの依存関係を明示的にモデル化するために、条件付き確率フレームワーク(CPF)を採用しています。
論文参考訳（メタデータ） (2025-07-23T10:20:52Z)
Attribute-formed Class-specific Concept Space: Endowing Language Bottleneck Model with Better Interpretability and Scalability [54.420663939897686]
本稿では,解釈可能な画像認識を実現するために,Attribute-formed Language Bottleneck Model (ALBM)を提案する。 ALBMは属性形式クラス固有の空間において概念を整理する。解釈性をさらに向上するため,細粒度属性の視覚的特徴を抽出するVAPL(Visual Attribute Prompt Learning)を提案する。
論文参考訳（メタデータ） (2025-03-26T07:59:04Z)
Hybrid Discriminative Attribute-Object Embedding Network for Compositional Zero-Shot Learning [83.10178754323955]
HDA-OE(Hybrid Discriminative Attribute-Object Embedding)ネットワークは,属性とオブジェクトの視覚表現との複雑な相互作用を解決するために提案される。トレーニングデータの多様性を高めるため、HDA-OEは属性駆動型データ合成(ADDS)モジュールを導入した。 HDA-OEは、モデルの識別能力をさらに向上するため、サブクラス駆動の差別的埋め込み(SDDE)モジュールを導入している。提案モデルを3つのベンチマークデータセットで評価し,その妥当性と信頼性を検証した。
論文参考訳（メタデータ） (2024-11-28T09:50:25Z)
Cross-composition Feature Disentanglement for Compositional Zero-shot Learning [49.919635694894204]
合成ゼロショット学習(CZSL)において、プリミティブ(属性とオブジェクト)の視覚的特徴の歪みは例外的な結果を示した。本稿では,複数のプリミティブ・シェアリング・コンポジションを入力とし,これらのコンポジションにまたがって一般化されるような不整合プリミティブ・コンポジションを制約するクロス・コンポジション・コンストラクション・ディエンタングルメントの解を提案する。
論文参考訳（メタデータ） (2024-08-19T08:23:09Z)
Hierarchical Visual Primitive Experts for Compositional Zero-Shot Learning [52.506434446439776]
合成ゼロショット学習(CZSL)は、既知のプリミティブ(属性とオブジェクト)の事前知識で構成を認識することを目的としている。このような問題に対処するために,コンポジショントランスフォーマー(CoT)と呼ばれるシンプルでスケーラブルなフレームワークを提案する。提案手法は,MIT-States,C-GQA,VAW-CZSLなど,いくつかのベンチマークでSoTA性能を実現する。
論文参考訳（メタデータ） (2023-08-08T03:24:21Z)
Learning Conditional Attributes for Compositional Zero-Shot Learning [78.24309446833398]
合成ゼロショット学習(CZSL)は、新しい合成概念を認識するためにモデルを訓練することを目的としている。課題の1つは、異なる物体、例えば「濡れたリンゴ」と「濡れた猫」の属性をモデル化することである。我々は、属性が認識対象と入力画像に条件付けされていることを議論し、条件付き属性の埋め込みを学習する。
論文参考訳（メタデータ） (2023-05-29T08:04:05Z)
AMELI: Enhancing Multimodal Entity Linking with Fine-Grained Attributes [22.158388220889865]
本稿では属性認識型マルチモーダル・エンティティリンクを提案する。目標は、マルチモーダルな知識ベースから対応する対象エンティティを予測することである。本研究を支援するために,18,472のレビューと35,598の製品からなる大規模データセットAMELIを構築した。
論文参考訳（メタデータ） (2023-05-24T05:01:48Z)
Label2Label: A Language Modeling Framework for Multi-Attribute Learning [93.68058298766739]
Label2Labelは、言語モデリングの観点からのマルチ属性予測の最初の試みである。 NLPにおける事前学習言語モデルの成功に触発されたLabel2Labelは、イメージ条件付きマスキング言語モデルを導入した。我々の直感は、ニューラルネットワークがコンテキストと残りの属性ヒントに基づいて欠落した属性を推測できる場合、インスタンスの属性関係がよく把握されるということである。
論文参考訳（メタデータ） (2022-07-18T15:12:33Z)
Learning Invariant Visual Representations for Compositional Zero-Shot Learning [30.472541551048508]
合成ゼロショット学習 (CZSL) は,目に見える対象の合成から学習した知識を用いて,新しい構成を認識することを目的としている。本稿では,異なる領域を表現レベルと勾配レベルで整列させる不変な特徴学習フレームワークを提案する。 2つのCZSLベンチマーク実験により,提案手法が従来の最先端技術よりも大幅に優れていることが示された。
論文参考訳（メタデータ） (2022-06-01T11:33:33Z)
Learning to Predict Visual Attributes in the Wild [43.91237738107603]
260K以上のオブジェクトインスタンスに対して,927K以上の属性アノテーションからなる大規模なウィジェット内属性予測データセットを導入する。本稿では,低レベルCNN機能と高レベルCNN機能の両方を利用するベースモデルを含む,これらの課題に体系的に対処する手法を提案する。これらの技術を用いることで,現状よりも3.7mAP,5.7ポイントのF1点が向上した。
論文参考訳（メタデータ） (2021-06-17T17:58:02Z)
AdaTag: Multi-Attribute Value Extraction from Product Profiles with Adaptive Decoding [55.89773725577615]
本稿ではアダプティブデコーディングを用いて属性抽出を行うAdaTagを提案する。実世界のeコマースデータセットに関する我々の実験は、以前の方法よりも顕著に改善されたことを示している。
論文参考訳（メタデータ） (2021-06-04T07:54:11Z)
Compositional Fine-Grained Low-Shot Learning [58.53111180904687]
そこで本研究では,ゼロおよび少数ショット学習のための新しい合成生成モデルを構築し,学習サンプルの少ない,あるいは全くない,きめ細かいクラスを認識する。本稿では, 学習サンプルから属性特徴を抽出し, それらを組み合わせて, 稀で見えないクラスのためのきめ細かい特徴を構築できる特徴合成フレームワークを提案する。
論文参考訳（メタデータ） (2021-05-21T16:18:24Z)
Learning to Infer Unseen Attribute-Object Compositions [55.58107964602103]
単一属性と多属性オブジェクトの両方を柔軟に認識できるグラフベースモデルを提案する。我々は116,099の画像と8,030の合成カテゴリを持つ大規模マルチ属性データセットを構築した。
論文参考訳（メタデータ） (2020-10-27T14:57:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。