Fugu-MT 論文翻訳(概要): Label2Label: A Language Modeling Framework for Multi-Attribute Learning

論文の概要: Label2Label: A Language Modeling Framework for Multi-Attribute Learning

arxiv url: http://arxiv.org/abs/2207.08677v1
Date: Mon, 18 Jul 2022 15:12:33 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-19 17:09:39.409343
Title: Label2Label: A Language Modeling Framework for Multi-Attribute Learning
Title（参考訳）: Label2Label: マルチ属性学習のための言語モデリングフレームワーク
Authors: Wanhua Li, Zhexuan Cao, Jianjiang Feng, Jie Zhou, Jiwen Lu
Abstract要約: Label2Labelは、言語モデリングの観点からのマルチ属性予測の最初の試みである。 NLPにおける事前学習言語モデルの成功に触発されたLabel2Labelは、イメージ条件付きマスキング言語モデルを導入した。我々の直感は、ニューラルネットワークがコンテキストと残りの属性ヒントに基づいて欠落した属性を推測できる場合、インスタンスの属性関係がよく把握されるということである。
参考スコア（独自算出の注目度）: 93.68058298766739
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Objects are usually associated with multiple attributes, and these attributes often exhibit high correlations. Modeling complex relationships between attributes poses a great challenge for multi-attribute learning. This paper proposes a simple yet generic framework named Label2Label to exploit the complex attribute correlations. Label2Label is the first attempt for multi-attribute prediction from the perspective of language modeling. Specifically, it treats each attribute label as a "word" describing the sample. As each sample is annotated with multiple attribute labels, these "words" will naturally form an unordered but meaningful "sentence", which depicts the semantic information of the corresponding sample. Inspired by the remarkable success of pre-training language models in NLP, Label2Label introduces an image-conditioned masked language model, which randomly masks some of the "word" tokens from the label "sentence" and aims to recover them based on the masked "sentence" and the context conveyed by image features. Our intuition is that the instance-wise attribute relations are well grasped if the neural net can infer the missing attributes based on the context and the remaining attribute hints. Label2Label is conceptually simple and empirically powerful. Without incorporating task-specific prior knowledge and highly specialized network designs, our approach achieves state-of-the-art results on three different multi-attribute learning tasks, compared to highly customized domain-specific methods. Code is available at https://github.com/Li-Wanhua/Label2Label.
Abstract（参考訳）: オブジェクトは通常、複数の属性に関連付けられ、これらの属性はしばしば高い相関を示す。属性間の複雑な関係をモデル化することは、複数属性学習にとって大きな課題となる。本稿では,複雑な属性相関を利用した単純かつ汎用的なフレームワーク label2label を提案する。 Label2Labelは、言語モデリングの観点からのマルチ属性予測の最初の試みである。具体的には、各属性ラベルをサンプルを記述する"word"として扱う。各サンプルには複数の属性ラベルがアノテートされているため、これらの"ワード"は自然に無秩序だが意味のある"文"を形成し、対応するサンプルの意味情報を記述する。ラベル2Labelは、NLPにおける事前学習言語モデルの顕著な成功に触発され、画像条件付きマスク付き言語モデルを導入し、ラベルの「文」から「語」トークンの一部をランダムにマスキングし、マスクされた「文」と画像の特徴によって伝達されるコンテキストに基づいてそれらを回復することを目的としている。我々の直感は、ニューラルネットワークがコンテキストと残りの属性ヒントに基づいて欠落した属性を推測できる場合、インスタンスの属性関係がよく把握されるということである。 label2labelは概念的にシンプルで経験的に強力です。タスク固有の事前知識と高度に専門化されたネットワーク設計を組み込まずに,高度にカスタマイズされたドメイン固有手法と比較して,3つの異なるマルチ属性学習タスクの最先端結果を達成する。コードはhttps://github.com/Li-Wanhua/Label2Labelで入手できる。

関連論文リスト

LATex: Leveraging Attribute-based Text Knowledge for Aerial-Ground Person Re-Identification [63.07563443280147]
本稿では,AG-ReID のための新しいフレームワーク LATex を提案する。属性ベースのテキスト知識を活用するために、プロンプトチューニング戦略を採用する。我々のフレームワークは、AG-ReIDを改善するために属性ベースのテキスト知識を完全に活用できる。
論文参考訳（メタデータ） (2025-03-31T04:47:05Z)
Adaptive Prototype Model for Attribute-based Multi-label Few-shot Action Recognition [11.316708754749103]
現実世界の行動認識システムでは、より多くの属性を組み込むことで、人間の行動をより包括的に理解できるようになる。本稿では,人間行動認識のためのアダプティブ属性プロトタイプモデル(AAPM)を提案する。 AAPMは属性に基づく複数ラベルの複数ショットのアクション認識と単一ラベルの少数ショットのアクション認識の両方において、最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2025-02-18T06:39:28Z)
AE-smnsMLC: Multi-Label Classification with Semantic Matching and Negative Label Sampling for Product Attribute Value Extraction [42.79022954630978]
商品属性値抽出は、製品検索やレコメンデーションなどのeコマースにおける多くの現実世界アプリケーションにおいて重要な役割を果たす。以前の方法では、製品テキスト内の値の位置にもっとアノテーションを必要とするシーケンスラベリングタスクとして扱われていた。属性値抽出のためのセマンティックマッチングと負ラベルサンプリングを用いた分類モデルを提案する。
論文参考訳（メタデータ） (2023-10-11T02:22:28Z)
Description-Enhanced Label Embedding Contrastive Learning for Text Classification [65.01077813330559]
モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文参考訳（メタデータ） (2023-06-15T02:19:34Z)
POAR: Towards Open Vocabulary Pedestrian Attribute Recognition [39.399286703315745]
歩行者属性認識(PAR)は、監視システムにおける歩行者の属性を予測することを目的としている。現実世界のすべての歩行者属性を消耗することは不可能である。我々は,新しい歩行者用オープンアトリビュート認識フレームワークを開発した。
論文参考訳（メタデータ） (2023-03-26T06:59:23Z)
Label Semantics for Few Shot Named Entity Recognition [68.01364012546402]
名前付きエンティティ認識におけるショットラーニングの問題について検討する。我々は,ラベル名中の意味情報を,モデルに付加的な信号を与え,よりリッチな事前情報を与える手段として活用する。本モデルは,第1エンコーダによって計算された名前付きエンティティの表現と,第2エンコーダによって計算されたラベル表現とを一致させることを学習する。
論文参考訳（メタデータ） (2022-03-16T23:21:05Z)
Semantic-Aware Representation Blending for Multi-Label Image Recognition with Partial Labels [86.17081952197788]
そこで我々は,未知のラベルを補うために,異なる画像にカテゴリ固有の表現をブレンドして,既知のラベルの情報を伝達することを提案する。 MS-COCO、Visual Genome、Pascal VOC 2007データセットの実験は、提案されたSARBフレームワークが、現在の主要な競合相手よりも優れたパフォーマンスを得ることを示している。
論文参考訳（メタデータ） (2022-03-04T07:56:16Z)
Label Mask for Multi-Label Text Classification [6.742627397194543]
本稿では,言語モデルのクローズ問題に着想を得た多言語テキスト分類モデル (LM-MTC) を提案する。そこで,各潜在的なラベルに対して異なるトークンを割り当て,ある確率でランダムにトークンをマスクし,ラベルに基づくマスケッド言語モデル(MLM)を構築する。
論文参考訳（メタデータ） (2021-06-18T11:54:33Z)
Low-Resource Task-Oriented Semantic Parsing via Intrinsic Modeling [65.51280121472146]
私たちは本質的にオントロジーラベルについて知っているものを利用して、効率的なセマンティック解析モデルを構築します。我々のモデルはTOPv2から派生した低リソースのベンチマークを用いて高効率である。
論文参考訳（メタデータ） (2021-04-15T04:01:02Z)
Learning to Infer Unseen Single-/Multi-Attribute-Object Compositions with Graph Networks [47.43595942156663]
本稿では,複雑な関係を学習するための属性オブジェクト意味関連グラフモデルを提案する。属性とオブジェクトを表すノードでは、グラフは柔軟に構築でき、単一の属性と複数属性オブジェクトの合成認識を実現する。
論文参考訳（メタデータ） (2020-10-27T14:57:35Z)
Automatic Validation of Textual Attribute Values in E-commerce Catalog by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文参考訳（メタデータ） (2020-06-15T21:31:05Z)
Multi-Label Text Classification using Attention-based Graph Neural Network [0.0]
ラベル間の注意的依存構造を捉えるために,グラフアテンションネットワークに基づくモデルを提案する。提案モデルでは, 従来の最先端モデルと比較して, 類似あるいは良好な性能が得られた。
論文参考訳（メタデータ） (2020-03-22T17:12:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。