論文の概要: Label2Label: A Language Modeling Framework for Multi-Attribute Learning
- arxiv url: http://arxiv.org/abs/2207.08677v1
- Date: Mon, 18 Jul 2022 15:12:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-19 17:09:39.409343
- Title: Label2Label: A Language Modeling Framework for Multi-Attribute Learning
- Title(参考訳): Label2Label: マルチ属性学習のための言語モデリングフレームワーク
- Authors: Wanhua Li, Zhexuan Cao, Jianjiang Feng, Jie Zhou, Jiwen Lu
- Abstract要約: Label2Labelは、言語モデリングの観点からのマルチ属性予測の最初の試みである。
NLPにおける事前学習言語モデルの成功に触発されたLabel2Labelは、イメージ条件付きマスキング言語モデルを導入した。
我々の直感は、ニューラルネットワークがコンテキストと残りの属性ヒントに基づいて欠落した属性を推測できる場合、インスタンスの属性関係がよく把握されるということである。
- 参考スコア(独自算出の注目度): 93.68058298766739
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objects are usually associated with multiple attributes, and these attributes
often exhibit high correlations. Modeling complex relationships between
attributes poses a great challenge for multi-attribute learning. This paper
proposes a simple yet generic framework named Label2Label to exploit the
complex attribute correlations. Label2Label is the first attempt for
multi-attribute prediction from the perspective of language modeling.
Specifically, it treats each attribute label as a "word" describing the sample.
As each sample is annotated with multiple attribute labels, these "words" will
naturally form an unordered but meaningful "sentence", which depicts the
semantic information of the corresponding sample. Inspired by the remarkable
success of pre-training language models in NLP, Label2Label introduces an
image-conditioned masked language model, which randomly masks some of the
"word" tokens from the label "sentence" and aims to recover them based on the
masked "sentence" and the context conveyed by image features. Our intuition is
that the instance-wise attribute relations are well grasped if the neural net
can infer the missing attributes based on the context and the remaining
attribute hints. Label2Label is conceptually simple and empirically powerful.
Without incorporating task-specific prior knowledge and highly specialized
network designs, our approach achieves state-of-the-art results on three
different multi-attribute learning tasks, compared to highly customized
domain-specific methods. Code is available at
https://github.com/Li-Wanhua/Label2Label.
- Abstract(参考訳): オブジェクトは通常、複数の属性に関連付けられ、これらの属性はしばしば高い相関を示す。
属性間の複雑な関係をモデル化することは、複数属性学習にとって大きな課題となる。
本稿では,複雑な属性相関を利用した単純かつ汎用的なフレームワーク label2label を提案する。
Label2Labelは、言語モデリングの観点からのマルチ属性予測の最初の試みである。
具体的には、各属性ラベルをサンプルを記述する"word"として扱う。
各サンプルには複数の属性ラベルがアノテートされているため、これらの"ワード"は自然に無秩序だが意味のある"文"を形成し、対応するサンプルの意味情報を記述する。
ラベル2Labelは、NLPにおける事前学習言語モデルの顕著な成功に触発され、画像条件付きマスク付き言語モデルを導入し、ラベルの「文」から「語」トークンの一部をランダムにマスキングし、マスクされた「文」と画像の特徴によって伝達されるコンテキストに基づいてそれらを回復することを目的としている。
我々の直感は、ニューラルネットワークがコンテキストと残りの属性ヒントに基づいて欠落した属性を推測できる場合、インスタンスの属性関係がよく把握されるということである。
label2labelは概念的にシンプルで経験的に強力です。
タスク固有の事前知識と高度に専門化されたネットワーク設計を組み込まずに,高度にカスタマイズされたドメイン固有手法と比較して,3つの異なるマルチ属性学習タスクの最先端結果を達成する。
コードはhttps://github.com/Li-Wanhua/Label2Labelで入手できる。
関連論文リスト
- AE-smnsMLC: Multi-Label Classification with Semantic Matching and
Negative Label Sampling for Product Attribute Value Extraction [42.79022954630978]
商品属性値抽出は、製品検索やレコメンデーションなどのeコマースにおける多くの現実世界アプリケーションにおいて重要な役割を果たす。
以前の方法では、製品テキスト内の値の位置にもっとアノテーションを必要とするシーケンスラベリングタスクとして扱われていた。
属性値抽出のためのセマンティックマッチングと負ラベルサンプリングを用いた分類モデルを提案する。
論文 参考訳(メタデータ) (2023-10-11T02:22:28Z) - Description-Enhanced Label Embedding Contrastive Learning for Text
Classification [65.01077813330559]
モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計
テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。
ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文 参考訳(メタデータ) (2023-06-15T02:19:34Z) - POAR: Towards Open Vocabulary Pedestrian Attribute Recognition [39.399286703315745]
歩行者属性認識(PAR)は、監視システムにおける歩行者の属性を予測することを目的としている。
現実世界のすべての歩行者属性を消耗することは不可能である。
我々は,新しい歩行者用オープンアトリビュート認識フレームワークを開発した。
論文 参考訳(メタデータ) (2023-03-26T06:59:23Z) - Label Semantics for Few Shot Named Entity Recognition [68.01364012546402]
名前付きエンティティ認識におけるショットラーニングの問題について検討する。
我々は,ラベル名中の意味情報を,モデルに付加的な信号を与え,よりリッチな事前情報を与える手段として活用する。
本モデルは,第1エンコーダによって計算された名前付きエンティティの表現と,第2エンコーダによって計算されたラベル表現とを一致させることを学習する。
論文 参考訳(メタデータ) (2022-03-16T23:21:05Z) - Semantic-Aware Representation Blending for Multi-Label Image Recognition
with Partial Labels [86.17081952197788]
そこで我々は,未知のラベルを補うために,異なる画像にカテゴリ固有の表現をブレンドして,既知のラベルの情報を伝達することを提案する。
MS-COCO、Visual Genome、Pascal VOC 2007データセットの実験は、提案されたSARBフレームワークが、現在の主要な競合相手よりも優れたパフォーマンスを得ることを示している。
論文 参考訳(メタデータ) (2022-03-04T07:56:16Z) - Label Mask for Multi-Label Text Classification [6.742627397194543]
本稿では,言語モデルのクローズ問題に着想を得た多言語テキスト分類モデル (LM-MTC) を提案する。
そこで,各潜在的なラベルに対して異なるトークンを割り当て,ある確率でランダムにトークンをマスクし,ラベルに基づくマスケッド言語モデル(MLM)を構築する。
論文 参考訳(メタデータ) (2021-06-18T11:54:33Z) - Low-Resource Task-Oriented Semantic Parsing via Intrinsic Modeling [65.51280121472146]
私たちは本質的にオントロジーラベルについて知っているものを利用して、効率的なセマンティック解析モデルを構築します。
我々のモデルはTOPv2から派生した低リソースのベンチマークを用いて高効率である。
論文 参考訳(メタデータ) (2021-04-15T04:01:02Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z) - Multi-Label Text Classification using Attention-based Graph Neural
Network [0.0]
ラベル間の注意的依存構造を捉えるために,グラフアテンションネットワークに基づくモデルを提案する。
提案モデルでは, 従来の最先端モデルと比較して, 類似あるいは良好な性能が得られた。
論文 参考訳(メタデータ) (2020-03-22T17:12:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。