論文の概要: Visual Referential Games Further the Emergence of Disentangled
Representations
- arxiv url: http://arxiv.org/abs/2304.14511v1
- Date: Thu, 27 Apr 2023 20:00:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-01 15:55:43.476518
- Title: Visual Referential Games Further the Emergence of Disentangled
Representations
- Title(参考訳): 視覚的レファレンシャルゲーム : 絡み合った表現の出現
- Authors: Kevin Denamgana\"i, Sondess Missaoui and James Alfred Walker
- Abstract要約: 本稿では,新興言語のレベルにおける構成性,学習された表現のレベルにおける絡み合い,そして視覚的参照ゲームの文脈における体系性が相互に関連しているかを検討する。
- 参考スコア(独自算出の注目度): 0.12891210250935145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Natural languages are powerful tools wielded by human beings to communicate
information. Among their desirable properties, compositionality has been the
main focus in the context of referential games and variants, as it promises to
enable greater systematicity to the agents which would wield it. The concept of
disentanglement has been shown to be of paramount importance to learned
representations that generalise well in deep learning, and is thought to be a
necessary condition to enable systematicity. Thus, this paper investigates how
do compositionality at the level of the emerging languages, disentanglement at
the level of the learned representations, and systematicity relate to each
other in the context of visual referential games. Firstly, we find that visual
referential games that are based on the Obverter architecture outperforms
state-of-the-art unsupervised learning approach in terms of many major
disentanglement metrics. Secondly, we expand the previously proposed Positional
Disentanglement (PosDis) metric for compositionality to (re-)incorporate some
concerns pertaining to informativeness and completeness features found in the
Mutual Information Gap (MIG) disentanglement metric it stems from. This
extension allows for further discrimination between the different kind of
compositional languages that emerge in the context of Obverter-based
referential games, in a way that neither the referential game accuracy nor
previous metrics were able to capture. Finally we investigate whether the
resulting (emergent) systematicity, as measured by zero-shot compositional
learning tests, correlates with any of the disentanglement and compositionality
metrics proposed so far. Throughout the training process, statically
significant correlation coefficients can be found both positive and negative
depending on the moment of the measure.
- Abstract(参考訳): 自然言語は人間によって情報を伝える強力なツールである。
それらの望ましい性質の中で、構成性は参照ゲームや変種という文脈における主要な焦点であり、それを弱めるエージェントに対してより体系性を高めることを約束している。
解離の概念は、深層学習においてよく一般化される学習表現にとって最重要であり、体系性を実現するために必要な条件であると考えられている。
そこで本研究では,視覚的参照ゲームにおいて,新興言語のレベルにおける構成性,学習された表現のレベルにおける絡み合い,および体系性が相互に関連しているかを検討する。
まず,Obverterアーキテクチャをベースとした視覚的参照ゲームは,多くの主要なゆがみ指標の観点から,最先端の教師なし学習手法より優れていることがわかった。
第二に、前述した構成性のための位置不等角化(posdis)の指標を、相互情報ギャップ(mig)の不等角化指標に見られる情報と完全性に関するいくつかの関心事(再)に拡張する。
この拡張により、オブバータベースのレファレンシャルゲームの文脈で現れる異なる種類のコンポジション言語間のさらなる識別が可能となり、レファレンスゲームの精度も以前の指標もキャプチャできなかった。
最後に、ゼロショット合成学習テストによって測定された結果の(創発的な)体系性は、これまでに提案された不整合および構成性指標のどれかと相関するかどうかを考察する。
トレーニングプロセスを通じて、測定のモーメントに応じて、正と負の両方の静的に有意な相関係数が見つかる。
関連論文リスト
- Skews in the Phenomenon Space Hinder Generalization in Text-to-Image Generation [59.138470433237615]
本稿では,関係学習用データセットの言語的スキューと視覚的スクリューの両方を定量化する統計指標を提案する。
系統的に制御されたメトリクスは、一般化性能を強く予測できることを示す。
この研究は、データの多様性やバランスを向上し、絶対的なサイズをスケールアップするための重要な方向を示します。
論文 参考訳(メタデータ) (2024-03-25T03:18:39Z) - Emergent Communication for Rules Reasoning [38.24159397787027]
エージェントが高レベルのルールを推論し伝達することを奨励する認知指向環境であるReasoning Gameを提案する。
実験結果から,Reasoning Gameでは,意味論的に安定かつ構成的な言語が出現し,推論問題を解くことが示唆された。
論文 参考訳(メタデータ) (2023-11-08T05:57:39Z) - Im-Promptu: In-Context Composition from Image Prompts [10.079743487034762]
視覚刺激の構成可能な要素に対して,類似推論がコンテキスト内合成を可能にするか否かを検討する。
我々はIm-Promptuを使って、ベクトル表現、パッチ表現、オブジェクトスロットなど、さまざまなレベルの構成性のエージェントを訓練する。
本実験は,学習された構成規則を未知の領域に拡張する非構成的表現を用いて,外挿能力と構成性の程度とのトレードオフを明らかにする。
論文 参考訳(メタデータ) (2023-05-26T21:10:11Z) - Enriching Disentanglement: From Logical Definitions to Quantitative Metrics [59.12308034729482]
複雑なデータにおける説明的要素を遠ざけることは、データ効率の表現学習にとって有望なアプローチである。
論理的定義と量的指標の関連性を確立し, 理論的に根ざした絡み合いの指標を導出する。
本研究では,非交叉表現の異なる側面を分離することにより,提案手法の有効性を実証的に実証する。
論文 参考訳(メタデータ) (2023-05-19T08:22:23Z) - Variational Cross-Graph Reasoning and Adaptive Structured Semantics
Learning for Compositional Temporal Grounding [143.5927158318524]
テンポラルグラウンドティング(Temporal grounding)とは、クエリ文に従って、未編集のビデオから特定のセグメントを特定するタスクである。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
ビデオや言語に内在する構造的意味論は、構成的一般化を実現する上で重要な要素である、と我々は主張する。
論文 参考訳(メタデータ) (2023-01-22T08:02:23Z) - Learning Attention-based Representations from Multiple Patterns for
Relation Prediction in Knowledge Graphs [2.4028383570062606]
AEMPは、エンティティのコンテキスト情報を取得することによって、コンテキスト化された表現を学習するための新しいモデルである。
AEMPは、最先端の関係予測手法よりも優れるか、競合する。
論文 参考訳(メタデータ) (2022-06-07T10:53:35Z) - On the Intrinsic and Extrinsic Fairness Evaluation Metrics for
Contextualized Language Representations [74.70957445600936]
様々な自然言語処理タスクの公平度を測定するために、複数のメトリクスが導入された。
これらの指標は,(1)下流アプリケーションにおけるフェアネスを評価する遠因性指標と,(2)上流言語表現モデルにおけるフェアネスを推定する遠因性指標の2つのカテゴリに大別することができる。
論文 参考訳(メタデータ) (2022-03-25T22:17:43Z) - Integrating Language Guidance into Vision-based Deep Metric Learning [78.18860829585182]
埋め込み空間として意味的類似性を符号化した距離空間を学習することを提案する。
これらの空間は、トレーニング中に見られるもの以外のクラスに転送可能であるべきである。
これにより、学習された埋め込み空間は不完全な意味的コンテキストを符号化し、クラス間の意味的関係を誤って表現する。
論文 参考訳(メタデータ) (2022-03-16T11:06:50Z) - On the Interplay Between Fine-tuning and Composition in Transformers [7.513100214864645]
本研究では,微調整が文脈的埋め込み能力に及ぼす影響について検討する。
具体的には、語彙重なりの大きい逆パラフレーズ分類タスクと感情分類タスクを微調整する。
微調整はこれらの表現における構成性の恩恵をほとんど得られないが、感情に関するトレーニングは特定のモデルに対して小さな局所的な利益をもたらす。
論文 参考訳(メタデータ) (2021-05-31T01:49:56Z) - On (Emergent) Systematic Generalisation and Compositionality in Visual
Referential Games with Straight-Through Gumbel-Softmax Estimator [0.30458514384586394]
2人(またはそれ以上)のエージェントが非視覚的な参照ゲームを行うと、構成性のドライバが現れる。
本稿では,ST-GSの文脈において,これまでフィールドで認識されてきた構成性の要因がどの程度適用されているかを検討する。
st-gsアプローチを小さなバッチサイズとオーバーコンプリート通信チャネルで使用することで、新興言語のコンポジション性が向上する。
論文 参考訳(メタデータ) (2020-12-19T20:40:09Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。