論文の概要: Compositional Networks Enable Systematic Generalization for Grounded
Language Understanding
- arxiv url: http://arxiv.org/abs/2008.02742v3
- Date: Tue, 19 Oct 2021 05:32:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 06:35:28.005371
- Title: Compositional Networks Enable Systematic Generalization for Grounded
Language Understanding
- Title(参考訳): 接地言語理解のための体系的一般化を可能にする合成ネットワーク
- Authors: Yen-Ling Kuo, Boris Katz, Andrei Barbu
- Abstract要約: 人間は、今まで遭遇したことのない概念の組み合わせを含む新しい文を理解する際に、驚くほど柔軟です。
近年の研究では、深層ネットワークは、新しい文で表されるときの人間の言語能力を模倣できるが、体系的な変化は、ネットワークの言語理解能力の限界を明らかにする。
本稿では,gSCANデータセットの一般化問題に対処することで,これらの制限を克服できることを実証する。
- 参考スコア(独自算出の注目度): 21.481360281719006
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humans are remarkably flexible when understanding new sentences that include
combinations of concepts they have never encountered before. Recent work has
shown that while deep networks can mimic some human language abilities when
presented with novel sentences, systematic variation uncovers the limitations
in the language-understanding abilities of networks. We demonstrate that these
limitations can be overcome by addressing the generalization challenges in the
gSCAN dataset, which explicitly measures how well an agent is able to interpret
novel linguistic commands grounded in vision, e.g., novel pairings of
adjectives and nouns. The key principle we employ is compositionality: that the
compositional structure of networks should reflect the compositional structure
of the problem domain they address, while allowing other parameters to be
learned end-to-end. We build a general-purpose mechanism that enables agents to
generalize their language understanding to compositional domains. Crucially,
our network has the same state-of-the-art performance as prior work while
generalizing its knowledge when prior work does not. Our network also provides
a level of interpretability that enables users to inspect what each part of
networks learns. Robust grounded language understanding without dramatic
failures and without corner cases is critical to building safe and fair robots;
we demonstrate the significant role that compositionality can play in achieving
that goal.
- Abstract(参考訳): 人間は、これまで経験したことのない概念の組み合わせを含む新しい文を理解するとき、非常に柔軟です。
近年の研究では、深層ネットワークは、新しい文で表されるときの人間の言語能力を模倣できるが、体系的な変化は、ネットワークの言語理解能力の限界を明らかにする。
これらの制限は、gSCANデータセットの一般化問題に対処することで克服可能であることを実証し、エージェントが視覚に根ざした新しい言語コマンド、例えば、新規な形容詞と名詞の組み合わせをいかにうまく解釈できるかを明確に測定する。
私たちが採用する重要な原則は構成性です:ネットワークの構成構造は、彼らが対処する問題領域の構成構造を反映し、他のパラメータをエンドツーエンドで学習できるようにすべきです。
エージェントが言語理解を合成領域に一般化するための汎用メカニズムを構築する。
重要なことは、我々のネットワークは先行作業と同じ最先端のパフォーマンスを持ち、先行作業がなければその知識を一般化する。
我々のネットワークはまた、ユーザーがネットワークの各部分が何を学べるかを検査できるレベルの解釈可能性も提供する。
劇的な失敗やコーナーケースのないロバストな基底言語理解は、安全で公正なロボットを構築する上で非常に重要である。
関連論文リスト
- Topological properties and organizing principles of semantic networks [3.8462776107938317]
本研究では,11言語から7つの意味関係によって定義されたConceptNetのセマンティックネットワークの特性について検討する。
セマンティック・ネットワークには普遍的な基本的特性があり、疎らで、クラスタ化され、多くは非合法な等級分布を示す。
一部のネットワークでは接続は類似性に基づくが、他のネットワークでは接続は相補性に基づくものである。
論文 参考訳(メタデータ) (2023-04-24T11:12:21Z) - Variational Cross-Graph Reasoning and Adaptive Structured Semantics
Learning for Compositional Temporal Grounding [143.5927158318524]
テンポラルグラウンドティング(Temporal grounding)とは、クエリ文に従って、未編集のビデオから特定のセグメントを特定するタスクである。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
ビデオや言語に内在する構造的意味論は、構成的一般化を実現する上で重要な要素である、と我々は主張する。
論文 参考訳(メタデータ) (2023-01-22T08:02:23Z) - Less Data, More Knowledge: Building Next Generation Semantic
Communication Networks [180.82142885410238]
本稿では、スケーラブルなエンドツーエンドセマンティック通信ネットワークの最初の厳密なビジョンを示す。
まず、セマンティック・コミュニケーション・ネットワークの設計は、データ駆動型ネットワークから知識駆動型ネットワークへどのように移行する必要があるかについて議論する。
意味表現と言語を用いることで、従来の送信機と受信機が教師と見習いになることを示す。
論文 参考訳(メタデータ) (2022-11-25T19:03:25Z) - TeKo: Text-Rich Graph Neural Networks with External Knowledge [75.91477450060808]
外部知識を用いた新しいテキストリッチグラフニューラルネットワーク(TeKo)を提案する。
まず、高品質なエンティティを組み込んだフレキシブルな異種セマンティックネットワークを提案する。
次に、構造化三重項と非構造化実体記述という2種類の外部知識を導入する。
論文 参考訳(メタデータ) (2022-06-15T02:33:10Z) - Compositional Processing Emerges in Neural Networks Solving Math
Problems [100.80518350845668]
人工知能の最近の進歩は、大きなモデルが十分な言語データに基づいて訓練されると、文法構造が表現に現れることを示している。
我々は、この研究を数学的推論の領域にまで拡張し、どのように意味を構成するべきかについての正確な仮説を定式化することができる。
私たちの研究は、ニューラルネットワークがトレーニングデータに暗黙的に構造化された関係について何かを推測できるだけでなく、個々の意味の合成を合成全体へと導くために、この知識を展開できることを示している。
論文 参考訳(メタデータ) (2021-05-19T07:24:42Z) - On the Binding Problem in Artificial Neural Networks [12.04468744445707]
この欠点の根底にある原因は、動的かつ柔軟に情報を結合できないことである。
非構造化感覚入力から有意義な実体を形成するための統一フレームワークを提案する。
我々は,人間レベルの一般化を実現する上で,AIに対する構成的アプローチが基本的重要性であると考えている。
論文 参考訳(メタデータ) (2020-12-09T18:02:49Z) - Understanding the Role of Individual Units in a Deep Neural Network [85.23117441162772]
本稿では,画像分類と画像生成ネットワーク内の隠れ単位を系統的に同定する分析フレームワークを提案する。
まず、シーン分類に基づいて訓練された畳み込みニューラルネットワーク(CNN)を分析し、多様なオブジェクト概念にマッチするユニットを発見する。
第2に、シーンを生成するために訓練されたGANモデルについて、同様の分析手法を用いて分析する。
論文 参考訳(メタデータ) (2020-09-10T17:59:10Z) - A Benchmark for Systematic Generalization in Grounded Language
Understanding [61.432407738682635]
人間は慣れ親しんだ部分から成り立つ不慣れな状況を記述する表現を容易に解釈する。
対照的に、現代のニューラルネットワークは、新しい構成を理解するのに苦労している。
位置言語理解における合成一般化を評価するための新しいベンチマークであるgSCANを導入する。
論文 参考訳(メタデータ) (2020-03-11T08:40:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。