論文の概要: gComm: An environment for investigating generalization in Grounded
Language Acquisition
- arxiv url: http://arxiv.org/abs/2105.03943v1
- Date: Sun, 9 May 2021 13:44:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-12 05:50:24.988987
- Title: gComm: An environment for investigating generalization in Grounded
Language Acquisition
- Title(参考訳): gComm: 接地言語習得における一般化調査環境
- Authors: Rishi Hazra and Sonu Dixit
- Abstract要約: gCommは、基盤言語獲得の研究を促進する堅牢なプラットフォームを開発するためのステップである。
2次元グリッド環境と一連のエージェントが連続したタスクの配列に部分的に観察可能な設定で露出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: gComm is a step towards developing a robust platform to foster research in
grounded language acquisition in a more challenging and realistic setting. It
comprises a 2-d grid environment with a set of agents (a stationary speaker and
a mobile listener connected via a communication channel) exposed to a
continuous array of tasks in a partially observable setting. The key to solving
these tasks lies in agents developing linguistic abilities and utilizing them
for efficiently exploring the environment. The speaker and listener have access
to information provided in different modalities, i.e. the speaker's input is a
natural language instruction that contains the target and task specifications
and the listener's input is its grid-view. Each must rely on the other to
complete the assigned task, however, the only way they can achieve the same, is
to develop and use some form of communication. gComm provides several tools for
studying different forms of communication and assessing their generalization.
- Abstract(参考訳): gCommは、より困難で現実的な環境で、基礎言語獲得の研究を促進する堅牢なプラットフォームを開発するためのステップである。
エージェントのセット(静止スピーカーと通信チャネルを介して接続される移動リスナ)を部分的に観察可能な設定で連続したタスクの配列に露呈する2次元グリッド環境を含む。
これらの課題を解決する鍵は、言語能力を開発し、それらを効率的に環境を探索するために利用するエージェントにある。
スピーカ及びリスナーは、異なるモードで提供される情報、すなわち、アクセスすることができる。
話者の入力は、ターゲットとタスク仕様を含む自然言語命令であり、リスナーの入力はそのグリッドビューである。
それぞれが割り当てられたタスクを完了するために互いに頼らなければならないが、同じことができる唯一の方法は、何らかの通信形態を開発し使用することである。
gCommは様々な形態のコミュニケーションを研究し、それらの一般化を評価するためのツールを提供している。
関連論文リスト
- Simple Embodied Language Learning as a Byproduct of Meta-Reinforcement
Learning [56.07190845063208]
具体的強化学習(RL)エージェントは、非言語タスクから間接的に言語を学習できるか?
エージェントが特定のオフィスを見つけることを目標とするオフィスナビゲーション環境を設計し、異なる建物(タスク)でオフィスロケーションが異なる。
我々は、RLエージェントが言語を間接的に学習できることを発見した。現在のメタRLアルゴリズムで訓練されたエージェントは、ホールドアウトレイアウトと言語フレーズでフロアプランを読むことに成功している。
論文 参考訳(メタデータ) (2023-06-14T09:48:48Z) - Learning Multi-Object Positional Relationships via Emergent
Communication [16.26264889682904]
観測対象が2つの対象を含む参照ゲームにおいてエージェントを訓練し、位置関係が関与している場合、一般化が主要な問題であることを示す。
学習言語は,目標を位置関係で記述したマルチステップのMDPタスクにおいてうまく一般化でき,実画像や事前学習した画像機能よりも優れることがわかった。
また,参照ゲームからの言語移行は,このタスクで直接学習する言語よりも,新しいタスクにおいて優れており,参照ゲームにおける事前学習のメリットが示唆されている。
論文 参考訳(メタデータ) (2023-02-16T04:44:53Z) - Collecting Interactive Multi-modal Datasets for Grounded Language
Understanding [66.30648042100123]
自然言語タスクを用いた協調型エンボディエージェントの定式化を行った。
広範かつスケーラブルなデータ収集ツールを開発しました。
対話型基底言語理解のための最初のデータセットを収集した。
論文 参考訳(メタデータ) (2022-11-12T02:36:32Z) - CLEAR: Improving Vision-Language Navigation with Cross-Lingual,
Environment-Agnostic Representations [98.30038910061894]
VLN(Vision-and-Language Navigation)タスクでは、エージェントが言語命令に基づいて環境をナビゲートする必要がある。
CLEAR: 言語横断表現と環境非依存表現を提案する。
我々の言語と視覚表現は、Room-to-Room and Cooperative Vision-and-Dialogue Navigationタスクにうまく転送できる。
論文 参考訳(メタデータ) (2022-07-05T17:38:59Z) - Know your audience: specializing grounded language models with listener
subtraction [20.857795779760917]
我々はDixitからインスピレーションを得て、マルチエージェント画像参照ゲームを定式化する。
この対照的なマルチエージェント設定において,CLIPビジョンエンコーダと大規模言語モデル間の注意ベースのアダプタを微調整することで,文脈依存の自然言語特殊化がもたらされることを示す。
論文 参考訳(メタデータ) (2022-06-16T17:52:08Z) - Curriculum Learning for Goal-Oriented Semantic Communications with a
Common Language [60.85719227557608]
話者とリスナーが協調して一連のタスクを実行することを可能にするために,総合目標指向のセマンティックコミュニケーションフレームワークを提案する。
話者とリスナーのセマンティックコミュニケーションを実現するために,階層的信念に基づく共通言語を提案する。
最適化問題は、イベントの完全かつ抽象的な記述を決定するために定義される。
論文 参考訳(メタデータ) (2022-04-21T22:36:06Z) - Bridging the Gap: Using Deep Acoustic Representations to Learn Grounded
Language from Percepts and Raw Speech [26.076534338576234]
自然言語と知覚を結びつける基底言語を理解することは、重要な研究分野である。
本研究は,2つの視覚的知覚と生音声入力に基づいて,基底言語習得の実現可能性を示す。
論文 参考訳(メタデータ) (2021-12-27T16:12:30Z) - Common Language for Goal-Oriented Semantic Communications: A Curriculum
Learning Framework [66.81698651016444]
目標指向タスク実行を実現するための包括的セマンティックコミュニケーションフレームワークを提案する。
カリキュラム学習(CL)と強化学習(RL)を組み合わせた新しいトップダウンフレームワークを提案する。
シミュレーションの結果,提案手法は,学習中の収束時間,タスク実行時間,送信コストにおいて従来のRLよりも優れていた。
論文 参考訳(メタデータ) (2021-11-15T19:13:55Z) - Learning to Ground Multi-Agent Communication with Autoencoders [43.22048280036316]
コミュニケーションには共通言語であるラングア・フランカがエージェント間で必要である。
学習した表現において、言語を基底とする簡単な方法を示す。
標準表現学習アルゴリズムは,共通言語に到達するのに十分であることがわかった。
論文 参考訳(メタデータ) (2021-10-28T17:57:26Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - A Practical Guide to Studying Emergent Communication through Grounded
Language Games [0.0]
本稿では,Babelソフトウェアシステムを拡張した高レベルロボットインタフェースを提案する。
これは、先進的な基底言語ゲーム実験の実行に関わる各サブタスクを扱うフレキシブルなモジュールを提供するツールキットを初めて提示する。
論文 参考訳(メタデータ) (2020-04-20T11:48:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。