論文の概要: Transforming Human-Centered AI Collaboration: Redefining Embodied Agents
Capabilities through Interactive Grounded Language Instructions
- arxiv url: http://arxiv.org/abs/2305.10783v1
- Date: Thu, 18 May 2023 07:51:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 16:24:28.126363
- Title: Transforming Human-Centered AI Collaboration: Redefining Embodied Agents
Capabilities through Interactive Grounded Language Instructions
- Title(参考訳): 人間中心のAIコラボレーションを変革する - 対話型接地言語指導による身体的エージェントの能力の再定義
- Authors: Shrestha Mohanty and Negar Arabzadeh and Julia Kiseleva and Artem
Zholus and Milagro Teruel and Ahmed Awadallah and Yuxuan Sun and Kavya Srinet
and Arthur Szlam
- Abstract要約: 人間の知能の適応性は目覚ましいもので、新しいタスクやマルチモーダル環境に迅速に適応することができる。
研究コミュニティはインタラクティブな「身体的エージェント」の開発を積極的に進めている
これらのエージェントは、コミュニケーションが壊れたり、指示が不明確であったりした場合に、迅速にフィードバックをリクエストする能力を持っていなければならない。
- 参考スコア(独自算出の注目度): 23.318236094953072
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human intelligence's adaptability is remarkable, allowing us to adjust to new
tasks and multi-modal environments swiftly. This skill is evident from a young
age as we acquire new abilities and solve problems by imitating others or
following natural language instructions. The research community is actively
pursuing the development of interactive "embodied agents" that can engage in
natural conversations with humans and assist them with real-world tasks. These
agents must possess the ability to promptly request feedback in case
communication breaks down or instructions are unclear. Additionally, they must
demonstrate proficiency in learning new vocabulary specific to a given domain.
In this paper, we made the following contributions: (1) a crowd-sourcing tool
for collecting grounded language instructions; (2) the largest dataset of
grounded language instructions; and (3) several state-of-the-art baselines.
These contributions are suitable as a foundation for further research.
- Abstract(参考訳): 人間の知能の適応性は目覚ましいもので、新しいタスクやマルチモーダル環境に迅速に適応することができる。
このスキルは、新しい能力を身につけ、他人を真似たり、自然言語命令に従うことで問題を解決する若い世代から明らかです。
研究コミュニティは、人間と自然な会話を行い、現実世界のタスクで支援できる対話型「身体的エージェント」の開発を積極的に進めている。
これらのエージェントは、コミュニケーションがダウンしたり指示が明確でない場合、フィードバックを迅速に要求する能力を持つ必要がある。
さらに、特定のドメインに固有の新しい語彙を学ぶ能力を示す必要がある。
本稿では,(1)接地言語命令を収集するためのクラウドソーシングツール,(2)接地言語命令の最大のデータセット,(3)最先端のベースラインについて述べる。
これらの貢献はさらなる研究の基盤として適している。
関連論文リスト
- Teaching Embodied Reinforcement Learning Agents: Informativeness and Diversity of Language Use [16.425032085699698]
具体的エージェントは、人間の言語を活用して、学習タスクの明示的または暗黙的な知識を得る能力を持つことが望ましい。
タスク学習を容易にするために、リッチ言語をどのように組み込むかは明確ではない。
本稿では,強化学習における言語入力の種類について検討する。
論文 参考訳(メタデータ) (2024-10-31T17:59:52Z) - Policy Learning with a Language Bottleneck [65.99843627646018]
PLLBB(Policy Learning with a Language Bottleneck)は、AIエージェントが言語規則を生成するためのフレームワークである。
PLLBBは、言語モデルによってガイドされるルール生成ステップと、エージェントがルールによってガイドされる新しいポリシーを学ぶ更新ステップとを交互に使用する。
2人のプレイヤーによるコミュニケーションゲーム、迷路解決タスク、および2つの画像再構成タスクにおいて、PLLBBエージェントはより解釈可能で一般化可能な振る舞いを学習できるだけでなく、学習したルールを人間のユーザと共有できることを示す。
論文 参考訳(メタデータ) (2024-05-07T08:40:21Z) - Towards More Human-like AI Communication: A Review of Emergent
Communication Research [0.0]
創発的コミュニケーション(英: Emergent Communication, Emecom)は、自然言語を利用できる人工エージェントの開発を目的とした研究分野である。
本稿では,文献の共通点と,それらが人間同士の相互作用にどのように関係しているかを概説する。
2つのサブカテゴリを特定し、その特性とオープンな課題を強調します。
論文 参考訳(メタデータ) (2023-08-01T14:43:10Z) - Collecting Interactive Multi-modal Datasets for Grounded Language
Understanding [66.30648042100123]
自然言語タスクを用いた協調型エンボディエージェントの定式化を行った。
広範かつスケーラブルなデータ収集ツールを開発しました。
対話型基底言語理解のための最初のデータセットを収集した。
論文 参考訳(メタデータ) (2022-11-12T02:36:32Z) - IGLU 2022: Interactive Grounded Language Understanding in a
Collaborative Environment at NeurIPS 2022 [63.07251290802841]
協調環境における対話型接地言語理解(IGLU: Interactive Grounded Language Understanding)を提案する。
競争の第一の目的は、対話型エンボディエージェントの開発方法の問題にアプローチすることである。
この研究課題は、NeurIPSコミュニティと非常に関係のある2つの研究分野に自然に関連があるが、限定的ではない。
論文 参考訳(メタデータ) (2022-05-27T06:12:48Z) - Interactive Grounded Language Understanding in a Collaborative
Environment: IGLU 2021 [58.196738777207315]
協調環境における対話型接地言語理解のためのemphIGLUを提案する。
競争の主目的は、対話型エージェントをいかにして構築するかという問題にアプローチすることであり、協調環境において、接地された自然言語命令を提供しながらタスクの解決を学ぶことである。
論文 参考訳(メタデータ) (2022-05-05T01:20:09Z) - NeurIPS 2021 Competition IGLU: Interactive Grounded Language
Understanding in a Collaborative Environment [71.11505407453072]
協調環境における対話型接地言語理解(IGLU: Interactive Grounded Language Understanding)を提案する。
競争の主目的は、対話型エージェントをいかにして構築するかという問題にアプローチすることであり、協調環境において、接地された自然言語命令を提供しながらタスクの解決を学ぶことである。
この研究課題は、自然言語理解・生成(NLU/G)と強化学習(RL)という、NeurIPSコミュニティと密接に関連している2つの分野に自然に関連している。
論文 参考訳(メタデータ) (2021-10-13T07:13:44Z) - Few-shot Language Coordination by Modeling Theory of Mind [95.54446989205117]
我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
論文 参考訳(メタデータ) (2021-07-12T19:26:11Z) - Emergent Multi-Agent Communication in the Deep Learning Era [26.764052787245728]
言語を通して協力する能力は、人間の決定的な特徴である。
深層人工ネットワークの知覚、運動、計画能力が増大するにつれて、研究者らは対話する共通の言語を開発することができるかどうかを研究している。
論文 参考訳(メタデータ) (2020-06-03T17:50:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。