論文の概要: Challenges in Grounding Language in the Real World
- arxiv url: http://arxiv.org/abs/2506.17375v1
- Date: Fri, 20 Jun 2025 17:17:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.392159
- Title: Challenges in Grounding Language in the Real World
- Title(参考訳): 現実世界における接地言語への挑戦
- Authors: Peter Lindes, Kaoutar Skiker,
- Abstract要約: 人工知能の長期的な目標は、人間が人間にとって自然な言語を使って物理的なロボットと協力できる言語理解システムを構築することである。
本研究では,対話型タスク学習が可能な認知エージェントの能力と,大規模言語モデルの言語能力を統合するソリューションを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A long-term goal of Artificial Intelligence is to build a language understanding system that allows a human to collaborate with a physical robot using language that is natural to the human. In this paper we highlight some of the challenges in doing this, and propose a solution that integrates the abilities of a cognitive agent capable of interactive task learning in a physical robot with the linguistic abilities of a large language model. We also point the way to an initial implementation of this approach.
- Abstract(参考訳): 人工知能の長期的な目標は、人間が人間にとって自然な言語を使って物理的なロボットと協力できる言語理解システムを構築することである。
本稿では,これを実現する上での課題をいくつか取り上げ,対話型タスク学習が可能な認知エージェントの能力と,大規模言語モデルの言語能力を統合したソリューションを提案する。
このアプローチの初期実装への道も示しています。
関連論文リスト
- tagE: Enabling an Embodied Agent to Understand Human Instructions [3.943519623674811]
我々は, Embodied Agent (tagE) のためのタスク・アンド・引数・グラウンドティング(タスク・アンド・引数・グラウンドディング)と呼ばれる新しいシステムを導入する。
本システムでは,自然言語で表現された複雑なタスク命令から一連のタスクを抽出するために,発明的なニューラルネットワークモデルを採用している。
提案モデルでは,入れ子デコードに富んだエンコーダ・デコーダ・フレームワークを用いて,複雑な命令からタスクとその引数を効果的に抽出する。
論文 参考訳(メタデータ) (2023-10-24T08:17:48Z) - Dobby: A Conversational Service Robot Driven by GPT-4 [22.701223191699412]
この研究は、対話型AIエージェントをサービスタスクの具体化システムに組み込むロボティクスプラットフォームを導入する。
このエージェントは、膨大な一般知識のコーパスから学んだ、大きな言語モデルに由来する。
本発明のエージェントは対話生成に加えて、ロボットのコマンドを呼び出し、物理世界と対話することができる。
論文 参考訳(メタデータ) (2023-10-10T04:34:00Z) - WALL-E: Embodied Robotic WAiter Load Lifting with Large Language Model [92.90127398282209]
本稿では,最新のLarge Language Models(LLM)と既存のビジュアルグラウンドとロボットグルーピングシステムを統合する可能性について検討する。
本稿では,この統合の例としてWALL-E (Embodied Robotic WAiter load lifting with Large Language model)を紹介する。
我々は,このLCMを利用したシステムを物理ロボットに展開し,よりユーザフレンドリなインタフェースで指導誘導型把握タスクを実現する。
論文 参考訳(メタデータ) (2023-08-30T11:35:21Z) - Human-guided Collaborative Problem Solving: A Natural Language based
Framework [74.27063862727849]
私たちのフレームワークは3つのコンポーネントで構成されています - 自然言語エンジンが言語発話を形式表現と逆変換に解析します。
このフレームワークが、Minecraftベースのブロックワールドドメインにおける協調的なビルディングタスクにおいて、協調的な問題解決の鍵となる課題に対処する能力について説明する。
論文 参考訳(メタデータ) (2022-07-19T21:52:37Z) - Human Heuristics for AI-Generated Language Are Flawed [8.465228064780744]
我々は,最も個人的かつ連続的な言語である動詞の自己表現が,AIによって生成されたかを検討した。
我々は,これらの単語がAI生成言語の人間の判断を予測可能で操作可能であることを実験的に実証した。
我々は、AIアクセントのようなソリューションについて議論し、AIによって生成された言語の誤認の可能性を減らす。
論文 参考訳(メタデータ) (2022-06-15T03:18:56Z) - Interactive Grounded Language Understanding in a Collaborative
Environment: IGLU 2021 [58.196738777207315]
協調環境における対話型接地言語理解のためのemphIGLUを提案する。
競争の主目的は、対話型エージェントをいかにして構築するかという問題にアプローチすることであり、協調環境において、接地された自然言語命令を提供しながらタスクの解決を学ぶことである。
論文 参考訳(メタデータ) (2022-05-05T01:20:09Z) - Do As I Can, Not As I Say: Grounding Language in Robotic Affordances [119.29555551279155]
大規模な言語モデルは、世界に関する豊富な意味知識を符号化することができる。
このような知識は、自然言語で表現された高レベルで時間的に拡張された命令を動作させようとするロボットにとって極めて有用である。
低レベルのスキルを大規模言語モデルと組み合わせることで,言語モデルが複雑かつ時間的に拡張された命令を実行する手順について高いレベルの知識を提供することを示す。
論文 参考訳(メタデータ) (2022-04-04T17:57:11Z) - CALVIN: A Benchmark for Language-conditioned Policy Learning for
Long-horizon Robot Manipulation Tasks [30.936692970187416]
汎用ロボットは、人間の言語を認識や行動に関連付けることを学ばなければならない。
CALVIN(CALVIN)は、長期の言語条件のタスクを学習するためのオープンソースのシミュレーションベンチマークである。
論文 参考訳(メタデータ) (2021-12-06T18:37:33Z) - Natural Language for Human-Robot Collaboration: Problems Beyond Language
Grounding [10.227242085922613]
この文脈では一般に研究されていない言語処理のいくつかの側面を同定する。
これには場所、計画、世代が含まれる。
我々は,各課題に対する評価を提案し,簡単な手法のベースラインを提供し,コラボレーションのための言語を学ぶ上での課題や機会を議論することで解決する。
論文 参考訳(メタデータ) (2021-10-09T03:24:38Z) - Learning Language-Conditioned Robot Behavior from Offline Data and
Crowd-Sourced Annotation [80.29069988090912]
本研究では,ロボットインタラクションの大規模なオフラインデータセットから視覚に基づく操作タスクを学習する問題について検討する。
クラウドソースの自然言語ラベルを用いたオフラインロボットデータセットの活用を提案する。
提案手法は目標画像仕様と言語条件付き模倣技術の両方を25%以上上回っていることがわかった。
論文 参考訳(メタデータ) (2021-09-02T17:42:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。