論文の概要: Active Reasoning in an Open-World Environment
- arxiv url: http://arxiv.org/abs/2311.02018v1
- Date: Fri, 3 Nov 2023 16:24:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-06 13:32:35.460566
- Title: Active Reasoning in an Open-World Environment
- Title(参考訳): オープンワールド環境におけるアクティブ推論
- Authors: Manjie Xu, Guangyuan Jiang, Wei Liang, Chi Zhang, Yixin Zhu
- Abstract要約: $Conan$は、アクティブな推論を評価するために考案されたインタラクティブなオープンワールド環境である。
この$Conan$は、Minecraftのようなリッチでオープンな設定を思い起こさせるような、多ラウンドの誘惑的推論を促進する。
我々の分析は、複雑なシナリオの探索と理解において、現代の最先端モデルの欠点を浮き彫りにしている。
- 参考スコア(独自算出の注目度): 29.596555383319814
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in vision-language learning have achieved notable success on
complete-information question-answering datasets through the integration of
extensive world knowledge. Yet, most models operate passively, responding to
questions based on pre-stored knowledge. In stark contrast, humans possess the
ability to actively explore, accumulate, and reason using both newfound and
existing information to tackle incomplete-information questions. In response to
this gap, we introduce $Conan$, an interactive open-world environment devised
for the assessment of active reasoning. $Conan$ facilitates active exploration
and promotes multi-round abductive inference, reminiscent of rich, open-world
settings like Minecraft. Diverging from previous works that lean primarily on
single-round deduction via instruction following, $Conan$ compels agents to
actively interact with their surroundings, amalgamating new evidence with prior
knowledge to elucidate events from incomplete observations. Our analysis on
$Conan$ underscores the shortcomings of contemporary state-of-the-art models in
active exploration and understanding complex scenarios. Additionally, we
explore Abduction from Deduction, where agents harness Bayesian rules to recast
the challenge of abduction as a deductive process. Through $Conan$, we aim to
galvanize advancements in active reasoning and set the stage for the next
generation of artificial intelligence agents adept at dynamically engaging in
environments.
- Abstract(参考訳): 視覚言語学習の最近の進歩は、広範な世界知識の統合を通じて、全情報質問応答データセットにおいて顕著な成功を収めている。
しかし、ほとんどのモデルは受動的に動作し、事前の知識に基づいて質問に答える。
対照的に、人間は不完全な情報問題に取り組むために、新しい情報と既存の情報の両方を使って積極的に探索し、蓄積し、推論する能力を持っている。
このギャップに対応するために,我々は,アクティブ推論の評価のために考案された対話型オープンワールド環境である$conan$を導入する。
conan$はアクティブな探索を促進し、minecraftのようなリッチでオープンワールドな設定を思い起こさせる多ラウンドの推論を促進する。
命令を通した単一ラウンドの推論に主に依存する以前の研究から逸脱し、$Conan$ compels agent は周囲と積極的に相互作用し、不完全な観測から出来事を解明するための以前の知識と新しい証拠を融合させる。
当社の$conan$に関する分析は、複雑なシナリオのアクティブな探索と理解における現代の最先端モデルの欠点を浮き彫りにしている。
さらに, エージェントがベイズ規則を利用して, 誘拐の難しさを誘引的プロセスとして再放送する, 誘惑からのアブダクションについても検討する。
我々は、$Conan$を通じて、アクティブな推論の進歩を活性化し、環境に動的に関与できる次世代の人工知能エージェントの舞台を整える。
関連論文リスト
- Mars: Situated Inductive Reasoning in an Open-World Environment [77.14465960780726]
本稿では,位置帰納的推論のために考案された対話型環境であるMarsを設計する。
ランドスケープ、サバイバル設定、タスク依存性を変更することで、反常識的なゲームメカニズムを導入する。
火星では、エージェントは周囲と積極的に対話し、有用なルールを導き、特定の状況下で意思決定タスクを実行する必要がある。
論文 参考訳(メタデータ) (2024-10-10T17:10:34Z) - WESE: Weak Exploration to Strong Exploitation for LLM Agents [95.6720931773781]
本稿では,オープンワールド対話型タスクの解法において,LLMエージェントの強化を目的としたWeak Exploration to Strong Exploitation (WESE)を提案する。
WESEは、探究と搾取のプロセスを分離し、費用対効果の弱いエージェントを用いて世界的知識の探索を行う。
次に、獲得した知識を格納し、タスク関連知識を抽出する知識グラフベースの戦略を導入する。
論文 参考訳(メタデータ) (2024-04-11T03:31:54Z) - Open-world Machine Learning: A Review and New Outlooks [83.6401132743407]
本稿では,新たなオープンワールド機械学習パラダイムを包括的に紹介することを目的としている。
研究者がそれぞれの分野でより強力なAIシステムを構築するのを支援し、人工知能の開発を促進することを目的としている。
論文 参考訳(メタデータ) (2024-03-04T06:25:26Z) - A Survey of Imitation Learning: Algorithms, Recent Developments, and
Challenges [9.288673880680033]
模倣学習(英: mimicion learning、IL)とは、専門家の行動を模倣することによって望ましい行動が学習される過程である。
本稿では、ILの概要と、その基礎となる前提とアプローチの概要について述べる。
また、この分野における最近の進歩と新たな研究分野についても詳述している。
論文 参考訳(メタデータ) (2023-09-05T11:56:07Z) - Brain in a Vat: On Missing Pieces Towards Artificial General
Intelligence in Large Language Models [83.63242931107638]
本稿では,知的エージェントの4つの特徴について述べる。
実世界の物体との活発な関わりは、概念的表現を形成するためのより堅牢な信号をもたらすと我々は主張する。
我々は、人工知能分野における将来的な研究の方向性を概説して結論付ける。
論文 参考訳(メタデータ) (2023-07-07T13:58:16Z) - Embodied Agents for Efficient Exploration and Smart Scene Description [47.82947878753809]
我々は、自律的なエージェントが見えない屋内環境を探索し、マッピングする必要がある視覚ナビゲーションの設定に取り組む。
本稿では,視覚ロボット探査と画像キャプションの最近の進歩を組み合わせたアプローチを提案し,評価する。
提案手法は,環境の意味的知識を最大化し,繰り返しを避けるスマートなシーン記述を生成する。
論文 参考訳(メタデータ) (2023-01-17T19:28:01Z) - Curious Exploration via Structured World Models Yields Zero-Shot Object
Manipulation [19.840186443344]
そこで本研究では,制御ループに帰納バイアスを組み込む構造的世界モデルを用いて,サンプル効率の高い探索を実現することを提案する。
提案手法は,早期にオブジェクトと対話し始める自由プレイ動作を生成し,時間とともにより複雑な動作を発達させる。
論文 参考訳(メタデータ) (2022-06-22T22:08:50Z) - Information is Power: Intrinsic Control via Information Capture [110.3143711650806]
我々は,潜時状態空間モデルを用いて推定したエージェントの状態訪問のエントロピーを最小化する,コンパクトで汎用的な学習目的を論じる。
この目的は、不確実性の低減に対応する環境情報収集と、将来の世界状態の予測不可能性の低減に対応する環境制御の両方をエージェントに誘導する。
論文 参考訳(メタデータ) (2021-12-07T18:50:42Z) - Explore and Explain: Self-supervised Navigation and Recounting [43.52107532692226]
エージェントがこれまで知らなかった環境を探索し、経路中に何が見えるかを再計算する、新しい具体的環境を考案する。
この文脈では、エージェントは探索目標によって駆動される環境をナビゲートし、記述のための適切な瞬間を選択し、関連するオブジェクトやシーンの自然言語記述を出力する必要がある。
本モデルでは,新たな自己監督型探索モジュールとペナルティと,説明のための完全なキャプションモデルを統合した。
論文 参考訳(メタデータ) (2020-07-14T18:00:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。