論文の概要: MINT: Minimal Information Neuro-Symbolic Tree for Objective-Driven Knowledge-Gap Reasoning and Active Elicitation
- arxiv url: http://arxiv.org/abs/2602.05048v1
- Date: Wed, 04 Feb 2026 20:58:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.615998
- Title: MINT: Minimal Information Neuro-Symbolic Tree for Objective-Driven Knowledge-Gap Reasoning and Active Elicitation
- Title(参考訳): MINT: 目的駆動型知識ギャップ推論とアクティブ励磁のための最小情報ニューロシンボリックツリー
- Authors: Zeyu Fang, Tian Lan, Mahdi Imani,
- Abstract要約: 言語に基づくインタラクションによる共同計画は、人間とAIのコラボレーションの重要な領域である。
我々は、AIエージェントがオブジェクト駆動計画において、人間の入力を積極的に引き出すための最適なインタラクション戦略を見つけることの問題を考察する。
我々は、知識ギャップの影響を推論し、MINTとの自己プレイを活用し、AIエージェントのエリケーション戦略とクエリを最適化するために、最小情報ニューロシンボリックツリー(MINT)を提案する。
- 参考スコア(独自算出の注目度): 12.062030893143081
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Joint planning through language-based interactions is a key area of human-AI teaming. Planning problems in the open world often involve various aspects of incomplete information and unknowns, e.g., objects involved, human goals/intents -- thus leading to knowledge gaps in joint planning. We consider the problem of discovering optimal interaction strategies for AI agents to actively elicit human inputs in object-driven planning. To this end, we propose Minimal Information Neuro-Symbolic Tree (MINT) to reason about the impact of knowledge gaps and leverage self-play with MINT to optimize the AI agent's elicitation strategies and queries. More precisely, MINT builds a symbolic tree by making propositions of possible human-AI interactions and by consulting a neural planning policy to estimate the uncertainty in planning outcomes caused by remaining knowledge gaps. Finally, we leverage LLM to search and summarize MINT's reasoning process and curate a set of queries to optimally elicit human inputs for best planning performance. By considering a family of extended Markov decision processes with knowledge gaps, we analyze the return guarantee for a given MINT with active human elicitation. Our evaluation on three benchmarks involving unseen/unknown objects of increasing realism shows that MINT-based planning attains near-expert returns by issuing a limited number of questions per task while achieving significantly improved rewards and success rates.
- Abstract(参考訳): 言語に基づくインタラクションによる共同計画は、人間とAIのコラボレーションの重要な領域である。
オープンな世界での計画上の問題は、しばしば不完全な情報と未知の様々な側面、例えば、関係するオブジェクト、人間のゴール/インテントを含む。
我々は、AIエージェントがオブジェクト駆動計画において、人間の入力を積極的に引き出すための最適なインタラクション戦略を見つけることの問題を考察する。
この目的のために、知識ギャップの影響を推論し、MINTとのセルフプレイを活用し、AIエージェントのエリケーション戦略とクエリを最適化するミニマルインフォメーションニューロシンボリックツリー(MINT)を提案する。
より正確には、MINTは人間とAIの相互作用の可能性を提案することで象徴的なツリーを構築し、残りの知識ギャップに起因する計画結果の不確実性を推定するために神経計画政策をコンサルティングすることで構築する。
最後に, LLM を利用して MINT の推論プロセスの検索と要約を行い, 最適な計画性能を得るために, 最適に人間の入力を抽出するクエリの集合をキュレートする。
知識ギャップを持つマルコフ決定プロセスのファミリーを考慮することにより、アクティブな人間によるMINTのリターン保証を解析する。
MINTをベースとした計画では,課題ごとの質問数に制限を課し,報酬や成功率を大幅に向上させることで,ほぼ熟練したリターンが得られることを示す。
関連論文リスト
- A Desideratum for Conversational Agents: Capabilities, Challenges, and Future Directions [51.96890647837277]
大規模言語モデル(LLM)は、従来の対話システムから、自律的な行動、文脈認識、ユーザとのマルチターンインタラクションが可能な高度なエージェントへと、会話AIを推進してきた。
本調査では,人間レベルの知性にアプローチするよりスケーラブルなシステムにおいて,何が達成されたのか,どのような課題が持続するのか,何を行う必要があるのか,といった,次世代の会話エージェントのデシラトゥムを提示する。
論文 参考訳(メタデータ) (2025-04-07T21:01:25Z) - From Consumption to Collaboration: Measuring Interaction Patterns to Augment Human Cognition in Open-Ended Tasks [2.048226951354646]
ジェネレーティブAIの台頭、特に大規模言語モデル(LLM)は、知識労働における認知過程を根本的に変えるものである。
本稿では、認知活動モード(探索対搾取)と認知エンゲージメントモード(建設対有害)の2つの側面に沿って相互作用パターンを分析する枠組みを提案する。
論文 参考訳(メタデータ) (2025-04-03T17:20:36Z) - Feedback-Aware Monte Carlo Tree Search for Efficient Information Seeking in Goal-Oriented Conversations [10.352944689413398]
本稿では,Large Language Models (LLMs) を利用して情報探索質問を生成する新しいフレームワークを提案する。
推測時間計画の一環として,情報獲得を最大化する質問を戦略的に選択する。
本研究は,目標指向対話における情報探索の促進にMCTSが有効であることを示すものである。
論文 参考訳(メタデータ) (2025-01-25T03:42:22Z) - WESE: Weak Exploration to Strong Exploitation for LLM Agents [95.6720931773781]
本稿では,オープンワールド対話型タスクの解法において,LLMエージェントの強化を目的としたWeak Exploration to Strong Exploitation (WESE)を提案する。
WESEは、探究と搾取のプロセスを分離し、費用対効果の弱いエージェントを用いて世界的知識の探索を行う。
次に、獲得した知識を格納し、タスク関連知識を抽出する知識グラフベースの戦略を導入する。
論文 参考訳(メタデータ) (2024-04-11T03:31:54Z) - Learning adaptive planning representations with natural language
guidance [90.24449752926866]
本稿では,タスク固有の計画表現を自動構築するフレームワークであるAdaについて述べる。
Adaは、プランナー互換の高レベルアクション抽象化と、特定の計画タスク領域に適応した低レベルコントローラのライブラリを対話的に学習する。
論文 参考訳(メタデータ) (2023-12-13T23:35:31Z) - Towards Goal-oriented Intelligent Tutoring Systems in Online Education [65.17234980710386]
目標指向知能チューニングシステム(GITS)という新しいタスクを提案する。
GITSは,演習や評価のカスタマイズを戦略的に計画することで,学生の指定概念の習得を可能にすることを目的としている。
PAI(Planning-Assessment-Interaction)と呼ばれるグラフに基づく新しい強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-03T12:37:16Z) - Comprehensive Multi-Agent Epistemic Planning [0.0]
この写本は、MEP(Multi-Adnt Epistemic Planning)として知られる特殊な計画に重点を置いている。
EPは、エージェントが知識/信任状態の空間で理由付けを行い、開始状態から望ましい状態に到達する計画を見つけようとする自動計画環境を指す。
その一般的な形であるMEP問題(英語版)は、世界の状態とエージェント間の情報の流れの両方を推論する必要がある複数のエージェントを含んでいる。
論文 参考訳(メタデータ) (2021-09-17T01:50:18Z) - LEMMA: A Multi-view Dataset for Learning Multi-agent Multi-task
Activities [119.88381048477854]
LEMMAデータセットを導入し、細心の注意深い設定で、行方不明な次元に対処するための単一の家を提供する。
我々は、人間と物体の相互作用による原子間相互作用を密に注釈し、日常の活動の構成性、スケジューリング、割り当ての土台として提供する。
この取り組みにより、マシンビジョンコミュニティは、目標指向の人間活動を調べ、現実世界におけるタスクのスケジューリングと割り当てをさらに研究できることを期待します。
論文 参考訳(メタデータ) (2020-07-31T00:13:54Z) - iCORPP: Interleaved Commonsense Reasoning and Probabilistic Planning on
Robots [46.13039152809055]
我々はiCORPPと呼ばれる新しいアルゴリズムを提案し、現在の世界状態を同時に推定し、世界ダイナミクスの推論を行い、タスク指向のコントローラを構築する。
結果は、競合するベースラインと比較して、スケーラビリティ、効率、適応性が大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2020-04-18T17:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。