論文の概要: Learning Explicit Behavioral Models with Adaptive Questions and World-Model Probes
- arxiv url: http://arxiv.org/abs/2606.07127v1
- Date: Fri, 05 Jun 2026 10:34:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.692627
- Title: Learning Explicit Behavioral Models with Adaptive Questions and World-Model Probes
- Title(参考訳): 適応的質問と世界モデルプローブを用いた明示的行動モデル学習
- Authors: Hikaru Shindo, Yu Deng, Teng Cao, Quentin Delfosse, Christopher Tauchmann, Jannis Blüml, Gopika Sudhakaran, Kristian Kersting,
- Abstract要約: 明示的行動モデル(ESBM)は、型付き述語、重み付けされたルール、バウンドオプション、メカニズムメモリを通しての振る舞いを表す。
適応的な質問とアクティブなワールドモデルプローブはスコアエラー、QAエラー、遷移予測エラーをローカルESBM編集の制約に変換する。
ESBMは明確な回答と実行可能なメカニズム予測を生成しながら、ハイスコアなポリシーを学びます。
- 参考スコア(独自算出の注目度): 33.45606616891203
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interactive agents trained only against task return can achieve high scores while failing to represent the mechanisms that make their actions succeed. This makes brittle behavior difficult to diagnose and limits adaptation when environment dynamics change. Existing LLM reflection and policy-code repair can revise behavior from failed trajectories, but questions and world-understanding tests are usually used only after training. We introduce an Explicit Symbolic Behavioral Model (ESBM), a trainable behavioral model that couples task performance with evidence-grounded question answering and executable mechanism prediction. An ESBM represents behavior through typed predicates, weighted rules, bounded options and mechanism memory; the mechanism layer predicts symbolic events, object changes, rewards and terminal consequences under action interventions. After each rollout, adaptive questions and active world-model probes convert score failures, QA errors and transition-prediction errors into constraints for local ESBM edits. Candidate models are selected by a multi-criterion rule that jointly evaluates task score, answerability and active world-model consistency. Under the tested Atari-style protocols, ESBM learns high-scoring policies while producing explicit answers and executable mechanism predictions, indicating that adaptive questions can serve as both training pressure and reusable benchmarks for mechanistic policy learning in this setting.
- Abstract(参考訳): タスクリターンに対してのみ訓練された対話エージェントは、アクションを成功させるメカニズムの表現に失敗しながら、高いスコアを達成することができる。
これにより、環境力学の変化による適応の診断や制限が困難になる。
既存のLCMリフレクションとポリシーコード修復は、失敗した軌道から振舞いを修正することができるが、質問や世界理解テストは通常、訓練後にのみ使用される。
本稿では,タスク性能とエビデンスに基づく質問応答と実行可能なメカニズム予測とを結合する訓練可能な行動モデルである Explicit Symbolic Behavioral Model (ESBM) を紹介する。
ESBMは、型付き述語、重み付けされたルール、境界付けられたオプション、およびメカニズムメモリを通しての振る舞いを表します。
各ロールアウト、適応的な質問、アクティブなワールドモデルプローブはスコアエラー、QAエラー、トランジッション予測エラーをローカルESBM編集の制約に変換する。
候補モデルは、タスクスコア、応答可能性、アクティブなワールドモデル一貫性を共同評価する多基準ルールによって選択される。
テストされたAtariスタイルのプロトコルの下でESBMは、明示的な回答と実行可能なメカニズム予測を生成しながら、ハイスコアなポリシーを学び、適応的な質問が、この環境でのメカニスティックなポリシー学習のためのトレーニングプレッシャと再利用可能なベンチマークとして機能することを示します。
関連論文リスト
- OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents [74.20327254615854]
大規模言語モデルエージェントは、シーケンシャルな意思決定タスクを解決するために、推論、行動選択、観察をインターリーブする。
LLMエージェントの既存の推論時間適応法は、主にプロンプトや検索に依存している。
提案するOLIVIAは,ReAct型エージェントのための推論時行動適応フレームワークである。
論文 参考訳(メタデータ) (2026-05-11T19:28:20Z) - AGWM: Affordance-Grounded World Models for Environments with Compositional Prerequisites [18.635313325437664]
我々は,行動の動的実行可能性を明確に追跡するために,前提条件依存のDAGとして表される抽象的な空き構造を学習するAGWM(Affordance-Grounded World Model)を提案する。
ゲームベースのシミュレーション環境の実験では、より低いマルチステップ予測誤差、新しい構成へのより良い一般化、解釈可能性の向上により、本手法の有効性が示された。
論文 参考訳(メタデータ) (2026-05-07T18:46:44Z) - Reshaping Action Error Distributions for Reliable Vision-Language-Action Models [69.38615670891038]
ロボット操作において、視覚言語アクション(VLA)モデルは、一般化可能でスケーラブルなロボットポリシーを学ぶための有望なパラダイムとして登場した。
連続動作型VLAモデルに焦点をあて、トレーニング中の動作誤差分布を再構成することにより、従来のMSEベースの回帰を超越する。
複数の代表的VLAアーキテクチャ上で、標準、少数ショット、ノイズの多い設定にまたがるアプローチを評価します。
論文 参考訳(メタデータ) (2026-02-04T05:37:09Z) - On the Paradoxical Interference between Instruction-Following and Task Solving [50.75960598434753]
次の命令は、大規模言語モデル(LLM)を、タスクの実行方法に関する明示的な制約を指定することで、人間の意図と整合させることを目的としている。
我々は,LLMのタスク解決能力にパラドックス的に干渉する命令に従うという,直感に反する現象を明らかにした。
本稿では,タスク解決に追従する命令の干渉を定量化する指標として,SUSTAINSCOREを提案する。
論文 参考訳(メタデータ) (2026-01-29T17:48:56Z) - Grounded Test-Time Adaptation for LLM Agents [75.62784644919803]
大規模言語モデル(LLM)ベースのエージェントは、新規で複雑な環境への一般化に苦慮している。
環境特化情報を活用することで, LLMエージェントを適応するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2025-11-06T22:24:35Z) - From Physics to Machine Learning and Back: Part II - Learning and Observational Bias in PHM [52.64097278841485]
物理インフォームドモデリングとデータストラテジーによる学習と観察バイアスの導入は、モデルを物理的に一貫した信頼性のある予測へと導くことができるかを検討する。
メタラーニングや少数ショットラーニングなどの高速適応手法をドメイン一般化手法とともに検討する。
論文 参考訳(メタデータ) (2025-09-25T14:15:43Z) - Model Editing as a Double-Edged Sword: Steering Agent Ethical Behavior Toward Beneficence or Harm [57.00627691433355]
我々は、モデル編集タスクとしてエージェントの行動ステアリングをフレーム化し、振舞い編集という。
心理学的道徳理論に基づくベンチマークであるBehaviorBenchを紹介する。
行動編集は倫理的・好意的な行動を促進するためにも、逆に有害な行動や悪意のある行動を引き起こすためにも利用できることを実証する。
論文 参考訳(メタデータ) (2025-06-25T16:51:51Z) - REAL: Reading Out Transformer Activations for Precise Localization in Language Model Steering [26.428347164111926]
推論時ステアリングは、パラメータを変更することなく、大きな言語モデルの応答を変更することを目的としている。
既存のアプローチはしばしば単純化的なキューやアドホックな一般化に依存している。
本稿では,Transformerモデルにおける振る舞い関連モジュールを識別するフレームワークであるREALを紹介する。
論文 参考訳(メタデータ) (2025-06-10T02:16:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。