論文の概要: Modeling Others' Minds as Code
- arxiv url: http://arxiv.org/abs/2510.01272v1
- Date: Mon, 29 Sep 2025 22:56:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.779387
- Title: Modeling Others' Minds as Code
- Title(参考訳): コードとしての他人の心のモデリング
- Authors: Kunal Jha, Aydan Yuenan Huang, Eric Ye, Natasha Jaques, Max Kleiman-Weiner,
- Abstract要約: コード内の行動プログラムを合成する新しいアルゴリズムであるROTEを紹介する。
ROTEは、スパースな観察から人間とAIの振る舞いを予測する。
行動理解をプログラム合成問題として扱うことで、ROTEはAIシステムが現実世界の人間の行動を効率的に効果的に予測する道を開く。
- 参考スコア(独自算出の注目度): 11.32494166591141
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate prediction of human behavior is essential for robust and safe human-AI collaboration. However, existing approaches for modeling people are often data-hungry and brittle because they either make unrealistic assumptions about rationality or are too computationally demanding to adapt rapidly. Our key insight is that many everyday social interactions may follow predictable patterns; efficient "scripts" that minimize cognitive load for actors and observers, e.g., "wait for the green light, then go." We propose modeling these routines as behavioral programs instantiated in computer code rather than policies conditioned on beliefs and desires. We introduce ROTE, a novel algorithm that leverages both large language models (LLMs) for synthesizing a hypothesis space of behavioral programs, and probabilistic inference for reasoning about uncertainty over that space. We test ROTE in a suite of gridworld tasks and a large-scale embodied household simulator. ROTE predicts human and AI behaviors from sparse observations, outperforming competitive baselines -- including behavior cloning and LLM-based methods -- by as much as 50% in terms of in-sample accuracy and out-of-sample generalization. By treating action understanding as a program synthesis problem, ROTE opens a path for AI systems to efficiently and effectively predict human behavior in the real-world.
- Abstract(参考訳): 人間の行動の正確な予測は、堅牢で安全な人間とAIのコラボレーションに不可欠である。
しかし、人間をモデル化するための既存のアプローチは、合理性に関する非現実的な仮定を行うか、高速な適応を計算的に要求しすぎるため、しばしばデータ不足と不安定である。
私たちの重要な洞察は、多くの日常生活の社会的相互作用は予測可能なパターンに従い、アクターとオブザーバの認知負荷を最小限に抑える効率的な「スクリプト」、例えば「グリーンライトを待つ」といったものである。
本稿では,これらのルーチンを,信念や欲求に則ったポリシーではなく,コンピュータコードでインスタンス化された行動プログラムとしてモデル化することを提案する。
本稿では,行動プログラムの仮説空間を合成するために,大規模言語モデル(LLM)と,その空間上の不確かさを推論するための確率論的推論の両方を活用する新しいアルゴリズムROTEを紹介する。
ROTEをグリッドワールドのタスクスイートと大規模な実機シミュレータでテストする。
ROTEは、粗い観察から人間とAIの振る舞いを予測し、行動クローニングやLCMベースの手法を含む競争ベースラインを、サンプル内精度とサンプル外一般化の観点から最大50%向上させる。
行動理解をプログラム合成問題として扱うことで、ROTEはAIシステムが現実世界の人間の行動を効率的に効果的に予測する道を開く。
関連論文リスト
- Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - REBEL: Reward Regularization-Based Approach for Robotic Reinforcement Learning from Human Feedback [61.54791065013767]
報酬関数と人間の嗜好の相違は、現実世界で破滅的な結果をもたらす可能性がある。
近年の手法は、人間の嗜好から報酬関数を学習することで、不適応を緩和することを目的としている。
本稿では,ロボットRLHFフレームワークにおける報酬正規化の新たな概念を提案する。
論文 参考訳(メタデータ) (2023-12-22T04:56:37Z) - Real-time Addressee Estimation: Deployment of a Deep-Learning Model on
the iCub Robot [52.277579221741746]
住所推定は、社会ロボットが人間とスムーズに対話するために必要なスキルである。
人間の知覚スキルにインスパイアされたディープラーニングモデルは、iCubロボットに設計、訓練、デプロイされる。
本研究では,人間-ロボットのリアルタイムインタラクションにおいて,そのような実装の手順とモデルの性能について述べる。
論文 参考訳(メタデータ) (2023-11-09T13:01:21Z) - Large Language Models as Zero-Shot Human Models for Human-Robot Interaction [12.455647753787442]
大型言語モデル(LLM)は、人間とロボットの相互作用のためのゼロショット人間モデルとして機能する。
LLMは目的のモデルに匹敵する性能を達成する。
シミュレーションされた信頼に基づくテーブルクリーニングタスクのケーススタディを提案する。
論文 参考訳(メタデータ) (2023-03-06T23:16:24Z) - Robust Planning for Human-Robot Joint Tasks with Explicit Reasoning on
Human Mental State [2.8246074016493457]
我々は,人間ロボットチームが達成するための既知の目的を持った共有タスクを与えられる,人間に意識したタスク計画問題を考える。
近年のアプローチでは、ロボットが両方のエージェント(共有された)タスクを計画する独立した合理的エージェントのチームとしてそれをモデル化している。
本稿では,実行時の可観測性規約をモデル化し,使用するための新しいアプローチについて述べる。
論文 参考訳(メタデータ) (2022-10-17T09:21:00Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Intuitive and Efficient Human-robot Collaboration via Real-time
Approximate Bayesian Inference [4.310882094628194]
コラボレーションロボットとエンドツーエンドAIは、工場や倉庫における人間のタスクの柔軟な自動化を約束する。
人間とコボットは互いに協力します。
これらのコラボレーションが効果的で安全であるためには、ロボットは人間の意図をモデル化し、予測し、活用する必要がある。
論文 参考訳(メタデータ) (2022-05-17T23:04:44Z) - Active Uncertainty Learning for Human-Robot Interaction: An Implicit
Dual Control Approach [5.05828899601167]
暗黙的な二重制御パラダイムに基づくループ内動作計画のための不確実性学習を実現するアルゴリズムを提案する。
提案手法は,動的プログラミングモデル予測制御問題のサンプリングに基づく近似に依拠する。
結果として得られたポリシーは、連続的およびカテゴリー的不確実性を持つ一般的な人間の予測モデルに対する二重制御効果を維持することが示されている。
論文 参考訳(メタデータ) (2022-02-15T20:40:06Z) - iCORPP: Interleaved Commonsense Reasoning and Probabilistic Planning on
Robots [46.13039152809055]
我々はiCORPPと呼ばれる新しいアルゴリズムを提案し、現在の世界状態を同時に推定し、世界ダイナミクスの推論を行い、タスク指向のコントローラを構築する。
結果は、競合するベースラインと比較して、スケーラビリティ、効率、適応性が大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2020-04-18T17:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。