論文の概要: Solving the Baby Intuitions Benchmark with a Hierarchically Bayesian
Theory of Mind
- arxiv url: http://arxiv.org/abs/2208.02914v1
- Date: Thu, 4 Aug 2022 22:27:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-08 12:30:24.559786
- Title: Solving the Baby Intuitions Benchmark with a Hierarchically Bayesian
Theory of Mind
- Title(参考訳): 階層的ベイズ心の理論による乳児直観ベンチマークの解法
- Authors: Tan Zhi-Xuan, Nishad Gothoskar, Falk Pollok, Dan Gutfreund, Joshua B.
Tenenbaum, Vikash K. Mansinghka
- Abstract要約: 本稿では,最近提案されたBaby Intuitions Benchmarkに対するベイズ解について述べる。
エージェントの目標と配置に関する階層的な優先順位を含めることで、HBToMモデルに対する推論はエージェントの効率性と嗜好をほとんど学習することができない。
このアプローチは、ほとんどのベンチマークタスクにおいてほぼ完璧な精度を実現し、ディープラーニングと模倣学習のベースラインを上回ります。
- 参考スコア(独自算出の注目度): 40.973571562607226
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To facilitate the development of new models to bridge the gap between machine
and human social intelligence, the recently proposed Baby Intuitions Benchmark
(arXiv:2102.11938) provides a suite of tasks designed to evaluate commonsense
reasoning about agents' goals and actions that even young infants exhibit. Here
we present a principled Bayesian solution to this benchmark, based on a
hierarchically Bayesian Theory of Mind (HBToM). By including hierarchical
priors on agent goals and dispositions, inference over our HBToM model enables
few-shot learning of the efficiency and preferences of an agent, which can then
be used in commonsense plausibility judgements about subsequent agent behavior.
This approach achieves near-perfect accuracy on most benchmark tasks,
outperforming deep learning and imitation learning baselines while producing
interpretable human-like inferences, demonstrating the advantages of structured
Bayesian models of human social cognition.
- Abstract(参考訳): 最近提案されたBaby Intuitions Benchmark (arXiv:2102.1 1938)は、機械と人間のソーシャルインテリジェンスのギャップを埋めるための新しいモデルの開発を容易にするために、若い幼児でさえも、エージェントの目標や行動に関する常識的推論を評価するために設計された一連のタスクを提供している。
ここでは、階層的ベイズ心の理論(hbtom)に基づいて、このベンチマークに対する原理ベイズ解を示す。
エージェントの目標と配置に関する階層的な事前情報を含めることで、我々のHBToMモデルによる推論は、エージェントの効率性や嗜好の少なからぬ学習を可能にし、その後のエージェントの振る舞いに関する常識的妥当性判断に使用することができる。
このアプローチは、ほとんどのベンチマークタスクにおいてほぼ完全に近い精度を達成し、人間の社会的認知の構造化ベイズモデルの利点を実証しながら、深層学習や模倣学習のベースラインよりも優れています。
関連論文リスト
- Hypothesis-Driven Theory-of-Mind Reasoning for Large Language Models [76.6028674686018]
エージェントの精神状態を追跡するための推論時間推論アルゴリズムである思考トレースを導入する。
提案アルゴリズムは,ベイズ理論をモデルとした。
本研究は,様々なベンチマークにおける思考トレーシングを評価し,大幅な性能向上を実証した。
論文 参考訳(メタデータ) (2025-02-17T15:08:50Z) - BRiTE: Bootstrapping Reinforced Thinking Process to Enhance Language Model Reasoning [78.63421517563056]
大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な機能を示した。
本稿では,新しいグラフィカルモデルを用いてLLM推論を定式化する統一確率的フレームワークを提案する。
本稿では,Bootstrapping Reinforced Thinking Process (BRiTE)アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2025-01-31T02:39:07Z) - Large Language Models as Theory of Mind Aware Generative Agents with Counterfactual Reflection [31.38516078163367]
ToM-agentは、オープンドメインの会話相互作用において、LLMベースの生成エージェントがToMをシミュレートできるように設計されている。
ToM-Adntは、精神状態に対するエージェントの認識のエミュレーションを促進するため、精神状態からの信頼を解き放つ。
以上の結果から,ToM-agentは,意味的情緒的支援や意思決定に限らず,相手の行動の根底にある要因を把握できることが示唆された。
論文 参考訳(メタデータ) (2025-01-26T00:32:38Z) - Building Socially-Equitable Public Models [32.35090986784889]
パブリックモデルは、さまざまなダウンストリームタスクを予測し、さまざまなAIアプリケーションにおいて重要な役割を果たす。
我々は、下流エージェントの目的を最適化プロセスに統合することを提唱する。
本研究では,不均一なエージェント間の公平性を育成し,パフォーマンスの相違に対処する新しいエクイタブル・オブジェクトを提案する。
論文 参考訳(メタデータ) (2024-06-04T21:27:43Z) - Scalable Evaluation of Multi-Agent Reinforcement Learning with Melting
Pot [71.28884625011987]
Melting PotはMARL評価スイートで、強化学習を使用して、新しいテストシナリオを作成するのに必要な人的労力を削減する。
幅広い研究トピックをカバーする80以上のユニークなテストシナリオを作成しました。
これらのテストシナリオを標準的なMARLトレーニングアルゴリズムに適用し、Melting Potがトレーニングのパフォーマンスだけでは明らかでない弱点をいかに明らかにするかを実証する。
論文 参考訳(メタデータ) (2021-07-14T17:22:14Z) - SIMPLE: SIngle-network with Mimicking and Point Learning for Bottom-up
Human Pose Estimation [81.03485688525133]
Single-network with Mimicking and Point Learning for Bottom-up Human Pose Estimation (SIMPLE) を提案する。
具体的には、トレーニングプロセスにおいて、SIMPLEが高性能なトップダウンパイプラインからのポーズ知識を模倣できるようにする。
さらに、SIMPLEは人間検出とポーズ推定を統一的なポイントラーニングフレームワークとして定式化し、単一ネットワークで相互に補完する。
論文 参考訳(メタデータ) (2021-04-06T13:12:51Z) - AGENT: A Benchmark for Core Psychological Reasoning [60.35621718321559]
直観心理学は、観察可能な行動を駆動する隠された精神変数を推論する能力です。
他のエージェントを推論する機械エージェントに対する近年の関心にもかかわらず、そのようなエージェントが人間の推論を駆動するコア心理学の原則を学ぶか保持するかは明らかではない。
本稿では,プロシージャが生成する3dアニメーション,エージェントを4つのシナリオで構成したベンチマークを提案する。
論文 参考訳(メタデータ) (2021-02-24T14:58:23Z) - Baby Intuitions Benchmark (BIB): Discerning the goals, preferences, and
actions of others [13.929484165904206]
私たちのベンチマークは、人間の幼児のような他のエージェントに関する汎用的で常識的な推論を達成するために機械に挑戦します。
幼児の認知に関する研究と同様に、機械はエージェントの行動の妥当性を予測しなければならない期待パラダイムに違反している。
最近提案された深層学習に基づく推論モデルでは,幼児のような推論が得られなかった。
論文 参考訳(メタデータ) (2021-02-23T21:01:06Z) - Meta-trained agents implement Bayes-optimal agents [13.572630988699572]
メモリベースメタラーニングはベイズ最適エージェントを数値的に近似する手法として有用であることを示す。
その結果,記憶に基づくメタラーニングはベイズ最適エージェントを数値的に近似する一般的な手法である可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-21T18:05:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。