論文の概要: Solving the Baby Intuitions Benchmark with a Hierarchically Bayesian
Theory of Mind
- arxiv url: http://arxiv.org/abs/2208.02914v1
- Date: Thu, 4 Aug 2022 22:27:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-08 12:30:24.559786
- Title: Solving the Baby Intuitions Benchmark with a Hierarchically Bayesian
Theory of Mind
- Title(参考訳): 階層的ベイズ心の理論による乳児直観ベンチマークの解法
- Authors: Tan Zhi-Xuan, Nishad Gothoskar, Falk Pollok, Dan Gutfreund, Joshua B.
Tenenbaum, Vikash K. Mansinghka
- Abstract要約: 本稿では,最近提案されたBaby Intuitions Benchmarkに対するベイズ解について述べる。
エージェントの目標と配置に関する階層的な優先順位を含めることで、HBToMモデルに対する推論はエージェントの効率性と嗜好をほとんど学習することができない。
このアプローチは、ほとんどのベンチマークタスクにおいてほぼ完璧な精度を実現し、ディープラーニングと模倣学習のベースラインを上回ります。
- 参考スコア(独自算出の注目度): 40.973571562607226
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To facilitate the development of new models to bridge the gap between machine
and human social intelligence, the recently proposed Baby Intuitions Benchmark
(arXiv:2102.11938) provides a suite of tasks designed to evaluate commonsense
reasoning about agents' goals and actions that even young infants exhibit. Here
we present a principled Bayesian solution to this benchmark, based on a
hierarchically Bayesian Theory of Mind (HBToM). By including hierarchical
priors on agent goals and dispositions, inference over our HBToM model enables
few-shot learning of the efficiency and preferences of an agent, which can then
be used in commonsense plausibility judgements about subsequent agent behavior.
This approach achieves near-perfect accuracy on most benchmark tasks,
outperforming deep learning and imitation learning baselines while producing
interpretable human-like inferences, demonstrating the advantages of structured
Bayesian models of human social cognition.
- Abstract(参考訳): 最近提案されたBaby Intuitions Benchmark (arXiv:2102.1 1938)は、機械と人間のソーシャルインテリジェンスのギャップを埋めるための新しいモデルの開発を容易にするために、若い幼児でさえも、エージェントの目標や行動に関する常識的推論を評価するために設計された一連のタスクを提供している。
ここでは、階層的ベイズ心の理論(hbtom)に基づいて、このベンチマークに対する原理ベイズ解を示す。
エージェントの目標と配置に関する階層的な事前情報を含めることで、我々のHBToMモデルによる推論は、エージェントの効率性や嗜好の少なからぬ学習を可能にし、その後のエージェントの振る舞いに関する常識的妥当性判断に使用することができる。
このアプローチは、ほとんどのベンチマークタスクにおいてほぼ完全に近い精度を達成し、人間の社会的認知の構造化ベイズモデルの利点を実証しながら、深層学習や模倣学習のベースラインよりも優れています。
関連論文リスト
- Learning to Assist Humans without Inferring Rewards [65.28156318196397]
我々は、エンパワーメントのレンズを通して支援を研究する先行研究に基づいて構築する。
補助剤は、人間の行動の影響を最大化することを目的としている。
これらの表現は、先行研究と類似したエンパワーメントの概念を推定する。
論文 参考訳(メタデータ) (2024-11-04T21:31:04Z) - WorkArena++: Towards Compositional Planning and Reasoning-based Common Knowledge Work Tasks [85.95607119635102]
大型言語モデル(LLM)は人間のような知性を模倣することができる。
WorkArena++は、Webエージェントの計画、問題解決、論理的/論理的推論、検索、コンテキスト的理解能力を評価するように設計されている。
論文 参考訳(メタデータ) (2024-07-07T07:15:49Z) - When is an Embedding Model More Promising than Another? [33.540506562970776]
埋め込みは機械学習において中心的な役割を担い、あらゆるオブジェクトを数値表現に投影し、様々な下流タスクを実行するために利用することができる。
埋め込みモデルの評価は一般にドメイン固有の経験的アプローチに依存する。
本稿では, 組込み器の評価を統一的に行い, 充足性と情報性の概念を考察する。
論文 参考訳(メタデータ) (2024-06-11T18:13:46Z) - Building Socially-Equitable Public Models [32.35090986784889]
パブリックモデルは、さまざまなダウンストリームタスクを予測し、さまざまなAIアプリケーションにおいて重要な役割を果たす。
我々は、下流エージェントの目的を最適化プロセスに統合することを提唱する。
本研究では,不均一なエージェント間の公平性を育成し,パフォーマンスの相違に対処する新しいエクイタブル・オブジェクトを提案する。
論文 参考訳(メタデータ) (2024-06-04T21:27:43Z) - Approximating Human Models During Argumentation-based Dialogues [4.178382980763478]
説明可能なAI計画(XAIP)の主な課題は、モデルの和解である。
本稿では,AIエージェントによる確率的人間モデル学習と更新を可能にする新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-28T23:22:18Z) - Scalable Evaluation of Multi-Agent Reinforcement Learning with Melting
Pot [71.28884625011987]
Melting PotはMARL評価スイートで、強化学習を使用して、新しいテストシナリオを作成するのに必要な人的労力を削減する。
幅広い研究トピックをカバーする80以上のユニークなテストシナリオを作成しました。
これらのテストシナリオを標準的なMARLトレーニングアルゴリズムに適用し、Melting Potがトレーニングのパフォーマンスだけでは明らかでない弱点をいかに明らかにするかを実証する。
論文 参考訳(メタデータ) (2021-07-14T17:22:14Z) - SIMPLE: SIngle-network with Mimicking and Point Learning for Bottom-up
Human Pose Estimation [81.03485688525133]
Single-network with Mimicking and Point Learning for Bottom-up Human Pose Estimation (SIMPLE) を提案する。
具体的には、トレーニングプロセスにおいて、SIMPLEが高性能なトップダウンパイプラインからのポーズ知識を模倣できるようにする。
さらに、SIMPLEは人間検出とポーズ推定を統一的なポイントラーニングフレームワークとして定式化し、単一ネットワークで相互に補完する。
論文 参考訳(メタデータ) (2021-04-06T13:12:51Z) - AGENT: A Benchmark for Core Psychological Reasoning [60.35621718321559]
直観心理学は、観察可能な行動を駆動する隠された精神変数を推論する能力です。
他のエージェントを推論する機械エージェントに対する近年の関心にもかかわらず、そのようなエージェントが人間の推論を駆動するコア心理学の原則を学ぶか保持するかは明らかではない。
本稿では,プロシージャが生成する3dアニメーション,エージェントを4つのシナリオで構成したベンチマークを提案する。
論文 参考訳(メタデータ) (2021-02-24T14:58:23Z) - Baby Intuitions Benchmark (BIB): Discerning the goals, preferences, and
actions of others [13.929484165904206]
私たちのベンチマークは、人間の幼児のような他のエージェントに関する汎用的で常識的な推論を達成するために機械に挑戦します。
幼児の認知に関する研究と同様に、機械はエージェントの行動の妥当性を予測しなければならない期待パラダイムに違反している。
最近提案された深層学習に基づく推論モデルでは,幼児のような推論が得られなかった。
論文 参考訳(メタデータ) (2021-02-23T21:01:06Z) - Meta-trained agents implement Bayes-optimal agents [13.572630988699572]
メモリベースメタラーニングはベイズ最適エージェントを数値的に近似する手法として有用であることを示す。
その結果,記憶に基づくメタラーニングはベイズ最適エージェントを数値的に近似する一般的な手法である可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-21T18:05:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。