論文の概要: Baby Intuitions Benchmark (BIB): Discerning the goals, preferences, and
actions of others
- arxiv url: http://arxiv.org/abs/2102.11938v1
- Date: Tue, 23 Feb 2021 21:01:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-26 01:08:03.063610
- Title: Baby Intuitions Benchmark (BIB): Discerning the goals, preferences, and
actions of others
- Title(参考訳): Baby Intuitions Benchmark (BIB): 他人の目標、好み、行動を検討する。
- Authors: Kanishk Gandhi, Gala Stojnic, Brenden M. Lake, Moira R. Dillon
- Abstract要約: 私たちのベンチマークは、人間の幼児のような他のエージェントに関する汎用的で常識的な推論を達成するために機械に挑戦します。
幼児の認知に関する研究と同様に、機械はエージェントの行動の妥当性を予測しなければならない期待パラダイムに違反している。
最近提案された深層学習に基づく推論モデルでは,幼児のような推論が得られなかった。
- 参考スコア(独自算出の注目度): 13.929484165904206
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To achieve human-like common sense about everyday life, machine learning
systems must understand and reason about the goals, preferences, and actions of
others. Human infants intuitively achieve such common sense by making
inferences about the underlying causes of other agents' actions. Directly
informed by research on infant cognition, our benchmark BIB challenges machines
to achieve generalizable, common-sense reasoning about other agents like human
infants do. As in studies on infant cognition, moreover, we use a violation of
expectation paradigm in which machines must predict the plausibility of an
agent's behavior given a video sequence, making this benchmark appropriate for
direct validation with human infants in future studies. We show that recently
proposed, deep-learning-based agency reasoning models fail to show infant-like
reasoning, leaving BIB an open challenge.
- Abstract(参考訳): 日常生活に関する人間のような常識を達成するために、機械学習システムは他人の目標、好み、行動を理解し、推論しなければならない。
ヒトの幼児は、他のエージェントの行動の根本原因について推測することで、直感的にそのような常識を達成する。
私たちのベンチマークBIBは、乳児認知の研究によって直接通知され、人間の幼児のような他のエージェントについての汎用的で常識的な推論を達成するために機械に挑戦します。
さらに, 幼児の認知に関する研究では, 機械が映像シーケンスからエージェントの行動の妥当性を予測し, 将来の研究におけるヒトの幼児との直接の検証に適合させる予測パラダイムに違反する。
最近提案された深層学習に基づく推論モデルでは、幼児のような推論が得られず、BIBはオープンな課題であることを示す。
関連論文リスト
- Modeling User Preferences via Brain-Computer Interfacing [54.3727087164445]
我々はBrain-Computer Interface技術を用いてユーザの好みを推測し、その注意力は視覚的コンテンツと感情的体験との関連性に相関する。
我々はこれらを,情報検索,生成モデルのパーソナライズされたステアリング,感情経験のクラウドソーシング人口推定など,関連するアプリケーションにリンクする。
論文 参考訳(メタデータ) (2024-05-15T20:41:46Z) - ThinkBot: Embodied Instruction Following with Thought Chain Reasoning [66.09880459084901]
EIF(Embodied Instruction following)は、複雑な環境下でオブジェクトを相互作用させることで、エージェントが人間の指示を完了させる。
我々は,人間の指導における思考連鎖を原因とした思考ボットを提案し,その不足した行動記述を復元する。
私たちのThinkBotは、成功率と実行効率の両面で、最先端のEIFメソッドよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2023-12-12T08:30:09Z) - Challenges in Video-Based Infant Action Recognition: A Critical
Examination of the State of the Art [9.327466428403916]
InfActPrimitive’という,5つの重要な幼児マイルストーンアクションカテゴリを含む,画期的なデータセットを紹介します。
近縁骨格に基づく行動認識モデルを用いた広範囲な比較分析を行う。
以上の結果から,PoseC3Dモデルでは約71%の精度で高い精度を達成できたが,残りのモデルでは乳幼児行動の動態を正確に把握することが困難であった。
論文 参考訳(メタデータ) (2023-11-21T02:36:47Z) - JECC: Commonsense Reasoning Tasks Derived from Interactive Fictions [75.42526766746515]
本稿では,人間のインタラクティブ・フィクション(IF)ゲームプレイ・ウォークスルーに基づく新しいコモンセンス推論データセットを提案する。
本データセットは,事実知識ではなく,機能的コモンセンス知識ルールの評価に重点を置いている。
実験の結果、導入したデータセットは、以前の機械読影モデルと新しい大規模言語モデルに難題であることが示されている。
論文 参考訳(メタデータ) (2022-10-18T19:20:53Z) - Solving the Baby Intuitions Benchmark with a Hierarchically Bayesian
Theory of Mind [40.973571562607226]
本稿では,最近提案されたBaby Intuitions Benchmarkに対するベイズ解について述べる。
エージェントの目標と配置に関する階層的な優先順位を含めることで、HBToMモデルに対する推論はエージェントの効率性と嗜好をほとんど学習することができない。
このアプローチは、ほとんどのベンチマークタスクにおいてほぼ完璧な精度を実現し、ディープラーニングと模倣学習のベースラインを上回ります。
論文 参考訳(メタデータ) (2022-08-04T22:27:11Z) - Affect-Aware Deep Belief Network Representations for Multimodal
Unsupervised Deception Detection [3.04585143845864]
ラベルを必要とせず、ビデオの現実世界、高い盗難を検出するための教師なしのアプローチ。
本稿では,感情を意識しないDeep Belief Networks (DBN) の新たなアプローチを提案する。
また、DBNモデルを訓練する機能として顔の感情を使用するだけでなく、音声・視覚表現の整列器として顔の感情を利用するDBN訓練手順も導入する。
論文 参考訳(メタデータ) (2021-08-17T22:07:26Z) - Recent Advances in Leveraging Human Guidance for Sequential
Decision-Making Tasks [60.380501589764144]
人工知能の長年の目標は、シーケンシャルな意思決定を必要とするタスクを実行することを学ぶことができる人工知能を作ることである。
学習し行動する人工エージェントであるが、実行すべき特定のタスクを特定するのは人間次第である。
この調査は、主に人間のガイダンスに依存する5つの最近の機械学習フレームワークのハイレベルな概要を提供する。
論文 参考訳(メタデータ) (2021-07-13T03:11:04Z) - AGENT: A Benchmark for Core Psychological Reasoning [60.35621718321559]
直観心理学は、観察可能な行動を駆動する隠された精神変数を推論する能力です。
他のエージェントを推論する機械エージェントに対する近年の関心にもかかわらず、そのようなエージェントが人間の推論を駆動するコア心理学の原則を学ぶか保持するかは明らかではない。
本稿では,プロシージャが生成する3dアニメーション,エージェントを4つのシナリオで構成したベンチマークを提案する。
論文 参考訳(メタデータ) (2021-02-24T14:58:23Z) - Towards Social & Engaging Peer Learning: Predicting Backchanneling and
Disengagement in Children [10.312968200748116]
社会ロボットと対話型コンピュータアプリケーションは、ピアラーニング仲間として振る舞うことで、幼児の早期言語発達を促進する可能性がある。
我々は、リスナーが注意を失うかどうかを予測するためのモデルを開発する(リスナー拡張予測, LDP)。
実験の結果, 瞳孔拡張, 瞬き速度, 頭部運動, 顔面動作単位など, これまでに使用したことのない多モード機能の有用性が示された。
論文 参考訳(メタデータ) (2020-07-22T11:16:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。