論文の概要: Deriving Commonsense Inference Tasks from Interactive Fictions
- arxiv url: http://arxiv.org/abs/2010.09788v1
- Date: Mon, 19 Oct 2020 19:02:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 20:28:49.354211
- Title: Deriving Commonsense Inference Tasks from Interactive Fictions
- Title(参考訳): 対話的フィクションから常識推論課題を導出する
- Authors: Mo Yu, Xiaoxiao Guo, Yufei Feng, Xiaodan Zhu, Michael Greenspan,
Murray Campbell
- Abstract要約: 本研究では,人間のインタラクティブなフィクションゲームプレイに基づく新しいコモンセンス推論データセットを提案する。
実験により,我々の課題は十分な常識知識を持つ人間の専門家に解けるが,既存の機械読解モデルに課題が生じることが示された。
- 参考スコア(独自算出の注目度): 44.15655034882293
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Commonsense reasoning simulates the human ability to make presumptions about
our physical world, and it is an indispensable cornerstone in building general
AI systems. We propose a new commonsense reasoning dataset based on human's
interactive fiction game playings as human players demonstrate plentiful and
diverse commonsense reasoning. The new dataset mitigates several limitations of
the prior art. Experiments show that our task is solvable to human experts with
sufficient commonsense knowledge but poses challenges to existing machine
reading models, with a big performance gap of more than 30%.
- Abstract(参考訳): commonsenseの推論は、私たちの物理的な世界について推定する人間の能力をシミュレートするものであり、一般的なaiシステムを構築する上で必須の基盤である。
本稿では,人間プレイヤーが多種多様かつ多様なコモンセンス推論を示すために,人間のインタラクティブなゲームプレイに基づく新しいコモンセンス推論データセットを提案する。
新しいデータセットは、以前の技術のいくつかの制限を緩和する。
実験によれば、我々のタスクは人間の専門家には十分常識的な知識で解決できるが、既存の機械学習モデルに課題を提起し、パフォーマンスギャップは30%以上である。
関連論文リスト
- HumanPlus: Humanoid Shadowing and Imitation from Humans [82.47551890765202]
ヒューマノイドが人間のデータから動きや自律的なスキルを学ぶためのフルスタックシステムを導入する。
まず、既存の40時間動作データセットを用いて、強化学習によるシミュレーションの低レベルポリシーを訓練する。
次に、自己中心型視覚を用いてスキルポリシーを訓練し、ヒューマノイドが自律的に異なるタスクを完了できるようにする。
論文 参考訳(メタデータ) (2024-06-15T00:41:34Z) - ACQUIRED: A Dataset for Answering Counterfactual Questions In Real-Life
Videos [53.92440577914417]
ACQUIREDは3.9Kの注釈付きビデオで構成され、幅広いイベントタイプを包含し、ファーストパーソンとサードパーソンの両方の視点を取り入れている。
各ビデオは、物理的、社会的、時間的な3つの異なる推論の次元にまたがる質問で注釈付けされている。
我々は,現在最先端の言語のみおよびマルチモーダルモデルに対して,我々のデータセットをベンチマークし,実験結果から大きな性能差が示された。
論文 参考訳(メタデータ) (2023-11-02T22:17:03Z) - Human Uncertainty in Concept-Based AI Systems [37.82747673914624]
概念に基づくAIシステムのコンテキストにおける人間の不確実性について検討する。
不確実な概念ラベルによるトレーニングは、概念ベースシステムにおける弱点を軽減するのに役立つ可能性がある。
論文 参考訳(メタデータ) (2023-03-22T19:17:57Z) - BO-Muse: A human expert and AI teaming framework for accelerated
experimental design [58.61002520273518]
我々のアルゴリズムは、人間の専門家が実験プロセスでリードすることを可能にする。
我々のアルゴリズムは、AIや人間よりも高速に、サブ線形に収束することを示す。
論文 参考訳(メタデータ) (2023-03-03T02:56:05Z) - JECC: Commonsense Reasoning Tasks Derived from Interactive Fictions [75.42526766746515]
本稿では,人間のインタラクティブ・フィクション(IF)ゲームプレイ・ウォークスルーに基づく新しいコモンセンス推論データセットを提案する。
本データセットは,事実知識ではなく,機能的コモンセンス知識ルールの評価に重点を置いている。
実験の結果、導入したデータセットは、以前の機械読影モデルと新しい大規模言語モデルに難題であることが示されている。
論文 参考訳(メタデータ) (2022-10-18T19:20:53Z) - Humanly Certifying Superhuman Classifiers [8.736864280782592]
機械学習システムの性能を推定することは、人工知能研究における長年の課題である。
我々は,参照のための不完全な人間のアノテーションのみを用いて,オラクルと比較して精度を推定する理論を開発した。
この環境での超人的性能の検出と証明のための簡単なレシピを提供する。
論文 参考訳(メタデータ) (2021-09-16T11:00:05Z) - The Ingredients of Real-World Robotic Reinforcement Learning [71.92831985295163]
実世界で収集されたデータによって継続的に自律的に改善できるロボット学習システムに必要な要素について論じる。
本稿では,このようなシステムの特異なインスタンス化を事例として,デクスタラスな操作を事例として提案する。
我々は人間の介入なしに学習できることを実証し、現実世界の3本指の手で様々な視覚ベースのスキルを習得する。
論文 参考訳(メタデータ) (2020-04-27T03:36:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。