論文の概要: ECHo: A Visio-Linguistic Dataset for Event Causality Inference via
Human-Centric Reasoning
- arxiv url: http://arxiv.org/abs/2305.14740v2
- Date: Mon, 23 Oct 2023 10:35:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 11:31:50.715926
- Title: ECHo: A Visio-Linguistic Dataset for Event Causality Inference via
Human-Centric Reasoning
- Title(参考訳): ECHo:人間中心推論による事象因果推論のためのビシオ言語データセット
- Authors: Yuxi Xie and Guanzhen Li and Min-Yen Kan
- Abstract要約: ECHoは、視覚言語学的社会的シナリオに基づくイベント因果推論のデータセットである。
我々は,現在のAIシステムの推論能力を評価するために,統合型Chain-of-Thought(CoT)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 22.951360187153156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce ECHo (Event Causality Inference via Human-Centric Reasoning), a
diagnostic dataset of event causality inference grounded in visio-linguistic
social scenarios. ECHo employs real-world human-centric deductive information
building on a television crime drama. ECHo requires the Theory-of-Mind (ToM)
ability to understand and reason about social interactions based on multimodal
information. Using ECHo, we propose a unified Chain-of-Thought (CoT) framework
to assess the reasoning capability of current AI systems. Our ToM-enhanced CoT
pipeline accommodates various large foundation models in both zero-shot and
few-shot visio-linguistic reasoning. We use this framework to scrutinize recent
large foundation models such as InstructGPT and MiniGPT-4 on three diagnostic
human-centric tasks. Further analysis demonstrates ECHo as a challenging
dataset to expose imperfections and inconsistencies in reasoning. Our data and
code are publicly available at https://github.com/YuxiXie/ECHo.
- Abstract(参考訳): 視覚言語社会シナリオに基づく事象因果推論の診断データセットであるECHo(Event Causality Inference via Human-Centric Reasoning)を紹介する。
ECHoは、テレビ犯罪ドラマに現実の人間中心の演能情報ビルを雇用している。
ECHoは、マルチモーダル情報に基づいて社会的相互作用を理解し、推論する、理論・オブ・ミンド(ToM)能力を必要とする。
筆者らはECHoを用いて,現在のAIシステムの推論能力を評価するために,統合型Chain-of-Thought(CoT)フレームワークを提案する。
当社のToM強化CoTパイプラインは、ゼロショットと少数ショットのビジオ言語推論の両方において、さまざまな大きな基礎モデルに対応しています。
InstructGPTやMiniGPT-4といった最近の大規模基盤モデルを3つの診断的人間中心のタスクで精査するために,この枠組みを用いる。
さらなる分析は、ECHoが推論における不完全性と矛盾を明らかにするための挑戦的なデータセットであることを示している。
私たちのデータとコードはhttps://github.com/YuxiXie/ECHo.comで公開されています。
関連論文リスト
- ACQUIRED: A Dataset for Answering Counterfactual Questions In Real-Life
Videos [53.92440577914417]
ACQUIREDは3.9Kの注釈付きビデオで構成され、幅広いイベントタイプを包含し、ファーストパーソンとサードパーソンの両方の視点を取り入れている。
各ビデオは、物理的、社会的、時間的な3つの異なる推論の次元にまたがる質問で注釈付けされている。
我々は,現在最先端の言語のみおよびマルチモーダルモデルに対して,我々のデータセットをベンチマークし,実験結果から大きな性能差が示された。
論文 参考訳(メタデータ) (2023-11-02T22:17:03Z) - Harnessing Collective Intelligence Under a Lack of Cultural Consensus [0.1813006808606333]
CCT(Cultural Consensus Theory)は、異なるコンセンサス・コンセンサス・コンセンサス(コンセンサス・コンセンサス・コンセンサス・コンセンサス・コンセンサス)を検出するための統計的枠組みを提供する。
我々は、事前訓練されたディープニューラルネットワーク埋め込みと、それらのエンティティに関するコンセンサス信念を、回答者の1つ以上のサブセットにマッピングする潜在構造で拡張する。
iDLC-CCTはコンセンサスの度合いをよりよく予測し、サンプル外エンティティによく一般化し、スパースデータでも有効であることがわかった。
論文 参考訳(メタデータ) (2023-09-18T14:05:04Z) - Towards Fair and Explainable AI using a Human-Centered AI Approach [5.888646114353372]
分類システムと単語埋め込みにおける説明可能性と公平性の向上を目的とした5つの研究プロジェクトについて述べる。
最初のプロジェクトは、ローカルモデル説明を機械教師のインタフェースとして導入するユーティリティ/ダウンサイドについて検討する。
第二のプロジェクトは、因果性に基づくヒューマン・イン・ザ・ループ視覚ツールであるD-BIASを紹介し、データセットの社会的バイアスを特定し緩和する。
第3のプロジェクトは、グループに対するバイアスに対するトレーニング済みの静的単語埋め込みの監査を支援する、ビジュアルインタラクティブツールであるWordBiasを提示する。
4番目のプロジェクトは、ソーシャルを識別するビジュアル分析ツールDramatVis Personae
論文 参考訳(メタデータ) (2023-06-12T21:08:55Z) - A Study of Situational Reasoning for Traffic Understanding [63.45021731775964]
トラフィック領域における状況推論のための3つの新しいテキストベースのタスクを考案する。
先行作業における言語推論タスクにまたがる一般化能力を示す知識強化手法を4つ採用する。
本稿では,データ分割におけるモデル性能の詳細な解析を行い,モデル予測を分類的に検討する。
論文 参考訳(メタデータ) (2023-06-05T01:01:12Z) - EnDex: Evaluation of Dialogue Engagingness at Scale [30.15445159524315]
本研究では,対話性を評価する最初の人間反応モデルであるEnDexを提案する。
コード、既製のEnDexモデル、および論文の発行時に大規模なデータセットをリリースします。
論文 参考訳(メタデータ) (2022-10-22T06:09:43Z) - ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational
Finance Question Answering [70.6359636116848]
本稿では,対話型質問応答における数値推論の連鎖を研究するために,新しい大規模データセットConvFinQAを提案する。
我々のデータセットは、現実世界の会話において、長距離で複雑な数値推論パスをモデル化する上で大きな課題となる。
論文 参考訳(メタデータ) (2022-10-07T23:48:50Z) - Neural Causal Models for Counterfactual Identification and Estimation [62.30444687707919]
本稿では,ニューラルモデルによる反事実文の評価について検討する。
まず、神経因果モデル(NCM)が十分に表現可能であることを示す。
第2に,反事実分布の同時同定と推定を行うアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-09-30T18:29:09Z) - Causal Reasoning Meets Visual Representation Learning: A Prospective
Study [117.08431221482638]
解釈可能性の欠如、堅牢性、分布外一般化が、既存の視覚モデルの課題となっている。
人間レベルのエージェントの強い推論能力にインスパイアされた近年では、因果推論パラダイムの開発に多大な努力が注がれている。
本稿では,この新興分野を包括的に概観し,注目し,議論を奨励し,新たな因果推論手法の開発の急激さを先導することを目的とする。
論文 参考訳(メタデータ) (2022-04-26T02:22:28Z) - Modeling and Reasoning in Event Calculus using Goal-Directed Constraint
Answer Set Programming [8.677108656718824]
イベント計算(英: Event Calculus、EC)は、常識推論を健全で論理的な基礎でモデル化する形式主義の一群である。
ECを用いた推論の機械化の試みは、高密度領域における連続的な変化の処理に困難に直面した。
我々は、ECシナリオが自然に、直接、s(CASP)にエンコードされる方法と、誘引的および誘引的推論タスクを実現する方法を示す。
論文 参考訳(メタデータ) (2021-06-28T10:43:25Z) - A Minimalist Dataset for Systematic Generalization of Perception,
Syntax, and Semantics [131.93113552146195]
我々は,機械が一般化可能な概念を学習する能力を調べるため,新しいデータセットであるHINT(Hand written arithmetic with INTegers)を提案する。
HINTでは、イメージなどの生信号から概念がどのように認識されるかを学ぶことが機械のタスクである。
我々は、RNN、Transformer、GPT-3など、様々なシーケンス・ツー・シーケンスモデルで広範囲に実験を行った。
論文 参考訳(メタデータ) (2021-03-02T01:32:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。