論文の概要: ECHo: Event Causality Inference via Human-centric Reasoning
- arxiv url: http://arxiv.org/abs/2305.14740v1
- Date: Wed, 24 May 2023 05:21:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-25 19:31:42.631466
- Title: ECHo: Event Causality Inference via Human-centric Reasoning
- Title(参考訳): ECHo:人間中心推論による事象因果推論
- Authors: Yuxi Xie and Guanzhen Li and Min-Yen Kan
- Abstract要約: 本稿では,視覚・言語的社会的シナリオに基づく事象因果推論の診断データセットであるECHoを紹介する。
我々は、現在のAIシステムの推論能力を評価するために、Chain-of-Thought(CoT)パラダイムと整合した統合フレームワークを提案する。
- 参考スコア(独自算出の注目度): 18.606313462183056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce ECHo, a diagnostic dataset of event causality inference grounded
in visual-and-linguistic social scenarios. ECHo employs real-world
human-centric deductive information collected from crime drama, bridging the
gap in multimodal reasoning towards higher social intelligence through the
elicitation of intermediate Theory-of-Mind (ToM). We propose a unified
framework aligned with the Chain-of-Thought (CoT) paradigm to assess the
reasoning capability of current AI systems. This ToM-enhanced CoT pipeline can
accommodate and integrate various large foundation models in zero-shot
visual-and-linguistic understanding. With this framework, we scrutinize the
advanced large language and multimodal models via three complementary
human-centric ECHo tasks. Further analysis demonstrates ECHo as a challenging
dataset to expose imperfections and inconsistencies in reasoning.
- Abstract(参考訳): 視覚的・言語的社会シナリオに基づく事象因果推論の診断データセットであるechoを紹介する。
ECHoは、犯罪ドラマから収集された現実の人間中心の誘引情報を採用し、中間理論(ToM)の適用を通じて、高い社会的知性へのマルチモーダル推論のギャップを埋める。
我々は、現在のAIシステムの推論能力を評価するために、Chain-of-Thought(CoT)パラダイムと整合した統合フレームワークを提案する。
このToMで強化されたCoTパイプラインは、ゼロショット視覚言語理解において、様々な大きな基礎モデルに対応および統合することができる。
本フレームワークでは,3つの補完的な人間中心ECHoタスクを用いて,先進的な大規模言語とマルチモーダルモデルを精査する。
さらなる分析は、ECHoが推論における不完全性と矛盾を明らかにするための挑戦的なデータセットであることを示している。
関連論文リスト
- ACQUIRED: A Dataset for Answering Counterfactual Questions In Real-Life
Videos [53.92440577914417]
ACQUIREDは3.9Kの注釈付きビデオで構成され、幅広いイベントタイプを包含し、ファーストパーソンとサードパーソンの両方の視点を取り入れている。
各ビデオは、物理的、社会的、時間的な3つの異なる推論の次元にまたがる質問で注釈付けされている。
我々は,現在最先端の言語のみおよびマルチモーダルモデルに対して,我々のデータセットをベンチマークし,実験結果から大きな性能差が示された。
論文 参考訳(メタデータ) (2023-11-02T22:17:03Z) - Harnessing Collective Intelligence Under a Lack of Cultural Consensus [0.1813006808606333]
CCT(Cultural Consensus Theory)は、異なるコンセンサス・コンセンサス・コンセンサス(コンセンサス・コンセンサス・コンセンサス・コンセンサス・コンセンサス)を検出するための統計的枠組みを提供する。
我々は、事前訓練されたディープニューラルネットワーク埋め込みと、それらのエンティティに関するコンセンサス信念を、回答者の1つ以上のサブセットにマッピングする潜在構造で拡張する。
iDLC-CCTはコンセンサスの度合いをよりよく予測し、サンプル外エンティティによく一般化し、スパースデータでも有効であることがわかった。
論文 参考訳(メタデータ) (2023-09-18T14:05:04Z) - Towards Fair and Explainable AI using a Human-Centered AI Approach [5.888646114353372]
分類システムと単語埋め込みにおける説明可能性と公平性の向上を目的とした5つの研究プロジェクトについて述べる。
最初のプロジェクトは、ローカルモデル説明を機械教師のインタフェースとして導入するユーティリティ/ダウンサイドについて検討する。
第二のプロジェクトは、因果性に基づくヒューマン・イン・ザ・ループ視覚ツールであるD-BIASを紹介し、データセットの社会的バイアスを特定し緩和する。
第3のプロジェクトは、グループに対するバイアスに対するトレーニング済みの静的単語埋め込みの監査を支援する、ビジュアルインタラクティブツールであるWordBiasを提示する。
4番目のプロジェクトは、ソーシャルを識別するビジュアル分析ツールDramatVis Personae
論文 参考訳(メタデータ) (2023-06-12T21:08:55Z) - A Study of Situational Reasoning for Traffic Understanding [63.45021731775964]
トラフィック領域における状況推論のための3つの新しいテキストベースのタスクを考案する。
先行作業における言語推論タスクにまたがる一般化能力を示す知識強化手法を4つ採用する。
本稿では,データ分割におけるモデル性能の詳細な解析を行い,モデル予測を分類的に検討する。
論文 参考訳(メタデータ) (2023-06-05T01:01:12Z) - EnDex: Evaluation of Dialogue Engagingness at Scale [30.15445159524315]
本研究では,対話性を評価する最初の人間反応モデルであるEnDexを提案する。
コード、既製のEnDexモデル、および論文の発行時に大規模なデータセットをリリースします。
論文 参考訳(メタデータ) (2022-10-22T06:09:43Z) - ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational
Finance Question Answering [70.6359636116848]
本稿では,対話型質問応答における数値推論の連鎖を研究するために,新しい大規模データセットConvFinQAを提案する。
我々のデータセットは、現実世界の会話において、長距離で複雑な数値推論パスをモデル化する上で大きな課題となる。
論文 参考訳(メタデータ) (2022-10-07T23:48:50Z) - Neural Causal Models for Counterfactual Identification and Estimation [62.30444687707919]
本稿では,ニューラルモデルによる反事実文の評価について検討する。
まず、神経因果モデル(NCM)が十分に表現可能であることを示す。
第2に,反事実分布の同時同定と推定を行うアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-09-30T18:29:09Z) - Causal Reasoning Meets Visual Representation Learning: A Prospective
Study [117.08431221482638]
解釈可能性の欠如、堅牢性、分布外一般化が、既存の視覚モデルの課題となっている。
人間レベルのエージェントの強い推論能力にインスパイアされた近年では、因果推論パラダイムの開発に多大な努力が注がれている。
本稿では,この新興分野を包括的に概観し,注目し,議論を奨励し,新たな因果推論手法の開発の急激さを先導することを目的とする。
論文 参考訳(メタデータ) (2022-04-26T02:22:28Z) - Modeling and Reasoning in Event Calculus using Goal-Directed Constraint
Answer Set Programming [8.677108656718824]
イベント計算(英: Event Calculus、EC)は、常識推論を健全で論理的な基礎でモデル化する形式主義の一群である。
ECを用いた推論の機械化の試みは、高密度領域における連続的な変化の処理に困難に直面した。
我々は、ECシナリオが自然に、直接、s(CASP)にエンコードされる方法と、誘引的および誘引的推論タスクを実現する方法を示す。
論文 参考訳(メタデータ) (2021-06-28T10:43:25Z) - A Minimalist Dataset for Systematic Generalization of Perception,
Syntax, and Semantics [131.93113552146195]
我々は,機械が一般化可能な概念を学習する能力を調べるため,新しいデータセットであるHINT(Hand written arithmetic with INTegers)を提案する。
HINTでは、イメージなどの生信号から概念がどのように認識されるかを学ぶことが機械のタスクである。
我々は、RNN、Transformer、GPT-3など、様々なシーケンス・ツー・シーケンスモデルで広範囲に実験を行った。
論文 参考訳(メタデータ) (2021-03-02T01:32:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。