論文の概要: ReCo: Reliable Causal Chain Reasoning via Structural Causal Recurrent
Neural Networks
- arxiv url: http://arxiv.org/abs/2212.08322v1
- Date: Fri, 16 Dec 2022 07:48:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-12-19 14:17:58.935480
- Title: ReCo: Reliable Causal Chain Reasoning via Structural Causal Recurrent
Neural Networks
- Title(参考訳): ReCo: 構造因果リカレントニューラルネットワークによる信頼性の高い因果連鎖推論
- Authors: Kai Xiong, Xiao Ding, Zhongyang Li, Li Du, Bing Qin, Yi Zheng and
Baoxing Huai
- Abstract要約: 信頼性の高い因果連鎖推論フレームワーク(ReCo)を提案する。
実験によると、ReCoは中国語と英語のCCRデータセットにおいて、一連の強力なベースラインを上回っている。
BERTは、他の種類の知識によって強化されたBERTモデルよりも、下流の因果関係の4つのタスクでより良いパフォーマンスを達成することができる。
- 参考スコア(独自算出の注目度): 32.537505018598736
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causal chain reasoning (CCR) is an essential ability for many decision-making
AI systems, which requires the model to build reliable causal chains by
connecting causal pairs. However, CCR suffers from two main transitive
problems: threshold effect and scene drift. In other words, the causal pairs to
be spliced may have a conflicting threshold boundary or scenario. To address
these issues, we propose a novel Reliable Causal chain reasoning
framework~(ReCo), which introduces exogenous variables to represent the
threshold and scene factors of each causal pair within the causal chain, and
estimates the threshold and scene contradictions across exogenous variables via
structural causal recurrent neural networks~(SRNN). Experiments show that ReCo
outperforms a series of strong baselines on both Chinese and English CCR
datasets. Moreover, by injecting reliable causal chain knowledge distilled by
ReCo, BERT can achieve better performances on four downstream causal-related
tasks than BERT models enhanced by other kinds of knowledge.
- Abstract(参考訳): 因果連鎖推論(英: Causal chain reasoning, CCR)は、多くの意思決定AIシステムにとって必須の能力であり、因果ペアを接続することで信頼性の高い因果連鎖を構築する必要がある。
しかし、CCRは、しきい値効果とシーンドリフトの2つの主要な遷移問題に悩まされている。
言い換えれば、スプライシングされる因果対は矛盾するしきい値境界やシナリオを持つかもしれない。
これらの問題に対処するために、新しいReliable Causal chain reasoning framework~(ReCo)を提案する。これは、因果連鎖内の各因果ペアのしきい値とシーンファクターを表現するために外因性変数を導入し、構造因果リカレントニューラルネットワーク~(SRNN)を介して外因性変数間のしきい値とシーンの矛盾を推定する。
実験によると、ReCoは中国語と英語のCCRデータセットにおいて、一連の強力なベースラインを上回っている。
さらに,ReCoで蒸留した因果連鎖知識を注入することにより,BERTは他の種類の知識によって強化されたBERTモデルよりも,下流4つの因果関係タスクにおいてより優れた性能が得られる。
関連論文リスト
- Are Reasoning LLMs Robust to Interventions on Their Chain-of-Thought? [79.86483056611105]
推論 LLM は、答えを出す前にステップバイステップの思考連鎖を生成する。
これらの推論は、その内部で発生する破壊の痕跡をどれほど堅牢にしていますか?
一定のタイミングでモデル自身のCoTを摂動させる制御された評価フレームワークを導入する。
論文 参考訳(メタデータ) (2026-02-07T10:02:58Z) - Assessing LLM Reasoning Through Implicit Causal Chain Discovery in Climate Discourse [22.71538103040959]
この研究は、大規模言語モデルの機械的因果推論能力を精査する。
我々は、因果連鎖構造において与えられた因果関係をリンクする全ての中間因果ステップを生成する。
論文 参考訳(メタデータ) (2025-10-15T11:15:00Z) - AdvChain: Adversarial Chain-of-Thought Tuning for Robust Safety Alignment of Large Reasoning Models [62.70575022567081]
本稿では,逆CoTチューニングによる動的自己補正をモデルに教えるアライメントパラダイムであるAdvChainを提案する。
私たちの仕事は、より堅牢で信頼性の高い推論モデルを構築するための新しい方向性を確立します。
論文 参考訳(メタデータ) (2025-09-29T04:27:23Z) - Correlation or Causation: Analyzing the Causal Structures of LLM and LRM Reasoning Process [15.790468401903874]
本研究は、推論モデルにおける因果関係の理解に寄与し、より強力な因果基盤を持つ将来のAIシステムを設計するための洞察を提供する。
以上の結果から,RLVRをトレーニングしたLEMは,より優れた因果推論能力を示し,理想的な因果構造とより密に一致していることが判明した。
論文 参考訳(メタデータ) (2025-09-22T06:44:44Z) - ChainReaction! Structured Approach with Causal Chains as Intermediate Representations for Improved and Explainable Causal Video Question Answering [13.950975794272603]
応答生成から因果推論を明示的に分離する新しい枠組みを提案する。
人間の認知モデルにインスパイアされた構造化因果関係は、低レベルの映像コンテンツを高レベルの因果推論で橋渡しする。
また,因果性指向のキャプション評価指標であるCauCoを提案する。
論文 参考訳(メタデータ) (2025-08-28T17:10:53Z) - Generalization or Hallucination? Understanding Out-of-Context Reasoning in Transformers [76.42159902257677]
我々は、両方の行動は、アウト・オブ・コンテクスト推論(OCR)として知られる単一のメカニズムに由来すると論じる。
OCRは、関連する概念が因果関係であるかによって、一般化と幻覚の両方を駆動する。
我々の研究は、OCR現象を理解するための理論的基盤を提供し、知識注入から望ましくない行動を分析し緩和するための新しいレンズを提供する。
論文 参考訳(メタデータ) (2025-06-12T16:50:45Z) - Graph-of-Causal Evolution: Challenging Chain-of-Model for Reasoning [4.586907225774023]
この研究は因果進化グラフ(GoCE)を提案する。
GoCEは暗黙のトークン表現を、微分可能でスパースな因果隣接行列にマッピングし、計算の各層を通じて因果制約を透過する。
CLUTRR、CLADDER、EX-FEVER、CausalQAなどの公開データセットで評価されている。
論文 参考訳(メタデータ) (2025-06-09T07:26:47Z) - Argument-Centric Causal Intervention Method for Mitigating Bias in Cross-Document Event Coreference Resolution [12.185497507437555]
クロスドキュメントイベント参照解決(CD-ECR)は、複数のドキュメントにまたがるイベントの言及が、同じ実世界の出来事を指すかどうかを判断する。
本稿ではArgument-Centric Causal Intervention(ACCI)に基づく新しい手法を提案する。
ACCIは、引き起こし語摂動の因果的影響を定量化する反ファクト的推論モジュールと、意味論的根拠のある情報に対する高い感度を促進するために、引数認識拡張モジュールを統合する。
論文 参考訳(メタデータ) (2025-06-02T09:46:59Z) - A Reverse Causal Framework to Mitigate Spurious Correlations for Debiasing Scene Graph Generation [59.473751744275496]
シーングラフ生成(SGG)フレームワークは通常、関係の特徴を抽出する検出器と、それらの関係を分類する分類器を備えている。
このような因果連鎖構造は、検出器の入力と最終的な予測の間に急激な相関をもたらす。
本稿では、因果連鎖構造を逆因果構造に再構築し、分類器の入力を共同創設者として扱うことを提案する。
論文 参考訳(メタデータ) (2025-05-29T13:57:01Z) - CDF-RAG: Causal Dynamic Feedback for Adaptive Retrieval-Augmented Generation [3.8808821719659763]
適応検索拡張生成(CDF-RAG)のための因果動的フィードバックを導入する。
CDF-RAGは、クエリを反復的に洗練し、構造化因果グラフを検索し、相互接続された知識ソース間のマルチホップ因果推論を可能にする。
我々は,CDF-RAGを4つの多様なデータセット上で評価し,既存のRAG法よりも応答精度と因果正性を向上させる能力を示した。
論文 参考訳(メタデータ) (2025-04-17T01:15:13Z) - Fine-Tuning on Diverse Reasoning Chains Drives Within-Inference CoT Refinement in LLMs [63.36637269634553]
本稿では,LLMを微調整し,一つの推論ステップで思考の逆連鎖(DCoT)を生成する手法を提案する。
DCoTの微調整により,モデルファミリおよびスケール間のCoTベースライン上での性能が向上することを示す。
我々の研究は、定量的解析と手動評価の両方で、観測された利益は、最初の推論連鎖を洗練させるモデルの能力に由来することを明らかにしているため、重要である。
論文 参考訳(メタデータ) (2024-07-03T15:01:18Z) - Deep Causal Generative Models with Property Control [11.604321459670315]
我々は相関対応因果変分自動エンコーダ(C2VAE)と呼ばれる新しい深層生成フレームワークを提案する。
C2VAEは、非絡み付き潜在ベクトルを用いて特性間の相関関係と因果関係を同時に回復する。
論文 参考訳(メタデータ) (2024-05-25T13:07:27Z) - Focus on Your Question! Interpreting and Mitigating Toxic CoT Problems in Commonsense Reasoning [21.951313919964484]
大規模言語モデルは高レベルのコモンセンス推論能力を示す。
CoTライクな手法は、もともとは正しい答えが間違っていた、というかなりの数に繋がる。
帰属的追跡法と因果的追跡法を用いて,モデルの内部動作機構を探索する。
論文 参考訳(メタデータ) (2024-02-28T14:09:02Z) - Identifiable Latent Polynomial Causal Models Through the Lens of Change [82.14087963690561]
因果表現学習は、観測された低レベルデータから潜在的な高レベル因果表現を明らかにすることを目的としている。
主な課題の1つは、識別可能性(identifiability)として知られるこれらの潜伏因果モデルを特定する信頼性の高い保証を提供することである。
論文 参考訳(メタデータ) (2023-10-24T07:46:10Z) - Inducing Causal Structure for Abstractive Text Summarization [76.1000380429553]
要約データの因果構造を誘導する構造因果モデル(SCM)を導入する。
本稿では因果的要因を模倣できる因果的表現を学習するための因果性インスピレーション付き系列列列モデル(CI-Seq2Seq)を提案する。
2つの広く使われているテキスト要約データセットの実験結果は、我々のアプローチの利点を示している。
論文 参考訳(メタデータ) (2023-08-24T16:06:36Z) - Learning Causally Disentangled Representations via the Principle of Independent Causal Mechanisms [17.074858228123706]
本稿では、因果関係の観測ラベルによって教師される因果関係の非絡み合い表現を学習するための枠組みを提案する。
この枠組みは, 極めて不整合な因果関係を生じさせ, 介入の堅牢性を向上し, 反事実発生と相容れないことを示す。
論文 参考訳(メタデータ) (2023-06-02T00:28:48Z) - Hierarchical Graph Neural Networks for Causal Discovery and Root Cause
Localization [52.72490784720227]
REASONはTopological Causal DiscoveryとPersonal Causal Discoveryで構成されている。
Topological Causal Discoveryコンポーネントは、根本原因を辿るために断層伝播をモデル化することを目的としている。
個々の因果発見コンポーネントは、単一のシステムエンティティの突然の変化パターンのキャプチャに重点を置いている。
論文 参考訳(メタデータ) (2023-02-03T20:17:45Z) - Causal Lifting and Link Prediction [10.336445584242933]
リンク予測において経路依存を扱える最初の因果モデルを開発した。
構造的対埋め込みが低いバイアスを示し、タスクの因果構造を正しく表すことを示す。
因果関係予測タスクの3つのシナリオについて理論的知見を検証した。
論文 参考訳(メタデータ) (2023-02-02T16:25:16Z) - Variational Causal Networks: Approximate Bayesian Inference over Causal
Structures [132.74509389517203]
離散DAG空間上の自己回帰分布をモデル化したパラメトリック変分族を導入する。
実験では,提案した変分後部が真の後部を良好に近似できることを示した。
論文 参考訳(メタデータ) (2021-06-14T17:52:49Z) - Causal Inference Q-Network: Toward Resilient Reinforcement Learning [57.96312207429202]
観測干渉を有する弾力性のあるDRLフレームワークを検討する。
本稿では、因果推論Q-network (CIQ) と呼ばれる因果推論に基づくDRLアルゴリズムを提案する。
実験の結果,提案手法は観測干渉に対して高い性能と高反発性を実現することができた。
論文 参考訳(メタデータ) (2021-02-18T23:50:20Z) - Causal discovery of linear non-Gaussian acyclic models in the presence
of latent confounders [6.1221613913018675]
本稿では,反復因果探索 (RCD) と呼ばれる因果関数モデルに基づく手法を提案する。
RCDは、少数の観測変数間で因果方向を推論し、その関係が潜伏した共同設立者の影響を受けているかどうかを判定する。
論文 参考訳(メタデータ) (2020-01-13T12:55:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。