Fugu-MT 論文翻訳(概要): Causal Interventions on Causal Paths: Mapping GPT-2's Reasoning From Syntax to Semantics

論文の概要: Causal Interventions on Causal Paths: Mapping GPT-2's Reasoning From Syntax to Semantics

arxiv url: http://arxiv.org/abs/2410.21353v1
Date: Mon, 28 Oct 2024 15:37:56 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:41.52914
Title: Causal Interventions on Causal Paths: Mapping GPT-2's Reasoning From Syntax to Semantics
Title（参考訳）: 因果経路の因果干渉:GPT-2の構文から意味論への推論のマッピング
Authors: Isabelle Lee, Joshua Lum, Ziyi Liu, Dani Yogatama,
Abstract要約: 我々は,LLMにおける因果推論を明確かつ効果的に解析することで特徴付けるための最初のステップを採っている。その結果,最初の2～3層に因果構文が局在していることが判明した。
参考スコア（独自算出の注目度）: 25.41527906415519
License: http://creativecommons.org/licenses/by/4.0/
Abstract: While interpretability research has shed light on some internal algorithms utilized by transformer-based LLMs, reasoning in natural language, with its deep contextuality and ambiguity, defies easy categorization. As a result, formulating clear and motivating questions for circuit analysis that rely on well-defined in-domain and out-of-domain examples required for causal interventions is challenging. Although significant work has investigated circuits for specific tasks, such as indirect object identification (IOI), deciphering natural language reasoning through circuits remains difficult due to its inherent complexity. In this work, we take initial steps to characterize causal reasoning in LLMs by analyzing clear-cut cause-and-effect sentences like "I opened an umbrella because it started raining," where causal interventions may be possible through carefully crafted scenarios using GPT-2 small. Our findings indicate that causal syntax is localized within the first 2-3 layers, while certain heads in later layers exhibit heightened sensitivity to nonsensical variations of causal sentences. This suggests that models may infer reasoning by (1) detecting syntactic cues and (2) isolating distinct heads in the final layers that focus on semantic relationships.
Abstract（参考訳）: 解釈可能性の研究は、自然言語で推論するトランスフォーマーベースのLLMによって利用されるいくつかの内部アルゴリズムに光を当てているが、その深い文脈と曖昧さは容易に分類できる。その結果、因果的介入に必要なドメイン内およびドメイン外例に依存した回路解析のための明確で動機のある質問を定式化することは困難である。間接的物体識別(IOI)などの特定のタスクの回路について重要な研究がなされているが、その複雑さのため、回路による自然言語推論の解読は難しいままである。本研究は,LPMにおける因果推論を,「雨が降り始めたので傘を開けた」などの明快な原因・効果文を分析して特徴付けるための最初のステップである。以上の結果より,第2～3層に因果構文が局在していること,第2～3層に係わる特定の頭部は,因果文の非意味的変化に対する感度を高めることが示唆された。このことは、(1)構文的手がかりを検出し、(2)意味的関係に焦点を絞った最終層において異なる頭部を分離することにより、モデルが推論を推し進める可能性を示唆している。

関連論文リスト

CLATTER: Comprehensive Entailment Reasoning for Hallucination Detection [60.98964268961243]
我々は,系統的かつ包括的な推論プロセスを実行するためのモデルを導くことで,モデルがよりきめ細やかで正確な絞り込み決定を実行できることを提案する。我々は,(i)クレームの分解,(ii)サブクレームの属性と包含分類,および(iii)集約分類から成る3段階の推論プロセスを定義し,そのような導出推論が実際に幻覚検出の改善をもたらすことを示す。
論文参考訳（メタデータ） (2025-06-05T17:02:52Z)
How does Transformer Learn Implicit Reasoning? [41.315116538534106]
制御されたシンボリック環境下でトランスフォーマーをスクラッチからトレーニングすることで、暗黙のマルチホップ推論がどのように現れるかを研究する。原子三重項によるトレーニングは必要ではなく学習を加速し,第2ホップの一般化は特定の構成構造へのクエリレベル露出に依存する。
論文参考訳（メタデータ） (2025-05-29T17:02:49Z)
Investigating the Robustness of Deductive Reasoning with Large Language Models [7.494617747914778]
大規模言語モデル(LLM)は多くの推論に基づく自然言語処理(NLP)タスクにおいて印象的な結果が得られることが示されている。 LLMが、非公式および自己形式化の両方の手法で、どの程度論理的推論タスクに頑健であるかは、まだ不明である。
論文参考訳（メタデータ） (2025-02-04T17:16:51Z)
Can Input Attributions Interpret the Inductive Reasoning Process in In-Context Learning? [19.268703560816498]
本稿では,言語学における一般化テストに触発された帰納的推論の総合的診断タスクを設計する。問題は、従来の入力属性(IA)手法が、ICLにおいてそのような推論プロセスを追跡し、影響のある例を特定することができるかどうかである。
論文参考訳（メタデータ） (2024-12-20T07:35:42Z)
Failure Modes of LLMs for Causal Reasoning on Narratives [51.19592551510628]
世界の知識と論理的推論の相互作用について検討する。最先端の大規模言語モデル(LLM)は、しばしば表面的な一般化に依存している。タスクの単純な再構成により、より堅牢な推論行動が引き起こされることを示す。
論文参考訳（メタデータ） (2024-10-31T12:48:58Z)
Distributional Associations vs In-Context Reasoning: A Study of Feed-forward and Attention Layers [49.80959223722325]
本研究では,大規模言語モデルにおけるフィードフォワード層とアテンション層との区別について検討する。フィードフォワード層はビッグラムのような単純な分布関係を学習する傾向があり、注意層は文脈内推論にフォーカスする。
論文参考訳（メタデータ） (2024-06-05T08:51:08Z)
Disentangling Logic: The Role of Context in Large Language Model Reasoning Capabilities [31.728976421529577]
包括的なドメイン集合からの抽象的および文脈的論理的問題に対するコントラストについて検討する。我々は、標準的な命題論理、特に命題推論と帰納論理推論に焦点を当てる。本実験は,LLMの論理的推論と真の推論能力に関する知見を提供することを目的としている。
論文参考訳（メタデータ） (2024-06-04T21:25:06Z)
Incremental Comprehension of Garden-Path Sentences by Large Language Models: Semantic Interpretation, Syntactic Re-Analysis, and Attention [11.073959609358088]
本研究では,4つの大言語モデルを用いて,園芸パス文の処理と誤解釈の運命について検討する。総合的な目標は、人間とLLMが庭道文の処理に一致しているかどうかを評価することである。実験により,園芸道文の処理における人間とLLMの連携が期待できることが示された。
論文参考訳（メタデータ） (2024-05-25T03:36:13Z)
Understanding and Patching Compositional Reasoning in LLMs [41.918902321483486]
本研究の目的は,言語モデルにおける構成的推論失敗の根本原因を明らかにすることである。実験結果から着想を得たので,ロジットレンズを応用し,LLMの内部隠蔽状態を識別するための介入実験を行った。このディープダイブは、暗黙の推論結果が実際に中間層内に存在することを明らかにし、最終的な明示的な推論結果を形成する上で、因果的な役割を担っている。本研究は, 暗黙の推論結果の正確な生成とレバリングにおいて, リンチピンとして現れるマルチヘッド自己注意モジュール(MHSA)を, これらの層内に発見するものである。
論文参考訳（メタデータ） (2024-02-22T06:47:56Z)
CausalGym: Benchmarking causal interpretability methods on linguistic tasks [52.61917615039112]
CausalGymを使って、モデル動作に因果的に影響を及ぼす解釈可能性手法のベンチマークを行う。ピチアモデル (14M--6.9B) について検討し, 幅広い解釈可能性手法の因果効果について検討した。 DASは他の手法よりも優れており、2つの困難な言語現象の学習軌跡の研究に利用している。
論文参考訳（メタデータ） (2024-02-19T21:35:56Z)
Large Language Models as an Indirect Reasoner: Contrapositive and Contradiction for Automated Reasoning [74.90592233107712]
本稿では,直接推論 (DR) と間接推論 (IR) を並列な複数の推論経路として考慮し,最終解を導出する直接間接推論 (DIR) 手法を提案する。我々のDIR法は単純だが有効であり、既存のCoT法と簡単に統合できる。
論文参考訳（メタデータ） (2024-02-06T03:41:12Z)
Zero-shot Causal Graph Extrapolation from Text via LLMs [50.596179963913045]
我々は,自然言語から因果関係を推定する大規模言語モデル (LLM) の能力を評価する。 LLMは、(特別な)トレーニングサンプルを必要とせずにペア関係のベンチマークで競合性能を示す。我々は、反復的なペアワイズクエリを通して因果グラフを外挿するアプローチを拡張した。
論文参考訳（メタデータ） (2023-12-22T13:14:38Z)
Neuro-Symbolic Integration Brings Causal and Reliable Reasoning Proofs [95.07757789781213]
LLMの複雑な推論には2行のアプローチが採用されている。 1行の作業は様々な推論構造を持つLLMを誘導し、構造出力は自然に中間推論ステップと見なすことができる。他方の行では、LCMのない宣言的解法を用いて推論処理を行い、推論精度は向上するが、解法のブラックボックスの性質により解釈性に欠ける。具体的には,Prologインタプリタが生成した中間検索ログにアクセスし,人間可読推論に解釈可能であることを示す。
論文参考訳（メタデータ） (2023-11-16T11:26:21Z)
Language Models can be Logical Solvers [99.40649402395725]
論理解法の推論過程を直接エミュレートする新しい言語モデルであるLoGiPTを導入する。 LoGiPTは、導出的ソルバの見えない推論過程を明らかにして精錬することから導かれる、新しく構築された命令チューニングデータセットに基づいて微調整される。
論文参考訳（メタデータ） (2023-11-10T16:23:50Z)
Phenomenal Yet Puzzling: Testing Inductive Reasoning Capabilities of Language Models with Hypothesis Refinement [92.61557711360652]
言語モデル(LM)は、しばしば帰納的推論に不足する。我々は,反復的仮説修正を通じて,LMの帰納的推論能力を体系的に研究する。本研究は, LMの誘導的推論過程と人間とのいくつかの相違点を明らかにし, 誘導的推論タスクにおけるLMの使用の可能性と限界に光を当てる。
論文参考訳（メタデータ） (2023-10-12T17:51:10Z)
Towards LogiGLUE: A Brief Survey and A Benchmark for Analyzing Logical Reasoning Capabilities of Language Models [56.34029644009297]
大規模言語モデル(LLM)は、形式的知識表現(KR)システムの様々な制限を克服する能力を示した。 LLMは誘導的推論において最も優れているが、誘導的推論では最も効果が低い。モデルの性能を評価するため,シングルタスクトレーニング,マルチタスクトレーニング,および「チェーンオブ思考」知識蒸留細調整技術について検討した。
論文参考訳（メタデータ） (2023-10-02T01:00:50Z)
Case-Based Abductive Natural Language Inference [4.726777092009554]
事例ベース帰納的自然言語推論(CB-ANLI) 事例ベース帰納的自然言語推論(CB-ANLI)
論文参考訳（メタデータ） (2020-09-30T09:50:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。