Fugu-MT 論文翻訳(概要): Theory-Grounded Evaluation of Human-Like Fallacy Patterns in LLM Reasoning

論文の概要: Theory-Grounded Evaluation of Human-Like Fallacy Patterns in LLM Reasoning

arxiv url: http://arxiv.org/abs/2506.11128v2
Date: Fri, 24 Oct 2025 11:47:35 GMT
ステータス: 翻訳完了
システム内更新日: 2025-10-28 09:00:15.037014
Title: Theory-Grounded Evaluation of Human-Like Fallacy Patterns in LLM Reasoning
Title（参考訳）: LLM推論におけるヒューマンライクな誤りパターンの理論的評価
Authors: Andrew Keenan Richardson, Ryan Othniel Kearns, Sean Moss, Vincent Wang-Mascianica, Philipp Koralus,
Abstract要約: 我々は,言語モデルにおける論理的推論について,その誤りが確立された人間の誤りに追従するかどうかを問うことによって研究する。各応答について,ETR予測誤り度と一致する場合の論理的推論と正当性を判定する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We study logical reasoning in language models by asking whether their errors follow established human fallacy patterns. Using the Erotetic Theory of Reasoning (ETR) and its open-source implementation, PyETR, we programmatically generate 383 formally specified reasoning problems and evaluate 38 models. For each response, we judge logical correctness and, when incorrect, whether it matches an ETR-predicted fallacy. Two results stand out: (i) as a capability proxy (Chatbot Arena Elo) increases, a larger share of a model's incorrect answers are ETR-predicted fallacies $(\rho=0.360, p=0.0265)$, while overall correctness on this dataset shows no correlation with capability; (ii) reversing premise order significantly reduces fallacy production for many models, mirroring human order effects. Methodologically, PyETR provides an open-source pipeline for unbounded, synthetic, contamination-resistant reasoning tests linked to a cognitive theory, enabling analyses that focus on error composition rather than error rate.
Abstract（参考訳）: 言語モデルにおける論理的推論は,その誤りが確立された人間の誤りパターンに従うかどうかを問うことによって研究される。 The Erotetic Theory of Reasoning (ETR) and its open-source implementation, PyETR, we programmaticly generated 383 formal specified reasoning problem and evaluation 38 models。各応答について、論理的正当性を判断し、誤判定がEPR予測誤りと一致するかどうかを判断する。 2つの結果は明らかです。 (i) 機能プロキシ(Chatbot Arena Elo) が増加するにつれて、モデルの誤答のより大きなシェアは、ETR予測誤字$(\rho=0.360, p=0.0265)$である。 (二)前提順序の逆転は、多くのモデルにおける誤り生産を著しく減少させ、ヒトの順序効果を反映させる。方法論的には、PyETRは、認知理論に関連付けられた非有界、合成、汚染耐性推論テストのためのオープンソースのパイプラインを提供し、エラー率よりもエラー合成にフォーカスする分析を可能にする。

関連論文リスト

CLEAR-3K: Assessing Causal Explanatory Capabilities in Language Models [3.137688620241855]
CLEAR-3Kは、ある文が別の文を因果的に説明するかどうかを言語モデルが判断できるかどうかを評価するために設計された、3000のアサーション推論質問のデータセットである。各質問は、意味的関連性と真の因果的説明的関係を区別するために、アサーションとアサーションのペアと挑戦言語モデルを示す。
論文参考訳（メタデータ） (2025-06-20T17:35:36Z)
A Closer Look at Bias and Chain-of-Thought Faithfulness of Large (Vision) Language Models [53.18562650350898]
思考の連鎖(CoT)推論は、大きな言語モデルの性能を高める。大規模視覚言語モデルにおけるCoT忠実度に関する最初の総合的研究について述べる。
論文参考訳（メタデータ） (2025-05-29T18:55:05Z)
Evaluating the Logical Reasoning Abilities of Large Reasoning Models [15.009205651973666]
大規模な推論モデルにおける論理的推論を評価するためのベンチマークであるLogiEvalを紹介する。 LogiEvalは様々な推論タイプ(帰納的、帰納的、類推的、帰納的)とタスク形式(論理的シーケンス、引数解析など)にまたがる。実験により,現代の推論モデルでは,4選択の議論解析問題や類似推論において,人間の性能を上回っていることがわかった。解析の結果,人為的性能はモデル故障分布を反映しないことがわかった。
論文参考訳（メタデータ） (2025-05-17T05:36:14Z)
Can Language Models Learn to Skip Steps? [59.84848399905409]
我々は推論においてステップをスキップする能力について研究する。効率を高めたり認知負荷を減らすためのステップをスキップする人間とは異なり、モデルはそのようなモチベーションを持っていない。私たちの研究は、人間のようなステップスキッピング能力に関する最初の調査である。
論文参考訳（メタデータ） (2024-11-04T07:10:24Z)
UNcommonsense Reasoning: Abductive Reasoning about Uncommon Situations [62.71847873326847]
異常、予期せぬ、そしてありそうもない状況をモデル化する能力について検討する。予期せぬ結果のコンテキストが与えられた場合、このタスクは説明を生成するために故意に推論する必要がある。私たちはUNcommonsenseという新しい英語コーパスをリリースします。
論文参考訳（メタデータ） (2023-11-14T19:00:55Z)
A Systematic Comparison of Syllogistic Reasoning in Humans and Language Models [39.77445889769015]
言語モデルのPaLM2ファミリにおいて、より大きなモデルはより小さなモデルよりも論理的であることを示す。最大のモデルでさえ体系的な誤りを犯し、その一部は人間の推論バイアスを反映している。全体として、言語モデルはトレーニングデータに含まれる人間のバイアスを模倣することが多いが、場合によってはそれを克服することができる。
論文参考訳（メタデータ） (2023-11-01T11:13:06Z)
The Generative AI Paradox: "What It Can Create, It May Not Understand" [81.89252713236746]
生成AIの最近の波は、潜在的に超人的な人工知能レベルに対する興奮と懸念を引き起こしている。同時に、モデルは、専門家でない人でも期待できないような理解の基本的な誤りを示している。一見超人的な能力と、ごく少数の人間が起こすエラーの持続性を、どうやって再現すればよいのか?
論文参考訳（メタデータ） (2023-10-31T18:07:07Z)
A fine-grained comparison of pragmatic language understanding in humans and language models [2.231167375820083]
言語モデルと人間を7つの現実的な現象で比較する。最大のモデルでは精度が高く,人間の誤りパターンと一致していることがわかった。モデルと人間が同様の言語的手がかりに敏感であるという予備的な証拠がある。
論文参考訳（メタデータ） (2022-12-13T18:34:59Z)
To what extent do human explanations of model behavior align with actual model behavior? [91.67905128825402]
モデル推論決定の人間による説明が、モデルが実際にこれらの決定を下す方法と一致する程度を調べた。自然言語の人間の説明が入力語に対するモデル感度とどのように一致するかを定量化する2つのアライメント指標を定義した。モデルと人間の説明との整合は、NLI上のモデルの精度によって予測されないことが判明した。
論文参考訳（メタデータ） (2020-12-24T17:40:06Z)
Are Visual Explanations Useful? A Case Study in Model-in-the-Loop Prediction [49.254162397086006]
画像に基づく年齢予測課題における視覚的満足度に基づく説明について検討する。モデル予測の提示により,人間の精度が向上することが判明した。しかし、様々な種類の説明は、人間の正確さやモデルの信頼を著しく変えることができない。
論文参考訳（メタデータ） (2020-07-23T20:39:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。