論文の概要: Can Hallucinations Be Useful? Solving Multi-Hop Questions With SLMs By Chaining System-I/II Reasoning
- arxiv url: http://arxiv.org/abs/2605.27596v1
- Date: Tue, 26 May 2026 19:09:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.474369
- Title: Can Hallucinations Be Useful? Solving Multi-Hop Questions With SLMs By Chaining System-I/II Reasoning
- Title(参考訳): 幻覚は有用か? 連鎖システムI/II推論によるマルチホップ質問の解決
- Authors: Saptarshi Sengupta, Suhang Wang,
- Abstract要約: 思考優先戦略は必ずしも必要ではない,と我々は主張する。
モデルが最初に質問に素早く答えられるように、認知にインスパイアされたフレームワークを提案する。
提案手法は,複数段階の質問応答ベンチマークにおいて,従来の思考優先経路を踏む先行作業よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 29.2316168192071
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, there has been increased interest in Small Language Models (SLMs), which are fast, show good performance, and have lower hardware demands than large language models (LLMs). However, SLMs hallucinate more frequently than LLMs, impacting their ability to solve complex multi-step reasoning problems as early mistakes cascade to the final response. To address this, existing works think-first followed by iterative retrieval to reduce hallucination. We argue that the think-first strategy is not always necessary as we find that: (i) SLMs are often accurately confident in their initial answer and, (ii) hallucinations can actually be beneficial for honing in on the true answer. As such, we position our work as an inversion of this strategy, i.e., answer first-reason later. We propose a cognitively-inspired framework where the model is first allowed to quickly answer the question (System-I (zero-shot)) and then resorts to deeper thinking (System-II) based on evidence retrieved from a knowledge source using the initial hypothesis. By combining System-I and System-II style thinking, we show that our method can outperform prior work that takes the traditional think-first route on various multi-step question-answering benchmarks.
- Abstract(参考訳): 近年,Small Language Models (SLM) への関心が高まり,性能が向上し,大規模言語モデル (LLM) よりもハードウェア要求が低くなった。
しかし、SLM は LLM よりも幻覚性が高く、最終応答の早期誤りとして複雑な多段階推論問題を解く能力に影響を及ぼす。
これを解決するために、既存の研究は、幻覚を減らすために反復的に検索する。
我々は、思考優先の戦略が常に必要であるとは限らないと論じている。
(i)SLMは、しばしばその最初の回答に正確に自信を持ち、
(二)幻覚は、真の答えをほのめかすのに実際は有益である。
したがって、我々はこの戦略の逆転、すなわち後述の第一段階に答えるものであると位置づけている。
そこで本研究では,まずモデルが素早い解答(System-I (zero-shot))を許容し,その初期仮説を用いて知識源から得られた証拠に基づいて,より深い思考(System-II)に頼る,認知にインスパイアされた枠組みを提案する。
System-I と System-II スタイルの思考を組み合わせることで,提案手法は従来の多段階質問応答ベンチマークにおいて,従来の思考優先の手法よりも優れていることを示す。
関連論文リスト
- Understanding and Mitigating Hallucinations in Multimodal Chain-of-Thought Models [40.739279930631334]
MCoT(Multimodal Chain-of-Thought)モデルは、複雑な視覚的推論タスクにおいて印象的な能力を示す。
近年の研究では、生成過程における視覚的注意の低下により、深刻な幻覚障害に悩まされていることが判明している。
本稿では,多様な思考ステップを効果的にローカライズし,幻覚を緩和するデコードプロセスに介入する戦略を提案する。
論文 参考訳(メタデータ) (2026-03-28T08:56:19Z) - MIRAGE: Assessing Hallucination in Multimodal Reasoning Chains of MLLM [58.2298313720146]
マルチモーダル幻覚は多源性であり、様々な原因から生じる。
既存のベンチマークでは、知覚誘発幻覚と推論誘発幻覚を適切に区別することができない。
論文 参考訳(メタデータ) (2025-05-30T05:54:36Z) - UCSC at SemEval-2025 Task 3: Context, Models and Prompt Optimization for Automated Hallucination Detection in LLM Output [7.121378498209948]
SemEval 2025 Task 3, Mu-SHROOM: Shared-task on Hallucinations and Related Observable Overgeneration misstakes, is a recent efforts in this direction。
本稿では,UCSC システムを共有 Mu-SHROOM タスクに適用する。
まず、関連するコンテキストを検索し、次に回答から偽のコンテンツを特定し、最終的にLLM出力のスパンにマップするフレームワークを導入する。
論文 参考訳(メタデータ) (2025-05-05T21:15:40Z) - Think More, Hallucinate Less: Mitigating Hallucinations via Dual Process of Fast and Slow Thinking [124.69672273754144]
HaluSearchは、ツリー検索ベースのアルゴリズムを組み込んだ新しいフレームワークである。
テキスト生成をステップバイステップの推論プロセスとしてフレーム化する。
認知科学における二重プロセス理論に着想を得た階層的思考システムスイッチ機構を導入する。
論文 参考訳(メタデータ) (2025-01-02T15:36:50Z) - Rationale-guided Prompting for Knowledge-based Visual Question Answering [6.745948705869626]
我々は,先行手法がLarge Language Models (LLM) の容量を十分に活性化していないことを論じる。
本稿では,知識に基づく VQA のための LLM と Rationale Heuristics を併用した PLRH というフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-22T09:14:35Z) - Deceptive Semantic Shortcuts on Reasoning Chains: How Far Can Models Go without Hallucination? [73.454943870226]
本研究はセマンティックアソシエーションによって誘発される特定の種類の幻覚の研究である。
この現象を定量化するために,EureQAと呼ばれる新しい探索手法とベンチマークを提案する。
論文 参考訳(メタデータ) (2023-11-16T09:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。