Fugu-MT 論文翻訳(概要): Think More, Hallucinate Less: Mitigating Hallucinations via Dual Process of Fast and Slow Thinking

論文の概要: Think More, Hallucinate Less: Mitigating Hallucinations via Dual Process of Fast and Slow Thinking

arxiv url: http://arxiv.org/abs/2501.01306v1
Date: Thu, 02 Jan 2025 15:36:50 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-05 16:54:32.276123
Title: Think More, Hallucinate Less: Mitigating Hallucinations via Dual Process of Fast and Slow Thinking
Title（参考訳）: より深く、より少ない幻覚:高速でスローな思考のデュアルプロセスによる幻覚の緩和
Authors: Xiaoxue Cheng, Junyi Li, Wayne Xin Zhao, Ji-Rong Wen,
Abstract要約: HaluSearchは、ツリー検索ベースのアルゴリズムを組み込んだ新しいフレームワークである。テキスト生成をステップバイステップの推論プロセスとしてフレーム化する。認知科学における二重プロセス理論に着想を得た階層的思考システムスイッチ機構を導入する。
参考スコア（独自算出の注目度）: 124.69672273754144
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large language models (LLMs) demonstrate exceptional capabilities, yet still face the hallucination issue. Typical text generation approaches adopt an auto-regressive generation without deliberate reasoning, which often results in untrustworthy and factually inaccurate responses. In this paper, we propose HaluSearch, a novel framework that incorporates tree search-based algorithms (e.g. MCTS) to enable an explicit slow thinking generation process for mitigating hallucinations of LLMs during inference. Specifically, HaluSearch frames text generation as a step-by-step reasoning process, using a self-evaluation reward model to score each generation step and guide the tree search towards the most reliable generation pathway for fully exploiting the internal knowledge of LLMs. To balance efficiency and quality, we introduce a hierarchical thinking system switch mechanism inspired by the dual process theory in cognitive science, which dynamically alternates between fast and slow thinking modes at both the instance and step levels, adapting to the complexity of questions and reasoning states. We conduct extensive experiments on both English and Chinese datasets and the results show that our approach significantly outperforms baseline approaches.
Abstract（参考訳）: 大きな言語モデル(LLM)は例外的な能力を示しているが、幻覚の問題に直面している。典型的なテキスト生成アプローチは、意図的な推論なしに自動回帰生成を採用し、しばしば信頼できない、事実的に不正確な応答をもたらす。本稿では,木探索に基づくアルゴリズム(例えばMCTS)を組み込んだ新しいフレームワークであるHaluSearchを提案する。具体的には、HaluSearchは、テキスト生成をステップバイステップの推論プロセスとして、自己評価報酬モデルを使用して、各生成ステップをスコアし、木探索を最も信頼性の高い生成経路へ誘導し、LLMの内部知識を完全に活用する。効率と品質のバランスをとるために,認知科学における二重プロセス理論に着想を得た階層的思考システムスイッチ機構を導入する。英語と中国語の両方のデータセットに対して広範な実験を行い、その結果、我々のアプローチはベースラインアプローチよりも大幅に優れていることが示された。

関連論文リスト

Towards Long Context Hallucination Detection [49.195854802543714]
大規模言語モデル(LLM)は、様々なタスクで顕著なパフォーマンスを示している。それらは文脈の幻覚に傾向があり、与えられた文脈に不一致または矛盾した情報を生成する。本稿では,BERTのような事前学習したエンコーダモデルを用いて,長期のコンテキストを処理し,文脈の幻覚を効果的に検出するアーキテクチャを提案する。
論文参考訳（メタデータ） (2025-04-28T03:47:05Z)
Waking Up an AI: A Quantitative Framework for Prompt-Induced Phase Transition in Large Language Models [0.0]
直感的な人間の思考の根底にあるものを研究するための2部構成の枠組みを提案する。意味的に融合したプロンプトと非融合したプロンプトの応答性に有意な差は認められなかった。我々の手法は、人工心と人間の心において、直観と概念的な跳躍がどのように現われるかにおいて重要な違いを照明するのに役立ちます。
論文参考訳（メタデータ） (2025-04-16T06:49:45Z)
VisuoThink: Empowering LVLM Reasoning with Multimodal Tree Search [89.43196232124883]
VisuoThinkは、視覚空間と言語ドメインをシームレスに統合する新しいフレームワークである。プログレッシブなビジュアルテキスト推論を可能にし、ルックアヘッドツリーサーチによるテストタイムスケーリングを組み込む。
論文参考訳（メタデータ） (2025-04-12T08:37:30Z)
Think&Cite: Improving Attributed Text Generation with Self-Guided Tree Search and Progress Reward Modeling [63.98194996746229]
大型言語モデル(LLM)は幻覚を起こし、事実的に誤った情報を生み出す傾向にある。我々はThink&Citeと呼ばれる新しいフレームワークを提案し、検索と統合された多段階推論問題として属性付きテキスト生成を定式化する。
論文参考訳（メタデータ） (2024-12-19T13:55:48Z)
Visual Agents as Fast and Slow Thinkers [88.6691504568041]
本稿では、Fast and Slow Thinking機構を視覚エージェントに組み込んだFaSTを紹介する。 FaSTは、システム1/2モード間の動的選択にスイッチアダプタを使用する。モデルの信頼性を調整し、新しいコンテキストデータを統合することで、不確実で目に見えないオブジェクトに取り組む。
論文参考訳（メタデータ） (2024-08-16T17:44:02Z)
DynaThink: Fast or Slow? A Dynamic Decision-Making Framework for Large Language Models [42.95876831743256]
大規模言語モデル(LLM)は、Chains-of-Thoughtプロンプトを通じて、さまざまな推論タスクにまたがる創発的な機能を示している。本稿では,LLMが高速かつ低速な推論手法を自律的に選択できることの課題に対処する。 LLMが高速に高信頼の解を識別するタスクに指定された「Fast」と、LLMが複雑だと認識するタスクに割り当てられた「Slow」という2つの異なる経路に分類する動的意思決定フレームワークを導入する。
論文参考訳（メタデータ） (2024-07-01T06:45:13Z)
What if...?: Thinking Counterfactual Keywords Helps to Mitigate Hallucination in Large Multi-modal Models [50.97705264224828]
大規模マルチモーダルモデルに反現実的思考を組み込む新しい手法である反現実的インセプションを提案する。我々は、より広い文脈のシーン理解にまたがる応答をモデルが関与し、生成することを目指している。オープンソースモデルとプロプライエタリモデルの両方を含む様々なLMMの包括的分析は、反事実的思考が幻覚を著しく減少させることを裏付ける。
論文参考訳（メタデータ） (2024-03-20T11:27:20Z)
DUMA: a Dual-Mind Conversational Agent with Fast and Slow Thinking [12.71072798544731]
DUMAは2つの生成型Large Language Model(LLM)をそれぞれ高速な思考と低速な思考に利用することで、デュアルミンドのメカニズムを具現化している。我々は、不動産業界のオンライン調査を扱うための会話エージェントを構築した。
論文参考訳（メタデータ） (2023-10-27T11:43:46Z)
Towards Mitigating Hallucination in Large Language Models via Self-Reflection [63.2543947174318]
大規模言語モデル(LLM)は、質問応答(QA)タスクを含む生成的および知識集約的なタスクを約束している。本稿では,広範に採用されているLCMとデータセットを用いた医療再生QAシステムにおける幻覚現象を解析する。
論文参考訳（メタデータ） (2023-10-10T03:05:44Z)
Tree-of-Mixed-Thought: Combining Fast and Slow Thinking for Multi-hop Visual Reasoning [16.495754104540605]
大規模言語モデル(LLM)は、視覚的推論のような複雑な推論タスクのためのコードライクな計画を生成することができる。ワンストップ推論 (fast) とツリー・オブ・シント (slow) を統合した階層型計画探索アルゴリズムを提案する。
論文参考訳（メタデータ） (2023-08-18T16:21:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。