論文の概要: TTFT-Aware Graph Chain-of-Thought:Distance-Indexed Neural A* for Low-Hallucination Multi-Hop Medical Reasoning
- arxiv url: http://arxiv.org/abs/2606.23108v1
- Date: Mon, 22 Jun 2026 09:51:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 00:06:37.679135
- Title: TTFT-Aware Graph Chain-of-Thought:Distance-Indexed Neural A* for Low-Hallucination Multi-Hop Medical Reasoning
- Title(参考訳): TTFT-Aware Graph Chain-of-Thought:Distance-Indexed Neural A* for Low-Hallucination Multi-Hop Medical Reasoning
- Authors: Bechir Dardouri, Kaïs Zhioua, Yassine Msaddak,
- Abstract要約: 本稿では、不均一な700Kノードの医療知識グラフにおいて、回答を検証可能なグラフチェーン・オブ・シントパスに制約する、プロダクショングレードのGraphRAGスタックを提案する。
その結果は、実世界の展開に備えた、説明可能な、低ハロゲン化マルチホップ医療推論のための実践的なレシピである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hallucinations and opaque reasoning remain unacceptable failure modes for clinical LLMs. We present a production-grade GraphRAG stack that constrains answers to verifiable graph chain-of-thought paths in a heterogeneous, ~700K-node medical knowledge graph powering a fertility assistant. The core idea is targeted navigation: a directed Pruned Landmark Labeling (PLL) oracle provides exact distances for sub-millisecond feasibility checks and simple-path enumeration, while a lightweight AStarNet heuristic operates strictly within the PLL corridor to prioritize clinically plausible expansions. We score and pack a small, diverse set of paths (CUI/semantic-type overlap, length prior, provenance priors) to condition generation, yielding compact prompts and improved Time to First Token (TTFT). On fertility-focused queries, the hybrid (PLL+AStarNet) establishes a better latency/recall Pareto frontier than text-only RAG and single-component baselines, lowers TTFT, and reduces clinician-audited hallucinations while preserving explanation clarity. The result is a practical recipe for explainable, low-hallucination multi-hop medical reasoning ready for real-world deployment.
- Abstract(参考訳): 幻覚や不透明な推論は、臨床LLMでは受け入れられない障害モードである。
我々は、不均一な700Kノードの医療知識グラフにおいて、答えを検証可能なグラフチェーンのパスに制約する、プロダクショングレードのGraphRAGスタックを提案する。
誘導されたPLL(Pruned Landmark Labeling)オラクルは、ミリ秒以下の実現可能性チェックと単純なパス列挙のための正確な距離を提供し、軽量のAStarNetヒューリスティックはPLL廊下内で厳密に動作し、臨床的に妥当な拡張を優先順位付けする。
コンディション生成にはCUI/semantic-type overlap, length prior, provenance priors) という,多種多様なパスをスコアし,パッケージ化して,コンパクトなプロンプトとTTFT(Time to First Token)の改良を実現した。
PLL+AStarNetは、テキストのみのRAGや単一成分ベースラインよりもレイテンシ/リコールのParetoフロンティアを確立し、TTFTを低下させ、説明の明確さを維持しながら臨床検査による幻覚を減少させる。
その結果は、実世界の展開に備えた、説明可能な、低ハロゲン化マルチホップ医療推論のための実践的なレシピである。
関連論文リスト
- Constrained Paraphrase Consistency for LLM Hallucination Detection [11.075787335043238]
大規模言語モデル(LLM)は、正確でスケーラブルな幻覚検出装置を動機付け、現実的に矛盾するクレームを生成することができる。
制約付き最適化問題としてトレーニングを定式化するCCHD(Consistency-Constrained Hallucination Detector)を提案する。
論文 参考訳(メタデータ) (2026-06-06T13:14:10Z) - TopoEvo: A Topology-Aware Self-Evolving Multi-Agent Framework for Root Cause Analysis in Microservices [10.602349579405832]
根本原因分析(RCA)はノイズや異種多モード可観測性のために困難である。
近年のLCMをベースとしたRCAエージェントは、ツールグラウンドによる説明を生成できるが、トポロジーに依存しないことが多い。
グラフ表現学習を構造化されたトポロジ制約推論と組み合わせたトポロジ対応の自己進化型マルチエージェントである textbfTopoEvo を提案する。
論文 参考訳(メタデータ) (2026-05-15T04:45:44Z) - Shattering the Shortcut: A Topology-Regularized Benchmark for Multi-hop Medical Reasoning in LLMs [4.647901209920043]
我々は,深部診断推論を厳格に評価するために設計された10,558のマルチホップ臨床質問のベンチマークであるShatterMed-QAを紹介した。
我々のフレームワークは、新しい$k$-Shatteringアルゴリズムを用いて、トポロジ規則化された医療知識グラフを構築する。
21個のLLMの総合的な評価は、我々のマルチホップタスクにおいて大きな性能劣化を示す。
論文 参考訳(メタデータ) (2026-03-12T21:19:54Z) - HELP: HyperNode Expansion and Logical Path-Guided Evidence Localization for Accurate and Efficient GraphRAG [53.30561659838455]
大きな言語モデル(LLM)は、しばしば固有の知識境界と幻覚に苦しむ。
Retrieval-Augmented Generation (RAG) は、マルチホップ推論に不可欠な構造的相互依存性をしばしば見落としている。
ヘルプは、複数の単純でマルチホップなQAベンチマークで競合性能を達成し、グラフベースのRAGベースラインよりも28.8$times$のスピードアップを実現している。
論文 参考訳(メタデータ) (2026-02-24T14:05:29Z) - Seeing Through the Chain: Mitigate Hallucination in Multimodal Reasoning Models via CoT Compression and Contrastive Preference Optimization [78.94590726578014]
マルチモーダル推論モデル (Multimodal reasoning model, MLRM) は幻覚の傾向が強く, 効果的な解はいまだ未発見のままである。
textbfCompression と textbfPreference textbfOptimization を組み合わせたトレーニングベースの緩和フレームワーク C3PO を提案する。
論文 参考訳(メタデータ) (2026-02-03T11:00:55Z) - Visual Multi-Agent System: Mitigating Hallucination Snowballing via Visual Flow [99.54291580187817]
視覚言語モデル (VLM) を利用したマルチエージェントシステム (MAS) は, 難易度の高いタスクを実現するが, 新たな障害項である視覚幻覚スノーボールに悩まされる。
本研究では,視覚的注意配分の低減に関して,幻覚雪球の本質に関する詳細な知見を提供する。
選択した視覚的リレートークンをベースとしたビジュアルフローとエージェント間メッセージを中継する軽量なプラグアンドプレイ緩和パラダイムであるViFを提案し,このパターンを増幅するために注目位置を適用した。
論文 参考訳(メタデータ) (2025-09-26T02:43:24Z) - Tripartite-GraphRAG via Plugin Ontologies [0.011161220996480647]
大規模言語モデル(LLM)は、様々な領域で顕著な能力を示してきたが、知識集約的なタスクに苦戦している。
主な制限は、幻覚の傾向、ソーストレーサビリティの欠如(証明)、タイムリーな知識更新における課題である。
本稿では,LLMと三部構造知識グラフ表現を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2025-04-28T10:43:35Z) - ANAH-v2: Scaling Analytical Hallucination Annotation of Large Language Models [65.12177400764506]
大規模言語モデル (LLM) は、様々な領域や広範囲のアプリケーションにまたがる、長い形式の質問応答タスクにおいて幻覚を示す。
現在の幻覚検出と緩和データセットはドメインやサイズによって制限されている。
本稿では,幻覚アノテーションデータセットを同時に,段階的にスケールアップする反復的自己学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-05T17:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。