論文の概要: CORE-Acu: Structured Reasoning Traces and Knowledge Graph Safety Verification for Acupuncture Clinical Decision Support
- arxiv url: http://arxiv.org/abs/2603.08321v1
- Date: Mon, 09 Mar 2026 12:42:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:15.991782
- Title: CORE-Acu: Structured Reasoning Traces and Knowledge Graph Safety Verification for Acupuncture Clinical Decision Support
- Title(参考訳): CORE-Acu:構造的推論トレースと臨床診断支援のための知識グラフ安全性検証
- Authors: Liuyi Xu, Yun Guo, Ming Chen, Zihan Dun, Yining Qian, An-Yang Lu, Shuang Li, Lijun Liu,
- Abstract要約: 臨床診断支援のための神経シンボリック・フレームワークであるCORE-Acuを提案する。
CORE-AcuはStructured Chain-of-Thought(S-CoT)と知識グラフ(KG)の安全性検証を統合している。
1000件の実験は、CORE-Acuの優れた実体の忠実さと推論品質を実証している。
- 参考スコア(独自算出の注目度): 13.638619580181894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) show significant potential for clinical decision support (CDS), yet their black-box nature -- characterized by untraceable reasoning and probabilistic hallucinations -- poses severe challenges in acupuncture, a field demanding rigorous interpretability and safety. To address this, we propose CORE-Acu, a neuro-symbolic framework for acupuncture clinical decision support that integrates Structured Chain-of-Thought (S-CoT) with knowledge graph (KG) safety verification. First, we construct the first acupuncture Structured Reasoning Trace dataset and a schema-constrained fine-tuning framework. By enforcing an explicit causal chain from pattern identification to treatment principles, treatment plans, and acupoint selection, we transform implicit Traditional Chinese Medicine (TCM) reasoning into interpretable generation constraints, mitigating the opacity of LLM-based CDS. Furthermore, we construct a TCM safety knowledge graph and establish a ``Generate--Verify--Revise'' closed-loop inference system based on a Symbolic Veto Mechanism, employing deterministic rules to intercept hallucinations and enforce hard safety boundaries. Finally, we introduce the Lexicon-Matched Entity-Reweighted Loss (LMERL), which corrects terminology drift caused by the frequency--importance mismatch in general optimization by adaptively amplifying gradient contributions of high-risk entities during fine-tuning. Experiments on 1,000 held-out cases demonstrate CORE-Acu's superior entity fidelity and reasoning quality. Crucially, CORE-Acu achieved 0/1,000 observed safety violations (95\% CI: 0--0.37\%), whereas GPT-4o exhibited an 8.5\% violation rate under identical rules. These results establish CORE-Acu as a robust neuro-symbolic framework for acupuncture clinical decision support, guaranteeing both reasoning auditability and strict safety compliance.
- Abstract(参考訳): 大規模言語モデル(LLM)は、臨床的意思決定支援(CDS)に有意義な可能性を示しているが、そのブラックボックスの性質は、追跡不能な推論と確率的幻覚を特徴とし、厳格な解釈性と安全性を要求される治療において深刻な課題を提起している。
これを解決するために,構造化連鎖(Structured Chain-of-Thought, S-CoT)と知識グラフ(KG)の安全性検証を統合した治療支援のための神経シンボリックなフレームワークであるCORE-Acuを提案する。
まず,まず,最初に構築された構造的推論トレースデータセットと,スキーマ制約による微調整フレームワークを構築する。
パターン識別から治療の原則,治療計画,キューポイント選択まで明確な因果連鎖を強制することにより,暗黙の中国医学(TCM)推論を解釈可能な生成制約に変換し,LCMベースのCDSの不透明性を緩和する。
さらに,TCM安全知識グラフを構築し,シンボリックベト機構に基づく<Generate--Verify--Revise''の閉ループ推論システムを構築し,幻覚を傍受し,ハードセーフティ境界を強制する決定論的ルールを適用した。
最後に、高リスク要素の微調整時の勾配寄与を適応的に増幅することにより、周波数重要ミスマッチによる用語のドリフトを一般化するLexicon-Matched Entity-Reweighted Loss (LMERL)を提案する。
1000件の実験は、CORE-Acuの優れた実体の忠実さと推論品質を実証している。
CORE-Acuは0/1,000の安全違反(95\% CI:0-0.37\%)を達成したのに対し、GPT-4oは8.5\%の安全違反率を示した。
これらの結果から, CORE-Acuは, 信頼性と厳格な安全性の両面を保証し, 臨床診断支援のための堅牢な神経シンボリック・フレームワークとして確立された。
関連論文リスト
- Guideline-Grounded Evidence Accumulation for High-Stakes Agent Verification [60.18369393468405]
既存の検証器は通常、ドメイン知識の欠如と限られた校正のために性能が劣る。
GLEANは専門家によって計算されたプロトコルをトラジェクトリインフォームされ、よく校正された正当性信号にコンパイルする。
我々は,MIMIC-IVデータセットから得られた3つの疾患の薬物的臨床診断でGLEANを実証的に検証した。
論文 参考訳(メタデータ) (2026-03-03T09:36:43Z) - Suppressing Prior-Comparison Hallucinations in Radiology Report Generation via Semantically Decoupled Latent Steering [94.37535002230504]
本研究では,Semantically Decoupled Latent Steeringと呼ばれる学習自由な推論時間制御フレームワークを開発した。
提案手法は,大言語モデル (LLM) による意味分解による意味のない介入ベクトルを構築する。
本手法は歴史的幻覚の可能性を著しく低下させることを示す。
論文 参考訳(メタデータ) (2026-02-27T04:49:01Z) - Overalignment in Frontier LLMs: An Empirical Study of Sycophantic Behaviour in Healthcare [1.9010852820067994]
モデル不安定性("Confusability")を考慮してアライメントバイアスを分離する新しい尺度であるAdjusted Sycophancy Scoreを提案する。
以上の結果から, ベンチマーク性能は臨床信頼性の指標ではないことが示唆され, 簡易な推論構造は, 専門家主導の薬効に対して優れた堅牢性をもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2026-01-26T10:21:34Z) - C-GRASP: Clinically-Grounded Reasoning for Affective Signal Processing [0.0]
心拍変動(HRV)は、自律神経監視のための重要な非侵襲マーカーである。
大規模言語モデル(LLM)をHRV解釈に適用することは、生理的幻覚によって妨げられる。
我々は,HRV解釈を8つのトレース可能な推論ステップに分解する,ガードレール付きRAG拡張パイプラインであるC-GRASPを提案する。
論文 参考訳(メタデータ) (2026-01-15T12:35:35Z) - Benchmarking Egocentric Clinical Intent Understanding Capability for Medical Multimodal Large Language Models [48.95516224614331]
MedGaze-Benchは、臨床医の視線を認知的カーソルとして活用し、手術、緊急シミュレーション、診断解釈における意図的理解を評価する最初のベンチマークである。
本ベンチマークでは,解剖学的構造の視覚的均一性,臨床における時間・因果依存性の厳格化,安全プロトコルへの暗黙の順守という3つの基本的な課題に対処する。
論文 参考訳(メタデータ) (2026-01-11T02:20:40Z) - Diagnosing Hallucination Risk in AI Surgical Decision-Support: A Sequential Framework for Sequential Validation [5.469454486414467]
大言語モデル (LLMs) は脊椎手術における臨床的決定支援の転換的可能性を提供する。
LLMは幻覚を通じて重大なリスクを引き起こすが、これは事実的に矛盾しているか、文脈的に不一致な出力である。
本研究は, 診断精度, 推奨品質, 推理堅牢性, 出力コヒーレンス, 知識アライメントを評価することによって, 幻覚リスクを定量化するための臨床中心の枠組みを提案する。
論文 参考訳(メタデータ) (2025-11-01T15:25:55Z) - Embedding Explainable AI in NHS Clinical Safety: The Explainability-Enabled Clinical Safety Framework (ECSF) [0.0]
本稿では,説明責任をDCB0129/0160ライフサイクルに組み込んだ説明責任型臨床安全フレームワーク(ECSF)を提案する。
相互規制合成は、DCB節をグッド機械学習プラクティス、NHS AI AssuranceとT.E.S.Tフレームワーク、EU AI Actの原則にマッピングする。
ECSFは5つのチェックポイントを導入している: リスク識別のためのグローバルな透明性、検証のためのケースレベルの解釈可能性、評価のための臨床使用性、リスク管理のためのトレーサブルな決定経路、市場後監視のための縦断的な解釈可能性監視。
論文 参考訳(メタデータ) (2025-10-24T07:36:58Z) - Conformal Lesion Segmentation for 3D Medical Images [82.92159832699583]
本稿では,データ駆動しきい値の校正をコンフォーマル化することで,テスト時間FNRが目標許容値以下であることを保証する,リスク制約付きフレームワークを提案する。
5つのバックボーンモデルにまたがる6つの3D-LSデータセット上でのCLSの統計的健全性と予測性能を検証し,臨床実践におけるリスク認識セグメンテーションの展開に関する実用的な知見を得た。
論文 参考訳(メタデータ) (2025-10-19T08:21:00Z) - SemioLLM: Evaluating Large Language Models for Diagnostic Reasoning from Unstructured Clinical Narratives in Epilepsy [45.2233252981348]
臨床知識を符号化するための言語モデル(LLM)が示されている。
6つの最先端モデルをベンチマークする評価フレームワークであるSemioLLMを提案する。
ほとんどのLSMは、脳内の発作発生領域の確率的予測を正確かつ確実に生成できることを示す。
論文 参考訳(メタデータ) (2024-07-03T11:02:12Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。