Fugu-MT 論文翻訳(概要): Language Models as Interfaces, Not Oracles: A Hybrid LLM-ML System for Pediatric Appendicitis

論文の概要: Language Models as Interfaces, Not Oracles: A Hybrid LLM-ML System for Pediatric Appendicitis

arxiv url: http://arxiv.org/abs/2606.19183v1
Date: Wed, 17 Jun 2026 15:22:51 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-18 17:16:51.237869
Title: Language Models as Interfaces, Not Oracles: A Hybrid LLM-ML System for Pediatric Appendicitis
Title（参考訳）: Oracle ではなくインターフェースとしての言語モデル:小児虫垂炎のためのハイブリッド LLM-ML システム
Authors: Soheyl Bateni, Maryam Abdolali,
Abstract要約: ClaMPAPP(Clinical Language-assisted Machine-learning Pipeline for Appendicitis)は、LLMを最終的な意思決定者ではなくインターフェースとして使用するハイブリッドシステムである。ドイツの病院から分離した2つの小児虫垂炎コホートに対する ClaMPAPP の評価を行った。
参考スコア（独自算出の注目度）: 1.0312968200748116
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language models (LLMs) can make clinical decision support more accessible by interpreting free-text documentation, but their direct use as diagnostic engines is limited by sensitivity to prompts, information order, and plausible but incorrect outputs. Structured machine-learning models offer more stable risk prediction, yet they require tabular inputs that are difficult to integrate with narrative clinical workflows. We present ClaMPAPP (Clinical Language-assisted Machine-learning Pipeline for Appendicitis), a hybrid system that uses an LLM as an interface rather than as the final decision-maker. ClaMPAPP extracts schema-constrained clinical features from note-like narratives, applies deterministic plausibility checks, and passes validated features to an XGBoost classifier trained on clinical, laboratory, and ultrasound variables. We evaluated ClaMPAPP on two independent pediatric appendicitis cohorts from German hospitals and compared it with end-to-end LLM baselines, including open-source and proprietary models. To preserve ground truth while testing free-text input, narratives were generated from structured electronic health records through template rendering and constrained LLM rewriting, with additional sentence-order permutation to assess positional robustness. ClaMPAPP achieved the strongest overall diagnostic performance in both internal and external validation while minimizing missed appendicitis cases, the key safety concern in acute triage. End-to-end LLMs showed unstable sensitivity-specificity trade-offs and greater degradation under narrative reordering. These results support an LLM-as-interface, ML-as-predictor design that separates natural-language usability from predictive inference and provides a more auditable pathway for clinical decision support.
Abstract（参考訳）: 大きな言語モデル(LLM)は、フリーテキストの文書を解釈することで、臨床的な意思決定を支援することができるが、診断エンジンとしての使用は、プロンプト、情報順序、そして妥当だが誤った出力に対する感度によって制限される。構造化機械学習モデルは、より安定したリスク予測を提供するが、物語的臨床ワークフローとの統合が難しい表形式の入力を必要とする。本稿では,LLM を最終的な意思決定者ではなくインターフェースとして使用するハイブリッドシステムである ClaMPAPP (Clinical Language-assisted Machine-learning Pipeline for Appendicitis) を提案する。 ClaMPAPPは、ノートのような物語からスキーマに制約された臨床特徴を抽出し、決定論的妥当性チェックを適用し、臨床、実験、および変数に基づいて訓練されたXGBoost分類器に検証された特徴を渡す。われわれは,ドイツの病院から分離した2つの小児虫垂炎コホートについてClarMPAPPを評価し,それをオープンソースおよびプロプライエタリモデルを含むエンドツーエンドのLCMベースラインと比較した。自由テキスト入力のテスト中に,テンプレートレンダリングと制約付きLCM書き換えによって構造化された電子健康記録から物語が生成され,さらに文順順順に変化し,位置の堅牢性を評価する。 ClaMPAPPは, 急性三肢症において, 虫垂炎を最小化しつつ, 内部および外部のバリデーションにおいて最も高い総合的診断性能を達成した。終末LLMでは, 不安定な感度特異性トレードオフと, 物語の並べ替えによる劣化が認められた。これらの結果は、LLM-as-interface, ML-as-predictor設計をサポートし、自然言語のユーザビリティを予測的推論から切り離し、臨床診断支援のためのより監査可能な経路を提供する。

関連論文リスト

Statistics, Not Scale: Modular Medical Dialogue with Bayesian Belief Engine [51.722324399751294]
大規模言語モデルは、自律的な診断エージェントとしてますますデプロイされているが、基本的に異なる2つの機能を説明する。本稿では,言語と推論を厳格に分離するモジュール型診断対話フレームワークBMBEを紹介する。
論文参考訳（メタデータ） (2026-04-21T21:59:57Z)
LLMs for Cardiovascular Risk Prediction from Structured Clinical Data [0.0]
冠状動脈疾患(CAD)は、世界中で死因の1つとなっている。我々はCAD予測のための構造化された臨床データと自然言語表現を橋渡しするハイブリッドフレームワークを開発する。
論文参考訳（メタデータ） (2026-04-21T00:16:05Z)
A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文参考訳（メタデータ） (2026-01-29T18:48:21Z)
Visualizing token importance for black-box language models [48.747801442240565]
我々は,ブラックボックスの大規模言語モデル(LLM)を監査して,本運用環境にデプロイした場合に確実に動作させるという課題を考察する。本稿では,各入力トークンに対する言語モデルの出力の感度を評価するために,分布ベース感性分析(DBSA)を提案する。
論文参考訳（メタデータ） (2025-12-12T14:01:43Z)
Toward Reliable Clinical Coding with Language Models: Verification and Lightweight Adaptation [3.952186976672079]
本稿では,高速エンジニアリングや小型微調整を含む軽量な介入により,探索手法の計算オーバーヘッドを伴わずに精度を向上できることを示す。階層的なニアミスエラーに対処するために,単体タスクとパイプラインコンポーネントの両方に臨床コード検証を導入する。
論文参考訳（メタデータ） (2025-10-08T23:50:58Z)
Exploring LLM-based Frameworks for Fault Diagnosis [2.2562573557834686]
大規模言語モデル(LLM)に基づくシステムは,センサリッチ産業環境における自律型健康モニタリングの新たな機会を提供する。本研究では,LLMがセンサデータから直接障害を検出し,分類すると同時に,自然言語の推論を通じて本質的に説明可能なアウトプットを生成する可能性について検討する。
論文参考訳（メタデータ） (2025-09-27T04:53:15Z)
Applications of Small Language Models in Medical Imaging Classification with a Focus on Prompt Strategies [9.1953139634128]
本研究では,医療画像分類作業における小言語モデル(SLM)の性能について検討する。 NIH Chest X-ray データセットを用いて胸部X線位置を分類する作業において,複数のSLMを評価した。以上の結果から,一部のSLMは良好なプロンプトで競合精度を達成できることがわかった。
論文参考訳（メタデータ） (2025-08-18T21:48:45Z)
Interpretable Medical Diagnostics with Structured Data Extraction by Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文参考訳（メタデータ） (2023-06-08T09:12:28Z)
Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文参考訳（メタデータ） (2023-05-30T22:05:11Z)
VBridge: Connecting the Dots Between Features, Explanations, and Data for Healthcare Models [85.4333256782337]
VBridgeは、臨床医の意思決定ワークフローに機械学習の説明をシームレスに組み込むビジュアル分析ツールである。我々は,臨床医がMLの特徴に慣れていないこと,文脈情報の欠如,コホートレベルの証拠の必要性など,3つの重要な課題を特定した。症例スタディと専門医4名のインタビューを通じて, VBridgeの有効性を実証した。
論文参考訳（メタデータ） (2021-08-04T17:34:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。