論文の概要: LiteOdyssey: A Lightweight Reasoning AI Agent for Interpretable Rare-Disease Diagnosis
- arxiv url: http://arxiv.org/abs/2606.16149v1
- Date: Mon, 15 Jun 2026 03:10:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.046052
- Title: LiteOdyssey: A Lightweight Reasoning AI Agent for Interpretable Rare-Disease Diagnosis
- Title(参考訳): LiteOdyssey: 解釈可能な希釈診断のための軽量推論AIエージェント
- Authors: Minh-Ha Nguyen, Erica Gray, Chih-Ting Yang, Rizwan Hamid, Lingyao Li, Siyuan Ma, Thomas A. Cassini, Cathy Shyr,
- Abstract要約: LiteOdysseyは、臨床遺伝学のワークフローを通じて推論言語モデルをガイドする軽量な希少な診断フレームワークである。
LiteOdysseyは、LIRICALとPhenoPacketストアの合計1,243件に対して、Recall@1の59.3%で最先端のパフォーマンスを達成した。
LiteOdyssey氏は、医師のレビューのために正確でデプロイが容易で透明性の高い、希少なAIシステムへの道筋を提案する。
- 参考スコア(独自算出の注目度): 5.485944483858884
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most medical AI systems improve by scaling additional machinery: more fine-tuning data, more agents, and/or larger retrieval databases. In rare-disease diagnosis, however, such scaling can produce systems that are difficult to deploy, audit, and maintain. We asked whether state-of-the-art diagnostic performance could instead be achieved by extending the reasoning chain of a single AI agent: guiding it with a diagnostic policy, developed through human-AI collaboration and augmenting with freely available biomedical tools. We introduce LiteOdyssey, a lightweight rare-disease diagnostic framework that guides reasoning language model through a clinical genetics workflow. This framework was developed through Policy Iteration with Human Feedback (PIHF) and uses dynamic access to public biomedical tools. On two challenging benchmarks that provide only patient clinical features, LiteOdyssey achieved state-of-the-art performance, with an overall disease Recall@1 of 59.3% over the combined 1,243 cases of LIRICAL (n = 370) and the PhenoPacket Store (n = 873). Both benchmarks have a high proportion of ultra-rare disease (a prevalence below 1 in 1,000,000, with ultra-rare shares of approximately 45% and 52.8%, respectively). On the more difficult PhenoPacket subset, where causal diseases were not mapped to Orphanet in our rarity-mapping pipeline, LiteOdyssey achieved 60.7% Recall@1, compared with 10.7% for the same baseline model (GPT-5.4) without tools. This performance was achieved without fine-tuning, multi-agent ensembles, or a large case-retrieval database. Gains were also observed in the following: on cases never seen during development, on a private cohort of real-world rare disease patients, and on a smaller open-weights model. LiteOdyssey suggests a path toward rare-disease AI systems that are accurate, easier to deploy, and more transparent for physician review.
- Abstract(参考訳): ほとんどの医療AIシステムは、より微調整されたデータ、より多くのエージェント、より大きな検索データベースなど、追加の機械をスケーリングすることによって改善される。
しかし、希少な診断では、そのようなスケーリングはデプロイ、監査、保守が困難なシステムを生み出す可能性がある。
私たちは、最先端の診断性能は、代わりに、単一のAIエージェントの推論チェーンを拡張することで達成できるかどうかを尋ねました。
臨床遺伝学のワークフローを通して推論言語モデルを導く軽量な希少診断フレームワーク LiteOdyssey を紹介する。
このフレームワークは、Physal Iteration with Human Feedback (PIHF)を通じて開発され、公開バイオメディカルツールへの動的アクセスを使用する。
LIRICAL (n = 370)とPhenoPacket Store (n = 873)の合計1,243例に対して、LiteOdysseyは59.3%のRecall@1で最先端のパフォーマンスを達成した。
どちらのベンチマークもウルトラレア病の比率が高い(Ultraレア株は約45%と52.8%)。
原因疾患をOrphanetにマッピングしないPhenoPacketサブセットでは、LiteOdysseyは60.7%のリコール@1を達成したが、同じベースラインモデル(GPT-5.4)ではツールなしで10.7%だった。
この性能は、微調整、マルチエージェントアンサンブル、大規模なケース検索データベースを使わずに達成された。
また, 開発期間中にみられなかった症例, 実世界のまれな疾患患者の私的コホート, より小さなオープンウェイトモデルにおいても, 利得が観察された。
LiteOdyssey氏は、医師のレビューのために正確でデプロイが容易で透明性の高い、希少なAIシステムへの道筋を提案する。
関連論文リスト
- Eliciting Medical Reasoning with Knowledge-enhanced Data Synthesis: A Semi-Supervised Reinforcement Learning Approach [62.0906177191353]
既存のアプローチでは、教師付き微調整を経て、大規模プロプライエタリモデルからの連鎖推論トレースを蒸留し、強化学習(RL)を実施している。
MedSSRは,医療知識を付加したデータ合成と半教師付き強化学習フレームワークである。
本フレームワークはまず, 分布制御可能な推論質問を合成するために, 稀な疾患知識を利用する。
次に、ポリシーモデル自体を利用して高品質な擬似ラベルを生成する。これにより、擬似ラベルデータ上での自己教師型RLと、人間の注釈付き実データ上での教師型RLの2段階固有の訓練パラダイムが実現される。
論文 参考訳(メタデータ) (2026-04-13T14:37:38Z) - A DeepSeek-Powered AI System for Automated Chest Radiograph Interpretation in Clinical Practice [83.11942224668127]
Janus-Pro-CXR (1B) はDeepSeek Janus-Proモデルに基づく胸部X線解釈システムである。
本システムは, 自動レポート生成において, 最先端のX線レポート生成モデルより優れる。
論文 参考訳(メタデータ) (2025-12-23T13:26:13Z) - An Explainable Hybrid AI Framework for Enhanced Tuberculosis and Symptom Detection [55.35661671061754]
結核は、特に資源に制限された遠隔地において、重要な世界的な健康問題である。
本稿では, 胸部X線による疾患および症状の検出を, 2つの頭部と自己監督頭部を統合することで促進する枠組みを提案する。
本モデルでは, 新型コロナウイルス, 結核, 正常症例の鑑別で98.85%の精度が得られ, マルチラベル症状検出では90.09%のマクロF1スコアが得られた。
論文 参考訳(メタデータ) (2025-10-21T17:18:55Z) - Design and Validation of a Responsible Artificial Intelligence-based System for the Referral of Diabetic Retinopathy Patients [65.57160385098935]
糖尿病網膜症の早期発見は、視力喪失のリスクを最大95%減少させる可能性がある。
我々は、AIライフサイクル全体にわたる倫理的原則を取り入れた、DRスクリーニングのための責任あるAIシステムであるRAIS-DRを開発した。
当科におけるRAIS-DRをFDA認可のEyeArtシステムと比較した。
論文 参考訳(メタデータ) (2025-08-17T21:54:11Z) - Toward the Autonomous AI Doctor: Quantitative Benchmarking of an Autonomous Agentic AI Versus Board-Certified Clinicians in a Real World Setting [0.0]
2030年までには、世界中で1100万人の医療従事者が不足していると予測されている。
エンド・ツー・エンドの大規模言語モデル(LLM)ベースのAIシステムは、実際の臨床実践において厳格に評価されていない。
論文 参考訳(メタデータ) (2025-06-27T19:04:44Z) - An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [69.46279475491164]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。
DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。
このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文 参考訳(メタデータ) (2025-06-25T13:42:26Z) - Artificial Intelligence-Based Triaging of Cutaneous Melanocytic Lesions [0.8864540224289991]
患者数の増加とより包括的な診断の必要性により、病理学者は作業負荷の増大に直面している。
われわれは,全スライド画像に基づいて皮膚メラノサイト性病変をトリアージする人工知能(AI)モデルを開発した。
論文 参考訳(メタデータ) (2024-10-14T13:49:04Z) - A Concept-based Interpretable Model for the Diagnosis of Choroid
Neoplasias using Multimodal Data [28.632437578685842]
我々は成人で最も多い眼がんである脈絡膜新生症(5.1%)に焦点を当てた。
本研究は,3種類の脈絡膜腫瘍を識別する概念に基づく解釈可能なモデルを提案する。
注目すべきは、このモデルがブラックボックスモデルに匹敵するF1スコアの0.91を達成する一方で、ジュニア医師の診断精度を42%向上させることである。
論文 参考訳(メタデータ) (2024-03-08T07:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。