論文の概要: ConfAgents: A Conformal-Guided Multi-Agent Framework for Cost-Efficient Medical Diagnosis
- arxiv url: http://arxiv.org/abs/2508.04915v1
- Date: Wed, 06 Aug 2025 22:39:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-08 18:59:39.658249
- Title: ConfAgents: A Conformal-Guided Multi-Agent Framework for Cost-Efficient Medical Diagnosis
- Title(参考訳): ConfAgents: 費用効率の良い医療診断のためのコンフォーマルガイド型マルチエージェントフレームワーク
- Authors: Huiya Zhao, Yinghao Zhu, Zixiang Wang, Yasha Wang, Junyi Gao, Liantao Ma,
- Abstract要約: 私たちは、新しいメタレベルの進化メカニズムを通じて制限を克服する、自己進化型AIエージェントであるHealthFlowを紹介します。
HealthFlowは、手続き的な成功と失敗を永続的で戦略的知識基盤に蒸留することで、独自のハイレベルな問題解決ポリシーを自律的に洗練する。
私たちの実験では、HealthFlowの自己進化アプローチが最先端のエージェントフレームワークを大幅に上回っていることを実証しています。
- 参考スコア(独自算出の注目度): 11.18347744454527
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The efficacy of AI agents in healthcare research is hindered by their reliance on static, predefined strategies. This creates a critical limitation: agents can become better tool-users but cannot learn to become better strategic planners, a crucial skill for complex domains like healthcare. We introduce HealthFlow, a self-evolving AI agent that overcomes this limitation through a novel meta-level evolution mechanism. HealthFlow autonomously refines its own high-level problem-solving policies by distilling procedural successes and failures into a durable, strategic knowledge base. To anchor our research and facilitate reproducible evaluation, we introduce EHRFlowBench, a new benchmark featuring complex, realistic health data analysis tasks derived from peer-reviewed clinical research. Our comprehensive experiments demonstrate that HealthFlow's self-evolving approach significantly outperforms state-of-the-art agent frameworks. This work marks a necessary shift from building better tool-users to designing smarter, self-evolving task-managers, paving the way for more autonomous and effective AI for scientific discovery.
- Abstract(参考訳): 医療研究におけるAIエージェントの有効性は、静的で事前定義された戦略への依存によって妨げられている。
エージェントはより良いツールユーザーになれるが、より良い戦略的プランナーになることを学ぶことはできない。
私たちは、新しいメタレベルの進化メカニズムを通じて、この制限を克服する自己進化型AIエージェントであるHealthFlowを紹介します。
HealthFlowは、手続き的な成功と失敗を永続的で戦略的知識基盤に蒸留することで、独自のハイレベルな問題解決ポリシーを自律的に洗練する。
本研究の定着と再現性評価の促進を目的として,ピアレビューされた臨床研究から得られた,複雑で現実的な健康データ分析タスクを特徴とする新しいベンチマークであるEHRFlowBenchを紹介した。
私たちの包括的な実験は、HealthFlowの自己進化アプローチが最先端のエージェントフレームワークを大幅に上回っていることを示している。
この作業は、よりよいツールユーザの構築から、よりスマートで自己進化的なタスクマネージャの設計、そして科学的な発見のためのより自律的で効果的なAIへの道を開くための、必要な転換である。
関連論文リスト
- HealthFlow: A Self-Evolving AI Agent with Meta Planning for Autonomous Healthcare Research [16.963151914975438]
私たちは、新しいメタレベルの進化メカニズムを通じて制限を克服する、自己進化型AIエージェントであるHealthFlowを紹介します。
HealthFlowは、手続き的な成功と失敗を永続的で戦略的知識基盤に蒸留することで、独自のハイレベルな問題解決ポリシーを自律的に洗練する。
私たちの実験では、HealthFlowの自己進化アプローチが最先端のエージェントフレームワークを大幅に上回っていることを実証しています。
論文 参考訳(メタデータ) (2025-08-04T17:08:47Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training [67.895981259683]
汎用AIエージェントは、次世代人工知能の基礎となるフレームワークとして、ますます認識されている。
現在のエージェントシステムはクローズドソースか、さまざまな有料APIやプロプライエタリなツールに大きく依存している。
我々は,完全オープンソースかつ(最大限に)フリーなマルチモジュールエージェントフレームワークであるCognitive Kernel-Proを提案する。
論文 参考訳(メタデータ) (2025-08-01T08:11:31Z) - A Survey of Self-Evolving Agents: On Path to Artificial Super Intelligence [87.08051686357206]
大きな言語モデル(LLM)は強力な能力を示しているが、基本的に静的である。
LLMはますますオープンでインタラクティブな環境にデプロイされているため、この静的な性質は重要なボトルネックとなっている。
この調査は、自己進化エージェントの体系的で包括的なレビューを初めて提供する。
論文 参考訳(メタデータ) (2025-07-28T17:59:05Z) - STELLA: Self-Evolving LLM Agent for Biomedical Research [40.841136388072385]
本稿では,制限を克服する自己進化型AIエージェントSTELLAを紹介する。
STELLAは、自律的に自身の能力を改善するマルチエージェントアーキテクチャを採用している。
バイオメディカルベンチマークを用いて,STELLAが最先端の精度を実現することを実証した。
論文 参考訳(メタデータ) (2025-07-01T20:52:01Z) - Deep Research Agents: A Systematic Examination And Roadmap [79.04813794804377]
Deep Research (DR) エージェントは複雑な多ターン情報研究タスクに取り組むように設計されている。
本稿では,DRエージェントを構成する基礎技術とアーキテクチャコンポーネントの詳細な分析を行う。
論文 参考訳(メタデータ) (2025-06-22T16:52:48Z) - Can AI Agents Design and Implement Drug Discovery Pipelines? [1.5848629658789695]
現在のAIエージェントベースのシステムは、プログラミングの課題を解決し、研究を行う能力を示している。
本稿では,AIエージェントの意思決定能力を評価するためのベンチマークであるDO Challengeを紹介する。
ベンチマークで強い性能を示したDeep Thoughtのマルチエージェントシステムについて述べる。
論文 参考訳(メタデータ) (2025-04-28T15:41:28Z) - LLM Agent Swarm for Hypothesis-Driven Drug Discovery [2.7036595757881323]
ファーマシュワーム(PharmaSwarm)は、新規な薬物標的および鉛化合物の仮説を提唱し、検証し、洗練するために、特殊な「エージェント」を編成する統合マルチエージェントフレームワークである。
PharmaSwarmはAIの副操縦士として機能することで、翻訳研究を加速し、従来のパイプラインよりも効率的に高信頼の仮説を提供することができる。
論文 参考訳(メタデータ) (2025-04-24T22:27:50Z) - Towards Next-Generation Medical Agent: How o1 is Reshaping Decision-Making in Medical Scenarios [46.729092855387165]
本稿では,医療用AIエージェントのバックボーンLSMの選択について検討する。
我々の研究結果は、o1の診断精度と一貫性を高める能力を示し、よりスマートでより応答性の高いAIツールへの道を開いた。
論文 参考訳(メタデータ) (2024-11-16T18:19:53Z) - From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning [62.54484062185869]
本稿では,エージェントの強化学習プロセスの最適化にステップワイド報酬を利用するStepAgentを紹介する。
エージェント反射とポリシー調整を容易にする暗黙の逆・逆の強化学習手法を提案する。
論文 参考訳(メタデータ) (2024-11-06T10:35:11Z) - MDAgents: An Adaptive Collaboration of LLMs for Medical Decision-Making [45.74980058831342]
MDAgents(Medical Decision-making Agents)と呼ばれる新しいマルチエージェントフレームワークを導入する。
割り当てられた単独またはグループの共同作業構造は、実際の医療決定過程をエミュレートして、手元にある医療タスクに合わせて調整される。
MDAgentsは医療知識の理解を必要とするタスクに関する10のベンチマークのうち7つのベンチマークで最高のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-04-22T06:30:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。