論文の概要: QuarkMedSearch: A Long-Horizon Deep Search Agent for Exploring Medical Intelligence
- arxiv url: http://arxiv.org/abs/2604.12867v4
- Date: Thu, 23 Apr 2026 01:15:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:05.96989
- Title: QuarkMedSearch: A Long-Horizon Deep Search Agent for Exploring Medical Intelligence
- Title(参考訳): QuarkMedSearch:医療情報探究のための長距離ディープサーチエージェント
- Authors: Zhichao Lin, Zhichao Liang, Gaoqiang Liu, Meng Xu, Baoyu Xiang, Shuxin Zhao, Yao Wu, Jian Xu, Guanjun Jiang,
- Abstract要約: 我々は,強力なエージェント基盤モデルであるTongyi DeepResearchを構築し,QuarkMedSearchを提案する。
データ合成には、大規模医療知識グラフとリアルタイムオンライン探索を組み合わせることで、長期医療深層検索訓練データを構築する。
ポストトレーニングでは、2段階のSFTおよびRLトレーニング戦略を採用し、モデルの計画、ツール呼び出し、リフレクション機能を徐々に強化する。
- 参考スコア(独自算出の注目度): 7.965065668022068
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As agentic foundation models continue to evolve, how to further improve their performance in vertical domains has become an important challenge. To this end, building upon Tongyi DeepResearch, a powerful agentic foundation model, we focus on the Chinese medical deep search scenario and propose QuarkMedSearch, systematically exploring a full-pipeline approach spanning medical multi-hop data construction, training strategies, and evaluation benchmarks to further push and assess its performance upper bound in vertical domains. Specifically, for data synthesis, to address the scarcity of deep search training data in the medical domain, we combine a large-scale medical knowledge graph with real-time online exploration to construct long-horizon medical deep search training data; for post-training, we adopt a two-stage SFT and RL training strategy that progressively enhances the model's planning, tool invocation, and reflection capabilities required for deep search, while maintaining search efficiency; for evaluation, we collaborate with medical experts to construct the QuarkMedSearch Benchmark through rigorous manual verification. Experimental results demonstrate that QuarkMedSearch achieves state-of-the-art performance among open-source models of comparable scale on the QuarkMedSearch Benchmark, while also maintaining strong competitiveness on general benchmarks.
- Abstract(参考訳): エージェントファウンデーションモデルが進化を続けるにつれて、垂直領域におけるパフォーマンスをさらに向上する方法が重要な課題となっている。
この目的のために,強力なエージェント基盤モデルであるTongyi DeepResearchを基盤として,中国における医療深層探索のシナリオに着目したQuarkMedSearchを提案する。
具体的には、医用領域における深部検索訓練データの不足に対処するため、大規模医療知識グラフとリアルタイムオンライン探索を併用して、長期医療深部検索訓練データの構築を行い、訓練後、厳密な手作業によるQuarkMedSearch Benchmarkを構築するために、検索効率を維持しながら、モデルの計画、ツール呼び出し、リフレクション能力を段階的に向上する2段階のSFTおよびRLトレーニング戦略を採用する。
実験により、QuarkMedSearchはQuarkMedSearchベンチマークにおいて、同等規模のオープンソースモデル間の最先端のパフォーマンスを達成し、また、一般的なベンチマークでは強力な競争力を維持していることが示された。
関連論文リスト
- Step-DeepResearch Technical Report [90.50586290399683]
コスト効率のよいエンドツーエンドエージェントである Step-DeepResearch を紹介する。
我々は、計画とレポート作成を強化するために、アトミック能力に基づくデータ合成戦略を提案する。
中国における評価ギャップを埋めるため,現実的な深層研究シナリオのためのADR-Benchを構築した。
論文 参考訳(メタデータ) (2025-12-23T16:32:27Z) - Enhancing Medical Cross-Modal Hashing Retrieval using Dropout-Voting Mixture-of-Experts Fusion [5.849736173068869]
クロスモーダル検索は、特に医学領域において、研究の活発な領域となっている。
本研究では,MoEをベースとしたコントラスト融合モジュールを用いた新しいフレームワークを提案する。
提案手法は,低メモリ環境における高精度かつ高速な検索速度の同時達成を可能にする。
論文 参考訳(メタデータ) (2025-12-06T14:23:44Z) - End-to-End Agentic RAG System Training for Traceable Diagnostic Reasoning [52.12425911708585]
Deep-DxSearchは、強化学習(RL)でエンドツーエンドに訓練されたエージェントRAGシステムである。
Deep-DxSearchでは,患者記録と信頼性のある医療知識情報を含む大規模医療検索コーパスを構築した。
実験により、エンドツーエンドのRLトレーニングフレームワークは、プロンプトエンジニアリングやトレーニングフリーなRAGアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-21T17:42:47Z) - MedResearcher-R1: Expert-Level Medical Deep Researcher via A Knowledge-Informed Trajectory Synthesis Framework [24.399778346443757]
汎用的なディープリサーチエージェントは、主要なプロプライエタリなシステムによって証明されているように、医療領域の課題に苦しむ。
2つのコアイノベーションを通じてこれらの課題に対処する医療深層研究エージェントを提示する。
本手法は12の専門分野にまたがる2100以上の多様な軌道を生成し,それぞれが平均4.2のツールインタラクションを発生させる。
論文 参考訳(メタデータ) (2025-08-20T17:51:20Z) - MedPerf: Open Benchmarking Platform for Medical Artificial Intelligence
using Federated Evaluation [110.31526448744096]
この可能性を解き明かすには、大規模な異種データに対して医療AIモデルの性能を測定する体系的な方法が必要である、と私たちは主張する。
MedPerfは、医療分野で機械学習をベンチマークするためのオープンフレームワークです。
論文 参考訳(メタデータ) (2021-09-29T18:09:41Z) - A Modern Non-SQL Approach to Radiology-Centric Search Engine Design with
Clinical Validation [0.0]
本稿では,Radiologyの文脈において,文書ベース,セキュア,効率的,高精度な検索エンジンを開発するためのデノボプロセスを提案する。
効率的なデータベースアーキテクチャ、検索能力、臨床思考を活用することで、放射線学者は医療データのパワーを活用する最前線にいる。
論文 参考訳(メタデータ) (2020-07-04T15:21:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。