論文の概要: RANGER: Sparsely-Gated Mixture-of-Experts with Adaptive Retrieval Re-ranking for Pathology Report Generation
- arxiv url: http://arxiv.org/abs/2603.04348v1
- Date: Wed, 04 Mar 2026 18:12:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.444772
- Title: RANGER: Sparsely-Gated Mixture-of-Experts with Adaptive Retrieval Re-ranking for Pathology Report Generation
- Title(参考訳): RANGER: 適応検索を併用した低ゲージ混合試験による病理報告生成
- Authors: Yixin Chen, Ziyu Su, Hikmat Khan, Muhammad Khalid Khan Niazi,
- Abstract要約: RANGER (Ranger) は、病理報告生成のための適応的検索を再度ランク付けした、疎結合なMixture-of-Experts (MoE) フレームワークである。
我々は、標準自然言語生成指標における既存のアプローチに対する一貫した改善を実証する。
我々の完全なRANGERモデルは、PathTextデータセット上で最適な性能を達成し、それぞれ0.4598、0.3044、0.2036、0.1435のBLEU-1からBLEU-4のスコアに達した。
- 参考スコア(独自算出の注目度): 5.081261104622565
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pathology report generation remains a relatively under-explored downstream task, primarily due to the gigapixel scale and complex morphological heterogeneity of Whole Slide Images (WSIs). Existing pathology report generation frameworks typically employ transformer architectures, relying on a homogeneous decoder architecture and static knowledge retrieval integration. Such architectures limit generative specialization and may introduce noisy external guidance during the report generation process. To address these limitations, we propose RANGER, a sparsely-gated Mixture-of-Experts (MoE) framework with adaptive retrieval re-ranking for pathology report generation. Specifically, we integrate a sparsely gated MoE into the decoder, along with noisy top-$k$ routing and load-balancing regularization, to enable dynamic expert specialization across various diagnostic patterns. Additionally, we introduce an adaptive retrieval re-ranking module that selectively refines retrieved memory from a knowledge base before integration, reducing noise and improving semantic alignment based on visual feature representations. We perform extensive experiments on the PathText-BRCA dataset and demonstrate consistent improvements over existing approaches across standard natural language generation metrics. Our full RANGER model achieves optimal performance on PathText dataset, reaching BLEU-1 to BLEU-4 scores of 0.4598, 0.3044, 0.2036, and 0.1435, respectively, with METEOR of 0.1883, and ROUGE-L of 0.3038, validating the effectiveness of dynamic expert routing and adaptive knowledge refinement for semantically grounded pathology report generation.
- Abstract(参考訳): 病理報告の生成は、主に全スライド画像(WSI)のギガピクセルスケールと複雑な形態的不均一性のため、比較的過小評価されている下流課題である。
既存の病理報告生成フレームワークは、典型的にはトランスフォーマーアーキテクチャを採用し、均質なデコーダアーキテクチャと静的知識検索の統合に依存している。
このようなアーキテクチャは、生成的特殊化を制限し、レポート生成プロセス中にノイズの多い外部ガイダンスを導入する可能性がある。
これらの制約に対処するため,本論文では,病的報告の生成に適応的検索を再ランク付けした,疎密なMixture-of-Experts (MoE) フレームワークであるRANGERを提案する。
具体的には、疎結合なMoEをデコーダに統合し、様々な診断パターンにまたがる動的専門家の専門化を可能にするため、ルーティングとロードバランシングの規則化を行う。
さらに,統合前の知識ベースから抽出したメモリを選択的に洗練し,ノイズを低減し,視覚的特徴表現に基づくセマンティックアライメントを改善する適応検索リグレードモジュールを提案する。
PathText-BRCAデータセットに関する広範な実験を行い、標準自然言語生成指標における既存のアプローチに対する一貫した改善を実証する。
我々の完全なRANGERモデルはPathTextデータセット上で最適性能を達成し、BLEU-1からBLEU-4までのスコアは0.4598、0.3044、0.2036、0.1435となり、METEORは0.1883、ROUGE-Lは0.3038となり、動的専門的ルーティングと適応的知識改善の有効性が検証された。
関連論文リスト
- RAGTrack: Language-aware RGBT Tracking with Retrieval-Augmented Generation [71.2136732268131]
RGB-Thermal(RGBT)トラッキングは、多様な環境条件をまたいだ堅牢なオブジェクトローカライゼーションを実現することを目的としている。
既存のRGBTトラッカーは、ターゲットモデリングのための初期フレームの視覚情報のみに依存している。
堅牢なRGBTトラッキングのための新しい検索拡張フレームワークであるRAGTrackを提案する。
論文 参考訳(メタデータ) (2026-03-04T01:02:04Z) - Mixture of Ranks with Degradation-Aware Routing for One-Step Real-World Image Super-Resolution [76.66229730098759]
実世界の画像超解像(Real-ISR)では、既存のアプローチは主に微調整された事前学習拡散モデルに依存している。
単一ステップ画像超解像のためのMixture-of-Ranks (MoR)アーキテクチャを提案する。
LoRAの各ランクを独立した専門家として扱う、きめ細かい専門家分割戦略を導入する。
論文 参考訳(メタデータ) (2025-11-20T04:11:44Z) - Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文 参考訳(メタデータ) (2025-11-10T12:45:52Z) - Path-Weighted Integrated Gradients for Interpretable Dementia Classification [1.388610714424775]
本稿では、カスタマイズ可能な重み付け関数を属性積分に組み込んだ統合勾配(IG)の一般化であるPath-Weighted Integrated Gradients (PWIG)を紹介する。
PWIGは、複雑な予測モデルにおける帰属品質を高めるための柔軟で理論的に基礎的なアプローチを提供する。
論文 参考訳(メタデータ) (2025-09-22T08:19:48Z) - HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文 参考訳(メタデータ) (2025-08-01T20:30:42Z) - GANet-Seg: Adversarial Learning for Brain Tumor Segmentation with Hybrid Generative Models [1.0456203870202954]
この研究は、事前訓練されたGANとUnetアーキテクチャを利用した脳腫瘍セグメンテーションのための新しいフレームワークを導入する。
グローバルな異常検出モジュールと改良されたマスク生成ネットワークを組み合わせることで,腫瘍感受性領域を正確に同定する。
マルチモーダルMRIデータと合成画像拡張を用いて、ロバスト性を改善し、限られたアノテートデータセットの課題に対処する。
論文 参考訳(メタデータ) (2025-06-26T13:28:09Z) - MIRAGE: A Metric-Intensive Benchmark for Retrieval-Augmented Generation Evaluation [8.950307082012763]
大規模言語モデル(LLM)の生成能力向上に有効な手法として,検索拡張生成(RAG)が注目されている。
本稿では,RAG評価に特化して設計された質問応答データセットであるMIRAGEについて述べる。
MIRAGEは、37,800エントリの検索プールにマッピングされた7,560のキュレートされたインスタンスで構成され、検索と生成の両方のタスクの効率的かつ正確な評価を可能にする。
論文 参考訳(メタデータ) (2025-04-23T23:05:46Z) - Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。
ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。
本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T15:04:42Z) - HistGen: Histopathology Report Generation via Local-Global Feature Encoding and Cross-modal Context Interaction [16.060286162384536]
HistGenは、病理組織学レポート生成のための学習可能なフレームワークである。
スライド画像全体(WSI)と局所的およびグローバルな粒度からの診断レポートを整列させることで、レポート生成を促進することを目的としている。
WSIレポート生成実験の結果,提案手法は最先端モデル(SOTA)よりも大きなマージンで優れていた。
論文 参考訳(メタデータ) (2024-03-08T15:51:43Z) - GSMFlow: Generation Shifts Mitigating Flow for Generalized Zero-Shot
Learning [55.79997930181418]
Generalized Zero-Shot Learningは、目に見えないクラスから見えないクラスに意味的な知識を移すことで、目に見えないクラスと見えないクラスの両方から画像を認識することを目的としている。
生成モデルの利点を生かして、見学したクラスから学んだ知識に基づいて、現実的な見知らぬサンプルを幻覚させることは、有望な解決策である。
本研究では,複数の条件付きアフィン結合層からなるフローベース生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:04:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。