論文の概要: Agentic AI framework for End-to-End Medical Data Inference
- arxiv url: http://arxiv.org/abs/2507.18115v1
- Date: Thu, 24 Jul 2025 05:56:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-25 15:10:43.0281
- Title: Agentic AI framework for End-to-End Medical Data Inference
- Title(参考訳): エンド・ツー・エンド医療データ推論のためのエージェントAIフレームワーク
- Authors: Soorya Ram Shimgekar, Shayan Vassef, Abhay Goyal, Navin Kumar, Koustuv Saha,
- Abstract要約: 我々は、摂取から推論まで、臨床データパイプライン全体を自動化するエージェントAIフレームワークを導入する。
本システムは, 高齢者, 緩和ケア, 大腸内視鏡検査から入手可能なデータセットを用いて評価した。
- 参考スコア(独自算出の注目度): 5.871161259593687
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Building and deploying machine learning solutions in healthcare remains expensive and labor-intensive due to fragmented preprocessing workflows, model compatibility issues, and stringent data privacy constraints. In this work, we introduce an Agentic AI framework that automates the entire clinical data pipeline, from ingestion to inference, through a system of modular, task-specific agents. These agents handle both structured and unstructured data, enabling automatic feature selection, model selection, and preprocessing recommendation without manual intervention. We evaluate the system on publicly available datasets from geriatrics, palliative care, and colonoscopy imaging. For example, in the case of structured data (anxiety data) and unstructured data (colonoscopy polyps data), the pipeline begins with file-type detection by the Ingestion Identifier Agent, followed by the Data Anonymizer Agent ensuring privacy compliance, where we first identify the data type and then anonymize it. The Feature Extraction Agent identifies features using an embedding-based approach for tabular data, extracting all column names, and a multi-stage MedGemma-based approach for image data, which infers modality and disease name. These features guide the Model-Data Feature Matcher Agent in selecting the best-fit model from a curated repository. The Preprocessing Recommender Agent and Preprocessing Implementor Agent then apply tailored preprocessing based on data type and model requirements. Finally, the ``Model Inference Agent" runs the selected model on the uploaded data and generates interpretable outputs using tools like SHAP, LIME, and DETR attention maps. By automating these high-friction stages of the ML lifecycle, the proposed framework reduces the need for repeated expert intervention, offering a scalable, cost-efficient pathway for operationalizing AI in clinical environments.
- Abstract(参考訳): 医療における機械学習ソリューションの構築とデプロイは、断片化された前処理ワークフロー、モデル互換性の問題、厳格なデータプライバシの制約により、費用がかかり、労働集約的なままである。
本研究では,Agentic AIフレームワークを導入し,臨床データパイプライン全体を自動化し,摂取から推論まで,モジュール型のタスク固有エージェントシステムを通じて処理する。
これらのエージェントは構造化データと非構造化データの両方を処理し、手作業による介入なしに自動特徴選択、モデル選択、前処理レコメンデーションを可能にする。
本システムは, 高齢者, 緩和ケア, 大腸内視鏡検査から入手可能なデータセットを用いて評価した。
例えば、構造化データ(不安データ)と非構造化データ(大腸ポリープデータ)の場合、パイプラインは、Ingestion Identifier Agentによるファイルタイプ検出から始まり、続いてData Anonymizer Agentによってプライバシコンプライアンスが保証され、データタイプを最初に識別し、匿名化します。
特徴抽出エージェントは、グラフデータに対する埋め込みに基づくアプローチを用いて特徴を特定し、すべての列名を抽出し、画像データに対する多段階MedGemmaに基づくアプローチにより、モダリティと疾患名を推測する。
これらの機能は、キュレートされたリポジトリからベストフィットモデルを選択する際に、Model-Data Feature Matcher Agentをガイドする。
Preprocessing Recommender AgentとPreprocessing Implementor Agentは、データタイプとモデル要求に基づいて、カスタマイズされた前処理を適用する。
最後に、 ``Model Inference Agent' はアップロードされたデータ上で選択されたモデルを実行し、SHAP、LIME、DETRアテンションマップなどのツールを使用して解釈可能な出力を生成する。
MLライフサイクルのこれらのハイフリクションステージを自動化することで、提案されたフレームワークは、専門家の介入を繰り返す必要を減らし、臨床環境でAIを運用するためのスケーラブルでコスト効率の高い経路を提供する。
関連論文リスト
- AgenticData: An Agentic Data Analytics System for Heterogeneous Data [12.67277567222908]
AgenticDataはエージェントデータ分析システムで、複数のドメインにまたがるデータソースを自律的に分析しながら、自然言語(NL)の質問に反応することができる。
本稿では,関連するデータを発見するためのデータプロファイリングエージェント,フィードバックに基づく反復最適化のためのセマンティッククロスバリデーションエージェント,短期文脈を維持するためのスマートメモリエージェントを利用するマルチエージェント協調戦略を提案する。
論文 参考訳(メタデータ) (2025-08-07T03:33:59Z) - Technical specification of a framework for the collection of clinical images and data [0.10051474951635875]
ここで説明したメインコレクションフレームワークの主な特徴は、自動化され、進行中のデータセットのコレクションを可能にすることである。
データセットには、長期間のフォローアップを伴う古いケースが混在していることが重要です。
完全に自動化されたアプローチに従わない他のタイプのコレクションフレームワークについても述べられている。
論文 参考訳(メタデータ) (2025-07-29T17:30:50Z) - Agentomics-ML: Autonomous Machine Learning Experimentation Agent for Genomic and Transcriptomic Data [33.7054351451505]
本稿では,完全自律型エージェントベースシステムであるAgenomics-MLを紹介した。
本稿では,Agenomics-MLが既存のエージェントベースの手法よりも,一般化と成功率の両面で優れていることを示す。
論文 参考訳(メタデータ) (2025-06-05T19:44:38Z) - Self-Interested Agents in Collaborative Machine Learning: An Incentivized Adaptive Data-Centric Framework [34.19393519060549]
本稿では,データ中心型協調機械学習のためのフレームワークを提案する。
アービターはエージェントからデータのバッチを収集し、機械学習モデルをトレーニングし、各エージェントにデータコントリビューションを反映する独自のモデルを提供する。
この設定は、共有データ影響モデルの更新を行うフィードバックループを確立し、結果のモデルが将来のデータ共有ポリシーをガイドする。
論文 参考訳(メタデータ) (2024-12-09T15:47:36Z) - AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning [98.26836657967162]
textbfAgentOhanaは、さまざまなシナリオにまたがって、異なる環境からエージェントのトラジェクトリを集約する。
AIエージェント用に調整された大規模なアクションモデルである textbfxLAM-v0.1 は、さまざまなベンチマークで例外的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-23T18:56:26Z) - AttributionScanner: A Visual Analytics System for Model Validation with Metadata-Free Slice Finding [29.07617945233152]
データスライス検索は、低パフォーマンスを示すデータセット内のサブグループを特定し解析することで、機械学習(ML)モデルを検証するための新興技術である。
このアプローチは、追加メタデータに対する退屈でコストのかかる要件を含む、重大な課題に直面します。
本稿では,メタデータを含まないデータスライス検索用に設計された,革新的なビジュアルアナリティクス(VA)システムであるAttributionScannerを紹介する。
本システムでは、一般的なモデル動作を含む解釈可能なデータスライスを特定し、属性モザイク設計によりこれらのパターンを可視化する。
論文 参考訳(メタデータ) (2024-01-12T09:17:32Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - STAR: Boosting Low-Resource Information Extraction by Structure-to-Text
Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。
我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。
実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-05-24T12:15:19Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - Have you forgotten? A method to assess if machine learning models have
forgotten data [20.9131206112401]
ディープラーニングの時代において、複数のソースからのデータの集約は、データの多様性を保証するための一般的なアプローチである。
本稿では、モデルによってデータが忘れられたかどうかという課題に対処する。
我々は、ターゲットの出力と異なるデータセットで訓練されたモデルの出力を比較する統計的手法を確立する。
論文 参考訳(メタデータ) (2020-04-21T16:13:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。