Fugu-MT 論文翻訳(概要): ScaleMAI: Accelerating the Development of Trusted Datasets and AI Models

論文の概要: ScaleMAI: Accelerating the Development of Trusted Datasets and AI Models

arxiv url: http://arxiv.org/abs/2501.03410v1
Date: Mon, 06 Jan 2025 22:12:00 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-08 16:58:02.904059
Title: ScaleMAI: Accelerating the Development of Trusted Datasets and AI Models
Title（参考訳）: ScaleMAI: 信頼されたデータセットとAIモデルの開発を加速する
Authors: Wenxuan Li, Pedro R. A. S. Bassi, Tianyu Lin, Yu-Cheng Chou, Xinze Zhou, Yucheng Tang, Fabian Isensee, Kang Wang, Qi Chen, Xiaowei Xu, Xiaoxi Chen, Lizhou Wu, Qilong Wu, Yannick Kirchhoff, Maximilian Rokuss, Saikat Roy, Yuxuan Zhao, Dexin Yu, Kai Ding, Constantin Ulrich, Klaus Maier-Hein, Yang Yang, Alan L. Yuille, Zongwei Zhou,
Abstract要約: 我々はAI統合データキュレーションとアノテーションのエージェントであるScaleMAIを提案する。まず、ScaleMAIは25,362個のCTスキャンを作成した。第2に、プログレッシブなヒューマン・イン・ザ・ループのイテレーションを通じて、ScaleMAIはFragship AI Modelを提供する。
参考スコア（独自算出の注目度）: 46.80682547774335
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Building trusted datasets is critical for transparent and responsible Medical AI (MAI) research, but creating even small, high-quality datasets can take years of effort from multidisciplinary teams. This process often delays AI benefits, as human-centric data creation and AI-centric model development are treated as separate, sequential steps. To overcome this, we propose ScaleMAI, an agent of AI-integrated data curation and annotation, allowing data quality and AI performance to improve in a self-reinforcing cycle and reducing development time from years to months. We adopt pancreatic tumor detection as an example. First, ScaleMAI progressively creates a dataset of 25,362 CT scans, including per-voxel annotations for benign/malignant tumors and 24 anatomical structures. Second, through progressive human-in-the-loop iterations, ScaleMAI provides Flagship AI Model that can approach the proficiency of expert annotators (30-year experience) in detecting pancreatic tumors. Flagship Model significantly outperforms models developed from smaller, fixed-quality datasets, with substantial gains in tumor detection (+14%), segmentation (+5%), and classification (72%) on three prestigious benchmarks. In summary, ScaleMAI transforms the speed, scale, and reliability of medical dataset creation, paving the way for a variety of impactful, data-driven applications.
Abstract（参考訳）: 信頼されたデータセットの構築は、透明で責任のある医療AI(MAI)研究に不可欠だが、小規模で高品質なデータセットを作成するには、多分野のチームによる何年もの労力を要する可能性がある。このプロセスは、人間中心のデータ生成とAI中心のモデル開発が別々のシーケンシャルなステップとして扱われるため、AIのメリットを遅らせることが多い。これを解決するために、AI統合データキュレーションとアノテーションのエージェントであるScaleMAIを提案し、データ品質とAIのパフォーマンスを自己強化サイクルで改善し、開発時間を数年から数ヶ月に短縮する。膵腫瘍の検出を例に挙げる。まず、ScaleMAIは25,362のCTスキャンのデータセットを段階的に作成し、良性/悪性腫瘍のvoxelアノテーションと24の解剖学的構造を含む。第2に、プログレッシブなヒューマン・イン・ザ・ループのイテレーションを通じて、ScaleMAIはFragship AI Modelを提供し、膵腫瘍を検出する専門家アノテータ(30年の経験)の習熟度にアプローチすることができる。フラッグシップモデルでは,腫瘍検出(+14%),セグメンテーション(+5%),分類(72%)の3つの名高いベンチマークにおいて,より小型で高品質なデータセットから開発されたモデルを著しく上回っている。要約すると、ScaleMAIは医療データセット作成のスピード、スケール、信頼性を変換し、さまざまなインパクトのあるデータ駆動アプリケーションへの道を開く。

関連論文リスト

TransConv-DDPM: Enhanced Diffusion Model for Generating Time-Series Data in Healthcare [2.2259175702299188]
ジェネレーティブAIは、データボリュームの増加とモデルトレーニングの強化を約束している。本稿では,生体力学的および生理的時系列データ生成のための改良された生成AIであるTransConv-DDPMを紹介する。
論文参考訳（メタデータ） (2026-02-03T05:24:37Z)
Scaling Tumor Segmentation: Best Lessons from Real and Synthetic Data [62.63749675817477]
AbdomenAtlas 2.0は10,135個のCTスキャンのデータセットで、6つの臓器に手動で注釈付けされた1ボクセルあたり15,130個の腫瘍例が記録されている。公開データセットよりも顕著な改善が達成され、DSCテストは+7%、配布外テストは+16%向上した。
論文参考訳（メタデータ） (2025-10-16T16:08:09Z)
impuTMAE: Multi-modal Transformer with Masked Pre-training for Missing Modalities Imputation in Cancer Survival Prediction [75.43342771863837]
我々は,効率的なマルチモーダル事前学習戦略を備えた新しいトランスフォーマーに基づくエンドツーエンドアプローチである impuTMAE を紹介する。マスクされたパッチを再構築することで、モダリティの欠如を同時に示唆しながら、モダリティ間の相互作用とモダリティ内相互作用を学習する。本モデルは,TGA-GBM/LGGとBraTSデータセットを用いたグリオーマ生存予測のために,異種不完全データに基づいて事前訓練を行った。
論文参考訳（メタデータ） (2025-08-08T10:01:16Z)
A Data-Efficient Pan-Tumor Foundation Model for Oncology CT Interpretation [17.993838581176902]
PASTAは、46の腫瘍学タスクのうち45の最先端のパフォーマンスを達成するパン腫瘍CT基盤モデルである。 PASTA-Genは、ピクセルレベルのアノテート病変とペア構造レポートを備えた3万個のCTスキャンの包括的なデータセットを生成する。
論文参考訳（メタデータ） (2025-02-10T05:45:03Z)
Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification [2.5091334993691206]
網膜疾患診断のための堅牢なディープラーニングモデルの開発には、トレーニングのためのかなりのデータセットが必要である。より小さなデータセットで効果的に一般化する能力は、依然として永続的な課題である。さまざまなデータソースを組み合わせて、パフォーマンスを改善し、新しいデータに一般化しています。
論文参考訳（メタデータ） (2024-09-17T17:22:35Z)
AutoPET Challenge: Tumour Synthesis for Data Augmentation [26.236831356731017]
我々は,CT画像のためのDiffTumor法を適用し,病変のあるPET-CT画像を生成する。提案手法では,AutoPETデータセット上で生成モデルをトレーニングし,トレーニングデータの拡張に使用する。以上の結果から,拡張データセットでトレーニングしたモデルでは,Diceスコアが向上し,データ拡張アプローチの可能性が示された。
論文参考訳（メタデータ） (2024-09-12T14:23:19Z)
Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。 ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文参考訳（メタデータ） (2024-08-19T15:04:42Z)
GFE-Mamba: Mamba-based AD Multi-modal Progression Assessment via Generative Feature Extraction from MCI [5.355943545567233]
アルツハイマー病(英語: Alzheimer's Disease、AD)は、軽度認知障害(MCI)から進行する可逆性神経変性疾患である。生成特徴抽出(GFE)に基づく分類器GFE-Mambaを紹介する。評価尺度、MRI、PETのデータを統合し、より深いマルチモーダル融合を可能にする。 GFE-MambaモデルがMCIからADへの変換予測に有効であることを示す。
論文参考訳（メタデータ） (2024-07-22T15:22:33Z)
Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。 iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文参考訳（メタデータ） (2024-07-10T19:17:23Z)
Texture Feature Analysis for Classification of Early-Stage Prostate Cancer in mpMRI [0.0]
本研究では,一階統計的特徴,ハラリックテクスチャ的特徴,および局所二分法パターンによる分類への寄与を分析した。我々は、分類結果を決定する少数の特徴を特定し、説明可能なAIアプローチの開発に役立つかもしれない。
論文参考訳（メタデータ） (2024-06-21T18:12:58Z)
AI in Lung Health: Benchmarking Detection and Diagnostic Models Across Multiple CT Scan Datasets [0.33923727961771083]
肺がんは、世界中でがん関連死亡の原因となっている。医療画像への人工知能の統合が拡大するにつれ、堅牢なAIモデルの開発と評価は、大規模で注釈の付いたデータセットへのアクセスを必要としている。我々は,3次元結節検出と肺がん分類のためのディープラーニングモデルをベンチマークした。
論文参考訳（メタデータ） (2024-05-07T18:36:40Z)
The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文参考訳（メタデータ） (2023-09-13T10:40:41Z)
Integrative Imaging Informatics for Cancer Research: Workflow Automation for Neuro-oncology (I3CR-WANO) [0.12175619840081271]
我々は,多系列ニューロオンコロジーMRIデータの集約と処理のための人工知能ベースのソリューションを提案する。エンド・ツー・エンドのフレームワーク i) アンサンブル分類器を用いてMRIの配列を分類し, i) 再現可能な方法でデータを前処理し, iv) 腫瘍組織サブタイプを規定する。欠落したシーケンスに対して堅牢であり、専門的なループアプローチを採用しており、セグメンテーションの結果は放射線学者によって手動で洗練される可能性がある。
論文参考訳（メタデータ） (2022-10-06T18:23:42Z)
Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文参考訳（メタデータ） (2022-04-22T17:27:00Z)
Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文参考訳（メタデータ） (2021-02-26T02:29:30Z)
Self-Training with Improved Regularization for Sample-Efficient Chest X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文参考訳（メタデータ） (2020-05-03T02:36:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。