Fugu-MT 論文翻訳(概要): Bridging the Reproducibility Divide: Open Source Software's Role in Standardizing Healthcare AI

論文の概要: Bridging the Reproducibility Divide: Open Source Software's Role in Standardizing Healthcare AI

arxiv url: http://arxiv.org/abs/2603.03367v1
Date: Mon, 02 Mar 2026 19:09:23 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-05 21:29:15.016548
Title: Bridging the Reproducibility Divide: Open Source Software's Role in Standardizing Healthcare AI
Title（参考訳）: Reproducibility Divideのブリッジ: ヘルスケアAIの標準化におけるオープンソースソフトウェアの役割
Authors: John Wu, Zhenbang Wu, Jimeng Sun,
Abstract要約: AI4Hの論文の74%は、依然としてプライベートデータセットに依存しているか、コードを共有していない。不整合で文書化されていないデータ前処理パイプラインは、可変モデルのパフォーマンスレポートをもたらす。コミュニティはオープンサイエンスの実践を促進し、データ前処理の標準化されたガイドラインを確立し、堅牢なベンチマークを開発する必要がある。
参考スコア（独自算出の注目度）: 19.53828399182458
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Our analysis of recent AI4H publications reveals that, despite a trend toward utilizing open datasets and sharing modeling code, 74% of AI4H papers still rely on private datasets or do not share their code. This is especially concerning in healthcare applications, where trust is essential. Furthermore, inconsistent and poorly documented data preprocessing pipelines result in variable model performance reports, even for identical tasks and datasets, making it challenging to evaluate the true effectiveness of AI models. Despite the challenges posed by the reproducibility crisis, addressing these issues through open practices offers substantial benefits. For instance, while the reproducibility mandate adds extra effort to research and publication, it significantly enhances the impact of the work. Our analysis shows that papers that used both public datasets and shared code received, on average, 110% more citations than those that do neither--more than doubling the citation count. Given the clear benefits of enhancing reproducibility, it is imperative for the AI4H community to take concrete steps to overcome existing barriers. The community should promote open science practices, establish standardized guidelines for data preprocessing, and develop robust benchmarks. Tackling these challenges through open-source development can improve reproducibility, which is essential for ensuring that AI models are safe, effective, and beneficial for patient care. This approach will help build more trustworthy AI systems that can be integrated into healthcare settings, ultimately contributing to better patient outcomes and advancing the field of medicine.
Abstract（参考訳）: 最近のAI4H出版物の分析によると、オープンデータセットの利用とモデリングコード共有の傾向にもかかわらず、AI4H論文の74%は依然としてプライベートデータセットに依存しているか、コードを共有していない。これは特に、信頼が不可欠である医療アプリケーションに関係している。さらに、一貫性がなく、文書化されていないデータ前処理パイプラインは、同一のタスクやデータセットであっても、可変モデルのパフォーマンスレポートをもたらすため、AIモデルの真の有効性を評価するのは難しい。再現性危機によって引き起こされる課題にもかかわらず、オープンプラクティスを通じてこれらの問題に対処することは、かなりの利益をもたらす。例えば、再現性委任は研究と出版に余分な労力を加えるが、これは作品の影響を著しく強化する。我々の分析によると、公開データセットと共有コードの両方を使用した論文は、平均して、引用回数を2倍以上に増やさないものよりも、平均して110%多く引用されている。再現性を高めるという明確なメリットを考えれば、AI4Hコミュニティは、既存の障壁を克服するための具体的なステップを踏むことが不可欠である。コミュニティはオープンサイエンスの実践を促進し、データ前処理の標準化されたガイドラインを確立し、堅牢なベンチマークを開発する必要がある。オープンソース開発を通じてこれらの課題に取り組むことは、再現性を向上させることができる。これは、AIモデルが安全で効果的で、患者に有益なものであることを保証するために不可欠である。このアプローチは、医療設定に統合可能な信頼性の高いAIシステムの構築を支援し、最終的には患者のより良い結果に寄与し、医療分野の進歩に寄与する。

関連論文リスト

Leveraging LLM Parametric Knowledge for Fact Checking without Retrieval [60.25608870901428]
信頼性は、大規模言語モデル(LLM)上に構築されたエージェントAIシステムの中核研究課題である本研究では,任意の自然言語クレームの検証に焦点をあて,検索なしで事実チェックを行うタスクを提案する。
論文参考訳（メタデータ） (2026-03-05T18:42:51Z)
AI IDEs or Autonomous Agents? Measuring the Impact of Coding Agents on Software Development [12.50615284537175]
大規模言語モデル(LLM)ベースのコーディングエージェントは、プルリクエストの生成とマージを行う自律的なコントリビュータとして機能するようになっている。本稿では,オープンソースリポジトリにおけるエージェント導入の経時的因果関係について検討する。
論文参考訳（メタデータ） (2026-01-20T04:51:56Z)
CoCoNUTS: Concentrating on Content while Neglecting Uninformative Textual Styles for AI-Generated Peer Review Detection [60.52240468810558]
我々は、AI生成ピアレビューの詳細なデータセットの上に構築されたコンテンツ指向ベンチマークであるCoCoNUTSを紹介する。また、マルチタスク学習フレームワークを介してAIレビュー検出を行うCoCoDetを開発し、レビューコンテンツにおけるAIのより正確で堅牢な検出を実現する。
論文参考訳（メタデータ） (2025-08-28T06:03:11Z)
How Good Are Synthetic Requirements ? Evaluating LLM-Generated Datasets for AI4RE [0.5156484100374059]
本稿では,合成要求データを生成するための改良された製品ラインアプローチを提案する。提案する4つの研究課題は,データ品質にどのような影響を及ぼすか,また,自動的なプロンプト最適化,およびポストジェネレーションのキュレーションについて検討する。以上の結果から, 人工的な要件は, 特定のタスクにおいて, 人為的な要件と一致し, より優れる可能性が示唆された。
論文参考訳（メタデータ） (2025-06-26T10:52:07Z)
Datasheets for Healthcare AI: A Framework for Transparency and Bias Mitigation [0.0]
トレーニングデータセットにおけるバイアス、データ不完全性、不正確性は、不公平な結果をもたらし、既存の格差を増幅する。透明性を促進し,規制要件との整合性を確保するためのデータセットドキュメンテーションフレームワークを提案する。この発見は、責任あるAI開発を促進する上で、データセットドキュメンテーションの重要性を強調している。
論文参考訳（メタデータ） (2025-01-09T23:36:34Z)
From Uncertainty to Trust: Kernel Dropout for AI-Powered Medical Predictions [14.672477787408887]
信頼に値する信頼を持ったAI駆動型医療予測は、医療アプリケーションにおけるAIの責任ある使用を保証するために不可欠である。本稿では,これらの課題に対処する新しいアプローチを提案し,カーネルモデルを用いたベイジアンモンテカルロ・ドロップアウトモデルを提案する。限られたデータであっても、信頼性が大幅に向上し、AI駆動型医療予測の信頼構築に向けた有望なステップを提供します。
論文参考訳（メタデータ） (2024-04-16T11:43:26Z)
MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文参考訳（メタデータ） (2023-10-04T01:36:30Z)
Curating Naturally Adversarial Datasets for Learning-Enabled Medical Cyber-Physical Systems [5.349773727704873]
既存の研究は、入力データに知覚不能な摂動を加えて作られた合成敵の例に対する堅牢性に焦点を当てている。本研究では, モデルロバスト性を評価するために, 自然な逆例からなるデータセットをキュレートする手法を提案する。
論文参考訳（メタデータ） (2023-09-01T15:52:32Z)
Collect, Measure, Repeat: Reliability Factors for Responsible AI Data Collection [8.12993269922936]
AIのデータ収集は責任ある方法で行うべきだと我々は主張する。本稿では,データ収集をメトリクスの集合でガイドするResponsible AI(RAI)手法を提案する。
論文参考訳（メタデータ） (2023-08-22T18:01:27Z)
The Role of AI in Drug Discovery: Challenges, Opportunities, and Strategies [97.5153823429076]
この分野でのAIのメリット、課題、欠点についてレビューする。データ拡張、説明可能なAIの使用、従来の実験手法とAIの統合についても論じている。
論文参考訳（メタデータ） (2022-12-08T23:23:39Z)
ImDrug: A Benchmark for Deep Imbalanced Learning in AI-aided Drug Discovery [79.08833067391093]
現実世界の医薬品のデータセットは、しばしば高度に不均衡な分布を示す。 ImDrugはオープンソースのPythonライブラリを備えたベンチマークで、4つの不均衡設定、11のAI対応データセット、54の学習タスク、16のベースラインアルゴリズムで構成されています。ドラッグ発見パイプラインの幅広い範囲にまたがる問題やソリューションに対して、アクセス可能でカスタマイズ可能なテストベッドを提供する。
論文参考訳（メタデータ） (2022-09-16T13:35:57Z)
SAIS: Supervising and Augmenting Intermediate Steps for Document-Level Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文参考訳（メタデータ） (2021-09-24T17:37:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。