論文の概要: From PhysioNet to Foundation Models -- A history and potential futures
- arxiv url: http://arxiv.org/abs/2602.15371v1
- Date: Tue, 17 Feb 2026 05:53:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-18 16:03:17.988853
- Title: From PhysioNet to Foundation Models -- A history and potential futures
- Title(参考訳): PhysioNetからFoundation Modelsへ - 歴史と将来の可能性
- Authors: Gari D. Clifford,
- Abstract要約: 私は過去30年間の傾向を、心臓学の例から考察する。
コンピュータカルディロジーの初期から、複雑生理信号研究資源(PhysioNet)がこの分野の最先端にある。
PhysioNetリソースの最も有望な方向性を特定します。
- 参考スコア(独自算出の注目度): 2.959572720506218
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Over the last 35 years, the sharing of medical data and models for research has evolved from sneakernet to the internet - from mailing magnetic tapes and compact discs of a handful of well-curated recordings, to the high-speed download of relatively comprehensive hospital databases. More recently, the fervor around the potential for modern machine learning and 'AI' to catapult us into the next industrial revolution has led to a seemingly insatiable desire to pump almost any source of data into large models. Although this has great potential, it also presents a whole set of new challenges. In this article I examine these trends over the last 30 years, drawing on examples from cardiology, one of the oldest data-intensive fields that is undergoing a renaissance via machine learning. From the early days of computerized cardiology, the Research Resource for Complex Physiologic Signals (PhysioNet) has been at the cutting edge of this field. This article, therefore, includes much of the Resource's history and the contributions drawn from 25 years of firsthand experience of co-developing elements of the Resource with its founders. I identify the most promising future directions for the PhysioNet Resource, and more generally, the growing issues and opportunities around dissemination and use of massive physiological databases, associated open access code, and public competitions, along with potential solutions to the key issues facing our field. Topics range from how we should approach foundation models in the context of the rapidly growing AI carbon footprint, to the potential of Tiny-ML and edge computing. I also cover issues around prizes and incentives, funding models, and scientific repeatability, as well as how we might address these issues by leveraging the PhysioNet Challenges, consistent with the philosophy of open-access from the early days of the PhysioNet Resource.
- Abstract(参考訳): 過去35年間で、医療データと研究用のモデルを共有することは、スニーカーネットからインターネットへと進化してきた。
最近では、現代の機械学習と、次の産業革命に私たちを乗っ取ろうとする'AI'の可能性を巡って、ほぼあらゆるデータソースを大きなモデルに投入したいという切望が浮かび上がっている。
これは大きな可能性を秘めているが、同時に新しい課題の集合も提示する。
本稿では、過去30年間のこれらの傾向を、機械学習によるルネッサンスを経験している最古のデータ集約分野の一つである心臓学の例から考察する。
コンピュータカルディロジーの初期から、複雑生理信号研究資源(PhysioNet)がこの分野の最先端にある。
この記事では、リソースの歴史の多くと、その創設者とリソースの要素を共同開発する25年間の経験から得られた貢献を紹介する。
より一般的には、巨大な生理的データベース、関連するオープンアクセスコード、パブリックコンペティションの拡散と利用に関する問題と機会が、私たちの分野に直面する重要な問題に対する潜在的な解決策とともに、最も有望なPhysioNet Resourceの方向性を特定します。
トピックは、急速に成長するAIカーボンフットプリントの文脈における基盤モデルへのアプローチ方法から、Tiny-MLとエッジコンピューティングの可能性までさまざまです。
また、賞品やインセンティブ、資金調達モデル、科学的再現性に関する問題や、PhystoNet Challengesを活用することで、PhystoNet Resourceの初期からのオープンアクセスの哲学と整合して、これらの問題にどのように対処するかについても取り上げています。
関連論文リスト
- Training Data Governance for Brain Foundation Models [0.0]
本稿では,ニューラルデータに基づく基礎学習モデルが新たな規範領域を開くことを主張する。
まず、脳基礎モデルの技術的基盤とトレーニングデータエコシステムについて説明する。
そして、プライバシ、同意、偏見、利益共有、ガバナンスに関する懸念を整理するために、AI倫理、神経倫理、生物倫理を描きます。
論文 参考訳(メタデータ) (2026-01-23T02:15:58Z) - Flow Matching Meets Biology and Life Science: A Survey [65.2146737141455]
拡散に基づく生成モデリングの強力な代替手段としてフローマッチングが登場した。
本稿では,フローマッチングの最近の進歩とその生物学的領域への応用に関する包括的調査について述べる。
論文 参考訳(メタデータ) (2025-07-23T17:44:29Z) - A Large-Scale Vision-Language Dataset Derived from Open Scientific Literature to Advance Biomedical Generalist AI [70.06771291117965]
PubMed Central Open Accessサブセットから派生したオープンソースのデータセットであるBiomedicaを紹介する。
Biomedicaには600万以上の科学論文と2400万の画像テキストペアが含まれている。
私たちは、Webサーバを通じてスケーラブルなストリーミングと検索APIを提供し、AIシステムとのシームレスな統合を容易にします。
論文 参考訳(メタデータ) (2025-03-26T05:56:46Z) - Biomedical Foundation Model: A Survey [84.26268124754792]
ファンデーションモデルは、広範なラベルなしデータセットから学習する大規模な事前訓練モデルである。
これらのモデルは、質問応答や視覚的理解といった様々な応用に適応することができる。
本研究は,生物医学分野における基礎モデルの可能性を探るものである。
論文 参考訳(メタデータ) (2025-03-03T22:42:00Z) - BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature [73.39593644054865]
BIOMEDICAはスケーラブルでオープンソースのフレームワークで、PubMed Central Open Accessサブセット全体を抽出、注釈付け、シリアライズして、使いやすく、公開可能なデータセットにする。
われわれのフレームワークは600万以上の記事から2400万以上のユニークな画像テキストペアで包括的なアーカイブを生成する。
BMCA-CLIPは、ストリーミングを通じてBIOMEDICAデータセット上で継続的に事前トレーニングされたCLIPスタイルのモデルのスイートで、27TBのデータをローカルにダウンロードする必要がなくなる。
論文 参考訳(メタデータ) (2025-01-13T09:58:03Z) - A Bibliometric Review of Neuromorphic Computing and Spiking Neural
Networks [27.535725907849216]
スパイクニューラルネットワークは 人工知能を進化させる可能性を秘めている
ニューロモルフィックコンピューティングハードウェアは、実験室のプロトタイプデバイスから商用チップセットへと移行しつつある。
生物、計算、物質科学のネクサスとして、これらの概念を取り巻く文献は広大なものである。
論文 参考訳(メタデータ) (2023-04-14T02:14:38Z) - Large AI Models in Health Informatics: Applications, Challenges, and the
Future [31.66920436409032]
大規模なAIモデル、あるいは基礎モデル(ファウンデーションモデル)は、パラメータワイドとデータワイドの両方で大規模に出現するモデルである。
ChatGPTは、大きなAIモデルが持つ影響に対する人々の想像力を押し付けました。
健康情報学において、大規模AIモデルの出現は方法論の設計に新たなパラダイムをもたらした。
論文 参考訳(メタデータ) (2023-03-21T03:28:33Z) - Federated Learning for Medical Applications: A Taxonomy, Current Trends,
Challenges, and Future Research Directions [9.662980267339375]
我々は, acFLの医学的応用, 特にグローバル癌診断の文脈に焦点をあてる。
acFLの最近の発展により、複雑な機械学習モデルを分散的に訓練することが可能になった。
論文 参考訳(メタデータ) (2022-08-05T21:41:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。