論文の概要: Understanding Biology in the Age of Artificial Intelligence
- arxiv url: http://arxiv.org/abs/2403.04106v1
- Date: Wed, 6 Mar 2024 23:20:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 15:43:40.164493
- Title: Understanding Biology in the Age of Artificial Intelligence
- Title(参考訳): 人工知能時代における生物学の理解
- Authors: Elsa Lawrence, Adham El-Shazly, Srijit Seal, Chaitanya K Joshi, Pietro
Li\`o, Shantanu Singh, Andreas Bender, Pietro Sormanni, Matthew Greenig
- Abstract要約: 現代生命科学の研究は、生物システムをモデル化するための人工知能のアプローチにますます依存している。
機械学習(ML)モデルは、大規模で複雑なデータセットのパターンを特定するのに有用であるが、生物学におけるその広範な応用は、従来の科学的調査方法から大きく逸脱している。
ここでは,生物現象をモデル化し,科学的知識を進化させるために,MLシステムの設計と応用を導く一般的な原理を同定する。
- 参考スコア(独自算出の注目度): 4.299566787216408
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern life sciences research is increasingly relying on artificial
intelligence approaches to model biological systems, primarily centered around
the use of machine learning (ML) models. Although ML is undeniably useful for
identifying patterns in large, complex data sets, its widespread application in
biological sciences represents a significant deviation from traditional methods
of scientific inquiry. As such, the interplay between these models and
scientific understanding in biology is a topic with important implications for
the future of scientific research, yet it is a subject that has received little
attention. Here, we draw from an epistemological toolkit to contextualize
recent applications of ML in biological sciences under modern philosophical
theories of understanding, identifying general principles that can guide the
design and application of ML systems to model biological phenomena and advance
scientific knowledge. We propose that conceptions of scientific understanding
as information compression, qualitative intelligibility, and dependency
relation modelling provide a useful framework for interpreting ML-mediated
understanding of biological systems. Through a detailed analysis of two key
application areas of ML in modern biological research - protein structure
prediction and single cell RNA-sequencing - we explore how these features have
thus far enabled ML systems to advance scientific understanding of their target
phenomena, how they may guide the development of future ML models, and the key
obstacles that remain in preventing ML from achieving its potential as a tool
for biological discovery. Consideration of the epistemological features of ML
applications in biology will improve the prospects of these methods to solve
important problems and advance scientific understanding of living systems.
- Abstract(参考訳): 現代の生命科学の研究は、主に機械学習(ML)モデルの使用を中心に、生物システムをモデル化するための人工知能アプローチにますます依存している。
mlは大規模で複雑なデータセットのパターンを特定するのに非常に有用であるが、その生物科学における広範な応用は、従来の科学的探究方法から著しく逸脱している。
このように、これらのモデルと生物学における科学的理解の間の相互作用は、科学研究の将来に重要な意味を持つトピックであるが、ほとんど注目を集めていない主題である。
本稿では,生物科学におけるMLの最近の応用を,現代哲学的理解理論の下で文脈化するための認識論的ツールキットから,生物学的現象をモデル化し,科学的知識を前進させるMLシステムの設計と応用を導く一般的な原理を同定する。
本稿では,情報圧縮・質的知性・依存関係モデルとしての科学的理解の概念が,MLによる生物学的システム理解の解釈に有用であることを示す。
現代の生物学的研究におけるMLの2つの重要な応用領域(タンパク質構造予測と単細胞RNAシークエンシング)の詳細な分析を通じて、これらの特徴により、MLシステムが対象とする現象の科学的理解をいかに進めるか、将来のMLモデルの開発をどう導くか、そしてMLが生物学的発見のツールとしての可能性を達成できないための重要な障害について検討する。
生物学におけるML応用の認識学的特徴を考えると,これらの手法が重要な課題を解決し,生体システムの科学的理解を深める可能性が改善される。
関連論文リスト
- Scientific Machine Learning Seismology [0.0]
科学機械学習(SciML)は、機械学習、特にディープラーニングと物理理論を統合し、複雑な自然現象を理解し予測する学際的な研究分野である。
PINNとニューラル演算子(NO)はSciMLの2つの一般的な方法である。
PINNの使用は、微分方程式の同時解、未決定系の推論、物理学に基づく正規化などの分野に拡大している。
論文 参考訳(メタデータ) (2024-09-27T02:27:42Z) - LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery [141.39722070734737]
本稿では,大規模言語モデルの知識駆動型抽象推論能力をシミュレーションの計算力で強化することを提案する。
本稿では,2段階最適化フレームワークであるSGA(Scientific Generative Agent)を紹介する。
法発見と分子設計における枠組みの有効性を実証するための実験を行った。
論文 参考訳(メタデータ) (2024-05-16T03:04:10Z) - Opportunities for machine learning in scientific discovery [16.526872562935463]
我々は、科学コミュニティが科学的な発見を達成するために機械学習技術をどのように活用できるかをレビューする。
課題は残るが、MLの原則的利用は基本的な科学的発見のための新たな道を開く。
論文 参考訳(メタデータ) (2024-05-07T09:58:02Z) - Knowledge-guided Machine Learning: Current Trends and Future Prospects [14.783972088722193]
また、科学知識誘導機械学習(KGML)の新興分野の研究の現状についても紹介している。
我々は、KGML研究のさまざまな側面について、使用する科学知識の種類、知識-機械学習統合の形式、そして、科学知識をMLに組み込む方法について論じる。
論文 参考訳(メタデータ) (2024-03-24T02:54:46Z) - Progress and Opportunities of Foundation Models in Bioinformatics [77.74411726471439]
基礎モデル(FM)は、特に深層学習の領域において、計算生物学の新しい時代に定着した。
我々の焦点は、特定の生物学的問題にFMを応用することであり、研究ニーズに適切なFMを選択するために研究コミュニティを指導することを目的としています。
データノイズ、モデル説明可能性、潜在的なバイアスなど、生物学においてFMが直面する課題と限界を分析します。
論文 参考訳(メタデータ) (2024-02-06T02:29:17Z) - Diverse Explanations From Data-Driven and Domain-Driven Perspectives in the Physical Sciences [4.442043151145212]
このパースペクティブは、物理科学における機械学習応用における多様な説明の源泉と意味を探求する。
モデル, 説明方法, 特徴属性レベル, 利害関係者のニーズが, ML出力の様々な解釈をもたらすかを検討する。
我々の分析は、科学的な文脈でMLモデルを解釈する際に、複数の視点を考慮することの重要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-02-01T05:28:28Z) - Scientific Large Language Models: A Survey on Biological & Chemical Domains [47.97810890521825]
大規模言語モデル(LLM)は、自然言語理解の強化において、変革的な力として現れてきた。
LLMの応用は従来の言語境界を超えて、様々な科学分野で開発された専門的な言語システムを含んでいる。
AI for Science(AI for Science)のコミュニティで急成長している分野として、科学LLMは包括的な探査を義務付けている。
論文 参考訳(メタデータ) (2024-01-26T05:33:34Z) - ProBio: A Protocol-guided Multimodal Dataset for Molecular Biology Lab [67.24684071577211]
研究結果を複製するという課題は、分子生物学の分野に重大な障害をもたらしている。
まず、この目的に向けた最初のステップとして、ProBioという名前の包括的なマルチモーダルデータセットをキュレートする。
次に、透明なソリューショントラッキングとマルチモーダルなアクション認識という2つの挑戦的なベンチマークを考案し、BioLab設定におけるアクティビティ理解に関連する特徴と難しさを強調した。
論文 参考訳(メタデータ) (2023-11-01T14:44:01Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Machine Learning in Nano-Scale Biomedical Engineering [77.75587007080894]
ナノスケールバイオメディカルエンジニアリングにおける機械学習の利用に関する既存の研究について概説する。
ML問題として定式化できる主な課題は、3つの主要なカテゴリに分類される。
提示された方法論のそれぞれについて、その原則、応用、制限に特に重点を置いている。
論文 参考訳(メタデータ) (2020-08-05T15:45:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。