論文の概要: From Inference to Prediction: How Machine Learning is Reconfiguring Science (1990-2025)
- arxiv url: http://arxiv.org/abs/2606.20995v1
- Date: Fri, 19 Jun 2026 00:06:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 11:18:34.549049
- Title: From Inference to Prediction: How Machine Learning is Reconfiguring Science (1990-2025)
- Title(参考訳): 推論から予測へ:機械学習が科学を再構成する方法(1990-2025)
- Authors: Malena Mendez Isla, Vincent Lariviere, Diego Kozlowski,
- Abstract要約: OpenAlex(1990-2025)の490万の科学出版物の分析
本研究は, 物理科学を中心とした中核周辺構造が, メソジカルコアを形成し, 第一成長領域を代表する健康科学を形成していることを示す。
伝統的に解釈可能性を重視した領域における予測アーキテクチャによる推論指向手法の変位を観察する。
- 参考スコア(独自算出の注目度): 0.669087470775851
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning (ML) has reshaped scientific practice across disciplines, yet its epistemic consequences remain poorly understood. This paper analyzes how its broad diffusion reconfigures the conditions under which scientific claims are produced and evaluated. Using a hierarchical taxonomy of 255 ML techniques and embedding-based semantic mapping, we analyze 4.9 million scientific publications from OpenAlex (1990-2025). We reconstruct the semantic space of ML research and show a core-periphery structure, with physical sciences forming the methodological core and health sciences representing the primary growth area. We identify distinct methodological profiles across domains: predictive techniques concentrate in computer sciences while inferential approaches remain distributed across applied fields, reflecting historically differentiated validation regimes. We observe the displacement of inference-oriented techniques by predictive architectures in domains that have traditionally prioritized interpretability-most notably health sciences and social sciences. This displacement unfolds in two qualitatively distinct waves. The first (2015-2021) was driven by deep learning architectures that reduced predictive error while introducing epistemic opacity. The second (post 2022) is organized around a small number of architectures delivered through external companies, introducing a further layer of opacity over data and processes that researchers cannot access or report. This transformation expands the analytical capacity of science, and also reorganizes the conditions under which scientific knowledge can be produced and evaluated.
- Abstract(参考訳): 機械学習(ML)は、分野によって科学的実践を再構築してきたが、そのエピステマティックな結果はあまり理解されていない。
本稿では,その拡散が科学的クレームの生成と評価の条件をどのように再構成するかを考察する。
機械学習技術255の階層的な分類法と埋め込みに基づくセマンティックマッピングを用いて、OpenAlex (1990-2025)の490万の科学論文を分析した。
我々はML研究のセマンティックスペースを再構築し、物理科学がメソジカルコアを形成し、健康科学が一次成長領域を代表していることを示す。
予測的手法はコンピュータ科学に集中しているが、推論的アプローチは適用分野に分散し、歴史的に区別された検証体制を反映している。
我々は、伝統的に解釈可能性、特に健康科学や社会科学を優先してきた領域において、予測アーキテクチャによる推論指向の手法の変位を観察する。
この変位は2つの定性的に異なる波に展開する。
最初の(2015-2021)は、認識の不透明度を導入しながら予測エラーを減らすディープラーニングアーキテクチャによって駆動された。
第2の(ポスト2022)は、外部企業を通じて提供される少数のアーキテクチャを中心に構成されており、研究者がアクセスまたは報告できないデータやプロセスに対する不透明性のさらなるレイヤを導入している。
この変換は科学の分析能力を拡張し、科学知識を創造し評価できる条件を再編成する。
関連論文リスト
- The Biosecurity Blind Spot: Systematic Dual-use Detection in Open Science Infrastructure [0.6124773188525718]
本稿では,オープンプレプリントサーバ上でのDouble-use Research of concern(DURC)コンテンツに関する最初の体系的分析を行う。
本分析により, オープンアクセス可能なタイトルや抽象概念に, 二重利用関連知識が日常的に存在していることが明らかとなった。
機関のレビュープロセス、資金要求、および事前印刷プラットフォームポリシーは、積極的にメタデータレベルのモニタリングを組み込むために進化する必要があると我々は主張する。
論文 参考訳(メタデータ) (2026-05-10T16:17:41Z) - From Pre-trained Models to Large Language Models: A Comprehensive Survey of AI-Driven Psychological Computing [45.96605393710063]
この調査では、アプリケーションドメインではなく、計算処理パターンによってAI駆動型心理学タスクを組織化する最初の系統分類を紹介した。
本稿では,タスク固有の特徴工学から伝達学習,少数ショット適応に至るまでの計算手法について検討する。
論文 参考訳(メタデータ) (2026-03-12T04:03:27Z) - WildSci: Advancing Scientific Reasoning from In-the-Wild Literature [50.16160754134139]
我々は、ピアレビューされた文献から自動的に合成されるドメイン固有の科学質問の新しいデータセットWildSciを紹介する。
複雑な科学的推論タスクを複数選択形式でフレーミングすることにより、明確に定義された報酬信号によるスケーラブルなトレーニングを可能にする。
一連の科学的ベンチマークの実験は、我々のデータセットとアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2026-01-09T06:35:23Z) - A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - Ontology Embedding: A Survey of Methods, Applications and Resources [54.3453925775069]
オンロジはドメインの知識とメタデータを表現するために広く使われている。
直接支援できる論理的推論は、学習、近似、予測において非常に限られています。
1つの簡単な解決策は、統計分析と機械学習を統合することである。
論文 参考訳(メタデータ) (2024-06-16T14:49:19Z) - Efficient Surrogate Models for Materials Science Simulations: Machine
Learning-based Prediction of Microstructure Properties [0.0]
いくつかの機械学習アルゴリズムがこれらの科学分野に応用され、シミュレーションモデルや代理モデルを強化し、加速している。
材料科学分野の2つの異なるデータセットに基づいて,6つの機械学習技術の応用について検討する。
論文 参考訳(メタデータ) (2023-09-01T07:29:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。