論文の概要: Is machine learning good or bad for the natural sciences?
- arxiv url: http://arxiv.org/abs/2405.18095v2
- Date: Fri, 31 May 2024 22:28:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-04 11:33:55.629990
- Title: Is machine learning good or bad for the natural sciences?
- Title(参考訳): 機械学習は自然科学にとって良いのか悪いのか?
- Authors: David W. Hogg, Soledad Villar,
- Abstract要約: MLの導入によって、強い、望ましくない統計バイアスがもたらされる状況が示されている。
例えば、MLモデルを用いて物理(または第一原理)シミュレーションをエミュレートすると、検証バイアスが増幅される。
別の例として、データセットのラベル付けに表現的回帰を使用する場合、これらのラベルは下流のバイアスを取らなければ使用できない。
- 参考スコア(独自算出の注目度): 7.41244589428771
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning (ML) methods are having a huge impact across all of the sciences. However, ML has a strong ontology - in which only the data exist - and a strong epistemology - in which a model is considered good if it performs well on held-out training data. These philosophies are in strong conflict with both standard practices and key philosophies in the natural sciences. Here we identify some locations for ML in the natural sciences at which the ontology and epistemology are valuable. For example, when an expressive machine learning model is used in a causal inference to represent the effects of confounders, such as foregrounds, backgrounds, or instrument calibration parameters, the model capacity and loose philosophy of ML can make the results more trustworthy. We also show that there are contexts in which the introduction of ML introduces strong, unwanted statistical biases. For one, when ML models are used to emulate physical (or first-principles) simulations, they amplify confirmation biases. For another, when expressive regressions are used to label datasets, those labels cannot be used in downstream joint or ensemble analyses without taking on uncontrolled biases. The question in the title is being asked of all of the natural sciences; that is, we are calling on the scientific communities to take a step back and consider the role and value of ML in their fields; the (partial) answers we give here come from the particular perspective of physics.
- Abstract(参考訳): 機械学習(ML)メソッドは、すべての科学に大きく影響しています。
しかし、MLには強力なオントロジー(データのみが存在する)と強力な認識論(モデルが保持されたトレーニングデータでうまく機能していると判断される)がある。
これらの哲学は、標準的な実践と自然科学における重要な哲学の両方と強く対立している。
ここでは、オントロジーと認識学が貴重である自然科学におけるMLのいくつかの場所を特定する。
例えば、前景や背景、楽器の校正パラメータといった共同創設者の影響を表現するために、表現力のある機械学習モデルが因果推論で使用される場合、モデルのキャパシティとMLの緩やかな哲学は、結果をより信頼できるものにします。
また、MLの導入が強い、望ましくない統計バイアスをもたらす状況があることも示している。
例えば、MLモデルを用いて物理(または第一原理)シミュレーションをエミュレートすると、検証バイアスが増幅される。
別の例として、データセットのラベル付けに表現的回帰を用いる場合、制御不能なバイアスを考慮せずに下流のジョイントやアンサンブル分析では、これらのラベルは使用できない。
このタイトルの問題は、すべての自然科学から求められている。つまり、我々は科学コミュニティに対して、その分野におけるMLの役割と価値について、一歩後退するよう呼びかけている。
関連論文リスト
- Scientific Machine Learning Seismology [0.0]
科学機械学習(SciML)は、機械学習、特にディープラーニングと物理理論を統合し、複雑な自然現象を理解し予測する学際的な研究分野である。
PINNとニューラル演算子(NO)はSciMLの2つの一般的な方法である。
PINNの使用は、微分方程式の同時解、未決定系の推論、物理学に基づく正規化などの分野に拡大している。
論文 参考訳(メタデータ) (2024-09-27T02:27:42Z) - Machine Learning and Theory Ladenness -- A Phenomenological Account [44.99833362998488]
両者の立場は単純すぎるし、MLメソッドとドメイン理論間の相互作用の理解を前進させるものではない、と我々は主張する。
分析の結果、モデルの構築はドメイン理論とは比較的独立しているが、特定のドメイン内でのモデルの実装と解釈は、基本的な理論的仮定と背景知識に依存していることが明らかとなった。
論文 参考訳(メタデータ) (2024-09-17T15:29:14Z) - A Dynamic Model of Performative Human-ML Collaboration: Theory and Empirical Evidence [2.498836880652668]
本稿では,人間-機械学習協調システムにおける機械学習モデルの展開を考えるための新しい枠組みを提案する。
このフレームワークでは、MLレコメンデーションの導入によって、人間の意思決定のデータ生成プロセスが変化します。
多くのレベルのMLパフォーマンスにおいて、人間はML予測を改善することができる。
論文 参考訳(メタデータ) (2024-05-22T15:38:30Z) - AI Model Disgorgement: Methods and Choices [127.54319351058167]
本稿では,現代の機械学習システムに適用可能な分類法を紹介する。
学習モデルにおけるデータ「効果の除去」の意味を,スクラッチからリトレーニングする必要のない方法で検討する。
論文 参考訳(メタデータ) (2023-04-07T08:50:18Z) - Constructing Effective Machine Learning Models for the Sciences: A
Multidisciplinary Perspective [77.53142165205281]
線形回帰モデルに変数間の変換や相互作用を手動で追加することで、非線形解が必ずしも改善されないことを示す。
データ駆動モデルを構築する前にこれを認識する方法や、そのような分析が本質的に解釈可能な回帰モデルへの移行にどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2022-11-21T17:48:44Z) - Learning Physical Dynamics with Subequivariant Graph Neural Networks [99.41677381754678]
グラフニューラルネットワーク(GNN)は、物理力学を学習するための一般的なツールとなっている。
物理法則は、モデル一般化に必須な帰納バイアスである対称性に従属する。
本モデルは,RigidFall上でのPhysylonと2倍低ロールアウトMSEの8つのシナリオにおいて,平均3%以上の接触予測精度の向上を実現している。
論文 参考訳(メタデータ) (2022-10-13T10:00:30Z) - The Need for Interpretable Features: Motivation and Taxonomy [69.07189753428553]
我々は、「解釈可能な特徴」という用語は、機械学習の説明の有用性に影響を与える機能の全範囲を捉えるのに十分な具体的あるいは詳細ではないと主張している。
本稿では,(1)解釈可能な機能空間と呼ぶもの,あるいはドメインの専門家が現実の行動を取る上で有用な機能の現状に,より注意を払わなければならない,という3つの重要な教訓を論じる。
論文 参考訳(メタデータ) (2022-02-23T19:19:14Z) - A Review of Physics-based Machine Learning in Civil Engineering [0.0]
機械学習(ML)は多くの分野に適用可能な重要なツールである。
研究室でシミュレートされた土木工学アプリケーションのためのMLは、現実世界のテストでは失敗することが多い。
本稿では,物理に基づくMLの歴史と土木工学への応用について概説する。
論文 参考訳(メタデータ) (2021-10-09T15:50:21Z) - Insights into Performance Fitness and Error Metrics for Machine Learning [1.827510863075184]
機械学習(ML)は、高いレベルの認知を達成し、人間のような分析を行うための訓練機械の分野である。
本稿では、回帰アルゴリズムや分類アルゴリズムにおいて、最もよく使われている性能適合度と誤差の測定値について検討する。
論文 参考訳(メタデータ) (2020-05-17T22:59:04Z) - An Information-Theoretic Approach to Personalized Explainable Machine
Learning [92.53970625312665]
本稿では,予測とユーザ知識のための簡易確率モデルを提案する。
説明と予測の間の条件付き相互情報による説明の効果を定量化する。
論文 参考訳(メタデータ) (2020-03-01T13:06:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。