論文の概要: Scaling Law of Sim2Real Transfer Learning in Expanding Computational Materials Databases for Real-World Predictions
- arxiv url: http://arxiv.org/abs/2408.04042v1
- Date: Wed, 7 Aug 2024 18:47:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-09 17:29:51.377015
- Title: Scaling Law of Sim2Real Transfer Learning in Expanding Computational Materials Databases for Real-World Predictions
- Title(参考訳): 実世界予測のための計算教材データベースの拡張におけるSim2Real Transfer Learningのスケーリング法則
- Authors: Shunya Minami, Yoshihiro Hayashi, Stephen Wu, Kenji Fukumizu, Hiroki Sugisawa, Masashi Ishii, Isao Kuwajima, Kazuya Shiratori, Ryo Yoshida,
- Abstract要約: 計算データベース上で事前訓練された予測器を実システムに微調整すると、優れた一般化能力を持つモデルが得られる。
本研究では,物質科学における複数の機械学習タスクに対するシミュレーション・トゥ・リアル(Sim2Real)変換学習のスケーリング則を実証する。
- 参考スコア(独自算出の注目度): 13.20562263181952
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To address the challenge of limited experimental materials data, extensive physical property databases are being developed based on high-throughput computational experiments, such as molecular dynamics simulations. Previous studies have shown that fine-tuning a predictor pretrained on a computational database to a real system can result in models with outstanding generalization capabilities compared to learning from scratch. This study demonstrates the scaling law of simulation-to-real (Sim2Real) transfer learning for several machine learning tasks in materials science. Case studies of three prediction tasks for polymers and inorganic materials reveal that the prediction error on real systems decreases according to a power-law as the size of the computational data increases. Observing the scaling behavior offers various insights for database development, such as determining the sample size necessary to achieve a desired performance, identifying equivalent sample sizes for physical and computational experiments, and guiding the design of data production protocols for downstream real-world tasks.
- Abstract(参考訳): 限られた実験材料データの課題に対処するため、分子動力学シミュレーションのような高スループットの計算実験に基づいて、広範な物理特性データベースが開発されている。
従来の研究では、計算データベースで事前訓練された予測器を実システムに微調整することで、スクラッチから学習するよりも優れた一般化能力を持つモデルが得られることが示されている。
本研究では,物質科学における複数の機械学習タスクに対するシミュレーション・トゥ・リアル(Sim2Real)変換学習のスケーリング則を実証する。
高分子および無機材料の3つの予測タスクのケーススタディでは、計算データのサイズが大きくなるにつれて、実システムの予測誤差がパワーローに従って減少することが明らかになった。
スケーリング動作の観察は、所望のパフォーマンスを達成するために必要なサンプルサイズを決定すること、物理および計算実験に相当するサンプルサイズを特定すること、下流の現実世界のタスクのためのデータ生産プロトコルの設計を導くことなど、データベース開発に様々な洞察を与える。
関連論文リスト
- Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Addressing computational challenges in physical system simulations with
machine learning [0.0]
シミュレーションを利用して様々な物理システムやプロセスを調べる研究者を支援する機械学習ベースのデータジェネレータフレームワークを提案する。
まず、シミュレーション結果を予測するために、限られたシミュレートされたデータセットを使用して教師付き予測モデルをトレーニングする。
その後、強化学習エージェントを訓練し、教師付きモデルを利用して正確なシミュレーションライクなデータを生成する。
論文 参考訳(メタデータ) (2023-05-16T17:31:50Z) - An Adversarial Active Sampling-based Data Augmentation Framework for
Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。
機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。
本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-27T20:53:39Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - Physical Systems Modeled Without Physical Laws [0.0]
ツリーベースの機械学習手法は、シミュレーションに関わる複雑なバックを「知る」ことなく、望ましい出力をエミュレートすることができる。
具体的には、2つのシミュレーション出力間の特定の時空間データの予測と、数値計算を繰り返す計算コストを伴わずに、物理予測の一般化に焦点をあてる。
論文 参考訳(メタデータ) (2022-07-26T20:51:20Z) - A Scaling Law for Synthetic-to-Real Transfer: A Measure of Pre-Training [52.93808218720784]
合成から現実への変換学習は,実タスクのための合成画像と接地真実アノテーションを用いた事前学習を行うフレームワークである。
合成画像はデータの不足を克服するが、事前訓練されたモデルで微調整性能がどのようにスケールするかは定かではない。
我々は、合成事前学習データの様々なタスク、モデル、複雑さにおける学習曲線を一貫して記述する、単純で一般的なスケーリング法則を観察する。
論文 参考訳(メタデータ) (2021-08-25T02:29:28Z) - Cognitive simulation models for inertial confinement fusion: Combining
simulation and experimental data [0.0]
研究者は、高性能な爆発を求めて設計空間を探索するためにコンピュータシミュレーションに大きく依存しています。
より効果的な設計と調査のために、シミュレーションは過去の実験データからの入力を必要とする。
本稿では,シミュレーションと実験データを共通の予測モデルに組み合わせた認知シミュレーション手法について述べる。
論文 参考訳(メタデータ) (2021-03-19T02:00:14Z) - Integrating Machine Learning with HPC-driven Simulations for Enhanced
Student Learning [0.0]
シミュレーション出力を生成するためのHPC駆動型シミュレーションとMLサロゲート手法の両方をサポートするWebアプリケーションを開発した。
授業内フィードバックと調査を通じて評価した結果,ML強化ツールは動的かつ応答性のあるシミュレーション環境を提供することがわかった。
論文 参考訳(メタデータ) (2020-08-24T22:48:21Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z) - Improving neural network predictions of material properties with limited
data using transfer learning [3.2851683371946754]
我々は,abinitioシミュレーションから物質特性の予測を高速化する新しい伝達学習アルゴリズムを開発した。
伝達学習は、物質科学以外の応用におけるデータ効率のモデリングに成功している。
論文 参考訳(メタデータ) (2020-06-29T22:34:30Z) - Predictive modeling approaches in laser-based material processing [59.04160452043105]
本研究の目的は,レーザー加工が材料構造に及ぼす影響を自動予測することである。
その焦点は、統計的および機械学習の代表的なアルゴリズムのパフォーマンスに焦点を当てている。
結果は、材料設計、テスト、生産コストを削減するための体系的な方法論の基礎を設定することができる。
論文 参考訳(メタデータ) (2020-06-13T17:28:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。