論文の概要: A simulation-based training framework for machine-learning applications in ARPES
- arxiv url: http://arxiv.org/abs/2508.15983v1
- Date: Thu, 21 Aug 2025 21:59:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.197485
- Title: A simulation-based training framework for machine-learning applications in ARPES
- Title(参考訳): ARPESにおける機械学習アプリケーションのためのシミュレーションベースのトレーニングフレームワーク
- Authors: MengXing Na, Chris Zhou, Sydney K. Y. Dufresne, Matteo Michiardi, Andrea Damascelli,
- Abstract要約: 我々は、機械学習モデルのトレーニングに必要な大規模なデータセットを生成するために、オープンソースの合成ARPESスペクトルシミュレーター、aureliaを導入する。
シミュレーション訓練したモデルと実際の実験データとをベンチマークし、人間の分析よりも正確なスペクトル品質を評価できることを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, angle-resolved photoemission spectroscopy (ARPES) has advanced significantly in its ability to probe more observables and simultaneously generate multi-dimensional datasets. These advances present new challenges in data acquisition, processing, and analysis. Machine learning (ML) models can drastically reduce the workload of experimentalists; however, the lack of training data for ML -- and in particular deep learning -- is a significant obstacle. In this work, we introduce an open-source synthetic ARPES spectra simulator - aurelia - for the purpose of generating the large datasets necessary to train ML models. As a demonstration, we train a convolutional neural network to evaluate ARPES spectra quality -- a critical task performed during the initial sample alignment phase of the experiment. We benchmark the simulation-trained model against actual experimental data and find that it can assess the spectra quality more accurately than human analysis, and swiftly identify the optimal measurement region with high precision. Thus, we establish that simulated ARPES spectra can be an effective proxy for experimental spectra in training ML models.
- Abstract(参考訳): 近年、角度分解型光電子分光法(ARPES)は、より観測可能な天体を探索し、同時に多次元のデータセットを生成する能力において著しく進歩している。
これらの進歩は、データ取得、処理、分析における新しい課題を提示している。
機械学習(ML)モデルは、実験者の作業量を劇的に削減することができるが、MLのためのトレーニングデータ(特にディープラーニング)の欠如は、大きな障害である。
本研究では,MLモデルのトレーニングに必要な大規模なデータセットを生成するために,オープンソースの合成ARPESスペクトルシミュレータであるaureliaを導入する。
デモでは、畳み込みニューラルネットワークをトレーニングして、ARPESスペクトルの品質を評価する -- 実験の最初のサンプルアライメントフェーズで実行される重要なタスクである。
シミュレーション訓練したモデルと実際の実験データとをベンチマークし、人間の分析よりも正確なスペクトル品質を評価できることを確認し、高精度に最適な測定領域を迅速に同定する。
そこで我々は,シミュレーションARPESスペクトルがMLモデルのトレーニングにおいて,実験スペクトルの効果的なプロキシとなることを証明した。
関連論文リスト
- Stellar parameter prediction and spectral simulation using machine learning [0.0]
本研究では,ESOの高精度放射速度惑星探索装置(HARPS)のデータ履歴全体に対して機械学習を適用した。
我々は、スペクトルパラメータを予測しスペクトルを生成するために、HARPSデータ上で標準および変分オートエンコーダを訓練した。
提案モデルでは, スペクトルパラメータの予測と実スペクトルの圧縮に優れ, 有効温度に対して約50Kの予測誤差を達成した。
論文 参考訳(メタデータ) (2024-12-12T07:09:42Z) - Enhancing radioisotope identification in gamma spectra via supervised domain adaptation [0.0]
本研究では, 教師付き領域適応手法がラジオアイソトープ識別モデルを改善する方法について検討した。
まず、合成ソースドメインのデータを用いて放射性同位元素の同定モデルを事前訓練し、新しいターゲットドメインに対して微調整する。
解析の結果、微調整モデルの方が、ソースドメインデータやターゲットドメインデータのみにのみトレーニングされたモデルよりも大幅に優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-12-10T00:21:00Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Closing the loop: Autonomous experiments enabled by
machine-learning-based online data analysis in synchrotron beamline
environments [80.49514665620008]
機械学習は、大規模または高速に生成されたデータセットを含む研究を強化するために使用できる。
本研究では,X線反射法(XRR)のための閉ループワークフローへのMLの導入について述べる。
本研究では,ビームライン制御ソフトウェア環境に付加的なソフトウェア依存関係を導入することなく,実験中の基本データ解析をリアルタイムで行うソリューションを提案する。
論文 参考訳(メタデータ) (2023-06-20T21:21:19Z) - Machine learning enabled experimental design and parameter estimation
for ultrafast spin dynamics [54.172707311728885]
機械学習とベイズ最適実験設計(BOED)を組み合わせた方法論を提案する。
本手法は,大規模スピンダイナミクスシミュレーションのためのニューラルネットワークモデルを用いて,BOEDの正確な分布と実用計算を行う。
数値ベンチマークでは,XPFS実験の誘導,モデルパラメータの予測,実験時間内でのより情報的な測定を行う上で,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-03T06:19:20Z) - To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis [50.31589712761807]
大規模言語モデル(LLM)は、事前トレーニング中にトークンに悩まされていることで知られており、Web上の高品質なテキストデータは、LSMのスケーリング制限に近づいている。
本研究では,事前学習データの再学習の結果について検討し,モデルが過度に適合する可能性が示唆された。
第2に, マルチエポック劣化の原因となる要因について検討し, データセットのサイズ, モデルパラメータ, トレーニング目標など, 重要な要因について検討した。
論文 参考訳(メタデータ) (2023-05-22T17:02:15Z) - Trustworthiness of Laser-Induced Breakdown Spectroscopy Predictions via
Simulation-based Synthetic Data Augmentation and Multitask Learning [4.633997895806144]
レーザ誘起分解分光法を用いてスペクトルデータの定量的解析を行う。
我々は、利用可能なトレーニングデータの小さなサイズと、未知のデータに対する推論中の予測の検証に対処する。
論文 参考訳(メタデータ) (2022-10-07T18:00:09Z) - Cognitive simulation models for inertial confinement fusion: Combining
simulation and experimental data [0.0]
研究者は、高性能な爆発を求めて設計空間を探索するためにコンピュータシミュレーションに大きく依存しています。
より効果的な設計と調査のために、シミュレーションは過去の実験データからの入力を必要とする。
本稿では,シミュレーションと実験データを共通の予測モデルに組み合わせた認知シミュレーション手法について述べる。
論文 参考訳(メタデータ) (2021-03-19T02:00:14Z) - Learning summary features of time series for likelihood free inference [93.08098361687722]
時系列データから要約機能を自動的に学習するためのデータ駆動型戦略を提案する。
以上の結果から,データから要約的特徴を学習することで,手作りの値に基づいてLFI手法よりも優れる可能性が示唆された。
論文 参考訳(メタデータ) (2020-12-04T19:21:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。