論文の概要: Trustworthiness of Laser-Induced Breakdown Spectroscopy Predictions via
Simulation-based Synthetic Data Augmentation and Multitask Learning
- arxiv url: http://arxiv.org/abs/2210.03762v1
- Date: Fri, 7 Oct 2022 18:00:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 15:51:27.141150
- Title: Trustworthiness of Laser-Induced Breakdown Spectroscopy Predictions via
Simulation-based Synthetic Data Augmentation and Multitask Learning
- Title(参考訳): シミュレーションに基づく合成データ拡張とマルチタスク学習によるレーザー誘起破壊分光予測の信頼性
- Authors: Riccardo Finotello, Daniel L'Hermite, Celine Qu\'er\'e, Benjamin
Rouge, Mohamed Tamaazousti, Jean-Baptiste Sirven
- Abstract要約: レーザ誘起分解分光法を用いてスペクトルデータの定量的解析を行う。
我々は、利用可能なトレーニングデータの小さなサイズと、未知のデータに対する推論中の予測の検証に対処する。
- 参考スコア(独自算出の注目度): 4.633997895806144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider quantitative analyses of spectral data using laser-induced
breakdown spectroscopy. We address the small size of training data available,
and the validation of the predictions during inference on unknown data. For the
purpose, we build robust calibration models using deep convolutional multitask
learning architectures to predict the concentration of the analyte, alongside
additional spectral information as auxiliary outputs. These secondary
predictions can be used to validate the trustworthiness of the model by taking
advantage of the mutual dependencies of the parameters of the multitask neural
networks. Due to the experimental lack of training samples, we introduce a
simulation-based data augmentation process to synthesise an arbitrary number of
spectra, statistically representative of the experimental data. Given the
nature of the deep learning model, no dimensionality reduction or data
selection processes are required. The procedure is an end-to-end pipeline
including the process of synthetic data augmentation, the construction of a
suitable robust, homoscedastic, deep learning model, and the validation of its
predictions. In the article, we compare the performance of the multitask model
with traditional univariate and multivariate analyses, to highlight the
separate contributions of each element introduced in the process.
- Abstract(参考訳): レーザ誘起分解分光法を用いてスペクトルデータの定量的解析を行う。
我々は、利用可能なトレーニングデータの小さなサイズと、未知のデータに対する推論中の予測の検証に対処する。
本研究では,深い畳み込み型マルチタスク学習アーキテクチャを用いたロバストキャリブレーションモデルを構築し,アナライテの濃度を予測し,補助出力としてスペクトル情報を追加する。
これらの二次予測は、マルチタスクニューラルネットワークのパラメータの相互依存性を利用して、モデルの信頼性を検証するために使うことができる。
実験サンプルの不足により,実験データに統計的に代表される任意の数のスペクトルを合成するシミュレーションベースのデータ拡張プロセスを導入する。
ディープラーニングモデルの性質を考えると、次元削減やデータ選択のプロセスは不要である。
この手順は、合成データ拡張のプロセス、適切なロバストで均質な深層学習モデルの構築、予測の検証を含むエンドツーエンドパイプラインである。
本稿では,従来の一変量解析および多変量解析とマルチタスクモデルの性能を比較し,プロセスで導入された各要素の別々の寄与を明らかにする。
関連論文リスト
- On the Diversity of Synthetic Data and its Impact on Training Large Language Models [34.00031258223175]
大規模言語モデル(LLM)は、多種多様な高品質な事前学習データの必要性を強調している。
合成データは、データの不足とアクセシビリティの課題に対する、実行可能なソリューションとして現れます。
本研究では, 事前学習および微調整段階における合成データ多様性の下流効果について検討した。
論文 参考訳(メタデータ) (2024-10-19T22:14:07Z) - LMD3: Language Model Data Density Dependence [78.76731603461832]
我々は,学習データ密度推定に基づいて,言語モデルタスクのパフォーマンスを個別の例レベルで解析する手法を開発した。
微調整データに対する制御的介入としてパラフレーズを用いた実験は、特定のテストクエリに対するトレーニング分布のサポートの増加が、測定可能な密度の増加をもたらすことを示した。
我々は,学習データのサブセットに対象モデルの予測が依存していることの統計的証拠を提供することができると結論付けた。
論文 参考訳(メタデータ) (2024-05-10T09:03:27Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Machine learning enabled experimental design and parameter estimation
for ultrafast spin dynamics [54.172707311728885]
機械学習とベイズ最適実験設計(BOED)を組み合わせた方法論を提案する。
本手法は,大規模スピンダイナミクスシミュレーションのためのニューラルネットワークモデルを用いて,BOEDの正確な分布と実用計算を行う。
数値ベンチマークでは,XPFS実験の誘導,モデルパラメータの予測,実験時間内でのより情報的な測定を行う上で,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-03T06:19:20Z) - Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty
Quantification [3.175239447683357]
本稿では、摂動支援サンプル合成(PASS)法により生成された合成データを利用した新しい摂動支援推論(PAI)フレームワークを提案する。
このフレームワークは、複雑なデータシナリオ、特に非構造化データの不確実性定量化に焦点を当てている。
我々は、画像合成、感情語分析、マルチモーダル推論、予測区間の構築など、様々な分野に適用することで、複雑なデータ駆動タスクにおける不確実性定量化を推し進める上で、PAIの有効性を実証する。
論文 参考訳(メタデータ) (2023-05-30T01:01:36Z) - Sequential Experimental Design for Spectral Measurement: Active Learning
Using a Parametric Model [1.9377646956063705]
分光測定では, 試料の脆性や高エネルギーコストのため, 測定時間を短縮する必要がある。
本研究では,パラメトリックモデルを用いた能動学習によるスペクトル測定の逐次的実験設計について述べる。
論文 参考訳(メタデータ) (2023-05-11T13:21:26Z) - Spectrum-BERT: Pre-training of Deep Bidirectional Transformers for
Spectral Classification of Chinese Liquors [0.0]
本稿では,中国酒のスペクトル分類のための双方向トランスフォーマーの事前学習手法を提案し,これをSpectrum-BERTと略した。
我々はNext Curve Prediction (NCP) と Masked Curve Model (MCM) の2つの事前学習タスクを精巧に設計し、未ラベルのサンプルを効果的に活用できるようにした。
比較実験では、提案したSpectrum-BERTは、複数のメトリクスでベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2022-10-22T13:11:25Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - A probabilistic deep learning approach to automate the interpretation of
multi-phase diffraction spectra [4.240899165468488]
シミュレーション回折スペクトルで訓練されたアンサンブル畳み込みニューラルネットワークを開発し、複素多相混合を同定する。
シミュレーションおよび実験的に測定された回折スペクトルをベンチマークし, これまでに報告した手法よりも精度が優れていることを示す。
論文 参考訳(メタデータ) (2021-03-30T20:13:01Z) - Predictive modeling approaches in laser-based material processing [59.04160452043105]
本研究の目的は,レーザー加工が材料構造に及ぼす影響を自動予測することである。
その焦点は、統計的および機械学習の代表的なアルゴリズムのパフォーマンスに焦点を当てている。
結果は、材料設計、テスト、生産コストを削減するための体系的な方法論の基礎を設定することができる。
論文 参考訳(メタデータ) (2020-06-13T17:28:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。