論文の概要: Accurate and Data-Efficient Micro-XRD Phase Identification Using Multi-Task Learning: Application to Hydrothermal Fluids
- arxiv url: http://arxiv.org/abs/2403.10042v1
- Date: Fri, 15 Mar 2024 06:23:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-18 18:29:12.343713
- Title: Accurate and Data-Efficient Micro-XRD Phase Identification Using Multi-Task Learning: Application to Hydrothermal Fluids
- Title(参考訳): マルチタスク学習を用いた高精度・データ効率のマイクロXRD位相同定:熱水流体への応用
- Authors: Yanfei Li, Juejing Liu, Xiaodong Zhao, Wenjun Liu, Tong Geng, Ang Li, Xin Zhang,
- Abstract要約: 本研究は,制約を克服するためにマルチタスク学習アーキテクチャを用いたディープラーニングの可能性を示す。
我々はMTLモデルを訓練し、ラベル付き実験データの必要性を最小限に抑え、mu-XRDパターンの位相情報を同定した。
生および未加工のXRDパターンを解析するために調整されたMTLモデルは、前処理データの解析モデルと密な性能を達成した。
- 参考スコア(独自算出の注目度): 14.094779042554729
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional analysis of highly distorted micro-X-ray diffraction ({\mu}-XRD) patterns from hydrothermal fluid environments is a time-consuming process, often requiring substantial data preprocessing and labeled experimental data. This study demonstrates the potential of deep learning with a multitask learning (MTL) architecture to overcome these limitations. We trained MTL models to identify phase information in {\mu}-XRD patterns, minimizing the need for labeled experimental data and masking preprocessing steps. Notably, MTL models showed superior accuracy compared to binary classification CNNs. Additionally, introducing a tailored cross-entropy loss function improved MTL model performance. Most significantly, MTL models tuned to analyze raw and unmasked XRD patterns achieved close performance to models analyzing preprocessed data, with minimal accuracy differences. This work indicates that advanced deep learning architectures like MTL can automate arduous data handling tasks, streamline the analysis of distorted XRD patterns, and reduce the reliance on labor-intensive experimental datasets.
- Abstract(参考訳): 熱水環境からの高度に歪んだマイクロX線回折({\mu}-XRD)パターンの伝統的な分析は、しばしばデータ前処理とラベル付き実験データを必要とする時間を要する。
本研究では,これらの制約を克服するために,マルチタスク学習(MTL)アーキテクチャを用いたディープラーニングの可能性を示す。
我々は、MTLモデルを訓練し、ラベル付き実験データとマスキング前処理ステップの必要性を最小限に抑えながら、XRDパターンの位相情報を同定した。
特に,MTLモデルでは,バイナリ分類CNNに比べて精度が優れていた。
さらに, クロスエントロピー損失関数の導入により, MTLモデルの性能が向上した。
最も顕著なのは、生のXRDパターンと未加工のXRDパターンを解析するために調整されたMTLモデルであり、精度の差が最小限である。
この研究は、MTLのような先進的なディープラーニングアーキテクチャが、厳しいデータ処理タスクを自動化し、歪んだXRDパターンの分析を合理化し、労働集約的な実験データセットへの依存を減らすことができることを示している。
関連論文リスト
- ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - DiffPrep: Differentiable Data Preprocessing Pipeline Search for Learning
over Tabular Data [12.416345241511781]
与えられたデータセットに対するデータ前処理パイプラインを自動かつ効率的に検索するDiffPrepを提案する。
実験の結果,DiffPrepは実世界の18のデータセットのうち15の精度で最高のテスト精度を達成できた。
論文 参考訳(メタデータ) (2023-08-20T23:40:26Z) - Scaling Relationship on Learning Mathematical Reasoning with Large
Language Models [75.29595679428105]
本研究では,事前学習損失,教師付きデータ量,拡張データ量が教師付きLDMの推論性能に与える影響について検討する。
複数のモデルからの拒絶サンプルは、LLaMA-7BをGSM8Kの49.3%の精度に押し上げ、監督された微調整(SFT)の精度を35.9%上回る結果となった。
論文 参考訳(メタデータ) (2023-08-03T15:34:01Z) - Closing the loop: Autonomous experiments enabled by
machine-learning-based online data analysis in synchrotron beamline
environments [80.49514665620008]
機械学習は、大規模または高速に生成されたデータセットを含む研究を強化するために使用できる。
本研究では,X線反射法(XRR)のための閉ループワークフローへのMLの導入について述べる。
本研究では,ビームライン制御ソフトウェア環境に付加的なソフトウェア依存関係を導入することなく,実験中の基本データ解析をリアルタイムで行うソリューションを提案する。
論文 参考訳(メタデータ) (2023-06-20T21:21:19Z) - To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis [50.31589712761807]
大規模言語モデル(LLM)は、事前トレーニング中にトークンに悩まされていることで知られており、Web上の高品質なテキストデータは、LSMのスケーリング制限に近づいている。
本研究では,事前学習データの再学習の結果について検討し,モデルが過度に適合する可能性が示唆された。
第2に, マルチエポック劣化の原因となる要因について検討し, データセットのサイズ, モデルパラメータ, トレーニング目標など, 重要な要因について検討した。
論文 参考訳(メタデータ) (2023-05-22T17:02:15Z) - Machine Learning Automated Approach for Enormous Synchrotron X-Ray
Diffraction Data Interpretation [14.495959477394841]
液体相を含むその場実験において、合成XRDモデルがu-XRDマッピングデータを解くことができるかどうかは不明である。
本研究では,LaCl3-calcite熱水流体系からu-XRDマッピングデータを収集し,実験的なXRDパターンを解くために2つのモデルカテゴリーを訓練した。
論文 参考訳(メタデータ) (2023-03-20T05:47:35Z) - Trustworthiness of Laser-Induced Breakdown Spectroscopy Predictions via
Simulation-based Synthetic Data Augmentation and Multitask Learning [4.633997895806144]
レーザ誘起分解分光法を用いてスペクトルデータの定量的解析を行う。
我々は、利用可能なトレーニングデータの小さなサイズと、未知のデータに対する推論中の予測の検証に対処する。
論文 参考訳(メタデータ) (2022-10-07T18:00:09Z) - SUTD-PRCM Dataset and Neural Architecture Search Approach for Complex
Metasurface Design [0.0]
本稿では,SUTDによる複雑な地表面データセットの偏光反射について述べる。
電磁シミュレーションから生成された、およそ260,000の複雑な準曲面のサンプルを含んでいる。
メタサーフェスパターンは、異なるレベルの複雑さを促進するために、異なるクラスに分割される。
論文 参考訳(メタデータ) (2022-02-24T16:15:13Z) - Tracking perovskite crystallization via deep learning-based feature
detection on 2D X-ray scattering data [137.47124933818066]
本稿では,より高速なR-CNN深層学習アーキテクチャに基づくX線回折画像の自動解析パイプラインを提案する。
有機-無機ペロブスカイト構造の結晶化をリアルタイムに追跡し, 2つの応用で検証した。
論文 参考訳(メタデータ) (2022-02-22T15:39:00Z) - Data from Model: Extracting Data from Non-robust and Robust Models [83.60161052867534]
この研究は、データとモデルの関係を明らかにするために、モデルからデータを生成する逆プロセスについて検討する。
本稿では,データ・トゥ・モデル(DtM)とデータ・トゥ・モデル(DfM)を連続的に処理し,特徴マッピング情報の喪失について検討する。
以上の結果から,DtMとDfMの複数シーケンスの後にも,特にロバストモデルにおいて精度低下が制限されることが示唆された。
論文 参考訳(メタデータ) (2020-07-13T05:27:48Z) - Designing Accurate Emulators for Scientific Processes using
Calibration-Driven Deep Models [33.935755695805724]
Learn-by-Calibrating (LbC)は、科学応用においてエミュレータを設計するための新しいディープラーニングアプローチである。
また,LbCは広く適応された損失関数の選択に対して,一般化誤差を大幅に改善することを示した。
LbCは、小さなデータレギュレータでも高品質なエミュレータを実現し、さらに重要なことは、明確な事前条件なしで固有のノイズ構造を復元する。
論文 参考訳(メタデータ) (2020-05-05T16:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。