論文の概要: MAX: Masked Autoencoder for X-ray Fluorescence in Geological Investigation
- arxiv url: http://arxiv.org/abs/2410.12330v1
- Date: Wed, 16 Oct 2024 07:52:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-17 13:41:42.826366
- Title: MAX: Masked Autoencoder for X-ray Fluorescence in Geological Investigation
- Title(参考訳): MAX: 地質調査におけるX線蛍光のためのマスク付きオートエンコーダ
- Authors: An-Sheng Lee, Yu-Wen Pao, Hsuan-Tien Lin, Sofia Ya Hsuan Liou,
- Abstract要約: 本稿では,XRFスペクトル(MAX)にマスク付き自己教師付きオートエンコーダを導入し,基礎モデルの事前学習を行う。
入力スペクトルの高い割合(50%)をマスキングすると、非自明で有意義な自己監督タスクが生じる。
その結果、MAXはデータの3分の1しか必要とせず、量子化精度の点で事前学習なしでモデルより優れていることがわかった。
- 参考スコア(独自算出の注目度): 7.777211995715721
- License:
- Abstract: Pre-training foundation models has become the de-facto procedure for deep learning approaches, yet its application remains limited in the geological studies, where in needs of the model transferability to break the shackle of data scarcity. Here we target on the X-ray fluorescence (XRF) scanning data, a standard high-resolution measurement in extensive scientific drilling projects. We propose a scalable self-supervised learner, masked autoencoders on XRF spectra (MAX), to pre-train a foundation model covering geological records from multiple regions of the Pacific and Southern Ocean. In pre-training, we find that masking a high proportion of the input spectrum (50\%) yields a nontrivial and meaningful self-supervisory task. For downstream tasks, we select the quantification of XRF spectra into two costly geochemical measurements, CaCO$_3$ and total organic carbon, due to their importance in understanding the paleo-oceanic carbon system. Our results show that MAX, requiring only one-third of the data, outperforms models without pre-training in terms of quantification accuracy. Additionally, the model's generalizability improves by more than 60\% in zero-shot tests on new materials, with explainability further ensuring its robustness. Thus, our approach offers a promising pathway to overcome data scarcity in geological discovery by leveraging the self-supervised foundation model and fast-acquired XRF scanning data.
- Abstract(参考訳): 事前学習基礎モデルは深層学習手法のデファクト・プロシージャとなっているが、その応用は地質学的研究に限られており、データ不足の欠如を打破するためのモデル転送性の必要性がある。
ここでは,X線蛍光(XRF)走査データを対象として,広範囲な科学掘削プロジェクトにおける標準高分解能測定を行った。
我々は,太平洋と南洋の複数の地域の地質記録を網羅する基礎モデルを構築するために,XRFスペクトル(MAX)を用いたスケーラブルな自己教師型オートエンコーダを提案する。
事前学習では、入力スペクトルの高い割合(50 %)をマスキングすると、非自明で有意義な自己監督タスクが生じる。
下流タスクでは,古海洋炭素系を理解することの重要性から,XRFスペクトルを2つの高価な地球化学的指標であるCaCO$_3$と全有機炭素に定量化する。
その結果,データの3分の1しか必要としないMAXは,定量化精度の点で事前学習を行わないモデルより優れていることがわかった。
さらに、新しい材料のゼロショット試験において、モデルの一般化性は60%以上向上し、その堅牢性をさらに確実にする。
そこで本手法は, 自己監督基盤モデルと高速取得XRFスキャンデータを活用することにより, 地質学的発見におけるデータ不足を克服する, 有望な経路を提供する。
関連論文リスト
- MA^2: A Self-Supervised and Motion Augmenting Autoencoder for Gait-Based Automatic Disease Detection [7.483446634501235]
グラウンド・リアクション・フォース(英語: Ground reaction force、GRF)は、グラウンドが物体に接触して働く力である。
GRFをベースとした自動疾患検出(ADD)が,新たな診断方法となった。
論文 参考訳(メタデータ) (2024-11-05T14:21:01Z) - Diff-CXR: Report-to-CXR generation through a disease-knowledge enhanced diffusion model [4.507437953126754]
本稿では,Diff-CXR と名づけられたDiffusion-to-CXR 学習フレームワークを提案する。
Diff-CXRは,MIMIC-CXRおよびIU-XrayのFIDおよびmAUCスコアにおいて,従来のSOTA医療TTI法を33.4%/8.0%/23.8%/56.4%で上回った。
論文 参考訳(メタデータ) (2024-10-26T12:38:12Z) - A Universal Deep Learning Framework for Materials X-ray Absorption Spectra [0.6291443816903801]
X線吸収分光法(XAS)は、吸収する原子の局所的な化学的環境を調べるための強力な特徴付け技術である。
しかしながら、XASデータの解析には重大な課題があり、しばしば広範囲で計算集約的なシミュレーションを必要とする。
我々は、XAS予測のための一連の伝達学習手法を開発し、それぞれが精度と効率の向上に一意に寄与する。
論文 参考訳(メタデータ) (2024-09-29T04:41:10Z) - Deep Learning for Gamma-Ray Bursts: A data driven event framework for
X/Gamma-Ray analysis in space telescopes [2.4666310814233703]
この論文は、Gamma Ray-Bursts (GRB) の概要、その特性、検出に使用される機器、人工知能 (AI) アプリケーションの提供に捧げられている。
Fermi-GBM や HERMES Pathfinder のような次世代の高X線モニターの電流と次世代の両方を考慮すると、研究課題は長く、希薄な高エネルギートランジェントの検出を中心に展開される。
これを解決するために、2つの章では、新しいデータ駆動フレームワークであるDeepGRBを紹介している。
論文 参考訳(メタデータ) (2024-01-28T11:49:57Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z) - Tracking perovskite crystallization via deep learning-based feature
detection on 2D X-ray scattering data [137.47124933818066]
本稿では,より高速なR-CNN深層学習アーキテクチャに基づくX線回折画像の自動解析パイプラインを提案する。
有機-無機ペロブスカイト構造の結晶化をリアルタイムに追跡し, 2つの応用で検証した。
論文 参考訳(メタデータ) (2022-02-22T15:39:00Z) - Improving Classification Model Performance on Chest X-Rays through Lung
Segmentation [63.45024974079371]
本稿では, セグメンテーションによる異常胸部X線(CXR)識別性能を向上させるための深層学習手法を提案する。
提案手法は,CXR画像中の肺領域を局所化するための深層ニューラルネットワーク(XLSor)と,大規模CXRデータセットで事前学習した自己教師あり運動量コントラスト(MoCo)モデルのバックボーンを用いたCXR分類モデルである。
論文 参考訳(メタデータ) (2022-02-22T15:24:06Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Identification of complex mixtures for Raman spectroscopy using a novel
scheme based on a new multi-label deep neural network [0.0]
本稿では,定数ウェーブレット変換(CWT)と複雑な混合物を分類するためのディープネットワークに基づく新しいスキームを提案する。
次に、多ラベルディープニューラルネットワークモデル(MDNN)を材料分類に適用する。
本モデルから得られた平均検出時間は5.31秒であり,従来提案したモデルよりもはるかに高速である。
論文 参考訳(メタデータ) (2020-10-29T14:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。