論文の概要: Explainable Predictive Modeling for Limited Spectral Data
- arxiv url: http://arxiv.org/abs/2202.04527v1
- Date: Wed, 9 Feb 2022 15:46:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-10 15:38:25.191459
- Title: Explainable Predictive Modeling for Limited Spectral Data
- Title(参考訳): 限定スペクトルデータの説明可能な予測モデル
- Authors: Frantishek Akulich, Hadis Anahideh, Manaf Sheyyab, Dhananjay Ambre
- Abstract要約: 本稿では、高次元および限られたスペクトルデータの予測結果を解釈するために、最近の説明可能なAI技術を適用する。
機器の解像度制限のため、分光データの重要な領域をピンポイントすると、データ収集プロセスを最適化する経路が生成される。
具体的には,MLモデルの評価がリアルタイムの実践に堅牢であることを保証するために,3つの異なるシナリオを設計する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature selection of high-dimensional labeled data with limited observations
is critical for making powerful predictive modeling accessible, scalable, and
interpretable for domain experts. Spectroscopy data, which records the
interaction between matter and electromagnetic radiation, particularly holds a
lot of information in a single sample. Since acquiring such high-dimensional
data is a complex task, it is crucial to exploit the best analytical tools to
extract necessary information. In this paper, we investigate the most commonly
used feature selection techniques and introduce applying recent explainable AI
techniques to interpret the prediction outcomes of high-dimensional and limited
spectral data. Interpretation of the prediction outcome is beneficial for the
domain experts as it ensures the transparency and faithfulness of the ML models
to the domain knowledge. Due to the instrument resolution limitations,
pinpointing important regions of the spectroscopy data creates a pathway to
optimize the data collection process through the miniaturization of the
spectrometer device. Reducing the device size and power and therefore cost is a
requirement for the real-world deployment of such a sensor-to-prediction system
as a whole. We specifically design three different scenarios to ensure that the
evaluation of ML models is robust for the real-time practice of the developed
methodologies and to uncover the hidden effect of noise sources on the final
outcome.
- Abstract(参考訳): 限定的な観察を持つ高次元ラベル付きデータの特徴選択は、ドメインエキスパートにとって強力な予測モデリングをアクセスしやすく、スケーラブルで、解釈可能なものにするために重要である。
物質と電磁放射の相互作用を記録する分光データは、特に1つのサンプルに多くの情報を保持している。
このような高次元データの取得は複雑な作業であるため、最適な分析ツールを用いて必要な情報を抽出することが重要である。
本稿では,高次元および限られたスペクトルデータの予測結果を解釈するために,最もよく用いられる特徴選択手法について検討し,最近の説明可能なAI技術を適用した。
予測結果の解釈は、mlモデルのドメイン知識への透明性と忠実性を保証するため、ドメインエキスパートにとって有益です。
機器分解能の限界により、分光データの重要な領域をピンポイントすることで、分光計装置の小型化によるデータ収集プロセスを最適化する経路が生成される。
デバイスのサイズと電力の削減とそれゆえコストの削減は、そのようなセンサーから予測システム全体の実世界展開の要件である。
我々は,3つの異なるシナリオを具体的に設計し,mlモデルの評価が,開発手法のリアルタイム実行にロバストであることを確認し,最終結果に対するノイズ源の隠れた影響を明らかにする。
関連論文リスト
- AI-driven emergence of frequency information non-uniform distribution
via THz metasurface spectrum prediction [36.84046475101662]
我々は,AI予測に基づく準曲面のテラヘルツスペクトル変調効果の予測に関する研究中に,異なる周波数に関連する未報告の情報特性を明らかにした。
このアプローチは、既存のデータセットの利用を効果的に最適化し、人工知能、化学、複合材料設計、バイオメディシンなどの分野における学際的な研究と応用の道を開く。
論文 参考訳(メタデータ) (2023-12-05T01:48:58Z) - Closing the loop: Autonomous experiments enabled by
machine-learning-based online data analysis in synchrotron beamline
environments [80.49514665620008]
機械学習は、大規模または高速に生成されたデータセットを含む研究を強化するために使用できる。
本研究では,X線反射法(XRR)のための閉ループワークフローへのMLの導入について述べる。
本研究では,ビームライン制御ソフトウェア環境に付加的なソフトウェア依存関係を導入することなく,実験中の基本データ解析をリアルタイムで行うソリューションを提案する。
論文 参考訳(メタデータ) (2023-06-20T21:21:19Z) - Exploring Supervised Machine Learning for Multi-Phase Identification and
Quantification from Powder X-Ray Diffraction Spectra [1.0660480034605242]
粉体X線回折分析は材料特性評価法の重要な構成要素である。
深層学習は、X線スペクトルから結晶学パラメータと特徴を予測するための主要な焦点となっている。
ここでは,多ラベル結晶相同定のための深層学習の代わりに,従来の教師付き学習アルゴリズムに関心がある。
論文 参考訳(メタデータ) (2022-11-16T00:36:13Z) - Spectrum-BERT: Pre-training of Deep Bidirectional Transformers for
Spectral Classification of Chinese Liquors [0.0]
本稿では,中国酒のスペクトル分類のための双方向トランスフォーマーの事前学習手法を提案し,これをSpectrum-BERTと略した。
我々はNext Curve Prediction (NCP) と Masked Curve Model (MCM) の2つの事前学習タスクを精巧に設計し、未ラベルのサンプルを効果的に活用できるようにした。
比較実験では、提案したSpectrum-BERTは、複数のメトリクスでベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2022-10-22T13:11:25Z) - Trustworthiness of Laser-Induced Breakdown Spectroscopy Predictions via
Simulation-based Synthetic Data Augmentation and Multitask Learning [4.633997895806144]
レーザ誘起分解分光法を用いてスペクトルデータの定量的解析を行う。
我々は、利用可能なトレーニングデータの小さなサイズと、未知のデータに対する推論中の予測の検証に対処する。
論文 参考訳(メタデータ) (2022-10-07T18:00:09Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Unsupervised Machine Learning for Exploratory Data Analysis of Exoplanet
Transmission Spectra [68.8204255655161]
我々は、通過する太陽系外惑星のスペクトルデータを解析するための教師なし手法に焦点をあてる。
スペクトルデータには、適切な低次元表現を要求する高い相関関係があることが示される。
主成分に基づく興味深い構造、すなわち、異なる化学状態に対応する明確に定義された分岐を明らかにする。
論文 参考訳(メタデータ) (2022-01-07T22:26:33Z) - Incorporating Causal Graphical Prior Knowledge into Predictive Modeling
via Simple Data Augmentation [92.96204497841032]
因果グラフ(CG)は、データ分散の背後にあるデータ生成プロセスの知識のコンパクトな表現である。
本研究では,条件付き独立性(CI)関係の事前知識を活用可能なモデルに依存しないデータ拡張手法を提案する。
本手法は,小データシステムにおける予測精度の向上に有効であることを実験的に示した。
論文 参考訳(メタデータ) (2021-02-27T06:13:59Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。