Fugu-MT 論文翻訳(概要): A universal synthetic dataset for machine learning on spectroscopic data

論文の概要: A universal synthetic dataset for machine learning on spectroscopic data

arxiv url: http://arxiv.org/abs/2206.06031v1
Date: Mon, 13 Jun 2022 10:37:19 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-14 22:13:35.438566
Title: A universal synthetic dataset for machine learning on spectroscopic data
Title（参考訳）: 分光データに基づく機械学習のための普遍的合成データセット
Authors: Jan Schuetzke, Nathan J. Szymanski, Markus Reischl
Abstract要約: このデータセットには、X線回折、核磁気共鳴、ラマン分光などの技術からの実験的な測定結果を表すために設計された人工スペクトルが含まれている。データセット生成プロセスは、スキャンの長さやピークカウントなどのカスタマイズ可能なパラメータを備えており、手元にある問題に適合するように調整することができる。最初のベンチマークとして、500のユニークなクラスに基づいて、35,000のスペクトルを含むデータセットをシミュレートした。
参考スコア（独自算出の注目度）: 0.5801044612920815
License: http://creativecommons.org/licenses/by/4.0/
Abstract: To assist in the development of machine learning methods for automated classification of spectroscopic data, we have generated a universal synthetic dataset that can be used for model validation. This dataset contains artificial spectra designed to represent experimental measurements from techniques including X-ray diffraction, nuclear magnetic resonance, and Raman spectroscopy. The dataset generation process features customizable parameters, such as scan length and peak count, which can be adjusted to fit the problem at hand. As an initial benchmark, we simulated a dataset containing 35,000 spectra based on 500 unique classes. To automate the classification of this data, eight different machine learning architectures were evaluated. From the results, we shed light on which factors are most critical to achieve optimal performance for the classification task. The scripts used to generate synthetic spectra, as well as our benchmark dataset and evaluation routines, are made publicly available to aid in the development of improved machine learning models for spectroscopic analysis.
Abstract（参考訳）: 分光データの自動分類のための機械学習手法の開発を支援するため,モデル検証に使用できる普遍的な合成データセットを作成した。このデータセットは、x線回折、核磁気共鳴、ラマン分光法などの手法による実験的な測定を表現するために設計された人工スペクトルを含んでいる。データセット生成プロセスは、スキャンの長さやピーク数などのカスタマイズ可能なパラメータを特徴としており、これは手元の問題に合わせて調整することができる。最初のベンチマークとして、500のユニークなクラスに基づいて、35,000のスペクトルを含むデータセットをシミュレートした。このデータの分類を自動化するために、8つの異なる機械学習アーキテクチャを評価した。結果から,分類タスクの最適性能を達成する上で,どの要因が最も重要かを明らかにした。合成スペクトルを生成するためのスクリプトとベンチマークデータセットと評価ルーチンは、分光分析のための改良された機械学習モデルの開発を支援するために公開されている。

関連論文リスト

Data-driven Synthesis of Magnetic Resonance Spectroscopy Data using a Variational Autoencoder [1.7789378551794652]
本研究では,単ボクセル分光データのみに特化して訓練された可変オートエンコーダ(VAE)を用いて,生体内MRSデータを合成するためのデータ駆動フレームワークを提案する。 VAEは複素数値スペクトルの低次元潜在表現を学習し、潜在空間サンプリングと合成により新しいサンプルを生成することができる。その結果,VOEは主成分パターンを正確に再構成し,生体内データと同じ特徴空間を占める合成スペクトルを生成することがわかった。
論文参考訳（メタデータ） (2026-02-28T16:52:16Z)
OASIS: A Deep Learning Framework for Universal Spectroscopic Analysis Driven by Novel Loss Functions [4.0097349146966925]
技術に依存しない自動スペクトル分析のための機械学習(ML)フレームワークを提案する。 OASISは、戦略的に設計された合成データセットでトレーニングされたモデルを通じて、その汎用性を達成する。本研究は、高性能MLモデルを開発するための重要な資源効率戦略として、損失関数の最適化を強調した。
論文参考訳（メタデータ） (2025-09-15T01:28:51Z)
What Makes Good Synthetic Training Data for Zero-Shot Stereo Matching? [57.49867420132091]
標準ベンチマークを用いてゼロショットステレオマッチング性能への影響を報告する。最適な設定を収集し、大規模なデータセットを作成することで、結果を検証する。我々は,プロシージャステレオデータセットのさらなる研究を可能にするために,我々のシステムをオープンソース化した。
論文参考訳（メタデータ） (2025-04-23T17:59:33Z)
Artificial Intelligence in Spectroscopy: Advancing Chemistry from Prediction to Generation and Beyond [38.32974480709081]
機械学習(ML)と人工知能(AI)の急速な出現は、化学に大きな変革をもたらした。分光・分光データへのこれらの手法の適用は、分光機械学習(SpectraML)と呼ばれるが、いまだに研究が進んでいない。我々はSpectraMLの統一的なレビューを行い、フォワードタスクと逆タスクの両方に対する最先端のアプローチを体系的に検証する。
論文参考訳（メタデータ） (2025-02-14T04:07:25Z)
Stellar parameter prediction and spectral simulation using machine learning [0.0]
本研究では,ESOの高精度放射速度惑星探索装置(HARPS)のデータ履歴全体に対して機械学習を適用した。我々は、スペクトルパラメータを予測しスペクトルを生成するために、HARPSデータ上で標準および変分オートエンコーダを訓練した。提案モデルでは, スペクトルパラメータの予測と実スペクトルの圧縮に優れ, 有効温度に対して約50Kの予測誤差を達成した。
論文参考訳（メタデータ） (2024-12-12T07:09:42Z)
Enhancing radioisotope identification in gamma spectra with transfer learning [0.0]
我々は、物理的に導出された合成データを用いてモデルを事前訓練し、転送学習技術を利用して特定の対象領域のモデルを微調整する。この分析結果から、微調整モデルの方が、合成データや対象ドメインデータのみにのみ訓練されたモデルよりも大幅に優れていたことが示唆された。本研究は,実験データへのアクセスが制限されたアプリケーションシナリオに伝達学習技術を適用するための概念実証として機能する。
論文参考訳（メタデータ） (2024-12-10T00:21:00Z)
Generating Diverse Synthetic Datasets for Evaluation of Real-life Recommender Systems [0.0]
合成データセットは、機械学習モデルの評価とテストに重要である。我々は,多様かつ統計的に一貫性のある合成データセットを生成するための新しいフレームワークを開発する。このフレームワークは、最小限の摩擦で研究を容易にする無料のオープンPythonパッケージとして利用できる。
論文参考訳（メタデータ） (2024-11-27T09:53:14Z)
Advancing fNIRS Neuroimaging through Synthetic Data Generation and Machine Learning Applications [0.0]
本研究では,機能的近赤外分光法(fNIRS)の神経イメージングへの統合的アプローチを提案する。高品質なニューロイメージングデータセットの不足に対処することにより、モンテカルロシミュレーションとパラメトリックヘッドモデルを利用して総合的な合成データセットを生成する。スケーラブルなデータ生成と処理のためにクラウドベースのインフラストラクチャが確立され、ニューロイメージングデータのアクセシビリティと品質が向上する。
論文参考訳（メタデータ） (2024-05-18T09:50:19Z)
Learning from Synthetic Data for Visual Grounding [55.21937116752679]
そこで本研究では,SynGroundが市販のビジョン・アンド・ランゲージモデルのローカライズ能力を向上できることを示す。 SynGroundで生成されたデータは、事前訓練されたALBEFモデルとBLIPモデルのポインティングゲーム精度をそれぞれ4.81%、絶対パーセンテージポイント17.11%向上させる。
論文参考訳（メタデータ） (2024-03-20T17:59:43Z)
Synthetic Information towards Maximum Posterior Ratio for deep learning on Imbalanced Data [1.7495515703051119]
マイノリティクラスのための合成データを生成することによって,データのバランスをとる手法を提案する。提案手法は,高エントロピーサンプルを同定することにより,情報領域のバランスを優先する。実験結果から,提案手法の優れた性能を実証した。
論文参考訳（メタデータ） (2024-01-05T01:08:26Z)
TarGEN: Targeted Data Generation with Large Language Models [51.87504111286201]
TarGENは、高品質な合成データセットを生成するための、多段階のプロンプト戦略である。我々は,LLMが不正確なラベル付きインスタンスを修正できるようにする自己補正法により,TarGENを増強する。合成データセットを元のデータセットと比較した包括的な分析により、データセットの複雑さと多様性の類似または高いレベルが明らかになる。
論文参考訳（メタデータ） (2023-10-27T03:32:17Z)
Optimizations of Autoencoders for Analysis and Classification of Microscopic In Situ Hybridization Images [68.8204255655161]
同様のレベルの遺伝子発現を持つ顕微鏡画像の領域を検出・分類するためのディープラーニングフレームワークを提案する。分析するデータには教師なし学習モデルが必要です。
論文参考訳（メタデータ） (2023-04-19T13:45:28Z)
Exploring Supervised Machine Learning for Multi-Phase Identification and Quantification from Powder X-Ray Diffraction Spectra [1.0660480034605242]
粉体X線回折分析は材料特性評価法の重要な構成要素である。深層学習は、X線スペクトルから結晶学パラメータと特徴を予測するための主要な焦点となっている。ここでは,多ラベル結晶相同定のための深層学習の代わりに,従来の教師付き学習アルゴリズムに関心がある。
論文参考訳（メタデータ） (2022-11-16T00:36:13Z)
Trustworthiness of Laser-Induced Breakdown Spectroscopy Predictions via Simulation-based Synthetic Data Augmentation and Multitask Learning [4.633997895806144]
レーザ誘起分解分光法を用いてスペクトルデータの定量的解析を行う。我々は、利用可能なトレーニングデータの小さなサイズと、未知のデータに対する推論中の予測の検証に対処する。
論文参考訳（メタデータ） (2022-10-07T18:00:09Z)
BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文参考訳（メタデータ） (2022-07-27T09:26:15Z)
Low-complexity deep learning frameworks for acoustic scene classification [64.22762153453175]
音響シーン分類(ASC)のための低複雑さ深層学習フレームワークを提案する。提案するフレームワークは、フロントエンドのスペクトログラム抽出、オンラインデータ拡張、バックエンドの分類、予測される確率の後期融合の4つの主要なステップに分けることができる。 DCASE 2022 Task 1 Development データセットで実施した実験は,低複雑さの要求を十分に満たし,最も高い分類精度を 60.1% で達成した。
論文参考訳（メタデータ） (2022-06-13T11:41:39Z)
Unsupervised Machine Learning for Exploratory Data Analysis of Exoplanet Transmission Spectra [68.8204255655161]
我々は、通過する太陽系外惑星のスペクトルデータを解析するための教師なし手法に焦点をあてる。スペクトルデータには、適切な低次元表現を要求する高い相関関係があることが示される。主成分に基づく興味深い構造、すなわち、異なる化学状態に対応する明確に定義された分岐を明らかにする。
論文参考訳（メタデータ） (2022-01-07T22:26:33Z)
A parameter refinement method for Ptychography based on Deep Learning concepts [55.41644538483948]
伝播距離、位置誤差、部分的コヒーレンスにおける粗いパラメトリゼーションは、しばしば実験の生存性を脅かす。最新のDeep Learningフレームワークは、セットアップの不整合を自律的に補正するために使用され、ポチコグラフィーの再構築の質が向上する。我々は,elettra シンクロトロン施設のツインミックビームラインで取得した合成データセットと実データの両方でシステムをテストした。
論文参考訳（メタデータ） (2021-05-18T10:15:17Z)
A probabilistic deep learning approach to automate the interpretation of multi-phase diffraction spectra [4.240899165468488]
シミュレーション回折スペクトルで訓練されたアンサンブル畳み込みニューラルネットワークを開発し、複素多相混合を同定する。シミュレーションおよび実験的に測定された回折スペクトルをベンチマークし, これまでに報告した手法よりも精度が優れていることを示す。
論文参考訳（メタデータ） (2021-03-30T20:13:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。