論文の概要: Untargeted Region of Interest Selection for GC-MS Data using a Pseudo
F-Ratio Moving Window ($\psi$FRMV)
- arxiv url: http://arxiv.org/abs/2208.00313v1
- Date: Sat, 30 Jul 2022 21:43:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 13:16:59.558455
- Title: Untargeted Region of Interest Selection for GC-MS Data using a Pseudo
F-Ratio Moving Window ($\psi$FRMV)
- Title(参考訳): 擬似f-ratio移動ウィンドウを用いたgc-msデータの非目標領域選択($\psi$frmv)
- Authors: Ryland T. Giebelhaus, Michael D. Sorochan Armstrong, A. Paulina de la
Mata, James J. Harynuk
- Abstract要約: 本稿では,GC-MSデータにおける関心領域の自動選択手法を提案する。
これは、クロマトグラムを横切るウィンドウの特異値分解から得られる正方形第一値と第二特異値の比に基づいている。
アルゴリズムの感度は、信号を含むクロマトグラフィー領域をもはや取り出すことができない濃度を調べることで検証された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: There are many challenges associated with analysing gas chromatography - mass
spectrometry (GC-MS) data. Many of these challenges stem from the fact that
electron ionisation can make it difficult to recover molecular information due
to the high degree of fragmentation with concomitant loss of molecular ion
signal. With GC-MS data there are often many common fragment ions shared among
closely-eluting peaks, necessitating sophisticated methods for analysis. Some
of these methods are fully automated, but make some assumptions about the data
which can introduce artifacts during the analysis. Chemometric methods such as
Multivariate Curve Resolution, or Parallel Factor Analysis are particularly
attractive, since they are flexible and make relatively few assumptions about
the data - ideally resulting in fewer artifacts. These methods do require
expert user intervention to determine the most relevant regions of interest and
an appropriate number of components, $k$, for each region. Automated region of
interest selection is needed to permit automated batch processing of
chromatographic data with advanced signal deconvolution. Here, we propose a new
method for automated, untargeted region of interest selection that accounts for
the multivariate information present in GC-MS data to select regions of
interest based on the ratio of the squared first, and second singular values
from the Singular Value Decomposition of a window that moves across the
chromatogram. Assuming that the first singular value accounts largely for
signal, and that the second singular value accounts largely for noise, it is
possible to interpret the relationship between these two values as a
probabilistic distribution of Fisher Ratios. The sensitivity of the algorithm
was tested by investigating the concentration at which the algorithm can no
longer pick out chromatographic regions known to contain signal.
- Abstract(参考訳): ガスクロマトグラフィー-質量分析法(gc-ms)データの解析には多くの課題がある。
これらの課題の多くは、電子イオン化が分子イオン信号の共役損失を伴う高い断片化による分子情報の回復を困難にするという事実に由来する。
GC-MSデータでは、しばしば多くの共通フラグメントイオンが密に計算されたピーク間で共有され、分析に洗練された方法を必要とする。
これらの手法のいくつかは完全に自動化されているが、分析中にアーティファクトを導入することができるデータについていくつかの仮定を行う。
多変量曲線解法やパラレル因子分析のようなケモメトリックス手法は、柔軟性があり、データについての仮定が比較的少ないため、特に魅力的である。
これらの手法は、最も関連性の高い領域を決定するために専門的なユーザー介入を必要とし、各領域に対して適切な数のコンポーネント、$k$が必要である。
高度な信号デコンボリューションを伴うクロマトグラフィーデータのバッチ処理を自動化可能にするには、関心領域の自動選択が必要となる。
本稿では,gc-msデータに存在する多変量情報から,第1の2乗率と第2の特異値の比率に基づいて,関心領域を選択するための興味領域の自動選択手法を提案する。
第1特異値が信号に大きく、第2特異値がノイズに大きく依存していると仮定すると、これらの2つの値の関係をフィッシャー比の確率分布として解釈することができる。
このアルゴリズムの感度は、信号を含むことで知られるクロマトグラフィー領域を選択できない濃度を調べることで検証された。
関連論文リスト
- Multi-Source and Test-Time Domain Adaptation on Multivariate Signals using Spatio-Temporal Monge Alignment [59.75420353684495]
コンピュータビジョンやバイオメディカルデータなどの信号に対する機械学習の応用は、ハードウェアデバイスやセッション記録にまたがる変動のため、しばしば課題に直面している。
本研究では,これらの変動を緩和するために,時空間モンジュアライメント(STMA)を提案する。
我々はSTMAが、非常に異なる設定で取得したデータセット間で、顕著で一貫したパフォーマンス向上をもたらすことを示す。
論文 参考訳(メタデータ) (2024-07-19T13:33:38Z) - Data Augmentation Scheme for Raman Spectra with Highly Correlated
Annotations [0.23090185577016453]
統計的に独立なラベルを持つデータセットから追加のデータポイントを生成するために、スペクトルの付加的な性質を利用する。
これらのデータポイント上でCNNをトレーニングすることで、アノテーションがモデルトレーニングに使用されたデータセットと同じ相関関係を持たないデータセットのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2024-02-01T18:46:28Z) - Datacube segmentation via Deep Spectral Clustering [76.48544221010424]
拡張ビジョン技術は、しばしばその解釈に挑戦する。
データ立方体スペクトルの巨大な次元性は、その統計的解釈において複雑なタスクを生じさせる。
本稿では,符号化空間における教師なしクラスタリング手法の適用の可能性について検討する。
統計的次元削減はアドホック訓練(可変)オートエンコーダで行い、クラスタリング処理は(学習可能な)反復K-Meansクラスタリングアルゴリズムで行う。
論文 参考訳(メタデータ) (2024-01-31T09:31:28Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - On the Interplay of Subset Selection and Informed Graph Neural Networks [3.091456764812509]
この研究は、QM9データセットにおける分子の原子化エネルギーの予測に焦点を当てている。
トレーニングセット選択過程における分子多様性の最大化は,線形回帰法および非線形回帰法のロバスト性を高めることを示す。
また、モデルに依存しない説明器を用いて、グラフニューラルネットワークによる予測の信頼性を確認する。
論文 参考訳(メタデータ) (2023-06-15T09:09:27Z) - HFN: Heterogeneous Feature Network for Multivariate Time Series Anomaly
Detection [2.253268952202213]
MTSのためのヘテロジニアス特徴ネットワーク(HFN)に基づく,新しい半教師付き異常検出フレームワークを提案する。
まず、センサ埋め込みによって生成された埋め込み類似性グラフと、センサ値によって生成された特徴値類似性グラフを組み合わせて、時系列不均一グラフを構築する。
このアプローチは、ヘテロジニアスグラフ構造学習(HGSL)と表現学習の最先端技術を融合させる。
論文 参考訳(メタデータ) (2022-11-01T05:01:34Z) - Peak Detection On Data Independent Acquisition Mass Spectrometry Data
With Semisupervised Convolutional Transformers [0.0]
質量分析法(LC-MS)に結合した液体クロマトグラフィーは、プロテオームの高スループットで定量的な測定に一般的に用いられている。
本稿では,このピーク検出問題を多変量時系列分割問題として定式化し,トランスフォーマーアーキテクチャに基づく新しいアプローチを提案する。
ここでは、畳み込みニューラルネットワーク(CNN)を用いて、グローバルビューで長距離依存関係をキャプチャ可能なトランスフォーマーを拡大する。
我々は,このモデルを,多チャンネル時系列データに対する技術半教師付き画像分類手法の状況に適応させることで,半教師付き方式でさらに訓練する。
論文 参考訳(メタデータ) (2020-10-26T18:55:27Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z) - PointIso: Point Cloud Based Deep Learning Model for Detecting
Arbitrary-Precision Peptide Features in LC-MS Map through Attention Based
Segmentation [5.495506445661776]
PointIsoは、ペプチドの特徴検出の問題を解決するために、ポイントクラウドベースの任意の精度のディープラーニングネットワークである。
ベンチマークデータセットにおいて、高品質なMS/MS識別を98%検出する。
論文 参考訳(メタデータ) (2020-09-15T17:34:14Z) - Improved guarantees and a multiple-descent curve for Column Subset
Selection and the Nystr\"om method [76.73096213472897]
我々は,データ行列のスペクトル特性を利用して近似保証を改良する手法を開発した。
我々のアプローチは、特異値減衰の既知の速度を持つデータセットのバウンダリが大幅に向上する。
RBFパラメータを変更すれば,改良された境界線と多重発振曲線の両方を実データセット上で観測できることが示される。
論文 参考訳(メタデータ) (2020-02-21T00:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。