論文の概要: ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2302.04917v1
- Date: Thu, 9 Feb 2023 20:19:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-13 17:14:47.365712
- Title: ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning
- Title(参考訳): ChemVise:ゼロショット学習の新しい応用による分布外化学検出の最大化
- Authors: Alexander M. Moore, Randy C. Paffenroth, Ken T. Ngo, Joshua R. Uzarski
- Abstract要約: 本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
- 参考スコア(独自算出の注目度): 60.02503434201552
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate chemical sensors are vital in medical, military, and home safety
applications. Training machine learning models to be accurate on real world
chemical sensor data requires performing many diverse, costly experiments in
controlled laboratory settings to create a data set. In practice even
expensive, large data sets may be insufficient for generalization of a trained
model to a real-world testing distribution. Rather than perform greater numbers
of experiments requiring exhaustive mixtures of chemical analytes, this
research proposes learning approximations of complex exposures from training
sets of simple ones by using single-analyte exposure signals as building blocks
of a multiple-analyte space. We demonstrate this approach to synthetic sensor
responses surprisingly improves the detection of out-of-distribution obscured
chemical analytes. Further, we pair these synthetic signals to targets in an
information-dense representation space utilizing a large corpus of chemistry
knowledge. Through utilization of a semantically meaningful analyte
representation spaces along with synthetic targets we achieve rapid analyte
classification in the presence of obscurants without corresponding
obscured-analyte training data. Transfer learning for supervised learning with
molecular representations makes assumptions about the input data. Instead, we
borrow from the natural language and natural image processing literature for a
novel approach to chemical sensor signal classification using molecular
semantics for arbitrary chemical sensor hardware designs.
- Abstract(参考訳): 正確な化学センサーは医療、軍、家庭の安全に不可欠である。
実世界の化学センサーデータに基づいて正確な機械学習モデルをトレーニングするには、データセットを作成するために、制御された実験室の設定において、多種多様なコストを要する。
実際には、大規模データセットはトレーニングされたモデルを実世界のテストディストリビューションに一般化するには不十分かもしれない。
本研究は, 化学分析物の徹底的な混合を必要とする実験を多く行うのではなく, 単分析式露光信号を複合解析空間のビルディングブロックとして用いることで, 単分析式の訓練セットから複雑な露光の近似を学習することを提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善する。
さらに,これらの合成信号を,大量の化学知識を生かした情報密度表現空間のターゲットにペアリングする。
意味論的に意味のある分析対象の表現空間と合成対象の活用により, 未知の学習データに該当せず, 高速な分析対象の分類が可能となる。
分子表現を用いた教師付き学習のための転送学習は、入力データについて仮定する。
その代わり、自然言語と自然画像処理の文献を借用し、任意の化学センサハードウェア設計のための分子セマンティクスを用いた化学センサ信号分類の新しいアプローチを提案する。
関連論文リスト
- MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - A Gaussian Process Model for Ordinal Data with Applications to Chemoinformatics [0.0]
化学実験の結果を予測するための条件付きガウス過程モデルを提案する。
我々のモデルの新しい側面は、核がスケーリングパラメータを含み、化学空間の要素間の相関の強さを制御することである。
本稿では,化学発見の容易化と化合物の有効性に対する重要な特徴の同定のための遺伝的アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-16T11:18:32Z) - Active Causal Learning for Decoding Chemical Complexities with Targeted Interventions [0.0]
そこで本研究では,戦略的サンプリングを通じて原因・影響関係を識別する能動的学習手法を提案する。
この方法は、より大きな化学空間の最も多くの情報を符号化できるデータセットの最小サブセットを特定する。
その後、同定された因果関係を利用して体系的な介入を行い、モデルがこれまで遭遇していなかった化学空間における設計タスクを最適化する。
論文 参考訳(メタデータ) (2024-04-05T17:15:48Z) - An Autonomous Large Language Model Agent for Chemical Literature Data
Mining [60.85177362167166]
本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。
本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z) - Synthetic Image Rendering Solves Annotation Problem in Deep Learning
Nanoparticle Segmentation [5.927116192179681]
レンダリングソフトウェアを使用することで、リアルで合成されたトレーニングデータを生成して、最先端の深層ニューラルネットワークをトレーニングできることが示される。
有害な金属酸化物ナノ粒子アンサンブルに対する人為的アノテーションに匹敵するセグメンテーション精度を導出する。
論文 参考訳(メタデータ) (2020-11-20T17:05:36Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Optical oxygen sensing with artificial intelligence [0.0]
この研究は、全く新しい人工知能アプローチを探求し、機械学習による酸素センシングの実現可能性を示す。
特別に開発されたニューラルネットワークは、入力量と酸素濃度を非常に効率的に関連付けるために学習する。
その結果,多くの商用センサや低コストセンサと比較して,0.5パーセントの空気濃度から予測される平均偏差が認められた。
論文 参考訳(メタデータ) (2020-07-27T20:59:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。