論文の概要: Exploring the Frontiers of kNN Noisy Feature Detection and Recovery for Self-Driving Labs
- arxiv url: http://arxiv.org/abs/2507.16833v1
- Date: Tue, 15 Jul 2025 03:35:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-24 22:33:14.668738
- Title: Exploring the Frontiers of kNN Noisy Feature Detection and Recovery for Self-Driving Labs
- Title(参考訳): 自動運転ラボにおけるkNNノイズの特徴検出と回復のフロンティアを探る
- Authors: Qiuyu Shi, Kangming Li, Yao Fehlis, Daniel Persaud, Robert Black, Jason Hattrick-Simpers,
- Abstract要約: 本研究では,ノイズのある特徴を自動で検出し,修正可能なサンプル・フィーチャー・ペアリングを判定し,最終的に適切な特徴値を復元するワークフローを開発する。
次に, データセットのサイズ, 雑音強度, 特徴値分布が, ノイズの特徴の検出可能性および回復可能性に与える影響について, 系統的研究を行った。
- 参考スコア(独自算出の注目度): 0.49478969093606673
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Self-driving laboratories (SDLs) have shown promise to accelerate materials discovery by integrating machine learning with automated experimental platforms. However, errors in the capture of input parameters may corrupt the features used to model system performance, compromising current and future campaigns. This study develops an automated workflow to systematically detect noisy features, determine sample-feature pairings that can be corrected, and finally recover the correct feature values. A systematic study is then performed to examine how dataset size, noise intensity, and feature value distribution affect both the detectability and recoverability of noisy features. In general, high-intensity noise and large training datasets are conducive to the detection and correction of noisy features. Low-intensity noise reduces detection and recovery but can be compensated for by larger clean training data sets. Detection and correction results vary between features with continuous and dispersed feature distributions showing greater recoverability compared to features with discrete or narrow distributions. This systematic study not only demonstrates a model agnostic framework for rational data recovery in the presence of noise, limited data, and differing feature distributions but also provides a tangible benchmark of kNN imputation in materials data sets. Ultimately, it aims to enhance data quality and experimental precision in automated materials discovery.
- Abstract(参考訳): 自動運転研究所(SDL)は、機械学習と自動実験プラットフォームを統合することで、材料発見を加速する公約を示している。
しかし、入力パラメータをキャプチャする際のエラーは、システムのパフォーマンスをモデル化し、現在と将来のキャンペーンを悪化させるのに使用される特徴を損なう可能性がある。
本研究では,ノイズのある特徴を体系的に検出し,修正可能なサンプル・フィーチャー・ペアリングを判定し,最終的に適切な特徴値を復元する自動ワークフローを開発する。
次に, データセットのサイズ, 雑音強度, 特徴値分布が, ノイズの特徴の検出可能性および回復可能性に与える影響について, 系統的研究を行った。
一般に、高強度ノイズと大規模なトレーニングデータセットは、ノイズのある特徴の検出と修正に有効である。
低強度ノイズは検出と回復を減少させるが、より大きなクリーンなトレーニングデータセットによって補償することができる。
連続的特徴分布と分散的特徴分布の差は, 離散的特徴や狭い特徴に比べて, 高い回復性を示す。
この体系的な研究は、ノイズ、限られたデータ、異なる特徴分布の存在下で、合理的なデータ回復のためのモデルに依存しないフレームワークを実証するだけでなく、材料データセットにおけるkNNインプットの具体的なベンチマークも提供する。
最終的には、自動材料発見におけるデータ品質と実験精度を向上させることを目指している。
関連論文リスト
- A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - Explainable fault and severity classification for rolling element bearings using Kolmogorov-Arnold networks [4.46753539114796]
ベアリング故障は機械の故障の主な原因である。
本研究では,これらの課題に対処するためにKolmogorov-Arnold Networksを用いた。
説明可能な結果を提供する軽量モデルを生成する。
論文 参考訳(メタデータ) (2024-12-02T09:40:03Z) - COMPILED: Deep Metric Learning for Defect Classification of Threaded Pipe Connections using Multichannel Partially Observed Functional Data [6.688305507010403]
本稿では,各サンプルが部分的に観察された多チャンネル関数データとして表現される欠陥分類に着目した。
各欠陥タイプのサンプルは限定的かつ不均衡である。
本稿では,Deep Metrics Learningに基づくCompactLEDと呼ばれる革新的な分類手法を提案する。
論文 参考訳(メタデータ) (2024-04-04T09:55:11Z) - Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Active Foundational Models for Fault Diagnosis of Electrical Motors [0.5999777817331317]
電気モーターの故障検出と診断は、産業システムの安全かつ信頼性の高い運転を保証する上で最も重要である。
マシン故障診断のための既存のデータ駆動ディープラーニングアプローチは、大量のラベル付きサンプルに大きく依存している。
ラベル付きサンプルを少ない量で活用する基礎モデルに基づくアクティブラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-27T03:25:12Z) - An Improved Anomaly Detection Model for Automated Inspection of Power Line Insulators [0.0]
電力系統の信頼性を確保するためには絶縁体の検査が重要である。
検査プロセスを自動化するために、ディープラーニングがますます活用されています。
本稿では,異常検出とオブジェクト検出の2段階的アプローチを提案する。
論文 参考訳(メタデータ) (2023-11-14T11:36:20Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - Improving the Robustness of Summarization Models by Detecting and
Removing Input Noise [50.27105057899601]
本研究では,様々な種類の入力ノイズから,様々なデータセットやモデルサイズに対する性能損失を定量化する大規模な実験的検討を行った。
本稿では,モデル推論中の入力中のそのようなノイズを検出し,除去するための軽量な手法を提案する。
論文 参考訳(メタデータ) (2022-12-20T00:33:11Z) - Learning Informative Health Indicators Through Unsupervised Contrastive Learning [5.193936395510582]
本研究は、健康指標を学習するための、新規で汎用的で教師なしのアプローチを提案する。
アプローチは2つのタスクと異なる特性を持つケーススタディに基づいて評価される。
提案手法は, 製粉機械の摩耗に追従した健康指標を効果的に学習することを示す。
論文 参考訳(メタデータ) (2022-08-28T21:04:42Z) - Architectural Optimization and Feature Learning for High-Dimensional
Time Series Datasets [0.7388859384645262]
重力波検出器における過渡ノイズアーチファクトの存在を予測する問題について検討する。
従来の技術と比較して誤差率を60%以上削減するモデルを導入する。
論文 参考訳(メタデータ) (2022-02-27T23:41:23Z) - Bridging the Gap Between Clean Data Training and Real-World Inference
for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。
本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。
広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文 参考訳(メタデータ) (2021-04-13T17:54:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。