論文の概要: Censoring chemical data to mitigate dual use risk
- arxiv url: http://arxiv.org/abs/2304.10510v2
- Date: Sat, 25 Oct 2025 15:56:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 17:41:21.244656
- Title: Censoring chemical data to mitigate dual use risk
- Title(参考訳): 二重利用リスクを軽減するための化学データの検閲
- Authors: Quintina L. Campbell, Jonathan Herington, Andrew D. White,
- Abstract要約: 機械学習モデルにはデュアルユースの可能性があり、有益な目的と悪意のある目的の両方に役立つ可能性がある。
化学におけるオープンソースモデルの開発は、毒性データと化学兵器に関する二重用途の懸念が表面化している。
本稿では3つの誤用経路とそれに対応する緩和戦略を特定する連鎖リスクフレームワークについて論じる。
- 参考スコア(独自算出の注目度): 0.1894032224965486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning models have dual-use potential, potentially serving both beneficial and malicious purposes. The development of open-source models in chemistry has specifically surfaced dual-use concerns around toxicological data and chemical warfare agents. We discuss a chain risk framework identifying three misuse pathways and corresponding mitigation strategies: inference-level, model-level, and data-level. At the data level, we introduce a model-agnostic noising method to increase prediction error in specific desired regions (sensitive regions). Our results show that selective noise induces variance and attenuation bias, whereas simply omitting sensitive data fails to prevent extrapolation. These findings hold for both molecular feature multilayer perceptrons and graph neural networks. Thus, noising molecular structures can enable open sharing of potential dual-use molecular data.
- Abstract(参考訳): 機械学習モデルにはデュアルユースの可能性があり、有益な目的と悪意のある目的の両方に役立つ可能性がある。
化学におけるオープンソースモデルの開発は、毒性データと化学兵器に関する二重用途の懸念を特に表面化してきた。
本稿では,3つの誤用経路とそれに対応する緩和戦略(推論レベル,モデルレベル,データレベル)を特定する連鎖リスクフレームワークについて論じる。
データレベルでは,特定の所望領域(感性領域)における予測誤差を増大させるモデルに依存しない雑音発生手法を提案する。
以上の結果から,選択雑音はばらつきや減衰バイアスを引き起こすのに対し,感度データの省略は外挿を防ぐのに失敗することがわかった。
これらの知見は、分子機能多層パーセプトロンとグラフニューラルネットワークの両方に当てはまる。
したがって、分子構造をノイズ化することで、潜在的な二重利用分子データのオープンな共有が可能になる。
関連論文リスト
- Blend the Separated: Mixture of Synergistic Experts for Data-Scarcity Drug-Target Interaction Prediction [39.410724831865245]
薬物と標的の相互作用予測(DTI)は、薬物発見や臨床応用を含む様々な用途において不可欠である。
DTIの予測で広く使われている入力データには2つの視点がある: 内因性データは薬物や標的の作り方を表し、外因性データは薬物や標的が他の生物学的実体とどのように関連しているかを表す。
入力データおよび/またはラベル不足下でのDTI予測に最初に取り組む手法を提案する。
論文 参考訳(メタデータ) (2025-03-20T02:27:16Z) - Chemical knowledge-informed framework for privacy-aware retrosynthesis learning [72.39098405805318]
現在の機械学習に基づくレトロシンセシスは、複数のソースからの反応データを1つのエッジに集め、予測モデルを訓練する。
このパラダイムは、組織の境界を越えた広範なデータ可用性を必要とするため、かなりのプライバシーリスクをもたらす。
本研究では, 化学知識インフォームド・フレームワーク (CKIF) について紹介する。
論文 参考訳(メタデータ) (2025-02-26T13:13:24Z) - Ensuring Medical AI Safety: Explainable AI-Driven Detection and Mitigation of Spurious Model Behavior and Associated Data [14.991686165405959]
本稿では,データとモデルの両方の観点から,突発的行動を特定するための半自動フレームワークを提案する。
これにより、急激なデータポイントの検索と、関連する予測ルールを符号化するモデル回路の検出が可能になる。
4つの医療データセットを用いて,本フレームワークの適用性を示す。
論文 参考訳(メタデータ) (2025-01-23T16:39:09Z) - Unlearnable Examples Detection via Iterative Filtering [84.59070204221366]
ディープニューラルネットワークは、データ中毒攻撃に弱いことが証明されている。
混合データセットから有毒なサンプルを検出することは極めて有益であり、困難である。
UE識別のための反復フィルタリング手法を提案する。
論文 参考訳(メタデータ) (2024-08-15T13:26:13Z) - An Autoencoder and Generative Adversarial Networks Approach for Multi-Omics Data Imbalanced Class Handling and Classification [2.2940141855172036]
分子生物学では、マルチオミクスシークエンシングから生成されるデータの爆発があった。
従来の統計手法は、そのような高次元データを扱う際に難しい課題に直面している。
この研究は、オートエンコーダを組み込んだニューラルネットワークでこれらの課題に取り組むことに焦点を当て、特徴の潜在空間を抽出する。
論文 参考訳(メタデータ) (2024-05-16T01:45:55Z) - Have You Poisoned My Data? Defending Neural Networks against Data Poisoning [0.393259574660092]
本稿では,トランスファー学習環境における有毒なデータポイントの検出とフィルタリングを行う新しい手法を提案する。
有効毒は, 特徴ベクトル空間の清浄点とよく区別できることを示す。
提案手法は, 防衛率と最終訓練モデルの性能において, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-03-20T11:50:16Z) - Leveraging Internal Representations of Model for Magnetic Image
Classification [0.13654846342364302]
本稿では、1つの磁気画像とそれに対応するラベル画像しか持たないシナリオに特化して設計された機械学習モデルトレーニングのための、潜在的に画期的なパラダイムを提案する。
私たちはDeep Learningの能力を活用して、データの不足を克服することを目的として、簡潔で情報に富んだサンプルを生成します。
論文 参考訳(メタデータ) (2024-03-11T15:15:50Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - On the Interplay of Subset Selection and Informed Graph Neural Networks [3.091456764812509]
この研究は、QM9データセットにおける分子の原子化エネルギーの予測に焦点を当てている。
トレーニングセット選択過程における分子多様性の最大化は,線形回帰法および非線形回帰法のロバスト性を高めることを示す。
また、モデルに依存しない説明器を用いて、グラフニューラルネットワークによる予測の信頼性を確認する。
論文 参考訳(メタデータ) (2023-06-15T09:09:27Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Autoregressive Perturbations for Data Poisoning [54.205200221427994]
ソーシャルメディアからのデータスクレイピングは、不正なデータの使用に関する懸念が高まっている。
データ中毒攻撃は、スクラップ対策として提案されている。
より広範なデータセットにアクセスせずに有毒なデータを生成できる自動回帰(AR)中毒を導入する。
論文 参考訳(メタデータ) (2022-06-08T06:24:51Z) - Attack-agnostic Adversarial Detection on Medical Data Using Explainable
Machine Learning [0.0]
本論文では,2つのデータセット上での対比サンプルの正確な検出のためのモデル非依存説明性に基づく手法を提案する。
MIMIC-IIIとHenan-Renmin EHRのデータセットでは,縦軸攻撃に対する検出精度は77%であった。
MIMIC-CXRデータセットでは88%の精度を実現し、すべての設定において、両方のデータセットにおける敵検出技術の現状を10%以上改善した。
論文 参考訳(メタデータ) (2021-05-05T10:01:53Z) - Explainable Adversarial Attacks in Deep Neural Networks Using Activation
Profiles [69.9674326582747]
本稿では,敵対的事例に基づくニューラルネットワークモデルを検討するためのビジュアルフレームワークを提案する。
これらの要素を観察することで、モデル内の悪用領域を素早く特定できることを示す。
論文 参考訳(メタデータ) (2021-03-18T13:04:21Z) - Information Obfuscation of Graph Neural Networks [96.8421624921384]
本稿では,グラフ構造化データを用いた学習において,情報難読化による機密属性保護の問題について検討する。
本稿では,全変動量とワッサーシュタイン距離を交互に学習することで,事前決定された機密属性を局所的にフィルタリングするフレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-28T17:55:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。