論文の概要: Solving adversarial examples requires solving exponential misalignment
- arxiv url: http://arxiv.org/abs/2603.03507v2
- Date: Wed, 11 Mar 2026 01:20:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 18:32:01.549577
- Title: Solving adversarial examples requires solving exponential misalignment
- Title(参考訳): 逆例の解法は指数的不整合の解法を必要とする
- Authors: Alessandro Salvatore, Stanislav Fort, Surya Ganguli,
- Abstract要約: 敵対的攻撃 – ニューラルネットワークを騙す人間には受け入れられない入力摂動 – は、マシンラーニングにおいて永続的な障害モードのままである。
我々は、ネットワークによってそのクラスに確実に割り当てられた全ての入力の空間として、クラス概念のためのネットワーク多様体(PM)を解析する。
驚くべきことに、ニューラルネットワークPMの次元は、自然の人間の概念よりも桁違いに高い。
- 参考スコア(独自算出の注目度): 58.04667880030032
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adversarial attacks - input perturbations imperceptible to humans that fool neural networks - remain both a persistent failure mode in machine learning, and a phenomenon with mysterious origins. To shed light, we define and analyze a network's perceptual manifold (PM) for a class concept as the space of all inputs confidently assigned to that class by the network. We find, strikingly, that the dimensionalities of neural network PMs are orders of magnitude higher than those of natural human concepts. Since volume typically grows exponentially with dimension, this suggests exponential misalignment between machines and humans, with exponentially many inputs confidently assigned to concepts by machines but not humans. Furthermore, this provides a natural geometric hypothesis for the origin of adversarial examples: because a network's PM fills such a large region of input space, any input will be very close to any class concept's PM. Our hypothesis thus suggests that adversarial robustness cannot be attained without dimensional alignment of machine and human PMs, and therefore makes strong predictions: both robust accuracy and distance to any PM should be negatively correlated with the PM dimension. We confirmed these predictions across 18 different networks of varying robust accuracy. Crucially, we find even the most robust networks are still exponentially misaligned, and only the few PMs whose dimensionality approaches that of human concepts exhibit alignment to human perception. Our results connect the fields of alignment and adversarial examples, and suggest the curse of high dimensionality of machine PMs is a major impediment to adversarial robustness.
- Abstract(参考訳): 敵対的攻撃 — ニューラルネットワークを騙す人間には受け入れられない入力摂動 — は、マシンラーニングにおいて永続的な障害モードであり、謎の起源を持つ現象である。
光を遮るために、クラス概念に対するネットワークの知覚多様体(PM)を、ネットワークによってそのクラスに確実に割り当てられた全ての入力の空間として定義し、解析する。
驚くべきことに、ニューラルネットワークPMの次元は、自然の人間の概念よりも桁違いに高い。
体積は一般に次元とともに指数関数的に増加するため、これは機械と人間の間で指数関数的な不整合を示唆し、指数関数的に多くの入力が機械による概念に確実に割り当てられるが、人間ではない。
ネットワークの PM はそのような入力空間の広い領域を満たすので、任意の入力は任意のクラスの概念の PM に非常に近い。
本仮説は, 機械と人間のPMの次元的アライメントがなければ, 対角的ロバスト性は達成できないことを示唆するものであり, 任意のPMに対するロバスト精度と距離は, PM次元と負の相関関係を持つべきである。
精度の異なる18の異なるネットワークにまたがってこれらの予測を確認した。
重要なことに、最もロバストなネットワークでさえ指数関数的に不一致であり、人間の概念の次元的アプローチが人間の知覚と一致しているPMはごくわずかである。
この結果から, 機械PMの高次元性の呪いは, 敵の強靭性にとって大きな障害となることが示唆された。
関連論文リスト
- Explicit Modelling of Theory of Mind for Belief Prediction in Nonverbal Social Interactions [9.318796743761224]
マルチモーダル入力から人間の社会的相互作用における信念とそのダイナミクスを予測するための、心の理論(ToM)ニューラルネットワークであるMToMnetを提案する。
MToMnetはコンテキストキューを符号化し、個人固有のキュー(人間の視線とボディランゲージ)を、それぞれ個別のMindNetに統合する。
以上の結果から,MToMnetは既存の手法をはるかに上回り,同時にパラメータも大幅に少なくなることが明らかとなった。
論文 参考訳(メタデータ) (2024-07-09T11:15:51Z) - A Geometrical Approach to Evaluate the Adversarial Robustness of Deep
Neural Networks [52.09243852066406]
対向収束時間スコア(ACTS)は、対向ロバストネス指標として収束時間を測定する。
我々は,大規模画像Netデータセットに対する異なる敵攻撃に対して,提案したACTSメトリックの有効性と一般化を検証する。
論文 参考訳(メタデータ) (2023-10-10T09:39:38Z) - Deep Neural Networks Tend To Extrapolate Predictably [51.303814412294514]
ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。
我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。
我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文 参考訳(メタデータ) (2023-10-02T03:25:32Z) - Searching for the Essence of Adversarial Perturbations [73.96215665913797]
本稿では,ニューラルネットワークの誤予測の原因となる,人間の認識可能な情報を含む対人摂動について述べる。
この人間の認識可能な情報の概念は、敵の摂動に関連する重要な特徴を説明できる。
論文 参考訳(メタデータ) (2022-05-30T18:04:57Z) - On the uncertainty principle of neural networks [36.098205818550554]
ニューラルネットワークは、敵攻撃に対して高い精度と堅牢性を同時に達成する能力において、基本的な限界として現れる不確実性関係の対象であることが示される。
量子物理学の基盤である相補性原理がニューラルネットワークに適用され、共役特徴の同時学習におけるそれらの能力に根本的な制限が課されることが明らかとなった。
論文 参考訳(メタデータ) (2022-05-03T13:48:12Z) - Learning to Predict Diverse Human Motions from a Single Image via
Mixture Density Networks [9.06677862854201]
本研究では,混合密度ネットワーク(MDN)モデルを用いて,単一画像から将来の人間の動きを予測する新しい手法を提案する。
MDNのマルチモーダルな性質は、既存のディープヒューマンモーション予測アプローチとは対照的に、様々な将来のモーション仮説の生成を可能にしている。
訓練されたモデルでは、入力として画像を直接取り、与えられた条件を満たす複数の可視運動を生成する。
論文 参考訳(メタデータ) (2021-09-13T08:49:33Z) - Development of Human Motion Prediction Strategy using Inception Residual
Block [1.0705399532413613]
Inception Residual Block (IRB) を提案する。
我々の主な貢献は、事前に観測されたポーズと次の予測されたポーズの間に連続性を持つように、入力と開始ブロックの出力の間の残差接続を提案することである。
提案したアーキテクチャでは、人間のポーズに関する事前知識をよりよく学習し、論文で詳述したよりはるかに高い予測精度を達成する。
論文 参考訳(メタデータ) (2021-08-09T12:49:48Z) - Vulnerability Under Adversarial Machine Learning: Bias or Variance? [77.30759061082085]
本研究では,機械学習が訓練された深層ニューラルネットワークのバイアスと分散に与える影響について検討する。
我々の分析は、ディープニューラルネットワークが対向的摂動下で性能が劣っている理由に光を当てている。
本稿では,計算処理の複雑さをよく知られた機械学習手法よりも低く抑えた,新しい逆機械学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-08-01T00:58:54Z) - Relationship between manifold smoothness and adversarial vulnerability
in deep learning with local errors [2.7834038784275403]
ニューラルネットワークにおける敵の脆弱性の起源について検討する。
本研究は,隠れ表現の固有スペクトルの比較的高速なパワーロー崩壊を必要とすることを明らかにする。
論文 参考訳(メタデータ) (2020-07-04T08:47:51Z) - Adversarial Robustness Guarantees for Random Deep Neural Networks [15.68430580530443]
逆の例は、正しく分類された入力に非常に近い誤った分類された入力です。
任意の$pge1$に対して、分類境界からの任意の入力の$ellp$距離は、入力の$ellp$ノルムの入力時間の次元の平方根の1つとしてスケールする。
この結果は、敵の例を理論的に理解する上での基本的な進歩であり、ネットワークアーキテクチャと敵の摂動に対する頑健性との関係を理論的に解明する道を開くものである。
論文 参考訳(メタデータ) (2020-04-13T13:07:26Z) - Firearm Detection and Segmentation Using an Ensemble of Semantic Neural
Networks [62.997667081978825]
本稿では,意味的畳み込みニューラルネットワークのアンサンブルに基づく兵器検出システムを提案する。
特定のタスクに特化した単純なニューラルネットワークのセットは、計算リソースを少なくし、並列にトレーニングすることができる。
個々のネットワークの出力の集約によって与えられるシステムの全体的な出力は、ユーザが偽陽性と偽陰性とをトレードオフするように調整することができる。
論文 参考訳(メタデータ) (2020-02-11T13:58:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。