論文の概要: Geometry-Aware Backdoor Attacks: Leveraging Curvature in Hyperbolic Embeddings
- arxiv url: http://arxiv.org/abs/2510.06397v1
- Date: Tue, 07 Oct 2025 19:24:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.167638
- Title: Geometry-Aware Backdoor Attacks: Leveraging Curvature in Hyperbolic Embeddings
- Title(参考訳): 幾何学を意識したバックドアアタック:双曲型埋め込みにおける曲率の活用
- Authors: Ali Baheri,
- Abstract要約: 非ユークリッド基底モデルは双曲幾何学のような曲線空間に表現を配置する。
入力空間の小さな変化は標準の入力空間検出器には微妙に見えるが、モデルの表現空間において不均等に大きな変化をもたらす。
本稿では,幾何適応型トリガを提案し,タスクやアーキテクチャにわたって評価する。
- 参考スコア(独自算出の注目度): 3.8806403512213787
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Non-Euclidean foundation models increasingly place representations in curved spaces such as hyperbolic geometry. We show that this geometry creates a boundary-driven asymmetry that backdoor triggers can exploit. Near the boundary, small input changes appear subtle to standard input-space detectors but produce disproportionately large shifts in the model's representation space. Our analysis formalizes this effect and also reveals a limitation for defenses: methods that act by pulling points inward along the radius can suppress such triggers, but only by sacrificing useful model sensitivity in that same direction. Building on these insights, we propose a simple geometry-adaptive trigger and evaluate it across tasks and architectures. Empirically, attack success increases toward the boundary, whereas conventional detectors weaken, mirroring the theoretical trends. Together, these results surface a geometry-specific vulnerability in non-Euclidean models and offer analysis-backed guidance for designing and understanding the limits of defenses.
- Abstract(参考訳): 非ユークリッド基底モデルは、双曲幾何学のような曲線空間に表現をますます配置する。
この幾何学は、バックドアトリガーが活用できる境界駆動の非対称性を生み出すことを示す。
境界付近では、標準入力空間検出器に対して小さな入力変化は微妙に見えるが、モデルの表現空間において非常に大きなシフトをもたらす。
我々の分析では、この効果を形式化し、防御の限界も明らかにしている:半径に沿って内側にポイントを引くことによって、そのようなトリガーを抑えることができるが、同じ方向に有用なモデル感度を犠牲にすることでのみ、その効果を抑えることができる。
これらの知見に基づいて、簡単な幾何学的適応トリガを提案し、タスクやアーキテクチャにわたって評価する。
経験的に、攻撃の成功は境界に向かって増加するが、従来の検出器は弱まり、理論的な傾向を反映する。
これらの結果は、非ユークリッドモデルにおいて幾何学特有の脆弱性を表面化し、防衛の限界を設計し理解するための分析支援のガイダンスを提供する。
関連論文リスト
- Exploiting Edge Features for Transferable Adversarial Attacks in Distributed Machine Learning [54.26807397329468]
この研究は、分散ディープラーニングシステムにおいて、これまで見過ごされていた脆弱性を探究する。
中間的特徴をインターセプトする敵は、依然として深刻な脅威となる可能性がある。
本稿では,分散環境に特化して設計されたエクスプロイト戦略を提案する。
論文 参考訳(メタデータ) (2025-07-09T20:09:00Z) - Geometry-Guided Adversarial Prompt Detection via Curvature and Local Intrinsic Dimension [10.892846618107392]
CurvaLIDは、その幾何学的性質を活用することで、敵のプロンプトを効率的に検出する新しい防御フレームワークである。
CurvaLIDは、テキストの幾何学的解析に基づいて、その基礎となる違いを明らかにする。
以上の結果から,敵対的プロンプトは良性プロンプトと異なる幾何学的シグネチャを呈し,CurvaLIDがほぼ完璧に分類できることが示唆された。
論文 参考訳(メタデータ) (2025-03-05T13:47:53Z) - Decoder ensembling for learned latent geometries [15.484595752241122]
我々は、関連する予想多様体上の測地線を容易に計算する方法を示す。
このシンプルで信頼性が高く、簡単に使える潜在測地に一歩近づきます。
論文 参考訳(メタデータ) (2024-08-14T12:35:41Z) - BadGD: A unified data-centric framework to identify gradient descent vulnerabilities [10.996626204702189]
BadGDは、敵の操作を理解し緩和するための新しい標準を設定している。
この研究は、このようなデータ中心の攻撃によって引き起こされる深刻な脅威を強調し、機械学習における堅牢な防御の必要性を強調している。
論文 参考訳(メタデータ) (2024-05-24T23:39:45Z) - Manifold Integrated Gradients: Riemannian Geometry for Feature Attribution [8.107199775668942]
Integrated Gradients (IG)は、ブラックボックス深層学習モデルの一般的な特徴属性法である。
我々は、IGに関連する2つの主要な課題に対処する。ノイズの多い特徴可視化の生成と、敵の帰属攻撃に対する脆弱性である。
提案手法は,データ多様体の内在的幾何とより密接に関連し,経路に基づく特徴属性の適応を伴う。
論文 参考訳(メタデータ) (2024-05-16T04:13:17Z) - Hide in Thicket: Generating Imperceptible and Rational Adversarial
Perturbations on 3D Point Clouds [62.94859179323329]
3Dポイントクラウド分類のための点操作に基づくアドリアック手法により、3Dモデルの脆弱性を明らかにした。
そこで本研究では,2段階の攻撃領域探索を行うHT-ADV法を提案する。
我々は,良性再サンプリングと良性剛性変換を用いることで,不受容性への犠牲がほとんどなく,身体的敵意の強さをさらに高めることができることを示唆する。
論文 参考訳(メタデータ) (2024-03-08T12:08:06Z) - Curve Your Attention: Mixed-Curvature Transformers for Graph
Representation Learning [77.1421343649344]
本稿では,一定曲率空間の積を完全に操作するトランスフォーマーの一般化を提案する。
また、非ユークリッド注意に対するカーネル化されたアプローチを提供し、ノード数とエッジ数に線形に時間とメモリコストでモデルを実行できるようにします。
論文 参考訳(メタデータ) (2023-09-08T02:44:37Z) - A Unifying and Canonical Description of Measure-Preserving Diffusions [60.59592461429012]
ユークリッド空間における測度保存拡散の完全なレシピは、最近、いくつかのMCMCアルゴリズムを単一のフレームワークに統合した。
我々は、この構成を任意の多様体に改善し一般化する幾何学理論を開発する。
論文 参考訳(メタデータ) (2021-05-06T17:36:55Z) - GELATO: Geometrically Enriched Latent Model for Offline Reinforcement
Learning [54.291331971813364]
オフライン強化学習アプローチは、近近法と不確実性認識法に分けられる。
本研究では,この2つを潜在変動モデルに組み合わせることのメリットを実証する。
提案したメトリクスは、分布サンプルのアウトの品質と、データ内のサンプルの不一致の両方を測定します。
論文 参考訳(メタデータ) (2021-02-22T19:42:40Z) - Orthogonal Deep Models As Defense Against Black-Box Attacks [71.23669614195195]
攻撃者が標的モデルに類似したモデルを用いて攻撃を発生させるブラックボックス設定における深層モデル固有の弱点について検討する。
本稿では,深部モデルの内部表現を他のモデルに直交させる新しい勾配正規化手法を提案する。
様々な大規模モデルにおいて,本手法の有効性を検証する。
論文 参考訳(メタデータ) (2020-06-26T08:29:05Z) - Smoothed Geometry for Robust Attribution [36.616902063693104]
特徴属性はディープニューラルネットワーク(DNN)の振る舞いを説明する一般的なツールである
それらは、近くの入力に対して異なる説明をもたらす攻撃に弱いことが示されている。
この堅牢性の欠如は、敵対的に操作された説明が安全性と信頼性を損なう可能性のある、高度なアプリケーションにおいて特に問題となる。
論文 参考訳(メタデータ) (2020-06-11T17:35:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。