論文の概要: Don't Lie to Me: Avoiding Malicious Explanations with STEALTH
- arxiv url: http://arxiv.org/abs/2301.10407v1
- Date: Wed, 25 Jan 2023 05:00:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-26 15:55:21.466549
- Title: Don't Lie to Me: Avoiding Malicious Explanations with STEALTH
- Title(参考訳): 嘘をつくな:STEALTHで悪意ある説明を避ける
- Authors: Lauren Alvarez and Tim Menzies
- Abstract要約: STEALTHは、悪意のある攻撃に悩まされることなく、AI生成モデルを使用する方法である。
データをクラスタリングした後、STEALTHシステムはAIモデルにクラスラベルに関するクエリを限定的に要求する。
- 参考スコア(独自算出の注目度): 26.56743917195549
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: STEALTH is a method for using some AI-generated model, without suffering from
malicious attacks (i.e. lying) or associated unfairness issues. After
recursively bi-clustering the data, STEALTH system asks the AI model a limited
number of queries about class labels. STEALTH asks so few queries (1 per data
cluster) that malicious algorithms (a) cannot detect its operation, nor (b)
know when to lie.
- Abstract(参考訳): STEALTHは、悪意のある攻撃(すなわち嘘)や関連する不正問題に苦しむことなく、AI生成モデルを使用する方法である。
再帰的にデータをクラスタリングした後、STEALTHシステムはAIモデルにクラスラベルに関するクエリを限定的に要求する。
STEALTHが悪意のあるアルゴリズムを問うクエリ(データクラスタあたり1)をほとんど求めない
a)その動作を検出することができず
(b)いつ嘘をつくかを知る。
関連論文リスト
- MUSE: Machine Unlearning Six-Way Evaluation for Language Models [109.76505405962783]
言語モデル(LM)は、プライベートおよび著作権のあるコンテンツを含む大量のテキストデータに基づいて訓練される。
総合的な機械学習評価ベンチマークであるMUSEを提案する。
人気のある8つのアンラーニングアルゴリズムがハリー・ポッターの本やニュース記事をいかに効果的に解き放つかをベンチマークする。
論文 参考訳(メタデータ) (2024-07-08T23:47:29Z) - Mitigating Data Injection Attacks on Federated Learning [20.24380409762923]
フェデレートラーニング(Federated Learning)は、複数のエンティティがデータを使ってモデルを協調的にトレーニングすることを可能にするテクニックである。
その利点にもかかわらず、フェデレートされた学習は偽のデータ注入攻撃の影響を受けやすい。
本稿では,フェデレート学習システムにおけるデータインジェクション攻撃の検出と緩和を行う新しい手法を提案する。
論文 参考訳(メタデータ) (2023-12-04T18:26:31Z) - Frontier Language Models are not Robust to Adversarial Arithmetic, or
"What do I need to say so you agree 2+2=5? [88.59136033348378]
言語モデルアライメントのための単純なテストベッドを提供する逆算術の問題を考察する。
この問題は自然言語で表される算術的な問題から成り、質問が完了する前に任意の逆文字列を挿入する。
これらの攻撃に対して、強化学習やエージェント構成ループを通じて、モデルを部分的に強化できることが示される。
論文 参考訳(メタデータ) (2023-11-08T19:07:10Z) - Linear Scalarization for Byzantine-robust learning on non-IID data [3.098066034546503]
クライアント間のデータが異種である場合,ビザンチン・ロバスト学習の問題点について検討する。
本研究では,非IID環境でのビザンチン攻撃を回避するため,線形スカラー化(LS)を有効活用する手法を提案する。
論文 参考訳(メタデータ) (2022-10-15T13:24:00Z) - A Non-monotonic Self-terminating Language Model [62.93465126911921]
本稿では,不完全復号アルゴリズムによる非終端列の問題に焦点をあてる。
まず、グリーディ探索、トップ$kのサンプリング、核サンプリングを含む不完全確率復号アルゴリズムを定義する。
次に,単調な終端確率の制約を緩和する非単調な自己終端言語モデルを提案する。
論文 参考訳(メタデータ) (2022-10-03T00:28:44Z) - CGUA: Context-Guided and Unpaired-Assisted Weakly Supervised Person
Search [54.106662998673514]
本稿では,コンテキストガイドとアンペア支援(CGUA)を弱教師付き人物検索フレームワークとして導入する。
具体的には、クラスタリングプロセスにおけるコンテキスト情報を活用する新しいコンテキストガイドクラスタ(CGC)アルゴリズムを提案する。
本手法は,より多様なラベル付きデータを活用することにより,最先端の教師付き手法に匹敵する,あるいは優れた性能を実現する。
論文 参考訳(メタデータ) (2022-03-27T13:57:30Z) - Robust Deep Semi-Supervised Learning: A Brief Introduction [63.09703308309176]
半教師付き学習(SSL)は、ラベルが不十分なときにラベル付きデータを活用することにより、学習性能を向上させることを目的としている。
ディープモデルによるSSLは、標準ベンチマークタスクで成功したことが証明されている。
しかし、それらは現実世界のアプリケーションにおける様々な堅牢性に対する脅威に対して依然として脆弱である。
論文 参考訳(メタデータ) (2022-02-12T04:16:41Z) - An Analysis Of Protected Health Information Leakage In Deep-Learning
Based De-Identification Algorithms [10.609854621863757]
LSTM(Long Short-Term Memory)に基づく最先端自由テキスト識別アルゴリズムの解析
我々は、LSTMの出力を用いてトレーニングデータのメンバシップを推定できるかどうかを評価するために、モデルをトレーニングし、分析した。
その結果、モデル出力に基づいて、トレーニングデータのメンバーが非メンバーと区別できるかどうかを特定できないことが示唆された。
論文 参考訳(メタデータ) (2021-01-28T16:38:11Z) - A Second-Order Approach to Learning with Instance-Dependent Label Noise [58.555527517928596]
ラベルノイズの存在は、しばしばディープニューラルネットワークのトレーニングを誤解させる。
人間による注釈付きラベルのエラーは、タスクの難易度レベルに依存する可能性が高いことを示しています。
論文 参考訳(メタデータ) (2020-12-22T06:36:58Z) - Unsupervised Anomaly Detectors to Detect Intrusions in the Current
Threat Landscape [0.11470070927586014]
本研究では,Isolation Forests,One-Class Support Vector Machines,Self-Organizing Mapsが侵入検知用よりも有効であることを示した。
不安定、分散、あるいは非可逆的行動による攻撃を、ファジング、ワーム、ボットネットなどによって検出することがより困難である点を詳述する。
論文 参考訳(メタデータ) (2020-12-21T14:06:58Z) - Task-Aware Variational Adversarial Active Learning [42.334671410592065]
本稿では,タスク非依存のVAALを修飾するタスク対応可変逆数AL(TA-VAAL)を提案する。
提案するTA-VAALは、バランスの取れたラベルとバランスの取れないラベルの分類のための様々なベンチマークデータセットにおいて、最先端の性能を向上する。
論文 参考訳(メタデータ) (2020-02-11T22:00:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。