論文の概要: Counter-Empirical Attacking based on Adversarial Reinforcement Learning
for Time-Relevant Scoring System
- arxiv url: http://arxiv.org/abs/2311.05144v1
- Date: Thu, 9 Nov 2023 04:49:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-10 16:05:50.622540
- Title: Counter-Empirical Attacking based on Adversarial Reinforcement Learning
for Time-Relevant Scoring System
- Title(参考訳): 時間関連スコーリングシステムにおける対向強化学習に基づくカウンター・エミュラル・アタック
- Authors: Xiangguo Sun, Hong Cheng, Hang Dong, Bo Qiao, Si Qin, Qingwei Lin
- Abstract要約: そこで我々は,評価システムの経験則を破ろうとする「攻撃的攻撃」機構を提案する。
対人学習問題を訓練することにより、経験的基準を破ろうとする攻撃活動トレースに対して、適切なスコアリング機能が堅牢であることを学ぶことができる。
- 参考スコア(独自算出の注目度): 22.86575572172689
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scoring systems are commonly seen for platforms in the era of big data. From
credit scoring systems in financial services to membership scores in E-commerce
shopping platforms, platform managers use such systems to guide users towards
the encouraged activity pattern, and manage resources more effectively and more
efficiently thereby. To establish such scoring systems, several "empirical
criteria" are firstly determined, followed by dedicated top-down design for
each factor of the score, which usually requires enormous effort to adjust and
tune the scoring function in the new application scenario. What's worse, many
fresh projects usually have no ground-truth or any experience to evaluate a
reasonable scoring system, making the designing even harder. To reduce the
effort of manual adjustment of the scoring function in every new scoring
system, we innovatively study the scoring system from the preset empirical
criteria without any ground truth, and propose a novel framework to improve the
system from scratch. In this paper, we propose a "counter-empirical attacking"
mechanism that can generate "attacking" behavior traces and try to break the
empirical rules of the scoring system. Then an adversarial "enhancer" is
applied to evaluate the scoring system and find the improvement strategy. By
training the adversarial learning problem, a proper scoring function can be
learned to be robust to the attacking activity traces that are trying to
violate the empirical criteria. Extensive experiments have been conducted on
two scoring systems including a shared computing resource platform and a
financial credit system. The experimental results have validated the
effectiveness of our proposed framework.
- Abstract(参考訳): スコアリングシステムはビッグデータ時代のプラットフォームで一般的に見られる。
金融サービスのクレジットスコアシステムからeコマースショッピングプラットフォームの会員スコアに至るまで、プラットフォームマネージャはこのようなシステムを使用して、奨励されたアクティビティパターンに向かってユーザーをガイドし、リソースをより効果的かつ効率的に管理する。
このようなスコアリングシステムを確立するために、まずいくつかの"empirical criteria"が決定され、その後にスコアの要素ごとに専用のトップダウン設計が行われ、新しいアプリケーションシナリオにおけるスコアリング機能の調整とチューニングに多大な労力がかかる。
さらに悪いことに、多くの新プロジェクトは通常、合理的なスコアリングシステムを評価するための基盤や経験を持っていません。
新たなスコアリングシステムにおけるスコアリング機能を手動で調整する作業の軽減を図るため,事前に設定した実験基準からスコアリングシステムを革新的に研究し,ゼロからシステムを改善するための新しい枠組みを提案する。
本稿では, 「攻撃」 行動トレースを生成し, スコアリングシステムの経験則を破ろうとする「カウンタ-empirical attack」メカニズムを提案する。
そして、相手の「エンハンサー」を適用してスコアシステムを評価し、改善戦略を見出す。
対人学習問題を訓練することにより、経験的基準を破ろうとする攻撃活動トレースに対して、適切なスコアリング機能が堅牢であることを学ぶことができる。
共有コンピューティングリソースプラットフォームと金融クレジットシステムを含む2つのスコアリングシステムに関する広範な実験が行われた。
実験により,提案手法の有効性が検証された。
関連論文リスト
- Learning Fair Ranking Policies via Differentiable Optimization of
Ordered Weighted Averages [55.04219793298687]
本稿では,学習からランクへの学習ループに,効率よく解ける公正ランキングモデルを組み込む方法について述べる。
特に,本論文は,OWA目標の制約された最適化を通じてバックプロパゲーションを行う方法を示す最初のものである。
論文 参考訳(メタデータ) (2024-02-07T20:53:53Z) - Learning Recovery Strategies for Dynamic Self-healing in Reactive
Systems [1.7218973692320518]
自己修復システムは、既知の障害状態から回復するための事前定義された命令のセットに従うことに依存する。
本提案では,システム特性の満足度条件を規定する述語としてモニタを定義する。
我々は、強化学習に基づく手法を用いて、ユーザの修正シーケンスに基づいた回復戦略を学習する。
論文 参考訳(メタデータ) (2024-01-22T23:34:21Z) - Universal Evasion Attacks on Summarization Scoring [0.3121997724420106]
回帰機械学習タスクの文脈で自動スコアリングを行う。
私たちはその頑丈さを探求するために脱出攻撃を実行します。
BERTScoreのバックドアが観測され、単純なトリガーは任意の自動要約方法よりも高いスコアを得られる。
論文 参考訳(メタデータ) (2022-10-25T18:25:47Z) - Evaluating Machine Unlearning via Epistemic Uncertainty [78.27542864367821]
本研究では,不確実性に基づく機械学習アルゴリズムの評価を行う。
これは私たちの最良の知識の一般的な評価の最初の定義です。
論文 参考訳(メタデータ) (2022-08-23T09:37:31Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - Large-Scale Sequential Learning for Recommender and Engineering Systems [91.3755431537592]
本稿では,現在の状況に適応してパーソナライズされたランキングを提供する自動アルゴリズムの設計に焦点を当てる。
前者はSAROSと呼ばれる新しいアルゴリズムを提案し,インタラクションの順序を学習するためのフィードバックの種類を考慮に入れている。
提案手法は, 電力網の故障検出に対する初期アプローチと比較して, 統計的に有意な結果を示す。
論文 参考訳(メタデータ) (2022-05-13T21:09:41Z) - Towards a Fairness-Aware Scoring System for Algorithmic Decision-Making [35.21763166288736]
本稿では,データ駆動型フェアネス対応スコアリングシステムを構築するための一般的なフレームワークを提案する。
提案するフレームワークは,実践者や政策立案者に対して,希望する公正性要件を選択するための柔軟性を提供する。
論文 参考訳(メタデータ) (2021-09-21T09:46:35Z) - Indicators of Attack Failure: Debugging and Improving Optimization of
Adversarial Examples [29.385242714424624]
機械学習モデルの頑健さを敵の例に評価することは難しい問題である。
我々は、勾配に基づく攻撃の最適化において共通の障害を明らかにするための定量的指標のセットを定義する。
実験により,現在の対向ロバスト性評価を可視化し,デバッグし,改善するために,提案した障害指標が有効であることを示す。
論文 参考訳(メタデータ) (2021-06-18T06:57:58Z) - Robustness Gym: Unifying the NLP Evaluation Landscape [91.80175115162218]
ディープニューラルネットワークは、現実のシステムにデプロイすると脆くなることが多い。
最近の研究は、そのようなモデルの堅牢性をテストすることに重点を置いている。
単純かつ評価可能なツールキットであるRobustness Gymの形で解を提案する。
論文 参考訳(メタデータ) (2021-01-13T02:37:54Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - Active Bayesian Assessment for Black-Box Classifiers [20.668691047355072]
本稿では,信頼性とラベル効率の両面でのデシラタを満たすため,分類器の性能を評価するためのベイズ的手法を提案する。
まず、精度、誤分類コスト、校正誤差などの一般的な評価指標の不確かさを定量化する推論手法を開発する。
次に、推論不確実性を用いたベイズ評価のための一般的な枠組みを提案し、ラベリングのための効率的なインスタンス選択を導出する。
論文 参考訳(メタデータ) (2020-02-16T08:08:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。