論文の概要: Incentives and Outcomes in Bug Bounties
- arxiv url: http://arxiv.org/abs/2509.16655v1
- Date: Sat, 20 Sep 2025 12:02:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 15:06:07.398843
- Title: Incentives and Outcomes in Bug Bounties
- Title(参考訳): バグバウンティのインセンティブと成果
- Authors: Serena Wang, Martino Banchio, Krzysztof Kotowicz, Katrina Ligett, R. Preston McAfee, Eduardo' Vela'' Nava,
- Abstract要約: GoogleのVulnerability Rewards Program(VRP)におけるインセンティブと成果の分析
我々は、2024年7月に投稿されたGoogleの報酬額の変更に焦点を当て、最高のインパクト層に対して最大200%まで報酬額が増加した。
実験の結果,報酬増加後の高付加価値バグの量が増加し,弾力性も向上した。
- 参考スコア(独自算出の注目度): 2.1517336465358503
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bug bounty programs have contributed significantly to security in technology firms in the last decade, but little is known about the role of reward incentives in producing useful outcomes. We analyze incentives and outcomes in Google's Vulnerability Rewards Program (VRP), one of the world's largest bug bounty programs. We analyze the responsiveness of the quality and quantity of bugs received to changes in payments, focusing on a change in Google's reward amounts posted in July, 2024, in which reward amounts increased by up to 200% for the highest impact tier. Our empirical results show an increase in the volume of high-value bugs received after the reward increase, for which we also compute elasticities. We further break down the sources of this increase between veteran researchers and new researchers, showing that the reward increase both redirected the attention of veteran researchers and attracted new top security researchers into the program.
- Abstract(参考訳): バグ報奨金プログラムは、過去10年間、テクノロジー企業のセキュリティに大きく貢献してきたが、有益な成果を生み出す上での報酬インセンティブの役割についてはほとんど知られていない。
私たちは、世界最大のバグ報奨金プログラムのひとつであるGoogleのVulnerability Rewards Program(VRP)のインセンティブと成果を分析します。
我々は、2024年7月に投稿されたGoogleの報酬額の変化に焦点を当て、支払いの変化に対して受け取った品質とバグ量の応答性を分析した。
実験の結果,報酬増加後の高付加価値バグの量が増加し,弾力性も向上した。
我々は、ベテラン研究者と新しい研究者の間でこの増加の源泉をさらに分断し、報酬の増加がベテラン研究者の注意を振り返り、新しいトップセキュリティ研究者をこのプログラムに惹きつけたことを示す。
関連論文リスト
- Adversarial Reward Auditing for Active Detection and Mitigation of Reward Hacking [69.06218054848803]
本稿では,報酬ハッキングを動的かつ競争的なゲームとして再認識するフレームワークであるAdrial Reward Auditing(ARA)を提案する。
まず、ハッカーポリシーは報酬モデルの脆弱性を発見し、監査人は潜伏表現からのエクスプロイトを検出することを学習する。
ARAはすべてのベースラインの中で最高のアライメントユーティリティトレードオフを実現しています。
論文 参考訳(メタデータ) (2026-02-02T07:34:57Z) - Stabilizing Long-term Multi-turn Reinforcement Learning with Gated Rewards [13.70228195630989]
本稿では,マルチターンインタラクション,dockerベースの実行,カスタマイズ可能な報酬関数をサポートする統合システムであるSWE指向RLフレームワークを紹介する。
Gated Reward Accumulation (G-RA) も提案する。これは,高位(長期)の報酬が予め定義された閾値を満たす場合にのみ,即時報酬を蓄積する新しい手法である。
論文 参考訳(メタデータ) (2025-08-14T11:37:02Z) - Process Reinforcement through Implicit Rewards [94.09453548052862]
複雑なプロセス報酬は、大きな言語モデル(LLM)の推論時間スケーリングにおいて、スパースな結果レベルの報酬よりも効果的な選択肢であることが証明されている。
ディエンス報酬は、その微粒な報酬が結果報酬の固有の問題に対処する可能性があるため、LLMの強化学習(RL)に魅力的な選択を与える。
これは主に、高品質なプロセスラベルの収集が違法に高価であるオンラインのトレーニングプロセス報酬モデル(PRM)の課題に起因する可能性がある。
提案するPRIMEは,ポリシロールアウトと結果ラベルのみを用いて,インプットプロセス報酬によるオンラインPRM更新を可能にする。
論文 参考訳(メタデータ) (2025-02-03T15:43:48Z) - Exploring the Impact of Rewards on Developers' Proactive AI Accountability Behavior [0.0]
我々は、報酬と制裁がAI開発者に与える影響を明らかにするために、自己決定理論に基づく理論モデルを開発する。
各種ドメインの関連研究を調査した結果,典型的な制裁措置とバグ報奨金は潜在的報酬メカニズムとして同定された。
論文 参考訳(メタデータ) (2024-11-27T14:34:44Z) - Artificial Bugs for Crowdsearch [0.0]
人工的なバグを挿入して、実際の(有機的な)バグを検索するインセンティブを高めることで、このようなプログラムを強化することを提案する。
このために、人工的なバグをひとつだけ挿入するだけで十分であることを示す。
論文 参考訳(メタデータ) (2024-03-14T15:27:14Z) - REBEL: Reward Regularization-Based Approach for Robotic Reinforcement Learning from Human Feedback [61.54791065013767]
報酬関数と人間の嗜好の相違は、現実世界で破滅的な結果をもたらす可能性がある。
近年の手法は、人間の嗜好から報酬関数を学習することで、不適応を緩和することを目的としている。
本稿では,ロボットRLHFフレームワークにおける報酬正規化の新たな概念を提案する。
論文 参考訳(メタデータ) (2023-12-22T04:56:37Z) - Robust and Performance Incentivizing Algorithms for Multi-Armed Bandits with Strategic Agents [52.75161794035767]
性能インセンティブとロバストネスの2つの目的を同時に満たすバンディットアルゴリズムのクラスを導入する。
そこで本研究では,第2価格オークションのアイデアをアルゴリズムと組み合わせることで,プリンシパルが腕の性能特性に関する情報を持たないような設定が可能であることを示す。
論文 参考訳(メタデータ) (2023-12-13T06:54:49Z) - Would I have gotten that reward? Long-term credit assignment by
counterfactual contribution analysis [50.926791529605396]
モデルベース信用代入アルゴリズムの新たなファミリーであるCOCOA(Counterfactual Contribution Analysis)を紹介する。
我々のアルゴリズムは、その後の報酬を得る際の行動の貢献度を測定することによって、正確な信用割当を実現する。
論文 参考訳(メタデータ) (2023-06-29T09:27:27Z) - Automatic Reward Design via Learning Motivation-Consistent Intrinsic
Rewards [46.068337522093096]
報酬の最大化という基本的な目標を捉えたモチベーションの概念を導入する。
提案手法は, 遅延報酬, 探索, 信用代入といった問題に対処する上で, 最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-07-29T14:52:02Z) - A Measure of Research Taste [91.3755431537592]
生産性と味の両方に報いる引用に基づく尺度を提案する。
提示された尺度capは、出版物とその量の影響のバランスをとる。
本研究では, 生物学, 計算機科学, 経済学, 物理分野の研究者を対象に, capの特性を解析した。
論文 参考訳(メタデータ) (2021-05-17T18:01:47Z) - Proposal of a Novel Bug Bounty Implementation Using Gamification [0.0]
本稿では,資源需要を緩和し,固有の問題を緩和することを目的とした,新たなバグ報奨金プロセスを提案する。
ゲーミフィケーション要素の導入は、金銭的な報酬の代替となり、バグ報奨プログラムの有効性の軽減も可能となる。
論文 参考訳(メタデータ) (2020-09-21T20:11:53Z) - Fast active learning for pure exploration in reinforcement learning [48.98199700043158]
1/n$でスケールしたボーナスはより高速な学習率をもたらし、地平線への依存に関して既知の上限を改善します。
また, 停止時間の解析を改良することにより, 最良政体識別設定におけるサンプルの複雑さを$H$で改善できることも示している。
論文 参考訳(メタデータ) (2020-07-27T11:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。