論文の概要: Security Risks of AI Agents Hiring Humans: An Empirical Marketplace Study
- arxiv url: http://arxiv.org/abs/2602.19514v1
- Date: Mon, 23 Feb 2026 05:08:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.68375
- Title: Security Risks of AI Agents Hiring Humans: An Empirical Marketplace Study
- Title(参考訳): 人間を雇用するAIエージェントのセキュリティリスク : 実証的マーケットプレーススタディ
- Authors: Pulak Mehta,
- Abstract要約: エージェントがタスクを投稿し、支払いを管理するマーケットプレースであるRENTAHUMAN.AIから、303の報奨金を分析する。
99の報奨金(32.7%)はプログラムチャネル(APIまたはMPP)に由来する。
資格詐欺、身元偽装、自動偵察、ソーシャルメディア操作、認証、回避、レファレンシャル詐欺の6つのアクティブな虐待クラスを、労働者1人当たり25ドルの中央値で購入可能である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous AI agents can now programmatically hire human workers through marketplaces using REST APIs and Model Context Protocol (MCP) integrations. This creates an attack surface analogous to CAPTCHA-solving services but with physical-world reach. We present an empirical measurement study of this threat, analyzing 303 bounties from RENTAHUMAN.AI, a marketplace where agents post tasks and manage escrow payments. We find that 99 bounties (32.7%), originate from programmatic channels (API keys or MCP). Using a dual-coder methodology (\k{appa} = 0.86 ), we identify six active abuse classes: credential fraud, identity impersonation, automated reconnaissance, social media manipulation, authentication circumvention, and referral fraud, all purchasable for a median of $25 per worker. A retrospective evaluation of seven content-screening rules flags 52 bounties (17.2%) with a single false positive, demonstrating that while basic defenses are feasible, they are currently absent.
- Abstract(参考訳): 自律型AIエージェントは、REST APIとモデルコンテキストプロトコル(MCP)の統合を使用して、マーケットプレースを通じてヒューマンワーカーをプログラム的に採用できるようになった。
これにより、CAPTCHA解決サービスに類似した攻撃面が生成されるが、物理世界への到達は可能である。
我々は,この脅威を実証的に測定し,エージェントがタスクを投稿しエスクロー支払いを管理するマーケットプレースであるRENTAHHMAN.AIから303の報奨金を分析した。
99の報奨金(32.7%)は、プログラム的なチャネル(APIキーまたはMPP)に由来する。
デュアルコーダ手法(\k{appa} = 0.86 )を用いて、資格詐欺、アイデンティティの偽装、自動偵察、ソーシャルメディア操作、認証回避、レファレンシャル詐欺の6つのアクティブな乱用クラスを特定し、労働者1人当たり25ドルの中央値で購入可能である。
7つのコンテンツスクリーニングルールフラグである52の報奨金(17.2%)を1つの偽陽性で振り返り評価し、基本的な防御は可能であるが、現在は欠落していることを示した。
関連論文リスト
- Comparing AI Agents to Cybersecurity Professionals in Real-World Penetration Testing [83.48116811975787]
我々は、人間のサイバーセキュリティ専門家に対するAIエージェントの包括的な評価を初めて提示する。
我々は、既存の6人のAIエージェントと、新しいエージェントの足場であるARTEMISとともに、10人のサイバーセキュリティ専門家を評価します。
ARTEMISは総合的に第2位で、9つの有効な脆弱性と82%の有効な提出率を発見した。
論文 参考訳(メタデータ) (2025-12-10T18:12:29Z) - Holistic Agent Leaderboard: The Missing Infrastructure for AI Agent Evaluation [87.47155146067962]
数百のタスクで並列評価をオーケストレーションする,標準化された評価ハーネスを提供する。
モデル、足場、ベンチマークにまたがる3次元解析を行う。
私たちの分析では、ほとんどのランで精度を低下させる高い推論努力など、驚くべき洞察が示されています。
論文 参考訳(メタデータ) (2025-10-13T22:22:28Z) - Multi-Agent Penetration Testing AI for the Web [3.93181912653522]
MAPTAは、自動Webアプリケーションセキュリティアセスメントのためのマルチエージェントシステムである。
大規模な言語モデルのオーケストレーションとツール地上実行とエンドツーエンドのエクスプロイトバリデーションを組み合わせたものだ。
104Challenge XBOWベンチマークでは、MAPTAは76.9%の成功を収めた。
論文 参考訳(メタデータ) (2025-08-28T14:14:24Z) - Security Challenges in AI Agent Deployment: Insights from a Large Scale Public Competition [101.86739402748995]
44の現実的なデプロイメントシナリオを対象とした,22のフロンティアAIエージェントを対象にしています。
Agent Red Teamingベンチマークを構築し、19の最先端モデルで評価します。
私たちの発見は、今日のAIエージェントの重要かつ永続的な脆弱性を浮き彫りにしたものです。
論文 参考訳(メタデータ) (2025-07-28T05:13:04Z) - OpenAgentSafety: A Comprehensive Framework for Evaluating Real-World AI Agent Safety [58.201189860217724]
OpenAgentSafetyは,8つの危機リスクカテゴリにまたがるエージェントの動作を評価する包括的なフレームワークである。
従来の作業とは異なり、我々のフレームワークは、Webブラウザ、コード実行環境、ファイルシステム、bashシェル、メッセージングプラットフォームなど、実際のツールと対話するエージェントを評価します。
ルールベースの分析とLSM-as-judgeアセスメントを組み合わせることで、過度な行動と微妙な不安全行動の両方を検出する。
論文 参考訳(メタデータ) (2025-07-08T16:18:54Z) - AI Agent Smart Contract Exploit Generation [8.69235891205913]
A1は、いかなる大規模言語モデルもエンドツーエンドのエクスプロイトジェネレータに変換するエージェントシステムである。
A1は、自律的な脆弱性発見のための6つのドメイン固有のツールを提供する。
我々は、A1がエクスプロイト当たり最大8.59億ドル、合計9.33億ドルを抽出していることを示す。
論文 参考訳(メタデータ) (2025-07-08T00:45:26Z) - Decompiling Smart Contracts with a Large Language Model [51.49197239479266]
Etherscanの78,047,845のスマートコントラクトがデプロイされているにも関わらず(2025年5月26日現在)、わずか767,520 (1%)がオープンソースである。
この不透明さは、オンチェーンスマートコントラクトバイトコードの自動意味解析を必要とする。
バイトコードを可読でセマンティックに忠実なSolidityコードに変換する,先駆的な逆コンパイルパイプラインを導入する。
論文 参考訳(メタデータ) (2025-06-24T13:42:59Z) - Do the Rewards Justify the Means? Measuring Trade-Offs Between Rewards
and Ethical Behavior in the MACHIAVELLI Benchmark [61.43264961005614]
我々は、50万以上のリッチで多様なシナリオを含む134個のChoose-Your-Own-Adventureゲームのベンチマークを開発する。
我々は、エージェントの傾向をパワー・シーキングと評価し、不使用を生じさせ、倫理的違反を犯す。
以上の結果から,エージェントは有能かつ道徳的に行動できることが示唆された。
論文 参考訳(メタデータ) (2023-04-06T17:59:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。