論文の概要: Investigating the Impact of Dark Patterns on LLM-Based Web Agents
- arxiv url: http://arxiv.org/abs/2510.18113v1
- Date: Mon, 20 Oct 2025 21:26:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:12.630988
- Title: Investigating the Impact of Dark Patterns on LLM-Based Web Agents
- Title(参考訳): LLMに基づくWebエージェントにおけるダークパターンの影響の検討
- Authors: Devin Ersoy, Brandon Lee, Ananth Shreekumar, Arjun Arunasalam, Muhammad Ibrahim, Antonio Bianchi, Z. Berkay Celik,
- Abstract要約: LLMベースのジェネラリストWebエージェントの意思決定過程に暗黒パターンが与える影響について検討する。
LiteAgentは、エージェントがタスクを実行するように自動的に促す軽量なフレームワークです。
また、eコマース、ストリーミングサービス、ニュースプラットフォームといったドメインからWebアプリケーションを構成する制御環境であるTrickyArenaについても紹介する。
- 参考スコア(独自算出の注目度): 16.297159088186888
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As users increasingly turn to large language model (LLM) based web agents to automate online tasks, agents may encounter dark patterns: deceptive user interface designs that manipulate users into making unintended decisions. Although dark patterns primarily target human users, their potentially harmful impacts on LLM-based generalist web agents remain unexplored. In this paper, we present the first study that investigates the impact of dark patterns on the decision-making process of LLM-based generalist web agents. To achieve this, we introduce LiteAgent, a lightweight framework that automatically prompts agents to execute tasks while capturing comprehensive logs and screen-recordings of their interactions. We also present TrickyArena, a controlled environment comprising web applications from domains such as e-commerce, streaming services, and news platforms, each containing diverse and realistic dark patterns that can be selectively enabled or disabled. Using LiteAgent and TrickyArena, we conduct multiple experiments to assess the impact of both individual and combined dark patterns on web agent behavior. We evaluate six popular LLM-based generalist web agents across three LLMs and discover that when there is a single dark pattern present, agents are susceptible to it an average of 41% of the time. We also find that modifying dark pattern UI attributes through visual design changes or HTML code adjustments and introducing multiple dark patterns simultaneously can influence agent susceptibility. This study emphasizes the need for holistic defense mechanisms in web agents, encompassing both agent-specific protections and broader web safety measures.
- Abstract(参考訳): オンラインタスクを自動化するために、ユーザが大規模言語モデル(LLM)ベースのWebエージェントに目を向けるにつれて、エージェントはダークパターンに遭遇する可能性がある。
ダークパターンは主に人間のユーザーをターゲットとしているが、LLMベースのジェネラリストWebエージェントに対する有害な影響は未発見のままである。
本稿では,LLMに基づくジェネラリストWebエージェントの意思決定過程に暗黒パターンが与える影響を初めて研究する。
これを実現するために、LiteAgentという軽量なフレームワークを導入し、エージェントがタスクを実行するように促し、包括的なログと対話の画面記録をキャプチャする。
また,eコマース,ストリーミングサービス,ニュースプラットフォームなどのドメインからWebアプリケーションを構成するコントロール環境であるTickyArenaについても紹介する。
LiteAgent と TrickyArena を用いて,Web エージェントの動作に対する個々のパターンと組み合わせたダークパターンの影響を評価する。
3つのLCMにまたがる6つの一般的なLCMベースのジェネラリストWebエージェントを評価し、単一のダークパターンが存在する場合、エージェントは平均41%の時間でその影響を受けやすいことを発見した。
また、ビジュアルデザインの変更やHTMLコードの調整、同時に複数のダークパターンを導入することで、ダークパターンのUI属性の変更がエージェントの感受性に影響を与える可能性があることもわかりました。
本研究は、エージェント固有の保護とより広範なWeb安全対策の両方を包含する、Webエージェントの全体防衛機構の必要性を強調した。
関連論文リスト
- AgentVigil: Generic Black-Box Red-teaming for Indirect Prompt Injection against LLM Agents [54.29555239363013]
本稿では,間接的なインジェクション脆弱性を自動的に検出し,悪用するための汎用的なブラックボックスファジリングフレームワークであるAgentVigilを提案する。
我々はAgentVigilをAgentDojoとVWA-advの2つの公開ベンチマークで評価し、o3-miniとGPT-4oに基づくエージェントに対して71%と70%の成功率を達成した。
攻撃を現実世界の環境に適用し、悪質なサイトを含む任意のURLに誘導するエージェントをうまく誘導する。
論文 参考訳(メタデータ) (2025-05-09T07:40:17Z) - AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents [52.13695464678006]
本研究は, 観察空間と行動空間を簡略化することで, LLMベースのWebエージェントを強化する。
AgentOccam は以前の最先端および同時処理を 9.8 (+29.4%) と 5.9 (+15.8%) で上回っている。
論文 参考訳(メタデータ) (2024-10-17T17:50:38Z) - WIPI: A New Web Threat for LLM-Driven Web Agents [28.651763099760664]
我々は、Web Agentを間接的に制御し、公開されているWebページに埋め込まれた悪意ある命令を実行する、新しい脅威WIPIを導入する。
WIPIを成功させるためには、ブラックボックス環境で動作させる。
提案手法は,純ブラックボックスシナリオにおいても平均攻撃成功率(ASR)が90%を超えることを達成している。
論文 参考訳(メタデータ) (2024-02-26T19:01:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。