論文の概要: Big Help or Big Brother? Auditing Tracking, Profiling, and Personalization in Generative AI Assistants
- arxiv url: http://arxiv.org/abs/2503.16586v1
- Date: Thu, 20 Mar 2025 16:21:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 14:58:04.890302
- Title: Big Help or Big Brother? Auditing Tracking, Profiling, and Personalization in Generative AI Assistants
- Title(参考訳): ビッグヘルプかビッグブラザーか? 生成型AIアシスタントにおけるトラッキング、プロファイリング、パーソナライゼーションの監査
- Authors: Yash Vekaria, Aurelio Loris Canino, Jonathan Levitsky, Alex Ciechonski, Patricia Callejo, Anna Maria Mandalari, Zubair Shafiq,
- Abstract要約: Generative AI(GenAI)ブラウザアシスタントは、WebブラウザにGenAIの強力な機能を統合することで、質問応答、コンテンツ要約、エージェントナビゲーションなどのリッチなエクスペリエンスを提供する。
現在ブラウザ拡張機能として利用可能なこれらのアシスタントは、検索やクリックデータなどの詳細なブラウジングアクティビティを追跡するだけでなく、フォームを埋めたり、プライバシー上の懸念を生じさせるようなタスクを自律的に行うこともできる。
本研究では,ユーザの属性や興味に基づいて,ユーザをプロファイルし,回答をパーソナライズする能力について検討する。
- 参考スコア(独自算出の注目度): 10.38225151849918
- License:
- Abstract: Generative AI (GenAI) browser assistants integrate powerful capabilities of GenAI in web browsers to provide rich experiences such as question answering, content summarization, and agentic navigation. These assistants, available today as browser extensions, can not only track detailed browsing activity such as search and click data, but can also autonomously perform tasks such as filling forms, raising significant privacy concerns. It is crucial to understand the design and operation of GenAI browser extensions, including how they collect, store, process, and share user data. To this end, we study their ability to profile users and personalize their responses based on explicit or inferred demographic attributes and interests of users. We perform network traffic analysis and use a novel prompting framework to audit tracking, profiling, and personalization by the ten most popular GenAI browser assistant extensions. We find that instead of relying on local in-browser models, these assistants largely depend on server-side APIs, which can be auto-invoked without explicit user interaction. When invoked, they collect and share webpage content, often the full HTML DOM and sometimes even the user's form inputs, with their first-party servers. Some assistants also share identifiers and user prompts with third-party trackers such as Google Analytics. The collection and sharing continues even if a webpage contains sensitive information such as health or personal information such as name or SSN entered in a web form. We find that several GenAI browser assistants infer demographic attributes such as age, gender, income, and interests and use this profile--which carries across browsing contexts--to personalize responses. In summary, our work shows that GenAI browser assistants can and do collect personal and sensitive information for profiling and personalization with little to no safeguards.
- Abstract(参考訳): Generative AI(GenAI)ブラウザアシスタントは、WebブラウザにGenAIの強力な機能を統合することで、質問応答、コンテンツ要約、エージェントナビゲーションなどのリッチなエクスペリエンスを提供する。
現在ブラウザ拡張機能として利用可能なこれらのアシスタントは、検索やクリックデータなどの詳細なブラウジングアクティビティを追跡するだけでなく、フォームを埋めたり、プライバシー上の懸念を生じさせるようなタスクを自律的に行うこともできる。
ユーザデータの収集,保存,処理,共有など,GenAIブラウザエクステンションの設計と運用を理解することが不可欠である。
そこで本稿では,ユーザの属性や興味に基づいて,ユーザをプロファイルし,回答をパーソナライズする能力について検討する。
我々は、ネットワークトラフィック分析を行い、最も人気のある10のGenAIブラウザアシスタント拡張によるトラッキング、プロファイリング、パーソナライズを監査するための新しいプロンプトフレームワークを使用する。
ローカルなブラウザ内モデルに頼る代わりに、これらのアシスタントはサーバー側のAPIに依存しており、明示的なユーザインタラクションなしに自動起動できる。
呼び出されると、Webページの内容、しばしば完全なHTML DOM、時にはユーザのフォーム入力さえも、ファーストパーティサーバで収集して共有する。
一部のアシスタントは識別子やユーザープロンプトをGoogle Analyticsのようなサードパーティのトラッカーと共有している。
この収集と共有は、Webページが、Webフォームに入力された名前やSSNなどの健康情報や個人情報などの機密情報を含む場合でも継続する。
いくつかのGenAIブラウザアシスタントは、年齢、性別、収入、興味などの人口統計特性を推測し、このプロファイルを用いて、閲覧コンテキストにまたがって応答をパーソナライズする。
まとめると、われわれの研究は、GenAIブラウザアシスタントがプロファイリングやパーソナライズのための個人情報を、ほとんど、あるいは全く保護することなく収集できることを示している。
関連論文リスト
- Capturing and Anticipating User Intents in Data Analytics via Knowledge Graphs [0.061446808540639365]
この研究は、人間中心の複雑な分析を捉えるための基本的なフレームワークとして、知識グラフ(KG)の使用について検討する。
生成されたKGに格納されたデータは、これらのシステムと対話するユーザーに補助(例えばレコメンデーション)を提供するために利用される。
論文 参考訳(メタデータ) (2024-11-01T20:45:23Z) - Beyond Browsing: API-Based Web Agents [58.39129004543844]
APIベースのエージェントはWebArenaの実験でWebブラウジングエージェントを上回っている。
ハイブリッドエージェント(Hybrid Agents)は、タスク全体にわたって、ほぼ均一にパフォーマンスを向上する。
結果から,APIが利用可能であれば,Webブラウジングのみに依存するという,魅力的な代替手段が提示されることが強く示唆された。
論文 参考訳(メタデータ) (2024-10-21T19:46:06Z) - How Unique is Whose Web Browser? The role of demographics in browser fingerprinting among US users [50.699390248359265]
ブラウザのフィンガープリントは、クッキーを使わずとも、Web上のユーザを識別し、追跡するために利用できる。
この技術と結果として生じるプライバシーリスクは10年以上にわたって研究されてきた。
我々は、さらなる研究を可能にするファースト・オブ・ザ・キンド・データセットを提供する。
論文 参考訳(メタデータ) (2024-10-09T14:51:58Z) - A Privacy Measure Turned Upside Down? Investigating the Use of HTTP Client Hints on the Web [2.082364067210557]
本稿では,HTTPクライアントヒントの利用に関する長期研究について紹介する。
ほとんどすべてのWebブラウザで実装されているにもかかわらず、クライアントヒントのサーバ側使用は一般的には低い。
トラッカーと結びついているサードパーティウェブサイトの文脈では、採用率が著しく高い。
論文 参考訳(メタデータ) (2024-05-22T15:32:12Z) - Instruct and Extract: Instruction Tuning for On-Demand Information
Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。
InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。
InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文 参考訳(メタデータ) (2023-10-24T17:54:25Z) - GenAIPABench: A Benchmark for Generative AI-based Privacy Assistants [1.2642388972233845]
本稿では、ジェネレーティブAIベースのプライバシアシスタント(GenAIPA)の評価ベンチマークであるGenAIPABenchを紹介する。
GenAIPABench には,1) プライバシポリシやデータ保護規則に関する一連の質問,2) さまざまな組織や規制に対する注釈付き回答,2) 応答の正確性,関連性,一貫性を評価するメトリクス,3) プライバシドキュメントの導入や,システムの堅牢性をテストするためのさまざまなプライバシ質問などを生成するためのプロンプトを生成するツールなどが含まれている。
我々は、GenAIPABenchを用いて、ChatGPT-4、Bard、Bing AIの3つの主要なGenAIシステムを評価し、その効果をGenAIPAとして評価した。
論文 参考訳(メタデータ) (2023-09-10T21:15:42Z) - GAIA Search: Hugging Face and Pyserini Interoperability for NLP Training
Data Exploration [97.68234051078997]
我々はPyseriniを、オープンソースのAIライブラリとアーティファクトのHugging Faceエコシステムに統合する方法について論じる。
Jupyter NotebookベースのウォークスルーがGitHubで公開されている。
GAIA Search - 前述した原則に従って構築された検索エンジンで、人気の高い4つの大規模テキストコレクションへのアクセスを提供する。
論文 参考訳(メタデータ) (2023-06-02T12:09:59Z) - What Do End-Users Really Want? Investigation of Human-Centered XAI for
Mobile Health Apps [69.53730499849023]
説明可能なAI(XAI)を評価するために,ユーザ中心のペルソナ概念を提案する。
分析の結果,ユーザの人口統計や性格,説明のタイプ,影響説明の嗜好が示された。
私たちの洞察は、対話的で人間中心のXAIを実践的な応用に近づけます。
論文 参考訳(メタデータ) (2022-10-07T12:51:27Z) - Masked LARk: Masked Learning, Aggregation and Reporting worKflow [6.484847460164177]
多くのWeb広告データフローは、ユーザの受動的クロスサイト追跡を含む。
ほとんどのブラウザは、その後のブラウザイテレーションで3PCの削除に向かっている。
本稿では,ユーザエンゲージメント測定とモデルトレーニングの集約を目的としたMasked LARkという新しい提案を提案する。
論文 参考訳(メタデータ) (2021-10-27T21:59:37Z) - TIPRDC: Task-Independent Privacy-Respecting Data Crowdsourcing Framework
for Deep Learning with Anonymized Intermediate Representations [49.20701800683092]
本稿では,匿名化中間表現を用いたタスク非依存型プライバシ参照データクラウドソーシングフレームワークTIPRDCを提案する。
このフレームワークの目的は、中間表現からプライバシー情報を隠蔽できる機能抽出器を学習することであり、データコレクターの生データに埋め込まれた元の情報を最大限に保持し、未知の学習タスクを達成することである。
論文 参考訳(メタデータ) (2020-05-23T06:21:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。