論文の概要: PersonaFingerprint: Measuring Persona Inference on Modern Websites with LLM-Driven Browsing
- arxiv url: http://arxiv.org/abs/2605.15962v1
- Date: Fri, 15 May 2026 13:54:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 17:44:16.332913
- Title: PersonaFingerprint: Measuring Persona Inference on Modern Websites with LLM-Driven Browsing
- Title(参考訳): PersonaFingerprint: LLM駆動ブラウジングによる近代Webサイトにおけるペルソナ推論の測定
- Authors: Chuxu Song, Hao Wang, Richard Martin,
- Abstract要約: Website Fingerprinting (WFP) は伝統的に、ユーザーがパケットサイズやタイミングなどの暗号化されたトラフィックメタデータから訪問するWebサイトを推測することに焦点を当ててきた。
本稿では,現代のWeb設定における新たなプライバシリスクを特定し,定量化する。敵はパケット長と時間間隔のみを用いてユーザのペルソナを推測できる。
その結果、現代のウェブサイトでは、暗号化されたトラフィックメタデータが、どのサイトを訪れたかだけでなく、閲覧方法やブラウジングの仕方もリークしていることがわかった。
- 参考スコア(独自算出の注目度): 2.9624076860490987
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Website Fingerprinting (WFP) has traditionally focused on inferring which website a user visits from encrypted traffic metadata such as packet sizes and timing. In this paper, we identify and quantify a new privacy risk in modern web settings: an adversary can infer a user's persona using only packet-length and inter-arrival-time sequences. To study this risk at scale, we build an LLM-driven multi-agent browsing framework that enforces controllable persona constraints while a computer-use agent interacts with real websites and collects corresponding encrypted traffic traces. We formalize persona fingerprinting under both closed-set and open-world settings and further evaluate whether persona information is already embedded in representations learned by existing WFP models and can be amplified at low cost. Across 10 modern websites and 15 personas (plus an open-world class), persona inference achieves about 84% accuracy on mixed-site traffic; moreover, a lightweight multi-task objective can boost persona accuracy to around 80% while retaining strong site classification performance (about 93% baseline). Our results show that, on modern websites, encrypted traffic metadata can leak not only which site a user visits, but also how they browse and who is browsing.
- Abstract(参考訳): Website Fingerprinting (WFP) は伝統的に、ユーザーがパケットサイズやタイミングなどの暗号化されたトラフィックメタデータから訪問するWebサイトを推測することに焦点を当ててきた。
本稿では,現代のWeb設定における新たなプライバシリスクを特定し,定量化する。敵はパケット長と時間間隔のみを用いてユーザのペルソナを推測できる。
このリスクを大規模に研究するために,コンピュータ利用エージェントが実際のWebサイトと対話し,対応する暗号化されたトラフィックトレースを収集している間に,制御可能なペルソナ制約を強制するLLM駆動のマルチエージェントブラウジングフレームワークを構築した。
さらに,既存のWFPモデルで学習した表現にペルソナ情報が組み込まれており,低コストで増幅できるかどうかを検証した。
10のモダンWebサイトと15のペルソナ(およびオープンワールドクラス)にまたがって、ペルソナ推論は混合サイトトラフィックにおいて約84%の精度を達成する。
その結果、現代のウェブサイトでは、暗号化されたトラフィックメタデータが、どのサイトを訪れたかだけでなく、閲覧方法やブラウジングの仕方もリークしていることがわかった。
関連論文リスト
- Large-scale online deanonymization with LLMs [58.46277616551135]
大規模なデ匿名化を実現するために,大規模言語モデルを用いることができることを示す。
当社のエージェントは、完全なインターネットアクセスによって、Hacker NewsユーザーとHistropic Interviewer参加者を高精度に識別することができる。
論文 参考訳(メタデータ) (2026-02-18T19:02:50Z) - BrowserArena: Evaluating LLM Agents on Real-World Web Navigation Tasks [51.803138848305814]
我々はBrowserArenaを紹介した。BrowserArenaは、ユーザから送信されたタスクを収集するオープンソースのエージェント評価プラットフォームである。
Captcha解決、ポップアップバナー削除、URLへのダイレクトナビゲーションの3つの一貫した障害モードを特定します。
本研究は,Webエージェントの多様性と脆性の両方を明らかにする。
論文 参考訳(メタデータ) (2025-10-02T15:22:21Z) - Redefining Website Fingerprinting Attacks With Multiagent LLMs [2.7117643001081437]
Webサイトフィンガープリント(WFP)は、ディープラーニングモデルを使用して、暗号化されたネットワークトラフィックを分類し、訪問したWebサイトを推論する。
本研究は,利用者が同一ウェブサイト上でも非常に多様な行動を示し,個人間で異なる交通パターンを生じさせることを示す。
論文 参考訳(メタデータ) (2025-09-15T21:17:04Z) - MAGPIE: A dataset for Multi-AGent contextual PrIvacy Evaluation [54.410825977390274]
LLMエージェントのコンテキストプライバシを評価するための既存のベンチマークは、主にシングルターン、低複雑さタスクを評価する。
まず、15ドメインにわたる158のリアルタイムハイテイクシナリオからなるベンチマーク-MAGPIEを示す。
次に、コンテキスト的にプライベートなデータに対する理解と、ユーザのプライバシを侵害することなくコラボレーションする能力に基づいて、最先端のLCMを評価します。
論文 参考訳(メタデータ) (2025-06-25T18:04:25Z) - Beyond the Crawl: Unmasking Browser Fingerprinting in Real User Interactions [9.495142718502072]
ブラウザーフィンガープリント(Browser fingerprinting)は、プロファイリングやターゲット広告に頻繁に使われるオンライン追跡技術である。
これまでの研究は、人間とコンピュータの相互作用のニュアンスを再現するのに本質的に苦労した自動化ウェブクローリングに大きく依存していた。
本稿では,30人の参加者を対象とした10週間にわたるユーザ調査を行い,3000のWebサイトを対象とした実閲覧セッションからテレメトリデータを収集した。
論文 参考訳(メタデータ) (2025-02-03T18:43:34Z) - AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents [52.13695464678006]
本研究は, 観察空間と行動空間を簡略化することで, LLMベースのWebエージェントを強化する。
AgentOccam は以前の最先端および同時処理を 9.8 (+29.4%) と 5.9 (+15.8%) で上回っている。
論文 参考訳(メタデータ) (2024-10-17T17:50:38Z) - Seamless Website Fingerprinting in Multiple Environments [4.226243782049956]
ウェブサイトのフィンガープリント(WF)攻撃は匿名接続で訪れたウェブサイトを識別する。
個々のWebページではなく,Webサイト全体を分類する,新たなアプローチを導入する。
我々の畳み込みニューラルネットワーク(CNN)は、TCPストリームのどの点からでもジッタと500個の連続パケットしか使用しない。
論文 参考訳(メタデータ) (2024-07-28T02:18:30Z) - Masked LARk: Masked Learning, Aggregation and Reporting worKflow [6.484847460164177]
多くのWeb広告データフローは、ユーザの受動的クロスサイト追跡を含む。
ほとんどのブラウザは、その後のブラウザイテレーションで3PCの削除に向かっている。
本稿では,ユーザエンゲージメント測定とモデルトレーニングの集約を目的としたMasked LARkという新しい提案を提案する。
論文 参考訳(メタデータ) (2021-10-27T21:59:37Z) - Adaptive Webpage Fingerprinting from TLS Traces [13.009834690757614]
ウェブページのフィンガープリントにおいて、相手は、ユーザーのブラウザとウェブサイトのサーバ間で交換された暗号化TLSトラフィックのパターンを分析して、被害者がロードした特定のWebページを推測する。
本研究では,TLSプロトコルに対する現代のWebページフィンガープリントの敵について検討する。
1) 前例のない数のWebページをスケールし、2)トレーニング中に遭遇したことのない数千のクラスを正確に分類し、3)頻繁なページ更新のシナリオにおいても、運用コストが低いTLS固有のモデルを導入する。
論文 参考訳(メタデータ) (2020-10-19T15:13:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。