論文の概要: WebPII: Benchmarking Visual PII Detection for Computer-Use Agents
- arxiv url: http://arxiv.org/abs/2603.17357v1
- Date: Wed, 18 Mar 2026 04:41:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.513905
- Title: WebPII: Benchmarking Visual PII Detection for Computer-Use Agents
- Title(参考訳): WebPII: コンピュータ利用エージェントのためのビジュアルPII検出のベンチマーク
- Authors: Nathan Zhao,
- Abstract要約: 44,865個の注釈付きeコマースUI画像の詳細な合成ベンチマークであるWebPIIを紹介する。
我々は,テキスト抽出基準の精度を2倍にするのではなく,実用性を示すためにWebRedactを訓練する。
プライバシ保護型コンピュータ利用研究を支援するデータセットとモデルをリリースする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computer use agents create new privacy risks: training data collected from real websites inevitably contains sensitive information, and cloud-hosted inference exposes user screenshots. Detecting personally identifiable information in web screenshots is critical for privacy-preserving deployment, but no public benchmark exists for this task. We introduce WebPII, a fine-grained synthetic benchmark of 44,865 annotated e-commerce UI images designed with three key properties: extended PII taxonomy including transaction-level identifiers that enable reidentification, anticipatory detection for partially-filled forms where users are actively entering data, and scalable generation through VLM-based UI reproduction. Experiments validate that these design choices improve layout-invariant detection across diverse interfaces and generalization to held-out page types. We train WebRedact to demonstrate practical utility, more than doubling text-extraction baseline accuracy (0.753 vs 0.357 mAP@50) at real-time CPU latency (20ms). We release the dataset and model to support privacy-preserving computer use research.
- Abstract(参考訳): 実際のWebサイトから収集されたデータには、必然的に機密情報が含まれており、クラウドにホストされた推論は、ユーザのスクリーンショットを公開する。
個人の識別可能な情報をWebスクリーンショットで検出することは、プライバシ保護デプロイメントには重要だが、このタスクには公開ベンチマークは存在しない。
WebPIIは、44,865個の注釈付きEコマースUIイメージの詳細な総合ベンチマークで、3つの重要な特性を持つ: 再識別を可能にするトランザクションレベルの識別子を含む拡張PII分類、ユーザが積極的にデータを入力する部分充填型の予測検出、VLMベースのUI再生によるスケーラブルな生成。
実験により、これらの設計選択は、様々なインターフェースにわたるレイアウト不変の検出を改善し、保留ページタイプに一般化することを検証する。
我々は、リアルタイムCPUレイテンシ(20ms)でテキスト抽出ベースライン精度(0.753対0.357 mAP@50)を2倍にするのではなく、実用性を示すためにWebRedactをトレーニングする。
プライバシ保護型コンピュータ利用研究を支援するデータセットとモデルをリリースする。
関連論文リスト
- LiveWeb-IE: A Benchmark For Online Web Information Extraction [48.82654261583883]
Web情報抽出(WIE)は、Webページから自動的にデータを抽出するタスクであり、様々なアプリケーションに高いユーティリティを提供する。
ライブWebサイトに対して,WIEシステムを直接評価するための新しいベンチマークである,データセットを導入する。
また,Webページコンテンツを視覚的に絞り込み,所望の情報を抽出することで,人間の認知過程を模倣する新しい多段階エージェントフレームワークであるVisual Grounding Scraper (VGS)を提案する。
論文 参考訳(メタデータ) (2026-03-14T05:55:11Z) - Anonymization-Enhanced Privacy Protection for Mobile GUI Agents: Available but Invisible [12.742325129012576]
Mobile Graphical User Interface (GUI)エージェントは、複雑なスマートフォンタスクを自動化する強力な機能を示している。
本稿では,機密データへのアクセスの原則を強制する匿名化に基づくプライバシー保護フレームワークを提案する。
本システムは,PII認識モデルを用いてセンシティブなUIコンテンツを検出し,それを決定論的型保存プレースホルダーに置き換える。
論文 参考訳(メタデータ) (2026-02-08T15:50:04Z) - Following the Clues: Experiments on Person Re-ID using Cross-Modal Intelligence [0.0]
CRIDは、Large Vision-Language Models、Graph Attention Networks、そして表現学習を組み合わせたクロスプラットフォームフレームワークである。
提案手法は,解釈可能な特徴の同定と活用に重点を置いており,低レベルの外観的手がかりを超えた意味論的意味的PIIの検出を可能にする。
本実験は,実運用におけるデータ横断型Re-IDシナリオの性能向上を示す。
論文 参考訳(メタデータ) (2025-07-02T09:10:33Z) - Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis [57.371814877372515]
グラフィカルユーザインタフェース(GUI)の基盤は、コンピュータ利用エージェント開発において依然として重要なボトルネックとなっている。
多様なタスクタイプにまたがる564の細かな注釈付きサンプルからなる総合ベンチマークであるOSWorld-Gを紹介する。
我々は、400万のサンプルを含む、最大のコンピュータ利用基盤データセットであるJediを合成してリリースする。
論文 参考訳(メタデータ) (2025-05-19T15:09:23Z) - AgentTrek: Agent Trajectory Synthesis via Guiding Replay with Web Tutorials [53.376263056033046]
既存のアプローチは高価な人間のアノテーションに依存しており、大規模には持続不可能である。
本稿では,Webエージェントトラジェクトリを生成するスケーラブルなデータ合成パイプラインであるAgentTrekを提案する。
完全に自動化されたアプローチは、データ収集コストを大幅に削減し、人間のアノテータを使わずに、高品質な軌道を0.55ドルに抑えることができます。
論文 参考訳(メタデータ) (2024-12-12T18:59:27Z) - Federated Face Forgery Detection Learning with Personalized Representation [63.90408023506508]
ディープジェネレータ技術は、区別がつかない高品質のフェイクビデオを制作し、深刻な社会的脅威をもたらす可能性がある。
従来の偽造検出手法は、データを直接集中的に訓練する。
本稿では,個人化表現を用いた新しいフェデレーション顔偽造検出学習を提案する。
論文 参考訳(メタデータ) (2024-06-17T02:20:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。