Fugu-MT 論文翻訳(概要): UA-Radar: Exploring the Impact of User Agents on the Web

論文の概要: UA-Radar: Exploring the Impact of User Agents on the Web

arxiv url: http://arxiv.org/abs/2311.10420v1
Date: Fri, 17 Nov 2023 09:53:32 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-18 23:02:51.164931
Title: UA-Radar: Exploring the Impact of User Agents on the Web
Title（参考訳）: UA-Radar: Webにおけるユーザエージェントの影響を探る
Authors: Jean Luc Intumwayase, Imane Fouad, Pierre Laperdrix, Romain Rouvoy,
Abstract要約: 初期のWebでは、異なるブラウザに同じWebページを与えると、非常に異なる結果が得られる。ユーザエージェント(UA)文字列は、コンテンツネゴシエーションのために導入された。過去30年間、UA文字列はブラウザによって露出され続けた。
参考スコア（独自算出の注目度）: 3.8373578956681547
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the early days of the web, giving the same web page to different browsers could provide very different results. As the rendering engine behind each browser would differ, some elements of a page could break or be positioned in the wrong location. At that time, the User Agent (UA) string was introduced for content negotiation. By knowing the browser used to connect to the server, a developer could provide a web page that was tailored for that specific browser to remove any usability problems. Over the past three decades, the UA string remained exposed by browsers, but its current usefulness is being debated. Browsers now adopt the exact same standards and use the same languages to display the same content to users, bringing the question if the content of the UA string is still relevant today, or if it is a relic of the past. Moreover, the diversity of means to browse the web has become so large that the UA string is one of the top contributors to tracking users in the field of browser fingerprinting, bringing a sense of urgency to deprecate it. In this paper, our goal is to understand the impact of the UA on the web and if this legacy string is still actively used to adapt the content served to users. We introduce UA-Radar, a web page similarity measurement tool that compares in-depth two web pages from the code to their actual rendering, and highlights the similarities it finds. We crawled 270, 048 web pages from 11, 252 domains using 3 different browsers and 2 different UA strings to observe that 100% of the web pages were similar before any JavaScript was executed, demonstrating the absence of differential serving. Our experiments also show that only a very small number of websites are affected by the lack of UA information, which can be fixed in most cases by updating code to become browser-agnostic. Our study brings some proof that it may be time to turn the page on the UA string and retire it from current web browsers.
Abstract（参考訳）: 初期のWebでは、異なるブラウザに同じWebページを与えると、非常に異なる結果が得られる。各ブラウザの背後にあるレンダリングエンジンが異なるため、ページのいくつかの要素が壊れたり、間違った場所に配置されたりする可能性がある。当時、ユーザーエージェント(UA)文字列はコンテンツネゴシエーションのために導入された。サーバに接続するブラウザを知っていれば、開発者は特定のブラウザに適したWebページを提供して、ユーザビリティの問題を取り除くことができる。過去30年間、UA文字列はブラウザによって露呈されてきたが、現在の有用性は議論されている。ブラウザは、まったく同じ標準を採用し、同じ言語を使ってユーザーに同じコンテンツを表示できるようになった。さらに、Webを閲覧する手段の多様性が非常に大きくなり、UA文字列はブラウザのフィンガープリント分野におけるユーザ追跡の最大のコントリビュータの1つとなり、それを非推奨にする切迫感をもたらしている。本稿では,UAがWebに与える影響と,このレガシ文字列がユーザに提供するコンテンツに積極的に適用されているかを理解することを目的とする。 UA-RadarはWebページの類似度測定ツールで、コード内の2ページを実際のレンダリングと比較し、類似点をハイライトする。 3つの異なるブラウザと2つの異なるUA文字列を使って11,252のドメインから270,048のWebページをクロールして、JavaScriptが実行される前にWebページの100%が似ていることを観察しました。また,ブラウザに依存しないコードを更新することで,ほとんどのケースで修正できるUA情報の欠如によって,ごく少数のWebサイトが影響を受けることがわかった。我々の研究は、UA文字列のページを現在のWebブラウザから削除する時が来たことを証明しています。

関連論文リスト

Atomicity for Agents: Exposing, Exploiting, and Mitigating TOCTOU Vulnerabilities in Browser-Use Agents [15.381306470663695]
ブラウザ利用エージェントにおけるTOCTOU脆弱性に関する大規模な実証的研究を行った。動的または敵対的なWebコンテンツは、意図しないアクションを誘発するためにこのウィンドウを利用することができる。我々は、事前実行検証に基づく軽量な緩和を設計する。
論文参考訳（メタデータ） (2026-02-28T05:25:03Z)
Nested Browser-Use Learning for Agentic Information Seeking [60.775556172513014]
情報検索(IS)エージェントは広範囲にわたる検索タスクで高いパフォーマンスを達成しているが、ツールの使用はAPIレベルのスニペット検索やURLベースのページフェッチに限られている。我々はNested Browser-Use Learning (NestBrowse)を提案する。NestBrowseは、ネストされた構造を通してページ探索からインタラクション制御を分離する最小かつ完全なブラウザアクションフレームワークである。
論文参考訳（メタデータ） (2025-12-29T17:59:14Z)
BrowserAgent: Building Web Agents with Human-Inspired Web Browsing Actions [48.194688161526756]
BrowserAgentは、事前に定義されたブラウザアクションのセットを通じて、Playwright経由で生のWebページで直接動作する。ステップ間で重要な結論を格納するための明示的なメモリ機構を導入し、モデルの推論能力をさらに強化する。
論文参考訳（メタデータ） (2025-10-12T15:43:37Z)
BrowserArena: Evaluating LLM Agents on Real-World Web Navigation Tasks [51.803138848305814]
我々はBrowserArenaを紹介した。BrowserArenaは、ユーザから送信されたタスクを収集するオープンソースのエージェント評価プラットフォームである。 Captcha解決、ポップアップバナー削除、URLへのダイレクトナビゲーションの3つの一貫した障害モードを特定します。本研究は,Webエージェントの多様性と脆性の両方を明らかにする。
論文参考訳（メタデータ） (2025-10-02T15:22:21Z)
Developers Insight On Manifest v3 Privacy and Security Webextensions [0.0]
現在、ChromeはManifest v3と呼ばれる修正されたAPIセットに移行している。本稿では,マニフェストv3の課題と可能性について,詳細な構造化された定性的な研究を用いて検討する。
論文参考訳（メタデータ） (2025-07-18T14:00:16Z)
Browser Fingerprinting Using WebAssembly [1.4732811715354452]
本稿ではWebAssembly(Wasm)を用いた高度な指紋認証手法を提案する。 WebAssemblyの計算機能を活用して、異なるブラウジングセッション間で返却デバイスを識別する、新たなアプローチを提案する。このアプローチを、Intel、AMD、ARM CPU、Windows、Android、iOSなどのオペレーティングシステム、VMWare、KVM、iOSなどの環境など、さまざまなプラットフォーム上で検証しています。
論文参考訳（メタデータ） (2025-05-31T21:39:17Z)
Snorkeling in dark waters: A longitudinal surface exploration of unique Tor Hidden Services (Extended Version) [2.498836880652668]
Onion Router (Tor) は、常に精査されているネットワークである。本稿では,Torネットワークの大規模解析を行う。 Mimirというクローラを利用して、ページ内でリンクされたコンテンツを自動的に収集し、訪問し、25万以上のサイトからページのデータセットを収集します。
論文参考訳（メタデータ） (2025-04-23T15:59:16Z)
Web Privacy based on Contextual Integrity: Measuring the Collapse of Online Contexts [0.0]
我々はプライバシの理論をコンテキスト統合として運用し、Webコンテキスト内およびWebコンテキスト間の永続的なユーザ識別を測定する。健康、金融、ニュース&メディア、LGBTQ、eコマース、アダルト、教育のWebサイトなど、トップ700のWebサイトを27日間クロールする。これは、Webプライバシをコンテキスト統合(Contextual Integrity)として測定する第一歩であり、コンテキストWebプライバシ調査のための新たな道を開くものだ。
論文参考訳（メタデータ） (2024-12-19T23:30:29Z)
MRWeb: An Exploration of Generating Multi-Page Resource-Aware Web Code from UI Designs [50.274447094978996]
マルチページリソース対応Webページ(MRWeb)生成タスクは、UIデザインをマルチページ、内部/外部ナビゲーション、イメージローディング、バックエンドルーティングを備えた機能的なWebUIに変換する。本稿では,500のWebサイト(300の合成,200の現実世界)を新たにキュレートしたデータセットを用いて既存のMRWeb問題に適用する。特に,Web UIの類似性を評価し,MRWeb生成に対するリソースリストの影響を評価し,MLLMの制約を分析し,MRWebツールの有効性を評価する。
論文参考訳（メタデータ） (2024-12-19T15:02:33Z)
Fingerprinting Browsers in Encrypted Communications [0.12209039082584558]
調査では、異なるブラウザが異なる数のメッセージを使ってサーバと通信していることがわかった。その結果、異なるブラウザの動作には30%-35%の相違があることが判明した。
論文参考訳（メタデータ） (2024-10-28T15:06:31Z)
Infogent: An Agent-Based Framework for Web Information Aggregation [59.67710556177564]
我々はWeb情報集約のための新しいフレームワークInfogentを紹介する。異なる情報アクセス設定の実験では、Infogentが既存のSOTAマルチエージェント検索フレームワークを7%上回った。
論文参考訳（メタデータ） (2024-10-24T18:01:28Z)
Beyond Browsing: API-Based Web Agents [58.39129004543844]
APIベースのエージェントはWebArenaの実験でWebブラウジングエージェントを上回っている。ハイブリッドエージェント(Hybrid Agents)は、タスク全体にわたって、ほぼ均一にパフォーマンスを向上する。結果から,APIが利用可能であれば,Webブラウジングのみに依存するという,魅力的な代替手段が提示されることが強く示唆された。
論文参考訳（メタデータ） (2024-10-21T19:46:06Z)
How Unique is Whose Web Browser? The role of demographics in browser fingerprinting among US users [50.699390248359265]
ブラウザのフィンガープリントは、クッキーを使わずとも、Web上のユーザを識別し、追跡するために利用できる。この技術と結果として生じるプライバシーリスクは10年以上にわたって研究されてきた。我々は、さらなる研究を可能にするファースト・オブ・ザ・キンド・データセットを提供する。
論文参考訳（メタデータ） (2024-10-09T14:51:58Z)
Towards Fine-Grained Webpage Fingerprinting at Scale [18.201489295361892]
Webサイトフィンガープリント(WF)攻撃は、暗号化されたトラフィックパターンを分析することで、Torクライアントが訪れたウェブサイトを効果的に識別することができる。既存の攻撃は、異なるウェブサイトを特定することに重点を置いているが、その精度は、きめ細かいWebページを特定するために適用されると劇的に低下する。機能空間を変換することで、難読化トラフィックから異なるWebページを識別するマルチラベルメトリック学習に基づくWPF攻撃であるOscarを提案する。
論文参考訳（メタデータ） (2024-09-06T15:21:00Z)
DarthShader: Fuzzing WebGPU Shader Translators & Compilers [19.345967816562364]
より要求の多いWebアプリケーションを実行するための最近のトレンドは、WebGPU標準の採用につながっている。信頼できないWebコンテンツは、伝統的にセキュリティではなくパフォーマンスのために最適化されたGPUスタックに渡される。 DarthShaderは、中間表現に基づくミュータと、より伝統的な抽象構文木を使用したものを組み合わせた最初の言語ファザである。
論文参考訳（メタデータ） (2024-09-03T12:06:19Z)
Web2Code: A Large-scale Webpage-to-Code Dataset and Evaluation Framework for Multimodal LLMs [112.89665642941814]
MLLM(Multimodal large language model)は、画像、ビデオ、オーディオなどのモダリティにおいて顕著な成功を収めている。現在のMLLMは、Webページのスクリーンショットを理解し、対応するHTMLコードを生成するのに驚くほど貧弱です。命令チューニングのための大規模Webページ・ツー・コードデータセットを新たに構築したベンチマークを提案する。
論文参考訳（メタデータ） (2024-06-28T17:59:46Z)
AutoScraper: A Progressive Understanding Web Agent for Web Scraper Generation [54.17246674188208]
Webスクレイピングは、Webサイトからデータを抽出し、自動データ収集を可能にし、データ分析機能を強化し、手動のデータ入力作業を最小化する強力なテクニックである。既存の手法では、ラッパーベースの手法は、新しいウェブサイトで直面する場合、適応性とスケーラビリティの制限に悩まされる。本稿では,大規模言語モデル(LLM)を用いたWebスクレイパー生成のパラダイムを紹介し,多様なWeb環境をより効率的に処理できる2段階フレームワークであるAutoScraperを提案する。
論文参考訳（メタデータ） (2024-04-19T09:59:44Z)
HDNA: A graph-based change detection in HTML pages(Deface Attack Detection) [0.0]
HDNA(HTML DNA)は、ドキュメントオブジェクトモデル(DOM)ツリーの解析と比較のために導入された。メソッドはその構造に基づいて各HTMLページに識別子を割り当てる。
論文参考訳（メタデータ） (2023-10-05T20:49:54Z)
A Suite of Generative Tasks for Multi-Level Multimodal Webpage Understanding [66.6468787004067]
ウィキペディアのWebページスイート (WikiWeb2M) には, 関連画像, テキスト, 構造データを含む2Mページが含まれている。我々は,最も関連性の高い画像とテキストをグローバルトークンとして選択し,Webページの他の部分へのコンテクストへの参加を可能にする,新しいアテンションメカニズムであるPrefix Globalを設計する。
論文参考訳（メタデータ） (2023-05-05T16:38:05Z)
Uncovering Fingerprinting Networks. An Analysis of In-Browser Tracking using a Behavior-based Approach [0.0]
この論文は、インターネット上でのブラウザのフィンガープリントの現状を探求している。我々はFPNETを実装し,その動作を観察することで,大量のWebサイト上で指紋認証スクリプトを識別する。 Google、Yandex、Maxmind、Sift、FingerprintJSといった企業を追跡します。
論文参考訳（メタデータ） (2022-08-15T18:06:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。