論文の概要: UA-Radar: Exploring the Impact of User Agents on the Web
- arxiv url: http://arxiv.org/abs/2311.10420v1
- Date: Fri, 17 Nov 2023 09:53:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-18 23:02:51.164931
- Title: UA-Radar: Exploring the Impact of User Agents on the Web
- Title(参考訳): UA-Radar: Webにおけるユーザエージェントの影響を探る
- Authors: Jean Luc Intumwayase, Imane Fouad, Pierre Laperdrix, Romain Rouvoy,
- Abstract要約: 初期のWebでは、異なるブラウザに同じWebページを与えると、非常に異なる結果が得られる。
ユーザエージェント(UA)文字列は、コンテンツネゴシエーションのために導入された。
過去30年間、UA文字列はブラウザによって露出され続けた。
- 参考スコア(独自算出の注目度): 3.8373578956681547
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the early days of the web, giving the same web page to different browsers could provide very different results. As the rendering engine behind each browser would differ, some elements of a page could break or be positioned in the wrong location. At that time, the User Agent (UA) string was introduced for content negotiation. By knowing the browser used to connect to the server, a developer could provide a web page that was tailored for that specific browser to remove any usability problems. Over the past three decades, the UA string remained exposed by browsers, but its current usefulness is being debated. Browsers now adopt the exact same standards and use the same languages to display the same content to users, bringing the question if the content of the UA string is still relevant today, or if it is a relic of the past. Moreover, the diversity of means to browse the web has become so large that the UA string is one of the top contributors to tracking users in the field of browser fingerprinting, bringing a sense of urgency to deprecate it. In this paper, our goal is to understand the impact of the UA on the web and if this legacy string is still actively used to adapt the content served to users. We introduce UA-Radar, a web page similarity measurement tool that compares in-depth two web pages from the code to their actual rendering, and highlights the similarities it finds. We crawled 270, 048 web pages from 11, 252 domains using 3 different browsers and 2 different UA strings to observe that 100% of the web pages were similar before any JavaScript was executed, demonstrating the absence of differential serving. Our experiments also show that only a very small number of websites are affected by the lack of UA information, which can be fixed in most cases by updating code to become browser-agnostic. Our study brings some proof that it may be time to turn the page on the UA string and retire it from current web browsers.
- Abstract(参考訳): 初期のWebでは、異なるブラウザに同じWebページを与えると、非常に異なる結果が得られる。
各ブラウザの背後にあるレンダリングエンジンが異なるため、ページのいくつかの要素が壊れたり、間違った場所に配置されたりする可能性がある。
当時、ユーザーエージェント(UA)文字列はコンテンツネゴシエーションのために導入された。
サーバに接続するブラウザを知っていれば、開発者は特定のブラウザに適したWebページを提供して、ユーザビリティの問題を取り除くことができる。
過去30年間、UA文字列はブラウザによって露呈されてきたが、現在の有用性は議論されている。
ブラウザは、まったく同じ標準を採用し、同じ言語を使ってユーザーに同じコンテンツを表示できるようになった。
さらに、Webを閲覧する手段の多様性が非常に大きくなり、UA文字列はブラウザのフィンガープリント分野におけるユーザ追跡の最大のコントリビュータの1つとなり、それを非推奨にする切迫感をもたらしている。
本稿では,UAがWebに与える影響と,このレガシ文字列がユーザに提供するコンテンツに積極的に適用されているかを理解することを目的とする。
UA-RadarはWebページの類似度測定ツールで、コード内の2ページを実際のレンダリングと比較し、類似点をハイライトする。
3つの異なるブラウザと2つの異なるUA文字列を使って11,252のドメインから270,048のWebページをクロールして、JavaScriptが実行される前にWebページの100%が似ていることを観察しました。
また,ブラウザに依存しないコードを更新することで,ほとんどのケースで修正できるUA情報の欠如によって,ごく少数のWebサイトが影響を受けることがわかった。
我々の研究は、UA文字列のページを現在のWebブラウザから削除する時が来たことを証明しています。
関連論文リスト
- Fingerprinting Browsers in Encrypted Communications [0.12209039082584558]
調査では、異なるブラウザが異なる数のメッセージを使ってサーバと通信していることがわかった。
その結果、異なるブラウザの動作には30%-35%の相違があることが判明した。
論文 参考訳(メタデータ) (2024-10-28T15:06:31Z) - Infogent: An Agent-Based Framework for Web Information Aggregation [59.67710556177564]
我々はWeb情報集約のための新しいフレームワークInfogentを紹介する。
異なる情報アクセス設定の実験では、Infogentが既存のSOTAマルチエージェント検索フレームワークを7%上回った。
論文 参考訳(メタデータ) (2024-10-24T18:01:28Z) - Beyond Browsing: API-Based Web Agents [58.39129004543844]
APIベースのエージェントはWebArenaの実験でWebブラウジングエージェントを上回っている。
ハイブリッドエージェント(Hybrid Agents)は、タスク全体にわたって、ほぼ均一にパフォーマンスを向上する。
結果から,APIが利用可能であれば,Webブラウジングのみに依存するという,魅力的な代替手段が提示されることが強く示唆された。
論文 参考訳(メタデータ) (2024-10-21T19:46:06Z) - How Unique is Whose Web Browser? The role of demographics in browser fingerprinting among US users [50.699390248359265]
ブラウザのフィンガープリントは、クッキーを使わずとも、Web上のユーザを識別し、追跡するために利用できる。
この技術と結果として生じるプライバシーリスクは10年以上にわたって研究されてきた。
我々は、さらなる研究を可能にするファースト・オブ・ザ・キンド・データセットを提供する。
論文 参考訳(メタデータ) (2024-10-09T14:51:58Z) - Towards Fine-Grained Webpage Fingerprinting at Scale [18.201489295361892]
Webサイトフィンガープリント(WF)攻撃は、暗号化されたトラフィックパターンを分析することで、Torクライアントが訪れたウェブサイトを効果的に識別することができる。
既存の攻撃は、異なるウェブサイトを特定することに重点を置いているが、その精度は、きめ細かいWebページを特定するために適用されると劇的に低下する。
機能空間を変換することで、難読化トラフィックから異なるWebページを識別するマルチラベルメトリック学習に基づくWPF攻撃であるOscarを提案する。
論文 参考訳(メタデータ) (2024-09-06T15:21:00Z) - DarthShader: Fuzzing WebGPU Shader Translators & Compilers [19.345967816562364]
より要求の多いWebアプリケーションを実行するための最近のトレンドは、WebGPU標準の採用につながっている。
信頼できないWebコンテンツは、伝統的にセキュリティではなくパフォーマンスのために最適化されたGPUスタックに渡される。
DarthShaderは、中間表現に基づくミュータと、より伝統的な抽象構文木を使用したものを組み合わせた最初の言語ファザである。
論文 参考訳(メタデータ) (2024-09-03T12:06:19Z) - Web2Code: A Large-scale Webpage-to-Code Dataset and Evaluation Framework for Multimodal LLMs [112.89665642941814]
MLLM(Multimodal large language model)は、画像、ビデオ、オーディオなどのモダリティにおいて顕著な成功を収めている。
現在のMLLMは、Webページのスクリーンショットを理解し、対応するHTMLコードを生成するのに驚くほど貧弱です。
命令チューニングのための大規模Webページ・ツー・コードデータセットを新たに構築したベンチマークを提案する。
論文 参考訳(メタデータ) (2024-06-28T17:59:46Z) - AutoScraper: A Progressive Understanding Web Agent for Web Scraper Generation [54.17246674188208]
Webスクレイピングは、Webサイトからデータを抽出し、自動データ収集を可能にし、データ分析機能を強化し、手動のデータ入力作業を最小化する強力なテクニックである。
既存の手法では、ラッパーベースの手法は、新しいウェブサイトで直面する場合、適応性とスケーラビリティの制限に悩まされる。
本稿では,大規模言語モデル(LLM)を用いたWebスクレイパー生成のパラダイムを紹介し,多様なWeb環境をより効率的に処理できる2段階フレームワークであるAutoScraperを提案する。
論文 参考訳(メタデータ) (2024-04-19T09:59:44Z) - HDNA: A graph-based change detection in HTML pages(Deface Attack
Detection) [0.0]
HDNA(HTML DNA)は、ドキュメントオブジェクトモデル(DOM)ツリーの解析と比較のために導入された。
メソッドはその構造に基づいて各HTMLページに識別子を割り当てる。
論文 参考訳(メタデータ) (2023-10-05T20:49:54Z) - A Suite of Generative Tasks for Multi-Level Multimodal Webpage
Understanding [66.6468787004067]
ウィキペディアのWebページスイート (WikiWeb2M) には, 関連画像, テキスト, 構造データを含む2Mページが含まれている。
我々は,最も関連性の高い画像とテキストをグローバルトークンとして選択し,Webページの他の部分へのコンテクストへの参加を可能にする,新しいアテンションメカニズムであるPrefix Globalを設計する。
論文 参考訳(メタデータ) (2023-05-05T16:38:05Z) - Uncovering Fingerprinting Networks. An Analysis of In-Browser Tracking
using a Behavior-based Approach [0.0]
この論文は、インターネット上でのブラウザのフィンガープリントの現状を探求している。
我々はFPNETを実装し,その動作を観察することで,大量のWebサイト上で指紋認証スクリプトを識別する。
Google、Yandex、Maxmind、Sift、FingerprintJSといった企業を追跡します。
論文 参考訳(メタデータ) (2022-08-15T18:06:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。