論文の概要: UA-Radar: Exploring the Impact of User Agents on the Web
- arxiv url: http://arxiv.org/abs/2311.10420v1
- Date: Fri, 17 Nov 2023 09:53:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-18 23:02:51.164931
- Title: UA-Radar: Exploring the Impact of User Agents on the Web
- Title(参考訳): UA-Radar: Webにおけるユーザエージェントの影響を探る
- Authors: Jean Luc Intumwayase, Imane Fouad, Pierre Laperdrix, Romain Rouvoy,
- Abstract要約: 初期のWebでは、異なるブラウザに同じWebページを与えると、非常に異なる結果が得られる。
ユーザエージェント(UA)文字列は、コンテンツネゴシエーションのために導入された。
過去30年間、UA文字列はブラウザによって露出され続けた。
- 参考スコア(独自算出の注目度): 3.8373578956681547
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the early days of the web, giving the same web page to different browsers could provide very different results. As the rendering engine behind each browser would differ, some elements of a page could break or be positioned in the wrong location. At that time, the User Agent (UA) string was introduced for content negotiation. By knowing the browser used to connect to the server, a developer could provide a web page that was tailored for that specific browser to remove any usability problems. Over the past three decades, the UA string remained exposed by browsers, but its current usefulness is being debated. Browsers now adopt the exact same standards and use the same languages to display the same content to users, bringing the question if the content of the UA string is still relevant today, or if it is a relic of the past. Moreover, the diversity of means to browse the web has become so large that the UA string is one of the top contributors to tracking users in the field of browser fingerprinting, bringing a sense of urgency to deprecate it. In this paper, our goal is to understand the impact of the UA on the web and if this legacy string is still actively used to adapt the content served to users. We introduce UA-Radar, a web page similarity measurement tool that compares in-depth two web pages from the code to their actual rendering, and highlights the similarities it finds. We crawled 270, 048 web pages from 11, 252 domains using 3 different browsers and 2 different UA strings to observe that 100% of the web pages were similar before any JavaScript was executed, demonstrating the absence of differential serving. Our experiments also show that only a very small number of websites are affected by the lack of UA information, which can be fixed in most cases by updating code to become browser-agnostic. Our study brings some proof that it may be time to turn the page on the UA string and retire it from current web browsers.
- Abstract(参考訳): 初期のWebでは、異なるブラウザに同じWebページを与えると、非常に異なる結果が得られる。
各ブラウザの背後にあるレンダリングエンジンが異なるため、ページのいくつかの要素が壊れたり、間違った場所に配置されたりする可能性がある。
当時、ユーザーエージェント(UA)文字列はコンテンツネゴシエーションのために導入された。
サーバに接続するブラウザを知っていれば、開発者は特定のブラウザに適したWebページを提供して、ユーザビリティの問題を取り除くことができる。
過去30年間、UA文字列はブラウザによって露呈されてきたが、現在の有用性は議論されている。
ブラウザは、まったく同じ標準を採用し、同じ言語を使ってユーザーに同じコンテンツを表示できるようになった。
さらに、Webを閲覧する手段の多様性が非常に大きくなり、UA文字列はブラウザのフィンガープリント分野におけるユーザ追跡の最大のコントリビュータの1つとなり、それを非推奨にする切迫感をもたらしている。
本稿では,UAがWebに与える影響と,このレガシ文字列がユーザに提供するコンテンツに積極的に適用されているかを理解することを目的とする。
UA-RadarはWebページの類似度測定ツールで、コード内の2ページを実際のレンダリングと比較し、類似点をハイライトする。
3つの異なるブラウザと2つの異なるUA文字列を使って11,252のドメインから270,048のWebページをクロールして、JavaScriptが実行される前にWebページの100%が似ていることを観察しました。
また,ブラウザに依存しないコードを更新することで,ほとんどのケースで修正できるUA情報の欠如によって,ごく少数のWebサイトが影響を受けることがわかった。
我々の研究は、UA文字列のページを現在のWebブラウザから削除する時が来たことを証明しています。
関連論文リスト
- Assessing Web Fingerprinting Risk [2.144574168644798]
ブラウザー指紋(Browser fingerprints)は、クッキーが無効になってもユーザーの秘密の追跡を可能にするデバイス固有の識別子である。
これまでの研究は、指紋認証のリスクを定量化するための鍵となる指標として、情報の尺度であるエントロピーを確立してきた。
我々は,先行作業の限界に対処するブラウザのフィンガープリントについて,最初の研究を行った。
論文 参考訳(メタデータ) (2024-03-22T20:34:41Z) - Beyond the Request: Harnessing HTTP Response Headers for Cross-Browser
Web Tracker Classification in an Imbalanced Setting [0.0]
本研究は,HTTP/S応答ヘッダを用いたWebトラッカ検出のための効果的な機械学習分類器の設計の試みである。
11の教師付きモデルがChromeデータでトレーニングされ、すべてのブラウザでテストされた。
結果は、ChromeとFirefoxで高い精度、F1スコア、精度、リコール、最小ログロスエラーを示した。
論文 参考訳(メタデータ) (2024-02-02T09:07:09Z) - HDNA: A graph-based change detection in HTML pages(Deface Attack
Detection) [0.0]
HDNA(HTML DNA)は、ドキュメントオブジェクトモデル(DOM)ツリーの解析と比較のために導入された。
メソッドはその構造に基づいて各HTMLページに識別子を割り当てる。
論文 参考訳(メタデータ) (2023-10-05T20:49:54Z) - User Attitudes to Content Moderation in Web Search [49.1574468325115]
我々は、Web検索における誤解を招く可能性のあるコンテンツや攻撃的なコンテンツに適用される様々なモデレーションプラクティスに対するサポートレベルについて検討する。
最も支持されている実践は、誤解を招く可能性のあるコンテンツや不快なコンテンツについてユーザーに知らせることであり、最も支持されていないものは、検索結果を完全に削除することである。
より保守的なユーザーやウェブ検索結果に対する信頼度が低いユーザーは、ウェブ検索におけるコンテンツモデレーションに反する傾向にある。
論文 参考訳(メタデータ) (2023-10-05T10:57:15Z) - Multimodal Web Navigation with Instruction-Finetuned Foundation Models [99.14209521903854]
視覚言語基礎モデルを用いたWebエージェントのためのデータ駆動オフライントレーニングについて検討する。
本稿では,WebページのスクリーンショットとHTMLページの両方を観察する命令追従型マルチモーダルエージェントWebGUMを提案する。
このレシピは,マルチモーダル認識,HTML理解,マルチステップ推論といったエージェントの能力を向上させることを実証的に実証する。
論文 参考訳(メタデータ) (2023-05-19T17:44:34Z) - A Suite of Generative Tasks for Multi-Level Multimodal Webpage
Understanding [66.6468787004067]
ウィキペディアのWebページスイート (WikiWeb2M) には, 関連画像, テキスト, 構造データを含む2Mページが含まれている。
我々は,最も関連性の高い画像とテキストをグローバルトークンとして選択し,Webページの他の部分へのコンテクストへの参加を可能にする,新しいアテンションメカニズムであるPrefix Globalを設計する。
論文 参考訳(メタデータ) (2023-05-05T16:38:05Z) - Uncovering Fingerprinting Networks. An Analysis of In-Browser Tracking
using a Behavior-based Approach [0.0]
この論文は、インターネット上でのブラウザのフィンガープリントの現状を探求している。
我々はFPNETを実装し,その動作を観察することで,大量のWebサイト上で指紋認証スクリプトを識別する。
Google、Yandex、Maxmind、Sift、FingerprintJSといった企業を追跡します。
論文 参考訳(メタデータ) (2022-08-15T18:06:25Z) - CoVA: Context-aware Visual Attention for Webpage Information Extraction [65.11609398029783]
WIE をコンテキスト対応 Web ページオブジェクト検出タスクとして再構築することを提案する。
我々は、外観特徴とDOMツリーからの構文構造を組み合わせた、コンテキスト認識型視覚意図ベース(CoVA)検出パイプラインを開発した。
提案手法は,従来の最先端手法を改良した新しい挑戦的ベースラインであることを示す。
論文 参考訳(メタデータ) (2021-10-24T00:21:46Z) - hBert + BiasCorp -- Fighting Racism on the Web [58.768804813646334]
これはfox news、breitbartnews、youtubeの3つの特定のソースから139,090のコメントとニュースを含むデータセットです。
本研究では、hBERT を新しい Hopfield Layer を用いて、予め訓練された BERT モデルの特定の層を修正する。
開発者がwebアプリケーションでトレーニングされたモデルを利用できるようにするため、javascriptライブラリとchrome拡張アプリケーションもリリースしています。
論文 参考訳(メタデータ) (2021-04-06T02:17:20Z) - SciREX: A Challenge Dataset for Document-Level Information Extraction [56.83748634747753]
ドキュメントレベルで大規模な情報抽出データセットを作成するのは難しい。
複数のIEタスクを含む文書レベルのIEデータセットであるSciREXを紹介する。
我々は、従来の最先端のIEモデルをドキュメントレベルのIEに拡張する強力なベースラインとして、ニューラルモデルを開発する。
論文 参考訳(メタデータ) (2020-05-01T17:30:10Z) - Boilerplate Removal using a Neural Sequence Labeling Model [4.056234173482691]
本稿では,手作り機能に頼らず,Webページに現れるHTMLタグや単語のみを入力として利用するニューラルシーケンスラベリングモデルを提案する。
これにより、モデルを使用して、任意のWebページのコンテンツをブラウザ内で直接ハイライトするブラウザ拡張を提示できる。
論文 参考訳(メタデータ) (2020-04-22T08:06:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。