論文の概要: Not Here, Go There: Analyzing Redirection Patterns on the Web
- arxiv url: http://arxiv.org/abs/2507.22019v1
- Date: Tue, 29 Jul 2025 17:12:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:56.768359
- Title: Not Here, Go There: Analyzing Redirection Patterns on the Web
- Title(参考訳): ここにいない、そこに行く - Web上のリダイレクトパターンの分析
- Authors: Kritika Garg, Sawood Alam, Dietrich Ayala, Michele C. Weigle, Michael L. Nelson,
- Abstract要約: 研究は、ホップあたり最大10回のリダイレクトに続いて、1100万のユニークなリダイレクトを分析した。
発見によると、リダイレクトの50%が正常に終了し、50%がエラーとなり、0.06%が10ホップを超えた。
また62,000台のカスタム404、ほぼ半分がソフト404であり、SEOとユーザーエクスペリエンスを損なう可能性がある。
- 参考スコア(独自算出の注目度): 0.2796197251957244
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: URI redirections are integral to web management, supporting structural changes, SEO optimization, and security. However, their complexities affect usability, SEO performance, and digital preservation. This study analyzed 11 million unique redirecting URIs, following redirections up to 10 hops per URI, to uncover patterns and implications of redirection practices. Our findings revealed that 50% of the URIs terminated successfully, while 50% resulted in errors, including 0.06% exceeding 10 hops. Canonical redirects, such as HTTP to HTTPS transitions, were prevalent, reflecting adherence to SEO best practices. Non-canonical redirects, often involving domain or path changes, highlighted significant web migrations, rebranding, and security risks. Notable patterns included "sink" URIs, where multiple redirects converged, ranging from traffic consolidation by global websites to deliberate "Rickrolling." The study also identified 62,000 custom 404 URIs, almost half being soft 404s, which could compromise SEO and user experience. These findings underscore the critical role of URI redirects in shaping the web while exposing challenges such as outdated URIs, server instability, and improper error handling. This research offers a detailed analysis of URI redirection practices, providing insights into their prevalence, types, and outcomes. By examining a large dataset, we highlight inefficiencies in redirection chains and examine patterns such as the use of "sink" URIs and custom error pages. This information can help webmasters, researchers, and digital archivists improve web usability, optimize resource allocation, and safeguard valuable online content.
- Abstract(参考訳): URIリダイレクトは、Web管理に不可欠な構造変更、SEO最適化、セキュリティをサポートする。
しかし、それらの複雑さはユーザビリティ、SEOパフォーマンス、デジタル保存に影響を及ぼす。
本研究では、URI毎に最大10ホップまでのリダイレクトに従って、1100万のユニークなリダイレクトURIを分析し、リダイレクトプラクティスのパターンと意味を明らかにする。
結果,URIの50%が正常に終了し,50%がエラーとなり,0.06%が10ホップを超えたことがわかった。
HTTPからHTTPSへの移行といった標準的なリダイレクトが一般的であり、SEOのベストプラクティスへの準拠を反映している。
ドメインやパスの変更を伴う非標準的なリダイレクトは、重要なWebマイグレーション、ブランド変更、セキュリティリスクを強調している。
注目すべきパターンは"シンク"URIで、複数のリダイレクトが収束し、グローバルなWebサイトによるトラフィックの集約から、意図的に"リンク"された。
調査では62,000のカスタム404URIが特定され、ほぼ半分がソフト404であり、SEOとユーザエクスペリエンスを損なう可能性がある。
これらの発見は、時代遅れのURI、サーバの不安定性、不適切なエラー処理といった課題を明らかにしながら、Webを形成する上で、URIリダイレクトが重要な役割を担っていることを示している。
この研究はURIリダイレクトのプラクティスを詳細に分析し、その頻度、タイプ、結果に関する洞察を提供する。
大規模なデータセットを調べることで、リダイレクトチェーンの非効率性を強調し、"シンク"URIやカスタムエラーページなどのパターンを調べます。
この情報は、Webマスター、研究者、デジタルアーキビストがWebのユーザビリティを改善し、リソース割り当てを最適化し、貴重なオンラインコンテンツを保護するのに役立つ。
関連論文リスト
- Client-Side Zero-Shot LLM Inference for Comprehensive In-Browser URL Analysis [0.0]
悪意のあるウェブサイトやフィッシングURLは、サイバーセキュリティのリスクがますます高まっている。
従来の検出アプローチは機械学習に依存している。
包括的URL分析のための新しいクライアントサイドフレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-04T07:47:23Z) - Go-Browse: Training Web Agents with Structured Exploration [49.19468732253614]
本稿では,多彩で現実的なWebエージェントデータを大規模に収集する手法であるGo-Browseを提案する。
Go-Browseはグラフ検索としてデータ収集をフレーミングすることで効率的な探索を実現する。
提案手法をWebArenaベンチマーク上でインスタンス化し,100URLにわたる10Kのタスク解決トラジェクトリと40Kのインタラクションステップのデータセットを収集する。
論文 参考訳(メタデータ) (2025-06-04T03:27:56Z) - Local Frames: Exploiting Inherited Origins to Bypass Content Blockers [9.01934402761379]
ローカルフレーム(つまり、"about:blank"のようなコンテンツをロードするiframe)は、Webのセキュリティとプライバシのツールとして広く使われている。
我々は,ほとんどのプライバシツールでサポートされている4つのコア機能について検討し,それぞれがローカルフレームを使用して回避できるかどうかを判断するテストを開発した。
テストは6つの一般的なWebプライバシとセキュリティツールに適用し、19の合計で少なくとも1つの脆弱性を特定し、ローカルフレームの不正処理に関する一般的なパターンを抽出します。
論文 参考訳(メタデータ) (2025-05-31T00:07:24Z) - How Robust Are Router-LLMs? Analysis of the Fragility of LLM Routing Capabilities [62.474732677086855]
大規模言語モデル(LLM)ルーティングは,計算コストと性能のバランスをとる上で重要な戦略である。
DSCベンチマークを提案する: Diverse, Simple, and Categorizedは、幅広いクエリタイプでルータのパフォーマンスを分類する評価フレームワークである。
論文 参考訳(メタデータ) (2025-03-20T19:52:30Z) - R2D2: Remembering, Replaying and Dynamic Decision Making with a Reflective Agentic Memory [53.94879482534949]
現在のモデルは、Web構造の可視化と理解が限られているため、効率的なナビゲーションとアクション実行に苦しむことが多い。
提案したR2D2フレームワークは,2つのパラダイムを統合することで,これらの課題に対処する。
本研究は,記憶を増強したナビゲーションと反射学習を組み合わせることで,Webエージェントの能力が向上することが示唆された。
論文 参考訳(メタデータ) (2025-01-21T20:21:58Z) - Securing the Web: Analysis of HTTP Security Headers in Popular Global Websites [2.7039386580759666]
調査対象のウェブサイトの半数以上(55.66%)は「F」という異常なセキュリティグレードを受けた。
これらの低いスコアは、コンテンツセキュリティポリシー(CSP)の弱い実装、HSTSガイドラインの無視、サブリソース統合(SRI)の不十分な適用など、複数の問題を露呈している。
論文 参考訳(メタデータ) (2024-10-19T01:03:59Z) - Poisoning Retrieval Corpora by Injecting Adversarial Passages [79.14287273842878]
本稿では,悪意のあるユーザが少数の逆行を発生させるような,高密度検索システムに対する新たな攻撃を提案する。
これらの逆行路を大規模な検索コーパスに挿入すると、この攻撃はこれらのシステムを騙すのに非常に効果的であることを示す。
また、教師なしと教師なしの両方の最先端の高密度レトリバーをベンチマークし、比較する。
論文 参考訳(メタデータ) (2023-10-29T21:13:31Z) - Phishing URL Detection: A Network-based Approach Robust to Evasion [17.786802845563745]
本稿では,正規パターンを付加したフィッシングURLを正確に検出するネットワークベースの推論手法を提案する。
本手法は, 各種実験において, 最先端の手法よりも優れた検出性能を示す。
論文 参考訳(メタデータ) (2022-09-03T16:09:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。