Fugu-MT 論文翻訳(概要): The Web unpacked: a quantitative analysis of global Web usage

論文の概要: The Web unpacked: a quantitative analysis of global Web usage

arxiv url: http://arxiv.org/abs/2404.17095v1
Date: Fri, 26 Apr 2024 01:05:47 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-29 14:24:03.740921
Title: The Web unpacked: a quantitative analysis of global Web usage
Title（参考訳）: ウェブ・アンパック : グローバルウェブ利用の定量的分析
Authors: Henrique S. Xavier,
Abstract要約: ウェブトラフィックの総量を推定し、ドメインおよび産業セクター間でのウェブトラフィックの分布を調査する。分析の結果,Webトラフィックが著しく集中していることが判明した。トラフィックの大部分は営利目的のウェブサイトだが、ほとんどが無料のウェブサイトに流れており、有料の壁をベースとしないビジネスモデルの優位性を強調している。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: This paper presents a comprehensive analysis of global web usage patterns based on data from SimilarWeb, a leading source for estimating web traffic. Leveraging a dataset comprising over 250,000 websites, we estimate the total web traffic and investigate its distribution among domains and industry sectors. We detail the characteristics of the top 116 domains, which comprise an estimated one-third of all web traffic. Our analysis scrutinizes various attributes of these domains, including their content sources and types, access requirements, offline presence, and ownership features. Our analysis reveals a significant concentration of web traffic, with a diminutive number of top websites capturing the majority of visits. Search engines, news and media, social networks, streaming, and adult content emerge as primary attractors of web traffic, which is also highly concentrated on platforms and USA-owned websites. Much of the traffic goes to for-profit but mostly free-of-charge websites, highlighting the dominance of business models not based on paywalls.
Abstract（参考訳）: 本稿では,Webトラフィックを推定する主要な情報源であるSimis Webのデータをもとに,グローバルなWeb利用パターンを包括的に分析する。 25万以上のWebサイトからなるデータセットを活用して、Webトラフィックの総量を推定し、ドメインや業界セクター間でのその分布を調査する。ウェブトラフィックの3分の1を占めるトップ116ドメインの特徴について詳述する。分析では、コンテンツソースやタイプ、アクセス要件、オフライン存在、オーナシップ機能など、これらのドメインのさまざまな属性を精査する。分析の結果,Webトラフィックが著しく集中していることが判明した。検索エンジン、ニュース、メディア、ソーシャルネットワーク、ストリーミング、そしてアダルトコンテンツがウェブトラフィックの主要な魅力として浮上し、プラットフォームや米国が所有するウェブサイトにも集中している。トラフィックの大部分は営利目的のウェブサイトだが、ほとんどが無料のウェブサイトに流れており、有料の壁をベースとしないビジネスモデルの優位性を強調している。

関連論文リスト

Explore to Evolve: Scaling Evolved Aggregation Logic via Proactive Online Exploration for Deep Research Agents [70.77400371166922]
深層研究ウェブエージェントは、洞察に富んだ研究のための知識を厳格に分析し集約する必要がある。本研究では,Webエージェントの検証可能なトレーニングデータを構築するためのExplore to Evolveパラダイムを提案する。オープンソースのエージェントフレームワークであるSmolAgentsをベースとして,教師付き微調整トラジェクトリを収集し,一連の基礎モデルを構築する。
論文参考訳（メタデータ） (2025-10-16T08:37:42Z)
WebDS: An End-to-End Benchmark for Web-based Data Science [59.270670758607494]
WebDSは、Webベースの初のエンドツーエンドデータサイエンスベンチマークである。 29のWebサイトにわたる870のWebベースのデータサイエンスタスクで構成されている。 WebDSは、実用的に有用なLCMベースのデータサイエンスの開発において、大きな進歩の舞台となる。
論文参考訳（メタデータ） (2025-08-02T06:39:59Z)
Embodied Web Agents: Bridging Physical-Digital Realms for Integrated Agent Intelligence [109.32705135051486]
Embodied Web Agentsは、エンボディメントとWebスケール推論を流動的にブリッジする、AIエージェントのための新しいパラダイムである。多様なタスクスイートを含むEmbodied Web Agents Benchmarkをリリースする。その結果、最先端のAIシステムと人間の能力の間には、大きなパフォーマンスのギャップが浮かび上がっている。
論文参考訳（メタデータ） (2025-06-18T17:58:17Z)
An Illusion of Progress? Assessing the Current State of Web Agents [49.76769323750729]
我々は,Webエージェントの現状を包括的かつ厳密に評価する。結果は、現在のエージェントの能力の非常に異なる描写を描いており、以前報告された結果に過度に最適化されていることを示唆している。オンライン評価ベンチマークであるOnline-Mind2Webを紹介した。
論文参考訳（メタデータ） (2025-04-02T05:51:29Z)
Multi-Record Web Page Information Extraction From News Websites [83.88591755871734]
本稿では,多数のレコードを含むWebページから情報を抽出する問題に焦点をあてる。このギャップに対処するため、リストページ用に設計された大規模なオープンアクセスデータセットを作成しました。我々のデータセットには13,120のWebページとニュースリストがあり、スケールと複雑さの両方で既存のデータセットをはるかに上回っている。
論文参考訳（メタデータ） (2025-02-20T15:05:00Z)
Fuzzy Logic Approach For Visual Analysis Of Websites With K-means Clustering-based Color Extraction [0.0]
本稿では,ユーザエクスペリエンス向上におけるWebサイトデザインの美学の重要性について検討する。これは、しばしば50ミリ秒以内に形成される最初の印象が、ウェブサイトの魅力とユーザビリティに対するユーザの認識に重大な影響を与えることを強調している。カラーハーモニーとフォントの人気に基づいて,ウェブサイトの美意識を測定する新しい手法を提案する。
論文参考訳（メタデータ） (2024-07-16T06:56:05Z)
MS MARCO Web Search: a Large-scale Information-rich Web Dataset with Millions of Real Click Labels [95.48844474720798]
我々は,MS MARCO Web Searchを紹介した。このデータセットは現実世界のWebドキュメントとクエリ分布を模倣する。 MS MARCO Web Searchは3つのウェブ検索課題を伴う検索ベンチマークを提供する。
論文参考訳（メタデータ） (2024-05-13T07:46:44Z)
WebVoyager: Building an End-to-End Web Agent with Large Multimodal Models [65.18602126334716]
既存のWebエージェントは1つの入力モダリティしか処理せず、単純化されたWebシミュレータや静的なWebスナップショットでのみ評価される。我々は,WebVoyagerを紹介した。LMM(Large Multimodal Model)を利用したWebエージェントで,現実世界のWebサイトと対話することで,エンド・ツー・エンドでのユーザ指示を完了することができる。 GPT-4(All Tools)とWebVoyager(text-only)の両方のパフォーマンスを大幅に上回る、59.1%のタスク成功率を実現していることを示す。
論文参考訳（メタデータ） (2024-01-25T03:33:18Z)
VisualWebArena: Evaluating Multimodal Agents on Realistic Visual Web Tasks [93.85005277463802]
VisualWebArenaは、マルチモーダルWebエージェントのパフォーマンスを現実的なタスクで評価するために設計されたベンチマークである。このベンチマークを実行するには、イメージテキスト入力を正確に処理し、自然言語命令を解釈し、ユーザが定義した目的を達成するためにウェブサイト上でアクションを実行する必要がある。
論文参考訳（メタデータ） (2024-01-24T18:35:21Z)
Mind2Web: Towards a Generalist Agent for the Web [25.363429937913065]
Mind2Webは、Webのためのジェネラリストエージェントの開発と評価のための最初のデータセットである。 31のドメインにまたがる137のWebサイトから2,000以上のオープンエンドタスクが収集され、Mind2WebはジェネラリストWebエージェントを構築するために必要な3つの材料を提供する。 Mind2Webをベースとして,汎用的なWebエージェントを構築するために,大規模言語モデル(LLM)を最初に検討する。
論文参考訳（メタデータ） (2023-06-09T17:44:31Z)
Multimodal Web Navigation with Instruction-Finetuned Foundation Models [99.14209521903854]
視覚言語基礎モデルを用いたWebエージェントのためのデータ駆動オフライントレーニングについて検討する。本稿では,WebページのスクリーンショットとHTMLページの両方を観察する命令追従型マルチモーダルエージェントWebGUMを提案する。このレシピは,マルチモーダル認識,HTML理解,マルチステップ推論といったエージェントの能力を向上させることを実証的に実証する。
論文参考訳（メタデータ） (2023-05-19T17:44:34Z)
Leveraging Google's Publisher-specific IDs to Detect Website Administration [3.936965297430477]
本稿では,Web上のWebサイトの管理を検知する新しいグラフベースの手法を提案する。提案手法を上位100万のWebサイトに適用し,Webサイト管理の生み出したグラフの特徴について検討する。調査の結果,Webサイトの約90%が1つのパブリッシャに関連付けられており,小さなパブリッシャがあまり人気のないWebサイトを管理する傾向にあることがわかった。
論文参考訳（メタデータ） (2022-02-10T14:59:17Z)
Webly Supervised Fine-Grained Recognition: Benchmark Datasets and An Approach [115.91099791629104]
WebFG-496 と WebiNat-5089 の2つの新しいベンチマークを構築した。 WebiNat-5089には5089のサブカテゴリと1100万以上のWebトレーニングイメージが含まれている。そこで本研究では,これらのデータセットのベンチマークを行うための新しいウェブ教師付き手法("Peer-learning'" と呼ぶ)を提案する。
論文参考訳（メタデータ） (2021-08-05T06:28:32Z)
Analisis Kualitas Layanan Website E-Commerce Bukalapak Terhadap Kepuasan Pengguna Mahasiswa Universitas Bina Darma Menggunakan Metode Webqual 4.0 [0.0]
オンライン開発をサポートする要因の1つは、オンラインの売買サイトやElectronic Commerceである。 Web または Web は、メディアの形式であり、ページの集合として解釈できる。本研究は,ユーザビリティ,情報品質,ユーザ満足度に関するインタラクション品質の3次元からなる Webqual 4.0 手法を用いた。
論文参考訳（メタデータ） (2021-06-23T10:57:04Z)
A Large Visual, Qualitative and Quantitative Dataset of Web Pages [4.5002924206836]
49,438ページの大規模なデータセットを作成しました。視覚、テキスト、数値のデータタイプで構成され、世界中のすべての国を含み、幅広いトピックを検討しています。
論文参考訳（メタデータ） (2021-05-15T01:31:25Z)
Open Domain Generalization with Domain-Augmented Meta-Learning [83.59952915761141]
オープンドメイン一般化(OpenDG)の新しい実践的問題について研究する。本稿では,オープンドメイン一般化表現を学ぶためのメタ学習フレームワークを提案する。種々のマルチドメインデータセットの実験結果から、提案したドメイン拡張メタラーニング(DAML)が、未確認ドメイン認識の先行手法より優れていることが示された。
論文参考訳（メタデータ） (2021-04-08T09:12:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。