論文の概要: "Way back then": A Data-driven View of 25+ years of Web Evolution
- arxiv url: http://arxiv.org/abs/2202.08239v1
- Date: Wed, 16 Feb 2022 18:36:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 15:00:06.352086
- Title: "Way back then": A Data-driven View of 25+ years of Web Evolution
- Title(参考訳): さかのぼって」:25年以上のウェブの進化をデータ駆動で見る
- Authors: Vibhor Agarwal, Nishanth Sastry
- Abstract要約: 私たちは、Internet Archiveや"Wayback Machine" Archive.orgから25年以上にわたって、Alexaのトップ100のWebサイトを調べています。
1990年代中盤から後半にかけてのGeocitiesやYahoo!、今日のGoogle、Facebook、Tiktokなどの人気の変化について調べる。
また、さまざまなカテゴリーのWebサイトとその人気を長年にわたって調べ、ニュースや教育関連Webサイトの人気が低下している証拠を見出した。
- 参考スコア(独自算出の注目度): 4.055696230852368
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Since the inception of the first web page three decades back, the Web has
evolved considerably, from static HTML pages in the beginning to the dynamic
web pages of today, from mainly the text-based pages of the 1990s to today's
multimedia rich pages, etc. Although much of this is known anecdotally, to our
knowledge, there is no quantitative documentation of the extent and timing of
these changes. This paper attempts to address this gap in the literature by
looking at the top 100 Alexa websites for over 25 years from the Internet
Archive or the "Wayback Machine", archive.org. We study the changes in
popularity, from Geocities and Yahoo! in the mid-to-late 1990s to the likes of
Google, Facebook, and Tiktok of today. We also look at different categories of
websites and their popularity over the years and find evidence for the decline
in popularity of news and education-related websites, which have been replaced
by streaming media and social networking sites. We explore the emergence and
relative prevalence of different MIME-types (text vs. image vs. video vs.
javascript and json) and study whether the use of text on the Internet is
declining.
- Abstract(参考訳): 最初のWebページが30年前に登場して以来、Webは、1990年代のテキストベースのページから今日のマルチメディアリッチなページに至るまで、初期の静的HTMLページから今日の動的Webページまで、大きく進化してきた。
これらの多くは逸話的に知られているが、私たちの知る限り、これらの変化の程度とタイミングに関する定量的な資料は存在しない。
本稿は,Internet Archive や "Wayback Machine" Archive.org から25年以上にわたって,Alexa のトップ100 Web サイトを閲覧することで,文学におけるこのギャップに対処する試みである。
1990年代中盤から後半にかけてのGeocitiesやYahoo!、今日のGoogle、Facebook、Tiktokなどの人気の変化について調べる。
また、さまざまなカテゴリーのWebサイトとその人気を長年にわたって検討し、ニュースや教育関連のWebサイトの人気が低下している証拠を、ストリーミングメディアやソーシャルネットワークサイトに置き換えた。
異なるmimeタイプ(テキスト対画像対ビデオ対javascriptとjson)の出現と相対性を調査し、インターネットでのテキストの使用が減少しているかどうかを調べる。
関連論文リスト
- Towards Scalable Topic Detection on Web via Simulating Levy Walks Nature of Topics in Similarity Space [55.97416108140739]
類似性空間におけるLevi Walk自然をシミュレートすることで,グループトピックに対する新しい,しかし非常に強力なExplore-Exploit(EE)アプローチを提案する。
2つの公開データセットの実験により、我々の手法は、有効性の観点からは最先端の手法に匹敵するだけでなく、効率面では最先端の手法よりも著しく優れていることが示された。
論文 参考訳(メタデータ) (2024-07-26T07:19:46Z) - Health Misinformation Detection in Web Content via Web2Vec: A Structural-, Content-based, and Context-aware Approach based on Web2Vec [3.299010876315217]
我々は、Webページの信頼性を評価するために、構造、コンテンツ、コンテキストベースの機能を研究するための研究の余地がまだあるWebページコンテンツに焦点を当てている。
本研究の目的は, フィッシングWebページ検出(Web2Vec)の文脈で最近提案されたWebページの埋め込み表現から始まる, 深層学習モデルに関連する機能の有効性を検討することである。
論文 参考訳(メタデータ) (2024-07-05T10:33:15Z) - Bridging Social Media and Search Engines: Dredge Words and the Detection of Unreliable Domains [3.659498819753633]
我々はWebグラフとソーシャルメディアのコンテキストを統合したWebサイト信頼性分類・発見システムを開発した。
本稿では,信頼できないドメインが検索エンジン上で高いランクを付けるような単語,用語,フレーズの概念を紹介する。
私たちは、ソーシャルメディアとオンラインコマースプラットフォームとの強いつながりを強調した、ドレッジワードの新たなデータセットをリリースしました。
論文 参考訳(メタデータ) (2024-06-17T11:22:04Z) - Forgotten Knowledge: Examining the Citational Amnesia in NLP [63.13508571014673]
論文を引用するのにどれくらいの時間がかかったのか、どのようにして変化したのか、そしてこの引用的注意/記憶に相関する要因は何か。
引用論文の約62%が出版直前の5年間のものであり,約17%が10年以上前のものであることを示す。
1990年から2014年にかけて、引用論文の中央値と年齢の多様性は着実に増加してきたが、その後傾向が逆転し、現在のNLP論文は、時間的引用の多様性が極端に低い。
論文 参考訳(メタデータ) (2023-05-29T18:30:34Z) - Web 3.0: The Future of Internet [53.234101208024335]
Web 3.0は分散化されたWebアーキテクチャであり、以前よりもインテリジェントで安全である。
Web 3.0は、分散テクノロジに従って、Webデータのオーナシップに対処できる。
経済、文化、テクノロジーの観点から、インターネットの世界を最適化する。
論文 参考訳(メタデータ) (2023-03-23T15:37:42Z) - Web3: The Next Internet Revolution [50.16560061003771]
次のインターネット革命: Web3は、従来のソーシャルモデルに新しい機会を開く。
分散金融はグローバルであり、銀行を持たない人々のための金融包括性を持つ。
Web3の今後の研究方向性について論じる。
論文 参考訳(メタデータ) (2023-03-22T23:37:43Z) - Leveraging Google's Publisher-specific IDs to Detect Website
Administration [3.936965297430477]
本稿では,Web上のWebサイトの管理を検知する新しいグラフベースの手法を提案する。
提案手法を上位100万のWebサイトに適用し,Webサイト管理の生み出したグラフの特徴について検討する。
調査の結果,Webサイトの約90%が1つのパブリッシャに関連付けられており,小さなパブリッシャがあまり人気のないWebサイトを管理する傾向にあることがわかった。
論文 参考訳(メタデータ) (2022-02-10T14:59:17Z) - Prediction of new outlinks for focused Web crawling [0.0]
この研究は、短い履歴を用いて、新しいリンクを効果的に検出するための方法論を提供する。
リンク変更率、新しいリンクの存在、新しいリンク数という3つのターゲットに対する統計モデルを提供する。
注目すべき発見は、ターゲットページの履歴が利用できない場合、我々の新機能は、関連するページの履歴を表すもので、ターゲットページの新規リンクに対して最も予測的であることである。
論文 参考訳(メタデータ) (2021-11-09T11:36:21Z) - The Rise and Fall of Fake News sites: A Traffic Analysis [62.51737815926007]
偽ニュースサイトのオンラインプレゼンスを調査し、実際のニュースサイトと比較してその行動を特徴づけます。
そこで本研究では,偽ニュースサイトを自動的に検出するコンテンツ非依存のMLを構築した。
論文 参考訳(メタデータ) (2021-03-16T18:10:22Z) - Echo Chambers on Social Media: A comparative analysis [64.2256216637683]
本研究では,4つのソーシャルメディアプラットフォーム上で100万ユーザが生成した100万個のコンテンツに対して,エコーチャンバーの操作的定義を導入し,大規模な比較分析を行う。
議論の的になっているトピックについてユーザの傾きを推測し、異なる特徴を分析してインタラクションネットワークを再構築する。
我々は、Facebookのようなニュースフィードアルゴリズムを実装するプラットフォームが、エコーチャンバの出現を招きかねないという仮説を支持する。
論文 参考訳(メタデータ) (2020-04-20T20:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。