論文の概要: Curious Rhythms: Temporal Regularities of Wikipedia Consumption
- arxiv url: http://arxiv.org/abs/2305.09497v1
- Date: Tue, 16 May 2023 14:48:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-17 14:38:48.792183
- Title: Curious Rhythms: Temporal Regularities of Wikipedia Consumption
- Title(参考訳): Curious Rhythms: ウィキペディア消費の時間的規則性
- Authors: Tiziano Piccardi, Martin Gerlach, Robert West
- Abstract要約: 日中交替のグローバルなパターンを除去した後も,個々の物品の消費習慣は日中変化が強く維持されていることを示す。
我々はウィキペディアの記事のアクセスリズムの話題的・文脈的相関を調査し、記事の話題、読者国、アクセスデバイス(モバイル対デスクトップ)が日々の注意パターンの重要な予測因子であることを示す。
- 参考スコア(独自算出の注目度): 13.484359389266867
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wikipedia, in its role as the world's largest encyclopedia, serves a broad
range of information needs. Although previous studies have noted that Wikipedia
users' information needs vary throughout the day, there is to date no
large-scale, quantitative study of the underlying dynamics. The present paper
fills this gap by investigating temporal regularities in daily consumption
patterns in a large-scale analysis of billions of timezone-corrected page
requests mined from English Wikipedia's server logs, with the goal of
investigating how context and time relate to the kind of information consumed.
First, we show that even after removing the global pattern of day-night
alternation, the consumption habits of individual articles maintain strong
diurnal regularities. Then, we characterize the prototypical shapes of
consumption patterns, finding a particularly strong distinction between
articles preferred during the evening/night and articles preferred during
working hours. Finally, we investigate topical and contextual correlates of
Wikipedia articles' access rhythms, finding that article topic, reader country,
and access device (mobile vs. desktop) are all important predictors of daily
attention patterns. These findings shed new light on how humans seek
information on the Web by focusing on Wikipedia as one of the largest open
platforms for knowledge and learning, emphasizing Wikipedia's role as a rich
knowledge base that fulfills information needs spread throughout the day, with
implications for understanding information seeking across the globe and for
designing appropriate information systems.
- Abstract(参考訳): wikipediaは世界最大の百科事典としての役割を担っており、幅広い情報のニーズに応えている。
以前の研究では、ウィキペディアの利用者の情報は一日を通じて異なるとされてきたが、基礎となるダイナミクスに関する大規模で定量的な研究は、今日まで行われていない。
本稿では,英語ウィキペディアのサーバログから抽出した数十億件のタイムゾーン補正ページ要求を大規模に分析し,その状況と時間が消費情報の種類とどのように関連しているかを調査することで,このギャップを埋める。
まず,昼夜交代のグローバルパターンを取り除いた後も,個々の物品の消費習慣が強い日内規則性を維持していることを示す。
次に,消費パターンの原型的形状を特徴とし,特に夕方・夜間に好む物品と勤務時間に好まれる物品とを区別する。
最後に,wikipedia記事のアクセスリズムのトピックと文脈の相関について検討し,記事のトピック,読者の国,アクセスデバイス(モバイルとデスクトップ)が毎日の注意パターンの重要な予測要因であることを見出した。
これらの発見は、知識と学習のための最大のオープンプラットフォームであるwikipediaに焦点をあてて、人々がweb上で情報を求める方法に新たな光を当て、wikipediaが一日を通して情報のニーズを満たすリッチな知識ベースとしての役割を強調し、世界中の情報を理解し、適切な情報システムを設計することを示唆した。
関連論文リスト
- Locating Information Gaps and Narrative Inconsistencies Across Languages: A Case Study of LGBT People Portrayals on Wikipedia [49.80565462746646]
我々は,情報ギャップと矛盾を事実レベルで特定するための,効率的かつ信頼性の高い手法であるInfoGap法を紹介した。
我々は、LGBTの人々の描写を分析してInfoGapを評価し、英語、ロシア語、フランス語のウィキペディアの2.7Kの伝記ページを解析した。
論文 参考訳(メタデータ) (2024-10-05T20:40:49Z) - Between News and History: Identifying Networked Topics of Collective
Attention on Wikipedia [0.0]
トピック検出のための時間的コミュニティ検出手法を開発した。
本手法をウィキペディア上での1年間の現在イベントのデータセットに適用する。
私たちは、現在の出来事を、より確立した知識よりも強く反映するトピックを解決できます。
論文 参考訳(メタデータ) (2022-11-14T18:36:21Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - Towards Proactive Information Retrieval in Noisy Text with Wikipedia
Concepts [6.744385328015561]
本研究は,クエリのコンテキストをウィキペディアの概念で活用することで,ノイズのあるテキスト上でのプロアクティブな情報検索を改善する方法について検討する。
ポッドキャストセグメント検索タスクに関する実験は、ウィキペディアの概念に関連性の明確なシグナルがあることを実証している。
また、クエリの背景コンテキストをWikifyingすることで、クエリの意味を曖昧にし、さらにプロアクティブな情報検索を支援することができる。
論文 参考訳(メタデータ) (2022-10-18T14:12:06Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - The Web Is Your Oyster -- Knowledge-Intensive NLP against a Very Large
Web Corpus [76.9522248303716]
我々は,既存のKI-NLPタスクを評価するための新しいセットアップを提案し,背景コーパスをユニバーサルなWebスナップショットに一般化する。
当初Wikipediaで開発された標準のKI-NLPベンチマークであるKILTを再利用し,CCNetのサブセットであるSphere corpusの使用をシステムに依頼した。
カバー範囲の潜在的なギャップ、スケールの課題、構造の欠如、品質の低下にもかかわらず、Sphereからの検索によって、最新の最先端のシステムがウィキペディアベースのモデルに適合し、さらに優れています。
論文 参考訳(メタデータ) (2021-12-18T13:15:34Z) - Surfer100: Generating Surveys From Web Resources on Wikipedia-style [49.23675182917996]
先進言語モデリングの最近の進歩は、ウィキペディアのリード段落生成のための2段階の抽出的抽象的アプローチと組み合わせることができることを示す。
提案手法は,より長いウィキペディアスタイルの要約をセクションで生成するために拡張され,100件の人文調査による詳細な研究を通じて,このような手法が本アプリケーションでどのように苦しむかを検討する。
論文 参考訳(メタデータ) (2021-12-13T02:18:01Z) - Tracking Knowledge Propagation Across Wikipedia Languages [1.8447697408534176]
本稿では,ウィキペディアにおける言語間知識伝達のデータセットについて述べる。
データセットは309の言語版と3300万の記事をカバーしている。
言語版のサイズは伝播速度と関連していることがわかった。
論文 参考訳(メタデータ) (2021-03-30T18:36:13Z) - Multiple Texts as a Limiting Factor in Online Learning: Quantifying
(Dis-)similarities of Knowledge Networks across Languages [60.00219873112454]
ウィキペディアを通して、ある話題に関する情報を入手する程度が、相談される言語に依存するという仮説を考察する。
ウィキペディアはウェブベースの情報ランドスケープの中心的な部分であるため、言語に関する言語的偏見を示している。
この論文は、研究、教育科学、ウィキペディア研究、計算言語学の橋渡しとなっている。
論文 参考訳(メタデータ) (2020-08-05T11:11:55Z) - How Inclusive Are Wikipedia's Hyperlinks in Articles Covering Polarizing
Topics? [8.035521056416242]
偏光トピックの相補的な側面を記述した記事間の相互接続トポロジの影響に着目した。
トピックの異なる側面へのユーザの露出を定量化するために,多様な情報への露出の新たな尺度を導入する。
ネットワークトポロジがユーザのトピックに関する多様な情報への露出を著しく制限するケースを特定し,ユーザが知識バブルに留まることを奨励する。
論文 参考訳(メタデータ) (2020-07-16T09:19:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。