論文の概要: What is Trending on Wikipedia? Capturing Trends and Language Biases
Across Wikipedia Editions
- arxiv url: http://arxiv.org/abs/2002.06885v1
- Date: Mon, 17 Feb 2020 11:04:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-03 11:16:57.826179
- Title: What is Trending on Wikipedia? Capturing Trends and Language Biases
Across Wikipedia Editions
- Title(参考訳): wikipediaのトレンドとは何か?
Wikipedia版にまたがるトレンドと言語バイアスのキャプチャ
- Authors: Volodymyr Miz, Jo\"elle Hanna, Nicolas Aspert, Benjamin Ricaud, and
Pierre Vandergheynst
- Abstract要約: ウィキペディア読者の閲覧行動の自動評価と比較を提案する。
例えば、2018年の最後の4ヶ月間は、英語、フランス語、ロシア語に重点を置いています。
提案手法には3つのステップがあり,まず,選択した期間に最も傾向の高い項目を抽出する。
第2に、半教師付きトピック抽出を行い、第3に、言語間でトピックを比較する。
- 参考スコア(独自算出の注目度): 4.916670182199368
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we propose an automatic evaluation and comparison of the
browsing behavior of Wikipedia readers that can be applied to any language
editions of Wikipedia. As an example, we focus on English, French, and Russian
languages during the last four months of 2018. The proposed method has three
steps. Firstly, it extracts the most trending articles over a chosen period of
time. Secondly, it performs a semi-supervised topic extraction and thirdly, it
compares topics across languages. The automated processing works with the data
that combines Wikipedia's graph of hyperlinks, pageview statistics and
summaries of the pages.
The results show that people share a common interest and curiosity for
entertainment, e.g. movies, music, sports independently of their language.
Differences appear in topics related to local events or about cultural
particularities. Interactive visualizations showing clusters of trending pages
in each language edition are available online
https://wiki-insights.epfl.ch/wikitrends
- Abstract(参考訳): 本研究では,ウィキペディアのどの言語版にも適用可能な,ウィキペディア読者の閲覧行動の自動評価と比較を提案する。
例えば、2018年の最後の4ヶ月間に、英語、フランス語、ロシア語に焦点を当てています。
提案手法には3つのステップがある。
まず、選択された期間に最も傾向の強い記事を抽出する。
第2に、半教師付きトピック抽出を行い、第3に、言語間でトピックを比較する。
この自動処理は、wikipediaのハイパーリンクグラフ、ページビュー統計、ページの要約を組み合わせたデータと連携する。
その結果,映画や音楽,スポーツといった娯楽に共通する関心や好奇心が,言語とは独立して共有されていることがわかった。
地域行事や文化的な特色に関する話題で違いが見られる。
各言語エディションのトレンドページのクラスタを表示するインタラクティブな可視化は、https://wiki-insights.epfl.ch/wikitrendsで公開されている。
関連論文リスト
- Locating Information Gaps and Narrative Inconsistencies Across Languages: A Case Study of LGBT People Portrayals on Wikipedia [49.80565462746646]
我々は,情報ギャップと矛盾を事実レベルで特定するための,効率的かつ信頼性の高い手法であるInfoGap法を紹介した。
我々は、LGBTの人々の描写を分析してInfoGapを評価し、英語、ロシア語、フランス語のウィキペディアの2.7Kの伝記ページを解析した。
論文 参考訳(メタデータ) (2024-10-05T20:40:49Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Models and Datasets for Cross-Lingual Summarisation [78.56238251185214]
対象言語における多文要約に関連付けられたソース言語において,長い文書を含む言語間要約コーパスを提案する。
コーパスは、チェコ語、英語、フランス語、ドイツ語の4つの言語について、12の言語対と指示をカバーしている。
言語対応のウィキペディアのタイトルから、主節と記事の本体を組み合わせることで、ウィキペディアから言語横断的な文書要約インスタンスを導出する。
論文 参考訳(メタデータ) (2022-02-19T11:55:40Z) - Tracking Knowledge Propagation Across Wikipedia Languages [1.8447697408534176]
本稿では,ウィキペディアにおける言語間知識伝達のデータセットについて述べる。
データセットは309の言語版と3300万の記事をカバーしている。
言語版のサイズは伝播速度と関連していることがわかった。
論文 参考訳(メタデータ) (2021-03-30T18:36:13Z) - Language-agnostic Topic Classification for Wikipedia [1.950869817974852]
本稿では,論文をトピックの分類に分類するための記事のリンクに基づく言語に依存しないアプローチを提案する。
言語に依存したアプローチのパフォーマンスにマッチするが、よりシンプルで、カバー範囲がずっと大きいことを示す。
論文 参考訳(メタデータ) (2021-02-26T22:17:50Z) - Multilingual Contextual Affective Analysis of LGBT People Portrayals in
Wikipedia [34.183132688084534]
物語文における特定の語彙選択は、物語の中の人々に対する作家の態度を反映し、聴衆の反応に影響を与える。
言語や文化によって単語の意味がどう異なるかを示し、既存の英語データセットを一般化することの難しさを浮き彫りにしている。
次に、LGBTコミュニティのメンバーのウィキペディアの伝記ページを3つの言語で分析することで、本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-10-21T08:27:36Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z) - Multiple Texts as a Limiting Factor in Online Learning: Quantifying
(Dis-)similarities of Knowledge Networks across Languages [60.00219873112454]
ウィキペディアを通して、ある話題に関する情報を入手する程度が、相談される言語に依存するという仮説を考察する。
ウィキペディアはウェブベースの情報ランドスケープの中心的な部分であるため、言語に関する言語的偏見を示している。
この論文は、研究、教育科学、ウィキペディア研究、計算言語学の橋渡しとなっている。
論文 参考訳(メタデータ) (2020-08-05T11:11:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。