論文の概要: On the Value of Wikipedia as a Gateway to the Web
- arxiv url: http://arxiv.org/abs/2102.07385v1
- Date: Mon, 15 Feb 2021 08:08:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 02:29:13.321704
- Title: On the Value of Wikipedia as a Gateway to the Web
- Title(参考訳): WebへのゲートウェイとしてのWikipediaの価値について
- Authors: Tiziano Piccardi, Miriam Redi, Giovanni Colavizza, Robert West
- Abstract要約: 1ヶ月で、ウィキペディアは外部ウェブサイトに4300万のクリックを発生させ、インフォボックス、引用参照、記事本体などのリンクを通じてほぼ一部を発生させた。
インフォボックスに掲載されている公式リンクはクリックスルー率(CTR)が最も高く、平均2.47%である。
Wikipediaは、検索エンジンとサードパーティのWebサイトの間の足場としてよく使われる。
- 参考スコア(独自算出の注目度): 13.703047949952852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: By linking to external websites, Wikipedia can act as a gateway to the Web.
To date, however, little is known about the amount of traffic generated by
Wikipedia's external links. We fill this gap in a detailed analysis of usage
logs gathered from Wikipedia users' client devices. Our analysis proceeds in
three steps: First, we quantify the level of engagement with external links,
finding that, in one month, English Wikipedia generated 43M clicks to external
websites, in roughly even parts via links in infoboxes, cited references, and
article bodies. Official links listed in infoboxes have by far the highest
click-through rate (CTR), 2.47% on average. In particular, official links
associated with articles about businesses, educational institutions, and
websites have the highest CTR, whereas official links associated with articles
about geographical content, television, and music have the lowest CTR. Second,
we investigate patterns of engagement with external links, finding that
Wikipedia frequently serves as a stepping stone between search engines and
third-party websites, effectively fulfilling information needs that search
engines do not meet. Third, we quantify the hypothetical economic value of the
clicks received by external websites from English Wikipedia, by estimating that
the respective website owners would need to pay a total of $7--13 million per
month to obtain the same volume of traffic via sponsored search. Overall, these
findings shed light on Wikipedia's role not only as an important source of
information, but also as a high-traffic gateway to the broader Web ecosystem.
- Abstract(参考訳): 外部ウェブサイトへのリンクによって、ウィキペディアはWebへのゲートウェイとして機能する。
しかし、現在までウィキペディアの外部リンクによって生成されるトラフィックの量についてはほとんど分かっていない。
このギャップを、ウィキペディアユーザーのクライアントデバイスから収集された利用ログの詳細な分析で埋める。
まず、外部リンクへのエンゲージメントのレベルを定量化し、1ヶ月で英語wikipediaが外部ウェブサイトに4300万クリックを生成し、インフォボックス、引用参照、記事本体のリンクを通じてほぼ一部でも生成したことを突き止めます。
インフォボックスに掲載されている公式リンクはクリックスルー率(CTR)が最も高く、平均2.47%である。
特に、企業、教育機関、ウェブサイトに関する記事に関する公式リンクが最も高いCTRを持っているのに対し、地理的コンテンツ、テレビ、音楽に関する記事に関する公式リンクは最も低いCTRである。
第2に、外部リンクとの関わりのパターンを調査し、wikipediaが検索エンジンとサードパーティーのウェブサイトの間の足場となり、検索エンジンが満たさない情報要求を効果的に満たしていることを見出した。
第3に、英語ウィキペディアからの外部ウェブサイトからのクリックの仮説的な経済価値を定量化し、各ウェブサイトの所有者は、スポンサー付き検索によって同じトラフィック量を取得するために、月7~1300万ドルを支払わなければならないと推定する。
全体として、これらの発見はウィキペディアの役割を重要な情報源としてだけでなく、より広範なWebエコシステムへの高トラフィックのゲートウェイとしても明らかにした。
関連論文リスト
- Orphan Articles: The Dark Matter of Wikipedia [13.290424502717734]
われわれは,他のウィキペディア記事からのリンクを含まない記事である孤児記事について,最初の体系的な研究を行っている。
すべての記事の約15%(8.8M)の驚くほど多くのコンテンツが、ウィキペディアをナビゲートする読者には事実上見えない。
また, 孤児に新たなリンク(脱孤児化)を追加することで, 統計的に有意な可視性向上につながるという疑似実験を通じて因果的証拠を提供する。
論文 参考訳(メタデータ) (2023-06-06T18:04:33Z) - WebCPM: Interactive Web Search for Chinese Long-form Question Answering [104.676752359777]
LFQA(Long-form Question answering)は、複雑でオープンな質問に、段落長の詳細な回答で答えることを目的としている。
中国初のLFQAデータセットであるWebCPMを紹介する。
高品質な質問応答対5,500件,支援事実14,315件,Web検索121,330件を収集した。
論文 参考訳(メタデータ) (2023-05-11T14:47:29Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Improving Wikipedia Verifiability with AI [116.69749668874493]
私たちはSideと呼ばれるニューラルネットワークベースのシステムを開発し、彼らの主張を支持できないWikipediaの引用を識別する。
本誌の最初の引用レコメンデーションは、既存のWikipediaの引用よりも60%多い選好を集めている。
以上の結果から,Wikipediaの妥当性を高めるために,AIベースのシステムを人間と共同で活用できることが示唆された。
論文 参考訳(メタデータ) (2022-07-08T15:23:29Z) - A Large Scale Study of Reader Interactions with Images on Wikipedia [2.370481325034443]
この研究は、Wikipediaで画像とのインタラクションがどのように起きているかに関する、初めての大規模な分析である。
画像との総合的なエンゲージメントを定量化し、29人に1人が少なくとも1つの画像のクリック結果を得た。
画像のクリックは、あまり知られていない人々の視覚芸術、輸送、伝記に関する短い記事や記事でより頻繁に起こることを観察する。
論文 参考訳(メタデータ) (2021-12-03T12:02:59Z) - Where the Earth is flat and 9/11 is an inside job: A comparative
algorithm audit of conspiratorial information in web search results [62.997667081978825]
本稿では,Google,Bing,DuckDuckGo,Yahoo,Yandexの5つの検索エンジンを対象に,検索結果における比較情報の分布について検討する。
われわれは、Google以外の検索エンジンが一貫して共謀広告の検索結果を表示し、共謀広告のウェブサイトへのリンクをトップに返したことを知った。
共謀プロモーティングの結果のほとんどはソーシャルメディアや共謀のウェブサイトから得られたものであり、一方共謀の情報は科学的なウェブサイトで共有され、より少なからぬレガシなメディアによって共有された。
論文 参考訳(メタデータ) (2021-12-02T14:29:21Z) - Multiple Texts as a Limiting Factor in Online Learning: Quantifying
(Dis-)similarities of Knowledge Networks across Languages [60.00219873112454]
ウィキペディアを通して、ある話題に関する情報を入手する程度が、相談される言語に依存するという仮説を考察する。
ウィキペディアはウェブベースの情報ランドスケープの中心的な部分であるため、言語に関する言語的偏見を示している。
この論文は、研究、教育科学、ウィキペディア研究、計算言語学の橋渡しとなっている。
論文 参考訳(メタデータ) (2020-08-05T11:11:55Z) - A Deeper Investigation of the Importance of Wikipedia Links to the
Success of Search Engines [7.433327915285967]
検索結果ページ(SERP)におけるウィキペディアリンクの発生状況に関する調査結果について報告する。
ウィキペディアのリンクは重要な検索コンテキストでは極めて一般的であり、一般的なクエリやトレンドクエリでは全SERPの67~84%に表示されるが、医療クエリではそれほど多くはない。
本研究は,(1)ウィキペディアのコンテンツと研究はウィキペディア領域以外で大きな影響を与え,(2)検索エンジンのような強力な技術はボランティアが作成した無料コンテンツに大きく依存している,という補完的な概念を裏付けるものである。
論文 参考訳(メタデータ) (2020-04-21T19:58:28Z) - Entity Extraction from Wikipedia List Pages [2.3605348648054463]
私たちは、DBpediaをバックボーンとして、カテゴリとリストページから大規模な分類を構築します。
遠隔監視により、リストページ内の新しいエンティティの識別のためのトレーニングデータを抽出する。
我々はDBpediaを7.5万の新しい型ステートメントと380万の高精度な新しい事実で拡張する。
論文 参考訳(メタデータ) (2020-03-11T07:48:46Z) - Quantifying Engagement with Citations on Wikipedia [13.703047949952852]
300ページビューの1つは、参照クリックの結果である。
クリックはより短いページや低い品質のページで頻繁に行われる。
最近のコンテンツ、オープンアクセスソース、ライフイベントに関する参考資料が特に人気である。
論文 参考訳(メタデータ) (2020-01-23T15:52:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。