論文の概要: A Deeper Investigation of the Importance of Wikipedia Links to the
Success of Search Engines
- arxiv url: http://arxiv.org/abs/2004.10265v1
- Date: Tue, 21 Apr 2020 19:58:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-22 20:30:25.798629
- Title: A Deeper Investigation of the Importance of Wikipedia Links to the
Success of Search Engines
- Title(参考訳): 検索エンジンの成功に対するウィキペディアリンクの重要性に関するより深い調査
- Authors: Nicholas Vincent and Brent Hecht
- Abstract要約: 検索結果ページ(SERP)におけるウィキペディアリンクの発生状況に関する調査結果について報告する。
ウィキペディアのリンクは重要な検索コンテキストでは極めて一般的であり、一般的なクエリやトレンドクエリでは全SERPの67~84%に表示されるが、医療クエリではそれほど多くはない。
本研究は,(1)ウィキペディアのコンテンツと研究はウィキペディア領域以外で大きな影響を与え,(2)検索エンジンのような強力な技術はボランティアが作成した無料コンテンツに大きく依存している,という補完的な概念を裏付けるものである。
- 参考スコア(独自算出の注目度): 7.433327915285967
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A growing body of work has highlighted the important role that Wikipedia's
volunteer-created content plays in helping search engines achieve their core
goal of addressing the information needs of millions of people. In this paper,
we report the results of an investigation into the incidence of Wikipedia links
in search engine results pages (SERPs). Our results extend prior work by
considering three U.S. search engines, simulating both mobile and desktop
devices, and using a spatial analysis approach designed to study modern SERPs
that are no longer just "ten blue links". We find that Wikipedia links are
extremely common in important search contexts, appearing in 67-84% of all SERPs
for common and trending queries, but less often for medical queries.
Furthermore, we observe that Wikipedia links often appear in "Knowledge Panel"
SERP elements and are in positions visible to users without scrolling, although
Wikipedia appears less in prominent positions on mobile devices. Our findings
reinforce the complementary notions that (1) Wikipedia content and research has
major impact outside of the Wikipedia domain and (2) powerful technologies like
search engines are highly reliant on free content created by volunteers.
- Abstract(参考訳): wikipediaのボランティア制作コンテンツが、何百万人もの人々の情報ニーズに対応するという、検索エンジンの核となる目標を達成する上で重要な役割を担っている。
本稿では,検索エンジン検索結果ページ(SERP)におけるウィキペディアリンクの出現状況について調査した結果を報告する。
本研究は,モバイルとデスクトップの両方のデバイスをシミュレートする3つの米国検索エンジンと,単に「テンブルーリンク」ではない現代のSERPを研究するための空間解析手法を用いて,先行作業を拡張した。
wikipediaのリンクは重要な検索コンテキストでは非常に一般的であり、一般的なクエリやトレンドクエリのサープの67-84%に現れるが、医療クエリではそれほど多くはない。
さらに、ウィキペディアのリンクは「知識パネル」のSERP要素によく表示され、スクロールせずにユーザーが見える位置に表示されるが、モバイルデバイスでは目立った位置には表示されない。
本研究は,(1)ウィキペディアのコンテンツと研究はウィキペディア領域以外で大きな影響を与え,(2)検索エンジンのような強力な技術はボランティアが作成した無料コンテンツに大きく依存している,という補完的な概念を裏付けるものである。
関連論文リスト
- User Attitudes to Content Moderation in Web Search [49.1574468325115]
我々は、Web検索における誤解を招く可能性のあるコンテンツや攻撃的なコンテンツに適用される様々なモデレーションプラクティスに対するサポートレベルについて検討する。
最も支持されている実践は、誤解を招く可能性のあるコンテンツや不快なコンテンツについてユーザーに知らせることであり、最も支持されていないものは、検索結果を完全に削除することである。
より保守的なユーザーやウェブ検索結果に対する信頼度が低いユーザーは、ウェブ検索におけるコンテンツモデレーションに反する傾向にある。
論文 参考訳(メタデータ) (2023-10-05T10:57:15Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - Towards Proactive Information Retrieval in Noisy Text with Wikipedia
Concepts [6.744385328015561]
本研究は,クエリのコンテキストをウィキペディアの概念で活用することで,ノイズのあるテキスト上でのプロアクティブな情報検索を改善する方法について検討する。
ポッドキャストセグメント検索タスクに関する実験は、ウィキペディアの概念に関連性の明確なシグナルがあることを実証している。
また、クエリの背景コンテキストをWikifyingすることで、クエリの意味を曖昧にし、さらにプロアクティブな情報検索を支援することができる。
論文 参考訳(メタデータ) (2022-10-18T14:12:06Z) - Improving Wikipedia Verifiability with AI [116.69749668874493]
私たちはSideと呼ばれるニューラルネットワークベースのシステムを開発し、彼らの主張を支持できないWikipediaの引用を識別する。
本誌の最初の引用レコメンデーションは、既存のWikipediaの引用よりも60%多い選好を集めている。
以上の結果から,Wikipediaの妥当性を高めるために,AIベースのシステムを人間と共同で活用できることが示唆された。
論文 参考訳(メタデータ) (2022-07-08T15:23:29Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - A Large-Scale Characterization of How Readers Browse Wikipedia [13.106604261718381]
読者がウィキペディアを閲覧する方法に関する,最初の体系的な大規模分析を提示する。
Wikipediaのサーバーログからの数十億のページリクエストを使用して、読者が記事にアクセスする方法を測定します。
ナビゲーションの挙動は、非常に多様な構造によって特徴づけられる。
論文 参考訳(メタデータ) (2021-12-22T12:54:44Z) - The Web Is Your Oyster -- Knowledge-Intensive NLP against a Very Large
Web Corpus [76.9522248303716]
我々は,既存のKI-NLPタスクを評価するための新しいセットアップを提案し,背景コーパスをユニバーサルなWebスナップショットに一般化する。
当初Wikipediaで開発された標準のKI-NLPベンチマークであるKILTを再利用し,CCNetのサブセットであるSphere corpusの使用をシステムに依頼した。
カバー範囲の潜在的なギャップ、スケールの課題、構造の欠如、品質の低下にもかかわらず、Sphereからの検索によって、最新の最先端のシステムがウィキペディアベースのモデルに適合し、さらに優れています。
論文 参考訳(メタデータ) (2021-12-18T13:15:34Z) - Surfer100: Generating Surveys From Web Resources on Wikipedia-style [49.23675182917996]
先進言語モデリングの最近の進歩は、ウィキペディアのリード段落生成のための2段階の抽出的抽象的アプローチと組み合わせることができることを示す。
提案手法は,より長いウィキペディアスタイルの要約をセクションで生成するために拡張され,100件の人文調査による詳細な研究を通じて,このような手法が本アプリケーションでどのように苦しむかを検討する。
論文 参考訳(メタデータ) (2021-12-13T02:18:01Z) - A Large Scale Study of Reader Interactions with Images on Wikipedia [2.370481325034443]
この研究は、Wikipediaで画像とのインタラクションがどのように起きているかに関する、初めての大規模な分析である。
画像との総合的なエンゲージメントを定量化し、29人に1人が少なくとも1つの画像のクリック結果を得た。
画像のクリックは、あまり知られていない人々の視覚芸術、輸送、伝記に関する短い記事や記事でより頻繁に起こることを観察する。
論文 参考訳(メタデータ) (2021-12-03T12:02:59Z) - On the Value of Wikipedia as a Gateway to the Web [13.703047949952852]
1ヶ月で、ウィキペディアは外部ウェブサイトに4300万のクリックを発生させ、インフォボックス、引用参照、記事本体などのリンクを通じてほぼ一部を発生させた。
インフォボックスに掲載されている公式リンクはクリックスルー率(CTR)が最も高く、平均2.47%である。
Wikipediaは、検索エンジンとサードパーティのWebサイトの間の足場としてよく使われる。
論文 参考訳(メタデータ) (2021-02-15T08:08:36Z) - Entity Extraction from Wikipedia List Pages [2.3605348648054463]
私たちは、DBpediaをバックボーンとして、カテゴリとリストページから大規模な分類を構築します。
遠隔監視により、リストページ内の新しいエンティティの識別のためのトレーニングデータを抽出する。
我々はDBpediaを7.5万の新しい型ステートメントと380万の高精度な新しい事実で拡張する。
論文 参考訳(メタデータ) (2020-03-11T07:48:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。