論文の概要: A Comparative Study of Reference Reliability in Multiple Language
Editions of Wikipedia
- arxiv url: http://arxiv.org/abs/2309.00196v1
- Date: Fri, 1 Sep 2023 01:19:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-04 14:50:21.665273
- Title: A Comparative Study of Reference Reliability in Multiple Language
Editions of Wikipedia
- Title(参考訳): wikipediaの複数言語版における参照信頼性の比較研究
- Authors: Aitolkyn Baigutanova, Diego Saez-Trumper, Miriam Redi, Meeyoung Cha,
Pablo Arag\'on
- Abstract要約: 本研究は,複数言語版における参照の信頼性を評価するために,500万以上のウィキペディア記事について検討する。
ある言語(すなわち英語)では信頼できないとされる文献は、他の言語では記事に現れ続けている。
ページの英語版に見られる権威のない情報源は、そのページの他の言語バージョンで持続する傾向がある。
- 参考スコア(独自算出の注目度): 12.919146538916353
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Information presented in Wikipedia articles must be attributable to reliable
published sources in the form of references. This study examines over 5 million
Wikipedia articles to assess the reliability of references in multiple language
editions. We quantify the cross-lingual patterns of the perennial sources list,
a collection of reliability labels for web domains identified and
collaboratively agreed upon by Wikipedia editors. We discover that some sources
(or web domains) deemed untrustworthy in one language (i.e., English) continue
to appear in articles in other languages. This trend is especially evident with
sources tailored for smaller communities. Furthermore, non-authoritative
sources found in the English version of a page tend to persist in other
language versions of that page. We finally present a case study on the Chinese,
Russian, and Swedish Wikipedias to demonstrate a discrepancy in reference
reliability across cultures. Our finding highlights future challenges in
coordinating global knowledge on source reliability.
- Abstract(参考訳): ウィキペディアの記事に掲載される情報は、参照の形で信頼できる出版元に帰属しなければならない。
本研究は,複数言語版における参照の信頼性を評価するために,500万以上のウィキペディア記事について検討する。
我々は、ウィキペディア編集者によって合意されたwebドメインの信頼性ラベルのコレクションであるperennial sources listのクロスリンガルパターンを定量化する。
ある言語(すなわち英語)で信頼できないと見なされる一部のソース(あるいはwebドメイン)が、他の言語の記事でも引き続き現れ続けていることが分かりました。
この傾向は、特に小さなコミュニティ向けに調整された情報源によって顕著である。
さらに、あるページの英語バージョンに見られる権威のない情報源は、そのページの他の言語バージョンで持続する傾向がある。
最後に,中国語,ロシア語,スウェーデン語のウィキペディアを事例として,文化間の参照信頼性の相違を示す。
情報源信頼性に関するグローバル知識のコーディネートにおける今後の課題に注目した。
関連論文リスト
- Language-Agnostic Modeling of Source Reliability on Wikipedia [2.6474867060112346]
本稿では,ウィキペディアの複数の言語版にまたがる情報源の信頼性を評価するために,言語に依存しないモデルを提案する。
このモデルはソースの信頼性を効果的に予測し、英語のF1マクロスコアは約0.80に達する。
さまざまなリソースレベルの言語で一貫性のあるモデルパフォーマンスを維持するという課題を強調します。
論文 参考訳(メタデータ) (2024-10-24T14:52:21Z) - Locating Information Gaps and Narrative Inconsistencies Across Languages: A Case Study of LGBT People Portrayals on Wikipedia [49.80565462746646]
我々は,情報ギャップと矛盾を事実レベルで特定するための,効率的かつ信頼性の高い手法であるInfoGap法を紹介した。
我々は、LGBTの人々の描写を分析してInfoGapを評価し、英語、ロシア語、フランス語のウィキペディアの2.7Kの伝記ページを解析した。
論文 参考訳(メタデータ) (2024-10-05T20:40:49Z) - An Open Multilingual System for Scoring Readability of Wikipedia [3.992677070507323]
ウィキペディア記事の読みやすさを評価するための多言語モデルを開発した。
ウィキペディアから簡略化されたウィキペディアやオンラインの子供まで、14言語にまたがる新しい多言語データセットを作成します。
我々のモデルはゼロショットシナリオでよく機能し、14言語で80%以上のランキング精度が得られることを示す。
論文 参考訳(メタデータ) (2024-06-03T23:07:18Z) - Lost in Translation -- Multilingual Misinformation and its Evolution [52.07628580627591]
本稿では,95言語にまたがる25万以上のファクトチェックの分析を通じて,多言語誤報の頻度とダイナミクスについて検討する。
誤報のクレームの大部分は1回だけ事実チェックされているが、21,000件以上のクレームに対応する11.7%は複数回チェックされている。
誤情報拡散のプロキシとしてファクトチェックを用いると、言語境界を越えて繰り返し主張する主張の33%が見つかる。
論文 参考訳(メタデータ) (2023-10-27T12:21:55Z) - Longitudinal Assessment of Reference Quality on Wikipedia [7.823541290904653]
この研究は、その参照のレンズを通して、このグローバル百科事典の信頼性を分析する。
我々は、参照要求(RN)、すなわち引用を欠く文の割合、参照リスク(RR)、すなわち非権威的参照の割合を定義することで、参照品質の概念を運用する。
論文 参考訳(メタデータ) (2023-03-09T13:04:14Z) - Improving Wikipedia Verifiability with AI [116.69749668874493]
私たちはSideと呼ばれるニューラルネットワークベースのシステムを開発し、彼らの主張を支持できないWikipediaの引用を識別する。
本誌の最初の引用レコメンデーションは、既存のWikipediaの引用よりも60%多い選好を集めている。
以上の結果から,Wikipediaの妥当性を高めるために,AIベースのシステムを人間と共同で活用できることが示唆された。
論文 参考訳(メタデータ) (2022-07-08T15:23:29Z) - Assessing the quality of sources in Wikidata across languages: a hybrid
approach [64.05097584373979]
いくつかの言語でラベルを持つWikidataのトリプルからサンプルした参照コーパスの大規模なコーパスを評価するために,一連のマイクロタスク実験を実施している。
クラウドソースアセスメントの統合されたバージョンを使用して、いくつかの機械学習モデルをトレーニングして、Wikidata全体の分析をスケールアップしています。
この結果はWikidataにおける参照の質の確認に役立ち、ユーザ生成多言語構造化データの品質をWeb上で定義し、取得する際の共通の課題を特定するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-20T10:06:46Z) - Multiple Texts as a Limiting Factor in Online Learning: Quantifying
(Dis-)similarities of Knowledge Networks across Languages [60.00219873112454]
ウィキペディアを通して、ある話題に関する情報を入手する程度が、相談される言語に依存するという仮説を考察する。
ウィキペディアはウェブベースの情報ランドスケープの中心的な部分であるため、言語に関する言語的偏見を示している。
この論文は、研究、教育科学、ウィキペディア研究、計算言語学の橋渡しとなっている。
論文 参考訳(メタデータ) (2020-08-05T11:11:55Z) - Design Challenges in Low-resource Cross-lingual Entity Linking [56.18957576362098]
言語間エンティティリンク (XEL) は、外国語テキスト中のエンティティの言及をウィキペディアのような英語の知識ベースに根拠付ける問題である。
本稿は、英語のウィキペディアの候補タイトルを、特定の外国語の言及に対応付けて識別する重要なステップに焦点を当てる。
本稿では,検索エンジンのクエリログを利用した簡易で効果的なゼロショットXELシステムQuELを提案する。
論文 参考訳(メタデータ) (2020-05-02T04:00:26Z) - Quantifying Engagement with Citations on Wikipedia [13.703047949952852]
300ページビューの1つは、参照クリックの結果である。
クリックはより短いページや低い品質のページで頻繁に行われる。
最近のコンテンツ、オープンアクセスソース、ライフイベントに関する参考資料が特に人気である。
論文 参考訳(メタデータ) (2020-01-23T15:52:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。