論文の概要: Characterizing Knowledge Manipulation in a Russian Wikipedia Fork
- arxiv url: http://arxiv.org/abs/2504.10663v1
- Date: Mon, 14 Apr 2025 19:30:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 22:11:59.220799
- Title: Characterizing Knowledge Manipulation in a Russian Wikipedia Fork
- Title(参考訳): ロシア語ウィキペディアフォークにおける知識操作の特徴付け
- Authors: Mykola Trokhymovych, Oleksandr Kosovan, Nathan Forrester, Pablo Aragón, Diego Saez-Trumper, Ricardo Baeza-Yates,
- Abstract要約: 最近ローンチされたウェブサイトRuwikiは、ロシアの法律に従ってオリジナルのウィキペディアのコンテンツをコピーして修正した。
この記事では、このロシアのウィキペディアのフォークを詳細に分析する。
本論文では,原版に対する主な変更を特徴付ける手法を提案する。
- 参考スコア(独自算出の注目度): 18.630486406259426
- License:
- Abstract: Wikipedia is powered by MediaWiki, a free and open-source software that is also the infrastructure for many other wiki-based online encyclopedias. These include the recently launched website Ruwiki, which has copied and modified the original Russian Wikipedia content to conform to Russian law. To identify practices and narratives that could be associated with different forms of knowledge manipulation, this article presents an in-depth analysis of this Russian Wikipedia fork. We propose a methodology to characterize the main changes with respect to the original version. The foundation of this study is a comprehensive comparative analysis of more than 1.9M articles from Russian Wikipedia and its fork. Using meta-information and geographical, temporal, categorical, and textual features, we explore the changes made by Ruwiki editors. Furthermore, we present a classification of the main topics of knowledge manipulation in this fork, including a numerical estimation of their scope. This research not only sheds light on significant changes within Ruwiki, but also provides a methodology that could be applied to analyze other Wikipedia forks and similar collaborative projects.
- Abstract(参考訳): Wikipediaは、他のウィキベースのオンライン百科事典の基盤でもある無料かつオープンソースソフトウェアであるMediaWikiを利用している。
たとえば最近ローンチしたWebサイトRuwikiは、ロシアの法律に従ってオリジナルのウィキペディアのコンテンツをコピーして修正した。
異なる形態の知識操作に関連付けられるプラクティスや物語を識別するために、この記事では、このロシアのウィキペディアのフォークを詳細に分析する。
本論文では,原版に対する主な変更を特徴付ける手法を提案する。
この研究の基礎は、ロシア語ウィキペディアとそのフォークからの190万以上の記事の総合的な比較分析である。
メタ情報と地理的,時間的,分類的,テキスト的特徴を用いて,Ruwikiエディターによる変更について検討する。
さらに,本フォークにおける知識操作の主要なトピックを分類し,その範囲を数値的に推定する。
この研究は、Ruwikiにおける重要な変更だけでなく、他のウィキペディアのフォークや同様の共同プロジェクトを分析するための方法論も提供しています。
関連論文リスト
- Hoaxpedia: A Unified Wikipedia Hoax Articles Dataset [10.756673240445709]
まず、正当性と偽のウィキペディア記事の類似点と相違点を体系的に分析する。
そして、311のホックス記事を集めたHoaxpediaを紹介します。
以上の結果から,ウィキペディアにおける偽コンテンツの検出は,コンテンツだけでは難しいが実現不可能であることが示唆された。
論文 参考訳(メタデータ) (2024-05-03T15:25:48Z) - AKEW: Assessing Knowledge Editing in the Wild [79.96813982502952]
AKEW(Assessing Knowledge Editing in the Wild)は知識編集のための新しい実用的なベンチマークである。
知識更新の編集設定は、構造化された事実、構造化されていない事実としてのテキスト、抽出された三つ組の3つを網羅している。
大規模な実験を通じて、最先端の知識編集手法と実践シナリオの間にかなりのギャップがあることを実証する。
論文 参考訳(メタデータ) (2024-02-29T07:08:34Z) - Orphan Articles: The Dark Matter of Wikipedia [13.290424502717734]
われわれは,他のウィキペディア記事からのリンクを含まない記事である孤児記事について,最初の体系的な研究を行っている。
すべての記事の約15%(8.8M)の驚くほど多くのコンテンツが、ウィキペディアをナビゲートする読者には事実上見えない。
また, 孤児に新たなリンク(脱孤児化)を追加することで, 統計的に有意な可視性向上につながるという疑似実験を通じて因果的証拠を提供する。
論文 参考訳(メタデータ) (2023-06-06T18:04:33Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Surfer100: Generating Surveys From Web Resources on Wikipedia-style [49.23675182917996]
先進言語モデリングの最近の進歩は、ウィキペディアのリード段落生成のための2段階の抽出的抽象的アプローチと組み合わせることができることを示す。
提案手法は,より長いウィキペディアスタイルの要約をセクションで生成するために拡張され,100件の人文調査による詳細な研究を通じて,このような手法が本アプリケーションでどのように苦しむかを検討する。
論文 参考訳(メタデータ) (2021-12-13T02:18:01Z) - A preliminary approach to knowledge integrity risk assessment in
Wikipedia projects [0.0]
ウィキペディアプロジェクト全体で知識の整合性リスクの分類と、コミュニティやコンテンツ問題に関連する内部リスクを評価するための指標の第一セットを導入する。
この分類の上に,編集者の地理的多様性の欠如が知識の整合性のリスクを如何に表すか,予備的な分析を行う。
これらはウィキペディアの知識統合リスク観測所を構築する研究プロジェクトの最初のステップである。
論文 参考訳(メタデータ) (2021-06-30T09:47:27Z) - Multiple Texts as a Limiting Factor in Online Learning: Quantifying
(Dis-)similarities of Knowledge Networks across Languages [60.00219873112454]
ウィキペディアを通して、ある話題に関する情報を入手する程度が、相談される言語に依存するという仮説を考察する。
ウィキペディアはウェブベースの情報ランドスケープの中心的な部分であるため、言語に関する言語的偏見を示している。
この論文は、研究、教育科学、ウィキペディア研究、計算言語学の橋渡しとなっている。
論文 参考訳(メタデータ) (2020-08-05T11:11:55Z) - Design Challenges in Low-resource Cross-lingual Entity Linking [56.18957576362098]
言語間エンティティリンク (XEL) は、外国語テキスト中のエンティティの言及をウィキペディアのような英語の知識ベースに根拠付ける問題である。
本稿は、英語のウィキペディアの候補タイトルを、特定の外国語の言及に対応付けて識別する重要なステップに焦点を当てる。
本稿では,検索エンジンのクエリログを利用した簡易で効果的なゼロショットXELシステムQuELを提案する。
論文 参考訳(メタデータ) (2020-05-02T04:00:26Z) - Entity Extraction from Wikipedia List Pages [2.3605348648054463]
私たちは、DBpediaをバックボーンとして、カテゴリとリストページから大規模な分類を構築します。
遠隔監視により、リストページ内の新しいエンティティの識別のためのトレーニングデータを抽出する。
我々はDBpediaを7.5万の新しい型ステートメントと380万の高精度な新しい事実で拡張する。
論文 参考訳(メタデータ) (2020-03-11T07:48:46Z) - WikiHist.html: English Wikipedia's Full Revision History in HTML Format [12.86558129722198]
我々は,マークアップの局所的な例を用いて大量のwikitextを解析する並列化アーキテクチャを開発した。
我々は、ウィキペディアのハイパーリンクの実証分析において、生のウィキテキストよりもWikiHist.htmlの利点を強調した。
論文 参考訳(メタデータ) (2020-01-28T10:44:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。