論文の概要: A preliminary approach to knowledge integrity risk assessment in
Wikipedia projects
- arxiv url: http://arxiv.org/abs/2106.15940v1
- Date: Wed, 30 Jun 2021 09:47:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-24 08:22:27.448336
- Title: A preliminary approach to knowledge integrity risk assessment in
Wikipedia projects
- Title(参考訳): Wikipediaプロジェクトにおける知識整合性リスク評価への予備的アプローチ
- Authors: Pablo Arag\'on, Diego S\'aez-Trumper
- Abstract要約: ウィキペディアプロジェクト全体で知識の整合性リスクの分類と、コミュニティやコンテンツ問題に関連する内部リスクを評価するための指標の第一セットを導入する。
この分類の上に,編集者の地理的多様性の欠如が知識の整合性のリスクを如何に表すか,予備的な分析を行う。
これらはウィキペディアの知識統合リスク観測所を構築する研究プロジェクトの最初のステップである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Wikipedia is one of the main repositories of free knowledge available today,
with a central role in the Web ecosystem. For this reason, it can also be a
battleground for actors trying to impose specific points of view or even
spreading disinformation online. There is a growing need to monitor its
"health" but this is not an easy task. Wikipedia exists in over 300 language
editions and each project is maintained by a different community, with their
own strengths, weaknesses and limitations. In this paper, we introduce a
taxonomy of knowledge integrity risks across Wikipedia projects and a first set
of indicators to assess internal risks related to community and content issues,
as well as external threats such as the geopolitical and media landscape. On
top of this taxonomy, we offer a preliminary analysis illustrating how the lack
of editors' geographical diversity might represent a knowledge integrity risk.
These are the first steps of a research project to build a Wikipedia Knowledge
Integrity Risk Observatory.
- Abstract(参考訳): Wikipediaは今日入手可能なフリー知識の主要なリポジトリの1つであり、Webエコシステムにおいて中心的な役割を果たす。
そのため、特定の視点を課したり、オンライン上で偽情報を広めようとする俳優の戦場にもなり得る。
の監視の必要性が高まっていますが、これは簡単な作業ではありません。
ウィキペディアは300以上の言語版があり、それぞれのプロジェクトは異なるコミュニティによって維持されており、それぞれの強み、弱点、制限がある。
本稿では,wikipediaプロジェクト全体にわたる知識整合性リスクの分類と,コミュニティやコンテンツの問題や,地政学やメディアの状況といった外部の脅威に関する内部リスクを評価するための指標のセットを紹介する。
この分類に加えて,編集者の地理的多様性の欠如が知識の完全性リスクを如何に表しているかを示す予備分析を行う。
これらはウィキペディアの知識統合リスク観測所を構築する研究プロジェクトの最初のステップである。
関連論文リスト
- Orphan Articles: The Dark Matter of Wikipedia [13.290424502717734]
われわれは,他のウィキペディア記事からのリンクを含まない記事である孤児記事について,最初の体系的な研究を行っている。
すべての記事の約15%(8.8M)の驚くほど多くのコンテンツが、ウィキペディアをナビゲートする読者には事実上見えない。
また, 孤児に新たなリンク(脱孤児化)を追加することで, 統計的に有意な可視性向上につながるという疑似実験を通じて因果的証拠を提供する。
論文 参考訳(メタデータ) (2023-06-06T18:04:33Z) - Between News and History: Identifying Networked Topics of Collective
Attention on Wikipedia [0.0]
トピック検出のための時間的コミュニティ検出手法を開発した。
本手法をウィキペディア上での1年間の現在イベントのデータセットに適用する。
私たちは、現在の出来事を、より確立した知識よりも強く反映するトピックを解決できます。
論文 参考訳(メタデータ) (2022-11-14T18:36:21Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - The Web Is Your Oyster -- Knowledge-Intensive NLP against a Very Large
Web Corpus [76.9522248303716]
我々は,既存のKI-NLPタスクを評価するための新しいセットアップを提案し,背景コーパスをユニバーサルなWebスナップショットに一般化する。
当初Wikipediaで開発された標準のKI-NLPベンチマークであるKILTを再利用し,CCNetのサブセットであるSphere corpusの使用をシステムに依頼した。
カバー範囲の潜在的なギャップ、スケールの課題、構造の欠如、品質の低下にもかかわらず、Sphereからの検索によって、最新の最先端のシステムがウィキペディアベースのモデルに適合し、さらに優れています。
論文 参考訳(メタデータ) (2021-12-18T13:15:34Z) - Surfer100: Generating Surveys From Web Resources on Wikipedia-style [49.23675182917996]
先進言語モデリングの最近の進歩は、ウィキペディアのリード段落生成のための2段階の抽出的抽象的アプローチと組み合わせることができることを示す。
提案手法は,より長いウィキペディアスタイルの要約をセクションで生成するために拡張され,100件の人文調査による詳細な研究を通じて,このような手法が本アプリケーションでどのように苦しむかを検討する。
論文 参考訳(メタデータ) (2021-12-13T02:18:01Z) - Dimensions of Commonsense Knowledge [60.49243784752026]
我々は,その関係に特に焦点をあてて,広く普及しているコモンセンスソースを調査した。
我々はこれらの関係を13の知識次元に集約し、それぞれがソースにあるより具体的な関係を抽象化する。
論文 参考訳(メタデータ) (2021-01-12T17:52:39Z) - Computational linguistic assessment of textbook and online learning
media by means of threshold concepts in business education [59.003956312175795]
言語学的観点では、しきい値の概念は特別な語彙の例であり、特定の言語的特徴を示す。
ビジネス教育における63のしきい値の概念のプロファイルは、教科書、新聞、ウィキペディアで調査されている。
3種類のリソースは、しきい値の概念のプロファイルから区別できる。
論文 参考訳(メタデータ) (2020-08-05T12:56:16Z) - Multiple Texts as a Limiting Factor in Online Learning: Quantifying
(Dis-)similarities of Knowledge Networks across Languages [60.00219873112454]
ウィキペディアを通して、ある話題に関する情報を入手する程度が、相談される言語に依存するという仮説を考察する。
ウィキペディアはウェブベースの情報ランドスケープの中心的な部分であるため、言語に関する言語的偏見を示している。
この論文は、研究、教育科学、ウィキペディア研究、計算言語学の橋渡しとなっている。
論文 参考訳(メタデータ) (2020-08-05T11:11:55Z) - How Inclusive Are Wikipedia's Hyperlinks in Articles Covering Polarizing
Topics? [8.035521056416242]
偏光トピックの相補的な側面を記述した記事間の相互接続トポロジの影響に着目した。
トピックの異なる側面へのユーザの露出を定量化するために,多様な情報への露出の新たな尺度を導入する。
ネットワークトポロジがユーザのトピックに関する多様な情報への露出を著しく制限するケースを特定し,ユーザが知識バブルに留まることを奨励する。
論文 参考訳(メタデータ) (2020-07-16T09:19:57Z) - Architecture for a multilingual Wikipedia [0.0]
我々はこの問題にもっと効果的に取り組むために新しいアプローチが必要だと主張する。
本稿では,この目的を達成するシステムのためのアーキテクチャを提案する。
ゴールは2つの部分に分かれている: 抽象ウィキペディアと呼ばれるプロジェクト内の抽象的な表記法でコンテンツを作成し維持すること、そしてこの表記法を自然言語に翻訳できるWikilambdaと呼ばれるインフラストラクチャを作成する。
論文 参考訳(メタデータ) (2020-04-08T22:25:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。