論文の概要: Architecture for a multilingual Wikipedia
- arxiv url: http://arxiv.org/abs/2004.04733v1
- Date: Wed, 8 Apr 2020 22:25:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 08:19:49.805261
- Title: Architecture for a multilingual Wikipedia
- Title(参考訳): 多言語ウィキペディアのためのアーキテクチャ
- Authors: Denny Vrande\v{c}i\'c
- Abstract要約: 我々はこの問題にもっと効果的に取り組むために新しいアプローチが必要だと主張する。
本稿では,この目的を達成するシステムのためのアーキテクチャを提案する。
ゴールは2つの部分に分かれている: 抽象ウィキペディアと呼ばれるプロジェクト内の抽象的な表記法でコンテンツを作成し維持すること、そしてこの表記法を自然言語に翻訳できるWikilambdaと呼ばれるインフラストラクチャを作成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wikipedia's vision is a world in which everyone can share in the sum of all
knowledge. In its first two decades, this vision has been very unevenly
achieved. One of the largest hindrances is the sheer number of languages
Wikipedia needs to cover in order to achieve that goal. We argue that we need a
new approach to tackle this problem more effectively, a multilingual Wikipedia
where content can be shared between language editions. This paper proposes an
architecture for a system that fulfills this goal. It separates the goal in two
parts: creating and maintaining content in an abstract notation within a
project called Abstract Wikipedia, and creating an infrastructure called
Wikilambda that can translate this notation to natural language. Both parts are
fully owned and maintained by the community, as is the integration of the
results in the existing Wikipedia editions. This architecture will make more
encyclopedic content available to more people in their own language, and at the
same time allow more people to contribute knowledge and reach more people with
their contributions, no matter what their respective language backgrounds.
Additionally, Wikilambda will unlock a new type of knowledge asset people can
share in through the Wikimedia projects, functions, which will vastly expand
what people can do with knowledge from Wikimedia, and provide a new venue to
collaborate and to engage the creativity of contributors from all around the
world. These two projects will considerably expand the capabilities of the
Wikimedia platform to enable every single human being to freely share in the
sum of all knowledge.
- Abstract(参考訳): Wikipediaのビジョンは、誰もがすべての知識をまとめて共有できる世界である。
最初の20年間、このビジョンは非常に不公平に達成されてきた。
最大の障害の1つは、wikipediaがその目標を達成するためにカバーしなければならない言語の数だ。
この問題をより効果的に解決するための新しいアプローチ、多言語ウィキペディアは、言語版間でコンテンツを共有することができる。
本稿では,この目的を達成するシステムのためのアーキテクチャを提案する。
これは2つの部分に分かれている:abstract wikipediaと呼ばれるプロジェクト内の抽象的表記法でコンテンツの作成と保守、そしてこの表記法を自然言語に翻訳できるwikilambdaと呼ばれるインフラストラクチャの作成である。
どちらの部分もコミュニティによって完全に所有され、維持されており、既存のウィキペディア版と統合されている。
このアーキテクチャは、自身の言語でより多くの人々が、より多くの百科事典コンテンツを利用できるようにし、同時に、より多くの人々が知識を提供し、それぞれの言語背景がどうであれ、より多くの人々に貢献を届けることができます。
さらにwikilambdaは、人々がwikimediaプロジェクトを通じて共有できる新しいタイプの知識資産であるファンクションをアンロックする。
これら2つのプロジェクトはWikimediaプラットフォームの機能を大幅に拡張し、すべての人間がすべての知識を自由に共有できるようにする。
関連論文リスト
- Language-Agnostic Modeling of Wikipedia Articles for Content Quality Assessment across Languages [0.19698344608599344]
ウィキペディアの記事の品質をモデル化するための新しい計算フレームワークを提案する。
本フレームワークは,論文から抽出した言語に依存しない構造的特徴に基づく。
既存のウィキペディアの言語バージョンにあるすべての記事の特徴値と品質スコアでデータセットを構築しました。
論文 参考訳(メタデータ) (2024-04-15T13:07:31Z) - Orphan Articles: The Dark Matter of Wikipedia [13.290424502717734]
われわれは,他のウィキペディア記事からのリンクを含まない記事である孤児記事について,最初の体系的な研究を行っている。
すべての記事の約15%(8.8M)の驚くほど多くのコンテンツが、ウィキペディアをナビゲートする読者には事実上見えない。
また, 孤児に新たなリンク(脱孤児化)を追加することで, 統計的に有意な可視性向上につながるという疑似実験を通じて因果的証拠を提供する。
論文 参考訳(メタデータ) (2023-06-06T18:04:33Z) - Kuaipedia: a Large-scale Multi-modal Short-video Encyclopedia [59.47639408597319]
Kuaipediaは、アイテム、アスペクト、ショートビデオからなる大規模なマルチモーダル百科事典である。
これは中国で有名なショートビデオプラットフォームKuaishouの何十億ものビデオから抽出されたものだ。
論文 参考訳(メタデータ) (2022-10-28T12:54:30Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - The Web Is Your Oyster -- Knowledge-Intensive NLP against a Very Large
Web Corpus [76.9522248303716]
我々は,既存のKI-NLPタスクを評価するための新しいセットアップを提案し,背景コーパスをユニバーサルなWebスナップショットに一般化する。
当初Wikipediaで開発された標準のKI-NLPベンチマークであるKILTを再利用し,CCNetのサブセットであるSphere corpusの使用をシステムに依頼した。
カバー範囲の潜在的なギャップ、スケールの課題、構造の欠如、品質の低下にもかかわらず、Sphereからの検索によって、最新の最先端のシステムがウィキペディアベースのモデルに適合し、さらに優れています。
論文 参考訳(メタデータ) (2021-12-18T13:15:34Z) - Surfer100: Generating Surveys From Web Resources on Wikipedia-style [49.23675182917996]
先進言語モデリングの最近の進歩は、ウィキペディアのリード段落生成のための2段階の抽出的抽象的アプローチと組み合わせることができることを示す。
提案手法は,より長いウィキペディアスタイルの要約をセクションで生成するために拡張され,100件の人文調査による詳細な研究を通じて,このような手法が本アプリケーションでどのように苦しむかを検討する。
論文 参考訳(メタデータ) (2021-12-13T02:18:01Z) - A Multilingual Entity Linking System for Wikipedia with a
Machine-in-the-Loop Approach [2.2889152373118975]
ウィキペディアの編集者によるコンテンツの追加とメンテナンスの努力にもかかわらず、多くの言語版ではリンクの配布は少ないままである。
本稿では,リンクを付加するためのコミュニティガイドラインに従うことのできる,ループ内のマシン・イン・ザ・ループ・エンティティ・リンクシステムを提案する。
筆者らは,推薦の確認,拒否,適応が可能な編集者への候補リンクを提案する対話型レコメンデーションインタフェースを開発した。
論文 参考訳(メタデータ) (2021-05-31T16:29:42Z) - Crosslingual Topic Modeling with WikiPDA [15.198979978589476]
ウィキペディアベースのポリグロット・ディリクレ・アロケーション(WikiPDA)について紹介する。
あらゆる言語で書かれたウィキペディアの記事を、共通の言語に依存しないトピックの集合上の分布として表現することを学ぶ。
28のウィキペディア版における話題バイアスの研究と言語横断的分類の2つのアプリケーションでその実用性を示す。
論文 参考訳(メタデータ) (2020-09-23T15:19:27Z) - Computational linguistic assessment of textbook and online learning
media by means of threshold concepts in business education [59.003956312175795]
言語学的観点では、しきい値の概念は特別な語彙の例であり、特定の言語的特徴を示す。
ビジネス教育における63のしきい値の概念のプロファイルは、教科書、新聞、ウィキペディアで調査されている。
3種類のリソースは、しきい値の概念のプロファイルから区別できる。
論文 参考訳(メタデータ) (2020-08-05T12:56:16Z) - Multiple Texts as a Limiting Factor in Online Learning: Quantifying
(Dis-)similarities of Knowledge Networks across Languages [60.00219873112454]
ウィキペディアを通して、ある話題に関する情報を入手する程度が、相談される言語に依存するという仮説を考察する。
ウィキペディアはウェブベースの情報ランドスケープの中心的な部分であるため、言語に関する言語的偏見を示している。
この論文は、研究、教育科学、ウィキペディア研究、計算言語学の橋渡しとなっている。
論文 参考訳(メタデータ) (2020-08-05T11:11:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。