論文の概要: Surveying Wikipedians: a dataset of users and contributors' practices on
Wikipedia in 8 languages
- arxiv url: http://arxiv.org/abs/2311.07964v1
- Date: Tue, 14 Nov 2023 07:39:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-15 15:03:21.019883
- Title: Surveying Wikipedians: a dataset of users and contributors' practices on
Wikipedia in 8 languages
- Title(参考訳): wikipediansの調査: 8言語のwikipediaにおけるユーザとコントリビュータのプラクティスのデータセット
- Authors: Caterina Cruciani, L\'eo Joubert (LEST, DySoLab), Nicolas Jullien (IMT
Atlantique - LUSSI, MARSOUIN, LEGO), Laurent Mell (CREAD EA 3875, MARSOUIN),
Sasha Piccione, Jeanne Vermeirsche
- Abstract要約: データセットはウィキペディアのユーザーに焦点を当てており、回答者の人口統計や社会経済的特徴に関する情報を含んでいる。
データは、2023年6月から7月にかけてオンラインで公開されているアンケートを用いて収集された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The dataset focuses on Wikipedia users and contains information about
demographic and socioeconomic characteristics of the respondents and their
activity on Wikipedia. The data was collected using a questionnaire available
online between June and July 2023. The link to the questionnaire was
distributed via a banner published in 8 languages on the Wikipedia page.
Filling out the questionnaire was voluntary and not incentivised in any way.
The survey includes 200 questions about: what people were doing on Wikipedia
before clicking the link to the questionnaire; how they use Wikipedia as
readers (``professional'' and ``personal'' uses); their opinion on the quality,
the thematic coverage, the importance of the encyclopaedia; the making of
Wikipedia (how they think it is made, if they have ever contributed and how);
their social, sport, artistic and cultural activities, both online and offline;
their socio-economic characteristics including political beliefs, and trust
propensities. More than 200 000 people opened the questionnaire, 100 332
started to answer, and constitute our dataset, and 10 576 finished it. Among
other themes identified by future researchers, the dataset can be useful for
advancing the research regarding the features of readers vs contributors of
online commons, the relationship between trust, information, sources, and the
use made of this information.
- Abstract(参考訳): このデータセットはwikipediaユーザーに焦点を当てており、回答者の人口統計と社会経済特性とウィキペディアにおける活動に関する情報を含んでいる。
データは2023年6月から7月にかけてオンライン公開されているアンケートを用いて収集された。
アンケートへのリンクはウィキペディアのページにある8つの言語で公開されたバナーを通じて配布された。
アンケートの充足は自発的であり、何のインセンティブも与えなかった。
The survey includes 200 questions about: what people were doing on Wikipedia before clicking the link to the questionnaire; how they use Wikipedia as readers (``professional'' and ``personal'' uses); their opinion on the quality, the thematic coverage, the importance of the encyclopaedia; the making of Wikipedia (how they think it is made, if they have ever contributed and how); their social, sport, artistic and cultural activities, both online and offline; their socio-economic characteristics including political beliefs, and trust propensities.
20万人以上がアンケートを開き、100人の332人が回答し始め、私たちのデータセットを構成しました。
将来の研究者によって特定される他のテーマの中で、このデータセットは、読者とオンラインコモンズのコントリビュータの特徴、信頼、情報、ソース、そしてこの情報で作られた使用との関係に関する研究を進めるのに役立つ。
関連論文リスト
- How to Engage Your Readers? Generating Guiding Questions to Promote Active Reading [60.19226384241482]
教科書や科学論文から10Kのインテキスト質問のデータセットであるGuidingQを紹介した。
言語モデルを用いてこのような質問を生成するための様々なアプローチを探索する。
我々は、そのような質問が読解に与える影響を理解するために、人間の研究を行う。
論文 参考訳(メタデータ) (2024-07-19T13:42:56Z) - Publishing Wikipedia usage data with strong privacy guarantees [6.410779699541235]
約20年間、ウィキメディア財団はウィキペディアの各ページを毎日何人訪問したかという統計を公表してきた。
2023年6月、ウィキメディア財団はこれらの統計データをより細かい粒度で公開し始めた。
本稿では、このデータ公開について、その目標、プロセスの展開開始とデータリリースの結果について述べる。
論文 参考訳(メタデータ) (2023-08-30T19:58:56Z) - Wiki-based Communities of Interest: Demographics and Outliers [18.953455338226103]
Wikiの情報源によると、このデータはホワイトハウスコロナウイルスタスクフォースのメンバーなど7.5万のコミュニティをカバーしている。
主観的およびグループ中心のデータセットをフォーマットで、またブラウジングインターフェースとしてリリースします。
論文 参考訳(メタデータ) (2023-03-16T09:58:11Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Wikipedia Reader Navigation: When Synthetic Data Is Enough [11.99768070409472]
クリックストリームデータから生成された実ナビゲーションシーケンスと合成シーケンスの違いを定量化する。
実数列と合成配列の差は統計的に有意であるが、小さな効果の大きさで、しばしば10%以下である。
これはウィキペディアのクリックストリームデータを公開リソースとして活用するための定量的な証拠となっている。
論文 参考訳(メタデータ) (2022-01-03T18:58:39Z) - Surfer100: Generating Surveys From Web Resources on Wikipedia-style [49.23675182917996]
先進言語モデリングの最近の進歩は、ウィキペディアのリード段落生成のための2段階の抽出的抽象的アプローチと組み合わせることができることを示す。
提案手法は,より長いウィキペディアスタイルの要約をセクションで生成するために拡張され,100件の人文調査による詳細な研究を通じて,このような手法が本アプリケーションでどのように苦しむかを検討する。
論文 参考訳(メタデータ) (2021-12-13T02:18:01Z) - A Dataset of Information-Seeking Questions and Answers Anchored in
Research Papers [66.11048565324468]
1,585の自然言語処理論文に関する5,049の質問のデータセットを提示する。
各質問は、対応する論文のタイトルと要約のみを読むNLP実践者によって書かれ、質問は全文に存在する情報を求めます。
他のQAタスクでうまく機能する既存のモデルは、これらの質問に答える上ではうまく機能せず、論文全体から回答する際には、少なくとも27 F1ポイントパフォーマンスが低下します。
論文 参考訳(メタデータ) (2021-05-07T00:12:34Z) - Multiple Texts as a Limiting Factor in Online Learning: Quantifying
(Dis-)similarities of Knowledge Networks across Languages [60.00219873112454]
ウィキペディアを通して、ある話題に関する情報を入手する程度が、相談される言語に依存するという仮説を考察する。
ウィキペディアはウェブベースの情報ランドスケープの中心的な部分であるため、言語に関する言語的偏見を示している。
この論文は、研究、教育科学、ウィキペディア研究、計算言語学の橋渡しとなっている。
論文 参考訳(メタデータ) (2020-08-05T11:11:55Z) - How Inclusive Are Wikipedia's Hyperlinks in Articles Covering Polarizing
Topics? [8.035521056416242]
偏光トピックの相補的な側面を記述した記事間の相互接続トポロジの影響に着目した。
トピックの異なる側面へのユーザの露出を定量化するために,多様な情報への露出の新たな尺度を導入する。
ネットワークトポロジがユーザのトピックに関する多様な情報への露出を著しく制限するケースを特定し,ユーザが知識バブルに留まることを奨励する。
論文 参考訳(メタデータ) (2020-07-16T09:19:57Z) - Quantifying Engagement with Citations on Wikipedia [13.703047949952852]
300ページビューの1つは、参照クリックの結果である。
クリックはより短いページや低い品質のページで頻繁に行われる。
最近のコンテンツ、オープンアクセスソース、ライフイベントに関する参考資料が特に人気である。
論文 参考訳(メタデータ) (2020-01-23T15:52:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。