論文の概要: Taboo and Collaborative Knowledge Production: Evidence from Wikipedia
- arxiv url: http://arxiv.org/abs/2308.06403v1
- Date: Fri, 11 Aug 2023 21:58:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-15 17:33:03.780711
- Title: Taboo and Collaborative Knowledge Production: Evidence from Wikipedia
- Title(参考訳): タブーとコラボレーティブな知識生産:wikipediaからの証拠
- Authors: Kaylea Champion and Benjamin Mako Hill
- Abstract要約: 本研究では, タブー対象を識別するための新しい計算手法を開発し, この手法を用いて, 英語ウィキペディアにおけるタブー対象の集合を同定する。
タブー記事は非タブー記事よりも人気があり、しばしば破壊されている。
頻繁な破壊攻撃にもかかわらず、タブー記事は非タブー記事よりも質が高いことも判明した。
- 参考スコア(独自算出の注目度): 7.168628921229442
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: By definition, people are reticent or even unwilling to talk about taboo
subjects. Because subjects like sexuality, health, and violence are taboo in
most cultures, important information on each of these subjects can be difficult
to obtain. Are peer produced knowledge bases like Wikipedia a promising
approach for providing people with information on taboo subjects? With its
reliance on volunteers who might also be averse to taboo, can the peer
production model produce high-quality information on taboo subjects? In this
paper, we seek to understand the role of taboo in knowledge bases produced by
volunteers. We do so by developing a novel computational approach to identify
taboo subjects and by using this method to identify a set of articles on taboo
subjects in English Wikipedia. We find that articles on taboo subjects are more
popular than non-taboo articles and that they are frequently vandalized.
Despite frequent vandalism attacks, we also find that taboo articles are higher
quality than non-taboo articles. We hypothesize that stigmatizing societal
attitudes will lead contributors to taboo subjects to seek to be less
identifiable. Although our results are consistent with this proposal in several
ways, we surprisingly find that contributors make themselves more identifiable
in others.
- Abstract(参考訳): 定義上、人々はタブーの主題について話したくない、あるいは興味をそそられる。
多くの文化において、セクシュアリティ、健康、暴力といったテーマはタブーであるため、それぞれのテーマに関する重要な情報は入手が困難である。
wikipediaのようなピア生成の知識ベースは、タブーの主題に関する情報を人々に提供するための有望なアプローチだろうか?
タブーに逆らうボランティアに頼っているため、ピア生産モデルはタブーの被験者に高品質な情報を作り出すことができるのか?
本稿では,ボランティアによる知識ベースにおけるタブーの役割を理解することを目的とする。
本研究では,タブー対象を識別するための新しい計算手法を開発し,この手法を用いて,英語ウィキペディアにおけるタブー対象の集合を同定する。
タブー主題の記事はタブー以外の記事よりも人気が高く、しばしば破壊される。
頻繁な破壊攻撃にもかかわらず、タブー記事は非タブー記事よりも品質が高いこともわかりました。
我々は、社会的態度の便宜化が、タブーの被験者への貢献者に対して、より識別しにくくすることにつながると仮定する。
私たちの結果はいくつかの点でこの提案と一致していますが、コントリビュータが他人でより身元を特定できるのは驚くべきことです。
関連論文リスト
- Lived Experience Matters: Automatic Detection of Stigma on Social Media
Toward People Who Use Substances [1.7378386177263254]
物質(PWUS)を使用する人々に対するスティグマは、治療を求める主要な障壁である。
本稿では、約5000の公開Reddit投稿のデータセットを用いて、PWUSに対するスティグマについて検討する。
論文 参考訳(メタデータ) (2023-02-04T02:26:08Z) - Kuaipedia: a Large-scale Multi-modal Short-video Encyclopedia [59.47639408597319]
Kuaipediaは、アイテム、アスペクト、ショートビデオからなる大規模なマルチモーダル百科事典である。
これは中国で有名なショートビデオプラットフォームKuaishouの何十億ものビデオから抽出されたものだ。
論文 参考訳(メタデータ) (2022-10-28T12:54:30Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Rumor Detection with Self-supervised Learning on Texts and Social Graph [101.94546286960642]
異種情報ソース上での自己教師型学習を対照的に提案し,それらの関係を明らかにするとともに,噂をよりよく特徴付ける。
我々はこの枠組みをSRD(Self-supervised Rumor Detection)と呼ぶ。
3つの実世界のデータセットに対する大規模な実験により、ソーシャルメディア上での噂の自動検出におけるSRDの有効性が検証された。
論文 参考訳(メタデータ) (2022-04-19T12:10:03Z) - Suum Cuique: Studying Bias in Taboo Detection with a Community
Perspective [2.1270496914042996]
本研究では,コミュニティの視点が前後にあるタブー分類とアノテーションのバイアスを調査する手法を提案する。
我々は、それぞれのコミュニティの言語に合わせて調整された特別な分類器を使用してバイアスを研究し、例えば、偏見はアフリカ系アメリカ人に対して最大である。
この論文は、少数民族社会に害を与える偽陽性のタブー決定を減らすための重要なステップである。
論文 参考訳(メタデータ) (2022-03-22T00:45:39Z) - Surfer100: Generating Surveys From Web Resources on Wikipedia-style [49.23675182917996]
先進言語モデリングの最近の進歩は、ウィキペディアのリード段落生成のための2段階の抽出的抽象的アプローチと組み合わせることができることを示す。
提案手法は,より長いウィキペディアスタイルの要約をセクションで生成するために拡張され,100件の人文調査による詳細な研究を通じて,このような手法が本アプリケーションでどのように苦しむかを検討する。
論文 参考訳(メタデータ) (2021-12-13T02:18:01Z) - Controlled Analyses of Social Biases in Wikipedia Bios [27.591896251854724]
ウィキペディアの伝記ページの分析において,共起変数の効果を低減する手法を提案する。
本研究では,比較コーパスと目的コーパスとの適合度を測定する指標の開発により,提案手法を評価する。
以上の結果から,共起変数に対する制御の失敗は,異なる結論とマスクバイアスをもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2020-12-31T21:27:12Z) - Multiple Texts as a Limiting Factor in Online Learning: Quantifying
(Dis-)similarities of Knowledge Networks across Languages [60.00219873112454]
ウィキペディアを通して、ある話題に関する情報を入手する程度が、相談される言語に依存するという仮説を考察する。
ウィキペディアはウェブベースの情報ランドスケープの中心的な部分であるため、言語に関する言語的偏見を示している。
この論文は、研究、教育科学、ウィキペディア研究、計算言語学の橋渡しとなっている。
論文 参考訳(メタデータ) (2020-08-05T11:11:55Z) - Linguistic Taboos and Euphemisms in Nepali [1.3535770763481905]
ネパールにおける攻撃的言語に関する詳細なコーパスに基づく研究について述べる。
我々は、政治、宗教、人種、性別を含む18以上の異なる言語犯罪を識別し、記述する。
さらに,現代話者に人気がある1000以上の攻撃語とタブー語を手作業で構築したデータセットについても紹介する。
論文 参考訳(メタデータ) (2020-07-27T18:25:01Z) - How Inclusive Are Wikipedia's Hyperlinks in Articles Covering Polarizing
Topics? [8.035521056416242]
偏光トピックの相補的な側面を記述した記事間の相互接続トポロジの影響に着目した。
トピックの異なる側面へのユーザの露出を定量化するために,多様な情報への露出の新たな尺度を導入する。
ネットワークトポロジがユーザのトピックに関する多様な情報への露出を著しく制限するケースを特定し,ユーザが知識バブルに留まることを奨励する。
論文 参考訳(メタデータ) (2020-07-16T09:19:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。