論文の概要: Misogyny classification of German newspaper forum comments
- arxiv url: http://arxiv.org/abs/2211.17163v1
- Date: Wed, 30 Nov 2022 16:56:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 15:36:23.511084
- Title: Misogyny classification of German newspaper forum comments
- Title(参考訳): ドイツの新聞フォーラムコメントのミソジニー分類
- Authors: Johann Petrak, Brigitte Krenn
- Abstract要約: 6600件のコメントを5レベルの誤字でアノテートしたコーパスの作成について述べる。
フォーラムのモデレーターは、注釈ガイドラインの作成とコメントの注釈の作成に専門家として関与した。
- 参考スコア(独自算出の注目度): 0.10152838128195464
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper presents work on detecting misogyny in the comments of a large
Austrian German language newspaper forum. We describe the creation of a corpus
of 6600 comments which were annotated with 5 levels of misogyny. The forum
moderators were involved as experts in the creation of the annotation
guidelines and the annotation of the comments. We also describe the results of
training transformer-based classification models for both binarized and
original label classification of that corpus.
- Abstract(参考訳): 本稿では,オーストリアの大手ドイツ語新聞のコメント欄における誤読の検出について述べる。
6600件のコメントを5レベルの誤字でアノテートしたコーパスの作成について述べる。
フォーラムのモデレーターは、注釈ガイドラインの作成とコメントの注釈の作成に専門家として関与した。
また、このコーパスのバイナライズおよびオリジナルラベル分類のためのトランスフォーマーベース分類モデルのトレーニング結果についても述べる。
関連論文リスト
- Beyond Binary Gender: Evaluating Gender-Inclusive Machine Translation with Ambiguous Attitude Words [85.48043537327258]
既存の機械翻訳の性別バイアス評価は主に男性と女性の性別に焦点を当てている。
本研究では,AmbGIMT (Gender-Inclusive Machine Translation with Ambiguous attitude words) のベンチマークを示す。
本研究では,感情的態度スコア(EAS)に基づく性別バイアス評価手法を提案する。
論文 参考訳(メタデータ) (2024-07-23T08:13:51Z) - PejorativITy: Disambiguating Pejorative Epithets to Improve Misogyny Detection in Italian Tweets [11.224028161937296]
語レベルではイタリア語のツイートを手動で注釈付けし,文レベルでは誤用する新しいコーパスであるPejorativITyを提示する。
本研究では,不明瞭な単語に関する情報を誤検出を対象とするモデルに注入する効果を評価する。
論文 参考訳(メタデータ) (2024-04-03T12:24:48Z) - VisoGender: A dataset for benchmarking gender bias in image-text pronoun
resolution [80.57383975987676]
VisoGenderは、視覚言語モデルで性別バイアスをベンチマークするための新しいデータセットである。
We focus to occupation-related biases in a hegemonic system of binary gender, inspired by Winograd and Winogender schemas。
我々は、最先端の視覚言語モデルをいくつかベンチマークし、それらが複雑な場面における二項性解消のバイアスを示すことを発見した。
論文 参考訳(メタデータ) (2023-06-21T17:59:51Z) - Placing M-Phasis on the Plurality of Hate: A Feature-Based Corpus of
Hate Online [18.973398187389083]
我々は、移民関連のニュース記事から収集した9万のドイツ語とフランス語のユーザーコメントのコーパスであるM-Phasis corpusを提示する。
これは "hate"-"neutral" の二分法を超越し、代わりに23の特徴で注釈付けされ、様々な種類の音声の記述子となる。
論文 参考訳(メタデータ) (2022-04-28T10:36:49Z) - Fine-Grained Opinion Summarization with Minimal Supervision [48.43506393052212]
FineSumは、複数のドキュメントから意見を抽出することでターゲットをプロファイルすることを目的としている。
FineSumは、生のコーパスから意見語句を自動的に識別し、異なる側面と感情に分類し、各アスペクト/感覚の下に複数のきめ細かい意見クラスタを構築する。
ベンチマークの自動評価と定量的人的評価の両方が,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2021-10-17T15:16:34Z) - A Dataset for Discourse Structure in Peer Review Discussions [33.621647816641925]
反感からの言論の手がかりは、レビューの品質と解釈に光を当てることができることを示す。
本稿では,20k文のラベル付きデータセットを英語で506対のレビュー・リビュー・ペアに収録し,専門家が注釈を付けた。
論文 参考訳(メタデータ) (2021-10-16T09:18:12Z) - Stay on Topic, Please: Aligning User Comments to the Content of a News
Article [7.3203631241415055]
新たな記事ベースに投稿されたユーザコメントとその内容との整合性を分類する分類アルゴリズムを提案する。
このアライメントは、コンテンツ、議論のエンティティ、トピック間の類似性に基づいて、ユーザーコメントと記事とを一致させようとする。
分類作業の難易度を理解するために,人間のラベル付け性能を評価するためのユーザ調査を行う。
論文 参考訳(メタデータ) (2021-03-03T18:29:00Z) - Abstractive Opinion Tagging [65.47649273721679]
eコマースでは、意見タグは、アイテムのレビューの特徴を反映したEコマースプラットフォームが提供するタグのランクリストを指す。
意見タグを生成するための現在のメカニズムは、手作業またはラベル付け方法に依存します。
AOT-Net と呼ばれる抽象的な意見タグフレームワークを提案し、多数のレビューからランク付けされた意見タグのリストを生成します。
論文 参考訳(メタデータ) (2021-01-18T05:08:15Z) - A Unified Dual-view Model for Review Summarization and Sentiment
Classification with Inconsistency Loss [51.448615489097236]
ユーザーレビューから正確な要約と感情を取得することは、現代のEコマースプラットフォームにとって不可欠な要素である。
本稿では,これら2つのタスクの性能を協調的に改善する新しいデュアルビューモデルを提案する。
異なる領域の4つの実世界のデータセットに対する実験結果から,本モデルの有効性が示された。
論文 参考訳(メタデータ) (2020-06-02T13:34:11Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z) - Developing a Multilingual Annotated Corpus of Misogyny and Aggression [1.0187588674939276]
インド英語,ヒンディー語,インド・バングラ語における多言語アノテート・コーパスの展開について論じる。
データセットはYouTubeビデオのコメントから収集され、現在合計2万以上のコメントが含まれている。
論文 参考訳(メタデータ) (2020-03-16T20:19:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。