論文の概要: Trigger Warnings: Bootstrapping a Violence Detector for FanFiction
- arxiv url: http://arxiv.org/abs/2209.04409v1
- Date: Fri, 9 Sep 2022 17:27:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-12 12:40:40.213282
- Title: Trigger Warnings: Bootstrapping a Violence Detector for FanFiction
- Title(参考訳): トリガー警告:ファンフィクション用バイオレンス検出器のブートストラップ
- Authors: Magdalena Wolska, Christopher Schr\"oder, Ole Borchardt, Benno Stein,
and Martin Potthast
- Abstract要約: 本稿では,新しい計算課題であるトリガー警告の課題に対して,最初のデータセットと評価結果を提示する。
ラベル付きコーパスデータは、有名なファンフィクションサイトArchive of Our Own (AO3)にホストされた物語作品から収集されている。
- 参考スコア(独自算出の注目度): 24.04917978057961
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present the first dataset and evaluation results on a newly defined
computational task of trigger warning assignment. Labeled corpus data has been
compiled from narrative works hosted on Archive of Our Own (AO3), a well-known
fanfiction site. In this paper, we focus on the most frequently assigned
trigger type--violence--and define a document-level binary classification task
of whether or not to assign a violence trigger warning to a fanfiction,
exploiting warning labels provided by AO3 authors. SVM and BERT models trained
in four evaluation setups on the corpora we compiled yield $F_1$ results
ranging from 0.585 to 0.798, proving the violence trigger warning assignment to
be a doable, however, non-trivial task.
- Abstract(参考訳): 本稿では,新しい計算課題であるトリガー警告の課題に対して,最初のデータセットと評価結果を示す。
ラベル付きコーパスデータは、有名なファンフィクションサイトArchive of Our Own (AO3)にホストされた物語作品から収集されている。
本稿では,最も頻繁に割り当てられるトリガ型-----に着目し,ao3の著者による警告ラベルを活用し,暴力的トリガ警告をファンフィクションに割り当てるか否かの文書レベルのバイナリ分類タスクを定義する。
SVM と BERT モデルは、コーパス上で4つの評価設定でトレーニングされ、0.585 から 0.798 まで F_1$ の結果が得られた。
関連論文リスト
- EagleEye: Attention to Unveil Malicious Event Sequences from Provenance Graphs [1.3359586871482305]
エンドポイントのセキュリティは、脅威とアタックの進化の性質のため、難しい。
エンドポイントロギングシステムが成熟するにつれて、プロファイランスグラフ表現は洗練された振る舞いルールの作成を可能にします。
本稿では,行動事象の表現にプロファイランスグラフからリッチな特徴を利用する新しいシステムであるEagleEyeを開発し,提示する。
論文 参考訳(メタデータ) (2024-08-17T14:48:02Z) - Silencing the Risk, Not the Whistle: A Semi-automated Text Sanitization Tool for Mitigating the Risk of Whistleblower Re-Identification [4.082799056366928]
ホイッスルブローイングは、公共部門と民間部門の両方で透明性と説明責任を確保するために不可欠である。
EUのWBDのような法的措置は、その範囲と有効性に制限されている。
現在のテキストのサニタイズツールは、一大のアプローチを踏襲し、匿名性を極端に限定している。
論文 参考訳(メタデータ) (2024-05-02T08:52:29Z) - If there's a Trigger Warning, then where's the Trigger? Investigating Trigger Warnings at the Passage Level [27.59190563321366]
トリガーは、この内容が一部の読者グループによって有害であると認識された場合、機密性の高い内容の文書を序文で警告する。
しかし、どの部分で警告を割り当てたのかは不明だ。
本稿では,文書のトリガーパスを手動と計算の両方で識別できる可能性について検討する。
論文 参考訳(メタデータ) (2024-04-15T09:37:52Z) - Forging the Forger: An Attempt to Improve Authorship Verification via Data Augmentation [52.72682366640554]
著者検証(英語: Authorship Verification, AV)とは、ある特定の著者によって書かれたか、別の人物によって書かれたのかを推測するテキスト分類タスクである。
多くのAVシステムは敵の攻撃に弱いことが示されており、悪意のある著者は、その書体スタイルを隠蔽するか、あるいは他の著者の書体を模倣することによって、積極的に分類者を騙そうとしている。
論文 参考訳(メタデータ) (2024-03-17T16:36:26Z) - OrderBkd: Textual backdoor attack through repositioning [0.0]
サードパーティのデータセットと事前トレーニングされた機械学習モデルは、NLPシステムに脅威をもたらす。
既存のバックドア攻撃は、トークンの挿入や文のパラフレーズなどのデータサンプルを毒殺する。
これまでの研究との大きな違いは、文中の2つの単語の配置をトリガーとして使うことです。
論文 参考訳(メタデータ) (2024-02-12T14:53:37Z) - Multi-modal Prompting for Low-Shot Temporal Action Localization [95.19505874963751]
低ショット(ゼロショット・少数ショット)シナリオ下での時間的行動局所化の問題点を考察する。
クラスに依存しない2段階のアクションローカライズアーキテクチャをTransformerに導入し,その後にオープン語彙分類を行った。
論文 参考訳(メタデータ) (2023-03-21T10:40:13Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Pre-trained Language Models as Re-Annotators [3.193067591317475]
事前学習言語モデルから意味センシティブなアノテーション表現を取得する方法について検討する。
アノテーション修正のためのクロスバリデーションに基づく事前学習言語モデルを微調整する。
関係抽出における再アノテーションについて検討し、手動で改訂したデータセットRe-DocREDを作成する。
論文 参考訳(メタデータ) (2022-05-11T09:28:23Z) - Towards Variable-Length Textual Adversarial Attacks [68.27995111870712]
データの離散性のため、自然言語処理タスクに対してテキストによる敵意攻撃を行うことは非自明である。
本稿では,可変長テキスト対比攻撃(VL-Attack)を提案する。
本手法は、iwslt14ドイツ語英訳で3,18$ bleuスコアを達成でき、ベースラインモデルより1.47$改善できる。
論文 参考訳(メタデータ) (2021-04-16T14:37:27Z) - Temporal Action Detection with Multi-level Supervision [116.55596693897388]
本稿では,ラベル付きデータとラベルなしデータを組み合わせたSemi-supervised Action Detection (SSAD)タスクを紹介する。
半教師付き分類タスクから直接適応したSSADベースラインの異なるタイプのエラーを解析する。
我々は,弱いラベル付きデータをSSADに組み込んで,3段階の監視レベルを持つOmni-supervised Action Detection (OSAD)を提案する。
論文 参考訳(メタデータ) (2020-11-24T04:45:17Z) - ScoreGAN: A Fraud Review Detector based on Multi Task Learning of
Regulated GAN with Data Augmentation [50.779498955162644]
生成・検出プロセスにおけるレビューテキストとレビューレーティングスコアの両方を利用した不正レビュー検出のためのScoreGANを提案する。
その結果,提案フレームワークは,既存の最先端フレームワークであるFakeGANをAPの7%,YelpとTripAdvisorのデータセットで5%上回る性能を示した。
論文 参考訳(メタデータ) (2020-06-11T16:15:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。