論文の概要: The Grievance Dictionary: Understanding Threatening Language Use
- arxiv url: http://arxiv.org/abs/2009.04798v1
- Date: Thu, 10 Sep 2020 12:06:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 03:28:54.727592
- Title: The Grievance Dictionary: Understanding Threatening Language Use
- Title(参考訳): Grievance Dictionary: 言語使用の脅威を理解する
- Authors: Isabelle van der Vegt, Maximilian Mozes, Bennett Kleinberg, Paul Gill
- Abstract要約: グリーバンス辞典は、グリーヴァンスに満ちた暴力の脅威評価の文脈で言語の使用を自動的に理解するために使用することができる。
この辞書は暴力的で非暴力的な個人によって書かれたテキストに適用することで検証された。
- 参考スコア(独自算出の注目度): 0.8373151777137792
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces the Grievance Dictionary, a psycholinguistic dictionary
which can be used to automatically understand language use in the context of
grievance-fuelled violence threat assessment. We describe the development the
dictionary, which was informed by suggestions from experienced threat
assessment practitioners. These suggestions and subsequent human and
computational word list generation resulted in a dictionary of 20,502 words
annotated by 2,318 participants. The dictionary was validated by applying it to
texts written by violent and non-violent individuals, showing strong evidence
for a difference between populations in several dictionary categories. Further
classification tasks showed promising performance, but future improvements are
still needed. Finally, we provide instructions and suggestions for the use of
the Grievance Dictionary by security professionals and (violence) researchers.
- Abstract(参考訳): 本稿では、グリーバンスに満ちた暴力脅威評価の文脈において、言語使用を自動的に理解するために使用できる心理言語辞書「グリーバンス辞書」を紹介する。
本稿では,経験豊富な脅威評価実践者から提案された辞書の開発について述べる。
これらの提案とその後の人的および計算的な単語リストの生成により、2,318人の参加者による20,502単語の注釈付き辞書が作成された。
この辞書は暴力者や非暴力者によって書かれたテキストに適用することで検証され、複数の辞書カテゴリーの人口差の強い証拠が示された。
さらなる分類作業は有望な性能を示したが、将来的な改善は必要である。
最後に,セキュリティ専門家や(違反)研究者によるGreevance Dictionaryの使用に関する指示と提案を行う。
関連論文リスト
- Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - A Study of Slang Representation Methods [3.511369967593153]
我々は,スラング理解に依存した様々な下流タスクに対して,表現学習モデルと知識資源の異なる組み合わせについて検討する。
誤り解析では、語彙外単語、多意味性、分散性、アノテーションの不一致など、スラング表現学習における中核的な課題を識別する。
論文 参考訳(メタデータ) (2022-12-11T21:56:44Z) - Short-Term Word-Learning in a Dynamically Changing Environment [63.025297637716534]
本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識するためのメカニズムを用いて、エンドツーエンドのASRシステムを補完する方法を示す。
誤報がわずかに増加しただけで, 単語の検出速度が大幅に向上した。
論文 参考訳(メタデータ) (2022-03-29T10:05:39Z) - Dynamically Refined Regularization for Improving Cross-corpora Hate
Speech Detection [30.462596705180534]
ヘイト音声分類器は、ソースと異なるデータセットで評価した場合、かなりの性能劣化を示す。
これまでの研究は、定義済みの静的辞書から特定の用語を正規化することでこの問題を緩和しようと試みてきた。
本稿では,単語リストを動的に洗練した帰属的手法を用いて,素早い相関を自動同定し,低減する手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T16:58:10Z) - Dict-BERT: Enhancing Language Model Pre-training with Dictionary [42.0998323292348]
事前学習型言語モデル(PLM)は,大規模コーパス上で自己指導型学習タスクを行うことで,普遍的な言語表現を学習することを目的としている。
本研究では,辞書におけるレアワードの定義を活用することで,言語モデル事前学習の強化に焦点をあてる。
入力テキストシーケンスとまれな単語定義間の単語と文レベルのアライメントに関する2つの新しい自己教師付き事前学習タスクを提案する。
論文 参考訳(メタデータ) (2021-10-13T04:29:14Z) - Semantic-Preserving Adversarial Text Attacks [85.32186121859321]
深層モデルの脆弱性を調べるために, Bigram と Unigram を用いた適応的セマンティック保存最適化法 (BU-SPO) を提案する。
提案手法は,既存手法と比較して最小の単語数を変更することで,攻撃成功率とセマンティックス率を最大化する。
論文 参考訳(メタデータ) (2021-08-23T09:05:18Z) - Self-Supervised Euphemism Detection and Identification for Content
Moderation [16.322965299627974]
ユーヘミズムの一般的な使用法は、ソーシャルメディアプラットフォームによって強制されるコンテンツモデレーションポリシーを回避することである。
通常、人間のモデレーターは、ある単語がエキシマティックに使われていることは明らかであるが、秘密の意味が何であるかは分かっていない。
本論文は, 共起的に使用される単語を検知し, 各単語の秘密意味を識別できる教師なしアルゴリズムを示す。
論文 参考訳(メタデータ) (2021-03-31T04:52:38Z) - dictNN: A Dictionary-Enhanced CNN Approach for Classifying Hate Speech
on Twitter [0.0]
クラウドソースで更新されたヘイトワード辞書に基づくベクトル化を提案する。
本稿では,CNNモデルの分類性能を向上させるために,標準単語埋め込みを用いた手法を提案する。
我々は,CNNモデルの予測能力を高め,F1マクロスコアを7ポイント増やすことができる。
論文 参考訳(メタデータ) (2021-03-16T00:27:33Z) - Speakers Fill Lexical Semantic Gaps with Context [69.30534067031734]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - RUSSE'2020: Findings of the First Taxonomy Enrichment Task for the
Russian language [70.27072729280528]
本稿では,ロシア語の分類学的豊か化に関する最初の共有課題の結果について述べる。
16チームがこのタスクに参加し、半数以上が提供されたベースラインを上回った。
論文 参考訳(メタデータ) (2020-05-22T13:30:37Z) - Word Sense Disambiguation for 158 Languages using Word Embeddings Only [80.79437083582643]
文脈における単語感覚の曖昧さは人間にとって容易であるが、自動的アプローチでは大きな課題である。
本稿では,学習前の標準単語埋め込みモデルを入力として,完全に学習した単語認識のインベントリを誘導する手法を提案する。
この手法を用いて、158の言語に対して、事前訓練されたfastText単語の埋め込みに基づいて、センスインベントリのコレクションを誘導する。
論文 参考訳(メタデータ) (2020-03-14T14:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。