論文の概要: The Grievance Dictionary: Understanding Threatening Language Use
- arxiv url: http://arxiv.org/abs/2009.04798v1
- Date: Thu, 10 Sep 2020 12:06:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 03:28:54.727592
- Title: The Grievance Dictionary: Understanding Threatening Language Use
- Title(参考訳): Grievance Dictionary: 言語使用の脅威を理解する
- Authors: Isabelle van der Vegt, Maximilian Mozes, Bennett Kleinberg, Paul Gill
- Abstract要約: グリーバンス辞典は、グリーヴァンスに満ちた暴力の脅威評価の文脈で言語の使用を自動的に理解するために使用することができる。
この辞書は暴力的で非暴力的な個人によって書かれたテキストに適用することで検証された。
- 参考スコア(独自算出の注目度): 0.8373151777137792
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces the Grievance Dictionary, a psycholinguistic dictionary
which can be used to automatically understand language use in the context of
grievance-fuelled violence threat assessment. We describe the development the
dictionary, which was informed by suggestions from experienced threat
assessment practitioners. These suggestions and subsequent human and
computational word list generation resulted in a dictionary of 20,502 words
annotated by 2,318 participants. The dictionary was validated by applying it to
texts written by violent and non-violent individuals, showing strong evidence
for a difference between populations in several dictionary categories. Further
classification tasks showed promising performance, but future improvements are
still needed. Finally, we provide instructions and suggestions for the use of
the Grievance Dictionary by security professionals and (violence) researchers.
- Abstract(参考訳): 本稿では、グリーバンスに満ちた暴力脅威評価の文脈において、言語使用を自動的に理解するために使用できる心理言語辞書「グリーバンス辞書」を紹介する。
本稿では,経験豊富な脅威評価実践者から提案された辞書の開発について述べる。
これらの提案とその後の人的および計算的な単語リストの生成により、2,318人の参加者による20,502単語の注釈付き辞書が作成された。
この辞書は暴力者や非暴力者によって書かれたテキストに適用することで検証され、複数の辞書カテゴリーの人口差の強い証拠が示された。
さらなる分類作業は有望な性能を示したが、将来的な改善は必要である。
最後に,セキュリティ専門家や(違反)研究者によるGreevance Dictionaryの使用に関する指示と提案を行う。
関連論文リスト
- Bridging Dictionary: AI-Generated Dictionary of Partisan Language Use [21.15400893251543]
Bridging Dictionaryは、異なる政治的見解を持つ人々によって、言葉がどのように認識されているかを示すインタラクティブなツールである。
Bridging Dictionaryには、静的で印刷可能なドキュメントが含まれており、大きな言語モデルによって生成された要約を含む796の用語がある。
ユーザーは選択した単語を探索し、その頻度、感情、要約、政治的分裂の例を視覚化することができる。
論文 参考訳(メタデータ) (2024-07-12T19:44:40Z) - Refinement of an Epilepsy Dictionary through Human Annotation of Health-related posts on Instagram [5.410785987233275]
私たちは、バイオメディカル用語で作られた辞書を使って、少なくとも一度はてんかん関連薬に言及したユーザーによって、800万件以上のInstagram投稿をタグ付けしました。
1,771のポストと2,947の項一致のランダムなサンプルを、ヒトのアノテーターによって評価し、偽陽性を同定した。
OpenAIのGPTシリーズモデルは人間のアノテーションと比較された。
論文 参考訳(メタデータ) (2024-05-14T17:27:59Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - A Study of Slang Representation Methods [3.511369967593153]
我々は,スラング理解に依存した様々な下流タスクに対して,表現学習モデルと知識資源の異なる組み合わせについて検討する。
誤り解析では、語彙外単語、多意味性、分散性、アノテーションの不一致など、スラング表現学習における中核的な課題を識別する。
論文 参考訳(メタデータ) (2022-12-11T21:56:44Z) - Short-Term Word-Learning in a Dynamically Changing Environment [63.025297637716534]
本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識するためのメカニズムを用いて、エンドツーエンドのASRシステムを補完する方法を示す。
誤報がわずかに増加しただけで, 単語の検出速度が大幅に向上した。
論文 参考訳(メタデータ) (2022-03-29T10:05:39Z) - Dynamically Refined Regularization for Improving Cross-corpora Hate
Speech Detection [30.462596705180534]
ヘイト音声分類器は、ソースと異なるデータセットで評価した場合、かなりの性能劣化を示す。
これまでの研究は、定義済みの静的辞書から特定の用語を正規化することでこの問題を緩和しようと試みてきた。
本稿では,単語リストを動的に洗練した帰属的手法を用いて,素早い相関を自動同定し,低減する手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T16:58:10Z) - Semantic-Preserving Adversarial Text Attacks [85.32186121859321]
深層モデルの脆弱性を調べるために, Bigram と Unigram を用いた適応的セマンティック保存最適化法 (BU-SPO) を提案する。
提案手法は,既存手法と比較して最小の単語数を変更することで,攻撃成功率とセマンティックス率を最大化する。
論文 参考訳(メタデータ) (2021-08-23T09:05:18Z) - Self-Supervised Euphemism Detection and Identification for Content
Moderation [16.322965299627974]
ユーヘミズムの一般的な使用法は、ソーシャルメディアプラットフォームによって強制されるコンテンツモデレーションポリシーを回避することである。
通常、人間のモデレーターは、ある単語がエキシマティックに使われていることは明らかであるが、秘密の意味が何であるかは分かっていない。
本論文は, 共起的に使用される単語を検知し, 各単語の秘密意味を識別できる教師なしアルゴリズムを示す。
論文 参考訳(メタデータ) (2021-03-31T04:52:38Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - RUSSE'2020: Findings of the First Taxonomy Enrichment Task for the
Russian language [70.27072729280528]
本稿では,ロシア語の分類学的豊か化に関する最初の共有課題の結果について述べる。
16チームがこのタスクに参加し、半数以上が提供されたベースラインを上回った。
論文 参考訳(メタデータ) (2020-05-22T13:30:37Z) - Word Sense Disambiguation for 158 Languages using Word Embeddings Only [80.79437083582643]
文脈における単語感覚の曖昧さは人間にとって容易であるが、自動的アプローチでは大きな課題である。
本稿では,学習前の標準単語埋め込みモデルを入力として,完全に学習した単語認識のインベントリを誘導する手法を提案する。
この手法を用いて、158の言語に対して、事前訓練されたfastText単語の埋め込みに基づいて、センスインベントリのコレクションを誘導する。
論文 参考訳(メタデータ) (2020-03-14T14:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。