Fugu-MT 論文翻訳(概要): The Grievance Dictionary: Understanding Threatening Language Use

論文の概要: The Grievance Dictionary: Understanding Threatening Language Use

arxiv url: http://arxiv.org/abs/2009.04798v1
Date: Thu, 10 Sep 2020 12:06:48 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-20 03:28:54.727592
Title: The Grievance Dictionary: Understanding Threatening Language Use
Title（参考訳）: Grievance Dictionary: 言語使用の脅威を理解する
Authors: Isabelle van der Vegt, Maximilian Mozes, Bennett Kleinberg, Paul Gill
Abstract要約: グリーバンス辞典は、グリーヴァンスに満ちた暴力の脅威評価の文脈で言語の使用を自動的に理解するために使用することができる。この辞書は暴力的で非暴力的な個人によって書かれたテキストに適用することで検証された。
参考スコア（独自算出の注目度）: 0.8373151777137792
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper introduces the Grievance Dictionary, a psycholinguistic dictionary which can be used to automatically understand language use in the context of grievance-fuelled violence threat assessment. We describe the development the dictionary, which was informed by suggestions from experienced threat assessment practitioners. These suggestions and subsequent human and computational word list generation resulted in a dictionary of 20,502 words annotated by 2,318 participants. The dictionary was validated by applying it to texts written by violent and non-violent individuals, showing strong evidence for a difference between populations in several dictionary categories. Further classification tasks showed promising performance, but future improvements are still needed. Finally, we provide instructions and suggestions for the use of the Grievance Dictionary by security professionals and (violence) researchers.
Abstract（参考訳）: 本稿では、グリーバンスに満ちた暴力脅威評価の文脈において、言語使用を自動的に理解するために使用できる心理言語辞書「グリーバンス辞書」を紹介する。本稿では,経験豊富な脅威評価実践者から提案された辞書の開発について述べる。これらの提案とその後の人的および計算的な単語リストの生成により、2,318人の参加者による20,502単語の注釈付き辞書が作成された。この辞書は暴力者や非暴力者によって書かれたテキストに適用することで検証され、複数の辞書カテゴリーの人口差の強い証拠が示された。さらなる分類作業は有望な性能を示したが、将来的な改善は必要である。最後に,セキュリティ専門家や(違反)研究者によるGreevance Dictionaryの使用に関する指示と提案を行う。

関連論文リスト

Translating the Grievance Dictionary: a psychometric evaluation of Dutch, German, and Italian versions [0.3399874096487746]
グリーバンス辞典(Greevance Dictionary)は、暴力的、脅迫的、または悲嘆に満ちたテキストの分析のための精神言語辞典である。英語以外の言語におけるこれらのテーマの関連性を考えると、グリーバンス辞典をオランダ語、ドイツ語、イタリア語に翻訳した。オランダ語とドイツ語の翻訳は原文の英語版と似ているが、イタリア語の辞書はいくつかのカテゴリーで信頼性が低い。
論文参考訳（メタデータ） (2025-05-12T12:27:38Z)
Inaccuracy of an E-Dictionary and Its Influence on Chinese Language Users [4.061449824145836]
主要なE辞書の精度はほとんど精査されておらず、そのコーパスの作り方にはほとんど注意が払われていない。本研究は,中国で最も広く使われているE辞書のひとつであるYoudaoについて,実験,ユーザ調査,辞書評定を併用して検討する。結果は、不完全あるいは誤解を招く定義が深刻な誤解を引き起こす可能性があることを示している。この研究は、データ処理における問題と辞書構築におけるAIと機械学習技術の統合を強調し、そのような欠陥定義がどのように生まれたかをさらに調査する。
論文参考訳（メタデータ） (2025-04-01T13:54:33Z)
Bridging Dictionary: AI-Generated Dictionary of Partisan Language Use [21.15400893251543]
Bridging Dictionaryは、異なる政治的見解を持つ人々によって、言葉がどのように認識されているかを示すインタラクティブなツールである。 Bridging Dictionaryには、静的で印刷可能なドキュメントが含まれており、大きな言語モデルによって生成された要約を含む796の用語がある。ユーザーは選択した単語を探索し、その頻度、感情、要約、政治的分裂の例を視覚化することができる。
論文参考訳（メタデータ） (2024-07-12T19:44:40Z)
Towards Unsupervised Speech Recognition Without Pronunciation Models [57.222729245842054]
本稿では,ペア音声とテキストコーパスを使わずにASRシステムを開発するという課題に取り組む。音声合成とテキスト・テキスト・マスクによるトークン埋込から教師なし音声認識が実現可能であることを実験的に実証した。この革新的なモデルは、レキシコンフリー環境下での以前の教師なしASRモデルの性能を上回る。
論文参考訳（メタデータ） (2024-06-12T16:30:58Z)
Refinement of an Epilepsy Dictionary through Human Annotation of Health-related posts on Instagram [5.410785987233275]
私たちは、バイオメディカル用語で作られた辞書を使って、少なくとも一度はてんかん関連薬に言及したユーザーによって、800万件以上のInstagram投稿をタグ付けしました。 1,771のポストと2,947の項一致のランダムなサンプルを、ヒトのアノテーターによって評価し、偽陽性を同定した。 OpenAIのGPTシリーズモデルは人間のアノテーションと比較された。
論文参考訳（メタデータ） (2024-05-14T17:27:59Z)
Biomedical Named Entity Recognition via Dictionary-based Synonym Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文参考訳（メタデータ） (2023-05-22T14:36:32Z)
A Study of Slang Representation Methods [3.511369967593153]
我々は,スラング理解に依存した様々な下流タスクに対して,表現学習モデルと知識資源の異なる組み合わせについて検討する。誤り解析では、語彙外単語、多意味性、分散性、アノテーションの不一致など、スラング表現学習における中核的な課題を識別する。
論文参考訳（メタデータ） (2022-12-11T21:56:44Z)
Short-Term Word-Learning in a Dynamically Changing Environment [63.025297637716534]
本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識するためのメカニズムを用いて、エンドツーエンドのASRシステムを補完する方法を示す。誤報がわずかに増加しただけで, 単語の検出速度が大幅に向上した。
論文参考訳（メタデータ） (2022-03-29T10:05:39Z)
Dynamically Refined Regularization for Improving Cross-corpora Hate Speech Detection [30.462596705180534]
ヘイト音声分類器は、ソースと異なるデータセットで評価した場合、かなりの性能劣化を示す。これまでの研究は、定義済みの静的辞書から特定の用語を正規化することでこの問題を緩和しようと試みてきた。本稿では,単語リストを動的に洗練した帰属的手法を用いて,素早い相関を自動同定し,低減する手法を提案する。
論文参考訳（メタデータ） (2022-03-23T16:58:10Z)
Semantic-Preserving Adversarial Text Attacks [85.32186121859321]
深層モデルの脆弱性を調べるために, Bigram と Unigram を用いた適応的セマンティック保存最適化法 (BU-SPO) を提案する。提案手法は,既存手法と比較して最小の単語数を変更することで,攻撃成功率とセマンティックス率を最大化する。
論文参考訳（メタデータ） (2021-08-23T09:05:18Z)
Self-Supervised Euphemism Detection and Identification for Content Moderation [16.322965299627974]
ユーヘミズムの一般的な使用法は、ソーシャルメディアプラットフォームによって強制されるコンテンツモデレーションポリシーを回避することである。通常、人間のモデレーターは、ある単語がエキシマティックに使われていることは明らかであるが、秘密の意味が何であるかは分かっていない。本論文は, 共起的に使用される単語を検知し, 各単語の秘密意味を識別できる教師なしアルゴリズムを示す。
論文参考訳（メタデータ） (2021-03-31T04:52:38Z)
Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文参考訳（メタデータ） (2020-10-05T17:19:10Z)
RUSSE'2020: Findings of the First Taxonomy Enrichment Task for the Russian language [70.27072729280528]
本稿では,ロシア語の分類学的豊か化に関する最初の共有課題の結果について述べる。 16チームがこのタスクに参加し、半数以上が提供されたベースラインを上回った。
論文参考訳（メタデータ） (2020-05-22T13:30:37Z)
Word Sense Disambiguation for 158 Languages using Word Embeddings Only [80.79437083582643]
文脈における単語感覚の曖昧さは人間にとって容易であるが、自動的アプローチでは大きな課題である。本稿では,学習前の標準単語埋め込みモデルを入力として,完全に学習した単語認識のインベントリを誘導する手法を提案する。この手法を用いて、158の言語に対して、事前訓練されたfastText単語の埋め込みに基づいて、センスインベントリのコレクションを誘導する。
論文参考訳（メタデータ） (2020-03-14T14:50:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。