論文の概要: Automating Violence Detection and Categorization from Ancient Texts
- arxiv url: http://arxiv.org/abs/2503.08192v1
- Date: Tue, 11 Mar 2025 08:55:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 15:44:57.288423
- Title: Automating Violence Detection and Categorization from Ancient Texts
- Title(参考訳): 古文書からの暴力検出と分類の自動化
- Authors: Alhassan Abdelhalim, Michaela Regneri,
- Abstract要約: 文学における暴力の記述は、人文科学の幅広い研究に貴重な洞察を与える。
歴史家にとって、暴力の描写は、大きな戦争と影響力のある人々の個人的紛争を取り巻く社会的ダイナミクスを分析するための特別な関心事である。
この研究は、古代のテキストにおける暴力を識別し、複数の次元にまたがる分類において、大規模言語モデル(LLM)の有効性を評価する最初のものである。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Violence descriptions in literature offer valuable insights for a wide range of research in the humanities. For historians, depictions of violence are of special interest for analyzing the societal dynamics surrounding large wars and individual conflicts of influential people. Harvesting data for violence research manually is laborious and time-consuming. This study is the first one to evaluate the effectiveness of large language models (LLMs) in identifying violence in ancient texts and categorizing it across multiple dimensions. Our experiments identify LLMs as a valuable tool to scale up the accurate analysis of historical texts and show the effect of fine-tuning and data augmentation, yielding an F1-score of up to 0.93 for violence detection and 0.86 for fine-grained violence categorization.
- Abstract(参考訳): 文学における暴力の記述は、人文科学の幅広い研究に貴重な洞察を与える。
歴史家にとって、暴力の描写は、大きな戦争と影響力のある人々の個人的紛争を取り巻く社会的ダイナミクスを分析するための特別な関心事である。
暴力研究のためのデータを手動で行うのは、手間と時間を要する。
この研究は、古代のテキストにおける暴力を識別し、複数の次元にまたがる分類において、大規模言語モデル(LLM)の有効性を評価する最初のものである。
実験により, LLMは, 歴史的テキストの正確な分析を向上し, 微調整とデータ拡張の効果を示す貴重なツールであり, 暴力検出には最大0.93点, きめ細かい暴力分類には最大0.86点のF1スコアが得られた。
関連論文リスト
- You Shall Know a Tool by the Traces it Leaves: The Predictability of Sentiment Analysis Tools [74.98850427240464]
感情分析ツールが同じデータセットで一致しないことを示す。
感傷的アノテーションに使用される感情ツールは,その結果から予測できることを示す。
論文 参考訳(メタデータ) (2024-10-18T17:27:38Z) - Causal Micro-Narratives [62.47217054314046]
テキストから因果マイクロナラティブを分類する新しい手法を提案する。
これらの物語は、対象対象の因果関係と/または効果の文レベルの説明である。
論文 参考訳(メタデータ) (2024-10-07T17:55:10Z) - LFED: A Literary Fiction Evaluation Dataset for Large Language Models [58.85989777743013]
元々は中国語で書かれたか、中国語に翻訳された95の文学小説を収集し、数世紀にわたって幅広い話題を扱っている。
質問分類を8つのカテゴリーで定義し,1,304の質問の作成を導く。
我々は、小説の特定の属性(小説の種類、文字番号、出版年など)がLLMのパフォーマンスに与える影響を詳細に分析する。
論文 参考訳(メタデータ) (2024-05-16T15:02:24Z) - Exploring Boundaries and Intensities in Offensive and Hate Speech: Unveiling the Complex Spectrum of Social Media Discourse [16.99659597567309]
本稿では,3つのタスクに対して8,258のツイートをアノテートしたAmharicのベンチマークデータセットを提案する。
私たちの研究は、ほとんどのツイートが攻撃的でない、憎悪の度合いの低いレベルに属することを強調しています。
民族的および政治的憎悪の対象の出現は、我々のデータセットに顕著に重複しており、エチオピアの社会政治の景観における複雑な関係を強調している。
論文 参考訳(メタデータ) (2024-04-18T09:52:50Z) - Mapping Violence: Developing an Extensive Framework to Build a Bangla Sectarian Expression Dataset from Social Media Interactions [1.2618555186247333]
オンラインバングラコンテンツにおける共犯マーカーの自動検出のための,初の包括的枠組みを開発した。
私たちのワークフローでは、社会科学者、言語学者、心理学者の洞察を取り入れた7段階の専門家アノテーションプロセスを導入しています。
このデータセットを用いてデータ統計とベンチマーク性能を提示することにより、非コミュニケーション暴力のカテゴリ以外では、リグリゴ・コミュニティ暴力は特にバングラ文字で広く普及していると判断した。
論文 参考訳(メタデータ) (2024-04-17T21:09:13Z) - Into the crossfire: evaluating the use of a language model to
crowdsource gun violence reports [0.21485350418225244]
我々は、通常のポルトガル語のテキストと銃暴力の報告を区別するために、Twitterテキストで訓練された細調整BERTベースのモデルを提案する。
我々は、新たな銃暴力イベントを特定するために、ソーシャルメディアのテキストを継続的に事実チェックしているブラジルのアナリストを調査、インタビューする。
論文 参考訳(メタデータ) (2024-01-16T14:40:54Z) - Mavericks at BLP-2023 Task 1: Ensemble-based Approach Using Language
Models for Violence Inciting Text Detection [0.0]
ソーシャルメディアは、社会における憎しみや暴力的な発言の伝播を加速させてきた。
少ない研究と少ないデータにより、低リソース環境では、暴力を誘発するテキストを検出する問題がさらに悪化する。
本稿では,バングラ語処理に関する第1回ワークショップにおいて,Volence Inciting Text Detection共有タスクについて紹介する。
論文 参考訳(メタデータ) (2023-11-30T18:23:38Z) - Affective and Dynamic Beam Search for Story Generation [50.3130767805383]
面白い物語を生成するために、AffGen(Affective Story Generator)を提案する。
AffGenはDynamic Beam SizeとAffective Re rankという2つの新しいテクニックを採用している。
論文 参考訳(メタデータ) (2023-10-23T16:37:14Z) - Sensitivity, Performance, Robustness: Deconstructing the Effect of
Sociodemographic Prompting [64.80538055623842]
社会デマトグラフィープロンプトは、特定の社会デマトグラフィープロファイルを持つ人間が与える答えに向けて、プロンプトベースのモデルの出力を操縦する技術である。
ソシオデマトグラフィー情報はモデル予測に影響を及ぼし、主観的NLPタスクにおけるゼロショット学習を改善するのに有用であることを示す。
論文 参考訳(メタデータ) (2023-09-13T15:42:06Z) - Sentiment Analysis Based on Deep Learning: A Comparative Study [69.09570726777817]
世論の研究は我々に貴重な情報を提供することができる。
感情分析の効率性と正確性は、自然言語処理で直面する課題によって妨げられている。
本稿では、感情分析の問題を解決するためにディープラーニングを用いた最新の研究をレビューする。
論文 参考訳(メタデータ) (2020-06-05T16:28:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。