論文の概要: ConfliBERT: A Language Model for Political Conflict
- arxiv url: http://arxiv.org/abs/2412.15060v1
- Date: Thu, 19 Dec 2024 17:08:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-20 13:31:55.370759
- Title: ConfliBERT: A Language Model for Political Conflict
- Title(参考訳): ConfliBERT: 政治的対立のための言語モデル
- Authors: Patrick T. Brandt, Sultan Alsarra, Vito J. D`Orazio, Dagmar Heintze, Latifur Khan, Shreyas Meher, Javier Osorio, Marcus Sianan,
- Abstract要約: 紛争学者は、政治暴力に関する情報をニュースやテキストから抽出するためにルールに基づくアプローチを用いてきた。
我々は、最近のConfliBERT言語モデルについて、政治的および暴力に関するテキストを処理するためにレビューする。
微調整すると、ConfliBERTは他の大規模言語モデルよりも精度、精度、リコールが優れていることが分かる。
- 参考スコア(独自算出の注目度): 7.031352908995972
- License:
- Abstract: Conflict scholars have used rule-based approaches to extract information about political violence from news reports and texts. Recent Natural Language Processing developments move beyond rigid rule-based approaches. We review our recent ConfliBERT language model (Hu et al. 2022) to process political and violence related texts. The model can be used to extract actor and action classifications from texts about political conflict. When fine-tuned, results show that ConfliBERT has superior performance in accuracy, precision and recall over other large language models (LLM) like Google's Gemma 2 (9B), Meta's Llama 3.1 (7B), and Alibaba's Qwen 2.5 (14B) within its relevant domains. It is also hundreds of times faster than these more generalist LLMs. These results are illustrated using texts from the BBC, re3d, and the Global Terrorism Dataset (GTD).
- Abstract(参考訳): 紛争学者は、政治暴力に関する情報をニュースやテキストから抽出するためにルールに基づくアプローチを用いてきた。
最近の自然言語処理開発は厳格な規則に基づくアプローチを超えて進んでいる。
我々は、最近のConfliBERT言語モデル(Hu et al 2022)をレビューし、政治的および暴力関連のテキストを処理する。
このモデルは、政治的対立に関するテキストからアクターとアクションの分類を抽出するために使用することができる。
微調整された結果から、ConfliBERTは、GoogleのGemma 2 (9B)、MetaのLlama 3.1 (7B)、AlibabaのQwen 2.5 (14B)のような他の大きな言語モデル(LLM)よりも、精度、精度、リコールにおいて優れたパフォーマンスを示している。
また、より汎用的なLSMよりも数百倍高速である。
これらの結果は、BBC、re3d、GTD(Global Terrorism Dataset)のテキストを使って説明されている。
関連論文リスト
- Narrative Analysis of True Crime Podcasts With Knowledge Graph-Augmented Large Language Models [8.78598447041169]
大きな言語モデル(LLM)は、複雑な物語の弧や矛盾する情報を含む物語といまだに苦労している。
最近の研究は、外部知識ベースで強化されたLLMが、結果の精度と解釈可能性を向上させることを示唆している。
本研究では,実際のポッドキャストデータの理解における知識グラフ(KG)の適用性について検討する。
論文 参考訳(メタデータ) (2024-11-01T21:49:00Z) - Large Language Models Reflect the Ideology of their Creators [71.65505524599888]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。
本稿では, LLMのイデオロギー的姿勢が創造者の世界観を反映していることを示す。
論文 参考訳(メタデータ) (2024-10-24T04:02:30Z) - Rule or Story, Which is a Better Commonsense Expression for Talking with Large Language Models? [49.83570853386928]
人間は物語を通して暗黙的にコモンセンスを伝え、伝承する。
本稿では,物語を通して表現される大規模言語モデル(LLM)の固有コモンセンス能力について検討する。
論文 参考訳(メタデータ) (2024-02-22T07:55:26Z) - Into the crossfire: evaluating the use of a language model to
crowdsource gun violence reports [0.21485350418225244]
我々は、通常のポルトガル語のテキストと銃暴力の報告を区別するために、Twitterテキストで訓練された細調整BERTベースのモデルを提案する。
我々は、新たな銃暴力イベントを特定するために、ソーシャルメディアのテキストを継続的に事実チェックしているブラジルのアナリストを調査、インタビューする。
論文 参考訳(メタデータ) (2024-01-16T14:40:54Z) - Mavericks at BLP-2023 Task 1: Ensemble-based Approach Using Language
Models for Violence Inciting Text Detection [0.0]
ソーシャルメディアは、社会における憎しみや暴力的な発言の伝播を加速させてきた。
少ない研究と少ないデータにより、低リソース環境では、暴力を誘発するテキストを検出する問題がさらに悪化する。
本稿では,バングラ語処理に関する第1回ワークショップにおいて,Volence Inciting Text Detection共有タスクについて紹介する。
論文 参考訳(メタデータ) (2023-11-30T18:23:38Z) - Fine-tuning Language Models for Factuality [96.5203774943198]
大規模な事前訓練型言語モデル(LLM)は、しばしば伝統的な検索エンジンの代替として、広く使われるようになった。
しかし、言語モデルは説得力のあるが事実的に不正確な主張をしがちである(しばしば「幻覚」と呼ばれる)。
本研究では,人間のラベル付けなしに,より現実的な言語モデルを微調整する。
論文 参考訳(メタデータ) (2023-11-14T18:59:15Z) - Skywork: A More Open Bilingual Foundation Model [55.927396986873816]
英語と中国語の両方のテキストから引き出された3.2兆以上のトークンのコーパスをトレーニングした,大規模言語モデル(LLM)のファミリーであるSkywork-13Bを紹介する。
我々のモデルは,一般的なベンチマークに優れるだけでなく,さまざまなドメインにおける中国語のモデリングにおける芸術的パフォーマンスの即興性も達成できることを示す。
論文 参考訳(メタデータ) (2023-10-30T08:31:47Z) - Using Word Embeddings to Analyze Protests News [2.024222101808971]
既存のワード埋め込みである word2vec と FastTest を ELMo と DistilBERT に置き換えるため、2つの優れたモデルが選択されている。
単語の袋やそれ以前のベクトルアプローチとは異なり、ELMo と DistilBERT はテキスト内の文脈情報に基づいて意味をキャプチャすることで、単語をベクトルの列として表現する。
論文 参考訳(メタデータ) (2022-03-11T12:25:59Z) - From FreEM to D'AlemBERT: a Large Corpus and a Language Model for Early
Modern French [57.886210204774834]
我々は、近世フランス語(歴史的フランス語:16$textth$から18$textth$ century)のためのNLPツールを開発する取り組みを提示する。
我々は、近世フランス語のtextFreEM_textmax$ corpusと、$textFreEM_textmax$でトレーニングされたRoBERTaベースの言語モデルであるD'AlemBERTを提示する。
論文 参考訳(メタデータ) (2022-02-18T22:17:22Z) - Neural Models for Offensive Language Detection [0.0]
攻撃的言語検出は、成長を続ける自然言語処理(NLP)アプリケーションである。
このような有害なコンテンツと戦うために、さまざまな機械学習モデルの改善と比較に貢献することが、この論文の重要な、挑戦的な目標である、と私たちは信じています。
論文 参考訳(メタデータ) (2021-05-30T13:02:45Z) - MEGATRON-CNTRL: Controllable Story Generation with External Knowledge
Using Large-Scale Language Models [98.53511229517463]
本稿では,大規模言語モデルを用いた新しいフレームワークを提案し,外部知識ベースを組み込んだテキスト生成制御を提案する。
本フレームワークは,キーワード予測器,知識検索器,文脈知識ランキング器,条件付きテキスト生成器から構成される。
実験の結果、我々のモデルは、ROCストーリーデータセットの以前の作業と比較して、反復性が低く、多様性が低い、より流動的で、一貫性があり、一貫性のあるストーリーを生成します。
論文 参考訳(メタデータ) (2020-10-02T08:07:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。