論文の概要: Predicting the descent into extremism and terrorism
- arxiv url: http://arxiv.org/abs/2509.16014v1
- Date: Fri, 19 Sep 2025 14:26:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:11.198135
- Title: Predicting the descent into extremism and terrorism
- Title(参考訳): 過激主義とテロリズムへの下降を予言する
- Authors: R. O. Lane, W. J. Holmes, C. J. Taylor, H. M. State-Davey, A. J. Wragge,
- Abstract要約: 提案システムは,機械学習(ML)に対応可能な形式でエンコードされた文のオンライン照合,符号化されたテキストを分類するMLコンポーネント,トラッカー,結果分析のための可視化システムを含む。
検出と追跡のコンセプトは、wikiquote.orgから取得したテロリスト、過激派、選挙運動家、政治家による引用を用いてテストされている。
このシステムは、839の引用文のデータセットを使用して、過激主義の81%の時間とテロリズムに関連する意図と態度を正確に検出することができた。
- 参考スコア(独自算出の注目度): 0.46603287532620746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes an approach for automatically analysing and tracking statements in material gathered online and detecting whether the authors of the statements are likely to be involved in extremism or terrorism. The proposed system comprises: online collation of statements that are then encoded in a form amenable to machine learning (ML), an ML component to classify the encoded text, a tracker, and a visualisation system for analysis of results. The detection and tracking concept has been tested using quotes made by terrorists, extremists, campaigners, and politicians, obtained from wikiquote.org. A set of features was extracted for each quote using the state-of-the-art Universal Sentence Encoder (Cer et al. 2018), which produces 512-dimensional vectors. The data were used to train and test a support vector machine (SVM) classifier using 10-fold cross-validation. The system was able to correctly detect intentions and attitudes associated with extremism 81% of the time and terrorism 97% of the time, using a dataset of 839 quotes. This accuracy was higher than that which was achieved for a simple baseline system based on n-gram text features. Tracking techniques were also used to perform a temporal analysis of the data, with each quote considered to be a noisy measurement of a person's state of mind. It was demonstrated that the tracking algorithms were able to detect both trends over time and sharp changes in attitude that could be attributed to major events.
- Abstract(参考訳): 本稿では,オンラインで収集した資料中のステートメントを自動的に分析・追跡し,その著者が過激主義やテロリズムに関与しているかどうかを検出するアプローチを提案する。
提案システムは,機械学習(ML)に対応可能な形式でエンコードされた文のオンライン照合,符号化されたテキストを分類するMLコンポーネント,トラッカー,結果分析のための可視化システムを含む。
検出と追跡のコンセプトは、wikiquote.orgから取得したテロリスト、過激派、選挙運動家、政治家による引用を用いてテストされている。
512次元ベクトルを生成する最先端のUniversal Sentence Encoder(Cer et al 2018)を用いて,各引用に対して特徴セットを抽出した。
データは10倍のクロスバリデーションを用いたサポートベクトルマシン(SVM)分類器のトレーニングとテストに使用された。
このシステムは、839の引用文のデータセットを使用して、過激主義の81%の時間とテロリズムに関連する意図と態度を正確に検出することができた。
この精度は、n-gramテキストの特徴に基づく単純なベースラインシステムで達成されたものよりも高かった。
追跡技術はデータの時間的分析にも用いられ、それぞれの引用は人の心の状態のうるさい測定であると考えられていた。
追跡アルゴリズムは、時間とともにトレンドを検知し、大きな出来事に起因する可能性のある態度の変化を鋭く検出できることが実証された。
関連論文リスト
- Your Language Model Can Secretly Write Like Humans: Contrastive Paraphrase Attacks on LLM-Generated Text Detectors [77.82885394684202]
テキスト検出を効果的に欺く訓練不要な方法である textbfContrastive textbfParaphrase textbfAttack (CoPA) を提案する。
CoPAは、大規模言語モデルによって生成される人間のような分布とは対照的に、補助的な機械的な単語分布を構築している。
我々の理論的分析は、提案された攻撃の優越性を示唆している。
論文 参考訳(メタデータ) (2025-05-21T10:08:39Z) - TempTest: Local Normalization Distortion and the Detection of Machine-generated Text [0.0]
本稿では,生成言語モデルに完全に依存した機械生成テキストを検出する手法を提案する。
これは、温度やトップkサンプリングのようなデコード戦略が条件付き確率測度を正規化する方法の欠陥を目標にすることで達成される。
我々は,様々な言語モデル,データセット,通過距離の異なる,白と黒のボックス設定での検出器の評価を行った。
論文 参考訳(メタデータ) (2025-03-26T10:56:59Z) - AuthorMist: Evading AI Text Detectors with Reinforcement Learning [4.806579822134391]
AuthorMistは、AI生成したテキストを人間ライクな文章に変換する、新しい強化学習ベースのシステムだ。
AuthorMistは,本来の意味を保ちながら,AI生成テキストの検出性を効果的に低減することを示す。
論文 参考訳(メタデータ) (2025-03-10T12:41:05Z) - Malicious URL Detection using optimized Hist Gradient Boosting Classifier based on grid search method [0.0]
悪意のあるウェブサイトが不正な理由で情報を収集する可能性があるため、オンラインプラットフォームで入力されたデータの正確さを信頼することは困難である。
悪意のあるWebサイトが引き起こすリスクを検出するために,機械学習(ML)ベースの手法を用いることを提案する。
使用されるデータセットには、悪意のあるWebサイトデータの1781のレコードと13の機能が含まれている。
論文 参考訳(メタデータ) (2024-06-12T11:16:30Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Phishing URL Detection Through Top-level Domain Analysis: A Descriptive
Approach [3.494620587853103]
本研究では,Splunkプラットフォーム内で使用可能な不正なURLを検出する機械学習モデルを開発することを目的とする。
文学における同様のアプローチから着想を得た私たちは、悪意のあるデータセットと良心的なデータセットを使用して、SVMとランダムフォレストアルゴリズムを訓練しました。
我々はアルゴリズムの性能を精度とリコールで評価し,ランダムフォレストの場合,最大85%の精度と87%のリコールを達成した。
論文 参考訳(メタデータ) (2020-05-13T21:41:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。