論文の概要: Analysis of Socially Unacceptable Discourse with Zero-shot Learning
- arxiv url: http://arxiv.org/abs/2409.13735v1
- Date: Tue, 10 Sep 2024 07:32:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-07 05:35:28.591654
- Title: Analysis of Socially Unacceptable Discourse with Zero-shot Learning
- Title(参考訳): ゼロショット学習による社会的に受け入れられない談話の分析
- Authors: Rayane Ghilene, Dimitra Niaouri, Michele Linardi, Julien Longhi,
- Abstract要約: 社会的に受け入れられない談話(SUD)の分析は、オンラインのポジティブな環境を維持するために不可欠である。
本研究では、事前学習したトランスフォーマーモデルとプロンプト技術を活用して、SUDの検出と特徴付けのためのエンタテインメントベースのゼロショットテキスト分類(unsupervised method)の有効性について検討する。
以上の結果から,これらのモデルがデータの発見に有効であることを示すとともに,ラベル付きデータセットを生成して,過激主義的物語の分析と評価を行う上で,このアプローチの有望な性質を明らかにすることができた。
- 参考スコア(独自算出の注目度): 2.3999111269325266
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Socially Unacceptable Discourse (SUD) analysis is crucial for maintaining online positive environments. We investigate the effectiveness of Entailment-based zero-shot text classification (unsupervised method) for SUD detection and characterization by leveraging pre-trained transformer models and prompting techniques. The results demonstrate good generalization capabilities of these models to unseen data and highlight the promising nature of this approach for generating labeled datasets for the analysis and characterization of extremist narratives. The findings of this research contribute to the development of robust tools for studying SUD and promoting responsible communication online.
- Abstract(参考訳): 社会的に受け入れられない談話(SUD)の分析は、オンラインのポジティブな環境を維持するために不可欠である。
本研究では、事前学習したトランスフォーマーモデルとプロンプト技術を活用して、SUDの検出と特徴付けのためのエンタテインメントベースのゼロショットテキスト分類(unsupervised method)の有効性について検討する。
以上の結果から,これらのモデルがデータの発見に有効であることを示すとともに,ラベル付きデータセットを生成して,過激主義的物語の分析と評価を行う上で,このアプローチの有望な性質を明らかにすることができた。
本研究の成果は,SUD研究のための堅牢なツールの開発や,インターネット上での責任あるコミュニケーションの促進に寄与する。
関連論文リスト
- From Passive Metric to Active Signal: The Evolving Role of Uncertainty Quantification in Large Language Models [77.04403907729738]
このサーベイは、受動的診断基準からリアルタイムモデル動作を導くアクティブ制御信号への不確実性の進化をグラフ化する。
3つのフロンティアにまたがるアクティブ制御信号として不確実性がいかに活用されているかを示す。
この調査は、次世代のスケーラブルで信頼性があり、信頼できるAIを構築するためには、新しい不確実性のトレンドを習得することが不可欠である、と論じている。
論文 参考訳(メタデータ) (2026-01-22T06:21:31Z) - AutoMalDesc: Large-Scale Script Analysis for Cyber Threat Research [81.04845910798387]
脅威検出のための自然言語の説明を生成することは、サイバーセキュリティ研究において未解決の問題である。
本稿では,大規模に独立して動作する自動静的解析要約フレームワークAutoMalDescを紹介する。
アノテーション付きシード(0.9K)データセットや方法論,評価フレームワークなど,100万以上のスクリプトサンプルの完全なデータセットを公開しています。
論文 参考訳(メタデータ) (2025-11-17T13:05:25Z) - Analytical Survey of Learning with Low-Resource Data: From Analysis to Investigation [192.53529928861818]
高リソースデータによる学習は人工知能(AI)において大きな成功を収めた
しかし、データアノテーションやモデルトレーニングに関連するコストは依然として大きい。
本調査では,低リソースデータからの学習に伴う一般化誤差とラベル複雑性を分析するために,アクティブサンプリング理論を用いた。
論文 参考訳(メタデータ) (2025-10-10T03:15:42Z) - Polarity Detection of Sustainable Detection Goals in News Text [38.03224707532651]
国連の持続可能な開発目標は、社会的、環境的、経済的課題に対処するための世界的な枠組みを提供する。
自然言語処理(NLP)と大規模言語モデル(LLM)の最近の進歩は、特定のSDGに基づいてテキストデータの自動分類を容易にする。
本稿では,テキストセグメントが特定のSDGに向かって進行を示すか,あるいはその進展を達成する意図を伝達するかを評価するSDG極性検出の新しいタスクを提案する。
本研究は、持続可能性モニタリングのための方法論ツールキットを進歩させ、効率的で高性能な極性検出システムの開発に関する実用的な知見を提供する。
論文 参考訳(メタデータ) (2025-09-24T07:23:44Z) - Enhancing WSI-Based Survival Analysis with Report-Auxiliary Self-Distillation [26.607553380775908]
本稿では,WSI を用いた生存分析のための新規な自己蒸留(Rasa)フレームワークを提案する。
LLM(Advanced Large Language Model)は、病理報告から細粒度のWSI関連テキスト記述を抽出するために用いられる。
次に、自己蒸留ベースのパイプラインは、学生モデルに無関係または冗長なWSI機能をフィルタリングするように設計されている。
論文 参考訳(メタデータ) (2025-09-19T05:14:19Z) - Mitigating Attrition: Data-Driven Approach Using Machine Learning and Data Engineering [0.0]
本稿では、機械学習とデータエンジニアリング技術を用いて、従業員の誘惑を緩和する新しいデータ駆動アプローチを提案する。
提案フレームワークは, 多様な人的資源システムからのデータを統合し, 高度な特徴工学を活用して, 誘惑に影響を及ぼす要因を包括的に把握する。
論文 参考訳(メタデータ) (2025-02-25T05:29:45Z) - A Literature Review of Literature Reviews in Pattern Analysis and Machine Intelligence [51.26815896167173]
本稿では,3つの相補的な側面からPAMIレビューを総合的に分析する。
我々の分析は、現在のレビューの実践において、独特の組織パターンと永続的なギャップを明らかにします。
最後に、最先端のAI生成レビューの評価は、コヒーレンスと組織の進歩を奨励していることを示している。
論文 参考訳(メタデータ) (2024-02-20T11:28:50Z) - Towards Biologically Plausible and Private Gene Expression Data
Generation [47.72947816788821]
差分プライバシー(DP)で訓練された生成モデルは、下流アプリケーションのための合成データの作成において、ますます顕著になりつつある。
しかし、既存の文献は主に基本的なベンチマークデータセットに焦点を当てており、基本的なメトリクスと比較的単純なデータ分布にのみ有望な結果を報告する傾向にある。
本研究では,DP生成モデルが自然応用シナリオにおいてどのように機能するかを系統的に分析し,実世界の遺伝子発現データに焦点をあてる。
論文 参考訳(メタデータ) (2024-02-07T14:39:11Z) - Word-Level ASR Quality Estimation for Efficient Corpus Sampling and
Post-Editing through Analyzing Attentions of a Reference-Free Metric [5.592917884093537]
品質推定(QE)メトリクスのポテンシャルは、ASRシステムにおける説明可能な人工知能(XAI)を強化する新しいツールとして導入され、評価される。
NoRefERメトリックの能力は、単語レベルの誤りを識別し、ASR仮説を補うのに役立つ。
論文 参考訳(メタデータ) (2024-01-20T16:48:55Z) - FIMBA: Evaluating the Robustness of AI in Genomics via Feature
Importance Adversarial Attacks [0.0]
本稿では、認識された公開ゲノムデータセット上の下流タスクを利用するAIモデルの脆弱性を実証する。
我々は、実際のデータを模倣し、モデルの意思決定を混乱させながら、入力変換に焦点を当てた攻撃を展開することによって、モデルの堅牢性を損なう。
実験の結果, 精度が低下し, 偽陽性や偽陰性が増加し, モデル性能が低下していることが明らかとなった。
論文 参考訳(メタデータ) (2024-01-19T12:04:31Z) - TRIAGE: Characterizing and auditing training data for improved
regression [80.11415390605215]
TRIAGEは回帰タスクに適した新しいデータキャラクタリゼーションフレームワークで、広範囲の回帰器と互換性がある。
TRIAGEは、共形予測分布を利用して、モデルに依存しないスコアリング方法、TRIAGEスコアを提供する。
TRIAGEの特徴は一貫性があり、複数の回帰設定においてデータの彫刻/フィルタリングによるパフォーマンス向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-10-29T10:31:59Z) - Post Hoc Explanations of Language Models Can Improve Language Models [43.2109029463221]
AMPLIFY(Post Hoc Explanations)を用いたインコンテキスト学習の活用によるモデル性能向上のための新しいフレームワークを提案する。
我々は,各入力特徴がモデル予測に与える影響を抽出し,帰属スコア(説明)を出力するポストホック説明手法を活用する。
AMPLIFYは,幅広いタスクに対して約10~25%の精度向上を実現している。
論文 参考訳(メタデータ) (2023-05-19T04:46:04Z) - On the Robustness of Aspect-based Sentiment Analysis: Rethinking Model,
Data, and Training [109.9218185711916]
アスペクトベースの感情分析(ABSA)は、ソーシャルメディアのテキストやレビューの背後にある製品やサービスの特定の側面に対して、特定の感情の極性を自動的に推測することを目的としている。
我々は、モデル、データ、トレーニングを含むあらゆる可能な角度からボトルネックを体系的に再考することで、ABSAの堅牢性を高めることを提案する。
論文 参考訳(メタデータ) (2023-04-19T11:07:43Z) - Energy-based Out-of-Distribution Detection for Graph Neural Networks [76.0242218180483]
我々は,GNNSafeと呼ばれるグラフ上での学習のための,シンプルで強力で効率的なOOD検出モデルを提案する。
GNNSafeは、最先端技術に対するAUROCの改善を最大17.0%で達成しており、そのような未開発領域では単純だが強力なベースラインとして機能する可能性がある。
論文 参考訳(メタデータ) (2023-02-06T16:38:43Z) - Offline Reinforcement Learning with Instrumental Variables in Confounded
Markov Decision Processes [93.61202366677526]
未測定の共同設立者を対象にオフライン強化学習(RL)について検討した。
そこで本稿では, 最適クラスポリシーを見つけるための, 有限サンプルの準最適性を保証した多種多様なポリシー学習手法を提案する。
論文 参考訳(メタデータ) (2022-09-18T22:03:55Z) - Artificial Text Detection via Examining the Topology of Attention Maps [58.46367297712477]
トポロジカルデータ分析(TDA)に基づく3種類の解釈可能なトポロジカル特徴を提案する。
BERTモデルから派生した特徴が3つの共通データセットにおいて、カウントベースとニューラルベースベースラインを最大10%上回っていることを実証的に示す。
特徴の探索解析は表面に対する感度と構文的性質を明らかにしている。
論文 参考訳(メタデータ) (2021-09-10T12:13:45Z) - Leveraging Community and Author Context to Explain the Performance and
Bias of Text-Based Deception Detection Models [6.428095289290804]
オンラインコミュニティで共有されている偽ニュースは、NLPモデルで検出することができる。
我々は,オンラインコミュニティの特徴と著者を用いて,ニューラルネットワークの騙し検出モデルの性能を説明する。
論文 参考訳(メタデータ) (2021-04-27T21:49:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。