論文の概要: Large Language Models in the Abuse Detection Pipeline
- arxiv url: http://arxiv.org/abs/2604.00323v1
- Date: Tue, 31 Mar 2026 23:42:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.7691
- Title: Large Language Models in the Abuse Detection Pipeline
- Title(参考訳): 乱用検出パイプラインにおける大規模言語モデル
- Authors: Suraj Kath, Sanket Badhe, Preet Shah, Ashwin Sampathkumar, Shivani Gupta,
- Abstract要約: オンラインの虐待はますます複雑化しており、有害な言語、ハラスメント、操作、不正行為にまたがっている。
従来の機械学習アプローチは、静的分類器や労働集約的なラベル付けに頼って、進化する脅威パターンや、曖昧なポリシー要件に追従する。
大規模言語モデルは、文脈的推論、ポリシー解釈、説明生成、モーダル間理解のための新しい機能を導入します。
- 参考スコア(独自算出の注目度): 0.23301643766310373
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online abuse has grown increasingly complex, spanning toxic language, harassment, manipulation, and fraudulent behavior. Traditional machine-learning approaches dependent on static classifiers and labor-intensive labeling struggle to keep pace with evolving threat patterns and nuanced policy requirements. Large Language Models introduce new capabilities for contextual reasoning, policy interpretation, explanation generation, and cross-modal understanding, enabling them to support multiple stages of modern safety systems. This survey provides a lifecycle-oriented analysis of how LLMs are being integrated into the Abuse Detection Lifecycle (ADL), which we define across four stages: (I) Label \& Feature Generation, (II) Detection, (III) Review \& Appeals, and (IV) Auditing \& Governance. For each stage, we synthesize emerging research and industry practices, highlight architectural considerations for production deployment, and examine the strengths and limitations of LLM-driven approaches. We conclude by outlining key challenges including latency, cost-efficiency, determinism, adversarial robustness, and fairness and discuss future research directions needed to operationalize LLMs as reliable, accountable components of large-scale abuse-detection and governance systems.
- Abstract(参考訳): オンラインの虐待はますます複雑化しており、有害な言語、ハラスメント、操作、不正行為にまたがっている。
従来の機械学習アプローチは、静的分類器や労働集約的なラベル付けに頼って、進化する脅威パターンや、曖昧なポリシー要件に追従する。
大規模言語モデルは、コンテキスト推論、ポリシー解釈、説明生成、相互理解のための新しい機能を導入し、近代的な安全システムの複数の段階をサポートすることができる。
この調査は、LCMがADL(Abuse Detection Lifecycle)にどのように統合されているかをライフサイクル指向で分析し、 (I) Label \& Feature Generation、 (II) Detection、 (III) Review \& Appeals、 (IV) Auditing \& Governanceの4つのステージで定義します。
各段階において,新たな研究と産業の実践を総合し,生産展開のアーキテクチャ的考察を強調し,LCM駆動型アプローチの強みと限界について検討する。
我々は、遅延、コスト効率、決定主義、敵対的堅牢性、公正性といった主要な課題を概説し、LLMを大規模乱用検知およびガバナンスシステムの信頼性と説明責任のあるコンポーネントとして運用するために必要な今後の研究方向性について論じる。
関連論文リスト
- On the Surprising Efficacy of LLMs for Penetration-Testing [3.11537581064266]
この論文は、浸透試験におけるLarge Language Models (LLMs)の進化を徹底的にレビューする。
さまざまな攻撃的なセキュリティタスクにまたがって、彼らのアプリケーションをデモし、サイバー殺人チェーンの幅広いフェーズをカバーする。
論文では、より広範な採用と安全なデプロイメントを妨げる重要な障害を特定し、議論する。
論文 参考訳(メタデータ) (2025-07-01T15:01:18Z) - MLLM-CL: Continual Learning for Multimodal Large Language Models [39.19456474036905]
ドメインと能力の連続学習を含む新しいベンチマークであるMLLM-CLを紹介する。
本稿では,パラメータ分離とMLLMに基づくルーティング機構による破滅的干渉を防止することを提案する。
我々のアプローチは、ドメイン固有の知識と機能的能力とを最小限の忘れ込みで統合することができ、既存の手法よりもはるかに優れています。
論文 参考訳(メタデータ) (2025-06-05T17:58:13Z) - Disambiguation in Conversational Question Answering in the Era of LLMs and Agents: A Survey [54.90240495777929]
自然言語処理(NLP)におけるあいまいさは依然として根本的な課題である
LLM(Large Language Models)の出現により、あいまいさに対処することがさらに重要になった。
本稿では,言語駆動システムにおけるあいまいさの定義,形態,含意について考察する。
論文 参考訳(メタデータ) (2025-05-18T20:53:41Z) - Large Language Models Meet Stance Detection: A Survey of Tasks, Methods, Applications, Challenges and Future Directions [0.37865171120254354]
スタンス検出は、ソーシャルメディア、ニュース記事、オンラインレビューなど、さまざまなプラットフォームにわたる主観的コンテンツを理解するために不可欠である。
大規模言語モデル(LLM)の最近の進歩は、新しい能力を導入して姿勢検出に革命をもたらした。
本稿では3つの重要な側面に沿って構築されたLCMに基づく姿勢検出手法について,新しい分類法を提案する。
スタンス検出、政治分析、公衆衛生モニタリング、ソーシャルメディアのモデレーションにおける主要な応用について論じる。
論文 参考訳(メタデータ) (2025-05-13T11:47:49Z) - A Survey of Frontiers in LLM Reasoning: Inference Scaling, Learning to Reason, and Agentic Systems [93.8285345915925]
推論(Reasoning)は、論理的推論、問題解決、意思決定を可能にする基本的な認知プロセスである。
大規模言語モデル(LLM)の急速な進歩により、推論は高度なAIシステムを区別する重要な能力として浮上した。
我々は,(1)推論が達成される段階を定義するレジーム,(2)推論プロセスに関与するコンポーネントを決定するアーキテクチャの2つの側面に沿って既存の手法を分類する。
論文 参考訳(メタデータ) (2025-04-12T01:27:49Z) - LLMs in Software Security: A Survey of Vulnerability Detection Techniques and Insights [12.424610893030353]
大規模言語モデル(LLM)は、ソフトウェア脆弱性検出のためのトランスフォーメーションツールとして登場している。
本稿では,脆弱性検出におけるLSMの詳細な調査を行う。
言語間の脆弱性検出、マルチモーダルデータ統合、リポジトリレベルの分析といった課題に対処する。
論文 参考訳(メタデータ) (2025-02-10T21:33:38Z) - Unique Security and Privacy Threats of Large Language Models: A Comprehensive Survey [63.4581186135101]
大規模言語モデル(LLM)は自然言語処理において顕著な進歩を遂げた。
プライバシーとセキュリティの問題は、そのライフサイクルを通じて明らかになっている。
この調査は、潜在的な対策の概要と分析である。
論文 参考訳(メタデータ) (2024-06-12T07:55:32Z) - STPA for Learning-Enabled Systems: A Survey and A New Practice [12.665507596261266]
システム理論プロセス分析(System Theoretic Process Analysis、STPA)は、輸送、エネルギー、防衛を含む多くの産業セクターで使用されているハザード分析の体系的なアプローチである。
安全クリティカルシステムにおける機械学習(ML)の利用傾向は、学習可能システム(LES)へのSTPAの拡張の必要性につながっている。
我々は,31論文の体系的な調査を行い,これらを5つの視点から要約する(関心,研究対象,修正,デリバティブ,プロセスのモデル化)。
私たちはDeepSTPAを紹介します。DeepSTPAは、現状から欠落している2つの側面から、DeepSTPAを強化します。
論文 参考訳(メタデータ) (2023-02-21T10:43:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。