論文の概要: Can Open-source LLMs Enhance Data Synthesis for Toxic Detection?: An Experimental Study
- arxiv url: http://arxiv.org/abs/2411.15175v2
- Date: Tue, 03 Dec 2024 20:07:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-05 15:06:00.790199
- Title: Can Open-source LLMs Enhance Data Synthesis for Toxic Detection?: An Experimental Study
- Title(参考訳): 毒性検出のためのオープンソースのLLMデータ合成は可能か?:実験的検討
- Authors: Zheng Hui, Zhaoxiao Guo, Hang Zhao, Juanyong Duan, Lin Ai, Yinheng Li, Julia Hirschberg, Congrui Huang,
- Abstract要約: 本研究では、有害なデータ合成のためのオープンソースのLCMの可能性について検討する。
我々はまず,複数のデータセットにまたがる有害なデータを生成するために,プロンプトエンジニアリングを用いて6つのオープンソースLLMの能力を検証した。
第2段階では、これらのモデルを微調整して、幻覚、データ重複、過剰適合といった課題に対処しながら、データ生成を改善する。
- 参考スコア(独自算出の注目度): 29.23490658406256
- License:
- Abstract: Effective toxic content detection relies heavily on high-quality and diverse data, which serves as the foundation for robust content moderation models. This study explores the potential of open-source LLMs for harmful data synthesis, utilizing prompt engineering and fine-tuning techniques to enhance data quality and diversity. In a two-stage evaluation, we first examine the capabilities of six open-source LLMs in generating harmful data across multiple datasets using prompt engineering. In the second stage, we fine-tune these models to improve data generation while addressing challenges such as hallucination, data duplication, and overfitting. Our findings reveal that Mistral excels in generating high-quality and diverse harmful data with minimal hallucination. Furthermore, fine-tuning enhances data quality, offering scalable and cost-effective solutions for augmenting datasets for specific toxic content detection tasks. These results emphasize the significance of data synthesis in building robust, standalone detection models and highlight the potential of open-source LLMs to advance smaller downstream content moderation systems. We implemented this approach in real-world industrial settings, demonstrating the feasibility and efficiency of fine-tuned open-source LLMs for harmful data synthesis.
- Abstract(参考訳): 効果的な有毒なコンテンツ検出は高品質で多様なデータに依存しており、堅牢なコンテンツモデレーションモデルの基盤となっている。
本研究は,データ品質と多様性を高めるために,迅速な技術と微調整技術を活用し,有害なデータ合成のためのオープンソースLLMの可能性を探るものである。
2段階評価では、まず、プロンプトエンジニアリングを用いて、複数のデータセットにまたがる有害なデータを生成する6つのオープンソースLCMの能力について検討する。
第2段階では、これらのモデルを微調整して、幻覚、データ重複、過剰適合といった課題に対処しながら、データ生成を改善する。
以上の結果より,ミストラルは幻覚の少ない高品質で多様な有害なデータを生成できることが示唆された。
さらに、微調整によってデータ品質が向上し、特定の有毒なコンテンツ検出タスクのためにデータセットを拡大するためのスケーラブルで費用対効果の高いソリューションを提供する。
これらの結果は、ロバストでスタンドアロンな検出モデルを構築する上でのデータ合成の重要性を強調し、より小型のダウンストリームコンテンツモデレーションシステムを構築するためのオープンソースのLCMの可能性を強調している。
この手法を実世界の産業環境において実装し、有害なデータ合成のための微調整オープンソースのLCMの実現可能性と効率性を実証した。
関連論文リスト
- Beyond Binary: Towards Fine-Grained LLM-Generated Text Detection via Role Recognition and Involvement Measurement [51.601916604301685]
大規模言語モデル(LLM)は、オンライン談話における信頼を損なう可能性のあるコンテンツを生成する。
現在の手法はバイナリ分類に重点を置いており、人間とAIのコラボレーションのような現実のシナリオの複雑さに対処できないことが多い。
バイナリ分類を超えてこれらの課題に対処するために,LLM生成コンテンツを検出するための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2024-10-18T08:14:10Z) - Large Language Models can be Strong Self-Detoxifiers [82.6594169242814]
SASA(Self-disciplined Autoregressive Smpling)は、大規模言語モデル(LLM)の毒性低減のための軽量制御復号アルゴリズムである。
SASAは、自己回帰サンプリング戦略を調整することにより、電流出力のマージンを追跡し、有害な部分空間から世代を分離する。
Llama-3.1-Instruct (8B), Llama-2 (7B), GPT2-L model with the RealToxicityPrompts, BOLD, and AttaQ benchmarks。
論文 参考訳(メタデータ) (2024-10-04T17:45:15Z) - Enhancing Unsupervised Sentence Embeddings via Knowledge-Driven Data Augmentation and Gaussian-Decayed Contrastive Learning [37.54523122932728]
大規模言語モデル(LLM)を用いたパイプラインベースのデータ拡張手法を提案する。
データ多様性の低い問題に対処するため、私たちのパイプラインは知識グラフ(KG)を使用してエンティティや量を取り出す。
高いデータノイズに対処するため、GCSEモデルは偽硬陰性サンプルの影響を制限するためにガウス分解関数を使用する。
論文 参考訳(メタデータ) (2024-09-19T16:29:58Z) - THaMES: An End-to-End Tool for Hallucination Mitigation and Evaluation in Large Language Models [0.0]
事実的に誤ったコンテンツの生成である幻覚は、大規模言語モデルにおいてますます困難になっている。
本稿では,このギャップに対処する統合フレームワークとライブラリであるTHaMESを紹介する。
THaMES は LLM における幻覚の評価と緩和のためのエンドツーエンドのソリューションを提供する。
論文 参考訳(メタデータ) (2024-09-17T16:55:25Z) - Low-rank finetuning for LLMs: A fairness perspective [54.13240282850982]
低ランク近似技術は、微調整された大規模言語モデルのデファクトスタンダードとなっている。
本稿では,これらの手法が初期訓練済みデータ分布から微調整データセットのシフトを捉える上での有効性について検討する。
低ランク微調整は好ましくない偏見や有害な振る舞いを必然的に保存することを示す。
論文 参考訳(メタデータ) (2024-05-28T20:43:53Z) - LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named
Entity Recognition [67.96794382040547]
$LLM-DA$は、数発のNERタスクのために、大きな言語モデル(LLM)に基づいた、新しいデータ拡張テクニックである。
提案手法では,14のコンテキスト書き換え戦略を採用し,同一タイプのエンティティ置換を設計し,ロバスト性を高めるためにノイズ注入を導入する。
論文 参考訳(メタデータ) (2024-02-22T14:19:56Z) - Efficient Toxic Content Detection by Bootstrapping and Distilling Large
Language Models [10.490147336936504]
大規模言語モデル(LLM)は、優れたゼロショットと少数ショットのin-Thought学習能力により、有害なコンテンツ検出を約束している。
BD-LLMは, 毒性物質検出のためのブートストラップ法と蒸留法において, 新規かつ効率的な手法である。
論文 参考訳(メタデータ) (2023-12-13T17:22:19Z) - Can Large Language Models Understand Content and Propagation for
Misinformation Detection: An Empirical Study [26.023148371263012]
大きな言語モデル(LLM)は、自然言語の理解と推論における強力な能力に対して大きな注目を集めている。
本研究では,誤情報検出タスクにおけるLCMの性能について,総合的研究を行った。
論文 参考訳(メタデータ) (2023-11-21T16:03:51Z) - On the Risk of Misinformation Pollution with Large Language Models [127.1107824751703]
本稿では,現代大規模言語モデル (LLM) の誤用の可能性について検討する。
本研究は, LLMが効果的な誤情報発生器として機能し, DOQAシステムの性能が著しく低下することを明らかにする。
論文 参考訳(メタデータ) (2023-05-23T04:10:26Z) - Information Extraction in Low-Resource Scenarios: Survey and Perspective [56.5556523013924]
情報抽出は構造化されていないテキストから構造化された情報を導き出そうとする。
本稿では,emphLLMおよびemphLLMに基づく低リソースIEに対するニューラルアプローチについて概説する。
論文 参考訳(メタデータ) (2022-02-16T13:44:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。