論文の概要: Adapting Large Language Models for Content Moderation: Pitfalls in Data
Engineering and Supervised Fine-tuning
- arxiv url: http://arxiv.org/abs/2310.03400v2
- Date: Thu, 7 Mar 2024 12:04:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 17:45:25.239538
- Title: Adapting Large Language Models for Content Moderation: Pitfalls in Data
Engineering and Supervised Fine-tuning
- Title(参考訳): コンテンツモデレーションに大規模言語モデルを適用する - データエンジニアリングと教師付き微調整の落とし穴-
- Authors: Huan Ma, Changqing Zhang, Huazhu Fu, Peilin Zhao, Bingzhe Wu
- Abstract要約: 大規模言語モデル(LLM)は、様々なドメインでタスクを処理するための実現可能なソリューションとなっている。
本稿では、コンテンツモデレーションのためにプライベートにデプロイ可能なLLMモデルを微調整する方法を紹介する。
- 参考スコア(独自算出の注目度): 79.53130089003986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nowadays, billions of people engage in communication and express their
opinions on the internet daily. Unfortunately, not all of these expressions are
friendly or compliant, making content moderation an indispensable task. A
common approach is to use a discriminative model to classify the content, but
this method often requires strict data engineering, otherwise it will face
unacceptable overfitting. With the successful development of Large Language
Models (LLMs) in recent years, LLM-based methods have become a feasible
solution for handling tasks in various domains. Thanks to the knowledge of the
foundation models, we can develop more robust privately deployed models with
limited data via fine-tuning these foundation models. Moreover, as a generative
model, it can provide detailed analysis of the review process, enhancing
interpretability. In this paper, we introduce how to fine-tune a LLM model that
can be privately deployed for content moderation. Specifically, we discuss the
differences between discriminative and generative models using content
moderation as an example. Additionally, we reveal that incorporating reasoning
processes during the fine-tuning of LLMs can effectively alleviate overfitting,
even if the model is not allowed to directly output reasoning processes during
deployment. We present a complete process, from data collection and
construction to model training and overfitting elimination, for fine-tuning
LLMs in vertical domain deployments. We report the entire research process and
the key findings in this paper, hoping to provide valuable experience for
researchers who are fine-tuning privately deployed models in their
domain-specific research.
- Abstract(参考訳): 今日では何十億という人々がコミュニケーションに携わり、毎日インターネット上で意見を表明している。
残念なことに、これらすべての表現は友好的あるいは準拠的であり、コンテンツモデレーションは必須のタスクである。
一般的なアプローチは、コンテンツを分類するために差別モデルを使用することであるが、この方法は厳密なデータエンジニアリングを必要とすることが多い。
近年、LLM(Large Language Models)の開発が成功し、LLMベースの手法が様々な分野のタスクを扱うための実現可能なソリューションとなった。
ファンデーションモデルの知識のおかげで、これらのファンデーションモデルを微調整することで、限られたデータでより堅牢なプライベートデプロイモデルを開発することができます。
さらに、生成モデルとして、レビュープロセスの詳細な分析を提供し、解釈可能性を高めることができる。
本稿では、コンテンツモデレーションのためにプライベートにデプロイ可能なLLMモデルを微調整する方法を紹介する。
具体的には、コンテンツモデレーションを例として、識別モデルと生成モデルの違いについて論じる。
さらに,LLMの微調整中に推論プロセスを組み込むことで,モデルが配置中に推論プロセスを直接出力できない場合でも,オーバーフィッティングを効果的に軽減できることを明らかにした。
データ収集や構築からモデルトレーニングやオーバーフィッティング除去まで,垂直領域展開における微調整 LLM の完全なプロセスを提案する。
本論文では,研究プロセス全体と重要な成果を報告し,ドメイン固有の研究にプライベートにデプロイされたモデルを微調整している研究者に貴重な経験を提供することを期待する。
関連論文リスト
- Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。
本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文 参考訳(メタデータ) (2024-10-22T06:43:28Z) - Cross-Domain Content Generation with Domain-Specific Small Language Models [3.2772349789781616]
そこで本研究では,2つのドメインに対して,コーヒーレントかつ関連する出力を生成するための小言語モデルを提案する。
それぞれのデータセットに合わせてカスタマイズされたカスタムトークン化ツールを利用することで、生成品質が大幅に向上することがわかった。
凍結層による知識拡張は,小言語モデルがドメイン固有のコンテンツを生成するのに有効な方法であることを示す。
論文 参考訳(メタデータ) (2024-09-19T21:45:13Z) - Model Attribution in LLM-Generated Disinformation: A Domain Generalization Approach with Supervised Contrastive Learning [26.02988481241285]
現代の大きな言語モデル(LLM)は、人間のような品質で偽情報を生成する。
偽情報を生成する方法の多様性は、正確なソース属性を複雑にする。
本稿では,モデル帰属の概念を領域一般化問題として紹介する。
論文 参考訳(メタデータ) (2024-07-31T00:56:09Z) - What matters when building vision-language models? [52.8539131958858]
我々は、80億のパラメータを持つ効率的な基礎的視覚言語モデルであるIdefics2を開発した。
Idefics2は、様々なマルチモーダルベンチマークで、そのサイズカテゴリ内で最先端のパフォーマンスを達成する。
トレーニング用に作成されたデータセットとともに、モデル(ベース、指示、チャット)をリリースします。
論文 参考訳(メタデータ) (2024-05-03T17:00:00Z) - In-Context Unlearning: Language Models as Few Shot Unlearners [27.962361828354716]
我々は,Large Language Models (LLMs) のための新しいアンラーニング手法を提案する。
このメソッドは、モデルパラメータを更新することなく、コンテキスト内で特定の種類の入力を提供することで、モデルからインスタンスを解放する。
実験の結果、文脈内アンラーニングは、モデルパラメータへのアクセスを必要とする他の最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-10-11T15:19:31Z) - Matching Pairs: Attributing Fine-Tuned Models to their Pre-Trained Large
Language Models [11.57282859281814]
異なる知識レベルと属性戦略を考慮し、最良の方法で10の微調整されたモデルのうち8つを正確に追跡できることに気付きます。
論文 参考訳(メタデータ) (2023-06-15T17:42:48Z) - Dataless Knowledge Fusion by Merging Weights of Language Models [51.8162883997512]
微調整された事前学習言語モデルは、下流のNLPモデルを構築するための主要なパラダイムとなっている。
これは、より優れた単一モデルを生み出すために、個々のモデル間で知識を融合させる障壁を生み出します。
パラメータ空間のモデルをマージするデータレス知識融合法を提案する。
論文 参考訳(メタデータ) (2022-12-19T20:46:43Z) - Large Language Models with Controllable Working Memory [64.71038763708161]
大規模言語モデル(LLM)は、自然言語処理(NLP)の一連のブレークスルーをもたらした。
これらのモデルをさらに切り離すのは、事前訓練中に内在する膨大な量の世界的知識だ。
モデルの世界知識が、文脈で提示された事実情報とどのように相互作用するかは、まだ解明されていない。
論文 参考訳(メタデータ) (2022-11-09T18:58:29Z) - Model Reprogramming: Resource-Efficient Cross-Domain Machine Learning [65.268245109828]
視覚、言語、音声などのデータに富む領域では、ディープラーニングが高性能なタスク固有モデルを提供するのが一般的である。
リソース制限されたドメインでのディープラーニングは、(i)限られたデータ、(ii)制約付きモデル開発コスト、(iii)効果的な微調整のための適切な事前学習モデルの欠如など、多くの課題に直面している。
モデル再プログラミングは、ソースドメインから十分に訓練されたモデルを再利用して、モデル微調整なしでターゲットドメインのタスクを解くことで、リソース効率のよいクロスドメイン機械学習を可能にする。
論文 参考訳(メタデータ) (2022-02-22T02:33:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。