論文の概要: Facilitating NSFW Text Detection in Open-Domain Dialogue Systems via
Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2309.09749v1
- Date: Mon, 18 Sep 2023 13:24:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 13:22:23.659937
- Title: Facilitating NSFW Text Detection in Open-Domain Dialogue Systems via
Knowledge Distillation
- Title(参考訳): 知識蒸留によるオープンドメイン対話システムにおけるNSFWテキストの検出
- Authors: Huachuan Qiu, Shuai Zhang, Hongliang He, Anqi Li, Zhenzhong Lan
- Abstract要約: CensorChatは、NSFW対話検出を目的とした対話監視データセットである。
このデータセットは、NSFWコンテンツ検出器を構築するための費用効率の良い手段を提供する。
提案手法は,NSFWコンテンツ検出の進歩だけでなく,AI駆動対話におけるユーザ保護ニーズの進展とも一致している。
- 参考スコア(独自算出の注目度): 28.370263099251638
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: NSFW (Not Safe for Work) content, in the context of a dialogue, can have
severe side effects on users in open-domain dialogue systems. However, research
on detecting NSFW language, especially sexually explicit content, within a
dialogue context has significantly lagged behind. To address this issue, we
introduce CensorChat, a dialogue monitoring dataset aimed at NSFW dialogue
detection. Leveraging knowledge distillation techniques involving GPT-4 and
ChatGPT, this dataset offers a cost-effective means of constructing NSFW
content detectors. The process entails collecting real-life human-machine
interaction data and breaking it down into single utterances and single-turn
dialogues, with the chatbot delivering the final utterance. ChatGPT is employed
to annotate unlabeled data, serving as a training set. Rationale validation and
test sets are constructed using ChatGPT and GPT-4 as annotators, with a
self-criticism strategy for resolving discrepancies in labeling. A BERT model
is fine-tuned as a text classifier on pseudo-labeled data, and its performance
is assessed. The study emphasizes the importance of AI systems prioritizing
user safety and well-being in digital conversations while respecting freedom of
expression. The proposed approach not only advances NSFW content detection but
also aligns with evolving user protection needs in AI-driven dialogues.
- Abstract(参考訳): NSFW(Not Safe for Work)コンテンツは、対話の文脈において、オープンドメインの対話システムにおいて、ユーザに深刻な副作用を与える可能性がある。
しかしながら、対話コンテキストにおけるnsfw言語、特に性的に明示されたコンテンツの検出に関する研究は、大幅に遅れている。
本研究では,NSFW対話検出を目的とした対話監視データセットであるCensorChatを紹介する。
GPT-4とChatGPTを含む知識蒸留技術を活用し、このデータセットはNSFWコンテンツ検出器を構築するためのコスト効率の良い手段を提供する。
このプロセスでは、実際の人間と機械のインタラクションデータを収集し、それを1つの発話と1つの対話に分解する。
ChatGPTは未ラベルデータの注釈付けに使われ、トレーニングセットとして機能する。
ChatGPT と GPT-4 をアノテータとして,ラベリングにおける相違を解消するための自己批判戦略を用いて,ラベリングの検証とテストセットを構築した。
BERTモデルは擬似ラベル付きデータのテキスト分類器として微調整され、その性能を評価する。
この研究は、表現の自由を尊重しながら、デジタル会話におけるユーザーの安全と幸福を優先するAIシステムの重要性を強調している。
提案手法は,NSFWコンテンツ検出だけでなく,AI駆動対話におけるユーザ保護ニーズの進展に対応する。
関連論文リスト
- Context Does Matter: Implications for Crowdsourced Evaluation Labels in Task-Oriented Dialogue Systems [57.16442740983528]
クラウドソースラベルは、タスク指向の対話システムを評価する上で重要な役割を果たす。
従来の研究では、アノテーションプロセスで対話コンテキストの一部だけを使用することが提案されている。
本研究では,対話文脈がアノテーション品質に及ぼす影響について検討する。
論文 参考訳(メタデータ) (2024-04-15T17:56:39Z) - Facilitating Pornographic Text Detection for Open-Domain Dialogue Systems via Knowledge Distillation of Large Language Models [26.443929802292807]
人間と機械の対話で発生するポルノコンテンツは、オープンドメインの対話システムにおいて、ユーザに深刻な副作用をもたらす可能性がある。
本稿では,対話セッションにポルノコンテンツが含まれているかどうかを検出するための対話監視データセットであるCensorChatを紹介する。
論文 参考訳(メタデータ) (2024-03-20T02:29:09Z) - Acknowledgment of Emotional States: Generating Validating Responses for
Empathetic Dialogue [21.621844911228315]
本研究は,共感的対話を有効活用するための最初の枠組みを紹介する。
本手法では,1)検証タイミング検出,2)ユーザの感情状態の同定,3)応答生成の検証を行う。
論文 参考訳(メタデータ) (2024-02-20T07:20:03Z) - A Benchmark for Understanding Dialogue Safety in Mental Health Support [15.22008156903607]
本稿では,支援者に対する肯定的な影響を優先する理論的かつ現実的な分類法を開発することを目的とする。
我々は、BERTベース、RoBERTa-large、ChatGPTなど、人気のある言語モデルを用いてデータセットを分析する。
開発されたデータセットと研究結果は、メンタルヘルスサポートにおける対話安全性の研究を進めるための貴重なベンチマークとなる。
論文 参考訳(メタデータ) (2023-07-31T07:33:16Z) - SuperDialseg: A Large-scale Dataset for Supervised Dialogue Segmentation [55.82577086422923]
文書地上対話の助けを借りて,対話のセグメンテーションポイントを実現可能な定義を提供する。
我々は,9,478の対話を含むSuperDialsegと呼ばれる大規模教師付きデータセットをリリースする。
また、対話セグメンテーションタスクの5つのカテゴリにまたがる18のモデルを含むベンチマークも提供する。
論文 参考訳(メタデータ) (2023-05-15T06:08:01Z) - SPACE-2: Tree-Structured Semi-Supervised Contrastive Pre-training for
Task-Oriented Dialog Understanding [68.94808536012371]
本稿では,限定ラベル付きダイアログと大規模未ラベルダイアログコーパスから対話表現を学習する,木構造付き事前学習会話モデルを提案する。
提案手法は,7つのデータセットと4つの一般的な対話理解タスクからなるDialoGLUEベンチマークにおいて,最新の結果が得られる。
論文 参考訳(メタデータ) (2022-09-14T13:42:50Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - Graph Based Network with Contextualized Representations of Turns in
Dialogue [0.0]
対話に基づく関係抽出(RE)は、対話に現れる2つの引数間の関係を抽出することを目的としている。
本稿では,対話の理解方法に着目したTUCORE-GCN(TUrn Context aware Graph Convolutional Network)を提案する。
論文 参考訳(メタデータ) (2021-09-09T03:09:08Z) - Persuasive Dialogue Understanding: the Baselines and Negative Results [27.162062321321805]
本研究では,コンディショナルランダムフィールド(CRF)と組み合わされたトランスフォーマーベースのアプローチの限界を,説得的戦略認識の課題として示す。
話者間および話者内コンテキストセマンティックな特徴とラベル依存を利用して認識を改善する。
論文 参考訳(メタデータ) (2020-11-19T16:52:43Z) - Exploiting Unsupervised Data for Emotion Recognition in Conversations [76.01690906995286]
会話における感情認識(Emotion Recognition in Conversations:ERC)は、会話における話者の感情状態を予測することを目的としている。
ERCタスクの教師付きデータは限られている。
教師なし会話データを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-02T13:28:47Z) - TOD-BERT: Pre-trained Natural Language Understanding for Task-Oriented
Dialogue [113.45485470103762]
本研究では,言語モデリングのためのタスク指向対話データセットを,人間とマルチターンの9つに統合する。
事前学習時の対話動作をモデル化するために,ユーザトークンとシステムトークンをマスク付き言語モデルに組み込む。
論文 参考訳(メタデータ) (2020-04-15T04:09:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。