論文の概要: YZR-net : Self-supervised Hidden representations Invariant to
Transformations for profanity detection
- arxiv url: http://arxiv.org/abs/2211.15532v1
- Date: Tue, 22 Nov 2022 05:35:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-04 13:58:23.381503
- Title: YZR-net : Self-supervised Hidden representations Invariant to
Transformations for profanity detection
- Title(参考訳): YZR-net : 自己教師型隠蔽表現の代名詞検出のための変換に不変
- Authors: Vedant Sandeep Joshi and Sivanagaraja Tatinati and Yubo Wang
- Abstract要約: YZR-Netは、チャットで使われる挑発的な単語を堅牢に検出できる自己教師型フレームワークである。
我々の誇張検出フレームワークは言語に依存しておらず、英語だけでなく、翻訳されたHinglishでも乱用を処理できる。
- 参考スコア(独自算出の注目度): 1.0705399532413613
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: On current {\it e-}learning platforms, live classes are an important tool
that provides students with an opportunity to get more involved while learning
new concepts. In such classes, the element of interaction with teachers and
fellow peers helps in removing learning silos and gives each student a chance
to experience some aspects relevant to offline learning in this era of virtual
classes. One common way of interaction in a class is through the chats /
messaging framework, where the teacher can broadcast messages as well as get
instant feedback from the students in the live class. This freedom of
interaction is a crucial aspect for any student's learning growth but misuse of
it can have serious repercussions. Some miscreants use this framework to send
profane messages which can have a negative impact on other students as well as
the teacher of the class. These rare but high impact situations obviate the
need for automatic detection mechanisms that prevent the posting of such chats
on any platform. In this work we develop YZR-Net which is a self-supervised
framework that is able to robustly detect profane words used in a chat even if
the student tries to add clever modifications to fool the system. The matching
mechanism on token / word level allows us to maintain a compact as well as
dynamic profane vocabulary which can be updated without retraining the
underlying model. Our profanity detection framework is language independent and
can handle abuses in both English as well as its transliterated counterpart
Hinglish (Hindi language words written in English).
- Abstract(参考訳): 現在のe-}ラーニングプラットフォームでは、ライブクラスは学生に新しい概念を学習しながらより深く関与する機会を提供する重要なツールである。
このような授業では、教師や仲間との交流の要素が学習サイロを取り除き、各生徒がオフライン学習に関連するいくつかの側面を体験する機会を与える。
クラス内のインタラクションの一般的な方法のひとつは、チャット/メッセージングフレームワークを通じて、教師がメッセージをブロードキャストしたり、ライブクラスの学生からすぐにフィードバックを受け取ることができる。
この相互作用の自由は、学生の学習の成長にとって重要な側面であるが、その誤用は深刻な影響をもたらす可能性がある。
一部の誤解者は、このフレームワークを使って、他の生徒やクラスの教師に悪影響を及ぼすような、挑発的なメッセージを送る。
これらのまれながら高い影響の状況は、どのプラットフォームにもそのようなチャットが投稿されるのを防ぐ自動検出メカニズムの必要性を妨げる。
本研究では,学生がシステムを騙すために巧妙な修正を加えようとする場合でも,チャットで使用される冗長な単語を頑健に検出できる自己教師付きフレームワークであるyzr-netを開発した。
トークン/ワードレベルでのマッチング機構により、基礎となるモデルを再トレーニングすることなく更新可能な、コンパクトかつダイナミックな代名詞語彙を維持できる。
私たちのプロファニティ検出フレームワークは言語に依存しておらず、英語とhinglish(英語で書かれたヒンディー語)の両方で乱用を処理できます。
関連論文リスト
- A Piece of Theatre: Investigating How Teachers Design LLM Chatbots to
Assist Adolescent Cyberbullying Education [19.382793802653847]
大規模言語モデルと即時連鎖により,教師は対話フローのプロトタイプを作成できる。
調査の結果,教師が熱心にツールを歓迎していることが判明した。
彼らの目標は、学生が安全な環境でのサイバーいじめに対する望ましい反応と望ましくない反応の両方をリハーサルできるようにすることである。
論文 参考訳(メタデータ) (2024-02-27T12:27:51Z) - Curriculum-Driven Edubot: A Framework for Developing Language Learning Chatbots Through Synthesizing Conversational Data [23.168347070904318]
本稿では,チャットボットの対話的特徴と英語教科書の体系的素材を組み合わせたチャットボットを開発するためのフレームワークであるCurriculum-Driven EduBotを紹介する。
まず、教科書から関連するトピックを抽出し、大きな言語モデルを用いてこれらのトピックに関連する対話を生成する。
論文 参考訳(メタデータ) (2023-09-28T19:14:18Z) - ChatLLM Network: More brains, More intelligence [42.65167827451101]
本稿では,複数の対話型言語モデルと対話し,フィードバックを提供し,一緒に考えることができるChatLLMネットワークを提案する。
我々は,ネットワークが問題解決の大幅な改善を達成し,各メンバーの観測可能性の向上につながったことを示す。
論文 参考訳(メタデータ) (2023-04-24T08:29:14Z) - User Adaptive Language Learning Chatbots with a Curriculum [55.63893493019025]
語彙的に制約されたデコーディングをダイアログシステムに適用し、ダイアログシステムに対して、その生成した発話にカリキュラムに準拠した単語やフレーズを含めるよう促す。
評価の結果,カリキュラム注入によるダイアログシステムにより,対象語に対する生徒の理解が向上し,英語実践への関心が高まることが示された。
論文 参考訳(メタデータ) (2023-04-11T20:41:41Z) - Opportunities and Challenges in Neural Dialog Tutoring [54.07241332881601]
言語学習のための2つの対話学習データセットを用いて、様々な生成言語モデルを厳密に分析する。
現在のアプローチでは、制約のある学習シナリオでチューリングをモデル化できますが、制約の少ないシナリオではパフォーマンスが悪くなります。
人的品質評価では, モデルと接地木アノテーションの両方が, 同等のチュータリングの点で低い性能を示した。
論文 参考訳(メタデータ) (2023-01-24T11:00:17Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - A Study of Slang Representation Methods [3.511369967593153]
我々は,スラング理解に依存した様々な下流タスクに対して,表現学習モデルと知識資源の異なる組み合わせについて検討する。
誤り解析では、語彙外単語、多意味性、分散性、アノテーションの不一致など、スラング表現学習における中核的な課題を識別する。
論文 参考訳(メタデータ) (2022-12-11T21:56:44Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z) - Neural Multi-Task Learning for Teacher Question Detection in Online
Classrooms [50.19997675066203]
教師の音声記録から質問を自動的に検出するエンドツーエンドのニューラルネットワークフレームワークを構築している。
マルチタスク学習手法を取り入れることで,質問の種類によって意味的関係の理解を深めることが可能となる。
論文 参考訳(メタデータ) (2020-05-16T02:17:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。