論文の概要: REDDIX-NET: A Novel Dataset and Benchmark for Moderating Online Explicit Services
- arxiv url: http://arxiv.org/abs/2505.23231v1
- Date: Thu, 29 May 2025 08:34:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.761136
- Title: REDDIX-NET: A Novel Dataset and Benchmark for Moderating Online Explicit Services
- Title(参考訳): REDDIX-NET: オンライン明示的なサービスのモデレーションのための新しいデータセットとベンチマーク
- Authors: MSVPJ Sathvik, Manan Roy Choudhury, Rishita Agarwal, Sathwik Narkedimilli, Vivek Gupta,
- Abstract要約: REDDIX-NETは、オンライン性サービスのモデレーションに特化した新しいベンチマークデータセットである。
このデータセットは、Reddit上の何千ものウェブスクラッドNSFWポストから派生したものだ。
我々は最先端の大規模言語モデルの分類性能を評価する。
- 参考スコア(独自算出の注目度): 5.212078389585781
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The rise of online platforms has enabled covert illicit activities, including online prostitution, to pose challenges for detection and regulation. In this study, we introduce REDDIX-NET, a novel benchmark dataset specifically designed for moderating online sexual services and going beyond traditional NSFW filters. The dataset is derived from thousands of web-scraped NSFW posts on Reddit and categorizes users into six behavioral classes reflecting different service offerings and user intentions. We evaluate the classification performance of state-of-the-art large language models (GPT-4, LlaMA 3.3-70B-Instruct, Gemini 1.5 Flash, Mistral 8x7B, Qwen 2.5 Turbo, Claude 3.5 Haiku) using advanced quantitative metrics, finding promising results with models like GPT-4 and Gemini 1.5 Flash. Beyond classification, we conduct sentiment and comment analysis, leveraging LLM and PLM-based approaches and metadata extraction to uncover behavioral and temporal patterns. These analyses reveal peak engagement times and distinct user interaction styles across categories. Our findings provide critical insights into AI-driven moderation and enforcement, offering a scalable framework for platforms to combat online prostitution and associated harms.
- Abstract(参考訳): オンラインプラットフォームの台頭は、オンライン売春を含む違法行為を隠蔽し、検知と規制の課題を提起している。
本研究では,オンライン性サービスをモデレートし,従来のNSFWフィルタを超えることを目的とした,新しいベンチマークデータセットREDDIX-NETを紹介する。
このデータセットはReddit上の何千ものウェブスクラッドなNSFW投稿から派生したもので、ユーザを異なるサービス提供やユーザの意図を反映した6つの行動クラスに分類する。
GPT-4, LlaMA 3.3-70B-インストラクト, Gemini 1.5 Flash, Mistral 8x7B, Qwen 2.5 Turbo, Claude 3.5 Haiku の分類性能を, 高度な定量的指標を用いて評価し, GPT-4 や Gemini 1.5 Flash などのモデルで有望な結果が得られた。
分類以外にも、LCMとPLMに基づくアプローチとメタデータ抽出を利用して感情分析やコメント分析を行い、行動パターンや時間パターンを明らかにする。
これらの分析により、ピークエンゲージメント時間とカテゴリ間で異なるユーザインタラクションスタイルが明らかになった。
我々の発見は、AIによるモデレーションと執行に関する重要な洞察を与え、プラットフォームがオンライン売春と関連する害と戦うためのスケーラブルなフレームワークを提供する。
関連論文リスト
- Towards Realistic Evaluation of Commit Message Generation by Matching Online and Offline Settings [77.20838441870151]
オンラインメトリック - VCSに生成されたメッセージをコミットする前にユーザが導入する編集回数 - を使用して、オフライン実験用のメトリクスを選択します。
我々は,GPT-4が生成したコミットメッセージと,人間の専門家が編集したコミットメッセージからなる57対のデータセットを収集した。
以上の結果から,編集距離が最も高い相関性を示すのに対し,BLEUやMETEORなどの類似度は低い相関性を示すことがわかった。
論文 参考訳(メタデータ) (2024-10-15T20:32:07Z) - Re-examining Sexism and Misogyny Classification with Annotator Attitudes [9.544313152137262]
Gender-Based Violence(GBV)はオンライン上の問題だが、既存のデータセットでは複数の可能なアノテータの視点をキャプチャできない。
我々はGBVのモデレーションパイプラインにおいて,(1)手動データラベリング,(2)自動分類の2つの重要な段階を再考する。
論文 参考訳(メタデータ) (2024-10-04T15:57:58Z) - Generative Pre-trained Ranking Model with Over-parameterization at Web-Scale (Extended Abstract) [73.57710917145212]
ランク付け学習は、入力クエリに基づいて関連するWebページを優先順位付けするために、Web検索で広く使われている。
本稿では,これらの課題に対処するために,経験的 UlineSemi-uline Supervised ulinePre-trained (GS2P) モデルを提案する。
我々は,公開データセットと大規模検索エンジンから収集した実世界のデータセットの両方に対して,大規模なオフライン実験を行う。
論文 参考訳(メタデータ) (2024-09-25T03:39:14Z) - Understanding the performance gap between online and offline alignment algorithms [63.137832242488926]
オフラインのアルゴリズムは、ペアの分類が得意になるようにポリシーを訓練し、オンラインのアルゴリズムは世代ごとに良いことを示しています。
このことは、識別能力と生成能力の間のユニークな相互作用を示唆しており、これはサンプリングプロセスに大きく影響している。
我々の研究は、AIアライメントにおけるオンラインサンプリングの重要な役割に光を当て、オフラインアライメントアルゴリズムのある種の根本的な課題を示唆している。
論文 参考訳(メタデータ) (2024-05-14T09:12:30Z) - Phishing Website Detection through Multi-Model Analysis of HTML Content [0.0]
本研究では,HTMLコンテンツに着目した高度な検出モデルを導入することにより,フィッシングのプレス問題に対処する。
提案手法は、構造化表データのための特殊多層パーセプトロン(MLP)モデルと、テキストの特徴を解析するための2つの事前学習自然言語処理(NLP)モデルを統合する。
2つのNLPと1つのモデルであるMultiText-LPの融合により、96.80 F1スコアと97.18精度スコアが得られた。
論文 参考訳(メタデータ) (2024-01-09T21:08:13Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Avoid Adversarial Adaption in Federated Learning by Multi-Metric
Investigations [55.2480439325792]
Federated Learning(FL)は、分散機械学習モデルのトレーニング、データのプライバシの保護、通信コストの低減、多様化したデータソースによるモデルパフォーマンスの向上を支援する。
FLは、中毒攻撃、標的外のパフォーマンス劣化とターゲットのバックドア攻撃の両方でモデルの整合性を損なうような脆弱性に直面している。
我々は、複数の目的に同時に適応できる、強い適応的敵の概念を新たに定義する。
MESASは、実際のデータシナリオで有効であり、平均オーバーヘッドは24.37秒である。
論文 参考訳(メタデータ) (2023-06-06T11:44:42Z) - Detecting Online Hate Speech: Approaches Using Weak Supervision and
Network Embedding Models [2.3322477552758234]
本研究では,ヘイトフルユーザを定量的に発見する弱監督型深層学習モデルを提案する。
我々は、19.2Mの投稿において、我々のモデルを評価し、我々の弱い監督モデルは、間接的に憎悪的な相互作用を識別するベースラインモデルよりも優れていることを示す。
また,Gabにおける2種類のユーザインタラクション(引用と応答)と,弱監督モデルからのインタラクションスコアをエッジウェイトとして分析し,ヘイトフルユーザを予測する。
論文 参考訳(メタデータ) (2020-07-24T18:13:52Z) - Learning Diverse Fashion Collocation by Neural Graph Filtering [78.9188246136867]
本稿では,グラフニューラルネットワークを用いて,フレキシブルなファッションアイテムセットをモデル化する新しいファッションコロケーションフレームワークであるNeural Graph Filteringを提案する。
エッジベクトルに対称演算を適用することにより、このフレームワークは様々な入力/出力を許容し、それらの順序に不変である。
提案手法を,Polyvoreデータセット,Polyvore-Dデータセット,Amazon Fashionデータセットの3つの一般的なベンチマークで評価した。
論文 参考訳(メタデータ) (2020-03-11T16:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。