論文の概要: On the Challenges of Creating Datasets for Analyzing Commercial Sex Advertisements to Assess Human Trafficking Risk and Organized Activity
- arxiv url: http://arxiv.org/abs/2405.13348v1
- Date: Wed, 22 May 2024 05:10:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-25 01:24:25.586250
- Title: On the Challenges of Creating Datasets for Analyzing Commercial Sex Advertisements to Assess Human Trafficking Risk and Organized Activity
- Title(参考訳): 人身売買リスクと組織活動を評価するための商業性情報分析のためのデータセット作成の課題
- Authors: Pablo Rivas, Tomas Cerny, Alejandro Rodriguez Perez, Javier Turek, Laurie Giddens, Gisela Bichler, Stacie Petter,
- Abstract要約: 本研究は、商業性広告を通じて、組織的活動や人身売買に関連するリスクを理解するためにデータセットを構築することの課題に対処する。
自動化されておらず、再現が難しい従来のアプローチは、これらの問題に対処するのに不足しています。
我々は,500万件の広告を再現可能かつ自動で分析する手法を開発した。
- 参考スコア(独自算出の注目度): 37.47883671323525
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our study addresses the challenges of building datasets to understand the risks associated with organized activities and human trafficking through commercial sex advertisements. These challenges include data scarcity, rapid obsolescence, and privacy concerns. Traditional approaches, which are not automated and are difficult to reproduce, fall short in addressing these issues. We have developed a reproducible and automated methodology to analyze five million advertisements. In the process, we identified further challenges in dataset creation within this sensitive domain. This paper presents a streamlined methodology to assist researchers in constructing effective datasets for combating organized crime, allowing them to focus on advancing detection technologies.
- Abstract(参考訳): 本研究は、商業性広告を通じて、組織的活動や人身売買に関連するリスクを理解するためにデータセットを構築することの課題に対処する。
これらの課題には、データの不足、迅速な陳腐化、プライバシの懸念などが含まれる。
自動化されておらず、再現が難しい従来のアプローチは、これらの問題に対処するのに不足しています。
我々は,500万件の広告を再現可能かつ自動で分析する手法を開発した。
このプロセスでは、このセンシティブなドメイン内でデータセットを作成する際のさらなる課題を特定した。
本稿では,研究者が組織犯罪と戦うための効果的なデータセットの構築を支援し,検出技術の進歩に焦点を合わせるための合理化手法を提案する。
関連論文リスト
- Safeguarding Marketing Research: The Generation, Identification, and Mitigation of AI-Fabricated Disinformation [0.26107298043931204]
生成AIは、人間のコントリビューションを忠実に模倣するコンテンツを生成する能力を確立している。
これらのモデルは、世論の操作や認識の歪曲に利用することができ、結果としてデジタルプラットフォームに対する信頼が低下する。
本研究は,マーケティング文献と実践に3つの方法で貢献する。
論文 参考訳(メタデータ) (2024-03-17T13:08:28Z) - Root causes, ongoing difficulties, proactive prevention techniques, and emerging trends of enterprise data breaches [0.0]
今や企業は、データが重要な資産であると考えており、このデータに侵入しても、ひどい影響が生じる可能性がある。
今や企業は、データ量の増加とデータ漏洩の頻度の増加によるデータ損失の検出と防止に高いプレミアムを課している。
このレビューは、興味深い見通しを強調し、企業がデータ漏洩から直面するリスクについて学ぶことに興味がある人に洞察力のある情報を提供しようとしている。
論文 参考訳(メタデータ) (2023-11-27T20:34:10Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - TII-SSRC-23 Dataset: Typological Exploration of Diverse Traffic Patterns
for Intrusion Detection [0.5261718469769447]
既存のデータセットは、しばしば不足しており、必要な多様性と現在のネットワーク環境との整合性が欠如している。
本稿では,これらの課題を克服するための新しい包括的データセットであるTII-SSRC-23を紹介する。
論文 参考訳(メタデータ) (2023-09-14T05:23:36Z) - Embrace Limited and Imperfect Training Datasets: Opportunities and
Challenges in Plant Disease Recognition Using Deep Learning [5.526950086166696]
貧弱なデータセットを受け入れることは可能であり、これらのデータセットの使用に伴う課題を明確に定義することを目的としています。
我々は植物病の認識に重点を置いているが、貧しいデータセットの受け入れと分析の原則は農業を含む幅広い分野に適用可能であることを強調している。
論文 参考訳(メタデータ) (2023-05-19T08:58:09Z) - An Ethical Highlighter for People-Centric Dataset Creation [62.886916477131486]
本稿では,既存のデータセットの倫理的評価を導くための分析フレームワークを提案する。
我々の研究は、先行研究のレビューと分析によって知らされ、そのような倫理的課題が生じる場所を強調します。
論文 参考訳(メタデータ) (2020-11-27T07:18:44Z) - Batch Exploration with Examples for Scalable Robotic Reinforcement
Learning [63.552788688544254]
BEE(Batch Exploration with Examples)は、重要状態の画像の少ない数の人間がガイドする状態空間の関連領域を探索する。
BEEは、シミュレーションと本物のフランカロボットの両方で、視覚ベースの操作に挑戦することができる。
論文 参考訳(メタデータ) (2020-10-22T17:49:25Z) - Survey of Network Intrusion Detection Methods from the Perspective of
the Knowledge Discovery in Databases Process [63.75363908696257]
本稿では,侵入検知器の開発を目的として,ネットワークデータに適用された手法について概説する。
本稿では,データのキャプチャ,準備,変換,データマイニング,評価などの手法について論じる。
この文献レビューの結果、ネットワークセキュリティ分野のさらなる研究のために考慮すべきいくつかのオープンな問題について検討する。
論文 参考訳(メタデータ) (2020-01-27T11:21:05Z) - Deep Learning for Sensor-based Human Activity Recognition: Overview,
Challenges and Opportunities [52.59080024266596]
本稿では,センサを用いた人間の活動認識のための最先端のディープラーニング手法について調査する。
まず、官能データのマルチモーダリティを導入し、公開データセットに情報を提供する。
次に、課題によって深層メソッドを構築するための新しい分類法を提案する。
論文 参考訳(メタデータ) (2020-01-21T09:55:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。