論文の概要: Leveraging Self-Supervised Learning for Scene Classification in Child Sexual Abuse Imagery
- arxiv url: http://arxiv.org/abs/2403.01183v2
- Date: Sat, 26 Oct 2024 15:49:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:19:59.595037
- Title: Leveraging Self-Supervised Learning for Scene Classification in Child Sexual Abuse Imagery
- Title(参考訳): 児童性虐待画像におけるシーン分類のための自己監督学習の活用
- Authors: Pedro H. V. Valois, João Macedo, Leo S. F. Ribeiro, Jefersson A. dos Santos, Sandra Avila,
- Abstract要約: 毎年、1000万人以上の児童性的虐待の報告が全米少年・爆発児センターに提出されている。
80%以上はオンライン・ソースから来ている。
この研究は、シーン中心のデータに基づいて事前訓練された自己教師型ディープラーニングモデルが71.6%の精度に達することを示した。
- 参考スコア(独自算出の注目度): 7.47716232790068
- License:
- Abstract: Crime in the 21st century is split into a virtual and real world. However, the former has become a global menace to people's well-being and security in the latter. The challenges it presents must be faced with unified global cooperation, and we must rely more than ever on automated yet trustworthy tools to combat the ever-growing nature of online offenses. Over 10 million child sexual abuse reports are submitted to the US National Center for Missing \& Exploited Children every year, and over 80% originate from online sources. Therefore, investigation centers cannot manually process and correctly investigate all imagery. In light of that, reliable automated tools that can securely and efficiently deal with this data are paramount. In this sense, the scene classification task looks for contextual cues in the environment, being able to group and classify child sexual abuse data without requiring to be trained on sensitive material. The scarcity and limitations of working with child sexual abuse images lead to self-supervised learning, a machine-learning methodology that leverages unlabeled data to produce powerful representations that can be more easily transferred to downstream tasks. This work shows that self-supervised deep learning models pre-trained on scene-centric data can reach 71.6% balanced accuracy on our indoor scene classification task and, on average, 2.2 percentage points better performance than a fully supervised version. We cooperate with Brazilian Federal Police experts to evaluate our indoor classification model on actual child abuse material. The results demonstrate a notable discrepancy between the features observed in widely used scene datasets and those depicted on sensitive materials.
- Abstract(参考訳): 21世紀の犯罪は、仮想世界と実世界に分けられる。
しかし、後者は人々の幸福と安全に対する世界的な脅威となっている。
その課題は、グローバルな統一的な協力に直面する必要があり、オンライン犯罪の絶え間なく成長している性質に対処するためには、これまで以上に自動化され、信頼に値するツールに頼らなければならない。
毎年1000万人以上の児童性的虐待の報告が全米児童虐待センターに提出され、80%以上がオンラインソースから来ている。
したがって、調査センターは、手動で全ての画像の処理と正確な調査はできない。
それを踏まえて、このデータを安全かつ効率的に処理できる信頼性の高い自動化ツールが最重要である。
この意味では、シーン分類タスクは、環境における文脈的手がかりを求め、センシティブな素材で訓練されることなく、児童性的虐待データをグループ化し分類することができる。
子どもの性的虐待のイメージを扱うことの不足と限界は、ラベルのないデータを活用して、下流のタスクに簡単に移行できる強力な表現を生成する機械学習手法である、自己教師付き学習につながる。
本研究は、シーン中心のデータに基づいて事前学習した自己教師型ディープラーニングモデルが、室内シーン分類タスクにおいて71.6%の精度に達し、平均2.2%の精度で、完全に教師されたバージョンよりも優れた性能を示すことを示す。
我々はブラジル連邦警察の専門家と協力し、実際の児童虐待資料の屋内分類モデルを評価する。
その結果,広範に使用されているシーンデータセットと感性材料に表された特徴との間には,顕著な相違が認められた。
関連論文リスト
- Detecting sexually explicit content in the context of the child sexual abuse materials (CSAM): end-to-end classifiers and region-based networks [0.0]
子どもの性的虐待物質(CSAM)は、世界中の子供の安全と幸福を脅かす。
本研究は、CSAM自動検出システムにおいて重要な役割を担う性的な内容の分類方法を提案する。
論文 参考訳(メタデータ) (2024-06-20T09:21:08Z) - ChildDiffusion: Unlocking the Potential of Generative AI and Controllable Augmentations for Child Facial Data using Stable Diffusion and Large Language Models [1.1470070927586018]
この枠組みは、民族データ、微妙な表現、顔ポーズのバリエーション、目まき効果、異なる髪の色とスタイル、老化、複数と異なる子供の性別を単一のフレームでレンダリングすることによって検証される。
提案手法は、時間的不整合や出力の限られた制御など、生成AIツールで発生する一般的な問題を回避している。
論文 参考訳(メタデータ) (2024-06-17T14:37:14Z) - Harnessing the Power of Text-image Contrastive Models for Automatic
Detection of Online Misinformation [50.46219766161111]
誤情報識別の領域における構成的学習を探求する自己学習モデルを構築した。
本モデルでは、トレーニングデータが不十分な場合、非マッチング画像-テキストペア検出の優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-19T02:53:59Z) - Joint Person Identity, Gender and Age Estimation from Hand Images using Deep Multi-Task Representation Learning [0.0]
画像から人物の身元、性別、年齢を共同で推定するマルチタスク表現学習フレームワークを提案する。
公開可能な1kハンドデータセット上で,畳み込みベースと変圧器ベースの両方のディープラーニングアーキテクチャの評価と比較を行う。
実験により, 身元だけでなく, 被疑者の性別や年齢などの属性を手動画像から効率的に推定できることが示唆された。
論文 参考訳(メタデータ) (2023-03-27T14:52:08Z) - Choreographer: Learning and Adapting Skills in Imagination [60.09911483010824]
我々は、その世界モデルを利用して想像力のスキルを学び、適応するモデルベースのエージェントであるChoreographerを紹介する。
提案手法は探索とスキル学習のプロセスを切り離し,モデルの潜在状態空間におけるスキルの発見を可能にする。
Choreographerはオフラインデータからスキルを学ぶことができ、探索ポリシーと同時にデータを集めることができる。
論文 参考訳(メタデータ) (2022-11-23T23:31:14Z) - Applying Artificial Intelligence for Age Estimation in Digital Forensic
Investigations [0.8122270502556371]
調査員は画像を見て、性発達段階やその他の人間の特徴を解釈することで、被害者の年齢を決定する必要があることが多い。
本稿では、既存の顔画像データセットを評価し、類似のデジタル法医学研究貢献のニーズに合わせて、新しいデータセットを提案する。
新しいデータセットは、IMDB-WIKIデータセットで事前トレーニングされたDeep Expectation (DEX)アルゴリズムでテストされる。
論文 参考訳(メタデータ) (2022-01-09T16:25:37Z) - A machine learning pipeline for aiding school identification from child
trafficking images [3.8494315501944736]
本研究では,子どもをインターセプト画像から識別するための概念実証機械学習パイプラインを開発した。
機械学習パイプラインがなければ、この膨大な時間と労働集約的なタスクは、法執行機関の職員が手作業で実行されます。
データ収集,ラベル付け,モデル開発,検証プロセス,およびモデル予測を用いた効率的な学校探索戦略について述べる。
論文 参考訳(メタデータ) (2021-06-09T16:57:58Z) - Curious Representation Learning for Embodied Intelligence [81.21764276106924]
近年,自己指導型表現学習は顕著な成功を収めている。
しかし、真にインテリジェントなエージェントを構築するためには、環境から学習できる表現学習アルゴリズムを構築する必要がある。
本稿では,強化学習方針と視覚的表現モデルを同時に学習する,好奇心をそそる表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-03T17:59:20Z) - LID 2020: The Learning from Imperfect Data Challenge Results [242.86700551532272]
Imperfect Dataワークショップからの学習は、新しいアプローチの開発に刺激を与え、促進することを目的としている。
我々は、弱教師付き学習環境における最先端のアプローチを見つけるために、3つの課題を編成する。
この技術的レポートは、課題のハイライトを要約している。
論文 参考訳(メタデータ) (2020-10-17T13:06:12Z) - Deep Traffic Sign Detection and Recognition Without Target Domain Real
Images [52.079665469286496]
本稿では,ターゲットドメインからの実際の画像を必要としない新しいデータベース生成手法と,(ii)交通標識のテンプレートを提案する。
この方法は、実際のデータでトレーニングを克服することではなく、実際のデータが利用できない場合に互換性のある代替手段になることを目的としている。
大規模なデータセットでは、完全に合成されたデータセットによるトレーニングは、実際のデータセットとトレーニングのパフォーマンスにほぼ一致する。
論文 参考訳(メタデータ) (2020-07-30T21:06:47Z) - Circumventing Outliers of AutoAugment with Knowledge Distillation [102.25991455094832]
AutoAugmentは多くの視覚タスクの精度を向上させる強力なアルゴリズムである。
本論文は作業機構を深く掘り下げ,AutoAugmentがトレーニング画像から識別情報の一部を除去できることを明らかにする。
教師モデルの出力に言及した知識蒸留を用いて,ネットワークトレーニングの指導を行う。
論文 参考訳(メタデータ) (2020-03-25T11:51:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。