論文の概要: An Innovative Tool for Uploading/Scraping Large Image Datasets on Social
Networks
- arxiv url: http://arxiv.org/abs/2311.09237v1
- Date: Wed, 1 Nov 2023 23:27:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-19 14:06:18.582827
- Title: An Innovative Tool for Uploading/Scraping Large Image Datasets on Social
Networks
- Title(参考訳): ソーシャルネットワーク上の大規模画像データセットのアップロード・スクラッピングのためのイノベーティブツール
- Authors: Nicol\`o Fabio Arceri, Oliver Giudice, Sebastiano Battiato
- Abstract要約: 我々は、意図的に作成したデジタルツールを用いて、自動化されたアプローチを提案する。
このツールは、画像データセット全体を希望するデジタルプラットフォームに自動的にアップロードし、アップロードされたすべての写真をダウンロードすることができる。
- 参考スコア(独自算出の注目度): 9.27070946719462
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Nowadays, people can retrieve and share digital information in an
increasingly easy and fast fashion through the well-known digital platforms,
including sensitive data, inappropriate or illegal content, and, in general,
information that might serve as probative evidence in court. Consequently, to
assess forensics issues, we need to figure out how to trace back to the posting
chain of a digital evidence (e.g., a picture, an audio) throughout the involved
platforms -- this is what Digital (also Forensics) Ballistics basically deals
with. With the entry of Machine Learning as a tool of the trade in many
research areas, the need for vast amounts of data has been dramatically
increasing over the last few years. However, collecting or simply find the
"right" datasets that properly enables data-driven research studies can turn
out to be not trivial in some cases, if not extremely challenging, especially
when it comes with highly specialized tasks, such as creating datasets analyzed
to detect the source media platform of a given digital media. In this paper we
propose an automated approach by means of a digital tool that we created on
purpose. The tool is capable of automatically uploading an entire image dataset
to the desired digital platform and then downloading all the uploaded pictures,
thus shortening the overall time required to output the final dataset to be
analyzed.
- Abstract(参考訳): 今日では、センシティブなデータ、不適切なコンテンツ、あるいは違法コンテンツ、そして一般的には、法廷で証拠となる可能性のある情報など、よく知られたデジタルプラットフォームを通じて、デジタル情報をますます簡単かつ迅速に検索し、共有することができる。
したがって、法医学的問題を評価するには、関連するプラットフォーム全体にわたってデジタル証拠(例えば、写真、音声)のポストチェーンに遡る方法を見出す必要があります。
多くの研究分野における取引のツールとしての機械学習の導入により、過去数年間で膨大なデータの必要性が劇的に増加してきた。
しかし、データ駆動の研究を適切に行う「正しい」データセットを収集または見つけることは、ある場合において自明ではないことが判明する。特に、あるデジタルメディアのソースメディアプラットフォームを検出するために分析されたデータセットを作成するといった、高度に専門化されたタスクの場合、極めて困難ではない。
本稿では、私たちが意図的に作成したデジタルツールを用いて自動アプローチを提案する。
このツールは、画像データセット全体を希望するデジタルプラットフォームに自動的にアップロードし、アップロードされたすべての画像をダウンロードすることで、分析対象のデータセットを出力するために必要な全体の時間を短縮することができる。
関連論文リスト
- Harnessing the Power of Text-image Contrastive Models for Automatic
Detection of Online Misinformation [50.46219766161111]
誤情報識別の領域における構成的学習を探求する自己学習モデルを構築した。
本モデルでは、トレーニングデータが不十分な場合、非マッチング画像-テキストペア検出の優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-19T02:53:59Z) - Digital Twin Tracking Dataset (DTTD): A New RGB+Depth 3D Dataset for
Longer-Range Object Tracking Applications [3.9776693020673677]
デジタルツイン(Digital twin)は、実際のオブジェクトをデジタルオブジェクトで拡張する問題である。
優れたデジタルツインシステムにおける重要なコンポーネントは、リアルタイムで正確な3Dオブジェクト追跡である。
この研究で、Digital Twin Tracking dataset(DTTD)と呼ばれる新しいRGB-Dデータセットを作成します。
論文 参考訳(メタデータ) (2023-02-12T20:06:07Z) - Fighting Malicious Media Data: A Survey on Tampering Detection and
Deepfake Detection [115.83992775004043]
近年のディープラーニング、特に深層生成モデルの発展により、知覚的に説得力のある画像や動画を低コストで制作するための扉が開かれた。
本稿では,現在のメディアタンパリング検出手法を概観し,今後の研究の課題と動向について論じる。
論文 参考訳(メタデータ) (2022-12-12T02:54:08Z) - Synthetic Data for Object Classification in Industrial Applications [53.180678723280145]
オブジェクト分類では、オブジェクトごとに、異なる条件下で、多数の画像を取得することは必ずしも不可能である。
本研究は,学習データセット内の限られたデータに対処するゲームエンジンを用いた人工画像の作成について検討する。
論文 参考訳(メタデータ) (2022-12-09T11:43:04Z) - Comprehensive Dataset of Face Manipulations for Development and
Evaluation of Forensic Tools [0.6091702876917281]
我々は、デジタルメディアの真正性に対処し、分類するための新しいアプローチを開発する研究コミュニティを支援するために、編集された顔画像のデータセットを作成する。
データセットの目標は,次の課題に対処することである。(1) 与えられた画像の真正性(編集検出)を決定することは可能か?
我々の期待は、これらの課題にかかわる画像鑑定の最先端を改善するために、我々の準備された評価プロトコルが、研究者に役立ちます。
論文 参考訳(メタデータ) (2022-08-24T21:17:28Z) - CapillaryX: A Software Design Pattern for Analyzing Medical Images in
Real-time using Deep Learning [0.688204255655161]
本稿では,医療画像のリアルタイム解析をローカルかつ並列に行うことができる計算アーキテクチャを提案する。
我々は,微小循環画像中の血管の定量化という,特定の医学・工業ケーススタディに焦点を当てた。
その結果,本システムはシリアルシステムに比べて約78%高速であり,マスタスレーブ並列システムアーキテクチャよりも12%高速であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T18:47:04Z) - Automatic Image Content Extraction: Operationalizing Machine Learning in
Humanistic Photographic Studies of Large Visual Archives [81.88384269259706]
本稿では,機械学習による大規模画像アーカイブの検索と解析のための自動画像コンテンツ抽出フレームワークを提案する。
提案する枠組みは、人文科学と社会科学のいくつかの分野に適用できる。
論文 参考訳(メタデータ) (2022-04-05T12:19:24Z) - Automated Artefact Relevancy Determination from Artefact Metadata and
Associated Timeline Events [7.219077740523683]
ケースハンダーで、多年にわたるデジタル法医学的証拠バックログは、世界中の法執行機関で一般的になっている。
これは、デジタル法医学的な調査を必要とするケースが、ケースごとに処理されるデータの量の増加と相まって増え続けているためである。
以前に処理されたデジタル法医学ケースとそれらのコンポーネントのアーティファクト関連性分類を活用することは、自動化された人工知能ベースのエビデンス処理システムのトレーニングの機会を促進することができる。
論文 参考訳(メタデータ) (2020-12-02T14:14:26Z) - Deep Traffic Sign Detection and Recognition Without Target Domain Real
Images [52.079665469286496]
本稿では,ターゲットドメインからの実際の画像を必要としない新しいデータベース生成手法と,(ii)交通標識のテンプレートを提案する。
この方法は、実際のデータでトレーニングを克服することではなく、実際のデータが利用できない場合に互換性のある代替手段になることを目的としている。
大規模なデータセットでは、完全に合成されたデータセットによるトレーニングは、実際のデータセットとトレーニングのパフォーマンスにほぼ一致する。
論文 参考訳(メタデータ) (2020-07-30T21:06:47Z) - From ImageNet to Image Classification: Contextualizing Progress on
Benchmarks [99.19183528305598]
ImageNet作成プロセスにおける特定の設計選択が、結果のデータセットの忠実性に与える影響について検討する。
私たちの分析では、ノイズの多いデータ収集パイプラインが、結果のベンチマークと、それがプロキシとして機能する実世界のタスクとの間に、体系的なミスアライメントをもたらす可能性があることを指摘しています。
論文 参考訳(メタデータ) (2020-05-22T17:39:16Z) - A Feature Comparison of Modern Digital Forensic Imaging Software [0.0]
ディスクイメージングなどのデジタル法医学研究の基本過程は,デジタル調査が比較的若い頃に開発された。
現在のデジタル調査の弱点は,ソフトウェア開発とメンテナンスの時間とともに明らかになっている。
論文 参考訳(メタデータ) (2020-01-02T02:42:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。