論文の概要: Objects of violence: synthetic data for practical ML in human rights
investigations
- arxiv url: http://arxiv.org/abs/2004.01030v1
- Date: Wed, 1 Apr 2020 14:50:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 18:21:03.285421
- Title: Objects of violence: synthetic data for practical ML in human rights
investigations
- Title(参考訳): 暴力の対象:人権調査における実践的MLのための合成データ
- Authors: Lachlan Kermode, Jan Freyberg, Alican Akturk, Robert Trafford, Denis
Kochetkov, Rafael Pardinas, Eyal Weizman, and Julien Cornebise
- Abstract要約: 我々は、弾薬、武器、軍事機器の映像や映像を検索し、識別し、有意義にトリアージする機械学習ワークフローを導入する。
このワークフローは、人権調査におけるOSINT(オープンソースインテリジェンス)研究者の仕事の迅速化を目的として設計されている。
- 参考スコア(独自算出の注目度): 2.178235115067506
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a machine learning workflow to search for, identify, and
meaningfully triage videos and images of munitions, weapons, and military
equipment, even when limited training data exists for the object of interest.
This workflow is designed to expedite the work of OSINT ("open source
intelligence") researchers in human rights investigations. It consists of three
components: automatic rendering and annotating of synthetic datasets that make
up for a lack of training data; training image classifiers from combined sets
of photographic and synthetic data; and mtriage, an open source software that
orchestrates these classifiers' deployment to triage public domain media, and
visualise predictions in a web interface. We show that synthetic data helps to
train classifiers more effectively, and that certain approaches yield better
results for different architectures. We then demonstrate our workflow in two
real-world human rights investigations: the use of the Triple-Chaser tear gas
grenade against civilians, and the verification of allegations of military
presence in Ukraine in 2014.
- Abstract(参考訳): 興味のある対象に限られた訓練データが存在する場合でも、軍需品、武器、軍需品の映像や映像を検索、識別し、有意義にトリアージする機械学習ワークフローを導入する。
このワークフローは、人権調査におけるOSINT(オープンソースインテリジェンス)の研究を迅速化するように設計されている。
トレーニングデータの欠如を補う合成データセットの自動レンダリングと注釈付け、写真と合成データの組み合わせから画像分類器を訓練する、そしてこれらの分類器が公開ドメインメディアをトリアージするためのデプロイをオーケストレーションするオープンソースソフトウェアであるmtriage、Webインターフェースでの予測を視覚化する3つのコンポーネントで構成されている。
合成データは、分類器をより効果的に訓練し、あるアプローチが異なるアーキテクチャに対してより良い結果をもたらすことを示す。
我々は、市民に対する三段式催涙ガスグレネードの使用と、2014年のウクライナにおける軍事的存在の疑惑の検証という2つの実世界の人権調査で、我々のワークフローを実証した。
関連論文リスト
- Synatra: Turning Indirect Knowledge into Direct Demonstrations for Digital Agents at Scale [97.21851531607811]
LLMは、デジタル環境と対話し、特定の目的を完遂する自律エージェントとして機能する。
デジタルタスクに対する大規模な直接的なデモが欠如していることもあって、正確性はまだ十分ではない。
我々は、この間接的な知識を大規模に直接監督するアプローチであるSynatraを提案する。
論文 参考訳(メタデータ) (2024-09-24T00:51:45Z) - Improving Object Detector Training on Synthetic Data by Starting With a Strong Baseline Methodology [0.14980193397844666]
本稿では,合成データを用いた学習における事前学習対象検出器の性能向上手法を提案する。
提案手法は,実画像の事前学習から得られた有用な特徴を忘れずに,合成データから有能な情報を抽出することに焦点を当てる。
論文 参考訳(メタデータ) (2024-05-30T08:31:01Z) - A survey of synthetic data augmentation methods in computer vision [0.0]
本稿では,合成データ拡張技術について概観する。
我々は、重要なデータ生成と拡張技術、アプリケーション全般の範囲、および特定のユースケースに焦点を当てる。
コンピュータビジョンモデルをトレーニングするための一般的な合成データセットの要約を提供する。
論文 参考訳(メタデータ) (2024-03-15T07:34:08Z) - Data-Independent Operator: A Training-Free Artifact Representation
Extractor for Generalizable Deepfake Detection [105.9932053078449]
本研究では,より一般的な人工物表現を捉えるのに,小型かつトレーニング不要なフィルタが十分であることを示す。
トレーニングソースとテストソースの両方に不偏があるため、未確認ソースに対して魅力的な改善を実現するために、Data-Independent Operator (DIO)と定義する。
我々の検出器は13.3%の大幅な改善を実現し、新しい最先端の性能を確立した。
論文 参考訳(メタデータ) (2024-03-11T15:22:28Z) - Learning Human Action Recognition Representations Without Real Humans [66.61527869763819]
そこで本研究では,仮想人間を含む合成データを用いて,実世界の映像を活用してモデルを事前学習するベンチマークを提案する。
次に、このデータに基づいて学習した表現を、下流行動認識ベンチマークの様々なセットに転送可能であるかを評価する。
私たちのアプローチは、以前のベースラインを最大5%上回ります。
論文 参考訳(メタデータ) (2023-11-10T18:38:14Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - Human-Centric Multimodal Machine Learning: Recent Advances and Testbed
on AI-based Recruitment [66.91538273487379]
人間中心のアプローチでAIアプリケーションを開発する必要性には、ある程度のコンセンサスがある。
i)ユーティリティと社会的善、(ii)プライバシとデータ所有、(iii)透明性と説明責任、(iv)AIによる意思決定プロセスの公正性。
異種情報ソースに基づく現在のマルチモーダルアルゴリズムは、データ中の機密要素や内部バイアスによってどのように影響を受けるかを検討する。
論文 参考訳(メタデータ) (2023-02-13T16:44:44Z) - Learning Visualization Policies of Augmented Reality for Human-Robot
Collaboration [5.400491728405083]
人間とロボットのコラボレーション領域では、拡張現実(AR)技術により、ロボットの状態を視覚化することができる。
現在のARベースの可視化ポリシーは手作業で設計されており、多くの人的努力とドメイン知識が必要です。
VARILと呼ばれるフレームワークを開発し、ARエージェントがデモから可視化ポリシーを学習できるようにする。
論文 参考訳(メタデータ) (2022-11-13T22:03:20Z) - Label-Free Synthetic Pretraining of Object Detectors [67.17371526567325]
そこで本稿では,SOLID(Synthetic Optimization layout with Instance Detection)という新しい手法を提案する。
筆者らのSOLIDアプローチは,(1)シーンアレンジメントを最適化した非ラベルの3Dモデルを用いた合成画像の生成,(2)"インスタンス検出"タスクにおけるオブジェクト検出の事前学習,の2つの主要コンポーネントから構成される。
当社のアプローチでは,事前学習のためのセマンティックラベルは必要とせず,任意の3Dモデルを使用することが可能である。
論文 参考訳(メタデータ) (2022-08-08T16:55:17Z) - Training Data Augmentation for Deep Learning Radio Frequency Systems [1.1199585259018459]
この研究は、トレーニング中に使用されるデータに焦点を当てている。
一般に、検査されたデータ型はそれぞれ、最終アプリケーションに有用なコントリビューションを持っている。
キャプチャーデータの利点にもかかわらず、ライブコレクションから生じる困難さとコストは、ピークパフォーマンスを達成するのに必要なデータ量を非現実的にすることが多い。
論文 参考訳(メタデータ) (2020-10-01T02:26:16Z) - Visual Imitation Made Easy [102.36509665008732]
本稿では,ロボットへのデータ転送を容易にしながら,データ収集プロセスを単純化する,模倣のための代替インターフェースを提案する。
我々は、データ収集装置やロボットのエンドエフェクターとして、市販のリーチ・グラブラー補助具を使用する。
我々は,非包括的プッシュと包括的積み重ねという2つの課題について実験的に評価した。
論文 参考訳(メタデータ) (2020-08-11T17:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。