論文の概要: OOWL500: Overcoming Dataset Collection Bias in the Wild
- arxiv url: http://arxiv.org/abs/2108.10992v1
- Date: Tue, 24 Aug 2021 23:22:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-26 22:04:17.068075
- Title: OOWL500: Overcoming Dataset Collection Bias in the Wild
- Title(参考訳): OOWL500: ワイルドなデータセットコレクションバイアスを克服する
- Authors: Brandon Leung, Chih-Hui Ho, Amir Persekian, David Orozco, Yen Chang,
Erik Sandstrom, Bo Liu, Nuno Vasconcelos
- Abstract要約: オンラインで収集された画像データセットは、偏見のあるオブジェクト認識を生成できるという仮説が研究されている。
新たな"in the lab"データ収集インフラストラクチャが提案されている。
安価で容易に複製できる性質は、ビジョンコミュニティによるスケーラブルなデータ収集の取り組みにつながる可能性もあります。
- 参考スコア(独自算出の注目度): 45.494056340200956
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The hypothesis that image datasets gathered online "in the wild" can produce
biased object recognizers, e.g. preferring professional photography or certain
viewing angles, is studied. A new "in the lab" data collection infrastructure
is proposed consisting of a drone which captures images as it circles around
objects. Crucially, the control provided by this setup and the natural camera
shake inherent to flight mitigate many biases. It's inexpensive and easily
replicable nature may also potentially lead to a scalable data collection
effort by the vision community. The procedure's usefulness is demonstrated by
creating a dataset of Objects Obtained With fLight (OOWL). Denoted as OOWL500,
it contains 120,000 images of 500 objects and is the largest "in the lab" image
dataset available when both number of classes and objects per class are
considered. Furthermore, it has enabled several of new insights on object
recognition. First, a novel adversarial attack strategy is proposed, where
image perturbations are defined in terms of semantic properties such as camera
shake and pose. Indeed, experiments have shown that ImageNet has considerable
amounts of pose and professional photography bias. Second, it is used to show
that the augmentation of in the wild datasets, such as ImageNet, with in the
lab data, such as OOWL500, can significantly decrease these biases, leading to
object recognizers of improved generalization. Third, the dataset is used to
study questions on "best procedures" for dataset collection. It is revealed
that data augmentation with synthetic images does not suffice to eliminate in
the wild datasets biases, and that camera shake and pose diversity play a more
important role in object recognition robustness than previously thought.
- Abstract(参考訳): 画像データセットがオンラインで「野生」に集められたという仮説は、例えばバイアスのあるオブジェクト認識を生成できる。
プロの撮影や特定の角度を好み、研究されている。
新たな"研究室内"データ収集インフラストラクチャは、オブジェクトを回りながら画像をキャプチャするドローンで構成されている。
重要なことに、この設定と自然なカメラによる制御は、飛行に固有の多くのバイアスを軽減する。
安価で容易に複製できる性質は、ビジョンコミュニティによるスケーラブルなデータ収集の取り組みにつながる可能性もあります。
このプロシージャの有用性は、fLight (OOWL)で達成されたオブジェクトのデータセットを作成することで実証される。
OOWL500 には 500 個のオブジェクトの 1220,000 イメージが含まれており,クラス単位のクラス数とオブジェクト数を考慮すれば,最大規模の "ラボ内" イメージデータセットである。
さらに、オブジェクト認識に関するいくつかの新しい洞察を可能にした。
まず,カメラの揺らぎやポーズなどのセマンティック特性の観点から,画像摂動を定義できる新たな対角攻撃戦略を提案する。
実際、実験の結果、ImageNetには相当量のポーズとプロの写真バイアスがあることがわかった。
第二に、ImageNetのような野生のデータセットとOOWL500のような実験データとの増大は、これらのバイアスを著しく減少させ、一般化を改善するオブジェクト認識に繋がることを示すために使われる。
第三に、データセットはデータセット収集の"ベストプロシージャ"に関する質問の研究に使用される。
合成画像によるデータ拡張は,野生のデータセットでバイアスを排除するには十分ではなく,カメラの揺動とポーズの多様性が従来考えられていたよりもオブジェクト認識の堅牢性において重要な役割を果たすことが明らかとなった。
関連論文リスト
- 360 in the Wild: Dataset for Depth Prediction and View Synthesis [66.58513725342125]
大規模な360$circ$ビデオデータセットを野放しに導入する。
このデータセットはインターネットから慎重に取り除かれ、世界中で様々な場所から収集されている。
データセットを構成する25K画像のそれぞれに、それぞれのカメラのポーズと深さマップが提供される。
論文 参考訳(メタデータ) (2024-06-27T05:26:38Z) - Retrieval Robust to Object Motion Blur [54.34823913494456]
本研究では,動きのぼやけの影響を受けやすい画像のオブジェクト検索手法を提案する。
ぼやけたオブジェクト検索のための最初の大規模データセットを提示する。
提案手法は,新しいぼやけた検索データセット上で,最先端の検索手法より優れている。
論文 参考訳(メタデータ) (2024-04-27T23:22:39Z) - Bugs in the Data: How ImageNet Misrepresents Biodiversity [98.98950914663813]
ImageNet-1k検証セットで野生動物を表す269のクラスから13450の画像を解析した。
多くのクラスが未定義あるいは重複しており、画像の12%が誤ってラベル付けされていることがわかった。
また,ImageNet-1kに含まれる野生生物関連ラベルと画像の両方が,地理的,文化的に有意な偏見を呈していることがわかった。
論文 参考訳(メタデータ) (2022-08-24T17:55:48Z) - ImageSubject: A Large-scale Dataset for Subject Detection [9.430492045581534]
主に被写体は、写真家が強調したいものなので、通常、画像やビデオの中に存在します。
主対象を検出することは、機械が画像やビデオの内容を理解するのを助ける重要な技術である。
我々は、オブジェクトのレイアウトを理解し、その中の主要な対象を見つけるために、モデルのトレーニングを目標とする新しいデータセットを提案する。
論文 参考訳(メタデータ) (2022-01-09T22:49:59Z) - StereOBJ-1M: Large-scale Stereo Image Dataset for 6D Object Pose
Estimation [43.839322860501596]
本稿では,大規模なステレオRGB画像オブジェクトのポーズ推定データセットであるtextbfStereOBJ-1M$データセットを提案する。
このデータセットは、オブジェクトの透明性、透過性、スペキュラリフレクションといった困難なケースに対処するように設計されている。
複雑で柔軟な環境でデータをキャプチャできる多視点方式でポーズデータを効率的にアノテートする新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-21T11:56:38Z) - Object-aware Contrastive Learning for Debiased Scene Representation [74.30741492814327]
オブジェクトを自己教師型でローカライズする,オブジェクト認識型コントラスト学習フレームワークを開発した。
また、コントラCAM、オブジェクト認識型乱作、背景混合に基づく2つのデータ拡張を導入し、コントラスト型自己教師型学習における文脈バイアスと背景バイアスを低減した。
論文 参考訳(メタデータ) (2021-07-30T19:24:07Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - FAIR1M: A Benchmark Dataset for Fine-grained Object Recognition in
High-Resolution Remote Sensing Imagery [21.9319970004788]
我々は,高分解能リモートセンシング画像において,100万以上のインスタンスと15,000以上の画像を含む新しいベンチマークデータセットを提案する。
FAIR1Mデータセットのすべてのオブジェクトは、指向境界ボックスによって5つのカテゴリと37のサブカテゴリに関してアノテートされます。
論文 参考訳(メタデータ) (2021-03-09T17:20:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。