論文の概要: Automatic dataset generation for specific object detection
- arxiv url: http://arxiv.org/abs/2207.07867v1
- Date: Sat, 16 Jul 2022 07:44:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-19 18:16:01.195159
- Title: Automatic dataset generation for specific object detection
- Title(参考訳): 特定物体検出のための自動データセット生成
- Authors: Xiaotian Lin, Leiyang Xu, Qiang Wang
- Abstract要約: 本研究では,オブジェクトの詳細な特徴を,無関係な情報を得ることなく保存することができるオブジェクト・イン・シーン・イメージの合成手法を提案する。
その結果,合成画像では,物体の境界が背景とよく一致していることがわかった。
- 参考スコア(独自算出の注目度): 6.346581421948067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the past decade, object detection tasks are defined mostly by large public
datasets. However, building object detection datasets is not scalable due to
inefficient image collecting and labeling. Furthermore, most labels are still
in the form of bounding boxes, which provide much less information than the
real human visual system. In this paper, we present a method to synthesize
object-in-scene images, which can preserve the objects' detailed features
without bringing irrelevant information. In brief, given a set of images
containing a target object, our algorithm first trains a model to find an
approximate center of the object as an anchor, then makes an outline regression
to estimate its boundary, and finally blends the object into a new scene. Our
result shows that in the synthesized image, the boundaries of objects blend
very well with the background. Experiments also show that SOTA segmentation
models work well with our synthesized data.
- Abstract(参考訳): 過去10年間で、オブジェクト検出タスクは主に大規模な公開データセットによって定義されている。
しかし、非効率な画像収集とラベル付けのため、オブジェクト検出データセットの構築はスケーラブルではない。
さらに、ほとんどのラベルは依然としてバウンディングボックスの形で、実際の人間の視覚システムよりもはるかに少ない情報を提供する。
本稿では,オブジェクトの詳細な特徴を無関係に保持できるオブジェクト・イン・シーン・イメージを合成する手法を提案する。
簡単に言うと、対象オブジェクトを含む一連のイメージを与えられたアルゴリズムは、まずモデルを訓練して、オブジェクトの近似中心をアンカーとして見つけ、その境界を推定するためにアウトライン回帰を行い、最終的にオブジェクトを新しいシーンにブレンドします。
その結果,合成画像では,物体の境界が背景とよく一致していることがわかった。
実験により, sotaセグメンテーションモデルが合成データとうまく連携することを示した。
関連論文リスト
- Salient Object Detection for Images Taken by People With Vision
Impairments [13.157939981657886]
本稿では、視覚障害者が撮影した画像を用いた、新しい有能な物体検出データセットを提案する。
VizWiz-SalientObjectは最大(つまり32,000個の人称注釈付き画像)で、ユニークな特徴を持っている。
我々は、我々のデータセットで7つの現代的な正当性オブジェクト検出方法のベンチマークを行い、それらが大きな画像、より複雑な境界、テキストの欠如に最も苦労していることを発見した。
論文 参考訳(メタデータ) (2023-01-12T22:33:01Z) - Object Detection in Aerial Images with Uncertainty-Aware Graph Network [61.02591506040606]
本稿では,ノードとエッジがオブジェクトによって表現される構造化グラフを用いた,新しい不確実性を考慮したオブジェクト検出フレームワークを提案する。
我々は我々のモデルをオブジェクトDETection(UAGDet)のための不確実性対応グラフネットワークと呼ぶ。
論文 参考訳(メタデータ) (2022-08-23T07:29:03Z) - FewSOL: A Dataset for Few-Shot Object Learning in Robotic Environments [21.393674766169543]
本稿では,オブジェクト認識のためのFew-Shot Object Learningデータセットについて紹介する。
私たちは、異なる視点から、オブジェクトごとに9つのRGB-D画像を持つ336の現実世界のオブジェクトをキャプチャしました。
評価結果から, ロボット環境下では, 数発の物体分類において, 改良の余地がまだ大きいことが示唆された。
論文 参考訳(メタデータ) (2022-07-06T05:57:24Z) - Discovering Objects that Can Move [55.743225595012966]
手動ラベルなしでオブジェクトを背景から分離する、オブジェクト発見の問題について検討する。
既存のアプローチでは、色、テクスチャ、位置などの外観の手がかりを使用して、ピクセルをオブジェクトのような領域に分類する。
私たちは、動的オブジェクト -- 世界で独立して動くエンティティ -- にフォーカスすることを選びます。
論文 参考訳(メタデータ) (2022-03-18T21:13:56Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - A Simple and Effective Use of Object-Centric Images for Long-Tailed
Object Detection [56.82077636126353]
シーン中心画像における物体検出を改善するために,物体中心画像を活用する。
私たちは、シンプルで驚くほど効果的なフレームワークを提示します。
我々の手法は、レアオブジェクトのオブジェクト検出(およびインスタンスセグメンテーション)の精度を相対的に50%(および33%)向上させることができる。
論文 参考訳(メタデータ) (2021-02-17T17:27:21Z) - Learning Object Detection from Captions via Textual Scene Attributes [70.90708863394902]
キャプションには、オブジェクトの属性やそれらの関係など、画像に関するよりリッチな情報が含まれている、と我々は主張する。
本稿では,この「テキストシーングラフ」の属性を用いて物体検知器を訓練する手法を提案する。
得られたモデルが、いくつかの挑戦的なオブジェクト検出データセットに対して、最先端の結果を達成することを実証的に実証した。
論文 参考訳(メタデータ) (2020-09-30T10:59:20Z) - Evaluating Salient Object Detection in Natural Images with Multiple
Objects having Multi-level Saliency [3.464871689508835]
正当性オブジェクト検出は、ラベルが正当性オブジェクトクラスと背景を持つバイナリ基底真理を用いて評価される。
我々のデータセットは、SalMoN(複数オブジェクトの自然画像の可用性)と呼ばれ、複数のオブジェクトを含む588の画像を持つ。
論文 参考訳(メタデータ) (2020-03-19T00:06:40Z) - Object-Centric Image Generation from Layouts [93.10217725729468]
複数のオブジェクトを持つ複雑なシーンを生成するレイアウト・ツー・イメージ生成法を開発した。
本手法は,シーン内のオブジェクト間の空間的関係の表現を学習し,レイアウトの忠実度の向上につながる。
本稿では,Fr'echet Inception Distanceのオブジェクト中心適応であるSceneFIDを紹介する。
論文 参考訳(メタデータ) (2020-03-16T21:40:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。