論文の概要: Background Mixup Data Augmentation for Hand and Object-in-Contact
Detection
- arxiv url: http://arxiv.org/abs/2202.13941v1
- Date: Mon, 28 Feb 2022 16:47:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-01 14:30:20.539277
- Title: Background Mixup Data Augmentation for Hand and Object-in-Contact
Detection
- Title(参考訳): 手動・接触検出のための背景混合データ拡張
- Authors: Koya Tango, Takehiko Ohkawa, Ryosuke Furuta, Yoichi Sato
- Abstract要約: 本研究では,ビデオ中の手動物体検出のためのバックグラウンド・ミックスアップというデータ拡張手法を提案する。
対象のトレーニング画像と手のない背景画像と、外部画像ソースから抽出した接触物とを混合し、混合画像を用いて検出器を訓練する。
提案手法は,教師付き学習環境と半教師付き学習環境の両方において,偽陽性を効果的に低減し,手動物体検出の性能を向上させることができることを示した。
- 参考スコア(独自算出の注目度): 20.565564076234878
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting the positions of human hands and objects-in-contact (hand-object
detection) in each video frame is vital for understanding human activities from
videos. For training an object detector, a method called Mixup, which overlays
two training images to mitigate data bias, has been empirically shown to be
effective for data augmentation. However, in hand-object detection, mixing two
hand-manipulation images produces unintended biases, e.g., the concentration of
hands and objects in a specific region degrades the ability of the hand-object
detector to identify object boundaries. We propose a data-augmentation method
called Background Mixup that leverages data-mixing regularization while
reducing the unintended effects in hand-object detection. Instead of mixing two
images where a hand and an object in contact appear, we mix a target training
image with background images without hands and objects-in-contact extracted
from external image sources, and use the mixed images for training the
detector. Our experiments demonstrated that the proposed method can effectively
reduce false positives and improve the performance of hand-object detection in
both supervised and semi-supervised learning settings.
- Abstract(参考訳): ビデオフレーム内の人間の手の位置と物体の接触(手動物体の検出)を検知することは、ビデオから人間の活動を理解するのに不可欠である。
オブジェクト検出器のトレーニングでは、データバイアスを軽減するために2つのトレーニングイメージをオーバーレイするMixupと呼ばれる手法が実証的にデータ拡張に有効であることが示されている。
しかし、ハンドオブジェクト検出では、2つのハンドマニピュレーション画像が混合されると意図しないバイアスが発生し、例えば、特定の領域における手とオブジェクトの集中は、ハンドオブジェクト検出器のオブジェクト境界を識別する能力が低下する。
本研究では,手動物体検出における意図しない効果を低減しつつ,データ混合正則化を利用した背景混合法を提案する。
手と被写体が接触する2つの画像とを混合する代わりに、対象画像と手のない背景画像と、外部画像から抽出された被写体とを混合し、この混合画像を用いて検出器を訓練する。
提案手法は,教師付き学習と半教師付き学習の両方において,偽陽性を効果的に低減し,手対象検出の性能を向上させることを実証した。
関連論文リスト
- Retrieval Robust to Object Motion Blur [54.34823913494456]
本研究では,動きのぼやけの影響を受けやすい画像のオブジェクト検索手法を提案する。
ぼやけたオブジェクト検索のための最初の大規模データセットを提示する。
提案手法は,新しいぼやけた検索データセット上で,最先端の検索手法より優れている。
論文 参考訳(メタデータ) (2024-04-27T23:22:39Z) - Unsupervised learning based object detection using Contrastive Learning [6.912349403119665]
本研究では,教師なし・自己教師型学習を通じて,単段階物体検出装置を訓練するための画期的な手法を提案する。
我々の最先端のアプローチはラベリングプロセスに革命をもたらす可能性を秘めており、手動アノテーションに関連する時間とコストを大幅に削減する。
我々は、画像間のコントラスト学習という概念を創始し、重要な位置情報の取得を可能にした。
論文 参考訳(メタデータ) (2024-02-21T01:44:15Z) - InterTracker: Discovering and Tracking General Objects Interacting with
Hands in the Wild [40.489171608114574]
既存の方法は相互作用する物体を見つけるためにフレームベースの検出器に依存している。
本稿では,対話オブジェクトの追跡に手動オブジェクトのインタラクションを活用することを提案する。
提案手法は最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2023-08-06T09:09:17Z) - Object-aware Contrastive Learning for Debiased Scene Representation [74.30741492814327]
オブジェクトを自己教師型でローカライズする,オブジェクト認識型コントラスト学習フレームワークを開発した。
また、コントラCAM、オブジェクト認識型乱作、背景混合に基づく2つのデータ拡張を導入し、コントラスト型自己教師型学習における文脈バイアスと背景バイアスを低減した。
論文 参考訳(メタデータ) (2021-07-30T19:24:07Z) - H2O: Two Hands Manipulating Objects for First Person Interaction
Recognition [70.46638409156772]
両手操作対象のマーカーレス3Dアノテーションを用いて,エゴセントリックな対話認識のための包括的なフレームワークを提案する。
本手法は,2つの手の3次元ポーズと操作対象の6次元ポーズのアノテーションと,それぞれのフレームのインタラクションラベルを生成する。
我々のデータセットは、H2O (2 Hands and Objects)と呼ばれ、同期されたマルチビューRGB-D画像、対話ラベル、オブジェクトクラス、左右の手でのグラウンドトルース3Dポーズ、6Dオブジェクトポーズ、グラウンドトルースカメラポーズ、オブジェクトメッシュ、シーンポイントクラウドを提供する。
論文 参考訳(メタデータ) (2021-04-22T17:10:42Z) - Data Augmentation for Object Detection via Differentiable Neural
Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。
この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。
オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文 参考訳(メタデータ) (2021-03-04T06:31:06Z) - A Simple and Effective Use of Object-Centric Images for Long-Tailed
Object Detection [56.82077636126353]
シーン中心画像における物体検出を改善するために,物体中心画像を活用する。
私たちは、シンプルで驚くほど効果的なフレームワークを提示します。
我々の手法は、レアオブジェクトのオブジェクト検出(およびインスタンスセグメンテーション)の精度を相対的に50%(および33%)向上させることができる。
論文 参考訳(メタデータ) (2021-02-17T17:27:21Z) - Leveraging Photometric Consistency over Time for Sparsely Supervised
Hand-Object Reconstruction [118.21363599332493]
本稿では,ビデオ中のフレームの粗いサブセットに対してのみアノテーションが利用できる場合に,時間とともに光度整合性を活用する手法を提案する。
本モデルでは,ポーズを推定することにより,手や物体を3Dで共同で再構成するカラーイメージをエンドツーエンドに訓練する。
提案手法は,3次元手動画像再構成の精度向上に有効であることを示す。
論文 参考訳(メタデータ) (2020-04-28T12:03:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。