論文の概要: Uncovering the Background-Induced bias in RGB based 6-DoF Object Pose
Estimation
- arxiv url: http://arxiv.org/abs/2304.08230v1
- Date: Mon, 17 Apr 2023 12:54:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 15:28:11.727641
- Title: Uncovering the Background-Induced bias in RGB based 6-DoF Object Pose
Estimation
- Title(参考訳): RGBに基づく6-DoFオブジェクトポース推定における背景バイアスの解明
- Authors: Elena Govi, Davide Sapienza, Carmelo Scribano, Tobia Poppi, Giorgia
Franchini, Paola Ard\`on, Micaela Verucchi and Marko Bertogna
- Abstract要約: 近年,産業環境におけるデータ駆動手法の利用傾向が高まっている。
ビデオや画像の操作が機械学習手法の有効性にどのように影響するかを理解することが重要である。
ケーススタディは,6次元ポーズ推定コンテキストにおける技術状況を考慮したLinemodデータセットを正確に解析することを目的としている。
- 参考スコア(独自算出の注目度): 5.30320006562872
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, there has been a growing trend of using data-driven methods
in industrial settings. These kinds of methods often process video images or
parts, therefore the integrity of such images is crucial. Sometimes datasets,
e.g. consisting of images, can be sophisticated for various reasons. It becomes
critical to understand how the manipulation of video and images can impact the
effectiveness of a machine learning method. Our case study aims precisely to
analyze the Linemod dataset, considered the state of the art in 6D pose
estimation context. That dataset presents images accompanied by ArUco markers;
it is evident that such markers will not be available in real-world contexts.
We analyze how the presence of the markers affects the pose estimation
accuracy, and how this bias may be mitigated through data augmentation and
other methods. Our work aims to show how the presence of these markers goes to
modify, in the testing phase, the effectiveness of the deep learning method
used. In particular, we will demonstrate, through the tool of saliency maps,
how the focus of the neural network is captured in part by these ArUco markers.
Finally, a new dataset, obtained by applying geometric tools to Linemod, will
be proposed in order to demonstrate our hypothesis and uncovering the bias. Our
results demonstrate the potential for bias in 6DOF pose estimation networks,
and suggest methods for reducing this bias when training with markers.
- Abstract(参考訳): 近年,産業環境におけるデータ駆動手法の利用傾向が高まっている。
これらの方法はしばしば映像や部品を処理するため、画像の完全性は不可欠である。
例えば、画像からなるデータセットは、様々な理由で洗練されることがある。
ビデオや画像の操作が機械学習手法の有効性にどのように影響するかを理解することが重要になる。
ケーススタディは,6次元ポーズ推定コンテキストにおける技術状況を考慮したLinemodデータセットを正確に解析することを目的としている。
このデータセットはArUcoマーカーを伴って画像を提示するが、そのようなマーカーが現実世界のコンテキストでは利用できないことは明らかである。
本研究では,マーカーの存在がポーズ推定精度にどのように影響するか,また,このバイアスがデータ拡張や他の手法によって軽減されるかを分析する。
本研究の目的は、これらのマーカーの存在が、テストフェーズにおいて、使用するディープラーニング手法の有効性をどう修正するかを示すことである。
特に、サリエンシマップのツールを通じて、ニューラルネットワークの焦点がこれらのArUcoマーカーによって部分的にキャプチャされる様子を実演する。
最後に,linemodに幾何学的ツールを適用することで得られた新しいデータセットを提案し,仮説を実証し,バイアスを明らかにする。
本研究は,6DOFポーズ推定ネットワークにおけるバイアスの可能性を示し,マーカーを用いたトレーニングにおいて,バイアスを減らす方法を提案する。
関連論文リスト
- Mitigating Bias Using Model-Agnostic Data Attribution [2.9868610316099335]
機械学習モデルにおけるバイアスの緩和は、公平性と公平性を保証するための重要な取り組みである。
本稿では, 画素画像の属性を利用して, バイアス属性を含む画像の領域を特定し, 正規化することで, バイアスに対処する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-08T13:00:56Z) - Image and AIS Data Fusion Technique for Maritime Computer Vision
Applications [1.482087972733629]
本研究では,AIS(Automatic Identification System)データと画像に検出された容器を融合させてデータセットを作成する手法を開発した。
提案手法は, 距離と方位を推定することにより, 検出した船舶を対応するAISメッセージに関連付ける。
この技術は、水路交通管理、遭遇検知、監視のためのデータセットを作成するのに有用である。
論文 参考訳(メタデータ) (2023-12-07T20:54:49Z) - Exploiting the Distortion-Semantic Interaction in Fisheye Data [12.633032175875865]
魚眼のデータは他のタイプのカメラよりも広い視野の利点があるが、これは高い歪みを犠牲にしている。
中心からさらに離れたオブジェクトは、モデルがセマンティックコンテキストを特定するのが難しくなる変形を示す。
画像の中心から物体の距離に基づいて歪みクラスラベルを抽出し,この関係を利用する手法を提案する。
次に、同じ意味クラスのオブジェクトと互いに近い歪みクラスのオブジェクトを制約する重み付けされた対照的な損失で、バックボーンの表現空間を形成する。
論文 参考訳(メタデータ) (2023-04-28T20:23:38Z) - Improving Fairness in Image Classification via Sketching [14.154930352612926]
ディープニューラルネットワーク(DNN)は、異なるサブ人口からトレーニングデータが収集された場合、不公平な予測を行う傾向がある。
我々はこの現象に対処するためにスケッチを使うことを提案する。
本手法は,一般的なシーンデータセットと医療シーンデータセットの両方に関する広範な実験を通じて評価する。
論文 参考訳(メタデータ) (2022-10-31T22:26:32Z) - Semantic keypoint-based pose estimation from single RGB frames [64.80395521735463]
一つのRGB画像からオブジェクトの連続6-DoFポーズを推定する手法を提案する。
このアプローチは、畳み込みネットワーク(convnet)によって予測されるセマンティックキーポイントと、変形可能な形状モデルを組み合わせる。
提案手法は,インスタンスベースのシナリオとクラスベースのシナリオの両方に対して,6-DoFオブジェクトのポーズを正確に復元できることを示す。
論文 参考訳(メタデータ) (2022-04-12T15:03:51Z) - Object-aware Contrastive Learning for Debiased Scene Representation [74.30741492814327]
オブジェクトを自己教師型でローカライズする,オブジェクト認識型コントラスト学習フレームワークを開発した。
また、コントラCAM、オブジェクト認識型乱作、背景混合に基づく2つのデータ拡張を導入し、コントラスト型自己教師型学習における文脈バイアスと背景バイアスを低減した。
論文 参考訳(メタデータ) (2021-07-30T19:24:07Z) - Data Augmentation for Object Detection via Differentiable Neural
Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。
この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。
オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文 参考訳(メタデータ) (2021-03-04T06:31:06Z) - Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文 参考訳(メタデータ) (2021-01-05T17:18:52Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。