論文の概要: Amplifying the Anterior-Posterior Difference via Data Enhancement -- A
More Robust Deep Monocular Orientation Estimation Solution
- arxiv url: http://arxiv.org/abs/2012.11431v1
- Date: Mon, 21 Dec 2020 15:36:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 06:31:14.631180
- Title: Amplifying the Anterior-Posterior Difference via Data Enhancement -- A
More Robust Deep Monocular Orientation Estimation Solution
- Title(参考訳): データ拡張による前方・後方差の増幅 -- よりロバストな深部単眼方位推定ソリューション
- Authors: Chenchen Zhao and Hao Li
- Abstract要約: 既存のディープラーニングベースの単眼方向推定アルゴリズムは、オブジェクトの前部と後部の混乱の問題に直面している。
本研究では,物体の向きが位置する左右半円を予測することに焦点を当てた事前学習手法を提案する。
実験の結果,提案する半円予測により方向推定の精度が向上し,上記の問題を緩和できることがわかった。
- 参考スコア(独自算出の注目度): 7.540176446791261
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing deep-learning based monocular orientation estimation algorithms
faces the problem of confusion between the anterior and posterior parts of the
objects, caused by the feature similarity of such parts in typical objects in
traffic scenes such as cars and pedestrians. While difficult to solve, the
problem may lead to serious orientation estimation errors, and pose threats to
the upcoming decision making process of the ego vehicle, since the predicted
tracks of objects may have directions opposite to ground truths. In this paper,
we mitigate this problem by proposing a pretraining method. The method focuses
on predicting the left/right semicircle in which the orientation of the object
is located. The trained semicircle prediction model is then integrated into the
orientation angle estimation model which predicts a value in range $[0, \pi]$.
Experiment results show that the proposed semicircle prediction enhances the
accuracy of orientation estimation, and mitigates the problem stated above.
With the proposed method, a backbone achieves similar state-of-the-art
orientation estimation performance to existing approaches with well-designed
network structures.
- Abstract(参考訳): 既存のディープラーニングに基づく単眼方向推定アルゴリズムは、車や歩行者などの交通シーンにおける典型的な物体の特徴的類似性に起因する、物体の前部と後部の混同の問題に直面している。
解決は難しいが、この問題は重大な方向推定誤差を引き起こし、予測された物体の軌道が地平線と反対の方向を持つ可能性があるため、エゴ車両の今後の意思決定プロセスに脅威をもたらす可能性がある。
本稿では,事前学習手法を提案することでこの問題を緩和する。
この方法は、物体の向きが位置する左右半円の予測に焦点を当てている。
訓練された半円予測モデルは、方向角推定モデルに統合され、範囲 $[0, \pi]$ の値が予測される。
実験の結果,提案した半円予測は,方向推定の精度を高め,上記の問題を緩和することがわかった。
提案手法では,ネットワーク構造の設計が整った既存手法と同様の方向推定性能を実現する。
関連論文リスト
- Orient Anything [4.342241136871849]
そこで我々は,2段階の配向パイプラインを導入し,アップアクティビティ推定におけるアートパフォーマンスの状態を把握した。
従来の作業とは異なり、クラスのサブセットではなく、すべてのShapenet上でメソッドをトレーニングし、評価します。
論文 参考訳(メタデータ) (2024-10-02T23:46:45Z) - Towards Motion Forecasting with Real-World Perception Inputs: Are
End-to-End Approaches Competitive? [93.10694819127608]
実世界の知覚入力を用いた予測手法の統一評価パイプラインを提案する。
我々の詳細な調査では、キュレートされたデータから知覚ベースのデータへ移行する際の大きなパフォーマンスギャップが明らかになりました。
論文 参考訳(メタデータ) (2023-06-15T17:03:14Z) - Deep Projective Rotation Estimation through Relative Supervision [31.05330535795121]
ディープラーニングは、画像ベースの向き推定器を開発する方法を提供する。
これらの推定器は、しばしば大きなラベル付きデータセットのトレーニングを必要とする。
自己教師付き配向推定のための新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-21T04:58:07Z) - RBP-Pose: Residual Bounding Box Projection for Category-Level Pose
Estimation [103.74918834553247]
カテゴリーレベルのオブジェクトポーズ推定は、既知のカテゴリの集合からの任意のオブジェクトの3次元メートル法サイズだけでなく、6次元のポーズを予測することを目的としている。
近年の手法では, 観測された点雲を標準空間にマッピングし, 梅山アルゴリズムを用いてポーズとサイズを復元する手法が提案されている。
本稿では,オブジェクトのポーズと残差ベクトルを共同で予測する,幾何学誘導型残差オブジェクト境界ボックス投影ネットワーク RBP-Pose を提案する。
論文 参考訳(メタデータ) (2022-07-30T14:45:20Z) - ConvPoseCNN2: Prediction and Refinement of Dense 6D Object Poses [23.348510362258402]
本稿では,オブジェクトの翻訳と向きを密に予測するPoseCNN法の完全畳み込み拡張を提案する。
これは、方向予測の空間分解能を改善するなど、いくつかの利点がある。
提案手法は,YCB-Videoデータセットにおいて,PoseCNNと同じ精度で実現可能であることを示す。
論文 参考訳(メタデータ) (2022-05-23T08:32:09Z) - Trajectory Forecasting from Detection with Uncertainty-Aware Motion
Encoding [121.66374635092097]
物体検出と追跡から得られる軌道は、必然的にうるさい。
本稿では, 明示的に形成された軌道に依存することなく, 直接検出結果に基づく軌道予測器を提案する。
論文 参考訳(メタデータ) (2022-02-03T09:09:56Z) - Learning Output Embeddings in Structured Prediction [73.99064151691597]
構造化予測に対する強力で柔軟なアプローチは、予測される構造化対象を潜在的に無限次元の特徴空間に埋め込むことである。
原空間における予測は、前像問題の解法により計算される。
本研究では,新しい特徴空間に出力埋め込みと回帰関数の有限近似を共同で学習することを提案する。
論文 参考訳(メタデータ) (2020-07-29T09:32:53Z) - Pillar-based Object Detection for Autonomous Driving [33.021347169775474]
本稿では,自律運転に最適化されたシンプルで柔軟な物体検出フレームワークを提案する。
このアプリケーションにおける点雲は極めて希少であるという観測に基づいて,アンカーによる問題を修正するための実践的な柱ベースのアプローチを提案する。
提案アルゴリズムは,多視点特徴学習に円筒射影を組み込み,各点毎やアンカー毎ではなく,各柱毎のバウンディングボックスパラメータを予測し,最終的な予測を改善するためにピラーツーポイント射影モジュールをアライメントする。
論文 参考訳(メタデータ) (2020-07-20T17:59:28Z) - Uncertainty quantification in imaging and automatic horizon tracking: a
Bayesian deep-prior based approach [0.5156484100374059]
不確実性定量化(英: Uncertainty Quantification、UQ)は、解の不均一性とデータノイズ感度の確率論的記述を扱う。
本稿では,階層モデルを決定するために,UQが地平線追跡にどのように貢献するかに焦点を当てる。
論文 参考訳(メタデータ) (2020-04-01T04:26:33Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z) - Composing Normalizing Flows for Inverse Problems [89.06155049265641]
本稿では,2つの流れモデルの合成として,対象条件を推定する近似推論フレームワークを提案する。
本手法は,様々な逆問題に対して評価し,不確実性のある高品質な試料を作製することを示した。
論文 参考訳(メタデータ) (2020-02-26T19:01:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。