論文の概要: Representation Based Regression for Object Distance Estimation
- arxiv url: http://arxiv.org/abs/2106.14208v1
- Date: Sun, 27 Jun 2021 11:45:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 17:52:03.520891
- Title: Representation Based Regression for Object Distance Estimation
- Title(参考訳): オブジェクト距離推定のための表現に基づく回帰
- Authors: Mete Ahishali, Mehmet Yamac, Serkan Kiranyaz, Moncef Gabbouj
- Abstract要約: 本研究では,検出された物体の距離を観測現場で予測する新しい手法を提案する。
提案手法は,最近提案されたCSEN(Convolutional Support Estimator Networks)を改良する。
- 参考スコア(独自算出の注目度): 27.507141762839208
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this study, we propose a novel approach to predict the distances of the
detected objects in an observed scene. The proposed approach modifies the
recently proposed Convolutional Support Estimator Networks (CSENs). CSENs are
designed to compute a direct mapping for the Support Estimation (SE) task in a
representation-based classification problem. We further propose and demonstrate
that representation-based methods (sparse or collaborative representation) can
be used in well-designed regression problems. To the best of our knowledge,
this is the first representation-based method proposed for performing a
regression task by utilizing the modified CSENs; and hence, we name this novel
approach as Representation-based Regression (RbR). The initial version of CSENs
has a proxy mapping stage (i.e., a coarse estimation for the support set) that
is required for the input. In this study, we improve the CSEN model by
proposing Compressive Learning CSEN (CL-CSEN) that has the ability to jointly
optimize the so-called proxy mapping stage along with convolutional layers. The
experimental evaluations using the KITTI 3D Object Detection distance
estimation dataset show that the proposed method can achieve a significantly
improved distance estimation performance over all competing methods. Finally,
the software implementations of the methods are publicly shared at
https://github.com/meteahishali/CSENDistance.
- Abstract(参考訳): 本研究では,検出された物体の距離を観測現場で予測する新しい手法を提案する。
提案手法はCSEN(Convolutional Support Estimator Networks)を改良したものである。
CSENは、表現に基づく分類問題において、サポート推定(SE)タスクの直接マッピングを計算するように設計されている。
さらに,よく設計された回帰問題において,表現ベース手法(疎表現あるいは協調表現)が利用できることを示す。
我々の知る限りでは、修正CSENを用いて回帰タスクを実行するための最初の表現ベース手法であり、この手法をRepresentation-based Regression (RbR) と呼ぶ。
CSENの初期バージョンには、入力に必要なプロキシマッピングステージ(つまり、サポートセットの粗い推定)がある。
本研究では,いわゆるプロキシマッピングステージと畳み込み層を共同で最適化する能力を有する圧縮学習csen(cl-csen)を提案することで,csenモデルを改善する。
kitti 3次元物体検出距離推定データセットを用いた実験評価により,提案手法は,すべての競合手法に対して有意に高い距離推定性能が得られることがわかった。
最後に、これらのメソッドのソフトウェア実装はhttps://github.com/meteahishali/CSENDistanceで公開されています。
関連論文リスト
- Consensus-Adaptive RANSAC [104.87576373187426]
本稿では,パラメータ空間の探索を学習する新しいRANSACフレームワークを提案する。
注意機構は、ポイント・ツー・モデル残差のバッチで動作し、軽量のワンステップ・トランスフォーマーで見いだされたコンセンサスを考慮するために、ポイント・ツー・モデル推定状態を更新する。
論文 参考訳(メタデータ) (2023-07-26T08:25:46Z) - Operational Support Estimator Networks [20.63209309898005]
本稿では,OSEN(Operational Support Estimator Networks)と呼ばれる新しい手法を提案する。
提案したOSENアプローチは、ディープネットワークを必要とせずに複雑な非線形性を学ぶことができる運用層で構成されている。
実験の結果,提案手法は計算効率を向上し,競合する手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-12T10:29:40Z) - CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.12857074801731]
そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。
投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。
ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文 参考訳(メタデータ) (2022-11-24T03:27:00Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - ConvPoseCNN2: Prediction and Refinement of Dense 6D Object Poses [23.348510362258402]
本稿では,オブジェクトの翻訳と向きを密に予測するPoseCNN法の完全畳み込み拡張を提案する。
これは、方向予測の空間分解能を改善するなど、いくつかの利点がある。
提案手法は,YCB-Videoデータセットにおいて,PoseCNNと同じ精度で実現可能であることを示す。
論文 参考訳(メタデータ) (2022-05-23T08:32:09Z) - Navigating Neural Space: Revisiting Concept Activation Vectors to
Overcome Directional Divergence [14.071950294953005]
概念活性化ベクトル (Concept Activation Vectors, CAV) は、潜在空間における人間の理解可能な概念をモデル化するための一般的なツールである。
本稿では、そのような分離性指向の解が、概念の方向性を正確にモデル化する実際の目標から逸脱する可能性があることを示す。
パターンベースのCAVを導入し、概念信号のみに着目し、より正確な概念指示を提供する。
論文 参考訳(メタデータ) (2022-02-07T19:40:20Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Integrated Grad-CAM: Sensitivity-Aware Visual Explanation of Deep
Convolutional Networks via Integrated Gradient-Based Scoring [26.434705114982584]
Grad-CAMは、モデルから得られたアクティベーションマップを組み合わせて視覚化する一般的なソリューションである。
Grad-CAMのグラデーションベース項のパス積分を計算することで、この問題に取り組むソリューションを紹介します。
CNNの予測のために抽出された表現の重要性を計測する手法で達成した改善を徹底した分析を行います。
論文 参考訳(メタデータ) (2021-02-15T19:21:46Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - MetaSDF: Meta-learning Signed Distance Functions [85.81290552559817]
ニューラルな暗示表現で形状を一般化することは、各関数空間上の学習先行値に比例する。
形状空間の学習をメタラーニング問題として定式化し、勾配に基づくメタラーニングアルゴリズムを利用してこの課題を解決する。
論文 参考訳(メタデータ) (2020-06-17T05:14:53Z) - Convolutional Sparse Support Estimator Network (CSEN) From energy
efficient support estimation to learning-aided Compressive Sensing [25.91471358239267]
スパース信号のサポート推定(SE)はスパース表現における非ゼロ要素の位置指標を見つけることを指す。
本研究では,そのようなマッピングをトレーニングセットから学習するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-03-02T11:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。