論文の概要: R4D: Utilizing Reference Objects for Long-Range Distance Estimation
- arxiv url: http://arxiv.org/abs/2206.04831v1
- Date: Fri, 10 Jun 2022 01:27:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-13 15:10:22.304627
- Title: R4D: Utilizing Reference Objects for Long-Range Distance Estimation
- Title(参考訳): R4D:長距離距離推定のための参照オブジェクトの利用
- Authors: Yingwei Li, Tiffany Chen, Maya Kabkab, Ruichi Yu, Longlong Jing,
Yurong You, Hang Zhao
- Abstract要約: 物体の距離を推定することは、自動運転にとって安全上重要な課題である。
本稿では,長距離距離推定(Long-Range Distance Estimation)と呼ぶ,挑戦的で未探索の課題を紹介する。
本稿では,R4Dを提案する。R4Dは,シーン内の既知の距離の参照を用いて,長距離物体の距離を正確に推定する最初のフレームワークである。
- 参考スコア(独自算出の注目度): 28.295002268802854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating the distance of objects is a safety-critical task for autonomous
driving. Focusing on short-range objects, existing methods and datasets neglect
the equally important long-range objects. In this paper, we introduce a
challenging and under-explored task, which we refer to as Long-Range Distance
Estimation, as well as two datasets to validate new methods developed for this
task. We then proposeR4D, the first framework to accurately estimate the
distance of long-range objects by using references with known distances in the
scene. Drawing inspiration from human perception, R4D builds a graph by
connecting a target object to all references. An edge in the graph encodes the
relative distance information between a pair of target and reference objects.
An attention module is then used to weigh the importance of reference objects
and combine them into one target object distance prediction. Experiments on the
two proposed datasets demonstrate the effectiveness and robustness of R4D by
showing significant improvements compared to existing baselines. We are looking
to make the proposed dataset, Waymo OpenDataset - Long-Range Labels, available
publicly at waymo.com/open/download.
- Abstract(参考訳): 物体の距離を推定することは自動運転にとって安全上重要な課題である。
ショートレンジオブジェクトに焦点を当て、既存のメソッドとデータセットは同様に重要なロングレンジオブジェクトを無視します。
本稿では,この課題のために開発された新しい手法を検証するための2つのデータセットと,長距離距離推定と呼ぶ課題について紹介する。
次に,シーン内の既知の距離の参照を用いて,長距離物体の距離を正確に推定する最初のフレームワークであるr4dを提案する。
人間の知覚からインスピレーションを得たR4Dは、対象オブジェクトをすべての参照に接続することでグラフを構築する。
グラフ内のエッジは、一対のターゲットと参照オブジェクトの間の相対距離情報を符号化する。
次に、アテンションモジュールを使用して、参照オブジェクトの重要性を測り、それらを1つのターゲットオブジェクト距離予測に組み合わせる。
提案した2つのデータセットに対する実験は、既存のベースラインと比較して大幅に改善され、R4Dの有効性と堅牢性を示した。
提案されたデータセットであるWaymo OpenDataset - Long-Range Labelsをwaymo.com/open/downloadで公開したいと思っています。
関連論文リスト
- 3DRP-Net: 3D Relative Position-aware Network for 3D Visual Grounding [58.924180772480504]
3Dビジュアルグラウンドは、自由形式の言語記述によって、ターゲットオブジェクトを3Dポイントクラウドにローカライズすることを目的としている。
3次元相対位置認識ネットワーク(3-Net)という,関係性を考慮した一段階フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T09:33:25Z) - DMODE: Differential Monocular Object Distance Estimation Module without Class Specific Information [8.552738832104101]
単分子距離推定のためのクラス非依存手法であるDMODEを提案する。
DMODEは、カメラの動きと時間とともにその大きさの変動を融合させることで、物体の距離を推定する。
我々は,TrackRCNN と EagerMOT からの出力と接点境界ボックスアノテーションを用いて,KITTI MOTS データセット上でのモデルを評価する。
論文 参考訳(メタデータ) (2022-10-23T02:06:56Z) - 4D Unsupervised Object Discovery [53.561750858325915]
本研究では,3次元点雲と2次元RGB画像の時間的情報を用いた4次元データからオブジェクトを共同で検出する4次元非教師対象探索を提案する。
本稿では,2次元ローカライゼーションネットワークで協調的に最適化された3次元点雲上にClusterNetを提案することで,この課題に対する最初の実践的アプローチを提案する。
論文 参考訳(メタデータ) (2022-10-10T16:05:53Z) - MPF6D: Masked Pyramid Fusion 6D Pose Estimation [1.2891210250935146]
提案手法では,提案手法の精度を向上させるため,物体の6次元ポーズを推定する手法を提案する。
提案手法は, 推定時間0.12秒でリアルタイムに利用でき, 精度が高い。
論文 参考訳(メタデータ) (2021-11-17T20:23:54Z) - 3D-FCT: Simultaneous 3D Object Detection and Tracking Using Feature
Correlation [0.0]
3D-FCTは、時間情報を利用して3Dオブジェクトの検出と追跡の関連タスクを同時に実行するシームズネットワークアーキテクチャである。
提案手法は,最先端手法よりも5.57%mAPの改善が期待できるKITTI追跡データセットを用いて評価した。
論文 参考訳(メタデータ) (2021-10-06T06:36:29Z) - Learning to Track with Object Permanence [61.36492084090744]
共同物体の検出と追跡のためのエンドツーエンドのトレーニング可能なアプローチを紹介します。
私たちのモデルは、合成データと実データで共同トレーニングされ、KITTIおよびMOT17データセットの最先端を上回ります。
論文 参考訳(メタデータ) (2021-03-26T04:43:04Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z) - Anchor Distance for 3D Multi-Object Distance Estimation from 2D Single
Shot [15.815583594196488]
シーン内の複数物体間の距離を,単写画像のみを用いてリアルタイムに推定する手法を提案する。
予測器がアンカー距離を使用する前に距離をキャッチし、距離に基づいてネットワークを訓練します。
提案手法は約30FPSの速度を実現し,既存の手法と比較して最低のRMSEを示す。
論文 参考訳(メタデータ) (2021-01-25T20:33:05Z) - Auto4D: Learning to Label 4D Objects from Sequential Point Clouds [89.30951657004408]
LiDAR点群から3次元空間に正確な物体軌道を生成する自動パイプラインを提案する。
鍵となるアイデアは、4Dオブジェクトラベルを2つの部分に分解することです。リジッドオブジェクトに対して時間を通して固定される3Dのオブジェクトサイズと、オブジェクトのポーズの進化を記述するモーションパスです。
安価だがノイズの多い入力を想定し,オブジェクトサイズを再推定し,動作経路を平滑化することにより,高品質な4dラベルを生成する。
論文 参考訳(メタデータ) (2021-01-17T04:23:05Z) - TAO: A Large-Scale Benchmark for Tracking Any Object [95.87310116010185]
オブジェクトのデータセットの追跡は2,907本の高解像度ビデオで構成され、平均で30分の長さの多様な環境でキャプチャされる。
ビデオの任意の時点で移動するオブジェクトにアノテータにラベルを付け、ファクトラムの後に名前を付けるように求めます。
我々の語彙は、既存の追跡データセットと著しく大きく、質的に異なる。
論文 参考訳(メタデータ) (2020-05-20T21:07:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。