論文の概要: Object Disparity
- arxiv url: http://arxiv.org/abs/2108.07939v1
- Date: Wed, 18 Aug 2021 02:11:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-19 14:53:58.698661
- Title: Object Disparity
- Title(参考訳): オブジェクトの差異
- Authors: Ynjiun Paul Wang
- Abstract要約: 本稿では,高密度画素差を直接検出して3次元物体距離検出を行う方法を提案する。
圧縮ネットオブジェクト分散-SSDの例は、Kittiデータセットの分散基底真理と比較した場合の精度で、効率的なオブジェクト分散検出を示すために構築された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most of stereo vision works are focusing on computing the dense pixel
disparity of a given pair of left and right images. A camera pair usually
required lens undistortion and stereo calibration to provide an undistorted
epipolar line calibrated image pair for accurate dense pixel disparity
computation. Due to noise, object occlusion, repetitive or lack of texture and
limitation of matching algorithms, the pixel disparity accuracy usually suffers
the most at those object boundary areas. Although statistically the total
number of pixel disparity errors might be low (under 2% according to the Kitti
Vision Benchmark of current top ranking algorithms), the percentage of these
disparity errors at object boundaries are very high. This renders the
subsequence 3D object distance detection with much lower accuracy than desired.
This paper proposed a different approach for solving a 3D object distance
detection by detecting object disparity directly without going through a dense
pixel disparity computation. An example squeezenet Object Disparity-SSD
(OD-SSD) was constructed to demonstrate an efficient object disparity detection
with comparable accuracy compared with Kitti dataset pixel disparity ground
truth. Further training and testing results with mixed image dataset captured
by several different stereo systems may suggest that an OD-SSD might be
agnostic to stereo system parameters such as a baseline, FOV, lens distortion,
even left/right camera epipolar line misalignment.
- Abstract(参考訳): ステレオビジョンの作業の多くは、与えられた左右一対の画像の高密度画素差の計算に重点を置いている。
カメラ対は通常、レンズの歪みとステレオキャリブレーションを必要とし、正確な高密度画素差計算のために非歪のエピポーラ線校正画像対を提供する。
ノイズ、物体の隠蔽、繰り返し、テクスチャの欠如、マッチングアルゴリズムの制限により、ピクセルの差の精度は通常、それらのオブジェクト境界領域で最も悩まされる。
統計的には画素差誤差の総数は低いかもしれないが(現在のトップランキングアルゴリズムのkitti visionベンチマークによると2%以下)、オブジェクト境界での画素差誤差の割合は非常に高い。
これにより、所望よりもずっと低い精度で、サブシーケンスの3dオブジェクト距離検出をレンダリングする。
本稿では,高密度画素差分計算を経ずに直接物体差分を検出できる3次元物体距離検出法を提案する。
圧縮ネット型オブジェクト分散SSD(OD-SSD)の例は,Kittiデータセットの分散基底真理と比較し,効率的なオブジェクト分散検出を精度良く示すために構築された。
複数の異なるステレオシステムによってキャプチャされた混合画像データセットによるさらなるトレーニングとテストの結果は、od-ssdがベースライン、fov、レンズ歪み、さらには左右のカメラエピポーララインの誤認といったステレオシステムのパラメータに無関係であることを示唆している。
関連論文リスト
- Multi-View Keypoints for Reliable 6D Object Pose Estimation [12.436320203635143]
熱マップとキーポイントの推定値を3次元空間上の確率密度マップに結合する新しい多視点手法を提案する。
本研究では, 様々な難易度, 反射率の異なる物体に対して, 約0.5mm, 2°の平均ポーズ推定誤差を示す。
論文 参考訳(メタデータ) (2023-03-29T16:28:11Z) - Monocular 3D Object Detection with Depth from Motion [74.29588921594853]
我々は、正確な物体深度推定と検出にカメラエゴモーションを利用する。
我々のフレームワークはDfM(Depth from Motion)と呼ばれ、2D画像の特徴を3D空間に持ち上げて3Dオブジェクトを検出する。
我々のフレームワークは、KITTIベンチマークにおいて最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-07-26T15:48:46Z) - Image-to-Lidar Self-Supervised Distillation for Autonomous Driving Data [80.14669385741202]
本稿では,自律運転データに適した3次元知覚モデルのための自己教師付き事前学習手法を提案する。
我々は、自動走行装置における同期・校正画像とLidarセンサーの可用性を活用している。
私たちのメソッドは、ポイントクラウドや画像アノテーションを一切必要としません。
論文 参考訳(メタデータ) (2022-03-30T12:40:30Z) - High-Resolution Depth Maps Based on TOF-Stereo Fusion [27.10059147107254]
そこで本研究では,効率的な種子育成アルゴリズムに基づくTOF-ステレオ融合法を提案する。
提案アルゴリズムは2次元画像に基づくステレオアルゴリズムよりも優れていることを示す。
このアルゴリズムは、単一のCPU上でリアルタイムのパフォーマンスを示す可能性がある。
論文 参考訳(メタデータ) (2021-07-30T15:11:42Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Self-supervised spectral matching network for hyperspectral target
detection [8.831857715361624]
いくつかのターゲットサンプルから、航空機、車両、船舶などの特定のターゲットピクセルをハイパースペクトル画像全体から識別することを目的としています。
一般に、背景ピクセルは画像の大部分を取り、複雑に分散します。
スペクトル混合に基づく自己監視型パラダイムは、ハイパースペクトルデータのために設計され、効果的な特徴表現を得る。
論文 参考訳(メタデータ) (2021-05-10T02:32:58Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - Adjusting Bias in Long Range Stereo Matching: A semantics guided
approach [14.306250516592305]
本研究では,フォアグラウンドとバックグラウンドを分離した2つの新しい深度に基づく損失関数を提案する。
これらの損失関数はチューナブルであり、ステレオ学習アルゴリズムの固有のバイアスのバランスをとることができる。
特に50mを超える距離にある物体に対しては, 差分推定と深さ推定の大幅な改善が期待できる。
論文 参考訳(メタデータ) (2020-09-10T01:47:53Z) - Wasserstein Distances for Stereo Disparity Estimation [62.09272563885437]
既定義の離散値の集合上の分布を出力する、奥行き推定や不均一推定への既存のアプローチ。
これにより、真の深さや差がこれらの値と一致しない場合に、不正確な結果をもたらす。
任意の深さの値を出力できる新しいニューラルネットワークアーキテクチャを用いて、これらの問題に対処する。
論文 参考訳(メタデータ) (2020-07-06T21:37:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。