論文の概要: OSRE: Object-to-Spot Rotation Estimation for Bike Parking Assessment
- arxiv url: http://arxiv.org/abs/2303.00725v1
- Date: Wed, 1 Mar 2023 18:34:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-03-02 13:44:54.899312
- Title: OSRE: Object-to-Spot Rotation Estimation for Bike Parking Assessment
- Title(参考訳): OSRE:自転車駐車評価のためのオブジェクト間回転推定
- Authors: Saghir Alfasly, Zaid Al-huda, Saifullah Bello, Ahmed Elazab, Jian Lu,
Chen Xu
- Abstract要約: 本稿では、カメラに依存しない、よく注釈付けされた合成自転車回転データセットを構築する。
次に、物体検出タスクを拡張して2つの軸における自転車の回転をさらに後退させることにより、物体間回転推定器(OSRE)を提案する。
提案したOSREは、将来性のある結果を提供する合成および実世界のデータに基づいて評価される。
- 参考スコア(独自算出の注目度): 10.489021696058632
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current deep models provide remarkable object detection in terms of object
classification and localization. However, estimating object rotation with
respect to other visual objects in the visual context of an input image still
lacks deep studies due to the unavailability of object datasets with rotation
annotations.
This paper tackles these two challenges to solve the rotation estimation of a
parked bike with respect to its parking area. First, we leverage the power of
3D graphics to build a camera-agnostic well-annotated Synthetic Bike Rotation
Dataset (SynthBRSet). Then, we propose an object-to-spot rotation estimator
(OSRE) by extending the object detection task to further regress the bike
rotations in two axes. Since our model is purely trained on synthetic data, we
adopt image smoothing techniques when deploying it on real-world images. The
proposed OSRE is evaluated on synthetic and real-world data providing promising
results. Our data and code are available at
\href{https://github.com/saghiralfasly/OSRE-Project}{https://github.com/saghiralfasly/OSRE-Project}.
- Abstract(参考訳): 現在の深層モデルは、オブジェクトの分類とローカライゼーションの観点で注目すべき物体検出を提供する。
しかしながら、入力画像の視覚的コンテキストにおける他の視覚オブジェクトに対するオブジェクトの回転の推定は、ローテーションアノテーション付きオブジェクトデータセットが利用できないため、深い研究が不足している。
本稿では,駐車エリアにおける駐車自転車の回転推定に関する2つの課題について考察する。
まず、3dグラフィックスのパワーを利用して、カメラに依存しない合成自転車回転データセット(synthbrset)を構築する。
次に,物体検出タスクを拡張し,自転車の回転を2軸でさらに後退させることにより,物体対スポット回転推定器(osre)を提案する。
我々のモデルは合成データに基づいて純粋に訓練されているので、実世界の画像にデプロイする際に画像平滑化技術を採用する。
提案するosreは合成データと実世界のデータで評価され,有望な結果が得られる。
我々のデータとコードは、 \href{https://github.com/saghiralfasly/OSRE-Project}{https://github.com/saghiralfasly/OSRE-Project}で利用可能です。
関連論文リスト
- DVMNet++: Rethinking Relative Pose Estimation for Unseen Objects [59.51874686414509]
既存のアプローチでは、通常、接地構造オブジェクト境界ボックスと、多数の離散仮説を持つ近似3次元回転を用いて3次元翻訳を予測している。
本稿では,1回のパスで相対オブジェクトのポーズを計算するDeep Voxel Matching Network (DVMNet++)を提案する。
提案手法は,最先端手法と比較して計算コストの低い新しいオブジェクトに対して,より正確な相対的ポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - CarPatch: A Synthetic Benchmark for Radiance Field Evaluation on Vehicle
Components [77.33782775860028]
車両の新たな総合ベンチマークであるCarPatchを紹介する。
内在カメラパラメータと外在カメラパラメータを付加した画像のセットに加えて、各ビューに対して対応する深度マップとセマンティックセグメンテーションマスクが生成されている。
グローバルとパートベースのメトリクスは、いくつかの最先端技術を評価し、比較し、より良い特徴付けるために定義され、使われてきた。
論文 参考訳(メタデータ) (2023-07-24T11:59:07Z) - DORT: Modeling Dynamic Objects in Recurrent for Multi-Camera 3D Object
Detection and Tracking [67.34803048690428]
本稿では、この問題を解決するためにRecurrenT(DORT)の動的オブジェクトをモデル化することを提案する。
DORTは、重い計算負担を軽減する動き推定のために、オブジェクトワイズローカルボリュームを抽出する。
フレキシブルで実用的で、ほとんどのカメラベースの3Dオブジェクト検出器に差し込むことができる。
論文 参考訳(メタデータ) (2023-03-29T12:33:55Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - HM3D-ABO: A Photo-realistic Dataset for Object-centric Multi-view 3D
Reconstruction [37.29140654256627]
本稿では、フォトリアリスティックなオブジェクト中心データセットHM3D-ABOを提案する。
リアルな屋内シーンとリアルなオブジェクトを構成することで構築される。
このデータセットは、カメラポーズ推定やノベルビュー合成といったタスクにも有用である。
論文 参考訳(メタデータ) (2022-06-24T16:02:01Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - Robust 2D/3D Vehicle Parsing in CVIS [54.825777404511605]
本研究では,協調型車両インフラシステム(CVIS)の一環として,異なるカメラビューの車両を堅牢に検出・認識する新しいアプローチを提案する。
提案方式は任意のカメラビュー向けに設計されており,本質的パラメータや外部的パラメータを仮定しない。
実際に,本手法は2次元検出,インスタンスセグメンテーション,6-DoFのポーズ推定においてSOTA法より優れている。
論文 参考訳(メタデータ) (2021-03-11T03:35:05Z) - Single-Shot 3D Detection of Vehicles from Monocular RGB Images via
Geometry Constrained Keypoints in Real-Time [6.82446891805815]
単眼RGB画像における車両検出のための新しい3次元単発物体検出法を提案する。
提案手法は,3次元空間への2次元検出を付加回帰および分類パラメータの予測により引き上げる。
KITTI 3D Object Detection と新しい nuScenes Object Detection ベンチマークを用いて,自律走行のための異なるデータセットに対するアプローチを検証し,その評価を行った。
論文 参考訳(メタデータ) (2020-06-23T15:10:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。