論文の概要: Tiny-YOLO object detection supplemented with geometrical data
- arxiv url: http://arxiv.org/abs/2008.02170v2
- Date: Thu, 15 Oct 2020 19:15:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 18:48:29.863111
- Title: Tiny-YOLO object detection supplemented with geometrical data
- Title(参考訳): 幾何データによるTiny-YOLO物体検出
- Authors: Ivan Khokhlov, Egor Davydenko, Ilya Osokin, Ilya Ryakin, Azer Babaev,
Vladimir Litvinenko, Roman Gorbachev
- Abstract要約: 本研究では,シーン形状に関する事前知識の助けを借りて,検出精度(mAP)を向上させる手法を提案する。
我々は自律型ロボットに注目するので、ロボットの寸法とカメラの傾斜角を考えると、入力フレームの各ピクセルの空間スケールを予測することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a method of improving detection precision (mAP) with the help of
the prior knowledge about the scene geometry: we assume the scene to be a plane
with objects placed on it. We focus our attention on autonomous robots, so
given the robot's dimensions and the inclination angles of the camera, it is
possible to predict the spatial scale for each pixel of the input frame. With
slightly modified YOLOv3-tiny we demonstrate that the detection supplemented by
the scale channel, further referred as S, outperforms standard RGB-based
detection with small computational overhead.
- Abstract(参考訳): 本研究では,シーン形状に関する事前知識を活かして検出精度(map)を向上させる手法を提案し,シーンを物体を配置した平面と仮定する。
我々は自律型ロボットに注目するので、ロボットの寸法とカメラの傾斜角を考えると、入力フレームの各ピクセルの空間スケールを予測することができる。
わずかに修正されたYOLOv3-tinyでは、Sと呼ばれるスケールチャネルで補足された検出が、計算オーバーヘッドを小さくして標準RGBベースの検出より優れていることを示す。
関連論文リスト
- Using a Distance Sensor to Detect Deviations in a Planar Surface [20.15053198469424]
平面表面が幾何学的偏差を含むかどうかを,小型光時間センサによる瞬時測定のみで決定する手法について検討する。
本手法の鍵となるのは,オフザシェルフ距離センサで捉えた生の飛行時間データに符号化された全情報の活用である。
本研究では,広視野での移動ロボットの障害物回避を可能にする実例を構築した。
論文 参考訳(メタデータ) (2024-08-07T15:24:25Z) - Anyview: Generalizable Indoor 3D Object Detection with Variable Frames [63.51422844333147]
我々は,AnyViewという新しい3D検出フレームワークを実用化するために提案する。
本手法は, 単純かつクリーンなアーキテクチャを用いて, 高い一般化性と高い検出精度を実現する。
論文 参考訳(メタデータ) (2023-10-09T02:15:45Z) - Point Anywhere: Directed Object Estimation from Omnidirectional Images [10.152838128195468]
本研究では、全方位カメラを用いて、指さしアームのユーザ/オブジェクト位置制約と左右方向制約を除去する手法を提案する。
提案手法は,等方形画像から興味領域を抽出し,高精度な推定を可能にする。
論文 参考訳(メタデータ) (2023-08-02T08:32:43Z) - RGB-Only Reconstruction of Tabletop Scenes for Collision-Free
Manipulator Control [71.51781695764872]
世界のRGBビューのみを用いたロボットマニピュレータの無衝突制御システムを提案する。
テーブルトップシーンの知覚入力は、ロボットエンドエフェクタにハンドヘルドまたは装着されたRGBカメラの複数の画像によって提供される。
シーンの3次元形状を再構成するために、NeRFのようなプロセスが使用され、そこからユークリッド完全符号距離関数(ESDF)が計算される。
次に、モデル予測制御アルゴリズムを用いてマニピュレータを制御し、ESDFの障害物を避けながら所望のポーズに達する。
論文 参考訳(メタデータ) (2022-10-21T01:45:08Z) - Neural Scene Representation for Locomotion on Structured Terrain [56.48607865960868]
本研究では,都市環境を横断する移動ロボットの局所的な地形を再構築する学習手法を提案する。
搭載されたカメラとロボットの軌道からの深度測定のストリームを用いて、ロボットの近傍の地形を推定する。
ノイズ測定とカメラ配置の盲点からの大量の欠落データにもかかわらず,シーンを忠実に再構築する3次元再構成モデルを提案する。
論文 参考訳(メタデータ) (2022-06-16T10:45:17Z) - A Fast Location Algorithm for Very Sparse Point Clouds Based on Object
Detection [0.0]
特徴点の少ない状況下で,画像オブジェクト検出によって対象物を素早く検出するアルゴリズムを提案する。
スマートフォンを持って手動で設計したシーンで実験を行い,提案手法の高精度な位置決め速度と精度を示す。
論文 参考訳(メタデータ) (2021-10-21T05:17:48Z) - Nothing But Geometric Constraints: A Model-Free Method for Articulated
Object Pose Estimation [89.82169646672872]
本稿では,ロボットアームの関節構成を,モデルに先入観を持たずにRGBまたはRGB-D画像のシーケンスから推定する,教師なし視覚ベースシステムを提案する。
我々は,古典幾何学的定式化と深層学習を組み合わせることで,この課題を解決するために,極性多剛体制約を拡張した。
論文 参考訳(メタデータ) (2020-11-30T20:46:48Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Single View Metrology in the Wild [94.7005246862618]
本研究では,物体の3次元の高さや地上のカメラの高さで表現されるシーンの絶対的なスケールを再現する,単一ビューメロジに対する新しいアプローチを提案する。
本手法は,被写体の高さなどの3Dエンティティによる未知のカメラとの相互作用から,弱い教師付き制約を抑えるために設計されたディープネットワークによって学習されたデータ駆動の先行情報に依存する。
いくつかのデータセットと仮想オブジェクト挿入を含むアプリケーションに対して、最先端の定性的かつ定量的な結果を示す。
論文 参考訳(メタデータ) (2020-07-18T22:31:33Z) - Object-oriented SLAM using Quadrics and Symmetry Properties for Indoor
Environments [11.069661312755034]
本稿ではRGB-Dカメラを用いたスパースオブジェクトレベルのSLAMアルゴリズムを提案する。
二次表現は、その位置、向き、占有空間を含むオブジェクトをコンパクトにモデル化するランドマークとして用いられる。
実験の結果,特に移動ロボットの前方軌道における最先端のアルゴリズムと比較して,提案アルゴリズムは2次再構成の精度と収束速度を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2020-04-11T04:15:25Z) - Real-Time Object Detection and Recognition on Low-Compute Humanoid
Robots using Deep Learning [0.12599533416395764]
本稿では、複数の低計算NAOロボットがカメラビューにおける物体のリアルタイム検出、認識、位置決めを行うことを可能にする新しいアーキテクチャについて述べる。
オブジェクト検出と局所化のためのアルゴリズムは,複数のシナリオにおける屋内実験に基づくYOLOv3の実証的な修正である。
このアーキテクチャは、カメラフィードからニューラルネットにリアルタイムフレームを供給し、その結果を使ってロボットを誘導する効果的なエンドツーエンドパイプラインも備えている。
論文 参考訳(メタデータ) (2020-01-20T05:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。