論文の概要: High-Definition 5MP Stereo Vision Sensing for Robotics
- arxiv url: http://arxiv.org/abs/2601.22445v1
- Date: Fri, 30 Jan 2026 01:29:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:15.1476
- Title: High-Definition 5MP Stereo Vision Sensing for Robotics
- Title(参考訳): ロボットのための高精細5MPステレオビジョンセンシング
- Authors: Leaf Jiang, Matthew Holzel, Bernhard Kaplan, Hsiou-Yuan Liu, Sabyasachi Paul, Karen Rankin, Piotr Swierczynski,
- Abstract要約: 高解像度(5MP+)ステレオビジョンシステムは、ロボットの能力向上に不可欠である。
本研究では,新しいフレーム・ツー・フレーム・キャリブレーションとステレオマッチング手法を用いて,5MPカメラ画像の処理による限界ギャップを解消する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-resolution (5MP+) stereo vision systems are essential for advancing robotic capabilities, enabling operation over longer ranges and generating significantly denser and accurate 3D point clouds. However, realizing the full potential of high-angular-resolution sensors requires a commensurately higher level of calibration accuracy and faster processing -- requirements often unmet by conventional methods. This study addresses that critical gap by processing 5MP camera imagery using a novel, advanced frame-to-frame calibration and stereo matching methodology designed to achieve both high accuracy and speed. Furthermore, we introduce a new approach to evaluate real-time performance by comparing real-time disparity maps with ground-truth disparity maps derived from more computationally intensive stereo matching algorithms. Crucially, the research demonstrates that high-pixel-count cameras yield high-quality point clouds only through the implementation of high-accuracy calibration.
- Abstract(参考訳): 高解像度(5MP+)ステレオビジョンシステムは、ロボット能力の進歩に不可欠であり、より長い範囲での操作を可能にし、3Dポイントの雲をはるかに高密度で正確に生成する。
しかし、高角分解能センサーの完全なポテンシャルを実現するには、キャリブレーションの精度と処理の高速化が相反する。
本研究では,新しいフレーム・フレーム・フレーム・キャリブレーションとステレオマッチング手法を用いて,5MPカメラ画像の処理による限界ギャップを解消する。
さらに,より計算集約的なステレオマッチングアルゴリズムから得られた実時間不均質マップと地中不整合マップを比較し,実時間性能を評価する新しい手法を提案する。
重要なこととして、この研究は、高画素数カメラが高精度キャリブレーションを実装することで、高品質な点雲を生み出すことを実証している。
関連論文リスト
- Accelerating 3D Photoacoustic Computed Tomography with End-to-End Physics-Aware Neural Operators [74.65171736966131]
光音響計算トモグラフィ(PACT)は、光コントラストと超音波分解能を組み合わせることで、光拡散限界を超える深部像を実現する。
現在の実装では、高密度トランスデューサアレイと長い取得時間を必要とし、臨床翻訳を制限している。
本研究では,センサ計測からボリューム再構成まで,逆音響マッピングを直接学習する物理認識モデルであるPanoを紹介する。
論文 参考訳(メタデータ) (2025-09-11T23:12:55Z) - CalibRefine: Deep Learning-Based Online Automatic Targetless LiDAR-Camera Calibration with Iterative and Attention-Driven Post-Refinement [7.736775961390864]
CalibRefineは完全に自動化され、ターゲットレス、オンラインキャリブレーションフレームワークである。
生のLiDAR点雲とカメラ画像を直接処理する。
以上の結果から,頑健なオブジェクトレベルの特徴マッチングと反復的改善と自己監督的注意に基づく改善が組み合わさって,信頼性の高いセンサアライメントを実現することが示唆された。
論文 参考訳(メタデータ) (2025-02-24T20:53:42Z) - EfficientPose 6D: Scalable and Efficient 6D Object Pose Estimation [4.595205112368888]
本研究は,GDRNPPに基づく高速かつスケーラブルなポーズ推定器の開発に焦点をあてる。
本稿では,推定時間と精度のトレードオフを考慮したAMISアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-19T19:21:23Z) - Advanced Object Detection and Pose Estimation with Hybrid Task Cascade and High-Resolution Networks [7.403403805442553]
本研究では,既存の6D-VNetフレームワークに基づく6次元オブジェクト検出とポーズ推定パイプラインを提案する。
HTCのマルチステージリファインメントプロセスとHRNetの高解像度表現能力の強みを活用することで,本手法は検出精度を大幅に向上し,推定精度を向上する。
論文 参考訳(メタデータ) (2025-02-06T08:48:34Z) - FAST GDRNPP: Improving the Speed of State-of-the-Art 6D Object Pose Estimation [0.0]
6Dオブジェクトのポーズ推定では、シーン内のオブジェクトの3次元の変換と回転を決定する。
現在のモデルでは、古典的モデルとディープラーニングベースのモデルの両方が、精度とレイテンシのトレードオフに悩まされることが多い。
モデルのサイズを減らし、推論時間を改善するために、いくつかの手法を用いる。
論文 参考訳(メタデータ) (2024-09-18T12:30:02Z) - PASTA: Towards Flexible and Efficient HDR Imaging Via Progressively Aggregated Spatio-Temporal Alignment [91.38256332633544]
PASTAは、HDRデゴスティングのためのプログレッシブアグリゲーションアグリゲーション・時空間アライメントフレームワークである。
提案手法は,特徴分散中の階層的表現を活用することにより,有効性と効率性を実現する。
実験結果から,従来のSOTA法よりもPASTAの方が視覚的品質と性能の両方で優れていることが示された。
論文 参考訳(メタデータ) (2024-03-15T15:05:29Z) - RCDN -- Robust X-Corner Detection Algorithm based on Advanced CNN Model [3.580983453285039]
複数の干渉下で入力に対して高いサブピクセル精度を維持することができる新しい検出アルゴリズムを提案する。
アルゴリズム全体は粗い戦略を採用しており、Xコーン検出ネットワークと3つの後処理技術を含んでいる。
実画像および合成画像の評価は,提案アルゴリズムが他の一般的な手法よりも検出率,サブピクセル精度,ロバスト性が高いことを示す。
論文 参考訳(メタデータ) (2023-07-07T10:40:41Z) - Efficient High-Resolution Deep Learning: A Survey [90.76576712433595]
スマートフォン、衛星、医療機器などの現代の機器のカメラは、非常に高解像度の画像やビデオを撮影することができる。
このような高解像度データは、がん検出、自動道路ナビゲーション、天気予報、監視、農業プロセスの最適化、その他多くの応用のためのディープラーニングモデルによって処理される。
ディープラーニングモデルの直接入力として高解像度の画像とビデオを使用することで、パラメータの多さ、計算コスト、推論レイテンシ、GPUメモリ使用量など、多くの課題が生じる。
文献におけるいくつかの研究は、高解像度データの課題に対処し、ハードウェアの制限に従いながら精度とスピードを改善するために、より良い代替案を提案する。
論文 参考訳(メタデータ) (2022-07-26T17:13:53Z) - Projected GANs Converge Faster [50.23237734403834]
GAN(Generative Adversarial Networks)は高品質な画像を生成するが、訓練は難しい。
生成したサンプルと実際のサンプルを固定された事前訓練された特徴空間に投影することで、これらの問題に大きく取り組みます。
我々の投影GANは画像品質、サンプル効率、収束速度を改善する。
論文 参考訳(メタデータ) (2021-11-01T15:11:01Z) - Neural Disparity Refinement for Arbitrary Resolution Stereo [67.55946402652778]
本稿では,安価で広範なコンシューマデバイスへの3Dコンピュータビジョンの展開を容易にすることを目的とした,ニューラルディファリティ改善のための新しいアーキテクチャを提案する。
我々のアプローチは任意の出力解像度で洗練された不均一写像を推定できる連続的な定式化に依存している。
論文 参考訳(メタデータ) (2021-10-28T18:00:00Z) - Towards quantum 3D imaging devices: the Qu3D project [0.6602265103893045]
量子望遠カメラは、運動量配置の絡み合いと光子数相関を利用して、光学素子の典型的な再焦点化と超高速で走査不要な3Dイメージング機能を提供する。
しかし、提案されたデバイスの量子的利点がエンドユーザに効果的で魅力的であるためには、2つの大きな課題に取り組む必要がある。
3D画像の検索や2D画像の再焦点を行うために、この膨大な量のデータを抽出するには、高性能で時間を要する計算が必要である。
論文 参考訳(メタデータ) (2021-06-15T01:14:51Z) - Searching for Efficient Architecture for Instrument Segmentation in
Robotic Surgery [58.63306322525082]
ほとんどのアプリケーションは、高解像度の外科画像の正確なリアルタイムセグメンテーションに依存している。
我々は,高解像度画像のリアルタイム推論を行うために調整された,軽量で高効率なディープ残差アーキテクチャを設計する。
論文 参考訳(メタデータ) (2020-07-08T21:38:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。