論文の概要: SteROI-D: System Design and Mapping for Stereo Depth Inference on Regions of Interest
- arxiv url: http://arxiv.org/abs/2502.09528v1
- Date: Thu, 13 Feb 2025 17:39:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-14 13:44:40.459339
- Title: SteROI-D: System Design and Mapping for Stereo Depth Inference on Regions of Interest
- Title(参考訳): SteROI-D:関心領域のステレオ深度推定のためのシステム設計とマッピング
- Authors: Jack Erhardt, Ziang Li, Reid Pinkham, Andrew Berkovich, Zhengya Zhang,
- Abstract要約: 機械学習アルゴリズムにより、Augmented and Virtual Reality (AR/VR)デバイス上での高品質なステレオ深度推定が可能になった。
フル画像処理スタック全体の高エネルギー消費は、ステレオディープアルゴリズムがバッテリ制限されたデバイス上で効果的に動作することを防ぐ。
本稿では,マッピング手法と組み合わせたフルステレオ深度システムであるSteROI-Dを紹介する。
28nmのプロトタイプ設計では,ベースラインASICに比べてシステムエネルギーの最大4.35倍の削減を実現している。
- 参考スコア(独自算出の注目度): 4.222590731080673
- License:
- Abstract: Machine learning algorithms have enabled high quality stereo depth estimation to run on Augmented and Virtual Reality (AR/VR) devices. However, high energy consumption across the full image processing stack prevents stereo depth algorithms from running effectively on battery-limited devices. This paper introduces SteROI-D, a full stereo depth system paired with a mapping methodology. SteROI-D exploits Region-of-Interest (ROI) and temporal sparsity at the system level to save energy. SteROI-D's flexible and heterogeneous compute fabric supports diverse ROIs. Importantly, we introduce a systematic mapping methodology to effectively handle dynamic ROIs, thereby maximizing energy savings. Using these techniques, our 28nm prototype SteROI-D design achieves up to 4.35x reduction in total system energy compared to a baseline ASIC.
- Abstract(参考訳): 機械学習アルゴリズムにより、Augmented and Virtual Reality (AR/VR)デバイス上での高品質なステレオ深度推定が可能になった。
しかし、フル画像処理スタック全体にわたる高エネルギー消費は、ステレオディープアルゴリズムがバッテリ制限されたデバイス上で効果的に動作することを防ぐ。
本稿では,マッピング手法と組み合わせたフルステレオディープシステムであるSteROI-Dを紹介する。
SteROI-Dは、省エネのために、システムレベルでのRerea-of-Interest(ROI)と時間的間隔を利用する。
SteROI-Dのフレキシブルで異質な計算ファブリックは多様なROIをサポートする。
重要なことは、動的ROIを効果的に扱うための体系的なマッピング手法を導入し、それによって省エネを最大化することである。
これらの技術を用いて、28nmのプロトタイプSteROI-Dの設計は、ベースラインASICと比較してシステム全体のエネルギーを最大4.35倍削減する。
関連論文リスト
- Real-time Multi-view Omnidirectional Depth Estimation System for Robots and Autonomous Driving on Real Scenes [9.073031720400401]
ロボットと車両の両方の現実シナリオにおけるナビゲーションと障害物回避のための全方位深度推定システムとそれに対応するアルゴリズムを提案する。
実時間全方位深度推定を実現するために,球面スイーシング法とモデルアーキテクチャを併用したRtHexa-OmniMVSアルゴリズムを提案する。
提案アルゴリズムは,屋内および屋外の両方で複雑な実世界のシナリオにおいて高い精度を示し,エッジコンピューティングプラットフォーム上で15fpsの推論速度を実現する。
論文 参考訳(メタデータ) (2024-09-12T08:44:35Z) - LightStereo: Channel Boost Is All Your Need for Efficient 2D Cost Aggregation [27.00836175513738]
LightStereoは、マッチングプロセスを加速するために作られた最先端のステレオマッチングネットワークである。
私たちのブレークスルーは、3Dコストボリュームのチャネル次元に特化してパフォーマンスを向上させることです。
LightStereoは、SceneFlowデータセットで競合するEPEメトリックを達成し、最低でも22GFLOPと17msのランタイムを必要とする。
論文 参考訳(メタデータ) (2024-06-28T11:11:24Z) - Egocentric RGB+Depth Action Recognition in Industry-Like Settings [50.38638300332429]
本研究は,産業的な環境下での自我中心のRGBとDepthモダリティからの行動の認識に焦点を当てる。
我々のフレームワークは、RGBとDepthの両方のモダリティを効果的に符号化する3DビデオSWIN変換器に基づいている。
また,ICIAP 2023におけるマルチモーダル動作認識チャレンジにおいて,本手法が第1位を確保した。
論文 参考訳(メタデータ) (2023-09-25T08:56:22Z) - Non-Intrusive Electric Load Monitoring Approach Based on Current Feature
Visualization for Smart Energy Management [51.89904044860731]
我々はAIのコンピュータビジョン技術を用いて、スマートエネルギー管理のための非侵襲的な負荷監視手法を設計する。
マルチスケールの特徴抽出とアテンション機構を備えたU字型ディープニューラルネットワークを用いて,色特徴画像からすべての電気負荷を認識することを提案する。
論文 参考訳(メタデータ) (2023-08-08T04:52:19Z) - Neural Disparity Refinement for Arbitrary Resolution Stereo [67.55946402652778]
本稿では,安価で広範なコンシューマデバイスへの3Dコンピュータビジョンの展開を容易にすることを目的とした,ニューラルディファリティ改善のための新しいアーキテクチャを提案する。
我々のアプローチは任意の出力解像度で洗練された不均一写像を推定できる連続的な定式化に依存している。
論文 参考訳(メタデータ) (2021-10-28T18:00:00Z) - Self-Supervised Depth Completion for Active Stereo [55.79929735390945]
アクティブステレオシステムは、低コストで高品質な深度マップのため、ロボット産業で広く利用されている。
これらの深度センサーはステレオアーチファクトに悩まされており、密度の深い深度推定を提供していない。
本稿では, 高精度な深度マップを推定するアクティブステレオシステムのための, 自己監督型深度補完法を提案する。
論文 参考訳(メタデータ) (2021-10-07T07:33:52Z) - Unpaired Single-Image Depth Synthesis with cycle-consistent Wasserstein
GANs [1.0499611180329802]
実環境深度のリアルタイム推定は、様々な自律システムタスクにとって必須のモジュールである。
本研究では、生成型ニューラルネットワークの分野における最近の進歩を、教師なしの単一画像深度合成に活用する。
論文 参考訳(メタデータ) (2021-03-31T09:43:38Z) - Exploiting Beam Search Confidence for Energy-Efficient Speech
Recognition [0.0]
エッジデバイス用低消費電力ハードウェアを中心に、ASRシステムのエネルギー効率と性能を向上させる技術を提案します。
これにより、音響モデル評価のエネルギーと実行時間をそれぞれ25.6%と25.9%削減し、無視可能な精度の損失を伴います。
論文 参考訳(メタデータ) (2021-01-22T12:35:35Z) - Channel Attention based Iterative Residual Learning for Depth Map
Super-Resolution [58.626803922196146]
我々は、合成データセットで訓練されたDSRモデルは制限的であり、実世界のDSRタスクを扱うのに有効ではないと論じる。
我々は、異なる深度センサの現実世界の劣化に対処するために2つの貢献をしている。
4つのモジュールからなる実世界のDSRのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-02T09:12:23Z) - OmniSLAM: Omnidirectional Localization and Dense Mapping for
Wide-baseline Multi-camera Systems [88.41004332322788]
超広視野魚眼カメラ(FOV)を用いた広視野多視点ステレオ構成のための全方向位置決めと高密度マッピングシステムを提案する。
より実用的で正確な再構築のために、全方向深度推定のための改良された軽量のディープニューラルネットワークを導入する。
我々は全方位深度推定をビジュアル・オドメトリー(VO)に統合し,大域的整合性のためのループ閉鎖モジュールを付加する。
論文 参考訳(メタデータ) (2020-03-18T05:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。