論文の概要: Pip-Stereo: Progressive Iterations Pruner for Iterative Optimization based Stereo Matching
- arxiv url: http://arxiv.org/abs/2602.20496v1
- Date: Tue, 24 Feb 2026 02:51:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.583912
- Title: Pip-Stereo: Progressive Iterations Pruner for Iterative Optimization based Stereo Matching
- Title(参考訳): Pip-Stereo: 反復最適化に基づくステレオマッチングのためのプログレッシブイテレーションプルーナ
- Authors: Jintu Zheng, Qizhe Liu, HuangXin Xu, Zhuojie Chen,
- Abstract要約: 反復的改善を解析し,不均一な更新が空間的に疎外であり,時間的に冗長であることを明らかにする。
専用単分子エンコーダを必要とせず,奥行き先を暗黙的に埋め込む,協調的な単分子先行転送フレームワークを提案する。
第3に,構造化空間とI/O意識設計を利用したハードウェア対応RNN演算子であるFlashGRUを開発した。
- 参考スコア(独自算出の注目度): 2.226667542457085
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While iterative stereo matching achieves high accuracy, its dependence on Recurrent Neural Networks (RNN) hinders edge deployment, a challenge underexplored in existing researches. We analyze iterative refinement and reveal that disparity updates are spatially sparse and temporally redundant. First, we introduce a progressive iteration pruning strategy that suppresses redundant update steps, effectively collapsing the recursive computation into a near-single-pass inference. Second, we propose a collaborative monocular prior transfer framework that implicitly embeds depth priors without requiring a dedicated monocular encoder, thereby eliminating its associated computational burden. Third, we develop FlashGRU, a hardware-aware RNN operator leveraging structured sparsity and I/O-conscious design, achieving a 7.28$\times$ speedup, 76.6\% memory peak reduction and 80.9\% global memory requests reduction over natvie ConvGRUs under 2K resolution. Our PipStereo enables real-time, high-fidelity stereo matching on edge hardware: it processes 320$\times$640 frames in just 75ms on an NVIDIA Jetson Orin NX (FP16) and 19ms on RTX 4090, matching the accuracy of large iterative based models, and our generalization ability and accuracy far exceeds that of existing real-time methods. Our embedded AI projects will be updated at: https://github.com/XPENG-Aridge-AI.
- Abstract(参考訳): 反復ステレオマッチングは高い精度を達成するが、リカレントニューラルネットワーク(RNN)への依存はエッジデプロイメントを妨げる。
反復的改善を解析し,不均一な更新が空間的に疎外であり,時間的に冗長であることを明らかにする。
まず、冗長な更新ステップを抑えるプログレッシブ・イテレーション・プルーニング・ストラテジーを導入し、再帰的計算をほぼ単一パスの推論に効果的に崩壊させる。
第2に,専用モノクルエンコーダを必要とせず,暗黙的に奥行き先を埋め込むコラボレーティブなモノクル先行転送フレームワークを提案する。
第三に、構造化空間性とI/O意識設計を活かしたハードウェア対応RNNオペレータであるFlashGRUを開発し、2K解像度で7.28$\times$スピードアップ、76.6\%メモリピーク削減、80.9\%グローバルメモリリクエスト削減を実現した。
NVIDIA Jetson Orin NX (FP16)でわずか75msで320$\times$640フレーム、RTX 4090で19msで処理し、大規模な反復型モデルの精度と一致し、我々の一般化能力と精度は既存のリアルタイムメソッドよりもはるかに高い。
組み込みAIプロジェクトは、次のようにアップデートされる。
関連論文リスト
- Scalable Generative Game Engine: Breaking the Resolution Wall via Hardware-Algorithm Co-Design [17.941176878609337]
我々は、スケーラブルなTextitHardware-Algorithm共設計フレームワークを導入することにより、生成モデルと高分解能ニューラルネットワークのギャップを埋める。
このシステムは, それぞれ26.4 FPSと48.3 FPSの流体を供給し, 有効遅延は2.7msである。
論文 参考訳(メタデータ) (2026-01-31T08:52:51Z) - LiQSS: Post-Transformer Linear Quantum-Inspired State-Space Tensor Networks for Real-Time 6G [85.58816960936069]
Sixth-Generation (6G) Open Radio Access Networks (O-RAN) における能動的およびエージェント的制御は、厳密なニアタイム(Near-RT)レイテンシと計算制約の下で制御グレードの予測を必要とする。
本稿では,効率的な無線テレメトリ予測のための変圧器後パラダイムについて検討する。
本稿では、自己アテンションを安定な状態空間動的カーネルに置き換える量子インスピレーション付き状態空間テンソルネットワークを提案する。
論文 参考訳(メタデータ) (2026-01-18T12:08:38Z) - Progressive Supernet Training for Efficient Visual Autoregressive Modeling [56.15415456746672]
本稿では,パラダイムとフルネットワークの両方の世代品質のフロンティアを突破するトレーニング戦略を提案する。
ImageNetの実験では、事前訓練されたVAR-d30、VARiant-d16、VARiant-d8と比べ、ほぼ同等の品質を実現している。
VARiant-d2は3.5倍のスピードアップと80%のメモリ削減を実現している。
論文 参考訳(メタデータ) (2025-11-20T16:59:24Z) - Enabling Vibration-Based Gesture Recognition on Everyday Furniture via Energy-Efficient FPGA Implementation of 1D Convolutional Networks [11.481972015296812]
本研究では、低消費電力フィールドプログラマブルゲートアレイ(FPGA)上にコンパクトNNを展開させるエネルギー効率のよいソリューションを提案する。
我々は、複雑なスペクトル前処理を生波形入力に置き換え、複雑なオンボード前処理を不要とし、精度を犠牲にすることなく入力サイズを21倍削減する。
組み込みFPGAに適した2つの軽量アーキテクチャ(1D-CNNと1D-SepCNN)を設計し、パラメータを3億6900万から216に削減し、同等の精度を維持した。
論文 参考訳(メタデータ) (2025-10-27T09:30:36Z) - Speedy MASt3R [68.47052557089631]
MASt3Rは、DUSt3Rを活用して高速な相互マッチング方式を導入することで、画像マッチングを3Dタスクとして再定義する。
高速MASt3Rは、精度を犠牲にすることなく、推論時間(画像ペアあたり198msから91ms)を54%削減する。
この進歩により、リアルタイムな3D理解が可能になり、複合現実ナビゲーションや大規模3Dシーン再構築といったアプリケーションに恩恵をもたらす。
論文 参考訳(メタデータ) (2025-03-13T03:56:22Z) - Accelerating Linear Recurrent Neural Networks for the Edge with Unstructured Sparsity [39.483346492111515]
線形リカレントニューラルネットワークは、推論中に一定のメモリ使用量と時間毎の時間を含む強力な長距離シーケンスモデリングを可能にする。
非構造化空間は、互換性のあるハードウェアプラットフォームによって加速されるときに、計算とメモリの要求を大幅に削減できる魅力的なソリューションを提供する。
非常に疎い線形RNNは、高密度ベースラインよりも高い効率と性能のトレードオフを一貫して達成している。
論文 参考訳(メタデータ) (2025-02-03T13:09:21Z) - Efficient Depth Estimation for Unstable Stereo Camera Systems on AR Glasses [1.086544864007391]
近年のハードウェアにおけるMLアクセラレーション(GPUとNPU)を考慮した補正とコストボリュームへのアプローチを開発する。
提案手法に基づき,MultiHeadDepth と HomoDepth を開発した。
修正されていないイメージを直接処理できるHomoDepthは、エンドツーエンドのレイテンシを44.5%削減する。
論文 参考訳(メタデータ) (2024-11-15T07:43:45Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - FastEmit: Low-latency Streaming ASR with Sequence-level Emission
Regularization [78.46088089185156]
ストリーム自動音声認識(ASR)は、仮説化された単語を可能な限り迅速かつ正確に出力することを目的としている。
既存のアプローチでは、シーケンストランスデューサモデルにおいて、トーケン単位またはフレーム単位の確率予測を演算することで、発光遅延をペナルティ化する。
本稿では,訓練用トランスデューサモデルにおいて,シーケンス毎の確率に遅延正規化を直接適用する,FastEmitというシーケンスレベルのエミッション正規化手法を提案する。
論文 参考訳(メタデータ) (2020-10-21T17:05:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。