Fugu-MT 論文翻訳(概要): LightStereo: Channel Boost Is All Your Need for Efficient 2D Cost Aggregation

論文の概要: LightStereo: Channel Boost Is All Your Need for Efficient 2D Cost Aggregation

arxiv url: http://arxiv.org/abs/2406.19833v2
Date: Sat, 16 Nov 2024 03:11:30 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:34.235007
Title: LightStereo: Channel Boost Is All Your Need for Efficient 2D Cost Aggregation
Title（参考訳）: LightStereo:Channel Boostは効率的な2Dコストアグリゲーションに必要なもの
Authors: Xianda Guo, Chenming Zhang, Youmin Zhang, Wenzhao Zheng, Dujun Nie, Matteo Poggi, Long Chen,
Abstract要約: LightStereoは、マッチングプロセスを加速するために作られた最先端のステレオマッチングネットワークである。私たちのブレークスルーは、3Dコストボリュームのチャネル次元に特化してパフォーマンスを向上させることです。 LightStereoは、SceneFlowデータセットで競合するEPEメトリックを達成し、最低でも22GFLOPと17msのランタイムを必要とする。
参考スコア（独自算出の注目度）: 27.00836175513738
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present LightStereo, a cutting-edge stereo-matching network crafted to accelerate the matching process. Departing from conventional methodologies that rely on aggregating computationally intensive 4D costs, LightStereo adopts the 3D cost volume as a lightweight alternative. While similar approaches have been explored previously, our breakthrough lies in enhancing performance through a dedicated focus on the channel dimension of the 3D cost volume, where the distribution of matching costs is encapsulated. Our exhaustive exploration has yielded plenty of strategies to amplify the capacity of the pivotal dimension, ensuring both precision and efficiency. We compare the proposed LightStereo with existing state-of-the-art methods across various benchmarks, which demonstrate its superior performance in speed, accuracy, and resource utilization. LightStereo achieves a competitive EPE metric in the SceneFlow datasets while demanding a minimum of only 22 GFLOPs and 17 ms of runtime, and ranks 1st on KITTI 2015 among real-time models. Our comprehensive analysis reveals the effect of 2D cost aggregation for stereo matching, paving the way for real-world applications of efficient stereo systems. Code will be available at \url{https://github.com/XiandaGuo/OpenStereo}.
Abstract（参考訳）: 提案するLightStereoは,マッチングプロセスの高速化を目的とした,最先端のステレオマッチングネットワークである。計算集約的な4Dコストの集約に依存する従来の手法とは別に、LightStereoは軽量な代替手段として3Dコストボリュームを採用する。類似したアプローチがこれまで検討されてきたが、我々のブレークスルーは、マッチングコストの分布がカプセル化される3Dコストボリュームのチャネル次元に焦点をあてることで、パフォーマンスを向上させることである。私たちの徹底的な探索は、重要な次元のキャパシティを増幅し、精度と効率の両方を確保するための多くの戦略を生み出しました。提案したLightStereoと,その速度,精度,資源利用性において優れた性能を示す各種ベンチマークの最先端手法を比較した。 LightStereoは、SceneFlowデータセットで競合するEPEメトリックを達成し、最低でも22GFLOPと17msのランタイムしか要求せず、リアルタイムモデルの中ではKITTI 2015で1位にランクインしている。本報告では, ステレオマッチングにおける2次元コストアグリゲーションの効果を明らかにするとともに, 効率的なステレオシステムの現実的応用への道を開いた。コードは \url{https://github.com/XiandaGuo/OpenStereo} で入手できる。

関連論文リスト

Decoupling Bidirectional Geometric Representations of 4D cost volume with 2D convolution [40.103929972279126]
本報告では,DBStereoの4次元コストアグリゲーションネットワークについて述べる。純粋な2D畳み込みに基づいており、同時にリアルタイムのパフォーマンスと印象的な精度を達成する。
論文参考訳（メタデータ） (2025-09-02T15:21:49Z)
Second-order Optimization of Gaussian Splats with Importance Sampling [51.95046424364725]
3D Gaussian Splatting (3DGS) は、高品質で高速な推論時間のため、新しいビューレンダリングに広く用いられている。本稿では,Levenberg-Marquardt (LM) と Conjugate Gradient (CG) に基づく新しい2階最適化手法を提案する。提案手法は標準LMよりも3倍の高速化を実現し,ガウス数が少ない場合のAdamを6倍の6倍の速さで上回る。
論文参考訳（メタデータ） (2025-04-17T12:52:08Z)
Boosting Omnidirectional Stereo Matching with a Pre-trained Depth Foundation Model [62.37493746544967]
カメラベースの設定は、立体深度推定を用いて高解像度の高解像度深度マップを生成することで、コスト効率のよい選択肢を提供する。既存の全方位ステレオマッチング手法は、様々な環境において限られた深度精度しか達成できない。 DFI-OmniStereoは, 大規模事前学習基礎モデルを用いて, 相対的な単眼深度推定を行う新しい全方位ステレオマッチング法である。
論文参考訳（メタデータ） (2025-03-30T16:24:22Z)
ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文参考訳（メタデータ） (2024-11-12T11:32:56Z)
RomniStereo: Recurrent Omnidirectional Stereo Matching [6.153793254880079]
本稿では,全方向ステレオマッチング (RomniStereo) アルゴリズムを提案する。我々の最良のモデルは、以前のSOTAベースラインよりも平均MAE値が40.7%向上する。結果の可視化では, 合成例と実例の両方において, 明らかな優位性を示す。
論文参考訳（メタデータ） (2024-01-09T04:06:01Z)
AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文参考訳（メタデータ） (2021-12-09T15:10:47Z)
Correlate-and-Excite: Real-Time Stereo Matching via Guided Cost Volume Excitation [65.83008812026635]
本稿では,GCE ( Guided Cost Volume Excitation) を構築し,画像によって誘導されるコストボリュームの簡単なチャネル励磁により,性能が大幅に向上することを示す。我々はCorrelate-and-Excite(CoEx)と呼ぶエンドツーエンドネットワークを提案する。
論文参考訳（メタデータ） (2021-08-12T14:32:26Z)
ES-Net: An Efficient Stereo Matching Network [4.8986598953553555]
既存のステレオマッチングネットワークは通常、性能を改善するために遅くて計算コストのかかる3D畳み込みを使用する。本稿では,高性能かつ効率的な推定を実現する効率的なステレオネットワーク(esnet)を提案する。
論文参考訳（メタデータ） (2021-03-05T20:11:39Z)
Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。しかし、その推測時間は一般的に540p画像の秒数で遅い。本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文参考訳（メタデータ） (2020-12-01T23:58:16Z)
Displacement-Invariant Matching Cost Learning for Accurate Optical Flow Estimation [109.64756528516631]
学習のマッチングコストは、最先端のディープステレオマッチング手法の成功に不可欠であることが示されている。本稿では,5次元特徴量構築の要件を回避できる新しい手法を提案する。提案手法は,各種データセットにおける最先端の精度を実現し,Sintelベンチマークにおける全光フロー法より優れる。
論文参考訳（メタデータ） (2020-10-28T09:57:00Z)
Content-Aware Inter-Scale Cost Aggregation for Stereo Matching [42.02981855948903]
本手法は,異なるスケールで情報収集を行う際に,信頼性の高い詳細回復を実現する。 3次元フィルタ重みを効率的に構築し、3次元コスト容積を集約する新しい分解戦略を提案する。 Scene Flow データセット,KITTI2015 と Middlebury の実験結果から,本手法の有効性が示された。
論文参考訳（メタデータ） (2020-06-05T02:38:34Z)
AANet: Adaptive Aggregation Network for Efficient Stereo Matching [33.39794232337985]
現在の最先端ステレオモデルは、ほとんどが高価な3D畳み込みに基づいている。エッジフェットング問題を緩和するために,スパースポイントに基づくスケール内コストアグリゲーション手法を提案する。また、従来のクロススケールなコスト集約アルゴリズムをニューラルネットワーク層に近似して、大きなテクスチャレス領域を処理する。
論文参考訳（メタデータ） (2020-04-20T18:07:55Z)
3DSSD: Point-based 3D Single Stage Object Detector [61.67928229961813]
本稿では,3DSSDと命名された点ベース3次元単段物体検出器を提案し,精度と効率のバランスが良好であることを示す。提案手法は,最先端のボクセルをベースとした一段法を大差で上回り,二段法に匹敵する性能を有する。
論文参考訳（メタデータ） (2020-02-24T12:01:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。