論文の概要: ViM-Disparity: Bridging the Gap of Speed, Accuracy and Memory for Disparity Map Generation
- arxiv url: http://arxiv.org/abs/2412.16745v1
- Date: Sat, 21 Dec 2024 19:41:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 15:58:33.301707
- Title: ViM-Disparity: Bridging the Gap of Speed, Accuracy and Memory for Disparity Map Generation
- Title(参考訳): ViM-Disparity: 分散マップ生成のためのスピード、精度、メモリのギャップを埋める
- Authors: Maheswar Bora, Tushar Anand, Saurabh Atreya, Aritra Mukherjee, Abhijit Das,
- Abstract要約: 分散マップ生成(DMG)の計算オーバーヘッドが低いリアルタイムかつ高精度なモデルにおいて,既存のトレードオフを解消するためのVisual Mamba (ViM) アーキテクチャを提案する。
また,DMGモデルの推論速度,計算オーバーヘッド,精度を共同評価できる性能指標を提案した。
- 参考スコア(独自算出の注目度): 1.1166701898428382
- License:
- Abstract: In this work we propose a Visual Mamba (ViM) based architecture, to dissolve the existing trade-off for real-time and accurate model with low computation overhead for disparity map generation (DMG). Moreover, we proposed a performance measure that can jointly evaluate the inference speed, computation overhead and the accurateness of a DMG model.
- Abstract(参考訳): 本研究では,分散マップ生成(DMG)の計算オーバーヘッドが低いリアルタイムかつ正確なモデルにおいて,既存のトレードオフを解消するために,Visual Mamba (ViM) ベースのアーキテクチャを提案する。
さらに,DMGモデルの推論速度,計算オーバーヘッド,精度を共同評価できる性能指標を提案した。
関連論文リスト
- MambaVT: Spatio-Temporal Contextual Modeling for robust RGB-T Tracking [51.28485682954006]
本研究では,マンバをベースとした純フレームワーク(MambaVT)を提案する。
具体的には、長距離クロスフレーム統合コンポーネントを考案し、ターゲットの外観変化にグローバルに適応する。
実験では、RGB-TトラッキングのためのMambaのビジョンの可能性が示され、MambaVTは4つの主要なベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-08-15T02:29:00Z) - A-SDM: Accelerating Stable Diffusion through Model Assembly and Feature Inheritance Strategies [51.7643024367548]
安定拡散モデルは、テキスト・ツー・イメージ(T2I)と画像・ツー・イメージ(I2I)生成のための一般的かつ効果的なモデルである。
本研究では、SDMにおける冗長計算の削減と、チューニング不要とチューニング不要の両方の手法によるモデルの最適化に焦点をあてる。
論文 参考訳(メタデータ) (2024-05-31T21:47:05Z) - Deep Learning Methods for Adjusting Global MFD Speed Estimations to Local Link Configurations [4.2185937778110825]
本研究では,MFDに基づくネットワーク平均速度とネットワーク構成を統合し,リンクの個々の速度を正確に推定するローカル補正係数(LCF)を提案する。
ネットワークの空間的構成と時間的ダイナミクスの両方をキャプチャするために、新しいディープラーニングフレームワークを使用します。
本モデルは,集約モデルの計算的利点を保ちながら,リンクレベルの交通速度推定の精度を向上させる。
論文 参考訳(メタデータ) (2024-05-23T07:37:33Z) - MiM-ISTD: Mamba-in-Mamba for Efficient Infrared Small Target Detection [72.46396769642787]
ネスト構造であるMamba-in-Mamba(MiM-ISTD)を開発した。
MiM-ISTDはSOTA法より8倍高速で、2048×2048$のイメージでテストすると、GPUメモリ使用率を62.2$%削減する。
論文 参考訳(メタデータ) (2024-03-04T15:57:29Z) - A-SDM: Accelerating Stable Diffusion through Redundancy Removal and
Performance Optimization [54.113083217869516]
本研究ではまず,ネットワークの計算冗長性について検討する。
次に、モデルの冗長性ブロックをプルークし、ネットワーク性能を維持する。
第3に,計算集約型注意部を高速化するグローバル地域対話型注意(GRI)を提案する。
論文 参考訳(メタデータ) (2023-12-24T15:37:47Z) - On Inference Stability for Diffusion Models [6.846175045133414]
DPM(Denoising Probabilistic Models)は、多彩で高品質な画像を生成するのに優れた生成モデルの分野である。
現在のDPMのトレーニング手法の多くは、時間ステップ間の相関を無視することが多く、画像生成におけるモデルの性能を効果的に制限している。
そこで本研究では,サンプリング品質を高めるために,推定ギャップを小さくすることを目的とした,新しいtextVinitsequence-aware Losを提案する。
論文 参考訳(メタデータ) (2023-12-19T18:57:34Z) - Incremental Multimodal Surface Mapping via Self-Organizing Gaussian
Mixture Models [1.0878040851638]
本文では,環境を連続確率モデルとして表わすインクリメンタルなマルチモーダル表面マッピング手法について述べる。
この研究で使用される戦略は環境を表現するためにガウス混合モデル(GMM)を用いる。
このギャップを埋めるために,高速GMMサブマップ抽出のための空間ハッシュマップを導入する。
論文 参考訳(メタデータ) (2023-09-19T19:49:03Z) - MapPrior: Bird's-Eye View Map Layout Estimation with Generative Models [24.681557413829317]
MapPriorは、従来のBEV知覚モデルと、セマンティックマップレイアウトのための学習された生成モデルを組み合わせた、新しいBEV知覚フレームワークである。
提出時点でMapPriorは、カメラおよびLiDARベースのBEV知覚において、MDDとECEのスコアを大幅に改善し、最強の競合方法を上回っている。
論文 参考訳(メタデータ) (2023-08-24T17:58:30Z) - Design and Prototyping Distributed CNN Inference Acceleration in Edge
Computing [85.74517957717363]
HALPはエッジコンピューティングにおけるエッジデバイス(ED)間のシームレスなコラボレーションを設計することで推論を加速する。
実験により、分散推論HALPはVGG-16に対して1.7倍の推論加速を達成することが示された。
分散推論HALPを用いたモデル選択は,サービスの信頼性を著しく向上させることができる。
論文 参考訳(メタデータ) (2022-11-24T19:48:30Z) - An Online Semantic Mapping System for Extending and Enhancing Visual
SLAM [2.538209532048867]
本稿では,2次元から3次元の物体検出パイプラインと,生成されたランドマークの高速なデータアソシエーションを用いた,移動型視覚システムのためのリアルタイムセマンティックマッピング手法を提案する。
我々のシステムは,65msの平均反復時間でリアルタイムに到達し,公開データセット上での最先端SLAMのポーズ推定を最大68%向上させることができる。
論文 参考訳(メタデータ) (2022-03-08T09:14:37Z) - A Generative Learning Approach for Spatio-temporal Modeling in Connected
Vehicular Network [55.852401381113786]
本稿では,コネクテッドカーの無線アクセス遅延を実現するための総合的時間品質フレームワークであるLaMI(Latency Model Inpainting)を提案する。
LaMIはイメージインペイントと合成のアイデアを採用し、2段階の手順で欠落したレイテンシサンプルを再構築することができる。
特に、パッチ方式のアプローチを用いて各地域で収集されたサンプル間の空間的相関を初めて発見し、その後、原点および高度に相関したサンプルをバラエナオートコーダ(VAE)に供給する。
論文 参考訳(メタデータ) (2020-03-16T03:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。