論文の概要: Full Matching on Low Resolution for Disparity Estimation
- arxiv url: http://arxiv.org/abs/2012.05586v1
- Date: Thu, 10 Dec 2020 11:11:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-15 06:23:20.529289
- Title: Full Matching on Low Resolution for Disparity Estimation
- Title(参考訳): 差分推定のための低分解能完全マッチング
- Authors: Hong Zhang and Shenglun Chen and Zhihui Wang and Haojie Li and Wanli
Ouyang
- Abstract要約: 本研究では,マルチステージ完全一致格差推定法(MFM)を提案する。
また,低分解能3次元コストを見積もる代わりに,低分解能4次元ボリュームから全類似度スコアを段階的に切り離すことを実証した。
実験の結果,提案手法は,シーンフローやkitti 2012,kitti 2015のデータセットにおいて,より正確な不一致推定結果を達成し,最先端の手法を上回った。
- 参考スコア(独自算出の注目度): 84.45201205560431
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A Multistage Full Matching disparity estimation scheme (MFM) is proposed in
this work. We demonstrate that decouple all similarity scores directly from the
low-resolution 4D volume step by step instead of estimating low-resolution 3D
cost volume through focusing on optimizing the low-resolution 4D volume
iteratively leads to more accurate disparity. To this end, we first propose to
decompose the full matching task into multiple stages of the cost aggregation
module. Specifically, we decompose the high-resolution predicted results into
multiple groups, and every stage of the newly designed cost aggregation module
learns only to estimate the results for a group of points. This alleviates the
problem of feature internal competitive when learning similarity scores of all
candidates from one low-resolution 4D volume output from one stage. Then, we
propose the strategy of \emph{Stages Mutual Aid}, which takes advantage of the
relationship of multiple stages to boost similarity scores estimation of each
stage, to solve the unbalanced prediction of multiple stages caused by serial
multistage framework. Experiment results demonstrate that the proposed method
achieves more accurate disparity estimation results and outperforms
state-of-the-art methods on Scene Flow, KITTI 2012 and KITTI 2015 datasets.
- Abstract(参考訳): 本研究では,マルチステージ完全一致不一致推定法(MFM)を提案する。
低解像度の4Dボリュームを最適化することに集中して、低解像度の3Dコストボリュームを推定する代わりに、低解像度の4Dボリュームステップから直接、すべての類似度スコアを段階的に切り離すことを実証する。
そこで我々はまず,全整合タスクをコスト集約モジュールの複数の段階に分解することを提案する。
具体的には、高分解能予測結果を複数のグループに分解し、新しく設計されたコストアグリゲーションモジュールの各ステージは、ポイントのグループの結果を見積もるためにのみ学習する。
これにより、1段階からの低解像度4Dボリューム出力から、全ての候補の類似度スコアを学習する際に、機能内部の競合が軽減される。
そこで本研究では,複数段階の関係を利用して各段階の類似度スコアを推定し,複数段階の連続多段階フレームワークによる不均衡予測を解消する,多段階間相互援助戦略を提案する。
実験により,提案手法はより精度の高い不均一性推定を行い,Scene Flow,KITTI 2012,KITTI 2015データセットの最先端手法より優れていた。
関連論文リスト
- SITCOM: Step-wise Triple-Consistent Diffusion Sampling for Inverse Problems [14.2814208019426]
拡散モデル(英: Diffusion Model、DM)は、トレーニングセット上で学習した分布からサンプリングできる生成モデルのクラスである。
DMは通常、画像空間内の測定条件分布からおよそサンプルに修正される。
これらの修正は、特定の設定(測定ノイズの存在など)や非線形タスクには適さないかもしれない。
測定一貫性拡散軌道を達成するための3つの条件を述べる。
論文 参考訳(メタデータ) (2024-10-06T13:39:36Z) - Hit the Sweet Spot! Span-Level Ensemble for Large Language Models [8.34562564266839]
本研究では,リアルタイム調整の必要性と正確なアンサンブル決定に必要な情報とを効果的にバランスさせるスパンレベルアンサンブル手法であるSweetSpanを提案する。
まず、各候補モデルを独立して共有プレフィックスに基づいて候補スパンを生成する。
第二に、難易度スコアを計算して、候補モデル間の相互評価を容易にし、不誠実なスコアを抽出してロバストなスパン選択を実現する。
論文 参考訳(メタデータ) (2024-09-27T09:41:29Z) - MAP: Low-compute Model Merging with Amortized Pareto Fronts via Quadratic Approximation [80.47072100963017]
Amortized Pareto Front (MAP) を用いた新しい低演算アルゴリズム Model Merging を導入する。
MAPは、複数のモデルをマージするためのスケーリング係数のセットを効率的に識別し、関連するトレードオフを反映する。
また,タスク数が比較的少ないシナリオではベイジアンMAP,タスク数の多い状況ではNested MAPを導入し,計算コストを削減した。
論文 参考訳(メタデータ) (2024-06-11T17:55:25Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - Data Pruning via Moving-one-Sample-out [61.45441981346064]
我々は移動1サンプルアウト(MoSo)と呼ばれる新しいデータ処理手法を提案する。
MoSoは、トレーニングセットから最も分かりにくいサンプルを特定し、削除することを目的としている。
実験結果から,MoSoは高プルーニング比で高い性能劣化を効果的に緩和することが示された。
論文 参考訳(メタデータ) (2023-10-23T08:00:03Z) - A Finite-Horizon Approach to Active Level Set Estimation [0.7366405857677227]
レベルセット推定(LSE)における空間サンプリングの文脈におけるアクティブラーニングの問題点について考察する。
1次元でLSEを行うための有限水平探索法を提案するが、最終的な推定誤差と一定数のサンプルの移動距離のバランスは最適である。
結果の最適化問題をクローズドな方法で解き、その結果のポリシーが既存のアプローチを一般化することを示す。
論文 参考訳(メタデータ) (2023-10-18T14:11:41Z) - A Unified Framework for Multi-distribution Density Ratio Estimation [101.67420298343512]
バイナリ密度比推定(DRE)は多くの最先端の機械学習アルゴリズムの基礎を提供する。
ブレグマン最小化の発散の観点から一般的な枠組みを開発する。
我々のフレームワークはバイナリDREでそれらのフレームワークを厳格に一般化する手法に導かれることを示す。
論文 参考訳(メタデータ) (2021-12-07T01:23:20Z) - D2C-SR: A Divergence to Convergence Approach for Image Super-Resolution [25.17545119739454]
画像超解像(SR)のための新しいフレームワークD2C-SRを提案する。
SRFlowのような最近の作品に触発され、私たちはこの問題を半確率的に対処します。
実験により,PSNRおよびSSIMにおけるD2C-SRの性能は,計算コストが大幅に低減された。
論文 参考訳(メタデータ) (2021-03-26T10:20:28Z) - Learning by Minimizing the Sum of Ranked Range [58.24935359348289]
本稿では,学習目標を定式化するための一般的なアプローチとして,ランキング範囲(SoRR)の和を紹介した。
ランク付き範囲は、実数の集合のソートされた値の連続的なシーケンスである。
我々は,SoRRフレームワークの最小化のための機械学習における2つの応用,すなわち,バイナリ分類のためのAoRR集約損失とマルチラベル/マルチクラス分類のためのTKML個人損失について検討する。
論文 参考訳(メタデータ) (2020-10-05T01:58:32Z) - MSMD-Net: Deep Stereo Matching with Multi-scale and Multi-dimension Cost
Volume [33.07553434167063]
マルチスケール・マルチ次元のコストボリュームを構築するためにMSMD-Netを提案する。
提案手法は, 領域横断の強い一般化を示し, 3倍あるいは5倍の高速さで, 最良先行作業よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-06-23T07:12:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。