論文の概要: Revisiting Stereo Depth Estimation From a Sequence-to-Sequence
Perspective with Transformers
- arxiv url: http://arxiv.org/abs/2011.02910v4
- Date: Wed, 25 Aug 2021 18:35:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 12:16:50.151374
- Title: Revisiting Stereo Depth Estimation From a Sequence-to-Sequence
Perspective with Transformers
- Title(参考訳): 変圧器を用いたシーケンス・ツー・シーケンス視点からのステレオ深度推定の再検討
- Authors: Zhaoshuo Li, Xingtong Liu, Nathan Drenkow, Andy Ding, Francis X.
Creighton, Russell H. Taylor, Mathias Unberath
- Abstract要約: ステレオ深度推定は、左と右の画像のエピポーラ線上の画素間の最適な対応に頼って深度を推定する。
そこで本研究では,列列対応の観点から問題を再検討し,位置情報と注意力を用いた高密度画素マッチングによるコストボリューム構築に置き換える。
合成と実世界の両方のデータセットについて有望な結果を報告し,STTRが微調整なしでも,異なる領域にまたがる一般化を実証した。
- 参考スコア(独自算出の注目度): 11.669086751865091
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stereo depth estimation relies on optimal correspondence matching between
pixels on epipolar lines in the left and right images to infer depth. In this
work, we revisit the problem from a sequence-to-sequence correspondence
perspective to replace cost volume construction with dense pixel matching using
position information and attention. This approach, named STereo TRansformer
(STTR), has several advantages: It 1) relaxes the limitation of a fixed
disparity range, 2) identifies occluded regions and provides confidence
estimates, and 3) imposes uniqueness constraints during the matching process.
We report promising results on both synthetic and real-world datasets and
demonstrate that STTR generalizes across different domains, even without
fine-tuning.
- Abstract(参考訳): ステレオ深度推定は、深度を推定するために左右画像のエピポーラ線上の画素間の最適な対応関係に依存する。
そこで本研究では,列列対応の観点から問題を再検討し,位置情報と注意力を用いた高密度画素マッチングによるコストボリューム構築に置き換える。
STTR(Stereo TRansformer)と呼ばれるこのアプローチにはいくつかの利点がある。
1)固定格差範囲の制限を緩和する。
2)隠蔽地域を特定し、信頼度を推定し、
3) マッチングプロセス中に一意性制約を課す。
合成と実世界の両方のデータセットについて有望な結果を報告し,STTRが微調整なしでも,異なる領域にまたがる一般化を実証した。
関連論文リスト
- Quantity-Aware Coarse-to-Fine Correspondence for Image-to-Point Cloud
Registration [4.954184310509112]
Image-to-point cloud registrationは、RGBイメージと参照ポイントクラウドの間の相対カメラのポーズを決定することを目的としている。
個々の点と画素とのマッチングは、モダリティギャップによって本質的に曖昧である。
本稿では,局所点集合と画素パッチ間の量認識対応を捉える枠組みを提案する。
論文 参考訳(メタデータ) (2023-07-14T03:55:54Z) - Explicit Correspondence Matching for Generalizable Neural Radiance
Fields [49.49773108695526]
本稿では,新たな未知のシナリオに一般化し,2つのソースビューで新規なビュー合成を行う新しいNeRF手法を提案する。
明瞭な対応マッチングは、異なるビュー上の3Dポイントの2次元投影でサンプリングされた画像特徴間のコサイン類似度と定量化される。
実験では,実験結果から得られたコサイン特徴の類似性と体積密度との間に強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-04-24T17:46:01Z) - Evaluation of a Canonical Image Representation for Sidescan Sonar [4.961559590556073]
サイドスキャンソナー(SSS)は広い範囲を検知し、高解像度のフォトリアリスティック画像を提供する。
SSSは、AUVの高度、目標範囲、センサーの解像度によって歪んだ3D海底画像を2D画像に投影する。
本稿では, この歪みを低減させるために, 強度補正とスラント範囲補正からなる正準変換法を提案する。
論文 参考訳(メタデータ) (2023-04-18T19:08:12Z) - Rectifying homographies for stereo vision: analytical solution for
minimal distortion [0.0]
整形化は、その後のステレオ対応問題を単純化するために用いられる。
本研究は、視点歪みを最小化する補正ホモグラフに対する閉形式解を提案する。
論文 参考訳(メタデータ) (2022-02-28T22:35:47Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z) - TFill: Image Completion via a Transformer-Based Architecture [69.62228639870114]
画像補完を無方向性シーケンス対シーケンス予測タスクとして扱うことを提案する。
トークン表現には,小かつ重複しないRFを持つ制限型CNNを用いる。
第2フェーズでは、可視領域と発生領域の外観整合性を向上させるために、新しい注意認識層(aal)を導入する。
論文 参考訳(メタデータ) (2021-04-02T01:42:01Z) - Fusion of Range and Stereo Data for High-Resolution Scene-Modeling [20.824550995195057]
本稿では,高分解能深度マップの構築において,レンジステレオ融合の問題に対処する。
低分解能深度データと高分解能ステレオデータとを最大後部(MAP)定式化で組み合わせる。
エネルギー関数におけるデータ期間の3つの特性のために、方法の精度は損なわれません。
論文 参考訳(メタデータ) (2020-12-12T09:37:42Z) - StereoGAN: Bridging Synthetic-to-Real Domain Gap by Joint Optimization
of Domain Translation and Stereo Matching [56.95846963856928]
大規模な合成データセットはステレオマッチングに有用であるが、通常は既知のドメインバイアスを導入する。
本稿では,ドメイン翻訳とステレオマッチングネットワークを用いたエンドツーエンドのトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-05T03:11:38Z) - RANSAC-Flow: generic two-stage image alignment [53.11926395028508]
単純な教師なしのアプローチは、様々なタスクにおいて驚くほどうまく機能することを示す。
その単純さにもかかわらず、我々の手法は様々なタスクやデータセットで競合する結果を示す。
論文 参考訳(メタデータ) (2020-04-03T12:37:58Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。