論文の概要: CbwLoss: Constrained Bidirectional Weighted Loss for Self-supervised
Learning of Depth and Pose
- arxiv url: http://arxiv.org/abs/2212.05845v1
- Date: Mon, 12 Dec 2022 12:18:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 16:57:54.120186
- Title: CbwLoss: Constrained Bidirectional Weighted Loss for Self-supervised
Learning of Depth and Pose
- Title(参考訳): CbwLoss: 深さと姿勢の自己教師型学習のための制約付き双方向重み付き損失
- Authors: Fei Wang, Jun Cheng, Penglei Liu
- Abstract要約: 光度差は、未ラベルのモノクロビデオから深度とカメラのポーズを推定するためにニューラルネットワークを訓練するために使用される。
本稿では,アフィン変換とビュー合成によって生じる流れ場と深さ構造の違いを利用して,移動物体とオクルージョンを取り扱う。
ネットワークを追加することなく、より意味的な情報と文脈的な情報を持つ特徴の差を測定することにより、テクスチャレス領域がモデル最適化に与える影響を緩和する。
- 参考スコア(独自算出の注目度): 13.581694284209885
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photometric differences are widely used as supervision signals to train
neural networks for estimating depth and camera pose from unlabeled monocular
videos. However, this approach is detrimental for model optimization because
occlusions and moving objects in a scene violate the underlying static scenario
assumption. In addition, pixels in textureless regions or less discriminative
pixels hinder model training. To solve these problems, in this paper, we deal
with moving objects and occlusions utilizing the difference of the flow fields
and depth structure generated by affine transformation and view synthesis,
respectively. Secondly, we mitigate the effect of textureless regions on model
optimization by measuring differences between features with more semantic and
contextual information without adding networks. In addition, although the
bidirectionality component is used in each sub-objective function, a pair of
images are reasoned about only once, which helps reduce overhead. Extensive
experiments and visual analysis demonstrate the effectiveness of the proposed
method, which outperform existing state-of-the-art self-supervised methods
under the same conditions and without introducing additional auxiliary
information.
- Abstract(参考訳): 光度差は、未ラベルの単眼ビデオから深度とカメラのポーズを推定するためのニューラルネットワークを訓練するための監視信号として広く使用されている。
しかし、この手法は静的シナリオの仮定に違反するため、モデル最適化にとって有害である。
さらに、テクスチャレス領域の画素や、差別的な画素がモデルトレーニングを妨げる。
そこで本研究では,アフィン変換とビュー合成によって生じる流れ場と深さ構造の違いを利用して,移動物体とオクルージョンをそれぞれ扱う。
第2に,ネットワークを追加することなく,より意味のある特徴と文脈的な情報の違いを測定することにより,テクスチャレス領域がモデル最適化に与える影響を緩和する。
さらに、各サブオブジェクト関数で双方向成分が使用されるが、一対の画像を1回だけ推論することでオーバーヘッドを低減できる。
提案手法は,同一条件下で,かつ補助的な情報を導入することなく,既存の自己教師あり手法に勝る効果を示す。
関連論文リスト
- Towards Cross-View-Consistent Self-Supervised Surround Depth Estimation [9.569646683579899]
連続画像からの自己監督下周深度推定は経済的な代替手段を提供する。
従来のSSSDE法では、画像間で情報を融合する異なるメカニズムが提案されているが、それらのいくつかは、クロスビュー制約を明示的に考慮している。
本稿では,SSSDEのクロスビュー一貫性を高めるために,効率的で一貫したポーズ推定設計と2つの損失関数を提案する。
論文 参考訳(メタデータ) (2024-07-04T16:29:05Z) - Exploiting the Distortion-Semantic Interaction in Fisheye Data [12.633032175875865]
魚眼のデータは他のタイプのカメラよりも広い視野の利点があるが、これは高い歪みを犠牲にしている。
中心からさらに離れたオブジェクトは、モデルがセマンティックコンテキストを特定するのが難しくなる変形を示す。
画像の中心から物体の距離に基づいて歪みクラスラベルを抽出し,この関係を利用する手法を提案する。
次に、同じ意味クラスのオブジェクトと互いに近い歪みクラスのオブジェクトを制約する重み付けされた対照的な損失で、バックボーンの表現空間を形成する。
論文 参考訳(メタデータ) (2023-04-28T20:23:38Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - FG-Depth: Flow-Guided Unsupervised Monocular Depth Estimation [17.572459787107427]
そこで本研究では,典型的な測光損失を代替する流量蒸留損失と,不適切な画素を除去するための前向きフローベースマスクを提案する。
提案手法は,KITTIとNYU-Depth-v2の両方のデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2023-01-20T04:02:13Z) - Frequency-Aware Self-Supervised Monocular Depth Estimation [41.97188738587212]
自己教師付き単眼深度推定モデルを改善するための2つの多目的手法を提案する。
本手法の高一般化性は,測光損失関数の基本的およびユビキタスな問題を解くことによって達成される。
我々は、解釈可能な解析で深度推定器を改善するために、初めてぼやけた画像を提案する。
論文 参考訳(メタデータ) (2022-10-11T14:30:26Z) - RISP: Rendering-Invariant State Predictor with Differentiable Simulation
and Rendering for Cross-Domain Parameter Estimation [110.4255414234771]
既存のソリューションでは、大量のトレーニングデータが必要か、未知のレンダリング設定への一般化性が欠如している。
本稿では、ドメインのランダム化と微分可能なレンダリング勾配を併用してこの問題に対処する手法を提案する。
提案手法は, 再構成誤差を大幅に低減し, 未知のレンダリング構成間の一般化性が向上する。
論文 参考訳(メタデータ) (2022-05-11T17:59:51Z) - Degradation-agnostic Correspondence from Resolution-asymmetric Stereo [96.03964515969652]
テレワイドカメラシステムで取得した解像度の異なる2枚の画像からステレオマッチングの問題を考察する。
特徴量整合性という画像空間の代わりに特徴空間に2つのビュー間の整合性を課すことを提案する。
測光損失をトレーニングしたステレオマッチングネットワークは最適ではないが, 特徴抽出器は劣化に依存しない, マッチング特有の特徴を生成できる。
論文 参考訳(メタデータ) (2022-04-04T12:24:34Z) - Efficient and Differentiable Shadow Computation for Inverse Problems [64.70468076488419]
微分可能幾何計算は画像に基づく逆問題に対する関心が高まっている。
微分可能な可視性とソフトシャドウ計算のための効率的かつ効率的なアプローチを提案する。
定式化は微分可能であるため, テクスチャ, 照明, 剛体ポーズ, 画像からの変形回復などの逆問題を解くために使用できる。
論文 参考訳(メタデータ) (2021-04-01T09:29:05Z) - SIR: Self-supervised Image Rectification via Seeing the Same Scene from
Multiple Different Lenses [82.56853587380168]
本稿では、異なるレンズからの同一シーンの歪み画像の補正結果が同一であるべきという重要な知見に基づいて、新しい自己監督画像補正法を提案する。
我々は、歪みパラメータから修正画像を生成し、再歪み画像を生成するために、微分可能なワープモジュールを利用する。
本手法は,教師付きベースライン法や代表的最先端手法と同等あるいはそれ以上の性能を実現する。
論文 参考訳(メタデータ) (2020-11-30T08:23:25Z) - Feature-metric Loss for Self-supervised Learning of Depth and Egomotion [13.995413542601472]
光度損失は、自己監督された深度とエゴモーション推定に広く利用されている。
本研究では,特徴量損失を提案し,特徴表現に基づいて定義する。
可視化による総合的な実験と詳細な分析により,提案した特徴量損失の有効性が示された。
論文 参考訳(メタデータ) (2020-07-21T05:19:07Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。