論文の概要: Toward Better SSIM Loss for Unsupervised Monocular Depth Estimation
- arxiv url: http://arxiv.org/abs/2506.04758v1
- Date: Thu, 05 Jun 2025 08:43:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-06 21:53:49.608007
- Title: Toward Better SSIM Loss for Unsupervised Monocular Depth Estimation
- Title(参考訳): 教師なし単眼深度推定のためのSSIM損失の改善に向けて
- Authors: Yijun Cao, Fuya Luo, Yongjie Li,
- Abstract要約: 本研究は, 構造類似度指標(SSIM)の新たな形式を提案する。
元のSSIM関数と比較して、提案された新しい形式は、SSIMの輝度、コントラスト、構造的類似性に関連するコンポーネントを組み合わせるために、乗法ではなく加算を用いる。
このスキームで構築した損失関数は、よりスムーズな勾配をもたらし、教師なし深さ推定におけるより高い性能を達成するのに役立つ。
- 参考スコア(独自算出の注目度): 14.89929051723735
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised monocular depth learning generally relies on the photometric relation among temporally adjacent images. Most of previous works use both mean absolute error (MAE) and structure similarity index measure (SSIM) with conventional form as training loss. However, they ignore the effect of different components in the SSIM function and the corresponding hyperparameters on the training. To address these issues, this work proposes a new form of SSIM. Compared with original SSIM function, the proposed new form uses addition rather than multiplication to combine the luminance, contrast, and structural similarity related components in SSIM. The loss function constructed with this scheme helps result in smoother gradients and achieve higher performance on unsupervised depth estimation. We conduct extensive experiments to determine the relatively optimal combination of parameters for our new SSIM. Based on the popular MonoDepth approach, the optimized SSIM loss function can remarkably outperform the baseline on the KITTI-2015 outdoor dataset.
- Abstract(参考訳): 教師なし単眼深度学習は一般的に、時間的に隣接した画像間の測光関係に依存する。
これまでの研究の多くは、平均絶対誤差(MAE)とSSIM(Structure similarity index measure)の両方をトレーニング損失として用いた。
しかし、SSIM関数と対応するハイパーパラメータの異なるコンポーネントがトレーニングに与える影響を無視する。
これらの課題に対処するため,本研究ではSSIMの新たな形態を提案する。
元のSSIM関数と比較して、提案された新しい形式は、SSIMの輝度、コントラスト、構造的類似性に関連するコンポーネントを組み合わせるために、乗法ではなく加算を用いる。
このスキームで構築した損失関数は、よりスムーズな勾配をもたらし、教師なし深さ推定におけるより高い性能を達成するのに役立つ。
我々は、新しいSSIMのためのパラメータの比較的最適な組み合わせを決定するために、広範囲な実験を行う。
人気のMonoDepthアプローチに基づいて、最適化されたSSIM損失関数は、KITTI-2015屋外データセットのベースラインを著しく上回る。
関連論文リスト
- Towards Generating Realistic Underwater Images [0.0]
VAROSデータセットを用いて,現実的な水中画像を生成するための画像翻訳モデルの性能について検討する。
ペア画像変換では、Pix2pixはそのペア監督とPatchGAN識別器により最高のFIDスコアを得る。
非ペア方式では、CycleGANはサイクル一貫性損失を利用して競合的なFIDスコアを得るが、CUTはサイクル一貫性を対照的な学習に置き換え、より高いSSIMを得る。
論文 参考訳(メタデータ) (2025-05-20T12:44:19Z) - SimCE: Simplifying Cross-Entropy Loss for Collaborative Filtering [47.81610130269399]
SSM(Sampred Softmax Cross-Entropy)を提案する。
また,上界を用いてSSMを単純化するアンダーラインSimplified Sampled Softmax underlineCross-underlineEntropy Loss (SimCE)を導入する。
MFとLightGCNの両方のバックボーンを使用して、12のベンチマークデータセットに対する検証を行ったところ、SimCEはBPRとSSMの両方で大幅に優れていた。
論文 参考訳(メタデータ) (2024-06-23T17:24:07Z) - Bridging the Sim-to-Real Gap with Bayesian Inference [53.61496586090384]
データからロボットダイナミクスを学習するためのSIM-FSVGDを提案する。
我々は、ニューラルネットワークモデルのトレーニングを規則化するために、低忠実度物理プリエンスを使用します。
高性能RCレースカーシステムにおけるSIM-to-realギャップのブリッジ化におけるSIM-FSVGDの有効性を実証する。
論文 参考訳(メタデータ) (2024-03-25T11:29:32Z) - DSSIM: a structural similarity index for floating-point data [68.8204255655161]
我々は、データSSIM(DSSIM)と呼ばれる浮動小数点データに直接適用可能な、人気のあるSSIMの代替案を提案する。
DSSIMは,大量のシミュレーションデータに対する圧縮損失による差分評価の文脈において有用性を示す一方で,シミュレーションや画像データを含む他の多くのアプリケーションにおいて有用であることを示す。
論文 参考訳(メタデータ) (2022-02-05T19:18:33Z) - A Hitchhiker's Guide to Structural Similarity [40.567747702628076]
構造的類似度(SSIM)指数は、非常に広く使用されている画像/ビデオ品質モデルです。
広く普及しているssimの実装の機能と性能を調査し,比較した。
私たちは最も効果的にSSIMを使用する方法に関する推奨事項のコレクションに到着しました。
論文 参考訳(メタデータ) (2021-01-16T02:51:06Z) - Sinkhorn Natural Gradient for Generative Models [125.89871274202439]
本研究では,シンクホーンの発散による確率空間上の最も急降下法として機能するシンクホーン自然勾配(SiNG)アルゴリズムを提案する。
本稿では,SiNG の主要成分であるシンクホーン情報行列 (SIM) が明示的な表現を持ち,対数的スケールの複雑さを正確に評価できることを示す。
本実験では,SiNGと最先端のSGD型解法を定量的に比較し,その有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-11-09T02:51:17Z) - Revisiting Robust Model Fitting Using Truncated Loss [19.137291311347788]
様々な2D/3D登録問題に新しいアルゴリズムを適用する。
RANSACと近似MC法を高い外れ値比で上回る。
新しいアルゴリズムは、特に高ノイズや外れ値において、最先端の登録手法と好意的に比較できる。
論文 参考訳(メタデータ) (2020-08-04T14:10:41Z) - ML-SIM: A deep neural network for reconstruction of structured
illumination microscopy images [0.0]
構造照明顕微鏡 (SIM) は, 光学超高分解能イメージングにおいて重要な技術となっている。
本稿では機械学習を利用した多目的再構成手法ML-SIMを提案する。
したがって、ML-SIMは生のSIM入力フレームの照明パターンにおけるノイズや不規則に対して堅牢である。
論文 参考訳(メタデータ) (2020-03-24T18:42:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。