論文の概要: Self-Supervised Monocular Depth Estimation: Solving the Edge-Fattening
Problem
- arxiv url: http://arxiv.org/abs/2210.00411v2
- Date: Tue, 4 Oct 2022 03:44:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 10:33:13.334992
- Title: Self-Supervised Monocular Depth Estimation: Solving the Edge-Fattening
Problem
- Title(参考訳): 自己教師付き単眼深度推定:エッジファイティング問題を解く
- Authors: Xingyu Chen, Ruonan Zhang, Ji Jiang, Yan Wang, Ge Li, Thomas H. Li
- Abstract要約: 計量学習に人気があるトリプルト損失は多くのコンピュータビジョンタスクで大きな成功を収めた。
MDEにおける生三重項損失の2つの欠点を示し、問題駆動型再設計を実証する。
- 参考スコア(独自算出の注目度): 39.82550656611876
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised monocular depth estimation (MDE) models universally suffer
from the notorious edge-fattening issue. Triplet loss, popular for metric
learning, has made a great success in many computer vision tasks. In this
paper, we redesign the patch-based triplet loss in MDE to alleviate the
ubiquitous edge-fattening issue. We show two drawbacks of the raw triplet loss
in MDE and demonstrate our problem-driven redesigns. First, we present a min.
operator based strategy applied to all negative samples, to prevent
well-performing negatives sheltering the error of edge-fattening negatives.
Second, we split the anchor-positive distance and anchor-negative distance from
within the original triplet, which directly optimizes the positives without any
mutual effect with the negatives. Extensive experiments show the combination of
these two small redesigns can achieve unprecedented results: Our powerful and
versatile triplet loss not only makes our model outperform all previous SoTA by
a large margin, but also provides substantial performance boosts to a large
number of existing models, while introducing no extra inference computation at
all.
- Abstract(参考訳): 自己教師付き単分子深度推定(MDE)モデルは、悪名高いエッジフェッテリング問題に普遍的に苦しむ。
計量学習に人気があるトリプルト損失は多くのコンピュータビジョンタスクで大きな成功を収めた。
本稿では,MDEにおけるパッチベースのトリプルト損失を再考し,ユビキタスエッジフェッテリング問題を緩和する。
MDEにおける生三重項損失の2つの欠点を示し、問題駆動型再設計を実証する。
まず,全ての負のサンプルに適用した最小演算子に基づく手法を提案する。
第2に、アンカー正距離とアンカー負距離を元の三重項内から分割し、負との相互効果なしに直接正を最適化する。
私たちの強力で汎用性のある三重項損失は、私たちのモデルがこれまでのsataをはるかに上回るだけでなく、多くの既存モデルに大幅なパフォーマンス向上をもたらすと同時に、余分な推論計算も導入していません。
関連論文リスト
- PHUDGE: Phi-3 as Scalable Judge [1.7495213911983414]
我々は,SOTAを達成したPhi3モデルについて,フィードバックテスト,フィードバックOOD,MTヒューマン,優先度テストの4つのタスクについて述べる。
GPT4だけでなく、人間のアノテータにも、絶対的および相対的なグルーピングタスクにおいて、非常に強い相関関係を示す。
我々は、体系的なML実験、思慮深いデータ拡張、問題自体の再現によって、より少ないトレーニングデータでも10倍のモデルに打ち勝つことができることを示した。
論文 参考訳(メタデータ) (2024-05-12T18:22:16Z) - Collapse-Aware Triplet Decoupling for Adversarially Robust Image Retrieval [12.007316506425079]
対人訓練は、対人的な例に対して画像検索を擁護する上で大きな成果を上げている。
ディープ・メトリック・ラーニング(DML)の既存の研究は、依然として弱敵とモデル崩壊という2つの大きな限界に悩まされている。
より強力な敵を得るために,Crolapse-Aware TRIplet Decoupling (CA-TRIDE)を提案する。
論文 参考訳(メタデータ) (2023-12-12T15:33:08Z) - When hard negative sampling meets supervised contrastive learning [17.173114048398947]
我々は、微調整フェーズ中にハードネガティブサンプリングを組み込んだ新しい教師付きコントラスト学習目標であるSCHaNeを導入する。
SchaNeは、様々なベンチマークで、トップ1の精度で強いベースラインBEiT-3を上回っている。
提案手法は,ImageNet-1kのベースモデルに対して,86.14%の精度で新たな最先端技術を実現する。
論文 参考訳(メタデータ) (2023-08-28T20:30:10Z) - Towards Regression-Free Neural Networks for Diverse Compute Platforms [50.64489250972764]
負のフリップを小さくする高精度モデル群を設計するために,REG-NAS(Regression constrained Neural Architecture Search)を導入する。
REG-NASは2つのコンポーネントから構成される: 1) より大きなモデルでより小さなモデルの全重みを収容できる新しいアーキテクチャ制約により、重量共有を最大化する。
我々は,regnasが3つの一般的なアーキテクチャ検索空間において,負のフリップが少なく,望ましいアーキテクチャを見つけることができたことを実証した。
論文 参考訳(メタデータ) (2022-09-27T23:19:16Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。
我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文 参考訳(メタデータ) (2021-08-26T17:55:11Z) - Are Negative Samples Necessary in Entity Alignment? An Approach with
High Performance, Scalability and Robustness [26.04006507181558]
本稿では,高パフォーマンス,高スケーラビリティ,高ロバスト性を実現する3つの新しいコンポーネントを持つ新しいEA手法を提案する。
提案手法の有効性と有効性を検討するために,いくつかの公開データセットについて詳細な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T15:20:41Z) - Trip-ROMA: Self-Supervised Learning with Triplets and Random Mappings [59.32440962369532]
単純なトリプルトに基づく損失は、大きなバッチや非対称性設計を必要とせずに驚くほど優れた性能が得られることを示す。
小型データシステムにおける過度に適合する問題を緩和するため,簡単なRandOm MApping(ROMA)戦略を提案する。
論文 参考訳(メタデータ) (2021-07-22T02:06:38Z) - Deep Ranking with Adaptive Margin Triplet Loss [5.220120772989114]
本稿では,固定利得三重項損失から適応利得三重項損失への簡単な修正を提案する。
提案した損失は,評価値が連続値である評価データセットに適している。
論文 参考訳(メタデータ) (2021-07-13T15:37:20Z) - Weakly Supervised Generative Network for Multiple 3D Human Pose
Hypotheses [74.48263583706712]
単一画像からの3次元ポーズ推定は、欠落した深さのあいまいさに起因する逆問題である。
逆問題に対処するために,弱い教師付き深層生成ネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T09:26:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。