論文の概要: Boosting Generalizability towards Zero-Shot Cross-Dataset Single-Image Indoor Depth by Meta-Initialization
- arxiv url: http://arxiv.org/abs/2409.02486v1
- Date: Wed, 4 Sep 2024 07:25:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-05 20:02:12.288682
- Title: Boosting Generalizability towards Zero-Shot Cross-Dataset Single-Image Indoor Depth by Meta-Initialization
- Title(参考訳): メタ初期化によるゼロショットクロスデータセット単一画像屋内深度への一般化性の向上
- Authors: Cho-Ying Wu, Yiqi Zhong, Junying Wang, Ulrich Neumann,
- Abstract要約: 我々は、勾配に基づくメタラーニングを用いて、ゼロショットのクロスデータセット推論における高い一般化性を得る。
我々は、ゼロショットのクロスデータセットプロトコルを提案し、メタ初期化によって誘導される高い一般化性を検証した。
- 参考スコア(独自算出の注目度): 17.822554284161868
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Indoor robots rely on depth to perform tasks like navigation or obstacle detection, and single-image depth estimation is widely used to assist perception. Most indoor single-image depth prediction focuses less on model generalizability to unseen datasets, concerned with in-the-wild robustness for system deployment. This work leverages gradient-based meta-learning to gain higher generalizability on zero-shot cross-dataset inference. Unlike the most-studied meta-learning of image classification associated with explicit class labels, no explicit task boundaries exist for continuous depth values tied to highly varying indoor environments regarding object arrangement and scene composition. We propose fine-grained task that treats each RGB-D mini-batch as a task in our meta-learning formulation. We first show that our method on limited data induces a much better prior (max 27.8% in RMSE). Then, finetuning on meta-learned initialization consistently outperforms baselines without the meta approach. Aiming at generalization, we propose zero-shot cross-dataset protocols and validate higher generalizability induced by our meta-initialization, as a simple and useful plugin to many existing depth estimation methods. The work at the intersection of depth and meta-learning potentially drives both research to step closer to practical robotic and machine perception usage.
- Abstract(参考訳): 室内ロボットは、ナビゲーションや障害物検出などのタスクを行うために深度に依存する。
屋内でのシングルイメージの深度予測は、システム展開の現場での堅牢性に関係して、目に見えないデータセットに対するモデル一般化性に重点を置いている。
この研究は勾配に基づくメタラーニングを活用し、ゼロショットのクロスデータセット推論における高い一般化性を得る。
明示的なクラスラベルに関連付けられた画像分類の最も研究されているメタラーニングとは異なり、オブジェクト配置やシーン構成に関して高度に変化する屋内環境に関連する連続的な深度値に対して、明確なタスク境界は存在しない。
メタラーニングの定式化において,RGB-Dミニバッチをタスクとして扱う細粒度タスクを提案する。
まず, 制限データに対する手法により, RMSEでは最大27.8%) の精度が向上することを示した。
そして、メタ学習初期化の微調整は、メタアプローチなしでベースラインを一貫して上回る。
一般化を目的としたゼロショット・クロスデータセットプロトコルを提案し,メタ初期化によって誘導される高次一般化性を,既存の多くの深度推定手法の簡易かつ有用なプラグインとして検証する。
深度とメタラーニングの交差点でのこの研究は、両方の研究を、実用的なロボットと機械認識の使用に近づける可能性がある。
関連論文リスト
- Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Meta Omnium: A Benchmark for General-Purpose Learning-to-Learn [15.0841751679151]
複数のビジョンタスクにまたがるデータセットであるMeta Omniumを紹介する。
我々は、タスクをまたいで一般化し、それらの間の知識を伝達する能力を分析する。
論文 参考訳(メタデータ) (2023-05-12T17:25:19Z) - Meta-Optimization for Higher Model Generalizability in Single-Image
Depth Prediction [19.469860191876876]
我々は、勾配に基づくメタラーニングを活用し、ゼロショットのクロスデータセット推論における高い一般化性を実現する。
メタラーニングにおける最も研究されている画像分類とは異なり、深度はピクセルレベルの連続範囲値である。
メタ最適化において,各RGB-Dペアをタスクとして扱う,きめ細かいタスクを提案する。
論文 参考訳(メタデータ) (2023-05-12T06:17:13Z) - SemHint-MD: Learning from Noisy Semantic Labels for Self-Supervised
Monocular Depth Estimation [19.229255297016635]
自己教師付き深度推定は、光度損失の勾配-局所性の問題により、局所的に最小限に抑えられる。
セマンティックセグメンテーションを活用して、ネットワークを局所的な最小限から切り離すための奥行きを高めるためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-31T17:20:27Z) - LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。
本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。
提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文 参考訳(メタデータ) (2022-10-14T19:13:36Z) - Improving Meta-Learning Generalization with Activation-Based
Early-Stopping [12.299371455015239]
数ショットの学習のためのメタラーニングアルゴリズムは、少数の例だけで新しいタスクに一般化できるニューラルネットワークを訓練することを目的としている。
早期停止は、新しいタスク分布に最適な一般化に達すると、モデルトレーニングを停止させる。
これは、メタテストセットが異なるターゲットデータセットから来る、数ショットの転送学習設定で問題となる。
論文 参考訳(メタデータ) (2022-08-03T22:55:45Z) - Improving Generalization in Meta-learning via Task Augmentation [69.83677015207527]
本稿ではMetaMixとChannel Shuffleの2つのタスク拡張手法を提案する。
MetaMixとChannel Shuffleはどちらも、多くのデータセットにまたがる大きなマージンによって、最先端の結果を上回っている。
論文 参考訳(メタデータ) (2020-07-26T01:50:42Z) - Incremental Object Detection via Meta-Learning [77.55310507917012]
本稿では,段階的タスク間の情報を最適に共有するように,モデル勾配を再形成するメタラーニング手法を提案する。
既存のメタ学習法と比較して,本手法はタスク非依存であり,オブジェクト検出のための高容量モデルに新たなクラスやスケールを段階的に追加することができる。
論文 参考訳(メタデータ) (2020-03-17T13:40:00Z) - Incremental Meta-Learning via Indirect Discriminant Alignment [118.61152684795178]
メタ学習のメタ学習段階において,段階的な学習の概念を発達させる。
我々のアプローチは、完全なメタトレーニングセットでモデルをトレーニングするのと比べて、テスト時に好適に機能する。
論文 参考訳(メタデータ) (2020-02-11T01:39:12Z) - Single Image Depth Estimation Trained via Depth from Defocus Cues [105.67073923825842]
単一のRGB画像から深度を推定することはコンピュータビジョンの基本的な課題である。
この作業では、異なる視点ではなく、フォーカスキューからの奥行きに依存しています。
我々は,KITTIとMake3Dデータセットの教師あり手法と同等な結果を提示し,教師なし学習手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-01-14T20:22:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。