Fugu-MT 論文翻訳(概要): Learning depth from monocular video sequences

論文の概要: Learning depth from monocular video sequences

arxiv url: http://arxiv.org/abs/2310.17156v1
Date: Thu, 26 Oct 2023 05:00:41 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-27 22:01:36.694094
Title: Learning depth from monocular video sequences
Title（参考訳）: 単眼映像からの深度学習
Authors: Zhenwei Luo
Abstract要約: トレーニングプロセス中に、より多くのイメージをインクルードできる新たなトレーニング損失を提案する。単一画像推定のための新しいネットワークアーキテクチャも設計する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Learning single image depth estimation model from monocular video sequence is a very challenging problem. In this paper, we propose a novel training loss which enables us to include more images for supervision during the training process. We propose a simple yet effective model to account the frame to frame pixel motion. We also design a novel network architecture for single image estimation. When combined, our method produces state of the art results for monocular depth estimation on the KITTI dataset in the self-supervised setting.
Abstract（参考訳）: 単眼ビデオシーケンスから単一画像深度推定モデルを学ぶことは、非常に難しい問題である。本稿では,訓練過程における監視用画像の増設を可能にする新しいトレーニングロスを提案する。フレームの画素移動を考慮した簡易かつ効果的なモデルを提案する。単一画像推定のための新しいネットワークアーキテクチャも設計する。組み合わせると,本手法は,自己教師付き環境でのKITTIデータセット上での単眼深度推定のための技術結果の状態を生成する。

関連論文リスト

Align3R: Aligned Monocular Depth Estimation for Dynamic Videos [50.28715151619659]
動的ビデオの時間的一貫した深度マップを推定するために,Align3Rと呼ばれる新しいビデオ深度推定法を提案する。我々のキーとなる考え方は、最近のDUSt3Rモデルを用いて、異なる時間ステップの単分子深度マップを整列させることである。実験により、Align3Rは一貫したビデオ深度を推定し、カメラはベースライン法よりも優れた性能を持つ単眼ビデオのポーズを示す。
論文参考訳（メタデータ） (2024-12-04T07:09:59Z)
Diffusion Models for Monocular Depth Estimation: Overcoming Challenging Conditions [30.148969711689773]
本稿では, 単一画像深度推定タスクにおいて, ディストリビューションデータの挑戦によって生じる複雑さに対処する新しい手法を提案する。我々は,包括的課題と関連する深度情報を用いて,新たなユーザ定義シーンを体系的に生成する。これは、深度認識制御による最先端のテキスト・画像拡散モデルを活用することで実現される。
論文参考訳（メタデータ） (2024-07-23T17:59:59Z)
Learning Robust Multi-Scale Representation for Neural Radiance Fields from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文参考訳（メタデータ） (2023-11-08T08:18:23Z)
GasMono: Geometry-Aided Self-Supervised Monocular Depth Estimation for Indoor Scenes [47.76269541664071]
本稿では,フレームと低テクスチャの大きな回転に起因する屋内シーンにおける自己教師型単眼深度推定の課題に対処する。モノクラーシーケンスから粗いカメラポーズを多視点形状で取得し,前者に対応する。低テクスチャの効果を和らげるために、視覚変換器のグローバルな推論と過度に適合する反復的な自己蒸留機構を組み合わせる。
論文参考訳（メタデータ） (2023-09-26T17:59:57Z)
Transformer-based model for monocular visual odometry: a video understanding approach [0.9790236766474201]
6-Fカメラのポーズを推定するために,映像理解タスクとして単眼視計測を取り扱う。本稿では,ビデオクリップから特徴を抽出し,その動作をエンドツーエンドに推定する,時間的自己認識機構に基づくTS-DoVOモデルを提案する。提案手法は,KITTIビジュアル・オドメトリー・データセットを用いた幾何学的,深層学習的手法と比較して,最先端の競合性能を実現した。
論文参考訳（メタデータ） (2023-05-10T13:11:23Z)
SC-DepthV3: Robust Self-supervised Monocular Depth Estimation for Dynamic Scenes [58.89295356901823]
自己監督型単眼深度推定は静的な場面で顕著な結果を示した。トレーニングネットワークのマルチビュー整合性の仮定に依存するが、動的オブジェクト領域に違反する。単一画像の深度を事前に生成するための,外部トレーニング付き単眼深度推定モデルを提案する。我々のモデルは、高度にダイナミックなシーンのモノクロビデオからトレーニングしても、シャープで正確な深度マップを予測できる。
論文参考訳（メタデータ） (2022-11-07T16:17:47Z)
Unsupervised Simultaneous Learning for Camera Re-Localization and Depth Estimation from Video [4.5307040147072275]
本稿では,モノクロカメラの再位置推定と,ラベルなし映像列からの深度推定を行うための教師なし同時学習フレームワークを提案する。本フレームワークでは,シーン座標を方向から推定する2つのネットワークと,カメラのポーズを推定するために合成された各画像からの深度マップを訓練する。また,本手法は,訓練された環境下での最先端の単分子深度推定よりも優れていた。
論文参考訳（メタデータ） (2022-03-24T02:11:03Z)
SelfTune: Metrically Scaled Monocular Depth Estimation through Self-Supervised Learning [53.78813049373321]
本稿では,事前学習した教師付き単分子深度ネットワークに対する自己教師付き学習手法を提案する。本手法は移動ロボットナビゲーションなどの様々な応用に有用であり,多様な環境に適用可能である。
論文参考訳（メタデータ） (2022-03-10T12:28:42Z)
Unsupervised Learning of Monocular Depth and Ego-Motion Using Multiple Masks [14.82498499423046]
本稿では,モノクロ映像からの複数のマスクを用いた深度・エゴモーションの教師なし学習手法を提案する。深度推定ネットワークとエゴモーション推定ネットワークは、真理値のない深度とエゴモーションの制約に応じて訓練される。 KITTIデータセットの実験は、深度と自我運動の点で良好なパフォーマンスを達成していることを示す。
論文参考訳（メタデータ） (2021-04-01T12:29:23Z)
Learning Monocular Depth in Dynamic Scenes via Instance-Aware Projection Consistency [114.02182755620784]
本稿では,複数の動的物体の6-DoF動作,エゴモーション,深度を,監督なしで一眼レフカメラで明示的にモデル化する,エンドツーエンドのジョイントトレーニングフレームワークを提案する。筆者らのフレームワークは,最先端の深度・動き推定法より優れていた。
論文参考訳（メタデータ） (2021-02-04T14:26:42Z)
Consistent Video Depth Estimation [57.712779457632024]
モノクロ映像中の全画素に対して, 密度, 幾何的に整合した深度を再構成するアルゴリズムを提案する。動画中の画素の幾何的制約を確立するために、従来の動きから再構成した構造を利用する。我々のアルゴリズムは、手持ちの映像をある程度のダイナミックな動きで処理することができる。
論文参考訳（メタデータ） (2020-04-30T17:59:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。