論文の概要: Loss it right: Euclidean and Riemannian Metrics in Learning-based Visual
Odometry
- arxiv url: http://arxiv.org/abs/2401.05396v1
- Date: Tue, 19 Dec 2023 10:31:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 08:46:55.378465
- Title: Loss it right: Euclidean and Riemannian Metrics in Learning-based Visual
Odometry
- Title(参考訳): loss it right: 学習に基づく視覚オドメトリにおけるユークリッド計量とリーマン計量
- Authors: Olaya \'Alvarez-Tu\~n\'on, Yury Brodskiy and Erdal Kayacan
- Abstract要約: 本稿では,視覚オドメトリー(VO)ネットワークにおける異なるポーズ表現とメートル法関数について概説する。
VOネットワークのDeepVOにおけるこれらの要因を,オイラー,四元音,和音距離に基づく損失関数を用いて検討する。
実験は、弦距離のような計量の数学的要求を満たす距離が、より良い一般化とより高速な収束をもたらすことを示している。
- 参考スコア(独自算出の注目度): 5.931491383317183
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper overviews different pose representations and metric functions in
visual odometry (VO) networks. The performance of VO networks heavily relies on
how their architecture encodes the information. The choice of pose
representation and loss function significantly impacts network convergence and
generalization. We investigate these factors in the VO network DeepVO by
implementing loss functions based on Euler, quaternion, and chordal distance
and analyzing their influence on performance. The results of this study provide
insights into how loss functions affect the designing of efficient and accurate
VO networks for camera motion estimation. The experiments illustrate that a
distance that complies with the mathematical requirements of a metric, such as
the chordal distance, provides better generalization and faster convergence.
The code for the experiments can be found at
https://github.com/remaro-network/Loss_VO_right
- Abstract(参考訳): 本稿では,視覚オドメトリー(VO)ネットワークにおける異なるポーズ表現とメートル法関数について概説する。
VOネットワークの性能は、そのアーキテクチャがどのように情報をエンコードするかに大きく依存している。
ポーズ表現と損失関数の選択は、ネットワーク収束と一般化に大きな影響を及ぼす。
VOネットワークのDeepVOにおけるこれらの要因を,オイラー,四分音,和音距離に基づく損失関数を用いて検討し,その性能への影響を解析した。
本研究では,損失関数がカメラモーション推定のための効率的かつ正確なVOネットワークの設計に与える影響について考察した。
実験は、弦距離のような計量の数学的要求を満たす距離が、より良い一般化とより高速な収束をもたらすことを示している。
実験のコードはhttps://github.com/remaro-network/Loss_VO_rightにある。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Unraveling the Hessian: A Key to Smooth Convergence in Loss Function Landscapes [0.0]
我々は、完全に連結されたニューラルネットワークにおける損失景観の収束を理論的に解析し、新しいオブジェクトをサンプルに追加する際の損失関数値の差について上限を導出する。
画像分類作業における損失関数面の収束を実証し,これらの結果を様々なデータセットで検証した。
論文 参考訳(メタデータ) (2024-09-18T14:04:15Z) - A Geometrical Approach to Evaluate the Adversarial Robustness of Deep
Neural Networks [52.09243852066406]
対向収束時間スコア(ACTS)は、対向ロバストネス指標として収束時間を測定する。
我々は,大規模画像Netデータセットに対する異なる敵攻撃に対して,提案したACTSメトリックの有効性と一般化を検証する。
論文 参考訳(メタデータ) (2023-10-10T09:39:38Z) - FourierLoss: Shape-Aware Loss Function with Fourier Descriptors [1.5659201748872393]
この研究は、FourierLossという新しい形状認識損失関数を導入しました。
これは、地上の真実と予測されたセグメンテーションマップの間の形状の相違に依拠し、それらのオブジェクト上で計算されたフーリエ記述子を通し、ネットワークトレーニングにおけるこの相違を罰する。
提案した形状認識損失関数が肝セグメンテーションに有意な有意な有意な成績を示した。
論文 参考訳(メタデータ) (2023-09-21T14:23:10Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Solving Large-scale Spatial Problems with Convolutional Neural Networks [88.31876586547848]
大規模空間問題に対する学習効率を向上させるために移動学習を用いる。
畳み込みニューラルネットワーク (CNN) は, 信号の小さな窓で訓練できるが, 性能劣化の少ない任意の大信号で評価できる。
論文 参考訳(メタデータ) (2023-06-14T01:24:42Z) - A Systematic Performance Analysis of Deep Perceptual Loss Networks: Breaking Transfer Learning Conventions [5.470136744581653]
ディープ・パーセプチュアル・ロス(英: Deep Perceptual Los)とは、2つの画像間の誤差をニューラルネットワークから抽出したディープ・特徴間の距離として計算する画像のロス関数の一種である。
本研究は,4つの異なるアプリケーション領域における事前学習損失ネットワークの効果を評価する。
論文 参考訳(メタデータ) (2023-02-08T13:08:51Z) - Learning sparse features can lead to overfitting in neural networks [9.2104922520782]
機能学習は遅延トレーニングよりもパフォーマンスが良くないことを示す。
空間性は異方性データの学習に不可欠であることが知られているが、対象関数が一定あるいは滑らかな場合に有害である。
論文 参考訳(メタデータ) (2022-06-24T14:26:33Z) - Efficient Deep Visual and Inertial Odometry with Adaptive Visual
Modality Selection [12.754974372231647]
本稿では,適応型深層学習に基づくVIO手法を提案する。
Gumbel-Softmax のトリックを用いてポリシーネットワークをトレーニングし、エンドツーエンドのシステムトレーニングで決定プロセスを差別化できるようにする。
実験結果から,本手法は全モードベースラインと同じような,あるいはさらに優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2022-05-12T16:17:49Z) - Why Do Better Loss Functions Lead to Less Transferable Features? [93.47297944685114]
本稿では,画像ネット上で学習した畳み込みニューラルネットワークの隠れ表現が,学習対象の選択が伝達可能性に与える影響について検討する。
我々は,多くの目的が,バニラソフトマックスのクロスエントロピーよりも画像ネットの精度を統計的に有意に向上させることを示した。
論文 参考訳(メタデータ) (2020-10-30T17:50:31Z) - Feature Flow: In-network Feature Flow Estimation for Video Object
Detection [56.80974623192569]
光の流れはコンピュータビジョンのタスクで広く使われ、ピクセルレベルのモーション情報を提供する。
一般的なアプローチは、ニューラルネットワークへの前向き光学フローと、タスクデータセット上のこのネットワークの微調整である。
ビデオオブジェクト検出のための textbfIn-network textbfFeature textbfFlow 推定モジュールを用いた新しいネットワーク (IFF-Net) を提案する。
論文 参考訳(メタデータ) (2020-09-21T07:55:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。