論文の概要: HyperPose: Hypernetwork-Infused Camera Pose Localization and an Extended Cambridge Landmarks Dataset
- arxiv url: http://arxiv.org/abs/2303.02610v2
- Date: Tue, 04 Mar 2025 19:46:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-06 15:49:25.501556
- Title: HyperPose: Hypernetwork-Infused Camera Pose Localization and an Extended Cambridge Landmarks Dataset
- Title(参考訳): HyperPose:ハイパーネットワークを応用したカメラポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスポスとケンブリッジのランドマークスポスポ
- Authors: Ron Ferens, Yosi Keller,
- Abstract要約: 絶対的なカメラポーズ回帰器にハイパーネットを利用するHyperPoseを提案する。
自然の環境条件、視点、照明に起因する自然のシーンに固有の外観の変化は、トレーニングとテストデータセットの間に大きな領域差を生じさせる。
推論中、ハイパーネットワークは特定の入力画像に基づいて局所化回帰ヘッドの適応重みを動的に計算する。
- 参考スコア(独自算出の注目度): 15.055091971627832
- License:
- Abstract: In this work, we propose HyperPose, which utilizes hyper-networks in absolute camera pose regressors. The inherent appearance variations in natural scenes, attributable to environmental conditions, perspective, and lighting, induce a significant domain disparity between the training and test datasets. This disparity degrades the precision of contemporary localization networks. To mitigate this, we advocate for incorporating hypernetworks into single-scene and multiscene camera pose regression models. During inference, the hypernetwork dynamically computes adaptive weights for the localization regression heads based on the particular input image, effectively narrowing the domain gap. Using indoor and outdoor datasets, we evaluate the HyperPose methodology across multiple established absolute pose regression architectures. We also introduce and share the Extended Cambridge Landmarks (ECL), a novel localization dataset, based on the Cambridge Landmarks dataset, showing it in multiple seasons with significantly varying appearance conditions. Our empirical experiments demonstrate that HyperPose yields notable performance enhancements for single- and multi-scene architectures. We have made our source code, pre-trained models, and the ECL dataset openly available.
- Abstract(参考訳): 本研究では,絶対的なカメラポーズ回帰器にハイパーネットワークを利用するHyperPoseを提案する。
自然の環境条件、視点、照明に起因する自然のシーンに固有の外観の変化は、トレーニングとテストデータセットの間に大きな領域差を生じさせる。
この格差は、現代のローカライゼーションネットワークの精度を低下させる。
これを緩和するために、ハイパーネットワークをシングルシーンおよびマルチシーンカメラのポーズ回帰モデルに組み込むことを提唱する。
推論中、ハイパーネットワークは特定の入力画像に基づいて局所化回帰ヘッドの適応重みを動的に計算し、ドメインギャップを効果的に狭める。
屋内および屋外のデータセットを用いて、複数の確立された絶対ポーズ回帰アーキテクチャにおけるHyperPose手法を評価する。
また,Cambridge Landmarksデータセットに基づく新しいローカライゼーションデータセットであるExtended Cambridge Landmarks (ECL)を導入,共有し,外観条件が著しく異なる複数のシーズンで示す。
実験により、HyperPoseはシングルシーンおよびマルチシーンアーキテクチャにおいて顕著なパフォーマンス向上をもたらすことが示された。
ソースコード、事前トレーニングされたモデル、ECLデータセットを公開しました。
関連論文リスト
- HipyrNet: Hypernet-Guided Feature Pyramid network for mixed-exposure correction [0.0]
HipyrNetは、ラプラシアピラミッドベースのフレームワークにHyperNetworkを統合する新しいアプローチである。
提案手法は、混合露光画像強調のための新しいベンチマークを設定し、適応画像翻訳における将来の研究の道を開く。
論文 参考訳(メタデータ) (2025-01-09T12:33:46Z) - Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object
Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。
提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。
本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文 参考訳(メタデータ) (2023-12-24T08:42:37Z) - Alignment-free HDR Deghosting with Semantics Consistent Transformer [76.91669741684173]
高ダイナミックレンジイメージングは、複数の低ダイナミックレンジ入力から情報を取得し、リアルな出力を生成することを目的としている。
既存の手法では、前景やカメラの動きによって引き起こされる入力フレーム間の空間的ずれに焦点を当てることが多い。
本研究では,SCTNet(Semantics Consistent Transformer)を用いたアライメントフリーネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-29T15:03:23Z) - HyperE2VID: Improving Event-Based Video Reconstruction via Hypernetworks [16.432164340779266]
イベントベースビデオ再構成のための動的ニューラルネットワークアーキテクチャであるHyperE2VIDを提案する。
提案手法では,ハイパーネットワークを用いてコンテキスト融合モジュールによって誘導される画素ごとの適応フィルタを生成する。
論文 参考訳(メタデータ) (2023-05-10T18:00:06Z) - Magnitude Invariant Parametrizations Improve Hypernetwork Learning [0.0]
Hypernetworksは、別のニューラルネットワークのパラメータを予測する強力なニューラルネットワークである。
トレーニングは通常、非ハイパーネットワークモデルよりもはるかにゆっくりと収束する。
我々は、ハイパーネットワークのトレーニングの課題に寄与する、基本的な未確認の問題を識別する。
我々は、MIP(Magnitude Invariant Parametrizations)と呼ばれる改訂されたハイパーネットワークの定式化を用いて、この問題に対する簡単な解決策を提案する。
論文 参考訳(メタデータ) (2023-04-15T22:18:29Z) - DLGSANet: Lightweight Dynamic Local and Global Self-Attention Networks
for Image Super-Resolution [83.47467223117361]
画像の超解像化に有効な軽量な動的局所・大域自己アテンションネットワーク(DLGSANet)を提案する。
トランスフォーマーのネットワーク設計により,ローカル特徴を効率的に抽出するシンプルなマルチヘッド動的自己アテンション(MHDLSA)モジュールを開発した。
この問題を解決するために,最も有用な類似値を選択するために,スパースグローバル自己アテンション(SparseGSA)モジュールを開発した。
論文 参考訳(メタデータ) (2023-01-05T12:06:47Z) - HyperStyle: StyleGAN Inversion with HyperNetworks for Real Image Editing [2.362412515574206]
HyperStyleは、StyleGANの重みを変調して、潜在空間の編集可能な領域で所定の画像を忠実に表現することを学ぶ。
HyperStyleは、エンコーダのほぼリアルタイム推論機能を備えた最適化手法に匹敵する再構成を行う。
論文 参考訳(メタデータ) (2021-11-30T18:56:30Z) - Global and Local Alignment Networks for Unpaired Image-to-Image
Translation [170.08142745705575]
未ペア画像から画像への変換の目的は、対象領域のスタイルを反映した出力画像を作成することである。
既存の手法では内容変化に注意が払われていないため、ソース画像からの意味情報は翻訳中の劣化に悩まされる。
我々はGLA-Net(Global and Local Alignment Networks)という新しいアプローチを導入する。
本手法は既存の手法よりもシャープでリアルな画像を効果的に生成する。
論文 参考訳(メタデータ) (2021-11-19T18:01:54Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z) - Molecule Property Prediction and Classification with Graph Hypernetworks [113.38181979662288]
ネットワークをハイパーネットワークに置き換えることで性能が向上することを示す。
ハイパーネットワークの適用において大きな困難は、安定性の欠如である。
最近の研究は、エラー訂正コードのコンテキストにおいて、ハイパーネットワークのトレーニング不安定性に取り組んでいる。
論文 参考訳(メタデータ) (2020-02-01T16:44:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。