論文の概要: 3D-LENS: A 3D Lifting-based Elevated Novel-view Synthesis method for Single-View Aerial-Ground Re-Identification
- arxiv url: http://arxiv.org/abs/2604.26520v1
- Date: Wed, 29 Apr 2026 10:38:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.360678
- Title: 3D-LENS: A 3D Lifting-based Elevated Novel-view Synthesis method for Single-View Aerial-Ground Re-Identification
- Title(参考訳): 3D-LENS: 単層空域再同定のための3次元リフティングに基づく高次新規ビュー合成法
- Authors: William Grolleau, Astrid Sabourin, Guillaume Lapouge, Catherine Achard,
- Abstract要約: Aerial-Ground Re-Identification (AG-ReID) は、視点領域のギャップによって制約される。
私たちはまず、Single-View AG-ReID設定をフォーマルにすることで、この問題に対処します。
3次元リフティングに基づく高次新規ビュー合成(3D-LENS)を提案する。
- 参考スコア(独自算出の注目度): 1.621606615628714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aerial-Ground Re-Identification (AG-ReID) is constrained by the viewpoint-domain gap, as drastic viewpoint disparities occlude or distort discriminative features, making cross-viewpoint image retrieval challenging. While existing methods rely on paired cross-view annotations, real-world deployments, such as wilderness search-and-rescue (SAR), often lack target-domain data, requiring retrieval from ground-level references alone. To our knowledge, we are the first to address this challenge by formalizing the Single-View AG-ReID (SV AG-ReID) setting, where models trained on a single real viewpoint must generalize to an unseen viewpoint. We propose 3D Lifting-based Elevated Novel-view Synthesis (3D-LENS), a unified framework combining geometrically-consistent novel view synthesis that leverages large-scale 3D mesh reconstruction, with a robust representation learning scheme to mitigate synthetic-to-real bias. Unlike 2D generative baselines that suffer from geometric inconsistencies or prior 3D methods that are restricted to class-specific templates, our approach ensures view-consistent synthesis across diverse categories without predefined templates that fail to capture fine-grained details, such as carried objects. Extensive experiments demonstrate that our method achieves state-of-the-art performance on SV AG-ReID scenarios. Code and data will be released at https://github.com/TurtleSmoke/3D-LENS.
- Abstract(参考訳): Aerial-Ground Re-Identification (AG-ReID) は、視点領域のギャップによって制約される。
既存のメソッドはペアのクロスビューアノテーションに依存しているが、ワイルドネスサーチ・アンド・レスキュー(SAR)のような現実世界のデプロイメントでは、しばしばターゲットドメインのデータがなく、地上レベルの参照のみから検索する必要がある。
我々の知る限り、我々は、単一視点AG-ReID(SV AG-ReID)設定を定式化することで、この課題に最初に対処する。
本稿では,大規模3次元メッシュ再構成を利用した幾何学的に一貫性のある新規ビュー合成を組み合わせた統合フレームワークである3D Lifting-based Elevated Novel-view Synthesis (3D-LENS)を提案する。
幾何学的不整合に苦しむ2次元生成ベースラインや、クラス固有のテンプレートに制限される以前の3次元手法とは異なり、本手法は、搬送対象のような細かな詳細を捕捉できない予め定義されたテンプレートなしで、様々なカテゴリにわたってビュー一貫性の合成を確実にする。
本手法がSV AG-ReIDシナリオにおける最先端性能を実現することを実証した。
コードとデータはhttps://github.com/TurtleSmoke/3D-LENS.comで公開される。
関連論文リスト
- CoordAR: One-Reference 6D Pose Estimation of Novel Objects via Autoregressive Coordinate Map Generation [20.453498343557026]
CoordARは、一参照6Dポーズ推定のための新しい自動回帰フレームワークである。
1) 離散化された3次元空間上での確率的予測を可能にする新しい座標マップのトークン化,2) RGBの外観と座標キューを別々に符号化するモダリティデカップリング符号化戦略,3) 両方の位置整列クエリ特徴に条件付き自己回帰変換器デコーダを提案する。
論文 参考訳(メタデータ) (2025-11-17T03:15:46Z) - OracleGS: Grounding Generative Priors for Sparse-View Gaussian Splatting [78.70702961852119]
OracleGSは、Gaussian Splattingのスパースビューのために、生成的完全性と回帰的忠実性を調整している。
提案手法は,多視点幾何学的証拠に先立って強力な生成条件を定め,幻覚的アーティファクトをフィルタリングし,非拘束領域における可塑性完備を保存している。
論文 参考訳(メタデータ) (2025-09-27T11:19:32Z) - DeOcc-1-to-3: 3D De-Occlusion from a Single Image via Self-Supervised Multi-View Diffusion [50.90541069907167]
閉塞型マルチビュー生成のためのエンドツーエンドフレームワークであるDeOcc-1-to-3を提案する。
私たちの自己教師型トレーニングパイプラインは、隠蔽されたイメージペアと擬似地上構造ビューを活用して、モデル構造を意識した補完とビュー整合性を教える。
論文 参考訳(メタデータ) (2025-06-26T17:58:26Z) - DiHuR: Diffusion-Guided Generalizable Human Reconstruction [51.31232435994026]
一般化可能なヒト3次元再構成のための拡散誘導モデルであるDiHuRを導入し,スパース・ミニマル・オーバーラップ画像からのビュー合成について述べる。
提案手法は, 一般化可能なフィードフォワードモデルと2次元拡散モデルとの2つのキー前処理をコヒーレントな方法で統合する。
論文 参考訳(メタデータ) (2024-11-16T03:52:23Z) - Epipolar-Free 3D Gaussian Splatting for Generalizable Novel View Synthesis [25.924727931514735]
一般化可能な3DGSは、フィードフォワード推論方式でスパースビュー観測から新しいシーンを再構築することができる。
既存の手法は、複雑な現実世界のシーンでは信頼できないエピポーラ先行に大きく依存している。
一般化可能な新規ビュー合成のための効率的なフィードフォワード3DGSモデルであるeFreeSplatを提案する。
論文 参考訳(メタデータ) (2024-10-30T08:51:29Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。