論文の概要: Geodiffussr: Generative Terrain Texturing with Elevation Fidelity
- arxiv url: http://arxiv.org/abs/2511.23029v1
- Date: Fri, 28 Nov 2025 09:52:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.8446
- Title: Geodiffussr: Generative Terrain Texturing with Elevation Fidelity
- Title(参考訳): Geodiffussr:Elevation Fidelityによる地層テクスチャ生成
- Authors: Tai Inui, Alexander Matsumura, Edgar Simo-Serra,
- Abstract要約: テキスト誘導テクスチャマップを合成するフローマッチングパイプラインであるGeodiffussrを紹介する。
マルチスケールコンテンツアグリゲーション(MCA): DEM機能は、複数の解像度でUNetブロックに注入され、グローバルからローカライズされた高度の一貫性が強制される。
Geodiffussrを訓練し,評価するために,SRTM由来のDEMとSentinel-2画像と視覚接地型自然出現キャプションを組み合わせた三重項のグローバル分布,バイオメ-および気候成層コーパスを組み立てた。
- 参考スコア(独自算出の注目度): 48.82552523546255
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large-scale terrain generation remains a labor-intensive task in computer graphics. We introduce Geodiffussr, a flow-matching pipeline that synthesizes text-guided texture maps while strictly adhering to a supplied Digital Elevation Map (DEM). The core mechanism is multi-scale content aggregation (MCA): DEM features from a pretrained encoder are injected into UNet blocks at multiple resolutions to enforce global-to-local elevation consistency. Compared with a non-MCA baseline, MCA markedly improves visual fidelity and strengthens height-appearance coupling (FID $\downarrow$ 49.16%, LPIPS $\downarrow$ 32.33%, $Δ$dCor $\downarrow$ to 0.0016). To train and evaluate Geodiffussr, we assemble a globally distributed, biome- and climate-stratified corpus of triplets pairing SRTM-derived DEMs with Sentinel-2 imagery and vision-grounded natural-language captions that describe visible land cover. We position Geodiffussr as a strong baseline and step toward controllable 2.5D landscape generation for coarse-scale ideation and previz, complementary to physically based terrain and ecosystem simulators.
- Abstract(参考訳): 大規模な地形生成は、コンピュータグラフィックスにおける労働集約的な課題である。
テキスト誘導テクスチャマップを合成するフローマッチングパイプラインであるGeodiffussrについて,DEM(Digital Elevation Map)に厳密に付着しながら紹介する。
マルチスケールコンテンツアグリゲーション(MCA): 事前訓練されたエンコーダのDEM機能は、複数の解像度でUNetブロックに注入され、グローバルからローカルへの高度一貫性が強制される。
非MCAベースラインと比較して、MCAは視覚的忠実度を著しく改善し、高さ-外観結合を強化している(FID $\downarrow$ 49.16%、LPIPS $\downarrow$ 32.33%、$Δ$dCor $\downarrow$ 0.0016)。
Geodiffussrを訓練し,評価するために,SRTM由来のDEMとSentinel-2画像,およびランドカバーを視覚的に表現した自然言語キャプションを組み合わせた三重項のグローバル分布,バイオメ-および気候成層コーパスを組み立てた。
我々はGeodiffussrを強力なベースラインとして位置づけ、粗大なアイデアとプレビズのための制御可能な2.5Dランドスケープ生成に向けて、物理的に基盤とした地形と生態系シミュレータを補完する。
関連論文リスト
- Exploring the Underwater World Segmentation without Extra Training [55.291219073365546]
我々は,最初の大規模かつ微細な水中セグメンテーションデータセットである textbfAquaOV255 を紹介する。
トレーニング不要なOVセグメンテーションフレームワークである textbfEarth2Ocean も紹介する。
論文 参考訳(メタデータ) (2025-11-11T07:22:56Z) - EarthCrafter: Scalable 3D Earth Generation via Dual-Sparse Latent Diffusion [23.3834795181211]
Aerial-Earth3Dは、これまでで最大の3D空中データセットで、アメリカ本土で撮影された50万のキュレートされたシーン(それぞれ600m×600m)で構成されています。
各シーンは、ポーズアノテートされたマルチビューイメージ、深度マップ、ノーマル、セマンティックセグメンテーション、カメラのポーズを提供し、地形の多様性を保証するための明確な品質制御を提供する。
我々は,スパースデカップリング型潜水拡散による大規模3次元地球生成に適したフレームワークであるEarthCrafterを提案する。
論文 参考訳(メタデータ) (2025-07-22T12:46:48Z) - EarthMapper: Visual Autoregressive Models for Controllable Bidirectional Satellite-Map Translation [50.433911327489554]
制御可能な衛星マップ翻訳のための新しいフレームワークであるEarthMapperを紹介する。
また,中国38都市を対象とした302,132組の衛星マップからなる大規模データセットであるCNSatMapをコントリビュートした。
CNSatMapとNew Yorkデータセットの実験は、EarthMapperの優れたパフォーマンスを実証している。
論文 参考訳(メタデータ) (2025-04-28T02:41:12Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - LMSeg: An end-to-end geometric message-passing network on barycentric dual graphs for large-scale landscape mesh segmentation [5.698076346359676]
オーストラリアのビクトリア州にあるユネスコ世界遺産に登録されているBudj Bim文化景観から得られた大規模なアノテートメッシュデータセットであるBudjBim Wallデータセットを紹介した。
大規模メッシュのセマンティックセグメンテーションのためのディープグラフメッセージパッシングネットワークであるLMSegを提案する。
3つの大規模ベンチマーク(SUM、H3D、BBW)の実験では、LMSegはSUMで75.1% mIoU、H3Dで78.4% O.A.、BBWで62.4% mIoUを達成した。
論文 参考訳(メタデータ) (2024-07-05T07:55:06Z) - Context and Geometry Aware Voxel Transformer for Semantic Scene Completion [7.147020285382786]
視覚に基づくセマンティックシーンコンプリート(SSC)は、様々な3次元知覚タスクに広く応用されているため、多くの注目を集めている。
既存のスパース・トゥ・デンス・アプローチでは、様々な入力画像間で共有コンテキストに依存しないクエリを使用するのが一般的である。
セマンティックシーン補完を実現するためにCGFormerというニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2024-05-22T14:16:30Z) - Learning without Exact Guidance: Updating Large-scale High-resolution Land Cover Maps from Low-resolution Historical Labels [4.833320222969612]
大規模な高解像度(HR)の土地被覆マッピングは、地球の表面を調査し、人類が直面する多くの課題を解決するための重要な課題である。
本研究では,大規模人事地被覆地図作成のための効率的かつ弱教師付きフレームワーク(Paraformer)を提案する。
論文 参考訳(メタデータ) (2024-03-05T08:02:00Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。