論文の概要: CaliTex: Geometry-Calibrated Attention for View-Coherent 3D Texture Generation
- arxiv url: http://arxiv.org/abs/2511.21309v2
- Date: Mon, 01 Dec 2025 15:45:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 15:37:38.34102
- Title: CaliTex: Geometry-Calibrated Attention for View-Coherent 3D Texture Generation
- Title(参考訳): CaliTex:ビューコヒーレントな3Dテクスチャ生成のための幾何学的校正的注意
- Authors: Chenyu Liu, Hongze Chen, Jingzhi Bao, Lingting Zhu, Runze Zhang, Weikai Chen, Zeyu Hu, Yingda Yin, Keyang Luo, Xin Wang,
- Abstract要約: 本稿では,3次元構造に注意を配向させる幾何補正型アテンションのフレームワークであるCaliTexを紹介する。
パートアラインド・アテンションは意味的に一致した部分の空間的アライメントを強制し、コンディション・アテンションは空間的忠実性を維持するために幾何学的条件付き経路を通して外観情報をルートする。
実証的に、CaliTexはシームレスでビューに一貫性のあるテクスチャを生成し、オープンソースのベースラインと商用ベースラインの両方を上回ります。
- 参考スコア(独自算出の注目度): 28.71183329814819
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite major advances brought by diffusion-based models, current 3D texture generation systems remain hindered by cross-view inconsistency -- textures that appear convincing from one viewpoint often fail to align across others. We find that this issue arises from attention ambiguity, where unstructured full attention is applied indiscriminately across tokens and modalities, causing geometric confusion and unstable appearance-structure coupling. To address this, we introduce CaliTex, a framework of geometry-calibrated attention that explicitly aligns attention with 3D structure. It introduces two modules: Part-Aligned Attention that enforces spatial alignment across semantically matched parts, and Condition-Routed Attention which routes appearance information through geometry-conditioned pathways to maintain spatial fidelity. Coupled with a two-stage diffusion transformer, CaliTex makes geometric coherence an inherent behavior of the network rather than a byproduct of optimization. Empirically, CaliTex produces seamless and view-consistent textures and outperforms both open-source and commercial baselines.
- Abstract(参考訳): 拡散ベースのモデルがもたらす大きな進歩にもかかわらず、現在の3Dテクスチャ生成システムは、クロスビューの不整合によって妨げられている。
この問題は、トークンやモダリティに対して非構造的全注意が無差別に適用され、幾何学的混乱と不安定な外観-構造結合を引き起こしている注意曖昧性から生じる。
これを解決するために,3次元構造に注意を配向させる幾何学的な注意の枠組みであるCaliTexを紹介した。
意味的に一致した部分間の空間的アライメントを強制するPart-Aligned Attentionと、空間的忠実性を維持するために幾何学的条件付き経路を通して外観情報をルーティングするCondition-Routed Attentionという2つのモジュールを導入している。
2段拡散変圧器と組み合わせて、CaliTexは幾何学的コヒーレンスを最適化の副産物ではなく、ネットワーク固有の振る舞いにする。
実証的に、CaliTexはシームレスでビューに一貫性のあるテクスチャを生成し、オープンソースのベースラインと商用ベースラインの両方を上回ります。
関連論文リスト
- NaTex: Seamless Texture Generation as Latent Color Diffusion [23.99275629136662]
本研究では,3次元空間で直接テクスチャ色を予測するネイティブテクスチャ生成フレームワークNaTexを提案する。
NaTexはMVDパイプラインに固有のいくつかの制限を避ける。
論文 参考訳(メタデータ) (2025-11-20T12:47:22Z) - Seeing 3D Through 2D Lenses: 3D Few-Shot Class-Incremental Learning via Cross-Modal Geometric Rectification [59.17489431187807]
本稿では,CLIPの階層的空間意味論を活用することで3次元幾何学的忠実度を高めるフレームワークを提案する。
本手法は3次元のクラスインクリメンタル学習を著しく改善し,テクスチャバイアスに対して優れた幾何コヒーレンスとロバスト性を実現する。
論文 参考訳(メタデータ) (2025-09-18T13:45:08Z) - Aligned Novel View Image and Geometry Synthesis via Cross-modal Attention Instillation [62.87088388345378]
ワーピング・アンド・インペインティング手法を用いて,新しいビューイメージと幾何学生成の整合性を実現する拡散型フレームワークを提案する。
手法は、既製の幾何学予測器を利用して、参照画像から見る部分的な幾何学を予測する。
生成した画像と幾何の正確なアライメントを確保するために, クロスモーダルアテンション蒸留法を提案する。
論文 参考訳(メタデータ) (2025-06-13T16:19:00Z) - CaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation [2.544527978847722]
CaPaは、高忠実度3Dアセットを効率的に生成するカーブ・アンド・ペイントのフレームワークである。
テクスチャの忠実さと幾何学的安定性に優れ、実用的でスケーラブルな3Dアセット生成のための新しい標準を確立する。
論文 参考訳(メタデータ) (2025-01-16T10:03:15Z) - GenesisTex2: Stable, Consistent and High-Quality Text-to-Texture Generation [35.04723374116026]
大規模テキスト・トゥ・イメージ(T2I)モデルは、テキスト・トゥ・イメージ(T2I)生成において驚くべき結果を示している。
これらのモデルを用いて3次元ジオメトリーのテクスチャを合成することは、2次元画像と3次元表面のテクスチャとの領域ギャップのために依然として困難である。
本稿では,事前学習した拡散モデルを活用する新しいテキスト・テクスチャ合成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-27T02:32:42Z) - Neural Semantic Surface Maps [52.61017226479506]
本稿では,2つの属とゼロの形状の地図を自動計算する手法を提案する。
提案手法は,手動のアノテーションや3Dトレーニングデータ要求を排除し,意味的表面-表面マップを生成する。
論文 参考訳(メタデータ) (2023-09-09T16:21:56Z) - Deep Geometric Texture Synthesis [83.9404865744028]
幾何学的テクスチャを合成するための新しい枠組みを提案する。
単一の参照3Dモデルの局所的な近傍からテクスチャ統計を学習する。
我々のネットワークはメッシュ頂点を任意の方向に変位させ、幾何学的テクスチャの合成を可能にする。
論文 参考訳(メタデータ) (2020-06-30T19:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。