Fugu-MT 論文翻訳(概要): Look Both Ways Before You Cross: Lifting Cross Fields From 2D Visual Priors

論文の概要: Look Both Ways Before You Cross: Lifting Cross Fields From 2D Visual Priors

arxiv url: http://arxiv.org/abs/2605.26062v1
Date: Mon, 25 May 2026 17:23:23 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-26 19:50:20.54353
Title: Look Both Ways Before You Cross: Lifting Cross Fields From 2D Visual Priors
Title（参考訳）: 横切る前に両方の方向を見る:2Dビジュアルプリミティブからクロスフィールドをリフティングする
Authors: Dale Decatur, Jacob Serfaty, Oded Stein, Amir Vaxman, Rana Hanocka,
Abstract要約: CrossLiftは、画像の視覚的特徴によってガイドされるメッシュ上のクロスフィールドを計算するためのテクニックである。我々は、粗いユーザ描画線を信号として用いたインタラクティブなクロスフィールド設計とともに、テクスチャ整列クワッドメッシュへのさらなる応用を示す。
参考スコア（独自算出の注目度）: 19.985353825489078
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present CrossLift, a technique for computing cross fields on meshes guided by visual features in images. We leverage powerful text-to-image priors that are capable of synthesizing images of feature-aligned quad meshes in 2D. We extract this signal as explicit per-pixel directions in the 2D images, which we then back-project to the mesh surface. We aggregate these candidate surface directions by performing two smooth interpolations on the mesh surface (first within each view and second across multiple views). We propose custom confidence-based weights for the candidate directions in each interpolation that allow us to resolve conflicts between candidates on the same face and smoothly interpolate our field to occluded faces. Our method is modular and can be used with many different 2D visual priors. We show additional applications to texture-aligned quad meshing as well as interactive cross-field design using coarse, user-drawn lines as signal. We demonstrate the effectiveness of CrossLift on a diverse set of both organic and mechanical shapes and produce quad meshes that exhibit superior semantic alignment as compared to existing methods. Project page at: https://crosslift.github.io/
Abstract（参考訳）: 画像の視覚的特徴によって導かれるメッシュ上でのクロスフィールドの計算手法であるCrossLiftを提案する。特徴整列されたクワッドメッシュの画像を2Dで合成できる強力なテキスト・ツー・イメージの優位性を活用します。我々は,この信号を2次元画像中の明示的な画素毎の方向として抽出し,メッシュ表面へのバックプロジェクションを行う。メッシュ表面上で2つの滑らかな補間を行うことにより,これらの候補表面方向を集約する(第1は各ビュー内,第2は複数のビューにわたって)。我々は,各補間における候補方向に対する独自の信頼度に基づく重み付けを提案し,同一面上の候補間の衝突を解消し,視野を隠蔽面に円滑に補間する。我々の手法はモジュラーであり、多くの異なる2次元視覚的先駆体で使用することができる。我々は、粗いユーザ描画線を信号として用いたインタラクティブなクロスフィールド設計とともに、テクスチャ整列クワッドメッシュへのさらなる応用を示す。そこで我々は,CrossLiftの有機的および機械的形状の多様な集合に対する効果を実証し,既存の手法に比べて優れたセマンティックアライメントを示すクワッドメッシュを生成する。 Project page at: https://crosslift.github.io/

関連論文リスト

PercHead: Perceptual Head Model for Single-Image 3D Head Reconstruction & Editing [51.56943889042673]
PercHeadは、シングルイメージの3Dヘッド再構成とセマンティック3D編集のための方法である。単一の入力画像からビュー一貫性を持つ3Dヘッドを再構成するための統一ベースモデルを開発する。軽量でインタラクティブなGUIを通して、直感的で強力な3D編集機能を強調します。
論文参考訳（メタデータ） (2025-11-04T17:59:15Z)
Surface Reconstruction from Point Clouds via Grid-based Intersection Prediction [12.329450385760051]
本稿では,点対の線分と暗黙曲面との交点を直接予測する手法を提案する。提案手法は,ShapeNet,MGN,ScanNetの3つのデータセット上での最先端性能を示す。
論文参考訳（メタデータ） (2024-03-21T02:31:17Z)
Differentiable Registration of Images and LiDAR Point Clouds with VoxelPoint-to-Pixel Matching [58.10418136917358]
カメラからの2D画像とLiDARからの3Dポイントクラウドの間のクロスモダリティ登録は、コンピュータビジョンとロボットトレーニングにおいて重要な課題である。ニューラルネットワークで学習した点パターンと画素パターンのマッチングによる2次元3次元対応の推定我々は、異なる潜在画素空間を介して3次元特徴を表現するために、構造化されたモダリティマッチングソルバを学習する。
論文参考訳（メタデータ） (2023-12-07T05:46:10Z)
MvDeCor: Multi-view Dense Correspondence Learning for Fine-grained 3D Segmentation [91.6658845016214]
そこで本研究では,2次元領域における自己教師型手法を,微細な3次元形状分割作業に活用することを提案する。複数のビューから3次元形状を描画し、コントラスト学習フレームワーク内に密接な対応学習タスクを設置する。その結果、学習された2次元表現はビュー不変であり、幾何学的に一貫性がある。
論文参考訳（メタデータ） (2022-08-18T00:48:15Z)
Z2P: Instant Rendering of Point Clouds [104.1186026323896]
ニューラルネットワークを用いて点雲をレンダリングする手法を提案する。既存のポイントレンダリング技術は、スプレイティングを使用するか、最初にレンダリング可能な表面メッシュを再構築する。
論文参考訳（メタデータ） (2021-05-30T13:58:24Z)
Bidirectional Projection Network for Cross Dimension Scene Understanding [69.29443390126805]
本稿では,2次元および3次元の連立推論のための縦方向投影網(BPNet)をエンドツーエンドに提示する。 emphBPM、補完的な2D、および3D情報は、複数のアーキテクチャレベルで相互に相互作用することができる。我々のemphBPNetは2次元および3次元セマンティックセマンティックセグメンテーションのためのScanNetV2ベンチマークで最高性能を達成した。
論文参考訳（メタデータ） (2021-03-26T08:31:39Z)
Multi-Plane Program Induction with 3D Box Priors [110.6726150681556]
1つの画像からプログラムライクなシーン表現を推論するBox Program Injection (BPI)を提案する。 BPIは同時に、複数の2次元平面上の繰り返し構造、平面の3次元位置と向き、およびカメラパラメータをモデル化する。ニューラルネットワークを使って、点の消滅やワイヤーフレーム線などの視覚的手がかりを推論し、検索ベースのアルゴリズムを誘導し、最もよく画像を説明するプログラムを見つける。
論文参考訳（メタデータ） (2020-11-19T18:07:46Z)
Contact Area Detector using Cross View Projection Consistency for COVID-19 Projects [7.539495357219132]
物体と静的表面との接触は、2つの異なる視点から物体を静的表面へ投影することで識別可能であることを示す。この単純な方法は現実の応用に容易に適応できる。
論文参考訳（メタデータ） (2020-08-18T02:57:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。