論文の概要: ReassembleNet: Learnable Keypoints and Diffusion for 2D Fresco Reconstruction
- arxiv url: http://arxiv.org/abs/2505.21117v2
- Date: Thu, 29 May 2025 14:16:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 13:10:25.753258
- Title: ReassembleNet: Learnable Keypoints and Diffusion for 2D Fresco Reconstruction
- Title(参考訳): ReassembleNet: 2D Fresco 再構成のための学習可能なキーポイントと拡散
- Authors: Adeela Islam, Stefano Fiorini, Stuart James, Pietro Morerio, Alessio Del Bue,
- Abstract要約: 我々は、最先端のDeep Learningメソッドにおいて、再アセンブリのための重要な制限に対処する。
本稿では,各入力片を輪郭キーポイントの集合として表現することで,複雑性を低減する手法であるReassembleNetを提案する。
次に拡散に基づくポーズ推定を適用し,元の構造を復元する。
- 参考スコア(独自算出の注目度): 20.327632780374497
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The task of reassembly is a significant challenge across multiple domains, including archaeology, genomics, and molecular docking, requiring the precise placement and orientation of elements to reconstruct an original structure. In this work, we address key limitations in state-of-the-art Deep Learning methods for reassembly, namely i) scalability; ii) multimodality; and iii) real-world applicability: beyond square or simple geometric shapes, realistic and complex erosion, or other real-world problems. We propose ReassembleNet, a method that reduces complexity by representing each input piece as a set of contour keypoints and learning to select the most informative ones by Graph Neural Networks pooling inspired techniques. ReassembleNet effectively lowers computational complexity while enabling the integration of features from multiple modalities, including both geometric and texture data. Further enhanced through pretraining on a semi-synthetic dataset. We then apply diffusion-based pose estimation to recover the original structure. We improve on prior methods by 55% and 86% for RMSE Rotation and Translation, respectively.
- Abstract(参考訳): 再組み立ての課題は、考古学、ゲノム学、分子ドッキングなど、複数の領域にまたがる重要な課題であり、元の構造を再構築するためには、元素の正確な配置と配向が必要である。
本研究では,最先端のDeep Learning手法における重要な制約,すなわち,再組立のための問題点に対処する。
i) 拡張性
ii) マルチモーダリティ,及び
三 実世界の適用可能性 正方形又は簡易な幾何学的形状、現実的かつ複雑な浸食、その他の実世界の問題を超えて。
本稿では,各入力片を一組の輪郭キーポイントとして表現し,グラフニューラルネットワークにインスパイアされた手法を用いて最も情報に富むものを選択することによって,複雑さを低減する手法であるReassembleNetを提案する。
ReassembleNetは、幾何データとテクスチャデータの両方を含む複数のモードからのフィーチャの統合を可能にしながら、計算の複雑さを効果的に低減する。
半合成データセットの事前トレーニングによりさらに強化された。
次に拡散に基づくポーズ推定を適用し,元の構造を復元する。
RMSE回転と翻訳では, 従来の手法を55%, 86%改善した。
関連論文リスト
- Dual-branch Graph Feature Learning for NLOS Imaging [51.31554007495926]
非視線イメージング(NLOS)は、直接見えない閉塞されたシーンを明らかにする機能を提供する。
xnet法は、アルベド情報回復に特化したアルベド中心の再構築ブランチと、幾何学的構造を抽出する深さ中心の再構築ブランチを統合する。
提案手法は,合成データと実データの間で,既存の手法の中で最も高い性能を実現する。
論文 参考訳(メタデータ) (2025-02-27T01:49:00Z) - ArtGS: Building Interactable Replicas of Complex Articulated Objects via Gaussian Splatting [66.29782808719301]
コンピュータビジョンにおいて、音声で表現されたオブジェクトを構築することが重要な課題である。
既存のメソッドは、しばしば異なるオブジェクト状態間で効果的に情報を統合できない。
3次元ガウスを柔軟かつ効率的な表現として活用する新しいアプローチであるArtGSを紹介する。
論文 参考訳(メタデータ) (2025-02-26T10:25:32Z) - On Characterizing the Evolution of Embedding Space of Neural Networks
using Algebraic Topology [9.537910170141467]
特徴埋め込み空間のトポロジがベッチ数を介してよく訓練されたディープニューラルネットワーク(DNN)の層を通過するとき、どのように変化するかを検討する。
深度が増加するにつれて、トポロジカルに複雑なデータセットが単純なデータセットに変換され、ベッチ数はその最小値に達することが示される。
論文 参考訳(メタデータ) (2023-11-08T10:45:12Z) - Differentiable Architecture Pruning for Transfer Learning [6.935731409563879]
本研究では,与えられた大規模モデルからサブアーキテクチャを抽出するための勾配に基づくアプローチを提案する。
我々のアーキテクチャ・プルーニング・スキームは、異なるタスクを解くために再訓練を成功させることができるトランスファー可能な新しい構造を生成する。
理論的収束保証を提供し、実データ上で提案した伝達学習戦略を検証する。
論文 参考訳(メタデータ) (2021-07-07T17:44:59Z) - Over-and-Under Complete Convolutional RNN for MRI Reconstruction [57.95363471940937]
MR画像再構成のための最近のディープラーニングに基づく手法は、通常、汎用的なオートエンコーダアーキテクチャを利用する。
OUCR(Over-and-Under Complete Convolu?tional Recurrent Neural Network)を提案する。
提案手法は, トレーニング可能なパラメータの少ない圧縮されたセンシングと, 一般的なディープラーニングに基づく手法に対して, 大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-06-16T15:56:34Z) - Dual-constrained Deep Semi-Supervised Coupled Factorization Network with
Enriched Prior [80.5637175255349]
本稿では、DS2CF-Netと呼ばれる、拡張された事前制約付きDual-Constrained Deep Semi-Supervised Coupled Factorization Networkを提案する。
隠れた深い特徴を抽出するために、DS2CF-Netは、深い構造と幾何学的な構造に制約のあるニューラルネットワークとしてモデル化される。
我々のネットワークは、表現学習とクラスタリングのための最先端の性能を得ることができる。
論文 参考訳(メタデータ) (2020-09-08T13:10:21Z) - Convolutional Occupancy Networks [88.48287716452002]
本稿では,オブジェクトと3Dシーンの詳細な再構築のための,より柔軟な暗黙的表現である畳み込み機能ネットワークを提案する。
畳み込みエンコーダと暗黙の占有デコーダを組み合わせることで、帰納的バイアスが組み込まれ、3次元空間における構造的推論が可能となる。
実験により,本手法は単一物体の微細な3次元再構成,大規模屋内シーンへのスケール,合成データから実データへの一般化を可能にした。
論文 参考訳(メタデータ) (2020-03-10T10:17:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。