論文の概要: FILTR: Extracting Topological Features from Pretrained 3D Models
- arxiv url: http://arxiv.org/abs/2604.22334v2
- Date: Tue, 28 Apr 2026 09:16:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 14:06:43.815731
- Title: FILTR: Extracting Topological Features from Pretrained 3D Models
- Title(参考訳): FILTR:事前訓練された3次元モデルから位相的特徴を抽出する
- Authors: Louis Martinez, Maks Ovsjanikov,
- Abstract要約: 凍結した3Dエンコーダから直接永続性図を予測するための学習可能なフレームワークを提案する。
我々のアプローチは、初めて生の点雲から永続性図をデータ駆動で抽出することを可能にする。
- 参考スコア(独自算出の注目度): 33.2175112734242
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in pretraining 3D point cloud encoders (e.g., Point-BERT, Point-MAE) have produced powerful models, whose abilities are typically evaluated on geometric or semantic tasks. At the same time, topological descriptors have been shown to provide informative summaries of a shape's multiscale structure. In this paper we pose the question whether topological information can be derived from features produced by 3D encoders. To address this question, we first introduce DONUT, a synthetic benchmark with controlled topological complexity, and propose FILTR (Filtration Transformer), a learnable framework to predict persistence diagrams directly from frozen encoders. FILTR adapts a transformer decoder to treat diagram generation as a set prediction task. Our analysis on DONUT reveals that existing encoders retain only limited global topological signals, yet FILTR successfully leverages information produced by these encoders to approximate persistence diagrams. Our approach enables, for the first time, data-driven extraction of persistence diagrams from raw point clouds through an efficient learnable feed-forward mechanism.
- Abstract(参考訳): 3Dポイント・クラウド・エンコーダ(例えばPoint-BERT、Point-MAE)の事前訓練の最近の進歩は、幾何学的・セマンティックなタスクで一般的に評価される強力なモデルを生み出している。
同時に、トポロジカルディスクリプタは、形状のマルチスケール構造の情報的要約を提供することが示されている。
本稿では,3次元エンコーダが生成する特徴からトポロジ的情報を抽出できるかどうかを問う。
この問題に対処するために、まず、制御された位相的複雑性を持つ合成ベンチマークであるDONUTを導入し、凍結エンコーダから直接永続性図を予測するための学習可能なフレームワークであるFILTR(Filtration Transformer)を提案する。
FILTRは、ダイアグラム生成をセット予測タスクとして扱うためにトランスフォーマーデコーダを適用する。
DONUTにおける解析により,既存のエンコーダは限られたグローバルトポロジカル信号のみを保持するが,FILTRはそれらのエンコーダが生成した情報を利用して永続性図を近似することに成功した。
当社のアプローチは,効率的な学習可能なフィードフォワード機構を通じて,原点雲からの永続性図をデータ駆動で抽出することを可能にする。
関連論文リスト
- Challenges in 3D Data Synthesis for Training Neural Networks on Topological Features [0.0]
トポロジカルデータ分析は、データの構造と接続性を分析する技術を含んでいる。
永続的ホモロジーのような伝統的な手法は、計算的に要求され、ニューラルネットワークベースの推定器の開発を動機付けている。
これらの手法を進化させる鍵となる障壁は、教師あり学習に特化したクラス分布と多様性を備えたラベル付き3Dデータの欠如である。
本稿では, 3次元畳み込み変換器アーキテクチャを用いて作成した, 属推定器ネットワークの学習に, 合成3次元データセットを用いる。
論文 参考訳(メタデータ) (2025-11-07T04:15:32Z) - Adaptive Point-Prompt Tuning: Fine-Tuning Heterogeneous Foundation Models for 3D Point Cloud Analysis [51.37795317716487]
本稿では,パラメータの少ない事前学習モデルを微調整するAdaptive Point-Prompt Tuning (APPT)法を提案する。
局所幾何学を集約することで原点雲を点埋め込みに変換し、空間的特徴を捉える。
任意のモダリティのソース領域から3Dへの自己アテンションを校正するために,重みを点埋め込みモジュールと共有するプロンプトジェネレータを導入する。
論文 参考訳(メタデータ) (2025-08-30T06:02:21Z) - Vector Representations of Vessel Trees [12.391128284848135]
本稿では,3次元血管ネットワークに着目した木構造幾何データのベクトル表現を学習するための新しいフレームワークを提案する。
我々のフレームワークであるVeTTAは、医用画像における解剖学的構造を正確に、柔軟で、位相的に一貫したモデリングを提供する。
論文 参考訳(メタデータ) (2025-06-11T20:34:08Z) - ARFA: An Asymmetric Receptive Field Autoencoder Model for Spatiotemporal
Prediction [55.30913411696375]
本稿では,非対称な受容場オートエンコーダ (ARFA) モデルを提案する。
エンコーダでは,大域的時間的特徴抽出のための大規模なカーネルモジュールを提案し,デコーダでは局所的時間的再構成のための小さなカーネルモジュールを開発する。
降水予測のための大規模レーダエコーデータセットであるRainBenchを構築し,その領域における気象データの不足に対処する。
論文 参考訳(メタデータ) (2023-09-01T07:55:53Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Self-Supervised Point Cloud Representation Learning with Occlusion
Auto-Encoder [63.77257588569852]
本稿では,3D Occlusion Auto-Encoder(3D-OAE)を提案する。
私たちのキーとなるアイデアは、入力ポイントクラウドのローカルパッチをランダムに排除し、隠されたパッチを復元することで監督を確立することです。
従来の手法とは対照的に、我々の3D-OAEは大量のパッチを除去し、少数の可視パッチでしか予測できない。
論文 参考訳(メタデータ) (2022-03-26T14:06:29Z) - Implicit Autoencoder for Point-Cloud Self-Supervised Representation
Learning [39.521374237630766]
最もポピュラーでアクセスしやすい3D表現、すなわち点雲は、下層の連続した3D表面の離散的なサンプルを含む。
この離散化プロセスは3次元形状のサンプリングのバリエーションを導入し、真の3次元幾何学の伝達可能な知識を開発するのが困難になる。
標準的なオートエンコーディングパラダイムでは、エンコーダは3D形状だけでなく、3D形状の特定の離散サンプリングに関する情報を潜在コードにエンコードする。
これは、デコーダによって再構成された点雲が、原点と再構成された点との完全なマッピングがない限り、受け入れられないためである。
論文 参考訳(メタデータ) (2022-01-03T18:05:52Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - Encoded Prior Sliced Wasserstein AutoEncoder for learning latent
manifold representations [0.7614628596146599]
本稿では,Encoded Prior Sliced Wasserstein AutoEncoderを紹介する。
追加のプリエンコーダネットワークは、データ多様体の埋め込みを学習する。
従来のオートエンコーダとは違って,前者はデータの基盤となる幾何を符号化する。
論文 参考訳(メタデータ) (2020-10-02T14:58:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。