論文の概要: PointCSP: Cross-Sample Semantic Propagation and Stability Preservation in Self-Supervised Point Cloud Learning
- arxiv url: http://arxiv.org/abs/2605.01759v1
- Date: Sun, 03 May 2026 07:40:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.926054
- Title: PointCSP: Cross-Sample Semantic Propagation and Stability Preservation in Self-Supervised Point Cloud Learning
- Title(参考訳): PointCSP: 自己監督型ポイントクラウドラーニングにおけるクロスサンプルセマンティックプロパゲーションと安定性の維持
- Authors: Xinxing Yu, Ajian Liu, Sunyuan Qiang, Hui Ma, Liying Yang, Yuzhong Wang, Zhi Rao, Yanyan Liang,
- Abstract要約: シーンレベルのクラウド自己教師型学習(PC-SSL)は、3次元視覚モデルの一般化能力を高める可能性を実証している。
バッチ内のサンプルを連続的な入力にシリアライズし,状態空間モデルで処理して意味状態の伝搬を可能にする,クロスサンプル意味伝搬(CSP)に基づくPC-SSLフレームワークを提案する。
このメカニズムは、状態空間のサンプル間の動的依存関係を明示的にモデル化し、ネットワークが潜在空間におけるクロスサンプルセマンティック一貫性を確立し、グローバルなセマンティックアライメントを実現する。
- 参考スコア(独自算出の注目度): 14.22776855572358
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scene-level point cloud self-supervised learning (PC-SSL) has demonstrated potential in enhancing the generalization capability of 3D vision models. Despite the advances in the field through existing methods, the sample-independent modeling paradigm still poses significant limitations in terms of maintaining consistent semantic representations across scenes. This challenge hinders the construction of a unified and transferable semantic space. To address this issue, we propose a PC-SSL framework based on cross-sample semantic propagation (CSP), in which samples within a batch are serialized into continuous input and processed by a state-space model to enable semantic state propagation. This mechanism explicitly models the dynamic dependencies across samples in the state space, allowing the network to establish cross-sample semantic consistency in the latent space and achieve global semantic alignment. Since serialization-based pretraining requires batch-level input organization, we further introduce an asymmetric semantic preservation distillation (SPD) during finetuning to achieve structural alignment of semantic transfer and eliminate inconsistencies caused by batch dependency. The proposed SPD ensures stable transfer of pretrained semantics through a heterogeneous input mechanism and a semantic feature alignment constraint. This enables the model to maintain structured semantic consistency and robustness under single-scene testing conditions. Extensive experiments on multiple benchmark datasets demonstrate that our method consistently outperforms state-of-the-art methods in both performance and semantic consistency.
- Abstract(参考訳): シーンレベルのクラウド自己教師型学習(PC-SSL)は、3次元視覚モデルの一般化能力を高める可能性を実証している。
既存の手法による分野の発展にもかかわらず、サンプルに依存しないモデリングパラダイムは、シーン間の一貫性のあるセマンティック表現を維持するという点で、依然として大きな制限を課している。
この課題は、統一的で伝達可能な意味空間の構築を妨げる。
そこで本研究では, バッチ内のサンプルを連続的な入力にシリアライズし, 状態空間モデルで処理し, セマンティックな状態伝達を可能にする, クロスサンプルセマンティック・プロパゲーション(CSP)に基づくPC-SSLフレームワークを提案する。
このメカニズムは、状態空間のサンプル間の動的依存関係を明示的にモデル化し、ネットワークが潜在空間におけるクロスサンプルセマンティック一貫性を確立し、グローバルなセマンティックアライメントを実現する。
直列化による事前学習にはバッチレベルの入力組織が必要であるため、微調整中に非対称な意味保存蒸留(SPD)を導入し、セマンティックトランスファーの構造的アライメントを実現し、バッチ依存性による不整合を解消する。
提案したSPDは、不均一な入力機構とセマンティックな特徴アライメント制約を通じて、事前訓練されたセマンティクスの安定した転送を保証する。
これにより、単一シーンのテスト条件下で構造化されたセマンティック一貫性と堅牢性を維持することができる。
複数のベンチマークデータセットに対する大規模な実験により、我々の手法は、パフォーマンスとセマンティック一貫性の両方において、常に最先端の手法より優れていることが示された。
関連論文リスト
- Modular Continual Learning via Zero-Leakage Reconstruction Routing and Autonomous Task Discovery [0.9137554315375919]
ニューラルネットワークのシーケンシャルなタスク学習において、破滅的な忘れは依然として主要なハードルである。
本稿では,タスク特化専門家と分散型外乱型ゲートキーパーを用いた構造パラメータ分離を実現するシリコンネイティブなモジュールアーキテクチャを提案する。
論文 参考訳(メタデータ) (2026-04-15T19:48:40Z) - Latent Thoughts Tuning: Bridging Context and Reasoning with Fused Information in Latent Tokens [13.653741247835091]
Latent Thoughts Tuning(LT-Tuning)は、潜在思想の構築とデプロイ方法を再定義するフレームワークである。
本研究では,コンテキスト隠蔽状態と予測意味指導を協調的に活用するコンテキスト予測融合機構を提案する。
提案手法は,既存の潜在推論ベースラインより優れ,機能崩壊を効果的に軽減し,頑健な推論精度を実現する。
論文 参考訳(メタデータ) (2026-02-10T19:19:10Z) - TRACER: Texture-Robust Affordance Chain-of-Thought for Deformable-Object Refinement [37.77903164878976]
TRACER は Texture-Robust Affordance Chain-of- Thought with dEformable-object Refinement framework である。
セマンティック推論から外見が損なわれ、物理的に一貫した機能領域の洗練まで、階層横断的なマッピングを提供する。
Fine-AGDDO15データセットと実世界のロボットプラットフォームで実施された実験は、TRACERが精度を著しく向上することを示した。
論文 参考訳(メタデータ) (2026-01-28T03:12:18Z) - SemaMIL: Semantic-Aware Multiple Instance Learning with Retrieval-Guided State Space Modeling for Whole Slide Images [17.674866281320046]
SemaMILは,スライド画像全体から識別特徴を抽出する適応的手法である。
セマンティックに類似したパッチを、可逆的な置換によってシーケンスでクラスタ化する。
FLOPやパラメータを少なくして最先端のサブタイプ精度を実現する。
論文 参考訳(メタデータ) (2025-08-30T10:13:18Z) - Interpreting CFD Surrogates through Sparse Autoencoders [6.842974489069953]
本研究では,計算流体力学(CFD)で用いられるグラフベースの代理モデルに対するポストホック解釈可能性フレームワークを導入する。
事前訓練されたサロゲートのノード埋め込み空間における過剰な基底を得ることにより、解釈可能な潜在特徴の辞書を抽出する。
このアプローチは、渦や流れ構造のような物理的現象に整合した単意味概念の同定を可能にする。
論文 参考訳(メタデータ) (2025-07-21T21:09:45Z) - Self-supervised Latent Space Optimization with Nebula Variational Coding [87.20343320266215]
本稿では,クラスタ化埋め込みに繋がる変分推論モデルを提案する。
textbfnebula anchorsと呼ばれる潜伏空間に新たな変数を導入し、トレーニング中に潜伏変数がクラスタを形成するように誘導する。
各潜在機能は最も近いアンカーでラベル付けできるため、クラスタ間の分離をより明確にするために、自己教師付き方法でメートル法学習を適用することも提案する。
論文 参考訳(メタデータ) (2025-06-02T08:13:32Z) - Spatial-Temporal-Spectral Unified Modeling for Remote Sensing Dense Prediction [20.1863553357121]
リモートセンシングのための現在のディープラーニングアーキテクチャは、基本的に堅固である。
本稿では,統合モデリングのための空間時間スペクトル統一ネットワーク(STSUN)について紹介する。
STSUNは任意の空間サイズ、時間長、スペクトル帯域で入力および出力データに適応することができる。
様々な密集した予測タスクと多様な意味クラス予測を統一する。
論文 参考訳(メタデータ) (2025-05-18T07:39:17Z) - PseudoNeg-MAE: Self-Supervised Point Cloud Learning using Conditional Pseudo-Negative Embeddings [55.55445978692678]
PseudoNeg-MAEは、ポイントクラウドマスマスキングオートエンコーダのグローバルな特徴表現を強化する。
本研究では,ネットワークが識別的表現を保ちながら,よりリッチな変換キューをキャプチャできる新たな損失を提案する。
論文 参考訳(メタデータ) (2024-09-24T07:57:21Z) - Towards Continual Learning Desiderata via HSIC-Bottleneck
Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。
提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文 参考訳(メタデータ) (2024-01-17T09:01:29Z) - Diverse Semantic Image Synthesis via Probability Distribution Modeling [103.88931623488088]
新規な多様な意味的画像合成フレームワークを提案する。
本手法は最先端手法と比較して優れた多様性と同等の品質を実現することができる。
論文 参考訳(メタデータ) (2021-03-11T18:59:25Z) - Improve Variational Autoencoder for Text Generationwith Discrete Latent
Bottleneck [52.08901549360262]
変分オートエンコーダ(VAE)は、エンドツーエンドの表現学習において必須のツールである。
VAEは強い自己回帰デコーダで潜伏変数を無視する傾向がある。
よりコンパクトな潜在空間において暗黙的な潜在特徴マッチングを強制する原理的アプローチを提案する。
論文 参考訳(メタデータ) (2020-04-22T14:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。