論文の概要: Fence Theorem: Towards Dual-Objective Semantic-Structure Isolation in Preprocessing Phase for 3D Anomaly Detection
- arxiv url: http://arxiv.org/abs/2503.01100v2
- Date: Tue, 04 Mar 2025 04:33:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 18:50:37.776586
- Title: Fence Theorem: Towards Dual-Objective Semantic-Structure Isolation in Preprocessing Phase for 3D Anomaly Detection
- Title(参考訳): Fence Theorem:Dual-Objective Semantic-Structure isolated in Preprocessing Phase for 3D Anomaly Detection
- Authors: Hanzhe Liang, Jie Zhou, Xuanxin Chen, Tao Dai, Jinbao Wang, Can Gao,
- Abstract要約: Fence Theoremは、前処理を二重目的意味的アイソレータとして定式化する。
Patch3Dは、Patch-CuttingとPatch-Matchingモジュールで構成され、セマンティック空間を分割し、類似のモジュールを統合する。
Anomaly-ShapeNetとReal3D-ADを異なる設定で実験した結果、前処理におけるよりきめ細かなセマンティックアライメントにより、ポイントレベルのAD精度が向上することが示された。
- 参考スコア(独自算出の注目度): 32.44179060918441
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D anomaly detection (AD) is prominent but difficult due to lacking a unified theoretical foundation for preprocessing design. We establish the Fence Theorem, formalizing preprocessing as a dual-objective semantic isolator: (1) mitigating cross-semantic interference to the greatest extent feasible and (2) confining anomaly judgments to aligned semantic spaces wherever viable, thereby establishing intra-semantic comparability. Any preprocessing approach achieves this goal through a two-stage process of Emantic-Division and Spatial-Constraints stage. Through systematic deconstruction, we theoretically and experimentally subsume existing preprocessing methods under this theorem via tripartite evidence: qualitative analyses, quantitative studies, and mathematical proofs. Guided by the Fence Theorem, we implement Patch3D, consisting of Patch-Cutting and Patch-Matching modules, to segment semantic spaces and consolidate similar ones while independently modeling normal features within each space. Experiments on Anomaly-ShapeNet and Real3D-AD with different settings demonstrate that progressively finer-grained semantic alignment in preprocessing directly enhances point-level AD accuracy, providing inverse validation of the theorem's causal logic.
- Abstract(参考訳): 3次元異常検出(AD)は、前処理設計のための統一的な理論基盤が欠如しているため、顕著であるが困難である。
我々は、Fence理論を確立し、前処理を二重目的意味論的アイソレータとして定式化し、(1) 最大範囲への横断的干渉を緩和し、(2) 実行可能なセマンティック空間に異常判断を収束させることにより、意味的コンパラビリティを確立する。
任意の前処理アプローチは、Emantic-DivisionとSpatial-Constraintsの2段階のプロセスを通じてこの目標を達成する。
体系的なデコンストラクションを通じて、理論的、実験的にこの定理の下で既存の前処理法を三部作の証拠(定性的分析、定量的研究、数学的証明)によってサブスメイトする。
Fence Theoremによって導かれたPatch3Dは、Patch-CuttingモジュールとPatch-Matchingモジュールで構成され、セマンティック空間をセグメンテーションし、類似のものを統合し、各空間内の通常の特徴を独立にモデル化する。
Anomaly-ShapeNetとReal3D-ADの異なる設定による実験では、前処理におけるよりきめ細かなセマンティックアライメントがポイントレベルのAD精度を直接的に向上させ、定理の因果論理の逆検証を提供することを示した。
関連論文リスト
- WavePhaseNet: A DFT-Based Method for Constructing Semantic Conceptual Hierarchy Structures (SCHS) [0.0]
本稿では,大規模言語モデルにおけるトランスフォーマー/アテンション機構を再構成する。
GPT-4の24,576次元埋め込み空間は、言語自己相似性とZipfの法則に基づく1/fスペクトル構造を示す。
コホモロジー整合性制御(Cohomological Consistency Control) 局所窓の重なり合うコホモロジー正則化によって構築される最小の埋め込み空間は、グラフ構造とコチェーン複体を定義することができる。
論文 参考訳(メタデータ) (2026-02-16T03:07:41Z) - ELROND: Exploring and decomposing intrinsic capabilities of diffusion models [3.656403721249365]
拡散モデルに渡される単一のテキストプロンプトは、プロセスによってのみ決定される幅広い視覚出力をもたらす。
本稿では,これらの意味的方向を入力埋め込み内で直接アンタングルするフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-10T19:07:15Z) - Dynamics Within Latent Chain-of-Thought: An Empirical Study of Causal Structure [58.89643769707751]
表現空間における潜在連鎖を操作可能な因果過程として研究する。
遅延ステップの予算は、均質な余分な深さよりも、非局所的なルーティングを備えたステージ機能のように振る舞う。
これらの結果は、モード条件と安定性を意識した分析を、潜伏推論システムの解釈と改善のための信頼性の高いツールとして動機付けている。
論文 参考訳(メタデータ) (2026-02-09T15:25:12Z) - Universal Latent Homeomorphic Manifolds: Cross-Domain Representation Learning via Homeomorphism Verification [4.509161738293017]
本稿では,意味表現と観察駆動型機械表現を一つの潜在構造に統一するフレームワークを提案する。
我々は、異なる意味-観測ペアによって誘導される潜在多様体が厳密に統一できるかどうかを決定するための基準として、エンホメオモルフィズムを用いる。
この基準は,(1)不完全観測からのセマンティック誘導スパース回復,(2)検証された構造整合性を持つクロスドメイン変換学習,(3)意味論的から観察空間への有効な移動によるゼロショット合成学習の3つの重要な応用に対する理論的保証を提供する。
論文 参考訳(メタデータ) (2026-01-13T23:08:16Z) - Foundations of Diffusion Models in General State Spaces: A Self-Contained Introduction [54.95522167029998]
この記事は、一般状態空間上の拡散に関する自己完結プライマーである。
我々は、その連続時間限界とともに離散時間ビュー(マルコフカーネルを経由し、逆ダイナミクスを学習する)を開発する。
一般的な変量処理は、標準の訓練損失を支えるELBOをもたらす。
論文 参考訳(メタデータ) (2025-12-04T18:55:36Z) - Geometrically-Constrained Agent for Spatial Reasoning [53.93718394870856]
視覚言語モデルは空間的推論において基本的な意味-幾何学的ギャップを示す。
現在のパラダイムは、このギャップを埋めることに失敗します。
本稿では,形式的タスク制約を導入することにより,このギャップを解消する学習自由エージェントパラダイムを提案する。
論文 参考訳(メタデータ) (2025-11-27T17:50:37Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - From Entanglement to Alignment: Representation Space Decomposition for Unsupervised Time Series Domain Adaptation [18.100665738436398]
DARSDは,表現空間の分解の観点から,UDAタスクを明示的に実現する理論的説明可能性を備えた,新しいUDAフレームワークである。
DarSDは3つの相乗的要素から構成される: (I) 意味的コンテンツを保存しながら、元の特徴をドメイン不変のサブ空間に投影する逆学習可能な共通不変基底; (II) 信頼、エラーの蓄積を妨げ、ターゲット特徴を動的に分離する擬似ラベル機構; (III) 機能クラスタリングと一貫性を同時に実施しながら、新興ディストリビューションギャップを緩和するハイブリッドコントラスト最適化戦略。
論文 参考訳(メタデータ) (2025-07-28T16:26:28Z) - Transfinite Fixed Points in Alpay Algebra as Ordinal Game Equilibria in Dependent Type Theory [0.0]
本稿では, 自己参照プロセスの安定な結果が, システムと環境との非有界リビジョン対話のユニークな平衡と同一であることを示すことによって, アルペイ・アルゲブラに寄与する。
固定点論、ゲームセマンティクス、順序解析、型理論から概念を統一することにより、この研究は無限の自己参照システムについての推論において、広くアクセス可能で形式的に厳密な基礎を確立する。
論文 参考訳(メタデータ) (2025-07-25T13:12:55Z) - Escaping Plato's Cave: JAM for Aligning Independently Trained Vision and Language Models [29.59537209390697]
単一モードモデルの潜在表現に対して、モダリティ固有のオートエンコーダを訓練するフレームワークを導入する。
類推により、このフレームワークはプラトンの洞窟から逃れる方法として機能し、結合しない入力から共有構造の出現を可能にする。
論文 参考訳(メタデータ) (2025-07-01T21:43:50Z) - The Unified Cognitive Consciousness Theory for Language Models: Anchoring Semantics, Thresholds of Activation, and Emergent Reasoning [2.0800882594868293]
統一認知意識理論(UCCT)は、これらを巨大な無意識パターンリポジトリとみなしている。
UCCTはこの過程を、事前学習で学んだ統計的事前学習と文脈駆動のターゲットパターンの間のベイズ的競争として定式化している。
我々はこの理論を、しきい値交差、モダリティ、密度距離予測力の3つの原理で基礎づける。
論文 参考訳(メタデータ) (2025-06-02T18:12:43Z) - Cross-Modal and Uncertainty-Aware Agglomeration for Open-Vocabulary 3D Scene Understanding [58.38294408121273]
CUA-O3Dと呼ばれるオープン語彙3次元シーン理解のためのクロスモーダル・不確実性認識アグリゲーションを提案する。
提案手法は,(1)空間認識型視覚基盤モデルの幾何学的知識とともに,VLMのセマンティックな先入観を取り入れること,(2)モデル固有の不確かさを捉えるために,新しい決定論的不確実性推定を用いること,の2つの課題に対処する。
論文 参考訳(メタデータ) (2025-03-20T20:58:48Z) - ARC-Flow : Articulated, Resolution-Agnostic, Correspondence-Free Matching and Interpolation of 3D Shapes Under Flow Fields [4.706075725469252]
本研究は、2つの3次元調音形状間の物理的可視性の教師なし予測のための統一的な枠組みを示す。
ニューラル正規微分方程式(ODE)が支配する滑らかな時間変化流れ場を用いた微分同相変換として補間をモデル化する
対応性は, パラメータ化の異なる高忠実度曲面に有効である, 効率的なバリアフォールド定式化を用いて回復する。
論文 参考訳(メタデータ) (2025-03-04T13:28:05Z) - 3D Human Pose Analysis via Diffusion Synthesis [65.268245109828]
PADSは、逆問題フレームワーク内での一般的な3次元ポーズ解析に取り組むための、初めての拡散ベースのフレームワークである。
その性能は異なるベンチマークで検証され、パイプラインの適応性と堅牢性を示している。
論文 参考訳(メタデータ) (2024-01-17T02:59:34Z) - Exploiting Diffusion Prior for Generalizable Dense Prediction [85.4563592053464]
近年のテキスト・トゥ・イメージ(T2I)拡散モデルでは、既成の高密度予測器では予測できないことがある。
我々は,事前学習したT2Iモデルを用いたパイプラインDMPを,高密度予測タスクの先駆けとして導入する。
限られたドメインのトレーニングデータにもかかわらず、この手法は任意の画像に対して忠実に推定し、既存の最先端のアルゴリズムを超越する。
論文 参考訳(メタデータ) (2023-11-30T18:59:44Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - Understanding and Constructing Latent Modality Structures in Multi-modal
Representation Learning [53.68371566336254]
優れたパフォーマンスの鍵は、完全なモダリティアライメントではなく、有意義な潜在モダリティ構造にある、と我々は主張する。
具体的には,1)モダリティ内正規化のための深い特徴分離損失,2)モダリティ間正規化のためのブラウン橋損失,3)モダリティ内正規化およびモダリティ間正規化のための幾何学的整合損失を設計する。
論文 参考訳(メタデータ) (2023-03-10T14:38:49Z) - Let us Build Bridges: Understanding and Extending Diffusion Generative
Models [19.517597928769042]
拡散に基づく生成モデルは、最近、有望な結果を得たが、多くのオープンな疑問を提起している。
この研究は、理論的な理解を深めるために、全体的なフレームワークを再検討しようと試みている。
1)拡散生成モデルを学習するための最初の理論的誤り解析,2)異なる離散および制約された領域からのデータを学ぶための単純で統一的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-08-31T08:58:10Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Shape Consistent 2D Keypoint Estimation under Domain Shift [35.15266729401601]
ドメインシフトの下でキーポイントを推定するための新しい深層適応フレームワークを提案する。
本手法は,機能アライメント,対人訓練,自己超越という3つの構成要素をシームレスに結合する。
提案手法は,2次元キーポイント予測タスクにおける最先端領域適応手法より優れている。
論文 参考訳(メタデータ) (2020-08-04T14:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。