論文の概要: High-Dimensional Latents Should Be Diagnosed Through Phase Structure
- arxiv url: http://arxiv.org/abs/2606.02600v1
- Date: Sat, 23 May 2026 06:17:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-07 20:42:22.578695
- Title: High-Dimensional Latents Should Be Diagnosed Through Phase Structure
- Title(参考訳): 高次元潜水剤は相構造を通して診断されるべきである
- Authors: Alejandro Ascarate, Leo Lebrat, Rodrigo Santa Cruz, Clinton Fookes, Olivier Salvado,
- Abstract要約: スピングラス理論のレンズによるオートエンコーダと変分オートエンコーダの潜在空間について検討した。
固定復号器用の潜時空間スピングラス辞書を定式化する。
トポロジカルな自明化機構のエッジ・オブ・ステイティに向けて潜伏系を駆動することは、下流に具体的な結果をもたらすことを示す。
- 参考スコア(独自算出の注目度): 56.362776482614976
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study autoencoder and variational-autoencoder latent spaces through the lens of spin-glass theory. The paper has two components. First, we formalize a latent-space spin-glass dictionary: for a fixed decoder, the reconstruction term together with a hyperspherical coordinates prior induces a Hamiltonian on the latent sphere, where latent coordinates play the role of continuous spins and the prior acts as an external magnetic field. This allows us to import operational spin-glass diagnostics -- overlap distributions, susceptibility, and block-spin coarse-graining -- to detect ordered, disordered, and edge-of-stability phases in trained latent representations. Second, we show that deliberately driving the latent system toward the edge-of-stability of the topological trivialization regime has concrete downstream consequences. In generation, hyperspherical compression improves the reconstruction-generation trade-off on CIFAR-10 and CelebA64, yielding lower self-FID while preserving or improving reconstruction. In anomaly detection, the same semi-ordered latent geometry improves both fully unsupervised and conditional OOD detection, including real-world Mars Rover and Galaxy Zoo datasets, as well as CIFAR-10/100 and Imagenette-based OOD benchmarks. We therefore advocate a phase-aware evaluation paradigm for AEs/VAEs, in which spin-glass observables complement standard ML metrics and expose the latent regimes that underlie downstream success or failure in many cases.
- Abstract(参考訳): スピングラス理論のレンズによるオートエンコーダと変分オートエンコーダの潜在空間について検討した。
紙には2つの要素があります。
まず、固定デコーダの場合、再構成項と超球面座標は、ラテント球上でハミルトン座標を誘導し、ラテント座標が連続スピンの役割を担い、前者は外部磁場として機能する。
これにより、トレーニングされた潜在表現におけるスピングラス診断 -- 重複分布、感受性、ブロックスピン粗粒化 -- をインポートし、順序、乱れ、エッジ・オブ・安定性のフェーズを検出することができる。
第二に、トポロジカルな自明化機構のエッジ・オブ・ステイティに向けた潜伏系を意図的に駆動することは、下流への具体的な結果をもたらすことを示す。
CIFAR-10とCelebA64の再生・再生のトレードオフは、超球面圧縮により改善され、復元の保存や改善をしながら、より低い自己FIDが得られる。
異常検出において、同じ半順序の潜在幾何学は、実世界のMars RoverとGalaxy Zooデータセット、CIFAR-10/100とImagenetteベースのOODベンチマークを含む、完全に教師なしおよび条件付きOOD検出の両方を改善する。
そこで我々は,AE/VAEの位相認識評価パラダイムを提唱し,スピングラスオブザーバが標準のMLメトリクスを補完し,下流の成功や失敗をもたらす潜伏状態を明らかにする。
関連論文リスト
- Beyond Reconstruction: Reconstruction-to-Vector Diffusion for Hyperspectral Anomaly Detection [9.078979356836193]
ハイパースペクトル異常検出(HAD)は、複雑なシーンにおけるスパースターゲットの同定に優れる。
既存のモデルは、スカラー・アズ・ア・エンドポイント(reconstruction-as-endpoint)パラダイムに閉じ込められているままである。
本稿では, 精製源として再構成を再定義するリコンストラクション・トゥ・ディフュージョン(R2VD)を提案する。
R2VDは新たな最先端技術を確立し、例外的な目標検出のバックグラウンドを提供する。
論文 参考訳(メタデータ) (2026-04-13T12:31:50Z) - DOC-GS: Dual-Domain Observation and Calibration for Reliable Sparse-View Gaussian Splatting [80.43237927269575]
本稿では,新しい視点からスパースビュー3DGSの再構築について再考する。
我々は、ガウスの原始的信頼性の観測不能性として、コアチャレンジを識別する。
この観測を動機として、レンダリング画像フレームワークにおける統合されたデュアルドメイン観測と幾何学的手法を提案する。
論文 参考訳(メタデータ) (2026-04-08T07:01:24Z) - SGR-OCC: Evolving Monocular Priors for Embodied 3D Occupancy Prediction via Soft-Gating Lifting and Semantic-Adaptive Geometric Refinement [9.891265334631889]
3Dセマンティック占有予測は、具現化されたAIの基盤である。
我々は,SGR-OCC(Soft-Gating and Ray-Refinement Occupancy)を提案する。
局所予測タスクでは、SGR-OCCは58.55$%の完了IoUと49.89$%のセマンティックmIoUを達成し、それぞれ3.65$%と3.69$%の前のベストメソッドであるEmbodiedOcc++を上回っている。
論文 参考訳(メタデータ) (2026-03-14T18:45:03Z) - Preoperative-to-intraoperative Liver Registration for Laparoscopic Surgery via Latent-Grounded Correspondence Constraints [51.7011449975586]
Land-Regは変形可能な登録フレームワークで、潜伏した2D-3Dのランドマーク対応を学習する。
厳格な登録のために、Land-Regはクロスモーダルラテントアライメントモジュールを採用している。
類似性マッチングを持つ不確実なオーバーラップランドマーク検出器を提案し, 明確な2D-3Dランドマーク対応を強く推定する。
論文 参考訳(メタデータ) (2026-03-02T10:44:03Z) - When Backdoors Go Beyond Triggers: Semantic Drift in Diffusion Models Under Encoder Attacks [2.4923006485141284]
エンコーダ側の中毒は持続的かつトリガーフリーなセマンティックな腐敗を引き起こすことを実証する。
バックドアは低ランクで目標中心の変形として機能し、局所的な感度を増幅し、乱れがセマンティックな近傍を連続的に伝播する。
本研究は, 拡散および対照的なパラダイムにまたがって検証され, エンコーダ中毒の深い構造的リスクを明らかにし, 単純な攻撃成功率を超える幾何的監査の必要性を強調した。
論文 参考訳(メタデータ) (2026-02-21T23:48:04Z) - Robot-DIFT: Distilling Diffusion Features for Geometrically Consistent Visuomotor Control [31.523644271297616]
一般化可能なロボット操作における重要なボトルネックは、現在の視覚的バックボーンと閉ループ制御の物理的要求との間の構造的ミスマッチである。
我々は,マニフォールド蒸留による推論プロセスから幾何学的情報ソースを分離するフレームワークであるRobot-DIFTを提案する。
凍結拡散教師を決定論的空間意味的特徴ピラミッドネットワーク(S2-FPN)に蒸留することにより、時間的安定性、リアルタイム実行、ドリフトに対する堅牢性を確保しつつ、生成モデルの豊富な幾何学的先行性を維持できる。
論文 参考訳(メタデータ) (2026-02-12T13:30:24Z) - DNA: Uncovering Universal Latent Forgery Knowledge [39.19379714306656]
フォージェリ検出機能は、すでにトレーニング済みのモデル内にエンコードされている。
DNAフレームワークは粗大な発掘機構を採用している。
Hifi-Genは、最新のモデルの上に構築された高忠実度合成ベンチマークである。
論文 参考訳(メタデータ) (2026-01-30T03:48:30Z) - VAE with Hyperspherical Coordinates: Improving Anomaly Detection from Hypervolume-Compressed Latent Space [56.362776482614976]
変分オートエンコーダ(VAE)は、これらのベクトルをデータに復号する前に、データを低次元の潜在ベクトルに符号化する。
本稿では,超球面座標を用いてVAEの潜伏変数を定式化し,超球面上の所定の方向に向かって潜伏ベクトルを圧縮する手法を提案する。
これにより、VAEの完全な教師なしおよびOOD異常検出能力が向上し、検討したデータセット上で最高のパフォーマンスを達成できることが示される。
論文 参考訳(メタデータ) (2026-01-25T03:10:24Z) - Noise & pattern: identity-anchored Tikhonov regularization for robust structural anomaly detection [58.535473924035365]
異常検出は自動産業検査において重要な役割を担い、他の均一な視覚パターンの微妙な欠陥や稀な欠陥を識別することを目的としている。
自己教師型オートエンコーダを用いて, 破損した入力の修復を学習する構造的異常検出に取り組む。
構造欠陥を模倣した画像に人工的破壊を注入する汚職モデルを導入する。
論文 参考訳(メタデータ) (2025-11-10T15:48:50Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。