論文の概要: MSDS: Deep Structural Similarity with Multiscale Representation
- arxiv url: http://arxiv.org/abs/2604.19159v1
- Date: Tue, 21 Apr 2026 07:13:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.665086
- Title: MSDS: Deep Structural Similarity with Multiscale Representation
- Title(参考訳): MSDS: マルチスケール表現との深い構造的類似性
- Authors: Danling Kang, Xue-Hua Chen, Bin Liu, Keke Zhang, Weiling Chen, Tiesong Zhao,
- Abstract要約: 深部相似性モデリングにおける空間スケールの役割は未だ十分に理解されていない。
マルチスケール表現を用いたDeep Structure similarity (MSDS) と呼ばれる,DeepSSIMの最小限のマルチスケール拡張を提案する。
提案フレームワークは,ピラミッドレベルで独立にDeepSSIMを計算し,学習可能なグローバル重みの軽量なセットで結果のスコアを融合することにより,クロススケールな統合から深い特徴表現を分離する。
- 参考スコア(独自算出の注目度): 27.66525025769263
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep-feature-based perceptual similarity models have demonstrated strong alignment with human visual perception in Image Quality Assessment (IQA). However, most existing approaches operate at a single spatial scale, implicitly assuming that structural similarity at a fixed resolution is sufficient. The role of spatial scale in deep-feature similarity modeling thus remains insufficiently understood. In this letter, we isolate spatial scale as an independent factor using a minimal multiscale extension of DeepSSIM, referred to as Deep Structural Similarity with Multiscale Representation (MSDS). The proposed framework decouples deep feature representation from cross-scale integration by computing DeepSSIM independently across pyramid levels and fusing the resulting scores with a lightweight set of learnable global weights. Experiments on multiple benchmark datasets demonstrate consistent and statistically significant improvements over the single-scale baseline, while introducing negligible additional complexity. The results empirically confirm spatial scale as a non-negligible factor in deep perceptual similarity, isolated here via a minimal testbed.
- Abstract(参考訳): 画像品質評価(IQA)では、深部機能に基づく知覚的類似性モデルが人間の視覚的知覚と強く一致していることが示されている。
しかし、既存のほとんどのアプローチは単一の空間スケールで動作し、固定解像度における構造的類似性は十分であると暗黙的に仮定する。
深部相似性モデリングにおける空間スケールの役割は未だ十分に理解されていない。
本稿では,空間スケールを,マルチスケール表現を用いたDeep Structure similarity with Multiscale Representation (MSDS)と呼ばれる,最小限のマルチスケール拡張を用いて,独立要因として分離する。
提案フレームワークは,ピラミッドレベルで独立にDeepSSIMを計算し,学習可能なグローバル重みの軽量なセットで結果のスコアを融合することにより,クロススケールな統合から深い特徴表現を分離する。
複数のベンチマークデータセットの実験は、無視可能な追加の複雑さを導入しながら、単一スケールのベースラインに対する一貫性と統計的に重要な改善を示している。
その結果, 空間スケールが知覚的類似性の非無視因子であることを実証的に確認した。
関連論文リスト
- Hyperbolic Enhanced Representation Learning for Incomplete Multi-view Clustering [57.38215918201251]
本稿では,不完全なマルチビュークラスタリングのためのハイパーボリック拡張表現学習フレームワークであるHERLを提案する。
ポアンカレボール内で操作すると、HERLは表現学習を強化するために構造を意識した潜在空間を構築する。
HERLは最先端のアプローチよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2026-04-18T10:50:46Z) - Frequency-Enhanced Dual-Subspace Networks for Few-Shot Fine-Grained Image Classification [6.738210148449625]
微粒化の少ない画像分類は,注釈付きサンプルの限られた数だけを用いて,視覚的類似度の高いサブカテゴリを認識することを目的としている。
既存のメトリック学習ベースの手法は、通常、空間的領域の特徴のみに依存する。
本稿では、周波数拡張デュアルサブスペースネットワーク(FEDSNet)を提案する。
論文 参考訳(メタデータ) (2026-04-16T12:54:29Z) - Mixture-of-Experts as Soft Clustering: A Dual Jacobian-PCA Spectral Geometry Perspective [0.5414847001704249]
Mixture-of-Experts (MoE)アーキテクチャは、一般的に効率性と条件計算によって動機付けられている。
幾何レンズを用いてMoEを解析し、表現空間のソフトパーティショニングの形でルーティングを解釈し、重なり合う局所チャートに変換する。
論文 参考訳(メタデータ) (2026-01-09T23:07:14Z) - MS-ISSM: Objective Quality Assessment of Point Clouds Using Multi-scale Implicit Structural Similarity [65.85858856481131]
点雲の非構造的で不規則な性質は、客観的品質評価(PCQA)に重大な課題をもたらす
マルチスケールインシシシット構造類似度測定(MS-ISSM)を提案する。
論文 参考訳(メタデータ) (2026-01-03T14:58:52Z) - Scale-Invariance Drives Convergence in AI and Brain Representations [7.318297580732467]
近年の研究では、大規模なAIモデルは、神経活動と一致する同様の内部表現に収束することがしばしば示されている。
AI表現におけるスケール不変性の2つの中核的側面:次元安定性とスケール間の構造的類似性。
解析の結果,fMRIデータと一致し,より一貫した次元と構造的類似性が得られた。
論文 参考訳(メタデータ) (2025-06-13T15:36:04Z) - Learning Multiscale Consistency for Self-supervised Electron Microscopy
Instance Segmentation [48.267001230607306]
本稿では,EMボリュームのマルチスケール一貫性を高める事前学習フレームワークを提案する。
当社のアプローチでは,強力なデータ拡張と弱いデータ拡張を統合することで,Siameseネットワークアーキテクチャを活用している。
効果的にボクセルと機能の一貫性をキャプチャし、EM分析のための転送可能な表現を学習する。
論文 参考訳(メタデータ) (2023-08-19T05:49:13Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - Joint Characterization of Multiscale Information in High Dimensional
Data [0.0]
グローバルアプローチとローカルアプローチの相乗効果を生かした多スケール共同評価手法を提案します。
関節の特徴は, PCA や t-sne のいずれからも明らかでない信号の検出と分離が可能であることを示す。
論文 参考訳(メタデータ) (2021-02-18T23:33:00Z) - Sequential Hierarchical Learning with Distribution Transformation for
Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。
特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。
実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文 参考訳(メタデータ) (2020-07-19T01:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。