論文の概要: MS-SCANet: A Multiscale Transformer-Based Architecture with Dual Attention for No-Reference Image Quality Assessment
- arxiv url: http://arxiv.org/abs/2602.04032v1
- Date: Tue, 03 Feb 2026 21:43:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.286063
- Title: MS-SCANet: A Multiscale Transformer-Based Architecture with Dual Attention for No-Reference Image Quality Assessment
- Title(参考訳): MS-SCANet:非参照画像品質評価のためのデュアルアテンション付きマルチスケールトランスフォーマーベースアーキテクチャ
- Authors: Mayesha Maliha R. Mithila, Mylene C. Q. Farias,
- Abstract要約: マルチスケール空間チャネル注意ネットワーク(MS-SCANet)は、非参照画像品質評価(IQA)のために設計されたトランスフォーマーベースのアーキテクチャである。
MS-SCANetは、複数のスケールで画像を処理し、細部と粗部の両方を効果的にキャプチャするデュアルブランチ構造を備えている。
- 参考スコア(独自算出の注目度): 1.7188280334580195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present the Multi-Scale Spatial Channel Attention Network (MS-SCANet), a transformer-based architecture designed for no-reference image quality assessment (IQA). MS-SCANet features a dual-branch structure that processes images at multiple scales, effectively capturing both fine and coarse details, an improvement over traditional single-scale methods. By integrating tailored spatial and channel attention mechanisms, our model emphasizes essential features while minimizing computational complexity. A key component of MS-SCANet is its cross-branch attention mechanism, which enhances the integration of features across different scales, addressing limitations in previous approaches. We also introduce two new consistency loss functions, Cross-Branch Consistency Loss and Adaptive Pooling Consistency Loss, which maintain spatial integrity during feature scaling, outperforming conventional linear and bilinear techniques. Extensive evaluations on datasets like KonIQ-10k, LIVE, LIVE Challenge, and CSIQ show that MS-SCANet consistently surpasses state-of-the-art methods, offering a robust framework with stronger correlations with subjective human scores.
- Abstract(参考訳): 本稿では,非参照画像品質評価(IQA)のためのトランスフォーマーアーキテクチャであるマルチスケール空間チャネル注意ネットワーク(MS-SCANet)を提案する。
MS-SCANetは、複数のスケールで画像を処理し、細部と粗部の両方を効果的にキャプチャするデュアルブランチ構造を備えており、従来の単一スケールメソッドよりも改善されている。
空間的およびチャネル的注意機構を組み込むことで,計算複雑性を最小化しながら重要な特徴を強調した。
MS-SCANetの重要なコンポーネントは、クロスブランチのアテンションメカニズムである。
また、2つの新しい整合損失関数、クロスブランチ整合損失とアダプティブプーリング整合損失を導入する。
KonIQ-10k, LIVE, LIVE Challenge, CSIQといったデータセットに対する大規模な評価は、MS-SCANetが最先端の手法を一貫して上回り、主観的な人間のスコアと強い相関関係を持つ堅牢なフレームワークを提供することを示している。
関連論文リスト
- MS-ISSM: Objective Quality Assessment of Point Clouds Using Multi-scale Implicit Structural Similarity [65.85858856481131]
点雲の非構造的で不規則な性質は、客観的品質評価(PCQA)に重大な課題をもたらす
マルチスケールインシシシット構造類似度測定(MS-ISSM)を提案する。
論文 参考訳(メタデータ) (2026-01-03T14:58:52Z) - Scale-aware Adaptive Supervised Network with Limited Medical Annotations [17.42211316792232]
SASNetは、新しいスケール対応適応リウェイト機構を通じて、低レベルと高レベルの両方の特徴表現を利用するデュアルブランチアーキテクチャである。
このアプローチでは,スケールアウェアのAdaptive Reweight戦略を含む,3つの重要な方法論的イノベーションを導入している。
SASNetは、最先端の半教師付き手法を超越したラベル付きデータで優れた性能を達成する。
論文 参考訳(メタデータ) (2026-01-02T23:55:17Z) - LLHA-Net: A Hierarchical Attention Network for Two-View Correspondence Learning [33.76961965760301]
本稿では階層型アテンションネットワーク(Layer-by-Layer Hierarchical Attention Network)という新しい手法を提案する。
コンピュータビジョンにおける特徴点マッチングの精度を向上させる。
本手法は, ステージ融合, 階層抽出, ネットワークの表現能力向上のためのアテンション機構を含む。
論文 参考訳(メタデータ) (2025-12-31T04:25:53Z) - MVNet: Hyperspectral Remote Sensing Image Classification Based on Hybrid Mamba-Transformer Vision Backbone Architecture [12.168520751389622]
ハイパースペクトル画像(HSI)分類は、高次元データ、限られたトレーニングサンプル、スペクトル冗長性といった課題に直面している。
本稿では,3D-CNNの局所特徴抽出,Transformerのグローバルモデリング,Mambaの線形シーケンスモデリング機能を統合した新しいMVNetネットワークアーキテクチャを提案する。
IN、UP、KSCデータセットでは、MVNetは分類精度と計算効率の両方で主流のハイパースペクトル画像分類法より優れている。
論文 参考訳(メタデータ) (2025-07-06T14:52:26Z) - Hyperspectral Image Classification via Transformer-based Spectral-Spatial Attention Decoupling and Adaptive Gating [12.168520751389622]
ディープニューラルネットワークは、ハイパースペクトル画像分類においていくつかの課題に直面している。
本稿ではSTNetと呼ばれる新しいネットワークアーキテクチャを提案する。
提案手法は、IN, UP, KSCデータセット上での優れた性能を示し、主流のハイパースペクトル画像分類手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-06-10T01:24:35Z) - C2D-ISR: Optimizing Attention-based Image Super-resolution from Continuous to Discrete Scales [6.700548615812325]
我々は、注目に基づく画像超解像モデルの最適化のための新しいフレームワーク、textbfC2D-ISRを提案する。
このアプローチは、2段階のトレーニング手法と階層的なエンコーディング機構に基づいている。
さらに,既存のアテンションベースネットワーク構造を用いて階層符号化機構を一般化する。
論文 参考訳(メタデータ) (2025-03-17T21:52:18Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - Vision Transformer with Convolutions Architecture Search [72.70461709267497]
本稿では,畳み込み型アーキテクチャサーチ(VTCAS)を用いたアーキテクチャ探索手法を提案する。
VTCASによって探索された高性能バックボーンネットワークは、畳み込みニューラルネットワークの望ましい特徴をトランスフォーマーアーキテクチャに導入する。
これは、特に低照度屋内シーンにおいて、物体認識のためのニューラルネットワークの堅牢性を高める。
論文 参考訳(メタデータ) (2022-03-20T02:59:51Z) - HDNet: High-resolution Dual-domain Learning for Spectral Compressive
Imaging [138.04956118993934]
HSI再構成のための高分解能デュアルドメイン学習ネットワーク(HDNet)を提案する。
一方、高効率な特徴融合によるHR空間スペクトルアテンションモジュールは、連続的かつ微細な画素レベルの特徴を提供する。
一方、HSI再構成のために周波数領域学習(FDL)を導入し、周波数領域の差を狭める。
論文 参考訳(メタデータ) (2022-03-04T06:37:45Z) - Sequential Hierarchical Learning with Distribution Transformation for
Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。
特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。
実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文 参考訳(メタデータ) (2020-07-19T01:35:53Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。