論文の概要: BiRQA: Bidirectional Robust Quality Assessment for Images
- arxiv url: http://arxiv.org/abs/2602.20351v1
- Date: Mon, 23 Feb 2026 20:52:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.5282
- Title: BiRQA: Bidirectional Robust Quality Assessment for Images
- Title(参考訳): BiRQA:画像の双方向ロバスト品質評価
- Authors: Aleksandr Gushchin, Dmitriy S. Vatolin, Anastasia Antsiferova,
- Abstract要約: フル参照画像品質評価(FR IQA)は、画像圧縮、復元、生成モデリングにおいて重要である。
本稿では、双方向の多スケールピラミッド内で4つの高速補完特徴を処理するコンパクトFR IQA計量モデルであるBiRQAを提案する。
5つのパブリックFR IQAベンチマークでは、BiRQAは以前のSOTAモデルよりも3倍高速で動作しながら、以前の状態(SOTA)より優れ、あるいは一致している。
- 参考スコア(独自算出の注目度): 49.74447451098852
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Full-Reference image quality assessment (FR IQA) is important for image compression, restoration and generative modeling, yet current neural metrics remain slow and vulnerable to adversarial perturbations. We present BiRQA, a compact FR IQA metric model that processes four fast complementary features within a bidirectional multiscale pyramid. A bottom-up attention module injects fine-scale cues into coarse levels through an uncertainty-aware gate, while a top-down cross-gating block routes semantic context back to high resolution. To enhance robustness, we introduce Anchored Adversarial Training, a theoretically grounded strategy that uses clean "anchor" samples and a ranking loss to bound pointwise prediction error under attacks. On five public FR IQA benchmarks BiRQA outperforms or matches the previous state of the art (SOTA) while running ~3x faster than previous SOTA models. Under unseen white-box attacks it lifts SROCC from 0.30-0.57 to 0.60-0.84 on KADID-10k, demonstrating substantial robustness gains. To our knowledge, BiRQA is the only FR IQA model combining competitive accuracy with real-time throughput and strong adversarial resilience.
- Abstract(参考訳): フル参照画像品質評価(FR IQA)は、画像圧縮、復元、生成モデリングにおいて重要であるが、現在のニューラルネットワークメトリクスは、敵の摂動に対して遅く、弱いままである。
本稿では、双方向の多スケールピラミッド内で4つの高速補完特徴を処理するコンパクトFR IQA計量モデルであるBiRQAを提案する。
ボトムアップアテンションモジュールは不確実性を認識したゲートを介して粗いレベルに微細なキューを注入し、トップダウンのクロスゲートブロックはセマンティックコンテキストを高解像度にルートする。
強靭性を高めるために,クリーンな"アンカー"サンプルとランキングの損失を攻撃時のポイントワイド予測誤差に限定する理論的根拠付き戦略であるAnchored Adversarial Trainingを導入する。
5つのパブリックFR IQAベンチマークでは、BiRQAは以前のSOTA(State-of-the-art)モデルよりも約3倍高速で動作し、性能が向上する。
目に見えないホワイトボックス攻撃の下で、SROCCはKADID-10kで0.30-0.57から0.60-0.84に上昇し、かなりの堅牢性向上を示す。
我々の知る限り、BiRQAは競合精度とリアルタイムスループットと強力な対向レジリエンスを組み合わせた唯一のFR IQAモデルである。
関連論文リスト
- BadCLIP++: Stealthy and Persistent Backdoors in Multimodal Contrastive Learning [73.46118996284888]
マルチモーダル・コントラスト学習モデルに対するバックドア攻撃の研究は、ステルスネスと永続性という2つの大きな課題に直面している。
両課題に対処する統合フレームワークであるBadCLIP++を提案する。
ステルスネスのために,タスク関連領域付近に知覚不可能なパターンを埋め込むセマンティックフュージョンQRマイクロトリガーを導入する。
持続性については、半径縮小とセントロイドアライメントによるトリガ埋め込みを安定化する。
論文 参考訳(メタデータ) (2026-02-19T08:31:16Z) - PreResQ-R1: Towards Fine-Grained Rank-and-Score Reinforcement Learning for Visual Quality Assessment via Preference-Response Disentangled Policy Optimization [12.993619998545633]
PreResQ-R1はPreference-Response Disentangled Reinforcement Learningフレームワークである。
1つの推論駆動最適化スキームにおいて絶対スコア回帰と相対ランク一貫性を統一する。
10 IQA と 5 VQA のベンチマークにおいて、SRCC と PLCC のメトリクスで最先端の結果を得る。
論文 参考訳(メタデータ) (2025-11-07T16:19:50Z) - Cross-Modal Transferable Image-to-Video Attack on Video Quality Metrics [3.7855740990304736]
最新の画像品質評価(IQA/VQA)メトリクスは、敵の攻撃に対して脆弱である。
文献で研究されている攻撃のほとんどはホワイトボックス攻撃であり、VQAの文脈におけるブラックボックス攻撃は、あまり注目されていない。
本稿では,現代のVQAモデルの脆弱性の探索を目的としたクロスモーダル攻撃手法IC2VQAを提案する。
論文 参考訳(メタデータ) (2025-01-14T20:12:09Z) - Backdoor Attacks against No-Reference Image Quality Assessment Models via a Scalable Trigger [76.36315347198195]
No-Reference Image Quality Assessment (NR-IQA) はコンピュータビジョンシステムの評価と最適化において重要な役割を果たしている。
近年の研究では、NR-IQAモデルが敵攻撃の影響を受けやすいことが示されている。
NR-IQA(BAIQA)に対する新規中毒性バックドアアタックを報告した。
論文 参考訳(メタデータ) (2024-12-10T08:07:19Z) - Stochastic BIQA: Median Randomized Smoothing for Certified Blind Image Quality Assessment [4.892675958180895]
最新のNo-Reference Image-Quality Assessment(NR-IQA)メトリクスは、敵の攻撃に弱いニューラルネットワークに基づいている。
この研究は、証明可能な堅牢な非参照IQA計量の開発に焦点を当てている。
論文 参考訳(メタデータ) (2024-11-19T15:42:48Z) - Defense Against Adversarial Attacks on No-Reference Image Quality Models with Gradient Norm Regularization [18.95463890154886]
No-Reference Image Quality Assessment (NR-IQA)モデルは、メディア業界において重要な役割を果たす。
これらのモデルは、入力画像に知覚不能な摂動をもたらす敵攻撃に弱いことが判明した。
そこで本研究では,小さな摂動に攻撃された場合の予測スコアの安定性を向上させるための防衛手法を提案する。
論文 参考訳(メタデータ) (2024-03-18T01:11:53Z) - You Only Train Once: A Unified Framework for Both Full-Reference and No-Reference Image Quality Assessment [45.62136459502005]
本稿では,完全な参照 (FR) と非参照 (NR) IQA を行うネットワークを提案する。
まず、入力画像から多レベル特徴を抽出するためにエンコーダを用いる。
FRおよびNR入力のユニバーサルアダプタとして階層的注意(HA)モジュールを提案する。
エンコーダの浅い層と深い層との間の特徴相関を調べるために, セマンティック・ディストーション・アウェア (SDA) モジュールを提案する。
論文 参考訳(メタデータ) (2023-10-14T11:03:04Z) - Adaptive Feature Alignment for Adversarial Training [56.17654691470554]
CNNは通常、敵攻撃に対して脆弱であり、セキュリティに敏感なアプリケーションに脅威をもたらす。
任意の攻撃強度の特徴を生成するための適応的特徴アライメント(AFA)を提案する。
本手法は任意の攻撃強度の特徴を自動的に整列するように訓練されている。
論文 参考訳(メタデータ) (2021-05-31T17:01:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。