論文の概要: Beyond Fidelity: Semantic Similarity Assessment in Low-Level Image Processing
- arxiv url: http://arxiv.org/abs/2604.25408v1
- Date: Tue, 28 Apr 2026 09:21:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.792171
- Title: Beyond Fidelity: Semantic Similarity Assessment in Low-Level Image Processing
- Title(参考訳): 低レベル画像処理における意味的類似性評価
- Authors: Runjie Wang, Weiling Chen, Tiesong Zhao, Chang Wen Chen,
- Abstract要約: 低レベル画像処理のための新しい評価タスクとしてtextitSemantic similarity を定式化する。
本稿では,意味的実体とその関係に基づく画像意味論の構造的定式化について述べる。
本稿では,前景のエンティティ,背景のエンティティ,関係性を通じて画像意味をモデル化するTripletベースのセマンティック類似スコア(T3S)を提案する。
- 参考スコア(独自算出の注目度): 53.27421114481586
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Low-level image processing has long been evaluated mainly from the perspective of visual fidelity. However, with the rise of deep learning and generative models, processed images may preserve perceptual quality while altering semantic content, making conventional Image Quality Assessment (IQA) insufficient for semantic-level assessment. In this paper, we formalize \textit{Semantic Similarity} as a new evaluation task for low-level image processing, aimed at measuring whether semantic content is preserved after processing. We further present a structured formulation of image semantics based on semantic entities and their relations, and discuss the desired properties and constraints of a valid semantic similarity index. Based on this formulation, we propose Triplet-based Semantic Similarity Score (T3S), which models image semantics through foreground entities, background entities, and relations. T3S combines semantic entity extraction, foreground-background disentanglement, and open-world class/relation modeling. Experiments on COCO and SPA-Data show that T3S consistently outperforms existing fidelity-oriented metrics and representative semantic-level baselines, while better reflecting progressive semantic changes under diverse degradations. These results highlight the importance of semantic assessment in modern low-level vision.
- Abstract(参考訳): 低レベルの画像処理は、主に視覚的忠実性の観点から長い間評価されてきた。
しかし、深層学習や生成モデルの普及に伴い、処理された画像はセマンティックコンテンツを変えながら知覚品質を維持することができ、従来の画像品質評価(IQA)はセマンティックレベルの評価には不十分である。
本稿では,低レベル画像処理のための新しい評価課題として,処理後に意味的内容が保存されているかどうかを判断する目的で,<textit{Semantic similarity} を定式化した。
さらに、セマンティックエンティティとその関係に基づく画像意味論の構造的定式化を行い、有効なセマンティック類似度指数の所望の性質と制約について議論する。
この定式化に基づいて,前景のエンティティ,背景のエンティティ,関係性を通じて画像意味をモデル化する,トリプルトに基づくセマンティック類似スコア(T3S)を提案する。
T3Sはセマンティック・エンティティ抽出、フォアグラウンド・バックグラウンド・ディアングルメント、およびオープンワールド・クラス/リレーショナル・モデリングを組み合わせる。
COCOとSPA-Dataの実験は、T3Sが既存の忠実度指向の指標と意味レベルを常に上回り、多様な劣化下での進歩的な意味変化を反映していることを示している。
これらの結果は、現代低レベル視覚における意味的アセスメントの重要性を強調している。
関連論文リスト
- BPCLIP: A Bottom-up Image Quality Assessment from Distortion to Semantics Based on CLIP [18.25854559825818]
比較言語-画像事前学習(CLIP)に基づくボトムアップ画像品質評価手法を提案する。
具体的には,エンコーダを用いて入力画像からマルチスケール特徴を抽出し,ボトムアップ型マルチスケールクロスアテンションモジュールを導入する。
6つの異なる次元に40の画像品質形容詞を組み込むことで、事前学習したCLIPテキストエンコーダが画像固有の品質の表現を生成することができる。
論文 参考訳(メタデータ) (2025-06-22T09:56:57Z) - Introspective Deep Metric Learning [91.47907685364036]
本稿では,不確実性を考慮した画像比較のためのイントロスペクティブな深度学習フレームワークを提案する。
提案するIDMLフレームワークは,不確実性モデリングによるディープメトリック学習の性能を向上させる。
論文 参考訳(メタデータ) (2023-09-11T16:21:13Z) - Edge Guided GANs with Multi-Scale Contrastive Learning for Semantic
Image Synthesis [139.2216271759332]
本稿では,難解なセマンティック画像合成タスクのための新しいECGANを提案する。
セマンティックラベルは詳細な構造情報を提供しておらず、局所的な詳細や構造を合成することは困難である。
畳み込み、ダウンサンプリング、正規化といった広く採用されているCNN操作は、通常、空間分解能の損失を引き起こす。
本稿では,同じセマンティッククラスに属する画素埋め込みを強制して,より類似した画像コンテンツを生成することを目的とした,新しいコントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2023-07-22T14:17:19Z) - Regression-free Blind Image Quality Assessment with Content-Distortion
Consistency [42.683300312253884]
画像品質評価のための回帰フリーフレームワークを提案する。
これは、セマンティックな特徴空間と歪みのある特徴空間を組み込むことで、局所的に類似したインスタンスを検索することに基づいている。
提案手法は, 最先端の回帰に基づく手法と比較して, 競争力や性能に優れる。
論文 参考訳(メタデータ) (2023-07-18T14:19:28Z) - Towards Semantic Communications: Deep Learning-Based Image Semantic
Coding [42.453963827153856]
我々は,よりセマンティクスや帯域幅に敏感な画像データに対するセマンティクス通信を考案した。
画素レベルを超えて画像を符号化する強化学習に基づく適応意味符号化(RL-ASC)手法を提案する。
実験の結果,提案したRL-ASCはノイズ耐性があり,視覚的に快適でセマンティックな一貫した画像の再構成が可能であった。
論文 参考訳(メタデータ) (2022-08-08T12:29:55Z) - Semantic Image Synthesis via Diffusion Models [174.24523061460704]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に事実上のGANベースのアプローチに従っている。
意味画像合成のためのDDPMに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Introspective Deep Metric Learning for Image Retrieval [80.29866561553483]
良好な類似性モデルは、より堅牢なトレーニングのために曖昧なイメージをよりよく扱うように注意しながら、意味的な相違を考慮すべきである、と我々は主張する。
本稿では,画像の意味的特徴とあいまいさを記述した,意味的埋め込みだけでなく,付随する不確実性埋め込みを用いて画像を表現することを提案する。
提案したIDMLフレームワークは,不確実性モデリングによるディープメトリック学習の性能向上を実現し,広く使用されているCUB-200-2011,Cars196,Stanford Online Productsデータセットの最先端結果を得る。
論文 参考訳(メタデータ) (2022-05-09T17:51:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。