論文の概要: Compressed Feature Quality Assessment: Dataset and Baselines
- arxiv url: http://arxiv.org/abs/2506.07412v1
- Date: Mon, 09 Jun 2025 04:16:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.801411
- Title: Compressed Feature Quality Assessment: Dataset and Baselines
- Title(参考訳): 圧縮された特徴品質評価:データセットとベースライン
- Authors: Changsheng Gao, Wei Zhou, Guosheng Lin, Weisi Lin,
- Abstract要約: 本稿では,圧縮特徴量評価(CFQA)の研究課題を紹介する。
CFQA研究を進めるために,300の原特徴と12000の圧縮特徴からなる最初のベンチマークデータセットを提案する。
セマンティックな劣化を捉えるために広く使われている3つの指標(MSE,cosine similarity, Centered Kernel Alignment)の性能を評価する。
- 参考スコア(独自算出の注目度): 86.31918930888816
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The widespread deployment of large models in resource-constrained environments has underscored the need for efficient transmission of intermediate feature representations. In this context, feature coding, which compresses features into compact bitstreams, becomes a critical component for scenarios involving feature transmission, storage, and reuse. However, this compression process introduces inherent semantic degradation that is notoriously difficult to quantify with traditional metrics. To address this, this paper introduces the research problem of Compressed Feature Quality Assessment (CFQA), which seeks to evaluate the semantic fidelity of compressed features. To advance CFQA research, we propose the first benchmark dataset, comprising 300 original features and 12000 compressed features derived from three vision tasks and four feature codecs. Task-specific performance drops are provided as true semantic distortion for the evaluation of CFQA metrics. We assess the performance of three widely used metrics (MSE, cosine similarity, and Centered Kernel Alignment) in capturing semantic degradation. The results underscore the representativeness of the dataset and highlight the need for more refined metrics capable of addressing the nuances of semantic distortion in compressed features. To facilitate the ongoing development of CFQA research, we release the dataset and all accompanying source code at \href{https://github.com/chansongoal/Compressed-Feature-Quality-Assessment}{https://github.com/chansongoal/Compressed-Feature-Quality-Assessment}. This contribution aims to advance the field and provide a foundational resource for the community to explore CFQA.
- Abstract(参考訳): 資源制約のある環境における大規模モデルの広範な展開は、中間的特徴表現の効率的な伝達の必要性を暗示している。
この文脈では、機能をコンパクトなビットストリームに圧縮するフィーチャーコーディングは、機能伝達、ストレージ、再利用を含むシナリオにとって重要なコンポーネントとなる。
しかし、この圧縮プロセスは、従来のメトリクスと定量化するのが非常に難しい、固有の意味的劣化をもたらす。
そこで本稿では, 圧縮特徴量評価 (CFQA) の課題として, 圧縮特徴量の意味的忠実度を評価することを提案する。
CFQA研究を進めるために,3つの視覚タスクと4つの特徴コーデックから得られた300の原特徴と12000の圧縮特徴からなる最初のベンチマークデータセットを提案する。
タスク固有のパフォーマンス低下は、CFQAメトリクスの評価のための真の意味歪みとして提供される。
セマンティックな劣化を捉えるために広く使われている3つの指標(MSE,cosine similarity, Centered Kernel Alignment)の性能を評価する。
その結果、データセットの代表性を強調し、圧縮された特徴における意味的歪みのニュアンスに対処できる、より洗練されたメトリクスの必要性を強調した。
CFQA研究の継続的な開発を容易にするため、データセットと付随するソースコードを、 \href{https://github.com/chansongoal/Compressed-Feature-Quality-Assessment}{https://github.com/chansongoal/Compressed-Feature-Quality-Assessment}でリリースする。
この貢献は、CFQAを探求するコミュニティのための基礎的なリソースを提供することを目的としています。
関連論文リスト
- RBFIM: Perceptual Quality Assessment for Compressed Point Clouds Using Radial Basis Function Interpolation [58.04300937361664]
ポイントクラウド圧縮(PCC)の主な課題の1つは、知覚的品質にRBを最適化できるように、認識された歪みを評価する方法である。
本稿では、放射基底関数(RBF)を用いて離散点特徴を歪み点雲の連続特徴関数に変換する新しい評価法を提案する。
論文 参考訳(メタデータ) (2025-03-18T11:25:55Z) - Hierarchical Semantic Compression for Consistent Image Semantic Restoration [62.97519327310638]
生成モデルから固有意味空間内で純粋に機能する新しい階層意味圧縮(HSC)フレームワークを提案する。
実験の結果,提案したHSCフレームワークは人間の視力に対する主観的品質と一貫性に関する最先端の性能を実現することが示された。
論文 参考訳(メタデータ) (2025-02-24T03:20:44Z) - Disentangling CLIP for Multi-Object Perception [58.73850193789384]
CLIPのような視覚言語モデルは、シーン内の1つの顕著なオブジェクトを認識するのに優れていますが、複数のオブジェクトを含む複雑なシーンで苦労しています。
DCLIPはCLIP機能を2つの相補的な目的から切り離すフレームワークである。
実験の結果,DCLIPはCLIPと比較してクラス間特徴類似度を30%削減できることがわかった。
論文 参考訳(メタデータ) (2025-02-05T08:20:31Z) - HEMGS: A Hybrid Entropy Model for 3D Gaussian Splatting Data Compression [25.820461699307042]
本稿では,3次元ガウススプラッティング(HEMGS)のためのハイブリッドエントロピーモデルを提案する。
変数レート予測器、ハイパープライアネットワーク、自動回帰ネットワークの3つの主要コンポーネントで構成されている。
HEMGSは、ベースラインメソッドのレンダリング品質を維持しながら、約40%のサイズ削減を実現している。
論文 参考訳(メタデータ) (2024-11-27T16:08:59Z) - No-Reference Image Quality Assessment with Global-Local Progressive Integration and Semantic-Aligned Quality Transfer [6.095342999639137]
視覚変換器(ViT)を用いたグローバル特徴抽出器と畳み込みニューラルネットワーク(CNN)を用いた局所特徴抽出器を組み合わせた二重測定フレームワークを開発した。
多様な画像コンテンツの品質スコアを主観的な意見スコアで自動的にラベル付けすることで、トレーニングデータを拡張するセマンティック・アライン・クオリティ・トランスファー手法を提案する。
論文 参考訳(メタデータ) (2024-08-07T16:34:32Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity [55.399230250413986]
上流タスクから有害なセマンティックノイズを除去するためのQFM-IQM(Quality-Aware Feature Matching IQA Metric)を提案する。
提案手法は,8つの標準IQAデータセット上での最先端NR-IQA法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2023-12-11T06:50:27Z) - Exploring and Exploiting Multi-Granularity Representations for Machine
Reading Comprehension [13.191437539419681]
適応的双方向注意カプセルネットワーク(ABA-Net)という新しい手法を提案する。
ABA-Netは、異なるレベルのソース表現を予測子に適応的に活用する。
私たちはSQuAD 1.0データセットに新しい最先端パフォーマンスを設定しました。
論文 参考訳(メタデータ) (2022-08-18T10:14:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。