論文の概要: A Two-Fold Patch Selection Approach for Improved 360-Degree Image Quality Assessment
- arxiv url: http://arxiv.org/abs/2412.12667v1
- Date: Tue, 17 Dec 2024 08:36:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 14:00:20.959127
- Title: A Two-Fold Patch Selection Approach for Improved 360-Degree Image Quality Assessment
- Title(参考訳): 360度画像品質向上のための2点パッチ選択手法
- Authors: Abderrezzaq Sendjasni, Seif-Eddine Benkabou, Mohamed-Chaker Larabi,
- Abstract要約: 本稿では,2倍のパッチ選択プロセスにより,360度知覚画像品質評価(IQA)の精度を向上させるための新しいアプローチを提案する。
我々の手法は、視覚的パッチ選択と埋め込み類似性に基づく洗練を組み合わせる。
結果は、ロバストで正確な360度IQAを提供する可能性を強調し、パフォーマンスは最大4.5%向上し、品質スコア予測の単調性も向上した。
- 参考スコア(独自算出の注目度): 4.577104493960515
- License:
- Abstract: This article presents a novel approach to improving the accuracy of 360-degree perceptual image quality assessment (IQA) through a two-fold patch selection process. Our methodology combines visual patch selection with embedding similarity-based refinement. The first stage focuses on selecting patches from 360-degree images using three distinct sampling methods to ensure comprehensive coverage of visual content for IQA. The second stage, which is the core of our approach, employs an embedding similarity-based selection process to filter and prioritize the most informative patches based on their embeddings similarity distances. This dual selection mechanism ensures that the training data is both relevant and informative, enhancing the model's learning efficiency. Extensive experiments and statistical analyses using three distance metrics across three benchmark datasets validate the effectiveness of our selection algorithm. The results highlight its potential to deliver robust and accurate 360-degree IQA, with performance gains of up to 4.5% in accuracy and monotonicity of quality score prediction, while using only 40% to 50% of the training patches. These improvements are consistent across various configurations and evaluation metrics, demonstrating the strength of the proposed method. The code for the selection process is available at: https://github.com/sendjasni/patch-selection-360-image-quality.
- Abstract(参考訳): 本稿では,2倍のパッチ選択プロセスにより,360度知覚画像品質評価(IQA)の精度を向上させるための新しいアプローチを提案する。
我々の手法は、視覚的パッチ選択と埋め込み類似性に基づく洗練を組み合わせる。
第1ステージでは、IQAの視覚的コンテンツの包括的カバレッジを確保するために、3つの異なるサンプリング手法を使用して、360度画像からパッチを選択することに焦点を当てている。
アプローチの中核である第2段階では、埋め込み類似性選択プロセスを用いて、埋め込み類似性距離に基づいて最も情報性の高いパッチをフィルタリングし、優先順位付けする。
この二重選択機構は、トレーニングデータが関連性および情報的であることを保証し、モデルの学習効率を高める。
3つのベンチマークデータセットにまたがる3つの距離測定値を用いた大規模実験と統計的解析により,選択アルゴリズムの有効性が検証された。
結果は、堅牢で正確な360度IQAを提供する可能性を強調し、トレーニングパッチの40%から50%しか使用せず、精度は4.5%まで向上し、品質スコア予測の単調性も向上した。
これらの改善は、様々な構成と評価指標で一致しており、提案手法の強度を実証している。
選択プロセスのコードは、https://github.com/sendjasni/patch-selection-360-image-quality で利用可能である。
関連論文リスト
- Adaptive Image Quality Assessment via Teaching Large Multimodal Model to Compare [99.57567498494448]
我々はLMMに基づくノン参照IQAモデルであるCompare2Scoreを紹介する。
トレーニング中、同じIQAデータセットの画像を比較することで、スケールアップ比較命令を生成する。
9つのIQAデータセットの実験により、Compare2Scoreは、トレーニング中にテキスト定義の比較レベルを効果的にブリッジすることを確認した。
論文 参考訳(メタデータ) (2024-05-29T17:26:09Z) - Opinion-Unaware Blind Image Quality Assessment using Multi-Scale Deep Feature Statistics [54.08757792080732]
我々は,事前学習された視覚モデルからの深い特徴を統計的解析モデルと統合して,意見認識のないBIQA(OU-BIQA)を実現することを提案する。
提案モデルは,最先端のBIQAモデルと比較して,人間の視覚的知覚との整合性に優れる。
論文 参考訳(メタデータ) (2024-05-29T06:09:34Z) - How Quality Affects Deep Neural Networks in Fine-Grained Image Classification [0.799543372823325]
粒度分類システムの性能を高めるために,非参照画像品質評価(NRIQA)誘導カットオフポイント選択(CPS)戦略を提案する。
最も一般的に採用されている3つのイメージ拡張設定 -- トリミング、回転、ぼやけた -- をエントリポイントとしています。
具体的には、これらの方法によって得られるカットオフポイントは、多数決によって集約され、画像サブセット選択のプロセスが通知される。
論文 参考訳(メタデータ) (2024-05-09T12:59:11Z) - Not Every Side Is Equal: Localization Uncertainty Estimation for
Semi-Supervised 3D Object Detection [38.77989138502667]
点雲からの半教師付き3Dオブジェクト検出は、少数のラベル付きデータと多数のラベルなしデータで検出器を訓練することを目的としている。
既存の方法は、各擬似境界ボックス全体を扱い、トレーニング中に各側面に等しい重要性を割り当てる。
3つの鍵設計からなる半教師付き3次元物体検出のためのサイドアウェアフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-16T09:08:03Z) - Efficient Vision Transformer for Human Pose Estimation via Patch
Selection [1.450405446885067]
ビジョントランスフォーマー(ViT)はCNNに代わる有望な代替品として登場し、最先端のパフォーマンスを向上している。
本稿では,ViTの計算複雑性を低減するための3つの方法を提案する。
提案手法は,0%から3.5%の精度で,30%から44%の範囲で計算複雑性の大幅な低減を実現している。
論文 参考訳(メタデータ) (2023-06-07T08:02:17Z) - Blind Image Quality Assessment via Vision-Language Correspondence: A
Multitask Learning Perspective [93.56647950778357]
ブラインド画像品質評価(BIQA)は、参照情報なしで画像品質の人間の知覚を予測する。
我々は,他のタスクからの補助的知識を活用するために,BIQAのための汎用的かつ自動化されたマルチタスク学習手法を開発した。
論文 参考訳(メタデータ) (2023-03-27T07:58:09Z) - Iterative Optimization of Pseudo Ground-Truth Face Image Quality Labels [0.0]
顔画像品質評価(FIQA)技術は、品質の悪いデータを拒否するのに使用できるサンプル品質情報を提供する。
本稿では,マットペアの類似点からのサンプル品質情報を品質予測に組み込んだ品質ラベル最適化手法を提案する。
提案手法は3つの多様なデータセットに対して3つの最先端FIQA手法を用いて評価する。
論文 参考訳(メタデータ) (2022-08-31T08:24:09Z) - Task-Specific Normalization for Continual Learning of Blind Image
Quality Models [105.03239956378465]
視覚的画像品質評価(BIQA)のための簡易かつ効果的な連続学習法を提案する。
このアプローチの重要なステップは、トレーニング済みのディープニューラルネットワーク(DNN)のすべての畳み込みフィルタを凍結して、安定性を明示的に保証することです。
我々は、各新しいIQAデータセット(タスク)に予測ヘッドを割り当て、対応する正規化パラメータをロードして品質スコアを生成する。
最終的な品質推定は、軽量な$K$-meansゲーティング機構で、すべての頭からの予測の重み付け総和によって計算される。
論文 参考訳(メタデータ) (2021-07-28T15:21:01Z) - Auto-weighted Multi-view Feature Selection with Graph Optimization [90.26124046530319]
グラフ学習に基づく新しい教師なしマルチビュー特徴選択モデルを提案する。
1) 特徴選択過程において, 異なる視点で共有されたコンセンサス類似度グラフが学習される。
各種データセットを用いた実験により,提案手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-11T03:25:25Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。