論文の概要: MetaRanker: Human-in-the-loop Active Ranking for Metalens Image Quality
- arxiv url: http://arxiv.org/abs/2605.29212v1
- Date: Thu, 28 May 2026 00:51:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 05:02:24.549327
- Title: MetaRanker: Human-in-the-loop Active Ranking for Metalens Image Quality
- Title(参考訳): MetaRanker: メタレンス画像のクオリティを人力でランク付けする
- Authors: Yujin Park, Haejun Chung, Ikbeom Jang,
- Abstract要約: 我々はMetaRankerを紹介した。MetaRankerは人間のループ内アクティブランキングフレームワークで、セマンティック・インタープリタビリティの観点から画像品質をメタル化する。
MetaRankerは、現実世界と合成メタエンスデータセットで、異なる劣化プロファイルを持つため、人間の評価と最も密接に一致したランキングを生成する。
- 参考スコア(独自算出の注目度): 0.5861893391102716
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Image quality in modern imaging systems emerges from the coupled effects of the sensor, optics, and computational reconstruction. Ultra-thin metalenses offer a path toward substantial miniaturization of optical modules, but practical designs often exhibit pronounced chromatic and field-dependent aberrations that necessitate computational reconstruction. In current metalens pipelines, reconstruction models are commonly trained and selected using distortion-based fidelity objectives, such as PSNR, yet these proxies can be weakly correlated with human preference and downstream utility, reflecting the well-known perception--distortion trade-off. We introduce MetaRanker, a human-in-the-loop active ranking framework that formalizes metalens image quality in terms of semantic interpretability, defined as the degree to which humans can reliably recognize objects and structures in the presence of optical artifacts. MetaRanker combines a probabilistic preference model with uncertainty-aware query selection, and leverages vision--language models to provide lightweight semantic priors. Importantly, these priors are used only to guide the sampling of informative comparisons; human judgments remain the primary supervision signal throughout. Across real-world and synthetic metalens datasets with distinct degradation profiles, MetaRanker produces rankings that align most closely with human assessments, while reducing the number of pairwise annotations required by approximately 80% relative to exhaustive pairwise evaluation. Finally, we show that standard image quality assessment metrics exhibit limited alignment with human interpretability in the metalens domain, positioning MetaRanker as a practical step toward perceptually grounded metalens evaluation and co-design.
- Abstract(参考訳): 現代の画像システムにおける画質は、センサー、光学、計算的再構成の複合効果から生まれる。
極薄の金属センスは、光学モジュールの相当な小型化への道を提供するが、実用的な設計は、しばしば計算再構成を必要とする色と磁場に依存した収差を顕著に示す。
現在のメタレンスパイプラインでは、PSNRのような歪みに基づく忠実度目標を用いて再構成モデルが一般的に訓練され、選択されるが、これらのプロキシは人間の嗜好や下流のユーティリティと弱い相関を持ち、よく知られた知覚-歪曲トレードオフを反映している。
メタランカー(MetaRanker)は、光学人工物の存在下で、人間が確実に物体や構造を認識できる程度に定義された意味論的解釈可能性の観点から、画像品質をメタレンスにフォーマル化する、ループ内アクティブランキングフレームワークである。
MetaRankerは確率論的嗜好モデルと不確実性を認識したクエリ選択を組み合わせ、視覚言語モデルを活用して、軽量なセマンティックプリミティブを提供する。
重要な点として、これらの先行は情報的比較のサンプリングをガイドするためにのみ使用される。
異なる劣化プロファイルを持つ実世界と合成メタレンスデータセット全体にわたって、MetaRankerは、人間の評価と最も密に一致したランキングを生成すると同時に、徹底的なペアワイズ評価に対して約80%必要となるペアワイズアノテーションの数を削減している。
最後に,メタランカーをメタレンス評価・共同設計のための実践的なステップとして位置づけ,メタレンス領域における人間の解釈可能性に限定した基準画像品質評価指標を示す。
関連論文リスト
- Bringing Multimodal Large Language Models to Infrared-Visible Image Fusion Quality Assessment [48.882448108261826]
赤外線可視画像融合(IVIF)は、熱情報と詳細な空間構造を単一の融合画像に統合し、知覚を高めることを目的としている。
近年のIVIF報酬モデリングの取り組みは人間の評価から学ぶが、集計されたスコアにスカラー回帰を用いる。
本稿では,MLLMを用いて人間の視覚知覚を再現し,連続的な品質スコアを生成するFuScoreを紹介する。
論文 参考訳(メタデータ) (2026-05-07T21:38:09Z) - Leveraging Image Editing Foundation Models for Data-Efficient CT Metal Artifact Reduction [2.201656998025222]
高減衰インプラントによる金属人工物は、CT画像の品質を著しく低下させる。
本稿では,文脈内推論タスクとしてアーティファクトリダクションのフレーミングというパラダイムシフトを提案する。
提案手法は16対128対のトレーニング例のみで有効なアーティファクト抑制を実現する。
論文 参考訳(メタデータ) (2026-04-07T14:32:25Z) - MGMAR: Metal-Guided Metal Artifact Reduction for X-ray Computed Tomography [0.0]
金属インプラントは標準的なCT前方モデルの仮定に反し、重度のストリーキングとシャドーイングアーティファクトを生み出した。
再建パイプライン全体を通して金属関連情報を明示的に活用する金属誘導型MAR法であるMGMARを提案する。
MGMARは最先端のパフォーマンスを達成し、29例の臨床検査で平均0.89点のスコアを得た。
論文 参考訳(メタデータ) (2026-03-13T13:41:23Z) - Implicit Neural Representation-Based Continuous Single Image Super Resolution: An Empirical Study [50.15623093332659]
入射神経表現(INR)は任意のスケール画像超解像(ASSR)の標準的アプローチとなっている
既存の手法を多様な設定で比較し、複数の画像品質指標に対して集計結果を示す。
トレーニング中, エッジ, テクスチャ, 細部を保存しながら, 強度変化をペナライズする新たな損失関数について検討した。
論文 参考訳(メタデータ) (2026-01-25T07:09:20Z) - Scene Perceived Image Perceptual Score (SPIPS): combining global and local perception for image quality assessment [0.0]
深層学習と人間の知覚のギャップを埋める新しいIQA手法を提案する。
我々のモデルは、深い特徴を高レベルの意味情報と低レベルの知覚の詳細に分解し、それぞれのストリームを別々に扱う。
このハイブリッド設計により、グローバルコンテキストと複雑な画像の詳細の両方を評価し、人間の視覚過程をより良く反映することができる。
論文 参考訳(メタデータ) (2025-04-24T04:06:07Z) - A Meaningful Perturbation Metric for Evaluating Explainability Methods [55.09730499143998]
本稿では,画像生成モデルを用いて標的摂動を行う新しい手法を提案する。
具体的には,画像の忠実さを保ちながら,入力画像の高関連画素のみを塗布し,モデルの予測を変更することに焦点を当てる。
これは、しばしばアウト・オブ・ディストリビューションの修正を生み出し、信頼できない結果をもたらす既存のアプローチとは対照的である。
論文 参考訳(メタデータ) (2025-04-09T11:46:41Z) - Dual-Domain CLIP-Assisted Residual Optimization Perception Model for Metal Artifact Reduction [9.028901322902913]
CT(Computed tomography)画像における金属遺物は,正確な臨床診断に重要な課題である。
深層学習に基づくアプローチ、特に生成モデルは、金属人工物還元(MAR)のために提案されている。
論文 参考訳(メタデータ) (2024-08-14T02:37:26Z) - Negligible effect of brain MRI data preprocessing for tumor segmentation [36.89606202543839]
我々は3つの公開データセットの実験を行い、ディープニューラルネットワークにおける異なる前処理ステップの効果を評価する。
その結果、最も一般的な標準化手順は、ネットワーク性能に何の価値も与えないことが示されている。
画像の規格化に伴う信号分散の低減のため,画像強度正規化手法はモデル精度に寄与しない。
論文 参考訳(メタデータ) (2022-04-11T17:29:36Z) - A Comprehensive Study of Image Classification Model Sensitivity to
Foregrounds, Backgrounds, and Visual Attributes [58.633364000258645]
このデータセットをRIVAL10と呼びます。
本研究では,前景,背景,属性の騒音劣化に対する幅広いモデルの感度を評価する。
本稿では,多種多様な最先端アーキテクチャ (ResNets, Transformers) とトレーニング手順 (CLIP, SimCLR, DeiT, Adversarial Training) について考察する。
論文 参考訳(メタデータ) (2022-01-26T06:31:28Z) - Progressively-Growing AmbientGANs For Learning Stochastic Object Models
From Imaging Measurements [14.501812971529137]
医療画像システムの客観的な最適化には、測定データ中のランダム性のすべての源をフルに評価する必要がある。
本稿では,オブジェクトのクラスにおける変数を記述するオブジェクトモデル(SOM)の確立を提案する。
医用イメージングシステムは、物体特性のノイズや間接的な表現を示す画像計測を記録しているため、画像化対象のモデルを構築するために直接GANを適用することはできない。
論文 参考訳(メタデータ) (2020-01-26T21:33:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。