論文の概要: iPhoneBlur: A Difficulty-Stratified Benchmark for Consumer Device Motion Deblurring
- arxiv url: http://arxiv.org/abs/2605.05990v1
- Date: Thu, 07 May 2026 10:41:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.701647
- Title: iPhoneBlur: A Difficulty-Stratified Benchmark for Consumer Device Motion Deblurring
- Title(参考訳): iPhoneBlurは、消費者のデバイスの動きを損なうための、難易度の高いベンチマーク
- Authors: Abdullah Al Shafi, Kazi Saeed Alam,
- Abstract要約: この研究は、高フレームのiPhone 17 Proビデオから合成された7,400枚の画像ペアの、難易度の高いベンチマークであるiPhoneBlurを紹介した。
各サンプルには、ISP対応および困難適応型復元戦略の調査を可能にする包括的なメタデータが含まれている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motion blur restoration on consumer mobile devices is typically evaluated using aggregate metrics that obscure performance variation across blur difficulty, masking model behavior under real deployment conditions. This work introduces iPhoneBlur, a difficulty-stratified benchmark of 7,400 image pairs synthesized from high-framerate iPhone 17 Pro videos captured in diverse real-world scenarios. Samples are partitioned into Easy, Medium, and Hard categories through PSNR-guided adaptive temporal windowing, with stratification validated by monotonic 2.2x increase in optical flow magnitude across tiers. Each sample includes comprehensive metadata enabling investigation of ISP-aware and difficulty-adaptive restoration strategies. Spectral analysis confirms synthesized blur exhibits high-frequency suppression patterns consistent with authentic motion degradation. Evaluation of six architectures reveals consistent 7-9 dB performance degradation from Easy to Hard subsets, a substantial gap entirely hidden by aggregate reporting. The benchmark further exposes a domain gap between professional and consumer cameras which targeted fine-tuning substantially recovers. By coupling difficulty stratification with deployment-critical metadata, iPhoneBlur enables systematic assessment of model reliability and failure modes for resource-constrained edge systems.
- Abstract(参考訳): 一般のモバイルデバイス上での動作のぼやけた復元は、実際の配置条件下での動作をマスクする、ぼやけ難易度、パフォーマンスの変動を曖昧にするような集計指標を用いて評価されるのが一般的である。
この研究は、さまざまな現実世界のシナリオで撮影された高フレームのiPhone 17 Proビデオから合成された7,400枚の画像ペアの、難易度の高いベンチマークであるiPhoneBlurを紹介した。
サンプルはPSNR誘導適応時間ウインドウによる簡易, 中, 硬のカテゴリに分割され, 層間における光流量の2.2倍の増大により成層化が検証される。
各サンプルには、ISP対応および困難適応型復元戦略の調査を可能にする包括的なメタデータが含まれている。
スペクトル解析により、合成されたぼかしは、真の運動劣化と一致した高周波抑制パターンを示すことを確認した。
6 つのアーキテクチャの評価では、7-9 dB のパフォーマンスが Easy から Hard のサブセットに一貫した低下を示す。
ベンチマークではさらに、微調整をターゲットとしたプロ用カメラとコンシューマ用カメラのドメインギャップが大幅に回復する。
デプロイメントクリティカルなメタデータと階層化の難しさを結合することにより、iPhoneBlurは、リソース制約エッジシステムのモデル信頼性と障害モードを体系的に評価することができる。
関連論文リスト
- Physically-Induced Atmospheric Adversarial Perturbations: Enhancing Transferability and Robustness in Remote Sensing Image Classification [54.952203312050564]
敵対的攻撃は、リモートセンシング(RS)画像分類におけるディープラーニングモデルの信頼性に深刻な脅威をもたらす。
本稿ではフォグフール(FogFool)を提案する。
2つのベンチマークRSデータセットの実験は、FogFoolが優れたパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-04-16T05:47:57Z) - Variational Rectification Inference for Learning with Noisy Labels [74.85528327499662]
損失関数の適応的補正を定式化するために, 変分補正推論(VRI)を提案する。
VRIは、補正ベクトルを潜在変数として扱うことによって階層ベイズとして構成される。
VRIで変分項を導入することにより、条件付き後部を正確に推定し、ディラックデルタ関数への崩壊を避ける。
論文 参考訳(メタデータ) (2026-03-18T01:25:08Z) - Multi-Period Texture Contrast Enhancement for Low-Contrast Wafer Defect Detection and Segmentation [19.221722169368494]
TexWDSは、マルチスケールの機能保持と周波数領域モデリングを調和させるテクスチャ対応フレームワークである。
周波数領域におけるテクスチャの破壊をモデル化することにより、MPTCEは構造化背景から非周期的異常を明示的に分離する。
TexWDSは新たな最先端を実現し、mAP50-95では8.3%、リコールでは7.7%を上回り、偽陽性率は約8.6%減少する。
論文 参考訳(メタデータ) (2026-03-15T08:35:49Z) - Efficient Semi-Automated Material Microstructure Analysis Using Deep Learning: A Case Study in Additive Manufacturing [0.0]
本稿では,U-Netに基づく畳み込みニューラルネットワークと対話型ユーザアノテーションと修正インタフェースを統合した,半自動能動学習に基づくセグメンテーションを提案する。
提案フレームワークは,スケーラビリティとロバスト性を維持しながらラベリングの労力を削減し,多様な材料システムにまたがる画像解析に広く適用可能である。
論文 参考訳(メタデータ) (2026-03-14T08:28:00Z) - Quality-Aware Robust Multi-View Clustering for Heterogeneous Observation Noise [12.720216418233795]
QARMVC(Quality-Aware Robust Multi-View Clustering)と呼ばれる新しいフレームワークを提案する。
QARMVCは、ビュー再構成に固有のセマンティクスを抽出するために、情報ボトルネック機構を採用している。
5つのベンチマークデータセットの実験では、QARMVCは一貫して最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2026-02-26T03:16:44Z) - From Filters to VLMs: Benchmarking Defogging Methods through Object Detection and Segmentation Performance [2.0524609401792397]
包括的なパイプラインの集合をベンチマークする構造化された経験的研究を提案する。
物体検出(mAP)とセグメンテーション(PQ, RQ, SQ)における画質と下流性能の評価を行った。
我々の分析では,デフォッギングが有効である場合,連鎖が相乗効果や劣化をもたらす場合,VLMベースのエディタが専用のアプローチとどのように比較されるかを明らかにした。
論文 参考訳(メタデータ) (2025-10-04T19:05:04Z) - Quantization Robustness to Input Degradations for Object Detection [2.0901018134712297]
トレーニング後の量子化(PTQ)は、リソース制約のあるデバイスに、YOLOのような効率的なオブジェクト検出モデルをデプロイするために不可欠である。
モデルロバスト性に対する精度低下の影響は、ノイズ、ぼかし、圧縮アーティファクトなどの実世界の入力劣化に大きく影響する。
本稿では,複数の精度のフォーマットにまたがるYOLOモデルのロバスト性を評価する実験的検討を行った。
論文 参考訳(メタデータ) (2025-08-27T06:20:38Z) - SOTA: Spike-Navigated Optimal TrAnsport Saliency Region Detection in Composite-bias Videos [50.51658520045165]
Spike-d TrAnsport Saliency Region Detection (SOTA)は、スパイクカメラの強度を活用しつつ、空間次元と時間次元の両方のバイアスを緩和するフレームワークである。
本手法では,微妙なフレーム・ツー・フレームの変動を捉えるために,スパイクに基づくマイクロデビア(SM)を導入する。
SOTAは様々な条件にまたがる不整合を減らして予測を洗練させる。
論文 参考訳(メタデータ) (2025-05-01T08:30:40Z) - DR2: Diffusion-based Robust Degradation Remover for Blind Face
Restoration [66.01846902242355]
ブラインド顔復元は通常、トレーニングのための事前定義された劣化モデルで劣化した低品質データを合成する。
トレーニングデータに現実のケースをカバーするために、あらゆる種類の劣化を含めることは、高価で実現不可能である。
本稿では、まず、劣化した画像を粗いが劣化不変な予測に変換し、次に、粗い予測を高品質な画像に復元するために拡張モジュールを使用するロバスト劣化再帰法(DR2)を提案する。
論文 参考訳(メタデータ) (2023-03-13T06:05:18Z) - Designing a Practical Degradation Model for Deep Blind Image
Super-Resolution [134.9023380383406]
単一画像スーパーレゾリューション (sisr) 法は, 推定劣化モデルが実画像から逸脱した場合はうまく動作しない。
本稿では, ランダムにシャッフルされたブラー, ダウンサンプリング, ノイズ劣化からなる, より複雑で実用的な劣化モデルを提案する。
論文 参考訳(メタデータ) (2021-03-25T17:40:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。