論文の概要: Subtle Motion Blur Detection and Segmentation from Static Image Artworks
- arxiv url: http://arxiv.org/abs/2602.18720v1
- Date: Sat, 21 Feb 2026 04:59:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.261792
- Title: Subtle Motion Blur Detection and Segmentation from Static Image Artworks
- Title(参考訳): 静的画像アートワークからのサブトル運動ブラインド検出とセグメンテーション
- Authors: Ganesh Samarth, Sibendu Paul, Solale Tabarestani, Caren Chen,
- Abstract要約: ストリーミングサービスは世界中の数億の視聴者にサービスを提供しており、サムネイル、ボックスアート、カバーイメージなどのビジュアルアセットがエンゲージメントに不可欠である。
サブトルモーションのぼかしは、視力の明快さを減らし、ユーザの信頼とクリックスルー率に悪影響を及ぼすような、広範にわたる品質問題のままである。
複数の粒度でゼロショット検出が可能なエンドツーエンド検出器と高品質なモーションぼかし特定データセット生成を組み合わせた統合フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.537980077620708
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Streaming services serve hundreds of millions of viewers worldwide, where visual assets such as thumbnails, box art, and cover images are critical for engagement. Subtle motion blur remains a pervasive quality issue, reducing visual clarity and negatively affecting user trust and click-through rates. However, motion blur detection from static images is underexplored, as existing methods and datasets focus on severe blur and lack fine-grained pixel-level annotations needed for quality-critical applications. Benchmarks such as GOPRO and NFS are dominated by strong synthetic blur and often contain residual blur in their sharp references, leading to ambiguous supervision. We propose SMBlurDetect, a unified framework combining high-quality motion blur specific dataset generation with an end-to-end detector capable of zero-shot detection at multiple granularities. Our pipeline synthesizes realistic motion blur from super high resolution aesthetic images using controllable camera and object motion simulations over SAM segmented regions, enhanced with alpha-aware compositing and balanced sampling to generate subtle, spatially localized blur with precise ground truth masks. We train a U-Net based detector with ImageNet pretrained encoders using a hybrid mask and image centric strategy incorporating curriculum learning, hard negatives, focal loss, blur frequency channels, and resolution aware augmentation.Our method achieves strong zero-shot generalization, reaching 89.68% accuracy on GoPro (vs 66.50% baseline) and 59.77% Mean IoU on CUHK (vs 9.00% baseline), demonstrating 6.6x improvement in segmentation. Qualitative results show accurate localization of subtle blur artifacts, enabling automated filtering of low quality frames and precise region of interest extraction for intelligent cropping.
- Abstract(参考訳): ストリーミングサービスは世界中の数億の視聴者にサービスを提供しており、サムネイル、ボックスアート、カバーイメージなどのビジュアルアセットがエンゲージメントに不可欠である。
サブトルモーションのぼかしは、視力の明快さを減らし、ユーザの信頼とクリックスルー率に悪影響を及ぼすような、広範にわたる品質問題のままである。
しかし、静止画像からのモーションブラー検出は、既存の手法やデータセットが深刻なブラーに焦点を当てており、品質クリティカルなアプリケーションに必要な細かいピクセルレベルのアノテーションが欠如しているため、あまり探索されていない。
GOPROやNFSのようなベンチマークは、強い合成のぼやけによって支配されており、しばしば鋭い参照で残酷なぼやけを含んでいるため、曖昧な監視につながっている。
SMBlurDetectは、高品質なモーションボケ特定データセット生成と、複数の粒度でゼロショット検出が可能なエンドツーエンド検出器を組み合わせた統合フレームワークである。
我々のパイプラインは、制御可能なカメラとSAMセグメント領域上の物体の動きシミュレーションを用いて、超高解像度の美容画像からリアルな動きのぼかしを合成し、α認識合成とバランスの取れたサンプリングにより強化し、精密な地平面マスクによる微妙で空間的局所的ぼかしを生成する。
我々は, 学習, ハードネガティブ, 焦点損失, ブラーフ周波数チャネル, 分解能意識の増大を取り入れたハイブリッドマスクとイメージ中心戦略を用いて, U-Netベースの検出器を訓練し, GoProの89.68%, CUHKの59.77%, CUHKの59.77%, セグメンテーションの6.6倍の改善を示した。
定性的結果は微妙なぼやけたアーティファクトの正確な局在を示し、低品質フレームの自動フィルタリングと知的収穫のための精密な関心領域抽出を可能にした。
関連論文リスト
- Motion-Aware Adaptive Pixel Pruning for Efficient Local Motion Deblurring [87.56382172827526]
画像内のぼやけた領域を識別するトレーニング可能なマスク予測器を提案する。
また、相対的な画素変位を運動軌跡に変換するフレーム内運動解析器を開発した。
提案手法は, 再建損失, 再生損失, および注釈付きぼかしマスクで導かれるマスク損失の組合せを用いて, エンドツーエンドで訓練する。
論文 参考訳(メタデータ) (2025-07-10T12:38:27Z) - SOTA: Spike-Navigated Optimal TrAnsport Saliency Region Detection in Composite-bias Videos [50.51658520045165]
Spike-d TrAnsport Saliency Region Detection (SOTA)は、スパイクカメラの強度を活用しつつ、空間次元と時間次元の両方のバイアスを緩和するフレームワークである。
本手法では,微妙なフレーム・ツー・フレームの変動を捉えるために,スパイクに基づくマイクロデビア(SM)を導入する。
SOTAは様々な条件にまたがる不整合を減らして予測を洗練させる。
論文 参考訳(メタデータ) (2025-05-01T08:30:40Z) - Generative Adversarial Network on Motion-Blur Image Restoration [0.0]
我々は、GAN(Generative Adrial Networks)を活用して、動きのぼやけによるイメージを効果的に損なうことに焦点をあてる。
GANベースの逆流モデルを定義し、GoProデータセットを用いてトレーニングし、評価する。
PNR(Peak Signal-to-Noise Ratio)とSSIM(Structure similarity Index Measure)は、画像品質の定量的測定に使用される2つの評価指標である。
論文 参考訳(メタデータ) (2024-12-27T06:12:50Z) - Multi-scale Frequency Enhancement Network for Blind Image Deblurring [7.198959621445282]
視覚障害者のためのマルチスケール周波数拡張ネットワーク(MFENet)を提案する。
ぼやけた画像のマルチスケール空間およびチャネル情報をキャプチャするために,深度的に分離可能な畳み込みに基づくマルチスケール特徴抽出モジュール(MS-FE)を導入する。
提案手法は,視覚的品質と客観的評価の両指標において,優れた劣化性能を達成できることを実証する。
論文 参考訳(メタデータ) (2024-11-11T11:49:18Z) - Adaptive Window Pruning for Efficient Local Motion Deblurring [81.35217764881048]
局所的な動きのぼかしは、露光中の移動物体と静止背景との混合により、実世界の写真で一般的に発生する。
既存の画像のデブロアリング手法は主にグローバルなデブロアリングに焦点を当てている。
本稿では,高解像度の局所的ぼやけた画像を適応的かつ効率的に復元することを目的とする。
論文 参考訳(メタデータ) (2023-06-25T15:24:00Z) - MC-Blur: A Comprehensive Benchmark for Image Deblurring [127.6301230023318]
ほとんどの実世界の画像では、ブラーは動きやデフォーカスなど様々な要因によって引き起こされる。
我々は,MC-Blurと呼ばれる大規模マルチライク画像デブロアリングデータセットを新たに構築する。
MC-Blurデータセットに基づいて,異なるシナリオにおけるSOTA法の比較を行う。
論文 参考訳(メタデータ) (2021-12-01T02:10:42Z) - Prior-enlightened and Motion-robust Video Deblurring [29.158836861982742]
PriOr-enlightened and MOTION-robust deblurring model (PROMOTION) は難解なぼかしに適したモデルである。
我々は、異種先行情報を効率的に符号化するために、3Dグループ畳み込みを用いる。
また、一様でないぼやけた時間領域をよりよく扱うために、ぼやけた分布を表す事前設計を行う。
論文 参考訳(メタデータ) (2020-03-25T04:16:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。