論文の概要: Image Demoiréing Using Dual Camera Fusion on Mobile Phones
- arxiv url: http://arxiv.org/abs/2506.08361v1
- Date: Tue, 10 Jun 2025 02:20:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:41.161462
- Title: Image Demoiréing Using Dual Camera Fusion on Mobile Phones
- Title(参考訳): デュアルカメラフュージョンを用いた携帯電話における画像復号化
- Authors: Yanting Mei, Zhilu Zhang, Xiaohe Wu, Wangmeng Zuo,
- Abstract要約: 本稿では,超広角(UW)画像を用いて広角(W)画像のモアレ除去を支援するDual Camera fusion for Image Demoir'eing(DCID, ie)を提案する。
特に,軽量なUW画像エンコーダを既存の復号機ネットワークに統合した効率的なDCID手法を提案する。
- 参考スコア(独自算出の注目度): 58.39212652291496
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When shooting electronic screens, moir\'e patterns usually appear in captured images, which seriously affects the image quality. Existing image demoir\'eing methods face great challenges in removing large and heavy moir\'e. To address the issue, we propose to utilize Dual Camera fusion for Image Demoir\'eing (DCID), \ie, using the ultra-wide-angle (UW) image to assist the moir\'e removal of wide-angle (W) image. This is inspired by two motivations: (1) the two lenses are commonly equipped with modern smartphones, (2) the UW image generally can provide normal colors and textures when moir\'e exists in the W image mainly due to their different focal lengths. In particular, we propose an efficient DCID method, where a lightweight UW image encoder is integrated into an existing demoir\'eing network and a fast two-stage image alignment manner is present. Moreover, we construct a large-scale real-world dataset with diverse mobile phones and monitors, containing about 9,000 samples. Experiments on the dataset show our method performs better than state-of-the-art methods. Code and dataset are available at https://github.com/Mrduckk/DCID.
- Abstract(参考訳): 電子スクリーンを撮影する際、通常、モワーイパターンはキャプチャされた画像に現れ、画像の品質に深刻な影響を及ぼす。
既存の画像デモア\'eingメソッドは、大きくて重いモワール\'eを除去する上で大きな課題に直面します。
そこで本研究では,超広角(UW)画像を用いて広角(W)画像の除去を支援するために,Dual Camera fusion for Image Demoir\'eing (DCID), \ieを提案する。
これは,(1)2つのレンズが一般的に近代的なスマートフォンを搭載していること,(2)UW画像は,主に焦点距離が異なるため,W画像内にモワーイエが存在する場合,通常色やテクスチャを提供することができること,の2つの動機に着想を得たものである。
特に,軽量なUW画像エンコーダを既存のdemoir\'eingネットワークに統合し,高速な2段階画像アライメント手法を提案する。
さらに,携帯電話やモニタを多用した大規模な実世界のデータセットを構築し,約9000のサンプルを含む。
実験の結果,本手法は最先端の手法よりも優れた性能を示した。
コードとデータセットはhttps://github.com/Mrduckk/DCID.comで公開されている。
関連論文リスト
- Self-Supervised Learning for Real-World Super-Resolution from Dual and Multiple Zoomed Observations [61.448005005426666]
スマートフォン用レファレンスベーススーパーレゾリューション(RefSR)における2つの課題について考察する。
本稿では,デュアルカメラとマルチカメラのズームで観測した実世界のRefSRに対して,新たな自己教師型学習手法を提案する。
論文 参考訳(メタデータ) (2024-05-03T15:20:30Z) - xT: Nested Tokenization for Larger Context in Large Images [79.37673340393475]
xTは、グローバルコンテキストを局所的な詳細で集約するビジョントランスフォーマーのフレームワークである。
我々は、挑戦的な分類タスクにおいて、精度を最大8.6%向上させることができる。
論文 参考訳(メタデータ) (2024-03-04T10:29:58Z) - Exposure Bracketing Is All You Need For A High-Quality Image [50.822601495422916]
マルチ露光画像は、デノイング、デブロアリング、高ダイナミックレンジイメージング、超解像において相補的である。
本研究では,これらの課題を組み合わせ,高品質な画像を得るために露光ブラケット写真を活用することを提案する。
特に時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文 参考訳(メタデータ) (2024-01-01T14:14:35Z) - Multimodal contrastive learning for remote sensing tasks [0.5801044612920815]
本稿では,Sentinel-1 と Sentinel-2 の画像ペアの大きなラベル付きデータセット (1M) 上で事前トレーニングされたデュアルエンコーダフレームワークを提案する。
本研究では,2つのリモートセンシング下流タスク(洪水セグメンテーションとランドカバーマッピング)における埋め込み実験を行い,この手法から学習した埋め込みが,積極的データ拡張による正のサンプル収集という従来の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-09-06T09:31:45Z) - A Differentiable Two-stage Alignment Scheme for Burst Image
Reconstruction with Large Shift [13.454711511086261]
バースト画像、すなわちJDD-Bのための共同デノジングとデモサック(JDD)が注目されている。
JDD-Bの重要な課題は、画像フレームのロバストなアライメントにある。
本稿では, JDD-B を効果的に活用するための2段階アライメント方式を提案する。
論文 参考訳(メタデータ) (2022-03-17T12:55:45Z) - Uni4Eye: Unified 2D and 3D Self-supervised Pre-training via Masked Image
Modeling Transformer for Ophthalmic Image Classification [1.2250035750661867]
眼科画像に埋め込まれた領域固有の特徴を捉えるために,Uni4Eyeという,汎用的な自己教師型トランスフォーマーフレームワークを提案する。
Uni4Eyeはグローバルな機能抽出器として機能し、ビジョントランスフォーマーアーキテクチャを備えたMasked Image Modelingタスクに基づいてベースを構築することができる。
We use a Unified Patch Embedding module to replaced the origin patch embedded module in ViT for jointly processing both 2D and 3D input images。
論文 参考訳(メタデータ) (2022-03-09T10:02:00Z) - Free-Form Image Inpainting via Contrastive Attention Network [64.05544199212831]
画像の塗装作業では、複雑なパターンを形成する画像のどこにでも、どんな形でもマスクが現れる。
エンコーダはこの複雑な状況下でこのような強力な表現を捕捉することは困難である。
本稿では,ロバスト性と一般化性を改善するための自己教師型シームズ推論ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-29T14:46:05Z) - Wavelet-Based Dual-Branch Network for Image Demoireing [148.91145614517015]
画像復調のための空間的注意機構を備えたウェーブレットベースのデュアルブランチネットワーク(WDNet)を設計する。
我々のネットワークはウェーブレット領域のモアレパターンを除去し、モアレパターンの周波数を画像の内容から分離する。
さらに,本手法の有効性を実証し,WDNetが非スクリーン画像上のモアレアーティファクトの除去を一般化することを示す。
論文 参考訳(メタデータ) (2020-07-14T16:44:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。