論文の概要: Efficient Hybrid Zoom using Camera Fusion on Mobile Phones
- arxiv url: http://arxiv.org/abs/2401.01461v1
- Date: Tue, 2 Jan 2024 23:28:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-04 15:32:34.004181
- Title: Efficient Hybrid Zoom using Camera Fusion on Mobile Phones
- Title(参考訳): 携帯電話におけるカメラ融合による高効率ハイブリッドズーム
- Authors: Xiaotong Wu, Wei-Sheng Lai, YiChang Shih, Charles Herrmann, Michael
Krainin, Deqing Sun, Chia-Kai Liang
- Abstract要約: モバイルデバイス上でのハイブリットズーム超解像システムを提案する。
モバイルプラットフォーム上で500msで12メガピクセル画像を生成する。
- 参考スコア(独自算出の注目度): 26.7287264520133
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: DSLR cameras can achieve multiple zoom levels via shifting lens distances or
swapping lens types. However, these techniques are not possible on smartphone
devices due to space constraints. Most smartphone manufacturers adopt a hybrid
zoom system: commonly a Wide (W) camera at a low zoom level and a Telephoto (T)
camera at a high zoom level. To simulate zoom levels between W and T, these
systems crop and digitally upsample images from W, leading to significant
detail loss. In this paper, we propose an efficient system for hybrid zoom
super-resolution on mobile devices, which captures a synchronous pair of W and
T shots and leverages machine learning models to align and transfer details
from T to W. We further develop an adaptive blending method that accounts for
depth-of-field mismatches, scene occlusion, flow uncertainty, and alignment
errors. To minimize the domain gap, we design a dual-phone camera rig to
capture real-world inputs and ground-truths for supervised training. Our method
generates a 12-megapixel image in 500ms on a mobile platform and compares
favorably against state-of-the-art methods under extensive evaluation on
real-world scenarios.
- Abstract(参考訳): DSLRカメラは、レンズ距離をシフトしたり、レンズタイプを切り替えることで、複数のズームレベルを達成することができる。
しかし、これらの技術は空間制約のためスマートフォンでは不可能である。
ほとんどのスマートフォンメーカーはハイブリッドズームシステムを採用している:通常、低ズームレベルのワイド(W)カメラと高ズームレベルのテレフォト(T)カメラである。
W と T の間のズームレベルをシミュレートするため、これらのシステムは W から画像を取り出し、デジタル的にアップサンプルする。
本稿では,W と T の同期ショットをキャプチャし,機械学習モデルを用いてT から W への詳細調整と転送を行う,モバイルデバイス上でのハイブリッドズーム超解像システムを提案する。
ドメインギャップを最小限に抑えるために、実世界の入力を捉えるデュアルホンカメラリグと、教師付きトレーニングのための接地トラスを設計する。
提案手法は,モバイルプラットフォーム上で500msの12メガピクセル画像を生成し,実世界のシナリオを広範囲に評価し,最先端の手法と比較した。
関連論文リスト
- MobileMEF: Fast and Efficient Method for Multi-Exposure Fusion [0.6261722394141346]
本稿では,エンコーダ・デコーダ深層学習アーキテクチャに基づくマルチ露光融合手法を提案する。
我々のモデルは、中距離スマートフォンで2秒未満で4K解像度画像を処理できる。
論文 参考訳(メタデータ) (2024-08-15T05:03:14Z) - Self-Supervised Learning for Real-World Super-Resolution from Dual and Multiple Zoomed Observations [61.448005005426666]
スマートフォン用レファレンスベーススーパーレゾリューション(RefSR)における2つの課題について考察する。
本稿では,デュアルカメラとマルチカメラのズームで観測した実世界のRefSRに対して,新たな自己教師型学習手法を提案する。
論文 参考訳(メタデータ) (2024-05-03T15:20:30Z) - ReWiTe: Realistic Wide-angle and Telephoto Dual Camera Fusion Dataset via Beam Splitter Camera Rig [6.532271094305152]
本稿では,ビームスプリッタを用いた新しいハードウェア構成を導入し,入力対と接地トラス画像の3つの画像を同時にキャプチャする。
新たに導入したデータセットであるReWiTeの有効性を検証する実験を行った。
論文 参考訳(メタデータ) (2024-04-16T14:10:42Z) - Dual-Camera Smooth Zoom on Mobile Phones [55.4114152554769]
我々は、スムーズなズームプレビューを実現するために、新しいタスク、すなわちデュアルカメラスムーズズーム(DCSZ)を導入する。
フレームモデル (FI) 技術は潜在的な解決法であるが、地軸収集に苦慮している。
連続型仮想カメラを組み込んだデータファクトリソリューションを提案し,シーンの再構成された3DモデルをレンダリングしてDCSZデータを生成する。
論文 参考訳(メタデータ) (2024-04-07T10:28:01Z) - Deep Hybrid Camera Deblurring for Smartphone Cameras [18.053081461607544]
スマートフォンのための学習型デブロアリングフレームワークを提案する。
我々は、長時間露光した広視野画像と短露光した超広視野画像をキャプチャし、そのバースト画像を用いて広視野像を損なう。
実験により, HCDeblurは最先端の劣化品質を達成できることが示された。
論文 参考訳(メタデータ) (2023-12-20T11:02:59Z) - Learning to Zoom and Unzoom [49.587516562644836]
入力画像にズームインし、空間的特徴を計算し、次に「アンゾム」して任意の変形を反転させる。
さまざまなタスクやデータセットを評価することで、この汎用性を実証する。
論文 参考訳(メタデータ) (2023-03-27T17:03:30Z) - SurroundDepth: Entangling Surrounding Views for Self-Supervised
Multi-Camera Depth Estimation [101.55622133406446]
本研究では,複数の周囲からの情報を組み込んだSurroundDepth法を提案し,カメラ間の深度マップの予測を行う。
具体的には、周囲のすべてのビューを処理し、複数のビューから情報を効果的に融合するクロスビュー変換器を提案する。
実験において,本手法は,挑戦的なマルチカメラ深度推定データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-04-07T17:58:47Z) - Mesoscopic photogrammetry with an unstabilized phone camera [8.210210271599134]
本稿では,3次元mesoscopic (mm-scale height variation)画像の定量化を可能にする特徴のないフォトグラム計算手法を提案する。
当社のエンドツーエンドのピクセル強度ベースのアプローチは、すべての画像を共同で登録し、整列高さマップを推定します。
また,他の複数フレーム登録問題に適用可能な時間とメモリの削減戦略を提案する。
論文 参考訳(メタデータ) (2020-12-11T00:09:18Z) - Minimal Solutions for Panoramic Stitching Given Gravity Prior [53.047330182598124]
我々は,光学中心が一致するカメラで撮影した画像のパノラマ画像縫合に対する最小限の解を提案する。
固定長や焦点距離の変動を視線歪みの有無で仮定し, 4つの実用的なカメラ構成について検討した。
シンセサイザーは、合成シーンと、Sun360データセットから500万枚以上の実画像のペアと、IMUを搭載した2台のスマートフォンを使って、私たちによって撮影されたシーンの両方でテストされる。
論文 参考訳(メタデータ) (2020-12-01T13:17:36Z) - Active Perception with A Monocular Camera for Multiscopic Vision [50.370074098619185]
低コストの単眼RGBカメラを用いてロボットアプリケーションの正確な深度推定を行うマルチスコープビジョンシステムの設計を行う。
制約のないカメラポーズで撮影された画像を持つマルチビューステレオとは異なり、提案システムはカメラを搭載したロボットアームを積極的に制御し、水平または垂直に並んだ位置の画像を同じパララックスで撮影する。
論文 参考訳(メタデータ) (2020-01-22T08:46:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。