論文の概要: Lightweight Optimal-Transport Harmonization on Edge Devices
- arxiv url: http://arxiv.org/abs/2511.12785v1
- Date: Sun, 16 Nov 2025 21:29:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:24.54066
- Title: Lightweight Optimal-Transport Harmonization on Edge Devices
- Title(参考訳): エッジデバイスにおける軽量最適トランスポート高調波化
- Authors: Maria Larchenko, Dmitry Guskov, Alexander Lobashev, Georgy Derevyanko,
- Abstract要約: 拡張現実(AR)のための色調和のための軽量なアプローチを提案する。
我々は、モンゲ・カントロヴィチ輸送写像を予測するためにコンパクトエンコーダを訓練することで古典的最適輸送理論を利用する。
我々は、MKL-Harmonizerアルゴリズムを最先端の手法と比較し、実合成AR画像に対して、この手法が最良の集計スコアを得ることを示す。
- 参考スコア(独自算出の注目度): 40.32116437322347
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Color harmonization adjusts the colors of an inserted object so that it perceptually matches the surrounding image, resulting in a seamless composite. The harmonization problem naturally arises in augmented reality (AR), yet harmonization algorithms are not currently integrated into AR pipelines because real-time solutions are scarce. In this work, we address color harmonization for AR by proposing a lightweight approach that supports on-device inference. For this, we leverage classical optimal transport theory by training a compact encoder to predict the Monge-Kantorovich transport map. We benchmark our MKL-Harmonizer algorithm against state-of-the-art methods and demonstrate that for real composite AR images our method achieves the best aggregated score. We release our dedicated AR dataset of composite images with pixel-accurate masks and data-gathering toolkit to support further data acquisition by researchers.
- Abstract(参考訳): 色調和は挿入された物体の色を、周囲の画像と知覚的に一致させるように調整し、シームレスに合成する。
調和問題は拡張現実(AR)において自然に発生するが、リアルタイムソリューションが不足しているため、現在、調和アルゴリズムはARパイプラインに統合されていない。
本研究では、デバイス上での推論をサポートする軽量なアプローチを提案することで、ARの色調和に対処する。
このために、モンゲ・カントロヴィチ輸送写像を予測するためにコンパクトエンコーダを訓練することで古典的最適輸送理論を利用する。
我々は、MKL-Harmonizerアルゴリズムを最先端の手法と比較し、実合成AR画像に対して、この手法が最良の集計スコアを得ることを示す。
我々は、画素精度の高いマスクとデータ収集ツールキットを備えた合成画像の専用のARデータセットをリリースし、研究者によるさらなるデータ取得を支援する。
関連論文リスト
- Real-Time Bundle Adjustment for Ultra-High-Resolution UAV Imagery Using Adaptive Patch-Based Feature Tracking [1.9247157750972368]
ダウンサンプリングなしで全解像度UAV画像を直接操作する新しいリアルタイムBAフレームワークを提案する。
当社の軽量でオンボード互換のアプローチでは、各イメージをユーザ定義のパッチに分割し、フレーム間で追跡しています。
UAVナビゲーションシステムを用いて画像間の重なり合う関係をリアルタイムで決定する。
提案アルゴリズムは,DLR Modular Aerial Camera System へのシームレスな統合のために設計されている。
論文 参考訳(メタデータ) (2025-11-08T22:09:32Z) - Region-to-Region: Enhancing Generative Image Harmonization with Adaptive Regional Injection [17.56045093665567]
画像調和の目標は、合成画像の前景を調整し、背景との視覚的整合性を実現することである。
近年, 遅延拡散モデル (LDM) が調和化に応用され, 顕著な結果が得られた。
現在の合成データセットは色移動に依存しており、局所的な変化がなく、複雑な現実世界の照明条件を捉えることができない。
論文 参考訳(メタデータ) (2025-08-13T12:21:51Z) - A Learnable Color Correction Matrix for RAW Reconstruction [19.394856071610604]
複雑な逆画像信号処理装置(ISP)を近似する学習可能な色補正行列(CCM)を導入する。
実験結果から,本手法で生成したRAW(simRAW)画像は,より複雑な逆ISP法で生成した画像と同等の性能向上が得られた。
論文 参考訳(メタデータ) (2024-09-04T07:46:42Z) - Deep Image Harmonization with Learnable Augmentation [17.690945824240348]
小型データセットの照明多様性を向上し、調和性能を向上させるため、学習可能な拡張法を提案する。
SycoNetは、フォアグラウンドマスクとランダムベクトルで実画像を取り込んで、適切な色変換を学習し、この実画像のフォアグラウンドに適用して合成合成合成画像を生成する。
論文 参考訳(メタデータ) (2023-08-01T08:40:23Z) - Searching a Compact Architecture for Robust Multi-Exposure Image Fusion [55.37210629454589]
2つの大きなスタブリングブロックは、画素の不一致や非効率な推論など、開発を妨げる。
本研究では,高機能なマルチ露光画像融合のための自己アライメントとディテールリプレクションモジュールを取り入れたアーキテクチャ検索に基づくパラダイムを提案する。
提案手法は様々な競争方式より優れており、一般的なシナリオではPSNRが3.19%向上し、不整合シナリオでは23.5%向上した。
論文 参考訳(メタデータ) (2023-05-20T17:01:52Z) - FRIH: Fine-grained Region-aware Image Harmonization [49.420765789360836]
我々は,FRIH(Fentral-Aware Image Harmonization)のための新しいグローバルな2段階フレームワークを提案する。
提案アルゴリズムは,軽量モデルを用いて,iHarmony4データセット(PSNRは38.19dB)上で最高の性能を実現する。
論文 参考訳(メタデータ) (2022-05-13T04:50:26Z) - Spatial-Separated Curve Rendering Network for Efficient and
High-Resolution Image Harmonization [59.19214040221055]
本稿では,空間分離型曲線描画ネットワーク(S$2$CRNet)を提案する。
提案手法は従来の手法と比較して90%以上のパラメータを減少させる。
提案手法は,既存の手法よりも10ドル以上高速な高解像度画像をリアルタイムにスムーズに処理することができる。
論文 参考訳(メタデータ) (2021-09-13T07:20:16Z) - SSH: A Self-Supervised Framework for Image Harmonization [97.16345684998788]
我々は、編集せずに「自由」な自然画像だけで訓練できる新しい自己改善調和フレームワーク(SSH)を提案する。
提案したSSHは,基準指標,視覚的品質,主観的ユーザスタディにおいて,従来の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-08-15T19:51:33Z) - PointAR: Efficient Lighting Estimation for Mobile Augmented Reality [7.58114840374767]
本稿では,現代のモバイルデバイス上での動作に適した効率的な照明推定パイプラインを提案する。
PointARは、モバイルカメラから撮影した1枚のRGB-D画像と、その画像中の2D位置を取得し、2次球面高調波係数を推定する。
論文 参考訳(メタデータ) (2020-03-30T19:13:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。