論文の概要: Optimal Image Transport on Sparse Dictionaries
- arxiv url: http://arxiv.org/abs/2311.01984v1
- Date: Fri, 3 Nov 2023 15:37:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-06 13:46:49.237997
- Title: Optimal Image Transport on Sparse Dictionaries
- Title(参考訳): スパース辞書における最適画像転送
- Authors: Junqing Huang, Haihui Wang, Andreas Weiermann, Michael Ruzhansky
- Abstract要約: Sparse Representation (SR) とOptimal Transport (OT) を利用して、スパース辞書上の新しい最適な画像転送アルゴリズムを導出する。
画像色変換や芸術的スタイル変換など,画像から画像への変換作業における多目的性や多くの利点を実証し、写真リアルな変換効果を示す。
- 参考スコア(独自算出の注目度): 2.7855886538423182
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we derive a novel optimal image transport algorithm over
sparse dictionaries by taking advantage of Sparse Representation (SR) and
Optimal Transport (OT). Concisely, we design a unified optimization framework
in which the individual image features (color, textures, styles, etc.) are
encoded using sparse representation compactly, and an optimal transport plan is
then inferred between two learned dictionaries in accordance with the encoding
process. This paradigm gives rise to a simple but effective way for
simultaneous image representation and transformation, which is also empirically
solvable because of the moderate size of sparse coding and optimal transport
sub-problems. We demonstrate its versatility and many benefits to different
image-to-image translation tasks, in particular image color transform and
artistic style transfer, and show the plausible results for photo-realistic
transferred effects.
- Abstract(参考訳): 本稿では,Sparse Representation (SR) と Optimal Transport (OT) を利用して,スパース辞書上の新たな最適な画像伝達アルゴリズムを導出する。
簡潔に、個々の画像特徴(色、テクスチャ、スタイル等)をスパース表現を用いてコンパクトに符号化し、符号化過程に応じて2つの学習辞書間で最適な転送計画を推定する統一最適化フレームワークを設計する。
このパラダイムは、スパース符号化の適度な大きさと最適なトランスポートサブプロブレムのために経験的に解決可能な、画像表現と変換の単純かつ効果的な方法をもたらす。
画像色変換や芸術的スタイル変換など、画像間翻訳タスクの多目的性や多くの利点を実証し、写真リアルな変換効果に対する妥当な結果を示す。
関連論文リスト
- PixelShuffler: A Simple Image Translation Through Pixel Rearrangement [0.0]
スタイル転送は画像から画像への変換の応用として広く研究されており、ある画像の内容を他の画像のスタイルと組み合わせた画像の合成が目的である。
既存の最先端の手法は、しばしば高品質なスタイル転送を実現するために拡散モデルや言語モデルを含む複雑なニューラルネットワークに依存している。
本稿では,画像から画像への変換問題に対処する新たなピクセルシャッフル手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T22:08:41Z) - High-Resolution Image Translation Model Based on Grayscale Redefinition [3.6996084306161277]
本稿では,異なる領域間の画像翻訳のための革新的な手法を提案する。
高解像度画像翻訳タスクでは、グレースケール調整法を用いてピクセルレベルの変換を行う。
他のタスクでは、Pix2PixHDモデルを使い、粗大な生成装置、マルチスケールの判別器、画像翻訳性能を向上させるために損失の改善を行う。
論文 参考訳(メタデータ) (2024-03-26T12:21:47Z) - Optimize and Reduce: A Top-Down Approach for Image Vectorization [12.998637003026273]
高速かつドメインに依存しないベクトル化へのトップダウンアプローチであるOptimize & Reduce (O&R)を提案する。
O&Rの目的は、B'ezier曲線パラメータを反復的に最適化することで、入力画像のコンパクトな表現を実現することである。
提案手法はドメインに依存しないものであり,固定された形状に対する再現性および知覚的品質の両方において,既存の作品よりも優れることを示す。
論文 参考訳(メタデータ) (2023-12-18T16:41:03Z) - OT-Attack: Enhancing Adversarial Transferability of Vision-Language
Models via Optimal Transport Optimization [65.57380193070574]
視覚言語事前学習モデルは、マルチモーダル対逆例に対して脆弱である。
近年の研究では、データ拡張と画像-テキストのモーダル相互作用を活用することで、対向的な例の転送可能性を高めることが示されている。
本稿では,OT-Attack と呼ばれる最適輸送方式の敵攻撃を提案する。
論文 参考訳(メタデータ) (2023-12-07T16:16:50Z) - SCONE-GAN: Semantic Contrastive learning-based Generative Adversarial
Network for an end-to-end image translation [18.93434486338439]
SCONE-GANはリアルで多様な風景画像を生成する学習に有効であることが示されている。
より現実的で多様な画像生成のために、スタイル参照画像を導入します。
画像から画像への変換と屋外画像のスタイリングのための提案アルゴリズムを検証した。
論文 参考訳(メタデータ) (2023-11-07T10:29:16Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - PI-Trans: Parallel-ConvMLP and Implicit-Transformation Based GAN for
Cross-View Image Translation [84.97160975101718]
本稿では,新しい並列-ConvMLPモジュールと,複数のセマンティックレベルでのインプリシット変換モジュールで構成される,新しい生成逆ネットワークPI-Transを提案する。
PI-Transは、2つの挑戦的データセットの最先端手法と比較して、大きなマージンで最も質的で定量的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-07-09T10:35:44Z) - Marginal Contrastive Correspondence for Guided Image Generation [58.0605433671196]
例題に基づく画像翻訳は、条件入力と2つの異なる領域からの例題間の密接な対応を確立する。
既存の作業は、2つのドメインにまたがる機能的距離を最小化することで、ドメイン間の通信を暗黙的に構築する。
本稿では,MCL-Net(Marginal Contrastive Learning Network)の設計を行った。
論文 参考訳(メタデータ) (2022-04-01T13:55:44Z) - Unbalanced Feature Transport for Exemplar-based Image Translation [51.54421432912801]
本稿では,画像翻訳における条件入力とスタイルの類似点間の特徴的アライメントに最適なトランスポートを組み込んだ一般画像翻訳フレームワークを提案する。
本手法は,最先端技術と比較して質的,定量的に優れた画像翻訳を実現する。
論文 参考訳(メタデータ) (2021-06-19T12:07:48Z) - Spatially-Adaptive Pixelwise Networks for Fast Image Translation [57.359250882770525]
高速かつ効率的な画像-画像変換を目的とした新しいジェネレータアーキテクチャを提案する。
私たちはピクセルワイズネットワークを使用します。つまり、各ピクセルは他のピクセルとは独立して処理されます。
私たちのモデルは最先端のベースラインよりも最大18倍高速です。
論文 参考訳(メタデータ) (2020-12-05T10:02:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。