論文の概要: Unsupervised Enhancement of Real-World Depth Images Using Tri-Cycle GAN
- arxiv url: http://arxiv.org/abs/2001.03779v1
- Date: Sat, 11 Jan 2020 18:19:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-12 09:36:25.165333
- Title: Unsupervised Enhancement of Real-World Depth Images Using Tri-Cycle GAN
- Title(参考訳): 三サイクルGANを用いた実世界深度画像の教師なし強調
- Authors: Alona Baruhov and Guy Gilboa
- Abstract要約: 低コストセンサで取得した高分解能で現実世界の深度画像の高精細化を目指す。
低品質センサドメインと高品質センサドメインとの教師なしドメイン翻訳として,クリーンな地上構造が欠如している場合に,その課題にアプローチする。
我々は,この課題に高度に熟練したサイクロンGANを用いているが,この場合,性能が良くない。
- 参考スコア(独自算出の注目度): 8.477619837043214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Low quality depth poses a considerable challenge to computer vision
algorithms. In this work we aim to enhance highly degraded, real-world depth
images acquired by a low-cost sensor, for which an analytical noise model is
unavailable. In the absence of clean ground-truth, we approach the task as an
unsupervised domain-translation between the low-quality sensor domain and a
high-quality sensor domain, represented using two unpaired training sets. We
employ the highly-successful Cycle-GAN to this task, but find it to perform
poorly in this case. Identifying the sources of the failure, we introduce
several modifications to the framework, including a larger generator
architecture, depth-specific losses that take into account missing pixels, and
a novel Tri-Cycle loss which promotes information-preservation while addressing
the asymmetry between the domains. We show that the resulting framework
dramatically improves over the original Cycle-GAN both visually and
quantitatively, extending its applicability to more challenging and asymmetric
translation tasks.
- Abstract(参考訳): 低品質の深度はコンピュータビジョンアルゴリズムにかなりの課題をもたらす。
本研究では,低コストセンサが取得した高分解能実空間深度画像の高分解能化を目指しており,分析ノイズモデルが利用できない。
クリーンな接地構造がなければ,2つの未経験トレーニングセットを用いて,低品質センサドメインと高品質センサドメインとの教師なしドメイン翻訳として,タスクにアプローチする。
我々は,この課題に高度に熟練したサイクロンGANを用いているが,この場合,性能が良くない。
故障の原因を同定し、より大きなジェネレータアーキテクチャ、欠落画素を考慮した奥行き特異的損失、ドメイン間の非対称性に対処しながら情報保存を促進する新しいトリサイクル損失など、フレームワークにいくつかの変更を加える。
その結果,元のCycle-GANを視覚的かつ定量的に改善し,その適用性をより困難で非対称な翻訳タスクにまで拡張した。
関連論文リスト
- Robust Disaster Assessment from Aerial Imagery Using Text-to-Image Synthetic Data [66.49494950674402]
航空画像からの損傷評価のタスクのための大規模合成監視を作成する際に,新たなテキスト・画像生成モデルを活用する。
低リソース領域から何千ものポストディスアスター画像を生成するために、効率的でスケーラブルなパイプラインを構築しています。
我々は,xBDおよびSKAI画像のクロスジオグラフィー領域転送設定におけるフレームワークの強度を,単一ソースとマルチソースの両方で検証する。
論文 参考訳(メタデータ) (2024-05-22T16:07:05Z) - GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - Multi-Sensor Diffusion-Driven Optical Image Translation for Large-Scale Applications [3.4085512042262374]
本稿では,大規模な低空間分解能画像を,異なる光学センサから高分解能に高分解能に分解する手法を提案する。
我々の貢献は、大規模な画像翻訳の課題に対処するために欠かせない新しい前方および逆拡散過程にある。
その結果、一貫したパッチを持つ高解像度の大規模画像となり、異種変化検出などのアプリケーションに不可欠である。
論文 参考訳(メタデータ) (2024-04-17T10:49:00Z) - ReContrast: Domain-Specific Anomaly Detection via Contrastive
Reconstruction [29.370142078092375]
殆どの高度な教師なし異常検出(UAD)手法は、大規模データセットで事前訓練された冷凍エンコーダネットワークの特徴表現をモデル化することに依存している。
本稿では,事前学習した画像領域に対するバイアスを低減するために,ネットワーク全体を最適化する新しい疫学的UAD手法であるReContrastを提案する。
2つの一般的な産業欠陥検出ベンチマークと3つの医用画像UADタスクで実験を行い、現在の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-05T05:21:15Z) - Manifold Constraint Regularization for Remote Sensing Image Generation [34.68714863219855]
GAN(Generative Adversarial Networks)は、リモートセンシング領域における顕著な成果を示している。
本稿では,リモートセンシング画像の特徴を分析し,多様体制約正規化を提案する。
論文 参考訳(メタデータ) (2023-05-31T02:35:41Z) - Towards Domain Generalization for Multi-view 3D Object Detection in
Bird-Eye-View [11.958753088613637]
まず,MV3D-Detタスクにおける領域ギャップの原因を解析する。
頑健な深度予測を得るために,カメラの内在パラメータから深度推定を分離する手法を提案する。
焦点長の値を変更して複数の擬似ドメインを作成し、敵の訓練損失を発生させ、特徴表現をよりドメインに依存しないものにするよう促す。
論文 参考訳(メタデータ) (2023-03-03T02:59:13Z) - Adversarial Domain Feature Adaptation for Bronchoscopic Depth Estimation [111.89519571205778]
そこで本研究では,深度推定のためのドメイン適応手法を提案する。
提案する2段階構造は,まず,ラベル付き合成画像を用いた深度推定ネットワークを教師付きで訓練する。
実験の結果,提案手法は実画像上でのネットワーク性能をかなりの差で向上させることがわかった。
論文 参考訳(メタデータ) (2021-09-24T08:11:34Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Unsupervised Deep Image Stitching: Reconstructing Stitched Features to
Images [38.95610086309832]
本稿では,教師なしの粗い画像アライメントと教師なしの画像再構成の2段階からなる,教師なしの深層画像ストレッチフレームワークを提案する。
第1段階では、大規模なベースラインシーンに適した教師なしホモグラフィネットワークを制約するアブレーションに基づく損失を設計する。
第2段階では、画素レベルの不一致を一定程度特徴レベルで除去できるという知見に動機付けられ、特徴から画素へのアーティファクトを除去するための教師なし画像再構成ネットワークを設計する。
論文 参考訳(メタデータ) (2021-06-24T09:45:36Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。