論文の概要: Scene restoration from scaffold occlusion using deep learning-based
methods
- arxiv url: http://arxiv.org/abs/2305.18810v1
- Date: Tue, 30 May 2023 07:53:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 17:37:54.045888
- Title: Scene restoration from scaffold occlusion using deep learning-based
methods
- Title(参考訳): 深層学習を用いた足場閉塞からのシーン復元
- Authors: Yuexiong Ding, Muyang Liu, Xiaowei Luo
- Abstract要約: 本研究では,足場閉塞から建設シーンを復元するための画素レベルのセグメンテーションと画像インペインティングを組み合わせた新しい2段階手法を提案する。
ラベル付きデータ不足に対処するため,ラベル付きデータのみに基づく低コストなデータ合成手法を開発した。
合成試験データを用いた実験により, 足場セグメンテーションと82%以上の構造的類似性に対して, 92%の平均交叉が達成された。
- 参考スコア(独自算出の注目度): 1.3106063755117399
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The occlusion issues of computer vision (CV) applications in construction
have attracted significant attention, especially those caused by the
wide-coverage, crisscrossed, and immovable scaffold. Intuitively, removing the
scaffold and restoring the occluded visual information can provide CV agents
with clearer site views and thus help them better understand the construction
scenes. Therefore, this study proposes a novel two-step method combining
pixel-level segmentation and image inpainting for restoring construction scenes
from scaffold occlusion. A low-cost data synthesis method based only on
unlabeled data is developed to address the shortage dilemma of labeled data.
Experiments on the synthesized test data show that the proposed method achieves
performances of 92% mean intersection over union (MIoU) for scaffold
segmentation and over 82% structural similarity (SSIM) for scene restoration
from scaffold occlusion.
- Abstract(参考訳): 建設におけるコンピュータビジョン(cv)応用の閉塞問題は、特に広い被覆、断裂、移動不能な足場によって引き起こされる多くの注目を集めている。
直感的には、足場を取り除き、隠蔽された視覚情報を復元することで、CVエージェントにより明確なサイトビューを提供し、建設シーンの理解を深めることができる。
そこで本研究では,足場咬合から構成場面を復元するための画素レベルセグメンテーションとイメージインパインティングを組み合わせた2段階の手法を提案する。
ラベル付きデータの不足ジレンマに対処するため,ラベル付きデータのみに基づく低コストなデータ合成手法を開発した。
合成試験データを用いた実験の結果,提案手法は,足場セグメンテーションのための平均交点(MIoU)と足場閉塞からのシーン復元のための82%以上の構造類似性(SSIM)を達成できた。
関連論文リスト
- Feature Completion Transformer for Occluded Person Re-identification [25.159974510754992]
咬合者の再同定(Re-ID)は,咬合者の破壊による課題である。
特徴空間に隠された部分の意味情報を暗黙的に補完する特徴補完変換器(FCFormer)を提案する。
FCFormerは優れたパフォーマンスを実現し、隠蔽されたデータセットに対してかなりのマージンで最先端の手法を上回ります。
論文 参考訳(メタデータ) (2023-03-03T01:12:57Z) - Dynamic Feature Pruning and Consolidation for Occluded Person
Re-Identification [21.006680330530852]
本研究では, 明示的な人間の構造解析を回避するために, 機能解析・統合(FPC)フレームワークを提案する。
フレームワークは主にスパースエンコーダ、マルチビュー機能mathcingモジュール、フィーチャーコンソリデーションデコーダで構成されている。
提案手法は,Occluded-Dukeデータセットにおいて,少なくとも8.6% mAPと6.0% Rank-1の精度で最新結果より優れる。
論文 参考訳(メタデータ) (2022-11-27T06:18:40Z) - Joint reconstruction-segmentation on graphs [0.7829352305480285]
本稿では,グラフベースセグメンテーション手法を用いた共同再建分割法を提案する。
合併症は、関係する行列の大きいため発生し、これらの合併症がどのように管理されるかを示す。
本手法を従来のグラフベースセグメンテーション文献に精通した2頭の牛の画像の歪曲バージョンに適用する。
論文 参考訳(メタデータ) (2022-08-11T14:01:38Z) - OCTAve: 2D en face Optical Coherence Tomography Angiography Vessel
Segmentation in Weakly-Supervised Learning with Locality Augmentation [14.322349196837209]
画素レベルのアノテーションを自動化するために,スクリブルベースの弱教師付き学習手法を提案する。
OCTAveと呼ばれる本提案手法は,スクリブルアノテートによる弱教師付き学習と,敵意と自己監督型自己監督型深層学習を組み合わせたものである。
論文 参考訳(メタデータ) (2022-07-25T14:40:56Z) - Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised
Semantic Segmentation and Localization [98.46318529630109]
画像分解をグラフ分割問題として再フレーミングすることで,従来のスペクトル分割法から着想を得た。
これらの固有ベクトルはすでにイメージを意味のあるセグメントに分解しており、シーン内のオブジェクトのローカライズに容易に利用できる。
データセットにまたがるこれらのセグメントに関連する機能をクラスタ化することで、明確に定義された、名前付き可能なリージョンを得ることができる。
論文 参考訳(メタデータ) (2022-05-16T17:47:44Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - Holistic Guidance for Occluded Person Re-Identification [7.662745552551165]
実世界のビデオ監視アプリケーションでは、人物の再識別(ReID)は、閉塞や検出エラーの影響に悩まされる。
個人識別ラベルにのみ依存するHG(Holistic Guidance)手法を提案する。
提案手法は, 包括的(非包括的)標本と, 包括的(非包括的)標本の包括的(包括的)な距離(DCD)分布を一致させることにより, この問題に対処する。
これに加えて、共同生成-識別的バックボーンは、デノナイジングオートエンコーダで訓練され、システムが制御される。
論文 参考訳(メタデータ) (2021-04-13T21:50:29Z) - Towards Unbiased COVID-19 Lesion Localisation and Segmentation via
Weakly Supervised Learning [66.36706284671291]
本研究では,画像レベルラベルのみに監視されたデータ駆動型フレームワークを提案する。
このフレームワークは、生成する対向ネットワークと病変特異的デコーダの助けを借りて、原画像から潜在的な病変を明示的に分離することができる。
論文 参考訳(メタデータ) (2021-03-01T06:05:49Z) - Gradient-Induced Co-Saliency Detection [81.54194063218216]
Co-SOD(Co-saliency Detection)は、一般的な唾液前景を関連画像のグループに分割することを目的としている。
本稿では,人間の行動にインスパイアされた,勾配誘導型共分散検出法を提案する。
論文 参考訳(メタデータ) (2020-04-28T08:40:55Z) - Image Co-skeletonization via Co-segmentation [102.59781674888657]
我々は,新しい共同処理の話題である画像コスケルトン化を提案する。
単一の自然な画像におけるオブジェクトのスケルトン化は、オブジェクトに関する事前の知識がほとんどないため、難しい問題である。
本稿では,コ・スケルトン化とコ・セグメンテーション・タスクの結合フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-12T09:35:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。