論文の概要: Video Semantic Segmentation with Distortion-Aware Feature Correction
- arxiv url: http://arxiv.org/abs/2006.10380v2
- Date: Thu, 12 Nov 2020 09:12:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 13:49:26.407333
- Title: Video Semantic Segmentation with Distortion-Aware Feature Correction
- Title(参考訳): 歪みを考慮した特徴補正によるビデオセマンティックセマンティックセグメンテーション
- Authors: Jiafan Zhuang, Zilei Wang, Bingke Wang
- Abstract要約: フレーム単位のイメージセグメンテーションは、計算コストが高いため、実際には受け入れられない。
本稿では,問題を緩和する歪み認識機能補正を提案する。
提案手法は,ビデオセマンティックセグメンテーションの精度を大幅に向上させることができる。
- 参考スコア(独自算出の注目度): 32.00672651803015
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video semantic segmentation is active in recent years benefited from the
great progress of image semantic segmentation. For such a task, the per-frame
image segmentation is generally unacceptable in practice due to high
computation cost. To tackle this issue, many works use the flow-based feature
propagation to reuse the features of previous frames. However, the optical flow
estimation inevitably suffers inaccuracy and then causes the propagated
features distorted. In this paper, we propose distortion-aware feature
correction to alleviate the issue, which improves video segmentation
performance by correcting distorted propagated features. To be specific, we
firstly propose to transfer distortion patterns from feature into image space
and conduct effective distortion map prediction. Benefited from the guidance of
distortion maps, we proposed Feature Correction Module (FCM) to rectify
propagated features in the distorted areas. Our proposed method can
significantly boost the accuracy of video semantic segmentation at a low price.
The extensive experimental results on Cityscapes and CamVid show that our
method outperforms the recent state-of-the-art methods.
- Abstract(参考訳): 近年の映像意味セマンティクスセグメンテーションは、画像セマンティクスセグメンテーションの大きな進歩から恩恵を受けている。
このようなタスクに対して、フレームごとのイメージセグメンテーションは一般的には高い計算コストのために受け入れられない。
この問題に取り組むために、多くの作品はフローベースの機能伝達を使って、前のフレームの特徴を再利用している。
しかし、光流量推定は必然的に不正確であり、伝播する特徴を歪ませる。
本稿では,歪み特性を補正することで映像セグメンテーション性能を向上させるために,歪み認識特徴の修正を提案する。
具体的には,まず特徴点からの歪みパターンを画像空間に転送し,効果的な歪みマップ予測を行うことを提案する。
歪みマップのガイダンスから得られた特徴補正モジュール (FCM) を用いて, 歪み領域の伝搬特性を補正する手法を提案する。
提案手法は,ビデオセマンティクスセグメンテーションの精度を低コストで大幅に向上させることができる。
cityscapes と camvid の広範な実験結果から,最近の最先端手法よりも優れた手法が得られた。
関連論文リスト
- Transparency Distortion Robustness for SOTA Image Segmentation Tasks [4.1119273264193685]
本研究では,空間的に異なる歪みを持つ既存のデータセットを合成的に拡張する手法を提案する。
実験により, これらの歪み効果は, 最先端セグメンテーションモデルの性能を低下させることが示された。
論文 参考訳(メタデータ) (2024-05-21T15:30:25Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Corner-to-Center Long-range Context Model for Efficient Learned Image
Compression [70.0411436929495]
学習された画像圧縮のフレームワークでは、コンテキストモデルは潜在表現間の依存関係をキャプチャする上で重要な役割を果たす。
本研究では,textbfCorner-to-Center 変換器を用いたコンテキストモデル (C$3$M) を提案する。
また,解析および合成変換における受容場を拡大するために,エンコーダ/デコーダのLong-range Crossing Attention Module (LCAM) を用いる。
論文 参考訳(メタデータ) (2023-11-29T21:40:28Z) - Fast Hybrid Image Retargeting [0.0]
本稿では,コンテント・アウェア・トリミングを用いて歪みを定量化し,抑制する手法を提案する。
我々の手法は,実行時間のごく一部で実行しながら,最近の手法より優れています。
論文 参考訳(メタデータ) (2022-03-25T11:46:06Z) - Correcting Face Distortion in Wide-Angle Videos [85.88898349347149]
これらの歪みを補正するビデオワープアルゴリズムを提案する。
私たちのキーとなるアイデアは、顔領域に局所的に立体投影を適用することです。
性能評価のために,焦点距離の広い広角ビデオデータセットを開発した。
論文 参考訳(メタデータ) (2021-11-18T21:28:17Z) - Wide-angle Image Rectification: A Survey [86.36118799330802]
広角画像は、基礎となるピンホールカメラモデルに反する歪みを含む。
これらの歪みを補正することを目的とした画像修正は、これらの問題を解決することができる。
本稿では、異なるアプローチで使用されるカメラモデルについて、詳細な説明と議論を行う。
次に,従来の幾何学に基づく画像修正手法と深層学習法の両方について検討する。
論文 参考訳(メタデータ) (2020-10-30T17:28:40Z) - Adaptive Debanding Filter [55.42929350861115]
バンディングアーティファクトは、写真やビデオフレームに階段のような色のバンドとして現れます。
後処理モジュールとして,コンテンツ適応型スムースなフィルタリングと拡張量子化を提案する。
実験結果から,提案した解離フィルタは,最先端の偽輪郭除去アルゴリズムよりも視覚的,定量的に優れていることがわかった。
論文 参考訳(メタデータ) (2020-09-22T20:44:20Z) - A Deep Ordinal Distortion Estimation Approach for Distortion Rectification [62.72089758481803]
より高精度なパラメータを効率良く得る新しい歪み補正手法を提案する。
本研究では, 局所言語関連推定ネットワークを設計し, 順序歪みを学習し, 現実的な歪み分布を近似する。
歪み情報の冗長性を考慮すると,本手法では歪み画像の一部のみを用いて順序方向の歪み推定を行う。
論文 参考訳(メタデータ) (2020-07-21T10:03:42Z) - UnRectDepthNet: Self-Supervised Monocular Depth Estimation using a
Generic Framework for Handling Common Camera Distortion Models [8.484676769284578]
本研究では,未修正単眼ビデオから深度,ユークリッド距離,および視覚計測を推定するための,汎用的な規模対応型自己教師パイプラインを提案する。
提案アルゴリズムは,KITTI修正データセットでさらに評価され,最先端の結果が得られた。
論文 参考訳(メタデータ) (2020-07-13T20:35:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。