論文の概要: POBEVM: Real-time Video Matting via Progressively Optimize the Target
Body and Edge
- arxiv url: http://arxiv.org/abs/2402.09731v1
- Date: Thu, 15 Feb 2024 06:08:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-16 16:53:14.893716
- Title: POBEVM: Real-time Video Matting via Progressively Optimize the Target
Body and Edge
- Title(参考訳): POBEVM: ターゲットとエッジを段階的に最適化するリアルタイムビデオマッチング
- Authors: Jianming Xian
- Abstract要約: 本研究では,リアルタイムなトリマップフリーなビデオマッチング手法を提案する。
提案手法は,Distinctions-646 (D646) と VideoMatte240K(VM) の両方のデータセット上で,事前のトリマップフリーなマッチング手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep convolutional neural networks (CNNs) based approaches have achieved
great performance in video matting. Many of these methods can produce accurate
alpha estimation for the target body but typically yield fuzzy or incorrect
target edges. This is usually caused by the following reasons: 1) The current
methods always treat the target body and edge indiscriminately; 2) Target body
dominates the whole target with only a tiny proportion target edge. For the
first problem, we propose a CNN-based module that separately optimizes the
matting target body and edge (SOBE). And on this basis, we introduce a
real-time, trimap-free video matting method via progressively optimizing the
matting target body and edge (POBEVM) that is much lighter than previous
approaches and achieves significant improvements in the predicted target edge.
For the second problem, we propose an Edge-L1-Loss (ELL) function that enforces
our network on the matting target edge. Experiments demonstrate our method
outperforms prior trimap-free matting methods on both Distinctions-646 (D646)
and VideoMatte240K(VM) dataset, especially in edge optimization.
- Abstract(参考訳): 深層畳み込みニューラルネットワーク(CNN)ベースのアプローチは、ビデオマッティングにおいて大きなパフォーマンスを実現している。
これらの手法の多くは、ターゲットボディの正確なアルファ推定を生成することができるが、典型的にはファジィまたは不正なターゲットエッジを生成する。
これは通常以下の理由によって引き起こされる。
1) 現在の方法は,常に対象体及びエッジを無差別に扱う。
2) ターゲット本体は, ターゲットエッジの比率が小さいだけで, ターゲット全体を支配する。
第1の課題として,マッチング対象体とエッジ(SOBE)を別々に最適化するCNNベースのモジュールを提案する。
そこで本研究では,従来のアプローチよりもずっと軽量で,予測された目標エッジの大幅な改善を実現するため,マッティング対象体とエッジ(pobevm)を段階的に最適化することで,リアルタイムでトリマップフリーなビデオマッティング手法を提案する。
2つ目の問題として,ネットワークをマッチング対象エッジに強制する Edge-L1-Loss (ELL) 関数を提案する。
実験では,先行するtrimap-free matting法をd646とvideomatte240k(vm)の2つのデータセット,特にエッジ最適化において上回っていることを示す。
関連論文リスト
- Learning to utilize image second-order derivative information for crisp edge detection [13.848361661516595]
エッジ検出はコンピュータビジョンの基本課題である。
最近のトップパフォーマンスエッジ検出手法は、厚くノイズの多いエッジラインを生成する傾向にある。
本稿では,モデルが真のエッジピクセルを正確に検出するのに役立つ2階微分型マルチスケールコンテキスト拡張モジュール(SDMCM)を提案する。
また、不均衡分布問題を軽減するために、ハイブリッド焦点損失関数(HFL)を構築した。
最後に、エッジ検出のためのSDMCMとBRMに基づくLUS-NetというU字型ネットワークを提案する。
論文 参考訳(メタデータ) (2024-06-09T13:25:02Z) - Neural Gradient Learning and Optimization for Oriented Point Normal
Estimation [53.611206368815125]
本研究では,3次元点雲から勾配ベクトルを一貫した向きで学習し,正規推定を行うためのディープラーニング手法を提案する。
局所平面幾何に基づいて角距離場を学習し、粗勾配ベクトルを洗練する。
本手法は,局所特徴記述の精度と能力の一般化を図りながら,グローバル勾配近似を効率的に行う。
論文 参考訳(メタデータ) (2023-09-17T08:35:11Z) - Efficient first-order predictor-corrector multiple objective
optimization for fair misinformation detection [5.139559672771439]
多重目的最適化(MOO)は、複数の競合する目的を同時に最適化することを目的としており、機械学習において重要な応用を見出した。
本稿では,線形にしかスケールしないガウスニュートン近似を提案し,イテレーション毎に一階内積しか必要としない。
このイノベーションは、大規模ネットワークで予測器のコレクタを可能にする。
論文 参考訳(メタデータ) (2022-09-15T12:32:15Z) - EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for
Mobile Vision Applications [68.35683849098105]
入力テンソルを複数のチャネルグループに分割するSDTAエンコーダを導入する。
1.3Mパラメータを持つEdgeNeXtモデルでは、ImageNet-1Kで71.2%のTop-1精度を実現している。
パラメータ5.6MのEdgeNeXtモデルでは、ImageNet-1Kで79.4%のTop-1精度を実現しています。
論文 参考訳(メタデータ) (2022-06-21T17:59:56Z) - A Mini-Block Natural Gradient Method for Deep Neural Networks [12.48022619079224]
我々は、近似自然勾配法、ミニブロックフィッシャー(MBF)の収束性を提案し、解析する。
提案手法では,一般化の並列性を利用して,各層内の多数の行列を効率的に処理する。
論文 参考訳(メタデータ) (2022-02-08T20:01:48Z) - Targeted Attack against Deep Neural Networks via Flipping Limited Weight
Bits [55.740716446995805]
我々は,悪質な目的で展開段階におけるモデルパラメータを修飾する新しい攻撃パラダイムについて検討する。
私たちのゴールは、特定のサンプルをサンプル修正なしでターゲットクラスに誤分類することです。
整数プログラミングにおける最新の手法を利用することで、このBIP問題を連続最適化問題として等価に再構成する。
論文 参考訳(メタデータ) (2021-02-21T03:13:27Z) - Patch-wise++ Perturbation for Adversarial Targeted Attacks [132.58673733817838]
トランスファビリティの高い対比例の作成を目的としたパッチワイズ反復法(PIM)を提案する。
具体的には、各イテレーションのステップサイズに増幅係数を導入し、$epsilon$-constraintをオーバーフローする1ピクセルの全体的な勾配が、その周辺領域に適切に割り当てられる。
現在の攻撃方法と比較して、防御モデルでは35.9%、通常訓練されたモデルでは32.7%、成功率を大幅に向上させた。
論文 参考訳(メタデータ) (2020-12-31T08:40:42Z) - Infrared target tracking based on proximal robust principal component
analysis method [12.560236015149965]
赤外線標的追跡は、民間と軍事の両方において重要な役割を担っている。
赤外線シーケンスのためのロバストで高精度なトラッカーを設計する際の主な課題は、重複、閉塞、外観変化である。
本稿では、近位頑健な主成分分析法に基づく赤外線ターゲットトラッカーを提案する。
論文 参考訳(メタデータ) (2020-10-11T14:54:00Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z) - Learning Fast and Robust Target Models for Video Object Segmentation [83.3382606349118]
ビデオオブジェクトセグメンテーション(VOS)は、ターゲットオブジェクトを定義する初期マスクがテスト時にのみ与えられるため、非常に難しい問題である。
それまでのほとんどの場合、第1フレーム上のファイン・チューン・セグメンテーション・ネットワークにアプローチし、非現実的なフレームレートとオーバーフィッティングのリスクをもたらす。
本稿では,2つのネットワークコンポーネントからなる新しいVOSアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T21:58:06Z) - CNNTOP: a CNN-based Trajectory Owner Prediction Method [1.3793594968500604]
軌道所有者予測は、パーソナライズされたレコメンデーションや都市計画など、多くの応用の基盤となっている。
既存の手法は主にRNNを用いて軌道を意味的にモデル化する。
CNNに基づくトラジェクトリオーナ予測(CNNTOP)手法を提案する。
論文 参考訳(メタデータ) (2020-01-05T07:58:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。