論文の概要: MaskFlownet: Asymmetric Feature Matching with Learnable Occlusion Mask
- arxiv url: http://arxiv.org/abs/2003.10955v2
- Date: Wed, 8 Apr 2020 16:00:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 09:17:12.700682
- Title: MaskFlownet: Asymmetric Feature Matching with Learnable Occlusion Mask
- Title(参考訳): MaskFlownet:学習可能なOcclusion Maskと非対称な特徴マッチング
- Authors: Shengyu Zhao, Yilun Sheng, Yue Dong, Eric I-Chao Chang, Yan Xu
- Abstract要約: MaskFlownetは、MPI Sintel、KITTI 2012、2015ベンチマークで発表されたすべての光学フローメソッドを上回っている。
提案手法は, MPIシンテル, KITTI 2012, 2015 ベンチマークで公表された全光フロー法を超越した。
- 参考スコア(独自算出の注目度): 23.496206316161633
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature warping is a core technique in optical flow estimation; however, the
ambiguity caused by occluded areas during warping is a major problem that
remains unsolved. In this paper, we propose an asymmetric occlusion-aware
feature matching module, which can learn a rough occlusion mask that filters
useless (occluded) areas immediately after feature warping without any explicit
supervision. The proposed module can be easily integrated into end-to-end
network architectures and enjoys performance gains while introducing negligible
computational cost. The learned occlusion mask can be further fed into a
subsequent network cascade with dual feature pyramids with which we achieve
state-of-the-art performance. At the time of submission, our method, called
MaskFlownet, surpasses all published optical flow methods on the MPI Sintel,
KITTI 2012 and 2015 benchmarks. Code is available at
https://github.com/microsoft/MaskFlownet.
- Abstract(参考訳): 特徴ウォーピングは光学的流れ推定の核となる技術であるが、ウォーピング中のオクルード領域による曖昧さは未解決の大きな問題である。
そこで本稿では,不斉咬合対応型特徴マッチングモジュールを提案する。このモジュールは不規則な咬合マスクを学習でき,特徴乱れの直後に無意味な領域を明示的に監視することなくフィルターすることができる。
提案するモジュールはエンド・ツー・エンドのネットワークアーキテクチャに容易に統合でき、性能向上を享受でき、計算コストを無視できる。
学習したオクルージョンマスクは、その後の2つの特徴ピラミッドを持つネットワークカスケードにさらに供給され、最先端の性能を達成することができる。
提出時点では,MPIシンテル,KITTI 2012,2015のベンチマークにおいて,MskFlownetと呼ばれる全光フロー法を超越している。
コードはhttps://github.com/microsoft/MaskFlownet.comで入手できる。
関連論文リスト
- Triple Point Masking [49.39218611030084]
既存の3Dマスク学習手法は、限られたデータの下でパフォーマンスボトルネックに遭遇する。
我々は、マスク付きオートエンコーダの事前学習のためのスケーラブルなフレームワークとして、TPMと呼ばれるトリプルポイントマスキング方式を導入する。
大規模な実験により,提案したTPMを組み込んだ4つのベースラインが,下流タスクの総合的な性能向上を実現することが示された。
論文 参考訳(メタデータ) (2024-09-26T05:33:30Z) - ColorMAE: Exploring data-independent masking strategies in Masked AutoEncoders [53.3185750528969]
Masked AutoEncoders (MAE)は、堅牢な自己管理フレームワークとして登場した。
データに依存しないColorMAEという手法を導入し、ランダムノイズをフィルタすることで異なる二元マスクパターンを生成する。
ランダムマスキングと比較して,下流タスクにおける戦略の優位性を示す。
論文 参考訳(メタデータ) (2024-07-17T22:04:00Z) - A Masked Pruning Approach for Dimensionality Reduction in
Communication-Efficient Federated Learning Systems [11.639503711252663]
Federated Learning(FL)は、多数のノードにわたるモデルのトレーニング用に設計された、成長する機械学習(ML)パラダイムである。
本研究では, フラニング法とFL法を組み合わせることにより, 限界を克服する新しいアルゴリズムを開発した。
本研究は,MPFLの既存手法と比較して優れた性能を示す広範囲な実験的研究である。
論文 参考訳(メタデータ) (2023-12-06T20:29:23Z) - Secure Deep Learning-based Distributed Intelligence on Pocket-sized
Drones [75.80952211739185]
パームサイズのナノドロンはエッジノードの魅力的なクラスであるが、その限られた計算資源は大規模なディープラーニングモデルの実行を妨げている。
エッジフォッグ計算のパラダイムを採用することで、計算の一部をフォグにオフロードすることができるが、フォグノードや通信リンクが信頼できない場合、セキュリティ上の懸念が生じる。
ナノドローン上でランダムなサブネットワークを冗長に実行することにより,霧の計算を検証する分散エッジフォッグ実行方式を提案する。
論文 参考訳(メタデータ) (2023-07-04T08:29:41Z) - MixMask: Revisiting Masking Strategy for Siamese ConvNets [23.946791390657875]
この研究は、textbfMixMaskと呼ばれる新しいフィリングベースのマスキング手法を導入している。
提案手法は,消去された領域を別の画像からのコンテンツに置き換えることにより,従来のマスキング手法で見られる情報の枯渇を効果的に解消する。
我々は,線形探索,半教師付きおよび教師付きファインタニング,オブジェクト検出,セグメンテーションなどの領域におけるフレームワークの性能向上を実証的に検証した。
論文 参考訳(メタデータ) (2022-10-20T17:54:03Z) - Automatic Sparse Connectivity Learning for Neural Networks [4.875787559251317]
十分に設計されたスパースニューラルネットワークは、FLOPや計算資源を大幅に削減する可能性がある。
本研究では,スパース接続性学習(Sparse Connectivity Learning)という新しい自動プルーニング手法を提案する。
SCLによって訓練された深層学習モデルは、SOTAの人間設計および自動プルーニング手法を、疎性、正確性、FLOPs削減で上回っている。
論文 参考訳(メタデータ) (2022-01-13T15:12:48Z) - PFENet++: Boosting Few-shot Semantic Segmentation with the
Noise-filtered Context-aware Prior Mask [62.37727055343632]
「Few-Shot」のためのガイド機能強化ネットワークで提案された以前のマスクガイダンスを再考する。
本稿では,クエリ画像中のオブジェクトの配置を改善するために,近隣のセマンティックキューを活用するコンテキスト対応プリエントマスク(CAPM)を提案する。
我々は、不要な応答をスクリーニングするために、軽量ノイズ抑圧モジュール(NSM)を組み込むことにより、さらに一歩前進する。
論文 参考訳(メタデータ) (2021-09-28T15:07:43Z) - Image Inpainting by End-to-End Cascaded Refinement with Mask Awareness [66.55719330810547]
任意の欠落領域を塗りつぶすことは、様々なマスクされた領域で有効な特徴を学ぶことは非自明だから難しい。
符号化フェーズにおける欠落領域のマルチスケール特徴を学習する新しいマスク対応インペイントソリューションを提案する。
私たちのフレームワークは、3つの公開データセットに関する広範な実験を通じて定量的および定性的に検証されます。
論文 参考訳(メタデータ) (2021-04-28T13:17:47Z) - OccInpFlow: Occlusion-Inpainting Optical Flow Estimation by Unsupervised
Learning [29.802404790103665]
閉塞は、教師なしの光学フロー学習において必然的で重要な問題である。
OccInpFlowはOccclusion領域をフル活用するためのOccclusion-inpaintingフレームワークである。
本研究では,Flying Chairs,KITTI,MPI-Sintelなどの主要なフローベンチマークデータセットについて実験を行った。
論文 参考訳(メタデータ) (2020-06-30T10:01:32Z) - BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation [103.74690082121079]
本研究では,インスタンスレベルの情報とセマンティックな情報と,低レベルの微細な粒度を効果的に組み合わせることで,マスク予測の改善を実現する。
私たちの主な貢献は、トップダウンとボトムアップの両方のインスタンスセグメンテーションアプローチからインスピレーションを得たブレンダーモジュールです。
BlendMaskは、非常に少ないチャネルで、ピクセルあたりの高密度な位置感受性インスタンス機能を効果的に予測し、単一の畳み込み層で各インスタンスの注意マップを学習することができる。
論文 参考訳(メタデータ) (2020-01-02T03:30:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。