論文の概要: FlowCaps: Optical Flow Estimation with Capsule Networks For Action
Recognition
- arxiv url: http://arxiv.org/abs/2011.03958v1
- Date: Sun, 8 Nov 2020 11:35:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 08:38:23.038330
- Title: FlowCaps: Optical Flow Estimation with Capsule Networks For Action
Recognition
- Title(参考訳): FlowCaps: アクション認識のためのカプセルネットワークによる光フロー推定
- Authors: Vinoj Jayasundara, Debaditya Roy, Basura Fernando
- Abstract要約: Capsule Networks(CapsNets)は最近、ほとんどのコンピュータビジョンタスクに優れたことを約束している。
本稿では,CapsNetをベースとしたFlowCapsアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 22.712379018181398
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Capsule networks (CapsNets) have recently shown promise to excel in most
computer vision tasks, especially pertaining to scene understanding. In this
paper, we explore CapsNet's capabilities in optical flow estimation, a task at
which convolutional neural networks (CNNs) have already outperformed other
approaches. We propose a CapsNet-based architecture, termed FlowCaps, which
attempts to a) achieve better correspondence matching via finer-grained,
motion-specific, and more-interpretable encoding crucial for optical flow
estimation, b) perform better-generalizable optical flow estimation, c) utilize
lesser ground truth data, and d) significantly reduce the computational
complexity in achieving good performance, in comparison to its
CNN-counterparts.
- Abstract(参考訳): カプセルネットワーク(CapsNets)は、最近、ほとんどのコンピュータビジョンタスク、特にシーン理解に関連することを約束している。
本稿では、畳み込みニューラルネットワーク(CNN)がすでに他のアプローチよりも優れている課題である光フロー推定におけるCapsNetの機能について検討する。
本稿では,FlowCapsと呼ばれるCapsNetベースのアーキテクチャを提案する。
a) 光流量推定に不可欠な細粒度、運動特化及びより解釈可能な符号化によるより良い対応マッチングを実現すること。
b)より一般化された光流量推定を行う。
c) より少ない真理データを利用して、
d) CNNカウンタ部と比較して, 性能向上における計算複雑性を著しく低減する。
関連論文リスト
- Context-Aware Iteration Policy Network for Efficient Optical Flow
Estimation [19.077966606237897]
我々は,効率的な光フロー推定のためのコンテキスト認識反復ポリシーネットワークを開発した。
Sintel/KITTIデータセットのFLOPを約40%/20%削減しながら性能を維持できる。
論文 参考訳(メタデータ) (2023-12-12T11:27:13Z) - FlowX: Towards Explainable Graph Neural Networks via Message Flows [59.025023020402365]
グラフニューラルネットワーク(GNN)の動作メカニズム解明へのステップとして,その説明可能性について検討する。
本稿では,重要なメッセージフローを識別してGNNを説明するために,FlowXと呼ばれる新しい手法を提案する。
そこで我々は,多様な説明対象に向けて,フロースコアを学習するための情報制御学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-26T22:48:15Z) - Enabling Capsule Networks at the Edge through Approximate Softmax and
Squash Operations [11.82717649039321]
本稿では,ソフトマックスやスカッシュのような複素演算の近似変種を設計するために近似計算を活用することを提案する。
本実験では,ASIC設計フローで実装した設計の面積,消費電力,臨界経路遅延のトレードオフを評価する。
論文 参考訳(メタデータ) (2022-06-21T08:57:16Z) - A Lightweight, Efficient and Explainable-by-Design Convolutional Neural
Network for Internet Traffic Classification [9.365794791156972]
本稿では、インターネットトラフィック分類のための新しい軽量・効率的・eXplainable-by-design畳み込みニューラルネットワーク(LEXNet)を提案する。
LEXNetは(軽量で効率の良い目的のために)新しい残留ブロックと(説明可能性のために)プロトタイプ層に依存している。
商用グレードのデータセットに基づいて、LEXNetは最先端のニューラルネットワークと同じ精度を維持することに成功した。
論文 参考訳(メタデータ) (2022-02-11T10:21:34Z) - GMFlow: Learning Optical Flow via Global Matching [124.57850500778277]
光フロー推定学習のためのGMFlowフレームワークを提案する。
機能拡張のためのカスタマイズトランスフォーマー、グローバル機能マッチングのための相関層とソフトマックス層、フロー伝搬のための自己保持層である。
我々の新しいフレームワークは、挑戦的なSintelベンチマークにおいて、32項目RAFTのパフォーマンスより優れています。
論文 参考訳(メタデータ) (2021-11-26T18:59:56Z) - Semi-supervised Network Embedding with Differentiable Deep Quantisation [81.49184987430333]
我々はネットワーク埋め込みのための微分可能な量子化法であるd-SNEQを開発した。
d-SNEQは、学習された量子化符号にリッチな高次情報を与えるためにランク損失を組み込む。
トレーニング済みの埋め込みのサイズを大幅に圧縮できるため、ストレージのフットプリントが減少し、検索速度が向上する。
論文 参考訳(メタデータ) (2021-08-20T11:53:05Z) - OAS-Net: Occlusion Aware Sampling Network for Accurate Optical Flow [4.42249337449125]
既存のディープネットワークは、ピラミッドの粗大なパラダイムを主に利用することで満足な結果を得た。
我々は,OAS-Netという軽量で効率的な光フローネットワークを提案し,正確な光フローを実現する。
SintelとKITTIデータセットの実験は、提案手法の有効性を実証している。
論文 参考訳(メタデータ) (2021-01-31T03:30:31Z) - FDFlowNet: Fast Optical Flow Estimation using a Deep Lightweight Network [12.249680550252327]
我々はFDFlowNet(fast Deep Flownet)と呼ばれるリアルタイム光フロー推定のための軽量で効果的なモデルを提案する。
我々は、PWC-Netの約2倍の速度で、挑戦的なKITTIとSintelベンチマークにおいて、より良い、あるいは同様の精度を達成する。
論文 参考訳(メタデータ) (2020-06-22T14:01:01Z) - Network Adjustment: Channel Search Guided by FLOPs Utilization Ratio [101.84651388520584]
本稿では,ネットワークの精度をFLOPの関数として考慮した,ネットワーク調整という新しいフレームワークを提案する。
標準画像分類データセットと幅広いベースネットワークの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2020-04-06T15:51:00Z) - What Deep CNNs Benefit from Global Covariance Pooling: An Optimization
Perspective [102.37204254403038]
我々は最適化の観点から、GCPの深いCNNのメリットを理解する試みを行っている。
GCPは最適化のランドスケープをよりスムーズにし、勾配をより予測できることを示す。
多様なタスクに対して様々な深部CNNモデルを用いて広範な実験を行い,その結果を強く支持する。
論文 参考訳(メタデータ) (2020-03-25T07:00:45Z) - ReActNet: Towards Precise Binary Neural Network with Generalized
Activation Functions [76.05981545084738]
本稿では,新たな計算コストを伴わずに,実数値ネットワークからの精度ギャップを埋めるため,バイナリネットワークを強化するためのいくつかのアイデアを提案する。
まず,パラメータフリーのショートカットを用いて,コンパクトな実数値ネットワークを修正・バイナライズすることで,ベースラインネットワークを構築する。
提案したReActNetはすべての最先端技術よりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2020-03-07T02:12:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。