論文の概要: Multi-encoder Network for Parameter Reduction of a Kernel-based
Interpolation Architecture
- arxiv url: http://arxiv.org/abs/2205.06723v1
- Date: Fri, 13 May 2022 16:02:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-16 13:39:29.254318
- Title: Multi-encoder Network for Parameter Reduction of a Kernel-based
Interpolation Architecture
- Title(参考訳): カーネル型補間アーキテクチャのパラメータ削減のためのマルチエンコーダネットワーク
- Authors: Issa Khalifeh, Marc Gorriz Blanch, Ebroul Izquierdo, Marta Mrak
- Abstract要約: 畳み込みニューラルネットワーク(CNN)はこの分野での最近の進歩の最前線にある。
これらのネットワークの多くは多くのパラメータを必要とし、多くのパラメータは重い重荷を意味する。
本稿では,一般的なフローレスカーネルネットワークにおけるパラメータ削減手法を提案する。
- 参考スコア(独自算出の注目度): 10.08097582267397
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Video frame interpolation involves the synthesis of new frames from existing
ones. Convolutional neural networks (CNNs) have been at the forefront of the
recent advances in this field. One popular CNN-based approach involves the
application of generated kernels to the input frames to obtain an interpolated
frame. Despite all the benefits interpolation methods offer, many of these
networks require a lot of parameters, with more parameters meaning a heavier
computational burden. Reducing the size of the model typically impacts
performance negatively. This paper presents a method for parameter reduction
for a popular flow-less kernel-based network (Adaptive Collaboration of Flows).
Through our technique of removing the layers that require the most parameters
and replacing them with smaller encoders, we reduce the number of parameters of
the network and even achieve better performance compared to the original
method. This is achieved by deploying rotation to force each individual encoder
to learn different features from the input images. Ablations are conducted to
justify design choices and an evaluation on how our method performs on
full-length videos is presented.
- Abstract(参考訳): ビデオフレーム補間は、既存のフレームから新しいフレームを合成する。
畳み込みニューラルネットワーク(cnns)は、この分野における最近の進歩の最前線にある。
一般的なCNNベースのアプローチの1つは、インプットフレームに生成したカーネルを適用して補間フレームを得ることである。
補間法がもたらすすべての利点にもかかわらず、これらのネットワークの多くは多くのパラメータを必要とする。
モデルのサイズを減らすことは一般的にパフォーマンスに悪影響を及ぼす。
本稿では,一般的なフローレスカーネルネットワーク(Adaptive Collaboration of Flows)のパラメータ削減手法を提案する。
本手法では,最も多くのパラメータを必要とするレイヤを除去し,より小さなエンコーダで置き換えることにより,ネットワークのパラメータ数を削減し,元の手法よりも優れた性能を実現する。
これは、各エンコーダに入力画像から異なる特徴を学習させるローテーションをデプロイすることで実現される。
設計選択を正当化するためにアブレーションを行い,本手法がフル長ビデオでどのように動作するかを評価する。
関連論文リスト
- Boosting Neural Representations for Videos with a Conditional Decoder [28.073607937396552]
Inlicit Neural representations (INRs) は、ビデオストレージと処理において有望なアプローチとして登場した。
本稿では,現在の暗黙的ビデオ表現手法のための普遍的なブースティングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-28T08:32:19Z) - Differentiable Resolution Compression and Alignment for Efficient Video
Classification and Retrieval [16.497758750494537]
本稿では,高解像度圧縮・アライメント機構を備えた効率的な映像表現ネットワークを提案する。
我々は、相性および非相性フレーム特徴を符号化するために、微分可能なコンテキスト対応圧縮モジュールを利用する。
我々は,異なる解像度のフレーム特徴間のグローバル時間相関を捉えるために,新しい解像度変換器層を導入する。
論文 参考訳(メタデータ) (2023-09-15T05:31:53Z) - VNVC: A Versatile Neural Video Coding Framework for Efficient
Human-Machine Vision [59.632286735304156]
コード化された表現をピクセルに復号することなく直接拡張・解析することがより効率的である。
再構成と直接拡張/分析の両方をサポートするために,コンパクト表現の学習を目標とする汎用型ニューラルビデオ符号化(VNVC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T03:04:57Z) - Progressive Motion Context Refine Network for Efficient Video Frame
Interpolation [10.369068266836154]
フローベースフレーム法は、まず、ターゲットフレームと入力フレームの間の光フローをモデル化し、次いで、ターゲットフレーム生成のための合成ネットワークを構築することで、大きな成功を収めた。
本稿では,動き場と画像コンテキストを協調的に予測し,高い効率性を実現するための新しいプログレッシブ・モーション・コンテキスト・リファイン・ネットワーク(PMCRNet)を提案する。
複数のベンチマーク実験により、提案手法は好意的かつ定量的な結果を得るだけでなく、モデルのサイズや実行時間を大幅に短縮することが示された。
論文 参考訳(メタデータ) (2022-11-11T06:29:03Z) - Neighbor Correspondence Matching for Flow-based Video Frame Synthesis [90.14161060260012]
フローベースフレーム合成のための近傍対応マッチング(NCM)アルゴリズムを提案する。
NCMは現在のフレームに依存しない方法で実行され、各ピクセルの時空間近傍でマルチスケールの対応を確立する。
粗いスケールのモジュールは、近隣の対応を利用して大きな動きを捉えるように設計されている。
論文 参考訳(メタデータ) (2022-07-14T09:17:00Z) - Improved CNN-based Learning of Interpolation Filters for Low-Complexity
Inter Prediction in Video Coding [5.46121027847413]
本稿では,ニューラルネットワークを用いた新しい予測手法を提案する。
新たなトレーニングフレームワークにより、各ネットワークブランチは特定の分数シフトに類似することができる。
Versatile Video Coding (VVC)テストモデルで実装されると、0.77%、1.27%、および2.25%のBDレートの節約が達成される。
論文 参考訳(メタデータ) (2021-06-16T16:48:01Z) - Manifold Regularized Dynamic Network Pruning [102.24146031250034]
本稿では,全インスタンスの多様体情報をプルーンドネットワークの空間に埋め込むことにより,冗長フィルタを動的に除去する新しいパラダイムを提案する。
提案手法の有効性をいくつかのベンチマークで検証し,精度と計算コストの両面で優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-10T03:59:03Z) - A Deep-Unfolded Reference-Based RPCA Network For Video
Foreground-Background Separation [86.35434065681925]
本稿では,ロバスト主成分分析(RPCA)問題に対するディープアンフォールディングに基づくネットワーク設計を提案する。
既存の設計とは異なり,本手法は連続するビデオフレームのスパース表現間の時間的相関をモデル化することに焦点を当てている。
移動MNISTデータセットを用いた実験により、提案したネットワークは、ビデオフォアグラウンドとバックグラウンドの分離作業において、最近提案された最先端のRPCAネットワークより優れていることが示された。
論文 参考訳(メタデータ) (2020-10-02T11:40:09Z) - Perceptron Synthesis Network: Rethinking the Action Scale Variances in
Videos [48.57686258913474]
ビデオアクション認識は、固定サイズの3Dカーネルを積み重ねたCNNによって部分的に解決されている。
データから最適なスケールのカーネルを学習することを提案する。
固定サイズのカーネルの袋からカーネルを生成するために,テキスト分割パーセプトロンシンセサイザーを提案する。
論文 参考訳(メタデータ) (2020-07-22T14:22:29Z) - Network Adjustment: Channel Search Guided by FLOPs Utilization Ratio [101.84651388520584]
本稿では,ネットワークの精度をFLOPの関数として考慮した,ネットワーク調整という新しいフレームワークを提案する。
標準画像分類データセットと幅広いベースネットワークの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2020-04-06T15:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。