論文の概要: VMAF Re-implementation on PyTorch: Some Experimental Results
- arxiv url: http://arxiv.org/abs/2310.15578v2
- Date: Wed, 25 Oct 2023 14:30:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-26 10:53:15.395978
- Title: VMAF Re-implementation on PyTorch: Some Experimental Results
- Title(参考訳): VMAFによるPyTorchの再実装:実験結果
- Authors: Kirill Aistov and Maxim Koroteev
- Abstract要約: PyTorchフレームワークを用いたVMAFの実装を提案する。
この実装について、標準 (libvmaf) と比較すると、VMAF ユニットでは $lesssim 10-2$ という差がある。
目的関数としてVMAFを使用する場合の計算勾配について検討し、この関数を用いたトレーニングが動作不良な勾配を生じさせないことを示す。
- 参考スコア(独自算出の注目度): 2.1756081703276
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Based on the standard VMAF implementation we propose an implementation of
VMAF using PyTorch framework. For this implementation comparisons with the
standard (libvmaf) show the discrepancy $\lesssim 10^{-2}$ in VMAF units. We
investigate gradients computation when using VMAF as an objective function and
demonstrate that training using this function does not result in ill-behaving
gradients.
- Abstract(参考訳): 標準VMAF実装に基づいて,PyTorchフレームワークを用いたVMAFの実装を提案する。
この実装で標準(libvmaf)と比較すると、vmafユニットで$\lesssim 10^{-2}$の差が示される。
目的関数としてVMAFを使用する場合の勾配計算について検討し、この関数を用いたトレーニングが不利な勾配を生じさせないことを示す。
関連論文リスト
- High Performance Computing Applied to Logistic Regression: A CPU and GPU
Implementation Comparison [0.0]
汎用GPUによるロジスティック回帰(LR)の並列バージョンを提案する。
我々の実装は、X. Zouらによって提案された並列なグラディエントDescent Logistic Regressionアルゴリズムの直接変換である。
本手法は,画像認識,スパム検出,不正検出などのリアルタイム予測に特に有用である。
論文 参考訳(メタデータ) (2023-08-19T14:49:37Z) - Scalable Video Object Segmentation with Simplified Framework [21.408446548059956]
本稿では,機能抽出とマッチングを行うスケーラブルなVOS(SimVOS)フレームワークを提案する。
SimVOSは拡張性のあるViTバックボーンを使用して、クエリと参照の同時抽出とマッチングを行う。
実験により,我々のSimVOSは,人気ビデオオブジェクトセグメンテーションベンチマークの最先端結果を得た。
論文 参考訳(メタデータ) (2023-08-19T04:30:48Z) - Filter Pruning for Efficient CNNs via Knowledge-driven Differential
Filter Sampler [103.97487121678276]
フィルタプルーニングは同時に計算を加速し、CNNのメモリオーバーヘッドを低減する。
本稿では,MFM(Masked Filter Modeling)フレームワークを用いた知識駆動型微分フィルタサンプリング(KDFS)を提案する。
論文 参考訳(メタデータ) (2023-07-01T02:28:41Z) - Softmax-free Linear Transformers [90.83157268265654]
視覚変換器(ViT)は、視覚知覚タスクの最先端を推し進めている。
既存の手法は理論的に欠陥があるか、視覚認識に経験的に効果がないかのいずれかである。
我々はSoftmax-Free Transformers (SOFT) のファミリーを提案する。
論文 参考訳(メタデータ) (2022-07-05T03:08:27Z) - Implicit Feature Refinement for Instance Segmentation [20.34804959340334]
高品質なインスタンスセグメンテーションのための新しい暗黙的特徴改善モジュールを提案する。
我々のIRFは、最先端の画像/ビデオインスタンスセグメンテーションフレームワークの性能向上を実現しています。
論文 参考訳(メタデータ) (2021-12-09T05:36:04Z) - Hacking VMAF and VMAF NEG: metrics vulnerability to different
preprocessing [0.0]
ビデオ前処理による品質指標VMAFとそのチューニング耐性バージョンVMAF NEGが人工的に向上可能であることを示す。
本稿では,VMAFを最大218.8%増加させる処理アルゴリズムのパラメータをチューニングするためのパイプラインを提案する。
論文 参考訳(メタデータ) (2021-07-09T15:53:47Z) - On PyTorch Implementation of Density Estimators for von Mises-Fisher and
Its Mixture [15.522964295287425]
我々は、vMFモデルとその混合物をレビューし、Python/PyTorchでモデルをトレーニングする方法の詳細なレシピを提供する。
混合学習には,ミニバッチに基づく大規模SGD学習と,全バッチ推定器であるEMアルゴリズムの両方を提供する。
論文 参考訳(メタデータ) (2021-02-10T09:26:56Z) - Data Agnostic Filter Gating for Efficient Deep Networks [72.4615632234314]
現在のフィルタプルーニング法は主に特徴写像を利用してフィルタの重要なスコアを生成し、より小さなスコアのプルーンを生成する。
本稿では,Daggerモジュールと呼ばれる補助的ネットワークを用いてプルーニングを誘導するデータフィルタプルーニング手法を提案する。
さらに,特定のFLOP制約でプルーネフィルタを支援するために,明示的なFLOPを意識した正規化を活用して,プルーニングフィルタを直接対象のFLOPに向けて推進する。
論文 参考訳(メタデータ) (2020-10-28T15:26:40Z) - Training Interpretable Convolutional Neural Networks by Differentiating
Class-specific Filters [64.46270549587004]
畳み込みニューラルネットワーク(CNN)は、様々なタスクでうまく使われている。
CNNは、しばしば「ブラックボックス」と解釈可能性の欠如とみなされる。
本稿では,クラス固有のフィルタを奨励することで,解釈可能なCNNを訓練する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-16T09:12:26Z) - iffDetector: Inference-aware Feature Filtering for Object Detection [70.8678270164057]
Inference-aware Feature Filtering (IFF)モジュールを導入し、現代の検出器と簡単に組み合わせることができる。
IFFは、畳み込み機能を強化するためにハイレベルなセマンティクスを活用することでクローズドループ最適化を行う。
IFFはCNNベースの物体検出器とプラグアンドプレイ方式で融合でき、計算コストのオーバーヘッドは無視できる。
論文 参考訳(メタデータ) (2020-06-23T02:57:29Z) - Filter Grafting for Deep Neural Networks [71.39169475500324]
ディープニューラルネットワーク(DNN)の表現能力向上を目的としたフィルタグラフト
我々は,フィルタの情報を測定するエントロピーベースの基準と,ネットワーク間のグラフト情報のバランスをとるための適応重み付け戦略を開発する。
例えば、グラフトされたMobileNetV2は、CIFAR-100データセットで非グラフトされたMobileNetV2を約7%上回っている。
論文 参考訳(メタデータ) (2020-01-15T03:18:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。