Fugu-MT 論文翻訳(概要): VMAF Re-implementation on PyTorch: Some Experimental Results

論文の概要: VMAF Re-implementation on PyTorch: Some Experimental Results

arxiv url: http://arxiv.org/abs/2310.15578v2
Date: Wed, 25 Oct 2023 14:30:39 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-26 10:53:15.395978
Title: VMAF Re-implementation on PyTorch: Some Experimental Results
Title（参考訳）: VMAFによるPyTorchの再実装:実験結果
Authors: Kirill Aistov and Maxim Koroteev
Abstract要約: PyTorchフレームワークを用いたVMAFの実装を提案する。この実装について、標準 (libvmaf) と比較すると、VMAF ユニットでは $lesssim 10-2$ という差がある。目的関数としてVMAFを使用する場合の計算勾配について検討し、この関数を用いたトレーニングが動作不良な勾配を生じさせないことを示す。
参考スコア（独自算出の注目度）: 2.1756081703276
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Based on the standard VMAF implementation we propose an implementation of VMAF using PyTorch framework. For this implementation comparisons with the standard (libvmaf) show the discrepancy $\lesssim 10^{-2}$ in VMAF units. We investigate gradients computation when using VMAF as an objective function and demonstrate that training using this function does not result in ill-behaving gradients.
Abstract（参考訳）: 標準VMAF実装に基づいて,PyTorchフレームワークを用いたVMAFの実装を提案する。この実装で標準(libvmaf)と比較すると、vmafユニットで$\lesssim 10^{-2}$の差が示される。目的関数としてVMAFを使用する場合の勾配計算について検討し、この関数を用いたトレーニングが不利な勾配を生じさせないことを示す。

関連論文リスト

NAF: Zero-Shot Feature Upsampling via Neighborhood Attention Filtering [80.55691420311616]
隣り合う注意フィルタリング(NAF)は、クロススケールな隣り合う注意と回転位置埋め込み(RoPE)を通して、適応的な空間・コンテンツ重みを学習する NAFはゼロショットを運用しており、再訓練せずにヴィジョン・ファンデーション・モデル(VFM)の機能をアップサンプルしている。高効率を維持し、2Kのフィーチャーマップにスケーリングし、18 FPSで中間解像度マップを再構築する。
論文参考訳（メタデータ） (2025-11-23T13:43:52Z)
scipy.spatial.transform: Differentiable Framework-Agnostic 3D Transformations in Python [49.015684860172975]
三次元剛体変換、すなわち回転と変換は、現代の微分可能な機械学習パイプラインの中心である。 SciPyのspace$.$diffモジュールは、厳格にテストされたPython実装である。我々はSciPyの空間$.$transform機能を完全にオーバーホールし、Python配列APIを実装する任意の配列ライブラリと互換性を持たせる。
論文参考訳（メタデータ） (2025-11-22T18:52:34Z)
Gradient-based optimization for variational empirical Bayes multiple regression [2.6763498831034043]
勾配に基づく(準ニュートン)手法に基づく代替最適化手法を提案する。我々はGradVIが同様の予測性能を示し、予測器が高い相関関係にある場合、より少ないイテレーションで収束することを示す。提案手法は,オープンソースのPythonソフトウェアGradVIに実装されている。
論文参考訳（メタデータ） (2024-11-21T20:35:44Z)
No Saved Kaleidosope: an 100% Jitted Neural Network Coding Language with Pythonic Syntax [0.8408735228878615]
我々は,C++,LLVM,Cudaを用いてニューラルネットワークを学習するためのjittedコンパイラを開発した。オブジェクト指向の特徴、強い型付け、データ前処理のための並列ワーカー、式のためのピソニック構文、PyTorchのようなモデル宣言、自動微分などが特徴である。
論文参考訳（メタデータ） (2024-09-17T23:15:39Z)
High Performance Computing Applied to Logistic Regression: A CPU and GPU Implementation Comparison [0.0]
汎用GPUによるロジスティック回帰(LR)の並列バージョンを提案する。我々の実装は、X. Zouらによって提案された並列なグラディエントDescent Logistic Regressionアルゴリズムの直接変換である。本手法は,画像認識,スパム検出,不正検出などのリアルタイム予測に特に有用である。
論文参考訳（メタデータ） (2023-08-19T14:49:37Z)
Scalable Video Object Segmentation with Simplified Framework [21.408446548059956]
本稿では,機能抽出とマッチングを行うスケーラブルなVOS(SimVOS)フレームワークを提案する。 SimVOSは拡張性のあるViTバックボーンを使用して、クエリと参照の同時抽出とマッチングを行う。実験により,我々のSimVOSは,人気ビデオオブジェクトセグメンテーションベンチマークの最先端結果を得た。
論文参考訳（メタデータ） (2023-08-19T04:30:48Z)
Filter Pruning for Efficient CNNs via Knowledge-driven Differential Filter Sampler [103.97487121678276]
フィルタプルーニングは同時に計算を加速し、CNNのメモリオーバーヘッドを低減する。本稿では,MFM(Masked Filter Modeling)フレームワークを用いた知識駆動型微分フィルタサンプリング(KDFS)を提案する。
論文参考訳（メタデータ） (2023-07-01T02:28:41Z)
Softmax-free Linear Transformers [90.83157268265654]
視覚変換器(ViT)は、視覚知覚タスクの最先端を推し進めている。既存の手法は理論的に欠陥があるか、視覚認識に経験的に効果がないかのいずれかである。我々はSoftmax-Free Transformers (SOFT) のファミリーを提案する。
論文参考訳（メタデータ） (2022-07-05T03:08:27Z)
Implicit Feature Refinement for Instance Segmentation [20.34804959340334]
高品質なインスタンスセグメンテーションのための新しい暗黙的特徴改善モジュールを提案する。我々のIRFは、最先端の画像/ビデオインスタンスセグメンテーションフレームワークの性能向上を実現しています。
論文参考訳（メタデータ） (2021-12-09T05:36:04Z)
Data Agnostic Filter Gating for Efficient Deep Networks [72.4615632234314]
現在のフィルタプルーニング法は主に特徴写像を利用してフィルタの重要なスコアを生成し、より小さなスコアのプルーンを生成する。本稿では,Daggerモジュールと呼ばれる補助的ネットワークを用いてプルーニングを誘導するデータフィルタプルーニング手法を提案する。さらに,特定のFLOP制約でプルーネフィルタを支援するために,明示的なFLOPを意識した正規化を活用して,プルーニングフィルタを直接対象のFLOPに向けて推進する。
論文参考訳（メタデータ） (2020-10-28T15:26:40Z)
Training Interpretable Convolutional Neural Networks by Differentiating Class-specific Filters [64.46270549587004]
畳み込みニューラルネットワーク(CNN)は、様々なタスクでうまく使われている。 CNNは、しばしば「ブラックボックス」と解釈可能性の欠如とみなされる。本稿では,クラス固有のフィルタを奨励することで,解釈可能なCNNを訓練する新しい手法を提案する。
論文参考訳（メタデータ） (2020-07-16T09:12:26Z)
iffDetector: Inference-aware Feature Filtering for Object Detection [70.8678270164057]
Inference-aware Feature Filtering (IFF)モジュールを導入し、現代の検出器と簡単に組み合わせることができる。 IFFは、畳み込み機能を強化するためにハイレベルなセマンティクスを活用することでクローズドループ最適化を行う。 IFFはCNNベースの物体検出器とプラグアンドプレイ方式で融合でき、計算コストのオーバーヘッドは無視できる。
論文参考訳（メタデータ） (2020-06-23T02:57:29Z)
Filter Grafting for Deep Neural Networks [71.39169475500324]
ディープニューラルネットワーク(DNN)の表現能力向上を目的としたフィルタグラフト我々は,フィルタの情報を測定するエントロピーベースの基準と,ネットワーク間のグラフト情報のバランスをとるための適応重み付け戦略を開発する。例えば、グラフトされたMobileNetV2は、CIFAR-100データセットで非グラフトされたMobileNetV2を約7%上回っている。
論文参考訳（メタデータ） (2020-01-15T03:18:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。