論文の概要: PyTorchVideo: A Deep Learning Library for Video Understanding
- arxiv url: http://arxiv.org/abs/2111.09887v1
- Date: Thu, 18 Nov 2021 18:59:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-19 13:55:22.120629
- Title: PyTorchVideo: A Deep Learning Library for Video Understanding
- Title(参考訳): PyTorchVideo: ビデオ理解のためのディープラーニングライブラリ
- Authors: Haoqi Fan, Tullie Murrell, Heng Wang, Kalyan Vasudev Alwala, Yanghao
Li, Yilei Li, Bo Xiong, Nikhila Ravi, Meng Li, Haichuan Yang, Jitendra Malik,
Ross Girshick, Matt Feiszli, Aaron Adcock, Wan-Yen Lo, Christoph
Feichtenhofer
- Abstract要約: PyTorchVideoは、ビデオ理解タスクのためのオープンソースのディープラーニングライブラリである。
マルチモーダルデータローディング、変換、モデルを含む、ビデオ理解ツールのフルスタックをカバーする。
ライブラリはPyTorchをベースにしており、任意のトレーニングフレームワークで使用することができる。
- 参考スコア(独自算出の注目度): 71.89124881732015
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce PyTorchVideo, an open-source deep-learning library that provides
a rich set of modular, efficient, and reproducible components for a variety of
video understanding tasks, including classification, detection, self-supervised
learning, and low-level processing. The library covers a full stack of video
understanding tools including multimodal data loading, transformations, and
models that reproduce state-of-the-art performance. PyTorchVideo further
supports hardware acceleration that enables real-time inference on mobile
devices. The library is based on PyTorch and can be used by any training
framework; for example, PyTorchLightning, PySlowFast, or Classy Vision.
PyTorchVideo is available at https://pytorchvideo.org/
- Abstract(参考訳): 我々はPyTorchVideoを紹介した。PyTorchVideoはオープンソースのディープラーニングライブラリで,分類,検出,自己教師型学習,低レベル処理など,さまざまなビデオ理解タスクに対して,モジュール化,効率的,再現可能な豊富なコンポーネントセットを提供する。
このライブラリには、マルチモーダルデータ読み込み、変換、最先端のパフォーマンスを再現するモデルを含む、ビデオ理解ツールのフルスタックが含まれている。
PyTorchVideoはさらに、モバイルデバイス上でリアルタイムの推論を可能にするハードウェアアクセラレーションをサポートしている。
ライブラリはPyTorchをベースにしており、PyTorchLightning、PySlowFast、Classy Visionなど、任意のトレーニングフレームワークで使用することができる。
pytorchvideoはhttps://pytorchvideo.org/で入手できる。
関連論文リスト
- Comgra: A Tool for Analyzing and Debugging Neural Networks [35.89730807984949]
PyTorchで使用するオープンソースのpythonライブラリであるcomgraを紹介します。
Comgraはモデルの内部アクティベーションに関するデータを抽出し、GUIで整理する。
要約統計と個々のデータポイントの両方を示し、トレーニングの初期段階と後期を比較し、関心のある個々のサンプルに注目し、ネットワークを通しての勾配の流れを可視化する。
論文 参考訳(メタデータ) (2024-07-31T14:57:23Z) - pyvene: A Library for Understanding and Improving PyTorch Models via
Interventions [79.72930339711478]
$textbfpyvene$は、さまざまなPyTorchモジュールに対するカスタマイズ可能な介入をサポートするオープンソースライブラリである。
私たちは、$textbfpyvene$が、ニューラルモデルへの介入を実行し、他のモデルとインターバルされたモデルを共有するための統一されたフレームワークを提供する方法を示します。
論文 参考訳(メタデータ) (2024-03-12T16:46:54Z) - Spatio-temporal Prompting Network for Robust Video Feature Extraction [74.54597668310707]
フレームテンポラリ(Frametemporal)は、ビデオ理解の分野における大きな課題の1つだ。
最近のアプローチでは、トランスフォーマーベースの統合モジュールを活用して、時間的品質情報を得る。
N-Temporal Prompting Network (NNSTP) という,クリーンで統一されたフレームワークを提案する。
ネットワークバックボーン内の入力特徴を調整することで,映像特徴の抽出を効率的に行うことができる。
論文 参考訳(メタデータ) (2024-02-04T17:52:04Z) - TorchBench: Benchmarking PyTorch with High API Surface Coverage [9.68698340637426]
我々は、PyTorchソフトウェアスタックの性能を研究するための新しいベンチマークスイートであるTorchBenchを提案する。
TorchBenchは、PyTorchソフトウェアスタックのパフォーマンスを包括的に特徴付けることができる。
本稿では,TorchBenchの実用例を2つ紹介する。
論文 参考訳(メタデータ) (2023-04-27T14:37:05Z) - PyGOD: A Python Library for Graph Outlier Detection [56.33769221859135]
PyGODは、グラフデータの外れ値を検出するオープンソースライブラリである。
外れ値検出のための主要なグラフベースのメソッドを幅広くサポートしています。
PyGODはBSD 2-Clauseライセンスの下でhttps://pygod.orgとPython Package Index (PyPI)でリリースされている。
論文 参考訳(メタデータ) (2022-04-26T06:15:21Z) - Small-Text: Active Learning for Text Classification in Python [23.87081733039124]
small-textはPython用の使いやすいアクティブラーニングライブラリである。
シングルラベルとマルチラベルのテキスト分類のためのプールベースのアクティブラーニングを提供する。
論文 参考訳(メタデータ) (2021-07-21T19:23:56Z) - TorchKGE: Knowledge Graph Embedding in Python and PyTorch [0.0]
TorchKGEは、PyTorchのみに依存する知識グラフ(KG)組み込みのためのPythonモジュールである。
KGデータ構造、単純なモデルインターフェース、ネガティブサンプリングとモデル評価のためのモジュールを備えている。
論文 参考訳(メタデータ) (2020-09-07T09:21:34Z) - mvlearn: Multiview Machine Learning in Python [103.55817158943866]
mvlearnは、主要なマルチビュー機械学習メソッドを実装するPythonライブラリである。
パッケージはPython Package Index(PyPI)とcondaパッケージマネージャからインストールできる。
論文 参考訳(メタデータ) (2020-05-25T02:35:35Z) - TorchIO: A Python library for efficient loading, preprocessing,
augmentation and patch-based sampling of medical images in deep learning [68.8204255655161]
我々はTorchIOというオープンソースのPythonライブラリを紹介し、ディープラーニングのための医療画像の効率的なロード、前処理、拡張、パッチベースのサンプリングを可能にする。
TorchIOはPyTorchのスタイルに従い、標準的な医用画像処理ライブラリを統合して、ニューラルネットワークのトレーニング中に画像を効率的に処理する。
Pythonを使わずに、画像ファイルに変換を適用できるコマンドラインインターフェースが含まれている。
論文 参考訳(メタデータ) (2020-03-09T13:36:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。