論文の概要: Lost in Transmission: On the Impact of Networking Corruptions on Video
Machine Learning Models
- arxiv url: http://arxiv.org/abs/2206.05252v1
- Date: Fri, 10 Jun 2022 17:50:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-13 15:06:12.167617
- Title: Lost in Transmission: On the Impact of Networking Corruptions on Video
Machine Learning Models
- Title(参考訳): lost in transmission: ネットワークの腐敗がビデオ機械学習モデルに与える影響について
- Authors: Trenton Chang and Daniel Y. Fu
- Abstract要約: 我々は、ビデオ機械学習のベンチマークデータセットで明らかなネットワークの破損を発見した。
ネットワークの破損は視覚的および時間的アーティファクト(スミア色やフレームドロップなど)を引き起こす。
これらのネットワークの破損は、さまざまなビデオMLタスクのパフォーマンスを低下させるが、効果はタスクとデータセットによって異なる。
- 参考スコア(独自算出の注目度): 2.0651795738033965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study how networking corruptions--data corruptions caused by networking
errors--affect video machine learning (ML) models. We discover apparent
networking corruptions in Kinetics-400, a benchmark video ML dataset. In a
simulation study, we investigate (1) what artifacts networking corruptions
cause, (2) how such artifacts affect ML models, and (3) whether standard
robustness methods can mitigate their negative effects. We find that networking
corruptions cause visual and temporal artifacts (i.e., smeared colors or frame
drops). These networking corruptions degrade performance on a variety of video
ML tasks, but effects vary by task and dataset, depending on how much temporal
context the tasks require. Lastly, we evaluate data augmentation--a standard
defense for data corruptions--but find that it does not recover performance.
- Abstract(参考訳): 本稿では,ネットワークエラーによるデータ破損が,機械学習(ML)モデルに与える影響について検討する。
ベンチマークビデオMLデータセットであるKinetics-400で明らかなネットワークの破損を発見した。
シミュレーション研究では,(1)ネットワークの破損が原因となるアーティファクト,(2)そのようなアーティファクトがMLモデルにどのように影響するか,(3)標準ロバスト性手法が悪影響を軽減するかを検討する。
ネットワークの破損は視覚的および時間的アーティファクト(スミア色やフレームドロップなど)を引き起こす。
これらのネットワークの破損は、さまざまなビデオMLタスクのパフォーマンスを低下させるが、タスクとデータセットによって、タスクに必要な時間的コンテキストによって異なる。
最後に、データ拡張(データ破損の標準的な防御)を評価するが、パフォーマンスは回復しない。
関連論文リスト
- Bitstream-Corrupted Video Recovery: A Novel Benchmark Dataset and Method [24.986639795808564]
bitstream-corrupted video (BSCV)ベンチマークは、28,000以上のビデオクリップを備えた最初のベンチマークデータセットである。
BSCVは,1)ビデオビットストリームのための3パラメータ汚職モデル,2)リッチなエラーパターン,複数の汚職レベル,フレキシブルなデータセットブランチを含む大規模データセット,3)ベンチマークとして機能するビデオリカバリフレームワークのプラグイン・アンド・プレイモジュールの集合である。
我々は,BSCVデータセット上での最先端ビデオ塗装手法の評価を行い,既存のアプローチの限界と,ビットストリーム崩壊ビデオ回復問題の解決におけるフレームワークの利点を実証した。
論文 参考訳(メタデータ) (2023-09-25T06:06:26Z) - Nebula: Self-Attention for Dynamic Malware Analysis [14.710331873072146]
我々は、多様な行動表現とフォーマットをまたいで一般化する、汎用的で自己注意型トランスフォーマーベースのニューラルアーキテクチャであるNebulaを紹介する。
我々は,異なる動的解析プラットフォームから取得した3つのデータセットを用いて,マルウェア検出と分類作業の両方について実験を行った。
自己教師付き学習事前学習は、トレーニングデータの20%しか持たない完全教師付きモデルの性能とどのように一致しているかを示す。
論文 参考訳(メタデータ) (2023-09-19T09:24:36Z) - Many or Few Samples? Comparing Transfer, Contrastive and Meta-Learning
in Encrypted Traffic Classification [68.19713459228369]
我々は、トランスファーラーニング、メタラーニング、コントラストラーニングを、参照機械学習(ML)ツリーベースおよびモノリシックDLモデルと比較する。
i) 大規模なデータセットを用いて,より一般的な表現を得られること,(ii) コントラスト学習が最良の手法であることを示している。
MLツリーベースでは大きなタスクは処理できないが、学習した表現を再利用することで、小さなタスクにも適合するが、DLメソッドはツリーベースモデルのパフォーマンスにも到達している。
論文 参考訳(メタデータ) (2023-05-21T11:20:49Z) - A Survey on the Robustness of Computer Vision Models against Common Corruptions [3.6486148851646063]
コンピュータビジョンモデルは、センサーエラーや極端な撮像環境に起因する入力画像の変化に影響を受けやすい。
これらの破損は、現実のシナリオにデプロイする際のモデルの信頼性を著しく損なう可能性がある。
本稿では,コンピュータビジョンモデルの汎用汚職に対する堅牢性を改善する手法について概観する。
論文 参考訳(メタデータ) (2023-05-10T10:19:31Z) - OOD-CV-v2: An extended Benchmark for Robustness to Out-of-Distribution
Shifts of Individual Nuisances in Natural Images [59.51657161097337]
OOD-CV-v2は、ポーズ、形状、テクスチャ、コンテキスト、気象条件の10のオブジェクトカテゴリのアウト・オブ・ディストリビューションの例を含むベンチマークデータセットである。
この新たなデータセットに加えて、一般的なベースライン手法を用いた広範な実験にも貢献する。
論文 参考訳(メタデータ) (2023-04-17T20:39:25Z) - A Data-Based Perspective on Transfer Learning [76.30206800557411]
転送学習におけるソースデータセットの合成の役割について,より詳しく検討する。
我々のフレームワークは、転送学習の脆さをピンポインティングするなど、新しい機能を生み出します。
論文 参考訳(メタデータ) (2022-07-12T17:58:28Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - Taxonomizing local versus global structure in neural network loss
landscapes [60.206524503782006]
ロスランドスケープが世界規模で良好に接続されている場合, 最適なテスト精度が得られることを示す。
また、モデルが小さい場合や、品質の低いデータに訓練された場合、世界規模で接続の不十分なランドスケープが生じる可能性があることも示しています。
論文 参考訳(メタデータ) (2021-07-23T13:37:14Z) - Few-Shot Learning for Video Object Detection in a Transfer-Learning
Scheme [70.45901040613015]
ビデオ物体検出のための数発学習の新たな課題について検討する。
我々は,多数のベースクラスオブジェクトに対して映像物体検出を効果的に訓練するトランスファー学習フレームワークと,ノベルクラスオブジェクトのいくつかのビデオクリップを用いる。
論文 参考訳(メタデータ) (2021-03-26T20:37:55Z) - Anomaly Recognition from surveillance videos using 3D Convolutional
Neural Networks [0.0]
異常なアクティビティ認識は、通常のストリームから変化するパターンやイベントを識別する。
この研究は、中央フロリダ大学犯罪ビデオデータセットに基づいて訓練された深部3次元畳み込みネットワーク(3D ConvNets)を用いて、特徴の学習にシンプルで効果的なアプローチを提供する。
論文 参考訳(メタデータ) (2021-01-04T16:32:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。