論文の概要: Analyzing Compression Techniques for Computer Vision
- arxiv url: http://arxiv.org/abs/2305.08075v1
- Date: Sun, 14 May 2023 05:17:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 17:42:33.241801
- Title: Analyzing Compression Techniques for Computer Vision
- Title(参考訳): コンピュータビジョンのための圧縮技術の解析
- Authors: Maniratnam Mandal and Imran Khan
- Abstract要約: ディープネットワークはコンピュータビジョンアプリケーションにおける実用的なユースケースとして非常に望ましい。
本稿では, 知識蒸留, プルーニング, 量子化の3つの基本圧縮手法について検討する。
MNIST と CIFAR-10 のデータセットを用いて解析を行い,その結果を報告する。
- 参考スコア(独自算出の注目度): 2.194191411461253
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Compressing deep networks is highly desirable for practical use-cases in
computer vision applications. Several techniques have been explored in the
literature, and research has been done in finding efficient strategies for
combining them. For this project, we aimed to explore three different basic
compression techniques - knowledge distillation, pruning, and quantization for
small-scale recognition tasks. Along with the basic methods, we also test the
efficacy of combining them in a sequential manner. We analyze them using MNIST
and CIFAR-10 datasets and present the results along with few observations
inferred from them.
- Abstract(参考訳): 深層ネットワーク圧縮は、コンピュータビジョンアプリケーションにおける実用的なユースケースとして非常に望ましい。
文献でいくつかの技術が研究され、それらを組み合わせるための効率的な戦略を見つける研究が進められている。
本研究の目的は, 知識蒸留, プルーニング, 量子化の3つの基本的な圧縮手法について検討することであった。
基本手法とともに、それらを逐次的に組み合わせることの有効性についても検証する。
MNIST と CIFAR-10 のデータセットを用いて解析し、その結果と、それらから推測される観測結果を提示する。
関連論文リスト
- Comprehensive Survey of Model Compression and Speed up for Vision Transformers [5.592810604696031]
ViT(Vision Transformers)はコンピュータビジョンのパラダイムシフトであり、様々なタスクにおける最先端モデルよりも優れています。
しかし、それらの実践的な展開は、高い計算量とメモリ要求によって妨げられる。
本研究は,4つの主要なモデル圧縮手法を評価することで課題に対処する。
論文 参考訳(メタデータ) (2024-04-16T09:19:11Z) - Pre-training Multi-task Contrastive Learning Models for Scientific
Literature Understanding [52.723297744257536]
事前学習言語モデル(LM)は、科学文献理解タスクにおいて有効であることを示す。
文献理解タスク間の共通知識共有を容易にするために,マルチタスクのコントラスト学習フレームワークであるSciMultを提案する。
論文 参考訳(メタデータ) (2023-05-23T16:47:22Z) - Advancing 3D finger knuckle recognition via deep feature learning [51.871256510747465]
接触のない3Dフィンガーナックルパターンは、識別性、距離からの視認性、利便性、利便性により、効果的な生体認証として出現している。
近年、ディープニューラルネットワークの中間機能を複数のスケールで同時に組み込むディープ・フィーチャー・コラボレーティブ・ネットワークが開発されている。
本稿では,3次元指のナックル画像を表現するために,最小次元の識別特徴ベクトルを学習する可能性を検討することにより,本手法を推し進める。
論文 参考訳(メタデータ) (2023-01-07T20:55:16Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - A deep learning approach to clustering visual arts [7.363576598794859]
本稿では,deep Learning approach to cLustering vIsUal artSを提案する。
この方法は、事前訓練された畳み込みネットワークを使用して特徴を抽出し、これらの特徴を深い組込みクラスタリングモデルに供給する。
生の入力データを潜在空間にマッピングするタスクは、この潜在空間内のクラスタセントロイドの集合を見つけるタスクと共同で最適化される。
論文 参考訳(メタデータ) (2021-06-11T08:35:26Z) - Hierarchical Learning Using Deep Optimum-Path Forest [55.60116686945561]
バグオブビジュアルワード(bovw)やディープラーニング技術は、コンピュータ支援医療診断を含むいくつかの領域で広く使われている。
本研究では機械学習とBoVWの概念を用いたパーキンソン病の自動同定ツールの開発に興味を持っている。
論文 参考訳(メタデータ) (2021-02-18T13:02:40Z) - A Compact Deep Learning Model for Face Spoofing Detection [4.250231861415827]
プレゼンテーションアタック検出(PAD)は研究コミュニティから大きな注目を集めている。
我々は、統一されたニューラルネットワークアーキテクチャにおいて、幅広い機能と深い機能の両方を融合することで、この問題に対処する。
この手順は、ROSE-Youtu、SiW、NUAA Imposterなどのさまざまなスプーフィングデータセットで行われます。
論文 参考訳(メタデータ) (2021-01-12T21:20:09Z) - Empowering Knowledge Distillation via Open Set Recognition for Robust 3D
Point Cloud Classification [20.591508284285368]
本稿では,3次元物体認識のための知識蒸留とオープンセット認識の併用学習手法を提案する。
提案手法の有効性を,より小さなモデルを得るための様々な実験により実証する。
論文 参考訳(メタデータ) (2020-10-25T13:26:48Z) - HDD-Net: Hybrid Detector Descriptor with Mutual Interactive Learning [24.13425816781179]
局所的特徴抽出は、SLAMや3D再構成、ARアプリケーションといった分野の進歩により、現在も活発な研究領域である。
両抽出を個別に処理し,学習過程における相互作用に焦点を当てる手法を提案する。
我々は,カメラのローカライゼーション作業に匹敵せず,HPatchの画像マッチングと3次元再構成品質の観点から,技術状況の改善を示す。
論文 参考訳(メタデータ) (2020-05-12T13:55:04Z) - Multi-Task Learning for Dense Prediction Tasks: A Survey [87.66280582034838]
マルチタスク学習(MTL)技術は、性能、計算、メモリフットプリントに関する有望な結果を示している。
我々は、コンピュータビジョンにおけるMLLのための最先端のディープラーニングアプローチについて、よく理解された視点を提供する。
論文 参考訳(メタデータ) (2020-04-28T09:15:50Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。