Fugu-MT 論文翻訳(概要): Distill-then-prune: An Efficient Compression Framework for Real-time Stereo Matching Network on Edge Devices

論文の概要: Distill-then-prune: An Efficient Compression Framework for Real-time Stereo Matching Network on Edge Devices

arxiv url: http://arxiv.org/abs/2405.11809v1
Date: Mon, 20 May 2024 06:03:55 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-21 14:03:49.312129
Title: Distill-then-prune: An Efficient Compression Framework for Real-time Stereo Matching Network on Edge Devices
Title（参考訳）: Distill-then-prune:エッジデバイス上でのリアルタイムステレオマッチングネットワークのための効率的な圧縮フレームワーク
Authors: Baiyu Pan, Jichao Jiao, Jianxing Pang, Jun Cheng,
Abstract要約: 本稿では, 知識蒸留とモデルプルーニングを取り入れて, 速度と精度のトレードオフを克服し, 新たな戦略を提案する。エッジデバイスに高い精度を提供しながら、リアルタイム性能を維持するモデルを得た。
参考スコア（独自算出の注目度）: 5.696239274365031
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In recent years, numerous real-time stereo matching methods have been introduced, but they often lack accuracy. These methods attempt to improve accuracy by introducing new modules or integrating traditional methods. However, the improvements are only modest. In this paper, we propose a novel strategy by incorporating knowledge distillation and model pruning to overcome the inherent trade-off between speed and accuracy. As a result, we obtained a model that maintains real-time performance while delivering high accuracy on edge devices. Our proposed method involves three key steps. Firstly, we review state-of-the-art methods and design our lightweight model by removing redundant modules from those efficient models through a comparison of their contributions. Next, we leverage the efficient model as the teacher to distill knowledge into the lightweight model. Finally, we systematically prune the lightweight model to obtain the final model. Through extensive experiments conducted on two widely-used benchmarks, Sceneflow and KITTI, we perform ablation studies to analyze the effectiveness of each module and present our state-of-the-art results.
Abstract（参考訳）: 近年,リアルタイムステレオマッチング法が数多く導入されているが,精度は低いことが多い。これらの手法は、新しいモジュールの導入や従来のメソッドの統合によって精度の向上を試みる。しかし、改善は控えめなだけである。本稿では, 知識蒸留とモデルプルーニングを取り入れた新しい手法を提案し, 速度と精度のトレードオフを克服する。その結果,エッジデバイス上で高い精度を実現しつつ,リアルタイム性能を維持するモデルが得られた。提案手法は3つの重要なステップを含む。まず、これらの効率的なモデルから冗長なモジュールを除去し、それらのコントリビューションを比較することによって、最先端の手法をレビューし、軽量モデルの設計を行う。次に,教師としての効率的なモデルを利用して,知識を軽量モデルに抽出する。最後に、我々は、最終モデルを得るために、軽量モデルを体系的に訓練する。 Sceneflow と KITTI の2つの広く使われているベンチマークで行った広範な実験を通じて,各モジュールの有効性を解析し,その結果を提示する。

関連論文リスト

SimpleGVR: A Simple Baseline for Latent-Cascaded Video Super-Resolution [55.14432034345353]
後続の超解像モデルの設計原理について検討し,その設計原理について検討する。まず、ベースモデルの出力特性をよりよく模倣し、VSRモデルと上流ジェネレータとの整合性を確保するための2つのトレーニングペアを生成する方法を提案する。第2に,(1)時間ステップサンプリング戦略,(2)低分解能(LR)入力に対する雑音増強効果の系統的解析を通じて,VSRモデル行動に対する批判的洞察を提供する。
論文参考訳（メタデータ） (2025-06-24T17:57:26Z)
An Effective Training Framework for Light-Weight Automatic Speech Recognition Models [10.295690160466936]
一つの大モデルから複数の小さなモデルを生成することができる2段階の効率的な表現学習手法を提案する。提案手法は,単語誤り率を最大12.54%向上させる3倍の学習速度を実現する。
論文参考訳（メタデータ） (2025-05-22T17:55:09Z)
On the Surprising Efficacy of Distillation as an Alternative to Pre-Training Small Models [7.062887337934677]
我々は、小モデルがその利点を享受するために事前学習のコストを吸収する必要がないことを提案する。事前訓練されたモデルからタスクを蒸留すると、そのタスクで事前訓練されたり微調整されたりした場合、小さなモデルで達成される性能を達成または超えることが観察された。
論文参考訳（メタデータ） (2024-04-04T07:38:11Z)
Towards Stable Machine Learning Model Retraining via Slowly Varying Sequences [6.067007470552307]
そこで本研究では,繰り返しのトレーニングにおいて安定な機械学習モデルのシーケンスを見つける手法を提案する。最適モデルの復元が保証される混合整数最適化の定式化を開発する。本手法は, 予測力の小さい, 制御可能な犠牲を伴い, 厳密に訓練されたモデルよりも強い安定性を示す。
論文参考訳（メタデータ） (2024-03-28T22:45:38Z)
A-SDM: Accelerating Stable Diffusion through Redundancy Removal and Performance Optimization [54.113083217869516]
本研究ではまず,ネットワークの計算冗長性について検討する。次に、モデルの冗長性ブロックをプルークし、ネットワーク性能を維持する。第3に,計算集約型注意部を高速化するグローバル地域対話型注意(GRI)を提案する。
論文参考訳（メタデータ） (2023-12-24T15:37:47Z)
Quantized Distillation: Optimizing Driver Activity Recognition Models for Resource-Constrained Environments [34.80538284957094]
本稿では,資源効率の高いドライバアクティビティ認識のための軽量フレームワークを提案する。このフレームワークは、ビデオ分類のスピードに最適化されたニューラルネットワークである3D MobileNetを強化する。モデルサイズを3倍に削減し、推論時間を1.4倍改善する。
論文参考訳（メタデータ） (2023-11-10T10:07:07Z)
BOOT: Data-free Distillation of Denoising Diffusion Models with Bootstrapping [64.54271680071373]
拡散モデルは多様な画像を生成する優れた可能性を示している。知識蒸留は、推論ステップの数を1つか数に減らすための治療法として最近提案されている。本稿では,効率的なデータフリー蒸留アルゴリズムにより限界を克服するBOOTと呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (2023-06-08T20:30:55Z)
EBJR: Energy-Based Joint Reasoning for Adaptive Inference [10.447353952054492]
最先端のディープラーニングモデルは、さまざまなベンチマークで大きなパフォーマンスレベルを達成した。一方、軽量アーキテクチャは適度な精度を実現しますが、より望ましいレイテンシを実現しています。本稿では,大規模高精度モデルと小型高速モデルとを併用する新しい手法を提案する。
論文参考訳（メタデータ） (2021-10-20T02:33:31Z)
Exploring Strategies for Generalizable Commonsense Reasoning with Pre-trained Models [62.28551903638434]
モデルの一般化と精度に及ぼす3つの異なる適応法の影響を計測する。 2つのモデルを用いた実験では、微調整はタスクの内容と構造の両方を学習することで最もうまく機能するが、過度に適合し、新しい答えへの限定的な一般化に苦しむ。我々は、プレフィックスチューニングのような代替適応手法が同等の精度を持つのを観察するが、解を見落とさずに一般化し、対数分割に対してより堅牢である。
論文参考訳（メタデータ） (2021-09-07T03:13:06Z)
Knowledge distillation: A good teacher is patient and consistent [71.14922743774864]
最先端のパフォーマンスを実現する大規模モデルと、実用的な用途で手頃な価格のモデルとの間には、コンピュータビジョンの相違が増えている。蒸留の有効性に大きな影響を及ぼす可能性のある,特定の暗黙的な設計選択を同定する。 ImageNetの最先端ResNet-50モデルが82.8%の精度で実現されている。
論文参考訳（メタデータ） (2021-06-09T17:20:40Z)
When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。精度を向上させるために,2つの軽量モジュールを提案する。 DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。 QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文参考訳（メタデータ） (2021-05-27T13:51:42Z)
Be Your Own Best Competitor! Multi-Branched Adversarial Knowledge Transfer [15.499267533387039]
提案手法は,高速な画像分類とエンコーダデコーダアーキテクチャの両方に特化しており,推論過程において余分な計算オーバーヘッドを発生させることなく,小型・コンパクトなモデルの性能を向上させる。提案手法は, 従来の自己蒸留法よりも大幅に改善されている。
論文参考訳（メタデータ） (2020-10-09T11:57:45Z)
Towards Practical Lipreading with Distilled and Efficient Models [57.41253104365274]
ニューラルネットワークの復活により、リリーディングは多くの進歩を目の当たりにした。最近の研究は、最適なアーキテクチャを見つけるか、一般化を改善することで、パフォーマンスを改善するといった側面に重点を置いている。現在の方法論と、実践的なシナリオにおける効果的なリップリーディングのデプロイ要件との間には、依然として大きなギャップがあります。まず, LRW と LRW-1000 をそれぞれ 88.5% と 46.6% に比例して, 最先端の性能を高めることを提案する。
論文参考訳（メタデータ） (2020-07-13T16:56:27Z)
Real-Time Model Calibration with Deep Reinforcement Learning [4.707841918805165]
本稿では,強化学習に基づくモデルパラメータ推定のための新しいフレームワークを提案する。提案手法を2つのモデルベース診断試験ケースで実証し, 評価した。
論文参考訳（メタデータ） (2020-06-07T00:11:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。