論文の概要: DYNA-PRUNER: Input-Adaptive Data-Model Co-Pruning for Efficient and Scalable Spatio-Temporal Media Prediction
- arxiv url: http://arxiv.org/abs/2606.15346v1
- Date: Sat, 13 Jun 2026 15:14:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:33.376075
- Title: DYNA-PRUNER: Input-Adaptive Data-Model Co-Pruning for Efficient and Scalable Spatio-Temporal Media Prediction
- Title(参考訳): DYNA-PRUNER:高効率かつスケーラブルな時空間メディア予測のための入力適応型データモデル共処理
- Authors: Fuyan Zhang, Yuqi Li, Yingli Tian, Edmond S. L. Ho,
- Abstract要約: Dyna-Prunerは、データとモデル構造を入力依存で共存するエンドツーエンドのフレームワークである。
共有重要同期機構は、冗長領域をプルーする結合マスクを生成する。
WeatherBench、SEVIR、TaxiBJの実験では、CNN、RNN、Transformerのバックボーンとシームレスに統合されている。
- 参考スコア(独自算出の注目度): 24.16400471463046
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Spatio-temporal prediction supports radar/satellite nowcasting and city-scale traffic monitoring, but modern models are often too expensive for real-time deployment. This stems from a mismatch between dense computation and strong input-dependent redundancy (e.g., calm seas or clear skies). To enable automated, resource-aware architecture optimization in scalable media analysis, we propose Dyna-Pruner, an end-to-end framework for input-dependent co-pruning of data and model structure. A shared-importance synchronization mechanism generates coupled masks that prune redundant regions and their corresponding computational units (e.g., convolutional filters), yielding per-sample sparse sub-networks at inference time. Experiments on WeatherBench, SEVIR, and TaxiBJ show seamless integration with CNN, RNN, and Transformer backbones, reducing FLOPs by up to $70\%$ and achieving a $2.5\times$ speedup on NVIDIA Jetson AGX Orin with negligible accuracy loss ($<1\%$).
- Abstract(参考訳): 時空間予測は、レーダ/衛星の現在放送と都市規模の交通監視をサポートするが、現代のモデルは、しばしばリアルタイム展開には高すぎる。
これは、密度計算と強い入力依存冗長性(例えば、穏やかな海や澄んだ空)のミスマッチに由来する。
スケーラブルなメディア分析におけるリソース認識アーキテクチャの自動最適化を実現するため,Dyna-Prunerを提案する。
共有重要同期機構は、冗長領域とその対応する計算単位(例えば畳み込みフィルタ)をプルークする結合マスクを生成し、推論時にサンプルごとのスパースサブネットワークを生成する。
WeatherBench、SEVIR、TaxiBJの実験では、CNN、RNN、Transformerのバックボーンとシームレスに統合され、FLOPを最大で70\%、NVIDIA Jetson AGX Orinで2.5\times$のスピードアップを達成する。
関連論文リスト
- CNN-based Multi-In-Multi-Out Model for Efficient Spatiotemporal Prediction [0.0]
CNNベースのモデルは、カーネルのローカルな特性のため、グローバルな情報を考えるのが困難である。
Transformerアーキテクチャに基づくモデルは、自己注意計算のために複雑になる。
論文 参考訳(メタデータ) (2026-05-02T06:22:56Z) - RepSFNet : A Single Fusion Network with Structural Reparameterization for Crowd Counting [6.895355763564631]
RepSFNetは、正確でリアルタイムな群衆推定のために設計された軽量アーキテクチャである。
RepSFNetは、最近の最先端の手法と比較して、推論遅延を最大34%削減しながら、競争精度を達成している。
論文 参考訳(メタデータ) (2026-01-28T08:33:36Z) - LiQSS: Post-Transformer Linear Quantum-Inspired State-Space Tensor Networks for Real-Time 6G [85.58816960936069]
Sixth-Generation (6G) Open Radio Access Networks (O-RAN) における能動的およびエージェント的制御は、厳密なニアタイム(Near-RT)レイテンシと計算制約の下で制御グレードの予測を必要とする。
本稿では,効率的な無線テレメトリ予測のための変圧器後パラダイムについて検討する。
本稿では、自己アテンションを安定な状態空間動的カーネルに置き換える量子インスピレーション付き状態空間テンソルネットワークを提案する。
論文 参考訳(メタデータ) (2026-01-18T12:08:38Z) - Compression and Inference of Spiking Neural Networks on Resource-Constrained Hardware [0.2226043394835212]
スパイキングニューラルネットワーク(SNN)は、連続的なアクティベーションではなく、離散的なスパイクを介して時間内に通信する。
エッジデバイス上でのSNN推論のための軽量なC言語ランタイムを提案する。
我々は,無活動ニューロンやシナプスを刺激するスパーススパイク活性を利用して,上流の畳み込み層での計算を縮小する。
論文 参考訳(メタデータ) (2025-11-15T10:02:23Z) - Parallel Neural Computing for Scene Understanding from LiDAR Perception in Autonomous Racing [0.0]
従来のシーケンシャルネットワークアプローチは、自律エージェントのリアルタイム知識と意思決定要求を満たすのに苦労する可能性がある。
本稿では,真のハードウェア対応並列処理が可能な高度なモデルを開発するための,新しいベースラインアーキテクチャを提案する。
提案モデルでは,LiDARセンサからの生の3Dポイントクラウドデータを入力として,両デバイスの2D Bird’s Eye View Mapに変換する。
論文 参考訳(メタデータ) (2024-12-24T04:56:32Z) - Data-Free Dynamic Compression of CNNs for Tractable Efficiency [46.498278084317704]
構造化プルーニング手法は, 精度が大幅に低下することなく浮動小数点演算を低下させる可能性を示唆している。
HASTE(Hashing for Tractable Efficiency)は,データフリーでプラグイン・アンド・プレイのコンボリューションモジュールで,トレーニングや微調整なしにネットワークのテスト時間推論コストを瞬時に低減する。
CIFAR-10とImageNetでは46.72%のFLOPを1.25%の精度で削減した。
論文 参考訳(メタデータ) (2023-09-29T13:09:40Z) - SWIFT: Rapid Decentralized Federated Learning via Wait-Free Model
Communication [11.763368822546468]
SWIFTはその待ち時間構造のため,実行時間に対してより高速に収束することを示す。
SWIFTは、画像分類、ID、非IIDデータ設定の損失レベルを生成し、既存のSOTAアルゴリズムよりも50%高速である。
論文 参考訳(メタデータ) (2022-10-25T14:01:21Z) - Receptive Field-based Segmentation for Distributed CNN Inference
Acceleration in Collaborative Edge Computing [93.67044879636093]
協調エッジコンピューティングネットワークにおける分散畳み込みニューラルネットワーク(CNN)を用いた推論高速化について検討する。
我々は,CNNモデルを複数の畳み込み層に分割するために,融合層並列化を用いた新しい協調エッジコンピューティングを提案する。
論文 参考訳(メタデータ) (2022-07-22T18:38:11Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Energy-Efficient Model Compression and Splitting for Collaborative
Inference Over Time-Varying Channels [52.60092598312894]
本稿では,エッジノードとリモートノード間のモデル圧縮と時間変化モデル分割を利用して,エッジデバイスにおける総エネルギーコストを削減する手法を提案する。
提案手法は, 検討されたベースラインと比較して, エネルギー消費が最小限であり, 排出コストが$CO$となる。
論文 参考訳(メタデータ) (2021-06-02T07:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。