論文の概要: C-NMT: A Collaborative Inference Framework for Neural Machine
Translation
- arxiv url: http://arxiv.org/abs/2204.04043v1
- Date: Fri, 8 Apr 2022 13:04:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-11 15:01:42.231085
- Title: C-NMT: A Collaborative Inference Framework for Neural Machine
Translation
- Title(参考訳): C-NMT:ニューラルマシン翻訳のための協調推論フレームワーク
- Authors: Yukai Chen, Roberta Chiaro, Enrico Macii, Massimo Poncino, Daniele
Jahier Pagliari
- Abstract要約: 協調推論(CI)は、ニューラルネットワーク翻訳(NMT)の中心におけるシーケンス・ツー・シーケンスマッピング問題に一度も適用されていない。
実験の結果,非協調的アプローチと比較して,CIはNMTのレイテンシを最大44%削減できることがわかった。
- 参考スコア(独自算出の注目度): 12.18517376088632
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Collaborative Inference (CI) optimizes the latency and energy consumption of
deep learning inference through the inter-operation of edge and cloud devices.
Albeit beneficial for other tasks, CI has never been applied to the sequence-
to-sequence mapping problem at the heart of Neural Machine Translation (NMT).
In this work, we address the specific issues of collaborative NMT, such as
estimating the latency required to generate the (unknown) output sequence, and
show how existing CI methods can be adapted to these applications. Our
experiments show that CI can reduce the latency of NMT by up to 44% compared to
a non-collaborative approach.
- Abstract(参考訳): コラボレーション推論(CI)は、エッジとクラウドデバイスの相互運用を通じて、ディープラーニング推論のレイテンシとエネルギー消費を最適化する。
他のタスクには有益だが、ニューラルネットワーク翻訳(NMT)の中心にあるシーケンス列マッピング問題にCIは適用されていない。
本稿では、(未知)出力シーケンスを生成するのに必要なレイテンシを推定するなど、協調nmtの特定の問題に対処し、既存のciメソッドをこれらのアプリケーションにどのように適用できるかを示す。
実験の結果,非協調的アプローチと比較して,CIはNMTのレイテンシを最大44%削減できることがわかった。
関連論文リスト
- Time-independent Spiking Neuron via Membrane Potential Estimation for Efficient Spiking Neural Networks [4.142699381024752]
スパイキングニューラルネットワーク(SNN)の計算的非効率性は、主に膜電位の逐次更新によるものである。
スパイキングニューロンの並列計算法である膜電位推定並列スパイキングニューロン(MPE-PSN)を提案する。
提案手法では,特に高次ニューロン密度条件下での計算効率の向上が期待できる。
論文 参考訳(メタデータ) (2024-09-08T05:14:22Z) - Parameter-Efficient Fine-Tuning for Continual Learning: A Neural Tangent Kernel Perspective [125.00228936051657]
本稿では,タスク関連機能を適応的に生成しながら,タスク固有のパラメータ記憶を不要にする新しいフレームワークNTK-CLを紹介する。
最適化可能なパラメータを適切な正規化で微調整することにより、NTK-CLは確立されたPEFT-CLベンチマーク上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-07-24T09:30:04Z) - MCU-MixQ: A HW/SW Co-optimized Mixed-precision Neural Network Design Framework for MCUs [9.719789698194154]
ニューラルネットワーク処理に十分なデータ幅を利用する混合精度ニューラルネットワーク(MPNN)は、厳密なリソース制約を満たすための効果的なアプローチである。
しかし、MCUクラスのISAにはサブバイトと混合精度のSIMD操作がない。
本研究では,複数の低ビット幅演算を単一の命令多重データ(SIMD)命令にパックする手法を提案する。
論文 参考訳(メタデータ) (2024-07-17T14:51:15Z) - DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。
フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文 参考訳(メタデータ) (2024-06-05T06:18:03Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Operational Support Estimator Networks [20.63209309898005]
本稿では,OSEN(Operational Support Estimator Networks)と呼ばれる新しい手法を提案する。
提案したOSENアプローチは、ディープネットワークを必要とせずに複雑な非線形性を学ぶことができる運用層で構成されている。
実験の結果,提案手法は計算効率を向上し,競合する手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-12T10:29:40Z) - Temporal Knowledge Sharing enable Spiking Neural Network Learning from
Past and Future [7.300220260073691]
スパイキングニューラルネットワーク(SNN)は、脳に似た情報処理機構のために、様々な領域の研究者から大きな注目を集めている。
しかしながら、SNNは通常、拡張時間ステップ、低時間情報利用、テストとトレーニングの間の一貫した時間ステップの必要性といった課題に悩まされる。
本稿では,SNNを時間的集約モデルとみなす新しい視点を提案する。
時間的知識共有(TKS)手法を導入し、異なる時間点間の情報交換を容易にする。
論文 参考訳(メタデータ) (2023-04-13T13:51:26Z) - Decomposition of Matrix Product States into Shallow Quantum Circuits [62.5210028594015]
テンソルネットワーク(TN)アルゴリズムは、パラメタライズド量子回路(PQC)にマッピングできる
本稿では,現実的な量子回路を用いてTN状態を近似する新しいプロトコルを提案する。
その結果、量子回路の逐次的な成長と最適化を含む1つの特定のプロトコルが、他の全ての手法より優れていることが明らかとなった。
論文 参考訳(メタデータ) (2022-09-01T17:08:41Z) - Nearest Neighbor Knowledge Distillation for Neural Machine Translation [50.0624778757462]
k-nearest-neighbor machine translation (NN-MT) は機械翻訳タスクにおける最先端の結果の多くを達成している。
NN-KDはベースNMTモデルをトレーニングし、NNの知識を直接学習する。
論文 参考訳(メタデータ) (2022-05-01T14:30:49Z) - Efficient Cluster-Based k-Nearest-Neighbor Machine Translation [65.69742565855395]
k-Nearest-Neighbor Machine Translation (kNN-MT)は、最近、ニューラルネットワーク翻訳(NMT)におけるドメイン適応のための非パラメトリックソリューションとして提案されている。
論文 参考訳(メタデータ) (2022-04-13T05:46:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。