論文の概要: Parallel Composition of Weighted Finite-State Transducers
- arxiv url: http://arxiv.org/abs/2110.02848v1
- Date: Wed, 6 Oct 2021 15:19:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-07 14:28:18.383459
- Title: Parallel Composition of Weighted Finite-State Transducers
- Title(参考訳): 重み付き有限状態トランスデューサの並列構成
- Authors: Shubho Sengupta, Vineel Pratap, Awni Hannun
- Abstract要約: 並列合成のためのアルゴリズムを提案し,それをグラフィックス処理ユニットに実装する。
我々は,ランダムグラフの構成と,音声認識によく使用されるグラフの構成について,並列アルゴリズムをベンチマークした。
並列合成は入力グラフのサイズに優れており、大きなグラフの場合、シーケンシャルCPUアルゴリズムの10倍から30倍高速である。
- 参考スコア(独自算出の注目度): 13.14627992384895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Finite-state transducers (FSTs) are frequently used in speech recognition.
Transducer composition is an essential operation for combining different
sources of information at different granularities. However, composition is also
one of the more computationally expensive operations. Due to the heterogeneous
structure of FSTs, parallel algorithms for composition are suboptimal in
efficiency, generality, or both. We propose an algorithm for parallel
composition and implement it on graphics processing units. We benchmark our
parallel algorithm on the composition of random graphs and the composition of
graphs commonly used in speech recognition. The parallel composition scales
better with the size of the input graphs and for large graphs can be as much as
10 to 30 times faster than a sequential CPU algorithm.
- Abstract(参考訳): 有限状態トランスデューサ(fsts)は音声認識によく用いられる。
トランスデューサ組成物は、異なる粒度で異なる情報ソースを結合するための必須操作である。
しかし、合成は計算コストの高い演算の1つでもある。
FSTの異種構造のため、合成のための並列アルゴリズムは効率、一般性、あるいはその両方において最適である。
並列合成のためのアルゴリズムを提案し,それをグラフィックス処理ユニットに実装する。
本稿では,ランダムグラフの構成と音声認識によく使われるグラフの構成について並列アルゴリズムをベンチマークする。
並列構成は入力グラフのサイズでスケールし、大規模なグラフの場合、シーケンシャルcpuアルゴリズムの10倍から30倍の速度で構成できる。
関連論文リスト
- PASCO (PArallel Structured COarsening): an overlay to speed up graph clustering algorithms [14.601622103700516]
グラフのクラスタリングノードは、グラフ解析の土台である。
いくつかの一般的な方法は、非常に大きなグラフには適さない。
この研究は、クラスタリングアルゴリズムを高速化するオーバーレイであるPASCOを導入している。
論文 参考訳(メタデータ) (2024-12-18T08:15:55Z) - Ensemble Quadratic Assignment Network for Graph Matching [52.20001802006391]
グラフマッチングはコンピュータビジョンやパターン認識において一般的に用いられる技法である。
最近のデータ駆動型アプローチは、グラフマッチングの精度を著しく改善した。
データ駆動手法と従来の手法の利点を組み合わせたグラフニューラルネットワーク(GNN)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2024-03-11T06:34:05Z) - Sequential and Shared-Memory Parallel Algorithms for Partitioned Local
Depths [0.0]
PaLDは相対距離に基づいて対関係の強さを同定する手法である。
性能最適化戦略を導入し、ベースラインのシーケンシャルな実装に対して、最大29ドル以上のシーケンシャルなスピードアップを実現した。
論文 参考訳(メタデータ) (2023-07-31T13:32:39Z) - Parallel Algorithms Align with Neural Execution [7.535219325248997]
しかし並列アルゴリズムは計算能力を最大限に活用できるため、実行すべきレイヤは少ない。
このことは、CLRSフレームワーク上のシーケンシャルなコンポーネントに対して、検索、ソート、および強力な接続されたコンポーネントの並列実装を比較する際に観察されるように、トレーニング時間を劇的に短縮します。
論文 参考訳(メタデータ) (2023-07-08T21:28:20Z) - PARTIME: Scalable and Parallel Processing Over Time with Deep Neural
Networks [68.96484488899901]
PartIMEは、データが継続的にストリーミングされるたびにニューラルネットワークを高速化するように設計されたライブラリです。
PartIMEは、ストリームから利用可能になった時点で、各データサンプルの処理を開始する。
オンライン学習において、PartialIMEと古典的な非並列ニューラル計算を経験的に比較するために実験が行われる。
論文 参考訳(メタデータ) (2022-10-17T14:49:14Z) - AsySQN: Faster Vertical Federated Learning Algorithms with Better
Computation Resource Utilization [159.75564904944707]
垂直連合学習(VFL)のための非同期準ニュートン(AsySQN)フレームワークを提案する。
提案アルゴリズムは、逆ヘッセン行列を明示的に計算することなく、近似して降下ステップをスケールする。
本稿では,非同期計算を採用することにより,計算資源の有効利用が期待できることを示す。
論文 参考訳(メタデータ) (2021-09-26T07:56:10Z) - Temporal Parallelization of Inference in Hidden Markov Models [0.0]
本稿では隠れマルコフモデル(hmms)における推論の並列化アルゴリズムを提案する。
パラレル・バックワード型フィルタ・スムージングアルゴリズムとパラレル・ビタビ型max-a-posteriori(MAP)を提案する。
高並列処理ユニット(GPU)における提案手法の性能と古典的手法とを実証的に比較する。
論文 参考訳(メタデータ) (2021-02-10T21:26:09Z) - Concurrent Alternating Least Squares for multiple simultaneous Canonical
Polyadic Decompositions [2.3513645401551333]
我々は,Matlabにインターフェースを提供するConcurrent ALSアルゴリズムとライブラリを紹介する。
我々は,同じテンソルの複数の分解をアルゴリズムレベルで融合させて算術強度を増大させる方法を示す。
人工データセットと実データセットの実験結果は、算術強度の増加による完了までの時間短縮を示す。
論文 参考訳(メタデータ) (2020-10-09T16:55:46Z) - MPLP++: Fast, Parallel Dual Block-Coordinate Ascent for Dense Graphical
Models [96.1052289276254]
この研究は、人気のあるDual Block-Coordinate Ascent原則に基づく新しいMAP-solverを導入している。
驚いたことに、性能の低い解法に小さな変更を加えることで、既存の解法を大きなマージンで大幅に上回る新しい解法MPLP++を導出します。
論文 参考訳(メタデータ) (2020-04-16T16:20:53Z) - Minimal Filtering Algorithms for Convolutional Neural Networks [82.24592140096622]
我々は,M=3,5,7,9,11の基本的なフィルタリング操作を実装するための完全並列ハードウェア指向アルゴリズムを開発した。
各ケースにおける提案アルゴリズムの完全な並列ハードウェア実装は、組込み乗算器の数を約30%削減する。
論文 参考訳(メタデータ) (2020-04-12T13:18:25Z) - Accelerating Feedforward Computation via Parallel Nonlinear Equation
Solving [106.63673243937492]
ニューラルネットワークの評価や自己回帰モデルからのサンプリングなどのフィードフォワード計算は、機械学習においてユビキタスである。
本稿では,非線形方程式の解法としてフィードフォワード計算の課題を定式化し,ジャコビ・ガウス・シーデル固定点法とハイブリッド法を用いて解を求める。
提案手法は, 並列化可能な繰り返し回数の削減(あるいは等値化)により, 元のフィードフォワード計算と全く同じ値が与えられることを保証し, 十分な並列化計算能力を付与する。
論文 参考訳(メタデータ) (2020-02-10T10:11:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。