論文の概要: An Efficient Summation Algorithm for the Accuracy, Convergence and
Reproducibility of Parallel Numerical Methods
- arxiv url: http://arxiv.org/abs/2205.05339v1
- Date: Wed, 11 May 2022 08:31:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 20:01:11.620456
- Title: An Efficient Summation Algorithm for the Accuracy, Convergence and
Reproducibility of Parallel Numerical Methods
- Title(参考訳): 並列数値法の正確性, 収束性, 再現性に対する効率的な要約アルゴリズム
- Authors: Farah Benmouhoub (UPVD), Pierre-Lo\"ic Garoche (ENAC), Matthieu Martel
(UPVD)
- Abstract要約: 我々は浮動小数点数の列をまとめる新しい並列アルゴリズムを導入した。
プロセッサ数で簡単にスケールアップできるこのアルゴリズムは、まず同じ指数の数を加算する。
この記事では、いくつかの特性に関して、その効率を広範囲に分析する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nowadays, parallel computing is ubiquitous in several application fields,
both in engineering and science. The computations rely on the floating-point
arithmetic specified by the IEEE754 Standard. In this context, an elementary
brick of computation, used everywhere, is the sum of a sequence of numbers.
This sum is subject to many numerical errors in floating-point arithmetic. To
alleviate this issue, we have introduced a new parallel algorithm for summing a
sequence of floating-point numbers. This algorithm which scales up easily with
the number of processors, adds numbers of the same exponents first. In this
article, our main contribution is an extensive analysis of its efficiency with
respect to several properties: accuracy, convergence and reproducibility. In
order to show the usefulness of our algorithm, we have chosen a set of
representative numerical methods which are Simpson, Jacobi, LU factorization
and the Iterated power method.
- Abstract(参考訳): 現在、並列コンピューティングは、工学と科学の両方において、いくつかのアプリケーション分野においてユビキタスである。
計算はIEEE754標準で指定された浮動小数点演算に依存する。
この文脈では、どこでも使われる基本的な計算ブロックは、数列の和である。
この和は浮動小数点演算において多くの数値誤差を負う。
この問題を軽減するために,浮動小数点数の列を要約する新しい並列アルゴリズムを導入した。
このアルゴリズムはプロセッサの数で容易にスケールアップでき、最初に同じ指数の数を追加する。
本稿では, その効率性について, 精度, 収束性, 再現性など, 様々な特性について広範な分析を行った。
提案手法の有用性を示すために,シンプソン法,ヤコビ法,lu因子分解法,反復パワー法などの代表的な数値手法を選択した。
関連論文リスト
- Closing the Computational-Query Depth Gap in Parallel Stochastic Convex Optimization [26.36906884097317]
我々は,リプシッツ,凸関数を次数次オラクルで最小化するための新しい並列アルゴリズムを開発した。
その結果,最もよく知られた問合せ深度と並列アルゴリズムの最もよく知られた計算深度とのギャップを埋めることができた。
論文 参考訳(メタデータ) (2024-06-11T15:41:48Z) - An Efficient Algorithm for Clustered Multi-Task Compressive Sensing [60.70532293880842]
クラスタ化マルチタスク圧縮センシングは、複数の圧縮センシングタスクを解決する階層モデルである。
このモデルに対する既存の推論アルゴリズムは計算コストが高く、高次元ではうまくスケールしない。
本稿では,これらの共分散行列を明示的に計算する必要をなくし,モデル推論を大幅に高速化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-30T15:57:14Z) - Fast Algorithms of Bath Calculations in Simulations of Quantum
System-Bath Dynamics [5.989041429080286]
ダイソン級数の和に対する高速アルゴリズムと量子系に対するインヒワームモンテカルロ法を提案する。
このアルゴリズムは、最も高価な部分は浴場影響関数の計算から得られる積分微分方程式の進化に基づいている。
提案した高速アルゴリズムは,時間ステップの総数である$N$を$O(N)$とすることで,そのような計算数を削減できることが証明されている。
論文 参考訳(メタデータ) (2022-02-13T03:00:46Z) - Using Shor's algorithm on near term Quantum computers: a reduced version [0.0]
我々は、ノイズの多い量子デバイス上で分解可能な数値の範囲を拡大するステップを推し進めるShorのアルゴリズムの縮小版を導入する。
特に、ほとんどのケースで注目すべき結果が得られており、しばしば提案されたアルゴリズムの1つで与えられた数を分解できる。
論文 参考訳(メタデータ) (2021-12-23T15:36:59Z) - Efficient Floating Point Arithmetic for Quantum Computers [1.189955933770711]
量子コンピューティングの大きな約束の1つは、重ね合わせ現象を用いたSIMD(単一命令 - 複数のデータ)演算の実現である。
我々は、符号なし整数量子回路を便利に生成できる半ブールと呼ばれる符号化形式を導入している。
我々は、このタイプの評価を、アンシラのないインプレース乗算や整数係数評価などの追加機能で拡張する。
論文 参考訳(メタデータ) (2021-12-20T14:00:36Z) - Fast Projected Newton-like Method for Precision Matrix Estimation under
Total Positivity [15.023842222803058]
現在のアルゴリズムはブロック座標降下法や近点アルゴリズムを用いて設計されている。
本稿では,2次元投影法に基づく新しいアルゴリズムを提案し,慎重に設計された探索方向と変数分割方式を取り入れた。
合成および実世界のデータセットに対する実験結果から,提案アルゴリズムは最先端の手法と比較して計算効率を著しく向上させることを示した。
論文 参考訳(メタデータ) (2021-12-03T14:39:10Z) - Provably Faster Algorithms for Bilevel Optimization [54.83583213812667]
バイレベル最適化は多くの重要な機械学習アプリケーションに広く適用されている。
両レベル最適化のための2つの新しいアルゴリズムを提案する。
両アルゴリズムが$mathcalO(epsilon-1.5)$の複雑さを達成し,既存のアルゴリズムを桁違いに上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-08T21:05:30Z) - Quantum-Inspired Algorithms from Randomized Numerical Linear Algebra [53.46106569419296]
我々は、リコメンダシステムと最小二乗回帰のためのクエリをサポートする古典的な(量子でない)動的データ構造を作成する。
これらの問題に対する以前の量子インスパイアされたアルゴリズムは、レバレッジやリッジレベレッジスコアを偽装してサンプリングしていると我々は主張する。
論文 参考訳(メタデータ) (2020-11-09T01:13:07Z) - Refined bounds for algorithm configuration: The knife-edge of dual class
approximability [94.83809668933021]
トレーニングセットが、トレーニングセット上でのパラメータの平均メトリックのパフォーマンスが、予想される将来的なパフォーマンスに最も近いことを保証するために、どの程度の規模が必要かを調査する。
この近似が L-無限ノルムの下で成り立つなら、強いサンプル複雑性境界を与えることができる。
我々は、コンピュータ科学において最も強力なツールの一つである整数プログラミングの文脈において、我々の限界を実証的に評価する。
論文 参考訳(メタデータ) (2020-06-21T15:32:21Z) - Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。
最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。
ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文 参考訳(メタデータ) (2020-06-18T08:16:25Z) - Accelerating Feedforward Computation via Parallel Nonlinear Equation
Solving [106.63673243937492]
ニューラルネットワークの評価や自己回帰モデルからのサンプリングなどのフィードフォワード計算は、機械学習においてユビキタスである。
本稿では,非線形方程式の解法としてフィードフォワード計算の課題を定式化し,ジャコビ・ガウス・シーデル固定点法とハイブリッド法を用いて解を求める。
提案手法は, 並列化可能な繰り返し回数の削減(あるいは等値化)により, 元のフィードフォワード計算と全く同じ値が与えられることを保証し, 十分な並列化計算能力を付与する。
論文 参考訳(メタデータ) (2020-02-10T10:11:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。