論文の概要: A Variant of Concurrent Constraint Programming on GPU
- arxiv url: http://arxiv.org/abs/2207.12116v1
- Date: Mon, 18 Jul 2022 11:45:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-31 14:24:26.161402
- Title: A Variant of Concurrent Constraint Programming on GPU
- Title(参考訳): GPUにおける並行制約プログラミングのバリアント
- Authors: Pierre Talbot, Fr\'ed\'eric Pinel, Pascal Bouvry
- Abstract要約: 我々はGPUで完全にプログラムされたシンプルな制約解決器であるTurboを開発した。
Turboは、我々のアプローチの正しさを検証し、並列CPUベースのソルバと正に比較する。
- 参考スコア(独自算出の注目度): 1.6242924916178283
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The number of cores on graphical computing units (GPUs) is reaching thousands
nowadays, whereas the clock speed of processors stagnates. Unfortunately,
constraint programming solvers do not take advantage yet of GPU parallelism.
One reason is that constraint solvers were primarily designed within the mental
frame of sequential computation. To solve this issue, we take a step back and
contribute to a simple, intrinsically parallel, lock-free and formally correct
programming language based on concurrent constraint programming. We then
re-examine parallel constraint solving on GPUs within this formalism, and
develop Turbo, a simple constraint solver entirely programmed on GPUs. Turbo
validates the correctness of our approach and compares positively to a parallel
CPU-based solver.
- Abstract(参考訳): グラフィカル・コンピューティング・ユニット(GPU)のコア数は数千に達しているが、プロセッサのクロック速度は停滞している。
残念ながら、制約プログラミングソルバは、gpu並列処理をまだ活用していない。
1つの理由は、制約ソルバが主にシーケンシャル計算のメンタルフレーム内で設計されていたためである。
この問題を解決するため、我々は、並列制約プログラミングに基づいた、単純で本質的に並列でロックフリーで形式的に正しいプログラミング言語に貢献する。
次に、この形式内でGPU上の並列制約解を再検討し、GPUで完全にプログラムされた単純な制約解法であるTurboを開発する。
Turboは我々のアプローチの正しさを検証し、並列CPUベースの解法と比較する。
関連論文リスト
- Towards end-to-end ASP computation [8.804696601388706]
本稿では,与えられた制約を満たす線形代数的安定モデルと解集合プログラミング(ASP)のエンドツーエンドアプローチを提案する。
我々は、行列化された正規論理プログラムから構築されたコスト関数の数値最小化として、Lin-Zhaoの定理 citeLin04 をベクトル空間内で直接制約とともに実装する。
3色およびハミルトンサイクル問題を含むプログラミング例を用いて、我々のアプローチを実証的に検証する。
論文 参考訳(メタデータ) (2023-06-12T02:00:22Z) - Optimization for Classical Machine Learning Problems on the GPU [12.162243004602505]
我々は、GPU上の制約付き最適化問題を解決するためにGENOフレームワークを拡張した。
このフレームワークは、ユーザが制約付き最適化問題を、読みやすいモデリング言語で指定できるようにする。
そして、この仕様からソルバが自動的に生成される。
論文 参考訳(メタデータ) (2022-03-30T14:15:54Z) - PLSSVM: A (multi-)GPGPU-accelerated Least Squares Support Vector Machine [68.8204255655161]
Support Vector Machines (SVM) は機械学習で広く使われている。
しかし、現代的で最適化された実装でさえ、最先端ハードウェア上の大きな非自明な高密度データセットにはうまくスケールしない。
PLSSVMはLVMのドロップイン代替として使用できる。
論文 参考訳(メタデータ) (2022-02-25T13:24:23Z) - FastDOG: Fast Discrete Optimization on GPU [23.281726932718232]
本稿では,構造化予測で発生する0-1整数線形プログラムを解くために,並列に並列なラグランジュ分解法を提案する。
我々の原始的アルゴリズムと双対アルゴリズムは、サブプロブレムとBDDに対する最適化の同期をほとんど必要としません。
問題に依存しない状態で、最先端の特殊アルゴリズムに近づいたり、優れていたりします。
論文 参考訳(メタデータ) (2021-11-19T15:20:10Z) - RTGPU: Real-Time GPU Scheduling of Hard Deadline Parallel Tasks with
Fine-Grain Utilization [5.02836935036198]
本論文では,複数のGPUアプリケーションの実行をリアルタイムにスケジュール可能なRTGPUを提案する。
提案手法は,従来の作業に比べてスケジューリング性に優れ,複数のGPUアプリケーションに厳しい期限をリアルタイムに保証する。
論文 参考訳(メタデータ) (2021-01-25T22:34:06Z) - Nimble: Lightweight and Parallel GPU Task Scheduling for Deep Learning [7.43260596107574]
我々は、最小のスケジューリングオーバーヘッドでタスクを並列に実行する、ディープラーニング(DL)実行エンジンであるNimbleを提案する。
Nableは、単一のGPUで複数のGPUストリームを活用することで、GPUタスクの実行を自動的に並列化する。
PyTorchと比較して、Nimbleは推論とトレーニングを最大22.34$times$と3.61$times$で高速化している。
論文 参考訳(メタデータ) (2020-12-04T17:25:46Z) - Hybrid Models for Learning to Branch [81.93868699246214]
我々はCPUマシン上で効率的な分岐を行うための新しいハイブリッドアーキテクチャを提案する。
提案アーキテクチャは,GNNの表現力と分岐処理のための計算コストの低い多層パーセプトロン(MLP)を組み合わせる。
論文 参考訳(メタデータ) (2020-06-26T21:03:45Z) - Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。
最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。
ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文 参考訳(メタデータ) (2020-06-18T08:16:25Z) - Sparsified Linear Programming for Zero-Sum Equilibrium Finding [89.30539368124025]
我々は、この問題に対して全く異なるアプローチを示し、それは競争力があり、しばしば、以前の最先端技術よりも桁違いに優れている。
ポーカーエンドゲームの実験により、現代の線形プログラムソルバは、ゲーム固有のCFRの現代的な変種でさえも競合することを示した。
論文 参考訳(メタデータ) (2020-06-05T13:48:26Z) - MPLP++: Fast, Parallel Dual Block-Coordinate Ascent for Dense Graphical
Models [96.1052289276254]
この研究は、人気のあるDual Block-Coordinate Ascent原則に基づく新しいMAP-solverを導入している。
驚いたことに、性能の低い解法に小さな変更を加えることで、既存の解法を大きなマージンで大幅に上回る新しい解法MPLP++を導出します。
論文 参考訳(メタデータ) (2020-04-16T16:20:53Z) - Lagrangian Decomposition for Neural Network Verification [148.0448557991349]
ニューラルネットワーク検証の基本的なコンポーネントは、出力が取ることのできる値のバウンダリの計算である。
ラグランジアン分解に基づく新しい手法を提案する。
ランニングタイムのごく一部で、既成の解法に匹敵するバウンダリが得られることを示す。
論文 参考訳(メタデータ) (2020-02-24T17:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。