論文の概要: Bine Trees: Enhancing Collective Operations by Optimizing Communication Locality
- arxiv url: http://arxiv.org/abs/2508.17311v1
- Date: Sun, 24 Aug 2025 11:40:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.461839
- Title: Bine Trees: Enhancing Collective Operations by Optimizing Communication Locality
- Title(参考訳): Bine Trees: コミュニケーションの局所性最適化による集合的操作の強化
- Authors: Daniele De Sensi, Saverio Pasqualoni, Lorenzo Piarulli, Tommaso Bonato, Seydou Ba, Matteo Turisini, Jens Domke, Torsten Hoefler,
- Abstract要約: コミュニケーションの局所性を改善するアルゴリズムの一群であるBine Treeを提示する。
林木は二分木と蝶の一般性を維持し、グローバルリンクのトラフィックを最大33%削減している。
我々は8つのBineベースの集合体を実装し、Dragonfly, Dragonfly+, oversubscribe fat-tree, torus topologiesの4つの大規模スーパーコンピュータ上でそれらを評価した。
- 参考スコア(独自算出の注目度): 15.158856693001193
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Communication locality plays a key role in the performance of collective operations on large HPC systems, especially on oversubscribed networks where groups of nodes are fully connected internally but sparsely linked through global connections. We present Bine (binomial negabinary) trees, a family of collective algorithms that improve communication locality. Bine trees maintain the generality of binomial trees and butterflies while cutting global-link traffic by up to 33%. We implement eight Bine-based collectives and evaluate them on four large-scale supercomputers with Dragonfly, Dragonfly+, oversubscribed fat-tree, and torus topologies, achieving up to 5x speedups and consistent reductions in global-link traffic across different vector sizes and node counts.
- Abstract(参考訳): 通信の局所性は、大規模なHPCシステム、特にノード群が内部で完全に接続されているが、グローバル接続を介して疎結合であるオーバーサブスクライブネットワークにおいて、集合的操作のパフォーマンスにおいて重要な役割を担っている。
本稿では,コミュニケーションの局所性を改善するアルゴリズムの一群であるBine木について述べる。
林木は二分木と蝶の一般性を維持し、グローバルリンクのトラフィックを最大33%削減している。
我々は8つのBineベースの集合を実装し、Dragonfly、Dragonfly+、過剰に登録された太字木、トーラストポロジーを持つ4つの大規模スーパーコンピュータ上でそれらを評価し、最大5倍のスピードアップと、異なるベクトルサイズとノード数にわたるグローバルリンクトラフィックの一貫した削減を実現した。
関連論文リスト
- Ents: An Efficient Three-party Training Framework for Decision Trees by Communication Optimization [11.331841403808541]
セキュアなマルチパーティ計算に基づく意思決定ツリーのためのマルチパーティトレーニングフレームワークにより、複数のパーティが、プライバシ保護を備えた分散プライベートデータ上で、高性能モデルをトレーニングすることができる。
決定木のための既存のマルチパーティトレーニングフレームワークは、通信オーバーヘッドが大きいため、コミュニケーションの非効率性を実証する。
本稿では,コミュニケーション最適化による意思決定木のための効率的な3要素学習フレームワークであるEntsを提案する。
論文 参考訳(メタデータ) (2024-06-12T07:13:11Z) - ForestColl: Throughput-Optimal Collective Communications on Heterogeneous Network Fabrics [3.4595857637420604]
ネットワークトポロジのスループット最適スケジュールを生成するツールであるForestCollを紹介する。
ForestCollは、ファブリックと直接アクセル接続の両方を含む、あらゆるネットワークファブリックをサポートしている。
論文 参考訳(メタデータ) (2024-02-09T21:21:17Z) - Learning a Decision Tree Algorithm with Transformers [75.96920867382859]
メタ学習によってトレーニングされたトランスフォーマーベースのモデルであるMetaTreeを導入し、強力な決定木を直接生成する。
我々は、多くのデータセットに欲求決定木とグローバルに最適化された決定木の両方を適合させ、MetaTreeを訓練して、強力な一般化性能を実現する木のみを生成する。
論文 参考訳(メタデータ) (2024-02-06T07:40:53Z) - Dynamic Collaborative Multi-Agent Reinforcement Learning Communication
for Autonomous Drone Reforestation [0.0]
我々は,協調型マルチエージェント強化学習(MARL)による自律型ドローンによる森林再生にアプローチする。
エージェントは動的に変化するネットワークの一部として通信することができる。
その結果、コミュニケーションが協調し、集団的パフォーマンスを高め、正確さを植え付け、個々のエージェントのリスクテイク性を高めるかが示される。
論文 参考訳(メタデータ) (2022-11-14T13:25:22Z) - DeHIN: A Decentralized Framework for Embedding Large-scale Heterogeneous
Information Networks [64.62314068155997]
本稿では,異種情報ネットワーク(DeHIN)のための分散埋め込みフレームワークについて述べる。
DeHINは、大きなHINをハイパーグラフとして革新的に定式化するコンテキスト保存分割機構を提供する。
当社のフレームワークでは,木のようなパイプラインを採用することで,効率よくHINを分割する分散戦略を採用しています。
論文 参考訳(メタデータ) (2022-01-08T04:08:36Z) - Graph Representation Learning via Contrasting Cluster Assignments [57.87743170674533]
GRCCAと呼ばれるクラスタ割り当てを対比して、教師なしグラフ表現モデルを提案する。
クラスタリングアルゴリズムとコントラスト学習を組み合わせることで、局所的およびグローバルな情報を合成的にうまく活用する動機付けがある。
GRCCAは、ほとんどのタスクにおいて強力な競争力を持っている。
論文 参考訳(メタデータ) (2021-12-15T07:28:58Z) - Towards Deeper Graph Neural Networks with Differentiable Group
Normalization [61.20639338417576]
グラフニューラルネットワーク(GNN)は、隣接するノードを集約することでノードの表現を学習する。
オーバースムーシングは、レイヤーの数が増えるにつれてGNNのパフォーマンスが制限される重要な問題のひとつです。
2つのオーバースムースなメトリクスと新しいテクニック、すなわち微分可能群正規化(DGN)を導入する。
論文 参考訳(メタデータ) (2020-06-12T07:18:02Z) - Dense Residual Network: Enhancing Global Dense Feature Flow for
Character Recognition [75.4027660840568]
本稿では,すべての畳み込み層から階層的特徴をフルに活用することにより,局所的・大域的特徴フローを改善する方法について検討する。
技術的には、テキスト認識のための効率的で効果的なCNNフレームワークであるFDRN(Fast Dense Residual Network)を提案する。
論文 参考訳(メタデータ) (2020-01-23T06:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。