論文の概要: Word Frequency Counting Based on Serverless MapReduce
- arxiv url: http://arxiv.org/abs/2601.00380v1
- Date: Thu, 01 Jan 2026 16:16:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 15:04:33.413286
- Title: Word Frequency Counting Based on Serverless MapReduce
- Title(参考訳): サーバーレスMapReduceに基づく単語の周波数カウント
- Authors: Hanzhe Li, Bingchen Lin, Mengyuan Xu,
- Abstract要約: 本稿では、サーバーレスコンピューティングプラットフォームに基づくMapプログラミングモデルを用いて、最も最適化されたMap関数数と特定のタスクに対するReducee関数数を求める。
同じ作業量に対して、広範な実験により、実行時間が減少し、プログラム全体の効率が、マップ関数の数が増え、関数が減少するにつれて、異なる速度で改善される。
- 参考スコア(独自算出の注目度): 3.8888092059964054
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the increasing demand for high-performance and high-efficiency computing, cloud computing, especially serverless computing, has gradually become a research hotspot in recent years, attracting numerous research attention. Meanwhile, MapReduce, which is a popular big data processing model in the industry, has been widely applied in various fields. Inspired by the serverless framework of Function as a Service and the high concurrency and robustness of MapReduce programming model, this paper focus on combining them to reduce the time span and increase the efficiency when executing the word frequency counting task. In this case, the paper use a MapReduce programming model based on a serverless computing platform to figure out the most optimized number of Map functions and Reduce functions for a particular task. For the same amount of workload, extensive experiments show both execution time reduces and the overall efficiency of the program improves at different rates as the number of map functions and reduce functions increases. This paper suppose the discovery of the most optimized number of map and reduce functions can help cooperations and programmers figure out the most optimized solutions.
- Abstract(参考訳): 高性能・高効率コンピューティングの需要が高まっている中、クラウドコンピューティング、特にサーバレスコンピューティングは、近年徐々に研究ホットスポットとなり、多くの研究の注目を集めている。
一方、MapReduceは業界で人気のあるビッグデータ処理モデルであり、様々な分野で広く適用されています。
本稿では,関数・アズ・ア・サービス(Function as a Service)のサーバレスフレームワークとMapReduceプログラミングモデルの高並列性とロバスト性から着想を得た。
この場合、サーバーレスコンピューティングプラットフォームに基づくMapReduceプログラミングモデルを使用して、最も最適化されたMap関数の数を把握し、特定のタスクに対して関数を還元する。
同じ作業量に対して、広範な実験により、実行時間が減少し、プログラム全体の効率が、マップ関数の数が増え、関数が減少するにつれて、異なる速度で改善される。
本稿では、最も最適化されたマップと関数の発見が、協調やプログラマが最も最適化されたソリューションを見つけるのに役立つと仮定する。
関連論文リスト
- Deep Lookup Network [76.66809324649154]
多くのリソース制限エッジデバイスでは、複雑な演算をルックアップテーブルを通じて計算し、計算コストを削減できる。
本稿では,ニューラルネットワーク構築の基本的な操作として使用できる汎用的で効率的な検索操作を提案する。
計算コストのかかる乗算演算をルックアップ演算に置き換えることで、画像分類、画像超解像、点クラウド分類タスクのためのルックアップネットワークを開発する。
論文 参考訳(メタデータ) (2025-09-17T03:31:41Z) - Optimizing Tensor Computation Graphs with Equality Saturation and Monte Carlo Tree Search [0.0]
モンテカルロ木探索を用いて優れた表現を構築するテンソルグラフ書き換え手法を提案する。
提案手法は,既存の手法と比較して,ニューラルネットワークの推論速度を最大11%向上させる。
論文 参考訳(メタデータ) (2024-10-07T22:22:02Z) - Memory-Scalable and Simplified Functional Map Learning [32.088809326158554]
本稿では,メモリスケーラブルで効率的な関数型マップ学習パイプラインを提案する。
関数マップの構造を利用することで、メモリにポイントワイズマップを格納することなく、同じ結果が得られる可能性を提供します。
このアルゴリズムを後処理のステップで使用する多くの関数型マップ学習法とは異なり、列車時に簡単に利用できる。
論文 参考訳(メタデータ) (2024-03-30T12:01:04Z) - Learning to Optimize Permutation Flow Shop Scheduling via Graph-based
Imitation Learning [70.65666982566655]
置換フローショップスケジューリング(PFSS)は製造業で広く使われている。
我々は,より安定かつ正確に収束を加速する専門家主導の模倣学習を通じてモデルを訓練することを提案する。
我々のモデルのネットワークパラメータはわずか37%に減少し、エキスパートソリューションに対する我々のモデルの解のギャップは平均6.8%から1.3%に減少する。
論文 参考訳(メタデータ) (2022-10-31T09:46:26Z) - NumS: Scalable Array Programming for the Cloud [82.827921577004]
タスクベース分散システム上でNumPyのような表現を最適化する配列プログラミングライブラリであるNumSを提案する。
これはLoad Simulated Hierarchical Scheduling (LSHS)と呼ばれる新しいスケジューラによって実現される。
LSHSは、ネットワーク負荷を2倍減らし、メモリを4倍減らし、ロジスティック回帰問題において実行時間を10倍減らし、Rayの性能を向上させる。
論文 参考訳(メタデータ) (2022-06-28T20:13:40Z) - Multi-Robot Active Mapping via Neural Bipartite Graph Matching [49.72892929603187]
本稿では,最小時間ステップにおけるシーンマップ構築の完全化を目的としたマルチロボットアクティブマッピングの問題点について検討する。
この問題の鍵は、より効率的なロボットの動きを可能にするゴール位置推定にある。
本稿では,ニューラルコマッピング(NeuralCoMapping)という新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-30T14:03:17Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - HeAT -- a Distributed and GPU-accelerated Tensor Framework for Data
Analytics [0.0]
HeATは、大規模並列処理のための配列ベースの数値プログラミングフレームワークで、簡単に使えるNumPyライクなAPIがある。
HeATはPyTorchをノードローカルな熱心な実行エンジンとして使用し、MPIを介して任意の規模の大規模高性能コンピューティングシステムにワークロードを分散する。
同様のフレームワークと比較すると、HeATは最大2桁のスピードアップを達成する。
論文 参考訳(メタデータ) (2020-07-27T13:33:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。