論文の概要: A Survey on Large-scale Machine Learning
- arxiv url: http://arxiv.org/abs/2008.03911v1
- Date: Mon, 10 Aug 2020 06:07:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 22:19:45.649170
- Title: A Survey on Large-scale Machine Learning
- Title(参考訳): 大規模機械学習に関する調査
- Authors: Meng Wang, Weijie Fu, Xiangnan He, Shijie Hao, Xindong Wu
- Abstract要約: 機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
- 参考スコア(独自算出の注目度): 67.6997613600942
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning can provide deep insights into data, allowing machines to
make high-quality predictions and having been widely used in real-world
applications, such as text mining, visual classification, and recommender
systems. However, most sophisticated machine learning approaches suffer from
huge time costs when operating on large-scale data. This issue calls for the
need of {Large-scale Machine Learning} (LML), which aims to learn patterns from
big data with comparable performance efficiently. In this paper, we offer a
systematic survey on existing LML methods to provide a blueprint for the future
developments of this area. We first divide these LML methods according to the
ways of improving the scalability: 1) model simplification on computational
complexities, 2) optimization approximation on computational efficiency, and 3)
computation parallelism on computational capabilities. Then we categorize the
methods in each perspective according to their targeted scenarios and introduce
representative methods in line with intrinsic strategies. Lastly, we analyze
their limitations and discuss potential directions as well as open issues that
are promising to address in the future.
- Abstract(参考訳): 機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行い、テキストマイニング、視覚分類、レコメンダシステムといった現実世界のアプリケーションで広く使われている。
しかしながら、ほとんどの高度な機械学習アプローチは、大規模データを操作する際の膨大な時間コストに苦しむ。
この問題では,ビッグデータからパターンを効率よく学習することを目的とした,大規模機械学習(LML)の必要性が求められている。
本稿では,この領域の今後の発展のための青写真を提供するため,既存のLML手法を体系的に調査する。
まず、スケーラビリティを改善する方法に従って、これらのLMLメソッドを分割します。
1)計算複雑性に関するモデル単純化
2)計算効率の最適化近似、及び
3)計算能力の並列性。
次に,対象とするシナリオに応じて各視点の手法を分類し,本質的な戦略に沿った代表的手法を導入する。
最後に、これらの制限を分析し、潜在的な方向性を議論するとともに、将来的に対処する見込みのあるオープンな課題について論じる。
関連論文リスト
- Topological Methods in Machine Learning: A Tutorial for Practitioners [4.297070083645049]
トポロジカル機械学習(TML)は、代数的トポロジの技法を利用して複雑なデータ構造を分析する分野である。
このチュートリアルは、2つの重要なTMLテクニック、永続的ホモロジーとMapperアルゴリズムの包括的な紹介を提供する。
アクセシビリティを高めるために、私たちはデータ中心のアプローチを採用し、読者はこれらのテクニックを関連するタスクに適用したハンズオン体験を得ることができる。
論文 参考訳(メタデータ) (2024-09-04T17:44:52Z) - LLM Inference Unveiled: Survey and Roofline Model Insights [62.92811060490876]
大規模言語モデル(LLM)推論は急速に進化しており、機会と課題のユニークなブレンドを提示している。
本調査は, 研究状況を要約するだけでなく, 屋上モデルに基づく枠組みを導入することによって, 従来の文献レビューから際立っている。
このフレームワークは、ハードウェアデバイスにLSMをデプロイする際のボトルネックを特定し、実用上の問題を明確に理解する。
論文 参考訳(メタデータ) (2024-02-26T07:33:05Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - Towards Efficient Generative Large Language Model Serving: A Survey from
Algorithms to Systems [14.355768064425598]
生成型大規模言語モデル(LLM)が最前線に立ち、データとのインタラクション方法に革命をもたらします。
しかし、これらのモデルをデプロイする際の計算強度とメモリ消費は、効率性の観点から大きな課題を呈している。
本研究は,機械学習システム(MLSys)研究の観点から,効率的なLCM提供手法の必要性について考察する。
論文 参考訳(メタデータ) (2023-12-23T11:57:53Z) - Federated Fine-Tuning of LLMs on the Very Edge: The Good, the Bad, the Ugly [62.473245910234304]
本稿では,最新のエッジコンピューティングシステムにおいて,Large Language Modelsをどのように導入できるかを,ハードウェア中心のアプローチで検討する。
マイクロレベルのハードウェアベンチマークを行い、FLOPモデルと最先端のデータセンターGPUを比較し、現実的な条件下でのネットワーク利用について検討する。
論文 参考訳(メタデータ) (2023-10-04T20:27:20Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - A Survey on the Integration of Machine Learning with Sampling-based
Motion Planning [9.264471872135623]
本調査は、サンプリングベースモーションプランナー(SBMP)の計算効率と適用性を改善するための機械学習の取り組みを概観する。
まず、ノードサンプリング、衝突検出、距離または最も近い隣人、ローカルプランニング、終了条件など、SBMPのキーコンポーネントの強化に学習がどのように使われているかについて論じる。
また、機械学習を用いてロボットのデータ駆動モデルを提供し、それをSBMPで使用する方法についても論じている。
論文 参考訳(メタデータ) (2022-11-15T18:13:49Z) - Interpretable AI-based Large-scale 3D Pathloss Prediction Model for
enabling Emerging Self-Driving Networks [3.710841042000923]
本稿では,新しい鍵予測器を応用した機械学習モデルを提案する。
予測,一般化,計算性能の観点から各種MLアルゴリズムの性能を定量的に評価することにより,光グラディエントブースティングマシン(LightGBM)アルゴリズムが全体として他のアルゴリズムより優れていることを示す。
論文 参考訳(メタデータ) (2022-01-30T19:50:16Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - MLPerfTM HPC: A Holistic Benchmark Suite for Scientific Machine Learning
on HPC Systems [32.621917787044396]
我々はMLCommonsTM Associationが推進する科学機械学習トレーニングアプリケーションのベンチマークスイートであるHPCを紹介する。
共同分析のための体系的なフレームワークを開発し、データステージング、アルゴリズム収束、計算性能の観点から比較する。
低レベルのメモリ、I/O、ネットワークの振る舞いに関して、各ベンチマークを特徴付けることで結論付ける。
論文 参考訳(メタデータ) (2021-10-21T20:30:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。