論文の概要: Finding Reusable Machine Learning Components to Build Programming
Language Processing Pipelines
- arxiv url: http://arxiv.org/abs/2208.05596v1
- Date: Thu, 11 Aug 2022 00:24:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-12 13:41:53.903803
- Title: Finding Reusable Machine Learning Components to Build Programming
Language Processing Pipelines
- Title(参考訳): プログラム言語処理パイプラインを構築するための再利用可能な機械学習コンポーネントを見つける
- Authors: Patrick Flynn and Tristan Vanderbruggen and Chunhua Liao and Pei-Hung
Lin and Murali Emani and Xipeng Shen
- Abstract要約: 機械学習を使った言語処理のプログラミングは、ここ数年で大幅に改善されている。
新たな研究者や開発者が独自の機械学習パイプラインを構築する上で適切なコンポーネントを見つけることは難しい。
PLPタスクの集合を解決するために、再利用可能なコンポーネントを活用して機械学習パイプラインを構築するユースケースをいくつか紹介する。
- 参考スコア(独自算出の注目度): 8.548096653876142
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Programming Language Processing (PLP) using machine learning has made vast
improvements in the past few years. Increasingly more people are interested in
exploring this promising field. However, it is challenging for new researchers
and developers to find the right components to construct their own machine
learning pipelines, given the diverse PLP tasks to be solved, the large number
of datasets and models being released, and the set of complex compilers or
tools involved. To improve the findability, accessibility, interoperability and
reusability (FAIRness) of machine learning components, we collect and analyze a
set of representative papers in the domain of machine learning-based PLP. We
then identify and characterize key concepts including PLP tasks, model
architectures and supportive tools. Finally, we show some example use cases of
leveraging the reusable components to construct machine learning pipelines to
solve a set of PLP tasks.
- Abstract(参考訳): 機械学習を用いたプログラミング言語処理(plp)は、ここ数年で大幅に改善されている。
この有望な分野を探求することに関心を持つ人がますます増えている。
しかし、解決すべき多様なplpタスク、リリース中の大量のデータセットとモデル、関連する複雑なコンパイラやツールセットを考えると、新たな研究者や開発者が独自の機械学習パイプラインを構築するための適切なコンポーネントを見つけることは困難である。
機械学習コンポーネントのファインダビリティ、アクセシビリティ、相互運用性、再利用性(FAIRness)を改善するため、機械学習ベースのPLPの領域における代表論文の集合を収集し分析する。
PLPタスクやモデルアーキテクチャ,サポートツールなど,主要な概念を識別し,特徴付ける。
最後に、plpタスクのセットを解決するために機械学習パイプラインを構築するために再利用可能なコンポーネントを利用するいくつかのユースケースを示す。
関連論文リスト
- Machine Learning Operations: A Mapping Study [0.0]
この記事では、MLOpsパイプラインのいくつかのコンポーネントに存在する問題について論じる。
MLOpsシステムで発生する課題を、異なる焦点領域に分類するために、システマティックマッピング研究が実施されている。
この研究の主な価値は、MLOpsの独特な課題と、私たちの研究で概説された推奨された解決策をマッピングすることです。
論文 参考訳(メタデータ) (2024-09-28T17:17:40Z) - Towards Completeness-Oriented Tool Retrieval for Large Language Models [60.733557487886635]
現実世界のシステムは多種多様なツールを組み込んでおり、全てのツールを大規模言語モデルに入力することは不可能である。
既存のツール検索手法は主にユーザクエリとツール記述間のセマンティックマッチングに焦点を当てている。
我々は,ユーザクエリとツール記述のセマンティックな類似性だけでなく,ツールの協調的情報も考慮した,新しいモデル診断型協調学習型ツール検索手法であるCOLTを提案する。
論文 参考訳(メタデータ) (2024-05-25T06:41:23Z) - CRAFT: Customizing LLMs by Creating and Retrieving from Specialized
Toolsets [75.64181719386497]
大規模言語モデル(LLM)のためのツール作成・検索フレームワークであるCRAFTを提案する。
タスク用に特別にキュレートされたツールセットを作成し、複雑なタスクを解決する能力を高めるためにこれらのセットからツールを取得するコンポーネントをLLMに装備する。
本手法はフレキシブルに設計されており,既製のLCMを細かな調整なしに未確認領域やモダリティに適応するためのプラグアンドプレイ方式を提供する。
論文 参考訳(メタデータ) (2023-09-29T17:40:26Z) - Learning to Parallelize with OpenMP by Augmented Heterogeneous AST
Representation [7.750212995537728]
コードに異質な拡張抽象構文木(Augmented-AST)表現を利用するグラフベースの新しい学習手法Graph2Parを提案する。
我々は18598並列化可能なOMP_Serialデータセットと13972非並列化可能なループを作成し、機械学習モデルをトレーニングする。
提案手法は,85%の精度で並列化可能なコード領域検出の精度を実現し,最先端のトークンベース機械学習手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-05-09T21:57:15Z) - Flashlight: Enabling Innovation in Tools for Machine Learning [50.63188263773778]
私たちは、機械学習ツールやシステムの革新を促進するために構築されたオープンソースのライブラリであるFlashlightを紹介します。
Flashlightは、広く使われているライブラリを下流で活用し、機械学習とシステム研究者をより緊密に連携させる研究を可能にするツールだと考えています。
論文 参考訳(メタデータ) (2022-01-29T01:03:29Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale [103.7609761511652]
大規模集団ロボット学習システムが,行動のレパートリーを同時に獲得できることを示す。
新しいタスクは、以前学んだタスクから継続的にインスタンス化できる。
我々は,7台のロボットから収集したデータを用いて,実世界のタスク12組でシステムを訓練し,評価する。
論文 参考訳(メタデータ) (2021-04-16T16:38:02Z) - A Data-Centric Framework for Composable NLP Workflows [109.51144493023533]
アプリケーションドメインにおける経験的自然言語処理システム(例えば、ヘルスケア、ファイナンス、教育)は、複数のコンポーネント間の相互運用を伴う。
我々は,このような高度なNLPの高速な開発を支援するために,統一的なオープンソースフレームワークを構築した。
論文 参考訳(メタデータ) (2021-03-02T16:19:44Z) - HAMLET: A Hierarchical Agent-based Machine Learning Platform [0.0]
HAMLET (Hierarchical Agent-based Machine LEarning plaTform) は階層型マルチエージェントシステムに基づくハイブリッド機械学習プラットフォームである。
提案システムは、機械学習ソリューションをハイパーグラフとしてモデル化し、異種エージェントのマルチレベル構造を自律的に設定する。
論文 参考訳(メタデータ) (2020-10-10T03:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。