論文の概要: Collective Knowledge: organizing research projects as a database of
reusable components and portable workflows with common APIs
- arxiv url: http://arxiv.org/abs/2011.01149v2
- Date: Sat, 30 Jan 2021 15:01:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 13:09:03.394078
- Title: Collective Knowledge: organizing research projects as a database of
reusable components and portable workflows with common APIs
- Title(参考訳): 集合的知識: 再利用可能なコンポーネントと共通APIによるポータブルワークフローのデータベースとして研究プロジェクトを編成する
- Authors: Grigori Fursin
- Abstract要約: この記事では、集合的知識フレームワーク(CKまたはcKnowledge)のモチベーションと概要について述べる。
CKの概念は、研究プロジェクトを研究成果物をカプセル化した再利用可能なコンポーネントに分解することである。
長期的な目標は、研究者と実践者を結びつけて、すべての知識を共有し再利用することで、イノベーションを加速させることである。
- 参考スコア(独自算出の注目度): 0.2538209532048866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article provides the motivation and overview of the Collective Knowledge
framework (CK or cKnowledge). The CK concept is to decompose research projects
into reusable components that encapsulate research artifacts and provide
unified application programming interfaces (APIs), command-line interfaces
(CLIs), meta descriptions and common automation actions for related artifacts.
The CK framework is used to organize and manage research projects as a database
of such components.
Inspired by the USB "plug and play" approach for hardware, CK also helps to
assemble portable workflows that can automatically plug in compatible
components from different users and vendors (models, datasets, frameworks,
compilers, tools). Such workflows can build and run algorithms on different
platforms and environments in a unified way using the universal CK program
pipeline with software detection plugins and the automatic installation of
missing packages.
This article presents a number of industrial projects in which the modular CK
approach was successfully validated in order to automate benchmarking,
auto-tuning and co-design of efficient software and hardware for machine
learning (ML) and artificial intelligence (AI) in terms of speed, accuracy,
energy, size and various costs. The CK framework also helped to automate the
artifact evaluation process at several computer science conferences as well as
to make it easier to reproduce, compare and reuse research techniques from
published papers, deploy them in production, and automatically adapt them to
continuously changing datasets, models and systems.
The long-term goal is to accelerate innovation by connecting researchers and
practitioners to share and reuse all their knowledge, best practices,
artifacts, workflows and experimental results in a common, portable and
reproducible format at https://cKnowledge.io .
- Abstract(参考訳): この記事では、集合的知識フレームワーク(CKまたはcKnowledge)のモチベーションと概要を説明します。
CKの概念は、研究プロジェクトを再利用可能なコンポーネントに分解し、研究成果物をカプセル化し、統合されたアプリケーションプログラミングインターフェース(API)、コマンドラインインターフェース(CLI)、メタ記述、関連する成果物の共通自動化アクションを提供する。
CKフレームワークは研究プロジェクトをこのようなコンポーネントのデータベースとして整理し、管理するために使用される。
USBの"プラグアンドプレイ"アプローチにインスパイアされたCKは、さまざまなユーザやベンダ(モデル、データセット、フレームワーク、コンパイラ、ツール)から互換性のあるコンポーネントを自動的にプラグインする、ポータブルなワークフローの組み立てにも役立ちます。
このようなワークフローは、ソフトウェア検出プラグインと欠落パッケージの自動インストールを備えた汎用CKプログラムパイプラインを使用して、さまざまなプラットフォームや環境上でアルゴリズムを構築し、実行することができる。
本稿では,機械学習(ML)と人工知能(AI)のための効率的なソフトウェアとハードウェアのベンチマーク,自動チューニング,共同設計を,速度,精度,エネルギー,サイズ,コストの面で自動化するために,モジュール型CKアプローチが成功した産業プロジェクトをいくつか紹介する。
CKフレームワークはまた、いくつかのコンピュータサイエンスカンファレンスでアーティファクト評価プロセスの自動化を支援し、公開論文からの研究テクニックを再現し、比較し、再利用し、本番環境にデプロイし、継続的に変化するデータセット、モデル、システムに自動的に適応できるようにする。
長期的な目標は、研究者と実践者が知識、ベストプラクティス、アーティファクト、ワークフロー、実験結果をすべて、https://cKnowledge.ioで共有し再利用することで、イノベーションを加速することにある。
関連論文リスト
- CARLOS: An Open, Modular, and Scalable Simulation Framework for the Development and Testing of Software for C-ITS [0.0]
CARLOS - C-ITSにおけるソフトウェアの開発とテストのためのオープンでモジュール化されたスケーラブルなシミュレーションフレームワークを提案する。
このフレームワークの中核となるビルディングブロックを提供し、コミュニティによってどのように利用され、拡張されるかを説明します。
本稿では、重要な設計原則を説明し、3つの主要なユースケースを示すことによって、アーキテクチャのモチベーションを高める。
論文 参考訳(メタデータ) (2024-04-02T10:48:36Z) - Automated User Story Generation with Test Case Specification Using Large Language Model [0.0]
要件文書からユーザストーリーを自動生成するツール「GeneUS」を開発した。
アウトプットはフォーマットで提供され、ダウンストリーム統合の可能性は人気のあるプロジェクト管理ツールに開放されます。
論文 参考訳(メタデータ) (2024-04-02T01:45:57Z) - DevBench: A Comprehensive Benchmark for Software Development [72.24266814625685]
DevBenchは、ソフトウェア開発ライフサイクルのさまざまな段階にわたる大規模言語モデル(LLM)を評価するベンチマークである。
GPT-4-Turboを含む現在のLLMは、DevBench内での課題の解決に失敗している。
本研究は,LLMを現実のプログラミングアプリケーションに展開する上で,現実的な知見を提供するものである。
論文 参考訳(メタデータ) (2024-03-13T15:13:44Z) - CRAFT: Customizing LLMs by Creating and Retrieving from Specialized
Toolsets [75.64181719386497]
大規模言語モデル(LLM)のためのツール作成・検索フレームワークであるCRAFTを提案する。
タスク用に特別にキュレートされたツールセットを作成し、複雑なタスクを解決する能力を高めるためにこれらのセットからツールを取得するコンポーネントをLLMに装備する。
本手法はフレキシブルに設計されており,既製のLCMを細かな調整なしに未確認領域やモダリティに適応するためのプラグアンドプレイ方式を提供する。
論文 参考訳(メタデータ) (2023-09-29T17:40:26Z) - CodeTF: One-stop Transformer Library for State-of-the-art Code LLM [72.1638273937025]
我々は、最先端のCode LLMとコードインテリジェンスのためのオープンソースのTransformerベースのライブラリであるCodeTFを紹介する。
我々のライブラリは、事前訓練されたコードLLMモデルと人気のあるコードベンチマークのコレクションをサポートします。
CodeTFが機械学習/生成AIとソフトウェア工学のギャップを埋められることを願っている。
論文 参考訳(メタデータ) (2023-05-31T05:24:48Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - ConvLab-3: A Flexible Dialogue System Toolkit Based on a Unified Data
Format [88.33443450434521]
タスク指向対話(TOD)システムはデジタルアシスタントとして機能し、フライトの予約やレストランの検索といった様々なタスクを通じてユーザを誘導する。
TODシステムを構築するための既存のツールキットは、データ、モデル、実験環境の包括的な配列を提供するのに不足することが多い。
本稿では,このギャップを埋めるための多面的対話システムツールキットConvLab-3を紹介する。
論文 参考訳(メタデータ) (2022-11-30T16:37:42Z) - Modular approach to data preprocessing in ALOHA and application to a
smart industry use case [0.0]
データ前処理と変換パイプラインをサポートするために、ALOHAツールフローに統合されたモジュラーアプローチに対処する。
提案手法の有効性を示すために,キーワードスポッティングのユースケースに関する実験結果を示す。
論文 参考訳(メタデータ) (2021-02-02T06:48:51Z) - The Collective Knowledge project: making ML models more portable and
reproducible with open APIs, reusable best practices and MLOps [0.2538209532048866]
本稿では、集合知識技術(CKまたはcKnowledge CK)の概要を紹介する。
CKはMLとシステムの研究を再現しやすくし、実運用環境にMLモデルをデプロイし、データセット、モデル、研究技術、ソフトウェア、ハードウェアの変更に適応させようとしている。
論文 参考訳(メタデータ) (2020-06-12T13:18:52Z) - FastReID: A Pytorch Toolbox for General Instance Re-identification [70.10996607445725]
一般的なインスタンスの再識別は、コンピュータビジョンにおいて非常に重要なタスクである。
我々は、JD AI Researchにおいて広く使われているソフトウェアシステムとしてFastReIDを提示する。
我々は、人物のリID、部分的なリID、クロスドメインのリID、車両のリIDなど、最先端のプロジェクトをいくつか実施してきた。
論文 参考訳(メタデータ) (2020-06-04T03:51:43Z) - SciWING -- A Software Toolkit for Scientific Document Processing [21.394568145639894]
SciWINGは、科学文書処理タスクのための事前訓練されたモデルへのアクセスを提供する。
使えるWebアプリケーションや端末ベースのアプリケーション、デモも用意されている。
論文 参考訳(メタデータ) (2020-04-08T04:43:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。