Fugu-MT 論文翻訳(概要): Collective Knowledge: organizing research projects as a database of reusable components and portable workflows with common APIs

論文の概要: Collective Knowledge: organizing research projects as a database of reusable components and portable workflows with common APIs

arxiv url: http://arxiv.org/abs/2011.01149v2
Date: Sat, 30 Jan 2021 15:01:14 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-30 13:09:03.394078
Title: Collective Knowledge: organizing research projects as a database of reusable components and portable workflows with common APIs
Title（参考訳）: 集合的知識: 再利用可能なコンポーネントと共通APIによるポータブルワークフローのデータベースとして研究プロジェクトを編成する
Authors: Grigori Fursin
Abstract要約: この記事では、集合的知識フレームワーク(CKまたはcKnowledge)のモチベーションと概要について述べる。 CKの概念は、研究プロジェクトを研究成果物をカプセル化した再利用可能なコンポーネントに分解することである。長期的な目標は、研究者と実践者を結びつけて、すべての知識を共有し再利用することで、イノベーションを加速させることである。
参考スコア（独自算出の注目度）: 0.2538209532048866
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This article provides the motivation and overview of the Collective Knowledge framework (CK or cKnowledge). The CK concept is to decompose research projects into reusable components that encapsulate research artifacts and provide unified application programming interfaces (APIs), command-line interfaces (CLIs), meta descriptions and common automation actions for related artifacts. The CK framework is used to organize and manage research projects as a database of such components. Inspired by the USB "plug and play" approach for hardware, CK also helps to assemble portable workflows that can automatically plug in compatible components from different users and vendors (models, datasets, frameworks, compilers, tools). Such workflows can build and run algorithms on different platforms and environments in a unified way using the universal CK program pipeline with software detection plugins and the automatic installation of missing packages. This article presents a number of industrial projects in which the modular CK approach was successfully validated in order to automate benchmarking, auto-tuning and co-design of efficient software and hardware for machine learning (ML) and artificial intelligence (AI) in terms of speed, accuracy, energy, size and various costs. The CK framework also helped to automate the artifact evaluation process at several computer science conferences as well as to make it easier to reproduce, compare and reuse research techniques from published papers, deploy them in production, and automatically adapt them to continuously changing datasets, models and systems. The long-term goal is to accelerate innovation by connecting researchers and practitioners to share and reuse all their knowledge, best practices, artifacts, workflows and experimental results in a common, portable and reproducible format at https://cKnowledge.io .
Abstract（参考訳）: この記事では、集合的知識フレームワーク(CKまたはcKnowledge)のモチベーションと概要を説明します。 CKの概念は、研究プロジェクトを再利用可能なコンポーネントに分解し、研究成果物をカプセル化し、統合されたアプリケーションプログラミングインターフェース(API)、コマンドラインインターフェース(CLI)、メタ記述、関連する成果物の共通自動化アクションを提供する。 CKフレームワークは研究プロジェクトをこのようなコンポーネントのデータベースとして整理し、管理するために使用される。 USBの"プラグアンドプレイ"アプローチにインスパイアされたCKは、さまざまなユーザやベンダ(モデル、データセット、フレームワーク、コンパイラ、ツール)から互換性のあるコンポーネントを自動的にプラグインする、ポータブルなワークフローの組み立てにも役立ちます。このようなワークフローは、ソフトウェア検出プラグインと欠落パッケージの自動インストールを備えた汎用CKプログラムパイプラインを使用して、さまざまなプラットフォームや環境上でアルゴリズムを構築し、実行することができる。本稿では,機械学習(ML)と人工知能(AI)のための効率的なソフトウェアとハードウェアのベンチマーク,自動チューニング,共同設計を,速度,精度,エネルギー,サイズ,コストの面で自動化するために,モジュール型CKアプローチが成功した産業プロジェクトをいくつか紹介する。 CKフレームワークはまた、いくつかのコンピュータサイエンスカンファレンスでアーティファクト評価プロセスの自動化を支援し、公開論文からの研究テクニックを再現し、比較し、再利用し、本番環境にデプロイし、継続的に変化するデータセット、モデル、システムに自動的に適応できるようにする。長期的な目標は、研究者と実践者が知識、ベストプラクティス、アーティファクト、ワークフロー、実験結果をすべて、https://cKnowledge.ioで共有し再利用することで、イノベーションを加速することにある。

関連論文リスト

ABC-Bench: Benchmarking Agentic Backend Coding in Real-World Development [72.4729759618632]
本稿では,現実的かつ実行可能なワークフロー内でエージェントバックエンドコーディングを評価するベンチマークであるABC-Benchを紹介する。オープンソースリポジトリから8つの言語と19のフレームワークにまたがる224の実践的なタスクをキュレートしました。我々の評価は、最先端モデルでさえ、これらの総合的なタスクに対して信頼性の高いパフォーマンスを提供するのに苦労していることを示している。
論文参考訳（メタデータ） (2026-01-16T08:23:52Z)
Confucius Code Agent: Scalable Agent Scaffolding for Real-World Codebases [44.366968508477235]
大規模に運用可能なスケーラブルなソフトウェアエンジニアリングエージェントであるConfucius Code Agent (CCA)を紹介した。 CCAはConfucius SDKの上に構築されている。さらに,エージェント構成の合成,評価,洗練を自動化するメタエージェントを導入する。
論文参考訳（メタデータ） (2025-12-11T08:05:58Z)
AUTO-Explorer: Automated Data Collection for GUI Agent [58.58097564914626]
本稿では,アノテーションコストを最小限に抑えた自動データ収集手法であるAuto-Explorerを提案する。それは、GUI環境を自律的に解析し探索する、シンプルだが効果的な探索メカニズムを組み込んでいる。収集したデータを用いて,マルチモーダル大規模言語モデル(MLLM)を微調整し,GUI要素基盤テストセットを確立する。
論文参考訳（メタデータ） (2025-11-09T15:13:45Z)
BuildBench: Benchmarking LLM Agents on Compiling Real-World Open-Source Software [39.43177863341685]
既存のメソッドは手動でキュレートされたルールに依存しており、カスタマイズされた設定や環境設定を必要とするOSSに適応できない。近年、Large Language Models (LLMs) を用いた試みでは、高度に評価されたOSSのサブセットを選択的に評価した。より困難で現実的なベンチマークであるBUILD-BENCHを提案する。
論文参考訳（メタデータ） (2025-09-27T03:02:46Z)
Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning [57.09163579304332]
機械学習論文を機能コードリポジトリに変換するフレームワークであるPaperCoderを紹介した。 PaperCoderは3つの段階で動作する。計画、図によるシステムアーキテクチャの設計、ファイル依存の特定、構成ファイルの生成である。次に、モデルベースおよび人的評価の両方に基づいて、機械学習論文からコード実装を生成するPaperCoderを評価する。
論文参考訳（メタデータ） (2025-04-24T01:57:01Z)
AutoPLC: Generating Vendor-Aware Structured Text for Programmable Logic Controllers [9.209415852653386]
AutoPLCは、ベンダーが認識するSTコードを自動的に自然言語要求から生成できるフレームワークである。 Siemens TIA PortalとCODESYSプラットフォーム向けに実装されている。 AutoPLCは914タスクベンチマークで90%以上のコンパイル成功を実現しています。
論文参考訳（メタデータ） (2024-12-03T12:05:56Z)
Commit0: Library Generation from Scratch [77.38414688148006]
Commit0は、AIエージェントにスクラッチからライブラリを書くよう促すベンチマークである。エージェントには、ライブラリのAPIを概説する仕様文書と、インタラクティブなユニットテストスイートが提供されている。 Commit0はまた、モデルが生成したコードに対して静的解析と実行フィードバックを受け取る、インタラクティブな環境も提供する。
論文参考訳（メタデータ） (2024-12-02T18:11:30Z)
CARLOS: An Open, Modular, and Scalable Simulation Framework for the Development and Testing of Software for C-ITS [0.0]
CARLOS - C-ITSにおけるソフトウェアの開発とテストのためのオープンでモジュール化されたスケーラブルなシミュレーションフレームワークを提案する。このフレームワークの中核となるビルディングブロックを提供し、コミュニティによってどのように利用され、拡張されるかを説明します。本稿では、重要な設計原則を説明し、3つの主要なユースケースを示すことによって、アーキテクチャのモチベーションを高める。
論文参考訳（メタデータ） (2024-04-02T10:48:36Z)
Automated User Story Generation with Test Case Specification Using Large Language Model [0.0]
要件文書からユーザストーリーを自動生成するツール「GeneUS」を開発した。アウトプットはフォーマットで提供され、ダウンストリーム統合の可能性は人気のあるプロジェクト管理ツールに開放されます。
論文参考訳（メタデータ） (2024-04-02T01:45:57Z)
DevBench: A Comprehensive Benchmark for Software Development [72.24266814625685]
DevBenchは、ソフトウェア開発ライフサイクルのさまざまな段階にわたる大規模言語モデル(LLM)を評価するベンチマークである。 GPT-4-Turboを含む現在のLLMは、DevBench内での課題の解決に失敗している。本研究は,LLMを現実のプログラミングアプリケーションに展開する上で,現実的な知見を提供するものである。
論文参考訳（メタデータ） (2024-03-13T15:13:44Z)
CRAFT: Customizing LLMs by Creating and Retrieving from Specialized Toolsets [75.64181719386497]
大規模言語モデル(LLM)のためのツール作成・検索フレームワークであるCRAFTを提案する。タスク用に特別にキュレートされたツールセットを作成し、複雑なタスクを解決する能力を高めるためにこれらのセットからツールを取得するコンポーネントをLLMに装備する。本手法はフレキシブルに設計されており,既製のLCMを細かな調整なしに未確認領域やモダリティに適応するためのプラグアンドプレイ方式を提供する。
論文参考訳（メタデータ） (2023-09-29T17:40:26Z)
CodeTF: One-stop Transformer Library for State-of-the-art Code LLM [72.1638273937025]
我々は、最先端のCode LLMとコードインテリジェンスのためのオープンソースのTransformerベースのライブラリであるCodeTFを紹介する。我々のライブラリは、事前訓練されたコードLLMモデルと人気のあるコードベンチマークのコレクションをサポートします。 CodeTFが機械学習/生成AIとソフトウェア工学のギャップを埋められることを願っている。
論文参考訳（メタデータ） (2023-05-31T05:24:48Z)
TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文参考訳（メタデータ） (2023-05-19T10:11:21Z)
ConvLab-3: A Flexible Dialogue System Toolkit Based on a Unified Data Format [88.33443450434521]
タスク指向対話(TOD)システムはデジタルアシスタントとして機能し、フライトの予約やレストランの検索といった様々なタスクを通じてユーザを誘導する。 TODシステムを構築するための既存のツールキットは、データ、モデル、実験環境の包括的な配列を提供するのに不足することが多い。本稿では,このギャップを埋めるための多面的対話システムツールキットConvLab-3を紹介する。
論文参考訳（メタデータ） (2022-11-30T16:37:42Z)
Modular approach to data preprocessing in ALOHA and application to a smart industry use case [0.0]
データ前処理と変換パイプラインをサポートするために、ALOHAツールフローに統合されたモジュラーアプローチに対処する。提案手法の有効性を示すために,キーワードスポッティングのユースケースに関する実験結果を示す。
論文参考訳（メタデータ） (2021-02-02T06:48:51Z)
The Collective Knowledge project: making ML models more portable and reproducible with open APIs, reusable best practices and MLOps [0.2538209532048866]
本稿では、集合知識技術(CKまたはcKnowledge CK)の概要を紹介する。 CKはMLとシステムの研究を再現しやすくし、実運用環境にMLモデルをデプロイし、データセット、モデル、研究技術、ソフトウェア、ハードウェアの変更に適応させようとしている。
論文参考訳（メタデータ） (2020-06-12T13:18:52Z)
FastReID: A Pytorch Toolbox for General Instance Re-identification [70.10996607445725]
一般的なインスタンスの再識別は、コンピュータビジョンにおいて非常に重要なタスクである。我々は、JD AI Researchにおいて広く使われているソフトウェアシステムとしてFastReIDを提示する。我々は、人物のリID、部分的なリID、クロスドメインのリID、車両のリIDなど、最先端のプロジェクトをいくつか実施してきた。
論文参考訳（メタデータ） (2020-06-04T03:51:43Z)
SciWING -- A Software Toolkit for Scientific Document Processing [21.394568145639894]
SciWINGは、科学文書処理タスクのための事前訓練されたモデルへのアクセスを提供する。使えるWebアプリケーションや端末ベースのアプリケーション、デモも用意されている。
論文参考訳（メタデータ） (2020-04-08T04:43:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。