Fugu-MT 論文翻訳(概要): Assessing the Quality of Computational Notebooks for a Frictionless Transition from Exploration to Production

論文の概要: Assessing the Quality of Computational Notebooks for a Frictionless Transition from Exploration to Production

arxiv url: http://arxiv.org/abs/2205.11941v1
Date: Tue, 24 May 2022 10:13:38 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-25 15:19:46.454112
Title: Assessing the Quality of Computational Notebooks for a Frictionless Transition from Exploration to Production
Title（参考訳）: 探鉱から生産への摩擦のない遷移のための計算ノートの品質評価
Authors: Luigi Quaranta
Abstract要約: データサイエンティストは、機械学習プロジェクトの爆発的なフェーズから生産フェーズに移行する必要があります。これら2つのフェーズのギャップを狭めるために、データサイエンティストが採用するツールとプラクティスは、統合されたソフトウェアエンジニアリングソリューションを統合することで改善される可能性がある。本研究プロジェクトでは,計算ノートと協調する上でのベストプラクティスについて検討し,ガイドライン遵守を促進するための概念実証ツールを提案する。
参考スコア（独自算出の注目度）: 1.332560004325655
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The massive trend of integrating data-driven AI capabilities into traditional software systems is rising new intriguing challenges. One of such challenges is achieving a smooth transition from the explorative phase of Machine Learning projects - in which data scientists build prototypical models in the lab - to their production phase - in which software engineers translate prototypes into production-ready AI components. To narrow down the gap between these two phases, tools and practices adopted by data scientists might be improved by incorporating consolidated software engineering solutions. In particular, computational notebooks have a prominent role in determining the quality of data science prototypes. In my research project, I address this challenge by studying the best practices for collaboration with computational notebooks and proposing proof-of-concept tools to foster guidelines compliance.
Abstract（参考訳）: データ駆動型AI機能を従来のソフトウェアシステムに統合する巨大なトレンドが、新たな興味深い課題を提起している。このような課題の1つは、機械学習プロジェクトの爆発的なフェーズ — データサイエンティストが研究室でプロトタイプモデルを構築する — から、ソフトウェアエンジニアがプロトタイプをプロダクション対応のAIコンポーネントに変換する運用フェーズへのスムーズな移行の実現である。これら2つのフェーズ間のギャップを狭めるためには、統合ソフトウェアエンジニアリングソリューションの導入によって、データサイエンティストが採用するツールとプラクティスが改善される可能性がある。特に、計算ノートはデータサイエンスのプロトタイプの品質を決定する上で重要な役割を担っている。私の研究プロジェクトでは、計算ノートとのコラボレーションのベストプラクティスを研究し、ガイドライン遵守を促進するための概念実証ツールを提案することで、この問題に対処します。

関連論文リスト

Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey [59.3507264893654]
課題解決は、現実世界の開発に不可欠な複雑なソフトウェアエンジニアリングタスクです。 SWE-benchのようなベンチマークでは、このタスクは大規模言語モデルでは極めて困難であることが判明した。本稿では,この新興領域を体系的に調査する。
論文参考訳（メタデータ） (2026-01-15T18:55:03Z)
A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文参考訳（メタデータ） (2025-10-10T06:56:50Z)
Machine-Learning-Assisted Photonic Device Development: A Multiscale Approach from Theory to Characterization [80.82828320306464]
フォトニックデバイス開発(PDD)は、様々な波長、スケール、アプリケーションにまたがる光を制御する新しいデバイスの設計と実装において大きな成功を収めた。 PDDは、設計パラメータからデバイス動作を導出する、デバイス性能をシミュレーションする、最適なデバイスを製造する、デバイス性能を測定する、という5段階の反復的プロセスである。 PDDは、大規模な最適化の展望、構造的または光学的特徴の不確実性、堅牢な製造プロセスの実装の困難に悩まされている。本稿では,機械学習支援型PDDの実現に向けて,これらの手法の総合的な展望を示す。
論文参考訳（メタデータ） (2025-06-24T23:32:54Z)
EngiBench: A Framework for Data-Driven Engineering Design Research [0.0]
EngiBenchは最初のオープンソースライブラリで、データ駆動エンジニアリング設計のためのさまざまなドメインにまたがる。 EngiOptは、EngiBenchインターフェースと互換性のあるアルゴリズムのコレクションを提供するコンパニオンライブラリである。これらの問題は、高感度で制約のある設計データセットにより、標準的な機械学習手法に重大な課題をもたらすことが示されている。
論文参考訳（メタデータ） (2025-06-02T08:53:02Z)
Generative AI and Empirical Software Engineering: A Paradigm Shift [9.284024538100063]
本稿では,大規模言語モデルのソフトウェア工学への統合が,確立した研究パラダイムをいかに破壊するかを考察する。我々は、我々が研究している現象、我々が依存する方法や理論、分析するデータ、そして、動的AIを介する環境で発生する妥当性に対する脅威をどう変えるかについて議論する。私たちの目標は、経験豊かなソフトウェアエンジニアリングコミュニティが、AIシステムが単なるツールではなく、ソフトウェアエンジニアリングとその研究を形作る活発な協力者の未来に、その質問や道具、検証基準を適合させることです。
論文参考訳（メタデータ） (2025-02-12T04:13:07Z)
OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis [55.390060529534644]
グラフィカルユーザインタフェース(GUI)エージェントのための新しいデータ合成パイプラインであるOS-Genesisを提案する。事前に定義されたタスクに頼る代わりに、OS-Genesisはエージェントがまず環境を認識し、ステップワイドなインタラクションを実行することを可能にする。我々は,OS-Genesisを用いたGUIエージェントのトレーニングにより,高度に挑戦するオンラインベンチマークの性能が大幅に向上することが実証された。
論文参考訳（メタデータ） (2024-12-27T16:21:58Z)
Data Publishing in Mechanics and Dynamics: Challenges, Guidelines, and Examples from Engineering Design [4.065325208853021]
本稿では、力学および力学におけるデータパブリッシングの価値と課題を分析する。後者は、データ駆動手法が元来ブームになっている分野では一般的ではない課題や考察も提起している。
論文参考訳（メタデータ） (2024-10-07T18:26:05Z)
Data Analysis in the Era of Generative AI [56.44807642944589]
本稿では,AIを活用したデータ分析ツールの可能性について考察する。我々は、大規模言語とマルチモーダルモデルの出現が、データ分析ワークフローの様々な段階を強化する新しい機会を提供する方法について検討する。次に、直感的なインタラクションを促進し、ユーザ信頼を構築し、AI支援分析ワークフローを複数のアプリにわたって合理化するための、人間中心の設計原則を調べます。
論文参考訳（メタデータ） (2024-09-27T06:31:03Z)
Survey and Taxonomy: The Role of Data-Centric AI in Transformer-Based Time Series Forecasting [36.31269406067809]
データ中心のAIは、AIモデルのトレーニング、特にトランスフォーマーベースのTSFモデルの効率的なトレーニングに不可欠である、と私たちは主張する。我々は、データ中心のAIの観点から、これまでの研究成果をレビューし、トランスフォーマーベースのアーキテクチャとデータ中心のAIの将来の開発のための基礎的な作業を行うつもりです。
論文参考訳（メタデータ） (2024-07-29T08:27:21Z)
On the Interaction between Software Engineers and Data Scientists when building Machine Learning-Enabled Systems [1.2184324428571227]
機械学習(ML)コンポーネントは、組織のコアシステムにますます統合されています。重要な課題の1つは、緊密に連携する必要がある異なるバックグラウンドを持つアクター間の効果的な相互作用である。本稿では,MLプロジェクトにおけるこれらの役割間の相互作用と協調のダイナミクスを理解するための探索ケーススタディを提案する。
論文参考訳（メタデータ） (2024-02-08T00:27:56Z)
Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文参考訳（メタデータ） (2022-09-05T16:48:34Z)
SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文参考訳（メタデータ） (2021-12-22T14:45:37Z)
Towards Productizing AI/ML Models: An Industry Perspective from Data Scientists [10.27276267081559]
AI/MLモデルから生産可能なAIベースのシステムへの移行は、データサイエンティストとソフトウェアエンジニアの両方にとって課題です。本稿では,この移行が実践者によってどのように認識されるかを理解するため,コンサルティング会社におけるワークショップの結果を報告する。
論文参考訳（メタデータ） (2021-03-18T22:25:44Z)
Technology Readiness Levels for Machine Learning Systems [107.56979560568232]
機械学習システムの開発とデプロイは、現代のツールで簡単に実行できますが、プロセスは一般的に急ぎ、エンドツーエンドです。私たちは、機械学習の開発と展開のための実証済みのシステムエンジニアリングアプローチを開発しました。当社の「機械学習技術準備レベル」フレームワークは、堅牢で信頼性が高く、責任あるシステムを確保するための原則的なプロセスを定義します。
論文参考訳（メタデータ） (2021-01-11T15:54:48Z)
Enabling collaborative data science development with the Ballet framework [9.424574945499844]
本稿では,データサイエンスのコラボレーションをスケールするための新しい概念的フレームワークとmlプログラミングモデルを提案する。 Balletはオープンソースのデータサイエンスを共同で行うための軽量ソフトウェアフレームワークです。
論文参考訳（メタデータ） (2020-12-14T18:51:23Z)
Integrated Benchmarking and Design for Reproducible and Accessible Evaluation of Robotic Agents [61.36681529571202]
本稿では,開発とベンチマークを統合した再現性ロボット研究の新しい概念について述べる。このセットアップの中心的なコンポーネントの1つはDuckietown Autolabであり、これは比較的低コストで再現可能な標準化されたセットアップである。本研究では,インフラを用いて実施した実験の再現性を解析し,ロボットのハードウェアや遠隔実験室間でのばらつきが低いことを示す。
論文参考訳（メタデータ） (2020-09-09T15:31:29Z)
Technology Readiness Levels for AI & ML [79.22051549519989]
機械学習システムの開発は、現代的なツールで容易に実行できるが、プロセスは通常急いで、エンドツーエンドで実行される。エンジニアリングシステムは、高品質で信頼性の高い結果の開発を効率化するために、明確に定義されたプロセスとテスト標準に従います。我々は、機械学習の開発と展開のための実証されたシステムエンジニアリングアプローチを提案する。
論文参考訳（メタデータ） (2020-06-21T17:14:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。