論文の概要: Operationalizing AI: Empirical Evidence on MLOps Practices, User Satisfaction, and Organizational Context
- arxiv url: http://arxiv.org/abs/2510.09968v1
- Date: Sat, 11 Oct 2025 02:57:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.715637
- Title: Operationalizing AI: Empirical Evidence on MLOps Practices, User Satisfaction, and Organizational Context
- Title(参考訳): 運用AI:MLOpsプラクティス、ユーザ満足度、組織コンテキストに関する実証的証拠
- Authors: Stefan Pasch,
- Abstract要約: 本稿では、G2.comから8000以上のAI開発プラットフォームのユーザレビューを分析する。
9つの確立された機械学習オペレーションに対するレビューの感情を測定する。
9つのプラクティスのうち7つは、ユーザの満足度と大きなポジティブな関係を示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Organizational efforts to utilize and operationalize artificial intelligence (AI) are often accompanied by substantial challenges, including scalability, maintenance, and coordination across teams. In response, the concept of Machine Learning Operations (MLOps) has emerged as a set of best practices that integrate software engineering principles with the unique demands of managing the ML lifecycle. Yet, empirical evidence on whether and how these practices support users in developing and operationalizing AI applications remains limited. To address this gap, this study analyzes over 8,000 user reviews of AI development platforms from G2.com. Using zero-shot classification, we measure review sentiment toward nine established MLOps practices, including continuous integration and delivery (CI/CD), workflow orchestration, reproducibility, versioning, collaboration, and monitoring. Seven of the nine practices show a significant positive relationship with user satisfaction, suggesting that effective MLOps implementation contributes tangible value to AI development. However, organizational context also matters: reviewers from small firms discuss certain MLOps practices less frequently, suggesting that organizational context influences the prevalence and salience of MLOps, though firm size does not moderate the MLOps-satisfaction link. This indicates that once applied, MLOps practices are perceived as universally beneficial across organizational settings.
- Abstract(参考訳): 人工知能(AI)を活用、運用するための組織的取り組みには、スケーラビリティ、メンテナンス、チーム間の調整など、大きな課題が伴うことが多い。
これに対し、機械学習オペレーション(MLOps)という概念は、ソフトウェアエンジニアリングの原則とMLライフサイクルを管理するというユニークな要求を統合するためのベストプラクティスのセットとして登場した。
しかし、これらのプラクティスがAIアプリケーションの開発と運用においてユーザを支援するかどうかに関する実証的な証拠は依然として限られている。
このギャップに対処するため、G2.comから8000以上のAI開発プラットフォームのユーザレビューを分析した。
ゼロショット分類を使用して、継続的インテグレーションとデリバリ(CI/CD)、ワークフローオーケストレーション、再現性、バージョニング、コラボレーション、監視を含む、9つの確立したMLOpsプラクティスに対するレビューの感情を測定する。
9つのプラクティスのうち7つは、ユーザ満足度と大きな肯定的な関係を示し、効果的なMLOps実装がAI開発に有意義な価値をもたらすことを示唆している。
小規模企業のレビュアーはMLOpsの実践をあまり頻繁に議論せず、組織のコンテキストがMLOpsの流行と健全性に影響を与えることを示唆している。
このことは、一度適用されれば、MLOpsのプラクティスが組織設定全体にわたって普遍的に有用であると認識されることを示している。
関連論文リスト
- ORMind: A Cognitive-Inspired End-to-End Reasoning Framework for Operations Research [56.961539386979354]
ORMindは認知にインスパイアされたフレームワークで、反ファクト推論を通じて最適化を強化する。
提案手法は,要求を数学的モデルや実行可能なコードに変換するエンド・ツー・エンドのワークフローを実装し,人間の認識をエミュレートする。
現在はLenovoのAIアシスタントで内部でテストされており、ビジネスとコンシューマの両方の最適化機能を強化する予定である。
論文 参考訳(メタデータ) (2025-06-02T05:11:21Z) - Evaluations at Work: Measuring the Capabilities of GenAI in Use [28.124088786766965]
現在のAIベンチマークは、人間とAIのコラボレーションの混乱したマルチターンの性質を見逃している。
実世界のタスクを相互依存サブタスクに分解する評価フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-15T23:06:23Z) - Model Utility Law: Evaluating LLMs beyond Performance through Mechanism Interpretable Metric [99.56567010306807]
大規模言語モデル(LLM)は、学術、産業、そして日々のアプリケーションに欠かせないものになっている。
大規模言語モデル (LLM) 時代における評価の課題の1つは一般化問題である。
従来の性能スコアを補完するメカニズムの解釈可能性向上指標であるモデル利用指数(MUI)を提案する。
論文 参考訳(メタデータ) (2025-04-10T04:09:47Z) - Initial Insights on MLOps: Perception and Adoption by Practitioners [9.777475640906404]
MLOps(Machine Learning and Operations)ガイドラインがこの分野の主要なリファレンスとして登場した。
MLOpsガイドラインの導入にも拘わらず、その実装には懐疑論の程度がある。
この研究は、MLOpsとその機械学習におけるイノベーションの次のフェーズへの影響について、より深い洞察を提供することを目的としている。
論文 参考訳(メタデータ) (2024-08-01T11:08:29Z) - A Multivocal Review of MLOps Practices, Challenges and Open Issues [9.227450931458907]
MLOpsは、MLモデルを本番環境に導入する、多くの社会技術的課題に対処するための重要なソリューションとして登場した。
MLOpsの実用性にもかかわらず、MLOpsに関する統合された知識体系は、それが対処するML生産化の課題の多様性のために、依然として解明されている。
本稿では,150のピアレビューと48のグレー文学のコーパスを体系的に解析し,MLOpsの統一的な概念化を合成する多言語文献レビューを提案する。
論文 参考訳(メタデータ) (2024-06-14T05:47:13Z) - Corex: Pushing the Boundaries of Complex Reasoning through Multi-Model Collaboration [83.4031923134958]
Corexは,大規模言語モデルを自律エージェントに変換する,新たな汎用戦略スイートだ。
人間の振る舞いにインスパイアされたCorexは、Debate、Review、Retrieveモードといった多様なコラボレーションパラダイムによって構成されている。
我々は,複数のLDMを協調的に演奏することで,既存の手法に比べて性能が著しく向上することが実証された。
論文 参考訳(メタデータ) (2023-09-30T07:11:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。