論文の概要: KModels: Unlocking AI for Business Applications
- arxiv url: http://arxiv.org/abs/2409.05919v1
- Date: Sun, 8 Sep 2024 13:19:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-11 22:10:02.835922
- Title: KModels: Unlocking AI for Business Applications
- Title(参考訳): KModels: ビジネスアプリケーションのためのAIのアンロック
- Authors: Roy Abitbol, Eyal Cohen, Muhammad Kanaan, Bhavna Agrawal, Yingjie Li, Anuradha Bhamidipaty, Erez Bilgory,
- Abstract要約: 本稿では、KModelのアーキテクチャと、それを形作る重要な決定について述べる。
KModelsにより、AI消費者は専用のデータサイエンティストの必要性を排除できる。
オンプレミスのデプロイメントに非常に適しているが、クラウド環境でも使用できる。
- 参考スコア(独自算出の注目度): 10.833754921830154
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As artificial intelligence (AI) continues to rapidly advance, there is a growing demand to integrate AI capabilities into existing business applications. However, a significant gap exists between the rapid progress in AI and how slowly AI is being embedded into business environments. Deploying well-performing lab models into production settings, especially in on-premise environments, often entails specialized expertise and imposes a heavy burden of model management, creating significant barriers to implementing AI models in real-world applications. KModels leverages proven libraries and platforms (Kubeflow Pipelines, KServe) to streamline AI adoption by supporting both AI developers and consumers. It allows model developers to focus solely on model development and share models as transportable units (Templates), abstracting away complex production deployment concerns. KModels enables AI consumers to eliminate the need for a dedicated data scientist, as the templates encapsulate most data science considerations while providing business-oriented control. This paper presents the architecture of KModels and the key decisions that shape it. We outline KModels' main components as well as its interfaces. Furthermore, we explain how KModels is highly suited for on-premise deployment but can also be used in cloud environments. The efficacy of KModels is demonstrated through the successful deployment of three AI models within an existing Work Order Management system. These models operate in a client's data center and are trained on local data, without data scientist intervention. One model improved the accuracy of Failure Code specification for work orders from 46% to 83%, showcasing the substantial benefit of accessible and localized AI solutions.
- Abstract(参考訳): 人工知能(AI)は急速に進歩し続けており、既存のビジネスアプリケーションにAI機能を統合する必要性が高まっている。
しかし、AIの急速な進歩と、AIがビジネス環境にどのように組み込まれているかの間には、大きなギャップがある。
優れた実験モデルをプロダクション環境、特にオンプレミス環境で展開することは、しばしば専門的な専門知識を必要とし、モデル管理の重い負担を課し、現実のアプリケーションでAIモデルを実装する上で重要な障壁を生み出します。
KModelsは、実績のあるライブラリとプラットフォーム(Kubeflow Pipelines、KServe)を活用して、AI開発者とコンシューマの両方をサポートすることで、AIの採用を合理化している。
モデル開発者はモデル開発のみに集中し、モデルをトランスポート可能なユニット(テンプレート)として共有し、複雑な運用デプロイメントの懸念を抽象化することができる。
KModelsは、ビジネス指向のコントロールを提供しながら、ほとんどのデータサイエンスをカプセル化したテンプレートによって、AIコンシューマが専用のデータサイエンティストの必要性を排除することを可能にする。
本稿では、KModelのアーキテクチャと、それを形作る重要な決定について述べる。
我々は、KModelsの主要なコンポーネントとインターフェースを概説する。
さらに、KModelsはオンプレミスのデプロイメントに非常に適しているが、クラウド環境でも利用可能である。
KModelsの有効性は、既存のWork Order Managementシステムに3つのAIモデルのデプロイを成功させることによって実証される。
これらのモデルは、クライアントのデータセンタで動作し、データサイエンティストの介入なしに、ローカルデータでトレーニングされる。
あるモデルは、作業順序のフェールコード仕様の精度を46%から83%に改善し、アクセス可能でローカライズされたAIソリューションの実質的なメリットを示している。
関連論文リスト
- End-Cloud Collaboration Framework for Advanced AI Customer Service in E-commerce [10.443070269390871]
近年、eコマース業界は、高度なAI駆動のカスタマーサービスソリューションに対する需要が急増している。
従来のクラウドベースのモデルは、レイテンシ、パーソナライズされたサービス、プライバシの懸念といった面で制限に直面しています。
我々は,eコマースにおける高度なAIカスタマーサービスのための革新的なエンドクラウドコラボレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-20T13:46:54Z) - xLAM: A Family of Large Action Models to Empower AI Agent Systems [111.5719694445345]
AIエージェントタスク用に設計された大規模なアクションモデルであるxLAMをリリースする。
xLAMは、複数のエージェント能力ベンチマークで例外的なパフォーマンスを提供する。
論文 参考訳(メタデータ) (2024-09-05T03:22:22Z) - Model Callers for Transforming Predictive and Generative AI Applications [2.7195102129095003]
モデル呼び出し(model caller)と呼ばれる新しいソフトウェア抽象化を導入する。
モデル呼び出しは、AIとMLモデル呼び出しの仲介役として機能する。
我々は、モデル呼び出しのためのPythonライブラリのプロトタイプをリリースした。
論文 参考訳(メタデータ) (2024-04-17T12:21:06Z) - Improving the Capabilities of Large Language Model Based Marketing Analytics Copilots With Semantic Search And Fine-Tuning [0.9787137564521711]
本稿では, 意味探索, プロンプトエンジニアリング, 微調整を組み合わせることで, LLMのタスクを正確に実行する能力を大幅に向上させることができることを示す。
GPT-4のようなプロプライエタリなモデルと、Llama-2-70bのようなオープンソースのモデル、および様々な埋め込み方法を比較します。
論文 参考訳(メタデータ) (2024-04-16T03:39:16Z) - Open-Source AI-based SE Tools: Opportunities and Challenges of Collaborative Software Learning [23.395624804517034]
大規模言語モデル(LLM)は、ソフトウェア工学(SE)タスクの進展に役立っている。
これらのAIベースのSEモデルのコラボレーションは、高品質なデータソースの最大化に重点を置いている。
特に高品質のデータは、しばしば商業的または機密性の高い価値を持ち、オープンソースAIベースのSEプロジェクトではアクセスできない。
論文 参考訳(メタデータ) (2024-04-09T10:47:02Z) - Reusable MLOps: Reusable Deployment, Reusable Infrastructure and
Hot-Swappable Machine Learning models and services [0.0]
私たちは、Reusable MLOpsと呼ばれるAI/MLオペレーションの分野で、持続可能な新しい概念を紹介します。
既存のデプロイメントとインフラストラクチャを再利用して、インフラストラクチャやマイクロサービスを分解することなく、それらをホットスワッピングすることで、新しいモデルを提供しています。
論文 参考訳(メタデータ) (2024-02-19T23:40:46Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - TaskMatrix.AI: Completing Tasks by Connecting Foundation Models with
Millions of APIs [71.7495056818522]
私たちは、基礎モデルと数百万のAPIを結合してタスク補完を行う、新しいAIエコシステムとしてTaskMatrix.AIを紹介します。
このようなエコシステムを構築するためのビジョンを示し、それぞれの重要なコンポーネントを説明し、このビジョンの実現可能性と次に取り組むべき主な課題の両方を説明するために研究ケースを使用します。
論文 参考訳(メタデータ) (2023-03-29T03:30:38Z) - OmniForce: On Human-Centered, Large Model Empowered and Cloud-Edge
Collaborative AutoML System [85.8338446357469]
我々は人間中心のAutoMLシステムであるOmniForceを紹介した。
我々は、OmniForceがAutoMLシステムを実践し、オープン環境シナリオにおける適応型AIを構築する方法について説明する。
論文 参考訳(メタデータ) (2023-03-01T13:35:22Z) - Enabling Automated Machine Learning for Model-Driven AI Engineering [60.09869520679979]
モデル駆動型ソフトウェアエンジニアリングとモデル駆動型AIエンジニアリングを実現するための新しいアプローチを提案する。
特に、私たちはAutomated MLをサポートし、AI集約システムの開発において、AIの深い知識のないソフトウェアエンジニアを支援します。
論文 参考訳(メタデータ) (2022-03-06T10:12:56Z) - Data-Driven and SE-assisted AI Model Signal-Awareness Enhancement and
Introspection [61.571331422347875]
モデルの信号認識性を高めるためのデータ駆動型手法を提案する。
コード複雑性のSE概念とカリキュラム学習のAIテクニックを組み合わせる。
モデル信号認識における最大4.8倍の改善を実現している。
論文 参考訳(メタデータ) (2021-11-10T17:58:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。