論文の概要: Building Scalable AI-Powered Applications with Cloud Databases: Architectures, Best Practices and Performance Considerations
- arxiv url: http://arxiv.org/abs/2504.18793v1
- Date: Sat, 26 Apr 2025 04:17:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 14:44:44.065771
- Title: Building Scalable AI-Powered Applications with Cloud Databases: Architectures, Best Practices and Performance Considerations
- Title(参考訳): クラウドデータベースによるスケーラブルなAI駆動アプリケーションの構築: アーキテクチャ、ベストプラクティス、パフォーマンスに関する考察
- Authors: Santosh Bhupathi,
- Abstract要約: AIベースのアプリケーションの急速な採用は、高性能でスケーラブルで効率的なクラウドデータベースソリューションを必要とする。
本稿では,汎用技術を活用することによって,クラウドネイティブデータベースがAI駆動アプリケーションを実現する方法について検討する。
パフォーマンスベンチマーク、スケーラビリティの考慮、コスト効率の戦略を評価し、AI対応アプリケーションの設計をガイドする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid adoption of AI-powered applications demands high-performance, scalable, and efficient cloud database solutions, as traditional architectures often struggle with AI-driven workloads requiring real-time data access, vector search, and low-latency queries. This paper explores how cloud-native databases enable AI-driven applications by leveraging purpose-built technologies such as vector databases (pgvector), graph databases (AWS Neptune), NoSQL stores (Amazon DocumentDB, DynamoDB), and relational cloud databases (Aurora MySQL and PostgreSQL). It presents architectural patterns for integrating AI workloads with cloud databases, including Retrieval-Augmented Generation (RAG) [1] with LLMs, real-time data pipelines, AI-driven query optimization, and embeddings-based search. Performance benchmarks, scalability considerations, and cost-efficient strategies are evaluated to guide the design of AI-enabled applications. Real-world case studies from industries such as healthcare, finance, and customer experience illustrate how enterprises utilize cloud databases to enhance AI capabilities while ensuring security, governance, and compliance with enterprise and regulatory standards. By providing a comprehensive analysis of AI and cloud database integration, this paper serves as a practical guide for researchers, architects, and enterprises to build next-generation AI applications that optimize performance, scalability, and cost efficiency in cloud environments.
- Abstract(参考訳): 従来のアーキテクチャでは、リアルタイムデータアクセス、ベクトル検索、低レイテンシクエリを必要とするAI駆動のワークロードに苦労することが多い。
本稿では、ベクトルデータベース(pgvector)、グラフデータベース(AWS Neptune)、NoSQLストア(Amazon DocumentDB、DynamoDB)、リレーショナルクラウドデータベース(Aurora MySQL、PostgreSQL)といった汎用技術を活用することで、クラウドネイティブデータベースがAI駆動のアプリケーションを実現する方法について検討する。
クラウドデータベースにAIワークロードを統合するためのアーキテクチャパターンとして、LLMを使用したRetrieval-Augmented Generation(RAG)[1]、リアルタイムデータパイプライン、AI駆動クエリ最適化、組み込みベースの検索などがある。
パフォーマンスベンチマーク、スケーラビリティの考慮、コスト効率の戦略を評価し、AI対応アプリケーションの設計をガイドする。
医療、金融、顧客エクスペリエンスといった業界における実世界のケーススタディは、企業がクラウドデータベースを使用してAI機能を強化し、セキュリティ、ガバナンス、および企業や規制標準への準拠を保証する方法を示している。
この論文は、AIとクラウドデータベースの統合に関する包括的な分析を提供することによって、クラウド環境のパフォーマンス、スケーラビリティ、コスト効率を最適化する次世代AIアプリケーションを構築するための、研究者、アーキテクト、企業のための実践的なガイドとなる。
関連論文リスト
- Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [59.52058740470727]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文 参考訳(メタデータ) (2025-05-03T13:55:38Z) - Orchestrating Agents and Data for Enterprise: A Blueprint Architecture for Compound AI [11.859180018313147]
企業アプリケーションのためのエージェントとデータをオーケストレーションするための複合AIシステムのための「青写真アーキテクチャ」を提案する。
エンタープライズにおける既存のプロプライエタリなモデルとAPIは、'エージェントレジストリ'で定義された'エージェント'にマップされる。
エージェントは、さまざまなモダリティのエンタープライズデータを同じように登録する'データレジストリ'を通じて、プロプライエタリなデータを利用することができる。
論文 参考訳(メタデータ) (2025-04-10T22:19:41Z) - AnDB: Breaking Boundaries with an AI-Native Database for Universal Semantic Analysis [11.419119182421964]
AnDBはAIネイティブデータベースで、従来のOワークロードとAI駆動タスクをサポートする。
AnDBでは、AIの専門知識を必要とせずに、直感的なステートメントを使用してセマンティッククエリを実行することができる。
AnDBは将来的なデータ管理インフラストラクチャを保護し、スクラッチから始めることなく、すべての種類のデータの全潜在能力を効果的かつ効率的に活用することを可能にする。
論文 参考訳(メタデータ) (2025-02-19T15:15:59Z) - Top Ten Challenges Towards Agentic Neural Graph Databases [56.92578700681306]
Neo4jやTigerGraphのようなグラフデータベース(GDB)は相互接続されたデータを扱うのが得意だが、高度な推論機能が欠けている。
本稿では,NGDBを3つのコア機能で拡張するエージェント型ニューラルネットワークデータベース(Agentic NGDB)を提案する。
論文 参考訳(メタデータ) (2025-01-24T04:06:50Z) - Cloud Platforms for Developing Generative AI Solutions: A Scoping Review of Tools and Services [0.27649989102029926]
Generative AIは、機械がコンテンツ、コード、デザインを作成できるようにすることで、エンタープライズアプリケーション開発を変革している。
クラウドコンピューティングは、生成AIモデルをトレーニング、デプロイ、スケールするためのインフラストラクチャを提供することによって、これらのニーズに対処する。
このレビューでは、生成AIのためのクラウドサービスを調べ、Amazon Web Services(AWS)、Microsoft Azure、Google Cloud、IBM Cloud、Oracle Cloud、Alibaba Cloudといった主要なプロバイダに焦点を当てている。
論文 参考訳(メタデータ) (2024-12-08T19:49:07Z) - Transforming the Hybrid Cloud for Emerging AI Workloads [81.15269563290326]
このホワイトペーパーでは、AIワークロードの複雑さの増大に対応するために、ハイブリッドクラウドシステムを変革することを想定している。
提案したフレームワークは、エネルギー効率、性能、コスト効率において重要な課題に対処する。
この共同イニシアチブは、ハイブリッドクラウドをセキュアで効率的で持続可能なプラットフォームとして確立することを目的としています。
論文 参考訳(メタデータ) (2024-11-20T11:57:43Z) - Scalable, Distributed AI Frameworks: Leveraging Cloud Computing for
Enhanced Deep Learning Performance and Efficiency [0.0]
近年、人工知能(AI)とクラウドコンピューティングの統合は、AIアプリケーションの計算要求の増加に対処するための有望な道として現れている。
本稿では,クラウドコンピューティングを活用したスケーラブルな分散AIフレームワークの総合的研究を行い,ディープラーニングの性能向上と効率化について述べる。
論文 参考訳(メタデータ) (2023-04-26T15:38:00Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Reproducible Performance Optimization of Complex Applications on the
Edge-to-Cloud Continuum [55.6313942302582]
エッジ・ツー・クラウド・コンティニュム上でのリアルタイムアプリケーションの最適化を支援する手法を提案する。
提案手法は, 制御されたテストベッド環境において, その動作を理解するための厳密な構成解析に頼っている。
当社の方法論はEdge-to-Cloud Continuumの他のアプリケーションに一般化することができる。
論文 参考訳(メタデータ) (2021-08-04T07:35:14Z) - A Privacy-Preserving Distributed Architecture for
Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。
クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文 参考訳(メタデータ) (2020-03-30T15:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。