論文の概要: Analyzing the Adoption of Database Management Systems Throughout the History of Open Source Projects
- arxiv url: http://arxiv.org/abs/2605.06817v1
- Date: Thu, 07 May 2026 18:17:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.536628
- Title: Analyzing the Adoption of Database Management Systems Throughout the History of Open Source Projects
- Title(参考訳): オープンソースプロジェクトの歴史を通してのデータベース管理システム導入の分析
- Authors: Camila A. Paiva, Raquel Maximino, Frederico Paiva, Rafael Accetta Vieira, Nicole Espanha, João Felipe Pimentel, Igor Wiese, Marco Aurélio Gerosa, Igor Steinmacher, Leonardo Murta, Vanessa Braganholo,
- Abstract要約: データベース管理システム(DBMS)は、現代のアプリケーションで処理されるデータの保存、取得、管理に広く使われている。
本稿では、GitHubにホストされている362の人気のあるオープンソースJavaプロジェクトでの使用状況について、歴史的に考察する。
- 参考スコア(独自算出の注目度): 11.002872292708565
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Database Management Systems (DBMSs) are widely used to store, retrieve, and manage the data handled by modern applications. Although prior work has studied the co-evolution of DBMSs and application source code, less is known about DBMS adoption, co-use, and replacement in real systems. This paper presents a historical study of DBMS usage in 362 popular open-source Java projects hosted on GitHub. We investigated the adoption of the top DBMSs ranked by DB-Engines, covering relational and non-relational systems. Using source-code heuristics, we analyzed DBMS popularity, stability, migration patterns, co-occurrence, and the role of Object-Relational Mappers (ORMs). Our findings show that MySQL and PostgreSQL are the most popular DBMSs in our corpus. Among non-relational DBMSs, Redis and MongoDB are the most frequently used and tend to remain stable after adoption. In contrast, systems such as HyperSQL are more often replaced as projects evolve. We also observed frequent co-use of multiple DBMSs, suggesting patterns of polyglot persistence in which projects combine systems to handle different data needs. Finally, we found that ORM frameworks are commonly used to mediate interactions between applications and DBMSs. Overall, our study provides empirical evidence on how DBMSs are adopted, combined, and replaced over time, offering guidance for developers, architects, educators, and DBMS vendors.
- Abstract(参考訳): データベース管理システム(DBMS)は、現代のアプリケーションで処理されるデータの保存、取得、管理に広く使われている。
以前の研究はDBMSとアプリケーションソースコードの共進化を研究してきたが、DBMSの採用、再利用、実際のシステムの置換についてはあまり知られていない。
本稿では、GitHubにホストされている362の人気のあるオープンソースプロジェクトにおけるDBMSの使用状況に関する歴史的考察を示す。
我々はDB-Enginesでランク付けされた上位DBMSの採用について検討し、リレーショナルシステムと非リレーショナルシステムについて検討した。
ソースコードヒューリスティックスを用いて、DBMSの人気、安定性、マイグレーションパターン、共起、およびORM(Object-Relational Mapper)の役割を分析した。
私たちの調査によると、MySQLとPostgreSQLは、私たちのコーパスで最も人気のあるDBMSです。
非リレーショナルDBMSの中では、RedisとMongoDBが最も頻繁に使われ、採用後も安定している傾向にある。
対照的に、HyperSQLのようなシステムは、プロジェクトが進化するにつれて、置き換えられることが多い。
また、複数のDBMSの頻繁な共用も観察し、異なるデータニーズを扱うシステムを組み合わせた多言語永続化のパターンを示唆した。
最後に、ORMフレームワークはアプリケーションとDBMS間のインタラクションの仲介に一般的に使われています。
全体として、私たちの研究は、DBMSをどのように採用、組み合わせ、置き換えるかという実証的な証拠を提供し、開発者、アーキテクト、教育者、DBMSベンダーに対してガイダンスを提供しています。
関連論文リスト
- AskDB: An LLM Agent for Natural Language Interaction with Relational Databases [0.06524460254566904]
我々はAskDBを紹介した。AskDBは自然言語を介してデータベースと対話するための大規模言語モデル駆動エージェントである。
AskDBは自然言語によるデータ分析と管理操作のオーバースクルデータベースの両方をサポートする。
我々の結果は、AskDBがリレーショナルデータベースシステムのための統一的でインテリジェントなエージェントである可能性を強調し、エンドユーザーに直感的でアクセスしやすい体験を提供する。
論文 参考訳(メタデータ) (2025-11-20T08:06:09Z) - LLM-based Multi-Agent Blackboard System for Information Discovery in Data Science [69.1690891731311]
従来のAIモデルのためのブラックボードアーキテクチャに着想を得た,新しいマルチエージェント通信パラダイムを提案する。
このフレームワークでは、中央エージェントが共有ブラックボードにリクエストをポストし、自律的な従属エージェントがその能力に基づいて応答する。
明示的なデータ発見を必要とする3つのベンチマークに対して,本手法の評価を行った。
論文 参考訳(メタデータ) (2025-09-30T22:34:23Z) - Toward Understanding Bugs in Vector Database Management Systems [11.916195480211648]
ベクトルデータベース管理システム(VDBMS)は,多様なデータソースからの高次元埋め込みのセマンティックな類似性検索を容易にする上で,重要な役割を担っている。
従来のデータベース信頼性モデルは、データ表現、クエリ機構、システムアーキテクチャに根本的な違いがあるため、VDBMSに直接適用することはできない。
我々は15のオープンソースVDBMSから1,671件のバグ修正プルリクエストを手動で分析し、症状、根本原因、開発者修正戦略に基づいたバグの包括的な分類法を開発した。
論文 参考訳(メタデータ) (2025-06-03T08:34:01Z) - WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos [48.88393315169039]
協調学習(CL)技術により、複数のパーティが生データを共有せずにモデルを共同でトレーニングできる。
現在のCLベンチマークとアルゴリズムは、主に、分離、アライメント、結合可能なデータベースの仮定の下で学習ステップを目標としています。
我々は1700万の重み付きエッジでリンクされた10万の現実世界のリレーショナルデータベースから構築された大規模なデータセットを構築した。
論文 参考訳(メタデータ) (2025-05-22T13:07:06Z) - Scaling Automated Database System Testing [3.3302293148249125]
我々は、Commonsqlの機能のサブセットをサポートするデータベースにテストオラクルを適用するビジョンとプラットフォームを提示する。
本研究では,Commonsqlの機能サブセットをサポートするデータベースに対して,テストオーラクルを適用するためのビジョンとプラットフォームであるSQLancer++を提示する。
論文 参考訳(メタデータ) (2025-03-27T12:10:36Z) - Enhanced Differential Testing in Emerging Database Systems [11.164715689334912]
本稿では,新たなデータベースシステムのバグを明らかにするために,改良された差分テストを提案する。
多くの新しいデータベースシステムは、概念的にはリレーショナルデータベースシステムの拡張である。
57の未知のバグがあり、うち17はロジックのバグで、40は内部エラーでした。
論文 参考訳(メタデータ) (2025-01-02T12:52:58Z) - Relational Database Augmented Large Language Model [59.38841050766026]
大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクに優れる。
彼らは、トレーニングや教師付き微調整プロセスを通じてのみ、新しい知識を取り入れることができる。
この正確で最新のプライベート情報は、通常リレーショナルデータベースに格納される。
論文 参考訳(メタデータ) (2024-07-21T06:19:10Z) - RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL [48.516004807486745]
文脈内学習を伴う大規模言語モデル(LLM)は、テキスト・ツー・タスクの性能を大幅に改善した。
In-context prompt Engineering のための新しい検索ベースフレームワーク RB- を提案する。
実験により,我々のモデルは,公開データセットのBIRDとSpiderの競合ベースラインよりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2024-07-11T08:19:58Z) - Demonstration of DB-GPT: Next Generation Data Interaction System Empowered by Large Language Models [15.694402144885702]
我々は,大規模な言語モデルを従来のデータインタラクションタスクに統合した,革新的で製品対応のPythonライブラリDB-GPTを提案する。
DB-GPTは、自然言語で記述されたデータインタラクションタスクを理解し、LLMを利用したコンテキスト認識応答を提供するように設計されている。
サービス指向マルチモデル管理フレームワーク(SMMF)は、データのプライバシとセキュリティを保証する。
論文 参考訳(メタデータ) (2024-04-16T01:38:34Z) - ERBench: An Entity-Relationship based Automatically Verifiable Hallucination Benchmark for Large Language Models [46.07900122810749]
大規模言語モデル(LLM)は、様々なアプリケーションで前例のない性能を達成したが、評価は依然として難しい。
既存のリレーショナルデータベースを利用することは、ベンチマークを構築する上で有望なアプローチである、と我々は主張する。
我々は,これらの整合性制約を用いて任意のデータベースをLLMベンチマークに変換するERBenchを提案する。
論文 参考訳(メタデータ) (2024-03-08T12:42:36Z) - A Unified Transferable Model for ML-Enhanced DBMS [53.46830627879208]
本稿では,タスク間で伝達可能な知識をキャプチャするマルチタスクトレーニングプロシージャと,db間でのメタ知識を蒸留するプリトレーニングファインチューンプロシージャを用いた統一モデルmtmlfを提案する。
このパラダイムはクラウドDBサービスに適しており、将来的にMLの使用方法に革命をもたらす可能性があると考えています。
論文 参考訳(メタデータ) (2021-05-06T03:31:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。