論文の概要: Development and Evolution of Xtext-based DSLs on GitHub: An Empirical Investigation
- arxiv url: http://arxiv.org/abs/2501.19222v1
- Date: Fri, 31 Jan 2025 15:28:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-03 14:02:56.575831
- Title: Development and Evolution of Xtext-based DSLs on GitHub: An Empirical Investigation
- Title(参考訳): GitHubにおけるXtextベースのDSLの開発と進化:実証的研究
- Authors: Weixing Zhang, Daniel Strüber, Regina Hebig,
- Abstract要約: Xtext関連のプロジェクトを含む1002のGitHubリポジトリを分析した。
私たちは、開発シナリオ、進化活動、関連するアーティファクトの共進化を含むDSL開発プラクティスを調査しました。
その結果、ほとんどの分析済みDSLは文法駆動のアプローチに従ったが、メタモデル駆動のアプローチを採用した者もいた。
- 参考スコア(独自算出の注目度): 3.6239962192634865
- License:
- Abstract: Domain-specific languages (DSLs) play a crucial role in facilitating a wide range of software development activities in the context of model-driven engineering (MDE). However, a systematic understanding of their evolution is lacking, which hinders methodology and tool development. To address this gap, we performed a comprehensive investigation into the development and evolution of textual DSLs created with Xtext, a particularly widely used language workbench in the MDE. We systematically identified and analyzed 1002 GitHub repositories containing Xtext-related projects. A manual classification of the repositories brought forward 226 ones that contain a fully developed language. These were further categorized into 18 application domains, where we examined DSL artifacts and the availability of example instances. We explored DSL development practices, including development scenarios, evolution activities, and co-evolution of related artifacts. We observed that DSLs are used more, evolve faster, and are maintained longer in specific domains, such as Data Management and Databases. We identified DSL grammar definitions in 722 repositories, but only a third provided textual instances, with most utilizing over 60% of grammar rules. We found that most analyzed DSLs followed a grammar-driven approach, though some adopted a metamodel-driven approach. Additionally, we observed a trend of retrofitting existing languages in Xtext, demonstrating its flexibility beyond new DSL creation. We found that in most DSL development projects, updates to grammar definitions and example instances are very frequent, and most of the evolution activities can be classified as ``perfective'' changes. To support the research in the model-driven engineering community, we contribute a dataset of repositories with meta-information, helping to develop improved tools for DSL evolution.
- Abstract(参考訳): ドメイン固有言語(DSL)は、モデル駆動工学(MDE)の文脈において、幅広いソフトウェア開発活動を促進する上で重要な役割を担います。
しかし、その進化に関する体系的な理解が欠如しており、方法論やツール開発を妨げている。
このギャップに対処するため、我々は、特にMDEで使われている言語ワークベンチであるXtextで作成されたテキストDSLの開発と進化に関する包括的な調査を行った。
我々はXtext関連プロジェクトを含む1002のGitHubリポジトリを体系的に同定し分析した。
リポジトリを手動で分類することで、226の言語が完全に開発された。
これらはさらに18のアプリケーションドメインに分類され、DSLアーティファクトとサンプルインスタンスの可用性を調べました。
私たちは、開発シナリオ、進化活動、関連するアーティファクトの共進化を含むDSL開発プラクティスを調査しました。
我々は、DSLがより多く使われ、より速く進化し、データ管理やデータベースのような特定のドメインで長く維持されていることを観察した。
私たちは722のリポジトリでDSL文法の定義を特定しましたが、3分の1のテキストインスタンスしか提供していません。
その結果、ほとんどの分析済みDSLは文法駆動のアプローチに従ったが、メタモデル駆動のアプローチを採用した者もいた。
さらに、私たちは既存の言語をXtextで再適合させる傾向を観察し、その柔軟性が新しいDSLの作成を超えたことを実証しました。
ほとんどのDSL開発プロジェクトでは、文法定義やサンプルインスタンスの更新が非常に頻繁に行われており、進化のアクティビティのほとんどは `perfective'' 変更に分類されます。
モデル駆動エンジニアリングコミュニティにおける研究を支援するため、メタ情報によるリポジトリのデータセットを提供し、DSL進化のための改善ツールの開発を支援します。
関連論文リスト
- From LIMA to DeepLIMA: following a new path of interoperability [2.5764171991553795]
本稿では,LIMAフレームワークのアーキテクチャと,深層ニューラルネットワークに基づく新たなテキスト解析モジュールの追加による最近の進化について述べる。
モデルは、Universal Dependencies 2.5 corpora、WikiNer corpora、CoNLL-03データセットで60以上の言語でトレーニングされた。
ユビキタスなディープラーニング自然言語処理モデルの統合と標準アノテーション付きコレクションの使用は、相互運用性の新たなパスと見なすことができる。
論文 参考訳(メタデータ) (2024-09-10T14:26:12Z) - From a Natural to a Formal Language with DSL Assistant [0.0]
DSL の開発を支援するために生成言語モデルを統合するツールである DSL Assistant の設計と試作を行う。
DSL Assistantは、OpenAIのアシスタントAPIとGPT-4oを使用して、DSL文法とサンプルインスタンスを生成する。
我々の実験によると、DSL AssistantはユーザーがDSLを作成し、修正するのに役立つ。
論文 参考訳(メタデータ) (2024-08-19T07:53:56Z) - S3LLM: Large-Scale Scientific Software Understanding with LLMs using Source, Metadata, and Document [8.518000504951404]
大規模言語モデル(LLM)は、複雑な科学的コードを理解するための新しい経路を提供する。
S3LLMは、ソースコード、コードメタデータ、要約された情報を対話的で対話的な方法で検証できるように設計されたフレームワークである。
S3LLMは、大規模科学計算ソフトウェアを迅速に理解するために、ローカルにデプロイされたオープンソースLLMを使用する可能性を実証している。
論文 参考訳(メタデータ) (2024-03-15T17:04:27Z) - DIALIGHT: Lightweight Multilingual Development and Evaluation of
Task-Oriented Dialogue Systems with Large Language Models [76.79929883963275]
DIALIGHTは多言語タスク指向対話(ToD)システムの開発と評価のためのツールキットである。
ローカル発話レベルとグローバル対話レベルの両方において、人間のきめ細かい評価のためのセキュアでユーザフレンドリーなWebインターフェースを備えている。
評価の結果, PLMの微調整により精度とコヒーレンスが向上する一方, LLMベースのシステムは多様で類似した応答を生成するのに優れていた。
論文 参考訳(メタデータ) (2024-01-04T11:27:48Z) - Large Language Models for Generative Information Extraction: A Survey [89.71273968283616]
大規模言語モデル(LLM)は、テキスト理解と生成において顕著な能力を示した。
各種IEサブタスクと技術の観点から,これらの作品を分類して概観する。
我々は,最も先進的な手法を実証的に分析し,LLMによるIEタスクの出現傾向を明らかにする。
論文 参考訳(メタデータ) (2023-12-29T14:25:22Z) - ChatDev: Communicative Agents for Software Development [84.90400377131962]
ChatDevはチャットを利用したソフトウェア開発フレームワークで、特別なエージェントがコミュニケーション方法についてガイドされる。
これらのエージェントは、統一された言語ベースのコミュニケーションを通じて、設計、コーディング、テストフェーズに積極的に貢献する。
論文 参考訳(メタデータ) (2023-07-16T02:11:34Z) - An Overview on Controllable Text Generation via Variational
Auto-Encoders [15.97186478109836]
ニューラルベース生成モデリングの最近の進歩は、コンピュータシステムが人間と会話できるという期待を再燃させた。
変分自動エンコーダ(VAE)のような潜在変数モデル(LVM)は、テキストデータの分布パターンを特徴付けるように設計されている。
この概要は、既存の生成方式、テキスト変分自動エンコーダに関連する問題、および制御可能な生成に関するいくつかのアプリケーションについて概説する。
論文 参考訳(メタデータ) (2022-11-15T07:36:11Z) - XF2T: Cross-lingual Fact-to-Text Generation for Low-Resource Languages [11.581072296148031]
拡張多言語データセット上で、人気のあるTransformerベースのテキスト生成モデルを用いて広範な研究を行う。
構造認識型入力エンコーディングとファクト認識を用いたマルチ言語 mT5 モデルにより,12言語の平均結果が得られた。
論文 参考訳(メタデータ) (2022-09-22T18:01:27Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - Addressing Issues of Cross-Linguality in Open-Retrieval Question
Answering Systems For Emergent Domains [67.99403521976058]
新型コロナウイルスの緊急ドメインに対する言語横断的オープン検索型質問応答システムについて紹介する。
本システムでは,検索した文書の信頼性を確保するために,学術論文のコーパスを採用している。
深いセマンティック・レトリバーは、我々の英語からすべてのデータに対するトレーニングの恩恵が大きく、言語横断環境ではBM25ベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-01-26T19:27:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。