論文の概要: LLM-based Generation of Semantically Diverse and Realistic Domain Model Instances
- arxiv url: http://arxiv.org/abs/2604.10350v1
- Date: Sat, 11 Apr 2026 21:20:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.971748
- Title: LLM-based Generation of Semantically Diverse and Realistic Domain Model Instances
- Title(参考訳): LLMを用いたセマンティックディバースおよびリアリスティックドメインモデルインスタンスの生成
- Authors: Andrei Coman, Lola Burgueño, Dominik Bork, Manuel Wimmer,
- Abstract要約: 大規模言語モデル(LLM)は、最近ドメインモデリングタスクをサポートするために提案されている。
本稿では,LLMと2つの検証手法を用いて,意味論的に現実的で多様なドメインモデルをインスタンス化する手法を提案する。
その結果、生成されたインスタンスは概ね構文的に正しいこと、ドメインモデルに準拠していること、セマンティックエラーはわずかであることがわかった。
- 参考スコア(独自算出の注目度): 3.534313562394614
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large Language Models (LLMs) have been recently proposed for supporting domain modeling tasks mostly related to the completion of partial models by recommending additional model elements. However, there are many more modeling tasks, one of them being the instantiation of domain models to represent concrete domain objects. While there is considerable work supporting the generation of structurally valid instantiations, there are still open challenges to incorporating real-world semantics by having realistic values contained in instances and ensuring the generation of semantically diverse models. Only then will such generated models become human-understandable and helpful in educational or data-driven research contexts. To tackle these challenges, this paper presents an approach that employs LLMs and two prompting strategies in combination with existing model validation tools for instantiating semantically realistic and diverse domain models expressed as UML class diagrams. We have applied our approach to models used in education and available in the literature from different domains and evaluated the generated instances in terms of syntactic correctness, model conformance, semantic correctness, and diversity of the generated values. The results show that the generated instances are mostly syntactically correct, that they conform to the domain model, and that there are only a few semantic errors. Moreover, the generated instance values are semantically diverse, i.e., concrete realistic examples in line with the domain and the combination of the values within one model are semantically coherent.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ドメインモデリングタスクをサポートするために最近提案されている。
しかし、多くのモデリングタスクがあり、そのうちの1つは、具体的なドメイン・オブジェクトを表現するためのドメイン・モデルのインスタンス化です。
構造的に有効なインスタンス生成を支援する作業は相当あるが、実世界のセマンティクスを組み込むには、実世界のセマンティクスをインスタンスに含め、意味論的に多様なモデルの生成を保証することで、未解決の課題がある。
その時だけ、そのような生成されたモデルは人間に理解され、教育やデータ駆動研究の文脈で役立つようになるでしょう。
これらの課題に対処するため,本論文では,UMLクラス図として表現された意味的現実的かつ多様なドメインモデルをインスタンス化するための既存モデル検証ツールと組み合わせて,LLMと2つの促進戦略を用いたアプローチを提案する。
本手法は, 教育で用いられ, 異なる分野の文献で利用できるモデルに適用し, 構文的正当性, モデル適合性, 意味的正当性, 生成値の多様性の観点から, 生成事例の評価を行った。
その結果、生成されたインスタンスは概ね構文的に正しいこと、ドメインモデルに準拠していること、セマンティックエラーはわずかであることがわかった。
さらに、生成されたインスタンスの値はセマンティックに多様であり、すなわち、ドメインに沿った具体的な現実的な例であり、1つのモデル内の値の組み合わせはセマンティックにコヒーレントである。
関連論文リスト
- AutoMerge: Search-Based Model Merging Framework for Effective Model Reuse [8.950520457150178]
近年,大規模言語モデル (LLM) の分野において,学習自由なアプローチとしてモデルマージが出現している。
このようなアプローチが他のディープラーニングモデルに効果的に適用できるかどうかを体系的に検討する以前の研究はない。
3つの異なるモデルアーキテクチャ上で5つのモデルマージ手法を評価する。
論文 参考訳(メタデータ) (2026-01-30T09:27:01Z) - Meta-probabilistic Modeling [36.339664748241944]
複数の関連するデータセットから生成モデル構造を直接学習するメタ確率モデリング(MPM)を提案する。
学習と推論のために、抽出可能なVAEにインスパイアされたサロゲートの目的を提案し、双方向の最適化により最適化する。
我々は、オブジェクト中心の画像モデリングとシーケンシャルテキストモデリングでMPMを評価し、有意義な潜在表現を復元しながら、生成モデルをデータに適応させることを実証した。
論文 参考訳(メタデータ) (2026-01-08T00:34:06Z) - LVLM-Aided Alignment of Task-Specific Vision Models [49.96265491629163]
タスク固有の視覚モデルは、高い領域において不可欠である。
本稿では,タスク固有の視覚モデルと人間のドメイン知識を協調する,新しい,効率的な手法を提案する。
提案手法は, モデル動作と人間の仕様との整合性を大幅に向上させる。
論文 参考訳(メタデータ) (2025-12-26T11:11:25Z) - A Model Is Not Built By A Single Prompt: LLM-Based Domain Modeling With Question Decomposition [4.123601037699469]
現実世界のドメインモデリングでは、エンジニアは通常複雑なタスクを簡単に解けるサブタスクに分解する。
本稿では,開発者のモデリングプロセスに類似した質問分解によるLLMに基づくドメインモデリング手法を提案する。
予備的な結果から,本手法は単発プロンプトによるプロンプトよりも優れていた。
論文 参考訳(メタデータ) (2024-10-13T14:28:04Z) - Learning to Generalize Unseen Domains via Multi-Source Meta Learning for Text Classification [71.08024880298613]
テキスト分類の多元的領域一般化について検討する。
本稿では、複数の参照ドメインを使用して、未知のドメインで高い精度を達成可能なモデルをトレーニングするフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-20T07:46:21Z) - Model Attribution in LLM-Generated Disinformation: A Domain Generalization Approach with Supervised Contrastive Learning [26.02988481241285]
現代の大きな言語モデル(LLM)は、人間のような品質で偽情報を生成する。
偽情報を生成する方法の多様性は、正確なソース属性を複雑にする。
本稿では,モデル帰属の概念を領域一般化問題として紹介する。
論文 参考訳(メタデータ) (2024-07-31T00:56:09Z) - Model Composition for Multimodal Large Language Models [71.5729418523411]
本稿では,既存のMLLMのモデル構成による新しいパラダイムを提案する。
我々の基本的な実装であるNaiveMCは、モダリティエンコーダを再利用し、LLMパラメータをマージすることで、このパラダイムの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-20T06:38:10Z) - Adapting Large Language Models for Content Moderation: Pitfalls in Data
Engineering and Supervised Fine-tuning [79.53130089003986]
大規模言語モデル(LLM)は、様々なドメインでタスクを処理するための実現可能なソリューションとなっている。
本稿では、コンテンツモデレーションのためにプライベートにデプロイ可能なLLMモデルを微調整する方法を紹介する。
論文 参考訳(メタデータ) (2023-10-05T09:09:44Z) - Model Reprogramming: Resource-Efficient Cross-Domain Machine Learning [65.268245109828]
視覚、言語、音声などのデータに富む領域では、ディープラーニングが高性能なタスク固有モデルを提供するのが一般的である。
リソース制限されたドメインでのディープラーニングは、(i)限られたデータ、(ii)制約付きモデル開発コスト、(iii)効果的な微調整のための適切な事前学習モデルの欠如など、多くの課題に直面している。
モデル再プログラミングは、ソースドメインから十分に訓練されたモデルを再利用して、モデル微調整なしでターゲットドメインのタスクを解くことで、リソース効率のよいクロスドメイン機械学習を可能にする。
論文 参考訳(メタデータ) (2022-02-22T02:33:54Z) - An Ample Approach to Data and Modeling [1.0152838128195467]
さまざまな分野の概念とメソッドを統合するモデルの構築方法をモデル化するためのフレームワークについて説明する。
参照M*メタモデルフレームワークは、厳密な同値関係の観点からデータセットと各モデルの関連付けに批判的に依存する。
開発されたフレームワークがデータクラスタリング、複雑性、共同研究、ディープラーニング、クリエイティビティに関する洞察を提供する方法について、いくつかの考察がなされている。
論文 参考訳(メタデータ) (2021-10-05T01:26:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。