論文の概要: GenAI-DrawIO-Creator: A Framework for Automated Diagram Generation
- arxiv url: http://arxiv.org/abs/2601.05162v1
- Date: Thu, 08 Jan 2026 17:51:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.315978
- Title: GenAI-DrawIO-Creator: A Framework for Automated Diagram Generation
- Title(参考訳): GenAI-DrawIO-Creator: ダイアグラムの自動生成フレームワーク
- Authors: Jinze Yu, Dayuan Jiang,
- Abstract要約: GenAI-DrawIO-Creatorは大規模言語モデル(LLM)を利用して図生成と操作を自動化する新しいフレームワークである。
本システムでは、Claude 3.7を統合して、構造化された視覚データを推論し、有効な図表表現を生成する。
- 参考スコア(独自算出の注目度): 0.6660458629649825
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Diagrams are crucial for communicating complex information, yet creating and modifying them remains a labor-intensive task. We present GenAI-DrawIO-Creator, a novel framework that leverages Large Language Models (LLMs) to automate diagram generation and manipulation in the structured XML format used by draw.io. Our system integrates Claude 3.7 to reason about structured visual data and produce valid diagram representations. Key contributions include a high-level system design enabling real-time diagram updates, specialized prompt engineering and error-checking to ensure well-formed XML outputs. We demonstrate a working prototype capable of generating accurate diagrams (such as network architectures and flowcharts) from natural language or code, and even replicating diagrams from images. Simulated evaluations show that our approach significantly reduces diagram creation time and produces outputs with high structural fidelity. Our results highlight the promise of Claude 3.7 in handling structured visual reasoning tasks and lay the groundwork for future research in AI-assisted diagramming applications.
- Abstract(参考訳): ダイアグラムは複雑な情報を伝達するのに不可欠だが、作成と修正は労働集約的な作業である。
本稿では,Large Language Models (LLM) を利用した新しいフレームワークであるGenAI-DrawIO-Creatorについて述べる。
本システムでは、Claude 3.7を統合して、構造化された視覚データを推論し、有効な図表表現を生成する。
主なコントリビューションには、リアルタイムダイアグラム更新を可能にするハイレベルなシステム設計、高度に整ったXML出力を保証するための特別なプロンプトエンジニアリングとエラーチェックが含まれる。
自然言語やコードから正確なダイアグラム(ネットワークアーキテクチャやフローチャートなど)を生成でき、画像からダイアグラムを複製できる動作プロトタイプを実証する。
シミュレーションにより,本手法はダイアグラム作成時間を大幅に短縮し,構造的忠実度の高い出力を生成することを示す。
我々の結果は、構造化された視覚的推論タスクの処理におけるClaude 3.7の約束を強調し、AI支援ダイアグラムアプリケーションにおける将来の研究の基礎を築いた。
関連論文リスト
- SketchAgent: Generating Structured Diagrams from Hand-Drawn Sketches [54.06877048295693]
SketchAgentは手描きスケッチの構造化図への変換を自動化するシステムである。
SketchAgentは、スケッチ認識、シンボリック推論、反復検証を統合し、セマンティックコヒーレントで構造的に正確な図を生成する。
ダイアグラム生成プロセスの合理化によって、SketchAgentはデザイン、教育、エンジニアリングの分野で大きな可能性を秘めています。
論文 参考訳(メタデータ) (2025-08-02T07:22:51Z) - StarFlow: Generating Structured Workflow Outputs From Sketch Images [10.870956565888545]
本稿では,視覚言語モデルを用いたスケッチから構造化ワークフロー出力を生成するフレームワークであるStarFlowを紹介する。
アプローチの強みと限界を分析するために、複数の視覚言語モデルを微調整し、ベンチマークします。
この結果から,ファインタニングによりワークフロー生成が大幅に向上し,このタスクにおける視覚言語モデルの性能が向上することが示された。
論文 参考訳(メタデータ) (2025-03-27T18:04:05Z) - SciDoc2Diagrammer-MAF: Towards Generation of Scientific Diagrams from Documents guided by Multi-Aspect Feedback Refinement [22.07623299712134]
本稿では,学術論文から関連情報を抽出し,図を生成するSciDoc2Diagramを提案する。
中間コード生成を用いたユーザ意図に基づく図を生成するパイプラインSciDoc2Diagrammerを開発した。
論文 参考訳(メタデータ) (2024-09-28T05:10:39Z) - PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は,ユーザのデザイン意図に基づいて編集可能なポスターを生成する自動テキスト投稿システムを開発した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z) - DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning [62.51232333352754]
テキスト・ツー・イメージ(T2I)世代はここ数年で著しい成長を遂げている。
それにもかかわらず、T2Iモデルでダイアグラムを生成する作業はほとんど行われていない。
本稿では,新しい2段階のテキスト・ツー・ダイアグラム生成フレームワークであるDiagrammerGPTを紹介する。
我々のフレームワークは、既存のT2Iモデルを上回る精度で、より正確なダイアグラムを生成する。
論文 参考訳(メタデータ) (2023-10-18T17:37:10Z) - InstructCV: Instruction-Tuned Text-to-Image Diffusion Models as Vision Generalists [66.85125112199898]
我々は,タスク固有の設計選択を抽象化する,コンピュータビジョンタスクのための統一言語インタフェースを開発する。
InstructCVと呼ばれる我々のモデルは、他のジェネラリストやタスク固有の視覚モデルと比較して競合的に機能する。
論文 参考訳(メタデータ) (2023-09-30T14:26:43Z) - HAT-GAE: Self-Supervised Graph Auto-encoders with Hierarchical Adaptive
Masking and Trainable Corruption [0.76146285961466]
グラフ表現学習のための新しいオートエンコーダモデルを提案する。
このモデルには階層型適応マスキング機構が組み込まれ,トレーニングの難易度を漸進的に向上させる。
提案手法が最先端のグラフ表現学習モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-01-28T02:43:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。