論文の概要: Using GUI Agent for Electronic Design Automation
- arxiv url: http://arxiv.org/abs/2512.11611v1
- Date: Fri, 12 Dec 2025 14:49:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.80601
- Title: Using GUI Agent for Electronic Design Automation
- Title(参考訳): GUIエージェントを用いた電子設計自動化
- Authors: Chunyi Li, Longfei Li, Zicheng Zhang, Xiaohong Liu, Min Tang, Weisi Lin, Guangtao Zhai,
- Abstract要約: Graphical User Interface (GUI)エージェントは、スクリーンショットをアクションシーケンスにマッピングするエンドツーエンドパラダイムを採用する。
既存のGUIエージェントは、Microsoft WordやExcelのようなコモディティソフトウェアにのみ評価される。
この作業は、GUIエージェントを一般的なオフィス自動化から、専門的で高価値なエンジニアリングドメインまで拡張する。
- 参考スコア(独自算出の注目度): 123.86509061313912
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Graphical User Interface (GUI) agents adopt an end-to-end paradigm that maps a screenshot to an action sequence, thereby automating repetitive tasks in virtual environments. However, existing GUI agents are evaluated almost exclusively on commodity software such as Microsoft Word and Excel. Professional Computer-Aided Design (CAD) suites promise an order-of-magnitude higher economic return, yet remain the weakest performance domain for existing agents and are still far from replacing expert Electronic-Design-Automation (EDA) engineers. We therefore present the first systematic study that deploys GUI agents for EDA workflows. Our contributions are: (1) a large-scale dataset named GUI-EDA, including 5 CAD tools and 5 physical domains, comprising 2,000+ high-quality screenshot-answer-action pairs recorded by EDA scientists and engineers during real-world component design; (2) a comprehensive benchmark that evaluates 30+ mainstream GUI agents, demonstrating that EDA tasks constitute a major, unsolved challenge; and (3) an EDA-specialized metric named EDAgent, equipped with a reflection mechanism that achieves reliable performance on industrial CAD software and, for the first time, outperforms Ph.D. students majored in Electrical Engineering. This work extends GUI agents from generic office automation to specialized, high-value engineering domains and offers a new avenue for advancing EDA productivity. The dataset will be released at: https://github.com/aiben-ch/GUI-EDA.
- Abstract(参考訳): Graphical User Interface (GUI)エージェントは、スクリーンショットをアクションシーケンスにマッピングするエンドツーエンドパラダイムを採用し、仮想環境における繰り返しタスクを自動化する。
しかし、既存のGUIエージェントは、Microsoft WordやExcelのようなコモディティソフトウェアでのみ評価される。
CAD(Professional Computer-Aided Design)スイートは、高次の経済的リターンを約束するが、既存のエージェントにとって最も弱いパフォーマンスドメインであり、専門家のElectronic-Design-Automation(EDA)エンジニアを置き換えるには程遠い。
そこで我々は,EDAワークフロー用のGUIエージェントをデプロイする最初の系統的研究を行った。
筆者らの貢献は,(1)GUI-EDAと呼ばれる大規模データセット,(1)CADツール5つと5つの物理ドメインを含む,実世界のコンポーネント設計において,EDA科学者と技術者が記録した2,000以上の高品質なスクリーンショット・アンサー・アクション・ペア,(2)30以上のメインストリームGUIエージェントを評価し,EDAタスクが主要な未解決課題であることを示す総合的なベンチマーク,(3)産業CADソフトウェア上で信頼性の高い性能を達成するリフレクション機構を備えたEDA特化計量,そして,初めて電気工学を専攻するPh.D.学生を上回ります。
この作業は、GUIエージェントを一般的なオフィス自動化から、専門的で高価値なエンジニアリングドメインに拡張し、EDA生産性を向上させるための新たな道を提供する。
データセットは、https://github.com/aiben-ch/GUI-EDA.comでリリースされる。
関連論文リスト
- Computer-Use Agents as Judges for Generative User Interface [142.75272102498806]
ComputerUse Agents (CUA) は、グラフィカルユーザインタフェース (GUI) を通じてデジタル環境を自律的に操作する能力が高まっている。
ほとんどのGUIは、人間が効率的にタスクを実行するのに不要な人間指向の動作を採用するために設計されている。
CUA は Coder でGUI の自動設計を支援することができるだろうか?
論文 参考訳(メタデータ) (2025-11-19T16:00:02Z) - Engineering.ai: A Platform for Teams of AI Engineers in Computational Design [8.217119500224284]
計算設計におけるAIエンジニアのチームのためのプラットフォームであるEngineering.aiを紹介します。
このフレームワークは階層的なマルチエージェントアーキテクチャを採用しており、チーフエンジニアが特殊エージェントをコーディネートする。
このシステムはFreeCAD、Gmsh、OpenFOAM、CalculiX、BPM音響解析を統合し、並列多分野シミュレーションを可能にする。
論文 参考訳(メタデータ) (2025-10-31T08:00:48Z) - UI-TARS-2 Technical Report: Advancing GUI Agent with Multi-Turn Reinforcement Learning [155.51875080423883]
グラフィカルユーザインタフェースのための自律エージェントの開発は、人工知能における大きな課題を示している。
本稿では,GUI中心のエージェントモデルであるUI-TARS-2を提案する。
実証的な評価では、UI-TARS-2は以前のUI-TARS-1.5よりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-09-02T17:44:45Z) - PHT-CAD: Efficient CAD Parametric Primitive Analysis with Progressive Hierarchical Tuning [52.681829043446044]
ParaCADは1000万点以上のアノテートドローイングと、複雑なトポロジカルな構造とテストのための物理的な制約を備えた3,000の現実世界の産業図で構成されている。
PHT-CADは視覚言語モデルのモダリティアライメントと推論機能を利用する新しい2次元PPAフレームワークである。
論文 参考訳(メタデータ) (2025-03-23T17:24:32Z) - UI-TARS: Pioneering Automated GUI Interaction with Native Agents [58.18100825673032]
本稿では,GUIエージェントのネイティブモデルであるUI-TARSを紹介する。
OSWorldベンチマークでは、UI-TARSはスコアが24.6、50ステップが22.7、15ステップが22.7でクロード(それぞれ22.0と14.9)を上回っている。
論文 参考訳(メタデータ) (2025-01-21T17:48:10Z) - ChatEDA: A Large Language Model Powered Autonomous Agent for EDA [6.858976599086164]
本稿では, LLM, AutoMage, EDAツールがエグゼクタとして機能するEDA用自律エージェントChatEDAを紹介する。
ChatEDAは、タスク分解、スクリプト生成、タスク実行を効果的に管理することで、登録-転送レベル(RTL)からグラフデータシステムバージョンII(GDSII)への設計フローを合理化する。
論文 参考訳(メタデータ) (2023-08-20T08:32:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。