論文の概要: AutoRPA: Efficient GUI Automation through LLM-Driven Code Synthesis from Interactions
- arxiv url: http://arxiv.org/abs/2605.21082v1
- Date: Wed, 20 May 2026 12:17:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.659034
- Title: AutoRPA: Efficient GUI Automation through LLM-Driven Code Synthesis from Interactions
- Title(参考訳): AutoRPA: インタラクションからのLLM駆動コード合成による効率的なGUI自動化
- Authors: Minghao Chen, Xinyi Hu, Zhou Yu, Yufei Yin,
- Abstract要約: AutoRPAは、ReActスタイルのエージェントの決定ロジックを堅牢なRPA関数に蒸留するフレームワークである。
実験によると、AutoRPAによって生成されたRPA関数は、トークン使用量を82%から96%削減しながら、同様のタスクをうまく解決している。
- 参考スコア(独自算出の注目度): 27.06451670215353
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Model (LLM) based agents have demonstrated proficiency in multi-step interactions with graphical user interfaces (GUIs). While most research focuses on improving single-task performance, practical scenarios often involve repetitive GUI tasks for which invoking LLM reasoning repeatedly, i.e., the ReAct paradigm, is inefficient. Prior to LLMs, traditional Robotic Process Automation (RPA) offers runtime efficiency but demands significant manual effort to develop and maintain. To bridge this gap, we propose AutoRPA, a framework that automatically distills the decision logic of ReAct-style agents into robust RPA functions. AutoRPA introduces two core innovations: (1) A translator-builder pipeline, where a translator agent converts hard-coded ReAct actions into soft-coded procedures, and a builder agent synthesizes robust RPA functions via retrieval-augmented generation over multiple trajectories; (2) A hybrid repair strategy during code verification, combining RPA execution with ReAct-based fallback for iterative refinement. Experiments across multiple GUI environments demonstrate that RPA functions generated by AutoRPA successfully solve similar tasks while reducing token usage by 82% to 96%, significantly improving runtime efficiency and reusability.
- Abstract(参考訳): LLM(Large Language Model)ベースのエージェントは、グラフィカルユーザインタフェース(GUI)との多段階インタラクションにおいて、習熟度を示す。
ほとんどの研究はシングルタスクのパフォーマンスの改善に重点を置いているが、現実的なシナリオは繰り返しGUIタスクを伴い、LLM推論を繰り返し実行すること、すなわちReActパラダイムは非効率である。
LLMの前には、従来のRobotic Process Automation (RPA) は実行効率を提供するが、開発とメンテナンスにはかなりの手作業が必要である。
このギャップを埋めるために,ReAct型エージェントの意思決定ロジックを堅牢なRPA関数に自動的に蒸留するフレームワークであるAutoRPAを提案する。
AutoRPAは,(1) トランスレータ・ビルダー・パイプライン,(1) トランスレータエージェントがハードコードされたReActアクションをソフトコードされたプロシージャに変換する,2) トランスレータ・ビルダー・パイプライン,(2) 複数のトラジェクトリ上での検索拡張生成を通じてロバストなRPA関数を合成する,2) コード検証中のハイブリッド修復戦略,RPA実行とReActベースのフォールバックを組み合わせる。
複数のGUI環境での実験では、AutoRPAによって生成されたRPA関数が、トークン使用率を82%から96%削減し、実行効率と再利用性を大幅に向上させながら、同様のタスクをうまく解決できることが示されている。
関連論文リスト
- EE-MCP: Self-Evolving MCP-GUI Agents via Automated Environment Generation and Experience Learning [24.190399395358014]
MCP-GUIは、エージェントが各モダリティが相補的な利点を提供するときに学習する統合型ポリシー学習問題として定式化される。
本稿では,自動環境生成と検証,軌跡収集,ギャップ駆動型タスク合成,品質フィルタによるトレーニングを編成する,完全自動パイプラインによる自己進化型フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-10T18:46:05Z) - Are LLM Agents the New RPA? A Comparative Study with RPA Across Enterprise Workflows [0.0]
AACUは、自然言語命令やユーザインターフェースとの自律的なインタラクションを通じて、インテリジェントエージェントがタスクを実行することを可能にする。
本研究では,企業ワークフローの自動化において,AACUがRCAの代替となるかどうかを検討する。
論文 参考訳(メタデータ) (2025-09-04T13:22:44Z) - CoAct-1: Computer-using Agents with Coding as Actions [94.99657662893338]
CoAct-1はGUIベースの制御と直接プログラム実行を組み合わせた新しいマルチエージェントシステムである。
我々は、CoAct-1が60.76%の最先端の成功率を達成したOSWorldベンチマークで、我々のシステムを評価した。
論文 参考訳(メタデータ) (2025-08-05T21:33:36Z) - ERPA: Efficient RPA Model Integrating OCR and LLMs for Intelligent Document Processing [0.0]
本稿では,移民におけるOCRタスクのIDデータ抽出と最適化を目的とした,革新的なロボットプロセス自動化(RPA)モデルであるERPAを提案する。
ベンチマークの結果、ERPAは処理時間を最大94%削減し、IDデータの抽出をわずか9.94秒で完了している。
論文 参考訳(メタデータ) (2024-12-24T09:44:43Z) - LMRPA: Large Language Model-Driven Efficient Robotic Process Automation for OCR [0.0]
本稿では,LMRPA(Large Model-Driven Robotic Process Automation Model)を紹介する。
光学文字認識(OCR)タスクの効率と速度を大幅に向上させるように設計されている。
論文 参考訳(メタデータ) (2024-12-24T00:21:36Z) - AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.565200973244146]
自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文 参考訳(メタデータ) (2024-10-03T20:01:09Z) - AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.47116888545878]
AutoActはQAのための自動エージェント学習フレームワークである。
大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - Accelerating Robotic Reinforcement Learning via Parameterized Action
Primitives [92.0321404272942]
強化学習は汎用ロボットシステムの構築に使用することができる。
しかし、ロボット工学の課題を解決するためにRLエージェントを訓練することは依然として困難である。
本研究では,ロボット行動プリミティブ(RAPS)のライブラリを手動で指定し,RLポリシーで学習した引数をパラメータ化する。
動作インターフェースへの簡単な変更は、学習効率とタスクパフォーマンスの両方を大幅に改善する。
論文 参考訳(メタデータ) (2021-10-28T17:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。