Fugu-MT 論文翻訳(概要): Every Software as an Agent: Blueprint and Case Study

論文の概要: Every Software as an Agent: Blueprint and Case Study

arxiv url: http://arxiv.org/abs/2502.04747v1
Date: Fri, 07 Feb 2025 08:29:09 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-10 18:29:33.066185
Title: Every Software as an Agent: Blueprint and Case Study
Title（参考訳）: エージェントとしてのソフトウェア - Blueprintとケーススタディ
Authors: Mengwei Xu,
Abstract要約: 我々は、ソフトウェア内部(ソースコードとランタイムコンテキスト)へのアクセスと、生成したコードを動的にソフトウェアに注入して実行することを許可することで、大きな言語モデル(LLM)を実現することを提唱する。ウェブベースの2つのデスクトップアプリケーションの設計アーキテクチャとケーススタディについて述べる。
参考スコア（独自算出の注目度）: 0.6655461660736298
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The rise of (multimodal) large language models (LLMs) has shed light on software agent -- where software can understand and follow user instructions in natural language. However, existing approaches such as API-based and GUI-based agents are far from satisfactory at accuracy and efficiency aspects. Instead, we advocate to endow LLMs with access to the software internals (source code and runtime context) and the permission to dynamically inject generated code into software for execution. In such a whitebox setting, one may better leverage the software context and the coding ability of LLMs. We then present an overall design architecture and case studies on two popular web-based desktop applications. We also give in-depth discussion of the challenges and future directions. We deem that such a new paradigm has the potential to fundamentally overturn the existing software agent design, and finally creating a digital world in which software can comprehend, operate, collaborate, and even think to meet complex user needs.
Abstract（参考訳）: マルチモーダル(multimodal)な大規模言語モデル(LLM)の台頭は、ソフトウェアエージェントに光を当てている。しかし、APIベースのエージェントやGUIベースのエージェントのような既存のアプローチは、正確性と効率の面において満足できない。代わりに、私たちは、ソフトウェア内部(ソースコードとランタイムコンテキスト)へのアクセスと、生成したコードを動的にソフトウェアに注入する許可をLLMに付与することを提唱しています。このようなホワイトボックス設定では、LLMのソフトウェアコンテキストとコーディング能力をうまく活用することができる。次に、一般的なWebベースのデスクトップアプリケーション2つについて、全体的な設計アーキテクチャとケーススタディを示す。また、課題と今後の方向性について詳細に議論する。このような新しいパラダイムは、既存のソフトウェアエージェント設計を根本的に覆し、最終的にソフトウェアが複雑なユーザニーズを理解し、操作し、協力し、考えることのできるデジタル世界を生み出す可能性があると私たちは考えています。

関連論文リスト

Skill Discovery for Software Scripting Automation via Offline Simulations with LLMs [63.10710876536337]
検証済みスクリプトの集合であるソフトウェア固有のスキルセットをキュレートするためのオフラインシミュレーションフレームワークを提案する。本フレームワークは,1)タスク作成,トップダウン機能の利用,およびボトムアップAPIのシナジー探索という2つのコンポーネントから構成される。 Adobe Illustratorでの実験では、我々のフレームワークは自動化の成功率を大幅に改善し、レスポンス時間を短縮し、ランタイムトークンのコストを削減しています。
論文参考訳（メタデータ） (2025-04-29T04:03:37Z)
Human-In-the-Loop Software Development Agents [12.830816751625829]
大規模言語モデル(LLM)ベースのソフトウェアエンジニアリングのためのマルチエージェントパラダイムを導入し、ソフトウェア開発タスクを自動的に解決する。本稿では,ソフトウェア開発のためのHuman-in-the-loop LLMベースのエージェントフレームワーク(HULA)を紹介する。私たちは社内使用のために、HULAフレームワークをAtlassianに設計、実装、デプロイしています。
論文参考訳（メタデータ） (2024-11-19T23:22:33Z)
OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.8507367518992]
私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文参考訳（メタデータ） (2024-07-23T17:50:43Z)
Agentless: Demystifying LLM-based Software Engineering Agents [12.19683999553113]
Agentless - ソフトウェア開発の問題を自動解決するためのエージェントレスアプローチです。 Agentlessはエージェントベースのアプローチの冗長で複雑な設定と比較すると、ローカライゼーション、修復、パッチ検証の3フェーズプロセスをシンプルに採用している。人気の高いSWE-bench Liteベンチマークの結果から、Agentlessは驚くほど高いパフォーマンスと低コストを達成できることがわかった。
論文参考訳（メタデータ） (2024-07-01T17:24:45Z)
Agent-Driven Automatic Software Improvement [55.2480439325792]
本提案は,Large Language Models (LLMs) を利用したエージェントの展開に着目して,革新的なソリューションの探求を目的とする。継続的学習と適応を可能にするエージェントの反復的性質は、コード生成における一般的な課題を克服するのに役立ちます。我々は,これらのシステムにおける反復的なフィードバックを用いて,エージェントの基盤となるLLMをさらに微調整し,自動化されたソフトウェア改善のタスクに整合性を持たせることを目指している。
論文参考訳（メタデータ） (2024-06-24T15:45:22Z)
Requirements are All You Need: From Requirements to Code with LLMs [0.0]
大規模言語モデル(LLM)は、ソフトウェア工学のタスクに適用できる。本稿では,要求文書からコードスニペットを自動生成するLLMについて述べる。複雑なユーザ要件を解釈し、ロバストな設計とコードソリューションを作成する上で、LCMの熟練度を実証する。
論文参考訳（メタデータ） (2024-06-14T14:57:35Z)
Morescient GAI for Software Engineering (Extended Version) [2.4861619769660637]
我々は,オープンサイエンスの原則に従って,GAIモデルを設計し,発展し,普及させる方法について,ビジョンとロードマップを提示する。
論文参考訳（メタデータ） (2024-06-07T07:38:33Z)
Towards a copilot in BIM authoring tool using a large language model-based agent for intelligent human-machine interaction [0.40964539027092917]
デザイナーは、しばしばよりインテリジェントで軽量な方法でソフトウェアと対話しようとします。本稿では,BIMオーサリングツールにおいて,協調動作として機能する自律エージェントフレームワークを提案する。 BIMオーサリングソフトウェアであるVectorworksのケーススタディでは,提案したフレームワークをシームレスに統合するソフトウェアプロトタイプを実装した。
論文参考訳（メタデータ） (2024-06-02T17:47:57Z)
SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering [79.07755560048388]
SWEエージェント(SWE-agent)は、LMエージェントが自律的にコンピュータを使用してソフトウェア工学のタスクを解決するシステムである。 SWEエージェントのカスタムエージェントコンピュータインタフェース(ACI)は、エージェントがコードファイルを作成し編集し、リポジトリ全体をナビゲートし、テストやその他のプログラムを実行する能力を著しく向上させる。我々はSWE-benchとHumanEvalFixのSWE-agentを評価し、それぞれ12.5%と87.7%のパス@1レートで最先端の性能を実現した。
論文参考訳（メタデータ） (2024-05-06T17:41:33Z)
ChatDev: Communicative Agents for Software Development [84.90400377131962]
ChatDevはチャットを利用したソフトウェア開発フレームワークで、特別なエージェントがコミュニケーション方法についてガイドされる。これらのエージェントは、統一された言語ベースのコミュニケーションを通じて、設計、コーディング、テストフェーズに積極的に貢献する。
論文参考訳（メタデータ） (2023-07-16T02:11:34Z)
CodeTF: One-stop Transformer Library for State-of-the-art Code LLM [72.1638273937025]
我々は、最先端のCode LLMとコードインテリジェンスのためのオープンソースのTransformerベースのライブラリであるCodeTFを紹介する。我々のライブラリは、事前訓練されたコードLLMモデルと人気のあるコードベンチマークのコレクションをサポートします。 CodeTFが機械学習/生成AIとソフトウェア工学のギャップを埋められることを願っている。
論文参考訳（メタデータ） (2023-05-31T05:24:48Z)
Low-code LLM: Graphical User Interface over Large Language Models [115.08718239772107]
本稿では,人間-LLMインタラクションフレームワークであるLow-code LLMを紹介する。より制御可能で安定した応答を実現するために、6種類のシンプルなローコードビジュアルプログラミングインタラクションを組み込んでいる。ユーザフレンドリなインタラクション,制御可能な生成,広い適用性という,低コード LLM の3つの利点を強調した。
論文参考訳（メタデータ） (2023-04-17T09:27:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。