論文の概要: The OpenHands Software Agent SDK: A Composable and Extensible Foundation for Production Agents
- arxiv url: http://arxiv.org/abs/2511.03690v1
- Date: Wed, 05 Nov 2025 18:16:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-06 18:19:32.515967
- Title: The OpenHands Software Agent SDK: A Composable and Extensible Foundation for Production Agents
- Title(参考訳): OpenHands Software Agent SDK: 生産エージェントのための構成可能で拡張可能な基盤
- Authors: Xingyao Wang, Simon Rosenberg, Juan Michelini, Calvin Smith, Hoang Tran, Engel Nyst, Rohit Malhotra, Xuhui Zhou, Valerie Chen, Robert Brennan, Graham Neubig,
- Abstract要約: 本稿では,ソフトウェア開発エージェントを実装するツールキットであるOpenHands Software Agent SDKを紹介する。
柔軟性を達成するために、デフォルトケースで数行のコードしか必要としないエージェントを実装するためのシンプルなインターフェースを設計する。
セキュリティと信頼性のために、シームレスなローカル-リモート実行ポータビリティ、REST/WebSocketサービスの統合を提供する。
- 参考スコア(独自算出の注目度): 46.254487394746725
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agents are now used widely in the process of software development, but building production-ready software engineering agents is a complex task. Deploying software agents effectively requires flexibility in implementation and experimentation, reliable and secure execution, and interfaces for users to interact with agents. In this paper, we present the OpenHands Software Agent SDK, a toolkit for implementing software development agents that satisfy these desiderata. This toolkit is a complete architectural redesign of the agent components of the popular OpenHands framework for software development agents, which has 64k+ GitHub stars. To achieve flexibility, we design a simple interface for implementing agents that requires only a few lines of code in the default case, but is easily extensible to more complex, full-featured agents with features such as custom tools, memory management, and more. For security and reliability, it delivers seamless local-to-remote execution portability, integrated REST/WebSocket services. For interaction with human users, it can connect directly to a variety of interfaces, such as visual workspaces (VS Code, VNC, browser), command-line interfaces, and APIs. Compared with existing SDKs from OpenAI, Claude, and Google, OpenHands uniquely integrates native sandboxed execution, lifecycle control, model-agnostic multi-LLM routing, and built-in security analysis. Empirical results on SWE-Bench Verified and GAIA benchmarks demonstrate strong performance. Put together, these elements allow the OpenHands Software Agent SDK to provide a practical foundation for prototyping, unlocking new classes of custom applications, and reliably deploying agents at scale.
- Abstract(参考訳): エージェントは現在、ソフトウェア開発のプロセスで広く使用されているが、プロダクション対応のソフトウェアエンジニアリングエージェントの構築は複雑な作業である。
ソフトウェアエージェントを効果的にデプロイするには、実装と実験の柔軟性、信頼性とセキュアな実行、そしてエージェントと対話するためのインターフェースが必要である。
本稿では,これらのデシラタを満たすソフトウェア開発エージェントを実装するツールキットであるOpenHands Software Agent SDKを提案する。
このツールキットは、人気のあるソフトウェア開発エージェント用のOpenHandsフレームワークのエージェントコンポーネントを完全に再設計したものだ。
柔軟性を実現するため、デフォルトのケースでは数行のコードしか必要とせず、カスタムツールやメモリ管理といった機能を備えたより複雑でフル機能のエージェントに容易に拡張可能なエージェントを実装するためのシンプルなインターフェースを設計する。
セキュリティと信頼性のために、シームレスなローカル-リモート実行ポータビリティ、REST/WebSocketサービスの統合を提供する。
人間のユーザと対話するためには、ビジュアルワークスペース(VS Code、VNC、ブラウザ)、コマンドラインインターフェイス、APIなど、さまざまなインターフェースに直接接続することができる。
OpenAI、Claude、Googleの既存のSDKと比較すると、OpenHandsはネイティブなサンドボックス実行、ライフサイクル制御、モデルに依存しないマルチLLMルーティング、ビルトインセキュリティ分析を独自に統合している。
SWE-Bench Verified および GAIA ベンチマークの実証結果は高い性能を示した。
これらの要素をまとめると、OpenHands Software Agent SDKは、プロトタイピング、新しいカスタムアプリケーションのクラスをアンロックし、エージェントを大規模に確実にデプロイするための実用的な基盤を提供することができる。
関連論文リスト
- AgentHub: A Research Agenda for Agent Sharing Infrastructure [6.191340541042416]
LLMベースのエージェントは急速に増殖しているが、発見、評価、管理のインフラは断片化されている。
最近の研究と工学の研究は、必要なインフラについて検討し始めているが、今のところは、分散、命名、プロトコル交渉に焦点を絞っている。
本稿ではエージェント共有のための研究課題であるエージェントHubを提案する。
論文 参考訳(メタデータ) (2025-10-03T20:18:58Z) - EnvX: Agentize Everything with Agentic AI [18.805404564291965]
私たちは、Agentic AIを活用してGitHubリポジトリをエージェント化するフレームワークであるEnvXを紹介します。
EnvXは3段階のプロセスを通じてリポジトリをアクティブエージェントとして再定義する。
我々はGitTaskBenchベンチマークでEnvXを評価し、画像処理、音声認識、文書分析、ビデオ操作など18の領域にわたるリポジトリを用いて評価した。
論文 参考訳(メタデータ) (2025-09-09T18:51:36Z) - AgentScope 1.0: A Developer-Centric Framework for Building Agentic Applications [95.42093979627703]
AgentScopeは柔軟で効率的なツールベースのエージェント環境インタラクションをサポートする。
エージェントの動作をReActパラダイムに基盤として,エージェントレベルの高度なインフラストラクチャを提供します。
AgentScopeには、開発者フレンドリーなエクスペリエンスのための堅牢なエンジニアリングサポートも含まれている。
論文 参考訳(メタデータ) (2025-08-22T10:35:56Z) - Cerebrum (AIOS SDK): A Platform for Agent Development, Deployment, Distribution, and Discovery [33.89476893368382]
CerebrumはAIOS用のエージェントSDKで、3つの重要なコンポーネント間のギャップに対処します。
エージェント開発のためのモジュール型の4層アーキテクチャを備えた包括的なSDK,(2)エージェントの共有と発見のためのコミュニティ主導のエージェントハブ,(3)エージェントのテストと評価のためのインタラクティブなWebインターフェース。
Cerebrumは、エージェント開発を標準化する統一されたフレームワークを提供しながら、研究者や開発者がエージェントを革新し、配布する柔軟性を維持しながら、この分野を前進させる。
論文 参考訳(メタデータ) (2025-03-14T14:29:17Z) - OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.8507367518992]
私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。
プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文 参考訳(メタデータ) (2024-07-23T17:50:43Z) - SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering [79.07755560048388]
SWEエージェント(SWE-agent)は、LMエージェントが自律的にコンピュータを使用してソフトウェア工学のタスクを解決するシステムである。
SWEエージェントのカスタムエージェントコンピュータインタフェース(ACI)は、エージェントがコードファイルを作成し編集し、リポジトリ全体をナビゲートし、テストやその他のプログラムを実行する能力を著しく向上させる。
我々はSWE-benchとHumanEvalFixのSWE-agentを評価し、それぞれ12.5%と87.7%のパス@1レートで最先端の性能を実現した。
論文 参考訳(メタデータ) (2024-05-06T17:41:33Z) - AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。
豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文 参考訳(メタデータ) (2024-02-21T04:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。