論文の概要: Resolving Java Code Repository Issues with iSWE Agent
- arxiv url: http://arxiv.org/abs/2603.11356v1
- Date: Wed, 11 Mar 2026 22:43:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.70403
- Title: Resolving Java Code Repository Issues with iSWE Agent
- Title(参考訳): iSWE AgentでJavaコードリポジトリの問題を解決する
- Authors: Jatin Ganhotra, Sami Serhan, Antonio Abu Nassar, Avraham Shinnar, Ziv Nevo, Martin Hirzel,
- Abstract要約: iSWE AgentはJavaに重点を置いた自動イシューリゾルバである。
2つのサブエージェントで構成され、1つはローカライゼーション用、もう1つは編集用である。
これは、Multi-SWE-benchとSWE-PolyBenchの両方のJava分割における最先端のイシュー解決率を達成する。
- 参考スコア(独自算出の注目度): 3.927958209415049
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Resolving issues on code repositories is an important part of software engineering. Various recent systems automatically resolve issues using large language models and agents, often with impressive performance. Unfortunately, most of these models and agents focus primarily on Python, and their performance on other programming languages is lower. In particular, a lot of enterprise software is written in Java, yet automated issue resolution for Java is under-explored. This paper introduces iSWE Agent, an automated issue resolver with an emphasis on Java. It consists of two sub-agents, one for localization and the other for editing. Both have access to novel tools based on rule-based Java static analysis and transformation. Using this approach, iSWE achieves state-of-the-art issue resolution rates across the Java splits of both Multi-SWE-bench and SWE-PolyBench. More generally, we hope that by combining the best of rule-based and model-based techniques, this paper contributes towards improving enterprise software development.
- Abstract(参考訳): コードリポジトリの問題を解決することは、ソフトウェア工学の重要な部分です。
最近の様々なシステムは、大きな言語モデルとエージェントを使用して、しばしば印象的なパフォーマンスで、自動的に問題を解決する。
残念なことに、これらのモデルとエージェントのほとんどはPythonに重点を置いており、他のプログラミング言語でのパフォーマンスは低い。
特に、多くのエンタープライズソフトウェアはJavaで書かれていますが、Javaの自動化されたイシュー解決は未調査です。
本稿では,Javaに重点を置いた自動イシューリゾルバであるiSWE Agentを紹介する。
2つのサブエージェントで構成され、1つはローカライゼーション用、もう1つは編集用である。
どちらもルールベースのJava静的解析と変換に基づく新しいツールにアクセスできます。
このアプローチを用いることで、iSWEはMulti-SWE-benchとSWE-PolyBenchのJava分割における最先端のイシュー解決率を達成する。
より一般的には、ルールベースのベストプラクティスとモデルベースのテクニックを組み合わせることで、エンタープライズソフトウェア開発の改善に貢献できることを願っています。
関連論文リスト
- SWE-PolyBench: A multi-language benchmark for repository level evaluation of coding agents [49.73885480071402]
我々はSWE-PolyBenchを紹介した。SWE-PolyBenchは、コードエージェントのリポジトリレベル、実行ベース評価のための新しいベンチマークである。
SWE-PolyBenchには21のリポジトリから2110のインスタンスが含まれており、Java(165)、JavaScript(1017)、TypeScript(729)、Python(199)のタスクが含まれており、バグ修正、機能追加、コードを含んでいる。
実験の結果,現在のエージェントは言語間で不均一なパフォーマンスを示し,複雑な問題に対処しつつ,単純なタスクで高いパフォーマンスを示すことがわかった。
論文 参考訳(メタデータ) (2025-04-11T17:08:02Z) - CUBETESTERAI: Automated JUnit Test Generation using the LLaMA Model [0.5999777817331317]
本稿では,Spring Bootフレームワークを使用したJavaアプリケーションのJUnitテスト生成を自動化するアプローチを提案する。
CUBETESTERAIと呼ばれるツールには、ユーザフレンドリーなWebインターフェースと、GitLabとDockerを使用したCI/CDパイプラインの統合が含まれている。
論文 参考訳(メタデータ) (2025-03-13T19:44:09Z) - SWE-bench-java: A GitHub Issue Resolving Benchmark for Java [27.226354754864783]
大規模言語モデル(LLM)の問題解決能力を評価するため、SWE-benchがリリースされた。
マルチ言語サポートへの第一歩として、SWE-bench-javaと呼ばれるSWE-benchのJavaバージョンを開発しました。
SWE-bench-javaの信頼性を検証するために、従来のSWE-agentを実装し、その上で複数の強力なLCMをテストする。
論文 参考訳(メタデータ) (2024-08-26T15:30:05Z) - Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration [64.19431011897515]
本稿では,問題解決のためにソフトウェアリポジトリ全体を包括的に理解し,活用するために設計された,新しいソフトウェアエンジニアリング手法であるAlibaba LingmaAgentを提案する。
提案手法では,重要なリポジトリ情報を知識グラフに凝縮し,複雑さを低減し,モンテカルロ木探索に基づく戦略を採用する。
Alibaba Cloudの製品展開と評価において、LingmaAgentは、開発エンジニアが直面した社内問題の16.9%を自動で解決し、手作業による介入で43.3%の問題を解決した。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - SWE-bench: Can Language Models Resolve Real-World GitHub Issues? [80.52201658231895]
SWE-benchは、実際のGitHub問題から引き出された2,294ドルのソフトウェアエンジニアリング問題と、人気のあるPythonリポジトリ12ドルのプルリクエストで構成される評価フレームワークである。
我々は、最先端のプロプライエタリモデルと微調整モデルSWE-Llamaの両方が、最も単純な問題だけを解決できることを示します。
論文 参考訳(メタデータ) (2023-10-10T16:47:29Z) - A Comprehensive Review of State-of-The-Art Methods for Java Code
Generation from Natural Language Text [0.0]
本稿では,Javaコード生成タスクにおけるディープラーニングモデルの進化と進展を概観する。
我々は,最も重要な手法に焦点を合わせ,そのメリットと限界,およびコミュニティが使用する目的的機能を示す。
論文 参考訳(メタデータ) (2023-06-10T07:27:51Z) - DexBERT: Effective, Task-Agnostic and Fine-grained Representation
Learning of Android Bytecode [0.40571357119162643]
そこで本研究では,Android アプリケーションで使用される主要なバイナリフォーマットである DEX バイトコードのチャンクを表現するために,BERT ライクな言語モデルを提案する。
DexBERTがDEX言語をモデル化できるかどうかを実証的に評価し、3つのクラスレベルのソフトウェアエンジニアリングタスクでモデルの有効性を評価する。
論文 参考訳(メタデータ) (2022-12-12T15:32:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。