論文の概要: AgenticTyper: Automated Typing of Legacy Software Projects Using Agentic AI
- arxiv url: http://arxiv.org/abs/2602.21251v1
- Date: Sat, 21 Feb 2026 17:53:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.550749
- Title: AgenticTyper: Automated Typing of Legacy Software Projects Using Agentic AI
- Title(参考訳): AgenticTyper:エージェントAIを使ったレガシーソフトウェアプロジェクトの自動型付け
- Authors: Clemens Pohle,
- Abstract要約: JavaScriptシステムには型安全性がなく、メンテナンスが危険である。TypeScriptは役に立ちますが、手動で型を追加するのは高価です。
本稿では,Large Language Model (LLM) を用いたエージェントシステムである AgenticTyper を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Legacy JavaScript systems lack type safety, making maintenance risky. While TypeScript can help, manually adding types is expensive. Previous automated typing research focuses on type inference but rarely addresses type checking setup, definition generation, bug identification, or behavioral correctness at repository scale. We present AgenticTyper, a Large Language Model (LLM)-based agentic system that addresses these gaps through iterative error correction and behavior preservation via transpilation comparison. Evaluation on two proprietary repositories (81K LOC) shows that AgenticTyper resolves all 633 initial type errors in 20 minutes, reducing manual effort from one working day.
- Abstract(参考訳): レガシーJavaScriptシステムには型安全性がなく、メンテナンスが危険である。
TypeScriptは役立つが、手動で型を追加するのは高価だ。
従来の自動型付け研究は型推論に重点を置いていたが、型チェックの設定、定義生成、バグ識別、リポジトリスケールでの振る舞いの正しさに対処することはめったにない。
本稿では,Large Language Model (LLM) に基づくエージェントシステムである AgenticTyper を提案する。
2つのプロプライエタリリポジトリ(81K LOC)の評価によると、AgenticTyperは633の初期型エラーを20分で解決し、1つの作業日から手作業の労力を削減している。
関連論文リスト
- From Logic to Toolchains: An Empirical Study of Bugs in the TypeScript Ecosystem [15.388279180731415]
本稿では、実世界のTypeScriptプロジェクトにおけるバグに関する大規模な実証的研究について紹介する。
16の人気のあるオープンソースリポジトリからの633のバグレポートを分析します。
アルゴリズムロジックではなく、統合とオーケストレーションの境界で、現代的な障害が発生することがよく示されます。
論文 参考訳(メタデータ) (2026-01-29T02:36:04Z) - HAFixAgent: History-Aware Automated Program Repair Agent [13.82629698836299]
HAFixAgentはHAFixAgentというヒストリー対応のバグフィクスエージェントで,その修復ループに非難由来のリポジトリを注入する。
Defects4Jの854の実際のバグに関する予備的な研究は、我々の設計を動機付け、バグ関連の歴史が広く利用でき、非常に集中していることを示している。
論文 参考訳(メタデータ) (2025-11-02T18:45:34Z) - Holistic Agent Leaderboard: The Missing Infrastructure for AI Agent Evaluation [87.47155146067962]
数百のタスクで並列評価をオーケストレーションする,標準化された評価ハーネスを提供する。
モデル、足場、ベンチマークにまたがる3次元解析を行う。
私たちの分析では、ほとんどのランで精度を低下させる高い推論努力など、驚くべき洞察が示されています。
論文 参考訳(メタデータ) (2025-10-13T22:22:28Z) - Where LLM Agents Fail and How They can Learn From Failures [62.196870049524364]
大規模言語モデル(LLM)エージェントは、複雑なマルチステップタスクの解決において有望であることを示す。
単一ルート原因エラーがその後の決定を通じて伝播する、障害のカスケードに対する脆弱性を増幅する。
現在のシステムは、モジュール的で体系的な方法でエージェントエラーを包括的に理解できるフレームワークを欠いている。
AgentErrorTaxonomyは、メモリ、リフレクション、計画、アクション、システムレベルの操作にまたがる障害モードのモジュール分類である。
論文 参考訳(メタデータ) (2025-09-29T18:20:27Z) - AgenTracer: Who Is Inducing Failure in the LLM Agentic Systems? [71.21547572568655]
AgenTracer-8Bは、マルチグラニュラ強化学習で訓練された軽量障害トレーサである。
Who&Whenベンチマークでは、AgenTracer-8BはGemini-2.5-ProやClaude-4-Sonnetのような巨大なLLMを最大18.18%上回っている。
AgenTracer-8BはMetaGPTやMAASのような市販のマルチエージェントシステムに4.8-14.2%の性能向上をもたらす。
論文 参考訳(メタデータ) (2025-09-03T13:42:14Z) - OS-Harm: A Benchmark for Measuring Safety of Computer Use Agents [60.78202583483591]
コンピュータ使用エージェントの安全性を計測する新しいベンチマークであるOS-Harmを紹介する。
OS-HarmはOSWorld環境上に構築されており、故意のユーザ誤用、インジェクション攻撃、モデル誤動作の3つのカテゴリでモデルをテストすることを目指している。
我々は、フロンティアモデルに基づいてコンピュータ利用エージェントを評価し、その安全性に関する洞察を提供する。
論文 参考訳(メタデータ) (2025-06-17T17:59:31Z) - Type-Constrained Code Generation with Language Models [51.03439021895432]
本稿では,型システムを利用してコード生成を誘導する型制約デコード手法を提案する。
そこで本研究では,新しい接頭辞オートマトンと,在来型を探索する手法を開発し,LLM生成コードに適切な型付けを強制するための健全なアプローチを構築した。
提案手法は,コード合成,翻訳,修復作業において,コンパイルエラーを半分以上削減し,機能的正しさを著しく向上させる。
論文 参考訳(メタデータ) (2025-04-12T15:03:00Z) - Inferring Pluggable Types with Machine Learning [0.12031796234206132]
本稿では,機械学習を用いて型付き修飾子を自動的に推論する方法について検討する。
本稿では,最小限のデータフローヒントを符号化した新しい表現NaP-ASTを提案する。
論文 参考訳(メタデータ) (2024-06-21T22:32:42Z) - Generative Type Inference for Python [62.01560866916557]
本稿では静的解析から静的ドメイン知識を取り入れた数ショットの生成型推論手法であるTypeGenを紹介する。
TypeGenは、静的解析の型推論ステップを、型依存グラフ(TDG)に基づいたプロンプトに変換することで、COTプロンプトを生成する。
実験の結果、TypeGenは引数型予測では10.0%、Top-1 Exact Matchでは22.5%で最高のベースラインであるType4Pyを上回っている。
論文 参考訳(メタデータ) (2023-07-18T11:40:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。