論文の概要: Co-Evolution of Types and Dependencies: Towards Repository-Level Type Inference for Python Code
- arxiv url: http://arxiv.org/abs/2512.21591v1
- Date: Thu, 25 Dec 2025 09:15:06 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-29 12:02:55.395498
- Title: Co-Evolution of Types and Dependencies: Towards Repository-Level Type Inference for Python Code
- Title(参考訳): 型と依存関係の共進化:Pythonコードのリポジトリレベル型推論を目指して
- Authors: Shuo Sun, Shixin Zhang, Jiwei Yan, Jun Yan, Jian Zhang,
- Abstract要約: Pythonの動的型付けメカニズムは、柔軟性を促進する一方で、実行時の型エラーの重要な原因となっている。
methodNameは、型と依存関係の共進化を通じてリポジトリレベルの型推論を実現する新しいアプローチである。
主なイノベーションは、(1)リポジトリレベルの型依存をキャプチャするために設計されたEDGモデル、(2)各イテレーションで型と依存関係が共進化する反復型推論アプローチ、(3)オンザフライでの推論の検証と修正を行う型チェッカー・イン・ザ・ループ戦略である。
- 参考スコア(独自算出の注目度): 14.7995140938911
- License:
- Abstract: Python's dynamic typing mechanism, while promoting flexibility, is a significant source of runtime type errors that plague large-scale software, which inspires the automatic type inference techniques. Existing type inference tools have achieved advances in type inference within isolated code snippets. However, repository-level type inference remains a significant challenge, primarily due to the complex inter-procedural dependencies that are difficult to model and resolve. To fill this gap, we present \methodName, a novel approach based on LLMs that achieves repository-level type inference through the co-evolution of types and dependencies. \methodName~constructs an Entity Dependency Graph (EDG) to model the objects and type dependencies across the repository. During the inference process, it iteratively refines types and dependencies in EDG for accurate type inference. Our key innovations are: (1) an EDG model designed to capture repository-level type dependencies; (2) an iterative type inference approach where types and dependencies co-evolve in each iteration; and (3) a type-checker-in-the-loop strategy that validates and corrects inferences on-the-fly, thereby reducing error propagation. When evaluated on 12 complex Python repositories, \methodName~significantly outperformed prior works, achieving a \textit{TypeSim} score of 0.89 and a \textit{TypeExact} score of 0.84, representing a 27\% and 40\% relative improvement over the strongest baseline. More importantly, \methodName~removed new type errors introduced by the tool by 92.7\%. This demonstrates a significant leap towards automated, reliable type annotation for real-world Python development.
- Abstract(参考訳): Pythonの動的型付けメカニズムは、柔軟性を促進する一方で、大規模なソフトウェアを悩ませるランタイムタイプのエラーの重要な原因であり、自動型推論技術に刺激を与えている。
既存の型推論ツールは、独立したコードスニペット内での型推論の進歩を達成した。
しかし、リポジトリレベルの型推論は依然として重大な課題であり、主に、モデル化と解決が難しい複雑なプロセス間依存関係のためである。
このギャップを埋めるために,型と依存関係の共進化を通じてリポジトリレベルの型推論を実現する,LLMに基づいた新しいアプローチである \methodName を提案する。
Entity Dependency Graph (EDG)を構築して、リポジトリ全体にわたってオブジェクトと型依存関係をモデル化する。
推論プロセスの間、EDGの型と依存関係を反復的に洗練し、正確な型推論を行う。
1)レポジトリレベルの型依存をキャプチャするために設計されたEDGモデル、(2)各イテレーションで型と依存関係が共進化する反復型推論アプローチ、(3)オンザフライでの推論の検証と修正を行う型チェッカー・イン・ザ・ループ戦略、そしてエラーの伝播を低減する。
12の複雑なPythonリポジトリで評価すると、‘methodName~significantly outformed earlier works, a \textit{TypeSim} score of 0.89, a \textit{TypeExact} score of 0.84, a \textit{TypeExact} score on the highest baseline。
さらに重要なのは、ツールによって導入された新しい型エラーを92.7\%削除したことだ。
これは、現実のPython開発において、自動化され、信頼性の高い型アノテーションへの大きな飛躍を示している。
関連論文リスト
- ResAD++: Towards Class Agnostic Anomaly Detection via Residual Feature Learning [52.11294707895649]
本稿では,クラス非依存型異常検出(AD)の問題点について検討する。
目的は、ターゲットデータの再トレーニングや微調整をせずに、異なるドメインから様々な新しいクラスの異常を一般化して検出できる、クラスに依存しないADモデルをトレーニングすることである。
8つの実世界のADデータセットに関する総合的な実験は、ResAD++が新しいクラスで直接使用されると、素晴らしいAD結果が得られることを示した。
論文 参考訳(メタデータ) (2025-09-28T08:41:05Z) - TypyBench: Evaluating LLM Type Inference for Untyped Python Repositories [9.127866457704162]
大規模言語モデル(LLM)は、コード理解において有望であるが、型推論能力はまだ未熟である。
我々は Python リポジトリ全体にわたって LLM の型推論を評価するために設計されたベンチマークである TypyBench を紹介した。
高品質なPythonレポジトリ50のキュレートデータセット上での各種LLMの評価から,LLMは十分なTypeSimスコアを達成できるが,複雑なネスト型と競合し,重要な型整合性エラーを示すことが明らかになった。
論文 参考訳(メタデータ) (2025-07-28T14:54:00Z) - Type-Constrained Code Generation with Language Models [51.03439021895432]
本稿では,型システムを利用してコード生成を誘導する型制約デコード手法を提案する。
そこで本研究では,新しい接頭辞オートマトンと,在来型を探索する手法を開発し,LLM生成コードに適切な型付けを強制するための健全なアプローチを構築した。
提案手法は,コード合成,翻訳,修復作業において,コンパイルエラーを半分以上削減し,機能的正しさを著しく向上させる。
論文 参考訳(メタデータ) (2025-04-12T15:03:00Z) - TIGER: A Generating-Then-Ranking Framework for Practical Python Type Inference [16.192704604206206]
Pythonの動的型付けシステムは柔軟性と表現力を提供するが、型関連のエラーにつながる可能性がある。
TIGERはPythonの多様な型カテゴリを扱うための2段階生成レベル(GTR)フレームワークである。
ManyTypes4Pyデータセットに対する評価は、TIGERが様々な型カテゴリの既存のメソッドよりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-02T09:29:02Z) - ArcheType: A Novel Framework for Open-Source Column Type Annotation using Large Language Models [24.867534196627222]
ArcheTypeは、コンテキストサンプリング、即時シリアライゼーション、モデルクエリ、ラベルリマッピングのための、シンプルで実用的な方法である。
ゼロショットCTAベンチマークに最先端の性能を新たに確立する。
論文 参考訳(メタデータ) (2023-10-27T15:31:22Z) - Generative Type Inference for Python [62.01560866916557]
本稿では静的解析から静的ドメイン知識を取り入れた数ショットの生成型推論手法であるTypeGenを紹介する。
TypeGenは、静的解析の型推論ステップを、型依存グラフ(TDG)に基づいたプロンプトに変換することで、COTプロンプトを生成する。
実験の結果、TypeGenは引数型予測では10.0%、Top-1 Exact Matchでは22.5%で最高のベースラインであるType4Pyを上回っている。
論文 参考訳(メタデータ) (2023-07-18T11:40:31Z) - TypeT5: Seq2seq Type Inference using Static Analysis [51.153089609654174]
本稿では,型予測をコード入力タスクとして扱う新しい型推論手法を提案する。
本手法では静的解析を用いて,型シグネチャがモデルによって予測されるコード要素毎に動的コンテキストを構築する。
また,モデルの入力コンテキストに事前の型予測を組み込んだ反復復号方式を提案する。
論文 参考訳(メタデータ) (2023-03-16T23:48:00Z) - DORE: Document Ordered Relation Extraction based on Generative Framework [56.537386636819626]
本稿では,既存のDocREモデルの根本原因について検討する。
本稿では,モデルが学習しやすく,決定論的な関係行列から記号列と順序列を生成することを提案する。
4つのデータセットに対する実験結果から,提案手法は生成型DocREモデルの性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2022-10-28T11:18:10Z) - Bilateral Dependency Optimization: Defending Against Model-inversion
Attacks [61.78426165008083]
本稿では,モデル反転攻撃に対する二元的依存性最適化(BiDO)戦略を提案する。
BiDOは、さまざまなデータセット、分類器、MI攻撃に対する最先端の防御性能を達成する。
論文 参考訳(メタデータ) (2022-06-11T10:07:03Z) - Type4Py: Deep Similarity Learning-Based Type Inference for Python [9.956021565144662]
類似度学習に基づくpythonの型推論モデルであるtype4pyを提案する。
高次元空間における同種の型と異種の型を区別することを学ぶ階層的ニューラルネットワークモデルを設計する。
Top-1の予測を考えると、Type4PyはTypilusとTypeWriterよりも19.33%、13.49%高い精度である。
論文 参考訳(メタデータ) (2021-01-12T13:32:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。