論文の概要: TypePro: Boosting LLM-Based Type Inference via Inter-Procedural Slicing
- arxiv url: http://arxiv.org/abs/2604.02702v1
- Date: Fri, 03 Apr 2026 03:52:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.313066
- Title: TypePro: Boosting LLM-Based Type Inference via Inter-Procedural Slicing
- Title(参考訳): TypePro: 手続き間スライシングによるLLMベースの型推論の強化
- Authors: Teyu Lin, Minghao Fan, Huaxun Huang, Zhirong Shen, Rongxin Wu,
- Abstract要約: 動的言語の型推論が人気のある研究領域となっている。
既存のアプローチは通常、静的解析、機械学習、あるいは大きな言語モデルを通じて型推論を実現する。
本稿では,動的言語の型推論にLLMを利用するTypeProという手法を提案する。
- 参考スコア(独自算出の注目度): 6.017183469774327
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dynamic languages (such as Python and JavaScript) offer flexibility and simplified type handling for programming, but this can also lead to an increase in type-related errors and additional overhead for compile-time type inference. As a result, type inference for dynamic languages has become a popular research area. Existing approaches typically achieve type inference through static analysis, machine learning, or large language models (LLMs). However, current work only focuses on the direct dependencies of variables related to type inference as the context, resulting in incomplete contextual information and thus affecting the accuracy of type inference. To address this issue, this paper proposes a method called TypePro, which leverages LLMs for type inference in dynamic languages. TypePro supplements contextual information by conducting inter-procedural code slicing. Then, TypePro proposes a set of candidate complex types based on the structural information of data types implied in the slices, thereby addressing the lack of domain knowledge of LLMs. We conducted experiments on the ManyTypes4Py and ManyTypes4TypeScript datasets, achieving Top-1 exact match (EM) rates of 88.9% and 86.6%, respectively. Notably, TypePro improves the Top-1 Exact Match by 7.1 and 10.3 percentage points over the second-best approach, showing the effectiveness and robustness of TypePro.
- Abstract(参考訳): 動的言語(PythonやJavaScriptなど)は、プログラミングの柔軟性と単純化された型ハンドリングを提供するが、型関連エラーの増加やコンパイル時の型推論のオーバーヘッドの増加につながる可能性がある。
その結果,動的言語に対する型推論が普及している。
既存のアプローチは通常、静的解析、機械学習、あるいは大きな言語モデル(LLM)を通じて型推論を実現する。
しかし、現在の研究は、型推論に関する変数の直接的な依存関係をコンテキストとしてのみ焦点を当てており、結果として不完全なコンテキスト情報が発生し、型推論の正確性に影響を与える。
本稿では,動的言語の型推論にLLMを利用するTypeProという手法を提案する。
TypeProは、プロセス間のコードスライシングを実行することで、コンテキスト情報を補完する。
次に、TypeProはスライスにインプットされたデータ型の構造情報に基づいて、候補となる複合型の集合を提案し、LLMのドメイン知識の欠如に対処する。
ManyTypes4Py と ManyTypes4TypeScript データセットの実験を行い、それぞれ 88.9% と 86.6% のTop-1 の正確な一致率を達成した。
特に、TypeProはTop-1 Exact Matchを第2のベストアプローチよりも7.1ポイント、10.3ポイント改善し、TypeProの有効性と堅牢性を示している。
関連論文リスト
- Combining Type Inference and Automated Unit Test Generation for Python [9.856068089918555]
Pythonのような動的型付けプログラミング言語における型情報の欠如は、テストジェネレータを阻害する。
本稿では、実行中に型関連情報を抽出し、利用可能な型情報を徐々に洗練する型トレースについて紹介する。
このアプローチでは、ブランチカバレッジが最大90.0%増加し、突然変異スコアが向上し、他の最先端の型推論ツールが生成するものと同じような品質の情報をタイプする。
論文 参考訳(メタデータ) (2025-07-02T08:41:28Z) - Type-Constrained Code Generation with Language Models [51.03439021895432]
本稿では,型システムを利用してコード生成を誘導する型制約デコード手法を提案する。
そこで本研究では,新しい接頭辞オートマトンと,在来型を探索する手法を開発し,LLM生成コードに適切な型付けを強制するための健全なアプローチを構築した。
提案手法は,コード合成,翻訳,修復作業において,コンパイルエラーを半分以上削減し,機能的正しさを著しく向上させる。
論文 参考訳(メタデータ) (2025-04-12T15:03:00Z) - Learning Type Inference for Enhanced Dataflow Analysis [6.999203506253375]
我々は、型アノテーションを確実に予測するように訓練されたTransformerベースのモデルであるCodeTIDAL5を提案する。
私たちのモデルは、MaryTypes4TypeScriptベンチマークで現在の最先端を7.85%上回っています。
JoernTIは、オープンソースの静的解析ツールであるJoernへの私たちのアプローチの統合です。
論文 参考訳(メタデータ) (2023-10-01T13:52:28Z) - Generative Type Inference for Python [62.01560866916557]
本稿では静的解析から静的ドメイン知識を取り入れた数ショットの生成型推論手法であるTypeGenを紹介する。
TypeGenは、静的解析の型推論ステップを、型依存グラフ(TDG)に基づいたプロンプトに変換することで、COTプロンプトを生成する。
実験の結果、TypeGenは引数型予測では10.0%、Top-1 Exact Matchでは22.5%で最高のベースラインであるType4Pyを上回っている。
論文 参考訳(メタデータ) (2023-07-18T11:40:31Z) - TypeT5: Seq2seq Type Inference using Static Analysis [51.153089609654174]
本稿では,型予測をコード入力タスクとして扱う新しい型推論手法を提案する。
本手法では静的解析を用いて,型シグネチャがモデルによって予測されるコード要素毎に動的コンテキストを構築する。
また,モデルの入力コンテキストに事前の型予測を組み込んだ反復復号方式を提案する。
論文 参考訳(メタデータ) (2023-03-16T23:48:00Z) - Query and Extract: Refining Event Extraction as Type-oriented Binary
Decoding [51.57864297948228]
本稿では,自然言語クエリとしてイベントタイプと引数ロールを取り入れた新しいイベント抽出フレームワークを提案する。
我々のフレームワークは、イベントタイプや引数ロールと入力テキストとのセマンティックな相関をよりよく捉えるための注意機構の恩恵を受ける。
論文 参考訳(メタデータ) (2021-10-14T15:49:40Z) - Unsupervised Label-aware Event Trigger and Argument Classification [73.86358632937372]
まず,利用可能なツール(srlなど)でイベントを識別し,それを事前に定義されたイベントタイプに自動マップする,教師なしイベント抽出パイプラインを提案する。
事前訓練された言語モデルを利用して、イベントトリガと引数の両方の事前定義された型を文脈的に表現します。
我々は、トリガーの83%と引数の54%を正しい型にマッピングし、以前のゼロショットアプローチのパフォーマンスをほぼ倍にしました。
論文 参考訳(メタデータ) (2020-12-30T17:47:24Z) - LambdaNet: Probabilistic Type Inference using Graph Neural Networks [46.66093127573704]
本稿では,グラフニューラルネットワークに基づくTypeScriptの確率型推論手法を提案する。
弊社のアプローチでは、数値や文字列などの標準型と、トレーニング中に遭遇していないユーザ定義型の両方を予測できる。
論文 参考訳(メタデータ) (2020-04-29T17:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。