論文の概要: Typify: A Lightweight Usage-driven Static Analyzer for Precise Python Type Inference
- arxiv url: http://arxiv.org/abs/2604.05067v1
- Date: Mon, 06 Apr 2026 18:13:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.432193
- Title: Typify: A Lightweight Usage-driven Static Analyzer for Precise Python Type Inference
- Title(参考訳): Typify: Pythonの型推論を正確にするための軽量なUsage駆動静的アナライザ
- Authors: Ali Aman, Muhammad Asaduzzaman, Shaowei Wang,
- Abstract要約: Pythonの動的型システムは静的解析に重大な課題をもたらす。
使用法駆動の静的解析エンジンであるTypifyを紹介する。
Typifyは、統計的学習に頼ることなく、正確で文脈的に関係のある型情報を推測する。
- 参考スコア(独自算出の注目度): 7.733270505483109
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Python's dynamic type system, while offering significant flexibility and expressiveness, poses substantial challenges for static analysis and automated tooling, particularly in unannotated or partially annotated codebases. Existing type inference approaches often depend on existing type annotations or on deep learning models that require extensive training corpora and considerable computational resources, resulting in limited scalability and reduced interpretability. We introduce Typify, a lightweight, usage-driven static analysis engine designed to infer precise and contextually relevant type information without relying on statistical learning or large datasets. Typify integrates symbolic execution with iterative fixpoint analysis and a context-matching retrieval system to propagate and predict type information across entire projects. By constructing and traversing dependency graphs in an execution-aware manner, Typify accurately connects function calls to their definitions and infers usage-based type semantics, even in complex, interdependent modules. We evaluate Typify on a diverse corpus of real-world Python repositories, including the ManyTypes4Py and Typilus datasets, benchmarking its effectiveness in predicting types of variables, arguments, and return statements. Results from the evaluation show that Typify consistently matches or surpasses state-of-the-art deep learning-based systems such as Type4Py and HiTyper, as well as industry-standard static type inference tools like Pyre. Our findings demonstrate that usage-driven, retrieval-based inference can match or exceed the accuracy of data-driven methods, offering a practical, interpretable, and computationally efficient alternative for large and evolving Python codebases.
- Abstract(参考訳): Pythonの動的型システムは、大きな柔軟性と表現力を提供する一方で、静的解析と自動化ツール、特に注釈のない、あるいは部分的に注釈付けされたコードベースにおいて、重大な課題を提起している。
既存の型推論アプローチは、しばしば既存の型アノテーションや、広範囲のトレーニングコーパスとかなりの計算資源を必要とするディープラーニングモデルに依存し、スケーラビリティが制限され、解釈可能性も低下する。
我々はTypifyを紹介した。Typifyは、統計的学習や大規模なデータセットに頼ることなく、正確でコンテキスト的に関連する型情報を推測するように設計された、軽量で使用量駆動の静的解析エンジンである。
Typifyは、シンボル実行と反復的な固定点解析とコンテキストマッチング検索システムを統合し、プロジェクト全体にわたって型情報を伝達し、予測する。
依存性グラフを実行対応で構築し、トラバースすることで、Typifyは関数呼び出しをその定義に正確に接続し、複雑な相互依存モジュールでも使用ベースの型セマンティクスを推論する。
ManyTypes4PyやTypilusのデータセットなど、現実のPythonリポジトリのさまざまなコーパス上でTypifyを評価し、変数の種類、引数、返却ステートメントの予測におけるその有効性をベンチマークします。
評価の結果、TypifyはType4PyやHiTyperといった最先端のディープラーニングベースのシステムと、Pyreのような業界標準の静的型推論ツールと一貫して一致または超えていることがわかった。
提案手法は,Pythonの大規模かつ進化中のコードベースに対して,実用的で解釈可能で,計算効率のよい代替手段を提供する。
関連論文リスト
- Toward a Corpus Study of the Dynamic Gradual Type [0.0]
本稿では,mypy型チェッカーを使用する221のGitHubプロジェクトを対象とする,Pythonの動的型に関する社内調査について報告する。
この研究は、動的型のための8つのパターンを明らかにし、このパターンは、mypy型システムの今後の改良や、正確な型アノテーションを促進するためのツールサポートに影響を及ぼす。
論文 参考訳(メタデータ) (2025-03-11T22:18:51Z) - Pointwise Mutual Information as a Performance Gauge for Retrieval-Augmented Generation [78.28197013467157]
文脈と問合せの間のポイントワイドな相互情報は,言語モデルの性能向上に有効な指標であることを示す。
本稿では,文書と質問のポイントワイドな相互情報を利用する2つの手法を提案する。
論文 参考訳(メタデータ) (2024-11-12T13:14:09Z) - Learning Type Inference for Enhanced Dataflow Analysis [6.999203506253375]
我々は、型アノテーションを確実に予測するように訓練されたTransformerベースのモデルであるCodeTIDAL5を提案する。
私たちのモデルは、MaryTypes4TypeScriptベンチマークで現在の最先端を7.85%上回っています。
JoernTIは、オープンソースの静的解析ツールであるJoernへの私たちのアプローチの統合です。
論文 参考訳(メタデータ) (2023-10-01T13:52:28Z) - Generative Type Inference for Python [62.01560866916557]
本稿では静的解析から静的ドメイン知識を取り入れた数ショットの生成型推論手法であるTypeGenを紹介する。
TypeGenは、静的解析の型推論ステップを、型依存グラフ(TDG)に基づいたプロンプトに変換することで、COTプロンプトを生成する。
実験の結果、TypeGenは引数型予測では10.0%、Top-1 Exact Matchでは22.5%で最高のベースラインであるType4Pyを上回っている。
論文 参考訳(メタデータ) (2023-07-18T11:40:31Z) - TypeT5: Seq2seq Type Inference using Static Analysis [51.153089609654174]
本稿では,型予測をコード入力タスクとして扱う新しい型推論手法を提案する。
本手法では静的解析を用いて,型シグネチャがモデルによって予測されるコード要素毎に動的コンテキストを構築する。
また,モデルの入力コンテキストに事前の型予測を組み込んだ反復復号方式を提案する。
論文 参考訳(メタデータ) (2023-03-16T23:48:00Z) - BenchCLAMP: A Benchmark for Evaluating Language Models on Syntactic and
Semantic Parsing [55.058258437125524]
本稿では,制約付きLanguage Model Parsingを評価するベンチマークであるBenchCLAMPを紹介する。
APIを通じてのみ利用可能な2つのGPT-3変種を含む8つの言語モデルをベンチマークする。
実験により,エンコーダ-デコーダ事前学習言語モデルでは,モデル出力が有効であると制約された場合に,構文解析や意味解析の最先端手法を超えることができることがわかった。
論文 参考訳(メタデータ) (2022-06-21T18:34:11Z) - High-dimensional distributed semantic spaces for utterances [0.2907403645801429]
本稿では,発話とテキストレベルデータの高次元表現モデルについて述べる。
言語情報を表現する数学的原理と行動学的に妥当なアプローチに基づいている。
本論文は,固定次元の共通積分フレームワークにおいて,実装モデルが言語的特徴を広範囲に表すことができるかを示す。
論文 参考訳(メタデータ) (2021-04-01T12:09:47Z) - Prototypical Representation Learning for Relation Extraction [56.501332067073065]
本論文では, 遠隔ラベルデータから予測可能, 解釈可能, 堅牢な関係表現を学習することを目的とする。
文脈情報から各関係のプロトタイプを学習し,関係の本質的意味を最善に探求する。
いくつかの関係学習タスクの結果,本モデルが従来の関係モデルを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2021-03-22T08:11:43Z) - Type4Py: Deep Similarity Learning-Based Type Inference for Python [9.956021565144662]
類似度学習に基づくpythonの型推論モデルであるtype4pyを提案する。
高次元空間における同種の型と異種の型を区別することを学ぶ階層的ニューラルネットワークモデルを設計する。
Top-1の予測を考えると、Type4PyはTypilusとTypeWriterよりも19.33%、13.49%高い精度である。
論文 参考訳(メタデータ) (2021-01-12T13:32:53Z) - Interpretable Entity Representations through Large-Scale Typing [61.4277527871572]
本稿では,人間の読みやすいエンティティ表現を作成し,箱から高パフォーマンスを実現する手法を提案する。
我々の表現は、微粒な実体型に対する後続確率に対応するベクトルである。
特定のドメインに対して,学習に基づく方法で,型セットのサイズを縮小できることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。