論文の概要: Combining Type Inference and Automated Unit Test Generation for Python
- arxiv url: http://arxiv.org/abs/2507.01477v1
- Date: Wed, 02 Jul 2025 08:41:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:23:00.107352
- Title: Combining Type Inference and Automated Unit Test Generation for Python
- Title(参考訳): Pythonの型推論と自動ユニットテスト生成の組み合わせ
- Authors: Lukas Krodinger, Stephan Lukasczyk, Gordon Fraser,
- Abstract要約: Pythonのような動的型付けプログラミング言語における型情報の欠如は、テストジェネレータを阻害する。
本稿では、実行中に型関連情報を抽出し、利用可能な型情報を徐々に洗練する型トレースについて紹介する。
このアプローチでは、ブランチカバレッジが最大90.0%増加し、突然変異スコアが向上し、他の最先端の型推論ツールが生成するものと同じような品質の情報をタイプする。
- 参考スコア(独自算出の注目度): 9.856068089918555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated unit test generation is an established research field that has so far focused on statically-typed programming languages. The lack of type information in dynamically-typed programming languages, such as Python, inhibits test generators, which heavily rely on information about parameter and return types of functions to select suitable arguments when constructing test cases. Since automated test generators inherently rely on frequent execution of candidate tests, we make use of these frequent executions to address this problem by introducing type tracing, which extracts type-related information during execution and gradually refines the available type information. We implement type tracing as an extension of the Pynguin test-generation framework for Python, allowing it (i) to infer parameter types by observing how parameters are used during runtime, (ii) to record the types of values that function calls return, and (iii) to use this type information to increase code coverage. The approach leads to up to 90.0% more branch coverage, improved mutation scores, and to type information of similar quality to that produced by other state-of-the-art type-inference tools.
- Abstract(参考訳): 自動単体テスト生成は、静的型プログラミング言語に焦点を当てた確立した研究分野である。
Pythonのような動的型付け言語における型情報の欠如は、テストケースを構築する際に適切な引数を選択するためにパラメータや戻り型の関数に関する情報に大きく依存するテストジェネレータを阻害する。
自動テストジェネレータは本来、候補テストの頻繁な実行に依存しているため、これらの頻繁な実行を利用して、型トレースを導入し、実行中に型関連情報を抽出し、利用可能な型情報を徐々に洗練する。
Python用のPynguinテスト生成フレームワークの拡張として、型トレースを実装しました。
i) 実行時にパラメータがどのように使用されるかを観察し、パラメータの型を推論する。
(ii) 関数がreturnを呼び出す値の型を記録し、
(iii) この型情報を使ってコードカバレッジを高めること。
このアプローチでは、ブランチカバレッジが最大90.0%増加し、突然変異スコアが向上し、他の最先端の型推論ツールが生成するものと同じような品質の情報をタイプする。
関連論文リスト
- LLM-based Unit Test Generation for Dynamically-Typed Programs [16.38145000434927]
TypeTestは、ベクトルベースのRetrieval-Augmented Generationシステムを通じて、テスト生成における型正しさを高める新しいフレームワークである。
125の現実世界のPythonモジュールの評価において、TypeTestは平均で86.6%、ブランチで76.8%を獲得し、それぞれ5.4%、9.3%の最先端ツールを上回った。
論文 参考訳(メタデータ) (2025-03-18T08:07:17Z) - Toward a Corpus Study of the Dynamic Gradual Type [0.0]
本稿では,mypy型チェッカーを使用する221のGitHubプロジェクトを対象とする,Pythonの動的型に関する社内調査について報告する。
この研究は、動的型のための8つのパターンを明らかにし、このパターンは、mypy型システムの今後の改良や、正確な型アノテーションを促進するためのツールサポートに影響を及ぼす。
論文 参考訳(メタデータ) (2025-03-11T22:18:51Z) - Generative Type Inference for Python [62.01560866916557]
本稿では静的解析から静的ドメイン知識を取り入れた数ショットの生成型推論手法であるTypeGenを紹介する。
TypeGenは、静的解析の型推論ステップを、型依存グラフ(TDG)に基づいたプロンプトに変換することで、COTプロンプトを生成する。
実験の結果、TypeGenは引数型予測では10.0%、Top-1 Exact Matchでは22.5%で最高のベースラインであるType4Pyを上回っている。
論文 参考訳(メタデータ) (2023-07-18T11:40:31Z) - Type Prediction With Program Decomposition and Fill-in-the-Type Training [2.7998963147546143]
大規模な言語モデルを活用する型予測のための検索ベースのアプローチであるOpenTauを構築した。
TypeScriptの型予測のための新しいデータセットで作業を評価し、ファイルタイプチェックの47.4%(14.5%の絶対的改善)とファイル毎の3.3型のエラー率を示している。
論文 参考訳(メタデータ) (2023-05-25T21:16:09Z) - TypeT5: Seq2seq Type Inference using Static Analysis [51.153089609654174]
本稿では,型予測をコード入力タスクとして扱う新しい型推論手法を提案する。
本手法では静的解析を用いて,型シグネチャがモデルによって予測されるコード要素毎に動的コンテキストを構築する。
また,モデルの入力コンテキストに事前の型予測を組み込んだ反復復号方式を提案する。
論文 参考訳(メタデータ) (2023-03-16T23:48:00Z) - Cross-Domain Evaluation of a Deep Learning-Based Type Inference System [0.44098366957385177]
本研究では,最先端のディープラーニング型推論システムとして,Type4Pyについて検討する。
クラス不均衡、語彙外単語、データセットシフト、未知クラスといった問題に対処する。
我々のデータセットは、ソフトウェアプロジェクトの異なる領域における型推論システムの評価を可能にする。
論文 参考訳(メタデータ) (2022-08-19T07:28:31Z) - Query and Extract: Refining Event Extraction as Type-oriented Binary
Decoding [51.57864297948228]
本稿では,自然言語クエリとしてイベントタイプと引数ロールを取り入れた新しいイベント抽出フレームワークを提案する。
我々のフレームワークは、イベントタイプや引数ロールと入力テキストとのセマンティックな相関をよりよく捉えるための注意機構の恩恵を受ける。
論文 参考訳(メタデータ) (2021-10-14T15:49:40Z) - Learning Sparse Prototypes for Text Generation [120.38555855991562]
プロトタイプ駆動のテキスト生成は、トレーニングコーパス全体の保存とインデックスを必要とするため、テスト時に非効率である。
本稿では,言語モデリング性能を向上するスパースなプロトタイプサポートセットを自動的に学習する新しい生成モデルを提案する。
実験では,1000倍のメモリ削減を実現しつつ,従来のプロトタイプ駆動型言語モデルよりも優れていた。
論文 参考訳(メタデータ) (2020-06-29T19:41:26Z) - LambdaNet: Probabilistic Type Inference using Graph Neural Networks [46.66093127573704]
本稿では,グラフニューラルネットワークに基づくTypeScriptの確率型推論手法を提案する。
弊社のアプローチでは、数値や文字列などの標準型と、トレーニング中に遭遇していないユーザ定義型の両方を予測できる。
論文 参考訳(メタデータ) (2020-04-29T17:48:40Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。