論文の概要: Type4Py: Deep Similarity Learning-Based Type Inference for Python
- arxiv url: http://arxiv.org/abs/2101.04470v1
- Date: Tue, 12 Jan 2021 13:32:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-04 01:30:35.591420
- Title: Type4Py: Deep Similarity Learning-Based Type Inference for Python
- Title(参考訳): Type4Py: Pythonの深い類似性学習に基づく型推論
- Authors: Amir M. Mir, Evaldas Latoskinas, Sebastian Proksch, Georgios Gousios
- Abstract要約: 類似度学習に基づくpythonの型推論モデルであるtype4pyを提案する。
高次元空間における同種の型と異種の型を区別することを学ぶ階層的ニューラルネットワークモデルを設計する。
Top-1の予測を考えると、Type4PyはTypilusとTypeWriterよりも19.33%、13.49%高い精度である。
- 参考スコア(独自算出の注目度): 9.956021565144662
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Dynamic languages, such as Python and Javascript, trade static typing for
developer flexibility. While this allegedly enables greater productivity, lack
of static typing can cause runtime exceptions, type inconsistencies, and is a
major factor for weak IDE support. To alleviate these issues, PEP 484
introduced optional type annotations for Python. As retrofitting types to
existing codebases is error-prone and laborious, learning-based approaches have
been proposed to enable automatic type annotations based on existing, partially
annotated codebases. However, the prediction of rare and user-defined types is
still challenging. In this paper, we present Type4Py, a deep similarity
learning-based type inference model for Python. We design a hierarchical neural
network model that learns to discriminate between types of the same kind and
dissimilar types in a high-dimensional space, which results in clusters of
types. Nearest neighbor search suggests likely type signatures of given Python
functions. The types visible to analyzed modules are surfaced using lightweight
dependency analysis. The results of quantitative and qualitative evaluation
indicate that Type4Py significantly outperforms state-of-the-art approaches at
the type prediction task. Considering the Top-1 prediction, Type4Py obtains
19.33% and 13.49% higher precision than Typilus and TypeWriter, respectively,
while utilizing a much bigger vocabulary.
- Abstract(参考訳): PythonやJavascriptのような動的言語は、開発者の柔軟性のために静的型付けを交換する。
これは生産性が向上すると言われているが、静的型付けの欠如はランタイム例外、型不整合を引き起こし、IDEサポートの弱さの大きな要因である。
これらの問題を緩和するため、PEP 484はPythonのオプション型アノテーションを導入した。
既存のコードベースへの型の再適合はエラーを起こしやすいため、既存の部分的に注釈付けされたコードベースに基づいた自動型アノテーションを実現するための学習ベースのアプローチが提案されている。
しかし、レア型とユーザ定義型の予測は依然として困難である。
本稿では,pythonの類似度学習に基づく型推論モデルtype4pyを提案する。
我々は、高次元空間における同種の型と異種の型を区別することを学ぶ階層型ニューラルネットワークモデルを設計し、その結果、型をクラスタ化する。
最寄りの検索では、python関数の型シグネチャが考えられる。
分析されたモジュールで見える型は、軽量な依存性分析を使って表面化されます。
定量的および定性的な評価の結果,Type4Pyはタイプ予測タスクにおける最先端アプローチよりも有意に優れていた。
トップ1の予測を考えると、Type4PyはTypilusやTypeWriterよりも19.33%、13.49%高い精度を得られる。
関連論文リスト
- Language Models for Text Classification: Is In-Context Learning Enough? [54.869097980761595]
最近の基礎言語モデルでは、ゼロショットや少数ショットの設定で多くのNLPタスクで最先端のパフォーマンスが示されている。
より標準的なアプローチよりもこれらのモデルの利点は、自然言語(prompts)で書かれた命令を理解する能力である。
これにより、アノテーション付きインスタンスが限られているドメインのテキスト分類問題に対処するのに適している。
論文 参考訳(メタデータ) (2024-03-26T12:47:39Z) - Generative Type Inference for Python [62.01560866916557]
本稿では静的解析から静的ドメイン知識を取り入れた数ショットの生成型推論手法であるTypeGenを紹介する。
TypeGenは、静的解析の型推論ステップを、型依存グラフ(TDG)に基づいたプロンプトに変換することで、COTプロンプトを生成する。
実験の結果、TypeGenは引数型予測では10.0%、Top-1 Exact Matchでは22.5%で最高のベースラインであるType4Pyを上回っている。
論文 参考訳(メタデータ) (2023-07-18T11:40:31Z) - Type Prediction With Program Decomposition and Fill-in-the-Type Training [2.7998963147546143]
大規模な言語モデルを活用する型予測のための検索ベースのアプローチであるOpenTauを構築した。
TypeScriptの型予測のための新しいデータセットで作業を評価し、ファイルタイプチェックの47.4%(14.5%の絶対的改善)とファイル毎の3.3型のエラー率を示している。
論文 参考訳(メタデータ) (2023-05-25T21:16:09Z) - TypeT5: Seq2seq Type Inference using Static Analysis [51.153089609654174]
本稿では,型予測をコード入力タスクとして扱う新しい型推論手法を提案する。
本手法では静的解析を用いて,型シグネチャがモデルによって予測されるコード要素毎に動的コンテキストを構築する。
また,モデルの入力コンテキストに事前の型予測を組み込んだ反復復号方式を提案する。
論文 参考訳(メタデータ) (2023-03-16T23:48:00Z) - Modeling Label Correlations for Ultra-Fine Entity Typing with Neural
Pairwise Conditional Random Field [47.22366788848256]
We use an undirected graphical model called pairwise Conditional random field (PCRF) to formulaing the UFET problem。
我々は、エンティティ型付けに様々な現代的なバックボーンを使用し、一意ポテンシャルを計算し、型句表現からペアのポテンシャルを導出する。
我々は、非常に大きな型集合に対する効率的な型推論に平均場変分推論を使用し、それをニューラルネットワークモジュールとして展開し、エンドツーエンドのトレーニングを可能にする。
論文 参考訳(メタデータ) (2022-12-03T09:49:15Z) - SIGTYP 2020 Shared Task: Prediction of Typological Features [78.95376120154083]
タイポロジーKBが広く採用されるのを妨げる大きな欠点は、人口が少ないことである。
類型的特徴は相互に相関することが多いため、それらを予測し、自動的に類型的KBを投入することができる。
全体として、このタスクは5つのチームから8つの応募を惹きつけた。
論文 参考訳(メタデータ) (2020-10-16T08:47:24Z) - LambdaNet: Probabilistic Type Inference using Graph Neural Networks [46.66093127573704]
本稿では,グラフニューラルネットワークに基づくTypeScriptの確率型推論手法を提案する。
弊社のアプローチでは、数値や文字列などの標準型と、トレーニング中に遭遇していないユーザ定義型の両方を予測できる。
論文 参考訳(メタデータ) (2020-04-29T17:48:40Z) - Typilus: Neural Type Hints [17.332608142043004]
本稿では,プログラムの構造,名称,パターンを確率論的に推論することで,型を予測するグラフニューラルネットワークモデルを提案する。
我々のモデルは,レアおよびユーザ定義型を含む,オープンなタイプの語彙を予測するために,ワンショット学習を用いることができる。
タイピロスは、すべてのアノテータ可能なシンボルの70%の型を自信を持って予測する。
論文 参考訳(メタデータ) (2020-04-06T11:14:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。