論文の概要: iJTyper: An Iterative Type Inference Framework for Java by Integrating
Constraint- and Statistically-based Methods
- arxiv url: http://arxiv.org/abs/2402.09995v1
- Date: Thu, 15 Feb 2024 15:02:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-16 15:09:53.938846
- Title: iJTyper: An Iterative Type Inference Framework for Java by Integrating
Constraint- and Statistically-based Methods
- Title(参考訳): ijtyper: 制約と統計に基づくメソッドの統合によるjavaの反復型推論フレームワーク
- Authors: Zhixiang Chen, Anji Li, Neng Zhang, Jianguo Chen, Yuan Huang, Zibin
Zheng
- Abstract要約: 制約および統計的手法の長所を統合することにより,Java の反復型推論フレームワーク iJTyper を提案する。
iJTyperは、両方のメソッドを反復的に実行し、終了条件を満たすまで、コードコンテキスト拡張と知識ベース削減を実行する。
その結果、iJTyperは2つのデータセットで97.31%と92.52%の平均的精度/リコールを達成した。
- 参考スコア(独自算出の注目度): 30.516523162439583
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inferring the types of API elements in incomplete code snippets (e.g., those
on Q&A forums) is a prepositive step required to work with the code snippets.
Existing type inference methods can be mainly categorized as constraint-based
or statistically-based. The former imposes higher requirements on code syntax
and often suffers from low recall due to the syntactic limitation of code
snippets. The latter relies on the statistical regularities learned from a
training corpus and does not take full advantage of the type constraints in
code snippets, which may lead to low precision. In this paper, we propose an
iterative type inference framework for Java, called iJTyper, by integrating the
strengths of both constraint- and statistically-based methods. For a code
snippet, iJTyper first applies a constraint-based method and augments the code
context with the inferred types of API elements. iJTyper then applies a
statistically-based method to the augmented code snippet. The predicted
candidate types of API elements are further used to improve the
constraint-based method by reducing its pre-built knowledge base. iJTyper
iteratively executes both methods and performs code context augmentation and
knowledge base reduction until a termination condition is satisfied. Finally,
the final inference results are obtained by combining the results of both
methods. We evaluated iJTyper on two open-source datasets. Results show that 1)
iJTyper achieves high average precision/recall of 97.31% and 92.52% on both
datasets; 2) iJTyper significantly improves the recall of two state-of-the-art
baselines, SnR and MLMTyper, by at least 7.31% and 27.44%, respectively; and 3)
iJTyper improves the average precision/recall of the popular language model,
ChatGPT, by 3.25% and 0.51% on both datasets.
- Abstract(参考訳): 不完全なコードスニペット(Q&Aフォーラムなど)でAPI要素の型を推測することは、コードスニペットを扱うのに必要な前向きなステップである。
既存の型推論メソッドは、主に制約ベースまたは統計ベースに分類できる。
前者はコード構文により高い要求を課し、しばしばコードスニペットの構文的制限のためにリコールの低さに悩まされる。
後者はトレーニングコーパスから学んだ統計的正規性に依存しており、コードスニペットの型制約を十分に活用していないため、精度が低下する可能性がある。
本稿では,制約および統計的手法の長所を統合することで,Javaの反復型推論フレームワークiJTyperを提案する。
コードスニペットのために、iJTyperはまず制約ベースのメソッドを適用し、推論されたAPI要素の型でコードコンテキストを拡張する。
その後、iJTyperは、拡張コードスニペットに統計ベースのメソッドを適用する。
予測されるAPI要素の候補型は、事前構築された知識ベースを減らして制約ベースの方法を改善するためにさらに使用される。
ijtyperは両方のメソッドを繰り返し実行し、終了条件が満たされるまでコードコンテキスト拡張と知識ベース削減を実行する。
最後に、両方の手法の結果を組み合わせて最終的な推論結果を得る。
iJTyperを2つのオープンソースデータセットで評価した。
その結果は
1) iJTyperは,両方のデータセットで97.31%,92.52%の平均的精度/リコールを達成する。
2)iJTyperは,2つの最先端ベースラインであるSnRとMLMTyperのリコールを,それぞれ少なくとも7.31%,27.44%改善する。
3)iJTyperは、一般的な言語モデルChatGPTの平均精度/リコールを、両方のデータセットで3.25%と0.51%改善する。
関連論文リスト
- CLIPLoss and Norm-Based Data Selection Methods for Multimodal Contrastive Learning [19.100022935748225]
データ選択は、大規模ビジュアル言語モデル(例えば、CLIP)のコア問題として浮上した。
3つの主要なデータ選択アプローチは、(1)データ選択を支援するために外部のCLIPモデルを活用すること、(2)高品質なデータを選択するのにより効果的な新しいCLIPスタイルの埋め込みモデルをトレーニングすること、(3)より優れたメトリクスや戦略をCLIP埋め込みに普遍的に適用することである。
論文 参考訳(メタデータ) (2024-05-29T22:19:57Z) - A Hard-to-Beat Baseline for Training-free CLIP-based Adaptation [121.0693322732454]
対照的に、CLIP(Contrastive Language- Image Pretraining)はその目覚ましいゼロショット能力で人気を集めている。
近年の研究では、下流タスクにおけるCLIPの性能を高めるための効率的な微調整手法の開発に焦点が当てられている。
従来のアルゴリズムであるガウス判別分析(GDA)を再検討し,CLIPの下流分類に適用する。
論文 参考訳(メタデータ) (2024-02-06T15:45:27Z) - Generative Type Inference for Python [62.01560866916557]
本稿では静的解析から静的ドメイン知識を取り入れた数ショットの生成型推論手法であるTypeGenを紹介する。
TypeGenは、静的解析の型推論ステップを、型依存グラフ(TDG)に基づいたプロンプトに変換することで、COTプロンプトを生成する。
実験の結果、TypeGenは引数型予測では10.0%、Top-1 Exact Matchでは22.5%で最高のベースラインであるType4Pyを上回っている。
論文 参考訳(メタデータ) (2023-07-18T11:40:31Z) - TypeT5: Seq2seq Type Inference using Static Analysis [51.153089609654174]
本稿では,型予測をコード入力タスクとして扱う新しい型推論手法を提案する。
本手法では静的解析を用いて,型シグネチャがモデルによって予測されるコード要素毎に動的コンテキストを構築する。
また,モデルの入力コンテキストに事前の型予測を組み込んだ反復復号方式を提案する。
論文 参考訳(メタデータ) (2023-03-16T23:48:00Z) - DORE: Document Ordered Relation Extraction based on Generative Framework [56.537386636819626]
本稿では,既存のDocREモデルの根本原因について検討する。
本稿では,モデルが学習しやすく,決定論的な関係行列から記号列と順序列を生成することを提案する。
4つのデータセットに対する実験結果から,提案手法は生成型DocREモデルの性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2022-10-28T11:18:10Z) - Highly Parallel Autoregressive Entity Linking with Discriminative
Correction [51.947280241185]
自己回帰リンクを全ての潜在的な言及に対して並列化する,非常に効率的な手法を提案する。
我々のモデルは以前の生成法より70倍高速で精度が高い。
論文 参考訳(メタデータ) (2021-09-08T17:28:26Z) - Provably Consistent Partial-Label Learning [120.4734093544867]
部分ラベル学習 (Partial-label Learning, PLL) は多クラス分類問題である。
本稿では,候補ラベル集合の第1世代モデルを提案し,一貫性が保証される2つの新しい手法を開発する。
ベンチマークおよび実世界のデータセットの実験は、提案した生成モデルの有効性と2つの方法の有効性を検証する。
論文 参考訳(メタデータ) (2020-07-17T12:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。