論文の概要: CodeImprove: Program Adaptation for Deep Code
- arxiv url: http://arxiv.org/abs/2501.15804v1
- Date: Mon, 27 Jan 2025 06:23:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:58:28.836544
- Title: CodeImprove: Program Adaptation for Deep Code
- Title(参考訳): CodeImprove: ディープコードのプログラム適応
- Authors: Ravishka Rathnasuriya, Zijie Zhao, Wei Yang,
- Abstract要約: コードモデルは、様々な理由でパフォーマンスが劣化することが多い。
我々は、通常の入力とスコープ外入力を区別し、スコープ外入力をスコープ内入力に変換するCodeImproveを提案する。
実験の結果、CodeImproveは精度8.78%まで向上し、2つのSEタスク上での3つのコードモデルの相対的改善の51.28%を達成できた。
- 参考スコア(独自算出の注目度): 3.560411187959367
- License:
- Abstract: Leveraging deep learning (DL)-based code analysis tools to solve software engineering tasks is becoming increasingly popular. Code models often suffer performance degradation due to various reasons (e.g., code data shifts). Retraining is often required to address these issues, but frequent model updates are costly in labeling and deployment. In this paper, we explore an alternative solution: Adapting the program inputs to the code models. This can be achieved by two steps: 1) input validation that focuses on identifying whether an input is an out-of-scope input program that are beyond a model's handling capability, and 2) input adaptation that adapts out-of-scope inputs to become in-scope inputs. Validating program input is challenging, as current techniques focus on continuous inputs such as image data and fail with discrete inputs like code data, which have unique characteristics and are processed differently by deep learning models. Adapting out-of-scope programs is also challenging due to their vast search spaces. Therefore, in this paper, we propose CodeImprove, which distinguishes out-of-scope from normal inputs and converts such out-of-scope inputs back to in-scope inputs through program transformation. In particular, we propose a validity score metric to identify out-of-scope inputs and leverage genetic algorithms to apply semantic preserving program transformation to convert out-of-scope inputs to in-scope inputs. Our experimental results show CodeImprove can enhance up to 8.78% of accuracy, and 51.28% of relative improvements in three code models on two SE tasks. Additionally, our input validation is promising in detecting out-of-scope inputs (AUC score of 0.924).
- Abstract(参考訳): ソフトウェアエンジニアリングタスクを解決するために、ディープラーニング(DL)ベースのコード分析ツールを活用することが、ますます人気を集めています。
コードモデルは、様々な理由(例えば、コードデータシフト)により、パフォーマンスが劣化することが多い。
これらの問題に対処するためにはリトレーニングが必要であることが多いが、頻繁なモデル更新はラベル付けとデプロイメントにコストがかかる。
本稿では,プログラム入力をコードモデルに適応させる方法を提案する。
これは次の2つのステップによって達成できる。
1)入力がモデルの処理能力を超えるスコープ外入力プログラムであるかどうかを識別することに焦点を当てた入力検証。
2)スコープ外入力に適応してスコープ内入力となる入力適応。
プログラム入力を検証することは困難であり、現在の技術はイメージデータのような連続的な入力に重点を置いており、コードデータのような独自の特徴を持ち、ディープラーニングモデルによって異なる処理を行う個別の入力で失敗する。
スコープ外プログラムの適応も、膨大な検索スペースのために困難である。
そこで本研究では,スコープ外入力と通常の入力とを区別し,プログラム変換によりスコープ内入力に変換するCodeImproveを提案する。
特に、スコープ外入力を識別し、遺伝的アルゴリズムを利用してセマンティック保存プログラム変換を適用し、スコープ外入力をスコープ内入力に変換するための妥当性スコアメトリクスを提案する。
実験の結果、CodeImproveは精度8.78%まで向上し、2つのSEタスク上での3つのコードモデルの相対的改善の51.28%を達成できた。
また,スコープ外入力(AUCスコア0.924)の検出にも有効である。
関連論文リスト
- Generative Input: Towards Next-Generation Input Methods Paradigm [49.98958865125018]
我々はGeneInputという新しい生成入力パラダイムを提案する。
すべての入力シナリオと他のインテリジェントな補助入力関数を処理するためにプロンプトを使用し、ユーザーフィードバックでモデルを最適化し、パーソナライズされた結果を提供する。
その結果,FK2C(Full-mode Key-sequence to Characters)タスクにおいて,最先端のパフォーマンスを初めて達成したことを示す。
論文 参考訳(メタデータ) (2023-11-02T12:01:29Z) - On-the-fly Improving Performance of Deep Code Models via Input Denoising [15.166827643436346]
深層コードモデルのための最初の入力記述手法(CodeDenoise)を提案する。
CodeDenoiseは(おそらく)誤予測された入力にノイズのある識別子をローカライズする。
モデルの再トレーニングや再構築は必要ありませんが、パフォーマンスを改善するためには、オンザフライでインプットをクリーン化すればよいのです。
論文 参考訳(メタデータ) (2023-08-19T09:55:19Z) - Incrementally-Computable Neural Networks: Efficient Inference for
Dynamic Inputs [75.40636935415601]
ディープラーニングは、センサーデータやユーザ入力などの動的入力を効率的に処理するという課題に直面していることが多い。
インクリメンタルな計算アプローチを採用し、入力の変化に応じて計算を再利用する。
本稿では,この手法をトランスフォーマーアーキテクチャに適用し,修正入力の分数に比例した複雑性を持つ効率的なインクリメンタル推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-07-27T16:30:27Z) - Data Lifecycle Management in Evolving Input Distributions for
Learning-based Aerospace Applications [23.84037777018747]
本稿では,テスト入力のサブセットをラベルに選択することで,モデルを段階的に再学習するフレームワークを提案する。
本フレームワーク内のアルゴリズムは,(1)ミッション寿命を通してのモデル性能と(2)ラベル付けとモデル再訓練に関連する累積コストに基づいて評価される。
論文 参考訳(メタデータ) (2022-09-14T18:15:56Z) - Discrete Key-Value Bottleneck [95.61236311369821]
ディープニューラルネットワークは、データストリームがi.d.d.であり、ラベル付きデータが豊富である分類タスクでうまく機能する。
この課題に対処した強力なアプローチの1つは、手軽に利用可能なデータ量に対する大規模なエンコーダの事前トレーニングと、タスク固有のチューニングである。
しかし、新しいタスクを考えると、多くの重みを微調整する必要があるため、エンコーダの重みを更新することは困難であり、その結果、以前のタスクに関する情報を忘れてしまう。
この問題に対処するモデルアーキテクチャを提案し,個別かつ学習可能なキー値符号のペアを含む離散的ボトルネックの上に構築する。
論文 参考訳(メタデータ) (2022-07-22T17:52:30Z) - Encoding Program as Image: Evaluating Visual Representation of Source
Code [2.1016374925364616]
入力プログラムのスナップショットに基づく新しいソースコード表現であるCode2Snapshotについて検討する。
入力プログラムの構文的特徴と意味的特徴を利用した最先端表現と比較する。
論文 参考訳(メタデータ) (2021-11-01T17:07:02Z) - Enforcing Consistency in Weakly Supervised Semantic Parsing [68.2211621631765]
本稿では,関連する入力に対する出力プログラム間の整合性を利用して,スプリアスプログラムの影響を低減することを提案する。
より一貫性のあるフォーマリズムは、一貫性に基づくトレーニングを必要とせずに、モデルパフォーマンスを改善することにつながります。
論文 参考訳(メタデータ) (2021-07-13T03:48:04Z) - Improving Compositionality of Neural Networks by Decoding
Representations to Inputs [83.97012077202882]
我々は、ニューラルネットワークのアクティベーションを制約し、入力に"デコード"するように生成モデルを共同で訓練することで、従来のディープラーニングプログラムの利点を橋渡しする。
本稿では,デオード可能な表現の分布外検出,逆例,校正,公平性への応用を実証する。
論文 参考訳(メタデータ) (2021-06-01T20:07:16Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Controlled time series generation for automotive software-in-the-loop
testing using GANs [0.5352699766206808]
オートマチックメカトロニクスシステムのテストは、部分的にはソフトウェア・イン・ザ・ループ・アプローチを使用し、システム・アンダー・テストのインプットを体系的にカバーすることが大きな課題である。
ひとつのアプローチは、テストプロセスの制御とフィードバックを容易にする入力シーケンスを作成することだが、現実的なシナリオにシステムを公開できない。
もうひとつは、現実を説明できるフィールド操作から記録されたシーケンスを再生するが、広く使われるには十分なキャパシティの十分なラベル付きデータセットを収集する必要があるため、コストがかかる。
この研究は、GAN(Generative Adrial Networks)のよく知られた教師なし学習フレームワークを適用して、記録された車内データのラベルなしデータセットを学習する。
論文 参考訳(メタデータ) (2020-02-16T16:19:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。