論文の概要: Natural Language Generation and Understanding of Big Code for
AI-Assisted Programming: A Review
- arxiv url: http://arxiv.org/abs/2307.02503v1
- Date: Tue, 4 Jul 2023 21:26:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 16:42:49.396156
- Title: Natural Language Generation and Understanding of Big Code for
AI-Assisted Programming: A Review
- Title(参考訳): AI支援プログラミングのための自然言語生成とビッグコードの理解:レビュー
- Authors: Man Fai Wong, Shangxin Guo, Ching Nam Hang, Siu Wai Ho, Chee Wei Tan
- Abstract要約: 本稿では,Big Codeを用いてトレーニングしたトランスフォーマーベース大規模言語モデル(LLM)に焦点を当てる。
LLMは、コード生成、コード補完、コード翻訳、コード洗練、コードの要約、欠陥検出、クローン検出など、AI支援プログラミングアプリケーションを促進する上で重要な役割を担っている。
これらのアプリケーションにNLP技術とソフトウェア自然性を導入する上での課題と機会を探究する。
- 参考スコア(独自算出の注目度): 9.355153561673855
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper provides a comprehensive review of the literature concerning the
utilization of Natural Language Processing (NLP) techniques, with a particular
focus on transformer-based large language models (LLMs) trained using Big Code,
within the domain of AI-assisted programming tasks. LLMs, augmented with
software naturalness, have played a crucial role in facilitating AI-assisted
programming applications, including code generation, code completion, code
translation, code refinement, code summarization, defect detection, and clone
detection. Notable examples of such applications include the GitHub Copilot
powered by OpenAI's Codex and DeepMind AlphaCode. This paper presents an
overview of the major LLMs and their applications in downstream tasks related
to AI-assisted programming. Furthermore, it explores the challenges and
opportunities associated with incorporating NLP techniques with software
naturalness in these applications, with a discussion on extending AI-assisted
programming capabilities to Apple's Xcode for mobile software development. This
paper also presents the challenges of and opportunities for incorporating NLP
techniques with software naturalness, empowering developers with advanced
coding assistance and streamlining the software development process.
- Abstract(参考訳): 本稿では,自然言語処理(NLP)技術の利用に関する文献を包括的にレビューし,AI支援プログラミングタスクの分野において,Big Codeを用いてトレーニングされたトランスフォーマーベース大規模言語モデル(LLM)に着目した。
ソフトウェア自然性によって強化されたLLMは、コード生成、コード補完、コード翻訳、コード洗練、コードの要約、欠陥検出、クローン検出など、AI支援プログラミングアプリケーションを促進する上で重要な役割を果たしている。
このようなアプリケーションの著名な例としては、OpenAIのCodexとDeepMind AlphaCodeを利用したGitHub Copilotがある。
本稿では,AI支援プログラミングに関連する下流タスクにおけるLLMとその応用について概説する。
さらに、これらのアプリケーションにNLP技術とソフトウェア自然性を導入する際の課題と機会についても検討し、モバイルソフトウェア開発のためのAppleのXcodeにAI支援プログラミング機能を拡張することについて議論した。
また,NLP技術をソフトウェア自然性に取り入れる上での課題と機会,高度なコーディング支援を開発者に与えること,ソフトウェア開発プロセスの合理化について述べる。
関連論文リスト
- Redefining Developer Assistance: Through Large Language Models in
Software Ecosystem [0.5912792105701256]
本稿では,インストラクションチューニングによって開発されたDevAssistLlamaを紹介し,ソフトウェア関連自然言語クエリの処理を支援する。
DevAssistLlamaは、特に複雑な技術ドキュメントの扱いに長けており、ソフトウェア固有のタスクにおける開発者の能力を向上させる。
論文 参考訳(メタデータ) (2023-12-09T18:02:37Z) - Developer Experiences with a Contextualized AI Coding Assistant:
Usability, Expectations, and Outcomes [11.520721038793285]
この研究は、コンテキスト化されたコーディングAIアシスタントであるStackSpot AIを制御された環境で使用した62人の参加者の初期体験に焦点を当てる。
アシスタントの使用は、大幅な時間を節約し、ドキュメントへのアクセスを容易にし、内部APIの正確なコードを生成する結果となった。
コーディングアシスタントが、複雑なコードを扱う際の変数応答や制限と同様に、よりコンテキスト情報にアクセスできるようにするために必要な知識ソースに関連する課題が観察された。
論文 参考訳(メタデータ) (2023-11-30T10:52:28Z) - Communicative Agents for Software Development [79.86905471184195]
ChatDevはチャットを利用した仮想ソフトウェア開発会社で、確立したウォーターフォールモデルを反映している。
各ステージは、プログラマ、コードレビュアー、テストエンジニアといった"ソフトウェアエージェント"のチームが参加し、協調的な対話を促進する。
ChatDevは潜在的な脆弱性を特定し、信頼できる効率とコスト効率を維持しながら幻覚を正す。
論文 参考訳(メタデータ) (2023-07-16T02:11:34Z) - CodeTF: One-stop Transformer Library for State-of-the-art Code LLM [72.1638273937025]
我々は、最先端のCode LLMとコードインテリジェンスのためのオープンソースのTransformerベースのライブラリであるCodeTFを紹介する。
我々のライブラリは、事前訓練されたコードLLMモデルと人気のあるコードベンチマークのコレクションをサポートします。
CodeTFが機械学習/生成AIとソフトウェア工学のギャップを埋められることを願っている。
論文 参考訳(メタデータ) (2023-05-31T05:24:48Z) - Chatbots As Fluent Polyglots: Revisiting Breakthrough Code Snippets [0.0]
この研究は、AI駆動のコードアシスタントを使用して、現代技術を形成する影響力のあるコンピュータコードの選択を分析する。
この研究の最初の貢献は、過去50年で最も重要なコードの進歩の半分を調査することであった。
論文 参考訳(メタデータ) (2023-01-05T23:17:17Z) - What is it like to program with artificial intelligence? [10.343988028594612]
大規模言語モデルは、自然言語で表される様々な問題を解決するためにコードを生成することができる。
この技術はすでに、少なくとも1つの広く使用されているプログラミングエディタ拡張、GitHub Copilotで商用化されている。
我々は,大規模言語モデル(LLM支援プログラミング)を用いたプログラミングが,プログラマ支援の事前概念化とどのように似ており,異なるのかを考察する。
論文 参考訳(メタデータ) (2022-08-12T10:48:46Z) - CodeRL: Mastering Code Generation through Pretrained Models and Deep
Reinforcement Learning [92.36705236706678]
CodeRLは、事前訓練されたLMと深層強化学習によるプログラム合成タスクのための新しいフレームワークである。
推論中、我々は重要なサンプリング戦略を持つ新しい生成手順を導入する。
モデルバックボーンについては,CodeT5のエンコーダデコーダアーキテクチャを拡張し,学習目標を拡張した。
論文 参考訳(メタデータ) (2022-07-05T02:42:15Z) - A Survey on Artificial Intelligence for Source Code: A Dialogue Systems
Perspective [4.771833920251869]
本稿では,過去35年間の自然言語処理(NLP)とソースコードにおけるディープラーニング手法について概説する。
次に、コードインテリジェンス(CI)およびプログラミング言語処理(PLP)として知られるソースコードに対する人工知能(AI)の適用状況について調査する。
論文 参考訳(メタデータ) (2022-02-10T05:40:51Z) - Competition-Level Code Generation with AlphaCode [74.87216298566942]
より深い推論を必要とする問題に対する新しいソリューションを作成することができるコード生成システムであるAlphaCodeを紹介する。
Codeforcesプラットフォームにおける最近のプログラミングコンペティションのシミュレーション評価において、AlphaCodeは平均54.3%のランキングを達成した。
論文 参考訳(メタデータ) (2022-02-08T23:16:31Z) - Using Document Similarity Methods to create Parallel Datasets for Code
Translation [60.36392618065203]
あるプログラミング言語から別のプログラミング言語へのソースコードの翻訳は、重要で時間を要する作業です。
本稿では、文書類似性手法を用いて、ノイズの多い並列データセットを作成することを提案する。
これらのモデルは、妥当なレベルのノイズに対して、地上の真実に基づいて訓練されたモデルと相容れない性能を示す。
論文 参考訳(メタデータ) (2021-10-11T17:07:58Z) - Improving Compositionality of Neural Networks by Decoding
Representations to Inputs [83.97012077202882]
我々は、ニューラルネットワークのアクティベーションを制約し、入力に"デコード"するように生成モデルを共同で訓練することで、従来のディープラーニングプログラムの利点を橋渡しする。
本稿では,デオード可能な表現の分布外検出,逆例,校正,公平性への応用を実証する。
論文 参考訳(メタデータ) (2021-06-01T20:07:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。