Fugu-MT 論文翻訳(概要): Can Machines Read Coding Manuals Yet? -- A Benchmark for Building Better Language Models for Code Understanding

論文の概要: Can Machines Read Coding Manuals Yet? -- A Benchmark for Building Better Language Models for Code Understanding

arxiv url: http://arxiv.org/abs/2109.07452v1
Date: Wed, 15 Sep 2021 17:42:44 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-16 15:19:15.485260
Title: Can Machines Read Coding Manuals Yet? -- A Benchmark for Building Better Language Models for Code Understanding
Title（参考訳）: 機械はコーディングマニュアルを読めますか? --コード理解のためのより良い言語モデルを構築するためのベンチマーク
Authors: Ibrahim Abdelaziz, Julian Dolby, Jamie McCusker, and Kavitha Srinivas
Abstract要約: フォーラムの投稿で、質問に対する最良の回答を予測するなどのタスクに基づいて、コード理解を評価するためのベンチマークのセットを導出します。我々は,これらのタスクにおける現状の言語モデルの性能を評価し,微調整による各タスクの大幅な改善を示す。
参考スコア（独自算出の注目度）: 3.98345038769576
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Code understanding is an increasingly important application of Artificial Intelligence. A fundamental aspect of understanding code is understanding text about code, e.g., documentation and forum discussions. Pre-trained language models (e.g., BERT) are a popular approach for various NLP tasks, and there are now a variety of benchmarks, such as GLUE, to help improve the development of such models for natural language understanding. However, little is known about how well such models work on textual artifacts about code, and we are unaware of any systematic set of downstream tasks for such an evaluation. In this paper, we derive a set of benchmarks (BLANCA - Benchmarks for LANguage models on Coding Artifacts) that assess code understanding based on tasks such as predicting the best answer to a question in a forum post, finding related forum posts, or predicting classes related in a hierarchy from class documentation. We evaluate the performance of current state-of-the-art language models on these tasks and show that there is a significant improvement on each task from fine tuning. We also show that multi-task training over BLANCA tasks helps build better language models for code understanding.
Abstract（参考訳）: コード理解は人工知能の重要な応用である。コードを理解する基本的な側面は、コードに関するテキストを理解することである。事前訓練された言語モデル(例えばBERT)は様々なNLPタスクの一般的なアプローチであり、自然言語理解のためのモデルの開発を支援するためにGLUEのような様々なベンチマークがある。しかし、そのようなモデルがコードに関するテキスト的アーティファクトに対してどのように機能するかは、ほとんど分かっておらず、そのような評価のために下流タスクの体系的なセットを知らない。本稿では、フォーラム投稿における質問に対する最良の回答の予測、関連するフォーラム投稿の検索、クラスドキュメントからの階層化に関連するクラス予測といったタスクに基づいて、コード理解を評価する一連のベンチマーク(BLANCA - LANguage Model on Coding Artifacts ベンチマーク)を導出する。我々は,これらのタスクにおける現状の言語モデルの性能を評価し,微調整による各タスクの大幅な改善を示す。また、BLANCAタスクによるマルチタスクトレーニングは、コード理解のためのより良い言語モデル構築に役立つことを示す。

関連論文リスト

MERA Code: A Unified Framework for Evaluating Code Generation Across Tasks [56.34018316319873]
我々は,最新のLLMをロシア語で評価するためのベンチマークであるMERA Codeを提案する。このベンチマークには、8つのプログラミング言語にまたがる11の評価タスクが含まれている。我々はオープンなLLMとフロンティアAPIモデルを評価し、非英語言語における実用的なコーディングタスクの観点からそれらの制限を分析した。
論文参考訳（メタデータ） (2025-07-16T14:31:33Z)
A Code Comprehension Benchmark for Large Language Models for Code [20.007789979629784]
大規模データセットを用いたコード理解タスクのための大規模言語モデルの微調整を提案する。コード理解タスクのスイート上で,さまざまなサイズの3つのコードモデルを評価する。最も重要な改善点はQWQ-32Bモデルで見られ、精度は70%から83.47%に向上した。
論文参考訳（メタデータ） (2025-07-14T16:19:49Z)
CodeGRAG: Bridging the Gap between Natural Language and Programming Language via Graphical Retrieval Augmented Generation [58.84212778960507]
我々は,LLMの性能を高めるため,グラフィカル検索拡張コード生成フレームワークであるCodeGRAGを提案する。 CodeGRAGは、制御フローとデータフローに基づいて、コードブロックのグラフィカルなビューを構築し、プログラミング言語と自然言語のギャップを埋める。ハードメタグラフプロンプト、ソフトプロンプト技術、事前訓練されたGNN専門家の目的の有効性を検証するために、C++言語とピソン言語の両方を含む4つのデータセットで様々な実験と改善が行われた。
論文参考訳（メタデータ） (2024-05-03T02:48:55Z)
Do Large Code Models Understand Programming Concepts? Counterfactual Analysis for Code Predicates [32.93686693752635]
大規模言語モデルによるテキスト生成の成功により、コード生成やコーディングタスクも改善された。このギャップを埋めるためには、基礎となるプログラムの論理構造をどの程度の自己回帰モデルで理解するかを探索する。
論文参考訳（メタデータ） (2024-02-08T06:48:01Z)
Python Code Generation by Asking Clarification Questions [57.63906360576212]
本稿では,この課題に対して,より斬新で現実的なセットアップを導入する。我々は、自然言語記述の過小評価は、明確化を問うことで解決できると仮定する。我々は、生成した合成明確化質問と回答を含む自然言語記述とコードのペアを含む、CodeClarQAという新しいデータセットを収集し、導入する。
論文参考訳（メタデータ） (2022-12-19T22:08:36Z)
Adding Context to Source Code Representations for Deep Learning [13.676416860721877]
我々は、ディープラーニングモデルが分析対象のコードに関する追加のコンテキスト情報にアクセスできることは有益であると主張している。本稿では,コード自体の情報とともに,コール階層からコンテキストを符号化することで,最先端のディープラーニングモデルの性能を向上できることを示す。
論文参考訳（メタデータ） (2022-07-30T12:47:32Z)
Code Generation Tools (Almost) for Free? A Study of Few-Shot, Pre-Trained Language Models on Code [13.15617135394116]
大規模で事前訓練された言語モデルによるショットラーニングは、コードに関する質問に答える強力な方法だ。本稿では,現在最先端の事前訓練済みの言語モデルであるCodexがこの目的をどの程度果たすかを検討する。
論文参考訳（メタデータ） (2022-06-02T23:15:42Z)
Benchmarking Generalization via In-Context Instructions on 1,600+ Language Tasks [95.06087720086133]
Natural-Instructions v2 は 1,600 以上の多種多様な言語タスクとその専門家による命令のコレクションである。ベンチマークでは、タグ付け、インフィル、書き換えなど、70以上の異なるタスクタイプがカバーされている。このベンチマークにより、モデルのクロスタスク一般化の大規模評価が可能になる。
論文参考訳（メタデータ） (2022-04-16T03:12:30Z)
CodeRetriever: Unimodal and Bimodal Contrastive Learning [128.06072658302165]
関数レベルのコードセマンティック表現を訓練するために,一様および二様のコントラスト学習を組み合わせたCodeRetrieverモデルを提案する。ノンモーダルなコントラスト学習のために、文書と関数名に基づいてポジティブなコードペアを構築するためのセマンティックガイド付き手法を設計する。バイモーダルなコントラスト学習では、コードのドキュメンテーションとインラインコメントを活用して、テキストコードペアを構築します。
論文参考訳（メタデータ） (2022-01-26T10:54:30Z)
Contrastive Learning for Source Code with Structural and Functional Properties [66.10710134948478]
本稿では,ソースコードの特徴に基づいて事前学習に焦点を当てた,新たな自己教師型モデルBOOSTを提案する。私たちは、機能的に等価なコードを生成する自動化された構造誘導型コード変換アルゴリズムを採用しています。私たちは、対照的な学習目標を通じて、機能的に等価なコードをより近く、異なるコードに近づける方法で、モデルをトレーニングします。
論文参考訳（メタデータ） (2021-10-08T02:56:43Z)
CLSEBERT: Contrastive Learning for Syntax Enhanced Code Pre-Trained Model [23.947178895479464]
CLSEBERTは,構文強化符号事前学習モデルのための構築学習フレームワークである。事前学習段階では、抽象構文木(AST)に含まれるコード構文と階層について検討する。ひとつは抽象構文木内のノード間のエッジを予測することであり、もう一つはコードトークンの型を予測することである。
論文参考訳（メタデータ） (2021-08-10T10:08:21Z)
BERT2Code: Can Pretrained Language Models be Leveraged for Code Search? [0.7953229555481884]
我々は,本モデルが埋め込み空間と改良のスコープに対するさらなるプローブの間に固有の関係を学習することを示す。本稿では,コード埋め込みモデルの品質が,我々のモデルの性能のボトルネックであることを示す。
論文参考訳（メタデータ） (2021-04-16T10:28:27Z)
GraphCodeBERT: Pre-training Code Representations with Data Flow [97.00641522327699]
本稿では,コード固有の構造を考慮したプログラミング言語の事前学習モデルであるGraphCodeBERTを提案する。これは変数間の"where-the-value-comes-from"の関係をエンコードするコードのセマンティックレベルの構造です。コード検索,クローン検出,コード翻訳,コード改良の4つのタスクにおいて,本モデルを評価する。
論文参考訳（メタデータ） (2020-09-17T15:25:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。