Fugu-MT 論文翻訳(概要): CCCI: Code Completion with Contextual Information for Complex Data Transfer Tasks Using Large Language Models

論文の概要: CCCI: Code Completion with Contextual Information for Complex Data Transfer Tasks Using Large Language Models

arxiv url: http://arxiv.org/abs/2503.23231v1
Date: Sat, 29 Mar 2025 21:31:19 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-01 19:35:57.000366
Title: CCCI: Code Completion with Contextual Information for Complex Data Transfer Tasks Using Large Language Models
Title（参考訳）: CCCI:大規模言語モデルを用いた複雑なデータ転送タスクのための文脈情報付きコード補完
Authors: Hangzhan Jin, Mohammad Hamdaqa,
Abstract要約: 本研究では,文脈認識型コード補完法であるCCCIを紹介する。データベーステーブル関係のようなコンテキスト情報を統合することで、CCCIはコード補完の精度を向上させる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Unlike code generation, which involves creating code from scratch, code completion focuses on integrating new lines or blocks of code into an existing codebase. This process requires a deep understanding of the surrounding context, such as variable scope, object models, API calls, and database relations, to produce accurate results. These complex contextual dependencies make code completion a particularly challenging problem. Current models and approaches often fail to effectively incorporate such context, leading to inaccurate completions with low acceptance rates (around 30\%). For tasks like data transfer, which rely heavily on specific relationships and data structures, acceptance rates drop even further. This study introduces CCCI, a novel method for generating context-aware code completions specifically designed to address data transfer tasks. By integrating contextual information, such as database table relationships, object models, and library details into Large Language Models (LLMs), CCCI improves the accuracy of code completions. We evaluate CCCI using 289 Java snippets, extracted from over 819 operational scripts in an industrial setting. The results demonstrate that CCCI achieved a 49.1\% Build Pass rate and a 41.0\% CodeBLEU score, comparable to state-of-the-art methods that often struggle with complex task completion.
Abstract（参考訳）: スクラッチからコードを生成するコード生成とは異なり、コード補完は、新しい行やコードのブロックを既存のコードベースに統合することに焦点を当てている。このプロセスは、正確な結果を得るために、変数スコープ、オブジェクトモデル、API呼び出し、データベース関係などの周囲のコンテキストを深く理解する必要があります。このような複雑なコンテキスト依存は、コード補完を特に困難な問題にします。現在のモデルとアプローチは、多くの場合、そのようなコンテキストを効果的に組み込むことができず、受け入れ率の低い不正確な完了(約30 %)につながる。特定の関係やデータ構造に大きく依存するデータ転送のようなタスクの場合、受け入れ率はさらに低下します。本研究では,データ転送タスクに特化して設計された文脈対応コード補完法であるCCCIを紹介する。データベーステーブルの関係、オブジェクトモデル、ライブラリの詳細などのコンテキスト情報をLLM(Large Language Models)に統合することにより、CCCIはコード補完の精度を向上させる。産業環境で819以上の運用スクリプトから抽出した289個のJavaスニペットを用いてCCCIを評価する。その結果、CCCIは49.1\%のビルドパス率と41.0\%のCodeBLEUスコアを達成した。

関連論文リスト

AlignCoder: Aligning Retrieval with Target Intent for Repository-Level Code Completion [55.21541958868449]
リポジトリレベルのコード補完フレームワークであるAlignCoderを提案する。我々のフレームワークは、初期クエリとターゲットコードのセマンティックギャップを橋渡しする拡張クエリを生成する。我々は、拡張クエリにおける推論情報を活用してより正確な検索を行うAlignRetrieverのトレーニングに強化学習を採用する。
論文参考訳（メタデータ） (2026-01-27T15:23:14Z)
Relative Positioning Based Code Chunking Method For Rich Context Retrieval In Repository Level Code Completion Task With Code Language Model [0.25066242154596113]
本稿では,大規模言語モデル(LLM)によるコード補完作業の効率化を支援する効果的なコンテキスト収集戦略について述べる。最終的なコンテキストにおけるコードのチャンキングと相対的な位置決めによって、コード補完タスクのパフォーマンスが向上することが分かりました。
論文参考訳（メタデータ） (2025-10-07T14:44:59Z)
CLOVER: A Test Case Generation Benchmark with Coverage, Long-Context, and Verification [71.34070740261072]
本稿では,テストケースの生成と完成におけるモデルの能力を評価するためのベンチマークCLOVERを提案する。ベンチマークはタスク間でのコード実行のためにコンテナ化されています。
論文参考訳（メタデータ） (2025-02-12T21:42:56Z)
Deep Learning-based Code Completion: On the Impact on Performance of Contextual Information [14.79590382350231]
本稿では,DLベースのコード補完技術の性能が,状況によってどう影響するかを実証研究する。追加のコンテキスト情報は、DLベースのコード補完のパフォーマンス向上に役立つ。
論文参考訳（メタデータ） (2025-01-09T08:34:34Z)
ContextModule: Improving Code Completion via Repository-level Contextual Information [11.459065573651348]
ContextModuleは生成されたコードの関連性と精度を改善する。我々は,実世界のコーディング環境における遅延制約を満たすために,インデックスキャッシングなどの性能最適化を実装した。
論文参考訳（メタデータ） (2024-12-11T03:15:49Z)
Contextualized Data-Wrangling Code Generation in Computational Notebooks [131.26365849822932]
我々は、マルチモーダルなコンテキスト依存を明確にしたデータラングリングコード生成例をマイニングするために、CoCoMineという自動アプローチを提案する。コンテクスト化されたデータラングリングコード生成のための58,221のサンプルを含むデータセットであるCoCoNoteをNotebooksで構築する。実験結果は、データラングリングコード生成にデータコンテキストを組み込むことの重要性を示す。
論文参考訳（メタデータ） (2024-09-20T14:49:51Z)
VersiCode: Towards Version-controllable Code Generation [58.82709231906735]
大規模言語モデル(LLM)は、コード生成において大きな進歩を遂げていますが、既存の研究は、ソフトウェア開発の動的な性質を説明できません。バージョン別コード補完(VSCC)とバージョン別コードマイグレーション(VACM)の2つの新しいタスクを提案する。 VersiCodeについて広範な評価を行い、バージョン管理可能なコード生成が確かに重要な課題であることを示した。
論文参考訳（メタデータ） (2024-06-11T16:15:06Z)
Dataflow-Guided Retrieval Augmentation for Repository-Level Code Completion [17.4397495929138]
本稿では,リポジトリレベルのコード補完のためのデータフロー誘導型検索拡張手法DraCoを提案する。実験では、DraCoの精度と適用効率が向上し、コード精度が3.43%向上し、識別子F1スコアが平均3.27%向上した。
論文参考訳（メタデータ） (2024-05-30T07:48:00Z)
CrossCodeEval: A Diverse and Multilingual Benchmark for Cross-File Code Completion [86.01508183157613]
CrossCodeEvalは4つの人気のあるプログラミング言語の様々な現実世界、オープンソース、パーミッシブライセンスのリポジトリ上に構築されている。関連するクロスファイルコンテキストが欠如している場合、CrossCodeEvalは極めて困難であることを示す。また、コードレトリバーの能力を測定するためにCrossCodeEvalが使えることも示しています。
論文参考訳（メタデータ） (2023-10-17T13:18:01Z)
CoCoMIC: Code Completion By Jointly Modeling In-file and Cross-file Context [82.88371379927112]
予め訓練されたコード LM 上で,ファイル内コンテキストとファイル内コンテキストを協調的に学習するための,クロスファイルコンテキストを組み込んだフレームワークを提案する。 CoCoMICは既存のコードLMを33.94%の精度で改善し、クロスファイルコンテキストが提供されるとコード補完のための識別子マッチングが28.69%増加した。
論文参考訳（メタデータ） (2022-12-20T05:48:09Z)
Python Code Generation by Asking Clarification Questions [57.63906360576212]
本稿では,この課題に対して,より斬新で現実的なセットアップを導入する。我々は、自然言語記述の過小評価は、明確化を問うことで解決できると仮定する。我々は、生成した合成明確化質問と回答を含む自然言語記述とコードのペアを含む、CodeClarQAという新しいデータセットを収集し、導入する。
論文参考訳（メタデータ） (2022-12-19T22:08:36Z)
ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2022-03-15T08:25:08Z)
CoSQA: 20,000+ Web Queries for Code Search and Question Answering [63.92224685262063]
CoSQAデータセットには、自然言語クエリとコードのペア用の20,604ラベルが含まれている。本稿では,クエリコードマッチングを強化するために,CoCLRと呼ばれる対照的な学習手法を提案する。我々は,CodeXGLUEを同じCodeBERTモデルで評価し,CoSQAのトレーニングにより,コード質問応答の精度が5.1%向上したことを示す。
論文参考訳（メタデータ） (2021-05-27T15:37:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。