論文の概要: Bridging the Gap between User Intent and LLM: A Requirement Alignment Approach for Code Generation
- arxiv url: http://arxiv.org/abs/2604.16198v1
- Date: Fri, 17 Apr 2026 16:08:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.992015
- Title: Bridging the Gap between User Intent and LLM: A Requirement Alignment Approach for Code Generation
- Title(参考訳): ユーザインテントとLLMのギャップを埋める:コード生成に必要なアライメントアプローチ
- Authors: Jia Li, Ruiqi Bai, Yangkang Luo, Yiran Zhang, Wentao Yang, Zeyu Sun, Tiankuo Zhao, Dongming Jin, Lei Li, Zhi Jin,
- Abstract要約: 大規模言語モデルのコード生成性能を向上させるための要求アライメント手法であるREA-Coderを提案する。
我々は,REA-Coderが5つのベンチマークデータセットで平均7.93%,30.25%,26.75%,8.59%,8.64%の改善を達成したことを示す。
- 参考スコア(独自算出の注目度): 41.38169076494242
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Code generation refers to automatically producing executable programs from user requirements. Recently, researchers have explored approaches to enhance the correctness of generated code with advanced large language models. Although achieving improvements, existing approaches focus on designing reasoning strategies or post-refinement methods to enhance code generation performance. Despite their differences, all these methods share a common assumption: the LLM can correctly understand the given requirement. However, this assumption does not always hold. To fill this gap, we propose REA-Coder, a requirement alignment approach to enhance the code generation performance of LLMs. REA-Coder involves first identifying the requirement content that does not align with LLMs and aligning the requirements. Then, based on the aligned requirements, LLMs generate code and further verify whether the generated code aligns with the requirements, iterating this process of requirement alignment and code generation until generating correct code or achieving the maximum number of iterations. Experimental results show that REA-Coder outperforms all advanced baselines on four LLMs across five programming benchmarks. Concretely, REA-Coder achieves average improvements of 7.93%, 30.25%, 26.75%, 8.59%, and 8.64% on the five benchmark datasets, demonstrating the effectiveness of requirement alignment for improving the code generation performance of LLMs.
- Abstract(参考訳): コード生成とは、ユーザ要求から実行可能なプログラムを自動的に生成することを指す。
近年,先進的な大規模言語モデルを用いた生成コードの正確性向上手法が研究されている。
改善はしたものの、既存のアプローチでは、コード生成のパフォーマンスを向上させるための推論戦略やポストリファインメント手法の設計に重点を置いている。
それらの違いにもかかわらず、これらのメソッドは共通の仮定を共有している: LLMは与えられた要求を正しく理解することができる。
しかし、この仮定は必ずしも成り立たない。
このギャップを埋めるために,LLMのコード生成性能を向上させる要求アライメントアプローチであるREA-Coderを提案する。
REA-Coderはまず、LCMと整合しない要求内容を特定し、要求を整合させる。
次に、整合した要件に基づいて、LCMはコードを生成し、生成されたコードが要求と整合しているかどうかをさらに検証し、正しいコードを生成するか、イテレーションの最大数を達成するまで、この要求整合とコード生成のプロセスを反復する。
実験結果から、REA-Coderは5つのベンチマークで4つのLLMの先進的なベースラインよりも優れていた。
具体的には、REA-Coderは5つのベンチマークデータセットで7.93%、30.25%、26.75%、8.59%、および8.64%の平均的な改善を実現し、LCMのコード生成性能を改善するための要求アライメントの有効性を実証している。
関連論文リスト
- CONCUR: Benchmarking LLMs for Concurrent Code Generation [3.386685695989279]
コード生成にLLM(Large Language Models)を活用することは、ソフトウェア工学の分野において、共通のプラクティスとして現れつつある。
既存のベンチマークは主にシーケンシャルなコードに焦点を当てており、並行コード生成でLLMを効果的に評価する能力がない。
このギャップに対処するため、並列コードを生成するLLMの能力を評価するためのベンチマークCONCURを設計した。
論文 参考訳(メタデータ) (2026-03-04T03:22:26Z) - Evaluating and Achieving Controllable Code Completion in Code LLM [89.64782747840225]
命令誘導型コード補完ベンチマークである制御可能コード補完ベンチマーク(C3-Bench)を提案する。
コード補完作業中に,オープンソースのプロプライエタリモデルと高度なプロプライエタリモデルの間に,命令追従機能にかなりのギャップがあることを明らかにする。
結果として得られたQwen2.5-Coder-C3は、C3-Bench上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-01-22T11:40:04Z) - Aligning Requirement for Large Language Model's Code Generation [9.205909320363247]
Specineは、大規模言語モデル(LLM)コード生成のための新しい仕様アライメント技術である。
その鍵となる考え方は、不整合入力仕様を特定し、LLMが認識した仕様を引き上げ、LLMのコード生成性能を高めるためにそれらを整合させることである。
例えば、Specineは最も効果的なベースラインを上回り、Pass@1ですべての被験者の平均29.60%の改善を達成した。
論文 参考訳(メタデータ) (2025-09-01T09:56:13Z) - PerfCodeGen: Improving Performance of LLM Generated Code with Execution Feedback [78.89596149768458]
大規模言語モデル(LLM)は、ソフトウェア開発タスクを支援するために広く採用されている。
LLM生成コードの性能を向上させるトレーニングフリーフレームワークPerfCodeGenを提案する。
論文 参考訳(メタデータ) (2024-11-18T06:22:38Z) - Applying RLAIF for Code Generation with API-usage in Lightweight LLMs [15.366324461797582]
Reinforcement Learning from AI Feedback (RLAIF)は、さまざまな領域で大きな可能性を証明している。
本稿では,軽量 (1B パラメータ) LLM のコード生成能力を改善するための RLAIF フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-28T17:16:03Z) - InfiBench: Evaluating the Question-Answering Capabilities of Code Large Language Models [56.723509505549536]
InfiBenchは、私たちの知識に合ったコードのための、最初の大規模フリーフォーム質問回答(QA)ベンチマークです。
慎重に選択された234の高品質なStack Overflow質問で構成されており、15のプログラミング言語にまたがっている。
InfiBench上で100以上の最新のコードLLMに対して,系統的評価を行い,新しい知見と洞察に富んだ結果を得た。
論文 参考訳(メタデータ) (2024-03-11T02:06:30Z) - StepCoder: Improve Code Generation with Reinforcement Learning from
Compiler Feedback [58.20547418182074]
2つの主要コンポーネントからなるコード生成の新しいフレームワークであるStepCoderを紹介します。
CCCSは、長いシーケンスのコード生成タスクをCurriculum of Code Completion Subtaskに分割することで、探索課題に対処する。
FGOは、未実行のコードセグメントをマスクすることでのみモデルを最適化し、Fine-Grained Optimizationを提供する。
提案手法は,出力空間を探索し,対応するベンチマークにおいて最先端の手法より優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-02-02T13:14:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。