論文の概要: Large Language Models for Multilingual Code Intelligence: A Survey
- arxiv url: http://arxiv.org/abs/2604.25960v1
- Date: Mon, 27 Apr 2026 20:20:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.105036
- Title: Large Language Models for Multilingual Code Intelligence: A Survey
- Title(参考訳): 多言語コードインテリジェンスのための大規模言語モデル:調査
- Authors: Chao Jiang, Dugang Liu, Cheng Wen, Zhiwu Xu, Hua Zheng, Muhammad Sadiq, Jawwad Ahmed Shamsi, Shengchao Qin, Zhong Ming,
- Abstract要約: この調査では、共通自然言語要求からの多言語コード生成と、言語間のセマンティクスを保存する多言語コード翻訳という2つの重要なタスクに焦点を当てた。
代表的な手法、ベンチマーク、評価指標をレビューし、信頼できる言語間の一般化の課題と機会を強調している。
- 参考スコア(独自算出の注目度): 15.859504186659825
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models have transformed AI-assisted software engineering, but current research remains biased toward high-resource languages such as Python, with weaker performance in languages like Rust and OCaml. Since real-world systems are inherently polyglot, robust multilingual code intelligence is crucial. This survey focuses on two key tasks: multilingual code generation from shared natural-language requirements, and multilingual code translation that preserves semantics across languages. It reviews representative methods, benchmarks, and evaluation metrics, and highlights challenges and opportunities for trustworthy cross-language generalization.
- Abstract(参考訳): 大規模な言語モデルは、AI支援ソフトウェアエンジニアリングを変革したが、現在の研究は、RustやOCamlのような言語のパフォーマンスが低下した、Pythonのようなオープンソースの言語に偏っている。
現実世界のシステムは本質的に多言語であるため、堅牢な多言語コードインテリジェンスが不可欠である。
この調査では、共通自然言語要求からの多言語コード生成と、言語間のセマンティクスを保存する多言語コード翻訳という2つの重要なタスクに焦点を当てた。
代表的な手法、ベンチマーク、評価指標をレビューし、信頼できる言語間の一般化の課題と機会を強調している。
関連論文リスト
- GlotEval: A Test Suite for Massively Multilingual Evaluation of Large Language Models [24.450836403716547]
GlotEvalは、多言語評価のために設計された軽量フレームワークである。
数十から数百の言語にまたがる7つの重要なタスク(機械翻訳、テキスト分類、要約、オープンエンドジェネレーション、読書理解、シーケンスラベリング、本質的な評価)をサポートする。
多様な言語的文脈におけるモデルの強みと弱みの正確な診断を可能にする。
論文 参考訳(メタデータ) (2025-04-05T12:30:58Z) - mHumanEval -- A Multilingual Benchmark to Evaluate Large Language Models for Code Generation [28.531581489405745]
mHumanEvalは200以上の自然言語でプロンプトをサポートする拡張ベンチマークである。
我々は15の多様な自然言語(NL)に対して専門的な人文翻訳を提供する。
我々は,SOTA (State-of-the-art) Code LLMの多言語コード生成能力を解析して結論付ける。
論文 参考訳(メタデータ) (2024-10-19T08:44:26Z) - Soft Language Clustering for Multilingual Model Pre-training [57.18058739931463]
本稿では,インスタンスを条件付きで符号化するためのフレキシブルガイダンスとして,コンテキスト的にプロンプトを検索するXLM-Pを提案する。
我々のXLM-Pは、(1)言語間における言語不変および言語固有知識の軽量なモデリングを可能にし、(2)他の多言語事前学習手法との容易な統合を可能にする。
論文 参考訳(メタデータ) (2023-06-13T08:08:08Z) - Multi-lingual Evaluation of Code Generation Models [82.7357812992118]
本稿では,MBXPとMultilingual HumanEval,MathQA-Xという,評価コード生成モデルに関する新しいベンチマークを提案する。
これらのデータセットは10以上のプログラミング言語をカバーする。
コード生成モデルの性能を多言語で評価することができる。
論文 参考訳(メタデータ) (2022-10-26T17:17:06Z) - Are Multilingual Models Effective in Code-Switching? [57.78477547424949]
多言語モデルの有効性を検討し,複合言語設定の能力と適応性について検討する。
この結果から,事前学習した多言語モデルでは,コードスイッチングにおける高品質な表現が必ずしも保証されないことが示唆された。
論文 参考訳(メタデータ) (2021-03-24T16:20:02Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating
Cross-lingual Generalization [128.37244072182506]
言語間TRansfer Evaluation of Multilinguals XTREMEは、40言語および9タスクにわたる多言語表現の言語間一般化能力を評価するためのベンチマークである。
我々は、英語でテストされたモデルは、多くのタスクにおいて人間のパフォーマンスに達するが、言語間変換されたモデルの性能にはまだ大きなギャップがあることを示した。
論文 参考訳(メタデータ) (2020-03-24T19:09:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。