Fugu-MT 論文翻訳(概要): On the Compression of Language Models for Code: An Empirical Study on CodeBERT

論文の概要: On the Compression of Language Models for Code: An Empirical Study on CodeBERT

arxiv url: http://arxiv.org/abs/2412.13737v1
Date: Wed, 18 Dec 2024 11:14:30 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-19 16:46:52.185775
Title: On the Compression of Language Models for Code: An Empirical Study on CodeBERT
Title（参考訳）: コードのための言語モデルの圧縮について:CodeBERTの実証的研究
Authors: Giordano d'Aloisio, Luca Traini, Federica Sarro, Antinisca Di Marco,
Abstract要約: 我々は、知識蒸留、量子化、プルーニングの3つの有名な圧縮戦略が、ソフトウェアエンジニアリングタスクの3つの異なるクラスに与える影響を調査する。その結果,これらの戦略の影響は,タスクや特定の圧縮方法によって大きく異なることが明らかとなった。
参考スコア（独自算出の注目度）: 9.574645433491225
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Language models have proven successful across a wide range of software engineering tasks, but their significant computational costs often hinder their practical adoption. To address this challenge, researchers have begun applying various compression strategies to improve the efficiency of language models for code. These strategies aim to optimize inference latency and memory usage, though often at the cost of reduced model effectiveness. However, there is still a significant gap in understanding how these strategies influence the efficiency and effectiveness of language models for code. Here, we empirically investigate the impact of three well-known compression strategies -- knowledge distillation, quantization, and pruning -- across three different classes of software engineering tasks: vulnerability detection, code summarization, and code search. Our findings reveal that the impact of these strategies varies greatly depending on the task and the specific compression method employed. Practitioners and researchers can use these insights to make informed decisions when selecting the most appropriate compression strategy, balancing both efficiency and effectiveness based on their specific needs.
Abstract（参考訳）: 言語モデルは、幅広いソフトウェアエンジニアリングタスクで成功裏に証明されているが、その大きな計算コストは、しばしば実践的な採用を妨げる。この課題に対処するため、研究者らは、コードのための言語モデルの効率を改善するために、様々な圧縮戦略を適用し始めた。これらの戦略は推論遅延とメモリ使用量の最適化を目標としているが、モデルの有効性を低下させるコストがかかることが多い。しかし、これらの戦略がコードに対する言語モデルの効率性と有効性にどのように影響するかを理解するには、依然として大きなギャップがある。ここでは、脆弱性検出、コード要約、コード検索という3つの異なる種類のソフトウェアエンジニアリングタスクに対する、よく知られた3つの圧縮戦略(知識の蒸留、量子化、プルーニング)の影響を実証的に調査する。その結果,これらの戦略の影響は,タスクや特定の圧縮方法によって大きく異なることが明らかとなった。専門家や研究者は、これらの洞察を使って、最も適切な圧縮戦略を選択し、特定のニーズに基づいて効率と効率のバランスをとる際に、情報的な決定を行うことができる。

関連論文リスト

Efficient Strategy for Improving Large Language Model (LLM) Capabilities [0.0]
大規模言語モデル(LLM)は、人工知能と自然言語処理の分野でマイルストーンとなっている。大規模なデプロイメントは、重要な計算リソースの必要性によって、依然として制限されている。この研究は、データ処理と慎重なデータ選択手法を探索し組み合わせるためのベースモデルから始めることを提案する。
論文参考訳（メタデータ） (2025-08-06T04:08:26Z)
Model Compression vs. Adversarial Robustness: An Empirical Study on Language Models for Code [11.16693333878553]
コードに対するトランスフォーマーベースの言語モデルは、様々なソフトウェア分析タスクにおいて顕著なパフォーマンスを示している。彼らの採用は高い計算コスト、推論速度の遅さ、環境への影響によって妨げられている。プルーニング、量子化、知識蒸留といったモデル圧縮技術は、これらの課題に対処する上で大きな役割を果たしている。
論文参考訳（メタデータ） (2025-08-05T22:32:32Z)
On the Scaling of Robustness and Effectiveness in Dense Retrieval [111.58315434849047]
ロバストさと有効性は、現実世界のアプリケーションのための密集した検索モデルを開発する上で重要な側面である。最近の研究は、高密度検索における有効性のスケーリング法則に対処し、モデルとデータのサイズと有効性の間には、ゆるい関係があることを明らかにしている。堅牢性と有効性は異なるスケーリングパターンを示しており、両方を共同で改善する場合、かなりのリソースコストがかかります。
論文参考訳（メタデータ） (2025-05-30T06:57:27Z)
Efficient Reasoning Models: A Survey [52.96232442322824]
本調査は,近年の効率的な推論の進歩を包括的に概観することを目的としている。 1)短い圧縮CoTを簡潔で効果的な推論チェーンに、(2)より小さい - 強力な推論能力を持つコンパクトな言語モデルを開発する、(3)より高速に、という3つの重要な方向性に分類する。
論文参考訳（メタデータ） (2025-04-15T06:28:00Z)
Investigating Execution-Aware Language Models for Code Optimization [7.62248558265865]
本研究では,コード実行情報を言語モデルに組み込むことが,コードの最適化能力にどのように影響するかを検討する。この結果から,コード最適化における標準のCodeT5+モデルと比較して,実行認識モデルの方がメリットが小さいことが示唆された。
論文参考訳（メタデータ） (2025-03-11T09:46:07Z)
TACO-RL: Task Aware Prompt Compression Optimization with Reinforcement Learning [11.167198972934736]
GPT-4のような大規模言語モデル(LLM)は、最適なパフォーマンスに必要なプロンプトのサイズが急増した。本稿では,RLに基づくタスク認識プロンプト圧縮手法を提案する。我々は,RL誘導圧縮法により,最先端圧縮技術よりもタスク性能が8%から189%向上することが実証された。
論文参考訳（メタデータ） (2024-09-19T18:11:59Z)
Efficiency optimization of large-scale language models based on deep learning in natural language processing tasks [6.596361762662328]
大規模言語モデルの内部構造と操作機構を理論的に解析する。我々は、適応最適化アルゴリズム(AdamWなど)、大規模並列計算技術、混合精度訓練戦略の寄与を評価した。
論文参考訳（メタデータ） (2024-05-20T00:10:00Z)
Towards Coarse-to-Fine Evaluation of Inference Efficiency for Large Language Models [95.96734086126469]
大規模言語モデル(LLM)は、ユーザが仕事を達成するのを助けるアシスタントとして機能し、高度なアプリケーションの開発をサポートする。 LLMの幅広い応用にとって、推論効率は重要な問題であり、既存の研究で広く研究されている。各種コードライブラリの推論性能の粗大な解析を行う。
論文参考訳（メタデータ） (2024-04-17T15:57:50Z)
What Happens When Small Is Made Smaller? Exploring the Impact of Compression on Small Data Pretrained Language Models [2.2871867623460216]
本稿では, AfriBERTa を用いた低リソース小データ言語モデルにおいて, プルーニング, 知識蒸留, 量子化の有効性について検討する。実験のバッテリを用いて,圧縮が精度を超えるいくつかの指標のパフォーマンスに与える影響を評価する。
論文参考訳（メタデータ） (2024-04-06T23:52:53Z)
A Thorough Examination of Decoding Methods in the Era of LLMs [72.65956436513241]
復号法は、次世代の予測器から実用的なタスク解決器に言語モデルを変換する上で、必須の役割を果たす。本稿では,大規模言語モデルの文脈における様々な復号法を包括的かつ多面的に分析する。その結果,復号法の性能は特にタスク依存的であり,アライメント,モデルサイズ,量子化などの要因に影響されていることが明らかとなった。
論文参考訳（メタデータ） (2024-02-10T11:14:53Z)
The Efficiency Spectrum of Large Language Models: An Algorithmic Survey [54.19942426544731]
LLM(Large Language Models)の急速な成長は、様々なドメインを変換する原動力となっている。本稿では,LLMのエンドツーエンドのアルゴリズム開発に不可欠な多面的効率性について検討する。
論文参考訳（メタデータ） (2023-12-01T16:00:25Z)
Retrieval-based Knowledge Transfer: An Effective Approach for Extreme Large Language Model Compression [64.07696663255155]
大規模事前学習型言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて例外的な性能を示した。しかし、これらのモデルの巨大なサイズは、現実世界のアプリケーションに展開する上で大きな課題をもたらします。本稿では,LLMの知識を極めて小規模なモデルに効果的に伝達するRetrieval-based Knowledge Transfer (RetriKT)と呼ばれる新しい圧縮パラダイムを提案する。
論文参考訳（メタデータ） (2023-10-24T07:58:20Z)
Revisiting Offline Compression: Going Beyond Factorization-based Methods for Transformer Language Models [7.542276054279341]
トランスフォーマー言語モデルは、多くの自然言語処理(NLP)タスクにおいて卓越した結果を達成する。その巨大なサイズは、しばしばメモリ制限されたデバイスを非現実的にし、実践者はそれをより小さなネットワークに圧縮する必要がある。本稿では,圧縮モデルをさらに微調整する必要のないオフライン圧縮手法について検討する。
論文参考訳（メタデータ） (2023-02-08T13:36:06Z)
An Empirical Investigation of Commonsense Self-Supervision with Knowledge Graphs [67.23285413610243]
大規模知識グラフから抽出した情報に基づく自己監督は、言語モデルの一般化を改善することが示されている。本研究では,言語モデルに適用可能な合成データを生成するための知識サンプリング戦略とサイズの影響について検討する。
論文参考訳（メタデータ） (2022-05-21T19:49:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。