Fugu-MT 論文翻訳(概要): Code Detection for Hardware Acceleration Using Large Language Models

論文の概要: Code Detection for Hardware Acceleration Using Large Language Models

arxiv url: http://arxiv.org/abs/2307.10348v1
Date: Wed, 19 Jul 2023 17:21:58 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-21 16:09:34.945754
Title: Code Detection for Hardware Acceleration Using Large Language Models
Title（参考訳）: 大規模言語モデルを用いたハードウェアアクセラレーションのためのコード検出
Authors: Pablo Antonio Mart\'inez and Gregorio Bernab\'e and Jos\'e Manuel Garc\'ia
Abstract要約: 本研究は,大規模言語モデル(LLM)を用いたコード検出の最初の解析である。コード検出のための予備的かつ素直なプロンプトと,新しいプロンプト戦略を提案する。その結果, GEMM, 畳み込み, FFTでは68.8%, 22.3%, 79.2%の精度が得られた。我々の新たなプロンプト戦略は偽陽性を大幅に減らし, 総合的精度(91.1%, 97.9%, 99.7%)は良好である。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Large language models (LLMs) have been massively applied to many tasks, often surpassing state-of-the-art approaches. While their effectiveness in code generation has been extensively studied (e.g., AlphaCode), their potential for code detection remains unexplored. This work presents the first analysis of code detection using LLMs. Our study examines essential kernels, including matrix multiplication, convolution, and fast-fourier transform, implemented in C/C++. We propose both a preliminary, naive prompt and a novel prompting strategy for code detection. Results reveal that conventional prompting achieves great precision but poor accuracy (68.8%, 22.3%, and 79.2% for GEMM, convolution, and FFT, respectively) due to a high number of false positives. Our novel prompting strategy substantially reduces false positives, resulting in excellent overall accuracy (91.1%, 97.9%, and 99.7%, respectively). These results pose a considerable challenge to existing state-of-the-art code detection methods.
Abstract（参考訳）: 大規模言語モデル(llm)は多くのタスクに大規模に適用され、しばしば最先端のアプローチを超えている。コード生成の有効性は広く研究されている(AlphaCodeなど)が、コード検出の可能性はまだ明らかではない。本研究は,LLMを用いたコード検出の最初の解析である。本稿では,C/C++で実装された行列乗算,畳み込み,高速フーリエ変換などの重要なカーネルについて検討する。コード検出のための予備的かつ素直なプロンプトと,新しいプロンプト戦略を提案する。その結果、従来のプロンプトは精度は高いが精度が低く(それぞれ68.8%、22.3%、および79.2%)、偽陽性が多いことが判明した。提案手法は偽陽性を著しく低減し, 総合的精度(91.1%, 97.9%, 99.7%)が良好である。これらの結果は、既存の最先端のコード検出手法にかなりの課題をもたらす。

関連論文リスト

A Systematic Evaluation of Parameter-Efficient Fine-Tuning Methods for the Security of Code LLMs [14.754759160027959]
大規模言語モデル(LLM)はソフトウェア開発を著しく加速するが、その頻繁な安全でないコードの生成は重大なリスクをもたらす。本研究では, 7つのパラメータ効率の微調整(PEFT)手法を総合的に評価し, 性能を損なうことなく, セキュアなコード生成が大幅に向上したことを示す。提案手法は,CodeGen2 16B上で80.86%,67.28%のベースラインに対して13.5ポイント改善した。
論文参考訳（メタデータ） (2025-09-16T04:09:41Z)
LoRACode: LoRA Adapters for Code Embeddings [1.5525560291268214]
コード検索のためのタスク固有アダプタを構築するために,ローランド適応(LoRA)に基づくパラメータ効率の微調整手法を提案する。提案手法では,トレーニング可能なパラメータの数をベースモデルの2%未満に削減し,広範なコードコーパスを高速に微調整する。
論文参考訳（メタデータ） (2025-03-07T10:50:45Z)
Large Language Models as Code Executors: An Exploratory Study [29.545321608864295]
本稿では,Large Language Models (LLM) をコードエグゼキュータとして探索する。 OpenAIのo1、GPT-4o、GPT-3.5、DeepSeek、Qwen-Coderなど、さまざまなLLMでこの実現可能性を調べています。我々は,コードスニペットを行単位で処理し,弱いモデルの精度を平均7.22%向上させるIIP(Iterative Instruction Prompting)技術を導入する。
論文参考訳（メタデータ） (2024-10-09T08:23:22Z)
StagedVulBERT: Multi-Granular Vulnerability Detection with a Novel Pre-trained Code Model [13.67394549308693]
本研究では,新たな脆弱性検出フレームワークStagedVulBERTを紹介する。 CodeBERT-HLSコンポーネントはトークンレベルとステートメントレベルの両方でセマンティクスを同時にキャプチャするために設計されている。粗粒度の脆弱性検出では、StagedVulBERTは92.26%のF1スコアを獲得し、最高のパフォーマンスメソッドよりも6.58%改善している。
論文参考訳（メタデータ） (2024-10-08T07:46:35Z)
LLM Agents Improve Semantic Code Search [6.047454623201181]
本稿では、ユーザプロンプトに情報を注入する検索拡張型エージェントのアプローチを提案する。 RAGを利用することで、エージェントはGitHubリポジトリから関連する詳細でユーザクエリを強化し、より情報的でコンテキスト整合性を高めます。 CodeSearchNetデータセットの実験結果は、RepoRiftが既存のメソッドを大幅に上回っていることを示している。
論文参考訳（メタデータ） (2024-08-05T00:43:56Z)
Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.90988015005934]
不確実性定量化は機械学習アプリケーションにおいて重要な要素である。最新のUQベースラインの集合を実装した新しいベンチマークを導入する。我々は、11タスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も効果的なアプローチを特定した。
論文参考訳（メタデータ） (2024-06-21T20:06:31Z)
Graspness Discovery in Clutters for Fast and Accurate Grasp Detection [57.81325062171676]
グレープネス(graspness)とは、散らばった場面で把握可能な領域を区別する幾何学的手がかりに基づく品質である。本研究では,探索過程を近似するカスケード把握モデルを構築した。大規模なベンチマークであるGraspNet-1Billionの実験では,提案手法が従来の手法よりも大きなマージンで優れていたことが示されている。
論文参考訳（メタデータ） (2024-06-17T02:06:47Z)
Bridging the Gap Between End-to-End and Two-Step Text Spotting [88.14552991115207]
ブリッジングテキストスポッティングは、2段階のメソッドでエラーの蓄積と最適化性能の問題を解決する新しいアプローチである。提案手法の有効性を広範囲な実験により実証する。
論文参考訳（メタデータ） (2024-04-06T13:14:04Z)
Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models [102.72940700598055]
推論タスクでは、小さなエラーでも不正確な結果にカスケードすることができる。入力の摂動に頼らず、外部リソースの導入を避ける手法を開発した。私たちのトレーニングアプローチでは、思考の連鎖の中で特定のトークンをランダムにマスクします。
論文参考訳（メタデータ） (2024-03-04T16:21:54Z)
Zero-Shot Detection of Machine-Generated Codes [83.0342513054389]
本研究は,LLMの生成したコードを検出するためのトレーニング不要な手法を提案する。既存のトレーニングベースまたはゼロショットテキスト検出装置は、コード検出に効果がないことがわかった。本手法は,リビジョン攻撃に対する堅牢性を示し,Javaコードによく適応する。
論文参考訳（メタデータ） (2023-10-08T10:08:21Z)
Asteria-Pro: Enhancing Deep-Learning Based Binary Code Similarity Detection by Incorporating Domain Knowledge [8.93208472340743]
本稿では,ドメイン知識に基づく事前フィルタリングと再分類モジュールを組み込んだ新しいディープラーニング強化アーキテクチャを提案する。 Asteria-Proは、高い精度で1,482の脆弱な関数を91.65%検出する。
論文参考訳（メタデータ） (2023-01-02T03:16:26Z)
Enhancing Semantic Code Search with Multimodal Contrastive Learning and Soft Data Augmentation [50.14232079160476]
コード検索のためのマルチモーダルコントラスト学習とソフトデータ拡張を用いた新しい手法を提案する。我々は,6つのプログラミング言語を用いた大規模データセットにおけるアプローチの有効性を評価するために,広範囲な実験を行った。
論文参考訳（メタデータ） (2022-04-07T08:49:27Z)
Efficient Few-Shot Object Detection via Knowledge Inheritance [62.36414544915032]
Few-shot Object Detection (FSOD) は、未確認のタスクに少ないトレーニングサンプルで適応できるジェネリック検出器を学習することを目的としている。計算量の増加を伴わない効率的なプレトレイン・トランスファー・フレームワーク(PTF)のベースラインを提案する。また,予測された新しいウェイトと事前訓練されたベースウェイトとのベクトル長の不整合を軽減するために,適応長再スケーリング(ALR)戦略を提案する。
論文参考訳（メタデータ） (2022-03-23T06:24:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。