Fugu-MT 論文翻訳(概要): BenchPress: A Deep Active Benchmark Genertor

論文の概要: BenchPress: A Deep Active Benchmark Genertor

arxiv url: http://arxiv.org/abs/2208.06555v1
Date: Sat, 13 Aug 2022 03:00:50 GMT
ステータス: 翻訳完了
システム内更新日: 2022-08-16 13:32:19.567628
Title: BenchPress: A Deep Active Benchmark Genertor
Title（参考訳）: benchpress: 深いアクティブなベンチマークジェネレータ
Authors: Foivos Tsimpourlas, Pavlos Petoumenos, Min Xu, Chris Cummins, Kim Hazelwood, Ajitha Rajan and Hugh Leather
Abstract要約: 我々は,ソースコードの特徴空間表現にステアリング可能な,コンパイラ用の最初のMLベンチマークジェネレータであるBenchPressを開発した。 BenchPressは、空または既存のシーケンスの任意の部分に新しいコードを追加することで、コンパイル関数を合成する。 CLgenよりも10倍もユニークなOpenCLベンチマークをコンパイルし、より大きく、多種多様である。
参考スコア（独自算出の注目度）: 7.194212461947882
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: We develop BenchPress, the first ML benchmark generator for compilers that is steerable within feature space representations of source code. BenchPress synthesizes compiling functions by adding new code in any part of an empty or existing sequence by jointly observing its left and right context, achieving excellent compilation rate. BenchPress steers benchmark generation towards desired target features that has been impossible for state of the art synthesizers (or indeed humans) to reach. It performs better in targeting the features of Rodinia benchmarks in 3 different feature spaces compared with (a) CLgen - a state of the art ML synthesizer, (b) CLSmith fuzzer, (c) SRCIROR mutator or even (d) human-written code from GitHub. BenchPress is the first generator to search the feature space with active learning in order to generate benchmarks that will improve a downstream task. We show how using BenchPress, Grewe's et al. CPU vs GPU heuristic model can obtain a higher speedup when trained on BenchPress's benchmarks compared to other techniques. BenchPress is a powerful code generator: Its generated samples compile at a rate of 86%, compared to CLgen's 2.33%. Starting from an empty fixed input, BenchPress produces 10x more unique, compiling OpenCL benchmarks than CLgen, which are significantly larger and more feature diverse.
Abstract（参考訳）: 我々は,ソースコードの特徴空間表現にステアリング可能な,コンパイラ用の最初のMLベンチマークジェネレータであるBenchPressを開発した。 BenchPressは、左と右のコンテキストを共同で観察することで、空または既存のシーケンスの任意の部分に新しいコードを追加することで、コンパイル機能を合成する。 benchpressは、アートシンセサイザー(あるいは実際に人間)が到達できないような、望ましいターゲット機能に向けてベンチマーク生成を行う。ロジニアベンチマークの特徴を3つの異なる特徴空間でターゲティングすることで、パフォーマンスが向上する。 (a)CLgen-アートMLシンセサイザーの状態。 b)clsmith fuzzer。 (c)SRCIRORミュータ、さらには (d) GitHubから人間が書いたコード。 BenchPressは、下流タスクを改善するベンチマークを生成するために、アクティブな学習でフィーチャースペースを検索する最初のジェネレータである。ベンチプレス、グローヴズなどの使い方をお見せします。 cpu対gpuのヒューリスティックモデルは、benchpressのベンチマークで他の手法よりも高いスピードアップが得られる。 BenchPressは強力なコードジェネレータである。生成されたサンプルはCLgenの2.33%に比べて86%の割合でコンパイルされる。空の固定入力から始めると、BenchPressはCLgenよりも10倍ユニークなOpenCLベンチマークを生成する。

関連論文リスト

Qwen3-Coder-Next Technical Report [67.90974638938285]
コーディングエージェントに特化したオープンウェイト言語モデルQwen3-Coder-Nextを提案する。 Qwen3-Coder-Nextは推論中に30億のパラメータしか起動せず、効率的な推論で強力なコーディング機能を実現する。
論文参考訳（メタデータ） (2026-02-28T16:25:04Z)
Splatwizard: A Benchmark Toolkit for 3D Gaussian Splatting Compression [69.94586602640355]
Splatwizardは3DGS圧縮モデルに特化して設計されたベンチマーク・ツールキットである。 Splatwizardは新しい3DGS圧縮モデルを実装し、最先端技術を利用するための使いやすいフレームワークを提供する。
論文参考訳（メタデータ） (2025-12-31T09:26:04Z)
Counting Without Running: Evaluating LLMs' Reasoning About Code Complexity [2.7389338551082605]
性能ボトルネックを予測するため,LLM(Large Language Models)のベンチマークを開発した。 FLOPBenchは577カーネルの単精度と倍精度のFLOP数を予測する。われわれはFLOPBenchをLLMツールの開発に焦点をあてたテストベッドとして位置づけた。
論文参考訳（メタデータ） (2025-12-04T01:03:20Z)
GitGoodBench: A Novel Benchmark For Evaluating Agentic Performance On Git [0.8397730500554048]
GitGoodBenchは、バージョン管理システム(VCS)タスク上でAIエージェントのパフォーマンスを評価するための新しいベンチマークである。私たちのベンチマークでは、オープンソースのPython、Java、Kotlinリポジトリから抽出された3つのコアGitシナリオについて取り上げています。我々は、カスタムツールを備えたGPT-4oを用いて、ベンチマークのプロトタイプバージョン上でベースライン性能を確立し、全体的な21.1%の解決率を達成する。
論文参考訳（メタデータ） (2025-05-28T16:56:11Z)
Can Compressed LLMs Truly Act? An Empirical Evaluation of Agentic Capabilities in LLM Compression [19.447797559761135]
学習後圧縮は大規模言語モデル(LLM)の計算コストとメモリコストを削減する既存の圧縮ベンチマークは、言語モデリングと自然言語理解タスクのみに焦点を当てている。圧縮がLLMのエージェント能力に与える影響を評価するための,最初の包括的なベンチマークであるACBenchを紹介する。
論文参考訳（メタデータ） (2025-05-26T02:49:07Z)
NoWag: A Unified Framework for Shape Preserving Compression of Large Language Models [63.271278137295006]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な性能を示す。 LLMは膨大な計算量とメモリ需要に悩まされており、リソース制約のある環境への展開を制限している。 Normalized Weight and Activation Guided Compression (Normalized Weight and Activation Guided Compression) をゼロショット形状保存圧縮アルゴリズムの統一フレームワークとして提案する。
論文参考訳（メタデータ） (2025-04-20T11:00:29Z)
SWE-PolyBench: A multi-language benchmark for repository level evaluation of coding agents [49.73885480071402]
我々はSWE-PolyBenchを紹介した。SWE-PolyBenchは、コードエージェントのリポジトリレベル、実行ベース評価のための新しいベンチマークである。 SWE-PolyBenchには21のリポジトリから2110のインスタンスが含まれており、Java(165)、JavaScript(1017)、TypeScript(729)、Python(199)のタスクが含まれており、バグ修正、機能追加、コードを含んでいる。実験の結果,現在のエージェントは言語間で不均一なパフォーマンスを示し,複雑な問題に対処しつつ,単純なタスクで高いパフォーマンスを示すことがわかった。
論文参考訳（メタデータ） (2025-04-11T17:08:02Z)
TritonBench: Benchmarking Large Language Model Capabilities for Generating Triton Operators [59.625889531331815]
Tritonは、効率的なGPUカーネルを構築するために設計されたハイレベルなPythonライクな言語である。従来のコード生成のための大規模言語モデル(LLM)の進歩にもかかわらず、これらのモデルは正確でパフォーマンスに最適化されたトリトンコードを生成するのに苦労している。本稿では,Triton演算子生成のための総合ベンチマークであるTritonBenchを紹介する。
論文参考訳（メタデータ） (2025-02-20T17:21:27Z)
CODEPROMPTZIP: Code-specific Prompt Compression for Retrieval-Augmented Generation in Coding Tasks with LMs [6.936336826531964]
Retrieval-Augmented Generation (RAG)は、検索したコード例をプロンプトに組み込むことで、コーディングタスクを強化する。既存の即時圧縮技術は自然言語に重点を置いており、コードの適切なソリューションが欠如している。 RAGに組み込む前にコード例を圧縮するフレームワークであるCodePromptZipを提案する。
論文参考訳（メタデータ） (2025-02-19T23:15:23Z)
HAC++: Towards 100X Compression of 3D Gaussian Splatting [55.6351304553003]
3D Gaussian Splatting (3DGS)は、新しいビュー合成のための有望なフレームワークとして登場し、高速レンダリング速度と高忠実さを誇っている。しかし、ガウスの点雲(あるいは論文のアンカー)のスパースで非組織的な性質は、圧縮の課題を提起している。本研究では,非組織型アンカーと構造化ハッシュグリッドの関係を利用したHAC++を提案する。
論文参考訳（メタデータ） (2025-01-21T16:23:05Z)
gsplat: An Open-Source Library for Gaussian Splatting [28.65527747971257]
gsplatはGaussian Splattingメソッドのトレーニングと開発用に設計されたオープンソースライブラリである。 PyTorchライブラリと互換性のあるPythonバインディングを備えたフロントエンドと、高度に最適化されたカーネルを備えたバックエンドを備えている。
論文参考訳（メタデータ） (2024-09-10T17:57:38Z)
Unseen No More: Unlocking the Potential of CLIP for Generative Zero-shot HOI Detection [6.4348035950413]
HOIGENと呼ばれるゼロショットHOI検出のためのCLIPを用いた第1世代モデルを提案する。 CLIPを注入した特徴発生器を人・物・組合の特徴の生成に応じて開発する。 HOIスコアを豊かにするために、ペアワイズHOI認識ブランチに生成プロトタイプバンクを構築し、画像ワイズHOI認識ブランチにマルチ知識プロトタイプバンクを構築した。
論文参考訳（メタデータ） (2024-08-12T08:02:37Z)
CodeRAG-Bench: Can Retrieval Augment Code Generation? [78.37076502395699]
検索拡張生成を用いたコード生成の系統的,大規模な解析を行う。まず、コード生成タスクの3つのカテゴリを含む総合的な評価ベンチマークであるCodeRAG-Benchをキュレートする。 CodeRAG-Bench上のトップパフォーマンスモデルについて、1つまたは複数のソースから検索したコンテキストを提供することにより検討する。
論文参考訳（メタデータ） (2024-06-20T16:59:52Z)
PruningBench: A Comprehensive Benchmark of Structural Pruning [50.23493036025595]
textitPruningBenchと呼ばれる、構造的プルーニングのための最初の包括的なベンチマークを提示する。 PruningBenchは、多様な構造的プルーニング技術の有効性を評価するために、統一的で一貫したフレームワークを使用している。将来の刈り取り方法の実装を容易にするための実装が容易なインターフェースを提供し、その後の研究者が自身の作業をリーダボードに組み込めるようにします。
論文参考訳（メタデータ） (2024-06-18T06:37:26Z)
ContextGS: Compact 3D Gaussian Splatting with Anchor Level Context Model [77.71796503321632]
我々は3DGS表現のアンカーレベルにコンテキストモデルを導入し,バニラ3DGSと比較して100倍以上のサイズの縮小を実現した。我々の研究は3DGS表現のためのアンカーレベルのコンテキストモデルを開拓し、バニラ3DGSに比べて100倍以上、そして最新の最先端のScaffold-GSに比べて15倍の大幅なサイズ縮小を実現した。
論文参考訳（メタデータ） (2024-05-31T09:23:39Z)
GaussianTalker: Real-Time High-Fidelity Talking Head Synthesis with Audio-Driven 3D Gaussian Splatting [25.78134656333095]
ポーズ制御可能な音声ヘッドをリアルタイムに生成するための新しいフレームワークを提案する。 GaussianTalkerは、ヘッドの標準的な3DGS表現を構築し、オーディオと同期して変形する。空間認識機能を活用し、近隣の点間の相互作用を強制する。
論文参考訳（メタデータ） (2024-04-24T17:45:24Z)
Exploring Continual Learning for Code Generation Models [80.78036093054855]
継続的学習(CL)は、コードドメインの中でまだ過小評価されていない重要な側面である。コード生成,翻訳,要約,改良など,幅広いタスクをカバーするCodeTask-CLというベンチマークを導入する。即時選択機構の不安定な訓練により,プロンプトプール (PP) などの有効手法が破滅的な忘れ込みに悩まされることが判明した。
論文参考訳（メタデータ） (2023-07-05T16:58:39Z)
HDCC: A Hyperdimensional Computing compiler for classification on embedded systems and high-performance computing [58.720142291102135]
この研究は、HDC分類メソッドの高レベルな記述を最適化されたCコードに変換する最初のオープンソースコンパイラである、ネームコンパイラを紹介している。 nameは現代のコンパイラのように設計されており、直感的で記述的な入力言語、中間表現(IR)、再ターゲット可能なバックエンドを備えている。これらの主張を裏付けるために,HDC文献で最もよく使われているデータセットについて,HDCCを用いて実験を行った。
論文参考訳（メタデータ） (2023-04-24T19:16:03Z)
BenchDirect: A Directed Language Model for Compiler Benchmarks [7.194212461947882]
ソースコードの特徴表現内で指向できる最初のMLコンパイラベンチマークジェネレータであるBenchPressを開発した。アクティブラーニングを使用して、Grewe氏らによるCPU対GPUのデータセットに目に見えない機能を備えた新しいベンチマークを導入し、取得したパフォーマンスを50%改善しました。 3つの特徴空間では、Rodiniaベンチマークの機能をターゲットにして、GitHub、CLgen、CLSmith、SRCIROR mutatorからの人書きコードよりも優れています。
論文参考訳（メタデータ） (2023-03-02T20:17:24Z)
SMORE: Knowledge Graph Completion and Multi-hop Reasoning in Massive Knowledge Graphs [147.73127662757335]
我々は、知識グラフ(KG)におけるシングルホップおよびマルチホップ推論のための最初の汎用フレームワークであるスケーラブルなマルチホップ推論(SMORE)を提案する。シングルマシンのSMOREはFreebase KG(86Mエンティティ、338Mエッジ)でマルチホップ推論を行うことができる。 SMOREは、従来のマルチホップKGフレームワークよりもスループット(トレーニング速度)を、最小のGPUメモリ要件で2.2倍向上させる。
論文参考訳（メタデータ） (2021-10-28T05:02:33Z)
Codabench: Flexible, Easy-to-Use and Reproducible Benchmarking for Everyone [45.673814384050004]
Codabenchは、データセットやタスクに対して、アルゴリズムやソフトウェアエージェントをベンチマークするための、オープンソースでコミュニティ主導のプラットフォームです。 Codabenchのパブリックインスタンスは誰でも無料で公開されている。
論文参考訳（メタデータ） (2021-10-12T07:54:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。