Fugu-MT 論文翻訳(概要): OODTE: A Differential Testing Engine for the ONNX Optimizer

論文の概要: OODTE: A Differential Testing Engine for the ONNX Optimizer

arxiv url: http://arxiv.org/abs/2505.01892v1
Date: Sat, 03 May 2025 18:54:30 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-06 18:49:35.321509
Title: OODTE: A Differential Testing Engine for the ONNX Optimizer
Title（参考訳）: OODTE: ONNXオプティマイザのための差分テストエンジン
Authors: Nikolaos Louloudakis, Ajitha Rajan,
Abstract要約: OODTEは単純で効果的な差分テストと評価のアプローチに従う。我々は15の問題を検知した。そのうち14は以前にも知られていなかったもので、クラッシュと精度の偏差に関連していた。
参考スコア（独自算出の注目度）: 2.6754376830313817
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: With $700$ stars on GitHub and part of the official ONNX repository, the ONNX Optimizer consists of the standard method to apply graph-based optimizations on ONNX models. However, its ability to preserve model accuracy across optimizations, has not been rigorously explored. We propose OODTE, a utility to automatically and thoroughly assess the correctness of the ONNX Optimizer. OODTE follows a simple, yet effective differential testing and evaluation approach that can be easily adopted to other compiler optimizers. In particular, OODTE utilizes a number of ONNX models, then optimizes them and executes both the original and the optimized variants across a user-defined set of inputs, while automatically logging any issues with the optimization process. Finally, for successfully optimized models, OODTE compares the results, and, if any accuracy deviations are observed, it iteratively repeats the process for each pass of the ONNX Optimizer, to localize the root cause of the differences observed. Using OODTE, we sourced well-known $130$ models from the official ONNX Model Hub, used for a wide variety of tasks (classification, object detection, semantic segmentation, text summarization, question and answering, sentiment analysis) from the official ONNX model hub. We detected 15 issues, 14 of which were previously unknown, associated with optimizer crashes and accuracy deviations. We also observed $9.2$% of all model instances presenting issues leading into the crash of the optimizer, or the generation of an invalid model while using the primary optimizer strategies. In addition, $30$% of the classification models presented accuracy differences across the original and the optimized model variants, while $16.6$% of semantic segmentation and object detection models are also affected, at least to a limited extent.
Abstract（参考訳）: GitHubに700ドルのスターと公式のONNXリポジトリの一部として、ONNX Optimizerは、ONNXモデルにグラフベースの最適化を適用するための標準メソッドで構成されている。しかし、最適化全体にわたってモデルの精度を維持する能力は、厳密に研究されていない。 OODTEは,ONNXオプティマイザの正当性を自動的かつ徹底的に評価するユーティリティである。 OODTEは、他のコンパイラオプティマイザにも容易に適用可能な、シンプルで効果的な差分テストと評価のアプローチに従っている。特にOODTEは、複数のONNXモデルを使用し、最適化し、ユーザ定義の入力セットにまたがってオリジナルと最適化された変種の両方を実行し、最適化プロセスで問題を自動的にログする。最後に、OODTEは結果を比較し、精度のずれが観測された場合、ONNXオプティマイザの各パスのプロセスを反復的に繰り返し、観察された違いの根本原因をローカライズする。 OODTEを使用して、ONNXモデルハブからよく知られた13,000ドルのモデル(分類、オブジェクト検出、セマンティックセグメンテーション、テキスト要約、質問と回答、感情分析)を、ONNXモデルハブからソースしました。我々は15の問題を検知した。そのうち14は以前にも知られていなかったもので、最適化器のクラッシュと精度の偏差に関連していた。また、主要なオプティマイザ戦略を使用しながら、オプティマイザのクラッシュや無効なモデルの生成につながる問題を示すすべてのモデルインスタンスの9.2$%も観察した。さらに、分類モデルの30ドル%はオリジナルのモデルと最適化されたモデルの精度の違いを示しており、セマンティックセグメンテーションとオブジェクト検出モデルの16.6ドル%も影響を受けている。

関連論文リスト

Decoding-Time Language Model Alignment with Multiple Objectives [116.42095026960598]
既存の手法は主に、1つの報酬関数に対してLMを最適化することに集中し、それらの適応性は様々な目的に制限される。本稿では,予測の線形結合から次のトークンを出力する復号時間アルゴリズムである$textbfmulti-objective decoding (MOD)$を提案する。提案手法は, 自然条件下であっても, 既存のアプローチが準最適であることを示すとともに, 提案手法の最適性を保証する。
論文参考訳（メタデータ） (2024-06-27T02:46:30Z)
ReNO: Enhancing One-step Text-to-Image Models through Reward-based Noise Optimization [59.72782742378666]
本稿では,Reward-based Noise Optimization (ReNO) を提案する。 20-50秒の計算予算の中で、ReNOによって強化されたワンステップモデルは、現在のすべてのオープンソーステキスト・トゥ・イメージ・モデルの性能を一貫して上回った。
論文参考訳（メタデータ） (2024-06-06T17:56:40Z)
Reward Model Ensembles Help Mitigate Overoptimization [7.715463015544845]
RLHF(Reinforcement Learning from Human feedback)は、大規模言語モデルを微調整して指示に従うための標準手法である。真の」報酬の完全な表現として、学習された報酬モデルは過度に最適化される。
論文参考訳（メタデータ） (2023-10-04T11:34:22Z)
Optimizer's Information Criterion: Dissecting and Correcting Bias in Data-Driven Optimization [16.57676001669012]
データ駆動最適化では、得られた決定のサンプル性能は通常、真の性能に対して楽観的なバイアスを生じさせる。クロスバリデーションのような、このバイアスを修正するための一般的なテクニックは、追加の最適化問題を繰り返し解決する必要があるため、コストがかかる。我々は一階偏差を直接近似する一般バイアス補正手法を開発し、追加の最適化問題を解く必要はない。
論文参考訳（メタデータ） (2023-06-16T07:07:58Z)
Estimate-Then-Optimize versus Integrated-Estimation-Optimization versus Sample Average Approximation: A Stochastic Dominance Perspective [15.832111591654293]
モデルクラスが十分に特定され、十分なデータが存在する場合に、逆の振る舞いが現れることを示す。また, 標準サンプル平均近似 (SAA) が, 後悔の点において, モデルクラスが適切に特定された場合に, 最悪の結果をもたらすことを示す。
論文参考訳（メタデータ） (2023-04-13T21:54:53Z)
Judging Adam: Studying the Performance of Optimization Methods on ML4SE Tasks [2.8961929092154697]
ソースコードの深層学習モデルを用いて各種の性能を検証した。 Anaheadの選択は、モデルの品質に大きな影響を与えます。 ML4SEコミュニティは、コード関連のディープラーニングタスクのデフォルトとして、Adamを使うべきだ、と提案する。
論文参考訳（メタデータ） (2023-03-06T22:49:20Z)
VeLO: Training Versatile Learned Optimizers by Scaling Up [67.90237498659397]
私たちは、ディープラーニングの成功の背後にある同じスケーリングアプローチを活用して、汎用性を学びます。私たちは、パラメータの更新を取り込み出力する小さなニューラルネットワークであるディープラーニングのためのインジェクションをトレーニングします。学習したメタトレーニングコード、関連するトレインテストデータ、およびvelo-code.ioのベースラインを備えた広範なベンチマークスイートをオープンソースとして公開しています。
論文参考訳（メタデータ） (2022-11-17T18:39:07Z)
MMO: Meta Multi-Objectivization for Software Configuration Tuning [5.716481441755875]
補助的な性能目標を考慮したメタ多目的化(MMO)モデルを提案する。重みを気にせずにMMOモデルを効果的に活用する方法を示す。
論文参考訳（メタデータ） (2021-12-14T11:21:24Z)
Conservative Objective Models for Effective Offline Model-Based Optimization [78.19085445065845]
計算設計の問題は、合成生物学からコンピュータアーキテクチャまで、様々な場面で発生している。本研究では,分布外入力に対する接地的目標の実際の値を低くする目的関数のモデルを学習する手法を提案する。 COMは、様々なMBO問題に対して、既存のメソッドの実装と性能の面では単純である。
論文参考訳（メタデータ） (2021-07-14T17:55:28Z)
Fast Rates for Contextual Linear Optimization [52.39202699484225]
提案手法は, 下流決定性能を直接最適化する手法よりもはるかに高速な, 後悔の収束率を実現する。予測モデルは、既存のツールを使ったトレーニングが簡単かつ高速で、解釈が簡単で、私たちが示しているように、非常にうまく機能する決定につながる。
論文参考訳（メタデータ） (2020-11-05T18:43:59Z)
Neural Model-based Optimization with Right-Censored Observations [42.530925002607376]
ニューラルネットワーク(NN)は、モデルベースの最適化手順のコアでうまく機能することが実証されている。トレーニングされた回帰モデルは,いくつかのベースラインよりも優れた予測品質が得られることを示す。
論文参考訳（メタデータ） (2020-09-29T07:32:30Z)
Bayesian Optimization for Selecting Efficient Machine Learning Models [53.202224677485525]
本稿では,予測効率とトレーニング効率の両面において,モデルを協調最適化するための統一ベイズ最適化フレームワークを提案する。レコメンデーションタスクのためのモデル選択の実験は、この方法で選択されたモデルがモデルのトレーニング効率を大幅に改善することを示している。
論文参考訳（メタデータ） (2020-08-02T02:56:30Z)
Daydream: Accurately Estimating the Efficacy of Optimizations for DNN Training [8.157520622932374]
プロファイリングツールは、“最適化Xは私のモデルの性能にどのように影響するのか? プログラマがDNN最適化の有効性を効率的に探求するのに役立つ新しいプロファイリングツールであるDaydreamを提案する。本研究では,Daydreamが主流のDNN最適化手法をモデル化し,性能改善をもたらす最適化の有効性を正確に予測できることを示す。
論文参考訳（メタデータ） (2020-06-05T09:08:16Z)
ENTMOOT: A Framework for Optimization over Ensemble Tree Models [57.98561336670884]
ENTMOOTは、ツリーモデルをより大きな最適化問題に統合するためのフレームワークである。 ENTMOOTは、ツリーモデルの意思決定とブラックボックス最適化への単純な統合を可能にしていることを示す。
論文参考訳（メタデータ） (2020-03-10T14:34:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。