Fugu-MT 論文翻訳(概要): OODTE: A Differential Testing Engine for the ONNX Optimizer

論文の概要: OODTE: A Differential Testing Engine for the ONNX Optimizer

arxiv url: http://arxiv.org/abs/2505.01892v2
Date: Sun, 01 Jun 2025 18:58:34 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-03 16:22:43.33753
Title: OODTE: A Differential Testing Engine for the ONNX Optimizer
Title（参考訳）: OODTE: ONNXオプティマイザのための差分テストエンジン
Authors: Nikolaos Louloudakis, Ajitha Rajan,
Abstract要約: ONNXは、ONNXモデルにグラフベースの最適化を適用するためのデフォルトツールである。広く使われているにもかかわらず、最適化中にモデルの精度を維持する能力は十分に研究されていない。 OODTEは,ONNXの正しさを自動的かつ包括的に評価するユーティリティである。
参考スコア（独自算出の注目度）: 2.6754376830313817
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: With over 700 stars on GitHub and being part of the official ONNX repository, the ONNX Optimizer is the default tool for applying graph-based optimizations to ONNX models. Despite its widespread use, its ability to maintain model accuracy during optimization has not been thoroughly investigated. In this work, we present OODTE, a utility designed to automatically and comprehensively evaluate the correctness of the ONNX Optimizer. OODTE adopts a straightforward yet powerful differential testing and evaluation methodology, which can be readily adapted for use with other compiler optimizers. Specifically, OODTE takes a collection of ONNX models, applies optimizations, and executes both the original and optimized versions across a user-defined input set, automatically capturing any issues encountered during optimization. When discrepancies in accuracy arise, OODTE iteratively isolates the responsible optimization pass by repeating the process at a finer granularity. We applied OODTE to 130 well-known models from the official ONNX Model Hub, spanning diverse tasks including classification, object detection, semantic segmentation, text summarization, question answering, and sentiment analysis. Our evaluation revealed that 9.2% of the model instances either caused the optimizer to crash or led to the generation of invalid models using default optimization strategies. Additionally, 30% of classification models and 16.6% of object detection and segmentation models exhibited differing outputs across original and optimized versions, whereas models focused on text-related tasks were generally robust to optimization. OODTE uncovered 15 issues-14 previously unknown-affecting 9 of 47 optimization passes and the optimizer overall. All issues were reported to the ONNX Optimizer team. OODTE offers a simple but effective framework for validating AI model optimizers, applicable beyond the ONNX ecosystem.
Abstract（参考訳）: GitHubには700以上のスターがいて、公式のONNXリポジトリの一部であるため、ONNX Optimizerは、ONNXモデルにグラフベースの最適化を適用するデフォルトツールである。広く使われているにもかかわらず、最適化中にモデルの精度を維持する能力は十分に研究されていない。本稿では,ONNXオプティマイザの正しさを自動的かつ包括的に評価するユーティリティOODTEを提案する。 OODTEは単純だが強力な差分テストと評価手法を採用しており、他のコンパイラオプティマイザで簡単に使用することができる。具体的には、OODTEはONNXモデルのコレクションを取得し、最適化を適用し、ユーザ定義の入力セットでオリジナルバージョンと最適化バージョンの両方を実行し、最適化中に遭遇した問題を自動的にキャプチャする。精度の相違が発生すると、OODTEはプロセスがより細かい粒度で繰り返すことによって、責任ある最適化パスを反復的に分離する。我々はOODTEをONNX Model Hubから有名な130のモデルに適用し、分類、オブジェクト検出、セマンティックセグメンテーション、テキスト要約、質問応答、感情分析など様々なタスクを網羅した。評価の結果、モデルインスタンスの9.2%がオプティマイザをクラッシュさせたり、デフォルトの最適化戦略を使って無効なモデルを生成する結果となった。さらに、分類モデルの30%と、オブジェクト検出とセグメンテーションモデルの16.6%は、オリジナルのバージョンと最適化されたバージョンで異なる出力を示した。 OODTEは、47の最適化パスのうち9つの未知の14のイシューと全体的なオプティマイザを発見した。すべての問題はONNXオプティマイザーチームに報告された。 OODTEは、ONNXエコシステムを越えて適用可能な、AIモデルのオプティマイザを検証するための、シンプルだが効果的なフレームワークを提供する。

関連論文リスト

Decoding-Time Language Model Alignment with Multiple Objectives [116.42095026960598]
既存の手法は主に、1つの報酬関数に対してLMを最適化することに集中し、それらの適応性は様々な目的に制限される。本稿では,予測の線形結合から次のトークンを出力する復号時間アルゴリズムである$textbfmulti-objective decoding (MOD)$を提案する。提案手法は, 自然条件下であっても, 既存のアプローチが準最適であることを示すとともに, 提案手法の最適性を保証する。
論文参考訳（メタデータ） (2024-06-27T02:46:30Z)
ReNO: Enhancing One-step Text-to-Image Models through Reward-based Noise Optimization [59.72782742378666]
本稿では,Reward-based Noise Optimization (ReNO) を提案する。 20-50秒の計算予算の中で、ReNOによって強化されたワンステップモデルは、現在のすべてのオープンソーステキスト・トゥ・イメージ・モデルの性能を一貫して上回った。
論文参考訳（メタデータ） (2024-06-06T17:56:40Z)
Reward Model Ensembles Help Mitigate Overoptimization [7.715463015544845]
RLHF(Reinforcement Learning from Human feedback)は、大規模言語モデルを微調整して指示に従うための標準手法である。真の」報酬の完全な表現として、学習された報酬モデルは過度に最適化される。
論文参考訳（メタデータ） (2023-10-04T11:34:22Z)
Optimizer's Information Criterion: Dissecting and Correcting Bias in Data-Driven Optimization [16.57676001669012]
データ駆動最適化では、得られた決定のサンプル性能は通常、真の性能に対して楽観的なバイアスを生じさせる。クロスバリデーションのような、このバイアスを修正するための一般的なテクニックは、追加の最適化問題を繰り返し解決する必要があるため、コストがかかる。我々は一階偏差を直接近似する一般バイアス補正手法を開発し、追加の最適化問題を解く必要はない。
論文参考訳（メタデータ） (2023-06-16T07:07:58Z)
Estimate-Then-Optimize versus Integrated-Estimation-Optimization versus Sample Average Approximation: A Stochastic Dominance Perspective [15.832111591654293]
モデルクラスが十分に特定され、十分なデータが存在する場合に、逆の振る舞いが現れることを示す。また, 標準サンプル平均近似 (SAA) が, 後悔の点において, モデルクラスが適切に特定された場合に, 最悪の結果をもたらすことを示す。
論文参考訳（メタデータ） (2023-04-13T21:54:53Z)
Judging Adam: Studying the Performance of Optimization Methods on ML4SE Tasks [2.8961929092154697]
ソースコードの深層学習モデルを用いて各種の性能を検証した。 Anaheadの選択は、モデルの品質に大きな影響を与えます。 ML4SEコミュニティは、コード関連のディープラーニングタスクのデフォルトとして、Adamを使うべきだ、と提案する。
論文参考訳（メタデータ） (2023-03-06T22:49:20Z)
VeLO: Training Versatile Learned Optimizers by Scaling Up [67.90237498659397]
私たちは、ディープラーニングの成功の背後にある同じスケーリングアプローチを活用して、汎用性を学びます。私たちは、パラメータの更新を取り込み出力する小さなニューラルネットワークであるディープラーニングのためのインジェクションをトレーニングします。学習したメタトレーニングコード、関連するトレインテストデータ、およびvelo-code.ioのベースラインを備えた広範なベンチマークスイートをオープンソースとして公開しています。
論文参考訳（メタデータ） (2022-11-17T18:39:07Z)
MMO: Meta Multi-Objectivization for Software Configuration Tuning [5.716481441755875]
補助的な性能目標を考慮したメタ多目的化(MMO)モデルを提案する。重みを気にせずにMMOモデルを効果的に活用する方法を示す。
論文参考訳（メタデータ） (2021-12-14T11:21:24Z)
Conservative Objective Models for Effective Offline Model-Based Optimization [78.19085445065845]
計算設計の問題は、合成生物学からコンピュータアーキテクチャまで、様々な場面で発生している。本研究では,分布外入力に対する接地的目標の実際の値を低くする目的関数のモデルを学習する手法を提案する。 COMは、様々なMBO問題に対して、既存のメソッドの実装と性能の面では単純である。
論文参考訳（メタデータ） (2021-07-14T17:55:28Z)
Fast Rates for Contextual Linear Optimization [52.39202699484225]
提案手法は, 下流決定性能を直接最適化する手法よりもはるかに高速な, 後悔の収束率を実現する。予測モデルは、既存のツールを使ったトレーニングが簡単かつ高速で、解釈が簡単で、私たちが示しているように、非常にうまく機能する決定につながる。
論文参考訳（メタデータ） (2020-11-05T18:43:59Z)
Neural Model-based Optimization with Right-Censored Observations [42.530925002607376]
ニューラルネットワーク(NN)は、モデルベースの最適化手順のコアでうまく機能することが実証されている。トレーニングされた回帰モデルは,いくつかのベースラインよりも優れた予測品質が得られることを示す。
論文参考訳（メタデータ） (2020-09-29T07:32:30Z)
Bayesian Optimization for Selecting Efficient Machine Learning Models [53.202224677485525]
本稿では,予測効率とトレーニング効率の両面において,モデルを協調最適化するための統一ベイズ最適化フレームワークを提案する。レコメンデーションタスクのためのモデル選択の実験は、この方法で選択されたモデルがモデルのトレーニング効率を大幅に改善することを示している。
論文参考訳（メタデータ） (2020-08-02T02:56:30Z)
Daydream: Accurately Estimating the Efficacy of Optimizations for DNN Training [8.157520622932374]
プロファイリングツールは、“最適化Xは私のモデルの性能にどのように影響するのか? プログラマがDNN最適化の有効性を効率的に探求するのに役立つ新しいプロファイリングツールであるDaydreamを提案する。本研究では,Daydreamが主流のDNN最適化手法をモデル化し,性能改善をもたらす最適化の有効性を正確に予測できることを示す。
論文参考訳（メタデータ） (2020-06-05T09:08:16Z)
ENTMOOT: A Framework for Optimization over Ensemble Tree Models [57.98561336670884]
ENTMOOTは、ツリーモデルをより大きな最適化問題に統合するためのフレームワークである。 ENTMOOTは、ツリーモデルの意思決定とブラックボックス最適化への単純な統合を可能にしていることを示す。
論文参考訳（メタデータ） (2020-03-10T14:34:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。