Fugu-MT 論文翻訳(概要): An Empirical Study of Challenges in Converting Deep Learning Models

論文の概要: An Empirical Study of Challenges in Converting Deep Learning Models

arxiv url: http://arxiv.org/abs/2206.14322v1
Date: Tue, 28 Jun 2022 23:18:37 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-30 20:23:51.261057
Title: An Empirical Study of Challenges in Converting Deep Learning Models
Title（参考訳）: ディープラーニングモデル変換における課題の実証的研究
Authors: Moses Openja, Amin Nikanjam, Ahmed Haj Yahmed, Foutse Khomh, Zhen Ming (Jack) Jiang
Abstract要約: 我々は、訓練されたディープラーニングモデルを変換するために、ONNXとCoreMLを評価するための最初の実証的研究を行う。この結果から,変換モデルの予測精度は原文と同程度であることが判明した。変換モデルは一般的に、原文の同じレベルで堅牢であると評価される。
参考スコア（独自算出の注目度）: 15.521925194920893
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: There is an increase in deploying Deep Learning (DL)-based software systems in real-world applications. Usually DL models are developed and trained using DL frameworks that have their own internal mechanisms/formats to represent and train DL models, and usually those formats cannot be recognized by other frameworks. Moreover, trained models are usually deployed in environments different from where they were developed. To solve the interoperability issue and make DL models compatible with different frameworks/environments, some exchange formats are introduced for DL models, like ONNX and CoreML. However, ONNX and CoreML were never empirically evaluated by the community to reveal their prediction accuracy, performance, and robustness after conversion. Poor accuracy or non-robust behavior of converted models may lead to poor quality of deployed DL-based software systems. We conduct, in this paper, the first empirical study to assess ONNX and CoreML for converting trained DL models. In our systematic approach, two popular DL frameworks, Keras and PyTorch, are used to train five widely used DL models on three popular datasets. The trained models are then converted to ONNX and CoreML and transferred to two runtime environments designated for such formats, to be evaluated. We investigate the prediction accuracy before and after conversion. Our results unveil that the prediction accuracy of converted models are at the same level of originals. The performance (time cost and memory consumption) of converted models are studied as well. The size of models are reduced after conversion, which can result in optimized DL-based software deployment. Converted models are generally assessed as robust at the same level of originals. However, obtained results show that CoreML models are more vulnerable to adversarial attacks compared to ONNX.
Abstract（参考訳）: 現実世界のアプリケーションにディープラーニング(DL)ベースのソフトウェアシステムのデプロイが増加している。通常、DLモデルは、DLモデルを表現し、訓練するための独自の内部メカニズム/フォーマットを持つDLフレームワークを使用して開発され、訓練される。さらに、訓練されたモデルは、通常、開発場所とは異なる環境でデプロイされる。相互運用性の問題を解決し、異なるフレームワーク/環境とDLモデルを互換性を持たせるために、ONNXやCoreMLのようなDLモデルにいくつかの交換フォーマットが導入されている。しかし、ONNXとCoreMLは、変換後の予測精度、性能、堅牢性を明らかにするために、コミュニティによって実験的に評価されなかった。変換されたモデルの粗悪な精度や非破壊的な振る舞いは、DLベースのソフトウェアシステムの品質の低下につながる可能性がある。本稿では,ONNX と CoreML を訓練された DL モデルを変換するための実験的検討を行った。私たちの体系的なアプローチでは、KerasとPyTorchという2つの人気のあるDLフレームワークを使用して、3つの人気のあるデータセット上で5つの広く使われているDLモデルをトレーニングしています。トレーニングされたモデルはONNXとCoreMLに変換され、そのようなフォーマット用に指定された2つのランタイム環境に変換され、評価される。変換前後の予測精度について検討する。その結果,変換モデルの予測精度は原文と同程度であることが判明した。また,変換モデルの性能(時間コストとメモリ消費)についても検討した。モデルのサイズは変換後に縮小され、DLベースのソフトウェアデプロイメントが最適化される可能性がある。変換モデルは一般的に、同じオリジナルレベルで堅牢であると評価される。しかし,ONNXと比較してCoreMLモデルは敵攻撃に対して脆弱であることがわかった。

関連論文リスト

Approximating Language Model Training Data from Weights [70.08614275061689]
モデル重みからデータ近似の問題を定式化し、いくつかのベースラインとメトリクスを提案する。そこで我々は,大規模公開テキストコーパスから最高のマッチングデータを選択する勾配に基づく手法を開発した。真のトレーニングデータがない場合でも、我々の方法では、公開Webドキュメントの小さなサブセットを見つけることができる。
論文参考訳（メタデータ） (2025-06-18T15:26:43Z)
LLäMmlein: Transparent, Compact and Competitive German-Only Language Models from Scratch [3.7160688974577156]
我々は、2つのドイツ専用デコーダモデル、LL"aMmlein 120Mと1Bを作成し、それらをスクラッチから透過的に公開し、トレーニングデータとともに、ドイツのNLP研究コミュニティが使用できるようにしました。モデルトレーニングには、広範なデータ前処理、カスタムなドイツのトークン化器の作成、トレーニング自体、および様々なベンチマークの最終モデルの評価など、いくつかの重要なステップが含まれていた。
論文参考訳（メタデータ） (2024-11-17T20:44:34Z)
Foundational GPT Model for MEG [3.524869467682149]
本研究では,脳信号の予測を用いて学習可能な2種類のディープラーニング基礎モデルを提案する。まず、改良されたWavenetを検討し、次に、改良されたTransformer-based (GPT2)モデルを検討する。我々は,これらのディープラーニングモデルの性能を,MEGデータに基づく標準的な線形自己回帰(AR)モデルと比較する。
論文参考訳（メタデータ） (2024-04-14T13:48:24Z)
MatFormer: Nested Transformer for Elastic Inference [94.1789252941718]
MatFormerは、様々なデプロイメント制約で弾力性を提供するように設計されたネストトランスフォーマーアーキテクチャである。 2.6BデコーダのみのMatFormer言語モデル(MatLM)は1.5Bから2.6Bまでの小さなモデルを抽出できることを示す。また,MatFormerベースのViT(MatViT)エンコーダから抽出した小さなエンコーダは,適応的な大規模検索のための距離空間構造を保持する。
論文参考訳（メタデータ） (2023-10-11T17:57:14Z)
MGit: A Model Versioning and Management System [7.2678752235785735]
MGitはモデルバージョニングと管理システムであり、モデルデリバティブの保存、テスト、更新、コラボレーションを容易にする。 MGitは、ライングラフのストレージフットプリントを最大7倍に削減し、アップストリームモデルの更新に応じて、ダウンストリームモデルを自動的に更新する。
論文参考訳（メタデータ） (2023-07-14T17:56:48Z)
Analysis of Failures and Risks in Deep Learning Model Converters: A Case Study in the ONNX Ecosystem [3.0307714495180895]
本稿では,ディープラーニング(DL)モデルコンバータの故障を解析する。私たちは、DL相互運用性ツール、ユースケース、問題点についてソフトウェアエンジニアを調査します。モデル変換器のノード変換段階が欠陥の75%を占め、報告された障害の33%が意味的に誤りのあるモデルと関連していることがわかった。
論文参考訳（メタデータ） (2023-03-30T21:00:38Z)
Predictable MDP Abstraction for Unsupervised Model-Based RL [93.91375268580806]
予測可能なMDP抽象化(PMA)を提案する。元のMDPで予測モデルを訓練する代わりに、学習されたアクション空間を持つ変換MDPでモデルを訓練する。我々はPMAを理論的に解析し、PMAが以前の教師なしモデルベースRLアプローチよりも大幅に改善することを示す。
論文参考訳（メタデータ） (2023-02-08T07:37:51Z)
Dataless Knowledge Fusion by Merging Weights of Language Models [51.8162883997512]
微調整された事前学習言語モデルは、下流のNLPモデルを構築するための主要なパラダイムとなっている。これは、より優れた単一モデルを生み出すために、個々のモデル間で知識を融合させる障壁を生み出します。パラメータ空間のモデルをマージするデータレス知識融合法を提案する。
論文参考訳（メタデータ） (2022-12-19T20:46:43Z)
An Empirical Study of Deep Learning Models for Vulnerability Detection [4.243592852049963]
我々は、広く使われている2つの脆弱性検出データセット上で、最先端の9つのディープラーニングモデルを調査し、再現した。モデル能力,トレーニングデータ,モデル解釈について検討した。我々の研究結果は、モデル結果の理解を深め、トレーニングデータ作成のガイダンスを提供し、モデルの堅牢性を向上させるのに役立つ。
論文参考訳（メタデータ） (2022-12-15T19:49:34Z)
Revealing Secrets From Pre-trained Models [2.0249686991196123]
トランスファーラーニングは多くの新しいディープラーニングアルゴリズムで広く採用されている。本研究では,事前学習モデルと微調整モデルが重み値に非常によく似ていることを示す。ブラックボックスの被害者モデルで使用されるモデルアーキテクチャと事前訓練モデルを明らかにするモデル抽出攻撃を提案する。
論文参考訳（メタデータ） (2022-07-19T20:19:03Z)
Integrated Training for Sequence-to-Sequence Models Using Non-Autoregressive Transformer [49.897891031932545]
本稿では,非自己回帰変換器をベースとしたケースドモデルを提案する。我々は、ピボットベースの2つの機械翻訳タスク、すなわち、フランス語-ドイツ語とドイツ語-チェコ語について評価を行う。
論文参考訳（メタデータ） (2021-09-27T11:04:09Z)
CorDEL: A Contrastive Deep Learning Approach for Entity Linkage [70.82533554253335]
エンティティリンケージ(EL)は、データのクリーニングと統合において重要な問題である。新たなデータの増加に伴い、ディープラーニング(DL)ベースのアプローチが提案され、従来のモデルに付随するELの高コスト化が図られている。我々は、ツインネットワークアーキテクチャはELに準最適であり、既存のモデルに固有の欠点をもたらすと主張している。
論文参考訳（メタデータ） (2020-09-15T16:33:05Z)
Do Adversarially Robust ImageNet Models Transfer Better? [102.09335596483695]
逆向きに堅牢なモデルは、トランスファーラーニングに使用する場合、標準訓練されたモデルよりもよく機能する。私たちの結果は、ロバストさが機能表現の改善につながるという最近の仮説と一致しています。
論文参考訳（メタデータ） (2020-07-16T17:42:40Z)
Model Reuse with Reduced Kernel Mean Embedding Specification [70.044322798187]
現在のアプリケーションで有用なモデルを見つけるための2段階のフレームワークを提案する。アップロードフェーズでは、モデルがプールにアップロードされている場合、モデルの仕様としてカーネル平均埋め込み(RKME)を縮小する。デプロイフェーズでは、RKME仕様の値に基づいて、現在のタスクと事前訓練されたモデルの関連性を測定する。
論文参考訳（メタデータ） (2020-01-20T15:15:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。