論文の概要: Capabilities for Better ML Engineering
- arxiv url: http://arxiv.org/abs/2211.06409v1
- Date: Fri, 11 Nov 2022 18:50:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 16:59:41.436899
- Title: Capabilities for Better ML Engineering
- Title(参考訳): より良いMLエンジニアリングのための能力
- Authors: Chenyang Yang, Rachel Brower-Sinning, Grace A. Lewis, Christian
K\"astner and Tongshuang Wu
- Abstract要約: MLモデルの振る舞いにきめ細かい仕様を使用する機能ベースのフレームワークを構想する。
具体的なシナリオを使用して、さまざまな次元にわたる幅広いアプリケーションの機能を明確に表現します。
MLエンジニアリングプロセスのガイダンスを提供するモデル一般化可能性を反映する能力の可能性を示す。
- 参考スコア(独自算出の注目度): 32.02809335330209
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In spite of machine learning's rapid growth, its engineering support is
scattered in many forms, and tends to favor certain engineering stages,
stakeholders, and evaluation preferences. We envision a capability-based
framework, which uses fine-grained specifications for ML model behaviors to
unite existing efforts towards better ML engineering. We use concrete scenarios
(model design, debugging, and maintenance) to articulate capabilities' broad
applications across various different dimensions, and their impact on building
safer, more generalizable and more trustworthy models that reflect human needs.
Through preliminary experiments, we show capabilities' potential for reflecting
model generalizability, which can provide guidance for ML engineering process.
We discuss challenges and opportunities for capabilities' integration into ML
engineering.
- Abstract(参考訳): 機械学習の急速な成長にもかかわらず、そのエンジニアリングサポートは多くの形態に分散しており、特定のエンジニアリングステージ、利害関係者、評価好みを好む傾向がある。
我々は、MLモデルの振る舞いのきめ細かい仕様を使用して、MLエンジニアリングの改善に向けた既存の取り組みを統合する能力ベースのフレームワークを構想する。
私たちは具体的なシナリオ(モデル設計、デバッギング、メンテナンス)を使用して、さまざまな次元にわたる能力の幅広いアプリケーションと、人間のニーズを反映した、より安全で汎用的で信頼性の高いモデルの構築への影響を明確化しています。
予備実験を通じて、MLエンジニアリングプロセスのガイダンスを提供するモデル一般化可能性の反映能力を示す。
MLエンジニアリングへの機能統合の課題と機会について論じる。
関連論文リスト
- On the Exploration of LM-Based Soft Modular Robot Design [26.847859137653487]
大規模言語モデル(LLM)は、現実世界の知識をモデル化する上で有望な能力を示した。
本稿では,LLMを用いてソフトモジュールロボットの設計を支援する可能性について検討する。
本モデルは,一方向・二方向・階段移動機能を有するソフトモジュールロボットの設計において,優れた評価性能を発揮する。
論文 参考訳(メタデータ) (2024-11-01T04:03:05Z) - On the Modeling Capabilities of Large Language Models for Sequential Decision Making [52.128546842746246]
大規模な事前訓練されたモデルでは、推論や計画タスクのパフォーマンスがますます向上している。
我々は、直接的または間接的に、意思決定ポリシーを作成する能力を評価する。
未知の力学を持つ環境において、合成データを用いた微調整LDMが報酬モデリング能力を大幅に向上させる方法について検討する。
論文 参考訳(メタデータ) (2024-10-08T03:12:57Z) - LLAVADI: What Matters For Multimodal Large Language Models Distillation [77.73964744238519]
本研究では,新しい効率的なモデル構造を提案するのではなく,スクラッチから小規模MLLMを訓練する。
本研究は, 知識蒸留プロセスにおける学習戦略, モデル選択, 蒸留アルゴリズムに関するものである。
異なるベンチマークと適切な戦略を評価することで、2.7Bの小型モデルでも7Bまたは13Bのパラメータを持つ大型モデルと同等に動作することができる。
論文 参考訳(メタデータ) (2024-07-28T06:10:47Z) - Large Language Model Agent as a Mechanical Designer [7.136205674624813]
本研究では,FEMモジュールと事前学習LLMを統合する新しい手法を提案する。
FEMモジュールはそれぞれの設計を評価し、重要なフィードバックを提供し、LLMにドメイン固有のトレーニングを必要とせずに継続的に学習し、計画し、生成し、設計を最適化するよう指示する。
その結果, LLMをベースとしたエージェントは, 自然言語仕様に準拠したトラスを最大90%の確率で生成できることがわかった。
論文 参考訳(メタデータ) (2024-04-26T16:41:24Z) - MLCopilot: Unleashing the Power of Large Language Models in Solving
Machine Learning Tasks [31.733088105662876]
我々は、新しいフレームワークを導入することで、機械学習と人間の知識のギャップを埋めることを目指している。
本稿では、構造化された入力を理解するためのLLMの能力を拡張し、新しいMLタスクを解くための徹底的な推論を行う可能性を示す。
論文 参考訳(メタデータ) (2023-04-28T17:03:57Z) - Scaling Vision-Language Models with Sparse Mixture of Experts [128.0882767889029]
提案手法は, 等価計算コストの高密度モデルに対して, 様々なベンチマークにおいて, 最先端性能を実現することができることを示す。
我々の研究は、MoEモデルのトレーニングの安定化、モデル解釈可能性に対するMoEの影響の理解、ビジョン言語モデルをスケールする際の計算性能間のトレードオフのバランスに関する貴重な洞察を提供する。
論文 参考訳(メタデータ) (2023-03-13T16:00:31Z) - Enabling Automated Machine Learning for Model-Driven AI Engineering [60.09869520679979]
モデル駆動型ソフトウェアエンジニアリングとモデル駆動型AIエンジニアリングを実現するための新しいアプローチを提案する。
特に、私たちはAutomated MLをサポートし、AI集約システムの開発において、AIの深い知識のないソフトウェアエンジニアを支援します。
論文 参考訳(メタデータ) (2022-03-06T10:12:56Z) - Panoramic Learning with A Standardized Machine Learning Formalism [116.34627789412102]
本稿では,多様なMLアルゴリズムの統一的な理解を提供する学習目的の標準化された方程式を提案する。
また、新しいMLソリューションのメカニック設計のガイダンスも提供し、すべての経験を持つパノラマ学習に向けた有望な手段として機能する。
論文 参考訳(メタデータ) (2021-08-17T17:44:38Z) - Learning by Design: Structuring and Documenting the Human Choices in
Machine Learning Development [6.903929927172917]
本稿では,機械学習モデル作成における熟考と規範的選択を概説する8つの設計質問からなる手法を提案する。
本手法は,方法論的透明性を通じた批判的評価を支援するなど,いくつかの利点がある。
本手法は,MLモデルの開発において,ML実践者が選択や仮定を構造化し,正当化する上で有効であると考えている。
論文 参考訳(メタデータ) (2021-05-03T08:47:45Z) - Technology Readiness Levels for AI & ML [79.22051549519989]
機械学習システムの開発は、現代的なツールで容易に実行できるが、プロセスは通常急いで、エンドツーエンドで実行される。
エンジニアリングシステムは、高品質で信頼性の高い結果の開発を効率化するために、明確に定義されたプロセスとテスト標準に従います。
我々は、機械学習の開発と展開のための実証されたシステムエンジニアリングアプローチを提案する。
論文 参考訳(メタデータ) (2020-06-21T17:14:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。