Fugu-MT 論文翻訳(概要): Capabilities for Better ML Engineering

論文の概要: Capabilities for Better ML Engineering

arxiv url: http://arxiv.org/abs/2211.06409v1
Date: Fri, 11 Nov 2022 18:50:21 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-14 16:59:41.436899
Title: Capabilities for Better ML Engineering
Title（参考訳）: より良いMLエンジニアリングのための能力
Authors: Chenyang Yang, Rachel Brower-Sinning, Grace A. Lewis, Christian K\"astner and Tongshuang Wu
Abstract要約: MLモデルの振る舞いにきめ細かい仕様を使用する機能ベースのフレームワークを構想する。具体的なシナリオを使用して、さまざまな次元にわたる幅広いアプリケーションの機能を明確に表現します。 MLエンジニアリングプロセスのガイダンスを提供するモデル一般化可能性を反映する能力の可能性を示す。
参考スコア（独自算出の注目度）: 32.02809335330209
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In spite of machine learning's rapid growth, its engineering support is scattered in many forms, and tends to favor certain engineering stages, stakeholders, and evaluation preferences. We envision a capability-based framework, which uses fine-grained specifications for ML model behaviors to unite existing efforts towards better ML engineering. We use concrete scenarios (model design, debugging, and maintenance) to articulate capabilities' broad applications across various different dimensions, and their impact on building safer, more generalizable and more trustworthy models that reflect human needs. Through preliminary experiments, we show capabilities' potential for reflecting model generalizability, which can provide guidance for ML engineering process. We discuss challenges and opportunities for capabilities' integration into ML engineering.
Abstract（参考訳）: 機械学習の急速な成長にもかかわらず、そのエンジニアリングサポートは多くの形態に分散しており、特定のエンジニアリングステージ、利害関係者、評価好みを好む傾向がある。我々は、MLモデルの振る舞いのきめ細かい仕様を使用して、MLエンジニアリングの改善に向けた既存の取り組みを統合する能力ベースのフレームワークを構想する。私たちは具体的なシナリオ(モデル設計、デバッギング、メンテナンス)を使用して、さまざまな次元にわたる能力の幅広いアプリケーションと、人間のニーズを反映した、より安全で汎用的で信頼性の高いモデルの構築への影響を明確化しています。予備実験を通じて、MLエンジニアリングプロセスのガイダンスを提供するモデル一般化可能性の反映能力を示す。 MLエンジニアリングへの機能統合の課題と機会について論じる。

関連論文リスト

On Path to Multimodal Generalist: General-Level and General-Bench [153.9720740167528]
本稿では,MLLMの性能と汎用性を5段階に定義した評価フレームワークであるGeneral-Levelを紹介する。フレームワークの中核はSynergyの概念であり、モデルが理解と生成をまたいだ一貫性のある機能を維持するかどうかを測定する。既存の100以上のMLLMを含む評価結果は、ジェネラリストの能力ランキングを明らかにする。
論文参考訳（メタデータ） (2025-05-07T17:59:32Z)
Reflective Planning: Vision-Language Models for Multi-Stage Long-Horizon Robotic Manipulation [90.00687889213991]
複雑な長距離ロボット操作問題を解決するには、高度な高レベルの計画能力が必要である。インターネット上で事前訓練された視覚言語モデル(VLM)は、原則としてそのような問題に対処するためのフレームワークを提供する。本稿では,多段階操作タスクにおけるVLMの物理推論能力を高める新しいテストタイムフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-23T20:42:15Z)
Benchmarking Large and Small MLLMs [71.78055760441256]
大規模なマルチモーダル言語モデル(MLLM)は、マルチモーダルコンテンツの理解と生成において顕著な進歩を遂げている。しかし、そのデプロイメントは、遅い推論、高い計算コスト、デバイス上のアプリケーションに対する非現実性など、重大な課題に直面している。 LLavaシリーズモデルとPhi-3-Visionによって実証された小さなMLLMは、より高速な推論、デプロイメントコストの削減、ドメイン固有のシナリオを扱う能力を備えた有望な代替手段を提供する。
論文参考訳（メタデータ） (2025-01-04T07:44:49Z)
On the Exploration of LM-Based Soft Modular Robot Design [26.847859137653487]
大規模言語モデル(LLM)は、現実世界の知識をモデル化する上で有望な能力を示した。本稿では,LLMを用いてソフトモジュールロボットの設計を支援する可能性について検討する。本モデルは,一方向・二方向・階段移動機能を有するソフトモジュールロボットの設計において,優れた評価性能を発揮する。
論文参考訳（メタデータ） (2024-11-01T04:03:05Z)
On the Modeling Capabilities of Large Language Models for Sequential Decision Making [52.128546842746246]
大規模な事前訓練されたモデルでは、推論や計画タスクのパフォーマンスがますます向上している。我々は、直接的または間接的に、意思決定ポリシーを作成する能力を評価する。未知の力学を持つ環境において、合成データを用いた微調整LDMが報酬モデリング能力を大幅に向上させる方法について検討する。
論文参考訳（メタデータ） (2024-10-08T03:12:57Z)
LLAVADI: What Matters For Multimodal Large Language Models Distillation [77.73964744238519]
本研究では,新しい効率的なモデル構造を提案するのではなく,スクラッチから小規模MLLMを訓練する。本研究は, 知識蒸留プロセスにおける学習戦略, モデル選択, 蒸留アルゴリズムに関するものである。異なるベンチマークと適切な戦略を評価することで、2.7Bの小型モデルでも7Bまたは13Bのパラメータを持つ大型モデルと同等に動作することができる。
論文参考訳（メタデータ） (2024-07-28T06:10:47Z)
Large Language Model Agent as a Mechanical Designer [7.136205674624813]
本研究では,FEMモジュールと事前学習LLMを統合する新しい手法を提案する。 FEMモジュールはそれぞれの設計を評価し、重要なフィードバックを提供し、LLMにドメイン固有のトレーニングを必要とせずに継続的に学習し、計画し、生成し、設計を最適化するよう指示する。その結果, LLMをベースとしたエージェントは, 自然言語仕様に準拠したトラスを最大90%の確率で生成できることがわかった。
論文参考訳（メタデータ） (2024-04-26T16:41:24Z)
Beyond development: Challenges in deploying machine learning models for structural engineering applications [2.6415688445750383]
本稿では,2つの具体例を通して,デプロイメントに適した機械学習モデルを開発する上での課題について述べる。様々な落とし穴の中で、提示された議論は、モデルの過度な適合と過小評価、トレーニングデータ代表性、変数の欠落バイアス、およびクロスバリデーションに焦点を当てている。その結果、適応サンプリングによる厳密なモデル検証手法の実装の重要性、注意深い物理インフォームド特徴選択、モデルの複雑さと一般化可能性の両方について考察した。
論文参考訳（メタデータ） (2024-04-18T23:40:42Z)
MLCopilot: Unleashing the Power of Large Language Models in Solving Machine Learning Tasks [31.733088105662876]
我々は、新しいフレームワークを導入することで、機械学習と人間の知識のギャップを埋めることを目指している。本稿では、構造化された入力を理解するためのLLMの能力を拡張し、新しいMLタスクを解くための徹底的な推論を行う可能性を示す。
論文参考訳（メタデータ） (2023-04-28T17:03:57Z)
Scaling Vision-Language Models with Sparse Mixture of Experts [128.0882767889029]
提案手法は, 等価計算コストの高密度モデルに対して, 様々なベンチマークにおいて, 最先端性能を実現することができることを示す。我々の研究は、MoEモデルのトレーニングの安定化、モデル解釈可能性に対するMoEの影響の理解、ビジョン言語モデルをスケールする際の計算性能間のトレードオフのバランスに関する貴重な洞察を提供する。
論文参考訳（メタデータ） (2023-03-13T16:00:31Z)
Enabling Automated Machine Learning for Model-Driven AI Engineering [60.09869520679979]
モデル駆動型ソフトウェアエンジニアリングとモデル駆動型AIエンジニアリングを実現するための新しいアプローチを提案する。特に、私たちはAutomated MLをサポートし、AI集約システムの開発において、AIの深い知識のないソフトウェアエンジニアを支援します。
論文参考訳（メタデータ） (2022-03-06T10:12:56Z)
Panoramic Learning with A Standardized Machine Learning Formalism [116.34627789412102]
本稿では,多様なMLアルゴリズムの統一的な理解を提供する学習目的の標準化された方程式を提案する。また、新しいMLソリューションのメカニック設計のガイダンスも提供し、すべての経験を持つパノラマ学習に向けた有望な手段として機能する。
論文参考訳（メタデータ） (2021-08-17T17:44:38Z)
Learning by Design: Structuring and Documenting the Human Choices in Machine Learning Development [6.903929927172917]
本稿では,機械学習モデル作成における熟考と規範的選択を概説する8つの設計質問からなる手法を提案する。本手法は,方法論的透明性を通じた批判的評価を支援するなど,いくつかの利点がある。本手法は,MLモデルの開発において,ML実践者が選択や仮定を構造化し,正当化する上で有効であると考えている。
論文参考訳（メタデータ） (2021-05-03T08:47:45Z)
Technology Readiness Levels for AI & ML [79.22051549519989]
機械学習システムの開発は、現代的なツールで容易に実行できるが、プロセスは通常急いで、エンドツーエンドで実行される。エンジニアリングシステムは、高品質で信頼性の高い結果の開発を効率化するために、明確に定義されたプロセスとテスト標準に従います。我々は、機械学習の開発と展開のための実証されたシステムエンジニアリングアプローチを提案する。
論文参考訳（メタデータ） (2020-06-21T17:14:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。