論文の概要: STAMP 4 NLP -- An Agile Framework for Rapid Quality-Driven NLP
Applications Development
- arxiv url: http://arxiv.org/abs/2111.08408v1
- Date: Tue, 16 Nov 2021 12:20:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-17 22:42:21.232987
- Title: STAMP 4 NLP -- An Agile Framework for Rapid Quality-Driven NLP
Applications Development
- Title(参考訳): STAMP 4 NLP - 迅速な品質駆動型NLPアプリケーション開発のためのアジャイルフレームワーク
- Authors: Philipp Kohl and Oliver Schmidts and Lars Kl\"oser and Henri Werth and
Bodo Kraft and Albert Z\"undorf
- Abstract要約: 我々は,NLPアプリケーションを開発するための反復的・漸進的なプロセスモデルとしてSTAMP 4 NLPを紹介した。
STAMP 4 NLPでは、ソフトウェアエンジニアリングの原則とデータサイエンスのベストプラクティスをマージします。
反復的・増分的なアプローチにより、企業は、イテレーション毎にプロトタイプの強化バージョンをソフトウェア環境にデプロイできます。
- 参考スコア(独自算出の注目度): 3.86574270083089
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The progress in natural language processing (NLP) research over the last
years, offers novel business opportunities for companies, as automated user
interaction or improved data analysis. Building sophisticated NLP applications
requires dealing with modern machine learning (ML) technologies, which impedes
enterprises from establishing successful NLP projects. Our experience in
applied NLP research projects shows that the continuous integration of research
prototypes in production-like environments with quality assurance builds trust
in the software and shows convenience and usefulness regarding the business
goal. We introduce STAMP 4 NLP as an iterative and incremental process model
for developing NLP applications. With STAMP 4 NLP, we merge software
engineering principles with best practices from data science. Instantiating our
process model allows efficiently creating prototypes by utilizing templates,
conventions, and implementations, enabling developers and data scientists to
focus on the business goals. Due to our iterative-incremental approach,
businesses can deploy an enhanced version of the prototype to their software
environment after every iteration, maximizing potential business value and
trust early and avoiding the cost of successful yet never deployed experiments.
- Abstract(参考訳): 近年の自然言語処理(NLP)研究の進展は、自動化されたユーザインタラクションやデータ分析の改善など、企業にとって新たなビジネスチャンスを提供する。
高度なNLPアプリケーションを構築するには、企業がNLPプロジェクトを成功させるのを妨げる、現代的な機械学習(ML)技術を扱う必要がある。
応用NLP研究プロジェクトでの経験から、品質保証がソフトウェアを信頼し、事業目標に関する利便性と有用性を示す生産的な環境における研究プロトタイプの継続的な統合が示されている。
我々は,NLPアプリケーションを開発するための反復的・漸進的なプロセスモデルとしてSTAMP 4 NLPを紹介した。
STAMP 4 NLPでは、ソフトウェアエンジニアリングの原則とデータサイエンスのベストプラクティスをマージします。
私たちのプロセスモデルをインスタンス化することで、テンプレートや規約、実装を利用してプロトタイプを効率的に作成でき、開発者やデータサイエンティストがビジネス目標に集中することができます。
当社の反復的インクリメンタルアプローチにより、各イテレーションの後にプロトタイプの強化バージョンをソフトウェア環境にデプロイでき、潜在的なビジネス価値を最大化し、早期に信頼でき、成功してもデプロイされない実験のコストを回避することができます。
関連論文リスト
- Automatic Evaluation for Text-to-image Generation: Task-decomposed Framework, Distilled Training, and Meta-evaluation Benchmark [62.58869921806019]
GPT-4oに基づくタスク分解評価フレームワークを提案し、新しいトレーニングデータセットを自動構築する。
我々は、GPT-4oの評価能力を7BオープンソースMLLM、MiniCPM-V-2.6に効果的に蒸留するための革新的なトレーニング戦略を設計する。
実験結果から,我々の蒸留したオープンソースMLLMは,現在のGPT-4oベースラインよりも有意に優れていた。
論文 参考訳(メタデータ) (2024-11-23T08:06:06Z) - Human-In-the-Loop Software Development Agents [12.830816751625829]
大規模言語モデル(LLM)は、ソフトウェア開発タスクを自動的に解決するために導入された。
ソフトウェア開発のためのHuman-in-the-loop LLMベースのエージェントフレームワーク(HULA)を紹介する。
私たちは社内使用のために、HULAフレームワークをAtlassianに設計、実装、デプロイしています。
論文 参考訳(メタデータ) (2024-11-19T23:22:33Z) - Think-on-Process: Dynamic Process Generation for Collaborative Development of Multi-Agent System [13.65717444483291]
ToP (Think-on-Process) はソフトウェア開発のための動的プロセス生成フレームワークである。
本フレームワークはGPT-3.5とGPT-4の動的プロセス生成能力を著しく向上させる。
論文 参考訳(メタデータ) (2024-09-10T15:02:34Z) - Agent-Driven Automatic Software Improvement [55.2480439325792]
本提案は,Large Language Models (LLMs) を利用したエージェントの展開に着目して,革新的なソリューションの探求を目的とする。
継続的学習と適応を可能にするエージェントの反復的性質は、コード生成における一般的な課題を克服するのに役立ちます。
我々は,これらのシステムにおける反復的なフィードバックを用いて,エージェントの基盤となるLLMをさらに微調整し,自動化されたソフトウェア改善のタスクに整合性を持たせることを目指している。
論文 参考訳(メタデータ) (2024-06-24T15:45:22Z) - Zero-shot LLM-guided Counterfactual Generation: A Case Study on NLP Model Evaluation [15.254775341371364]
ゼロショット対実生成に大規模言語モデルを活用する可能性について検討する。
我々は,この生成を容易にするための構造化パイプラインを提案し,近年のLLMにおける命令追従とテキスト理解の能力を効果的に活用できるという仮説を立てた。
論文 参考訳(メタデータ) (2024-05-08T03:57:45Z) - Selene: Pioneering Automated Proof in Software Verification [62.09555413263788]
実世界の産業レベルのマイクロカーネルであるseL4をベースとした,最初のプロジェクトレベルの自動証明ベンチマークであるSeleneを紹介する。
GPT-3.5-turbo や GPT-4 のような先進的な大規模言語モデル (LLM) による実験結果から, 自動証明生成領域における LLM の機能を強調した。
論文 参考訳(メタデータ) (2024-01-15T13:08:38Z) - Generative User-Experience Research for Developing Domain-specific Natural Language Processing Applications [4.139846693958609]
本稿では、生成UX研究をドメインNLPアプリケーションに組み込むための新しい手法を提案する。
生成UX研究は、プロトタイプ開発の初期段階、すなわちアイデアと概念評価、およびシステムの有用性とユーザ有用性を評価するための最終段階において、ドメインユーザーを採用する。
論文 参考訳(メタデータ) (2023-06-28T12:17:45Z) - EasyNLP: A Comprehensive and Easy-to-use Toolkit for Natural Language
Processing [38.9428437204642]
EasyNLPは、NLPアプリケーションを簡単に構築できるように設計されている。
知識に富んだ事前訓練、知識蒸留、数発の学習が特徴である。
EasyNLPはAlibaba Group内の10以上のビジネスユニットに電力を供給している。
論文 参考訳(メタデータ) (2022-04-30T13:03:53Z) - FedNLP: A Research Platform for Federated Learning in Natural Language
Processing [55.01246123092445]
NLPのフェデレーションラーニングのための研究プラットフォームであるFedNLPを紹介します。
FedNLPは、テキスト分類、シーケンスタグ付け、質問応答、Seq2seq生成、言語モデリングなど、NLPで一般的なタスクの定式化をサポートしている。
FedNLPによる予備実験では、分散型データセットと集中型データセットの学習には大きなパフォーマンスギャップが存在することが明らかになった。
論文 参考訳(メタデータ) (2021-04-18T11:04:49Z) - Technology Readiness Levels for AI & ML [79.22051549519989]
機械学習システムの開発は、現代的なツールで容易に実行できるが、プロセスは通常急いで、エンドツーエンドで実行される。
エンジニアリングシステムは、高品質で信頼性の高い結果の開発を効率化するために、明確に定義されたプロセスとテスト標準に従います。
我々は、機械学習の開発と展開のための実証されたシステムエンジニアリングアプローチを提案する。
論文 参考訳(メタデータ) (2020-06-21T17:14:34Z) - Towards CRISP-ML(Q): A Machine Learning Process Model with Quality
Assurance Methodology [53.063411515511056]
本稿では,機械学習アプリケーション開発のためのプロセスモデルを提案する。
第1フェーズでは、データの可用性がプロジェクトの実現可能性に影響を与えることが多いため、ビジネスとデータの理解が結合されます。
第6フェーズでは、機械学習アプリケーションの監視とメンテナンスに関する最先端のアプローチがカバーされている。
論文 参考訳(メタデータ) (2020-03-11T08:25:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。