論文の概要: Design of an Open-Source Architecture for Neural Machine Translation
- arxiv url: http://arxiv.org/abs/2403.03582v1
- Date: Wed, 6 Mar 2024 09:57:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 15:37:16.558566
- Title: Design of an Open-Source Architecture for Neural Machine Translation
- Title(参考訳): ニューラルネットワーク翻訳のためのオープンソースアーキテクチャの設計
- Authors: S\'eamus Lankford, Haithem Afli and Andy Way
- Abstract要約: adaptNMTは、Transformerモデルの開発とデプロイに対する合理化されたアプローチを提供するオープンソースアプリケーションである。
このアプリケーションは広く採用されているOpenNMTエコシステム上に構築されている。
- 参考スコア(独自算出の注目度): 2.648836772989769
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: adaptNMT is an open-source application that offers a streamlined approach to
the development and deployment of Recurrent Neural Networks and Transformer
models. This application is built upon the widely-adopted OpenNMT ecosystem,
and is particularly useful for new entrants to the field, as it simplifies the
setup of the development environment and creation of train, validation, and
test splits. The application offers a graphing feature that illustrates the
progress of model training, and employs SentencePiece for creating subword
segmentation models. Furthermore, the application provides an intuitive user
interface that facilitates hyperparameter customization. Notably, a
single-click model development approach has been implemented, and models
developed by adaptNMT can be evaluated using a range of metrics. To encourage
eco-friendly research, adaptNMT incorporates a green report that flags the
power consumption and kgCO${_2}$ emissions generated during model development.
The application is freely available.
- Abstract(参考訳): adaptNMTはオープンソースのアプリケーションで、リカレントニューラルネットワークとトランスフォーマーモデルの開発とデプロイに対する合理化されたアプローチを提供する。
このアプリケーションは広く採用されているOpenNMTエコシステム上に構築されており、特に開発環境のセットアップや列車の作成、検証、テストの分割を簡単にするため、新しい参入者にとって有用である。
このアプリケーションは、モデルトレーニングの進捗を示すグラフ機能を提供し、サブワードセグメンテーションモデルの作成にSentencePieceを使用している。
さらに、アプリケーションはハイパーパラメータのカスタマイズを容易にする直感的なユーザーインターフェースを提供する。
特に、シングルクリックモデル開発アプローチが実装されており、adaptnmtによって開発されたモデルは、さまざまなメトリクスを使って評価することができる。
環境に優しい研究を促進するため、AdaptNMTは、エネルギー消費とモデル開発中に発生するkgCO${_2}$エミッションをフラグするグリーンレポートを組み込んでいる。
アプリケーションは無料で利用できる。
関連論文リスト
- Reference Trustable Decoding: A Training-Free Augmentation Paradigm for Large Language Models [79.41139393080736]
大規模言語モデル(LLM)は急速に進歩し、印象的な機能を示している。
我々は、モデルが微調整なしで新しいタスクに迅速に適応できるパラダイムである参照信頼復号(RTD)を提案する。
論文 参考訳(メタデータ) (2024-09-30T10:48:20Z) - Dynamic Provisioning of REST APIs for Model Management [1.511194037740325]
モデル駆動工学(MDE)は、主要な成果物としてモデルに焦点を当てたソフトウェア工学の方法論である。
Webベースのモデリングツールを開発する際の一般的な要件は、モデル管理の迅速かつ効率的な方法を提供することである。
本稿では、モデリング・アズ・ア・サービスを提供するモデリングプラットフォームを構築するために使用できるモデル管理のためのサービスを提供するアプローチを提案する。
論文 参考訳(メタデータ) (2024-06-24T23:28:00Z) - Structural Pruning of Pre-trained Language Models via Neural Architecture Search [7.833790713816726]
事前学習された言語モデル(PLM)は、ラベル付きデータに基づいて微調整された自然言語理解タスクの最先端である。
本稿では, 最適トレードオフ効率を有する微調整ネットワークのサブ部分を見つけるために, 構造解析のためのニューラルアーキテクチャ探索(NAS)について検討する。
論文 参考訳(メタデータ) (2024-05-03T17:34:57Z) - A Review of Modern Recommender Systems Using Generative Models (Gen-RecSys) [57.30228361181045]
この調査は、ジェネレーティブモデル(Gen-RecSys)を用いたレコメンデーションシステムにおける重要な進歩を結びつける。
対話駆動生成モデル、自然言語レコメンデーションのための大規模言語モデル(LLM)とテキストデータの使用、RSにおける画像やビデオの生成と処理のためのマルチモーダルモデルの統合。
我々の研究は、Gen-RecSysの影響と害を評価するために必要なパラダイムを強調し、オープンな課題を特定します。
論文 参考訳(メタデータ) (2024-03-31T06:57:57Z) - adaptNMT: an open-source, language-agnostic development environment for
Neural Machine Translation [2.648836772989769]
adaptNMTは、機械翻訳の分野で働いている技術と非技術の両方のユーザー向けに設計されている。
このアプリケーションは広く採用されているOpenNMTエコシステム上に構築されている。
NLP空間におけるエコフレンドリーな研究を支援するため、グリーンレポートでは、モデル開発中に発生する電力消費とkgCO$_2$排出もフラグ付けしている。
論文 参考訳(メタデータ) (2024-03-04T12:10:17Z) - Model LEGO: Creating Models Like Disassembling and Assembling Building Blocks [53.09649785009528]
本稿では,新しいモデルを得るためのトレーニングを必要としないパラダイムについて検討する。
生体視覚系における受容野にインスパイアされたCNNの誕生と同様、モデル分解と組み立てを提案する。
モデル組立には、特定のタスクに適した新しいモデルを構築するために、アライメントパディング戦略とパラメータスケーリング戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T05:27:28Z) - Assemble Foundation Models for Automatic Code Summarization [9.53949558569201]
ニューラルネットワークに基づく自動コード要約のためのフレキシブルでロバストなアプローチを提案する。
CodeBERT や GPT-2 のような利用可能な基盤モデルを AdaMo という単一のモデルに組み立てる。
本稿では,知識伝達の観点から,連続事前学習と中間微調整という2つの適応型スキームを導入する。
論文 参考訳(メタデータ) (2022-01-13T21:38:33Z) - Factorized Neural Transducer for Efficient Language Model Adaptation [51.81097243306204]
空白および語彙予測を分解し,ニューラルトランスデューサの因子化モデルを提案する。
この因子化は、音声認識のためのトランスデューサにスタンドアロン言語モデルの改善を移すことが期待できる。
提案した因子化ニューラルトランスデューサは、言語モデル適応にドメイン外テキストデータを使用する場合、15%から20%のWER改善が得られることを示す。
論文 参考訳(メタデータ) (2021-09-27T15:04:00Z) - Deep Variational Models for Collaborative Filtering-based Recommender
Systems [63.995130144110156]
ディープラーニングは、リコメンダシステムの結果を改善するために、正確な協調フィルタリングモデルを提供する。
提案するモデルは, 深層建築の潜伏空間において, 変分概念を注入性に適用する。
提案手法は, 入射雑音効果を超える変動エンリッチメントのシナリオにおいて, 提案手法の優位性を示す。
論文 参考訳(メタデータ) (2021-07-27T08:59:39Z) - Learning Discrete Energy-based Models via Auxiliary-variable Local
Exploration [130.89746032163106]
離散構造データに対する条件付きおよび非条件付きEMMを学習するための新しいアルゴリズムであるALOEを提案する。
エネルギー関数とサンプリング器は、新しい変分型電力繰り返しにより効率よく訓練できることを示す。
本稿では、ソフトウェアテストのためのエネルギーモデルガイド付ファジィザについて、libfuzzerのようなよく設計されたファジィエンジンに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2020-11-10T19:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。