論文の概要: Hy-MT2: A Family of Fast, Efficient and Powerful Multilingual Translation Models in the Wild
- arxiv url: http://arxiv.org/abs/2605.22064v2
- Date: Mon, 25 May 2026 03:05:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 16:32:37.946594
- Title: Hy-MT2: A Family of Fast, Efficient and Powerful Multilingual Translation Models in the Wild
- Title(参考訳): Hy-MT2:野生における高速・高能率・高能率多言語翻訳モデル
- Authors: Mao Zheng, Zheng Li, Tao Chen, Bo Lv, Mingrui Sun, Mingyang Song, Jinlong Song, Hong Huang, Decheng Wu, Hai Wang, Yifan Song, Yanfeng Chen, Guanwei Zhang,
- Abstract要約: Hy-MT2は、一般的な実世界のビジネス、ドメイン固有、命令フォローする翻訳タスクで優れたパフォーマンスを提供する。
7Bと30Bは、DeepSeek-V4-ProやKim K2.6のようなオープンソースモデルよりも高速に考えられたモードで優れている。
軽量の1.8Bモデルは440MBのストレージしか必要とせず、1.5倍の推論スピードアップを実現している。
- 参考スコア(独自算出の注目度): 28.747270164782673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hy-MT2 is a family of fast-thinking multilingual translation models designed for complex real-world scenarios. It includes three model sizes: 1.8B, 7B, and 30B-A3B (MoE), all of which support translation among 33 languages and effectively follow translation instructions in multiple languages. Multi-dimensional evaluations show that Hy-MT2 delivers outstanding performance across general, real-world business, domain-specific, and instruction-following translation tasks. The 7B and 30B models outperform open-source models such as DeepSeek-V4-Pro and Kimi K2.6 in fast-thinking mode, while the lightweight 1.8B model also surpasses mainstream commercial APIs from providers such as Microsoft and Doubao overall. Moreover, when paired with AngelSlim's 1.25-bit extreme quantization for on-device deployment, the lightweight 1.8B model requires only 440 MB of storage and achieves a 1.5x inference speedup.
- Abstract(参考訳): Hy-MT2は、複雑な現実世界のシナリオ向けに設計された高速な多言語翻訳モデルのファミリーである。
1.8B, 7B, 30B-A3B (MoE) の3つのモデルサイズがあり、いずれも33言語間の翻訳をサポートし、複数の言語で効率的に翻訳指示に従う。
多次元評価では、Hy-MT2は、一般的な実世界のビジネス、ドメイン固有、命令追従の翻訳タスクに優れたパフォーマンスを提供する。
7Bと30Bモデルは、DeepSeek-V4-ProやKimi K2.6のようなオープンソースモデルよりも高速に考えられている。
さらに、AngelSlimのデバイス上に展開するための1.25ビットの極端な量子化と組み合わせると、軽量の1.8Bモデルは440MBのストレージしか必要とせず、1.5倍の推論速度を実現する。
関連論文リスト
- Omnilingual MT: Machine Translation for 1,600 Languages [58.66170104105936]
我々は,1600以上の言語をサポートする最初の機械翻訳システムであるOmnilingual Machine Translation (OMT)を提案する。
このスケールは、大規模な公開多言語コーパスと新たに作成されたデータセットを統合する包括的なデータ戦略によって実現されている。
OMTモデルは言語間移動を改善し、1,600の評価において、MTのパズルの「理解」部分を解くのに近づいている。
論文 参考訳(メタデータ) (2026-03-17T09:43:42Z) - HY-MT1.5 Technical Report [24.77479897240016]
HY-MT1.5-1.8BとHY-MT1.5-7Bは、高性能翻訳に適した総合的なトレーニングフレームワークによって開発された新しい機械翻訳モデルである。
本手法は, 汎用およびMT指向のプレトレーニング, 微調整, オンライン蒸留, 強化学習を統合した多段階パイプラインを編成する。
論文 参考訳(メタデータ) (2025-12-30T09:06:37Z) - Multilingual Machine Translation with Open Large Language Models at Practical Scale: An Empirical Study [13.409987421121405]
GemmaX2-28は、28言語で最上位の多言語翻訳性能を達成する9Bモデルである。
GemmaX2-28 は TowerInstruct や XALMA などの最先端 (SOTA) モデルより一貫して優れている。
論文 参考訳(メタデータ) (2025-02-04T16:57:03Z) - Vega-MT: The JD Explore Academy Translation System for WMT22 [67.71016343958556]
言語ペアとモデルサイズという2つの主要な要因をスケールアップすることで、これまでの作業の限界を押し上げます。
第1位はZh-En(45.1)、En-Zh(61.7)、De-En(58.0)、En-De(63.2)、Cs-En(74.7)、Ru-En(64.9)、En-Ru(69.6)、En-Ja(65.1)、En-Cs(95.3)、Ja-En(40.6)である。
論文 参考訳(メタデータ) (2022-09-20T03:45:24Z) - Towards Making the Most of Multilingual Pretraining for Zero-Shot Neural
Machine Translation [74.158365847236]
SixT++は、100のソース言語をサポートする強力な多言語NMTモデルであるが、たった6つのソース言語からの並列データセットで一度トレーニングされている。
CRISSとm2m-100は、それぞれ7.2と5.0BLEUの2つの強い多言語NMTシステムより大幅に優れていた。
論文 参考訳(メタデータ) (2021-10-16T10:59:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。