論文の概要: European Language Grid: An Overview
- arxiv url: http://arxiv.org/abs/2003.13551v1
- Date: Mon, 30 Mar 2020 15:25:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 07:37:02.850704
- Title: European Language Grid: An Overview
- Title(参考訳): European Language Grid: 概要
- Authors: Georg Rehm and Maria Berger and Ela Elsholz and Stefanie Hegele and
Florian Kintzel and Katrin Marheinecke and Stelios Piperidis and Miltos
Deligiannis and Dimitris Galanis and Katerina Gkirtzou and Penny Labropoulou
and Kalina Bontcheva and David Jones and Ian Roberts and Jan Hajic and Jana
Hamrlov\'a and Luk\'a\v{s} Ka\v{c}ena and Khalid Choukri and Victoria Arranz
and Andrejs Vasi\c{l}jevs and Orians Anvari and Andis Lagzdi\c{n}\v{s} and
J\=ulija Me\c{l}\c{n}ika and Gerhard Backfried and Erin\c{c} Dikici and
Miroslav Janosik and Katja Prinz and Christoph Prinz and Severin Stampler and
Dorothea Thomas-Aniola and Jos\'e Manuel G\'omez P\'erez and Andres Garcia
Silva and Christian Berr\'io and Ulrich Germann and Steve Renals and Ondrej
Klejch
- Abstract要約: 欧州言語グリッド(ELG)プロジェクトは、欧州における言語技術(LT)の主要プラットフォームとしてELGを確立している。
ELGはスケーラブルなクラウドプラットフォームであり、簡単に統合可能な方法で、ヨーロッパのすべての言語に対して、数百の商用および非商用LTへのアクセスを提供する。
ELGはMultilingual Digital Single Marketを欧州のLTコミュニティに拡大し、新たな雇用と機会を生み出す。
- 参考スコア(独自算出の注目度): 13.990735617594368
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With 24 official EU and many additional languages, multilingualism in Europe
and an inclusive Digital Single Market can only be enabled through Language
Technologies (LTs). European LT business is dominated by hundreds of SMEs and a
few large players. Many are world-class, with technologies that outperform the
global players. However, European LT business is also fragmented, by nation
states, languages, verticals and sectors, significantly holding back its
impact. The European Language Grid (ELG) project addresses this fragmentation
by establishing the ELG as the primary platform for LT in Europe. The ELG is a
scalable cloud platform, providing, in an easy-to-integrate way, access to
hundreds of commercial and non-commercial LTs for all European languages,
including running tools and services as well as data sets and resources. Once
fully operational, it will enable the commercial and non-commercial European LT
community to deposit and upload their technologies and data sets into the ELG,
to deploy them through the grid, and to connect with other resources. The ELG
will boost the Multilingual Digital Single Market towards a thriving European
LT community, creating new jobs and opportunities. Furthermore, the ELG project
organises two open calls for up to 20 pilot projects. It also sets up 32
National Competence Centres (NCCs) and the European LT Council (LTC) for
outreach and coordination purposes.
- Abstract(参考訳): EUの公式な24の言語と多くの追加言語により、ヨーロッパの多言語主義と包括的デジタル単一市場はLanguage Technologies (LTs)を通じてのみ利用可能である。
欧州のLT事業は数百の中小企業と少数の大企業が支配している。
多くは世界クラスの技術であり、世界的プレイヤーを上回っている。
しかし、欧州のLTビジネスは、国家、言語、垂直、セクターによって断片化されており、その影響を著しく抑えている。
欧州言語グリッド(ELG)プロジェクトは、欧州におけるLTの主要なプラットフォームとしてELGを確立することで、この断片化に対処している。
ELGはスケーラブルなクラウドプラットフォームであり、簡単に統合可能な方法で、ツールやサービスの実行、データセットやリソースを含む、ヨーロッパのすべての言語に対して、数百の商用および非商用LTへのアクセスを提供する。
完全な運用が完了すると、商用および非商用の欧州LTコミュニティは、彼らの技術とデータセットをERGに保管してアップロードし、グリッドを通じてそれらをデプロイし、他のリソースと接続できるようになる。
ELGはMultilingual Digital Single Marketを欧州のLTコミュニティに拡大し、新たな雇用と機会を生み出す。
さらに、ELGプロジェクトは最大20のパイロットプロジェクトに対する2つのオープンコールを組織している。
また、32の国立コンペテンスセンター(NCC)と欧州LT協議会(LTC)を、アウトリーチと調整のために設置している。
関連論文リスト
- UltraLink: An Open-Source Knowledge-Enhanced Multilingual Supervised
Fine-tuning Dataset [69.33424532827608]
オープンソースの大規模言語モデル(LLM)は、様々な分野において大きな強みを持っている。
本研究では,オープンソースの多言語教師付き微調整データセットを構築する。
結果として得られたUltraLinkデータセットは、5つの言語にわたる約100万のサンプルで構成されている。
論文 参考訳(メタデータ) (2024-02-07T05:05:53Z) - Okapi: Instruction-tuned Large Language Models in Multiple Languages
with Reinforcement Learning from Human Feedback [61.83548032416181]
複数の言語を対象としたRLHFに基づく命令調整型LLMシステムであるOkapiを提案する。
オカピは26の多言語言語でインストラクションと応答ランクデータを導入し、将来の多言語LLM研究の促進と開発に役立てている。
論文 参考訳(メタデータ) (2023-07-29T18:01:46Z) - MULTI3NLU++: A Multilingual, Multi-Intent, Multi-Domain Dataset for
Natural Language Understanding in Task-Oriented Dialogue [115.32009638844059]
英語のみのNLU++データセットを拡張して、手動による翻訳を高、中、低リソース言語に含めます。
Multi3NLU++はそのマルチインテント特性のため、複雑で自然なユーザ目標を表現している。
我々はMulti3NLU++を用いて、インテント検出やスロットラベリングといった自然言語理解タスクに対して、最先端の多言語モデルをベンチマークする。
論文 参考訳(メタデータ) (2022-12-20T17:34:25Z) - The Massively Multilingual Natural Language Understanding 2022
(MMNLU-22) Workshop and Competition [0.0]
利用可能なデータがないため、自然言語理解システムは言語のサブセットに限定されることが一般的である。
我々は、NLUの限界に対処し、NLU技術を新しい高さまで推進する3段階のアプローチをローンチする。
我々は、Slot-filling、Intent Classification、Virtual Assistant EvaluationのためのMultilingual Amazon SLU Resource Pack(SLURP)と呼ばれる52の言語データセットをリリースする。
我々は、競争環境を提供し、モデルの他言語への転送可能性を高めるために、大規模多言語NLU 2022チャレンジを組織する。
論文 参考訳(メタデータ) (2022-12-13T03:00:36Z) - A Unified Strategy for Multilingual Grammatical Error Correction with
Pre-trained Cross-Lingual Language Model [100.67378875773495]
本稿では,多言語文法的誤り訂正のための汎用的かつ言語に依存しない戦略を提案する。
我々の手法は言語固有の操作を使わずに多様な並列GECデータを生成する。
NLPCC 2018 Task 2のデータセット(中国語)で最先端の結果を達成し、Falko-Merlin(ドイツ語)とRULEC-GEC(ロシア語)の競合性能を得る。
論文 参考訳(メタデータ) (2022-01-26T02:10:32Z) - CDA: a Cost Efficient Content-based Multilingual Web Document Aligner [97.98885151955467]
多言語のWebドキュメントをコンテンツに基づいて整列させる、Content-based Document Alignmentアプローチを紹介します。
我々はtf-idfを用いたベクトル表現構築に語彙翻訳モデルを利用する。
実験によると、cdaは堅牢でコスト効率が高く、(i)大規模でノイズの多いwebデータの処理や(ii)新しくて低リソースな言語へのスケーリングにおいて著しく優れている。
論文 参考訳(メタデータ) (2021-02-20T03:37:23Z) - Cross-lingual Machine Reading Comprehension with Language Branch
Knowledge Distillation [105.41167108465085]
言語間機械読解(CLMRC)は、ローソース言語に大規模なデータセットがないため、依然として難しい問題である。
本稿では,Language Branch Machine Reading (LBMRC) という新しい拡張手法を提案する。
LBMRCは、個々の言語に精通したMultiple Machine Read comprehension (MRC)モデルを訓練する。
複数の言語分岐モデルから全ての対象言語に対する単一モデルへのアマルガメート知識の多言語蒸留アプローチを考案する。
論文 参考訳(メタデータ) (2020-10-27T13:12:17Z) - The European Language Technology Landscape in 2020: Language-Centric and
Human-Centric AI for Cross-Cultural Communication in Multilingual Europe [17.329457671869744]
言語技術(LT)は、これらの障壁を壊すための強力な手段です。
本稿では,欧州のLTランドスケープを概観し,資金提供プログラム,活動,行動,課題について述べる。
論文 参考訳(メタデータ) (2020-03-30T21:42:45Z) - Making Metadata Fit for Next Generation Language Technology Platforms:
The Metadata Schema of the European Language Grid [0.8074509995682542]
メタデータは、デジタル資産の要素管理と利用を促進する重要な要素として現れてきた。
European Language Grid Platformは、ヨーロッパにおけるLanguage Technologyの主要なマーケットプレースとハブを目指している。
論文 参考訳(メタデータ) (2020-03-30T06:46:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。