論文の概要: TICO-19: the Translation Initiative for Covid-19
- arxiv url: http://arxiv.org/abs/2007.01788v2
- Date: Mon, 6 Jul 2020 14:13:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 06:05:32.179405
- Title: TICO-19: the Translation Initiative for Covid-19
- Title(参考訳): TICO-19:Covid-19の翻訳イニシアチブ
- Authors: Antonios Anastasopoulos, Alessandro Cattelan, Zi-Yi Dou, Marcello
Federico, Christian Federman, Dmitriy Genzel, Francisco Guzm\'an, Junjie Hu,
Macduff Hughes, Philipp Koehn, Rosie Lazar, Will Lewis, Graham Neubig,
Mengmeng Niu, Alp \"Oktem, Eric Paquin, Grace Tang, and Sylwia Tur
- Abstract要約: COvid-19の翻訳イニシアチブ(TICO-19)は、テストおよび開発データを、35の異なる言語でAIおよびMT研究者に提供した。
同じデータが表現されているすべての言語に変換されるため、テストや開発は、セット内の任意の言語のペアリングに対して行うことができる。
- 参考スコア(独自算出の注目度): 112.5601530395345
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The COVID-19 pandemic is the worst pandemic to strike the world in over a
century. Crucial to stemming the tide of the SARS-CoV-2 virus is communicating
to vulnerable populations the means by which they can protect themselves. To
this end, the collaborators forming the Translation Initiative for COvid-19
(TICO-19) have made test and development data available to AI and MT
researchers in 35 different languages in order to foster the development of
tools and resources for improving access to information about COVID-19 in these
languages. In addition to 9 high-resourced, "pivot" languages, the team is
targeting 26 lesser resourced languages, in particular languages of Africa,
South Asia and South-East Asia, whose populations may be the most vulnerable to
the spread of the virus. The same data is translated into all of the languages
represented, meaning that testing or development can be done for any pairing of
languages in the set. Further, the team is converting the test and development
data into translation memories (TMXs) that can be used by localizers from and
to any of the languages.
- Abstract(参考訳): 新型コロナウイルスのパンデミックは、世界で1世紀ぶりの最悪のパンデミックだ。
SARS-CoV-2ウイルスの潮流を抑えるための重要な手段は、弱い集団に自分を守る手段を伝えていくことである。
この目的のために、covid-19の翻訳イニシアチブ(tico-19)の協力者は、これらの言語でcovid-19に関する情報へのアクセスを改善するためのツールやリソースの開発を促進するために、35の異なる言語でaiとmt研究者にテストと開発データを提供している。
研究チームは、高リソースの「ピボット」言語9つに加えて、アフリカ、南アジア、東南アジアなど、より少ない26の言語をターゲットにしている。
同じデータが表現されたすべての言語に翻訳されるため、テストや開発はセット内の任意の言語のペアリングに対して行うことができる。
さらに、チームはテストと開発データを翻訳メモリ(TMX)に変換し、ローカライザがどの言語からでも利用できるようにしている。
関連論文リスト
- SPEED++: A Multilingual Event Extraction Framework for Epidemic Prediction and Preparedness [73.73883111570458]
多様な疾患や言語に対する流行イベント情報を抽出する,最初の多言語イベント抽出フレームワークを提案する。
各言語でデータに注釈を付けることは不可能であり、ゼロショット・クロスランガル・クロス・ディスリーズ・モデルを開発する。
われわれのフレームワークは、2019年12月初旬に中国のWeiboポストから、中国でのトレーニングなしに、新型コロナウイルスの流行を警告することができる。
論文 参考訳(メタデータ) (2024-10-24T03:03:54Z) - DN at SemEval-2023 Task 12: Low-Resource Language Text Classification
via Multilingual Pretrained Language Model Fine-tuning [0.0]
感情分析のための既存のモデルやデータセットは、英語や中国語などの高リソース言語向けに開発されている。
AfriSenti-SemEval 2023 Shared Task 12は、低リソースのアフリカの言語に対する感情分析モデルを評価することで、このギャップを埋めることを目的としている。
そこで我々は,多言語XLM-Rモデルを多言語モデルに適用し,様々なデータに基づいて分類ヘッドを訓練した。
論文 参考訳(メタデータ) (2023-05-04T07:28:45Z) - MasakhaNER 2.0: Africa-centric Transfer Learning for Named Entity
Recognition [55.95128479289923]
アフリカ系言語は10億人を超える人々によって話されているが、NLPの研究や開発ではあまり語られていない。
我々は、20のアフリカ言語で最大の人間アノテーション付きNERデータセットを作成します。
最適な転送言語を選択すると、ゼロショットF1スコアが平均14ポイント向上することを示す。
論文 参考訳(メタデータ) (2022-10-22T08:53:14Z) - Making a MIRACL: Multilingual Information Retrieval Across a Continuum
of Languages [62.730361829175415]
MIRACLは、WSDM 2023 Cupチャレンジのために構築した多言語データセットです。
18の言語にまたがるアドホック検索に焦点を当てている。
我々の目標は、言語連続体における検索を改善する研究を加速させることです。
論文 参考訳(メタデータ) (2022-10-18T16:47:18Z) - COVID-19 Named Entity Recognition for Vietnamese [6.17059264011429]
ベトナムで最初の手作業によるcovid-19ドメイン固有データセットについて紹介する。
私たちのデータセットは、新たに定義されたエンティティタイプを持つ名前付きエンティティ認識タスクにアノテートされます。
当社のデータセットには、既存のベトナムのNERデータセットと比較して最大数のエンティティが含まれています。
論文 参考訳(メタデータ) (2021-04-08T16:35:34Z) - A System for Worldwide COVID-19 Information Aggregation [92.60866520230803]
我々は、トピックによって分類された7言語10の地域から信頼できる記事を含む世界的な新型コロナウイルス情報収集システムを構築した。
ニューラルマシン翻訳モジュールは、他言語の論文を日本語と英語に翻訳する。
記事とトピックのペアデータセットに基づいてトレーニングされたBERTベースのトピック分類器は、ユーザが興味のある情報を効率的に見つけるのに役立つ。
論文 参考訳(メタデータ) (2020-07-28T01:33:54Z) - Cross-lingual Transfer Learning for COVID-19 Outbreak Alignment [90.12602012910465]
われわれは、Twitterを通じてイタリアの新型コロナウイルス感染症(COVID-19)の早期流行を訓練し、他のいくつかの国に移る。
実験の結果,クロスカントリー予測において最大0.85のスピアマン相関が得られた。
論文 参考訳(メタデータ) (2020-06-05T02:04:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。