論文の概要: A System for Worldwide COVID-19 Information Aggregation
- arxiv url: http://arxiv.org/abs/2008.01523v2
- Date: Sun, 11 Oct 2020 05:36:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 02:20:07.491460
- Title: A System for Worldwide COVID-19 Information Aggregation
- Title(参考訳): 世界規模の新型コロナウイルス情報収集システム
- Authors: Akiko Aizawa, Frederic Bergeron, Junjie Chen, Fei Cheng, Katsuhiko
Hayashi, Kentaro Inui, Hiroyoshi Ito, Daisuke Kawahara, Masaru Kitsuregawa,
Hirokazu Kiyomaru, Masaki Kobayashi, Takashi Kodama, Sadao Kurohashi,
Qianying Liu, Masaki Matsubara, Yusuke Miyao, Atsuyuki Morishima, Yugo
Murawaki, Kazumasa Omura, Haiyue Song, Eiichiro Sumita, Shinji Suzuki, Ribeka
Tanaka, Yu Tanaka, Masashi Toyoda, Nobuhiro Ueda, Honai Ueoka, Masao Utiyama,
Ying Zhong
- Abstract要約: 我々は、トピックによって分類された7言語10の地域から信頼できる記事を含む世界的な新型コロナウイルス情報収集システムを構築した。
ニューラルマシン翻訳モジュールは、他言語の論文を日本語と英語に翻訳する。
記事とトピックのペアデータセットに基づいてトレーニングされたBERTベースのトピック分類器は、ユーザが興味のある情報を効率的に見つけるのに役立つ。
- 参考スコア(独自算出の注目度): 92.60866520230803
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The global pandemic of COVID-19 has made the public pay close attention to
related news, covering various domains, such as sanitation, treatment, and
effects on education. Meanwhile, the COVID-19 condition is very different among
the countries (e.g., policies and development of the epidemic), and thus
citizens would be interested in news in foreign countries. We build a system
for worldwide COVID-19 information aggregation containing reliable articles
from 10 regions in 7 languages sorted by topics. Our reliable COVID-19 related
website dataset collected through crowdsourcing ensures the quality of the
articles. A neural machine translation module translates articles in other
languages into Japanese and English. A BERT-based topic-classifier trained on
our article-topic pair dataset helps users find their interested information
efficiently by putting articles into different categories.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)の世界的なパンデミックにより、公衆は、衛生、治療、教育への影響などさまざまな分野をカバーし、関連するニュースに注意を払っている。
一方、新型コロナウイルス(covid-19)の状況は国によって大きく異なる(例えば、流行の政策や発展)ため、市民は外国のニュースに興味を持つだろう。
我々は7つの言語に10の信頼できる記事を含む世界的な新型コロナウイルス情報集約システムを構築し,トピックを分類した。
クラウドソーシングを通じて収集した信頼性の高いcovid-19関連webサイトデータセットは、記事の品質を確保します。
ニューラルマシン翻訳モジュールは、他の言語の記事を日本語と英語に翻訳する。
記事トピックペアデータセットに基づいてトレーニングされたBERTベースのトピック分類器は、異なるカテゴリに記事を置くことで、ユーザが興味のある情報を効率的に見つけるのに役立つ。
関連論文リスト
- Making a MIRACL: Multilingual Information Retrieval Across a Continuum
of Languages [62.730361829175415]
MIRACLは、WSDM 2023 Cupチャレンジのために構築した多言語データセットです。
18の言語にまたがるアドホック検索に焦点を当てている。
我々の目標は、言語連続体における検索を改善する研究を加速させることです。
論文 参考訳(メタデータ) (2022-10-18T16:47:18Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - Facebook AI WMT21 News Translation Task Submission [23.69817809546458]
ニュース翻訳におけるWMT2021共有課題に対するFacebookの多言語モデル提出について述べる。
チェコ語、ドイツ語、ハウサ語、アイスランド語、日本語、ロシア語、中国語の14の言語指導に参加します。
利用可能なすべてのソースからのデータを利用して、高品質なバイリンガルベースラインとマルチリンガルベースラインを作成します。
論文 参考訳(メタデータ) (2021-08-06T18:26:38Z) - Topic Modeling and Progression of American Digital News Media During the
Onset of the COVID-19 Pandemic [2.798697306330988]
現在、世界は深刻な世界的なパンデミックの真っ最中にあり、人々の生活のあらゆる側面に影響を与えている。
パンデミックの影響で、米国では新型コロナウイルス関連のデジタルメディア記事が大量に掲載されている。
本研究では, 各種デジタル物品を自動抽出して, 管理可能な情報に抽出する自然言語処理パイプラインを開発した。
論文 参考訳(メタデータ) (2021-05-25T14:27:47Z) - \textit{NewsEdits}: A Dataset of Revision Histories for News Articles
(Technical Report: Data Processing) [89.77347919191774]
textitNewsEditsは、ニュース記事の改訂履歴の最初の公開データセットです。
1,278,804条と、22以上の英語とフランス語の新聞から4,609,430版がある。
論文 参考訳(メタデータ) (2021-04-19T21:15:30Z) - MM-COVID: A Multilingual and Multimodal Data Repository for Combating
COVID-19 Disinformation [37.52398946169075]
このデータセットは、多言語フェイクニュースと関連する社会的コンテキストを提供する。
偽ニュースコンテンツ3981点と、英語、スペイン語、ポルトガル語、ヒンディー語、フランス語、イタリア語の信頼に値する情報7192点を収集します。
論文 参考訳(メタデータ) (2020-11-08T21:42:03Z) - A Multilingual Neural Machine Translation Model for Biomedical Data [84.17747489525794]
生物医学領域におけるテキストの翻訳に使用できる多言語ニューラルマシン翻訳モデルをリリースする。
このモデルは5つの言語(フランス語、ドイツ語、イタリア語、韓国語、スペイン語)から英語に翻訳できる。
ドメインタグを使用して、大量のジェネリックおよびバイオメディカルデータをトレーニングする。
論文 参考訳(メタデータ) (2020-08-06T21:26:43Z) - TICO-19: the Translation Initiative for Covid-19 [112.5601530395345]
COvid-19の翻訳イニシアチブ(TICO-19)は、テストおよび開発データを、35の異なる言語でAIおよびMT研究者に提供した。
同じデータが表現されているすべての言語に変換されるため、テストや開発は、セット内の任意の言語のペアリングに対して行うことができる。
論文 参考訳(メタデータ) (2020-07-03T16:26:17Z) - Classification Aware Neural Topic Model and its Application on a New
COVID-19 Disinformation Corpus [2.492887522265771]
新型コロナウイルス(COVID-19)のパンデミックを受けて、偽情報の爆発が世界中のファクトチェックやメディアを過負荷にしている。
そこで我々は,新型コロナウイルスの偽情報を分類する計算手法を開発した。
論文 参考訳(メタデータ) (2020-06-05T10:32:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。