論文の概要: Accurate and Scalable Matching of Translators to Displaced Persons for
Overcoming Language Barriers
- arxiv url: http://arxiv.org/abs/2012.02595v1
- Date: Mon, 30 Nov 2020 22:50:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-06 16:13:41.689798
- Title: Accurate and Scalable Matching of Translators to Displaced Persons for
Overcoming Language Barriers
- Title(参考訳): 言語障害克服のための転職者への翻訳者の正確かつスケーラブルなマッチング
- Authors: Divyansh Agarwal, Yuta Baba, Pratik Sachdeva, Tanya Tandon, Thomas
Vetterli, Aziz Alghunaim
- Abstract要約: 本稿では,翻訳者の要求をボランティアに大規模にマッチングする機械学習システムについて述べる。
デプロイメントでは、この軽量システムはリクエストの82%と中央値の応答時間59秒と一致します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Residents of developing countries are disproportionately susceptible to
displacement as a result of humanitarian crises. During such crises, language
barriers impede aid workers in providing services to those displaced. To build
resilience, such services must be flexible and robust to a host of possible
languages. \textit{Tarjimly} aims to overcome the barriers by providing a
platform capable of matching bilingual volunteers to displaced persons or aid
workers in need of translating. However, Tarjimly's large pool of translators
comes with the challenge of selecting the right translator per request. In this
paper, we describe a machine learning system that matches translator requests
to volunteers at scale. We demonstrate that a simple logistic regression,
operating on easily computable features, can accurately predict and rank
translator response. In deployment, this lightweight system matches 82\% of
requests with a median response time of 59 seconds, allowing aid workers to
accelerate their services supporting displaced persons.
- Abstract(参考訳): 発展途上国の住民は、人道的危機の結果として、不均等に変位に悩まされる。
このような危機の間、言語障壁は転職者へのサービス提供を援助労働者に妨げた。
レジリエンスを構築するためには、可能な言語のホストに対して、柔軟性と堅牢性が必要です。
\textit{tarjimly} は、バイリンガルのボランティアと、翻訳を必要とする人または労働者の移動をマッチングできるプラットフォームを提供することで、障壁を克服することを目的としている。
しかし、Tarjimlyの大規模なトランスレータプールは、リクエストごとに正しいトランスレータを選択するという課題を伴っている。
本稿では,大規模なボランティアに翻訳者要求をマッチングする機械学習システムについて述べる。
単純なロジスティック回帰は,容易に計算可能な機能上で動作し,翻訳者の応答を正確に予測しランク付けできることを実証する。
デプロイメントでは、この軽量システムはリクエストの82\%と、平均応答時間59秒に一致し、エイドワーカーは、解雇された人をサポートするサービスを加速することができる。
関連論文リスト
- CReMa: Crisis Response through Computational Identification and Matching of Cross-Lingual Requests and Offers Shared on Social Media [5.384787836425144]
危機の時代には、ソーシャルメディアプラットフォームはコミュニケーションの促進と資源の調整において重要な役割を担っている。
本稿では,CReMa(Crisis Response Matcher)を提案する。
16言語でヘルプ検索をシミュレートし,ソーシャルメディアに支援を提供する新しい多言語データセットを提案する。
論文 参考訳(メタデータ) (2024-05-20T09:30:03Z) - Can Machine Translation Bridge Multilingual Pretraining and Cross-lingual Transfer Learning? [8.630930380973489]
本稿では,機械翻訳を言語表現学習の強化を目的とした継続的な学習目的として活用する可能性について検討する。
この結果から,機械翻訳の継続学習が言語間表現学習の強化に失敗することが明らかとなった。
言語横断シナリオにおける明示的な文レベルのアライメントは、言語間移動事前学習に有害である、と結論付けた。
論文 参考訳(メタデータ) (2024-03-25T13:53:04Z) - On the Copying Problem of Unsupervised NMT: A Training Schedule with a
Language Discriminator Loss [120.19360680963152]
unsupervised neural machine translation (UNMT)は多くの言語で成功している。
コピー問題、すなわち、入力文の一部を翻訳として直接コピーする問題は、遠い言語対に共通している。
本稿では,言語識別器の損失を取り入れた,シンプルだが効果的な訓練スケジュールを提案する。
論文 参考訳(メタデータ) (2023-05-26T18:14:23Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - Cross-lingual Transfer for Speech Processing using Acoustic Language
Similarity [81.51206991542242]
言語間の移動は、このデジタル分割を橋渡しする魅力的な方法を提供する。
現在の言語間アルゴリズムは、テキストベースのタスクや音声関連タスクを低リソース言語で実現している。
本稿では,数百の言語をまたがる音響的言語間移動対を効率的に同定する言語類似性手法を提案する。
論文 参考訳(メタデータ) (2021-11-02T01:55:17Z) - Multilingual Unsupervised Neural Machine Translation with Denoising
Adapters [77.80790405710819]
単言語データのみを持つ言語を翻訳・翻訳する多言語無教師機械翻訳の問題点を考察する。
この問題に対して、モノリンガルデータを活用するための標準的な手順は、計算コストが高くチューニングが難しいバックトランスレーションである。
本稿では,事前学習したmBART-50上に,デノナイジング対象のアダプタ層であるデノナイジングアダプタを使用することを提案する。
論文 参考訳(メタデータ) (2021-10-20T10:18:29Z) - Lost in Interpreting: Speech Translation from Source or Interpreter? [0.0]
チェコ語とドイツ語を同時に解釈しながら、欧州議会の演説を英語で10時間の録音と書き起こしを公開します。
話者ベースおよびインタプリタベース音声翻訳システムの品質とレイテンシを英語からチェコ語に比較検討した。
論文 参考訳(メタデータ) (2021-06-17T09:32:49Z) - Pivot Through English: Reliably Answering Multilingual Questions without
Document Retrieval [4.4973334555746]
低リソース言語(LRL)における解答に対する既存の解答法は、英語に大きく遅れた。
文書検索を回避し、英語から低リソース言語への知識の確実に転送する、より現実的なタスクセットアップを利用可能なリソースに策定します。
このタスク設定内では、リランク付き英語学習セットに対する意味的類似性検索に類似した、Reranked Maximal Internal Product Search (RM-MIPS)を提案する。
論文 参考訳(メタデータ) (2020-12-28T04:38:45Z) - Self-Supervised Representations Improve End-to-End Speech Translation [57.641761472372814]
自己教師付き事前学習機能により,翻訳性能が一貫的に向上することを示す。
言語間の変換は、チューニングの必要なく、あるいはほとんどチューニングすることなく、さまざまな言語に拡張することができる。
論文 参考訳(メタデータ) (2020-06-22T10:28:38Z) - Self-Attention with Cross-Lingual Position Representation [112.05807284056337]
位置符号化(PE)は、自然言語処理タスクの単語順序情報を保存し、入力シーケンスの固定位置インデックスを生成する。
語順が異なるため、言語間の位置関係をモデル化することは、SANがこの問題に取り組むのに役立つ。
我々は、入力文のバイリンガル認識潜在構造をモデル化するために、言語間位置表現によるSANを拡大する。
論文 参考訳(メタデータ) (2020-04-28T05:23:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。