論文の概要: Accurate and Scalable Matching of Translators to Displaced Persons for
Overcoming Language Barriers
- arxiv url: http://arxiv.org/abs/2012.02595v1
- Date: Mon, 30 Nov 2020 22:50:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-06 16:13:41.689798
- Title: Accurate and Scalable Matching of Translators to Displaced Persons for
Overcoming Language Barriers
- Title(参考訳): 言語障害克服のための転職者への翻訳者の正確かつスケーラブルなマッチング
- Authors: Divyansh Agarwal, Yuta Baba, Pratik Sachdeva, Tanya Tandon, Thomas
Vetterli, Aziz Alghunaim
- Abstract要約: 本稿では,翻訳者の要求をボランティアに大規模にマッチングする機械学習システムについて述べる。
デプロイメントでは、この軽量システムはリクエストの82%と中央値の応答時間59秒と一致します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Residents of developing countries are disproportionately susceptible to
displacement as a result of humanitarian crises. During such crises, language
barriers impede aid workers in providing services to those displaced. To build
resilience, such services must be flexible and robust to a host of possible
languages. \textit{Tarjimly} aims to overcome the barriers by providing a
platform capable of matching bilingual volunteers to displaced persons or aid
workers in need of translating. However, Tarjimly's large pool of translators
comes with the challenge of selecting the right translator per request. In this
paper, we describe a machine learning system that matches translator requests
to volunteers at scale. We demonstrate that a simple logistic regression,
operating on easily computable features, can accurately predict and rank
translator response. In deployment, this lightweight system matches 82\% of
requests with a median response time of 59 seconds, allowing aid workers to
accelerate their services supporting displaced persons.
- Abstract(参考訳): 発展途上国の住民は、人道的危機の結果として、不均等に変位に悩まされる。
このような危機の間、言語障壁は転職者へのサービス提供を援助労働者に妨げた。
レジリエンスを構築するためには、可能な言語のホストに対して、柔軟性と堅牢性が必要です。
\textit{tarjimly} は、バイリンガルのボランティアと、翻訳を必要とする人または労働者の移動をマッチングできるプラットフォームを提供することで、障壁を克服することを目的としている。
しかし、Tarjimlyの大規模なトランスレータプールは、リクエストごとに正しいトランスレータを選択するという課題を伴っている。
本稿では,大規模なボランティアに翻訳者要求をマッチングする機械学習システムについて述べる。
単純なロジスティック回帰は,容易に計算可能な機能上で動作し,翻訳者の応答を正確に予測しランク付けできることを実証する。
デプロイメントでは、この軽量システムはリクエストの82\%と、平均応答時間59秒に一致し、エイドワーカーは、解雇された人をサポートするサービスを加速することができる。
関連論文リスト
- Language Fusion for Parameter-Efficient Cross-lingual Transfer [21.96231169571248]
Fusion forLanguage Representations (FLARE)は、英語以外の言語における表現品質と下流のパフォーマンスを向上させる新しい手法である。
FLAREは、低ランク (LoRA) アダプタ内でのソースおよびターゲット言語表現を、軽量線形変換を用いて統合する。
FLAREの有効性を実証するためには、自然言語推論、質問応答、感情分析など、言語横断の自然言語理解タスクにまたがる一連の実験がある。
論文 参考訳(メタデータ) (2025-01-12T18:02:29Z) - CReMa: Crisis Response through Computational Identification and Matching of Cross-Lingual Requests and Offers Shared on Social Media [5.384787836425144]
危機の時代には、ソーシャルメディアプラットフォームはコミュニケーションの促進と資源の調整において重要な役割を担っている。
本稿では,CReMa(Crisis Response Matcher)を提案する。
16言語でヘルプ検索をシミュレートし,ソーシャルメディアに支援を提供する新しい多言語データセットを提案する。
論文 参考訳(メタデータ) (2024-05-20T09:30:03Z) - On the Copying Problem of Unsupervised NMT: A Training Schedule with a
Language Discriminator Loss [120.19360680963152]
unsupervised neural machine translation (UNMT)は多くの言語で成功している。
コピー問題、すなわち、入力文の一部を翻訳として直接コピーする問題は、遠い言語対に共通している。
本稿では,言語識別器の損失を取り入れた,シンプルだが効果的な訓練スケジュールを提案する。
論文 参考訳(メタデータ) (2023-05-26T18:14:23Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - Cross-lingual Transfer for Speech Processing using Acoustic Language
Similarity [81.51206991542242]
言語間の移動は、このデジタル分割を橋渡しする魅力的な方法を提供する。
現在の言語間アルゴリズムは、テキストベースのタスクや音声関連タスクを低リソース言語で実現している。
本稿では,数百の言語をまたがる音響的言語間移動対を効率的に同定する言語類似性手法を提案する。
論文 参考訳(メタデータ) (2021-11-02T01:55:17Z) - Multilingual Unsupervised Neural Machine Translation with Denoising
Adapters [77.80790405710819]
単言語データのみを持つ言語を翻訳・翻訳する多言語無教師機械翻訳の問題点を考察する。
この問題に対して、モノリンガルデータを活用するための標準的な手順は、計算コストが高くチューニングが難しいバックトランスレーションである。
本稿では,事前学習したmBART-50上に,デノナイジング対象のアダプタ層であるデノナイジングアダプタを使用することを提案する。
論文 参考訳(メタデータ) (2021-10-20T10:18:29Z) - Lost in Interpreting: Speech Translation from Source or Interpreter? [0.0]
チェコ語とドイツ語を同時に解釈しながら、欧州議会の演説を英語で10時間の録音と書き起こしを公開します。
話者ベースおよびインタプリタベース音声翻訳システムの品質とレイテンシを英語からチェコ語に比較検討した。
論文 参考訳(メタデータ) (2021-06-17T09:32:49Z) - Pivot Through English: Reliably Answering Multilingual Questions without
Document Retrieval [4.4973334555746]
低リソース言語(LRL)における解答に対する既存の解答法は、英語に大きく遅れた。
文書検索を回避し、英語から低リソース言語への知識の確実に転送する、より現実的なタスクセットアップを利用可能なリソースに策定します。
このタスク設定内では、リランク付き英語学習セットに対する意味的類似性検索に類似した、Reranked Maximal Internal Product Search (RM-MIPS)を提案する。
論文 参考訳(メタデータ) (2020-12-28T04:38:45Z) - Self-Supervised Representations Improve End-to-End Speech Translation [57.641761472372814]
自己教師付き事前学習機能により,翻訳性能が一貫的に向上することを示す。
言語間の変換は、チューニングの必要なく、あるいはほとんどチューニングすることなく、さまざまな言語に拡張することができる。
論文 参考訳(メタデータ) (2020-06-22T10:28:38Z) - Self-Attention with Cross-Lingual Position Representation [112.05807284056337]
位置符号化(PE)は、自然言語処理タスクの単語順序情報を保存し、入力シーケンスの固定位置インデックスを生成する。
語順が異なるため、言語間の位置関係をモデル化することは、SANがこの問題に取り組むのに役立つ。
我々は、入力文のバイリンガル認識潜在構造をモデル化するために、言語間位置表現によるSANを拡大する。
論文 参考訳(メタデータ) (2020-04-28T05:23:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。