論文の概要: Assessing Digital Language Support on a Global Scale
- arxiv url: http://arxiv.org/abs/2209.13515v1
- Date: Tue, 27 Sep 2022 16:35:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 15:24:46.662546
- Title: Assessing Digital Language Support on a Global Scale
- Title(参考訳): グローバルスケールでのデジタル言語サポートの評価
- Authors: Gary F. Simons, Abbey L. Thomas, and Chad K. White
- Abstract要約: 我々は,ISO 639で認識されるすべての言語が,デジタル言語サポートにおいてどの程度優れているかを自動評価する方法を開発した。
この評価は、デジタル技術が言語をサポートするための幅広い方法を示すために選ばれた143のデジタルツールのウェブサイトから、サポート対象言語の名前を取り除くことに基づいている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The users of endangered languages struggle to thrive in a digitally-mediated
world. We have developed an automated method for assessing how well every
language recognized by ISO 639 is faring in terms of digital language support.
The assessment is based on scraping the names of supported languages from the
websites of 143 digital tools selected to represent a full range of ways that
digital technology can support languages. The method uses Mokken scale analysis
to produce an explainable model for quantifying digital language support and
monitoring it on a global scale.
- Abstract(参考訳): 絶滅危惧種の言語のユーザーは、デジタルで媒介される世界で育つのに苦労している。
我々は,ISO 639で認識されるすべての言語が,デジタル言語サポートにおいてどの程度優れているかを自動評価する方法を開発した。
この評価は、デジタル技術が言語をサポートするための幅広い方法を示すために選ばれた143のデジタルツールのウェブサイトから、サポート対象言語の名前を取り除くことに基づいている。
本手法はMokkenスケール解析を用いて,デジタル言語サポートの定量化と世界規模でのモニタリングを行うための説明可能なモデルを生成する。
関連論文リスト
- Soft Language Identification for Language-Agnostic Many-to-One End-to-End Speech Translation [40.0365339798752]
多くのエンドツーエンドの音声翻訳モデルは、異なるソース言語からの音声信号をターゲット言語でテキストに変換することができる。
場合によっては、入力言語を付与または推定することができる。
我々は、単純で効果的な線形入力ネットワークを導入することで、これを実現する。
論文 参考訳(メタデータ) (2024-06-12T00:00:39Z) - A Roadmap for Multilingual, Multimodal Domain Independent Deception Detection [2.1506382989223782]
人間のコミュニケーションの一般的な側面である騙しは、デジタル時代において大きな変化を遂げた。
近年の研究では、英語の領域にまたがる騙しに普遍的な言語的手がかりが存在する可能性が示されている。
低リソース言語における誤検出の実践的課題は、ラベル付きデータがないため、よく研究されている問題ではない。
論文 参考訳(メタデータ) (2024-05-07T00:38:34Z) - GlobalBench: A Benchmark for Global Progress in Natural Language
Processing [114.24519009839142]
GlobalBenchは、すべての言語におけるすべてのNLPデータセットの進捗を追跡することを目的としている。
話者当たりのユーティリティと、全言語にわたるテクノロジのエクイティをトラックする。
現在、GlobalBenchは190言語で966のデータセットをカバーしており、62言語にまたがる1,128のシステムサブミッションを持っている。
論文 参考訳(メタデータ) (2023-05-24T04:36:32Z) - ReadMe++: Benchmarking Multilingual Language Models for Multi-Domain Readability Assessment [12.704628912075218]
本稿では、アラビア語、英語、フランス語、ヒンディー語、ロシア語で9757文の人間のアノテーションを付加した多言語マルチドメインデータセットであるReadMe++を紹介する。
ReadMe++を使って、教師付き、教師なし、および少数ショットプロンプト設定において、多言語および単言語言語モデルをベンチマークする。
本実験は,ReadMe++で学習したモデルによる優れたドメイン一般化と言語間変換能力の強化によるエキサイティングな結果を示す。
論文 参考訳(メタデータ) (2023-05-23T18:37:30Z) - Scaling Speech Technology to 1,000+ Languages [66.31120979098483]
MMS(Massively Multilingual Speech)プロジェクトは、タスクに応じてサポート言語を10~40倍増やす。
主な材料は、一般に公開されている宗教文書の読解に基づく新しいデータセットである。
我々は,1,406言語,1,107言語用1つの多言語自動音声認識モデル,同一言語用音声合成モデル,4,017言語用言語識別モデルについて,事前学習したwav2vec 2.0モデルを構築した。
論文 参考訳(メタデータ) (2023-05-22T22:09:41Z) - Making a MIRACL: Multilingual Information Retrieval Across a Continuum
of Languages [62.730361829175415]
MIRACLは、WSDM 2023 Cupチャレンジのために構築した多言語データセットです。
18の言語にまたがるアドホック検索に焦点を当てている。
我々の目標は、言語連続体における検索を改善する研究を加速させることです。
論文 参考訳(メタデータ) (2022-10-18T16:47:18Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - Cross-lingual Transfer for Speech Processing using Acoustic Language
Similarity [81.51206991542242]
言語間の移動は、このデジタル分割を橋渡しする魅力的な方法を提供する。
現在の言語間アルゴリズムは、テキストベースのタスクや音声関連タスクを低リソース言語で実現している。
本稿では,数百の言語をまたがる音響的言語間移動対を効率的に同定する言語類似性手法を提案する。
論文 参考訳(メタデータ) (2021-11-02T01:55:17Z) - That Sounds Familiar: an Analysis of Phonetic Representations Transfer
Across Languages [72.9927937955371]
我々は、他言語に存在するリソースを用いて、多言語自動音声認識モデルを訓練する。
我々は,多言語設定における全言語間での大幅な改善と,多言語設定におけるスターク劣化を観察した。
分析の結果、ひとつの言語に固有の電話でさえ、他の言語からのトレーニングデータを追加することで大きなメリットがあることがわかった。
論文 参考訳(メタデータ) (2020-05-16T22:28:09Z) - Mapping Languages: The Corpus of Global Language Use [0.0]
本稿では,このコーパスがデータ駆動型言語マッピングにどのように使用できるかに着目し,グローバル言語を用いたWebベースのコーパスについて述べる。
コーパスには148の言語と158の国を表す423億語が含まれている。
論文 参考訳(メタデータ) (2020-04-02T03:42:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。