論文の概要: Multilinguality at the Edge: Developing Language Models for the Global South
- arxiv url: http://arxiv.org/abs/2604.21637v1
- Date: Thu, 23 Apr 2026 12:53:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.503491
- Title: Multilinguality at the Edge: Developing Language Models for the Global South
- Title(参考訳): エッジにおける多言語性:グローバル・サウスのための言語モデルの開発
- Authors: Lester James V. Miranda, Songbo Hu, Roi Reichart, Anna Korhonen,
- Abstract要約: 私たちはこの課題を、マルチ言語とエッジデプロイメントの交差点である、最後のマイルと呼んでいる。
この問題に対処する232の論文を言語モデリングパイプラインで調査する。
この研究が包括的で公平な言語技術の発展に寄与することを願っている。
- 参考スコア(独自算出の注目度): 36.43004021646316
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Where and how language models (LMs) are deployed determines who can benefit from them. However, there are several challenges that prevent effective deployment of LMs in non-English-speaking and hardware constrained communities in the Global South. We call this challenge the last mile: the intersection of multilinguality and edge deployment, where the goals are aligned but the technical requirements often compete. Studying these two fields together is both a need, as linguistically diverse communities often face the most severe infrastructure constraints, and an opportunity, as edge and multilingual NLP research remain largely siloed. To understand the state of the art and the challenges of combining the two areas, we survey 232 papers that tackle this problem across the language modelling pipeline, from data collection to development and deployment. We also discuss open questions and provide actionable recommendations for different stakeholders in the NLP ecosystem. Finally, we hope that this work contributes to the development of inclusive and equitable language technologies.
- Abstract(参考訳): 言語モデル(LM)のデプロイ方法とデプロイ方法によって、誰がそのメリットを享受できるかが決定される。
しかし、グローバル・サウスの非英語・ハードウェア制約地域において、LMを効果的に展開することを妨げるいくつかの課題がある。
目標は整っているが、技術的な要件はしばしば競合する、多言語性とエッジデプロイメントの交差点です。
これら2つの分野を一緒に研究することは、言語的に多様なコミュニティが、しばしば最も厳しいインフラの制約に直面しており、エッジとマルチリンガルのNLP研究が概ねサイロ化されているため、機会である。
データ収集から開発,デプロイメントに至るまで,言語モデリングパイプライン全体でこの問題に対処する232の論文を調査した。
オープンな質問についても議論し、NLPエコシステムにおけるさまざまな利害関係者に対して実行可能なレコメンデーションを提供します。
最後に,本研究が包括的で公平な言語技術の発展に寄与することを願っている。
関連論文リスト
- Low-Resource, High-Impact: Building Corpora for Inclusive Language Technologies [11.52881045684005]
このチュートリアルは、多言語および低リソース言語を扱うNLP実践者、研究者、開発者向けに設計されている。
参加者は、表現不足の言語のためのエンドツーエンドのNLPパイプラインを構築するための実用的なツールキットを使い果たします。
論文 参考訳(メタデータ) (2025-12-16T16:44:17Z) - A Capabilities Approach to Studying Bias and Harm in Language Technologies [4.135516576952934]
我々は、能力アプローチのレンズを通して、言語技術への公平さ、偏見、包摂性を考察する。
能力のアプローチは、人々が達成できるものに集中し、社会的、政治的、経済的文脈を考慮に入れている。
本稿では,機能アプローチ,多言語・多文化的評価との関係,言語技術の有害性の定義と評価において,コミュニティメンバと有意義な協力を得られるか,について詳述する。
論文 参考訳(メタデータ) (2024-11-06T22:46:13Z) - A Survey on Large Language Models with Multilingualism: Recent Advances and New Frontiers [51.8203871494146]
LLM(Large Language Models)の急速な開発は、自然言語処理における顕著な多言語機能を示している。
LLMのブレークスルーにもかかわらず、多言語シナリオの研究は依然として不十分である。
本調査は,多言語問題に対する研究コミュニティの取り組みを支援することを目的としており,LLMに基づく多言語自然言語処理における中核概念,鍵技術,最新の発展の包括的理解を提供する。
論文 参考訳(メタデータ) (2024-05-17T17:47:39Z) - Multilingual Large Language Model: A Survey of Resources, Taxonomy and Frontiers [81.47046536073682]
本稿では,MLLM(Multilingual Large Language Model)文学における最近の進歩と新たなトレンドを要約する一貫した視点を提示する。
私たちの研究がコミュニティに迅速なアクセスを提供し、MLLMにおける画期的な研究を促進することを願っています。
論文 参考訳(メタデータ) (2024-04-07T11:52:44Z) - Multilingual Multimodality: A Taxonomical Survey of Datasets,
Techniques, Challenges and Opportunities [10.721189858694396]
マルチ言語とマルチモーダル(MultiX)ストリームの統合について検討する。
我々は、並列アノテーションで研究された言語、金または銀のデータを調べ、これらのモダリティと言語がモデリングにおいてどのように相互作用するかを理解する。
モデリングアプローチの長所と短所とともに、どのシナリオを確実に使用できるのかをよりよく理解するために、モデリングアプローチについて説明します。
論文 参考訳(メタデータ) (2022-10-30T21:46:01Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems [51.328224222640614]
大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
論文 参考訳(メタデータ) (2021-04-17T15:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。