論文の概要: AI Diffusion in Low Resource Language Countries
- arxiv url: http://arxiv.org/abs/2511.02752v1
- Date: Tue, 04 Nov 2025 17:31:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:06.121461
- Title: AI Diffusion in Low Resource Language Countries
- Title(参考訳): 低資源言語諸国におけるAI拡散
- Authors: Amit Misra, Syed Waqas Zamir, Wassim Hamidouche, Inbal Becker-Reshef, Juan Lavista Ferres,
- Abstract要約: 低リソース言語諸国(LRLC)のAIユーザは、ベースラインに比べて約20%低い。
言語的アクセシビリティは、公平なAI拡散に対する重要な独立した障壁である。
- 参考スコア(独自算出の注目度): 10.939989206795047
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial intelligence (AI) is diffusing globally at unprecedented speed, but adoption remains uneven. Frontier Large Language Models (LLMs) are known to perform poorly on low-resource languages due to data scarcity. We hypothesize that this performance deficit reduces the utility of AI, thereby slowing adoption in Low-Resource Language Countries (LRLCs). To test this, we use a weighted regression model to isolate the language effect from socioeconomic and demographic factors, finding that LRLCs have a share of AI users that is approximately 20% lower relative to their baseline. These results indicate that linguistic accessibility is a significant, independent barrier to equitable AI diffusion.
- Abstract(参考訳): 人工知能(AI)は前例のないスピードで世界中に拡散している。
Frontier Large Language Models (LLMs) は、データ不足のため、低リソース言語ではパフォーマンスが悪いことが知られている。
我々は,この性能欠陥がAIの有用性を低下させ,低資源言語諸国(LRLC)の採用を鈍化させるという仮説を立てた。
これをテストするために、重み付き回帰モデルを用いて、言語効果を社会経済的、人口統計学的要因から分離し、LRLCがベースラインに対して約20%低いAIユーザを持つことを示した。
これらの結果は、言語的アクセシビリティが、公平なAI拡散に対する重要な独立した障壁であることを示している。
関連論文リスト
- Enhancing Code Generation for Low-Resource Languages: No Silver Bullet [55.39571645315926]
大規模言語モデル(LLM)は、プログラミング言語の構文、意味論、使用パターンを学ぶために、大規模で多様なデータセットに依存している。
低リソース言語では、そのようなデータの限られた可用性は、モデルを効果的に一般化する能力を損なう。
本稿では,低リソース言語におけるLLMの性能向上のためのいくつかの手法の有効性を実証研究する。
論文 参考訳(メタデータ) (2025-01-31T12:23:28Z) - Think Outside the Data: Colonial Biases and Systemic Issues in Automated Moderation Pipelines for Low-Resource Languages [13.011117871938561]
AIによるモデレーションシステムは、Global Southで話されている低リソース言語と競合する。
調査の結果,データ不足に加えて,IT企業によるユーザデータの独占といった社会的政治的要因が,歴史的不平等を悪化させることが明らかとなった。
これらの制限は、単に「データ不足」によって引き起こされる技術的なギャップであるだけでなく、非西洋語の植民地的抑圧に根ざした構造的不平等を反映している、と我々は主張する。
論文 参考訳(メタデータ) (2025-01-23T17:01:53Z) - Building an Efficient Multilingual Non-Profit IR System for the Islamic Domain Leveraging Multiprocessing Design in Rust [0.0]
本研究は、イスラムドメインのための多言語非営利IRシステムの開発に焦点を当てている。
ドメイン適応の継続事前学習やモデルサイズ削減のための言語削減といった手法を用いて,軽量な多言語検索モデルを構築した。
論文 参考訳(メタデータ) (2024-11-09T11:37:18Z) - Double Jeopardy and Climate Impact in the Use of Large Language Models: Socio-economic Disparities and Reduced Utility for Non-English Speakers [0.0]
私たちは,OpenAIのGPTモデルをAPI経由で使用する場合,入力の処理方法であるトークン化によって,英語話者のコストが高くなることを示した。
約15億人は、主に低所得国の言語を話し、英語話者が直面しているものよりも4倍から6倍のコストがかかる可能性がある。
このことは、全ての言語グループに利益をもたらすためのより公平なアルゴリズム開発の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-10-14T16:11:04Z) - SMILE: Speech Meta In-Context Learning for Low-Resource Language Automatic Speech Recognition [55.2480439325792]
音声メタインコンテキスト学習(SMILE)は、メタラーニングと音声インコンテキスト学習(SICL)を組み合わせた革新的なフレームワークである
SMILEは、トレーニング不要な多言語ASRタスクにおいて、ベースライン手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2024-09-16T16:04:16Z) - Unlocking the Potential of Model Merging for Low-Resource Languages [66.7716891808697]
大規模言語モデルを新しい言語に適応させるには、通常、継続事前訓練(CT)と、教師付き微調整(SFT)が含まれる。
我々は低リソース言語の代替としてモデルマージを提案し、異なる機能を持つモデルを追加トレーニングなしで単一のモデルに組み合わせる。
Llama-2-7Bをベースとした実験により、モデルマージはタスク解決能力の低い低リソース言語に対して、極めて少ないデータを持つシナリオにおいて、CT-then-SFTよりも優れていることが実証された。
論文 参考訳(メタデータ) (2024-07-04T15:14:17Z) - LLMs in the Loop: Leveraging Large Language Model Annotations for Active Learning in Low-Resource Languages [1.149936119867417]
低リソース言語は、限られた言語資源とデータラベリングの専門知識のために、AI開発において重大な障壁に直面している。
データアノテーションのアクティブ学習ループにおけるLLMの可能性を活用することを提案する。
GPT-4-Turboを用いた実証的な評価では、データ要求が大幅に削減され、最先端の性能が実証された。
論文 参考訳(メタデータ) (2024-04-02T19:34:22Z) - Improving Candidate Generation for Low-resource Cross-lingual Entity
Linking [81.41804263432684]
XEL(クロスランガル・エンティティ・リンク)は、ソース言語テキストから抽出された参照をターゲット言語知識ベース(KB)で検索するタスクである。
本稿では,(1)エンティティ参照とKBエントリの切断を減らすこと,(2)低リソースシナリオへのモデルの堅牢性を改善すること,の3つの改良を提案する。
論文 参考訳(メタデータ) (2020-03-03T05:32:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。