論文の概要: Information availability in different languages and various technological constraints related to multilinguism on the Internet
- arxiv url: http://arxiv.org/abs/2508.17918v1
- Date: Mon, 25 Aug 2025 11:35:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.753107
- Title: Information availability in different languages and various technological constraints related to multilinguism on the Internet
- Title(参考訳): 異なる言語における情報提供とインターネット上の多言語化に関連する様々な技術的制約
- Authors: Sonal Khosla, Haridasa Acharya,
- Abstract要約: 1995年から2010年にかけて、インターネット利用者数は16億人から16億5000万人に増加した。
世界人口の20-25%が母国語として英語を話している。
本稿では,異なる言語における情報提供の必要性と,インターネット上での多言語化に関連する様々な技術的制約について分析する。
- 参考スコア(独自算出の注目度): 0.07812854697536452
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The usage of Internet has grown exponentially over the last two decades. The number of Internet users has grown from 16 Million to 1650 Million from 1995 to 2010. It has become a major repository of information catering almost every area. Since the Internet has its origin in USA which is English speaking country there is huge dominance of English on the World Wide Web. Although English is a globally acceptable language, still there is a huge population in the world which is not able to access the Internet due to language constraints. It has been estimated that only 20-25% of the world population speaks English as a native language. More and more people are accessing the Internet nowadays removing the cultural and linguistic barriers and hence there is a high growth in the number of non-English speaking users over the last few years on the Internet. Although many solutions have been provided to remove the linguistic barriers, still there is a huge gap to be filled. This paper attempts to analyze the need of information availability in different languages and the various technological constraints related to multi-linguism on the Internet.
- Abstract(参考訳): 過去20年間でインターネットの利用は指数関数的に増加した。
1995年から2010年にかけて、インターネット利用者数は16億人から16億5000万人に増加した。
ほぼすべての地域の情報を保管する主要なリポジトリとなっている。
インターネットは、英語圏のアメリカに起源を持つため、World Wide Web上では、英語が圧倒的に優勢である。
英語は世界的に受け入れられる言語であるが、言語制約によりインターネットにアクセスできない人口は世界規模である。
世界人口の20-25%が母国語として英語を話していると推計されている。
近年は、文化や言語的な障壁を取り除き、インターネットにアクセスする人が増えているため、インターネット上での英語を話さないユーザーの数は、ここ数年で増加傾向にある。
言語的障壁を取り除くための多くのソリューションが提供されてきたが、それでも満たすべき大きなギャップがある。
本稿では,異なる言語における情報提供の必要性と,インターネット上での多言語化に関連する様々な技術的制約について分析する。
関連論文リスト
- A Survey on Automatic Online Hate Speech Detection in Low-Resource Languages [0.5825410941577593]
ソーシャルメディアとインターネットのアクセシビリティはヘイトスピーチの普及を促している。
本稿は、世界中の低リソース言語におけるヘイトスピーチ検出に関する詳細な調査である。
論文 参考訳(メタデータ) (2024-11-28T09:42:53Z) - Socially Responsible Data for Large Multilingual Language Models [12.338723881042926]
大規模言語モデル(LLM)は、過去3年間で、急速にサイズと明らかな能力が向上している。
グローバル・ノース以外の地域社会の言語に対応するためのモデルを模索している。
論文 参考訳(メタデータ) (2024-09-08T23:51:04Z) - Mapping Language Literacy At Scale: A Case Study on Facebook [6.402634424631123]
本研究は,世界の160か国以上におけるオンライン人口の言語リテラシースキルを体系的に研究する。
本研究では,成人Facebook利用者の投稿を集約・非特定し,オンライン人口に対する人口レベルリテラシー推定手法を開発した。
Facebookでは、多くの国で女性が男性よりも高い言語リテラシーを示していますが、アフリカとアジアでは大きなギャップが残っています。
論文 参考訳(メタデータ) (2023-03-21T20:24:13Z) - Towards continually learning new languages [66.36852845415916]
言語のバッチ学習は経済的に有益だが、大きな課題は破滅的な忘れ方だ。
我々は,破滅的忘れを抑えるために,重量分解特性と弾性重みの固化特性を組み合わせる。
私たちは、すべての言語をゼロからトレーニングするのに比べ、破滅的な忘れものもなく、合理的なパフォーマンスで26の言語を達成しています。
論文 参考訳(メタデータ) (2022-11-21T18:24:34Z) - Making a MIRACL: Multilingual Information Retrieval Across a Continuum
of Languages [62.730361829175415]
MIRACLは、WSDM 2023 Cupチャレンジのために構築した多言語データセットです。
18の言語にまたがるアドホック検索に焦点を当てている。
我々の目標は、言語連続体における検索を改善する研究を加速させることです。
論文 参考訳(メタデータ) (2022-10-18T16:47:18Z) - NusaX: Multilingual Parallel Sentiment Dataset for 10 Indonesian Local
Languages [100.59889279607432]
インドネシアにおける言語の資源開発に重点を置いている。
インドネシアのほとんどの言語は絶滅危惧種に分類され、一部は絶滅している。
インドネシアで10の低リソース言語を対象とした,最初の並列リソースを開発した。
論文 参考訳(メタデータ) (2022-05-31T17:03:50Z) - SIGMORPHON 2020 Shared Task 0: Typologically Diverse Morphological
Inflection [81.85463892070085]
形態的回帰に関するSIGMORPHON 2020の課題は、型的に異なる言語にまたがるシステムの一般化能力を調査することを目的としている。
システムは45言語と5つの言語ファミリーのデータを使用して開発され、追加の45言語と10の言語ファミリー(合計13言語)のデータで微調整され、90言語すべてで評価された。
論文 参考訳(メタデータ) (2020-06-20T13:24:14Z) - Characterising User Content on a Multi-lingual Social Network [9.13241181020543]
インドにおけるShareChatと呼ばれる多言語ソーシャルネットワークの特性について紹介する。
私たちは、2019年のインド総選挙の前と14の言語で72週間にわたって、網羅的なデータセットを収集しました。
テルグ語、マラヤラム語、タミル語、カナダ語は政治的イメージの誘惑に支配的であることが判明した。
論文 参考訳(メタデータ) (2020-04-23T22:25:48Z) - Improvement of electronic Governance and mobile Governance in
Multilingual Countries with Digital Etymology using Sanskrit Grammar [0.0]
我々は,パニアン・グラマティカル・ルールを用いて,表面レベルや形態変化した単語から自動的に根抽出するシステムを訓練した。
語源はROOT形式を用いて単語を関連付けるために用いられる。
プログラムを拡張して、あらゆる言語の単語を文法化することに取り組んでいます。
論文 参考訳(メタデータ) (2020-03-31T20:58:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。