論文の概要: Improvement of electronic Governance and mobile Governance in
Multilingual Countries with Digital Etymology using Sanskrit Grammar
- arxiv url: http://arxiv.org/abs/2004.00104v1
- Date: Tue, 31 Mar 2020 20:58:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 01:43:29.320450
- Title: Improvement of electronic Governance and mobile Governance in
Multilingual Countries with Digital Etymology using Sanskrit Grammar
- Title(参考訳): サンスクリット文法を用いた多言語国における電子ガバナンスとモバイルガバナンスの改善
- Authors: Arijit Das and Diganta Saha
- Abstract要約: 我々は,パニアン・グラマティカル・ルールを用いて,表面レベルや形態変化した単語から自動的に根抽出するシステムを訓練した。
語源はROOT形式を用いて単語を関連付けるために用いられる。
プログラムを拡張して、あらゆる言語の単語を文法化することに取り組んでいます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With huge improvement of digital connectivity (Wifi,3G,4G) and digital
devices access to internet has reached in the remotest corners now a days.
Rural people can easily access web or apps from PDAs, laptops, smartphones etc.
This is an opportunity of the Government to reach to the citizen in large
number, get their feedback, associate them in policy decision with e governance
without deploying huge man, material or resourses. But the Government of
multilingual countries face a lot of problem in successful implementation of
Government to Citizen (G2C) and Citizen to Government (C2G) governance as the
rural people tend and prefer to interact in their native languages. Presenting
equal experience over web or app to different language group of speakers is a
real challenge. In this research we have sorted out the problems faced by Indo
Aryan speaking netizens which is in general also applicable to any language
family groups or subgroups. Then we have tried to give probable solutions using
Etymology. Etymology is used to correlate the words using their ROOT forms. In
5th century BC Panini wrote Astadhyayi where he depicted sutras or rules -- how
a word is changed according to person,tense,gender,number etc. Later this book
was followed in Western countries also to derive their grammar of comparatively
new languages. We have trained our system for automatic root extraction from
the surface level or morphed form of words using Panian Gramatical rules. We
have tested our system over 10000 bengali Verbs and extracted the root form
with 98% accuracy. We are now working to extend the program to successfully
lemmatize any words of any language and correlate them by applying those rule
sets in Artificial Neural Network.
- Abstract(参考訳): デジタル接続(Wifi,3G,4G)の大幅な改善と、インターネットにアクセスするデジタルデバイスが、現在、最遠の角に到達している。
農村の人々は、PDA、ラップトップ、スマートフォンなどから簡単にWebやアプリにアクセスできます。
これは政府にとって、大量の市民にリーチし、彼らのフィードバックを得て、巨大な人材、物質、または反省を配置することなく、政策決定とeガバナンスに関連付ける機会である。
しかし、多言語国家の政府は、農村住民が母国語で対話する傾向にあるため、市民政府(G2C)と市民政府(C2G)の統治を成功させる上で、多くの問題に直面している。
Webやアプリ上で平等な体験を異なる言語グループに提示することは、真の課題です。
本研究では,Indo Aryan 話者が直面している問題を,言語族群やサブグループにも適用可能な問題として整理した。
そして、Etymologyを使って確率的解決策を与えようとした。
語源はROOT形式を用いて単語を関連付けるために用いられる。
紀元前5世紀、パニーニは「astadhyayi」を著し、経典や規則を描いている。
その後、西洋諸国でも比較的新しい言語の文法を導出するためにこの本が続いた。
我々は,パニアン・グラマティカル・ルールを用いて,表面レベルや形態変化した単語から自動的に根抽出するシステムを訓練した。
我々は10000個以上のベンガリバーブを試験し,98%の精度で根形態を抽出した。
我々は現在、プログラムを拡張して、任意の言語の単語を文法化し、それらのルールセットをニューラルネットワークに適用することでそれらを相関付けしています。
関連論文リスト
- Harnessing the Power of Artificial Intelligence to Vitalize Endangered Indigenous Languages: Technologies and Experiences [31.62071644137294]
我々は、世界の言語の多様性の低下と、AIとNLPに固有の倫理的課題をもたらすインディジェネラル言語について論じる。
Indigenous Language のための高品質な機械学習トランスレータの開発に励む成果を報告する。
私たちは2023年と2024年にブラジルの先住民コミュニティで実施したプロジェクトで構築したプロトタイプを紹介します。
論文 参考訳(メタデータ) (2024-07-17T14:46:37Z) - What do Transformers Know about Government? [0.5057850174013127]
特に,BERTが文中の構成要素間の政府関係をエンコードする方法について検討する。
我々の実験は、政府に関する情報がトランスフォーマーのすべての層にエンコードされていることを示しているが、主にモデルの初期段階にある。
私たちは、実験で言語における数千のレムマに関する政府関係を定義するデータセットであるGovernment Bankをリリースします。
論文 参考訳(メタデータ) (2024-04-22T15:15:50Z) - How Generative-AI can be Effectively used in Government Chatbots [0.0]
本稿では広東省の政府チャットボットChatGPTと,大規模言語モデルWenxin Ernieの比較を行った。
この研究は、政府のチャットボットと大きな言語モデルの間に大きな違いを見出した。
政府のチャットボットの今後の方向性をより深く探求するため,本研究では,目標とする最適化経路を提案する。
論文 参考訳(メタデータ) (2023-11-29T07:27:15Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - Language Models are Multilingual Chain-of-Thought Reasoners [83.37148309771378]
本稿では,250の小学校数学問題を10の類型的多言語に手動で翻訳することで,多言語学級数学のベンチマークを導入する。
MGSM問題をチェーン・オブ・ソートにより解く能力は,モデルスケールの増大とともに出現する。
言語モデルの多言語推論能力は他のタスクにも及んでいることを示す。
論文 参考訳(メタデータ) (2022-10-06T17:03:34Z) - Role of Artificial Intelligence in Detection of Hateful Speech for
Hinglish Data on Social Media [1.8899300124593648]
ヒンディー語と英語のコードミックスデータ(Hinglish)の流行は、世界中の都市人口のほとんどで増加しています。
ほとんどのソーシャルネットワークプラットフォームが展開するヘイトスピーチ検出アルゴリズムは、これらのコード混合言語に投稿された不快で虐待的なコンテンツをフィルタリングできない。
非構造化コードミックスHinglish言語の効率的な検出方法を提案する。
論文 参考訳(メタデータ) (2021-05-11T10:02:28Z) - Acoustics Based Intent Recognition Using Discovered Phonetic Units for
Low Resource Languages [51.0542215642794]
本稿では,検出された音素単位を意図分類に用いる新しい音響に基づく意図認識システムを提案する。
我々は,2つの言語群 – インディカル言語とロマンス言語 – に対する2つの異なる意図認識タスクの結果を提示する。
論文 参考訳(メタデータ) (2020-11-07T00:35:31Z) - Mere account mein kitna balance hai? -- On building voice enabled
Banking Services for Multilingual Communities [47.955173277834795]
我々は,多言語社会のための音声対応型銀行サービスの構築に向けた最初の取り組みについて紹介する。
コードミキシング(Code Mixing)は、ある言語からの語彙項目が別の言語の発話に埋め込まれる現象である。
音声に基づく意図認識システムを構築するための様々な訓練戦略について検討する。
論文 参考訳(メタデータ) (2020-10-09T01:20:09Z) - SIGMORPHON 2020 Shared Task 0: Typologically Diverse Morphological
Inflection [81.85463892070085]
形態的回帰に関するSIGMORPHON 2020の課題は、型的に異なる言語にまたがるシステムの一般化能力を調査することを目的としている。
システムは45言語と5つの言語ファミリーのデータを使用して開発され、追加の45言語と10の言語ファミリー(合計13言語)のデータで微調整され、90言語すべてで評価された。
論文 参考訳(メタデータ) (2020-06-20T13:24:14Z) - That Sounds Familiar: an Analysis of Phonetic Representations Transfer
Across Languages [72.9927937955371]
我々は、他言語に存在するリソースを用いて、多言語自動音声認識モデルを訓練する。
我々は,多言語設定における全言語間での大幅な改善と,多言語設定におけるスターク劣化を観察した。
分析の結果、ひとつの言語に固有の電話でさえ、他の言語からのトレーニングデータを追加することで大きなメリットがあることがわかった。
論文 参考訳(メタデータ) (2020-05-16T22:28:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。