論文の概要: A Panoramic Survey of Natural Language Processing in the Arab World
- arxiv url: http://arxiv.org/abs/2011.12631v3
- Date: Mon, 27 Sep 2021 07:13:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 02:37:01.438708
- Title: A Panoramic Survey of Natural Language Processing in the Arab World
- Title(参考訳): アラブ世界における自然言語処理のパノラマ調査
- Authors: Kareem Darwish and Nizar Habash and Mourad Abbas and Hend Al-Khalifa
and Huseein T. Al-Natsheh and Samhaa R. El-Beltagy and Houda Bouamor and
Karim Bouzoubaa and Violetta Cavalli-Sforza and Wassim El-Hajj and Mustafa
Jarrar and Hamdy Mubarak
- Abstract要約: 自然言語(英: natural language)とは、意図的な人間の計画や設計を伴わない、象徴的なコミュニケーション(書面、署名、書面)のシステムを指す用語である。
自然言語処理(NLP)は、音声認識や合成、機械翻訳、光学文字認識(OCR)、感情分析(SA)、質問応答、対話システムなどの応用を構築するために自然言語をモデル化することに焦点を当てた人工知能(AI)のサブフィールドである。
- 参考スコア(独自算出の注目度): 12.064637486695485
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The term natural language refers to any system of symbolic communication
(spoken, signed or written) without intentional human planning and design. This
distinguishes natural languages such as Arabic and Japanese from artificially
constructed languages such as Esperanto or Python. Natural language processing
(NLP) is the sub-field of artificial intelligence (AI) focused on modeling
natural languages to build applications such as speech recognition and
synthesis, machine translation, optical character recognition (OCR), sentiment
analysis (SA), question answering, dialogue systems, etc. NLP is a highly
interdisciplinary field with connections to computer science, linguistics,
cognitive science, psychology, mathematics and others. Some of the earliest AI
applications were in NLP (e.g., machine translation); and the last decade
(2010-2020) in particular has witnessed an incredible increase in quality,
matched with a rise in public awareness, use, and expectations of what may have
seemed like science fiction in the past. NLP researchers pride themselves on
developing language independent models and tools that can be applied to all
human languages, e.g. machine translation systems can be built for a variety of
languages using the same basic mechanisms and models. However, the reality is
that some languages do get more attention (e.g., English and Chinese) than
others (e.g., Hindi and Swahili). Arabic, the primary language of the Arab
world and the religious language of millions of non-Arab Muslims is somewhere
in the middle of this continuum. Though Arabic NLP has many challenges, it has
seen many successes and developments. Next we discuss Arabic's main challenges
as a necessary background, and we present a brief history of Arabic NLP. We
then survey a number of its research areas, and close with a critical
discussion of the future of Arabic NLP.
- Abstract(参考訳): 自然言語(英: natural language)とは、意図的な人間の計画や設計を伴わない象徴的コミュニケーション(話し方、署名、書き方)のシステムを指す。
これはアラビア語や日本語のような自然言語とエスペラントやPythonのような人工的に構築された言語を区別する。
自然言語処理(NLP)は、音声認識や合成、機械翻訳、光学文字認識(OCR)、感情分析(SA)、質問応答、対話システムなどの応用を構築するために自然言語をモデル化することに焦点を当てた人工知能(AI)のサブフィールドである。
nlpはコンピュータ科学、言語学、認知科学、心理学、数学などと結びついた非常に学際的な分野である。
初期のAI応用のいくつかはNLP(例えば機械翻訳)であり、特に過去10年間(2010-2020)は、過去のSFのように思われたものの、大衆の認識、使用、期待の高まりと一致した、驚くほどの品質向上を目撃している。
NLP研究者は、言語に依存しないモデルやツールの開発を誇りにしている。例えば、機械翻訳システムは、同じ基本的なメカニズムとモデルを使って、様々な言語向けに構築することができる。
しかし現実には、一部の言語(英語や中国語など)は他の言語(ヒンディー語やスワヒリ語など)よりも注目を集めている。
アラブ世界の第一言語であるアラビア語と、何百万人もの非アラブ系ムスリムの宗教言語はこの連続体の真ん中にある。
アラビア語のNLPには多くの課題があるが、多くの成功と発展が見られた。
次に、必要な背景としてアラビア語の主な課題について議論し、アラビア語NLPの簡単な歴史を示す。
その後、多くの研究分野を調査し、アラビアNLPの将来についての批判的な議論に近づいた。
関連論文リスト
- Computational Approaches to Arabic-English Code-Switching [0.0]
我々は,現代標準アラビア語およびアラビア語-英語NERタスクの最先端技術を提案し,適用する。
NERタスクのための最初の注釈付きCSアラビア英語コーパスを作成しました。
すべての手法がCSデータ上でNERタグガーの性能を改善した。
論文 参考訳(メタデータ) (2024-10-17T08:20:29Z) - Harnessing the Power of Artificial Intelligence to Vitalize Endangered Indigenous Languages: Technologies and Experiences [31.62071644137294]
我々は、世界の言語の多様性の低下と、AIとNLPに固有の倫理的課題をもたらすインディジェネラル言語について論じる。
Indigenous Language のための高品質な機械学習トランスレータの開発に励む成果を報告する。
私たちは2023年と2024年にブラジルの先住民コミュニティで実施したプロジェクトで構築したプロトタイプを紹介します。
論文 参考訳(メタデータ) (2024-07-17T14:46:37Z) - Enhancing Language Learning through Technology: Introducing a New English-Azerbaijani (Arabic Script) Parallel Corpus [0.9051256541674136]
本稿では,英語・アゼルバイジャン語の並列コーパスについて紹介する。
これは、低リソース言語のための言語学習と機械翻訳の技術的ギャップを埋めるように設計されている。
論文 参考訳(メタデータ) (2024-07-06T21:23:20Z) - What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文 参考訳(メタデータ) (2024-02-19T09:15:28Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - Neural Machine Translation for the Indigenous Languages of the Americas:
An Introduction [102.13536517783837]
アメリカ大陸のほとんどの言語は、もしあるならば、並列データと単言語データしか持たない。
これらの言語におけるNLPコミュニティの関心が高まった結果、最近の進歩、発見、オープンな質問について論じる。
論文 参考訳(メタデータ) (2023-06-11T23:27:47Z) - Discovering Phonetic Inventories with Crosslingual Automatic Speech
Recognition [71.49308685090324]
本稿では,未知言語における音声認識における異なる要因(モデルアーキテクチャ,音韻モデル,音声表現の種類)の影響について検討する。
独特な音、類似した音、トーン言語は、音声による在庫発見の大きな課題である。
論文 参考訳(メタデータ) (2022-01-26T22:12:55Z) - Including Signed Languages in Natural Language Processing [48.62744923724317]
署名された言語は、聴覚障害者や難聴者のコミュニケーションの主な手段です。
このポジショニングペーパーは、NLPコミュニティに対して、社会的および科学的影響の高い研究領域として署名された言語を含めるよう求めている。
論文 参考訳(メタデータ) (2021-05-11T17:37:55Z) - OkwuGb\'e: End-to-End Speech Recognition for Fon and Igbo [0.015863809575305417]
本稿では,Fon の最先端 ASR モデルと Igbo のベンチマーク ASR モデルについて述べる。
本稿では,各言語の包括的言語分析を行い,両言語間のエンドツーエンド,ディープニューラルネットワークに基づく音声認識モデルの作成について述べる。
論文 参考訳(メタデータ) (2021-03-13T18:02:44Z) - SIGMORPHON 2020 Shared Task 0: Typologically Diverse Morphological
Inflection [81.85463892070085]
形態的回帰に関するSIGMORPHON 2020の課題は、型的に異なる言語にまたがるシステムの一般化能力を調査することを目的としている。
システムは45言語と5つの言語ファミリーのデータを使用して開発され、追加の45言語と10の言語ファミリー(合計13言語)のデータで微調整され、90言語すべてで評価された。
論文 参考訳(メタデータ) (2020-06-20T13:24:14Z) - Can Multilingual Language Models Transfer to an Unseen Dialect? A Case
Study on North African Arabizi [2.76240219662896]
本研究では,多言語モデルによる未知の方言の処理能力について検討する。
弊社のケーススタディは、北アフリカアラビアのユーザ生成を例に挙げる。
ゼロショットおよび教師なし適応シナリオでは、多言語言語モデルがそのような未知の方言に変換できることが示される。
論文 参考訳(メタデータ) (2020-05-01T11:29:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。