論文の概要: Towards Systematic Monolingual NLP Surveys: GenA of Greek NLP
- arxiv url: http://arxiv.org/abs/2407.09861v3
- Date: Fri, 31 Jan 2025 16:28:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-03 13:59:58.631765
- Title: Towards Systematic Monolingual NLP Surveys: GenA of Greek NLP
- Title(参考訳): 単言語NLPの体系化に向けて:ギリシャ語NLPのGenA
- Authors: Juli Bakagianni, Kanella Pouli, Maria Gavriilidou, John Pavlopoulos,
- Abstract要約: 本研究は、体系的かつ総合的なモノリンガルNLPサーベイを作成するための一般化可能な方法論を紹介する。
本手法をギリシャのNLP(2012-2023)に適用し,その現状と課題を概観する。
- 参考スコア(独自算出の注目度): 2.3499129784547663
- License:
- Abstract: Natural Language Processing (NLP) research has traditionally been predominantly focused on English, driven by the availability of resources, the size of the research community, and market demands. Recently, there has been a noticeable shift towards multilingualism in NLP, recognizing the need for inclusivity and effectiveness across diverse languages and cultures. Monolingual surveys have the potential to complement the broader trend towards multilingualism in NLP by providing foundational insights and resources, necessary for effectively addressing the linguistic diversity of global communication. However, monolingual NLP surveys are extremely rare in the literature. This study introduces a generalizable methodology for creating systematic and comprehensive monolingual NLP surveys, aimed at optimizing the process of constructing such surveys and thoroughly addressing a language's NLP support. Our approach integrates a structured search protocol to avoid selection bias and ensure reproducibility, an NLP task taxonomy to organize the surveyed material coherently, and language resources (LRs) taxonomies to identify potential benchmarks and highlight opportunities for improving resource availability (e.g., through better maintenance or licensing). We apply this methodology to Greek NLP (2012-2023), providing a comprehensive overview of its current state and challenges. We discuss the progress of Greek NLP and outline the Greek LRs found, classified by availability and usability, assessing language support per NLP task. The presented systematic literature review of Greek NLP serves as an application of our method that showcases the benefits of monolingual NLP surveys more broadly. Similar applications could be considered for the myriads of languages whose progress in NLP lags behind that of well-supported languages.
- Abstract(参考訳): 自然言語処理(NLP)の研究は伝統的に、資源の入手、研究コミュニティの大きさ、市場要求などによって、主に英語に焦点を当ててきた。
近年、NLPにおける多言語主義への顕著なシフトがあり、多様な言語や文化にまたがる傾きと有効性の必要性を認識している。
モノリンガルサーベイは、グローバルコミュニケーションの言語多様性を効果的に解決するために必要な基礎的な洞察と資源を提供することによって、NLPにおける多言語主義に対するより広範な傾向を補完する可能性がある。
しかし、モノリンガルNLPサーベイは文献では非常に稀である。
本研究では,一言語によるNLP調査を体系的かつ包括的に作成するための一般化可能な方法論を紹介し,そのような調査を最適化し,言語のNLPサポートを徹底的に解決することを目的とする。
提案手法は,選択バイアスを回避し再現性を確保するための構造化検索プロトコルと,調査対象を整合的に整理するNLPタスク分類と,潜在的なベンチマークを特定し,リソースの可用性向上(例えば,メンテナンスやライセンスの改善による)の機会を強調するための言語資源(LR)分類を統合したものである。
本手法をギリシャのNLP(2012-2023)に適用し,その現状と課題を概観する。
我々は,ギリシャのNLPの進捗状況について考察し,NLPタスクごとの言語サポートを評価し,可用性とユーザビリティによって分類されたギリシアのLRについて概説する。
ギリシャ語NLPの体系的文献レビューは,モノリンガルNLP調査のメリットをより広く示す手法の応用として有用である。
同様の応用は、NLPの進歩が十分にサポートされた言語よりも遅れている、無数の言語に対して考えられる。
関連論文リスト
- A survey of neural-network-based methods utilising comparable data for finding translation equivalents [0.0]
NLPの最も一般的なアプローチとして,必要な辞書コンポーネントの1つを自動生成する手法を提案する。
記述法の改善に欠かせないので,レキソグラフィの観点から解析する。
この調査は、NLPフィールドがレキシコグラフィーの洞察の恩恵を受けることができるため、NLPフィールドとレキシコグラフィーフィールドの接続を奨励する。
論文 参考訳(メタデータ) (2024-10-19T16:10:41Z) - The Nature of NLP: Analyzing Contributions in NLP Papers [77.31665252336157]
我々は,NLP研究を構成するものについて,研究論文から定量的に検討する。
以上の結果から,NLPにおける機械学習の関与は,90年代前半から増加傾向にあることが明らかとなった。
2020年以降、言語と人々への関心が復活した。
論文 参考訳(メタデータ) (2024-09-29T01:29:28Z) - The Ghanaian NLP Landscape: A First Look [9.17372840572907]
特にガーナ語は絶滅が記録され、いくつかは危険にさらされている。
本研究は、ガーナ語に焦点をあてた自然言語処理(NLP)研究の包括的調査のパイオニアである。
論文 参考訳(メタデータ) (2024-05-10T21:39:09Z) - Multilingual Large Language Model: A Survey of Resources, Taxonomy and Frontiers [81.47046536073682]
本稿では,MLLM(Multilingual Large Language Model)文学における最近の進歩と新たなトレンドを要約する一貫した視点を提示する。
私たちの研究がコミュニティに迅速なアクセスを提供し、MLLMにおける画期的な研究を促進することを願っています。
論文 参考訳(メタデータ) (2024-04-07T11:52:44Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - Ling-CL: Understanding NLP Models through Linguistic Curricula [17.44112549879293]
我々は精神言語学と言語習得研究から言語複雑性の特徴づけを取り入れている。
我々は、モデルがNLPタスクに対処するために学習する基礎となる言語知識を理解するために、データ駆動型カリキュラムを開発する。
論文 参考訳(メタデータ) (2023-10-31T01:44:33Z) - Beyond Counting Datasets: A Survey of Multilingual Dataset Construction
and Necessary Resources [38.814057529254846]
公開されている156個のNLPデータセットの特徴について検討する。
言語に習熟したNLP研究者と集団労働者を対象に調査を行った。
メカニカルトルコプラットフォーム上で高品質な多言語データを収集するための戦略を同定する。
論文 参考訳(メタデータ) (2022-11-28T18:54:33Z) - Meta Learning for Natural Language Processing: A Survey [88.58260839196019]
ディープラーニングは自然言語処理(NLP)分野において主要な技術である。
ディープラーニングには多くのラベル付きデータが必要です。
メタ学習は、より良いアルゴリズムを学ぶためのアプローチを研究する機械学習の分野である。
論文 参考訳(メタデータ) (2022-05-03T13:58:38Z) - Systematic Inequalities in Language Technology Performance across the
World's Languages [94.65681336393425]
本稿では,言語技術のグローバルな有用性を評価するためのフレームワークを紹介する。
本分析では, ユーザ対応技術と言語的NLPタスクの両面において, より深く研究されている。
論文 参考訳(メタデータ) (2021-10-13T14:03:07Z) - Ensuring the Inclusive Use of Natural Language Processing in the Global
Response to COVID-19 [58.720142291102135]
低リソース言語を網羅することで、現在のNLPアプローチと将来のNLPアプローチをより包括的に行う方法について議論する。
我々は,NLPの正の社会的影響を最大化することに関心のある研究者のために,いくつかの今後の方向性を提案する。
論文 参考訳(メタデータ) (2021-08-11T12:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。