論文の概要: A Systematic Survey of Natural Language Processing for the Greek Language
- arxiv url: http://arxiv.org/abs/2407.09861v4
- Date: Wed, 18 Jun 2025 07:16:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 16:34:05.178967
- Title: A Systematic Survey of Natural Language Processing for the Greek Language
- Title(参考訳): ギリシャ語の自然言語処理に関する体系的研究
- Authors: Juli Bakagianni, Kanella Pouli, Maria Gavriilidou, John Pavlopoulos,
- Abstract要約: 本研究では,モノリンガルNLPサーベイのための一般化可能なフレームワークを提案する。
提案手法は,バイアスを最小限に抑えるために構造化された検索プロトコル,分類のためのNLPタスク分類,潜在的なベンチマークを特定するための言語資源を統合する。
この枠組みをギリシャのNLP(2012-2023)に適用し、現状、タスク固有の進捗状況、リソースギャップを詳細に分析する。
- 参考スコア(独自算出の注目度): 2.3499129784547663
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Comprehensive monolingual Natural Language Processing (NLP) surveys are essential for assessing language-specific challenges, resource availability, and research gaps. However, existing surveys often lack standardized methodologies, leading to selection bias and fragmented coverage of NLP tasks and resources. This study introduces a generalizable framework for systematic monolingual NLP surveys. Our approach integrates a structured search protocol to minimize bias, an NLP task taxonomy for classification, and language resource taxonomies to identify potential benchmarks and highlight opportunities for improving resource availability. We apply this framework to Greek NLP (2012-2023), providing an in-depth analysis of its current state, task-specific progress, and resource gaps. The survey results are publicly available (https://doi.org/10.5281/zenodo.15314882) and are regularly updated to provide an evergreen resource. This systematic survey of Greek NLP serves as a case study, demonstrating the effectiveness of our framework and its potential for broader application to other not so well-resourced languages as regards NLP.
- Abstract(参考訳): 総合的モノリンガル自然言語処理(NLP)調査は、言語固有の課題、リソース可用性、研究ギャップを評価するために不可欠である。
しかしながら、既存の調査では標準化された方法論が欠如しており、選択バイアスやNLPタスクやリソースの断片化されたカバレッジにつながっている。
本研究では,モノリンガルNLPサーベイのための一般化可能なフレームワークを提案する。
提案手法は,バイアスを最小限に抑えるために構造化された検索プロトコル,分類のためのNLPタスク分類,および言語資源分類を統合し,潜在的なベンチマークを特定し,資源の可用性向上の機会を強調する。
このフレームワークをギリシャのNLP(2012-2023)に適用し、現状、タスク固有の進捗状況、リソースギャップを詳細に分析する。
調査結果は公開されており(https://doi.org/10.5281/zenodo.15314882)、常緑資源を提供するために定期的に更新されている。
このギリシャ語NLPの体系的な調査は、我々のフレームワークの有効性と、NLPに関してあまり良くない言語への広範な適用の可能性を示すケーススタディとして機能する。
関連論文リスト
- NaijaNLP: A Survey of Nigerian Low-Resource Languages [0.0]
3つの言語(Hausa、Yorub'a、Igbo)がナイジェリアの話し言葉の約60%を占めている。
これらの言語は、計算言語学におけるタスクを支援するリソースが不足しているため、低リソースに分類される。
本研究は,ナイジェリアの3大言語を対象とした低リソースNLP(LR-NLP)研究の進展を概観する。
論文 参考訳(メタデータ) (2025-02-27T05:48:51Z) - Bridging Gaps in Natural Language Processing for Yorùbá: A Systematic Review of a Decade of Progress and Prospects [0.6554326244334868]
このレビューでは、注釈付きコーパスの不足、事前訓練された言語モデルの可用性の制限、音節複雑性やダイアクリティカル依存といった言語的課題を重要な障害として取り上げている。
この結果から,多言語・モノリンガル資源の増大が明らかとなった。ただし,この分野は,コードスイッチングやデジタル利用のための言語放棄といった社会文化的要因に制約されている。
論文 参考訳(メタデータ) (2025-02-24T17:41:48Z) - A survey of neural-network-based methods utilising comparable data for finding translation equivalents [0.0]
NLPの最も一般的なアプローチとして,必要な辞書コンポーネントの1つを自動生成する手法を提案する。
記述法の改善に欠かせないので,レキソグラフィの観点から解析する。
この調査は、NLPフィールドがレキシコグラフィーの洞察の恩恵を受けることができるため、NLPフィールドとレキシコグラフィーフィールドの接続を奨励する。
論文 参考訳(メタデータ) (2024-10-19T16:10:41Z) - The Nature of NLP: Analyzing Contributions in NLP Papers [77.31665252336157]
我々は,NLP研究を構成するものについて,研究論文から定量的に検討する。
以上の結果から,NLPにおける機械学習の関与は,90年代前半から増加傾向にあることが明らかとなった。
2020年以降、言語と人々への関心が復活した。
論文 参考訳(メタデータ) (2024-09-29T01:29:28Z) - A Survey on Large Language Models with Multilingualism: Recent Advances and New Frontiers [51.8203871494146]
LLM(Large Language Models)の急速な開発は、自然言語処理における顕著な多言語機能を示している。
LLMのブレークスルーにもかかわらず、多言語シナリオの研究は依然として不十分である。
本調査は,多言語問題に対する研究コミュニティの取り組みを支援することを目的としており,LLMに基づく多言語自然言語処理における中核概念,鍵技術,最新の発展の包括的理解を提供する。
論文 参考訳(メタデータ) (2024-05-17T17:47:39Z) - The Ghanaian NLP Landscape: A First Look [9.17372840572907]
特にガーナ語は絶滅が記録され、いくつかは危険にさらされている。
本研究は、ガーナ語に焦点をあてた自然言語処理(NLP)研究の包括的調査のパイオニアである。
論文 参考訳(メタデータ) (2024-05-10T21:39:09Z) - Multilingual Large Language Model: A Survey of Resources, Taxonomy and Frontiers [81.47046536073682]
本稿では,MLLM(Multilingual Large Language Model)文学における最近の進歩と新たなトレンドを要約する一貫した視点を提示する。
私たちの研究がコミュニティに迅速なアクセスを提供し、MLLMにおける画期的な研究を促進することを願っています。
論文 参考訳(メタデータ) (2024-04-07T11:52:44Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - Ling-CL: Understanding NLP Models through Linguistic Curricula [17.44112549879293]
我々は精神言語学と言語習得研究から言語複雑性の特徴づけを取り入れている。
我々は、モデルがNLPタスクに対処するために学習する基礎となる言語知識を理解するために、データ駆動型カリキュラムを開発する。
論文 参考訳(メタデータ) (2023-10-31T01:44:33Z) - Beyond Counting Datasets: A Survey of Multilingual Dataset Construction
and Necessary Resources [38.814057529254846]
公開されている156個のNLPデータセットの特徴について検討する。
言語に習熟したNLP研究者と集団労働者を対象に調査を行った。
メカニカルトルコプラットフォーム上で高品質な多言語データを収集するための戦略を同定する。
論文 参考訳(メタデータ) (2022-11-28T18:54:33Z) - Meta Learning for Natural Language Processing: A Survey [88.58260839196019]
ディープラーニングは自然言語処理(NLP)分野において主要な技術である。
ディープラーニングには多くのラベル付きデータが必要です。
メタ学習は、より良いアルゴリズムを学ぶためのアプローチを研究する機械学習の分野である。
論文 参考訳(メタデータ) (2022-05-03T13:58:38Z) - Systematic Inequalities in Language Technology Performance across the
World's Languages [94.65681336393425]
本稿では,言語技術のグローバルな有用性を評価するためのフレームワークを紹介する。
本分析では, ユーザ対応技術と言語的NLPタスクの両面において, より深く研究されている。
論文 参考訳(メタデータ) (2021-10-13T14:03:07Z) - Ensuring the Inclusive Use of Natural Language Processing in the Global
Response to COVID-19 [58.720142291102135]
低リソース言語を網羅することで、現在のNLPアプローチと将来のNLPアプローチをより包括的に行う方法について議論する。
我々は,NLPの正の社会的影響を最大化することに関心のある研究者のために,いくつかの今後の方向性を提案する。
論文 参考訳(メタデータ) (2021-08-11T12:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。