Fugu-MT 論文翻訳(概要): Towards Systematic Monolingual NLP Surveys: GenA of Greek NLP

論文の概要: Towards Systematic Monolingual NLP Surveys: GenA of Greek NLP

arxiv url: http://arxiv.org/abs/2407.09861v1
Date: Sat, 13 Jul 2024 12:01:52 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-16 20:27:46.266433
Title: Towards Systematic Monolingual NLP Surveys: GenA of Greek NLP
Title（参考訳）: 単言語NLPの体系化に向けて:ギリシャ語NLPのGenA
Authors: Juli Bakagianni, Kanella Pouli, Maria Gavriilidou, John Pavlopoulos,
Abstract要約: 本研究は, 体系的かつ総合的な単言語NLPサーベイを作成する手法を導入することで, ギャップを埋めるものである。構造化された検索プロトコルによって特徴づけられ、出版物を選定し、NLPタスクの分類によってそれらを整理することができる。本手法の適用により,2012年から2022年にかけて,ギリシャNLPの体系的文献レビューを行った。
参考スコア（独自算出の注目度）: 2.3499129784547663
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Natural Language Processing (NLP) research has traditionally been predominantly focused on English, driven by the availability of resources, the size of the research community, and market demands. Recently, there has been a noticeable shift towards multilingualism in NLP, recognizing the need for inclusivity and effectiveness across diverse languages and cultures. Monolingual surveys have the potential to complement the broader trend towards multilingualism in NLP by providing foundational insights and resources necessary for effectively addressing the linguistic diversity of global communication. However, monolingual NLP surveys are extremely rare in literature. This study fills the gap by introducing a method for creating systematic and comprehensive monolingual NLP surveys. Characterized by a structured search protocol, it can be used to select publications and organize them through a taxonomy of NLP tasks. We include a classification of Language Resources (LRs), according to their availability, and datasets, according to their annotation, to highlight publicly-available and machine-actionable LRs. By applying our method, we conducted a systematic literature review of Greek NLP from 2012 to 2022, providing a comprehensive overview of the current state and challenges of Greek NLP research. We discuss the progress of Greek NLP and outline encountered Greek LRs, classified by availability and usability. As we show, our proposed method helps avoid common pitfalls, such as data leakage and contamination, and to assess language support per NLP task. We consider this systematic literature review of Greek NLP an application of our method that showcases the benefits of a monolingual NLP survey. Similar applications could be regard the myriads of languages whose progress in NLP lags behind that of well-supported languages.
Abstract（参考訳）: 自然言語処理(NLP)の研究は伝統的に、資源の入手、研究コミュニティの大きさ、市場要求などによって、主に英語に焦点を当ててきた。近年、NLPにおける多言語主義への顕著なシフトがあり、多様な言語や文化にまたがる傾きと有効性の必要性を認識している。モノリンガルサーベイは、グローバルコミュニケーションの言語多様性を効果的に解決するために必要な基礎的な洞察とリソースを提供することによって、NLPにおける多言語主義に対するより広範な傾向を補完する可能性がある。しかし、モノリンガルNLPサーベイは文学では極めて稀である。本研究は, 体系的かつ総合的な単言語NLPサーベイを作成する手法を導入することで, ギャップを埋めるものである。構造化された検索プロトコルによって特徴づけられ、出版物を選定し、NLPタスクの分類によってそれらを整理することができる。利用可能なLR(Language Resources:言語資源)の分類とアノテーションによるデータセットが含まれており、公開可能なLRとマシン対応のLRを強調している。本手法の適用により,2012年から2022年にかけて,ギリシャNLPの体系的な文献レビューを行い,ギリシャNLP研究の現状と課題を概観した。我々は、ギリシャのNLPの進歩と、可用性とユーザビリティによって分類されたギリシャのLRの概要について論じる。提案手法は,データ漏洩や汚染などの一般的な落とし穴を回避し,NLPタスク毎の言語サポートを評価する。我々は,ギリシャ語NLPの体系的な文献レビューを,単言語NLPサーベイの利点を示す手法の応用とみなす。同様の応用は、よくサポートされた言語よりもNLPの進歩が遅れている言語が無数にあると見なすことができる。

関連論文リスト

Opportunities and Challenges of Natural Language Processing for Low-Resource Senegalese Languages in Social Science Research [0.6016863427924156]
本稿では,セネガル憲法で公式に認められた6つの国語(Wolof, Pulaar, Sereer, Joola, Mandingue, Soninke)の進歩と課題について概観する。言語的・社会技術的・インフラ的要素を合成し、それらのデジタル準備性を形作り、データ、ツール、ベンチマークのギャップを識別する。この論文は、セネガル語のための持続可能なコミュニティ中心のNLPエコシステムに向けたロードマップを概説することで締めくくっている。
論文参考訳（メタデータ） (2025-12-24T20:20:31Z)
Dancing with Critiques: Enhancing LLM Reasoning with Stepwise Natural Language Self-Critique [66.94905631175209]
我々は、段階的に自然言語の自己批判(PANEL)を行う新しい推論時間スケーリング手法を提案する。ステップレベルの探索プロセスのガイドとして、自己生成の自然言語批判をフィードバックとして採用している。このアプローチは、タスク固有の検証と関連するトレーニングオーバーヘッドの必要性を回避します。
論文参考訳（メタデータ） (2025-03-21T17:59:55Z)
NaijaNLP: A Survey of Nigerian Low-Resource Languages [0.0]
3つの言語(Hausa、Yorub'a、Igbo)がナイジェリアの話し言葉の約60%を占めている。これらの言語は、計算言語学におけるタスクを支援するリソースが不足しているため、低リソースに分類される。本研究は,ナイジェリアの3大言語を対象とした低リソースNLP(LR-NLP)研究の進展を概観する。
論文参考訳（メタデータ） (2025-02-27T05:48:51Z)
Bridging Gaps in Natural Language Processing for Yorùbá: A Systematic Review of a Decade of Progress and Prospects [0.6554326244334868]
このレビューでは、注釈付きコーパスの不足、事前訓練された言語モデルの可用性の制限、音節複雑性やダイアクリティカル依存といった言語的課題を重要な障害として取り上げている。この結果から,多言語・モノリンガル資源の増大が明らかとなった。ただし,この分野は,コードスイッチングやデジタル利用のための言語放棄といった社会文化的要因に制約されている。
論文参考訳（メタデータ） (2025-02-24T17:41:48Z)
Open or Closed LLM for Lesser-Resourced Languages? Lessons from Greek [2.3499129784547663]
我々は,7つのNLPタスクにおけるオープンソース(Llama-70b)とクローズドソース(GPT-4o mini)の大規模言語モデルの性能評価を行った。第2に,事前学習における LLM による潜在的なデータ使用量を評価するツールとして,オーソリティ属性を再定義することにより,ギリシャ NLP の範囲を広げる。第3に,STE(Summarize, Translate, Embed)法は,従来のTF-IDF法よりも長文のクラスタリングに優れる,法的NLPのケーススタディを示す。
論文参考訳（メタデータ） (2025-01-22T12:06:16Z)
A survey of neural-network-based methods utilising comparable data for finding translation equivalents [0.0]
NLPの最も一般的なアプローチとして,必要な辞書コンポーネントの1つを自動生成する手法を提案する。記述法の改善に欠かせないので,レキソグラフィの観点から解析する。この調査は、NLPフィールドがレキシコグラフィーの洞察の恩恵を受けることができるため、NLPフィールドとレキシコグラフィーフィールドの接続を奨励する。
論文参考訳（メタデータ） (2024-10-19T16:10:41Z)
The Nature of NLP: Analyzing Contributions in NLP Papers [77.31665252336157]
我々は,NLP研究を構成するものについて,研究論文から定量的に検討する。以上の結果から,NLPにおける機械学習の関与は,90年代前半から増加傾向にあることが明らかとなった。 2020年以降、言語と人々への関心が復活した。
論文参考訳（メタデータ） (2024-09-29T01:29:28Z)
Systematic Task Exploration with LLMs: A Study in Citation Text Generation [63.50597360948099]
大規模言語モデル(LLM)は、複雑な創造的自然言語生成(NLG)タスクの定義と実行において、前例のない柔軟性をもたらす。本稿では,系統的な入力操作,参照データ,出力測定からなる3成分研究フレームワークを提案する。我々はこのフレームワークを用いて引用テキスト生成を探索する。これは一般的なNLPタスクであり、タスク定義と評価基準に関するコンセンサスを欠いている。
論文参考訳（メタデータ） (2024-07-04T16:41:08Z)
A Survey on Large Language Models with Multilingualism: Recent Advances and New Frontiers [51.8203871494146]
LLM(Large Language Models)の急速な開発は、自然言語処理における顕著な多言語機能を示している。 LLMのブレークスルーにもかかわらず、多言語シナリオの研究は依然として不十分である。本調査は,多言語問題に対する研究コミュニティの取り組みを支援することを目的としており,LLMに基づく多言語自然言語処理における中核概念,鍵技術,最新の発展の包括的理解を提供する。
論文参考訳（メタデータ） (2024-05-17T17:47:39Z)
The Ghanaian NLP Landscape: A First Look [9.17372840572907]
特にガーナ語は絶滅が記録され、いくつかは危険にさらされている。本研究は、ガーナ語に焦点をあてた自然言語処理(NLP)研究の包括的調査のパイオニアである。
論文参考訳（メタデータ） (2024-05-10T21:39:09Z)
From Multiple-Choice to Extractive QA: A Case Study for English and Arabic [51.13706104333848]
既存の多言語データセットを新しいNLPタスクに再利用する可能性について検討する。本稿では,英語および現代標準アラビア語に対するアノテーションガイドラインと並列EQAデータセットを提案する。我々は、残りの120のBELEBELE言語変種に対して、他の人が我々のアプローチを適用するのを助けることを目指しており、その多くがリソース不足と見なされている。
論文参考訳（メタデータ） (2024-04-26T11:46:05Z)
Multilingual Large Language Model: A Survey of Resources, Taxonomy and Frontiers [81.47046536073682]
本稿では,MLLM(Multilingual Large Language Model)文学における最近の進歩と新たなトレンドを要約する一貫した視点を提示する。私たちの研究がコミュニティに迅速なアクセスを提供し、MLLMにおける画期的な研究を促進することを願っています。
論文参考訳（メタデータ） (2024-04-07T11:52:44Z)
Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文参考訳（メタデータ） (2024-01-11T03:04:38Z)
Ling-CL: Understanding NLP Models through Linguistic Curricula [17.44112549879293]
我々は精神言語学と言語習得研究から言語複雑性の特徴づけを取り入れている。我々は、モデルがNLPタスクに対処するために学習する基礎となる言語知識を理解するために、データ駆動型カリキュラムを開発する。
論文参考訳（メタデータ） (2023-10-31T01:44:33Z)
Beyond Counting Datasets: A Survey of Multilingual Dataset Construction and Necessary Resources [38.814057529254846]
公開されている156個のNLPデータセットの特徴について検討する。言語に習熟したNLP研究者と集団労働者を対象に調査を行った。メカニカルトルコプラットフォーム上で高品質な多言語データを収集するための戦略を同定する。
論文参考訳（メタデータ） (2022-11-28T18:54:33Z)
Meta Learning for Natural Language Processing: A Survey [88.58260839196019]
ディープラーニングは自然言語処理(NLP)分野において主要な技術である。ディープラーニングには多くのラベル付きデータが必要です。メタ学習は、より良いアルゴリズムを学ぶためのアプローチを研究する機械学習の分野である。
論文参考訳（メタデータ） (2022-05-03T13:58:38Z)
Systematic Inequalities in Language Technology Performance across the World's Languages [94.65681336393425]
本稿では,言語技術のグローバルな有用性を評価するためのフレームワークを紹介する。本分析では, ユーザ対応技術と言語的NLPタスクの両面において, より深く研究されている。
論文参考訳（メタデータ） (2021-10-13T14:03:07Z)
Ensuring the Inclusive Use of Natural Language Processing in the Global Response to COVID-19 [58.720142291102135]
低リソース言語を網羅することで、現在のNLPアプローチと将来のNLPアプローチをより包括的に行う方法について議論する。我々は,NLPの正の社会的影響を最大化することに関心のある研究者のために,いくつかの今後の方向性を提案する。
論文参考訳（メタデータ） (2021-08-11T12:54:26Z)
Low-Resource Adaptation of Neural NLP Models [0.30458514384586405]
本論文は,情報抽出と自然言語理解における低リソースシナリオを扱う手法について考察する。ニューラルNLPモデルを開発し,学習データを最小限にしたNLPタスクに関する多くの研究課題を探索する。
論文参考訳（メタデータ） (2020-11-09T12:13:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。