論文の概要: GR-NLP-TOOLKIT: An Open-Source NLP Toolkit for Modern Greek
- arxiv url: http://arxiv.org/abs/2412.08520v1
- Date: Wed, 11 Dec 2024 16:34:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 14:04:39.033272
- Title: GR-NLP-TOOLKIT: An Open-Source NLP Toolkit for Modern Greek
- Title(参考訳): GR-NLP-TOOLKIT: 現代ギリシャのためのオープンソースNLPツールキット
- Authors: Lefteris Loukas, Nikolaos Smyrnioudis, Chrysa Dikonomaki, Spyros Barbakos, Anastasios Toumazatos, John Koutsikakis, Manolis Kyriakakis, Mary Georgiou, Stavros Vassos, John Pavlopoulos, Ion Androutsopoulos,
- Abstract要約: 現代ギリシア語に特化して開発されたオープンソースの自然言語処理(NLP)ツールキットであるGR-NLP-TOOL KITを提案する。
このツールキットは、音声のタグ付け、形態的タグ付け、依存性解析、名前付きエンティティ認識、ギリシャ語からギリシャ語への翻訳という、5つのコアNLPタスクで最先端のパフォーマンスを提供する。
- 参考スコア(独自算出の注目度): 10.595573163276102
- License:
- Abstract: We present GR-NLP-TOOLKIT, an open-source natural language processing (NLP) toolkit developed specifically for modern Greek. The toolkit provides state-of-the-art performance in five core NLP tasks, namely part-of-speech tagging, morphological tagging, dependency parsing, named entity recognition, and Greeklishto-Greek transliteration. The toolkit is based on pre-trained Transformers, it is freely available, and can be easily installed in Python (pip install gr-nlp-toolkit). It is also accessible through a demonstration platform on HuggingFace, along with a publicly available API for non-commercial use. We discuss the functionality provided for each task, the underlying methods, experiments against comparable open-source toolkits, and future possible enhancements. The toolkit is available at: https://github.com/nlpaueb/gr-nlp-toolkit
- Abstract(参考訳): 現代ギリシア語に特化して開発されたオープンソースの自然言語処理(NLP)ツールキットGR-NLP-TOOLKITを提案する。
このツールキットは、音声のタグ付け、形態的タグ付け、依存性解析、名前付きエンティティ認識、ギリシャ語からギリシャ語への翻訳という、5つのコアNLPタスクで最先端のパフォーマンスを提供する。
ツールキットはトレーニング済みのTransformerをベースにしており、自由に利用でき、Pythonに簡単にインストールできる(pip install gr-nlp-toolkit)。
また、HuggingFace上のデモプラットフォームを通じてアクセスでき、非商用使用用のAPIも公開されている。
本稿では,各タスクに提供される機能,基礎となるメソッド,同等のオープンソースツールキットに対する実験,今後の拡張について論じる。
ツールキットは、https://github.com/nlpaueb/gr-nlp-toolkitで利用可能である。
関連論文リスト
- PyPulse: A Python Library for Biosignal Imputation [58.35269251730328]
PyPulseは,臨床およびウェアラブルの両方のセンサ設定において生体信号の計算を行うPythonパッケージである。
PyPulseのフレームワークは、非機械学習バイオリサーバーを含む幅広いユーザーベースに対して、使い勝手の良いモジュラーで拡張可能なフレームワークを提供する。
PyPulseはMITライセンスでGithubとPyPIでリリースしました。
論文 参考訳(メタデータ) (2024-12-09T11:00:55Z) - CMULAB: An Open-Source Framework for Training and Deployment of Natural Language Processing Models [59.91221728187576]
本稿では,NLPモデルのモデル展開と連続的なヒューマン・イン・ザ・ループの微調整を簡単にするオープンソースフレームワークであるCMU言語バックエンドを紹介する。
CMULABは、マルチ言語モデルのパワーを活用して、音声認識、OCR、翻訳、構文解析などの既存のツールを新しい言語に迅速に適応し、拡張することができる。
論文 参考訳(メタデータ) (2024-04-03T02:21:46Z) - VNLP: Turkish NLP Package [0.0]
VNLPは、トルコ語のための最先端自然言語処理(NLP)パッケージである。
テキスト分割やテキスト正規化といった最も単純なタスクから、テキストやトークンの分類モデルといったより高度なタスクまで、幅広いツールが含まれている。
VNLPには、オープンソースのGitHubリポジトリ、ReadtheDocsドキュメント、便利なインストールのためのPyPiパッケージ、Python、コマンドラインAPIがある。
論文 参考訳(メタデータ) (2024-03-02T20:46:56Z) - PyThaiNLP: Thai Natural Language Processing in Python [4.61731352666614]
PyThaiNLPは、Pythonで実装されたタイ語のためのオープンソース自然言語処理(NLP)ライブラリである。
タイ語の幅広いソフトウェア、モデル、データセットを提供する。
論文 参考訳(メタデータ) (2023-12-07T19:19:43Z) - HugNLP: A Unified and Comprehensive Library for Natural Language
Processing [14.305751154503133]
本稿では,HugingFace Transformersのバックエンドを備えた自然言語処理(NLP)ライブラリであるHugNLPを紹介する。
HugNLPは、モデル、プロセッサ、アプリケーションを含む階層構造で構成され、異なるNLPタスクで事前訓練された言語モデル(PLM)の学習プロセスを統一する。
論文 参考訳(メタデータ) (2023-02-28T03:38:26Z) - Binding Language Models in Symbolic Languages [146.3027328556881]
Binderはトレーニング不要のニューラルシンボリックフレームワークで、タスク入力をプログラムにマッピングする。
解析の段階では、Codexは元のプログラミング言語では答えられないタスク入力の一部を特定することができる。
実行段階では、CodexはAPI呼び出しで適切なプロンプトを与えられた万能機能を実行することができる。
論文 参考訳(メタデータ) (2022-10-06T12:55:17Z) - ESPnet-SLU: Advancing Spoken Language Understanding through ESPnet [95.39817519115394]
ESPnet-SLUは、エンドツーエンドの音声処理ツールキットであるESPnetのプロジェクトである。
単一のフレームワークによる音声言語理解の迅速な開発を目的として設計されている。
論文 参考訳(メタデータ) (2021-11-29T17:05:49Z) - Trankit: A Light-Weight Transformer-based Toolkit for Multilingual
Natural Language Processing [22.38792093462942]
Trankitは多言語自然言語処理のための軽量トランスフォーマーベースのツールキット
100言語以上の基本的なNLPタスクのためのトレーニング可能なパイプラインと56言語のための90の事前トレーニングパイプラインを提供する。
Trankitは、文のセグメンテーション、音声の一部タグ付け、形態的特徴タグ付け、依存性解析よりも、以前の多言語NLPパイプラインを大幅に上回る。
論文 参考訳(メタデータ) (2021-01-09T04:55:52Z) - N-LTP: An Open-source Neural Language Technology Platform for Chinese [68.58732970171747]
textttN-は、中国の6つの基本的なNLPタスクをサポートする、オープンソースのニューラルネットワークテクノロジプラットフォームである。
textttN-は、中国のタスク間で共有知識をキャプチャする利点がある共有事前学習モデルを使用することで、マルチタスクフレームワークを採用する。
論文 参考訳(メタデータ) (2020-09-24T11:45:39Z) - ESPnet-ST: All-in-One Speech Translation Toolkit [57.76342114226599]
ESPnet-STは、エンドツーエンドの音声処理ツールキットであるESPnet内の新しいプロジェクトである。
音声認識、機械翻訳、音声翻訳のための音声合成機能を実装する。
データ前処理、特徴抽出、トレーニング、デコードパイプラインを含むオールインワンのレシピを提供します。
論文 参考訳(メタデータ) (2020-04-21T18:38:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。