論文の概要: calamanCy: A Tagalog Natural Language Processing Toolkit
- arxiv url: http://arxiv.org/abs/2311.07171v1
- Date: Mon, 13 Nov 2023 09:06:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 15:00:54.471395
- Title: calamanCy: A Tagalog Natural Language Processing Toolkit
- Title(参考訳): calamanCy: Tagalogの自然言語処理ツールキット
- Authors: Lester James V. Miranda
- Abstract要約: calamanCyは、Tagalog用の自然言語処理(NLP)パイプラインを構築するためのオープンソースのツールキットである。
SpaCy上に構築されており、簡単に実験でき、他のフレームワークと統合できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce calamanCy, an open-source toolkit for constructing natural
language processing (NLP) pipelines for Tagalog. It is built on top of spaCy,
enabling easy experimentation and integration with other frameworks. calamanCy
addresses the development gap by providing a consistent API for building NLP
applications and offering general-purpose multitask models with out-of-the-box
support for dependency parsing, parts-of-speech (POS) tagging, and named entity
recognition (NER). calamanCy aims to accelerate the progress of Tagalog NLP by
consolidating disjointed resources in a unified framework. The calamanCy
toolkit is available on GitHub: https://github.com/ljvmiranda921/calamanCy.
- Abstract(参考訳): 本稿では,自然言語処理(NLP)パイプライン構築のためのオープンソースツールキットであるcalamanCyを紹介する。
SpaCy上に構築されており、簡単に実験でき、他のフレームワークと統合できる。
CalamanCyは、NLPアプリケーションを構築するための一貫したAPIを提供し、依存性解析、POSタグ付け、名前付きエンティティ認識(NER)をサポートする汎用マルチタスクモデルを提供することによって、開発ギャップに対処する。
CalamanCyは、統合されたフレームワークで未結合のリソースを統合することで、Tagalog NLPの進歩を加速することを目指している。
calamancy toolkitはgithubで入手できる。 https://github.com/ljvmiranda921/calamancy。
関連論文リスト
- CNER: A tool Classifier of Named-Entity Relationships [0.0]
CNERは、スペイン語で名前付きエンティティ間の意味的関係を抽出するための有能なツールのアンサンブルである。
コンテナベースのアーキテクチャに基づいて構築されたCNERは、さまざまな名前付きエンティティ認識と関係抽出ツールを統合している。
CNERは実践的な教育資源として機能し、機械学習技術がスペイン語の多様なNLPタスクに効果的に対処する方法について説明している。
論文 参考訳(メタデータ) (2024-05-17T01:16:58Z) - CMULAB: An Open-Source Framework for Training and Deployment of Natural Language Processing Models [59.91221728187576]
本稿では,NLPモデルのモデル展開と連続的なヒューマン・イン・ザ・ループの微調整を簡単にするオープンソースフレームワークであるCMU言語バックエンドを紹介する。
CMULABは、マルチ言語モデルのパワーを活用して、音声認識、OCR、翻訳、構文解析などの既存のツールを新しい言語に迅速に適応し、拡張することができる。
論文 参考訳(メタデータ) (2024-04-03T02:21:46Z) - VNLP: Turkish NLP Package [0.0]
VNLPは、トルコ語のための最先端自然言語処理(NLP)パッケージである。
テキスト分割やテキスト正規化といった最も単純なタスクから、テキストやトークンの分類モデルといったより高度なタスクまで、幅広いツールが含まれている。
VNLPには、オープンソースのGitHubリポジトリ、ReadtheDocsドキュメント、便利なインストールのためのPyPiパッケージ、Python、コマンドラインAPIがある。
論文 参考訳(メタデータ) (2024-03-02T20:46:56Z) - mahaNLP: A Marathi Natural Language Processing Library [0.4499833362998489]
本稿では,オープンソースの自然言語処理(NLP)ライブラリであるmahaNLPについて述べる。
NLPの分野では、低リソースのインドの言語であるMarathiのサポートを強化することを目指している。
論文 参考訳(メタデータ) (2023-11-05T06:59:59Z) - GAIA Search: Hugging Face and Pyserini Interoperability for NLP Training
Data Exploration [97.68234051078997]
我々はPyseriniを、オープンソースのAIライブラリとアーティファクトのHugging Faceエコシステムに統合する方法について論じる。
Jupyter NotebookベースのウォークスルーがGitHubで公開されている。
GAIA Search - 前述した原則に従って構築された検索エンジンで、人気の高い4つの大規模テキストコレクションへのアクセスを提供する。
論文 参考訳(メタデータ) (2023-06-02T12:09:59Z) - HuSpaCy: an industrial-strength Hungarian natural language processing
toolkit [0.0]
言語処理パイプラインは、最先端の補題化、形態素合成分析、エンティティ認識、単語埋め込みによって構成されるべきである。
本稿では,ハンガリー語処理パイプラインのHuSpaCyを紹介する。
論文 参考訳(メタデータ) (2022-01-06T07:49:45Z) - ESPnet-SLU: Advancing Spoken Language Understanding through ESPnet [95.39817519115394]
ESPnet-SLUは、エンドツーエンドの音声処理ツールキットであるESPnetのプロジェクトである。
単一のフレームワークによる音声言語理解の迅速な開発を目的として設計されている。
論文 参考訳(メタデータ) (2021-11-29T17:05:49Z) - A Data-Centric Framework for Composable NLP Workflows [109.51144493023533]
アプリケーションドメインにおける経験的自然言語処理システム(例えば、ヘルスケア、ファイナンス、教育)は、複数のコンポーネント間の相互運用を伴う。
我々は,このような高度なNLPの高速な開発を支援するために,統一的なオープンソースフレームワークを構築した。
論文 参考訳(メタデータ) (2021-03-02T16:19:44Z) - N-LTP: An Open-source Neural Language Technology Platform for Chinese [68.58732970171747]
textttN-は、中国の6つの基本的なNLPタスクをサポートする、オープンソースのニューラルネットワークテクノロジプラットフォームである。
textttN-は、中国のタスク間で共有知識をキャプチャする利点がある共有事前学習モデルを使用することで、マルチタスクフレームワークを採用する。
論文 参考訳(メタデータ) (2020-09-24T11:45:39Z) - ESPnet-ST: All-in-One Speech Translation Toolkit [57.76342114226599]
ESPnet-STは、エンドツーエンドの音声処理ツールキットであるESPnet内の新しいプロジェクトである。
音声認識、機械翻訳、音声翻訳のための音声合成機能を実装する。
データ前処理、特徴抽出、トレーニング、デコードパイプラインを含むオールインワンのレシピを提供します。
論文 参考訳(メタデータ) (2020-04-21T18:38:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。