Fugu-MT 論文翻訳(概要): PyThaiNLP: Thai Natural Language Processing in Python

論文の概要: PyThaiNLP: Thai Natural Language Processing in Python

arxiv url: http://arxiv.org/abs/2312.04649v1
Date: Thu, 7 Dec 2023 19:19:43 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-11 17:32:07.079503
Title: PyThaiNLP: Thai Natural Language Processing in Python
Title（参考訳）: PyThaiNLP: Pythonのタイ語自然言語処理
Authors: Wannaphong Phatthiyaphaibun, Korakot Chaovavanich, Charin Polpanumas, Arthit Suriyawongkul, Lalita Lowphansirikul, Pattarawat Chormai, Peerat Limkonchotiwat, Thanathip Suntorntip, Can Udomcharoenchaikit
Abstract要約: PyThaiNLPは、Pythonで実装されたタイ語のためのオープンソース自然言語処理(NLP)ライブラリである。タイ語の幅広いソフトウェア、モデル、データセットを提供する。
参考スコア（独自算出の注目度）: 4.61731352666614
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present PyThaiNLP, a free and open-source natural language processing (NLP) library for Thai language implemented in Python. It provides a wide range of software, models, and datasets for Thai language. We first provide a brief historical context of tools for Thai language prior to the development of PyThaiNLP. We then outline the functionalities it provided as well as datasets and pre-trained language models. We later summarize its development milestones and discuss our experience during its development. We conclude by demonstrating how industrial and research communities utilize PyThaiNLP in their work. The library is freely available at https://github.com/pythainlp/pythainlp.
Abstract（参考訳）: PyThaiNLPはPythonで実装されたタイ語のためのオープンソース自然言語処理(NLP)ライブラリである。タイ語向けの幅広いソフトウェア、モデル、データセットを提供する。まず,pythainlp開発に先立って,タイ語ツールに関する簡単な歴史的文脈について述べる。次に、提供される機能やデータセット、事前学習された言語モデルを概説します。その後、開発マイルストーンをまとめ、開発における私たちの経験について論じます。我々は,産業・研究コミュニティがPyThaiNLPをどのように活用しているかを実証することによって結論付けた。ライブラリはhttps://github.com/pythainlp/pythainlpで無料で利用できる。

関連論文リスト

Automated Python Translation [27.835184325945164]
我々は、Pythonの自然なモダリティを他の人間の言語に自動的に翻訳するタスクを紹介します。これはこれらの形式の短縮性を考えると、ユニークな挑戦である。我々は、Pythonを他のヒューマン言語に翻訳する自動パイプラインを作成します。
論文参考訳（メタデータ） (2025-04-15T15:30:22Z)
GR-NLP-TOOLKIT: An Open-Source NLP Toolkit for Modern Greek [10.595573163276102]
現代ギリシア語に特化して開発されたオープンソースの自然言語処理(NLP)ツールキットであるGR-NLP-TOOL KITを提案する。このツールキットは、音声のタグ付け、形態的タグ付け、依存性解析、名前付きエンティティ認識、ギリシャ語からギリシャ語への翻訳という、5つのコアNLPタスクで最先端のパフォーマンスを提供する。
論文参考訳（メタデータ） (2024-12-11T16:34:23Z)
CMULAB: An Open-Source Framework for Training and Deployment of Natural Language Processing Models [59.91221728187576]
本稿では,NLPモデルのモデル展開と連続的なヒューマン・イン・ザ・ループの微調整を簡単にするオープンソースフレームワークであるCMU言語バックエンドを紹介する。 CMULABは、マルチ言語モデルのパワーを活用して、音声認識、OCR、翻訳、構文解析などの既存のツールを新しい言語に迅速に適応し、拡張することができる。
論文参考訳（メタデータ） (2024-04-03T02:21:46Z)
pyvene: A Library for Understanding and Improving PyTorch Models via Interventions [79.72930339711478]
$textbfpyvene$は、さまざまなPyTorchモジュールに対するカスタマイズ可能な介入をサポートするオープンソースライブラリである。私たちは、$textbfpyvene$が、ニューラルモデルへの介入を実行し、他のモデルとインターバルされたモデルを共有するための統一されたフレームワークを提供する方法を示します。
論文参考訳（メタデータ） (2024-03-12T16:46:54Z)
VNLP: Turkish NLP Package [0.0]
VNLPは、トルコ語のための最先端自然言語処理(NLP)パッケージである。テキスト分割やテキスト正規化といった最も単純なタスクから、テキストやトークンの分類モデルといったより高度なタスクまで、幅広いツールが含まれている。 VNLPには、オープンソースのGitHubリポジトリ、ReadtheDocsドキュメント、便利なインストールのためのPyPiパッケージ、Python、コマンドラインAPIがある。
論文参考訳（メタデータ） (2024-03-02T20:46:56Z)
Python is Not Always the Best Choice: Embracing Multilingual Program of Thoughts [51.49688654641581]
本稿では,多言語からの強みと多様性を生かしたMultiPoTというタスクとモデル非依存のアプローチを提案する。実験の結果、Python Self-Consistencyを著しく上回ることがわかった。特にMultiPoTはChatGPT(gpt-3.5-turbo-0701)で平均4.6%以上の改善を実現している。
論文参考訳（メタデータ） (2024-02-16T13:48:06Z)
Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。方言データセットにおけるNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文参考訳（メタデータ） (2024-01-11T03:04:38Z)
Causal-learn: Causal Discovery in Python [53.17423883919072]
因果発見は、観測データから因果関係を明らかにすることを目的としている。 $textitcausal-learn$は因果発見のためのオープンソースのPythonライブラリである。
論文参考訳（メタデータ） (2023-07-31T05:00:35Z)
Recent Advances in Natural Language Processing via Large Pre-Trained Language Models: A Survey [67.82942975834924]
BERTのような大規模で事前訓練された言語モデルは、自然言語処理(NLP)の分野を大きく変えた。本稿では,これらの大規模言語モデルを用いたNLPタスクの事前学習,微調整,プロンプト,テキスト生成といった手法を用いた最近の研究について紹介する。
論文参考訳（メタデータ） (2021-11-01T20:08:05Z)
LaoPLM: Pre-trained Language Models for Lao [3.2146309563776416]
事前訓練された言語モデル(PLM)は、コンテキストにおける異なるレベルの概念をキャプチャし、普遍的な言語表現を生成する。 PTMは、ほとんどのNLPアプリケーションで広く使われているが、Lao NLP研究ではあまり使われていない。ラオス語の資源管理状況を軽減するために,テキスト分類データセットを構築した。本稿では,ラオスにおけるトランスフォーマーベースのPTMを,BERT-small,BERT-base,ELECTRA-small,ELECTRA-baseの4つのバージョンで提案する。
論文参考訳（メタデータ） (2021-10-12T11:13:07Z)
pysentimiento: A Python Toolkit for Opinion Mining and Social NLP tasks [0.2826977330147589]
pysentimientoは意見マイニングやその他のソーシャルNLPタスク用に設計されたPythonツールキットである。このオープンソースライブラリは、簡単に使えるPythonライブラリで、スペイン語、英語、イタリア語、ポルトガル語の最先端モデルを提供する。各種タスク,言語,データセットにまたがる事前学習言語モデルの総合的な性能評価を行う。
論文参考訳（メタデータ） (2021-06-17T13:15:07Z)
Text Normalization for Low-Resource Languages of Africa [1.5766133856827325]
本研究では,アフリカの低リソース言語群におけるテキスト正規化とデータセット品質の影響について検討する。我々は、有限状態トランスデューサのためのPythonライブラリであるPyniniフレームワークで構築したテキスト正規化器と、アフリカ言語のための言語モデルのトレーニング実験について説明する。
論文参考訳（メタデータ） (2021-03-29T18:00:26Z)
N-LTP: An Open-source Neural Language Technology Platform for Chinese [68.58732970171747]
textttN-は、中国の6つの基本的なNLPタスクをサポートする、オープンソースのニューラルネットワークテクノロジプラットフォームである。 textttN-は、中国のタスク間で共有知識をキャプチャする利点がある共有事前学習モデルを使用することで、マルチタスクフレームワークを採用する。
論文参考訳（メタデータ） (2020-09-24T11:45:39Z)
Stanza: A Python Natural Language Processing Toolkit for Many Human Languages [44.8226642800919]
我々は,オープンソースのPython自然言語処理ツールキットであるStanzaを紹介した。 Stanzaは、トークン化、マルチワードトークン拡張、レムマティゼーション、パート・オブ・音声、形態的特徴タグ付けなど、テキスト分析のための言語に依存しない完全なニューラルネットワークを備えている。我々は、Universal Dependencies Treebanksや他の多言語コーパスを含む、合計112のデータセットでStanzaをトレーニングしました。
論文参考訳（メタデータ） (2020-03-16T09:05:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。