論文の概要: CLASSLA-Express: a Train of CLARIN.SI Workshops on Language Resources and Tools with Easily Expanding Route
- arxiv url: http://arxiv.org/abs/2412.01386v1
- Date: Mon, 02 Dec 2024 11:15:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:46:58.734861
- Title: CLASSLA-Express: a Train of CLARIN.SI Workshops on Language Resources and Tools with Easily Expanding Route
- Title(参考訳): CLASSLA-Express: CLARIN.SIワークショップ
- Authors: Nikola Ljubešić, Taja Kuzman, Ivana Filipović Petrović, Jelena Parizoska, Petya Osenova,
- Abstract要約: CLASSLA-Expressワークショップの最初のイテレーションは、5カ国6つのワークショップを含む。
その目的は、最近リリースされたCLASSLA-webコーパスと同様に、コーパスクエリツールの使用に関する知識を共有することである。
- 参考スコア(独自算出の注目度): 4.165168823227979
- License:
- Abstract: This paper introduces the CLASSLA-Express workshop series as an innovative approach to disseminating linguistic resources and infrastructure provided by the CLASSLA Knowledge Centre for South Slavic languages and the Slovenian CLARIN.SI infrastructure. The workshop series employs two key strategies: (1) conducting workshops directly in countries with interested audiences, and (2) designing the series for easy expansion to new venues. The first iteration of the CLASSLA-Express workshop series encompasses 6 workshops in 5 countries. Its goal is to share knowledge on the use of corpus querying tools, as well as the recently-released CLASSLA-web corpora - the largest general corpora for South Slavic languages. In the paper, we present the design of the workshop series, its current scope and the effortless extensions of the workshop to new venues that are already in sight.
- Abstract(参考訳): 本稿では,CLASSLA-Expressワークショップシリーズを,南スラヴ語とスロベニア語CLARIN.SIインフラのためのCLASSLA知識センターが提供する言語資源とインフラを広めるための革新的なアプローチとして紹介する。
ワークショップシリーズは,(1)関心のある国で直接ワークショップを実施し,(2)新しい会場への展開を容易にするためのシリーズを設計する,という2つの重要な戦略を採っている。
CLASSLA-Expressワークショップの最初のイテレーションは、5カ国6つのワークショップを含む。
その目的は、コーパスクエリツールの使用に関する知識を共有することであり、最近リリースされたCLASSLA-webコーパスは、南スラヴ語で最大の汎用コーパスである。
本稿では,ワークショップシリーズの設計,現状のスコープ,ワークショップの拡張を,すでに見られている新しい会場に提示する。
関連論文リスト
- Foundations of Large Language Models [49.962594581024376]
本書は4つの主要な章で構成されており、それぞれが事前学習、生成モデル、プロンプト技術、アライメント方法という重要な領域を探求している。
自然言語処理や関連分野の大学生、専門家、実践者を対象としている。
論文 参考訳(メタデータ) (2025-01-16T01:03:56Z) - LLMic: Romanian Foundation Language Model [76.09455151754062]
ルーマニア語に特化して設計された基礎言語モデルである LLMic について述べる。
英語からルーマニア語への翻訳作業において,事前学習後の言語翻訳のための微調整 LLMic が既存の解よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-01-13T22:14:45Z) - Teaching Llama a New Language Through Cross-Lingual Knowledge Transfer [0.7499722271664147]
本研究は,エストニア語に対する言語横断学習と単言語事前学習の併用が与える影響について考察する。
高品質な英語指導からエストニア語への言語間知識の伝達を実演し、コモンセンス推論の改善をもたらす。
ベストモデルである textscLlammas は、エストニア人のための最初のオープンソースの命令フォロー型 LLM である。
論文 参考訳(メタデータ) (2024-04-05T11:52:02Z) - CMULAB: An Open-Source Framework for Training and Deployment of Natural Language Processing Models [59.91221728187576]
本稿では,NLPモデルのモデル展開と連続的なヒューマン・イン・ザ・ループの微調整を簡単にするオープンソースフレームワークであるCMU言語バックエンドを紹介する。
CMULABは、マルチ言語モデルのパワーを活用して、音声認識、OCR、翻訳、構文解析などの既存のツールを新しい言語に迅速に適応し、拡張することができる。
論文 参考訳(メタデータ) (2024-04-03T02:21:46Z) - CLASSLA-Stanza: The Next Step for Linguistic Processing of South Slavic
Languages [0.0]
CLASSLA-Stanzaは南スラヴ語の自動言語アノテーションのためのパイプラインである。
我々は、Stanzaに対するCLASSLA-Stanzaの主な改善点を説明し、パイプラインの最新2.1リリースのモデルトレーニングプロセスの詳細を説明します。
論文 参考訳(メタデータ) (2023-08-08T13:41:41Z) - Prompting Language-Informed Distribution for Compositional Zero-Shot Learning [73.49852821602057]
合成ゼロショット学習(CZSL)タスクは、目に見えない合成視覚概念を認識することを目的としている。
本稿では,タスクに対して言語インフォームド分布(PLID)を指示するモデルを提案する。
MIT-States、UT-Zappos、C-GQAデータセットの実験結果は、PLIDの先行技術よりも優れた性能を示している。
論文 参考訳(メタデータ) (2023-05-23T18:00:22Z) - Resources and Few-shot Learners for In-context Learning in Slavic
Languages [0.22940141855172028]
スラヴ語における文脈内学習(ICL)の訓練と評価に必要なインフラを収集する。
直近のコンテキスト内学習者の集合を評価し,その結果を教師付きベースラインと比較する。
英語で調整されたICLモデルは、非英語の文脈からいくつかのタスクを学習することができる。
論文 参考訳(メタデータ) (2023-04-04T16:16:25Z) - LAVIS: A Library for Language-Vision Intelligence [98.88477610704938]
LAVISは、LAnguage-VISionの研究と応用のためのオープンソースライブラリである。
最先端の画像言語、ビデオ言語モデル、一般的なデータセットに容易にアクセスできる統一インターフェースを備えている。
論文 参考訳(メタデータ) (2022-09-15T18:04:10Z) - Natural Language Processing Chains Inside a Cross-lingual Event-Centric
Knowledge Pipeline for European Union Under-resourced Languages [0.0]
本稿では、欧州連合言語のための言語処理チェーンを含むプラットフォームを開発するための戦略について述べる。
これらのチェーンは、ヨーロッパや他の世界に影響を与える可能性のある主要なイベントに関する多言語メディア情報を処理することを目的とした、イベント中心の知識処理パイプラインの第1ステップの一部です。
論文 参考訳(メタデータ) (2020-10-23T14:26:30Z) - A Summary of the First Workshop on Language Technology for Language
Documentation and Revitalization [70.14668193220528]
2019年8月、カーネギーメロン大学でワークショップが開かれ、言語コミュニティのメンバー、ドキュメンタリー言語学者、技術者を集結させようとした。
本報告では,ワークショップの結果を報告するとともに,9言語を対象とした様々な技術が開発され,実装されている。
論文 参考訳(メタデータ) (2020-04-27T22:55:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。