論文の概要: Towards the first UD Treebank of Spoken Italian: the KIParla forest
- arxiv url: http://arxiv.org/abs/2410.04589v1
- Date: Sun, 6 Oct 2024 19:01:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-02 06:36:17.305311
- Title: Towards the first UD Treebank of Spoken Italian: the KIParla forest
- Title(参考訳): イタリア初のUDツリーバンク:KIParla林
- Authors: Ludovica Pannitto,
- Abstract要約: 本プロジェクトは、KIParla corpus(Mauri et al., 2019, Ballare et al., 2020)のためのUniversal Dependencies treebankを構築することで、イタリア語で利用可能な言語資源を充実させようとしている。
- 参考スコア(独自算出の注目度): 0.16317061277457
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The present project endeavors to enrich the linguistic resources available for Italian by constructing a Universal Dependencies treebank for the KIParla corpus (Mauri et al., 2019, Ballar\`e et al., 2020), an existing and well known resource for spoken Italian.
- Abstract(参考訳): このプロジェクトは、KIParla corpus(Mauri et al , 2019, Ballar\`e et al , 2020)のためのUniversal Dependencies treebankを構築し、イタリア語で利用可能な言語資源を充実させようとしている。
関連論文リスト
- The KIPARLA Forest treebank of spoken Italian: an overview of initial design choices [0.138120109831448]
本稿では,イタリアのKIParla corpus (KIParla corpus) のツリーバンク構築に向けた設計選択について概説する。
本研究の目的は,イタリアのKIParla corpus のツリーバンク構築に向けた設計選択について概説することである。
論文 参考訳(メタデータ) (2024-11-10T18:32:24Z) - LuxBank: The First Universal Dependency Treebank for Luxembourgish [0.38447712214412116]
ルクセンブルク語(Luxembourgish)は、西ゲルマンの約40万人が話している言語である。
ルクセンブルクにおける最初のユニバーサル依存(UD)ツリーバンクであるLuxBankを紹介する。
論文 参考訳(メタデータ) (2024-11-07T15:50:40Z) - MaiBaam: A Multi-Dialectal Bavarian Universal Dependency Treebank [56.810282574817414]
We present the first multi-dialect Bavarian treebank (MaiBaam) based with part-of-speech and syntactic dependency information in Universal Dependencies (UD)。
我々は、近縁なバイエルン語とドイツ語のモルフォシンタクティックな相違を強調し、話者の正書法の豊富な多様性を示す。
私たちのコーパスには15kのトークンが含まれており、3つの国にまたがるバイエルン語を話すすべての地域の方言をカバーしています。
論文 参考訳(メタデータ) (2024-03-15T13:33:10Z) - Making a MIRACL: Multilingual Information Retrieval Across a Continuum
of Languages [62.730361829175415]
MIRACLは、WSDM 2023 Cupチャレンジのために構築した多言語データセットです。
18の言語にまたがるアドホック検索に焦点を当てている。
我々の目標は、言語連続体における検索を改善する研究を加速させることです。
論文 参考訳(メタデータ) (2022-10-18T16:47:18Z) - Building an Endangered Language Resource in the Classroom: Universal
Dependencies for Kakataibo [0.8938910048099864]
ペルーで話されているパノア語であるカタイボ語(Kakataibo)という、絶滅危惧言語のための新しいユニバーサル依存ツリーバンクをAmazoniaから立ち上げました。
まず,大学生を対象とした計算言語コースの文脈において,木バンクの作成に有効な協調手法について論じる。
論文 参考訳(メタデータ) (2022-06-21T12:58:56Z) - Universal Dependency Treebank for Odia Language [0.24466725954625887]
本稿では,形態学的に豊かな低資源のインド語であるオディア(Odia)の公用ツリーバンクについて紹介する。
ツリーバンクには、インド語で最大の並列コーパスコレクションである「サマンタル」から選ばれたオディアに約1082のトークン(100文)が含まれている。
オディア・ツリーバンクの形態解析は機械学習を用いて行った。
論文 参考訳(メタデータ) (2022-05-24T11:19:26Z) - Developing Universal Dependency Treebanks for Magahi and Braj [0.7349727826230861]
本稿では、マガヒ語とブラージュ語という2つの低リソースのインドの言語のためのツリーバンクの開発について論じる。
マガヒの木バンクには945の文と500の文からなるブラージュの木バンクがあり、その補題、部分音声、形態的特徴、普遍的な依存関係が特徴である。
論文 参考訳(メタデータ) (2022-04-26T23:43:41Z) - Prix-LM: Pretraining for Multilingual Knowledge Base Construction [59.02868906044296]
複数言語による知識構築と完成のための統合フレームワークである Prix-LM を提案する。
既存の多言語KBから抽出したモノリンガルトリプルとクロスリンガルリンクの2種類の知識を利用する。
複数の言語におけるリンク予測、言語間リンク、バイリンガル語彙誘導など、標準的なエンティティ関連タスクの実験は、その効果を実証している。
論文 参考訳(メタデータ) (2021-10-16T02:08:46Z) - Cross-Lingual GenQA: A Language-Agnostic Generative Question Answering
Approach for Open-Domain Question Answering [76.99585451345702]
オープン検索生成質問回答(GenQA)は、高品質で自然な回答を英語で提供することが証明されている。
我々は多言語環境に対するGenQAアプローチの最初の一般化について述べる。
論文 参考訳(メタデータ) (2021-10-14T04:36:29Z) - Anchor-based Bilingual Word Embeddings for Low-Resource Languages [76.48625630211943]
良質な単言語単語埋め込み(MWEs)は、大量のラベルのないテキストを持つ言語向けに構築することができる。
MWEは、数千の単語変換ペアだけでバイリンガル空間に整列することができる。
本稿では,高資源言語におけるベクトル空間を出発点とするBWEの構築手法を提案する。
論文 参考訳(メタデータ) (2020-10-23T19:17:00Z) - Recursive Top-Down Production for Sentence Generation with Latent Trees [77.56794870399288]
自然および合成言語に対する文脈自由文法の生成特性をモデル化する。
潜伏二分木構造にN$の葉を持つ動的プログラミングアルゴリズムを提案する。
また,Multi30kデータセットを用いたドイツ語と英語の翻訳実験を行った。
論文 参考訳(メタデータ) (2020-10-09T17:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。