論文の概要: Towards the first UD Treebank of Spoken Italian: the KIParla forest
- arxiv url: http://arxiv.org/abs/2410.04589v1
- Date: Sun, 06 Oct 2024 19:01:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-08 13:38:55.611323
- Title: Towards the first UD Treebank of Spoken Italian: the KIParla forest
- Title(参考訳): イタリア初のUDツリーバンク:KIParla林
- Authors: Ludovica Pannitto,
- Abstract要約: 本プロジェクトは、KIParla corpus(Mauri et al., 2019, Ballare et al., 2020)のためのUniversal Dependencies treebankを構築することで、イタリア語で利用可能な言語資源を充実させようとしている。
- 参考スコア(独自算出の注目度): 0.16317061277457
- License:
- Abstract: The present project endeavors to enrich the linguistic resources available for Italian by constructing a Universal Dependencies treebank for the KIParla corpus (Mauri et al., 2019, Ballar\`e et al., 2020), an existing and well known resource for spoken Italian.
- Abstract(参考訳): このプロジェクトは、KIParla corpus(Mauri et al , 2019, Ballar\`e et al , 2020)のためのUniversal Dependencies treebankを構築し、イタリア語で利用可能な言語資源を充実させようとしている。
関連論文リスト
- MaiBaam: A Multi-Dialectal Bavarian Universal Dependency Treebank [56.810282574817414]
We present the first multi-dialect Bavarian treebank (MaiBaam) based with part-of-speech and syntactic dependency information in Universal Dependencies (UD)。
我々は、近縁なバイエルン語とドイツ語のモルフォシンタクティックな相違を強調し、話者の正書法の豊富な多様性を示す。
私たちのコーパスには15kのトークンが含まれており、3つの国にまたがるバイエルン語を話すすべての地域の方言をカバーしています。
論文 参考訳(メタデータ) (2024-03-15T13:33:10Z) - Making a MIRACL: Multilingual Information Retrieval Across a Continuum
of Languages [62.730361829175415]
MIRACLは、WSDM 2023 Cupチャレンジのために構築した多言語データセットです。
18の言語にまたがるアドホック検索に焦点を当てている。
我々の目標は、言語連続体における検索を改善する研究を加速させることです。
論文 参考訳(メタデータ) (2022-10-18T16:47:18Z) - Building an Endangered Language Resource in the Classroom: Universal
Dependencies for Kakataibo [0.8938910048099864]
ペルーで話されているパノア語であるカタイボ語(Kakataibo)という、絶滅危惧言語のための新しいユニバーサル依存ツリーバンクをAmazoniaから立ち上げました。
まず,大学生を対象とした計算言語コースの文脈において,木バンクの作成に有効な協調手法について論じる。
論文 参考訳(メタデータ) (2022-06-21T12:58:56Z) - Universal Dependency Treebank for Odia Language [0.24466725954625887]
本稿では,形態学的に豊かな低資源のインド語であるオディア(Odia)の公用ツリーバンクについて紹介する。
ツリーバンクには、インド語で最大の並列コーパスコレクションである「サマンタル」から選ばれたオディアに約1082のトークン(100文)が含まれている。
オディア・ツリーバンクの形態解析は機械学習を用いて行った。
論文 参考訳(メタデータ) (2022-05-24T11:19:26Z) - Developing Universal Dependency Treebanks for Magahi and Braj [0.7349727826230861]
本稿では、マガヒ語とブラージュ語という2つの低リソースのインドの言語のためのツリーバンクの開発について論じる。
マガヒの木バンクには945の文と500の文からなるブラージュの木バンクがあり、その補題、部分音声、形態的特徴、普遍的な依存関係が特徴である。
論文 参考訳(メタデータ) (2022-04-26T23:43:41Z) - Prix-LM: Pretraining for Multilingual Knowledge Base Construction [59.02868906044296]
複数言語による知識構築と完成のための統合フレームワークである Prix-LM を提案する。
既存の多言語KBから抽出したモノリンガルトリプルとクロスリンガルリンクの2種類の知識を利用する。
複数の言語におけるリンク予測、言語間リンク、バイリンガル語彙誘導など、標準的なエンティティ関連タスクの実験は、その効果を実証している。
論文 参考訳(メタデータ) (2021-10-16T02:08:46Z) - Cross-Lingual GenQA: A Language-Agnostic Generative Question Answering
Approach for Open-Domain Question Answering [76.99585451345702]
オープン検索生成質問回答(GenQA)は、高品質で自然な回答を英語で提供することが証明されている。
我々は多言語環境に対するGenQAアプローチの最初の一般化について述べる。
論文 参考訳(メタデータ) (2021-10-14T04:36:29Z) - Multilingual Central Repository: a Cross-lingual Framework for
Developing Wordnets [5.459389632295147]
本稿では,多言語中央リポジトリの開発に使用される多言語フレームワークについて述べる。
この知識ベースにはバスク語、カタルーニャ語、英語、ガリシア語、ポルトガル語のワードネットが含まれており、ベースコンセプト、トップオントロジー、WordNetドメイン、Suggested Upper Merged Ontologyが含まれる。
論文 参考訳(メタデータ) (2021-07-01T09:50:55Z) - Apurin\~a Universal Dependencies Treebank [0.4893345190925178]
本稿では,アプリーナ語における最初のユニバーサル依存ツリーバンクについて論じる。
ツリーバンクには、76の完全注釈文、14のパート・オブ・スペル、および7つの追加または新機能が含まれている。
論文 参考訳(メタデータ) (2021-06-07T07:42:00Z) - Anchor-based Bilingual Word Embeddings for Low-Resource Languages [76.48625630211943]
良質な単言語単語埋め込み(MWEs)は、大量のラベルのないテキストを持つ言語向けに構築することができる。
MWEは、数千の単語変換ペアだけでバイリンガル空間に整列することができる。
本稿では,高資源言語におけるベクトル空間を出発点とするBWEの構築手法を提案する。
論文 参考訳(メタデータ) (2020-10-23T19:17:00Z) - Recursive Top-Down Production for Sentence Generation with Latent Trees [77.56794870399288]
自然および合成言語に対する文脈自由文法の生成特性をモデル化する。
潜伏二分木構造にN$の葉を持つ動的プログラミングアルゴリズムを提案する。
また,Multi30kデータセットを用いたドイツ語と英語の翻訳実験を行った。
論文 参考訳(メタデータ) (2020-10-09T17:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。