論文の概要: A UD Treebank for Bohairic Coptic
- arxiv url: http://arxiv.org/abs/2504.18386v2
- Date: Fri, 06 Jun 2025 21:42:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 21:10:46.95541
- Title: A UD Treebank for Bohairic Coptic
- Title(参考訳): ボヘリック・コプトのためのUDツリーバンク
- Authors: Amir Zeldes, Nina Speransky, Nicholas Wagner, Caroline T. Schroeder,
- Abstract要約: ボヘリック・コプト語(Bohairic Coptic)は、マムルーク前、ビザンティン・エジプト後期、コプト教会の現代語の主要なコプト語方言である。
本稿では,聖書のテキスト,聖人の生活,キリスト教のアセティック・ライティングなど,さまざまな作品から収集した,ボヘラクティック・コプトの最初の構文的注釈付きコーパスを提示し,評価する。
- 参考スコア(独自算出の注目度): 8.912169966160896
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite recent advances in digital resources for other Coptic dialects, especially Sahidic, Bohairic Coptic, the main Coptic dialect for pre-Mamluk, late Byzantine Egypt, and the contemporary language of the Coptic Church, remains critically under-resourced. This paper presents and evaluates the first syntactically annotated corpus of Bohairic Coptic, sampling data from a range of works, including Biblical text, saints' lives and Christian ascetic writing. We also explore some of the main differences we observe compared to the existing UD treebank of Sahidic Coptic, the classical dialect of the language, and conduct joint and cross-dialect parsing experiments, revealing the unique nature of Bohairic as a related, but distinct variety from the more often studied Sahidic.
- Abstract(参考訳): 他のコプト語の方言、特にサヒド方言、ボヘリック・コプト方言、マムルーク語以前の主要なコプト語の方言、ビザンツ後期エジプト、そしてコプト教会の現代語に対するデジタルリソースの進歩にもかかわらず、批判的に過小評価されている。
本稿では,聖書のテキスト,聖人の生活,キリスト教のアセティック・ライティングなど,さまざまな作品から収集した,ボヘラクティック・コプトの最初の構文的注釈付きコーパスを提示し,評価する。
また、この言語の古典方言であるサヒド・コプト(英語版)の既存のUDツリーバンク(英語版)と比較して、我々が観察する主な相違点について検討し、ボヘリア語の特徴を関連付けるとともに、より頻繁に研究されるサヒド語とは異なる多様性を明らかにした。
関連論文リスト
- Critical biblical studies via word frequency analysis: unveiling text authorship [7.2762881851201255]
私たちは、聖書の最初の9冊にまたがる多くの章にまたがる3つの異なる著者を区別することを目指しています。
我々の分析は、最初の2人の著者(DとDtrH)が、専門家の評価と一致した事実であるPよりもはるかに密接な関係があることを示唆している。
論文 参考訳(メタデータ) (2024-10-24T22:08:38Z) - Puzzle Pieces Picker: Deciphering Ancient Chinese Characters with Radical Reconstruction [73.26364649572237]
Oracle Bone Inscriptionsは、世界で最も古い書式である。
多くのOracle Bone Inscriptions (OBI) は未解読のままであり、今日の古生物学におけるグローバルな課題の1つとなっている。
本稿では, 急進的再構成によってこれらの謎的文字を解読する新しい手法, Puzzle Pieces Picker (P$3$) を提案する。
論文 参考訳(メタデータ) (2024-06-05T07:34:39Z) - Efficacy of ByT5 in Multilingual Translation of Biblical Texts for Underrepresented Languages [3.313876945324241]
本研究では,ByT5をベースとした多言語翻訳モデルの開発と評価を行った。
我々は、文字ベースおよび形態学的に豊かな言語の複雑なニュアンスを捉えるために、モデルを訓練した。
BLEUスコアで測定し,サンプル翻訳を補足した結果,本モデルが神文へのアクセシビリティを向上させることが示唆された。
論文 参考訳(メタデータ) (2024-05-22T05:12:35Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - MaiBaam: A Multi-Dialectal Bavarian Universal Dependency Treebank [56.810282574817414]
We present the first multi-dialect Bavarian treebank (MaiBaam) based with part-of-speech and syntactic dependency information in Universal Dependencies (UD)。
我々は、近縁なバイエルン語とドイツ語のモルフォシンタクティックな相違を強調し、話者の正書法の豊富な多様性を示す。
私たちのコーパスには15kのトークンが含まれており、3つの国にまたがるバイエルン語を話すすべての地域の方言をカバーしています。
論文 参考訳(メタデータ) (2024-03-15T13:33:10Z) - Extracting Lexical Features from Dialects via Interpretable Dialect Classifiers [43.756851270091516]
本稿では,解釈可能な方言を用いて,方言の語彙的特徴を識別する新しい手法を提案する。
本手法は,方言の変種に寄与する重要な言語固有の語彙の特徴を同定し,その同定に有効であることを示す。
論文 参考訳(メタデータ) (2024-02-27T22:06:55Z) - A Dataset for Metaphor Detection in Early Medieval Hebrew Poetry [35.963626057019034]
詩は古代後期や中世ヘブライ語で顕著である。
比喩的・リテラル言語の使用の廃止は、人文科学研究者にとって大きな課題である。
本稿では,古古今・中世ヘブライ詩のメタファーを専門とする,新しい,挑戦的なデータセットについて述べる。
論文 参考訳(メタデータ) (2024-02-27T10:09:40Z) - A Corpus for Sentence-level Subjectivity Detection on English News Articles [49.49218203204942]
我々はこのガイドラインを用いて、議論を呼んだ話題に関する英ニュース記事から抽出した638の目的語と411の主観的な文からなるNewsSD-ENGを収集する。
我々のコーパスは、語彙や機械翻訳といった言語固有のツールに頼ることなく、英語で主観的検出を行う方法を舗装している。
論文 参考訳(メタデータ) (2023-05-29T11:54:50Z) - Style Classification of Rabbinic Literature for Detection of Lost
Midrash Tanhuma Material [1.933681537640272]
本稿では,そのスタイルに基づいたラビ文学の分類システムを提案する。
本研究では,この手法を用いて,特定のミッドラッシュジャンルから失われた素材を発見できることを示す。
論文 参考訳(メタデータ) (2022-11-17T17:45:59Z) - Computer-Aided Modelling of the Bilingual Word Indices to the
Ninth-Century Uchitel'noe evangelie [0.0]
我々は,情報源の多元性から生じる様々な非対称翻訳の関連性と変動性をモデル化する方法を示す。
われわれのアプローチは一般化を念頭に設計されており、ギリシャ語から旧教会スラヴ語への他の翻訳にも適用できるよう意図されている。
論文 参考訳(メタデータ) (2022-10-25T10:16:39Z) - For the Purpose of Curry: A UD Treebank for Ashokan Prakrit [2.538209532048867]
我々はアショカン・プラークリットの最初の言語的注釈付きツリーバンクを提示する。
これは、紀元前3世紀のアショーカ・モーリヤ帝の岩と柱の宣言によって証明された、インド・アーリアの初期の方言連続体である。
論文 参考訳(メタデータ) (2021-11-24T20:30:09Z) - Phoneme Recognition through Fine Tuning of Phonetic Representations: a
Case Study on Luhya Language Varieties [77.2347265289855]
音韻アノテーションに基づく多言語認識手法であるAllosaurus を用いた音素認識に焦点を当てた。
挑戦的な実世界シナリオで評価するために,我々は,ケニア西部とウガンダ東部のluhya言語クラスタの2つの種類であるbukusuとsaamiaの音声認識データセットをキュレートした。
私たちは、アロサウルスの微調整がわずか100発話であっても、電話のエラー率を大幅に改善することが分かりました。
論文 参考訳(メタデータ) (2021-04-04T15:07:55Z) - A Multi-Perspective Architecture for Semantic Code Search [58.73778219645548]
テキストマッチングのための新しい多言語間ニューラルネットワークを提案する。
CoNaLaデータセットを用いた実験により,提案したモデルでは,従来の手法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2020-05-06T04:46:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。