論文の概要: Constituency Structure over Eojeol in Korean Treebanks
- arxiv url: http://arxiv.org/abs/2512.22487v1
- Date: Sat, 27 Dec 2025 06:12:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.080343
- Title: Constituency Structure over Eojeol in Korean Treebanks
- Title(参考訳): 韓国の樹木バンクにおけるEojeolの地域構造
- Authors: Jungyeul Park, Chulwoo Park,
- Abstract要約: 韓国語の単語は形態学的に複雑であり、形態素を構成端末として扱い、単語の内部形態とフレーズレベルの構文構造を融合させる。
本稿では,非構成層に符号化された音声情報の形態的セグメンテーションと微細なきめ細かな部分を有するオエオール系選挙区表現について論じる。
- 参考スコア(独自算出の注目度): 6.030221684048552
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The design of Korean constituency treebanks raises a fundamental representational question concerning the choice of terminal units. Although Korean words are morphologically complex, treating morphemes as constituency terminals conflates word internal morphology with phrase level syntactic structure and creates mismatches with eojeol based dependency resources. This paper argues for an eojeol based constituency representation, with morphological segmentation and fine grained part of speech information encoded in a separate, non constituent layer. A comparative analysis shows that, under explicit normalization assumptions, the Sejong and Penn Korean treebanks can be treated as representationally equivalent at the eojeol based constituency level. Building on this result, we outline an eojeol based annotation scheme that preserves interpretable constituency and supports cross treebank comparison and constituency dependency conversion.
- Abstract(参考訳): 韓国選挙区のツリーバンクの設計は、ターミナルユニットの選択に関する基本的な表現的疑問を提起する。
韓国語の単語は形態学的に複雑であるが、形態素を選挙区端末として扱うと、単語の内部形態がフレーズレベルの構文構造と混同され、オジェオールに基づく依存資源とミスマッチする。
本稿では,非構成層に符号化された音声情報の形態的セグメンテーションと微細なきめ細かな部分を有するオエオール系選挙区表現について論じる。
比較分析では、明示的な正規化仮定の下では、セホンとペンのツリーバンクは、オエオールの選挙区レベルで表象的に同等に扱われることが示された。
この結果に基づいて,解釈可能な選挙区を保存し,ツリーバンク間比較と選挙区依存性変換をサポートするojeolベースのアノテーションスキームを概説する。
関連論文リスト
- Enhancing Korean Dependency Parsing with Morphosyntactic Features [5.985682224542601]
本稿では,Universal Dependencies(UD)とUniversal Morphology(UniMorph)をブリッジする統合フレームワークであるUniDive for Koreanを紹介する。
韓国の豊かな屈折形態と柔軟な語順は、既存のフレームワークに課題をもたらす。
論文 参考訳(メタデータ) (2025-03-26T22:27:26Z) - Structured Tree Alignment for Evaluation of (Speech) Constituency Parsing [43.758912958903494]
本稿では, 音声評価の問題に起因した, 区切り木間の類似度尺度STRUCT-IOUについて述べる。
パラメータを計算するために,音声領域に強制アライメントを施して接地構文解析木を投影し,予測された接地構造成分と予測された成分を一定の制約下で整列させ,すべての整列構成ペアの平均IOUスコアを算出する。
論文 参考訳(メタデータ) (2024-02-21T00:01:17Z) - Word segmentation granularity in Korean [1.0619039878979954]
韓国語では、単語のセグメンテーションの粒度には複数のレベルがある。
特定の言語処理やコーパスアノテーションタスクでは、いくつかの異なる粒度レベルが提案され、利用されている。
興味深いことに、機能的形態素のみを分離した粒度は、句構造解析の最適性能をもたらす。
論文 参考訳(メタデータ) (2023-09-07T13:42:05Z) - K-UniMorph: Korean Universal Morphology and its Feature Schema [1.3048920509133806]
韓国語に対する新しいユニバーサル・モルフォロジー・データセットを提案する。
文末の文法的基準を詳細に概説し, 屈折形を抽出する方法を明らかにし, 形態的スキーマの生成方法を示す。
我々は,韓国語の3つの単語形式(文字,音節,形態素)を用いて屈折処理を行う。
論文 参考訳(メタデータ) (2023-05-10T17:44:01Z) - UniMorph 4.0: Universal Morphology [104.69846084893298]
本稿は,過去2年間のいくつかの前線における展開と改善について述べる。
多くの言語学者による共同作業により、30の絶滅危惧言語を含む67の新しい言語が追加された。
前回のUniMorphリリースに合わせて,16言語で形態素セグメンテーションを施したデータベースも拡張した。
論文 参考訳(メタデータ) (2022-05-07T09:19:02Z) - Quantifying Synthesis and Fusion and their Impact on Machine Translation [79.61874492642691]
自然言語処理(NLP)では、一般に、融合や凝集のような厳密な形態を持つ言語全体をラベル付けする。
本研究では,単語とセグメントレベルで形態型を定量化することにより,そのようなクレームの剛性を低減することを提案する。
本研究では, 英語, ドイツ語, トルコ語の非教師なし・教師付き形態素分割法について検討する一方, 融合ではスペイン語を用いた半自動手法を提案する。
そして、機械翻訳品質と単語(名詞と動詞)における合成・融合の程度との関係を分析する。
論文 参考訳(メタデータ) (2022-05-06T17:04:58Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - Evaluating the Morphosyntactic Well-formedness of Generated Texts [88.20502652494521]
L'AMBRE – テキストのモルフォシンタク的整形性を評価する指標を提案する。
形態的に豊かな言語に翻訳するシステムのダイアクロニックスタディを通じて,機械翻訳作業におけるメトリックの有効性を示す。
論文 参考訳(メタデータ) (2021-03-30T18:02:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。