論文の概要: Annotating Compositionality Scores for Irish Noun Compounds is Hard Work
- arxiv url: http://arxiv.org/abs/2502.10061v1
- Date: Fri, 14 Feb 2025 10:32:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-17 18:06:53.469195
- Title: Annotating Compositionality Scores for Irish Noun Compounds is Hard Work
- Title(参考訳): アイルランドの名詞化合物の組成スコアの注釈付けは難しい
- Authors: Abigail Walsh, Teresa Clifford, Emma Daly, Jane Dunne, Brian Davis, Gearóid Ó Cleircín,
- Abstract要約: 本稿では,アイルランド語で特定される各種ドメインの複合名詞について,専門家アノテータによる分析を行った。
我々は、重要な特徴である構成性だけでなく、ドメインの特異性にも焦点を合わせ、アノテータの親しみと信頼度も評価します。
- 参考スコア(独自算出の注目度): 0.8400429419447888
- License:
- Abstract: Noun compounds constitute a challenging construction for NLP applications, given their variability in idiomaticity and interpretation. In this paper, we present an analysis of compound nouns identified in Irish text of varied domains by expert annotators, focusing on compositionality as a key feature, but also domain specificity, as well as familiarity and confidence of the annotator giving the ratings. Our findings and the discussion that ensued contributes towards a greater understanding of how these constructions appear in Irish language, and how they might be treated separately from English noun compounds.
- Abstract(参考訳): 名詞化合物は、慣用性と解釈の多様性を考えると、NLPアプリケーションにとって難しい構成となっている。
本稿では,様々なドメインのアイルランド語のテキストにおいて,有能なアノテータによって識別される複合名詞の分析を行い,重要な特徴である構成性だけでなく,ドメインの特異性にも焦点をあてるとともに,アノテータの親しみと信頼度も評価する。
これらの構造がアイルランド語でどのように現れるのか、そしてそれらが英語の名詞と別々に扱われるかについて、我々の発見とその後の議論はより深い理解に寄与する。
関連論文リスト
- Unsupervised Mapping of Arguments of Deverbal Nouns to Their
Corresponding Verbal Labels [52.940886615390106]
デバーバル名詞は英語の文章でよく使われる動詞で、出来事や行動やその議論を記述している。
名前付けされた構成の引数を扱うために存在する解決策は意味論的アノテーションに基づいている。
本稿では,より統語的アプローチを導入し,デバーバル名詞の議論を対応する動詞構成にマッピングする。
論文 参考訳(メタデータ) (2023-06-24T10:07:01Z) - Multilingual Extraction and Categorization of Lexical Collocations with
Graph-aware Transformers [86.64972552583941]
我々は,グラフ対応トランスフォーマアーキテクチャにより拡張されたBERTに基づくシーケンスタグ付けモデルを提案し,コンテキストにおけるコロケーション認識の課題について評価した。
以上の結果から, モデルアーキテクチャにおける構文的依存関係を明示的に符号化することは有用であり, 英語, スペイン語, フランス語におけるコロケーションのタイプ化の差異について考察する。
論文 参考訳(メタデータ) (2022-05-23T16:47:37Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - More Than Words: Collocation Tokenization for Latent Dirichlet
Allocation Models [71.42030830910227]
モデルが異なる環境でクラスタリングの品質を測定するための新しい指標を提案する。
マージトークンでトレーニングされたトピックは、マージされていないモデルよりも、より明確で、一貫性があり、トピックを区別する効果が高いトピックキーをもたらすことを示す。
論文 参考訳(メタデータ) (2021-08-24T14:08:19Z) - Transition-based Bubble Parsing: Improvements on Coordination Structure
Prediction [18.71574180551552]
本稿では,気泡増進構造解析のための遷移システムとニューラルモデルを提案する。
The English Penn Treebank and the English GENIA corpus での実験結果から,我々の研究は構造予測のコーディネートにおける過去の最先端のアプローチに勝っていることが示された。
論文 参考訳(メタデータ) (2021-07-14T18:00:05Z) - An In-depth Study on Internal Structure of Chinese Words [34.864343591706984]
本研究は,中国語の単語の深い内部構造を,構文的関係を識別するための11のラベルを持つ依存木としてモデル化することを提案する。
中国語の Penn Treebank から 30K 以上の多字語からなる単語内構造木バンク (WIST) を手動で注釈する。
我々は,中国語の単語形成に関する知見を明らかにするために,WISTに関する詳細な,興味深い分析を行った。
論文 参考訳(メタデータ) (2021-06-01T09:09:51Z) - What Meaning-Form Correlation Has to Compose With [1.6973426830397942]
3つの言語で意味-形式相関を解析する。
MFC測定では,同義語や非接地語などの言語現象が重なることがわかった。
論文 参考訳(メタデータ) (2020-12-07T16:33:23Z) - Pareto Probing: Trading Off Accuracy for Complexity [87.09294772742737]
我々は,プローブの複雑性と性能の基本的なトレードオフを反映したプローブ計量について論じる。
係り受け解析による実験により,文脈表現と非文脈表現の統語的知識の幅広いギャップが明らかとなった。
論文 参考訳(メタデータ) (2020-10-05T17:27:31Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Word Interdependence Exposes How LSTMs Compose Representations [18.34617849764921]
NLPにおける最近の研究は、LSTM言語モデルが言語データの構成構造を捉えていることを示している。
LSTMにおける単語の意味間の相互依存度を,内部ゲートでの相互作用に基づく新しい尺度として提示する。
論文 参考訳(メタデータ) (2020-04-27T21:48:08Z) - A Joint Approach to Compound Splitting and Idiomatic Compound Detection [2.172754891384887]
名詞化合物の詳細な処理には、それらをより小さな成分(または根)に分割する必要がある
我々は,ドイツ語に対する名詞合成と慣用的化合物検出の2倍の深層学習に基づくアプローチを開発した。
我々のニューラル名詞化合物スプリッターはサブワードレベルで動作し、最先端の技術を約5%上回っている。
論文 参考訳(メタデータ) (2020-03-21T09:00:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。