論文の概要: Hindi-Urdu Adposition and Case Supersenses v1.0
- arxiv url: http://arxiv.org/abs/2103.01399v1
- Date: Tue, 2 Mar 2021 01:25:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-05 02:54:22.924945
- Title: Hindi-Urdu Adposition and Case Supersenses v1.0
- Title(参考訳): Hindi-Urdu Adposition and Case Supersenses v1.0
- Authors: Aryaman Arora, Nitin Venkateswaran, Nathan Schneider
- Abstract要約: この文書は英語ガイドラインのバージョン2.5と一致している。
英語のガイドラインはこの文書のモデルとして使われた。
ケース・システムに加えて、ヒンディー語は斜めのジェネティヴに構築された非常に豊かな代用体系を持ち、現在のヒングリッシュでも生産的な借用語が組み込まれている。
- 参考スコア(独自算出の注目度): 9.861775841965388
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: These are the guidelines for the application of SNACS (Semantic Network of
Adposition and Case Supersenses; Schneider et al. 2018) to Modern Standard
Hindi of Delhi. SNACS is an inventory of 50 supersenses (semantic labels) for
labelling the use of adpositions and case markers with respect to both
lexical-semantic function and relation to the underlying context. The English
guidelines (Schneider et al., 2020) were used as a model for this document.
Besides the case system, Hindi has an extremely rich adpositional system
built on the oblique genitive, with productive incorporation of loanwords even
in present-day Hinglish.
This document is aligned with version 2.5 of the English guidelines.
- Abstract(参考訳): これらはSNACS(Semantic Network of Adposition and Case Supersenses; Schneider et al)の適用ガイドラインである。
2018) デリーの現代標準ヒンディー語に。
SNACSは50のスーパーセンス(セマンティックラベル)のインベントリであり、語彙・セマンティック関数および基礎となる文脈との関係について、配置とケースマーカーの使用をラベル付けする。
英語ガイドライン(Schneider et al., 2020)は、この文書のモデルとして使用されました。
ケース・システムに加えて、ヒンディー語は斜めのジェネティヴに構築された非常に豊かな代用体系を持ち、現在のヒングリッシュでも生産的な借用語が組み込まれている。
この文書は英語ガイドラインのバージョン2.5と一致している。
関連論文リスト
- Navigating Text-to-Image Generative Bias across Indic Languages [53.92640848303192]
本研究ではインドで広く話されているIndic言語に対するテキスト・ツー・イメージ(TTI)モデルのバイアスについて検討する。
これらの言語における主要なTTIモデルの生成的パフォーマンスと文化的関連性を評価し,比較する。
論文 参考訳(メタデータ) (2024-08-01T04:56:13Z) - Fantastic Semantics and Where to Find Them: Investigating Which Layers of Generative LLMs Reflect Lexical Semantics [50.982315553104975]
本稿では,Llama2という人気言語モデルに対する語彙意味論のボトムアップ進化について検討する。
実験の結果,下位層の表現は語彙的意味論を符号化しているが,上位層はより弱い意味帰納的帰納的帰納的帰納的帰納的帰納的帰納的帰属的帰属的帰属的帰属的存在であることがわかった。
これは、高層層がより良い語彙意味論を得るマスク言語モデリングのような差別的な目的を持つモデルとは対照的である。
論文 参考訳(メタデータ) (2024-03-03T13:14:47Z) - Dual-Alignment Pre-training for Cross-lingual Sentence Embedding [79.98111074307657]
本稿では,言語間文埋め込みのためのDAP(Dual-alignment pre-training)フレームワークを提案する。
そこで本研究では,一方の文脈化トークン表現を用いて翻訳相手を再構成する,新しい表現翻訳学習(RTL)タスクを提案する。
我々の手法は文の埋め込みを大幅に改善できる。
論文 参考訳(メタデータ) (2023-05-16T03:53:30Z) - MASALA: Modelling and Analysing the Semantics of Adpositions in
Linguistic Annotation of Hindi [11.042037758273226]
我々は言語モデルを用いてヒンディー語におけるSNACSスーパーセンスの自動ラベリングを試みる。
Gujaratiのような関連言語へのセマンティックロールラベリングや拡張におけるアップストリームアプリケーションについて検討する。
論文 参考訳(メタデータ) (2022-05-08T21:13:33Z) - "A Passage to India": Pre-trained Word Embeddings for Indian Languages [30.607474624873014]
既存のアプローチを使って、14のインドの言語に複数の単語を埋め込みます。
これらすべての言語への組み込みを単一のリポジトリに配置します。
8つの異なるアプローチを使って、合計436のモデルをリリースします。
論文 参考訳(メタデータ) (2021-12-27T17:31:04Z) - Prosody Labelled Dataset for Hindi using Semi-Automated Approach [0.19733467999508417]
本研究は,ヒンディー語のための半自動ラベル付き韻律データベースの開発を目的とする。
ヒンディー語では韻律ラベリングの標準は存在しない。
ピッチアクセント、中間句境界、アクセント句境界の訓練されたモデルの精度は、それぞれ73.40%、93.20%、および43%である。
論文 参考訳(メタデータ) (2021-12-11T13:11:36Z) - Towards automatic identification of linguistic politeness in Hindi texts [1.2691047660244332]
25,000以上のブログコメントを手作業でアノテートしたコーパスを使ってSVMをトレーニングしました。
トレーニングされたシステムは、人間の精度の2%以内である77%以上の精度を著しく向上させる。
論文 参考訳(メタデータ) (2021-11-30T10:32:17Z) - Image-to-image Translation via Hierarchical Style Disentanglement [115.81148219591387]
この問題に対処するために,HiSD(Hierarchical Style Disentanglement)を提案する。
具体的には,ラベルを階層的な木構造に整理し,独立タグ,排他属性,不規則なスタイルを上下に割り当てる。
CelebA-HQデータセットの定性的および定量的結果の両方が提案されたHiSDの能力を検証する。
論文 参考訳(メタデータ) (2021-03-02T03:43:18Z) - CUSATNLP@HASOC-Dravidian-CodeMix-FIRE2020:Identifying Offensive Language
from ManglishTweets [0.0]
本稿では,HASOC 攻撃言語識別-DravidianCodeMix のサブトラックである Task2 に提案する作業モデルを提案する。
これはメッセージレベルの分類タスクです。
埋め込みモデルに基づく分類器は、我々のアプローチにおける攻撃的コメントではなく攻撃的コメントを識別する。
論文 参考訳(メタデータ) (2020-10-17T10:11:41Z) - Automatic Extraction of Rules Governing Morphological Agreement [103.78033184221373]
原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
論文 参考訳(メタデータ) (2020-10-02T18:31:45Z) - Constructing a Family Tree of Ten Indo-European Languages with
Delexicalized Cross-linguistic Transfer Patterns [57.86480614673034]
我々は,デレクシカル化転送を,解釈可能なツリー・ツー・ストリングパターンとツリー・ツー・ツリーパターンとして定式化する。
これにより、言語間移動を定量的に探索し、第二言語習得の問い合わせを拡張することができる。
論文 参考訳(メタデータ) (2020-07-17T15:56:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。