論文の概要: Bh\=a$\unicode{x1E63}$\=acitra: Visualising the dialect geography of
South Asia
- arxiv url: http://arxiv.org/abs/2105.14082v1
- Date: Fri, 28 May 2021 19:52:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-06 01:50:42.744867
- Title: Bh\=a$\unicode{x1E63}$\=acitra: Visualising the dialect geography of
South Asia
- Title(参考訳): Bh\=a$\unicode{x1E63}$\=acitra: 南アジアの方言地理を視覚化する
- Authors: Aryaman Arora, Adam Farris, Gopalakrishnan R, Samopriya Basu
- Abstract要約: Bh=a$x1E63$=acitraは、言語研究データベースと注釈付きデータセット上に構築された南アジアの方言システムマッピングである。
- 参考スコア(独自算出の注目度): 1.911678487931003
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We present Bh\=a$\unicode{x1E63}$\=acitra, a dialect mapping system for South
Asia built on a database of linguistic studies of languages of the region
annotated for topic and location data. We analyse language coverage and look
towards applications to typology by visualising example datasets. The
application is not only meant to be useful for feature mapping, but also serves
as a new kind of interactive bibliography for linguists of South Asian
languages.
- Abstract(参考訳): Bh\=a$\unicode{x1E63}$\=acitraは、トピックや位置情報に注釈を付けた地域の言語研究のデータベース上に構築された南アジアの方言マッピングシステムである。
我々は、言語カバレッジを分析し、サンプルデータセットを視覚化することで、型論への応用に目を向ける。
このアプリケーションは、機能マッピングに有用であるだけでなく、南アジア言語の言語学者のための新しい種類のインタラクティブな書誌としても機能する。
関連論文リスト
- The First Swahili Language Scene Text Detection and Recognition Dataset [55.83178123785643]
低リソース言語、特にスワヒリ語には大きなギャップがある。
スワヒリ語は東アフリカ諸国で広く話されているが、依然としてシーンテキスト認識において未発見言語である。
本研究では,スワヒリシーンのテキスト画像の包括的データセットを提案し,異なるシーンのテキスト検出および認識モデルに基づくデータセットの評価を行う。
論文 参考訳(メタデータ) (2024-05-19T03:55:02Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Content-Localization based System for Analyzing Sentiment and Hate
Behaviors in Low-Resource Dialectal Arabic: English to Levantine and Gulf [5.2957928879391]
本稿では,高リソース言語における資源の内容を,低リソースアラビア語方言にローカライズすることを提案する。
我々は、コンテンツローカライゼーションに基づくニューラルマシン翻訳を用いて、レバンタインとガルフの2つの低リソースアラビア語方言に対する感情と憎悪の分類器を開発する。
以上の結果から,同一言語における方言の特異性を考慮し,方言的側面を無視することが,誤解を招く可能性が示唆された。
論文 参考訳(メタデータ) (2023-11-27T15:37:33Z) - Logographic Information Aids Learning Better Representations for Natural
Language Inference [3.677231059555795]
本稿では,より優れた意味表現を学習する上で,言語モデルにログ情報を提供することのメリットを探求する新しい研究を提案する。
6つの言語で評価した結果,ロゴグラフシステムを持つ言語にマルチモーダル埋め込みを組み込むことによる大きなメリットが示唆された。
論文 参考訳(メタデータ) (2022-11-03T20:40:14Z) - MASALA: Modelling and Analysing the Semantics of Adpositions in
Linguistic Annotation of Hindi [11.042037758273226]
我々は言語モデルを用いてヒンディー語におけるSNACSスーパーセンスの自動ラベリングを試みる。
Gujaratiのような関連言語へのセマンティックロールラベリングや拡張におけるアップストリームアプリケーションについて検討する。
論文 参考訳(メタデータ) (2022-05-08T21:13:33Z) - Urdu Morphology, Orthography and Lexicon Extraction [0.0]
本稿では,Urdu言語の実装をソフトウェアAPIとして記述する。
我々は、正書法、形態学、辞書の抽出を扱う。
論文 参考訳(メタデータ) (2022-04-06T20:14:01Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - SIGTYP 2020 Shared Task: Prediction of Typological Features [78.95376120154083]
タイポロジーKBが広く採用されるのを妨げる大きな欠点は、人口が少ないことである。
類型的特徴は相互に相関することが多いため、それらを予測し、自動的に類型的KBを投入することができる。
全体として、このタスクは5つのチームから8つの応募を惹きつけた。
論文 参考訳(メタデータ) (2020-10-16T08:47:24Z) - PhraseCut: Language-based Image Segmentation in the Wild [62.643450401286]
自然言語のフレーズを与えられた画像領域を分割する問題について考察する。
私たちのデータセットは、Visual Genomeデータセットの上に収集されます。
我々の実験は、我々のデータセットにおける概念のスケールと多様性が、既存の最先端技術に重大な課題をもたらすことを示している。
論文 参考訳(メタデータ) (2020-08-03T20:58:53Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。