論文の概要: The Parallel Meaning Bank: A Framework for Semantically Annotating
Multiple Languages
- arxiv url: http://arxiv.org/abs/2012.14854v1
- Date: Tue, 29 Dec 2020 17:04:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-19 00:45:29.797654
- Title: The Parallel Meaning Bank: A Framework for Semantically Annotating
Multiple Languages
- Title(参考訳): Parallel Meaning Bank: 複数の言語を意味的にアノテーションするフレームワーク
- Authors: Lasha Abzianidze, Rik van Noord, Chunliu Wang, Johan Bos
- Abstract要約: 本稿では,パラレル平均銀行の背景にある考え方について概説する。
このフレームワークは、英語以外の言語で書かれたテキストの構成意味論を簡単にアノテーションする方法を提供することを目指しています。
文書が英語からの翻訳に基づいている限り、新しい言語を意味銀行に追加することができます。
- 参考スコア(独自算出の注目度): 2.57503092324306
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper gives a general description of the ideas behind the Parallel
Meaning Bank, a framework with the aim to provide an easy way to annotate
compositional semantics for texts written in languages other than English. The
annotation procedure is semi-automatic, and comprises seven layers of
linguistic information: segmentation, symbolisation, semantic tagging, word
sense disambiguation, syntactic structure, thematic role labelling, and
co-reference. New languages can be added to the meaning bank as long as the
documents are based on translations from English, but also introduce new
interesting challenges on the linguistics assumptions underlying the Parallel
Meaning Bank.
- Abstract(参考訳): 本論文は,英語以外の言語で書かれたテキストに対して,作曲意味論の注釈付けを容易にするためのフレームワークであるParallel Meaning Bankの背景にある考え方を概説する。
アノテーション手順は半自動的であり、セグメンテーション、シンボル化、セマンティックタグ付け、単語感覚の曖昧さ、構文構造、テーマロールラベリング、コレファレンスという7つの言語情報からなる。
文書が英語の翻訳に基づいている限り、新しい言語を銀行の意味に追加することができるが、パラレル平均銀行の根底にある言語学の仮定に関する新たな興味深い課題も導入する。
関連論文リスト
- Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.07940818022468]
エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。
意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。
グループ化されたサブワードの検査では 様々な意味的類似性を示します
論文 参考訳(メタデータ) (2024-11-07T08:38:32Z) - Unlocking Korean Verbs: A User-Friendly Exploration into the Verb Lexicon [5.358486800301437]
Sejong辞書データセットは、形態学、構文、意味表現を広範囲にカバーしている。
このデータセット内のラベル付き言語構造は、単語とフレーズの関係を明らかにする基盤を形成する。
本稿では,動詞関連情報の収集と統合を目的としたユーザフレンドリーなWebインターフェースを提案する。
論文 参考訳(メタデータ) (2024-10-01T22:03:34Z) - Evaluating Contextualized Representations of (Spanish) Ambiguous Words: A New Lexical Resource and Empirical Analysis [2.2530496464901106]
スペイン語の単言語モデルと多言語BERTモデルを用いて、文脈におけるスペイン語のあいまいな名詞の意味表現を評価する。
様々な BERT ベースの LM の文脈的意味表現は、人間の判断に多少の違いがあるが、ヒトのベンチマークには及ばない。
論文 参考訳(メタデータ) (2024-06-20T18:58:11Z) - Contribuci\'on de la sem\'antica combinatoria al desarrollo de
herramientas digitales multiling\"ues [0.0]
本稿では、スペイン語、フランス語、ドイツ語の名詞句における引数パターンの自動生成のための3つのプロトタイプの設計に、コンビニアル・セマンティックスの分野がどのように貢献したかを述べる。
また、外国語の文脈における生産状況において、議論の構文・意味的インターフェースについて知ることが重要であることも示している。
論文 参考訳(メタデータ) (2023-12-26T19:32:05Z) - SpaDeLeF: A Dataset for Hierarchical Classification of Lexical Functions
for Collocations in Spanish [6.9454683800956705]
スペイン語の動詞・名詞のコロケーションと文の出現頻度が最も高いデータセットを提示する。
各コロケーションは、階層分類タスクのクラスとして定義される37の語彙関数の1つに割り当てられる。
木構造にクラスを結合し,構造レベル毎に分類対象を導入する。
論文 参考訳(メタデータ) (2023-11-07T18:32:34Z) - Enhancing Cross-lingual Transfer via Phonemic Transcription Integration [57.109031654219294]
PhoneXLは、音素転写を言語間移動のための追加のモダリティとして組み込んだフレームワークである。
本研究は, 音素転写が, 言語間移動を促進するために, 正書法以外の重要な情報を提供することを示すものである。
論文 参考訳(メタデータ) (2023-07-10T06:17:33Z) - SenteCon: Leveraging Lexicons to Learn Human-Interpretable Language
Representations [51.08119762844217]
SenteConは、深層言語表現に人間の解釈可能性を導入する方法である。
SenteConは、下流タスクにおける予測性能にほとんど、あるいは全くコストをかからない高レベルな解釈性を提供する。
論文 参考訳(メタデータ) (2023-05-24T05:06:28Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - AUTOLEX: An Automatic Framework for Linguistic Exploration [93.89709486642666]
本稿では言語学者による言語現象の簡潔な記述の発見と抽出を容易にするための自動フレームワークを提案する。
具体的には、この枠組みを用いて、形態的一致、ケースマーキング、単語順序の3つの現象について記述を抽出する。
本研究では,言語専門家の助けを借りて記述を評価し,人間の評価が不可能な場合に自動評価を行う手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T20:37:30Z) - Multi-SimLex: A Large-Scale Evaluation of Multilingual and Cross-Lingual
Lexical Semantic Similarity [67.36239720463657]
Multi-SimLexは、12の異なる言語のデータセットをカバーする大規模な語彙リソースと評価ベンチマークである。
各言語データセットは、意味的類似性の語彙的関係に注釈付けされ、1,888のセマンティック・アライメント・コンセプト・ペアを含む。
言語間の概念の整合性のため、66の言語間セマンティック類似性データセットを提供する。
論文 参考訳(メタデータ) (2020-03-10T17:17:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。