Fugu-MT 論文翻訳(概要): A new semantically annotated corpus with syntactic-semantic and cross-lingual senses

論文の概要: A new semantically annotated corpus with syntactic-semantic and cross-lingual senses

arxiv url: http://arxiv.org/abs/2605.28494v1
Date: Wed, 27 May 2026 13:52:26 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-28 17:38:56.091827
Title: A new semantically annotated corpus with syntactic-semantic and cross-lingual senses
Title（参考訳）: セマンティック・セマンティック・クロスランガル感覚を持つ意味的注釈付きコーパス
Authors: Myriam Rakho, Eric Laporte, Matthieu Constant,
Abstract要約: コーパスは20のフランス語の多節動詞から構成される。各動詞のインスタンスには3つのセンスラベルがアノテートされている。この例の英語版における動詞の実際の翻訳は、パラレルコーパスである。フランス語の計算辞書における動詞の入力。翻訳の連結による微粒な感覚ラベル。
参考スコア（独自算出の注目度）: 0.11470070927586017
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We describe a new sense-tagged corpus for word sense disambiguation. The corpus is constituted of instances of 20 French polysemous verbs. Each verb instance is annotated with three sense labels: (1) the actual translation of the verb in the english version of this instance in a parallel corpus, (2) an entry of the verb in a computational dictionary of French (the Lexicon-Grammar tables) and (3) a fine-grained sense label resulting from the concatenation of the translation and the Lexicon-Grammar entry.
Abstract（参考訳）: 単語感覚不明瞭化のための新しい感覚タグ付きコーパスについて述べる。コーパスは20のフランス語多文動詞の例で構成されている。それぞれの動詞は3つの意味ラベルで注釈付けされる: (1) この例の英語版における動詞の実際の翻訳、(2)フランス語の計算辞書(Lexicon-Grammar table)における動詞の入力、(3)翻訳の連結とLexicon-Grammarエントリによるきめ細かい感覚ラベル。

関連論文リスト

Can Word Sense Distribution Detect Semantic Changes of Words? [35.17635565325166]
単語感覚分布は、英語、ドイツ語、スウェーデン語、ラテン語の単語の意味変化を正確に予測するために使用できることを示す。 SemEval 2020 Task 1のデータセットを用いた実験結果から,単語の意味的変化を正確に予測できることがわかった。
論文参考訳（メタデータ） (2023-10-16T13:41:27Z)
A Corpus for Sentence-level Subjectivity Detection on English News Articles [49.49218203204942]
我々はこのガイドラインを用いて、議論を呼んだ話題に関する英ニュース記事から抽出した638の目的語と411の主観的な文からなるNewsSD-ENGを収集する。我々のコーパスは、語彙や機械翻訳といった言語固有のツールに頼ることなく、英語で主観的検出を行う方法を舗装している。
論文参考訳（メタデータ） (2023-05-29T11:54:50Z)
ArzEn-ST: A Three-way Speech Translation Corpus for Code-Switched Egyptian Arabic - English [32.885722714728765]
ArzEn-ST (英語: ArzEn-ST) は、エジプトの音声翻訳会社。このコーパスは、バイリンガル話者との非公式なインタビューを通じて収集されたArzEn音声コーパスの拡張である。
論文参考訳（メタデータ） (2022-11-22T04:37:14Z)
GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention Refinement [73.73599110214828]
グラウンドドコンディション認識(GSR)は、人間のイベント理解のための画像の構造化されたセマンティックサマリーを生成することを目的としている。オブジェクト検出とイメージキャプションタスクにインスパイアされた既存のメソッドは、2段階のフレームワークを使用するのが一般的である。本稿では,動詞と役割の双方向関係の活用に焦点をあてた,新しい2段階フレームワークを提案する。
論文参考訳（メタデータ） (2022-08-18T17:13:59Z)
Grammar-Based Grounded Lexicon Learning [68.59500589319023]
G2L2は、構成的および基礎的な言語表現を学ぶための語彙主義的なアプローチである。 G2L2の中核には語彙エントリの集まりがあり、各単語を構文型とニューロシンボリックセマンティックプログラムにマッピングする。 G2L2は、少量のデータから新しい単語合成へと一般化することができる。
論文参考訳（メタデータ） (2022-02-17T18:19:53Z)
When is Wall a Pared and when a Muro? -- Extracting Rules Governing Lexical Selection [85.0262994506624]
本稿では,微細な語彙の区別を自動的に識別する手法を提案する。我々は、これらの区別を説明する簡潔な記述を、人間と機械で読める形式で抽出する。我々はこれらの記述を用いて、与えられた曖昧な単語を異なる可能な翻訳に翻訳する時、非ネイティブ話者に教える。
論文参考訳（メタデータ） (2021-09-13T14:49:00Z)
Word frequency-rank relationship in tagged texts [0.0]
3つの異なる文法クラスに対応するサブ語彙の周波数-ランク関係を解析する。この結果は、周波数ランク関係が文法関数に関連する言語的特徴を反映している可能性があることを指摘する。
論文参考訳（メタデータ） (2021-02-07T15:17:51Z)
Investigating Cross-Linguistic Adjective Ordering Tendencies with a Latent-Variable Model [66.84264870118723]
本稿では,多言語形容詞順序付けを潜在変数モデルとして,初めて純粋コーパス駆動モデルを提案する。我々は普遍的、言語横断的、階層的形容詞順序付け傾向の存在の強い確固たる証拠を提供する。
論文参考訳（メタデータ） (2020-10-09T18:27:55Z)
LiSSS: A toy corpus of Spanish Literary Sentences for Emotions detection [1.5356167668895644]
このコーパスは,愛,恐怖,幸福,怒り,悲しみ/痛みという感情のセットで,文章を手作業で分類することで構成する。 LISSSコーパスは、CCライクなアルゴリズムの評価や作成のための無料リソースとして、コミュニティに提供される。
論文参考訳（メタデータ） (2020-05-17T11:14:30Z)
Humpty Dumpty: Controlling Word Meanings via Corpus Poisoning [29.181547214915238]
埋め込み空間における単語の位置を変更することで、攻撃者が新しい単語や既存の単語の「意味」を制御できることが示される。埋め込みに対する攻撃は、さまざまな下流タスクに影響を与える可能性がある。
論文参考訳（メタデータ） (2020-01-14T17:48:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。