論文の概要: Concordance Comparison as a Means of Assembling Local Grammars
- arxiv url: http://arxiv.org/abs/2605.11862v1
- Date: Tue, 12 May 2026 09:45:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.765234
- Title: Concordance Comparison as a Means of Assembling Local Grammars
- Title(参考訳): 局所文法を組み立てる意味としての一致比較
- Authors: Juliana Pirovani, Elias de Oliveira, Eric Laporte,
- Abstract要約: 本稿では2つの局所文法から得られた一致を比較するツールを使用する。
比較分析により,各LG間の包摂性,交叉性,解離性の関係を観察した。
この手法は、ポルトガル語で書かれたテキストから人物名を抽出するケーススタディで用いられた。
- 参考スコア(独自算出の注目度): 0.45880283710344055
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named Entity Recognition for person names is an important but non-trivial task in information extraction. This article uses a tool that compares the concordances obtained from two local grammars (LG) and highlights the differences. We used the results as an aid to select the best of a set of LGs. By analyzing the comparisons, we observed relationships of inclusion, intersection and disjunction within each pair of LGs, which helped us to assemble those that yielded the best results. This approach was used in a case study on extraction of person names from texts written in Portuguese. We applied the enhanced grammar to the Gold Collection of the Second HAREM. The F-Measure obtained was 76.86, representing a gain of 6 points in relation to the state-of-the-art for Portuguese.
- Abstract(参考訳): 人物名に対する名前付きエンティティ認識は、情報抽出において重要なタスクであるが、非自明なタスクである。
本稿では,2つの局所文法(LG)から得られた一致を比較検討し,その相違点を強調した。
結果を使って、LGのベストセットを選択しました。
比較分析により,各LG間の包摂性,交叉性,解離性の関係が観察され,最も優れた結果を得たものを組み立てるのに役立った。
この手法は、ポルトガル語で書かれたテキストから人物名を抽出するケーススタディで用いられた。
拡張文法を第2次HAREMのゴールドコレクションに適用した。
F-Measureは76.86で、ポルトガルの最先端技術に関連して6ポイントを獲得した。
関連論文リスト
- Semantic Alignment of Multilingual Knowledge Graphs via Contextualized Vector Projections [8.709638469928448]
埋め込みに基づくコサイン類似性マッチングを用いた言語間アライメントシステム
我々は、より優れた埋め込みを生成するために、微調整変換器に基づく多言語モデルを使用する。
我々はOAEI-2022マルチファームトラックについて検討した。
論文 参考訳(メタデータ) (2025-12-22T11:02:30Z) - Lost in Translation, Found in Context: Sign Language Translation with Contextual Cues [56.038123093599815]
我々の目的は、連続手話から音声言語テキストへの翻訳である。
署名ビデオと追加のコンテキストキューを組み込む。
文脈的アプローチが翻訳の質を著しく向上させることを示す。
論文 参考訳(メタデータ) (2025-01-16T18:59:03Z) - How Transliterations Improve Crosslingual Alignment [48.929677368744606]
近年の研究では、アライメント目的を用いた多言語事前学習言語モデル(mPLM)が言語横断アライメントを改善することが示されている。
本稿では, 言語間のアライメントを明示的に評価し, 翻訳に基づくアプローチにおける重要な要素を同定し, 性能向上に寄与する。
論文 参考訳(メタデータ) (2024-09-25T20:05:45Z) - Homonym Sense Disambiguation in the Georgian Language [49.1574468325115]
本研究は,ジョージア語における単語センス曖昧化(WSD)課題に対する新しいアプローチを提案する。
これは、ジョージアのCommon Crawls corpusをフィルタリングすることによって形成されたデータセットに基づいて、事前訓練されたLarge Language Model(LLM)の教師付き微調整に基づいている。
論文 参考訳(メタデータ) (2024-04-24T21:48:43Z) - Multilingual Coreference Resolution in Low-resource South Asian Languages [36.31301773167754]
韓国語31言語に翻訳データセット(TransMuCoRes)を導入する。
予測された翻訳のほぼ全てが正当性検査に合格し、英語の参照の75%は予測された翻訳と一致している。
本研究は,ヒンディー語黄金集合上でのエンド・ツー・エンドのコア参照分解モデルを評価する最初のものである。
論文 参考訳(メタデータ) (2024-02-21T07:05:51Z) - Which One? Leveraging Context Between Objects and Multiple Views for Language Grounding [77.26626173589746]
文脈内接地に対する多視点的アプローチ(MAGiC)を提案する。
2つの類似したオブジェクトを区別する言語に基づくオブジェクト参照を選択する。
SNAREオブジェクト参照タスクの最先端モデルよりも、相対誤差を12.9%削減する。
論文 参考訳(メタデータ) (2023-11-12T00:21:58Z) - FRACAS: A FRench Annotated Corpus of Attribution relations in newS [0.0]
引用抽出と情報源帰属のために,フランス語で1676年のニュースワイヤテキストを手作業で注釈付けしたコーパスを提示する。
まず,データ選択時のコーパスの構成と選択について述べる。
次に、手動ラベリングに取り組んでいる8つのアノテータ間のアノテータ間合意について詳述する。
論文 参考訳(メタデータ) (2023-09-19T13:19:54Z) - LyricSIM: A novel Dataset and Benchmark for Similarity Detection in
Spanish Song LyricS [52.77024349608834]
歌詞中の意味的類似性に合わせた新しいデータセットとベンチマークを提案する。
このデータセットはもともと2775組のスペイン語の歌で構成されており、63のネイティブアノテータによる集合アノテーション実験で注釈付けされました。
論文 参考訳(メタデータ) (2023-06-02T07:48:20Z) - Extracting Synonyms from Bilingual Dictionaries [1.1470070927586016]
本稿では,バイリンガル辞書から同義語を抽出する新しいアルゴリズムの開発について述べる。
この考え方は、翻訳対から翻訳グラフを構築し、次に巡回経路を抽出して統合し、同義語のバイリンガル集合を形成するというものである。
このアルゴリズムの最初の評価は、アラビア語と英語の両言語同義語を抽出する有望な結果を示している。
論文 参考訳(メタデータ) (2020-12-01T16:09:22Z) - Multilingual Alignment of Contextual Word Representations [49.42244463346612]
BERTはXNLIのゼロショット性能をベースモデルに比べて大幅に改善した。
単語検索の文脈バージョンを導入し、下流のゼロショット転送とよく相関していることを示す。
これらの結果は、大規模多言語事前学習モデルの理解に有用な概念としてコンテキストアライメントをサポートする。
論文 参考訳(メタデータ) (2020-02-10T03:27:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。