論文の概要: Closing the Gap at CRAC 2026: Two-Stage Adaptation for LLM-Based Multilingual Coreference Resolution
- arxiv url: http://arxiv.org/abs/2605.16984v2
- Date: Thu, 21 May 2026 14:20:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.428124
- Title: Closing the Gap at CRAC 2026: Two-Stage Adaptation for LLM-Based Multilingual Coreference Resolution
- Title(参考訳): CRAC 2026におけるギャップの閉鎖: LLMに基づく多言語照合解決のための2段階適応
- Authors: Antoine Bourgois, Olga Seminck, Thierry Poibeau,
- Abstract要約: 本稿では,2026年度のコンピュテーショナル・モデル・オブ・リファレンス・アナフォラ・アンド・コアス・タスクについて紹介する。
公式テストセットの平均CoNLL F1スコアは74.32で,LLMトラックで1位,総合3位にランクインした。
- 参考スコア(独自算出の注目度): 2.708757385089282
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We present our submission to the LLM track of the 2026 Computational Models of Reference, Anaphora and Coreference (CRAC 2026) shared task. With an average CoNLL F1 score of 74.32 on the official test set, our system ranked first in the LLM track, and third overall. Our system is based on the Gemma-3-27b model, fine-tuned using a two-stage strategy with a multilingual base adapter followed by dataset-specific adapters. We represent mention spans by their headword using an XML-inspired format with local reindexing and annotate documents iteratively. These design choices proved effective across languages, document lengths, and annotation guidelines.
- Abstract(参考訳): 我々は2026年のコンピュータ・モデル・オブ・リファレンス・アナフォラ・アンド・コアス・タスク(CRAC 2026)のLLMトラックに提案する。
公式テストセットの平均CoNLL F1スコアは74.32で,LLMトラックで1位,総合3位にランクインした。
本システムはGemma-3-27bモデルに基づいて,多言語ベースアダプタとデータセット固有のアダプタを併用した2段階戦略を用いて微調整を行う。
私たちは、XMLにインスパイアされたフォーマットで、文書をリデクシングし、注釈付けを反復的に行うことで言及スパンを表現します。
これらの設計選択は、言語、文書の長さ、ガイドラインで有効であることが証明された。
関連論文リスト
- PSK at SemEval-2026 Task 9: Multilingual Polarization Detection Using Ensemble Gemma Models with Synthetic Data Augmentation [0.0]
我々はSemEval-2026 Task 9: Multilingual Polarization Detection(22言語にまたがる二言語分類タスク)について提案する。
我々のアプローチは、Low-Rank Adaptation (LoRA)を用いて言語毎にGemma3モデルを分離し、Low-Rank Adaptation (LLM)によって生成された合成データで拡張する。
最終システムは22言語で0.811のマクロF1を達成し、参加チームの2位にランクインし、3言語で1位、8言語で3位にランクインした。
論文 参考訳(メタデータ) (2026-05-06T17:29:14Z) - HPLT 3.0: Very Large-Scale Multilingual Resources for LLM and MT. Mono- and Bi-lingual Data, Multilingual Evaluation, and Pre-Trained Models [25.953042884928006]
約200の言語に対して、オープンで、非常に大きく、高品質で、リッチな注釈付きテキストデータセットを提供するためのイニシアティブを提示します。
30兆のトークンで、これはおそらくLLM事前学習データの多言語収集としては最大である。
57種類のモノリンガルエンコーダ-デコーダモデルと、少数のモノリンガルGPT様参照モデルを訓練し、評価する。
論文 参考訳(メタデータ) (2025-11-02T20:16:38Z) - CorefInst: Leveraging LLMs for Multilingual Coreference Resolution [0.0]
Coreference Resolution(CR)は、自然言語理解において重要な課題である。
本研究では,デコーダのみのLLMを利用してオーバートとゼロの言及を扱う,最初の多言語CR手法を提案する。
論文 参考訳(メタデータ) (2025-09-22T08:35:21Z) - LexMatcher: Dictionary-centric Data Collection for LLM-based Machine Translation [67.24113079928668]
本稿では、バイリンガル辞書に見られる感覚のカバレッジによって駆動されるデータキュレーション手法であるLexMatcherを提案する。
我々の手法は、WMT2022テストセットの確立されたベースラインよりも優れています。
論文 参考訳(メタデータ) (2024-06-03T15:30:36Z) - TartuNLP @ SIGTYP 2024 Shared Task: Adapting XLM-RoBERTa for Ancient and Historical Languages [0.21485350418225246]
我々はSIGTYP 2024の制約なしサブタスクに,古代・歴史的言語における単語埋め込み評価の共有タスクを提出する。
そこで我々は,パラメータ効率の微調整を応用した,シンプルな,一様で,計算的に軽量な手法を開発した。
本研究は,現代の言語に事前学習した言語モデルを,アダプタ学習を通じて古代・古代の言語に適応する可能性を示すものである。
論文 参考訳(メタデータ) (2024-04-19T12:26:28Z) - The Ups and Downs of Large Language Model Inference with Vocabulary Trimming by Language Heuristics [74.99898531299148]
本研究は,興味のある言語への埋め込みエントリを制限し,時間と記憶効率を高めることによる語彙トリミング(VT)について検討する。
Unicodeベースのスクリプトフィルタリングとコーパスベースの選択という2つの言語を異なる言語ファミリやサイズに適用する。
その結果、VTは小型モデルのメモリ使用量を50%近く削減し、生成速度が25%向上した。
論文 参考訳(メタデータ) (2023-11-16T09:35:50Z) - An Open Dataset and Model for Language Identification [84.15194457400253]
マクロ平均F1スコア0.93、偽陽性率0.033を201言語で達成するLIDモデルを提案する。
モデルとデータセットの両方を研究コミュニティに公開しています。
論文 参考訳(メタデータ) (2023-05-23T08:43:42Z) - Zero-Shot Listwise Document Reranking with a Large Language Model [58.64141622176841]
本稿では,タスク固有の学習データを用いることなく,言語モデル(LRL)を用いたリスワイズ・リランカを提案する。
3つのTRECウェブサーチデータセットの実験により、LRLは第1段検索結果の再ランク付け時にゼロショットポイントワイズ法より優れるだけでなく、最終段再ランカとしても機能することが示された。
論文 参考訳(メタデータ) (2023-05-03T14:45:34Z) - MuCGEC: a Multi-Reference Multi-Source Evaluation Dataset for Chinese
Grammatical Error Correction [51.3754092853434]
MuCGECは中国語文法誤り訂正(CGEC)のためのマルチ参照評価データセットである
3つの中国語-as-a-Second-Language(CSL)学習資料から収集された7,063文からなる。
各文は3つのアノテータによって修正され、その修正は専門家によって慎重にレビューされ、1文あたりの参照数は2.3である。
論文 参考訳(メタデータ) (2022-04-23T05:20:38Z) - NEMO: Frequentist Inference Approach to Constrained Linguistic Typology
Feature Prediction in SIGTYP 2020 Shared Task [83.43738174234053]
タイプ的特徴間の相関関係を表現するために頻繁な推論を用い、この表現を用いて、個々の特徴を予測する単純なマルチクラス推定器を訓練する。
テスト言語149言語に対して,マイクロ平均精度0.66を達成できた。
論文 参考訳(メタデータ) (2020-10-12T19:25:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。