Fugu-MT 論文翻訳(概要): \'UFAL CorPipe at CRAC 2022: Effectivity of Multilingual Models for Coreference Resolution

論文の概要: \'UFAL CorPipe at CRAC 2022: Effectivity of Multilingual Models for Coreference Resolution

arxiv url: http://arxiv.org/abs/2209.07278v2
Date: Fri, 24 Nov 2023 10:02:16 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-28 05:09:25.750273
Title: \'UFAL CorPipe at CRAC 2022: Effectivity of Multilingual Models for Coreference Resolution
Title（参考訳）: CRAC 2022における \'UFAL CorPipe: 干渉分解のための多言語モデルの効果
Authors: Milan Straka and Jana Strakov\'a
Abstract要約: CRAC 2022 における多言語照合解決のための共有タスクの入賞条件について述べる。提案システムは,まず参照検出を解き,抽出したスパンと先行最大化手法をリンクする。
参考スコア（独自算出の注目度）: 1.2772632966631616
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We describe the winning submission to the CRAC 2022 Shared Task on Multilingual Coreference Resolution. Our system first solves mention detection and then coreference linking on the retrieved spans with an antecedent-maximization approach, and both tasks are fine-tuned jointly with shared Transformer weights. We report results of fine-tuning a wide range of pretrained models. The center of this contribution are fine-tuned multilingual models. We found one large multilingual model with sufficiently large encoder to increase performance on all datasets across the board, with the benefit not limited only to the underrepresented languages or groups of typologically relative languages. The source code is available at https://github.com/ufal/crac2022-corpipe.
Abstract（参考訳）: CRAC 2022 における多言語照合解決のための共有タスクの受賞申請について述べる。提案システムは,まず参照検出を解き,抽出したスパンのコア参照リンクを先行最大化手法で解き,両タスクは共有トランスフォーマー重みとともに微調整される。各種事前学習モデルの微調整結果について報告する。この貢献の中心は細調整された多言語モデルである。その結果,全データセットの性能向上に十分なエンコーダを持つ大規模多言語モデルが得られたが,その利点は表現不足の言語や類型的関連言語群に限るに留まらなかった。ソースコードはhttps://github.com/ufal/crac2022-corpipeで入手できる。

関連論文リスト

Implicit Cross-Lingual Rewarding for Efficient Multilingual Preference Alignment [35.1576728251478]
提案手法は,暗黙の報奨によって適切に整合した英語モデルからの好みを捉え,反復学習を通じて他言語に伝達する手法である。 2回に分けて微調整したLlama3はウィンレートを平均12.72%改善し、X-AlpacaEvalのリーダーボード上でのトレーニング言語全体の長さ制御ウィンレートを5.97%向上させた。
論文参考訳（メタデータ） (2025-03-06T17:33:01Z)
Exploring Multiple Strategies to Improve Multilingual Coreference Resolution in CorefUD [0.0]
本稿では,エンド・ツー・エンドのニューラル・コアス・リゾリューションシステムについて述べる。まず、モノリンガルとクロスリンガルのバリエーションを含む強力なベースラインモデルを構築します。多様な言語文脈における性能向上のためのいくつかの拡張を提案する。
論文参考訳（メタデータ） (2024-08-29T20:27:05Z)
ÚFAL CorPipe at CRAC 2023: Larger Context Improves Multilingual Coreference Resolution [1.2772632966631616]
CRAC 2023 Shared Task on Multilingual Coreference Resolution で優勝した CorPipe について述べる。我々のシステムは、初期のマルチリンガル・コアス・パイプラインの改良版であり、他の参加者を4.5%の差で上回っている。
論文参考訳（メタデータ） (2023-11-24T10:15:34Z)
CUNI Submission to MRL 2023 Shared Task on Multi-lingual Multi-task Information Retrieval [5.97515243922116]
本稿では,多言語多タスク情報検索におけるMRL2023共有タスクのためのチャールズ大学システムを提案する。共有タスクの目的は、いくつかの未表現言語で名前付きエンティティ認識と質問応答のためのシステムを開発することである。両方のサブタスクに対する私たちのソリューションは、翻訳テストのアプローチに依存しています。
論文参考訳（メタデータ） (2023-10-25T10:22:49Z)
Ensemble Transfer Learning for Multilingual Coreference Resolution [60.409789753164944]
非英語で作業する場合に頻繁に発生する問題は、注釈付きトレーニングデータの不足である。我々は,様々なトランスファー学習技術を組み合わせた,シンプルだが効果的なアンサンブルベースのフレームワークを設計する。また、ウィキペディアアンカーテキストを利用して、コア参照解決モデルをブートストラップする低コストのTL手法を提案する。
論文参考訳（メタデータ） (2023-01-22T18:22:55Z)
End-to-end Multilingual Coreference Resolution with Mention Head Prediction [0.0]
本稿では,CRAC 2022の多言語照合における共有タスクについて述べる。我々のモデルは、最先端のエンドツーエンドのコア参照解決システムに基づいている。
論文参考訳（メタデータ） (2022-09-26T08:45:09Z)
Breaking Down Multilingual Machine Translation [74.24795388967907]
マルチ言語学習は一般にエンコーダにとって有益であるが,ローソース言語(LRL)ではデコーダにのみ有益であることを示す。 LRLの多言語モデルと一対多モデルは、Aharoniらによって報告された最良の結果よりも優れています。
論文参考訳（メタデータ） (2021-10-15T14:57:12Z)
XLM-T: Scaling up Multilingual Machine Translation with Pretrained Cross-lingual Transformer Encoders [89.0059978016914]
そこで本稿では,既製のクロスリンガルトランスフォーマでモデルを初期化し,多言語並列データで微調整するXLM-Tを提案する。この単純な方法は,10対のWMTデータセットと94対のOPUS-100コーパスにおいて,大幅な改善を実現する。
論文参考訳（メタデータ） (2020-12-31T11:16:51Z)
Beyond English-Centric Multilingual Machine Translation [74.21727842163068]
我々は真の多言語多言語翻訳モデルを作成し、100言語のいずれかのペア間で直接翻訳できる。大規模なマイニングによって生成された教師付きデータで、数千の言語方向をカバーするトレーニングデータセットを構築し、オープンソースにしています。 WMTのベストシングルシステムに競争力を持たせながら、非英語の方向を直接翻訳する場合、非英語モデルに焦点をあてると10 BLEU以上のゲインが得られる。
論文参考訳（メタデータ） (2020-10-21T17:01:23Z)
Mixed-Lingual Pre-training for Cross-lingual Summarization [54.4823498438831]
言語間の要約は、ソース言語の記事に対する対象言語の要約を作成することを目的としている。本稿では,翻訳のような言語間タスクと,マスク付き言語モデルのようなモノリンガルタスクの両方を活用する混合言語事前学習に基づくソリューションを提案する。本モデルでは,2.82(中国語)と1.15(中国語,英語)のROUGE-1スコアを最先端の結果に対して改善する。
論文参考訳（メタデータ） (2020-10-18T00:21:53Z)
Pre-training Multilingual Neural Machine Translation by Leveraging Alignment Information [72.2412707779571]
mRASPは、汎用多言語ニューラルマシン翻訳モデルを事前訓練するためのアプローチである。我々は,低,中,豊かな資源を含む多種多様な環境における42の翻訳方向の実験を行い,エキゾチックな言語対への変換を行った。
論文参考訳（メタデータ） (2020-10-07T03:57:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。