論文の概要: CorPipe at CRAC 2024: Predicting Zero Mentions from Raw Text
- arxiv url: http://arxiv.org/abs/2410.02756v2
- Date: Sat, 09 Nov 2024 23:24:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:04:28.380085
- Title: CorPipe at CRAC 2024: Predicting Zero Mentions from Raw Text
- Title(参考訳): CorPipe at CRAC 2024: 生テキストからのゼロメンション予測
- Authors: Milan Straka,
- Abstract要約: 我々は,CorPipe 24,CRAC 2024Shared Task on Multilingual Coreference Resolutionについて述べる。
このタスクの第3イテレーションでは、新しい目的として、ゼロコア参照参照に必要な空のノードを予測することが挙げられる。
どちらの設定でも、CorPipeは、それぞれ3.9ポイントと2.8%の差で他の参加者を上回っている。
- 参考スコア(独自算出の注目度): 1.2772632966631616
- License:
- Abstract: We present CorPipe 24, the winning entry to the CRAC 2024 Shared Task on Multilingual Coreference Resolution. In this third iteration of the shared task, a novel objective is to also predict empty nodes needed for zero coreference mentions (while the empty nodes were given on input in previous years). This way, coreference resolution can be performed on raw text. We evaluate two model variants: a~two-stage approach (where the empty nodes are predicted first using a pretrained encoder model and then processed together with sentence words by another pretrained model) and a single-stage approach (where a single pretrained encoder model generates empty nodes, coreference mentions, and coreference links jointly). In both settings, CorPipe surpasses other participants by a large margin of 3.9 and 2.8 percent points, respectively. The source code and the trained model are available at https://github.com/ufal/crac2024-corpipe.
- Abstract(参考訳): 我々は,CorPipe 24,CRAC 2024Shared Task on Multilingual Coreference Resolutionについて述べる。
この共有タスクの3回目のイテレーションでは、新しい目的は、ゼロコア参照参照に必要な空のノードを予測することである。
このようにして、コア参照の解決は生のテキストで行うことができる。
2段階のアプローチ(まず、事前訓練されたエンコーダモデルを用いて空のノードを予測し、次に、他の事前訓練されたモデルによって文語と共に処理する)と1段階のアプローチ(1つの事前訓練されたエンコーダモデルが空のノードを生成し、コア参照参照とコア参照リンクを共同で生成する)である。
どちらの設定でも、CorPipeは、それぞれ3.9ポイントと2.8%の差で他の参加者を上回っている。
ソースコードとトレーニングされたモデルはhttps://github.com/ufal/crac2024-corpipeで公開されている。
関連論文リスト
- Self-Consistent Decoding for More Factual Open Responses [28.184313177333642]
Sample & Selectは、DoLA、P-CRR、S-CRRのデコーダに対して、30%の相対的なマージンで事実性を向上する。
生成した要約の人間による検証を収集し,本手法の実際的優位性を確認する。
論文 参考訳(メタデータ) (2024-03-01T17:31:09Z) - Connecting the Dots: Collaborative Fine-tuning for Black-Box Vision-Language Models [121.0693322732454]
本稿では,下流タスクに対するブラックボックス視覚言語モデルの微調整のための textbfCraFT' アプローチを提案する。
CraFTは、2つのモジュールと、テキストプロンプトを学習するプロンプト生成モジュールと、残差スタイルの出力予測を強化する予測改善モジュールとから構成される。
15以上のデータセットに対する数ショットの分類実験は、CraFTの優位性を示している。
論文 参考訳(メタデータ) (2024-02-06T14:53:19Z) - CRUXEval: A Benchmark for Code Reasoning, Understanding and Execution [36.30158138035512]
800のPython関数(3-13行)からなるベンチマークを示す。
各関数は入力出力対を持ち、入力予測と出力予測という2つの自然なタスクに繋がる。
単純なCoTと微調整方式によってベンチマークのパフォーマンスが向上するが、その解決には程遠いことを示す。
論文 参考訳(メタデータ) (2024-01-05T20:53:51Z) - Object Recognition as Next Token Prediction [99.40793702627396]
オブジェクト認識を次のトークン予測として提案する。
その考え方は、画像埋め込みからフォームラベルへのテキストトークンの自動回帰予測を行う言語デコーダを適用することである。
論文 参考訳(メタデータ) (2023-12-04T18:58:40Z) - ÚFAL CorPipe at CRAC 2023: Larger Context Improves Multilingual Coreference Resolution [1.2772632966631616]
CRAC 2023 Shared Task on Multilingual Coreference Resolution で優勝した CorPipe について述べる。
我々のシステムは、初期のマルチリンガル・コアス・パイプラインの改良版であり、他の参加者を4.5%の差で上回っている。
論文 参考訳(メタデータ) (2023-11-24T10:15:34Z) - 1st Place Solution of The Robust Vision Challenge (RVC) 2022 Semantic
Segmentation Track [67.56316745239629]
本報告では,ECCV 2022におけるロバストビジョンチャレンジのセマンティックセグメンテーション課題に対する勝利解について述べる。
本手法では,エンコーダとしてFAN-B-Hybridモデルを採用し,セグメンテーションフレームワークとしてSegformerを使用している。
提案手法は,マルチドメインセグメンテーションタスクの強力なベースラインとして機能し,今後の作業に役立てることができる。
論文 参考訳(メタデータ) (2022-10-23T20:52:22Z) - Conformal Predictor for Improving Zero-shot Text Classification
Efficiency [37.745518881553416]
NLIモデルとNSPモデルの平均推論時間をそれぞれ25.6%、22.2%削減する。
各データセットに適したCPを用いて、NLIベースのモデルとNSPベースのモデルの平均推論時間をそれぞれ25.6%、22.2%削減する。
論文 参考訳(メタデータ) (2022-10-23T05:19:50Z) - Progressive End-to-End Object Detection in Crowded Scenes [96.92416613336096]
以前のクエリベースの検出器は2つの欠点に悩まされていた: まず、複数の予測が1つのオブジェクトに対して推論される。
具体的には、まず受理されたクエリを選択して正の予測を生成し、その後、受理された予測に従って残雑音のあるクエリを精査する。
提案手法は,混み合ったシーンにおける問合せ型検出器の性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-15T06:12:00Z) - Detecting Handwritten Mathematical Terms with Sensor Based Data [71.84852429039881]
本稿では,手書きの数学的用語を自動分類する,スタビロによるUbiComp 2021チャレンジの解を提案する。
入力データセットには異なるライターのデータが含まれており、ラベル文字列は合計15の異なる文字から構成されている。
論文 参考訳(メタデータ) (2021-09-12T19:33:34Z) - Pre-training for Abstractive Document Summarization by Reinstating
Source Text [105.77348528847337]
本稿では,Seq2Seqに基づく非ラベルテキストによる抽象要約モデルの事前学習を可能にする3つの事前学習目標を提案する。
2つのベンチマーク要約データセットの実験では、3つの目的がすべてベースラインでパフォーマンスを向上させることが示されている。
論文 参考訳(メタデータ) (2020-04-04T05:06:26Z) - Parallel sequence tagging for concept recognition [0.0]
名前付きエンティティ認識(NER)と正規化(NEN)は、バイオメディカルテキストのためのあらゆるテキストマイニングシステムの中核となるコンポーネントである。
従来の概念認識パイプラインでは、これらのタスクはシリアルな方法で結合される。
我々は,NER と NEN の両方をシーケンスラベルタスクとしてモデル化し,ソースコードを直接操作する並列アーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-16T19:41:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。