論文の概要: Joint Coreference Resolution for Zeros and non-Zeros in Arabic
- arxiv url: http://arxiv.org/abs/2210.12169v1
- Date: Fri, 21 Oct 2022 18:01:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 14:04:43.770281
- Title: Joint Coreference Resolution for Zeros and non-Zeros in Arabic
- Title(参考訳): アラビア語におけるゼロと非ゼロの合同比較分解能
- Authors: Abdulrahman Aloraini and Sameer Pradhan and Massimo Poesio
- Abstract要約: AZPと非AZPを共同で解決するアーキテクチャを2つ導入する。
我々は、アラビア語でそれらを評価し、この言語は、我々が知る限り、共同解決に関する事前の作業は行われていない。
- 参考スコア(独自算出の注目度): 10.215363323133897
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most existing proposals about anaphoric zero pronoun (AZP) resolution regard
full mention coreference and AZP resolution as two independent tasks, even
though the two tasks are clearly related. The main issues that need tackling to
develop a joint model for zero and non-zero mentions are the difference between
the two types of arguments (zero pronouns, being null, provide no nominal
information) and the lack of annotated datasets of a suitable size in which
both types of arguments are annotated for languages other than Chinese and
Japanese. In this paper, we introduce two architectures for jointly resolving
AZPs and non-AZPs, and evaluate them on Arabic, a language for which, as far as
we know, there has been no prior work on joint resolution. Doing this also
required creating a new version of the Arabic subset of the standard
coreference resolution dataset used for the CoNLL-2012 shared task (Pradhan et
al.,2012) in which both zeros and non-zeros are included in a single dataset.
- Abstract(参考訳): anaphoric zero pronoun (azp) 解決に関する既存の提案のほとんどは、完全参照コリファレンスと azp 分解を2つの独立したタスクと見なす。
ゼロとゼロ以外の言及のための共同モデルを開発するのに必要な主な問題は、2つのタイプの議論(ゼロ代名詞はnullであり、名目情報を提供しない)と、2つのタイプの議論が中国語と日本語以外の言語にアノテートされる適切な大きさの注釈付きデータセットの欠如である。
本稿では,azpsと非azpsを共同で解くための2つのアーキテクチャを紹介し,それらのアーキテクチャをアラビア語で評価する。
また、CoNLL-2012共有タスク(Pradhan et al.,2012)で使用される標準コア参照解決データセットのアラビア部分集合の新バージョンを作成し、ゼロと非ゼロの両方を単一のデータセットに含める必要があった。
関連論文リスト
- Exploring Multiple Strategies to Improve Multilingual Coreference Resolution in CorefUD [0.0]
本稿では,エンド・ツー・エンドのニューラル・コアス・リゾリューションシステムについて述べる。
まず、モノリンガルとクロスリンガルのバリエーションを含む強力なベースラインモデルを構築します。
多様な言語文脈における性能向上のためのいくつかの拡張を提案する。
論文 参考訳(メタデータ) (2024-08-29T20:27:05Z) - Multilingual Coreference Resolution in Low-resource South Asian Languages [36.31301773167754]
韓国語31言語に翻訳データセット(TransMuCoRes)を導入する。
予測された翻訳のほぼ全てが正当性検査に合格し、英語の参照の75%は予測された翻訳と一致している。
本研究は,ヒンディー語黄金集合上でのエンド・ツー・エンドのコア参照分解モデルを評価する最初のものである。
論文 参考訳(メタデータ) (2024-02-21T07:05:51Z) - Light Coreference Resolution for Russian with Hierarchical Discourse
Features [0.0]
ニューラルコア参照解決モデルに修辞情報を組み込んだ新しいアプローチを提案する。
部分的に微調整された多言語エンティティ認識言語モデルLUKEを用いて、エンドツーエンドのスパンベースコア参照リゾルバを実装した。
言及間の修辞的距離を用いた最良のモデルでは、開発セット(74.6% F1)で1位、共有タスク(73.3% F1)で2位にランクされている。
論文 参考訳(メタデータ) (2023-06-02T11:41:24Z) - Ensemble Transfer Learning for Multilingual Coreference Resolution [60.409789753164944]
非英語で作業する場合に頻繁に発生する問題は、注釈付きトレーニングデータの不足である。
我々は,様々なトランスファー学習技術を組み合わせた,シンプルだが効果的なアンサンブルベースのフレームワークを設計する。
また、ウィキペディアアンカーテキストを利用して、コア参照解決モデルをブートストラップする低コストのTL手法を提案する。
論文 参考訳(メタデータ) (2023-01-22T18:22:55Z) - Neural Coreference Resolution based on Reinforcement Learning [53.73316523766183]
コアレゾリューションシステムは2つのサブタスクを解決する必要がある。
ひとつのタスクは、潜在的な言及のすべてを検出することであり、もう1つは、可能な言及ごとに前者のリンクを学習することである。
本稿では,アクターをベースとした強化学習型ニューラルコア参照分解システムを提案する。
論文 参考訳(メタデータ) (2022-12-18T07:36:35Z) - SeqZero: Few-shot Compositional Semantic Parsing with Sequential Prompts
and Zero-shot Models [57.29358388475983]
近年の研究では、事前訓練された言語モデルと標準発話を併用する有望な結果が示されている。
本稿では,SeqZeroという構文解析手法を提案する。
特に、SeqZeroは、提案した制約付き再スケーリングを備えたアンサンブルによって、両方のモデルのメリットを明らかにします。
論文 参考訳(メタデータ) (2022-05-15T21:13:15Z) - Exploring Multi-Modal Representations for Ambiguity Detection &
Coreference Resolution in the SIMMC 2.0 Challenge [60.616313552585645]
会話型AIにおける効果的なあいまいさ検出と参照解決のためのモデルを提案する。
具体的には,TOD-BERTとLXMERTをベースとしたモデルを用いて,多数のベースラインと比較し,アブレーション実験を行う。
以上の結果から,(1)言語モデルでは曖昧さを検出するためにデータの相関を活用でき,(2)言語モデルではビジョンコンポーネントの必要性を回避できることがわかった。
論文 参考訳(メタデータ) (2022-02-25T12:10:02Z) - MobIE: A German Dataset for Named Entity Recognition, Entity Linking and
Relation Extraction in the Mobility Domain [76.21775236904185]
データセットは3,232のソーシャルメディアテキストと91Kトークンによるトラフィックレポートで構成され、20.5Kアノテーション付きエンティティを含んでいる。
データセットのサブセットには,7つのモビリティ関連,n-ary関係型がアノテートされている。
私たちの知る限りでは、NER、EL、REのアノテーションを組み合わせた最初のドイツ語データセットです。
論文 参考訳(メタデータ) (2021-08-16T08:21:50Z) - An Unsupervised Language-Independent Entity Disambiguation Method and
its Evaluation on the English and Persian Languages [3.8498574327875943]
Unsupervised Language-Independent Entity Disambiguation (ULIED)は、名前付きエンティティを曖昧にリンクするための新しいアプローチである。
異なる英語エンティティリンクデータセット上でのULIEDの評価と、利用可能な唯一のペルシアのデータセットは、ほとんどのケースにおいて、ULIEDが最先端の教師なし多言語アプローチよりも優れていることを示している。
論文 参考訳(メタデータ) (2021-01-31T06:41:55Z) - Structured Prediction as Translation between Augmented Natural Languages [109.50236248762877]
本研究では,構造化予測言語の課題を解決するために,新しいフレームワークであるTANL(Translation between Augmented Natural Languages)を提案する。
タスク固有の差別を訓練することで問題に取り組む代わりに、拡張自然言語間の翻訳タスクとして位置づける。
提案手法は, タスク固有のモデルに適合するか, 性能に優れ, 特に, 共同エンティティと関係抽出に関する新たな最先端結果が得られる。
論文 参考訳(メタデータ) (2021-01-14T18:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。