論文の概要: Coreference Resolution System for Indonesian Text with Mention Pair
Method and Singleton Exclusion using Convolutional Neural Network
- arxiv url: http://arxiv.org/abs/2009.05675v1
- Date: Fri, 11 Sep 2020 22:21:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 20:50:02.244276
- Title: Coreference Resolution System for Indonesian Text with Mention Pair
Method and Singleton Exclusion using Convolutional Neural Network
- Title(参考訳): 畳み込みニューラルネットワークを用いたメンションペア法とシングルトン排除によるインドネシア語テキストの照合分解システム
- Authors: Turfa Auliarachman (1), Ayu Purwarianti (1) ((1) Institut Teknologi
Bandung)
- Abstract要約: インドネシア語テキストの参照ペア法による新しいコア参照解決システムを提案する。
語彙的・統語的特徴に加えて,言及する単語や文脈の表現を学習するために,単語埋め込みを用いてCNNに供給する。
提案システムは最先端システムより優れている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural network has shown promising performance on coreference resolution
systems that uses mention pair method. With deep neural network, it can learn
hidden and deep relations between two mentions. However, there is no work on
coreference resolution for Indonesian text that uses this learning technique.
The state-of-the-art system for Indonesian text only states the use of lexical
and syntactic features can improve the existing coreference resolution system.
In this paper, we propose a new coreference resolution system for Indonesian
text with mention pair method that uses deep neural network to learn the
relations of the two mentions. In addition to lexical and syntactic features,
in order to learn the representation of the mentions words and context, we use
word embeddings and feed them to Convolutional Neural Network (CNN).
Furthermore, we do singleton exclusion using singleton classifier component to
prevent singleton mentions entering any entity clusters at the end. Achieving
67.37% without singleton exclusion, 63.27% with trained singleton classifier,
and 75.95% with gold singleton classifier on CoNLL average F1 score, our
proposed system outperforms the state-of-the-art system.
- Abstract(参考訳): ニューラルネットワークは、参照ペア法を使用したコア参照解決システムで有望な性能を示した。
deep neural networkを使えば、2つの言及の間の隠れた関係と深い関係を学習できる。
しかし、この学習技術を用いたインドネシア語テキストのコリファレンス解決に関する研究は行われていない。
インドネシアのテクストの最先端システムでは、語彙的および構文的特徴の使用は既存のコア参照解決システムを改善することができるとのみ述べられている。
本稿では,2つの言及の関係を深層ニューラルネットワークを用いて学習する参照ペア法によるインドネシア語テキストの新しいコア参照解決システムを提案する。
語彙的・構文的特徴に加えて,言及する単語や文脈の表現を学習するために,単語の埋め込みを用い,畳み込みニューラルネットワーク(CNN)に供給する。
さらに、シングルトン分類器コンポーネントを使用してシングルトン排除を行い、最後にどのエンティティクラスタにも入らないようにする。
シングルトンを除外せずに67.37%、トレーニングされたシングルトン分類器で63.27%、conll平均f1スコアでゴールドシングルトン分類器で75.95%を達成した。
関連論文リスト
- SPLICE: A Singleton-Enhanced PipeLIne for Coreference REsolution [11.062090350704617]
シングルトンは、つまりテキストの中で一度だけ言及される不明瞭さは、理論的な観点から人間が言論を理解する方法において重要であると言及している。
OntoNotesベンチマークでシングルトン参照スパンが欠如しているため、英語のエンドツーエンドのニューラルコア参照解決にそれらの検出を組み込もうとする以前の試みは妨げられていた。
本稿では,既存のネストネストNERシステムとOntoNotes構文木から派生した特徴を組み合わせることで,この制限に対処する。
論文 参考訳(メタデータ) (2024-03-25T22:46:16Z) - DenoSent: A Denoising Objective for Self-Supervised Sentence
Representation Learning [59.4644086610381]
本稿では,他の視点,すなわち文内視点から継承する新たな認知的目的を提案する。
離散ノイズと連続ノイズの両方を導入することで、ノイズの多い文を生成し、モデルを元の形式に復元するように訓練する。
我々の経験的評価は,本手法が意味的テキスト類似性(STS)と幅広い伝達タスクの両面で競合する結果をもたらすことを示した。
論文 参考訳(メタデータ) (2024-01-24T17:48:45Z) - SMDDH: Singleton Mention detection using Deep Learning in Hindi Text [0.0]
本稿では,完全に接続されたネットワークと,ヒンディー語テキストのための畳み込みニューラルネットワークに基づくシングルトン参照検出モジュールを提案する。
精度,リコール,F測定の点で,得られた実験結果は良好である。
論文 参考訳(メタデータ) (2023-01-23T10:58:18Z) - Hybrid Rule-Neural Coreference Resolution System based on Actor-Critic
Learning [53.73316523766183]
コアレゾリューションシステムは2つの主要なタスクに取り組む必要がある。
ひとつのタスクは、潜在的な言及のすべてを検出することであり、もう1つは、可能な言及ごとに前者のリンクを学習することである。
本稿では,アクター・クリティカル・ラーニングに基づく複合ルール・ニューラル・コア参照解決システムを提案する。
論文 参考訳(メタデータ) (2022-12-20T08:55:47Z) - Neural Coreference Resolution based on Reinforcement Learning [53.73316523766183]
コアレゾリューションシステムは2つのサブタスクを解決する必要がある。
ひとつのタスクは、潜在的な言及のすべてを検出することであり、もう1つは、可能な言及ごとに前者のリンクを学習することである。
本稿では,アクターをベースとした強化学習型ニューラルコア参照分解システムを提案する。
論文 参考訳(メタデータ) (2022-12-18T07:36:35Z) - Neural Implicit Dictionary via Mixture-of-Expert Training [111.08941206369508]
ニューラルインシシット辞書(NID)を学習することで、データとトレーニング効率の両方を達成する汎用INRフレームワークを提案する。
我々のNIDは、所望の関数空間にまたがるように調整された座標ベースのImpworksのグループを組み立てる。
実験の結果,NIDは最大98%の入力データで2次元画像や3次元シーンの再現を2桁高速化できることがわかった。
論文 参考訳(メタデータ) (2022-07-08T05:07:19Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - Preliminary study on using vector quantization latent spaces for TTS/VC
systems with consistent performance [55.10864476206503]
本稿では,潜在言語埋め込みをモデル化するための量子化ベクトルの利用について検討する。
トレーニングにおいて、潜伏空間上の異なるポリシーを強制することにより、潜伏言語埋め込みを得ることができる。
実験の結果,ベクトル量子化法で構築した音声クローニングシステムは,知覚的評価の点でわずかに劣化していることがわかった。
論文 参考訳(メタデータ) (2021-06-25T07:51:35Z) - Semi-Supervised Neural System for Tagging, Parsing and Lematization [1.6752182911522522]
本稿では,CoNLL 2018の多言語構文解析からユニバーサル依存関係への共有タスクであるICS PASシステムについて述べる。
このシステムは、BiLSTMネットワークによって抽出された特徴に基づいて、共同で訓練されたタグ、レムマタイザー、および依存性から構成される。
論文 参考訳(メタデータ) (2020-04-26T18:29:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。