論文の概要: SMDDH: Singleton Mention detection using Deep Learning in Hindi Text
- arxiv url: http://arxiv.org/abs/2301.09361v1
- Date: Mon, 23 Jan 2023 10:58:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-24 13:42:49.473719
- Title: SMDDH: Singleton Mention detection using Deep Learning in Hindi Text
- Title(参考訳): SMDDH: ヒンディー語の深層学習を用いたシングルトン調律検出
- Authors: Kusum Lata, Pardeep Singh, and Kamlesh Dutta
- Abstract要約: 本稿では,完全に接続されたネットワークと,ヒンディー語テキストのための畳み込みニューラルネットワークに基づくシングルトン参照検出モジュールを提案する。
精度,リコール,F測定の点で,得られた実験結果は良好である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mention detection is an important component of coreference resolution system,
where mentions such as name, nominal, and pronominals are identified. These
mentions can be purely coreferential mentions or singleton mentions
(non-coreferential mentions). Coreferential mentions are those mentions in a
text that refer to the same entities in a real world. Whereas, singleton
mentions are mentioned only once in the text and do not participate in the
coreference as they are not mentioned again in the following text. Filtering of
these singleton mentions can substantially improve the performance of a
coreference resolution process. This paper proposes a singleton mention
detection module based on a fully connected network and a Convolutional neural
network for Hindi text. This model utilizes a few hand-crafted features and
context information, and word embedding for words. The coreference annotated
Hindi dataset comprising of 3.6K sentences, and 78K tokens are used for the
task. In terms of Precision, Recall, and F-measure, the experimental findings
obtained are excellent.
- Abstract(参考訳): メンション検出は、名前、名義、代名詞などの言及が識別される、コア参照解決システムの重要な構成要素である。
これらの言及は、純粋にcoreferential mentionsまたはsingleton mentions(非coreferential mentions)である。
coreferential mentionsは、現実世界で同じエンティティを参照するテキスト中の言及である。
一方、シングルトン言及は1回だけテキストで言及され、次のテキストでは再び言及されないため、コア参照には参加しない。
これらのシングルトン項のフィルタリングは、コリファレンス解決プロセスの性能を大幅に改善することができる。
本稿では,完全接続されたネットワークと,ヒンズー語テキストのための畳み込みニューラルネットワークに基づくシングルトン参照検出モジュールを提案する。
このモデルは、いくつかの手作りの特徴と文脈情報と単語への単語埋め込みを利用する。
タスクには、3.6K文と78Kトークンからなるコア参照注釈ヒンディー語データセットが使用される。
精度,リコール,F測定の点で,得られた実験結果は良好である。
関連論文リスト
- Fine-Grained Named Entities for Corona News [0.0]
本研究では,コロナニュース記事からトレーニングデータを生成するためのデータアノテーションパイプラインを提案する。
名前付きエンティティ認識モデルは、この注釈付きコーパスに基づいて訓練され、その後、ドメインの専門家によって手動で注釈付けされたテスト文で評価される。
論文 参考訳(メタデータ) (2024-04-20T18:22:49Z) - SPLICE: A Singleton-Enhanced PipeLIne for Coreference REsolution [11.062090350704617]
シングルトンは、つまりテキストの中で一度だけ言及される不明瞭さは、理論的な観点から人間が言論を理解する方法において重要であると言及している。
OntoNotesベンチマークでシングルトン参照スパンが欠如しているため、英語のエンドツーエンドのニューラルコア参照解決にそれらの検出を組み込もうとする以前の試みは妨げられていた。
本稿では,既存のネストネストNERシステムとOntoNotes構文木から派生した特徴を組み合わせることで,この制限に対処する。
論文 参考訳(メタデータ) (2024-03-25T22:46:16Z) - Incorporating Singletons and Mention-based Features in Coreference
Resolution via Multi-task Learning for Better Generalization [12.084539012992412]
本稿では,シングルトンを学習するコア推論モデルと,エンティティタイプや情報ステータスなどの特徴について述べる。
このアプローチはOntoGUMベンチマークで新しい最先端スコアを実現する。
論文 参考訳(メタデータ) (2023-09-20T18:44:24Z) - Part-of-Speech Tagging of Odia Language Using statistical and Deep
Learning-Based Approaches [0.0]
本研究は,条件付きランダムフィールド (CRF) と深層学習に基づくアプローチ (CNN と Bi-LSTM) を用いて,Odia の音声タグ作成を支援することを目的とする。
文字列の特徴を持つBi-LSTMモデルと事前学習した単語ベクトルは,最先端の結果を得た。
論文 参考訳(メタデータ) (2022-07-07T12:15:23Z) - Automatic Dialect Density Estimation for African American English [74.44807604000967]
アフリカ・アメリカン・イングリッシュ(AAE)方言の方言密度の自動予測について検討する。
方言密度は、非標準方言の特徴を含む発話における単語の割合として定義される。
このデータベースでは,AAE音声に対する予測された真理弁証密度と地上の真理弁証密度との間に有意な相関関係を示す。
論文 参考訳(メタデータ) (2022-04-03T01:34:48Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - Accelerating Text Mining Using Domain-Specific Stop Word Lists [57.76576681191192]
本稿では,超平面的アプローチと呼ばれるドメイン固有語の自動抽出手法を提案する。
ハイパープレーンベースのアプローチは、無関係な特徴を排除することによって、テキストの寸法を著しく削減することができる。
その結果,超平面型アプローチはコーパスの寸法を90%削減し,相互情報より優れることがわかった。
論文 参考訳(メタデータ) (2020-11-18T17:42:32Z) - Coreference Resolution System for Indonesian Text with Mention Pair
Method and Singleton Exclusion using Convolutional Neural Network [0.0]
インドネシア語テキストの参照ペア法による新しいコア参照解決システムを提案する。
語彙的・統語的特徴に加えて,言及する単語や文脈の表現を学習するために,単語埋め込みを用いてCNNに供給する。
提案システムは最先端システムより優れている。
論文 参考訳(メタデータ) (2020-09-11T22:21:19Z) - Active Learning for Coreference Resolution using Discrete Annotation [76.36423696634584]
我々は、コア参照解決におけるアクティブラーニングのためのペアワイズアノテーションを改善した。
提案された参照ペアがコアフェレントでないと判断された場合、アノテータに参照アンテセントを識別するよう依頼する。
既存のベンチマークコアベンチマークデータセットを用いた実験では、この追加質問からの信号が人間のアノテーション時間当たりの大幅なパフォーマンス向上につながることが示された。
論文 参考訳(メタデータ) (2020-04-28T17:17:11Z) - Continuous speech separation: dataset and analysis [52.10378896407332]
自然な会話では、音声信号は連続的であり、重複成分と重複成分の両方を含む。
本稿では,連続音声分離アルゴリズムを評価するためのデータセットとプロトコルについて述べる。
論文 参考訳(メタデータ) (2020-01-30T18:01:31Z) - Lexical Sememe Prediction using Dictionary Definitions by Capturing
Local Semantic Correspondence [94.79912471702782]
セメムは人間の言語の最小の意味単位として定義されており、多くのNLPタスクで有用であることが証明されている。
本稿では,このようなマッチングを捕捉し,セメムを予測できるセメム対応プールモデルを提案する。
我々は,有名なSememe KB HowNetのモデルとベースライン手法を評価し,そのモデルが最先端のパフォーマンスを実現することを発見した。
論文 参考訳(メタデータ) (2020-01-16T17:30:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。