論文の概要: Nominal Compound Chain Extraction: A New Task for Semantic-enriched
Lexical Chain
- arxiv url: http://arxiv.org/abs/2009.09173v1
- Date: Sat, 19 Sep 2020 06:20:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 21:20:21.798167
- Title: Nominal Compound Chain Extraction: A New Task for Semantic-enriched
Lexical Chain
- Title(参考訳): 名目的複合連鎖抽出 : 意味に富む語彙連鎖の新しい課題
- Authors: Bobo Li and Hao Fei and Yafeng Ren and Donghong Ji
- Abstract要約: 本稿では, 同一の意味的トピックを共有するすべての名目化合物を抽出・クラスタリングする, NCCE(Nominal Compound Chain extract)という新しいタスクを導入する。
さらに,そのタスクを2段階の予測(複合抽出と連鎖検出)としてモデル化し,提案したジョイントフレームワークを用いて処理する。
実験は手動でアノテートしたコーパスに基づいており、NCCEタスクの必要性が証明されている。
- 参考スコア(独自算出の注目度): 34.352862428120126
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Lexical chain consists of cohesion words in a document, which implies the
underlying structure of a text, and thus facilitates downstream NLP tasks.
Nevertheless, existing work focuses on detecting the simple surface lexicons
with shallow syntax associations, ignoring the semantic-aware lexical compounds
as well as the latent semantic frames, (e.g., topic), which can be much more
crucial for real-world NLP applications. In this paper, we introduce a novel
task, Nominal Compound Chain Extraction (NCCE), extracting and clustering all
the nominal compounds that share identical semantic topics. In addition, we
model the task as a two-stage prediction (i.e., compound extraction and chain
detection), which is handled via a proposed joint framework. The model employs
the BERT encoder to yield contextualized document representation. Also, HowNet
is exploited as external resources for offering rich sememe information. The
experiments are based on our manually annotated corpus, and the results prove
the necessity of the NCCE task as well as the effectiveness of our joint
approach.
- Abstract(参考訳): 語彙連鎖は文書中の凝集語から成り、これはテキストの基盤構造を意味し、それによって下流のNLPタスクを容易にする。
それにもかかわらず、既存の研究は、単純な表層レキシコンを浅い構文連想で検出することに焦点を当てており、意味認識された語彙化合物や潜在意味フレーム(例えばトピック)を無視している。
本稿では,新しい課題であるNCCE(Nominal Compound Chain extract)を紹介し,同じ意味的トピックを共有するすべての名目化合物を抽出・クラスタリングする。
さらに,そのタスクを2段階の予測(複合抽出と連鎖検出)としてモデル化し,提案したジョイントフレームワークを用いて処理する。
このモデルは、コンテキスト化された文書表現を得るためにBERTエンコーダを使用する。
また、hownetは豊富なセム情報を提供する外部リソースとして活用されている。
実験は手動で注釈付けしたコーパスに基づき,NCCEタスクの必要性と,共同アプローチの有効性を実証した。
関連論文リスト
- DepNeCTI: Dependency-based Nested Compound Type Identification for
Sanskrit [7.04795623262177]
本研究はネスト化合物型同定(NeCTI)の新たな課題を紹介する。
マルチコンポーネント化合物のネストしたスパンを特定し、それら間の暗黙的な意味関係をデコードすることを目的としている。
我々の知る限りでは、これはこの課題を提案する語彙意味論の分野における最初の試みである。
論文 参考訳(メタデータ) (2023-10-14T06:11:53Z) - Large Language Model Prompt Chaining for Long Legal Document
Classification [2.3148470932285665]
チェイン(Chaining)は、複雑なタスクを小さな管理可能なコンポーネントに分解する戦略である。
即時連鎖により、ゼロショット以上の性能を向上できるだけでなく、より大きなモデルによって達成されたマイクロF1スコアを超越できることを実証する。
論文 参考訳(メタデータ) (2023-08-08T08:57:01Z) - Enhanced word embeddings using multi-semantic representation through
lexical chains [1.8199326045904998]
フレキシブル・レキシカル・チェーンIIと固定レキシカル・チェーンIIという2つの新しいアルゴリズムを提案する。
これらのアルゴリズムは、語彙連鎖から派生した意味関係、語彙データベースからの以前の知識、および単一のシステムを形成するビルディングブロックとしての単語埋め込みにおける分布仮説の堅牢性を組み合わせている。
その結果、語彙チェーンと単語埋め込み表現の統合は、より複雑なシステムに対しても、最先端の結果を維持します。
論文 参考訳(メタデータ) (2021-01-22T09:43:33Z) - Structured Prediction as Translation between Augmented Natural Languages [109.50236248762877]
本研究では,構造化予測言語の課題を解決するために,新しいフレームワークであるTANL(Translation between Augmented Natural Languages)を提案する。
タスク固有の差別を訓練することで問題に取り組む代わりに、拡張自然言語間の翻訳タスクとして位置づける。
提案手法は, タスク固有のモデルに適合するか, 性能に優れ, 特に, 共同エンティティと関係抽出に関する新たな最先端結果が得られる。
論文 参考訳(メタデータ) (2021-01-14T18:32:21Z) - Relation Clustering in Narrative Knowledge Graphs [71.98234178455398]
原文内の関係文は(SBERTと)埋め込み、意味論的に類似した関係をまとめるためにクラスタ化される。
予備的なテストでは、そのようなクラスタリングが類似した関係を検知し、半教師付きアプローチのための貴重な前処理を提供することが示されている。
論文 参考訳(メタデータ) (2020-11-27T10:43:04Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Pairwise Representation Learning for Event Coreference [73.10563168692667]
イベント参照ペアのためのペアワイズ表現学習(Pairwise Representation Learning, PairwiseRL)手法を開発した。
私たちの表現は、イベントとその引数のエンコーディングを容易にするために、テキストスニペットのより微細で構造化された表現をサポートします。
PairwiseRLは、その単純さにもかかわらず、クロスドキュメントとイントラドキュメントのイベントコアベンチマークベンチマークの両方において、従来の最先端のイベントコアシステムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-24T06:55:52Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z) - Joint Semantic Analysis with Document-Level Cross-Task Coherence Rewards [13.753240692520098]
本稿では,共用コア参照解決のためのニューラルネットワークアーキテクチャと,英語のセマンティックロールラベリングについて述べる。
我々は、文書と意味的アノテーション間のグローバルコヒーレンスを促進するために強化学習を使用します。
これにより、異なるドメインからの複数のデータセットにおける両方のタスクが改善される。
論文 参考訳(メタデータ) (2020-10-12T09:36:24Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - Selective Attention Encoders by Syntactic Graph Convolutional Networks
for Document Summarization [21.351111598564987]
本稿では,文書中の文から解析木を接続するグラフを提案し,文書の構文表現を学習するために重ねられたグラフ畳み込みネットワーク(GCN)を利用する。
提案したGCNによる選択的アテンションアプローチは,ベースラインよりも優れ,データセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-03-18T01:30:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。