論文の概要: Unsupervised Technical Domain Terms Extraction using Term Extractor
- arxiv url: http://arxiv.org/abs/2101.09015v1
- Date: Fri, 22 Jan 2021 09:24:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-21 01:08:41.463084
- Title: Unsupervised Technical Domain Terms Extraction using Term Extractor
- Title(参考訳): 用語エクストラクタを用いた教師なし技術領域用語抽出
- Authors: Suman Dowlagar, Radhika Mamidi
- Abstract要約: 用語抽出の目的は、与えられたコーパスから関連する単語またはフレーズを自動的に抽出することです。
本稿では,チャンキング,プリプロセッシング,ランク付けといったドメイン固有項を考慮した,監視されていない自動ドメイン用語抽出手法に注目する。
- 参考スコア(独自算出の注目度): 9.23545668304066
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Terminology extraction, also known as term extraction, is a subtask of
information extraction. The goal of terminology extraction is to extract
relevant words or phrases from a given corpus automatically. This paper focuses
on the unsupervised automated domain term extraction method that considers
chunking, preprocessing, and ranking domain-specific terms using relevance and
cohesion functions for ICON 2020 shared task 2: TermTraction.
- Abstract(参考訳): 用語抽出は、用語抽出としても知られ、情報抽出のサブタスクである。
用語抽出の目標は、与えられたコーパスから関連する単語やフレーズを自動的に抽出することである。
本稿では,アイコン2020共有タスク2における相関関数と凝集関数を用いて,チャンキング,前処理,ランク付けを行う非教師なしのドメイン項抽出手法について述べる。
関連論文リスト
- Domain Embeddings for Generating Complex Descriptions of Concepts in
Italian Language [65.268245109828]
電子辞書から抽出した言語情報と語彙情報に富んだ分布意味資源を提案する。
リソースは21のドメイン固有の行列と1つの包括的なマトリックスとグラフィカルユーザインタフェースから構成される。
本モデルは,具体的概念知識に直接関連した行列を選択することにより,概念の意味的記述の推論を容易にする。
論文 参考訳(メタデータ) (2024-02-26T15:04:35Z) - Terminology-Aware Translation with Constrained Decoding and Large
Language Model Prompting [11.264272119913311]
我々は、WMT 2023用語翻訳タスクを提出する。
私たちは、ドメインに依存しない、最小限の手作業を必要とするトランスレーション-then-refineアプローチを採用しています。
その結果,我々の用語認識モデルは,効率的に用語を組み込むことができることがわかった。
論文 参考訳(メタデータ) (2023-10-09T16:08:23Z) - A Distributed Automatic Domain-Specific Multi-Word Term Recognition
Architecture using Spark Ecosystem [0.5156484100374059]
ドメイン固有の用語を自動的に抽出する分散Sparkベースのアーキテクチャを提案する。
2つの実世界のデータセットで実験を行うことで、アーキテクチャの実現性を実証的に証明する。
論文 参考訳(メタデータ) (2023-05-24T10:05:59Z) - Cascaded Beam Search: Plug-and-Play Terminology-Forcing For Neural
Machine Translation [11.902884131696783]
本稿では,用語制約付き翻訳のためのプラグイン・アンド・プレイ方式を提案する。
学習を必要としない用語強制アプローチであるカスケードビームサーチを提案する。
我々は,WMT21用語翻訳タスクの上位提案に対抗して,提案手法の性能を評価する。
論文 参考訳(メタデータ) (2023-05-23T21:48:02Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - Open Relation and Event Type Discovery with Type Abstraction [80.92395639632383]
ここでは、モデルを一般化し、型を命名するよう促される型抽象化の考え方を紹介します。
推論された名前の類似性を利用してクラスタを誘導する。
複数の関係抽出およびイベントデータセット抽出に関する実験は、型抽象化アプローチの利点を一貫して示している。
論文 参考訳(メタデータ) (2022-11-30T23:47:49Z) - Extracting Domain-specific Concepts from Large-scale Linked Open Data [0.0]
提案手法は,LOD語彙を対象ドメインに関連する用語とリンクすることにより,検索エンティティを定義する。
対象領域における概念的関係の範囲を決定するために,共通上層実体の発生と経路の連鎖関係について検討した。
論文 参考訳(メタデータ) (2021-11-22T10:25:57Z) - How Domain Terminology Affects Meeting Summarization Performance [61.12624289478716]
我々は、巨大ミーティングコーパス上で、ドメイン用語のゴールドスタンダードアノテーションを作成します。
本稿では,会議要約システムの性能を,用語の活用の有無で分析する。
論文 参考訳(メタデータ) (2020-11-02T02:33:59Z) - Constrained Abstractive Summarization: Preserving Factual Consistency
with Constrained Generation [93.87095877617968]
本稿では,抽象要約の現実的一貫性を保ちつつ,制約付き抽象要約(CAS)を提案する。
我々は、CASを満たすために、一般的に自己回帰生成モデルに適用される語彙制約付き復号法を採用する。
対話的要約において1つの手動制約のみを使用する場合、最大13.8ROUGE-2ゲインを観測する。
論文 参考訳(メタデータ) (2020-10-24T00:27:44Z) - SemEval-2020 Task 6: Definition extraction from free text with the DEFT
corpus [28.67911239741097]
参加者が自由テキストから定義を抽出するSemEval共有タスクであるDeftEvalを提案する。
DeftEvalは3つの異なるサブタスクを含む:文分類、シーケンスラベリング、関係抽出。
論文 参考訳(メタデータ) (2020-08-31T15:55:24Z) - CASE: Context-Aware Semantic Expansion [68.30244980290742]
本稿では,CASE(Context-Aware Semantic Expansion)と呼ばれる新しいタスクを定義し,検討する。
セマンティックな文脈でシード項が与えられた場合、その文脈に適した他の用語をシードとして提案することを目指している。
このタスクのアノテーションは,既存のコーパスから完全に自動で,大規模に抽出可能であることを示す。
論文 参考訳(メタデータ) (2019-12-31T06:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。