論文の概要: Methods for Recognizing Nested Terms
- arxiv url: http://arxiv.org/abs/2504.16007v2
- Date: Sat, 10 May 2025 13:31:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 14:13:12.960363
- Title: Methods for Recognizing Nested Terms
- Title(参考訳): ネスト項の認識方法
- Authors: Igor Rozhkov, Natalia Loukachevitch,
- Abstract要約: ネスト項抽出に特化したRuTermEvalコンペティションへの参加について述べる。
我々は、ネストされた名前の認識に以前にうまく適用されたBinderモデルを適用し、ネストされた単語を抽出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we describe our participation in the RuTermEval competition devoted to extracting nested terms. We apply the Binder model, which was previously successfully applied to the recognition of nested named entities, to extract nested terms. We obtained the best results of term recognition in all three tracks of the RuTermEval competition. In addition, we study the new task of recognition of nested terms from flat training data annotated with terms without nestedness. We can conclude that several approaches we proposed in this work are viable enough to retrieve nested terms effectively without nested labeling of them.
- Abstract(参考訳): 本稿では,ネスト項抽出に特化したRuTermEvalコンペティションへの参加について述べる。
我々は、ネストされた名前の認識に以前にうまく適用されたBinderモデルを適用し、ネストされた単語を抽出する。
我々は,RuTermEvalコンペティションの3トラックすべてにおいて,項認識の最良の結果を得た。
また,ネストのない用語を付加した平らなトレーニングデータからネスト付き用語を認識させる新しい課題について検討した。
この研究で提案したいくつかのアプローチは、ネストラベルを付けずにネスト項を効率的に取り出すのに十分である、と結論付けることができる。
関連論文リスト
- Extracting domain-specific terms using contextual word embeddings [2.7941582470640784]
本稿では,用語抽出のための新しい機械学習手法を提案する。
従来の用語抽出システムの特徴と、文脈単語の埋め込みから派生した新しい文脈特徴を組み合わせる。
われわれのアプローチは、これまでの最先端よりもF1スコアの点で大幅に改善されている。
論文 参考訳(メタデータ) (2025-02-24T16:06:35Z) - Conjunct Resolution in the Face of Verbal Omissions [51.220650412095665]
本稿では,テキスト上で直接動作する接続分解タスクを提案し,コーディネーション構造に欠けている要素を復元するために,分割・言い換えパラダイムを利用する。
クラウドソースアノテーションによる自然に発生する動詞の省略例を10万件以上を含む,大規模なデータセットをキュレートする。
我々は、このタスクのために様々な神経ベースラインをトレーニングし、最良の手法が適切なパフォーマンスを得る一方で、改善のための十分なスペースを残していることを示す。
論文 参考訳(メタデータ) (2023-05-26T08:44:02Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - BEST: BERT Pre-Training for Sign Language Recognition with Coupling
Tokenization [135.73436686653315]
我々は、BERTの事前学習の成功を活用し、手話認識(SLR)モデルを肥大化させるために、ドメイン固有の統計モデルを構築している。
手と体が手話表現の優位性を考えると、それらを三重奏単位として整理し、トランスフォーマーのバックボーンに供給する。
劣化した入力シーケンスからマスク三重項ユニットを再構成して事前学習を行う。
意味的ジェスチャー/身体状態を表すポーズ三重奏ユニットから離散擬似ラベルを適応的に抽出する。
論文 参考訳(メタデータ) (2023-02-10T06:23:44Z) - Exploring Euphemism Detection in Few-Shot and Zero-Shot Settings [0.0]
この研究は、EMNLP 2022 FigLang Workshopで提案されたEuphemism Detection Shared Taskに基づいており、ほとんどショットやゼロショットの設定にまで拡張されている。
共有タスクからのデータセットを用いて,数発,ゼロショットの定式化を行い,RoBERTaとGPT-3を用いて実験を行った。
以上の結果から, 言語モデルでは, 学習中に見つからない新しい用語であっても, ユーフェミズムの用語を比較的よく分類することができ, ユーフェミズムに関連する高次概念を捉えることが可能であることが示唆された。
論文 参考訳(メタデータ) (2022-10-24T02:43:43Z) - Robust Candidate Generation for Entity Linking on Short Social Media
Texts [1.5006258585503875]
つぶやきの分野では、ユーザーがしばしば非公式な綴りや文脈の制限、特異性の欠如に悩まされることが示される。
我々はウィキペディアの長期的文脈表現を用いたハイブリッドなソリューションを実証し、0.93リコールを達成した。
論文 参考訳(メタデータ) (2022-10-14T02:47:31Z) - Entity Disambiguation with Entity Definitions [50.01142092276296]
ローカルモデルはEntity Disambiguation (ED)で最近驚くべきパフォーマンスを達成した
それまでの研究は、各候補者のテキスト表現として、ウィキペディアのタイトルのみを使うことに限られていた。
本稿では、この制限に対処し、より表現力のあるテキスト表現がそれを緩和できる範囲について検討する。
提案する6つのベンチマークのうち2つに新たな技術の現状を報告し,未知のパターンに対する一般化能力を強く改善する。
論文 参考訳(メタデータ) (2022-10-11T17:46:28Z) - CUNI systems for WMT21: Terminology translation Shared Task [0.0]
本研究の目的は、提供された用語データベースに基づいて特定の用語を翻訳するシステムを設計することである。
提案手法は,入力文とともに所望の翻訳を提供し,提案した用語を使用するようにモデルを訓練することに基づいている。
トレーニング中も推論中も用語を補足し、モデルが単語の表面形状を正しく生成する方法を学習できるようにする。
論文 参考訳(メタデータ) (2021-09-20T08:05:39Z) - Introducing Syntactic Structures into Target Opinion Word Extraction
with Deep Learning [89.64620296557177]
目的語抽出のためのディープラーニングモデルに文の構文構造を組み込むことを提案する。
また,ディープラーニングモデルの性能向上のために,新たな正規化手法を導入する。
提案モデルは,4つのベンチマークデータセット上での最先端性能を広範囲に解析し,達成する。
論文 参考訳(メタデータ) (2020-10-26T07:13:17Z) - The Extraordinary Failure of Complement Coercion Crowdsourcing [50.599433903377374]
クラウドソーシングは近年,言語アノテーションの収集を緩和し,スケールアップしている。
本研究の目的は,この現象の注釈付きデータを2つの既知のタスク – 明示的補完と自然言語推論 – に還元することで収集することである。
どちらの場合も、クラウドソーシングは合意のスコアが低かった。
論文 参考訳(メタデータ) (2020-10-12T19:04:04Z) - Building Legal Case Retrieval Systems with Lexical Matching and
Summarization using A Pre-Trained Phrase Scoring Model [1.9275428660922076]
本研究は,2019年法律情報抽出・販売コンペティションの判例検索課題に対処する手法を提案する。
我々のアプローチは、要約が検索に重要であるという考え方に基づいている。
コンペティションのベンチマークにおけるタスクの最先端の結果を達成しました。
論文 参考訳(メタデータ) (2020-09-29T15:10:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。