論文の概要: Term Expansion and FinBERT fine-tuning for Hypernym and Synonym Ranking
of Financial Terms
- arxiv url: http://arxiv.org/abs/2107.13764v1
- Date: Thu, 29 Jul 2021 06:17:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-30 20:12:59.786468
- Title: Term Expansion and FinBERT fine-tuning for Hypernym and Synonym Ranking
of Financial Terms
- Title(参考訳): 財務用語のハイパーネム及び同期ランク付けのための用語展開とフィンバート微調整
- Authors: Ankush Chopra and Sohom Ghosh
- Abstract要約: 本稿では,ハイパニムと同義語対応問題を解くシステムを提案する。
IJCAI-2021におけるFinNLPワークショップの共有作業であるFinSim-3に参加するために,これらのシステムを設計した。
我々の最高のパフォーマンスモデル(精度:0.917、ランク:1.156)は、FIBOのラベル階層を用いて作成された拡張ラベルセット上で、微調整されたSentenceBERT(Reimers et al., 2019)によって開発された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hypernym and synonym matching are one of the mainstream Natural Language
Processing (NLP) tasks. In this paper, we present systems that attempt to solve
this problem. We designed these systems to participate in the FinSim-3, a
shared task of FinNLP workshop at IJCAI-2021. The shared task is focused on
solving this problem for the financial domain. We experimented with various
transformer based pre-trained embeddings by fine-tuning these for either
classification or phrase similarity tasks. We also augmented the provided
dataset with abbreviations derived from prospectus provided by the organizers
and definitions of the financial terms from DBpedia [Auer et al., 2007],
Investopedia, and the Financial Industry Business Ontology (FIBO). Our best
performing system uses both FinBERT [Araci, 2019] and data augmentation from
the afore-mentioned sources. We observed that term expansion using data
augmentation in conjunction with semantic similarity is beneficial for this
task and could be useful for the other tasks that deal with short phrases. Our
best performing model (Accuracy: 0.917, Rank: 1.156) was developed by
fine-tuning SentenceBERT [Reimers et al., 2019] (with FinBERT at the backend)
over an extended labelled set created using the hierarchy of labels present in
FIBO.
- Abstract(参考訳): hypernymと同義語マッチングは、主要な自然言語処理(nlp)タスクの1つである。
本稿では,この問題を解決しようとするシステムを提案する。
IJCAI-2021におけるFinNLPワークショップの共有作業であるFinSim-3に参加するために,これらのシステムを設計した。
共有タスクは金融領域でこの問題を解決することに集中します。
分類や句の類似性タスクを微調整することで,様々なトランスフォーマティブによる事前学習埋め込みを実験した。
また,dbpedia (auer et al., 2007), investopedia, and the financial industry business ontology (fibo) の財務用語のオーガナイザと定義から提供されたprospectusを省略して,提供されたデータセットを拡張した。
FinBERT[Araci, 2019]と、前述のソースからのデータ拡張の両方を使用します。
意味的類似性を伴うデータ拡張を用いた用語拡張は,このタスクに有益であり,短いフレーズを扱う他のタスクにも有用であると考えられる。
我々の最高のパフォーマンスモデル(精度:0.917, Rank: 1.156)は、FIBOのラベル階層を用いて作成された拡張ラベルセット上で、細調整のSentenceBERT [Reimers et al., 2019] によって開発された。
関連論文リスト
- Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - NativE: Multi-modal Knowledge Graph Completion in the Wild [51.80447197290866]
本研究では,MMKGCを実現するための包括的フレームワークNativEを提案する。
NativEは、任意のモダリティに対して適応的な融合を可能にするリレーショナル誘導デュアルアダプティブフュージョンモジュールを提案する。
提案手法を評価するために,5つのデータセットを用いたWildKGCという新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2024-03-28T03:04:00Z) - Learning Semantic Text Similarity to rank Hypernyms of Financial Terms [0.23940819037450983]
本稿では,財務用語のハイパニムを抽出・ランク付けできるシステムを提案する。
このシステムは、DBpediaのような様々な情報源から得られた財務的なテキストコーパスで訓練されている。
負のサンプルでトレーニングセットを増強するために、新しいアプローチが使用されている。
論文 参考訳(メタデータ) (2023-03-20T16:53:36Z) - FinBERT-MRC: financial named entity recognition using BERT under the
machine reading comprehension paradigm [8.17576814961648]
我々はFinNERタスクを機械読解(MRC)問題として定式化し、FinBERT-MRCと呼ばれる新しいモデルを提案する。
この定式化は、よく設計されたクエリを利用して重要な事前情報を導入し、ターゲットエンティティの開始インデックスと終了インデックスを抽出する。
我々は,中国の財務データセットChFinAnnと実単語データセットAdminPunishについて実験を行った。
論文 参考訳(メタデータ) (2022-05-31T00:44:57Z) - DICoE@FinSim-3: Financial Hypernym Detection using Augmented Terms and
Distance-based Features [2.6599014990168834]
金融分野における意味的類似を学習する第3の共有タスクであるFinSim-3に、チームDICoEを提出する。
このタスクは金融分野における一連の用語を提供し、金融オントロジーから最も関連性の高いハイパーネムに分類する必要がある。
私たちの最高の成績は、タスクのリーダーボードで4位にランクインした。
論文 参考訳(メタデータ) (2021-09-30T08:01:48Z) - FinQA: A Dataset of Numerical Reasoning over Financial Data [52.7249610894623]
我々は、大量の財務文書の分析を自動化することを目的として、財務データに関する深い質問に答えることに重点を置いている。
我々は,金融専門家が作成した財務報告に対して質問回答のペアを用いた,新たな大規模データセットFinQAを提案する。
その結果、人気があり、大規模で、事前訓練されたモデルは、金融知識を得るための専門的な人間には程遠いことが示される。
論文 参考訳(メタデータ) (2021-09-01T00:08:14Z) - Yseop at FinSim-3 Shared Task 2021: Specializing Financial Domain
Learning with Phrase Representations [0.0]
我々は、FinSim-3共有タスク2021:財務分野のセマンティック類似性を学ぶためのアプローチを提示する。
このタスクの目的は、金融ドメインから与えられた用語のリストを最も関連性の高いハイパーネムに正しく分類することである。
平均精度は0.917、平均ランクは1.141である。
論文 参考訳(メタデータ) (2021-08-21T10:53:12Z) - TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and
Textual Content in Finance [71.76018597965378]
TAT-QAと呼ばれるタブラデータとテクスチャデータの両方を含む新しい大規模な質問応答データセットを構築します。
本稿では,テーブルとテキストの両方を推論可能な新しいQAモデルであるTAGOPを提案する。
論文 参考訳(メタデータ) (2021-05-17T06:12:06Z) - Removing Bias in Multi-modal Classifiers: Regularization by Maximizing
Functional Entropies [88.0813215220342]
いくつかのモダリティは、他のものよりも分類結果に容易に寄与することができる。
機能的エントロピーと機能的フィッシャー情報とを結合した対数ソボレフの不等式に基づく手法を開発した。
VQA-CPv2 と SocialIQ の2つの挑戦的マルチモーダルデータセットに対して,より均一にモダリティを活用しながら,最先端の結果を得る。
論文 参考訳(メタデータ) (2020-10-21T07:40:33Z) - SynSetExpan: An Iterative Framework for Joint Entity Set Expansion and
Synonym Discovery [66.24624547470175]
SynSetExpanは2つのタスクを相互に拡張できる新しいフレームワークである。
クラウドソーシングによる最初の大規模Synonym-Enhanced Set Expansionデータセットを作成する。
SE2データセットと以前のベンチマークの実験では、エンティティセットの拡張と同義語発見タスクの両方においてSynSetExpanの有効性が示されている。
論文 参考訳(メタデータ) (2020-09-29T07:32:17Z) - IITK at the FinSim Task: Hypernym Detection in Financial Domain via
Context-Free and Contextualized Word Embeddings [2.515934533974176]
FinSim 2020の課題は、財務用語を外部オントロジーにおいて最も関連性の高いハイパーネム(またはトップレベル)概念に分類することである。
我々は、文脈に依存しない単語埋め込みと文脈に依存しない単語埋め込みの両方を分析に活用する。
我々のシステムは、平均的なランクと精度の両方に基づいて、第1位にランク付けします。
論文 参考訳(メタデータ) (2020-07-22T04:56:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。