論文の概要: Financial Numeric Extreme Labelling: A Dataset and Benchmarking for XBRL
Tagging
- arxiv url: http://arxiv.org/abs/2306.03723v1
- Date: Tue, 6 Jun 2023 14:41:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 15:04:42.418420
- Title: Financial Numeric Extreme Labelling: A Dataset and Benchmarking for XBRL
Tagging
- Title(参考訳): 財務数値ラベリング - XBRLタグのデータセットとベンチマーク
- Authors: Soumya Sharma, Subhendu Khatuya, Manjunath Hegde, Afreen Shaikh.
Koustuv Dasgupta, Pawan Goyal, Niloy Ganguly
- Abstract要約: 米国証券取引委員会(SEC)は、すべての公社に対し、分類学の特定のラベルの数字を含むべき定期的な財務声明を提出するよう命令している。
非常に大きなラベル集合から文中の特定の数字スパンに対するラベルのタスクを定式化するタスクを定式化する。
- 参考スコア(独自算出の注目度): 23.01422165679548
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The U.S. Securities and Exchange Commission (SEC) mandates all public
companies to file periodic financial statements that should contain numerals
annotated with a particular label from a taxonomy. In this paper, we formulate
the task of automating the assignment of a label to a particular numeral span
in a sentence from an extremely large label set. Towards this task, we release
a dataset, Financial Numeric Extreme Labelling (FNXL), annotated with 2,794
labels. We benchmark the performance of the FNXL dataset by formulating the
task as (a) a sequence labelling problem and (b) a pipeline with span
extraction followed by Extreme Classification. Although the two approaches
perform comparably, the pipeline solution provides a slight edge for the least
frequent labels.
- Abstract(参考訳): アメリカ合衆国証券取引委員会(sec)は、すべての公的企業に対し、特定のラベルに付記された数字を含む定期的な財務諸表を分類から提出するよう義務付けている。
本稿では,非常に大きなラベル集合から文中の特定の数字スパンへのラベルの割り当てを自動化するタスクを定式化する。
この課題に向けて、2,794ラベルの注釈付きデータセットであるFinancial Numeric Extreme Labelling (FNXL)をリリースする。
タスクを定式化することでFNXLデータセットのパフォーマンスをベンチマークする。
(a)配列ラベリング問題、及び
(b)スパン抽出のパイプラインを極端に分類する。
2つのアプローチは比較可能だが、パイプラインソリューションは、最も頻繁なラベルに対してわずかなエッジを提供する。
関連論文リスト
- Complementary to Multiple Labels: A Correlation-Aware Correction
Approach [65.59584909436259]
理論上, マルチクラスCLLにおける遷移行列が, 複数ラベルの場合どのように歪むかを示す。
候補ラベルから遷移行列を推定する2段階の手法を提案する。
論文 参考訳(メタデータ) (2023-02-25T04:48:48Z) - Pairwise Instance Relation Augmentation for Long-tailed Multi-label Text
Classification [38.66674700075432]
Pairwise Instance Relation Augmentation Network (PIRAN) を提案する。
PIRANはSOTA法を一貫して上回り、テールラベルの性能を劇的に向上させる。
論文 参考訳(メタデータ) (2022-11-19T12:45:54Z) - Open Vocabulary Extreme Classification Using Generative Models [24.17018785195843]
極端なマルチラベル分類(XMC)タスクは、非常に大きなラベルセットからラベルのサブセットでコンテンツをタグ付けすることを目的としている。
本稿では, ラベルの集合をフラットシーケンスとして生成し, 予測されたラベル順序に依存しない新たな損失を用いて訓練する GROOV を提案する。
提案手法の有効性を実証し,GROOVが与えられた語彙の外で有意なラベルを予測できるようなXMCデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2022-05-12T00:33:49Z) - Acknowledging the Unknown for Multi-label Learning with Single Positive
Labels [65.5889334964149]
伝統的に、全ての無注釈ラベルは、単一正のマルチラベル学習(SPML)において負のラベルとして仮定される。
本研究では, 予測確率のエントロピーを最大化するエントロピー最大化(EM)損失を提案する。
非通知ラベルの正負ラベル不均衡を考慮し、非対称耐性戦略とより精密な監視を行うセルフペースト手順を備えた非対称擬似ラベル(APL)を提案する。
論文 参考訳(メタデータ) (2022-03-30T11:43:59Z) - GNN-XML: Graph Neural Networks for Extreme Multi-label Text
Classification [23.79498916023468]
extreme multi-label text classification (xmtc) は、非常に大きなラベルセットから最も関連するラベルのサブセットでテキストインスタンスをタグ付けすることを目的としている。
GNN-XMLはXMTC問題に適したスケーラブルなグラフニューラルネットワークフレームワークである。
論文 参考訳(メタデータ) (2020-12-10T18:18:34Z) - A Study on the Autoregressive and non-Autoregressive Multi-label
Learning [77.11075863067131]
本稿では,ラベルとラベルの依存関係を共同で抽出する自己アテンションに基づく変分エンコーダモデルを提案する。
したがって、ラベルラベルとラベル機能の両方の依存関係を保ちながら、すべてのラベルを並列に予測することができる。
論文 参考訳(メタデータ) (2020-12-03T05:41:44Z) - An Empirical Study on Large-Scale Multi-Label Text Classification
Including Few and Zero-Shot Labels [49.036212158261215]
大規模なMulti-label Text Classification (LMTC) は、幅広い自然言語処理 (NLP) アプリケーションを持つ。
Label-Wise Attention Networks (LWANs) を用いた最新のLMTCモデル
確率的ラベル木(PLT)に基づく階層的手法がLWANより優れていることを示す。
BERTとLWANを組み合わせた最先端手法を提案する。
論文 参考訳(メタデータ) (2020-10-04T18:55:47Z) - openXDATA: A Tool for Multi-Target Data Generation and Missing Label
Completion [23.14045574165086]
機械学習の一般的な問題は、不整合ラベル空間と欠落ラベルを持つデータセットを扱うことである。
本研究では,一部ラベル付きあるいは非ラベル付きデータセットで不足ラベルを補完するopenXdataツールを紹介する。
根拠となる真理値に近づいたレートで、すべてのデータセットに対してカテゴリと連続ラベルの両方を推定する能力を示す。
論文 参考訳(メタデータ) (2020-07-27T22:05:53Z) - Few-shot Slot Tagging with Collapsed Dependency Transfer and
Label-enhanced Task-adaptive Projection Network [61.94394163309688]
本稿では,現在最先端の少数ショット分類モデルであるTapNetに基づくラベル強化タスク適応プロジェクションネットワーク(L-TapNet)を提案する。
実験結果から,本モデルは1ショット設定で14.64点のF1スコアで最強の少ショット学習ベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2020-06-10T07:50:44Z) - General Partial Label Learning via Dual Bipartite Graph Autoencoder [81.78871072599607]
一般部分ラベル学習(GPLL)の実践的かつ困難な問題を定式化する。
本稿では,Dual Bipartite Graph Autoencoder (DB-GAE) と呼ばれる新しいグラフオートエンコーダを提案する。
論文 参考訳(メタデータ) (2020-01-05T19:00:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。