論文の概要: Noise-Robust Financial Numerical Entity Attribute Tagging
- arxiv url: http://arxiv.org/abs/2605.24910v1
- Date: Sun, 24 May 2026 07:31:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.504423
- Title: Noise-Robust Financial Numerical Entity Attribute Tagging
- Title(参考訳): ノイズ・ロバストな金融数値エンティティ属性のタグ付け
- Authors: Hsin-Min Lu, Chen-Yang Lai, Yi-Jhen Li, Ju-Chun Yen,
- Abstract要約: 既存の研究は主に概念名予測に焦点を当てており、2つの重要な制限に直面している。
textscNORAはタスク対応のインスタンス固有の重み付けを使用して、トレーニング中のノイズラベルの影響を緩和する。
textbfAttributes(textscNORA)は、未フィルタリングとノイズフィルタリングの両方のテスト設定で堅牢である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Financial Numerical Entity (FNE) understanding aims to recover the meaning of numerical mentions in financial reports. Existing studies primarily focus on concept name prediction and face two important limitations. First, labels derived from inline XBRL may contain errors because filings are usually prepared manually. Second, other important FNE attributes, such as reporting-time relation, measurement scale, and accounting sign, are less emphasized. We propose \textbf{NO}ise-\textbf{R}obust Tagging for Rich Financial Numerical Entity \textbf{A}ttributes (\textsc{NORA}) to address these gaps. NORA uses task-aware instance-specific weighting to attenuate the influence of noisy labels during training, and we further propose the Neighborhood Prior-adjusted KNN (NPK) filtering method for more reliable evaluation on real-world noisy test sets. In addition, we construct a large-scale benchmark containing 6.6 million instances with multi-attribute labels and filing metadata. Experiments show that \textsc{NORA} performs strongly compared with state-of-the-art noisy-label baselines, including Co-teaching, Mixup, SSR, and SelfMix. Moreover, NORA is robust under both unfiltered and noise-filtered test settings. It achieves the best Accuracy, Macro F1, and Weighted F1 for concept name and time-relation prediction, while remaining competitive on scale and sign prediction. These results demonstrate the value of jointly modeling rich FNE attributes while accounting for label noise in real-world financial filings.
- Abstract(参考訳): 金融数値エンティティ(FNE)の理解は、財務報告における数値的な言及の意味を回復することを目的としている。
既存の研究は主に概念名予測に焦点を当てており、2つの重要な制限に直面している。
まず、インラインXBRLから派生したラベルは、通常手動で作成されるためエラーを含む可能性がある。
第二に、レポート時間関係、測定尺度、会計標識などの重要なFNE属性は強調されない。
本稿では、これらのギャップに対処するために、リッチファイナンシャル数値 Entity \textbf{A}ttributes (\textsc{NORA}) に対する \textbf{NO}ise-\textbf{R}obust Taggingを提案する。
NORAは、タスク対応のインスタンス固有重み付けを用いて、トレーニング中のノイズラベルの影響を緩和し、実世界のノイズテストセットをより信頼性の高い評価を行うために、Norborhood Prior-Adjusted KNN (NPK) フィルタリング手法を提案する。
さらに、マルチ属性ラベルとファイリングメタデータを備えた660万のインスタンスを含む大規模ベンチマークを構築した。
実験の結果,‘textsc{NORA} はCo-Teaching, Mixup, SSR, SelfMix など,最先端のノイズラベルベースラインと強く比較できることがわかった。
さらに、NORAは、未フィルタリングとノイズフィルタリングの両方のテスト設定で堅牢である。
最高精度のマクロF1と重み付きF1を概念名と時間関係予測で達成し、スケールとサインの予測では競争力を維持している。
これらの結果は、実世界のファイナンシャルファイリングにおけるラベルノイズを考慮しつつ、リッチなFNE属性を共同でモデル化する価値を示す。
関連論文リスト
- MADE: A Living Benchmark for Multi-Label Text Classification with Uncertainty Quantification of Medical Device Adverse Events [0.7685926099671206]
医療などの高度な領域における機械学習は、強力な予測性能と信頼性のある不確実性定量化を必要とする。
医療機器の異常事象報告から得られたMLTCベンチマークであるMADEを紹介する。
エントロピー/一貫性に基づく自己言語UQ手法を体系的に評価する。
論文 参考訳(メタデータ) (2026-04-16T16:28:16Z) - Instruction Finetuning LLaMA-3-8B Model Using LoRA for Financial Named Entity Recognition [0.0]
本稿では,MetaのLlama 3 8Bを用いて,命令微調整とローランド適応(LoRA)を組み合わせた財務NERに適用する。
1,693文のコーパスを用いて,Qwen3-8B,Baichuan2-7B,T5,BERT-Baseと比較し,マイクロF1スコア0.894を得る。
論文 参考訳(メタデータ) (2026-01-15T03:41:00Z) - All That Glisters Is Not Gold: A Benchmark for Reference-Free Counterfactual Financial Misinformation Detection [67.89888669159899]
RFC Benchは、現実的なニュースの下で財務的な誤情報に関する大規模な言語モデルを評価するためのベンチマークである。
このベンチマークでは、2つの補完的なタスクが定義されている。
論文 参考訳(メタデータ) (2026-01-07T18:18:28Z) - You only need 4 extra tokens: Synergistic Test-time Adaptation for LLMs [50.54173262572369]
大規模言語モデル (LLM) は、金融、医療、農業などの専門分野にますます導入されている。
本稿では,言語モデルに対するラベルフリーテスト時適応について検討し,追加の監督なしにモデルをオンザフライで適応する推論時フレームワークであるSyTTAについて述べる。
論文 参考訳(メタデータ) (2025-10-11T14:00:39Z) - Navigating Label Ambiguity for Facial Expression Recognition in the Wild [13.242490592706805]
本研究では,NLA(Navigating Label Ambiguity)と呼ばれる,現実世界の環境下で堅牢な新しいフレームワークを提案する。
NLAの背景にある動機は、各イテレーションであいまいなサンプルを動的に推定し強調することは、ノイズとクラス不均衡を軽減することである。
大規模な実験は、NLAが既存の手法を総合的および平均的精度で上回ることを示した。
論文 参考訳(メタデータ) (2025-02-14T08:24:38Z) - Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - Uncertainty-aware Self-training for Low-resource Neural Sequence
Labeling [29.744621356187764]
本稿では,ニューラルシークエンスラベリング(NSL)のための新しい未知の自己学習フレームワークSeqUSTを提案する。
ベイジアンニューラルネットワーク(BNN)にモンテカルロ(MC)ドロップアウトを組み込んでトークンレベルで不確実性評価を行い、ラベルのないデータから信頼性の高い言語トークンを選択する。
ノイズロスのあるマスク付きシークエンスラベリングタスクは、ノイズのある擬似ラベルの問題を抑えることを目的とした堅牢なトレーニングを支援する。
論文 参考訳(メタデータ) (2023-02-17T02:40:04Z) - Fairness via Representation Neutralization [60.90373932844308]
フェアネスのための表現中立化(Representation Neutralization for Fairness, RNF)という新たな緩和手法を提案する。
RNFは、DNNモデルのタスク固有の分類ヘッダのみをデバイアスすることで、その公平性を達成する。
複数のベンチマークデータセットに対する実験結果は、DNNモデルの識別を効果的に削減するRNFフレームワークを実証している。
論文 参考訳(メタデータ) (2021-06-23T22:26:29Z) - Fine-Grained Named Entity Typing over Distantly Supervised Data Based on
Refined Representations [16.30478830298353]
Fine-Grained Named Entity Typing (FG-NET) は自然言語処理(NLP)の鍵となるコンポーネントである
本稿では,コーパスレベルの文脈的手がかりをエンド分類に先立ち,ノイズの多い参照表現を洗練させるエッジ重み付き注意グラフ畳み込みネットワークを提案する。
実験により,提案モデルではマクロf1とマイクロf1の相対スコアが10.2%,マクロf1が8.3%であった。
論文 参考訳(メタデータ) (2020-04-07T17:26:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。