論文の概要: Enhancing Complex Formula Recognition with Hierarchical Detail-Focused Network
- arxiv url: http://arxiv.org/abs/2409.11677v1
- Date: Wed, 18 Sep 2024 03:32:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-19 19:10:09.568542
- Title: Enhancing Complex Formula Recognition with Hierarchical Detail-Focused Network
- Title(参考訳): 階層的Detail-Focused Networkによる複素数式認識の強化
- Authors: Jiale Wang, Junhui Yu, Huanyong Liu, Chenanran Kong,
- Abstract要約: 階層的かつ複雑な数式認識(MER)は、数式を複数解釈できるため困難である。
これらの問題に対処するために設計された最初のデータセットである階層的詳細認識データセット(Focused-Focused)を紹介する。
本稿では,階層型サブフォーミュラモジュールを組み込んだ新しいフレームワークである階層型Detail Recognition Network (HDNet)を提案する。
- 参考スコア(独自算出の注目度): 0.3749861135832072
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hierarchical and complex Mathematical Expression Recognition (MER) is challenging due to multiple possible interpretations of a formula, complicating both parsing and evaluation. In this paper, we introduce the Hierarchical Detail-Focused Recognition dataset (HDR), the first dataset specifically designed to address these issues. It consists of a large-scale training set, HDR-100M, offering an unprecedented scale and diversity with one hundred million training instances. And the test set, HDR-Test, includes multiple interpretations of complex hierarchical formulas for comprehensive model performance evaluation. Additionally, the parsing of complex formulas often suffers from errors in fine-grained details. To address this, we propose the Hierarchical Detail-Focused Recognition Network (HDNet), an innovative framework that incorporates a hierarchical sub-formula module, focusing on the precise handling of formula details, thereby significantly enhancing MER performance. Experimental results demonstrate that HDNet outperforms existing MER models across various datasets.
- Abstract(参考訳): 階層的および複雑な数学的表現認識(MER)は、解析と評価の両方を複雑にし、複数の式を解釈できるため困難である。
本稿では,これらの問題に対処するために設計された最初のデータセットである階層的Detail-Focused Recognition dataset (HDR)を紹介する。
大規模なトレーニングセットであるHDR-100Mで構成され、前例のない規模と多様性を提供し、1億のトレーニングインスタンスを提供する。
テストセットであるHDR-Testには、包括的なモデル性能評価のための複雑な階層公式の複数の解釈が含まれている。
さらに、複素公式のパースはしばしば細かな詳細の誤りに悩まされる。
そこで本稿では,階層型サブフォーミュラモジュールを組み込んだHyerarchical Detail-Focused Recognition Network (HDNet)を提案する。
実験の結果、HDNetは様々なデータセットで既存のMERモデルより優れていることが示された。
関連論文リスト
- A Framework for Fine-Tuning LLMs using Heterogeneous Feedback [69.51729152929413]
ヘテロジニアスフィードバックを用いた大規模言語モデル(LLM)の微調整フレームワークを提案する。
まず、不均一なフィードバックデータをSFTやRLHFなどの手法と互換性のある単一の監視形式にまとめる。
次に、この統合されたフィードバックデータセットから、性能向上を得るために高品質で多様なサブセットを抽出する。
論文 参考訳(メタデータ) (2024-08-05T23:20:32Z) - Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity [59.57065228857247]
Retrieval-augmented Large Language Models (LLMs) は、質問回答(QA)のようなタスクにおける応答精度を高めるための有望なアプローチとして登場した。
本稿では,クエリの複雑さに基づいて,LLMの最適戦略を動的に選択できる適応型QAフレームワークを提案する。
オープンドメインのQAデータセットを用いて、複数のクエリの複雑さを網羅し、QAシステムの全体的な効率性と精度を高めることを示す。
論文 参考訳(メタデータ) (2024-03-21T13:52:30Z) - Unity by Diversity: Improved Representation Learning in Multimodal VAEs [24.691068754720106]
ハード制約をソフト制約に置き換えることで、より優れた潜伏表現が得られることを示す。
既存の手法と比較して、学習した潜在表現の改善と欠落したデータモダリティの計算結果を示す。
論文 参考訳(メタデータ) (2024-03-08T13:29:46Z) - A General Model for Aggregating Annotations Across Simple, Complex, and
Multi-Object Annotation Tasks [51.14185612418977]
ラベルの品質を改善するための戦略は、複数のアノテータに同じ項目にラベルを付け、ラベルを集約するように求めることである。
特定のタスクに対して様々なbespokeモデルが提案されているが、様々な複雑なタスクを一般化するアグリゲーションメソッドを導入するのはこれが初めてである。
本論では,3つの新たな研究課題について検討し,今後の課題を概説する。
論文 参考訳(メタデータ) (2023-12-20T21:28:35Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Fully Complex-valued Fully Convolutional Multi-feature Fusion Network
(FC2MFN) for Building Segmentation of InSAR images [7.3045725197814875]
本稿では,InSAR画像上にセマンティックセグメンテーションを構築するための完全複素数値完全畳み込み多機能融合ネットワーク(FC2MFN)を提案する。
複素数値化InSARデータの特異性については、その大きさと位相を考慮した複素数を比較するための新しい複素数値化プーリング層が提案されている。
FC2MFNは、セグメンテーション性能とモデル複雑さの観点から、他の最先端手法と比較して、より良い結果が得られる。
論文 参考訳(メタデータ) (2022-12-14T08:17:39Z) - Diversified Dynamic Routing for Vision Tasks [36.199659460868496]
本稿では,各レイヤが専門家の集合で構成された新しいアーキテクチャを提案する。
本手法では,データのパーティショニングに関する課題を解決するために,モデルを明示的に訓練する。
都市景観のセマンティックセグメンテーションとMS-COCOのオブジェクト検出とインスタンスセグメンテーションについていくつかの実験を行った。
論文 参考訳(メタデータ) (2022-09-26T23:27:51Z) - Data Augmentation for Abstractive Query-Focused Multi-Document
Summarization [129.96147867496205]
2つのQMDSトレーニングデータセットを提示し,2つのデータ拡張手法を用いて構築する。
これらの2つのデータセットは相補的な性質を持ち、すなわちQMDSCNNは実際のサマリを持つが、クエリはシミュレートされる。
組み合わせたデータセット上にエンドツーエンドのニューラルネットワークモデルを構築し、DUCデータセットに最新の転送結果をもたらします。
論文 参考訳(メタデータ) (2021-03-02T16:57:01Z) - Revealing the Invisible with Model and Data Shrinking for
Composite-database Micro-expression Recognition [49.463864096615254]
入力複雑性とモデル複雑性を含む学習複雑性の影響を分析する。
より浅層構造と低分解能入力データを探索する再帰畳み込みネットワーク(RCN)を提案する。
学習可能なパラメータを増やさなくてもRCNと統合できる3つのパラメータフリーモジュールを開発した。
論文 参考訳(メタデータ) (2020-06-17T06:19:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。