論文の概要: UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition
- arxiv url: http://arxiv.org/abs/2404.15254v2
- Date: Thu, 5 Sep 2024 15:42:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-07 03:22:33.583142
- Title: UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition
- Title(参考訳): UniMERNet: 実世界の数学的表現認識のためのユニバーサルネットワーク
- Authors: Bin Wang, Zhuangcheng Gu, Guang Liang, Chao Xu, Bo Zhang, Botian Shi, Conghui He,
- Abstract要約: 本稿では,複雑な実世界のシナリオを対象とした数学的表現認識(MER)に関する最初の研究であるUniMERデータセットを紹介する。
UniMERデータセットには、前例のないスケールと多様性を提供する大規模なトレーニングセットUniMER-1Mが含まれている。
UniMER-Testは、現実世界のシナリオで見られる様々な公式分布をカバーし、より包括的で公正な評価を提供する。
- 参考スコア(独自算出の注目度): 16.728226010877727
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The paper introduces the UniMER dataset, marking the first study on Mathematical Expression Recognition (MER) targeting complex real-world scenarios. The UniMER dataset includes a large-scale training set, UniMER-1M, which offers unprecedented scale and diversity with one million training instances to train high-quality, robust models. Additionally, UniMER features a meticulously designed, diverse test set, UniMER-Test, which covers a variety of formula distributions found in real-world scenarios, providing a more comprehensive and fair evaluation. To better utilize the UniMER dataset, the paper proposes a Universal Mathematical Expression Recognition Network (UniMERNet), tailored to the characteristics of formula recognition. UniMERNet consists of a carefully designed encoder that incorporates detail-aware and local context features, and an optimized decoder for accelerated performance. Extensive experiments conducted using the UniMER-1M dataset and UniMERNet demonstrate that training on the large-scale UniMER-1M dataset can produce a more generalizable formula recognition model, significantly outperforming all previous datasets. Furthermore, the introduction of UniMERNet enhances the model's performance in formula recognition, achieving higher accuracy and speeds. All data, models, and code are available at https://github.com/opendatalab/UniMERNet.
- Abstract(参考訳): 本稿では,複雑な実世界のシナリオを対象とした数学的表現認識(MER)に関する最初の研究であるUniMERデータセットを紹介する。
UniMERデータセットには大規模なトレーニングセットであるUniMER-1Mが含まれている。
さらに、UniMERは厳密に設計され多様なテストセットであるUniMER-Testを備えており、現実世界のシナリオで見られる様々な公式分布をカバーし、より包括的で公正な評価を提供する。
そこで本研究では,Universal Mathematical Expression Recognition Network (UniMERNet)を提案する。
UniMERNetは、詳細認識とローカルコンテキスト機能を組み込んだ慎重に設計されたエンコーダと、性能向上のための最適化されたデコーダで構成されている。
UniMER-1MデータセットとUniMERNetを用いた大規模な実験により、大規模なUniMER-1Mデータセットのトレーニングにより、より一般化可能な式認識モデルが生成され、以前のすべてのデータセットよりも大幅に向上することを示した。
さらに、UniMERNetの導入により、式認識におけるモデルの性能が向上し、精度と速度が向上する。
すべてのデータ、モデル、コードはhttps://github.com/opendatalab/UniMERNetで入手できる。
関連論文リスト
- MMM: Multilingual Mutual Reinforcement Effect Mix Datasets & Test with Open-domain Information Extraction Large Language Models [10.242002062961083]
英語,日本語,中国語の21のサブデータセットを含むMultilingual MRE混合データセット(MMM)を提案する。
また,Large Language Models (LLM) を用いたデータセット翻訳手法を提案する。
オープンドメイン情報抽出大言語モデル(OIELLM)を学習するための統合入力出力フレームワークを開発する。
論文 参考訳(メタデータ) (2024-07-15T17:50:43Z) - UniRAG: Universal Retrieval Augmentation for Multi-Modal Large Language Models [76.30799731147589]
そこで,UniRAGというプラグイン・アンド・プレイ技術を紹介した。
一般のエンティティを用いたMSCOCOデータセットによる評価結果から,GPT-4oやGemini-Proといったプロプライエタリモデルも,UniIRモデルのようなMMレトリバーが取得した関連情報を用いて入力プロンプトを拡張した場合,生成品質を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-16T17:58:45Z) - Contrastive Multiple Instance Learning for Weakly Supervised Person ReID [50.04900262181093]
本稿では、より効果的に教師付きされたReIDに適した新しいフレームワークであるContrastive Multiple Instance Learning (CMIL)を紹介する。
CMILは、対照的な損失を生かしながら、単一のモデルと擬似ラベルを必要とせず、自分自身を区別する。
PerformancePhoto.coの実際のアプリケーションから自然に発生する弱いラベルを特徴とするMUDDデータセットの拡張であるWL-MUDDデータセットをリリースする。
論文 参考訳(メタデータ) (2024-02-12T14:48:31Z) - SMUTF: Schema Matching Using Generative Tags and Hybrid Features [6.471515752693932]
SMUTFは、教師あり学習がオープンドメインタスクのパフォーマンスに影響を与えないと仮定する。
人道交換言語に触発された革新的な適応では、各データ列に「生成タグ」を配置します。
SMUTFは幅広い汎用性を示し、既存の事前訓練された埋め込み、分類方法、生成モデルとシームレスに機能する。
論文 参考訳(メタデータ) (2024-01-22T08:47:50Z) - Universal Metric Learning with Parameter-Efficient Transfer Learning [40.85295050164728]
メトリック学習における一般的なプラクティスは、データセット毎に埋め込みモデルをトレーニングし、テストすることである。
このデータセット固有のアプローチは、複数の異種データの分散を含む実世界のシナリオをシミュレートすることができない。
本稿では,複数のデータ分布にまたがる関係を捉えることのできる統一されたメトリックを学習するUniversal Metric Learning(UML)という,新しいメトリック学習パラダイムを導入する。
論文 参考訳(メタデータ) (2023-09-16T10:34:01Z) - MLLM-DataEngine: An Iterative Refinement Approach for MLLM [62.30753425449056]
本稿では,データ生成,モデルトレーニング,評価を橋渡しする新しいクローズドループシステムを提案する。
各ループ内で、MLLM-DataEngineはまず評価結果に基づいてモデルの弱点を分析する。
ターゲットとして,異なる種類のデータの比率を調整する適応型バッドケースサンプリングモジュールを提案する。
品質については、GPT-4を用いて、各データタイプで高品質なデータを生成する。
論文 参考訳(メタデータ) (2023-08-25T01:41:04Z) - LMGQS: A Large-scale Dataset for Query-focused Summarization [77.6179359525065]
我々は4つの一般的な要約ベンチマークを新しいQFSベンチマークデータセットであるLMGQSに変換する。
我々は最先端の要約モデルを用いてベースラインを確立する。
複数の既存のQFSベンチマークにおいて、最先端のゼロショットと教師付きパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-05-22T14:53:45Z) - Optimizing Server-side Aggregation For Robust Federated Learning via
Subspace Training [80.03567604524268]
クライアント間の非IIDデータ分散と中毒攻撃は、現実世界のフェデレーション学習システムにおける2つの大きな課題である。
サーバ側集約プロセスを最適化する汎用的なアプローチであるSmartFLを提案する。
本稿では,SmartFLの収束と一般化能力に関する理論的解析を行う。
論文 参考訳(メタデータ) (2022-11-10T13:20:56Z) - Improving the Reliability of Network Intrusion Detection Systems through
Dataset Integration [0.20646127669654826]
本研究は、機械学習(ML)に基づくネットワーク侵入検知システム(NIDS)の新しい方法論であるReliable-NIDS(R-NIDS)を提示する。
R-NIDSは、MLモデルを統合データセットで動作させ、さまざまなデータセットからさまざまな情報で学習プロセスを強化する。
本研究では、NIDS評価のための文献において最も一般的な3つのデータセットの情報に基づいて、2つのよく知られたMLモデルを構築することを提案する。
論文 参考訳(メタデータ) (2021-12-02T09:30:18Z) - Data Augmentation for Abstractive Query-Focused Multi-Document
Summarization [129.96147867496205]
2つのQMDSトレーニングデータセットを提示し,2つのデータ拡張手法を用いて構築する。
これらの2つのデータセットは相補的な性質を持ち、すなわちQMDSCNNは実際のサマリを持つが、クエリはシミュレートされる。
組み合わせたデータセット上にエンドツーエンドのニューラルネットワークモデルを構築し、DUCデータセットに最新の転送結果をもたらします。
論文 参考訳(メタデータ) (2021-03-02T16:57:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。