論文の概要: CharNet: Generalized Approach for High-Complexity Character
Classification
- arxiv url: http://arxiv.org/abs/2401.17098v1
- Date: Tue, 30 Jan 2024 15:29:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 14:31:45.383396
- Title: CharNet: Generalized Approach for High-Complexity Character
Classification
- Title(参考訳): charnet:高複雑度キャラクタ分類のための一般化アプローチ
- Authors: Boris Kriuk
- Abstract要約: 手書き文字認識は、機械学習研究者にとって難しい問題である。
多数のユニークな文字クラスが存在するため、ロジカルスクリプトや中韓文字シーケンスのようなデータによっては、HCR問題に新たな複雑さをもたらす。
本稿では,詳細な文字画像分類のための,単純で一般化可能な,高効率なアプローチを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Handwritten character recognition (HCR) is a challenging problem for machine
learning researchers. Unlike printed text data, handwritten character datasets
have more variation due to human-introduced bias. With numerous unique
character classes present, some data, such as Logographic Scripts or
Sino-Korean character sequences, bring new complications to the HCR problem.
The classification task on such datasets requires the model to learn
high-complexity details of the images that share similar features. With recent
advances in computational resource availability and further computer vision
theory development, some research teams have effectively addressed the arising
challenges. Although known for achieving high efficiency, many common
approaches are still not generalizable and use dataset-specific solutions to
achieve better results. Due to complex structure and high computing demands,
existing methods frequently prevent the solutions from gaining popularity. This
paper proposes a straightforward, generalizable, and highly effective approach
(CharNet) for detailed character image classification and compares its
performance to that of existing approaches.
- Abstract(参考訳): 手書き文字認識(HCR)は、機械学習研究者にとって難しい問題である。
印刷されたテキストデータとは異なり、手書き文字データセットは人為的バイアスによりよりバリエーションがある。
多数のユニークな文字クラスが存在するため、ロジカルスクリプトや中韓文字シーケンスのようなデータによっては、HCR問題に新たな複雑さをもたらす。
このようなデータセットの分類タスクでは、モデルが類似した特徴を持つ画像の複雑な詳細を学ぶ必要がある。
近年の計算資源の可用性の向上とコンピュータビジョン理論の開発により、一部の研究チームはこの問題に対処している。
高効率を達成することで知られているが、多くの一般的なアプローチはまだ一般化されておらず、より良い結果を得るためにデータセット固有のソリューションを使用する。
複雑な構造と高い計算要求のため、既存の手法はしばしばソリューションの人気を妨げている。
本稿では,文字画像の詳細な分類のための簡易で汎用的で高効率なアプローチ(CharNet)を提案し,その性能を既存手法と比較する。
関連論文リスト
- Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - Homological Convolutional Neural Networks [4.615338063719135]
本稿では,トポロジ的に制約されたネットワーク表現を通じて,データ構造構造を利用した新しいディープラーニングアーキテクチャを提案する。
5つの古典的な機械学習モデルと3つのディープラーニングモデルに対して、18のベンチマークデータセットでモデルをテストします。
論文 参考訳(メタデータ) (2023-08-26T08:48:51Z) - Efficient Deep Clustering of Human Activities and How to Improve
Evaluation [53.08810276824894]
我々は,ヒト活動の再コーグ・ニオン(HAR)のための新しい深層クラスタリングモデルを提案する。
本稿では,HARクラスタリングモデルがどのように評価されるかという,いくつかの異なる問題を取り上げる。
次に、これらの問題に対する解決策について議論し、将来の深層HARクラスタリングモデルに対する標準評価設定を提案する。
論文 参考訳(メタデータ) (2022-09-17T14:12:42Z) - Deep Sequence Models for Text Classification Tasks [0.007329200485567826]
自然言語処理(NLP)は、人間の多様で複雑な言語を理解するために機械を装備している。
一般的なテキスト分類アプリケーションには、情報検索、ニューストピックのモデリング、テーマ抽出、感情分析、スパム検出が含まれる。
RNN、GRU、LSTMといったシーケンスモデルは、長距離依存性を持つタスクのブレークスルーである。
その結果、ほとんどのモデルでは80%と94%の範囲で性能が向上した。
論文 参考訳(メタデータ) (2022-07-18T18:47:18Z) - GMN: Generative Multi-modal Network for Practical Document Information
Extraction [9.24332309286413]
文書情報抽出 (DIE) は, 実世界の様々な先進的な応用により, 注目を集めている。
本稿では,これらの問題に対処するための実環境シナリオのためのジェネレーティブ・マルチモーダル・ネットワーク(GMN)を提案する。
慎重に設計された空間エンコーダとモード対応マスクモジュールにより、GMNはシーケンシャルな順序にシリアライズが難しい複雑なドキュメントを扱うことができる。
論文 参考訳(メタデータ) (2022-07-11T08:52:36Z) - When is Memorization of Irrelevant Training Data Necessary for
High-Accuracy Learning? [53.523017945443115]
我々は,十分な精度のトレーニングアルゴリズムが,予測モデルにおいて,そのトレーニング例の大規模サブセットに関する情報を本質的にすべてエンコードしなければならない自然予測問題を記述する。
私たちの結果は、トレーニングアルゴリズムや学習に使用されるモデルのクラスに依存しません。
論文 参考訳(メタデータ) (2020-12-11T15:25:14Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - Predicting Themes within Complex Unstructured Texts: A Case Study on
Safeguarding Reports [66.39150945184683]
本稿では,教師付き分類手法を用いた保護レポートにおいて,主テーマの自動識別の問題に焦点をあてる。
この結果から,ラベル付きデータに制限のある複雑なタスクであっても,深層学習モデルが対象知識の振る舞いをシミュレートする可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-27T19:48:23Z) - Learning Generalized Relational Heuristic Networks for Model-Agnostic
Planning [29.714818991696088]
本稿では,記号的行動モデルが存在しない場合の一般化を学習するための新しいアプローチを開発する。
データの効率的で一般化可能な学習を容易にするために、抽象状態表現を使用する。
論文 参考訳(メタデータ) (2020-07-10T06:08:28Z) - ENT-DESC: Entity Description Generation by Exploring Knowledge Graph [53.03778194567752]
実際には、出力記述が最も重要な知識のみをカバーするため、入力知識は十分以上である可能性がある。
我々は、KG-to-textにおけるこのような実践的なシナリオの研究を容易にするために、大規模で挑戦的なデータセットを導入する。
本稿では,元のグラフ情報をより包括的に表現できるマルチグラフ構造を提案する。
論文 参考訳(メタデータ) (2020-04-30T14:16:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。