Fugu-MT 論文翻訳(概要): CharNet: Generalized Approach for High-Complexity Character Classification

論文の概要: CharNet: Generalized Approach for High-Complexity Character Classification

arxiv url: http://arxiv.org/abs/2401.17098v1
Date: Tue, 30 Jan 2024 15:29:32 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-31 14:31:45.383396
Title: CharNet: Generalized Approach for High-Complexity Character Classification
Title（参考訳）: charnet:高複雑度キャラクタ分類のための一般化アプローチ
Authors: Boris Kriuk
Abstract要約: 手書き文字認識は、機械学習研究者にとって難しい問題である。多数のユニークな文字クラスが存在するため、ロジカルスクリプトや中韓文字シーケンスのようなデータによっては、HCR問題に新たな複雑さをもたらす。本稿では,詳細な文字画像分類のための,単純で一般化可能な,高効率なアプローチを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Handwritten character recognition (HCR) is a challenging problem for machine learning researchers. Unlike printed text data, handwritten character datasets have more variation due to human-introduced bias. With numerous unique character classes present, some data, such as Logographic Scripts or Sino-Korean character sequences, bring new complications to the HCR problem. The classification task on such datasets requires the model to learn high-complexity details of the images that share similar features. With recent advances in computational resource availability and further computer vision theory development, some research teams have effectively addressed the arising challenges. Although known for achieving high efficiency, many common approaches are still not generalizable and use dataset-specific solutions to achieve better results. Due to complex structure and high computing demands, existing methods frequently prevent the solutions from gaining popularity. This paper proposes a straightforward, generalizable, and highly effective approach (CharNet) for detailed character image classification and compares its performance to that of existing approaches.
Abstract（参考訳）: 手書き文字認識(HCR)は、機械学習研究者にとって難しい問題である。印刷されたテキストデータとは異なり、手書き文字データセットは人為的バイアスによりよりバリエーションがある。多数のユニークな文字クラスが存在するため、ロジカルスクリプトや中韓文字シーケンスのようなデータによっては、HCR問題に新たな複雑さをもたらす。このようなデータセットの分類タスクでは、モデルが類似した特徴を持つ画像の複雑な詳細を学ぶ必要がある。近年の計算資源の可用性の向上とコンピュータビジョン理論の開発により、一部の研究チームはこの問題に対処している。高効率を達成することで知られているが、多くの一般的なアプローチはまだ一般化されておらず、より良い結果を得るためにデータセット固有のソリューションを使用する。複雑な構造と高い計算要求のため、既存の手法はしばしばソリューションの人気を妨げている。本稿では,文字画像の詳細な分類のための簡易で汎用的で高効率なアプローチ(CharNet)を提案し,その性能を既存手法と比較する。

関連論文リスト

Beyond the Pipeline: Analyzing Key Factors in End-to-End Deep Learning for Historical Writer Identification [0.0]
本稿では,歴史作家識別のためのエンド・ツー・エンド深層学習手法の性能に影響を及ぼす諸要因について検討する。従来のHWI手法は手作りの画像処理とクラスタリング技術に依存しており、小さなデータセットでよく機能する傾向にある。エンドツーエンドパイプラインは、ドキュメントイメージから直接機能を学ぶことによって、プロセスを自動化することを目的としている。
論文参考訳（メタデータ） (2025-10-21T14:25:16Z)
Boosting Semi-Supervised Scene Text Recognition via Viewing and Summarizing [71.29488677105127]
既存のシーンテキスト認識(STR)手法は、特に芸術的で歪んだ文字に対して、挑戦的なテキストを認識するのに苦労している。人的コストを伴わずに、合成データと実際のラベルなしデータを活用して、対照的な学習ベースのSTRフレームワークを提案する。本手法は,共通ベンチマークとUnion14M-Benchmarkで平均精度94.7%,70.9%のSOTA性能を実現する。
論文参考訳（メタデータ） (2024-11-23T15:24:47Z)
Contrastive Transformer Learning with Proximity Data Generation for Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文参考訳（メタデータ） (2023-11-15T16:26:49Z)
Few-shot Image Classification based on Gradual Machine Learning [6.935034849731568]
少ないショット画像分類は、ラベル付きサンプルのみを使用してラベル付きイメージを正確に分類することを目的としている。段階的機械学習(GML)の非i.dパラダイムに基づく新しいアプローチを提案する。提案手法は精度でSOTAの性能を1-5%向上させることができることを示す。
論文参考訳（メタデータ） (2023-07-28T12:30:41Z)
Efficient Deep Clustering of Human Activities and How to Improve Evaluation [53.08810276824894]
我々は,ヒト活動の再コーグ・ニオン(HAR)のための新しい深層クラスタリングモデルを提案する。本稿では,HARクラスタリングモデルがどのように評価されるかという,いくつかの異なる問題を取り上げる。次に、これらの問題に対する解決策について議論し、将来の深層HARクラスタリングモデルに対する標準評価設定を提案する。
論文参考訳（メタデータ） (2022-09-17T14:12:42Z)
Autoregressive Search Engines: Generating Substrings as Document Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文参考訳（メタデータ） (2022-04-22T10:45:01Z)
Learning from Few Examples: A Summary of Approaches to Few-Shot Learning [3.6930948691311016]
Few-Shot Learningは、いくつかのトレーニングサンプルからデータの基本パターンを学習する問題を指す。ディープラーニングソリューションは、データ飢餓と、膨大な計算時間とリソースに悩まされている。機械学習アプリケーション構築のターンアラウンド時間を劇的に短縮できるようなショットラーニングは、低コストのソリューションとして現れます。
論文参考訳（メタデータ） (2022-03-07T23:15:21Z)
Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文参考訳（メタデータ） (2021-11-04T04:39:02Z)
Detecting Requirements Smells With Deep Learning: Experiences, Challenges and Future Work [9.44316959798363]
本研究の目的は,手動でラベル付きデータセットを作成し,アンサンブル学習,深層学習(DL),単語埋め込みや伝達学習といった手法を用いて一般化問題を克服することで,従来の作業を改善することである。現在の調査結果は、データセットが不均衡であり、どのクラスをもっと追加すべきかを示している。
論文参考訳（メタデータ） (2021-08-06T12:45:15Z)
Tensor feature hallucination for few-shot learning [17.381648488344222]
限られた監督と限られたデータによって、サンプルを分類するという課題に対処するショットは少ない。数ショット分類のための合成データ生成に関するこれまでの研究は、複雑なモデルを活用することに重点を置いていた。本稿では,単純かつ簡単な合成データ生成手法を効果的に利用する方法を検討する。
論文参考訳（メタデータ） (2021-06-09T18:25:08Z)
When is Memorization of Irrelevant Training Data Necessary for High-Accuracy Learning? [53.523017945443115]
我々は,十分な精度のトレーニングアルゴリズムが,予測モデルにおいて,そのトレーニング例の大規模サブセットに関する情報を本質的にすべてエンコードしなければならない自然予測問題を記述する。私たちの結果は、トレーニングアルゴリズムや学習に使用されるモデルのクラスに依存しません。
論文参考訳（メタデータ） (2020-12-11T15:25:14Z)
Robust Document Representations using Latent Topics and Metadata [17.306088038339336]
本稿では,文書分類問題に対する事前学習型ニューラルネットワークモデルの微調整手法を提案する。テキストとメタデータの両方をタスク形式でキャプチャする文書表現を生成します。私たちのソリューションでは、メタデータを単にテキストで拡張するのではなく、明示的に組み込んでいます。
論文参考訳（メタデータ） (2020-10-23T21:52:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。