論文の概要: Recognition of Oracle Bone Inscriptions by using Two Deep Learning
Models
- arxiv url: http://arxiv.org/abs/2105.00777v2
- Date: Tue, 4 May 2021 05:23:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-05 11:29:28.565769
- Title: Recognition of Oracle Bone Inscriptions by using Two Deep Learning
Models
- Title(参考訳): 深層学習モデルを用いたOracleの骨碑文の認識
- Authors: Yoshiyuki Fujikawa, Hengyi Li, Xuebin Yue, Aravinda C V, Amar Prabhu
G, Lin Meng
- Abstract要約: オラクルの骨碑文(OBI)には、約3000年前に中国で使われた世界最古の文字が含まれている。
本論文は,文化遺産の保存と整理を支援するオンラインOBI認識システムの設計を目的とする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Oracle bone inscriptions (OBIs) contain some of the oldest characters in the
world and were used in China about 3000 years ago. As an ancient form of
literature, OBIs store a lot of information that can help us understand the
world history, character evaluations, and more. However, as OBIs were found
only discovered about 120 years ago, few studies have described them, and the
aging process has made the inscriptions less legible. Hence, automatic
character detection and recognition has become an important issue. This paper
aims to design a online OBI recognition system for helping preservation and
organization the cultural heritage. We evaluated two deep learning models for
OBI recognition, and have designed an API that can be accessed online for OBI
recognition. In the first stage, you only look once (YOLO) is applied for
detecting and recognizing OBIs. However, not all of the OBIs can be detected
correctly by YOLO, so we next utilize MobileNet to recognize the undetected
OBIs by manually cropping the undetected OBI in the image. MobileNet is used
for this second stage of recognition as our evaluation of ten state-of-the-art
models showed that it is the best network for OBI recognition due to its
superior performance in terms of accuracy, loss and time consumption. We
installed our system on an application programming interface (API) and opened
it for OBI detection and recognition.
- Abstract(参考訳): オラクルの骨碑文(OBI)には、約3000年前に中国で使われた世界最古の文字が含まれている。
古代の文学として、OBIは世界の歴史やキャラクターの評価などを理解するのに役立つ情報をたくさん保存しています。
しかし、OBIが発見されてから約120年が経ち、研究がほとんど行われておらず、老朽化によって碑文の信頼性が低下している。
そのため,文字の自動検出と認識が重要な課題となっている。
本稿では,文化遺産の保存・整理を支援するオンラインOBI認識システムを設計することを目的とする。
OBI認識のための2つのディープラーニングモデルを評価し、OBI認識のためにオンラインでアクセス可能なAPIを設計した。
最初の段階では、OBIの検出と認識に一度(YOLO)しか適用されない。
しかし、全OBIをYOLOで正確に検出できるわけではないため、画像中の未検出OBIを手動でトリミングすることで、次にMobileNetを用いて未検出OBIを認識する。
MobileNetはこの第2段階の認識に利用されており、精度、損失、時間消費の点で優れた性能でOBI認識に適したネットワークであることを示す10種類の最先端モデルの評価を行った。
アプリケーションプログラミングインタフェース(API)にシステムを設置し,OBI検出と認識のために開放した。
関連論文リスト
- YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。
提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。
YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文 参考訳(メタデータ) (2024-01-30T18:59:38Z) - Continual Generalized Intent Discovery: Marching Towards Dynamic and
Open-world Intent Recognition [25.811639218862958]
Generalized Intent Discovery (GID)は、OOD学習の1段階のみを考慮し、過去のすべての段階におけるデータを共同トレーニングに活用する必要がある。
Continual Generalized Intent Discovery (CGID)は、動的OODデータストリームからOODインテントを継続的にかつ自動的に検出することを目的としている。
PLRDはクラスプロトタイプを通じて新しいインテント発見をブートストラップし、データ再生と特徴蒸留を通じて新しいインテントと古いインテントのバランスをとる。
論文 参考訳(メタデータ) (2023-10-16T08:48:07Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - Multi-Modal Human Authentication Using Silhouettes, Gait and RGB [59.46083527510924]
全体認証は、遠隔生体認証のシナリオにおいて有望なアプローチである。
本稿では,RGBデータとシルエットデータを組み合わせたDME(Dual-Modal Ensemble)を提案する。
DME内では、従来の歩行分析に使用される二重ヘリカル歩行パターンにインスパイアされたGaitPatternを提案する。
論文 参考訳(メタデータ) (2022-10-08T15:17:32Z) - Deep Learning Architecture for Automatic Essay Scoring [0.0]
本稿では、リカレントネットワーク(RNN)と畳み込みニューラルネットワーク(CNN)に基づく新しいアーキテクチャを提案する。
提案アーキテクチャでは, 単語埋め込みベクトルから, 単語n-gramの文脈的特徴を学習し, 捉える。
提案方式は,他の深層学習に基づくAESシステムよりも格付け精度が高い。
論文 参考訳(メタデータ) (2022-06-16T14:56:24Z) - BehavePassDB: Benchmarking Mobile Behavioral Biometrics [12.691633481373927]
新たなデータベースであるBehavePassDBを,個別の取得セッションとタスクに構成する。
本稿では,三重項損失とスコアレベルでのモダリティ融合を有する長短項メモリ(LSTM)アーキテクチャに基づくシステムを提案し,評価する。
論文 参考訳(メタデータ) (2022-06-06T11:21:15Z) - Deep Learning for Face Anti-Spoofing: A Survey [74.42603610773931]
対面防止(FAS)は、プレゼンテーションアタック(PA)から顔認識システムを保護する上で重要な役割を担っているため、近年注目を集めている。
論文 参考訳(メタデータ) (2021-06-28T19:12:00Z) - End-to-end User Recognition using Touchscreen Biometrics [11.394909061094463]
目標は、モバイルデバイスの生データを使ってユーザーを透過的に識別できるエンドツーエンドシステムを作ることだった。
提案するシステムでは,タッチスクリーンからのデータはディープニューラルネットワークの入力に直接反映され,ユーザの同一性を決定することができる。
論文 参考訳(メタデータ) (2020-06-09T16:38:09Z) - Towards Palmprint Verification On Smartphones [62.279124220123286]
過去20年間の研究によると、ヤシの印刷物は独特性と永続性に優れた効果がある。
我々はスマートフォン用のDeepMPV+というDCNNベースのパームプリント検証システムを構築した。
DeepMPV+の効率と有効性は広範な実験によって裏付けられている。
論文 参考訳(メタデータ) (2020-03-30T08:31:03Z) - DeepSign: Deep On-Line Signature Verification [6.5379404287240295]
本研究は,オンライン署名検証のための最先端深層学習手法の詳細な分析を行う。
我々は、新しいDeepSignDBのオンライン手書き署名生体情報データベースを提示、記述する。
我々は,オンライン手書き署名検証のタスクに対して,TA-RNN(Time-Aligned Recurrent Neural Networks)と呼ばれる最近のディープラーニングアプローチを適用し,評価する。
論文 参考訳(メタデータ) (2020-02-24T08:53:11Z) - Deep Learning for Person Re-identification: A Survey and Outlook [233.36948173686602]
人物再識別(Re-ID)は、複数の重複しないカメラを通して興味ある人物を検索することを目的としている。
人物のRe-IDシステム開発に関わるコンポーネントを分離することにより、それをクローズドワールドとオープンワールドのセッティングに分類する。
論文 参考訳(メタデータ) (2020-01-13T12:49:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。