論文の概要: Advanced Hough-based method for on-device document localization
- arxiv url: http://arxiv.org/abs/2106.09987v1
- Date: Fri, 18 Jun 2021 08:17:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-21 14:06:20.964878
- Title: Advanced Hough-based method for on-device document localization
- Title(参考訳): オンデバイス文書のローカライズのためのhoughに基づく高度手法
- Authors: D.V. Tropin, A.M. Ershov, D.P. Nikolaev and V.V. Arlazarov
- Abstract要約: 本研究では,文書の内容や内部構造を事前に知ることなく,画像中の文書の位置を考察する。
中心射影モデルの幾何学的不変量を考慮したHough-based法を提案する。
より挑戦的なMIDV-500データセットで評価すると、提案アルゴリズムは公表された手法と比較して最高の精度を保証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The demand for on-device document recognition systems increases in
conjunction with the emergence of more strict privacy and security
requirements. In such systems, there is no data transfer from the end device to
a third-party information processing servers. The response time is vital to the
user experience of on-device document recognition. Combined with the
unavailability of discrete GPUs, powerful CPUs, or a large RAM capacity on
consumer-grade end devices such as smartphones, the time limitations put
significant constraints on the computational complexity of the applied
algorithms for on-device execution.
In this work, we consider document location in an image without prior
knowledge of the document content or its internal structure. In accordance with
the published works, at least 5 systems offer solutions for on-device document
location. All these systems use a location method which can be considered
Hough-based. The precision of such systems seems to be lower than that of the
state-of-the-art solutions which were not designed to account for the limited
computational resources.
We propose an advanced Hough-based method. In contrast with other approaches,
it accounts for the geometric invariants of the central projection model and
combines both edge and color features for document boundary detection. The
proposed method allowed for the second best result for SmartDoc dataset in
terms of precision, surpassed by U-net like neural network. When evaluated on a
more challenging MIDV-500 dataset, the proposed algorithm guaranteed the best
precision compared to published methods. Our method retained the applicability
to on-device computations.
- Abstract(参考訳): デバイス上の文書認識システムの需要は、より厳格なプライバシーとセキュリティ要件の出現とともに増加する。
このようなシステムでは、エンドデバイスからサードパーティの情報処理サーバへのデータ転送は行われない。
応答時間は、オンデバイス文書認識のユーザエクスペリエンスに不可欠である。
スマートフォンなどのコンシューマグレードのエンドデバイスでは、離散GPU、強力なCPU、あるいは大きなRAM容量が利用できないため、時間制限は、オンデバイス実行に適用されるアルゴリズムの計算複雑性に大きな制約を与えた。
本研究では,文書の内容や内部構造を事前に知ることなく,画像中の文書の位置を考察する。
公開された作品に従って、少なくとも5つのシステムがオンデバイスドキュメントロケーションのソリューションを提供している。
これらのシステムはすべて、ハフベースと見なすことのできるロケーションメソッドを使用する。
このようなシステムの精度は、限られた計算資源を考慮に入れない最先端のソリューションよりも低いようである。
先進的なハフ法を提案する。
他の手法とは対照的に、中央射影モデルの幾何学的不変性を考慮し、文書境界検出にエッジとカラーの特徴を組み合わせる。
提案手法は,ニューラルネットワークのようなU-netを超越した精度で,SmartDocデータセットの2番目の最適結果を実現する。
より挑戦的なMIDV-500データセットで評価すると、提案アルゴリズムは公表された手法と比較して最高の精度を保証した。
本手法はオンデバイス計算への適用性を維持した。
関連論文リスト
- HeteroEdge: Addressing Asymmetry in Heterogeneous Collaborative
Autonomous Systems [1.274065448486689]
2台の無人地上車両(UGV)と2台のNVIDIA Jetsonデバイスからなるテストベッドの自己適応最適化フレームワークを提案する。
このフレームワークは、異種ノード上の複数のタスク(ストレージ、処理、計算、送信、推論)を同時に効率的に管理する。
入力された画像フレームの圧縮とマスキング、類似したフレームの識別、および最適化のための境界条件を得るためにプロファイリング装置を含む。
論文 参考訳(メタデータ) (2023-05-05T02:43:16Z) - Task-Oriented Over-the-Air Computation for Multi-Device Edge AI [57.50247872182593]
エッジAIをサポートするための6Gネットワークは、AIタスクの効率的かつ効率的な実行に焦点を当てたタスク指向のテクニックを備えている。
本稿では,マルチデバイススプリット推論システムにおけるタスク指向オーバー・ザ・エア計算(AirComp)方式を提案する。
論文 参考訳(メタデータ) (2022-11-02T16:35:14Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Device-independent Quantum Fingerprinting for Large Scale Localization [6.141741864834815]
デバイスに依存しない量子指紋マッチングアルゴリズムQHFPを提案する。
特に,従来の手法よりも指数関数的に優れた複雑性を持つ量子アルゴリズムを提案する。
その結果,QHFPが空間と走行時間を指数的に改善し,正確な推定位置を得る能力が確認された。
論文 参考訳(メタデータ) (2022-06-22T04:35:17Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - Benchmarking Quality-Dependent and Cost-Sensitive Score-Level Multimodal
Biometric Fusion Algorithms [58.156733807470395]
本稿では,BioSecure DS2 (Access Control) 評価キャンペーンの枠組み内で実施したベンチマーク研究について報告する。
キャンペーンは、約500人の中規模施設における物理的アクセス制御の適用を目標とした。
我々の知る限りでは、これは品質ベースのマルチモーダル融合アルゴリズムをベンチマークする最初の試みである。
論文 参考訳(メタデータ) (2021-11-17T13:39:48Z) - Are we ready for beyond-application high-volume data? The Reeds robot
perception benchmark dataset [3.781421673607643]
本稿ではロボット認識アルゴリズムの研究のためにReedsと呼ばれるデータセットを提案する。
このデータセットは、アプリケーション固有のソリューションをテストする環境を提供するのではなく、アルゴリズムに要求されるベンチマーク機会を提供することを目的としている。
論文 参考訳(メタデータ) (2021-09-16T23:21:42Z) - Quantum verification and estimation with few copies [63.669642197519934]
大規模絡み合ったシステムの検証と推定は、信頼性の高い量子情報処理にそのようなシステムを用いる際の大きな課題の1つである。
本稿では,資源の一定数(サンプリング複雑性)に着目し,任意の次元のシステムに適していることを示す。
具体的には、量子状態トモグラフィー(quantum state tomography)の概念とともに、エンタングルメント検出のために少なくとも1つのコピーだけを必要とする確率的フレームワークをレビューする。
論文 参考訳(メタデータ) (2021-09-08T18:20:07Z) - Approach for Document Detection by Contours and Contrasts [0.0]
本稿では,モバイル端末上で行う任意の文書検出について考察する。
本研究では,輪郭法を改良し,競合する輪郭位置仮説を境界内と外とのコントラストに応じてランク付けする。
提案手法は,オープンなMIDV-500データセット上での未適合な最先端性能を提供し,SmartDocデータセットの最先端パフォーマンスに匹敵する結果を実証する。
論文 参考訳(メタデータ) (2020-08-06T12:44:40Z) - PrimiTect: Fast Continuous Hough Voting for Primitive Detection [49.72425950418304]
本手法は点を平面や円錐などの異なる幾何学的プリミティブに分類し,データのコンパクトな表現につながる。
我々は、プリミティブの局所的で低次元のパラメータ化を使用して、ポイントが属するオブジェクトのタイプ、形状、ポーズを決定する。
これにより、ロボットアプリケーションでしばしば必要とされるように、計算能力の低いデバイス上での動作に適したアルゴリズムが実現されます。
論文 参考訳(メタデータ) (2020-05-15T10:16:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。