論文の概要: Flowmind2Digital: The First Comprehensive Flowmind Recognition and
Conversion Approach
- arxiv url: http://arxiv.org/abs/2401.03742v1
- Date: Mon, 8 Jan 2024 09:05:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-09 17:11:09.982849
- Title: Flowmind2Digital: The First Comprehensive Flowmind Recognition and
Conversion Approach
- Title(参考訳): Flowmind2Digital: 最初の包括的フローミンド認識と変換アプローチ
- Authors: Huanyu Liu, Jianfeng Cai, Tingjia Zhang, Hongsheng Li, Siyuan Wang,
Guangming Zhu, Syed Afaq Ali Shah, Mohammed Bennamoun and Liang Zhang
- Abstract要約: フローチャートとマインドマップは、フローミンド(flowmind)と呼ばれ、日々の活動において不可欠であり、手書き版はリアルタイムのコラボレーションを容易にする。
既存のスケッチ認識手法は、フィールド固有であり、デジタル変換手順が欠如している、現実的な状況において制限に直面している。
本稿では,これらの課題に対処するため,Flowmind2digital法とhdFlowmindデータセットを提案する。
- 参考スコア(独自算出の注目度): 57.00892368627367
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Flowcharts and mind maps, collectively known as flowmind, are vital in daily
activities, with hand-drawn versions facilitating real-time collaboration.
However, there's a growing need to digitize them for efficient processing.
Automated conversion methods are essential to overcome manual conversion
challenges. Existing sketch recognition methods face limitations in practical
situations, being field-specific and lacking digital conversion steps. Our
paper introduces the Flowmind2digital method and hdFlowmind dataset to address
these challenges. Flowmind2digital, utilizing neural networks and keypoint
detection, achieves a record 87.3% accuracy on our dataset, surpassing previous
methods by 11.9%. The hdFlowmind dataset, comprising 1,776 annotated flowminds
across 22 scenarios, outperforms existing datasets. Additionally, our
experiments emphasize the importance of simple graphics, enhancing accuracy by
9.3%.
- Abstract(参考訳): フローチャートとマインドマップは、フローミンド(flowmind)と呼ばれ、日々の活動において不可欠であり、手書き版はリアルタイムのコラボレーションを容易にする。
しかし、効率的な処理のためにデジタル化する必要性が増しています。
手動変換を克服するためには自動変換法が不可欠である。
既存のスケッチ認識手法では、フィールド固有であり、デジタル変換手順が欠如している。
本稿では,これらの課題に対処するため,Flowmind2digital法とhdFlowmindデータセットを提案する。
Flowmind2digitalはニューラルネットワークとキーポイント検出を利用して、データセット上で87.3%の精度を達成した。
hdFlowmindデータセットは、22のシナリオにわたる1,776のアノテートフローミンドで構成され、既存のデータセットを上回っている。
さらに,単純なグラフィックの重要性を強調し,精度を9.3%向上させた。
関連論文リスト
- Bridging the Gap Between End-to-End and Two-Step Text Spotting [88.14552991115207]
ブリッジングテキストスポッティングは、2段階のメソッドでエラーの蓄積と最適化性能の問題を解決する新しいアプローチである。
提案手法の有効性を広範囲な実験により実証する。
論文 参考訳(メタデータ) (2024-04-06T13:14:04Z) - Fully automated landmarking and facial segmentation on 3D photographs [0.0]
本研究の目的は,深層学習を用いた自動頭蓋計測法の開発と評価である。
10個のランドマークが1人の観察者によって2897の顔写真に手動で注釈付けされた。
ワークフローはすべてのテストケースの98.6%で成功した。
論文 参考訳(メタデータ) (2023-09-19T09:39:55Z) - Pruning Distorted Images in MNIST Handwritten Digits [0.0]
手書き文字を認識できる2段階の深層学習手法を提案する。
最初の段階では、トレーニングセット内で歪んだ桁を識別する単純なニューラルネットワークを作成します。
第2段階では、これらの識別された画像をトレーニングデータセットから除外し、フィルタデータセットを使用してモデルを再トレーニングする。
実験の結果,提案手法の有効性を実証し,テストデータセットの精度を99.5%以上とした。
論文 参考訳(メタデータ) (2023-05-26T11:44:35Z) - TempNet: Temporal Attention Towards the Detection of Animal Behaviour in
Videos [63.85815474157357]
本稿では,映像中の生物学的行動を検出するための,効率的なコンピュータビジョンと深層学習に基づく手法を提案する。
TempNetはエンコーダブリッジと残留ブロックを使用して、2段階の空間的、そして時間的、エンコーダでモデル性能を維持する。
本研究では,サブルフィッシュ (Anoplopoma fimbria) 幼虫の検出への応用を実証する。
論文 参考訳(メタデータ) (2022-11-17T23:55:12Z) - Real-time Action Recognition for Fine-Grained Actions and The Hand Wash
Dataset [0.0]
Raspberry Piのような低出力システム上で,高精度かつ効率的にリアルタイムに動作する3ストリーム融合アルゴリズムを提案する。
このアルゴリズムによって得られた結果は、UCF-101とHMDB-51データセットでベンチマークされ、それぞれ92.7%と64.9%の精度を達成した。
論文 参考訳(メタデータ) (2022-10-13T22:38:11Z) - What Stops Learning-based 3D Registration from Working in the Real
World? [53.68326201131434]
この研究は、3Dポイントのクラウド登録失敗の原因を特定し、その原因を分析し、解決策を提案する。
最終的に、これは最も実践的な3D登録ネットワーク(BPNet)に変換される。
我々のモデルは微調整をせずに実データに一般化し、商用センサで得られた見えない物体の点雲上で最大67%の精度に達する。
論文 参考訳(メタデータ) (2021-11-19T19:24:27Z) - Handwritten Character Recognition from Wearable Passive RFID [1.3190581566723918]
本稿では,シーケンスとビットマップ表現を融合した前処理パイプラインを提案する。
データは全部で7500文字を含む10の被験者から収集される。
提案したモデルは実験で72%の精度に達しており、この挑戦的なデータセットの精度が高いと考えられる。
論文 参考訳(メタデータ) (2020-08-06T09:45:29Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z) - Take an Emotion Walk: Perceiving Emotions from Gaits Using Hierarchical Attention Pooling and Affective Mapping [55.72376663488104]
本稿では、ビデオやモーションキャプチャーデータから得られた歩行スタイルから、知覚された人間の感情を分類するためのオートエンコーダに基づくアプローチを提案する。
3次元ポーズシーケンスから抽出した各ステップのポーズにおける各関節の動きを考慮し、これらの関節の動きをエンコーダに階層的にプールする。
我々はデコーダを訓練し、潜伏埋め込みからトップダウン方式で1ステップ当たりの関節の動きを再構築する。
論文 参考訳(メタデータ) (2019-11-20T05:04:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。