論文の概要: Flowmind2Digital: The First Comprehensive Flowmind Recognition and
Conversion Approach
- arxiv url: http://arxiv.org/abs/2401.03742v1
- Date: Mon, 8 Jan 2024 09:05:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-09 17:11:09.982849
- Title: Flowmind2Digital: The First Comprehensive Flowmind Recognition and
Conversion Approach
- Title(参考訳): Flowmind2Digital: 最初の包括的フローミンド認識と変換アプローチ
- Authors: Huanyu Liu, Jianfeng Cai, Tingjia Zhang, Hongsheng Li, Siyuan Wang,
Guangming Zhu, Syed Afaq Ali Shah, Mohammed Bennamoun and Liang Zhang
- Abstract要約: フローチャートとマインドマップは、フローミンド(flowmind)と呼ばれ、日々の活動において不可欠であり、手書き版はリアルタイムのコラボレーションを容易にする。
既存のスケッチ認識手法は、フィールド固有であり、デジタル変換手順が欠如している、現実的な状況において制限に直面している。
本稿では,これらの課題に対処するため,Flowmind2digital法とhdFlowmindデータセットを提案する。
- 参考スコア(独自算出の注目度): 57.00892368627367
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Flowcharts and mind maps, collectively known as flowmind, are vital in daily
activities, with hand-drawn versions facilitating real-time collaboration.
However, there's a growing need to digitize them for efficient processing.
Automated conversion methods are essential to overcome manual conversion
challenges. Existing sketch recognition methods face limitations in practical
situations, being field-specific and lacking digital conversion steps. Our
paper introduces the Flowmind2digital method and hdFlowmind dataset to address
these challenges. Flowmind2digital, utilizing neural networks and keypoint
detection, achieves a record 87.3% accuracy on our dataset, surpassing previous
methods by 11.9%. The hdFlowmind dataset, comprising 1,776 annotated flowminds
across 22 scenarios, outperforms existing datasets. Additionally, our
experiments emphasize the importance of simple graphics, enhancing accuracy by
9.3%.
- Abstract(参考訳): フローチャートとマインドマップは、フローミンド(flowmind)と呼ばれ、日々の活動において不可欠であり、手書き版はリアルタイムのコラボレーションを容易にする。
しかし、効率的な処理のためにデジタル化する必要性が増しています。
手動変換を克服するためには自動変換法が不可欠である。
既存のスケッチ認識手法では、フィールド固有であり、デジタル変換手順が欠如している。
本稿では,これらの課題に対処するため,Flowmind2digital法とhdFlowmindデータセットを提案する。
Flowmind2digitalはニューラルネットワークとキーポイント検出を利用して、データセット上で87.3%の精度を達成した。
hdFlowmindデータセットは、22のシナリオにわたる1,776のアノテートフローミンドで構成され、既存のデータセットを上回っている。
さらに,単純なグラフィックの重要性を強調し,精度を9.3%向上させた。
関連論文リスト
- Fully automated landmarking and facial segmentation on 3D photographs [0.0]
本研究の目的は,深層学習を用いた自動頭蓋計測法の開発と評価である。
10個のランドマークが1人の観察者によって2897の顔写真に手動で注釈付けされた。
ワークフローはすべてのテストケースの98.6%で成功した。
論文 参考訳(メタデータ) (2023-09-19T09:39:55Z) - Pruning Distorted Images in MNIST Handwritten Digits [0.0]
手書き文字を認識できる2段階の深層学習手法を提案する。
最初の段階では、トレーニングセット内で歪んだ桁を識別する単純なニューラルネットワークを作成します。
第2段階では、これらの識別された画像をトレーニングデータセットから除外し、フィルタデータセットを使用してモデルを再トレーニングする。
実験の結果,提案手法の有効性を実証し,テストデータセットの精度を99.5%以上とした。
論文 参考訳(メタデータ) (2023-05-26T11:44:35Z) - Deep learning-based approaches for human motion decoding in smart
walkers for rehabilitation [3.8791511769387634]
スマートウォーカーは、できるだけ早く人間の動きとニーズをデコードできなければならない。
現在の歩行者はウェアラブルや組込みセンサーの情報を用いて動きの意図を復号する。
早期の動作認識・検出問題として人間の動作復号化に対処する非接触アプローチを提案する。
論文 参考訳(メタデータ) (2023-01-13T14:29:44Z) - TempNet: Temporal Attention Towards the Detection of Animal Behaviour in
Videos [63.85815474157357]
本稿では,映像中の生物学的行動を検出するための,効率的なコンピュータビジョンと深層学習に基づく手法を提案する。
TempNetはエンコーダブリッジと残留ブロックを使用して、2段階の空間的、そして時間的、エンコーダでモデル性能を維持する。
本研究では,サブルフィッシュ (Anoplopoma fimbria) 幼虫の検出への応用を実証する。
論文 参考訳(メタデータ) (2022-11-17T23:55:12Z) - Real-time Action Recognition for Fine-Grained Actions and The Hand Wash
Dataset [0.0]
Raspberry Piのような低出力システム上で,高精度かつ効率的にリアルタイムに動作する3ストリーム融合アルゴリズムを提案する。
このアルゴリズムによって得られた結果は、UCF-101とHMDB-51データセットでベンチマークされ、それぞれ92.7%と64.9%の精度を達成した。
論文 参考訳(メタデータ) (2022-10-13T22:38:11Z) - What Stops Learning-based 3D Registration from Working in the Real
World? [53.68326201131434]
この研究は、3Dポイントのクラウド登録失敗の原因を特定し、その原因を分析し、解決策を提案する。
最終的に、これは最も実践的な3D登録ネットワーク(BPNet)に変換される。
我々のモデルは微調整をせずに実データに一般化し、商用センサで得られた見えない物体の点雲上で最大67%の精度に達する。
論文 参考訳(メタデータ) (2021-11-19T19:24:27Z) - Keypoint Message Passing for Video-based Person Re-Identification [106.41022426556776]
ビデオベースの人物再識別(re-ID)は、異なるカメラで捉えた人々のビデオスニペットをマッチングすることを目的とした、視覚監視システムにおいて重要な技術である。
既存の手法は主に畳み込みニューラルネットワーク(CNN)に基づいており、そのビルディングブロックは近隣のピクセルを一度に処理するか、あるいは3D畳み込みが時間情報のモデル化に使用される場合、人の動きによって生じるミスアライメントの問題に悩まされる。
本稿では,人間指向グラフ法を用いて,通常の畳み込みの限界を克服することを提案する。具体的には,人手指のキーポイントに位置する特徴を抽出し,時空間グラフとして接続する。
論文 参考訳(メタデータ) (2021-11-16T08:01:16Z) - Handwritten Character Recognition from Wearable Passive RFID [1.3190581566723918]
本稿では,シーケンスとビットマップ表現を融合した前処理パイプラインを提案する。
データは全部で7500文字を含む10の被験者から収集される。
提案したモデルは実験で72%の精度に達しており、この挑戦的なデータセットの精度が高いと考えられる。
論文 参考訳(メタデータ) (2020-08-06T09:45:29Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z) - Towards Reading Beyond Faces for Sparsity-Aware 4D Affect Recognition [55.15661254072032]
自動4次元表情認識(FER)のための空間認識深層ネットワークを提案する。
まず,深層学習のためのデータ制限問題に対処する新しい拡張手法を提案する。
次に、多視点での畳み込み特徴のスパース表現を計算するために、疎度対応のディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-02-08T13:09:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。