論文の概要: Linear Object Detection in Document Images using Multiple Object
Tracking
- arxiv url: http://arxiv.org/abs/2305.16968v1
- Date: Fri, 26 May 2023 14:22:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-29 14:15:16.043967
- Title: Linear Object Detection in Document Images using Multiple Object
Tracking
- Title(参考訳): 複数物体追跡による文書画像の線形物体検出
- Authors: Philippe Bernet (1), Joseph Chazalon (1), Edwin Carlinet (1),
Alexandre Bourquelot (1), Elodie Puybareau (1) ((1) EPITA Research Lab.)
- Abstract要約: 線形オブジェクトは文書構造に関する実質的な情報を伝達する。
多くのアプローチはベクトル表現を復元できるが、1994年に導入された1つのクローズドソース技術のみである。
複数オブジェクト追跡を用いた文書画像中の線形オブジェクトの正確なインスタンスセグメンテーションのためのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 58.720142291102135
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Linear objects convey substantial information about document structure, but
are challenging to detect accurately because of degradation (curved, erased) or
decoration (doubled, dashed). Many approaches can recover some vector
representation, but only one closed-source technique introduced in 1994, based
on Kalman filters (a particular case of Multiple Object Tracking algorithm),
can perform a pixel-accurate instance segmentation of linear objects and enable
to selectively remove them from the original image. We aim at re-popularizing
this approach and propose: 1. a framework for accurate instance segmentation of
linear objects in document images using Multiple Object Tracking (MOT); 2.
document image datasets and metrics which enable both vector- and pixel-based
evaluation of linear object detection; 3. performance measures of MOT
approaches against modern segment detectors; 4. performance measures of various
tracking strategies, exhibiting alternatives to the original Kalman filters
approach; and 5. an open-source implementation of a detector which can
discriminate instances of curved, erased, dashed, intersecting and/or
overlapping linear objects.
- Abstract(参考訳): 線形オブジェクトは文書構造に関する実質的な情報を提供するが、劣化(カーブ、消去)や装飾(ダブル、ダッシュ)のため、正確に検出することが難しい。
多くのアプローチはベクトル表現を復元できるが、1994年にカルマンフィルタ(特に多重オブジェクト追跡アルゴリズム)に基づいて導入された1つのクローズドソース技術のみが、線形オブジェクトのピクセル精度の高いインスタンスセグメンテーションを実行でき、元の画像からそれらを選択的に除去することができる。
このアプローチを再普及させることを目標とし、次のように提案する。
1.多重オブジェクトトラッキング(mot)を用いた文書画像中の線形オブジェクトの正確なインスタンス分割のためのフレームワーク
2. ベクトルおよび画素に基づく線形物体検出の評価を可能にする文書画像データセット及びメトリクス
3.近代セグメント検出器に対するMOTアプローチの性能測定
4. 従来のカルマンフィルタの代替策として, 各種追跡戦略の性能対策
5. 曲線、消去、破砕、交差及び/又は重なり合う線形オブジェクトのインスタンスを識別できる検出器のオープンソース実装。
関連論文リスト
- Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - Image Segmentation-based Unsupervised Multiple Objects Discovery [1.7674345486888503]
教師なしオブジェクト発見は、イメージ内のオブジェクトをローカライズすることを目的としている。
我々は,複数のオブジェクトの発見に対して,完全に教師なしのボトムアップアプローチを提案する。
我々は、教師なしクラス非依存オブジェクト検出と教師なしイメージセグメンテーションの両方に対して、最先端の結果を提供する。
論文 参考訳(メタデータ) (2022-12-20T09:48:24Z) - Deformable One-Dimensional Object Detection for Routing and Manipulation [8.860083597706502]
本稿では, 交差や閉塞を扱える変形可能な一次元物体の検出手法を提案する。
本アルゴリズムは, 変形可能な物体を含む画像を取得し, 受動球面継手に接続された固定長円筒セグメントの連鎖を出力する。
実験と実験により, 様々な複雑な条件下で変形可能な一次元物体を正確に検出できることが判明した。
論文 参考訳(メタデータ) (2022-01-18T07:19:17Z) - Ensembling object detectors for image and video data analysis [98.26061123111647]
本稿では,複数の物体検出器の出力をアンサンブルすることで,画像データ上の境界ボックスの検出性能と精度を向上させる手法を提案する。
本研究では,2段階追跡に基づく検出精度向上手法を提案することで,映像データに拡張する。
論文 参考訳(メタデータ) (2021-02-09T12:38:16Z) - FMODetect: Robust Detection and Trajectory Estimation of Fast Moving
Objects [110.29738581961955]
高速移動物体の検出と軌道推定のための最初の学習ベースアプローチを提案する。
提案手法は, 高速移動物体を軌道への切り離された距離関数として検出する。
シャープな外観推定のために,エネルギー最小化に基づくデブロワーリングを提案する。
論文 参考訳(メタデータ) (2020-12-15T11:05:34Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - End-to-End Multi-Object Tracking with Global Response Map [23.755882375664875]
画像シーケンス/映像を入力とし、学習対象の位置と追跡対象を直接出力する、完全にエンドツーエンドのアプローチを提案する。
具体的には,提案した多目的表現戦略により,グローバル応答マップをフレーム上で正確に生成することができる。
MOT16 と MOT17 のベンチマークによる実験結果から,提案したオンライントラッカーは,いくつかのトラッキング指標において最先端の性能を達成した。
論文 参考訳(メタデータ) (2020-07-13T12:30:49Z) - Black-box Explanation of Object Detectors via Saliency Maps [66.745167677293]
対象検出器の予測のための視覚的説明を生成するD-RISEを提案する。
本稿では, YOLOv3などの1段検出器やFaster-RCNNのような2段検出器など, 異なる対象検出器に容易にD-RISEを適用可能であることを示す。
論文 参考訳(メタデータ) (2020-06-05T02:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。