論文の概要: T360RRD: A dataset for 360 degree rotated rectangular box table
detection
- arxiv url: http://arxiv.org/abs/2303.01894v2
- Date: Mon, 6 Mar 2023 01:49:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-07 12:09:18.596822
- Title: T360RRD: A dataset for 360 degree rotated rectangular box table
detection
- Title(参考訳): t360rrd:360度回転矩形テーブル検出用データセット
- Authors: Wenxing Hu, Minglei Tong
- Abstract要約: 本稿では,回転する画像テーブル検出データセットを構築する方法を提案する。
トレーニングセットは600の回転画像と977の注釈付きインスタンスを含み、テストセットは240の回転画像と499の注釈付きインスタンスを含む。
TRR360D回転テーブル検出データセットは、開始点とアノテーションの方向を制約することで作成される。
- 参考スコア(独自算出の注目度): 1.0952758707992685
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To address the problem of scarcity and high annotation costs of rotated image
table detection datasets, this paper proposes a method for building a rotated
image table detection dataset. Based on the ICDAR2019MTD modern table detection
dataset, we refer to the annotation format of the DOTA dataset to create the
TRR360D rotated table detection dataset. The training set contains 600 rotated
images and 977 annotated instances, and the test set contains 240 rotated
images and 499 annotated instances. The AP50(T<90) evaluation metric is
defined, and this dataset is available for future researchers to study rotated
table detection algorithms and promote the development of table detection
technology. The TRR360D rotated table detection dataset was created by
constraining the starting point and annotation direction, and is publicly
available at https://github.com/vansin/TRR360D.
- Abstract(参考訳): 本稿では,回転画像テーブル検出データセットの不足とアノテーションコストの問題に対処するため,回転画像テーブル検出データセットを構築する手法を提案する。
ICDAR2019MTDのテーブル検出データセットに基づいて、DOTAデータセットのアノテーションフォーマットを参照して、TRR360D回転テーブル検出データセットを作成する。
トレーニングセットは600の回転画像と977の注釈付きインスタンスを含み、テストセットは240の回転画像と499の注釈付きインスタンスを含む。
AP50(T<90)評価基準を定義し、このデータセットは将来の研究者がテーブル検出アルゴリズムの研究とテーブル検出技術の開発を促進するために利用できる。
TRR360D回転テーブル検出データセットは開始点とアノテーションの方向を制約することで作成され、https://github.com/vansin/TRR360Dで公開されている。
関連論文リスト
- RTHDet: Rotate Table Area and Head Detection in images [0.6065331868792098]
本稿では,テーブル領域の検出と回転シナリオにおけるヘッドテール部分のローカライズという新しいタスクを提案する。
提案手法は,回転テーブルの検出におけるデータセットの不足に対処する。
新しい計量「R360 AP」は回転した領域を検出し、頭部尾部を局在させる精度を測定する。
論文 参考訳(メタデータ) (2023-12-31T07:34:31Z) - V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - MMRotate: A Rotated Object Detection Benchmark using Pytorch [68.3869241353113]
我々はMMRotateというオープンソースのツールボックスを提案し、オブジェクトの回転検出のためのコヒーレントなアルゴリズムフレームワークを提供する。
MMRotateは18の最先端アルゴリズムを実装し、最も頻繁に使用される3つの角度定義法をサポートしている。
また、多数のトレーニングされたモデルと詳細なベンチマークを提供し、回転したオブジェクト検出のパフォーマンスに関する洞察を与えています。
論文 参考訳(メタデータ) (2022-04-28T07:31:00Z) - TNCR: Table Net Detection and Classification Dataset [62.997667081978825]
TNCRデータセットは、スキャンされた文書画像のテーブル検出と5つのクラスに分類される。
我々は、テーブル検出のための最先端のディープラーニングベースの手法を実装し、いくつかの強力なベースラインを構築した。
我々は、テーブルの検出、分類、構造認識に対するより深い学習アプローチを促進するために、TNCRをオープンソースにしました。
論文 参考訳(メタデータ) (2021-06-19T10:48:58Z) - Rotation invariant CNN using scattering transform for image
classification [0.0]
入力中の回転に不変な畳み込み予測器を提案する。
このアーキテクチャは、角度アノテートされたデータなしで角度方向を予測することができる。
直立およびランダムに回転したサンプルを用いて,実験結果の検証を行った。
論文 参考訳(メタデータ) (2021-05-21T07:36:34Z) - OSKDet: Towards Orientation-sensitive Keypoint Localization for Rotated
Object Detection [0.0]
オリエンテーション感度キーポイントに基づく回転検出器OSKDetを提案する。
ターゲットを特徴付けるキーポイントのセットを採用し、roi上のキーポイントヒートマップを予測して回転したターゲットを形成する。
DOTAは77.81%、HRSC2016は89.91%、UCAS-AODは97.18%である。
論文 参考訳(メタデータ) (2021-04-18T03:40:52Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z) - A Fixation-based 360{\deg} Benchmark Dataset for Salient Object
Detection [21.314578493964333]
パノラマコンテンツ中の固定予測(FP)は、仮想現実(VR)アプリケーションの普及傾向とともに広く研究されている。
静止物体検出(SOD)は、実際のシーンを表すデータセットが欠如しているため、360度画像ではめったに探索されていない。
論文 参考訳(メタデータ) (2020-01-22T11:16:39Z) - Multi-View Photometric Stereo: A Robust Solution and Benchmark Dataset
for Spatially Varying Isotropic Materials [65.95928593628128]
多視点光度ステレオ技術を用いて3次元形状と空間的に異なる反射率の両方をキャプチャする手法を提案する。
我々のアルゴリズムは、遠近点光源と遠近点光源に適している。
論文 参考訳(メタデータ) (2020-01-18T12:26:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。