論文の概要: RTHDet: Rotate Table Area and Head Detection in images
- arxiv url: http://arxiv.org/abs/2402.03315v1
- Date: Sun, 31 Dec 2023 07:34:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-11 15:52:09.533863
- Title: RTHDet: Rotate Table Area and Head Detection in images
- Title(参考訳): RTHDet:回転テーブル領域と画像の頭部検出
- Authors: Wenxing Hu, Minglei Tong
- Abstract要約: 本稿では,テーブル領域の検出と回転シナリオにおけるヘッドテール部分のローカライズという新しいタスクを提案する。
提案手法は,回転テーブルの検出におけるデータセットの不足に対処する。
新しい計量「R360 AP」は回転した領域を検出し、頭部尾部を局在させる精度を測定する。
- 参考スコア(独自算出の注目度): 0.6065331868792098
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional models focus on horizontal table detection but struggle in
rotating contexts, limiting progress in table recognition. This paper
introduces a new task: detecting table regions and localizing head-tail parts
in rotation scenarios. We propose corresponding datasets, evaluation metrics,
and methods. Our novel method, 'Adaptively Bounded Rotation,' addresses dataset
scarcity in detecting rotated tables and their head-tail parts. We produced
'TRR360D,' a dataset incorporating semantic information of table head and tail,
based on 'ICDAR2019MTD.' A new metric, 'R360 AP,' measures precision in
detecting rotated regions and localizing head-tail parts. Our baseline, the
high-speed and accurate 'RTMDet-S,' is chosen after extensive review and
testing. We introduce 'RTHDet,' enhancing the baseline with a 'r360' rotated
rectangle angle representation and an 'Angle Loss' branch, improving head-tail
localization. By applying transfer learning and adaptive boundary rotation
augmentation, RTHDet's AP50 (T<90) improved from 23.7% to 88.7% compared to the
baseline. This demonstrates RTHDet's effectiveness in detecting rotating table
regions and accurately localizing head and tail parts.RTHDet is integrated into
the widely-used open-source MMRotate toolkit:
https://github.com/open-mmlab/mmrotate/tree/dev-1.x/projects/RR360.
- Abstract(参考訳): 伝統的なモデルは水平テーブルの検出に重点を置いているが、テーブル認識の進歩を制限する回転コンテキストに苦戦している。
本稿では,テーブル領域の検出と回転シナリオにおけるヘッドテール部分のローカライズを行う。
本稿では,対応するデータセット,評価指標,方法を提案する。
提案手法は,回転するテーブルとそのヘッドテール部分を検出する際のデータセット不足に対処する。
我々は「ICDAR2019MTD」に基づくテーブルヘッドとテールの意味情報を組み込んだデータセット「TRR360D」を作成した。
新しい測定基準「r360 ap」は、回転領域の検出とヘッドテール部分のローカライズにおける精度を測定する。
我々のベースラインである高速かつ正確な「RTMDet-S」は、広範囲なレビューとテストの後に選択される。
本稿では,「RTHDet」を導入し,r360回転長方形角表現と「アングルロス」分岐でベースラインを強化し,ヘッドテールのローカライゼーションを改善した。
転送学習と適応境界回転拡張を適用することで、RTHDetのAP50(T<90)はベースラインに比べて23.7%から88.7%に向上した。
これはRTHDetが回転テーブル領域を検出し、頭部と尾部の正確なローカライズに有効であることを示し、RTHDetは広く使われているオープンソースのMMRotateツールキットに統合されている。
関連論文リスト
- RIDE: Boosting 3D Object Detection for LiDAR Point Clouds via Rotation-Invariant Analysis [15.42293045246587]
RIDEは3D LiDAR-point-based object DEtectorの回転不変性の先駆的な探索である。
回転に敏感ではあるが幾何をよく保持できる2機能抽出器と、幾何情報をある程度失うが回転に頑健な回転不変特徴を抽出する。
我々のRIDEは互換性があり、既存の1段と2段の3D検出器に簡単に接続でき、検出性能と回転ロバスト性の両方を高めることができる。
論文 参考訳(メタデータ) (2024-08-28T08:53:33Z) - V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - CRIN: Rotation-Invariant Point Cloud Analysis and Rotation Estimation
via Centrifugal Reference Frame [60.24797081117877]
CRIN,すなわち遠心回転不変ネットワークを提案する。
CRINは点の座標を直接入力として取り、局所点を回転不変表現に変換する。
点に基づく3次元回転の連続分布を導入する。
論文 参考訳(メタデータ) (2023-03-06T13:14:10Z) - T360RRD: A dataset for 360 degree rotated rectangular box table
detection [1.0952758707992685]
本稿では,回転する画像テーブル検出データセットを構築する方法を提案する。
トレーニングセットは600の回転画像と977の注釈付きインスタンスを含み、テストセットは240の回転画像と499の注釈付きインスタンスを含む。
TRR360D回転テーブル検出データセットは、開始点とアノテーションの方向を制約することで作成される。
論文 参考訳(メタデータ) (2023-03-03T12:47:30Z) - SPE-Net: Boosting Point Cloud Analysis via Rotation Robustness
Enhancement [118.20816888815658]
SPE-Netという名前の3Dポイントクラウドアプリケーションに適した新しいディープアーキテクチャを提案する。
埋め込みSelective Position variant' の手順は、入力の根底にある回転条件に効果的に対応できる注意機構に依存している。
SPE-Netと関連する仮説の利点を4つのベンチマークで示し、SOTA法よりも回転試験データと回転試験データの両方に明らかな改善点を示した。
論文 参考訳(メタデータ) (2022-11-15T15:59:09Z) - ReF -- Rotation Equivariant Features for Local Feature Matching [30.459559206664427]
本稿では,モデルアーキテクチャ自体に偏りを生じさせ,回転特異な特徴を生じさせる代替的補完的手法を提案する。
我々は, ステアブルCNNの高性能, 回転特異的カバレッジを全回転角に拡張できることを実証した。
本稿では,アンサンブル,ロバストな推定,ネットワークアーキテクチャのバリエーション,回転前処理の効果について詳細に分析する。
論文 参考訳(メタデータ) (2022-03-10T07:36:09Z) - Pyramid R-CNN: Towards Better Performance and Adaptability for 3D Object
Detection [89.66162518035144]
点雲から2段階の3Dオブジェクトを検出するための柔軟で高性能なフレームワークであるPraamid R-CNNを提案する。
興味の疎い点から特徴を適応的に学習するために,ピラミッドRoIヘッドという新しい第2段モジュールを提案する。
我々のピラミッドRoIヘッドはスパースかつ不均衡な状況に対して堅牢であり、検出性能を継続的に向上するために様々な3Dバックボーンに適用することができる。
論文 参考訳(メタデータ) (2021-09-06T14:17:51Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。