論文の概要: ALINA: Advanced Line Identification and Notation Algorithm
- arxiv url: http://arxiv.org/abs/2406.08775v1
- Date: Thu, 13 Jun 2024 03:10:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-14 21:28:25.788154
- Title: ALINA: Advanced Line Identification and Notation Algorithm
- Title(参考訳): ALINA:高度な線同定と表記アルゴリズム
- Authors: Mohammed Abdul Hafeez Khan, Parth Ganeriwala, Siddhartha Bhattacharyya, Natasha Neogi, Raja Muthalagu,
- Abstract要約: クラウドソーシングのような従来のラベリング手法は、コスト、データのプライバシ、時間、大規模なデータセットの潜在的なエラーのために禁止されている。
本稿では,タクシーウェイデータセットのラベル付けに使用できる新しいアノテーションフレームワークであるAdvanced Line Identification and Notation Algorithm (ALINA)を提案する。
- 参考スコア(独自算出の注目度): 4.12089570007199
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Labels are the cornerstone of supervised machine learning algorithms. Most visual recognition methods are fully supervised, using bounding boxes or pixel-wise segmentations for object localization. Traditional labeling methods, such as crowd-sourcing, are prohibitive due to cost, data privacy, amount of time, and potential errors on large datasets. To address these issues, we propose a novel annotation framework, Advanced Line Identification and Notation Algorithm (ALINA), which can be used for labeling taxiway datasets that consist of different camera perspectives and variable weather attributes (sunny and cloudy). Additionally, the CIRCular threshoLd pixEl Discovery And Traversal (CIRCLEDAT) algorithm has been proposed, which is an integral step in determining the pixels corresponding to taxiway line markings. Once the pixels are identified, ALINA generates corresponding pixel coordinate annotations on the frame. Using this approach, 60,249 frames from the taxiway dataset, AssistTaxi have been labeled. To evaluate the performance, a context-based edge map (CBEM) set was generated manually based on edge features and connectivity. The detection rate after testing the annotated labels with the CBEM set was recorded as 98.45%, attesting its dependability and effectiveness.
- Abstract(参考訳): ラベルは教師付き機械学習アルゴリズムの基礎である。
ほとんどの視覚認識手法は、オブジェクトローカライゼーションのためのバウンディングボックスやピクセルワイドセグメンテーションを使用して、完全に教師される。
クラウドソーシングのような従来のラベリング手法は、コスト、データのプライバシ、時間、大規模なデータセットの潜在的なエラーのために禁止されている。
これらの問題に対処するために、異なるカメラ視点と様々な気象特性(正気と曇り)からなるタクシーウェイデータセットのラベル付けに使用できる、新しいアノテーションフレームワークであるAdvanced Line Identification and Notation Algorithm (ALINA)を提案する。
さらに、CIRCLEDAT (CIRCLEDAT) アルゴリズムが提案されている。
画素が特定されると、ALINAはフレーム上の対応する画素座標アノテーションを生成する。
このアプローチを使用して、タクシーウェイデータセットから60,249フレームのAssistTaxiがラベル付けされている。
性能を評価するため、エッジの特徴と接続性に基づいてコンテキストベースのエッジマップ(CBEM)セットを手動で生成した。
CBEMセットでアノテートされたラベルのテスト後の検出率は98.45%と記録され、信頼性と有効性が確認された。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Active Label Correction for Semantic Segmentation with Foundation Models [34.0733215363568]
本稿では,画素の擬似ラベルを補正する補正クエリの設計に基づく,アクティブラベル補正(ALC)の有効なフレームワークを提案する。
提案手法は, (i) 擬似ラベルを用いた補正クエリのアノテータフレンドリな設計, (ii) スーパーピクセルに基づくラベル展開を先取りする取得関数の2つの重要な手法からなる。
PASCAL,Cityscapes,Kvasir-SEGデータセットの実験結果から,ALCフレームワークの有効性が示された。
論文 参考訳(メタデータ) (2024-03-16T06:10:22Z) - Semi-supervised segmentation of land cover images using nonlinear
canonical correlation analysis with multiple features and t-SNE [1.7000283696243563]
イメージセグメンテーションはクラスタリングタスクであり、各ピクセルにクラスタラベルが割り当てられる。
本研究では,少数のピクセルのみをラベル付けすることで,半教師付きセグメンテーション手法を提案する。
提案した半教師付きRBF-CCAアルゴリズムは、リモートセンシングされた複数のマルチスペクトル画像に実装されている。
論文 参考訳(メタデータ) (2024-01-22T17:56:07Z) - PNT-Edge: Towards Robust Edge Detection with Noisy Labels by Learning
Pixel-level Noise Transitions [119.17602768128806]
特に大規模なデータセットでは、エッジの正確なラベル付けは難しい。
本稿では,ラベル破壊過程をモデル化するために,Pixelレベルのノイズ遷移を学習することを提案する。
論文 参考訳(メタデータ) (2023-07-26T09:45:17Z) - Unified Mask Embedding and Correspondence Learning for Self-Supervised
Video Segmentation [76.40565872257709]
我々は、局所的な識別的特徴学習のためのフレーム間密度対応を同時にモデル化する統合フレームワークを開発する。
ラベルなしビデオから直接マスク誘導シーケンシャルセグメンテーションを実行することができる。
我々のアルゴリズムは、2つの標準ベンチマーク(DAVIS17とYouTube-VOS)に最先端をセットする。
論文 参考訳(メタデータ) (2023-03-17T16:23:36Z) - Object Tracking and Geo-localization from Street Images [4.5958644027273685]
本稿では,低フレームレートのストリートビデオから交通標識を検出・位置情報化するフレームワークを提案する。
提案システムは、カメラに対する各符号の位置オフセットを予測するRetinaNet(GPS-RetinaNet)の修正版を用いている。
提案したデータセットは、幅広い道路から収集された多様な環境群をカバーする。
論文 参考訳(メタデータ) (2021-07-13T17:32:04Z) - Group-aware Label Transfer for Domain Adaptive Person Re-identification [179.816105255584]
Unsupervised Adaptive Domain (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインデータセットで訓練されたモデルを、さらなるアノテーションなしでターゲットドメインデータセットに適応することを目的としている。
最も成功したUDA-ReIDアプローチは、クラスタリングに基づく擬似ラベル予測と表現学習を組み合わせて、2つのステップを交互に実行する。
疑似ラベル予測と表現学習のオンラインインタラクションと相互促進を可能にするグループ認識ラベル転送(GLT)アルゴリズムを提案します。
論文 参考訳(メタデータ) (2021-03-23T07:57:39Z) - Uncertainty-based method for improving poorly labeled segmentation
datasets [0.0]
ディープ畳み込みニューラルネットワーク(DCNN)は、完全にランダムなラベルを記憶することも知られている。
信頼できないピクセルレベルのアノテーションの集合を用いて,バイナリセグメンテーションDCNNを訓練するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-16T08:37:19Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - Automatic Signboard Detection and Localization in Densely Populated
Developing Cities [0.0]
自然シーン画像における看板検出は, エラーのない情報検索における最優先課題である。
本稿では,看板を自動的に検出し,そのような都市に適した新しい物体検出手法を提案する。
提案手法では,符号板を正確に検出できる(背景の形状や色が多様であっても平均精度は0.90 mAP)。
論文 参考訳(メタデータ) (2020-03-04T08:04:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。