論文の概要: Anomaly Triplet-Net: Progress Recognition Model Using Deep Metric Learning Considering Occlusion for Manual Assembly Work
- arxiv url: http://arxiv.org/abs/2501.03533v1
- Date: Tue, 07 Jan 2025 05:12:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-08 15:49:36.673441
- Title: Anomaly Triplet-Net: Progress Recognition Model Using Deep Metric Learning Considering Occlusion for Manual Assembly Work
- Title(参考訳): Anomaly Triplet-Net:手作業における排他性を考慮したDeep Metric Learningを用いた進捗認識モデル
- Authors: Takumi Kitsukawa, Kazuma Miura, Shigeki Yumoto, Sarthak Pathak, Alessandro Moro, Kazunori Umeda,
- Abstract要約: 工場における製品組み立て過程を可視化するために, 閉塞を考慮した進捗認識手法を提案する。
深層学習に基づく物体検出方法を用いて、工場に設置された固定点カメラから取得した画像から目標組立物を検出する。
収穫画像上での深度メートル法学習に基づく分類手法を用いて、製品組み立て作業の進捗状況を大まかな進捗段階として推定する。
- 参考スコア(独自算出の注目度): 38.07444864492428
- License:
- Abstract: In this paper, a progress recognition method consider occlusion using deep metric learning is proposed to visualize the product assembly process in a factory. First, the target assembly product is detected from images acquired from a fixed-point camera installed in the factory using a deep learning-based object detection method. Next, the detection area is cropped from the image. Finally, by using a classification method based on deep metric learning on the cropped image, the progress of the product assembly work is estimated as a rough progress step. As a specific progress estimation model, we propose an Anomaly Triplet-Net that adds anomaly samples to Triplet Loss for progress estimation considering occlusion. In experiments, an 82.9% success rate is achieved for the progress estimation method using Anomaly Triplet-Net. We also experimented with the practicality of the sequence of detection, cropping, and progression estimation, and confirmed the effectiveness of the overall system.
- Abstract(参考訳): 本稿では,工場における製品組み立て過程を可視化するために,深層学習を用いたオクルージョンを考慮したプログレッシブ認識手法を提案する。
まず、深層学習に基づく物体検出方法を用いて、工場に設置された固定点カメラから取得した画像から目標組立物を検出する。
次に、画像から検出領域を抽出する。
最後に、収穫画像上での深度メートル法学習に基づく分類手法を用いて、製品組み立て作業の進捗状況を大まかな進捗段階として推定する。
特定の進捗推定モデルとして,オクルージョンを考慮した進捗推定のために,異常サンプルをトリプルトロスに追加する異常トリプルトネットを提案する。
実験では,Anomaly Triplet-Netを用いた進捗推定法において,82.9%の成功率を達成した。
また, 検出, 収穫, 進行予測の行程の実用性についても検討し, システム全体の有効性を確認した。
関連論文リスト
- Mismatched: Evaluating the Limits of Image Matching Approaches and Benchmarks [9.388897214344572]
2次元画像からの3次元3次元再構成はコンピュータビジョンにおける活発な研究分野である。
伝統的にこの作業にはパラメトリック技術が用いられてきた。
近年の進歩は、学習ベースの方法にシフトしている。
論文 参考訳(メタデータ) (2024-08-29T11:16:34Z) - RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering
Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。
本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文 参考訳(メタデータ) (2023-12-19T03:39:56Z) - Improving Online Lane Graph Extraction by Object-Lane Clustering [106.71926896061686]
本稿では,局所レーングラフの推定精度を向上させるために,アーキテクチャと損失の定式化を提案する。
提案手法は,中心線をクラスタ中心とすることで,対象を中心線に割り当てることを学ぶ。
提案手法は既存の3次元オブジェクト検出手法の出力を用いて,大幅な性能向上を実現することができることを示す。
論文 参考訳(メタデータ) (2023-07-20T15:21:28Z) - Continual Learning Approaches for Anomaly Detection [6.014777261874645]
本研究では,連続学習環境における異常検出のためのフレームワークとして,圧縮再生を行う新しい手法を提案する。
提案手法は,我々の知る限り,連続学習環境において初めて研究されるスーパーレゾリューションモデルを用いて,原画像のスケールと圧縮を行う。
提案手法を検証するために,画素ベースの異常のある実世界の画像データセットを用いて,連続学習の文脈における異常検出のための信頼性の高いベンチマークを提供する。
論文 参考訳(メタデータ) (2022-12-21T17:08:58Z) - Data-Driven Interpolation for Super-Scarce X-Ray Computed Tomography [1.3535770763481902]
浅層ニューラルネットワークを訓練し、隣接する2つの取得を中間角度で推定された測定値に組み合わせる。
これにより、標準的な方法で再構成できる拡張された測定シーケンスが得られる。
バイオメディカルデータセットを用いた2次元および3次元イメージングの結果を得た。
論文 参考訳(メタデータ) (2022-05-16T15:42:41Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - Real-time Human Action Recognition Using Locally Aggregated
Kinematic-Guided Skeletonlet and Supervised Hashing-by-Analysis Model [30.435850177921086]
3次元動作認識には, 非常に複雑な調音, 大量のノイズ, 実装効率の低下という3つの問題がある。
本研究では,局所的に集約されたキネマティック誘導骨格 (LAKS) と教師付きハッシュ・バイ・アナリシス (SHA) モデルを組み合わせたリアルタイム3次元動作認識フレームワークを提案する。
MSRAction3D, UTKinectAction3DおよびFlorence3DActionデータセットの実験結果から, 提案手法は認識精度と実装効率の両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-05-24T14:46:40Z) - IAFA: Instance-aware Feature Aggregation for 3D Object Detection from a
Single Image [37.83574424518901]
単一の画像からの3Dオブジェクト検出は、自動運転において重要なタスクです。
本稿では,3次元物体検出の精度向上のために有用な情報を集約するインスタンス認識手法を提案する。
論文 参考訳(メタデータ) (2021-03-05T05:47:52Z) - 3D Registration for Self-Occluded Objects in Context [66.41922513553367]
このシナリオを効果的に処理できる最初のディープラーニングフレームワークを紹介します。
提案手法はインスタンスセグメンテーションモジュールとポーズ推定モジュールから構成される。
これにより、高価な反復手順を必要とせず、ワンショットで3D登録を行うことができます。
論文 参考訳(メタデータ) (2020-11-23T08:05:28Z) - Deep Keypoint-Based Camera Pose Estimation with Geometric Constraints [80.60538408386016]
連続するフレームから相対的なカメラのポーズを推定することは、視覚計測の基本的な問題である。
本稿では,検出,特徴抽出,マッチング,外乱除去のための学習可能なモジュールで構成されるエンドツーエンドのトレーニング可能なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-29T21:41:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。