Fugu-MT 論文翻訳(概要): Real-time Object Detection: YOLOv1 Re-Implementation in PyTorch

論文の概要: Real-time Object Detection: YOLOv1 Re-Implementation in PyTorch

arxiv url: http://arxiv.org/abs/2305.17786v1
Date: Sun, 28 May 2023 18:17:31 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-30 16:36:44.576813
Title: Real-time Object Detection: YOLOv1 Re-Implementation in PyTorch
Title（参考訳）: リアルタイムオブジェクト検出:PyTorchにおけるYOLOv1再実装
Authors: Michael Shenoda
Abstract要約: 私はPyTorchフレームワークを使って実装するためにYOLO v1アーキテクチャを選択しました。結果を改善するために、元のアーキテクチャを変更するために、さまざまなテクニックを試しました。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Real-time object detection is a crucial problem to solve when in comes to computer vision systems that needs to make appropriate decision based on detection in a timely manner. I have chosen the YOLO v1 architecture to implement it using PyTorch framework, with goal to familiarize with entire object detection pipeline I attempted different techniques to modify the original architecture to improve the results. Finally, I compare the metrics of my implementation to the original.
Abstract（参考訳）: リアルタイムオブジェクト検出は、検出に基づく適切な判断をタイムリーに行う必要があるコンピュータビジョンシステムにおいて、解決すべき重要な問題である。私は、PyTorchフレームワークを使って実装するためにYOLO v1アーキテクチャを選択しました。最後に、私の実装のメトリクスとオリジナルのメトリクスを比較します。

関連論文リスト

Accelerating Object Detection with YOLOv4 for Real-Time Applications [0.276240219662896]
畳み込みニューラルネットワーク(CNN)は、ほとんどの問題に対して画像コンテンツとコンピュータビジョンアプローチを認識する強力なツールとして登場した。本稿では、畳み込みニューラルネットワーク(CNN)のようなディープラーニングとオブジェクト検出フレームワークの簡単な紹介を紹介する。
論文参考訳（メタデータ） (2024-10-17T17:44:57Z)
The Impact of Different Backbone Architecture on Autonomous Vehicle Dataset [120.08736654413637]
バックボーンアーキテクチャによって抽出された特徴の質は、全体的な検出性能に大きな影響を与える可能性がある。本研究は,KITTI,NuScenes,BDDの3つの自律走行車データセットを評価し,対象検出タスクにおける異なるバックボーンアーキテクチャの性能を比較した。
論文参考訳（メタデータ） (2023-09-15T17:32:15Z)
YOLOPose V2: Understanding and Improving Transformer-based 6D Pose Estimation [36.067414358144816]
YOLOPoseはトランスフォーマーベースの多目的6Dポーズ推定法である。キーポイントから向きを予測するために,学習可能な向き推定モジュールを用いる。提案手法はリアルタイムアプリケーションに適した手法であり,最先端の手法に匹敵する結果が得られる。
論文参考訳（メタデータ） (2023-07-21T12:53:54Z)
3D Video Object Detection with Learnable Object-Centric Global Optimization [65.68977894460222]
対応性に基づく最適化は3次元シーン再構成の基盤となるが、3次元ビデオオブジェクト検出では研究されていない。オブジェクト中心の時間対応学習と特徴量付きオブジェクトバンドル調整を備えた、エンドツーエンドで最適化可能なオブジェクト検出器であるBA-Detを提案する。
論文参考訳（メタデータ） (2023-03-27T17:39:39Z)
Fast and Accurate Object Detection on Asymmetrical Receptive Field [0.0]
本稿では,物体検出精度を受容場の変化の観点から改善する手法を提案する。 YOLOv5の頭部の構造は、非対称なプール層を付加することによって改変される。本稿では, 従来の YOLOv5 モデルと比較し, いくつかのパラメータから解析する。
論文参考訳（メタデータ） (2023-03-15T23:59:18Z)
Siamese Network Training Using Sampled Triplets and Image Transformation [0.0]
この研究で使われた装置は、2つの熱カメラを使って水面上の物体を検出する。障害物衝突を自律的に回避するには,物体をリアルタイムで追跡する必要がある。コンピュータビジョン(CV)のための機械学習(ML)アプローチは、Pythonのハイレベルプログラミング環境として使用された。
論文参考訳（メタデータ） (2021-06-13T14:47:52Z)
Analysis of voxel-based 3D object detection methods efficiency for real-time embedded systems [93.73198973454944]
本稿では, ボクセルをベースとした2つの3次元物体検出手法について述べる。実験の結果,これらの手法は入力点雲が遠距離にあるため,遠距離の小さな物体を検出できないことが確認できた。この結果から,既存手法の計算のかなりの部分は,検出に寄与しないシーンの位置に着目していることが示唆された。
論文参考訳（メタデータ） (2021-05-21T12:40:59Z)
Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文参考訳（メタデータ） (2021-04-16T21:35:08Z)
Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文参考訳（メタデータ） (2020-11-17T09:39:42Z)
RepPoints V2: Verification Meets Regression for Object Detection [65.120827759348]
本稿ではRepPointsのローカライズ予測に検証タスクを導入する。 RepPoints v2は、オリジナルのRepPointsよりも約2.0mAPの一貫性のある改善を提供する。提案手法は、インスタンスセグメンテーションのようなアプリケーションと同様に、他のオブジェクト検出フレームワークをより高めることができることを示す。
論文参考訳（メタデータ） (2020-07-16T17:57:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。