論文の概要: YOLO-based Object Detection in Industry 4.0 Fischertechnik Model
Environment
- arxiv url: http://arxiv.org/abs/2301.12827v1
- Date: Mon, 30 Jan 2023 12:29:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 15:00:13.698141
- Title: YOLO-based Object Detection in Industry 4.0 Fischertechnik Model
Environment
- Title(参考訳): 工業4.0 フィッシャーテクニクモデル環境におけるYOLOに基づく物体検出
- Authors: Slavomira Schneidereit, Ashkan Mansouri Yarahmadi, Toni Schneidereit,
Michael Breu{\ss}, Marc Gebauer
- Abstract要約: 本稿では,Fischer 業界 4.0 アプリケーション間のプロセスフローを監視する YOLO アーキテクチャの適合性について概説する。
実世界の工場環境をシミュレートするため、さまざまな歪みを付加したリッチデータセットを作成し、画像品質を高度に向上し、場合によっては劣化させる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we extensively explore the suitability of YOLO architectures to
monitor the process flow across a Fischertechnik industry 4.0 application.
Specifically, different YOLO architectures in terms of size and complexity
design along with different prior-shapes assignment strategies are adopted. To
simulate the real world factory environment, we prepared a rich dataset
augmented with different distortions that highly enhance and in some cases
degrade our image qualities. The degradation is performed to account for
environmental variations and enhancements opt to compensate the color
correlations that we face while preparing our dataset. The analysis of our
conducted experiments shows the effectiveness of the presented approach
evaluated using different measures along with the training and validation
strategies that we tailored to tackle the unavoidable color correlations that
the problem at hand inherits by nature.
- Abstract(参考訳): 本稿では,Fischertechnik 業界 4.0 アプリケーション間のプロセスフローを監視する YOLO アーキテクチャの適合性について概説する。
具体的には、サイズと複雑性設計の点で異なるYOLOアーキテクチャと、異なる事前割り当て戦略を採用する。
実世界の工場環境をシミュレートするため、さまざまな歪みを付加したリッチデータセットを作成し、画像品質を高度に向上し、場合によっては劣化させる。
劣化は環境の変化を考慮し、データセットの準備中に直面する色相関を補うために行われる。
実験結果から,提案手法の有効性と,課題が自然に受け継がれている不可避な色彩相関に対処するために調整した訓練・検証戦略が示唆された。
関連論文リスト
- ObjectCompose: Evaluating Resilience of Vision-Based Models on
Object-to-Background Compositional Changes [69.28123489510172]
本研究では,視覚モデルによる多様な背景背景環境に対するレジリエンスを評価する。
我々は、画像から画像への変換、画像から画像への変換、および画像から画像への変換モデルの生成機能を利用して、オブジェクトから背景への変換を自動的に生成する。
論文 参考訳(メタデータ) (2024-03-07T17:48:48Z) - Exploiting Multimodal Synthetic Data for Egocentric Human-Object
Interaction Detection in an Industrial Scenario [14.188006024550257]
EgoISM-HOIは,手や物体のアノテーションが豊富な産業環境下で合成されたEHOI画像からなる,新しいマルチモーダルデータセットである。
本研究は,提案手法を事前学習するために合成データを活用することにより,実世界のデータでテストした場合の性能が著しく向上することを示す。
この分野での研究を支援するため、私たちはデータセット、ソースコード、事前トレーニングされたモデルをhttps://iplab.dmi.unict.it/egoism-hoi.comで公開しています。
論文 参考訳(メタデータ) (2023-06-21T09:56:55Z) - Learning World Models with Identifiable Factorization [39.767120163665574]
我々は、遅延状態変数の4つの異なるカテゴリをモデル化するために、IFactorを提案する。
我々の分析は、これらの潜伏変数のブロックワイド識別性を確立する。
本稿では,ブロックを識別して世界モデルを学習するための実践的アプローチを提案する。
論文 参考訳(メタデータ) (2023-06-11T02:25:15Z) - Adaptive Contextual Perception: How to Generalize to New Backgrounds and
Ambiguous Objects [75.15563723169234]
本研究では,視覚モデルが分布外一般化の文脈をどのように適応的に利用するかを検討する。
1つの設定で優れているモデルは、もう1つの設定で苦労する傾向があります。
生物学的視覚の一般化能力を再現するためには、コンピュータビジョンモデルは背景表現に対して分解対象を持つ必要がある。
論文 参考訳(メタデータ) (2023-06-09T15:29:54Z) - Cross-Domain Policy Adaptation via Value-Guided Data Filtering [57.62692881606099]
動的ミスマッチで異なるドメインにまたがるポリシーを一般化することは、強化学習において重要な課題となる。
本稿では、ペア化された値ターゲットの近接に基づいて、ソースドメインからの遷移を選択的に共有するバリューガイドデータフィルタリング(VGDF)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-28T04:08:40Z) - Contrastive View Design Strategies to Enhance Robustness to Domain
Shifts in Downstream Object Detection [37.06088084592779]
コントラスト学習とドメイン外オブジェクト検出の実証的研究を行う。
本稿では,外見シフトやコンテキストシフトのシナリオにおいて,ビューを拡大し,堅牢性を高める戦略を提案する。
我々の結果と洞察は、対照的な学習における視点の選択を通じて、堅牢性を確保する方法を示している。
論文 参考訳(メタデータ) (2022-12-09T00:34:50Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - DASGIL: Domain Adaptation for Semantic and Geometric-aware Image-based
Localization [27.294822556484345]
環境変化下での視覚的長期化は、自律走行と移動ロボット工学において難しい問題である。
視覚的位置認識のための多スケール潜在埋め込み表現に幾何学的および意味的情報を融合する新しいマルチタスクアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-10-01T17:44:25Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。