論文の概要: Localizing the conceptual difference of two scenes using deep learning
for house keeping usages
- arxiv url: http://arxiv.org/abs/2208.04884v1
- Date: Tue, 9 Aug 2022 16:25:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-10 12:10:12.346968
- Title: Localizing the conceptual difference of two scenes using deep learning
for house keeping usages
- Title(参考訳): 深層学習による住宅利用における2場面の概念的差異の局所化
- Authors: Ali Atghaei, Ehsan Rahnama, Kiavash azimi
- Abstract要約: これらの違いを見出すために、2つの画像を鼻で減らすことは不可能である。
本研究の目的は,あるシーンの2つのフレームの概念的差異を,2つの異なる時間で発見し,ローカライズすることである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Finding the conceptual difference between the two images in an industrial
environment has been especially important for HSE purposes and there is still
no reliable and conformable method to find the major differences to alert the
related controllers. Due to the abundance and variety of objects in different
environments, the use of supervised learning methods in this field is facing a
major problem. Due to the sharp and even slight change in lighting conditions
in the two scenes, it is not possible to naively subtract the two images in
order to find these differences. The goal of this paper is to find and localize
the conceptual differences of two frames of one scene but in two different
times and classify the differences to addition, reduction and change in the
field. In this paper, we demonstrate a comprehensive solution for this
application by presenting the deep learning method and using transfer learning
and structural modification of the error function, as well as a process for
adding and synthesizing data. An appropriate data set was provided and labeled,
and the model results were evaluated on this data set and the possibility of
using it in real and industrial applications was explained.
- Abstract(参考訳): 産業環境における2つのイメージ間の概念的差異の発見は,特にHSEの目的において重要であり,関連するコントローラに警告する主要な違いを見つけるための信頼性と適合性はいまだに存在しない。
異なる環境における物体の多種多様さから,この分野における教師あり学習手法の利用は大きな問題となっている。
2つのシーンの照明条件が鮮明でわずかに変化しているため、これらの違いを見出すために2つの画像を鼻で減らすことはできない。
本研究の目的は,一つのシーンの2つのフレームの概念的な違いを2つの異なる時間に見つけ,その違いをフィールドの追加,縮小,変化に分類することである。
本稿では, 深層学習法を提示し, 誤り関数の構造的修正, およびデータの追加と合成のプロセスを用いて, この応用の包括的ソリューションを実証する。
適切なデータセットが提供され,ラベル付けされ,このデータセット上でモデル結果が評価され,実および産業用途での利用の可能性が説明された。
関連論文リスト
- Distractors-Immune Representation Learning with Cross-modal Contrastive Regularization for Change Captioning [71.14084801851381]
変更キャプションは、類似した画像間のセマンティックな変化を簡潔に記述することを目的としている。
既存のほとんどの手法は、それらの違いを直接キャプチャし、エラーを起こしやすい特徴を得るリスクを負う。
本稿では,2つの画像表現の対応するチャネルを関連づけるイントラクタ免疫表現学習ネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T13:00:33Z) - Bilevel Fast Scene Adaptation for Low-Light Image Enhancement [50.639332885989255]
低照度シーンにおける画像の強調は、コンピュータビジョンにおいて難しいが、広く懸念されている課題である。
主な障害は、異なるシーンにまたがる分散の相違によるモデリングの混乱にある。
上述の潜在対応をモデル化するための双レベルパラダイムを導入する。
エンコーダのシーン非関連な一般化を多様なシーンにもたらすために、双方向学習フレームワークを構築した。
論文 参考訳(メタデータ) (2023-06-02T08:16:21Z) - SALUDA: Surface-based Automotive Lidar Unsupervised Domain Adaptation [62.889835139583965]
我々は、ソースデータとターゲットデータに基づいて、暗黙の基盤となる表面表現を同時に学習する教師なし補助タスクを導入する。
両方のドメインが同じ遅延表現を共有しているため、モデルは2つのデータソース間の不一致を許容せざるを得ない。
実験の結果,本手法は実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-
論文 参考訳(メタデータ) (2023-04-06T17:36:23Z) - Learning Transformations To Reduce the Geometric Shift in Object
Detection [60.20931827772482]
画像キャプチャプロセスの変動から生じる幾何シフトに対処する。
我々は、これらのシフトを最小限に抑えるために幾何変換の集合を学習する自己学習アプローチを導入する。
我々は,カメラの視野変化(FoV)と視点変化(視点変化)の2つの異なるシフトについて,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-01-13T11:55:30Z) - Industrial Scene Change Detection using Deep Convolutional Neural
Networks [0.0]
本稿では、転送学習を用いた深層畳み込みニューラルネットワークに基づく手法を提案する。
提案手法は他の方法よりも効率的であり, 様々な産業環境に応用できることが示されている。
論文 参考訳(メタデータ) (2022-12-29T12:01:06Z) - CbwLoss: Constrained Bidirectional Weighted Loss for Self-supervised
Learning of Depth and Pose [13.581694284209885]
光度差は、未ラベルのモノクロビデオから深度とカメラのポーズを推定するためにニューラルネットワークを訓練するために使用される。
本稿では,アフィン変換とビュー合成によって生じる流れ場と深さ構造の違いを利用して,移動物体とオクルージョンを取り扱う。
ネットワークを追加することなく、より意味的な情報と文脈的な情報を持つ特徴の差を測定することにより、テクスチャレス領域がモデル最適化に与える影響を緩和する。
論文 参考訳(メタデータ) (2022-12-12T12:18:24Z) - Augmentation Invariance and Adaptive Sampling in Semantic Segmentation
of Agricultural Aerial Images [16.101248613062292]
農業用航空画像におけるセマンティックの問題点について検討する。
この作業に用いられている既存の手法は,2つの特徴を考慮せずに設計されている。
i) 上向きの視点に典型的な測光的および幾何学的シフトに不変な意味表現を学習するために、モデルに適切な拡張と整合性損失のセットを併用した2つのアイデアに基づく解を提案する。
本研究は,農業ビジョンデータセットを用いた広範囲な実験により,提案手法が現在の最先端手法の性能を向上させることを実証する。
論文 参考訳(メタデータ) (2022-04-17T10:19:07Z) - Image Difference Captioning with Pre-training and Contrastive Learning [45.59621065755761]
画像差分キャプション(IDC)タスクは、自然言語と類似した2つの画像の視覚的差異を記述することを目的としている。
このタスクの主な課題は、1)より強力な視覚と言語関連を学習する必要のある、きめ細かい視覚的差異、2)手動アノテーションのコストの2つの側面にある。
本稿では,これらの課題に対処するために,事前学習ファインタニングパラダイムに基づく新しいモデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-09T06:14:22Z) - Object-aware Contrastive Learning for Debiased Scene Representation [74.30741492814327]
オブジェクトを自己教師型でローカライズする,オブジェクト認識型コントラスト学習フレームワークを開発した。
また、コントラCAM、オブジェクト認識型乱作、背景混合に基づく2つのデータ拡張を導入し、コントラスト型自己教師型学習における文脈バイアスと背景バイアスを低減した。
論文 参考訳(メタデータ) (2021-07-30T19:24:07Z) - Multi-Task Incremental Learning for Object Detection [71.57155077119839]
マルチタスクは、知識と計算を共有しながら、複数のタスクを学習する。
古いデータにアクセスせずに漸進的に学習すると、過去の知識を壊滅的に忘れてしまう。
論文 参考訳(メタデータ) (2020-02-13T04:58:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。