論文の概要: Deep Learning Techniques for Visual Counting
- arxiv url: http://arxiv.org/abs/2206.03033v2
- Date: Wed, 8 Jun 2022 16:29:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-09 11:17:40.288662
- Title: Deep Learning Techniques for Visual Counting
- Title(参考訳): ビジュアルカウントのためのディープラーニング技術
- Authors: Luca Ciampi
- Abstract要約: 静止画像やビデオフレーム中のオブジェクトをカウントするディープラーニング(DL)技術について検討・拡張を行った。
特に、現在のDLベースのソリューションをトレーニングするために必要なデータ不足に関する課題に取り組みました。
- 参考スコア(独自算出の注目度): 0.13537117504260618
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this dissertation, we investigated and enhanced Deep Learning (DL)
techniques for counting objects, like pedestrians, cells or vehicles, in still
images or video frames. In particular, we tackled the challenge related to the
lack of data needed for training current DL-based solutions. Given that the
budget for labeling is limited, data scarcity still represents an open problem
that prevents the scalability of existing solutions based on the supervised
learning of neural networks and that is responsible for a significant drop in
performance at inference time when new scenarios are presented to these
algorithms. We introduced solutions addressing this issue from several
complementary sides, collecting datasets gathered from virtual environments
automatically labeled, proposing Domain Adaptation strategies aiming at
mitigating the domain gap existing between the training and test data
distributions, and presenting a counting strategy in a weakly labeled data
scenario, i.e., in the presence of non-negligible disagreement between multiple
annotators. Moreover, we tackled the non-trivial engineering challenges coming
out of the adoption of Convolutional Neural Network-based techniques in
environments with limited power resources, introducing solutions for counting
vehicles and pedestrians directly onboard embedded vision systems, i.e.,
devices equipped with constrained computational capabilities that can capture
images and elaborate them.
- Abstract(参考訳): 本研究では,歩行者やセル,車両などの物体を静止画やビデオフレームでカウントする深層学習(dl)技術について検討し,拡張した。
特に、現在のDLベースのソリューションのトレーニングに必要なデータ不足に関する課題に取り組みました。
ラベル付けの予算が限られていることを考えると、データ不足は、ニューラルネットワークの教師付き学習に基づく既存のソリューションのスケーラビリティを妨げるオープンな問題であり、これらのアルゴリズムに新たなシナリオが提示された場合に、推論時にパフォーマンスが大幅に低下する原因である。
そこで我々は,いくつかの相補的な側面からこの問題に対処し,自動ラベル付けされた仮想環境から収集したデータセットを収集し,トレーニングとテストデータ分布の間に存在するドメイン間ギャップを緩和することを目的としたドメイン適応戦略を提案する。
さらに、限られた電力資源を持つ環境での畳み込みニューラルネットワーク技術の導入による、非自明なエンジニアリング上の課題に対処し、車両や歩行者を直接組込み視覚システムに搭載するソリューションを導入しました。
関連論文リスト
- AI Flow at the Network Edge [58.31090055138711]
AI Flowは、デバイス、エッジノード、クラウドサーバ間で利用可能な異種リソースを共同で活用することで、推論プロセスを合理化するフレームワークである。
この記事では、AI Flowのモチベーション、課題、原則を特定するためのポジションペーパーとして機能する。
論文 参考訳(メタデータ) (2024-11-19T12:51:17Z) - Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Hyperspectral Image Analysis in Single-Modal and Multimodal setting
using Deep Learning Techniques [1.2328446298523066]
ハイパースペクトルイメージングは、その例外的なスペクトル分解能のため、土地利用とカバーの正確な分類を提供する。
しかし、高次元化と空間分解能の制限による課題は、その効果を妨げている。
本研究では,深層学習技術を用いて特徴を効率的に処理し,抽出し,データを統合的に分類することで,これらの課題に対処する。
論文 参考訳(メタデータ) (2024-03-03T15:47:43Z) - A Proper Orthogonal Decomposition approach for parameters reduction of
Single Shot Detector networks [0.0]
本稿では,古典的モデルオーダー削減手法であるProper Orthogonal Decompositionに基づく次元削減フレームワークを提案する。
我々は、PASCAL VOCデータセットを用いてSSD300アーキテクチャにそのようなフレームワークを適用し、ネットワーク次元の削減と、転送学習コンテキストにおけるネットワークの微調整における顕著な高速化を実証した。
論文 参考訳(メタデータ) (2022-07-27T14:43:14Z) - Federated Deep Learning Meets Autonomous Vehicle Perception: Design and
Verification [168.67190934250868]
フェデレーテッド・ラーニング・パワード・コネクテッド・オートモービル(FLCAV)が提案されている。
FLCAVは通信とアノテーションのコストを削減しながらプライバシを保存する。
マルチステージトレーニングのためのネットワークリソースと道路センサのポーズを決定することは困難である。
論文 参考訳(メタデータ) (2022-06-03T23:55:45Z) - Exploring Data Aggregation and Transformations to Generalize across
Visual Domains [0.0]
この論文は、ドメイン一般化(DG)、ドメイン適応(DA)およびそれらのバリエーションの研究に寄与する。
本稿では,機能集約戦略と視覚変換を利用するドメイン一般化とドメイン適応の新しいフレームワークを提案する。
提案手法が確立したDGおよびDAベンチマークにおいて,最先端の競争的アプローチよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-20T14:58:14Z) - Visual Domain Adaptation for Monocular Depth Estimation on
Resource-Constrained Hardware [3.7399856406582086]
我々は、ビジュアルドメイン適応の文脈において、リソース制約のあるハードウェア上でディープニューラルネットワークをトレーニングする問題に対処する。
本稿では,限られたリソースを持つデバイス上での学習に適応した逆学習手法を提案する。
実験の結果,視覚領域適応は効率的なネットワークアーキテクチャとトレーニングセットにのみ関係していることがわかった。
論文 参考訳(メタデータ) (2021-08-05T15:10:00Z) - Learning a Domain-Agnostic Visual Representation for Autonomous Driving
via Contrastive Loss [25.798361683744684]
ドメイン認識コントラスト学習(Domain-Agnostic Contrastive Learning、DACL)は、2段階の非監視ドメイン適応フレームワークである。
提案手法は,従来の最新手法に比べ,単眼深度推定作業における性能向上を実現した。
論文 参考訳(メタデータ) (2021-03-10T07:06:03Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z) - Binary Neural Networks: A Survey [126.67799882857656]
バイナリニューラルネットワークは、リソース制限されたデバイスにディープモデルをデプロイするための有望なテクニックとして機能する。
バイナライゼーションは必然的に深刻な情報損失を引き起こし、さらに悪いことに、その不連続性はディープネットワークの最適化に困難をもたらす。
本稿では,2項化を直接実施するネイティブソリューションと,量子化誤差の最小化,ネットワーク損失関数の改善,勾配誤差の低減といった手法を用いて,これらのアルゴリズムを探索する。
論文 参考訳(メタデータ) (2020-03-31T16:47:20Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。