論文の概要: LiqD: A Dynamic Liquid Level Detection Model under Tricky Small
Containers
- arxiv url: http://arxiv.org/abs/2403.08273v1
- Date: Wed, 13 Mar 2024 05:53:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 15:15:57.206186
- Title: LiqD: A Dynamic Liquid Level Detection Model under Tricky Small
Containers
- Title(参考訳): LiqD:トリッキースモール下の動的液体レベル検出モデル
容器
- Authors: Yukun Ma, Zikun Mao
- Abstract要約: 本稿では,U2-Netに基づくコンテナ動的液位検出モデルを提案する。
実験結果から, 容器内の液体の動的液体レベル変化を効果的に検出できることが示唆された。
- 参考スコア(独自算出の注目度): 5.361320134021586
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In daily life and industrial production, it is crucial to accurately detect
changes in liquid level in containers. Traditional contact measurement methods
have some limitations, while emerging non-contact image processing technology
shows good application prospects. This paper proposes a container dynamic
liquid level detection model based on U^2-Net. This model uses the SAM model to
generate an initial data set, and then evaluates and filters out high-quality
pseudo-label images through the SemiReward framework to build an exclusive data
set. The model uses U^2-Net to extract mask images of containers from the data
set, and uses morphological processing to compensate for mask defects.
Subsequently, the model calculates the grayscale difference between adjacent
video frame images at the same position, segments the liquid level change area
by setting a difference threshold, and finally uses a lightweight neural
network to classify the liquid level state. This approach not only mitigates
the impact of intricate surroundings, but also reduces the demand for training
data, showing strong robustness and versatility. A large number of experimental
results show that the proposed model can effectively detect the dynamic liquid
level changes of the liquid in the container, providing a novel and efficient
solution for related fields.
- Abstract(参考訳): 日常生活や工業生産では,容器内の液体濃度の変化を正確に検出することが重要である。
従来の接触測定手法にはいくつかの制限があるが、新しい非接触画像処理技術は優れた応用可能性を示している。
本稿では,U^2-Netに基づくコンテナ動的液位検出モデルを提案する。
このモデルはSAMモデルを用いて初期データセットを生成し、SemiRewardフレームワークを通じて高品質な擬似ラベル画像を評価しフィルタし、排他的データセットを構築する。
このモデルはU^2-Netを用いてデータセットからコンテナのマスクイメージを抽出し、モルフォロジー処理を用いてマスク欠陥を補償する。
その後、モデルは、隣接するビデオフレーム画像間のグレースケールの差を同じ位置で算出し、差分閾値を設定して液体レベル変化領域を分割し、最後に、軽量ニューラルネットワークを用いて液体レベル状態を分類する。
このアプローチは複雑な環境の影響を軽減するだけでなく、トレーニングデータの需要を減らし、堅牢性と汎用性を示す。
多くの実験結果から,提案モデルが容器内の液体の動的液体レベル変化を効果的に検出できることが示唆された。
関連論文リスト
- AssemAI: Interpretable Image-Based Anomaly Detection for Manufacturing Pipelines [0.0]
製造パイプラインにおける異常検出は、産業環境の複雑さと変動性によって強化され、依然として重要な課題である。
本稿では,スマート製造パイプラインに適した解釈可能な画像ベース異常検出システムAssemAIを紹介する。
論文 参考訳(メタデータ) (2024-08-05T01:50:09Z) - Robust CLIP-Based Detector for Exposing Diffusion Model-Generated Images [13.089550724738436]
拡散モデル(DM)は画像生成に革命をもたらし、様々な分野にまたがる高品質な画像を生成する。
超現実的画像を作成する能力は、現実的コンテンツと合成的コンテンツを区別する上で大きな課題となる。
この研究は、CLIPモデルによって抽出された画像とテキストの特徴をMLP(Multilayer Perceptron)分類器と統合する堅牢な検出フレームワークを導入する。
論文 参考訳(メタデータ) (2024-04-19T14:30:41Z) - Inpainting Computational Fluid Dynamics with Deep Learning [8.397730500554047]
有効な流体データ補完法は、流体力学実験において必要なセンサー数を削減する。
流体データ完備化問題の誤った性質は、理論解を得るのを違法に困難にしている。
ベクトル量子化法を用いて、完全および不完全流体データ空間を離散値下次元表現にマッピングする。
論文 参考訳(メタデータ) (2024-02-27T03:44:55Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Unpaired Downscaling of Fluid Flows with Diffusion Bridges [0.0]
ドメイン翻訳に使用する2つの独立条件拡散モデルをどのように連鎖させるかを示す。
結果として得られる変換は、低解像度と高解像度データセットの間の拡散ブリッジである。
本手法は, 物理流体シミュレーションにおいて, 分解能を高め, 文脈依存バイアスを補正することを示した。
論文 参考訳(メタデータ) (2023-05-02T23:13:44Z) - An Adversarial Active Sampling-based Data Augmentation Framework for
Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。
機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。
本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-27T20:53:39Z) - RetiFluidNet: A Self-Adaptive and Multi-Attention Deep Convolutional
Network for Retinal OCT Fluid Segmentation [3.57686754209902]
OCTガイド下治療には網膜液の定量化が必要である。
RetiFluidNetと呼ばれる新しい畳み込みニューラルアーキテクチャは、多クラス網膜流体セグメンテーションのために提案されている。
モデルは、テクスチャ、コンテキスト、エッジといった特徴の階層的な表現学習の恩恵を受ける。
論文 参考訳(メタデータ) (2022-09-26T07:18:00Z) - Visual-tactile sensing for Real-time liquid Volume Estimation in
Grasping [58.50342759993186]
変形性容器内の液体をリアルタイムに推定するためのビジュオ触覚モデルを提案する。
我々は、RGBカメラからの生の視覚入力と、特定の触覚センサーからの触覚手がかりの2つの感覚モードを融合する。
ロボットシステムは、推定モデルに基づいて、リアルタイムで適切に制御され、調整される。
論文 参考訳(メタデータ) (2022-02-23T13:38:31Z) - A Comprehensive Study of Image Classification Model Sensitivity to
Foregrounds, Backgrounds, and Visual Attributes [58.633364000258645]
このデータセットをRIVAL10と呼びます。
本研究では,前景,背景,属性の騒音劣化に対する幅広いモデルの感度を評価する。
本稿では,多種多様な最先端アーキテクチャ (ResNets, Transformers) とトレーニング手順 (CLIP, SimCLR, DeiT, Adversarial Training) について考察する。
論文 参考訳(メタデータ) (2022-01-26T06:31:28Z) - Visual Saliency Transformer [127.33678448761599]
RGBとRGB-Dの液状物体検出(SOD)のための、純粋な変圧器であるVST(Visual Saliency Transformer)に基づく新しい統一モデルを開発しました。
イメージパッチを入力として取り、トランスフォーマーを利用してイメージパッチ間のグローバルコンテキストを伝搬する。
実験結果から,RGBとRGB-D SODのベンチマークデータセットにおいて,本モデルが既存の最新結果を上回っていることが示された。
論文 参考訳(メタデータ) (2021-04-25T08:24:06Z) - Optical Flow Estimation from a Single Motion-blurred Image [66.2061278123057]
画像内の動きのぼかしは、基本的なコンピュータビジョンの問題に実用的な関心を持つ可能性があります。
本研究では,単一動画像からの光流れをエンドツーエンドで推定する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T12:45:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。