論文の概要: A framework for river connectivity classification using temporal image processing and attention based neural networks
- arxiv url: http://arxiv.org/abs/2502.00474v1
- Date: Sat, 01 Feb 2025 16:00:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 15:01:04.173816
- Title: A framework for river connectivity classification using temporal image processing and attention based neural networks
- Title(参考訳): 時間的画像処理とアテンションベースニューラルネットワークを用いた河川接続分類のためのフレームワーク
- Authors: Timothy James Becker, Derin Gezgin, Jun Yi He Wu, Mary Becker,
- Abstract要約: 気候変動に伴う極度の気象現象は、河川や河川の接続に変化をもたらす可能性がある。
伝統的な河川流量計は展開に費用がかかり、大きな川体に限られている。
トレイルカメラ方式は低コストで容易に展開でき、時間単位のデータを集める代替手段である。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Measuring the connectivity of water in rivers and streams is essential for effective water resource management. Increased extreme weather events associated with climate change can result in alterations to river and stream connectivity. While traditional stream flow gauges are costly to deploy and limited to large river bodies, trail camera methods are a low-cost and easily deployed alternative to collect hourly data. Image capturing, however requires stream ecologists to manually curate (select and label) tens of thousands of images per year. To improve this workflow, we developed an automated instream trail camera image classification system consisting of three parts: (1) image processing, (2) image augmentation and (3) machine learning. The image preprocessing consists of seven image quality filters, foliage-based luma variance reduction, resizing and bottom-center cropping. Images are balanced using variable amount of generative augmentation using diffusion models and then passed to a machine learning classification model in labeled form. By using the vision transformer architecture and temporal image enhancement in our framework, we are able to increase the 75% base accuracy to 90% for a new unseen site image. We make use of a dataset captured and labeled by staff from the Connecticut Department of Energy and Environmental Protection between 2018-2020. Our results indicate that a combination of temporal image processing and attention-based models are effective at classifying unseen river connectivity images.
- Abstract(参考訳): 河川と河川の水の接続性の測定は, 効果的な水資源管理に不可欠である。
気候変動に伴う極端な気象現象の増加は、河川や河川の接続に変化をもたらす可能性がある。
従来の流路流量計は、大規模な河川水域に展開するのに費用がかかるが、トレイルカメラ法は、時間単位のデータ収集に代えて、低コストで容易に展開できる手段である。
しかし、画像の撮影には、ストリーム生態学者が毎年何万もの画像を手動でキュレート(選択とラベル)する必要がある。
このワークフローを改善するために,(1)画像処理,(2)画像拡張,(3)機械学習の3つの部分からなる自動インストリームカメラ画像分類システムを開発した。
画像前処理は, 7つの画像品質フィルタ, 葉質に基づくルーマ分散低減, リサイズ化, ボトムセンタートリミングからなる。
画像は拡散モデルを用いて生成増強の変動量を用いてバランスを取り、ラベル付き形式で機械学習分類モデルに渡される。
視覚変換器のアーキテクチャと時間的画像強調により、新しい未確認サイト画像に対して75%の精度を90%に向上させることができる。
2018年から2020年にかけてコネチカット州エネルギー環境保護省の職員が収集・ラベル付けしたデータセットを活用している。
その結果,時間的画像処理とアテンションベースモデルを組み合わせることで,河川接続画像の分類に有効であることが示唆された。
関連論文リスト
- Counting Fish with Temporal Representations of Sonar Video [15.713015426791221]
本稿では,エコー図解析に基づく魚数計測のための軽量なコンピュータビジョン手法を提案する。
アラスカのケナイ川から得られた代表データに対して23%のカウント誤差を達成し,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-02-07T18:02:28Z) - AM Flow: Adapters for Temporal Processing in Action Recognition [6.67921694218089]
textitAttention Map (AM) Flowは、入力されたビデオフレーム内の動きに関連するピクセルを識別する手法である。
AMフローは空間的および時間的処理の分離を可能にし、時間的処理の組合せよりも改善された結果を提供する。
我々は、Kineetics-400、Something v2、Toyota Smarthomeのデータセットについて実験を行い、最先端または同等の結果を示す。
論文 参考訳(メタデータ) (2024-11-04T13:07:22Z) - JIGMARK: A Black-Box Approach for Enhancing Image Watermarks against Diffusion Model Edits [76.25962336540226]
JIGMARKは、コントラスト学習による堅牢性を高める、第一級の透かし技術である。
本評価の結果,JIGMARKは既存の透かし法をはるかに上回っていることがわかった。
論文 参考訳(メタデータ) (2024-06-06T03:31:41Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Flow Matching in Latent Space [2.9330609943398525]
フローマッチングは、印象的な経験的パフォーマンスを示す生成モデルをトレーニングするフレームワークである。
本稿では,事前学習されたオートエンコーダの潜時空間にフローマッチングを適用し,計算効率を向上させることを提案する。
我々の研究は、条件生成タスクのフローマッチングへの様々な条件の統合における先駆的な貢献である。
論文 参考訳(メタデータ) (2023-07-17T17:57:56Z) - ExposureDiffusion: Learning to Expose for Low-light Image Enhancement [87.08496758469835]
この研究は、拡散モデルと物理ベースの露光モデルとをシームレスに統合することで、この問題に対処する。
提案手法は,バニラ拡散モデルと比較して性能が大幅に向上し,推論時間を短縮する。
提案するフレームワークは、実際のペア付きデータセット、SOTAノイズモデル、および異なるバックボーンネットワークの両方で動作する。
論文 参考訳(メタデータ) (2023-07-15T04:48:35Z) - Unsupervised Restoration of Weather-affected Images using Deep Gaussian
Process-based CycleGAN [92.15895515035795]
本稿では,CycleGANに基づくディープネットワークの監視手法について述べる。
我々は,より効果的なトレーニングにつながるCycleGANのトレーニングに新たな損失を導入し,高品質な再構築を実現した。
提案手法は, 脱落, 脱落, 脱落といった様々な修復作業に効果的に適用できることを実証する。
論文 参考訳(メタデータ) (2022-04-23T01:30:47Z) - Image analysis for automatic measurement of crustose lichens [0.0]
地層は、特に最近の地質学的堆積物や考古学的構造において、年代推定器としてよく使われている。
現在の自動化されていない手作業のキッチンと測定は、時間と手間のかかるプロセスである。
本研究は, 平らな岩盤表面のライチェンタルリを効率よく識別するワークフローと画像取得・処理ツールを提案する。
論文 参考訳(メタデータ) (2022-03-01T23:11:59Z) - Recursive Self-Improvement for Camera Image and Signal Processing
Pipeline [6.318974730864278]
現在のカメラ画像と信号処理パイプライン(ISP)は、画像全体に一様に適用される単一のフィルタを適用する傾向がある。
これは、ほとんどの取得したカメラ画像が空間的に異質なアーティファクトを持っているにもかかわらずである。
学習された潜在部分空間で動作する深層強化学習モデルを提案する。
論文 参考訳(メタデータ) (2021-11-15T02:23:40Z) - Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。
そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。
StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文 参考訳(メタデータ) (2021-04-29T17:58:35Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。