論文の概要: Composing Open-domain Vision with RAG for Ocean Monitoring and Conservation
- arxiv url: http://arxiv.org/abs/2412.02262v1
- Date: Tue, 03 Dec 2024 08:34:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 21:11:22.929507
- Title: Composing Open-domain Vision with RAG for Ocean Monitoring and Conservation
- Title(参考訳): 海洋モニタリングと保全のためのRAGを用いたオープンドメインビジョンの構築
- Authors: Sepand Dyanatkar, Angran Li, Alexander Dungate,
- Abstract要約: 本稿では, 海洋アプリケーションにおける画像解析と映像解析のためのレジリエントでスケーラブルなソリューションを提案する。
我々は,本手法を,ビデオ漁船から魚を分類する予備的応用を通じて検証する。
- 参考スコア(独自算出の注目度): 41.94295877935867
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Climate change's destruction of marine biodiversity is threatening communities and economies around the world which rely on healthy oceans for their livelihoods. The challenge of applying computer vision to niche, real-world domains such as ocean conservation lies in the dynamic and diverse environments where traditional top-down learning struggle with long-tailed distributions, generalization, and domain transfer. Scalable species identification for ocean monitoring is particularly difficult due to the need to adapt models to new environments and identify rare or unseen species. To overcome these limitations, we propose leveraging bottom-up, open-domain learning frameworks as a resilient, scalable solution for image and video analysis in marine applications. Our preliminary demonstration uses pretrained vision-language models (VLMs) combined with retrieval-augmented generation (RAG) as grounding, leaving the door open for numerous architectural, training and engineering optimizations. We validate this approach through a preliminary application in classifying fish from video onboard fishing vessels, demonstrating impressive emergent retrieval and prediction capabilities without domain-specific training or knowledge of the task itself.
- Abstract(参考訳): 気候変動による海洋生物多様性の破壊は、世界中の地域社会や経済を脅かしている。
海洋保全のようなニッチで現実世界のドメインにコンピュータビジョンを適用するという課題は、伝統的なトップダウン学習が長い尾の分布、一般化、ドメイン転送に苦しむ動的で多様な環境にある。
海洋モニタリングのためのスケーラブルな種識別は、新しい環境にモデルを適応させ、希少種や未確認種を識別する必要があるため、特に困難である。
これらの制限を克服するために、海洋アプリケーションにおける画像およびビデオ分析のためのレジリエントでスケーラブルなソリューションとして、ボトムアップでオープンドメインの学習フレームワークを活用することを提案する。
予備的なデモでは、事前訓練された視覚言語モデル(VLM)と検索強化世代(RAG)を接地として使用し、多くのアーキテクチャ、トレーニング、エンジニアリング最適化のためにドアを開放した。
我々は,本手法を,映像付き漁船から魚を分類する予備的応用を通じて検証し,ドメイン固有の訓練やタスク自体の知識を使わずに,目覚ましい発見と予測能力を示す。
関連論文リスト
- Real-time Seafloor Segmentation and Mapping [0.0]
ポシドニア・オーシャンカ・メドウ(Posidonia Oceanica meadows)は、サバイバルと保全のために岩に大きく依存する海草の一種である。
ディープラーニングベースのセマンティックセグメンテーションと視覚自動監視システムは、さまざまなアプリケーションで有望であることを示している。
本稿では,自律型水中車両(AUV)がポシドニア大洋の牧草地の境界を自律的に調査できるようにするために,機械学習とコンピュータビジョン技術を組み合わせたフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-14T22:49:08Z) - Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。
EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。
本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文 参考訳(メタデータ) (2025-04-09T15:13:26Z) - AdaWorld: Learning Adaptable World Models with Latent Actions [76.50869178593733]
我々は,効率的な適応を実現する革新的な世界モデル学習手法であるAdaWorldを提案する。
主要なアイデアは、世界モデルの事前トレーニング中にアクション情報を統合することである。
次に、これらの潜伏行動を条件とした自己回帰的世界モデルを開発する。
論文 参考訳(メタデータ) (2025-03-24T17:58:15Z) - Image-Based Relocalization and Alignment for Long-Term Monitoring of Dynamic Underwater Environments [57.59857784298534]
本稿では,視覚的位置認識(VPR),特徴マッチング,画像分割を組み合わせた統合パイプラインを提案する。
本手法は, 再検討領域のロバスト同定, 剛性変換の推定, 生態系変化の下流解析を可能にする。
論文 参考訳(メタデータ) (2025-03-06T05:13:19Z) - ODYSSEE: Oyster Detection Yielded by Sensor Systems on Edge Electronics [14.935296890629795]
オイスターは沿岸生態系において重要なキーストーンであり、経済的、環境的、文化的な利益をもたらす。
現在の監視戦略は、しばしば破壊的な方法に依存している。
本研究では, 安定拡散を用いた新しいパイプラインを提案し, 現実的な合成データを用いて収集した実データセットを増強する。
論文 参考訳(メタデータ) (2024-09-11T04:31:09Z) - Harnessing Artificial Intelligence for Wildlife Conservation [0.0937465283958018]
保護AIは、視覚スペクトルと熱赤外線カメラを使用して、動物、人間、密猟に関連する物体を検出し、分類する。
このプラットフォームは、このデータを畳み込みニューラルネットワーク(CNN)とTransformerアーキテクチャで処理し、種を監視する。
ヨーロッパ、北アメリカ、アフリカ、東南アジアの事例研究は、このプラットフォームが種の識別、生物多様性の監視、密猟防止に成功していることを強調している。
論文 参考訳(メタデータ) (2024-08-30T09:13:31Z) - Multifidelity digital twin for real-time monitoring of structural dynamics in aquaculture net cages [1.124958340749622]
デジタルツイン技術は水産産業を前進させることができるが、その採用は限られている。
フレキシブルな浮体構造である魚網ケージは、養殖農場の重要かつ脆弱な構成要素である。
本研究では,水生生物網の構造動態をリアルタイムにモニタリングするデジタルツインへの統合のための多要素代理モデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-06T21:26:30Z) - A Survey on Transferability of Adversarial Examples across Deep Neural Networks [53.04734042366312]
逆の例では、機械学習モデルを操作して誤った予測を行うことができます。
敵の例の転送可能性により、ターゲットモデルの詳細な知識を回避できるブラックボックス攻撃が可能となる。
本研究は, 対角移動可能性の展望を考察した。
論文 参考訳(メタデータ) (2023-10-26T17:45:26Z) - FisHook -- An Optimized Approach to Marine Specie Classification using
MobileNetV2 [5.565562836494568]
海洋生物の分類とモニタリングは、その分布、人口動態、そしてそれらに対する人間の活動の影響を理解するのに役立ちます。
ディープラーニングアルゴリズムは、海洋生物を効率的に分類し、海洋生態系の監視と管理を容易にする。
論文 参考訳(メタデータ) (2023-04-04T04:30:25Z) - GeoNet: Benchmarking Unsupervised Adaptation across Geographies [71.23141626803287]
地理的ロバスト性の問題について検討し、3つの主要な貢献を行う。
まず,地理的適応のための大規模データセットGeoNetを紹介する。
第2に、シーンコンテキストにおける大きな変化から、ドメインシフトの主な原因が生じるという仮説を立てる。
第3に、最先端の教師なしドメイン適応アルゴリズムとアーキテクチャを広範囲に評価する。
論文 参考訳(メタデータ) (2023-03-27T17:59:34Z) - Applications of Deep Learning in Fish Habitat Monitoring: A Tutorial and
Survey [1.9249287163937976]
ディープラーニング(DL)は最先端のAI技術であり、ビジュアルデータを分析する上で前例のないパフォーマンスを示している。
本稿では,DLの重要な概念を網羅するチュートリアルを紹介し,DLの動作に関する高レベルな理解を支援する。
チュートリアルではまた、水中魚のモニタリングのような挑戦的な応用のために、DLアルゴリズムをどのように開発すべきかをステップバイステップで説明する。
論文 参考訳(メタデータ) (2022-06-11T01:59:54Z) - Unlocking the potential of deep learning for marine ecology: overview,
applications, and outlook [8.3226670069051]
本稿では,海洋生態学者と計算機科学者のギャップを埋めることを目的としている。
本研究では, 一般的な深層学習手法を, 平易な言語における生態データ分析に適用する。
我々は,海洋生態学への深層学習の確立と新たな応用を通じて,課題と機会を解説する。
論文 参考訳(メタデータ) (2021-09-29T21:59:16Z) - Generating Physically-Consistent Satellite Imagery for Climate Visualizations [53.61991820941501]
我々は,将来的な洪水や森林再生イベントの合成衛星画像を作成するために,生成的敵ネットワークを訓練する。
純粋なディープラーニングベースのモデルでは、洪水の可視化を生成することができるが、洪水の影響を受けない場所では幻覚的な洪水が発生する。
我々は,地球観測におけるセグメンテーションガイドによる画像と画像の変換のためのコードとデータセットを公開している。
論文 参考訳(メタデータ) (2021-04-10T15:00:15Z) - Movement Tracks for the Automatic Detection of Fish Behavior in Videos [63.85815474157357]
水中ビデオでサブルフィッシュ(Anoplopoma fimbria)の発芽行動のデータセットを提供し,その上での深層学習(DL)法による行動検出について検討した。
提案する検出システムは,Long Short-Term Memory(LSTM)ネットワークを用いて,サブルフィッシュの起動動作を識別する。
論文 参考訳(メタデータ) (2020-11-28T05:51:19Z) - Physics-informed GANs for Coastal Flood Visualization [65.54626149826066]
我々は,現在および将来の沿岸洪水の衛星画像を生成する深層学習パイプラインを構築した。
物理に基づく洪水図と比較して画像を評価することにより,提案手法は物理的一貫性とフォトリアリズムの両方において,ベースラインモデルよりも優れていることがわかった。
この研究は沿岸の洪水の可視化に焦点が当てられているが、気候変動が地球をどう形作るかのグローバルな可視化を作成することを想定している。
論文 参考訳(メタデータ) (2020-10-16T02:15:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。