論文の概要: Cross-modal learning for plankton recognition
- arxiv url: http://arxiv.org/abs/2603.16427v1
- Date: Tue, 17 Mar 2026 12:04:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.260086
- Title: Cross-modal learning for plankton recognition
- Title(参考訳): プランクトン認識のためのクロスモーダル学習
- Authors: Joona Kareinen, Veikka Immonen, Tuomas Eerola, Lumi Haraguchi, Lasse Lensu, Kaisa Kraft, Sanna Suikkanen, Heikki Kälviäinen,
- Abstract要約: 本稿では,マルチモーダルをプランクトン認識に活用するための戦略として,自己監督型クロスモーダルコーディネートを考察する。
提案手法は,最小限のラベル付き画像しか必要とせず,高い認識精度を実現する。
- 参考スコア(独自算出の注目度): 7.782757108520769
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper considers self-supervised cross-modal coordination as a strategy enabling utilization of multiple modalities and large volumes of unlabeled plankton data to build models for plankton recognition. Automated imaging instruments facilitate the continuous collection of plankton image data on a large scale. Current methods for automatic plankton image recognition rely primarily on supervised approaches, which require labeled training sets that are labor-intensive to collect. On the other hand, some modern plankton imaging instruments complement image information with optical measurement data, such as scatter and fluorescence profiles, which currently are not widely utilized in plankton recognition. In this work, we explore the possibility of using such measurement data to guide the learning process without requiring manual labeling. Inspired by the concepts behind Contrastive Language-Image Pre-training, we train encoders for both modalities using only binary supervisory information indicating whether a given image and profile originate from the same particle or from different particles. For plankton recognition, we employ a small labeled gallery of known plankton species combined with a $k$-NN classifier. This approach yields a recognition model that is inherently multimodal, i.e., capable of utilizing information extracted from both image and profile data. We demonstrate that the proposed method achieves high recognition accuracy while requiring only a minimal number of labeled images. Furthermore, we show that the approach outperforms an image-only self-supervised baseline. Code available at https://github.com/Jookare/cross-modal-plankton.
- Abstract(参考訳): 本稿では,マルチモーダルと大量の未ラベルプランクトンデータを有効活用し,プランクトン認識のためのモデルを構築する戦略として,自己監督型クロスモーダルコーディネートを考察する。
自動撮像装置は大規模なプランクトン画像データの連続収集を容易にする。
自動プランクトン画像認識の現在の手法は、主に教師付きアプローチに依存しており、収集には労働集約的なラベル付きトレーニングセットが必要である。
一方、現代のプランクトンイメージング装置では、画像情報と散乱や蛍光プロファイルなどの光学的計測データとを補完するものもある。
本研究では,手動ラベリングを必要とせず,そのような測定データを用いて学習プロセスをガイドする可能性を検討する。
Contrastive Language-Image Pre-Trainingの背景にある概念に触発されて、与えられた画像とプロファイルが同一粒子に由来するか、または異なる粒子に由来するかを示すバイナリ・スーパーバイザリー情報のみを用いて、両方のモダリティのためのエンコーダを訓練する。
プランクトン認識には、既知のプランクトン種の小さなラベル付きギャラリーと、$k$-NN分類器を併用する。
このアプローチは、本質的にマルチモーダルな認識モデル、すなわち、画像データとプロファイルデータの両方から抽出された情報を利用することができる。
提案手法は,最小限のラベル付き画像しか必要とせず,高い認識精度を実現することを実証する。
さらに,本手法は画像のみの自己教師付きベースラインよりも優れていることを示す。
コードはhttps://github.com/Jookare/cross-modal-plankton.comで公開されている。
関連論文リスト
- Self-Supervised Pretraining for Fine-Grained Plankton Recognition [0.11309478649967238]
プランクトン認識は、海洋食物網や炭素捕獲においてプランクトンが重要な役割を担っているため、重要なコンピュータビジョン問題である。
本研究では,プランクトン認識のための大規模自己教師型プレトレーニングについて検討する。
論文 参考訳(メタデータ) (2025-03-14T12:15:20Z) - Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。
我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。
実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文 参考訳(メタデータ) (2023-12-12T14:45:45Z) - Efficient Unsupervised Learning for Plankton Images [12.447149371717]
水生生態系の保全には,シチューにおけるプランクトン群集のモニタリングが不可欠である。
このようなデータを分類するための機械学習アルゴリズムの採用は、手動アノテーションの大幅なコストに影響される可能性がある。
プランクトン微生物の正確な分類を行うために,効率的な教師なし学習パイプラインを提案する。
論文 参考訳(メタデータ) (2022-09-14T15:33:16Z) - Towards Generating Large Synthetic Phytoplankton Datasets for Efficient
Monitoring of Harmful Algal Blooms [77.25251419910205]
有害な藻類(HAB)は養殖農場で重大な魚死を引き起こす。
現在、有害藻や他の植物プランクトンを列挙する標準的な方法は、顕微鏡でそれらを手動で観察し数えることである。
合成画像の生成にはGAN(Generative Adversarial Networks)を用いる。
論文 参考訳(メタデータ) (2022-08-03T20:15:55Z) - Deep Learning Classification of Lake Zooplankton [0.0]
湖沼プランクトンの同定のために開発された深層学習モデルについて述べる。
この目的のために,我々は17900年の動物園プランクトンと大型植物プランクトンコロニーの画像に対して35のクラスに注釈を付けた。
最良モデルは転送学習とアンサンブルに基づいて,98%の精度と93%のF1スコアでプランクトン画像を分類した。
論文 参考訳(メタデータ) (2021-08-11T14:57:43Z) - Unsupervised Noisy Tracklet Person Re-identification [100.85530419892333]
本稿では,非照合トラックレットデータから識別的人物再識別モデルを訓練できる選択的トラックレット学習(STL)手法を提案する。
これにより、カメラビュー全体で人物の画像/トラックレットの真のマッチングペアを完全にラベル付けする面倒でコストのかかるプロセスが回避されます。
提案手法は生トラックレットの任意のノイズデータに対して特に頑健であるため,制約のない追跡データから識別モデル学習にスケーラブルである。
論文 参考訳(メタデータ) (2021-01-16T07:31:00Z) - Deep Low-Shot Learning for Biological Image Classification and
Visualization from Limited Training Samples [52.549928980694695]
In situ hybridization (ISH) gene expression pattern image from the same developmental stage。
正確な段階のトレーニングデータをラベル付けするのは、生物学者にとっても非常に時間がかかる。
限られた訓練画像を用いてISH画像を正確に分類する2段階の低ショット学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-20T06:06:06Z) - Multi-species Seagrass Detection and Classification from Underwater
Images [1.2233362977312945]
本稿では,深層畳み込みニューラルネットワークに基づく海草の多種検出と分類器を提案する。
また,画像パッチを半自動でラベル付けする簡単な手法を導入し,手動ラベリングの要件を最小化する。
この研究で収集したデータセットと、実験を再現するためのコードと事前訓練されたモデルについて、公開してリリースします。
論文 参考訳(メタデータ) (2020-09-18T07:20:44Z) - Model Watermarking for Image Processing Networks [120.918532981871]
深層モデルの知的財産権を保護する方法は、非常に重要であるが、真に研究されていない問題である。
画像処理モデルを保護するための最初のモデル透かしフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-25T18:36:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。