Fugu-MT 論文翻訳(概要): Self-Supervised Learning of Plant Image Representations

論文の概要: Self-Supervised Learning of Plant Image Representations

arxiv url: http://arxiv.org/abs/2604.27538v1
Date: Thu, 30 Apr 2026 07:41:49 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-01 16:31:53.973398
Title: Self-Supervised Learning of Plant Image Representations
Title（参考訳）: 植物画像表現の自己教師付き学習
Authors: Ilyass Moummad, Kawtar Zaher, Hervé Goëau, Jean-Christophe Lombardo, Pierre Bonnet, Alexis Joly,
Abstract要約: 自己教師型学習は教師型学習に代わるスケーラブルな代替手段を提供する。植物画像におけるSSLパイプラインの増大は有害であることを示す。我々は、この領域にもっと適したアフィンやポスター化を含む代替の変換を識別する。
参考スコア（独自算出の注目度）: 3.958317527488534
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Automated plant recognition plays a crucial role in biodiversity monitoring and conservation, yet current approaches rely heavily on supervised learning, which is limited by the availability of expert-labeled data. Self-supervised learning (SSL) offers a scalable alternative, but existing methods and training protocols are largely designed for coarse-grained visual tasks and may not transfer well to fine-grained domains such as plant species recognition. In this work, we investigate SSL for plant image representation learning. We show that commonly used augmentations in SSL pipelines - such as Gaussian blur, grayscale conversion, and solarization - are detrimental in the context of plant images, as they remove subtle discriminative cues essential for fine-grained recognition. We instead identify alternative transformations, including affine and posterization, that are better suited to this domain. We further demonstrate that training SimDINOv2 on the iNaturalist 2021 Plantae subset yields significantly stronger representations than training on ImageNet-1K, highlighting the importance of domain-specific data for SSL. Our findings are consistent across both ViT-Base and ViT-Large architectures. Moreover, our models achieve competitive performance and sometimes outperform strong supervised baselines Pl@ntCLEF and BioCLIP on downstream plant recognition tasks in few-shot settings. Overall, our results highlight the critical importance of domain-adapted augmentation strategies and dataset selection in self-supervised learning, and provide practical guidelines for building scalable models for biodiversity monitoring.
Abstract（参考訳）: 植物の自動認識は生物多様性の監視と保全において重要な役割を担っているが、現在のアプローチは、専門家ラベル付きデータの可用性によって制限される教師付き学習に大きく依存している。自己教師付き学習(SSL)はスケーラブルな代替手段を提供するが、既存の手法や訓練プロトコルは主に粗い視覚タスクのために設計されており、植物種認識のようなきめ細かいドメインにうまく移行しない可能性がある。本研究では,植物画像表現学習のためのSSLについて検討する。 SSLパイプラインでは, ガウスのぼかし, グレースケールの変換, 太陽化など, 微粒化に欠かせない微妙な差別的手がかりを除去するため, 植物画像の文脈において有害であることを示す。代わりに、このドメインにもっと適したアフィンやラスタライゼーションなど、代替の変換を特定します。さらに、iNaturalist 2021 Plantaeサブセット上でSimDINOv2をトレーニングすると、ImageNet-1Kでのトレーニングよりもはるかに強力な表現が得られることを実証し、SSLにおけるドメイン固有データの重要性を強調した。我々の発見はViT-BaseアーキテクチャとViT-Largeアーキテクチャの両方で一致している。さらに,本モデルでは,下流植物認識タスクにおいて,競合性能を達成し,時には強力な教師付きベースラインPl@ntCLEFやBioCLIPよりも優れる。全体として、本研究は、自己教師付き学習におけるドメイン適応型強化戦略とデータセット選択の重要性を強調し、生物多様性モニタリングのためのスケーラブルなモデルを構築するための実践的ガイドラインを提供する。

関連論文リスト

Scale-Aware Self-Supervised Learning for Segmentation of Small and Sparse Structures [8.202335520689024]
自己教師付き学習は、限定的なアノテーション体制下での表現学習の強力な戦略として登場した。そこで本研究では,小型の収穫機を拡張パイプラインに統合するSSL適応方式を提案する。データモダリティが著しく異なる2つの領域(地震イメージングとニューロイメージング)にまたがるこのアプローチを評価した。
論文参考訳（メタデータ） (2026-01-26T15:58:04Z)
BotaCLIP: Contrastive Learning for Botany-Aware Representation of Earth Observation Data [5.63123057685834]
BotaCLIPは、訓練済みの基礎モデルを適用してドメイン固有の知識を注入するための軽量フレームワークである。本稿では,BotaCLIPがデータスカース設定に専門家の知識を注入し,フラジカル表現学習を可能にする方法を示す。
論文参考訳（メタデータ） (2025-11-26T09:19:06Z)
Rethinking Plant Disease Diagnosis: Bridging the Academic-Practical Gap with Vision Transformers and Zero-Shot Learning [2.3536628395905974]
注意に基づくアーキテクチャとゼロショット学習アプローチが、キュレートされた学術データセットと現実世界の農業環境とのギャップを埋めるかどうかを検討する。 CNN(Convolutional Neural Networks)、ビジョントランスフォーマー(Vision Transformers)、およびCLIP(Contrastive Language- Image Pre-training)ベースのゼロショットモデルである。
論文参考訳（メタデータ） (2025-11-24T11:08:01Z)
Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文参考訳（メタデータ） (2023-12-12T14:45:45Z)
In-Domain Self-Supervised Learning Improves Remote Sensing Image Scene Classification [5.323049242720532]
リモートセンシング画像分類のための有望なアプローチとして,自己教師付き学習が登場している。そこで本研究では,14の下流データセットにまたがる自己教師型事前学習戦略について検討し,その効果を評価する。
論文参考訳（メタデータ） (2023-07-04T10:57:52Z)
Deep face recognition with clustering based domain adaptation [57.29464116557734]
そこで本研究では,ターゲットドメインとソースがクラスを共有しない顔認識タスクを対象とした,クラスタリングに基づく新しいドメイン適応手法を提案する。本手法は,特徴領域をグローバルに整列させ,その一方で,対象クラスタを局所的に識別することで,識別対象特徴を効果的に学習する。
論文参考訳（メタデータ） (2022-05-27T12:29:11Z)
Domain-Aware Continual Zero-Shot Learning [52.349332188116975]
ドメイン対応連続ゼロショット学習(DACZSL)は、連続的に変化するドメインにおいて、目に見えないカテゴリの画像を認識するタスクである。そこで本研究では,ドメインシフトのための因子化特徴を学習するためのドメイン不変ネットワーク(DIN)を提案し,未知のクラスに対するテキスト表現を改善した。以上の結果から,DINは既存のベースラインよりも高調波精度で5%以上,後方転送で1%以上優れていた。
論文参考訳（メタデータ） (2021-12-24T08:17:18Z)
Improving Self-supervised Learning with Hardness-aware Dynamic Curriculum Learning: An Application to Digital Pathology [2.2742357407157847]
自己教師付き学習(SSL)は、最近、多くの画像解析タスクに有用な汎用的な視覚表現を学習する大きな可能性を示している。既存のSSLメソッドは、ラベル付きトレーニングインスタンスの数が少ない場合や、転送ドメイン間のドメインシフトが重要である場合、ダウンストリームタスクに一般化できない。本稿では,カリキュラム学習のレンズを用いて,自己指導型事前学習表現の改善を試みる。
論文参考訳（メタデータ） (2021-08-16T15:44:48Z)
PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文参考訳（メタデータ） (2020-11-25T11:03:11Z)
Deep Low-Shot Learning for Biological Image Classification and Visualization from Limited Training Samples [52.549928980694695]
In situ hybridization (ISH) gene expression pattern image from the same developmental stage。正確な段階のトレーニングデータをラベル付けするのは、生物学者にとっても非常に時間がかかる。限られた訓練画像を用いてISH画像を正確に分類する2段階の低ショット学習フレームワークを提案する。
論文参考訳（メタデータ） (2020-10-20T06:06:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。