論文の概要: Improving Data-Efficient Fossil Segmentation via Model Editing
- arxiv url: http://arxiv.org/abs/2210.03879v2
- Date: Mon, 10 Apr 2023 03:43:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 23:26:44.101371
- Title: Improving Data-Efficient Fossil Segmentation via Model Editing
- Title(参考訳): モデル編集によるデータ効率の高い化石セグメンテーションの改善
- Authors: Indu Panigrahi, Ryan Manzuk, Adam Maloof, Ruth Fong
- Abstract要約: 少ないラベル付き画像で化石セグメンテーションを改善するための2つのパラダイムを提案する。
我々は,Mask R-CNNが化石の異なる分類を区別できないことを明らかにするために,ドメインインフォームの画像摂動を適用した。
我々は,画像分類における体系的な誤りを,ラベル付き追加データを必要としない画像分割に補正する既存のモデル編集手法を拡張した。
- 参考スコア(独自算出の注目度): 4.683612295430956
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most computer vision research focuses on datasets containing thousands of
images of commonplace objects. However, many high-impact datasets, such as
those in medicine and the geosciences, contain fine-grain objects that require
domain-expert knowledge to recognize and are time-consuming to collect and
annotate. As a result, these datasets contain few labeled images, and current
machine vision models cannot train intensively on them. Originally introduced
to correct large-language models, model-editing techniques in machine learning
have been shown to improve model performance using only small amounts of data
and additional training. Using a Mask R-CNN to segment ancient reef fossils in
rock sample images, we present a two-part paradigm to improve fossil
segmentation with few labeled images: we first identify model weaknesses using
image perturbations and then mitigate those weaknesses using model editing.
Specifically, we apply domain-informed image perturbations to expose the Mask
R-CNN's inability to distinguish between different classes of fossils and its
inconsistency in segmenting fossils with different textures. To address these
shortcomings, we extend an existing model-editing method for correcting
systematic mistakes in image classification to image segmentation with no
additional labeled data needed and show its effectiveness in decreasing
confusion between different kinds of fossils. We also highlight the best
settings for model editing in our situation: making a single edit using all
relevant pixels in one image (vs. using multiple images, multiple edits, or
fewer pixels). Though we focus on fossil segmentation, our approach may be
useful in other similar fine-grain segmentation problems where data is limited.
- Abstract(参考訳): ほとんどのコンピュータビジョン研究は、何千もの共通のオブジェクトの画像を含むデータセットに焦点を当てている。
しかし、医学や地球科学などの多くの高インパクトデータセットには、ドメインエキスパートの知識を必要とする細粒のオブジェクトが含まれており、収集や注釈に時間を要する。
その結果、これらのデータセットにはラベル付きイメージがほとんど含まれておらず、現在のマシンビジョンモデルは集中的にトレーニングすることはできない。
もともと大規模な言語モデルを修正するために導入された機械学習のモデル編集技術は、少量のデータと追加のトレーニングだけでモデルパフォーマンスを改善することが示されている。
Mask R-CNNを用いて古代のサンゴ礁の化石を岩石サンプル画像に分割し、ラベル付き画像がほとんどない状態で化石の断片化を改善するための2つのパラダイムを提示する。
具体的には,マスクr-cnnが異なる種類の化石を区別できないことや,テクスチャの異なる化石を分割することの矛盾を露呈するために,ドメインインフォーム画像摂動を適用する。
これらの欠点に対処するため,画像分類における系統的な誤りを,ラベル付きデータを必要としない画像分割に補正する既存のモデル編集手法を拡張し,異なる種類の化石の混同を減少させる効果を示す。
我々はまた、我々の状況におけるモデル編集の最良の設定を強調している: 1つの画像中のすべての関連するピクセルを使って、1つの編集を行う(例えば、複数の画像、複数の編集、またはより少ないピクセルを使用する)。
化石のセグメンテーションに注目するが、我々のアプローチは、データに制限がある他の類似した微細粒セグメンテーション問題に有用かもしれない。
関連論文リスト
- UnSeg: One Universal Unlearnable Example Generator is Enough against All Image Segmentation [64.01742988773745]
未承認のプライベートデータ上での大規模なイメージセグメンテーションモデルのトレーニングに関して、プライバシーに関する懸念が高まっている。
我々は、学習不可能な例の概念を利用して、学習不可能なノイズを原画像に生成し、付加することにより、モデルトレーニングに使用不能な画像を作成する。
6つのメインストリームイメージセグメンテーションタスク、10つの広く使われているデータセット、7つの異なるネットワークアーキテクチャでUnSegの有効性を実証的に検証する。
論文 参考訳(メタデータ) (2024-10-13T16:34:46Z) - Are Deep Learning Models Robust to Partial Object Occlusion in Visual Recognition Tasks? [4.9260675787714]
畳み込みニューラルネットワーク(CNN)を含む画像分類モデルは、様々な分類タスクでうまく機能するが、部分閉塞下では困難である。
我々は最近開発されたOccluded Video Instance(IRUO)データセット(arXiv:2102.01558)を基にした画像認識(IRUO)データセットをコントリビュートする。
現代のCNNベースモデルでは、従来のCNNベースモデルと比較して、隠蔽画像の認識精度が向上しており、ViTベースモデルは隠蔽画像のCNNベースモデルよりも精度が高いことが判明した。
論文 参考訳(メタデータ) (2024-09-16T23:21:22Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Deep Image Composition Meets Image Forgery [0.0]
画像偽造は長年研究されてきた。
ディープラーニングモデルは、トレーニングのために大量のラベル付きデータを必要とする。
本研究では,画像合成深層学習モデルを用いて,実生活における操作の質に近いスプライシング画像を生成する。
論文 参考訳(メタデータ) (2024-04-03T17:54:37Z) - The Change You Want to See (Now in 3D) [65.61789642291636]
本稿の目的は、同じ3Dシーンの2つの「野生」画像の間で何が変わったかを検出することである。
我々は,全合成データに基づいて学習し,クラスに依存しない変化検出モデルに貢献する。
我々は,人間に注釈を付けた実世界のイメージペアによる評価データセットを新たにリリースした。
論文 参考訳(メタデータ) (2023-08-21T01:59:45Z) - Effective Data Augmentation With Diffusion Models [65.09758931804478]
我々は、事前訓練されたテキスト・画像拡散モデルによりパラメータ化された画像・画像変換によるデータ拡張の多様性の欠如に対処する。
本手法は,市販の拡散モデルを用いて画像のセマンティクスを編集し,いくつかのラベル付き例から新しい視覚概念に一般化する。
本手法は,実世界の雑草認識タスクと数ショット画像分類タスクにおいて評価し,テスト領域における精度の向上を観察する。
論文 参考訳(メタデータ) (2023-02-07T20:42:28Z) - A Generalist Framework for Panoptic Segmentation of Images and Videos [61.61453194912186]
我々は,タスクの帰納バイアスに頼ることなく,離散的なデータ生成問題としてパノプティクスセグメンテーションを定式化する。
単純な構造と一般的な損失関数を持つパノスコープマスクをモデル化するための拡散モデルを提案する。
本手法は,動画を(ストリーミング環境で)モデル化し,オブジェクトのインスタンスを自動的に追跡することを学ぶ。
論文 参考訳(メタデータ) (2022-10-12T16:18:25Z) - Terrain Classification using Transfer Learning on Hyperspectral Images:
A Comparative study [0.13999481573773068]
畳み込みニューラルネットワーク(CNN)とMulti-Layer Perceptron(MLP)は画像分類の有効な方法であることが証明されている。
しかし、彼らは長いトレーニング時間と大量のラベル付きデータの要求の問題に悩まされている。
本稿では,移動学習法を用いてトレーニング時間を短縮し,大規模ラベル付きデータセットへの依存を減らすことを提案する。
論文 参考訳(メタデータ) (2022-06-19T14:36:33Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - Rethinking Natural Adversarial Examples for Classification Models [43.87819913022369]
ImageNet-Aは、自然対比例の有名なデータセットです。
オブジェクト検出技術を用いたImageNet-A例の背景影響を低減して仮説を検証した。
実験により,様々な分類モデルを用いた物体検出モデルは,その分類モデルよりも精度が高かった。
論文 参考訳(メタデータ) (2021-02-23T14:46:48Z) - Syn2Real: Forgery Classification via Unsupervised Domain Adaptation [1.8229783460536682]
本稿では,ディープセマンティック・イメージ・インペイントとコピー・モーブ・フォージェリ・アルゴリズムを用いた合成鍛造データセットを提案する。
我々は、教師なしドメイン適応ネットワークを用いて、合成されたデータセットから特徴空間をマッピングすることで、新しいドメインのコピー・モーブ偽造を検出する。
論文 参考訳(メタデータ) (2020-02-03T15:02:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。