論文の概要: BI-LAVA: Biocuration with Hierarchical Image Labeling through Active
Learning and Visual Analysis
- arxiv url: http://arxiv.org/abs/2308.08003v1
- Date: Tue, 15 Aug 2023 19:36:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-17 15:42:53.464142
- Title: BI-LAVA: Biocuration with Hierarchical Image Labeling through Active
Learning and Visual Analysis
- Title(参考訳): BI-LAVA:アクティブラーニングとビジュアル分析による階層的画像ラベリングによるバイオキュレーション
- Authors: Juan Trelles and Andrew Wentzel and William Berrios and G. Elisabeta
Marai
- Abstract要約: BI-LAVAは階層構造の科学画像を整理するシステムである。
イメージラベルの小さなセット、階層的なイメージ分類器のセット、そしてモデルビルダーが不完全なグランドトルースラベルを扱うのを助けるためにアクティブラーニングを使用する。
評価の結果,本手法は分類学におけるクラスの特徴を理解する上で,ドメインエキスパートを効果的に支援していることがわかった。
- 参考スコア(独自算出の注目度): 2.859324824091085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the biomedical domain, taxonomies organize the acquisition modalities of
scientific images in hierarchical structures. Such taxonomies leverage large
sets of correct image labels and provide essential information about the
importance of a scientific publication, which could then be used in biocuration
tasks. However, the hierarchical nature of the labels, the overhead of
processing images, the absence or incompleteness of labeled data, and the
expertise required to label this type of data impede the creation of useful
datasets for biocuration. From a multi-year collaboration with biocurators and
text-mining researchers, we derive an iterative visual analytics and active
learning strategy to address these challenges. We implement this strategy in a
system called BI-LAVA Biocuration with Hierarchical Image Labeling through
Active Learning and Visual Analysis. BI-LAVA leverages a small set of image
labels, a hierarchical set of image classifiers, and active learning to help
model builders deal with incomplete ground-truth labels, target a hierarchical
taxonomy of image modalities, and classify a large pool of unlabeled images.
BI-LAVA's front end uses custom encodings to represent data distributions,
taxonomies, image projections, and neighborhoods of image thumbnails, which
help model builders explore an unfamiliar image dataset and taxonomy and
correct and generate labels. An evaluation with machine learning practitioners
shows that our mixed human-machine approach successfully supports domain
experts in understanding the characteristics of classes within the taxonomy, as
well as validating and improving data quality in labeled and unlabeled
collections.
- Abstract(参考訳): 生物医学領域では、分類学は階層構造における科学的イメージの獲得モダリティを整理する。
このような分類は、大量の正しい画像ラベルを活用し、科学的な出版の重要性に関する重要な情報を提供する。
しかし、ラベルの階層的性質、画像処理のオーバーヘッド、ラベル付きデータの欠如または不完全性、およびこの種のデータをラベル付けるのに必要な専門知識は、バイオキュレーションのための有用なデータセットの作成を妨げる。
バイオキュレーターとテキストマイニング研究者との複数年間のコラボレーションから、これらの課題に対処するための反復的な視覚分析とアクティブラーニング戦略を導出する。
この戦略をbi-lava biocuration (bi-lava biocuration) というシステムで実装し,階層的な画像ラベリングを行う。
BI-LAVAは、小さなイメージラベルセット、階層的なイメージ分類器、アクティブラーニングを活用し、モデルビルダーが不完全な基底構造ラベルを扱うのを助け、画像モダリティの階層的な分類をターゲットとし、ラベルのない画像の大きなプールを分類する。
bi-lavaのフロントエンドは、データ分布、分類、画像投影、画像サムネイルの近傍を表すカスタムエンコーディングを使用して、モデル構築者が不慣れな画像データセットと分類を探索し、ラベルを訂正して生成するのに役立つ。
機械学習の実践者による評価では、分類学におけるクラスの特徴を理解し、ラベル付きコレクションやラベルなしコレクションのデータ品質を検証・改善する上で、ドメインエキスパートの育成に成功している。
関連論文リスト
- A Step Towards Worldwide Biodiversity Assessment: The BIOSCAN-1M Insect
Dataset [18.211840156134784]
本稿では,画像に基づく分類学的評価が可能なコンピュータビジョンモデルの訓練を目的とした,100万画像データセットを提案する。
このデータセットは魅力的な特徴も示しており、その研究はより広範な機械学習コミュニティにとって興味深いものとなるだろう。
論文 参考訳(メタデータ) (2023-07-19T20:54:08Z) - Graph Attention Transformer Network for Multi-Label Image Classification [50.0297353509294]
複雑なラベル間関係を効果的にマイニングできる多ラベル画像分類のための一般的なフレームワークを提案する。
提案手法は3つのデータセット上で最先端の性能を実現することができる。
論文 参考訳(メタデータ) (2022-03-08T12:39:05Z) - Boosting Entity-aware Image Captioning with Multi-modal Knowledge Graph [96.95815946327079]
名前付きエンティティの長期分布により、名前付きエンティティと視覚的キューの関係を学習することは困難である。
本稿では、視覚オブジェクトと名前付きエンティティを関連付けるために、マルチモーダルな知識グラフを構築する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-07-26T05:50:41Z) - Self-Ensembling Contrastive Learning for Semi-Supervised Medical Image
Segmentation [6.889911520730388]
限られたラベルを持つ医用画像セグメンテーションにおける半教師あり学習の性能向上を目指す。
我々は、ラベルのない画像に対照的な損失を与えることによって、特徴レベルで潜在表現を直接学習する。
我々はMRIとCTのセグメンテーションデータセットの実験を行い、提案手法が最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2021-05-27T03:27:58Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Graphonomy: Universal Image Parsing via Graph Reasoning and Transfer [140.72439827136085]
グラフィノノミー(Graphonomy)というグラフ推論・伝達学習フレームワークを提案する。
人間の知識とラベル分類を、局所畳み込みを超えた中間グラフ表現学習に組み込んでいる。
意味認識グラフの推論と転送を通じて、複数のドメインにおけるグローバルおよび構造化されたセマンティックコヒーレンシーを学習する。
論文 参考訳(メタデータ) (2021-01-26T08:19:03Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - Learning Representations For Images With Hierarchical Labels [1.3579420996461438]
クラスラベルによって誘導されるセマンティック階層に関する情報を活用するための一連の手法を提案する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の提供により、全体的な性能が向上することを示す。
しかし,CNN分類器には階層的な情報が注入され,組込みベースモデルでは,新たに提示された実世界ETHエコロジーコレクションイメージデータセットの階層非依存モデルよりも優れていた。
論文 参考訳(メタデータ) (2020-04-02T09:56:03Z) - Collaborative Learning of Semi-Supervised Clustering and Classification
for Labeling Uncurated Data [6.871887763122593]
ドメイン固有のイメージコレクションは、科学とビジネスの様々な領域において潜在的な価値を示す。
このような画像データに同時代の教師付き画像解析手法を採用するには、まずクリーン化と整理を行い、次に特定のドメインで使用される命名書に手動でラベル付けする必要がある。
我々はPludシステムの設計と実装を行い、専門家が費やした労力を最小限に抑え、現実的な大量の画像の収集を処理した。
論文 参考訳(メタデータ) (2020-03-09T17:03:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。