論文の概要: Hespi: A pipeline for automatically detecting information from hebarium specimen sheets
- arxiv url: http://arxiv.org/abs/2410.08740v1
- Date: Fri, 11 Oct 2024 11:59:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-30 22:15:28.791811
- Title: Hespi: A pipeline for automatically detecting information from hebarium specimen sheets
- Title(参考訳): Hespi: Hebarium検体シートからの情報を自動的に検出するパイプライン
- Authors: Robert Turnbull, Emily Fitzgerald, Karen Thompson, Joanne L. Birch,
- Abstract要約: Hespiは、デジタル画像から、ハーバリウム標本の機関ラベルの収集データのカタログ前サブセットを抽出する。
パイプラインはテキストベースの機関ラベルを印刷、タイプ、手書き、または組み合わせとして分類する。
Hespiは、国際的な草原から標本シート画像を含むテストデータセットのテキストを正確に検出し、抽出する。
- 参考スコア(独自算出の注目度): 6.749750044497731
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Specimen associated biodiversity data are sought after for biological, environmental, climate, and conservation sciences. A rate shift is required for the extraction of data from specimen images to eliminate the bottleneck that the reliance on human-mediated transcription of these data represents. We applied advanced computer vision techniques to develop the `Hespi' (HErbarium Specimen sheet PIpeline), which extracts a pre-catalogue subset of collection data on the institutional labels on herbarium specimens from their digital images. The pipeline integrates two object detection models; the first detects bounding boxes around text-based labels and the second detects bounding boxes around text-based data fields on the primary institutional label. The pipeline classifies text-based institutional labels as printed, typed, handwritten, or a combination and applies Optical Character Recognition (OCR) and Handwritten Text Recognition (HTR) for data extraction. The recognized text is then corrected against authoritative databases of taxon names. The extracted text is also corrected with the aide of a multimodal Large Language Model (LLM). Hespi accurately detects and extracts text for test datasets including specimen sheet images from international herbaria. The components of the pipeline are modular and users can train their own models with their own data and use them in place of the models provided.
- Abstract(参考訳): 生物多様性に関するデータは、生物、環境、気候、および保護科学のために研究されている。
検体画像からのデータの抽出にはレートシフトが必要であり、これらのデータの人為的転写に依存するボトルネックを排除できる。
我々は,先進的なコンピュータビジョン技術を用いて,デジタル画像からハーバリウム標本の収集データのカタログ前サブセットを抽出する"Hespi"(Herbarium Specimen sheet PIpeline)を開発した。
パイプラインは2つのオブジェクト検出モデルを統合する。第1はテキストベースのラベルのバウンディングボックスを検出し、第2はテキストベースのデータフィールドのバウンディングボックスを検出する。
このパイプラインは、テキストベースの機関ラベルを印刷、タイプ、手書き、または組み合わせとして分類し、データ抽出に光学文字認識(OCR)と手書き文字認識(HTR)を適用する。
認識されたテキストは、分類名の権威あるデータベースに対して修正される。
抽出されたテキストは、マルチモーダル大言語モデル(LLM)の側近で補正される。
Hespiは、国際的な草原から標本シート画像を含むテストデータセットのテキストを正確に検出し、抽出する。
パイプラインのコンポーネントはモジュール化されており、ユーザは自身のデータで独自のモデルをトレーニングし、提供されたモデルの代わりに使用することができる。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Human-in-the-Loop Synthetic Text Data Inspection with Provenance Tracking [11.022295941449919]
Inspectorは,ループ内データ検査技術である。
ユーザスタディでは,感情分析タスクでは3X,ヘイトスピーチ検出タスクでは4X,正確なラベル付きテキスト数が増加する。
論文 参考訳(メタデータ) (2024-04-29T17:16:27Z) - Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - Named Entity Recognition for Address Extraction in Speech-to-Text
Transcriptions Using Synthetic Data [0.0]
本稿では,BERTアーキテクチャによる双方向表現に基づく名前付きエンティティ認識(NER)モデルの構築手法を提案する。
このNERモデルは、音声からテキストへの書き起こしから取得したデータからアドレス部分を抽出する。
合成データのみを訓練したNERモデルの性能を,小さな実データを用いて評価した。
論文 参考訳(メタデータ) (2024-02-08T10:29:11Z) - Enhancing Scene Text Detectors with Realistic Text Image Synthesis Using
Diffusion Models [63.99110667987318]
DiffTextは、前景のテキストと背景の本質的な特徴をシームレスにブレンドするパイプラインです。
テキストインスタンスが少なくなると、生成したテキストイメージはテキスト検出を支援する他の合成データを一貫して上回ります。
論文 参考訳(メタデータ) (2023-11-28T06:51:28Z) - DPIC: Decoupling Prompt and Intrinsic Characteristics for LLM Generated Text Detection [56.513637720967566]
大規模言語モデル(LLM)は、盗作、eコマースプラットフォームへの偽レビューの設置、炎症性偽ツイートなどの誤用のリスクを引き起こすテキストを生成することができる。
既存の高品質な検出手法では、本質的な特徴を抽出するために、モデルの内部にアクセスする必要がある。
ブラックボックスモデル生成テキストの深い内在特性を抽出する。
論文 参考訳(メタデータ) (2023-05-21T17:26:16Z) - TextDiffuser: Diffusion Models as Text Painters [118.30923824681642]
我々は、背景に忠実な視覚的に魅力的なテキストで画像を生成することに焦点を当てたTextDiffuserを紹介した。
我々は,OCRアノテーションを用いた最初の大規模テキスト画像データセットであるMARIO-10Mに,1000万の画像テキストペアをコントリビュートする。
テキストプロンプトのみまたはテキストテンプレート画像と併用して高品質なテキスト画像を作成し,テキストによる不完全な画像の再構成を行う,テキストディフューザは柔軟かつ制御可能であることを示す。
論文 参考訳(メタデータ) (2023-05-18T10:16:19Z) - Detecting Handwritten Mathematical Terms with Sensor Based Data [71.84852429039881]
本稿では,手書きの数学的用語を自動分類する,スタビロによるUbiComp 2021チャレンジの解を提案する。
入力データセットには異なるライターのデータが含まれており、ラベル文字列は合計15の異なる文字から構成されている。
論文 参考訳(メタデータ) (2021-09-12T19:33:34Z) - Object Detection Based Handwriting Localization [2.6641834518599308]
文書から手書き領域をローカライズするオブジェクト検出手法を提案する。
提案手法は手書き文字認識や署名検証などの他の作業を容易にすることも期待されている。
論文 参考訳(メタデータ) (2021-06-28T21:25:20Z) - DUET: Detection Utilizing Enhancement for Text in Scanned or Captured
Documents [1.4866448722906016]
提案手法は,テキスト検出だけでなく,ノイズ低減やテキスト領域の強調を行うように設計されている。
テキスト検出と強調のためにラベル付けされた文書画像の合成により,モデルのトレーニングデータを充実させる。
提案手法は,他のテキスト検出手法を上回る性能を有する実文書データセットで実証される。
論文 参考訳(メタデータ) (2021-06-10T07:08:31Z) - PharmKE: Knowledge Extraction Platform for Pharmaceutical Texts using
Transfer Learning [0.0]
PharmKEは、医薬品のセマンティック分析を徹底するために、いくつかの段階を通じてディープラーニングを適用するテキスト分析プラットフォームです。
この方法論は、正確なラベル付きトレーニングとテストデータセットの作成に使用され、カスタムエンティティラベリングタスクのモデルトレーニングに使用されます。
得られた結果は、同じデータセットで訓練された微調整BERTおよびBioBERTモデルと比較されます。
論文 参考訳(メタデータ) (2021-02-25T19:36:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。