論文の概要: Large-Scale Data Mining of Rapid Residue Detection Assay Data From HTML
and PDF Documents: Improving Data Access and Visualization for Veterinarians
- arxiv url: http://arxiv.org/abs/2112.00962v1
- Date: Thu, 2 Dec 2021 03:39:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-04 04:55:38.664052
- Title: Large-Scale Data Mining of Rapid Residue Detection Assay Data From HTML
and PDF Documents: Improving Data Access and Visualization for Veterinarians
- Title(参考訳): htmlおよびpdf文書からの迅速残差検出データの大規模データマイニング:獣医のためのデータアクセスと可視化の改善
- Authors: Majid Jaberi-Douraki, Soudabeh Taghian Dinani, Nuwan Indika Millagaha
Gedara, Xuan Xu, Emily Richards, Fiona Maunsell, Nader Zad, Lisa Ann Tell
- Abstract要約: 食品動物医学におけるエクストララベル薬物の使用は、米国動物医薬品使用明確化法(AMDUCA)によって認可されている。
時々、離脱間隔や多くの動物を治療する科学的なデータがあるため、薬物残基を検査する必要が生じる。
家畜の健康を守るために、農薬の残留物を監視するために、迅速な農薬試験が不可欠である。
- 参考スコア(独自算出の注目度): 3.055086390437118
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extra-label drug use in food animal medicine is authorized by the US Animal
Medicinal Drug Use Clarification Act (AMDUCA), and estimated withdrawal
intervals are based on published scientific pharmacokinetic data. Occasionally
there is a paucity of scientific data on which to base a withdrawal interval or
a large number of animals being treated, driving the need to test for drug
residues. Rapid assay commercial farm-side tests are essential for monitoring
drug residues in animal products to protect human health. Active ingredients,
sensitivity, matrices, and species that have been evaluated for commercial
rapid assay tests are typically reported on manufacturers' websites or in PDF
documents that are available to consumers but may require a special access
request. Additionally, this information is not always correlated with
FDA-approved tolerances. Furthermore, parameter changes for these tests can be
very challenging to regularly identify, especially those listed on websites or
in documents that are not publicly available. Therefore, artificial
intelligence plays a critical role in efficiently extracting the data and
ensure current information. Extracting tables from PDF and HTML documents has
been investigated both by academia and commercial tool builders. Research in
text mining of such documents has become a widespread yet challenging arena in
implementing natural language programming. However, techniques of extracting
tables are still in their infancy and being investigated and improved by
researchers. In this study, we developed and evaluated a data-mining method for
automatically extracting rapid assay data from electronic documents. Our
automatic electronic data extraction method includes a software package module,
a developed pattern recognition tool, and a data mining engine. Assay details
were provided by several commercial entities that produce these rapid drug
residue assay
- Abstract(参考訳): 食品動物医学におけるエクストララベル薬物の使用は、米国動物医薬品使用明確化法(AMDUCA)によって認可され、推定離脱間隔は、公表された科学薬理学データに基づいて決定される。
時々、離脱期間や治療中の多数の動物を基盤とする科学的なデータがあるため、薬物残基のテストが必要となる。
市販のファームサイド試験は、ヒトの健康を守るために動物製品の薬物残基を監視するのに不可欠である。
市販の迅速検査試験で評価された有効成分、感度、マトリックス、種は、一般的にメーカーのウェブサイトやpdf文書で報告され、消費者は利用できるが特別なアクセス要求を必要とする。
さらに、この情報はFDAが承認した寛容と常に相関しているわけではない。
さらに、これらのテストのパラメータの変更は、定期的に識別するのが非常に難しく、特にwebサイトや公開されていないドキュメントにリストアップされる。
したがって、人工知能はデータを効率的に抽出し、現在の情報を確保する上で重要な役割を果たす。
PDFとHTMLドキュメントからテーブルを抽出することは、学術と商用ツールビルダーの両方で研究されている。
このような文書のテキストマイニングの研究は、自然言語プログラミングの実装において広く、そして困難な領域となっている。
しかし、テーブルの抽出技術はまだ初期段階にあり、研究者によって調査・改良されている。
本研究では,電子文書から迅速アッセイデータを自動抽出するデータマイニング手法を開発し,評価した。
自動電子データ抽出法は,ソフトウェアパッケージモジュール,パターン認識ツール,データマイニングエンジンを備える。
アッセイの詳細は、これらの急速な薬物残基アッセイを生産するいくつかの商業団体によって提供された。
関連論文リスト
- DrugAgent: Explainable Drug Repurposing Agent with Large Language Model-based Reasoning [10.528489471229946]
本稿では,最先端の機械学習技術と知識統合を用いた医薬品再調達プロセスを強化するためのマルチエージェントフレームワークを提案する。
AIエージェントは、DTIモデルを訓練し、知識グラフエージェントはDGIdbを使用してDTIを系統的に抽出する。
これらのエージェントからの出力を統合することで、外部データベースを含む多様なデータソースを効果的に活用し、実行可能な再資源化候補を提案する。
論文 参考訳(メタデータ) (2024-08-23T21:24:59Z) - "Hey..! This medicine made me sick": Sentiment Analysis of User-Generated Drug Reviews using Machine Learning Techniques [2.2874754079405535]
本研究は、特定の薬物に関するユーザレビューを、ポジティブ、ネガティブ、中立などの異なるクラスに分類する薬物レビュー分類システムを提案する。
収集されたデータは手動でラベル付けされ、ラベルが正しいことを保証するために手動で検証される。
論文 参考訳(メタデータ) (2024-04-09T08:42:34Z) - Learning to Describe for Predicting Zero-shot Drug-Drug Interactions [54.172575323610175]
薬物と薬物の相互作用は同時投与の有効性を損なう可能性がある。
従来のDDI予測の計算手法では、知識不足のため、新しい薬物の相互作用を捉えることができない可能性がある。
言語モデルに基づくDDI予測器と強化学習(RL)に基づく情報セレクタを用いたテキストDDIを提案する。
論文 参考訳(メタデータ) (2024-03-13T09:42:46Z) - ImDrug: A Benchmark for Deep Imbalanced Learning in AI-aided Drug
Discovery [79.08833067391093]
現実世界の医薬品のデータセットは、しばしば高度に不均衡な分布を示す。
ImDrugはオープンソースのPythonライブラリを備えたベンチマークで、4つの不均衡設定、11のAI対応データセット、54の学習タスク、16のベースラインアルゴリズムで構成されています。
ドラッグ発見パイプラインの幅広い範囲にまたがる問題やソリューションに対して、アクセス可能でカスタマイズ可能なテストベッドを提供する。
論文 参考訳(メタデータ) (2022-09-16T13:35:57Z) - Black-box Dataset Ownership Verification via Backdoor Watermarking [67.69308278379957]
我々は、リリースデータセットの保護を、(目立たしい)サードパーティモデルのトレーニングに採用されているかどうかの検証として定式化する。
バックドアの透かしを通じて外部パターンを埋め込んでオーナシップの検証を行い,保護することを提案する。
具体的には、有毒なバックドア攻撃(例えばBadNets)をデータセットのウォーターマーキングに利用し、データセット検証のための仮説テストガイダンスメソッドを設計する。
論文 参考訳(メタデータ) (2022-08-04T05:32:20Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - DrugOOD: Out-of-Distribution (OOD) Dataset Curator and Benchmark for
AI-aided Drug Discovery -- A Focus on Affinity Prediction Problems with Noise
Annotations [90.27736364704108]
我々は、AI支援薬物発見のための体系的なOODデータセットキュレーターおよびベンチマークであるTarmOODを提案する。
DrugOODには、ベンチマークプロセスを完全に自動化するオープンソースのPythonパッケージが付属している。
我々は、薬物標的結合親和性予測という、AIDDにおける最も重要な問題の1つに焦点を当てる。
論文 参考訳(メタデータ) (2022-01-24T12:32:48Z) - Neural Medication Extraction: A Comparison of Recent Models in
Supervised and Semi-supervised Learning Settings [0.751289645756884]
薬物処方は、電子カルテにエンコードされなければならない重要な情報である。
これが薬品抽出作業の現況である。
我々は、I2B2医療処方薬抽出タスクにおいて、最先端のニューラルネットワークアーキテクチャを独立して総合的に評価する。
論文 参考訳(メタデータ) (2021-10-19T19:23:38Z) - Semi-Supervised Exaggeration Detection of Health Science Press Releases [23.930041685595775]
近年の研究では、研究結果を誇張することで、メディアが科学論文を誤って表現する傾向が示されている。
本稿では,科学コミュニケーションにおける誇張検出問題の形式化と研究について述べる。
本稿では,補完的なクローゼスタイルのQAタスクからの知識を活用し,数発の学習を改善する多タスク版であるMT-PETを紹介する。
論文 参考訳(メタデータ) (2021-08-30T19:32:20Z) - Data Mining with Big Data in Intrusion Detection Systems: A Systematic
Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。
データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。
ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文 参考訳(メタデータ) (2020-05-23T20:57:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。