論文の概要: Horizon Scans can be accelerated using novel information retrieval and artificial intelligence tools
- arxiv url: http://arxiv.org/abs/2504.01627v1
- Date: Wed, 02 Apr 2025 11:33:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:25:33.365333
- Title: Horizon Scans can be accelerated using novel information retrieval and artificial intelligence tools
- Title(参考訳): 新たな情報検索と人工知能ツールにより、ホライゾンスカンを加速できる
- Authors: Lena Schmidt, Oshin Sharma, Chris Marshall, Sonia Garcia Gonzalez Moral,
- Abstract要約: この研究は、水平線スキャンを改善するために設計されたオープンソースのPythonベースのツールであるSCANARとAIDOCを紹介している。
SCANARはニュース記事の検索と処理を自動化する。
AIDOCは、AIを活用して関連性に基づいてテキストデータを順序付けし、セマンティックな類似性のためにニューラルネットワークを使用し、その後、人間のレビューに関連性のあるエントリを優先順位付けすることで、フィルタリングを支援する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Introduction: Horizon scanning in healthcare assesses early signals of innovation, crucial for timely adoption. Current horizon scanning faces challenges in efficient information retrieval and analysis, especially from unstructured sources like news, presenting a need for innovative tools. Methodology: The study introduces SCANAR and AIDOC, open-source Python-based tools designed to improve horizon scanning. SCANAR automates the retrieval and processing of news articles, offering functionalities such as de-duplication and unsupervised relevancy ranking. AIDOC aids filtration by leveraging AI to reorder textual data based on relevancy, employing neural networks for semantic similarity, and subsequently prioritizing likely relevant entries for human review. Results: Twelve internal datasets from horizon scans and four external benchmarking datasets were used. SCANAR improved retrieval efficiency by automating processes previously dependent on manual labour. AIDOC displayed work-saving potential, achieving around 62% reduction in manual review efforts at 95% recall. Comparative analysis with benchmarking data showed AIDOC's performance was similar to existing systematic review automation tools, though performance varied depending on dataset characteristics. A smaller case-study on our news datasets shows the potential of ensembling large language models within the active-learning process for faster detection of relevant articles across news datasets. Conclusion: The validation indicates that SCANAR and AIDOC show potential to enhance horizon scanning efficiency by streamlining data retrieval and prioritisation. These tools may alleviate methodological limitations and allow broader, swifter horizon scans. Further studies are suggested to optimize these models and to design new workflows and validation processes that integrate large language models.
- Abstract(参考訳): 導入:医療における水平走査は、革新の初期の兆候を評価し、タイムリーな採用に不可欠である。
現在の地平線スキャンは、効率的な情報検索と分析、特にニュースのような構造化されていない情報源からの問題に直面し、革新的なツールの必要性を提示している。
Methodology: この研究は、水平線スキャンを改善するために設計されたオープンソースのPythonベースのツールであるSCANARとAIDOCを紹介している。
SCANARはニュース記事の検索と処理を自動化する。
AIDOCは、AIを活用して関連性に基づいてテキストデータを順序付けし、セマンティックな類似性のためにニューラルネットワークを使用し、その後、人間のレビューに関連性のあるエントリを優先順位付けすることで、フィルタリングを支援する。
結果: 地平線スキャンによる12の内部データセットと4つの外部ベンチマークデータセットを使用した。
SCANARは以前手作業に依存していたプロセスを自動化することで、検索効率を改善した。
AIDOCは作業削減の可能性を示し、95%のリコールでマニュアルレビューの取り組みを約62%削減した。
ベンチマークデータとの比較分析によると、AIDOCのパフォーマンスは既存のシステムレビュー自動化ツールと似ているが、データセットの特性によって性能は異なる。
ニュースデータセットのケーススタディを小さくすると、アクティブラーニングプロセス内で大きな言語モデルを統合し、ニュースデータセット全体にわたる関連記事の検出を高速化する可能性が示される。
結論: SCANAR と AIDOC はデータ検索と優先順位付けの合理化により地平線走査効率を高める可能性を示した。
これらのツールは、方法論上の制限を緩和し、より広範に高速な地平線スキャンを可能にする。
これらのモデルを最適化し、大きな言語モデルを統合する新しいワークフローと検証プロセスを設計するためのさらなる研究が提案されている。
関連論文リスト
- Large Language Models and Synthetic Data for Monitoring Dataset Mentions in Research Papers [0.0]
本稿では,研究領域間のデータセット参照検出を自動化する機械学習フレームワークを提案する。
我々は,研究論文からゼロショット抽出,品質評価のためのLCM-as-a-Judge,および改良のための推論剤を用いて,弱教師付き合成データセットを生成する。
推論では、ModernBERTベースの分類器がデータセットの参照を効率的にフィルタリングし、高いリコールを維持しながら計算オーバーヘッドを低減する。
論文 参考訳(メタデータ) (2025-02-14T16:16:02Z) - Enhancing Feature Selection and Interpretability in AI Regression Tasks Through Feature Attribution [38.53065398127086]
本研究では、回帰問題に対する入力データの非形式的特徴をフィルタリングする特徴属性法の可能性について検討する。
我々は、初期データ空間から最適な変数セットを選択するために、統合グラディエントとk平均クラスタリングを組み合わせた機能選択パイプラインを導入する。
提案手法の有効性を検証するため, ターボ機械の開発過程における羽根振動解析を実世界の産業問題に適用した。
論文 参考訳(メタデータ) (2024-09-25T09:50:51Z) - Optimizing News Text Classification with Bi-LSTM and Attention Mechanism for Efficient Data Processing [4.523790140313845]
本稿では,ディープラーニングに基づくニューステキストの自動分類手法を提案する。
高度な機械学習アルゴリズムを導入することにより、ニューステキストの効率的な分類と管理を実現する。
ニュース業界の情報処理能力を向上させるために重要な実践的重要性を持っている。
論文 参考訳(メタデータ) (2024-09-23T22:23:08Z) - Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。
具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文 参考訳(メタデータ) (2023-12-03T13:50:24Z) - STAR: Boosting Low-Resource Information Extraction by Structure-to-Text
Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。
我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。
実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-05-24T12:15:19Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - BERT WEAVER: Using WEight AVERaging to enable lifelong learning for
transformer-based models in biomedical semantic search engines [49.75878234192369]
We present WEAVER, a simple, yet efficient post-processing method that infuse old knowledge into the new model。
WEAVERを逐次的に適用すると、同じ単語の埋め込み分布が、一度にすべてのデータに対する総合的なトレーニングとして得られることを示す。
論文 参考訳(メタデータ) (2022-02-21T10:34:41Z) - Efficient Nearest Neighbor Language Models [114.40866461741795]
非パラメトリックニューラルネットワークモデル(NLM)は、外部データストアを用いてテキストの予測分布を学習する。
比較性能を維持しながら、推論速度の最大6倍の高速化を実現する方法を示す。
論文 参考訳(メタデータ) (2021-09-09T12:32:28Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - A Span Extraction Approach for Information Extraction on Visually-Rich
Documents [2.3131309703965135]
視覚豊かな文書(VRD)を事前学習する言語モデルの能力向上のための新しいアプローチを提案する。
まず、クエリベースの新しいIEモデルを導入し、一般的に使用されるシーケンスラベリングアプローチの代わりにスパン抽出の定式化を採用する。
また、文書内の意味的エンティティ間の関係をモデル化することに焦点を当てた新しいトレーニングタスクを提案する。
論文 参考訳(メタデータ) (2021-06-02T06:50:04Z) - Improving the Performance of Fine-Grain Image Classifiers via Generative
Data Augmentation [0.5161531917413706]
我々は、ロバスト生成アドリアルネットワーク(DAPPER GAN)の熟練した事前学習からデータ拡張を開発する。
DAPPER GANは、トレーニングイメージの新しいビューを自動的に生成するML分析支援ツールである。
本手法をStanford Carsデータセット上で実験的に評価し,車体形状とモデル分類精度の向上を実証した。
論文 参考訳(メタデータ) (2020-08-12T15:29:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。