論文の概要: Mining Healthcare Procurement Data Using Text Mining and Natural
Language Processing -- Reflection From An Industrial Project
- arxiv url: http://arxiv.org/abs/2301.03458v1
- Date: Mon, 9 Jan 2023 15:59:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-10 16:52:01.615795
- Title: Mining Healthcare Procurement Data Using Text Mining and Natural
Language Processing -- Reflection From An Industrial Project
- Title(参考訳): テキストマイニングと自然言語処理を用いた医療調達データマイニング -産業プロジェクトからの考察-
- Authors: Ziqi Zhang, Tomas Jasaitis, Richard Freeman, Rowida Alfrjani, Adam
Funk
- Abstract要約: 我々は、医療分野における何百万もの異質な調達文書を採掘するテキストマイニングとNLPソリューションを開発する産業プロジェクトについて述べる。
ドメイン知識を効果的に活用し、複数のテキストマイニングやNLPタスクや言語に一般化する手法を用いる。
この手法を適用して数百万の調達文書をマイニングし,最初の構造化された調達契約データベースを開発する。
- 参考スコア(独自算出の注目度): 8.092450321868004
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While text mining and NLP research has been established for decades, there
remain gaps in the literature that reports the use of these techniques in
building real-world applications. For example, they typically look at single
and sometimes simplified tasks, and do not discuss in-depth data heterogeneity
and inconsistency that is common in real-world problems or their implication on
the development of their methods. Also, few prior work has focused on the
healthcare domain. In this work, we describe an industry project that developed
text mining and NLP solutions to mine millions of heterogeneous, multilingual
procurement documents in the healthcare sector. We extract structured
procurement contract data that is used to power a platform for dynamically
assessing supplier risks. Our work makes unique contributions in a number of
ways. First, we deal with highly heterogeneous, multilingual data and we
document our approach to tackle these challenges. This is mainly based on a
method that effectively uses domain knowledge and generalises to multiple text
mining and NLP tasks and languages. Second, applying this method to mine
millions of procurement documents, we develop the first structured procurement
contract database that will help facilitate the tendering process. Second,
Finally, we discuss lessons learned for practical text mining/NLP development,
and make recommendations for future research and practice.
- Abstract(参考訳): テキストマイニングとnlp研究は数十年にわたって確立されてきたが、実世界のアプリケーション構築におけるこれらのテクニックの使用を報告した文献にはギャップがある。
例えば、彼らは通常、シングルタスクや時に単純化されたタスクに注目し、実際の問題やそれらのメソッド開発に共通する深いデータの不均一性と非一貫性を議論しない。
また、医療分野に焦点を当てた以前の作業はほとんどありません。
本稿では,医療分野における数百万の異種多言語調達文書をマイニングするために,テキストマイニングとnlpソリューションを開発した産業プロジェクトについて述べる。
我々は,サプライヤリスクを動的に評価するためのプラットフォームに電力を供給するための構造的調達契約データを抽出する。
私たちの作品は、さまざまな方法でユニークな貢献をしています。
まず、高度に異質で多言語的なデータに対処し、これらの課題に取り組むためのアプローチを文書化する。
これは主にドメイン知識を効果的に活用し、複数のテキストマイニングやNLPタスクや言語に一般化する手法に基づいている。
第2に、この手法を数百万の調達文書のマイニングに応用し、テンダリングプロセスの促進に役立つ最初の構造化された調達契約データベースを開発する。
第2に,実践的テキストマイニング/NLP開発で学んだ教訓について考察し,今後の研究と実践を推奨する。
関連論文リスト
- A survey of neural-network-based methods utilising comparable data for finding translation equivalents [0.0]
NLPの最も一般的なアプローチとして,必要な辞書コンポーネントの1つを自動生成する手法を提案する。
記述法の改善に欠かせないので,レキソグラフィの観点から解析する。
この調査は、NLPフィールドがレキシコグラフィーの洞察の恩恵を受けることができるため、NLPフィールドとレキシコグラフィーフィールドの接続を奨励する。
論文 参考訳(メタデータ) (2024-10-19T16:10:41Z) - Leveraging Data Augmentation for Process Information Extraction [0.0]
自然言語テキストデータに対するデータ拡張の適用について検討する。
データ拡張は、自然言語テキストからビジネスプロセスモデルを生成するタスクのための機械学習メソッドを実現する上で重要なコンポーネントである。
論文 参考訳(メタデータ) (2024-04-11T06:32:03Z) - Large Language Models for Generative Information Extraction: A Survey [89.71273968283616]
大規模言語モデル(LLM)は、テキスト理解と生成において顕著な能力を示した。
各種IEサブタスクと技術の観点から,これらの作品を分類して概観する。
我々は,最も先進的な手法を実証的に分析し,LLMによるIEタスクの出現傾向を明らかにする。
論文 参考訳(メタデータ) (2023-12-29T14:25:22Z) - Just Tell Me: Prompt Engineering in Business Process Management [63.08166397142146]
GPT-3や他の言語モデル(LM)は、様々な自然言語処理(NLP)タスクに効果的に対処できる。
私たちは、迅速なエンジニアリングは、BPM研究にLMの能力をもたらすことができると論じています。
論文 参考訳(メタデータ) (2023-04-14T14:55:19Z) - Application of Transformers based methods in Electronic Medical Records:
A Systematic Literature Review [77.34726150561087]
本研究は,異なるNLPタスクにおける電子カルテ(EMR)のトランスフォーマーに基づく手法を用いて,最先端技術に関する体系的な文献レビューを行う。
論文 参考訳(メタデータ) (2023-04-05T22:19:42Z) - Very Large Language Model as a Unified Methodology of Text Mining [17.653623842967807]
テキストデータマイニングは、言語テキストから必須情報を抽出するプロセスである。
様々なデータセットが収集され、様々な種類のタスクのために様々なアルゴリズムが設計される。
私は、非常に大きな言語モデル(VLLM)がテキストマイニングの効果的な統一手法となるという青空の考えを提示します。
論文 参考訳(メタデータ) (2022-12-19T06:52:13Z) - TegTok: Augmenting Text Generation via Task-specific and Open-world
Knowledge [83.55215993730326]
本稿では,タスク固有およびオープンワールド知識(TegTok)によるTExt生成の統一化を提案する。
本モデルでは,2種類の知識ソースからの知識エントリを高密度検索により選択し,それぞれ入力エンコーディングと出力デコーディングの段階に注入する。
論文 参考訳(メタデータ) (2022-03-16T10:37:59Z) - Data-to-Value: An Evaluation-First Methodology for Natural Language
Projects [3.9378507882929554]
Data to Value"(D2V)は、ビッグデータテキスト分析プロジェクトのための新しい方法論である。
ビッグデータテキスト分析プロジェクトチームとトピック間の切断を避けるため、質問の詳細なカタログでガイドされている。
論文 参考訳(メタデータ) (2022-01-19T17:04:52Z) - A Survey on Low-Resource Neural Machine Translation [106.51056217748388]
我々は、関連する作品を、使用した補助データに基づいて3つのカテゴリに分類する。
私たちの調査は、研究者がこの分野をよりよく理解し、より良いアルゴリズムを設計するきっかけになることを期待しています。
論文 参考訳(メタデータ) (2021-07-09T06:26:38Z) - A survey on natural language processing (nlp) and applications in
insurance [4.040320146147257]
本稿では,NLP(Natural Language Processing)が保険を提供する機会を説明する。
現在使われている様々な方法の詳細は、その物語にさかのぼる。
また,オープンソースライブラリとpythonコードを用いた特定のメソッドの実装についても解説する。
論文 参考訳(メタデータ) (2020-10-01T14:56:18Z) - Knowledge-Aware Procedural Text Understanding with Multi-Stage Training [110.93934567725826]
本稿では,このような文書の理解とプロセス中のエンティティの状態や場所の追跡を目的とした手続き的テキスト理解の課題に焦点をあてる。
常識的推論の難しさとデータ不足という2つの課題はまだ未解決のままである。
我々は、複数の外部知識を効果的に活用する、KnOwledge-Aware ProceduraL text understAnding (KOALA)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-28T10:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。