論文の概要: Learning Regular Expressions for Interpretable Medical Text
Classification Using a Pool-based Simulated Annealing and Word-vector Models
- arxiv url: http://arxiv.org/abs/2011.09351v1
- Date: Mon, 16 Nov 2020 07:20:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 23:29:58.692451
- Title: Learning Regular Expressions for Interpretable Medical Text
Classification Using a Pool-based Simulated Annealing and Word-vector Models
- Title(参考訳): プール型シミュレートアニーリングと単語ベクトルモデルを用いた解釈可能な医用テキスト分類のための正規表現の学習
- Authors: Chaofan Tu, Ruibin Bai, Zheng Lu, Uwe Aickelin, Peiming Ge, Jianshuang
Zhao
- Abstract要約: 医用分類のための高品質かつ解釈可能な正規表現からなるルールベースエンジンを提案する。
正規表現はコンストラクティブメソッドによって自動生成され、Pool-based Simulated Annealing (PSA)アプローチで最適化される。
- 参考スコア(独自算出の注目度): 0.6807963587057013
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose a rule-based engine composed of high quality and
interpretable regular expressions for medical text classification. The regular
expressions are auto generated by a constructive heuristic method and optimized
using a Pool-based Simulated Annealing (PSA) approach. Although existing Deep
Neural Network (DNN) methods present high quality performance in most Natural
Language Processing (NLP) applications, the solutions are regarded as
uninterpretable black boxes to humans. Therefore, rule-based methods are often
introduced when interpretable solutions are needed, especially in the medical
field. However, the construction of regular expressions can be extremely
labor-intensive for large data sets. This research aims to reduce the manual
efforts while maintaining high-quality solutions
- Abstract(参考訳): 本稿では,医用テキスト分類のための高品質かつ解釈可能な正規表現からなるルールベースエンジンを提案する。
正規表現は構成的ヒューリスティック法によって自動生成され、Pool-based Simulated Annealing (PSA) アプローチを用いて最適化される。
既存のディープニューラルネットワーク(DNN)手法は、ほとんどの自然言語処理(NLP)アプリケーションで高品質な性能を示すが、その解決策は人間には解釈不能なブラックボックスと見なされている。
したがって、特に医療分野において、解釈可能なソリューションが必要な場合、ルールベースの手法がしばしば導入される。
しかし、正規表現の構築は大規模データセットにとって非常に労働集約的である。
本研究は,高品質なソリューションを維持しながら手作業を削減することを目的とする。
関連論文リスト
- Bi-Encoders based Species Normalization -- Pairwise Sentence Learning to
Rank [0.0]
本稿では、名前付きエンティティ正規化のための新しい深層学習手法を提案し、問題をランク付けするペアワイズ学習として扱う。
本研究は,種の実体型に関する実験を行い,その手法を最先端技術に対して評価する。
論文 参考訳(メタデータ) (2023-10-22T17:30:16Z) - Toward Unified Controllable Text Generation via Regular Expression
Instruction [56.68753672187368]
本稿では,正規表現の利点をフル活用し,多様な制約を一様にモデル化する命令ベース機構を用いた正規表現指導(REI)を提案する。
提案手法では,中規模言語モデルの微調整や,大規模言語モデルでの少数ショット・インコンテクスト学習のみを要し,各種制約の組み合わせに適用した場合のさらなる調整は不要である。
論文 参考訳(メタデータ) (2023-09-19T09:05:14Z) - An Iterative Optimizing Framework for Radiology Report Summarization with ChatGPT [80.33783969507458]
放射線医学報告の「印象」セクションは、放射線医と他の医師とのコミュニケーションにとって重要な基盤である。
近年の研究では、大規模医療用テキストデータを用いた印象自動生成の有望な成果が得られている。
これらのモデルは、しばしば大量の医療用テキストデータを必要とし、一般化性能が劣る。
論文 参考訳(メタデータ) (2023-04-17T17:13:42Z) - Improving Pre-trained Language Model Fine-tuning with Noise Stability
Regularization [94.4409074435894]
本稿では,LNSR(Layerwise Noise Stability Regularization)という,新規かつ効果的な微調整フレームワークを提案する。
具体的には、標準ガウス雑音を注入し、微調整モデルの隠れ表現を正規化することを提案する。
提案手法は,L2-SP,Mixout,SMARTなど他の最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-12T04:42:49Z) - Regularization-based Pruning of Irrelevant Weights in Deep Neural
Architectures [0.0]
本稿では,無関係な重みを識別し,そのノルムを選択的に縮小する正規化手法を用いて,スパース神経トポロジを学習する手法を提案する。
提案手法を画像分類と自然言語生成のタスクで検証し,スパーシティとメトリクスの両面から比較結果を得た。
論文 参考訳(メタデータ) (2022-04-11T09:44:16Z) - SDA: Improving Text Generation with Self Data Augmentation [88.24594090105899]
自動データ拡張のための自己模倣学習フェーズを組み込むことにより,標準最大確率推定(MLE)パラダイムを改善することを提案する。
既存の文レベルの拡張戦略とは異なり,本手法はより汎用的で,任意のMLEベースの訓練手順に容易に適応できる。
論文 参考訳(メタデータ) (2021-01-02T01:15:57Z) - Lexically-constrained Text Generation through Commonsense Knowledge
Extraction and Injection [62.071938098215085]
我々は、ある入力概念のセットに対して妥当な文を生成することを目的としているcommongenベンチマークに焦点を当てる。
生成したテキストの意味的正しさを高めるための戦略を提案する。
論文 参考訳(メタデータ) (2020-12-19T23:23:40Z) - Data-Driven Regular Expressions Evolution for Medical Text
Classification Using Genetic Programming [0.0]
本研究では,正規表現を進化させるために,遺伝的プログラミング(GP)アプローチを用いた新しい正規表現に基づくテキスト分類手法を提案する。
本手法は,オンライン医療提供者からのリアルタイム医療用テキスト調査を用いて評価し,有望なパフォーマンスを示す。
論文 参考訳(メタデータ) (2020-12-04T03:44:46Z) - Contextualized Perturbation for Textual Adversarial Attack [56.370304308573274]
逆例は自然言語処理(NLP)モデルの脆弱性を明らかにする。
本稿では,フロートおよび文法的出力を生成するContextualized AdversaRial Example生成モデルであるCLAREを提案する。
論文 参考訳(メタデータ) (2020-09-16T06:53:15Z) - Revisiting Regex Generation for Modeling Industrial Applications by
Incorporating Byte Pair Encoder [14.42244606935982]
本研究は正規表現の自動生成に焦点を当て,この問題に対処する新しい遺伝的アルゴリズムを提案する。
まずバイトペアエンコーダ(BPE)を用いて頻繁な項目を抽出し,次に正規表現を構築する。
指数減衰を行うことで、トレーニング速度は指数崩壊を使わずに、手法の約100倍の速度となる。
論文 参考訳(メタデータ) (2020-05-06T02:09:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。