論文の概要: Neuro-Symbolic Regex Synthesis Framework via Neural Example Splitting
- arxiv url: http://arxiv.org/abs/2205.11258v1
- Date: Fri, 20 May 2022 05:55:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-06 00:48:11.165025
- Title: Neuro-Symbolic Regex Synthesis Framework via Neural Example Splitting
- Title(参考訳): ニューラルサンプル分割によるニューロシンボリックレグレックス合成フレームワーク
- Authors: Su-Hyeon Kim, Hyunjoon Cheon, Yo-Sub Han, Sang-Ki Ko
- Abstract要約: ニューラル・サンプル・スプリッティングと呼ばれる新しいアプローチを頼りにすることで、正弦と負弦からより高速に学習列を学習する問題に取り組む」。
提案手法は,正の文字列から類似文字列をグループ化するニューラルネットワークを用いて,各サンプル文字列を複数の部分に分割する。
本研究では,スプリット陽性からサブレゲックスを合成し,合成したサブレゲックスを連結して最終結果を生成する,SplitRegex'という効率的な合成フレームワークを提案する。
- 参考スコア(独自算出の注目度): 8.076841611508488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to the practical importance of regular expressions (regexes, for short),
there has been a lot of research to automatically generate regexes from
positive and negative string examples. We tackle the problem of learning
regexes faster from positive and negative strings by relying on a novel
approach called `neural example splitting'. Our approach essentially split up
each example string into multiple parts using a neural network trained to group
similar substrings from positive strings. This helps to learn a regex faster
and, thus, more accurately since we now learn from several short-length
strings. We propose an effective regex synthesis framework called `SplitRegex'
that synthesizes subregexes from `split' positive substrings and produces the
final regex by concatenating the synthesized subregexes. For the negative
sample, we exploit pre-generated subregexes during the subregex synthesis
process and perform the matching against negative strings. Then the final regex
becomes consistent with all negative strings. SplitRegex is a
divided-and-conquer framework for learning target regexes; split (=divide)
positive strings and infer partial regexes for multiple parts, which is much
more accurate than the whole string inferring, and concatenate (=conquer)
inferred regexes while satisfying negative strings. We empirically demonstrate
that the proposed SplitRegex framework substantially improves the previous
regex synthesis approaches over four benchmark datasets.
- Abstract(参考訳): 正規表現 (regexes,略してregexes) の実践的な重要性のため、正および負の文字列例からregexsを自動的に生成する研究が数多く行われている。
我々は,'ニューラルサンプル分割'と呼ばれる新しいアプローチに依拠して,正弦と負弦からより早く学習する問題に取り組む。
提案手法は,正弦から類似のサブストリングをグループ化するニューラルネットワークを用いて,各サンプル文字列を複数の部分に分割する。
これはregexをより速く、正確に学習するのに役立ちます。
本稿では,'split'正のサブストリングからサブレゲックスを合成し,合成したサブレゲックスを連結して最終レゲックスを生成する'splitregex'という効果的なレゲックス合成フレームワークを提案する。
負のサンプルに対しては, サブレゲックス合成プロセス中に生成したサブレゲックスを利用して, 負の文字列に対するマッチングを行う。
すると、最終的なregexはすべての負の文字列と一致する。
SplitRegexはターゲットのregexsを学習するための分割および参照のフレームワークであり、(=divide)正の文字列を分割し、(=divide)複数の部分に対して部分的なregexsを推論する。
提案するSplitRegexフレームワークは,4つのベンチマークデータセットに対して,以前のregex合成アプローチを大幅に改善することを示す。
関連論文リスト
- WikiSplit++: Easy Data Refinement for Split and Rephrase [19.12982606032723]
Split と Rephrase は複雑な文を同じ意味を持つ複数の単純文に分割する。
我々は、WikiSplitのインスタンスを削除してWikiSplit++を作成し、複雑な文は、より単純な文の少なくとも1つを含まない。
本手法は,幻覚測定の指標である分割数とエンテーメント比において有意な利得を得た。
論文 参考訳(メタデータ) (2024-04-13T13:07:32Z) - Correct and Optimal: the Regular Expression Inference Challenge [10.899596368151892]
コード/言語モデリングの課題として正規表現推論(REI)を提案する。
私たちはREIのための最初の大規模データセットを作成し、公開します。
論文 参考訳(メタデータ) (2023-08-15T17:40:10Z) - Copy Is All You Need [66.00852205068327]
既存のテキストコレクションからテキストセグメントを段階的にコピーするテキスト生成を定式化する。
提案手法は, 自動評価と人的評価の両方により, より優れた生成品質を実現する。
当社のアプローチでは,より大規模なテキストコレクションにスケールアップすることで,さらなるパフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2023-07-13T05:03:26Z) - Linear-Time Modeling of Linguistic Structure: An Order-Theoretic
Perspective [97.57162770792182]
文字列内のトークンのペア間の関係をモデル化するタスクは、自然言語を理解する上で不可欠な部分である。
これらの徹底的な比較は避けられ、さらに、トークン間の関係を文字列上の部分順序としてキャストすることで、複雑さを線形に減らすことができる。
提案手法は,文字列中の各トークンの実際の数を並列に予測し,それに従ってトークンをソートすることで,文字列内のトークンの総順序を決定する。
論文 参考訳(メタデータ) (2023-05-24T11:47:35Z) - Cascading and Direct Approaches to Unsupervised Constituency Parsing on
Spoken Sentences [67.37544997614646]
本研究は,教師なし音声補聴における最初の研究である。
目的は, 音声文の階層的構文構造を, 選挙区解析木の形で決定することである。
正確なセグメンテーションだけでは、音声文を正確に解析するのに十分であることを示す。
論文 参考訳(メタデータ) (2023-03-15T17:57:22Z) - Improving Structured Text Recognition with Regular Expression Biasing [13.801707647700727]
本研究では,ある形式に従う構造化テキストの認識の問題について検討する。
偏見の正規表現 (regexes) を指定することにより, 構造化テキストの認識精度を向上させることを提案する。
論文 参考訳(メタデータ) (2021-11-10T23:12:05Z) - FOREST: An Interactive Multi-tree Synthesizer for Regular Expressions [5.21480688623047]
デジタルフォームバリデーションのための正規表現シンセサイザーであるFORESTについて紹介する。
forestryは入力値の所望のパターンにマッチする正規表現を生成する。
また、与えられた正規表現のキャプチャ条件を合成する新しいSMTエンコーディングも提案する。
論文 参考訳(メタデータ) (2020-12-28T14:06:01Z) - Benchmarking Multimodal Regex Synthesis with Complex Structures [45.35689345004124]
自然言語から正規表現(regex)を生成する既存のデータセットは、複雑さに制限されている。
従来のものと異なる新しい合成データセットであるStructuredRegexを3つの側面で紹介する。
論文 参考訳(メタデータ) (2020-05-02T00:16:09Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - Multi-level Head-wise Match and Aggregation in Transformer for Textual
Sequence Matching [87.97265483696613]
そこで本研究では,複数のレベルにおける頭部のマッチング表現を学習することで,Transformerとのシーケンスペアマッチングを新たに提案する。
実験の結果,提案手法は複数のタスクにおいて新しい最先端性能を実現することができることがわかった。
論文 参考訳(メタデータ) (2020-01-20T20:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。