論文の概要: Indirectly Supervised English Sentence Break Prediction Using Paragraph
Break Probability Estimates
- arxiv url: http://arxiv.org/abs/2109.12023v1
- Date: Fri, 24 Sep 2021 15:30:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-27 18:51:10.670315
- Title: Indirectly Supervised English Sentence Break Prediction Using Paragraph
Break Probability Estimates
- Title(参考訳): 節分割確率推定を用いた間接教師付き英語文ブレーク予測
- Authors: Robert C. Moore
- Abstract要約: 文分割予測器は段落分割確率推定のみに基づいて,この課題に対して高い精度を達成可能であることを示す。
この文ブレーク予測器は、文ブレークアノテーションを使わずに、大量の自然発生テキストに基づいてほぼ完全に訓練される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This report explores the use of paragraph break probability estimates to help
predict the location of sentence breaks in English natural language text. We
show that a sentence break predictor based almost solely on paragraph break
probability estimates can achieve high accuracy on this task. This sentence
break predictor is trained almost entirely on a large amount of naturally
occurring text without sentence break annotations, with only a small amount of
annotated data needed to tune two hyperparameters. We also show that even
better results can be achieved across in-domain and out-of-domain test data, if
paragraph break probability signals are combined with a support vector machine
classifier trained on a somewhat larger amount of sentence-break-annotated
data. Numerous related issues are addressed along the way.
- Abstract(参考訳): 本報告は,英語自然言語テキストにおける文のブレーク位置を予測するために,段落ブレーク確率推定を用いた場合について検討する。
そこで本研究では, ほぼ段落ブレーク確率推定に基づく文ブレーク予測器が, 高い精度を実現できることを示す。
この文分割予測器は、文分割アノテーションを使わずに、大量の自然発生テキストに基づいてほぼ完全に訓練され、2つのハイパーパラメータをチューニングするために少量の注釈付きデータしか必要としない。
また,段落ブレーク確率信号と,より大量の文ブレークアノテートデータに基づいて訓練されたサポートベクターマシン分類器を組み合わせることで,ドメイン内およびドメイン外テストデータでさらに優れた結果が得られることを示した。
関連する問題も数多く取り組まれている。
関連論文リスト
- How to Compute the Probability of a Word [45.23856093235994]
本稿では,単語確率の正しい計算法を導出する。
確率計算における広範囲なバグの修正は,文理解および語彙最適化分析における測定結果に影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2024-06-20T17:59:42Z) - Proximal Causal Inference With Text Data [5.796482272333648]
本稿では,2つの前処理テキストデータを用いた因果推論手法を提案し,2つのゼロショットモデルを用いて2つのプロキシを推定し,それらのプロキシを近位g-形式に適用する。
ゼロショット予測のためのMIMIC-IIIおよびオープン大言語モデルを用いた実世界の臨床ノートを用いて, 合成および半合成条件下での手法の評価を行った。
論文 参考訳(メタデータ) (2024-01-12T16:51:02Z) - Interpretable Automatic Fine-grained Inconsistency Detection in Text
Summarization [56.94741578760294]
本研究の目的は, 要約中の事実誤りの微粒化を予測し, 微粒化不整合検出の課題を提案することである。
要約における現実的不整合の検査方法に触発され,解析可能な微粒不整合検出モデルであるFinGrainFactを提案する。
論文 参考訳(メタデータ) (2023-05-23T22:11:47Z) - Extracting Victim Counts from Text [5.478764356647437]
人道的セクターの意思決定者は危機時のタイムリーかつ正確な情報に頼っている。
地震で民間人が何人負傷したかを知ることは、適切な援助を割り当てるのに不可欠である。
数字は異なるフォーマットを持ち、数値推論を必要とする可能性がある。
論文 参考訳(メタデータ) (2023-02-23T23:50:24Z) - Progressive End-to-End Object Detection in Crowded Scenes [96.92416613336096]
以前のクエリベースの検出器は2つの欠点に悩まされていた: まず、複数の予測が1つのオブジェクトに対して推論される。
具体的には、まず受理されたクエリを選択して正の予測を生成し、その後、受理された予測に従って残雑音のあるクエリを精査する。
提案手法は,混み合ったシーンにおける問合せ型検出器の性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-15T06:12:00Z) - Extracting Grammars from a Neural Network Parser for Anomaly Detection
in Unknown Formats [79.6676793507792]
強化学習は、ある未知のフォーマットで文を解析するために、人工知能を訓練する技術として、最近約束されている。
本稿では、ニューラルネットワークから生成規則を抽出し、これらの規則を用いて、ある文が名目か異常かを決定する手順を提案する。
論文 参考訳(メタデータ) (2021-07-30T23:10:24Z) - Variable Instance-Level Explainability for Text Classification [9.147707153504117]
本論文では,インスタンスレベルでの異なる特徴スコアリング手法を用いて変数長説明を抽出する手法を提案する。
本手法は,従来の固定長および固定長のスコアリング手法と比較して,より忠実な説明を提供する。
論文 参考訳(メタデータ) (2021-04-16T16:53:48Z) - Double Perturbation: On the Robustness of Robustness and Counterfactual
Bias Evaluation [109.06060143938052]
テストデータセットを超えたモデル弱点を明らかにするための"ダブル摂動"フレームワークを提案する。
この枠組みを,モデルの頑健さと英語における反事実バイアスの分析に使用される2つの摂動に基づくアプローチに応用する。
論文 参考訳(メタデータ) (2021-04-12T06:57:36Z) - Narrative Incoherence Detection [76.43894977558811]
本稿では,文間セマンティック理解のための新たなアリーナとして,物語不整合検出の課題を提案する。
複数文の物語を考えると、物語の流れに意味的な矛盾があるかどうかを決定します。
論文 参考訳(メタデータ) (2020-12-21T07:18:08Z) - Fact-aware Sentence Split and Rephrase with Permutation Invariant
Training [93.66323661321113]
Sentence Split と Rephrase は、複雑な文をいくつかの単純な文に分解し、その意味を保存することを目的としている。
従来の研究では、パラレル文対からのSeq2seq学習によってこの問題に対処する傾向があった。
本稿では,この課題に対するSeq2seq学習における順序分散の効果を検証するために,置換訓練を導入する。
論文 参考訳(メタデータ) (2020-01-16T07:30:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。