論文の概要: Method of the coherence evaluation of Ukrainian text
- arxiv url: http://arxiv.org/abs/2011.00310v1
- Date: Sat, 31 Oct 2020 16:48:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 04:46:07.591592
- Title: Method of the coherence evaluation of Ukrainian text
- Title(参考訳): ウクライナ語テキストのコヒーレンス評価方法
- Authors: S. D. Pogorilyy and A. A. Kramov
- Abstract要約: ウクライナ語のテキストコヒーレンス測定法について分析した。
訓練と試験はウクライナのテキストのコーパスで行われている。
テキストコヒーレンス評価のための2つの典型的なタスクを実行することで、テスト手順を実行する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the growing role of the SEO technologies, it is necessary to perform
an automated analysis of the article's quality. Such approach helps both to
return the most intelligible pages for the user's query and to raise the web
sites positions to the top of query results. An automated assessment of a
coherence is a part of the complex analysis of the text. In this article, main
methods for text coherence measurements for Ukrainian language are analyzed.
Expediency of using the semantic similarity graph method in comparison with
other methods are explained. It is suggested the improvement of that method by
the pre-training of the neural network for vector representations of sentences.
Experimental examination of the original method and its modifications is made.
Training and examination procedures are made on the corpus of Ukrainian texts,
which were previously retrieved from abstracts and full texts of Ukrainian
scientific articles. The testing procedure is implemented by performing of two
typical tasks for the text coherence assessment: document discrimination task
and insertion task. Accordingly to the analysis it is defined the most
effective combination of method's modification and its parameter for the
measurement of the text coherence.
- Abstract(参考訳): SEO技術の役割が増大しているため、記事の品質を自動的に分析する必要がある。
このアプローチは、ユーザのクエリに対して最も知的なページを返すのに役立ち、Webサイトの位置をクエリ結果のトップに上げるのに役立ちます。
コヒーレンスの自動評価は、テキストの複雑な解析の一部である。
本稿では,ウクライナ語におけるテキストコヒーレンス測定の主な方法について分析する。
意味的類似性グラフ法を他の手法と比較した場合の頻度について説明する。
文のベクトル表現のためのニューラルネットワークの事前学習による改善が示唆された。
元の方法の実験的検討とその修正がなされた。
訓練と試験の手順は、ウクライナの科学論文の要約や全文から収集されたウクライナ語のテキストのコーパスに基づいて行われる。
テスト手順は、文書識別タスクと挿入タスクという、テキストコヒーレンス評価のための2つの典型的なタスクを実行して実施する。
分析により, 提案手法の修正と, テキストのコヒーレンス測定のためのパラメータの最も効果的な組み合わせが定義できる。
関連論文リスト
- Efficiently Leveraging Linguistic Priors for Scene Text Spotting [63.22351047545888]
本稿では,大規模テキストコーパスから言語知識を活用する手法を提案する。
シーンテキストデータセットとよく一致したテキスト分布を生成し、ドメイン内の微調整の必要性を取り除く。
実験結果から,本手法は認識精度を向上するだけでなく,単語のより正確な局所化を可能にすることが示された。
論文 参考訳(メタデータ) (2024-02-27T01:57:09Z) - Language Model Decoding as Direct Metrics Optimization [87.68281625776282]
現在の復号法は、異なる側面にわたる人間のテキストと整合するテキストを生成するのに苦労している。
本研究では,言語モデルからの復号化を最適化問題として,期待される性能と人間のテキストとの厳密なマッチングを目的とした。
この誘導分布は,人間のテキストの難易度を向上させることが保証されていることを証明し,人間のテキストの基本的な分布に対するより良い近似を示唆する。
論文 参考訳(メタデータ) (2023-10-02T09:35:27Z) - An Adversarial Multi-Task Learning Method for Chinese Text Correction
with Semantic Detection [0.0]
中国語文文脈における文字認識のモデル化と検出能力を高めるために, 逆多タスク学習法を提案する。
モンテカルロ木探索戦略とポリシーネットワークを導入し,意味検出による効率の良い中国語テキスト修正作業を実現する。
論文 参考訳(メタデータ) (2023-06-28T15:46:00Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - Uzbek text summarization based on TF-IDF [0.0]
本稿では,ウズベク語における要約課題について実験する。
この手法はTF-IDFアルゴリズムに基づくテキスト抽象化に基づいている。
テキスト全体の重要な部分にn-gram法を適用することで、与えられたテキストを要約する。
論文 参考訳(メタデータ) (2023-03-01T12:39:46Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Text Revision by On-the-Fly Representation Optimization [76.11035270753757]
現在の最先端手法は、これらのタスクをシーケンスからシーケンスまでの学習問題として定式化している。
並列データを必要としないテキストリビジョンのための反復的なインプレース編集手法を提案する。
テキストの単純化に関する最先端の教師付き手法よりも、競争力があり、パフォーマンスも向上する。
論文 参考訳(メタデータ) (2022-04-15T07:38:08Z) - TFW2V: An Enhanced Document Similarity Method for the Morphologically
Rich Finnish Language [0.5801044612920816]
本研究は,形態学的に豊かな言語であるフィンランド語に対する現在のアプローチの実験に焦点をあてる。
本稿では,長文文書と限られた量のデータの両方を扱う上で,高い効率性を示す簡易な方法TFW2Vを提案する。
論文 参考訳(メタデータ) (2021-12-23T12:27:45Z) - Method of noun phrase detection in Ukrainian texts [0.0]
ウクライナ語の文中の名詞句の探索は、まだ初期段階にある。
ウクライナ語文における名詞句検出の複雑な方法として、ユニバーサル依存手段と名前付き一致認識モデルが提案されている。
論文 参考訳(メタデータ) (2020-10-22T09:20:24Z) - Matching Text with Deep Mutual Information Estimation [0.0]
本稿では,深い相互情報推定を組み込んだ汎用テキストマッチングのためのニューラルネットワークを提案する。
提案手法は,Deep Info Max (TIM) を用いたテキストマッチングであり,表現の教師なし学習手法と統合されている。
自然言語推論,パラフレーズ識別,解答選択など,いくつかのタスクにおけるテキストマッチング手法の評価を行った。
論文 参考訳(メタデータ) (2020-03-09T15:25:37Z) - Text Perceptron: Towards End-to-End Arbitrary-Shaped Text Spotting [49.768327669098674]
テキストパーセプトロン(Text Perceptron)という,エンドツーエンドのトレーニング可能なテキストスポッティング手法を提案する。
まず、テキスト読解順序と境界情報を学ぶ効率的なセグメンテーションベースのテキスト検出器を用いる。
次に、検出された特徴領域を正規形態に変換するために、新しい形状変換モジュール(STM)を設計する。
論文 参考訳(メタデータ) (2020-02-17T08:07:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。