論文の概要: Optimizing Readability Using Genetic Algorithms
- arxiv url: http://arxiv.org/abs/2301.00374v1
- Date: Sun, 1 Jan 2023 09:08:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 13:49:01.519111
- Title: Optimizing Readability Using Genetic Algorithms
- Title(参考訳): 遺伝的アルゴリズムを用いた可読性最適化
- Authors: Jorge Martinez-Gil
- Abstract要約: 本研究は,英語の任意のテキストの読みやすさを自動的に最適化する手法であるORUGAを提案する。
この手法の背景にある中核的な考え方は、ある要因がテキストの可読性に影響を与えることである。
さらに,本研究は,多目的最適化手法を用いて,原文の内容と形式の両方を保存することを目的とする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This research presents ORUGA, a method that tries to automatically optimize
the readability of any text in English. The core idea behind the method is that
certain factors affect the readability of a text, some of which are
quantifiable (number of words, syllables, presence or absence of adverbs, and
so on). The nature of these factors allows us to implement a genetic learning
strategy to replace some existing words with their most suitable synonyms to
facilitate optimization. In addition, this research seeks to preserve both the
original text's content and form through multi-objective optimization
techniques. In this way, neither the text's syntactic structure nor the
semantic content of the original message is significantly distorted. An
exhaustive study on a substantial number and diversity of texts confirms that
our method was able to optimize the degree of readability in all cases without
significantly altering their form or meaning. The source code of this approach
is available at https://github.com/jorge-martinez-gil/oruga.
- Abstract(参考訳): 本研究は,英語の任意のテキストの読みやすさを自動的に最適化する手法であるORUGAを提案する。
この方法の背後にある基本的な考え方は、ある要素がテキストの可読性に影響することであり、そのいくつかは定量化可能である(単語数、音節数、副詞の有無など)。
これらの要因の性質により、既存の単語を最適化を容易にするために最も適した同義語に置き換えるための遺伝的学習戦略を実装できる。
さらに本研究は,多目的最適化手法を用いて,原文の内容と形態の両方を保存しようとするものである。
このように、テキストの構文構造も、元のメッセージの意味的内容も著しく歪んでいない。
テキストのかなりの数と多様性に関する徹底的な研究により,本手法は,その形態や意味を著しく変えることなく,すべてのケースで可読性の程度を最適化できることを確認した。
このアプローチのソースコードはhttps://github.com/jorge-martinez-gil/orugaで入手できる。
関連論文リスト
- MoCE: Adaptive Mixture of Contextualization Experts for Byte-based Neural Machine Translation [13.70446799743065]
バイトベースの機械翻訳システムは、多言語設定において大きな可能性を秘めている。
Unicode符号化は、新しい言語でも未知の単語の出現を排除し、各文字を特定のバイトにマッピングする。
局所的な文脈化は、初期意味論をトークンに割り当て、文理解を改善するのに有効であることが証明されている。
本研究では,コンテキスト化エキスパートとして扱われる注意ヘッドを適応的に選択・混合する,コンテキスト化エキスパートの混合(MoCE)を提案する。
論文 参考訳(メタデータ) (2024-11-03T08:15:43Z) - Language Model Decoding as Direct Metrics Optimization [87.68281625776282]
現在の復号法は、異なる側面にわたる人間のテキストと整合するテキストを生成するのに苦労している。
本研究では,言語モデルからの復号化を最適化問題として,期待される性能と人間のテキストとの厳密なマッチングを目的とした。
この誘導分布は,人間のテキストの難易度を向上させることが保証されていることを証明し,人間のテキストの基本的な分布に対するより良い近似を示唆する。
論文 参考訳(メタデータ) (2023-10-02T09:35:27Z) - Copy Is All You Need [66.00852205068327]
既存のテキストコレクションからテキストセグメントを段階的にコピーするテキスト生成を定式化する。
提案手法は, 自動評価と人的評価の両方により, より優れた生成品質を実現する。
当社のアプローチでは,より大規模なテキストコレクションにスケールアップすることで,さらなるパフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2023-07-13T05:03:26Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Text Revision by On-the-Fly Representation Optimization [76.11035270753757]
現在の最先端手法は、これらのタスクをシーケンスからシーケンスまでの学習問題として定式化している。
並列データを必要としないテキストリビジョンのための反復的なインプレース編集手法を提案する。
テキストの単純化に関する最先端の教師付き手法よりも、競争力があり、パフォーマンスも向上する。
論文 参考訳(メタデータ) (2022-04-15T07:38:08Z) - Text Counterfactuals via Latent Optimization and Shapley-Guided Search [15.919650185010491]
本研究は,分類モデルにおける対実テキスト生成の問題について考察する。
我々は、モデルの予測を変えるために、テキストを最小限に変更することを目指している。
ホワイトボックスアプローチは、視覚における同様の問題にうまく適用されている。
論文 参考訳(メタデータ) (2021-10-22T05:04:40Z) - Semantic-Preserving Adversarial Text Attacks [85.32186121859321]
深層モデルの脆弱性を調べるために, Bigram と Unigram を用いた適応的セマンティック保存最適化法 (BU-SPO) を提案する。
提案手法は,既存手法と比較して最小の単語数を変更することで,攻撃成功率とセマンティックス率を最大化する。
論文 参考訳(メタデータ) (2021-08-23T09:05:18Z) - Text Guide: Improving the quality of long text classification by a text
selection method based on feature importance [0.0]
そこで本研究では,原文長を予め定義された限界まで短縮するテキスト変換方式であるtext guideを提案する。
長文分類に特化して設計された最近の言語モデルの性能向上に,テキストガイドが有効であることを示す。
論文 参考訳(メタデータ) (2021-04-15T04:10:08Z) - Intrinsic Probing through Dimension Selection [69.52439198455438]
現代のほとんどのNLPシステムは、様々なタスクにおいて驚くほど高いパフォーマンスが得られる事前訓練された文脈表現を使用している。
このような高いパフォーマンスは、ある種の言語構造がこれらの表現に根ざしない限りはあり得ず、それを探究する研究が盛んに行われている。
本稿では,言語情報が表現内でどのように構造化されているかを示す内在的探索と,先行研究で広く普及している外在的探索とを区別し,抽出に成功したことを示すことによって,そのような情報の存在を主張するのみである。
論文 参考訳(メタデータ) (2020-10-06T15:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。