論文の概要: Notes on Coalgebras in Stylometry
- arxiv url: http://arxiv.org/abs/2010.02733v2
- Date: Mon, 9 Aug 2021 15:01:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 07:05:08.322682
- Title: Notes on Coalgebras in Stylometry
- Title(参考訳): スティロメトリーにおけるCoalgebrasに関する注記
- Authors: Jo\"el A. Doat
- Abstract要約: 本稿では,あるテキストの構文的特徴を確率的遷移システムに導入することにより,コレージュブラが振る舞いの概念を定式化する方法について論じる。
行動距離を埋め込むことで、これらのシステム内の点間の差異を定量的に測定し、異なるテキストの特徴を比較することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The syntactic behaviour of texts can highly vary depending on their contexts
(e.g. author, genre, etc.). From the standpoint of stylometry, it can be
helpful to objectively measure this behaviour. In this paper, we discuss how
coalgebras are used to formalise the notion of behaviour by embedding syntactic
features of a given text into probabilistic transition systems. By introducing
the behavioural distance, we are then able to quantitatively measure
differences between points in these systems and thus, comparing features of
different texts. Furthermore, the behavioural distance of points can be
approximated by a polynomial-time algorithm.
- Abstract(参考訳): テキストの構文的挙動は、その文脈(例えば、著者、ジャンルなど)によって大きく異なる。
スタイロメトリの観点からは、客観的にこの挙動を測定するのに有用である。
本稿では,与えられたテキストの構文的特徴を確率的遷移系に組み込むことで,振る舞いの概念を定式化する手法について述べる。
行動距離を導入することで、これらのシステム内の点間の違いを定量的に測定し、異なるテキストの特徴を比較することができる。
さらに、点の挙動距離を多項式時間アルゴリズムで近似することができる。
関連論文リスト
- Estimating the Influence of Sequentially Correlated Literary Properties in Textual Classification: A Data-Centric Hypothesis-Testing Approach [4.161155428666988]
スティロメトリーは、ジャンルやテーマといった要素とは異なる半意識的な選択を反映していると考えられる文学的特徴を分析して著者を区別することを目的としている。
主題的内容など一部の文学的特性は、隣接するテキスト単位間の相関関係として表される可能性が高いが、権威的なスタイルのように、その独立性を持つものもいる。
テキスト分類における逐次相関文学的特性の影響を評価するための仮説検証手法を提案する。
論文 参考訳(メタデータ) (2024-11-07T18:28:40Z) - Rethinking Distance Metrics for Counterfactual Explainability [53.436414009687]
本研究では, 反事実を参照領域から独立して引き出すのではなく, 基礎となるデータ分布からの参照と共同してサンプリングする, 反事実生成手法のフレーミングについて検討する。
我々は、幅広い設定に適用可能な、反ファクト的な類似性のために調整された距離メートル法を導出する。
論文 参考訳(メタデータ) (2024-10-18T15:06:50Z) - Supervised Pattern Recognition Involving Skewed Feature Densities [49.48516314472825]
一致する類似度指数に基づくユークリッド距離の分類ポテンシャルと相似性指数を比較する。
隣接する2つの群の密度間の交点を分類する精度を考慮する。
論文 参考訳(メタデータ) (2024-09-02T12:45:18Z) - A Comparative Study of Sentence Embedding Models for Assessing Semantic
Variation [0.0]
本稿では,複数の文献において,連続する文間の意味的類似性の時系列と対の文類似性の行列を用いた最近の文埋め込み法について比較する。
文の埋め込み手法のほとんどは、ある文書において意味的類似性の高相関パターンを推定するが、興味深い相違が見られる。
論文 参考訳(メタデータ) (2023-08-08T23:31:10Z) - Accessibility and Trajectory-Based Text Characterization [0.6912244027050454]
特に、テキストは階層構造によって特徴づけられ、マルチスケールの概念や手法を用いてアプローチすることができる。
テキスト・ナラティブを表現するためのメソスコピック・アプローチを拡張し,発話のタグ付け部分間の反復関係のみを考慮した。
テキストのキャラクタリゼーションは、アクセシビリティ、対称性、繰り返しシグネチャといったスケール依存の相補的手法を考慮することで達成された。
論文 参考訳(メタデータ) (2022-01-17T23:33:11Z) - Extractive approach for text summarisation using graphs [0.0]
本稿では,抽出手法を用いてテキスト要約問題の解法に用いるグラフ関連アルゴリズムについて検討する。
文章の重なり合いと、文章の類似度を測定するための編集距離の2つの指標を考察する。
論文 参考訳(メタデータ) (2021-06-21T10:03:34Z) - Understanding Synonymous Referring Expressions via Contrastive Features [105.36814858748285]
画像とオブジェクトインスタンスレベルでのコントラスト機能を学ぶためのエンドツーエンドのトレーニング可能なフレームワークを開発しています。
提案アルゴリズムをいくつかのベンチマークデータセットで評価するための広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-04-20T17:56:24Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - The role of feature space in atomistic learning [62.997667081978825]
物理的にインスパイアされた記述子は、原子論シミュレーションへの機械学習技術の応用において重要な役割を果たしている。
異なる記述子のセットを比較するためのフレームワークを導入し、メトリクスとカーネルを使ってそれらを変換するさまざまな方法を紹介します。
原子密度のn-体相関から構築した表現を比較し,低次特徴の利用に伴う情報損失を定量的に評価した。
論文 参考訳(メタデータ) (2020-09-06T14:12:09Z) - A computational model implementing subjectivity with the 'Room Theory'.
The case of detecting Emotion from Text [68.8204255655161]
本研究は,テキスト分析における主観性と一般的文脈依存性を考慮した新しい手法を提案する。
単語間の類似度を用いて、ベンチマーク中の要素の相対的関連性を抽出することができる。
この方法は、主観的評価がテキストの相対値や意味を理解するために関係しているすべてのケースに適用できる。
論文 参考訳(メタデータ) (2020-05-12T21:26:04Z) - Diversity, Density, and Homogeneity: Quantitative Characteristic Metrics
for Text Collections [23.008385862718036]
本稿では,テキストコレクションの分散度,疎度,均一度を定量的に測定する多様性,密度,均一性の指標を提案する。
実世界のデータセットを用いた実験により,提案手法は有名なBERTのテキスト分類性能と高い相関性を示す。
論文 参考訳(メタデータ) (2020-03-19T00:48:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。