論文の概要: Words ranking and Hirsch index for identifying the core of the hapaxes
in political texts
- arxiv url: http://arxiv.org/abs/2006.07667v1
- Date: Sat, 13 Jun 2020 15:48:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 20:58:59.681168
- Title: Words ranking and Hirsch index for identifying the core of the hapaxes
in political texts
- Title(参考訳): 政治文書におけるハプクスのコアを識別するための単語ランキングとhirschインデックス
- Authors: Valerio Ficcadenti, Roy Cerqueti, Marcel Ausloos, Gurjeet Dhesi
- Abstract要約: 我々は、米国大統領が発音する約1000の講演について調査する。
稀な単語の関連性、すなわち、各スピーチで一度だけ述べた単語の関連性を探る。
- 参考スコア(独自算出の注目度): 8.172425535905036
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper deals with a quantitative analysis of the content of official
political speeches. We study a set of about one thousand talks pronounced by
the US Presidents, ranging from Washington to Trump. In particular, we search
for the relevance of the rare words, i.e. those said only once in each speech
-- the so-called hapaxes. We implement a rank-size procedure of Zipf-Mandelbrot
type for discussing the hapaxes' frequencies regularity over the overall set of
speeches. Starting from the obtained rank-size law, we define and detect the
core of the hapaxes set by means of a procedure based on an Hirsch index
variant. We discuss the resulting list of words in the light of the overall US
Presidents' speeches. We further show that this core of hapaxes itself can be
well fitted through a Zipf-Mandelbrot law and that contains elements producing
deviations at the low ranks between scatter plots and fitted curve -- the
so-called king and vice-roy effect. Some socio-political insights are derived
from the obtained findings about the US Presidents messages.
- Abstract(参考訳): 本稿では,公的な政治演説の内容の定量的分析を行う。
我々は、ワシントンからトランプまで、米国の大統領が発音する約1000の講演のセットを調査した。
特に、レアワードの関連性、すなわち、各スピーチで1回だけ言及された単語(いわゆるハファックス)を検索する。
本研究では,音声全体の周波数規則性について議論するために,Zipf-Mandelbrot型のランクサイズプロシージャを実装した。
得られたランクサイズの法則から、ヒルシュ指数変種に基づく手続きによって設定されたハプクスのコアを定義し、検出する。
我々は、アメリカの全大統領演説に照らして、得られた単語のリストについて論じる。
さらに、このハプクスの核心はジップ・マンデルブロの法則によってうまく適合し、散乱プロットと適合曲線の間の低いランクで偏差を生み出す要素を含むことを示している(いわゆるキングとバイスロイ効果)。
いくつかの社会政治的洞察は、アメリカ合衆国大統領のメッセージに関する得られた発見から導かれる。
関連論文リスト
- Quantifying the Uniqueness of Donald Trump in Presidential Discourse [51.76056700705539]
本稿では,大規模言語モデルに基づく一意性尺度を提案する。
トランプ氏の演説パターンが、最近の歴史の中で大統領候補に指名されたすべての主要政党の発言パターンから逸脱していることを示す証拠が相当ある」と述べた。
論文 参考訳(メタデータ) (2024-01-02T19:00:17Z) - BLASER: A Text-Free Speech-to-Speech Translation Evaluation Metric [66.73705349465207]
エンドツーエンドの音声音声翻訳(S2ST)は、一般的にテキストベースのメトリクスで評価される。
本稿では,ASRシステムへの依存を回避するために,BLASERと呼ばれるエンドツーエンドS2STのテキストフリー評価指標を提案する。
論文 参考訳(メタデータ) (2022-12-16T14:00:26Z) - Benchmarking Evaluation Metrics for Code-Switching Automatic Speech
Recognition [19.763431520942028]
本研究では,人間の判断によるコードスイッチング音声認識仮説のベンチマークデータセットを開発する。
自動仮説の最小化のための明確なガイドラインを定義する。
我々は、アラビア語/英語の方言音声におけるコードスイッチング音声認識結果の人間受容のための最初のコーパスをリリースする。
論文 参考訳(メタデータ) (2022-11-22T08:14:07Z) - Evaluating context-invariance in unsupervised speech representations [15.67794428589585]
現在のベンチマークでは文脈不変性は測定されていない。
我々は文脈不変性を測定するZeroSpeech ABXベンチマークの新バージョンを開発する。
表現の文脈依存性は単語レベルの表現の安定性の予測であることを示す。
論文 参考訳(メタデータ) (2022-10-27T21:15:49Z) - Show Me Your Face, And I'll Tell You How You Speak [0.0]
我々は,話者の唇の動きのみを与えられた音声を生成することを学習する,口唇から音声合成の課題を探求する。
本稿では,制約のないシナリオにおいて,唇から音声への正確な合成を実現するために重要な設計選択を施した新しい手法「Lip2Speech」を提案する。
論文 参考訳(メタデータ) (2022-06-28T13:52:47Z) - Automatic Dialect Density Estimation for African American English [74.44807604000967]
アフリカ・アメリカン・イングリッシュ(AAE)方言の方言密度の自動予測について検討する。
方言密度は、非標準方言の特徴を含む発話における単語の割合として定義される。
このデータベースでは,AAE音声に対する予測された真理弁証密度と地上の真理弁証密度との間に有意な相関関係を示す。
論文 参考訳(メタデータ) (2022-04-03T01:34:48Z) - Speaker Embedding-aware Neural Diarization for Flexible Number of
Speakers with Textual Information [55.75018546938499]
本稿では,話者埋め込み認識型ニューラルダイアリゼーション(SEND)手法を提案する。
本手法は,ターゲット話者の音声活動検出よりも低いダイアリゼーション誤差率を実現する。
論文 参考訳(メタデータ) (2021-11-28T12:51:04Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - Triplet loss based embeddings for forensic speaker identification in
Spanish [0.0]
三重項損失を用いたCNNの訓練により得られた音声埋め込みの利用を検討する。
主に男性話者によって構成されるデータ設定のいくつかの制限を示す。
三重項損失は、フォレンジックスピーカー識別のための音声埋め込みを作成するための良い選択肢であることを示す。
論文 参考訳(メタデータ) (2021-02-24T21:24:25Z) - Multi-stage Speaker Extraction with Utterance and Frame-Level Reference
Signals [113.78060608441348]
本稿では,複数段階の話者抽出手法を提案する。
初めて、ターゲット話者の基準としてフレームレベルの逐次音声埋め込みを用いる。
論文 参考訳(メタデータ) (2020-11-19T03:08:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。