論文の概要: Frozen Binomials on the Web: Word Ordering and Language Conventions in
Online Text
- arxiv url: http://arxiv.org/abs/2003.03612v1
- Date: Sat, 7 Mar 2020 17:22:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-25 19:57:59.287541
- Title: Frozen Binomials on the Web: Word Ordering and Language Conventions in
Online Text
- Title(参考訳): Web上の凍結二項文:オンラインテキストにおける語順と言語規約
- Authors: Katherine Van Koevering, Austin R. Benson, Jon Kleinberg
- Abstract要約: オンラインテキストは、非公式テキストの文脈で二項語を研究するユニークな機会を提供する。
従来提案されていたルールは二項順序付けの予測に有効ではないことを示す。
また、様々な地域社会における二項構造のグローバルな構造についても検討する。
- 参考スコア(独自算出の注目度): 27.22193897989139
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is inherent information captured in the order in which we write words
in a list. The orderings of binomials --- lists of two words separated by `and'
or `or' --- has been studied for more than a century. These binomials are
common across many areas of speech, in both formal and informal text. In the
last century, numerous explanations have been given to describe what order
people use for these binomials, from differences in semantics to differences in
phonology. These rules describe primarily `frozen' binomials that exist in
exactly one ordering and have lacked large-scale trials to determine efficacy.
Online text provides a unique opportunity to study these lists in the context
of informal text at a very large scale. In this work, we expand the view of
binomials to include a large-scale analysis of both frozen and non-frozen
binomials in a quantitative way. Using this data, we then demonstrate that most
previously proposed rules are ineffective at predicting binomial ordering. By
tracking the order of these binomials across time and communities we are able
to establish additional, unexplored dimensions central to these predictions.
Expanding beyond the question of individual binomials, we also explore the
global structure of binomials in various communities, establishing a new model
for these lists and analyzing this structure for non-frozen and frozen
binomials. Additionally, novel analysis of trinomials --- lists of length three
--- suggests that none of the binomials analysis applies in these cases.
Finally, we demonstrate how large data sets gleaned from the web can be used in
conjunction with older theories to expand and improve on old questions.
- Abstract(参考訳): リストの中に単語を書く順番でキャプチャされる固有の情報があります。
二項の順序 --- 'and' または 'or' で区切られた2つの単語のリスト -- は、1世紀以上にわたって研究されてきた。
これらの二項は、形式的および形式的テキストの両方において、様々な言語領域で一般的である。
前世紀には、意味論の相違から音韻学の相違まで、人々がこれらの二項に対してどのような順番を使うかを説明するために多くの説明がなされている。
これらの規則は、正確に1つの順序で存在する「凍結」二項式を主に記述し、有効性を決定する大規模な試行を欠いている。
オンラインテキストは、これらのリストを非常に大規模な非公式テキストの文脈で研究するユニークな機会を提供する。
本研究では,凍結二項と非凍結二項の両方の大規模解析を定量的に含むように,二項の視点を拡大する。
このデータを用いて,提案するルールのほとんどが二項順序の予測に効果がないことを示す。
これらの二項の順序を時間とコミュニティにわたって追跡することで、これらの予測の中心となる追加の未探索次元を確立することができる。
個々の二項問題を超えて、様々なコミュニティにおける二項のグローバル構造を探求し、これらのリストの新しいモデルを確立し、非凍結二項と凍結二項のこの構造を分析する。
さらに、三項の新たな分析 ---長さ3のリスト -- は、これらの場合において二項解析は適用されないことを示唆している。
最後に,Webから収集した大規模なデータセットが,従来の理論と連動して古い問題を拡張し,改善することができることを示す。
関連論文リスト
- How many classifiers do we need? [50.69951049206484]
分類器間の不一致と偏極が、個々の分類器を集約することで得られる性能向上とどのように関連しているかを詳細に分析する。
分類器の個数で不一致の挙動を示す。
我々の理論と主張は、様々なタイプのニューラルネットワークを用いた画像分類タスクに関する経験的な結果によって裏付けられている。
論文 参考訳(メタデータ) (2024-11-01T02:59:56Z) - Testing the Predictions of Surprisal Theory in 11 Languages [77.45204595614]
本研究では,11言語における副次的時間と読解時間の関係について検討する。
より多様な言語に焦点をあてることで、これらの結果は、情報理論と言語間のインクリメンタル言語処理の最も堅牢なリンクを提供すると論じる。
論文 参考訳(メタデータ) (2023-07-07T15:37:50Z) - Explanation Selection Using Unlabeled Data for Chain-of-Thought
Prompting [80.9896041501715]
非専門家によって書かれたオフ・ザ・シェルフの説明のように、タスクのために"チューニング"されていない説明は、中途半端なパフォーマンスをもたらす可能性がある。
本稿では,ブラックボックス方式で説明拡散プロンプトを最適化する方法の課題に対処する。
論文 参考訳(メタデータ) (2023-02-09T18:02:34Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - STaCK: Sentence Ordering with Temporal Commonsense Knowledge [34.64198104134244]
文順予測は、ランダムに順序付けられた文書中の文の正しい順序を見つけるタスクである。
本稿では,グラフニューラルネットワークと時間的コモンセンス知識に基づくフレームワークSTaCKを紹介する。
その結果,提案手法が自然に順序予測に適していることが実証的に証明された。
論文 参考訳(メタデータ) (2021-09-06T05:29:48Z) - Fast Bayesian Variable Selection in Binomial and Negative Binomial
Regression [9.774282306558465]
本稿では,二項回帰および負二項回帰における変数選択のための効率的なMCMCスキームを導入し,ロジスティック回帰を特別な事例として活用する。
実験では、17万の共変量を持つデータを含む、我々のアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-06-28T20:54:41Z) - Investigating Cross-Linguistic Adjective Ordering Tendencies with a
Latent-Variable Model [66.84264870118723]
本稿では,多言語形容詞順序付けを潜在変数モデルとして,初めて純粋コーパス駆動モデルを提案する。
我々は普遍的、言語横断的、階層的形容詞順序付け傾向の存在の強い確固たる証拠を提供する。
論文 参考訳(メタデータ) (2020-10-09T18:27:55Z) - Top2Vec: Distributed Representations of Topics [0.0]
トピックモデリングは、文書の大規模なコレクションにおいて潜在意味構造(通常トピックと呼ばれる)を発見するのに使用される。
共同文書と単語セマンティック埋め込みを利用してトピックを検索するtexttttop2vec$を提示する。
実験の結果, $texttttop2vec$ は確率的生成モデルよりも, 学習したコーパスの有意に情報的, 代表的なトピックを見つけることができた。
論文 参考訳(メタデータ) (2020-08-19T20:58:27Z) - Fast Maximum Likelihood Estimation and Supervised Classification for the
Beta-Liouville Multinomial [0.0]
ベータ・リウヴィル乗算はニュートン・ラフソンの最大推定におけるディリクレ乗算に匹敵する効率であることを示す。
また,4つの金標準データセットのうち2つにおいて,β-Liouville多重項が多重項およびディリクレ多重項よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-12T20:30:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。