論文の概要: Words as Gatekeepers: Measuring Discipline-specific Terms and Meanings
in Scholarly Publications
- arxiv url: http://arxiv.org/abs/2212.09676v1
- Date: Mon, 19 Dec 2022 18:01:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 17:58:51.964751
- Title: Words as Gatekeepers: Measuring Discipline-specific Terms and Meanings
in Scholarly Publications
- Title(参考訳): 門番としての言葉 : 学術出版における専門用語と意味の測定
- Authors: Li Lucy, Jesse Dodge, David Bamman, Katherine A. Keith
- Abstract要約: 我々は学術用語を専門的な語型と感覚として定義する。
我々は、解釈可能な情報理論の指標を用いて、数百の分野にまたがる有病率を推定する。
- 参考スコア(独自算出の注目度): 13.443742417911352
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scholarly text is often laden with jargon, or specialized language that
divides disciplines. We extend past work that characterizes science at the
level of word types, by using BERT-based word sense induction to find
additional words that are widespread but overloaded with different uses across
fields. We define scholarly jargon as discipline-specific word types and
senses, and estimate its prevalence across hundreds of fields using
interpretable, information-theoretic metrics. We demonstrate the utility of our
approach for science of science and computational sociolinguistics by
highlighting two key social implications. First, we measure audience design,
and find that most fields reduce jargon when publishing in general-purpose
journals, but some do so more than others. Second, though jargon has varying
correlation with articles' citation rates within fields, it nearly always
impedes interdisciplinary impact. Broadly, our measurements can inform ways in
which language could be revised to serve as a bridge rather than a barrier in
science.
- Abstract(参考訳): 学術的なテキストはしばしば、規律を分割する専門的な言語であるジャーゴン(jargon)で語られる。
BERTをベースとした単語感覚誘導法を用いて,各分野にまたがる多用性に富んだ追加語を見つけることで,語型レベルで科学を特徴付ける過去の研究を拡張した。
我々は学術用語を規律固有の単語タイプと感覚として定義し,解釈可能な情報理論的指標を用いて数百分野にわたってその頻度を推定する。
我々は,科学および計算社会言語学における我々のアプローチの有用性を,二つの重要な社会的意味を浮き彫りにすることで実証する。
まず、オーディエンスデザインを計測し、ほとんどの分野が汎用雑誌の出版時のジャーゴンを減少させるが、他の分野よりも多くのことをするものもある。
第二に、ジャーゴンは分野内の記事の引用率と異なる相関関係を持つが、ほぼ常に学際的影響を阻害する。
広くは、我々の測定は、科学の障壁ではなく、橋として言語を改定する方法を知ることができる。
関連論文リスト
- Quantifying the redundancy between prosody and text [67.07817268372743]
我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文 参考訳(メタデータ) (2023-11-28T21:15:24Z) - Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - SensePOLAR: Word sense aware interpretability for pre-trained contextual
word embeddings [4.479834103607384]
単語埋め込みに解釈可能性を加えることは、テキスト表現における活発な研究の領域である。
本稿では,従来のPOLARフレームワークを拡張したSensePOLARを提案する。
論文 参考訳(メタデータ) (2023-01-11T20:25:53Z) - Dictionary-Assisted Supervised Contrastive Learning [0.0]
本稿では,辞書支援型教師付きコントラスト学習(DASCL)の目的について紹介する。
共通の固定トークンは、関心の概念に関連する辞書(ies)に現れるコーパス内の任意の単語を置き換える。
DASCLとクロスエントロピーは、数ショットの学習設定と社会科学応用における分類性能指標を改善する。
論文 参考訳(メタデータ) (2022-10-27T04:57:43Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework
Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - What's in a Scientific Name? [0.0]
本研究は,「予測」,「モデル」,「最適化」,「複雑」,「エントロピー」,「ランダム」,「決定論的」,「パターン」,「データベース」の語源を考察した。
いくつかの単語は、異なる領域で顕著に異なる関連性を持っていることが観察され、生物学はコンピュータ科学と関連し、データベースと関連性を共有することが判明した。
論文 参考訳(メタデータ) (2021-05-31T22:06:20Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Generalized Word Shift Graphs: A Method for Visualizing and Explaining
Pairwise Comparisons Between Texts [0.15833270109954134]
計算テキスト分析における一般的な課題は、2つのコーパスが単語頻度、感情、情報内容などの測定によってどのように異なるかを定量化することである。
一般化された単語シフトグラフを導入し、個々の単語が2つのテキスト間の変動にどのように貢献するかを意味的かつ解釈可能な要約を生成する。
このフレームワークは、相対周波数、辞書スコア、Kulback-LeiblerやJensen-Shannonの発散といったエントロピーに基づく測度など、テキストの比較によく使われる多くのアプローチを自然に含んでいることを示す。
論文 参考訳(メタデータ) (2020-08-05T17:27:11Z) - Cultural Cartography with Word Embeddings [0.0]
本稿では,単語の埋め込みが社会学における意味論とどのように一致しているかを示す。
まず、条件を一定に保ち、埋め込み空間が周囲をどう動くかを測定することができる。
第二に、埋め込み空間定数を保持して、ドキュメントや著者がそれに対してどのように動くかを確認することもできる。
論文 参考訳(メタデータ) (2020-07-09T01:58:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。