論文の概要: Words as Gatekeepers: Measuring Discipline-specific Terms and Meanings
in Scholarly Publications
- arxiv url: http://arxiv.org/abs/2212.09676v2
- Date: Tue, 23 May 2023 02:24:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-25 00:42:41.392344
- Title: Words as Gatekeepers: Measuring Discipline-specific Terms and Meanings
in Scholarly Publications
- Title(参考訳): 門番としての言葉 : 学術出版における専門用語と意味の測定
- Authors: Li Lucy, Jesse Dodge, David Bamman, Katherine A. Keith
- Abstract要約: テキストから学術用語を測定するための解釈可能なアプローチを開発し,検証する。
我々は、単語知覚誘導を用いて、広い範囲にまたがって異なる意味を持つ単語を識別する。
単語感覚は、語型と平行してジャゴンの相補的かつユニークなビューを提供することを示す。
- 参考スコア(独自算出の注目度): 13.443742417911352
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scholarly text is often laden with jargon, or specialized language that can
facilitate efficient in-group communication within fields but hinder
understanding for out-groups. In this work, we develop and validate an
interpretable approach for measuring scholarly jargon from text. Expanding the
scope of prior work which focuses on word types, we use word sense induction to
also identify words that are widespread but overloaded with different meanings
across fields. We then estimate the prevalence of these discipline-specific
words and senses across hundreds of subfields, and show that word senses
provide a complementary, yet unique view of jargon alongside word types. We
demonstrate the utility of our metrics for science of science and computational
sociolinguistics by highlighting two key social implications. First, though
most fields reduce their use of jargon when writing for general-purpose venues,
and some fields (e.g., biological sciences) do so less than others. Second, the
direction of correlation between jargon and citation rates varies among fields,
but jargon is nearly always negatively correlated with interdisciplinary
impact. Broadly, our findings suggest that though multidisciplinary venues
intend to cater to more general audiences, some fields' writing norms may act
as barriers rather than bridges, and thus impede the dispersion of scholarly
ideas.
- Abstract(参考訳): 学術的なテキストは、しばしばジャーゴン(jargon)や、フィールド内での効率的なグループ内コミュニケーションを促進するが、外部グループに対する理解を妨げる特殊言語が組み込まれている。
本研究では,テキストから学術用語を測定するための解釈可能なアプローチを開発し,検証する。
単語タイプに焦点を当てた事前作業の範囲を拡大し、word senseインダクションを使用して、フィールドにまたがる異なる意味を持つ広義の単語を識別します。
次に, 何百ものサブフィールドにまたがって, 規律固有の単語や感覚の出現率を推定し, 単語感覚は, 単語のタイプとともに, 相補的かつ独特なジャーゴンの視点を提供することを示した。
我々は,科学および計算社会言語学における指標の有用性を,二つの重要な社会的意味を浮き彫りにすることで実証する。
第一に、ほとんどの分野は汎用の会場のために書く際にジャーゴンの使用を減らすが、いくつかの分野(生物科学など)は他の分野よりも少ない。
第二に、ジャーゴンと引用率の相関の方向は場によって異なるが、ジャーゴンはほとんど常に学際的影響と負の相関関係にある。
概して,多分野の会場はより一般のオーディエンスを対象とするものの,一部の分野の文章規範は橋梁よりも障壁として機能する可能性があり,学術的アイデアの分散を阻害していることが示唆された。
関連論文リスト
- Quantifying the redundancy between prosody and text [67.07817268372743]
我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文 参考訳(メタデータ) (2023-11-28T21:15:24Z) - Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - SensePOLAR: Word sense aware interpretability for pre-trained contextual
word embeddings [4.479834103607384]
単語埋め込みに解釈可能性を加えることは、テキスト表現における活発な研究の領域である。
本稿では,従来のPOLARフレームワークを拡張したSensePOLARを提案する。
論文 参考訳(メタデータ) (2023-01-11T20:25:53Z) - Dictionary-Assisted Supervised Contrastive Learning [0.0]
本稿では,辞書支援型教師付きコントラスト学習(DASCL)の目的について紹介する。
共通の固定トークンは、関心の概念に関連する辞書(ies)に現れるコーパス内の任意の単語を置き換える。
DASCLとクロスエントロピーは、数ショットの学習設定と社会科学応用における分類性能指標を改善する。
論文 参考訳(メタデータ) (2022-10-27T04:57:43Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework
Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - What's in a Scientific Name? [0.0]
本研究は,「予測」,「モデル」,「最適化」,「複雑」,「エントロピー」,「ランダム」,「決定論的」,「パターン」,「データベース」の語源を考察した。
いくつかの単語は、異なる領域で顕著に異なる関連性を持っていることが観察され、生物学はコンピュータ科学と関連し、データベースと関連性を共有することが判明した。
論文 参考訳(メタデータ) (2021-05-31T22:06:20Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Generalized Word Shift Graphs: A Method for Visualizing and Explaining
Pairwise Comparisons Between Texts [0.15833270109954134]
計算テキスト分析における一般的な課題は、2つのコーパスが単語頻度、感情、情報内容などの測定によってどのように異なるかを定量化することである。
一般化された単語シフトグラフを導入し、個々の単語が2つのテキスト間の変動にどのように貢献するかを意味的かつ解釈可能な要約を生成する。
このフレームワークは、相対周波数、辞書スコア、Kulback-LeiblerやJensen-Shannonの発散といったエントロピーに基づく測度など、テキストの比較によく使われる多くのアプローチを自然に含んでいることを示す。
論文 参考訳(メタデータ) (2020-08-05T17:27:11Z) - Cultural Cartography with Word Embeddings [0.0]
本稿では,単語の埋め込みが社会学における意味論とどのように一致しているかを示す。
まず、条件を一定に保ち、埋め込み空間が周囲をどう動くかを測定することができる。
第二に、埋め込み空間定数を保持して、ドキュメントや著者がそれに対してどのように動くかを確認することもできる。
論文 参考訳(メタデータ) (2020-07-09T01:58:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。