論文の概要: What Are LLMs Doing to Scientific Communication? Measuring Changes in Writing Practices and Reading Experience
- arxiv url: http://arxiv.org/abs/2605.19936v1
- Date: Tue, 19 May 2026 14:54:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.449916
- Title: What Are LLMs Doing to Scientific Communication? Measuring Changes in Writing Practices and Reading Experience
- Title(参考訳): LLMは科学コミュニケーションに何をするのか? : 書記の実践と読解体験の変化を計測する
- Authors: Filip Miletić, Neele Falk,
- Abstract要約: 私たちは、ACLアンソロジー(2020-2024)から37,000以上の論文からなる自然主義コーパスと、3000の人文のパスからなる合成データセットを作成します。
まず,単語の頻度と使用状況が時間とともに大きく変化したことを示す。
次に、より複雑なスタイリスティックな特徴をモデル化し、LLM修飾テキストがより頻繁に、特定の構文構造、より複雑で長い単語、より低い語彙の多様性を含むことを確認する。
- 参考スコア(独自算出の注目度): 8.092815324198176
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Has the style of scientific communication changed due to the growing use of large language models in the writing process? We address this question in the domain of Natural Language Processing by leveraging two data resources we create: a naturalistic corpus of over 37,000 papers from the ACL Anthology (2020-2024); and a synthetic dataset of 3,000 human-written passages and their LLM-generated improvements. We first implement a series of diachronic lexical analyses, showing that both word frequency and usage contexts have changed significantly over time, indicating semantic specialization in some cases and generalization in others. Broadening our perspective, we then model a range of more complex stylistic features and find that LLM-modified texts more frequently contain certain syntactic constructions, more complex and longer words and a lower lexical diversity. Finally, we connect these changes in writing practices to subjective reading experience through a pilot annotation study with 20 domain experts. They overall rate LLM-improved texts as more understandable and exciting, but also express negative qualitative attitudes towards LLMs, highlighting the strongly subjective effect of AI-assisted writing on reading experience.
- Abstract(参考訳): 筆記プロセスにおける大規模言語モデルの利用の増加により,科学的コミュニケーションのスタイルは変化したのか?
本稿では,ACLアンソロジー(2020-2024)の37,000以上の論文からなる自然言語コーパスと,3000件の人文文文の合成データセットとLLMによる改善という2つのデータ資源を活用することで,自然言語処理分野におけるこの問題に対処する。
まず,単語の頻度と使用状況が時間とともに大きく変化し,意味的特殊化や一般化が見られた。
パースペクティブを広げると、より複雑なスタイリスティックな特徴をモデル化し、LLM修飾テキストは特定の構文構造、より複雑で長い単語、より低い語彙の多様性を含むことが多いことに気付く。
最後に、これらのプラクティスの変化を、20のドメインエキスパートによるパイロットアノテーション研究を通じて、主観的な読書体験に結び付ける。
全体として、LLM改善されたテキストをより理解しやすくエキサイティングなものとして評価する一方で、LLMに対する否定的な質的な態度を表現し、AI支援による執筆が読書体験に強い主観的影響を強調した。
関連論文リスト
- More Aligned, Less Diverse? Analyzing the Grammar and Lexicon of Two Generations of LLMs [6.96297373955807]
本研究は, LLM生成テキストと人間によるテキストの比較において, 研究の進展に寄与する。
我々は、生態学と情報理論の多様性指標を用いて、文法構造や語彙型の変化を定量化する。
英語のニューステキストは時間軸がほとんど変化していないのに対して,新しいLLMでは構文的,特に語彙的多様性が向上している。
論文 参考訳(メタデータ) (2026-05-07T11:21:29Z) - CLEAR: A Comprehensive Linguistic Evaluation of Argument Rewriting by Large Language Models [2.872898284494118]
我々は、議論的テキストとその改善、Argument Improvement(ArgImp)というタスクに焦点を当てる。
本稿では4つの言語レベルにマッピングされた57のメトリクスからなる評価パイプラインであるCLEARについて述べる。
これらのモデルでは,文章の短縮と平均語長の増大,文章の融合によりArgImpが実現されている。
論文 参考訳(メタデータ) (2025-09-18T14:53:41Z) - How Do LLM-Generated Texts Impact Term-Based Retrieval Models? [76.92519309816008]
本稿では,大規模言語モデル(LLM)が項ベース検索モデルに与える影響について検討する。
言語学的解析により,LLM生成テキストはよりスムーズで低周波なZipf勾配を示すことが明らかとなった。
本研究は,項分布がクエリと密接に一致した文書を優先して,項ベース検索モデルがソースバイアスを示すかどうかを考察する。
論文 参考訳(メタデータ) (2025-08-25T06:43:27Z) - Who Relies More on World Knowledge and Bias for Syntactic Ambiguity Resolution: Humans or LLMs? [2.3749120526936465]
本研究では,近年の大型言語モデル (LLM) が,6つの類型的多様言語において,相対的節のアタッチメントのあいまいさをナビゲートする方法について検討する。
論文 参考訳(メタデータ) (2025-03-13T19:44:15Z) - Beyond Profile: From Surface-Level Facts to Deep Persona Simulation in LLMs [50.0874045899661]
本稿では,文字のテキストワークに現れる言語パターンと独特の思考パターンの両方を再現するモデルである characterBot を紹介する。
著名な中国の作家ル・ジュンをケーススタディとして、17冊のエッセイ集から派生した4つの訓練課題を提案する。
これには、外部の言語構造と知識を習得することに焦点を当てた事前訓練タスクと、3つの微調整タスクが含まれる。
言語的正確性と意見理解の3つのタスクにおいて、キャラクタボットを評価し、適応されたメトリクスのベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2025-02-18T16:11:54Z) - Human Variability vs. Machine Consistency: A Linguistic Analysis of Texts Generated by Humans and Large Language Models [0.0]
人文テキストと大言語モデル(LLM)で生成されたテキストとの有意な差異を同定する。
以上の結果から,人間は認知的要求の少ない文章を書けること,意味的内容の充実,感情的内容の充実などが示唆された。
論文 参考訳(メタデータ) (2024-12-04T04:38:35Z) - Inclusivity in Large Language Models: Personality Traits and Gender Bias in Scientific Abstracts [49.97673761305336]
我々は,3つの大きな言語モデル (LLM) を,人間の物語スタイルと潜在的な性別バイアスに適合させることで評価した。
以上の結果から,これらのモデルは一般的にヒトの投稿内容によく似たテキストを生成するが,スタイル的特徴の変化は有意な性差を示すことが示唆された。
論文 参考訳(メタデータ) (2024-06-27T19:26:11Z) - Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。
計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文 参考訳(メタデータ) (2024-04-01T17:45:15Z) - Improving Factual Consistency of News Summarization by Contrastive Preference Optimization [65.11227166319546]
大規模言語モデル(LLM)は、本来の記事と現実的に矛盾する要約を生成する。
これらの幻覚は、従来の方法による検出が困難である。
本稿では,LLMの適合性を解消し,忠実で偽のコンテンツを生成するコントラスト優先最適化(CPO)を提案する。
論文 参考訳(メタデータ) (2023-10-30T08:40:16Z) - Cross-Lingual Knowledge Editing in Large Language Models [73.12622532088564]
知識編集は、スクラッチから再学習することなく、大きな言語モデルを新しい知識に適応させることが示されている。
ソース言語編集が別のターゲット言語に与える影響は、いまだ不明である。
まず、ZsREを英語から中国語に翻訳することで、大規模な言語間合成データセットを収集する。
論文 参考訳(メタデータ) (2023-09-16T11:07:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。