論文の概要: Beyond Via: Analysis and Estimation of the Impact of Large Language Models in Academic Papers
- arxiv url: http://arxiv.org/abs/2603.25638v2
- Date: Thu, 02 Apr 2026 17:45:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:09.063502
- Title: Beyond Via: Analysis and Estimation of the Impact of Large Language Models in Academic Papers
- Title(参考訳): Beyond Via: 学術論文における大規模言語モデルの影響の分析と評価
- Authors: Mingmeng Geng, Yuhang Dong, Thierry Poibeau,
- Abstract要約: 大規模言語モデル(LLM)によって駆動される可能性のある単語使用量の変化について報告する。
実験により、現在の分類器は、複数のクラス分類タスクにおいて、与えられたテキストを生成する特定のモデルを正確に決定するのに苦労していることが示された。
- 参考スコア(独自算出の注目度): 10.297544444218685
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Through an analysis of arXiv papers, we report several shifts in word usage that are likely driven by large language models (LLMs) but have not previously received sufficient attention, such as the increased frequency of "beyond" and "via" in titles and the decreased frequency of "the" and "of" in abstracts. Due to the similarities among different LLMs, experiments show that current classifiers struggle to accurately determine which specific model generated a given text in multi-class classification tasks. Meanwhile, variations across LLMs also result in evolving patterns of word usage in academic papers. By adopting a direct and highly interpretable linear approach and accounting for differences between models and prompts, we quantitatively assess these effects and show that real-world LLM usage is heterogeneous and dynamic.
- Abstract(参考訳): arXiv論文の分析を通じて、大言語モデル(LLM)によって駆動されるが、タイトルにおける"Beyond"と"via"の頻度の増加や、抽象論における"the"と"of"の頻度の減少など、これまで十分に注目されていなかった単語使用率の変化を報告した。
異なるLLM間の類似性から、実験により、現在の分類器は、複数のクラス分類タスクにおいて、与えられたテキストを生成する特定のモデルを正確に決定するのは難しいことが示されている。
一方、LLM間のバリエーションは学術論文における単語使用パターンの進化をもたらす。
直接的かつ高度に解釈可能な線形アプローチを採用し、モデルとプロンプトの違いを考慮し、これらの効果を定量的に評価し、実世界のLLM利用は不均一で動的であることを示す。
関連論文リスト
- Revisiting Word Embeddings in the LLM Era [0.2999888908665658]
大規模言語モデル(LLM)は、最近、様々なNLPタスクにおいて顕著な進歩を見せている。
従来の非コンテクスト化単語と文脈化単語の埋め込みをLLMによる埋め込みで比較した。
以上の結果から,LLMは意味的関連語をより緊密にクラスタ化し,非文脈化設定における類似処理をより良く行うことが示唆された。
論文 参考訳(メタデータ) (2025-02-26T22:45:08Z) - ExpliCa: Evaluating Explicit Causal Reasoning in Large Language Models [75.05436691700572]
明示的な因果推論において,LLM(Large Language Models)を評価するための新しいデータセットであるExpliCaを紹介する。
ExpliCa上で7つの商用およびオープンソース LLM をテストしました。
驚くべきことに、モデルは因果関係と時間的関係を関連付ける傾向にあり、そのパフォーマンスはイベントの言語的順序にも強く影響される。
論文 参考訳(メタデータ) (2025-02-21T14:23:14Z) - Human-LLM Coevolution: Evidence from Academic Writing [0.0]
We report a marked drop in the frequency of several words before previously identifieded by ChatGPT, such as "delve"。
ChatGPTで好まれる「重要な」単語の頻度は増加し続けている。
論文 参考訳(メタデータ) (2025-02-13T18:55:56Z) - PoLLMgraph: Unraveling Hallucinations in Large Language Models via State Transition Dynamics [51.17512229589]
PoLLMgraphは、大規模言語モデルのためのモデルベースのホワイトボックス検出および予測手法である。
LLMの内部状態遷移ダイナミクスを解析することにより,幻覚を効果的に検出できることを示す。
我々の研究は、LLMのモデルベースのホワイトボックス分析の新しい手法を開拓し、LLMの振る舞いの複雑なダイナミクスをさらに探求し、理解し、洗練する研究コミュニティを動機付けている。
論文 参考訳(メタデータ) (2024-04-06T20:02:20Z) - Revisiting Word Embeddings in the LLM Era [5.122866382023337]
大規模言語モデル(LLM)は、最近、様々なNLPタスクにおいて顕著な進歩を見せている。
従来の非コンテクスト化単語と文脈化単語の埋め込みをLLMによる埋め込みで比較した。
以上の結果から,LLMは意味的関連語をより緊密にクラスタ化し,非文脈化設定における類似処理をより良く行うことが示唆された。
論文 参考訳(メタデータ) (2024-02-16T21:47:30Z) - Large Language Models Are Latent Variable Models: Explaining and Finding
Good Demonstrations for In-Context Learning [104.58874584354787]
近年,事前学習型大規模言語モデル (LLM) は,インコンテキスト学習(in-context learning)として知られる推論時少数ショット学習能力を実現する上で,顕著な効率性を示している。
本研究では,現実のLLMを潜在変数モデルとみなし,ベイズレンズによる文脈内学習現象を考察することを目的とする。
論文 参考訳(メタデータ) (2023-01-27T18:59:01Z) - A Comparative Study of Lexical Substitution Approaches based on Neural
Language Models [117.96628873753123]
本稿では,一般的なニューラル言語とマスキング言語モデルの大規模比較研究について述べる。
目的語に関する情報を適切に注入すれば,SOTA LMs/MLMsによって達成された既に競合する結果をさらに改善できることを示す。
論文 参考訳(メタデータ) (2020-05-29T18:43:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。