論文の概要: Thematic and Task-Based Categorization of K-12 GenAI Usages with Hierarchical Topic Modeling
- arxiv url: http://arxiv.org/abs/2508.09997v1
- Date: Fri, 01 Aug 2025 21:38:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-17 22:58:06.184215
- Title: Thematic and Task-Based Categorization of K-12 GenAI Usages with Hierarchical Topic Modeling
- Title(参考訳): 階層的トピックモデリングを用いたK-12 GenAIのテーマとタスクベース分類
- Authors: Johannes Schneider, Béatrice S. Hasler, Michaela Varrone, Fabian Hoya, Thomas Schroffenegger, Dana-Kristin Mah, Karl Peböck,
- Abstract要約: 授業室における未成年者の匿名インタラクションデータを数ヶ月間, 学校, 科目で分析した。
我々は,学生,教師,チャットGPTが生成する17,000件以上のメッセージを,コンテンツ(自然や人など)とタスク(文章や説明など)の2次元に分類する。
- 参考スコア(独自算出の注目度): 1.0737278711356866
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We analyze anonymous interaction data of minors in class-rooms spanning several months, schools, and subjects employing a novel, simple topic modeling approach. Specifically, we categorize more than 17,000 messages generated by students, teachers, and ChatGPT in two dimensions: content (such as nature and people) and tasks (such as writing and explaining). Our hierarchical categorization done separately for each dimension includes exemplary prompts, and provides both a high-level overview as well as tangible insights. Prior works mostly lack a content or thematic categorization. While task categorizations are more prevalent in education, most have not been supported by real-world data for K-12. In turn, it is not surprising that our analysis yielded a number of novel applications. In deriving these insights, we found that many of the well-established classical and emerging computational methods, i.e., topic modeling, for analysis of large amounts of texts underperform, leading us to directly apply state-of-the-art LLMs with adequate pre-processing to achieve hierarchical topic structures with better human alignment through explicit instructions than prior approaches. Our findings support fellow researchers, teachers and students in enriching the usage of GenAI, while our discussion also highlights a number of concerns and open questions for future research.
- Abstract(参考訳): 授業室における未成年者の匿名インタラクションデータを数ヶ月間, 学校, 対象者を対象に, 新しくてシンプルなトピックモデリング手法を用いて分析した。
具体的には、学生、教師、チャットGPTが生成する17,000件以上のメッセージを、コンテンツ(自然や人など)とタスク(文章や説明など)の2次元に分類する。
それぞれの次元で個別に行われる階層的分類には、模範的なプロンプトが含まれており、高レベルな概要と有形な洞察の両方を提供する。
それまでの作品は内容や主題の分類がほとんどなかった。
タスク分類は教育において一般的であるが、K-12の実際のデータではサポートされていない。
逆に、我々の分析が多くの新しい応用をもたらしたことは驚くにあたらない。
これらの知見を導出するにあたっては、大量のテキストを解析するためのトピックモデリングなど、確立された古典的および新興的な計算手法の多くについて、適切な事前処理による最先端のLCMを直接適用して、事前のアプローチよりも明確な指示によって、より優れた階層的なトピック構造を達成できることを見出した。
我々は,GenAIの利用を充実させる研究者,教員,学生を支援するとともに,今後の研究への懸念やオープンな疑問も浮き彫りにしている。
関連論文リスト
- Boosting Short Text Classification with Multi-Source Information Exploration and Dual-Level Contrastive Learning [12.377363857246602]
短文分類のためのMI-DELIGHTという新しいモデルを提案する。
まず、スパーシリティの問題を軽減するために、マルチソース情報探索を行う。
次に,短いテキストの表現を学習するために,グラフ学習アプローチを採用する。
論文 参考訳(メタデータ) (2025-01-16T00:26:15Z) - Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - Twitter Topic Classification [15.306383757213956]
我々は、ツイートトピック分類に基づく新しいタスクを提案し、関連する2つのデータセットをリリースする。
ソーシャルメディアで最も重要な議論点をカバーする幅広いトピックについて、トレーニングとテストデータを提供しています。
タスク上で,現在の汎用言語モデルとドメイン固有言語モデルの定量的評価と分析を行う。
論文 参考訳(メタデータ) (2022-09-20T16:13:52Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Predicting Themes within Complex Unstructured Texts: A Case Study on
Safeguarding Reports [66.39150945184683]
本稿では,教師付き分類手法を用いた保護レポートにおいて,主テーマの自動識別の問題に焦点をあてる。
この結果から,ラベル付きデータに制限のある複雑なタスクであっても,深層学習モデルが対象知識の振る舞いをシミュレートする可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-27T19:48:23Z) - Keyword Assisted Topic Models [0.0]
少数のキーワードを提供することで,話題モデルの計測性能を大幅に向上させることができることを示す。
KeyATMは、より解釈可能な結果を提供し、文書分類性能が向上し、標準トピックモデルよりもトピックの数に敏感でない。
論文 参考訳(メタデータ) (2020-04-13T14:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。