論文の概要: Subtask Analysis of Process Data Through a Predictive Model
- arxiv url: http://arxiv.org/abs/2009.00717v1
- Date: Sat, 29 Aug 2020 21:11:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 17:29:00.985180
- Title: Subtask Analysis of Process Data Through a Predictive Model
- Title(参考訳): 予測モデルによるプロセスデータのサブタスク解析
- Authors: Zhi Wang, Xueying Tang, Jingchen Liu and Zhiliang Ying
- Abstract要約: 本稿では,そのようなプロセスデータの探索的解析のための計算効率の良い手法を開発した。
新しいアプローチでは、長い個々のプロセスを短いサブプロセスのシーケンスに分割することで、複雑性の低減を実現している。
PIAAC 2012のプロセスデータを用いて、新しいアプローチでプロセスデータの探索分析がどのように行えるかを示す。
- 参考スコア(独自算出の注目度): 5.7668512557707166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Response process data collected from human-computer interactive items contain
rich information about respondents' behavioral patterns and cognitive
processes. Their irregular formats as well as their large sizes make standard
statistical tools difficult to apply. This paper develops a computationally
efficient method for exploratory analysis of such process data. The new
approach segments a lengthy individual process into a sequence of short
subprocesses to achieve complexity reduction, easy clustering and meaningful
interpretation. Each subprocess is considered a subtask. The segmentation is
based on sequential action predictability using a parsimonious predictive model
combined with the Shannon entropy. Simulation studies are conducted to assess
performance of the new methods. We use the process data from PIAAC 2012 to
demonstrate how exploratory analysis of process data can be done with the new
approach.
- Abstract(参考訳): 人間とコンピュータの対話的な項目から収集された応答プロセスデータは、回答者の行動パターンや認知過程に関する豊富な情報を含んでいる。
その不規則な形式と大きなサイズは標準統計ツールの適用を困難にしている。
本稿では,そのようなプロセスデータの探索的解析を効率的に行う方法を提案する。
新しいアプローチでは、長い個々のプロセスを短いサブプロセスのシーケンスに分割し、複雑さの低減、クラスタリングの容易化、意味のある解釈を実現する。
各サブプロセスはサブタスクとみなされる。
セグメンテーションは、シャノンエントロピーと組み合わせた微妙な予測モデルを用いた逐次行動予測可能性に基づいている。
新しい手法の性能を評価するためにシミュレーション研究を行った。
PIAAC 2012のプロセスデータを用いて、新しいアプローチでプロセスデータの探索分析がどのように行えるかを示す。
関連論文リスト
- Distilled Datamodel with Reverse Gradient Matching [74.75248610868685]
オフライントレーニングとオンライン評価段階を含む,データ影響評価のための効率的なフレームワークを提案する。
提案手法は, 直接再学習法と比較して, プロセスの大幅な高速化を図りながら, 同等のモデル行動評価を実現する。
論文 参考訳(メタデータ) (2024-04-22T09:16:14Z) - Mining a Minimal Set of Behavioral Patterns using Incremental Evaluation [3.16536213610547]
行動パターンマイニングへの既存のアプローチには2つの制限がある。
まず、インクリメンタルな計算がパターン候補の生成にのみ組み込まれるため、スケーラビリティが制限される。
第二に、マイニングされたパターンに基づくプロセス分析は、実用的なアプリケーションシナリオで得られるパターンが圧倒的に多いため、限られた効果しか示さない。
論文 参考訳(メタデータ) (2024-02-05T11:41:37Z) - A Mechanistic Interpretation of Arithmetic Reasoning in Language Models
using Causal Mediation Analysis [128.0532113800092]
算数問題に対するトランスフォーマーに基づくLMの機械的解釈を提案する。
これにより、算術に関連する情報がLMによってどのように処理されるかについての洞察が得られる。
論文 参考訳(メタデータ) (2023-05-24T11:43:47Z) - ALMERIA: Boosting pairwise molecular contrasts with scalable methods [0.0]
ALMERIAは、一対の分子コントラストに基づく化合物の類似性と活性予測を推定するためのツールである。
大量のデータを利用するスケーラブルなソフトウェアと手法を使って実装されている。
分子活性予測の最先端性能を示す実験を行った。
論文 参考訳(メタデータ) (2023-04-28T16:27:06Z) - Clustering Object-Centric Event Logs [0.36748639131154304]
本稿では,OCEL に類似したオブジェクトをクラスタリングするクラスタリング手法を提案する。
我々のアプローチは、プロセスモデルの複雑さを減らし、エンドユーザーがプロセスに対する洞察を得るのに役立つオブジェクトの一貫性のあるサブセットを生成する。
論文 参考訳(メタデータ) (2022-07-26T09:16:39Z) - Process-BERT: A Framework for Representation Learning on Educational
Process Data [68.8204255655161]
本稿では,教育プロセスデータの表現を学習するためのフレームワークを提案する。
我々のフレームワークは、BERT型の目的を用いて、シーケンシャルなプロセスデータから表現を学習する事前学習ステップで構成されています。
当社のフレームワークは,2019年国のレポートカードデータマイニングコンペティションデータセットに適用しています。
論文 参考訳(メタデータ) (2022-04-28T16:07:28Z) - What Averages Do Not Tell -- Predicting Real Life Processes with
Sequential Deep Learning [0.1376408511310322]
プロセスマイニング(Process Mining)は、システムによってログされた実行データからビジネスプロセスに関する洞察を発見すること。
多くのディープラーニング技術が、プロセス結果の予測を目的とした予測プロセスマイニングに成功している。
プロセスマイニングのトレースはマルチモーダルシーケンスであり、自然言語の文や画像とは全く異なる構造である。
論文 参考訳(メタデータ) (2021-10-19T19:45:05Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Rissanen Data Analysis: Examining Dataset Characteristics via
Description Length [78.42578316883271]
特定の能力が与えられたデータの正確なモデルを達成するのに役立つかどうかを判断する手法を提案する。
最小プログラム長は計算不可能であるため,ラベルの最小記述長(MDL)をプロキシとして推定する。
我々は、mdlの父にちなんで、rissanen data analysis (rda) と呼ぶ。
論文 参考訳(メタデータ) (2021-03-05T18:58:32Z) - Process Discovery for Structured Program Synthesis [70.29027202357385]
プロセスマイニングにおける中核的なタスクは、イベントログデータから正確なプロセスモデルを学ぶことを目的としたプロセス発見である。
本稿では,ターゲットプロセスモデルとして(ブロック-)構造化プログラムを直接使用することを提案する。
我々は,このような構造化プログラムプロセスモデルの発見に対して,新たなボトムアップ・アグリメティブ・アプローチを開発する。
論文 参考訳(メタデータ) (2020-08-13T10:33:10Z) - ProcData: An R Package for Process Data Analysis [5.278929511653198]
この記事では、プロセスデータの処理、記述、分析のためのツールを提供するように設計されています。
不規則応答過程の情報を正規数値ベクトルに圧縮する2つのプロセスデータの特徴抽出手法をパッケージに実装する。
また、2012年度国際学生評価プログラムにおける、いくつかの対応プロセス生成装置と、気候管理項目の実際の対応プロセスのデータセットをパッケージに含めている。
論文 参考訳(メタデータ) (2020-06-09T05:44:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。