論文の概要: Data Science in an Agent-Based Simulation World
- arxiv url: http://arxiv.org/abs/2306.01764v1
- Date: Sat, 27 May 2023 12:16:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-11 13:57:48.454097
- Title: Data Science in an Agent-Based Simulation World
- Title(参考訳): エージェントベースシミュレーションの世界におけるデータサイエンス
- Authors: Satoshi Takahashi, Atushi Yoshikawa
- Abstract要約: 本稿ではエージェント・ベース・シミュレーション(ABS)を用いたデータサイエンス教材を提案する。
この教材を用いることで、学習者はデータ科学者が行う典型的なタスクをステップバイステップでシミュレートできることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In data science education, the importance of learning to solve real-world
problems has been argued. However, there are two issues with this approach: (1)
it is very costly to prepare multiple real-world problems (using real data)
according to the learning objectives, and (2) the learner must suddenly tackle
complex real-world problems immediately after learning from a textbook using
ideal data. To solve these issues, this paper proposes data science teaching
material that uses agent-based simulation (ABS). The proposed teaching material
consists of an ABS model and an ABS story. To solve issue 1, the scenario of
the problem can be changed according to the learning objectives by setting the
appropriate parameters of the ABS model. To solve issue 2, the difficulty level
of the tasks can be adjusted by changing the description in the ABS story. We
show that, by using this teaching material, the learner can simulate the
typical tasks performed by a data scientist in a step-by-step manner (causal
inference, data understanding, hypothesis building, data collection, data
wrangling, data analysis, and hypothesis testing). The teaching material
described in this paper focuses on causal inference as the learning objectives
and infectious diseases as the model theme for ABS, but ABS is used as a model
to reproduce many types of social phenomena, and its range of expression is
extremely wide. Therefore, we expect that the proposed teaching material will
inspire the construction of teaching material for various objectives in data
science education.
- Abstract(参考訳): データサイエンス教育では、現実世界の問題を解決するための学習の重要性が議論されている。
しかし,本手法には,(1)学習目的に応じて複数の現実問題(実データを用いた)を作成するのに非常にコストがかかること,(2)学習者が理想データを用いて教科書から学習した直後に突然,複雑な現実問題に対処しなければならないこと,の2つの問題がある。
本稿では,エージェント・ベース・シミュレーション(ABS)を用いたデータサイエンス教材を提案する。
提案する教材は,ABSモデルとABSストーリーからなる。
課題1を解決するために、ABSモデルの適切なパラメータを設定することにより、学習目標に応じて問題のシナリオを変更することができる。
課題2を解決するために、ABSストーリーの記述を変更してタスクの難易度を調整することができる。
この教材を用いて、学習者はデータ科学者が行う典型的なタスク(因果推論、データ理解、仮説構築、データ収集、データラングリング、データ分析、仮説テスト)を段階的にシミュレートできることを示す。
本稿では,ABSのモデルテーマとしての因果推論と感染症について述べるが,ABSは様々な社会現象を再現するモデルとして利用されており,その表現範囲は極めて広い。
そこで本研究は,データサイエンス教育における様々な目的のための教材構築を促すことを期待する。
関連論文リスト
- LLM-itation is the Sincerest Form of Data: Generating Synthetic Buggy Code Submissions for Computing Education [5.421088637597145]
大規模言語モデル(LLM)は、大規模でプライバシを保存する合成データを作成するための有望なアプローチを提供する。
本研究は,GPT-4oを用いた導入プログラミング演習のための合成バグギーコード生成について検討する。
合成データと実生データ間のテストケース故障の分布を比較し,実生データを模倣した合成データの精度を解析した。
論文 参考訳(メタデータ) (2024-11-01T00:24:59Z) - LLM-based Cognitive Models of Students with Misconceptions [55.29525439159345]
本稿では,この2つの要件を満たすためにLLM(Large Language Models)を命令調整できるかどうかを検討する。
真正な学生ソリューションパターンを反映したデータセットを生成する新しいPythonライブラリであるMalAlgoPyを紹介する。
我々の洞察は、AIに基づく学生モデルの理解を高め、効果的な適応学習システムへの道を開く。
論文 参考訳(メタデータ) (2024-10-16T06:51:09Z) - The Frontier of Data Erasure: Machine Unlearning for Large Language Models [56.26002631481726]
大規模言語モデル(LLM)はAIの進歩の基礎となっている。
LLMは機密情報、偏見情報、著作権情報を記憶し、広めることによってリスクを生じさせる。
機械学習は、これらの懸念を軽減するための最先端のソリューションとして現れます。
論文 参考訳(メタデータ) (2024-03-23T09:26:15Z) - Physics-Informed Machine Learning for Modeling and Control of Dynamical
Systems [0.0]
物理インフォームド機械学習(英: Physics-informed machine learning、PIML)は、機械学習(ML)アルゴリズムを物理的制約と体系的に統合する手法とツールのセットである。
PIMLの基本前提は、MLと物理の統合により、より効率的で、物理的に一貫性があり、データ効率のよいモデルが得られることである。
本稿では,動的システムモデリングと制御のためのPIMLの最近の進歩について,チュートリアルのような概要を提供する。
論文 参考訳(メタデータ) (2023-06-24T05:24:48Z) - Hindsight States: Blending Sim and Real Task Elements for Efficient
Reinforcement Learning [61.3506230781327]
ロボット工学では、第一原理から導かれた力学モデルに基づくシミュレーションに基づいて、トレーニングデータを生成する方法がある。
ここでは、力学の複雑さの不均衡を利用して、より標本効率のよい学習を行う。
提案手法をいくつかの課題に対して検証し,既存の近視アルゴリズムと組み合わせた場合の学習改善を実証する。
論文 参考訳(メタデータ) (2023-03-03T21:55:04Z) - On Inductive Biases for Machine Learning in Data Constrained Settings [0.0]
この論文は、データ制約された設定で表現力のあるモデルを学ぶという問題に対する異なる答えを探求する。
ニューラルネットワークを学ぶために、大きなデータセットに頼るのではなく、データ構造を反映した既知の関数によって、いくつかのモジュールを置き換えるつもりです。
我々のアプローチは「帰納的バイアス」のフードの下に置かれており、これは探索するモデルの空間を制限する手元にあるデータの仮説として定義することができる。
論文 参考訳(メタデータ) (2023-02-21T14:22:01Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Algebraic Learning: Towards Interpretable Information Modeling [0.0]
この論文は、一般的な情報モデリングにおける解釈可能性の問題に対処し、問題を2つの範囲から緩和する試みである。
まず、問題指向の視点を用いて、興味深い数学的性質が自然に現れるモデリング実践に知識を取り入れる。
第二に、訓練されたモデルを考えると、基礎となるシステムに関するさらなる洞察を抽出するために様々な方法を適用することができる。
論文 参考訳(メタデータ) (2022-03-13T15:53:39Z) - Machine Unlearning of Features and Labels [72.81914952849334]
機械学習モデルにおけるアンラーニングとラベルのファーストシナリオを提案する。
提案手法は,影響関数の概念に基づいて,モデルパラメータのクローズドフォーム更新によるアンラーニングを実現する。
論文 参考訳(メタデータ) (2021-08-26T04:42:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。