論文の概要: Edu-ConvoKit: An Open-Source Library for Education Conversation Data
- arxiv url: http://arxiv.org/abs/2402.05111v1
- Date: Wed, 7 Feb 2024 18:59:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-08 14:06:40.139903
- Title: Edu-ConvoKit: An Open-Source Library for Education Conversation Data
- Title(参考訳): Edu-ConvoKit: 教育会話データのためのオープンソースのライブラリ
- Authors: Rose E. Wang, Dorottya Demszky
- Abstract要約: 本稿では,教育における会話データの事前処理,アノテーション,分析を行うオープンソースライブラリであるEdu-ConvoKitを紹介する。
Edu-ConvoKitはオープンソース(https://github.com/stanfordnlp/edu-convokit )、pip- installable(https://pypi.org/project/edu-convokit/)で、包括的なドキュメントがある。
- 参考スコア(独自算出の注目度): 4.142038400174106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Edu-ConvoKit, an open-source library designed to handle
pre-processing, annotation and analysis of conversation data in education.
Resources for analyzing education conversation data are scarce, making the
research challenging to perform and therefore hard to access. We address these
challenges with Edu-ConvoKit. Edu-ConvoKit is open-source
(https://github.com/stanfordnlp/edu-convokit ), pip-installable
(https://pypi.org/project/edu-convokit/ ), with comprehensive documentation
(https://edu-convokit.readthedocs.io/en/latest/ ). Our demo video is available
at: https://youtu.be/zdcI839vAko?si=h9qlnl76ucSuXb8- . We include additional
resources, such as Colab applications of Edu-ConvoKit to three diverse
education datasets and a repository of Edu-ConvoKit related papers, that can be
found in our GitHub repository.
- Abstract(参考訳): edu-convokitは,教育における会話データの事前処理,アノテーション,分析を扱うオープンソースライブラリである。
教育会話データを分析するためのリソースは乏しく、研究は実行が難しく、アクセスが困難である。
Edu-ConvoKitでこれらの課題に対処する。
Edu-ConvoKitはオープンソースである(https://github.com/stanfordnlp/edu-convokit )。
デモビデオはhttps://youtu.be/zdci839vako?
si=h9qln76ucSuXb8-。
3つの多様な教育データセットにedu-convokitのcolabアプリケーションや、githubリポジトリにあるedu-convokit関連論文のリポジトリなど、追加のリソースが含まれています。
関連論文リスト
- pyvene: A Library for Understanding and Improving PyTorch Models via
Interventions [79.72930339711478]
$textbfpyvene$は、さまざまなPyTorchモジュールに対するカスタマイズ可能な介入をサポートするオープンソースライブラリである。
私たちは、$textbfpyvene$が、ニューラルモデルへの介入を実行し、他のモデルとインターバルされたモデルを共有するための統一されたフレームワークを提供する方法を示します。
論文 参考訳(メタデータ) (2024-03-12T16:46:54Z) - TextBox 2.0: A Text Generation Library with Pre-trained Language Models [72.49946755856935]
本稿では,事前学習言語モデル(PLM)の利用に着目し,包括的で統一されたライブラリであるTextBox 2.0を提案する。
包括的に言えば、私たちのライブラリは、13ドルの共通テキスト生成タスクと、それに対応する8,3ドルのデータセットをカバーしています。
また、効率的なトレーニング戦略を4ドルで実装し、スクラッチから新しいPLMを事前トレーニングするための4ドル世代目標を提供します。
論文 参考訳(メタデータ) (2022-12-26T03:50:36Z) - ConvLab-3: A Flexible Dialogue System Toolkit Based on a Unified Data
Format [88.33443450434521]
タスク指向対話(TOD)システムはデジタルアシスタントとして機能し、フライトの予約やレストランの検索といった様々なタスクを通じてユーザを誘導する。
TODシステムを構築するための既存のツールキットは、データ、モデル、実験環境の包括的な配列を提供するのに不足することが多い。
本稿では,このギャップを埋めるための多面的対話システムツールキットConvLab-3を紹介する。
論文 参考訳(メタデータ) (2022-11-30T16:37:42Z) - textless-lib: a Library for Textless Spoken Language Processing [50.070693765984075]
我々はPyTorchベースのライブラリであるtextless-libを紹介した。
ライブラリが提供するビルディングブロックを説明し、そのユーザビリティを実証する。
論文 参考訳(メタデータ) (2022-02-15T12:39:42Z) - skrl: Modular and Flexible Library for Reinforcement Learning [0.0]
skrlはPythonで書かれた強化学習のためのオープンソースのモジュールライブラリである。
NVIDIA Isaac Gym環境のロード、設定、操作を可能にする。
論文 参考訳(メタデータ) (2022-02-08T12:43:31Z) - NeMo Toolbox for Speech Dataset Construction [11.494290433050624]
音声データセット構築パイプラインの各ステップに、データ前処理、音声テキストアライメント、データ後処理、フィルタリングを含むツールを開発する。
LibriVoxオーディオブックからロシアのLibriSpeechコーパス(RuLS)を構築し、ツールボックスの効率を実証しました。
論文 参考訳(メタデータ) (2021-04-11T01:57:55Z) - Brain Predictability toolbox: a Python library for neuroimaging based
machine learning [0.0]
Brain Predictability Toolbox(BPt)は、機械学習(ML)ツールの統合フレームワークである。
このパッケージは、幅広い異なる神経画像に基づくML質問を調査するのに適している。
論文 参考訳(メタデータ) (2020-11-03T14:06:43Z) - ConvoKit: A Toolkit for the Analysis of Conversations [14.801204120360346]
本稿では,会話を解析するためのオープンソースのツールキットであるConvoKitの設計と機能について述べる。
ConvoKitは、会話データの表現と操作のための統一されたフレームワークと、対話データセットの大規模かつ多様なコレクションを提供する。
論文 参考訳(メタデータ) (2020-05-08T18:00:28Z) - Conversations with Search Engines: SERP-based Conversational Response
Generation [77.1381159789032]
我々は、検索エンジンと対話するためのパイプラインを開発するために、適切なデータセット、検索・アズ・ア・会話(SaaC)データセットを作成します。
また、このデータセットを用いて、検索エンジンと対話するための最先端パイプライン(Conversations with Search Engines (CaSE))も開発しています。
CaSEは、サポートされたトークン識別モジュールとプリア・アウェア・ポインタージェネレータを導入することで最先端を向上する。
論文 参考訳(メタデータ) (2020-04-29T13:07:53Z) - Rapidly Bootstrapping a Question Answering Dataset for COVID-19 [88.86456834766288]
我々は、新型コロナウイルスに特化して設計された質問応答データセットの始まりであるCovidQAを紹介する。
これは、そのタイプの最初の公開リソースであり、より実質的な評価資源が利用可能になるまで研究を導くためのストップギャップとして意図されている。
論文 参考訳(メタデータ) (2020-04-23T17:35:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。