論文の概要: Edu-ConvoKit: An Open-Source Library for Education Conversation Data
- arxiv url: http://arxiv.org/abs/2402.05111v1
- Date: Wed, 7 Feb 2024 18:59:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-08 14:06:40.139903
- Title: Edu-ConvoKit: An Open-Source Library for Education Conversation Data
- Title(参考訳): Edu-ConvoKit: 教育会話データのためのオープンソースのライブラリ
- Authors: Rose E. Wang, Dorottya Demszky
- Abstract要約: 本稿では,教育における会話データの事前処理,アノテーション,分析を行うオープンソースライブラリであるEdu-ConvoKitを紹介する。
Edu-ConvoKitはオープンソース(https://github.com/stanfordnlp/edu-convokit )、pip- installable(https://pypi.org/project/edu-convokit/)で、包括的なドキュメントがある。
- 参考スコア(独自算出の注目度): 4.142038400174106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Edu-ConvoKit, an open-source library designed to handle
pre-processing, annotation and analysis of conversation data in education.
Resources for analyzing education conversation data are scarce, making the
research challenging to perform and therefore hard to access. We address these
challenges with Edu-ConvoKit. Edu-ConvoKit is open-source
(https://github.com/stanfordnlp/edu-convokit ), pip-installable
(https://pypi.org/project/edu-convokit/ ), with comprehensive documentation
(https://edu-convokit.readthedocs.io/en/latest/ ). Our demo video is available
at: https://youtu.be/zdcI839vAko?si=h9qlnl76ucSuXb8- . We include additional
resources, such as Colab applications of Edu-ConvoKit to three diverse
education datasets and a repository of Edu-ConvoKit related papers, that can be
found in our GitHub repository.
- Abstract(参考訳): edu-convokitは,教育における会話データの事前処理,アノテーション,分析を扱うオープンソースライブラリである。
教育会話データを分析するためのリソースは乏しく、研究は実行が難しく、アクセスが困難である。
Edu-ConvoKitでこれらの課題に対処する。
Edu-ConvoKitはオープンソースである(https://github.com/stanfordnlp/edu-convokit )。
デモビデオはhttps://youtu.be/zdci839vako?
si=h9qln76ucSuXb8-。
3つの多様な教育データセットにedu-convokitのcolabアプリケーションや、githubリポジトリにあるedu-convokit関連論文のリポジトリなど、追加のリソースが含まれています。
関連論文リスト
- SEART Data Hub: Streamlining Large-Scale Source Code Mining and Pre-Processing [13.717170962455526]
私たちはSEART Data HubというWebアプリケーションを紹介します。これは、公開GitHubリポジトリからマイニングされたコードを特徴とする大規模データセットを簡単に構築し、事前処理できるWebアプリケーションです。
簡単なWebインターフェースを通じて、研究者はマイニング基準と、実行したい特定の前処理ステップを指定できる。
リクエストを提出すると、ユーザは数時間以内に、必要なデータセットのダウンロードリンク付きのメールを受け取る。
論文 参考訳(メタデータ) (2024-09-27T11:42:19Z) - EduNLP: Towards a Unified and Modularized Library for Educational Resources [78.8523961816045]
我々はEduNLPという,統一された,モジュール化された,広範なライブラリを紹介し,教育資源の理解に焦点をあてる。
このライブラリでは、ワークフロー全体を4つのキーモジュールに分離し、データ構成、処理、モデル実装、モデル評価など、一貫したインターフェースを提供します。
現在のバージョンでは、主に4つのカテゴリから10の典型的なモデルを提供し、教育領域における5つのダウンストリーム評価タスクを、ユーザの使用に対して8つの被験者に提供します。
論文 参考訳(メタデータ) (2024-06-03T12:45:40Z) - pyvene: A Library for Understanding and Improving PyTorch Models via
Interventions [79.72930339711478]
$textbfpyvene$は、さまざまなPyTorchモジュールに対するカスタマイズ可能な介入をサポートするオープンソースライブラリである。
私たちは、$textbfpyvene$が、ニューラルモデルへの介入を実行し、他のモデルとインターバルされたモデルを共有するための統一されたフレームワークを提供する方法を示します。
論文 参考訳(メタデータ) (2024-03-12T16:46:54Z) - ConvLab-3: A Flexible Dialogue System Toolkit Based on a Unified Data
Format [88.33443450434521]
タスク指向対話(TOD)システムはデジタルアシスタントとして機能し、フライトの予約やレストランの検索といった様々なタスクを通じてユーザを誘導する。
TODシステムを構築するための既存のツールキットは、データ、モデル、実験環境の包括的な配列を提供するのに不足することが多い。
本稿では,このギャップを埋めるための多面的対話システムツールキットConvLab-3を紹介する。
論文 参考訳(メタデータ) (2022-11-30T16:37:42Z) - textless-lib: a Library for Textless Spoken Language Processing [50.070693765984075]
我々はPyTorchベースのライブラリであるtextless-libを紹介した。
ライブラリが提供するビルディングブロックを説明し、そのユーザビリティを実証する。
論文 参考訳(メタデータ) (2022-02-15T12:39:42Z) - skrl: Modular and Flexible Library for Reinforcement Learning [0.0]
skrlはPythonで書かれた強化学習のためのオープンソースのモジュールライブラリである。
NVIDIA Isaac Gym環境のロード、設定、操作を可能にする。
論文 参考訳(メタデータ) (2022-02-08T12:43:31Z) - NeMo Toolbox for Speech Dataset Construction [11.494290433050624]
音声データセット構築パイプラインの各ステップに、データ前処理、音声テキストアライメント、データ後処理、フィルタリングを含むツールを開発する。
LibriVoxオーディオブックからロシアのLibriSpeechコーパス(RuLS)を構築し、ツールボックスの効率を実証しました。
論文 参考訳(メタデータ) (2021-04-11T01:57:55Z) - ConvoKit: A Toolkit for the Analysis of Conversations [14.801204120360346]
本稿では,会話を解析するためのオープンソースのツールキットであるConvoKitの設計と機能について述べる。
ConvoKitは、会話データの表現と操作のための統一されたフレームワークと、対話データセットの大規模かつ多様なコレクションを提供する。
論文 参考訳(メタデータ) (2020-05-08T18:00:28Z) - Conversations with Search Engines: SERP-based Conversational Response
Generation [77.1381159789032]
我々は、検索エンジンと対話するためのパイプラインを開発するために、適切なデータセット、検索・アズ・ア・会話(SaaC)データセットを作成します。
また、このデータセットを用いて、検索エンジンと対話するための最先端パイプライン(Conversations with Search Engines (CaSE))も開発しています。
CaSEは、サポートされたトークン識別モジュールとプリア・アウェア・ポインタージェネレータを導入することで最先端を向上する。
論文 参考訳(メタデータ) (2020-04-29T13:07:53Z) - Rapidly Bootstrapping a Question Answering Dataset for COVID-19 [88.86456834766288]
我々は、新型コロナウイルスに特化して設計された質問応答データセットの始まりであるCovidQAを紹介する。
これは、そのタイプの最初の公開リソースであり、より実質的な評価資源が利用可能になるまで研究を導くためのストップギャップとして意図されている。
論文 参考訳(メタデータ) (2020-04-23T17:35:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。