論文の概要: An Empirical Study on How the Developers Discussed about Pandas Topics
- arxiv url: http://arxiv.org/abs/2210.03519v2
- Date: Wed, 10 May 2023 16:52:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-11 17:26:49.709818
- Title: An Empirical Study on How the Developers Discussed about Pandas Topics
- Title(参考訳): pandasトピックに関する開発者の議論に関する実証的研究
- Authors: Sajib Kumar Saha Joy, Farzad Ahmed, Al Hasib Mahamud, and Nibir
Chandra Mandal
- Abstract要約: Stack Overflow(SO)など,オンライン開発者フォーラムでは,数多くの議論が主流になっている。
本研究の目的は,パンダのトピックの人気と難しさを明らかにすることである。
開発者は、エラーや処理、可視化、外部サポート、データフレーム、最適化を除いて、SOにおける様々なパンダのトピックについて議論する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pandas is defined as a software library which is used for data analysis in
Python programming language. As pandas is a fast, easy and open source data
analysis tool, it is rapidly used in different software engineering projects
like software development, machine learning, computer vision, natural language
processing, robotics, and others. So a huge interests are shown in software
developers regarding pandas and a huge number of discussions are now becoming
dominant in online developer forums, like Stack Overflow (SO). Such discussions
can help to understand the popularity of pandas library and also can help to
understand the importance, prevalence, difficulties of pandas topics. The main
aim of this research paper is to find the popularity and difficulty of pandas
topics. For this regard, SO posts are collected which are related to pandas
topic discussions. Topic modeling are done on the textual contents of the
posts. We found 26 topics which we further categorized into 5 board categories.
We observed that developers discuss variety of pandas topics in SO related to
error and excepting handling, visualization, External support, dataframe, and
optimization. In addition, a trend chart is generated according to the
discussion of topics in a predefined time series. The finding of this paper can
provide a path to help the developers, educators and learners. For example,
beginner developers can learn most important topics in pandas which are
essential for develop any model. Educators can understand the topics which seem
hard to learners and can build different tutorials which can make that pandas
topic understandable. From this empirical study it is possible to understand
the preferences of developers in pandas topic by processing their SO posts
- Abstract(参考訳): PandasはPythonプログラミング言語のデータ分析に使用されるソフトウェアライブラリとして定義されている。
pandasは高速で簡単でオープンソースのデータ分析ツールであるため、ソフトウェア開発、機械学習、コンピュータビジョン、自然言語処理、ロボット工学など、さまざまなソフトウェアエンジニアリングプロジェクトで急速に利用されている。
だから、pandasに関するソフトウェア開発者に大きな関心が示され、stack overflow(so)のようなオンライン開発者フォーラムで、多くの議論が支配的になっている。
このような議論はpandasライブラリの人気を理解するのに役立ち、pandasトピックの重要性、普及率、困難さを理解するのにも役立ちます。
本研究の目的は,パンダのトピックの人気と難しさを明らかにすることである。
この点に関して、pandasトピックに関する議論に関連する投稿が収集される。
トピックモデリングは、投稿のテキスト内容に基づいて行われる。
26のトピックを,さらに5つのボードカテゴリに分類した。
開発者は、エラーや処理、可視化、外部サポート、データフレーム、最適化を除いて、SOにおける様々なパンダトピックについて議論する。
また、予め定義された時系列におけるトピックの議論に応じてトレンドチャートを生成する。
この論文の発見は、開発者、教育者、学習者を支援する道を提供する。
例えば初心者の開発者は,任意のモデルを開発する上で不可欠な,pandasの最も重要なトピックを学ぶことができる。
教育者は、学習者にとって難しいトピックを理解し、パンダのトピックを理解できるようにするための異なるチュートリアルを構築することができる。
この実証研究から,SOポストを処理することで,パンダトピックにおける開発者の好みを理解することができる。
関連論文リスト
- Investigating Developers' Preferences for Learning and Issue Resolution Resources in the ChatGPT Era [1.3124513975412255]
最近のトレンドはビデオチュートリアルのような魅力的なフォーマットを好んでいる。
ChatGPTのような大規模言語モデル(LLM)の出現は、新しい学習パラダイムを提示します。
我々は,ソフトウェア開発者とコンピュータサイエンスの学生を対象に,341の回答を集め,そのうち268の回答を完成・分析した。
論文 参考訳(メタデータ) (2024-10-10T22:57:29Z) - ChatGPT in Linear Algebra: Strides Forward, Steps to Go [1.1060425537315088]
当社の関心分野における近年のChatGPTのプロセスを振り返る。
このソフトウェアが教師のアシスタントになるのか、それとも人間の教師の代わりになるのか、という問題に対処する。
論文 参考訳(メタデータ) (2024-02-18T07:35:01Z) - Characterizing and Classifying Developer Forum Posts with their Intentions [10.452110215035072]
オンライン技術フォーラムの投稿数は急速に増えている。
ほとんどのタグは技術的な観点にのみ焦点をあてています。
ポストの意図をモデル化することは、現在のタグ分類に余分な次元を与えることができる。
論文 参考訳(メタデータ) (2023-12-21T20:17:01Z) - PandaGPT: One Model To Instruction-Follow Them All [43.481806913988805]
PandaGPTは、視覚的および聴覚的指示追従機能を備えた大型LANguage MoDelsをエミュレートするアプローチである。
PandaGPTは、詳細な画像記述生成、ビデオにインスパイアされたストーリーの執筆、音声に関する質問に答えるといった複雑なタスクを実行することができる。
論文 参考訳(メタデータ) (2023-05-25T04:16:07Z) - Uncovering the Potential of ChatGPT for Discourse Analysis in Dialogue:
An Empirical Study [51.079100495163736]
本稿では、トピックセグメンテーションと談話解析という2つの談話分析タスクにおけるChatGPTの性能を体系的に検証する。
ChatGPTは、一般的なドメイン間会話においてトピック構造を特定する能力を示すが、特定のドメイン間会話ではかなり困難である。
我々のより深い調査は、ChatGPTは人間のアノテーションよりも合理的なトピック構造を提供するが、階層的なレトリック構造を線形に解析することしかできないことを示唆している。
論文 参考訳(メタデータ) (2023-05-15T07:14:41Z) - pysentimiento: A Python Toolkit for Opinion Mining and Social NLP tasks [0.2826977330147589]
pysentimientoは意見マイニングやその他のソーシャルNLPタスク用に設計されたPythonツールキットである。
このオープンソースライブラリは、簡単に使えるPythonライブラリで、スペイン語、英語、イタリア語、ポルトガル語の最先端モデルを提供する。
各種タスク,言語,データセットにまたがる事前学習言語モデルの総合的な性能評価を行う。
論文 参考訳(メタデータ) (2021-06-17T13:15:07Z) - Graph Self-Supervised Learning: A Survey [73.86209411547183]
SSL(Self-supervised Learning)は、グラフデータの有望でトレンドの学習パラダイムとなっています。
グラフデータにSSL技術を用いた既存のアプローチをタイムリーかつ包括的にレビューします。
論文 参考訳(メタデータ) (2021-02-27T03:04:21Z) - The Influence of Domain-Based Preprocessing on Subject-Specific
Clustering [55.41644538483948]
大学におけるオンライン教育の大部分を突然移行させることで、学者の作業負荷が増大した。
この問題に対処するひとつの方法は、トピックに応じてこれらの質問をクラスタ化することです。
本稿では,タグ付けデータセットの領域を探求し,コードの抜粋の同定と経験的結果の提供に焦点をあてる。
論文 参考訳(メタデータ) (2020-11-16T17:47:19Z) - Inquisitive Question Generation for High Level Text Comprehension [60.21497846332531]
InQUISITIVEは、文書を読みながら19K質問を抽出するデータセットである。
我々は,読者が情報を求めるための実践的な戦略に携わることを示す。
我々は, GPT-2に基づく質問生成モデルを評価し, 妥当な質問を生成することができることを示す。
論文 参考訳(メタデータ) (2020-10-04T19:03:39Z) - Video Captioning with Guidance of Multimodal Latent Topics [123.5255241103578]
我々は、データから教師なしの方法でマルチモーダルトピックをマイニングする統合キャプションフレームワークM&M TGMを提案する。
事前に定義されたトピックと比較して、マイニングされたマルチモーダルトピックはより意味的に、視覚的に一貫性がある。
MSR-VTTとYoutube2Textのデータセットを用いた大規模な実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2017-08-31T11:18:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。