論文の概要: Method Names in Jupyter Notebooks: An Exploratory Study
- arxiv url: http://arxiv.org/abs/2504.20330v1
- Date: Tue, 29 Apr 2025 00:38:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.705579
- Title: Method Names in Jupyter Notebooks: An Exploratory Study
- Title(参考訳): ジュピターノートにおけるメソッド名:探索的研究
- Authors: Carol Wong, Gunnar Larsen, Rocky Huang, Bonita Sharif, Anthony Peruma,
- Abstract要約: 384 Jupyter Notebook における 691 メソッドの命名方法の解析を行った。
本研究は,ノートのメソッド名の特徴を明らかにし,簡潔さの選好を含む特徴を明らかにした。
我々は,科学的コードにおける高品質な名前を評価・推奨するための専門的なツールや技術の開発に寄与する研究成果を思い起こさせる。
- 参考スコア(独自算出の注目度): 5.8097100720874355
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Method names play an important role in communicating the purpose and behavior of their functionality. Research has shown that high-quality names significantly improve code comprehension and the overall maintainability of software. However, these studies primarily focus on naming practices in traditional software development. There is limited research on naming patterns in Jupyter Notebooks, a popular environment for scientific computing and data analysis. In this exploratory study, we analyze the naming practices found in 691 methods across 384 Jupyter Notebooks, focusing on three key aspects: naming style conventions, grammatical composition, and the use of abbreviations and acronyms. Our findings reveal distinct characteristics of notebook method names, including a preference for conciseness and deviations from traditional naming patterns. We identified 68 unique grammatical patterns, with only 55.57% of methods beginning with a verb. Further analysis revealed that half of the methods with return statements do not start with a verb. We also found that 30.39% of method names contain abbreviations or acronyms, representing mathematical or statistical terms and image processing concepts, among others. We envision our findings contributing to developing specialized tools and techniques for evaluating and recommending high-quality names in scientific code and creating educational resources tailored to the notebook development community.
- Abstract(参考訳): メソッド名は、機能の目的と振舞いを伝える上で重要な役割を担います。
研究によると、高品質な名前はコードの理解とソフトウェアの全体的な保守性を著しく改善している。
しかしながら、これらの研究は主に従来のソフトウェア開発における命名プラクティスに焦点を当てている。
科学計算とデータ分析の一般的な環境であるJupyter Notebooksでは、命名パターンについて限定的な研究がなされている。
本研究では,384のJupyter Notebookにまたがる691のメソッドで見られる命名法について,命名スタイルの規則,文法的構成,略語と頭字語の使用の3つの重要な側面に着目して分析する。
本研究は,従来の命名パターンから簡潔さや逸脱を優先することを含む,ノートのメソッド名の特徴を明らかにした。
動詞から始まる手法の55.57%に過ぎなかった68の特異な文法パターンを同定した。
さらに分析したところ、返却文を持つメソッドの半数が動詞から始まっていないことがわかった。
また、30.39%のメソッド名は、数学的あるいは統計的用語や画像処理の概念を表す略語や頭字語が含まれていることも判明した。
本研究の成果は,学術コードにおける高品質な名称の評価・推奨,ノートブック開発コミュニティに適した教育資源の創出に寄与すると考えられる。
関連論文リスト
- Recognition of Geometrical Shapes by Dictionary Learning [49.30082271910632]
形状認識のための辞書学習を初めて行う方法を提案する。
基礎となる最適化手法の選択は、認識品質に大きな影響を及ぼす。
実験結果から,辞書学習は形状認識タスクの興味深い方法である可能性が確認された。
論文 参考訳(メタデータ) (2025-04-15T08:05:16Z) - A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文 参考訳(メタデータ) (2024-05-20T08:41:15Z) - Reproducing, Extending, and Analyzing Naming Experiments [0.23456696459191312]
開発者が名前を選択する方法に関する最近の調査では、異なる開発者が同じオブジェクトに対して与えた名前を収集している。
これにより、これらの名前の多様性と構造の研究が可能となり、名前の作り方に関するモデルの構築が可能となった。
我々はこの研究の様々な部分を3つの独立した実験で再現した。
論文 参考訳(メタデータ) (2024-02-15T15:39:54Z) - How are We Detecting Inconsistent Method Names? An Empirical Study from
Code Review Perspective [13.585460827586926]
メソッドの適切な命名は、プログラムコードを理解しやすくし、ソフトウェア保守性を高める。
メソッド名の不整合をチェックする自動ツールの開発に多くの研究努力が費やされている。
本研究では,最先端技術が一貫性と一貫性のないメソッド名の検出や推奨にどのように貢献するかを実証研究する。
論文 参考訳(メタデータ) (2023-08-24T10:39:18Z) - Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Author Name Disambiguation via Heterogeneous Network Embedding from
Structural and Semantic Perspectives [13.266320447769564]
名前の曖昧さは、複数の著者が同じ名前を持つなど、学術的なデジタル図書館で一般的である。
提案手法は主に異種ネットワークとクラスタリングのための表現学習に基づいている。
意味表現はNLPツールを使用して生成される。
論文 参考訳(メタデータ) (2022-12-24T11:22:34Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - Exploiting Method Names to Improve Code Summarization: A Deliberation
Multi-Task Learning Approach [5.577102440028882]
コード要約のための新しいマルチタスク学習(MTL)アプローチを設計する。
まず,メソッド名の生成と情報性予測のタスクを紹介する。
新たな2パス審議機構をmtlアーキテクチャに組み込んで、より一貫性のある中間状態を生成します。
論文 参考訳(メタデータ) (2021-03-21T17:52:21Z) - Accelerating Text Mining Using Domain-Specific Stop Word Lists [57.76576681191192]
本稿では,超平面的アプローチと呼ばれるドメイン固有語の自動抽出手法を提案する。
ハイパープレーンベースのアプローチは、無関係な特徴を排除することによって、テキストの寸法を著しく削減することができる。
その結果,超平面型アプローチはコーパスの寸法を90%削減し,相互情報より優れることがわかった。
論文 参考訳(メタデータ) (2020-11-18T17:42:32Z) - How Does That Sound? Multi-Language SpokenName2Vec Algorithm Using
Speech Generation and Deep Learning [4.769747792846004]
SpokenName2Vecは、同様の名前提案問題に対処する、新しくて汎用的なアプローチである。
提案手法は25万のフォアネームからなる大規模データセット上で実証された。
提案手法の性能は,本研究で評価した他の10種類のアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-24T20:39:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。