論文の概要: Reproducing, Extending, and Analyzing Naming Experiments
- arxiv url: http://arxiv.org/abs/2402.10022v1
- Date: Thu, 15 Feb 2024 15:39:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-16 15:12:39.443338
- Title: Reproducing, Extending, and Analyzing Naming Experiments
- Title(参考訳): 命名実験の再現、拡張、分析
- Authors: Rachel Alpern, Ido Lazer, Issar Tzachor, Hanit Hakim, Sapir Weissbuch,
and Dror G. Feitelson
- Abstract要約: 開発者が名前を選択する方法に関する最近の調査では、異なる開発者が同じオブジェクトに対して与えた名前を収集している。
これにより、これらの名前の多様性と構造の研究が可能となり、名前の作り方に関するモデルの構築が可能となった。
我々はこの研究の様々な部分を3つの独立した実験で再現した。
- 参考スコア(独自算出の注目度): 0.23456696459191312
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Naming is very important in software development, as names are often the only
vehicle of meaning about what the code is intended to do. A recent study on how
developers choose names collected the names given by different developers for
the same objects. This enabled a study of these names' diversity and structure,
and the construction of a model of how names are created. We reproduce
different parts of this study in three independent experiments. Importantly, we
employ methodological variations rather than striving of an exact replication.
When the same results are obtained this then boosts our confidence in their
validity by demonstrating that they do not depend on the methodology.
Our results indeed corroborate those of the original study in terms of the
diversity of names, the low probability of two developers choosing the same
name, and the finding that experienced developers tend to use slightly longer
names than inexperienced students. We explain name diversity by performing a
new analysis of the names, classifying the concepts represented in them as
universal (agreed upon), alternative (reflecting divergent views on a topic),
or optional (reflecting divergent opinions on whether to include this concept
at all). This classification enables new research directions concerning the
considerations involved in naming decisions. We also show that explicitly using
the model proposed in the original study to guide naming leads to the creation
of better names, whereas the simpler approach of just asking participants to
use longer and more detailed names does not.
- Abstract(参考訳): 命名はソフトウェア開発において非常に重要であり、しばしばコードが何を意図しているのかを示す唯一の手段である。
開発者が同じオブジェクトに対して異なる開発者から与えられた名前の収集方法に関する最近の研究。
これにより、これらの名前の多様性と構造の研究と、名前の作り方に関するモデルの構築が可能になった。
この研究の様々な部分を3つの独立した実験で再現する。
重要なことは、正確な複製の試行よりも、方法論的なバリエーションを採用することである。
同じ結果が得られると、方法論に依存しないことを示すことによって、妥当性に対する信頼が高まる。
本研究の結果は,名称の多様性,2人の開発者が同じ名前を選ぶ確率の低さ,経験者の方が経験者よりもやや長い名前を使う傾向が示唆された。
名前の新しい分析を行い、それらに表される概念を普遍的(認識される)、代替(話題に関する異論的な見解を反映する)、または任意(この概念を全く含めるべきかについての異論を反映する)に分類し、名前の多様性を説明する。
この分類は命名決定にかかわる考察に関する新たな研究の方向性を可能にする。
また,本研究で提案するモデルを用いて命名の指導を行うことで,名称の明確化が促進されるのに対し,参加者に対してより長く詳細な名称の使用を求めるという単純なアプローチは不可能であることを示した。
関連論文リスト
- Renovating Names in Open-Vocabulary Segmentation Benchmarks [31.243790558954288]
オープン語彙セグメンテーションベンチマーク(RENOVATE)における「改称」のためのフレームワークを提案する。
我々のフレームワークは、視覚セグメントごとに名前の質を高めるリネームモデルを備えている。
改良された名称は、最大15%の相対的な改善で、より強力なオープン語彙モデルをトレーニングするのに役立ちます。
論文 参考訳(メタデータ) (2024-03-14T17:35:32Z) - Multicultural Name Recognition For Previously Unseen Names [65.268245109828]
本論文は、人名の認識を改善することを目的としており、それは、誰かが生まれたり、名前を変えたりする際にも、成長できる多様なカテゴリーである。
私は103か国の名前を見て、モデルが異なる文化の名前でどれだけうまく機能するかを比較します。
文字入力と単語入力を組み合わせたモデルの方が単語のみのモデルより優れており,従来のNERモデルと比較して精度が向上する可能性がある。
論文 参考訳(メタデータ) (2024-01-23T17:58:38Z) - The Impact of Familiarity on Naming Variation: A Study on Object Naming
in Mandarin Chinese [4.6112416098164255]
中国語の言語とビジョンのデータセットを作成し、1319の自然主義的な画像に平均20の名前を付ける。
本研究では,対象物に対する親しみ度が,対象物間で引き起こされる命名変化の程度にどの程度関係しているかを検討する。
論文 参考訳(メタデータ) (2023-11-16T20:13:24Z) - RefBERT: A Two-Stage Pre-trained Framework for Automatic Rename
Refactoring [57.8069006460087]
本研究では,他のリネーム活動よりも難易度の高い変数名の自動改名について検討する。
変数名に対する名前変更のための2段階事前訓練フレームワークであるRefBERTを提案する。
RefBERTの変数名は既存の手法よりも正確で有意義であることを示す。
論文 参考訳(メタデータ) (2023-05-28T12:29:39Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Author Name Disambiguation via Heterogeneous Network Embedding from
Structural and Semantic Perspectives [13.266320447769564]
名前の曖昧さは、複数の著者が同じ名前を持つなど、学術的なデジタル図書館で一般的である。
提案手法は主に異種ネットワークとクラスタリングのための表現学習に基づいている。
意味表現はNLPツールを使用して生成される。
論文 参考訳(メタデータ) (2022-12-24T11:22:34Z) - VarCLR: Variable Semantic Representation Pre-training via Contrastive
Learning [84.70916463298109]
VarCLRは変数名のセマンティック表現を学ぶための新しいアプローチである。
VarCLRはコントラスト学習に適しており、明示的に類似した入力間の距離を最小化することを目的としている。
VarCLRはBERTのような洗練された汎用言語モデルを効果的に適用できることを示す。
論文 参考訳(メタデータ) (2021-12-05T18:40:32Z) - Novel Aficionados and Doppelg\"angers: a referential task for semantic
representations of individual entities [0.0]
固有名詞と共通名詞の意味的区別は,それらの言語分布に反映されることを示す。
結果は、異なる個々の実体の分布表現は、共通の名詞のそれらよりも明確に区別できないことを示している。
論文 参考訳(メタデータ) (2021-04-20T22:24:19Z) - SynSetExpan: An Iterative Framework for Joint Entity Set Expansion and
Synonym Discovery [66.24624547470175]
SynSetExpanは2つのタスクを相互に拡張できる新しいフレームワークである。
クラウドソーシングによる最初の大規模Synonym-Enhanced Set Expansionデータセットを作成する。
SE2データセットと以前のベンチマークの実験では、エンティティセットの拡張と同義語発見タスクの両方においてSynSetExpanの有効性が示されている。
論文 参考訳(メタデータ) (2020-09-29T07:32:17Z) - How Does That Sound? Multi-Language SpokenName2Vec Algorithm Using
Speech Generation and Deep Learning [4.769747792846004]
SpokenName2Vecは、同様の名前提案問題に対処する、新しくて汎用的なアプローチである。
提案手法は25万のフォアネームからなる大規模データセット上で実証された。
提案手法の性能は,本研究で評価した他の10種類のアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-24T20:39:00Z) - Interpretability Analysis for Named Entity Recognition to Understand
System Predictions and How They Can Improve [49.878051587667244]
名前付きエンティティ認識のためのLSTM-CRFアーキテクチャの性能について検討する。
文脈表現はシステムの性能に寄与するが、ハイパフォーマンスを駆動する主な要因は、名前トークン自体を学習することにある。
我々は、コンテキストのみからエンティティタイプを推測する可能性を評価するために、人間アノテーションを登録し、コンテキストのみのシステムによるエラーの大部分に対してエンティティタイプを推論することはできないが、改善の余地はいくつかある。
論文 参考訳(メタデータ) (2020-04-09T14:37:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。