論文の概要: Term Interrelations and Trends in Software Engineering
- arxiv url: http://arxiv.org/abs/2108.09529v1
- Date: Sat, 21 Aug 2021 15:35:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 15:20:26.653934
- Title: Term Interrelations and Trends in Software Engineering
- Title(参考訳): ソフトウェア工学における用語相互関係と動向
- Authors: Janusan Baskararajah and Lei Zhang and Andriy Miranskyy
- Abstract要約: 単語埋め込み技術を用いてプロトタイピングツールを構築する。
我々は、SE Body of Knowledgeハンドブックと15,233の研究論文のタイトルと要約の埋め込みを訓練する。
埋め込みは,単語を要約し,知識ベースにおける傾向を明らかにする上で有効であることを示す。
- 参考スコア(独自算出の注目度): 7.247039414157251
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Software Engineering (SE) community is prolific, making it challenging
for experts to keep up with the flood of new papers and for neophytes to enter
the field. Therefore, we posit that the community may benefit from a tool
extracting terms and their interrelations from the SE community's text corpus
and showing terms' trends. In this paper, we build a prototyping tool using the
word embedding technique. We train the embeddings on the SE Body of Knowledge
handbook and 15,233 research papers' titles and abstracts. We also create test
cases necessary for validation of the training of the embeddings. We provide
representative examples showing that the embeddings may aid in summarizing
terms and uncovering trends in the knowledge base.
- Abstract(参考訳): ソフトウェアエンジニアリング(se)コミュニティは多作であり、専門家が新しい論文の洪水に追随し、新生物がこの分野に参入することを困難にしている。
そこで我々は,SEコミュニティのテキストコーパスから用語とその相互関係を抽出し,用語の傾向を示すツールの恩恵を受けることができると考えている。
本稿では,単語埋め込み技術を用いたプロトタイピングツールを構築する。
我々は、SE Body of Knowledgeハンドブックと15,233の研究論文のタイトルと要約の埋め込みを訓練する。
また、組み込みのトレーニングの検証に必要なテストケースを作成します。
本稿では,埋め込みが用語の要約や知識ベースの動向を明らかにするのに役立つことを示す代表的な例を示す。
関連論文リスト
- SyROCCo: Enhancing Systematic Reviews using Machine Learning [6.805429133535976]
本稿では,システムレビュープロセスのナビゲートを支援する機械学習技術について検討する。
データ抽出やエビデンスマッピングといったレビューのその後の段階へのML技術の適用は、その初期段階にある。
論文 参考訳(メタデータ) (2024-06-24T11:04:43Z) - Tool Learning with Large Language Models: A Survey [60.733557487886635]
大規模言語モデル(LLM)を用いたツール学習は,高度に複雑な問題に対処するLLMの能力を強化するための,有望なパラダイムとして登場した。
この分野での注目と急速な進歩にもかかわらず、現存する文献は断片化され、体系的な組織が欠如している。
論文 参考訳(メタデータ) (2024-05-28T08:01:26Z) - Improving Retrieval in Theme-specific Applications using a Corpus
Topical Taxonomy [52.426623750562335]
ToTER (Topical Taxonomy Enhanced Retrieval) フレームワークを紹介する。
ToTERは、クエリとドキュメントの中心的なトピックを分類学のガイダンスで識別し、そのトピックの関連性を利用して、欠落したコンテキストを補う。
プラグイン・アンド・プレイのフレームワークとして、ToTERは様々なPLMベースのレトリバーを強化するために柔軟に使用できる。
論文 参考訳(メタデータ) (2024-03-07T02:34:54Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Semantic Similarity Measure of Natural Language Text through Machine
Learning and a Keyword-Aware Cross-Encoder-Ranking Summarizer -- A Case Study
Using UCGIS GIS&T Body of Knowledge [2.4909170697740968]
GIS&T Body of Knowledge (BoK)は、地理空間的トピックを定義し、開発し、文書化するためのコミュニティ主導の取り組みである。
本研究は,テキストから意味を抽出する上で,複数自然言語処理(NLP)技術の有効性を評価する。
また、科学出版物を分析するための機械学習技術の使用について、新たな視点を提供する。
論文 参考訳(メタデータ) (2023-05-17T01:17:57Z) - LLM-based Interaction for Content Generation: A Case Study on the
Perception of Employees in an IT department [85.1523466539595]
本稿では,IT企業の従業員が生成ツールを使用する意図を明らかにするためのアンケート調査を行う。
以上の結果から, 生成ツールの比較的平均的な受容性が示唆されるが, ツールが有用であると認識されるほど, 意図が高くなることが示唆された。
分析の結果, 生産ツールの利用頻度は, 従業員が作業の文脈でこれらのツールをどのように認識しているかを理解する上で重要な要因である可能性が示唆された。
論文 参考訳(メタデータ) (2023-04-18T15:35:43Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - Semantic and Relational Spaces in Science of Science: Deep Learning
Models for Article Vectorisation [4.178929174617172]
我々は、自然言語処理(NLP)とグラフニューラルネットワーク(GNN)を用いて、記事の意味的・関係的な側面に基づく文書レベルの埋め込みに焦点を当てる。
論文のセマンティックな空間をNLPでエンコードできるのに対し、GNNでは研究コミュニティの社会的実践をエンコードするリレーショナルな空間を構築することができる。
論文 参考訳(メタデータ) (2020-11-05T14:57:41Z) - XREF: Entity Linking for Chinese News Comments with Supplementary
Article Reference [19.811371589597382]
本研究では,中国のニュースコメントに対するエンティティリンクの問題点について考察する。
本稿では、注意機構を利用して関連するコンテキストをピンポイントする新しいモデルXREFを提案する。
大規模未ラベルコーパスを利用した弱教師付きトレーニング手法を開発した。
論文 参考訳(メタデータ) (2020-06-24T19:42:54Z) - A Corpus Study and Annotation Schema for Named Entity Recognition and
Relation Extraction of Business Products [68.26059718611914]
製品エンティティのアノテーションと企業-製品関係の言及のためのコーパススタディ、アノテーションスキーマおよび関連ガイドラインを提示する。
積の言及はしばしば名詞句として認識されるが、境界の曖昧さのため、その正確な範囲を定義することは困難である。
提案ガイドラインに準じて,英文Webおよびソーシャルメディア文書の事前コーパスを提示する。
論文 参考訳(メタデータ) (2020-04-07T11:45:22Z) - Distributional semantic modeling: a revised technique to train term/word
vector space models applying the ontology-related approach [36.248702416150124]
ニューラルネットワークを用いた分散項表現(あるいは項埋め込み)学習による分布意味モデリングのための新しい手法を設計する。
Vec2graphは、動的かつインタラクティブなグラフとして単語埋め込み(私たちの場合の長期埋め込み)を視覚化するためのPythonライブラリである。
論文 参考訳(メタデータ) (2020-03-06T18:27:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。