論文の概要: Expert-sourcing Domain-specific Knowledge: The Case of Synonym
Validation
- arxiv url: http://arxiv.org/abs/2309.16798v1
- Date: Thu, 28 Sep 2023 19:02:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 05:37:38.842860
- Title: Expert-sourcing Domain-specific Knowledge: The Case of Synonym
Validation
- Title(参考訳): エキスパートソーシング・ドメイン固有知識:同義語検証の場合
- Authors: Michael Unterkalmsteiner, Andrew Yates
- Abstract要約: 私たちは、専門家からドメイン固有の知識をソースとして採用し、拡張したツールサポートを説明します。
我々は、専門家にラベル付けタスクの実行に時間を割くよう動機付けることを目的とした、設計上の決定に関する洞察を提供する。
我々は、エキスパートソーシングのアプローチが、ソフトウェア工学におけるあらゆるデータラベリングタスクに適用可能であることを予測している。
- 参考スコア(独自算出の注目度): 14.51095331294056
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: One prerequisite for supervised machine learning is high quality labelled
data. Acquiring such data is, particularly if expert knowledge is required,
costly or even impossible if the task needs to be performed by a single expert.
In this paper, we illustrate tool support that we adopted and extended to
source domain-specific knowledge from experts. We provide insight in design
decisions that aim at motivating experts to dedicate their time at performing
the labelling task. We are currently using the approach to identify true
synonyms from a list of candidate synonyms. The identification of synonyms is
important in scenarios were stakeholders from different companies and
background need to collaborate, for example when defining and negotiating
requirements. We foresee that the approach of expert-sourcing is applicable to
any data labelling task in software engineering. The discussed design decisions
and implementation are an initial draft that can be extended, refined and
validated with further application.
- Abstract(参考訳): 教師付き機械学習の前提条件のひとつは、高品質なラベル付きデータである。
このようなデータを取得することは、特に専門家の知識が必要な場合、ひとつの専門家がタスクを実行する必要がある場合、コストがかかるか不可能である。
本稿では、専門家のドメイン固有の知識をソースとして採用・拡張したツールサポートについて述べる。
我々は、専門家にラベル付けタスクの実行に時間を割く動機付けを目的とした設計決定に関する洞察を提供する。
私たちは現在、候補同義語のリストから真の同義語を識別するためにこのアプローチを使用しています。
同義語の識別は、要件を定義し交渉する場合など、異なる企業やバックグラウンドの利害関係者が協力する必要があるシナリオにおいて重要である。
我々は、エキスパートソーシングのアプローチは、ソフトウェアエンジニアリングにおけるあらゆるデータラベル付けタスクに適用できると予測する。
議論された設計決定と実装は、拡張し、洗練し、さらなるアプリケーションで検証できる初期ドラフトである。
関連論文リスト
- GEMS: Generative Expert Metric System through Iterative Prompt Priming [18.0413505095456]
非専門家は、効果的な測度を作成したり、理論を文脈特異的なメトリクスに変換するのが直感的ではないと考えることができる。
この技術的レポートは、大規模ソフトウェア企業内のソフトウェアコミュニティを調べることで、この問題に対処する。
本稿では,ニューラルアクティビティにインスパイアされたプロンプトエンジニアリングフレームワークを提案し,生成モデルが理論を抽出し,要約できることを実証する。
論文 参考訳(メタデータ) (2024-10-01T17:14:54Z) - Leveraging Open Knowledge for Advancing Task Expertise in Large Language Models [36.172093066234794]
オープンな知識を持つ大規模言語モデルのタスク専門性を向上させるために,人手によるサンプル(Kショット)を少数導入する。
複数の専門家の間で個別のyet-complementaryな知識を最大限に活用するために、Mixix-of-expert (MoE)システムを構築している。
論文 参考訳(メタデータ) (2024-08-28T16:28:07Z) - Causal Discovery with Language Models as Imperfect Experts [119.22928856942292]
専門知識を用いて因果グラフの同定を改善する方法について検討する。
整合性に基づく専門家の知識を改良するための戦略を提案する。
本稿では,不完全な専門家として大規模言語モデルを用いる実データを用いたケーススタディについて報告する。
論文 参考訳(メタデータ) (2023-07-05T16:01:38Z) - Toward a traceable, explainable, and fairJD/Resume recommendation system [10.820022470618234]
自動採用システムの開発は今でも大きな課題の1つだ。
我々の目的は、JD/Resumeマッチングプロセスを強化するために、現代言語モデルと知識ベースとデータセットを組み合わせる方法を探ることである。
論文 参考訳(メタデータ) (2022-02-02T18:17:05Z) - Extracting Semantics from Maintenance Records [0.2578242050187029]
保守記録から名前付きエンティティ認識を抽出する3つの手法を開発した。
我々は、構文規則と意味に基づくアプローチと、事前学習された言語モデルを活用するアプローチを開発する。
実世界の航空整備記録データを用いた評価の結果,有望な結果が得られた。
論文 参考訳(メタデータ) (2021-08-11T21:23:10Z) - KnowPrompt: Knowledge-aware Prompt-tuning with Synergistic Optimization
for Relation Extraction [111.74812895391672]
シナジスティック最適化(KnowPrompt)を用いた知識認識型Promptチューニング手法を提案する。
関係ラベルに含まれる潜在知識をインジェクトして,学習可能な仮想型語と解答語で構築する。
論文 参考訳(メタデータ) (2021-04-15T17:57:43Z) - Streaming Self-Training via Domain-Agnostic Unlabeled Images [62.57647373581592]
視覚認識モデル学習の過程を民主化することを目的としたストリーミング自己学習(SST)を提案する。
SSTの鍵となるのは、(1)ドメインに依存しない未ラベル画像により、追加の知識や監督なしにいくつかのラベル付き例でより良いモデルを学ぶことができ、(2)学習は継続的なプロセスであり、学習更新のスケジュールを構築することで行うことができる。
論文 参考訳(メタデータ) (2021-04-07T17:58:39Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z) - Reasoning over Vision and Language: Exploring the Benefits of
Supplemental Knowledge [59.87823082513752]
本稿では,汎用知識基盤(KB)から視覚言語変換器への知識の注入について検討する。
我々は複数のタスクやベンチマークに対する様々なkbの関連性を実証的に研究する。
この技術はモデルに依存しず、最小限の計算オーバーヘッドで任意の視覚言語変換器の適用可能性を拡張することができる。
論文 参考訳(メタデータ) (2021-01-15T08:37:55Z) - Expertise Style Transfer: A New Task Towards Better Communication
between Experts and Laymen [88.30492014778943]
そこで我々は,手動で注釈付きデータセットを手動で提供し,専門的なスタイルの転送を行う新しいタスクを提案する。
このタスクの解決は、プロの言語を単純化するだけでなく、レイメンの記述の正確さと専門性の向上にも寄与する。
スタイル転送とテキスト単純化のための5つの最先端モデルのベンチマーク性能を確立する。
論文 参考訳(メタデータ) (2020-05-02T04:50:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。