論文の概要: Picking Pearl From Seabed: Extracting Artefacts from Noisy Issue
Triaging Collaborative Conversations for Hybrid Cloud Services
- arxiv url: http://arxiv.org/abs/2105.15065v1
- Date: Mon, 31 May 2021 15:51:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-01 17:48:03.134288
- Title: Picking Pearl From Seabed: Extracting Artefacts from Noisy Issue
Triaging Collaborative Conversations for Hybrid Cloud Services
- Title(参考訳): 海底から真珠を摘む - ハイブリッドクラウドサービスのためのノイズの多いトリアーティファクトからのアーティファクト抽出
- Authors: Amar Prakash Azad, Supriyo Ghosh, Ajay Gupta, Harshit Kumar and
Prateeti Mohapatra
- Abstract要約: 本稿では,最小ラベル付きデータを用いたノイズの多い会話から成果物を抽出する手法を提案する。
人間の介入を最小限に抑えた教師なしモデルと教師なしモデルの組み合わせを提案する。
- 参考スコア(独自算出の注目度): 5.5665438607715165
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Site Reliability Engineers (SREs) play a key role in issue identification and
resolution. After an issue is reported, SREs come together in a virtual room
(collaboration platform) to triage the issue. While doing so, they leave behind
a wealth of information which can be used later for triaging similar issues.
However, usability of the conversations offer challenges due to them being i)
noisy and ii) unlabelled. This paper presents a novel approach for issue
artefact extraction from the noisy conversations with minimal labelled data. We
propose a combination of unsupervised and supervised model with minimum human
intervention that leverages domain knowledge to predict artefacts for a small
amount of conversation data and use that for fine-tuning an already pretrained
language model for artefact prediction on a large amount of conversation data.
Experimental results on our dataset show that the proposed ensemble of
unsupervised and supervised model is better than using either one of them
individually.
- Abstract(参考訳): サイトの信頼性エンジニア(SRE)は、問題の識別と解決において重要な役割を果たす。
問題が報告された後、SREは仮想ルーム(コラボレーションプラットフォーム)に集まり、問題をトリガします。
そうしている間に、同様の問題をトリアージするために後で使用できる豊富な情報を残します。
しかし、会話のユーザビリティは、i)うるさい、ii)ラベルなしであるため、課題となる。
本稿では,最小ラベル付きデータを用いたノイズの多い会話から課題成果を抽出する手法を提案する。
本稿では,最小限の介入による教師なしと教師なしのモデルの組み合わせを提案し,ドメイン知識を利用して少量の会話データに対するアーティファクトを予測し,すでに訓練済みの言語モデルを用いて大量の会話データに基づくアーティファクト予測を行う。
実験結果から,教師なしモデルと教師なしモデルのアンサンブルは,それぞれが個別に使用するよりも優れていることがわかった。
関連論文リスト
- How to Enhance Causal Discrimination of Utterances: A Case on Affective
Reasoning [22.11437627661179]
本稿では,会話プロセスにテクスティ.i.d.ノイズ項を組み込むことにより,構造因果モデル(SCM)を構築することを提案する。
ディープラーニングの実装を容易にするため,非構造化会話データを扱うためのcognフレームワークを導入し,非可観測ノイズを学習可能な「単純な原因」とみなすオートエンコーダアーキテクチャを採用した。
論文 参考訳(メタデータ) (2023-05-04T07:45:49Z) - ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational
Finance Question Answering [70.6359636116848]
本稿では,対話型質問応答における数値推論の連鎖を研究するために,新しい大規模データセットConvFinQAを提案する。
我々のデータセットは、現実世界の会話において、長距離で複雑な数値推論パスをモデル化する上で大きな課題となる。
論文 参考訳(メタデータ) (2022-10-07T23:48:50Z) - Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。
また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。
NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文 参考訳(メタデータ) (2022-04-27T04:24:35Z) - TANet: Thread-Aware Pretraining for Abstractive Conversational
Summarization [27.185068253347257]
我々はRedditコミュニティの複数人による議論に基づいて,RCSと呼ばれる大規模(11M)事前学習データセットを構築した。
次に、スレッド対応のTransformerベースのネットワークであるTANetを紹介する。
会話を文の列として扱う既存の事前学習モデルとは異なり、本質的な文脈依存は会話全体を理解する上で重要な役割を担っていると論じる。
論文 参考訳(メタデータ) (2022-04-09T16:08:46Z) - Findings on Conversation Disentanglement [28.874162427052905]
発話から発話への分類と発話からスレッドへの分類を学習する学習モデルを構築した。
Ubuntu IRCデータセットの実験は、このアプローチが従来の欲求的アプローチを上回る可能性があることを示している。
論文 参考訳(メタデータ) (2021-12-10T05:54:48Z) - Smoothing Dialogue States for Open Conversational Machine Reading [70.83783364292438]
本稿では,2つの対話状態を1つのデコーダとブリッジ決定と質問生成でスムーズにすることで,効果的なゲーティング戦略を提案する。
OR-ShARCデータセットを用いた実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2021-08-28T08:04:28Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Exploiting Unsupervised Data for Emotion Recognition in Conversations [76.01690906995286]
会話における感情認識(Emotion Recognition in Conversations:ERC)は、会話における話者の感情状態を予測することを目的としている。
ERCタスクの教師付きデータは限られている。
教師なし会話データを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-02T13:28:47Z) - Improving Multi-Turn Response Selection Models with Complementary
Last-Utterance Selection by Instance Weighting [84.9716460244444]
我々は、データリソース自体の根底にある相関を利用して、異なる種類の監視信号を導出することを検討する。
2つの公開データセットで広範な実験を行い、両方のデータセットで大幅に改善した。
論文 参考訳(メタデータ) (2020-02-18T06:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。