論文の概要: Conversational Pattern Mining using Motif Detection
- arxiv url: http://arxiv.org/abs/2211.06846v1
- Date: Sun, 13 Nov 2022 08:30:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 17:31:50.458834
- Title: Conversational Pattern Mining using Motif Detection
- Title(参考訳): モチーフ検出を用いた会話パターンマイニング
- Authors: Nicolle Garber, Vukosi Marivate
- Abstract要約: 我々は,会話パターンマイニング技術を開発するために,教師なしの手法を用いている。
本研究では,これを自然言語処理の分野に適用し,モチーフ検出アルゴリズムを拡張した。
このアルゴリズムを実世界の動的データセットに適用するために,我々はオープンソースフィルムスクリプトデータソースからモチーフを抽出する。
- 参考スコア(独自算出の注目度): 1.9686054517684888
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The subject of conversational mining has become of great interest recently
due to the explosion of social and other online media. Supplementing this
explosion of text is the advancement in pre-trained language models which have
helped us to leverage these sources of information. An interesting domain to
analyse is conversations in terms of complexity and value. Complexity arises
due to the fact that a conversation can be asynchronous and can involve
multiple parties. It is also computationally intensive to process. We use
unsupervised methods in our work in order to develop a conversational pattern
mining technique which does not require time consuming, knowledge demanding and
resource intensive labelling exercises. The task of identifying repeating
patterns in sequences is well researched in the Bioinformatics field. In our
work, we adapt this to the field of Natural Language Processing and make
several extensions to a motif detection algorithm. In order to demonstrate the
application of the algorithm on a dynamic, real world data set; we extract
motifs from an open-source film script data source. We run an exploratory
investigation into the types of motifs we are able to mine.
- Abstract(参考訳): 近年,ソーシャルメディアやオンラインメディアの爆発により,会話的マイニングの話題が注目されている。
このテキストの爆発を補うことは、これらの情報ソースを活用するのに役立った、事前学習された言語モデルの進歩です。
分析する興味深い領域は、複雑性と価値の観点から会話である。
複雑性は、会話が非同期で複数の相手を巻き込むことができるという事実によって生じる。
また、計算処理にも集中している。
我々は,時間消費や知識要求,資源集約的なラベル付けを必要としない対話型パターンマイニング手法を開発するために,教師なしの手法を用いた。
配列の繰り返しパターンを識別するタスクは、バイオインフォマティクスの分野でよく研究されている。
本研究では,これを自然言語処理の分野に適用し,モチーフ検出アルゴリズムの拡張を行った。
動的,実世界のデータセットへのアルゴリズムの適用を実証するために,オープンソースのフィルムスクリプトデータソースからモチーフを抽出する。
私たちは、採掘できるモチーフの種類を探索的に調査しています。
関連論文リスト
- generAItor: Tree-in-the-Loop Text Generation for Language Model
Explainability and Adaptation [28.715001906405362]
大規模言語モデル(LLM)は、自動補完、補助的な書き込み、チャットベースのテキスト生成など、様々な下流タスクに広くデプロイされている。
本稿では,ビーム探索ツリーの視覚的表現を解析,説明,適応する中心的な要素とする,ループ内ツリーのアプローチを提案することで,この欠点に対処する。
視覚解析技術であるGenerAItorを,タスク固有のウィジェットで中央ビーム探索木を拡大し,ターゲットとした可視化とインタラクションの可能性を提供する。
論文 参考訳(メタデータ) (2024-03-12T13:09:15Z) - Enhancing Retrieval-Augmented Large Language Models with Iterative
Retrieval-Generation Synergy [164.83371924650294]
検索と生成を反復的に同期させるIter-RetGenと呼ばれる手法により,高い性能が得られることを示す。
モデル出力は、タスクを完了するために必要なものを示し、より関連する知識を取得するための情報的コンテキストを提供する。
Iter-RetGenプロセスは、すべての知識を全体として取得し、構造的な制約なしに生成時の柔軟性をほとんど保持します。
論文 参考訳(メタデータ) (2023-05-24T16:17:36Z) - Momentum Decoding: Open-ended Text Generation As Graph Exploration [49.812280360794894]
自動回帰言語モデル(LM)を用いたオープンエンドテキスト生成は、自然言語処理における中核的なタスクの1つである。
我々は、新しい視点から、すなわち、有向グラフ内の探索プロセスとして、オープンエンドテキスト生成を定式化する。
本稿では,新しい復号法であるtextitmomentum decodingを提案する。
論文 参考訳(メタデータ) (2022-12-05T11:16:47Z) - ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational
Finance Question Answering [70.6359636116848]
本稿では,対話型質問応答における数値推論の連鎖を研究するために,新しい大規模データセットConvFinQAを提案する。
我々のデータセットは、現実世界の会話において、長距離で複雑な数値推論パスをモデル化する上で大きな課題となる。
論文 参考訳(メタデータ) (2022-10-07T23:48:50Z) - Keyword Extraction for Improved Document Retrieval in Conversational
Search [10.798537120200006]
混合開始型会話検索は大きな利点をもたらす。
会話からユーザーが提供する追加情報を取り入れることには、いくつかの課題がある。
我々は2つの対話型キーワード抽出データセットを収集し、それらを組み込んだエンドツーエンドの文書検索パイプラインを提案する。
論文 参考訳(メタデータ) (2021-09-13T13:55:37Z) - Latin writing styles analysis with Machine Learning: New approach to old
questions [0.0]
中世のテキストは、世代から世代までのコミュニケーション手段を用いて、心から学び、普及した。
ラテン語で書かれた文学の特定の構成を考慮に入れれば、特定の物語テキストの親しみやすい情報源の確率パターンを探索し、示すことができる。
論文 参考訳(メタデータ) (2021-09-01T20:21:45Z) - Generative Conversational Networks [67.13144697969501]
本稿では,対話エージェントが独自のラベル付き学習データを生成することを学習する,生成会話ネットワーク(Generative Conversational Networks)というフレームワークを提案する。
そこで本研究では,シードデータから学習したベースラインモデルに対して,意図検出が平均35%,スロットタグが平均21%向上したことを示す。
論文 参考訳(メタデータ) (2021-06-15T23:19:37Z) - Text Mining for Processing Interview Data in Computational Social
Science [0.6820436130599382]
我々は、市販のテキスト分析技術を用いて、計算社会科学研究からのインタビューテキストデータを処理する。
局所的クラスタリングと用語的エンリッチメントが,応答の探索と定量化に有用であることがわかった。
我々は社会科学の研究にテキスト分析を使うことを奨励し、特に探索的オープンエンドな研究に力を入れている。
論文 参考訳(メタデータ) (2020-11-28T00:44:35Z) - Pretrained Language Models for Dialogue Generation with Multiple Input
Sources [101.17537614998805]
本研究では,事前学習した言語モデルGPT2から適応した複数の入力源を持つ対話モデルについて検討する。
異なるソースに対応する複数の異なる注意情報を融合する様々な手法を探索する。
実験結果から, 核融合法は単純な核融合ベースラインよりも, 対話履歴との関連性が高いことがわかった。
論文 参考訳(メタデータ) (2020-10-15T07:53:28Z) - Positioning yourself in the maze of Neural Text Generation: A
Task-Agnostic Survey [54.34370423151014]
本稿では, ストーリーテリング, 要約, 翻訳など, 世代ごとのタスクインパクトをリレーする手法の構成要素について検討する。
本稿では,学習パラダイム,事前学習,モデリングアプローチ,復号化,各分野における重要な課題について,命令的手法の抽象化を提案する。
論文 参考訳(メタデータ) (2020-10-14T17:54:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。