論文の概要: WildClaims: Information Access Conversations in the Wild(Chat)
- arxiv url: http://arxiv.org/abs/2509.17442v1
- Date: Mon, 22 Sep 2025 07:32:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 14:36:18.895118
- Title: WildClaims: Information Access Conversations in the Wild(Chat)
- Title(参考訳): WildClaims: 野生における情報アクセスに関する会話(チャット)
- Authors: Hideaki Joko, Shakiba Amirshahi, Charles L. A. Clarke, Faegheh Hasibi,
- Abstract要約: ユーザによる情報へのアクセスは,システムによってなされる,チェック価値のある事実の主張として暗黙的に発生する。
3000のWildChat会話で7,587発の発話から121,905件の事実主張を抽出した新しいリソースであるWildClaimsデータセットをリリースする。
本資料の予備的分析から,18%~51%の会話がチェック価値のあるアサーションを含むことが明らかとなった。
- 参考スコア(独自算出の注目度): 16.147482837466132
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid advancement of Large Language Models (LLMs) has transformed conversational systems into practical tools used by millions. However, the nature and necessity of information retrieval in real-world conversations remain largely unexplored, as research has focused predominantly on traditional, explicit information access conversations. The central question is: What do real-world information access conversations look like? To this end, we first conduct an observational study on the WildChat dataset, large-scale user-ChatGPT conversations, finding that users' access to information occurs implicitly as check-worthy factual assertions made by the system, even when the conversation's primary intent is non-informational, such as creative writing. To enable the systematic study of this phenomenon, we release the WildClaims dataset, a novel resource consisting of 121,905 extracted factual claims from 7,587 utterances in 3,000 WildChat conversations, each annotated for check-worthiness. Our preliminary analysis of this resource reveals that conservatively 18% to 51% of conversations contain check-worthy assertions, depending on the methods employed, and less conservatively, as many as 76% may contain such assertions. This high prevalence underscores the importance of moving beyond the traditional understanding of explicit information access, to address the implicit information access that arises in real-world user-system conversations.
- Abstract(参考訳): LLM(Large Language Models)の急速な進歩により、対話システムは数百万人が使う実用的なツールへと変化した。
しかしながら、現実世界の会話における情報検索の性質と必要性は、従来の明示的な情報アクセス会話に主に焦点を絞っているため、未解明のままである。
質問の中心は: 現実世界の情報アクセスの会話はどんなものか?
そこで我々はまず,WildChatデータセット,大規模ユーザ-ChatGPT会話の観察的研究を行い,ユーザの情報へのアクセスは,会話の主目的が創造的記述のような情報的ではない場合でも,システムによってなされる価値のある事実的主張として暗黙的に発生することを発見した。
この現象を体系的に研究するために、3000のWildChat会話で7,587発の発話から121,905発の事実クレームを抽出した新しいリソースであるWildClaimsデータセットを作成した。
本資料を予備分析した結果,18%~51%の会話がチェック価値のあるアサーションを含むことが明らかとなった。
この高い頻度は、明示的な情報アクセスに対する従来の理解を超えて、現実世界のユーザ・システム間の会話で発生する暗黙的な情報アクセスに取り組むことの重要性を浮き彫りにしている。
関連論文リスト
- From Chat Logs to Collective Insights: Aggregative Question Answering [16.25106951968537]
Aggregative Question Answeringは、何千ものユーザとチャットボットのインタラクションを明示的に推論し、集約的なクエリに答えることを必要とする新しいタスクである。
この方向の研究を可能にするために,実世界の会話182,330から派生した6,027の集約質問からなるWildChat-AQAというベンチマークを構築した。
論文 参考訳(メタデータ) (2025-05-29T17:59:55Z) - WildVis: Open Source Visualizer for Million-Scale Chat Logs in the Wild [88.05964311416717]
本研究では,高速,多目的,大規模会話分析が可能な対話型ツールWildVisを紹介する。
WildVisは、基準リストに基づいてテキストと埋め込みスペースの検索と視覚化機能を提供する。
誤用調査の促進,データセット間のトピック分布の可視化と比較,ユーザ固有の会話パターンの特徴付け,という3つのケーススタディを通じてWildVisの有用性を実証する。
論文 参考訳(メタデータ) (2024-09-05T17:59:15Z) - NewsDialogues: Towards Proactive News Grounded Conversation [72.10055780635625]
本稿では,対話システムがニュースの重要な話題に基づいて会話を積極的にリードする新しいタスク,Proactive News Grounded Conversationを提案する。
この課題をさらに発展させるために、人間と人間の対話データセットtsNewsDialoguesを収集し、合計14.6Kの発話を含む1Kの会話を含む。
論文 参考訳(メタデータ) (2023-08-12T08:33:42Z) - RHO ($\rho$): Reducing Hallucination in Open-domain Dialogues with
Knowledge Grounding [57.46495388734495]
本稿では、知識グラフ(KG)からリンクされたエンティティと関係述語を表現したRHO(rho$)を提案する。
本稿では,(1)テキスト埋め込みと対応するKG埋め込みを組み合わせるための局所知識基盤,(2)注目機構を介してRHOにマルチホップ推論能力を持たせるためのグローバル知識基盤を提案する。
論文 参考訳(メタデータ) (2022-12-03T10:36:34Z) - Knowledge-Grounded Conversational Data Augmentation with Generative
Conversational Networks [76.11480953550013]
生成会話ネットワークを用いて会話データを自動的に生成する。
我々は、Topical Chatデータセット上で、知識のない会話に対するアプローチを評価した。
論文 参考訳(メタデータ) (2022-07-22T22:37:14Z) - End-to-end Spoken Conversational Question Answering: Task, Dataset and
Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。
本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。
本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文 参考訳(メタデータ) (2022-04-29T17:56:59Z) - BERT Embeddings Can Track Context in Conversational Search [5.3222282321717955]
我々は,自然な方法で情報検索を支援する対話型検索システムを開発した。
システムは、質問が提示される状況を理解し、会話の現在の状態を追跡し、以前の質問や回答に対する言及を検出する。
論文 参考訳(メタデータ) (2021-04-13T22:02:24Z) - Information Seeking in the Spirit of Learning: a Dataset for
Conversational Curiosity [10.409312809724458]
我々は、ユーザが知っていることに関連する事実を提示されると、エンゲージメントが増加するという仮説をテストするウィザード・オブ・オズ・ダイアログタスクを設計する。
ユーザとアシスタントが地理的話題について会話する14Kダイアログ(181K発声)を収集・リリースする。
このデータセットには、既存のユーザ知識、メッセージレベルのダイアログアクション、ウィキペディアへの接地、メッセージに対するユーザ反応が注釈付けされている。
論文 参考訳(メタデータ) (2020-05-01T01:55:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。