論文の概要: Visually Grounded Narratives: Reducing Cognitive Burden in Researcher-Participant Interaction
- arxiv url: http://arxiv.org/abs/2509.00381v1
- Date: Sat, 30 Aug 2025 06:38:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.206214
- Title: Visually Grounded Narratives: Reducing Cognitive Burden in Researcher-Participant Interaction
- Title(参考訳): 視覚的グラウンドド・ナラティブ:研究者と参加者のインタラクションにおける認知的バーデンの低減
- Authors: Runtong Wu, Jiayao Song, Fei Teng, Xianhao Ren, Yuyan Gao, Kailun Yang,
- Abstract要約: 名前は研究資料をコヒーレントなストーリーイメージに転送することができる。
我々は,可視画像生成を容易にするアクタ位置と形状モジュールを開発した。
我々のアプローチは、異なるデータパーティショニングスキームにおける最先端のパフォーマンスを一貫して示す。
- 参考スコア(独自算出の注目度): 8.483791023853017
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Narrative inquiry has been one of the prominent application domains for the analysis of human experience, aiming to know more about the complexity of human society. However, researchers are often required to transform various forms of data into coherent hand-drafted narratives in storied form throughout narrative analysis, which brings an immense burden of data analysis. Participants, too, are expected to engage in member checking and presentation of these narrative products, which involves reviewing and responding to large volumes of documents. Given the dual burden and the need for more efficient and participant-friendly approaches to narrative making and representation, we made a first attempt: (i) a new paradigm is proposed, NAME, as the initial attempt to push the field of narrative inquiry. Name is able to transfer research documents into coherent story images, alleviating the cognitive burden of interpreting extensive text-based materials during member checking for both researchers and participants. (ii) We develop an actor location and shape module to facilitate plausible image generation. (iii) We have designed a set of robust evaluation metrics comprising three key dimensions to objectively measure the perceptual quality and narrative consistency of generated characters. Our approach consistently demonstrates state-of-the-art performance across different data partitioning schemes. Remarkably, while the baseline relies on the full 100% of the available data, our method requires only 0.96% yet still reduces the FID score from 195 to 152. Under identical data volumes, our method delivers substantial improvements: for the 70:30 split, the FID score decreases from 175 to 152, and for the 95:5 split, it is nearly halved from 96 to 49. Furthermore, the proposed model achieves a score of 3.62 on the newly introduced metric, surpassing the baseline score of 2.66.
- Abstract(参考訳): ナラティブ・クエストは、人間の社会の複雑さについてより深く知ることを目的として、人間の経験の分析のための顕著な応用分野の1つとなっている。
しかし、研究者は、様々な形態のデータを物語分析を通して、手書きのコヒーレントな物語に変換することがしばしば求められており、データ解析の多大な負担が伴う。
参加者もまた、大量の文書のレビューと対応を含む、これらの物語製品のメンバチェックとプレゼンテーションに従事していると期待されている。
二重負担と、より効率的で参加者フレンドリーな物語作りと表現アプローチの必要性を踏まえて、私たちは最初の試みを行った。
(i)物語探究の分野を推し進める最初の試みとして,NAMEという新たなパラダイムが提案されている。
名前は、研究資料をコヒーレントなストーリーイメージに転送することができ、研究者と参加者の両方の検査中に、広範なテキストベースの資料を解釈する際の認知的負担を軽減することができる。
(II)プラプティブルな画像生成を容易にするアクタ位置と形状モジュールを開発する。
3) 生成した文字の知覚的品質と物語的一貫性を客観的に測定するために、3つの重要な次元からなる頑健な評価指標を設計した。
我々のアプローチは、異なるデータパーティショニングスキームにおける最先端のパフォーマンスを一貫して示す。
興味深いことに、ベースラインは利用可能なデータの100%に依存しているが、我々の手法は0.96%しか必要とせず、FIDのスコアを195から152に下げる。
70:30分割ではFIDスコアが175から152に減少し,95:5分割では96から49にほぼ半減した。
さらに,提案モデルでは,新たに導入した測定値に対して3.62のスコアを達成し,ベースラインスコアの2.66を上回った。
関連論文リスト
- Knowledge-Centric Templatic Views of Documents [2.654058995940072]
著者はしばしば、スライドデッキ、ニュースレター、レポート、ポスターなど、様々な文書形式でアイデアを共有している。
文書生成装置の品質測定に適応できる新しい統一評価フレームワークを提案する。
人間の評価を行い,提案手法を用いて作成した文書の82%を利用者が好んでいることを示す。
論文 参考訳(メタデータ) (2024-01-13T01:22:15Z) - Towards Automatic Boundary Detection for Human-AI Collaborative Hybrid
Essay in Education [10.606131520965604]
本研究では,滅多に調査されていない現実的な環境下でのAIコンテンツ検出について検討する。
まず,人書きコンテンツとAI生成コンテンツ間の遷移点の同定として,検出タスクを定式化した。
次に、エンコーダトレーニングプロセス中にAI生成コンテンツと人書きコンテンツとを分離する2段階のアプローチを提案した。
論文 参考訳(メタデータ) (2023-07-23T08:47:51Z) - On the Possibilities of AI-Generated Text Detection [76.55825911221434]
機械が生成するテキストが人間に近い品質を近似するにつれて、検出に必要なサンプルサイズが増大すると主張している。
GPT-2, GPT-3.5-Turbo, Llama, Llama-2-13B-Chat-HF, Llama-2-70B-Chat-HFなどの最先端テキストジェネレータをoBERTa-Large/Base-Detector, GPTZeroなどの検出器に対して試験した。
論文 参考訳(メタデータ) (2023-04-10T17:47:39Z) - Analyzing and Evaluating Faithfulness in Dialogue Summarization [67.07947198421421]
まず,対話要約の忠実度に関するきめ細かな人間の分析を行い,生成した要約の35%以上がソース対話に忠実に一致していないことを観察する。
そこで本研究では,ルールベース変換により生成した複数選択質問を用いたモデルレベルの忠実度評価手法を提案する。
論文 参考訳(メタデータ) (2022-10-21T07:22:43Z) - PART: Pre-trained Authorship Representation Transformer [52.623051272843426]
文書を書く著者は、自分のテキストに識別情報を印字する。
以前の作品では、手作りの機能や分類タスクを使って著者モデルを訓練していた。
セマンティクスの代わりにテキストの埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - ICDAR 2021 Competition on Components Segmentation Task of Document
Photos [63.289361617237944]
3つの課題タスクが提案され、提供されたデータセット上で異なるセグメンテーションの割り当てが実行される。
収集されたデータはブラジルのいくつかのID文書のもので、その個人情報は便利に交換された。
さまざまなディープラーニングモデルが、各タスクで最高の結果を得るために、さまざまな戦略を持つ参加者によって適用されました。
論文 参考訳(メタデータ) (2021-06-16T00:49:58Z) - Integrating Semantics and Neighborhood Information with Graph-Driven
Generative Models for Document Retrieval [51.823187647843945]
本稿では,周辺情報をグラフ誘導ガウス分布でエンコードし,その2種類の情報をグラフ駆動生成モデルと統合することを提案する。
この近似の下では、トレーニング対象がシングルトンまたはペアワイズ文書のみを含む用語に分解可能であることを証明し、モデルが非関連文書と同じくらい効率的にトレーニングできることを示す。
論文 参考訳(メタデータ) (2021-05-27T11:29:03Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。