論文の概要: NICO-RAG: Multimodal Hypergraph Retrieval-Augmented Generation for Understanding the Nicotine Public Health Crisis
- arxiv url: http://arxiv.org/abs/2603.02047v1
- Date: Mon, 02 Mar 2026 16:31:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.973599
- Title: NICO-RAG: Multimodal Hypergraph Retrieval-Augmented Generation for Understanding the Nicotine Public Health Crisis
- Title(参考訳): NICO-RAG : ニコチン公衆衛生危機理解のためのマルチモーダルハイパーグラフ検索世代
- Authors: Manuel Serna-Aguilera, Raegan Anderes, Page Dobbs, Khoa Luu,
- Abstract要約: Nicotine Innovation Counter-Offensive (NICO)データセットは、55のタバコやニコチン製品ブランドで、画像やテキスト記述を含む20万以上のマルチモーダルサンプルを提供する。
本稿では,高コストの言語モデルを実現することなく画像特徴を検索可能な検索拡張生成(RAG)フレームワークNICO-RAGを提案する。
- 参考スコア(独自算出の注目度): 12.945798371353412
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The nicotine addiction public health crisis continues to be pervasive. In this century alone, the tobacco industry has released and marketed new products in an aggressive effort to lure new and young customers for life. Such innovations and product development, namely flavored nicotine or tobacco such as nicotine pouches, have undone years of anti-tobacco campaign work. Past work is limited both in scope and in its ability to connect large-scale data points. Thus, we introduce the Nicotine Innovation Counter-Offensive (NICO) Dataset to provide public health researchers with over 200,000 multimodal samples, including images and text descriptions, on 55 tobacco and nicotine product brands. In addition, to provide public health researchers with factual connections across a large-scale dataset, we propose NICO-RAG, a retrieval-augmented generation (RAG) framework that can retrieve image features without incurring the high-cost of language models, as well as the added cost of processing image tokens with large-scale datasets such as NICO. At construction time, NICO-RAG organizes image- and text-extracted entities and relations into hypergraphs to produce as factual responses as possible. This joint multimodal knowledge representation enables NICO-RAG to retrieve images for query answering not only by visual similarity but also by the semantic similarity of image descriptions. Experimentals show that without needing to process additional tokens from images for over 100 questions, NICO-RAG performs comparably to the state-of-the-art RAG method adapted for images.
- Abstract(参考訳): ニコチン中毒の公衆衛生危機は依然として広まり続けている。
この世紀だけで、タバコ産業は、新しい若い顧客を終生誘致するために、積極的に新製品を発売し、販売している。
このような革新と製品開発、すなわちニコチンまたはニコチンポーチのようなタバコの風味付けは、反タバコキャンペーン活動に1年間を要した。
過去の作業はスコープと大規模データポイントを接続する能力の両方で制限されている。
そこで我々は,Nictine Innovation Counter-Offensive (NICO) Datasetを導入し,55のタバコおよびニコチン製品ブランド上で,画像やテキスト記述を含む20万以上のマルチモーダルサンプルを公衆衛生研究者に提供する。
さらに,公共衛生研究者に対して,大規模なデータセット間でのファクトコネクトを提供するため,NICO-RAGを提案する。このフレームワークは,高コストの言語モデルを発生させることなく,画像特徴を検索可能な検索拡張生成(RAG)フレームワークであり,NICOのような大規模データセットによる画像トークン処理のコストが増大する。
NICO-RAGは、構築時に画像およびテキスト抽出されたエンティティと関係をハイパーグラフに整理し、可能な限り事実応答を生成する。
この共同マルチモーダル知識表現により、NICO-RAGは、視覚的類似性だけでなく、画像記述のセマンティック類似性によって、クエリ応答のためのイメージを検索することができる。
NICO-RAGは100以上の質問に対して、画像から追加のトークンを処理する必要がなく、画像に適応した最先端のRAG法と互換性があることを示した。
関連論文リスト
- DEFEND: A Large-scale 1M Dataset and Foundation Model for Tobacco Addiction Prevention [6.522584735276245]
Tobacco-1Mは、75の製品カテゴリにまたがる階層的なラベルを持つ100万のタバコ製品イメージの包括的なデータセットである。
DEFENDはタバコ製品の理解のための新しい基礎モデルである。
論文 参考訳(メタデータ) (2025-01-20T02:55:46Z) - Public Health Advocacy Dataset: A Dataset of Tobacco Usage Videos from Social Media [6.9114339814002745]
Public Health Advocacy データセット (PHAD) は、TikTok や YouTube などのソーシャルメディアプラットフォームから提供されるタバコ製品に関連する5,730本のビデオの包括的なコレクションである。
このデータセットは430万フレームを含み、ユーザエンゲージメントメトリクス、ビデオ記述、検索キーワードなどの詳細なメタデータを含んでいる。
論文 参考訳(メタデータ) (2024-11-12T18:12:06Z) - LSD3K: A Benchmark for Smoke Removal from Laparoscopic Surgery Images [0.7138611948315257]
腹腔鏡下手術で手術器具が生み出す煙は視野を曖昧にし、外科医が正確に安全に手術を行う能力を損なう。
近年、腹腔鏡画像の喫煙が研究者の注目を集めているが、このタスクの開発を妨害する主要なボトルネックは、公開可能な高品質なベンチマークデータセットの欠如である。
我々は, 3000対の合成非均一煙像からなる, LSD3Kと呼ばれる腹腔鏡下手術画像デスモーキングのための新しい高品質データセットを構築した。
論文 参考訳(メタデータ) (2024-07-18T03:42:16Z) - A Domain Translation Framework with an Adversarial Denoising Diffusion
Model to Generate Synthetic Datasets of Echocardiography Images [0.5999777817331317]
臨床研究に好適な心エコー画像を作成するための枠組みを提案する。
いくつかのドメイン翻訳操作において、このような生成モデルによって高品質な画像サンプルを合成できることが確認された。
論文 参考訳(メタデータ) (2024-03-07T15:58:03Z) - Implicit Neural Representation in Medical Imaging: A Comparative Survey [3.478921293603811]
Inlicit Neural representations (INR) はシーン再構成やコンピュータグラフィックスにおいて強力なパラダイムとして注目されている。
本調査は,医療画像の分野でのINRモデルの概要を概観することを目的としている。
論文 参考訳(メタデータ) (2023-07-30T06:39:25Z) - XrayGPT: Chest Radiographs Summarization using Medical Vision-Language Models [72.8965643836841]
我々は,会話型医療ビジョン言語モデルであるXrayGPTを紹介する。
胸部X線写真に関するオープンエンドの質問を分析し、答えることができる。
自由テキストラジオグラフィーレポートから217kの対話的かつ高品質な要約を生成する。
論文 参考訳(メタデータ) (2023-06-13T17:59:59Z) - DeepfakeArt Challenge: A Benchmark Dataset for Generative AI Art Forgery and Data Poisoning Detection [57.51313366337142]
悪意ある目的のために生成的AIを使用することについて懸念が高まっている。
生成AIを用いた視覚コンテンツ合成の領域では、画像偽造とデータ中毒が重要な関心事となっている。
DeepfakeArt Challenge(ディープフェイクアートチャレンジ)は、AIアートのジェネレーションとデータ中毒検出のための機械学習アルゴリズムの構築を支援するために設計された、大規模なチャレンジベンチマークデータセットである。
論文 参考訳(メタデータ) (2023-06-02T05:11:27Z) - There is a Time and Place for Reasoning Beyond the Image [63.96498435923328]
画像は人間の目へのピクセルだけでなく、他のソースからのコンテキスト情報から推論、関連付け、推論して、推論することで、より完全な画像を確立することができる。
我々は、ニューヨーク・タイムズ(NYT)から自動的に抽出された16k画像と関連するニュース、時間、位置のデータセットTARAと、WITから離れた監視対象として追加で61k例を紹介した。
我々は、最先端のジョイントモデルと人間のパフォーマンスの間に70%のギャップがあることを示し、これは、セグメントワイズ推論を用いて高レベルな視覚言語ジョイントモデルを動機づける提案モデルによってわずかに満たされている。
論文 参考訳(メタデータ) (2022-03-01T21:52:08Z) - CAGAN: Text-To-Image Generation with Combined Attention GANs [70.3497683558609]
テキスト記述に基づく写真リアルな画像を生成するために,CAGAN(Combined Attention Generative Adversarial Network)を提案する。
提案されたCAGANは2つの注意モデルを用いている:関連語に条件付きで異なる部分領域を描画する単語注意と、チャネル間の非線形相互作用をキャプチャする絞りと励起の注意である。
スペクトル正規化によるトレーニングの安定化により、提案したCAGANは、CUBデータセット上のISとFID、より困難なCOCOデータセット上のFIDの技術を改良する。
論文 参考訳(メタデータ) (2021-04-26T15:46:40Z) - Generative Adversarial U-Net for Domain-free Medical Image Augmentation [49.72048151146307]
注釈付き医用画像の不足は、医用画像コンピューティングの分野における最大の課題の1つだ。
本稿では,生成逆U-Netという新しい生成手法を提案する。
当社の新しいモデルは、ドメインフリーで、さまざまな医療画像に汎用性があります。
論文 参考訳(メタデータ) (2021-01-12T23:02:26Z) - Attention-Driven Dynamic Graph Convolutional Network for Multi-Label
Image Recognition [53.17837649440601]
本稿では,各画像の特定のグラフを動的に生成するアテンション駆動型動的グラフ畳み込みネットワーク(ADD-GCN)を提案する。
パブリックなマルチラベルベンチマーク実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-12-05T10:10:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。