論文の概要: LLMCount: Enhancing Stationary mmWave Detection with Multimodal-LLM
- arxiv url: http://arxiv.org/abs/2409.16209v2
- Date: Mon, 11 Nov 2024 13:56:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 17:14:23.313609
- Title: LLMCount: Enhancing Stationary mmWave Detection with Multimodal-LLM
- Title(参考訳): LLMCount:マルチモーダルLLMによる静止ミリ波検出の強化
- Authors: Boyan Li, Shengyi Ding, Deen Ma, Yixuan Wu, Hongjie Liao, Kaiyuan Hu,
- Abstract要約: LLMCountは,大規模言語モデル(LLM)の機能を活用して,群衆検出性能を向上させる最初のシステムである。
システムの性能を評価するため,ホール,会議室,映画館などの多彩なシナリオ下で総合的な評価を行う。
- 参考スコア(独自算出の注目度): 1.8326853076179552
- License:
- Abstract: Millimeter wave sensing provides people with the capability of sensing the surrounding crowds in a non-invasive and privacy-preserving manner, which holds huge application potential. However, detecting stationary crowds remains challenging due to several factors such as minimal movements (like breathing or casual fidgets), which can be easily treated as noise clusters during data collection and consequently filtered in the following processing procedures. Additionally, the uneven distribution of signal power due to signal power attenuation and interferences resulting from external reflectors or absorbers further complicates accurate detection. To address these challenges and enable stationary crowd detection across various application scenarios requiring specialized domain adaption, we introduce LLMCount, the first system to harness the capabilities of large-language models (LLMs) to enhance crowd detection performance. By exploiting the decision-making capability of LLM, we can successfully compensate the signal power to acquire a uniform distribution and thereby achieve a detection with higher accuracy. To assess the system's performance, comprehensive evaluations are conducted under diversified scenarios like hall, meeting room, and cinema. The evaluation results show that our proposed approach reaches high detection accuracy with lower overall latency compared with previous methods.
- Abstract(参考訳): ミリ波センシングは、周囲の群衆を非侵襲的でプライバシー保護的な方法で検知する機能を提供する。
しかし, 定在群集の検出は, データ収集時にノイズクラスタとして容易に処理でき, 以下の処理手順でフィルタリングできるため, 最小運動(呼吸やカジュアルフィジットなど)のいくつかの要因により, 依然として困難である。
さらに、信号パワーの減衰と外部反射器や吸収器による干渉による信号パワーの不均一分布は、さらに正確な検出を複雑にする。
これらの課題に対処し、特定のドメイン適応を必要とする様々なアプリケーションシナリオにまたがる定常的な群集検出を可能にするため、LLMCountを導入し、大規模なモデル(LLM)の能力を活用して群集検出性能を向上させる。
LLMの意思決定能力を利用することで、信号パワーを補償して均一な分布を得ることができ、精度の高い検出が可能となる。
システムの性能を評価するため,ホール,会議室,映画館などの多彩なシナリオ下で総合的な評価を行う。
評価結果から,提案手法は従来手法に比べて全体の遅延時間が少なく,検出精度が高いことがわかった。
関連論文リスト
- Generalizable Non-Line-of-Sight Imaging with Learnable Physical Priors [52.195637608631955]
非視線画像(NLOS)は、その潜在的な応用により注目されている。
既存のNLOS再構成アプローチは、経験的物理的前提に依存して制約される。
本稿では,Learningable Path Compensation(LPC)とAdaptive Phasor Field(APF)の2つの主要な設計を含む,学習に基づく新しいソリューションを提案する。
論文 参考訳(メタデータ) (2024-09-21T04:39:45Z) - Cost-Effective Hallucination Detection for LLMs [11.58436181159839]
大規模な言語モデル(LLM)は幻覚を起こす傾向があり、入力、外部事実、あるいは内部的矛盾に反する信頼できない出力を生成する。
幻覚検出のためのパイプラインでは,まず,生成した回答が幻覚である可能性を示す信頼スコアを生成し,第2に,入力の属性と候補応答に基づいてスコア条件を調整し,第3に,スコアを閾値付けして検出を行う。
論文 参考訳(メタデータ) (2024-07-31T08:19:06Z) - Boosting Detection in Crowd Analysis via Underutilized Output Features [8.319283909091595]
群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集群集
これらの手法の可能性は、しばしば無視される群集分析に重要な情報を提供するため、過小評価されていると我々は主張する。
既存の検出モデルと容易に統合可能なプラグイン・アンド・プレイモジュールであるCrowd Hatを提案する。
論文 参考訳(メタデータ) (2023-08-30T17:59:11Z) - Hyperspectral Remote Sensing Benchmark Database for Oil Spill Detection
with an Isolation Forest-Guided Unsupervised Detector [13.739881592455044]
近年、海洋石油流出事故が環境、天然資源、沿岸住民の生活に深刻な影響を与えているため、石油流出の検出が注目されている。
既存のアプローチのほとんどは、ハイパースペクトル画像(HSI)からのオイル流出を検出するための教師付きおよび半教師付きフレームワークに基づいている。
本研究では,HSIの孤立林を基盤とした非監督型油流出検出手法の開発を初めて試みる。
論文 参考訳(メタデータ) (2022-09-28T02:26:42Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - ReDFeat: Recoupling Detection and Description for Multimodal Feature
Learning [51.07496081296863]
我々は、相互重み付け戦略による多モーダル特徴学習の検出と記述の独立した制約を再定義する。
本研究では,大きな受容場を有し,学習可能な非最大抑制層を備える検出器を提案する。
我々は,特徴マッチングと画像登録タスクにおける特徴量を評価するために,クロス可視,赤外線,近赤外,合成開口レーダ画像ペアを含むベンチマークを構築した。
論文 参考訳(メタデータ) (2022-05-16T04:24:22Z) - DeepTimeAnomalyViz: A Tool for Visualizing and Post-processing Deep
Learning Anomaly Detection Results for Industrial Time-Series [88.12892448747291]
DeTAVIZ インタフェースは Web ブラウザをベースとした可視化ツールで,特定の問題における DL ベースの異常検出の実現可能性の迅速な探索と評価を行う。
DeTAVIZを使えば、ユーザーは複数のポスト処理オプションを簡単かつ迅速に繰り返し、異なるモデルを比較することができ、選択したメトリックに対して手動で最適化できる。
論文 参考訳(メタデータ) (2021-09-21T10:38:26Z) - Flow-based Self-supervised Density Estimation for Anomalous Sound
Detection [6.495759450230705]
私たちは、同じ機械タイプの他の機械からの音にターゲットマシンの音と低い可能性により高い可能性を割り当てるモデルを訓練します。
DCASE 2020 Challenge Task2データセットを用いて行った実験では、提案手法は平均4.6%改善した。
論文 参考訳(メタデータ) (2021-03-16T01:52:03Z) - Optimal Sequential Detection of Signals with Unknown Appearance and
Disappearance Points in Time [64.26593350748401]
本論文は、変化の期間が有限で未知であると仮定して、逐次的な変化点検出問題に対処する。
我々は、所定の時間(または空間)ウィンドウにおける最小検出確率を最大化する信頼性の高い最大変更検出基準に焦点を当てる。
FMAアルゴリズムは、光学画像中の衛星のかすかなストリークを検出するために応用される。
論文 参考訳(メタデータ) (2021-02-02T04:58:57Z) - A Reinforcement Learning based approach for Multi-target Detection in
Massive MIMO radar [12.982044791524494]
本稿では,MMIMO(Multiple input Multiple output)認知レーダ(CR)におけるマルチターゲット検出の問題点について考察する。
本稿では,未知の外乱統計の存在下での認知的マルチターゲット検出のための強化学習(RL)に基づくアルゴリズムを提案する。
定常環境と動的環境の両方において提案したRLアルゴリズムの性能を評価するため, 数値シミュレーションを行った。
論文 参考訳(メタデータ) (2020-05-10T16:29:06Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。