論文の概要: FiLark: a streaming-first software framework for end-to-end exploration, annotation, and algorithm integration in distributed acoustic sensing
- arxiv url: http://arxiv.org/abs/2605.20132v1
- Date: Tue, 19 May 2026 17:17:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.550731
- Title: FiLark: a streaming-first software framework for end-to-end exploration, annotation, and algorithm integration in distributed acoustic sensing
- Title(参考訳): FiLark: 分散型音響センシングにおけるエンドツーエンド探索、アノテーション、アルゴリズム統合のためのストリーミングファーストソフトウェアフレームワーク
- Authors: Jintao Li, Weichang Li, Kai Tong, Xaingyu Guo,
- Abstract要約: FiLarkはPythonフレームワークで、データアクセス、信号処理、可視化、DASの監視において、emph-streaming-first原則を均一に適用する。
- 参考スコア(独自算出の注目度): 7.3952570413177705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distributed acoustic sensing (DAS) systems generate continuous, ultra-high-channel-count data streams at rates that exceed the capabilities of conventional batch-oriented analysis frameworks. As a result, essential tasks such as interactive exploration of long-duration recordings, scalable event annotation, and real-time algorithm-in-the-loop monitoring remain inadequately supported by workflows built around manually selected data segments and offline processing. This paper presents FiLark (Fiber Lark), a Python framework that applies a \emph{streaming-first} principle uniformly across data access, signal processing, visualization and monitoring for DAS. Instead of operating on manually selected data segments, FiLark presents any DAS sources-including continuous multi-file recordings-as a unified stream and builds all system components around that abstraction. An OpenGL-based ring-buffer renderer enables interactive browsing and visualization of arbitrarily long recordings with constant memory usage. An integrated annotation interface supports event labeling directly within continuous data streams, facilitating the creation of reproducible machine-learning-ready labeled datasets without offline preprocessing. The signal processing library includes temporal, spatial, spectral, and decomposition-based operators, with both CPU implementations and GPU-accelerated variants via PyTorch, alongside stateful chunked execution that preserves processing continuity and application semantics across segment boundaries. A standardized monitor interface further integrates streaming detectors and learning-based models into the visualization workflow. By sharing a common streaming abstraction across all layers, FiLark allows processing configurations and workflows developed interactively to transfer directly to scalable production pipelines without modification.
- Abstract(参考訳): 分散音響センシング(DAS)システムは、従来のバッチ指向分析フレームワークの能力を超える速度で、連続して超高チャネル数のデータストリームを生成する。
その結果、長期記録のインタラクティブな探索、スケーラブルなイベントアノテーション、リアルタイムのアルゴリズム・イン・ザ・ループ監視といった重要なタスクは、手動で選択したデータセグメントとオフライン処理を中心に構築されたワークフローによって不十分にサポートされている。
本稿では,データアクセス,信号処理,DASの可視化,監視を均一に行うPythonフレームワークFiLark(Fiber Lark)を提案する。
手動で選択したデータセグメントを操作する代わりに、FiLarkはDASソースを含む連続的なマルチファイル記録を統一ストリームとして提供し、その抽象化の周りにすべてのシステムコンポーネントを構築する。
OpenGLベースのリングバッファレンダラは、任意のメモリ使用量で任意の長記録のインタラクティブなブラウジングと可視化を可能にする。
統合されたアノテーションインターフェースは、継続的データストリーム内で直接イベントラベリングをサポートし、オフライン前処理なしで再現可能な機械学習対応ラベル付きデータセットの作成を容易にする。
信号処理ライブラリには、時間的、空間的、スペクトル的、分解に基づく演算子が含まれており、CPU実装とPyTorchによるGPUアクセラレーションの亜種の両方と、セグメント境界を越えた処理の連続性とアプリケーションセマンティクスを保存するステートフルなチャンク実行がある。
標準化されたモニタインターフェースは、ストリーミング検出器と学習ベースのモデルを可視化ワークフローに統合する。
すべてのレイヤで共通のストリーミング抽象化を共有することで、FiLarkは、インタラクティブに開発され、変更することなく、スケーラブルなプロダクションパイプラインに直接転送することができる。
関連論文リスト
- Advancing Narrative Long Video Generation via Training-Free Identity-Aware Memory [79.01059178883817]
IAMFlowはトレーニング不要のID対応メモリフレームワークで、永続的なエンティティのIDを明示的にモデル化し追跡する。
VLMは、レンダリングフレームから属性を非同期に検証し、洗練し、暗黙の類似性ベースのマッチングの代わりに明示的なエンティティ追跡を可能にする。
NarraStream-Benchは,6次元にまたがる324のマルチプロンプトスクリプトを備えた,ナラストリームビデオ生成のためのベンチマークである。
論文 参考訳(メタデータ) (2026-05-18T17:54:34Z) - Efficient Inference for Large Vision-Language Models: Bottlenecks, Techniques, and Prospects [26.144665202231014]
LVLM(Large Vision-Language Models)は、画像やビデオに対する洗練された推論を可能にするが、その推論は視覚トークン支配として知られるシステム的効率障壁によって妨げられる。
提案手法は,符号化,プリフィル,デコードからなる推論ライフサイクルを中心に構築された効率技術に関する系統分類である。
論文 参考訳(メタデータ) (2026-04-07T07:44:11Z) - TrajTok: Learning Trajectory Tokens enables better Video Understanding [63.1260672430712]
ビデオモデルのトークン化は、通常、パッチ化によって、過剰で冗長な数のトークンを生成する。
そこで我々は,ビデオモデルと完全に統合され,共にトレーニングされたビデオトークンモジュールであるTrajTokを提案する。
本稿では,前処理した視覚特徴量(TrajAdapter)の探索ヘッドとしてシームレスに統合できるか,特に長ビデオ推論において高い性能を持つ視覚言語モデル(TrajVLM)のアライメントコネクタとして利用できることを示す。
論文 参考訳(メタデータ) (2026-02-26T09:15:34Z) - Fast SAM2 with Text-Driven Token Pruning [52.8350457627401]
Segment Anything Model 2 (SAM2) では、視覚計算モデルがプロンプト駆動のビデオオブジェクトセグメンテーションにおいて大幅に進歩している。
SAM2パイプラインは、イメージエンコーダが生成するすべての視覚トークンを、ターゲットオブジェクトとの関係にかかわらず、下流の時間的推論モジュールを通じて伝達する。
本稿では,時間的伝播に先立ってトークン密度を選択的に低減し,推論効率を向上させるためのテキスト誘導型トークンプルーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-24T18:59:05Z) - Flowception: Temporally Expansive Flow Matching for Video Generation [35.14803469800522]
Flowceptionは自動回帰および可変長ビデオ生成フレームワークである。
離散的なフレーム挿入を連続的なフレームデノイングでインターリーブする確率パスを学習する。
Flowceptionは、フレームをシーケンスに挿入し、復調することを学ぶことで、画像からビデオへの生成やビデオなど、さまざまなタスクをシームレスに統合する。
論文 参考訳(メタデータ) (2025-12-12T10:23:47Z) - StreamDiffusionV2: A Streaming System for Dynamic and Interactive Video Generation [65.90400162290057]
生成モデルは、コンテンツの作り方、スタイル、配信方法を再定義することで、ライブストリーミング業界を変革している。
ビデオ拡散の最近の進歩は、オフライン生成のための時間的一貫性とサンプリング効率を著しく改善した。
ライブオンラインストリーミングは厳しいサービスレベル(SLO)の下で動作します。 タイム・ツー・ファーストフレームは最小限でなければなりません。
論文 参考訳(メタデータ) (2025-11-10T18:51:28Z) - DIFFVSGG: Diffusion-Driven Online Video Scene Graph Generation [61.59996525424585]
DIFFVSGGはオンラインのVSGGソリューションで、このタスクを反復的なシーングラフ更新問題とみなしている。
オブジェクト分類の復号化、境界ボックス回帰、グラフ生成の3つのタスクを1つの共有特徴埋め込みを用いて統合する。
DIFFVSGGはさらに、後続のフレームの予測が過去のフレームの結果をLCMの条件入力として活用する継続的時間的推論を促進する。
論文 参考訳(メタデータ) (2025-03-18T06:49:51Z) - Event-based Video Frame Interpolation with Edge Guided Motion Refinement [28.331148083668857]
本稿では,イベント信号のエッジ特徴を効果的に活用するためのエンドツーエンドE-VFI学習手法を提案する。
提案手法にはエッジガイド・アテンテーティブ(EGA)モジュールが組み込まれており,アテンテーティブアグリゲーションによって推定された映像の動きを補正する。
合成データと実データの両方を用いた実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-04-28T12:13:34Z) - Motion-inductive Self-supervised Object Discovery in Videos [99.35664705038728]
本稿では,連続的なRGBフレームの処理モデルを提案し,層状表現を用いて任意のフレーム間の光の流れを推定する。
3つの公開ビデオセグメンテーションデータセットにおいて,従来の最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-10-01T08:38:28Z) - FlowVOS: Weakly-Supervised Visual Warping for Detail-Preserving and
Temporally Consistent Single-Shot Video Object Segmentation [4.3171602814387136]
本稿では,VOSデータから流れ場を学習する前景型ビジュアルワープ手法を提案する。
フローモジュールをトレーニングし、2つの弱い教師付き損失を用いてフレーム間の詳細な動きをキャプチャする。
提案手法は,高精細かつ時間的整合性を持ったセグメンテーションを生成する。
論文 参考訳(メタデータ) (2021-11-20T16:17:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。