OASIS: Open Agent Social Interaction Simulations with One Million Agents [147.3] 実世界のソーシャルメディアプラットフォームに基づくスケーラブルなソーシャルメディアシミュレータを提案する。
OASISは最大100万人のユーザをモデリングできる大規模なユーザシミュレーションをサポートする。
我々は、情報拡散、グループ分極、XプラットフォームとRedditプラットフォーム間の群れ効果など、様々な社会現象を再現する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:16:00 GMT)
Enhancing LLM Reasoning via Critique Models with Test-Time and Training-Time Supervision [120.4] 本稿では、推論と批判モデルの役割を分離する2人プレイヤパラダイムを提案する。
まず、批判データを収集する自動化およびスケーラブルなフレームワークであるAutoMathCritiqueを提案する。
テスト時間における難解なクエリに対するアクターのパフォーマンスを,批判モデルが一貫して改善することが実証された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:11:54 GMT)
InTraGen: Trajectory-controlled Video Generation for Object Interactions [100.8] InTraGenは、オブジェクトインタラクションシナリオのトラジェクトリベースの生成を改善するパイプラインである。
その結果,視覚的忠実度と定量的性能の両面での改善が示された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:27:50 GMT)
Preference Optimization for Reasoning with Pseudo Feedback [100.6] 提案手法では,解のラベル付けを関連するテストケースに対する評価として行うことで,推論タスクに対する疑似フィードバックを生成する手法を提案する。
本研究では,擬似フィードバックを優先最適化に用いる数学的推論と符号化の両タスクについて実験を行い,両タスク間の改善を観察する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:44:02 GMT)
Predicting Emergent Capabilities by Finetuning [99.0] 微調整された言語モデルでは,出現頻度の低いモデルに展開するスケーリングのポイントをシフトできることがわかった。
提案手法は4つの標準NLPベンチマークを用いて検証する。
いくつかのケースでは、最大4倍の計算でトレーニングされたモデルが出現したかどうかを正確に予測できる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:48:09 GMT)
Revisiting Marr in Face: The Building of 2D--2.5D--3D Representations in Deep Neural Networks [98.7] 近年、ディープニューラルネットワークは人間のビジョンに匹敵するレベルに達していると広く考えられている。
ネットワークの中間層から元の画像を再構成するためのサブネットワークであるグラフィクスプローブを導入する。
ニューラルネットワークにグラフィックスプローブを注入し、画像再構成の動作を分析することで、DNNは最初、低層層における2D表現として画像をエンコードし、最終的に高層層における3D表現を構築する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:15:28 GMT)
RoDE: Linear Rectified Mixture of Diverse Experts for Food Large Multi-Modal Models [96.4] Uni-Foodは、さまざまな食品ラベルを持つ10万以上の画像からなる統合食品データセットである。
Uni-Foodは、食品データ分析に対するより包括的なアプローチを提供するように設計されている。
本稿では,食品関連マルチタスキングの課題に対処するため,新しいリニア・リクティフィケーション・ミックス・オブ・ディバース・エキスパート (RoDE) アプローチを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 02:12:05 GMT)
DocPedia: Unleashing the Power of Large Multimodal Model in the Frequency Domain for Versatile Document Understanding [91.2] 本研究は, OCRフリー文書理解のための新しい大規模マルチモーダルモデル(LMM)であるDocPediaを提案する。
既存の作業では高解像度のドキュメントで苦労したり、大きな言語モデルを捨てたり、視覚や言語能力に制約があったりするのに対して、DocPediaでは、ピクセル空間ではなく、周波数領域の視覚入力を直接処理しています。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:17:12 GMT)
MVGenMaster: Scaling Multi-View Generation from Any Image via 3D Priors Enhanced Diffusion Model [87.7] MVGenMasterは3Dプリエントで拡張された多視点拡散モデルであり,NVS(多目的なノベルビュー合成)タスクに対処する。
我々のモデルは、任意の参照ビューとカメラのポーズを条件とした100の新しいビューを生成できる、シンプルで効果的なパイプラインを特徴としている。
スケールアップデータセットを用いてモデルを強化するために,いくつかのトレーニングとモデル修正を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:34:23 GMT)
UNOPose: Unseen Object Pose Estimation with an Unposed RGB-D Reference Image [86.7] 単参照型オブジェクトポーズ推定のための新しいアプローチとベンチマークをUNOPoseと呼ぶ。
粗大なパラダイムに基づいて、UNOPoseはSE(3)不変の参照フレームを構築し、オブジェクト表現を標準化する。
重なり合う領域内に存在すると予測される確率に基づいて、各対応の重みを補正する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:36:00 GMT)
LeanAgent: Lifelong Learning for Formal Theorem Proving [85.4] フォーマルな定理証明のための新しい生涯学習フレームワークであるLeanAgentを紹介する。
LeanAgentは継続的に一般化し、拡張可能な数学的知識を改善します。
以前、23のリーンリポジトリで人間が公式に証明していなかった155の定理の証明に成功した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 02:39:03 GMT)
G2SDF: Surface Reconstruction from Explicit Gaussians with Implicit SDFs [84.1] G2SDFはニューラル暗黙の符号付き距離場をガウススプラッティングフレームワークに統合する新しいアプローチである。
G2SDFは, 3DGSの効率を維持しつつ, 従来よりも優れた品質を実現する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:07:07 GMT)
Privacy-Preserving Federated Foundation Model for Generalist Ultrasound Artificial Intelligence [83.0] プライバシー保護型超音波基礎モデルであるUltraFedFMを提案する。
UltraFedFMは、9か国の16の分散医療機関にわたる連合学習を用いて、協調的に事前訓練されている。
疾患診断には0.927のレシーバ動作特性曲線、病変セグメント化には0.878のサイス類似係数を平均的に達成する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:40:11 GMT)
Octavius: Mitigating Task Interference in MLLMs via LoRA-MoE [83.0] LLM(Large Language Models)は、命令チューニングを通じて、ゼロショット能力をマルチモーダル学習に拡張することができる。
ネガティブな対立や干渉は パフォーマンスに悪影響を及ぼすかもしれない
我々は、よく知られたMixture-of-Experts(MoE)と代表的なPEFT技法の1つであるLoRA(LoRA-MoE)を組み合わせて、マルチモーダル学習のための新しいLLMベースのデコーダ(LoRA-MoE)を設計する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:07:45 GMT)
UniPose: A Unified Multimodal Framework for Human Pose Comprehension, Generation and Editing [79.7] さまざまなモダリティにまたがって人間のポーズを理解し、生成し、編集するためのフレームワークであるUniPoseを提案する。
具体的には、3Dポーズを個別のポーズトークンに変換するためにポーズトークンライザを適用し、統一語彙内のLCMへのシームレスな統合を可能にする。
統一的な学習戦略から恩恵を受けるUniPoseは、さまざまなポーズ関連タスク間で知識を効果的に伝達し、目に見えないタスクに適応し、拡張された能力を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:06:30 GMT)
CARE Transformer: Mobile-Friendly Linear Visual Transformer via Decoupled Dual Interaction [77.9] 本稿では,新しいdetextbfCoupled dutextbfAl-interactive lineatextbfR atttextbfEntion (CARE) 機構を提案する。
まず,非対称な特徴分離戦略を提案し,非対称的に学習プロセスを局所帰納バイアスと長距離依存に分解する。
分離学習方式を採用し,特徴間の相補性を完全に活用することにより,高い効率性と精度を両立させることができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:56:13 GMT)
VQA$^2$: Visual Question Answering for Video Quality Assessment [76.8] ビデオ品質アセスメント(VQA)は、低レベルの視覚知覚において古典的な分野である。
画像領域における最近の研究は、視覚質問応答(VQA)が視覚的品質を著しく低レベルに評価できることを示した。
VQA2インストラクションデータセットは,ビデオ品質評価に焦点をあてた最初の視覚的質問応答インストラクションデータセットである。
VQA2シリーズは、ビデオにおける空間的時間的品質の詳細の知覚を高めるために、視覚的および運動的トークンをインターリーブする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:19:16 GMT)
KBAlign: Efficient Self Adaptation on Specific Knowledge Bases [75.8] 大規模言語モデル(LLM)は通常、知識材料を瞬時に活用するために、検索強化世代に依存している。
本稿では,知識ベースを含む下流タスクへの効率的な適応を目的としたKBAlignを提案する。
提案手法は,Q&Aペアやリビジョン提案などの自己注釈付きデータを用いて反復学習を行い,モデルが知識内容を効率的に把握できるようにする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:51:57 GMT)
All Languages Matter: Evaluating LMMs on Culturally Diverse 100 Languages [73.9] ALM-benchは、100言語にわたるLMMを評価するための、これまでで最大かつ最も包括的な取り組みである。
様々な言語でテキストと組み合わせた文化的に多様なイメージを理解し、推論する能力をテストすることで、既存のモデルに挑戦する。
このベンチマークは、真/偽、複数選択、オープンな質問など、さまざまな質問フォーマットを備えた、堅牢でニュアンスの高い評価フレームワークを提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:44:42 GMT)
UnitedVLN: Generalizable Gaussian Splatting for Continuous Vision-Language Navigation [72.0] 我々は,UnitedVLNと呼ばれる,新しい汎用3DGSベースの事前学習パラダイムを導入する。
エージェントは、高忠実度360度ビジュアルイメージとセマンティック特徴を統一してレンダリングすることで、将来の環境をよりよく探索することができる。
UnitedVLNは既存のVLN-CEベンチマークで最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 02:44:59 GMT)
Can Learned Optimization Make Reinforcement Learning Less Difficult? [70.5] 学習の最適化が強化学習の難しさを克服するのに役立つかどうかを検討する。
本稿では, 塑性, 探索および非定常性のための学習最適化手法(OPEN)を用いて, 入力特性と出力構造がこれらの困難に対して予め提案された情報によって通知される更新規則をメタラーニングする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:05:29 GMT)
DLCR: A Generative Data Expansion Framework via Diffusion for Clothes-Changing Person Re-ID [69.7] 本稿では,多様な服装の個人画像を生成するための新しいデータ拡張フレームワークを提案する。
5つのベンチマークCC-ReIDデータセットの追加データを生成し、衣服の多様性を10倍に向上する。
この膨大なデータの増加により、進歩的学習とテスト時間予測の洗練という、2つの新しい戦略を導入する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:19:39 GMT)
A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.2] ディープニューラルネットワークは、アンダーサンプル計測から高忠実度画像を再構成する大きな可能性を示している。
我々のモデルは、離散化に依存しないアーキテクチャであるニューラル演算子に基づいている。
我々の推論速度は拡散法よりも1,400倍速い。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:35:58 GMT)
OminiControl: Minimal and Universal Control for Diffusion Transformer [68.3] OminiControlは、イメージ条件をトレーニング済みのDiffusion Transformer(DiT)モデルに統合するフレームワークである。
コアとなるOminiControlはパラメータ再利用機構を活用しており、強力なバックボーンとしてイメージ条件をエンコードすることができる。
OminiControlは、主観駆動生成や空間的に整合した条件を含む、幅広いイメージコンディショニングタスクを統一的に処理する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:46:35 GMT)
Mixed Degradation Image Restoration via Local Dynamic Optimization and Conditional Embedding [67.6] マルチインワン画像復元 (IR) は, 一つのモデルで全ての種類の劣化画像復元を処理し, 大幅な進歩を遂げている。
本稿では,単一と混合の分解で画像を効果的に復元できる新しいマルチインワンIRモデルを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:26:34 GMT)
Ca2-VDM: Efficient Autoregressive Video Diffusion Model with Causal Generation and Cache Sharing [66.7] Ca2-VDMは、Causal生成とキャッシュ共有を備えた効率的な自己回帰VDMである。
因果生成のために一方向の特徴計算を導入し、前回の自己回帰ステップで条件付きフレームのキャッシュをプリ計算できるようにする。
キャッシュ共有では、巨大なキャッシュストレージコストを避けるために、すべてのデノナイズステップでキャッシュを共有する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:33:41 GMT)
PointMamba: A Simple State Space Model for Point Cloud Analysis [65.6] 我々は、最近の代表的状態空間モデル(SSM)であるMambaの成功を、NLPからポイントクラウド分析タスクへ転送するPointMambaを提案する。
従来のトランスフォーマーとは異なり、PointMambaは線形複雑性アルゴリズムを採用し、グローバルなモデリング能力を示しながら計算コストを大幅に削減する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:45:35 GMT)
SHuBERT: Self-Supervised Sign Language Representation Learning via Multi-Stream Cluster Prediction [65.2] 本稿では,ASL(American Sign Language)ビデオコンテンツから強い表現を学習する自己教師型トランスフォーマーエンコーダSHuBERTを紹介する。
HuBERT音声表現モデルの成功に触発されて、SHuBERTはマルチストリーム視覚手話入力にマスク付き予測を適用する。
SHuBERTは、複数のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:13:08 GMT)
Multi-modal Retrieval Augmented Multi-modal Generation: A Benchmark, Evaluate Metrics and Strong Baselines [63.4] 本稿では,マルチモーダル検索拡張マルチモーダル生成(M$2$RAG)の興味深い課題について検討する。
このタスクでは,複数モーダルなWebページを閲覧し,テキストと画像が混在し,ユーザクエリを解決するためのマルチモーダルな応答を生成するための基礎モデルが必要である。
我々は,M$2$RAGタスクのベンチマークを構築し,既存の基礎モデルの能力を分析するために,テキストモーダルメトリクスとマルチモーダルメトリクスのセットを備える。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:20:19 GMT)
RoboSense: Large-scale Dataset and Benchmark for Egocentric Robot Perception and Navigation in Crowded and Unstructured Environments [62.6] 我々は3種類のセンサー(Camera, LiDAR, Fisheye)をベースとした自我中心型マルチセンサデータ収集プラットフォームを構築した。
大規模なマルチモーダルデータセットであるRoboSenseは、エゴセントリックなロボット知覚を促進するために構築されている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:24:48 GMT)
AI-Generated Image Quality Assessment Based on Task-Specific Prompt and Multi-Granularity Similarity [62.0] 本稿では,TSP-MGSというAIGIの品質評価手法を提案する。
タスク固有のプロンプトを設計し、AIGIとプロンプトの多粒度類似度を測定する。
一般的に使用されるAGIQA-1KとAGIQA-3Kベンチマークの実験は、提案されたTSP-MGSの優位性を示している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:47:53 GMT)
SlimLM: An Efficient Small Language Model for On-Device Document Assistance [61.0] SlimLMはモバイル端末上での文書支援タスクに最適化された一連のSLMである。
SlimLMはSlimPajama-627Bで事前訓練され、DocAssistで微調整されている。
我々はSlimLMを既存のSLMと比較し、同等または優れた性能を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:19:16 GMT)
DreamRunner: Fine-Grained Storytelling Video Generation with Retrieval-Augmented Motion Adaptation [60.1] ストーリーテリングビデオ生成(SVG)は、最近、長いマルチモーションのマルチシーンビデオを作成するタスクとして登場した。
本研究では,新しいストーリー・ツー・ビデオ生成手法であるDreamRunnerを提案する。
文字の整合性、テキストアライメント、スムーズな遷移における最先端性能を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:41:56 GMT)
Generating Out-Of-Distribution Scenarios Using Language Models [58.5] 大規模言語モデル(LLM)は自動運転において有望であることを示している。
本稿では,多様なOF-Distribution(OOD)駆動シナリオを生成するためのフレームワークを提案する。
我々は、広範囲なシミュレーションを通じてフレームワークを評価し、新しい"OOD-ness"メトリクスを導入する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:38:17 GMT)
NovelGS: Consistent Novel-view Denoising via Large Gaussian Reconstruction Model [57.9] NovelGSは、スパースビュー画像が与えられたガウススプラッティングの拡散モデルである。
我々は3Dガウスを生成するためにトランスフォーマーネットワークを経由する新しい視点を利用する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:57:17 GMT)
ZoomLDM: Latent Diffusion Model for multi-scale image generation [57.6] 複数のスケールで画像を生成するための拡散モデルZoomLDMを提案する。
我々のアプローチの中心は、自己教師あり学習(SSL)埋め込みを利用した、新たな拡大対応条件付け機構である。
ZoomLDMは、すべてのスケールにわたる最先端の画像生成品質を実現し、大きな画像全体のサムネイルを生成するデータスカース設定に優れています。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:39:22 GMT)
Self-Generated Critiques Boost Reward Modeling for Language Models [57.6] Critic-RMは、余分な監督なしに自己生成した批評を使って報酬モデルを改善するフレームワークである。
実験の結果、Critic-RMは標準報酬モデルやLLM審査員と比較して報酬モデリングの精度を3.7%-7.3%改善していることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:28:26 GMT)
Leverage Task Context for Object Affordance Ranking [57.6] 25の共通タスク、50k以上の画像、661k以上のオブジェクトからなる、最初の大規模タスク指向のアベイランスランキングデータセットを構築しました。
その結果,タスクコンテキストに基づくアベイランス学習のパラダイムの実現可能性と,サリエンシランキングやマルチモーダルオブジェクト検出の分野における最先端モデルよりも,我々のモデルの方が優れていることが示された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:22:33 GMT)
Robust Federated Learning Over the Air: Combating Heavy-Tailed Noise with Median Anchored Clipping [57.4] 重み付き雑音による有害な影響に対処するため,メディアアンコールド・クリッピング (MAC) と呼ばれる新しい勾配クリッピング法を提案する。
また、MAC下でのアナログオーバー・ザ・エア・フェデレーション学習によるモデルトレーニングの収束率の解析式も導出する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:51:04 GMT)
Minority-Focused Text-to-Image Generation via Prompt Optimization [57.3] 本稿では,事前訓練されたテキスト・ツー・イメージ(T2I)潜時拡散モデルを用いて,少数サンプルの生成について検討する。
所望のプロパティの出現を促進するオンラインプロンプト最適化フレームワークを開発した。
次に、このジェネリックプロンプトを、マイノリティーな特徴の生成を促進する特殊な解決器に仕立てる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:30:36 GMT)
MotionWavelet: Human Motion Prediction via Wavelet Manifold Learning [57.1] MotionWaveletは、空間周波数領域における人間の動きパターンを研究する人間の動き予測フレームワークである。
ウェーブレット拡散モデルでは、動作データにウェーブレット変換を適用することでウェーブレット多様体を学習する。
ウェーブレット空間形状誘導機構は、デノナイジングプロセスを洗練し、多様体構造との整合性を改善する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:09:19 GMT)
Human-Activity AGV Quality Assessment: A Benchmark Dataset and an Objective Evaluation Metric [56.7] 我々は人間活動型AI生成ビデオ(AGV)の先駆的な研究を行っている。
視覚的品質評価と意味歪みの同定に焦点をあてる。
我々は,人間活動AGVの質を自動解析するために,AI生成人活動ビデオ品質指標(GHVQ)という客観的評価指標を開発した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:58:43 GMT)
DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.5] 我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:09:47 GMT)
One Diffusion to Generate Them All [54.8] OneDiffusionは双方向画像合成と理解をサポートする汎用的で大規模な拡散モデルである。
テキスト、深さ、ポーズ、レイアウト、セマンティックマップなどの入力から条件生成を可能にする。
OneDiffusionは、シーケンシャルな画像入力を使用して、マルチビュー生成、カメラポーズ推定、即時パーソナライズを可能にする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:11:05 GMT)
Open-Vocabulary Octree-Graph for 3D Scene Understanding [54.1] Octree-Graphはオープンな3Dシーン理解のための新しいシーン表現である。
セマンティクスを記憶し、その形状に応じてオブジェクトの占有度を調節するアダプティブ・オクツリー構造を開発する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:14:10 GMT)
Inference-Time Policy Steering through Human Interactions [54.0] 推論中、人間はしばしばポリシー実行ループから取り除かれる。
本稿では,人間のインタラクションを活用して生成するサンプリングプロセスにバイアスを与える推論時ポリシーステアリングフレームワークを提案する。
提案手法は,アライメントと分布シフトの最良のトレードオフを実現する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:03:50 GMT)
Interpreting Object-level Foundation Models via Visual Precision Search [53.8] より少ない領域で正確な属性マップを生成する視覚的精度探索法を提案する。
本手法は,マルチモーダル融合による帰属問題を克服するために,内部モデルパラメータをバイパスする。
提案手法は,複数の評価指標にまたがる既存の手法を超越して,視覚的接地や物体検出タスクにおける障害を解釈することができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:54:54 GMT)
VitaGlyph: Vitalizing Artistic Typography with Flexible Dual-branch Diffusion Models [53.6] 柔軟な芸術的タイポグラフィーを実現するために,二枝・無訓練の手法であるVitaGlyphを導入する。
VitaGlyphは入力文字を被写体と周囲からなるシーンとして扱い、次に幾何変換の度合いでそれらをレンダリングする。
実験結果から、VitaGlyphは芸術性や可読性の向上だけでなく、複数のカスタマイズ概念を表現できることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:46:45 GMT)
Reconstructing Hand-Held Objects in 3D from Images and Videos [53.3] モノクローナルなRGB映像が与えられると、時間とともに手持ちの物体の幾何学を3Dで再構築することを目指している。
1枚のRGB画像から手と物体の形状を共同で再構成するMCC-Hand-Object(MCC-HO)を提案する。
次に、GPT-4(V)を用いてテキストから3D生成モデルを作成し、画像中のオブジェクトにマッチする3Dオブジェクトモデルを検索する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:58:07 GMT)
SALOVA: Segment-Augmented Long Video Assistant for Targeted Retrieval and Routing in Long-Form Video Analysis [52.1] 本稿では,SALOVA: Segment-Augmented Video Assistantを紹介する。
87.8Kビデオの高品質なコレクションをセグメントレベルで高密度にキャプションし、シーンの連続性を捕捉し、リッチなコンテキストを維持する。
本フレームワークは,クエリに応答して,関連ビデオセグメントの正確な識別と検索を可能にすることで,現在のビデオLMMの限界を緩和する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:04:47 GMT)
WTDUN: Wavelet Tree-Structured Sampling and Deep Unfolding Network for Image Compressed Sensing [51.9] マルチスケールウェーブレットサブバンド上で直接動作するWTDUNという新しいウェーブレットドメインの深層展開フレームワークを提案する。
本手法は,ウェーブレット係数の固有間隔とマルチスケール構造を利用して,木構造によるサンプリングと再構成を実現する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:31:03 GMT)
Can Encrypted Images Still Train Neural Networks? Investigating Image Information and Random Vortex Transformation [51.5] 画像変換時の情報内容の変化を評価するために,画像情報量を測定する新しい枠組みを構築した。
また,Random Vortex Transformationと呼ばれる新しい画像暗号化アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:14:53 GMT)
Monocular Lane Detection Based on Deep Learning: A Survey [51.2] 車線検出は自律運転認識システムにおいて重要な役割を果たす。
ディープラーニングアルゴリズムが普及するにつれて、ディープラーニングに基づく単眼車線検出手法が優れた性能を示した。
本稿では, 成熟度の高い2次元車線検出手法と開発途上国の3次元車線検出技術の両方を網羅して, 既存手法の概要を概説する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:09:43 GMT)
Event-boosted Deformable 3D Gaussians for Fast Dynamic Scene Reconstruction [50.9] 3D Gaussian Splatting (3D-GS) はリアルタイムレンダリングを実現するが、RGBカメラの低時間分解能のため高速動作に苦慮している。
本稿では,高時間分解能連続運動データをキャプチャするイベントカメラと,高速な動的シーン再構成のための変形可能な3D-GSを組み合わせた最初のアプローチを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:23:38 GMT)
Exploring the Generalization Capabilities of AID-based Bi-level Optimization [50.3] 本稿では, 近似暗黙差分法 (AID) と反復差分法 (D) の2種類の二段階最適化手法を提案する。
AIDベースのメソッドは容易に変換できないが、2レベル構造に留まる必要がある。
実世界のタスクにおけるこれらの手法の有効性と応用の可能性を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:22:17 GMT)
A Survey of Stance Detection on Social Media: New Directions and Perspectives [50.3] 姿勢検出は 感情コンピューティングにおける 重要なサブフィールドとして現れました
近年は、効果的な姿勢検出手法の開発に対する研究の関心が高まっている。
本稿では,ソーシャルメディア上での姿勢検出手法に関する包括的調査を行う。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:05:39 GMT)
The formation of Schrodinger cat-like states in the process of spontaneous parametric down-conversion [50.2] 自然パラメトリックダウンコンバージョン(SPDC)過程におけるSchrodinger catlike state(Ss)の形成について述べる。
初めて、非散逸的および散逸的体制下での基本モードおよび第二調和モードにおけるSsの形成を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:47:46 GMT)
Parallelizing Linear Transformers with the Delta Rule over Sequence Length [49.9] この研究は、デルタ則で線形変圧器を訓練するためのハードウェア効率の良いアルゴリズムについて述べる。
我々は100Bトークンに対して1.3Bモデルをトレーニングし、最近の線形時間ベースラインよりも優れていることを発見した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:36:01 GMT)
Quantum information scrambling in adiabatically-driven critical systems [49.2] 量子情報スクランブル(quantum information scrambling)とは、量子多体系の多くの自由度に初期記憶された情報の拡散を指す。
ここでは、量子情報スクランブルの概念を、断熱進化中の臨界量子多体系に拡張する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:09:34 GMT)
Towards an Information Theoretic Framework of Context-Based Offline Meta-Reinforcement Learning [48.8] 我々は,COMRLアルゴリズムが,タスク変数$M$と,その潜在表現$Z$の相互情報目的を,様々な近似境界を実装して最適化していることを示す。
本研究は,COMRL法の情報理論基盤を構築し,強化学習の文脈におけるタスク表現学習の理解を深める。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:32:49 GMT)
No Identity, no problem: Motion through detection for people tracking [48.7] 本稿では,検出のみの監視を行いながら,動きの手がかりを利用する手法を提案する。
提案アルゴリズムは,2つの画像間の2次元運動推定とともに,2つの異なるタイミングで熱マップを検出する。
提案手法は,MOT17およびWILDTRACKデータセット上でのマルチターゲット・シングルビュー・マルチターゲット・トラッキングに対して,最先端の結果を提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:13:17 GMT)
Adapter-based Approaches to Knowledge-enhanced Language Models -- A Survey [48.5] 知識強化言語モデル(KELM)は、大規模言語モデルとドメイン固有の知識のギャップを埋めるための有望なツールとして登場した。
KELMsは知識グラフ(KGs)を利用することで、より現実的な精度と幻覚を達成することができる
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:10:24 GMT)
Downlink MIMO Channel Estimation from Bits: Recoverability and Algorithm [47.7] 主な課題は、ユーザ機器(UE)からの限られたフィードバックから基地局(BS)のダウンリンクチャネル状態情報(CSI)を取得することである。
本稿では、UE側で圧縮とガウスディザリングに基づく量子化戦略を採用し、BS側で最大極大推定器(MLE)を定式化する単純なフィードバックフレームワークを提案する。
このアルゴリズムは、高次高調波探索(HR)ソルバをサブルーチンとして統合するために慎重に設計されており、この難しいMLE問題に効果的に取り組む鍵であることが判明した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 02:15:01 GMT)
EAIRiskBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents [47.7] EAI(Embodied AI)は、高度なAIモデルを現実世界のインタラクションのための物理的なエンティティに統合する。
高レベルのタスク計画のためのEAIエージェントの"脳"としてのファンデーションモデルは、有望な結果を示している。
しかし、これらのエージェントの物理的環境への展開は、重大な安全性上の課題を呈している。
EAIRiskBenchは、EAIシナリオにおける自動物理的リスクアセスメントのための新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:18:01 GMT)
TIFeD: a Tiny Integer-based Federated learning algorithm with Direct feedback alignment [47.4] リソース制約のあるデバイス上でのトレーニングマシンとディープラーニングモデルは、小さな機械学習分野における次の課題である。
提案したアルゴリズムは、完全なネットワークと単一層実装を備え、科学界でパブリックリポジトリとして利用可能である。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:44:26 GMT)
Local Bayesian Optimization for Controller Tuning with Crash Constraints [47.3] 我々は最近提案されたBOの局所変種をクラッシュ制約を含むように拡張し、制御器は未知の既知領域でしか評価できないようにした。
本研究は,制御性能の向上とチューニングに必要な時間と資源の削減を目的としたローカルBOの可能性を示すものである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:37:48 GMT)
Fast and Efficient: Mask Neural Fields for 3D Scene Segmentation [47.1] 本稿では,新しい視点から3次元オープン語彙セグメンテーションを実現するMaskFieldを提案する。
MaskFieldは、マスクの特徴フィールドとクエリを定式化することによって、基礎モデルからマスクと意味的特徴の蒸留を分解する。
実験の結果,MaskFieldは従来の最先端手法を超越するだけでなく,極めて高速な収束を実現することがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:15:56 GMT)
A Unified Framework for Center-based Clustering of Distributed Data [46.9] 我々は、ユーザのネットワーク上で動作する分散センターベースのクラスタリングアルゴリズムのファミリーを開発する。
私たちのフレームワークは、$K$-meansやHuber Losといった一般的なクラスタリング損失を含む、スムーズな凸損失関数の幅広いクラスを可能にします。
ブレグマン損失の特別の場合、固定点がロイド点の集合に収束することを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:47:57 GMT)
Concept Drift Adaptation in Text Stream Mining Settings: A Systematic Review [46.5] 本研究では,テキストストリームシナリオにおけるコンセプトドリフト適応に関する体系的な文献レビューを行う。
2018年から2024年8月にかけて,テキストドリフトカテゴリ,検出タイプ,モデル更新機構,ストリームマイニングタスクの対応,テキスト表現方法とその更新メカニズムなどの未解決の側面について,48の論文を選定した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:38:48 GMT)
VIRES: Video Instance Repainting with Sketch and Text Guidance [46.2] VIRESは、スケッチとテキストガイダンスを備えたビデオインスタンス再描画方法である。
本稿では,自己スケーリングを標準化したSequential ControlNetを提案する。
スケッチ対応エンコーダは、再塗装された結果が提供されるスケッチシーケンスに一致していることを保証する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:55:41 GMT)
Controllable Human Image Generation with Personalized Multi-Garments [46.0] BootCompは、テキストから画像への拡散モデルに基づく新しいフレームワークである。
本研究では,ヒトとマルチガーメントのペアからなる大規模な合成データセットを構築するためのデータ生成パイプラインを提案する。
ファッションドメインにおいて、異なるタイプの参照ベース生成に適応することで、フレームワークの幅広い適用性を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:37:13 GMT)
FATH: Authentication-based Test-time Defense against Indirect Prompt Injection Attacks [45.7] 大規模言語モデル(LLM)は、現実世界のアプリケーションのための追加ツールとテキスト情報を備えたバックボーンとして広くデプロイされている。
プロンプトインジェクション攻撃は特に脅威であり、外部のテキスト情報に悪意のあるインストラクションを注入することで、LLMを利用して攻撃者が望む答えを生成することができる。
本稿では,AuThentication with Hash-based tags (FATH)という新しいテストタイム防衛戦略を紹介する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:37:40 GMT)
Discrete to Continuous: Generating Smooth Transition Poses from Sign Language Observation [45.2] 本研究では,文脈的に滑らかな遷移フレームを合成するための条件拡散モデルを提案する。
本手法は,遷移フレーム生成の教師なし問題を教師なし学習タスクに変換する。
PHO14TENIX, USTC-CSL100, USTC-500データセットを用いた実験により, 本手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:06:49 GMT)
StepTool: A Step-grained Reinforcement Learning Framework for Tool Learning in LLMs [44.9] 我々は,大規模言語モデルにおけるツール学習を改善するための,段階的な強化学習フレームワークであるStepToolを紹介する。
StepToolは、既存のメソッドを多段階のツールベースのタスクで大幅に上回っている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:38:49 GMT)
GEMeX: A Large-Scale, Groundable, and Explainable Medical VQA Benchmark for Chest X-ray Diagnosis [44.8] 胸部X線診断 (GEMeX) のための大規模, 接地可能, 説明可能な医療用VQAベンチマークを導入する。
マルチモーダルな説明可能性メカニズムは、質問対ごとに詳細な視覚的およびテキスト的説明を提供する。
4つの異なる質問タイプ、オープンエンド、クローズドエンド、シングルチョイス、マルチチョイスは、多様な臨床ニーズを反映している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:36:46 GMT)
DetailGen3D: Generative 3D Geometry Enhancement via Data-Dependent Flow [44.7] DetailGen3Dは、生成された3D形状を強化するために特別に設計されたジェネレーティブなアプローチである。
我々の重要な洞察は、潜在空間におけるデータ依存フローを通して、粗大から細小への変換を直接モデル化することである。
改質時に正確な空間対応を確保するためのトークンマッチング戦略を導入する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:08:17 GMT)
SMGDiff: Soccer Motion Generation using diffusion probabilistic models [44.5] サッカーは世界的に有名なスポーツであり、ビデオゲームやVR/ARで重要な応用がある。
本稿では,リアルタイムかつユーザ制御可能なサッカー動作を生成するための新しい2段階フレームワークであるSMGDiffを紹介する。
我々のキーとなる考え方は、リアルタイムキャラクタ制御を強力な拡散ベース生成モデルと統合し、高品質で多様な出力運動を保証することである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:25:53 GMT)
MMDS: A Multimodal Medical Diagnosis System Integrating Image Analysis and Knowledge-based Departmental Consultation [44.2] MMDSは、医療画像や患者の顔の詳細を認識できるシステムである。
第1の構成要素は、医療画像とビデオの分析である。
第2の要素は、専門的な医療反応の生成である。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:48:23 GMT)
Augmenting Multimodal LLMs with Self-Reflective Tokens for Knowledge-based Visual Question Answering [44.0] 本稿では,外部知識ソースを統合することでMLLMの適応性を高める新しい手法を提案する。
提案するモデルであるReflectiVA(ReflectiVA)では,反射トークンを用いて外部知識の必要性を動的に判定する。
これにより、MLLMは外部知識が不要なタスクにおいて、レイテンシとパフォーマンスを保ちながら、外部知識を管理することができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:01:03 GMT)
Towards Precise Scaling Laws for Video Diffusion Transformers [43.7] ビデオ拡散変換器のスケーリング法則を解析し,任意のモデルサイズと計算予算に対して新しいスケーリング法則を提案する。
これらの最適設定の下では、従来のスケーリング手法と比較して、同等のパフォーマンスを実現し、推論コストを40.1%削減する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:59:04 GMT)
Sonic: Shifting Focus to Global Audio Perception in Portrait Animation [43.6] 発話顔生成の研究は、主に、顔の動きを同期させ、視覚的に魅力的で時間的に整合したアニメーションを作るという複雑さを探求する。
我々は,グローバルな音声知識を活用し,全体的な知覚を高めるために,Sonicと呼ばれる新しいパラダイムを提案する。
映像品質、時間的整合性、唇の同期精度、動きの多様性の点で、新しいオーディオ駆動のパラダイムが既存のSOTA手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:24:52 GMT)
Quantum algorithms for calculating determinant and inverse of matrix and solving linear algebraic systems [43.5] そこで本稿では,行列式と逆行列の行列式(N-1)を計算するための量子アルゴリズムを提案する。
基本的な考え方は、行列の各行を量子系の純粋な状態にエンコードすることである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:51:03 GMT)
CATP-LLM: Empowering Large Language Models for Cost-Aware Tool Planning [43.1] コスト対応ツール計画のためのLCM(CATP-LLM)フレームワークを提案する。
LLMは、効率的な並行ツールの実行とコスト削減のために、複数のブランチの非逐次計画を生成するために、LLMを強化するためのツール計画言語を組み込んでいる。
また、コスト対応計画評価のための最初のプラットフォームであるOpenCATPについても紹介する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:05:49 GMT)
Graph Transformer Networks for Accurate Band Structure Prediction: An End-to-End Approach [43.0] 本稿では,結晶構造からのバンド構造を直接高精度に予測するグラフトランスフォーマーに基づくエンドツーエンドアプローチを提案する。
本モデルでは, バンド構造予測だけでなく, バンドギャップ, バンド中心, バンド分散などの特性を高精度に導出できることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:22:03 GMT)
Reconstructing Satellites in 3D from Amateur Telescope Images [42.9] 本稿では、小型アマチュア望遠鏡で撮影した映像を利用して、低地球軌道上の衛星の3次元再構成のための枠組みを提案する。
これらの望遠鏡から得られたビデオデータは、激しい動きのぼかし、大気の乱流、広汎な背景光汚染、焦点距離の延長、観測視点の制約など、標準的な3D再構成作業のデータと大きく異なる。
本研究では,高忠実度3次元モデル再構成を実現するために,SfM(Structure from Motion)アプローチと改良された3次元ガウススプレイティングアルゴリズムを適用した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:47:46 GMT)
CliMB: An AI-enabled Partner for Clinical Predictive Modeling [42.3] CliMBは、臨床科学者が自然言語を使って予測モデルを作成できるように設計された、コードなしAI対応のパートナーである。
CliMBは、医療データ科学のパイプライン全体を通して臨床科学者をガイドする。
CliMBは、計画、エラー防止、コード実行、モデルパフォーマンスといった重要な領域において、一貫して優れたパフォーマンスを示した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:21:05 GMT)
BayLing 2: A Multilingual Large Language Model with Efficient Language Alignment [42.2] 本稿では,ハイソース言語から低ソース言語へ効率的に生成能力と知識を伝達するBayLing 2を紹介する。
100以上の言語にまたがる多言語翻訳では、BayLingは同様のスケールのオープンソースモデルよりも優れたパフォーマンスを示している。
BayLingのデモ、ホームページ、コード、モデルが利用可能だ。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:35:08 GMT)
Three perspectives on entropy dynamics in a non-Hermitian two-state system [41.9] 利得と損失のバランスが取れたオープンな2状態系における物理挙動の指標としてのエントロピーダイナミクスが提示される。
我々は,従来のHermitian-adjoint状態の枠組みを利用する際の視点を,biorthogonal-adjoint状態に基づくアプローチ,およびアイソスペクトルマッピングに基づく第3のケースと区別する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:39:19 GMT)
Curvature in the Looking-Glass: Optimal Methods to Exploit Curvature of Expectation in the Loss Landscape [41.9] 我々は,多くの整列線形単位を持つアーキテクチャにおいて,期待される損失変化の曲率がどのように現れるかを理解するための新しい概念的枠組みを提案する。
我々の導出は、これらの不連続性がどのようにガラスのような構造を形成するかを示しており、これは強いがランダムな原子配列の微視的な領域を含む非晶質固体と類似している。
ガラスとヘッセンの項とネステロフ加速勾配更新で可能な特定の精度特性を組み込んだ準ニュートンステップの最適修正を導出する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:32:57 GMT)
Assessing non-Gaussian quantum state conversion with the stellar rank [41.9] 状態変換は量子情報処理における基本的なタスクである。
本稿では,ガウス状態変換を近似的に評価するためのフレームワークを提案する。
近似的条件と確率的条件の両方の下でガウス状態変換のバウンダリを導出する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:59:05 GMT)
LDACP: Long-Delayed Ad Conversions Prediction Model for Bidding Strategy [41.5] オンライン広告において、広告キャンペーンが展開されると、自動入札システムは、広告変換数に基づいて入札戦略を動的に調整し、コストパーアクション(CPA)を最適化する。
長い変換遅延のある広告では、入札戦略の信号としてリアルタイム追跡変換番号のみに依存することで、現在のCPAを著しく過大評価することができる。
本稿では,2つのサブモジュールからなる入札戦略 (LDACP) のための長遅延広告変換予測モデルを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:07:00 GMT)
Boundaries for quantum advantage with single photons and loop-based time-bin interferometers [40.9] ループベースのボソンサンプリング器は、一連の遅延線を用いて自由度で光子を干渉する。
本稿では,このループ構造を利用してより効率的なシミュレーションを行う手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:13:20 GMT)
Transformers Provably Solve Parity Efficiently with Chain of Thought [40.8] この研究は、複雑な問題を解決するためのトレーニングトランスの最初の理論的解析を提供する。
我々は、基本的な$k$-parity問題を解くために、1層トランスを訓練することを検討する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:39:51 GMT)
Visual Riddles: a Commonsense and World Knowledge Challenge for Large Vision and Language Models [40.4] このベンチマークは、常識と世界知識を必要とする視覚的謎の視覚モデルと言語モデルをテストすることを目的としたものだ。
ベンチマークは400個のビジュアル・ライドルで構成されており、それぞれが様々なテキスト・ツー・イメージ・モデルによって生成されるユニークなイメージを特徴としている。
Gemini-Pro-1.5は40%の精度で、既存のモデルは82%の精度で人間のパフォーマンスにかなり遅れている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:53:44 GMT)
Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions [40.2] Marco-o1は数学、物理学、コーディングなどの標準解を持つ分野に焦点を当てている。
我々は「o1モデルは、明確な標準が欠落し、報酬が定量化が難しい広い領域に効果的に一般化する」という問題に対処することを目指している。
Marco-o1は、Chain-of-Thoughtファインチューニング、Monte Carlo Tree Search (MCTS)、リフレクションメカニズム、革新的な推論戦略によって実現されている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:57:55 GMT)
Characterizing the Fragmentation of the Social Media Ecosystem [39.6] 私たちは9つのソーシャルメディアプラットフォーム上で600万人近いユーザーが投稿した1260万のURLのデータセットを使用しています。
メインストリームとAlt-techプラットフォームの間には明確な分離がある。
これらの知見は、ソーシャルメディアエコシステムの断片化と分極を定義する主要な側面を概説している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:45:03 GMT)
AtomR: Atomic Operator-Empowered Large Language Models for Heterogeneous Knowledge Reasoning [38.7] AtomRは、新しい異種知識推論フレームワークである。
複雑な問題を3つの原子知識演算子の組み合わせに分解する。
AtomRは3つの単一ソースと2つのマルチソース推論ベンチマークで最先端のベースラインを大幅に上回る。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:35:51 GMT)
Semantic Capability Model for the Simulation of Manufacturing Processes [38.7] シミュレーションは製造工程の検査の機会を提供する。
異なるシミュレーションの組み合わせは、あるシミュレーションの出力が別のシミュレーションの入力パラメータとして機能し、結果として一連のシミュレーションとなるときに必要である。
シミュレーション、特定の知識を生成する能力、それぞれの品質基準を表現した情報モデルが導入された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:53:56 GMT)
Machine learning for cerebral blood vessels' malformations [38.5] 脳動脈瘤と動静脈奇形は、生命を脅かす脳の血行動態である。
脳血流のパラメータは、リスクアセスメントと治療予後のための機械学習支援プロトコルに利用できる可能性がある。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:58:00 GMT)
Towards Foundation Models for Critical Care Time Series [38.1] 本稿では,コア処理変数を含む最初の大規模コレクションとして,シーケンスモデリングと転送学習研究のための調和データセットを提案する。
将来的には、このデータセットを拡張して、トランスファーラーニングのさらなる進歩と、重要な医療アプリケーションのためのスケーラブルで汎用的なモデルの開発をサポートする予定だ。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:49:55 GMT)
Scaling Laws for Black box Adversarial Attacks [37.7] 敵の例では、クロスモデル転送可能性を示し、ブラックボックスモデルを攻撃することができる。
モデルアンサンブルは、複数のサロゲートモデルを同時に攻撃することで、転送可能性を改善する効果的な戦略である。
スケールされた攻撃はセマンティクスにおいてより良い解釈可能性をもたらし、モデルの共通の特徴がキャプチャーされることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:14:37 GMT)
Deployment of ARX Models for Thermal Forecasting in Power Electronics Boards Using WBG Semiconductors [37.7] ARXパラメトリックモデルは、成分の厚さの相違や物質物性の詳細な理解なしに正確な温度予測を提供する。
これらのモデルは、FEMシミュレーションや従来の熱モデルに代わる信頼性の高い代替品として出現する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:01:17 GMT)
Factorized Visual Tokenization and Generation [37.6] 本稿では,大規模なコードブックを複数の独立したサブコードブックに分解することで,VQベースのトークン化を活性化する新しい手法であるFacterized Quantization(FQ)を紹介する。
このファクター化は、大規模なコードブックのルックアップの複雑さを低減し、より効率的でスケーラブルなビジュアルトークン化を可能にします。
実験により,提案したFQGANモデルにより,視覚トークンの再現品質が大幅に向上し,最先端の性能が達成された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:59:53 GMT)
High-Resolution Be Aware! Improving the Self-Supervised Real-World Super-Resolution [37.5] 地平線画像は現実の環境では利用できないため、自己教師型学習は超高解像度には不可欠である。
既存の方法は、擬似ペアを作成したり、低分解能再構成目標を強制することによって、低分解能画像から自己監督を導出する。
本稿では,高解像度画像の認識を強化し,自己監督された現実世界の超解像を改善する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:13:32 GMT)
Efficient Video Face Enhancement with Enhanced Spatial-Temporal Consistency [36.9] 本研究では,新規で効率的なブラインド・ビデオ・フェース・エンハンスメント法を提案する。
圧縮された低品質バージョンから、効率的なデフリック機構で高品質の動画を復元する。
VFHQ-Testデータセットで行った実験は、我々の手法が現在の最先端のブラインド・フェイス・ビデオの復元と、効率と有効性の両面での解フリック法を超越していることを示している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:14:36 GMT)
LLaVA-CoT: Let Vision Language Models Reason Step-by-Step [36.0] LLaVA-CoTは、自律的な多段階推論を実現するために設計された新しいVLMである。
チェーン・オブ・シークレットのプロンプトとは異なり、LLaVA-CoTは独立に要約、視覚的解釈、論理的推論、結論生成の逐次的な段階に関与する。
100kのトレーニングサンプルと単純な推論時間スケーリング手法により、LLaVA-CoTはベースモデルよりも8.9%性能が向上する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:42:20 GMT)
Enhancing Few-Shot Learning with Integrated Data and GAN Model Approaches [35.4] 本稿では,データ拡張とモデルファインチューニングを融合することで,少数ショット学習を向上するための革新的なアプローチを提案する。
薬物発見、ターゲット認識、悪意のあるトラフィック検出などの分野で、小さなサンプルデータによって引き起こされる課題に対処することを目的としている。
その結果,本研究で開発されたMhERGANアルゴリズムは,数発の学習に極めて有効であることが確認された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:51:11 GMT)
Cavity-Quantum Electrodynamics with Moiré Flatband Photonic Crystals [35.1] 量子ドットは、42 psから1692 psまでの40の因子で調整できるが、これは強いパーセルの増強とパーセルの阻害効果に起因する。
我々の発見は、量子インターネットアプリケーションのための量子光源、量子光スイッチ、量子ノードのムーアのフラットバンド化への道を開いた。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:52:11 GMT)
VidComposition: Can MLLMs Analyze Compositions in Compiled Videos? [35.1] VidCompositionは、マルチモーダル大言語モデル(MLLM)の映像合成理解能力を評価するためのベンチマークである。
これには、カメラの動き、アングル、ショットサイズ、物語構造、キャラクターの動作、感情など、様々な構成的な側面をカバーしている。
33個のオープンソースおよびプロプライエタリなMLLMを総合的に評価した結果,人的・モデル的能力の差は顕著であった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:12:24 GMT)
TopV-Nav: Unlocking the Top-View Spatial Reasoning Potential of MLLM for Zero-shot Object Navigation [34.9] MLLMをベースとしたTopV-Navを提案する。
MLLMの空間推論能力をトップビューで完全に解き放つために,適応型視覚プロンプト生成法(AVPG)を提案する。
また,動的マップスケーリング(DMS)機構を設計し,好みのスケールで動的にトップビューマップをズームする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:27:55 GMT)
Unlocking the Potential of Text-to-Image Diffusion with PAC-Bayesian Theory [33.8] テキスト・ツー・イメージ(T2I)拡散モデルは、高忠実で多彩で視覚的にリアルな画像を生成することによって、生成モデルに革命をもたらした。
最近の注目度に基づく手法は、オブジェクトの包摂性や言語的バインディングを改善してきたが、それでも属性のミスバインディングのような課題に直面している。
そこで,ベイズ的手法を用いて,所望のプロパティを強制するために,注意分布を優先したカスタムプライドを設計する手法を提案する。
本手法では,アテンション機構を解釈可能なコンポーネントとして扱い,微粒化制御と属性オブジェクトアライメントの改善を実現している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:57:48 GMT)
ZoomEye: Enhancing Multimodal LLMs with Human-Like Zooming Capabilities through Tree-Based Image Exploration [33.7] Zoom Eyeはイメージをツリーとして概念化し、各子ノードは親ノードのズームしたサブパッチを表し、ルートは全体イメージを表す。
例えば,LLaVA-v1.5-7Bは$V*$ Benchで34.57%増加し,HR-Benchで17.88%上昇する)。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 02:15:30 GMT)
A Survey of Deep Learning Library Testing Methods [33.6] ディープラーニング(DL)ライブラリは、基礎となる最適化と計算を行う。
DLライブラリはバグに免疫がなく、ユーザの個人資産や安全性に深刻な脅威をもたらす可能性がある。
本稿では,各種DLライブラリに関する試験研究の概要について述べる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:51:06 GMT)
VideoOrion: Tokenizing Object Dynamics in Videos [33.3] ビデオ内のキーセマンティック情報を明示的にキャプチャするビデオ大言語モデル(Video Large Language Model: Video-LLM)を提案する。
VideoOrionでは、専門的なビジョンモデルを使用して、検出-セグメンション-トラックパイプラインを通じてオブジェクトのダイナミクスを抽出する。
本手法は,高次元映像データをセマンティックトークンに効率よく圧縮するビデオLLMにおける永続的課題に対処する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:32:02 GMT)
VisualLens: Personalization through Visual History [32.9] 画像表現を抽出し,フィルタし,洗練し,パーソナライズするためにこれらの信号を利用する新しいアプローチであるVisualLensを提案する。
私たちのアプローチは、従来のメソッドが失敗するシナリオにおいて、パーソナライズされたレコメンデーションの道を開くものです。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:45:42 GMT)
RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations [32.8] 本稿では,模倣学習のためのデータ強化手法であるRoCoDAを紹介する。
我々は5つのロボット操作タスクに関する広範な実験を通じてRoCoDAを検証する。
我々の政策は、目に見えない物体のポーズ、テクスチャ、および邪魔者の存在に対する堅牢な一般化を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:57:15 GMT)
Boosting 3D Object Generation through PBR Materials [32.7] 物理ベースレンダリング(PBR)材料の観点から,生成した3Dオブジェクトの品質を高める新しい手法を提案する。
アルベドやバンプマップでは、合成データに微調整された安定拡散を利用してこれらの値を抽出する。
粗さと金属度マップについては,対話的な調整を行うためのセミオートマチックなプロセスを採用する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:20:52 GMT)
From Generation to Judgment: Opportunities and Challenges of LLM-as-a-judge [32.6] 人工知能(AI)と自然言語処理(NLP)において、長い間、評価と評価が重要な課題であった。
大規模言語モデル(LLM)の最近の進歩は"LLM-as-a-judge"パラダイムを刺激している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:28:44 GMT)
SADA: Semantic adversarial unsupervised domain adaptation for Temporal Action Localization [32.4] 本稿では,Sparse TAL における Unsupervised Domain Adaptation のアプローチを初めて紹介する。
我々は、現実的なスパース動作検出ベンチマークで動作するドメイン適応モデルの開発を開拓した。
EpicKitchens100とCharadesEgoをベースとした,複数のドメインシフトを評価する新しいベンチマークセットを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:38:52 GMT)
DriveDreamer4D: World Models Are Effective Data Machines for 4D Driving Scene Representation [32.2] 本稿では,世界モデルの先行モデルを利用した4次元運転シーン表現を強化するDriveDreamer4Dを紹介する。
われわれの知る限り、DriveDreamer4Dは、運転シナリオにおける4D再構成を改善するためにビデオ生成モデルを利用する最初の企業である。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:02:47 GMT)
One is Plenty: A Polymorphic Feature Interpreter for Immutable Heterogeneous Collaborative Perception [32.2] 自律運転における協調的知覚は、個々のエージェントの知覚能力を著しく向上させる。
既存のほとんどのメソッドはインタプリタを通してセマンティックギャップをブリッジする。
ポリモーフィック機能インタプリタであるPolyInterを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:47:26 GMT)
On Expressive Power of Looped Transformers: Theoretical Analysis and Enhancement via Timestep Encoding [32.0] ループ変換器はパラメータ効率とチューリング完全性に利点がある。
シーケンス・ツー・シーケンス関数の連続率のモジュラリティの概念を定義することでループ変換器の近似率を確立する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:17:14 GMT)
Seq2Time: Sequential Knowledge Transfer for Video LLM Temporal Grounding [31.9] ビデオ大言語モデル(LLM)は、長いビデオ内の出来事を理解し、推論するために、時間的認識が不可欠である。
データ指向のトレーニングパラダイムであるSeq2Timeを提案する。長いビデオの時間的意識を高めるために,画像と短いビデオクリップのシーケンスを活用する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:01:11 GMT)
@Bench: Benchmarking Vision-Language Models for Human-centered Assistive Technology [31.8] 視覚障害者を支援するための人間中心補助技術(AT)は、複数のタスクを同時に実行することのできるジェネラリストへと進化している。
われわれはまず、PVIsで事前設計されたユーザースタディによってガイドされた新しいATベンチマーク(@Bench)を作成する。
さらに、全てのタスクを同時に処理し、PVIを支援するためにより補助的な機能に拡張できる新しいATモデル(@Model)を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:36:32 GMT)
UniTS: A Unified Multi-Task Time Series Model [31.7] UniTSは、予測タスクと生成タスクを単一のフレームワークに統合した、統合されたマルチタスク時系列モデルである。
UniTSは、人間の活動センサー、ヘルスケア、エンジニアリング、ファイナンスにまたがる38のデータセットでテストされている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:12:55 GMT)
CLIPS: An Enhanced CLIP Framework for Learning with Synthetic Captions [31.6] リッチに記述された合成キャプションをより効果的に活用するための2つのシンプルで効果的な設計を提案する。
まず,合成キャプションを用いた学習において,強い逆効果が観察される。
第二に、自己回帰キャプタを組み込んで、再カプセル化プロセスを模倣する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:49:02 GMT)
Do Large Language Models Perform Latent Multi-Hop Reasoning without Exploiting Shortcuts? [31.1] 我々は,大規模言語モデルが最近,マルチホップクエリに答えるために事実を記憶し,構成する方法について評価する。
1つの大きな課題は、LLMが「スカーレット・ヨハンソン」(Scarlett Johansson)と「合衆国」(United States)との遭遇によってショートカットを開発した可能性があることである。
我々は,LLMがショートカットを活用せずに,有望なマルチホップ推論能力を示すことを観察した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:59:30 GMT)
R2I-rPPG: A Robust Region of Interest Selection Method for Remote Photoplethysmography to Extract Heart Rate [31.0] 新型コロナウイルス(COVID-19)のパンデミックは、接触のないバイタルサインを測定するための低コストでスケーラブルなアプローチの必要性を強調している。
遠隔検診(remote photoplethymography, R)は、健康なボランティアのクローズアップビデオに適用した場合の心拍数(HR)を正確に推定することができる。
医療におけるrの実践的応用における重要な障壁の1つは、関心領域の正確な局在である。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:01:15 GMT)
O1 Replication Journey -- Part 2: Surpassing O1-preview through Simple Distillation, Big Progress or Bitter Lesson? [30.9] 本稿では,OpenAIのO1モデル機能を複製する現在のアプローチについて,批判的な考察を行う。
O1のAPIからの単純な蒸留と教師付き微調整を組み合わせることで、複雑な数学的推論タスクにおいて優れた性能が得られることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:31:27 GMT)
Human Motion Instruction Tuning [30.7] 本稿では,人間の動作指導のためのフレームワークであるLLaMoについて述べる。
LLaMoは、命令チューニングのためのネイティブフォームで動作を保持します。
ビデオデータとモーションデータをテキスト入力と共に処理することで、LLaMoは柔軟な人間中心の分析を可能にする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:38:43 GMT)
Med-PerSAM: One-Shot Visual Prompt Tuning for Personalized Segment Anything Model in Medical Domain [30.7] 文脈内学習に適したプロンプトを組み込んだ事前学習モデルの活用は、NLPタスクにおいて極めて効果的であることが証明されている。
textbfMed-PerSAMは,医療領域向けに設計された,新規で簡単なワンショット・フレームワークである。
本モデルは,多様な2次元医用画像データセットにおいて,基礎モデルおよび従来のSAMベースのアプローチより優れる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:16:17 GMT)
Provably Robust and Secure Steganography in Asymmetric Resource Scenario [30.1] 現在の安全なステガノグラフィーアプローチでは、プライベートメッセージの隠蔽と抽出のためにエンコーダとデコーダのペアが必要となる。
本稿では,非対称な資源設定のための確実かつセキュアなステガノグラフィーフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:43:36 GMT)
Multi-Granularity Class Prototype Topology Distillation for Class-Incremental Source-Free Unsupervised Domain Adaptation [29.6] クラスインクリメンタルソースフリーの非教師なしドメイン適応問題には2つの課題がある。
マルチグラニュラリティクラスプロトタイプトポロジー蒸留(GROTO)アルゴリズムを提案する。
提案手法は,3つの公開データセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:28:09 GMT)
Generative Omnimatte: Learning to Decompose Video into Layers [29.1] 本報告では,全方位問題に対処する新しい生成階層化ビデオ分解フレームワークを提案する。
私たちの中核となる考え方は、特定の物体によって引き起こされるシーン効果を識別し除去するために、ビデオ拡散モデルを訓練することです。
我々は,このモデルを,小さく,慎重にキュレートしたデータセットを用いて,既存のビデオインペイントモデルから微調整できることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:59:57 GMT)
Curator Attack: When Blackbox Differential Privacy Auditing Loses Its Power [28.9] 差分プライバシーのためのBlackbox監査は、その有効性と幅広いシナリオへの適用性から人気を集めている。
しかし、ブラックボックスの監査は本質的にその設定に欠陥があることがわかりました。
本研究の目的は,ブラックボックス監査ツールの限界を明らかにすること,データ所有者にこれらのツールを使用する際のリスクを認識し,より信頼性の高い差分プライバシー監査手法の開発を促すことである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:00:04 GMT)
SAR3D: Autoregressive 3D Object Generation and Understanding via Multi-scale 3D VQVAE [28.6] 本稿では,多次元ベクトル量子化変分オートエンコーダ(VQVAE)を利用して3Dオブジェクトをトークン化する新しいフレームワークであるScale AutoRegressive 3D(SAR3D)を紹介する。
次の単一トークンの代わりにマルチスケールの潜在表現で次のスケールを予測することで、SAR3Dは生成時間を著しく短縮する。
実験の結果,SAR3Dは現行の3D生成法よりも高速かつ高品質であることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:00:05 GMT)
BlendServe: Optimizing Offline Inference for Auto-regressive Large Models with Resource-aware Batching [28.1] レイテンシに敏感なアプリケーションでは、オフラインのバッチ推論が一般的になっています。
オフラインバッチ推論の資源利用を最大化するシステムであるBlendServeを提案する。
BlendServeは、広く使われている業界標準と比較して、最大で1.44倍のスループット向上を提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:24:53 GMT)
Soft-TransFormers for Continual Learning [28.0] ソフトトランスフォーマー(Soft-TF)と呼ばれる完全微調整連続学習(CL)手法を提案する。
ソフトTFは、各タスクに対して最適なソフトネットワークやサブネットワークを逐次学習し、選択する。
推定において、Soft-TFのタスク適応型ネットワークは、事前学習されたネットワークのパラメータをマスクする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:52:47 GMT)
Towards Faster Decentralized Stochastic Optimization with Communication Compression [27.5] MoTEFは,Momentum Tracking と Error Feedback との通信を統合する新しい手法である。
我々の分析は、MoTEFが所望のプロパティの大部分と、データの下でかなり既存のメソッドを統合することを実証している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:00:40 GMT)
Deformable Mamba for Wide Field of View Segmentation [27.3] 変形可能なマンバ(Deformable Mamba)は、パノラマや魚眼のセマンティックセグメンテーションの文脈における画像歪みに対処するために設計されたフレームワークである。
コアには、デフォルマブル・マンバ・フュージョン(DMF)ブロックで構築されたデコーダがあり、フレームワーク全体がより変形しやすく、効率的で、正確である。
提案手法は, 特定のFoVに適した従来の最先端手法と比較して, セグメンテーション精度を常に向上させる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:21:48 GMT)
Repository-level Code Translation Benchmark Targeting Rust [27.1] Rustをターゲットにした375のタスクからなる、最初のリポジトリレベルのコード変換ベンチマークを紹介します。
このベンチマークを用いて、4つの最先端の大規模言語モデル(LLM)について検討する。
その結果,LCMは単純なタスクに比べて,リポジトリレベルでの翻訳性能が著しく低下(41.5%-56.2% Pass@1 drop of GPT-4)していることが判明した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:57:25 GMT)
UVCG: Leveraging Temporal Consistency for Universal Video Protection [27.0] 悪意ある編集から映像コンテンツを保護するためにユニバーサルビデオ一貫性ガード(UVCG)を提案する。
UVCGは、連続的かつ知覚不能な摂動を導入することで、他のビデオのコンテンツを保護ビデオに埋め込む。
UVCGをLDM(Latent Diffusion Models)の様々なバージョンに適用し、その有効性と複数の編集パイプラインにおける一般化性を評価する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:48:54 GMT)
Spiking Transformer with Spatial-Temporal Attention [26.7] SpikeベースのTransformerは、従来のニューラルネットワーク(ANN)ベースのTransformerに代わる、魅力的でエネルギー効率のよい代替手段を提供する。
本研究では,空間的・時間的情報を自己認識機構に効率よく統合する,シンプルかつ簡単なアーキテクチャである空間時間注意型スパイキングトランスフォーマーを提案する。
アーキテクチャのオーバーホールなしに既存のスパイクベースのトランスにシームレスに統合できる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:22:40 GMT)
Dynamic Self-Distillation via Previous Mini-batches for Fine-tuning Small Language Models [26.5] 自己蒸留(SelfD)は、教師の指導なしに生徒モデルが学習できるように、推奨可能な代替手段として現れる。
我々は、前回のミニバッチ(DynSDPB)からDynamic SelfDというモデル非依存およびタスク非依存の手法を導入する。
エンコーダのみのLMとデコーダのみのLMにおいてDynSDPBの優れた性能を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:37:48 GMT)
RoboSpatial: Teaching Spatial Understanding to 2D and 3D Vision-Language Models for Robotics [26.4] 室内とテーブルトップのシーンを3Dスキャンで捉えた大規模な空間理解データセットであるRoboSpatialと,ロボット工学に関連する豊富な空間情報を付加したエゴセントリック画像を紹介する。
実験の結果,RoboSpatialで訓練したモデルは,空間的空き時間予測,空間的関係予測,ロボット操作といった下流タスクのベースラインよりも優れていた。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:21:34 GMT)
On the Reconstruction of Training Data from Group Invariant Networks [26.3] トレーニングされたニューラルネットワークからトレーニングデータを再構築することは、プライバシと説明可能性に重要な意味を持つ研究の活発な領域である。
近年の進歩は、このプロセスが複数のデータタイプに対して実現可能であることを実証している。
しかし、グループ不変のニューラルネットワークからのデータ再構成は、ほとんど探索されていない別の課題を引き起こす。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:05:00 GMT)
Binary Search with Distributional Predictions [26.2] 本研究では,予測自体が分布である分布予測を用いたアルゴリズムについて検討する。
従来の予測に基づくアルゴリズムを1つの予測で使用すると、予測が不十分な単純な分布が存在することを示す。
これはまた、二分探索木を最適に計算する古典的な問題に対する最初の分散ロバストアルゴリズムをもたらす。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:15:31 GMT)
MANO: Exploiting Matrix Norm for Unsupervised Accuracy Estimation Under Distribution Shifts [25.6] モデルのアウトプット、特にロジットを活用することは、トレーニング済みニューラルネットワークのテスト精度を、アウト・オブ・ディストリビューションのサンプルで推定する一般的なアプローチである。
実装の容易さと計算効率にもかかわらず、現在のロジットベースの手法は過信問題に弱いため、予測バイアスにつながる。
予測バイアスを低減するためにデータ依存正規化を適用したMaNoを提案し,正規化ロジットの行列の$L_p$ノルムを推定スコアとする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:00:29 GMT)
DiffDesign: Controllable Diffusion with Meta Prior for Efficient Interior Design Generation [25.5] DiffDesignは、メタプリミティブを持つ制御可能な拡散モデルであり、効率的な内部設計生成を実現する。
具体的には,画像データセット上で事前学習した2次元拡散モデルの生成先行をレンダリングバックボーンとして利用する。
さらに、外観、ポーズ、サイズといったデザイン属性を横断的に制御し、視点整合性を強制する最適な転送ベースのアライメントモジュールを導入することで、デノナイジングプロセスをガイドする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:36:34 GMT)
Emotion Granularity from Text: An Aggregate-Level Indicator of Mental Health [25.2] 心理学において、個人の感情概念を区別する能力の変化を感情の粒度と呼ぶ。
高い感情の粒度は、より良い精神と身体の健康と結びついている。
低感情の粒度は、不適応な感情制御戦略や健康状態の悪化と結びついている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:05:20 GMT)
CS-Eval: A Comprehensive Large Language Model Benchmark for CyberSecurity [25.1] CS-Evalは、サイバーセキュリティにおける大規模言語モデル(LLM)のベンチマークである。
学界から研究ホットスポットを合成し、産業から実用化する。
高品質な質問を3つの認知レベル(知識、能力、応用)に分類する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:54:42 GMT)
Gazing Into Missteps: Leveraging Eye-Gaze for Unsupervised Mistake Detection in Egocentric Videos of Skilled Human Activities [25.0] 我々は、視線信号の解析を通して、自我中心ビデオにおける教師なし誤り検出の課題に対処する。
眼球運動が被写体操作活動に密接に従うという観察に基づいて,視線信号が誤検出をどの程度支援できるかを評価する。
予測された視線軌道と観測された視線軌道の矛盾は、誤りを特定する指標として機能する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:19:38 GMT)
LIA: Privacy-Preserving Data Quality Evaluation in Federated Learning Using a Lazy Influence Approximation [24.9] フェデレートラーニング(Federated Learning)では、低品質、腐敗、悪意のあるデータを扱うことが不可欠である。
我々は「怠慢な影響」と呼ばれる新しい影響近似を利用した単純で効果的なアプローチを提案する。
提案手法は, 種々のシミュレーションおよび実世界の環境において, バイアスや破損したデータをフィルタすることに成功した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:37:20 GMT)
Beyond Sight: Towards Cognitive Alignment in LVLM via Enriched Visual Knowledge [24.5] LVLM(Large Vision-Language Models)は、学習済みのビジョンと言語コンポーネントを個別に統合する。
これらのモデルはしばしば、視覚エンコーダ(VE)と大言語モデル(LLM)の「認知的不整合」の中核的な問題に遭遇する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:33:14 GMT)
Long-Tailed Out-of-Distribution Detection via Normalized Outlier Distribution Adaptation [24.2] アウト・オブ・ディストリビューション(OOD)検出における重要な課題は、トレーニング中に接地型OODサンプルが存在しないことである。
この分散シフト問題に対処するために、正規化外乱分布適応(AdaptOD)を提案する。
AdaptODは、外れ値サンプルに基づいてバニラの外れ値分布を真のOOD分布に効果的に適応する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:14:11 GMT)
Utilizing Uncertainty in 2D Pose Detectors for Probabilistic 3D Human Mesh Recovery [23.5] 確率論的アプローチは 有望な3次元メッシュ上の分布を学習する
この目的関数だけでは、全分布を捉えるのに十分ではないことを示す。
トレーニング中,被験者のセグメンテーションマスクを利用することで,不正なサンプルの数を著しく削減できることを実証した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:13:12 GMT)
MAGiC-SLAM: Multi-Agent Gaussian Globally Consistent SLAM [23.3] 同時ローカライゼーションとマッピング(SLAM)システムは、拡張現実、ロボティクス、自律運転など、コンピュータビジョンで広く使われている。
近年の研究では、分散ニューラルシーン表現を用いてこの問題に対処している。
本稿では,厳格に変形可能な3次元ガウス型シーン表現を提案する。
合成および実世界のデータセット上でMAGiC-SLAMを評価し,その精度と精度について検討した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:34:01 GMT)
Hyperspectral and multispectral image fusion with arbitrary resolution through self-supervised representations [23.0] 本稿では,2つのニューラル表現を行列因子化に組み込むことにより,新しい連続低ランク因子化(CLoRF)を提案する。
提案手法は,行列分解による低ランク化と神経表現による連続性の両方を自己教師的手法で利用することができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:24:39 GMT)
Learning by Analogy: Enhancing Few-Shot Prompting for Math Word Problem Solving with Computational Graph-Based Retrieval [22.9] 同様に構造化された質問の類似性によって,大規模言語モデルの問題解決能力が向上することを示す。
具体的には、与えられた質問に類似した計算グラフを持つ問題の検索を頼りに、プロンプトの見本として機能する。
6つの数学単語問題データセットに対する実験結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:01:25 GMT)
Optimistic Verifiable Training by Controlling Hardware Nondeterminism [22.9] トレーニング中のGPUタイプ間の非決定性は、トレーニングプロセスの正確な複製を防ぐ。
本稿では,目標よりも高精度なトレーニング,中間計算後のラウンドリング,適応的しきい値決定に基づくラウンドリング決定の共有を併用する手法を提案する。
検証可能なトレーニング手法は,証明ベースシステムと比較して,ストレージと時間コストを著しく削減する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:13:47 GMT)
ESARM: 3D Emotional Speech-to-Animation via Reward Model from Automatically-Ranked Demonstrations [22.9] 本稿では,既存のモデルの欠点に対処する新しい3次元音声アニメーション(STA)生成フレームワークを提案する。
本稿では、報酬モデルと結合した新しいSTAモデルを紹介し、この組み合わせにより、音声条件下での感情と内容の疎結合を可能にする。
ベンチマークデータセット上で大規模な実験を行い,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:12:25 GMT)
Fancy123: One Image to High-Quality 3D Mesh Generation via Plug-and-Play Deformation [22.6] 2つの拡張モジュールと、上記の3つの問題に対処するための未投射操作を備えたFancy123を提案する。
外観強調モジュールは、2Dマルチビューイメージをリアルピクセルに変形させて、より優れたマルチビュー一貫性を実現する。
忠実度向上モジュールは、入力画像に一致するように3Dメッシュを変形させる。
入力画像と変形したマルチビュー画像をLRMの生成されたメッシュに投影することで、高い明快さが保証される。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:31:55 GMT)
Understanding Generalization of Federated Learning: the Trade-off between Model Stability and Optimization [22.6] Federated Learning(FL)は、複数のデバイスにまたがるニューラルネットワークをトレーニングする分散学習アプローチである。
FLはデータの不均一性のためにしばしば課題に直面し、クライアント間の一貫性のないローカルオプティマに繋がる。
本稿では,フェデレート最適化における第1次一般化ダイナミクス解析フレームワークを紹介する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:43:22 GMT)
BugSpotter: Automated Generation of Code Debugging Exercises [22.2] 本稿では,問題記述からバグコードを生成するツールであるBugSpotterを紹介する。
学生は失敗するテストケースを設計することでBugSpotterと対話する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:31:00 GMT)
MICAS: Multi-grained In-Context Adaptive Sampling for 3D Point Cloud Processing [22.1] ポイントクラウド処理(PCP)は、再構築、復調、登録、セグメンテーションといったタスクを含む。
In-context Learning (ICL)は、タスク固有のデモプロンプトを持つ単一のモデルを使用することで、タスク間での約束を示す。
我々は,PCPに適した多粒度適応サンプリング機構を備えた高度なICLフレームワークであるMICASを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:57:28 GMT)
Do Automatic Factuality Metrics Measure Factuality? A Critical Evaluation [21.7] 「本研究は、要約文の表層的属性が事実性を予測するのに十分であるか否かを調査する。」
そして, 実測値が矛盾した要約の事実修正にどのように反応するかを評価し, 有意義な改善を示すものはごくわずかであることを確認した。
これらの知見に触発されて、生成した要約に無害な文を付加することにより、(最も)自動的事実性指標、すなわち、確実に事実性スコアをインフレーションすることができることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:15:15 GMT)
Demand Modeling for Advanced Air Mobility [21.4] Advanced Air Mobility (AAM) は有望な輸送手段として登場した。
本研究は、テネシー州の国勢調査区域における雇用ベースの旅行データを分析し、AAMの需要動態を分析した。
その結果,一般交通費の70%以上を航空輸送が占める場合,AAMにとって旅行は有効である可能性が示唆された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:51:39 GMT)
Grasp, See and Place: Efficient Unknown Object Rearrangement with Policy Structure Prior [21.2] ロボットがオブジェクトをRGB-D画像で指定された目標設定に再構成することを想定する、未知のオブジェクト再構成のタスクに焦点をあてる。
近年の研究では、学習に基づく知覚モジュールを組み込んだ未知の物体再構成システムについて検討している。
本稿では,結合構造を持つ二重ループシステム GSP を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:54:48 GMT)
ReDAN: An Empirical Study on Remote DoS Attacks against NAT Networks [20.9] ローカルNATネットワークの外部で動作するインターネット攻撃者は、NATデバイスをリモートで識別し、特定NATデバイスから外部サーバへのTCP接続を停止できることを示す。
我々はNAT仕様内のPMTUD機構の欠陥を利用して、インターネット上のNATデバイスを識別する。
実験の結果,既存のNATデバイスに広範なセキュリティ脆弱性が認められた。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:02:26 GMT)
StructFormer: Document Structure-based Masked Attention and its Impact on Language Model Pre-Training [20.8] 本研究は,BERT事前学習におけるグローバルアテンションの影響を実証的に評価することに焦点を当てた。
我々は、arXivデータとテキスト専用コーパスとともに、構造化対応テキストの広範なコーパスを作成します。
我々の分析は、文書構造をLMモデルに組み込むことの重要性を強調し、より抽象的なタスクに優れることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:57:52 GMT)
Real-time volumetric free-hand ultrasound imaging for large-sized organs: A study of imaging the whole spine [20.7] 3次元超音波イメージングは、構造観察と測定における従来の2次元超音波イメージングの限界を克服することができる。
大型臓器の体積超音波画像撮影は, 長い取得時間, 避けられない患者の動き, 3D特徴認識などの困難に直面している。
以上の課題に最適化された実時間容積自由手超音波画像システムを提案し,その臨床診断に応用した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:40:29 GMT)
Path Loss Prediction Using Deep Learning [20.6] 通信リンクに沿った障害はしばしば暗黙的に、あるいは代表的クラッタの高さや全障害深さなどの派生メトリクスを通して考慮される。
畳み込みニューラルネットワークを用いて高分解能障害物高さマップから特徴抽出を自動的に行う経路固有経路損失予測法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:20:49 GMT)
Generative AI may backfire for counterspeech [20.6] 我々は、最先端AIが生み出す文脈化された逆音声が、オンラインヘイトスピーチを抑制するのに有効であるかどうかを分析する。
その結果,非コンテクスチュアライズされた対応音声は,オンラインヘイトスピーチを著しく減少させることがわかった。
しかし、LLMsによって生成される文脈化された反音声は効果が無く、バックファイアさえも生じうる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:10:34 GMT)
Towards the Dynamics of a DNN Learning Symbolic Interactions [20.5] 近年の一連の定理は、与えられた入力サンプルに対して、入力変数間の相互作用の小さなセットを原始的推論パターンと見なせることを示すために証明されている。
本研究は,DNNの一般化能力が学習過程においてどのように変化するかの理論的メカニズムとして,相互作用の2相ダイナミクスを実証する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:57:20 GMT)
Enhancing Diagnostic Precision in Gastric Bleeding through Automated Lesion Segmentation: A Deep DuS-KFCM Approach [20.4] 本稿では,新しい深層学習モデルDual Spatial Kernelized Constrained Fuzzy C-Means (Deep DuS-KFCM)を提案する。
このシステムは、ニューラルネットワークをファジィ論理と相乗し、出血領域を高精度かつ効率的に同定する。
本モデルでは, 前例のない87.95%の精度と96.33%の特異性を示し,同時代のセグメンテーション法より優れていた。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:07:16 GMT)
U2NeRF: Unsupervised Underwater Image Restoration and Neural Radiance Fields [20.3] マルチビュー幾何学に基づく新しいビューのレンダリングと復元を同時に行うトランスフォーマーベースのアーキテクチャであるUnsupervised Underwater Neural Radiance Field U2NeRFを提案する。
我々は,12の水中シーンからなる水中ビュー合成UVSデータセットを,合成生成データと実世界のデータの両方を含む形でリリースする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:02:28 GMT)
Unlocking The Potential of Adaptive Attacks on Diffusion-Based Purification [20.2] Diffusion-based purification (DBP)は、敵対的事例(AE)に対する防御である
我々は、この主張を再考し、防衛を通じて損失勾配を後退させる勾配に基づく戦略に焦点をあてる。
このような最適化手法はDBPのコア基盤を無効にし、その代わりに悪意のあるサンプル上の分布に精製された出力を制限する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:30:32 GMT)
Full-counting statistics for the alternating and domain-wall states [20.1] 自由フェルミオンの1次元系に対して、領域壁の完全な数え上げ統計と交互占有状態との接続を導出する。
これにより、N'eel状態の偶数累積の時間とともに線形成長を示すことができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:31:05 GMT)
GSE: Group-wise Sparse and Explainable Adversarial Attacks [20.1] スパース敵は、最小ピクセルの摂動によって、愚かなディープニューラルネットワーク(DNN)を攻撃します。
近年の取り組みは、この標準を核グループノルムのようなスパーシティ正則化器に置き換えて、グループワイドの敵攻撃を作らせている。
本稿では,意味的意味のある画像内のグループワイドアタックを生成する2相アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:23:35 GMT)
Edit Away and My Face Will not Stay: Personal Biometric Defense against Malicious Generative Editing [19.9] FaceLockは、敵の摂動を最適化して生体情報を破壊または著しく変更する、ポートレート保護の新しいアプローチである。
我々の研究はバイオメトリック・ディフェンスを推進し、画像編集におけるプライバシー保護の実践の基礎を定めている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:59:03 GMT)
Word4Per: Zero-shot Composed Person Retrieval [19.9] CPR(Composeed Person Retrieval)と呼ばれる新しいタスクが提案され、画像情報とテキスト情報を併用して対象人物の検索を行う。
管理されたCPRには、非常にコストのかかる手動のアノテーションデータセットが必要ですが、現在利用可能なリソースはありません。
本稿では,2段階学習フレームワークであるWord4Perを提案する。このフレームワークでは,軽量テキスト変換ネットワーク(TINet)と微調整コントラスト言語-画像事前学習(CLIP)ネットワークに基づくテキストベースの人物検索モデルが学習される。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:11:18 GMT)
From Diffusion to Resolution: Leveraging 2D Diffusion Models for 3D Super-Resolution Task [19.6] 本稿では,3次元電子顕微鏡(vEM)の超解像性を高めるために,2次元拡散モデルと体積内の横方向の連続性を利用する新しい手法を提案する。
イオンビーム走査型電子顕微鏡(FIB-SEM)の2つのデータを用いて,本フレームワークのロバスト性と実用性を示した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:12:55 GMT)
SplatFlow: Multi-View Rectified Flow Model for 3D Gaussian Splatting Synthesis [19.4] SplatFlowは3DGSの直接生成と編集を可能にする包括的フレームワークである。
SplatFlowは、マルチビュー整流(RF)モデルとガウス整流デコーダ(GSDecoder)の2つの主要コンポーネントから構成される。
我々は、MVImgNetとDL3DV-7Kデータセット上でSplatFlowの能力を検証し、様々な3D生成、編集、塗装に基づくタスクにおいて、その汎用性と有効性を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:46:17 GMT)
SAVEn-Vid: Synergistic Audio-Visual Integration for Enhanced Understanding in Long Video Context [19.2] SAVEn-Vidは,58k以上の音声・視覚的指示を含む,史上初の音声・視覚的ビデオデータセットである。
AVBenchは、ロングビデオ内の音声・視覚的理解タスクの強化に関するモデルを評価するためにデザインされた2500QAを含むベンチマークである。
実験により、SAVEnVideoは、ゼロショット長ビデオタスク(Video-MME)で3.61%、ゼロショット長ビデオタスク(Music-AVQA)で1.29%、最上位のオーディオ・ヴィジュアル・タスク(Music-AVQA)で1.29%を上回った。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:22:13 GMT)
An Empirical Study of Vulnerability Detection using Federated Learning [19.1] フェデレートラーニング(FL)は、脆弱性検出におけるデータサイロ問題に対処するための有望な手段として研究されている。
本稿ではまず,FLに基づく脆弱性検出のための効果的な評価フレームワークであるVulFLを提案する。
本研究は、脆弱性検出におけるFLの可能性に光を当て、脆弱性検出のためのFLベースのソリューションの設計をガイドするために使用できる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:21:12 GMT)
HQP: A Human-Annotated Dataset for Detecting Online Propaganda [18.8] 高品質なラベルを用いたオンラインプロパガンダ検出のための新しいデータセットHQPを提案する。
我々は、最先端の言語モデルは、弱いラベルで訓練された場合、オンラインプロパガンダを検出するのに失敗していることを示す。
高品質なラベルの小さなサンプルを用いた素早い学習は、依然として妥当な性能を達成できることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:20:43 GMT)
Continual Learning of Large Language Models: A Comprehensive Survey [18.5] 静的、コンパイル済み、一般的なデータセットに基づいてトレーニングされた大規模言語モデル(LLMs)は、多くの研究方向や応用を引き起こしている。
そのような方向の1つは、トレーニング済みのLLMを動的データ分散、タスク構造、ユーザの好みに組み込むという、簡単ではない課題に対処する。
CL(Continuous Learning)コミュニティで広く研究されているが、LSMの領域では新たなマニフェストが提示されている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:27:13 GMT)
CSA: Data-efficient Mapping of Unimodal Features to Multimodal Features [18.5] CLIPのようなマルチモーダルエンコーダは、ゼロショット画像分類やクロスモーダル検索といったタスクに優れている。
そこで本研究では,2つのユニモーダルエンコーダを用いて,制限データを用いたマルチモーダルエンコーダを複製する正準類似性解析(CSA)を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:01:53 GMT)
Hyperspectral Image Cross-Domain Object Detection Method based on Spectral-Spatial Feature Alignment [18.4] 本研究では、ハイパースペクトル画像の教師なしクロスドメインオブジェクト検出について検討する。
我々の重要な観察は、局所的な空間スペクトル特性が異なる領域間で不変であることである。
領域シフトの問題を解決するために,スペクトル空間的特徴アライメントに基づくHSIクロスドメインオブジェクト検出手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:42:06 GMT)
Revisiting a Design Choice in Gradient Temporal Difference Learning [18.3] オフ・ポリシー・ラーニングは、強化学習エージェントが実行されていないポリシーについて反実的に推論することを可能にする。
関数近似とブートストラップを組み合わせると不安定になる可能性がある。
本稿では、$Atop$TDの変種である$A_ttop$TDが、致命的なトライアドの効果的な解であることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:26:34 GMT)
A Characterization of Multioutput Learnability [18.1] バッチおよびオンライン設定におけるマルチアウトプット関数クラスを学習する際の問題点を考察する。
マルチアウトプット関数クラスは,関数クラスの単一アウトプット制限が学習可能である場合にのみ学習可能であることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 00:06:06 GMT)
Towards Efficient Model-Heterogeneity Federated Learning for Large Models [18.0] モデル・ヘテロジニティ・フェデレーション・ラーニング(MHFL)に適した革新的微調整フレームワークであるHeteroTuneを紹介する。
特に,マルチブランチ・クロスモデルアグリゲータを用いたFedAdapterという,パラメータ効率の高いファインチューニング構造を提案する。
軽量なFedAdapterの利点は、計算オーバーヘッドと通信オーバーヘッドの両方を大幅に削減することにある。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:58:51 GMT)
Scalable Fine-tuning from Multiple Data Sources: A First-Order Approximation Approach [17.8] 目的タスクに対する言語モデル(LM)の微調整の問題について,$n$補助タスクの情報を用いて最適に検討する。
この問題には、NLPにおけるターゲット命令チューニングや、チェーン・オブ・ファインタニングにおけるデータ選択など、幅広い応用がある。
繰り返し学習せずにモデル微調整性能を推定する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:09:45 GMT)
Any2Any: Incomplete Multimodal Retrieval with Conformal Prediction [17.6] 我々はAny2Anyという新しい検索フレームワークを提案し、クエリと参照の両方が不完全なモダリティを持つシナリオに対処する。
クロスモーダルエンコーダとのペアワイズ類似度を計算し、同型予測を伴う2段階キャリブレーションプロセスを用いて類似度を整列する。
KITTIデータセットで35%のRecall@5を達成する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:04:20 GMT)
Learning Predictive Checklists with Probabilistic Logic Programming [17.4] 本稿では,画像や時系列などの様々なデータモダリティから予測チェックリストを学習する手法を提案する。
本手法は,チェックリストの離散性と連続値データとのマッチングを可能にする学習パラダイムである確率論的論理プログラミングに依存する。
提案手法は,画像シーケンス,時系列,臨床ノートを含む予測タスクにおいて,さまざまな説明可能な機械学習手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:07:19 GMT)
Bi-Directional Deep Contextual Video Compression [17.2] 本稿では,Bフレームに適した双方向深層映像圧縮方式をDCVC-Bと呼ぶ。
まず、効果的な動き差分符号化のための双方向の動き差分文脈伝搬法を提案する。
次に、双方向文脈圧縮モデルと対応する双方向時間エントロピーモデルを提案する。
第3に,階層的品質構造に基づくトレーニング戦略を提案し,画像の大規模なグループ間で効果的なビット割り当てを実現する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:15:53 GMT)
Scaling Spike-driven Transformer with Efficient Spike Firing Approximation Training [17.2] 脳にインスパイアされたスパイキングニューラルネットワーク(SNN)の野望は、従来のニューラルネットワーク(ANN)に代わる低消費電力な代替手段になることである。
この作業は、SNNとANNのパフォーマンスギャップと、SNNの高トレーニングコストという、このビジョンを実現する上での2つの大きな課題に対処する。
本研究では,2次発火機構によるスパイクニューロンの固有の欠陥を同定し,整数学習とスパイク駆動推論を用いたスパイクフィリング近似(SFA)法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:05:41 GMT)
The GPT-WritingPrompts Dataset: A Comparative Analysis of Character Portrayal in Short Stories [17.2] 本研究では,人間と機械の両方の生成過程から,ストーリーテリングの感情的特徴と記述的特徴を6次元で定量化し比較する。
生成した物語は6次元すべてで人間ストーリーと大きく異なり、主主人公の物語的視点やジェンダーに応じてグループ化された場合、人間世代と機械世代は同様のバイアスを呈することがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:13:12 GMT)
Tuning Synaptic Connections instead of Weights by Genetic Algorithm in Spiking Policy Network [16.9] 現代の深層強化学習(DRL)は、相互作用から学ぶための計算的アプローチを探求している。
DRLの代替エネルギーとして遺伝的アルゴリズムを用いたスパイキングポリシーネットワーク(SPN)を最適化した。
生物学的研究によって、脳は新たなシナプス接続を創造することで記憶を形成することが示され、与えられたタスクを解決するためにSPNの重みの代わりにシナプス接続を調整した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:11:06 GMT)
Poster: From Fort to Foe: The Threat of RCE in RPKI [16.8] 本稿では,RPKIバリデータFortに,バッファオーバーフローの脆弱性を新たに提示する。
この脆弱性により、アタッカーはソフトウェアを実行するマシン上でリモートコード実行を達成できる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:01:02 GMT)
Contrastive Multi-graph Learning with Neighbor Hierarchical Sifting for Semi-supervised Text Classification [16.8] 半教師付きテキスト分類のための隣接階層シフティングを用いたコントラッシブ・マルチグラフ学習法を提案する。
具体的には、コア機能を利用してマルチリレーショナルテキストグラフを作成し、テキスト間のセマンティックな接続を強化する。
ThuCNews、SogouNews、20のニュースグループ、およびOhsumedデータセットに関する我々の実験は95.86%、97.52%、87.43%、70.65%を達成し、半教師付きテキスト分類の競争結果を示している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:35:55 GMT)
DEAL: Decoupled Classifier with Adaptive Linear Modulation for Group Robust Early Diagnosis of MCI to AD Conversion [16.7] 深層学習に基づくアルツハイマー病の診断は、最近大きな進歩を遂げた。
診断のグループロバスト性についての研究には、依然として重大なギャップが残っている。
MRI画像を用いてMCIからADへの変換の早期診断におけるグループロバスト性の最初の包括的調査を行った。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:45:44 GMT)
Interactive Medical Image Segmentation: A Benchmark Dataset and Baseline [16.7] IMed-361Mベンチマークデータセットは、一般的なIMIS研究において重要な進歩である。
我々は、複数のデータソースから640万以上の医療画像とその対応する地底真理マスクを収集し、標準化する。
我々は,対話型入力による高品質マスク生成をサポートするIMISベースラインネットワークを開発した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:53:16 GMT)
Dataset Distillers Are Good Label Denoisers In the Wild [16.6] ノイズ除去にデータセット蒸留を利用する新しい手法を提案する。
本手法は,既存の手法に共通するフィードバックループを回避し,訓練効率を向上させる。
各種ノイズ条件下での3つの代表的なデータセット蒸留法(DATM, DANCE, RCIG)を厳格に評価した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:16:27 GMT)
RECAST: Reparameterized, Compact weight Adaptation for Sequential Tasks [16.5] RECASTはタスク固有のトレーニング可能なパラメータを50未満に劇的に削減する新しい手法である。
本稿では,RECASTが様々なスケール,アーキテクチャ,パラメータ空間において,最先端の技術を最大3%向上させることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:08:38 GMT)
MixPE: Quantization and Hardware Co-design for Efficient LLM Inference [16.4] MixPEは、大規模言語モデルにおける効率的な低ビット量子化のために設計された、特殊な混合精度処理素子である。
我々は、MixPEが最先端の量子化アクセラレータを2.6倍のスピードアップと1.4倍のエネルギー削減で超えることを示した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:34:53 GMT)
An End-to-End Robust Point Cloud Semantic Segmentation Network with Single-Step Conditional Diffusion Models [16.4] 既存の条件付き拡散確率モデル (DDPM) とノイズ・コンディション・フレームワーク (NCF) は, 3次元シーン理解作業において依然として困難である。
我々は、DtextbfDPMsのtextbfConditional-Noise Framework(CNF)に基づく、エンドツーエンドのロバストなtextbfSegmentation textbfNetを提案する。
CNFのおかげで、CDSegNetはnonのような単一ステップ推論でセマンティックラベルを生成することができる
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:53:55 GMT)
Video-Text Dataset Construction from Multi-AI Feedback: Promoting Weak-to-Strong Preference Learning for Video Large Language Models [16.3] MLLM(Multimodal Large Language Models)アライメントには,ビデオテキストの嗜好データが不可欠である。
我々は、textittextbfMultiple textbfMultimodal textbfArtificial textbfIntelligence textbfPreferenceデータセットと呼ばれる高品質なVQA選好データセットを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:59:39 GMT)
MOSABench: Multi-Object Sentiment Analysis Benchmark for Evaluating Multimodal Large Language Models Understanding of Complex Image [16.0] マルチオブジェクト感情分析に特化して設計された新しい評価データセットMOSABenchを紹介する。
MOSABenchの主なイノベーションは、距離ベースのターゲットアノテーション、出力を標準化するための評価のための後処理、改良されたスコアリング機構である。
本研究は、複雑な多目的感情分析タスクにおける精度を高めるためのMLLMの必要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:00:36 GMT)
BadSFL: Backdoor Attack against Scaffold Federated Learning [15.9] フェデレートラーニング(FL)は、分散クライアント上のディープラーニングモデルのトレーニングにより、データのプライバシを保護します。
既存のバックドア攻撃は主に独立かつ同一に分散した(IID)シナリオを持つFLに焦点を当てるが、現実のFLトレーニングデータは通常IIDではない。
非IID設定における足場集約アルゴリズムを用いて,FLフレームワーク用に特別に設計された新しいバックドアアタック手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:46:57 GMT)
EPS: Efficient Patch Sampling for Video Overfitting in Deep Super-Resolution Model Training [15.7] ビデオSRネットワークオーバーフィッティングのための効率的なパッチサンプリング手法であるEPSを提案する。
本手法は,クラスタの解像度や数に応じて,トレーニング用パッチの数を4%から25%に削減する。
最新のパッチサンプリング手法であるEMTと比較して,本手法は全体の実行時間を83%削減する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:01:57 GMT)
DreamForge: Motion-Aware Autoregressive Video Generation for Multi-View Driving Scenes [15.5] 本研究では,DreamForgeを提案する。DreamForgeは3次元制御可能な長期生成に適した,高度な拡散型自己回帰ビデオ生成モデルである。
レーンと前景の生成を向上するために、視点誘導を導入し、オブジェクト指向位置符号化を統合する。
また,映像中の動きの手がかりや外観の変化を捉えた時間的注意も提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:50:30 GMT)
Stop Playing the Guessing Game! Target-free User Simulation for Evaluating Conversational Recommender Systems [15.5] PEPPERは、実際のユーザインタラクション履歴とレビューから構築された、ターゲットフリーなユーザシミュレータによる評価プロトコルである。
PEPPERは、単純な推測ゲームに陥ることなく、現実的なユーザ-CRS対話を可能にする。
PEPPERは、CRSの嗜好誘発能力を包括的に評価するための詳細な尺度を提示する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:36:20 GMT)
Distributed, communication-efficient, and differentially private estimation of KL divergence [15.3] 分散された機密性の高いデータを管理する上で重要なタスクは、分散の変化の度合いを測定することである。
差分プライバシの下で,計算のフェデレーションモデル間でのKL分散を推定するための新しいアルゴリズムアプローチについて述べる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:20:40 GMT)
NormXLogit: The Head-on-Top Never Lies [15.2] トランスフォーマーアーキテクチャは、大きな言語モデルを構築する上で主要な選択肢となっている。
個々の入力トークンの意義を評価するため,NormXLogitと呼ばれる新しい手法を提案する。
提案手法は,忠実度の観点から,既存の勾配法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:12:27 GMT)
Beyond Turing Test: Can GPT-4 Sway Experts' Decisions? [15.0] 本稿では,生成したテキストが読者の判断にどう影響するかを,アマチュアと専門家の両方に焦点をあてる。
以上の結果から,GPT-4はアマチュアとプロの双方の意思決定に影響を及ぼす説得的分析を生ずる可能性が示唆された。
その結果、観客反応による実世界評価と、生成モデルによく用いられる現在の多次元評価器との間に高い相関関係が示された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:12:35 GMT)
Chat2SVG: Vector Graphics Generation with Large Language Models and Image Diffusion Models [14.9] Chat2SVGは大規模言語モデルと画像拡散モデルを組み合わせたハイブリッドフレームワークである。
本システムにより,自然言語による直感的な編集が可能となり,プロのベクトルグラフィックス作成が可能となった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:31:57 GMT)
Distributed Online Optimization with Stochastic Agent Availability [14.8] エージェントが各ステップで既知の確率$p$でアクティブである分散オンライン最適化の変種について検討する。
我々は,そのネットワーク後悔を,アクティブエージェントの即時後悔の平均から分析する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:20:01 GMT)
Quark: Real-time, High-resolution, and General Neural View Synthesis [14.6] 本稿では,高品質,高解像度,リアルタイムの新規ビュー合成を実現するためのニューラルアルゴリズムを提案する。
入力されたRGB画像やビデオストリームのスパースセットから、3Dシーンを再構築し、NVIDIA A100上で1080pの解像度で新しいビューを30fpsでレンダリングします。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:59:50 GMT)
CoverLib: Classifiers-equipped Experience Library by Iterative Problem Distribution Coverage Maximization for Domain-tuned Motion Planning [14.6] CoverLibは、ライブラリに経験分類器ペアを反復的に追加する。
未発見領域を効果的にカバーする機能に基づいて、次のエクスペリエンスを選択する。
それは、問題領域に対する高速な計画と高い成功率の両方を達成する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:19:51 GMT)
Interpreting Language Reward Models via Contrastive Explanations [14.6] リワードモデル(RM)は、大きな言語モデル(LLM)出力と人間の値のアライメントにおいて重要な要素である。
本稿では,RM によるバイナリ応答比較について,対照的な説明を用いて説明することを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:37:27 GMT)
Fast training of large kernel models with delayed projections [14.5] データサイズとモデルサイズの両方で効率よくスケールできるカーネルマシンを構築するための新しい手法を提案する。
提案アルゴリズムでは,PSGD(Preconditioned Gradient Descent)に遅延プロジェクションを導入し,従来よりもはるかに大きなモデルのトレーニングを可能にする。
提案アルゴリズムであるEigenPro4を検証し,既存の手法よりも格段に高速な学習速度を示しながら,比較あるいはより優れた分類精度を維持した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:42:13 GMT)
TEG-DB: A Comprehensive Dataset and Benchmark of Textual-Edge Graphs [14.4] Text-Attributed Graphs (TAG)は、自然言語記述によるグラフ構造を強化し、データとその相互接続の詳細な描写を容易にする。
既存のTAGデータセットは、主にノードでのみテキスト情報を特徴付けており、エッジは通常、単なるバイナリまたはカテゴリ属性で表される。
このギャップに対処するため、ノードとエッジにリッチなテキスト記述を備えたTextual-Edge Graphsデータセットを導入しました。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:35:47 GMT)
REDUCR: Robust Data Downsampling Using Class Priority Reweighting [14.0] この研究は、クラス優先度の再重み付けを使用する堅牢で効率的なデータダウンサンプリング手法であるREDUCRを導入している。
視覚およびテキスト分類タスクにおけるREDUCRのデータ効率とロバスト性能を実証する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:50:55 GMT)
Speculative Decoding with CTC-based Draft Model for LLM Inference Acceleration [14.0] ドラフトフェーズにおけるドラフトトークン間の相関性を強化するCTCベースのドラフトモデルを提案する。
実験結果から,提案手法は強いベースラインに比べて高い受理率と高速な推論速度が得られることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:10:21 GMT)
CutS3D: Cutting Semantics in 3D for 2D Unsupervised Instance Segmentation [13.9] 我々は,シーンのポイントクラウド表現を利用して,最後の2Dインスタンスを得るために,3次元のセマンティックマスクをカットすることを提案する。
また,クリーンな学習信号の分離を目的とした3つの空間信頼成分を用いたクラス非依存検出器のトレーニングの強化も提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:11:27 GMT)
Dark Miner: Defend against undesired generation for text-to-image diffusion models [13.9] 我々は消去タスクを分析し、既存の手法では不要な生成の総確率の最小化を保証できないことを指摘した。
我々は、採掘、検証、回避を含む3段階のプロセスであるダークマイナーを提案する。
本手法は, 従来手法と比較して, 特に複数対逆攻撃において, 消去効果と防御効果が向上する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:31:05 GMT)
Fundamental Limits of Prompt Tuning Transformers: Universality, Capacity and Efficiency [13.6] 主要なコントリビューションは、テクスチングル・ヘッド・トランスフォーマーに、テクスチングル・セルフアテンション・レイヤのみを組み込むことである。
そのような最も単純な変換器の迅速なチューニングは、列から列へのリプシッツ関数に対する普遍近似であることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:12:17 GMT)
On the Robustness of the Successive Projection Algorithm [13.6] 我々は,SPAの雑音に対する頑健さとその変種について再考する。
特に,SPAにおける既存の誤差境界の厳密性を証明する。
我々は、まずデータポイントをシフトして持ち上げる、より堅牢なSPAの亜種を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:49:33 GMT)
TreeFormer: Single-view Plant Skeleton Estimation via Tree-constrained Graph Generation [13.5] 木制約グラフ生成による植物骨格推定装置であるTreeFormerを提案する。
学習に基づくグラフ生成と従来のグラフアルゴリズムを組み合わせることで,学習ループの制約を課す。
実験の結果,本手法は複数領域の植物骨格構造を正確に推定できることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:43:20 GMT)
Deciphering genomic codes using advanced NLP techniques: a scoping review [13.2] ヒトゲノムシークエンシングデータの広大かつ複雑な性質は、効果的な解析のための課題を提示する。
本稿では,自然言語処理(NLP)技術,特にLarge Language Models(LLM)とTransformer Architectureの応用について検討する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:35:56 GMT)
Local Learning for Covariate Selection in Nonparametric Causal Effect Estimation with Latent Variables [13.1] 非実験データから因果効果を推定することは、科学の多くの分野における根本的な問題である。
非パラメトリック因果効果推定における共変量選択のための新しい局所学習手法を提案する。
我々は、合成データと実世界のデータの両方に関する広範な実験を通じて、アルゴリズムを検証する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:08:54 GMT)
From General to Specific: Utilizing General Hallucination to Benchmark Specific Role-Playing Agents [13.0] 我々は、ロールプレイングエージェント(RPAs)のための自動的、スケーラブルで、一般化可能なパラダイムを提案する。
我々は、一般知識グラフから関係を抽出し、ロール間の相互作用をシミュレートするためにRPAの固有の幻覚特性を活用することにより、SHARPというベンチマークを構築した。
本研究は,これらの指標に影響を及ぼす要因を考察し,関係性への盲目的な忠誠と事実への固執とのトレードオフを論じるものである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:13:00 GMT)
Auditing for Human Expertise [13.0] 我々は、この問題を自然仮説テストとして適用できる統計的枠組みを開発する。
本稿では,専門家の予測が興味ある結果から統計的に独立しているかどうかを判定する簡単な手順を提案する。
我々のテストの拒絶は、人間の専門家が利用可能なデータに基づいてトレーニングされたアルゴリズムに価値を付加する可能性を示唆している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:59:11 GMT)
Glo-In-One-v2: Holistic Identification of Glomerular Cells, Tissues, and Lesions in Human and Mouse Histopathology [12.9] ヒトとマウスの病理データを部分的にラベル付けした画像内に14のクラスをセグメント化するために設計された,単一の動的頭部深層学習アーキテクチャを提案する。
ネットワークセグメントは、接着、毛細管落下、大脳性硬化症、ハイアリン症、メサンギウム分解、微小動脈瘤、結節性硬化症、メサンギウム拡張、セグメント性硬化症を含む9つの糸球体病変クラスを含む。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:59:39 GMT)
Transparent Neighborhood Approximation for Text Classifier Explanation [12.8] 本稿では,ブラックボックステキストジェネレータの代替として,確率ベースの編集手法を提案する。
提案手法であるXPROBは,実世界の2つのデータセットで行った評価に基づいて,競争性能を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:10:09 GMT)
FakeFormer: Efficient Vulnerability-Driven Transformers for Generalisable Deepfake Detection [12.6] 本稿では,視覚変換器(ViT)が顔面偽造検出に最適である理由について検討する。
本稿では, 微妙な不整合情報を抽出するためにViTを拡張したFakeFormerというディープフェイク検出フレームワークを提案する。
FF++、Celeb-DF、WildDeepfake、DFD、DFDCP、DFDCなど、さまざまな有名なデータセットで実験が行われている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:26:30 GMT)
F -- A Model of Events based on the Foundational Ontology DOLCE+DnS Ultralite [12.5] イベントモデルFと呼ばれるイベントの形式モデルを提案する。
このモデルでは、時間と空間、オブジェクト、人、およびメアロジー、因果関係、イベント間の相関関係を表現するための包括的サポートを提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:45:38 GMT)
VQ-SGen: A Vector Quantized Stroke Representation for Sketch Generation [12.5] VQ-SGenは、高品質なスケッチ生成のための新しいアルゴリズムである。
トークン化されたストローク表現を利用することで,高い忠実度を有するストロークを生成する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:51:22 GMT)
SKQVC: One-Shot Voice Conversion by K-Means Quantization with Self-Supervised Speech Representations [12.4] ワンショット音声変換(ワンショット音声変換、英: One-shot Voice conversion、VC)は、単一の話者発話のみを用いて、任意の2つの話者間の変換を可能にする方法である。
K平均量子化(KQ)と自己教師付き学習(SSL)機能を利用した最近の研究は、音声からコンテンツ情報をキャプチャできることを示した。
本稿では,SSLの特徴と音声属性を利用した,シンプルで効果的なワンショットVCモデルを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:14:26 GMT)
Unsupervised Video Summarization via Iterative Training and Simplified GAN [12.3] 本稿では, 生成的対角ネットワークのアイデアを用いた, 教師なしの映像要約手法を提案する。
また、複数回の繰り返しに対して、再構成器とフレームセレクタを交互に訓練することにより、反復的トレーニング戦略を適用する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:37:22 GMT)
COBRA: A Continual Learning Approach to Vision-Brain Understanding [12.2] 視覚脳理解(VBU)は機能的磁気共鳴画像(fMRI)によって記録された脳活動から視覚情報を抽出することを目的としている
VBUの既存の研究は破滅的な忘れ込みという課題に直面している。
本稿では,視覚脳のための連続学習(Continuous Learning for Vision-Brain,COBRA)と呼ばれる新しいフレームワークを紹介し,VBUにおける連続学習に対処する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:59:54 GMT)
AnonyNoise: Anonymizing Event Data with Smart Noise to Outsmart Re-Identification and Preserve Privacy [12.1] イベントカメラは、人間の解釈が困難で出力が希少であるため、当初は有望な解決策と考えられていた。
近年のディープラーニングの進歩は、ニューラルネットワークが高品質なグレースケールのイメージを再構築し、イベントカメラのデータを使って個人を再識別できることを証明している。
本稿では,人間だけでなくニューラルネットワークによる再同定を防止するための,最初のイベント匿名化パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:43:03 GMT)
Transformers are Deep Optimizers: Provable In-Context Learning for Deep Model Training [11.9] In-context Learning (ICL) の深層モデルの学習過程をシミュレートする能力について検討する。
具体的には、$(2N+4)L$層変換器を明示的に構成し、$L$勾配降下ステップをシミュレートする。
本研究では,3層,4層,6層ニューラルネットワークの合成データセットについて検証した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:32:11 GMT)
Pathways on the Image Manifold: Image Editing via Video Generation [11.9] 我々は、事前訓練されたビデオモデルを用いて、画像編集を時間的プロセスとして再構成し、元の画像から所望の編集へのスムーズな遷移を生成する。
提案手法は,テキストベースの画像編集における最先端の成果を達成し,編集精度と画像保存の両面で有意な改善を示した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:41:45 GMT)
Is Hyper-Parameter Optimization Different for Software Analytics? [11.9] SEデータはクラス間の"smoother"境界を持つことができる。
SMOOTHIEはより高速に動作し、SEデータでより良い予測を行う。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:55:38 GMT)
EndoPerfect: A Hybrid NeRF-Stereo Vision Approach Pioneering Monocular Depth Estimation and 3D Reconstruction in Endoscopy [11.8] 内視鏡下副鼻腔手術(ESS)の3次元再建は極めて正確である。
これは、従来の単眼内視鏡を使用する場合、非常に難しい課題となる。
本稿では,ニューラルレージアンス場(NeRF)と立体深度推定を組み合わせた3次元再構成手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:28:50 GMT)
Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval [11.8] テキスト・ツー・イメージ・パーソナリティ検索(TIPR)の目的は、与えられたテキスト記述に従って特定の人物画像を取得することである。
本稿では,人物画像と対応するテキスト間のきめ細かいインタラクションとアライメントを構築するための新しいTIPRフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:01:56 GMT)
Enabling Adoption of Regenerative Agriculture through Soil Carbon Copilots [11.6] 我々は、土壌の健康と再生の実践に関する洞察を提供するために、AI駆動の土壌有機炭素コパイロットを導入する。
私たちのデータには、極端な気象イベントデータ、ファームマネジメントデータ、SOC予測が含まれています。
カリフォルニア郡全体で農業の実践を比較すると、多様な農業活動が耕作の悪影響を緩和する証拠が見つかる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:11:41 GMT)
Post Guidance for Online Communities [11.5] Post Guideは、ユーザが投稿する投稿のドラフトを作成すると、介入をトリガーするルールを使用して、ユーザのコントリビューションをガイドする。
この独特なコミュニティ固有のプロアクティブでユーザ中心のアプローチは、モデレーターにさらなる負担を課すことなく、ルールへの順守を高めることができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:32:46 GMT)
FocDepthFormer: Transformer with latent LSTM for Depth Estimation from Focal Stack [11.4] 本稿では,トランスフォーマーをLSTMモジュールとCNNデコーダと統合した新しいトランスフォーマーネットワークFocDepthFormerを提案する。
LSTMを組み込むことで、FocDepthFormerは大規模な単分子RGB深さ推定データセットで事前トレーニングすることができる。
我々のモデルは、複数の評価指標で最先端のアプローチより優れています。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:21:50 GMT)
SCIGS: 3D Gaussians Splatting from a Snapshot Compressive Image [11.4] Snapshot Compressive Imaging (SCI)は、高速なダイナミックシーンで情報をキャプチャすることができる。
現在のディープラーニングに基づく再構築手法では,シーン内の3次元構造的整合性を維持するのに苦労している。
本稿では,3DGSの変種であるSCIGSを提案し,カメラのポーズスタンプとガウスの原始座標を埋め込みとして利用するプリミティブレベルの変換ネットワークを開発した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:58:09 GMT)
Fine-Tuning LLMs with Noisy Data for Political Argument Generation [11.3] Redditのデータ上の微調整されたモデルは、議論の質が最も高く、ノイズの多いデータの組み合わせは、持続的な毒性につながった。
プロンプティング戦略は、個人攻撃のような特定の有毒な特徴を減らしたが、より広範な影響しか与えなかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:28:11 GMT)
Language Driven Occupancy Prediction [11.2] オープン語彙占有予測のための効果的で一般化可能なフレームワークであるLOccを紹介する。
私たちのパイプラインは、画像の貴重な意味情報を掘り下げるための、実現可能な方法を提供します。
LOccは生成された言語基底の真実を効果的に利用し、3D言語ボリュームの学習をガイドする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:47:10 GMT)
The Critical Canvas--How to regain information autonomy in the AI era [11.2] クリティカルキャンバス(Critical Canvas)は、アルゴリズム効率と人事機関のバランスを回復するために設計された情報探索プラットフォームである。
このプラットフォームは、圧倒的な技術的情報を実用的な洞察に変換する。
AIの時代において、より情報に富んだ意思決定と効果的な政策開発を可能にする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:46:02 GMT)
Why the Agent Made that Decision: Explaining Deep Reinforcement Learning with Vision Masks [11.1] VisionMaskは、エージェントの視覚入力における最も重要な領域を特定するために、エンドツーエンドで訓練されたスタンドアロンの説明モデルである。
挿入精度は14.9%、F1スコアは30.08%向上し、選択された視覚的説明から元のアクションを再現する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:11:46 GMT)
AdaTrans: Feature-wise and Sample-wise Adaptive Transfer Learning for High-dimensional Regression [11.0] 本稿では,F-AdaTrans(F-AdaTrans)やS-AdaTrans(S-AdaTrans)の変換可能な構造を検出・集約できる適応型トランスファー学習法を提案する。
F-AdaTransは適切に選択された重みによって、既知の伝達可能な構造を持つオラクル推定器に近い収束率が得られることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:05:52 GMT)
Imperceptible Adversarial Examples in the Physical World [11.0] 我々は、ストレートスルー推定器(STE、別名BPDA)を用いて、物理世界における敵対例を知覚できないものにする。
我々のSTEのレンダリング拡張は、物理的世界における知覚できない敵パッチも可能にします。
我々の知る限りでは、これは物理的世界の小さな規範に縛られた、知覚できない敵の例を示す最初の作品である。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:02:23 GMT)
DF-GNN: Dynamic Fusion Framework for Attention Graph Neural Networks on GPUs [10.8] 本稿では,Attention Graph Neural Networks (AT-GNN) ファミリーを対象とした動的カーネル融合フレームワーク DF-GNN を提案する。
DF-GNNは動的双方向スレッドスケジューリング戦略を導入し、スレッドスケジューリングの柔軟な調整を可能にする。
cuGraphやdgNNのような既存のGNNカーネルの最適化作業を超え、最先端のDGLスパースライブラリよりも7.0times$のスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:26:58 GMT)
Recent Trends in Linear Text Segmentation: a Survey [10.7] 自然言語処理の分野は、最近、Web上のテキスト、ビデオ、オーディオの急増により、多くの関心を集めている。
本稿では,線形テキストセグメンテーションの現在の進歩を概観し,その課題に対する資源とアプローチの観点から技術の現状を説明する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:48:59 GMT)
Summarizing Bayesian Nonparametric Mixture Posterior -- Sliced Optimal Transport Metrics for Gaussian Mixtures [10.7] 混合モデルの後方推論を要約する既存の方法は、クラスタリングのための暗黙のランダムパーティションの点推定を同定することに焦点を当てている。
本研究では,非パラメトリックベイズ混合モデルにおける後部推論を要約し,混合度(または混合度)の密度推定を推論対象として優先順位付けする手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:30:54 GMT)
Meta-Chunking: Learning Efficient Text Segmentation via Logical Perception [10.6] 本稿では,文と段落の粒度を表すメタチャンキングの概念を紹介する。
Meta-Chunkingを実装するために,性能と速度のバランスをとるPerplexity (PPL) Chunkingを設計した。
11のデータセットで実施された実験により、Meta-Chunkingはシングルホップおよびマルチホップ質問応答のパフォーマンスをより効率的に改善できることが示された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:54:03 GMT)
LLM Circuit Analyses Are Consistent Across Training and Scale [10.5] 我々は,デコーダのみの言語モデルにおいて,300億の訓練トークンにまたがるモデル機構の出現と進化について検討する。
タスク能力とそれらをサポートする機能コンポーネントは、スケールにわたって同じトークン数で一貫して現れます。
これらの結果から, 事前学習終了時の小モデルに対する回路解析は, 追加の事前学習やモデルスケールの超越後においても適用可能な知見を与えることが可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:04:58 GMT)
Debiased Regression for Root-N-Consistent Conditional Mean Estimation [10.5] 本稿では,高次元および非パラメトリック回帰推定器を含む回帰推定器のデバイアス化手法を提案する。
理論解析により,提案した推定器は,緩やかな収束率条件下で$sqrtn$-consistencyと正規性を達成することを示した。
提案手法は,推定精度の向上や信頼区間の簡易化など,いくつかの利点を提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:27:16 GMT)
Open Vocabulary Monocular 3D Object Detection [10.4] RGB画像から3次元空間内の物体を検出しローカライズすることを目的とした新しい課題であるオープンボキャブラリモノクロ3Dオブジェクト検出の研究を開拓した。
オープンボキャブラリ2次元検出器を活用して2次元境界ボックスを3次元空間に持ち上げるクラス非依存的手法を提案する。
提案手法は,3次元境界ボックスを推定する作業から2次元の物体の認識と局所化を分離し,未知のカテゴリをまたいだ一般化を可能にする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:59:17 GMT)
Melody Is All You Need For Music Generation [10.4] 本稿では,メロディを用いたテキスト・ツー・ミュージック・ジェネレーションの新たなアプローチであるメロディ・ガイドド・ミュージック・ジェネレーション(MG2)モデルを提案する。
提案したMG2モデルは、既存のオープンソースのテキストから音楽への生成モデルを超え、パラメータの1/3未満とトレーニングデータの1/200未満を活用している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:43:20 GMT)
Bot-Driven Development: From Simple Automation to Autonomous Software Development Bots [10.4] ボット駆動開発(BotDD)は、ボットがコーディング、テスト、プロジェクト管理において積極的な役割を負う、変革的なシフトである。
本稿では,ボット駆動開発が従来の開発役割,特にドライバ・ナビゲータのダイナミクスにどのように影響するかを考察する。
本稿では,ボット駆動開発における課題に対処する研究課題として,開発者のためのスキル開発,ヒューマン・ボット・トラスト・ダイナミクス,最適割り込み頻度,倫理的考察を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:21:23 GMT)
Clustering Time Series Data with Gaussian Mixture Embeddings in a Graph Autoencoder Framework [10.3] 時系列データ分析は、金融、医療、環境モニタリングなど、さまざまな領域で普及している。
伝統的な時系列クラスタリング手法は、そのようなデータに固有の複雑な時間的依存関係を捉えるのに苦労することが多い。
時系列クラスタリングのためのグラフベースのアプローチである変分混合グラフオートエンコーダ(VMGAE)を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:49:01 GMT)
Certified algorithms for equilibrium states of local quantum Hamiltonians [10.2] 平衡状態における可観測物の予測は、量子多体系において中心的だが悪名高い難しい問題である。
局所観測値の期待値を有限時間で近似できることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:51:49 GMT)
Harnessing LLMs for Educational Content-Driven Italian Crossword Generation [10.1] 我々は,イタリア語のクロスワードパズルをテキストから生成するための新しいツールを公開した。
我々は、GPT-4o、Mistral-7B-Instruct-v0.3、Llama3-8b-Instructといった先進言語モデルを用いている。
この最先端ジェネレータは、包括的なイタリア・クルー・インストラクトデータセットを使用する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:13:25 GMT)
Non-Hermitian Spin-Spin Interaction Mediated by Chiral Phonons [10.1] キラルフォノンを介する非対角非エルミートスピン相互作用を導入する。
結果として生じる非エルミート相互作用は、電子スピンの kHz の範囲に達することができる。
この効果はカスケード量子系、非エルミート多体物理学、非エルミート冷却に幅広い応用をもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:18:17 GMT)
GeoFormer: A Multi-Polygon Segmentation Transformer [10.1] リモートセンシングでは、建物のような物体のスケール不変な形状を学習する必要がある。
このような課題に対処する新しいアーキテクチャであるGeoFormerを導入し、マルチポリゴンをエンドツーエンドに生成する方法を学習する。
キーポイントを自動回帰方式で空間依存トークンとしてモデル化することにより、GeoFormerは、衛星画像から構築対象を指示する既存の作業より優れている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:54:44 GMT)
Ensemble Learning via Knowledge Transfer for CTR Prediction [9.9] 本稿では,より大規模なアンサンブルネットワークを調査し,一般的なアンサンブル学習法に特有の3つの制約を見出す。
我々は,新しいモデルに依存しないアンサンブル知識伝達フレームワーク(EKTF)を提案する。
実世界の5つのデータセットの実験結果は、EKTFの有効性と互換性を示している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:14:20 GMT)
Adaptive Coordinate-Wise Step Sizes for Quasi-Newton Methods: A Learning-to-Optimize Approach [9.8] 本稿では,Broyden-Fletcher-Goldfarb-Shannoフレームワークに新たなLearning-to-(L2O)モデルを導入する。
提案手法は,従来のバックトラックライン探索法や過次降下法よりも大幅に改善されている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:13:59 GMT)
Debiasing Classifiers by Amplifying Bias with Latent Diffusion and Large Language Models [9.8] DiffuBiasはテキスト・画像生成のための新しいパイプラインであり、バイアス・コンフリクト・サンプルを生成することで分類器の堅牢性を高める。
DrouBiasは、安定拡散モデルを活用する最初のアプローチである。
総合実験により,DiffuBiasがベンチマークデータセット上で最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:11:16 GMT)
Alpha Entropy Search for New Information-based Bayesian Optimization [9.7] 我々はAlpha Entropy Search (AES)と呼ばれる新しい情報に基づく獲得関数のクラスを導入する。
AESは、KL(Kulback-Leibler)の発散を一般化するα偏差に基づいている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:19:30 GMT)
Structured Multi-Track Accompaniment Arrangement via Style Prior Modelling [9.5] 本稿では,これらの課題に対処するために,不整合型因子に対する事前モデリングを活用する新しいシステムを提案する。
私たちのキーとなる設計は、ベクトル量子化と、オーケストレーションスタイルの長期フローをモデル化するためのユニークなマルチストリームトランスの使用です。
本システムでは,既存のベースラインに比べて,コヒーレンス,構造,全体的な配置品質が優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:19:58 GMT)
VidHal: Benchmarking Temporal Hallucinations in Vision LLMs [9.4] ビデオベースの幻覚を評価するために特別に設計されたベンチマークであるVidHalを紹介する。
VidHalの明確な特徴は、各ビデオに関連する様々なレベルのキャプションを表すキャプションを慎重に作成することである。
本稿では,VLLMの字幕ランク付けを必要とする新規な字幕順序付けタスクを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:17:23 GMT)
Ptychoformer: A Physics-Guided Deep Learning Framework for Ptychographic Imaging [9.4] PtychoformerはPtychographic Imagingのための物理誘導型ディープラーニングフレームワークである。
注意機構と特徴抽出を回折物理特性と整合させる。
限られたトレーニングデータと低い重複率の下では、堅牢なパフォーマンスを維持している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:49:59 GMT)
Lion Cub: Minimizing Communication Overhead in Distributed Lion [9.4] 通信オーバーヘッドは、分散ディープラーニング、特に遅いイーサネット相互接続において重要な課題である。
分散学習に不可欠な3つの要因をLionを用いて分析し、コミュニケーション手法の最適化、効果的な量子化手法の同定、モーメント同期の必要性を評価する。
これはLionと比較して、エンドツーエンドのトレーニングで最大5倍のスピードアップを可能にします。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:08:24 GMT)
Mozart's Touch: A Lightweight Multi-modal Music Generation Framework Based on Pre-Trained Large Models [9.3] Mozart's Touchは、画像、ビデオ、テキストなどのクロスプラットフォーム入力と整合した音楽を生成することができるフレームワークである。
従来のエンド・ツー・エンドの手法とは異なり、モーツァルト・タッチはLPMを使って音楽生成モデルの訓練や微調整を必要とせず、視覚要素を正確に解釈する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:32:13 GMT)
FineWeb-zhtw: Scalable Curation of Traditional Chinese Text Data from the Web [9.2] FineWeb-zhtwは、中国の伝統的なユーザー向けに設計されたデータセットである。
我々は、英語と中国語の言語的差異に対処するために、巧妙に設計されたフィルタの複数の段階を考案した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:49:45 GMT)
Noise Diffusion for Enhancing Semantic Faithfulness in Text-to-Image Synthesis [9.1] 本稿では,大規模視覚言語モデルの言語理解能力を活用して,初期雑音ラテントの最適化を導くことを提案する。
本研究では,ノイズ拡散プロセスを導入し,雑音を更新し,分布の整合性を保ちながら意味的に忠実な画像を生成する。
実験により,様々な拡散モデル間のセマンティックアライメントを一貫して強化し,本フレームワークの有効性と適応性を示した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:40:47 GMT)
LLM Augmentations to support Analytical Reasoning over Multiple Documents [9.0] 本研究では,インテリジェンス解析の文脈内での深い解析的推論を強化するために,大規模言語モデル(LLM)の適用について検討する。
動的エビデンスツリー(DET)と呼ばれるメモリモジュールでLLMの能力を高めるアーキテクチャを開発し、複数の調査スレッドを開発・追跡する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:00:42 GMT)
JESTR: Joint Embedding Space Technique for Ranking Candidate Molecules for the Annotation of Untargeted Metabolomics Data [9.0] アノテーションのための新しいパラダイム(JESTR)を導入する。
分子指紋やスペクトルを明示的に構築する以前のアプローチとは異なり、JESTRはそれらの表現を共同空間に埋め込む。
JESTRを3つのデータセット上でmol-to-specおよびspec-to-FPアノテーションツールに対して評価する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:01:37 GMT)
Image Generation Diversity Issues and How to Tame Them [8.9] 生成メソッドは、実際のデータとほとんど区別できない出力を生成するが、多くの場合、データの完全なキャプチャに失敗する。
本稿では、生成モデルにおける現在の多様性の欠如と、これを測定するための共通指標の欠如に留意する。
画像検索問題として多様性をフレーミングすることでこれを実現し、合成データを用いて実画像の検索回数をクエリとして測定する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:00:21 GMT)
Luminance Component Analysis for Exposure Correction [8.9] 本稿では、発光成分分析(LCA)と呼ばれる露光補正法を提案する。
LCAは直交制約をU-Net構造に適用し、輝度関連および輝度非関連の特徴を分離する。
LCAは28.72 FPSの露光補正データセットにおいて最高のPSNR(21.33)とSSIM(0.88)を達成している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:21:58 GMT)
KernelGPT: Enhanced Kernel Fuzzing via Large Language Models [8.8] 我々はLarge Language Models (LLM) を通じてsyscall仕様を自動合成する最初のアプローチである KernelGPT を提案する。
以上の結果から, KernelGPTは最新の技術よりも, より新しい, 有効な仕様を作成できることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:10:44 GMT)
Can AI grade your essays? A comparative analysis of large language models and teacher ratings in multidimensional essay scoring [8.7] 大規模言語モデルは、教師のためのエッセイ・スコーリング作業を容易にする潜在的なソリューションを提供する。
大規模言語モデルのようなジェネレーティブAIの最近の発展は、教師にとってエッセイ・スコリング・タスクを促進する潜在的なソリューションを提供する。
我々は,ドイツの学生エッセイの評価において,オープンソースとクローズドソースの両方のLCMの性能と信頼性を評価した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:33:14 GMT)
Efficient Interactive LLM Serving with Proxy Model-based Sequence Length Prediction [8.7] 大型モデル(LLM)は、多くのドメインにわたるAIアプリケーションの新しい波を駆動している。
LLM出力シーケンス長の予測に光プロキシモデルを用いる投機的ショートストジョブファースト(SSJF)スケジューラを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:35:07 GMT)
Decision Making under the Exponential Family: Distributionally Robust Optimisation with Bayesian Ambiguity Sets [8.6] ベイズアンビグニティセット(DRO-BAS)を用いた分布ロバスト最適化について紹介する。
DRO-BASは、後部インフォームド曖昧性セットよりも最悪のケースリスクを最適化することで、モデルの不確実性に対してヘッジを行う。
どちらも条件下では、より効率的なシングルステージプログラムにつながる強い双対の定式化を認めていることを証明している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:49:02 GMT)
Blockchain Meets LLMs: A Living Survey on Bidirectional Integration [8.5] 2つの技術の利点と開発上の制約を評価し、それらの組み合わせの可能性と開発の可能性について検討する。
本稿では,ブロックチェーンへの大規模言語モデルの応用を主に検討し,主要な開発方向を6つ同定する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:54:08 GMT)
Learn from Foundation Model: Fruit Detection Model without Manual Annotation [8.5] 農業は十分なデータを持たない領域の1つである。
そこで本研究では,手動のアノテーションを使わずに,基礎モデルから効果的でドメイン固有な小さなモデルを学習するためのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:52:46 GMT)
ADAF: An Artificial Intelligence Data Assimilation Framework for Weather Forecasting [8.5] 本稿では,人工知能に基づくデータ同化フレームワーク(ADAF)を導入し,高品質なキロスケール分析を実現する。
大陸性米国(CONUS)の4つの準曲面変数に対してADAFを実装した。
その結果,ADAFは高分解能高速リフレッシュデータ同化システム(HRRRDAS)を16%から33%の精度で超えた。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:46:17 GMT)
Cautious Optimizers: Improving Training with One Line of Code [8.4] 我々はAdamWをCautious、例えばC-AdamWに改名した。
我々の理論的な洞察によって、全く新しい結果の族が明らかになる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:36:01 GMT)
CoCoNO: Attention Contrast-and-Complete for Initial Noise Optimization in Text-to-Image Synthesis [8.4] 自己注意マップと相互注意マップの相補的な情報を活用することで、初期潜伏者を最適化する新しいアルゴリズムであるCoCoNOを導入する。
本手法では,各自己注意区間が特定の被験者のクロスアテンションマップにのみリンクされていることを保証することで,所望のオーバーラップを最小化するアテンションコントラストロスと,これらのセグメント内でのアクティベーションを最大化し,各被写体が完全に明確に表現されることを保証するアテンション完全ロスという2つの新たなロス関数を導入する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:20:14 GMT)
Fostering Intrinsic Motivation in Reinforcement Learning with Pretrained Foundation Models [8.3] CLIPのような最近の基盤モデルの台頭は、事前訓練されたセマンティックにリッチな埋め込みを活用する機会を提供する。
導入モジュールは、完全な状態情報を有効に活用することができ、サンプル効率を大幅に向上させることができる。
基礎モデルによって提供される埋め込みは、トレーニング中にエージェントが構築したものよりも、時として優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:42:16 GMT)
Rethinking Diffusion for Text-Driven Human Motion Generation [8.2] 2023年以降、ベクトル量子化(VQ)に基づく離散生成法が人間の運動生成を支配している。
本研究では,現行のVQ法が有効である理由を考察し,既存の拡散型手法の限界について検討する。
本手法では,双方向のマスク付き自己回帰を行うことができるヒトの運動拡散モデルを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:59:42 GMT)
EgoSurgery-Tool: A Dataset of Surgical Tool and Hand Detection from Egocentric Open Surgery Videos [8.1] EgoSurgery-Phaseデータセットの拡張であるEgoSurgery-Toolについて紹介する。
EgoSurgery-Toolは15のカテゴリにまたがる49K以上の手術用ツールで構成され、大規模な手術用ツール検出データセットを構成する。
9つの一般的な物体検出器を用いてEgoSurgery-Toolの包括的解析を行い,手術器具と手指検出の両面での有効性を検証した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:58:10 GMT)
Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning [8.0] 本稿では,車線描画画像の異常検出を分類問題に変換する。
本研究では,データ前処理,マスク付き画像モデリング(MiM)手法による自己教師付き事前学習,ラベル平滑化によるクロスエントロピーベース損失を用いた微調整,後処理からなる4相パイプラインを提案する。
その結果,提案パイプラインは車線描画画像異常検出において優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:26:11 GMT)
Diffusion Features for Zero-Shot 6DoF Object Pose Estimation [7.9] 本研究は,ゼロショットポーズ推定における潜在拡散モデル (LDM) のバックボーンの影響を評価する。
LDMを用いたゼロショット方式でポーズを推定するテンプレートベースのマルチステージ手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:53:56 GMT)
HiCat: A Semi-Supervised Approach for Cell Type Annotation [7.9] HiCatは単細胞RNAシークエンシングデータから細胞型をアノテートするための半教師付きパイプラインである。
既知の細胞型に対する教師あり学習の強みと、教師なし学習を融合させ、新しいタイプの識別を行う。
公開されている10のゲノムデータセットをベンチマークすると、HiCatは他のメソッドを上回ります。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:42:56 GMT)
ZeroPS: High-quality Cross-modal Knowledge Transfer for Zero-Shot 3D Part Segmentation [7.9] 本研究では,2次元事前学習基礎モデルから3次元オブジェクトポイントクラウドへの高品質な知識伝達を実現する新しいパイプラインZeroPSを提案する。
ZeroPSでは,1)コビュー領域とSAMのプロンプト機構を活用することで2Dから3Dへのリフティング,2)2D-3DビュープロジェクションとGLIPのプロンプト機構を活用することで1Dクラスを3D部分に関連付ける,3)マルチビュー観察を活用することで予測性能を向上させる,といった関係が示された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:47:52 GMT)
When Quantum Meets Classical: Characterizing Hybrid Quantum-Classical Issues Discussed in Developer Forums [7.9] ハイブリッド量子古典コンピューティングは、両方の世界のベストを達成するための妥協として浮上している。
この研究は、ハイブリッドアプリケーションの開発者が直面している実世界の531の問題を徹底的に分析した。
ハイブリッドアプリケーションの開発者にとって繰り返し発生する障害を特定し、それらを克服するための行動可能なレコメンデーションを特定します。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:32:01 GMT)
Just-in-Time Detection of Silent Security Patches [7.8] セキュリティパッチは黙秘される可能性がある。つまり、CVEのような包括的なアドバイザリを常に備えているわけではない。
この透明性の欠如により、ユーザーは利用可能なセキュリティアップデートを気にせず、攻撃者が未パッチの脆弱性を悪用する十分な機会を提供する。
本稿では,大規模言語モデル(LLM)を活用して,生成されたコード変更説明を用いてパッチ情報を拡張することを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:21:16 GMT)
Scalable and Efficient Temporal Graph Representation Learning via Forward Recent Sampling [7.8] 時間グラフ表現学習(TGRL)は,実世界のネットワークにおける動的システムのモデリングに不可欠である。
従来のTGRL法は、時間的隣人の非効率なサンプリングのため、重要な計算課題や推論遅延に直面していることが多い。
本稿では,新しいTGRLフレームワークであるNo-Looking-Back (NLB)を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:41:01 GMT)
Exploring QUIC Dynamics: A Large-Scale Dataset for Encrypted Traffic Analysis [7.8] VisQUICは10万以上のラベル付きQUICトレースと対応するSSLキーのデータセットである。
トレースの視覚的表現を生成することにより、高度な機械学習(ML)アプリケーションと、暗号化されたQUICトラフィックの詳細な分析を容易にする。
我々のデータセットはQUICとHTTP/3プロトコルに関する包括的な研究を可能にし、暗号化されたトラフィック分析ツールの開発を支援する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:48:48 GMT)
Learning Distributions on Manifolds with Free-Form Flows [7.8] 本研究では,多様体上のデータ生成モデルであるManifold Free-Form Flows (M-FFF)を提案する。
M-FFF は、既知の射影を持つ任意の多様体に直接適応する。
従来のシングルステップメソッドと一貫して一致したり、性能が良くなったりします。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:47:11 GMT)
DoubleCCA: Improving Foundation Model Group Robustness with Random Sentence Embeddings [7.7] 基礎モデルのテキスト埋め込みを強化するために,ランダム文と正準相関解析(CCA)を利用する手法を提案する。
各種タスクやデータセットにおける本手法の有効性を実証し,性能とロバスト性の両方の観点から既存手法よりも優れていることを示す。
提案手法は実装が簡単で,既存のモデルに容易に組み込めるため,基礎モデルの堅牢性をグループベースのバイアスに改善するための実用的なソリューションとなる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:52:28 GMT)
Causal Adjacency Learning for Spatiotemporal Prediction Over Graphs [7.7] グラフ上の因果関係を発見するための因果関係学習(CAL)手法を提案する。
その結果,提案する隣接行列は因果関係を捉えることができることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:05:27 GMT)
Enhancing Autonomous Driving Safety through World Model-Based Predictive Navigation and Adaptive Learning Algorithms for 5G Wireless Applications [7.7] NavSecureは、脅威を予測し、安全なルートを定式化するビジョンベースのナビゲーションフレームワークである。
我々のアプローチは、大規模な実世界の試行錯誤学習の必要性を減らす。
NavSecureは、衝突防止やリスク低減など、重要な安全性指標に優れています。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:37:55 GMT)
Assessing the Answerability of Queries in Retrieval-Augmented Code Generation [7.7] 本研究は,有効な回答が生成できるかどうかを評価するための課題を提案する。
我々は、Retrieval-augmented Code Generability Evaluation (RaCGEval)と呼ばれるベンチマークデータセットを構築し、このタスクを実行するモデルの性能を評価する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:18:33 GMT)
GAST: Sequential Gaussian Avatars with Hierarchical Spatio-temporal Context [7.7] 3D人間のアバターは、標準放射場とフレームごとの歪みを観察することで、高忠実なレンダリングとアニメーションを可能にします。
空間SMPL(-X)のポーズや時間埋め込みに依存する既存の手法は、それぞれ粗い品質や限られたアニメーションの柔軟性に悩まされている。
空間情報と時間情報の両方を階層的に統合することで、3DGSと3DGSを統合化するためのフレームワークであるGASTを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:05:19 GMT)
Will an AI with Private Information Allow Itself to Be Switched Off? [7.6] さまざまな目標を達成すれば、AIがオフスイッチを無効にできる可能性がある。
しかし実際には、人間は限られた情報しか持っていない。
最適なプレイでは、完全に合理的な人間を助けるAIエージェントでさえ、シャットダウンを避けることがある。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:09:48 GMT)
Safety Filtering While Training: Improving the Performance and Sample Efficiency of Reinforcement Learning Agents [7.6] 強化学習(RL)コントローラは柔軟で性能が高いが、安全性を保証することは滅多にない。
安全フィルタは、柔軟性を維持しながら、RLコントローラにハードセーフの保証を与える。
我々は、評価中にのみ適用するのではなく、トレーニング用RLコントローラに安全フィルタを組み込むためのいくつかの変更を分析した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:44:01 GMT)
Quadratic Gaussian Splatting for Efficient and Detailed Surface Reconstruction [7.5] Quadratic Gaussian Splatting (QGS) は、円盤を二次曲面に置き換える新しい方法である。
QGSは、通常の一貫性項を導くために空間曲率を描画し、過剰な平滑化を効果的に低減する。
私たちのコードはオープンソースとしてリリースされます。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:55:00 GMT)
EgoSurgery-Phase: A Dataset of Surgical Phase Recognition from Egocentric Open Surgery Videos [7.4] EgoSurgery-Phaseという位相認識のための新しいエゴセントリックオープン手術ビデオデータセットを導入する。
このデータセットは、9つの異なる手術フェーズにまたがる15時間の実際の手術ビデオで構成されている。
動画の他に、EgoSurgery-Phaseは視線を提供しています。私たちが知る限り、これは外科的位相認識のための、最初のオープンな手術ビデオデータセットです。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:03:02 GMT)
Deanthropomorphising NLP: Can a Language Model Be Conscious? [7.4] 我々は、そのような大きな言語モデルは、センシティブでもなく、意識的にもなく、特にLaMDAは、その資格を持つ他の類似したモデルよりも進歩していないという立場を取る。
感性の主張は,NLP報告における人為的言語の使用傾向の広範化の一環と考えられる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:55:29 GMT)
FTII-Bench: A Comprehensive Multimodal Benchmark for Flow Text with Image Insertion [7.3] Flow Text with Image Insertion Taskでは、LVLMは画像理解、命令理解、長文解釈において優れた能力を持つ必要がある。
318の高品質な中国語画像テキストニュース記事と307の高品質な英語画像テキストニュース記事を含む、画像挿入ベンチマーク付きフローテキスト(FTII-Bench)を導入し、10の異なるニュースドメインをカバーする。
9つのオープンソースと2つのクローズドソースのLVLMと2つのCLIPベースのモデルを評価した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:24:23 GMT)
Recommender Systems for Good (RS4Good): Survey of Use Cases and a Call to Action for Research that Matters [7.3] 我々は、推薦システムは社会的善(RS4Good)に寄与すべきだと主張する。
本稿ではまず,社会問題問題に対するレコメンデータシステムの利用が,文献で成功を収めた事例について論じる。
次に、RS4Goodの研究を成功させるために必要となるパラダイムシフトを概説する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:27:50 GMT)
Learning New Concepts, Remembering the Old: A Novel Continual Learning [7.3] 概念ボトルネックモデル(CBM)は、アーキテクチャに人間の理解可能な概念を導入することにより、モデルの解釈可能性を高める。
既存のCBMは静的データセットを前提としており、実際のデータストリームへの適応能力を制限している。
我々は,CBMのコンセプト・インクリメンタル・クラス・インクリメンタル・ラーニングタスクを新たに定義し,モデルがそれまでの知識を維持しつつ,時間とともに新しい概念・クラスを蓄積できるようにする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:44:14 GMT)
Text-to-Image Synthesis: A Decade Survey [7.3] テキスト・ツー・イメージ合成(T2I)は、テキスト記述から高品質な画像を生成することに焦点を当てている。
本調査では,T2Iに関する最近の研究440件について概説する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:40:32 GMT)
Fast Stochastic Composite Minimization and an Accelerated Frank-Wolfe Algorithm under Parallelization [7.2] 2つの凸関数の和を最小化する問題を考える。
1つはリプシッツ連続勾配を持ち、オークルを介してアクセスでき、もう1つは「単純」である。
我々は、$tildeO (1/ sqrtepsilon)$ iterationsで$epsilon$prialdual gap(期待して)を達成することができることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:47:56 GMT)
LATUP-Net: A Lightweight 3D Attention U-Net with Parallel Convolutions for Brain Tumor Segmentation [7.2] LATUP-Netは、並列畳み込みを備えた軽量な3DアテンションU-Netである。
高いセグメンテーション性能を維持しつつ、計算要求を大幅に削減するように設計されている。
BraTS 2020データセットの平均Diceスコアは88.41%、83.82%、73.67%であり、BraTS 2021データセットでは、それぞれ90.29%、89.54%、83.92%である。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:50:52 GMT)
A Study of Malware Prevention in Linux Distributions [7.2] オープンソースソフトウェアパッケージに対する悪意ある攻撃は、ますます懸念される。
本研究は,Linuxディストリビューションリポジトリにおけるマルウェアの防止と検出の課題について考察する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:30:31 GMT)
Observation of quantized vortex in an atomic Bose-Einstein condensate at Dirac point [7.2] グラフェン様光ハニカム格子中の原子ボース-アインシュタイン凝縮物に基づくディラック点における量子化された渦の出現を観察した。
我々の研究は、量子気体中で渦を生成する新しい方法を提供し、この方法は汎用的で、様々な種類の光学格子に適用できる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:10:46 GMT)
EvoChain: a Recovery Approach for Permissioned Blockchain Applications [7.1] 本稿では、時間制限または特定の条件下でのデータリアクションとリカバリの制御可能な変更性を導入するチェーンコードフレームワーク拡張であるEvoChainについて述べる。
WineTrackerはHyperledger Fabricベースのサプライチェーンアプリケーションです。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:02:17 GMT)
Decentralized Storage And Self-Sovereign Identity For Document-Based Claims [7.1] 分散IDシステムは、オンラインアクティビティのトラッキングやデータ漏洩によって、ユーザのプライバシを侵害することが多い。
この記事では、分散化されたアプリケーションのプロトタイプであるSoverClaimを紹介します。
プロトタイプは、750ms以下の応答時間を達成するために、自己主権のアイデンティティとドキュメントベースのクレームのシームレスな統合を実証している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:28:44 GMT)
CapHDR2IR: Caption-Driven Transfer from Visible Light to Infrared Domain [7.0] 赤外線(IR)イメージングは、極端光条件下でコンテンツをキャプチャするユニークな能力のため、いくつかの分野で利点がある。
代替として、可視光は赤外線画像の合成に使用できるが、それによって画像の細部への忠実さが失われ、シーンの文脈的認識の欠如により不整合が生じる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:23:14 GMT)
Annealing Flow Generative Model Towards Sampling High-Dimensional and Multi-Modal Distributions [7.0] Annealing Flowは、高次元およびマルチモーダル分布からサンプリングするために設計された、連続正規化フローベースのアプローチである。
AFは有効かつバランスの取れたモード探索を保証し、サンプルサイズと寸法の線形複雑さを達成し、非効率な混合時間を回避している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:05:27 GMT)
Probing the Mid-level Vision Capabilities of Self-Supervised Learning [7.0] 自己教師付き学習アプローチは、主にハイレベルな認識タスクのために設計され、評価される。
私たちの研究はSSLモデルが学んだことの全体像とタイムリーなビューを提供し、主にハイレベルなビジョンタスクに焦点を当てた既存の研究を補完します。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:59:50 GMT)
Unlearn to Relearn Backdoors: Deferred Backdoor Functionality Attacks on Deep Learning Models [6.9] バックドア攻撃の新たなパラダイムとして,Deferred Activated Backdoor Functionality (DABF)を紹介した。
従来の攻撃とは異なり、DABFは当初バックドアを隠蔽し、起動しても良質な出力を生成する。
DABF攻撃は、マシンラーニングモデルのライフサイクルで一般的なプラクティスを利用して、モデル更新と初期デプロイ後の微調整を実行する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:51:39 GMT)
Learning 3D Representations from Procedural 3D Programs [6.9] 自己教師付き学習は、ラベルのない3Dポイントクラウドから転送可能な3D表現を取得するための有望なアプローチとして登場した。
簡単なプリミティブと拡張を使って3次元形状を自動的に生成する手続き型3Dプログラムから3次元表現を学習する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:59:57 GMT)
A Graph Neural Architecture Search Approach for Identifying Bots in Social Media [6.8] グラフ畳み込みネットワーク(RGC)に適したNAS(Neural Architecture Search)技術の実装について紹介する。
本モデルでは,ユーザ関係とメタデータの両方を組み込んだグラフを構築した上で,DFG-NAS を用いて RGC の最適構成を自動的に検索する。
検索期間中に最高性能の5つのアーキテクチャを調査し,85.7%の精度を達成し,最先端のモデルを上回った。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:10:16 GMT)
Semi-supervised Underwater Image Enhancement Using A Physics-Aware Triple-Stream Network [6.8] 我々は、物理に基づく画像形成モデル(IFM)と深層学習技術の両方を水中画像強調(UIE)に活用する。
PATS-UIENetは、直接信号伝送推定水蒸気(D-Stream)、後方信号伝送推定水蒸気(B-Stream)、アンビエント光推定水蒸気(A-Stream)からなる。
また、ラベル付き画像とラベルなし画像の両方を利用して、IFMにインスパイアされた半教師付き学習フレームワークを採用し、不十分なデータの問題に対処する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:53:06 GMT)
Interpolating neural network: A novel unification of machine learning and interpolation theory [6.8] 我々は、エンジニアリングソフトウェア2.0を実現するための補間ニューラルネットワーク(INN)を導入する。
INNは、従来の多層パーセプトロン(MLP)や物理インフォームドニューラルネットワーク(PINN)よりも、モデル精度に匹敵するトレーニング可能なパラメータや解決可能なパラメータが少ない。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:00:32 GMT)
A Survey of Blockchain-Based Privacy Applications: An Analysis of Consent Management and Self-Sovereign Identity Approaches [6.7] 現代の分散アプリケーションは、高度な人工知能(AI)と機械学習アルゴリズムを利用してビジネスプロセスを自動化する。
AI技術の普及は、現実世界のネットワークにおけるデータ需要を増加させる。
テクノロジは監査性や不変性をマルチステークホルダーアプリケーションに提供しますが、プライバシに対する固有のサポートは欠如しています。
この記事では、ブロックチェーンベースのプライバシシステムに関する文献を調査し、プライバシを保護するツールを特定します。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:10:30 GMT)
DeDe: Detecting Backdoor Samples for SSL Encoders via Decoders [6.7] 自己教師付き学習(SSL)は、大量のラベルのないデータで高品質な上流エンコーダのトレーニングに広く利用されている。
バックドア攻撃は トレーニングデータの ごく一部を汚染するだけ
本稿では,被害者エンコーダの共起によるバックドアマッピングの活性化を検知し,入力をトリガーする新しい検出機構であるDeDeを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:26:22 GMT)
Leveraging the Power of MLLMs for Gloss-Free Sign Language Translation [6.7] そこで我々は,Gloss-free Multimodal Sign Language Translationフレームワークを提案する。
マルチモーダルな大言語モデルを用いて手話コンポーネントの詳細なテキスト記述を生成する。
提案手法は,ベンチマークデータセットPHOENIX14TとCSL-Dailyの最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:01:41 GMT)
ST-Align: A Multimodal Foundation Model for Image-Gene Alignment in Spatial Transcriptomics [6.7] 空間転写学 (Spatial transcriptomics, ST) は, 高解像度の病理像と全スライディングスケールの個々の部位における全スライディング表現プロファイルを提供する。
ST-Alignは、空間コンテキストを組み込んだ画像生成ペアを深く整合させる、ST用に設計された最初の基礎モデルである。
ST-AlignはSTコンテキストに合わせた特殊なエンコーダを採用しており、さらにマルチモーダル核融合のためのアテンションベース核融合ネットワーク(ABFN)を採用している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:15:07 GMT)
Flexible Physical Camouflage Generation Based on a Differential Approach [6.6] 本研究は、特に対向性カモフラージュに適したニューラルレンダリングに対する新しいアプローチを導入する。
我々の手法はFPAと呼ばれ、照明条件や材質の変化を忠実にシミュレートすることで従来の手法を超えています。
逆行性カモフラージュ法におけるFPAアプローチの有用性と有効性について検討した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:07:14 GMT)
Any3DIS: Class-Agnostic 3D Instance Segmentation by 2D Mask Tracking [6.6] 既存の3Dインスタンスセグメンテーションメソッドは、オーバーセグメンテーションの問題に頻繁に遭遇し、下流タスクを複雑にする冗長で不正確な3D提案につながります。
この課題は、フレーム全体に密集した2Dマスクを点雲に上げ、直接の監督なしに3D候補の提案を形成する、教師なしのマージンアプローチから生じる。
本研究では,2次元マスクセグメンテーション・トラッキング基盤モデル(SAM-2)を用いて,映像フレーム間の一貫したオブジェクトマスクを確保する3次元マスク追跡モジュールを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:26:31 GMT)
Complementarity in Human-AI Collaboration: Concept, Sources, and Evidence [6.6] 我々は相補性の概念を開発し、その理論的ポテンシャルを定式化する。
情報と能力の非対称性を相補性の2つの主要な源とみなす。
我々の研究は、意思決定における人間とAIの相補性の包括的な理論的基盤を提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:04:11 GMT)
M3: Mamba-assisted Multi-Circuit Optimization via MBRL with Effective Scheduling [6.5] M3は、Mambaアーキテクチャと効果的なスケジューリングを用いた新しいモデルベースRL(MBRL)手法である。
既存のRL法に比べて試料効率が大幅に向上する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 00:30:49 GMT)
A Survey of Event Causality Identification: Principles, Taxonomy, Challenges, and Assessment [6.5] 事象因果同定(ECI)は自然言語処理(NLP)において重要な課題となっている。
本分類法は文レベル(SECI)と文書レベルの事象因果同定(DECI)の2つの主要なタスクに従ってECIの手法を分類する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:55:09 GMT)
Local and Global Feature Attention Fusion Network for Face Recognition [6.5] 本稿では,特徴量に基づく地域的・グローバルな特徴注意融合(LGAF)ネットワークを提案する。
ネットワークは特徴品質に応じて局所特徴とグローバル特徴の注意を適応的に割り当て、より差別的で高品質な顔特徴を得る。
実験の結果、LGAFは4ドルの検証セットで最高の平均性能を達成していることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:55:57 GMT)
What can LLM tell us about cities? [6.4] 本研究では,世界規模で都市や地域に関する知識を提供する上で,大規模言語モデル(LLM)の能力について検討する。
実験の結果、LLMはグローバルな都市に広範に多様な知識を組み込んでおり、MLモデルはLLMに由来する特徴に基づいて一貫して訓練され、予測精度が向上していることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:07:56 GMT)
Even Sparser Graph Transformers [6.3] グラフ変換器は長距離依存モデリングに優れるが、一般的には入力グラフ内のノード数において二次記憶の複雑さを必要とする。
Exphormerのようなスパースアテンションの変種は役に立つが、優れたパフォーマンスを得るためには入力グラフに高次拡張を必要とする可能性がある。
本研究では,各種グラフデータセットのメモリ要求を大幅に削減することで,Spexphormerの性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:59:25 GMT)
Federated Hypergraph Learning: Hyperedge Completion with Local Differential Privacy [6.3] FedHGLは、複数のクライアントにわたる包括的なハイパーグラフニューラルネットワークを協調的にトレーニングするように設計されている。
クロスクライアント機能アグリゲーションは中央サーバで実行され、クライアントがこの情報を活用できるように配布される。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:43:10 GMT)
Entropic uncertainty and quantum non-classicality of Unruh-Dewitt detectors in relativity [6.3] 本研究では,Unruh-Dewitt検出器の対に関する量子メモリ支援エントロピー不確実性と量子相関性に対するUnruh熱雑音の影響について検討する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:49:50 GMT)
Generalized Principal-Agent Problem with a Learning Agent [6.2] 古典的なプリンシパルエージェント問題は、エージェントがプリンシパルのコミット戦略に最も反応できると仮定することが多い。
エージェントが平均的学習アルゴリズム(regretではないが、swap-regretではない)を使用する場合、プリンシパルは$U*$よりもはるかに優れた処理を行うことができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:29:07 GMT)
Adversarial Attacks for Drift Detection [6.2] 本研究は、よく用いられるドリフト検出スキームの欠点について研究する。
ドリフト中のデータストリームを検出せずに構築する方法を示す。
特に,一般的な検出手法に対して,可能なすべての逆数を計算する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:25:00 GMT)
Learning from Relevant Subgoals in Successful Dialogs using Iterative Training for Task-oriented Dialog Systems [6.2] タスク指向ダイアログ(ToD)システムは、ユーザ目標を達成するために複数のサブゴールを解決しなければならないが、フィードバックはダイアログの最後にのみ取得されることが多い。
ToDシステムを改善するための反復的トレーニング手法であるSuIT(subgoal-aware ITerative Training)を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:47:31 GMT)
SplatAD: Real-Time Lidar and Camera Rendering with 3D Gaussian Splatting for Autonomous Driving [6.2] カメラとライダーデータのセンサリアリスティックレンダリングのための既存のニューラル放射場(NeRF)法は、低レンダリング速度に悩まされている。
SplatADは,カメラとライダーデータの両方の動的シーンをリアルかつリアルタイムにレンダリングするための,最初の3DGSベースの手法である。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:18:22 GMT)
Quasi-Lindblad pseudomode theory for open quantum systems [6.2] ガウス浴を線形結合した開量子系の力学を研究するための新しい枠組みを導入する。
提案手法は, 連続浴を擬似モードの補助的な離散集合と散逸ダイナミクスに置き換える。
この準Lindblad擬モードの定式化は、複素指数の複素重み付き和の観点から、入浴相関関数の表現につながることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:34:08 GMT)
Functionality understanding and segmentation in 3D scenes [6.2] Fun3DUは、3Dシーンで機能を理解するために設計された最初のアプローチである。
Fun3DUは、関心の対象を特定するためにChain-of-Thought推論を通じてタスク記述を解析するために言語モデルを使用する。
SceneFun3DでFun3DUを評価し、230のシーンで3000以上のタスク記述を含む、このタスクをベンチマークする最も最近で唯一のデータセットである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:57:48 GMT)
Live Fitness Coaching as a Testbed for Situated Interaction [6.0] QEVDベンチマークとデータセットは、フィットネスコーチングの挑戦的かつ制御されながら現実的な領域における人間とAIの相互作用を探索するものだ。
このベンチマークでは、複雑な人間の行動を認識し、起こりうる誤りを特定し、リアルタイムで適切なフィードバックを提供するために、視覚言語モデルが必要である。
そこで本研究では,適切なタイミングで適切なフィードバックで人間の行動に非同期に応答できる,シンプルなエンドツーエンドストリーミングベースラインを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:25:06 GMT)
Towards Clean-Label Backdoor Attacks in the Physical World [5.9] 本稿では,顔認証と動物分類に関する実験を通じて,新たな攻撃パラダイム,SMSbfclean-label physical backdoor attack (CLPBA)について検討する。
CLPBAは、正しい毒殺アルゴリズムと物理的トリガーで深刻な脅威になる可能性がある。
本研究は,意図しないオブジェクトやクラスが対象クラスとして誤って分類される場合に発生する,CLPBAの制限として,偶然のバックドアアクティベーションが強調される。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:40:54 GMT)
Neural Network-based High-index Saddle Dynamics Method for Searching Saddle Points and Solution Landscape [5.8] ニューラルネットワークを用いたハイインデックスサドルダイナミックス(NN-HiSD)法を提案する。
ニューラルネットワークに基づく代理モデルを用いてエネルギー関数を近似する。
我々は、明示的なエネルギー関数と非明示的なエネルギー関数を持つシステムで数値実験を行う。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:57:05 GMT)
Constraining symmetron fields with a levitated optomechanical system [5.7] シンメトロンは、物質と結合するときの重力を変化させると考えられている。
従来の測定値の高密度環境でのスクリーニング動作のため、シンメトロン場の検出は困難である。
本稿では,共振器のパラメータに制約を設定する手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:31:40 GMT)
Where is Dmitry going? Framing 'migratory' decisions in the criminal underground [5.7] サイバー犯罪の地下には数百のフォーラムコミュニティがあり、市場や情報交換プラットフォームとして機能している。
TelegramとDiscordにおけるサイバー犯罪コミュニティの出現は、エコシステムの断片化と適応性の向上を浮き彫りにしている。
我々は、参加者が1つのフォーラムから別のフォーラムに移動するきっかけとなる経済的なインセンティブと信頼構築メカニズムについて検討する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:17:51 GMT)
Privacy-Preserving Federated Learning with Differentially Private Hyperdimensional Computing [5.7] フェデレートラーニング(FL)はIoT(Internet of Things)環境での効率的なデータ交換に不可欠である。
プライバシ保護によるフェデレーションハイパー次元コンピューティング(FedHDPrivacy)について紹介する。
FedHDPrivacyは、前回のラウンドから累積ノイズを理論的に追跡することで、プライバシとパフォーマンスのバランスを慎重に管理する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 02:23:02 GMT)
Enhancing Multimodal Medical Image Classification using Cross-Graph Modal Contrastive Learning [5.7] 本稿では,マルチモーダルな医用画像分類のためのクロスグラフ・モーダルコントラスト学習フレームワークを提案する。
提案手法は、パーキンソン病(PD)データセットと公共メラノーマデータセットの2つのデータセットで評価される。
以上の結果から,CGMCLは従来手法よりも精度,解釈可能性,早期疾患予測に優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:35:14 GMT)
Style-Pro: Style-Guided Prompt Learning for Generalizable Vision-Language Models [5.5] Style-Proは、CLIPのゼロショット一般化能力を緩和し、保存する新しいプロンプト学習フレームワークである。
Style-Proは、ベース・ツー・ニューの一般化、クロス・データセットの転送、ドメインの一般化など、さまざまな設定における最先端のメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 00:20:53 GMT)
ROADS: Robust Prompt-driven Multi-Class Anomaly Detection under Domain Shift [5.5] ROADSは階層的なクラス認識のプロンプト統合機構を使用して、異常なクラス間の干渉を軽減する。
MVTec-ADデータセットとVISAデータセットの実験は、ROADSが異常検出と局所化の両方において最先端の手法を上回ることを示した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 02:34:40 GMT)
Privacy Protection in Personalized Diffusion Models via Targeted Cross-Attention Adversarial Attack [5.4] 本稿では,CoPSAM(Selective Attention Manipulation)による新規かつ効率的な対向攻撃法を提案する。
この目的のために、クリーンなサンプルに付加される知覚不可能なノイズを慎重に構築し、その逆のノイズを得る。
CelebA-HQ顔画像データセットのサブセットに対する実験的検証は、我々のアプローチが既存の手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:39:18 GMT)
Phase-Informed Tool Segmentation for Manual Small-Incision Cataract Surgery [5.3] 白内障手術は世界中で最も一般的な手術であり、発展途上国では非常に高い負担がかかる。
白内障-MSICSは,18の手術相と3,527のフレームに,13の手術ツールを画素レベルで付加した53の手術ビデオを含む,最初の総合的データセットである。
ファウンデーションモデルからの擬似ラベルを利用した,位相条件デコーダと簡易かつ効果的な半教師付きセットアップを導入することで,ツールセグメンテーションを強化する新しいフレームワークであるToolSegを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:22:42 GMT)
Revisiting DDIM Inversion for Controlling Defect Generation by Disentangling the Background [5.2] 異常検出において、異常データの不足は、ディープニューラルネットワーク表現を効果的に活用する上での課題となる。
本稿では,欠陥の認知に影響を及ぼす背景と欠陥の関係をモデル化することを提案する。
提案手法は,対象の通常の画像に不変な背景を持つ欠陥を生じさせることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:05:11 GMT)
DiTAS: Quantizing Diffusion Transformers via Enhanced Activation Smoothing [5.2] 効率的な拡散変換器(DiT)のためのデータフリー後トレーニング量子化(PTQ)法を提案する。
DiTASは、入力アクティベーションにおけるチャネルワイド・アウトレイアの影響を軽減するために、時間的凝集平滑化手法が提案されている。
提案手法により,DiTの4ビット重み付き8ビットアクティベーション(W4A8)量子化が可能であり,全精度モデルとして同等の性能を維持した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:36:31 GMT)
Using Drone Swarm to Stop Wildfire: A Predict-then-optimize Approach [5.2] ドローンの群れの銃撃戦は、山火事の現場における非常に複雑な環境条件など、大きな課題に直面している。
我々はこれらの課題に対処し、効果的なドローン群銃撃戦を可能にするための予測最適化アプローチを開発した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:10:03 GMT)
U-WNO:U-Net-enhanced Wavelet Neural Operator for fetal head segmentation [5.2] 本稿では,新しいU-Net-enhanced Wavelet Neural Operator(U-WNO)の開発について述べる。
ウェーブレット分解、演算子学習、エンコーダ・デコーダ機構を組み合わせる。
U-WNOは、複数の科学と産業の分野で大きな影響を与える可能性がある。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:48:32 GMT)
Ultrahigh-fidelity spatial mode quantum gates in high-dimensional space by diffractive deep neural networks [5.2] 本稿では,光子の多次元空間モードを用いた高次元量子ゲートの構成について述べる。
我々のゲートは、量子プロセストモグラフィーによって特徴づけられるように、99.6(2)%の高忠実度を示す。
我々の研究は、ディープラーニングを用いて特定の量子ゲートを設計するための扉を開き、量子計算の信頼性の高い実行の可能性を秘めている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:16:55 GMT)
From Dashcam Videos to Driving Simulations: Stress Testing Automated Vehicles against Rare Events [5.1] 現実的な運転シナリオを用いたシミュレーションにおける自動運転システム(ADS)のテストは、その性能を検証する上で重要である。
本稿では,現実の自動車事故映像の詳細なシミュレーションシナリオへの変換を自動化する新しいフレームワークを提案する。
予備結果は,完全自動化と人的介入を伴わず,リアルタイム変換を数分で完了させるという,かなりの時間効率を示した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:01:54 GMT)
SEMU-Net: A Segmentation-based Corrector for Fabrication Process Variations of Nanophotonics with Microscopic Images [4.9] 走査型電子顕微鏡画像(SEM)を自動的にセグメント化する手法であるSEMU-Netを導入し,それらを用いて,U-Netとその変種に基づく2つのディープニューラルネットワークモデルをトレーニングする。
予測モデルは製造に伴う変動を予測し、補正モデルはこれらの問題に対処するために設計を調整する。
実験結果から, セグメンテーションU-Netの平均IoUスコアは99.30%, タンデムアーキテクチャにおける補正注意U-Netの平均IoUスコアは98.67%に達した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:49:59 GMT)
FREE-Merging: Fourier Transform for Model Merging with Lightweight Experts [4.7] 既存のモデルマージメソッドは、パフォーマンスとデプロイメントコストのトレードオフに直面する。
本稿では、周波数領域情報を利用して有害な特殊情報を効率的にフィルタリングするFR-Mergingを提案する。
フリーマージン(FR-Merging with light expert)は、トレーニングコスト、推論速度、ストレージ要件、パフォーマンスのバランスのとれたトレードオフを打つ。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:35:01 GMT)
RevSAM2: Prompt SAM2 for Medical Image Segmentation via Reverse-Propagation without Fine-tuning [4.6] 本稿では,医療画像セグメンテーションのための簡易かつ効果的な自己補正フレームワークであるRevSAM2を紹介する。
RevSAM2は、微調整を必要とせず、目に見えない3D画像分割タスクにおいて優れた性能を発揮する。
我々は,ラベル効率の良い医用画像セグメンテーションにおけるSAM2の可能性について,微調整なしで初めて検討した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:58:24 GMT)
Solaris: A Foundation Model of the Sun [4.6] 私たちは、太陽の大気を予測するための最初の基礎モデルであるSolarisを紹介します。
我々は、ソーラー・ダイナミクス・オブザーバトリー(Solar Dynamics Observatory)の13年間のフルディスク・マルチ波長の太陽画像を活用している。
Solarisは109万のパラメータを持つ大規模な3D Swin Transformerアーキテクチャ上に構築されている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:36:15 GMT)
Interpretable Video based Stress Detection with Self-Refine Chain-of-thought Reasoning [4.5] 本稿では,ビデオベースストレス検出のための新しい解釈可能なアプローチを提案する。
本手法は,ストレスレベルを示すビデオシーケンスから微妙な行動・生理的手がかりを抽出することに焦点を当てる。
我々は、従来のビデオベースストレス検出法と比較して、その優れた性能を示すために、いくつかのパブリックおよびプライベートなデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:57:04 GMT)
LaVida Drive: Vision-Text Interaction VLM for Autonomous Driving with Token Selection, Recovery and Enhancement [4.5] 本稿では,自律運転のための新しい,効率的なVQAフレームワークであるLaVida Driveを紹介する。
LaVida Driveは、詳細な視覚知覚のための高解像度入力を維持しながら、時間データをシームレスに統合する。
複雑な詳細のための高分解能データを保持し、時間解析のために低分解能入力を使用することで空間処理を最適化する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:18:42 GMT)
DocEDA: Automated Extraction and Design of Analog Circuits from Documents with Large Language Model [4.5] 本稿では,先進的なコンピュータビジョン技術と大規模言語モデル(LLM)を活用して,文書からシームレスに電気パラメータを抽出する自動システムDocEDAを紹介する。
実験の結果,DocEDAは回路設計文書の処理効率と電気パラメータ抽出の精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:41:43 GMT)
A fluorescent-protein spin qubit [4.5] 黄色蛍光タンパク質(EYFP)の光調節可能なスピン量子ビットの実現
近赤外レーザーパルスは、最大44%のスピンコントラストを持つトリプレット状態の読み出しを可能にする。
哺乳類細胞では, 複雑な細胞内環境にもかかわらず, コントラストとコヒーレント制御を保ち, クビットを発現する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:00:00 GMT)
Unsupervised Event Outlier Detection in Continuous Time [4.4] 我々は、我々の知る限り、異常事象を検出するための最初の教師なし外乱検出手法を開発した。
我々は、実際のデータから修正されたデータを識別する'ディスクリミネータ'を用いて、データの異常値を補正する'ジェネレータ'を訓練する。
実験結果から,本手法は最先端手法よりも高精度にイベント異常を検出できることが示唆された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:29:39 GMT)
Three Cars Approaching within 100m! Enhancing Distant Geometry by Tri-Axis Voxel Scanning for Camera-based Semantic Scene Completion [4.4] ScanSSCは、Scan ModuleとScan Lossで構成されるカメラベースのセマンティックシーンコンプリートモデルである。
スキャンモジュールは軸方向のマスキングを使用しており、各軸は近距離から遠距離のカスケードマスキングを用いており、これは以前のボクセルとの関係を捉えることができる。
Scan Lossは累積ロジットとそれに対応するクラス分布のそれぞれの軸に沿って、近距離方向のクロスエントロピーを計算し、リッチなコンテキスト認識信号を遠くのボクセルに伝搬する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:33:43 GMT)
A Riemannian ADMM [4.4] 問題のクラスは、機械学習と統計学において重要な応用を見出す。
我々のアルゴリズムは、スパース非滑らかな対象多様体を解くための最初のADM ADMアルゴリズムである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:35:48 GMT)
Boundless Socratic Learning with Language Games [4.3] は、最初のデータや知識に存在しているものよりもパフォーマンスを大幅に向上させることができると論じています。
本稿では,言語ゲームの概念に基づく構築型フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:16:16 GMT)
Integrating Geodesic Interpolation and Flow Matching for Non-Autoregressive Text Generation in Logit Space [4.3] 非自己回帰型言語モデルは、自然言語処理分野における自己回帰型モデルの効果的な代替手段として出現している。
本研究では,Kulback-Leibler分散測地学を用いて,離散列の初期分布と対象分布を補間する新しい流れマッチング手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:15:41 GMT)
AI-Native Multi-Access Future Networks -- The REASON Architecture [4.3] REASONプロジェクトは、E2Eサービスオーケストレーション、サステナビリティ、セキュリティ、信頼管理など、将来のネットワークデプロイメントにおける技術的な課題に対処することを目的としている。
本稿では,REASONのアーキテクチャと今後のネットワークに対する要件について述べる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:58:44 GMT)
Kibble-Zurek law in dissipative critical dynamics [4.2] 臨界点を横切る二部格子上の二バンドフェルミオン系の族における散逸的クエンチダイナミクスについて検討する。
発散はキブルズレック(KZ)スケーリング法則を指数関数的に抑制し、発散の量子ジャンプ部分が反KZ行動の原因となることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:11:28 GMT)
Very Basics of Tensors with Graphical Notations: Unfolding, Calculations, and Decompositions [4.1] この講義ノートはテンソルの基本と、それらを数学的記号やグラフィカル表記で表現する方法に関するものである。
この講義ノートの目的は、テンソルの基本とそれらを数学的記号やグラフィカル表記で表現する方法を学ぶことである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:02:35 GMT)
ConVerSum: A Contrastive Learning-based Approach for Data-Scarce Solution of Cross-Lingual Summarization Beyond Direct Equivalents [4.0] 言語間の要約は自然言語処理の洗練された分野である。
高品質なCLSデータがない場合、CLSには実現可能な解決策がない。
コントラスト学習のパワーを活かしたCLSのための新しいデータ効率のアプローチであるConVerSumを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:52:05 GMT)
LLMPirate: LLMs for Black-box Hardware IP Piracy [4.0] 大規模言語モデル(LLM)は、ハードウェア開発プロセス全体にわたるセキュリティ上の脆弱性に対して、新たな攻撃シナリオを誘発することができる。
このような攻撃ベクトルの1つは知的財産権(IP)海賊行為である。
LLMPirate は LLM をベースとした最初の手法で, 検出を回避した回路設計の海賊版を生成できる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:54:06 GMT)
Efficient Biological Data Acquisition through Inference Set Design [4.0] 本研究は,システム全体としての所望の精度を実現するため,最小の候補群を選択することを目的とする。
本稿では,このメカニズムを推論セット設計と呼び,信頼性に基づくアクティブラーニングソリューションを用いて,挑戦的な事例を抽出する手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:51:33 GMT)
Pureformer-VC: Non-parallel One-Shot Voice Conversion with Pure Transformer Blocks and Triplet Discriminative Training [3.9] ワンショット音声変換は、ターゲット話者の音色を1つの音声サンプルで一致させるために、任意の音源音声の音色を変更することを目的としている。
既存のスタイル転送型VC法は, 音声表現の絡み合いに頼っていた。
本稿では, Conformer ブロックを用いてアンタングル化されたエンコーダを構築する Pureformer-VC と, Zipformer ブロックを用いてスタイル転送デコーダを構築する Zipformer-VC を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:35:22 GMT)
Finding Structure in Language Models [3.9] この論文は、言語モデルが人間のものと似た文法構造を深く理解しているかどうかに関するものである。
我々は,大規模言語モデルの複雑な性質の理解を深める新しい解釈可能性技術を開発する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:37:24 GMT)
Sparse patches adversarial attacks via extrapolating point-wise information [3.8] そこで本研究では,高密度対向摂動をポイントワイドトリミングすることで,対向攻撃のスパースパッチに対する新しいアプローチを提案する。
また,本手法は標準的なスパース攻撃にも適用可能であり,複数の広範囲な設定に対して,最先端の手法を大幅に改善することを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:36:46 GMT)
Maximizing Relation Extraction Potential: A Data-Centric Study to Unveil Challenges and Opportunities [3.8] 本稿では,ニューラルリレーション抽出を阻害するデータ中心特性について検討する。
それは、文脈の曖昧さ、関係関係の関連、長い尾のデータ、きめ細かい関係の分布など、重要な問題を強調している。
これらの問題を緩和するための将来の方向性を示すマーカーをセットし、初心者や先進的な研究者にとって重要なリソースであることを証明している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:16:02 GMT)
A Data-Driven Approach to Dataflow-Aware Online Scheduling for Graph Neural Network Inference [3.7] GNN推論におけるデータフローを考慮した遅延予測のためのデータ駆動フレームワークを提案する。
我々の回帰器は、与えられたグラフに対して最大91.28%の精度で最適なデータフローを予測でき、平均絶対パーセンテージ誤差(MAPE)は3.78%である。
本稿では、これらの回帰器を用いてスケジューリング決定を強化するオンラインスケジューリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:38:59 GMT)
Approximation Algorithms for Combinatorial Optimization with Predictions [3.7] 従来のアルゴリズムの近似保証よりも高い精度で予測を行う。
我々のアルゴリズムは、完璧な予測が得られたときに最適解を生成する。
この種の問題全体に対して最適なアプローチを示すが、個々の問題の特定の構造的特性を利用して改善された境界を求める可能性はある。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:31:34 GMT)
Towards Agentic Schema Refinement [3.7] 本稿では,データベースとユーザ間のセマンティックレイヤを,小さくて分かりやすいデータベースビューの集合として提案する。
弊社のアプローチは、LLMによる不安定なデータベースの探索の道を開くものだ。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:57:16 GMT)
Context-Aware Input Orchestration for Video Inpainting [3.7] 入力データの構成を変更することでメモリ使用量を最適化する革新的な手法を提案する。
我々の焦点は、入力フレームの割合の変動が、インペイントされたビデオの品質にどのように影響するかを調べることである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:50:21 GMT)
iHQGAN: A Lightweight Invertible Hybrid Quantum-Classical Generative Adversarial Network for Unsupervised Image-to-Image Translation [3.6] iHQGANは、量子古典的教師なしI2I翻訳モデルである。
互いにほぼ可逆な2つの量子ジェネレータと共有パラメータを用いる。
低複雑さCNNベースのジェネレータを使用する古典的手法よりも優れている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:57:54 GMT)
PreF3R: Pose-Free Feed-Forward 3D Gaussian Splatting from Variable-length Image Sequence [3.6] 可変長の画像列から,PreF3R, Pose-Free Feed-forward 3D再構成を提案する。
PreF3Rは、カメラキャリブレーションの必要性を排除し、正準座標フレーム内の3次元ガウス場を、未提示画像のシーケンスから直接再構成する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:16:29 GMT)
Enhancing In-Hospital Mortality Prediction Using Multi-Representational Learning with LLM-Generated Expert Summaries [3.6] ICU患者の院内死亡率(IHM)予測は、時間的介入と効率的な資源配分に重要である。
本研究は、構造化された生理データと臨床ノートをLarge Language Model(LLM)によって生成された専門家要約と統合し、IHM予測精度を向上させる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:36:38 GMT)
Gaussian Process Priors for Boundary Value Problems of Linear Partial Differential Equations [3.5] 偏微分方程式(PDE)の解法は計算科学の基本的な課題である。
近年、PDEに取り組むために、ニューラル演算子と物理インフォームドニューラルネットワーク(PINN)が導入されている。
本稿では, 線形PDEの一般システムと定数係数, 線形境界条件の両方を満たすGP事前の構成手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:48:15 GMT)
Multi-Resolution Generative Modeling of Human Motion from Limited Data [3.5] 限られたトレーニングシーケンスから人間の動きを合成することを学ぶ生成モデルを提案する。
このモデルは、骨格の畳み込み層とマルチスケールアーキテクチャを統合することで、人間の動きパターンを順応的にキャプチャする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:36:29 GMT)
Targeted Therapy in Data Removal: Object Unlearning Based on Scene Graphs [3.5] 個人識別可能な情報(PII)を機械学習・アズ・ア・サービス(ML)プロバイダに不注意にアップロードすることも可能だ。
ユーザーがこれらのサービスでPIIを望まない場合、COPPAなどの規制はこれらのユーザーを忘れる権利を義務付ける。
本研究では,シーングラフに基づくオブジェクト学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:51:01 GMT)
Multimodal Foundation Models Exploit Text to Make Medical Image Predictions [3.4] 我々は、画像やテキストを含む様々なデータモダリティを、マルチモーダル基礎モデルが統合し、優先順位付けするメカニズムを評価する。
以上の結果から,マルチモーダルAIモデルは医学的診断的推論に有用であるが,テキストの活用によって精度が大きく向上することが示唆された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:38:17 GMT)
Probing the limitations of multimodal language models for chemistry and materials research [3.4] 実世界の化学や材料科学のタスクを視覚言語モデルがどのように扱うかを評価するためのベンチマークであるMaCBenchを紹介する。
これらのシステムは、基本的な知覚タスクにおいて有望な能力を示すが、空間的推論、クロスモーダル情報合成、論理的推論の基本的な限界を示す。
私たちの洞察は、化学や材料科学以外にも重要な意味を持ち、信頼性の高いマルチモーダルAI科学アシスタントを開発するには、適切なトレーニングデータとそれらのモデルをトレーニングするためのアプローチのキュレーションの進歩が必要であることを示唆している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:51:45 GMT)
Preparation and observation of anomalous counterpropagating edge states in a periodically driven optical Raman lattice [3.3] 2次元周期駆動光ラマン格子における異常な反伝播エッジ状態の作成と検出を行う。
結果は、AFVH相の将来の実験的探査と、その独自のエッジモードに関連するトポロジカル現象の理論的枠組みを確立する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:40:41 GMT)
QUBO Refinement: Achieving Superior Precision through Iterative Quantum Formulation with Limited Qubits [3.3] 量子アルゴリズムは線形方程式と固有値を解くことができ、古典的なコンピュータのペースを超える。
この技術を活用することで、線形システム、固有値問題、RSA暗号システム、CT画像再構成などの応用のための量子最適化モデルが提案されている。
既存のQiskitシミュレーター、D-Waveシステムシミュレーター、ハイブリッドソルバの精度は2つの10箇所に限られている。
本稿では,各数を二項化する際に,最上位から最下位に順次進行する新しい反復アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:56:00 GMT)
Motion Code: Robust Time Series Classification and Forecasting via Sparse Variational Multi-Stochastic Processes Learning [3.3] 本稿では,各時系列を連続的なプロセスの実現とみなす新しいフレームワークを提案する。
この数学的アプローチは、タイムスタンプ間の依存関係をキャプチャし、ノイズ内の隠れた時間変化信号を検出する。
現実のパーキンソン病センサートラッキングを含むノイズの多いデータセットの実験は、確立されたベンチマークに対するモーションコードの強力なパフォーマンスを実証している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:57:35 GMT)
Human-Calibrated Automated Testing and Validation of Generative Language Models [3.3] 本稿では,ジェネレーティブ言語モデル(GLM)の評価と検証のための包括的枠組みを提案する。
銀行などの高額な領域に展開される検索・拡張世代(RAG)システムに焦点を当てている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:53:36 GMT)
Connections between sequential Bayesian inference and evolutionary dynamics [3.2] 生物学における進化過程を記述する力学方程式とシーケンシャルベイズ学習法の間には、長い間関係があると仮定されてきた。
この写本は、この正確な関係を連続的に厳密に確立した新たな研究を記述している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:20:25 GMT)
Probing for Consciousness in Machines [3.2] 本研究は, 人工エージェントが中核意識を発達させる可能性を探るものである。
中心意識の出現は、感情や感情の表現によって知らされる自己モデルと世界モデルの統合に依存している。
その結果,エージェントは初歩的な世界と自己モデルを形成することができ,機械意識の発達への道筋が示唆された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:27:07 GMT)
Shapley Value Computation in Ontology-Mediated Query Answering [3.2] Shapley値は、もともと富分配のための協調ゲーム理論で導入されたもので、KRやデータベースで使われている。
本稿では,問合せ応答設定におけるShapley値計算(SVC)の複雑さ解析について述べる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:04:55 GMT)
Brain-like emergent properties in deep networks: impact of network architecture, datasets and training [3.2] ディープネットワークが急速に向上しているにもかかわらず、実際のビジョンタスクでは人間よりも優れています。
このパラドックス的な一般化の欠如は、ディープネットワークをより脳に似たものにすることで対処できる。
深層ネットワーク上でテスト可能な知覚的・神経的創発的特性について報告する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:22:36 GMT)
MindForge: Empowering Embodied Agents with Theory of Mind for Lifelong Collaborative Learning [3.2] Colllabvoyagerは、露骨な視点を取ることで、ボイジャーを生涯の協調学習で強化する新しいフレームワークである。
コラボボヤガーは、(1)知覚、信念、欲求、行動をリンクするマインド表現の理論、(2)エージェント間の自然言語コミュニケーション、(3)タスクと環境知識のセマンティックメモリの3つの重要なイノベーションを紹介している。
混合実験のMinecraft実験では、共同作業員はボイジャーのエージェントよりも優れており、作業完了率は6.6% (+39.4%) で1ブロックの土を集め、70.8% (+20.8%) で大幅に改善した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:17:01 GMT)
Unraveling Arithmetic in Large Language Models: The Role of Algebraic Structures [3.2] 大型言語モデル (LLM) は顕著な数学的能力を示しており、主にチェーン・オブ・シント (CoT) のプロンプトによって駆動されている。
本稿では,emphCommutativity やemphIdentity などの代数的構造を捉えることによって,LLM が算術を学習することを提案する。
この結果から,代数的構造を活用することでLLMの算術的能力が向上し,算術的性能向上への洞察が得られた。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:23:11 GMT)
Adaptive Circuit Behavior and Generalization in Mechanistic Interpretability [3.1] GPT-2小領域における間接物体識別(IOI)回路の汎用性について検討する。
その結果、回路は驚くほどよく一般化し、全ての部品と機構を再利用し、入力エッジを追加するだけでよいことがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:32:34 GMT)
Phys4DGen: A Physics-Driven Framework for Controllable and Efficient 4D Content Generation from a Single Image [3.1] 既存の方法は、4Dコンテンツのダイナミクスを導くために、事前訓練されたビデオ拡散モデルに大きく依存している。
物理対応の4Dコンテンツを生成する新しいフレームワークであるPhys4DGenを提案する。
物理的特性を視覚的に推測する人間の能力に触発され,物理知覚モジュールが導入された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:12:38 GMT)
Deep Learning-Based Electricity Price Forecast for Virtual Bidding in Wholesale Electricity Market [3.1] 本研究では,ERCOT(Electric Reliability Council of Texas)市場におけるリアルタイム電力価格と日頭電力価格の間に広がる価格を予測するためのトランスフォーマーに基づくディープラーニングモデルを提案する。
提案したモデルは現実的な制約の下で訓練され、毎週モデルを更新してウォーキングフォワードアプローチを用いて検証される。
その結果, ピーク時のみの取引戦略が50%を超える精度で, ほぼ一貫した利益をもたらすことがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:04:16 GMT)
NexusSplats: Efficient 3D Gaussian Splatting in the Wild [3.1] そこで本研究では,NexusSplatsと呼ばれるネクサスカーネルによる3次元シーン再構築手法を提案する。
この結果から,NexusSplatsは最先端のレンダリング品質を実現すると同時に,現在の最高の品質に比べて,再構築時間を最大70.4%削減できることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:54:28 GMT)
Improving Deformable Image Registration Accuracy through a Hybrid Similarity Metric and CycleGAN Based Auto-Segmentation [3.0] 変形性画像登録(DIR)は、解剖学的変化を考慮に入れた適応放射線療法(ART)において重要である。
従来の強度に基づくDIR法は、画像強度が異なるときにしばしば失敗する。
本研究は,CycleGANに基づく強度補正とオートセグメンテーションを利用して,強度と構造情報を組み合わせたハイブリッド類似度測定値を評価する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:49:16 GMT)
TransCompressor: LLM-Powered Multimodal Data Compression for Smart Transportation [3.0] 本研究では,マルチモーダルトランスポートセンサデータの効率的な圧縮と圧縮にLarge Language Modelsを活用する新しいフレームワークであるTransCompressorを紹介する。
TransCompressorは、バロメーター、速度測定、高度測定など、さまざまなセンサーデータタイプで、バス、タクシー、MTRといった様々な交通手段で徹底的に評価されている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 00:32:20 GMT)
SynDiff-AD: Improving Semantic Segmentation and End-to-End Autonomous Driving with Synthetic Data from Latent Diffusion Models [3.0] 提案するSynDiff-ADは,表現不足なグループに対して,現実的な画像を生成する新しいデータ拡張パイプラインである。
SynDiff-ADでデータセットを拡張することで、Mask2FormerやSegFormerといったセグメンテーションモデルのパフォーマンスを最大1.2%向上します。
我々のSynDiff-ADパイプラインは、AIM-2DやAIM-BEVのようなエンド・ツー・エンドの自動運転モデルの運転性能を、様々な環境条件で最大20%向上することを示した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:24:12 GMT)
DepthSSC: Monocular 3D Semantic Scene Completion via Depth-Spatial Alignment and Voxel Adaptation [2.9] 単眼カメラのみを用いたセマンティックシーン補完手法DepthSSCを提案する。
DepthSSCがGeometric-Aware Voxelization (GAV)とSpatial Transformation Graph Fusion (ST-GF)モジュールを統合
DepthSSCは複雑な3次元構造を効果的に捉え、最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:13:35 GMT)
An Efficient Classical Algorithm for Simulating Short Time 2D Quantum Dynamics [2.9] 本稿では,2次元量子システムにおける短時間のダイナミクスをシミュレーションする,効率的な古典的アルゴリズムを提案する。
この結果から, 短時間2次元量子力学の複雑さに固有の単純さが明らかとなった。
この研究は、古典計算と量子計算の境界についての理解を深める。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:37:34 GMT)
A Dequantized Algorithm for the Guided Local Hamiltonian Problem [2.9] 誘導局所ハミルトニアン問題(GLH)は量子コンピュータ上で効率よく解くことができ、BQP完全であることが証明されている。
これにより、GLH問題は古典計算と量子計算の基本的な分離を探求するための貴重なフレームワークとなる。
ランダム化量子想像時間進化量子アルゴリズムの量子化古典アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:38:16 GMT)
Can LLMs faithfully generate their layperson-understandable 'self'?: A Case Study in High-Stakes Domains [2.8] 法、健康、ファイナンスという3つの優先度の高いアプリケーションドメインにまたがって、textitReQuesting$と呼ばれるLDMの説明可能性という新しい概念を導入します。
提案した概念は、多タスクにおける説明可能なレイマン理解可能なアルゴリズムを高次本質的推論により忠実に生成することを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:54:47 GMT)
NonSysId: A nonlinear system identification package with improved model term selection for NARMAX models [2.7] 本稿では,非線形システム識別のためのオープンソースソフトウェアパッケージであるNonSysIdを紹介する。
このソフトウェアには、シミュレーション(フリーラン)の精度を優先する高度な項選択手法が組み込まれている。
NonSysIdは、構造的健康モニタリング、故障診断、バイオメディカル信号処理などのリアルタイムアプリケーションに特に適している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:19:19 GMT)
Multi-Scale Direction-Aware Network for Infrared Small Target Detection [2.7] 赤外小目標検出は、背景とターゲットを効果的に分離することが難しい問題に直面している。
我々は、赤外線小ターゲットの高周波方向特徴を統合するためのマルチスケール方向対応ネットワーク(MSDA-Net)を提案する。
MSDA-Netは、パブリックNUDT-SIRST、SIRST、IRSTD-1kデータセット上で、最先端(SOTA)結果を達成する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:49:46 GMT)
J-CaPA : Joint Channel and Pyramid Attention Improves Medical Image Segmentation [2.5] 本稿では,Channel Attention と Pyramid Attention を併用したマルチスケール特徴抽出手法を提案する。
提案モデルでは, 複雑な解剖学的構造に対するセグメンテーション精度が向上し, 既存の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:52:21 GMT)
Trustworthy artificial intelligence in the energy sector: Landscape analysis and evaluation framework [2.5] 本研究では,欧州連合(EU)における信頼に値するAI(TAI)のファジィ景観を評価することを目的とする。
スマートグリッドやスマートビルディングシステムなど,エネルギーアプリケーションに適した新しいTAIアプリケーションフレームワークであるE-TAIを導入する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:39:55 GMT)
UltraSam: A Foundation Model for Ultrasound using Large Open-Access Segmentation Datasets [2.5] 超音波画像の自動解析は、解剖学的複雑さと限られた注釈データのために困難である。
データ中心のアプローチを採り、最大公用超音波セグメンテーションデータセットを組み立て、超音波に適した多目的視覚基盤モデルを訓練する。
Segment Anything Model(SAM)の適応版であるUltraSamを導入する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:33:44 GMT)
Understanding trade-offs in classifier bias with quality-diversity optimization: an application to talent management [2.3] 公正なAIモデルを開発する上での大きな課題は、そのようなモデルをトレーニングする上で利用可能なデータのバイアスにある。
本稿では,データセットに固有のバイアスを可視化し,公平性と正確性の間の潜在的なトレードオフを理解する方法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:14:02 GMT)
EigenHearts: Cardiac Diseases Classification Using EigenFaces Approach [2.3] 心疾患の分類におけるEigenFacesアプローチの応用について検討した。
我々は、心エコー図法における固有顔アプローチから着想を得た前処理ステップを実行し、ポッドモードのセットを生成し、それを固有ハートと呼ぶ。
その結果,SVDを前処理に用いた場合,分類精度は約50%向上した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:41:20 GMT)
Representation Collapsing Problems in Vector Quantization [2.3] ベクトル量子化は、連続表現を離散ベクトルの集合に離散化する機械学習の技法である。
その頻度にもかかわらず、生成モデルにおけるベクトル量子化の特性と振舞いは、ほとんど未解明のままである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:32:29 GMT)
Multi-Modal Deep Learning for Credit Rating Prediction Using Text and Numerical Data Streams [2.3] 本稿では、企業信用格付けクラスの予測のためのディープラーニングモデルの融合のための最も効果的なアーキテクチャについて分析する。
我々は,CNN,LSTM,GRU,BERTなど,さまざまな深層学習モデルと融合戦略の組み合わせを検証した。
その結果,2つの融合戦略を持つCNNベースのマルチモーダルモデルでは,他のマルチモーダル手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:03:23 GMT)
TORE: Token Recycling in Vision Transformers for Efficient Active Visual Exploration [2.2] アクティブ・ビジュアル・エクスプロレーション(AVE)は、実世界のシナリオにおけるロボット資源の利用を最適化し、最も情報性の高い観測を順次選択する。
我々はToken Recycling (TORE)と呼ばれる新しいアプローチをAVEに導入する。
エンコーダを抽出器と集約器に分割し、抽出器はそれぞれの観察を別々に処理し、集約器に渡されるトークンの再利用を可能にする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:08:38 GMT)
Safe Bayesian Optimization for Complex Control Systems via Additive Gaussian Processes [2.2] 複数のコントローラを同時に安全に最適化するSafeCtrlBOを提案する。
我々は安全なベイズ最適化における探索プロセスを簡素化し、拡張能力を犠牲にすることなく計算労力を削減する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:20:06 GMT)
A Comprehensive Survey of Text Classification Techniques and Their Research Applications: Observational and Experimental Insights [2.1] 本研究では,研究分野に基づくテキスト分類に特化して設計された包括的分類法を提案する。
分類学は、研究分野ベースのカテゴリ、研究分野ベースのサブカテゴリ、方法論ベースの技術、方法論のサブテクニック、研究分野の応用という階層的なレベルに分けられる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:32:25 GMT)
FinML-Chain: A Blockchain-Integrated Dataset for Enhanced Financial Machine Learning [2.1] 本稿では、高周波オンチェーンデータと低周波オフチェーンデータを統合するためのフレームワークを提案する。
このフレームワークは、トランザクションフィーメカニズムのような経済メカニズムを分析するためのモジュラーデータセットを生成する。
我々は、金融研究を推進し、ブロックチェーン駆動システムの理解を改善するデータセットを作成できるフレームワークの能力を実証する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:55:11 GMT)
Extension of Clifford Data Regression Methods for Quantum Error Mitigation [2.0] 本研究は、クリフォードデータ回帰の2つの変種について検討し、元の回路に非自明なゲートセットを導入する。
第1の変種は元の回路のコピーを複数使用し、第2の変種は単一ビット回転の層を付加する。
これらの手法の性能を数値実験により評価し,根平均二乗誤差の低減を実証した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:38:06 GMT)
CHESS: Contextual Harnessing for Efficient SQL Synthesis [2.0] 効率的でスケーラブルなテキスト・ツー・クエリのためのフレームワークであるCHESSを紹介します。
特殊エージェントは4つあり、それぞれが上記の課題の1つをターゲットにしている。
私たちのフレームワークは、さまざまなデプロイメント制約に適応する機能を提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:43:07 GMT)
EnStack: An Ensemble Stacking Framework of Large Language Models for Enhanced Vulnerability Detection in Source Code [1.9] 本稿では,自然言語処理(NLP)技術を用いた脆弱性検出を支援する,新たなアンサンブルスタックフレームワークであるEnStackを紹介する。
本手法は,コード理解に特化した複数の事前学習型大規模言語モデル(LLM)を相乗化する。
メタ分類器はそれぞれのLSMの強度を集約し、微妙で複雑な脆弱性を検知する包括的なモデルをもたらす。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:47:10 GMT)
Graph Adapter of EEG Foundation Models for Parameter Efficient Fine Tuning [1.9] EEG-GraphAdapter (EGA) はパラメータ効率の高い微細チューニング(PEFT)アプローチである。
EGAは、GNNベースのモジュールとして、事前訓練された時間バックボーンモデルに統合される。
バックボーンのBENDRモデルと比較すると、F1スコアでは最大16.1%の性能向上を実現している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:30:52 GMT)
Integrating Dynamic Correlation Shifts and Weighted Benchmarking in Extreme Value Analysis [1.9] 本稿では、EVDBM(Extreme Value Dynamic Benchmarking Method)を導入することにより、EVA(Extreme Value Analysis)に対する革新的なアプローチを提案する。
EVDBMは極端な事象を検出するために極端な値理論を統合し、新しいDISC(Dynamic Identification of Significant correlation)-Thresholdingアルゴリズムと結合している。
EVDBMの柔軟性は、意思決定の感度が不可欠である他のセクターの幅広い応用の可能性を示している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:21:17 GMT)
Harnessing Superclasses for Learning from Hierarchical Databases [1.8] 多くの大規模分類問題において、クラスは既知の階層に整理され、通常木として表される。
この種の教師付き階層分類の損失について紹介する。
提案手法では,クロスエントロピーの損失に比較して,計算コストの大幅な増大は伴わない。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:39:52 GMT)
Why do Machine Learning Notebooks Crash? [1.8] GitHubとKaggleから92,542回のクラッシュを含む64,031のMLノートブックを収集します。
例外タイプや根本原因など,さまざまな側面にわたる746件のクラッシュのサンプルを分析した。
我々の分析によると、クラッシュの87%は、APIの誤用、データ混乱、ノートブック固有の問題、環境問題、実装エラーによって引き起こされている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:33:08 GMT)
The Two-Hop Curse: LLMs trained on A->B, B->C fail to learn A-->C [1.8] 本稿では,LLMにおける2ホップ推論の制御設定について紹介する。
トレーニング中やプロンプト中に事実が一緒に現れる場合、モデルは遅延推論を行うことができる。
この完全な失敗を、Two-Hop Curseを別々に学習した事実を構成することと呼ぶ。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:04:28 GMT)
Uncertainty in Supply Chain Digital Twins: A Quantum-Classical Hybrid Approach [1.8] 本研究では,量子古典型ハイブリッド機械学習(ML)モデルを用いた不確実性定量化(UQ)について検討する。
これは、量子コンピューティング技術がUQのデータ機能を、特に従来の方法と組み合わせることで、どのように変換できるかを示している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:36:19 GMT)
HiDP: Hierarchical DNN Partitioning for Distributed Inference on Heterogeneous Edge Platforms [1.8] エッジ推論技術は、低レイテンシ推論のために複数のエッジノード間でディープニューラルネットワーク(DNN)推論タスクを分割して分散する。
ヘテロジニアスエッジノード上での分散推論のための階層的DNNパーティショニング戦略(HiDP)を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:40:42 GMT)
Robustness of WDM technique for the co-propagation of quantum with classical signals in an optical fiber [1.7] We study the evolution of co-proagating quantum and classical signals which are launched using WDM。
計算によると 古典的なチャンネルから 一番近いチャンネルは 2つしかない
これは、WDM技法が古典的なデータトラフィックへの弱い量子リンクの統合において原則として堅牢であることを反映している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:22:47 GMT)
Enhancing Answer Reliability Through Inter-Model Consensus of Large Language Models [1.7] 先進モデルを含む革新的な言語モデル相互作用システムの協調力学について検討する。
これらのモデルは、正確な基底的答えを伴わずに、複雑でPhDレベルの統計的疑問を生成し、答える。
本研究では,モデル間のコンセンサスによって応答の信頼性と精度が向上することを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:18:17 GMT)
Accelerating Task Generalisation with Multi-Level Hierarchical Options [1.7] フラクチャクラスタオプション(FraCOs)は、難解な一般化タスクにおける最先端のパフォーマンスを達成する階層的な強化学習手法である。
いくつかの複雑な手続き的に生成された環境で、最先端の深層強化学習アルゴリズムに対してFraCOを評価した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:41:05 GMT)
Graph Neural Networks-based Parameter Design towards Large-Scale Superconducting Quantum Circuits for Crosstalk Mitigation [1.6] 量子システムのシミュレーションの複雑さは、量子チップのコンピュータ支援設計に重大な課題をもたらす。
本稿では,大規模超伝導量子回路のパラメータ設計アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:04:53 GMT)
Explainable AI Approach using Near Misses Analysis [1.6] 本稿では,近距離ミス解析(NMA)に基づく新しいXAI手法を提案する。
ニューラルネットワーク(NN)の潜在的意思決定プロセスから推論される論理的「概念」の階層構造を、その明示的な構造を掘り下げることなく明らかにする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:00:01 GMT)
Implementing transferable annealing protocols for combinatorial optimisation on neutral atom quantum processors: a case study on smart-charging of electric vehicles [1.5] 本稿では,類似した局所構造を持つ問題インスタンス間のパラメータ転送可能性の有望性に基づいて構築する。
本研究は,共有ジオメトリを持つグラフ族上の最大独立集合問題に対して,最適パラメータが自然に集中していることを明らかにする。
本手法を用いて,実データセット上でのスマートチャージ最適化問題に対処する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:41:02 GMT)
Profiling Bias in LLMs: Stereotype Dimensions in Contextual Word Embeddings [1.5] 大規模言語モデル(LLM)は、人工知能(AI)の現在の成功の基礎である。
リスクを効果的に伝達し、緩和努力を促進するために、これらのモデルは識別特性を適切に直感的に記述する必要がある。
社会心理学研究の辞書に基づくステレオタイプ次元に関するバイアスプロファイルを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:14:45 GMT)
ENCLIP: Ensembling and Clustering-Based Contrastive Language-Image Pretraining for Fashion Multimodal Search with Limited Data and Low-Quality Images [1.5] 本稿では,CLIP(Contrastive Language- Image Pretraining)モデルの性能向上を目的とした,ENCLIPと呼ばれる革新的なアプローチを提案する。
これは、限られたデータ可用性と低品質の画像によって引き起こされる課題に対処することに焦点を当てている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:15:38 GMT)
Asymmetric Quantum Harmonic Otto Engine Under Hot Squeezed Thermal Reservoir [1.5] 熱圧縮熱貯留層下での量子調和オットーエンジンの非対称性について検討した。
第1構成では、膨張ストロークの駆動プロトコルが自然界において突然スイッチされ、圧縮ストロークが断熱的に駆動される。
急激な圧縮ストロークに接近する間だけ, 急激な膨張の場合の達成可能な最大効率は1/2であることが判明した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:59:20 GMT)
Parameter Efficient Instruction Tuning: An Empirical Study [1.5] 効率的なファインタニング(PEFT)は、完全なファインタニングに比べて計算量、メモリ、ストレージコストが大幅に小さくなるため、命令チューニングのコスト効率が向上している。
実験により、LoRAとアダプタだけが、理想的なトレーニング設定で完全に微調整できることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:06:09 GMT)
End-to-End Steering for Autonomous Vehicles via Conditional Imitation Co-Learning [1.5] この課題に対処するために、条件付き模倣コラーニング(CIC)アプローチを導入する。
そこで我々は, 回帰と分類のギャップを埋めるために, 分類-回帰ハイブリッド損失を用いて, 操舵回帰問題を分類として提案する。
本モデルは,CIL法と比較して,見えない環境下での自律走行の成功率を平均62%向上させることを実証した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:37:48 GMT)
Enhancing Multi-Agent Consensus through Third-Party LLM Integration: Analyzing Uncertainty and Mitigating Hallucinations in Large Language Models [1.5] 大きな言語モデル(LLM)は、複雑な推論タスクを扱う際にも問題に直面します。
本稿では,知識境界を拡張するために異なるLSMを統合する新しい手法を提案する。
算術的データセットの実験により,本手法の有効性が検証された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:42:33 GMT)
DiffGuard: Text-Based Safety Checker for Diffusion Models [1.4] 本稿では,既存のソリューションよりも優れたテキストベースの安全フィルタを提案する。
我々の研究は、特に情報戦の文脈において、AIが生成するコンテンツの誤用に対処する必要があることによる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:47:02 GMT)
Immersion and Invariance-based Coding for Privacy-Preserving Federated Learning [1.4] 協調分散学習におけるプライバシ保護手法として,フェデレートラーニング(FL)が登場している。
制御理論から差分プライバシーとシステム浸漬ツールを組み合わせたプライバシー保護FLフレームワークを提案する。
提案手法は,局所モデルパラメータとグローバルモデルパラメータの両方に対して,任意のレベルの差分プライバシを提供するように調整可能であることを実証する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:32:53 GMT)
Offline reinforcement learning for job-shop scheduling problems [1.4] 本稿では,複雑な制約を伴う最適化問題に対して,新しいオフラインRL法を提案する。
我々のアプローチは、エッジ属性のアクションを符号化し、専門家ソリューションの模倣と期待される報酬のバランスをとる。
本手法がジョブショップスケジューリングおよびフレキシブルジョブショップスケジューリングベンチマークに与える影響を実証する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:36:34 GMT)
XAI and Android Malware Models [1.4] 我々は,Android のマルウェア分類問題に対して学習を行った ML および DL モデルに XAI 技術を適用した。
この問題領域におけるXAI技術の有用性について論じる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:33:11 GMT)
DyGASR: Dynamic Generalized Exponential Splatting with Surface Alignment for Accelerated 3D Mesh Reconstruction [1.3] 従来の3次元ガウス関数の代わりに一般化指数関数を用いて粒子数を減少させるDyGASRを提案する。
また,GSR(Generalized Surface Regularization)を導入し,各点雲の最小のスケーリングベクトルをゼロにする。
提案手法は既存の3DGSベースのメッシュ再構成手法を超越し,25%の高速化,30%のメモリ使用量の削減を実現している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:03:32 GMT)
Understanding the Scalability of Circuit Cutting Techniques for Practical Quantum Applications [1.3] 回路切断により、利用可能なハードウェアよりも大きい量子回路が実行される。
カット技術は回路を小さなサブ回路に分割し、ハードウェア上で動作させ、古典的な後処理によって結果を再結合する。
耐故障性量子コンピュータ上での動作のオーケストレーションに,現在の回路切断技術が有効かどうかを検討する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:16:27 GMT)
OffLight: An Offline Multi-Agent Reinforcement Learning Framework for Traffic Signal Control [1.3] 我々は、TSCデータセットにおける異種行動ポリシーを処理するために設計された新しいオフラインMARLフレームワークであるOffLightを紹介する。
OffLightは、分散シフトの修正にImportance Smpling(IS)、高品質なエクスペリエンスにフォーカスするためにReturn-Based Prioritized Smpling(RBPS)を組み込んでいる。
OffLightは既存のオフラインRL手法よりも優れており、平均走行時間の7.8%、待ち時間の長さの11.2%にまで短縮されている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:17:30 GMT)
Comparison of Generative Learning Methods for Turbulence Modeling [1.2] 直接数値シミュレーション (DNS) や大渦シミュレーション (LES) のような高解像度の手法は一般に計算に手頃な価格ではない。
機械学習、特に生成確率モデルにおける最近の進歩は、乱流モデリングのための有望な代替手段を提供する。
本稿では, 変分オートエンコーダ(VAE), ディープ・コンバーサナル・ジェネレータ・ネットワーク(DCGAN), 拡散確率モデル(DDPM)の3つの生成モデルの適用について検討する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:20:53 GMT)
A Study on Unsupervised Domain Adaptation for Semantic Segmentation in the Era of Vision-Language Models [1.2] ドメインシフトは、ディープラーニングベースのコンピュータビジョンにおける大きな課題の1つです。
UDAメソッドは、そのドメインのラベルのないデータのみを使用することで、モデルを新しいターゲットドメインに適応させる。
最近の視覚言語モデルは、ドメイン適応を促進する強力な一般化能力を示している。
既存のUDAメソッドのエンコーダを視覚言語で事前学習したエンコーダに置き換えることで,大幅な性能向上が期待できることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:12:24 GMT)
Unsupervised Quantum Anomaly Detection on Noisy Quantum Processors [1.2] 本稿では,一クラス支援ベクトルマシン(OCSVM)アルゴリズムの一般化特性の系統的解析を行う。
結果は理論的にシミュレートされ、トラップイオンおよび超伝導量子プロセッサ上で実験的に検証された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:42:38 GMT)
Algorithms for Sparse LPN and LSPN Against Low-noise [1.2] 本研究では,古典的学習パリティ(LPN)問題の2つの変種に対する学習アルゴリズムについて検討する。
我々は,幅広いパラメータに対する技術状況を改善するための新しいアルゴリズムフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:16:22 GMT)
Preventing Jailbreak Prompts as Malicious Tools for Cybercriminals: A Cyber Defense Perspective [1.1] ジェイルブレイクのプロンプトは、大規模な言語モデルにおける倫理的保護を回避しようとしているため、AIとサイバーセキュリティに重大な脅威をもたらす。
本稿では、サイバー防衛の観点からジェイルブレイクプロンプトを分析し、プロンプトインジェクションやコンテキスト操作のような手法を探索する。
我々は,AIのレジリエンスを強化するために,高度なプロンプト解析,動的安全プロトコル,連続モデル微調整を含む戦略を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:23:58 GMT)
FUN-AD: Fully Unsupervised Learning for Anomaly Detection with Noisy Training Data [1.1] ラベルなしおよび潜在的に汚染されたトレーニングデータを用いた完全教師なし異常検出のための新しい学習ベースアプローチを提案する。
本手法は, 2つの観測結果から, 正常試料間の対特徴距離が, 異常試料や異種試料間の対特徴距離よりも平均的に小さい可能性が示唆され, 互いに近接する2つの特徴対が等質な対である可能性が示唆された。
本研究は, 近接する近傍距離が信頼度の高いサンプルと異常を区別できることを示す最初の観測結果に基づいて, 反復的に再構成されたメモリバンクを用いた擬似ラベル方式を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:51:38 GMT)
A SAM-guided and Match-based Semi-Supervised Segmentation Framework for Medical Imaging [1.0] SAMatchは、半教師付き医療画像セグメンテーションのためのSAM誘導フレームワークである。
SAMは様々なタスクにまたがってうまく一般化し、高信頼のプロンプトを生成し、擬似ラベルを洗練するために使用される。
ACDC心臓MRI, BUSI乳房超音波, MRLiver データセットを用いた実験では, SAMatch による最先端の成績が得られた。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:41:38 GMT)
Sequential Attack Impairs Security in Device-independent Quantum Key Distribution [1.0] デバイス独立量子鍵分布(DI-QKD)
非局所相関を用いて、2つの正直な当事者間の暗号鍵をセキュアに確立する。
ベル違反は観測された統計に固有の予測不可能性を保証する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:50:08 GMT)
Optimization meets Machine Learning: An Exact Algorithm for Semi-Supervised Support Vector Machines [1.0] サポートベクトルマシン(SVM)は、バイナリ分類のための教師付き学習モデルである。
半定値プログラミング(SDP)緩和を用いたS3VMの新しい分岐手法を提案する。
SDP緩和は文献で利用できるものよりもはるかに強い境界を提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:51:09 GMT)
Plastic Arbor: a modern simulation framework for synaptic plasticity $\unicode{x2013}$ from single synapses to networks of morphological neurons [0.9] 人間や他の動物では、シナプスの可塑性過程は学習や記憶などの認知機能において重要な役割を果たす。
近年の研究では、デンドライトの細胞内分子過程が単一ニューロンの動態に大きく影響していることが示されている。
我々はArborライブラリをPlastic Arborフレームワークに拡張し、様々なスパイク駆動型塑性パラダイムのシミュレーションをサポートした。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:51:13 GMT)
Increasing the scalability of graph convolution for FPGA-implemented event-based vision [0.9] イベントカメラは、従来のフレームベースの視覚センサーに代わるものとして、ますます人気が高まっている。
我々は、FPGAリソースの柔軟な選択を可能にするために、グラフ畳み込みのためのハードウェアモジュールの最適化に重点を置いている。
乗算におけるLUT使用量の最大94%を削減するために,追加のBRAMバッファを利用する「二段階畳み込み」手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:44:32 GMT)
DP-CDA: An Algorithm for Enhanced Privacy Preservation in Dataset Synthesis Through Randomized Mixing [0.9] 有効なデータパブリッシングアルゴリズムであるemphDP-CDAを導入する。
提案アルゴリズムは、クラス固有の方法でデータをランダムに混合し、プライバシー保証を確保するために慎重に調整されたランダム性を誘導することにより、合成データセットを生成する。
以上の結果から,DP-CDAを用いた合成データセットは,同一のプライバシー要件下であっても,従来のデータパブリッシングアルゴリズムで生成したデータセットよりも優れた実用性が得られることが示唆された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:14:06 GMT)
Selecting informative conformal prediction sets with false coverage rate control [0.9] コンフォーマル手法は、任意の機械学習予測器に対して有限サンプルカバレッジで結果/ラベルの予測セットを提供する。
分析者は,予測セットが十分小さいサンプルのみを情報的とみなすことができる分類設定と回帰設定の両方を考慮する。
本研究では,このような情報的共形予測セットを構築するための統一的なフレームワークを開発し,選択したサンプルの偽カバレッジ率(FCR)を制御した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:46:28 GMT)
SAGEval: The frontiers of Satisfactory Agent based NLG Evaluation for reference-free open-ended text [0.8] 本稿では,参照/グラウンドラベルが存在しない,あるいは十分に利用できない,自然言語生成のためのロバストな評価手法を開発する必要性を明らかにする。
本研究では,LCM評価器のスコアを補正し,複雑なNLG評価シナリオにおいてもラベル付きデータの必要性を低減できることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:07:16 GMT)
Real-world validation of safe reinforcement learning, model predictive control and decision tree-based home energy management systems [0.8] 本稿では,機械学習に基づくエネルギー管理手法の現実的検証について述べる。
住宅の4つの再生を電気的に設置する実験を行った。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:45:15 GMT)
Deep Learning for Motion Classification in Ankle Exoskeletons Using Surface EMG and IMU Signals [0.8] 足関節外骨格は、移動性を高め、転倒リスクを減らす可能性に対してかなりの関心を集めている。
本稿では、3つの慣性計測ユニット(IMU)と8つの表面筋電図センサ(sEMG)を統合する新しい動き予測フレームワークを提案する。
その結果、畳み込みニューラルネットワーク(CNN)は5つの動作タスクのデータセット上でLSTM(Long Short-Term Memory)ネットワークをわずかに上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:51:40 GMT)
Abnormality-Driven Representation Learning for Radiology Imaging [0.8] 病変強調型コントラスト学習(LeCL)は,CTスキャンの異なる部位にわたる2次元軸方向スライスにおける異常により引き起こされる視覚的表現を得るための新しい手法である。
本研究は, 腫瘍病変位置, 肺疾患検出, 患者ステージングの3つの臨床的課題に対するアプローチを, 最先端の4つの基礎モデルと比較した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:53:26 GMT)
Understanding GEMM Performance and Energy on NVIDIA Ada Lovelace: A Machine Learning-Based Analytical Approach [0.8] 本研究では、カスタム実装のタイル付き行列乗算カーネルとNVIDIAのCUTLASSライブラリの2つのアプローチを用いる。
我々は多出力回帰機能を持つランダムフォレストに基づく予測モデルを開発した。
我々のフレームワークは、実行時予測のR2スコアが0.98、電力予測の0.78で例外的精度を達成した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:47:23 GMT)
Protomon: A Multimode Qubit in the Fluxonium Molecule [0.8] 本稿では,フラキソニウム分子回路で符号化されたマルチモード量子ビット,プロトモンを導入する。
密接に関連する$0$-$pi$ qubitと比べ、プロトモンは理論においていくつかの利点がある。
選択した量子ビットに対して,64~73mu$s,0.2~0.5mu$sの偏極時間を測定した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:28:49 GMT)
ASSERTIFY: Utilizing Large Language Models to Generate Assertions for Production Code [0.8] プロダクションアサーションは、開発者がコードに関する仮定を検証するのを助けるために、コードに埋め込まれたステートメントである。
静的解析やディープラーニングのような現在のアサーション生成技術は、プロダクションアサーションの生成に関して不足している。
このプレプリントは、LLM(Large Language Models)を活用した自動エンドツーエンドツールであるAssertifyを導入し、エンジニアリングにプロダクションアサーションを生成することで、ギャップに対処する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:52:28 GMT)
Leveraging Foundation Models To learn the shape of semi-fluid deformable objects [0.8] 過去10年間、非流動性のある変形可能な物体を特徴付け、操作する研究者によって強い関心が浮かび上がった。
本稿では,動作制御対象の情報として機能する安定な特徴を定義するために,溶接プールの特徴付けの課題に対処する。
基礎モデルからより小さな生成モデルへの知識蒸留の性能は、変形可能な物体のキャラクタリゼーションにおいて顕著な結果を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:41:35 GMT)
Analog In-Memory Computing Attention Mechanism for Fast and Energy-Efficient Large Language Models [0.8] 自己注意によって駆動されるトランスフォーマーネットワークは、大規模言語モデルの中心である。
生成トランスフォーマーでは、自己アテンションはキャッシュメモリを使用してトークンプロジェクションを格納し、各ステップで再計算を避ける。
本稿では、ゲインセルと呼ばれる新しいチャージベースのメモリをベースとした、独自の自己アテンションインメモリコンピューティングアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:14:33 GMT)
LegoPET: Hierarchical Feature Guided Conditional Diffusion for PET Image Reconstruction [0.7] ホログラムからの高画質PET画像再構成のための階層的特徴ガイド付き条件拡散モデルであるLegoPETを紹介する。
LegoPETは、cDPMの性能を向上するだけでなく、最近のDLベースのPET画像再構成技術を、視覚的品質とピクセルレベルのPSNR/SSIMメトリクスで上回っている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:05:34 GMT)
Simultaneous 3D Object Segmentation and 6-DOF Pose Estimation [0.7] 純粋な3次元点雲シーンにおける3次元オブジェクト分割と6-DOFポーズ推定を同時に行う手法を提案する。
提案手法の重要な構成要素は,純3次元点群における3次元オブジェクト分割と6-DOFポーズ推定を同時に予測できるマルチタスクCNNアーキテクチャである。
実験評価のために,Augmented Reality (AR) を用いた2つの最先端3Dオブジェクトデータセット citePLciteTLINEMOD のための拡張トレーニングデータを生成する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:30:42 GMT)
Simulation of two-dimensional electronic spectroscopy on a near-term quantum computer using a probe qubit protocol [0.7] 2次元電子分光法(2DES)は、光合成系内のエネルギー輸送における量子効果を探索し、新しい材料特性を研究するための強力なツールである。
これらの実験の力学をシミュレートすると、システムのサイズが大きく、時間スケールが長いため、古典的なコンピュータにとって大きな課題となる。
本稿では,短期量子デバイス上での2DESの量子シミュレーションのためのプローブ量子ビットプロトコル(PQP)を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:13:57 GMT)
Quantum droplets and Schrödinger's cat states in atomic-molecular Bose-Einstein condensates [0.7] 原子-分子ボース-アインシュタイン凝縮体において、量子滴、偶数および奇数シュル「オーディンガー猫状態の明示的な実現が示される。
これらの巨視的量子状態の形成における$chi2$型の非線形性と化学的ポテンシャルの両方の重要な役割が示されている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:15:40 GMT)
Exploring the Stability Gap in Continual Learning: The Role of the Classification Head [0.7] 安定性のギャップは、トレーニング中に部分的に回復する前に、モデルが最初に学習したタスクのパフォーマンスを失う現象である。
バックボーンと分類ヘッドが安定性のギャップに与える影響を評価できるツールとして,NMC(Nest-mean Classifier)を導入した。
実験の結果, NMCは最終性能を向上するだけでなく, 各種連続学習ベンチマークのトレーニング安定性を著しく向上させることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:09:05 GMT)
Keep it Tighter -- A Story on Analytical Mean Embeddings [0.6] カーネル技術は、データサイエンスにおいて最も人気があり柔軟なアプローチの一つである。
平均埋め込みは、最大平均不一致(MMD)と呼ばれる分岐測度をもたらす。
本稿では,基礎となる分布の1つの平均埋め込みが解析的に利用可能である場合のMDD推定の問題に焦点をあてる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:32:12 GMT)
Characterized Diffusion Networks for Enhanced Autonomous Driving Trajectory Prediction [0.6] 本稿では,自律走行のための新しい軌道予測モデルを提案する。
本モデルは,不確実性推定と複雑なエージェント相互作用を組み込むことにより,軌道予測の精度と信頼性を向上させる。
提案モデルでは,実環境における自律走行システムへの応用の可能性を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:03:44 GMT)
Bosonic Peierls state emerging from the one-dimensional Ising-Kondo interaction [0.6] 凝縮物質物理学におけるホットトピックであるピエルス転移は、通常は1次元フェルミオン系で起こると考えられている。
摂動解析と数値密度行列再正規化群法により, ピエルス状態のボソニックなアナログが適切なパラメータ規則で発生することを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:10:53 GMT)
Learning deep illumination-robust features from multispectral filter array images [0.5] 本稿では, 原画像から直接, 識別的・照明的特徴を学習するための独自のアプローチを提案する。
MS画像分類実験により,本手法は手工芸法と近年の深層学習法の両方に優れることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:06:27 GMT)
Jaya R Package -- A Parameter-Free Solution for Advanced Single and Multi-Objective Optimization [0.5] Jaya RパッケージはパラメータフリーのJaya最適化アルゴリズムの堅牢で汎用的な実装を提供する。
その直感的な設計と柔軟性により、ユーザーは様々な領域にわたる複雑な現実世界の問題を解決することができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:46:54 GMT)
Exact Solvability Of Entanglement For Arbitrary Initial State in an Infinite-Range Floquet System [0.5] 無限範囲Ising相互作用を持つ$N$-spin Floquetモデルを導入する。
本モデルでは, 熱力学的限界が存在しないにもかかわらず, 任意の初期状態に対して, $langle Srangle/S_Max rightarrow 1$ の値が 1$ の値から 1$ の値にずれがあることを数値的に示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:55:05 GMT)
Contrastive Deep Learning Reveals Age Biomarkers in Histopathological Skin Biopsies [0.5] 皮膚生検画像だけでは、個人の年齢を決定するのに十分であることを示す。
次に、皮膚生検の病理組織学的スライドに視覚的特徴を用いて、新しい老化のバイオマーカーを構築した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:52:01 GMT)
Spontaneous Symmetry Breaking of an Optical Polarization State in a Polarization-Selective Nonlinear Resonator [0.4] 我々は、原子ルビジウム蒸気中の偏光自転を利用して、自発対称性の破れと偏光パターンの不安定性を観察する。
本稿では,複数の空間モード間のIsingのような相互作用をシミュレートする機構を応用し,完全光コヒーレントIsingマシンの基盤として提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:20:30 GMT)
Diagnosis of diabetic retinopathy using machine learning & deep learning technique [0.4] 本稿では,物体検出と機械学習の分類技術を用いた新しい基礎検出手法を提案する。
我々は、YOLO_V8を用いて、眼底画像の物体検出を行い、光ディスク、光カップ、病変などの関心領域(ROI)を特定する。
次に、病理徴候の有無に基づいて、機械学習SVM分類アルゴリズムを用いてROIを異なるDRステージに分類する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:09:37 GMT)
Are Transformers Truly Foundational for Robotics? [0.4] GPT(Generative Pre-Trained Transformers)は、ロボット工学に革命をもたらすことを誇示している。
ここではその実用性に疑問を呈する。
我々は、この技術のGPT状態と、小さな昆虫の脳がこれらの制約なしに頑健な自律性を達成したこととを対比する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:35:01 GMT)
Twin Transformer using Gated Dynamic Learnable Attention mechanism for Fault Detection and Diagnosis in the Tennessee Eastman Process [0.4] 故障検出・診断(FDD)は,産業プロセスの安全性と効率を確保するための重要な課題である。
我々は、化学プロセス制御のための広く使われているベンチマークであるテネシー・イーストマン・プロセス(TEP)のための新しいFDD手法を提案する。
新しい注意機構であるGated Dynamic Learnable Attention (GDLAttention)を導入し、ゲーティング機構と動的学習機能を統合する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:22:53 GMT)
Statistical inference for quantum singular models [0.4] 本稿では,量子状態推定とモデル選択という,量子統計的推論における2つの重要なタスクに焦点をあてる。
証明の鍵となる考え方は、古典的な影を用いた可能性関数の量子アナログの導入である。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:01:55 GMT)
Brain Tumor Classification using Vision Transformer with Selective Cross-Attention Mechanism and Feature Calibration [0.4] 我々は,クロスアテンション融合モジュールの性能向上のための2つの新しいメカニズムを紹介する: 特徴メカニズム(FCM)と選択的クロスアテンション(SCA)である。
FCMは異なるブランチの機能を校正して互換性を高め、SCAは最も有益な機能に選択的に対応します。
提案手法は脳腫瘍の分類における他の最先端手法よりも優れており,精度と効率が向上している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:02:57 GMT)
Modulated time evolution for efficient variational ground-state preparation [0.4] 実装が容易で、複雑な反断熱的ハミルトン派や、システムのエネルギーギャップに関する事前の知識を必要としない。
時間進化がさらにトロッター化され、スピンスピン結合項と磁場項を別の因子に分離すると、構造上は量子近似最適化アルゴリズム(QAOA)と同一となる。
QAOAと比較すると、変調された時間進化はしばしば、少ないレイヤ(時間ステップ)で同じレベルのパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:51:52 GMT)
Enhancing Fluorescence Lifetime Parameter Estimation Accuracy with Differential Transformer Based Deep Learning Model Incorporating Pixelwise Instrument Response Function [0.3] 本稿では,最新の微分変換器エンコーダ・デコーダアーキテクチャであるMFliNetを用いた新しいDLアーキテクチャを提案する。
本モデルの性能は, 慎重に設計し, 複雑な組織模倣ファントムと前臨床内癌異種移植実験により実証した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:03:41 GMT)
CatNet: Effective FDR Control in LSTM with Gaussian Mirrors and SHAP Feature Importance [0.3] CatNetは、False Discovery Rate(FDR)を効果的に制御し、ガウスミラー(GM)法でLSTMの重要な特徴を選択するアルゴリズムである。
リンク関数の異なる線形モデルとLSTMモデルの両方において、シミュレーションデータを用いてCatNetの性能を評価する。
我々は、S&P500指数部品の価格を予測するため、多要素投資ポートフォリオを構築した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:53:37 GMT)
Large-scale simulations of Floquet physics on near-term quantum computers [0.3] 本稿では,量子ハードウェア上で高速駆動型量子システムをシミュレートするためのQHiFFSアルゴリズムを提案する。
QHiFFSの中心はキック演算子の概念であり、力学が時間に依存しない実効ハミルトニアンによって支配される基底となる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:52:20 GMT)
Machine Learning for the Digital Typhoon Dataset: Extensions to Multiple Basins and New Developments in Representations and Tasks [0.3] 本稿では,長期的データを対象とした機械学習モデルを対象として,40年以上にわたって最長の台風衛星画像データセットの新バージョンを提案する。
データセットV2に新たに追加されたのは、南半球の熱帯サイクロンデータである。
2つの半球からのデータを持つことで、盆地と半球間の地域差について、新たな研究をすることができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:25:39 GMT)
Divergence-free algorithms for solving nonlinear differential equations on quantum computers [0.3] 量子コンピュータにおける非線形微分方程式の分散自由シミュレーションのアルゴリズムを提案する。
進化時間制約のない非線形微分方程式の解は、量子コンピュータの実用的な応用への扉を開く。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:47:24 GMT)
Performance Evaluation of Deep Learning-Based State Estimation: A Comparative Study of KalmanNet [0.3] KF(Kalman Filters)は、リアルタイム状態推定アプリケーションの基本である。
本研究では,1つの代表的なモデルであるKalmanNetを,実環境下での性能を評価するために,自動車レーダデータに基づいて選定・評価した。
その結果、KalmanNetはIMMフィルタよりも優れており、KalmanNetのようなデータ駆動型メソッドは有望であるが、現在の信頼性と堅牢性の欠如は安全クリティカルなアプリケーションには不適であることを示した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:59:14 GMT)
How ChatGPT Changed the Media's Narratives on AI: A Semi-Automated Narrative Analysis Through Frame Semantics [0.3] 我々は、AIに言及した5つのニュース記事から収集された49,000以上の文のデータセットに対して、混合メソッドフレームセマンティクスに基づく分析を行う。
このデータセットは、OpenAIs ChatGPTのローンチを中心とした12ヶ月の期間をカバーしており、最も訪問者の多いオープンなニュース出版社から収集されている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:12:45 GMT)
Efficient pooling of predictions via kernel embeddings [0.2] 確率的予測は、可能な結果の集合上の確率分布である。
それらは典型的には、個々の予測分布を線形にプールすることで結合される。
各予測に割り当てられた重量は、過去の性能に基づいて推定できる。
これは、いくつかのトレーニングデータに対して適切なスコアリングルールを最適化する重みを見つけることで達成できる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:04:37 GMT)
Enhanced Lung Cancer Survival Prediction using Semi-Supervised Pseudo-Labeling and Learning from Diverse PET/CT Datasets [0.2] ハイブリッド機械学習システム(HMLS)を用いたPET/CTスキャンから手技・深部放射線特性(HRF/DRF)を解析した。
We extract 215 HRFs and 1024 DRFs by PySERA and a 3D-Autoencoder, in the ViSERA software。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:58:37 GMT)
Information Extraction from Heterogeneous Documents without Ground Truth Labels using Synthetic Label Generation and Knowledge Distillation [0.2] ラベルなしVRDコーパスにおける合成ラベル生成手法であるタスク認識命令に基づくラベリング(TAIL)を提案する。
応答型知識蒸留を用いた多モード視覚リッチ文書理解モデル(VRDU)をTAILラベル上で微調整する。
得られたモデルが、最先端のLMMよりも大規模な多国籍組織の内部費用文書に匹敵する性能を示した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:47:20 GMT)
Approximate FW Algorithm with a novel DMO method over Graph-structured Support Set [0.2] 我々は、元のアルゴリズムを分析し、実装し、それに基づいていくつかの拡張を導入した。
新しいDMO法では十分な改善が得られなかったが,バックトラックライン探索法は効率よくイテレーション数を削減した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:20:43 GMT)
The Dynamic Creativity of Proto-artifacts in Generative Computational Co-creation [0.2] 本稿では,計算共創過程において生成する中間人工物の創造性を決定するのに必要な属性について検討する。
新エレクトロニック・アシスタント(NEA)による未完成曲の聴取実験
その結果, 成果物の価値と新規性に基づく2つの属性定義が, 革新的製品に繋がる未完成の作業を評価するのに十分であることが判明した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:44:33 GMT)
Swin fMRI Transformer Predicts Early Neurodevelopmental Outcomes from Neonatal fMRI [0.2] 本研究では,新生児fMRIデータを用いたベイリーIII合成スコアの予測を目的としたSwiFT(Swin 4D fMRI Transformer)モデルを提案する。
分析の結果,SwiFTは認知,運動,言語結果の予測において,ベースラインモデルよりも有意に優れていた。
これらの知見は、神経発達研究と臨床実践を進めるためのトランスフォーマーモデルの可能性を強調している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:20:07 GMT)
Graph neural networks with configuration cross-attention for tensor compilers [0.2] 対象の計算グラフの高速な構成のスクリーニングを可能にするニューラルネットワークアーキテクチャであるTGraphを提案する。
我々は、我々の研究に関連するCO$排出量削減の可能性について、AI指向のデータセンターをホストする分野における家計排出量の50%以上に相当すると見積もっている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:25:16 GMT)
Autoassociative Learning of Structural Representations for Modeling and Classification in Medical Imaging [0.2] 本研究では,視覚的プリミティブの観点から観察画像の再構成によって学習するニューロシンボリックシステムのクラスを提案する。
組織像の異常診断に応用すると,従来のディープラーニングアーキテクチャよりも分類精度が優れていた。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:36:37 GMT)
Almost Public Quantum Coins [0.2] 量子コインスキーム(quantum coins scheme)は、伝統的な通貨コインスキームと同様に、すべての貨幣状態が互いに正確なコピーである。
量子マネースキームはプライベート、すなわち銀行だけがマネー状態や公開を検証できる。
本稿では、パブリックな量子コインスキームによく似たスキームに、任意のプライベートな量子コインスキームを持ち上げる方法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:52:24 GMT)
Trap-MID: Trapdoor-based Defense against Model Inversion Attacks [0.1] そこで我々は,Trap-MID(Trap-MID)を用いたMI攻撃を誤認するモデルインバージョンディフェンスを提案する。
トラップドアがモデルに統合され、入力が対応するトリガーで注入されたときに特定のラベルを予測する。
我々は,MI攻撃の抑止におけるトラップドアの有効性と自然性の影響に関する理論的知見を提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:10:05 GMT)
Cutting Voxel Projector a New Approach to Construct 3D Cone Beam CT Operator [0.1] 我々は3次元コーンビームトモグラフィ再構成のための新しいプロジェクターのクラスを導入する。
本手法は, ボクセルの局所改質を可能にし, 適応格子分解能と再構成品質の向上を実現する。
その結果, カットボクセルプロジェクターはTTプロジェクターよりも精度が高く, 特にコーンビーム角が大きいことが判明した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:40:39 GMT)
Factoring integers via Schnorr's algorithm assisted with VQE [0.1] 現在の非対称暗号は、古典的コンピュータは効率よく大きな整数を乗算できるが、逆演算、因子化ははるかに複雑である、という原理に基づいている。
十分に大きな整数の場合、この分解プロセスは古典的なコンピュータで何百年、何千年もかかる。
この研究は、この論文を分析し、彼らが行った実験を再現するが、異なる量子法(VQE)で番号を1961年に分解できる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:11:10 GMT)
Lipschitz constant estimation for general neural network architectures using control tools [0.1] 本稿では,半定値プログラミングを用いた一般ニューラルネットワークアーキテクチャのリプシッツ定数の推定について述べる。
我々はニューラルネットワークを時間変動力学系と解釈し、そこでは、$k$th層は、時間で$k$の力学に対応する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:35:07 GMT)
A Dataset for Evaluating Online Anomaly Detection Approaches for Discrete Multivariate Time Series [0.0] 現在の公開データセットは小さすぎるため、多様ではない。
我々は、最先端のシミュレーションツールによって生成される多種多様な、広範囲で、非自明なデータセットという解決策を提案する。
トレーニングとテストサブセットが汚染された、クリーンなバージョンで提供されるように、データセットのさまざまなバージョンを利用可能にしています。
予想通り、ベースライン実験では、データセットの半教師付きバージョンでトレーニングされたアプローチが、教師なしバージョンよりも優れていた。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:24:57 GMT)
When Is Heterogeneity Actionable for Personalization? [0.0] パーソナライゼーションは、A/Bテストにおける最高のパフォーマンスの処置を全員に割り当てる統一的なポリシーを超えて、結果を改善するために使用することができる。
我々は「作用可能な不均一性」を定量化する統計モデルを開発する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:37:17 GMT)
When Babies Teach Babies: Can student knowledge sharing outperform Teacher-Guided Distillation on small datasets? [0.0] 我々は,データ効率のよい言語モデル事前学習の限界を推し進めることを目的として,BabyLMチャレンジに提案する。
重み付き相互学習を二段階最適化問題として定式化することにより、生徒の平等な待遇の限界に対処する。
評価の結果、教師なしの手法は教師が指導する手法と一致したり、超えたりできることがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:25:31 GMT)
Weakly supervised image segmentation for defect-based grading of fresh produce [0.0] 本研究は, 分散型サプライチェーンにおけるバナナのポストハーベスト品質評価の問題に取り組むものである。
そこで本研究では,バナナ画像の表面欠陥の検出と分割にパン光学的セグメンテーションを用い,欠陥の大きさと数量を定量化する手法を提案する。
実際のフィールド条件下で、バナナの476個のスマートフォン画像のデータセットが収集され、傷や傷跡に注釈が付けられた。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:28:58 GMT)
Weak measurement-based protocol for ergotropy protection in open quantum batteries [0.0] このような影響から量子状態を保護し、電池の放電を緩和するために、選択的弱測定を用いるプロトコルを提案する。
その結果, 適切に選択された測定強度は, 不要な放電効果を低減できることがわかった。
我々は、エルゴトロピーのコヒーレント成分と非コヒーレント成分の弱い測定がどのように影響するかを探求し、エネルギー貯蔵技術における量子コヒーレンス(quantum coherence)の実践的応用に関する新たな知見を提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:12:00 GMT)
Using Large Language Models for a standard assessment mapping for sustainable communities [0.0] 本稿では,大規模言語モデル(LLM)を用いた都市持続可能性評価への新たなアプローチを提案する。
この方法論には、標準定義に基づくカスタムプロンプトの開発と、パリ参加予算案の527のプロジェクトとProBONO Horizon 2020プロジェクトの398のアクティビティの2つの異なるデータセットへの適用が含まれている。
本稿では, 従来の人間による評価よりも, 大幅な省エネ, 整合性の向上など, この手法の利点について論じる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:04:18 GMT)
Turbofan Engine Remaining Useful Life (RUL) Prediction Based on Bi-Directional Long Short-Term Memory (BLSTM) [0.0] 本稿では,双方向長短期記憶(BLSTM)モデルについて述べる。
また、いくつかのRUL予測データベースモデルのベンチマークも提供する。
提案したRUL予測モデルは,エンジン故障予測ベンチマークデータセットに基づいて評価する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:27:07 GMT)
Tree Transformers are an Ineffective Model of Syntactic Constituency [0.0] 言語学者は、自然言語構文の重要な側面は、言語単位を構成構造にまとめることである、と長い間考えてきた。
ツリー変換器など、選挙区に対する帰納バイアスを提供するために、いくつかの代替モデルが提案されている。
木形質変換器を用いて意味的・有用な構成構造を利用するかどうかを検討する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:53:46 GMT)
The relativistic rotated harmonic oscillator [0.0] 量子調和振動子の拡散解析変換により得られる非自己共役作用素の相対論的版を導入する。
スペクトルは実かつ離散的であるが、固有函数は基底を形成しておらず、擬スペクトルは非常に非自明であることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:35:12 GMT)
The brain versus AI: World-model-based versatile circuit computation underlying diverse functions in the neocortex and cerebellum [0.0] 脳とAIの類似点と収束進化を同定する。
確立した神経科学理論を統合する新しい理論を提案する。
私たちの体系的なアプローチ、洞察、理論は、脳を理解するための画期的な進歩を約束します。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 04:05:43 GMT)
The SVASR System for Text-dependent Speaker Verification (TdSV) AAIC Challenge 2024 [0.0] 提案システムでは,音声内容の検証にFast-Conformer-based ASRモジュールが組み込まれている。
本稿では,wav2vec-BERTモデルから抽出した話者埋め込みとReNetモデルを組み合わせた特徴融合手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:53:45 GMT)
The Role of Accuracy and Validation Effectiveness in Conversational Business Analytics [0.0] 本研究では,AIを利用した対話型ビジネス分析を用いて,エンドユーザが従来のセルフサービス分析を効果的に利用できない技術的能力ギャップに対処する手法について検討する。
自然言語による対話を容易にすることによって、対話型ビジネス分析は、ユーザが独立してデータを検索し、洞察を生成できるようにすることを目的としている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:14:53 GMT)
Teaching Smaller Language Models To Generalise To Unseen Compositional Questions (Full Thesis) [0.0] 私たちは、検索したコンテキストを推論する能力を注入することで、さまざまな質問に答えるようにモデルを訓練します。
2つの知識ソースからコンテキストを取得し、ウィキペディアコーパスは、新しい拡張を持つマルチホップ高密度検索システムを用いてクエリし、より大規模な言語モデルから生成された論理から、より低いリソース環境下での動作を最適化した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:25:34 GMT)
Synthesising Handwritten Music with GANs: A Comprehensive Evaluation of CycleWGAN, ProGAN, and DCGAN [0.0] 本稿では,現実的な手書き楽譜の合成にGAN(Generative Adversarial Networks)を適用し,データ不足問題に対処する。
本稿では,3種類のGANモデル(DCGAN, ProGAN, CycleWGAN)について,多彩で高品質な手書き音楽画像を生成する能力の比較を行った。
スタイル伝達とトレーニングの安定性を向上させるCycleWGANモデルは,定性評価と定量的評価の両方において,DCGANとProGANを著しく上回っている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:10:43 GMT)
Symmetry-preserved cost functions for variational quantum eigensolver [0.0] ハイブリッド量子-古典的変分アルゴリズムは、ノイズの多い量子コンピュータに最適であると考えられている。
コスト関数に直接対称性の保存を符号化し、ハードウェア効率の良いAns"atzeをより効率的に利用できるようにする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:33:47 GMT)
Superradiant Quantum Phase Transition in Open Systems: System-Bath Interaction at the Critical Point [0.0] そこで本研究では,Dickeモデルとボソニック浴場との相互作用について検討した。
臨界点が環境との相互作用に影響されないことがわかった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:56:40 GMT)
Subsystem decompositions of quantum evolutions and transformations between causal perspectives [0.0] 我々は、量子進化は異なるサブシステム分解に関して表現できるという考えを定式化する。
量子スイッチの異なるパーティに関連付けることができる因果的視点は、サブシステム分解の変化によって関連付けられないことを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:42:07 GMT)
Spectral Signatures of Non-Trivial Topology in a Superconducting Circuit [0.0] 3つのジョセフソントンネル接合を平行に持つ超伝導回路が非自明なトポロジーを示す退化性を持つことを示す。
測定結果から、異なる位相構造で作製されたデバイスは、接合不完全性や幾何学的インダクタンスに対して堅牢であるべき単純な位相図上に落下することが示された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:26:53 GMT)
Soft information decoding with superconducting qubits [0.0] 「ソフトデコーディング」は閾値を25%引き上げ、エラー率を最大30倍まで下げる。
測定毎に1バイトの情報が最適な復号化を実現するのに十分であることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:41:25 GMT)
Robustness of contextuality under different types of noise as quantifiers for parity-oblivious multiplexing tasks [0.0] 我々は分析的および数値的なツールを用いて、異なる種類の雑音下でのPOMシナリオにおける文脈性のロバスト性を推定する。
我々は,任意の$n$-to-1 POMシナリオにおいて,文脈性から偏極へのロバスト性と成功率の関係を一般化する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:18:25 GMT)
Regression-based Physics Informed Neural Networks (Reg-PINNs) for Magnetopause Tracking [0.0] 回帰に基づく物理情報ニューラルネットワーク(Reg-PINN)の紹介
Reg-PINNは、物理にインスパイアされた経験的モデルをニューラルネットワークの損失関数に埋め込む。
シュエのモデルと比較して、この手法はRMSEの約30%の削減を実現している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:38:43 GMT)
Quantum thermodynamics of the Caldeira-Leggett model with non-equilibrium Gaussian reservoirs [0.0] 我々は、量子粒子がエンジニアリングされた貯水池の集合に強く結合されるカルデイラ・レゲットモデルの非平衡バージョンを導入する。
強い置換/スクイーズされた貯水池は、ハミルトニアン系における効果的な時間依存を生成するために使用できる。
非平衡カルデイラ・レゲットモデルにおける熱統計と、圧縮および変位色雑音の作用による古典的ランゲヴィン粒子の統計との量子古典的対応を示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:02:15 GMT)
Quantum subsystem codes, CFTs and their $\mathbb{Z}_2$-gaugings [0.0] 量子サブシステム符号からナライン共形場理論を構築する。
得られた符号 CFT は、大域的な$mathbbZ$対称性を示し、オービフォールドおよびフェルミオン化された理論を実行することができる。
我々は、$mathbbZ$-bifold, new supersymmetric code CFT, and few fermionic code CFTs with spontaneously broken Supersymmetric。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:18:55 GMT)
Quantum State Tomography of Photonic Qubits with Realistic Coherent Light Sources [0.0] 量子状態トモグラフィ(QST)は、量子状態の特徴付けに欠かせない技術である。
本稿では,現実的な条件下でのQSTの効率をシミュレーションし,評価するための数値的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:28:37 GMT)
Quantum Circuit Training with Growth-Based Architectures [0.0] 本研究では,量子回路(PQC)の深度を漸進的に増加させる成長型トレーニング戦略を提案する。
ブロック成長,逐次特徴マップ成長,インターリーブ特徴マップ成長という3つの異なる手法を開発し,PQCに再アップロードブロックを適応的に付加する。
回帰タスクと2次元ラプラス方程式について, 動的成長法が従来の固定深度法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:46:22 GMT)
PriorPath: Coarse-To-Fine Approach for Controlled De-Novo Pathology Semantic Masks Generation [0.0] 粗い粒度の画像から得られた詳細でリアルなセマンティックマスクを生成するパイプラインであるPresidePathを提案する。
このアプローチにより、生成されたマスクの空間配置を制御でき、結果として合成画像が生成される。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:57:19 GMT)
Prediction Beyond the Medium Range with an Atmosphere-Ocean Model that Combines Physics-based Modeling and Machine Learning [0.0] 本稿では、機械学習(ML)と従来の物理モデルを組み合わせたハイブリッドモデリング手法の可能性について検討する。
このモデルは低分解能で簡易なパラメータ化大気一般循環モデルSPEEDYに基づいている。
このモデルはエルニーノの周期と、季節によって3~7ヶ月の降水量による地球規模のテレコネクションを予測する能力を持っている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:07:31 GMT)
Postselected amplification applied to Mach-Zehnder-interferometer for phase shift measurement of optical coherent states [0.0] マッハ・ツェンダー干渉計(MZI)を通過する際の光コヒーレント状態の位相シフト測定手法を提案する。
通常の弱値増幅(WVA)の定式化とは異なり、MZIの経路状態は光コヒーレント状態に絡み合ったサブシステム状態として記述することはできない。
我々はMZIの暗ポートにおける場四分法測定から抽出した増幅位相シフトを明示的に実施する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:27:34 GMT)
Post-Markovian master equation à la microscopic collisional model [0.0] 我々は、マルコフ衝突モデルフレームワークから正のポストマルコフマスター方程式(PMME)を導出した。
また, 導出方程式を用いて熱化を調べた結果, ポストマルコフ力学が熱化過程を加速することが明らかとなった。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:18:10 GMT)
Phonon Number Measurement Using Optimal Composite Pulses [0.0] 理論的には, 状態進化の整合性を必要としない複合パルスを用いた手法を提案する。
これは、断熱的進化のレッドサイドバンド法と直接比較して、フォック状態のより高い個体数を測定することができる。
我々は、合成パルスのユニタリ演算の忠実度を改善するために、量子最適制御法を用いる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:17:18 GMT)
Out-of-Time Ordered Correlator for a Chaotic Many-Body Quantum System [0.0] カオス多体量子系の時間外相関器(OTOC)の大規模依存性と値を明示的に計算する。
我々は、$Delta$が対応する古典系の主ラプノフ係数と普遍的に関連していると推測する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:51:46 GMT)
Oriented histogram-based vector field embedding for characterizing 4D CT data sets in radiotherapy [0.0] 肺放射線療法の第一の目的は、標的体積に所定の用量を与えながら、健康な組織への曝露を最小限に抑えて治療結果を最適化することである。
この課題は、呼吸による肺組織の動きを考慮に入れ、正確な治療アライメントに影響を及ぼす。
本稿では,CTスキャンの計画や,変形可能な画像登録から得られるベクトル場などの導出データなど,前処理情報のみに依存する先進的アプローチを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:05:57 GMT)
Optical Algorithm for Derivative of Real-Valued Functions [0.0] 一次元実数値関数の導出をパラ軸および単色レーザービームを用いて実装するための光学的アルゴリズムを作成する。
我々は、2次元位相符号化関数を光ビームの強度プロファイルに転送できる新しい光学アルゴリズムを実験的に実装した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:24:28 GMT)
On the equivalence between SAPPT and SAS states [0.0] 絶対分離状態 (AS) と絶対正部分転位状態 (APPT) の同値性は、一般に量子エンタングルメント理論において未解決の問題である。
SAPPT状態は、明示的な反例を提供することにより、常に対称的に分離可能であるとは限らない。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:06:52 GMT)
On classical advice, sampling advise and complexity assumptions for learning separations [0.0] 我々は、サンプリングアドバイス、すなわちトレーニングセットの形でのアドバイスと古典的なアドバイスの等価性を証明する。
主な結果は,BPP/sampがP/polyに等しいことを示す。
量子学習の高速化を示す概念クラスの存在に対する十分かつ必要な複雑性の仮定を同定する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:23:04 GMT)
OLoRA: Orthonormal Low-Rank Adaptation of Large Language Models [0.0] Low-Rank Adaptation (LoRA)はこれらの問題を緩和するための有望な方法として登場した。
OLoRAはLLMトレーニングの収束を著しく加速する。
OLoRAは、様々な言語モデリングタスクで標準のLoRAよりもパフォーマンスが向上している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:45:19 GMT)
Nonlinear quantum computing by amplified encodings [0.0] 本稿では,高次元非線形量子計算のための新しい枠組みを提案する。
増幅ベクトルと行列エンコーディングのテンソル積を利用する。
このフレームワークは非線形量子アルゴリズムへの新たな経路を提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:37:57 GMT)
Non-Hermitian Floquet dynamics in absorption spectroscopy [0.0] 弱いプローブの極限では、リンドブラッド・マスター方程式は関連する定常状態コヒーレンスに対してより小さな線形方程式系に還元される。
媒体の複雑な感受性は、崩壊する着衣状態の個々の寄与の観点から表すことができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:48:01 GMT)
Noise-tolerant learnability of shallow quantum circuits from statistics and the cost of quantum pseudorandomness [0.0] 量子過程を学習するための量子統計クエリの自然な堅牢性を示す。
定深量子回路の学習アルゴリズムを量子統計クエリ設定に適用する。
擬似乱数ユニタリ(PRU)は一定深さの回路では構築できないことを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:42:15 GMT)
Neural Port-Hamiltonian Models for Nonlinear Distributed Control: An Unconstrained Parametrization Approach [0.0] ニューラルネットワーク(NN)は、優れたパフォーマンスをもたらす制御ポリシのパラメータ化に利用することができる。
NNの小さな入力変更に対する感度は、クローズドループシステムの不安定化のリスクを引き起こす。
これらの問題に対処するために、ポート・ハミルトンシステムのフレームワークを活用して、連続時間分散制御ポリシーを設計する。
提案する分散コントローラの有効性は,非ホロノミック移動ロボットのコンセンサス制御によって実証される。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:41:46 GMT)
Naive Algorithmic Collusion: When Do Bandit Learners Cooperate and When Do They Compete? [0.0] アルゴリズムエージェントは、さまざまな競争上の決定設定で使用される。
エージェントが競合する状況で使用されるマルチアーム帯域幅機械学習アルゴリズムの動作について検討する。
これらの文脈自由な盗賊は、相手の選択や結果の知識がないまま、相変わらず共謀行動を学ぶことを示している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:58:07 GMT)
Mobility edges in pseudo-unitary quasiperiodic quantum walks [0.0] フロッケ準結晶は、離散時間ステップにおける均質磁場におけるブロッホ電子の運動をシミュレートする。
モデルがまだ擬似単体であることを示します」
初めて、離散時間設定に特有の第2の遷移を観察する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:00:01 GMT)
Measuring entanglement without local addressing via spiral quantum state tomography [0.0] 量子状態トモグラフィーは、量子コンピュータとシミュレータで生成された量子状態を特定するための重要なツールである。
本稿では,より効率的にスケールできるトモグラフィー手法を提案する。
数値シミュレーションの結果,高いトモグラフィ効率と精度が示された。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:37:29 GMT)
Measurement incompatibility cannot be stochastically distilled [0.0] 本研究では, フィルタを適用すれば, 一連の測定の不整合性を高めることはできないことを示す。
我々は、最も一般的な局所フィルタに関して得られるステアビリティの問題を解くことができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:22:05 GMT)
Machine-learning emergent spacetime from linear response in future tabletop quantum gravity experiments [0.0] 本稿では,AdS/CFT対応下で精度の高いバルク再構成を実現するために,新しい解釈型ニューラルネットワーク(NN)モデルを提案する。
本研究の目的は,NNを用いた機械学習により,凝縮物質系データから高次元重力測定値を再構成することである。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 02:42:33 GMT)
Low-Data Classification of Historical Music Manuscripts: A Few-Shot Learning Approach [0.0] 歴史的写本における記号分類のための自己指導型学習フレームワークを開発した。
この課題を克服するために、ニューラルネットワークによる特徴抽出器を非ラベルデータでトレーニングし、最小限のサンプルで効果的な分類を可能にする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:14:25 GMT)
Local Intrinsic Dimensionality for Dynamic Graph Embeddings [0.0] 局所内在的次元性(LID)は、データマイニングと機械学習の分野において重要な理論的意味と実践的応用を持っている。
近年の研究では,グラフに対して定義されたLID尺度が,ランダムウォークに基づくグラフ表現学習法を改善することが示唆されている。
本稿では,静的グラフのための LID 尺度である NC-LID を動的ネットワークに適用する方法について論じる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:11:45 GMT)
Limitations of tensor network approaches for optimization and sampling: A comparison against quantum and classical Ising machines [0.0] 相互作用グラフを用いたIsingスピングラスシステムの低エネルギースペクトルを明らかにするアルゴリズムを開発した。
我々の決定論的アプローチは、分岐と境界の探索戦略と、辺辺の近似計算を組み合わせたものである。
ペガサスグラフとゼファーグラフで定義されたランダムな問題に対して、最大数千スピンのアプローチをベンチマークする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 14:35:14 GMT)
Lens Distortion Encoding System Version 1.0 [0.0] LDESは、あるビューから別のビューへの直接変換に使用される単一の高品質でアニマタブルなSTMapを生成する。
View Mapsは自由に組み合わせたり、変換したり、アニメーションしたりできるので、アナモルフィックから球面歪みへのスムーズなシフトのような効果もできる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 21:35:42 GMT)
Learning thresholds lead to stable language coexistence [0.0] 本稿では,言語シフトダイナミクスにおける記憶と学習の効果を組み込んだ言語競合モデルを提案する。
粗い時間スケールでは、記憶と学習の影響は、競合する言語の話者分数に対する閾値として表すことができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:58:08 GMT)
K8s Pro Sentinel: Extend Secret Security in Kubernetes Cluster [0.0] 本研究は,Secret Objectsの暗号化とアクセス制御の自動化を行うオペレータであるK8s Pro Sentinelを紹介する。
Sentinel演算子の性能と信頼性をRed Hat Operator Scorecardとカオスエンジニアリングのプラクティスを用いて評価した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:15:37 GMT)
Isolated zero mode in a quantum computer from a duality twist [0.0] 理論モデルを超えた双対性、一般化対称性、位相欠陥の相互作用について検討する。
この物理を表わす単純なモデルは横フィールドイジングモデルであり、位相的欠陥をホストすることができる。
空間上の一点に作用する場合、この双対性欠陥は双対性ツイスト境界条件と1つのゼロモードを課す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:51:52 GMT)
Interpretable machine learning approach for electron antineutrino selection in a large liquid scintillator detector [0.0] 我々は,大規模な液体シンチレータ検出器のための強力な信号バックグラウンド識別器として,完全に接続されたニューラルネットワークを導入した。
JUNO検出器を例として、カットベースアプローチの効率が既に高いにもかかわらず、提示されたMLモデルにより、イベント選択効率がさらに向上できることを実証する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 10:16:37 GMT)
Interaction-induced enhancement of the efficiency in a quantum Hall thermal machine [0.0] 量子ドットを形成する1つの閉じた量子ホールエッジチャネルに基づく熱機械について検討する。
異なる温度で保たれた2つの量子ホール状態とトンネルが結合しており、ホットホールはローレンツの電圧パルスの周期的な列車によって平衡から追い出される。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:55:10 GMT)
InAs/InP quantum dot based C-Band all-fiber plug-and-play triggered single-photon source integrated using micro-transfer printing [0.0] InP H1点欠陥2Dフォトニック結晶キャビティにおけるInAs/InP量子ドットの設計,製造,光学特性について報告する。
このようにして、第3の通信窓で動作している全ファイバシングルフォトソースのプラグアンドプレイを実演する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:31:32 GMT)
Graph Pooling with Local Cluster Selection [0.0] GNNにおけるグラフプーリングは、グラフを入力として取り、粗いグラフを出力として生成する操作のファミリーである。
この研究は、平均的な状況に対するグラフプーリングアプローチとともに、グラフをプールする新しい手順を定式化する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 17:54:29 GMT)
Generative AI for Brane Configurations, Tropical Coamoeba and 4d N=1 Quiver Gauge Theories [0.0] 我々は、複雑な構造を入力として選択した生成AIモデルを訓練し、対応する熱帯コアメーバを生成する。
同じトーリックカラビ・ヤウ 3 次元に対応するブレーンタイリングの族に対する位相空間全体の高分解能表現を得る。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 01:42:12 GMT)
GaussianDiffusion: 3D Gaussian Splatting for Denoising Diffusion Probabilistic Models with Structured Noise [0.0] 本稿では,ガウススプラッティングに基づく3次元コンテンツ生成フレームワークについて紹介する。
3次元生成における多視点一貫性の実現という課題は、モデリングの複雑さと精度を著しく損なう。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:03:41 GMT)
From Uncertainty Relations to Quantum Acceleration Limits [0.0] 任意の有限次元射影ヒルベルト空間で定義される量子系に対する2つの代替微分の比較解析を行う。
量子進化の加速の最大上限を達成するのに必要な最も一般的な条件を見つける。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:57:05 GMT)
Exploring Privacy and Security as Drivers for Environmental Sustainability in Cloud-Based Office Solutions (Extended Abstract) [0.0] 本稿では,クラウドベースのオフィスソリューションにおけるプライバシ,サイバーセキュリティ,環境影響の交わりについて検討する。
プライバシとセキュリティを重視したソリューションは,データ収集や広告を通じて調達したソリューションよりも“グリーン”である,という仮説を立てています。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:36:25 GMT)
Exploring Discrete Flow Matching for 3D De Novo Molecule Generation [0.0] フローマッチングは、最近提案されたジェネレーティブモデリングフレームワークで、様々なタスクにおいて印象的なパフォーマンスを実現している。
本稿では,既存の手法よりも学習可能なパラメータが少ない3D de novo設計における技術性能の状態を達成した,オープンソースのFlowMol-CTMCを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:27:39 GMT)
ExpTest: Automating Learning Rate Searching and Tuning with Insights from Linearized Neural Networks [0.0] 本稿では,初期学習率探索とその後の学習率調整のための高度な手法であるExpTestを提案する。
ExpTestを数学的に正当化し、実証的なサポートを提供します。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:58:22 GMT)
Exchange anisotropies in microwave-driven singlet-triplet qubits [0.0] 量子プロセッサのワークホースとして、ホールスピン量子ビットが出現している。
スピン軌道相互作用は装置の非均一性を引き起こし、局所的に異なる量子エネルギーと部位依存の異方性をもたらす。
平面ゲルマニウム中のマイクロ波駆動一重項量子ビットについて報告する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 08:14:37 GMT)
Evaluating Rank-N-Contrast: Continuous and Robust Representations for Regression [0.0] この文書は2023年に出版された『Rank-N-Contrast』(arXiv:2210.01189v2)の複製である。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:31:53 GMT)
Engineering Ponderomotive Potential for Realizing $π$ and $π/2$ Bosonic Josephson Junctions [0.0] 音速ジョセフソン接合の定位電位を高周波電磁場により周期的に検討する。
マクロな量子自己トラッピングから$pi$-Josephson振動への動的遷移のパラメータ依存性について論じる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:22:39 GMT)
Embedded structure in quantum theory, functional operator and multiverse [0.0] 量子力学が量子場理論から再構築されるという事実をヒントとして、量子場理論を組み込んだより広い理論的枠組みを探求する。
関数演算子を導入することによって量子理論を組込み構造で定式化し、レベルII多元数を記述することができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 05:53:47 GMT)
Embedded Blockchains: A Synthesis of Blockchains, Spread Spectrum Watermarking, Perceptual Hashing & Digital Signatures [0.0] 音声とビデオの操作を検知する手法を提案する。
このスキームは、ブロックチェーン、暗号化された拡散スペクトル透かし、知覚ハッシュ、デジタルシグネチャの合成である。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:16:37 GMT)
Dynamic violation of Bell's inequalities in the angular momentum representation [0.0] 角モータ$j_$および$j$の複合系の密度行列の一般式を得る。
また、絡み合い対策とベル係数の強い違反との相関も与えられる。
2粒子ハミルトニアン系の固有状態の密度行列の時間依存凸結合を用いる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:15:18 GMT)
Discrete Quantum Walks with Marked Vertices and Their Average Vertex Mixing Matrices [0.0] 負のアイデンティティコインをマークされた頂点とグローバーコインに割り当てる離散的な量子ウォークについて検討する。
遷移行列の固有空間の基底を見つけ、平均頂点混合行列の式を導出する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:58:55 GMT)
Deep Convolutional Neural Networks Structured Pruning via Gravity Regularization [0.0] 我々は、重力の概念を深層畳み込みニューラルネットワーク(DCNN)の訓練段階に統合する物理に着想を得たアプローチを提案する。
このアプローチでは、重力は畳み込みフィルタと誘引フィルタの質量の積に直接比例し、その間の距離の正方形に逆比例する。
その結果、より強い重力を経験するフィルターは重量をゼロに減らし、除去が可能となり、一方で弱い重力下でのフィルターは重要な重量を保持し、重要な情報を保持する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:10:10 GMT)
Deciphering Urban Morphogenesis: A Morphospace Approach [0.0] 形態形成は形態空間を通じて軌道として概念化され、構造探索選択プロセスによって制御される。
この研究は、都市形態形成の非エルゴード的な性質を強調しており、互いに依存するエージェント間の相互作用の多様化を支援するために、適合度に基づいて構成が徐々に選択される。
この分析は、密度、透過性、情報組織のバランスをとるソリューションとして都市が出現し、進化していくという提案を支持し、より複雑な社会機能をサポートすることができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:46:56 GMT)
Deciphering Acoustic Emission with Machine Learning [0.0] マイクロピラー圧縮試験における変位雪崩の微視的詳細を推定できる機械学習に基づく手法を提案する。
機械学習アプローチでは,様々な記述子が利用されており,予測における重要性が分析されている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:34:05 GMT)
Curvature Informed Furthest Point Sampling [0.0] ファテスト点サンプリング(FPS)を強化する強化学習に基づくサンプリングアルゴリズムを提案する。
提案手法は,FPS由来のソフトランクと深部ニューラルネットワークによる曲率スコアを組み合わせることで,ポイントをランク付けする。
我々は,各特徴が性能に与える影響について,質的および定量的に考察した総合的アブレーション研究を提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:58:38 GMT)
Correlation versus Dissipation in a Non-Hermitian Anderson Impurity Model [0.0] 非エルミート・アンダーソン不純物モデルに対する1体損失のスレーブボソン理論を開発する。
我々は、この再正規化効果に基づいて、近藤状態の散逸性量子相転移のメカニズムを明らかにする。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 02:02:43 GMT)
Continual Deep Reinforcement Learning with Task-Agnostic Policy Distillation [0.0] TAPD(Task-Agnostic Policy Distillation)フレームワークが導入されている。
本稿では,継続学習の問題に対処する。
タスク非依存の蒸留知識を利用することで、下流タスクをより効率的に解決することができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:18:39 GMT)
Computed models of natural radiation backgrounds in qubits and superconducting detectors [0.0] 自然発生の放射線背景は超伝導量子ビットにおける相関的なデコヒーレンス現象を引き起こす。
我々は、宇宙線スペクトルの粒子輸送符号Geant4とPARMAサマリーを用いて、両方の自然放射線源をモデル化する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:57:32 GMT)
Collective nuclear excitation and pulse propagation in single-mode x-ray waveguides [0.0] M"オスバウアー核は、硬X線エネルギー範囲の遷移を持つ非常にきれいな量子光学系を構成する。
我々は、薄膜導波路におけるいわゆる未探索核共鳴X線伝播を設計し、実証する。
我々の発見は、核共鳴散乱と核量子光学の実験のための新しい設計空間を開く。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:56:26 GMT)
Cluster-based human-in-the-loop strategy for improving machine learning-based circulating tumor cell detection in liquid biopsy [0.0] 本研究では,機械学習によるCTC検出を改善するためのHuman-in-the-loop(HiL)戦略を提案する。
我々は,自己教師型ディープラーニングと従来のMLに基づく分類器を組み合わせて,人間専門家による新たな未ラベルトレーニングサンプルの反復的サンプリングとラベル付けを提案する。
転移性乳癌患者の液体生検データに対して,本手法の利点を実証した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 12:26:48 GMT)
Charge-induced energy shift of a single-spin qubit under a magnetic-field gradient [0.0] 半導体量子ドット(QD)に閉じ込められた電子は、周囲のQDの電子占有の変化によって置換することができる。
不均一磁場における単一スピン量子ビットの場合、ホスト電子の変位は量子ビットエネルギーシフトをもたらす。
磁場勾配におけるシリコン単一スピン量子ビットに対する近接QDの電荷占有の変化によって引き起こされる量子ビットエネルギーシフトを分光学的に検討した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:34:50 GMT)
Cascaded Single Photons from Pulsed Quantum Excitation [0.0] 2段階のシステムは、最も基本的な構成要素である。
最近の理論的提案では、量子光で2段階の系を照らすのが有利であると予測されている。
我々は、レーザーパルスによって駆動される2レベル系の放出を利用して、別の2レベル系を励起する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:23:43 GMT)
CMAViT: Integrating Climate, Managment, and Remote Sensing Data for Crop Yield Estimation with Multimodel Vision Transformers [0.0] 我々はCMAViT(Climate-Management Aware Vision Transformer)と呼ばれる深層学習に基づくマルチモデルを導入する。
CMAViTは、リモートセンシング画像と短期気象データを活用することにより、空間データと時間データの両方を統合する。
UNet-ConvLSTMのような従来のモデルよりも優れ、空間的変動のキャプチャと収差予測に優れています。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 23:34:53 GMT)
CIA: Controllable Image Augmentation Framework Based on Stable Diffusion [0.0] データセット拡張のためのモジュールパイプラインであるCIAを紹介します。
我々は、CIAがトレーニングデータの最適な拡張パイプラインを探すのにどのように使えるかを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:29:51 GMT)
Broadcasting Quantum Information using Finite Resources [0.0] 本稿では,この放送プロセスの精度が,記憶の生成に関する熱力学的制約によって制限されていることを示す。
このようなプロセスのエントロピー生成の限界を低くし、メモリエントロピーが情報を正確にブロードキャストする能力を制限することを示した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:12:52 GMT)
Breakdown of Linear Spin-Wave Theory in a Non-Hermitian Quantum Spin Chain [0.0] 励起スペクトルのスピン波理論と非エルミート逆場イジングモデルのクエンチ力学について述べる。
複素励起スペクトルはホルシュタイン・プリマコフ変換の線形近似を用いた一般超立方体格子に対して得られる。
しかし, 線形スピン波近似は崩壊し, ボゾン理論は有限時間での発散に悩まされている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:06:20 GMT)
Bose-Einstein condensation at constant pressure [0.0] 凝縮を伴う状態への遷移の温度が見いだされる。
総密度, 凝縮密度, エネルギー, エントロピー, 熱容量の温度依存性を計算する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:36:13 GMT)
Bloch Sphere of the Qutrit System [0.0] 基底群として SU(3) 群を用いて、クォート系の異なる構成のブロッホベクトルを得る。
異なる構成の2つのセクターのブロッホ軌跡は、単純曲線から複素曲線の範囲を示している。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:21:05 GMT)
Beyond Task Vectors: Selective Task Arithmetic Based on Importance Metrics [0.0] 本稿では,タスク固有パラメータ融合によるマルチタスク性能向上を目的としたトレーニングフリーフレームワークであるtextbfunderlineSelective textbfunderlineTask textbfunderlineArithmetic underlinetextbf(STA)を紹介する。
実験により,STAはベンチマーク間で優れたマルチタスク性能を実現し,タスクを忘れる際の優れた性能を示した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 06:59:16 GMT)
Batch Bayesian Optimization via Expected Subspace Improvement [0.0] 本稿では,ベイズ最適化をバッチ評価に拡張するためのシンプルで効率的な手法を提案する。
提案手法は,逐次ベイズ最適化アルゴリズムと比較した場合,ニア線形高速化を実現することができる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:14:09 GMT)
Anyons on M5-Probes of Seifert 3-Orbifolds via Flux Quantization [0.0] アーベル量子状態の厳密な導出があり、従って「位相順序」は、自明なセイファートファイバーの3オリフォルド特異点にラップされたM5-プローブの1+2次元固定軌跡に現れる。
これは、等変ねじれコホモトピーと呼ばれる非アーベルコホモロジー理論におけるフラックス量子化により、プローブ M5-ブレーン上の「自己双対」テンソル場を大域的に完成させた後である。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 19:00:03 GMT)
Anomaly Detection in California Electricity Price Forecasting: Enhancing Accuracy and Reliability Using Principal Component Analysis [0.0] 本研究は,カリフォルニア州の電力網における電力価格予測の強化に焦点を当てた。
我々は,CAISOの時間的電力価格と2016-2021年の需要を分析し,日頭予測精度を向上させる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 20:55:25 GMT)
Anomaly Detection and RFI Classification with Unsupervised Learning in Narrowband Radio Technosignature Searches [0.0] 本稿では,HDBSCANを用いて偽陽性率を低減し,外れ値信号の分離を行う信号処理手法であるGLOBular Clusteringを提案する。
標準的な狭帯域信号検出と空間フィルタリングパイプラインを組み合わせると、GLOBcularクラスタリングは偽陽性率を大幅に改善する。
We benchmark our method against the Choza et al. (2024) TurboSETI-only search of 97 nearby galaxy at L-band, showed a false- positive hit reduction rate of 93.1% and a false- positive event reduction rate of 99.3%。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:40:19 GMT)
Anomalous high-density spin noise in a strongly interacting atomic vapor [0.0] 本稿では,スピン力学に大きく影響を及ぼす強い相互作用状態の観察について報告する。
以上の結果から,通常の単一原子動力学モデルではスペクトルは説明できないことが示唆された。
この研究は、SNSを用いた原子蒸気中の多体スピンノイズや高次相関器の研究への道を開く。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:46:49 GMT)
Angular momentum effects in neutron decay [0.0] 非平面波状態における自由中性子のβ崩壊の興味深い現象について検討する。
解析では、非ゼロ軌道角運動量(OAM)を持つ非偏極渦(ベッセル)中性子、ラゲール・ガウス波パケット、および独自の偏極パターンを特徴とするスピン相関OAM状態の3種類の状態について検討した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 09:44:28 GMT)
A quantum inspired predictor of Parkinsons disease built on a diverse, multimodal dataset [0.0] 世界最速の神経変性疾患であるパーキンソン病は、わずか2年で50%増加した。
我々のモデルは90%の精度、AUCは0.98の精度でベンチマークモデルを上回っている。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 18:29:12 GMT)
A comparison of Bayesian sampling algorithms for high-dimensional particle physics and cosmology applications [0.0] 我々は,マルコフ・チェイン・モンテカルロ(MCMC)とネストサンプリング手法を幅広く検討し,比較した。
ネストサンプリング手法を用いて最も容易に解けると広く考えられているいくつかの例は、現代のMCMCアルゴリズムによりより効率的に解けることを示す。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 03:10:24 GMT)
A Review of Mechanistic Models of Event Comprehension [0.0] 事象理解の理論的仮定と計算モデルについて考察する。
イベント理解の計算モデルとして,REPRISE,Structured Event Memory,Luモデル,Gumbschモデル,Elman and McRaeモデルを挙げる。
主要なテーマは、帰納的バイアスとしての階層構造の使用、理解における予測の重要性、作業イベントモデルのための多様な戦略である。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 16:55:33 GMT)
A Review of Design Concerns in Superconducting Quantum Circuits [0.0] 本稿では,量子情報応用のための超伝導回路デバイスの設計プロセスについて述べる。
デバイス上で望ましい実効ハミルトニアンを実装するために考慮すべき要因について論じる。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 22:16:57 GMT)
A Review of Bayesian Uncertainty Quantification in Deep Probabilistic Image Segmentation [0.0] 画像セグメンテーションの進歩は、ディープラーニングベースのコンピュータビジョンの広い範囲において重要な役割を果たす。
この文脈において不確かさの定量化が広く研究され、モデル無知(認識の不確実性)やデータ曖昧さ(アラート的不確実性)を表現し、不正な意思決定を防ぐことができる。
この研究は、分野の進歩を左右する不確実性の基本概念と様々なタスクへの応用について議論することで、確率的セグメンテーションの包括的概要を提供する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:26:09 GMT)
A Performance Increment Strategy for Semantic Segmentation of Low-Resolution Images from Damaged Roads [0.0] 新興国の代表的データセットは、貧弱な道路の低解像度画像で構成されている。
このシナリオでは、3つの課題が生じる: ピクセルが少ないオブジェクト、未定義の形状を持つオブジェクト、非常に不足したクラス。
これらの課題に対処するため、この研究は、パフォーマンスを高めるための14のトレーニング実験の方法論として、セマンティックのパフォーマンスインクリメント戦略(PISSS)を提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 11:27:42 GMT)
A Gaussian Process Model for Ordinal Data with Applications to Chemoinformatics [0.0] 化学実験の結果を予測するための条件付きガウス過程モデルを提案する。
我々のモデルの新しい側面は、核がスケーリングパラメータを含み、化学空間の要素間の相関の強さを制御することである。
本稿では,化学発見の容易化と化合物の有効性に対する重要な特徴の同定のための遺伝的アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 15:10:40 GMT)
A Deep Learning Approach to Predict the Fall [of Price] of Cryptocurrency Long Before its Actual Fall [0.0] 本研究の目的は、暗号通貨市場のリスクファクターの大きさを予測することである。
当社のアプローチは、経験した問題や困難を克服することで、暗号通貨市場に投資する人々を支援します。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 13:33:49 GMT)
A Cross-Corpus Speech Emotion Recognition Method Based on Supervised Contrastive Learning [0.0] 本稿では,教師付きコントラスト学習に基づくクロスコーパス音声認識手法を提案する。
まず,複数の音声感情データセットに対する教師付きコントラスト学習を用いて,自己教師付き音声表現モデルを微調整する。
実験の結果、WavLMベースのモデルはIEMOCAPデータセットで77.41%、CAIAデータセットで96.49%の未重み付き精度(UA)を達成した。
論文参考訳(メタデータ) (Mon, 25 Nov 2024 07:03:31 GMT)