Agentic Reasoning for Large Language Models [122.8] 推論は推論、問題解決、意思決定の基礎となる基本的な認知プロセスである。
大規模言語モデル(LLM)は、クローズドワールド設定では強力な推論能力を示すが、オープンエンドおよび動的環境では苦労する。
エージェント推論は、連続的な相互作用を計画し、行動し、学習する自律的なエージェントとしてLLMを解釈することでパラダイムシフトを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:58:23 GMT)
LiQSS: Post-Transformer Linear Quantum-Inspired State-Space Tensor Networks for Real-Time 6G [85.6] Sixth-Generation (6G) Open Radio Access Networks (O-RAN) における能動的およびエージェント的制御は、厳密なニアタイム(Near-RT)レイテンシと計算制約の下で制御グレードの予測を必要とする。
本稿では,効率的な無線テレメトリ予測のための変圧器後パラダイムについて検討する。
本稿では、自己アテンションを安定な状態空間動的カーネルに置き換える量子インスピレーション付き状態空間テンソルネットワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 12:08:38 GMT)
UDPNet: Unleashing Depth-based Priors for Robust Image Dehazing [77.1] UDPNetは、大規模で事前訓練された深度推定モデルDepthAnything V2から深度に基づく事前情報を活用する一般的なフレームワークである。
提案手法は,様々なシナリオにまたがる深度認識デハージングのための新しいベンチマークを確立する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 07:53:45 GMT)
Do Neural Codecs Generalize? A Controlled Study Across Unseen Languages and Non-Speech Tasks [72.1] 本稿では、ニューラルオーディオコーデック(NAC)の一般化能力の3つの重要かつ未解明な側面について検討する。
我々は厳格に制御された構成を用いてNACをスクラッチからトレーニングし、公正な比較を可能にするために事前学習データを慎重にキュレートする。
以上の結果から,NACは未学習言語への一般化が可能であり,非音声タスクにおける音声のみのNACは劣化した性能を示し,非音声タスクにおける非音声データの導入は音声タスクにおける同等のパフォーマンスを維持しつつ,非音声タスクにおけるパフォーマンスを向上させることが示唆された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 00:53:11 GMT)
ET-Agent: Incentivizing Effective Tool-Integrated Reasoning Agent via Behavior Calibration [68.9] ETAgentはエージェントのツール使用行動を調整するためのトレーニングフレームワークである。
過誤行動パターンを最適行動に段階的に校正するように設計されている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 02:13:27 GMT)
FutureX-Pro: Extending Future Prediction to High-Value Vertical Domains [65.9] FutureX-Proは、財政、小売、公衆衛生、自然災害の4つの経済と社会的に重要な分野をターゲットにしている。
本稿では、FutureX-Finance、FutureX-Retail、FutureX-PublicHealth、FutureX-NaturalDisaster、FutureX-SearchなどのFutureX-Proを紹介する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 04:44:49 GMT)
SSVD-O: Parameter-Efficient Fine-Tuning with Structured SVD for Speech Recognition [65.9] 本稿では,構造化SVD誘導(SSVD)ファインチューニング法の拡張であるSSVD-Outer(SSVD-O)を紹介する。
自動音声認識のためのPEFTにおいて,モデル部分空間間のパラメータ予算配分を初めて体系的に解析する。
その結果, SSVD-O は連続的に性能ギャップを細調整に狭めつつ, 一般化を改善し, 破滅的な忘れを軽減できることが示唆された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 22:16:44 GMT)
AQUA-Bench: Beyond Finding Answers to Knowing When There Are None in Audio Question Answering [58.0] Aqua-Benchは、Audio Question Unanswerability Assessmentのベンチマークである。
提案手法は,Absent Answer Detection,Incompatible Answer Set Detection,Incompatible Audio Question Detectionの3つのシナリオを体系的に評価する。
これらのケースを評価することで、Aqua-Benchはモデルの信頼性を厳格に測定する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 03:55:28 GMT)
Can Deep Research Agents Find and Organize? Evaluating the Synthesis Gap with Expert Taxonomies [57.1] 72のコンピュータサイエンスサーベイから得られた診断ベンチマークであるTaxoBenchを紹介する。
我々は,3,815個の引用を根本的真理として正確に分類した分類木を手作業で抽出した。
ベストエージェントは、専門家が選択した論文の20.9%しかリコールせず、完璧なインプットであっても、最高のモデルは組織の0.31 ARIしか達成していない。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:57:09 GMT)
NeuralFur: Animal Fur Reconstruction From Multi-View Images [56.5] 画像からリアルな動物の毛皮の形状を再構築することは、微細な細部、自己閉塞性、毛皮の外観に依存しているため、難しい作業である。
ストランドベース表現を用いた動物の高忠実度3次元毛皮モデリングのための,第1のマルチビューベース手法を提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 16:46:38 GMT)
Where It Moves, It Matters: Referring Surgical Instrument Segmentation via Motion [54.4] SurgRefは、自由形式の言語表現を楽器の動きに基礎を置くモーションガイドフレームワークである。
SurgRefをトレーニングし,評価するために,高密度時間マスクとリッチモーション表現を備えた多機能ビデオデータセットRef-IMotionを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 02:14:08 GMT)
Environment-Aware Code Generation: How far are We? [52.7] 大規模言語モデル(LLM)がユーザの特定の環境に適した実行可能コードを確実に生成できるかどうかは不明である。
本稿では,環境対応コード生成(EACG)の最初の体系的研究について述べる。
その結果,現在のLLMは環境固有のコード生成に苦しむ一方で,環境の適合性や実行性も向上していることがわかった。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 04:58:15 GMT)
Video Individual Counting and Tracking from Moving Drones: A Benchmark and Methods [51.9] moveDroneCrowd++は、移動中のドローンが捉えた、密集した群衆のカウントと追跡のための、最大のビデオレベルのデータセットである。
また,GD3Aを提案する。GD3Aは,特定位置化を回避する密度マップに基づくビデオ個人カウント手法である。
実験結果から,本手法は群集や複雑な運動下での既存手法よりも有意に優れていた。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 17:17:31 GMT)
Beyond the Dirac Delta: Mitigating Diversity Collapse in Reinforcement Fine-Tuning for Versatile Image Generation [51.3] textbfDRIFT(textbfDivetextbfRsity-textbfIncentivized Reinforcement textbfFine-textbfTuning for Versatile Image Generation)を提案する。
DRIFTはタスクアライメントとジェネレーションの多様性に関して優れた優位性を達成し、9.08%!sim! 43.46%$多様性等価アライメントレベルの増加と59.65ドルとなる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 13:25:43 GMT)
BiCoLoR: Communication-Efficient Optimization with Bidirectional Compression and Local Training [50.3] BiCoLoRは、ローカルトレーニングと圧縮という2つの広く使われている戦略を組み合わせた通信効率の最適化アルゴリズムである。
BiCoLoRは既存のアルゴリズムより優れており、通信効率の新たな標準を確立している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 13:23:27 GMT)
Evaluating Contextually Mediated Factual Recall in Multilingual Large Language Models [47.4] 大規模言語モデル(LLM)における文脈依存的事実リコールについて検討する。
文脈的調停は事実的想起を常に低下させ、関係性にかなりの変化をもたらす。
これらの知見は、孤立した事実記憶と文脈依存言語理解のギャップを浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:38:55 GMT)
Evaluating Large Language Models for Time Series Anomaly Detection in Aerospace Software [46.8] 時系列異常検出(TSAD)は、航空宇宙ソフトウェアシステムの安全性と信頼性を確保するために不可欠である。
大規模言語モデル(LLM)は、教師なしアプローチに代わる、有望なトレーニングなしの代替手段を提供する。
ATSADBenchは航空宇宙TSADの最初のベンチマークである。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 15:07:16 GMT)
MemeLens: Multilingual Multitask VLMs for Memes [45.8] ミーム理解のための多言語・説明強調視覚言語モデル(VLM)を提案する。
私たちは、38の公開ミームデータセット、データセット固有のラベルを、害、ターゲット、具体的/実用的意図、影響にまたがる20ドルのタスクの共有分類に集約します。
この結果から,ロバストなミーム理解には多モーダルな訓練が必要であり,セマンティックなカテゴリ間でかなりの差異があり,モデルが統一された環境で訓練されるのではなく,個々のデータセットに微調整された場合,過度な特殊化に敏感であることが示唆された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:01:03 GMT)
Encoding Emotion Through Self-Supervised Eye Movement Reconstruction [42.8] 自然主義的低解像度ビデオから感情表現のマルチモーダルマーカーを予測するために、眼球運動をどのように利用できるかを検討する。
言語モデルの事前学習法に着想を得て,自己監督型眼球運動再構成を用いた新しい視線検出モデルを開発した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:37:41 GMT)
DALD-PCAC: Density-Adaptive Learning Descriptor for Point Cloud Lossless Attribute Compression [42.6] 我々は,ポイントクラウド属性圧縮に適した学習ベースのフレームワークであるDALD-PCACを開発した。
本研究では,変分変分変換器を用いて点雲の空間性や不規則性に対処するポイントワイズアテンションモデルを開発した。
LiDARとオブジェクトポイントクラウドの実験は、DALD-PCACがほとんどのデータで最先端のパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 04:54:46 GMT)
Weaknesses of Facial Emotion Recognition Systems [42.0] 顔からの感情検出は、人間とコンピュータのインタラクションに必要な機械学習問題の1つである。
3つの最も興味深く最良のソリューションが選択され、続いて3つのデータセットが選択される。
選択されたニューラルネットワークはトレーニングされ、その後、パフォーマンスを比較するために一連の実験が行われる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 13:27:01 GMT)
LR-DWM: Efficient Watermarking for Diffusion Language Models [40.7] Diffusion Language Models (DLMs) は、非逐次反復記述によるテキストを生成する。
近年の研究では、DLMを透かし、必要な時に処理を反転させることが提案されているが、計算やメモリのオーバーヘッドがかなり大きい。
本稿では,左隣と右隣の両方に基づいて生成されたトークンをバイアスする左隣拡散透かし(LR-DWM)を導入する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 12:08:51 GMT)
Failure Modes in Multi-Hop QA: The Weakest Link Law and the Recognition Bottleneck [38.4] 本稿では,MFAI(Multi-Focus Attention Instruction)を導入した。
システム2推論を利用して、必要な情報を効果的に見つけ、統合する「思考」モデルを実証する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 17:16:04 GMT)
Incentivizing In-depth Reasoning over Long Contexts with Process Advantage Shaping [38.3] 長文推論には正確な接地と頑健な長距離推論の両方が必要である。
本稿では,KG駆動型フレームワークであるDeepReasonQAを提案する。
提案手法はRLVRのベースラインを大幅に上回り,パラメータをはるかに少なくしてフロンティアのLLMにマッチすることを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 16:10:04 GMT)
Rethinking the Value of Multi-Agent Workflow: A Strong Single Agent Baseline [38.2] 一つのエージェントがKVキャッシュの再利用による効率上の利点を生かして均一性を実現できることを示す。
本稿では,単一エージェントの実行を自動的に調整し,推論コストを削減するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 08:16:09 GMT)
Holos: A Web-Scale LLM-Based Multi-Agent System for the Agentic Web [38.1] 長期間の環境保全のために設計されたWebスケールのLaMASであるHolosを紹介した。
マイクロレベルのコラボレーションとマクロスケールの出現のギャップを埋めることによって、Holos氏は、自己組織的で継続的な進化するAgentic Webの次世代の基盤を築きたいと考えている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 13:09:25 GMT)
MMDeepResearch-Bench: A Benchmark for Multimodal Deep Research Agents [38.0] MMDR-Bench(MMDR-Bench)は、21のドメインにまたがる140の専門的なタスクのベンチマークである。
MMDR-Benchは以前の設定と比較して、明確な証拠を用いたレポートスタイルの合成を強調している。
報告品質のためのF-LLM適応評価(FLAE)、引用的根拠のアライメントのためのTRACE(Trustworthy Retrieval-Aligned Citation Evaluation)、テキスト・視覚的整合性のためのMOSAIC(Multimodal Support-Aligned Integrity Check)を提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:41:33 GMT)
Analyzing the Temporal Factors for Anxiety and Depression Symptoms with the Rashomon Perspective [37.3] 本稿では、不安と抑うつの関係の堅牢な解釈を提供するために、公衆精神保健領域における新たなモデリング視点を提案する。
我々はランダムな森林モデルと部分的依存プロファイルを組み合わせることで、ラショモン集合全体の予測関係の堅牢性と安定性を厳密に評価する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 20:20:38 GMT)
Stochastic Quantum Information Geometry and Speed Limits at the Trajectory Level [35.2] 条件量子漁業情報(CQFI)を導入して量子情報幾何学と熱力学のギャップを埋める
我々は,CQFIが不整合性(集団)と不整合性(基底回転)のコントリビューションを許容することを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 16:23:26 GMT)
Semidefinite Programming for Quantum Channel Learning [35.2] 半定値プログラミング(SDP)は、Choi行列に対する忠実度最適化問題を解くために適用することができる。
我々は、市販のSDP解決器をいくつか試し、それぞれ異なる形態の量子チャネルの再構築を可能にした。
これは、比較的小さなクラウス階の量子チャネルが、実験で観測された古典的なデータを記述するのに十分であることを示している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 17:26:45 GMT)
Improving Large Molecular Language Model via Relation-aware Multimodal Collaboration [34.1] マルチレベル分子モード協調プロジェクタを備えた大規模言語モデルに基づく分子アシスタントCoLLaMoを提案する。
実験により,我々のCoLLaMoはLMLMの分子モダリティ一般化能力を向上することが示された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 04:38:19 GMT)
Histopath-C: Towards Realistic Domain Shifts for Histopathology Vision-Language Adaptation [34.1] Histopath-Cは、デジタル病理学で観察される現実世界の分布変化を模倣するために設計された、リアルな合成汚職を伴う新しいベンチマークである。
我々のフレームワークは、任意の利用可能なデータセットに汚職を動的に適用し、オンザフライでテスト時間適応メカニズムを評価する。
提案手法は,自然画像用に設計された最先端のTTA手法より優れている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 17:06:09 GMT)
LegacyAvatars: Volumetric Face Avatars For Traditional Graphics Pipelines [33.5] 3次元顔アバターの高速な古典的レンダリングのための新しい表現法を提案する。
我々のアプローチは、髪、皮膚、目など複雑な顔の特徴を制御可能なレンダリングを実現する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 06:46:05 GMT)
Learner-Tailored Program Repair: A Solution Generator with Iterative Edit-Driven Retrieval Enhancement [33.0] 本稿では,バグコードに対するバグ記述を提供しながら,プログラムの修復性を高めるフレームワークを提案する。
最初の段階では、ソリューション検索フレームワークを使用して、ソリューション検索データベースを構築する。
第2段階では、コードを修正し、説明を提供するソリューション誘導型プログラム修復手法を提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 15:44:30 GMT)
Facet-Aware Multi-Head Mixture-of-Experts Model with Text-Enhanced Pre-training for Sequential Recommendation [32.1] 逐次レコメンデーション(SR)システムは、インタラクション履歴を活用することで、ユーザの動的嗜好を捉えるのに優れている。
この表現だけでは、アイテムの多面的な性質を捉えるには不十分である、と我々は主張する。
FAME(Facet-Aware Multi-Head Mixture-of-Experts Model for Sequential Recommendation)という新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 08:00:00 GMT)
3AM: 3egment Anything with Geometric Consistency in Videos [32.1] 3AMは、MUSt3Rからの3D認識機能をSAM2に統合するトレーニング時間拡張である。
提案手法では,カメラのポーズや前処理を伴わず,推論時のRGB入力のみを必要とする。
幅広いベースラインモーション(ScanNet++、Replica)を持つ挑戦的なデータセットでは、3AMはSAM2と拡張を大きく上回っている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 08:08:27 GMT)
ToolPRMBench: Evaluating and Advancing Process Reward Models for Tool-using Agents [31.8] 逆誘導探索法はツール使用エージェントの強化に強い可能性を示している。
ツール使用環境におけるPRMの体系的かつ信頼性の高い評価ベンチマークが欠如している。
ツール使用エージェントのPRM評価に特化して設計された大規模ベンチマークであるToolPRMBenchを紹介する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 07:48:36 GMT)
SLAP: Scalable Language-Audio Pretraining with Variable-Duration Audio and Multi-Objective Training [31.2] 本稿では,言語とオーディオの事前学習を1億9900万のオーディオテキストペアに拡張するSLAPについて紹介する。
SLAPは、シングルステージトレーニングにおける自己監督とキャプションの損失を追加して対照的な損失を統一し、よりリッチな高密度オーディオ表現の学習を容易にする。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 21:36:19 GMT)
Adaptive Rotary Steering with Joint Autoregression for Robust Extraction of Closely Moving Speakers in Dynamic Scenarios [28.3] Ambisonicsにおける深部空間フィルタリングの最近の進歩は、静止多話者シナリオにおいて強い性能を示す。
我々は,この回転ステアリングを,目標の初期方向を条件としたインターリーブ付きトラッキングアルゴリズムを用いて自動化することを提案する。
付近の話者や交差する話者にとって、ロバストな追跡は難しくなり、空間的手がかりは強化にはあまり効果がない。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:38:49 GMT)
Bone-conduction Guided Multimodal Speech Enhancement with Conditional Diffusion Models [28.1] 単一チャンネル音声強調モデルでは雑音環境下での顕著な性能劣化に直面している。
本稿では,骨伝導センサと空気伝導マイクロホンを統合した新しいマルチモーダル音声強調フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:17:22 GMT)
ReWorld: Multi-Dimensional Reward Modeling for Embodied World Models [27.7] ReWorldは、強化学習を活用して、物理リアリズム、タスク完了能力、実施可能性、視覚的品質をビデオベースで具現化した世界モデルと整合させることを目的としたフレームワークである。
本研究では,ReWorldが生成したロールアウトの物理的忠実度,論理的コヒーレンス,具体化,視覚的品質を著しく改善し,従来の方法よりも優れていたことを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:27:10 GMT)
Breaking Coordinate Overfitting: Geometry-Aware WiFi Sensing for Cross-Layout 3D Pose Estimation [26.6] 本稿では、WiFiベースのクロスドメインポーズ推定のための最初の幾何条件付きフレームワークPerceptAlignを紹介する。
PerceptAlignは、最先端のベースラインと比較して、ドメイン内エラーを12.3%削減し、ドメイン間エラーを60%以上削減する。
これらの結果は、スケーラブルで実用的なWiFiセンシングへの有効な経路として、幾何学条件学習を確立している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 04:13:09 GMT)
Beyond Softmax and Entropy: Improving Convergence Guarantees of Policy Gradients by f-SoftArgmax Parameterization with Coupled Regularization [26.4] 政策勾配法は政策パラメータ化の選択に非常に敏感である。
一般化されたf-softargmaxに基づいて,ソフトマックスを代替的なポリシーパラメータ化に置き換えることを提案する。
我々は、いかなる形態のプレコンディショニングも必要とせず、有限 MDP に対する最初の明示的な非漸近的最終点収束保証を確立する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 22:25:03 GMT)
Plan, Verify and Fill: A Structured Parallel Decoding Approach for Diffusion Language Models [26.2] Plan-Verify-Fill(PVF)は、定量的検証を通じて計画を立てるトレーニングフリーのパラダイムである。
PVFは、高平均セマンティックアンカーを優先順位付けすることで、階層的な骨格を積極的に構築する。
信頼性ベースの並列デコーディングと比較して、NFE(Number of Evaluation Function)を最大65%削減する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 03:53:01 GMT)
Cross-reality Location Privacy Protection in 6G-enabled Vehicular Metaverses: An LLM-enhanced Hybrid Generative Diffusion Model-based Approach [25.9] 6G対応の車載メタバースは、空対地統合ネットワークを通じて、自律走行車が物理的および仮想空間を横断する動作を可能にする。
AVが実際にLBSを要求するときに報告された位置と、対応するAIエージェントが仮想にデプロイされているエッジサーバの位置を関連付けることで、敵がAVトラジェクトリを推測できるため、現実的な位置プライバシーリスクを引き起こす可能性がある。
本稿では、現実の連続的な位置摂動や、仮想性における個別のプライバシーを意識したAIエージェントのマイグレーションを含む、ハイブリッドアクションに基づく、リアルタイムな位置プライバシ保護フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 08:40:38 GMT)
Efficient Privacy-Preserving Retrieval Augmented Generation with Distance-Preserving Encryption [25.9] RAGは高い計算コストを伴わずにLLMの応答品質を向上させる重要な技術として登場した。
従来のアーキテクチャでは、RAGサービスは、信頼できるローカル環境内でデータセットをホストする単一のエンティティによって提供される。
信頼できないサードパーティサービスへの依存は、プライバシーのリスクをもたらす。
信頼できないクラウド環境に適した効率的なプライバシ保護RAGフレームワーク(ppRAG)を提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 09:29:50 GMT)
Guided by the Plan: Enhancing Faithful Autoregressive Text-to-Audio Generation with Guided Decoding [25.8] Plan-Criticは、aGAEにインスパイアされた目標で訓練された軽量補助モデルであり、一部世代から最終的な命令追従品質を予測する。
Plan-Criticは、ARベースラインよりも10ポイント改善されたCLAPスコアを実現している。
この研究は、因果生成とグローバルセマンティックアライメントのギャップを埋め、厳密な自己回帰モデルさえも前方に計画できることを実証する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 07:26:23 GMT)
BenchSeg: A Large-Scale Dataset and Benchmark for Multi-View Food Video Segmentation [25.8] 我々は、新しいマルチビューフードビデオセグメンテーションデータセットとベンチマークであるBenchSegを紹介する。
BenchSegは55の料理シーンを25,284の微妙な注釈付きフレームで集約し、各料理を360度カメラで撮影する。
既存のFoodSeg103データセット上で20種類の最先端セグメンテーションモデルを評価し,BenchSeg上で評価する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:08:11 GMT)
TimeGMM: Single-Pass Probabilistic Forecasting via Adaptive Gaussian Mixture Models with Reversible Normalization [23.7] TimeGMMは、単一のフォワードパスで複雑な将来の分布をキャプチャする新しいフレームワークである。
最先端の手法を一貫して上回り、CRPSでは22.48%、NMAEでは21.23%の最大改善を実現している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 07:02:13 GMT)
Do MLLMs See What We See? Analyzing Visualization Literacy Barriers in AI Systems [23.3] MLLM(Multimodal Large Language Models)における可視化リテラシーの障壁の体系的解析について述べる。
我々は、人間の可視化リテラシー研究に適応したバリア中心の戦略で、4つの最先端モデルから309の誤った応答をオープンコードした。
結果は、モデルは単純なチャートではうまく機能するが、色集約的なセグメントベースの視覚化に苦慮していることを示している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 21:08:23 GMT)
Ordered Local Momentum for Asynchronous Distributed Learning under Arbitrary Delays [22.7] 非同期分散学習のための新しい手法OrLoMoを提案する。
OrLoMoでは、各ワーカーがMSGDをローカルに実行します。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 09:05:39 GMT)
How Safe Is Your Data in Connected and Autonomous Cars: A Consumer Advantage or a Privacy Nightmare ? [21.5] 車両間通信(V2X)により、自動運転車は現実世界のエンティティと大量のデータを生成および交換することができる。
本稿では、CAVにおけるデータ共有の多面的性質を考察し、そのイノベーションと関連する脆弱性に対する貢献を分析した。
堅牢なポリシーと倫理的なデータ管理プラクティスに対する緊急の要求を強調します。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 06:45:21 GMT)
Docs2Synth: A Synthetic Data Trained Retriever Framework for Scanned Visually Rich Documents Understanding [21.4] 我々は、プライベートおよびローリソースドメインの検索誘導推論を可能にする合成スーパービジョンフレームワークであるDocs2 Synthを紹介する。
Docs2 Synthは、生文書コレクションを自動的に処理し、エージェントベースのシステムを介して多様なQAペアを生成し検証し、軽量なビジュアルレトリバーを訓練して、ドメイン関連エビデンスを抽出する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 04:45:09 GMT)
Proc3D: Procedural 3D Generation and Parametric Editing of 3D Shapes with Large Language Models [21.3] Proc3Dは、リアルタイムな修正を可能にしながら編集可能な3Dモデルを生成するように設計されたシステムである。
Proc3Dは3Dモデルのグラフ表現である手続きコンパクトグラフ(PCG)を導入している。
In-context Learning (ICL) を用いた GPT-4o と微調整 LLAMA-3 モデルを用いて, Proc3D の機能を示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 03:08:08 GMT)
Less is More: Label-Guided Summarization of Procedural and Instructional Videos [21.1] 本稿では,3段階のフレームワークであるPRISMを提案する。
大規模言語モデル(LLM)を用いた適応型ビジュアルサンプリング、ラベル駆動アンカー、文脈検証について分析する。
提案手法はプロシージャとドメイン固有のビデオタスクにまたがって一般化し,セマンティックアライメントと精度の両面で高い性能を実現する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 03:41:48 GMT)
FairGE: Fairness-Aware Graph Encoding in Incomplete Social Networks [21.1] FairGE (Fair Graph) は、不完全なソーシャルネットワークにおけるGTのためのフェアネス対応フレームワークである。
これはスペクトルグラフ理論を通じて直接公正性を符号化する。
これは、最先端のベースラインと比較して、統計的平等と機会の平等の両方において少なくとも16%改善されている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:11:42 GMT)
Concepts from Representations: Post-hoc Concept Bottleneck Models via Sparse Decomposition of Visual Representations [20.9] 本稿では,PCBM-ReDについて述べる。PCBM-ReDは,事前学習した不透明なモデルに解釈性を再現する新しいパイプラインである。
最先端の精度を実現し、エンドツーエンドモデルのパフォーマンスギャップを狭め、より優れた解釈性を示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 08:01:44 GMT)
Bridging Semantic Understanding and Popularity Bias with LLMs [20.6] 本稿では,Large Language Model (RecLLM) を用いたレコメンデーションにより,人気バイアスの意味的理解のギャップを埋める新しいフレームワークを提案する。
FairLRMは人気バイアスをアイテムサイドとユーザサイドのコンポーネントに分解する。
FairLRMはフェアネスとレコメンデーションの精度を大きく向上させる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:01:59 GMT)
SkeFi: Cross-Modal Knowledge Transfer for Wireless Skeleton-Based Action Recognition [20.0] 既存のソリューションでは、RGBカメラを使用して骨格キーポイントをアノテートするが、そのパフォーマンスは暗い環境で低下し、プライバシーの懸念が高まる。
本稿では,これらの課題を軽減するために,非侵襲型無線センサ,すなわちLiDARとmmWaveについて検討する。
実験により、SkeFi は mmWave および LiDAR 上での最先端の性能を実現することが示された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:39:02 GMT)
Deep Lightweight Unrolled Network for High Dynamic Range Modulo Imaging [19.5] Modulo-Imaging (MI)は、強度レベルに達すると信号強度をリセットすることでダイナミックなダイナミックレンジ画像を拡張するための有望な代替手段を提供する。
自己調整を容易にするScaling Equi項を導入し、モデルが元の分布外の新しい画像に適応できるようにする。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:22:38 GMT)
IC3-Evolve: Proof-/Witness-Gated Offline LLM-Driven Heuristic Evolution for IC3 Hardware Model Checking [18.9] IC3-Evolveはオフラインのコード進化フレームワークで、IC3の実装に小さな、スロット制限付き、監査可能なパッチを提案する。
すべての候補パッチは、証明/ビヘイビアゲートによる検証によってのみ承認される。
我々は、HWMCCベンチマークで進化し、未確認の公開および産業モデル検査ベンチマークにおける一般化可能性を評価する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 12:37:27 GMT)
"What If My Face Gets Scanned Without Consent": Understanding Older Adults' Experiences with Biometric Payment [18.8] バイオメトリック・ペイメント(バイオメトリック・ペイメント)、すなわち、デジタル・ペイメント・システムで実装されたバイオメトリック・認証は、記憶の需要を減らし、高齢者の支払いを合理化することができる。
ユーザと非ユーザの両方を含む22人の中国人高齢者を対象に半構造化インタビューを行った。
参加者は、利便性とセキュリティの認識から生体認証を利用する動機があった。
彼らはまた、パスワードのない性質による制御の喪失を心配し、生体データセキュリティへの懸念を表明した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 07:59:11 GMT)
DeepRAHT: Learning Predictive RAHT for Point Cloud Attribute Compression [18.4] 地域適応階層変換(Regional Adaptive Hierarchical Transform、RAHT)は、有効点クラウド属性圧縮(PCAC)方式である。
本稿では,DeepRAHTと呼ばれるスパーステンソルをベースとしたPCACのエンドツーエンドRAHTフレームワークを提案する。
実験により、DeepRAHTはベースライン法よりも高性能で高速で堅牢な解であることが示された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 04:33:45 GMT)
One-Sided Matrix Completion from Ultra-Sparse Samples [18.3] 観測周波数で第2モーメントの各非ゼロエントリを正規化する非バイアス推定器を提案する。
推定器は任意の$p$に対して偏りがなく、分散が低いことを示す。
合成データと実世界のデータの両方の実験は、我々のアプローチを検証する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 01:33:48 GMT)
LIBERTy: A Causal Framework for Benchmarking Concept-Based Explanations of LLMs with Structural Counterfactuals [18.0] 概念に基づく説明は、高レベルの概念がモデル行動にどのように影響するかを定量化する。
既存のベンチマークは、不完全なプロキシとして機能する費用のかかる人手による対策に依存しています。
本稿では,構造上の逆ファクトペアを含むデータセットを構築するためのフレームワーク,LIBERTyを紹介する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 06:28:47 GMT)
FairGU: Fairness-aware Graph Unlearning in Social Networks [17.1] フェアネスを意識したグラフアンラーニングフレームワークであるFairGUを紹介する。
FairGUは、有効データ保護戦略を備えた専用のフェアネス対応モジュールを統合している。
FairGUは、最先端のグラフアンラーニング手法よりも一貫して優れていることを実証する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:03:48 GMT)
Deep Feature Deformation Weights [16.9] 従来のフレームワークの正確な制御と速度で,データのセマンティクスを融合させる手法を提案する。
我々のアプローチは驚くほど単純だが効果的であり、深い特徴近接は滑らかで意味的な変形重みを生み出す。
コンシューマグレードマシン上で,最大100万顔までのメッシュの変形をリアルタイムに生成できる概念実証アプリケーションを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:23:03 GMT)
Linear Mechanisms for Spatiotemporal Reasoning in Vision Language Models [16.7] 視覚言語モデル(VLM)のある時点で空間構造の視覚的・幾何学的・テキスト的表現を組み合わせなければならない
本稿では,VLMがオブジェクト位置をテキストのアクティベーションに線形に結合し,言語トークンによる推論を行うことにより,オブジェクト位置を符号化することを示す。
解析をビデオVLMに拡張し、類似の線形時間ID機構を同定する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 23:48:38 GMT)
Cooperative Multi-agent RL with Communication Constraints [16.7] 通信が限られている場合、エージェントはポリシーを更新するために時代遅れの情報を頼らなければならない。
欠落したデータを扱うための一般的なアプローチは、重要サンプリングと呼ばれ、ベースポリシーからの古いデータを振り返り、現在のポリシーの勾配を見積もる。
本稿では,政策の更新を予測し,一連の基本方針のサンプルを収集するために,古い勾配を用いた基本方針予測手法を提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:05:23 GMT)
STAGE: A Benchmark for Knowledge Graph Construction, Question Answering, and In-Script Role-Playing over Movie Screenplays [16.1] 本稿では,フル長の映画画面上での物語理解のためのベンチマークであるSTAGE(Screenplay Text, Agents, Graphs and Evaluation)を紹介する。
STAGEは、ナレッジグラフの構成、シーンレベルのイベント要約、長文のスクリーンプレイ質問応答、インスクリプトのキャラクターロールプレイングの4つのタスクを、すべて共有された物語の世界表現に基づいて定義している。
このベンチマークは、クリーン化されたスクリプト、キュレートされた知識グラフ、および英語と中国語の150本の映画に対するイベント中心および文字中心のアノテーションを提供し、世界表現の構築、物語の抽象化と検証、長い物語の推論、そして生成を可能にする。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:40:32 GMT)
Are LLMs Smarter Than Chimpanzees? An Evaluation on Perspective Taking and Knowledge State Estimation [16.0] 我々の最も近い動物であるチンパンジーは、その能力に欠けています。
LLMがストーリーキャラクタが、その行動を通じて、保持すべきでない知識をいつ検出できるかをテストするための2つのタスクを設計する。
その結果,現在のLLMは両タスクにおいてほぼランダムな性能を示し,人間にはかなり劣っていることがわかった。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 13:53:24 GMT)
ParaMETA: Towards Learning Disentangled Paralinguistic Speaking Styles Representations from Speech [16.0] ParaMETAは、発話スタイルを直接学習し、制御するためのフレームワークである。
音声を各スタイルの専用部分空間に投影することで、アンタングル付きタスク固有の埋め込みを学習する。
音声とテキストベースのプロンプトをサポートしており、ユーザーは他を保存しながら、ある話し方を変更することができる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 07:05:40 GMT)
Harmonizing the Arabic Audio Space with Data Scheduling [15.8] 本稿では、アラビア語中心のLLMのためのマルチタスク・インストラクション・チューニングに関する最初の体系的研究について述べる。
我々はQwen2.5-Omni (7B) を微調整し、Aligner-Based Diverse Smpling (ADS) とともにタスクプログレッシブカリキュラム (TPC) を提案する。
ADSは初期収束を加速するが、その固有の勾配のボラティリティは、長期の訓練で生成的復号を不安定にすることができる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 17:08:31 GMT)
DDSA: Dual-Domain Strategic Attack for Spatial-Temporal Efficiency in Adversarial Robustness Testing [15.6] 現在の対向ロバスト性試験法は、フレーム単位の徹底的な処理とフルイメージの摂動を必要とする。
本稿では,時間的選択性と空間的精度の検証を最適化する資源効率の高い対向ロバスト性試験フレームワークを提案する。
我々の二重ドメインアプローチは、攻撃効率を維持しながら、時間空間資源の大幅な保全を実現する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 03:14:22 GMT)
UAVGENT: A Language-Guided Distributed Control Framework [15.5] 進化的かつ高レベルなミッションを実行するマルチドローンシステムの言語-in-the-loop制御について検討する。
i)人間の操作者が自然言語命令を発行し、(ii)LLMベースの監督者が定期的に命令されたタスクを解釈し、検証し、修正し、(iii)分散インナーループコントローラが結果の参照を追跡する3層アーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:48:57 GMT)
De-Anonymization at Scale via Tournament-Style Attribution [15.5] De-Anonymization at Scale (DAS) は、数万の候補テキストに著者を帰属させる大規模な言語モデルに基づく手法である。
DASは、匿名プラットフォームに対して現実的なプライバシーリスクを示すために、数万のプールから、偶然よりもはるかに高い精度で、同じ著者のテキストを復元することができる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 13:49:43 GMT)
Discovering 100+ Compiler Defects in 72 Hours via LLM-Driven Semantic Logic Recomposition [15.3] プログラム生成に機能を組み合わせたコンパイラファズーであるFeatureFuzzを提案する。
24時間にわたるキャンペーンで、FeatureFuzzは167のユニークなクラッシュを発見し、これは第2位のファザーより2.78倍高い。
72時間のファジィキャンペーンを通じて、FeatureFuzzはGCCとLLVMの106のバグを特定した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:33:45 GMT)
System-Mediated Attention Imbalances Make Vision-Language Models Say Yes [15.2] 視覚言語モデル(VLM)の幻覚は、一般に、入力モダリティ(システム、画像、テキスト)間での注意の非バランスな割り当てと結びついている。
本研究では,これらの不均衡を機能的に冗長なシステム重みに起因した,より包括的でシステム経由の会計評価を行う。
画像およびテキスト入力に対するシステムモダリティからの注意を因果的に再分配することは、このバイアスを著しく抑制し、しばしば既存のアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:34:39 GMT)
Federated Joint Learning for Domain and Class Generalization [15.2] textbfFedDCGは、フェデレートされた学習環境におけるクラスとドメインの一般化に対処する新しいアプローチである。
textbfFedDCGは、精度と堅牢性の点で最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 04:24:11 GMT)
Multi-Sensor Matching with HyperNetworks [14.9] ハイパーネットワークを活用し、マルチモーダルパッチマッチングを改善します。
本稿では,Siamese CNNを拡張した軽量な記述型学習アーキテクチャを提案する。
また、500Kペアのクロスプラットフォーム(地上/空中)VIS-IRパッチデータセットであるGAP-VIRをリリースしています。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 09:19:33 GMT)
Experiencer, Helper, or Observer: Online Fraud Intervention for Older Adults Through Role-based Simulation [14.8] ROLESafeは、高齢者が異なる学習役割を通して学ぶ、反詐欺的な教育介入である。
中国における144人の高齢者を対象に行った調査では、経験者とヘルパーの役割がオンライン詐欺を識別する能力を大幅に向上させた。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 09:15:51 GMT)
Agentic Artificial Intelligence (AI): Architectures, Taxonomies, and Evaluation of Large Language Model Agents [14.4] エージェントを知覚,脳,計画,行動,ツール利用,コラボレーションに分割する統合分類法を提案する。
また、デジタルオペレーティングシステム、エンボディロボット、その他の特殊なドメインを含む、これらのエージェントが動作する環境もグループ化します。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:51:16 GMT)
Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition [13.5] 高雑音の音声入力は、特徴融合プロセスに有害な干渉をもたらす傾向がある。
本稿では、音声強調と組み合わさった、エンドツーエンドノイズローバストAVSRフレームワークを提案する。
本手法は,頑健な音声認識性能を実現するために,音声の意味的整合性を保っている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:46:08 GMT)
Wavelet-Driven Masked Multiscale Reconstruction for PPG Foundation Models [13.3] Masked Multiscale Reconstruction (MMR)は、PSGデータの階層的時間周波数スケールから明確に学習する自己教師付き事前学習フレームワークである。
32,000人のユーザから1700万のラベルのない10秒PSGセグメントを使用して、MMRでモデルを事前訓練する。
19の多様な健康関連タスクのうち、MMRは大規模ウェアラブルPSGデータを改善し、最先端のオープンソースPSGモデルに適合させる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 01:34:47 GMT)
From Shallow Waters to Mariana Trench: A Survey of Bio-inspired Underwater Soft Robots [13.0] 水中ロボットは極端な水圧に悩まされ、しばしば水中の生態系に騒音や損傷を引き起こす。
バイオインスパイアされたソフトロボットは、これらの課題に対処するために水生生物からインスピレーションを得ている。
生物にインスパイアされたソフトロボットは、海洋探査の有望な分野として登場した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:10:19 GMT)
A Mixture of Experts Vision Transformer for High-Fidelity Surface Code Decoding [13.0] トポロジカル・スタビライザーの符号は、その幾何学的局所性と実践的関連性から特に魅力的である。
本稿では,量子ビジョン変換器を用いたデコーダQuantumSMoEを提案する。
トーリックコードの実験は、QuantumSMoEが最先端の機械学習デコーダより優れていることを示した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 16:49:59 GMT)
OpenNavMap: Structure-Free Topometric Mapping via Large-Scale Collaborative Localization [12.7] OpenNavMapは、オンデマンドの再構築に3D幾何学的基礎モデルを活用する軽量で構造のないトポロジカルシステムである。
提案手法は,動的プログラミングに基づくシーケンスマッチング,幾何検証,信頼性校正最適化を,頑健で粗いサブマップアライメントに統一する。
Map-Freeベンチマークの評価は、平均翻訳誤差0.62mを達成し、構造移動ベースラインと回帰ベースラインよりも優れた精度を示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 07:24:46 GMT)
PsychēChat: An Empathic Framework Focused on Emotion Shift Tracking and Safety Risk Analysis in Psychological Counseling [12.3] 本稿では,心理的カウンセリングのための感情変化追跡と安全リスク分析を明示的に統合したサイコチャットを提案する。
具体的には、対話型ロールプレイングを用いてカウンセラー対話を合成し、感情管理モジュールとリスクコントロールモジュールの2つのモジュールを統合する。
Agent Modeは、感情管理、リスクコントロール、カウンセラー応答を協調的なマルチエージェントパイプラインに構成する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 13:06:13 GMT)
Learning Diverse Skills for Behavior Models with Mixture of Experts [12.1] Di-BMと呼ばれるMixture of Expertsを用いて,行動モデルの多様なスキルを学ぶことを提案する。
我々のアプローチはプラグアンドプレイであり、標準的な模倣学習手法にシームレスに統合できる。
複数の実世界のロボット操作タスクの実験は、Di-BMが最先端のベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 13:14:32 GMT)
Creating Disability Story Videos with Generative AI: Motivation, Expression, and Sharing [11.7] Generative AI(GenAI)は、障害者(PwD)が障害に関するストーリーを作成するのを支援することを約束している。
GenAIは、メディア生産の障壁を減らし、PwDの創造性を刺激するが、また、個人の表現に採用を妨げるバイアスや欠陥をもたらす可能性がある。
本研究では、障害者擁護団体の9人のPwDが、GenAIを用いて障害者体験を共有するビデオを作成する方法について検討した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 23:18:34 GMT)
Learning Longitudinal Health Representations from EHR and Wearable Data [11.6] 本稿では,電子健康記録とウェアラブルデータを連続的な時間潜在プロセスとして共同で表現する多モーダル基礎モデルを提案する。
生理学的およびリスクモデリングのタスクを予測することで、モデルは強力な電子健康記録とウェアラブルのみのベースラインを上回っます。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 02:39:18 GMT)
An Efficient and Multi-Modal Navigation System with One-Step World Model [11.6] 現在のナビゲーションワールドモデルは、多段階拡散プロセスと自動回帰フレーム・バイ・フレーム生成に依存している。
本稿では,効率的な空間的注意力を備えたワンステップ生成パラダイムと3次元U-Netバックボーンを提案する。
この設計は、推論遅延を大幅に低減し、予測性能を向上しつつ、高周波制御を可能にする。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 06:29:56 GMT)
Explanova: Automatically Discover Data Insights in N \times M Table via XAI Combined LLM Workflow [11.6] DeepAnalyze、DataSage、Datawiseはすべて、自動きめ細かい分析のための強力なエージェントフレームワークです。
私たちのExplanovaは、ローカルな小さなLSMのため、そのような試みです。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 09:00:03 GMT)
Language-Based Swarm Perception: Decentralized Person Re-Identification via Natural Language Descriptions [11.5] 本稿では,自然言語を主表現モダリティとして活用するロボット群における分散型人物再識別手法を提案する。
各ロボットは視覚言語モデル(VLM)を用いて個人を局所的に検出し記述する
これらの記述は、一元的に調整することなく、群をまたいで比較され、クラスタ化され、ロボットは同一個体の観察を協調的にグループ化することができる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 16:43:27 GMT)
Turbo-GoDec: Exploiting the Cluster Sparsity Prior for Hyperspectral Anomaly Detection [11.0] 我々はTurbo-GoDecと呼ばれる新しいハイパースペクトル異常検出法を提案する。
本稿では, 異常画素が空間内の小さなクラスター群として現れることがあり, 異常画素のクラスタ・スパシティー(クラスタ・スパシティ)と呼ぶ。
提案したTurbo-GoDec法の小型異常検出における優れた性能を示す3つの実超スペクトル画像(HSI)データセットを用いて実験を行った。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 09:49:58 GMT)
LB-MCTS: Synergizing Large Language Models and Bayesian Optimization for Efficient CASH [10.8] モンテカルロ木探索構造における大規模言語モデル(LLM)とBOの相乗化フレームワークであるLB-MCTSを提案する。
STM(Selective Tuning Memory)と明示的な探索-探索トレードオフによる推論を最大化する。
104のAMLBデータセットに対する実験は、LB-MCTSが競合ベースラインよりも優れていることを示した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:26:31 GMT)
Towards Robust Universal Perturbation Attacks: A Float-Coded, Penalty-Driven Evolutionary Approach [10.2] UAP(Universal Adversarial noise perturbations)は、ディープニューラルネットワークを弱体化させる能力によって、大きな注目を集めている。
このような摂動を生成するための単一目的駆動型フレームワークを導入する。
筆者らのフレームワークは, 従来手法に比べて, サイズが小さく, 誤分類効率が高く, 高速な摂動を常に生成している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 23:31:12 GMT)
Wavelet-Aware Anomaly Detection in Multi-Channel User Logs via Deviation Modulation and Resolution-Adaptive Attention [10.2] 内部脅威検出は企業セキュリティにおける重要な課題である。
本稿では,ウェーブレット対応変調,多分解能ウェーブレット分解,分解能適応型アテンションを統合した新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 02:49:48 GMT)
Construct, Align, and Reason: Large Ontology Models for Enterprise Knowledge Management [9.9] 従来の知識グラフは暗黙の関係発見に苦慮し、複雑な質問に対する十分な意味理解が欠けている。
我々は,大規模オントロジーモデル (LOM) である統合構成-アライン-レアソンフレームワークを導入する。
構造理解を改善するため,オントロジー命令の微調整,ノードセマンティックエンコーディングを強化するためにテキストオントロジーを基礎とする,カリキュラム学習によるオントロジー言語対をマルチタスクでチューニングし,セマンティック推論を強化する,という3段階の訓練パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 05:30:03 GMT)
R-VoxelMap: Accurate Voxel Mapping with Recursive Plane Fitting for Online LiDAR Odometry [9.7] R-ボクセルマップ(R-VoxelMap)は、幾何駆動平面フィッティング戦略を用いて正確なボクセルマップを構築する新しいボクセルマッピング手法である。
提案手法は他の最先端手法よりも高い精度を達成し,効率とメモリ使用量に匹敵する精度を実現している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 12:11:22 GMT)
CoReflect: Conversational Evaluation via Co-Evolutionary Simulation and Reflective Rubric Refinement [9.6] 本稿では,対話シミュレーションと評価を適応的反復プロセスに統合するCoReflectを紹介する。
会話プランナーは、多様なゴール指向対話を通じてユーザシミュレータをガイドする構造化テンプレートを生成する。
反射分析器はこれらの対話を処理して、系統的な行動パターンを特定し、自動的に評価を洗練させる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 00:56:06 GMT)
Soft Shadow Diffusion (SSD): Physics-inspired Learning for 3D Computational Periscopy [9.6] 非視線イメージング(NLOS)は間接的な測定から隠れたシーンを再構成する。
ここでは,通常のNLOS画像から隠れたシーンの3次元再構成を実演する。
我々は、勾配に基づく最適化法と、ソフトシャドウ拡散と呼ばれる物理に着想を得たニューラルネットワークアプローチの2つのソリューションを開発した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 04:40:00 GMT)
HCFT: Hierarchical Convolutional Fusion Transformer for EEG Decoding [9.6] 階層型脳核融合変換器(HCFT)という軽量な復号化フレームワークを提案する。
HCFTはマルチスケール表現のためにデュアルブランチエンコーダと階層トランスフォーマーブロックを組み合わせる。
その結果、HCFTは平均精度80.83%、BCI IV-2bではコーエンのカッパが0.6165であり、感度99.10%、時間当たり0.0236の偽陽性、CHB-MITでは98.82%であることがわかった。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 06:36:30 GMT)
Multimodal Generative Engine Optimization: Rank Manipulation for Vision-Language Model Rankers [9.5] 視覚言語モデル(VLM)は、現代の検索とレコメンデーションシステムにおいて、ユニモーダルエンコーダを急速に置き換えている。
本稿では、悪意あるアクターがターゲット商品を不当に宣伝することを可能にする、新たな敵対的枠組みを提案する。
最先端モデルを用いた実世界のデータセット実験により、コーディネート攻撃はテキストのみと画像のみのベースラインを著しく上回ることを示した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 04:58:28 GMT)
Utilizing the Score of Data Distribution for Hyperspectral Anomaly Detection [9.4] 我々は新しい高スペクトル異常検出法(ScoreAD)を提案する。
本手法は、まず、高スペクトル画像からスペクトル全体の生成モデル(SGM)を訓練する。
4つの超スペクトルデータセットの実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 12:14:48 GMT)
Large Language Model for OWL Proofs [9.4] 大規模言語モデル(LLM)は推論タスクなどの推論タスクを実行できる。
本研究は,複雑な知識に対する可読な推論を表現するために広く採用されている,建設の文脈における証明生成について考察する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:57:57 GMT)
Legal experts disagree with rationale extraction techniques for explaining ECtHR case outcome classification [9.3] 解釈可能性(interpretability)は、法律分野における大規模言語モデルの応用に不可欠である。
本稿では,モデルに依存しない解釈可能性手法の比較分析フレームワークを提案する。
モデルが違反を予測する「理由」は,法の専門家とは大きく異なることを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:03:17 GMT)
NADIR: Differential Attention Flow for Non-Autoregressive Transliteration in Indic Languages [9.2] 非自己回帰(NAR)モデルは速度を提供するが、幻覚や長さの制御に悩まされる。
スピードと精度のバランスをとるために設計された新しいNARアーキテクチャであるNADIRを紹介する。
NADIRは最先端のARベースラインに比べて13倍以上のスピードアップを実現している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 12:56:47 GMT)
Distributed Perceptron under Bounded Staleness, Partial Participation, and Noisy Communication [9.0] クライアントはローカルなパーセプトロン更新を実行し、サーバは各通信ラウンドにやってくる更新を集約してグローバルモデルを形成する。
本研究では, 有限の誤差予算が, 軽度な新参加条件下での明示的な有限ラウンド安定化をもたらすことを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:35:19 GMT)
A Theory of Diversity for Random Matrices with Applications to In-Context Learning of Schrödinger Equations [9.0] 集合 $mathbfA(1), dots, mathbfA(N)$ が与えられたとき、$mathbfA(1), dots, mathbfA(N)$ が自明である確率は?
ランダムポテンシャルを持つ線型シュルディンガー作用素の離散化から生じるランダム行列の数族に対して、サンプルサイズ$N$と次元$d$の点で、この確率の低い境界を与える。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 21:12:54 GMT)
DepthCropSeg++: Scaling a Crop Segmentation Foundation Model With Depth-Labeled Data [8.9] DepthCropSeg++は作物のセグメンテーションの基礎モデルであり、オープンフィールド環境下で異なる作物種をセグメンテーションすることができる。
最先端のセマンティックセグメンテーションアーキテクチャであるViT-Adapterアーキテクチャを構築し、動的 UpAdapterアーキテクチャで拡張し、2段階の自己学習パイプラインでモデルをトレーニングする。
結果は、DepthCropSeg++が包括的なテストセットで93.11%のmoUを達成したことを示している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:51:09 GMT)
FlowIID: Single-Step Intrinsic Image Decomposition via Latent Flow Matching [8.8] 固有画像分解(IID)は、画像をアルベドとシェーディングコンポーネントに分離する。
既存のIDモデルは良い結果を得るが、多くのパラメータを使用することが多い。
本稿では,フローマッチングに基づくフローマッチング手法であるFlowIIDを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 09:29:13 GMT)
Large-scale EM Benchmark for Multi-Organelle Instance Segmentation in the Wild [8.7] 本研究では, 多様なセルタイプにまたがる10万以上の2次元EM画像と, 実世界の変動を捉えた5つのオルガネラクラスからなる, マルチオルガネラインスタンスセグメンテーションのベンチマークを開発する。
現在のモデルでは、異種EMデータの一般化に苦慮し、グローバルな分散形態を持つオルガネラでは性能が悪くなっている。
これらの知見は,局所文脈モデルと実世界の変動性の存在下での長距離構造的連続性をモデル化する課題との根本的なミスマッチを浮き彫りにした。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 16:09:27 GMT)
Auditing Meta and TikTok Research API Data Access under Article 40(12) of the Digital Services Act [8.3] 本稿では、プラットフォームリサーチAPIから得られたデータと、同一プラットフォームのユーザ可視公開情報環境(PIE)に関するデータを比較することで、研究アクセスモダリティの体系的な監査を行う。
本研究は,3種類のプラットフォームを具体化する機構,スコープ狭化,メタデータのストリッピング,運用上の制約による系統的なデータ損失を示す。
デジタルサービス法(DSA)に基づくシステムリスクの有意義かつ独立した監査を支援するには,MetaおよびTikTok Research APIの現在の形態は不十分である,と我々は結論付けている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 12:59:11 GMT)
Class-Partitioned VQ-VAE and Latent Flow Matching for Point Cloud Scene Generation [8.3] 分級ベクトル量子化変分オートエンコーダ(CPVQ-VAE)
本稿では,物体の潜伏する特徴を効果的に復号するために訓練されたCPVQ-VAE(Class-Partitioned Vector Quantized Variational Autoencoder)を提案する。
提案手法は,ChamferとPoint2Meshのエラーを最大70.4%,72.3%削減して,可塑性点雲のシーンを確実に復元する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 13:05:35 GMT)
Capability-Aware Early-Stage Research Idea Evaluation [8.2] 本稿では,著者情報と研究思想のみを用いて,論文の受容と評価を予測する能力認識フレームワークを提案する。
提案手法では,3方向トランスフォーマーアーキテクチャによる著者情報,(推測)能力提示,研究アイデアを統合した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 16:22:17 GMT)
Persistent Sheaf Laplacian Analysis of Protein Stability and Solubility Changes upon Mutation [8.1] SheafLapNetは、TDL(Topological Deep Learning)とPSL(Persistent Sheaf Laplacian)の数学的理論に基づく統合予測フレームワークである。
SheafLapNetは、進化したタンパク質トランスフォーマー特徴と補助的な物理的記述子と、せん断理論的不変性を相乗し、多スケールで機械的な方法で内在的な分子相互作用を捉える。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 01:45:12 GMT)
Knowing When to Abstain: Medical LLMs Under Clinical Uncertainty [8.0] MedAbstainは,医療用多票質問応答における禁忌のための統一ベンチマークおよび評価プロトコルである。
最先端で高精度なモデルでさえ、不確実性に欠けることがよくあります。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 16:19:29 GMT)
MARO: Learning Stronger Reasoning from Social Interaction [7.8] マルチエージェント・リワード最適化(Multi-Agent Reward Optimization、MARO)は、大規模言語モデルがより強力な推論能力を得ることを可能にする手法である。
実験の結果,MAROは社会的推論能力を大幅に向上することが示された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 09:10:08 GMT)
Adversarial Defense in Vision-Language Models: An Overview [7.7] VLM(Vision Language Models)の普及により、高度な敵攻撃に対する脆弱性に対する懸念が高まっている。
この課題に対処するために、トレーニング時防衛、テスト時適応防衛、トレーニング自由防衛の3つの主要な防衛パラダイムが提案されている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:57:51 GMT)
Benchmarking Concept-Spilling Across Languages in LLMs [7.6] 大規模言語モデル(LLM)は言語間の優れた能力を示すが、他の言語からの表現に対する体系的なバイアスを示すことが多い。
本稿では,言語間の多文語をモデルがどう扱うかを測定することで,多言語意味的ロバスト性を評価するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:28:26 GMT)
Assessing the livability within the 15-minute city concept based on mobile phone data [7.5] 本研究では、ヘルシンキ大都市圏(フィンランド)の携帯電話データを用いて、一般的に使用されている可視性指標が観察された人間の活動パターンを予測するかどうかを評価する。
分析の結果,歩行性指数は,運動パターンと相関し,純粋な魅力の観点よりも優れていた。
この結果は、機能的多様性や歩行性の向上といった伝統的な都市計画目標が、生活可能性に寄与するが、15分間の都市全体の持続可能なモビリティ目標に限定的な影響を及ぼすことを示唆している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:32:39 GMT)
AlphaSyndrome: Tackling the Syndrome Measurement Circuit Scheduling Problem for QEC Codes [7.4] 我々は、一般的な通勤安定化器符号におけるシンドローム測定回路を自動でスケジューリングするAlphaSyndromeを提案する。
AlphaSyndromeは、さまざまなコードファミリ、サイズ、デコーダにまたがって、論理エラー率を平均80.6%削減する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 17:45:58 GMT)
Measuring unconventional causal structures in monitored dynamics [7.3] 観測された量子力学における因果構造と創発的「時間の制限」について検討する。
我々は、因果影響の程度を定量化するための新しい尺度、クロスエントロピー量子因果影響(英語版)を提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 05:58:19 GMT)
EmoKGEdit: Training-free Affective Injection via Visual Cue Transformation [7.2] EmoKGEditは、正確で構造を保った画像感情編集のための新しいトレーニング不要のフレームワークである。
オブジェクト,シーン,属性,視覚的手がかり,感情間の関係を乱すために,マルチモーダル・センティメント・アソシエーション・ナレッジグラフを構築した。
EmoKGEditは感情の忠実さとコンテンツ保存の両面で優れた性能を発揮し、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 09:20:09 GMT)
Classical-Quantum Channel Resolvability Using Matrix Multiplicative Weight Update Algorithm [7.2] 古典量子(C-Q)チャネルの可解性について検討し、C-Qチャネルの可解性は文献のランダムな符号化によって証明されている。
行列乗算重み更新アルゴリズムを用いて,C-Qチャネルの可解性を決定論的符号化により証明する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 02:49:45 GMT)
GazeFormer-MoE: Context-Aware Gaze Estimation via CLIP and MoE Transformer [7.2] 本稿では,3次元視線推定のためのセマンティックス,マルチスケールトランスフォーマを提案する。
本モデルでは,2.49,3.22,10.16,1.44のアート角誤差を新たに達成し,従来報告した結果よりも64%向上した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 08:54:02 GMT)
Zero-Permission Manipulation: Can We Trust Large Multimodal Model Powered GUI Agents? [7.0] アクションリバインド(Action Rebinding)は、エージェントの実行をリバインドする危険な権限をゼロにする、一見良心的なアプリを可能にする、新たな攻撃である。
エージェントのタスク回復ロジックとAndroidのUI状態保存を武器化し、プログラム可能なマルチステップアタックチェーンを編成する。
以上の結果から,原子間相互作用リバインディングの成功率は100%であり,マルチステップアタックチェーンを確実にオーケストレーションできることが示唆された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:54:54 GMT)
HOT-POT: Optimal Transport for Sparse Stereo Matching [6.8] 我々は、最適輸送(OT)の観点から、カメラ幾何学の直線制約を考察する。
カメラ投影点を(半)線として定式化し、古典的エピポーラ距離と3次元光線距離を用いてマッチング品質を定量化する。
私たちは顔分析の応用に焦点を合わせ、異なるランドマークの慣習に適合することを目指しています。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:10:45 GMT)
Enabling High-Curvature Navigation in Eversion Robots through Buckle-Inducing Constrictive Bands [6.5] ロボットの外壁に沿って座屈点を導入することにより屈曲剛性を減少させるパッシブアプローチを提案する。
ロボットの体に沿って一定間隔で非伸縮性径減少円周帯を統合することで実現した。
実験の結果、これらのバンドは先端で曲げた際のロボットの硬さを最大91%減少させることがわかった。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:12:51 GMT)
Press Start to Charge: Videogaming the Online Centralized Charging Scheduling Problem [6.3] オンライン集中充電スケジューリング問題(OCCSP)について検討する。
この問題において、中央機関は、いつ動的に到着する電気自動車(EV)を充電するかをリアルタイムで判断しなければならない。
私たちはまずそれをゲーミフィケーションし、グリッド上の時間的制約と容量的制約の中で充電ブロックを配置するゲームとしてモデル化します。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:15:29 GMT)
Approximating splits for decision trees quickly in sparse data streams [6.2] スパースバイナリ機能とバイナリクラスを扱う場合、最適な分割の検索を高速化する方法に焦点をあてる。
我々の実験では、ほぼ最適で、ベースラインよりも高速で、理論近似の保証を上回ります。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:19:28 GMT)
Speculative Sampling with Reinforcement Learning [6.1] 推論時間レイテンシは、大規模言語モデル(LLM)の現実的な応用において、依然としてオープンな課題である。
本稿では,投機的サンプリングのための強化学習(Reinforcement Learning for Speculative Smpling, Re-SpS)を紹介する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 01:31:29 GMT)
PISE: Physics-Anchored Semantically-Enhanced Deep Computational Ghost Imaging for Robust Low-Bandwidth Machine Perception [6.1] PISEは低帯域幅のエッジ知覚のための物理インフォームドディープゴーストイメージングフレームワークである。
分類精度を2.57%向上し、バラツキを9倍から5%削減する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:31:24 GMT)
Beyond Human Annotation: Recent Advances in Data Generation Methods for Document Intelligence [6.0] この調査は、ドキュメントインテリジェンスにおけるデータ生成のための最初の総合的な技術マップを確立する。
データ生成は監視信号生成として再定義される。
データとラベルの有効性」に基づく新しい分類法が導入された
論文参考訳(メタデータ) (Sun, 18 Jan 2026 09:01:18 GMT)
CTC-DID: CTC-Based Arabic dialect identification for streaming applications [5.5] CTC-DIDは、方言識別タスクを限定語彙ASRシステムとしてフレーム化する。
限られたデータセットでトレーニングされたSSLベースのCTC-DIDモデルは、微調整されたWhisperモデルとECAPA-TDNNモデルの両方を上回っている。
提案手法は、短い発話に対してより堅牢であり、ストリーミングでリアルタイムなアプリケーションに容易に適応できることが示されている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 00:11:02 GMT)
AgenTRIM: Tool Risk Mitigation for Agentic AI [5.5] ツール駆動型エージェントリスクの検出と緩和のためのフレームワークであるAgenTRIMを紹介する。
AgenTRIMは、これらのリスクに相補的なオフラインおよびオンラインフェーズを通じて対処する。
AgenTRIMは、高いタスク性能を維持しながら、攻撃成功を大幅に削減する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 15:10:18 GMT)
The Dynamic and Endogenous Behavior of Re-Offense Risk: An Agent-Based Simulation Study of Treatment Allocation in Incarceration Diversion Programs [5.3] 収監・転用治療プログラムは、社会的再統合を改善し、再犯を減らすことを目的としている。
リスクを人間-システム間相互作用としてモデル化する新しいフレームワークを開発する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:55:54 GMT)
Information Farming: From Berry Picking to Berry Growing [5.2] GenAIの台頭は、人々が情報を作成し、構造し、再利用する方法に根本的な変革をもたらしています。
この変化は新石器時代の革命と似ており、社会が狩猟や採集から耕作へと移行した。
生成技術により、ユーザーは、プロンプトの形で種を植えて、自分のプロットの中に豊かに構造化され、関連する収穫物を収穫することで、"ファーム"情報を置き換えることができる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:16:15 GMT)
Stablecoin Design with Adversarial-Robust Multi-Agent Systems via Trust-Weighted Signal Aggregation [5.2] 本稿では,リスク状態推定のための新しいストレスハーネスを組み込んだ,信頼度の高い平均変動フロンティアリザーブコントローラMVF-Composerを提案する。
私たちの重要な洞察は、マルチエージェントシミュレーションを敵のストレステスターとしてデプロイし、オンチェーンが現れる前に予備的な脆弱性を露呈することです。
ブラックスワンを注入した1200のランダム化シナリオで、MVF-Composerはピークペグの偏差を57%減らし、SASベースラインに対して平均回復時間を3.1倍減らした。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:21:25 GMT)
ASAS-BridgeAMM: Trust-Minimized Cross-Chain Bridge AMM with Failure Containment [5.2] クロスチェーンブリッジは、分散ファイナンス(DeFi)におけるシステムリスクの単一の最大のベクトルである
本稿では,Contained Degradationを導入した橋梁結合型自動市場メーカASAS-BridgeAMMについて紹介する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:40:26 GMT)
Temporal Data and Short-Time Averages Improve Multiphase Mass Flow Metering [5.1] コリオリス質量流量計(Coriolis mass flowmeter)は、直接質量流量測定を行う単一位相計である。
本稿では,時間的情報を保存することにより,そのようなシナリオにおけるモデル性能が大幅に向上することを示す。
我々は,342実験から得られた3相気-油流データに対して,多層パーセプトロン,窓面多層パーセプトロン,畳み込みニューラルネットワーク(CNN)を比較した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:39:53 GMT)
Dissecting Linear Recurrent Models: How Different Gating Strategies Drive Selectivity and Generalization [5.1] 線形リカレントニューラルネットワークは、トランスフォーマーのソフトマックスアテンションメカニズムの効率的な代替手段として登場した。
既存のベンチマークタスクは、大きな違いを明らかにするには単純すぎるか、実験のために過度にリソースを消費する。
本稿では,SelectivBenchを紹介した。SelectivBenchは軽量でカスタマイズ可能な,シーケンスモデルを体系的に評価するためのベンチマークタスクである。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 21:49:21 GMT)
Optimal Power Allocation and Sub-Optimal Channel Assignment for Downlink NOMA Systems Using Deep Reinforcement Learning [5.0] 本研究では,リプレイメモリをオン・ポリシー・アルゴリズムで組み込んだ深層強化学習フレームワークを提案し,ネットワークリソースをNOMAシステムに割り当てて学習を一般化する。
また,学習率,バッチサイズ,モデルの種類,状態の特徴数の変化の影響を評価するため,広範囲なシミュレーションを行った。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 03:37:40 GMT)
TrojanPraise: Jailbreak LLMs via Benign Fine-Tuning [5.0] TrojanPraiseは、良質でフィルタ承認されたデータを利用した、新しい微調整ベースの攻撃である。
TrojanPraiseは最大攻撃成功率95.88%を達成し、モデレーションを回避している。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 15:48:36 GMT)
Generative AI as a Non-Convex Supply Shock: Market Bifurcation and Welfare Analysis [4.9] 我々は、GenAIのコストが、市場をAIの出口と人間のセグメントに再活性化させ、-class hollow'のアウトプットを生成する方法を示す。
我々は、最適ガバナンスは、遅延フェール渋滞管理に向けたものでなければならないと結論づける。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 17:00:40 GMT)
Actionable Advice from Reviews via Mixture of LoRA Experts: A Two-LLM Pipeline for Issue Extraction and Business Recommendations [4.8] 本稿では,イシューモデルが健全な問題を抽出し,粗いテーマを割り当てるモジュール型2LLMフレームワークを提案する。
Yelpレビューから総合的なレビュー・イシュー・アドバイザ・トリプルを構築し,行動可能性,具体性,実現可能性,期待される影響,新規性,非冗長性,バイアス,明快さにまたがる8次元の操作ルーリックを用いて,推奨事項を評価する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:11:29 GMT)
SDiT: Semantic Region-Adaptive for Diffusion Transformers [4.7] 拡散変換器 (DiTs) はテキストと画像の合成において最先端の性能を達成するが、復調の反復性や世界的注目の二次的コストのため計算コストは高い。
本稿では,SDiTを提案する。SDiTは,領域の複雑さに応じて計算を割り当てるセマンティック領域適応拡散変換器である。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 06:43:36 GMT)
SRAW-Attack: Space-Reweighted Adversarial Warping Attack for SAR Target Recognition [4.6] SRAW(Space-Reweighted Adrial Warping)を提案する。
実験により、SRAWは最先端のSAR-ATRモデルの性能を著しく低下させることが示された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 05:07:30 GMT)
SplittingSecrets: A Compiler-Based Defense for Preventing Data Memory-Dependent Prefetcher Side-Channels [4.6] 本稿では,Data Memory-dependent Prefetchers (DMP) から生じるサイドチャネルに対して,ソフトウェアライブラリを強化可能なコンパイラベースのツールであるSplittingSecretsを紹介する。
そのようなプレファーを悪用する敵は、データ・アット・レストをリークする攻撃をマウントできることが示されている。
シークレットデータの漏洩を防ぐため、SplittingSecretsはメモリ操作を変換し、シークレットがアドレスに似た方法でメモリに格納されないようにする。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 05:55:46 GMT)
Distribution Shift Is Key to Learning Invariant Prediction [4.1] 大規模な分散シフトは、経験的リスク最小化の下でも、よりよいパフォーマンスをもたらす可能性がある。
我々は、あるデータ条件下では、ERMソリューションは不変予測モデルに匹敵する性能が得られることを証明した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 07:49:57 GMT)
A Two-Stage Globally-Diverse Adversarial Attack for Vision-Language Pre-training Models [4.0] 既存のマルチモーダル攻撃は、限られた摂動多様性と不安定なマルチステージパイプラインに悩まされることが多い。
本稿では,2段階のグローバル・クロス・アタック・フレームワークである2S-GDAを提案する。
我々のフレームワークはモジュラーであり、既存の手法と簡単に組み合わせて、対向移動性をさらに高めることができる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 08:05:33 GMT)
VR ProfiLens: User Profiling Risks in Consumer Virtual Reality Apps [3.8] 我々は,VRセンサデータに基づくユーザプロファイリングと,コンシューマVRアプリ間のプライバシーリスクを調査するために,VR ProfiLensを提案する。
以上の結果から,センサデータから機密情報を適度に高いリスク(最大90%のF1スコア)で推定できることが示唆された。
われわれの調査結果は、プライバシーの喪失、追跡、ターゲット広告、安全上の脅威など、ユーザーのリスクを浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 20:01:39 GMT)
Deterministic and probabilistic neural surrogates of global hybrid-Vlasov simulations [3.8] ハイブリッド・ブラソフシミュレーションは、太陽風と磁気圏の相互作用をモデル化するためのイオン-運動効果を解く。
グラフベース機械学習エミュレータは、電界の進化とイオン速度分布の低次モーメントを学習できることを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 23:13:23 GMT)
Autonomous Manipulation of Hazardous Chemicals and Delicate Objects in a Self-Driving Laboratory: A Sliding Mode Approach [3.7] スライディングモード制御(SMC)は、マニピュレータ力学における不確実性や乱れを管理するための堅牢なアプローチとして登場した。
本研究では,モビリティプラットフォームに搭載されたマニピュレータの動作を制御するために,双曲型タンジェント関数を用いたモデルベースSMC(MBSMC)を実装した。
PID, NMBSMCと比較すると, MBSMCはよりスムーズな運動, 最大90%の制御作業が達成された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 21:05:47 GMT)
The Expert Validation Framework (EVF): Enabling Domain Expert Control in AI Engineering [3.6] 我々は、GenAIコンポーネントを使ったソフトウェア構築の中心にドメインエキスパートを置くエキスパート検証フレームワークを提示する。
我々のフレームワークは、厳格で専門家主導の方法論を確立することによって、AI能力と組織的信頼の致命的なギャップに対処します。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 09:20:21 GMT)
Statistical-Neural Interaction Networks for Interpretable Mixed-Type Data Imputation [3.4] 本稿では,相関に基づく統計的先行情報とニューラル特徴量とを結合した混合型計算手法を提案する。
ICUモニタリング,人口調査,社会経済統計,工学的応用を対象とする6つのデータセットからSNIを評価する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 12:18:10 GMT)
A Scalable Entity-Based Framework for Auditing Bias in LLMs [3.3] 本稿では,モデル動作における構造的差異を測定するために,名前付きエンティティをプローブとして用いたスケーラブルなバイアス監査フレームワークを提案する。
これまでで最大のバイアス監査を実施しており、複数のエンティティタイプ、タスク、言語、モデル、およびプロンプト戦略を含む、19億のデータポイントで構成されています。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 12:07:31 GMT)
An Embodied Companion for Visual Storytelling [3.3] 本研究では,人間の機械的存在を再現するために,Large Language Models (LLMs) と描画ロボットを統合した芸術機器であるCompanionを提案する。
このアプローチは、ロボットを受動的執行者から、共有されたビジュアルストーリーテリングを予期せぬ美的領域に駆動できる遊び心のある共同創造パートナーに変える。
結果から,本システムは審美的アイデンティティとプロの展示効果を区別した作品を製作することを確認した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 08:15:16 GMT)
CytoCLIP: Learning Cytoarchitectural Characteristics in Developing Human Brain Using Contrastive Language Image Pre-Training [2.8] CytoCLIPは、訓練済みのContrastive Language-Image Pre-Trainingフレームワークから派生したビジョン言語モデルのスイートである。
1つは低解像度の全体領域画像を用いて訓練され、領域の全体構造パターンを理解する。
低解像度画像には86の異なる領域があり、高解像度タイルには384の脳領域がある。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 06:42:24 GMT)
Visualizing and Benchmarking LLM Factual Hallucination Tendencies via Internal State Analysis and Clustering [2.4] 大型言語モデル (LLM) はしばしば幻覚を起こし、医学や法律のような敏感な分野において特に有害な非感覚的または偽の情報を生成する。
FalseCiteは、誤解を招いたり、偽造された引用によって引き起こされた幻覚応答を捕捉し、ベンチマークするために設計された、キュレートされたデータセットである。
GPT-4o-mini, Falcon-7B, Mistral 7-BをFalseCiteで実行し, 誤認による誤認に対する幻覚活動が顕著に増加した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 22:51:40 GMT)
XRefine: Attention-Guided Keypoint Match Refinement [2.3] XRefineは、サブピクセルキーポイントの改良のための、新しい、検出器に依存しないアプローチである。
我々のクロスアテンションに基づくアーキテクチャは、内部検出器表現に頼ることなく、改良されたキーポイント座標を予測することを学ぶ。
MegaDepth、KITTI、ScanNetの実験では、このアプローチが幾何推定精度を一貫して改善することを示した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:32:53 GMT)
DiffusionQC: Artifact Detection in Histopathology via Diffusion Model [2.3] 本研究では, 拡散モデルを用いて, クリーン画像中の人工物を外れ値として検出するDiffusionQCを提案する。
ピクセルレベルのアーティファクトアノテーションや事前に定義されたアーティファクトタイプではなく、トレーニング用のクリーンイメージのセットのみを必要とする。
実証実験の結果、最先端技術よりも優れた性能を示し、クロスステインな一般化能力を提供する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 02:59:26 GMT)
Zero-Shot Embedding Drift Detection: A Lightweight Defense Against Prompt Injections in LLMs [2.2] 敵は電子メールやユーザー生成コンテンツなどの間接的な入力チャネルを利用してアライメント保護を回避する。
本稿では,Zero-Shot Embedding Drift Detection (ZEDD)を提案する。
ZEDDは、モデル内部へのアクセス、アタックタイプの事前知識、タスク固有の再トレーニングを必要とせずに動作する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:33:35 GMT)
Non-intersecting Squared Bessel Process: Spectral Moments and Dynamical Entanglement Entropy [2.0] 本研究では,非交差二乗ベッセル過程から生じる絡み合い推定のためのベースライン統計モデルを提案し,平均絡み合いエントロピーと量子純度を用いて絡み合い推定を行う。
この研究は,アンサンブルのスペクトルモーメントの発見によって実現され,アンサンブルメトリクスの体系的計算のための新しいアプローチとして機能する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 16:53:56 GMT)
Topological quantum color code model on infinite lattice [1.7] カラーコードモデルは、Calderbank-Shor-Steane (CSS)型トポロジカル量子誤り訂正符号の重要な例である。
物質の量子相の観点からは、これらの励起を熱力学的極限で理解することが不可欠である。
カラーコードの順序は$mathsfRep(D(mathbbZ_2)) simeq MathsfRep(D(mathbbZ_2)$で表され、トーリックコードの二重層に相当する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 13:53:18 GMT)
Ontology-aligned structuring and reuse of multimodal materials data and workflows towards automatic reproduction [1.5] 既存のテキストマイニング手法では、関連するパラメータを含む完全計算を抽出するには不十分である。
文献からの計算密度の自動抽出と構造化のための大規模言語モデル(LLM)支援フレームワークが導入された。
このフレームワークは、公表された結果を意味的に相互運用可能な形式で整理・コンテキスト化するための基盤を提供し、それによって計算材料データの透明性と再利用性を向上させる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 20:51:23 GMT)
Simulated Annealing Enhances Theory-of-Mind Reasoning in Autoregressive Language Models [1.4] 心の理論 (ToM) の課題は、自分自身や他人の潜伏した精神状態についての推論に決定的に依存する。
付加的な重み付けや検証を行うことなく,ToMの強力な能力がベースモデルから直接回復可能であることを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 05:51:30 GMT)
From Prompts to Pavement: LMMs-based Agentic Behavior-Tree Generation Framework for Autonomous Vehicles [1.4] 従来の行動木(BT)は構造化された決定論理を提供するが、本質的に静的であり、労働集約的なマニュアルチューニングを必要とする。
本稿では,大規模言語モデル (LLM) とマルチモーダル視覚モデル (LVM) を利用して,BTの生成と適応を行うエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:32:29 GMT)
An Optimized Decision Tree-Based Framework for Explainable IoT Anomaly Detection [1.3] モノのインターネット(IoT)デバイスの増加は、サイバー脅威の攻撃面を著しく増加させています。
本稿では、最適化された決定木分類器に基づく説明可能なAI(XAI)フレームワークを提案する。
提案システムは,99.91%の精度,99.51%のF1スコア,0.9960のコーエンカッパ,98.93%のクロスバリデーション平均精度で高い安定性が確認された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 08:48:53 GMT)
Asynchronous MultiAgent Reinforcement Learning for 5G Routing under Side Constraints [1.1] 本稿では,PPOエージェントが並列にルートを計画し,共有グローバルリソース環境にリソースデルタをコミットする非同期マルチエージェント強化学習フレームワークを提案する。
モントリオール市からのほぼリアルタイム交通データを用いて,O-RAN様ネットワークシミュレーションの手法の評価を行った。
AMARLはGoS(Gorge of Service)とエンドツーエンドのレイテンシを実現し、トレーニングウォールタイム時間を短縮し、需要シフトに対する堅牢性を向上させる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:38:37 GMT)
CurConMix+: A Unified Spatio-Temporal Framework for Hierarchical Surgical Workflow Understanding [1.1] 手術行動三重項認識は、楽器、行動、解剖学的標的間の相互作用をモデル化することによって、詳細な外科的行動を理解することを目的としている。
ワークフロー分析とスキルアセスメントにおいて臨床的に重要であるにもかかわらず、進行は重度のクラス不均衡、微妙な視覚的変化、三重項成分間の相互依存によって妨げられている。
本研究では,これらの課題に対処するための空間表現フレームワークであるCurConMixを構築した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 08:42:10 GMT)
Large Language Models Predict Functional Outcomes after Acute Ischemic Stroke [1.0] 大規模言語モデルによる将来のmRSスコアの推測能力は、日常的な受入音から直接的に明らかでない。
凍結・微調整条件および90日間のmRS予測において,エンコーダ (BERT, NYUTron) およびジェネレーティブ (Llama-3.1-8B, MedGemma-4B) LLMs の評価を行った。
90日間の正確なmRS精度は33.9%(95% CI、27.9-39.9%)、バイナリ精度は76.3%であった。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 04:18:42 GMT)
SimpleMatch: A Simple and Strong Baseline for Semantic Correspondence [1.0] 我々は,低解像度でも高い性能を実現する意味対応フレームワークであるSimpleMatchを紹介する。
現在のSOTA法よりも252x252 (3.3倍小さい)の解像度で、SimpleMatchはSPair-71kベンチマークで84.1%のPCK@0.1で優れた性能を達成した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:31:46 GMT)
Primate-like perceptual decision making emerges through deep recurrent reinforcement learning [1.0] 理論は、霊長類の意思決定機構とその結果として生じる行動能力は、ノイズや時間的に進化する情報に直面して報酬を最大化するために現れたことを示唆している。
ノイズの多い知覚的識別タスクにおいて、強化学習を用いて終端から終端までのディープ・リカレント・ニューラルネットワークを訓練する。
ネットワークは霊長類のような意思決定のいくつかの重要な能力を学びました。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 20:43:53 GMT)
User-to-Vehicle Interaction in Smart Mobility: The GO-DRiVeS Autonomous Ride-Sharing Application [1.0] GO-DRiVeSはオンデマンドのライドシェアリングで、長い歩幅と課題を節約するためのモバイルアプリをリクエストする。
GO-DRiVeSアプリケーションは、柔軟性のためのアジャイル方法論に従って開発された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:56:24 GMT)
Hybrid Encryption with Certified Deletion in Preprocessing Model [1.0] 認証された削除により、AliceはBobにデータをアウトソースでき、その後、彼女の要求によりファイルが不可逆的に削除されたという確実な保証を得る。
既存のアプローチは、ワンタイムパッド(OTP)暗号化や、古典的または量子コンピューティングの将来の進歩に弱い計算硬度仮定に依存する。
プリプロセッシングモデル(pHE-CD)における認証削除によるハイブリッド暗号の導入と形式化
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:18:12 GMT)
Improved Bug Localization with AI Agents Leveraging Hypothesis and Dynamic Cognition [0.9] ソフトウェアバグは技術提供者(AT&Tなど)に毎年数十億ドルを費やし、開発者はバグ解決に約50%を費やしている。
従来のバグローカライゼーションの手法は、コードのコンポーネントを分離して不審さを分析することが多い。
大規模言語モデル(LLM)やエージェントAI技術の最近の進歩は、強力な潜在的なコード理解を示す一方で、コード探索中に因果推論を欠いている。
我々は、因果推論、コールグラフベースの根本原因分析、コンテキストが可能な複数のAIエージェントによる上記の制限を克服する、バグローカライゼーションのための新しいエージェントテクニック、CogniGentを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:12:21 GMT)
CD-TWINSAFE: A ROS-enabled Digital Twin for Scene Understanding and Safety Emerging V2I Technology [0.8] CD-TWINSAFE(CD-TWINSAFE)は、V2Iをベースとした自動運転車用デジタルツインである。
提案アーキテクチャは,シーン理解のためのステレオカメラを備えた車載運転スタックと,カメラが見ているシーンのUnreal Engine 5レプリカを実行するデジタルツインスタックと,コックピットに安全警報を返送する2つのスタックで構成されている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 12:07:26 GMT)
IceWatch: Forecasting Glacial Lake Outburst Floods (GLOFs) using Multimodal Deep Learning [0.5] 氷河湖のアウトバースト洪水は山岳地帯で深刻な脅威となっている。
IceWatchは、空間的視点と時間的視点の両方を取り入れた、GLOF予測のための新しいディープラーニングフレームワークである。
強力な予測性能、リアルタイム使用のための高速なデータ処理、ノイズや欠落した情報に対する堅牢性を保証する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 09:29:40 GMT)
onepot CORE -- an enumerated chemical space to streamline drug discovery, enabled by automated small molecule synthesis and AI [0.5] ワンポットCORE(Onepot CORE)は、3.4B分子とそれに対応するオンデマンド生成物を含む列挙された化学空間である。
1pot COREは、(i)医薬化学でよく用いられる反応セットを選択し、(ii)サプライヤーカタログからビルディングブロックを抽出し、(iii)候補製品を列挙し、(iv)MLベースの実現可能性評価を適用して化合物を優先順位付けする。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 22:23:20 GMT)
A Hierarchical Benchmark of Foundation Models for Dermatology [0.4] 皮膚科における現在のベンチマークは、しばしば、複雑な診断分類をフラットな二分分類タスクに還元する。
この過剰な単純化は、モデルが微細な微分診断を行う能力を曖昧にする。
本研究は, 階層型皮膚病変分類のための基礎モデル10から導かれた埋め込みの有用性について検討した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 12:38:15 GMT)
Inverse Quantum Simulation for Quantum Material Design [0.4] 所望の特性を持つ材料設計を可能にする逆量子シミュレーションの枠組みを提案する。
ハミルトニアン学習は、この状態が近似基底状態である低エネルギーハミルトニアンを再構成するために用いられる。
結果は、量子シミュレータの範囲を、量子多体システムを探索することから、新しい量子材料の設計と発見まで拡張する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 03:28:09 GMT)
Improving Low-Resource Machine Translation via Round-Trip Reinforcement Learning [0.4] 低リソース環境における翻訳のための自己教師付き強化学習に基づく微調整について検討する。
我々のアプローチでは、chrF++とBLEUを組み合わせて、英語をターゲットとする低リソース言語に変換し、その後、英語に戻す。
私たちは、中央アイマラ語、フリウリア語、ウーロフ語、ロシア語の言語の改善を一貫して観察する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:44:49 GMT)
Leveraging Mutation Analysis for LLM-based Repair of Quantum Programs [0.3] 大規模言語モデル(LLM)がコード修復を生成できるフレームワークを構築するとともに,適用された修復の自然言語による説明を行う。
突然変異解析は,LLMに基づく量子プログラムのAPRに有用な文脈情報を提供できることを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 06:07:42 GMT)
Fine-Tuning Cycle-GAN for Domain Adaptation of MRI Images [0.3] 本稿では,教師なし医療画像領域適応のためのサイクロンGANモデルを提案する。
本モデルでは,トレーニングデータをペア化せずに,ソースドメインとターゲットドメイン間の双方向マッピングを学習する。
MRIデータセットによるいくつかの実験では、ラベル付きデータ無しの双方向領域適応において、我々のモデルの有効性が示された。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 17:50:00 GMT)
Artificial Intelligence in Materials Science and Engineering: Current Landscape, Key Challenges, and Future Trajectorie [0.3] AIは材料研究者にとって不可欠な能力になりつつある。
我々は、CNN、GNN、Transformersを含む機械学習アプローチのスペクトルを、新たな生成AIと確率モデルとともに調査する。
また、この分野でのデータの役割を重要視し、機械学習モデルの性能をいかに効果的に表現し、成果を上げるかを強調した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:36:10 GMT)
Survival is the Only Reward: Sustainable Self-Training Through Environment-Mediated Selection [0.3] 本稿では,外部フィードバックとバウンドメモリの下での安定した自己学習のための概念実証システムアーキテクチャを提案する。
学習は、報酬、客観的機能、または外部的に定義された適合度基準によってではなく、環境の生存性によってのみ媒介される自己学習アーキテクチャを導入する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 08:35:56 GMT)
Kinematic Tokenization: Optimization-Based Continuous-Time Tokens for Learnable Decision Policies in Noisy Time Series [0.3] トランスフォーマーは離散トークン用に設計されているが、多くの実世界の信号はノイズサンプリングによって観測される連続的なプロセスである。
最適化に基づく連続時間表現であるKinematic Tokenizationを導入する。
本研究では,明示的な連続時間トークンにより,雑音を伴う時系列における選択的決定ポリシーの学習性と校正性を向上できることを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 15:10:01 GMT)
Rethinking the AI Scientist: Interactive Multi-Agent Workflows for Scientific Discovery [0.2] 本稿では,数分で測定したターンアラウンド時間を用いて,インタラクティブな科学的調査を可能にするマルチエージェントシステムであるDeep Researchを紹介する。
このアーキテクチャは、永続的な世界状態を通じて統合された計画、データ分析、文献検索、新規性検出のための特殊なエージェントから構成される。
BixBenchの計算生物学ベンチマークによる評価は、最先端のパフォーマンスを示し、オープンレスポンスでは48.8%、マルチチョイス評価では64.5%の精度を達成した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:12:41 GMT)
Hybrid Concolic Testing with Large Language Models for Guided Path Exploration [0.2] 強力なハイブリッドソフトウェアテスティングテクニックであるConcolic Testingは、歴史的に基本的な制限に悩まされてきた。
本稿では,これらの課題を克服するために,Large Language Models (LLMs) と並列実行を統合した新しいアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 06:09:18 GMT)
Automated Tool Support for Category-Partition Testing: Design Decisions, UI and Examples of Use [0.1] カテゴリ分割(英: Category-Partition)は、テスト対象システムの入力ドメインをサブドメインに分割できるという考え方に基づく機能テスト手法である。
本稿では、グラフィカルユーザインタフェースツールのサポートにより、可能な限り多くのステップを自動化しようとする試みについて報告する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:48:02 GMT)
A Cloud-based Multi-Agentic Workflow for Science [0.1] 大型言語モデル(LLM)は、様々な科学領域にまたがって広く普及している。
シミュレーションの実行や複雑な決定といった複雑なタスクを実行する能力の欠如は、彼らのユーティリティを制限します。
我々は、完全にクラウド上で実行されている間、科学的アシスタントとして機能するエージェントフレームワークに対して、ドメインに依存しない、モデルに依存しないワークフローを提示します。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 22:37:09 GMT)
Machine Learning as a Service (MLaaS) Dataset Generator Framework for IoT Environments [0.1] 機械学習・アズ・ア・サービス(ML)を評価するための新しいフレームワークを提案する。
MDGは、複数の実世界のデータセットとデータ分散設定にわたる多様なモデルファミリーをトレーニングし、評価することで、現実的なMLの振る舞いをシミュレートする。
1万以上のMLサービスインスタンスを生成し、下流評価に適した大規模なベンチマークデータセットを構築します。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 08:07:50 GMT)
What Trace Powers Reveal About Log-Determinants: Closed-Form Estimators, Certificates, and Failure Modes [0.0] トレースパワーへのアクセスを$p_k = tr(Ak)$, 行列パワーが利用可能であれば自然に研究する。
非有界条件よりも連続的な正のモーメントが均一に正確であることはない。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 23:04:17 GMT)
Time-Continuous Modeling for Temporal Affective Pattern Recognition in LLMs [0.0] 本稿では,物理インフォームドニューラルネットワークを活用した実世界の感情動態と文脈内学習を模倣するLLMのデータセットと概念的枠組みを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:16:26 GMT)
Synthetic Student Responses: LLM-Extracted Features for IRT Difficulty Parameter Estimation [0.0] 項目応答理論の難易度パラメータを学生試験なしで正確に推定できるかどうかを検討する。
我々のアプローチは,Large Language Models (LLMs) を用いて抽出した従来の言語特徴と教育的洞察を組み合わせたものである。
数学の質問に対する25万以上の学生回答のデータセットを用いて、予測された難易度パラメータと全く見えない質問の実際の難易度パラメータの約0.78のPearson相関が得られる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:19:13 GMT)
Spark-LLM-Eval: A Distributed Framework for Statistically Rigorous Large Language Model Evaluation [0.0] 本稿では,Apache Spark上に構築された分散評価フレームワークであるSpark-LLM-Evalを紹介する。
フレームワークとすべての評価コードはオープンソースとして利用可能である。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 04:34:39 GMT)
RAPTOR-AI for Disaster OODA Loop: Hierarchical Multimodal RAG with Experience-Driven Agentic Decision-Making [0.0] 本研究は, 災害対応の3段階, 初期救助, 中期復旧, 長期復興を支援するために設計されたエージェント型検索・拡張生成フレームワークを紹介する。
頑健なマルチモーダルグラウンドを実現するために,テキスト災害マニュアル,歴史的教訓,航空・地上レベルの画像を統合した階層的知識基盤を構築した。
提案システムは,BLIPベースの画像キャプション,ColVBERT埋め込み,長文要約を用いて,46の津波関連PDF(2,378ページ)を処理するオープンソースのマルチモーダル実装に基づいている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:58:41 GMT)
Quantum Filtering for Squeezed Noise Inputs [0.0] 我々は、二次的な測定(ホモディニング)を行う量子開系に対する量子フィルタを導出する。
これにより、以前の熱入力ノイズの処理が拡張され、圧縮入力が可能になった。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 20:03:15 GMT)
Prometheus Mind: Retrofitting Memory to Frozen Language Models [0.0] Prometheus Mindは、11個のモジュールアダプタ(530MB、7%オーバーヘッド)を使用して、凍結したQwen3-4Bにメモリを適合させる
ラベル付きデータなしで最小ペアで意味的な方向を求めるコントラスト指向探索(CDD)を開発した。
Prometheus-132 (132例)では、クリーン入力に対する94.4%の検索が達成されている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 20:29:07 GMT)
Privacy-Preserving Federated Learning with Verifiable Fairness Guarantees [0.0] フェデレートラーニングは、センシティブなデータを集中化せずに、分散機関間で協調的なモデルトレーニングを可能にする。
本稿では,フェデレートされた学習システムに対して,初めて検証可能な公正性を保証する新しい暗号フレームワークであるCryptoFair-FLを紹介する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 15:06:30 GMT)
Predictive Prototyping: Evaluating Design Concepts with ChatGPT [0.0] 本稿では、生成事前学習変換器(GPT)がプロトタイピングによって得られる情報を予測できるかどうかを検討する。
OpenAI GPT-4o を用いた設計フィードバックをエミュレートするための検索拡張生成(RAG)手法を提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 06:26:03 GMT)
Patch-Level Tokenization with CNN Encoders and Attention for Improved Transformer Time-Series Forecasting [0.0] 本研究では,局所的時間的表現学習をグローバルな依存性モデリングから分離する2段階予測フレームワークを提案する。
第1段階では、畳み込みニューラルネットワーク(CNN)が固定長の時間的パッチで動作し、短距離時間的ダイナミクスと非線形特徴相互作用を抽出する。
第2段階では、Transformerエンコーダが結果のトークンシーケンスを処理して、パッチ間の時間的依存関係をモデル化し、パッチごとの予測を生成する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 16:16:01 GMT)
Orthogonalized Policy Optimization:Decoupling Sampling Geometry from Optimization Geometry in RLHF [0.0] 大規模言語モデルの最近のアライメント手法は、しばしば異なるアルゴリズムとして提示される。
多くのアプローチが2つの基本的および独立的な設計選択を暗黙的に説明していることを示す。
最適化幾何からサンプリング幾何を明示的に分離するフレームワークであるオルソゴン化政策最適化(OPO)を提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 13:57:44 GMT)
Operator delocalization in disordered spin chains via exact MPO marginals [0.0] 演算子の複雑性(演算子長さ)の相補的尺度を導入する。
どちらの量も、パウリ基底における時間発展作用素の拡大から定義される。
演算子質量と長さは,行列-積演算フレームワーク内で効率的に,正確に計算可能であることを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 15:03:25 GMT)
On the Provable Suboptimality of Momentum SGD in Nonstationary Stochastic Optimization [0.0] 各種段差系における均一な凸性および滑らか性の下でのグラディエントDescentの追跡性能を解析した。
本研究では,ドリフトによる追従誤差を大幅に増幅し,追従能力に明らかなペナルティを与えることを示す。
これらの結果は、動的環境における運動量の経験的不安定性に対する決定的な理論的根拠を与える。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 03:27:21 GMT)
Novel method for evaluating the eigenvalues of the Heun differential equation with an application to the Breit equation [0.0] 対応する2階のフン微分方程式と、固有値が決定できる連続分数の導出を行う。
ディラック方程式の正しいエネルギー準位は変数の適切な写像によって得られた結果から導かれることを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 17:32:03 GMT)
Mapping the Stochastic Penal Colony [0.0] 本稿では,罰そのものに焦点をあて,三つの貢献を行う。
まず、経験や工芸品を収集するためのオートエスノグラフィーと、それらを分析するための手続き的正義を組み合わせた新しい方法論を開発する。
第二に、フーコーのアルゴリズム時代の刑法体系のモデルを再構築し、刑罰としての刑罰と規律としての刑罰の間の歴史的リミナルな慣行として、刑法植民地を復活させた。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 16:22:59 GMT)
Machine Learning-Based Framework for Real Time Detection and Early Prediction of Control Valve Stiction in Industrial Control Systems [0.0] 制御バルブスタイクションは、不安定性、機器の摩耗、メンテナンスコストの上昇を引き起こす産業プロセスシステムにおいて一般的な欠点である。
本研究では,日常的に収集されるプロセス信号のみを用いて,スティクションの検出と予測を行う機械学習フレームワークを提案する。
提案するフレームワークを既存の制御システムに統合することで,予測メンテナンスをサポートし,ダウンタイムを低減し,不要なハードウェア置換を回避することができる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:34:48 GMT)
Life, Machine Learning, and the Search for Habitability: Predicting Biosignature Fluxes for the Habitable Worlds Observatory [0.0] 我々は、外惑星反射光スペクトルから生体信号種を予測するために設計された2つの先進的な機械学習アーキテクチャを導入する。
両モデルとも、幅広い外惑星条件にまたがる拡張データセットにおいて、比較可能な高い予測精度を達成できることを実証した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:43:48 GMT)
Learning Relativistic Geodesics and Chaotic Dynamics via Stabilized Lagrangian Neural Networks [0.0] 我々は、ラグランジアンの第2微分の非物理的シグネチャを速度に関してペナライズするヘッセン正則化スキームを提案する。
我々のLNNは、非相対論的および一般相対論的設定の両方において、測地運動を表すラグランジアンを学習できることを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:09:26 GMT)
Learning Deterministic Finite-State Machines from the Prefixes of a Single String is NP-Complete [0.0] 入力サンプルがプレフィックスクローズされた場合の計算複雑性について検討した。
サンプル集合がバイナリ文字列のすべてのプレフィックスで構成されている場合,問題はNPハードで近似可能であることを示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 23:28:36 GMT)
LOGOS-CA: A Cellular Automaton Using Natural Language as State and Rule [0.0] 大言語モデル (LLM) はWinograd Challenge (WSC) で高いパフォーマンスを達成した
これは、人類によって生み出された言語が、かなりのニュアンスを持つ世界のかなりの部分を記述していることを示唆している。
本研究では,セルオートマトンにおける高表現力の言語利用を試みた。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 20:11:05 GMT)
Interpolation of unitaries with time-dependent Hamiltonians via Deep Learning [0.0] 時間依存ハミルトニアンによって支配される量子システムは、単位時間進化作用素の正確な計算に重大な課題をもたらす。
物理インフォームドニューラルネットワークに基づく物理インフォームドディープラーニング手法を導入し,実時間領域でこれらの演算子を推定する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 23:20:38 GMT)
How Well Do LLMs Predict Human Behavior? A Measure of their Pretrained Knowledge [0.0] 大規模言語モデル(LLM)は、人間の行動を予測するのにますます使われている。
本稿では,事前学習したLLMが,そのような予測にどの程度の知識をもたらすかを評価する尺度を提案する。
本研究では,ある領域における固定LDMの予測誤差を,ドメイン固有データのサンプル増加に基づいて学習したフレキシブル機械学習モデルと比較することにより,この測定値を推定する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:28:54 GMT)
How Clinicians Think and What AI Can Learn From It [0.0] ほとんどの臨床AIシステムは、ラベルやリスクスコアを生成する予測エンジンとして動作するが、実際の臨床推論は、不確実性の下で、時間に縛られたシーケンシャルな制御の問題である。
クリニック推論の主流となる計算基板は、基数最適化ではなく、順序的、非補償的意思決定であると主張する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 19:19:41 GMT)
Hierarchy of quantum correlations in qubit-qutrit axially symmetric states [0.0] 混成量子ビット量子ビット系において、異方性パラメータ、磁場、温度の相互作用が量子相関の生存に与える影響について検討する。
その結果,ベルの非局所性と絡み合い(負性)は温度や異方性に非常に敏感であり,熱雑音下での急激な死を示すことがわかった。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 07:38:40 GMT)
HERMES: A Unified Open-Source Framework for Realtime Multimodal Physiological Sensing, Edge AI, and Intervention in Closed-Loop Smart Healthcare Applications [0.0] HERMESはオープンソースの高性能Pythonフレームワークで、エッジで連続的なマルチモーダルセンシングとAI処理を行う。
これは、同期データ収集と、ユーザのPyTorchモデルによるリアルタイムストリーミング推論を可能にする。
HERMESは、商用およびカスタムの分散センサーの固定版および自由生活環境に適用できる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 22:54:46 GMT)
Graph Attention Networks with Physical Constraints for Anomaly Detection [0.0] 本研究は, 正規化保存法則を特徴とする油圧対応グラフの時間的注意法を提案する。
マルチスケールモジュールは、ノードからネットワークレベルへの検出スコアを集約する。
3.3$ppのゲインとパラメータノイズの15%以下の高いロバスト性を示す。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:14:47 GMT)
Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis [0.0] HITL(Human-in-the-Loop)とHCAI(Human-Centered AI)の原則は広く認められている。
しかし、役割、チェックポイント、フィードバックメカニズムを構造化するための運用ガイダンスは、まだ断片化されている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 02:38:01 GMT)
Explainable Machine Learning for Pediatric Dental Risk Stratification Using Socio-Demographic Determinants [0.0] 方法: 人口レベルの小児データを用いて, 年齢, 収入と収益の比率, 人種・民族性, 性別, 医療歴などを用いて, 教師付き機械学習モデルを訓練した。
モデルは、高い確率レベルでリスクを過小評価する保守的なキャリブレーションによって、控えめな差別を達成した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 13:40:41 GMT)
Efficient classical simulation of time dynamics in Fermi-Hubbard models with imaginary interactions [0.0] 自由フェルミオンにおけるデフォーカスのリンドブラディアン進化と、二部格子における虚相互作用フェルミ・ハッバードモデルの時間発展の間の写像を用いる。
これらの相互作用系におけるシュルディンガー方程式を解くための効率的な古典的アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 11:56:24 GMT)
Disentanglement by deranking and by suppression of correlation [0.0] 自然解離仮説は、標準量子力学におけるいくつかの際立った問題によって動機付けられている。
微分は非線形作用素を用いて定式化され、量子状態ベクトルのシュルディンガー方程式と密度作用素のマスター方程式の両方を修正できる。
標準量子力学によって除外される極限サイクル定常状態解は、解離の存在下で可能となる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 10:33:09 GMT)
Disagreement as Data: Reasoning Trace Analytics in Multi-Agent Systems [0.0] 本稿では,大規模言語モデル(LLM)エージェントが生成する推論トレースが,プロセスデータの新しいリッチな形式を構成することを提案する。
我々は、推論トレースにコサイン類似性を適用し、エージェント間の不一致を系統的に検出、定量化し、解釈する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 23:19:49 GMT)
Conversational Context Classification: A Representation Engineering Approach [0.0] 重要な課題は、Large Language Modelsが期待される会話規範から逸脱した時期を正確に検出することである。
本稿では,RepE(Representation Engineering)とOCSVM(One-Class Support Vector Machine)の利用について概説する。
文脈内例に基づいてOCSVMをトレーニングすることにより、LLMの隠れ状態潜在空間内に堅牢な境界を確立する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 06:47:35 GMT)
Constraint-Aware Neurosymbolic Uncertainty Quantification with Bayesian Deep Learning for Scientific Discovery [0.0] 既存の不確実な定量化手法には、象徴的な科学的知識を組み込むメカニズムが欠けている。
本稿では,識別可能なシンボル推論によるベイズ的深層学習を統一するConstraint-Aware Neurosymbolic Uncertainity Framework (CANUF)を紹介する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 14:57:35 GMT)
Coherence Scaling in Quantum Communication Protocols [0.0] 量子コヒーレンスがどのようにスケールし、量子通信プロトコルで再配布されるかを検討する。
対数的あるいは一貫したコヒーレンス成長のみを示しながら,超高密度符号化によりスケーラブルな通信が可能となることを示す。
量子テレポーテーションは、望ましくないプロトコルによって引き起こされるコヒーレンスコストを示し、テレポーテーションされた量子ビットの数と線形に増加する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:01:38 GMT)
Camera Pose Revisited [0.0] 本稿では,キャリブレーション対象のポーズの初期推定に着目したパースペクティブ-$n$n$n$問題に対処する。
そこで本研究では,復調誤差ベクトルの古典的2次定式化を組み合わせたテキストレットCay-ProCay78アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 20:10:34 GMT)
BirdsEye-RU: A Dataset For Detecting Faces from Overhead Images [0.0] BirdsEye-RUデータセットは、8万以上の注釈付き顔を含む2,978枚の画像の集合である。
このデータセットは、様々な環境にまたがる、小さくて離れた顔を捉えるように設計されている。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 18:36:03 GMT)
Assessing the Carbon Footprint of Virtual Meetings: A Quantitative Analysis of Camera Usage [0.0] 本稿では,ビデオ通話中のデータ消費に関連する二酸化炭素排出量を定量化し,カメラのオン/オフの影響に着目した。
実験は携帯電話を介して4G接続を用いて、ビデオに関連する様々なデータ転送を測定した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 07:02:02 GMT)
An Ontological Interpretation of Photon Wave-Particle Duality via Complex-Space Trajectories [0.0] 波動粒子の双対性は、量子論における中心的な解釈上の課題である。
我々は、拡張複素空間で定式化された光子力学の軌跡に基づく記述を開発する。
運動量固有状態は光速で均一に伝播する直線軌道に対応するが、重畳状態は非自明な量子ポテンシャルをもたらす。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 06:43:30 GMT)
An Innovative Framework for Breast Cancer Detection Using Pyramid Adaptive Atrous Convolution, Transformer Integration, and Multi-Scale Feature Fusion [0.0] この論文は、Praamid Adaptive Atrous Convolution(PAAC)とTransformerアーキテクチャを統合することにより、マンモグラフィ画像中の悪性腫瘤を検出する革新的な枠組みを示す。
提案手法は, 良性組織と悪性組織からの特徴抽出を強化するために多スケール特徴フュージョンを用いており, Dice Loss 関数と Focal Loss 関数を組み合わせてモデルの学習プロセスを改善する。
提案モデルは,BreastNet,DeepMammo,Multi-Scale CNN,Swin-Unet,SegFormerなどの基礎モデルよりも高い精度で癌塊の検出に成功した。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 03:55:33 GMT)
Abusing the Internet of Medical Things: Evaluating Threat Models and Forensic Readiness for Multi-Vector Attacks on Connected Healthcare Devices [0.0] 我々は,サイバー物理システムのセキュリティモデルと技術利用フレームワークを融合したハザード統合脅威モデルを開発する。
我々は,実践者との没入型シミュレーションを行い,我々のモデルのライブバージョンをデプロイし,デジタル法医学の実践におけるギャップを識別する。
IPVコンテキストにおけるMedTechのサイバーセキュリティには,脅威モデリングの統合と法医学的能力の向上が必要である。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 21:32:52 GMT)
A Comprehensive Review of Bio-Inspired Approaches to Coordination, Communication, and System Architecture in Underwater Swarm Robotics [0.0] Underwater Swarm Roboticsは、個々の自律プラットフォームの機能を拡張する、有望なフレームワークを提供する。
魚類学校や昆虫コロニーのような自然システムにインスパイアされたバイオインスパイアされたSwarmアプローチは、分散意思決定を可能にしている。
本稿では,バイオインスパイアされた協調機構,コミュニケーション戦略,システム設計の考察について述べる。
論文参考訳(メタデータ) (Sun, 18 Jan 2026 03:42:28 GMT)