Teaching Pretrained Language Models to Think Deeper with Retrofitted Recurrence [113.5] 既存の事前学習された非再帰言語モデルを深度再帰モデルに変換する方法について検討する。
学習過程におけるモデルの有効深度を高めるために繰り返しのカリキュラムを用いることで,全体の計算コストを削減しつつ,性能を維持できることが判明した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:43:07 GMT)
Can LLM Annotations Replace User Clicks for Learning to Rank? [112.2] 大規模な教師付きデータは最新のランキングモデルのトレーニングには不可欠だが、高品質な人的アノテーションの取得にはコストがかかる。
クリックデータは低コストの代替手段として広く使われており、近年の大規模言語モデル(LLM)の発展に伴い、LLMベースの関連アノテーションも有望なアノテーションとして登場した。
公開データセットであるTianGong-STと、産業データセットであるBaidu-Clickの両方の実験は、クリック管理モデルが高周波クエリでより良いパフォーマンスを示すことを示している。
データスケジューリングと周波数対応多目的学習という2つのトレーニング戦略を検討し、両方の監視信号を統合する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:26:14 GMT)
Guided Diffusion Sampling on Function Spaces with Applications to PDEs [112.1] PDEに基づく逆問題における条件付きサンプリングのための一般的なフレームワークを提案する。
これは、関数空間拡散モデルと条件付けのためのプラグアンドプレイガイダンスによって達成される。
提案手法は,最先端の固定解像度拡散ベースラインに対して平均32%の精度向上を実現する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:54:16 GMT)
RLVE: Scaling Up Reinforcement Learning for Language Models with Adaptive Verifiable Environments [111.9] 適応検証環境(RLVE)を用いた強化学習の導入
RLVEは、各検証可能な環境が、トレーニングが進むにつれて、問題の難易度分布をポリシーモデルの能力に動的に適応させることを可能にする。
環境スケーリング,すなわち,トレーニング環境の収集を拡大することで,推論能力が継続的に向上することを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:18:35 GMT)
IterResearch: Rethinking Long-Horizon Agents via Markovian State Reconstruction [107.5] IterResearchは、マルコフ決定過程として長期研究を再構築する、新しい反復的深層研究パラダイムである。
6つのベンチマークで平均+14.5ppの既存のオープンソースエージェントよりも大幅に改善されている。
これは効果的なプロンプト戦略として機能し、ロングホライゾンタスクにおけるReActよりも19.2ppのフロンティアモデルを改善する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:30:08 GMT)
GNN-Enabled Robust Hybrid Beamforming with Score-Based CSI Generation and Denoising [105.1] 本稿では,グラフニューラルネットワーク(GNN)とスコアベース生成モデルを用いて,ロバストなハイブリッドビームフォーミング(HBF)タスクを実現することを提案する。
我々は、高分解能CSIの分布を学習するために、変換器(BERT)ベースのノイズ条件スコアネットワーク(NCSN)による双方向表現を設計する。
最後に,デノナイジングスコアネットワーク(DSN)と,デノナイジングスコアネットワーク(DSN)を任意のチャネルエラーレベル下でデノナイジングできるデノナイジングスコアネットワーク(DeBERT)を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:18:34 GMT)
Scaling Agent Learning via Experience Synthesis [100.4] 強化学習は、対話を通じて自己改善を行うことで、自律的なエージェントに力を与えることができる。
しかし、コストのかかるロールアウト、タスクの多様性の制限、信頼性の低い報奨信号、インフラストラクチャの複雑さによって、その実践的採用は依然として困難である。
私たちはDreamGymを紹介します。DreamGymはスケーラビリティを念頭において多様なエクスペリエンスを合成するために設計された最初の統合フレームワークです。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:02:36 GMT)
Towards Visual Grounding: A Survey [99.1] Referring Expression や Phrase Grounding としても知られる Visual Grounding は、与えられた式テキストに基づいてイメージ内の特定の領域をグラウンドすることを目的としている。
2021年以降、視覚的な接地は大幅に進歩し、接地事前訓練のような新しい概念が生まれている。
本稿では,視覚的グラウンドリングの分野で現在利用可能な,最も包括的な概要を示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:20:13 GMT)
StreamKV: Streaming Video Question-Answering with Segment-based KV Cache Retrieval and Compression [95.6] 我々は,ビデオLLMと高度なKVキャッシュの検索と圧縮をシームレスに行うフレームワークである textbfStreamKV を提案する。
公開StreamingVQAベンチマークの実験では、StreamKVが既存のオンラインビデオ-LLMを著しく上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:25:03 GMT)
Dissecting Long-Chain-of-Thought Reasoning Models: An Empirical Study [91.8] この研究は、強化学習のスケーリングにおける正と負のサンプルの役割に焦点を当てている。
グループ相対的政策最適化において、サンプルの半数以上がゼロの優位性を持つような実質的なデータ非効率性を同定する。
本研究では,様々な推論モデルとベンチマークの不安定な性能について検討し,不明瞭な結果を伴う不確実な問題に対する不安定性について考察した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:38:29 GMT)
TuckA: Hierarchical Compact Tensor Experts for Efficient Fine-Tuning [83.9] 4つのキー特性を持つTucker Adaptation(TuckA)を導入する。
我々は,ルータのパラメータサイズを$L$の係数で削減する,効率的なバッチレベルルーティング機構を開発した。
自然言語理解、画像分類、数学的推論におけるベンチマーク実験は、TuckAの有効性を物語っている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:03:16 GMT)
UniPixel: Unified Object Referring and Segmentation for Pixel-Level Visual Reasoning [83.7] 視覚的なプロンプト入力を柔軟に解釈し,マスクによる応答を生成できる大規模マルチモーダルモデルUniPixelを提案する。
具体的には、UniPixelは、要求に応じて視覚的なプロンプトを処理し、関連するマスクを生成し、推論中にこれらの中間ポインタに対してその後の推論条件を実行する。
提案手法の有効性は,画素レベルの参照/セグメンテーションや画像・ビデオにおけるオブジェクト中心の理解など,多種多様なタスクを対象とした10のベンチマークで検証されている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:50:20 GMT)
How Efficient Are Diffusion Language Models? A Critical Examination of Efficiency Evaluation Practices [81.9] 拡散言語モデル(DLM)は、長期支配的自己回帰(AR)パラダイムに代わる有望な代替として登場した。
しかし、現在のオープンソースのDLMは、しばしばARの速度よりも優れており、現実のユーティリティを制限している。
本研究はDLMの効率に関する系統的研究であり, 先行評価手法の問題点を同定する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:10:25 GMT)
SM3Det: A Unified Model for Multi-Modal Remote Sensing Object Detection [79.6] 本稿では,リモートセンシングのためのマルチモーダルデータセットとマルチタスクオブジェクト検出(M2Det)という新しいタスクを提案する。
水平方向または指向方向の物体を、あらゆるセンサーから正確に検出するように設計されている。
この課題は、1)マルチモーダルモデリングの管理に関わるトレードオフ、2)マルチタスク最適化の複雑さに起因する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:57:08 GMT)
YoNoSplat: You Only Need One Model for Feedforward 3D Gaussian Splatting [79.4] YoNoSplatは、任意の数の画像から高品質な3次元ガウス格子表現を再構成するフィードフォワードモデルである。
我々のモデルは非常に多用途で、ポーズとアンポーズの両方で効果的に動作し、校正され、校正されていない入力を処理します。
ポーズフリーとポーズ依存の両方の設定で、標準ベンチマークで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:21:54 GMT)
Provable Benefit of Curriculum in Transformer Tree-Reasoning Post-Training [76.1] 学習後のカリキュラムは指数関数的複雑性のボトルネックを回避していることを示す。
結果のみの報酬信号の下では、強化学習の微調整は、サンプルの複雑さを高い精度で達成する。
カリキュラムを意識したクエリにより、報奨託書の呼び出しとサンプリングコストの両方を指数関数的に削減するテストタイムスケーリングの保証を確立する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:29:54 GMT)
Consistency Is Not Always Correct: Towards Understanding the Role of Exploration in Post-Training Reasoning [75.8] 基礎モデルは幅広い知識を示すが、タスク固有の推論は限定的である。
RLVRと推論スケーリングは、RLVRや推論スケーリングのようなトレーニング後の戦略を動機付けます。
RLVRはスキューズ効果を誘発し,推論エントロピーを減少させ,正しい経路を忘れることを示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:25:26 GMT)
SageLM: A Multi-aspect and Explainable Large Language Model for Speech Judgement [74.5] 音声音声合成(S2S)大規模言語モデル(LLM)は、人間とコンピュータの自然な相互作用の基礎となる。
包括的S2S LLM評価のためのエンドツーエンド・マルチアスペクト・説明可能な音声LLMである textttSageLM を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:45:48 GMT)
Superhuman AI for Stratego Using Self-Play Reinforcement Learning and Test-Time Search [74.2] Stratego(ストラテゴ)は、大量の情報を隠蔽した戦略決定の挑戦を実証したボードゲームである。
この研究は、ストラテゴのパフォーマンスとコストの両方の段階的な変化を確立し、トップヒューマンのレベルに到達するだけでなく、超人的なレベルを達成することが可能になった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:13:41 GMT)
DeepDiver: Adaptive Search Intensity Scaling via Open-Web Reinforcement Learning [73.7] WebPuzzleはトレーニングと275サンプルテストベンチマークで、ライブインターネット上での情報検索を評価する。
我々は、検索強度スケーリング(SIS)を育成する強化学習フレームワークであるDeepDiverを開発した。
我々は,DeepDiverのカリキュラムをコールドスタートSFTからよく設計されたRLプロシージャに詳述し,その探索方針がクローズドドクエリからロングフォームライティングなどのオープンエンドジェネレーションへと一般化したことを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:43:25 GMT)
CAGE: Curvature-Aware Gradient Estimation For Accurate Quantization-Aware Training [73.5] 本稿では,量子化による損失に対応する新しい手法を提案する。
CAGEは、同様の計算コストで、精度の観点から最先端の手法を大幅に改善する。
LlamaモデルのQAT事前トレーニングでは、CAGEは4ビット(W4A4)で達成された精度と事前のベストメソッドとを一致させる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:53:51 GMT)
S$^2$Drug: Bridging Protein Sequence and 3D Structure in Contrastive Representation Learning for Virtual Screening [72.9] タンパク質リガンドコントラスト表現学習のための2段階フレームワークを提案する。
最初の段階では、ESM2ベースのバックボーンを用いて、ChemBLでタンパク質配列を事前訓練する。
第2段階では、残基レベルゲーティングモジュールを介して配列と構造情報を融合することでPDBBindを微調整する。
この補助的なタスクは、モデルを誘導し、タンパク質配列内の結合残基を正確に局在させ、それらの3次元空間配列をキャプチャする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:57:47 GMT)
ChemBOMAS: Accelerated BO in Chemistry with LLM-Enhanced Multi-Agent System [72.6] 本稿では,大規模言語モデル(LLM)によるベイズ最適化を高速化するマルチエージェントシステムであるChemBOMASを紹介する。
データ駆動型戦略は、わずか1%のラベル付きサンプルに微調整された8BスケールのLCMレジストレータを含む。
知識駆動型戦略では、検索空間の分割においてLLMを導くために、ハイブリッドなRetrieval-Augmented Generationアプローチを採用している。
ChemBOMASはベースライン方式に比べて最適化効率を最大5倍に向上させた。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:52:53 GMT)
Low-altitude UAV Friendly-Jamming for Satellite-Maritime Communications via Generative AI-enabled Deep Reinforcement Learning [72.2] 本稿では,低高度無人航空機(UAV)による衛星海上通信システムを提案する。
安全衛星・海上通信多目的最適化問題(SSMCMOP)を定式化する。
動的かつ長期の最適化問題を解くため、マルコフ決定過程に再構成する。
次に,トランスサック (TransSAC) アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:49:13 GMT)
On the Probabilistic Learnability of Compact Neural Network Preimage Bounds [71.6] 本研究では,高信頼度保証と有界誤差の解の提供を目的とした,新しい確率論的視点を採用する。
このメソッドは、ランダム化された決定ツリーのアンサンブルを利用して、所望の出力特性を満たす候補入力領域を生成する。
我々の理論的導出は、地域純度とグローバルカバレッジに関する正式な統計的保証を提供し、実用的なスケーラブルなコンピューティングソリューションを提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:56:51 GMT)
LiteUpdate: A Lightweight Framework for Updating AI-Generated Image Detectors [71.2] AI生成画像検出器を更新するための軽量なフレームワーク LiteUpdate を提案する。
LiteUpdateでは、イメージの信頼性と勾配に基づく識別機能を活用する、代表的なサンプル選択モジュールを採用している。
実験により、LiteUpdateは様々な検出器における検出性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:22:28 GMT)
Logic Distillation: Learning from Code Function by Function for Decision-making Tasks [71.1] 大規模言語モデル(LLM)は、その強力な論理的推論能力のために注目を集めている。
知識蒸留(KD)は、L-LLMsの能力をS-LLMsに与えることを目的としており、S-LLMsは単にL-LLMsの出力を模倣するだけである。
本稿では, 論理蒸留 (LD) と呼ばれる新しいフレームワークを提案し, その課題に対処する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:09:42 GMT)
The Markovian Thinker [70.4] 強化学習(Reinforcement Learning, RL)は、LongCoT(LongCoT)という長鎖のLLMを学習するための強力なレシピとなっている。
しかし、状態がプロンプトプラス全ての先行推論トークンである標準的なRLの「思考環境」は、州を無拘束にし、思考が長くなるにつれて注意に基づく政策に二次計算を支払うよう強制する。
我々は,一定サイズの状態に条件付けしながら,政策が推論を進めるパラダイムであるマルコフ的思考を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:21:14 GMT)
MVU-Eval: Towards Multi-Video Understanding Evaluation for Multimodal LLMs [69.3] MVU-EvalはMLLMのマルチビデオ理解を評価するための最初の包括的なベンチマークである。
私たちのMVU-Evalは、主に8つのコア能力を評価し、4,959本のビデオにまたがる1,824本の厳密にキュレートされた質問応答ペアを評価します。
これらの機能は、自律システムにおけるマルチセンサー合成や、クロスアングルスポーツ分析のような現実世界のアプリケーションと厳格に一致している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:02:33 GMT)
Twenty-Five Years of MIR Research: Achievements, Practices, Evaluations, and Future Challenges [68.5] 我々は過去25年間に音楽情報検索(MIR)の進化を辿った。
MIRは音楽情報学に関するあらゆる研究を集めている。
我々は、MIR研究の急速な発展を後押しする一連の成功事例をレビューする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:32:23 GMT)
Self Forcing: Bridging the Train-Test Gap in Autoregressive Video Diffusion [67.9] 本稿では,自己回帰ビデオ拡散モデルのための新しい訓練パラダイムであるSelf Forcingを紹介する。
露光バイアスの長年の問題に対処し、地道的な文脈で訓練されたモデルは、自身の不完全な出力で条件付けられたシーケンスを生成する必要がある。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:36:27 GMT)
StreamDiffusionV2: A Streaming System for Dynamic and Interactive Video Generation [65.9] 生成モデルは、コンテンツの作り方、スタイル、配信方法を再定義することで、ライブストリーミング業界を変革している。
ビデオ拡散の最近の進歩は、オフライン生成のための時間的一貫性とサンプリング効率を著しく改善した。
ライブオンラインストリーミングは厳しいサービスレベル(SLO)の下で動作します。 タイム・ツー・ファーストフレームは最小限でなければなりません。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:51:28 GMT)
MirrorMamba: Towards Scalable and Robust Mirror Detection in Videos [64.9] 我々はMirrorMambaと呼ばれる新しい有効でスケーラブルなビデオミラー検出手法を提案する。
提案手法では,様々な条件に適応し,知覚深度,対応性,光学的手法を取り入れた。
特に、この研究は、ミラー検出の分野におけるMambaベースのアーキテクチャの初めての成功例である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:18:14 GMT)
LangBridge: Interpreting Image as a Combination of Language Embeddings [64.4] LangBridgeは、ビジュアルトークンをテキスト埋め込みの線形結合に明示的にマッピングする新しいアダプタである。
以上の結果から,LLaMA3-8BやQwen2.5-14Bといった大型モデルに対して,Qwen2-0.5Bで事前訓練したLangBridgeを直接適用できることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:02:33 GMT)
BEE-RAG: Balanced Entropy Engineering for Retrieval-Augmented Generation [64.0] 本稿では,RAGシステムの適応性を改善するために,バランスの取れたエントロピーエンジニアリングRAG(BEE-RAG)フレームワークを提案する。
BEE-RAGは、注意感度をコンテキスト長から分離し、安定したエントロピーレベルを確保する。
これに基づいて,マルチインパタンス推定のためのゼロショット推論戦略とパラメータ効率適応微調整機構を導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:49:10 GMT)
Temporal Inconsistency Guidance for Super-resolution Video Quality Assessment [63.8] 本稿では,フレームの時間的矛盾を定量化するための知覚指向アプローチを提案する。
人間の視覚システムに触発され,不整合誘導時間モジュールを開発した。
我々の手法は最先端のVQA手法よりも優れています。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:04:01 GMT)
Tool Zero: Training Tool-Augmented LLMs via Pure RL from Scratch [63.4] ツール強化言語モデルのトレーニングは、複雑なタスクの能力を高めるための有望なアプローチとして登場した。
規則に基づく強化学習のための動的一般化誘導型報酬設計を提案する。
本研究では,SFTモデルとRL-with-SFTモデルと比較して7%以上の性能向上を実現していることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:36:41 GMT)
TNT: Improving Chunkwise Training for Test-Time Memorization [62.8] タイタンスやTTTのような深いテストタイム記憶モジュールを持つリカレントニューラルネットワーク(RNN)は、トランスフォーマーとは異なる有望で線形にスケールするパラダイムである。
TNTは,2段階のプロセスを通じて,推論性能からトレーニング効率を分離する,新たなトレーニングパラダイムである。
TNTはトレーニング速度を最も正確なベースライン構成の17倍に高速化する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:45:09 GMT)
SPUR: A Plug-and-Play Framework for Integrating Spatial Audio Understanding and Reasoning into Large Audio-Language Models [62.1] 本研究では,空間知覚を伴う大規模オーディオスピーカモデルを備えた,軽量なプラグイン・アプローチであるSPURを紹介する。
SPURは、 (i) チャネルを回転認識、リスナー中心の空間特徴にマッピングし、マルチモーダルアダプタを介して対象のLALMに統合する第1次アンビニクス(FOA)エンコーダと、 (ii) SPUR-Setは、オープンソースのFOA記録を制御されたシミュレーションと組み合わせた空間QAデータセットで、相対方向、標高、距離、および監督された空間推論の重複を強調する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:29:26 GMT)
Optimistic Online-to-Batch Conversions for Accelerated Convergence and Universality [61.1] 我々は,古典的ネステロフの加速度勾配法が最適収束を達成するような,滑らかな目的を持ったオフライン凸最適化について検討した。
理論的に楽観性を取り入れた新しい楽観的オンライン・バッチ変換を提案する。
我々は,オンライン・バッチ変換のレンズを用いて,強凸・滑らかな目標に対する最適加速収束率を初めて達成した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:07:51 GMT)
Shared Heritage, Distinct Writing: Rethinking Resource Selection for East Asian Historical Documents [60.3] 古典中国語から漢語・漢文への言語間移動可能性の仮定を疑問視する。
実験の結果,漢文で書かれた古代朝鮮語文書の言語モデル性能に対する古典中国語データセットの影響は最小限であった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:23:23 GMT)
Correcting False Alarms from Unseen: Adapting Graph Anomaly Detectors at Test Time [60.3] グラフ異常検出(GAD)における未確認正規pattErnsの修正のための,軽量かつプラグアンドプレイなテスト時間適応フレームワークを提案する。
意味的混乱に対処するために、シフトしたデータと元のデータとをグラフ属性レベルで整合させるグラフ整合器を用いる。
10個の実世界のデータセットに対する大規模な実験により、TUNEは事前学習されたGADモデルの合成パターンと実際の見えない正常パターンの両方への一般化性を著しく向上することが示された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:10:05 GMT)
Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.0] CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:45:52 GMT)
GUI-360$^\circ$: A Comprehensive Dataset and Benchmark for Computer-Using Agents [59.1] GUI-360$circ$は、コンピュータ利用エージェント(CUA)を進化させるために設計された大規模で包括的なデータセットとベンチマークスイートである。
リリースされたコーパスには、人気のあるWindowsオフィスアプリケーションにおける数千のトラジェクトリにわたる1.2万以上の実行されたアクションステップが含まれている。
このデータセットは、3つの標準タスク、GUIグラウンド、スクリーン解析、アクション予測、ハイブリッドGUI+APIアクションスペースをサポートする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:27:15 GMT)
A Step Toward World Models: A Survey on Robotic Manipulation [58.8] 本稿では,ロボット操作の手法のレビューを通じて,世界モデルのコア機能を示すアプローチについて考察する。
我々は、認識、予測、制御にまたがる役割を分析し、主要な課題と解決策を特定し、完全に実現された世界モデルが持つべきコアコンポーネント、能力、機能を蒸留する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:45:44 GMT)
UnsafeChain: Enhancing Reasoning Model Safety via Hard Cases [57.7] さまざまなソースを持つハードプロンプトから構築された安全アライメントデータセットであるUnsafeChainをリリースする。
我々は3つの大きな推論モデル(LRM)を微調整し、それらを最近のSafeChainとSTAR-1と比較する。
UnsafeChainは、1Kサブセットのマッチングやベースラインのパフォーマンスを越えながら、従来よりも一貫してパフォーマンスが向上している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:23:44 GMT)
From Pretrain to Pain: Adversarial Vulnerability of Video Foundation Models Without Task Knowledge [57.4] 本稿では、ダウンストリームモデルやオープンソースのVFMから微調整されたMLLMを攻撃することによる、新規で実用的な敵の脅威シナリオについて検討する。
本稿では,VFMの時間的表現ダイナミクスを利用して効果的な摂動を発生させる,時間的対応型対向攻撃手法であるTransferable Video Attack (TVA)を提案する。
TVAは高価なサロゲートモデルのトレーニングやドメイン固有のデータへのアクセスを回避し、より実用的で効率的な攻撃戦略を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:42:32 GMT)
DIMO: Diverse 3D Motion Generation for Arbitrary Objects [57.1] DIMOは、単一の画像から任意のオブジェクトに対して多様な3Dモーションを生成することができる生成的アプローチである。
我々は、よく訓練されたビデオモデルにおけるリッチな事前情報を利用して、共通の動きパターンを抽出する。
学習した潜時空間での推論時間の間、単方向パスで様々な3次元運動を瞬時にサンプリングすることができる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:56:49 GMT)
Mitigating Modality Imbalance in Multi-modal Learning via Multi-objective Optimization [57.0] マルチモーダル学習(MML)は、複数のモーダルからの情報を統合することを目的としており、単一のモーダル学習よりも優れたパフォーマンスをもたらすことが期待されている。
近年の研究では、MMLはモダリティにまたがる不均衡学習のため、単一モダリティアプローチと比較しても性能が劣っていることが示されている。
本稿では,修正ML問題を解くための勾配に基づくアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:16:01 GMT)
JPRO: Automated Multimodal Jailbreaking via Multi-Agent Collaboration Framework [56.8] JPROは、自動VLMジェイルブレイク用に設計された新しいマルチエージェント協調フレームワークである。
これは、アタックの多様性とスケーラビリティにおいて、以前の方法の欠点を克服する。
実験の結果,JPROは複数の高度なVLMに対して60%以上の攻撃成功率を達成した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:16:46 GMT)
SWE-Compass: Towards Unified Evaluation of Agentic Coding Abilities for Large Language Models [56.7] ソフトウェアエンジニアリングのための大規模言語モデル(LLM)の評価は、タスクカバレッジの狭さ、言語バイアス、現実世界の開発者との整合性の不足によって制限されている。
SWE-1は、不均一なコード関連評価を構造化および生産整合性のあるフレームワークに統合する包括的なベンチマークである。
SWE-は8つのタスクタイプ、8つのプログラミングシナリオ、10のプログラミング言語にまたがる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:18:54 GMT)
Understanding Forgetting in LLM Supervised Fine-Tuning and Preference Learning - A Convex Optimization Perspective [55.7] オープンソースLLMのポストトレーニングにおいて広く採用されているアプローチは、SFTとRLHF/DPOのシーケンシャルな実行である。
これはSFTとRLHF/DPOのトレードオフの点において最適である。
本稿では,理論収束保証と逐次後学習フレームワークの性能を実証的に向上させる,実践的な後学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:00:46 GMT)
Lightning Grasp: High Performance Procedural Grasp Synthesis with Contact Fields [55.0] 本稿では,新しい高性能な手続き型グリップ合成アルゴリズムLightning Graspを提案する。
最先端のアプローチを超越したオーダー・オブ・マグニチュード・スピードアップを実現する。
ロボット操作のさらなるイノベーションを促進するために,当社のシステムをオープンソースとして公開しています。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:59:44 GMT)
Deep Pareto Reinforcement Learning for Multi-Objective Recommender Systems [54.2] 複数の目的を同時に最適化することは、レコメンデーションプラットフォームにとって重要なタスクです。
既存の多目的推薦システムは、そのような動的な関係を体系的に考慮していない。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:56:55 GMT)
Sim4Seg: Boosting Multimodal Multi-disease Medical Diagnosis Segmentation with Region-Aware Vision-Language Similarity Masks [54.0] 医療診断(MDS)という医用視覚言語タスクについて紹介する。
MDSは、医療画像に対する臨床クエリを理解し、対応するセグメンテーションマスクと診断結果を生成することを目的としている。
診断セグメンテーションの性能を向上させる新しいフレームワークであるSim4Segを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:22:42 GMT)
Transformers Provably Learn Chain-of-Thought Reasoning with Length Generalization [53.9] AI推論に関する重要な問題は、モデルが学習した推論パターンを外挿して、より長いチェーン・オブ・シークレット(CoT)で難しいタスクを解決できるかどうかである。
状態追跡問題の代数構造が、学習されたCoTの外挿の度合いをいかに支配するかを数学的に証明する。
定数深度変換器はCoTで$mathsfNC1$-complete問題を確実に学習することを保証する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:40:24 GMT)
Secure Low-altitude Maritime Communications via Intelligent Jamming [53.4] 低高度無線ネットワーク (LAWN) は海上通信の有効なソリューションとして登場している。
オープンで明確なUAV通信チャネルは、海上のLAWNを盗聴攻撃に対して脆弱にする。
本稿では,動的盗難対策にインテリジェントジャミングを用いた低高度海上通信システムを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:16:19 GMT)
Last-Iterate Convergence of Adaptive Riemannian Gradient Descent for Equilibrium Computation [52.7] 本稿では,テクスト幾何学的強単調ゲームに対する新たな収束結果を確立する。
我々のキーとなる結果は、RGDがテクスト幾何学的手法で最終定位線形収束を実現することを示しています。
全体として、ユークリッド設定を超えるゲームに対して、幾何学的に非依存な最終点収束解析を初めて提示する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:07:30 GMT)
Bridging Weakly-Supervised Learning and VLM Distillation: Noisy Partial Label Learning for Efficient Downstream Adaptation [51.7] ノイズ部分ラベル学習(NPLL)では、各トレーニングサンプルは、複数のノイズアノテータによって注釈付けされた候補ラベルのセットに関連付けられている。
本稿では、事前学習された視覚言語モデルによって注釈付けされた部分ラベルからの学習に焦点を当てる。
革新的な協調整合正則化(Co-Reg)法を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:19:19 GMT)
First Sub-MeV Dark Matter Search with the QROCODILE Experiment Using Superconducting Nanowire Single-Photon Detectors [51.6] 低エネルギー(QROCODILE)におけるダークマターインシデントのための量子分解能線極低温観測による最初の結果を示す。
QROCODILE実験では、暗黒物質散乱と吸収の標的とセンサーとして、マイクロワイヤベースの超伝導ナノワイヤ単光子検出器(SNSPD)を使用している。
サブMeVダークマター粒子と30keV以下の質量との相互作用に関する新たな世界的制約を報告した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:00:18 GMT)
Rectifying Regression in Reinforcement Learning [51.3] 平均絶対誤差は,学習方針の最適度差を制御するために,従来の平均二乗誤差よりもよい予測目標であることを示す。
異なる損失関数は、これらの異なる回帰目標とよりよく一致していることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:09:59 GMT)
TCM-Eval: An Expert-Level Dynamic and Extensible Benchmark for Traditional Chinese Medicine [51.0] 我々は,中国伝統医学(TCM)の最初のダイナミックで高品質なベンチマークであるTCM-Evalを紹介する。
大規模トレーニングコーパスを構築し,SI-CoTE(Self-Iterative Chain-of-Thought Enhancement)を提案する。
このリッチなトレーニングデータを用いて,TCM用に特別に設計された最先端LLMであるZhiMingTang(ZMT)を開発した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:35:25 GMT)
GauSSmart: Enhanced 3D Reconstruction through 2D Foundation Models and Geometric Filtering [50.7] 2次元基礎モデルと3次元ガウススプラッティング再構成をブリッジするハイブリッド手法であるGauSSmartを提案する。
提案手法は,凸フィルタリングや意味的特徴監視など,確立した2次元コンピュータビジョン技術を統合している。
GauSSmartは既存のGaussian Splattingよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:16:00 GMT)
Q-RAG: Long Context Multi-step Retrieval via Value-based Embedder Training [50.4] 強化学習(RL)を用いた多段階探索のための細粒度埋め込みモデルQ-RAGを提案する。
Q-RAGは、オープンドメイン質問応答のための既存のマルチステップ検索方法に代わる、競合的でリソース効率のよい代替手段を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:31:02 GMT)
Preparation of Fractal-Inspired Computational Architectures for Advanced Large Language Model Analysis [50.1] FractalNetはフラクタルにインスパイアされた高度な大規模言語モデル解析のための計算アーキテクチャである。
新しいセットアップにはテンプレート駆動ジェネレータ、ランナー、評価フレームワークが含まれており、畳み込み、正規化、アクティベーション、ドロップアウト層の体系的な置換によって、1200以上のニューラルネットワークを生成できる。
本論文は, フラクタル設計を自動建築探査の実用的で資源効率のよい方法として位置づけている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:31:39 GMT)
SPAN: Spatial-Projection Alignment for Monocular 3D Object Detection [49.1] 既存の単分子3D検出器は典型的には、切り離された予測パラダイムを通じて、3D境界ボックスの顕著な非線形回帰をテームする。
本稿では2つの主成分を持つ新しい空間射影アライメント(SPAN)を提案する。
SPANは、予測された3次元境界ボックスと接地した3次元境界ボックスの間に明らかに大域的な空間的制約を課し、それによって非結合な特性回帰による空間的ドリフトを補正する。
3D-2Dプロジェクションアライメントは、投影された3Dボックスが、画像平面上の対応する2D検出バウンディングボックス内に密に整列していることを保証する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:48:48 GMT)
Seg2Any: Open-set Segmentation-Mask-to-Image Generation with Precise Shape and Semantic Control [48.9] テキスト・トゥ・イメージ(T2I)モデルは、正確な空間レイアウト制御に苦慮している。
Seg2Anyは、高度なマルチモーダル拡散変換器上に構築された新しいS2Iフレームワークである。
Seg2Anyは、オープンセットとクローズセットの両方のS2Iベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:02:07 GMT)
On the Joint Minimization of Regularization Loss Functions in Deep Variational Bayesian Methods for Attribute-Controlled Symbolic Music Generation [47.4] 明示的な潜在変数モデルは、データ合成のための柔軟だが強力なフレームワークを提供する。
既存のアプローチは、両方の正規化目標を共同で最小化するのに苦労していることを示す。
適切な属性変換は、目標潜在次元の可制御性と正則化の両方を達成するのに有効であることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:09:25 GMT)
Conditional Diffusion as Latent Constraints for Controllable Symbolic Music Generation [47.4] シンボリック音楽生成モデルに対するプラグアンドプレイ遅延制約としての拡散過程の解法について検討する。
拡散駆動制約は従来の属性正規化や他の潜在制約アーキテクチャよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:46:10 GMT)
HENet++: Hybrid Encoding and Multi-task Learning for 3D Perception and End-to-end Autonomous Driving [47.4] 本稿では,マルチタスク3次元認識とエンドツーエンド自動運転のためのHENetおよびHENet++フレームワークを提案する。
具体的には,短期フレームには大型画像エンコーダ,長期フレームには小型画像エンコーダを用いたハイブリッド画像エンコーダネットワークを提案する。
本フレームワークは,高密度かつスパースな特徴を同時に抽出し,異なるタスクに対してより適切な表現を提供し,累積誤差を低減し,計画モジュールにより包括的な情報を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:49:59 GMT)
DigiData: Training and Evaluating General-Purpose Mobile Control Agents [45.5] モバイルコントロールエージェントのトレーニング用に設計された大規模で高品質で多様なマルチモーダルデータセットであるDigiDataを紹介した。
本稿では,実世界の複雑なタスクに対して,モバイル制御エージェントを評価するためのベンチマークであるDigiData-Benchを紹介する。
我々の貢献は、より直感的で効果的なヒューマンデバイスインタラクションを実現するために、モバイル制御エージェントの開発を著しく推進することを目的としている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:57:35 GMT)
A solvable model of learning generative diffusion: theory and insights [45.0] 本稿では,2層自動エンコーダによりパラメータ化されたフローモデルや拡散モデルについて考察する。
学習モデルにより生成されたサンプルの分布の低次元投影の厳密な特性を導出する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:08:50 GMT)
CoSQA+: Pioneering the Multi-Choice Code Search Benchmark with Test-Driven Agents [44.3] 既存のコード検索データセットは、主にセマンティック理解を通じてコードを評価する人間のアノテータに依存している。
本稿では、CoSQAの高品質なクエリと複数の適切なコードとをペアリングするCoSQA+を紹介する。
複数のモデルに基づく候補選択と新しいテスト駆動型エージェントアノテーションシステムを備えた自動パイプラインを開発する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:14:05 GMT)
Evaluating Test-Time Scaling LLMs for Legal Reasoning: OpenAI o1, DeepSeek-R1, and Beyond [44.2] 我々は17の中国語および英語の法的タスクにわたる12の大規模言語モデル(LLM)を評価した。
法律分野に特化したオープンソースモデルである Legal-R1 を開発した。
DeepSeek-R1は中国の法的推論において明らかな優位性を示し、OpenAIのo1は英語のタスクで同等の結果を得る。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:28:29 GMT)
Nowcast3D: Reliable precipitation nowcasting via gray-box learning [43.7] 極端降水は高次元の忠実度とリードタイムを要求されるが、既存のアプローチは限られている。
我々は、レーダの動きと、データ駆動学習を伴う物理的に制約されたニューラル演算子を直接処理する、グレーボックスで完全な3時間放送フレームワークを導入する。
このフレームワークは、160人の気象学者によるブラインド評価において、より正確な3時間のリードタイムを達成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:55:46 GMT)
TiS-TSL: Image-Label Supervised Surgical Video Stereo Matching via Time-Switchable Teacher-Student Learning [43.7] TiS-TSLは、最小限の監督下でビデオステレオマッチングのためのタイムウィッチ可能な教師学生学習フレームワークである。
統合モデルは、画像予測(IP)、前方ビデオ予測(FVP)、後方ビデオ予測(BVP)の3つの異なるモードで動作する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:01:26 GMT)
On The Presence of Double-Descent in Deep Reinforcement Learning [43.2] 二重降下パラドックスは深部強化学習(DRL)の非定常領域においてほとんど探索されていない。
本稿では, DDがモデルフリーDRLに存在することを示す予備的証拠として, Actor-Critic フレームワークを用いて, 様々なモデルキャパシティを体系的に調査する。
これらの知見は、DDをDRLの因子として確立し、より汎用的で、転送可能で、堅牢なエージェントを設計するための情報ベースのメカニズムを提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:45:03 GMT)
Learning to Focus: Focal Attention for Selective and Scalable Transformers [43.0] 焦点注意は、ソフトマックス温度を制御することによって注意分布を鋭くする。
パラメータの最大42%、トレーニングデータの最大33%の精度で、同じ精度を達成する。
長時間のタスクでは、17%から82%の大幅な相対的な改善を実現している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:02:58 GMT)
Learning Temporal 3D Semantic Scene Completion via Optical Flow Guidance [42.8] 3Dセマンティックシーンコンプリート(SSC)は、自律運転知覚のための総合的なシーン幾何学と意味論を提供する。
既存のSSC手法は、現在のフレームからスパース情報をキャプチャすることや、複数フレームの時間的特徴を経時的に積み重ねることに限られる。
本稿では, 時間的SSC手法FlowScene: Learning Temporal 3D Semantic Scene Completion through Optical Flow Guidanceを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:08:02 GMT)
Mono3DVG-EnSD: Enhanced Spatial-aware and Dimension-decoupled Text Encoding for Monocular 3D Visual Grounding [42.4] CLIP-Guided Lexical Certainty Adapter (CLIP-LCA) と Dimension-Decoupled Module (D2M) の2つの主要なコンポーネントを統合する新しいフレームワーク Mono3DVG-EnSD を提案する。
特に,Far(Acc@0.5)の難易度を+13.54%向上させる手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:02:30 GMT)
Otter: Mitigating Background Distractions of Wide-Angle Few-Shot Action Recognition with Enhanced RWKV [42.4] 我々は,各フレームのキーパッチを強調する広角動作認識システムを開発し,背景情報に対する被験者の強調を効果的に行う。
通常の試作機は時間的強調と時間的モデリングを同時に強化し、広角FSARの性能を向上させるため、時間的強化された試作機と組み合わせられる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:05:56 GMT)
Rethinking Retrieval-Augmented Generation for Medicine: A Large-Scale, Systematic Expert Evaluation and Practical Insights [42.2] 大きな言語モデル(LLM)は医学の風景を変えつつある。
Retrieval-augmented Generation (RAG) はこれらの制限に対処するために広く採用されている。
今回,医学におけるRAGの総合的評価について紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:00:12 GMT)
Unlocking early fault-tolerant quantum computing with mitigated magic dilution [42.0] 我々は小角回転の合成手法として緩和魔法希釈(MMD)を導入する。
この研究は、数百万の量子演算をサポートするデバイス上での早期フォールトトレラントなデモの道を開いた。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:46:52 GMT)
Beyond English: Toward Inclusive and Scalable Multilingual Machine Translation with LLMs [41.5] 大規模な言語モデルでは、MMT(Multilingual Machine Translation)が大幅に進歩しているが、幅広い言語カバレッジ、一貫した翻訳品質、英語中心のバイアスは未解決の課題である。
textbfLMTは、中国語と英語を中心としたtextbfLarge-scale textbfMultilingual textbfTranslationモデルである。
LMTは4BモデルがAya-13BとNLLB-54Bモデルを大きく上回り、4Bモデルと同等の言語カバレッジを持つモデル間でSOTA性能を実現している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:54:53 GMT)
Descriptive Image-Text Matching with Graded Contextual Similarity [41.0] 画像とテキストの文脈的類似度を段階的に学習するために,DITMと呼ばれる記述的画像テキストマッチングを提案する。
各文の記述性スコアを累積項の周波数逆文書頻度(TF-IDF)で定式化し、両者の相似性をバランスさせる。
本手法は文記述性を利用して,2つの重要な方法で堅牢な画像テキストマッチングを学習する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:05:30 GMT)
Error exponents of quantum state discrimination with composite correlated hypotheses [40.8] 2組の量子状態間の量子仮説試験における誤差指数について検討する。
量子ホーフディングの発散と反発散の2つの自然な拡張を量子状態の集合に導入し比較する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:14:48 GMT)
Data-Centric Elastic Pipeline Parallelism for Efficient Long-Context LLM Training [40.7] Elastic Pipeline Parallelism (EPP)は、トークンレベルのPPとバッチレベルのPPをオーケストレーションして、リソースとワークロードの不均一性に適応する。
InfiniPipeは最先端システムの1.69倍の高速化を実現している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:27:38 GMT)
Grounding Computer Use Agents on Human Demonstrations [40.7] GroundCUAは、専門家による人間のデモから構築された大規模なデスクトップグラウンドデータセットである。
12のカテゴリにわたる87のアプリケーションをカバーし、56Kのスクリーンショットを含む。
GroundCUAを用いて、ターゲットUI要素に命令をマッピングするモデルのFundNextファミリを開発する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:35:21 GMT)
Lightweight Time Series Data Valuation on Time Series Foundation Models via In-Context Finetuning [40.5] 時系列基礎モデル (TSFM) は,多種多様な時系列データに事前訓練を施すことにより,その能力の向上を実証している。
本稿では, TSFMS 上での軽量時系列評価であるLTSV を提案する。
LTSVは、管理可能な計算要求を維持しつつ、信頼性と高い評価性能を一貫して提供することを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:06:46 GMT)
Trading Vector Data in Vector Databases [40.5] オンライン学習では,販売者が不確実な検索コストに直面し,購入者が投稿した価格にフィードバックを提供する。
1)構成学習における不均一な部分的フィードバック,(2)価格学習における変数的および複雑なフィードバック,(3)構成と価格決定の間の固有の結合である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:20:32 GMT)
Omni-View: Unlocking How Generation Facilitates Understanding in Unified 3D Model based on Multiview images [40.5] OmniViewは、マルチビュー画像に基づく3Dシーンの統一的な理解と生成を拡張している。
シーン理解、新しいビュー合成、幾何学的推定を共同でモデル化し、3Dシーン理解と生成タスク間の相乗的相互作用を可能にする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:44:48 GMT)
Does TabPFN Understand Causal Structures? [40.2] 本研究では,TabPFNが内部表現に因果情報をエンコードするかどうかを検討する。
学習可能なデコーダと因果トークンを用いたアダプタフレームワークを開発した。
評価の結果,TabPFNの埋め込みには因果情報が含まれており,従来の因果発見アルゴリズムよりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:53:15 GMT)
Sampling and Loss Weights in Multi-Domain Training [39.9] 各ドメインがバッチにどの程度貢献するかを制御するサンプリングウェイトと、トレーニング中に各ドメインの損失を拡大するロスウェイトという2種類の重みについて検討する。
まず、勾配降下(SGD)のような反復的手法における勾配推定のばらつきを減らすことができる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:08:53 GMT)
Condensed Data Expansion Using Model Inversion for Knowledge Distillation [39.8] 本稿では,モデルインバージョンを用いた縮合データセットの拡張手法を提案する。
凝縮したサンプルを補完する合成データを作成することにより、トレーニングセットを充実させ、基礎となるデータ分布をよりよく近似する。
本手法は, 凝縮データセットのみを用いた場合と比較して, KD精度が著しく向上したことを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:52:04 GMT)
Not Only Consistency: Enhance Test-Time Adaptation with Spatio-temporal Inconsistency for Remote Physiological Measurement [39.7] 遠隔計測(Remote Measurement, RPM)は非接触装置を用いて生理的信号をモニタリングするための有望な非侵襲的手法として登場した。
本稿では,本研究におけるRPMタスクに適した完全テスト時間適応(TTA)戦略を提案する。
本稿では,知識に基づく自己指導型textbfonsistency-textbfintextbfConsistency-textbfintegration (textbfCiCiCi) フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:12:47 GMT)
Which Similarity-Sensitive Entropy? [39.2] 我々はLCRとVSが桁違いに異なる可能性を示し、システムに関する補完的な情報をキャプチャできることを示した。
より基本的な ur-elements'' の線形結合として要素を解釈する場合や,システムやデータセットが量子力学特性を持つ場合のみ,VS が望ましいと結論づける。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:32:16 GMT)
SCOPE: Intrinsic Semantic Space Control for Mitigating Copyright Infringement in LLMs [39.1] SCOPEはパラメータ更新や補助フィルタを必要としない推論時間法である。
著作権に敏感なサブスペースを特定し、デコード時にそのアクティベーションを切断する。
広く知られるベンチマークの実験は、SCOPEが汎用性を低下させることなく著作権侵害を軽減していることを示している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:53:07 GMT)
Universal Spectral Tokenization via Self-Supervised Panchromatic Representation Learning [39.1] 連続した科学的データは、多くの解像度と領域にまたがり、それらを共通の表現に統一することは、科学の基礎モデルを開発するための重要なステップである。
ヘテロジニアススペクトルを自己監督的に学習する深層学習モデルを提案する。
初めて、単一のモデルが、解像度と領域をまたいだスペクトルデータを統一できることを実証した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:51:19 GMT)
Beyond Observations: Reconstruction Error-Guided Irregularly Sampled Time Series Representation Learning [38.9] iTimERはISTS表現学習のための自己教師型フレームワークである。
観測されていないタイムスタンプをノイズ対応トレーニングターゲットに変換し、意味のある再構築信号を可能にする。
iTimERは、ISTS設定下での最先端メソッドを一貫して上回る。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:53:10 GMT)
General Signal Model and Capacity Limit for Rydberg Quantum Information System [37.8] Rydberg原子受信機は、高感度、ブロードバンド、無線周波数(RF)受信を実現するための変換アプローチである。
既存のRydberg原子レシーバーの静的信号モデルは、原子量子状態の定常的な仮定に依存している。
本稿では,Rydberg原子受信機の動的信号応答を閉形式で計算する一般モデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:34:58 GMT)
Dynamics-Decoupled Trajectory Alignment for Sim-to-Real Transfer in Reinforcement Learning for Autonomous Driving [37.6] 強化学習(RL)はロボット工学において有望だが、実際の車両にRLを配備することは依然として難しい。
タイヤ特性、路面条件、空力障害、車両負荷などの要因により、実世界の力学を正確にモデル化することは不可能である。
本研究では,移動計画と車両制御を空間的・時間的アライメント戦略で分離する枠組みを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:45:24 GMT)
SpatialThinker: Reinforcing 3D Reasoning in Multimodal LLMs via Spatial Rewards [37.4] 構造的空間接地と多段階推論を統合するためにRLで訓練された3D対応MLLMであるSpatialThinkerを紹介する。
このモデルは,タスク関連オブジェクトと空間関係のシーングラフを構築し,密集した空間報酬による回答への推論を行うことにより,人間のような空間知覚をシミュレートする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:52:47 GMT)
DTTNet: Improving Video Shadow Detection via Dark-Aware Guidance and Tokenized Temporal Modeling [37.3] ビデオシャドウ検出は、複雑な背景からの影の識別と、様々な照明下での動的影の変形のモデル化という2つの困難に直面している。
影と背景のあいまいさに対処するために,提案したビジョンマッチングモジュール(VMM)とDark-Aware Semantic Block(DSB)を通して言語的先行性を活用する。
時間変動影形状に対して,時間的学習を分離するTokenized Temporal Block (TTB)を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:18:26 GMT)
LeCoT: revisiting network architecture for two-view correspondence pruning [37.3] 2ビュー対応プルーニングは、初期からの誤った対応(外部)を正確に除去することを目的としている。
現在の一般的な戦略は多層パーセプトロン(MLP)をバックボーンとして採用している。
余分な設計モジュールを使わずにコンテキスト情報をキャプチャするための新しい視点を導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:08:15 GMT)
Lassoed Forests: Random Forests with Adaptive Lasso Post-selection [36.2] 理論上,標準およびラッソ重み付きランダム林の相対的な性能は信号対雑音比に依存することを示す。
適応重み付けを適用し,ランダム林とラッソ選別を組み合わせた統合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:39:09 GMT)
Generalized Security-Preserving Refinement for Concurrent Systems [36.1] 本稿では,IFS特性が実装と抽象化の間に保持されていることを証明するための改良型合成手法を提案する。
我々は,セキュリティポリシーの収集に対する2つの非保存ケーススタディを検証するために,我々のアプローチを適用した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:06:01 GMT)
RobustA: Robust Anomaly Detection in Multimodal Data [36.1] 実世界のマルチモーダルデータは、予期せぬ環境歪みのためにしばしば破損する。
本研究は,マルチモーダル異常検出タスクにおける劣化モードの悪影響を包括的に調査する第一種研究である。
本稿では, 破損したモダリティに対して顕著なレジリエンスを示すマルチモーダル異常検出法を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:22:33 GMT)
Skill Path: Unveiling Language Skills from Circuit Graphs [35.9] 本稿では, 分解, 刈り取り, 刈り取り後の因果仲裁からなる3段階の枠組みを提案する。
特に、変換器モデルを完全に線形分解し、不整合グラフを導出する。
本稿では,3つの汎用言語スキルについて検討する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:10:28 GMT)
A Diffusion Model to Shrink Proteins While Maintaining Their Function [35.6] SCISORは、配列から文字を削除し、自然界で見られるものに似たタンパク質サンプルを生成する新しい離散拡散モデルである。
SCISORは、自然配列にランダムな挿入を追加するフォワードノイズ発生過程を逆転するようにデノイズを訓練する。
評価において、SCISORはProteinGymに対する欠失の機能的効果の最先端の予測を達成している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:46:24 GMT)
Contextual Linear Optimization with Partial Feedback [35.4] 本研究では,異なるタイプのフィードバックを持つ文脈線形最適化(CLO)のためのオフライン学習アルゴリズムのクラスを提案する。
我々は,IERMに対して,不特定モデルクラスとフレキシブルな推定方法の選択を可能にする,新しい高速遅延境界を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 00:35:15 GMT)
Selecting Auxiliary Data via Neural Tangent Kernels for Low-Resource Domains [35.3] 大規模言語モデル(LLM)は広範囲にわたるタスクで大きな成功を収めていますが、データ不足と過度に適合するリスクが高いため、低リソース領域での適用は依然として大きな課題です。
我々は、一般的なドメイン補助データを選択して、ニューラルネットワーク(NTK)を介してドメイン固有のパフォーマンスを高めるための、原則的で効率的なフレームワークであるtextbfNTK-Selectorを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:41:23 GMT)
Rethinking Text-based Protein Understanding: Retrieval or LLM? [35.3] タンパク質テキストモデルは、タンパク質の生成と理解において大きな注目を集めている。
現在のアプローチでは、タンパク質関連の知識を、継続した事前学習とマルチモーダルアライメントを通じて、大きな言語モデルに統合することに重点を置いている。
そこで本研究では,タンパク質間テキスト生成のための微調整LDMを著しく上回り,学習不要シナリオにおける精度と効率性を示す検索強化手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:48:28 GMT)
Boosting Fine-Grained Urban Flow Inference via Lightweight Architecture and Focalized Optimization [35.1] 適応最適化でアーキテクチャ効率を相乗化するための統合ソリューションを提案する。
PLGFは、Progressive Local-Global Fusion戦略を採用した軽量で強力なアーキテクチャである。
DualFocal Lossは、二重空間の監視と難易度対応の集中機構を統合する新しい機能である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:38:26 GMT)
Robust Hallucination Detection in LLMs via Adaptive Token Selection [35.1] 大きな言語モデル(LLM)の幻覚は、より広範なデプロイメントを妨げる重要な安全性上の懸念を引き起こす。
本研究では,適応的選択とクリティカルトークンの学習を通じて,幻覚の堅牢な検出を可能にする新しいアプローチであるHaMIを提案する。
本研究では,ハロシン化検出タスクの革新的な定式化により,このロバスト性を実現する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:06:04 GMT)
Diffusion Implicit Policy for Unpaired Scene-aware Motion Synthesis [35.0] 本研究では,シーン認識動作合成のための統合フレームワークDIPを提案する。
トレーニング中の動作合成から人間とシーンのインタラクションを遠ざけるとともに、推論中の動作拡散に対話に基づく暗黙のポリシーを導入する。
以上の結果から,本フレームワークは最先端手法よりも動作の自然性や相互作用の可視性が高いことが示された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:11:29 GMT)
Breaking the Gradient Barrier: Unveiling Large Language Models for Strategic Classification [34.7] In-context Learningに基礎を置いた勾配のないSC法GLIMを紹介する。
GLIMはSCの典型的な二段階最適化プロセスを暗黙的にシミュレートする。
我々はGLIMが事前訓練されたLSMをサポートし、幅広い戦略的な操作に適応できることを証明した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:30:09 GMT)
FreqGRL: Suppressing Low-Frequency Bias and Mining High-Frequency Knowledge for Cross-Domain Few-Shot Learning [34.4] ドメイン間数ショット学習は、ドメインシフトの大きな条件下で、いくつかのラベル付き例しか持たない新しいクラスを認識することを目的としている。
近年のアプローチでは、限られた量のラベル付きターゲットドメインデータを活用して性能を向上している。
本稿では、この問題を分析し、2つの重要な課題を特定するために、最初の周波数空間の視点を示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:56:09 GMT)
Beyond Boundaries: Leveraging Vision Foundation Models for Source-Free Object Detection [34.3] Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースに制限されたオブジェクト検出器をターゲットドメインに適応することを目的としている。
ヴィジョン・ファンデーション・モデル(VFM)は、大規模で多様なデータに基づいて事前訓練され、強力な知覚能力と広範な一般化を示す。
本稿では,VFMを外部知識源として活用し,特徴アライメントとラベル品質を協調的に向上する新しいSFODフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:06:01 GMT)
Omni-AVSR: Towards Unified Multimodal Speech Recognition with Large Language Models [34.2] 大規模言語モデル(LLM)は、最近、複数のモーダルをまたいだ音声認識において、印象的な成果を上げている。
Omni-AVSRは,マルチグラニュラリティ学習とパラメータ効率の両立を両立した統合型音声視覚LLMである。
LRS2 と LRS3 の実験では、Omni-AVSR は最先端のベースラインと同等または優れた精度で達成されている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:03:44 GMT)
Robot Learning from a Physical World Model [33.9] 本稿では,ビデオ生成から物理世界モデリングによるロボット学習を実現するフレームワークであるPhysWorldを紹介する。
様々な実世界のタスクの実験により、PhysWorldは以前のアプローチに比べて操作精度を大幅に改善した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:59:07 GMT)
ReQISC: A Reconfigurable Quantum Computer Microarchitecture and Compiler Co-Design [33.8] 再構成可能な量子命令セットコンピュータ(ReQISC)の概念を導入する。
SU(4)の表現性と、下層のマイクロアーキテクチャによって実現された時間最小性を活用することにより、SU(4)ベースのISAは顕著な性能を達成する。
エンドツーエンドコンパイラでサポートされているReQISCは、従来のCNOT-ISA、SOTAコンパイラ、パルス実装よりも優れている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:19:30 GMT)
Generating an Image From 1,000 Words: Enhancing Text-to-Image With Structured Captions [33.4] 我々は、長文の字幕上で、最初のオープンソーステキスト・ツー・イメージモデルを訓練する。
長いキャプションを効率的に処理するために,DimFusionを提案する。
また,テキスト・アズ・ア・ブートネック・コンストラクション(TaBR)の評価プロトコルについても紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:25:25 GMT)
Learning from N-Tuple Data with M Positive Instances: Unbiased Risk Estimation and Theoretical Guarantees [33.2] 弱教師付き学習はしばしばラベルよりも粗い集約信号で機能する。
学習可能な未バイアスリスク推定器 (URE) をインスタンス生成プロセスと潜在限界値にリンクすることで, カウントが許容できることを示す。
我々は,理論上は基礎的かつ事実上安定的な目標設定によって,カウントオンリーの監視を効果的に活用できることを実証した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:41:24 GMT)
LLMCARE: early detection of cognitive impairment via transformer models enhanced by LLM-generated synthetic data [32.7] アルツハイマー病と関連する認知症は、米国で500万人近い高齢者に影響を及ぼす。
本研究は,トランスフォーマー埋め込みと手作り言語的特徴を融合した音声ベースのスクリーニングパイプラインを開発し,評価する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:23:49 GMT)
Privacy on the Fly: A Predictive Adversarial Transformation Network for Mobile Sensor Data [32.4] 本稿では,歴史的信号を利用したリアルタイムなプライバシ保護フレームワークを提案し,対人的摂動を積極的に生成する。
2つのデータセットの実験では、PATNはプライバシ推論モデルのパフォーマンスを著しく低下させる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:57:17 GMT)
Automated Estimation of Anatomical Risk Metrics for Endoscopic Sinus Surgery Using Deep Learning [31.9] Keros、Gera、Thai-Malaysia-Singaporeのような解剖学的リスクスコアは標準化されたアプローチを提供するが、冠動脈CTやCBCTスキャンで手動で測定する必要がある。
本稿では,これらのリスクスコアを,熱マップ回帰による重要な解剖学的ランドマークの局在化によって推定する,自動ディープラーニングパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:28:02 GMT)
Continual Pre-training of MoEs: How robust is your router? [31.8] Mixture of Experts (MoE) トランスフォーマーは、基礎モデルのための有望なアーキテクチャである。
MoEは、トレーニング時のサンプル効率の改善と、より強力なパフォーマンスの恩恵を受ける。
完全再学習したMoEの性能を,MoEのコストのごく一部で一致させることができることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:32:48 GMT)
$μ$LO: Compute-Efficient Meta-Generalization of Learned Optimizers [31.6] 学習者(LO)は、ニューラルネットワークのウォールタイムトレーニング時間を著しく短縮する可能性がある。
彼らはメタトレーニングで見られるものよりも広いネットワークをトレーニングする場合、目に見えないタスクを最適化するのに苦労する。
我々は,$mu$-parameterized LOsのための簡単なメタトレーニングレシピを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:46:07 GMT)
MRT: Learning Compact Representations with Mixed RWKV-Transformer for Extreme Image Compression [31.4] よりコンパクトな1次元潜在表現に画像をエンコードするMixed RWKV-Transformer (MRT) アーキテクチャを提案する。
MRTは各画像を固定サイズのウィンドウに分割し、RWKVモジュールを使用してウィンドウ間のグローバルな依存関係をキャプチャし、Transformerブロックを使用して各ウィンドウ内のローカルをモデル化する。
圧縮効率をさらに高めるため、専用RWKV圧縮モデル(RCM)を導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:23:00 GMT)
ComoRAG: A Cognitive-Inspired Memory-Organized RAG for Stateful Long Narrative Reasoning [30.6] コモラグは、物語的推論は単発の過程ではなく、新しい証拠獲得と過去の知識の融合の間の動的で進化的な相互作用である、という原則を掲げて提案する。
各サイクルにおいて、ComoRAGは新しい探索経路を考案するための探索クエリを生成し、検索した新しい側面の証拠をグローバルメモリプールに統合する。
ComoRAGは、グローバルなコンテキスト理解を必要とする複雑なクエリに対して特に有利である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:47:01 GMT)
The Value of Personalized Recommendations: Evidence from Netflix [30.6] 我々は、レコメンデーションによって誘導されるユーティリティ、低ランクの不均一性、フレキシブルな状態依存を組み込む個別選択モデルを構築します。
推薦アルゴリズムが導入した慣用的変動を利用して、これらの成分を識別し、別々に評価する。
その結果,現行の推薦システムを行列係数化や人気度に基づくアルゴリズムに置き換えることで,エンゲージメントの4%と12%の削減が期待できることがわかった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:27:01 GMT)
KVLink: Accelerating Large Language Models via Efficient KV Cache Reuse [30.5] KVLinkは、大規模言語モデル(LLM)における効率的なキー値(KV)キャッシュ再利用のためのアプローチである。
KVLinkは、連結後のグローバルな位置と一致するように、推論時にKVキャッシュの位置埋め込みを調整することと、自己注意を回復するためにトレーニング可能な特別なトークンを使用することである。
7つのデータセットにわたる実験によると、KVLinkは最先端の手法よりも平均4%の精度で質問応答を改善する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 00:11:57 GMT)
Have We Really Understood Collaborative Information? An Empirical Investigation [30.4] 協力的な情報はレコメンデーションシステムの基盤となる。
我々は,項目共起パターンの観点から協調情報を明確化し,その特徴を同定し,定量的な定義を提示する。
次に,複数の側面から協調情報の分布を推定し,協調情報が実際にどのように構成されているかを明らかにする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:00:26 GMT)
UAV-Assisted Resilience in 6G and Beyond Network Energy Saving: A Multi-Agent DRL Approach [30.2] 本稿では、6Gネットワーク省エネ(NES)シナリオにおける無人航空機(UAV)によるレジリエンスの視点について検討する。
本稿では,UAV支援通信を実現するために,マルチエージェントのDeep Deterministic Policy Gradient (MADDPG) フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:23:03 GMT)
Likelihood-based Mitigation of Evaluation Bias in Large Language Models [30.0] 大規模言語モデル(LLM)は、自然言語生成タスクを自動メトリクスとして評価するために広く使われている。
LLMが評価に使用される場合、確率バイアスが存在する可能性がある。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:11:10 GMT)
Understanding Representation Dynamics of Diffusion Models via Low-Dimensional Modeling [29.6] 拡散モデルにおける一様表現ダイナミクスの出現について検討する。
この一様性は、ノイズスケールをまたいだデノイング強度とクラス信頼の相互作用から生じる。
分類タスクでは、単調力学の存在は拡散モデルの一般化を確実に反映する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:05:24 GMT)
VADER: Towards Causal Video Anomaly Understanding with Relation-Aware Large Language Models [29.2] ビデオ異常検出のためのLLM駆動型フレームワークであるVADERを提案する。
VADERは、ビデオからの異常な理解を強化するために、オブジェクト機能と視覚的手がかりを統合する。
複数の実世界のVAUベンチマークの実験では、VADERは異常記述、説明、因果推論タスクにまたがって強い結果が得られることを示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:56:11 GMT)
Consistent Story Generation: Unlocking the Potential of Zigzag Sampling [28.8] 非対称なプロンプトとビジュアルシェアリングを備えたZigzag Smplingと呼ばれる新しいトレーニング不要サンプリング戦略を導入する。
提案手法は、非対称なプロンプト間の交互に対象特性を保持するジグザグサンプリング機構を提案する。
本手法は,コヒーレントで一貫した視覚的ストーリーの生成において,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:49:42 GMT)
How Do VLAs Effectively Inherit from VLMs? [28.7] 視覚言語アクション(VLA)モデルは、一般化可能な具体化制御を実現するという約束を持っている。
我々は、絵文字テーブルトップ操作タスクであるGrinningFaceという診断ベンチマークを導入する。
本稿では,パラメータ効率のよい微調整,VLM凍結,協調学習,離散化動作の予測,潜伏動作の予測の効果について検討する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:58:02 GMT)
Harnessing Sparsification in Federated Learning: A Secure, Efficient, and Differentially Private Realization [28.5] フェデレートラーニング(FL)は、複数のクライアントが、生データの代わりに集約のための勾配更新のみを共有することで、モデルを共同でトレーニングすることを可能にする。
通信効率,セキュア,および微分プライベートなFLのための新しいシステムフレームワークであるCloverを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:10:48 GMT)
A Closer Look at Knowledge Distillation in Spiking Neural Network Training [28.5] スパイキングニューラルネットワーク(SNN)は、優れたエネルギー効率のため人気を博しているが、効果的なモデルトレーニングの課題に直面している。
近年の研究では,教師として,学生として対象のSNNを用いて,知識蒸留(KD)技術を導入して,これを改善している。
これは一般的に、ANNとSNNの中間機能と予測ロジットを直列に並べることで実現され、アーキテクチャ間の固有の違いを無視することが多い。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:51:31 GMT)
Sparse4DGS: 4D Gaussian Splatting for Sparse-Frame Dynamic Scene Reconstruction [28.4] スパースフレーム動的シーン再構成のための最初の手法であるスパース4DGSを提案する。
疎フレーム環境下での標準空間と変形空間の両方で動的再構成法が失敗するのを観察する。
提案手法は,NeRF-Synthetic, HyperNeRF, NeRF-DS, およびiPhone-4Dデータセット上で, 既存の動的, 少数ショット技術より優れている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:10:43 GMT)
Minimizing Breaking Changes and Redundancy in Mitigating Technical Lag for Java Projects [28.3] DepUpdaterはバージョンアップグレードのバランスを保ち、技術的遅延を減らし、互換性を確保し、冗長な依存関係を回避する。
既存の依存性管理ツールと比較すると、DepUpdaterは互換性を確保し、冗長な依存関係を刈取しながら、技術的遅延をより効果的に削減している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:43:46 GMT)
A Lightweight Complex-Valued Deformable CNN for High-Quality Computer-Generated Holography [28.2] 深層学習法はコンピュータホログラフィー(CGH)において重要な役割を担っている
本稿では、ネットワークへの統合のための変形可能な畳み込みを設計し、畳み込みカーネルの形状を動的に調整し、ERFの柔軟性を向上させる。
提案手法は,シミュレーションおよび光学実験の再現において,最先端性能を達成しつつ,一つのモデルを利用することを可能にする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:51:46 GMT)
4DSTR: Advancing Generative 4D Gaussians with Spatial-Temporal Rectification for High-Quality and Consistent 4D Generation [28.1] 本研究では,空間的時間的補正により生成する4次元ガウス散乱を変調する4DSTRと呼ばれる新しい4D生成ネットワークを提案する。
実験の結果,4DSTRは映像から4Dまでの性能を向上し,再現性,空間的時間的整合性,迅速な時間的動きへの適応性に優れていた。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:57:03 GMT)
E2E-VGuard: Adversarial Prevention for Production LLM-based End-To-End Speech Synthesis [27.9] ボイスクローニング詐欺のような悪意ある悪用は、深刻なセキュリティリスクを引き起こす。
E2E-VGuardは、2つの新興脅威に対する積極的な防御フレームワークである。
音色保護のために,特徴抽出器を備えたエンコーダアンサンブルを用いる。
我々は精神音響モデルを導入し、摂動的不感を確実にする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:38:53 GMT)
FedAdamW: A Communication-Efficient Optimizer with Convergence and Generalization Guarantees for Federated Large Models [27.7] AdamWは、大規模なモデルをトレーニングするための最も効果的な一般化の1つになった。
我々は、様々な大規模モデルのトレーニングと微調整を行うために、textttFedAdamWと呼ばれる最初のアンダーラインAdamWアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:37:40 GMT)
ConeGS: Error-Guided Densification Using Pixel Cones for Improved Reconstruction with Fewer Primitives [27.6] 3D Gaussian Splattingは、新しいビュー合成における最先端の画像品質とリアルタイム性能を実現する。
問題は、既存の幾何学に沿ってガウスを伝播させるクローンベースの密度化に起因している。
本研究では,既存のシーン形状に依存しない画像空間インフォームド・デンシフィケーション・フレームワークであるConeGSについて述べる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:54:58 GMT)
Real-to-Sim Robot Policy Evaluation with Gaussian Splatting Simulation of Soft-Body Interactions [27.2] 本稿では,現実の映像からソフトボディのディジタルツインを構築するための,リアル・トゥ・シミュレート・ポリシー評価フレームワークを提案する。
我々は,ぬいぐるみのパッキング,ロープルーティング,Tブロックプッシュなど,代表的な変形可能な操作タスクに対するアプローチを検証する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:28:23 GMT)
A Fully Polynomial-Time Algorithm for Robustly Learning Halfspaces over the Hypercube [26.8] ハイパーキューブ上の一様分布に関して、ハーフスペースを学習するための最初のフルタイムアルゴリズムを与える。
誤り保証は$etaO(1)+epsilon$で、$eta$はノイズレートです。
より一般的に、我々のフレームワークは、個別分布に関する教師あり学習が以前考えられていたほど難しくないことを示している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:58:41 GMT)
Mufu: Multilingual Fused Learning for Low-Resource Translation with LLM [26.8] 自動生成された多言語候補の選択と、プロンプト内の不正確な翻訳を補正する命令を含む。
Mufuは、翻訳タスクをポストされたタスクに変換する。
Flores-200データセット上でのEn-XX翻訳実験により,Museスタイルのプロンプトに対して微調整されたLLMは,高品質な補助翻訳候補に対して堅牢であることが示された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:19:35 GMT)
ReCode: Updating Code API Knowledge with Reinforcement Learning [26.6] 大規模言語モデル(LLM)は、外部ライブラリAPIの頻繁な更新に適応する際には、優れたコード生成機能を示す。
ReCodeは,APIの変更に対するプログラマの適応を模倣する新しいフレームワークである。
我々の実験は、ReCodeが動的APIシナリオにおけるLLMのコード生成性能を大幅に向上させることを示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:49:41 GMT)
GroupRank: A Groupwise Reranking Paradigm Driven by Reinforcement Learning [26.6] Groupwiseは、大規模な言語モデルのための新しいパラダイムである。
高品質な検索とランキングデータのための革新的なパイプラインを提案する。
得られたデータは、リランカのトレーニングだけでなく、レトリバーのトレーニングにも利用することができる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:25:31 GMT)
Distilling Diversity and Control in Diffusion Models [26.2] 蒸留拡散モデルは、はるかに少ない時間ステップで画像を生成するが、同じプロンプトから複数の出力を生成する際にサンプルの多様性が低下する。
本研究は, 蒸留モデルに切り替える前に, 最初の臨界時間段階のみに基本モデルを用いたハイブリッド手法である多様性蒸留を導入する。
蒸留モデルにおいて,最初の段階が多様性のボトルネックに集中する理由を示す因果検証と理論的支援の両方を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:36:25 GMT)
EditGRPO: Reinforcement Learning with Post-Rollout Edits for Clinically Accurate Chest X-Ray Report Generation [26.2] 放射線学レポート生成には、高度な医用画像解析、効果的な時間的推論、正確なテキスト生成が必要である。
本稿では,臨床動機による報酬生成を最適化する混合政治強化学習アルゴリズムであるEditGRPOを紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:42:57 GMT)
FoCLIP: A Feature-Space Misalignment Framework for CLIP-Based Image Manipulation and Detection [25.8] 我々は,CLIPベースの画像品質指標を騙す機能空間の誤調整フレームワークである textbfFoCLIP を提案する。
FoCLIPは3つの重要なコンポーネントを統合して、ばかげた例を構築する。
10の芸術的傑作プロンプトとImageNetサブセットの実験では、最適化されたイメージがCLIPscoreで大幅に改善できることが示されている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:54:35 GMT)
Nearly-Optimal Private Selection via Gaussian Mechanism [25.8] 指数的機構の$(log log |mathcalY|)O(1)$の係数内にある$tildeO(log |mathcalY|)$の誤差を保証する。
これは、$O(log3/2 |mathcalY|)$の誤差を達成するスタインケのメカニズムを改善する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:17:33 GMT)
PyLO: Towards Accessible Learned Optimizers in PyTorch [25.6] 私たちはPyTorchベースのライブラリであるPyLOを紹介します。
私たちのリリースには、aMacceleratedバージョンのsmall_fclopt学習アーキテクチャ(aetz et al., 2022)が含まれています。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:14:05 GMT)
MPJudge: Towards Perceptual Assessment of Music-Induced Paintings [25.1] 音楽誘導絵画はユニークな芸術的実践であり、視覚芸術は音楽の影響下で創造される。
本稿では,音楽と視覚芸術の知覚的コヒーレンスを直接モデル化する,音楽誘発絵画評価のための新しい枠組みを提案する。
本稿では,変調に基づく融合機構を用いて,音楽特徴を視覚エンコーダに統合するモデルMPJudgeを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:18:27 GMT)
RedOne 2.0: Rethinking Domain-specific LLM Post-Training in Social Networking Services [25.0] ソーシャルネットワークサービス(SNS)は、大規模言語モデル(LLM)に固有の課題をもたらす
我々は、高速で安定した適応のために設計された、プログレッシブでRL優先のポストトレーニングパラダイムで訓練されたSNS指向のLLMであるRedOne 2.0を紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:04:34 GMT)
Pralekha: Cross-Lingual Document Alignment for Indic Languages [24.9] ドキュメントアライメント係数(DAC)は、きめ細かいドキュメントアライメントのための新しい計量である。
プールベースの手法とは異なり、DACは小さなチャンクをマッチングして文書を整列し、一対の平均チャンク数に対する整列チャンクの比率として類似性を計算する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:02:30 GMT)
Routing Manifold Alignment Improves Generalization of Mixture-of-Experts LLMs [24.8] ルーティング重みの多様体をタスク埋め込みの多様体と整合させることで、このギャップを効果的に軽減できることを示す。
実験では,RoMAを用いてOLMoE,DeepSeekMoE,Qwen3-MoEのルータを微調整する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:59:53 GMT)
C3PO: Optimized Large Language Model Cascades with Probabilistic Cost Constraints for Reasoning [24.7] 大規模言語モデル(LLM)は複雑な推論タスクにおいて印象的な結果を得たが、その高い推論コストは、現実世界のデプロイメントにとって大きな障壁であり続けている。
既存のカスケード法はラベル付きデータによる教師付きトレーニングに依存しており、理論的一般化の保証は提供せず、テスト時間計算コストの制限も与えている。
確率的コスト制約の下でLLMカスケードを最適化するための自己教師型フレームワークであるC3POを紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:50:27 GMT)
Bidirectional Image-Event Guided Fusion Framework for Low-Light Image Enhancement [24.6] 極端に低照度な条件下では、フレームベースのカメラは、ダイナミックレンジの制限により、細部が著しく失われる。
近年の研究では、イベント誘導型低照度画像強調のためのイベントカメラが導入されている。
低光画像強調のための双方向画像イベント誘導融合フレームワークBiLIEを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:47:02 GMT)
MedVoiceBias: A Controlled Study of Audio LLM Behavior in Clinical Decision-Making [24.5] 大規模言語モデルは、テキストベースのインターフェースから臨床環境でのオーディオインタラクションへ移行する。
我々はこれらのモデルを170の症例で評価し、それぞれ36の異なる音声プロファイルから音声に合成した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 00:44:37 GMT)
PlanT 2.0: Exposing Biases and Structural Flaws in Closed-Loop Driving [24.4] 我々は、CARLAにおける自律運転研究用に設計された軽量でオブジェクト中心の計画変換器PlanTを紹介する。
CARLA Leaderboard 2.0が新たに導入したシナリオに対処するため、PlanTに複数のアップグレードを導入しました。
私たちは、よりリッチで堅牢でバイアスの少ないデータセットに焦点を当てた、データ中心の開発へのシフトを主張します。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:41:47 GMT)
scUnified: An AI-Ready Standardized Resource for Single-Cell RNA Sequencing Analysis [24.0] 我々は、シングルセルRNAシークエンシングデータのための、AI対応の標準リソース scUnified を提案する。
scUnified Consolided to 13 high-quality datasets across two species and 9 tissue types。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:55:13 GMT)
CAST-LUT: Tokenizer-Guided HSV Look-Up Tables for Purple Flare Removal [24.0] 分離されたHSVルックアップテーブル(LUT)上に構築された新しいネットワークを提案する。
本手法は,Hue (H), Saturation (S), Value (V)コンポーネントを独立に調整することで,色補正を簡略化することを目的とする。
我々のモデルは、視覚効果において既存の手法を著しく上回るだけでなく、あらゆる定量的指標に対して最先端のパフォーマンスも達成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:45:03 GMT)
Multi-Modal Continual Learning via Cross-Modality Adapters and Representation Alignment with Knowledge Preservation [23.7] 獲得した知識を維持しながら、新しいタスクにモデルを適用するためには、継続的な学習が不可欠である。
マルチモーダル連続学習のための事前学習型モデルベースフレームワークを提案する。
我々のアプローチは、クラス・インクリメンタル・ラーニングとドメイン・インクリメンタル・ラーニングの両方において、一貫してベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:33:41 GMT)
Reasoning Planning for Language Models [23.5] 本稿では,コントラスト学習フレームワークであるEPICを紹介する。
EPICは、モデル推論能力とクエリメソッド互換性の両方をキャプチャする共有表現空間を学習する。
多様な数学的推論タスクの実験は、EPICが常に最適な推論方法を選択することを示している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:30:17 GMT)
Improving Contactless Fingerprint Recognition with Robust 3D Feature Extraction and Graph Embedding [23.3] 既存の非接触指紋アルゴリズムは、非接触指紋を2Dプレーン指紋として扱う。
本稿では,接触指紋の3次元特徴を捉える新しい非接触指紋認識アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:02:46 GMT)
SEAGraph: Unveiling the Whole Story of Paper Review Comments [23.3] 従来のピアレビュープロセスでは、著者は曖昧または不十分な詳細なフィードバックを受け取ることが多い。
これにより、著者によるレビューコメントの理解を深める方法について、批判的な疑問が持ち上がる。
提案するSEAGraphは,レビューの意図を明らかにすることによって,レビューコメントを明確にするための新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:10:15 GMT)
DIAL-GS: Dynamic Instance Aware Reconstruction for Label-free Street Scenes with 4D Gaussian Splatting [23.0] ラベルのない街路シーンのための動的インスタンス認識再構築手法であるDIAL-GSを提案する。
まず、歪んだレンダリングと実際の観察との整合性を利用して、動的インスタンスを正確に識別する。
我々は、アイデンティティとダイナミクスが相互に強化され、整合性と整合性の両方が向上する相互機構を導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:18:40 GMT)
Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper [23.0] Jr. AI Scientistは、初心者の学生研究者のコア研究ワークフローを模倣した最先端の自律AI科学者システムである。
実際のNeurIPS、IJCV、ICLRの上に構築された新しい研究論文は、新しい手法を提案し、実装することで動作する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:05:28 GMT)
Enhanced Water Leak Detection with Convolutional Neural Networks and One-Class Support Vector Machine [23.0] 本稿では,新しいリーク検出手法を提案する。
水分配ネットワーク(WDN)の一連のノードで得られた水圧測定に基づく。
提案手法は,非リークデータに基づいてトレーニングされた一級サポートベクトルマシン(SVM)に基づいており,漏洩を異常として検出する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:33:29 GMT)
Retrieval-Augmented Feature Generation for Domain-Specific Classification [23.0] 本稿では,ドメイン分類タスクに特有な有用かつ説明可能な特徴を生成するための検索拡張特徴生成手法であるRAFGを紹介する。
生成した特徴の解釈可能性を高めるため,ドメイン内の既存特徴間の知識検索を行い,潜在的な特徴関連を同定する。
医療、経済、地理的領域におけるいくつかのデータセットを対象とした実験は、我々のRAFG法が高品質で有意義な特徴を生み出すことを示しています。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:45:42 GMT)
Hybrid action Reinforcement Learning for quantum architecture search [22.8] HyRLQASは、離散ゲート配置と連続パラメータ生成を統合する統合フレームワークである。
我々はHyRLQASが低エネルギー誤差とよりコンパクトな回路構造を一貫して達成していることを示す。
これらの結果は、ハイブリッドアクション強化学習が、自動およびハードウェア効率の量子回路設計への原則的な経路を提供することを示唆している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:28:07 GMT)
Loss-Guided Auxiliary Agents for Overcoming Mode Collapse in GFlowNets [22.7] Loss-Guided GFlowNets(LGGFN)は、GFlowNetのトレーニング損失によって、補助的なGFlowNetの探索が直接的にテキスト駆動される新しいアプローチである。
この目的の探査は、多種多様な高解像度サンプルの発見を著しく加速させる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:28:26 GMT)
S-DAG: A Subject-Based Directed Acyclic Graph for Multi-Agent Heterogeneous Reasoning [22.6] 大規模言語モデル(LLM)は複雑な推論問題において顕著な性能を達成した。
本研究では,指定されたマルチエージェント協調戦略を備えた対象レベルできめ細かい分析を行う新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:40:02 GMT)
CaberNet: Causal Representation Learning for Cross-Domain HVAC Energy Prediction [22.6] クロスドメインなHVACエネルギー予測は、スケーラブルな建築エネルギー管理に不可欠である。
本稿では,堅牢なクロスドメイン予測のための不変表現を学習する因果的・解釈可能なディープシーケンスモデルであるCaberNetを提案する。
気候の異なる3つの都市にある3つの建物から収集した実世界のデータセットをCaberNetで評価した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:21:43 GMT)
Deep learning EPI-TIRF cross-modality enables background subtraction and axial super-resolution for widefield fluorescence microscopy [22.2] 深層学習に基づくEPI-TIRFクロスモダリティネットワークET2dNetを開発し,TIRF対応のバックグラウンドサブトラクションと軸超解像を実現する。
また,成果物を再現する専用3次元再構成ネットワークET3dNetを開発した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:52:56 GMT)
Breadcrumbs Reasoning: Memory-Efficient Reasoning with Compression Beacons [22.1] 本稿では,KVキャッシュを学習用専用トークンで周期的に圧縮することを提案する。
我々は, この圧縮を行うために, 改良された共同蒸留および強化学習フレームワークを用いてモデルを訓練する。
本手法は,キャッシュ圧縮のないモデルとトレーニング不要な圧縮技術の両方と比較して,優れたメモリ精度のフロンティアを実現する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 00:06:46 GMT)
VAEVQ: Enhancing Discrete Visual Tokenization through Variational Modeling [22.0] VAEVQは,(1)変分潜時量子化(VLQ),AEを量子化用VOEに置き換えて構造的かつスムーズな潜時空間を活用し,より効率的なコーデックアクティベーションを促進する,(2)表現コヒーレンス戦略(RCS),(2)先行および後列化特徴間のアライメント強度を適応的に調整して整合性を高め,ノイズへの過度適合を防止する,(3)分布整合性正規化(DCR),といった3つの重要なコンポーネントから構成される。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:07:23 GMT)
3D-ANC: Adaptive Neural Collapse for Robust 3D Point Cloud Recognition [22.0] 3D-ANCはニューラル・コラプス(NC)機構を利用して識別的特徴学習を編成する手法である。
3D-ANCは2つのデータセット上の様々な構造を持つモデルのロバスト性を大幅に改善することを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:37:00 GMT)
Fine-Tuning Diffusion-Based Recommender Systems via Reinforcement Learning with Reward Function Optimization [21.8] 拡散モデルは、ユーザ・イテム相互作用の生成過程をモデル化することによって、最先端のパフォーマンスを提供する。
ReFiTはReinforcement Learning(RL)ベースのFin-Tuningを拡散型レコメンデータシステムに統合する新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:38:16 GMT)
BLADE: Benchmarking Language Model Agents for Data-Driven Science [21.7] プランニング、メモリ、コード実行機能を備えたLMベースのエージェントは、データ駆動科学をサポートする可能性がある。
本稿では,エージェントの多面的アプローチを自動的に評価するベンチマークBLADEについて述べる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:38:02 GMT)
Improved Runtime Guarantees for the SPEA2 Multi-Objective Optimizer [21.2] SPEA2 は NSGA-II とは全く異なる集団動態を持つことを示す。
O(nk)$の最高のランタイム保証は、$mu = Theta+1n)$と$lambda = O(nk)$に対してのみ達成されるだけでなく、任意の$muでは、lambda = O(nk)$に対して達成される。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:43:02 GMT)
On Stealing Graph Neural Network Models [21.2] 現在のグラフニューラルネットワーク(GNN)モデルステアリング手法は、被害者モデルに対するクエリに大きく依存している。
本稿では,相手がモデルと非常に限られた相互作用でGNNを抽出する方法を実証する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:01:31 GMT)
MathSE: Improving Multimodal Mathematical Reasoning via Self-Evolving Iterative Reflection and Reward-Guided Fine-Tuning [20.8] マルチモーダル大言語モデル (MLLM) は視覚言語対応タスクにおいて顕著な機能を示した。
これまでの研究は、特殊な数学的データセットの微調整に重点を置いてきた。
メソッドは推論、リフレクション、報酬に基づくフィードバックのサイクルを通じてモデルを反復的に洗練する。
MathVL-testの結果は、主要なオープンソースマルチモーダル数学的推論モデルQVQを上回った。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:46:19 GMT)
Uncovering Pretraining Code in LLMs: A Syntax-Aware Attribution Approach [20.8] オープンソースコードは、しばしばオープンソースライセンスによって保護されるが、事前トレーニングで使用する場合、法的および倫理的な課題を提起する。
コードに適した構文決定型メンバシップ推論攻撃法であるSynPruneを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:29:09 GMT)
Sensitivity Analysis for Climate Science with Generative Flow Models [20.6] 感度分析は気候科学の基盤であり、嵐の強度から長期の気候フィードバックまでの現象を理解するのに不可欠である。
現代のAIベースの生成モデルは、評価が桁違い速くなっているが、それらによる感度分析は依然として重大なボトルネックである。
本研究は、生成フローモデルにおける勾配の計算に随伴状態法を適用することにより、この問題に対処する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:07:41 GMT)
How Bias Binds: Measuring Hidden Associations for Bias Control in Text-to-Image Compositions [20.1] 本研究は,セマンティックバインディング下でのバイアスの出現について検討する。
我々は,特定のオブジェクト-属性結合がどのようにバイアスを活性化するかを定量化するバイアスアテンデンススコアを導入する。
トークンデカップリングがセマンティックバインディングのデバイアス化をいかに促進するかを検討するために,トレーニング不要なコンテキストバイアス制御フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:27:05 GMT)
Hierarchical Spatial-Frequency Aggregation for Spectral Deconvolution Imaging [19.9] 本稿では,高忠実度コンパクト行列設計を実現するための新しいCSI手法を提案する。
SDIに固有のデータ依存演算子に取り組むために、階層型空間スペクトル集約フレームワーク(HSFAUF)を導入する。
さらに、繰り返し改善中の空間スペクトル前処理を統合するために、空間周波数アグリゲーション変換器(SFAT)を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:29:34 GMT)
Calibrating and Rotating: A Unified Framework for Weight Conditioning in PEFT [19.8] DoRA法は重み更新を大きさと方向に分解することで性能を向上させる。
本研究では,重み更新行列の特異値エントロピーを増大させる能力からDoRAの成功が導かれることを確かめる。
我々は、DoRAを数学的に等価で効率的な行列形式に再構成し、学習可能な重み条件付け法として明らかにした。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:39:41 GMT)
Multi-modal Dynamic Proxy Learning for Personalized Multiple Clustering [19.7] 複数のクラスタリングは、さまざまな視点から様々な潜在構造を発見することを目的としている。
既存手法は,ユーザの関心を損なうことなく,網羅的なクラスタリングを生成する。
本稿では,新しいマルチモーダル動的プロキシ学習フレームワークであるMulti-D Proxyを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:21:46 GMT)
Improving Region Representation Learning from Urban Imagery with Noisy Long-Caption Supervision [19.7] 地域表現学習は、未ラベルの都市データから有意義な特徴を抽出することにより、都市コンピューティングにおいて重要な役割を担っている。
近年,Large Language Models (LLMs) を利用して,画像に基づく都市部表現学習にテキスト知識を取り入れることが研究されている。
本稿では,長文認識と騒音抑制による都市部表現学習を改善する,UrbanLNという新しい事前学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:53:32 GMT)
Addressing Polarization and Unfairness in Performative Prediction [19.7] 性能予測解は, 厳密な分極と予測性能の相違をもたらす可能性があり, 従来の公平な介入は, モデル依存の分布シフトでしばしば失敗することを示した。
本稿では, 理論解析と実験結果から, 安定性と公正性の両方を確実に保証する新しい公正性機構を導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:10:10 GMT)
GEWDiff: Geometric Enhanced Wavelet-based Diffusion Model for Hyperspectral Image Super-resolution [19.6] 超解像4回で超スペクトル像を再構成するための新しい枠組みを提案する。
スペクトル空間情報を保存しながら、効率よくHSIを潜在空間に圧縮するウェーブレットベースのエンコーダデコーダが導入された。
本モデルでは, 忠実度, スペクトル精度, 視覚リアリズム, 明度など, 複数次元にわたる最先端の成果を示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:44:16 GMT)
A Theoretical Analysis of Detecting Large Model-Generated Time Series [19.4] データ誤用や製造のリスクが高まっているため、時系列大モデル(TSLM)が生成する合成時系列を識別する問題について検討する。
本研究では, TSLM生成時系列を識別するために, 連続プレフィックス上で不確実性指標を集約するホワイトボックス検出器である不確実性収縮推定器(UCE)を紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:48:48 GMT)
PADiff: Predictive and Adaptive Diffusion Policies for Ad Hoc Teamwork [19.4] アドホックチームワーク(AHT)では、エージェントがこれまで見つからなかったチームメイトと協力する必要がある。
従来のRLベースのアプローチは、1つの期待したリターンを最適化する。
PADiffは、エージェントのマルチモーダルな振る舞いを捉え、チームメイトとの多様な協調モードをアンロックする拡散ベースのアプローチである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:05:40 GMT)
Atomic Consistency Preference Optimization for Long-Form Question Answering [19.2] 大きな言語モデル(LLM)は、しばしばファクトイドの幻覚を生み出します。
一般的な緩和戦略はモデルアライメント(英語版)であり、これは、キュレートされた(実際の、非実の)ペアのトレーニングによって、事実の正確性を改善する。
本稿では,外部の監督なしに現実の精度を向上する自己監督的選好調整手法であるACPOを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:08:26 GMT)
Security-aware Semantic-driven ISAC via Paired Adversarial Residual Networks [19.2] 本稿では,セキュリティ・セマンティック・セマンティック・インテリジェンス・コミュニケーション(ISAC)フレームワーク,すなわちセキュリティ・セマンティックISAC(SS-ISAC)を提案する。
対向攻撃のポジティブな影響に触発され、提案したSS-ISACフレームワークでは、プラグ可能な暗号化モジュールと復号モジュールが設計されている。
SACと盗難防止性能の両面から提案したSS-ISACフレームワークの有効性をシミュレーションにより検証した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:34:08 GMT)
Adversarial Node Placement in Decentralized Federated Learning: Maximum Spanning-Centrality Strategy and Performance Analysis [19.2] フェデレーテッド・ラーニング(FL)が普及するにつれ、その分散型への関心が高まっている。
本稿では、分散化FLモデルの訓練性能における逆ノード配置の役割について述べる。
ネットワークトポロジ特性に基づいてノード配置を確率的に調整する新しい攻撃戦略MaxSpAN-FLを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:09:28 GMT)
Reg-DPO: SFT-Regularized Direct Preference Optimization with GT-Pair for Improving Video Generation [19.1] GT-Pairは、実動画をポジティブとして、モデル生成動画をネガティブとして、高品質な選好ペアを構築する。
また、SFT損失を正規化用語として組み込んだReg-DPOをDPO損失に組み込み、トレーニング安定性と生成精度を高める。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:10:25 GMT)
Discourse Graph Guided Document Translation with Large Language Models [18.9] TransGraphは、構造化された談話グラフを通じてチャンク間の関係を明示的にモデル化する、談話誘導フレームワークである。
翻訳品質と用語の整合性の強いベースラインを一貫して越えつつ、トークンオーバーヘッドを著しく低くする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:48:01 GMT)
Text-to-Pipeline: Bridging Natural Language and Data Preparation Pipelines [18.8] 我々は,NLデータ作成命令をDPパイプラインに変換する新しいタスクであるText-to-Pipelineを紹介する。
Parrotは、体系的な評価をサポートする大規模なベンチマークである。
ParROTは、プロダクションパイプラインから変換パターンをマイニングし、23,009の現実世界のテーブル上でインスタンス化する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:42:35 GMT)
Learning Quantized Continuous Controllers for Integer Hardware [18.7] 組み込みハードウェア上での継続的制御強化学習には、厳密なレイテンシと電力予算が必要である。
小さなFPGAはこれらを提供することができるが、高価な浮動小数点パイプラインが避けられる場合のみである。
本稿では,低ビットポリシーを自動的に選択し,Artix-7 FPGAに合成する学習型ハードウェアパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:39:14 GMT)
REOcc: Camera-Radar Fusion with Radar Feature Enrichment for 3D Occupancy Prediction [18.6] REOccは3次元占有予測のためにレーダー特徴表現を豊かにするために設計されたカメラとレーダーの融合ネットワークである。
提案手法では, 空間情報と文脈情報を統合することにより, レーダ特徴を洗練させるレーダーデンシファイアとレーダ増幅器の2つの主成分を導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:23:52 GMT)
UniADC: A Unified Framework for Anomaly Detection and Classification [18.6] 本稿では,画像中の異常領域を同時に検出し,特定のカテゴリを特定することを目的とした,統一された異常検出・分類の課題を紹介する。
異常検出と分類の統一モデルであるUniADCを提案する。
MVTec-FS,MTD,WFDDを含む3つの異常検出および分類データセットについて広範な実験を行い,UniADCは異常検出,局所化,分類において既存の手法より一貫して優れていることを示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:42:08 GMT)
FedMAC: Tackling Partial-Modality Missing in Federated Learning with Cross-Modal Aggregation and Contrastive Regularization [18.3] Federated Learning(FL)は、分散データソースを使用して機械学習モデルをトレーニングする手法である。
本研究ではFedMACという新しいフレームワークを提案し,FLに欠落した部分モダリティ条件下でのマルチモダリティの解消を図った。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:48:19 GMT)
Enhanced Partially Relevant Video Retrieval through Inter- and Intra-Sample Analysis with Coherence Prediction [18.2] 部分的に関連のあるビデオ検索は、テキストクエリに関連するターゲットビデオを取得することを目的としている。
既存の手法は、セマンティック空間を構築するために、ペア化されたビデオとテキストクエリを粗く整列する。
サンプル間相関とサンプル内冗長性を体系的に活用する新しいPRVRフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:12:42 GMT)
K-Stain: Keypoint-Driven Correspondence for H&E-to-IHC Virtual Staining [18.2] 仮想染色は、ヘマトキシリンおよびエオシン(H&E)画像を免疫組織化学的(IHC)画像に変換するための有望な方法を提供する。
既存の方法は、組織スライスにおける不整合のため、空間情報の有効利用に苦慮することが多い。
K-Stainは、キーポイントに基づく空間的および意味的な関係を利用して、合成したIHC画像の忠実度を向上させる新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:04:59 GMT)
Benchmarking LLMs for Fine-Grained Code Review with Enriched Context in Practice [18.2] ContextCRBenchは、コードレビューにおける詳細なLCM評価のためのベンチマークである。
153.7Kのイシューとトップレベルのリポジトリからのプルリクエストを収集する。
レビューワークフローに沿った3つの評価シナリオをサポートする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:06:35 GMT)
F2RVLM: Boosting Fine-grained Fragment Retrieval for Multi-Modal Long-form Dialogue with Vision Language Model [18.2] きめ細かいフラグメント検索(FFR)は、クエリ関連フラグメントを見つけるためにモデルを必要とするタスクである。
F2RVLMは、2段階のパラダイムで訓練された生成的検索モデルである。
ドメイン内設定と実ドメイン設定の両方で、人気のあるVision-Language Modelよりも優れています。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:33:57 GMT)
Two Heads are Better than One: Distilling Large Language Model Features Into Small Models with Feature Decomposition and Mixture [18.1] 強化学習(RL)による市場形成は、金融取引において大きな注目を集めている。
本稿では,階層,タスク,データという3次元にまたがる大規模言語モデルの特徴を分離する新しいフレームワークを提案する。
様々な学生モデルは、異なる次元と共に単純なLCMの特徴を協調的に学習し、それぞれのモデルは知識蒸留を達成するために異なる特徴に責任を負う。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:57:05 GMT)
Matchings Under Biased and Correlated Evaluations [18.0] 2つの異なるグループからの候補を評価できる2施設の安定マッチングモデルについて検討した。
マッチングプロセスによって選択された不利な候補に対する表現比、すなわち不利な候補の割合について検討する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:00:17 GMT)
Steering LLMs toward Korean Local Speech: Iterative Refinement Framework for Faithful Dialect Translation [18.0] DIA-REFINEはゴール指向の包括的方言翻訳のためのフレームワークである。
本研究では,言語変化を定量化するための方言忠実度スコア (DFS) と,方言翻訳の成功度を測定するためのターゲット方言比 (TDR) を導入する。
我々の研究は、ゴール指向の包括的方言翻訳のための堅牢なフレームワークを確立する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:52:24 GMT)
RaLD: Generating High-Resolution 3D Radar Point Clouds with Latent Diffusion [18.0] ミリ波レーダーは、悪条件の頑丈さと低コストのおかげで、自律システムに対して有望なセンシングモダリティを提供する。
その実用性はレーダーポイント雲の空間性と低解像度によって著しく制限されており、密集した正確な3D知覚を必要とするタスクに課題をもたらす。
本稿では,このギャップを埋めるフレームワークとして,シーンレベルのフラストラムベースのLiDARオートエンコーディング,順序不変の潜在表現,ダイレクトレーダスペクトルコンディショニングを導入して紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:03:58 GMT)
Non-Rival Data as Rival Products: An Encapsulation-Forging Approach for Data Synthesis [17.9] 本稿では,非対称なユーティリティで競合する合成データを生成する新しい手法であるEncapsulation-Forgingフレームワークを提案する。
筆者らのフレームワークは,サンプルの効率を目覚ましいものにし,元のデータの性能をわずかなサイズで一致させる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:42:55 GMT)
Coherence Fraction in Grover Search Algorithm [17.8] エンタングルメントとコヒーレンスはグロバー探索アルゴリズムによって達成された量子的優位性を完全に説明できないことを示す。
また、量子最小化アルゴリズムにおけるコヒーレンス分数の役割についても検討する。
これらの発見は、新しい量子アルゴリズムを開発するための量子優位性とオープンパスの起源に関する洞察を与える。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:29:05 GMT)
Onboard Hyperspectral Super-Resolution with Deep Pushbroom Neural Network [17.8] 衛星上のハイパースペクトル画像装置は、空間分解能の制限を犠牲にして、ある物質と別の物質を区別するために必要な微細なスペクトル信号を得る。
提案するニューラル・ネットワーク設計手法はDeep Pushbroom Super-Resolution (DPSR) と呼ばれるもので,画像線を沿線方向の線で処理し,これまで取得した線を利用する。
この設計は、メモリ要求と計算の複雑さを大幅に制限し、リアルタイムのパフォーマンス、すなわち、次のものを取得するのに要する時間を超解する能力を達成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:03:13 GMT)
HyperSHAP: Shapley Values and Interactions for Explaining Hyperparameter Optimization [17.6] ブラックボックスHPOメソッドは、ユーザの信頼を損なうとともに、採用を阻害する。
本稿では,シャプリー値と相互作用に基づくHPOのゲーム理論的説明可能性フレームワークを提案する。
様々なHPOベンチマークでHyperSHAPの能力を実証し、対応するHPO問題の相互作用構造を解析する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:43:45 GMT)
Cross-Modal Unlearning via Influential Neuron Path Editing in Multimodal Large Language Models [17.6] MLLM(Multimodal Large Language Models)は、テキストやビジョンなどの入力を統合することで、基礎モデルを現実世界のアプリケーションに拡張する。
機械学習のためのマルチモーダル・インフルエンサー・ニューロン・パス・エディター (MIP-Editor) を提案する。
MIP-Editorはマルチモーダルタスクにおいて、最大忘れ率87.75%、一般知識保持率54.26%という優れた未学習性能を達成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:31:20 GMT)
MENTOR: A Metacognition-Driven Self-Evolution Framework for Uncovering and Mitigating Implicit Risks in LLMs on Domain Tasks [17.6] 現在のアライメントの取り組みは、主に偏見、ヘイトスピーチ、暴力のような明確なリスクをターゲットにしている。
本稿では,大規模言語モデルにおける暗黙的リスクの解消と軽減を目的とした,メタ認知駆動型セルフエボリューティオンフレームワークMENTORを提案する。
我々は、ドメイン固有のリスク識別を強化するために、教育、財務、管理にまたがる9000のリスククエリをサポートするデータセットをリリースする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:51:51 GMT)
RareAgents: Autonomous Multi-disciplinary Team for Rare Disease Diagnosis and Treatment [17.6] 希少な病気が世界中で約3億人に影響を与えている。
近年,大規模言語モデル (LLM) を利用したエージェントが,様々な領域にまたがる顕著な応用を実証している。
RareAgentsは、Llama-3.1-8B/70Bをベースモデルとして、MDT(Advanced Multidisciplinary Team)のコーディネーション、メモリメカニズム、医療ツールの利用を統合する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:32:04 GMT)
Distilling 3D distinctive local descriptors for 6D pose estimation [17.5] 本稿では,GeDi教師からローカル記述子を回帰するために,効率的な学生モデルを訓練する知識蒸留フレームワークを提案する。
提案手法を5つのBOPベンチマークデータセットで検証し,推論時間を大幅に短縮することを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:42:43 GMT)
Magnitude-Modulated Equivariant Adapter for Parameter-Efficient Fine-Tuning of Equivariant Graph Neural Networks [17.5] MMEA(Magnitude-Modulated Equivariant Adapter)
本稿では,軽量なスカラーゲーティングを用いて,各次数および多重度に基づいて特徴量の変調を行う新しい等変微調整法を提案する。
その結果、多くの実践シナリオにおいて、チャネルの大きさの変調は、対称性を損なうことなく、新しい化学環境に同変モデルを適用するのに十分であることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:31:56 GMT)
Language Generation with Infinite Contamination [17.3] そこでは,未知のターゲット言語である$K$から文字列の逆列挙をアルゴリズムが観測する。
私たちは、驚くべきことに、密度のある世代は、同じ一般性で達成可能であることを示しています。
これは、カリキュラム学習がノイズの多いWebデータから学ぶために重要であることを示唆している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:59:39 GMT)
Tightening the entropic uncertainty relations with quantum memory in a multipartite scenario [17.3] 3部量子メモリ支援エントロピー不確実性関係を導入する。
我々は,マルチパーティイトシステム内で実施される複数の測定を包含する関係を拡大する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:26:02 GMT)
Explainable Cross-Disease Reasoning for Cardiovascular Risk Assessment from LDCT [17.1] 低用量胸部CT(LDCT)は本質的に肺と心臓の両方の構造を捉えている。
本稿では,LDCTスキャンによる心肺リスクの解釈を可能にする,説明可能なクロスディスリーズ推論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:04:46 GMT)
Free-T2M: Robust Text-to-Motion Generation for Humanoid Robots via Frequency-Domain [17.0] 本稿では周波数領域の観点からT2M問題を再構成する。
本稿では、段階固有の周波数領域の整合性を考慮したフレームワークであるFluquency enhanced text-to-motion(Free-T2M)を紹介する。
大規模な実験により,本手法は動作品質と意味的正しさを劇的に向上させることが示された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:54:26 GMT)
AGO: Adaptive Grounding for Open World 3D Occupancy Prediction [17.0] AGOは、さまざまなオープンワールドシナリオを扱うための適応的な基盤を備えた、新しい3D占有予測フレームワークである。
モダリティアダプタは、VLM由来の画像埋め込みと整合した空間に3D埋め込みをマッピングし、モダリティギャップを低減する。
Occ3D-nuScenesの実験では、AGOはゼロショットおよび少数ショット転送において未知のオブジェクト予測を改善する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:14:04 GMT)
Rethinking Crystal Symmetry Prediction: A Decoupled Perspective [16.9] XRDecouplerは、サブプロパティ混乱SPC問題に対処するために特別に設計された問題解決用兵器である。
我々は,多次元結晶対称性情報をスーパークラスガイダンスとして組み込んで,モデルの予測過程と化学直観との整合性を確保する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:27:57 GMT)
R2-KG: General-Purpose Dual-Agent Framework for Reliable Reasoning on Knowledge Graphs [16.8] R2-KGは、推論を2つの役割に分けるプラグイン・アンド・プレイのフレームワークである。
以上の結果から,R2-KGはKGベースの推論のための柔軟性とコスト効率のよい解であることがわかった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:19:18 GMT)
A Provably-Correct and Robust Convex Model for Smooth Separable NMF [16.8] 非負行列分解(NMF)は非負データに対する線形次元法であり、ハイパースペクトルアンミックスやトピックモデリングなどの応用がある。
特に分離性は、NMF の基底ベクトルが入力行列のいくつかの列に等しいことを仮定する。
SSNMFの凸モデルを提案し,ノイズがあっても追従因子を確実に回復することを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:54:27 GMT)
Continual Learning with Synthetic Boundary Experience Blending [16.7] 本稿では,経験ブレンディング(EB)を提案する。
EBには,(1)境界データを合成するための潜時空間ノイズ注入,(2)経験とSBDを併用したエンドツーエンドトレーニングの2つの要素がある。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:21:00 GMT)
GFix: Perceptually Enhanced Gaussian Splatting Video Compression [16.6] 既存の3DGSベースのビデオコーデックは、より目立った視覚的アーティファクトと比較的低い圧縮比を示す。
本稿では,3DGSのレンダリングと量子化の成果物が拡散訓練中に採取した雑音に類似しているという仮定に基づいて,3DGSによる映像圧縮の知覚的向上を特に狙う。
本稿では,市販のニューラルエンハンサーとして機能する,一段拡散モデルの合理化によるコンテンツ適応型フレームワークGFixを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:03:30 GMT)
QUARK: Quantization-Enabled Circuit Sharing for Transformer Acceleration by Exploiting Common Patterns in Nonlinear Operations [16.5] QUIRKは量子化可能なFPGAアクセラレーションフレームワークである。
Transformerベースのモデル内のすべての非線形操作をターゲットにしている。
新しい回路共有設計により高性能な近似を実現する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:46:21 GMT)
AvatarTex: High-Fidelity Facial Texture Reconstruction from Single-Image Stylized Avatars [16.4] AvatarTexは、顔のテクスチャを再構築するフレームワークで、単一の画像からスタイリングされたテクスチャとフォトリアリスティックなテクスチャの両方を生成することができる。
筆者らの3段階パイプラインは,まず拡散型塗り絵によるテクスチャ領域の欠如,GANによる潜時最適化によるスタイルと構造整合性の改善,拡散型塗り絵による細部細部の改善などを行った。
スタイル化されたテクスチャデータセットの必要性に対処するために,正確なUV整列レイアウトを備えた20,000のマルチスタイルUVテクスチャの高解像度コレクションであるTexHubを紹介した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:31:15 GMT)
Do LLMs Feel? Teaching Emotion Recognition with Prompts, Retrieval, and Curriculum Learning [16.2] 会話における感情認識(Emotion Recognition in Conversation、ERC)は、人間の感情を理解し、人間とコンピュータの自然な相互作用を可能にするための重要なタスクである。
本稿では,Promptエンジニアリング,実証検索,カリキュラム学習を統合した新しいERCトレーニングフレームワークであるPRC-Emoを提案する。
提案手法は新たなSOTA(State-of-the-art)性能を実現し,提案手法の有効性と一般化性を示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:52:11 GMT)
Pure Vision Language Action (VLA) Models: A Comprehensive Survey [16.0] ビジョン言語アクション(VLA)モデルの出現は、従来のポリシーベースの制御から一般化されたロボット工学へのパラダイムシフトを表している。
この調査は、明確な分類学と既存の研究の体系的、包括的レビューを提供することを目的として、先進的なVLA手法を探求する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:53:21 GMT)
Understanding and Mitigating Memorization in Diffusion Models for Tabular Data [16.0] メモリ化は、モデルが正確にまたはほぼ同一のトレーニングデータを不注意に複製した場合に発生する。
本稿では,TabCutMixを提案する。
また,TabCutMixは,高品質なデータ生成を維持しつつ,メモリ化を効果的に軽減することを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:32:49 GMT)
SlotVLA: Towards Modeling of Object-Relation Representations in Robotic Manipulation [15.9] 我々は、より構造化され、効率的で、説明可能なビジュモータ制御のための経路として、オブジェクトリレーション中心の表現について研究する。
まず,ロボット操作におけるオブジェクト関係推論の実現と評価を目的とした,詳細なベンチマークデータセットであるLIBERO+を紹介する。
次に,SlotVLAを提案する。SlotVLAは,オブジェクトと動作復号化の関係をキャプチャするスロットアテンションベースのフレームワークである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:33:44 GMT)
When Bias Pretends to Be Truth: How Spurious Correlations Undermine Hallucination Detection in LLMs [15.6] 大規模言語モデル (LLM) は幻覚を呈し続けており, 妥当で誤った反応を生じている。
我々は、急激な相関によって引き起こされた、批判的だが未発見の幻覚のクラスを強調した。
信頼に基づくフィルタリングや内部状態探索のような既存の幻覚検出手法は、基本的には素早い相関の存在下で失敗する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:19:27 GMT)
REINFORCE++: Stabilizing Critic-Free Policy Optimization with Global Advantage Normalization [15.3] REINFORCE++は、textbfGlobal Advantage Normalizationを中心にした、批判のないフレームワークである。
本稿では、汎用ドメインRLHFのアルゴリズムであるREINFORCE++と、複雑な推論タスクのための堅牢なグループサンプリングのREINFORCE++/wベースラインの2つのバリエーションを紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:11:13 GMT)
Beyond Uniform Deletion: A Data Value-Weighted Framework for Certified Machine Unlearning [15.3] 非学習プロセスにおけるデータ価値の不均一性を考慮に入れた一般的なアンラーニングフレームワークであるデータ価値重み付きアンラーニング(DVWU)を提案する。
具体的には、データ値に基づいて重み付け戦略を設計し、それをアンラーニング手順に統合し、モデルに様々な有用性を持つデータポイントの差別化未学習を可能にする。
合成と実世界の両方のデータセットを用いた実験により,本手法は従来の非学習手法と比較して予測性能と頑健性に優れることを示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:32:29 GMT)
Meta SecAlign: A Secure Foundation LLM Against Prompt Injection Attacks [15.3] モデルレベルのディフェンスを内蔵した,初の完全オープンソースLCMであるMeta SecAlignを開発した。
我々は、9つのユーティリティベンチマークと7つのセキュリティベンチマークにおいて、一般的な知識、命令フォロー、エージェントに関する最も包括的な評価を行う。
私たちの最高のモデルであるMeta-SecAlign-70Bは、オープンソースのLCMのためのユーティリティセキュリティトレードオフの新たなフロンティアを確立します。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:30:10 GMT)
Designing Beyond Language: Sociotechnical Barriers in AI Health Technologies for Limited English Proficiency [15.3] 我々は、14人の患者ナビゲーターとストーリーボードによるインタビューを行い、スペイン語話者の介護体験をどう形作るかを探った。
言語的および文化的な誤解、プライバシーに関する懸念、そしてAIがケアを強化するための機会とリスクに関する緊張関係を特定しました。
AIツールは、社会的障壁や制度上の制約を緩和する可能性があるが、誤情報や人間のカマラデリーの根絶のリスクがある。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:23:06 GMT)
Breaking Privacy in Federated Clustering: Perfect Input Reconstruction via Temporal Correlations [15.1] フェデレートされたクラスタリングにより、複数のパーティが生サンプルを共有することなく、分散データのパターンを発見することができる。
多くのプロトコルは、トレーニング中に中間セントロイドを開示し、オーバーヘッドを減らす。
フェデレーションクラスタリングにおけるセントロイドの開示は、プライバシーを著しく損なうことを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:06:16 GMT)
Understanding the role of depth in the neural tangent kernel for overparameterized neural networks [15.0] 本研究では,ReパラメータLUネットワークの高密度化について,対応する制限カーネルを特徴付けることにより検討した。
この収束挙動を観測するために必要なネットワーク深度の大きさの順序を実証的に評価する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:18:04 GMT)
From Invariant Representations to Invariant Data: Provable Robustness to Spurious Correlations via Noisy Counterfactual Matching [14.7] トレーニングデータから急激な相関関係を学習するモデルは、新しい環境にデプロイすると失敗することが多い。
我々は、不変表現の学習から不変データペアの活用へと焦点を移す、データ中心の代替案を提案する。
ノイズの反事実マッチングは、少数の反事実ペアでさえも活用することで、堅牢性を向上させる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:59:58 GMT)
AnoStyler: Text-Driven Localized Anomaly Generation via Lightweight Style Transfer [14.6] AnoStylerはテキスト誘導型転送としてゼロショット異常生成をフレーム化する。
CLIPベースの損失関数で訓練された軽量なU-Netモデルを用いて、通常の画像を視覚的にリアルな異常画像にスタイリングする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:20:31 GMT)
The Few Govern the Many:Unveiling Few-Layer Dominance for Time Series Models [14.5] 我々は,より大きなモデルではより優れた性能が得られない,ファズリング現象を観察する。
本稿では,これらの支配層のみを自動的に識別し,保持する実用的な手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:53:29 GMT)
Combining digital data streams and epidemic networks for real time outbreak detection [14.3] 我々は、リアルタイムでアウトブレイクを識別する機械学習フレームワークであるLRTrendを紹介する。
LRTrendは、単一のリージョン内の多様な健康および行動データストリームを効果的に集約する。
病気固有の疫病ネットワークを学習し、地域間で情報を収集する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:53:52 GMT)
FinRpt: Dataset, Evaluation System and LLM-based Multi-agent Framework for Equity Research Report Generation [14.3] 本稿では,Equity Research Report (ERR) 生成タスクを初めて定式化する。
本稿では,ERR生成のためのオープンソースの評価ベンチマークであるFinRptを提案する。
また、生成されたERRを評価するための11の指標を含む総合的な評価システムも導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:22:32 GMT)
Neyman-Pearson Classification under Both Null and Alternative Distributions Shift [14.3] ナイマン・ピアソン分類における転帰学習の問題点について考察する。
我々は、ソースが通知されたときに、Type-IおよびType-IIエラーの改善を保証する適応的な手順を導出する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:38:27 GMT)
Preference-Guided Reinforcement Learning for Efficient Exploration [14.1] LOPE: textbfLearning textbfOnline with trajectory textbfPreferencedanctextbfE, a end-to-end preference-guided RL framework。
我々の直感では、LOPEは人的フィードバックをガイダンスとして考慮し、オンライン探索の焦点を直接調整する。
LOPEは収束率と全体的な性能の点で、最先端のいくつかの手法より優れている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:56:56 GMT)
Mapping Reduced Accessibility to WASH Facilities in Rohingya Refugee Camps with Sub-Meter Imagery [13.9] 水、衛生および衛生へのアクセス(WASH)は、難民キャンプにおいて主要な公衆衛生上の問題となっている。
本研究では、WASHアクセシビリティを水ポンプ、ラトリン、浴室キュービクルに特異的に定量化するためのリモートセンシング駆動フレームワークを提案する。
サブメーター衛星画像を用いて,F1スコア76.4%の避難避難所検出を実現する半教師付きセグメンテーション・フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:48:04 GMT)
DeepPersona: A Generative Engine for Scaling Deep Synthetic Personas [13.8] 物語完全合成ペルソナを合成するためのスケーラブルな生成エンジンであるDEEPPERSONAを紹介する。
まず、アルゴリズムによって、数百以上の階層的に組織化された属性からなる、最も大きな人間帰属分類を構築できる。
我々は、平均して数百の構造化属性と約1MBの物語テキストを持つコヒーレントで現実的なペルソナを条件付きで生成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:37:56 GMT)
Perceptually Aligning Representations of Music via Noise-Augmented Autoencoders [13.6] このような方法でオーディオオートエンコーダを訓練した後、従来の訓練よりも粗い表現構造で知覚的に健全な情報をキャプチャできることが示される。
このような知覚的階層は、音楽のピッチにおける副次的な推定や、音楽聴取に対する脳波応答の予測という文脈において、潜時拡散復号化を改善することを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:11:02 GMT)
Hybrid Autoencoders for Tabular Data: Leveraging Model-Based Augmentation in Low-Label Settings [13.6] 本稿では,ニューラルエンコーダと難解なソフト決定木(OSDT)エンコーダを組み合わせたハイブリッドオートエンコーダを提案する。
提案手法は,多種多様なデータセットにまたがる低ラベル分類と回帰において一貫した向上を実現し,深部および木に基づく教師付きベースラインを向上する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:08:39 GMT)
HiMo-CLIP: Modeling Semantic Hierarchy and Monotonicity in Vision-Language Alignment [13.6] HiMo-CLIPは、エンコーダアーキテクチャを変更することなくCLIPスタイルのモデルを強化する表現レベルフレームワークである。
HiMo-CLIPは2つの重要なコンポーネントを導入している: 階層分解(HiDe)モジュール。
複数の画像テキスト検索ベンチマークの実験は、HiMo-CLIPが強いベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:04:36 GMT)
Interpreting Multi-Attribute Confounding through Numerical Attributes in Large Language Models [13.6] 大規模言語モデル(LLM)は,実世界の数値相関を符号化するが,体系的に増幅する傾向があることを示す。
無関係な文脈は、モデルサイズによって異なる下流効果で、等級表現の一貫性のあるシフトを誘導します。
これらの知見は,多属性絡み合い下でのより公平な表現認識制御の基礎となった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:39:09 GMT)
Resource Efficient Sleep Staging via Multi-Level Masking and Prompt Learning [13.6] 本研究では,睡眠時間ごとの信号収集量を削減することを目的とした,資源効率の高い睡眠ステージングの課題を提案する。
この課題を解決するため,マスク・アウェア・スリープ・スタージング(MASS)と呼ばれる新しいフレームワークを提案する。
MASSは4つのデータセットで評価され、特にデータの量が非常に限られている場合、最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:19:26 GMT)
REACT-LLM: A Benchmark for Evaluating LLM Integration with Causal Features in Clinical Prognostic Tasks [13.5] 大言語モデル(LLM)と因果学習はそれぞれ、臨床意思決定(CDM)に強い可能性を秘めている
現実世界の医療では、結果に因果的影響のある特徴を特定することが、行動可能で信頼できる予測に不可欠である。
本稿では,LEMと因果的特徴の組み合わせが臨床予後を向上するかどうかを評価するためのベンチマークであるREACT-LLMを紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:12:35 GMT)
Guiding Generative Models to Uncover Diverse and Novel Crystals via Reinforcement Learning [13.4] 本稿では,多種多様だが熱力学的に実現可能な結晶性化合物への潜伏拡散モデルを導出する強化学習フレームワークを提案する。
我々のアプローチは、グループの相対的政策最適化と検証可能な多目的報酬を統合し、創造性、安定性、多様性を共同でバランスさせる。
このアプローチは、制御可能なAI駆動の逆設計のためのモジュラー基盤を確立する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:48:49 GMT)
Time-Prompt: Integrated Heterogeneous Prompts for Unlocking LLMs in Time Series Forecasting [13.3] 時系列予測は、変数間の時間的依存関係を将来の状態推論のためにモデル化することを目的としている。
深層学習に基づく手法は目覚ましい進歩を遂げているが, 長期的な予測では, 依然として準最適性能を示している。
本稿では,時系列予測のための大規模言語モデルを活性化するフレームワークであるTime-Promptを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:01:48 GMT)
DynaSpec: Context-aware Dynamic Speculative Sampling for Large-Vocabulary Language Models [13.2] DynaSpecは動的ショートリスト機構で、堅牢で、ドラフトをスピードアップし、さまざまなタスクにまたがって一般化する。
Llama-3-8Bでは許容される平均長を98.2%まで改善した。
文脈依存の選択を利用することで、DynaSpecは生成トークンの最大2.18倍、固定語彙アプローチの1.91倍を達成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:41:15 GMT)
DrKGC: Dynamic Subgraph Retrieval-Augmented LLMs for Knowledge Graph Completion across General and Biomedical Domains [13.1] 知識グラフ補完(KGC)は、既存の三重情報とテキスト情報を活用することにより、知識グラフ(KG)に欠落した三重情報を予測することを目的としている。
DrKGCは、KG内の構造埋め込みと論理ルールを学ぶために、フレキシブルで軽量なモデルトレーニング戦略を採用している。
そして、新しいボトムアップグラフ検索手法を利用して、学習ルールでガイドされた各クエリのサブグラフを抽出する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:45:20 GMT)
Peeling Context from Cause for Multimodal Molecular Property Prediction [12.9] CLaP(Causal Layerwise Peeling)は、因果信号をコンテキストから階層的に分離するフレームワークである。
CLaPは、競争ベースラインよりもMAE、MSE、R2$を一貫して改善する。
原子レベルの因果正性マップを生成し、予測に責任を負う部分構造をハイライトする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:29:33 GMT)
Importance-Aware Data Selection for Efficient LLM Instruction Tuning [12.9] 本稿では,モデルの能力向上における命令データの重要性を定量化するための新しい指標として,MIWV(Model Instruction Weakness Value)を提案する。
実験の結果,MIWVに基づくデータのトップ1%のみを選択すると,全データセットでのトレーニングよりも優れることがわかった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:06:30 GMT)
On the Consistency of Multilingual Context Utilization in Retrieval-Augmented Generation [12.8] 大規模言語モデル(LLM)を用いた検索言語拡張生成(RAG)は,多言語質問応答タスクにおいて高い性能を示した。
多言語RAGでは、検索されたパスは、ユーザが入力したクエリ以外の言語で書くことができる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:06:24 GMT)
TabRAG: Tabular Document Retrieval via Structured Language Representations [12.8] Retrieval-Augmented Generation (RAG)のデータを取り込むには、ターゲットコーパスに直接埋め込みモデルを微調整するか、または埋め込みモデルエンコーディングのための文書を解析する必要がある。
本稿では,構造化言語表現によるテーブル重文書の処理を目的とした解析に基づくRAGパイプラインであるTabRAGを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 00:05:58 GMT)
On the Mechanisms of Collaborative Learning in VAE Recommenders [12.8] 変分オートエンコーダ(VAE)は行列分解の強力な代替手段である。
VAE-based collaborative filtering (CF) において, 協調がいかに生じるかを分析し, 潜時近接によって制御されることを示す。
分析はNetflix, MovieLens-20M, Million Songのデータセットで検証されている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:13:58 GMT)
Scalable Offline Metrics for Autonomous Driving [12.6] オフラインモデルのパフォーマンスからオンライン設定への外挿は依然として課題だ。
これらの設定では、一見小さなエラーが複雑になり、テスト時間違反や衝突を引き起こします。
シミュレーションで分析したところ、オフラインとオンラインのセッティングの相関は以前の研究よりさらに悪化していた。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:22:29 GMT)
TrueCity: Real and Simulated Urban Data for Cross-Domain 3D Scene Understanding [12.6] 3Dのセマンティックなシーン理解は、3Dコンピュータビジョンコミュニティにおいて長年の課題である。
我々は,cm精度のアノテート実世界の点群,セマンティック3次元都市モデル,および同じ都市を表すアノテート模擬点群を用いた最初の都市セマンティックセマンティックセマンティクスベンチマークであるTrueCityを紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:57:50 GMT)
DeepBooTS: Dual-Stream Residual Boosting for Drift-Resilient Time-Series Forecasting [12.5] 時系列(TS)は非定常性を示す。
ほとんどの予測手法は、コンセプトドリフトに対する頑丈さを損なう。
DeepBooTSは、新しいエンドツーエンドの2ストリーム残差低減法である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:43:47 GMT)
Tight Bounds for Schrödinger Potential Estimation in Unpaired Data Translation [12.5] オルンシュタイン・ウレンベック過程を基準として、対応するシュル「オーディンガーポテンシャル」を推定する。
オルンシュタイン-ウレンベック過程の混合特性により、有利なシナリオにおいて、いくつかの対数因子までの収束の速さをほぼ達成できる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:22:44 GMT)
Gaussian-Augmented Physics Simulation and System Identification with Complex Colliders [12.4] 本稿では,任意の形状の衝突子を用いた物理特性推定が可能な微分可能なMPMフレームワークAS-DiffMPMを提案する。
本手法は, 対象物体が複雑な剛体と相互作用できるように, 異種衝突処理機構を組み込むことにより, 既存手法を拡張した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:44:19 GMT)
An Adaptive Machine Learning Triage Framework for Predicting Alzheimer's Disease Progression [12.4] 軽度認知障害(MCI)からアルツハイマー病(AD)への転換の正確な予測は、効果的なパーソナライズされた治療を可能にする。
予測された「情報の価値」に基づいて、高度でコストのかかる特徴を選択的に得る2段階の機械学習フレームワークを設計する。
我々のフレームワークは、基本的な機能と高度な機能の両方を使用するモデルに匹敵する0.929のAUROCを達成しながら、高度なテストの必要性を20%削減します。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:57:56 GMT)
SMiLE: Provably Enforcing Global Relational Properties in Neural Networks [12.4] 我々は、グローバルリレーショナルプロパティをサポートするため、NNの実施フレームワークであるSMiLEを拡張した。
SMiLEはモノトニック性、大域的ロバスト性、個人的公正性、合成データ、実データ、回帰および分類タスクについて評価する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:33:32 GMT)
CLiFT-ASR: A Cross-Lingual Fine-Tuning Framework for Low-Resource Taiwanese Hokkien Speech Recognition [12.3] CLiFT-ASRは台湾のホッキエンにおける音声認識のための言語横断的な微調整フレームワークである。
最初は音素の太ロアノテーションから音響と音調の表現を学び、次に漢文字の語彙と構文をキャプチャする。
TAT-MOEコーパスの実験は、CLiFT-ASRが文字誤り率を24.88%減少させることを示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:03:30 GMT)
Bernstein-von Mises for Adaptively Collected Data [12.2] 適応的に収集されたデータにおいて,ベイズ型UQとウォルド型頻繁性UQの等価性を証明した。
我々は、様々なシミュレーションを通して、我々の理論(肯定的かつ否定的)を実証的に検証する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:36:13 GMT)
Multi-Scenario Highway Lane-Change Intention Prediction: A Physics-Informed AI Framework for Three-Class Classification [12.2] 車線変更操作は高速道路事故の主要な原因である。
本稿では,車体キネマティクス,インタラクション実現可能性,およびトラフィック安全メトリクスを学習プロセスに統合する物理インフォームドAIフレームワークを提案する。
99.8%の精度、93.6%のマクロF1、96.1%の精度、88.7%のマクロF1を1秒の地平線で表す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:08:56 GMT)
SAFENLIDB: A Privacy-Preserving Safety Alignment Framework for LLM-based Natural Language Database Interfaces [12.1] NLIDBのための新しいプライバシセキュリティアライメントフレームワークであるtextscSafeNlidbを提案する。
このフレームワークは、スクラッチからハイブリッドチェーンのインタラクションデータを生成する自動化パイプラインを備えている。
また、直接選好最適化の多重選好振動を克服するために、推論ウォームアップと交互選好最適化を導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:05:59 GMT)
Beyond Plain Demos: A Demo-centric Anchoring Paradigm for In-Context Learning in Alzheimer's Disease Detection [12.1] 物語写本からのアルツハイマー病(AD)は大きな言語モデル(LLM)に挑戦する
AD検出ヒンジのコンテキスト内学習の改善は、より良いデモ(デモ)セットを通じて知覚を豊かにする。
我々は、EmphtextbfDiverse and Contrastive Retrieval (DCR) を通じてコンテキスト幅を共同で拡張し、EmphtextbfProjected Vector Anchoring (PVA) を介して各デモの信号を深くするデモ中心アンカーフレームワークである textbfDA4ICL を紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:13:42 GMT)
Dual Mamba for Node-Specific Representation Learning: Tackling Over-Smoothing with Selective State Space Modeling [12.1] オーバー・スムーシングに対処するため,Dual Mamba-enhanced Graph Convolutional Network (DMbaGCN)を提案する。
DMbaGCNはローカル・ステート・エボリューション・マンバ(LSEMba)とグローバル・コンテキスト・アウェア・マンバ(GCAMba)の2つのモジュールから構成されている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:34:20 GMT)
DOS: Directional Object Separation in Text Embeddings for Multi-Object Image Generation [12.1] 本稿では,3種類のCLIPテキスト埋め込みを,テキスト・ツー・イメージ・モデルに渡す前に修正するDOS(Directional Object separation)を提案する。
実験の結果,DOS は多目的画像生成の成功率を一貫して改善し,オブジェクトの混合を減少させることがわかった。
これらの結果は、多目的画像生成を改善するための実用的で効果的なソリューションとしてDOSを強調している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:22:27 GMT)
DeepKnown-Guard: A Proprietary Model-Based Safety Response Framework for AI Agents [12.1] 大きな言語モデル(LLM)はますます顕著になり、重要なドメインへの信頼性の高いデプロイメントを厳しく制限しています。
本稿では,LLMを入力レベルと出力レベルの両方で保護する新しい安全応答フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:31:25 GMT)
Enhancing Multimodal Recommendations with Vision-Language Models and Information-Aware Fusion [11.9] VIRALは、Vision-Language and Information-Aware Recommendationフレームワークである。
意味的に整合した画像表現のための、きめ細かいタイトル誘導記述を生成する。
3つのAmazonデータセットの実験によると、VIRALは強いマルチモーダルベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:11:16 GMT)
Coupling Agent-based Modeling and Life Cycle Assessment to Analyze Trade-offs in Resilient Energy Transitions [11.9] 持続的で回復力のあるエネルギーシステムに移行するには、環境、社会、資源の次元にわたって複雑で相互依存的なトレードオフをナビゲートする必要がある。
本稿では,エージェント・ベース・モデリングとライフサイクル・アセスメント(LCA)を組み合わせて,エネルギー遷移経路が地域資源競争,生態的制約,地域レベルの負担とどのように相互作用するかをシミュレートする統合モデリング・フレームワークを提案する。
その結果、統合的かつマルチスケールな意思決定が、エネルギー経路の展開を形作って、シナリオ駆動の制約の下で空間的に明示的なトレードオフを明らかにするかが示される。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:28:03 GMT)
PaperArena: An Evaluation Benchmark for Tool-Augmented Agentic Reasoning on Scientific Literature [11.8] 本研究では,大規模言語モデル(LLM)に基づくエージェントの評価ベンチマークであるPaperArenaを提案する。
研究上の疑問から、エージェントは推論や適切なツールとのインタラクションを通じて、複数の論文にまたがる多様なフォーマットを統合する必要がある。
実験の結果、高度に確立されたエージェントを駆動する最も先進的なLCMでさえ、平均精度は38.78%に過ぎなかった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:21:21 GMT)
Achieving Effective Virtual Reality Interactions via Acoustic Gesture Recognition based on Large Language Models [11.6] 視覚に基づくジェスチャー認識は、高い計算コスト、照明条件への感受性、プライバシー漏洩の懸念に悩まされている。
難聴の高周波信号を出力し反射を捉え、チャネルインパルス応答(CIR)を符号化することで、ジェスチャーが音場を低コストでユーザ透明な方法で摂動する方法を符号化する。
本稿では,VR/ARシステムにおけるCIRに基づくジェスチャー認識のための大規模言語モデル(LLM)を利用する最初のフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:19:58 GMT)
How Generative AI Empowers Attackers and Defenders Across the Trust & Safety Landscape [11.6] Generative AI(GenAI)は、Trust & Safetyを再構築するための強力な技術である。
本稿では,5つの領域にわたるトラスト・アンド・セーフティの専門家43名による質的研究を通じて,これらの効果について検討する。
我々は,GenAIが攻撃者および防衛者の両方に力を与える環境を特徴付ける。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 22:00:58 GMT)
Holistic Unlearning Benchmark: A Multi-Faceted Evaluation for Text-to-Image Diffusion Model Unlearning [11.6] 概念アンラーニングは、非倫理的または有害なテキスト・ツー・イメージ拡散モデルの使用に対する有望な解決策である。
我々のベンチマークでは、33のターゲットコンセプトがカバーされており、1概念あたり16,000のプロンプトが含まれており、Celebrity、Style、Intellectual Property、NSFWの4つのカテゴリにまたがっている。
本研究は,全ての評価基準において1つの方法が排他的でないことを明らかにする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:29:24 GMT)
Oblivious Digital Tokens [11.4] コンピュータ装置は、通常、ユニークな測定可能な振る舞いを示すか、秘密の知識を証明することによって、自分自身を識別する。
サイバー・コンフリクトの間、デジタルリソースを保護するために赤十字国際委員会が最近提案したデジタルエンブレムの文脈において、この問題が自然に発生するかを示す。
この新たな重要かつオープンな問題に対処するために、我々はOblivious Digital Token (ODT)と呼ばれる新しいプリミティブを定義します。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:58:54 GMT)
Zero-error communication under discrete-time Markovian dynamics [11.2] 離散時間)マルコフ力学を持つ開量子系を考える。
我々の課題は、システムが任意に長い時間進化した後でも、完全に復元できるように、システムに情報を保存することである。
これは、力学が混合されているとき、古典的な(参照量子)情報に対して正確には不可能であることを示す。
さらに、そのようなダイナミクスのクランブルが、完全検索の点を超えた符号化された情報を処理した後の最小時間に、厳密な普遍的上限を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:47:54 GMT)
Causes and Canonicalization of Unreproducible Builds in Java [11.2] 再現可能なビルドの概念フレームワークを導入し,再現可能な中央からの大きなデータセットを分析し,再現不可能な6つの根本原因の新たな分類法を開発した。
12,803個の再現不可能なアーティファクトに対して26.60%のカノニゼーションを実現するツールであるChains-Rebuildを紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:06:13 GMT)
Improving Generalization in Deepfake Detection with Face Foundation Models and Metric Learning [11.1] 本稿では、強力な一般化を伴う堅牢なビデオディープフェイク検出フレームワークを提案する。
本手法は,実顔データに基づく自己教師型モデルであるFSFM上に構築されている。
トレーニング中に三重項損失の変種を組み込み、実際のサンプルと偽のサンプルの間により分離可能な埋め込みを生成するようモデルに誘導する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:17:56 GMT)
Quantifying nonclassical correlations relative to local channels [11.0] 量子チャネルに対する量子状態の修正Wigner-Yanase-Dysonスキュー情報と量子相関の定量的尺度を導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:33:10 GMT)
Fair Bayesian Data Selection via Generalized Discrepancy Measures [11.0] モデルパラメータとサンプル重みの群固有の後続分布を共有中心分布と整合させることにより、公平性を確保するデータ選択フレームワークを提案する。
我々のフレームワークは、ワッサーシュタイン距離、平均誤差の最大値、および$f$-divergenceなど、様々な分布差によるフレキシブルアライメントをサポートしている。
ベンチマークデータセットを用いた実験の結果,提案手法は既存のデータ選択法やモデルベースフェアネス法を公平性と精度で一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:28:04 GMT)
Revisiting the Data Sampling in Multimodal Post-training from a Difficulty-Distinguish View [11.0] マルチモーダル推論のための2つの難解なサンプリング手法を提案する。
本稿では, プログレッシブ・イメージ・セマンティック・マスキング(PISM)が, 画像の系統的劣化を通じてサンプル硬さを定量化することを示す。
また、相互モダリティ・アテンション・バランス(CMAB)が相互の相互作用の複雑さを評価することも示している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:31:59 GMT)
Ambiguity-aware Truncated Flow Matching for Ambiguous Medical Image Segmentation [10.6] 本稿では,Ambiguity-Aware Truncated Flow Matching (ATFM)を提案する。
GTRは予測の忠実度とトラニケート分布の信頼性の両方を高めるために導入された。
SFMは,セマンティック・アウェア・フロー・トランスフォーメーションの拡張により,多様な予測の妥当性を高めるために提案されている。
ATFMは、高度な手法と比較して、GEDとHM-IoUを最大$12%、$7.3%改善している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:57:06 GMT)
More Agents Helps but Adversarial Robustness Gap Persists [10.5] LLMエージェントが一緒に働くと、数学的な質問応答において、1つのLLMよりも強力なように見える。
本稿では,逆摂動問題を用いてこの問題を考察する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:58:17 GMT)
P3-LLM: An Integrated NPU-PIM Accelerator for LLM Inference Using Hybrid Numerical Formats [10.4] P3-LLMは,ハイブリッドな数値形式を用いた大規模言語モデル(LLM)推論のための新しいアクセラレータである。
まず、ハイブリッドな数値形式を利用するフレキシブルな混合精度量子化方式を提案する。
我々は,P3-LLMがKV-cacheのみの量子化と重み活性化量子化の両方の観点から,最先端の量子化精度を実現することを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:29:34 GMT)
SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations [10.4] SPOTは、停止点という社会学的概念を再現可能なNLPタスクに翻訳する最初の注釈付きコーパスである。
このコーパスには、フランスのFacebookコメントを手動で注釈付けした43,305件が含まれている。
我々は、様々なプロンプト戦略の下で、細調整エンコーダモデル(CamemBERT)と命令調整LLMをベンチマークする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:54:40 GMT)
Mixed Signals: Understanding Model Disagreement in Multimodal Empathy Detection [10.3] 単調・多モーダル予測が分岐する症例について検討した。
我々の分析は、一つのモードにおける支配的なシグナルが、他人がサポートしていないときに融合を誤解させる可能性があることを示唆している。
これらの洞察的位置不一致は、困難な事例を特定し、共感システムの堅牢性を改善するのに有用な診断信号である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:36:10 GMT)
Robust and High-Fidelity 3D Gaussian Splatting: Fusing Pose Priors and Geometry Constraints for Texture-Deficient Outdoor Scenes [10.3] 3D Gaussian Splatting (3DGS)は、デジタルアセット作成のための重要なレンダリングパイプラインとして登場した。
不安定なポーズ推定とシーン表現歪みの問題に対処するため,2つの側面からこの問題にアプローチする。
ポーズ推定にはLiDAR-IMUオドメトリーを用い,大規模環境下でカメラに事前ポーズを提供する。
シーン表現には、正規ベクトル制約と効果的なランク正規化を導入し、ガウス原始体の方向と形状の整合性を強制する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:45:08 GMT)
GlitchMiner: Mining Glitch Tokens in Large Language Models via Gradient-based Discrete Optimization [10.2] 大規模言語モデル(LLM)における予測不可能または異常な振る舞いをトリガーするGlitchトークンは、信頼性と安全性をモデル化する上で大きな課題となる。
GlitchMinerは,予測エントロピーの最大化により,グリッチトークンを識別する動作駆動型フレームワークである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:34:45 GMT)
Incomplete Depression Feature Selection with Missing EEG Channels [10.2] 脳波によるうつ病分析の最近の進歩は、うつ病検出精度の改善に期待が持たれている。
実世界のEEGデータ取得は、電極剥離からのデータ損失や大きなノイズ干渉など、しばしば課題に直面している。
我々は、不完全抑うつ特徴選択(IDFS-MEC)と呼ばれる、堅牢な抑うつ分析のための新しい特徴選択手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:47:09 GMT)
SDS KoPub VDR: A Benchmark Dataset for Visual Document Retrieval in Korean Public Documents [10.1] 既存のビジュアル文書検索(VDR)のベンチマークは、非英語言語と公式出版物の構造的複雑さを概ね見落としている。
SDS KoPub VDRは,韓国の公文書の検索と理解のための,最初の大規模公開ベンチマークである。
ベンチマークは361の現実世界のドキュメント上に構築されており、KOGL Type 1ライセンス下の256ファイル、公式の法的ポータルからの105ファイルが含まれている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:20:56 GMT)
Knowledge-Guided Prompt Learning for Request Quality Assurance in Public Code Review [10.1] 我々は, P ublic Code Review (KP-PCR) のための K nowledge-guided P rompt Learning を提案し, 開発者によるコードレビュー要求品質保証を実現する。
2011-2023年のPCRデータセットの実験結果から,我々のKP-PCRはベースラインより優れていたことが判明した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 00:13:25 GMT)
CGLE: Class-label Graph Link Estimator for Link Prediction [10.1] CGLE(Class-label Graph Link Estimator)は、GNNベースのリンク予測モデルを拡張するために設計された新しいフレームワークである。
CGLEはクラス条件のリンク確率行列を構成する。
効率的な前処理の段階でカプセル化され、基礎となるGNNモデルの計算複雑性は影響を受けないままである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:34:36 GMT)
Beyond Fixed Depth: Adaptive Graph Neural Networks for Node Classification Under Varying Homophily [10.0] 本研究では,局所構造特性とラベル特性を情報伝達ダイナミクスに関連付ける理論的枠組みを開発する。
本稿では,ノード固有の集約深さを動的に選択する適応深度GNNアーキテクチャを提案する。
本手法は, 統一モデルにおけるホモ親和性パターンとヘテロ親和性パターンの両方にシームレスに適応する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:37:51 GMT)
Automatically Detecting Checked-In Secrets in Android Apps: How Far Are We? [10.0] 開発者はしばしば、そのようなシークレットの適切なストレージを見落とし、プロジェクトに直接配置することを選択します。
チェックインされたシークレットがプロジェクトにチェックインされ、悪意のある敵によって簡単に抽出され、悪用される。
オープンソースプロジェクトとは異なり、ソースコードへの直接アクセスの欠如と難読化の存在は、Androidアプリのチェックインシークレット検出を複雑にする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:18:22 GMT)
Synergy over Discrepancy: A Partition-Based Approach to Multi-Domain LLM Fine-Tuning [10.0] 大規模言語モデル(LLM)は印象的な一般化能力を示すが、複数の異種ドメインに効果的に適用することは困難である。
負の転送を最小限に抑えつつドメイン間シナジーを生かした分割型多段階微調整フレームワークを提案する。
私たちのアプローチでは、ドメインの相違、シナジー、モデルキャパシティの制約のバランスをとることによって、ドメインを(ステージ)に戦略的に分割します。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:27:26 GMT)
Continual Learning of Domain Knowledge from Human Feedback in Text-to-SQL [10.0] 本研究では,テキスト・ツー・アウェア・スキーマや蒸留スキーマにおいて,人間のフィードバックから連続的な学習を行うフレームワークを提案する。
本稿では, メモリ拡張エージェント, 特に手続きエージェントが, ループ内フィードバックを利用して, 大幅な精度向上と誤差低減を実現していることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:29:10 GMT)
Variational Diffusion Unlearning: A Variational Inference Framework for Unlearning in Diffusion Models under Data Constraints [9.9] 本研究では,事前学習した拡散モデルから望ましくない特徴を含む出力の発生を防止できる機械学習手法を提案する。
本手法は, 可塑性インデューサと安定正則化器の2項からなる損失関数の最小化を目的とした, 変分推論フレームワークに着想を得たものである。
本手法の有効性は,授業未学習と特徴未学習の両方に対する総合的な実験を通じて検証する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:26:21 GMT)
Deep Neural Operator Learning for Probabilistic Models [9.8] 本稿では,確率モデルの一般クラスを対象としたディープニューラルネットワークフレームワークを提案する。
我々は、明示的なネットワークサイズ境界を持つ普遍近似定理を確立する。
本稿では,新しいストライク価格の最適停止境界を学習モデルが再現することなく生成することを示す,アメリカの選択肢のバスケットの数値的な例を示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:52:48 GMT)
Decoding Quantum Search Advantage: The Critical Role of State Properties in Random Walks [9.7] ランダムウォークに基づくアルゴリズムにおける量子状態特性の役割について検討する。
その結果,コヒーレンス率の増加は成功確率を高めるが,絡み合いやコヒーレンスの増加は減少することがわかった。
我々の探索はGroverライクなスピードアップを実現し、量子強化機械学習の重要な可能性を示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:10:44 GMT)
LoRA on the Go: Instance-level Dynamic LoRA Selection and Merging [9.7] Low-Rank Adaptation (LoRA) は、大規模言語モデルを微調整するためのパラメータ効率の高いアプローチとして登場した。
LoGoはトレーニング不要のフレームワークで、追加の要件なしにインスタンスレベルでアダプタを動的に選択し、マージする。
LoGoはトレーニングベースのベースラインを3.6%まで上回り、他のタスクでは競争力を維持している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:13:10 GMT)
CoLM: Collaborative Large Models via A Client-Server Paradigm [9.7] textbfCoLM(textbfCollaboration in textbfLarge-textbfModels)は、協調推論のための新しいフレームワークである。
単一の出力を生成するために複数のモデルからの同時推論に依存する従来のアンサンブル法とは異なり、COLMは複数のモデルの出力を集約または共有することを可能にする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:42:21 GMT)
TwinOR: Photorealistic Digital Twins of Dynamic Operating Rooms for Embodied AI Research [9.7] インテリジェントな手術システムのための具体的AIの開発には、継続的な学習と評価のために安全で制御可能な環境が必要である。
デジタル双生児は、探索と訓練のために高忠実でリスクのない環境を提供する。
我々は、AI研究のための手術室のフォトリアリスティックでダイナミックなデジタルツインを構築するためのフレームワークであるTwinORを紹介した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:57:09 GMT)
PanoNav: Mapless Zero-Shot Object Navigation with Panoramic Scene Parsing and Dynamic Memory [9.6] 目に見えない環境でのゼロショットオブジェクトナビゲーション(ZSON)は、家庭用ロボットにとって難しい問題である。
本稿では,Panomic Scene Parsingモジュールとメモリ誘導決定機構を統合した,完全なRGBのみのマップレスZSONフレームワークであるPanoNavを提案する。
公開ナビゲーションベンチマークの実験では、PanoNavはSRとSPLの両方で代表ベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:31:32 GMT)
DPCformer: An Interpretable Deep Learning Model for Genomic Prediction in Crops [9.6] ゲノム選択(GS)は、全ゲノム情報を用いて、作物の表現型を予測し、繁殖を加速する。
しかし、従来のGS手法は複雑な特徴や大きなデータセットの予測精度に苦慮している。
複雑な遺伝子型とフェノタイプの関係をモデル化するために,畳み込みニューラルネットワークと自己認識機構を統合したディープラーニングモデルDPCformerを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:28:13 GMT)
DETECT: Data-Driven Evaluation of Treatments Enabled by Classification Transformers [9.5] DETECTは、治療前後の日常生活の患者活動を比較することで、治療の成功を評価するデータ駆動フレームワークである。
以上の結果から,DETECTは客観的かつ軽量であり,臨床的意思決定に重要な新規な寄与であることが明らかとなった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:38:32 GMT)
Wavelet Enhanced Adaptive Frequency Filter for Sequential Recommendation [9.5] 逐次レコメンデーションのためのウェーブレット拡張適応周波数フィルタという新しい手法を提案する。
動的周波数領域フィルタリングとウェーブレット機能強化の2つの重要なモジュールで構成されている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:22:33 GMT)
Visual Structures Helps Visual Reasoning: Addressing the Binding Problem in VLMs [9.4] 本稿では,視覚入力構造を用いた拡張推論(VISER)を提案する。
VISERは、低レベルの空間構造を持つ視覚入力を増強する、シンプルで効果的な方法である。
私たちは、コアの視覚的推論タスクに対して、実質的なパフォーマンス改善を実証的に示します。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:12:13 GMT)
Learning to Focus: Prioritizing Informative Histories with Structured Attention Mechanisms in Partially Observable Reinforcement Learning [9.2] 本研究では, 動的ヘッドの自己保持機構に, 構造的インダクティブ先行を導入する。
Atari 100kベンチマークの実験では、ほとんどの効率向上がガウス以前の結果から生じることが示されている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:53:16 GMT)
CAMP-VQA: Caption-Embedded Multimodal Perception for No-Reference Quality Assessment of Compressed Video [9.2] 本稿では,大規模モデルの意味理解機能を活用した新しいNR-VQAフレームワークであるCAMP-VQAを提案する。
本手法では,フレーム間変動から抽出したキーフラグメントを統合する品質対応ビデオメタデータ機構を提案する。
我々のモデルは既存のNR-VQA法を一貫して上回り、手作業の細かいアノテーションを使わずに精度の向上を実現している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:37:47 GMT)
Learn to Select: Exploring Label Distribution Divergence for In-Context Demonstration Selection in Text Classification [9.1] テキスト分類のためのインコンテキスト学習(ICL)は、大規模言語モデル(LLM)において印象的な性能を示した。
2段階のデモ選択法であるTopK + Label Distribution Divergence (L2D)を提案する。
これにより、意味的に類似するだけでなく、テスト入力とラベルの分布に一致したデモを選択できる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:04:14 GMT)
Using Vision Language Models as Closed-Loop Symbolic Planners for Robotic Applications: A Control-Theoretic Perspective [9.1] 大型言語モデル (LLMs) と視覚言語モデル (VLMs) はシンボル計画の具体化に広く用いられている。
制御理論の観点からロボット応用のための閉ループシンボルプランナとしてVLMを使用する方法について検討する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:56:56 GMT)
Geometric implicit neural representations for signed distance functions [9.0] 入射神経表現(INR)は、低次元空間における信号を表現するための有望な枠組みとして登場した。
本調査は,テキスト署名距離関数(SDF)を近似する特殊INR問題に関する既存の文献を概観する。
本稿では、正規化や曲率などの微分幾何ツールを、その損失関数をテクスト幾何学的INRとして組み込んだニューラルネットワークSDFについて述べる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:33:02 GMT)
Minimum Width of Deep Narrow Networks for Universal Approximation [9.0] 完全連結ニューラルネットワークに必要な最小幅の下限と上限について検討する。
より直感的な例を構築して、不等式 $w_minge d_y+mathbf1_d_xd_yleq2d_x$ の新たな証明を示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:29:14 GMT)
ConsistTalk: Intensity Controllable Temporally Consistent Talking Head Generation with Diffusion Noise Search [9.0] 拡散雑音探索を用いた新しい強度制御型音声ヘッド生成フレームワークである textbfTalk を紹介する。
まず,動作特徴を静的な外観から切り離すスタブファン光フロー誘導時間モジュール(OFT)を提案する。
第2に,マルチモーダル・教師・学生の知識蒸留により得られたtextbfAudio-to-Intensity (A2I) モデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:28:13 GMT)
EMNLP: Educator-role Moral and Normative Large Language Models Profiling [8.9] 本稿では,EMNLP(Educator-Role Moral and Normative LLMs Profiling framework)を紹介する。
EMNLPは既存のスケールを拡張し、88の教師固有の道徳ジレンマを構築している。
ターゲットソフトプロンプトインジェクションセットは、教師SPのコンプライアンスと脆弱性を評価する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:05:52 GMT)
Place Matters: Comparing LLM Hallucination Rates for Place-Based Legal Queries [8.9] 本研究は, クローズドソースLPMによる法情報の幻覚の頻度が, 場所と大きく関連していることを示す。
このことは、これらのモデルによって提供される法的な解の質が地理的に均等に分散していないことを示唆している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:42:00 GMT)
NoteEx: Interactive Visual Context Manipulation for LLM-Assisted Exploratory Data Analysis in Computational Notebooks [8.8] NoteExはJupyterLab拡張で、EDAワークフローのセマンティックビジュアライゼーションを提供する。
これにより、アナリストはメンタルモデルを外部化し、分析依存関係を指定し、タスク関連コンテキストのインタラクティブな選択を可能にする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:44:55 GMT)
AnomalyAID: Reliable Interpretation for Semi-supervised Network Anomaly Detection [8.8] AnomalyAIDは、異常検出プロセスを解釈し、解釈結果の信頼性を向上させることを目的としている。
本稿では,グローバル・ローカル・インタプリタを利用した新しい解釈手法を提案する。
両段階のモデル予測を特別な制約に合わせることで,ネットワーク異常検出のための新たな2段階半教師付き学習フレームワークを設計する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:03:57 GMT)
De-Individualizing fMRI Signals via Mahalanobis Whitening and Bures Geometry [8.8] 我々は,fMRI信号から有意義な情報を抽出するために,マハラノビスデータ白化を用いる。
これらの手法は、脳機能と認知と行動を結びつけるメカニズムの発見を助ける可能性がある。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:14:48 GMT)
Robust Causal Discovery under Imperfect Structural Constraints [8.6] 既存のメソッドは、通常、完全な事前を前提とするか、特定の特定されたエラータイプしか処理できない。
我々は,事前調整と紛争解決を通じて知識とデータを調和させることを提案する。
提案手法は線形設定と非線形設定の両方に対して堅牢である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:27:08 GMT)
DPS: Design Pattern Summarisation Using Code Features [8.6] DPSは、コードから直接デザインパターンの自然言語要約を生成するための最初のアプローチである。
開発者調査では、手作業による要約よりも、DPSのコンテキスト保存が優れていることが確認されている。
時間的タスクは、要約が理解時間を大幅に短縮することを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:04:37 GMT)
Rethinking Rainy 3D Scene Reconstruction via Perspective Transforming and Brightness Tuning [8.6] 既存のデータセットはしばしば、雨の多い3Dシーンの2つの重要な特徴を見落としている。
OmniRain3Dという新しいデータセットを構築し、視点の不均一性と明るさの動的性を取り入れた。
本稿では,降雨時からクリーンな3Dシーンを高忠実に再現するREVR-GSNetというエンドツーエンド再構築フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:57:55 GMT)
Sparse identification of quasipotentials via a combined data-driven method [8.5] データから直接準ポテンシャルの擬似方程式を発見する方法を示す。
ニューラルネットワークとスパース回帰アルゴリズムを用いており、特にマルチスタブルエネルギーランドスケープを象徴的に記述するように設計されている。
準ポテンシャルのモデル非バイアス解析形式は, メタスタビリティとエネルギー景観の評価を目的とした幅広い応用に注目されている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:05:50 GMT)
Static and dynamic coherence fraction in the Bernstein-Vazirani algorithm [8.4] 我々は、コヒーレンス分数とベルンシュタイン・ヴァジラニアルゴリズムのリンクを確立する。
一般化されたベルンシュタイン・ヴァジラニアルゴリズムの成功確率は初期状態のコヒーレンス分だけに依存することを示す。
量子コヒーレンス分画が量子アルゴリズムの効率にどのように影響するかを明らかにする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:41:23 GMT)
Observation of Non-Hermitian Spectral Deformation in Complex Momentum Space [8.3] 我々は運動量空間におけるスペクトル変形を再構成し、複素平面上の固有スペクトルは異なる測度で変形する。
これにより、非ブロッホ帯域理論の下で、システムの鍵情報を実験的に抽出することができる。
我々の研究は、非エルミート物理学と非ブロッホバンド理論を探索するための汎用的なプラットフォームを実証する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:39:01 GMT)
Fast Bayesian Updates via Harmonic Representations [8.2] 本稿では,高調波解析を利用した高速ベイズ更新のための新しい統一フレームワークを提案する。
我々は、ベイズ更新規則をスペクトル畳み込みに変換するために、適切なベースで事前および可能性を表現することを実証する。
計算可能性を実現するために,スムーズな関数に対して,例外的に正確な有限次元近似を与えるスペクトルトランケーション方式を導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:28:33 GMT)
Stacking Variational Bayesian Monte Carlo [8.1] Stacking Variational Bayesian Monte Carlo (S-VBMC)は、複数の独立ランからの頑健で大域的な後部近似である。
S-VBMCは追加の可能性評価を必要とせず、自然に並列化可能であり、既存の推論にシームレスに適合する。
VBMCの探索に挑戦するために設計された2つの合成問題と、計算神経科学による実世界の2つの応用について、その効果を実証する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:18:18 GMT)
Learning to Fast Unrank in Collaborative Filtering Recommendation [8.1] 協調フィルタリングレコメンデーション(L2UnRank)における高速アンランク学習を提案する。
L2UnRankは、(a)相互作用ベースのp-ホップ伝播による影響範囲の同定、(b)このスコープ内のエンティティの構造的および意味的影響の計算、(c)影響情報によってガイドされる効率的でランク付け可能なパラメータ更新を実行する。
実験では、L2UnRankのモデルに依存しない性質を示し、最先端の非ランクの有効性を達成し、再トレーニングに匹敵する推奨品質を維持する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:45:15 GMT)
EduGuardBench: A Holistic Benchmark for Evaluating the Pedagogical Fidelity and Adversarial Safety of LLMs as Simulated Teachers [8.1] 職業シミュレーションのための大規模言語モデル(SP-LLM)は、パーソナライズされた教育において重要である。
EduGuardBenchはロールプレイングフィデリティスコア(RFS)を用いてプロのフィデリティを評価する
また、一般的な害、特に学術的不正をターゲットとしたペルソナベースの敵対的プロンプトを使用して安全性の脆弱性を調査する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:42:24 GMT)
Rethinking Tokenization for Rich Morphology: The Dominance of Unigram over BPE and Morphological Alignment [8.1] トークン化アルゴリズムの選択はパフォーマンスに影響する最も重要な要因であり、Unigramベースのトークン化アルゴリズムは、ほとんどの設定において一貫してBPEを上回っている。
より優れた形態的アライメントは、テキスト分類や構造予測タスクのパフォーマンスと適度で正の相関を示すが、その影響はトークン化アルゴリズムに準じる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:36:09 GMT)
Zeroth-Order Adaptive Neuron Alignment Based Pruning without Re-Training [8.0] 我々は, LLMの任意のプルーニングアルゴリズム上で使用可能な, エフェストアップアルゴリズムである textbfNeuroAl を提案する。
我々の手法は、パフォーマンス・ランタイムトレードオフの観点から最新の最先端手法よりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:02:31 GMT)
NeuroBridge: Bio-Inspired Self-Supervised EEG-to-Image Decoding via Cognitive Priors and Bidirectional Semantic Alignment [7.9] 視覚神経復号は、脳の活動パターンから知覚される視覚刺激を再構成または推論しようとする。
現在のアプローチは、高品質な刺激脳応答対の不足によって制約されている。
本稿では,NuroBridgeという自己教師型アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:29:09 GMT)
Adaptive Initial Residual Connections for GNNs with Theoretical Guarantees [7.8] 異なるノードが異なる残差強度を持つ適応的残差スキームについて検討する。
特に、埋め込みのディリクレエネルギーがゼロから離れていることを示す。
これはアダプティブな設定だけでなく、アクティベーション関数との静的な残留接続に対しても初めて理論上の保証となる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:08:37 GMT)
How do Machine Learning Models Change? [7.8] 本研究は、Hugging Faceで10万台のモデルから680,000件のコミットと202台のモデルから2,251件のコミットを分析した。
コミットを分類し,ベイズネットワークを用いてコミット・リリース活動の時間パターンをモデル化するために,拡張ML変更分類を適用した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:45:16 GMT)
GPT, But Backwards: Exactly Inverting Language Model Outputs [7.7] 本稿では,Sparse One-Hot Discrete Adam (SODA)アルゴリズムを提案する。
実験では、自然言語とランダム入力の両方において、正確な言語モデルの逆変換が可能であることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:40:58 GMT)
Graph Representation-based Model Poisoning on the Heterogeneous Internet of Agents [7.7] Internet of Agents (IoA)は、異種大規模言語モデル(LLM)エージェントが大規模に相互接続し協力できる統一されたエージェント中心のパラダイムを構想している。
このパラダイムの中では、フェデレートラーニング(FL)は、分散LLMエージェントがデータを集中化せずにグローバルモデルをコトレーニングできる重要なイネーブラーとして機能する。
グラフ表現に基づくモデル中毒(GRMP)攻撃は、観測された良性局所モデルを受動的に利用してパラメータ相関グラフを構築し、高次依存を捕捉・再生成するための逆変分グラフオートエンコーダを拡張する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:06:26 GMT)
Multiple Streams of Knowledge Retrieval: Enriching and Recalling in Transformers [7.6] 本研究では, 微調整モデルから予め訓練したモデルに重みを選択的に移植する手法である, エンファンダイナミックウェイトグラフティングを提案する。
微調整された関係情報を取得するための2つの経路を示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:00:02 GMT)
MG-HGNN: A Heterogeneous GNN Framework for Indoor Wi-Fi Fingerprint-Based Localization [7.5] 受信信号強度インジケータ(RSSI)は、Wi-Fi指紋の主要な表現であり、屋内のローカライゼーションにとって重要なツールである。
既存のRSSIベースの位置決め手法は、環境の複雑さとマルチソース情報処理の課題により、精度の低下に悩まされることが多い。
本稿では,空間認識の向上と位置決め性能の向上を図るため,新しい多グラフヘテロジニアスGNNフレームワーク(MG-HGNN)を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:27:27 GMT)
Retriv at BLP-2025 Task 2: Test-Driven Feedback-Guided Framework for Bangla-to-Python Code Generation [7.5] 提案手法は,インストラクションプロンプトと,テスト駆動のフィードバック誘導型反復精製プロセスを組み合わせた手法である。
モデルはBangla命令からコードを生成し、ユニットテストに対してテストし、3つの評価パスを通じて失敗するアウトプットを反復的に洗練する。
このアプローチはチームの"Retriv"がPass@1スコア0.934で共有タスクの2位を確保するのに役立ちました。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:41:44 GMT)
Retriv at BLP-2025 Task 1: A Transformer Ensemble and Multi-Task Learning Approach for Bangla Hate Speech Identification [7.5] 本稿では,社会的影響を受けながら言語的に困難な課題である,バングラヘイト音声識別の問題に対処する。
研究チーム「Retriv」は, (1A) ヘイトタイプ分類, (1B) ターゲットグループ識別, (1C) タイプ, 重症度, ターゲットの3つのサブタスクに参加した。
我々のシステムは, 72.75% (1A) と72.69% (1B) のマイクロf1スコアを達成し, 重み付きマイクロf1スコアを72.62% (1C) とした。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:07:09 GMT)
Adaptive Group Robust Ensemble Knowledge Distillation [7.4] 適応型グループロバスト・アンサンブル知識蒸留(AGRE-KD)を提案する。
いくつかのデータセットに対する実験により,提案したアンサンブル蒸留技術の優位性を実証した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:42:17 GMT)
Flexible Concept Bottleneck Model [7.4] 概念ボトルネックモデル(CBM)は、人間の理解可能な概念を予測にマッピングする中間層を導入することで、ニューラルネットワークの解釈性を改善する。
本稿では,フレキシブル・コンセプト・ボトルネック・モデル (FCBM) を提案する。
提案手法は,同数の有効概念を持つ最先端のベースラインに匹敵する精度を実現する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:50:57 GMT)
Categorical Emotions or Appraisals - Which Emotion Model Explains Argument Convincingness Better? [7.2] 我々は、受取人の議論が引き起こす感情は主観的であると論じる。
それは受取人の目標、基準、事前の知識、スタンスに依存します。
本研究は、説得力予測のための感情モデル間の最初の体系的比較を示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:53:04 GMT)
Differentiated Directional Intervention A Framework for Evading LLM Safety Alignment [7.1] 大規模言語モデルには、悪意のある要求を拒否する能力が備わっている。
以前の研究は、この拒絶機構を活性化空間の1つの線形方向としてモデル化していた。
我々は,臨界層における安全アライメントを正確に中和する新しいホワイトボックスフレームワークDBDIを導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:52:34 GMT)
How Does a Deep Neural Network Look at Lexical Stress? [7.1] 英語の非音節単語のデータセットは、読み書き音声と自発音声から自動的に構築される。
CNNアーキテクチャは、最小のストレスペアを欠いた非音節単語のスペクトル表現から、ストレス位置を予測するために訓練された。
特徴特異的な関連分析を提案し,その結果から, 発声母音の第1および第2フォルマントの影響を強く受けていることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:16:06 GMT)
From Attribution to Action: Jointly ALIGNing Predictions and Explanations [7.1] 分類器とマスカを反復的に訓練する新しいフレームワークであるALIGNを提案する。
高品質マスクをガイダンスとして活用することにより、ALIGNは解釈可能性と一般化性の両方を改善し、様々な設定でその優位性を示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:52:17 GMT)
Wasserstein-Cramér-Rao Theory of Unbiased Estimation [7.1] 独立にサンプリングされたデータセットの値と比較した場合、推定器の不安定性を表す量に興味がある。
結果として生じる感度の理論は、古典的な分散の理論がフィッシャー・ラオ幾何学に基づいているのと同じように、ワッサーシュタイン幾何学に基づいている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:58:18 GMT)
Saturating the Quantum Cramér--Rao Bound in Prioritised Parameter Estimation [7.1] 一方のパラメータに関する情報は最大化できるが、他方のパラメータに関する情報は完全に失われることはない。
我々は,量子量子コンピュータ上での最適エンタングリング測定を実装することで,この知見を実証する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:53:41 GMT)
Diffolio: A Diffusion Model for Multivariate Probabilistic Financial Time-Series Forecasting and Portfolio Construction [7.1] 本稿では,多変量金融時系列予測とポートフォリオ構築のための拡散モデルDiffolioを提案する。
Diffolioは階層型アテンションアーキテクチャを備えたデノナイジングネットワークを採用しており、アセットレベル層とマーケットレベル層の両方で構成されている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:05:32 GMT)
DeNAS-ViT: Data Efficient NAS-Optimized Vision Transformer for Ultrasound Image Segmentation [7.1] 超音波画像分割のためのデータ効率の高いNAS最適化ビジョン変換器であるDeNAS-ViTを紹介する。
ViTのアテンション機構に先立って,マルチスケールトークンサーチを行う効率的なNASモジュールを提案する。
公開データセットの実験では、DeNAS-ViTが最先端のパフォーマンスを実現し、ラベル付き最小限のデータで堅牢性を維持することが示されている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:23:25 GMT)
A Weak Penalty Neural ODE for Learning Chaotic Dynamics from Noisy Time Series [7.0] 本稿では,データ駆動時系列予測モデルの古典的強い定式化を補完する手法として弱い定式化を提案する。
Weak-Penalty NODE (WP-NODE) と呼ばれるこのトレーニング戦略は,ベンチマークカオス力学系における最先端予測精度と例外的ロバスト性を実現する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:40:35 GMT)
PhaseSeed: Precise Call Graph Construction for Split-Phase Applications using Dynamic Seeding [7.0] PhaseSeedは、分割相アプリケーションにおけるポインタ解析の精度を向上させる新しい技術である。
PhaseSeedは、指定された初期設定に対して健全である。
本稿では、制御フロー整合性(CFI)、ソフトウェアデブロ、システムコールフィルタリングの3つのセキュリティメカニズムに適用する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:17:09 GMT)
On Accurate and Robust Estimation of 3D and 2D Circular Center: Method and Application to Camera-Lidar Calibration [7.0] 共形幾何代数とRANSACに基づく頑健な3次元円の中心推定器を提案する。
また,真の2次元投影中心を復元するための弦長分散最小化法を提案する。
我々のフレームワークは最先端のアプローチを大きく上回っている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:43:42 GMT)
High-Frequency Semantics and Geometric Priors for End-to-End Detection Transformers in Challenging UAV Imagery [6.9] 本稿では,空中シーンに適したリアルタイム検出変換器であるHEDS-DETRを紹介する。
まず,高周波数拡張セマンティックスネットワーク(HFESNet)のバックボーンを提案する。
第2に、高分解能特徴を効率的に融合させることにより、情報損失に対処する。
第三に、2つの相乗的成分を用いてデコーダの安定性と位置決め精度を向上させる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:51:21 GMT)
Bell-State Quantum Holography with Metasurfaces [6.9] 光子対の偏光絡み合うベル状態に符号化されたベル状態ホログラム識別ホログラム画像を実験的に実現した。
ホログラム状態画素の全密度行列を画素で再構成する。
このフレームワークは、準曲面フォトニクスと量子状態再構成を統一し、高次元量子通信へのスケーラブルな経路を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:52:21 GMT)
Model Inversion Attacks Meet Cryptographic Fuzzy Extractors [6.9] モデル反転攻撃は、機械学習(ML)モデルを使用するプライバシーに敏感なアプリケーションに対して、オープンな課題となる。
モデル反転に対する強い防御の望ましい性質を定式化し、ファジィ抽出器という暗号概念に接続する。
標準ユークリッド距離コンパレータをサポートするファジィ抽出器L2FE-Hashを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:22:59 GMT)
Breaking the Stealth-Potency Trade-off in Clean-Image Backdoors with Generative Trigger Optimization [6.8] クリーンイメージのバックドア攻撃は、セキュリティクリティカルなアプリケーションに重大な脅威をもたらす。
既存の方法の重大な欠点は、攻撃を成功させるのに必要な毒素率が、比例的かつ顕著な、クリーン精度(CA)の低下を引き起こすことである。
我々は、条件付きInfoGANを使用して、強力でステルス的なトリガーとして機能する自然発生画像の特徴を識別するフレームワークであるGenerative Clean-Image Backdoors (GCB)を紹介した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:37:44 GMT)
COGNOS: Universal Enhancement for Time Series Anomaly Detection via Constrained Gaussian-Noise Optimization and Smoothing [6.7] Constrained Gaussian-Noise Optimization and Smoothing (COGNOS)は、モデルに依存しない拡張フレームワークである。
我々はCOGNOSが非常に有効であることを示し、12種類のバックボーンモデルに適用した場合、平均Fスコアアップリフトは57.9%となることを示した。
出力統計を直接正規化することは、異常検出システムを大幅に改善するための強力で一般化可能な戦略である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:43:48 GMT)
Enabling Off-Policy Imitation Learning with Deep Actor Critic Stabilization [6.7] 本稿では,非政治学習を取り入れてサンプル効率を向上させる逆模倣学習アルゴリズムを提案する。
専門家の行動に頑健に適合するために必要なサンプルの削減を実証する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:35:50 GMT)
Convergence of Multiagent Learning Systems for Traffic control [6.7] Qラーニングを用いた独立したエージェントとして各交通信号をモデル化するマルチエージェント強化学習(MARL)が,平均通勤遅延を低減するための有望な戦略として登場した。
本稿では,このマルチエージェント TSC アルゴリズムの理論的基礎に焦点をあてることで,ギャップを埋める。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:10:20 GMT)
Data Trajectory Alignment for LLM Domain Adaptation: A Two-Phase Synthesis Framework for Telecommunications Mathematics [6.7] 汎用大規模言語モデル (LLMs) は、電気通信のような垂直に展開されることが増えている。
本稿では2相モデルに依存しないデータキュレーションフレームワークであるData Trajectory Alignment (DTA)を提案する。
DTAはソリューションプロセス(最終回答だけでなく)を第一級の監督として扱います。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:05:08 GMT)
Loss Tomography for Quantum Networks [6.5] 量子ネットワークトモグラフィーにおいて、量子容量領域の分析が強力な新しいツールとしてどのように利用できるかを示す。
以上の結果から,量子容量領域はネットワーク設計や資源割り当て,プロトコルベンチマークなどに有用であるだけでなく,量子ネットワークトモグラフィーへの応用にも有用であることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:52:18 GMT)
On the Relation between Rectified Flows and Optimal Transport [6.5] 整流流マッチングは、学習した輸送経路を直線化し、分布間のより直接的な流れを生み出すことを目的としている。
最近の主張は、学習速度場が勾配であるように制約された整流流が最適輸送問題への解をもたらすことを示唆している。
本論文では, 従来の等価性を無効にするためのいくつかの反例を提示し, 整流の勾配制約を強制することは, 一般には, 最適輸送マップを計算するための信頼性の高い方法ではないと論じる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:54:53 GMT)
On Cryptography and Distribution Verification, with Applications to Quantum Advantage [6.5] 仮説テストの分野における最も基本的な問題の1つはアイデンティティテストの問題である。
古典/量子分布の効率的な検証と古典/量子暗号の関係について検討する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:22:18 GMT)
All Entities are Not Created Equal: Examining the Long Tail for Ultra-Fine Entity Typing [6.4] PLMのパラメトリック知識にのみ依存するエンティティタイピングアプローチは,事前学習分布の長い部分のエンティティと大きく競合することを示す。
この結果から, PLMを超越して, 希少なエンティティによく対応できるソリューションを創出する必要があることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:01:06 GMT)
Integrating Reweighted Least Squares with Plug-and-Play Diffusion Priors for Noisy Image Restoration [6.4] インパルスノイズを含む一般的なノイズの頑健な除去のための生成拡散先に基づくプラグアンドプレイ画像復元フレームワークを提案する。
評価実験の結果,提案手法は非ガウス的インパルスノイズを効果的に除去し,復元性能が向上することが示された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:11:20 GMT)
Image Restoration via Primal Dual Hybrid Gradient and Flow Generative Model [6.4] 正則化ロバスト性は、画像の逆問題に対する古典的なアプローチであり、正則化項は未知の像の望ましい性質を強制する。
近年,フローマッチング画像復元機能の統合が注目されている。
そこで本研究では,正規化子に関連する演算子をモデルから派生した時間依存デブロワーに置き換える,モデル分割に基づくPlug-and-Playフレームワークに,このような生成前処理を組み込む。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:26:36 GMT)
Resilient by Design - Active Inference for Distributed Continuum Intelligence [6.2] 本稿では,DCCシステムのレジリエンスを実現するための確率的アクティブ・推論・レジリエンス・エージェント(PAIR-Agent)を提案する。
PAIR-Agentは、デバイスログから因果断層グラフを構築すること、(ii)マルコフ毛布と自由エネルギー原理を用いて、確実性と不確実性を管理しつつ障害を識別すること、(iii)能動推論による自律的修復を行うこと、の3つのコアオペレーションを実行する。
継続的監視と適応的な再構成を通じて、エージェントはさまざまな障害条件下でサービス継続性と安定性を維持する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:30:44 GMT)
Proceedings of the 2025 XCSP3 Competition [6.2] 2025年XCSP3コンペティションの結果はCP'25(31st International Conference on Principles and Practice of Constraint Programming)で発表された。
この文書は2025年のXCSP3コンペティションの手続きを表している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:12:04 GMT)
ConvFill: Model Collaboration for Responsive Conversational Voice Agents [6.2] 本稿では,パワフルなバックエンドモデルからストリーミング知識をシームレスに取り入れつつ,軽量なオンデバイスモデルがコンテキスト的に適切な対話を生成するタスクである対話型インフィルを提案する。
合成多領域会話に基づく360MパラメータモデルであるConvFillを提案する。
ConvFillは,200ms以下の応答待ち時間を維持しつつ,同一サイズのスタンドアロンの小型モデルに対して36~42%の精度向上を実現している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:50:30 GMT)
EMODIS: A Benchmark for Context-Dependent Emoji Disambiguation in Large Language Models [6.1] 大規模言語モデル(LLM)は、現実世界の通信環境にますます展開されているが、文脈に依存したあいまいさを解決できる能力はまだ未定である。
我々は,最小かつコントラッシブな文脈下で曖昧な絵文字表現を解釈するLLMの能力を評価するための新しいベンチマークEMODISを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:24:01 GMT)
Argus: Quality-Aware High-Throughput Text-to-Image Inference Serving System [6.1] Argusは、各プロンプトが品質を維持するための適切なレベルの近似を選択する推論システムである。
レイテンシサービスレベルの目標(SLO)違反が10倍少なくなり、平均品質が10%向上し、ベースラインよりも40%高いスループットを実現している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:34:39 GMT)
Multilingual Lexical Feature Analysis of Spoken Language for Predicting Major Depression Symptom Severity [6.0] 英国, オランダ, スペインで586人の参加者の5,836人の音声データとPHQ-8アセスメントの探索分析を行った。
線形混合効果モデルを用いてMDD症状の重症度に関連する解釈可能な語彙の特徴を同定することを試みた。
英語では,MDD症状の重症度は,語彙的多様性尺度や絶対言語を含む7つの特徴と関連していた。
オランダ語では1文あたりの単語と肯定的な単語頻度で関連が観察され、スペインで収集された記録では関連は見られなかった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:03:16 GMT)
Controllable Flow Matching for Online Reinforcement Learning [5.9] 条件付きフローマッチング(CFM)を用いた軌道レベルの合成法であるCtrlFlowを提案する。
本手法は,非線形制御性グラミアン行列が支配する制御エネルギーを最小化することにより,最適軌道サンプリングを実現する。
オンライン設定では、CtrlFlowは、動的モデルよりも一般的な MuJoCo ベンチマークタスクのパフォーマンスが優れていることを実証している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:01:20 GMT)
SRNN: Spatiotemporal Relational Neural Network for Intuitive Physics Understanding [5.9] 本稿では、オブジェクト属性、関係、タイムラインの統一的ニューラル表現を確立するモデルである、時空間ネットワーク(SRNN)を紹介する。
一般的なpretrain-then-finetune'パラダイムとは異なり、SRNNはpredefine-then-finetune'アプローチを採用する。
我々の研究は、直感的な物理理解のための工学系への生物学的知能の翻訳の可能性を確認する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:43:42 GMT)
MAROON: A Dataset for the Joint Characterization of Near-Field High-Resolution Radio-Frequency and Optical Depth Imaging Techniques [5.9] 我々は、光学領域と電波領域の両方から深度イメージを特徴付けるというユニークな課題に挑戦する。
本研究では, 対象物, ジオメトリー, 物体間距離について, 深度測定の総合的な評価を行う。
すべてのオブジェクトの測定は、MAROONと呼ばれるマルチモーダルデータセットとして公開されます。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:44:18 GMT)
Causal Dynamic Variational Autoencoder for Counterfactual Regression in Longitudinal Data [5.8] 時間とともに治療効果を推定する現在の方法は、すべての共同創設者が観察されたり、観測されていないものを推測しようとしたりすることを前提としている。
提案手法は,結果列に因果的影響を特に与える未観測適応変数に着目した。
提案するCausal Dynamic Variational Autoencoder (CDVAE) は,遅延調整変数の有効性に関する理論的保証を前提としている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:23:33 GMT)
HumorReject: Decoupling LLM Safety from Refusal Prefix via A Little Humor [5.8] 大きな言語モデル(LLM)は、安全のために明示的な拒絶プレフィックスに依存している。
We introduced HumorReject, a novel data-driven approach that reimaging LLM safety by decouping it from refusal prefixes through humor。
本手法は,様々な攻撃ベクトルに対して優れたロバスト性を示しながら,一般的な「過防衛」問題に効果的に対処する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:53:56 GMT)
Emergent Dynamical Translational Symmetry Breaking as an Order Principle for Localization and Topological Transitions [5.7] 我々は、ハミルトン変換対称性 (DTS) の概念を導入し、これは局所可観測物のハミルトン対称性ではなく、長期間のダイナミクスによって定義される。
我々は,TLTCがアンダーソン局在化遷移,多体局在化遷移,位相相転移を普遍的に捉えることを示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:49:37 GMT)
Dimensionality reduction and width of deep neural networks based on topological degree theory [5.6] コンパクトな位相空間のユークリッド空間への埋め込みと、特定の次元還元写像のクラスの下での連結埋め込みの分離性に関する枠組みを提案する。
深層ニューラルネットワークの設定におけるディープラーニング理論の分類と近似問題に関する興味深い洞察を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:09:56 GMT)
Certified L2-Norm Robustness of 3D Point Cloud Recognition in the Frequency Domain [5.5] 3Dポイントクラウド分類は、自律運転、ロボティクス、拡張現実といった安全に重要なアプリケーションにおいて、基本的なタスクである。
既存の認証された防御は点の摂動を制限するが、個々の点を維持しながら全体構造を変化させる微妙な幾何学的歪みを見落としている。
本稿では,ロバストネス解析を周波数領域にシフトし,グローバルL2境界摂動に対する構造化された認証を可能にする新しい認証フレームワークFreqCertを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:24:35 GMT)
Towards a Rigorous Understanding of the Population Dynamics of the NSGA-III: Tight Runtime Bounds [5.5] 双目的のOneMinMax(2$-OMM)問題に対してNSGA-IIIの厳密なランタイム境界を証明した。
これは、古典的なベンチマーク問題でNSGA-IIIにバウンドされた最初の低いランタイムである。
また、$m$-objective OneMinMax 問題において、NSGA-III の最もよく知られた上限も改善する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:11:07 GMT)
Dual-Pathway Fusion of EHRs and Knowledge Graphs for Predicting Unseen Drug-Drug Interactions [5.5] 薬物と薬物の相互作用(DDI)は予防可能な害の主要な原因である。
我々は,患者レベル EHR の文脈に基づいて,KG 関係のスコアリングを条件付ける最初のシステムを紹介した。
融合"Teacher"は、両方のソースに表される薬物対のメカニズム固有の関係を学習する。
蒸留された「Student」は、推論時にKGアクセスのない新規または稀に使用される薬物に一般化する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:18:16 GMT)
PADM: A Physics-aware Diffusion Model for Attenuation Correction [5.4] SPECT(Single-Photon Emission Computed Tomography)を用いた心筋灌流画像(MPI)における減衰アーティファクトの意義
本研究では,心筋SPECTにおける減衰補正のための新しいCTフリーソリューションを提案する。
具体的には,教師が学習する蒸留機構を通じて,明示的な物理の先行を組み込んだ拡散に基づく生成法であるPADM(Physical-Aware Attenuation Correction Diffusion Model)を紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:54:46 GMT)
Graph-Conditional Flow Matching for Relational Data Generation [5.4] 本稿では,外部キー関係によって生成されたグラフから関係データセットの内容を生成する関係データ生成モデルを提案する。
我々は、フローマッチングにより、関係データベース全体の内容の深い生成モデルを学ぶことによって、これを行う。
我々の方法は、複雑な構造を持つ関係データセットをサポートでき、各レコードの生成は、同じ接続されたコンポーネント内の他のレコードの影響を受けられるので、柔軟である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:05:11 GMT)
Feedback-Enhanced Driven-Dissipative Quantum Batteries in Waveguide-QED Systems [5.3] 原子-導波路-QED系における駆動散逸QBを実現する手法を提案する。
測定とコヒーレントフィードバック制御を組み合わせることで、ほぼ完全に安定した充電が可能となることを示す。
この研究は、駆動散布型QBの範囲を広げ、その性能を高めるための実践的な戦略を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:17:48 GMT)
Bilevel Learning via Inexact Stochastic Gradient Descent [5.3] バイレベル最適化は、高次元ハイパーチューニングのための機械学習の中心的なツールである。
両レベル最適化の不正確な理論を推し進める。
我々は収束を証明し、減衰精度とステップサイズスケジュールでレートを確立する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:02:52 GMT)
Explainable Swarm: A Methodological Framework for Interpreting Swarm Intelligence [5.1] 本研究は、人気のあるSwarmアルゴリズムの1つであるParticle Swarm Optimizationについて、多面的な解釈可能性に関する調査を行う。
我々は、新しい機械学習アプローチを用いて、PSOにおける様々なトポロジとパラメータの役割を解釈可能で説明可能なフレームワークを提供する。
この研究は、Swarmトポロジが情報の流れ、多様性、収束にどのように影響するかを解読することに成功した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:19:57 GMT)
RPTS: Tree-Structured Reasoning Process Scoring for Faithful Multimodal Evaluation [5.1] 推論プロセスツリースコア(Reasoning Process Tree Score、RPTS)は、推論プロセスを評価するツリー構造に基づくメトリクスである。
実世界のマルチモーダルシナリオでRPTSを検証するために,374の画像と390の推論インスタンスからなるRPTS-Evalという新しいベンチマークを構築した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:48:07 GMT)
Structural Enforcement of Statistical Rigor in AI-Driven Discovery: A Functional Architecture [5.1] 自動研究システム(AI-サイエンティフィック)における統計厳密化のための機能的アーキテクチャを提案する。
我々は、シーケンシャルな統計プロトコルを強制するHaskell eDeclarative ControlであるResearch monadを紹介する。
大規模シミュレーションとエンドツーエンドケーススタディにより,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:42:30 GMT)
Rethinking Metrics and Diffusion Architecture for 3D Point Cloud Generation [5.0] 生成した点雲を評価するためによく使われる指標には、欠陥に対する堅牢性がないことを示す。
推定点正規度を比較することで表面類似度を近似する新しい計量であるSurface Normal Concordance (SNC)を提案する。
拡散点変換器(Diffusion Point Transformer)という高忠実度3次元構造を生成する新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:55:03 GMT)
AgentSUMO: An Agentic Framework for Interactive Simulation Scenario Generation in SUMO via Large Language Models [4.9] 本研究では,大規模言語モデルを用いた対話型シミュレーションシナリオ生成のためのエージェントフレームワークを提案する。
AgentSUMOは、ユーザの意図を解釈し、タスクの複雑さを評価し、パラメータを推測し、実行可能なシミュレーション計画を定式化する適応推論層を導入することで、命令駆動実行から離脱する。
ソウルとマンハッタンの都市ネットワークの実験では、エージェントワークフローは、非専門家のアクセシビリティを維持しながら、トラフィックフローのメトリクスを大幅に改善することを示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:46:12 GMT)
Rethinking Parameter Sharing as Graph Coloring for Structured Compression [4.9] ジオシェアリング(Geo-Sharing)は、深層モデルにおける冗長性を減少させる構造化圧縮の一形態である。
モデルのパラメータ空間における構造対称性として,グループ理論の観点からパラメータ共有をリキャストする。
ヘッセンの低曲率固有部分空間に摂動を投影することにより、この基準は共有群を選択するための解析則を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:21:35 GMT)
Discovering Spatial Correlations of Earth Observations for weather forecasting by using Graph Structure Learning [4.8] 本研究では,地球観測と大気状態の空間的相関を見出すことにより,天気予報の精度を向上させることを目的とする。
我々は、この問題を解決するために構造学習を伴う時間グラフニューラルネットワーク(STGNN)を用いる。
本研究では,東アジアの実際の大気状態と観測データを用いて,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:06:30 GMT)
JunoBench: A Benchmark Dataset of Crashes in Python Machine Learning Jupyter Notebooks [4.8] JunoBenchは、PythonベースのMLノートブックにおける実世界のクラッシュのベンチマークデータセットである。
JunoBenchには111のキュレーションと再現可能なクラッシュが含まれている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:52:00 GMT)
From LIF to QIF: Toward Differentiable Spiking Neurons for Scientific Machine Learning [4.7] 我々は従来のLeaky Integrate-and-Fire(LIF)モデルの代替として、準積分体(QIF)ニューロンを導入・評価する。
QIFニューロンは滑らかで微分可能なスパイキングダイナミクスを示し、勾配に基づくトレーニングと安定した最適化を可能にしている。
これらの結果は、QIFニューロンをスパイキングと連続的な価値のある深層学習の間の計算ブリッジとして位置づける。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:47:17 GMT)
Llama-Embed-Nemotron-8B: A Universal Text Embedding Model for Multilingual and Cross-Lingual Tasks [4.7] llama-embed-nemotron-8bはオープンウェイトテキスト埋め込みモデルである。
これはMultilingual Massive Text Embedding Benchmarkで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:13:16 GMT)
Hard vs. Noise: Resolving Hard-Noisy Sample Confusion in Recommender Systems via Large Language Models [4.7] トレーニングレコメンデータシステムで使用される暗黙のフィードバックは、ミスクリックや位置バイアスといった要因によって、避けられないほどノイズに直面する。
従来の研究では、より高い損失値などの分散したデータパターンを通じてノイズのあるサンプルを識別しようと試みてきた。
ノイズのあるサンプルと硬いサンプルが類似したパターンを呈し,ノイズの多い混乱問題を引き起こした。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:51:03 GMT)
Verifying rich robustness properties for neural networks [4.6] ロバストネスはAIのアライメントと安全性の問題であり、ニューラルネットワークのようなモデルが安全クリティカルなシステムでますます使われている。
本稿では,ニューラルネットワーク検証におけるロバスト性の変種を特定し,検証するためのフレームワークを提案する。
我々は,これらすべての変種を均質な方法で検証する,新規で強力な統一手法を開発した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:43:02 GMT)
Can Training Dynamics of Scale-Invariant Neural Networks Be Explained by the Thermodynamics of an Ideal Gas? [4.6] 本研究では,スケール不変ニューラルネットワークの重み減衰を伴う勾配降下(SGD)の定常分布を記述する枠組みを開発する。
定常エントロピーの挙動を含むフレームワークの重要な予測は,実験観測と密接に一致していることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:10:01 GMT)
An Overview of 7726 User Reports: Uncovering SMS Scams and Scammer Strategies [4.6] ユーザーレポートの89.16%がテキストメッセージで構成されており、続いて不審な通話やURLが報告されている。
ユーザが報告したユニークなテキストメッセージの35.12%はスパムであり、40.27%は詐欺テキストメッセージである。
本稿は、特定された詐欺メールを12種類の詐欺タイプに分類する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:15:59 GMT)
Data Complexity of Querying Description Logic Knowledge Bases under Cost-Based Semantics [4.5] コストベースセマンティクスに基づく不整合重み付き記述論理(DL)知識ベースを問合せする際のデータ複雑性について検討する。
簡単に言うと、この考え方は、各解釈に違反した公理と主張の重みに基づくコストを割り当てることである。
そこで本研究では,一階書き直しにより,一階書き直しによって,一階書き直しの解や連結クエリの解を計算できることを見出した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:34:24 GMT)
GRAPH-GRPO-LEX: Contract Graph Modeling and Reinforcement Learning with Group Relative Policy Optimization [4.5] 本研究は,法的契約を構造化セマンティックグラフに変換する新しいフレームワークを用いて,契約レビューと分析のタスクを簡素化し,自動化することを目的とする。
ノードとエッジのグラフ理論的な等価値に、コアの法的契約要素をマッピングする詳細なオントロジーを導入する。
そこで我々は,契約からエンティティと関係を分割抽出するための強化学習に基づくLarge Language Model (LLM) フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:57:51 GMT)
AdaRec: Adaptive Recommendation with LLMs via Narrative Profiling and Dual-Channel Reasoning [4.5] AdaRecは、適応的なパーソナライズされたレコメンデーションのために、大規模な言語モデルを活用する、数発のコンテキスト内学習フレームワークである。
AdaRecは、水平な振舞いアライメントを統合し、垂直因果属性によるピア駆動パターンを発見するデュアルチャネルアーキテクチャを採用している。
実際のeコマースデータセットの実験では、AdaRecは機械学習モデルとLLMベースのベースラインの両方を上回っている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:59:27 GMT)
LLMServingSim2.0: A Unified Simulator for Heterogeneous Hardware and Serving Techniques in LLM Infrastructure [4.4] 本稿では,大規模LLMサービスシステムにおける異種ハードウェアの探索を目的としたシステムシミュレータLLMServingSim2.0を紹介する。
1) ハードウェアモデルをシステムレベルのシミュレータに統合することは、明確な抽象化が欠如していることから、非自明な問題であり、(2) 既存のシミュレータは、サービス技術の限られたサブセットしかサポートしていない。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:47:53 GMT)
Evaluating the Ability of Large Language Models to Reason about Cardinal Directions, Revisited [4.4] テンプレートの集合から生成されたベンチマークを用いて,28大言語モデル(LLM)の基準方向(CD)を推論する能力について検討した。
特定のシナリオから正しいCDを決定するLLMの能力を広範囲にテストする。
新しい大きな推論モデルでさえ、すべての質問に対して正しいCDを確実に決定できない。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:52:37 GMT)
Adaptive and Robust Data Poisoning Detection and Sanitization in Wearable IoT Systems using Large Language Models [4.3] 本研究では,大規模言語モデル(LLM)を用いてHARシステムにおける中毒検出と衛生を行う新しいフレームワークを提案する。
提案手法では, テクストロールプレイのプロンプトが組み込まれており, LLMは, センサ異常の文脈化と評価に専門家の役割を担っている。
フレームワークを広範囲に評価し,検出精度,衛生品質,レイテンシ,通信コストを定量化する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 00:01:56 GMT)
Learning from the Right Patches: A Two-Stage Wavelet-Driven Masked Autoencoder for Histopathology Representation Learning [4.3] 全スライド画像はデジタル病理の中心であるが、その極端の大きさとアノテーションが不足しているため、自己指導型学習が不可欠である。
本稿では,ウェーブレットインフォームドパッチ選択戦略を通じて,MAEに基づく学習に構造と生物学的関連性をもたらす枠組みを提案する。
WISE-MAEは、弱い監督下で効率を保ちながら、競争力のある表現品質と下流分類性能を実現する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:06:25 GMT)
HEDN: A Hard-Easy Dual Network with Task Difficulty Assessment for EEG Emotion Recognition [4.2] マルチソース領域適応は、クロスオブジェクト脳波の感情認識における個人差に対処するための効果的なアプローチである。
既存の手法では、異なるソースドメインとターゲットドメイン間の異なる転送困難を無視して、すべてのソースドメインを均等に扱う。
本稿では,タスク難易度評価機構を用いて,動的に"ハードソース"と"イージーソース"を識別する新しいHard-Easy Dual Network(HEDN)を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:14:31 GMT)
Sensor Calibration Model Balancing Accuracy, Real-time, and Efficiency [4.2] Scare (Sensor model balance, Real-time, Accuracy and efficiency) は8つの顕微鏡的要件を同時に満たす超圧縮トランスである。
Scare は,(1) ビン間の境界情報を保持しながら時系列データを対数的に圧縮するシーケンスレンズプロジェクタ (SLP) ,(2) コストのかかる乗算をバイナリハッシュコードによるビットワイズ操作に置き換える効率的なビットワイズアテンション (EBA) モジュール,(3) 補助損失項のない安定したトレーニングを保証するハッシュ最適化戦略の3つのコアコンポーネントから構成される。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:16:20 GMT)
Prompt Injection Vulnerability of Consensus Generating Applications in Digital Democracy [4.2] 大言語モデル(LLM)は、デジタル民主主義の実験において、コンセンサスステートメントと集約された嗜好を生成する方法として注目を集めている。
そこで,本研究では,コンセンサス生成システムにおけるインジェクション攻撃に対する既製のLLMの脆弱性について検討する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:20:03 GMT)
High-Dimensional Asymptotics of Differentially Private PCA [4.2] 差分プライバシーでは、機密データセットの統計はランダムノイズを導入することで民営化される。
このような高い騒音レベルが本当に必要か、あるいは証明技術に限界があるのかは、まだ不明である。
本稿では,ターゲットのプライバシレベルを達成するために必要な最小のノイズレベルを識別する,シャープなプライバシ特性を得ることができるかを検討する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:17:16 GMT)
ChestGPT: Integrating Large Language Models and Vision Transformers for Disease Detection and Localization in Chest X-Rays [4.1] 視覚変換器(ViT)は、視覚データをLLMが効率的に処理できるフォーマットに変換するのに有効であることが証明されている。
本稿では,EVA ViTとLlama 2 LLMを統合するフレームワークであるChestGPTについて紹介する。
提案手法は, F1スコア0.76のVinDr-CXRデータセットを用いて, 強いグローバルな疾患分類性能を達成した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:40:44 GMT)
Dynamics of number entropy for free fermionic systems in presence of defects and stochastic processes [4.1] 自由フェルミオンの連鎖における数エントロピーのダイナミクスについて, 欠陥と過程の双方を考慮し検討した。
特殊な欠陥クラス、すなわち共形欠陥に対して、数エントロピーの時間的成長、数分布の時間的進化、およびサブシステム内の関連相関行列の固有値プロファイルに関する解析的および数値的な結果を示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:57:11 GMT)
Minimal and Mechanistic Conditions for Behavioral Self-Awareness in LLMs [4.0] 自己認識(Self-Awareness)とは、明示的な監督なしに学習した振る舞いを正確に記述または予測する能力である。
この能力は、例えばモデルが評価中に真の能力をよりよく隠せるように、安全上の懸念を提起する。
自己認識は、容易に誘導・変調できる、ドメイン固有で線形な特徴として現れることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:27:05 GMT)
When Bias Helps Learning: Bridging Initial Prejudice and Trainability [3.9] 平均場解析(MF)は、ランダムネットワークにおけるパラメータ分布が勾配が消滅するか爆発するかを決定することを示した。
近年の研究では、入力空間の広い領域を1つのクラスに割り当てるIGB(initial-guessing bias)が示されている。
IGB と MF 分析をリンクする理論的証明を行い、特定のクラスに対するネットワーク前処理が、効率的に学習するための条件に本質的に結びついていることを確認する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:11:27 GMT)
VeriLLM: A Lightweight Framework for Publicly Verifiable Decentralized Inference [3.9] 本稿では,分散言語モデル (LLM) 推論のための公開検証プロトコルであるVeriLLMを紹介する。
VeriLLMは、軽量な経験的再実行と暗号的なコミットメントを組み合わせることで、検証者は基礎となる推論コストの約1%で結果を検証することができる。
We show that VeriLLM achieve reliable public verifiability with least overhead。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:52:26 GMT)
Pre-Attention Expert Prediction and Prefetching for Mixture-of-Experts Large Language Models [3.8] 我々は,高精度かつ軽量なエキスパートプレフェッチを実現するために,プレアテンションエキスパート予測を提案する。
当社の軽量プレアテンションエキスパートルータは、DeepSeek V2 Liteで93.03%、Qwen3-30Bで94.69%、Phi-mini-MoEで97.62%の精度を達成した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:05:07 GMT)
DeepRWCap: Neural-Guided Random-Walk Capacitance Solver for IC Design [3.8] 本稿では、機械学習誘導型ランダムウォークソルバであるDeepRWCapを紹介し、ウォークの各ステップを導くのに必要な遷移量を予測する。
DeepRWCapは、2段階のニューラルアーキテクチャを使用して、構造化された出力を、立方体面上の対面分布と空間カーネルに分解する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:25:13 GMT)
Environment-Aware Indoor LoRaWAN Ranging Using Path Loss Model Inversion and Adaptive RSSI Filtering [3.8] 本稿では,環境に配慮したマルチウォールパス損失モデルとRSSIのためのKalman prefilterを結合した,軽量で解釈可能なパイプラインを提案する。
アプローチは平均絶対誤差(MAE)は4.74m、根平均二乗誤差(RMSE)は6.76mである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:09:10 GMT)
DeepEyesV2: Toward Agentic Multimodal Model [3.8] エージェントマルチモーダルモデルは、テキストやイメージを理解するだけでなく、コード実行環境やWeb検索といった外部ツールを積極的に起動し、これらの操作を推論に統合する必要がある。
本稿では,DeepEyesV2を導入し,データ構築,トレーニング方法,モデル評価の観点からエージェント型マルチモーダルモデルの構築方法について検討する。
我々は、RealX-Benchや他の代表的なベンチマーク上でDeepEyesV2を評価し、実世界の理解、数学的推論、探索集約的なタスクにおけるその効果を実証した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:43:16 GMT)
LLM Teacher-Student Framework for Text Classification With No Manually Annotated Data: A Case Study in IPTC News Topic Classification [3.8] 本稿では,多言語ニューストピック分類モデルを構築するための教師学習フレームワークを提案する。
このフレームワークは、ニューストピックトレーニングデータセットを開発するための教師モデルとして、ジェネレーティブ事前学習トランスフォーマー(GPT)モデルを使用している。
学生モデルは比較的少数のトレーニングインスタンスで高いパフォーマンスを達成でき、強力なゼロショット言語間の能力を示すことができる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:53:53 GMT)
When Language Shapes Thought: Cross-Lingual Transfer of Factual Knowledge in Question Answering [3.7] 我々は、言語と思考理論のレンズを通して、非英語から英語への事実的知識伝達を探求する。
我々は、モデルの内部の'思考'言語と知識の源とを整合させるLanguage-to-Thoughtプロンプトを導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:55:15 GMT)
TimeMosaic: Temporal Heterogeneity Guided Time Series Forecasting via Adaptive Granularity Patch and Segment-wise Decoding [3.6] TimeMosaicは、時間的不均一性に対処することを目的とした予測フレームワークである。
TimeMosaicは、局所情報密度に応じて動的に粒度を調整するために適応パッチ埋め込みを採用している。
我々は,321億の観測値を持つ大規模コーパスを訓練し,最先端のTSFMと性能を比較検討した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:17:12 GMT)
Data Leakage and Deceptive Performance: A Critical Examination of Credit Card Fraud Detection Methodologies [3.6] 本研究はクレジットカード不正検出研究における方法論的厳密性について批判的に検討する。
基本的な方法論の原則に反した場合、単純なモデルでさえ、見事に印象的な結果が得られることを実証する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:30:51 GMT)
Compositional Phoneme Approximation for L1-Grounded L2 Pronunciation Training [3.6] 合成音素近似に基づくL1-grounded pronunciation training法を提案する。
韓国の20人の非ネイティブ英語話者による評価は、CPAベースのトレーニングが音響解析において76%の箱内フォルマントレートを達成することを示している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:58:40 GMT)
Multispectral-NeRF:a multispectral modeling approach based on neural radiance fields [3.6] 2次元画像に基づく3次元再構成技術は、通常RGBスペクトル情報に依存する。
RGB以外のスペクトルバンドは、ますます3D再構成に組み込まれている。
これらのスペクトルデータを統合する既存の方法は、高価なスキーム価格、低い精度、幾何学的特徴に悩まされることが多い。
我々は、マルチスペクトル情報を効果的に統合できる、NeRFから派生した拡張ニューラルアーキテクチャであるMultispectral-NeRFを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:10:03 GMT)
Who Is the Story About? Protagonist Entity Recognition in News [3.6] 本稿では,ニュースストーリーを定着させ,主要な展開を形作る組織を識別するタスクであるProtagonist Entity Recognition(PER)を紹介する。
我々は現在最先端のLarge Language Models (LLMs) を用いて、NER誘導プロンプトを通じて大規模ニュースコレクションを自動的にラベル付けする。
その結果,PERは物語中心の情報抽出に有効かつ有意義な拡張であることが示された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:53:45 GMT)
Embedding-Aware Quantum-Classical SVMs for Scalable Quantum Machine Learning [3.6] ViT埋め込みは量子アドバンテージを独自に実現し、従来のSVMよりも最大8.02%の精度向上を実現している。
量子カーネルの優位性は、組込み選択に決定的に依存し、変換器の注意と量子特徴空間の基本的な相乗効果を明らかにする最初の体系的な証拠を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:08:37 GMT)
Beyond Detection: Exploring Evidence-based Multi-Agent Debate for Misinformation Intervention and Persuasion [3.5] マルチエージェント・ディベート(MAD)フレームワークは、敵対的推論による誤情報検出をシミュレートするための有望なアプローチとして登場した。
我々は,事実証拠検索を取り入れた従来のアプローチを拡張するエビデンスベースのMADフレームワークであるED2Dを紹介する。
ED2Dによるデバンキング転写の説得的効果を,ヒトの専門家によって書かれたものと比較した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:15:53 GMT)
Large language models in materials science and the need for open-source approaches [3.4] 材料発見パイプライン全体にわたる最近の大規模言語モデル(LLM)の応用についてレビューする。
テキストから合成条件などの貴重な情報をLLMがどのように抽出するかを強調した。
ベンチマーク結果によると、オープンソースの代替手段は、透明性、コスト効率、データプライバシを提供しながら、パフォーマンスにマッチする可能性がある。
オープンソースモデルの改善が進むにつれて、科学的な発見のためにアクセスしやすく、柔軟で、コミュニティ主導のAIプラットフォームを構築するための、より広範な採用を提唱します。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 00:05:20 GMT)
Spilling the Beans: Teaching LLMs to Self-Report Their Hidden Objectives [3.3] 提案手法は,実ミスを認めるようにモデルを訓練する手法である。
簡単な質問応答設定における事実誤りの認識は、隠れた不整合目的の認識に一般化されることを示す。
SRFTの後、モデルは尋問された際に隠された目的の詳細を告白する傾向にある。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:09:44 GMT)
When Sufficient is not Enough: Utilizing the Rashomon Effect for Complete Evidence Extraction [3.3] 個々のモデルは通常、完全な証拠のサブセットのみを復元する。
我々は、リコール精度トレードオフ、エビデンスによるトレーニングの役割、確実なしきい値によるダイナミックアンサンブルを分析し、含意を議論する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:46:39 GMT)
PlantTraitNet: An Uncertainty-Aware Multimodal Framework for Global-Scale Plant Trait Inference from Citizen Science Data [3.3] マルチモーダルなマルチタスク不確実性を考慮したディープラーニングフレームワークであるPlantTraitNetを紹介する。
空間上の個々の特性予測を集約することにより、特性分布のグローバルマップを生成する。
以上の結果から,PlantTraitNetは評価されたすべての特性に対して,既存の特性マップを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:51:04 GMT)
A Trace-based Approach for Code Safety Analysis [3.2] Rustは、未定義の動作を許可するメモリセーフなプログラミング言語である。
本稿では、安全でないコードと未定義の振る舞いを理解するための体系的な枠組みを確立する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:20:35 GMT)
Environment-Aware Transfer Reinforcement Learning for Sustainable Beam Selection [3.2] 本稿では、転送学習と強化学習(RL)を用いて、5Gおよびネットワークを越えたビーム選択を改善するための新しい持続的アプローチを提案する。
本稿では,gNodeBs(gNBs)とその周辺散乱体の位置を表す点雲として環境をモデル化することを提案する。
点雲間のチャンファー距離を計算することにより、構造的に類似した環境を効率的に同定し、転送学習による事前学習モデルの再利用を可能にする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:50:05 GMT)
HLPD: Aligning LLMs to Human Language Preference for Machine-Revised Text Detection [3.1] 本稿では,機械改訂テキストから生成されたテキストを検出するために,HLPD(Human Language Preference Detection)を提案する。
HLPDは報酬に基づくアライメントプロセスであるHuman Language Preference Optimization (HLPO)を採用し、スコアリングモデルのトークン分布を人間的な書き込みにシフトさせる。
GPTシリーズモデルで修正されたテキストを検出すると、HLPDはAUROCをImBDよりも15.11%改善し、Fast-DetectGPTを45.56%上回った。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:47:34 GMT)
Fast and High Excitation Transport in Waveguide Quantum Electrodynamics [3.0] 2つの分離された冷間結合原子配列を用いて高速で高い原子励起輸送を示す。
この増強された導波路による励起の輸送は、少数のサブラディアントな右固有状態の優位性によって出現する。
本研究は,wQEDプラットフォームに適用可能性を示し,量子工学および量子情報応用に関する知見を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:17:31 GMT)
Direct Molecular Polarizability Prediction with SO(3) Equivariant Local Frame GNNs [3.0] 分子のテンソル応答特性を予測するために設計された,新しい同変グラフニューラルネットワークアーキテクチャを提案する。
我々のGNNは、局所的なメッセージパッシングフレームワークにスカラー、ベクトル、テンソルチャネルを統合することで、幾何学的情報を効果的にキャプチャする。
モデルの精度を評価するため、QM7-Xデータセットにおける分子の偏光率を推定し、テンソルメッセージパッシングがスカラーメッセージパッシングモデルより優れていることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:23:20 GMT)
Relative Energy Learning for LiDAR Out-of-Distribution Detection [3.0] アウト・オブ・ディストリビューション(OOD)検出は信頼性の高い自動運転にとって重要な要件である。
我々は,LiDAR点雲におけるOOD検出のためのフレームワークであるRelative Energy Learning (REL)を提案する。
トレーニング中のOODサンプルの欠如に対処するため,ポイントゲインと呼ばれる軽量なデータ合成戦略を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:29:18 GMT)
The Evolving Nature of Latent Spaces: From GANs to Diffusion [3.0] 拡散モデルが表現の重みをいかに断片化し、統一された内部空間の仮定に挑戦するかを示す。
我々は、生成的AIがどのように理解されているかを再考する:コンテンツを直接合成するのではなく、専門的なプロセスの創発的な構成としてである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:23:35 GMT)
Private Sketches for Linear Regression [3.0] 最小二乗問題と絶対偏差回帰問題に対する微分プライベートスケッチをリリースする。
これらのプライベートスケッチが利用可能になったことで、レグレッションに一般的に利用可能なソルバの応用が容易になった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:22:40 GMT)
Inclusion of Role into Named Entity Recognition and Ranking [2.8] 新しい課題は、エンティティが特定のコンテキストにおける自身の行動や属性に従って役割を演じるときである。
代表語やフレーズを学習し,それを用いた役割や実体の表現を構築した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:39:00 GMT)
Solving bilevel optimization via sequential minimax optimization [2.7] 本研究では,非滑らかな凸部となるような制約付き二段階最適化問題について検討する。
SMO法は低レベル目的関数の複雑さを改善する。
予備結果は、最近開発された1次ペナルティ性能と比較される。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:51:05 GMT)
LoReTTA: A Low Resource Framework To Poison Continuous Time Dynamic Graphs [2.6] 連続時間動的グラフの新たな逆向きフレームワークであるLoReTTAを紹介する。
TGNNのパフォーマンスを4つの広範囲なベンチマークデータセットと4つのState-of-the-Art(SotA)モデルで平均29.47%低下させる。
LoReTTAは11の攻撃ベースラインを上回り、4つの主要な異常検知システムに検出不能であり、4つのSotA対敵防御訓練手法に堅牢である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:41:02 GMT)
Adaptive Testing for Segmenting Watermarked Texts From Language Models [2.5] 大規模言語モデル(LLM)の急速な普及は、LLM生成したテキストと人間が書いたコンテンツとを区別する必要性を浮き彫りにしている。
ウォーターマーク技術は、微妙な統計信号をLCM生成テキストに埋め込んで信頼性の高い識別を可能にする。
我々は、この適応検出戦略を拡張し、与えられたテキストを透かしや非透かしに分割するより困難な問題に対処する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:50:19 GMT)
Aligning Attention with Human Rationales for Self-Explaining Hate Speech Detection [2.5] Supervised Rational Attention (SRA) は、モデル注意と人間の合理性を明確に整合させるフレームワークである。
SRAはヘイトスピーチ分類における解釈可能性と公平性の両方を改善する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:57:56 GMT)
Disturbance-based Discretization, Differentiable IDS Channel, and an IDS-Correcting Code for DNA-based Storage [2.5] 本稿では,複雑なIDSチャネルに対して,IDS訂正符号を効率よく生成することを目的とした,自動エンコーダベースのアプローチ THEA-codeを提案する。
これらの革新はオートエンコーダの収束を成功させ、チャネルカスタマイズIDS補正コードを生成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:45:54 GMT)
Leveraging Text-Driven Semantic Variation for Robust OOD Segmentation [2.5] 本稿では,テキスト駆動型OODモデルを訓練し,視覚言語空間における意味論的に多様なオブジェクト集合を学習する手法を提案する。
視覚的およびテキスト的情報を整合させることにより、本手法は、見えない物体に効果的に一般化し、多様な運転環境において堅牢なOODセグメンテーションを提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:54:23 GMT)
Evaluating Online Moderation Via LLM-Powered Counterfactual Simulations [2.4] エージェントベースモデリングを強化するために、LLM(Large Language Models)をうまく活用することができる。
我々は,モデレーションの介入によって有害な行動が影響される対実シミュレーションを可能にする,オンラインソーシャルネットワークのシミュレータを設計する。
我々は、OSNエージェントの心理的リアリズムとパーソナライズされたモデレーション戦略の優れた効果を明らかにする広範な実験を行う。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:31:59 GMT)
MI-to-Mid Distilled Compression (M2M-DC): An Hybrid-Information-Guided-Block Pruning with Progressive Inner Slicing Approach to Model Compression [2.4] そこで我々は,MI-to-Mid Distilled Compression (M2M-DC) について紹介する。
M2M-DCは、ラベル対応の相互情報信号によって残留ブロックをランク付けする。
その後、短いKD相をステージコヒーレントで残留安全なチャネルスライシングと交換する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:36:29 GMT)
Rapidly Learning Soft Robot Control via Implicit Time-Stepping [2.3] DisMechは、ソフトダイナミクスと摩擦接触の両方を扱うことができる完全に暗黙のソフトボディシミュレータである。
剛性マニピュレータにおけるデルタ結合位置制御に類似したデルタ自然曲率制御を導入する。
暗黙のタイムステッピングにより、500環境の並列ステップは、非接触ケースでは最大6倍、コンタクトリッチシナリオでは最大40倍の速度を達成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:24:56 GMT)
Mitigating Sexual Content Generation via Embedding Distortion in Text-conditioned Diffusion Models [2.3] Distorting Embedding Space (DES) はテキストエンコーダベースの防御機構である。
DESは、アンセーフプロンプトを用いてテキストエンコーダから抽出されたアンセーフな埋め込みを、慎重に計算された安全な埋め込み領域に変換する。
DESはまた、敵の攻撃に対する堅牢性を高めるために、ヌードの埋め込みを中立的な埋め込みと整合させることで、ヌードの埋め込みを中和する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:18:58 GMT)
A Hybrid Autoencoder-Transformer Model for Robust Day-Ahead Electricity Price Forecasting under Extreme Conditions [2.2] 本稿では,拡散注意変換器モデルとオートエンコーダ自己回帰モデルを統合した新しいハイブリッドディープラーニングフレームワークを提案する。
カリフォルニアと山東省でサンプリングされたデータセットの実験により、我々のフレームワークは予測精度、堅牢性、計算効率において最先端の手法を大幅に上回っていることが示された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:47:24 GMT)
Convergence of Actor-Critic Learning for Mean Field Games and Mean Field Control in Continuous Spaces [2.1] 我々は[Angiuli et al., 2023a]に提示されたディープアクター・クリティック・強化学習アルゴリズムの収束を確立する。
このアルゴリズムは、2つの学習率の比率に応じて平均場ゲーム(MFG)または平均場制御(MFC)問題の解を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:55:34 GMT)
Active Learning for Animal Re-Identification with Ambiguity-Aware Sampling [2.1] 本稿では、補完的なクラスタリング手法を利用して構造的不明瞭な領域を探索し、ターゲットとする新しいAL Re-IDフレームワークを提案する。
提案手法は,既存の基盤,USL,ALのベースラインを一貫して上回ることを示す。
具体的には,基礎的手法,USL法,AL法を用いて,13種の野生生物データセットの平均10.49%,11.19%,および3.99%(mAP)の改善を報告した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:13:40 GMT)
On (Approximate) Pareto Optimality for the Multinomial Logistic Bandit [2.0] マルチノードロジット帯域問題に対処するための新しいオンライン学習アルゴリズムを提供する。
MNLモデルがもたらす課題にもかかわらず、我々は新しいアッパー信頼境界法(UCB)を開発した。
我々は,MNL-Bandit問題に対する後悔と推定誤差のトレードオフを特徴付ける理論的保証を開発する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:20:00 GMT)
ACE-ICD: Acronym Expansion As Data Augmentation For Automated ICD Coding [2.0] 本稿では,医療用頭字語を拡張するために,大規模言語モデルを活用した新しい効果的なデータ拡張手法を提案する。
我々のアプローチであるACE-ICDは、共通コード、レアコード、フルコード代入を含む、複数の設定にまたがる新しい最先端のパフォーマンスを確立します。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:11:20 GMT)
FedNET: Federated Learning for Proactive Traffic Management and Network Capacity Planning [2.0] FedNETは、大規模通信ネットワークにおけるリスクの高いリンクを早期に識別するためのフレームワークである。
FedNETは、ノードレベルのトラフィックの時間的進化を分散的にモデル化するためにフェデレートラーニングを採用している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:36:16 GMT)
Adam symmetry theorem: characterization of the convergence of the stochastic Adam optimizer [1.9] 我々は、アダムが収束する単純二次強凸 SOP のクラスを、勾配ステップの数が無限大に増加するにつれて証明する。
特に、SOP の確率変数が対称分布でない標準的な場合、アダムが SOP の最小値に収束すると、アダムのステップの数が無限大に増加する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:45:32 GMT)
MERaLiON-SER: Robust Speech Emotion Recognition Model for English and SEA Languages [1.8] 本稿では,英語と東南アジア語に対する頑健な音声感情認識モデルMERaLiON-SERを提案する。
本モデルでは,重み付きカテゴリーのクロスエントロピーとコンコーダンス相関係数の損失を組み合わせたハイブリッド目標を用いて学習を行った。
我々は,MERaLiON-SERがオープンソース音声エンコーダと大規模オーディオ-LLMを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:49:45 GMT)
Wasm: A Pipeline for Constructing Structured Arabic Interleaved Multimodal Corpora [1.8] 我々は、新しいアラビアマルチモーダルデータセットを作成するためにCommon Crawlデータセットを処理するパイプラインWasmを提示する。
テキスト抽出のみに焦点を当てた既存のアラビア語コーパスとは異なり、我々のアプローチはウェブコンテンツの構造的整合性を保っている。
既存の主要なデータセットに対して、データ処理パイプラインの包括的な比較分析を提供します。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:10:31 GMT)
PointCubeNet: 3D Part-level Reasoning with 3x3x3 Point Cloud Blocks [1.7] PointCubeNetは、新しいマルチモーダル3D理解フレームワークである。
部分アノテーションを必要とせずに部分レベルの推論を実現する。
これは、教師なしの3D部分レベルの推論を行う最初の試みである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:16:07 GMT)
NOVO: Bridging LLaVA and SAM with Visual-only Prompts for Reasoning Segmentation [1.7] RISegは視覚のみのプロンプトを通じて視覚言語モデル(VLM)とセグメンテーションモデルをブリッジするフレームワークである。
境界品質を高め, レベルセグメンテーションを可能にするため, トレーニングフリーリファインメントモジュールを導入する。
実験によると、RISegは複数のメトリクスとモデルサイズにわたる最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:58:32 GMT)
Med-SORA: Symptom to Organ Reasoning in Abdomen CT Images [1.7] Med-SORAは腹部CT画像における症状と臓器の推論の枠組みである。
私たちの知る限りでは、医療マルチモーダルラーニングにおける症状から組織への推論に対処する最初の研究である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:30:51 GMT)
Evaluating LLMs for Anxiety, Depression, and Stress Detection Evaluating Large Language Models for Anxiety, Depression, and Stress Detection: Insights into Prompting Strategies and Synthetic Data [1.6] メンタルヘルス障害は世界中の成人の5分の1以上に影響を与える。
臨床面接のDAIC-WOZデータセットを用いて、不安、抑うつ、ストレス分類のモデルを微調整した。
応力検出では、ゼロショット合成法がF1の0.884、ROC AUCの0.886に達した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:38:26 GMT)
Inference-Time Scaling of Diffusion Models for Infrared Data Generation [1.5] 赤外線アプリケーションのための視覚モデルの開発は、赤外線アノテーションの専門知識によって妨げられている。
領域適応CLIPベースの検証器を用いて、赤外画像生成品質を向上させる推論時間スケーリング手法を提案する。
KAIST Multispectral Pedestrian Detection Benchmark データセットの FID スコアを10%削減した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:18:38 GMT)
Beyond Centrality: Understanding Urban Street Network Typologies Through Intersection Patterns [1.4] 本研究はサンフランシスコベイエリアの100以上の都市を調査する。
本稿では,3方向交差点と4方向交差点の異なるタイプの交差点を区別し,交差点を分類するための新しい指標を提案する。
機械学習におけるクラスタリングアルゴリズムの適用により、3つの異なる型を同定した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:22:05 GMT)
Revisiting Stochastic Approximation and Stochastic Gradient Descent [1.2] 本稿では,近似 (SA) アルゴリズムと勾配 Descent (SGD) アルゴリズムの収束性を証明する新しい手法を提案する。
新しいアプローチはGSLLN(Generalized Strong Law of Large Numbers)と呼ばれる概念に基づいており、従来のSLLNを拡張している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:14:23 GMT)
A Deep Learning Model to Predicting Changes in Consumer Attributes for New Line-extended Products [1.2] マーケターは、企業が市場に参入する前に、新ライン延長製品の主要な顧客特性を知る必要がある。
本稿では,新しい深層学習モデルを用いて,新しいライン延長製品における消費者属性の変化を予測する手法について述べる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:50:03 GMT)
Surgical Agent Orchestration Platform for Voice-directed Patient Data Interaction [1.2] da Vinciロボット手術では、外科医の手と目が完全に関与しているため、中断することなくマルチモーダルな患者のデータにアクセスし操作することは困難である。
大規模言語モデル(LLM)によって駆動されるオーケストレーションエージェントと3つのタスク固有エージェントからなる階層型マルチエージェントフレームワーク上に構築された音声指向型手術エージェントオーケストレータプラットフォーム(SAOP)を提案する。
SAOPは240の音声コマンドに対して高い精度と成功率を達成する一方、LLMベースのエージェントは音声認識エラーや多様な、曖昧なフリーフォームコマンドに対する堅牢性を改善し、最小侵襲のda Vinciロボット手術をサポートする可能性を示している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:47:24 GMT)
High-dimensional Path-Encoded Entanglement Distribution Between Photonic Chips Enabled by Multimode Phase Stabilisation [1.1] フォトニックチップ間での4次元経路符号化量子状態の分布を,新しい多モード位相安定化アルゴリズムにより実証する。
局所射影測定の最小値を用いて、2つのチップで完全な量子状態トモグラフィーを行うことができる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:44:16 GMT)
GCAMPS: A Scalable Classical Simulator for Qudit Systems [1.1] 古典量子システムのための新しいハイブリッドシミュレーション手法を提案する。
我々はこの方法を3自由度を持つ量子系、すなわち四重項の量子系にベンチマークする。
我々は、同じ$T$ドープなランダムベンチマーク回路上でのqubitシミュレーションと比較して、qutritシミュレーションの方が改善されていることを見出した。
この拡張により、従来量子デバイスにアクセスできなかった問題を古典的にシミュレーションすることができる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:39:23 GMT)
Quantum Sensing with Bright Two-Mode Squeezed Light in a Distributed Network of Gyroscopes [1.1] 本研究は、角速度推定を改善するために、分散量子センシングと光学ジャイロスコープの統合について検討する。
複数の空間分離型光学ジャイロスコープ間の連続可変絡み合いを利用した新しい構成を提案する。
このスキームは、新興量子ネットワークにおける量子エンハンスな慣性航法と精度メートル法に潜在的に応用できる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:30:47 GMT)
Self-Evaluating LLMs for Multi-Step Tasks: Stepwise Confidence Estimation for Failure Detection [1.1] 自己評価型大規模言語モデル(LLM)は、複雑な推論において有意義な信頼度推定を提供する。
ステップワイズ評価は一般的に、潜在的なエラーを検出する際の総合的なスコアよりも優れている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:19:51 GMT)
GraphGDel: Constructing and Learning Graph Representations of Genome-Scale Metabolic Models for Growth-Coupled Gene Deletion Prediction [1.1] 本稿では,制約に基づくメタボリックモデルからグラフ表現を構築するための体系的なパイプラインを提案する。
第2に,これらのグラフ表現を遺伝子およびメタボライト配列データと統合し,成長に結合した遺伝子削除戦略を予測するディープラーニングフレームワークを開発する。
我々のアプローチは確立されたベースラインを一貫して上回り、全体的な精度で14.04%、16.26%、13.18%の改善を実現している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:24:28 GMT)
Duality-based Mode Operations and Pyramid Multilayer Mapping for Rhetorical Modes [1.1] 本稿では,二元性に基づく二元性モードの操作を提案し,組み合わせや一般化といった生成モードを導入している。
また、ピラミッド多層マッピングフレームワークも提供し、結果として生じる認知の複雑さを低減する。
この研究から、将来のAIシステムが言語トークンだけでなく、階層化された修辞的推論構造上で動作するための経路を特定できるだろう。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:17:00 GMT)
Singling out people without knowing their names - Behavioural targeting, pseudonymous data, and the New Data Protection Regulation [1.0] データ保護法が行動ターゲティングに適用されるかどうかについては熱心に議論されている。
多くの行動ターゲティング企業は、個人に関するデータに名前を結び付けない限り、個人データを一切処理しないと言っている。
本稿では,データ保護法が行動ターゲティングに適用されるべきであると主張している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:09:31 GMT)
OntoTune: Ontology-Driven Learning for Query Optimization with Convolutional Models [1.0] オントロジーは構造化され、情報に富んだ知識表現である。
本稿では,クエリ最適化のための学習を強化するオントロジーベースのプラットフォームであるOntoTuneを提案する。
ケーススタディでは、OntoTuneのデフォルト駆動型学習性能が、データベースシステムクエリ実行と比較してどのように向上するかを示している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:08:19 GMT)
Garbage Vulnerable Point Monitoring using IoT and Computer Vision [1.0] 本稿では,モノのインターネット (IoT) とコンピュータビジョン (CV) を用いた都市ごみ管理手法を提案する。
このシステムは、ストリートレベルのカメラとオブジェクト検出アルゴリズムを用いて、廃棄されたゴミを素早く検知し、監視することができる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:27:51 GMT)
Finite sample learning of moving targets [0.9] 対象のほぼ正しい推定値(PAC)を構築するのに必要なサンプル数に縛られた小説を導出する。
提案手法は,自律型緊急ブレーキへの応用について実証した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:12:42 GMT)
ClusterMine: Robust Label-Free Visual Out-Of-Distribution Detection via Concept Mining from Text Corpora [0.9] ClusterMineは、正のラベルにアクセスせずに最先端のOOD検出性能を実現するための最初の方法である。
クラスタリングによって)視覚のみのサンプル一貫性とゼロショットのイメージテキスト一貫性を組み合わせることで、大きなテキストコーパスから肯定的な概念を抽出する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:04:01 GMT)
Exploring the "Great Unseen" in Medieval Manuscripts: Instance-Level Labeling of Legacy Image Collections with Zero-Shot Models [0.9] 本稿は,中世の写本ページとその内容をよりホモリスティックに理論化し,最新技術を用いて全写本フォリオを分割・記述することを目的としている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:56:58 GMT)
EmoBang: Detecting Emotion From Bengali Texts [0.8] 大規模で標準化されたデータセットの欠如は、感情検出のための低リソース言語としてBengaliを分類している。
既存の研究は主に古典的な機械学習モデルと伝統的な特徴工学を用いており、性能は限られている。
これはベンガルの感情検出のための最初の包括的なベンチマークである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:07:40 GMT)
Saliency Map-Guided Knowledge Discovery for Subclass Identification with LLM-Based Symbolic Approximations [0.7] 本稿では,センサ信号に基づく知識発見のためのニューラルシンボリックアプローチを提案する。
我々は、トレーニングされたニューラルネットワークから導出される勾配に基づく塩分濃度マップを用いて、発見プロセスの導出を行う。
確立された時系列分類データセットの実験結果から,サリエンシマップ駆動法による知識発見の有効性が示された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:11:49 GMT)
multiMentalRoBERTa: A Fine-tuned Multiclass Classifier for Mental Health Disorder [0.6] ソーシャルメディアからのメンタルヘルス障害の早期発見は、適切なリソースへのタイムリーなサポート、リスクアセスメント、参照を可能にするために重要である。
この研究は、一般的な精神状態のマルチクラス分類用に設計された微調整RoBERTaモデルであるMultiMentalRoBERTaを紹介する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:54:07 GMT)
CodeEvolve: An open source evolutionary coding agent for algorithm discovery and optimization [0.6] 我々は,大規模言語モデルと遺伝的アルゴリズムを結合して複雑な計算問題を解く,オープンソースの進化的符号化エージェントであるCodeEvolveを紹介する。
我々のフレームワークは、一般化された科学的発見のための最近の手法に基づいて、強力な進化的概念を大規模言語モデルドメインに適用する。
我々は、Google DeepMindのクローズドソースAlphaEvolveを評価するために使用される数学ベンチマークのサブセット上で、CodeEvolveの厳密な評価を行う。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:12:41 GMT)
Explainable Probabilistic Machine Learning for Predicting Drilling Fluid Loss of Circulation in Marun Oil Field [0.5] 本研究では,ガウス過程回帰(GPR)に基づく確率論的機械学習フレームワークを提案する。
GPRモデルは, 掘削パラメータ間の非線形依存関係を捕捉し, 予測の不確実性を定量化し, リスクの高い意思決定に信頼性を高める。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:34:02 GMT)
Classification of Microplastic Particles in Water using Polarized Light Scattering and Machine Learning Methods [0.5] 本稿では, 水中で直接マイクロプラスチックを識別し, その場で分類するための新しいリフレクションベースアプローチを紹介し, 検証する。
我々は、リニア偏光レーザー光を照射し、反射信号を捕捉することで、無色のマイクロプラスチック粒子(50-300$mu$m)を分類する。
高密度ポリエチレン, 低密度ポリエチレン, ポリプロピレンの3種類の共重合体を画像ベース分類に深部畳み込みニューラルネットワーク(CNN)を用いて同定した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:51:15 GMT)
SinSEMI: A One-Shot Image Generation Model and Data-Efficient Evaluation Framework for Semiconductor Inspection Equipment [0.4] SinSEMIは、単一の光学画像から多彩で非常にリアルな画像を生成する新しいワンショット学習手法である。
実験の結果,SinSEMI生成画像は高い忠実度と有意義な多様性を達成できた。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:01:10 GMT)
Real-Time LiDAR Super-Resolution via Frequency-Aware Multi-Scale Fusion [0.4] FLASH (Frequency-aware LiDAR Adaptive Super- resolution with Hierarchical fusion) は、二重ドメイン処理による制限を克服する新しいフレームワークである。
FLASHは、2つの重要なイノベーションを統合する: (i) 局所的な空間的注意とFFTによるグローバルな周波数領域分析を組み合わせ、細粒度の幾何と周期的な走査パターンの両方をログ線形複雑度で捉え、 (ii) 学習された位置特異的な特徴集約による従来のスキップ接続を置き換え、CBAMによる動的特徴選択のために強化する適応的マルチスケールフュージョン。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:38:15 GMT)
Counterfactual Explanation for Multivariate Time Series Forecasting with Exogenous Variables [0.4] いくつかの機械学習モデルはブラックボックスとして機能し、解釈可能性が重要な関心事となる。
この問題に対処する1つのアプローチは、モデル予測に関する洞察を提供することを目的とした、反現実的説明(CE)である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:00:28 GMT)
Real-time pothole detection with onboard sensors and camera on vehicles [0.4] 本稿では,車載センサーの助けを借りて,これらのポットホールをリアルタイムに識別する方法について検討した。
本実装では, ポットホール検出にSVM分類器を用い, ローカル道路から収集したデータに基づいて98.1%の精度を実現した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:27:47 GMT)
Machine-Learning Accelerated Calculations of Reduced Density Matrices [0.4] 我々は、ニューラルネットワーク(NN)アーキテクチャを用いて、大規模システムに対する$n$-RDMの計算を高速化し、予測することを提案する。
根底にある直感では、$n$-RDMはブリルアンゾーン(BZ)上の滑らかな関数であり、補間可能であるため、NNが小さな$n$-RDMで訓練して大きな関数を予測することができる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:23:34 GMT)
Simulation-based Methods for Optimal Sampling Design in Systems Biology [0.4] 本研究では,最適サンプリング設計のための2つのシミュレーション手法を提案する。
E-Optimal- rank (EOR) はE-Optimal criterionを使用し、E-Optimal criterionはLong Short-Term Memory (LSTM) ニューラルネットワークを使用する。
Lotka-Volterra と 3-compartment モデルに基づくシミュレーション研究は、提案手法がランダム選択と古典的E-最適設計の両方より優れていることを示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:26:51 GMT)
Employing Sentence Space Embedding for Classification of Data Stream from Fake News Domain [0.4] 本稿では,文空間法を用いた自然言語データストリーム分類手法を提案する。
画像分類専用の畳み込みディープネットワークを使用することで、テキストデータに基づいてフェイクニュースを認識できる。
実生活のFakedditデータセットに基づいて,提案手法をデータストリーム分類のための最先端アルゴリズムと比較した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:59:40 GMT)
Estimation of aboveground biomass in a tropical dry forest: An intercomparison of airborne, unmanned, and space laser scanning [0.3] パリ協定第5条は、高品質の森林データの必要性を強調している。
熱帯乾燥林は最もよく理解されていない熱帯林の1つである。
コスタリカ・グアナカステ県の10の常緑乾燥林から推定されるAGB値は26.02 Mg/haから175.43 Mg/haである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:53:57 GMT)
New perspectives on quantum kernels through the lens of entangled tensor kernels [0.3] 量子核の埋め込みはすべて、絡み合ったテンソル核として理解できることが示される。
この視点が量子核の独特な帰納バイアスとそれらの量子化の潜在的な方法の両方に新しい洞察を得られるかについて議論する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:52:47 GMT)
Pandar128 dataset for lane line detection [0.3] Pandar128は128ビームのLiDARを使用したレーン線検出のための最大の公開データセットである。
52,000枚以上のカメラフレームと34,000枚のLiDARスキャンが含まれており、ドイツの様々な現実世界で撮影されている。
また,このデータセットを補完するために,車線再建のための軽量ベースライン法であるSimpleLidarLaneを導入する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:18:36 GMT)
Federated Learning for Video Violence Detection: Complementary Roles of Lightweight CNNs and Vision-Language Models for Energy-Efficient Use [0.3] フェデレーション学習は、プライバシを保存するが、大きなビジョン保存モデル(VLM)をデプロイすることは、大きなエネルギーと持続可能性の課題をもたらす。
RWF-2000データセットとRLVSデータセット上で、現実的な非IID分割の下での連邦暴力検出の3つの戦略を比較した。
すべての方法がバイナリ暴力検出において90%以上の精度を達成している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:01:51 GMT)
Het 'right to be forgotten' en bijzondere persoonsgegevens: geen ruimte meer voor een belangenafweging? [The 'Right to Be Forgotten' and Sensitive Personal Data: No Room for Balancing?] [0.2] ロッテルダム地方裁判所は、人々が弁護士の名前を探すと、Googleはもはやブログにリンクしないかもしれないと裁定した。
ブログ投稿が刑事判決に関するため、裁判所は弁護士の要請を認めた。
特別なカテゴリのデータに対する裁判所の理由付けは、表現の自由の問題を生じさせる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:09:29 GMT)
Anatomy-Aware Lymphoma Lesion Detection in Whole-Body PET/CT [0.2] 深層学習に基づく病変検出モデルに解剖学的事前情報を加える効果について検討した。
解剖学的な事前を含めることで、nnDetectionフレームワーク内の検出性能が大幅に向上する。
Swin Transformerは、nnDetectionで使用される従来の畳み込みニューラルネットワーク(CNN)エンコーダに対して明確な優位性を提供していない。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:39:22 GMT)
Modeling and Topology Estimation of Low Rank Dynamical Networks [0.2] 識別可能性を保証する低階動的ネットワークモデルを提案する。
この理論的結果に基づいて,ネットワークエッジを推定する一貫した手法を開発した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:42:35 GMT)
Subspace State Transfer in Coined Quantum Walks [0.2] 本研究では,ある状態に局在した部分空間が別の状態に遷移する,特定の量子ウォークにおける輸送現象について検討する。
我々はまず、エルミートダイグラフのスペクトル特性を用いて、完全かつかなり良い部分空間状態移動のキャラクタリゼーションを開発する。
次に、整数ステップで完全部分空間状態移動が発生するかどうかをテストする重み付け時間アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:29:29 GMT)
Forecasting intermittent time series with Gaussian Processes and Tweedie likelihood [0.1] 我々は、断続時系列の確率的予測のための潜在関数としてガウス過程(GP)を採用する。
我々は、潜在GP変数と、負二項分布(NegBinGP)とツイーディ分布(TweedieGP)の2種類の予測分布を結合する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:58:55 GMT)
RRTS Dataset: A Benchmark Colonoscopy Dataset from Resource-Limited Settings for Computer-Aided Diagnosis Research [0.1] 我々はOlympus 170およびPen- Tax i-Scanシリーズ内視鏡を用いて収集した大腸内視鏡像のデータセットを紹介する。
このデータセットには164人の患者から得られた1,288枚のポリプと31人の患者から得られた1,657枚のポリプフリー画像が含まれている。
パフォーマンスは、キュレートされたデータセットと比較して低く、アーティファクトと可変品質のイメージの現実的な難しさを反映している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:51:41 GMT)
Achieving fast and robust perfect entangling gates via reinforcement learning [0.1] 我々は、PEゲートを生成する近似パルス形状を発見するために強化学習技術を利用する。
RLエージェントのコレクションは、堅牢なシミュレーション環境で訓練され、効果的な制御戦略の特定を可能にする。
RLアプローチはハードウェアに依存しないため、様々な量子コンピューティングプラットフォームで広く適用可能である可能性がある。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:07:19 GMT)
Privacy-Preserving Personalization in Education: A Federated Recommender System for Student Performance Prediction [0.1] 教育のデジタル化は、データ駆動型パーソナライゼーションの機会を提供するが、学生のデータプライバシーにも課題をもたらす。
フェデレートラーニング(FL)を用いた新しいプライバシ保護レコメンデータシステムを提案し,その課題に対処するために評価を行った。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:44:47 GMT)
When Evidence Contradicts: Toward Safer Retrieval-Augmented Generation in Healthcare [0.1] 本研究では,医学関連クエリに対する応答生成における5つの大規模言語モデル(LLM)の性能について検討する。
以上の結果から,非常に類似した抽象概念間の矛盾は,実際に性能を低下させ,不整合を招き,モデル解答の事実的精度を低下させることが示された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:27:54 GMT)
Beyond Data Scarcity Optimizing R3GAN for Medical Image Generation from Small Datasets [0.0] 本研究では,GAN(Generative Adversarial Network)を小さなデータセットに最適化して,現実的かつ診断的に意味のある画像を生成する方法について検討する。
R3GANによる体系的な実験に基づいて,効率的なトレーニング戦略を確立し,256x256解像度データセットの最適化構成を設計した。
生成したサンプルは、不均衡な胚のデータセットのバランスをとるために使用され、分類性能が大幅に向上した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:23:39 GMT)
Resource-Efficient Quantum Optimization via Higher-Order Encoding [0.0] HUBO(Higher-Order Unconstrained Binary Optimization)は,より資源効率の高い定式化を実現する。
提案手法はHUBOハミルトニアンを体系的に構成し,ゲートアサインメント(GAP)やk-Colorable Subgraph(MkCS),プログラミング(IP)問題などのベンチマークにおいてQUBOと比較し,キュービット要求を指数関数的に削減し,CNOTゲート数を少なくとも89.6%削減する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:17:55 GMT)
A passive atomtronics filter for Fermi gases [0.0] 原子線フィルタ装置は、2成分のフェルミガスの成分を反発性接触相互作用で空間的に分離する。
橋梁状電位が2つのリング状電位を結合するバーベル型トラップ電位を特徴付ける。
強く反発する体制では、それぞれのリングトラップは最終的にフェルミオンの1種を貯蔵する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:43:48 GMT)
Extending Quantum Computing through Subspace, Embedding and Classical Molecular Dynamics Techniques [0.0] 量子コンピュータを用いた化学システムの研究を容易にする技術について概説する。
マルチスケール/マルチ物理シミュレーションワークフロー内に展開された量子選択型構成相互作用の実証-概念実証について述べる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:24:23 GMT)
A Picture is Worth a Thousand (Correct) Captions: A Vision-Guided Judge-Corrector System for Multimodal Machine Translation [0.0] 本稿では,自動誤り検出と修正により,トレーニングデータの品質問題に対処する2段階のアプローチを提案する。
提案手法では,マルチモーダル言語モデルを利用した視覚強調型判断補正パイプラインを提案する。
このパイプラインは4つの言語にわたる28,928のトレーニング例を処理し、言語ごとの平均17.1%のキャプションを修正している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:02:48 GMT)
ZK-SenseLM: Verifiable Large-Model Wireless Sensing with Selective Abstention and Zero-Knowledge Attestation [0.0] ZK-SenseLMはセキュアで監査可能な無線センシングフレームワークである。
Wi-Fiチャネル状態情報のための大モデルエンコーダと、ポリシ基底決定層と、推論のゼロ知識証明とをペアリングする。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:51:36 GMT)
What is the Return on Investment of Digital Engineering for Complex Systems Development? Findings from a Mixed-Methods Study on the Post-production Design Change Process of Navy Assets [0.0] 複雑なエンジニアリングシステムでは、通常、スケジュールとコストのオーバーランに直面すると同時に、デプロイ後のパフォーマンスが低下する。
INCOSEと国防総省(DoD)の協力を得て、システムエンジニアリング(SE)コミュニティは、デジタルエンジニアリング(DE)を潜在的な治療法と見なしている。
本研究は, 海軍の運用後設計変更プロジェクトの予備設計フェーズに責任を負う海軍SEチームの事例研究から得られた知見を提示する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:16:15 GMT)
Walsh-Hadamard Neural Operators for Solving PDEs with Discontinuous Coefficients [0.0] ニューラル作用素は偏微分方程式の解作用素を学習するための強力なツールとして登場した。
本稿では,WHNO(Walsh-Hadamard Neural Operator)を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:49:20 GMT)
Vision-Based System Identification of a Quadrotor [0.0] 本稿では,視覚に基づくシステム識別技術の四重項モデリングおよび制御への応用について検討する。
グレーボックスモデリングを用いて不確実性を緩和し,車載視覚システムの有効性を評価する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:31:28 GMT)
Verifiable Fine-Tuning for LLMs: Zero-Knowledge Training Proofs Bound to Data Provenance and Policy [0.0] 本稿では,簡潔なゼロ知識証明を生成するプロトコルとシステムであるVerifiable Fine Tuningを提案する。
本システムは,確率的監査と帯域幅制約によって構成されることを示す。
結果から,本システムは実パラメータ効率のよいパイプラインで実現可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:02:49 GMT)
Transport regimes of biphoton-state quantum walks in ordered and disordered arrays of nonlinear waveguides [0.0] 非線形導波路の配列における駆動量子ウォークは、弾道伝播ではなく、2つの異なる輸送状態を示すことを示す。
アンダーソンのローカライゼーションの観察に加えて、どちらの種類の障害も超ボール主義体制の消滅につながっている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:21:39 GMT)
The time qubit [0.0] 磁場中のスピンの沈み込みは、例えばトンネル時間測定などにおいて量子時計としてしばしば用いられる。
このような時計は、時間矢印を量子2レベルシステムとして扱うことによって、反対の時間方向のコヒーレントな重ね合わせに存在しうることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:42:41 GMT)
The human-machine paradox: how collaboration creates or destroys value, and why augmentation is key to resolving it [0.0] 我々は、人間機械技術政策の真のボトムライン経済効果は、危険なほど誤解されていると論じる。
以上の結果から, 複雑なシナリオにおいては, 人的機械戦略が最も経済的に有効であるが, 真の拡張が達成された場合に限る。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:06:27 GMT)
The Wisdom of the Crowd: High-Fidelity Classification of Cyber-Attacks and Faults in Power Systems Using Ensemble and Machine Learning [0.0] 本稿では,機械学習に基づくサイバー攻撃と物理的障害の分類のための高忠実度評価フレームワークを提案する。
モデルはラベル付き時間領域測定に基づいてトレーニングされ、サブサイクル応答性のために設計されたリアルタイムストリーミング環境で評価された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:15:37 GMT)
The Environmental Impact of Ensemble Techniques in Recommender Systems [0.0] 推薦システムにおけるアンサンブル技術は10~30%の精度向上を実証しているが、その環境影響は未測定のままである。
この論文は、単一最適化モデルと比較してアンサンブル技術が環境に与える影響について考察する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:06:58 GMT)
TauFlow: Dynamic Causal Constraint for Complexity-Adaptive Lightweight Segmentation [0.0] 本稿では,軽量セグメンテーションモデルであるTauFlowを提案する。
TauFlowの中核は、脳のようなメカニズムにインスパイアされた動的な機能応答戦略である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:47:21 GMT)
Sufficiency of the counterfactual account of Lüders' rule to rule out ontological models of quantum mechanics [0.0] L'uders' 則の反実的な説明は、本質的に量子形式論とは相容れない存在論的モデルを示す。
これは、オントロジーモデル、あるいは文脈モデルでさえ、私たちが期待するもの(通常は暗黙的に仮定される量子状態の更新規則)と異なる振る舞いをしなければならないか、あるいは量子的振る舞いをモデル化できないことを暗示している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:54:44 GMT)
State-Selective Ionization and Trapping of Single H$_2^+$ Ions with (2+1) Multiphoton Ionization [0.0] 2+1)共鳴強調多光子イオン化(REMPI)を用いた極低温リニアポールトラップへの単一H$+$分子イオンの高効率偏光負荷について報告する。
H$+$イオンは、$X;1Sigma_g+$状態から$E,F;1Sigma_g+$状態へのH$分子の共鳴2光子励起と非共鳴1光子イオン化によって生成される。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:15:27 GMT)
Spectroscopy and Coherence of an Excited-State Transition in $\text{Tm}^{3+}$:$\text{YAlO}_{3}$ at Telecommunication Wavelength [0.0] 希土類結晶中の1451.37nm励起状態ゼロフォノン線(ZPL)の分光特性とコヒーレンス特性を特徴付ける。
この結果から,このような遷移を量子技術に活用できる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:59:07 GMT)
Slow - Motion Video Synthesis for Basketball Using Frame Interpolation [0.0] バスケットボールの放送映像は伝統的に30-60fpsで撮影され、ダンクやクロスオーバーのような急激な演奏を視聴者が鑑賞する能力を制限する。
本稿では,高品質なバスケットボール特有の補間フレームをリアルタイムに生成するスローモーション合成システムを提案する。
提案手法は,Pak Signal-to-Noise Ratio (PSNR) とStructure similarity (SSIM) を用いて,Super SloMoとベースラインRIFEモデルと比較する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:58:59 GMT)
Sentiment Analysis On YouTube Comments Using Machine Learning Techniques Based On Video Games Content [0.0] 本研究は,YouTubeのコメントに基づいて,ビデオゲームに対する感情分析を行う。
この分析は、複数の人気ゲームビデオにまたがり、ユーザーの好みや批判に関するトレンドと洞察を明らかにした。
この結果は,ユーザのコメントに表されるニュアンスな感情を捉える上で,高度な感情分析の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:02:25 GMT)
Sensitivity of Small Language Models to Fine-tuning Data Contamination [0.0] 小言語モデル(SLM)は、資源に制約のある環境にますますデプロイされている。
命令チューニング中の構文的および意味的変換タイプに対する感受性を計測する。
文字反転はサイズや家族に関係なく、すべてのモデルでほぼ完全に失敗する。
セマンティック・トランスフォーメーションは、異なるしきい値の挙動を示し、コア言語能力においてより強いレジリエンスを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:44:29 GMT)
Self-consistent tensor network method for correlated super-moiré matter beyond one billion sites [0.0] モイアと超モイアの材料は、エキゾチックな相関量子物質を設計するための例外的なプラットフォームを提供する。
スーパーモアの資料はこの要件を、数百万から数十億のサイトを考慮すべき限界まで押し上げています。
我々は,10億のサイトに到達するシステムにおいて,相関状態の解決を可能にする方法論を確立する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:52:35 GMT)
Segmentation of Ischemic Stroke Lesions using Transfer Learning on Multi-sequence MRI [0.0] 各種MRIで虚血性脳梗塞を自動的に分類するための新しい枠組みを提案する。
提案手法はISLES 2015 Brain Stroke シーケンスデータセットで検証されている。
我々の努力はDiceスコア80.5%、精度74.03%を達成し、セグメンテーションアプローチの有効性を示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:27:25 GMT)
Revocation and Reconstruction of Shared Quantum States [0.0] いかなる理由があっても、ディーラーが再建者の意図を確信していない場合、私たちは独立して取り消す方法を示します。
さらに、4つのキュービットの純粋な絡み合った状態のクラスをリソースとみなし、プロトコルが成功するパラメータの範囲を明示的に見つける。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:48:00 GMT)
Reversing adiabatic state preparation in few-level quantum systems [0.0] 状態は、カウンターダイアバティック(CD)量子制御プロトコルを追加することで、高速かつ忠実に準備できる。
ベリー相は非完全状態伝達の感度検出器として機能することを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:40:25 GMT)
Rejection of wavefront aberrations in an atomic gradiometer [0.0] 原子干渉計に基づく慣性センサの主な残留限界の1つは、レーザービームの歪みに由来する。
ここでは、冷間原子勾配計におけるこれらの効果の影響を定量化する解析計算を伴う数値シミュレーションを提案する。
干渉計によるレーザビーム収差の伝搬と、初期非対称性と2つの原子源の有意な飛行時間拡張とを組み合わせ、位相雑音の一般モード拒絶を差分構成で制限することを実証した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:04:31 GMT)
Recursive Dynamics in Fast-Weights Homeostatic Reentry Networks: Toward Reflective Intelligence [0.0] 本研究では、高速な連想記憶、ホメオスタティック正規化、学習された再帰フィードバックを統合し、ニューラルネットワークの自己参照計算を近似するニューラルネットワーク機構であるFH-RL(Fast-Weights Homeostatic Reentry Layer)を紹介する。
Information Reentry Ratio(IRR)、Eigen-Spectrum Recursion Index(ESRI)、Representational Drift Periodicity(RDP)の3つの新しい指標を用いて、Reentry gain $gamma$のコントロール実験を行い、創発的内部ダイナミクスを評価する。
これらの知見は、フィードバック間のバランスから、反射的、思考的な内部処理が生じるという定量的証拠を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:36:45 GMT)
Recent Advances on Nonadiabatic Geometric Quantum Computation [0.0] 幾何相は量子物理学の基本概念であり、幾何学構造と量子力学の進化の間の深い関係を明らかにする。
本稿では、普遍的な量子ゲート構成、すなわち幾何量子計算(GQC)の文脈における幾何学的位相のレビューを提供する。
まず, 既存の解析的GQCアプローチをすべて包含できる統一的理論フレームワークについて検討し, 解析的幾何学的ゲートの設計原理を体系的に検討する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:09:50 GMT)
Quantum algorithm for one quasi-particle excitations in the thermodynamic limit via cluster-additive block-diagonalization [0.0] 数値連結クラスター展開(NLCE)と変分量子固有解器(VQE)を組み合わせた熱力学極限における準粒子励起エネルギーの量子アルゴリズムを提案する。
本研究は,NLCEによる熱力学限界における励起状態計算に,変分量子アルゴリズムを拡張したクラスタ付加フレームワークとしてPCATを確立した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:02:07 GMT)
Quantum action of the Josephson dynamics [0.0] 2つの結合したマクロスケール量子系間の相対位相の超平均場ジョセフソンダイナミクスについて検討する。
位相の量子平均に対する1ループのみの量子実効作用とそれに対応する運動方程式を導出する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:56:46 GMT)
Quantitative Evaluation of Quantum/Classical Neural Network Using a Game Solver Metric [0.0] 我々は、古典畳み込みニューラルネットワーク(CCNN)、量子または量子畳み込みニューラルネットワーク(QNN、QCNN)、ハイブリッド古典量子ニューラルネットワーク(Hybrid NN)を比較した。
その結果,Hybrid NNs エンジンは CCNNs エンジンに匹敵するElo レーティングを実現し,量子エンジンは現在のハードウェア制約下では性能が劣っていることがわかった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:36:31 GMT)
Qualitative Research in an Era of AI: A Pragmatic Approach to Data Analysis, Workflow, and Computation [0.0] 我々は、知識、目的、倫理的コミットメントによって展開された場合、新しい技術は長年にわたる方法論上の課題に対処する可能性があると論じる。
我々は、慎重に、透過的に使用すると、現代の計算ツールは、置き換わるよりも、有意義に拡張できると結論付けている。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:57:17 GMT)
Planar Dirac equation with radial contact potentials [0.0] 周囲に支持される最も一般的な時間非依存接触電位について検討する。
問題は1次元のもの(ラジアル)に効果的に還元される
次に、物理パラメータのいくつかの選択に対する有界および散乱解について検討する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:10:26 GMT)
Physically-Grounded Goal Imagination: Physics-Informed Variational Autoencoder for Self-Supervised Reinforcement Learning [0.0] 自己指導型目標条件強化学習は、ロボットが人間の監督なしに多様なスキルを自律的に獲得することを可能にする。
RIG(Visual Reinforcement Learning with Imagined Goals)のような既存の手法では、変分オートエンコーダ(VAE)を使用して学習空間の目標を生成するが、学習効率を阻害する物理的に不可解な目標を生成する制限がある。
我々は,新しい拡張物理インフォームド変分オートエンコーダ(拡張p3-VAE)を用いて,物理制約を直接VAEトレーニングプロセスに統合する物理インフォームドRIG(PI-RIG)を提案する。
私たちの重要なイノベーションは、潜伏空間を明示的に分離することです。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:18:38 GMT)
Performance Decay in Deepfake Detection: The Limitations of Training on Outdated Data [0.0] 本稿では,現代ディープフェイクにおけるAUROCの99.8%を超える簡易かつ効果的な2段階検出手法を提案する。
このデータに基づいてトレーニングされたモデルは、わずか6ヶ月後に生成された生成技術を用いて作成したディープフェイクに対して、30%以上のリコール損失を被っていることを示す。
効果的なディープフェイク検出の未来は、高速データ収集と高度なフレームレベルの特徴検出器の開発に依存している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:58:34 GMT)
Pedagogical Reflections on the Holistic Cognitive Development (HCD) Framework and AI-Augmented Learning in Creative Computing [0.0] ホロスティック認知開発(HCD)フレームワークは、デザイン思考、経験的学習、反射的実践を統一的な構成主義的教育に統合する。
ゲームデザインのコース(CS3247、CS4350)、仮想現実(CS4240)、拡張現実システムなどに適用される。
この論文は、スケーラブルでパーソナライズされたフィードバックを通じて、HCDフレームワークを運用するiReflect、ReflexAI、Knowledge GraphといったAI拡張システムについても検討している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:07:37 GMT)
Optimal phase estimation in the presence of correlated dephasing [0.0] そこで我々は,位相推定のための最適メロジカルプロトコルについて検討した。
スピンスクイーズ法は, 位相変動が正に相関する状態において, 実質的に最適性能を提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:37:51 GMT)
Oh That Looks Familiar: A Novel Similarity Measure for Spreadsheet Template Discovery [0.0] 本稿では,セマンティックな埋め込み,データ型情報,空間的位置決めを組み合わせたハイブリッド距離測定手法を提案する。
本手法では, スプレッドシートをセルレベルの埋め込みに変換し, チャムファーやハウスドルフ距離などの集約手法を用いる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:25:55 GMT)
No-signalling-projection-invariant Bell inequalities [0.0] 我々は、それぞれ$m$のバイナリアウトカムの測定を行う$n$パーティを含む構成に対するベルの不等式が、符号射影不変でない正準形式を持つことを示す。
特に、シグナルのないポリトープに弱いシグナルを投射する$L2$-projectionは、この標準ベルの不等式に反する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:04:07 GMT)
Neural-Initialized Newton: Accelerating Nonlinear Finite Elements via Operator Learning [0.0] 計算固体力学における非線形問題のパラメトリック解を高速化するニュートン法を提案する。
制御方程式の非線形パラメトリック解を近似するために、物理学的な条件付きニューラルネットワークを訓練する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 07:45:10 GMT)
MetricSynth: Framework for Aggregating DORA and KPI Metrics Across Multi-Platform Engineering [0.0] 本稿では、開発者エクスペリエンス(DevEx)とキーパフォーマンス指標(KPI)メトリクスを、ソフトウェアエコシステムに対してほぼリアルタイムに可視化するように設計されたフレームワークのアーキテクチャと実装について述べる。
さまざまな内部ツールやプラットフォームからのデータを集約することにより、開発生産性、品質、運用効率といった重要な領域のメトリクスを計算して視覚化する。
この実装により、手動によるレポートの作業が大幅に削減され、毎週20時間削減され、より高速でデータ駆動型のボトルネック識別が可能になった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:08:32 GMT)
Matrix-product state skeletons in Onsager-integrable quantum chains [0.0] マトリックス生成状態 (MPS) 骨格は、正確なMPS基底状態を持つハミルトンのネットワークである。
我々は、ある相互作用するスピン鎖($N$状態オンサーガー積分型カイラルクロックファミリー)で骨格を部分的に露出する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:38:08 GMT)
Mapping the Future of Human Digital Twin Adoption in Job-Shop Industries: A Strategic Prioritization Framework [0.0] エルゴノミック姿勢モニタリング、疲労予測、健康ベースのタスク割り当てといったHDTアプリケーションは、新興国の産業に利益をもたらす。
本研究は、労働集約型産業における人中心型デジタル進化を支援するための戦略的優先順位付けの枠組みを提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:04:02 GMT)
ML-EcoLyzer: Quantifying the Environmental Cost of Machine Learning Inference Across Frameworks and Hardware [0.0] 機械学習推論の炭素,エネルギー,熱,水コストを測定するためのML-EcoLyzerを提案する。
このツールは古典的モデルと近代的モデルの両方をサポートし、適応的な監視とハードウェア認識評価を適用している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:30:29 GMT)
Low-Gap Hf-HfOx-Hf Josephson Junctions for meV-Scale Particle Detection [0.0] ハフニウム基ジョセフソン接合(Hf-HfOx-Hf)の創製とキャラクタリゼーションを報告する。
Hf-HfOx-Hfは、超低閾値のシングルTHz光子とシングルフォノン検出のための、有望な低Tc材料プラットフォームである。
この研究は、Hfベースの接合と次世代超伝導検出器および量子ビットアーキテクチャの可能性に関する最初の包括的な研究である。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:14:54 GMT)
LegalEval-Q: A New Benchmark for The Quality Evaluation of LLM-Generated Legal Text [0.0] 我々は,明快さ,コヒーレンス,用語に基づく法文の質を評価する回帰モデルを構築した。
まず、モデルの品質レベルが14億のパラメータから外れ、限界的な改善は72億のパラメータで2.7%だけである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:30:26 GMT)
Learning Biomolecular Motion: The Physics-Informed Machine Learning Paradigm [0.0] 物理インフォームド機械学習は、データ駆動推論と物理的な制約を統合する体系的なフレームワークを提供する。
我々はこれらのアプローチを「生体分子閉鎖問題」の解として捉えている。
我々は、機械学習、統計物理学、計算化学の交差点における先進的な研究の道について概説する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 00:24:06 GMT)
Laser-induced spectral diffusion of T centers in silicon nanophotonic devices [0.0] シリコンのカラーセンターは、通信波長で動作するスピン光子インターフェースとして出現している。
シリコンフォトニック結晶空洞におけるT中心の光スペクトル拡散について検討した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 00:47:36 GMT)
Lagrangian neural ODEs: Measuring the existence of a Lagrangian with Helmholtz metrics [0.0] 与えられたODEとオイラー・ラグランジュ方程式との類似性を定量化するためにヘルムホルツ計量を提案する。
2階のニューラル ODE と組み合わせてラグランジアンニューラル ODE を形成し、これはオイラー・ラグランジュ方程式を直接的に学習し、追加の推論コストをゼロにすることができる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:25:10 GMT)
LMM-IQA: Image Quality Assessment for Low-Dose CT Imaging [0.0] 低線量CTは、低線量で患者の安全性を著しく向上させる。
しかし、ノイズ、ぼかし、コントラスト損失の増加は診断品質を低下させる可能性がある。
劣化の数値スコアとテキスト記述の両方を生成するLLMに基づく品質評価システムを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:56:11 GMT)
LLM-Powered Swarms: A New Frontier or a Conceptual Stretch? [0.0] Swarm Intelligenceは、単純で分散化されたエージェントが複雑な振る舞いを集合的に生成する方法について説明している。
近年,OpenAIのSwarm(OAS)フレームワークなど,大規模言語モデル(LLM)ベースのシステムにスワーミングの概念が拡張されている。
本稿では,従来の群知能の基本原理である分散化,簡易化,創発性,拡張性について考察する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:31:54 GMT)
LLM Driven Processes to Foster Explainable AI [0.0] オーディエンス可能なアーティファクトへの推論を外部化する,モジュール型で説明可能なLCMエージェントパイプラインを提案する。
このシステムは3つのフレームワークをインスタンス化する: VesterのSensitivity Model(要素セット、署名されたインパクトマトリックス、システム的役割、フィードバックループ)、正規形式ゲーム(戦略、ペイオフマトリックス、平衡)、シーケンシャルゲーム(ロールコンディショニングされたエージェント、ツリー構築、後方誘導)。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:20:00 GMT)
Krylov Complexity and Mixed-State Phase Transition [0.0] 我々はデコヒーレンスと量子複雑性を結合する統一的な枠組みを確立する。
密度行列を二重ヒルベルト空間の純粋な状態にベクトル化することにより、デコヒーレンス過程は虚時間発展にマッピングされる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:45:39 GMT)
Increasing AI Explainability by LLM Driven Standard Processes [0.0] 本稿では,Large Language Models (LLM) を標準化された分析プロセスに組み込むことにより,人工知能(AI)システムの説明可能性を高めるアプローチを提案する。
LLMの推論空間と、その上の説明可能なプロセス空間とを分離する階層アーキテクチャが提示される。
実証的な評価は、システムが分散ガバナンス、システム分析、戦略的推論コンテキストにおいて、人間レベルの決定ロジックを再現可能であることを示している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:16:10 GMT)
Improving Asset Allocation in a Fast Moving Consumer Goods B2B Company: An Interpretable Machine Learning Framework for Commercial Cooler Assignment Based on Multi-Tier Growth Targets [0.0] 本稿では,クーラーを受け取った後,どの飲料クライアントが高いリターンを得られるかを予測する枠組みを提案する。
3つの成長しきい値が定義され、年間売上の10%、30%、50%が成長した。
その結果, AUC スコアが0.857, 0.877, 0.898 であることがわかった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:39:35 GMT)
How many stations are sufficient? Exploring the effect of urban weather station density reduction on imputation accuracy of air temperature and humidity [0.0] 都市気象局ネットワーク(WSN)は、都市気象や気候パターンを監視し、都市計画を支援するために広く利用されている。
本稿では,ドイツ・フライブルクの既存のWSNを薄型化するためのステップワイズ駅除去手順を提案する。
我々は,WSN濃度のシミュレート後の1年間,WSNの大気温度と湿度パターンを再現するWSNサブセットの能力を解析した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:48:54 GMT)
How AI Fails: An Interactive Pedagogical Tool for Demonstrating Dialectal Bias in Automated Toxicity Models [0.0] AIによるモデレーションは日々の生活に広まりつつある。
AIは偏見がある」という主張をよく耳にする
不適切」と宣言されたオンライン投稿が単に偏りのあるアルゴリズムの犠牲者ではないことをどうやって確信できるだろうか?
論文参考訳(メタデータ) (Mon, 10 Nov 2025 03:49:58 GMT)
High-dimensional Bayesian filtering through deep density approximation [0.0] 我々は最近,非線形フィルタリングのための2つのディープ密度法をベンチマークした。
ディープスプリッティングフィルタとディープBSDEフィルタの2つのフィルタは、いずれもFeynman--Kac式、Euler--Maruyama離散化、ニューラルネットワークに基づいている。
計算効率の面では、ディープ密度法は粒子ベースのフィルタと比較しておよそ2~5桁の推論時間を短縮する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:06:31 GMT)
Harmonic Token Projection (HTP): A Vocabulary-Free, Training-Free, Deterministic, and Reversible Embedding Methodology [0.0] Harmonic Token Projection (HTP) は、訓練、語彙、パラメータなしでテキスト埋め込みを生成するための可逆的で決定論的フレームワークである。
HTPは英語でrho = 0.68のスピアマン相関を達成し、10言語で安定した性能を維持している。
これは有意義な意味関係が決定論的幾何学から出現し、データ駆動型埋め込みの透過的で効率的な代替手段を提供することを示している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 20:51:18 GMT)
Green AI: A systematic review and meta-analysis of its definitions, lifecycle models, hardware and measurement attempts [0.0] この記事では、持続可能なAIとは異なる、グリーンAIの統一された運用定義を確立する。
ライフサイクルアセスメント段階にマッピングされた5つのフェーズライフサイクルを形式化し、エネルギー、炭素、水、エンボディドインパクトを第一級に設定する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:26:06 GMT)
Glioma C6: A Novel Dataset for Training and Benchmarking Cell Segmentation [0.0] Glioma C6は、グリオーマC6細胞のサンプルセグメンテーションのための新しいオープンデータセットである。
データセットは75個の高分解能位相コントラスト顕微鏡画像と12,000以上の注釈付き細胞からなる。
ソマアノテーションや、生物学者が提供した形態学的細胞分類が含まれる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:33:34 GMT)
Geometric Decomposition of Statistical Inference through Gradient Flow and Co-Monotonicity Measures [0.0] 地域分析に推論問題を分割するための2つの戦略を提供する幾何学的分解フレームワークを開発する。
経路単調性検証離散モース理論を用いてサンプルを勾配流セルに分割し,結果が単調な振る舞いを示す。
共単調性分解は結合構造を利用し、サンプルの結合空間への埋め込みを定義する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:18:16 GMT)
Fuzzy Label: From Concept to Its Application in Label Learning [0.0] 本稿では,ファジィ集合論に基づくファジィラベルの概念を導入し,ラベルの不確かさをよりよく捉え,表現する。
本稿では, ファジィラベルをマイニングし, 生成するファジィラベリング手法を提案する。
我々は,古典的K-Nearest Neighbors (KNN) とマルチラベルKNNアルゴリズムを具体例として,単一ラベル学習と多ラベル学習のファジィラベル強化アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:58:19 GMT)
Finite-dimensional Lie algebras in bosonic quantum dynamics: The single-mode case [0.0] 単モードおよび自己相互作用ボゾン系の量子力学において生じる有限次元リー代数の数学的性質を研究、分類、探索する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 10:46:22 GMT)
Fault-Tolerant Encoding of Logical Qudits in Spin Systems [0.0] 普遍量子コンピュータは任意のハミルトニアンによって支配される任意の量子状態のシミュレーションを可能にする。
将来の量子プロセッサにフォールトトレラントな論理キューディットを装備することは必要不可欠であり、キューディットは自然にマルチレベル物理システムのシミュレーションと一致する。
本稿では、スピンシステムを用いたフォールトトレラント論理キューディエンコーディングの一般的なフレームワークと実例を示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 01:58:51 GMT)
Extending QAOA-GPT to Higher-Order Quantum Optimization Problems [0.0] 我々はQAOA-GPTを高次非制約バイナリ最適化問題に拡張する。
我々は、ADAPT-QAOAを介して生成されたグラフ回路対に基づいてモデルをトレーニングし、重ヘックス格子上に埋め込まれた8ビットおよび16ビットのインスタンスの性能を評価する。
その結果、QAOA-GPTは高次コストハミルトニアンや複雑なエネルギー景観に効果的に一般化することを示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:46:38 GMT)
Exploring the Early Universe with Deep Learning [0.0] 来るべき正方形キロメアアレイ天文台(SKAO)は、イオン化エポック(EoR)中の中性水素の分布をマッピングする。
我々は,SKAOから期待される水素信号の2次元パワースペクトルから情報を抽出する最新の深層学習技術を開発した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:47:45 GMT)
Explaining Human Choice Probabilities with Simple Vector Representations [0.0] 我々は,選択周波数ヒストグラムをベクトルとして扱うことによって構成した参加者選択モデルを開発した。
マッチング/アンチマッチと最大化/最小化という2つの基本方針だけで、参加者の選択を考慮に入れることができました。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:36:37 GMT)
Exact strong zero modes in quantum circuits and spin chains with non-diagonal boundary conditions [0.0] 我々は、積分可能量子回路における完全強零モード演算子(ESZM)と、一般開境界条件に対するスピン-1/2XXZ鎖を構成する。
ESZMは境界の1つに局在しており、無限境界コヒーレンス時間をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:50:33 GMT)
Efficient certification of intractable quantum states with few Pauli measurements [0.0] 我々はクリフォードの製品国家を認証するための効率的なプロトコルを導入する。
提案プロトコルでは,単一キュービットパウリ測定と高速な古典的後処理しか必要としない。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 17:01:51 GMT)
Distillation Dynamics: Towards Understanding Feature-Based Distillation in Vision Transformers [0.0] 蒸留力学と呼ばれる新しい分析枠組みを通じて,この現象の包括的解析を行った。
特徴蒸留における負の伝達の根本原因を,教師と学生のモデル間の基本的な表現パラダイムのミスマッチと同定する。
この結果から,ViTsにおける知識伝達の成功には,これらの基本的表現制約を尊重する手法へのナイーブな特徴模倣を超越する必要があることが明らかとなった。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:46:30 GMT)
Direct imaging of magnetotransport at graphene-metal interfaces with a single-spin quantum sensor [0.0] 走査型単一スピン量子磁気センサによる磁気輸送のナノスケールイメージングについて報告する。
本研究は、複雑な電子輸送現象を研究するためのナノスケール電流イメージング技術の可能性を実証するものである。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:13:35 GMT)
Diagnosing and Breaking Amplitude Suppression in Seismic Phase Picking Through Adversarial Shape Learning [0.0] 高信号対雑音S波予測は、常に検出しきい値を超えず、抑圧された振幅で発振する。
S波のオンセットは高振幅境界に対する時間的不確実性を示し、CNNの急激な振幅変化に対するバイアスは、微妙なオンセットではなく、これらの境界への予測を固定する。
我々は、形状制約を強制する識別器を用いて従来のBCEトレーニングを強化することで、条件付きGANフレームワークによってこれを実装した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 05:52:43 GMT)
Descriptor-Based Object-Aware Memory Systems: A Comprehensive Review [0.0] 現代のコンピューティングシステムのセキュリティと効率は、ハイレベルなプログラムセマンティクスを伝播するネイティブアーキテクチャメカニズムが欠如していることによって損なわれている。
本稿では,このセマンティックギャップを埋めるために設計されたアーキテクチャパラダイムを包括的に調査する。
このパラダイムにより、ハードウェアはソフトウェア定義オブジェクトのリッチなセマンティクスを動的に取得し、強制することができる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:03:06 GMT)
Dense packing of the surface code: code deformation procedures and hook-error-avoiding gate scheduling [0.0] 表面符号は量子コンピューティングにおける主要な誤り訂正符号の1つである。
本稿では,複数の標準表面コードパッチを高密度に充填された接続された構成に変換する,詳細なコード変形手順を提案する。
また,高密度に充填された表面コードにおけるフックエラーを抑制する安定化器計測回路のためのCNOTゲートスケジューリングを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 06:36:55 GMT)
Decoherence from universal tomographic measurements [0.0] デコヒーレンスの効果は、ストラトノビッチ・ワイル準確率分布の系の状態空間への進化を研究することによって解析される。
デコヒーレンス時間スケール (decoherence timescale) とは、系の初期状態の準確率分布が非負となる最小時間であり、ヒルベルト空間次元の減少を示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 18:26:34 GMT)
Conservative Software Reliability Assessments Using Collections of Bayesian Inference Problems [0.0] ソフトウェア障害の発生をモデル化するために、Bernoulliプロセスを使用します。
ソフトウェアが将来失敗することなく動作している最悪の後続予測確率を明示的に決定する。
この研究は、強ベイズ的推論結果といわゆる保守的ベイズ的推論方法を拡張する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:36:35 GMT)
Comparing Schemes for Creating Qudit Graph States from 16- & 128-dimensional Hilbert Space using Donors in Silicon [0.0] シリコン中のスピン四重項を用いた任意のキューディットグラフ状態を生成するための2つのスキームを比較した。
最初のスキームは、単一エミッタ(シリコンスピンqudit)からキュディト線形グラフ状態を生成することを提案した。
2つめのスキームは2つのスピンキューディットを使用する。融合に頼る代わりに、2つのエミッターはCZを介して直接結合され、同じ資源状態を生成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:32:15 GMT)
Collective light shifts of many longitudinal cavity modes induced by coupling to a cold-atom ensemble [0.0] 高品質のファブリペロキャビティにおける冷間原子雲と多くの縦モードとの相互作用を実験的に検討した。
共振器を105ドル以上の共振器内原子に結合し, 同時に$sim 100$の共振器モードの有意なシフトを検出する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:42:04 GMT)
CoSense-LLM: Semantics at the Edge with Cost- and Uncertainty-Aware Cloud-Edge Cooperation [0.0] CoSense-LLMは、連続したマルチモーダルセンサストリームをコンパクトなセマンティックトークンに変換するエッジファーストフレームワークである。
システムは、ページ化またはストリーミングKVキャッシュ、Flashスタイルのカーネル、投機的復号化、量子化されたLoRAアダプタなど、モダンなサービス最適化で動作する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:37:47 GMT)
Causal Discovery in Dynamic Fading Wireless Networks [0.0] 本稿では,逐次回帰に基づくアルゴリズムの提案により,無線環境における因果推論の課題に対処する。
構造変化の同定に要する検出遅延の理論的下限と上限を導出し,ネットワークサイズ,ノイズ分散,フェージング重大度への依存性を明示的に定量化する。
本研究は,非定常無線環境下でのネットワーク信頼性を維持するために,ロバストなオンライン因果推論機構を設計するための厳密な理論的洞察と実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:51:13 GMT)
Bridging the daemonic gap en route to charge multi-mode batteries via a single auxiliary [0.0] まず, 電池を補助充電器でまとめて時間発展させることにより, 量子電池を充電しながら, デーモン的優位性を利用することが可能であることを示す。
蓄電池設計を多モード共振器バッテリとキューディット充電器に拡張し、二重モードバッテリとクァトリット充電器の充電サイクルを繰り返すことが、集合バッテリの個別モードを同時に充電するために重要であることを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:58:04 GMT)
Bridging the Prototype-Production Gap: A Multi-Agent System for Notebooks Transformation [0.0] 本稿では,JupyterノートブックをPythonコードリポジトリに自動的に変換する,新しいマルチエージェントシステムであるCodelevateを提案する。
私たちのシステムでは,アーキテクチャの一貫性とコード品質を保証するために,アーキテクチャ,開発者,構造という3つの専門エージェントを共用する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:05:10 GMT)
Bridging the Plausibility-Validity Gap by Fine-Tuning a Reasoning-Enhanced LLM for Chemical Synthesis and Discovery [0.0] 大規模言語モデルは、科学的に合理的に見えるが基本的な原則に反する出力をしばしば生成する。
本稿では、推論中心のモデルアーキテクチャと低ランク適応微調整を組み合わせた体系的なアプローチを提案する。
微調整されたシステムは96.3%の形式順守、97.4%の化学的妥当性、74.4%の合成可能性を達成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:20:52 GMT)
Biphoton state generation and engineering with bright hybrid III-V/Silicon photonic devices [0.0] デバイスは、バイフォトン生成とオンチップ量子状態工学を融合する異種統合デバイスである。
設計は10$6$ s$-1$mW$-1$以上のペア生成率と一致事故率を最大600まで達成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 14:12:36 GMT)
Automatic generation of DRI Statements [0.0] DRI(Deliberative Index)は、グループ推論を評価するための洗練されたメトリクスを提供する。
この論文は、DRIステートメント生成に対する革新的で自動化されたアプローチを導入している。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:36:07 GMT)
Automated Circuit Interpretation via Probe Prompting [0.0] 本稿では、帰属グラフをコンパクトで解釈可能な部分グラフに変換する自動パイプラインであるプローブプロンプトを提案する。
5つのプロンプトにまたがって、プローブプロンプトされたサブグラフは、複雑さを圧縮しながら高い説明的カバレッジを保っている。
幾何学的クラスタリングベースラインと比較すると、概念整列群はより高い行動コヒーレンスを示す。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:53:36 GMT)
Assisting the Grading of a Handwritten General Chemistry Exam with Artificial Intelligence [0.0] 本稿では,AIを用いた手書き化学試験における評価システムの有効性と信頼性について検討する。
私たちはAIに割り当てられたスコアと、さまざまな種類の質問に対する人間の評価を比較します。
その結果,ルーチンアセスメントタスクにおけるAIの有望な応用が示唆された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 12:37:31 GMT)
Approximate Bayesian inference for cumulative probit regression models [0.0] 通常の分類データは、広範囲の実用的な応用で日常的に遭遇する。
累積プロビットモデルにおける回帰係数の後方分布を近似する3つのスケーラブルアルゴリズムを提案する。
本稿では,犯罪ネットワークの構造を解明するために,提案アルゴリズムの有用性について述べる。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 11:15:42 GMT)
Aligning Brain Signals with Multimodal Speech and Vision Embeddings [0.0] 我々は、平均的なwav2vec2音声埋め込みで脳波信号を一致させるMetaからの作業を構築している。
音声を言語にエンコードするwav2vec2と、単語を画像にマッピングするCLIPの2つのモデルからの埋め込みを比較した。
脳波を自然な音声知覚中に記録した脳波を用いて,これらの埋め込みが脳活動とどのように一致しているかを評価する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 02:52:40 GMT)
AgenticSciML: Collaborative Multi-Agent Systems for Emergent Discovery in Scientific Machine Learning [0.0] AgenticSciMLは、10以上の専門AIエージェントが協力してSciMLソリューションを提案し、批判し、洗練する、協調的なマルチエージェントシステムである。
このフレームワークは、構造化された議論、検索強化されたメソッドメモリ、およびアンサンブル誘導された進化的検索を統合する。
その結果,AIエージェント間の協調推論は,創発的な方法論的革新をもたらす可能性が示唆された。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 16:06:33 GMT)
Agentic AI Sustainability Assessment for Supply Chain Document Insights [0.0] 本稿では,エージェント人工知能(AI)を中心としたサプライチェーン運用におけるドキュメントインテリジェンスのための総合的持続可能性評価フレームワークを提案する。
文書集約紙抽出において, 評価可能な環境性能を提供しながら, 自動化効率を向上させるという2つの目的に対処する。
我々は,AI支援型HITLとエージェントAIのシナリオにより,エネルギー消費の最大7倍,二酸化炭素排出量の90-97%,水利用の89-98%を手作業で行うことができることを示した。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 13:38:08 GMT)
Aerial Image Stitching Using IMU Data from a UAV [0.0] 無人航空機(UAV)は航空写真やリモートセンシング用途に広く使われている。
主な課題の1つは、複数の画像を大きな領域をカバーする単一の高解像度画像に縫い合わせることである。
本稿では,UAVで撮影した画像の縫合にIMUデータとコンピュータビジョン技術を組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 08:33:00 GMT)
Accessibility Gaps in U.S. Government Dashboards for Blind and Low-Vision Residents [0.0] 連邦、州、市レベルで6つのライブシステムを監査しました。
多くのチャートは基本的な発見性に欠けるか、キーボードとスクリーンリーダーの使用をブロックするホバーに依存している。
簡単なステータスとトレンドテキストを同じ更新ケイデンスで追加し、マッチングテーブルまたはCSVをパブリッシュし、アクセシビリティーのコミットメントを明示する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 04:20:46 GMT)
ANO : Faster is Better in Noisy Landscape [0.0] ノイズの多い環境で瞬間運動量を切り離す小説「Ano」を紹介します。
アノログは、勾配強化学習のようなノイズの多い非定常的な体制においてかなりの利益をもたらす。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:31:41 GMT)
A survey: Information search time optimization based on RAG (Retrieval Augmentation Generation) chatbot [0.0] Retrieval-Augmented Generation (RAG)ベースのチャットボットは、質問応答による情報検索だけでなく、インジェクションされたプライベートデータに基づく複雑な意思決定にも有用である。
我々は,「Xシステム」と呼ばれる組織内の複雑な情報を取得する際に,検索時間がどれだけ節約できるかを調査する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 22:39:26 GMT)
A Two-Stage System for Layout-Controlled Image Generation using Large Language Models and Diffusion Models [0.0] テキストから画像への拡散モデルは、顕著な生成能力を示すが、対象数や空間配置の正確な制御は欠如している。
この研究は、これらの構成制限に対処する2段階のシステムを導入する。
最初のステージでは、オブジェクトのリストから構造化レイアウトを生成するために、LLM(Large Language Model)を採用している。
第2段階では、レイアウト条件付き拡散モデルを用いて、このレイアウトに付着したフォトリアリスティック画像を合成する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:40:48 GMT)
A Comprehensive Approach to Finite-Bath Open Quantum Systems: Exact Dynamics [0.0] 我々は、有限基底開量子系をモデル化し、中心スピンモデルの正確なダイナミクスを開発する。
新しい量子チャネルが特徴づけられ、後者は、非常によく知られた非マルコフ量子チャネルの顕微鏡的理解を解明する。
これは、有限基底開量子系の基本的な理解と、量子物理学の広大な領域における多くの新しい応用の道を開く。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:12:35 GMT)
A Collaborative Model for Improving Information Sharing among Cancer Care Groups using Software Engineering Principles [0.0] がん治療とソフトウェア工学情報管理の類似性を分析する。
ソフトウェア工学の原則を用いたがんケアグループ間の情報共有モデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 09:38:08 GMT)
A Classical-Quantum Hybrid Architecture for Physics-Informed Neural Networks [0.0] 本稿では,QPINN-MACを用いた量子古典的ハイブリッド物理インフォームドニューラルネットワークについて紹介する。
古典的成分と量子的成分の戦略的結合により、QPINN-MACは普遍近似特性を保持する。
これらの結合が勾配崩壊を防ぎ、高次元状態においてもトレーニング性を確保することを実証する。
論文参考訳(メタデータ) (Mon, 10 Nov 2025 15:39:18 GMT)