Do traveling waves make good positional encodings? [44.6] 移動波に基づく新しい位置符号化機構であるRollPEを提案する。
従来の絶対的な位置埋め込みよりもはるかに優れていることを示す。
我々は、RolePEの数学的等価性を、RoPEの特定の構成に導出する。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 14:32:45 GMT)
Comparative Analysis of Large Language Models for the Machine-Assisted Resolution of User Intentions [43.4] 大きな言語モデル(LLM)は、自然言語の理解とユーザ意図の解決のための変換ツールとして登場した。
本研究では,複数のオープンソースおよびオープンアクセスモデルが,マシンアシストによるユーザ意図の解決を容易にする能力について検討する。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 14:36:59 GMT)
Clifford Algebraic Rotor Embeddings : Maybe embeddings should start to CARE [42.0] 四元数に基づくアプローチ(QuatRo)をオイラー角の代わりに示し、四元数が3次元回転を表現する能力を活用する。
幾何代数を用いたClifford Algebraic Rotary Embeddings (CARE) に対する QuatRo の一般化を提案する。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 12:50:51 GMT)
LT-Soups: Bridging Head and Tail Classes via Subsampled Model Soups [41.9] LT-Soupsは、様々なLT体制をまたいで一般化するために設計された2段階のモデルスープフレームワークである。
我々は、ヘッドテール比、ヘッドとテールの比率を、このトレードオフに影響を及ぼす決定的だが見過ごされた要因として特定する。
6つのベンチマークデータセットに対する実験により、LT-SoupsはPEFTと従来のモデルスープと比較して優れたトレードオフを達成することが示された。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 14:15:57 GMT)
Beyond Superficial Forgetting: Thorough Unlearning through Knowledge Density Estimation and Block Re-insertion [27.5] 大規模言語モデルに対するブロック再帰(KUnBR)による知識密度誘導学習を提案する。
KUnBRは有害な知識の豊富なレイヤを特定し、再挿入戦略を通じて有害な知識を徹底的に排除する。
いくつかのアンラーニングおよび一般機能ベンチマークで実施された実験は、KUnBRが最先端の忘れたパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 14:12:43 GMT)
SpecQuant: Spectral Decomposition and Adaptive Truncation for Ultra-Low-Bit LLMs Quantization [18.0] SpecQuantはアクティベーションアウトレーヤとチャネル間の分散に対処する2段階のフレームワークである。
LLaMA-3 8Bでは、SpecQuantはウェイトとアクティベーションの両方で4ビットの量子化を実現し、ゼロショット精度のギャップは全精度に比べてわずか1.5%に縮小した。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 11:02:13 GMT)
DeCoRL: Decoupling Reasoning Chains via Parallel Sub-Step Generation and Cascaded Reinforcement for Interpretable and Scalable RLHF [11.4] DeCoRL(Decoupled Reasoning Chains via Coordinated Reinforcement Learning)は、シーケンシャルな処理から協調的なモジュールオーケストレーションへと推論を変換する新しいフレームワークである。
DeCoRLは軽量な特殊モデルを訓練して推論サブステップを同時に生成し、並列処理によるシーケンシャルなボトルネックを排除している。
包括的評価は、RM-Bench、RMB、RewardBenchにまたがる最先端の結果を示し、大規模モデルを含む既存の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 07:52:39 GMT)
Who Gets the Reward, Who Gets the Blame? Evaluation-Aligned Training Signals for Multi-LLM Agents [10.6] マルチエージェントシステムにおける大規模言語モデル(LLM)は複雑なタスクを約束している。
本稿では,協調ゲーム理論の帰属とプロセス報酬モデリングを一体化する理論的枠組みを提案する。
本手法は, 局所的, 署名, クレジット保存信号を生成する。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 22:21:08 GMT)
How Modality Shapes Perception and Reasoning: A Study of Error Propagation in ARC-AGI [7.2] ARC-AGIとARC-AGI-2は、小さな色量子格子上の一般化スルー合成を測定する。
最近の命令ファーストシステムは、グリッドを生成-実行-選択ループで実行される簡潔な自然言語またはDSLルールに変換する。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 19:06:41 GMT)
Beyond One-Way Pruning: Bidirectional Pruning-Regrowth for Extreme Accuracy-Sparsity Tradeoff [7.2] スパシティが一定の閾値を超えると、反復的およびワンショットプルーニング法の両方がモデル性能の急激な低下につながる。
この急激な劣化は、達成可能な圧縮比を制限し、特定のハードウェアプラットフォームに必要な厳密なサイズ制約を満たすことを防ぐ。
ハードウェア制約を満たす高度に圧縮されたネットワークから始まる双方向のプルーニング・リグロース戦略を提案する。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 21:22:29 GMT)
SpiderGen: Towards Procedure Generation For Carbon Life Cycle Assessments with Generative AI [5.9] 我々は従来のLCAの分類と方法論をLCMの推論能力と世界知識と統合したLLMベースのワークフローであるSpiderGenを提案する。
SpiderGenは正確なLCAプロセス情報を提供し、完全に正しいか小さなエラーがあり、10つのサンプルデータポイントでF1スコアを62%達成している。
炭素衝突を推定するための人的労力とコストを削減できるスパイダージェンのポテンシャルを強調し、LCAプロセス情報を10分以内で1ドル未満で作成できる。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 17:43:37 GMT)
Range Asymmetric Numeral Systems-Based Lightweight Intermediate Feature Compression for Split Computing of Deep Neural Networks [5.2] Splitコンピューティングは、リソース制約のあるエッジデバイスとクラウドサーバの間で、ディープニューラルネットワーク推論を分散する。
本研究では、非対称整数量子化とスパーステンソル表現を併用したレンジ非対称数値システム(rANS)の符号化を利用して、伝送オーバーヘッドを劇的に低減する新しい軽量圧縮フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 12:33:59 GMT)
Learning with Preserving for Continual Multitask Learning [4.8] タスク出力の保存から共有表現空間の維持に焦点を移す新しいフレームワークであるLawP(Learning with Preserving)を紹介した。
LwPは破滅的な忘れを緩和するだけでなく、CMTLタスクにおける最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 22:23:20 GMT)
Subject-Independent Imagined Speech Detection via Cross-Subject Generalization and Calibration [3.5] 本研究は,ニューラルデコードフレームワークにおいて,トレーニングダイナミクスと軽量な対象特化が被験者間性能に与える影響について検討した。
対象者毎のトレーニングセグメントが短く、被験者間の頻繁な交互化を伴う巡回的対象者間トレーニングアプローチは、未確認対象データ間での復号性能を緩やかに改善する結果となった。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 07:21:16 GMT)
Adaptive Stepsizing for Stochastic Gradient Langevin Dynamics in Bayesian Neural Networks [3.0] SA-SGLDを導入し, 時間再スケーリングを用いて, 監視量に応じて段差を変調する手法を提案する。
提案手法は, 高精度な2次元玩具のSGLDや, シャープな先行画像を用いたBNN画像の分類において, SGLDよりも高精度な後方サンプリングを実現することができることを示す。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 13:15:17 GMT)
Evaluation of LLM-based Explanations for a Learning Analytics Dashboard [1.5] 学習分析ダッシュボードは、デジタル学習環境における自己規制学習をサポートする強力なツールである。
しかし、それらの効果は、提供したデータの解釈可能性に影響される可能性がある。
大規模な言語モデルを用いて、ダッシュボード内のデータの言語的説明を生成し、スタンドアロンのダッシュボードと人間の教師が提供する説明に対して評価する。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 19:36:40 GMT)
A methodological analysis of prompt perturbations and their effect on attack success rates [0.5] この研究は、異なるLarge Language Models (LLM)アライメントメソッドが、攻撃に対するモデルの応答にどのように影響するかを調査することを目的としている。
我々は,最も一般的なアライメント手法,すなわち Supervised Fine-Tuning (SFT), Direct Preference Optimization (DPO), Reinforcement Learning with Human Feedback (RLHF) に基づいて,オープンソースモデルを選択した。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 19:39:33 GMT)
Homotopy-Guided Self-Supervised Learning of Parametric Solutions for AC Optimal Power Flow [0.4] 交流最適電力フロー(AC-OPF)ソリューションのパラメトリック近似(L2O)を最適化する学習は、リアルタイム操作における高速で再利用可能なソリューションの可能性を提供する。
本稿では,AC-OPF問題に対するToptopy-Guided L2O法を提案する。
得られた学習プロセスは、ラベル付き最適解や外部解法を必要とせずに実現性を向上させる。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 23:23:22 GMT)
Token Is All You Need: Cognitive Planning through Belief-Intent Co-Evolution [0.0] 意味的に豊かなトークンの最小セット内での信念と意図の共進化から効果的な計画が生じることを示す。
知性はピクセルの忠実さではなく、信念と意図のトークン化された双対性にある。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 18:17:53 GMT)
The Singularity Warfare: The metatheoretical Framework [0.0] この論文は、人工知能と量子力学によって駆動される技術革新の加速ペースが、紛争の性質を根本的に変えつつあると主張している。
この論文は、物理学、哲学、未来学から理論を合成し、このパラダイムシフトを理解するためのメタ理論的な枠組みを提供する。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 21:20:02 GMT)
Synergistic Feature Fusion for Latent Lyrical Classification: A Gated Deep Learning Architecture [0.0] 本研究は,複雑で高次元の深い意味的特徴を,論理的内容分類のための単純かつ解釈可能な構造的手がかりと統合するという課題に対処する。
低次元補助的特徴(Fstruct)を用いた意味-BERT埋め込み(Fdeep)を修飾するためのゲート機構を利用したディープラーニングモデルであるSFLアーキテクチャを提案する。
SFLモデルは精度0.9894、マクロF1スコア0.9894を達成し、特徴連結を用いた総合ランダムフォレスト(RF)ベースラインを上回った。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 21:12:52 GMT)
Selective Diabetic Retinopathy Screening with Accuracy-Weighted Deep Ensembles and Entropy-Guided Abstention [0.0] 糖尿病網膜症(DR)は2030年までに全世界で1億3000万人以上の患者に影響を与えると予測されている。
不確実性推定と統合された深層アンサンブル学習フレームワークを導入し,DR検出における堅牢性,透明性,スケーラビリティを向上させる。
35,000個のEyePACS網膜基底画像のトレーニングと検証は、未濾過の精度93.70%を生み出した。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 03:36:48 GMT)
SYNAPSE: Synergizing an Adapter and Finetuning for High-Fidelity EEG Synthesis from a CLIP-Aligned Encoder [0.0] SynAPSEは、脳波信号表現学習と高忠実度画像合成を橋渡しする2段階のフレームワークである。
本手法はCVPR40データセット上で,意味的コヒーレントな潜在空間と最先端の知覚的忠実性を実現する。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 02:53:49 GMT)
Majority Rules: LLM Ensemble is a Winning Approach for Content Categorization [0.0] 本研究では,大規模言語モデル(LLM)を用いた非構造化テキスト分類のためのアンサンブルフレームワークを提案する。
複数のモデルを統合することで、アンサンブル大言語モデル(eLLM)フレームワークは個々のシステムの共通の弱点に対処する。
eLLMは人間の専門レベルに近いパフォーマンスを実現し、分類に基づく分類のためのスケーラブルで信頼性の高いソリューションを提供する。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 05:10:09 GMT)
LAD-BNet: Lag-Aware Dual-Branch Networks for Real-Time Energy Forecasting on Edge Devices [0.0] Google Coral TPUを用いたエッジ推論に最適化された革新的なニューラルネットワークであるLAD-BNetを提案する。
我々のハイブリッドアプローチは、時間的ラグの明示的な利用に特化したブランチと、拡張畳み込みを特徴とする時間的畳み込みネットワーク(TCN)を組み合わせることで、短期的および長期的依存関係の同時取得を可能にします。
10分間の時間分解能を持つ実エネルギー消費データに基づいて、LAD-BNetは1時間水平線で14.49%のMAPEを達成した。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 03:55:06 GMT)
H-Model: Dynamic Neural Architectures for Adaptive Processing [0.0] 本稿では、入力データに基づいて内部構造を動的に調整できるニューラルネットワークアーキテクチャの設計と実験について述べる。
提案モデルでは,各層がネットワークを介して出力がどのように伝搬されるかに影響を与えるルーティング機構を導入している。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 14:39:42 GMT)
Graph-Memoized Reasoning: Foundations Structured Workflow Reuse in Intelligent Systems [0.0] グラフ構造化メモリとして、推論を表現、保存、再利用するための正式なフレームワークであるGraph-Memoized Reasoningを導入する。
過去の決定グラフを符号化し、構造的および意味的類似性を通してそれらを検索することにより、新しい推論タスクにおける部分グラフの合成再利用を可能にする。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 07:42:37 GMT)
AGENet: Adaptive Edge-aware Geodesic Distance Learning for Few-Shot Medical Image Segmentation [0.0] AGENetはエッジ・アウェアな測地距離学習を通じて空間的関係を組み込む新しいフレームワークである。
私たちの重要な洞察は、医療構造はプロトタイプの抽出をガイドできる予測可能な幾何学的パターンに従っているということです。
本手法は,計算効率を維持しつつ,既存の手法と比較して境界誤差を低減する。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 09:56:35 GMT)
A Method for Identifying Farmland System Habitat Types Based on the Dynamic-Weighted Feature Fusion Network Model [0.0] 本研究では,15種類の耕作地系生息地を含む高分解能リモートセンシング画像データセットを開発した。
基礎的特徴を抽出する動的重み付き特徴融合ネットワーク(DWFF-Net)を提案する。
提案モデルでは,0.6979とF1スコア(0.8049)の平均インターセクション(mIoU)が,それぞれ0.021と0.0161のベースラインネットワークを上回っている。
論文参考訳(メタデータ) (Tue, 11 Nov 2025 02:44:38 GMT)