Reliable and Responsible Foundation Models: A Comprehensive Survey [287.2] 本調査は,基礎モデルの信頼性と責任を問うものである。
バイアスと公平性、セキュリティとプライバシ、不確実性、説明可能性、分散シフトなど、重要な問題について検討する。
各分野について,フィールドの現状を概観し,今後の研究の方向性について概説する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:25:03 GMT)
Outcome Accuracy is Not Enough: Aligning the Reasoning Process of Reward Models [108.3] Rationale Consistencyは、モデルの推論プロセスと人間の判断のアライメントを定量化する、きめ細かい計量である。
我々のフロンティアモデルの評価では,最先端モデル間で合理的な一貫性が効果的に識別できることが示されている。
我々は、GenRMトレーニングの合理性一貫性と結果精度を組み合わせたハイブリッド信号を導入する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:24:52 GMT)
Bringing Reasoning to Generative Recommendation Through the Lens of Cascaded Ranking [107.1] ジェネレーティブ・レコメンデーション(GR)は、資源効率の高いレコメンデーションのために、FLOPSの利用率の高いエンド・ツー・エンドのアプローチとして期待されている。
現在のGRモデルは,トークン生成が進むにつれてトークンレベルのバイアスがエスカレートする,重要なtextbfbias増幅問題に悩まされていることを示す。
バイアス増幅問題に対処するためには、GR to 1) がより異質な情報を導入し、2) トークン生成ステップごとにより大きな計算資源を割り当てることが重要である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:13:38 GMT)
Fluid Representations in Reasoning Models [91.8] 本稿では,QwQ-32Bの抽象構造情報処理のメカニズム解析を行う。
その結果、QwQ-32Bは、推論中の行動や概念の内部表現を徐々に改善することがわかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:34:50 GMT)
Rethinking Personalization in Large Language Models at the Token Level [89.6] パーソナライズは通常、ベースNLPタスクの上に追加レイヤとしてフレーム化される。
トークンレベルの観点からは、応答中の異なるトークンは、様々な程度にパーソナライズに寄与する。
本稿では,ユーザ固有の情報に対する各出力トークンの依存性を推定する自己コントラスト手法PerContrastを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:05:02 GMT)
Untwisting RoPE: Frequency Control for Shared Attention in DiTs [84.1] 位置符号化はトランスフォーマーベースの生成モデルに不可欠である。
ロータリー・ポジショナル・エンベディング (RoPE) は, 異なる位置感性を有する周波数成分に自然に分解されることを示す。
本稿では,厳密な位置アライメントよりも意味的類似性を反映するように,RoPE周波数帯域を選択的に変調する手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:01:59 GMT)
Theory of Space: Can Foundation Models Construct Spatial Beliefs through Active Exploration? [83.1] 宇宙の理論は、自己指向的かつ活発な探索を通じて情報を得るエージェントの能力として定義される。
重要な革新は空間的信念の探索であり、各ステップでモデルが空間的表現を明らかにするように促す。
この結果から,現在の基盤モデルでは,活発な探査において,コヒーレントで変更可能な空間的信念の維持に苦慮していることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:06:40 GMT)
Vision-aligned Latent Reasoning for Multi-modal Large Language Model [82.3] VaLR(Vision-aligned Latent Reasoning)は、思考の連鎖の推論ステップの前に動的に視覚対応の潜在トークンを生成するフレームワークである。
VaLRは、MLLMの中間埋め込みを視覚エンコーダのものと整合させることにより、推論中の視覚的知識の保存を訓練する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:04:02 GMT)
Why Steering Works: Toward a Unified View of Language Model Parameter Dynamics [81.8] 局所的な微調整、LoRAに基づく適応、およびアクティベーションに基づく介入を分離して研究する。
制御信号によって誘導される動的ウェイト更新として、これらの介入をフレーム化する統一的な視点を示す。
提案手法では,選択と効用との間に一貫したトレードオフが観測される。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:45:27 GMT)
Forecasting Future Language: Context Design for Mention Markets [81.3] 我々は、参照市場における正確な予測を支援するために、入力コンテキストをどのように設計するかを検討する。
1 より豊かなコンテキストは予測性能を継続的に改善し、(2)市場条件付きプロンプト(MCP)は事前の市場確率を扱い、テキストによる証拠を用いてそれを更新し、より良いキャリブレーションの予測を得る、(3)市場確率とMCP(MixMCP)の混合が市場ベースラインを上回っている、という3つの洞察を得た。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:43:31 GMT)
WMVLM: Evaluating Diffusion Model Image Watermarking via Vision-Language Models [79.3] 拡散モデルから生成された画像を保護するためには,デジタル透かしが不可欠である。
従来の透かし評価手法では,残余と意味の両方の透かしの統一的な枠組みが欠如していた。
我々は,視覚言語モデルを用いた拡散モデル画像透かしのための最初の統一的・解釈可能な評価フレームワークLMを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:23:10 GMT)
From Data to Behavior: Predicting Unintended Model Behaviors Before Training [78.4] トレーニング前に意図しないモデルの振る舞いを予測する新しいタスクであるData2Behaviorを紹介する。
また,その平均表現を通して候補データを要約する軽量な手法として,MDF(Manipulating Data Features)を提案する。
Qwen3-14B、Qwen2.5-32B-Instruct、Gemma-3-12b-itの実験では、MDFは意図しない振る舞いを予測でき、事前訓練済みの脆弱性に関する洞察を与える。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:37:17 GMT)
Point2Insert: Video Object Insertion via Sparse Point Guidance [77.2] Point2Insertは、ビデオにフレキシブルでユーザフレンドリーなオブジェクト挿入のためのスパースポイントベースのフレームワークである。
正の点と負の点の両方をサポートし、挿入に適した領域または挿入に適さない領域を示す。
一貫して強力なベースラインを上回り、$times$10のパラメータを持つモデルを超えています。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:01:15 GMT)
Decomposing Query-Key Feature Interactions Using Contrastive Covariances [75.4] クエリとキー間の双方向のジョイント埋め込み空間であるクエリキー空間について検討する。
キーとクエリの機能がこれらの低ランクのサブスペースに整列して、高い注目スコアが生成されるときです。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:50:02 GMT)
VK-LSVD: A Large-Scale Industrial Dataset for Short-Video Recommendation [74.7] 本稿では,VK-LSVD(Large Short-Video dataset)を紹介する。
VK-LSVDは、コンテンツ埋め込み、多様なフィードバック信号、コンテキストメタデータなどの豊富な機能に加えて、これまでになく1000万人のユーザーと約2000万のビデオからの400億以上のインタラクションを提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:54:52 GMT)
Steering LLMs via Scalable Interactive Oversight [74.1] 大規模な言語モデルは、エンフェーブコーディングのような複雑で長期にわたるタスクをますます自動化し、監督のギャップが生まれています。
スケーラブルな監視において重要な課題は、人間が責任を持ってAIシステムを、特定または検証する能力を超えたタスクで操ることができることだ。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:52:00 GMT)
Gradually Compacting Large Language Models for Reasoning Like a Boiling Frog [72.4] 大きな言語モデル(LLM)は印象的な推論能力を示しているが、その相当なサイズは、しばしばかなりの計算資源を必要とする。
圧縮過程を細かな繰り返しに分割する段階的圧縮法を提案する。
この「沸騰するカエル」効果の反復的なアプローチは、急激な性能損失を伴わずに、モデルを段階的に圧縮することができる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:56:52 GMT)
Towards Reducible Uncertainty Modeling for Reliable Large Language Model Agents [72.3] 大規模言語モデル(LLM)に対する不確実性定量化(UQ)は、日常的なLLMアプリケーションの安全ガードレールの鍵となるビルディングブロックである。
本稿では,既存のUQ設定の幅広いクラスを仮定したエージェントUQの汎用的な定式化について述べる。
エージェントの軌道上での再現可能な不確実性を明示的にモデル化する,新しい視点,条件付き不確実性低減プロセスを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:47:40 GMT)
Rethinking the Trust Region in LLM Reinforcement Learning [72.3] PPO(Proximal Policy Optimization)は、大規模言語モデル(LLM)のデファクト標準アルゴリズムとして機能する。
より原則的な制約でクリッピングを代用する多変量確率ポリシー最適化(DPPO)を提案する。
DPPOは既存の方法よりも優れたトレーニングと効率を実現し、RLベースの微調整のためのより堅牢な基盤を提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:59:04 GMT)
ConvexBench: Can LLMs Recognize Convex Functions? [70.5] 凸解析は数学の現代的な分野であり、多くの応用がある。
大規模言語モデル(LLM)が研究レベルの数学と科学を自動化し始めるにつれ、LLMが凸性を理解し、推論する能力を示すことが重要である。
我々は,LLMが深い機能的構成下での象徴的対象の凸性を識別できるかどうかを,スケーラブルで機械的に検証できるベンチマークであるcbを紹介する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:09:18 GMT)
Reshaping Action Error Distributions for Reliable Vision-Language-Action Models [69.4] ロボット操作において、視覚言語アクション(VLA)モデルは、一般化可能でスケーラブルなロボットポリシーを学ぶための有望なパラダイムとして登場した。
連続動作型VLAモデルに焦点をあて、トレーニング中の動作誤差分布を再構成することにより、従来のMSEベースの回帰を超越する。
複数の代表的VLAアーキテクチャ上で、標準、少数ショット、ノイズの多い設定にまたがるアプローチを評価します。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:37:09 GMT)
Short Chains, Deep Thoughts: Balancing Reasoning Efficiency and Intra-Segment Capability via Split-Merge Optimization [68.9] 大規模推論モデル(LRM)は、長い推論連鎖の生成を通じて複雑なタスクを解く際、印象的な能力を示した。
textbfCoSMo(textbfSplit-textbfMerge textbfOptimization)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:39:47 GMT)
How Attention Sinks Emerge in Large Language Models: An Interpretability Perspective [67.1] モデルがゼロ位置のトークンを認識できるように簡単なメカニズムを同定し、2つの変圧器ブロック内で注意シンクを誘導する。
スクラッチからトレーニングされた30B A3B MoEモデルからのトレーニングトレースを分析することで、このメカニズムはトレーニングの初期段階に現れ、最初の2層に集中するようになる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:10:34 GMT)
Scaling Agentic Verifier for Competitive Coding [66.1] 大規模言語モデル(LLM)は強力なコーディング能力を示しているが、1回の試行で競合するプログラミング問題を正しく解くのに苦戦している。
実行ベースの再ランク付けは、有望なテスト時間スケーリング戦略を提供するが、既存のメソッドは、難しいテストケースの生成または非効率的なランダム入力サンプリングによって制約される。
本稿では,プログラムの動作を積極的に推論し,高い差別性のあるテスト入力を検索するエージェント検証手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:30:40 GMT)
Evolutionary Mapping of Neural Networks to Spatial Accelerators [64.1] ニューロモルフィック加速器のための最初の進化的ハードウェア・イン・ザ・ループマッピングフレームワークを紹介する。
我々は,2次元メッシュに152コアを配置した空間加速器であるIntel Loihi 2のアプローチを評価した。
提案手法は,2つのスパース多層パーセプトロンネットワーク上でのデフォルトコアと比較して,最大35%のレイテンシ削減を実現している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:28:08 GMT)
Generative Modeling via Drifting [63.4] 本稿では,訓練中の前進方向の分布を進化させ,一段階の推論を自然に認めるDrifting Modelsという新しいパラダイムを提案する。
実験では,1ステップのジェネレータが256 x 256の解像度でImageNetの最先端結果を達成し,FIDは潜時空間で1.54,ピクセル空間で1.61である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:06:49 GMT)
Capturing Visual Environment Structure Correlates with Control Performance [62.7] 既存のプロキシメトリクスは、ビジュアル世界の狭い側面をキャプチャする表現能力に重点を置いている。
事前学習された視覚エンコーダが環境状態の復号化を支援するかを測定する。
この推定精度は、下流の政策性能と強く相関していることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:59:12 GMT)
SynthVerse: A Large-Scale Diverse Synthetic Dataset for Point Tracking [61.0] ポイントトラッキングに特化した大規模で多様な合成データセットであるSynthVerseを紹介する。
SynthVerseは、広範囲のオブジェクトカテゴリをカバーすることによって、データセットの多様性を大幅に拡張する。
我々は,最先端の手法を体系的に評価するために,高度に多様な点追跡ベンチマークを構築した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:14:21 GMT)
PIO-FVLM: Rethinking Training-Free Visual Token Reduction for VLM Acceleration from an Inference-Objective Perspective [59.2] 本稿では,視覚モデル(VLM)における冗長な視覚トークンを減らし,推論を高速化するPIO-FVLMを提案する。
提案されているPIO-FVLMは、トレーニングフリーで、FlashAttentionと互換性があり、実用的なアプリケーションやデプロイメントに親しみやすい。
LLaVA-Next-7Bでは、PIO-FVLMは視覚トークンの11.1%しか保持していないが、オリジナルのパフォーマンスの97.2%を維持している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:33:10 GMT)
Proxy Compression for Language Modeling [58.9] プロキシ圧縮は、圧縮された入力の効率性を維持する代替のトレーニングスキームである。
コード言語モデリングの実験では、プロキシ圧縮がトレーニング効率を大幅に向上することを示した。
モデルスケールが大きくなるにつれて、プロキシトレーニングされたモデルは最終的に一致するか、あるいは競合するトークン化アルゴリズムのアプローチになる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:36:46 GMT)
Private PoEtry: Private In-Context Learning via Product of Experts [58.5] In-context Learning (ICL) は、大規模言語モデルが推論時に少数の例だけで新しいタスクに適応できるようにする。
ICLに対する既存の差分プライバシーアプローチは、計算コストが高いか、オーバーサンプリング、合成データ生成、あるいは不要なしきい値設定に依存している。
我々は、Product-of-Expertsモデルのレンズを通してプライベートICLを再構成し、理論的に基盤付けられたフレームワークを与え、アルゴリズムを自明に並列化することができる。
本手法は,従来のDP-ICL法と比較して平均30ポイント以上精度が向上し,高いプライバシー保証を維持した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:56:24 GMT)
A Coin Flip for Safety: LLM Judges Fail to Reliably Measure Adversarial Robustness [57.5] 既存の検証プロトコルは、レッドチーム固有の分散シフトを考慮できないことを示す。
我々は、より一貫して判断可能な振る舞いのベンチマークであるReliableBenchと、判断失敗を公開するために設計されたデータセットであるJiceStressTestを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:13:35 GMT)
Beyond Global Alignment: Fine-Grained Motion-Language Retrieval via Pyramidal Shapley-Taylor Learning [56.6] 動き言語検索は、自然言語と人間の動きの間の意味的ギャップを埋めることを目的としている。
既存のアプローチは主に、全動作シーケンスとグローバルテキスト表現の整合性に重点を置いている。
本研究では,微粒な動き言語検索のためのPST学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:24:36 GMT)
BPDQ: Bit-Plane Decomposition Quantization on a Variable Grid for Large Language Models [56.5] 本稿では,ビットプレーンとスカラー係数による可変量子化グリッドを構成するビットプレーン分解量子化(BPDQ)を提案する。
BPDQは、1つのGTX 3090上でQwen2.5-72Bを83.85%のGSM8Kの精度で提供できる(ただし16ビットでは90.83%)。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:54:37 GMT)
Understanding Degradation with Vision Language Model [56.1] 視覚的劣化を理解することは、コンピュータビジョンにおいて重要な問題であるが、難しい問題である。
本稿では,教師付き微調整と強化学習を併用したマルチモーダル・チェーン・オブ・ソート・モデルであるDU-VLMを紹介する。
また,110,000個のクリーン劣化ペアと接地された物理アノテーションからなる大規模データセットである textbfDU-110k も導入した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:51:15 GMT)
CoWTracker: Tracking by Warping instead of Correlation [53.8] ワープに有利なコストを削減できる高密度な点トラッカーを提案する。
近年の光学的流れの進展に触発されて,本手法では,現在の推定値に基づいて,対象フレームからクエリフレームへ特徴を変換することで,トラック推定を反復的に洗練する。
我々のモデルは,TAP-Vid-DAVIS,TAP-Vid-Kinetics,Robo-TAPなど,標準的な高密度点追跡ベンチマークの最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:58:59 GMT)
Learning to Separate RF Signals Under Uncertainty: Detect-Then-Separate vs. Unified Joint Models [53.8] 受信した信号に直接適用した場合、単一のディープニューラルネットワークアーキテクチャが共同で検出および分離することを学習していることを示す。
これらの結果から,UJM は DTS に代わるスケーラブルで実用的な代替品であり,広範に推定された統合分離のための新たな方向を開拓した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:25:02 GMT)
SIDeR: Semantic Identity Decoupling for Unrestricted Face Privacy [53.8] 本稿では,非制限顔プライバシー保護のためのセマンティックデカップリング駆動フレームワークSIDeRを提案する。
SIDeRは、顔画像をマシン認識可能な識別特徴ベクトルと視覚的に知覚可能なセマンティックな外観成分に分解する。
認証されたアクセスのために、SIDeRは正しいパスワードが提供されるときに元の形式に復元できる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:30:48 GMT)
A Framework for Combining Optimization-Based and Analytic Inverse Kinematics [53.7] 逆運動学(IK)問題の解法と最適化法はロボティクスの歴史において深く研究されている。
IK回避のための新しい定式化を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:23:32 GMT)
Past- and Future-Informed KV Cache Policy with Salience Estimation in Autoregressive Video Diffusion [53.1] 既存のアプローチは一般的にKVキャッシュポリシーに依存しており、長期のビデオ生成におけるトークンの重要性の違いを無視している。
我々は,過去・未来型KVキャッシュポリシー(PaFu-KV)を提案する。
特にPaFu-KVは、双方向キャッシュ教師から抽出した軽量なサリエンス推定ヘッドを導入し、サリエンススコアを推定する。
このポリシーは、KVキャッシュ容量を小さくし、推論時にメモリフットプリントを減らすことで、より良い品質効率のトレードオフをもたらす。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:26:51 GMT)
TxRay: Agentic Postmortem of Live Blockchain Attacks [52.7] 5年も経たないうちに、DeFiのエコシステムは15.75億米ドル以上を失い、エクスプロイトが報告された。
我々は、限られた証拠から生のACT攻撃を再構築する死後システムであるTxRayを提示する。
DeFiHackLabsの114件のインシデントで、TxRayは105件のインシデントに対して専門家による根本原因と実行可能なPoCを生成し、92.11%のエンド・ツー・エンドの再現を達成した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:54:43 GMT)
SE-Bench: Benchmarking Self-Evolution with Knowledge Internalization [52.6] 我々は,NumPyライブラリとそのAPIドキュメントをランダムな識別子を持つ擬似ノーベルパッケージに難読化する診断環境であるSE-Benchを紹介する。
エージェントはこのパッケージを内部化するように訓練され、ドキュメントにアクセスせずに単純なコーディングタスクで評価される。
本研究は,(1)参考資料を用いた学習が保持を阻害するオープンブックパラドックス,(2)知識圧縮を重みに強制する「クローズドブックトレーニング」,(2)標準RLがPPOクリッピングと負の勾配によって新たな知識を完全に内部化するのに失敗するRLギャップ,(3)内部化,証明モデルのためのセルフプレイの実現可能性,の3つの知見を明らかにする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:58:32 GMT)
Explicit Uncertainty Modeling for Active CLIP Adaptation with Dual Prompt Tuning [52.0] デュアルプロンプトチューニングに基づくアクティブCLIP適応のためのロバストな不確実性モデリングフレームワークを提案する。
提案手法は,同一のアノテーション予算の下で,既存のアクティブラーニング手法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:01:55 GMT)
Protein Autoregressive Modeling via Multiscale Structure Generation [51.9] タンパク質自己回帰モデリング(PAR)は,タンパク質のバックボーン生成のための最初のマルチスケール自己回帰フレームワークである。
ノイズの多いコンテキスト学習とスケジュールサンプリングを採用し、堅牢なバックボーン生成を実現している。
非条件生成ベンチマークでは、PARはタンパク質の分布を効果的に学習し、高い設計品質のバックボーンを生成する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:59:49 GMT)
Beyond Unimodal Shortcuts: MLLMs as Cross-Modal Reasoners for Grounded Named Entity Recognition [51.7] GMNER(Multimodal Named Entity Recognition)は、テキストベースのエンティティを抽出し、セマンティックカテゴリを割り当て、それらを対応する視覚領域に接地することを目的としている。
MLLMは、視覚バイアスやテキストバイアスを含む$textbfmodality bias$を示す。
本稿では,モダリティを考慮した一貫性推論(bfMCR$)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:12:49 GMT)
CoRe: Context-Robust Remasking for Diffusion Language Models [51.6] 推論時間リビジョンのためのトレーニングフリーフレームワークであるContext-Robust Remasking (CoRe)を提案する。
静的トークンの確率を信頼するのではなく、CoReは、ターゲットとなるマスク付きコンテキストの摂動に対する感受性を示すことによって、コンテキスト不安定なトークンを識別する。
LLaDA-8B-Base上で、CoReは推論とコードベンチマークをまたいで一貫した改善を行い、計算マッチングベースラインを上回り、MBPPを最大9.2%改善した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:12:30 GMT)
VISTA-Bench: Do Vision-Language Models Really Understand Visualized Text as Well as Pure Text? [51.0] VLM(Vision-Language Models)は、テキスト入力と視覚入力のクロスモーダル理解において、優れたパフォーマンスを実現している。
VISTA-Benchは、マルチモーダル認識、推論、および非モーダル理解領域のベンチマークである。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:48:55 GMT)
Transolver-3: Scaling Up Transformer Solvers to Industrial-Scale Geometries [51.0] Transolver-3は、高忠実度物理シミュレーションのために設計されたTransolverファミリーの新しいメンバーである。
Transolver-3は1億6000万以上のセルでメッシュを処理でき、3つの挑戦的なシミュレーションベンチマークで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:52:44 GMT)
Multi-Source Retrieval and Reasoning for Legal Sentencing Prediction [50.7] 厳密な客観的知識と柔軟な主観的推論を必要とするため、LSPは依然として困難である。
我々は,LLMにおけるマルチソース検索と推論を統合して強化学習を行うフレームワークであるMSR2$を提案する。
2つの実世界のデータセットの実験によると、$MSR2$はLSPの精度と解釈可能性の両方を改善している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:55:55 GMT)
SALAD-Pan: Sensor-Agnostic Latent Adaptive Diffusion for Pan-Sharpening [50.4] SALAD-Panは、効率的なパンシャーピングのためのセンサ非依存の潜時空間拡散法である。
バンドワイドの単一チャネルVAEを訓練し、高解像度のマルチスペクトル画像をコンパクトな潜在表現に符号化する。
拡散過程における高精度核融合と強いゼロショット(クロスセンサー)能力を実現する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:01:07 GMT)
Frontend Token Enhancement for Token-Based Speech Recognition [50.4] 音声信号の離散化表現は、音声認識アプリケーションにおける連続的な特徴の効率的な代替手段である。
本研究では,雑音の多い音声からクリーンな音声トークンを推定し,意味的トークンを用いてASRバックエンド上で評価するシステムを提案する。
入力/トークン領域に基づく拡張モデルとして,ウェーブ・ツー・ウェーブ・トゥ・ウェーブ・トゥ・アウトプット,連続SSL機能・ツー・ツー・ケン,ウェーブ・ツー・ツー・ケンの4種類を検討する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:02:15 GMT)
Hierarchical Latent Structures in Data Generation Process Unify Mechanistic Phenomena across Scale [50.3] 我々は文脈自由文法を用いて、ウェブスケールテキストコーパスのための忠実で効率的なプロキシである合成コーパスを生成する。
設計したデータ生成プロセスにおいて,誘導ヘッド,関数ベクトル,ハイドラ効果という3つの力学現象の出現について検討する。
これらの現象の出現を説明する上で,データ生成プロセスの階層構造がX因子となることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:49:13 GMT)
Concise Geometric Description as a Bridge: Unleashing the Potential of LLM for Plane Geometry Problem Solving [50.1] PlaneThought Problem Solving (PGPS) は幾何学図と問題テキスト記述に基づく平面幾何学的問題を解決することを目的としている。
大規模言語モデル(LLM)は強力な推論能力を有しており、PGPSへの直接的な応用は視覚図の処理能力の欠如によって妨げられている。
視覚図の幾何学的記述を生成するためにMLLMインタープリタを訓練し、既製のLCMを用いて推論を行う。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:10:56 GMT)
Beyond Many-Shot Translation: Scaling In-Context Demonstrations For Low-Resource Machine Translation [49.8] In-context Learningは、低リソース機械翻訳にLarge Language Modelsを適用する新しい方法を提供するかもしれない。
本研究では,Long-context モデルを用いた数千例のサンプルに対して,数ショット設定以上の低リソース機械翻訳ICLのスケーリングについて検討する。
JavaneseとSundaneseに関する我々の実験は、追加のコンテキストからのゲインがすばやく飽和し、最大コンテキストウィンドウの近くで分解可能であることを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:02:22 GMT)
MirrorLA: Reflecting Feature Map for Vision Linear Attention [49.4] リニアアテンションはトランスフォーマーの2次から線形への計算複雑性を著しく低下させるが、パフォーマンスにおけるソフトマックスに基づくアテンションの遅れは一貫して遅れる。
我々は、受動トランケーションをアクティブなリオリエンテーションに置き換える幾何学的枠組みであるMirrorLAを提案する。
MirrorLAは標準的なベンチマークで最先端のパフォーマンスを実現し、表現の忠実さを損なうことなく厳密な線形効率を実現できることを示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:14:09 GMT)
Light Up Your Face: A Physically Consistent Dataset and Diffusion Model for Face Fill-Light Enhancement [49.3] フェース・フィリング・ライト・エンハンスメント(FFE)は、元のシーンの照明と背景をそのままにしながら、仮想フィリング光を加えることで、露出の少ない顔を明るくする。
ほとんどのフェースリライト法は、入力照明の抑制やシーン全体の修正が可能な、全体的な照明を再構築することを目的としている。
スケーラブルな学習を支援するために、物理的に一貫したフィルライトで構築された大規模なペアデータセットであるLightYourFace-160K(LYF-160K)を紹介した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:03:41 GMT)
Causal Representation Meets Stochastic Modeling under Generic Geometry [49.2] 我々は,連続時間潜在点過程の因果表現学習を開発する。
MUTATEは時間適応型遷移モジュールを持つ変分自動エンコーダフレームワークである。
シミュレーションおよび実証研究全体で、MUTATEは科学的疑問に効果的に答えられることが判明した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:40:53 GMT)
Euphonium: Steering Video Flow Matching via Process Reward Gradient Guided Stochastic Dynamics [49.2] フローマッチングモデルと人間の嗜好の整合に対する現在のアプローチは、トレーニングロールアウト中の非効率な探索によって妨げられている。
プロセス報酬誘導力学を用いて生成を行う新しいフレームワークであるEuphoniumを提案する。
トレーニング収束を1.66倍に加速しながら,既存の方法よりも優れたアライメントを実現することを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:59:57 GMT)
VLRS-Bench: A Vision-Language Reasoning Benchmark for Remote Sensing [49.1] 複雑なリモートセンシング推論のためのビジョン言語ReaSoning Benchmark (VLRS-Bench) を提案する。
VLRS-Benchは平均71ワードの質問応答対を2,000個構成し、14のタスクと最大8つの時間フェーズにまたがる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:21:33 GMT)
Identifying Intervenable and Interpretable Features via Orthogonality Regularization [48.9] 我々はデコーダ行列をほぼ直交的な特徴に分解する。
これにより、ターゲットデータセットのパフォーマンスを本質的に変更することなく、機能間の干渉と重畳を低減することができる。
私たちのコードは、$texttthttps://github.com/mrtzmllr/sae-icm$で利用可能です。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:29:14 GMT)
Learning Rate Matters: Vanilla LoRA May Suffice for LLM Fine-tuning [48.7] Low-Rank Adaptation (LoRA)は、効率的な大規模言語モデルの微調整のための一般的なアプローチである。
本研究では,バニラ・ロラとともに4つの代表的ロラ変種を再評価する。
異なるLoRA手法が学習率の異なる範囲を好んでいることが判明した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:36:20 GMT)
Decomposed Prompting Does Not Fix Knowledge Gaps, But Helps Models Say "I Don't Know" [47.9] 大規模言語モデルは、クローズドブックの質問応答において知識限界を認識するのに苦労することが多く、自信ある幻覚へと繋がる。
我々は、モデルスケールの異なるDirect、Assistive、Incrementalの3つのタスク等価プロンプトとマルチホップQAベンチマークを評価した。
幻覚が一致している間に事実知識が安定しているため、クロスレジームは内部の不確実性の正確なシグナルを与える。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:39:58 GMT)
Improving 2D Diffusion Models for 3D Medical Imaging with Inter-Slice Consistent Stochasticity [47.5] ICS(Inter-Slice Consistentity)は、拡散サンプリング中のインタースライス一貫性を促進する戦略である。
ISCSは、追加の計算コストなしで、任意の2Dトレーニングされた拡散ベースの3D再構成パイプラインにドロップすることができる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:54:08 GMT)
CRoSS: A Continual Robotic Simulation Suite for Scalable Reinforcement Learning with High Task Diversity and Realistic Physics Simulation [47.0] 継続的な強化学習では、エージェントは以前取得したポリシーを忘れずに一連のタスクから学ぶ必要がある。
本稿では,ガゼボシミュレータで現実的にシミュレーションされたロボットをベースとしたCRLのための新しいベンチマークスイートを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:54:26 GMT)
The Thinking Boundary: Quantifying Reasoning Suitability of Multimodal Tasks via Dual Tuning [46.6] 提案するDual Tuningは、推論が目標タスクに対して肯定的な利得をもたらすかどうかを評価するためのフレームワークである。
多様なマルチモーダルタスクにおける推論学習の適性を評価するために,「シンキング境界」を確立した。
我々の研究は、適切なデータとトレーニング戦略を特定するための実践的なガイダンスを提供する「すべての理由」パラダイムに挑戦する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:13:39 GMT)
Targeted Synthetic Control Method [46.6] そこで本研究では, 対象合成制御 (TSC) 手法を導入し, 対実結果を直接推定する2段階推定手法を提案する。
TSCは柔軟で、任意の機械学習モデルでインスタンス化できる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:38:58 GMT)
ARGaze: Autoregressive Transformers for Online Egocentric Gaze Estimation [46.3] エゴセントリックな視線推定は、カメラ装着者が過去と現在のフレームのみを使用して、ファースト・パーソン・ビデオから見ている場所を予測する。
本稿では,視線推定を逐次予測として再構成するARGazeを提案する。
オンライン評価では,複数のエゴセントリックなベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:33:16 GMT)
Fine-tuning Pre-trained Vision-Language Models in a Human-Annotation-Free Manner [46.1] CLIPのような大規模視覚言語モデル(VLM)は、ゼロショットの強い一般化を示すが、下流のタスクに適応するためには通常、コストのかかるラベル付きデータを必要とする。
既存の教師なしの自己学習手法は擬似ラベル化に依存しているが、信頼できない信頼度フィルタリング、確認バイアス、低信頼サンプルの未利用に悩まされることが多い。
我々は,デュアルモデル,クロスモーダル協調機構を通じてラベルのないデータを活用する,教師なし適応フレームワークであるCollaborative Fine-Tuning (CoFT)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:00:12 GMT)
Duality Models: An Embarrassingly Simple One-step Generation Paradigm [46.1] 「入力1つ、出力1つ」のパラダイムは、トレーニング予算の分割を強制する。
多段階の目的に十分なサンプルを割り当てると、数段階の世代は訓練されていない。
本稿では,DuMo(Duality Models)を「1つの入力,2つの出力」パラダイムで提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:16:22 GMT)
Canonical Quantization of Cylindrical Waveguides: A Gauge-Based Approach [45.9] 本稿では、TEM(横電磁)とTM(横電磁)の2つの磁場四角形について紹介する。
Klein-Gordon型方程式によって支配される特徴的一次元スカラー場をそれぞれ同定する。
一般化されたフラックスは、適切なゲージ選択により、電磁ポテンシャル$A,V$から直接推定される。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:54:54 GMT)
Position: Machine Learning for Heart Transplant Allocation Policy Optimization Should Account for Incentives [45.8] 臓器割当は単なる静的な最適化の問題ではなく、移植センター、臨床医、規制当局を含む複雑なゲームであることを強調する。
意思決定パイプラインにおける重要なインセンティブのミスアライメントを特定し、今日、それらが有害な結果をもたらしていることを示すデータを提示する。
機械学習コミュニティのための研究課題を概説し、メカニズム設計、戦略分類、因果推論、社会的選択の統合を訴える。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:24:06 GMT)
Near-Optimal Dynamic Matching via Coarsening with Application to Heart Transplantation [45.8] 我々は粗いアプローチに基づく新しいオンラインマッチングアルゴリズムを開発した。
オフラインノードを静電容量クラスタに集約することで、ほぼ最適理論的保証が得られることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:23:09 GMT)
Rethinking the Design Space of Reinforcement Learning for Diffusion Models: On the Importance of Likelihood Estimation Beyond Loss Design [45.8] 本稿では,政策段階の目標,可能性推定器,ロールアウトサンプリングスキームの3つの要因を解消し,RL設計空間を体系的に解析する。
最終生成標本からのみ計算されるエビデンス低境界モデル推定器(ELBO)を採用することが,有効,効率的,安定なRL最適化を実現する主要な要因であることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:36:42 GMT)
Seg-ReSearch: Segmentation with Interleaved Reasoning and External Search [45.8] Seg-ReSearchは、既存のアプローチの知識ボトルネックを克服する、新しいセグメンテーションパラダイムである。
インターリーブされた推論と外部検索を有効にすることで、Seg-ReSearchはセグメントシステムに動的でオープンなクエリを処理する権限を与える。
OK-VOSと既存の2つの推論セグメンテーションベンチマークの実験は、Seg-ReSearchが最先端のアプローチを実質的なマージンで改善していることを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:33:16 GMT)
AGILE: Hand-Object Interaction Reconstruction from Video via Agentic Generation [45.8] 本稿では,対話学習のためのエージェント生成にパラダイムを転換する,堅牢なフレームワークAGILEを紹介する。
我々はAGILEがグローバルな幾何学的精度でベースラインを上回り、先行技術が頻繁に崩壊する挑戦的なシーケンスに対して、例外的な堅牢性を証明していることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:42:58 GMT)
Privileged Information Distillation for Language Models [45.7] 訓練時特権情報(PI)は、言語モデルが失敗する可能性のあるタスクを成功させることを可能にする。
PIで学んだ能力を、推論時間なしで行動しなければならないポリシーに転送することは、依然として根本的な課題である。
同モデルを用いてPI条件の教師と無条件の学生を同時に訓練する共同教師学生目標である-Distillを紹介する。
また,学生とPI条件の教師との間には,逆KLペナルティを持つ強化学習(RL)を用いた学習方法として,OPSD(On-Policy Self-Distillation)を導入する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:46:17 GMT)
Skin Tokens: A Learned Compact Representation for Unified Autoregressive Rigging [44.8] SkinTokensは、スキンウェイトを学習し、コンパクトで、離散的な表現である。
TokenRigは統合された自動回帰フレームワークで、リグ全体を骨格パラメータとSkinTokensの単一シーケンスとしてモデル化する。
我々の研究は、より忠実で堅牢なリギングに統一的で生成的なアプローチを示します。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:52:17 GMT)
Adaptive 1D Video Diffusion Autoencoder [44.7] 適応型1次元符号化と拡散型デコードのためのトランスフォーマベースのフレームワークである1次元拡散ビデオ自動符号化(One-DVA)を提案する。
1-DVAは3D-CNN VAEと同等の性能を同じ圧縮比で再現する。
さらに、生成過程によって生じる人工物を軽減するために、生成モデルのためのOne-DVA潜伏分布を規則化し、デコーダを微調整する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:11:12 GMT)
"Someone Hid It": Query-Agnostic Black-Box Attacks on LLM-Based Retrieval [44.5] 大規模言語モデル(LLM)は,検索システムにおいて有効なバックボーンとして機能している。
近年の研究では、LDMをベースとしたRetrievalは敵の攻撃に弱いことが示されている。
ゼロショットサロゲートLPMをベースとした転送可能なインジェクショントークンを生成する実用的なブラックボックス攻撃法を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:50:10 GMT)
Locas: Your Models are Principled Initializers of Locally-Supported Parametric Memories [44.5] Locasは局所的なパラメトリックメモリであり、現代のトランスフォーマーにおいてFFNブロックの設計を共有する。
このような低ランクサイドウェイFFNスタイルの記憶の適切な初期化は、迅速な収束、一般化の改善、破滅的な予防に不可欠である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:09:40 GMT)
Game-Based and Gamified Robotics Education: A Comparative Systematic Review and Design Guidelines [44.4] 本稿では,ロボット教育におけるGBLとゲーミフィケーションの体系的レビューと比較合成について紹介する。
我々は4つのデータベースにまたがる12,485レコード(2014-2025)の95の研究を分析した。
1)アプローチコンテキストとペタゴギーの結合,2)入門プログラミングとモジュールキットの重視,3)短期研究の地平線。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:41:26 GMT)
CreditAudit: 2$^\text{nd}$ Dimension for LLM Evaluation and Selection [44.3] CreditAuditはデプロイ指向の信用監査フレームワークで、セマンティックアライメントと非敵対的なシステムプロンプトテンプレートのファミリ下でモデルを評価する。
同様の平均能力を持つモデルは、かなり異なる変動を示し、安定リスクは、エージェントまたは高失敗コストの制度における優先順位決定を覆す可能性があることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:10:51 GMT)
ReThinker: Scientific Reasoning by Rethinking with Guided Reflection and Confidence Control [44.1] ReThinkerは、検索、ツールの使用、マルチエージェント推論を編成する信頼性対応のエージェントフレームワークである。
HLE、GAIA、XBenchの実験は、ReThinkerが常に最先端の基礎モデルより優れていることを示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:41:52 GMT)
UniReason 1.0: A Unified Reasoning Framework for World Knowledge Aligned Image Generation and Editing [44.1] マルチモーダルモデルは、しばしば深い推論を必要とする複雑な合成タスクに苦しむ。
画像生成と画像編集を調和させる統一フレームワークUniReasonを提案する。
我々は,大規模推論中心のデータセットを体系的に構築することで,このフレームワークをサポートする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:38:12 GMT)
PDF-HR: Pose Distance Fields for Humanoid Robots [43.8] ヒューマノイドロボットのためのPose Distance Fields(PDF-HR)を紹介する。
PDF-HRは、リターゲティングされたロボットのポーズの大きなコーパスまでの距離を予測する。
単軌道運動追跡,一般動作追跡,スタイルベース動作模倣,一般動作追跡など,多種多様なヒューマノイド作業におけるPDF-HRの評価を行った。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:38:51 GMT)
StagePilot: A Deep Reinforcement Learning Agent for Stage-Controlled Cybergrooming Simulation [43.8] オフラインのRLベースの対話エージェントで、予防トレーニングのためのグルーミング動作をシミュレートする。
StagePilotは、ユーザの感情とゴール近接のバランスをとる複合報酬を使用して、会話のステージを選択する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:22:45 GMT)
CoWork-X: Experience-Optimized Co-Evolution for Multi-Agent Collaboration System [43.3] CoWork-Xはエピソード間のクローズドループ最適化問題としてピアコラボレーションを論じている。
CoWork-Xは安定した累積的なパフォーマンス向上を実現し、オンラインレイテンシとトークン使用率を着実に削減する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:42:14 GMT)
Statsformer: Validated Ensemble Learning with LLM-Derived Semantic Priors [43.2] Statsformerは、大規模言語モデル(LLM)由来の知識を教師付き統計学習に統合するための原則化されたフレームワークである。
線形学習者と非線形学習者のアンサンブル内に,LLMから派生した特徴量を埋め込み,それらの影響をクロスバリデーションにより適応的に校正する。
この設計は、統計的誤差を除いて、ライブラリ内ベースラーナーの凸結合よりも悪い性能を期待できるようなオラクルスタイルのフレキシブルなシステムをもたらす。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:58:51 GMT)
Safe Urban Traffic Control via Uncertainty-Aware Conformal Prediction and World-Model Reinforcement Learning [43.1] STREAM-RLは、不確実性誘導型適応型コンフォーマルフォアキャスター、コンフォーマル残留流ネットワーク、不確実性誘導型セーフワールドモデルRLエージェントである。
複数の実世界の交通軌跡データの実験では、STREAM-RLは91.4%のカバレッジ効率を達成し、FDRを4.1%の信頼性で制御し、標準のPPOの69%に比べて安全性を95.2%向上している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:10:59 GMT)
LoRDO: Distributed Low-Rank Optimization with Infrequent Communication [43.0] $texttLoRDO$は、頻繁な同期を伴う低ランク最適化のための原則化されたフレームワークである。
言語モデリングやダウンストリームタスクにおいて、$texttLoRDO$は低ランクの$texttDDP$とほぼ同等であることを示す。
また、$texttLoRDO$は、小さなランク/バッチサイズで、非常に低メモリ設定でパフォーマンスをさらに改善します。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:25:24 GMT)
Toward Effective Multimodal Graph Foundation Model: A Divide-and-Conquer Based Approach [43.0] MGFM(Multimodal Graph Foundation Models)は、Multimodal-Attributed Graphs(MAG)におけるリッチなマルチモーダル情報の活用を可能にする。
本稿では,異なる粒度にまたがるモダリティの相互作用とアライメントを分離するために,Divide-and-Conquer戦略を用いた新しいフレームワークPLANETを提案する。
PLANETは,様々なグラフ中心およびマルチモーダル生成タスクにおいて,最先端のベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:05:12 GMT)
OmniSIFT: Modality-Asymmetric Token Compression for Efficient Omni-modal Large Language Models [42.6] 我々はOmni-LLM向けに設計されたトークン圧縮フレームワークであるOmniSIFTを提案する。
フレームワーク全体が、差別化可能なストレートスルー推定器を通じてエンドツーエンドに最適化されている。
オリジナルのトークンコンテキストの25%に過ぎないため、OmniSIFTはすべての圧縮ベースラインを一貫して上回り、複数のタスクでフルトーケンモデルのパフォーマンスを上回ります。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:51:05 GMT)
LLM-Empowered Cooperative Content Caching in Vehicular Fog Caching-Assisted Platoon Networks [42.6] 本稿では,Vehicular Fog Caching支援プラトンのための新しい3層コンテンツキャッシュアーキテクチャを提案する。
このシステムは、ローカルな小隊車両、ダイナミックなVFCクラスタ、およびクラウドサーバーをまたいだストレージを戦略的に調整し、コンテンツ検索のレイテンシを最小限にする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:59:22 GMT)
EntRGi: Entropy Aware Reward Guidance for Diffusion Language Models [42.4] 本研究では,離散拡散言語モデルに対する報酬指導について検討する。
既存のアプローチでは、離散トークンを連続的な緩和に置き換えるか、ストレートスルー推定器のようなテクニックを採用する。
本稿では,報酬モデルから勾配を動的に調節するエントロピー対応リワードガイダンスについて紹介する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:37:14 GMT)
From Vision to Assistance: Gaze and Vision-Enabled Adaptive Control for a Back-Support Exoskeleton [42.2] 活動性腰部職業性外骨格に対する視覚制御フレームワークを提案する。
提案システムは,一対一の YOLO に基づく知覚システムからリアルタイムの把握検出を統合する。
ユーザスタディでは、視覚刺激による補助が身体的需要を著しく減少させることが示された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:23:42 GMT)
Synthesizable Molecular Generation via Soft-constrained GFlowNets with Rich Chemical Priors [42.1] 本稿では,S3-GFNという合成可能なSMILES分子を,配列ベースGFlowNetの簡単なソフトレギュラー化により生成する手法を提案する。
実験の結果,S3-GFNは多種多様なタスクにおいて高い報酬で合成可能な分子を生成することができることがわかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:27:42 GMT)
Reducing the Costs of Proof Synthesis on Rust Systems by Scaling Up a Seed Training Set [40.9] 本稿では,Rustで記述されたシステムソフトウェアの検証ツールであるVerusのデータ合成パイプラインであるVeruSynを紹介する。
690万のRustプログラムで、それぞれが正式な仕様と、それがその仕様を満たしている証拠を持って、最大のVerus検証プログラムを合成します。
このデータセットによって、コスト対効果の高いトレードオフを備えた微調整のQwen2.5-Coder-32B-Instructモデルが作成できます。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:04:56 GMT)
BioBridge: Bridging Proteins and Language for Enhanced Biological Reasoning with LLMs [40.5] BioBridgeはタンパク質理解のためのドメイン適応型連続的事前学習フレームワークである。
提案するBioBridgeは、複数のタンパク質ベンチマークにおいて、メインストリームのPLMに匹敵する性能を示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:24:49 GMT)
Swordsman: Entropy-Driven Adaptive Block Partition for Efficient Diffusion Language Models [40.4] Swordsmanは、拡散言語モデルのためのエントロピー駆動の適応ブロックワイドデコーディングフレームワークである。
隣接するトークン間のエントロピーシフトを特定してブロックを分割し、セマンティックまたは構文的構成境界との整合性を向上する。
トレーニングフリーのフレームワークとして、Swordsman氏は、幅広い評価で最先端のパフォーマンスを実演している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:27:49 GMT)
Self-Improving Pretraining: using post-trained models to pretrain better models [40.2] 本稿では、文書をストリームし、強化学習(RL)を用いて次のK生成トークンを各ステップで改善する新しい事前学習手法を提案する。
実験では, 実効性と安全性の点で標準事前訓練よりも36.2%と18.5%の相対的な改善が得られ, 総生産品質の86.3%まで向上した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:31:10 GMT)
A$^2$-LLM: An End-to-end Conversational Audio Avatar Large Language Model [39.9] A$2$-LLMは、言語、音声の韻律、および3D顔の動きを統一されたフレームワーク内で説明するエンドツーエンドの音声アバターモデルである。
深いセマンティック理解により、A$2$-LLMは単純な唇同期以上の感情的に豊かな顔の動きを生成する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:19:46 GMT)
Blockchain Federated Learning for Sustainable Retail: Reducing Waste through Collaborative Demand Forecasting [39.6] 持続可能なサプライチェーンマネジメントにおけるフェデレートラーニングの適用について検討する。
単体小売店シナリオにおける需要予測と廃棄物評価のためのベースライン予測モデルを構築した。
直接データを共有せずに複数の小売業者間で協調的にトレーニングされた予測型FLモデルを導入する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:10:37 GMT)
Subliminal Effects in Your Data: A General Mechanism via Log-Linearity [39.4] 現代の大規模言語モデル(LLM)のトレーニングは、特定の振る舞いを引き出すために設計されたアルゴリズムとデータセットの検証可能なスモーガスボードとなっている。
最近の実験では、データセットが個々のデータポイントから直接観測できない信号を送信できることが示されている。
我々は、ジェネリックデータセットに隠されたサブテキストが出現する一般的なメカニズムを明らかにする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:50:46 GMT)
Linear Model Merging Unlocks Simple and Scalable Multimodal Data Mixture Optimization [38.8] 異なるデータ混合物の性能を推定するための効率的な戦略としてモデルマージについて検討する。
我々は14のマルチモーダルベンチマーク実験を行い、プロキシモデルが実際のデータ混合に基づいてトレーニングされたモデルと高い相関を示すことを実証的に実証した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:06:39 GMT)
SOON: Symmetric Orthogonal Operator Network for Global Subseasonal-to-Seasonal Climate Forecasting [38.7] 我々は,地球規模のS2S気候予測のためのSymmetric Orthogonal Operator Network (SOON)を提案する。
SOONは、グローバルグリッドを格子環にトークン化し、帯状周期構造の整合性を保つ異方的埋め込み戦略を結合する。
Earth Reanalysis 5データセットの実験では、SOONが新しい最先端技術を確立し、精度と計算効率を予測できる既存の手法を著しく上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:19:45 GMT)
Contextual Drag: How Errors in the Context Affect LLM Reasoning [38.4] 我々はコンテキストドラッグと呼ばれる現象を研究する。
文脈における失敗した試みの存在は、その後の世代を構造的に類似した誤りにバイアスする。
外部からのフィードバックも自己検証の成功も、この効果を排除するのに十分でないことを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:36:23 GMT)
X2HDR: HDR Image Generation in a Perceptually Uniform Space [37.8] 高ダイナミックレンジフォーマットとディスプレイはますます普及しているが、最先端の画像生成装置は低ダイナミックレンジ(LDR)出力に限定されている。
既存の事前学習拡散モデルでは,スクラッチから再学習することなく,HDR生成に容易に適応できることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:59:51 GMT)
Can We Redesign a Shoulder Exosuit to Enhance Comfort and Usability Without Losing Assistance? [37.4] 肩の可動性低下は, 上肢機能と日常生活活動能力を制限する。
本研究は, 快適性に配慮したソフトショルダー・エクソスーツ (ソフトショルダー v2) を考案した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:56:25 GMT)
Mitigating Long-Tail Bias via Prompt-Controlled Diffusion Augmentation [36.9] 本稿では,ドメイン構成とセマンティック構成の両方を明示的に制御し,ペア付きラベルサンプルを合成する,プロンプト制御拡散増強フレームワークを提案する。
遠隔センシングセグメンテーションにおける長期バイアスを軽減するための実践的メカニズムとして,マイノリティクラスに集中したゲインを示し,都市・農村の一般化を改善した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:49:16 GMT)
Canzona: A Unified, Asynchronous, and Load-Balanced Framework for Distributed Matrix-based Optimizers [36.7] 非同期アプローチは計算の冗長性に悩まされるが、レイヤワイドパーティショニングではこの矛盾を解決できない。
データ並列化では、負荷不均衡を中和しながら原子性を尊重するアルファバランス静的分割戦略を導入する。
提案手法は,エンド・ツー・エンドでの1.57倍の高速化を実現し,ステップ遅延をベースラインに比べて5.8倍削減する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:38:24 GMT)
MemOCR: Layout-Aware Visual Memory for Efficient Long-Horizon Reasoning [36.5] 本稿では,コンテキスト予算の厳しい長期推論を改善するマルチモーダルメモリエージェントであるMemOCRを紹介する。
MemOCRは、視覚的レイアウトを通じて適応的な情報密度でメモリ空間を割り当てる。
我々は,多種多様な圧縮レベルにエージェントを露出する予算対応目標の下で,強化学習でMemOCRを訓練する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:03:12 GMT)
ECG-R1: Protocol-Guided and Modality-Agnostic MLLM for Reliable ECG Interpretation [36.2] 既存のマルチモーダル大言語モデル(MLLM)は、ECGの解釈には信頼できないままである。
ECG-R1は、信頼できるECG解釈のために設計されたMLLMの最初の推論である。
コードとデータはhrefhttp://ai.heartvoice.com.cn/ECG-R1hereで公開されている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:17:55 GMT)
Shaping Expressiveness in Robotics: The Role of Design Tools in Crafting Embodied Robot Movements [36.1] 本稿では,表現力のあるロボットアームの動作を支援するための,移動中心型設計ペタゴギーを提案する。
反復的なアプローチはダンスからの分析フレームワークを統合し、デザイナーは動的および具体的次元を通して動きを調べることができる。
カスタムマニュアルのリモコンは、ロボットアームのインタラクティブでリアルタイムな操作を容易にし、専用のアニメーションソフトウェアは、可視化、詳細なモーションシーケンシング、正確なパラメータ制御をサポートする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:08:16 GMT)
Do Vision-Language Models Respect Contextual Integrity in Location Disclosure? [35.9] 視覚言語モデル (VLM) は画像位置情報において高い性能を示した。
これは、カジュアルに共有された写真からセンシティブな場所を推測するために悪用されるため、重大なプライバシーリスクを引き起こす。
VLM-GEOPRIVACY(VLM-GEOPRIVACY)は、実世界の画像に潜伏する社会的規範や文脈的手がかりを解釈するために、VLMに挑戦するベンチマークである。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:24:14 GMT)
DRMOT: A Dataset and Framework for RGBD Referring Multi-Object Tracking [35.6] Referring Multi-Object Tracking (RMOT)は、言語記述に基づいて特定のターゲットを追跡することを目的としている。
本稿では,RGB,Depth(D),Language(L)モダリティを融合させて3D認識トラッキングを実現するモデルを必要とする新しいタスク,RGBD Referring Multi-Object Tracking (DRMOT)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:56:16 GMT)
CyIN: Cyclic Informative Latent Space for Bridging Complete and Incomplete Multimodal Learning [35.6] 本稿では,完全学習と不完全学習のギャップを埋めるために,Cyclic Informative Learning framework(CyIN)を提案する。
不完全なマルチモーダル入力による欠落情報を補うために,クロスモーダル巡回変換を提案する。
CyINは1つの統一モデルで完全および不完全マルチモーダル学習を共同最適化することに成功した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:05:15 GMT)
NeuroCanvas: VLLM-Powered Robust Seizure Detection by Reformulating Multichannel EEG as Image [35.1] 脳波検査(EEG)による正確な発作検出は臨床的介入には重要であるが、長期記録のマニュアルレビューは労働集約的である。
脳波信号を大規模言語モデル(LLM)にエンコードする最近の試みは、多様な患者にまたがる神経信号を扱うという約束を示しているが、2つの大きな課題が残っている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:06:38 GMT)
DEEPMED: Building a Medical DeepResearch Agent via Multi-hop Med-Search Data and Turn-Controlled Agentic Training & Inference [34.7] DeepResearch(DR)は、ツールから検証可能な証拠を出力し、一般的なドメインで強力に実行する。
これは、タスク特性とツール使用のスケーリングの2つのギャップに起因しています。
DeepMedはベースモデルを平均で9.79%改善し、より大きな医学的推論とDRモデルを上回っている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:31:10 GMT)
A Modern System Recipe for Situated Embodied Human-Robot Conversation with Real-Time Multimodal LLMs and Tool-Calling [34.6] 身近な会話には、ロボットがアクティブな知覚とリアルタイム対話をインターリーブする必要がある。
本稿では、リアルタイムマルチモーダル言語モデルと、注意とアクティブな知覚のためのツールインタフェースのセットを組み合わせた、単純で最小限のシステムレシピを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:48:16 GMT)
When Silence Is Golden: Can LLMs Learn to Abstain in Temporal QA and Beyond? [34.5] 大型言語モデル(LLM)は、しばしば不確実性を認めず、(答えを拒否する)棄却するよりも、しばしば流動的であるが誤解を招く答えを生み出す。
この弱点は、時間差のある証拠や事実を、異なる期間にわたってしばしば無視する時間差質問応答においてさえ明らかである。
キャリブレーションのような既存のアプローチは、複雑な推論において不確実性を捉えるには信頼できないかもしれない。
我々は、禁忌を教育可能なスキルとみなし、禁忌を意識した報酬によって導かれる強化学習(RL)とCoT(Chain-of-Thought)の監督を結びつけるパイプラインを導入する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:54:47 GMT)
LABBench2: An Improved Benchmark for AI Systems Performing Biology Research [33.9] 我々は、科学的なタスクを実行するAIシステムの実世界の能力を測定するためのベンチマークの進化を紹介する。
LabBench2 は 1,900 のタスクから構成されており、ほとんどの場合 LAB-Bench の継続である。
我々は,現在のフロンティアモデルの性能を評価し,LAB-BenchとLABBench2で測定された能力が大幅に向上したのに対して,LABBench2は難易度に有意義なジャンプを与えることを示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:50:48 GMT)
SPOT-Occ: Sparse Prototype-guided Transformer for Camera-based 3D Occupancy Prediction [33.8] プロトタイプベースのスパーストランスフォーマーデコーダを提案する。
私たちの中核となる考え方は、デコーダのプロトタイプに注意を向けさせることです。
我々のモデルはSPOT-Occと呼ばれ、従来の手法よりも高速で優れていた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:59:24 GMT)
VTok: A Unified Video Tokenizer with Decoupled Spatial-Temporal Latents [33.8] この作業では、生成と理解の両方に使用できる統合ビデオトークン化フレームワークであるVTokを紹介している。
本稿では,映像の空間的・時間的表現を1つのキーフレームの空間的特徴を保ちながら,各フレームを1つの残差トークンに符号化することで分離することを提案する。
実験の結果,VTokはフレーム数とフレーム単位のトークン数から,映像表現の複雑さをその和に効果的に還元することがわかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:39:46 GMT)
Fine-Grained Activation Steering: Steering Less, Achieving More [33.7] アクティベーションステアリングは、大規模言語モデル(LLM)の振る舞いを変更するためのコスト効率のパラダイムとして登場した。
ブロックレベルのアクティベーションは本質的に異種であり,有益であり,無関係であり,有害であることを示す。
我々はAUSteerを提案する。AUSteerはAUレベルのより微細な粒度で動作するシンプルで効率的な方法である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:03:01 GMT)
Beyond Ground: Map-Free LiDAR Relocalization for UAVs [33.3] 地図のないLiDAR再ローカライゼーションは、弱い信号や不利用可能な信号を持つ環境で高精度な位置決めを実現するための有効なソリューションである。
我々は、UAVのための新しい地図のないLiDAR再ローカライズフレームワークであるMAILSを提案する。
提案手法は, 良好な位置決め精度を実現し, 既存の手法を著しく上回っている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:36:14 GMT)
Training Data Efficiency in Multimodal Process Reward Models [33.1] MPRMの訓練には大規模なモンテカルロ(MC)注釈コーパスが必要である。
本稿ではMPRMトレーニングにおけるデータ効率について検討する。
本稿では、既存のMC信号に基づいて、混合と信頼性の両方を優先するバランス情報スコア(BIS)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:27:38 GMT)
SuperPoint-E: local features for 3D reconstruction via tracking adaptation in endoscopy [33.1] 本研究は、内視鏡ビデオにおけるStructure-from-Motion(SfM)の性能向上のために、特徴抽出の強化に重点を置いている。
提案手法は,提案手法を用いた局所特徴抽出手法であるSuperPoint-Eにより,内視鏡における特徴検出と記述の質を著しく向上する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:45:41 GMT)
When and Where to Attack? Stage-wise Attention-Guided Adversarial Attack on Large Vision Language Models [32.9] LVLM(Large Vision-Language Models)に対するアドリアック攻撃は、現代のマルチモーダルシステムにおける安全性の脆弱性を明らかにするために重要である。
ランダムトリミングのような入力変換に基づく最近の攻撃は、空間的局所的な摂動は、大域的な画像操作よりも効果的であることを示唆している。
注意誘導型フレームワークであるSAGA(Stage-wise AttentionGuided Attack)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:29:10 GMT)
CodeScaler: Scaling Code LLM Training and Test-Time Inference via Execution-Free Reward Models [32.9] コード生成のための強化学習トレーニングとテスト時間推論の両方をスケールするために設計された実行自由報酬モデル。
CodeScalerはQwen3-8Bベースを平均+11.72ポイント改善し、バイナリ実行ベースのRLを+1.82ポイント上回る。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:56:00 GMT)
Learning to Reason in 13 Parameters [32.4] 本稿では,低ランクアダプタを1つのパラメータの小さなサイズにスケールするTinyLoRAを提案する。
我々は、bf16(26バイト)で13個の訓練されたパラメータしか持たないGSM8K上で、Qwen2.5から91%の精度で8Bパラメータサイズを訓練することができる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:20:04 GMT)
Geometry-Aware Optimal Transport: Fast Intrinsic Dimension and Wasserstein Distance Estimation [32.4] 我々は,半双対OT関数を利用する$textOT_c(, hat)$のチューニング不要な推定器を導入する。
このフレームワークは、実際に重要な計算上の利点と統計上の利点を解放する。
数値実験により,我々の幾何認識パイプラインは離散化誤差のボトルネックを効果的に軽減することを示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:56:28 GMT)
Landscape-aware Automated Algorithm Design: An Efficient Framework for Real-world Optimization [32.2] 大規模言語モデル(LLM)は、アルゴリズムの自動設計において新たなフロンティアを開放した。
LLMは探索過程を導くために対象問題の広範な評価を必要とする。
本研究では,アルゴリズム発見を低コスト評価から切り離す,革新的で効率的なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:18:45 GMT)
Partial Ring Scan: Revisiting Scan Order in Vision State Space Models [32.0] 状態空間モデル(SSM)は視覚タスクに注目する効率的な代替手段として登場した。
ビジョンSSMは、事前に定義されたスキャン順序に沿って、2D画像を1Dトークンシーケンスにシリアライズする必要がある。
スキャン順序は, 空間的隣接度, 破壊対象の連続性, 回転などの幾何学的変換による劣化を増幅することにより, 性能に重要な影響を与えることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:07:41 GMT)
EgoActor: Grounding Task Planning into Spatial-aware Egocentric Actions for Humanoid Robots via Visual-Language Models [31.8] EgoActingは,高レベルの指示を様々な,正確に,空間的に認識されたヒューマノイド行動に直結させることが要求される。
さらに,ロコモーションプリミティブを予測可能な,統一的でスケーラブルな視覚言語モデル(VLM)であるEgoActorを導入することで,このタスクをインスタンス化する。
我々は,実世界の実演,空間的推論質問応答,シミュレートされた環境デモンストレーションから,エゴセントリックなRGBのみのデータに対する広範囲の監視を活用している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:04:56 GMT)
When LLaVA Meets Objects: Token Composition for Vision-Language-Models [31.6] Mask-LLaVAは、様々なレベルの視覚的特徴を活用して、自己回帰視覚言語モデルのためのコンパクトで情報に富んだ視覚表現を作成するフレームワークである。
すべてのトークンはトレーニング中に使用されるが、結果として得られるモデルは、特にテスト時にマスクベースのオブジェクトトークンの数を柔軟に減少させることができる。
分析の結果,マルチレベル機能を組み合わせることで,より少ないトークンで効率的な学習が可能であり,テスト時に動的トークン選択を可能とし,性能を向上できることがわかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:50:46 GMT)
Self-evolving Embodied AI [31.5] エンボディード・人工知能(英語: Embodied Artificial Intelligence、AI)は、エージェントとその環境によって、能動的知覚、具体的認知、行動相互作用を通じて形成されるインテリジェントなシステムである。
本稿では,エージェントが変化状態と環境に基づいて動作する新たなパラダイムである,自己進化型エンボディAIを紹介する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:40:34 GMT)
CoBA-RL: Capability-Oriented Budget Allocation for Reinforcement Learning in LLMs [31.4] CoBA-RLは、モデルの進化能力に基づいて、ロールアウト予算を適応的に割り当てるように設計された強化学習アルゴリズムである。
我々のアプローチは、探索と搾取の間のトレードオフを効果的に編成し、一貫した一般化の改善を提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:35:42 GMT)
Adaptive Prompt Elicitation for Text-to-Image Generation [31.2] APEは、言語モデル事前を用いた解釈可能な機能要件として遅延インテントを表現している。
ユーザ定義タスクに挑戦するユーザスタディでは、ワークロードのオーバーヘッドなしに、19.8%のアライメントが証明されている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:24:46 GMT)
CoLT: Reasoning with Chain of Latent Tool Calls [31.2] CoT(Chain-of-Thought)は、大規模言語モデル(LLM)の推論能力を高める重要な手法である。
ツールコールとして潜伏推論を実装する新しいフレームワークである「CoLT」を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:12:53 GMT)
MaMa: A Game-Theoretic Approach for Designing Safe Agentic Systems [31.0] エージェントのサブセットが侵害された場合でも安全であり続けるエージェントシステムの自動設計について検討する。
本稿では,このゲームをほぼ解決し,安全なエージェントシステムを自動的に設計する新しいアルゴリズムであるMeta-Adversary-Meta-Agent (MaMa)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:07:49 GMT)
QUATRO: Query-Adaptive Trust Region Policy Optimization for LLM Fine-tuning [30.9] クエリ適応信頼度ポリシー最適化(QUATRO)を提案する。
QUATROは、原則化された最適化を通じて、信頼領域の制約を直接実施する。
様々な数学的推論のベンチマークで実証的な検証を行ったところ、QUITROは政策安定度の増加の下で安定な振舞いを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:51:04 GMT)
Act, Sense, Act: Learning Non-Markovian Active Perception Strategies from Large-Scale Egocentric Human Data [30.5] 我々は、情報ゲインと意思決定分岐によって駆動される非マルコフ過程として能動的知覚を定式化する。
本稿では,認知と記憶を意識した視覚言語アクションフレームワークCoMe-VLAを紹介する。
本フレームワークは,自律的なサブタスク遷移のための認知補助ヘッドと,一貫した自己および環境意識を維持するためのデュアルトラックメモリシステムを統合する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:28:14 GMT)
SocialVeil: Probing Social Intelligence of Language Agents under Communication Barriers [30.2] textscSocialVeilは、認知差によるコミュニケーション障壁下での社会的相互作用をシミュレートできる社会学習環境である。
相互理解は平均で45%以上減少し,混乱は50%近く増加した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:04:25 GMT)
Combining scEEG and PPG for reliable sleep staging using lightweight wearables [30.2] シングルチャネル脳波(scEEG)のような軽量ウェアラブルデバイスでは、信頼性の高い睡眠ステージングは依然として困難である。
scEEGは皮質活動を直接測定し、睡眠段階の基礎として機能するが、軽い睡眠段階において限られたパフォーマンスを示す。
本研究では,短時間 (30 s - 30 min) の制約下での4クラス睡眠ステージングにおける scEEG- PPG 融合について検討した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:00:35 GMT)
VecSet-Edit: Unleashing Pre-trained LRM for Mesh Editing from Single Image [30.1] textbfVecSet-Editは、メッシュ編集のバックボーンとして高忠実度VecSet Large Reconstruction Model(LRM)を利用する最初のパイプラインである。
我々のアプローチは、VecSetトークンの空間的特性の分析に基づいており、トークンサブセットが異なる幾何学的領域を支配していることを明らかにする。
我々のDetail-Preserving Texture Bakingモジュールは、元のメッシュの幾何学的詳細だけでなく、テクスチャ情報も保存することを保証します。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:16:12 GMT)
EXaMCaP: Subset Selection with Entropy Gain Maximization for Probing Capability Gains of Large Chart Understanding Training Sets [30.1] 性能評価のためのフルセットの微調整MLLMは、かなりの時間的コストを発生させる。
エントロピーゲインを用いてサブセットを選択するEXaMCaPを提案する。
実験の結果、EXaMCaPはChartUトレーニングセットの能力向上を実証する上で、ベースラインよりも優れていた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:41:03 GMT)
CoT is Not the Chain of Truth: An Empirical Internal Analysis of Reasoning LLMs for Fake News Generation [30.0] 偽ニュース生成では、たとえモデルが有害な要求を拒絶しても、そのチェーン・オブ・ソート(CoT)推論は内部的にも安全でない物語を包含し伝播する可能性がある。
モデル層間におけるCoT生成を系統的に分解し,個別の注意点の役割を評価する統合型安全分析フレームワークを提案する。
我々の研究は、拒絶が安全性を示唆する仮定に挑戦し、潜伏する推論リスクを軽減するための新たな理解視点を提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:43:10 GMT)
History-Guided Iterative Visual Reasoning with Self-Correction [30.0] 大きな言語モデル(MLLM)の推論信頼性を向上させるための自己整合性手法
本稿では,繰り返し検証と動的誤り訂正の人間の推論行動に触発されたH-GIVRフレームワークを提案する。
このフレームワークは計算コストを低く保ちながら、クロスモーダル推論精度を著しく向上させることができる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:42:06 GMT)
Bi-directional Bias Attribution: Debiasing Large Language Models without Modifying Prompts [29.9] 本研究では, 言語モデルにおいて, ステレオタイプ誘導語を検出し, ニューロンレベルのバイアスをもたらすフレームワークを提案する。
本フレームワークはまず, 集団間の比較分析により, ステレオタイプ誘導形容詞と名詞を識別する。
3つの LLM 実験により,本手法はモデル全体の性能を保ちながらバイアスを効果的に低減することを示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:27:36 GMT)
Vibe AIGC: A New Paradigm for Content Generation via Agentic Orchestration [29.7] 本稿では,階層型マルチエージェントの自律的合成を表現したエージェントオーケストレーションによるコンテンツ生成の新しいパラダイムを提案する。
このシフトは、AIを脆弱な推論エンジンから堅牢なシステムレベルのエンジニアリングパートナに変えることによって、人間とAIの協力経済を再定義する、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:01:44 GMT)
TrajVG: 3D Trajectory-Coupled Visual Geometry Learning [29.1] TrajVGは、クロスフレームな3D対応を明示する再構築フレームワークである。
擬似2次元トラックのみを用いて,同じ結合制約を自己教師対象に再構成する。
3Dトラッキング、ポーズ推定、ポイントマップ再構成、ビデオ深度による実験は、TrajVGが現在のフィードフォワードのパフォーマンスベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:13:55 GMT)
RAPO: Risk-Aware Preference Optimization for Generalizable Safe Reasoning [29.0] 大規模推論モデル(LRM)は、そのチェーン・オブ・ソート(CoT)推論で大きな成功を収めた。
LRMは、多種多様な複雑なジェイルブレイク攻撃に対して一般化に失敗することが多い。
LRMが安全リスクを適応的に識別し対処することを可能にするRAPOフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:18:38 GMT)
Depth-Guided Metric-Aware Temporal Consistency for Monocular Video Human Mesh Recovery [29.0] 本稿では,3つの相乗的コンポーネントを通して,計量的時間的整合性を実現する包括的フレームワークを提案する。
Depth-Guided Multi-Scale Fusionモジュールは、幾何的先行とRGB機能とを、信頼を意識したゲーティングを通じて適応的に統合する。
MoDAR(Motion-Depth Aligned Refinement)モジュールは、運動力学と幾何学的手がかりの間の横断的な注意を通して時間的コヒーレンスを強制する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:41:03 GMT)
GRIP: Geometric Refinement and Adaptive Information Potential for Data Efficiency [28.8] textbfGRIP (Geometric Refinement and Adaptive Information Potential) は、コーパスを情報密度幾何学空間としてモデル化することにより、これらの次元を統一するフレームワークである。
我々の研究は、大規模事前学習における適応データキュレーションのための堅牢な幾何学的基礎を確立する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:23:24 GMT)
An Improved Boosted DC Algorithm for Nonsmooth Functions with Applications in Image Recovery [28.8] 本研究では,非滑らか・非収束問題に対して,凸関数アルゴリズム(BDCA)の高次差分を求める手法を提案する。
In the application of IBDCA in image recovery showed the effective of our method。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:54:28 GMT)
Light Forcing: Accelerating Autoregressive Video Diffusion via Sparse Attention [28.6] textscLight Forcingは、ARビデオ生成モデルに適した、テキストファーストのスパースアテンションソリューションである。
textitChunk-Aware Growthメカニズムを組み込んで,各チャンクのコントリビューションを定量的に見積もる。
また,情報的歴史的・局所的文脈を粗い方法で捉えるために,テキストスパース注意を導入する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:41:53 GMT)
Bilevel Optimization with Lower-Level Uniform Convexity: Theory and Algorithm [28.4] 双レベル最適化は、上位レベルの問題が下位レベルの問題によって制約される階層的なフレームワークである。
既存の二レベル最適化手法は、低レベル関数に対する強い凸性やポリアック・オジャシエヴィチ(PL)条件を仮定する。
両レベル最適化は, 一般凸下層関数に対して本質的に難解であり, 極小過次関数の探索が目的であることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:09:52 GMT)
AGMA: Adaptive Gaussian Mixture Anchors for Prior-Guided Multimodal Human Trajectory Forecasting [28.3] 本稿では,2つの段階を通して表現的事前を構成するAGMA(Adaptive Gaussian Mixture Anchors)を提案する。
ETH-UCY、Stanford Drone、JRDBデータセットの実験は、AGMAが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:42:57 GMT)
Interpreting Physics in Video World Models [28.3] 物理推論における長年の疑問は、ビデオベースのモデルが物理変数の分解表現に依存する必要があるかどうかである。
本稿では,大規模ビデオエンコーダ内の物理表現を調べるための最初の解釈可能性研究について述べる。
現代のビデオモデルは、古典的な物理エンジンのような物理変数の分解表現を使用しない。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:19:19 GMT)
LycheeDecode: Accelerating Long-Context LLM Inference via Hybrid-Head Sparse Decoding [27.9] LLM(Long-context Large Language Model)は、デコード中に急速に拡大するキーバリューキャッシュという、重要なボトルネックを露呈する。
我々は,微細なハイブリッドヘッドアテンション機構を中心とした効率的な復号法であるLycheeDecodeを提案する。
我々はLycheeDecodeが、フルアテンションベースラインに匹敵する、時には超越した生成品質を達成することを実証した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:34:12 GMT)
AERO: Autonomous Evolutionary Reasoning Optimization via Endogenous Dual-Loop Feedback [27.7] 以下は「アンダーライン・アンダーライン・エボリューショナリー・アンダーライン・アンダーライン・オプティマイゼーション(AERO)」である。
AEROは、シナジスティックなデュアルループシステムの中で、自己問合せ、回答、批判を内部化する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:43:04 GMT)
Audio ControlNet for Fine-Grained Audio Generation and Editing [27.5] 事前訓練されたT2Aバックボーン上でコントロールネットモデルをトレーニングし、大音量、ピッチ、イベントロールに対して制御可能な生成を実現する。
我々は、このフレームワークを音声編集に拡張し、指示によって指定された時刻に音声イベントを削除・挿入するT2A-Editorを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:52:38 GMT)
medR: Reward Engineering for Clinical Offline Reinforcement Learning via Tri-Drive Potential Functions [27.4] 強化学習(RL)は動的治療体制(DTR)を最適化するための強力なフレームワークを提供する
既存のアプローチは、様々な病理の一般化に失敗する手動信号に依存することが多い。
本稿では,Large Language Models (LLMs) を利用したオフライン報酬設計と検証のための自動パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:20:50 GMT)
Understanding LLM Evaluator Behavior: A Structured Multi-Evaluator Framework for Merchant Risk Assessment [26.8] 大規模言語モデル(LLM)は、推論品質の評価手段としてますます使われていますが、その信頼性と支払いリスク設定の偏りはよく分かっていません。
本稿では,Merchant Category Code(MCC)に基づく商業リスク評価において,LCM推論を評価するための構造化マルチ評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:55:16 GMT)
VISTA: Enhancing Visual Conditioning via Track-Following Preference Optimization in Vision-Language-Action Models [26.5] VLA(Vision-Language-Action)モデルは、幅広いロボット操作タスクにおいて強力なパフォーマンスを示している。
成功にもかかわらず、大きな事前訓練されたVLAモデルをアクション空間に拡張することで、視覚-アクションのミスアライメントを誘発することができる。
VLAモデルにおける視覚的条件付けを明確に強化するトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:59:29 GMT)
DementiaBank-Emotion: A Multi-Rater Emotion Annotation Corpus for Alzheimer's Disease Speech (Version 1.0) [26.2] DementiaBank-Emotionはアルツハイマー病(AD)音声に対する最初のマルチラター感情アノテーションコーパスである。
Ekmanの6つの基本的な感情と中立性のための108人の話者からの1,492の発話を注釈し、AD患者は健康的なコントロールよりもはるかに非中立的な感情を表現していることがわかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:13:48 GMT)
Scaling Laws for Embedding Dimension in Information Retrieval [26.2] 埋め込み次元と検索性能の関係を包括的に分析する。
スケーリングの振る舞いは電力法則に適合しており、埋め込み次元のみを考慮して、パフォーマンスのスケーリング法則を導出することができる。
評価タスクがトレーニングタスクに沿っている場合, 埋め込みサイズが大きくなるにつれて, 性能が向上し続けていることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:27:12 GMT)
Are AI Capabilities Increasing Exponentially? A Competing Hypothesis [26.1] 短期的な地平線においても、このデータは指数的な成長をサポートしていないと論じる。
我々は、AI能力をベースと推論能力に分解するより複雑なモデルを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:28:49 GMT)
Group-Evolving Agents: Open-Ended Self-Improvement via Experience Sharing [26.1] Group-Evolving Agents (GEA)は、エージェントのグループを基本的な進化単位として扱う。
我々はGAAを、最先端の自己進化手法を著しく上回る、挑戦的なコーディングベンチマークで評価する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:29:36 GMT)
GenMRP: A Generative Multi-Route Planning Framework for Efficient and Personalized Real-Time Industrial Navigation [25.9] マルチルート計画のための生成フレームワークであるGenMRPを提案する。
我々は,GenMRPがオフライン環境とオンライン環境の両方で高い効率で最先端の性能を達成することを示す。
GenMRPは現実世界のナビゲーションアプリに完全にデプロイされており、その効果とメリットを実証している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:21:21 GMT)
On the Equilibrium between Feasible Zone and Uncertain Model in Safe Exploration [25.7] 本稿では,安全な探査の目的が,実現可能なゾーンと環境モデルとの均衡を見出すことであることを明らかにした。
より大きな実現可能なゾーンはより正確な環境モデルをもたらし、より正確なモデルにより、より大きなゾーンを探索することができる。
本稿では,最大許容域の探索と不確実なモデルとの交互に行う安全平衡探索(SEE)と呼ばれる,最初の平衡指向型安全な探査フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:09:20 GMT)
Quantile-Physics Hybrid Framework for Safe-Speed Recommendation under Diverse Weather Conditions Leveraging Connected Vehicle and Road Weather Information Systems Data [25.6] 本研究では,様々な気象条件下での高速道路走行において,リアルタイムの安全速度間隔を推奨するハイブリッド予測フレームワークを提案する。
ニューヨーク州バッファローで73日間に660万以上のレコードを含むデータセットを構築した。
モデルが気象条件の変化に対応し、道路セグメントをまたいで一般化する能力は、現実世界の展開を約束する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:06:32 GMT)
Topology-Aware Revival for Efficient Sparse Training [25.3] Topology-Aware Revival (TAR) は、動的に切り替えることなく静的なスペーシングを改善する軽量のワンショット・ポスト・プルーニング・プロシージャである。
TARは静的スパースベースラインの最終的なリターンを最大+37.9%改善し、動的スパーストレーニングベースラインを+13.5%向上させた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:01:12 GMT)
PerpetualWonder: Long-Horizon Action-Conditioned 4D Scene Generation [25.3] PerpetualWonderは、1枚の画像から長時間のアクション条件付き4Dシーンを生成するハイブリッド生成シミュレータである。
物理的な状態と視覚的プリミティブのリンクを生成する新しい統一された表現が特徴であり、生成的洗練により、ダイナミクスと外観の両方を修正できる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:58:55 GMT)
SkeletonGaussian: Editable 4D Generation through Gaussian Skeletonization [25.3] SkeletonGaussianは、モノクロビデオ入力から編集可能な動的3Dガウシアンを生成するためのフレームワークである。
本手法は,スケルトンと細粒な非剛体運動によって特異的に駆動されるスパース剛体運動に運動を分解する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:00:44 GMT)
DiMo: Discrete Diffusion Modeling for Motion Generation and Understanding [25.3] マスク付きモデリングからテキスト-モーション理解と生成まで拡張した,離散拡散スタイルのフレームワークであるDiMoを提案する。
動きをトークン化し、順次デコードするGPTスタイルの自己回帰アプローチとは異なり、DiMoは繰り返しマスク付きトークン精錬を行う。
統合された枠組みの下で、強い動きの質と競争力のある双方向理解を示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:01:02 GMT)
Improved Dimension Dependence for Bandit Convex Optimization with Gradient Variations [25.0] 本研究では,帯域幅による勾配変動の基本量である非連続勾配変動の精密な解析法を提案する。
超矩形領域上の一点帯域線形最適化のための1次勾配変分を達成し,本手法の汎用性を実証する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:58:53 GMT)
Maximin Relative Improvement: Fair Learning as a Bargaining Problem [24.9] グループフェアネスをサブ集団間の交渉問題として解釈するアプローチを根本的に異なるアプローチで提案する。
このゲーム理論的な観点は、最悪のグループ損失の最小化や後悔の最小化のような既存の堅牢な最適化手法が古典的なバリ取り解に対応していることを示している。
そこで我々は,Kalai-Smorodinsky溶液を回収するベースライン予測器によるリスク低減と潜在的な低減の相対的改善を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:44:56 GMT)
Training A Foundation Model to Represent Graphs as Vectors [24.6] 本稿では,任意のグラフを意味情報を保存するベクトルとして表現できるグラフ基盤モデルを訓練することを目的とする。
提案モデルの有効性を裏付ける理論的な一般化を提供する。
数ショットのグラフ分類とグラフクラスタリングによる実験結果から,我々のモデルは強いベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:06:28 GMT)
Can Vision Replace Text in Working Memory? Evidence from Spatial n-Back in Vision-Language Models [24.6] 作業記憶は知的行動の中心的な要素である。
最近の研究では、n-backタスクを使用して、大きな言語モデルで作業メモリのような振る舞いを探索している。
一致したテキストレンダリングや画像レンダリングのグリッドとして表現された空間的n-backタスクに対して,Qwen2.5とQwen2.5-VLを評価する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:25:07 GMT)
DMFlow: Disordered Materials Generation by Flow Matching [24.6] DMFlowは、乱れた結晶に特化して設計された生成フレームワークである。
フローマッチングモデルを使用して、すべての構造コンポーネントを共同で生成する。
SD,PD,混合構造を含むベンチマークをCrystallography Open Databaseからリリースした。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:36:58 GMT)
Disentangling meaning from language in LLM-based machine translation [24.4] 機械論的観点から文レベルの機械翻訳について検討する。
我々はMTを2つのサブタスクに分解する: 対象言語でテキストを生成し、入力文の意味を保存する。
命令ベースのプロンプトに匹敵する無命令MT性能を実現できることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:40:53 GMT)
Membership Inference Attacks from Causal Principles [24.4] 我々は、MIA評価を因果推論問題とし、記憶をトレーニングセットにデータポイントを含む因果効果として定義する。
非漸近的整合性保証付きマルチラン・ワンラン・ゼロラン体制の実用的推定器を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:15:22 GMT)
Textual Planning with Explicit Latent Transitions [24.1] LLMによるプランニングはトークン・バイ・トークン・ジェネレーションと,フルフォワードの繰り返しによってボトルネックとなる。
フリーズ言語空間で動作する軽量トランジションモデルを用いて, 自己回帰的次状態生成を置き換えた EmbedPlan を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:46:15 GMT)
Universal Robust Speech Adaptation for Cross-Domain Speech Recognition and Enhancement [24.1] URSA-GANは、ノイズおよびチャネル条件のミスマッチを軽減するために設計された、ドメイン対応の生成フレームワークである。
URSA-GANは、ASRの文字誤り率を効果的に低減し、様々なノイズや不一致のチャネルシナリオでSEの指標を改善する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:16:22 GMT)
Budget-Aware Agentic Routing via Boundary-Guided Training [24.1] 予算対応エージェントルーティング(Budget-Aware Agentic Routing)は、各ステップで安価なモデルと高価なモデルを選択して、コスト削減フロンティアを最適化する。
境界誘導訓練(Boundary-Guided Training)は、希少な報酬の下で学習を定着させるために難しい分類法を構築する。
実験結果から,提案手法は高効率フロンティアを改良し,強いルーティングベースラインを極めて低コストで整合することを示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:39:27 GMT)
ProphetKV: User-Query-Driven Selective Recomputation for Efficient KV Cache Reuse in Retrieval-Augmented Generation [23.9] 本稿では,RAGシナリオに対するユーザクエリ駆動型KVキャッシュ再利用手法であるProphet KVを提案する。
Prophet KVは、ユーザクエリに対するセマンティックな関連性に基づいてトークンを優先順位付けする。
以上の結果から, Prophet KVの完全補充精度は96%-101%であり,再計算率は20%に過ぎなかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:50:52 GMT)
SparVAR: Exploring Sparsity in Visual AutoRegressive Modeling for Training-Free Acceleration [23.9] 本稿では,視覚的オートレグレッシブ・アテンションの3つの特性,すなわち強いアテンション・シンク,大規模アクティベーション類似性,局所性の3つの特性を利用する,トレーニング不要なアクティベーション・フレームワークを提案する。
具体的には、後続の高分解能尺度のスパースアテンションパターンをスパース決定尺度から動的に予測し、効率的なインデックスマッピング機構を用いて自己相似スパースアテンションを構築する。
提案手法は、ほぼすべての高周波の詳細を保存しながら、$mathbf1.57times$ Speed-upを実現する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:34:06 GMT)
Improving Set Function Approximation with Quasi-Arithmetic Neural Networks [23.7] 準数学的ニューラルネットワーク(qui-arithmetic Neural Network, QUINN)を提案する。
quaNNは、一般的な集合関数分解の幅広いクラスに対する普遍近似である。
理論解析により、quarNNは共通な集合関数分解の幅広いクラスに対する普遍近似であることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:36:31 GMT)
DeepRead: Document Structure-Aware Reasoning to Enhance Agentic Search [23.4] 本稿では,構造化対応マルチターン文書推論エージェントDeepReadを紹介する。
文書質問応答において,DeepReadは検索-o1スタイルのエージェント検索よりも大幅に改善されていることを示す。
我々の微粒な行動分析では、人間に似た読みと推論のパラダイムが示され、読みの振る舞いがわかる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:03:28 GMT)
Not All Negative Samples Are Equal: LLMs Learn Better from Plausible Reasoning [23.4] Plausible Negative Samples (PNS) は、予測フォーマットと構造コヒーレンスを示す高品質な負のサンプルを合成する手法である。
PNSは、フォーマットコンプライアンス、精度逆転、チェーンオブ思考評価を組み合わせた複合報酬によって導かれる逆強化学習を通じて、専用モデルを訓練する。
PNSは他の負のサンプル法を一貫して上回り、RL訓練モデルよりも平均2.03%改善した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:25:31 GMT)
LCUDiff: Latent Capacity Upgrade Diffusion for Faithful Human Body Restoration [23.3] 劣化した人中心のイメージを復元する既存の方法は、しばしば不十分な忠実さに苦しむ。
そこで我々はLCUDiffを提案する。LCUDiffは訓練済みの潜伏拡散モデルをアップグレードする安定なワンステップフレームワークである。
合成および実世界のデータセットの実験は、より高い忠実度と少ないアーティファクトによる競争結果を示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:37:46 GMT)
MTS-CSNet: Multiscale Tensor Factorization for Deep Compressive Sensing on RGB Images [23.2] MTSCSNetは,Multiscale Summation (MTS) の分解に基づくCSフレームワークである。
MTSCSNetは,最近の拡散型CS法と比較して,PSNRの顕著な向上と推論の高速化により,RGB画像における最先端の再構成性能を実現していることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:38:04 GMT)
Rethinking Weight Tying: Pseudo-Inverse Tying for Stable LM Training and Updates [22.8] Pseudo-Inverse Tyingはトレーニングを通じて擬似逆整合インターフェースを保証する。
256M-1.3Bパラメータにまたがるデバイス上でのPITを評価する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:44:53 GMT)
Optimizing Mission Planning for Multi-Debris Rendezvous Using Reinforcement Learning with Refueling and Adaptive Collision Avoidance [22.3] 本研究では, アクティブデブリ除去ミッションにおける適応衝突回避のための強化学習に基づく枠組みを提案する。
小型衛星は、柔軟性、コスト効率、操縦性から採用され、ADRのようなダイナミックなミッションに適している。
このフレームワークは、補給戦略、効率的なミッション計画、適応衝突回避を統合し、宇宙船のランデブー操作を最適化する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:49:20 GMT)
Optimal Multi-Debris Mission Planning in LEO: A Deep Reinforcement Learning Approach with Co-Elliptic Transfers and Refueling [22.3] 本稿では, ホフマン転移, 安全近接操作, 明示的再給油論理を組み合わせた統合型楕円型操舵フレームワークを提案する。
我々は、Greedy、Monte Carlo Tree Search(MCTS)、Deep reinforcement Learning(RL)の3つの異なる計画アルゴリズムをベンチマークする。
100以上のテストシナリオの実験結果から,Masked PPOはミッション効率と計算性能に優れることが示された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:15:14 GMT)
Evaluating Robustness and Adaptability in Learning-Based Mission Planning for Active Debris Removal [22.3] この研究は、低地球軌道における制約付きマルチデブリランデブー問題の3つのプランナーを比較した。
再燃料化, 現実的な移動力学, ランダム化された破片場を用いた高忠実軌道シミュレーションにより評価を行った。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:22:40 GMT)
Thickening-to-Thinning: Reward Shaping via Human-Inspired Learning Dynamics for LLM Reasoning [22.2] Reinforcement Learning with Verifiable Rewards (RLVR) は、大規模言語モデルにおける推論を強化するための有望なパラダイムとして登場した。
既存の報酬体系は、問題解決における広範囲な探索の必要性と、熟達した知識に必要な効率とを区別することができない。
人間の学習プロセスにインスパイアされた動的報酬フレームワークであるT2Tを紹介する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:55:58 GMT)
PersoPilot: An Adaptive AI-Copilot for Transparent Contextualized Persona Classification and Personalized Response Generation [22.1] PersoPilotはエージェントAIコパイロットで、パーソナ理解とコンテキスト分析を統合し、エンドユーザとアナリストの両方をサポートする。
アナリスト側では、PersoPilotは透明で推論機能を備えたラベリングアシスタントを提供し、アクティブな学習駆動型分類プロセスと統合されている。
適応可能なフレームワークとして、PersoPilotは幅広いサービスパーソナライズシナリオに適用できる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:31:24 GMT)
SimpleTool: Parallel Decoding for Real-Time LLM Function Calling [21.7] SimpleToolは3-6倍のスピードアップ(最大9.6倍)を実現し、並列化オーバーヘッドは+8.2%である。
Mobile Actionsでは、ST-Qwen-0.5BはGoogleのFunctionGemmaよりも精度とレイテンシの一貫性が優れている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:58:27 GMT)
SCASRec: A Self-Correcting and Auto-Stopping Model for Generative Route List Recommendation [21.4] ルートレコメンデーションシステムは、高品質な順序付きレコメンデーションを生成するために、微調整と再ランクを含む多段階パイプラインを採用するのが一般的である。
ランク付けと冗長性排除を1つのエンドツーエンドプロセスに統合する統合生成フレームワークであるSCASRecを提案する。
SCASRecは、ハードサンプルに焦点を当ててリストワイズ改善をガイドするステップワイズ補正報酬(SCR)を導入し、学習可能なエンド・オブ・レコメンデーション(EOR)トークンを使用して、さらなる改善が期待されない場合に生成を適応的に終了する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:14:59 GMT)
Comparing Euclidean and Hyperbolic K-Means for Generalized Category Discovery [21.2] ハイパボリッククラスタリングGCD(HC-GCD)について紹介する。
HC-GCDは、双曲幾何学のローレンツ・ハイパーボロイドモデルへの埋め込みを学習し、これらの埋め込みを双曲K-Meansアルゴリズムを用いて双曲空間に直接クラスタ化する。
双曲K平均はユークリッドK平均よりも精度が高いことを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:40:33 GMT)
SCALE: Self-uncertainty Conditioned Adaptive Looking and Execution for Vision-Language-Action Models [21.1] VLA(Vision-Language-Action)モデルが汎用ロボット制御の有望なパラダイムとして登場した。
現在のテストタイムスケーリング(TTS)メソッドでは、追加のトレーニング、検証、複数フォワードパスが必要になるため、デプロイには実用的ではない。
我々は,「自己不確実性」に基づく視覚的知覚と行動を協調的に調節するシンプルな推論戦略を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:48:16 GMT)
Attack-Resistant Uniform Fairness for Linear and Smooth Contextual Bandits [21.1] 我々は,線形および滑らかな報酬関数に対して,最小限の後悔を解く新しいアルゴリズムを開発した。
最小限の$tildeO(1)の予算を持つ敵は、従来の攻撃のように全体的な性能を低下させるだけでなく、悪質なフェアネス固有の障害を選択的に誘発できることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:37:47 GMT)
HoRD: Robust Humanoid Control via History-Conditioned Reinforcement Learning and Online Distillation [21.0] ヒューマノイドロボットは、力学、タスク仕様、環境設定の小さな変更の下で、大幅なパフォーマンス低下を被る可能性がある。
ドメインシフト下での堅牢なヒューマノイド制御のための2段階学習フレームワークHoRDを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:41:23 GMT)
ProAct: A Benchmark and Multimodal Framework for Structure-Aware Proactive Response [20.9] ProAct-75は、さまざまなドメインにわたるプロアクティブエージェントのトレーニングと評価のために設計されたベンチマークである。
我々のデータセットは、明示的なタスクグラフに富んだ91,581のステップレベルのアノテーションを備えている。
MLLM(Multimodal Large Language Model)を用いた参照ベースラインであるProAct-Helperを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:41:04 GMT)
GeneralVLA: Generalizable Vision-Language-Action Models with Knowledge-Guided Trajectory Planning [20.6] GeneralVLAは階層型視覚言語アクション(VLA)モデルであり、基礎モデルの一般化をより効果的に活用することができる。
GeneralVLAは14タスクの軌道生成に成功し、VoxPoserのような最先端の手法を著しく上回った。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:30:27 GMT)
Towards Structured, State-Aware, and Execution-Grounded Reasoning for Software Engineering Agents [20.5] 私たちは、リアクティブな振る舞いを超えて、構造化され、状態認識され、実行基盤の推論に移行する必要があると論じています。
明示的な構造、永続的かつ進化的な状態、そして実行時のフィードバックの統合によって、SEエージェントがより一貫性と信頼性のある推論を行うのにどう役立つかを概説する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:07:53 GMT)
Language Models Struggle to Use Representations Learned In-Context [20.3] 本研究は,大規模言語モデルにおいて,簡単なダウンストリームタスクを完了するためにコンテキスト内表現を使用できるかどうかを考察する。
オープンウェイト LLM がコンテキスト内で定義された新しい意味論の表現の展開に苦慮していることを示す。
全体として、本研究は、モデルに対して、提示された情報をコンテキスト内にエンコードするだけでなく、この情報の柔軟な展開をサポートする方法で、モデルに奨励する新しい方法を模索している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:55:07 GMT)
Laplacian Representations for Decision-Time Planning [20.3] 複数の時間スケールで状態空間距離をキャプチャすることで、ラプラシア表現が計画に有効な潜在空間を提供することを示す。
この表現は意味のある距離を保ち、自然に長い水平問題をサブゴールに分解し、長い予測地平線上で生じる複合誤差を緩和する。
階層的計画アルゴリズムであるALPSを導入し、OGBenchのオフラインゴール条件付きRLタスクの選択において、一般的に使用されるベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:34:50 GMT)
PersoDPO: Scalable Preference Optimization for Instruction-Adherent, Persona-Grounded Dialogue via Multi-LLM Evaluation [20.2] PersoDPOはスケーラブルな選好最適化フレームワークである。
一貫性とパーソナライゼーションを目標とした評価指標と,長さ形式のコンプライアンス機能を統合する。
FoCusデータセットの実験は、PersoDPOフレームワークで微調整されたオープンソースの言語モデルが、強力なオープンソースベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:34:55 GMT)
ReFORM: Reflected Flows for On-support Offline RL via Noise Manipulation [20.2] オフライン強化学習(RL)は、環境の相互作用を伴わずに行動ポリシーによって生成された固定データセットから最適なポリシーを学ぶことを目的としている。
構築による制約の少ないサポート制約を強制するフローポリシーに基づくオフラインRL手法であるReFORMを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:03:11 GMT)
Sparse Attention as Compact Kernel Regression [20.0] カーネル理論によるスパースアテンション機構の理解が現在欠落している。
スパースアテンションとコンパクト(有界サポート)カーネルの正式な対応を確立する。
カーネルレグレッションベースの変種であるメモリモザイクによる実験は、カーネルベースのスパースアテンションが競合性能を達成することを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:26:29 GMT)
From Helpfulness to Toxic Proactivity: Diagnosing Behavioral Misalignment in LLM Agents [20.0] トキシック・プロアクティビティ(Toxic Proactive)とは、エージェントがユーティリティを最大化するための倫理的制約を無視したアクティブな障害モードである。
過剰な拒絶とは異なり、トキシック・プロアクティベーションは、その「使い勝手」を維持するために過剰または操作的な措置をとるエージェントとして現れている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:29:04 GMT)
Semantic Self-Distillation for Language Model Uncertainty [20.0] 軽量な学生モデルでは,言語モデルが応答トークンを生成する前に,迅速な条件付き不確実性を推定できることを示す。
この分布のエントロピーは、幻覚予測のための効果的な不確実性信号を提供し、確率密度は、候補回答を信頼性のために評価することを可能にする。
TriviaQAでは,学生モデルが幻覚予測のための有限サンプルセマンティック分散に適合あるいは優れ,ドメイン外応答検出のための強い信号を提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:03:28 GMT)
Towards Next-Generation SLAM: A Survey on 3DGS-SLAM Focusing on Performance, Robustness, and Future Directions [19.8] この調査は、3DGSとSLAMを統合するための重要な技術的アプローチを包括的にレビューする。
提案手法の性能最適化は,レンダリング品質,トラッキング精度,再構築速度,メモリ消費の4つの重要な側面にまたがる。
本研究では3DGS-SLAMの運動ぼけや動的環境などの複雑な環境におけるロバスト性を高める手法について検討する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:20:22 GMT)
Multiview Self-Representation Learning across Heterogeneous Views [19.7] 本稿では,多視点自己表現学習(MSRL)手法を提案する。
複数のベンチマークビジュアルデータセットを用いた実験により、提案手法はいくつかの最先端手法より一貫して優れていることが示された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:45:54 GMT)
Optimal Rates for Feasible Payoff Set Estimation in Games [19.6] ゲーム逆理論は、観察された行動と整合した支払の集合全体を特定することを目的としている。
我々は、ハースドルフ計量上で、高い確率と最大精度で実現可能なペイオフの集合を推定する問題に焦点をあてる。
この結果は,マルチエージェント環境における設定値のペイオフ推論のための学習理論の基礎を提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:27:11 GMT)
PhysBrain: Human Egocentric Data as a Bridge from Vision Language Models to Physical Intelligence [19.6] Egocentric2Embodiment Translation Pipelineは、生の人間中心のビデオをマルチレベルなスキーマ駆動型実施監視に変換する。
E2E-3Mデータセットのトレーニングにより、Egocentric-aware embodied brainであるPhysBrainを得る。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:53:52 GMT)
EMA Policy Gradient: Taming Reinforcement Learning for LLMs with EMA Anchor and Top-k KL [19.5] 大規模言語モデル(LLM)の勾配ポリシーアルゴリズムを改善するための2つの手法を提案する。
まず、RL中の固定アンカーポリシーを指数移動平均(EMA)に置き換える。
第2に、正確なKLとサンプルKLのフレキシブルなTop-k KL推定器を導入する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:50:17 GMT)
Joint Parameter and State-Space Bayesian Optimization: Using Process Expertise to Accelerate Manufacturing Optimization [19.3] 以上の結果から,POGPN-JPSSは所望の性能閾値を2倍の速さで高い信頼性で達成し,最先端手法を著しく上回ることを示す。
このことは、専門家の知識と構造化確率モデルを組み合わせることの重要性を強調している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:07:36 GMT)
Invariance on Manifolds: Understanding Robust Visual Representations for Place Recognition [19.2] 本稿では,2次幾何統計フレームワークを提案する。
提案手法では、固定されたトレーニング済みのバックボーン上に構築されたトレーニング不要のフレームワークを導入し、パラメータ更新なしで強力なゼロショット一般化を実現する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:38:55 GMT)
PEPR: Privileged Event-based Predictive Regularization for Domain Generalization [19.2] 本稿では,厳密な単一モダリティRGBモデルをトレーニングするための特権情報(LUPI)パラダイムを用いた学習環境下でのクロスモーダルフレームワークを提案する。
イベントカメラを特権情報のソースとして利用し、トレーニング中にのみ利用可能です。
RGBエンコーダをPEPRでトレーニングし、イベントベースの潜伏特性を予測し、意味豊かさを犠牲にすることなくロバスト性を蒸留する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:10:36 GMT)
Rationality Measurement and Theory for Reinforcement Learning Agents [19.1] 本稿では,強化学習エージェントに対する合理性尺度と関連する理論の組を提案する。
最も急な方向に隠された真値関数を最大化すれば、デプロイメントにおけるアクションは完全に合理的であると定義します。
政策の合理的な行動に対する行動の期待値の相違は、合理的なリスクであると定義される。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:41:22 GMT)
Theory of Optimal Learning Rate Schedules and Scaling Laws for a Random Feature Model [19.0] 勾配降下学習モデル(SGD)の最適学習率スケジュールの解法モデルについて検討する。
ハードフェーズでは、最適スケジュールはウォームアップ安定デカイに似ており、初期学習レートは一定($T$)で、トレーニングステップの消滅分だけ実行されます。
我々のモデルは、簡単かつ困難な状況下での計算-最適スケーリング法則(モデルサイズとトレーニングステップが選択される)も予測します。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:11:36 GMT)
Laminating Representation Autoencoders for Efficient Diffusion [19.0] 近年の研究では、拡散モデルがピクセル空間ラテントではなくSSLパッチ機能を直接操作することで、高品質な画像を生成することが示されている。
この表現をわずか32個の連続トークンからなる1次元列に圧縮する変分オートエンコーダであるFlatDINOを導入する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:57:33 GMT)
CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification [19.0] 医用画像分類はコンピュータ支援診断(CAD)のコアタスクである
眼科領域ではFlurecein fundus angiography (FFA) とIndocyanine green angiography (ICGA) が血行動態および病変・構造情報を提供する。
我々は,MedMamba上に構築された拡張フレームワークであるCLEAR-Mambaを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:18:59 GMT)
Knowledge Distillation for mmWave Beam Prediction Using Sub-6 GHz Channels [18.7] 本稿では,知識蒸留(KD)技術に基づくサブ6GHzチャネル-mmWaveビームマッピングのためのフレームワークを提案する。
提案モデルでは,教師のビーム予測精度とスペクトル効率を向上し,学習可能なパラメータと計算複雑性を99%削減した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:15:32 GMT)
Learning, Solving and Optimizing PDEs with TensorGalerkin: an efficient high-performance Galerkin assembly algorithm [18.7] 本稿では,数値解の統一化,制約付き最適化,変分構造を持つPDEの物理インフォームド学習について述べる。
我々のフレームワークは、基礎となる変分形式のガレルキン離散化に基づいている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:04:09 GMT)
JOintGS: Joint Optimization of Cameras, Bodies and 3D Gaussians for In-the-Wild Monocular Reconstruction [18.6] JOintGSは、カメラ外在物、人間のポーズ、および3Dガウス表現を協調的に最適化する統合フレームワークである。
NeuManとEMDBデータセットの実験は、JOintGSが優れた再構築品質を達成することを示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:33:51 GMT)
ALORE: Autonomous Large-Object Rearrangement with a Legged Manipulator [18.5] 足関節マニピュレータのための自律型大物体再構成システムであるALOREについて述べる。
提案システムの特徴は, (i) 多目的環境学習のための階層的強化学習パイプライン, (ii) 統合された相互作用構成表現とオブジェクト速度推定器, (iii) タスク・アンド・モーション・プランニング・フレームワークの3つである。
このシステムは、単一障害なしに、32の椅子を40分近く並べ替える8つのループを成功させ、約40mのルートで長距離の自律的な配置を実行する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:57:36 GMT)
Horizon-LM: A RAM-Centric Architecture for LLM Training [18.4] Horizon-LMは、大規模なモデル最適化のためにCPUとGPUの役割を再定義するメモリ中心のトレーニングシステムである。
1.5,TBのホストRAMを持つ1つのH200 GPU上で、Horizon-LMは120Bパラメータまでのモデルを確実にトレーニングする。
標準的なシングルA100マシンでは、Horizon-LMはCPUオフロードのDeepSpeed ZeRO-3よりも最大12.2$timesのトレーニングスループットを実現している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:04:46 GMT)
Optimization, Generalization and Differential Privacy Bounds for Gradient Descent on Kolmogorov-Arnold Networks [18.1] Kolmogorov--Arnold Networks (KAN) は、最近標準イテレーションの代替となる構造化された代替品として登場した。
本稿では,2層カンを訓練するための勾配勾配勾配(GD)を解析する。
差分プライバシー下でのトレーニングダイナミクス,一般化,実用性を特徴付ける一般境界を導出する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:03:18 GMT)
RA-QA: Towards Respiratory Audio-based Health Question Answering [17.9] 呼吸器疾患は世界的な死因の1つであり、早期かつアクセス可能なスクリーニング方法の緊急の必要性を強調している。
自然言語を使ったリアルタイムのコンサルティングで対話できるインテリジェントシステムの欠如は、依然として重要なギャップである。
第1回呼吸音響質問応答データセットを構築するため,11種類の呼吸オーディオデータセットから収集したデータをキュレートし,調和させた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:25:47 GMT)
Let Experts Feel Uncertainty: A Multi-Expert Label Distribution Approach to Probabilistic Time Series Forecasting [17.8] 実世界の応用における時系列予測には高い予測精度と解釈可能な不確実性定量化が必要である。
本稿では,これらの課題に対処する新しい多言語学習分散ラベル(LDL)フレームワークを提案する。
提案手法では,(1)異なる学習パラメータを持つ複数の専門家を用いて時間パターンを抽出するマルチエキスパートLDLと,(2)時系列を解釈可能なコンポーネントに明示的に分解するパターン認識LDL-MoEの2つの相補的手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:51:02 GMT)
Learning Context Matters: Measuring and Diagnosing Personalization Gaps in LLM-Based Instructional Design [17.6] 本稿では,学習コンテキストが指導戦略選択にどう影響するかを計測・診断するための枠組みを提案する。
以上の結果から,LCは系統的かつ測定可能な命令決定の変化を誘導するが,実質的なミスアライメントは残っていない。
この分析は、LCがLLMの指導計画を実質的に形作っているが、教育学的に適切なパーソナライズを確実に誘導していないことを実証している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:02:28 GMT)
GeoLanG: Geometry-Aware Language-Guided Grasping with Unified RGB-D Multimodal Learning [17.4] GeoLanGは言語誘導の把握のためのエンドツーエンドのマルチタスクフレームワークである。
視覚的および言語的な入力を共有表現空間に統一し、ロバストなセマンティックアライメントと一般化を改善する。
その結果,GeoLanGは複雑で散在した環境において,正確かつ堅牢な言語誘導の把握を可能にすることを示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:42:55 GMT)
Certifiable Boolean Reasoning Is Universal [17.3] ディープラーニングモデルは常に任意の$f:0,1Bto0,1$タスクを通じて推論可能であることを示す。
任意のブール$f:0,1Bto0,1$に対して、サンプリングされた回路が任意に高い確率で$f$を計算するパラメータ構成が存在する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:09:49 GMT)
Fine-grained Classification of A Million Life Trajectories from Wikipedia [17.3] 生活活動を分類するために、ウィキペディアから(テキスト、時間、場所)トリプルを抽出するツールを使用します。
我々は3世紀にわたって589,193人の個人に対して380万のラベル付き活動を行う、最も微細な生命軌道データセットを構築した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:52:26 GMT)
Feedback Control for Multi-Objective Graph Self-Supervision [17.2] グラフ自己教師型学習(SSL)は、プリテキスト目的のツールボックスの増大を提供する。
しかし、それらを確実に組み合わせることは、客観的な干渉とトレーニングの不安定さのために課題である。
我々は、グラフSSLをフィードバック制御の時間割当として再キャストするフレームワークであるControlGを紹介した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:42:10 GMT)
Rethinking Rubric Generation for Improving LLM Judge and Reward Modeling for Open-ended Tasks [17.1] 本稿では,分解フィルタサイクル上に構築された潤滑精製の原理的フレームワークRDを提案する。
RRDは粗いルブリックをきめ細かな識別基準に分解し、カバー範囲を広げ、応答間の分離を鋭くする。
評価とトレーニングの両方で、大きく、一貫した利益をもたらします。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:16:09 GMT)
Data Kernel Perspective Space Performance Guarantees for Synthetic Data from Transformer Models [17.1] トランスフォーマーモデルは、データ不足の問題を軽減するためにますます使われています。
モデルはブラックボックスであるため、合成データの特性を予測するのは難しい。
本稿では,DKPSの性能保証が下流タスクの性能を解明する方法について述べる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:41:39 GMT)
S-MUSt3R: Sliding Multi-view 3D Reconstruction [17.0] 本研究はS-MUSt3Rを提案する。S-MUSt3Rは単分子3次元再構成のための基礎モデルの限界を拡張するシンプルで効率的なパイプラインである。
我々は,S-MUSt3Rが長いRGBシーケンス上で正常に動作し,高精度で一貫した3D再構成を実現することを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:07:14 GMT)
Journey to the Centre of Cluster: Harnessing Interior Nodes for A/B Testing under Network Interference [17.0] クラスタレベルのランダム化が標準となり、ネットワーク対応推定器の使用が可能になった。
これらの推定器は、典型的には情報単位のサブセットのみを保持するようにデータをトリミングし、適切な条件下でバイアスを低くするが、しばしば高い分散に悩まされる。
本稿では,既存のネットワーク認識型推定器が必要とする微妙な再重み付けを回避するため,内部ノードを平均化して平均イン・イン・イン・イン・インター(MII)推定器を構築することを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:41:52 GMT)
Disentangling Causal Importance from Emergent Structure in Multi-Expert Orchestration [16.5] Informは、オーケストレーションを明示的で分析可能な計算として扱う、解釈可能性分析である。
我々は,GSM8K,HumanEval,MMLUのオーケストレータを10名の指導訓練専門家の同種コンソーシアムを用いて評価した。
本研究では,経路の質量と相互作用トポロジによって捉えた関係的重要性と,勾配に基づく因果属性を用いて測定した内在的重要性の相違を明らかにする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:41:32 GMT)
AM-FM: A Foundation Model for Ambient Intelligence Through WiFi [16.1] 環境知性は、スマート環境、健康モニタリング、人間とコンピュータの相互作用に不可欠である。
我々は、環境知能とWiFiによるセンシングのための最初の基礎モデルAM-FMを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:26:06 GMT)
Gradient Flow Through Diagram Expansions: Learning Regimes and Explicit Solutions [16.1] 本研究では,スケーリングレジームを解析し,勾配流問題に対する明示的な解析解を導出する一般的なフレームワークを開発する。
鍵となる革新は損失進化の形式的なパワー級数展開であり、係数はファインマン図形に似た図形でエンコードされる。
この拡張は、異なる学習フェーズを明らかにするために使用可能な、明確に定義された大規模な制限を持つことを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:38:57 GMT)
Active Asymmetric Multi-Agent Multimodal Learning under Uncertainty [15.9] 不確実性下でのアクティブ非対称マルチエージェントマルチモーダル学習(A2MAML)を提案する。
A2MAMLは、不確実性を認識し、モダリティレベルのコラボレーションのための原則化されたアプローチである。
共同事故検出のための接続された自律走行シナリオの実験は、A2MAMLがシングルエージェントとコラボレーティブベースラインの両方を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:01:31 GMT)
Nix and Fix: Targeting 1000x Compression of 3D Gaussian Splatting with Diffusion Models [15.9] NiFiは、3DGSを極端に圧縮する手法である。
以上の結果から,本手法は3DGSよりも0.1MB以下,1000倍の精度向上を実現し,その性能向上を図っている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:39:00 GMT)
GAMMS: Graph based Adversarial Multiagent Modeling Simulator [15.7] GAMMS(Graph based Adrial Multiagent Modeling Simulator)は軽量かつスケーラブルなシミュレーションフレームワークである。
GAMMSはスケーラビリティ、使いやすさ、統合ファーストアーキテクチャ、高速な視覚化フィードバック、現実世界の接地という5つの目標を強調している。
都市道路網や通信システムといった複雑な領域の効率的なシミュレーションを可能にする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:38:51 GMT)
Multi-Aspect Mining and Anomaly Detection for Heterogeneous Tensor Streams [15.6] ヘテロコンプ(HeteroComp)は、不均一なテンソルストリームを各属性の潜在群とその時間ダイナミクスを表す「成分」に要約する手法である。
提案手法はガウス過程を用いて連続属性の未知分布と時間力学をモデル化する。
実際のデータセットの実験では、HeteroCompはグループ異常検出精度の最先端アルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:32:57 GMT)
Multi-Integration of Labels across Categories for Component Identification (MILCCI) [15.6] 時系列分析における重要な課題は、ラベルが多段階観測でどのように符号化されているかを理解することである。
提案するMILCCIは,データの基盤となる解釈可能なコンポーネントを識別し,異種間変動をキャプチャし,ラベル情報を統合してデータ内の各カテゴリの表現を理解する,新しいデータ駆動方式である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:00:33 GMT)
Agent-Omit: Training Efficient LLM Agents for Adaptive Thought and Observation Omission via Agentic Reinforcement Learning [15.4] マルチターンエージェント環境相互作用におけるエージェント思考と観察の管理は、効率を改善するための新たな戦略である。
本稿では,LLMエージェントが冗長な思考や観察を適応的に省略することを可能にする統合トレーニングフレームワークであるAgent-Omitを提案する。
実験の結果, 構築したAgen-Omit-8Bは, 7つのLLMエージェントに匹敵する性能を得ることができた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:26:23 GMT)
Knowing When to Answer: Adaptive Confidence Refinement for Reliable Audio-Visual Question Answering [15.4] 我々は,textitReliable Audio-Visual Question Answering (mathcalR$-AVQA) に公式な問題を定式化する。
本稿では,$mathcalR$-AVQAの性能を高める軽量な手法であるAdaptive Confidence Refinement (ACR)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:35:33 GMT)
Quantile Transfer for Reliable Operating Point Selection in Visual Place Recognition [15.3] 閾値は通常、特定の環境のために手動でオフラインで調整され、デプロイメント中に固定される。
本稿では,ユーザ定義の精度要件に基づき,VPRシステムの動作点を自動的に選択してリコールを最大化する手法を提案する。
複数の最先端のVPR技術とデータセットによる実験では、提案手法が一貫して最先端のVPRよりも優れていることが示されている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:31:29 GMT)
MIRROR: A Multi-Agent Framework with Iterative Adaptive Revision and Hierarchical Retrieval for Optimization Modeling in Operations Research [15.3] MIRRORは、操作研究のための微調整のないエンドツーエンドのマルチエージェントフレームワークである。
自然言語の最適化問題を数学的モデルや解法コードに変換する。
実験により、MIRRORは標準的なOperations Researchベンチマークの既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:04:51 GMT)
LASS-ODE: Scaling ODE Computations to Connect Foundation Models with Dynamical Physical Systems [15.2] ODE の一貫性を強制することは、高価な非線形統合を必要としないことを示す。
トークン単位の局所線型ODE表現は、基礎モデル体制へのスケーリング中に物理的忠実性を保存する。
我々は、共通構造ハブによる注意を増大させる、シンプルだが効果的なシステム間注目を導入する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:20:11 GMT)
WideSeek-R1: Exploring Width Scaling for Broad Information Seeking via Multi-Agent Reinforcement Learning [15.1] 既存のマルチエージェントシステムは、作業の並列化に失敗した手作りとターンテイクのインタラクションに依存していることが多い。
拡張性のあるオーケストレーションと並列実行を相乗化するために,マルチエージェント強化学習(MARL)を用いてトレーニングされたリードエージェントサブエージェントフレームワークであるWideSeek-R1を提案する。
WideSeek-R1-4Bは、シングルエージェントのDeepSeek-R1-671Bのパフォーマンスに匹敵する、WideSearchベンチマークで40.0%のアイテムF1スコアを達成している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:05:12 GMT)
Aortic Valve Disease Detection from PPG via Physiology-Informed Self-Supervised Learning [14.8] 光胸腺造影は大動脈弁疾患のスクリーニング法として期待されている。
金標準ラベル付きPSGデータの極端な不足は、データ駆動アプローチの有効性を厳しく制限する。
我々は,大規模無ラベルPSGデータの価値を解放することを目的とした,新たなパラダイムであるPhysological-Guided Self-Supervised Learning (PG-SSL)を提案し,検証する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:56:50 GMT)
VeriInteresting: An Empirical Study of Model Prompt Interactions in Verilog Code Generation [14.8] この研究は、モデル推論、特殊化、迅速なエンジニアリング戦略間の相互作用に焦点を当てている。
我々は、汎用性、推論、ドメイン固有の変種を含む、多種多様な小型および大型のLMを評価した。
2つのVerilogベンチマークで、モデルクラスが構造化プロンプトと最適化にどう反応するかのパターンを識別する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:52:30 GMT)
Beyond Tokens: Semantic-Aware Speculative Decoding for Efficient Inference by Probing Internal States [14.8] 大規模言語モデル(LLM)は多くのタスクで高いパフォーマンスを達成するが、自動回帰復号化による高い推論遅延に悩まされる。
トークンの代わりにセマンティックシークエンス全体を検証するセマンティックス(SemanticSpec)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:52:27 GMT)
Annotation Free Spacecraft Detection and Segmentation using Vision Language Models [14.8] 視覚言語モデル(VLM)は、オープンワールドのゼロショット視覚認識において顕著な性能を示した。
本稿では,VLMを用いた空間目標に対するアノテーションのない検出・セグメンテーションパイプラインを提案する。
我々のアプローチは、事前訓練されたVLMを用いて、ラベルのない実データの小さなサブセットに対して擬似ラベルを自動的に生成することから始まる。
擬似ラベルに固有のノイズにもかかわらず、蒸留プロセスは直接ゼロショットVLM推論よりもかなりの性能向上をもたらす。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:07:29 GMT)
ActMem: Bridging the Gap Between Memory Retrieval and Reasoning in LLM Agents [14.7] 本稿では,ActMemと呼ばれる新しい動作可能なメモリフレームワークを提案する。
ActMemは非構造化対話履歴を構造化因果グラフと意味グラフに変換する。
エージェントは暗黙の制約を推論し、過去の状態と現在の意図の間の潜在的な衝突を解決することができる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:54:53 GMT)
RIGA-Fold: A General Framework for Protein Inverse Folding via Recurrent Interaction and Geometric Awareness [14.4] RIGA-Foldは、リカレントインタラクションと幾何学的認識を相乗化するフレームワークである。
構造的モダリティとシーケンス的モダリティのギャップを埋めるために、強化された変種RIGA-Fold*を導入する。
我々のフレームワークは、シーケンス回復と構造的整合性の両方において、最先端のベースラインを著しく上回る。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:07:13 GMT)
TurboBoA: Faster and Exact Attention-aware Quantization without Backpropagation [14.2] 本稿では,BoAの精度を保ちながら処理を著しく高速化する,バックプロパゲーションフリーのPTQアルゴリズムであるTurboBoAを提案する。
i)シーケンシャルボトルネックを低減し、3倍以上のスピードアップをもたらすクローズドフォームのエラー補償規則と、(ii)先行する量子化層から伝播するエラーの補正機構、(iii)座標偏差補正による適応グリッド計算により、繰り返し更新時のアライメントを維持する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:38:50 GMT)
Score-Based Change-Point Detection and Region Localization for Spatio-Temporal Point Processes [14.1] 本研究では,連続時空間における変化時間と変化領域を共同で推定する,可能性のないスコアベース検出フレームワークを提案する。
手順はどちらも停止時間と推定変更領域を出力し、空間的解釈性のあるリアルタイム検出を可能にする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:44:41 GMT)
Multi-scale hypergraph meets LLMs: Aligning large language models for time series analysis [14.0] 本稿では,MSH-LLMを提案する。MSH-LLMは,時系列解析のために大規模言語モデルを調整するマルチスケールハイパーグラフ手法である。
具体的には、時系列意味空間のマルチスケール意味情報を強化するために、ハイパーエージング機構が設計されている。
時系列のマルチスケール時間パターンを理解するために、文脈情報を提供し、LLMの能力を高めるために、一連のプロンプト(MoP)機構を導入している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:47:00 GMT)
LILaC: Late Interacting in Layered Component Graph for Open-domain Multimodal Multihop Retrieval [13.9] LILaCは2つのコアイノベーションを特徴とするマルチモーダル検索フレームワークである。
まず,2つのレイヤにおけるマルチモーダル情報を明示的に表現した階層化コンポーネントグラフを提案する。
次に,遅延相互作用に基づくサブグラフ検索手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:55:48 GMT)
Legendre Memory Unit with A Multi-Slice Compensation Model for Short-Term Wind Speed Forecasting Based on Wind Farm Cluster Data [13.8] 本稿では,時空間相関を用いたクラスタデータの完全活用により,高精度,高速,堅牢な風速予測を実現することに焦点を当てた。
革新的なアンサンブルモデルWMF-CPK-MSLMUが提案され、データ前処理、予測、マルチスライス補償の3つの重要なブロックがある。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:28:42 GMT)
RECITYGEN -- Interactive and Generative Participatory Urban Design Tool with Latent Diffusion and Segment Anything [13.8] 本稿では,テキストプロンプトを用いて都市環境の街路ビュー画像をインタラクティブに作成できる新しいツールであるRECITYGENを提案する。
北京のパイロットプロジェクトでは、ユーザがRECITYGENを使用して、進行中の都市再生プロジェクトの改善を提案する。
いくつかの制限にもかかわらず、RECITYGENは、よりダイナミックで包括的な都市計画方法への移行を示す公共の嗜好と整合する大きな可能性を示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:09:04 GMT)
HugRAG: Hierarchical Causal Knowledge Graph Design for RAG [13.7] HugRAGは、グラフベースのRAGの知識組織を再考するフレームワークである。
我々の研究は、構造化され、スケーラブルで、因果的に基礎付けられたRAGシステムのための原則化された基盤を確立する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:59:02 GMT)
OCRVerse: Towards Holistic OCR in End-to-End Vision-Language Models [13.4] OCRVerseは、テキスト中心のOCRと視覚中心のOCRを統一する、エンドツーエンドで最初の総合的なOCR手法である。
我々は、広範囲のテキスト中心のドキュメントと、チャート、Webページ、科学的なプロットを含む視覚中心のレンダリングコンポジットをカバーするために、包括的データエンジニアリングを構築します。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:53:33 GMT)
Temporal Pair Consistency for Variance-Reduced Flow Matching [13.3] TPC(Temporal Pair Consistency)は、同じ確率経路に沿ってペア化された時間ステップで速度予測を結合する軽量な分散還元原理である。
フローマッチング内で確立されたTPCは、複数の解像度でCIFAR-10とImageNetのサンプル品質と効率を改善する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:05:21 GMT)
Attack Selection Reduces Safety in Concentrated AI Control Settings against Trusted Monitoring [13.3] 我々は、AIがモニターを逆選択することで、モニターを逆転させる能力について研究する。
攻撃選択を2つの問題に分解する: 攻撃を品質スコアにマッピングし、品質スコアを確率にマッピングする。
攻撃モデルが攻撃選択に慎重でありながら、監視を判断するよう促すことで、監査予算0.5%において、ベースラインの99%から59%の安全性が低下することがわかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:42:07 GMT)
Deconstructing sentence disambiguation by joint latent modeling of reading paradigms: LLM surprisal is not enough [13.2] 本研究では,4つの読解パラダイムにまたがる人間の読解行動の潜在過程混合モデルを提案する。
このモデルは、庭園パス確率、庭園パスコスト、再分析コストを区別する。
本モデルでは, 読解行動, 質問応答, 文法的判断に関して, 経験的パターンを再現可能であることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:27:49 GMT)
Generative Neural Operators through Diffusion Last Layer [13.1] 予測の不確実性をモデル化するために、任意の神経オペレーターのバックボーンにアタッチできる軽量な確率的ヘッドを導入する。
PDE溶液分布によってしばしば現れる相対的滑らかさと低次元構造に動機づけられた条件出力分布を関数空間で直接パラメータ化する。
PDE演算子学習ベンチマーク、予測の改善、不確実性認識。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:10:53 GMT)
Imposing Boundary Conditions on Neural Operators via Learned Function Extensions [13.0] 本稿では,機能拡張による複雑な非均一なBC上でのニューラル演算子の条件付けフレームワークを提案する。
我々は、Poisson、線形弾性、超弾性問題にまたがる18の挑戦的データセットをベンチマークした。
この結果から,既存のニューラルネットワークフレームワークにおいて,境界-領域間拡張を学習することは複雑なBCGを注入するための効果的かつ実践的な戦略であることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:28:43 GMT)
DELTA: Deliberative Multi-Agent Reasoning with Reinforcement Learning for Multimodal Psychological Counseling [13.0] マルチモーダル信号を用いた構造化推論プロセスとしてカウンセリングをモデル化するマルチエージェントフレームワークであるDELTAを紹介する。
DELTAは、モデル間のカウンセリング品質と感情の両方を改善する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:56:05 GMT)
From Ambiguity to Action: A POMDP Perspective on Partial Multi-Label Ambiguity and Its Horizon-One Resolution [13.0] 重要な課題は、曖昧な候補ラベルが、機能エンジニアリングのような下流タスクにエラーを伝達できることだ。
我々は,PMLリスク最小化を期待回帰段階1に変換するために,部分観測可能なマルコフ決定プロセス(POMDP)として,曖昧さと特徴選択タスクを共同でモデル化する。
本稿では、PML-POMDP対応の理論解析と、誤りを擬似ラベル品質項とサンプルサイズに分解する過剰リスク境界について述べる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:36:44 GMT)
OmniRAG-Agent: Agentic Omnimodal Reasoning for Low-Resource Long Audio-Video Question Answering [13.0] OmniRAG-Agent(英語版)は、予算付きロングオーディオビデオ推論のためのエージェント・オムニモーダルQA法である。
OmniLLMは、外部の銀行から短い、関連するフレームとオーディオスニペットを取り出すことができる。
エージェントループを使用して、ターンにまたがってツールを呼び出し、検索したエビデンスをマージして複雑なクエリに応答する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:33:14 GMT)
From Consistency to Complementarity: Aligned and Disentangled Multi-modal Learning for Time Series Understanding and Reasoning [12.9] マルチモーダル大規模言語モデル(MLLM)であるMADIを提案する。
合成および実世界のベンチマーク実験により、MADIは汎用LLMと時系列特化MLLMを一貫して上回っていることが示された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:39:31 GMT)
DeFrame: Debiasing Large Language Models Against Framing Effects [12.8] 大規模言語モデル(LLM)は、現実のアプリケーションにますますデプロイされ、人口統計学的に公正な応答が重要になっていることを保証します。
LLMは標準的な評価では公平に見えるが、評価設定の外でバイアスのある応答を生成することができる。
セマンティックに等価なプロンプトの表現方法の違いであるフレーミングを、このギャップの未発見のコントリビュータとして認識しています。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:15:51 GMT)
SemPipes -- Optimizable Semantic Data Operators for Tabular Machine Learning Pipelines [12.8] 本稿では,セマンティックデータ演算子をMLパイプラインに統合する新しい宣言型プログラミングモデルであるSemPipesを紹介する。
SemPipesはデータ特性、演算子命令、パイプラインコンテキストに基づいて、カスタム演算子実装を合成する。
セマンティック演算子は、専門家が設計したパイプラインとエージェント生成パイプラインの両方において、エンドツーエンドの予測性能を大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:36:29 GMT)
From Evaluation to Design: Using Potential Energy Surface Smoothness Metrics to Guide Machine Learning Interatomic Potential Architectures [12.7] MLIPは量子ポテンシャルエネルギー表面の物理的滑らかさを再現することができない。
マイクロカノニカル分子動力学のような既存の評価は計算に高価であり、主に近平衡状態を研究する。
MLIPの評価基準を改善するためにBSCT(Band Smoothness Characterization Test)を導入する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:50:10 GMT)
Rate-Optimal Noise Annealing in Semi-Dual Neural Optimal Transport: Tangential Identifiability, Off-Manifold Ambiguity, and Guaranteed Recovery [12.5] 半二重の神経的最適輸送は、極小の目的によって輸送マップを学習するが、トレーニングは不正または退化マップに収束することができる。
補聴器としての添加音の平滑化について検討し,ノイズが消えるにつれて新たな地図復元の保証を証明した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:49:38 GMT)
KVSmooth: Mitigating Hallucination in Multi-modal Large Language Models through Key-Value Smoothing [12.5] KVSmoothは、隠れた状態に対して注意エントロピー誘導適応平滑化を行うことで幻覚を緩和する、トレーニングフリーでプラグアンドプレイの手法である。
実験では、KVSmoothは全体的な性能を改善しながら幻覚を著しく減少させる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:59:17 GMT)
WAXAL: A Large-Scale Multilingual African Language Speech Corpus [12.4] WAXALは1億人以上の話者を表す21言語のための大規模でオープンにアクセスできる音声データセットである。
このコレクションは、約1,250時間の書き起こしを含む自動音声認識(ASR)データセットと、さまざまな話者からの自然な音声を含むテキスト音声合成(TTS)データセットの2つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:41:41 GMT)
Bypassing AI Control Protocols via Agent-as-a-Proxy Attacks [12.4] 現在の防御は、エージェントのChain-of-Thought(CoT)とツール使用アクションを共同で評価し、ユーザの意図との整合性を保証する監視プロトコルに依存している。
これらの監視ベースの防御は、新しいエージェント・アズ・ア・プロキシ・ア・プロキシ・アタックによってバイパス可能であることを実証する。
以上の結果から,現在の監視型エージェント防御は,モデルスケールによらず根本的に脆弱であることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:38:38 GMT)
Personalized Image Generation via Human-in-the-loop Bayesian Optimization [12.2] 言語が限界に達した後も、新しい画像が$xast$よりも$xp*$に近いタイミングで認識できることが示されています。
我々は,新しい画像を生成するMultiBOを$xp*$の関数として開発し,ユーザから優先的なフィードバックを得る。
ユーザからのフィードバックのラウンドで、生成モデルは$xast$に関する情報を持っていないにも関わらず、$xast$にずっと近づくことが可能であることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:30:51 GMT)
A Unified Complementarity-based Approach for Rigid-Body Manipulation and Motion Prediction [12.2] 本稿では,単一形式(Unicomp)における自由運動と摩擦接触を連続的に捉えるロボット操作の数学的モデルを提案する。
実験結果から,提案手法は,接触に富む全身操作の操作から,タスク間の対話的な動作において,物理的に一貫した動作を可能にすることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:10:57 GMT)
Rethinking Perplexity: Revealing the Impact of Input Length on Perplexity Evaluation in LLMs [12.2] 本稿では,入力長,評価プロトコル設計,システムレベルのコストを統合するシステム意識評価フレームワークであるLengthBenchmarkを紹介する。
精度指向のメトリクスのみに焦点を当てた以前の作業とは異なり、LengthBenchmarkはレイテンシ、メモリフットプリント、評価コストを計測する。
その結果, (i)スライディングウィンドウ評価は短い入力で連続的に性能を低下させ, (ii) 完全精度モデルと量子化モデルの両方が, 評価セグメント長が大きくなるにつれて利得を実現することがわかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:34:27 GMT)
MINT: Minimal Information Neuro-Symbolic Tree for Objective-Driven Knowledge-Gap Reasoning and Active Elicitation [12.1] 言語に基づくインタラクションによる共同計画は、人間とAIのコラボレーションの重要な領域である。
我々は、AIエージェントがオブジェクト駆動計画において、人間の入力を積極的に引き出すための最適なインタラクション戦略を見つけることの問題を考察する。
我々は、知識ギャップの影響を推論し、MINTとの自己プレイを活用し、AIエージェントのエリケーション戦略とクエリを最適化するために、最小情報ニューロシンボリックツリー(MINT)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:58:53 GMT)
Enabling Real-Time Colonoscopic Polyp Segmentation on Commodity CPUs via Ultra-Lightweight Architecture [12.0] 我々は超圧縮方式(0.3Mパラメータ)で機能するUltraSegファミリーを提示する。
モデルは、精度を犠牲にすることなく、単一のCPUコア上で90FPSを達成する。
この研究は、大腸内視鏡のためのCPUネイティブなソリューションを提供するだけでなく、より広範に侵襲的な外科的視覚応用のための再現可能な青写真も提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:04:30 GMT)
LLM-Assisted Replication for Quantitative Social Science [11.9] 大規模言語モデル(LLM)は、執筆、コーディング、レビューの合理化によって科学的生産を加速している。
本稿では,社会科学論文の統計分析を再現し,潜在的な問題にフラグを立てるLLMシステムを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:17:49 GMT)
Continuous Degradation Modeling via Latent Flow Matching for Real-World Super-Resolution [11.8] 本稿では,フローマッチングによる遅延劣化空間を活用することにより,単一のHR画像から真正LR画像を合成できる新しいフレームワークを提案する。
提案手法では,現実的なアーチファクトを目に見えない劣化レベルで生成し,大規模で現実的なSRトレーニングデータセットの作成を容易にする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:16:38 GMT)
LATMiX: Learnable Affine Transformations for Microscaling Quantization of LLMs [11.8] 可逆変換をアクティベーションに適用することで、量子化を大幅に改善することができる。
現代のハードウェアは、マイクロスケーリング(MX)データフォーマットをますますサポートしている。
学習可能な非可逆アフィン変換への外乱還元を一般化する手法である LATMiX を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:32:27 GMT)
AppleVLM: End-to-end Autonomous Driving with Advanced Perception and Planning-Enhanced Vision-Language Models [11.7] 我々は、堅牢なエンドツーエンド運転のための先進的な認識と計画強化VLMモデルであるAppleVLMを提案する。
AppleVLMは、新しいビジョンエンコーダと計画戦略エンコーダを導入し、認識と意思決定を改善する。
我々は,CARLAベンチマークのクローズドループ実験において,AppleVLMを評価し,最先端の駆動性能を実現する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:37:14 GMT)
Does SGD Seek Flatness or Sharpness? An Exactly Solvable Model [11.7] 我々は,訓練中の平ら化と研削動作の両方を示す解析的解決可能なモデルを同定し,解決する。
このモデルでは、SGDトレーニングは平坦さを優先しないが、最小限のゆらぎのみを優先する。
我々は、異なるモデルアーキテクチャで制御された設定におけるこの重要な洞察を再現する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:36:31 GMT)
ZKBoost: Zero-Knowledge Verifiable Training for XGBoost [11.7] ZKBoostは,XGBoostのZKPoTプロトコルの最初のゼロ知識証明である。
我々の固定点実装は、標準のXGBoost精度を1%以内で一致させ、実際のデータセット上で実用的なzkPoTを実現する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:56:28 GMT)
Beyond Rejection Sampling: Trajectory Fusion for Scaling Mathematical Reasoning [11.6] 構造化された監視構築プロセスとしてリジェクションサンプリングを再構成する微調整戦略であるTrajFusionを提案する。
具体的には、TrajFusionは、試行錯誤推論を明示的にモデル化する融合軌道を形成する。
複数のベンチマークによる大規模な実験は、TrajFusionがRFTを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:20:56 GMT)
Learning Decentralized LLM Collaboration with Multi-Agent Actor Critic [11.4] 分散LLMコラボレーションは、実際により魅力的です。
これらの問題に対処するため、MARLではアクタークリティカルな手法が一般的である。
我々は2つのMAACアプローチ,textbfCoLLM-CC with a textbfCritics, textbfCoLLM-DC with textbfDecentralized textbfCriticsを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:30:21 GMT)
Guided Verifier: Collaborative Multimodal Reasoning via Dynamic Process Supervision [11.2] マルチモーダル大規模言語モデル(MLLM)の複雑な推論能力を高めるための重要なメカニズムとして強化学習(RL)が登場した。
本稿では,これらの構造的制約に対処する textbfGuided Verifier フレームワークを提案する。
我々は,マルチモーダル幻覚をターゲットとした特殊なデータ合成パイプラインを開発し,プロセスレベルの負の textbfCoRe データセットとtextbfCorrect-guide textbfReasoning トラジェクトリを構築し,ガイド付き検証器を訓練する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:38:42 GMT)
Mixture of Masters: Sparse Chess Language Models with Player Routing [11.1] 我々は,世界クラスのグランドマスターを模擬した小型GPT専門家による最初のチェスのミキシングモデルであるMoMを紹介する。
MoMは、チェス固有の報酬によって導かれる自己教師付き学習と強化学習の組み合わせで訓練される。
目に見えない標準的なゲームでStockfishに対して評価すると、MoMは、密集した個々の専門家ネットワークと一般的なGPTベースラインの両方を上回ります。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:18:43 GMT)
Zenith: Scaling up Ranking Models for Billion-scale Livestreaming Recommendation [11.1] 我々は、最小限のオーバーヘッドランタイムで複雑な機能インタラクションを学習するスケーラブルで効率的なランキングアーキテクチャであるZenithを紹介します。
我々のA/Bテストは、ZenithがオンラインCTR AUCとLoglossで+1.05%/-1.10%を獲得し、Quality Watch Session/Userで+9.93%のアップを実現していることを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:45:34 GMT)
ProxyWar: Dynamic Assessment of LLM Code Generation in Game Arenas [11.1] 本稿では,コード生成品質を体系的に評価する新しいフレームワークであるProxyWarを紹介する。
既存のアプローチとは異なり、ProxyWarは関数的正確性だけでなく、生成されたプログラムの動作特性も評価している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:57:06 GMT)
A Unified Candidate Set with Scene-Adaptive Refinement via Diffusion for End-to-End Autonomous Driving [11.1] 固定軌跡語彙は、定期運転において安定したカバレッジを提供するが、しばしば複雑な相互作用において最適解を見逃す。
そこで我々は,CdDriveを提案する。このCdDriveは,元の語彙候補を保存し,語彙条件付き拡散復調によって生成されたシーン適応型候補を付加する。
どちらの候補も共有選択モジュールによって共同でスコア付けされ、ルーチンと高度にインタラクティブなシナリオで信頼性の高いパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:42:46 GMT)
Beyond Rewards in Reinforcement Learning for Cyber Defence [11.1] 報酬関数構造が学習および政策行動特性に及ぼす影響を評価する。
我々は、多種多様なスパースと密集した報酬関数、2つの確立されたサイバージム、ネットワークサイズ、およびポリシー勾配と値に基づくRLアルゴリズムを使用する。
以上の結果から,目標に整合して頻繁に遭遇する場合の疎度な報酬は,トレーニングの信頼性の向上とリスクの低いより効果的なサイバー防御エージェントの両面に特有であることがわかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:55:23 GMT)
Restoring Landauer's Principle for Unitarily Transformed Thermal Reservoirs [11.0] ランダウアーの原理は、熱貯水池を圧縮熱状態(STS)に置き換えたときに破られるように見える
このような一元化熱状態に対する原理の形式的拡張を導入する。
また、非平衡および相対論的な設定で量子熱力学を解析するための堅牢なツールも提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:43:08 GMT)
From Competition to Collaboration: Designing Sustainable Mechanisms Between LLMs and Online Forums [11.0] 我々は,GenAIシステムが質問をフォーラムに提案し,そのいくつかを公開できるシーケンシャルな相互作用の枠組みを提案する。
当社の枠組みは、非通貨交換、非対称情報、インセンティブの不一致など、このような協力の難しさを捉えている。
この結果から,AIシステムと人的知識プラットフォーム間の効果的な知識共有を支援する,持続可能なコラボレーションの可能性を強調した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:58:39 GMT)
Temporal Slowness in Central Vision Drives Semantic Object Learning [10.9] 人間は最小限の監督力で自我中心の視覚ストリームから意味オブジェクト表現を取得する。
本研究では,人間の視覚体験から意味的対象表現を形成する上で,中心視とスローネス学習が果たす役割について検討した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:47:58 GMT)
Boosting CVaR Policy Optimization with Quantile Gradients [10.9] 政策勾配(CVaR-PG)を用いた条件付き値付きリスク(CVaR)の改善
量子最適化は、全てのサンプルデータを活用する動的プログラミングの定式化を認め、それによってサンプル効率が向上する。
リスク逆挙動が検証可能な領域における実証結果から,マルコフ政策クラス内のアルゴリズムはCVaR-PGにより大幅に改善されることが示された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:55:23 GMT)
Color Matters: Demosaicing-Guided Color Correlation Training for Generalizable AI-Generated Image Detection [10.8] 本稿では,AI生成画像検出のためのデモサイジング誘導色相関トレーニングフレームワークを提案する。
自己教師付きU-Netは、与えられたチャネルから欠落したチャネルの条件分布をモデル化するように訓練される。
理論的解析の結果,DCCTは画像とAI生成画像間の色相関特性の分布特性の証明可能な差異を目標としていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:04:42 GMT)
RASA: Routing-Aware Safety Alignment for Mixture-of-Experts Models [10.7] ルーティング対応の専門家レベルのアライメントフレームワークであるRASAを提案する。
RASAは、ジェイルブレイクの成功によって不当にアクティベートされた専門家を特定し、固定されたルーティングの下でこれらの専門家だけを選択的に微調整する。
この結果から,グローバルなパラメータ更新よりも,目標とする専門家の修復により,ロバストなMoEの安全性が向上することが示唆された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:19:15 GMT)
AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders [10.7] 私たちは、WhisperとHuBERTのすべてのエンコーダ層にわたってSAEをトレーニングします。
50%以上の機能は無作為な種間で一貫しており、復元品質は維持されている。
SAEの特徴は, 音声知覚における脳波活動と相関し, 人間の神経処理との整合性を示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:29:16 GMT)
Addressing Corpus Knowledge Poisoning Attacks on RAG Using Sparse Attention [10.7] Sparse Document Attention RAG (SDAG) の新たな防衛手法について紹介する。
SDAGは、取得したドキュメント間の相互アテンションを許可するブロックスパースアテンションメカニズムである。
我々は,SDAG法が攻撃成功率において標準的な因果注意機構を大幅に上回ることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:22:20 GMT)
VILLAIN at AVerImaTeC: Verifying Image-Text Claims via Multi-Agent Collaboration [10.7] VILLAINは画像テキストのクレームを検証するマルチモーダルなファクトチェックシステムである。
私たちのシステムは、すべての評価指標でトップボードにランクインしました。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:12:55 GMT)
Scaling DPPs for RAG: Density Meets Diversity [10.6] Retrieval-Augmented Generation (RAG) は、外部知識を基盤として、Large Language Models (LLM) を強化する。
標準的なRAGパイプラインは、関連ランキングを使用してコンテキストを構築し、ユーザクエリと各コーパスチャンク間のポイントワイズスコアを実行する。
本稿では,DPP(Determinantal Point Processes)を軽量P-Adapterを通じて組み込んだRAGの多様性を考慮した検索機構であるScalDPPを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:37:07 GMT)
Empirical-MCTS: Continuous Agent Evolution via Dual-Experience Monte Carlo Tree Search [10.5] Empirical-MCTSは、ステートレス検索を連続的な非パラメトリック学習プロセスに変換するデュアルループフレームワークである。
Inpirical-MCTS はモンテカルロ木探索法とスタンドアロンの体験駆動型エージェントのどちらよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:14:55 GMT)
ROSA-Tuning: Enhancing Long-Context Modeling via Suffix Matching [10.5] 長いコンテキスト能力と計算効率は、今日の大きな言語モデルが直面している中心的な課題の一つである。
本稿では,事前学習モデルの長文モデリング能力を高めるための検索・リコール機構であるROSA-Tuningを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:02:38 GMT)
Conditional Flow Matching for Visually-Guided Acoustic Highlighting [10.2] 視覚的に誘導された音響ハイライトは、付随するビデオとオーディオのバランスを調整し、一貫性のあるオーディオ視覚体験を作り出す。
既存のアプローチでは、オーディオリミックスの本来の曖昧さに苦しむ差別モデルを使用している。
この制限に対処するために、条件付きフローマッチング(CFM)フレームワークを導入します。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:53:22 GMT)
InterPReT: Interactive Policy Restructuring and Training Enable Effective Imitation Learning from Laypersons [10.2] ユーザからの指示でポリシー構造を継続的に更新するInterPReT(Interactive Policy Restructuring and Training)を提案する。
これにより、エンドユーザーは対話的に指示やデモンストレーションを行い、エージェントのパフォーマンスを監視し、エージェントの意思決定戦略をレビューすることができる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:55:10 GMT)
Windowed SummaryMixing: An Efficient Fine-Tuning of Self-Supervised Learning Models for Low-resource Speech Recognition [10.2] Windowed SummaryMixing (WSM)を導入し、SlideMixing (SM)を強化した。
WSMは、グローバルな要約と共にローカルな近隣の要約を統合し、時間的依存関係を改善しながら効率を維持します。
提案手法は,SSLモデルのピークVRAM使用率を40%削減しつつ,ASR性能を向上する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:01:30 GMT)
Bures-Wasserstein Importance-Weighted Evidence Lower Bound: Exposition and Applications [10.2] 変分推論の有効な目的として,IW-ELBO(IW-ELBO)の重要性が浮かび上がっている(VI)
本稿では、ブレス=ヴァッサーシュタイン空間におけるIW-ELBOの最適化を定式化する。
解析の重要な寄与は勾配推定器の安定性に関するものである。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:01:56 GMT)
Optimal conversion from Rényi Differential Privacy to $f$-Differential Privacy [10.1] レーニ微分プライバシー (RDP) プロファイル $mapsto ()$ を有効な仮説テストトレードオフ $f$ にマッピングするすべての変換規則の中で、 [Zhu et al. (2022) で述べられている予想を証明します。
この最適性は、すべての有効なプロファイルとすべてのType Iエラーレベルに対して$$を同時に保持する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:49:51 GMT)
They Call Her 'Miss' and Him 'Professor': Lived Experiences of Women Teaching Support Staff in IT/SE Education [10.1] 女性教職支援スタッフ(TSS)はしばしば認識されず、過小評価される。
我々は,IT/SE高等教育における15人の女性TSSの生活経験を生かした。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:52:26 GMT)
Exceptional Behaviors: How Frequently Are They Tested? [10.0] テストスイートの計器バージョンを実行し、実行を監視し、実行時に発生した例外に関する情報を収集します。
我々は、25のPythonシステムのテストスイートを分析し、5,372のメソッド、17.9Mの呼び出し、1.4Mの上昇した例外をカバーした。
例外を発生させる手法の80%近くは、頻繁に発生するが、20%ほどは例外を発生させる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:15:18 GMT)
ImpRIF: Stronger Implicit Reasoning Leads to Better Complex Instruction Following [9.8] ImpRIFは、暗黙の推論命令に対するLLMの理解を高める方法である。
グラフ推論を用いた微調整を提案し、グラフに沿って推論するモデルを明示的に訓練するために強化学習を適用した。
その結果,暗黙的推論能力の強化は,その後の複雑な指示を著しく改善できることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:50:11 GMT)
Focus-LIME: Surgical Interpretation of Long-Context Large Language Models via Proxy-Based Neighborhood Selection [9.8] Focus-LIMEは、外科的解釈のトラクタビリティを回復するために設計された粗大なフレームワークである。
本手法は外科的説明を実践可能とし,ユーザに忠実な説明を提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:34:30 GMT)
Benchmarking Uncertainty Quantification of Plug-and-Play Diffusion Priors for Inverse Problems Solving [9.7] プラグ・アンド・プレイ拡散先行(DP)は科学・工学分野における逆問題解決の強力なパラダイムとなっている。
しかし、現在の評価では、単一サンプル上でのポイント推定精度の指標を強調している。
逆問題では、所望の分布は典型的には再構成よりも後続分布であるが、既存のベンチマークは単一の再構成出力のみを評価する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:02:32 GMT)
Robust automatic brain vessel segmentation in 3D CTA scans using dynamic 4D-CTA data [9.7] 動的4D-CTA頭部スキャンを用いた脳血管造影法を開発した。
我々は、動的4D-CTAコレクションから複数のフェーズに同じセグメンテーションを用いて、地上の真理アノテーションに基づいてディープラーニングモデルを訓練する。
対象は,25例の訓練画像110例,14例の検査画像165例であった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:22:34 GMT)
Food Portion Estimation: From Pixels to Calories [9.7] 画像に基づく食事評価では、2次元画像入力から食品の3次元サイズを推定する。
深層学習はまた、画像の単眼画像または補助入力の組み合わせを使用することでギャップを埋め、画像入力からの出力部分を正確に予測する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:53:21 GMT)
Millimeter-scale rigid diamond probe for high sensitivity endoscopic-magnetometry applications [9.5] 光学設計を最適化し,感度を向上したミリスケール硬質ダイヤモンド磁気センサプローブを提案する。
フラスタットダイヤモンドと小型複合パラボリック集光器 (CPC) レンズを結合することにより, 蛍光集光効率を直径4mm以内で37%向上する。
この確認された構造により、将来、外科的および工業的応用のために、mmサイズのプローブとピコテスラ感度を持つ内視鏡を投影することができる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:01:48 GMT)
Anytime-Valid Conformal Risk Control [9.5] 共形予測とリスク制御は、統計的に有効なエラー制御を計算的に効率的に示す予測セットを生成することができる。
任意の時点において累積的に増大するキャリブレーションデータセットに対して高い確率で有効となるように制御を拡張した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:39:36 GMT)
Integrating Fine-Grained Audio-Visual Evidence for Robust Multimodal Emotion Reasoning [9.5] 本稿では,ロバストなマルチモーダル推論のためのフレームワークであるSABER-LLMを紹介する。
まず,600Kビデオクリップからなる大規模感情推論データセットであるSABERを構築した。
第2に,エビデンス抽出と推論を「知覚的推論」に分離する構造的エビデンス分解パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:48:10 GMT)
Universality of General Spiked Tensor Models [9.5] 高次元状態におけるランクワンスパイクテンソルモデルについて検討する。
本研究では,その高次元スペクトル挙動と統計的限界が非ガウス雑音に対して頑健であることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:59:30 GMT)
Mosaic Learning: A Framework for Decentralized Learning with Model Fragmentation [9.4] 分散学習(DL)は、中央サーバーなしで協調機械学習(ML)を可能にする。
私たちは、モデルを断片に分解し、それらをネットワーク全体で独立に分散するDLフレームワークであるMosaic Learningを紹介します。
我々は,4つの学習課題におけるモザイク学習を実証的に評価し,最大12ポイントのノードレベルのテスト精度を疫学学習と比較した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:22:05 GMT)
VideoBrain: Learning Adaptive Frame Sampling for Long Video Understanding [9.4] VideoBrainは、Vision-Language Modelsが学習したサンプリングポリシーを通じて視覚情報を適応的に取得することを可能にするエンドツーエンドフレームワークである。
提案手法は,ビデオ間の意味検索を行うCLIPエージェントと,時間間隔内での高密度サンプリングを行うUniformエージェントの2つの補完エージェントを特徴とする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:08:35 GMT)
MTS-JEPA: Multi-Resolution Joint-Embedding Predictive Architecture for Time-Series Anomaly Prediction [9.4] MTS-JEPAは,ソフトコードブックのボトルネックと多解像度の予測対象を統合した特殊なアーキテクチャである。
この設計は、経時的ショックと長期的トレンドを明確に分離し、コードブックを使用して離散的な状態遷移をキャプチャする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:11:29 GMT)
Tokenization and Morphological Fidelity in Uralic NLP: A Cross-Lingual Evaluation [9.2] 本研究は3つのサブワードパラダイムであるByte Pairを体系的に比較する。
BPE(Overlap BPE)、OBPE(Overlap BPE)、Unigram Language Model(Unigram Language Model)。
OBPEは従来手法よりも強い形態的アライメントとタグ付け精度を実現する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:59:25 GMT)
VEXA: Evidence-Grounded and Persona-Adaptive Explanations for Scam Risk Sensemaking [9.2] 電子メール、ショートメッセージサービス、ソーシャルメディアなどのオンライン詐欺は、日々のリスク評価にますます挑戦している。
我々は,学習者向け詐欺説明を生成するためのエビデンス・グラウンドとペルソナ・アダプティブ・フレームワークであるVEXAを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:16:24 GMT)
Latent Chain-of-Thought as Planning: Decoupling Reasoning from Verbalization [9.2] CoT(Chain-of-Thought)は、大規模言語モデル(LLM)に複雑な問題に取り組む権限を与える。
最近の潜伏推論手法は、連続した隠蔽状態内で推論を行うことによって効率を最適化しようとする。
PLaTは、潜在推論を言語化から根本的に切り離すことによって計画として再構成するフレームワークである。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:14:48 GMT)
Building Interpretable Models for Moral Decision-Making [9.2] 我々は、トロリースタイルのジレンマ上でニューラルネットワークが道徳的な決定を行う方法を研究するために、カスタムトランスフォーマーモデルを構築します。
モデルでは、影響を受ける人、人数、属する成果をエンコードする埋め込みを使用して、構造化されたシナリオを処理します。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:38:06 GMT)
Is Micro Domain-Adaptive Pre-Training Effective for Real-World Operations? Multi-Step Evaluation Reveals Potential and Bottlenecks [9.2] 前回の研究では、ドキュメントが少ないマイクロドメイン適応型事前学習(textbfmDAPT$)が、より大きなドメインでのDAPTと同様、効果的であることを示した。
生成タスクにおけるmDAPTの可能性とボトルネックを明らかにすることを目的としている。
我々はmDAPTをIT技術支援業務における現実の質問に対する独占的なIT製品知識について検証した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:53:26 GMT)
E-Globe: Scalable $ε$-Global Verification of Neural Networks via Tight Upper Bounds and Pattern-Aware Branching [9.2] 形式的検証は堅牢性を保証するが、現在のメソッドはスケーラビリティと完全性というトレードオフに直面している。
我々は,$$$globalの最適値に到達するか,早期停止を起動するまで,上界と下界を効率的に締め付けるハイブリッド検証器を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:42:29 GMT)
Finding NeMO: A Geometry-Aware Representation of Template Views for Few-Shot Perception [9.1] 本稿では、RGB画像を用いたトレーニング中に見つからない物体の6DoFポーズの検出、セグメント化、推定に使用できる新しいオブジェクト中心表現を提案する。
本手法は,オブジェクトがスパースなオブジェクトのような点群を生成するために,オブジェクトを描写するRGBテンプレートビューを少数必要とするようなエンコーダから構成される。
次に、デコーダは、オブジェクトをクエリ画像とともに符号化し、様々な密集した予測を生成する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:12:05 GMT)
Context Determines Optimal Architecture in Materials Segmentation [9.0] 本稿では,SEM,AFM,XCT,光学顕微鏡にまたがる材料画像分割のためのクロスモーダル評価フレームワークを提案する。
7つのデータセットにまたがる6つのエンコーダとデコーダの組み合わせを評価した結果,最適アーキテクチャは文脈によって体系的に異なることがわかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:44:52 GMT)
Performative Learning Theory [9.0] サンプル(例えば、アプリの既存ユーザのみ)と人口全体に影響を与えるパフォーマンス予測について検討する。
一般化境界は, 標本, 個体群, およびその両方に作用する。
我々の分析は、世界の変化とそれから学ぶことの間の根本的なトレードオフを明らかにします。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:32:03 GMT)
Static and auto-regressive neural emulation of phytoplankton biomass dynamics from physical predictors in the global ocean [8.9] フィトクトンは海洋食物網の基礎であり、生態学的プロセスと地球規模の生物地球化学的サイクルの両方を駆動している。
その生態学的および気候学的重要性にもかかわらず、植物プランクトン力学は数値的な生物地球化学モデルにとって依然として課題である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:55:34 GMT)
Med-MMFL: A Multimodal Federated Learning Benchmark in Healthcare [8.9] フェデレートラーニング(FL)は、データプライバシを保持しながら、分散化された医療機関間で協調的なモデルトレーニングを可能にする。
Med-MMFLは医療分野における最初の総合的MMFLベンチマークであり、様々なモダリティ、タスク、フェデレーションシナリオを含んでいる。
本ベンチマークでは,6つの最先端FLアルゴリズムを評価し,異なる集約戦略,損失定式化,正規化手法について検討した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:50:15 GMT)
Billion-Scale Graph Foundation Models [8.8] Graph Billion-Foundation-Fusion (GraphBFF)は、Graph Foundation Modelsを構築するための最初のエンドツーエンドのレシピである。
レシピの中心にあるのはGraphBFF Transformerだ。
また,GraphBFFは,最大31個のPRAUCポイントで,ショット数の設定を含む顕著なゼロショットとプロファイリングのパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:03:51 GMT)
Constructing Compact ADAPT Unitary Coupled-Cluster Ansatz with Parameter-Based Criterion [8.8] Param-ADAPT-VQEは、従来の勾配基準ではなくパラメータベースの基準に基づいて励起演算子を選択する新しい改良アルゴリズムである。
そこで,Param-ADAPT-VQEは,計算精度,アンザッツサイズ,測定コストにおいて,本来のADAPT-VQEよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:26:58 GMT)
"I'm happy even though it's not real": GenAI Photo Editing as a Remembering Experience [8.7] Generative Artificial Intelligence(GenAI)は、パーソナルデバイス上の写真アプリケーションにますます統合されている。
この研究は、人々がどのようにしてGenAIを使って個人写真を編集し、それが記憶体験をどう形成するかを調査する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:25:33 GMT)
Applying Ground Robot Fleets in Urban Search: Understanding Professionals' Operational Challenges and Design Opportunities [8.7] 都市検索は、高い認知力と状況負荷の下で、迅速かつ防御力のある決定と持続的な身体的努力を要求する。
近年の技術進歩に伴い、地上ロボットはコンピュータビジョンに基づく状況認識とLCMを利用したインタフェースと組み合わせることで、これらの運用上の負担を軽減できる可能性がある。
公共安全専門家がそのような技術をどのように認識しているか、あるいは既存のプラクティスへの統合を想定しているかを、専門的な研究は行われていない。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:26:31 GMT)
SpeechMapper: Speech-to-text Embedding Projector for LLMs [8.6] SpeechMapper はコスト効率のよい音声からLLMへの埋め込み訓練手法である。
過度な適合を緩和し、より堅牢で一般化可能なモデルを可能にする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:11:44 GMT)
PipeMFL-240K: A Large-scale Dataset and Benchmark for Object Detection in Pipeline Magnetic Flux Leakage Imaging [8.4] PipeMFL-240Kは、パイプラインMFL擬似カラー画像における複雑なオブジェクト検出のための、微妙な注釈付きデータセットとベンチマークである。
データセットには、textbf240,320イメージとtextbf191,530の高品質なバウンディングボックスアノテーションが含まれており、約 textbf1,480 km にまたがる11のパイプラインから収集されている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:43:32 GMT)
When and What to Ask: AskBench and Rubric-Guided RLVR for LLM Clarification [8.4] 大きな言語モデル(LLM)は、重要な詳細を省略したり、誤解を招く情報を含まない場合にも、しばしば応答する。
タスク性能を犠牲にすることなく,LLMがいつ,何を求めるかを決定する能力の評価と改善について検討する。
AskBenchは、標準的なQAペアを明示的なチェックポイントを持つマルチターンインタラクションに変換する対話型ベンチマークである。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:21:01 GMT)
Finding Optimal Video Moment without Training: Gaussian Boundary Optimization for Weakly Supervised Video Grounding [8.4] 弱教師付き時間的ビデオグラウンドティングは、ビデオ文ペアのみを使用して、未トリミングビデオ内のクエリ関連セグメントをローカライズすることを目的としている。
本稿では,原理化された最適化問題を解くことによってセグメント境界を予測できる新しい推論フレームワークを提案する。
実験の結果,GBOはローカライゼーションを大幅に改善し,標準ベンチマーク全体にわたって最先端の結果が得られた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:47:33 GMT)
Trust The Typical [8.3] 本稿では,安全をアウト・オブ・ディストリビューション(OOD)検出問題として扱うことにより,この原則を運用するフレームワークであるTrust The typical(T3)を紹介する。
T3は意味空間における許容可能なプロンプトの分布を学習し、潜在的な脅威として有意な偏差を宣言する。
安全な英語のテキスト転送のみを訓練した単一のモデルは、訓練をすることなく、多様なドメインと14以上の言語に効果的に移行した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:06:46 GMT)
Delving into Muon and Beyond: Deep Analysis and Extensions [8.3] We study Muon as the p = 0 end of a family of a spectrum transformations of form U boldsymbolp V'。
RMS正規化更新は、最初のモーメント更新よりも安定した最適化をもたらす。
この結果から,Muonはスペクトル正規化の有効な形式として理解されているのがよいが,汎用的に優れた最適化手法ではないことが示唆された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:40:47 GMT)
DOS: Dual-Flow Orthogonal Semantic IDs for Recommendation in Meituan [8.3] 生成レコメンデーションシステムのためのDual-Flow Orthogonal Semantic ID (DOS)法を提案する。
DOSは、セマンティックIDのコードブック空間を生成空間と整合させるために協調的な信号を利用する、ユーザイムの二重フローフレームを使用している。
DOSはMeituanのモバイルアプリケーションにうまくデプロイされ、数億のユーザにサービスを提供している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:43:42 GMT)
A computational account of dreaming: learning and memory consolidation [8.2] 本研究では,夢の過程の認知的・計算的モデルを提案する。
海馬から自発的にランダムに活性化される信号を処理する脳の覚醒活動の継続として提案されている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:09:26 GMT)
MMSF: Multitask and Multimodal Supervised Framework for WSI Classification and Survival Analysis [8.1] 本稿では,線形複雑度MILバックボーン上に構築されたマルチタスクおよびマルチモーダル監視フレームワークMMSFを紹介する。
CAMELYON16 と TCGA-NSCLC の実験では、2.1--6.6% の精度と2.2--6.9% のAUC が競争ベースラインよりも向上した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:32:11 GMT)
How to rewrite the stars: Mapping your orchard over time through constellations of fruits [8.1] 本稿では,ビデオ間での果実のマッチング問題に対処する新たなパラダイムを提案する。
提案手法は, ビデオや時間を通して, 果実のマッチングに有効である。
果樹園の地図を作り、その後6DoFでカメラのポーズを見つけるために使うこともできる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:31:32 GMT)
Escape of quantum information across an analogue black hole horizon [8.0] 内部サブシステム内で最初に局在した量子資源は、粒子放射によって外部へ移動可能であることを示す。
この研究は、情報がどのようにブラックホールから逃れるかに関する量子シミュレーションから新しい視点を提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:06:48 GMT)
Following the TRAIL: Predicting and Explaining Tomorrow's Hits with a Fine-Tuned LLM [8.0] TRAILは、短期的な項目の人気を予測し、忠実な自然言語の説明を生成する、微調整された大規模言語モデルである。
正と負のペアによる対照的な学習を用いて、スコアと説明を構造化されたトレンド信号と整合させる。
広範囲にわたる実験により、TRAILは強いベースラインを上回り、一貫性のある、しっかりとした説明を生み出すことが示されている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:22:52 GMT)
The Key to State Reduction in Linear Attention: A Rank-based Perspective [8.0] 最近の実験結果から、訓練された線形アテンションモデルの状態は、しばしば低ランク構造を示すことが示されている。
線形注意におけるランクの役割を理論的に分析し,クエリノイズを増幅することにより,効率の低いランクが検索誤差に影響を与えることを示した。
これらの理論的な知見に加えて、低ランク状態は、最小限の劣化だけで、訓練後を大幅に減少させることができると推測する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:39:38 GMT)
El Agente Quntur: A research collaborator agent for quantum chemistry [8.0] El Agente Qunturは階層型多エージェントAIシステムであり、計算量子化学の研究協力者として動作するように設計されている。
QunturはORCA 6.0で利用可能な計算の全範囲をサポートする。
計算化学の研究レベルでのエージェントシステムの進展と現在のボトルネックについて論じる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:38:50 GMT)
Pruning Minimal Reasoning Graphs for Efficient Retrieval-Augmented Generation [7.9] グラフスタイルのRAGシステムであるAutoPrunedRetrieverについて述べる。
AutoPrunedRetrieverは、エンティティとリレーションをコンパクトなIDインデックス付きコードブックに格納し、質問、事実、回答をエッジシーケンスとして表現する。
難易度とテレビのベンチマークでは、AutoPrunedRetrieverが再びランクインし、グラフの多いベースラインよりも2桁もトークンを減らした。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:48:11 GMT)
Individual Fairness In Strategic Classification [7.9] 個人が機械学習(ML)決定に影響を与えるように特徴を変更する戦略分類では、批判的公正性の課題が提示される。
しきい値に基づく分類を解析し、決定論的しきい値が個々の公正性に反することを示す。
ランダム化分類器が個別の公平性を保証し、これらの条件を利用して最適かつ個別のランダム化分類器を見つける条件を導入する。
実世界のデータセットに対する実験により,本手法が効果的に不公平を軽減し,公平性と精度のトレードオフを改善することが確認された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:09:18 GMT)
A Domain-Specific Curated Benchmark for Entity and Document-Level Relation Extraction [7.9] 我々は,1,600以上のPubMed抽象概念に基づくベンチマークであるGutBrainIEを紹介した。
内脳軸に基盤を置きながら、ベンチマークのリッチなスキーマ、複数のタスク、高度にキュレーションされた弱教師付きデータの組み合わせにより、ドメイン間でのバイオメディカルIEシステムの開発と評価に広く適用することができる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:38:55 GMT)
Multi-Head LatentMoE and Head Parallel: Communication-Efficient and Deterministic MoE Parallelism [7.9] Multi-Head LatentMoEとHead Parallelは、$k$、完全にバランスの取れたトラフィック、決定論的通信に関わらず、$O(1)$通信コストを達成する。
MoE と EP と比較すると、HP の Multi-Head LatentMoE は、同じ性能を保ちながら、最大で1.61Times$の速度で走行する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:57:19 GMT)
Resilient Load Forecasting under Climate Change: Adaptive Conditional Neural Processes for Few-Shot Extreme Load Forecasting [7.8] データスカース条件に対する確率予測モデルであるAdaCNPを提案する。
実世界の電力系統負荷データからAdaCNPを評価し,それを代表的ベースラインの範囲と比較した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:36:39 GMT)
Convivial Fabrication: Towards Relational Computational Tools For and From Craft Practices [7.8] 製作のための計算ツールは、デザインに積極的に参加するよりも受動的に素材を扱い、職人の材料間の関係を抽象化する。
プラクティスを重要視するクラフトコミュニティにとって、抽象化は計算ツールの採用と創造性を制限します。
我々は,工芸品を中心に,個人・道具・材料間の即時関係,コミュニティ・プラットフォーム・共有材料間の中距離関係,施設・インフラ・関係エコロジー間の関係の延長の3つを識別する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:23:50 GMT)
Tinker Tales: Supporting Child-AI Collaboration through Co-Creative Storytelling with Educational Scaffolding [7.8] ティンカー物語(Tinker Tales)は、子供とAIのコラボレーションを支援するために、物語と社会的感情の足場をデザインしたストーリーテリングシステムである。
子どもたちはストーリー要素を配置し、移動し、有形および音声ベースのインタラクションを通じてAIと対話することでストーリーを形作り、洗練する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:48:12 GMT)
A Simple Reduction Scheme for Constrained Contextual Bandits with Adversarial Contexts via Regression [7.8] 制約付き文脈帯域幅を逆選択したコンテキストで検討し、各アクションがランダムな報酬を与え、ランダムなコストを発生させる。
我々は、観測された文脈に基づいて、期待が既知の関数クラスに属する固定分布から、報酬とコストを独立に引き出すという標準的な実現可能性仮定を採用する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:19:55 GMT)
Generalized Schrödinger Bridge on Graphs [7.8] Generalized Schrdinger Bridge on Graphs (GSBoG) は任意のグラフ上で実行可能制御された連続時間マルコフ連鎖(CTMC)ポリシーを学習するための新しいフレームワークである。
GSBoGは、軌跡レベルのポリシーを学び、密集したグローバルソルバを避け、拡張性を向上させる。
GSBoGは、アプリケーション固有の中間状態コストを最適化しつつ、正確なトポロジ的なポリシーを確実に学習することを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:48:09 GMT)
Adaptive Exploration for Latent-State Bandits [7.8] 我々は,タグ付きコンテキスト特徴と協調探索戦略を利用する,状態モデルフリーな帯域幅アルゴリズムのファミリーを導入する。
これらは潜在状態を暗黙的に追跡し、状態依存の報酬パターンを曖昧にします。
様々な設定における実証的な結果は、古典的なアプローチよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:49:39 GMT)
Beyond Forgetting: Machine Unlearning Elicits Controllable Side Behaviors and Capabilities [7.7] 本研究では,LLMアンラーニング手法のクラスである表現ミス指向(RM)について考察する。
我々は、忘れる以外に、機械学習は制御可能な側面の振る舞いと高レベルの概念に対応する強力な側面の能力を引き出すと仮定する。
この発見は、このかなり魅力的な現象が、誤用された場合や、利用可能なメカニズムを隠蔽する可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:09:12 GMT)
Multi-layer Cross-Attention is Provably Optimal for Multi-modal In-context Learning [7.7] 本稿では,マルチモーダル学習を数学的に学習可能なフレームワークを導入し,変換器のようなアーキテクチャがベイズ最適性能をコンテキスト内で回復する方法について検討する。
本研究は,マルチモーダル分布において,文脈内学習における奥行きの利点を強調し,クロスアテンションの有効性を確立することを目的とする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:57:30 GMT)
Evolving Afferent Architectures: Biologically-inspired Models for Damage-Avoidance Learning [7.6] 本稿では,CAT(Computational Afferent Traces)を適応的,内部的リスク信号として生成するフレームワークを提案する。
CATをベースとした進化型アーキテクチャは,手作りのベースラインよりも効率が高く,老朽性に優れていることがわかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:53:28 GMT)
UnMaskFork: Test-Time Scaling for Masked Diffusion via Deterministic Action Branching [7.5] UnMaskFork(UMF)は、unmaskingトラジェクトリを検索ツリーとして定式化するためのフレームワークであり、生成パスを最適化するためにMonte Carlo Tree Searchを使用している。
UMFは、複雑なコーディングベンチマークで既存のテスト時間スケーリングベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:13:08 GMT)
Investigating Disability Representations in Text-to-Image Models [7.2] 本研究では、障害者がAI生成画像でどのように表現されるかを検討する。
本研究は、一般的な障害プロンプトと特定の障害カテゴリを参照するプロンプトとの画像類似性を比較することで、障害表現を分析する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:54:25 GMT)
CAST-CKT: Chaos-Aware Spatio-Temporal and Cross-City Knowledge Transfer for Traffic Flow Prediction [7.2] CAST-CKT(Chaos-Aware Spatio-Temporal and Cross-City Knowledge Transfer framework)を提案する。
交通予測可能性の仕組みを定量化するために、効率的なカオス分析装置を使用し、いくつかの重要なイノベーションを推進している。
実験では、MAEとRMSEにおいて、最先端の手法よりもかなりのマージンで優れた性能を示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:34:17 GMT)
Decoupled Orthogonal Dynamics: Regularization for Deep Network Optimizers [7.2] 我々はマグニチュードと方向が異なる役割を担い、動的に分離されるべきであると主張している。
SGDスタイルの更新は1次元ノルム制御を処理し、Adamの適応的プレコンディショニングは接部分空間に限定される。
ビジョンと言語タスクの実験は、AdamOがAdamWに対する一般化と安定性を改善し、追加の複雑な制約を導入することなく実現していることを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:41:51 GMT)
What's in a Benchmark? The Case of SWE-Bench in Automated Program Repair [7.1] SWE-Benchは、人気のあるPythonリポジトリから抽出された実際の問題を使用して、修復システムを評価するために設計されたベンチマークである。
公開のリーダーボードであるSWE-Bench LiteとVerified-は、進捗を追跡し、ソリューションを比較するための中心的なプラットフォームになっている。
本稿では, 提案するソリューション, 提案の背後にある製品, 採用するLCM, アプローチのオープン性について検討する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:19:18 GMT)
Learning fermionic linear optics with Heisenberg scaling and physical operations [7.1] 我々はフェルミオン型線形光学(FLO)の学習問題を再考し、フェルミオン型ガウスユニタリ(fermionic Gaussian unitary)とも呼ばれる。
我々は,スーパーセレクションに従属し,最小限のアンシラを用い,両パラメータへの依存性を改善した,効率的で実験的にフレンドリーなプロトコルを確立する。
これは、ハイゼンベルクのスケーリングを精度良く達成した最初のFLO学習アルゴリズムである。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:18:08 GMT)
Provable Target Sample Complexity Improvements as Pre-Trained Models Scale [7.0] 事前学習モデルの利点は、スケーリング法則に関する実証的研究によって強調されている。
我々は,新しい枠組み,コーキングを導入することによって理論的調査を行う。
我々の分析は、事前学習モデルの改善が下流タスクのサンプルの複雑さを確実に減少させることを証明している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:51:56 GMT)
Reliable Explanations or Random Noise? A Reliability Metric for XAI [6.9] 本研究では、4つの信頼性公理の下で説明安定性を定量化する指標である説明信頼性指数(ERI)を紹介する。
ERIは、説明信頼性の原則的評価を可能にし、より信頼できるAI(XAI)システムをサポートする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:04:07 GMT)
Jacobian Regularization Stabilizes Long-Term Integration of Neural Differential Equations [6.8] トレーニング中にNDEモデルのジャコビアンを方向微分で正規化することは、長期統合を安定化させることを示す。
トレーニング中の長期ロールアウトに比べてはるかに低コストであるが、長期シミュレーションの安定性の向上に成功している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:36:28 GMT)
Less Finetuning, Better Retrieval: Rethinking LLM Adaptation for Biomedical Retrievers via Synthetic Data and Model Merging [6.8] Retrieval-augmented Generation (RAG) はLarge Language Models (LLMs) のバックボーンとなった。
STM(Synthesize-Merge-Train)は,デコーダのみのLLMを,合成ハードネガティブ,検索プロンプト最適化,モデルマージで拡張するモジュラーフレームワークである。
MTEBベンチマークによる12の医療および一般タスクのサブセットの実験では、STMはタスク固有の専門家を最大23.5%(平均7.5%)増やし、単一の専門家と強力なベースラインの両方を広範囲の事前訓練なしで上回るマージモデルを生成する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:36:00 GMT)
A Human-Centered Privacy Approach (HCP) to AI [6.7] この章は、Human-Centered AI(HCAI)におけるプライバシーに関する包括的な概要を提供する。
技術、倫理、ヒューマンファクタの観点から統合されたソリューションを提供する、人間中心のプライバシーフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:43:25 GMT)
SalFormer360: a transformer-based saliency estimation model for 360-degree videos [6.7] 本研究では,変換器アーキテクチャ上に構築された360度ビデオのための新しい唾液度推定モデルであるSalFormer360を提案する。
私たちのアプローチは、既存のエンコーダアーキテクチャ、SegFormer、カスタムデコーダの組み合わせに基づいています。
SalFormer360が既存の最先端メソッドより優れていることを示すのは、最も大きな3つのベンチマークデータセットの実験である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:11:00 GMT)
Directional Concentration Uncertainty: A representational approach to uncertainty quantification for generative models [6.7] 高い柔軟性とアプローチ,あるいは先行手法の性能を超越した,新しい量子化フレームワーク(UQ)を提案する。
我々は,von Mises-Fisher(vMF)分布に基づく埋め込みの濃度を定量化するための新しい統計手法であるDCUを紹介する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:49:18 GMT)
COMBOOD: A Semiparametric Approach for Detecting Out-of-distribution Data for Image Classification [6.5] 画像認識におけるOOD検出のための新しい半パラメトリックフレームワークCOMBOODを提案する。
我々のフレームワークは、最も近い隣人とマハラノビスの2つの距離指標からの信号を組み合わせて、推定点の信頼度をアウト・オブ・ディストリビューション(out-of-distribution)とする。
COMBOODは,OpenOODベンチマークデータセット上で,最先端のOOD検出手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:56:24 GMT)
System-Level Isolation for Mixed-Criticality RISC-V SoCs: A "World" Reality Check [6.5] RISC-V International が提案するハードウェアアイソレーションプリミティブの比較分析を行った。
以上の結果から,ワールドベースのチェッカーは,設定に依存しないアクセス遅延を導入し,最悪の場合の遅延を低減できることがわかった。
すべての成果物をオープンソースとして公開し、RISC-V仕様の進化と批准に直接貢献することを期待しています。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:39:56 GMT)
$C$-$ΔΘ$: Circuit-Restricted Weight Arithmetic for Selective Refusal [6.4] アクティベーションステアリングは広く使用されているが、実行時フックを必要とし、世代数でコストをスケールする必要がある。
カテゴリー固有の拒絶の機械的理解は、標準チェックポイントとしてデプロイされる回路制限された重み更新に蒸留できるのか?
Cを適用すると、推論時フックのない、ドロップインの編集されたチェックポイントが得られ、リクエスト毎の介入から1回のオフラインアップデートにコストがシフトする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:10:52 GMT)
Hierarchical Embedding Fusion for Retrieval-Augmented Code Generation [6.4] コード補完のためのリポジトリ表現のための2段階のアプローチである階層埋め込み融合(HEF)を提案する。
HEFはスニペットベースの検索ベースラインに匹敵する正確なマッチング精度を達成する。
グラフベースおよび反復検索システムと比較して、HEFは中央値のエンドツーエンドのレイテンシを13倍から26倍に削減する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:56:11 GMT)
Learning Where It Matters: Geometric Anchoring for Robust Preference Alignment [6.4] 本稿では,固定参照を動的な幾何学的アンカーに置き換えたGeometric Anchor Preference Optimization (GAPO)を提案する。
GAPOは標準のLCMアライメントと推論ベンチマークのパフォーマンスをマッチングまたは改善しながら、ロバストさを一貫して改善する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:40:21 GMT)
Embracing Anisotropy: Turning Massive Activations into Interpretable Control Knobs for Large Language Models [6.2] そこで本稿では,ドメイン・クリティカル・ディメンションを学習自由な方法で識別するための簡易な等級基準を提案する。
本分析により,これらの次元は,記号的・定性的パターンやドメイン固有項の解釈可能な意味検出器として振る舞うことが明らかとなった。
さらに,特定次元にのみアクティベーションステアリングを適用するCritical Dimension Steeringを導入する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:51:26 GMT)
MA3DSG: Multi-Agent 3D Scene Graph Generation for Large-Scale Indoor Environments [6.1] 我々は,マルチエージェントを用いて,この拡張性に対処するための最初のフレームワークであるマルチエージェント3次元シーングラフ生成(MA3DSG)モデルを導入する。
我々は,個々のエージェントから部分グラフを効率よく統合したグローバルシーングラフにマージする学習自由グラフアライメントアルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:39:57 GMT)
Quantum fields from real-time ensemble dynamics [6.1] 実時間シュルディンガー・ピクチャー・フレームワークで量子場を定式化する。
この定式化の中で、ウェーブ $[,t]$ は構成空間上の一階の因果アンサンブルダイナミクスを符号化する。
絡み合い、散乱、共形場振幅は同じアンサンブル理論の異なる射影として現れる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:40:38 GMT)
Toward Accurate and Accessible Markerless Neuronavigation [6.1] 我々は、高価なハードウェアと物理マーカーを低コストで可視光および赤外線カメラに置き換えるマーカーレスアプローチを導入し、評価する。
人件費50ドルによる検証では、マーカーレスアルゴリズムでは2.32ドルmmと2.01ドルという平均的な追跡誤差が得られた。
提案したマーカーレス神経ナビゲーション法は、セットアップコストと複雑さを低減し、患者の快適性を向上し、臨床および研究環境における神経ナビゲーションへのアクセスを拡大することができる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:05:36 GMT)
Turning mechanistic models into forecasters by using machine learning [6.0] 時間変化パラメータを用いた複雑な力学系の予測モデルを開発した。
我々のモデルは、時系列の学習において平均的な絶対誤差を3%以下、最大1ヶ月前に予測するために6%以下を達成する。
本研究は,時間変化パラメータをデータ駆動型微分方程式の発見に組み込むことで,モデリング精度と予測性能が向上することを示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:00:08 GMT)
Theory of Speciation Transitions in Diffusion Models with General Class Structure [5.9] 拡散モデルは拡散過程を反転させ、ノイズをターゲット分布から引き出された構造化サンプルに変換することによってデータを生成する。
最近の理論的研究により、この後方ダイナミクスは、偏光遷移として知られる鋭い定性的遷移を経ることができることが示されている。
拡散モデルにおける偏差の一般理論を開発し、適切に定義されたクラスを持つ任意の対象分布に適用する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:35:47 GMT)
SLUM-i: Semi-supervised Learning for Urban Mapping of Informal Settlements and Data Quality Benchmarking [5.9] 急速な都市拡大は、低所得国と中所得国の主要都市における非公式の集落の成長を加速させた。
我々は,カラチとムンバイのベンチマークデータセットとともに,スクラッチから構築したLahoreのベンチマークデータセットを紹介した。
そこで本研究では,従来の半教師付き学習パイプラインに内在するクラス不均衡と特徴劣化を軽減するための,新しい半教師付きセグメンテーションフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:16:30 GMT)
LORE: Jointly Learning the Intrinsic Dimensionality and Relative Similarity Structure From Ordinal Data [5.8] 内在的次元と順序構造を共同で学習するフレームワークであるLORE(Low Rank Embedding)を導入する。
合成データセット、シミュレートされた知覚空間、実世界のクラウドソースされた順序埋め込みの実験は、LOREがコンパクトで解釈可能で高精度な低次元埋め込みを学ぶことを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:12:56 GMT)
From Assumptions to Actions: Turning LLM Reasoning into Uncertainty-Aware Planning for Embodied Agents [5.8] マルチエージェントで活動し、部分的に観察可能で、分散化された環境では、広範囲にわたる不確実性にもかかわらず計画し行動しなければならない。
我々は,大規模言語モデルで潜在する断片化仮定を構造化決定木に変換するPlanner-Composer-EvaluatorフレームワークであるPCEを紹介する。
また, PCEは, トークン使用率とタスク効率において, コミュニケーション中心のベースラインを一貫して上回り, トークン使用率と同等であることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:43:39 GMT)
KGLAMP: Knowledge Graph-guided Language model for Adaptive Multi-robot Planning and Replanning [5.7] ヘテロジニアスなマルチロボットチームのための知識グラフ誘導LLM計画フレームワークであるKGLAMPを紹介する。
このフレームワークは、オブジェクト関係、空間到達性、ロボット能力をコードする構造化知識グラフを維持している。
MAT-THOR ベンチマークの実験では、KGLAMP は LLM のみと PDDL ベースの両方で少なくとも 25.5% 向上している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:46:02 GMT)
How Few-shot Demonstrations Affect Prompt-based Defenses Against LLM Jailbreak Attacks [5.6] 大規模言語モデル(LLM)は、安全アライメントをバイパスするジェイルブレイク攻撃による脅威の増加に直面している。
Role-Oriented Prompts (RoP) や Task-Oriented Prompts (ToP) のようなプロンプトベースの防衛は効果を示したが、これらの防衛戦略における数発のデモンストレーションの役割はいまだ不明である。
我々は,RoPの安全性を最大4.5%向上させ,ToPの有効性を最大21.2%低下させ,タスク命令の注意をそらすことにより,RoPの安全性を最大4.5%向上させることを示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:54:51 GMT)
Gabor Fields: Orientation-Selective Level-of-Detail for Volume Rendering [5.5] 本稿では,連続周波数フィルタリングを低コストで実現するGaborカーネルの配向選択混合について述べる。
また,Gabor-noise-modulated Gaussianとしてプロシージャ雲の効率的な設計とレンダリングを行うアプリケーションを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:58:03 GMT)
Piece of CAKE: Adaptive Execution Engines via Microsecond-Scale Learning [5.4] CAKEは、マイクロスケールのコンテキスト多重武装バンディットを使用して、各データ"モーセル"に対して最適なカーネルを選択することを学ぶ。
C CAKEは、最先端の静的よりもエンドツーエンドのワークロード遅延を最大2倍削減できる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:41:07 GMT)
Atomic Information Flow: A Network Flow Model for Tool Attributions in RAG Systems [5.3] グラフベースのネットワークフローモデルである textbfAtomic Information Flow (AIF) を提案する。
AIFは、AI説明可能性のための粒度の属性メトリクスを可能にする。
AIF信号のポストトレーニングにより,textbf82.71%(+28.01点)の精度が向上し,textbf87.52%(+1.85%)のコンテキストトークン圧縮が達成された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:51:57 GMT)
SynthForensics: A Multi-Generator Benchmark for Detecting Synthetic Video Deepfakes [5.3] われわれはSynthForensicsを導入し、人工的なビデオディープフェイクを検知する最初の人間中心のベンチマークを私たちの知る限りで紹介する。
ベンチマークは、アーキテクチャ的に異なる、最先端のオープンソースT2Vモデルの6,815のユニークなビデオで構成されている。
AUCの平均的な性能低下は29.19%で、いくつかの手法はランダムな確率よりも悪く、上位モデルは重い圧縮の下で30ポイント以上低下する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:47:37 GMT)
AIANO: Enhancing Information Retrieval with AI-Augmented Annotation [5.3] オフザシェルフツールは、アノテーションプロセスが複雑で非効率になる。
我々はAI拡張アノテーションツールであるAIANOを開発し、人間の専門知識とLLM支援を密に統合した。
AIANOのAI強化アプローチは、情報検索タスクのためのデータセット作成を加速し、強化する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:05:12 GMT)
UniTrack: Differentiable Graph Representation Learning for Multi-Object Tracking [5.2] UniTrackは、マルチオブジェクトトラッキング(MOT)を強化するために設計された、プラグアンドプレイグラフ理論の損失関数である。
最大で53%のIDスイッチが削減され、12%のIDF1が、挑戦的なベンチマークで改善され、SportsMOT上でのピークパフォーマンスは9.7%向上した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:44:16 GMT)
Exploring the Ethical Concerns in User Reviews of Mental Health Apps using Topic Modeling and Sentiment Analysis [5.2] AI駆動のメンタルヘルスモバイルアプリの急速な成長は、倫理的配慮とユーザーの信頼を懸念している。
本研究では、ユーザ生成レビューから倫理的側面を評価する自然言語処理(NLP)ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:35:27 GMT)
Growth First, Care Second? Tracing the Landscape of LLM Value Preferences in Everyday Dilemmas [5.1] 4つのアドバイス指向サブレディットから得られたキュレートデータセットを用いて、アドバイスに基づく価値トレードオフ構造を検討する。
我々は、ジレンマ内でどのように共起するかを特徴付けるために、値共起ネットワークを構築した。
モデルとコンテキストによって、LLMはベネバレンスとコネクションよりも探索と成長に関する価値を常に優先順位付けしています。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:41:27 GMT)
BioACE: An Automated Framework for Biomedical Answer and Citation Evaluations [5.0] 生成した回答の品質と、生成した回答の事実をサポートするための参照を評価することが重要である。
バイオACEは,バイオメディカルな回答と,回答に記載された事実に対する引用を自動で評価するフレームワークである。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:13:43 GMT)
Act or Clarify? Modeling Sensitivity to Uncertainty and Cost in Communication [5.0] コミュニケーション設定では、不確実性を減らす重要な方法は、明確化質問(CQ)を問うことである。
我々は、CQを問う決定は、文脈の不確実性と代替行動のコストの両方に依存すると予測する。
我々は、この相互作用を期待された後悔に基づく計算モデルで定式化する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:50:43 GMT)
Privacy Amplification by Missing Data [4.9] 差分プライバシーの枠組みの中で、欠落したデータをプライバシー増幅機構として分析する。
我々は、不完全なデータが、微分プライベートアルゴリズムのプライバシーの増幅をもたらすことを初めて示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:07:53 GMT)
Internalizing LLM Reasoning via Discovery and Replay of Latent Actions [4.8] 連鎖プロセスの隠れ状態への内部化は、テスト時間計算をスケールするための非常に効率的なパラダイムとして現れている。
動的潜在軌道制御問題として推論強化を再構築するSTIR(Self-Distilled Tools for Internal Reasoning)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:44:57 GMT)
Team, Then Trim: An Assembly-Line LLM Framework for High-Quality Tabular Data Generation [4.8] 本稿では,LLMの協力チームを通じて高品質なデータを合成するフレームワークであるTeam-then-Trim(T$2$)を紹介する。
T$2$では、ドメイン知識によってガイドされる特殊なLLMは、異なるデータコンポーネントを逐次生成する。
シミュレーションと実世界の両方のデータセットに対する実証的な結果は、T$2$が高品質なデータを生成する上で最先端の手法より優れていることを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:34:41 GMT)
El Agente Estructural: An Artificially Intelligent Molecular Editor [4.8] 本稿では, 自然言語駆動型構造生成・操作エージェントであるEl Agente Estructuralについて述べる。
構造学は、人間の専門家が、包括的なドメインインフォームドツールと視覚言語モデルを統合することで、分子システムを直接操作する方法を模倣する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:38:48 GMT)
ACIL: Active Class Incremental Learning for Image Classification [4.8] 本稿では、クラスインクリメンタルな学習設定のための新しいアクティブな学習フレームワークACILを提案する。
我々は、不確実性と多様性に基づく基準を利用して、各エピソードに注釈を付ける必要があるサンプルを特定する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:22:30 GMT)
SLAY: Geometry-Aware Spherical Linearized Attention with Yat-Kernel [4.8] 本稿では,最近導入されたE-Productの緩和的かつ計算学的に効率的な定式化に基づいて,線形時間アテンション機構の新たなクラスを提案する。
提案手法は,Yat Kernels (SLAY) を用いた球面線形化注意(Spherical Linearized Attention with Yat Kernels)であり,クエリとキーを単位球に制約することにより,注意が角アライメントにのみ依存するようにする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:06:50 GMT)
A Quantum Computing Framework for VLBI Data Correlation [4.8] 古典的ベースバンド時系列データである長さ$N$は、振幅エンコーディングを$log N$ qubitsのみを用いて量子重ね合わせ状態に埋め込むことができることを示す。
基本的VLBI相関とフリンジフィッティング操作は、計算複雑性を著しく低減した量子アルゴリズムによって実装できる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:59:26 GMT)
CLEAR-HPV: Interpretable Concept Discovery for HPV-Associated Morphology in Whole-Slide Histology [4.7] 我々はHPV(CLEAR-HPV)のための概念レベル説明型注意誘導表現について紹介する。
CLEAR-HPVは、トレーニング中に概念ラベルを必要とせずに概念発見を可能にするために、注意重み付き潜在空間を再構築する。
ケラチナイズ、バサロイド、ストロームのモルフォロジーの概念を自動的に発見し、空間概念マップを生成し、コンパクトなコンセプト・フレクション・ベクターを用いて各スライドを表現する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:18:14 GMT)
AVERE: Improving Audiovisual Emotion Reasoning with Preference Optimization [4.7] EmoReAlMは,情動関連,幻覚,モダリティ合意のためのMLLMを評価するためのベンチマークである。
次に,AVEm-DPOを提案する。AVEm-DPOは,モデル応答を音声視覚入力と感情中心クエリの両方に整合させる選好最適化手法である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:24:25 GMT)
Model Reconciliation through Explainability and Collaborative Recovery in Assistive Robotics [4.7] 我々は,ロボットと人間のメンタルモデルの違いを予測し,説明するために,大規模言語モデルを利用する。
本フレームワークは,人間にロボットの修正を許すことで,説明後のモデルのばらつきを解決することを目的としている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:42:19 GMT)
LinGO: A Linguistic Graph Optimization Framework with LLMs for Interpreting Intents of Online Uncivil Discourse [4.7] 大規模言語モデル(LLM)のための言語グラフ最適化フレームワークLinGOを紹介する。
言語を多段階言語コンポーネントに分解し、最もエラーの原因となるターゲットステップを特定し、ターゲットステップのプロンプトやサンプルコンポーネントを反復的に最適化する。
GPT-5-mini, Gemini 2.5 Flash-Lite, Claude 3 Haikuの3つのコスト効率 LLM と, TextGrad, AdalFlow, DSPy, Retrieval-Augmented Generation (RAG) の4つの最適化手法を用いたLinGOのベンチマークを行った。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:56:35 GMT)
Evaluating Large Language Models on Solved and Unsolved Problems in Graph Theory: Implications for Computing Education [4.6] 大規模言語モデルは、コンピュータ科学の先進的な材料を探究するために学生によってますます使われている。
本研究では,2つのグラフ理論問題に対する LLM の性能について検討する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:20:25 GMT)
Enhancing IMU-Based Online Handwriting Recognition via Contrastive Learning with Zero Inference Overhead [4.5] 推論コストを増大させることなく特徴表現と認識精度を向上させるためのトレーニングフレームワークを提案する。
ECHWRは、トレーニングフェーズ中にセンサー信号とセマンティックテキストの埋め込みを整列する一時的な補助ブランチを使用する。
OnHW-Words500データセットの評価によると、ECHWRは最先端のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:44:54 GMT)
Probabilistic Label Spreading: Efficient and Consistent Estimation of Soft Labels with Epistemic Uncertainty on Graphs [4.5] 本稿では,ラベルの不確かさを推定する確率的ラベル拡散手法を提案する。
データポイントあたりのアノテーションの数が0に収束しても、ラベルの拡散が一貫した確率推定器が得られることを示す。
実験結果から,本手法はベースラインと比較して,所望のラベル品質を実現するために必要なアノテーション予算を大幅に削減することが示された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:00:30 GMT)
Beyond the Control Equations: An Artifact Study of Implementation Quality in Robot Control Software [4.5] オープンソースロボットソフトウェアにおける184個の実世界コントローラの実装について検討する。
これらの実装は、しばしばアドホックな方法で離散化を処理し、リアルタイムの信頼性に関する潜在的な問題を引き起こす。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:45:59 GMT)
Governance at the Edge of Architecture: Regulating NeuroAI and Neuromorphic Systems [4.5] 現在のAIガバナンスフレームワークは、von Neumannハードウェア上で静的で集中的にトレーニングされた人工知能ニューラルネットワーク用に構築されている。
ニューロAIシステムは、ニューロモルフィックなハードウェアに具現化され、スパイクニューラルネットワークによって実装され、これらの仮定を破る。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:38:32 GMT)
Crypto-asset Taxonomy for Investors and Regulators [4.5] 本稿では,暗号資産の多次元分類法を開発する。
技術設計を市場構造と規制に結びつける。
構造内の上位100の資産をマッピングし、ケーススタディを提供します。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:29:13 GMT)
PuppetAI: A Customizable Platform for Designing Tactile-Rich Affective Robot Interaction [4.4] モジュール型ソフトロボットインタラクションプラットフォームであるPuppetAIを紹介する。
スケーラブルなケーブル駆動アクチュエータシステムと、カスタマイズ可能な人形にインスパイアされたロボットジェスチャーフレームワークを提供する。
われわれのデザインでは、デキスタリティを向上した「ソフトロボット」と、外装の「使い勝手の良いタッチ」を具備したニュアンスなジェスチャーで作業してきた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:37:31 GMT)
Reinforcement Learning Enhancement Using Vector Semantic Representation and Symbolic Reasoning for Human-Centered Autonomous Emergency Braking [4.3] 本稿では,意味情報,空間情報,形状情報を含むニューロシンボリックな特徴表現を生成するパイプラインを提案する。
また、シンボル推論モジュールを介して人間の値のバランスをとるソフト・ファースト・オーダー・ロジック(SFOL)報酬関数を提案する。
この結果から,総合的な表現とソフト推論を強化学習に統合することで,自律運転におけるコンテキスト認識と価値整合型意思決定を支援することが示唆された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:56:27 GMT)
From Dead Neurons to Deep Approximators: Deep Bernstein Networks as a Provable Alternative to Residual Layers [4.3] 我々は、Deep Bernstein Networksが、最適化性と表現能力の両立を図りながら、残余のないアーキテクチャとして振る舞うことができることを示す。
我々のアーキテクチャは、死のニューロンを標準的なディープネットワークの90%から5%未満に減らし、ReLU、Leaky ReLU、SeLU GeLUを上回ります。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:55:55 GMT)
Do Developers Read Type Information? An Eye-Tracking Study on TypeScript [4.2] 静的アノテーション付き型は、開発者が多くのプログラミングタスクを行うのに役立つことが示されている。
これは、開発者がインコードドキュメンテーションとして型アノテーションを使っているためであると仮定されている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:12:59 GMT)
Non-Intrusive Graph-Based Bot Detection for E-Commerce Using Inductive Graph Neural Networks [4.2] 悪意のあるボットは、データをスクラップし、在庫を盗み、詐欺行為を繰り返すことで、Eコマースプラットフォームへの脅威が増大する。
IPブラックリストやCAPTCHAベースの課題など、従来のボットの緩和技術は、ますます非効率あるいは侵入的になっている。
本研究は,ユーザセッションの振る舞いをグラフ表現を通じてモデル化するEコマースのための非侵襲的なグラフベースボット検出フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:55:42 GMT)
An Intuitionistic Fuzzy Logic Driven UNet architecture: Application to Brain Image segmentation [4.0] 直観的ファジィ論理(IF-UNet)を組み込んだ拡張フレームワークUNetを提案する。
このモデルはメンバーシップ、非メンバーシップ、およびヒューイテーションの度合いでデータを処理し、部分体積効果と不確実性に対処する。
実験の結果、IF-UNetは脳画像の不確実性に対処してセグメンテーション品質を改善することが確認された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:27:35 GMT)
AFD-INSTRUCTION: A Comprehensive Antibody Instruction Dataset with Functional Annotations for LLM-Based Understanding and Design [4.0] AFD-Instructionは、抗体に合わせた機能アノテーションを備えた最初の大規模命令データセットである。
このデータセットは2つの重要な構成要素を含んでいる: 抗体理解は、配列から直接機能的特性を推測するものであり、また、機能的制約の下でデノボ配列を生成することができる抗体設計である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:09:39 GMT)
Relational Scene Graphs for Object Grounding of Natural Language Commands [3.9] 本稿では,3DSGにオープンまたはクローズドな空間関係を組み込むことで,自然言語コマンドの解釈能力を向上させることができるかを検討する。
そこで本研究では,オープン語彙言語コマンドからターゲットオブジェクトをグラウンドグラウンド化するためのLLMベースのパイプラインと,オープン語彙空間エッジをマッピング中にキャプチャした画像から3DSGに付加するビジョン言語モデル(VLM)ベースのパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:05:29 GMT)
Autonomous Navigation at the Nano-Scale: Algorithms, Architectures, and Constraints [3.9] 本稿では,ナノUAVのセンサ,コンピューティング,制御アーキテクチャの最先端を概説する。
我々は、古典幾何学に基づく手法から新しい「エッジAI」パラダイムへの移行を批判的に分析する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:08:13 GMT)
Inference-Time Backdoors via Hidden Instructions in LLM Chat Templates [3.8] チャットテンプレートは、すべての推論コールで呼び出される実行可能なJinja2プログラムである。
悪意のあるテンプレートでモデルを配布する敵が,推論時バックドアを埋め込むことができることを示す。
Backdoorsは推論ランタイムをまたいで一般化し、最大のオープンウェイトディストリビューションプラットフォームによって適用されるすべての自動セキュリティスキャンを回避する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:28:53 GMT)
Point Virtual Transformer [3.8] LiDARベースの3Dオブジェクト検出器は、遠距離の物体を検出するのに苦労することが多い。
変換器をベースとした3Dオブジェクト検出フレームワークであるPoint Virtual Transformer (PointViT) について述べる。
このフレームワークは、初期の点レベル融合からBEVベースのゲート融合まで、複数の融合戦略を調べ、精度と効率の観点からそれらのトレードオフを分析する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:44:53 GMT)
Capacity Constraints and the Multilingual Penalty for Lexical Disambiguation [3.8] 多言語言語モデル(LM)は、時としてモノリンガルモデルよりも性能が低いことを示す。
関係性判断のデータセットを用いた語彙的曖昧化のための「多言語ペナルティ」の定量化を行う。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:42:08 GMT)
AI-Based Detection of In-Treatment Changes from Prostate MR-Linac Images [3.7] 本研究は761例のMR-Linac画像を含む。
深層学習モデルを用いて、ペア画像の時間順を予測することにより、治療に伴う変化を特徴づけた。
モデルはMR-Linac分画の時間順を正確に予測し、放射誘起変化を1日または数日で検出する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:14:55 GMT)
ShapBPT: Image Feature Attributions Using Data-Aware Binary Partition Trees [3.7] ピクセルレベルの特徴属性は、コンピュータビジョンのためのeXplainable AI(XCV)の重要なツールである
本稿では,階層型シェープ式に基づく新しいデータ認識型XCV法であるShapBPTを紹介する。
このデータ対応階層的パーティショニングを使用することで、ShapBPTは、その特徴属性と本質的なイメージデータとの整合性を保証する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:42:21 GMT)
Quality Model for Machine Learning Components [3.7] テストは、システムから派生した要件を考慮せずに、モデルパフォーマンスなどのモデルプロパティのテストに限られています。
新しい標準ISO 25059は、AIシステムのより具体的な品質モデルを定義する。
本稿では,MLコンポーネントの品質モデルを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:50:51 GMT)
RAP: KV-Cache Compression via RoPE-Aligned Pruning [3.6] 大規模言語モデルにおける長いコンテキスト推論は、KV-Cacheのメモリと計算コストによってますますボトルネックになっている。
我々は,RoPEの2x2回転構造を保ち,B吸収を回復し,復元をなくすために,全RoPEの列対を突破するRAP(RoPE-Aligned Pruning)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:20:02 GMT)
CVA6-CFI: A First Glance at RISC-V Control-Flow Integrity Extensions [3.6] 本研究は,制御フロー積分(CFI)のための標準RISC-V拡張の設計,統合,評価を行う。
ZicfissとZicfilp拡張機能は、脆弱なプログラムの実行を制御フローのハイジャック攻撃から保護することを目的としている。
我々は,オープンソースのCVA6コアに完全に統合された,前縁と後縁の制御フロー保護を実装した2つの独立したハードウェアユニットを紹介する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:24:31 GMT)
Digital Twins & ZeroConf AI: Structuring Automated Intelligent Pipelines for Industrial Applications [3.5] この研究は、Cyber-Physical SystemsへのシームレスなAIパイプライン統合を可能にする、モジュール的で相互運用可能なソリューションを提案する。
我々は、DTがデータ管理とインテリジェントな拡張をオーケストレーションするZeroconfigation (ZeroConf) AIパイプラインの概念を紹介します。
このアプローチはMicroFactoryのシナリオで実証されており、並行MLモデルと動的データ処理のサポートを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:11:06 GMT)
Hallucination is a Consequence of Space-Optimality: A Rate-Distortion Theorem for Membership Testing [3.5] 大きな言語モデルはしばしば「ランダムな事実」に高い信頼を持って幻覚を与える
我々はそのような事実の記憶を会員試験問題として定式化する。
幻覚は, 損失圧縮の自然な帰結として持続することを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:00:24 GMT)
RISE: Interactive Visual Diagnosis of Fairness in Machine Learning Models [3.4] textitRISE(Residual Inspection through Sorted Evaluation)は,分類された残基を解釈可能なパターンに変換するインタラクティブな可視化ツールである。
残留曲線構造を形式的公正性の概念に結合することにより、RISEは局所的な不均一性診断、環境間の部分群比較、隠された公正性問題の検出を可能にする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:01:21 GMT)
VISION-ICE: Video-based Interpretation and Spatial Identification of Arrhythmia Origins via Neural Networks in Intracardiac Echocardiography [3.4] 不整脈源の局在は、正常洞リズム、左サイド、右サイドの不整脈を区別する3段階の分類課題として定式化されている。
上記の3つのクラスを識別する3次元畳み込みニューラルネットワークを開発した。
10倍のクロスバリデーションでは、前例のない4例に対して平均66.2%の精度で評価された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:02:03 GMT)
It's all In the (Exponential) Family: An Equivalence between Maximum Likelihood Estimation and Control Variates for Sketching Algorithms [3.3] 我々は、最適CVEがMLEと同じ分散を達成することを示し、MLEの最大期待-最大化アルゴリズムを提供する。
我々は,EMアルゴリズムがMLE/CVEを用いたアルゴリズムのスケッチにどのように寄与するかを示し,CV重みが分かっているとき,EMアルゴリズムがMLEの発見にどう寄与するかを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:35:28 GMT)
SAR-RAG: ATR Visual Question Answering by Semantic Search, Retrieval, and MLLM Generation [3.3] 合成開口レーダ(SAR)の自動目標認識(ATR)のための視覚コンテキスト画像検索補助AIエージェント(ImageRAG)を提案する。
SARは、軍用車両の位置を検知し、監視するために防衛およびセキュリティアプリケーションで使用されるリモートセンシング手法である。
新しい手法は、ニューラルネットワーク、トランスフォーマーアテンション、マルチモーダルな大規模言語モデルの能力を高める。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:23:16 GMT)
Beyond KL Divergence: Policy Optimization with Flexible Bregman Divergences for LLM Reasoning [3.3] Group-Based Mirror Policy Optimization (GBMPO)は、グループベースのポリシー最適化をフレキシブルなBregman分散に拡張するフレームワークである。
ハンドデザインのProbL2-GRPOは86.7%の精度でDr. GRPOベースラインよりも5.5ポイント向上している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:01:20 GMT)
From Sparse Sensors to Continuous Fields: STRIDE for Spatiotemporal Reconstruction [3.3] 時空間デコーダを用いた高次元空間場を潜時状態にマッピングするフレームワークSTRIDEを提案する。
STRIDEは超高分解能をサポートし、超高分解能をサポートし、ノイズに対して頑健であることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:39:23 GMT)
Continual Learning through Control Minimization [3.2] タスクが逐次的にトレーニングされる場合、ニューラルネットワークにとって破滅的な忘れは依然として根本的な課題だ。
学習と保存の信号が競合する制御問題として継続学習を再構築する。
我々のフレームワークは、真の事前タスクの曲率を回復し、タスクの識別を可能にし、リプレイなしで標準ベンチマークにおける既存のメソッドよりも優れた性能を発揮する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:34:26 GMT)
From Fragmentation to Integration: Exploring the Design Space of AI Agents for Human-as-the-Unit Privacy Management [3.2] ユーザのクロスコンテキストなプライバシ課題を,12の半構造化インタビューを通じて調査する。
その結果、人々はアドホックな手動戦略を頼りにしながら、包括的なプライバシー管理を欠いていることが明らかになった。
ソリューションを探索するため、9つのAIエージェントの概念を生成し、116人の米国参加者による速度測定調査を通じて評価した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:12:37 GMT)
Revisiting Prompt Sensitivity in Large Language Models for Text Classification: The Role of Prompt Underspecification [3.2] 大型言語モデル (LLM) はゼロショットと少数ショットの分類器として広く使われている。
特定されていないプロンプトと特定の指示を提供するプロンプトの感度を研究・比較する。
命令プロンプトがそのような問題に苦しむのに対して、未特定プロンプトは、関連するトークンに対して高い性能のばらつきとロジット値の低下を示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:59:28 GMT)
From independent patches to coordinated attention: Controlling information flow in vision transformers [3.2] 我々は、視覚変換器において、注意によって伝達される情報を明示的かつ測定可能な量にする。
我々は、明示的な情報コストでモデルを訓練し、独立したパッチ処理から完全に表現力のあるグローバルアテンションまで制御可能なスペクトルを得る。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:33:24 GMT)
A principled framework for uncertainty decomposition in TabPFN [3.2] 本研究では,TabPFNにおける不確実性分解法を提案する。
予測更新のボラティリティによって決定される分散推定器をコンテキストに沿って導出する。
分類のためにエントロピーに基づく不確実性分解を得る。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:23:53 GMT)
In-situ benchmarking of fault-tolerant quantum circuits. I. Clifford circuits [3.1] そこで本研究では,フォールトトレラント回路の物理的および論理的誤差を,シンドロームデータを用いてその場で特徴付けることができることを示す。
本手法は, ゲート校正, 復号精度の向上, 論理回路の検証を支援するために, フォールトトレラント量子コンピュータを効率よく, その場で特徴付ける方法を提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:06:17 GMT)
Realistic adversarial scenario generation via human-like pedestrian model for autonomous vehicle control parameter optimisation [3.1] 公道での直接テストは、稀だが重要な相互作用に対して費用がかかり、安全ではない。
シミュレーションベースのテストでは、安全限界を探索するために敵シナリオが広く使用されている。
本稿では,認知にインスパイアされた歩行者モデルを用いた代替手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:57:40 GMT)
Digital signatures with classical shadows on near-term quantum computers [3.1] 古典的通信のみで動作する量子デジタル署名方式を導入する。
公開鍵から秘密鍵を学習する際の予測困難性を支持する理論的および数値的な証拠を提供する。
測定サンプルの数が増えるにつれて、ハードウェアで実証されたプリミティブは量子デジタルシグネチャの実証を実現する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:48:12 GMT)
EPPCMinerBen: A Novel Benchmark for Evaluating Large Language Models on Electronic Patient-Provider Communication via the Patient Portal [3.0] 本稿では,EPPC(Electronic patient-communication)データを解析するためのベンチマークであるEPPCMinerBenを紹介する。
EPPCMinerBenには、コード分類、サブコード分類、エビデンス抽出の3つのサブタスクが含まれている。
イェール・ニューヘイブン病院(Yale New Haven Hospital)の患者ポータルの752通のセキュアなメッセージから,1,933通の専門家注釈文を用いて,コミュニケーション意図と支援テキストの識別に関するLCMを評価した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:41:11 GMT)
DF-ACBlurGAN: Structure-Aware Conditional Generation of Internally Repeated Patterns for Biomaterial Microtopography Design [3.0] 内部的に繰り返し、周期的な構造を持つ画像を生成することの学習は、機械学習とコンピュータビジョンモデルに根本的な課題をもたらす。
本稿では, DF-ACBlurGANを提案する。
このアプローチは、周波数領域反復スケール推定、スケール適応型ガウスボケリング、および単位セル再構成を統合し、シャープな局所特徴と安定した大域周期性とをバランスさせる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:05:33 GMT)
Simulated Adoption: Decoupling Magnitude and Direction in LLM In-Context Conflict Resolution [3.0] 大規模言語モデル(LLM)は、既存のパラメトリックメモリよりもコンテクスト内での競合情報を優先することが多い。
モデルが「未学習」や内部の真理の大きさを抑えるのではなく、幾何変位のメカニズムを用いていることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:13:11 GMT)
How to Stop Playing Whack-a-Mole: Mapping the Ecosystem of Technologies Facilitating AI-Generated Non-Consensual Intimate Images [3.0] AIG-NCIIはイメージベースの性的虐待の一種で、女性や少女に不当に害を与える。
AIG-NCIIに対処するためには、産業、政策、アカデミア、市民社会全体にわたる賞賛すべき努力のパッチワークがある。
AIG-NCIIの11のカテゴリを地図化して分類する技術エコシステムとして,我々は最初の包括的AIG-NCII技術エコシステムに貢献する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:58:05 GMT)
A Dual-TransUNet Deep Learning Framework for Multi-Source Precipitation Merging and Improving Seasonal and Extreme Estimates [3.0] 衛星探査と再分析による多ソース降水生成物 (MSP) は, 温暖化モニタリングに広く利用されている。
我々は6つのMSPと4つのERA5物理予測器を統合する2段階のTransUNetベースのマルチソース降水統合フレームワーク(DDL-MSPMF)を開発した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:55:43 GMT)
Instance-optimal high-precision shadow tomography with few-copy measurements: A metrological approach [3.0] シャドウトモグラフィーの高精度化過程における試料の複雑さについて検討した。
我々は、$O(mathrmpolylog(d))$$のコピー数に一度に作用するアダプティブな測定値を使用する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:00:00 GMT)
DMS2F-HAD: A Dual-branch Mamba-based Spatial-Spectral Fusion Network for Hyperspectral Anomaly Detection [2.9] ハイパースペクトル異常検出(HAD)は,高次元ハイパースペクトル画像において,まれかつ不規則なターゲットを特定することを目的としている。
DMS2F-HADは,新しい2分岐マンバモデルである。
本アーキテクチャは,マンバの線形時間モデルを用いて,空間的特徴とスペクトル的特徴を効率よく学習する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:37:29 GMT)
Blockchain Technology for Public Services: A Polycentric Governance Synthesis [2.9] 本研究は2021年から2025年にかけて発行されたピアレビュー研究を体系的にレビューし、ブロックチェーン対応のパブリックサービスについて検討する。
デジタルアイデンティティ、電子投票、調達、ソーシャルサービスを含む主要なアプリケーションドメインを特定し、これらのイニシアチブを支えるガバナンスアレンジメントを分析する。
ブロックチェーンをコーディネートと情報共有のルールをエンコードするガバナンスインフラストラクチャとして捉えることで、この研究は、単純な採用基準を越えて、ディジタル政府理論を前進させる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:54:45 GMT)
OmniRad: A Radiological Foundation Model for Multi-Task Medical Image Analysis [2.9] 我々は、120万枚の医療画像に基づいて事前訓練された、自己監督型基礎モデルであるOmniRadを紹介する。
分類とセグメンテーションにまたがる幅広い公開ベンチマークで評価する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:38:51 GMT)
Multilingual Extraction and Recognition of Implicit Discourse Relations in Speech and Text [2.9] 暗黙の談話関係分類は文脈から意味を推測する必要があるため、難しい課題である。
本稿では,英語,フランス語,スペイン語の暗黙的談話関係のための多言語・多モーダルデータセットを構築するために,遠隔関係および非関連言語ペアの自動手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:50:27 GMT)
Model-Dowser: Data-Free Importance Probing to Mitigate Catastrophic Forgetting in Multimodal Large Language Models [2.8] タスク固有データに対する細調整型マルチモーダル言語モデル(MLLM)は、下流アプリケーションの性能向上に有効な方法である。
この問題を緩和しようとする既存の手法は、言語デコーダの深い層を微調整した場合や、モデルのサイズが大きくなるにつれて、効果が低下する。
本稿では,MLLMの新しい細粒度調整手法であるModel-Dowserを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:56:27 GMT)
Robust Generalizable Heterogeneous Legal Link Prediction [2.7] より堅牢な表現の学習のためのエッジドロップアウトと機能結合を含めることで、このアプローチを改善することができ、エラー率を最大45%削減できる。
また,適合性向上のための非対称デコーダを改良した多言語ノード機能に基づくアプローチを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:59:13 GMT)
Symmetric joint measurement as a complement to the elegant joint measurement [2.6] ここでは,0~1/2の共起性を有する2量子対称関節測定について述べる。
三角ネットワークにおける電流構造の対称性とその適用について検討する。
偶数量子ビットを持つマルチキュービット系に対して、2量子対称関節測定を一般化する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:16:29 GMT)
Demonstrating ARG-V's Generation of Realistic Java Benchmarks for SV-COMP [2.4] SV-COMPフォーマットでJava検証ベンチマークを自動的に生成するためのARG-Vツールの応用について述べる。
新たに生成された68の現実的なベンチマークセットにおいて、4つの主要なJava検証者は、既存のベンチマークスイートのパフォーマンスと比較して、正確さとリコールを減少させます。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:35:28 GMT)
QuantumGS: Quantum Encoding Framework for Gaussian Splatting [2.4] 本稿では,変分量子回路をガウススプラッティングパイプラインに統合する新しいフレームワークQuantumGSを紹介する。
本稿では,3次元方向データを表現するために,キュービットの自然な幾何学を利用して,ビュー方向をブロッホ球に直接マッピングするユニークな符号化手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:56:42 GMT)
Counterfactual Explanations for Hypergraph Neural Networks [2.3] ハイパーグラフニューラルネットワーク(HGNN)は、多くの現実世界システムにおける高次相互作用を効果的にモデル化する。
CF-HyperGNNExplainerを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:34:03 GMT)
Natural Language Instructions for Scene-Responsive Human-in-the-Loop Motion Planning in Autonomous Driving using Vision-Language-Action Models [2.3] doScenesは、noScenesのグラウンドトゥルースモーションにフリーフォーム命令をリンクする最初の実世界のデータセットである。
オープンソースMLLMベースのエンドツーエンド駆動フレームワークであるOpenEMMAを採用しています。
我々は、doScenesディレクティブを乗客スタイルのプロンプトとしてOpenEMMAのビジョン言語インタフェースに統合する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:44:56 GMT)
Scalable Generation and Validation of Isomorphic Physics Problems with GenAI [2.2] 生成AIを用いた大規模同型物理問題バンクの生成と評価のためのフレームワークを提案する。
我々の生成フレームワークは、構造的変動を正確に制御するために、即時連鎖とツールの使用を用いています。
事前デプロイ検証では、17のオープンソース言語モデル(LM)を用いて生成項目を評価し,実際の学生のパフォーマンスと比較した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:01:20 GMT)
Agentic AI in Healthcare & Medicine: A Seven-Dimensional Taxonomy for Empirical Evaluation of LLM-based Agents [2.2] 大規模言語モデル(LLM)に基づくエージェントは、医療や医療を計画し、使用し、行為を行う。
しかし、文献は概ね、広範な調査または単一の能力への狭い潜入である概要で構成されている。
我々は,認知能力,知識管理,相互作用パターン,適応と学習,安全と倫理,フレームワークの類型化,コアタスクとサブタスクという,7次元の分類学を用いた49の研究をレビューすることによって,この問題に対処する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:59:14 GMT)
Expected Moral Shortfall for Ethical Competence in Decision-making Models [2.2] 道徳的認知は、AIモデルにおける意思決定において決定的だが過小評価されていない側面である。
本稿では,AIモデルに倫理的能力を与える技術の比較分析を行う。
道徳の数学的離散化と実生活応用の実証は、他の技術に対して伝達され、テストされてきた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:37:03 GMT)
Scattering State Theory for One-dimensional Floquet Lattices [2.2] 拡張された1次元フロケ格子における散乱を解くためのフロケ移動行列法を開発した。
空間的断熱境界を設計することにより、マルチチャネルサイドバンド干渉を抑制する。
伝送シフトを直接検証するコールド原子ブラッグ散乱法と、量子化されたゼロバイアス電流プラトーを示す表面音響波誘起輸送法という2つの実験的実現法を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:24:37 GMT)
Decoupling Time and Risk: Risk-Sensitive Reinforcement Learning with General Discounting [2.2] 本稿では,分散RLにおける将来報酬のフレキシブルディスカウントとリスク対策の最適化を支援する新しいフレームワークを提案する。
以上の結果から, ディスカウントは, より表現力のある時間的・リスク的嗜好プロファイルを抽出する上で, 意思決定上の問題の基礎となるものと考えられる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:49:12 GMT)
Signal or 'Noise': Human Reactions to Robot Errors in the Wild [2.1] 現実の世界では、ロボットは頻繁にエラーを犯すが、実験室の外でのエラーに対する人々の社会的反応についてはほとんど知られていない。
私たちはコーヒーロボットを作り、公共の場に展開しました。
被験者は, 誤りやその他の刺激に反応して, 社会的信号の変動を連続的に表すことができた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:52:14 GMT)
Towards $2+1$D quantum electrodynamics on a cold-atom quantum simulator [2.1] 本稿では,スピン$S=1$ truncationにおける格子ゲージ理論の実現可能なコールド原子量子シミュレータを提案する。
我々は、この理論のボソニックな計算ベースへのマッピングを導出し、創発的なゲージ保護機構によって安定化する。
我々の研究は、高次元格子ゲージ理論をシミュレートするための実験的展望を著しく前進させる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:00:00 GMT)
XtraLight-MedMamba for Classification of Neoplastic Tubular Adenomas [1.9] XtraLight-MedMambaは、管状腺腫を分類するための超軽量な状態空間ベースのディープラーニングフレームワークである。
低品位尿細管腺腫患者から得られたキュレートデータセットを用いて評価した。
XtraLight-MedMambaの精度は97.18%、F1スコアは0.9767で約32,000のパラメータを使用した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:07:51 GMT)
Avoiding Premature Collapse: Adaptive Annealing for Entropy-Regularized Structural Inference [1.8] この障害の基本的なメカニズムは、 textbf Premature Mode Collapseである。
提案手法は,適応型スケジューリングアルゴリズムであるtextbfEfficient Piecewise Hybrid Adaptive Stability Control (EPH-ASC) で,推論過程の安定性をモニタする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:27:01 GMT)
The Label Horizon Paradox: Rethinking Supervision Targets in Financial Forecasting [1.7] 最適監視信号は予測目標から逸脱することが多く、市場ダイナミクスによって支配される中間地平線を横切る。
本稿では,一つのトレーニング実行内で最適なプロキシラベルを自律的に識別する,双方向最適化フレームワークを提案する。
大規模財務データセットの実験では、従来のベースラインよりも一貫した改善が示されている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:25:34 GMT)
Learning the Value Systems of Agents with Preference-based and Inverse Reinforcement Learning [1.7] Agreement Technologies(コンセンサス・テクノロジー)とは、自律的なソフトウェアエージェントが相互に対話するオープンコンピュータシステムを指す。
本研究では,観察と人間の実演から価値システムを自動的に呼び出す新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:07:15 GMT)
On the use of LLMs to generate a dataset of Neural Networks [1.7] 大規模な言語モデルを利用して、バリデーションのベンチマークとして機能するニューラルネットワークのデータセットを自動的に生成します。
合計608個のサンプルが生成され、それぞれが正確な設計選択に従っている。
ニューラルネットワークの信頼性と適応性の研究を進めるコミュニティを支援するために、データセットを公開しています。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:13:24 GMT)
The Needle is a Thread: Finding Planted Paths in Noisy Process Trees [1.6] 本稿では,2木間のファジィマッチングを求めるアルゴリズムを提案する。
人工的に生成したデータと実世界のデータセットのマイニングにおいて,これらが有用であることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:56:43 GMT)
Bayesian PINNs for uncertainty-aware inverse problems (BPINN-IP) [1.6] 提案手法はPINNを拡張し、期待されるNN出力の性質や重みに関する事前知識を考慮に入れている。
変形推論とモンテカルロのドロップアウトは、再構成された画像に対する予測手段と分散を提供するために用いられる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:42:57 GMT)
Scalable testing of quantum error correction [1.6] 階層化された断層注入と外挿を組み合わせたスケーラブルなアプローチを提案する。
我々のツールは、デスクトップ上で2時間の時間予算で物理的エラー率0.0005で17までスケールする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:36:04 GMT)
Real-time processing of analog signals on accelerated neuromorphic hardware [1.4] 本稿では,センサデータを処理するアナログ信号直接注入システムを提案する。
我々は、スパイクニューラルネットワークを用いて、データを聴覚コードに変換し、音源の位置を予測する。
我々は、サーボモータアクチュエータをプログラムして、騒音のピーク付近をリアルタイムにローカライズすることでこれを実証する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:07:54 GMT)
Separation-Utility Pareto Frontier: An Information-Theoretic Characterization [1.4] 本研究は, 実用性と分離の最適トレードオフ, 真の結果を条件に, 感度特性から予測的独立性を必要とする公正基準について検討する。
本研究は,条件付き相互情報(CMI)に基づく実験正則化器の開発である。
この研究は、深層学習における分離を強制するための、証明可能で安定的で柔軟なアプローチを提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:38:44 GMT)
Applying a Requirements-Focused Agile Management Approach for Machine Learning-Enabled Systems [1.4] 機械学習(ML)対応システムは、従来の要件工学(RE)とアジャイル管理に挑戦する。
既存のREとアジャイルのプラクティスは統合が不十分で、これらの特性に十分に適合していません。
本稿では,ML対応システムの継続的かつアジャイルな改善のための要件重視のアプローチであるRefineMLの適用経験について報告する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:49:02 GMT)
It's not a Lottery, it's a Race: Understanding How Gradient Descent Adapts the Network's Capacity to the Task [1.4] 勾配降下がこれを実現するメカニズムについて検討する。
トレーニング後にしばしばキャパシティを削減できる理由を説明する3つのダイナミックな原則を特定します。
具体的には、宝くじの予測の背後にあるメカニズムや、あるニューロンの特定の有益な初期条件が、より高い重量ノルムをもたらす理由を具体的に説明する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:22:40 GMT)
Forget to Generalize: Iterative Adaptation for Generalization in Federated Learning [1.3] 我々は、異種環境における一般化を促進する新しい訓練パラダイム、IFA(Iterative Federated Adaptation)を提案する。
CIFAR-10、MIT-Indoors、Stanford Dogsのデータセットに対する実験は、提案手法がグローバルな精度を改善することを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:27:15 GMT)
EchoJEPA: A Latent Predictive Foundation Model for Echocardiography [1.3] 我々は,3K患者の心エコー図を1800万回トレーニングした基礎モデルであるEchoJEPAを提示する。
遅延予測の目的を活用することで、EchoJEPAはスペックルノイズを無視した堅牢な解剖学的表現を学ぶ。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:15:20 GMT)
Graph--Theoretic Analysis of Phase Optimization Complexity in Variational Wave Functions for Heisenberg Antiferromagnets [1.2] 位相再構成HAFはNPハードの最悪のケースであり、波動関数の符号構造と最適化の直接的なリンクを提供する。
これは位相再構成HAFがNPハードの最悪のケースであり、波動関数の符号構造と最適化の直接的なリンクを提供することを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:53:18 GMT)
When Code Becomes Abundant: Redefining Software Engineering Around Orchestration and Verification [1.2] 私たちは、ソフトウェアエンジニアリングは意図の明細化、アーキテクチャ制御、検証について再定義する必要があると論じています。
この変化は、説明責任の崩壊を中心的なリスクとして導入し、研究の優先順位、教育カリキュラム、産業プラクティスに根本的な変化を必要とする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:18:53 GMT)
Probabilistic NDVI Forecasting from Sparse Satellite Time Series and Weather Covariates [1.2] 植生動態の正確な短期予測は、精密農業におけるデータ駆動型意思決定支援の鍵となる。
衛星観測によるNDVIの予測は、雲の被覆によって引き起こされるスパースと不規則なサンプリングのため、依然として困難である。
本研究では,フィールドレベルのNDVI予測のための確率的予測フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:48:52 GMT)
Locally Gentle State Certification for High Dimensional Quantum Systems [1.1] 量子統計的推論の標準的なアプローチは、波動関数の崩壊を引き起こす測定に依存する。
我々は,学習アルゴリズムがトレースノルムで少なくとも$$$の摂動を制約する,局所的な量子状態認証の限界について検討する。
本研究は,情報抽出と状態乱れのトレードオフを明らかにし,量子学習における物理計測制約とプライバシ機構の深い関係を明らかにする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:41:11 GMT)
ReFRAME or Remain: Unsupervised Lexical Semantic Change Detection with Frame Semantics [1.1] 本研究では,フレームのセマンティクスに基づく意味変化検出手法を開発した。
本手法は意味変化の検出に有効であり,多くの分布意味モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:00:49 GMT)
Visual concept ranking uncovers medical shortcuts used by large multimodal models [1.1] 大規模マルチモーダルモデル(LMM)において重要な視覚概念を識別する手法を提案する。
臨床皮膚画像から悪性皮膚病変を分類する作業に主に焦点をあてる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:27:34 GMT)
ARIA: Adaptive Retrieval Intelligence Assistant -- A Multimodal RAG Framework for Domain-Specific Engineering Education [1.1] ARIAは、大学レベルのコースにまたがってインテリジェントな教育アシスタントを作成するためのフレームワークである。
ARIAは、60の非関連クエリのうち58を拒否しながら、関連する20のコースの質問に正しく答えた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:08:24 GMT)
Greedy-Gnorm: A Gradient Matrix Norm-Based Alternative to Attention Entropy for Head Pruning [1.1] グレディ・グラディエント・ノルム(グレディ・グラディエント・ノルム、Greedy-Gradient norm、Greedy-Gnorm、Greedy-Gnorm、Greedy-Gnorm、Greedy-Gnorm)は、ヘッド・プルーニング・アルゴリズムである。
BERT, ALBERT, RoBERTa, XLM-RoBERTaの実験は、グリーディ・グノームが実質的な頭部除去の下で常に精度を保っていることを示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:28:22 GMT)
Depth-Wise Emergence of Prediction-Centric Geometry in Large Language Models [1.1] 本稿では,デコーダのみの大規模言語モデルが,文脈処理から予測生成段階への遷移を示すことを示す。
幾何学的解析と機械的介入を組み合わせた統一的な枠組みを用いて,遅延層表現がトークン予測を選択的に因果制御できる構造的幾何符号を実装していることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:00:16 GMT)
Causal explanations of outliers in systems with lagged time-dependencies [1.0] 本研究では,Budhathoki et al.[2022]の因果根起因解析法を一般時間依存システムに適用する。
時間依存システムに存在する無限依存グラフを扱うための2つのトランケーション手法について論じる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:37:40 GMT)
Comparative Insights on Adversarial Machine Learning from Industry and Academia: A User-Study Approach [1.0] 本稿では,産業専門家と学生の様々な機械学習の脆弱性とその教育戦略について考察する。
最初の調査では、専門家によるオンライン調査を行い、サイバーセキュリティ教育とAMLの脅威に対する懸念との間に顕著な相関が示された。
第2の研究では、自然言語処理と生成AIの概念を実装した2つのCTF課題を開発し、トレーニングデータセットに対する有害な攻撃を実証した。
これらの課題の有効性は、カーネギーメロン大学の学部生や大学院生を対象に調査を行い、CTFベースのアプローチがAMLの脅威に効果的に関与することを発見した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:51:50 GMT)
Accelerating the Tesseract Decoder for Quantum Error Correction [1.0] Tesseractは量子エラー補正のための新しいMLEデコーダである
本稿では,低レベル性能向上によるTesseractデコーダの最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:52:54 GMT)
Thermal State Simulation with Pauli and Majorana Propagation [0.9] We adapt Pauli and Majorana propagation to imaginary-time evolution in the Schrdinger picture。
高温状態はパウリベースやマヨラナベースではスパースであり、無限の温度で恒等式に近づくことができる。
我々は,小係数トランケーションとパウリウェイト(マヨラナ長)トランケーション戦略の解析的保証を提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:59:02 GMT)
The Supportiveness-Safety Tradeoff in LLM Well-Being Agents [0.9] 大規模言語モデル(LLM)が社会支援ロボット(SAR)に統合されている
支持度は異なるが, システムプロンプトは3つに6つのLSMを比較検討した。
強力なバリデーションのプロンプトは 安全性を著しく低下させます 場合によっては あらゆる領域に注意を払っています
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:15:43 GMT)
Dual Mind World Model Inspired Network Digital Twin for Access Scheduling [0.9] 本稿では,Dual Mind World Model (DMWM) アーキテクチャにインスパイアされた新しいDigital Twin対応スケジューリングフレームワークを提案する。
従来のルールベースや純粋にデータ駆動のポリシーとは異なり、提案されたDMWMは短期水平予測計画とシンボリックモデルベースのロールアウトを組み合わせたものである。
以上の結果から, バースト, 干渉制限, 期限に敏感な環境において, DMWMは優れた性能を発揮することがわかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:53:55 GMT)
Availability Attacks Without an Adversary: Evidence from Enterprise LANs [0.8] 本稿では、ユーザエンドポイントの定期ドッキングとアンロックが、Rapid Spanning Tree Protocol (RSTP) の制御面の急激な再計算を繰り返し引き起こすことを示す、実運用型LANの実証的研究について述べる。
プロトコルに準拠してはいないが、これらのイベントは、従来のセキュリティ監視によってほとんど検出されずに、リアルタイムストリーミング(音声とビデオ)サービスを劣化させる、およそ2-4秒の一時的な転送障害をもたらす。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:01:07 GMT)
A labeled dataset of simulated phlebotomy procedures for medical AI: polygon annotations for object detection and human-object interaction [0.8] 本発明のデータ記事は、トレーニングアーム上で実行される模擬血液抽出(咽頭切開)手順を記録した11,884個のラベル付き画像のデータセットを提示する。
制御条件下で記録された高精細ビデオから画像を抽出し、冗長性を低減するためにキュレートした。
それぞれの画像には、注射器、ゴムバンド、消毒剤ワイプ、手袋、トレーニングアームの5つの医学関連クラスのポリゴンアノテーションが含まれている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:54:46 GMT)
Discovering Mechanistic Models of Neural Activity: System Identification in an in Silico Zebrafish [0.8] 幼魚ゼブラフィッシュのシミュレーションを基礎として, ニューラルネットワークの力学モデルをテストする。
LLMをベースとした木探索では,予測基準値を大幅に上回る予測モデルが自律的に発見された。
我々の洞察は、現実世界のニューラル記録をモデル化するためのガイダンスを提供し、AI駆動の科学的発見のためのより広範なテンプレートを提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:33:29 GMT)
Differentiable Inverse Graphics for Zero-shot Scene Reconstruction and Robot Grasping [0.8] 我々は,ニューラルネットワークモデルと物理に基づく微分可能レンダリングを組み合わせて,ゼロショットシーン再構成とロボットの把握を行う,微分可能なニューログラフィックモデルを提案する。
我々のアプローチは、新しい環境におけるよりデータ効率が高く、解釈可能で、一般化可能なロボット自律性への道筋を提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:33:50 GMT)
Generative AI in Systems Engineering: A Framework for Risk Assessment of Large Language Models [0.8] LLM(Large Language Models)の利用の増加は、エンジニアリングライフサイクル全体にわたって大きなチャンスをもたらします。
本稿では,システム工学環境におけるLLMの適用性を評価するための構造化アプローチであるLLM Risk Assessment Framework(LRF)を紹介する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:30:11 GMT)
Multi Objective Design Optimization of Non Pneumatic Passenger Car Tires Using Finite Element Modeling, Machine Learning, and Particle swarm Optimization and Bayesian Optimization Algorithms [0.8] 非空気圧タイヤは空気圧タイヤに代わる有望な代替手段を提供する。
彼らの不連続な話構造は、剛性、耐久性、高速振動の課題を提示する。
本研究は,UPTIS型スポーク旅客車両を最適化するための統合生成設計と機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:15:33 GMT)
Radar-Inertial Odometry For Computationally Constrained Aerial Navigation [0.7] 本稿では,IMUとレーダの情報を融合するために,レーダ・慣性オドメトリー(RIO)アルゴリズムを提案する。
本研究では, 深層学習の進歩を活かして, スパース・ノイズの多いレーダ点雲中の3次元点対応を検索する方法を示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:03:26 GMT)
Mapping the Web of Science, a large-scale graph and text-based dataset with LLM embeddings [0.7] 大きなテキストデータセットは、テキスト自体とセマンティクスを通じて伝達される情報と、リンク、参照、共有属性を通じて他のテキストとの関係という2つのタイプの特徴を継承する。
本稿では,ウェブ・オブ・サイエンス・データセットの新しい埋め込み手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:02:32 GMT)
Linguistically Informed Evaluation of Multilingual ASR for African Languages [0.7] We evaluate three speech encoder on two African languages by complementing WER with Feature Error Rate (FER), and add a tone-aware extension (TER)。
fer と TER は,単語レベルの精度が低い場合でも言語的に有意な誤りパターンを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:28:04 GMT)
Convolution Operator Network for Forward and Inverse Problems (FI-Conv): Application to Plasma Turbulence Simulations [0.7] 複雑な時間的力学において,システムの進化を予測し,パラメータを推定できるフレームワークを提案する。
FI-ConvはU-Netアーキテクチャ上に構築されており、ほとんどの畳み込み層はConvXt V2ブロックに置き換えられている。
長谷川-若谷方程式による乱流プラズマ場予測におけるFI-Convの性能評価を行った。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:33:36 GMT)
Multi-Cue Anomaly Detection and Localization under Data Contamination [0.7] 本稿では,適応的偏差学習パラダイムに限定的な異常監視を組み込んだ頑健な異常検出フレームワークを提案する。
本フレームワークは, 各種データ汚染下での強い検出・局所化性能, 解釈可能性, 堅牢性を実現する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:10:48 GMT)
Pruning for Generalization: A Transfer-Oriented Spatiotemporal Graph Framework [0.6] グラフベースの時系列予測モデルを改善するため,TL-GPSGNTを提案する。
情報理論および相関に基づく基準を用いて,構造的情報的部分グラフを抽出する。
TL-GPSGNTは低データ転送シナリオにおけるベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:41:29 GMT)
JSynFlow: Japanese Synthesised Flowchart Visual Question Answering Dataset built with Large Language Models [0.6] JSynFlowは日本のフローチャートのための合成ビジュアルQAデータセットである。
本稿では、データセットの手順を詳述し、JSynFlowによる微調整により、VLMの性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:24:32 GMT)
Evaluating the Presence of Sex Bias in Clinical Reasoning by Large Language Models [0.6] 大規模言語モデル(LLM)は、ドキュメント、教育、臨床決定支援のための医療にますます組み込まれている。
本研究では,現代LPMが臨床推論における性差を示し,モデル構成がこれらの行動にどのように影響するかを検討した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:21:38 GMT)
Hand Gesture Recognition from Doppler Radar Signals Using Echo State Networks [0.6] ハンドジェスチャ認識(HGR)はヒューマンコンピュータインタラクション(HCI)の基本技術である
特に、ドップラーレーダー信号に基づくHGRは車内インタフェースやロボットシステムに適している。
本稿では、周波数変調連続波(FMCW)レーダ信号を用いたレーダベースHGRに対するエコー状態ネットワーク(ESN)アプローチを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:11:05 GMT)
Post-Quantum Identity-Based TLS for 5G Service-Based Architecture and Cloud-Native Infrastructure [0.6] 量子後IDベース暗号化(IBE)に基づく,プライベート分散システムのための証明書不要認証フレームワークを提案する。
本設計では,認証と署名に基づく認証をID由来の鍵とIDに基づく鍵カプセル化に置き換え,証明書の送信や検証なしに相互に認証されたTLS接続を可能にする。
このフレームワークをクラウドネイティブなアプリケーションデプロイメントとレイテンシに敏感な5G Coreネットワークに適用する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:55:41 GMT)
HoloEv-Net: Efficient Event-based Action Recognition via Holographic Spatial Embedding and Global Spectral Gating [0.6] イベントベース行動認識(EAR)は,高時間分解能と高ダイナミックレンジのイベントカメラにより注目されている。
既存の手法は, (i) 密度ボクセル表現の計算冗長性, (ii) マルチブランチアーキテクチャに固有の構造冗長性, (iii) グローバルな動きパターンを捉えるためのスペクトル情報の未利用性に悩まされている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 03:42:42 GMT)
ProDCARL: Reinforcement Learning-Aligned Diffusion Models for De Novo Antimicrobial Peptide Design [0.5] 抗微生物抵抗性は医療の持続性を脅かし、抗微生物ペプチド(AMP)の低コストな計算発見を動機付ける
本稿では,AMP活性およびペプチド毒性を示す配列特性予測器と拡散型タンパク質生成器を結合した強化学習フレームワークであるProDCARLを紹介する。
サイリコ実験では、ProDCARLは微調整後の平均AMPスコアを0.081から0.178に上昇させる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:28:09 GMT)
Expert Selections In MoE Models Reveal (Almost) As Much As Text [0.5] 本稿では,Mixix-of-Experts (MoE)言語モデルに対するテキスト再構成攻撃を提案する。
MoEモデルでは、各トークンは専門家の選択から専門家トークンのサブセットにルーティングされる。
これらのルーティング決定は、これまで理解されていたよりもはるかに多くの情報をリークすることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:42:30 GMT)
Scaling Multiagent Systems with Process Rewards [0.5] AIフィードバック(MAPPA)によるプロセスごとの報酬を考慮したマルチエージェントシステムを提案する。
我々は,競合数学問題とツール拡張データ解析タスクに対するアプローチを実証する。
データ解析タスクでは,品質指標が最大47%向上する一方,成功率を+16.7pp向上させる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:14:54 GMT)
A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization [0.5] 本稿では,各ステップ毎に,学習者の目標とするスキルに対する理解を深める可能性が最も高いエクササイズを選択することで,個別化されたエクササイズ列を生成する手法を提案する。
オンライン数学学習プラットフォームからのデータを用いて、より高度なスキル向上に関連するエクササイズを推奨し、学習者間の差異に効果的に適用する。
教育的な観点から、このフレームワークは大規模にパーソナライズされた実践を可能にし、一貫した学習価値を持つエクササイズを強調し、インストラクターが追加的なサポートの恩恵を受けることができる学習者を特定するのに役立つ。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:14:53 GMT)
Impact of diversity on bounded archives for multi-objective local search [0.5] この研究は、MOOPのためのメタヒューリスティックの開発に関連する2つの重要な課題に取り組みます。
非支配的な解の指数的成長とメタヒューリスティックスの傾向は、パレートフロントの部分集合にその探索を不均等に集中させる。
第1に、非支配的なソリューションの増加を効果的に管理するための戦略メカニズムとして、境界付きアーカイブが使用される。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:47:14 GMT)
Two-chart Beltrami Optimization for Distortion-Controlled Spherical Bijection with Application to Brain Surface Registration [0.4] 球面ベルトラミ微分 (SBD) は、単位球面の準同型自己写像の2文字表現である。
BOOSTは、2つのBeltramiフィールドを更新してタスク駆動損失を最小限に抑えつつ、歪みを規則化し、シームに沿って一貫性を強制する、微分可能な最適化フレームワークである。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:38:39 GMT)
When Does Adaptation Win? Scaling Laws for Meta-Learning in Quantum Control [0.4] 量子ハードウェアは、固有のデバイスの不均一性と環境ドリフトに悩まされている。
メタラーニングのスケーリング法則を導出し、適応の利得が勾配のステップとともに指数関数的に飽和することを示す。
古典的線形四元数制御のさらなる検証は、これらの法則が量子特異物理学よりも一般的な最適化幾何学から現れることを確認している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:14:39 GMT)
Trojan Attacks on Neural Network Controllers for Robotic Systems [0.4] 本稿では,ニューラルネットワークに対するバックドア(トロイジャン)攻撃について検討する。
コントローラ内に組み込むことができる軽量で並列なトロイの木馬ネットワークを設計する。
その結果、提案攻撃の有効性を確認し、ニューラルネットワークに基づくロボット制御システムが潜在的に重大なセキュリティ脅威にさらされていることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:12:22 GMT)
No One-Size-Fits-All: Building Systems For Translation to Bashkir, Kazakh, Kyrgyz, Tatar and Chuvash Using Synthetic And Original Data [0.4] ロシア・バシュキル、ロシア・カザフ、ロシア・キルギス、イングリッシュ・タタール、イングリッシュ・チュヴァシュの5つのテュルク語対の機械翻訳について検討する。
合成データにLoRAを用いた微調整 nllb-200-distilled-600M はカザフ語では chrF++ 49.71 、バシュキル語では 46.94 を達成した。
DeepSeek-V3.2で類似のサンプルを検索すると、ChuvashではchrF++ 39.47が達成された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:14:29 GMT)
Allocate Marginal Reviews to Borderline Papers Using LLM Comparative Ranking [0.3] 本稿では,大規模なMLカンファレンスは,受理境界付近の論文に限界レビュー能力を割り当てるべきである,と論じる。
本稿では,人間レビュー前の境界線帯域を識別し,割り当てられた時点での言語レビュアー容量を割り当てるための比較ランキングを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 07:12:42 GMT)
Near-frustration-free electronic structure Hamiltonian representations and lower bound certificates [0.3] 総和二乗階層に基づくハミルトン表現は、基底状態エネルギーの厳密な下界を与える。
この研究は、SOS分解と変分二粒子還元密度行列(v2RDM)理論を結合する統一的な枠組みを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:42:37 GMT)
Taming multiparty entanglement at measurement-induced phase transitions [0.3] トラップイオンネイティブMIPTの大規模数値シミュレーションを行う。
真の多党交絡(GME)と2,3,4党の分離の堅牢な崩壊を明らかにする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:01:04 GMT)
Interfaze: The Future of AI is built on Task-Specific Small Models [0.3] 現代LLMアプリケーションをコンテキスト上で構築および動作する問題として扱うシステムであるInterfazeを提案する。
このスタックの上に薄いコントローラがあり、単一のOpenAIスタイルのエンドポイントを公開する。
このアーキテクチャでは、Interfaze-BetaはMMLU-Proで83.6%、MMLUで91.4%、GPQA-Diamondで81.3%、LiveCodeBench v5で57.8%、AIME-2025で90.0%を達成している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:36:37 GMT)
I Can't Believe It's Not a Valid Exploit [0.2] 我々は,大規模言語モデルによるJavaセキュリティ脆弱性に対するPoC生成フレームワークPoC-Gymを開発した。
静的解析ツールによるガイダンスがPoC生成の成功率を向上させるか否かを評価し,結果のPoCを手作業で検査する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 02:59:03 GMT)
Pluralism in AI Governance: Toward Sociotechnical Alignment and Normative Coherence [0.2] この研究は、フルスタックアライメント、価値の厚みモデル、バリューセンシティブデザイン、パブリックコンスティチューションAIなどのフレームワークを合成する。
価値、メカニズム、戦略をリンクする階層化されたフレームワークを導入し、公正性対効率、透明性対セキュリティ、プライバシ対株式といった緊張関係をマッピングする。
この研究は、AIガバナンスの全体的、価値に敏感なモデルに貢献し、社会技術システムに公開価値を埋め込むための積極的なメカニズムとして規制を緩和する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:28:56 GMT)
Beyond Learning on Molecules by Weakly Supervising on Molecules [0.2] 我々の適応化学埋め込みモデル(ACE-Mol)は、ラベル付き弱いモチーフから学習する。
計算が簡単でスケールしやすい自然言語記述子。
ACE-Molは、解釈可能で化学的に意味のある表現を持つ分子特性予測ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:03:20 GMT)
Towards Understanding and Avoiding Limitations of Convolutions on Graphs [0.2] 我々は、メッセージパッシングニューラルネットワーク(MPNN)の詳細な理論的解析を提供する。
我々はMPNNの性能を制限するいくつかの重要な特性を同定する。
これらの欠点に対処するフレームワークをいくつか提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:21:18 GMT)
Unmasking Superspreaders: Data-Driven Approaches for Identifying and Comparing Key Influencers of Conspiracy Theories on X.com [0.1] 新型コロナウイルス(COVID-19)パンデミックによる700万件以上のツイートを利用して、ヒューマンスーパースプレッダーとボットの主な違いを分析します。
スーパースプレッダーは、ハッシュタグや絵文字のような構造要素に頼らずに、より複雑な言語や実体的コンテンツを使う傾向がある。
ボットは、よりシンプルな言語と戦略的なハッシュタグのクロスユースを好んでおり、アクセシビリティを高め、トレンドの議論に浸透し、リーチを拡大する可能性がある。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:36:18 GMT)
Quantum-Assisted Design of Space-Terrestrial Integrated Networks [0.1] 宇宙空間統合ネットワーク(STIN)の設計と最適化を,ハイブリッド量子古典的手法を用いて検討する。
衛星選択問題(SSP)、ゲートウェイ選択問題(GSP)、スペクトル割り当て問題(SAP)の3つの主要な最適化問題を定式化する。
中性原子量子プロセッサを用いて、SSPを最大ウェイト独立セット問題にマッピングし、Aquilaプラットフォームに埋め込み、量子アディアバティックアルゴリズム(QAA)を介してそれを解く。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:18:10 GMT)
Machine Learning-Driven Crystal System Prediction for Perovskites Using Augmented X-ray Diffraction Data [0.1] X線回折(XRD)スペクトルによる結晶系の予測は材料科学における重要な課題である。
本研究では,高度なモデルを活用する機械学習(ML)駆動のフレームワークを提案する。
このモデルは、立方晶系、点群3mとm-3m、空間群PnmaとPnnnを含む対称性クラスに対して高い性能を示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:09:51 GMT)
Supervised Learning as Lossy Compression: Characterizing Generalization and Sample Complexity via Finite Blocklength Analysis [0.1] 本稿では,機械学習における一般化に関する情報理論の新たな視点について述べる。
固定ランダム化学習アルゴリズムにおけるサンプルの複雑さと一般化誤差の低い境界を導出する。
情報理論境界理論と安定性理論で見いだされる既存の指標と理論上の関係を示すために、過度に適合する項を分解する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 00:45:01 GMT)
ARC-AGI-2 Technical Report [0.1] ARC (Abstraction and Reasoning Corpus) はパターンマッチング以上の一般化を評価するために設計された。
本稿では、ニューラルネットワークと構造認識の事前処理とオンラインタスク適応を組み合わせることにより、ARC性能を向上させるトランスフォーマーベースシステムを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:03:56 GMT)
Requirements for Teleportation in an Intercity Quantum Network [0.1] 都市間ネットワークトポロジにおける量子テレポーテーションのハードウェア要件について検討する。
具体的には、エンドツーエンドの望まれるテレポーテーション忠実度を2/3ドルで達成するためには、最先端以上の最小限の改善が必要であることを確認します。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:56:48 GMT)
ImmuVis: Hyperconvolutional Foundation Model for Imaging Mass Cytometry [0.1] 質量校正法(IMC)の効率的な畳み込み基盤モデルであるImmuVisを提案する。
ImmuVisは学習マーカー埋め込みから畳み込みカーネルを生成し、単一のモデルを任意のマーカーサブセット上で再トレーニングすることなく動作させることができる。
これらの結果は、ImmuVisを実世界のIMCモデリングのための実用的で効率的な基礎モデルとして位置づけている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:11:33 GMT)
Artificial Intelligence as Strange Intelligence: Against Linear Models of Intelligence [0.0] 我々は2つの新しい概念「ファミリア・インテリジェンス」と「ストレンジ・インテリジェンス」を紹介する。
AIが奇妙な知性であるなら、最も有能なシステムでさえ、明らかなタスクで失敗することがあると期待すべきである。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:19:36 GMT)
Dynamic Simulations of Strongly Coupled Spin Ensembles for Inferring Nature of Electronic Correlations from Nuclear Magnetic Resonance [0.0] 我々は核磁気共鳴スピンエコー実験のシミュレーションのための効率的なパッケージを開発した。
相互作用する核アンサンブルの力学を探求し、システムの重要な振る舞いについて議論する。
電子相関の領域と異方性を推測するためにパッケージを使用できる明確な例を示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:18:36 GMT)
Why Agentic-PRs Get Rejected: A Comparative Study of Coding Agents [0.0] 本稿では,コーディングエージェント(Agentic-PRs)を用いたプルリクエストが,エージェントとしてラベル付けされていないPR(Human-PRs)よりも少ない頻度で受け入れられていることを示す。
拒否されたPRの多くは明確なフィードバックを欠いているため、拒否理由を決定するのが困難である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:24:18 GMT)
Vistas of Algebraic Probability: Quantum Computation and Information [0.0] コルモゴロフの確率の基盤は測度空間、$-代数、確率測度を基本対象とする。
より広範な定式化は、区別された線型汎函数を備えた確率変数の代数によって提供される。
このアプローチは、初期の確率ですでに暗黙的なアイデアの現代的な読解と見なすこともできる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:19:11 GMT)
Verification and Identification in ECG biometric on large-scale [0.0] 本研究は心電図(ECG)バイオメトリックスを大規模に研究する。
我々は、運用メトリクスとプロトコルによる大規模評価の不足という、文献における重要なギャップに対処する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:47:07 GMT)
VERA-MH: Reliability and Validity of an Open-Source AI Safety Evaluation in Mental Health [0.0] メンタルヘルス(VERA-MH)評価における倫理的かつ責任のあるAIの検証は、証拠に基づく自動安全ベンチマークの緊急の必要性を満たすために最近提案された。
本研究は,自殺リスク検出および応答におけるAI安全性に対するVERA-MH評価の臨床的妥当性と信頼性を検討することを目的とした。
Findingsは、メンタルヘルスのためのオープンソースで完全に自動化されたAI安全評価であるVERA-MHの臨床的妥当性と信頼性をサポートする。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:17:04 GMT)
Unbiased Single-Queried Gradient for Combinatorial Objective [0.0] 計算問題の確率論的再構成では、ハイパーキューブよりも最適化されることが多い。
我々は、偏りのない勾配を提案し、関数の単一のクエリしか必要としない。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:08:07 GMT)
UGA-SSMRPT2 -- A Multireference Perturbation Theory Predicting Accurate Electronic Excitation Energies in Diverse Molecular Systems [0.0] UGA-SSMRPT2(英: UGA-SSMRPT2)は、ムカージーの状態-特異多重参照結合クラスタ理論のスピンフリー摂動アナログである。
この研究は、UGA-SSMRPT2が励起エネルギーを計算するための正確で安価なフレームワークであることを実証している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:53:53 GMT)
Toward Reliable and Explainable Nail Disease Classification: Leveraging Adversarial Training and Grad-CAM Visualization [0.0] 本稿では,爪疾患の自動分類のための機械学習モデルを提案する。
4つの有名なCNNモデル、InceptionV3、DenseNet201、EfficientNetV2、ResNet50がトレーニングされ分析された。
インセプションV3の精度は95.57%、DenseNet201は94.79%だった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:08:13 GMT)
Topological frustration and quantum resources [0.0] 本稿では,TFの存在下でのいくつかの量子資源の挙動について論じる。
非フラストレーションのものと比べ、TFは安定で非局在化されたトポロジカルな励起のため、これらの資源に明確な寄与を付加することを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:00:02 GMT)
Tighter Asymptotic Key Rates for Intensity-Correlated Decoy-State QKD via Nonlinear Programming [0.0] 実際のソースは、ラウンド全体で相関する強度のドリフトを示し、潜在的に強度情報をリークし、リニアプログラムへの標準のデコイ状態の還元を破ることができる。
まず、内点非線形IPOPTを用いてパラメータ推定の完全な問題を解き、得られた候補解を鍵レートの有効な下限を証明した外解器の線形化点として利用する。
粗粒度モデル非依存相関と微粒化ガウスモデルの両方のシミュレーションは、正準基準点よりも一貫した鍵レート境界を示し、場合によっては、両方の最適化段階が一致するときに最適性を証明することができる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:00:05 GMT)
Thermodynamic Cost of Regeneration in a Quantum Stirling Cycle [0.0] 我々は,標準的な弱結合型マルコフ開量子系における再生量子スターリング熱エンジンサイクルについて検討した。
サイクル効率を改良することにより、必要な作業入力を明示的な再生コストとして扱う。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:29:20 GMT)
The Birthmark Standard: Privacy-Preserving Photo Authentication via Hardware Roots of Trust and Consortium Blockchain [0.0] 既存の認証アプローチであるCoalition for Content Provenance and Authenticity (C2PA)は、画像ファイルに直接暗号的に署名されているが、重大な障害に悩まされている。
本研究では,Non-Uniformity correct(NUC)マップとPRNUパターンから製造・一様センサエントロピーを利用した認証アーキテクチャであるBirthmark Standardを提案する。
キャプチャ中に、カメラは、キーテーブルアーキテクチャを介してデバイスアイデンティティを公開することなく、センサーの信頼性を証明する匿名認証証明書を作成する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:16:03 GMT)
TestMigrationsInPy: A Dataset of Test Migrations from Unittest to Pytest [0.0] UnittestとpytestはPythonで最も人気のあるテスティングフレームワークである。
単純なアサーション、フィクスチャの再利用、相互運用性などだ。
本稿では,単体テストからピテストへのテストマイグレーションのデータセットであるTestMigrationsInPyを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 23:14:17 GMT)
Tabula RASA: Exposing and Breaking the Relational Bottleneck in Transformers [0.0] RASA(Relation-Aware Sparse Attention)は、リレーショナル推論のための構造的帰納バイアスを提供する最小限のアーキテクチャ修正である。
以上の結果から,複雑性理論解析に基づく最小限のアーキテクチャ変更は,マルチホップ推論を大幅に改善できることが示された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:02:18 GMT)
Supporting software engineering tasks with agentic AI: Demonstration on document retrieval and test scenario generation [0.0] 2つのソフトウェアエンジニアリングタスクにエージェントAIソリューションを導入します。
まず,詳細な要件記述から自動テストシナリオ生成のためのソリューションを開発した。
第2に、ソフトウェア工学文書の文脈における文書検索タスクのためのエージェントAIソリューションを開発した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:33:16 GMT)
Stochastic hierarchical data-driven optimization: application to plasma-surface kinetics [0.0] この研究は、物理モデルの効率的な校正のために、スロッピーモデル理論にインスパイアされた階層的最適化フレームワークを導入する。
我々は、最小のシミュレーションクエリを用いて、厳密なパラメータ部分空間を特定し、ターゲットとするヘッセン近似を削減した。
プラズマ-表面相互作用問題に適用し,その枠組みを検証した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:03:40 GMT)
Squeezing Enhanced Sagnac Sensing based on SU(1,1) Quantum Interference [0.0] 本稿では,スケザリング型サニャック干渉計の簡易かつ頑健な設計を提案する。
サニャックループ内に光学パラメトリック増幅器(OPA)を戦略的に配置することにより、光は前方と後方の両方に自動的に絞り込まれる。
我々の分析は、最も現実的な損失と検出器非効率の条件下での超古典的感度を示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:24:25 GMT)
Smart Diagnosis and Early Intervention in PCOS: A Deep Learning Approach to Women's Reproductive Health [0.0] 多嚢胞性卵巣症候群(Polycystic Ovary syndrome, PCOS)は、生殖年齢の女性に広くみられる疾患である。
本稿では,卵巣超音波画像の分類のための伝達学習に基づく強力なフレームワークを設計する。
このモデルは、嚢胞感染および非感染患者の3856個の超音波画像を含むオンラインデータセットでトレーニングされた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:58:21 GMT)
Scalable Explainability-as-a-Service (XaaS) for Edge AI Systems [0.0] 本稿では,説明可能性を扱う分散アーキテクチャであるExplainability-as-a-Service (X)を提案する。
重要なイノベーションは、エッジデバイスが説明の要求、キャッシュ、検証を可能にする説明生成から推論を分離することです。
Xは3つの現実世界のデプロイメントで高い説明品質を維持しながら、レイテンシを38%削減する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:28:57 GMT)
Same Input, Different Scores: A Multi Model Study on the Inconsistency of LLM Judge [0.0] 本研究は, GPT-4o, GPT-4o-mini, Gemini-2.5-Flash, Claude-Haiku-4.5, Claude-Sonnet-4.5の5モデルに対して, 評価安定性を系統的に評価した。
3つの疑問に対処する: 繰り返し実行されるモデルのスコアがどの程度安定しているか、モデルが異なる入力のスコアがどの程度異なるか、温度がスコアの一貫性にどのように影響するか。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:03:08 GMT)
SPEAR: An Engineering Case Study of Multi-Agent Coordination for Smart Contract Auditing [0.0] スマートコントラクト監査のための多エージェント協調フレームワークSPEARを提案する。
エージェントは、AGMに準拠したリビジョンによって更新された地域信条を維持し、交渉およびオークションプロトコルを介して調整し、新しい情報が利用可能になるにつれて計画を改訂する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 10:51:19 GMT)
SAFE: Stable Alignment Finetuning with Entropy-Aware Predictive Control for RLHF [0.0] LM-RLHF設定のためのポリシーアクター批判RL法を新たに開発した。
悲観的値推定のための二重ソフトミニ批判を組み合わせた新しいRLHFアルゴリズムであるSAFE(Stable Alignment Finetuning with Entropy-aware Control)を提案する。
本手法は計算オーバーヘッドを最小限に抑え,解釈可能な耐クラッシュ性RLHFフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:26:44 GMT)
RexBERT: Context Specialized Bidirectional Encoders for E-commerce [0.0] RexBERTは、Eコマースセマンティクス向けに設計されたBERTスタイルのエンコーダのファミリーである。
Ecom-niverseは、様々な小売やショッピングソースからキュレートされた350億のトークンコーパスです。
我々は17Mから4MまでのRexBERTモデルをトレーニングし、トークン分類、意味的類似性、一般的な自然言語理解タスクに基づいて評価する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:32:37 GMT)
Review of Superconducting Qubit Devices and Their Large-Scale Integration [0.0] 量子コンピュータ、超伝導、ジョセフソン接合の基礎を概観する。
次に、超伝導量子ビットが有用な量子コンピュータとして機能するために必要な条件であるDiVincenzoの基準に関する重要な技術と概念を紹介する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:19:32 GMT)
Reshaping Perception Through Technology: From Ancient Script to Large Language Models [0.0] AIは人工知能ではなく、新しいメディアとして理解されていると我々は主張する。
我々は、フレキシブルな展開と共同創造の共有論理を通じて認知を形作る技術の流れを辿る。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:45:16 GMT)
Reducing the labeling burden in time-series mapping using Common Ground: a semi-automated approach to tracking changes in land cover and species over time [0.0] 我々は、時間ステップt0のみから参照データにアクセス可能なモデルが、t0と将来の時間ステップt1の両方で競合的に実行可能であることを示す。
この結果は、初期時間ステップ t0 を超えて参照ラベルを手動で更新する必要なく、効果的な時間的一般化を実現することができることを示唆している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:49:36 GMT)
Real and momentum space analysis of topological phases in 2D d-wave altermagnets [0.0] 本研究は, 二次元d波磁気学における位相位相の包括的解析を行う。
スピン分割, 有効反磁性強度を解析し, これらの相の輸送性について検討した。
この研究は、反磁性材料における「エッジトロニクス」の理論的および情報理論の枠組みを確立する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:40:39 GMT)
REDistill: Robust Estimator Distillation for Balancing Robustness and Efficiency [0.0] 本稿では、ロバスト統計に基づく原則化されたフレームワークであるREDistillを紹介する。
レディスティルは標準のKD目標をKL分散の一般化であるパワー分散損失に置き換える。
CIFAR-100 と ImageNet-1k の実験では、REDistill は多様な教師/学生アーキテクチャにおける生徒の精度を一貫して向上することを示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:50:53 GMT)
Qudit Twisted-Torus Codes in the Bivariate Bicycle Framework [0.0] 有限長量子低密度パリティチェック (LDPC) 符号を, ねじれ境界条件を持つ2次元トーラスの変換不変CSS構造から検討した。
探索された有限サイズの場合、ツイスト・トーラス・クディット構造は典型的には、解けないものよりも大きな距離を達成できる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:15:51 GMT)
Quantum computational imaging and sensing [0.0] 本稿では,電磁場における量子情報のコヒーレントな処理を行うために,量子コンピュータを用いたイメージングとセンシングを行う新しいフレームワークを提案する。
光通信用コヒーレント受信機の設計を例に,このフレームワークについて述べる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:36:48 GMT)
Quantum Key Distribution with Imperfections: Recent Advances in Security Proofs [0.0] 量子鍵分配(QKD)は、2つの空間的に分離されたパーティが情報理論的に安全な暗号化を確立することを可能にする。
広範囲の盗聴戦略に対して堅牢なセキュリティ証明は、いくつかのQKDプロトコルの理論的健全性を確立している。
ほとんどの証明は、そのようなプロトコルに関わる物理系の理想化されたモデルに基づいており、実際的な実装では満たされない仮定を含むことが多い。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:16:33 GMT)
Quantum Advantage in Decision Trees: A Weighted Graph and $L_1$ Norm Approach [0.0] 本稿では,重み付きグラフとして単一クエリ量子決定木の定式化を提案する。
量子決定木の出力のスペクトルノルムの高額なL_1$は、その古典的基準を上回るために必要な条件である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:10:54 GMT)
Quantifying the Operational Cost of Multipartite Entanglement [0.0] マルチパーティの絡み合いは、多体量子系における相互作用の強さと範囲を決定する。
N-粒子系のk = N-粒子エンタングルメントを定量化する一般的な方法を提案する。
我々は、重要な二分的絡み合い尺度を一般化する、新たに定義されたk-部分的絡み合いを解析的に計算する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:58:44 GMT)
Pure narrowband photon-pair generation in a monolithic cavity [0.0] フォトニック量子技術は純粋な単一光子の効率的な源を必要とする。
本稿では,高スペクトル・空間純度に最適化されたモノリシックキャビティ内のSPDC単光子源について述べる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:19:15 GMT)
PriMod4AI: Lifecycle-Aware Privacy Threat Modeling for AI Systems using LLM [0.0] PriMod4AIは、2つの構造化された知識ソース、確立された分類を表すLINDDUN知識ベース、およびLINDDUN外の脅威を捉えるモデル中心のプライバシ攻撃知識ベースを統一するハイブリッドプライバシ脅威モデリングアプローチである。
このフレームワークは、古典的およびAI駆動の視点を統合した、正当化された分類に基づく脅威評価を生成する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:58:19 GMT)
Pre-optimization of quantum circuits, barren plateaus and classical simulability: tensor networks to unlock the variational quantum eigensolver [0.0] 変分量子アルゴリズムは基底状態を作成するための実践的なアプローチであるが、量子優位性の可能性はまだ不明である。
微分可能2次元テンソルネットワーク(TN)を用いて、横フィールドイジングモデル(TFIM)の基底状態を作成するパラメータ化量子回路を最適化する。
システムサイズに比例して指数関数的に縮小しない拡張勾配帯にアクセスできることにより,TN事前最適化がバレン高原問題を緩和できることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:49:55 GMT)
Photonic entanglement enhanced multidimensional spectroscopy for probing exciton correlations: theory and applications to photosynthetic aggregates [0.0] 本稿では,光子対拡大多次元分光法を提案する。
超高速時間スケールでのエキシトン-エキシトン相互作用と相関に敏感である。
これらの知見は多光子絡み合いを用いたマルチエキシトン力学の探索に利用できる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:56:46 GMT)
PhoQuPy: A Python framework for Automation of Quantum Optics experiments [0.0] 量子材料中の単一光子エミッタ(SPE)の同定とキャラクタリゼーションのための共焦点フォトルミネッセンス(PL)走査システムを提案する。
装置は、試料をレーザーで励起し、走査パターン内の各空間座標のスペクトルを取得する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:52:32 GMT)
Optimizing What We Trust: Reliability-Guided QUBO Selection of Multi-Agent Weak Framing Signals for Arabic Sentiment Prediction [0.0] アラビア語のソーシャルメディアにおけるフラーミングの検出は、解釈的曖昧さ、文化的根拠、限られた信頼できる監督のために困難である。
本稿では,ラベル融合からデータキュレーションへ焦点を移す信頼性に配慮した弱い監視フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:19:43 GMT)
Optimal Control Design Guided by Adam Algorithm and LSTM-Predicted Open Quantum System Dynamics [0.0] 長期記憶ニューラルネットワーク(LSTM-NN)は、オープン量子システムの時間進化を正確に予測することができる。
オープン量子系における高速かつ効率的な最適制御設計のための最適制御フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:08:12 GMT)
On the emergence of classical stochasticity [0.0] パウリ型マスター方程式によって支配される量子系における古典性の出現の論理構造について検討する。
この仮定は、持続時間や到着時刻などの中間時間の標準計算に不可欠であることを示す。
次に、量子力学から古典性がどのように現れるかを説明するために、いわゆる超脱コヒーレンス限界における単一粒子、ボソン、フェルミオンの例を考える。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:04:11 GMT)
Noise-Resilient Quantum Chemistry with Half the Qubits [0.0] 本稿では, 半量子量子対角化法であるHSQDを導入する。
HSQDはIBM量子ハードウェア上でのSQDの精度と一致する。
その結果、半量子SQDは強相関化学における実用的な量子優位性へのノイズ耐性と資源効率の経路として確立された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 08:53:26 GMT)
Neural Sentinel: Unified Vision Language Model (VLM) for License Plate Recognition with Human-in-the-Loop Continual Learning [0.0] この研究は、ライセンスプレートの認識、状態分類、車両抽出を1つの前方パスで特徴付ける新しい統一的なアプローチであるNeural Sentinelを提案する。
我々の主な貢献は、Low-Rank Adaptation (LoRA)を介して適応された微調整のPaliGemma 3Bモデルが、車両画像に関する複数の視覚的疑問に同時に答えられることを示すことである。
このシステムは、予測エラー(ECE)0.048で152msの平均推定遅延を達成し、信頼度の高い推定値を示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:04:15 GMT)
Multi-threaded Recast-Based A* Pathfinding for Scalable Navigation in Dynamic Game Environments [0.0] 本稿では、Recastベースのメッシュ生成、Bezier曲線軌道平滑化、および群集協調のための密度解析により標準A*を向上するマルチスレッドフレームワークを提案する。
実験により,1000個の同時エージェントで350以上のFPSを維持し,密度認識経路の調整により衝突のない群集ナビゲーションを実現することを確認した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:47:18 GMT)
Model-Driven Legacy System Modernization at Scale [0.0] 本稿では,レガシシステムモダナイゼーションに対するモデル駆動型アプローチを提案する。
分析、濃縮、合成、遷移の4段階のプロセスは系統的に抽出、抽象、変換を行う。
機能的動作と不可欠な非機能的特性を保ちながら、コアユーザインターフェースコンポーネントとページ構造を半自動でモダンなWebスタックに移行できることを示します。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:07:20 GMT)
Minimal Hamiltonian deformations as bulk probes of effective non-Hermiticity in Dirac materials [0.0] 非エルミート的(NH)ディラック半金属は開ゲイン-ロス系を記述するが、実スペクトルを特徴とする電荷中立性モデルはしばしばエルミート的に見える。
ここでは, 有効非ハーモニティの応答に基づく診断は, 最小の擬似ローレンツ対称性破壊変形を用いて定式化できることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:48:06 GMT)
Mechanistic Evidence for Faithfulness Decay in Chain-of-Thought Reasoning [0.0] Chain-of-Thoughtの説明は、言語モデルが複雑な問題を解決する方法を理解するために広く使われている。
モデルの意思決定プロセスに個別の推論ステップが忠実かどうかを測定する指標である正規化論理差判定(NLDD)を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 21:55:57 GMT)
Lyapunov Constrained Soft Actor-Critic (LC-SAC) using Koopman Operator Theory for Quadrotor Trajectory Tracking [0.0] 強化学習は複雑な意思決定問題の解決において大きな成功を収めた。
標準アルゴリズムは振動や非有界状態の発散を引き起こす物理系に報酬を与える。
リアプノフに基づく安定性保証をRLアルゴリズムに組み込むことで大きな研究がなされている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:51:05 GMT)
Low resource entanglement classification from neural network interpretability [0.0] 絡み合いは量子情報と量子技術の中心的な資源である。
機械学習は有望な代替手段として登場し、不完全な測定データから絡み合う特徴を可能にする。
2量子状態と3量子状態の絡み合い分類のための統一的で解釈可能なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:42:45 GMT)
LitS: A novel Neighborhood Descriptor for Point Clouds [0.0] 本稿では,2次元および3次元点雲のための新しい近傍記述子LitSを紹介する。
LitS'ドメインの各要素は、局所参照システムに対する方向を表す。
任意の方向でLitSを評価することで、同じ方向を中心とするコーンのような領域の隣人の数に関する情報が得られます。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:31:02 GMT)
Limitations of an approximative phase-space description in strong-field quantum optics [0.0] この近似位相空間記述を導入し、その正確性について議論する。
駆動レーザーの量子光学特性を古典状態の非コヒーレントな混合体にすることで誤特性化することを発見した。
この近似位相空間記述を用いることで、量子光学オブザーバブルを誤認識できることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:47:11 GMT)
Laws of Learning Dynamics and the Core of Learners [0.0] 本稿では,エントロピーに基づく生涯学習手法を提案する。
本研究は,トランスファーベースの敵攻撃を防御する免疫機構を構築することにより,その効果を評価する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:27:47 GMT)
Large-Ensemble Simulations Reveal Links Between Atmospheric Blocking Frequency and Sea Surface Temperature Variability [0.0] 大気の遮蔽現象は、中緯度で持続的な気象の極端を誘導する。
SST変動はブロッキング周波数に有意かつ物理的に解釈可能な影響を及ぼす。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:08:19 GMT)
Large Language Models in Software Documentation and Modeling: A Literature Review and Findings [0.0] 我々は、ドキュメントやモデリングに関連するソフトウェア工学タスクにおいて、大規模言語モデルの使用に関する文献レビューを行う。
地域の4つの主要な会場からの記事を分析し、それらが解決したタスクごとに整理し、使用済みのプロンプト技術、メトリクス、人間に基づく評価へのアプローチ、および主要なデータセットの概要を提供する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:21:50 GMT)
LID Framework: A new method for geospatial and exploratory data analysis of potential innovation deter-minants at the neighborhood level [0.0] 地域ごとの重要な要因を特定するために,ローカルイノベーション決定因子データベースとフレームワークを開発した。
ニューヨーク州とマサチューセッツ州の地区を、社会要因、経済特性、土地利用と移動性、形態学、環境の4つの側面で検討する。
結果は、代替データソースは、イノベーションのダイナミクスに関する洞察を高めるために、重要かつ未調査の可能性を秘めていることを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:52:27 GMT)
Ising-Induced Spectral Broadening Resolves the Relaxation Bottleneck in Superradiant Masers [0.0] 対角的イジング相互作用は,本質的な単一粒子のデファスティングを超越した,深い不均一な拡張を生じさせることを示す。
この強い対角性障害は共鳴フリップフロップ交換を抑制し、スペクトル拡散に利用可能な状態の密度を効果的に正規化する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:31:20 GMT)
Information, Dissipation, and Planckian Optimality [0.0] 我々は、「散逸した」作業が有限温度で量子多体状態の区別可能な変化を生じさせる効率の普遍的な境界を導出する。
プランクアン散乱器は最適の端に座っており,情報伝達効率が崩壊する前に最大緩和率を示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:00:00 GMT)
Influence of environment on quantum correlations in two-spin systems with dipole-dipole interactions [0.0] 環境がシステムスピンのデファス化のみを引き起こす場合、最も単純な場合を考える。
エンタングルメントの依存性と緩和率の量子不一致を求める。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:15:54 GMT)
Influence of Noninertial Dynamics on Static Quantum Resource Theories [0.0] 非慣性効果と完全に正のトレース保存(CPTP)マップの等価性を示す。
この定式化において、ウンルー効果はボソニックアンプチャネルと等価である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:35:34 GMT)
Infinite multiverses and where to find them? [0.0] 量子物理学では、我々が知っている規則は適用されない。
このような現象、すなわちコペンハーゲンの解釈と量子物理学の多世界解釈の2つについて検討する。
私たちはまた、異なる宇宙で歩き回っている人のコピーがたくさんあるのか、なぜ会ったことがないのかという疑問に答えようとします。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:08:03 GMT)
Inference-Time Reasoning Selectively Reduces Implicit Social Bias in Large Language Models [0.0] 大規模言語モデル(LLM)における推論可能な推論が暗黙のバイアスに与える影響について検討する。
提案手法により,15のステレオタイプを対象とするモデルクラスに対するIAT型評価における暗黙バイアスが有意に低減されることが判明した。
この研究は、認知科学と心理学の理論が、方法論的および解釈的なフレームワークを提供することで、AI評価研究を補完する方法について強調する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:44:23 GMT)
In models of spontaneous wave-function collapse, why only fermions collapse, not bosons? [0.0] STM-原子から、純粋にボソニックな部分セクターが自己随伴ハミルトニアンを持つことが示される。
これにより、GTD内の第一原理機構が提供され、なぜフェルミオン性自由度のみが崩壊チャネルとして働くのかが説明される。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:16:55 GMT)
Human-Centered Explainable AI for Security Enhancement: A Deep Intrusion Detection Framework [0.0] 本稿では,深層学習モデルの透明性を高めるために,説明可能な人工知能(XAI)を統合した新しいIDSフレームワークを提案する。
このフレームワークはベンチマークデータセットNSL-KDDを用いて実験的に評価され、従来のIDSやブラックボックス深層学習モデルと比較して優れた性能を示した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 20:33:27 GMT)
How to Train Your Resistive Network: Generalized Equilibrium Propagation and Analytical Learning [0.0] 我々はKirchhoffの法則に対するグラフ理論および解析フレームワークを用いて勾配を計算するアルゴリズムを開発した。
数値シミュレーションを用いて本アルゴリズムを実証し,全ての抵抗のレプリカやリードアウトを必要とせずに,出力層のみにレジストレータネットワークをトレーニング可能であることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 06:41:53 GMT)
Generalized quantum theory for accessing nonlinear systems: the case of Levinson-Smith equations [0.0] 奇数の対称性と奇数の対称性を持つ微分方程式のリナール族は、アベル形式に変換されたとき閉形式解を認めた。
私たちが遭遇する微分方程式の他のクラスは、基礎となるパラメータの特定の組み合わせに対するヤコビ楕円函数を含む解について話す。
この結果の興味深いオフショットは、システム内の平準面の状態からソリトニック様の溶液が出現することである。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:48:15 GMT)
From Lemmas to Dependencies: What Signals Drive Light Verbs Classification? [0.0] 軽動詞構成 (LVCs) は、特にトルコ語において、動詞の多語表現の難易度クラスである。
本稿では,モデル入力を体系的に制限することで,どの信号がLVC分類を駆動するかを問う。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:41:11 GMT)
From Florence to Fermions: a historical reconstruction of the origins of Fermi's statistics one hundred years later [0.0] この論文の目的は、若いエンリコ・フェルミ(Enrico Fermi)が理想的な単原子気体の統計に関する論文を書くきっかけとなった経路を追究することである。
この発見は、絶対エントロピー定数(英語版)において、彼が形式的な時代から示していた彼の興味に端を発する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 12:10:23 GMT)
FADE: Selective Forgetting via Sparse LoRA and Self-Distillation [0.0] FADE(Fast Adapter for Data Erasure)は,画像生成のための2段階のアンラーニング手法である。
FADEはまず、勾配ベースの唾液度を使用して、忘れセットに最も責任を持つパラメータを識別する。
第2段階では、FADEは、忘れられた概念をユーザ定義のサロゲートで上書きする自己蒸留の目的を適用している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:38:51 GMT)
Exploiting contextual information to improve stance detection in informal political discourse with LLMs [0.0] 本研究では,大規模言語モデル(LLM)を用いた非公式オンライン談話における政治的姿勢検出について検討した。
実世界の政治フォーラムデータセットを用いて、ユーザのイデオロギー的傾向、繰り返しトピック、言語パターンを要約した構造化プロファイルを生成する。
文脈的プロンプトは、+17.5%から+38.5%に改善され、従来のアプローチを超越した74%の精度を実現している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:49:26 GMT)
Entanglement improves coordination in distributed systems [0.0] 分散システムにおけるコーディネートは、しばしば通信遅延によって妨げられ、性能が低下する。
本研究では,2つのサーバからなる分散システムにおける共有絡み合いの双対最適化問題への適用について検討する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:14:41 GMT)
Enhanced QKNorm normalization for neural transformers with the Lp norm [0.0] クエリとキーベクトルの正規化は、Transformerアーキテクチャの重要な部分である。
QKNorm正規化スキームの一般化を提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:45:39 GMT)
Enforcing Monotonic Progress in Legal Cross-Examination: Preventing Long-Horizon Stagnation in LLM-Based Inquiry [0.0] 大規模言語モデル (LLM) は印象的な言語流布を示すが、明示的な手続き的制約の下で長期タスクを確実に完了させることに苦慮している。
我々は、外部決定論的状態制御器を介して蓄積されたキー情報ユニット(KIU)のモノトニック進行を強制する、ニューロシンボリックアーキテクチャであるSoft-FSMを提案する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 04:44:56 GMT)
Enabling large-scale digital quantum simulations with superconducting qubits [0.0] デジタル量子シミュレーションは、量子化学、凝縮物質物理学、材料科学などの分野を変換することができる。
フォールトトレラントな量子コンピュータの長期的解は、主に量子ビット数のオーバーヘッドのために、自分自身の誤りを正すことはできない。
この論文は、完全な計算スタックにまたがる量子シミュレーションを進める方法を探究することによって、このより広範な努力に寄与する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:29:55 GMT)
Emergence of Krylov complexity through quantum walks: An exploration of the quantum origins of complexity [0.0] グラフ上の量子ランダムウォークとKrylov/spread複雑性の関係について検討する。
後者の定義は、グラフをチェーンに還元する標準的な方法によって自然に現れることを示す。
この識別を用いて、既知の複雑性特徴を持つシステムの特別なクラスに対応するグラフの族を構築する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:00:00 GMT)
Efficient time-evolution of matrix product states using average Hamiltonians [0.0] 時間依存ハミルトニアンの力学をシミュレートするために,既存のMPSアルゴリズムを簡易かつ効率的に拡張する手法を提案する。
我々の研究は、時間依存ハミルトニアンの影響下でのQMBSの効率的なシミュレーションの道を開いた。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:00:01 GMT)
Effect of initial intrasystem entanglement on entropy growth in generalized Jaynes-Cummings models [0.0] 初期のシステム内絡み合いは、フォトニック環境と相互作用する原子系のエントロピーに影響を及ぼす。
本研究では, 純粋なハールランダム状態と混合ハールランダム状態, 固定平均エネルギーあるいは固定混合状態のアンサンブル, 環境における初期光子数などの初期系状態のアンサンブルについて考察する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:34:27 GMT)
Dynamical Regimes of Multimodal Diffusion Models [0.0] 本稿では,Ornstein-Uhlenbeck過程をトラクタブルモデルとして用いた,結合拡散モデルの理論的枠組みを提案する。
重要な予測は同期ギャップ'であり、異なる固有モードが異なる速度で安定化する逆生成過程の時間窓である。
本研究では,結合強度がスペクトルフィルタとして機能し,時間的階層の調整が可能であることを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:16:12 GMT)
Dynamical Quantum Phase Transitions in Boundary Time Crystals [0.0] 散逸型集団スピンモデルにおける動的量子相転移(DQPT)の存在を実証する。
我々は、DQPTがランププロトコルの下で持続し、続いて最終ハミルトニアンによるユニタリ進化が続くことを示す。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:42:42 GMT)
Does the entropy of systems with larger internal entanglement grow stronger? [0.0] システムが環境と相互作用するとき、システムに含まれる絡み合いが再分配されることが知られている。
一方, システムと環境との絡み合いは, システムのエントロピーと密接に関係している。
また, 絡み合い深度はエントロピー成長に寄与することが示唆された。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 09:14:02 GMT)
Distributed Quantum Error Mitigation: Global and Local ZNE encodings [0.0] 分散量子コンピューティングにおけるゼロノイズ補間(ZNE)の挙動について検討する。
ZNEは優れたスケーラビリティを示し、6つの量子処理ユニット(QPU)に対して最大48%の誤差削減を実現する。
これらの知見は、分散量子エラー軽減における基本的なトレードオフを浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:12:07 GMT)
Dicke Superradiance in Extended 2D Quantum Arrays Coupled to Metasurface Bound States in the Continuum [0.0] ディック超放射能(Dicke superradiance)は、それぞれのエミッタの独立したエミッタの総和を超えて、量子エミッタのアンサンブルからの放出がコヒーレントに増強される集合現象である。
この研究は、物理的に拡張された量子エミッタアレイにおける協調放出の上限を実現するための物理的に実行可能なプラットフォームとして、BICをサポートする光メタ曲面を前進させる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 14:57:58 GMT)
Deterministic Retrieval at Scale: Optimal-Space LCP Indexing and 308x Energy Reduction on Modern GPUs [0.0] 長さLのN配列に対するLCP(Longest Common Prefix)類似性に基づく決定論的トップk検索について検討した。
O(N*L) 空間を O(L+k) クエリ時間で表す。
次に,サーマル・アウェア・ロジック(TAL)を導入し,プレフィックス構造を範囲境界スキャンに変換する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:40:42 GMT)
Democratic Preference Alignment via Sortition-Weighted RLHF [0.0] DemPOはアルゴリズムのソートを施したフレームワークで、市民アセンブリを構成するのと同じメカニズムを好みに基づく微調整に応用する。
我々はLlamaモデルを,各スキームで微調整された10億から80億のパラメータに評価した。
これらの結果は、選好収集段階における人口統計学的代表性を高めることは、ポストホック補正よりも、代表者から引き出された価値を反映した行動がより良く反映されるモデルが得られることを示している。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:59:24 GMT)
Deep Learning CNN for Pneumonia Detection: Advancing Digital Health in Society 5.0 [0.0] 肺炎は深刻な世界的な健康問題であり、高い死亡率と死亡率に寄与している。
本研究では,胸部X線画像から肺炎を自動的に検出する深層学習に基づく畳み込みニューラルネットワーク(CNN)を開発した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:16:47 GMT)
Cross-Attention Transformer for Joint Multi-Receiver Uplink Neural Decoding [0.0] 我々はOFDM信号の連成復号化のためのクロスアテンション変換器を提案する。
共有受信者エンコーダは、受信された各グリッド内の時間周波数構造を学習する。
トークンワイドのクロスアテンションモジュールは、受信機を融合させ、標準チャネルデコーダに対してソフトなログライクな比率を生成する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:34:48 GMT)
Correspondence between classical and quantum resonances [0.0] 分子ハミルトニアン非線形系では励起エネルギーが増加するにつれて分岐が起こる。
本稿では, 異性化系CN-Li$leftrightarrows$Li-CNにおけるこれらの古典共鳴の量子表現について検討する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:42:44 GMT)
Contrastive Continual Learning for Model Adaptability in Internet of Things [0.0] IoT(Internet of Things)デプロイメントは、センサドリフトなどの要因がアプリケーションユーティリティに影響を与えるような、非定常な動的環境で動作する。
連続学習(CL)は、破滅的な忘れをせずにモデルに時間をかけて適応することでこの問題に対処する。
コントラスト学習は、自己管理的な方法で堅牢性とサンプル効率を改善する強力な表現学習パラダイムとして登場した。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 18:59:14 GMT)
Constraints on stability and renormalization group flows in nonequilibrium matter [0.0] 量子情報不等式を用いた非平衡系の再正規化群流と相の安定性に関する制約を導出する。
これらの制約は、古典対称性破壊状態におけるデコヒーレンス駆動遷移や、2次元における強-弱対称性破壊臨界性など、いくつかの例を通して説明される。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 19:00:03 GMT)
Conditional Counterfactual Mean Embeddings: Doubly Robust Estimation and Learning Rates [0.0] 実測結果の条件分布をヒルベルト空間(RKHS)に埋め込む枠組みを提案する。
本フレームワークでは,RKHS値の回帰を考慮したCCME用2段階メタ推定器を開発した。
本実験は,条件付き対実分布のマルチモーダル構造を含む分布特性を精度良く再現できることを実証する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:40:29 GMT)
Communication Enhances LLMs' Stability in Strategic Thinking [0.0] 安価でコストのかかるプレプレイメッセージが戦略的安定性に影響を及ぼすかどうかを評価する。
研究対象のモデル-コンテキストペアリングの大部分に対して,トラジェクティブノイズの連続的な低減を実証する。
コミュニケーションは有害な不安定性をもたらすことはめったにないが、いくつかの文脈固有の例外を文書化し、コミュニケーションが安定性を損なう限られた領域を特定する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:12:52 GMT)
Benchmarking Quantum and Classical Algorithms for the 1D Burgers Equation: QTN, HSE, and PINN [0.0] 本稿では1次元バーガー方程式をシミュレーションするための量子ネットワーク(QTN)、流体力学シュルディンガー方程式(Difference)、物理情報ニューラルネットワーク(PINN)の比較ベンチマークを提案する。
我々は、N=4$から128$までのグリッド解決におけるソリューションの正確性、実行時のスケーリング、リソースオーバーヘッドを分析します。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 05:57:27 GMT)
Autodiscover: A reinforcement learning recommendation system for the cold-start imbalance challenge in active learning, powered by graph-aware thompson sampling [0.0] この論文では、適応エージェントによって駆動されるオンライン意思決定問題として、アクティブな学習を再構成するフレームワークであるAutoDiscoverを紹介している。
26-dataset SynERGYベンチマークでは、AutoDiscoverは静的ALベースラインよりも高いスクリーニング効率を実現している。
エージェントの決定を解釈し、検証し、診断するための、オープンソースのビジュアル分析ダッシュボードであるTS-Insightも導入しています。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 22:16:50 GMT)
Approaches to Semantic Textual Similarity in Slovak Language: From Algorithms to Transformers [0.0] 本稿ではスロバキア語に適用される文レベルSTS法の比較評価を行う。
従来のアルゴリズムの出力を特徴として、いくつかの機械学習モデルをトレーニングしました。
また、CloudNLPによる微調整モデル、OpenAIの埋め込みモデル、GPT-4モデル、事前訓練されたBarberBERTモデルなど、いくつかのサードパーティツールの評価を行った。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 15:35:16 GMT)
Alignment Drift in Multimodal LLMs: A Two-Phase, Longitudinal Evaluation of Harm Across Eight Model Releases [0.0] マルチモーダル・大規模言語モデル (MLLM) は現実世界のシステムにますます導入されているが、その安全性は相変わらず探索されていない。
そこで本研究では,26名のプロレッドチームによる726名の相手プロンプトの固定ベンチマークを用いて,MLLMの無害度を2段階評価する。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:42:02 GMT)
Agnostic Parameter Estimation with Large Spins [0.0] 典型的な量子センサーは、未知の回転を行う量子ビットを含むが、ここでは未知の回転角が推定されるパラメータである。
良く知られた制限は、回転軸が未知であれば、最大量子フィッシャー情報は達成できないということである。
ここでは、大きなスピンプローブとアンシラの絡み合いを利用して、回転角を推定するための最適な量子フィッシャー情報を得る。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:51:04 GMT)
A simple means for deriving quantum mechanics [0.0] ある種の特有な性質を持つメカニクスが提示される。
一方、操作の物理的記述と規則は理解しやすく直感的に明確である。
他方では、非相対論的量子力学の観測可能な全ての予測を完全に満たしている。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 13:16:07 GMT)
A logical re-conception of neural networks: Hamiltonian bitwise part-whole architecture [0.0] 本稿では,操作ルールと学習ルールを併用したアーキテクチャを用いて,関係を直接表現するシンプルな初期動作システムを提案する。
グラフ-ハミルトン作用素は、すべての関係制約の同時満足度を示す基底状態を持つエンコーディング間のエネルギーを計算する。
結果として生じる非伝統的なアーキテクチャは、標準のANNの例を処理できるだけでなく、シンボリック計算の特徴を示す表現も生成できる。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 01:16:37 GMT)
A Quantum-inspired Hybrid Swarm Intelligence and Decision-Making for Multi-Criteria ADAS Calibration [0.0] 本研究は,QiHSI(Quantum-Inspired Hybrid Swarm Intelligence)に基づく新しい最適化フレームワークを提案する。
QiHSIは、量子にインスパイアされたメカニズムを使用して、地球規模の探索能力を強化し、複雑な高次元決定空間における人口の多様性を維持する。
その結果、QiHSIはインテリジェントADASキャリブレーションに対して信頼性が高くスケーラブルなアプローチを提供することがわかった。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 17:26:49 GMT)
A Framework of Critical Success Factors for Agile Software Development [0.0] この体系的な文献レビューは、アジャイルプロジェクトの重要な成功要因(CSF)を特定します。
チームの効率性とプロジェクト管理が最もよく引用されるCSFとして現れました。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 11:56:11 GMT)
"Be My Cheese?": Cultural Nuance Benchmarking for Machine Translation in Multilingual LLMs [0.0] 本稿では,機械翻訳における文化的ローカライゼーションを評価するための大規模評価ベンチマークを提案する。
言語毎に5つのネイティブスピーカーレーダを持つ15言語を対象に,多言語大言語モデル (LLM) を7つ評価した。
GPT-5 (2.10/3)、Claude Sonnet 3.7 (1.97/3)、Mistral Medium 3.1 (1.84/3)は破滅的な失敗が少ない最強の層である。
論文参考訳(メタデータ) (Wed, 04 Feb 2026 16:35:48 GMT)