EvoRoute: Experience-Driven Self-Routing LLM Agent Systems [100.6] EvoRouteは、静的で事前定義されたモデルの割り当てを超越する、自己進化型のモデルルーティングパラダイムである。
挑戦的なエージェントベンチマークの実験によると、既製のエージェントシステムに統合されたEvoRouteは、システムのパフォーマンスを維持または向上するだけでなく、実行コストを最大80%削減し、レイテンシを70%以上削減する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:06:46 GMT)
FFP-300K: Scaling First-Frame Propagation for Generalizable Video Editing [97.4] FFP-300Kは、720p解像度と81フレームの高忠実度ビデオペアの大規模データセットである。
本稿では,第1フレームの外観維持とソース映像の動作保存の緊張を解消する,真の誘導不要なFFPのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:17:15 GMT)
From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence [91.5] エピプレキシティ(英: Epiplexity)とは、計算的に境界付けられた観測者がデータから学べるものを捉える情報の形式化である。
計算によってどのように情報を生成するか、データの順序にどのように依存するか、そしてモデリングがデータ生成プロセス自体よりも複雑なプログラムを生成する可能性を示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:04:03 GMT)
VTONQA: A Multi-Dimensional Quality Assessment Dataset for Virtual Try-on [83.4] VTONQAはVTON用に設計された最初の多次元品質評価データセットである。
11の代表的なVTONモデルによって生成される8,132の画像と、3つの評価次元にわたる24,396の平均世論スコア(MOS)を含んでいる。
VTONモデルとさまざまな画像品質評価(IQA)メトリクスのベンチマークを行い、既存の手法の限界を明らかにした。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:42:26 GMT)
MMFormalizer: Multimodal Autoformalization in the Wild [79.2] MMFormalizerは、適応グラウンドを現実の数学的および物理的ドメインのエンティティと統合することにより、テキスト以外の自動形式化を拡張する。
MMFormalizerを新しいベンチマークであるPhyX-AFで評価し,MathVerse,PhyX,Synthetic Geometry,Analytic Geometryから115個のキュレートされたサンプルを作成した。
その結果, GPT-5 と Gemini-3-Pro が最も高いコンパイル精度と意味的精度が得られ, GPT-5 は物理的推論に優れていた。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:42:51 GMT)
Accurate Table Question Answering with Accessible LLMs [78.9] データベースのテーブルTと自然言語の質問Qが与えられたとき、テーブル質問応答(TQA)タスクは、Tの内容に基づいてQに正確な回答を返すことを目的としている。
最近の最先端のソリューションは、大きな言語モデル(LLM)を活用して高品質な回答を得る。
本稿では,デスクトップやラップトップ上で動作可能な小型でオープンなLLMを用いたTQAに焦点を当てる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:07:25 GMT)
Encyclo-K: Evaluating LLMs with Dynamically Composed Knowledge Statements [78.9] 既存のベンチマークは、主に質問レベルで質問をキュレートする。
ベンチマーク構築をゼロから再考するステートメントベースのベンチマークであるEncyclo-Kを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:20:46 GMT)
Iterative Structured Pruning for Large Language Models with Multi-Domain Calibration [73.4] 大規模言語モデル(LLM)は、自然言語処理タスクの幅広い範囲で顕著な成功を収めている。
その拡大を続けるスケールは、かなりの計算オーバーヘッド、メモリフットプリント、推論レイテンシなど、現実世界のデプロイメントに重大な障壁をもたらす。
本研究では,アーキテクチャコンポーネント全体を排除し,標準ハードウェアアクセラレーションとの互換性を維持する構造的プルーニングについて検討する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:09:31 GMT)
Linear Script Representations in Speech Foundation Models Enable Zero-Shot Transliteration [70.8] 我々は,スクリプトが多言語音声モデルのアクティベーション空間に線形に符号化されていることを示し,推論時にアクティベーションを変更することで,出力スクリプトを直接制御できることを示した。
本稿では,Whisperの全モデルサイズにまたがる競合性能を観測し,音声認識出力のスクリプトに対するポストホック制御を実現する手法を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:45:04 GMT)
A Versatile Multimodal Agent for Multimedia Content Generation [66.9] 複雑なコンテンツ作成タスクの自動化を目的としたMultiMedia-Agentを提案する。
エージェントシステムには、データ生成パイプライン、コンテンツ作成のためのツールライブラリ、嗜好アライメントを評価するためのメトリクスセットが含まれている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:49:47 GMT)
MOSS Transcribe Diarize: Accurate Transcription with Speaker Diarization [66.0] 話者対応のタイムスタンプ・トランセプションは,各話者の発話のタイミングを正確に決定することを目的としている。
既存のSATSシステムでは、エンド・ツー・エンドの定式化はまれであり、コンテキストウィンドウの制限、長距離スピーカーメモリの弱い、タイムスタンプの出力ができないといった制約がある。
本稿では,MOSS Transcribe Diarizeについて述べる。MOSS Transcribe Diarizeはマルチモーダルな大規模言語モデルで,エンドツーエンドのパラダイムで話者属性,時間スタンプの転写を行う。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:55:48 GMT)
Extracting books from production language models [65.9] 同様の抽出がLLMの生産に可能であるかどうかについては、未解決のままである。
ジェイルブレイクされたクロード3.7 ソンネットは、全書籍をほぼ全文出力する場合もある。
モデルおよびシステムレベルのセーフガードであっても、(コピーライト内での)トレーニングデータの抽出はLLM生産のリスクである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:01:27 GMT)
BaseCal: Unsupervised Confidence Calibration via Base Model Signals [65.1] ポストトレーニング後のLLM(PoLLM)は、一般的に深刻な過信で信頼を損なう。
対応するLLMはよく校正されたままである。
このことは、ベース LLM をリファレンスとして、PoLLM の信頼性を校正する動機となります。
簡単な解決策であるBaseCal-ReEvalは、PoLLMの応答を評価し、それらをベースLSMに供給し、平均確率を自信として得る。
そこで本研究では,PLLMの最終層が隠された状態をベースにマッピングするために,軽量プロジェクションをトレーニングするBaseCal-Projを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:22:21 GMT)
Towards Comprehensive Stage-wise Benchmarking of Large Language Models in Fact-Checking [65.0] 大規模言語モデル(LLM)は、現実のファクトチェックシステムにますます多くデプロイされている。
FactArenaは、完全に自動化されたアリーナスタイルの評価フレームワークである。
本研究では,静的クレーム検証精度とエンドツーエンドのファクトチェック能力の相違点を明らかにした。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 02:51:56 GMT)
Breaking the Assistant Mold: Modeling Behavioral Variation in LLM Based Procedural Character Generation [62.5] 手続き的コンテンツ生成は、レベル、マップ、クエストを通じて巨大な仮想世界を可能にするが、大規模なキャラクター生成は未調査のままである。
既存の手法では2つのアライメント誘起バイアスを同定する。
我々は、行動構築から世界構築を遠ざけるフレームワークであるPersonaWeaverを紹介した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:18:01 GMT)
InfiniDepth: Arbitrary-Resolution and Fine-Grained Depth Estimation with Neural Implicit Fields [62.5] 本稿では,神経暗黙の場として深度を表すInfiniDepthを紹介する。
連続した2次元座標で奥行きを問合えることができ、任意の解像度ときめ細かい深さの推定が可能となる。
InfiniDepthは、合成ベンチマークと実世界のベンチマークの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:57:06 GMT)
RelightAnyone: A Generalized Relightable 3D Gaussian Head Model [60.6] 3D Gaussian Splatting (3DGS)は、フォトリアリスティックな3Dヘッドアバターを再構成しレンダリングするための標準的なアプローチとなっている。
既存の方法では、ワンライト・アット・ア・タイム(OLAT)のような複雑な時間多重照明の下で被写体を捕獲する必要がある。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:01:07 GMT)
Decoupling the Effect of Chain-of-Thought Reasoning: A Human Label Variation Perspective [60.5] 長いチェーン・オブ・ソート(CoT)がトップオプションの決定的決定要因となるが、あいまいなタスクの粒度分布キャリブレータとして機能しないことを示す。
CoTは分布アライメントを改善するが、CoTの内容によって最終的な精度が決定される。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:26:40 GMT)
Robust Mesh Saliency GT Acquisition in VR via View Cone Sampling and Geometric Smoothing [59.1] バーチャルリアリティー(VR)における人中心視覚モデリングには3次元メッシュサリエンシ基底真理が不可欠である
現在のVRアイトラッキングパイプラインは、単一線サンプリングとユークリッドのスムース化に依存しており、テクスチャの注意を喚起し、ギャップをまたいだ信号の漏洩を引き起こす。
本稿では,これらの制約に対処する頑健な枠組みを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:20:12 GMT)
Multi-Agent-Driven Cognitive Secure Communications in Satellite-Terrestrial Networks [58.7] 悪意のある盗聴者は衛星地上ネットワーク(STN)を介して個人情報に深刻な脅威をもたらす
リアルタイムセンシングによりスペクトルスケジューリングと保護を協調する複数のエージェントによって駆動される認知セキュア通信フレームワークを提案する。
我々は、生成した対向ネットワークを利用して対向行列を生成し、学習支援電力制御を用いて、実及び対向信号のパワーを保護層に設定する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:30:41 GMT)
Unified Thinker: A General Reasoning Modular Core for Image Generation [57.7] 汎用画像生成のためのタスクに依存しない推論アーキテクチャであるUnified Thinkerを提案する。
Unified Thinkerはイメージジェネレータから専用のThinkerを分離し、生成モデル全体をトレーニングすることなく、推論のモジュラーアップグレードを可能にする。
テキスト・画像生成と画像編集の実験により、Unified Thinkerは画像の推論と生成品質を大幅に改善することが示された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:59:33 GMT)
Foreground-Aware Dataset Distillation via Dynamic Patch Selection [56.6] コンテンツ適応方式でパッチ選択を向上する前景対応型データセット蒸留法を提案する。
複数のベンチマーク実験により,提案手法は既存手法よりも蒸留性能を一貫して向上することが示された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:44:02 GMT)
On the Capacity Region of Individual Key Rates in Vector Linear Secure Aggregation [55.1] すべてのユーザがキーを保持する必要はないことを示し、それによって文学における最もよく知られた到達可能な領域を厳密に拡大する。
以上の結果から,各ユーザがキーを保持する必要はないという新たな事実が明らかになった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:34:07 GMT)
AbductiveMLLM: Boosting Visual Abductive Reasoning Within MLLMs [54.7] 視覚的帰納的推論は、AIシステムが不完全な視覚的観察の最も可能性の高い説明を推論する必要がある難しいタスクである。
本稿では,REASONERとIMAGINERの2つの相乗成分からなるAbductiveMLLMを紹介する。
標準VARベンチマークの実験では、AbductiveMLLMは最先端のパフォーマンスを達成し、従来のソリューションや高度なMLLMよりも一貫して優れていた。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 07:05:35 GMT)
Figure It Out: Improve the Frontier of Reasoning with Executable Visual States [53.8] 複雑な推論問題はしばしば、テキストに明示的にエンコードされていない暗黙の空間的および幾何学的関係を含む。
FIGRを導入し、エンドツーエンドの強化学習を通じて、実行可能な視覚構成を多ターン推論に統合する。
8つの挑戦的な数学ベンチマークの実験により、FIGRは強いテキストのみのチェーン・オブ・シークレット・ベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:22:08 GMT)
In-Context Reinforcement Learning through Bayesian Fusion of Context and Value Prior [53.2] テキスト内強化学習は、パラメータを更新せずに、目に見えない環境への高速な適応を約束する。
本研究では,ベイズ ICRL 法である SPICE を導入し,その事前値を深層アンサンブルで学習し,テスト時に更新する。
本研究は,SPICEが準最適軌道のみに事前訓練した場合でも,帯域幅と有限水平MDPの両方において,後悔と最適動作を達成できることを証明した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:41:31 GMT)
Who Laughs with Whom? Disentangling Influential Factors in Humor Preferences across User Clusters and LLMs [53.1] 大きな言語モデル(LLMs)を用いたユーモアの評価を複雑にし、個人や文化に幅広い相違点がある。
本研究では,ユーザの投票ログをクラスタリングし,Bradley-Terry-Luceモデルを用いた解釈可能な選好因子よりもクラスタ固有の重みを推定することにより,日本の創造的反応ゲームであるOogiriにおけるユーモア選好の不均一性をモデル化する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:33:45 GMT)
Grad-ELLM: Gradient-based Explanations for Decoder-only LLMs [52.2] Grad-ELLMは、デコーダのみをベースとした大規模言語モデルのための勾配に基づく属性法である。
我々は、より公平な比較を提供する2つの忠実度指標$-Soft-NCと$-Soft-NSを導入する。
実験の結果,Grad-ELLMは他の属性法よりも優れた忠実性が得られることがわかった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:22:39 GMT)
SIGMA: Scalable Spectral Insights for LLM Collapse [51.9] SIGMA(Spectral Inequalities for Gram Matrix Analysis)は,モデル崩壊のための統一的なフレームワークである。
行列のスペクトル上の決定論的境界を導出するベンチマークを利用することで、SIGMAは表現空間の収縮を追跡するために数学的に基底化された計量を提供する。
我々は、SIGMAが状態への遷移を効果的に捉え、崩壊のメカニズムに関する理論的知見の両方を提供することを示した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:47:11 GMT)
Sample-Efficient Neurosymbolic Deep Reinforcement Learning [49.6] 本稿では,背景記号知識を統合し,サンプル効率を向上させるニューロシンボリックディープRL手法を提案する。
オンライン推論は2つのメカニズムを通じてトレーニングプロセスのガイドを行う。
我々は、最先端の報奨機ベースラインよりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:28:53 GMT)
From Memorization to Creativity: LLM as a Designer of Novel Neural-Architectures [48.8] 大規模言語モデル(LLM)は、プログラム合成において優れているが、ニューラルネットワーク設計(信頼性、性能、構造的ノベルティ)を自律的にナビゲートする能力は、未調査のままである。
コード指向LLMをクローズドループ合成フレームワークに配置し、22の教師付き微調整サイクルの進化を解析することによって、この問題に対処する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:20:28 GMT)
Large Reasoning Models Are (Not Yet) Multilingual Latent Reasoners [48.7] 大きな推論モデル(LRM)は、数学的推論タスクにおいて高い性能を達成する。
LRMは、これらのテキスト推論ステップを完了する前に、正しい答えに到達することが多い。
この現象は英語で研究されてきたが、多言語的行動はほとんど分かっていない。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:20:17 GMT)
Unveiling and Bridging the Functional Perception Gap in MLLMs: Atomic Visual Alignment and Hierarchical Evaluation via PET-Bench [48.6] MLLM(Multimodal Large Language Models)は、異常検出や解剖学的モダリティのレポート生成などのタスクにおいて、顕著な熟練性を示した。
本研究では, 機能的トレーサの生体分布を, 形態的先行性とは無関係に復号化できない現状の視覚エンコーダについて, 基本的な機能的知覚ギャップを定量化する。
PET-Benchは52,308個の階層型QAペアからなるPET-Benchの最初の大規模機能評価ベンチマークである。
AVAは認知ギャップを効果的に橋渡しし、CoTを幻覚源から頑健な推論ツールに変換し、診断を改善していることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:58:50 GMT)
Hidden State Poisoning Attacks against Mamba-based Language Models [48.5] Mambaのような状態空間モデル(SSM)は、Transformerベースの言語モデルの効率的な代替手段を提供する。
本稿では,これらのモデルにおいて,特定の短い入力句が部分記憶効果を誘導する現象を考察する。
我々のベンチマークであるRoBench25は、HiSPAsを受ける際のモデルの情報検索機能を評価することができる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:54:49 GMT)
Ratio-Variance Regularized Policy Optimization for Efficient LLM Fine-tuning [48.3] 本稿では,安定なオン・ポリティクス学習をサポートし,オフ・ポリティクスデータの再利用を原則とするプリミティブ・デュアル・フレームワークを提案する。
R2VPO$は、強いクリッピングベースのベースラインよりも17%の平均的な相対的なゲインで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:01:42 GMT)
PrismVAU: Prompt-Refined Inference System for Multimodal Video Anomaly Understanding [48.0] ビデオ異常理解(VAU)は、従来のビデオ異常検出(VAD)を拡張し、それらのコンテキストを記述し、推論する。
既存のVAUアプローチは、細調整されたマルチモーダル言語モデル(MLLM)やビデオキャプタなどの外部モジュールに依存していることが多い。
実時間VAUのための軽量で効果的なシステムであるPrismVAUを導入し,1つのオフ・ザ・シェルフMLLMを用いて異常スコア,説明,迅速な最適化を行う。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:11:06 GMT)
MemRL: Self-Evolving Agents via Runtime Reinforcement Learning on Episodic Memory [46.6] 提案するMemRLは,非パラメトリック強化学習をエピソードメモリ上で行うことで,エージェントの自己進化を可能にするフレームワークである。
MemRLは、セマンティックな関連性によって候補をフィルタリングし、学習したQ値に基づいて候補を選択する2相検索機構を採用している。
解析実験により,MemRLは安定性・塑性ジレンマを効果的に調整し,重み付けを伴わずに連続的なランタイム改善を可能にすることを確認した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:14:50 GMT)
A path to natural language through tokenisation and transformers [46.1] バイトペア符号化(BPE)がコーパス統計をどのように変換するかを検討する。
BPEは、経験的エントロピーの特徴的な成長パターンを誘導しながら、トークン周波数をジプシアン電力法則に向けて駆動する。
我々は、様々なBPE深さでトークン化されたコーパス上で言語モデルを訓練し、モデル予測エントロピーがZipf由来の予測とますます一致していることを明らかにする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:14:04 GMT)
PersonaLedger: Generating Realistic Financial Transactions with Persona Conditioned LLMs and Rule Grounded Feedback [45.7] PersonaLedgerは、リッチユーザペルソナに条件付けされた大きな言語モデルを使用して、多様なトランザクションストリームを生成する生成エンジンである。
23,000人のユーザによる3000万トランザクションのパブリックデータセットと、2つのタスク、不確実性分類とアイデンティティ盗難セグメンテーションを備えたベンチマークスイートを作成します。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:18:59 GMT)
IBISAgent: Reinforcing Pixel-Level Visual Reasoning in MLLMs for Universal Biomedical Object Referring and Segmentation [44.9] IBISAgentはビジョン中心の多段階意思決定プロセスとしてセグメンテーションを再構築する。
IBISAgentは、クローズドソースとオープンソース両方のSOTAメソッドを一貫して上回っている。
すべてのデータセット、コード、トレーニングされたモデルが公開されます。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:37:50 GMT)
Punctuation-aware Hybrid Trainable Sparse Attention for Large Language Models [44.3] textbfPunctuation-aware textbfHybrid textbfSparse textbfAttention textbf(PHSA)を提案する。
具体的には,大域的セマンティック表現と句読点付き境界特徴を融合させ,コアセマンティック構造を保ちながら,計算オーバーヘッドをほとんど含まない二重ブランチアグリゲーション機構を設計する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:47:16 GMT)
Memorization, Emergence, and Explaining Reversal Failures: A Controlled Study of Relational Semantics in LLMs [43.4] 本稿では,対称/逆三重項からテキストを生成する合成フレームワークを提案し,GPTスタイルの自己回帰モデルをスクラッチから訓練し,記憶,論理推論,文脈内一般化を評価する。
浅層(2-3層)モデルにおいても,関係性セマンティクスが十分な論理量制御によって出現し,その一般化が安定な中間層信号と一致していることが判明した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:20:38 GMT)
Understanding Reward Hacking in Text-to-Image Reinforcement Learning [43.4] テキスト・ツー・イメージ(T2I)RLポストトレーニングにおける報酬ハッキングの挙動を解析する。
多様な報酬モデルにまたがって、我々は共通の失敗モード、すなわちアーティファクトが引き起こす画像の生成を識別する。
そこで本稿では, アーティファクトフリーおよびアーティファクト入りサンプルの小さなデータセットに基づいて, 軽量かつ適応的なアーティファクト報酬モデルを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:43:47 GMT)
VLM4VLA: Revisiting Vision-Language-Models in Vision-Language-Action Models [43.1] Vision-Language-Action(VLA)モデルは、事前訓練された大規模なVision-Language Models(VLM)をポリシーバックボーンに統合する。
本稿では、VLMの選択と能力が下流のVLAポリシーのパフォーマンスにどのように変換されるかという、体系的に研究されることは滅多にない。
VLM4VLAは、汎用的なVLMを、学習可能なパラメータの小さなセットのみを用いてVLAポリシーに変換する、最小限の適応パイプラインである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:58:24 GMT)
Lunar Rover Cargo Transport: Mission Concept and Field Test [42.8] ローバーは、ピックアップと配送を成功させるために、貨物を小さな許容範囲内で自律的に駐車できなければならない。
ワントン・パス・ツー・フライ・ローバーは、安全な経路のネットワークを作るための半自律遠隔制御モードで駆動された。
クローズドループの性能は、車両を貨物に合わせるのに十分正確である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:16:55 GMT)
Dementia-R1: Reinforced Pretraining and Reasoning from Unstructured Clinical Notes for Real-World Dementia Prognosis [42.5] 非構造的臨床ノートから縦型認知症予後のフレームワークであるDementia-R1を紹介した。
本手法では,患者の病理組織から抽出した臨床的指標を予測するために,事前トレーニングを行うコールドスタートRL戦略を採用する。
大規模な実験により、Dementia-R1は実世界の非構造化臨床データセットで77.03%のF1スコアを達成した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:44:04 GMT)
On the Identifiability of Regime-Switching Models with Multi-Lag Dependencies [42.3] マルチラグレジームスイッチングモデル(RSM)の一般的な理論的枠組みを開発する。
非線形ガウス条件下では,レギュラー数とマルチラグ遷移の双方の識別可能性を示す。
我々の結果は、アーキテクチャとノイズの仮定を通して完全に教師なしの設定を保ちます。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:12:39 GMT)
Multi-Turn Jailbreaking of Aligned LLMs via Lexical Anchor Tree Search [42.2] 本稿では,Lexical Anchor Tree Search()を提案する。
AdvBench と HarmBench の評価は、LATS が最新の GPT、Claude、Llama モデルで 97-100% ASR を達成することを示した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 02:58:22 GMT)
Towards Zero-Shot Point Cloud Registration Across Diverse Scales, Scenes, and Sensor Setups [41.0] ゼロショット一般化を実現するトレーニングフリー登録フレームワークであるBUFFER-Xを提案する。
提案手法は階層型マルチスケールマッチングを用いて,局所,中,大域の受容領域にまたがる対応を抽出する。
効率クリティカルなアプリケーションでは、BUFFER-X-Liteを導入し、総時間を43%削減する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:51:24 GMT)
TA-Prompting: Enhancing Video Large Language Models for Dense Video Captioning via Temporal Anchors [40.5] デンスビデオキャプションは、入力ビデオ全体の時間的局所化イベントを解釈し、記述することを目的としている。
近年の最先端技術は,ビデオデータに詳細なモーメント記述を提供するために,大規模言語モデル(LLM)を活用している。
本稿では,TA-Promptingを提案する。TA-Promptingはテンポラルアンカーを介し,イベントを正確にローカライズし,ビデオLLMに時間対応のビデオイベント理解を促す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:45:53 GMT)
One Sample to Rule Them All: Extreme Data Efficiency in RL Scaling [40.0] 本稿では,複数の学際的影響をもたらす1つのトレーニングサンプルを設計するためのフレームワークを提案する。
戦略的に選択された1つの数学推論サンプルは、複数のドメイン間で大きなパフォーマンス改善をもたらすことができる。
以上の結果から, サンプル工学とよばれる, トレーニングサンプルの精密工学へのシフトが示唆された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:41:35 GMT)
Rationale-Grounded In-Context Learning for Time Series Reasoning with Multimodal Large Language Models [39.8] 本稿では,時間列推論のための理性学習手法を提案する。
提案するRationaleTSの3ドメイン時系列推論タスクにおける有効性と有効性を示すため,広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:27:04 GMT)
Dual-quaternion learning control for autonomous vehicle trajectory tracking with safety guarantees [39.1] 運動を運動論的に記述できる自律型ロボットプラットフォームのための学習型軌道追跡制御器を提案する。
コントローラは二重四元数フレームワークで定式化され、角速度と直線速度の直接の指令を仮定して速度レベルで動作する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:30:02 GMT)
Beyond the Black Box: Theory and Mechanism of Large Language Models [39.1] LLM(Large Language Models)の急速な台頭は、人工知能において大きなパラダイムシフトを引き起こした。
本調査では,データ作成,モデル作成,トレーニング,アライメント,推論,評価の6つの段階に,研究環境を整理するライフサイクルベースの統合分類法を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:45:53 GMT)
Sphinx: Benchmarking and Modeling for LLM-Driven Pull Request Review [38.0] プルリクエスト(PR)レビューは、ソフトウェア品質を保証する上で不可欠だが、ノイズの多い監視、限られたコンテキスト理解、不適切な評価指標のため、依然として難しい。
提案するPRレビュー用統合フレームワークであるSphinxは,(1)擬似修飾コードとマージコードを比較することによって,文脈に富んだ,意味論的根拠のあるレビューコメントを生成する構造化データ生成パイプライン,(2)実行可能な検証ポイントの構造化カバレッジに基づいてレビュー品質を評価するチェックリストに基づく評価ベンチマーク,(3)ルールベースで解釈可能な報酬を用いて,モデル動作を現実と整合させる新しいトレーニングパラダイムであるCRPOである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:49:56 GMT)
M3MAD-Bench: Are Multi-Agent Debates Really Effective Across Domains and Modalities? [37.9] マルチエージェント討論(MAD)は、回答の品質を改善し、複雑な推論をサポートするため、構造化された議論を通じて複数のエージェントを編成する。
既存のMADの研究は、断片化と矛盾した設定下で評価が行われ、公正な比較を妨げるという2つの基本的な限界に悩まされている。
M3MAD-Benchは、マルチドメインタスク、マルチモーダルインプット、マルチ次元メトリクスにわたるMADメソッド評価のための統一ベンチマークである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:33:48 GMT)
EarthVL: A Progressive Earth Vision-Language Understanding and Generation Framework [37.8] マルチタスクデータセット(EarthVLSet)と意味誘導ネットワーク(EarthVLNet)を含む、プログレッシブアースビジョン言語理解フレームワークを提案する。
EarthVLSetには10.9kのサブメートル解像度のリモートセンシング画像、ランドカバーマスク、761.5kのテキストペアが含まれる。
オブジェクト中心の方法では、セマンティックセグメンテーション、リレーショナル推論、包括的な理解を徐々に達成するためにEarthVLNetが提案されている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 07:41:44 GMT)
RadioDiff-Flux: Efficient Radio Map Construction via Generative Denoise Diffusion Model Trajectory Midpoint Reuse [37.8] 新たな2段階遅延拡散フレームワークであるRadioDiff-Fluxを提案する。
静的環境モデリングを動的洗練から切り離し、事前計算された中間点の再利用を可能にする。
実験の結果、RadioDiff-Fluxは0.15%の精度で最大50の加速を達成できることがわかった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 07:57:27 GMT)
Aligning Findings with Diagnosis: A Self-Consistent Reinforcement Learning Framework for Trustworthy Radiology Reporting [37.6] MLLM(Multimodal Large Language Models)は放射線学レポート生成に強い可能性を示している。
本フレームワークは, より詳細な発見のための思考ブロックと, 構造化された疾患ラベルに対する回答ブロックという, 生成を2つの異なる構成要素に再構成する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:17:44 GMT)
Topology-aware Pathological Consistency Matching for Weakly-Paired IHC Virtual Staining [37.4] 本稿では,H&E-to-IHC仮想染色のための新しいトポロジ対応フレームワークを提案する。
具体的には,グラフのコントラスト学習とトポロジ的摂動を利用したトポロジ対応の一貫性マッチング機構を提案する。
本手法は最先端の手法より優れ,高い臨床関連性を有する優れた世代品質を達成できる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:28:38 GMT)
A method for robust spin relaxometry in the presence of imperfect state preparation [36.9] 不完全なスピン偏極の存在下で、より堅牢なパラメータ推定を可能にする最小限のフィッティング手順を導入する。
我々のモデルは、より正確な適合性を提供することで既存のアプローチを改善し、シングルスピンダイナミクス研究を効率的に並列化するためのフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:42:54 GMT)
InfiAgent: An Infinite-Horizon Framework for General-Purpose Autonomous Agents [36.7] InfiAgentは、タスクの持続時間に関係なく、エージェントの推論コンテキストを厳密に拘束する。
20Bのオープンソースモデルを持つInfiAgentは、より大きなプロプライエタリなシステムと競合する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:35:57 GMT)
SA-ResGS: Self-Augmented Residual 3D Gaussian Splatting for Next Best View Selection [35.5] シーン再構築における不確実性定量化を安定化し,不確実性を考慮した監視を強化するためのフレームワークとして,自己拡張型残留3Dガウススティング(SA-ResGS)がある。
SA-ResGSは、自己拡張点雲を生成することにより、不確実性推定の信頼性と、その監視効果の両方を改善する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:59:07 GMT)
CAMO: Category-Agnostic 3D Motion Transfer from Monocular 2D Videos [35.3] 2Dビデオから3Dアセットへのモーション転送は、固有のポーズのあいまいさと多様なオブジェクト形状のため、難しい問題である。
モノクロ2Dビデオから直接、多様なターゲットメッシュに動きを転送するカテゴリに依存しないフレームワークであるCAMOを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:03:04 GMT)
Grading Scale Impact on LLM-as-a-Judge: Human-LLM Alignment Is Highest on 0-5 Grading Scale [34.8] LLM-as-a-judge問題について,人間とLSMの2種類のラッカーを比較して検討した。
LLM判定は主観的ベンチマークのスケールで完全に整合性がないことがわかった。
0-5のグルーピングスケールは、人間とLLMのアライメントが最強である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 22:12:06 GMT)
Digital Red Queen: Adversarial Program Evolution in Core War with LLMs [34.6] 大規模言語モデル(LLM)は、多くの領域における問題に対する解決策の進化にますます使われてきている。
本稿では,対戦動態を取り入れたシンプルな自己再生アルゴリズムであるDigital Red Queen(DRQ)について検討する。
DRQはLLMを使って「戦士」と呼ばれる組み立てのようなプログラムを進化させ、コアウォーゲームにおける仮想マシンの制御のために互いに競い合う。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:58:17 GMT)
UniCorn: Towards Self-Improving Unified Multimodal Models through Self-Generated Supervision [34.6] 導電失語(Conduction Aphasia)は、モデルがマルチモーダル入力を正確に解釈するが、その理解を忠実で制御可能な合成に変換するのに苦労する現象である。
外部データや教師の監督を必要としない,シンプルでエレガントな自己改善フレームワークUniCornを提案する。
マルチモーダルコヒーレンスの回復を検証するために,テキスト・トゥ・イメージ・トゥ・テクスチャ・コンシステンシー・ベンチマークであるUniCycleを導入する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:15:50 GMT)
HEEGNet: Hyperbolic Embeddings for EEG [34.1] 脳波の階層構造を捉え,ドメイン不変なハイパーボリック埋め込みを学習するためのハイブリッドハイパーボリックネットワークアーキテクチャHEEGNetを提案する。
この目的のために、HEEGNetはユークリッドエンコーダと双曲エンコーダを結合し、新しい粗いドメイン適応戦略を採用している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:30:47 GMT)
ThinkRL-Edit: Thinking in Reinforcement Learning for Reasoning-Centric Image Editing [33.9] 画像編集の質を向上させるために,強化学習(RL)について検討した。
RL は,(1) ノイズ除去に限定した推論探索,(2) バイアスド報酬融合,(3) 不安定な VLM ベースの命令報酬の3つの主要な課題に直面している。
画像合成から視覚的推論を分離する推論中心のRLフレームワークであるThinkRL-Editを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:43:00 GMT)
LittiChoQA: Literary Texts in Indic Languages Chosen for Question Answering [33.8] インドのガンジケート平野で話されている多くの言語を網羅する,これまでで最大の文学的QAデータセットであるLittiChoQAを紹介した。
データセットは、ファクトイドと非ファクトイドの問合せのバランスのとれた270K以上の問合せペアで構成されている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:59:41 GMT)
DiT-JSCC: Rethinking Deep JSCC with Diffusion Transformers and Semantic Representations [32.9] 新たなDeep J SCCパラダイムとして、ジェネレーティブジョイントソースチャネルコーディング(GJSCC)が登場した。
本稿では,意味論的優先表現エンコーダと拡散変換器(DiT)に基づく生成復号器を共同で学習できる,新しいGJSCCバックボーンであるDiT-JSCCを提案する。
DiT-JSCCは, 意味的一貫性と視覚的品質の両面で, 特に極端な状況下で, 既存のJ SCC法より一貫して優れていることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:42:45 GMT)
Generalizable Prompt Tuning for Audio-Language Models via Semantic Expansion [32.6] 音声言語モデル(ALM)における即時チューニングのためのSemantically Expanded Prompt Tuning (SEPT)を提案する。
SEPTは、大きな言語モデルによって生成されるセマンティックな隣人を組み込むことで、迅速な埋め込み空間を正規化する。
大規模な実験により、SEPTは複数のプロンプトチューニングベースラインにまたがる一般化性能を一貫して改善することが示された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:47:32 GMT)
Zoom-IQA: Image Quality Assessment with Reliable Region-Aware Reasoning [32.3] VLMに基づくIQAモデルであるZoom-IQAを導入し、重要な認知行動を明確にエミュレートする。
Zoom-IQAは堅牢性、説明可能性、一般化の向上を実現している。
画像復元などの下流タスクへの応用は、Zoom-IQAの有効性をさらに示している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:00:17 GMT)
The Sonar Moment: Benchmarking Audio-Language Models in Audio Geo-Localization [32.0] AGL1Kは、音声言語モデル(ALM)のための最初のオーディオジオローカライズベンチマークである。
クラウドソースプラットフォームから確実にローカライズ可能なサンプルを抽出するために,オーディオ・ローカライズビリティ・メトリックを提案する。
クローズド・ソース・モデルはオープンソース・モデルよりも大幅に優れており、言語的手がかりが予測の足場として支配されることが多い。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:13:24 GMT)
Enhancing Linguistic Competence of Language Models through Pre-training with Language Learning Tasks [31.9] 我々はL2Tを提案する。L2Tは言語学習タスクを統合した事前学習フレームワークである。
人間の言語習得にインスパイアされたL2Tは、生テキストを構造化された入力出力ペアに変換し、明示的な言語刺激を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 22:28:15 GMT)
TiMem: Temporal-Hierarchical Memory Consolidation for Long-Horizon Conversational Agents [31.8] テンポラルメモリツリー(TMT)を通して会話を整理する時間階層型メモリフレームワークTiMemを提案する。
TiMemの特徴は3つのコア特性である。(1)TMTによる時間的階層構造、(2)微調整なしで階層レベルのメモリ統合を可能にする意味誘導統合、(3)複雑さの異なるクエリ間のバランスと効率のバランスをとる複雑性認識メモリリコールである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:24:19 GMT)
Interpretable All-Type Audio Deepfake Detection with Audio LLMs via Frequency-Time Reinforcement Learning [31.5] 実世界のオーディオディープフェイク検出には、異種音声をまたいで一般化する全タイプの検出器が必要である。
SFTでALLMをコールドスタートし、ルールベースの周波数時間制約の下でGRPOを適用する2段階トレーニングパラダイムを提案する。
FT-GRPOは、FT-grounded rationalsを生成しながら、全型ADDの最先端性能を実証する実験を行った。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:50:02 GMT)
Muses: Designing, Composing, Generating Nonexistent Fantasy 3D Creatures without Training [31.2] Musesは、フィードフォワードパラダイムで素晴らしい3D生物を生成するための、トレーニング不要な最初の方法だ。
従来の手法は、部分認識の最適化、手動のアセンブリ、あるいは2D画像生成に依存しており、非現実的あるいは非コヒーレントな3Dアセットを生成することが多い。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:59:57 GMT)
Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning [31.0] PDACの基底型および古典型TCGへの分子置換は予後および予測値を確立している。
本稿では,標準的なH&E染色WSIから直接治療関連分子サブタイプを予測する,解釈可能なディープラーニングフレームワークであるPanSubNetを紹介する。
PanSubNetは2つの多施設コホートにまたがる1,055人のデータを用いて開発された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:52:12 GMT)
Topology-Independent Robustness of the Weighted Mean under Label Poisoning Attacks in Heterogeneous Decentralized Learning [30.9] 本稿では,ラベル中毒攻撃における分散勾配降下のロバスト性について,ロバストおよび重み付き平均アグリゲータの両方を考慮した解析を行った。
その結果,ロバストアグリゲータの学習誤差はネットワークトポロジに依存し,重み付き平均アグリゲータの性能はトポロジに依存しないことがわかった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:32:34 GMT)
When Agents See Humans as the Outgroup: Belief-Dependent Bias in LLM-Powered Agents [30.9] 本稿は、LSMによるエージェントは、人口統計バイアス(例えば、性別、宗教)だけでなく、グループ間バイアスも最小限の「us」と「them」の手がかりで示していることを示している。
エージェントは他のAIエージェントを内集団として扱うことができ、人間を外集団として扱うことができる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:16:57 GMT)
Ahead of the Spread: Agent-Driven Virtual Propagation for Early Fake News Detection [30.5] 偽ニュース下線検出のためのアンダーラインアゲイン駆動型アンダーラインオパガタンデリオンであるAVOIDを提案する。
AVOIDは、早期検出を、受動的に観察されるのではなく、伝播信号を積極的にシミュレートするエビデンス生成の新しいパラダイムとして再構成する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:36:43 GMT)
Empowering Reliable Visual-Centric Instruction Following in MLLMs [30.1] MLLMの命令追従能力を評価するための既存のベンチマークは、主に言語命令に焦点を当てている。
我々は、体系的に構築されたデータセットを伴う新しいベンチマークであるVC-IFEvalを紹介する。
本ベンチマークでは,視覚に依存した制約を命令設計に体系的に組み込んで,より厳密できめ細かな評価を可能にする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:23:33 GMT)
MMErroR: A Benchmark for Erroneous Reasoning in Vision-Language Models [29.8] 2,013個のサンプルを1つのコヒーレントな推論誤差に埋め込んだベンチマークであるMMErroRを提案する。
MMErroRは、回答の正しさに焦点を当てた既存のベンチマークとは異なり、プロセスレベル、エラー中心の評価をターゲットにしている。
最良モデル(Gemini-3.0-Pro)でさえ、66.47%のケースでエラーを分類する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:45:26 GMT)
SYNAPSE: Empowering LLM Agents with Episodic-Semantic Memory via Spreading Activation [29.5] プリコンパイルされたリンクではなく静的を超越する統一メモリアーキテクチャであるSynapseを紹介する。
この結果から,Synapseは時間的およびマルチホップの複雑な推論タスクにおいて,最先端の手法を著しく上回ることがわかった。
私たちのコードとデータは受け入れ次第公開されます。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:19:58 GMT)
DGA-Net: Enhancing SAM with Depth Prompting and Graph-Anchor Guidance for Camouflaged Object Detection [28.2] DGA-NetはSegment Anything Model(SAM)を新しいディーププロセッシングパラダイムで適用するフレームワークである。
具体的には、異種グラフ内のRGB意味論と幾何学的深さを合成するクロスモーダルグラフ拡張(CGE)モジュールを提案する。
また,AGRモジュールを設計し,特徴階層における固有情報減衰に対する対策を行う。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:04:23 GMT)
Q-Regularized Generative Auto-Bidding: From Suboptimal Trajectories to Optimal Policies [28.0] Q-value regularized Generative Auto-bidding法であるQGAを提案する。
大規模な実世界のA/Bテストでは、QGAはAd GMVが3.27%増加し、Ad ROIが2.49%改善した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:42:25 GMT)
DNACHUNKER: Learnable Tokenization for DNA Language Models [27.9] 本研究では,学習可能な動的DNAトークン化機構を統合したDNACHUNKERを提案する。
我々はヒト基準ゲノム(HG38)を用いてDNACHUNKERの性能を訓練し、ヌクレオチドトランスフォーマーおよびゲノムベンチマークで試験することで、DNACHUNKERの性能を実証する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:46:42 GMT)
Towards Faithful Reasoning in Comics for Small MLLMs [27.5] Comic-based visual question answering (CVQA) は、象徴的抽象、物語論理、ユーモアに依存しているため、マルチモーダルな大規模言語モデル (MLLM) に対して異なる課題を提起する。
小型MLLMにおいて,より忠実で伝達可能な推論チェーンを創出するための,新しいマンガ推論フレームワークを提案する。
我々のフレームワークは、モジュールCoT生成とGRPOベースの強化微細調整と、新しい構造的報酬を組み合わせる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:00:21 GMT)
MoE Adapter for Large Audio Language Models: Sparsity, Disentanglement, and Gradient-Conflict-Free [27.3] 音響情報の分離を目的とした疎混合(MoE)アーキテクチャであるtextittextbfMoE-Adapter を導入する。
実験により、MoE-Adapterは、音声意味的タスクとパラ言語的タスクの両方において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:24:38 GMT)
RAL2M: Retrieval Augmented Learning-To-Match Against Hallucination in Compliance-Guaranteed Service Systems [27.3] 幻覚はLLM駆動型サービスシステムにおいて大きな関心事である。
本稿では,生成幻覚を排除した新しいフレームワークであるRetrieval-Augmented Learning-to-Match(RAL2M)を紹介する。
異種モデル能力を明示的にモデル化する問合せ適応型潜在アンサンブル戦略を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:00:16 GMT)
PsychEval: A Multi-Session and Multi-Therapy Benchmark for High-Realism AI Psychological Counselor [26.8] textttPsychEvalは、3つの重要な課題に対処するために設計された、マルチセッション、マルチセラピー、そして非常に現実的なベンチマークである。
メモリ連続性、適応推論、縦計画などの重要な機能を必要とする。
データセットには677以上のメタスキルと4577のアトミックスキルを含む、広範なプロフェッショナルスキルが注釈付けされている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 07:31:24 GMT)
Implicit Graph, Explicit Retrieval: Towards Efficient and Interpretable Long-horizon Memory for Large Language Models [26.7] 暗黙的なグラフメモリと明示的なサブグラフ検索を組み合わせたメモリフレームワークであるLatntGraphMemを提案する。
LatentGraphMemは、安定性と効率性のためにグラフ構造化メモリを潜時空間に格納する。
複数のモデルスケールにわたるロングホライゾンベンチマークの実験によると、LatentGraphMemは、明示的なグラフと潜在メモリのベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:10:10 GMT)
DCG ReID: Disentangling Collaboration and Guidance Fusion Representations for Multi-modal Vehicle Re-Identification [26.5] マルチモーダル車両リID(DCG-ReID)におけるディスタングル協調と誘導融合表現を提案する。
具体的には、相互干渉を伴わない不均一な品質分散モーダルデータを切り離すために、まず動的信頼に基づくDCDW(Disentangling Weighting)機構を設計する。
筆者らは,(1)品質分布の均衡化,(CFM)コラボレーション・フュージョン・モジュール(CFM)が共有識別情報の収集とクラス内整合性向上のために相互にコンセンサス特性をマイニングすること,(2)不均衡分布の調整,(GFM)誘導融合モジュール(GFM)が支配的モダリティの強化のために偏差増幅を実装していること,の2つのシナリオ特異的融合戦略を開発した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:09:19 GMT)
Learning to Nudge: A Scalable Barrier Function Framework for Safe Robot Interaction in Dense Clutter [26.5] 従来の安全フレームワークは、接触を安全でないものとして扱い、ロボットが衝突を避けることを制限している。
提案手法は,マルチオブジェクト・ダイナミックスを明示的にモデル化する計算複雑性を回避している。
本研究では, 衝突のない航法を可能にする手法を実証し, 密閉クラッタのシミュレーション実験により本手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:42:09 GMT)
CodeMEM: AST-Guided Adaptive Memory for Repository-Level Iterative Code Generation [26.4] インタラクションが進むにつれて、リポジトリのコンテキストを保存し、更新して、新たに検証された情報を統合する必要があります。
既存のメモリ管理アプローチは、将来性を示すが、自然言語中心の表現によって制限される。
本稿では,リポジトリレベルの反復コード生成に適したAST誘導動的メモリ管理システムであるCodeMEMを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:57:19 GMT)
SketchThinker-R1: Towards Efficient Sketch-Style Reasoning in Large Multimodal Models [26.2] SketchThinker-R1は、大規模なマルチモーダルモデルにおいてスケッチスタイルの推論能力にインセンティブを与える。
本手法は,3つの基本段階から構成される。Sketch-Mode Cold Startの段階では,標準長推論処理をスケッチ型推論に変換する。
次に、モデルの思考プロセスを明確に評価し、スケッチスタイルの推論により高いスコアを割り当てるSketchJudge Reward Modelを訓練する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:55:23 GMT)
EComStage: Stage-wise and Orientation-specific Benchmarking for Large Language Models in E-commerce [26.0] 大規模言語モデル(LLM)ベースのエージェントは、ますますeコマースアプリケーションにデプロイされている。
EComStageは、総合的な段階的推論プロセスにおけるエージェント対応LCMを評価するための統一ベンチマークである。
私たちは、オープンソースモデルやクローズドソースAPIを含む、1Bから200Bのパラメータにまたがる30以上のLLMを評価しました。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:39:16 GMT)
Text-Guided Layer Fusion Mitigates Hallucination in Multimodal LLMs [25.8] TGIF(Text-Guided Inter-layer Fusion)は、エンコーダ層を深度的に「専門家」として扱う軽量モジュールである。
TGIFは幻覚、OCR、VQAベンチマークで一貫した改善を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:31:19 GMT)
D$^3$R-DETR: DETR with Dual-Domain Density Refinement for Tiny Object Detection in Aerial Images [25.4] 本稿ではD$3$R-DETRを提案する。
空間領域情報と周波数領域情報を融合することにより、低レベル特徴写像を洗練し、より正確な物体密度マップを予測する。
AI-TOD-v2データセットの実験では、D$3$R-DETRが既存の最先端検出器よりも小さな物体検出に優れていることが示されている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:21:50 GMT)
A UCB Bandit Algorithm for General ML-Based Estimators [25.0] ML-UCBは、任意の機械学習モデルとマルチアームバンディットフレームワークを統合する一般化された高信頼度有界アルゴリズムである。
シーケンシャルな意思決定のための洗練されたMLモデルをデプロイする際の根本的な課題は、トラクタブルな集中不平等の欠如である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:08:14 GMT)
Stable-RAG: Mitigating Retrieval-Permutation-Induced Hallucinations in Retrieval-Augmented Generation [24.6] Retrieval-Augmented Generationは、大規模言語モデルにおける事実幻覚を減らすための重要なパラダイムとなっている。
本稿では,置換誘導幻覚を緩和するために,置換感度推定を利用するStable-RAGを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:07:38 GMT)
DarkEQA: Benchmarking Vision-Language Models for Embodied Question Answering in Low-Light Indoor Environments [24.5] 視覚言語モデル(VLM)は、エンボディエージェントの中央推論モジュールとしてますます採用されている。
既存のベンチマークでは、その能力は理想的かつよく照らされた条件下で評価されているが、堅牢な24/7操作では、広範囲の視覚的劣化によるパフォーマンスが要求される。
In this present DarkEQA, a open-source benchmark for a EQA-relevant primitives under multi-level low-light conditions。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:24:09 GMT)
SentGraph: Hierarchical Sentence Graph for Multi-hop Retrieval-Augmented Question Answering [24.4] SentGraphは文レベルグラフベースのRAGフレームワークで、マルチホップ質問応答のための文間のきめ細かい論理的関係を明示的にモデル化する。
オンライン検索中、SentGraphはグラフ誘導型エビデンスの選択と経路拡張を行い、きめ細かい文レベルのエビデンスを取得する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:39:51 GMT)
EpiQAL: Benchmarking Large Language Models in Epidemiological Question Answering for Enhanced Alignment and Reasoning [24.3] EpiQALは、様々な疾患にまたがる疫学的問題に対する最初の診断基準である。
構築には、専門家が設計した分類指導、マルチモデル検証、検索に基づく難易度制御が組み合わされている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:49:10 GMT)
LongBench Pro: A More Realistic and Comprehensive Bilingual Long-Context Evaluation Benchmark [24.1] LongBench Proは、英語と中国語で自然に発生する1500の長文サンプルのより現実的なベンチマークである。
タスク固有のメトリクスによるきめ細かい分析と、コンテキスト要求の多次元分類をサポートする。
LongBench Proは、長いコンテキスト理解を進めるための堅牢なテストベッドを提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:01:59 GMT)
Parallel Latent Reasoning for Sequential Recommendation [23.6] 多様な推論軌道を同時に探索するための新しいフレームワークである PLR を提案する。
PLRは連続的な潜在空間における学習可能なトリガートークンを通して並列推論ストリームを構築する。
3つの実世界のデータセットの実験により、PLRは最先端のベースラインを大幅に上回ることを示した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:25:48 GMT)
Pearmut: Human Evaluation of Translation Made Trivial [23.3] 我々はPearmutを紹介した。Pearmutは軽量だが機能豊富なプラットフォームで、エンド・ツー・エンドの人間による評価を自動評価として簡単に行うことができる。
DA、ESA、MQMなどの標準評価プロトコルを実装しているが、新しいプロトコルのプロトタイピングを可能にする。
ドキュメントレベルのコンテキスト、絶対的かつコントラスト的な評価、注意チェック、ESAAI事前アノテーション、静的およびアクティブな学習ベースの割り当て戦略が特徴である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:21:03 GMT)
Towards Efficient 3D Object Detection for Vehicle-Infrastructure Collaboration via Risk-Intent Selection [23.2] リスクインテリジェント選択検出(RiSe)は、パラダイムを可視領域の識別からリスククリティカル領域の優先順位付けに移行する、インタラクション対応のフレームワークである。
RiSeは、高信頼度特徴を高相互作用領域からのみ伝達する意味選択的融合スキームを実装している。
本手法は,最先端検出精度を維持しつつ,通信量を全特徴共有の0.71%に削減する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:25:23 GMT)
Parameter-Robust MPPI for Safe Online Learning of Unknown Parameters [23.0] 本稿では,オンラインパラメータ学習と安全制約を統合したフレームワークを提案する。
PRMPPIは、Stein Variational Gradient Descentを通じてパラメータに対する粒子ベースの信念を維持している。
実験では、成功率の向上、トラッキングエラーの低減、ベースラインよりも正確なパラメータ推定が示されている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:44:11 GMT)
Jailbreaking LLMs Without Gradients or Priors: Effective and Transferable Attacks [22.5] RAILSは,モデルロジットのみで動作するフレームワークである。
RAILSは勾配依存を排除し、クロストケナイザーアンサンブル攻撃を可能にする。
RAILSは、複数のオープンソースモデルで100%近い成功率と、GPTやGeminiのようなクローズドソースシステムへの高いブラックボックス攻撃転送性を実現している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:14:13 GMT)
A Fast Semidefinite Convex Relaxation for Optimal Control Problems With Spatio-Temporal Constraints [22.2] 自律エージェントの最適制御問題(OC)の解決は、自動運転車から自動運転車まで、幅広いアプリケーションにおいて不可欠である。
ほとんどのOCPは、イベントタイミングと軌道とのカップリングのため、非ポイントである。
本稿では,水平線を時間制約付きセグメントに分割する時間スケーリング直接多重撮影方式を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:38:19 GMT)
Channel Knowledge Map Construction via Guided Flow Matching [22.2] 線形輸送誘導フローマッチング(LT-GFM)に基づく新しいフレームワークを提案する。
本稿では,従来のチャネルゲインマップ(CGM)構築だけでなく,より困難な相関マップ(SCM)構築にも適用可能な統一アーキテクチャを提案する。
シミュレーションの結果, LT-GFMはFréchet Inception Distance (FID) よりも有意に低い分布忠実度を実現し, DDPMに比べて25倍の速度で推論速度を加速することがわかった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:25:56 GMT)
Breaking Self-Attention Failure: Rethinking Query Initialization for Infrared Small Target Detection [22.1] 赤外線小目標検出(IRSTD)は、低信号対雑音比(SNR)、小さなターゲットサイズ、複雑な乱雑な背景のために大きな課題に直面している。
最近のDETRベースの検出器は、IRSTDに顕著な性能劣化を示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:14:01 GMT)
Batch-of-Thought: Cross-Instance Learning for Enhanced LLM Reasoning [22.0] Batch-of-Thought (BoT)は、クロスインスタンス学習を可能にするために、関連するクエリを共同で処理するトレーニング不要の手法である。
バッチ間で比較分析を行うことで、BoTは高品質な推論テンプレートを特定し、一貫性チェックを通じてエラーを検出し、計算コストを償却する。
3つのモデルファミリーと6つのベンチマーク実験により、BoT-Rは推論コストを最大61%削減しつつ、精度と信頼性の校正を一貫して改善することを示した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:47:45 GMT)
GRRE: Leveraging G-Channel Removed Reconstruction Error for Robust Detection of AI-Generated Images [21.9] G- Channel Removed Reconstruction Error (GRRE) は、堅牢なAI生成画像検出にこの差を利用した、シンプルで効果的な方法である。
GRREは、トレーニング中に見えないものを含む複数の生成モデル間で、高い検出精度を一貫して達成する。
これらの結果は、生成AI時代における画像の真正性を保護するための強力な法医学的ツールとして、チャネル除去に基づく再構築の可能性を強調している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:53:10 GMT)
Vulnerabilities of Audio-Based Biometric Authentication Systems Against Deepfake Speech Synthesis [21.9] 非常に小さなサンプルで訓練された現代の音声クローニングモデルは、商用話者認証システムを簡単に回避することができる。
アンチスプーフィング検出器は、様々な音声合成方法の一般化に苦慮している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:55:32 GMT)
Reinforcement Learning for Follow-the-Leader Robotic Endoscopic Navigation via Synthetic Data [21.6] 本稿では,内視鏡本体と腸管壁との接触を最小限に抑えるために,フレキシブルな連続構造に基づく内視鏡ロボットについて述べる。
単眼深度推定による視覚に基づく深部強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:15:53 GMT)
Learning User Preferences Through Interaction for Long-Term Collaboration [21.4] MultiSessionCollabは、エージェントがいかにユーザの好みを学習できるかを評価するベンチマークである。
本稿では,対話体験の蓄積に伴ってユーザの嗜好を持続・改善するメモリを備えた長期協調エージェントを提案する。
実験によると、メモリを装備するエージェントは、長期的なコラボレーションを改善し、タスクの成功率を高め、より効率的なインタラクションを実現し、ユーザの労力を削減できる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:26:22 GMT)
Effective Online 3D Bin Packing with Lookahead Parcels Using Monte Carlo Tree Search [20.6] ロボットアームを搭載したオンライン3D Bin Packing(3D-BP)は、現代の物流における輸送と労働コストの削減に不可欠である。
オンライン3D-BPをモデル予測制御(MPC)問題として、ルックアヘッドパーセルで定式化し、モンテカルロ木探索(MCTS)フレームワークを適用して解決する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:51:11 GMT)
Reliability-Aware Adaptive Self-Consistency for Efficient Sampling in LLM Reasoning [20.4] 自己整合性はマルチサンプルアグリゲーションによる推論信頼性を向上させるが、かなりの推論コストを発生させる。
本稿では,この制限に対処する信頼性適応型自己整合性(ReASC)を提案する。
ReASCは、既存のベースラインと比較して常に最高の精度とコストのトレードオフを達成し、3Bから27Bパラメータのモデルスケールでの推論効率を向上させる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:27:53 GMT)
LUT-KAN: Segment-wise LUT Quantization for Fast KAN Inference [20.3] 本稿では,PyKanスタイルのkan層に対するLUTコンパイルおよび量子化手法であるLUT-KANを紹介する。
LUT-KANは、各エッジ関数をアフィンInt8/uint8量子化および線形化したセグメントごとのLUTに変換する。
複数の種にまたがる平均および標準偏差による精度,速度,メモリ計測値について報告する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:00:45 GMT)
Guardians of the Hair: Rescuing Soft Boundaries in Depth, Stereo, and Novel Views [20.3] 本稿では,3次元視覚タスクにおける細粒度境界の詳細を復元するフレームワークであるHairGuardを紹介する。
HairGuardはモノクロ深度推定、ステレオ画像/ビデオ変換、新しいビュー合成など、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:02:34 GMT)
Safety at One Shot: Patching Fine-Tuned LLMs with A Single Instance [20.1] 安全アライメントは, 単一の安全事例のみで完全に回復可能であることを示す。
安全勾配の低ランク構造を明らかにし,なぜこのような効率的な補正が可能かを説明する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:04:31 GMT)
SimRPD: Optimizing Recruitment Proactive Dialogue Agents through Simulator-Based Data Evaluation and Selection [19.8] SimRPDは、プロアクティブな対話エージェントを訓練するための3段階のフレームワークである。
まず,大規模な会話データを合成する高忠実度ユーザシミュレータを開発する。
次に,Chain-of-Intentionに基づく多次元評価フレームワークを提案する。
最後に、選択したデータセットに基づいて、採用プロアクティブ対話エージェントを訓練する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:00:15 GMT)
CREAM: Continual Retrieval on Dynamic Streaming Corpora with Adaptive Soft Memory [19.6] CREAMは、メモリベースの連続検索のための自己教師型フレームワークである。
教師なしの環境では、目に見えないトピックと見えないトピックの両方に適応します。
2つのベンチマークデータセットの実験は、CREAMが優れた適応性と精度を示すことを示した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:47:49 GMT)
To Generate or Discriminate? Methodological Considerations for Measuring Cultural Alignment in LLMs [19.5] ソシオデデデモグラフィープロンプト(SDP)は、大規模言語モデルの応答をステレオタイプで偏りがあることを示す。
これを解決するために、逆社会デマトグラフィープロンプト(ISDP)を用いて、LCMに実際のユーザ行動とシミュレーションされたユーザの行動とを区別し、予測するよう促す。
その結果、SDPの示唆に反して、モデルはシミュレーションされたモデルよりも実際の振る舞いの方が優れていることが示された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:42:03 GMT)
Mass Concept Erasure in Diffusion Models with Concept Hierarchy [19.3] 消去された概念を親子構造に整理するスーパータイプサブタイプ概念階層を提案する。
概念を個別に消去するのではなく,効果的かつ効率的なグループワイド抑制手法を導入する。
さまざまな領域にまたがる概念の同時消去を必要とする、より困難なベンチマークを構築します。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:41:15 GMT)
Hypothesize-Then-Verify: Speculative Root Cause Analysis for Microservices with Pathwise Parallelism [19.3] SpecRCAは、thithypothesize-then-verifyパラダイムを採用した投機的根本原因分析フレームワークである。
AIOps 2022に関する予備的な実験では、既存のアプローチよりも精度と効率が優れていることが示されている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:58:25 GMT)
Agentic Memory Enhanced Recursive Reasoning for Root Cause Localization in Microservices [19.2] Site Reliability Engineers (SRE) 障害の根本原因をローカライズする。
従来のグラフベースのディープラーニングアプローチは、事前に定義されたスキーマに大きく依存することが多い。
本稿では,ルート原因ローカライゼーションのためのエージェントメモリ拡張フレームワークAMER-RCLを紹介する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:50:14 GMT)
SlingBAG Pro: Accelerating point cloud-based iterative reconstruction for 3D photoacoustic imaging with arbitrary array geometries [19.0] SlingBAG Proは,スライディングボール適応成長法(SlingBAG)のポイントクラウド反復概念に基づく高度な再構成アルゴリズムである。
SlingBAG Proは高い復元品質を維持し、必要なトランスデューサの数を削減し、階層的な最適化戦略を採用している。
元のSlingBAGアルゴリズムと比較して、SlingBAG Proは不規則な配列ジオメトリの下で、ポイントクラウドベースの3D PA再構成において最大2.2倍の速度向上を実現している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:50:28 GMT)
Scaling Laws of Machine Learning for Optimal Power Flow [18.9] 深層ニューラルネットワーク(DNN)のような機械学習アプローチは、OPFソリューションの速度と性能を向上させるために広く研究されている。
既存の研究では、これらのスケーリング関係を定量化することなく、離散的なシナリオを評価する。
この研究は、MLベースのOPFの2次元にわたる最初の体系的スケーリング研究である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:32:37 GMT)
DreamStyle: A Unified Framework for Video Stylization [18.8] ビデオスタイリングのための統合フレームワークDreamStyleを紹介する。
1)テキスト誘導、(2)スタイル誘導、(3)ファーストフレーム誘導ビデオスタイリングをサポートする。
質的および定量的な評価は、DreamStyleが3つのビデオスタイリングタスク全てに適していることを示している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 07:42:12 GMT)
ECLIPTICA - A Framework for Switchable LLM Alignment via CITA - Contrastive Instruction-Tuned Alignment [18.7] ECLIPTICAは、アライメントを命令駆動で実行時制御可能なものとして扱う。
安全要件、ユーザロール、ガバナンス制約の進化の下で、即時に振る舞いを調整します。
命令調整効率は86.7%に達し、DPO(56.1%)、GRPO(36.1%)、PPO(20.4%)を上回った。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:28:26 GMT)
Context-aware Privacy Bounds for Linear Queries [18.6] 最大漏洩点レンズを用いてLaplace機構のプライバシ解析を再検討する。
DPフレームワークの分布に依存しない定義は、しばしば過度なノイズを課すことを実証する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:34:04 GMT)
JPU: Bridging Jailbreak Defense and Unlearning via On-Policy Path Rectification [18.5] 大規模言語モデル(LLM)は、しばしばジェイルブレイク攻撃に失敗する。
我々は、安全アンカーへの動的ジェイルブレイクパスの修正のために、$textbfJ$ailbreak $textbfP$ath $textbfU$nlearning (JPU)を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:30:10 GMT)
The Illusion of Specialization: Unveiling the Domain-Invariant "Standing Committee" in Mixture-of-Experts Models [18.4] エキスパートモデルの混合は、スパースルーティングによってドメインの特殊化を実現すると広く仮定されている。
我々は,個別の専門家ではなく,専門家グループレベルでのルーティング行動を分析するフレームワークであるCOMMITTEEAUDITを紹介する。
私たちは、スタンドング委員会が、ドメイン、レイヤ、およびルーティング予算をまたいだルーティングマスの大部分を一貫して捉えていることに気付きました。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:29:45 GMT)
Fine-Grained Generalization via Structuralizing Concept and Feature Space into Commonality, Specificity and Confounding [18.0] ファイングラインド・ドメイン・ジェネリゼーション(FGDG)は、従来のドメイン・ジェネリゼーションよりも大きな課題を示す。
ドメインシフトの下では、モデルはきめ細かなキューに過度に敏感になり、重要な特徴の抑制とパフォーマンスの大幅な低下につながります。
本稿では,概念と特徴空間を3つの構造成分に分解するための概念-特徴構造一般化(CFSG)を提案する。
CFSGはベースラインモデルよりも平均9.87%の性能向上を実現し、既存の最先端手法を平均3.08%上回っている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:39:09 GMT)
HarmonRank: Ranking-aligned Multi-objective Ensemble for Live-streaming E-commerce Recommendation [18.0] ライブストリーミングのeコマースは、購入とユーザーとストリームの双方のインタラクションのバランスをとるためのランキングメカニズムを必要とする。
本稿では,複数目的のアンサンブルフレームワークであるHarmonRankを提案する。
提案手法は,4億DAUのライブストリーミングEコマースレコメンデーションプラットフォームに完全デプロイされ,2%以上の購入率に寄与している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:59:02 GMT)
Accelerating Storage-Based Training for Graph Neural Networks [18.0] 本稿では,AGNES という新しいストレージベース GNN トレーニングフレームワークを提案する。
AGNESは、ブロックワイドストレージI/O処理を用いて、高性能ストレージデバイスのI/O帯域をフル活用する。
常に4つの最先端の手法よりも4.1倍高速である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:51:54 GMT)
Forget Many, Forget Right: Scalable and Precise Concept Unlearning in Diffusion Models [17.9] ScaPreは、大規模なアンラーニングに適した統合フレームワークである。
スペクトルトレース正則化と幾何アライメントを統合し、最適化を安定させ、対立を抑え、グローバルな構造を維持する。
許容できる品質制限の中で最高のベースラインよりも、$times mathbf5$以上の概念を忘れています。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:59:17 GMT)
The World is Not Mono: Enabling Spatial Understanding in Large Audio-Language Models [17.7] 聴覚場面分析(ASA)のための階層的枠組みを導入する。
本稿では,Qwen2-Audioのようなモデルを用いて,複雑な音響世界を理解し,推論するシステムを提案する。
我々の研究は、大規模モデルの強力な推論能力を総合音響シーン解析に活用するための明確な経路を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:54:47 GMT)
When Prompting Meets Spiking: Graph Sparse Prompting via Spiking Graph Prompt Learning [17.0] Graph Prompt Feature (GPF) 学習は、下流タスクでトレーニング済みのGNNモデルを適応するために広く利用されている。
本稿では、スパイキングニューロン機構、スパイキンググラフプロンプト特徴(SpikingGPF)を活用することにより、学習用スパースグラフプロンプトを提案する。
我々のアプローチは、スパイキングニューロンが安価な情報処理を実行し、グラフスパースプロンプトのタスクに自然に適合するスパースアウトプットを生成できるという観察に動機づけられている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 02:22:04 GMT)
GAMBIT: A Gamified Jailbreak Framework for Multimodal Large Language Models [16.7] 本稿では,ゲーム勝利の一環として,探索,意図の再構築,回答を行うモデルを駆動する新しいフレームワークを提案する。
GAMBITは高い攻撃成功率(ASR)を達成し、Gemini 2.5 Flashで92.13%、QvQ-MAXで91.20%、GPT-4oで85.87%に達した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:09:10 GMT)
SoulX-FlashTalk: Real-Time Infinite Streaming of Audio-Driven Avatars via Self-Correcting Bidirectional Distillation [16.3] textbfX-FlashTalkは、textbf32 FPSのリアルタイムスループットを達成しながら、textbfsub秒の起動遅延(0.87秒)を達成する14Bスケールのシステムである。
SoulX-FlashTalkは、Textbf32 FPSのリアルタイムスループットを達成しつつ、Textbfsub秒の起動遅延(0.87秒)を達成する最初の14Bスケールシステムである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:58:08 GMT)
UniSRCodec: Unified and Low-Bitrate Single Codebook Codec with Sub-Band Reconstruction [16.2] ニューラルオーディオコーデック(NAC)は、コンパクトな圧縮と再構成を実行することで送信オーバーヘッドを低減することができる。
既存のNACは、マルチコードブックとシングルコードブックコーデックの2つのカテゴリに分けられる。
提案するUniSRCodecは,高サンプリングレート,低帯域幅,高忠実度,統一性をサポート可能なシングルコードブックである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 07:20:05 GMT)
STReasoner: Empowering LLMs for Spatio-Temporal Reasoning in Time Series via Spatial-Aware Reinforcement Learning [16.1] 時系列における時空間推論には、時間力学、空間依存、テキストコンテキストの明示的な合成が含まれる。
この能力は、交通ネットワークや電力網、病気の伝播といったシステムにおける高い意思決定に不可欠である。
このギャップに対処するために、エチオロジー推論、エンティティ識別、相関推論、コンテキスト内予測を含む4つのコアタスクからなるベンチマークであるST-Benchを導入する。
次に,STReasonerを提案し,LLMが時系列,グラフ構造,テキストを明示的な推論のために統合できるようにする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:46:12 GMT)
MedDialogRubrics: A Comprehensive Benchmark and Evaluation Framework for Multi-turn Medical Consultations in Large Language Models [15.9] 5,200件の患者と6万件以上のきめ細粒度評価ルーブリックからなる新規なベンチマークであるMedDialogRubricsについて紹介する。
本フレームワークでは,実世界の電子的健康記録にアクセスすることなく,現実的な患者記録と主訴を合成するマルチエージェントシステムを採用している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:56:33 GMT)
DreamLoop: Controllable Cinemagraph Generation from a Single Photograph [15.9] 一つの写真から映像を生成するための、制御可能なビデオ合成フレームワークDreamLoopを紹介する。
私たちのキーとなるアイデアは、時間的ブリッジングとモーションコンディショニングという2つの目標に基づいて、一般的なビデオ拡散モデルを適用することです。
提案手法は,ユーザ意図に整合した高品質で複雑なシネマグラフを製作し,既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:41:40 GMT)
SOP: A Scalable Online Post-Training System for Vision-Language-Action Models [15.9] 視覚言語アクション(VLA)モデルは、大規模な事前訓練を通じて強力な一般化を実現するが、現実の展開には幅広い汎用性に加えて、専門家レベルのタスク能力が必要である。
VLAモデルの既存のトレーニング後のアプローチは、通常、オフライン、シングルロボット、タスク固有である。
本稿では,一般VLAモデルのオンライン,分散,マルチタスクのポストトレーニングを物理世界に直接適用可能なスケーラブルオンラインポストトレーニングシステムを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:25:11 GMT)
Unified Meta-Representation and Feedback Calibration for General Disturbance Estimation [15.8] 本稿では,メタラーニングとフィードバック校正によるオンライン適応に基づく外乱推定フレームワークを提案する。
過去の観測の有限時間窓から特徴を抽出することにより、一般的な非構造的乱れを効果的に捉える統一表現を学習することができる。
本研究の枠組みは, 四重項飛行実験で示されるように, 複数の急激な乱れを効果的に推定する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:53:19 GMT)
VNU-Bench: A Benchmarking Dataset for Multi-Source Multimodal News Video Understanding [15.8] 本稿では,ニュース領域におけるマルチソース・クロスビデオ理解のための最初のベンチマークであるVNU-Benchを紹介する。
様々な角度からマルチソース・マルチモーダル・ニュースを理解するための実験モデルに特有の新しい質問タイプを設計する。
データセットには429のニュースグループ、1,405の動画、2,501の高品質な質問が含まれている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:42:44 GMT)
Physics-Informed Gaussian Process Regression for the Constitutive Modeling of Concrete: A Data-Driven Improvement to Phenomenological Models [15.6] この研究は、カラゴジアン・アンド・ケースコンクリートモデルのモジュラーエラスト塑性構造を保持する物理インフォームドフレームワークを開発する。
実験的な障害表面を、実験的にアクセス可能な可観測物から直接学ぶことができる制約付きガウスプロセス回帰サロゲートに置き換える。
その結果,非拘束型GPRはトレーニング条件付近でよく補間されるが,外挿条件下では身体的制約が悪化し,不適切であることがわかった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:09:40 GMT)
Window-based Membership Inference Attacks Against Fine-tuned Large Language Models [15.4] 我々はWBC(Window-Based Comparison)を導入し,この知見を手話に基づくアグリゲーションを用いたスライディングウインドウアプローチにより活用する。
提案手法では,テキストシーケンス毎に異なるサイズのウィンドウをスライドし,各ウィンドウがメンバシップにバイナリ投票を行う。
幾何学的に空間化されたウィンドウサイズで票をアンサンブルすることで、トークンレベルのアーティファクトからフレーズレベルの構造への記憶パターンをキャプチャする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:37:27 GMT)
M-RAG: Making RAG Faster, Stronger, and More Efficient [15.1] 大規模言語モデルのための新しいチャンクフリー検索戦略であるM-RAGを提案する。
M-RAGは構造化されたk-v分解メタマーカーを軽量で意図に整合した検索キーで抽出する。
M-RAGは高い効率で解答フレンドリーな証拠を回収できることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:14:54 GMT)
DIP: Dynamic In-Context Planner For Diffusion Language Models [15.1] textbfDynamic textbfIn-Context textbfPlanner (DIP)を提案する。
その結果、DIPは、標準推論よりも最大12.9$times$推論スピードアップ、KVキャッシュ強化推論よりも1.17$times$生成品質を維持している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:24:16 GMT)
ReCCur: A Recursive Corner-Case Curation Framework for Robust Vision-Language Understanding in Open and Edge Scenarios [14.9] ノイズの多いWebイメージを監査可能なきめ細かいラベルに変換するフレームワークであるReCCurを提案する。
現実的なコーナーケースのシナリオでは、ReCCurはコンシューマグレードのGPUで動作し、純度と分離性を着実に改善する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:36:43 GMT)
AnyDepth: Depth Estimation Made Easy [14.9] 単眼深度推定は2次元画像から3次元シーンの深度情報を復元することを目的としている。
最近の研究は大きな進歩を遂げているが、大規模なデータセットや複雑なデコーダに依存しているため、効率と一般化能力は制限されている。
ゼロショット単眼深度推定のための軽量でデータ中心のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:51:35 GMT)
Simulating Complex Multi-Turn Tool Calling Interactions in Stateless Execution Environments [14.5] DiGiT-TCは、ステートフルな環境で検索によって生成された会話の特徴を持つ会話を呼び出すツールを作成するように設計されている。
標準ツール呼び出しベンチマークに対する我々のアプローチを検証するとともに、ステートフルな問題設定においても、我々のアプローチはパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:04:30 GMT)
M-SEVIQ: A Multi-band Stereo Event Visual-Inertial Quadruped-based Dataset for Perception under Rapid Motion and Challenging Illumination [14.5] M-SEVIQは、ステレオイベントカメラ、フレームベースのカメラ、慣性測定ユニット(IMU)、およびジョイントエンコーダを備えたUnitree Go2を用いて収集された、多バンドのステレオイベント可視化および慣性四倍体データセットである。
このデータセットには、異なる速度レベル、照明波長、照明条件でキャプチャされた30以上の実世界のシーケンスが含まれている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 07:23:34 GMT)
pdfQA: Diverse, Challenging, and Realistic Question Answering over PDFs [14.4] マルチドメイン2K人間アノテーション(real-pdfQA)と2K合成データセット(syn-pdfQA)について述べる。
両データセットに品質と難易度フィルタを適用して評価し、有効なQAペアと挑戦的なQAペアを得る。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:22:59 GMT)
Quantum key distribution without authentication and information leakage [14.2] 量子鍵分布(QKD)は、最も広く研究されている量子暗号モデルである。
そこで我々は,個別の認証機構を必要としない新しいQKD変種を提案する。
我々の設計は(ほとんど)プロトコルキーを再利用して完全な情報理論のセキュリティを実現する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:25:45 GMT)
Time-Scaling Is What Agents Need Now [14.0] 人間は時間化シーケンシャル推論によって限られた認知資源の下で問題を解決する。
DeepSeek-R1のような最近のモデルでは、明示的な推論トラジェクトリによってパフォーマンスが向上している。
タイムスケーリング(Time-Scaling)は、拡張時間経路を利用したアーキテクチャ設計である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:01:17 GMT)
Learning from Prompt itself: the Hierarchical Attribution Prompt Optimization [13.9] 構造化最適化アプローチでは、改良されたプロンプトを開発するには、自動または半自動の手順が必要である。
現在のプロンプト最適化手法は、しばしばプロンプトドリフトを誘導し、新しいプロンプトが前の障害を修正するが、以前成功したタスクのパフォーマンスを損なう。
本研究では,(1)学習データにおける誤りパターンをターゲットとした動的帰属機構,(2)機能的プロンプトセグメントを編集するための意味単位最適化,(3)エンドツーエンドのLSMとLM-MLLMの両方をサポートするマルチモーダル・フレンドリなプロンプト・プロンプト・フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:34:17 GMT)
Geometric and Dynamic Scaling in Deep Transformers [13.7] 我々は、ディープトランスフォーマーの崩壊は基本的に幾何学的な問題であると主張する。
2つの原則によりこれらの障害に対処する統一的な幾何学的枠組みを提案する。
超深層ネットワークにおけるランク崩壊を回避するためには, 動的消去を許容しながら幾何的妥当性を強制することが重要であると予測した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:35:54 GMT)
HOLO: Homography-Guided Pose Estimator Network for Fine-Grained Visual Localization on SD Maps [13.6] マルチビュー画像と標準定義(SD)マップ間の視覚的微粒化のための,新しいホモグラフィ誘導ポーズ推定ネットワークを提案する。
我々の知る限りでは、画像からマップへのローカライゼーションのためのホモグラフィ学習とBEVセマンティック推論を統合化するための最初の試みである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:48:47 GMT)
CaricatureGS: Exaggerating 3D Gaussian Splatting Faces With Gaussian Curvature [13.5] 顔のための制御可能で制御可能な3Dキャラクタライゼーションフレームワークを紹介する。
我々は3Dガウススティング(3DGS)を利用しており、これは近年、現実的な自由視点アバターを生み出すことが示されている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:56:28 GMT)
Lil: Less is Less When Applying Post-Training Sparse-Attention Algorithms in Long-Decode Stage [13.5] スパースアテンションは、パラドックス的にエンドツーエンドの複雑さを増大させる可能性がある。
本稿では,情報損失が情報ゲインを超える閾値を検出する早期探索アルゴリズムを提案する。
我々のアルゴリズムは、推論集約ベンチマークで2%未満の限界精度でトークン消費を最大90%削減する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:23:58 GMT)
Maximizing Local Entropy Where It Matters: Prefix-Aware Localized LLM Unlearning [13.5] 本研究では,時間的・語彙的両面にわたる局所的なエントロピー目標によって駆動されるPALU(Prefix-Localized Unlearning)を提案する。
PALUは、最先端のベースラインに比べて、忘れることの有効性と実用性を維持するのに優れている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:10:48 GMT)
Scalable Tree Ensemble Proximities in Python [13.3] 本稿では,分離重み付きリーフ衝突確率の族を定義することによって,効率的な近接計算のための一般的なフレームワークを提案する。
この家系の任意の近接測度は、厳密なスパース行列の分解を認め、計算を葉面衝突に制限し、明示的なペアワイズ比較を避けることを示します。
この定式化により、Pythonのスパース線形代数を用いた低メモリでスケーラブルな近接計算が可能となる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:57:43 GMT)
FCMBench: A Comprehensive Financial Credit Multimodal Benchmark for Real-world Applications [13.2] FCMBenchは、現実世界のアプリケーションのための大規模金融クレジットマルチモーダルベンチマークである。
18のコア証明書タイプ、4,043のプライバシ準拠イメージ、8,446のQAサンプルを含んでいる。
現代の視覚言語モデルにおいて、性能格差と堅牢性を効果的に識別することができる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:08:49 GMT)
ATLAS: Adaptive Test-Time Latent Steering with External Verifiers for Enhancing LLMs Reasoning [13.1] 我々はATLAS(Adaptive Test-Time Latent Steering)を提案する。
ATLASは外部の軽量潜伏検証器を用いて推論時のステアリング決定を動的に制御する。
複数の数学的推論ベンチマークの実験は、ATLASがバニラ復号化と固定ステアリングベースラインの両方を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:27:24 GMT)
PhysSFI-Net: Physics-informed Geometric Learning of Skeletal and Facial Interactions for Orthognathic Surgical Outcome Prediction [12.8] PhysSFI-Netは、矯正手術後の軟部組織の変形を正確に予測するための物理インフォームドな幾何学的深層学習フレームワークである。
モデル性能は点雲形状誤差,表面偏差誤差,ランドマーク位置誤差を用いて評価した。
PhysSFI-Net は点雲形状誤差 1.070 +/- 0.088 mm、表面偏差誤差 1.296 +/- 0.349 mm、ランドマーク局在誤差 2.445 +/- 1.326 mm を達成した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:24:05 GMT)
UltraLogic: Enhancing LLM Reasoning through Large-Scale Data Synthesis and Bipolar Float Reward [12.7] 本稿では,問題の論理的核を自然言語表現から切り離す枠組みであるUltraLogicを提案する。
このフレームワークは、数百のユニークなタスクタイプと、10の難易度にまたがる自動キャリブレーションパイプラインで構成されている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:41:32 GMT)
Tackling the Inherent Difficulty of Noise Filtering in RAG [12.6] Retrieval-Augmented Generation (RAG) はLarge Language Models (LLMs) の拡張手法として広く採用されている。
ノイズや無関係なドキュメントは、RAG中にしばしば導入され、パフォーマンスが低下し、幻覚的なアウトプットを引き起こします。
そこで本研究では,検索した文書に含まれる関連情報と無関係情報とを識別する能力を高めるために,新たな微調整手法を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:41:23 GMT)
Closing the Reality Gap: Zero-Shot Sim-to-Real Deployment for Dexterous Force-Based Grasping and Manipulation [12.5] 複数の指を持つ人間のような器用な手は、人間レベルの操作機能を提供する。
しかし、実際のハードウェアに直接デプロイ可能なトレーニングコントロールポリシは、コンタクトリッチな物理のため、依然として難しいままです。
本稿では,高密度触覚フィードバックと関節トルクセンシングを併用して身体的相互作用を調節する実践的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 07:26:39 GMT)
Enhancing Multilingual RAG Systems with Debiased Language Preference-Guided Query Fusion [12.5] MRAGシステムは高リソース言語、特に英語に好まれることが多い。
このような測定は、評価ベンチマークに固有の構造的先行性によって著しく歪められていることが判明した。
DeLP(Debiased Language Preference)は,これらの構造的欠点を明確化するための校正指標である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:01:56 GMT)
VLN-MME: Diagnosing MLLMs as Language-guided Visual Navigation agents [12.4] ゼロショットエージェントとしてMLLMを探索するための統一的評価フレームワークを提案する。
高度にモジュール化されたアクセシブルな設計で評価を単純化する。
我々は,CoT推論と自己言語によるベースラインエージェントの強化が,予期せぬ性能低下につながることを観察した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:00:10 GMT)
Beyond Immediate Activation: Temporally Decoupled Backdoor Attacks on Time Series Forecasting [12.3] TDBAは、TS予測のための時間的に分離されたバックドアアタックフレームワークである。
ターゲットパターンの期待位置を符号化するトリガを注入することにより、TDBAは予測されたデータ内の任意の位置においてターゲットパターンの活性化を可能にする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:01:38 GMT)
Detecting Hallucinations in Retrieval-Augmented Generation via Semantic-level Internal Reasoning Graph [12.2] そこで本研究では,忠実な幻覚を検出するための意味レベルの内部推論グラフに基づく手法を提案する。
RAGTruth と Dolly-15k の最先端ベースラインと比較して総合的な性能が向上する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:35:20 GMT)
LAMS-Edit: Latent and Attention Mixing with Schedulers for Improved Content Preservation in Diffusion-Based Image and Style Editing [12.1] インバージョンプロセスから中間状態を活用するLAMS-Editを提案する。
両方のプロセスからの潜在表現とアテンションマップは、スケジューラによって制御される重み付けを用いて各ステップで結合される。
この技術はP2P(Prompt-to-Prompt)と統合され、LAMS編集フレームワークを形成し、リージョンマスクによる正確な編集をサポートし、LoRAによるスタイル転送を可能にする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:57:05 GMT)
PC2P: Multi-Agent Path Finding via Personalized-Enhanced Communication and Crowd Perception [12.1] PC2Pは、QラーニングベースのMARLフレームワークから派生した、新しい分散MAPF手法である。
動的グラフトポロジに基づくパーソナライズされたコミュニケーション機構を提案する。
致命的なデッドロック問題を解決するために,我々は地域ベースのデッドロック破滅戦略を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:11:26 GMT)
Can Embedding Similarity Predict Cross-Lingual Transfer? A Systematic Study on African Languages [12.1] 低リソースのアフリカ言語のためのNLPシステムを構築するためには、言語間移動が不可欠である。
816回の移動実験において,5つの埋め込み類似度指標を系統的に評価した。
その結果,コサインギャップと検索に基づく指標が転送成功を確実に予測できることが判明した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:39:28 GMT)
Metaphors are a Source of Cross-Domain Misalignment of Large Reasoning Models [12.0] 学習データ中のメタファーとLLMの推論内容の誤調整度との間には,強い因果関係がみられた。
我々は,メタファと大規模推論モデルの大域的および局所的潜在的特徴の活性化との間には関連性があることを観察した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:50:58 GMT)
Analysis of Various Manipulator Configurations Based on Multi-Objective Black-Box Optimization [12.0] 近年,ロボット基礎モデルの開発が活発化している。
これらのマニピュレータは、関節の順序やリンク長の比率がロボットによって異なるため、全く同じ構造を共有していない。
エンドエフェクタの到達性と関節トルクの観点から多目的最適化を行った。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:29:40 GMT)
Self-Supervised Learning from Noisy and Incomplete Data [11.9] 科学と工学の問題は、ノイズや不完全な観測から信号を推測することである。
最近のデータ駆動手法は、地上の信号や関連する観測例から直接解法を学習することで、より良い解を提供することが多い。
自己教師付き学習手法は、測定データのみからソルバを学習することで、有望な代替手段を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:40:50 GMT)
The Equivalence between Hardy-type paradox and Logical Contextuality [11.8] 任意の有限シナリオに対して、論理的ハーディ型パラドックスの存在は論理的文脈性と同値であることを示す。
これらの結果は (2,k,2), (2,2,d) および n-サイクルのシナリオに関する先行研究を一般化する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 02:26:30 GMT)
The performances of the Chinese and U.S. Large Language Models on the Topic of Chinese Culture [11.6] 本研究は, GPT-5.1, DeepSeek-V3.2, Qwen3-Max, Gemini2.5Pro などのモデルを評価するための直接探索パラダイムを採用する。
我々は、歴史、文学、詩、および関連する領域を含む伝統的な中国文化の理解を評価する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:03:01 GMT)
P-Check: Advancing Personalized Reward Model via Learning to Generate Dynamic Checklist [11.4] 我々は、パーソナライズされた報酬モデリングフレームワークであるP-Checkを提案する。
P-Checkは、報酬予測を導くための動的評価基準を合成するプラグアンドプレイチェックリストジェネレータを訓練する。
実験を行い、P-Checkは報酬の精度を向上するだけでなく、下流のパーソナライズされた生成も向上することを示した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:53:53 GMT)
Mitigating Prompt-Induced Hallucinations in Large Language Models via Structured Reasoning [11.3] 我々は、知識グラフ探索をガイドするコードモジュールを導入し、思考の連鎖のプロンプトの一部としてコードを組み込む。
複数の公開データセット上でGPT-4とLLaMA-3.3を用いて提案手法を実験的に評価した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:02:45 GMT)
Do LLMs Encode Functional Importance of Reasoning Tokens? [11.2] 推論トークンを反復的に除去する確率保存的削除手順であるgreedy pruningを提案する。
本研究では, プルーニングチェーンを訓練した学生が, 一致した推論長でフロンティアモデルによる圧縮ベースラインより優れていることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:50:02 GMT)
Correct, Concise and Complete: Multi-stage Training For Adaptive Reasoning [11.2] 教師付き微調整と強化学習を組み合わせた多段階効率的な推論手法を提案する。
提案手法は,8Bモデルでは平均28%,32Bモデルでは40%の応答長を減少させる。
より複雑な最先端の効率的な推論手法に比べて、優れたトレードオフを実現する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:31:51 GMT)
Enhanced 3D Gravity Inversion Using ResU-Net with Density Logging Constraints: A Dual-Phase Training Approach [10.8] 深層学習(DL)に基づくデータ駆動重力インバージョン法は、従来の正規化法に欠ける物理的特性回復能力を有する。
既存のDL手法は事前情報制約の不足に悩まされ、大きなデータ適合誤差と信頼性の低い結果の逆モデルに繋がる。
本稿では,上記の問題に対処するために,事前密度のよいログ情報を統合した新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:24:11 GMT)
Fine-tuning Small Language Models as Efficient Enterprise Search Relevance Labelers [10.7] そこで本稿では,SLM(small-Tune-Small Language Model)を高精度に評価する手法を提案する。
LLMを用いて、シード文書からリアルなエンタープライズクエリを合成し、BM25を用いてハードネガティブを検索し、教師のLSMを用いて関連スコアを割り当てる。
得られたデータセットはSLMに蒸留され、コンパクトなレバレンスラベルが生成される。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:48:40 GMT)
Improved Evidence Extraction for Document Inconsistency Detection with LLMs [10.6] 本稿では,新しい包括的エビデンス抽出指標と制約付きフィルタリングによる再試行フレームワークを提案する。
有望な実験結果で私たちの主張を支持します。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 00:58:20 GMT)
Optimizing Control-Friendly Trajectories with Self-Supervised Residual Learning [10.6] 現実世界の物理学は、現代の複雑なロボットシステムに対して、一定の精度で解析的にのみモデル化できる。
本稿では、上記の課題に対処するために、自己教師付き残差学習と軌道最適化の枠組みを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:01:58 GMT)
MixTTE: Multi-Level Mixture-of-Experts for Scalable and Adaptive Travel Time Estimation [10.5] 本稿では,リンクレベルのモデリングと産業用ルートレベルのTTEシステムを統合する,スケーラブルで適応的なフレームワークを提案する。
我々は、不均一なトラフィックパターンを扱うために、安定なグラフ混在ネットワークを構築した。
実世界のデータセットの実験により、MixTTEは7つのベースラインと比較して予測エラーを大幅に削減する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:40:20 GMT)
Dynamic Hyperparameter Importance for Efficient Multi-Objective Optimization [10.5] 多目的最適化(MOO)は、適切なMLモデルを選択する際の目的をトレードオフするために用いられる。
本稿では,様々な目的のトレードオフに基づいて,最も影響力のあるハイパーパラメータを優先する,新しい動的最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:37:44 GMT)
CageDroneRF: A Large-Scale RF Benchmark and Toolkit for Drone Perception [10.2] CageDroneRF (CDRF) は、無線周波数(RF)ドローンの検出と識別のための大規模なベンチマークである。
CDRFは既存のRFデータセットの不足と限られた多様性に対処する。
このデータセットは、さまざまな現代のドローンモデルにまたがる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:39:59 GMT)
Mechanistic Interpretability of Large-Scale Counting in LLMs through a System-2 Strategy [9.9] 大規模言語モデル(LLM)は、タスクのカウントにおいて体系的な制限を示す。
本稿では,システム2の認知プロセスにインスパイアされた簡易なテストタイム戦略を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:58:27 GMT)
Fast Conformal Prediction using Conditional Interquantile Intervals [9.9] 本稿では, ほぼ最小の予測区間を構成する共形回帰法であるCIR(Conformal Interquantile Regression)を導入する。
また、周波数間隔の幅に基づく選択規則を組み込んだCIR+を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 07:01:08 GMT)
Discriminating real and synthetic super-resolved audio samples using embedding-based classifiers [9.9] GAN(Generative Adversarial Network)と拡散モデルは最近,オーディオ超解像における最先端の性能を達成した。
ここでは、様々な埋め込み空間における実・超解音声の分離性について分析する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 22:10:45 GMT)
Motion Blur Robust Wheat Pest Damage Detection with Dynamic Fuzzy Feature Fusion [9.8] カメラの揺れによる動きのぼかしは、エッジオブジェクトの検出を著しく低下させるゴーストアーティファクトを生成する。
本稿では, 動的ファジィロバスト畳み込みピラミッドであるDFRCPをYOLOv11へのプラグインとして提案する。
DFRCPによるYOLOv11の精度はYOLOv11ベースラインよりも10.4%高い。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:28:21 GMT)
FROST-Drive: Scalable and Efficient End-to-End Driving with a Frozen Vision Encoder [9.8] 本稿では,VLM(Vision-Language Model)から事前学習したビジョンエンコーダの強力な一般化能力の維持と活用を目的とした新しいE2Eアーキテクチャを提案する。
エンコーダの重みを凍結させることにより、我々の手法はリッチで一般化された世界知識を直接 VLM から駆動タスクに転送する。
この結果から,有能なVLMの広い知識を維持することは,集中的なドメイン固有適応よりも堅牢で一般化可能な駆動性能を実現する上で,より効果的な戦略であることが示唆された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:13:35 GMT)
Better, But Not Sufficient: Testing Video ANNs Against Macaque IT Dynamics [9.8] 下側頭葉(IT)大脳皮質のマカク性視覚経路について検討した。
我々は, 静的, 再帰的, ビデオベースANNモデルに対して, ナチュラルビデオ中の仮面IT応答を比較した。
現在のビデオモデルは、ITで表現される外見不変の時間計算よりも、外見バウンドなダイナミクスをよりよく捉えている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:04:18 GMT)
FlexProofs: A Vector Commitment with Flexible Linear Time for Computing All Proofs [9.8] バッチオープニングを伴うマルチエクスポネントのための新しいベクトルコミットメントスキームであるFlexProofsを紹介する。
我々は、$N=216$と$b=log2N$の場合、FlexProofsはHydraProofsよりも6倍高速であることを示す。
我々の実験によると、$N=216$と$b=log2N$の場合、FlexProofsはHydraProofsより6倍速い。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:05:16 GMT)
Multiparameter quantum estimation with a uniformly accelerated Unruh-DeWitt detector [9.8] 本研究では,Unruh-DeWitt検出器を有界およびミンコフスキー真空の真空スカラー場に結合させた一様加速検出器について検討した。
量子クラメロ-ラオ境界は初期位相と重みパラメータを含む推定に対して厳密な誤差を与えることができない。
境界の場合、境界の導入は、ホレボ・クラメル・ラオ境界と長岡境界の両方の値が体系的に減少するのを観察する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:48:03 GMT)
Multi-Modal Data-Enhanced Foundation Models for Prediction and Control in Wireless Networks: A Survey [9.8] ファンデーションモデル(FM)は、人工知能(AI)の未来を形作り始めた革新的ブレークスルーとして認識されている
本稿では,無線ネットワークにおけるFM,特にマルチモーダルFMの利用について論じる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:59:29 GMT)
FTCircuitBench: A Benchmark Suite for Fault-Tolerant Quantum Compilation and Architecture [9.8] FTCircuitBenchは、インパクトのある量子アルゴリズムのベンチマークスイートとして機能する。
モジュール型のエンドツーエンドパイプラインでは、さまざまなフォールトトレラントアーキテクチャのアルゴリズムをコンパイルして分解することができる。
ツールキットは、各ステージで詳細な数値解析を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:08:46 GMT)
Language Hierarchization Provides the Optimal Solution to Human Working Memory Limits [9.6] 階層化は作業メモリ容量の制限という課題を最適に解決することを示す。
その結果,階層構造の構築は逐次言語入力の処理効率を最適化することが示唆された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:05:47 GMT)
LAUDE: LLM-Assisted Unit Test Generation and Debugging of Hardware DEsigns [9.5] 単体テストは、コンポーネント設計モジュールが機能的に正しく、システムレベルで統合される前に仕様に準拠していることを保証するため、ハードウェア設計ライフサイクルにおいて重要である。
ハードウェア設計のための統一された単体テスト生成およびデバッグフレームワークであるLAUDEを導入し、設計ソースコードのセマンティック理解を基礎的大言語モデル(LLM)のChain-of-Thought(CoT)推論能力と相互補完する。
We apply LAUDE with closed- and open-source LLMs to a large corpus of buggy hardware design codes from the VerilogEval dataset, where generated unit tests detect bugs。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:00:07 GMT)
A Unified Frequency Principle for Quantum and Classical Machine Learning [9.5] 本稿では、量子ニューラルネットワークのトレーニング力学を特徴付ける周波数原理(F-principle)の統一理論フレームワークを提案する。
この枠組みでは、量子ニューラルネットワークがターゲット関数の低周波成分の学習に対してスペクトルバイアスを示すことを示す。
本研究は,古典的および量子的学習のダイナミクスを統一し,学習性形成におけるノイズの役割を明らかにするとともに,雑音耐性量子ニューラルネットワークの設計を導くための周波数領域レンズを提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:44:22 GMT)
A Bi-directional Adaptive Framework for Agile UAV Landing [9.5] 本稿では,車両とプラットフォームの役割を再定義する双方向協調着陸フレームワークを提案する。
動的シナリオで検証されたこのフレームワークの有効性は、自律的二次的回復の効率、精度、堅牢性を大幅に改善する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:10:06 GMT)
Towards Agnostic and Holistic Universal Image Segmentation with Bit Diffusion [9.2] 本稿では,ユニバーサルイメージセグメンテーションのための拡散型フレームワークを提案する。
位置認識型パレットと2Dグレーのコード注文によって性能が向上することを示す。
提案した改善と大規模事前訓練や迅速な条件付けを組み合わせることで、競争モデルが実現できると考えています。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:07:14 GMT)
ChemBART: A Pre-trained BART Model Assisting Organic Chemistry Analysis [9.0] ChemBARTはSMILESベースの大規模言語モデルで、化学反応で事前訓練されている。
ChemBARTは、前駆体/試薬生成、温度収率回帰、分子特性分類、ポリシーと値関数の最適化など、様々な化学的問題を効果的に解決する。
本研究は, 反応中心の事前学習の能力を検証するとともに, 完全合成計画サイクルの進展におけるChemBARTの幅広い有用性を示すものである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:55:38 GMT)
Empirical Comparison of Encoder-Based Language Models and Feature-Based Supervised Machine Learning Approaches to Automated Scoring of Long Essays [8.9] 長いコンテキストは、テキスト処理においてエンコーダのみの言語モデルに課題を課すことがある。
この研究は、長いエッセイの自動評価のためのエンコーダベースの言語モデルをいくつか訓練した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 02:17:45 GMT)
MDAgent2: Large Language Model for Code Generation and Knowledge Q&A in Molecular Dynamics [8.8] MDAgent2は、分子動力学領域内で知識Q&Aとコード生成の両方を実行することができる最初のエンドツーエンドフレームワークである。
MD-Instruct と MD-Code の2つのドメイン適応型モデルを訓練するために,3段階の事前学習,教師付き微調整,強化学習を採用する。
さらに、コード生成、実行、評価、自己補正を統合するデプロイ可能なマルチエージェントシステムであるMDAgent2-RUNTIMEを構築します。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:33:09 GMT)
Listen to Rhythm, Choose Movements: Autoregressive Multimodal Dance Generation via Diffusion and Mamba with Decoupled Dance Dataset [8.7] Rhythm, Choose Movements (LRCM) は多様な入力モダリティと自己回帰ダンスモーション生成の両方をサポートする多モード誘導拡散フレームワークである。
受け入れ次第、完全なデータセットと事前トレーニングされたモデルを公開します。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:59:22 GMT)
Learning to Diagnose and Correct Moral Errors: Towards Enhancing Moral Sensitivity in Large Language Models [8.7] 道徳的良性および有害な入力を診断し,道徳的誤りを正すために,LLMをファシリケートする2つの実用的推論手法を提案する。
実用的推論手法の中心的な強みは、その推論手法を推論負荷に基づいて設計するための統一的な視点である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:09:05 GMT)
RPIQ: Residual-Projected Multi-Collaboration Closed-Loop and Single Instance Quantization for Visually Impaired Assistance [8.6] 本研究では,Residual-Projected Multi-Collaboration and Single Instance Quantization(RPIQ)という新しい量子化フレームワークを提案する。
OPT、Qwen、LLaMAのような言語モデルや、CagVLM2のような視覚言語モデルなど、様々な種類の大規模モデルの実験。
RPIQはモデルを4ビット表現に圧縮でき、ピークメモリ消費を大幅に削減できる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:22:34 GMT)
Discovering and Causally Validating Emotion-Sensitive Neurons in Large Audio-Language Models [8.6] 大規模音声言語モデル(LALM)における感情感受性ニューロン(ESN)のニューロンレベルでの解釈可能性の研究について紹介する。
複数の感情認識ベンチマークにおいて、周波数、エントロピー、等級、コントラストに基づくニューロンセレクタを比較した。
推論時間の介入を用いて、一貫した感情特異的なシグネチャを明らかにする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:46:35 GMT)
Learning to Act Robustly with View-Invariant Latent Actions [8.4] 視覚に基づくロボットポリシーは、視界不変の視覚表現の必要性を強調し、小さな視点の変化に苦しむことが多い。
本研究では,ビュー不変遅延行動 (VILA) を提案する。これは,物理力学に基づくビュー不変表現を学習するために,トラジェクトリ間で遷移パターンをキャプチャする潜在動作をモデル化する。
シミュレーションと実世界の双方の実験から、VILAベースのポリシーは見当たらない視点に効果的に一般化し、新しいタスクにうまく移行することが示された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:14:01 GMT)
Prioritized Replay for RL Post-training [8.2] 大規模言語モデルのRL後学習のための問題レベル優先順位付けフレームワークを提案する。
提案手法は,経験的成功統計から得られたモデル駆動優先スコアに基づいて問題を選択する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:51:02 GMT)
Mechanistic Knobs in LLMs: Retrieving and Steering High-Order Semantic Features via Sparse Autoencoders [8.2] 意味論的に解釈可能な内部特徴の検索とステアリングのためのスパースオートエンコーダベースのフレームワークを提案する。
本研究では,ビッグファイブの性格特性をケーススタディとして用いて,モデル行動の正確かつ双方向なステアリングを可能にすることを実証する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:40:37 GMT)
Making MoE-based LLM Inference Resilient with Tarragon [8.0] Tarragonは回復力のあるMoE推論フレームワークで、個々のワーカーへの影響を抑えつつ、パイプラインの残りの部分を前進させる。
Tarragonは、MoEベースのトランスフォーマーにおける注意と専門家の計算を自然に分離し、注意労働者(AW)と専門家労働者(EW)を異なる障害領域として扱う。
現状のメガスケール・インファーと比較して,タラゴンは故障によるストールを160~213倍削減する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:01:10 GMT)
Sampling non-log-concave densities via Hessian-free high-resolution dynamics [8.0] 本研究では,Hessian-free- resolution (HFHR) プロセスのターゲット分布 $(q)prop e-U(q) からのサンプリング問題について検討する。
我々は、$blana U$ linear growth が無限大であるという追加の仮定の下で、HFHR 力学の収縮は KLD よりも厳密に優れていることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:38:09 GMT)
Paper Skygest: Personalized Academic Recommendations on Bluesky [7.8] Paper Skygestは、BlueskyとAT Protocol上のユーザのネットワークから投稿された科学コンテンツのためのパーソナライズされたソーシャルフィードである。
Paper Skygestは、学者によるソーシャルメディアフィードを継続的に展開する最初の、かつ最大である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:52:49 GMT)
Making Infeasible Tasks Feasible: Planning to Reconfigure Disconnected 3D Environments with Movable Objects [7.6] 初期から目標設定までの衝突のないロボットパスの計画は、環境が切断されたときに失敗することが多い。
BRiDGEは,ロボットやオブジェクトの構成に木をインクリメンタルに構築して,実現可能な計画を計算する,サンプリングベースのプランナである。
本手法は確率論的に完全であることを示すとともに,その有効性を検証した広範な数値実験およびハードウェア実験を行う。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:36:09 GMT)
HiMeS: Hippocampus-inspired Memory System for Personalized AI Assistants [7.5] 短期記憶と長期記憶を融合したAI補助アーキテクチャであるHiMeSを提案する。
短期記憶と長期記憶を融合したAI補助アーキテクチャであるHiMeSを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:05:50 GMT)
Statistical Inference for Fuzzy Clustering [7.4] ファジィ$c$-means (FCM) は、混合メンバーシップを可能にし、不確実性と段階的な遷移をよりよく捉える。
我々は,クラスタサイズ不均衡の可能性のある設定のための,重み付きファジィ$c$-means (WFCM) のための新しいフレームワークを開発した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 02:11:01 GMT)
Training-Free Adaptation of New-Generation LLMs using Legacy Clinical Models [7.3] Cross-Architecture Proxy Tuning (CAPT) は、最先端の汎用ドメインモデルのトレーニングなし適応を可能にするモデルセンスのアプローチである。
CAPTは相反する語彙を持つモデルをサポートし、コントラストデコーディングを利用して臨床的に関連するシグナルを選択的に注入する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:23:47 GMT)
Reducing Hallucinations in LLMs via Factuality-Aware Preference Learning [7.3] 本稿では,F-DPO (Factuality-aware Direct Preference Optimization) を紹介する。
DPOペアを2つのファクトアリティ指標と合成幻覚的変種で拡張することで、ファクトアウェアな嗜好データを構築する。
F-DPOは補助的な報酬モデルやトークンレベルのアノテーション、マルチステージトレーニングを必要としない。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:01:34 GMT)
MCD-Net: A Lightweight Deep Learning Baseline for Optical-Only Moraine Segmentation [7.2] 本研究は,Google Earthの3,340個の手動高解像度画像からなる,大規模な光のみのモレーンセグメンテーションデータセットを初めて紹介した。
我々は、MobileNetV2エンコーダ、CBAM(Convolutional Block Attention Module)、DeepLabV3+デコーダを統合する軽量ベースラインであるMCD-Netを開発した。
尾根の起伏はサブピクセル幅とスペクトルのあいまいさによって制限されているが、光学画像だけではモレーンボディのセグメンテーションが信頼できることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:29:29 GMT)
From Intuition to Expertise: Rubric-Based Cognitive Calibration for Human Detection of LLM-Generated Korean Text [7.1] LREADは韓国の国産書記法から派生した筆記体である。
フェーズ1は直感のみの検出、フェーズ2は基準レベルスコア、フェーズ3はドメイン中心の熟達を評価します。
フェーズ全体では、多数投票の精度は60%から100%に上昇し、アノテーション間の合意が強まる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:51:39 GMT)
Limited Linguistic Diversity in Embodied AI Datasets [7.0] 本稿では,広く使用されているVLA(Vision-Language-Action)データセットの体系的データセット監査について述べる。
我々は,語彙的多様性,重複と重複,意味的類似性,構文的複雑性などを含む相補的な次元に沿って命令言語を定量化する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:06:47 GMT)
Adaptive Constraint Propagation: Scaling Structured Inference for Large Language Models via Meta-Reinforcement Learning [6.9] MetaJuLSは、タスク固有のリトレーニングなしで、言語やタスクに適用可能な普遍的な制約伝達ポリシーを学習する。
10言語にわたるUniversal Dependenciesでは、MetaJuLSはタスク固有のトレーニングを何時間も必要とせず、5~10の勾配ステップ(5~15秒)で新しい言語やタスクに適応する。
メカニスティック・アナリティクス(Mechanistic analysis)は、人間のような構文解析戦略(easy-first)と新しい非直観的手法を明らかにする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:24:45 GMT)
Unsupervised Topological Phase Discovery in Periodically Driven Systems via Floquet-Bloch State [6.9] フロッケ工学は、新しい非平衡位相を実現するための非平行なプラットフォームを提供する。
本稿では、モーメント時間(boldsymbolk,t$)空間で定義されたカーネルを利用する教師なし機械学習フレームワークを提案する。
この研究は、フロケ固有状態自体にコードされている固有位相特性を明らかにすることに成功している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 07:45:22 GMT)
Nonlinear Spectral Modeling and Control of Soft-Robotic Muscles from Data [6.8] 水圧静電アクチュエータ(HASEL)は高性能だが、記憶効果と筋骨格効果を示す。
本稿では、スペクトル部分多様体(SSM)理論に基づくデータ駆動還元制御戦略を提案する。
対角的HASELクラッチ接合部をリアルタイムに制御するためのSSMモデルを構築した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:43:49 GMT)
AnatomiX, an Anatomy-Aware Grounded Multimodal Large Language Model for Chest X-Ray Interpretation [6.7] AnatomiXは、解剖学的に接地された胸部X線解釈のために設計されたマルチモーダルな大規模言語モデルである。
放射線学的ワークフローに触発され、解剖学的構造を特定し、特徴を抽出する。
次に、大きな言語モデルを活用して、フレーズグラウンド、レポート生成、視覚的質問応答、画像理解など、さまざまな下流タスクを実行する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:13:23 GMT)
Validating Generalist Robots with Situation Calculus and STL Falsification [6.7] 汎用ロボットは現実になりつつあり、自然言語の命令を解釈し、多様な操作を実行することができる。
本稿では,抽象的推論と具体的なシステムファルシフィケーションを組み合わせた2層検証フレームワークを提案する。
テーブルトップ操作タスクの実験により、私たちのフレームワークはNVIDIA GR00Tコントローラの障害ケースを効果的に発見することを示した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:13:33 GMT)
Multi-RADS Synthetic Radiology Report Dataset and Head-to-Head Benchmarking of 41 Open-Weight and Proprietary Language Models [6.7] RXL-RADSetは10個のRADSに1,600の合成放射線学報告を含んでいる。
GPT-5.2は99.8%の妥当性と81.1%の精度(1,600の予測)を達成した。
20-32B の上位 SLM は 99% の正解率と 70% の正解率を得た。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:18:44 GMT)
Prompting Underestimates LLM Capability for Time Series Classification [6.5] その結果,大規模言語モデル (LLM) は時系列分類において性能が低いことが示唆された。
この結論は、モデルの表現能力よりも、プロンプトベースの生成の限界を反映していることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:31:27 GMT)
Uni-FinLLM: A Unified Multimodal Large Language Model with Modular Task Heads for Micro-Level Stock Prediction and Macro-Level Systemic Risk Assessment [6.0] 金融機関や規制機関は、株価変動からシステム的脆弱性へのリスクを評価するために、異種データを統合するシステムを必要としている。
共用トランスフォーマーバックボーンとモジュールタスクヘッドを併用した統合マルチモーダル大言語モデルUni-FinLLMを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:22:51 GMT)
FIRE-VLM: A Vision-Language-Driven Reinforcement Learning Framework for UAV Wildfire Tracking in a Physics-Grounded Fire Digital Twin [6.0] ワイルドファイア監視は、極度の視覚的劣化の下で推論できる自律システムを要求する。
Fire-VLMは、ファイア・トゥ・エンド・ビジョン・ランゲージ・モデル(VLM)ガイド付き強化学習フレームワークである。
筆者らの貢献は,(1)野火デジタル双生児構築のためのGIS-to-simulation Pipeline,(2)UAVファイアフロント追跡のためのVLM誘導RLエージェント,(3)物理用語とVLM意味論を組み合わせた山火事対応報酬設計である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 22:31:57 GMT)
A Dataset of Low-Rated Applications from the Amazon Appstore for User Feedback Analysis [5.9] 本研究では、Amazon Software Appstore(ASA)からソースされた64の低ランクアプリケーションからキュレートされた新しいデータセットを紹介する。
このデータセットは、ソフトウェアの品質向上に不可欠である、ユーザによって特定される最も頻繁な問題をキャプチャするために設計されている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:32:49 GMT)
Non-Markovian dynamics of the giant atom beyond the rotating-wave approximation [5.9] 超伝導量子ビットは、蛇行する伝送線や表面音響波と結合し、巨大な人工原子を実現できる。
摂動的レッドフィールド理論は長時間の入浴記憶時間によって失敗するのに対し、0温度での正確な力学と弱いカップリングについて検討する。
その結果、巨大原子は非マルコフ的開量子力学を探索するための強力なプラットフォームとして確立され、量子情報や熱力学への応用が期待できる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:35:57 GMT)
Deep Learning-Based Image Recognition for Soft-Shell Shrimp Classification [5.9] エビをベースとした加工食品では、鮮度は収穫後急速に低下し、軟殻エビは調理後や冷凍後に頭と体の分離に悩まされることが多い。
本研究では,収穫直後の白エビの自動分類に深層学習に基づく画像認識を利用する。
畳み込みニューラルネットワーク(CNN)モデルは、手作業によるソートを置き換え、分類精度、効率、一貫性を向上させる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:36:31 GMT)
SLIM: Stealthy Low-Coverage Black-Box Watermarking via Latent-Space Confusion Zones [5.8] トレーニングデータは、LLM(Large Language Model)開発において、重要かつしばしばプロプライエタリな資産である。
我々は,厳格なブラックボックスアクセス下でユーザごとのデータ証明を可能にするフレームワークSLIMを紹介する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:37:45 GMT)
Mastering the Game of Go with Self-play Experience Replay [5.8] QZeroは,学習中の探索を禁ずる新しいモデルレス強化学習アルゴリズムであり,自己再生と非政治経験によるナッシュ均衡政策を学習する。
人間のデータなしでタトゥーララザを起動し、控えめな計算リソースで5ヶ月間トレーニングし、QZeroはAlphaGoに匹敵するパフォーマンスレベルを達成した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:42:40 GMT)
MAFS: Multi-head Attention Feature Selection for High-Dimensional Data via Deep Fusion of Filter Methods [5.8] 高次元バイオメディカルデータには特徴選択が不可欠であり、予測性能の向上、計算コストの削減、精密医療応用における解釈可能性の向上を実現している。
本稿では,MAFS(Multi-head Attention-based Feature Selection)について紹介する。
既存のフィルターベースおよびディープラーニングベースの代替品と比較して、常に優れたカバレッジと安定性を実現し、高次元のバイオメディカルデータにおける機能選択のためのスケーラブルで解釈可能な堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 02:51:14 GMT)
Improving Indigenous Language Machine Translation with Synthetic Data and Language-Specific Preprocessing [5.8] 我々は,高容量多言語翻訳モデルを用いて合成文対を生成することで,アメリカ大陸の言語に対する並列データセットを拡張した。
グアラニ語-スペイン語とケチュア語-スペイン語の翻訳実験は、合成データ拡張による一貫したchrF++の改善を示している。
Aymaraの診断実験は、高度に凝集的な言語に対する一般的な前処理の限界を強調している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:06:42 GMT)
HEXAR: a Hierarchical Explainability Architecture for Robots [5.6] 我々は,ロボットシステムに関する説明を生成するためのプラグイン,階層的アプローチを提供する新しいフレームワークであるHEXARを提案する。
我々は,家庭環境における支援作業を行うTAAGoロボット上でHEXARを実装し,評価する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:55:16 GMT)
Recursive querying of neural networks via weighted structures [5.6] フィードフォワードニューラルネットワークにおける重み付き構造の論理について検討する。
我々はDatalogのような構文を採用し、固定点論理の正規形式を重み付け構造に拡張する。
非常に単純なモデルに依存しないクエリはすでにNP完全であることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:30:44 GMT)
PiDR: Physics-Informed Inertial Dead Reckoning for Autonomous Platforms [5.5] 自律型プラットフォームのための物理インフォーム付き慣性デッドレコニングフレームワークPiDRを提案する。
移動ロボットと自律型水中車両によって収集された実世界のデータセット上でPiDRを評価する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:19:50 GMT)
Auditing Search Query Suggestion Bias Through Recursive Algorithm Interrogation [5.5] 本研究は,検索クエリのバイアスを識別する新たなアプローチを提案する。
バイアス分析のデータベースをより深めるための、より低いレベルの提案が含まれている。
これらの提案に基づき、政治領域における人物関連検索における話題群バイアスについて検討する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:13:39 GMT)
Quality Degradation Attack in Synthetic Data [5.5] 本研究では,実際のデータセットへのアクセスや生成プロセスの制御を行う敵による品質攻撃について検討する。
我々は、対応する脅威モデルを形式化し、実データのターゲット操作の有効性を実証的に評価する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:43:31 GMT)
Understanding Multi-Agent Reasoning with Large Language Models for Cartoon VQA [5.4] フレームワークは視覚エージェント、言語エージェント、批評家エージェントの3つの特殊エージェントで構成されている。
このフレームワークは2つの漫画ベースのVQAデータセット、PororoとSimpsonsで体系的に評価された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:58:33 GMT)
Automatic Prompt Engineering with No Task Cues and No Tuning [5.3] 本稿では,設計とアプリケーションの両方において,より簡易な自動プロンプトエンジニアリングシステムを提案する。
チューニングも,タスクに関する明確なヒントも必要ありません。
データベーステーブルにおける暗号列名拡張(CNE)について検討した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:04:45 GMT)
Stable boundary modes for fragile topology from spontaneous PT-symmetry breaking [5.1] 非局所対称性によって保護されたトポロジカル絶縁体、または脆弱なトポロジで保護されるトポロジカル絶縁体は、通常、堅牢なギャップ内エッジモードを認めない。
パリティ時間系では、非エルミートカップリングによって安定に、頑健なトポロジカルエッジモードが引き起こされることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:02:38 GMT)
From Muscle to Text with MyoText: sEMG to Text via Finger Classification and Transformer-Based Decoding [5.0] 表面筋電図(sEMG)は筋活動の復号のための直接神経インタフェースを提供する。
我々は,SEMG信号をテキストにデコードする階層的なフレームワークであるMyoTextを,生理学的に基底化した中間段階を通して提示する。
MyoTextは85.4%の指分類精度、5.4%の文字誤り率、6.5%の単語誤り率(WER)でベースラインを上回っている
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:30:15 GMT)
On the Intrinsic Limits of Transformer Image Embeddings in Non-Solvable Spatial Reasoning [4.9] 視覚変換器 (ViT) は意味認識に優れるが, 心的回転などの空間的推論タスクにおいて, 系統的失敗を示す。
我々は複雑性境界を定式化する: 定数深度ViTは、非解決可能な空間構造を効率的に捉えるための論理的な深さを根本的に欠いている。
我々はこの複雑性ギャップを潜在空間探索により検証し、ViT表現が構成深度が増加するにつれて非解決不可能なタスクに構造的に崩壊することを示した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:32:40 GMT)
RiskCueBench: Benchmarking Anticipatory Reasoning from Early Risk Cues in Video-Language Models [4.9] 我々は、リスク信号クリップを特定するためにビデオに慎重に注釈を付ける、新しいビデオ理解ベンチマークであるR RiskCueBenchを紹介した。
実験結果によると、現在のシステムでは、進化する状況を解釈し、早期視覚信号から将来の危険事象を予測できる能力に大きなギャップがあることが判明した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:14:49 GMT)
Millimeter-Wave Gesture Recognition in ISAC: Does Reducing Sensing Airtime Hamper Accuracy? [4.8] ミリ波ISACシステムを用いたジェスチャー認識システムへの影響について検討する。
実時間センシングから,25パーセントのセンシング空調では分類精度が0.15ポイントしか低下しないことがわかった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:42:18 GMT)
Counterfactual Fairness with Graph Uncertainty [4.8] グラフ不確実性(CF-GU)は、因果グラフをCFに特定する不確実性を含むバイアス評価手法である。
合成データに関する実験は、ドメイン知識の仮定がCFの監査をどのように支援するか、あるいは反証するかを示している。
実世界のデータに関する実験は、最小限のドメイン知識の制約を課しても、信頼性の高いよく知られたバイアスを指摘します。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:33:26 GMT)
Bridging Mechanistic Interpretability and Prompt Engineering with Gradient Ascent for Interpretable Persona Control [4.7] 大規模言語モデル(LLM)に勾配を適応させる新しいフレームワークを提案する。
Llama 3.1, Qwen 2.5, Gemma 3におけるRESGAとSAEGAの有効性を示す。
本手法は,制御可能かつ解釈可能な動作修正のための新しいパラダイムを提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:34:14 GMT)
LSP-DETR: Efficient and Scalable Nuclei Segmentation in Whole Slide Images [4.7] 全体スライド画像は、大きな計算上の課題を生じさせる。
既存のスターベースの処理とコストのかかる後処理のアプローチは、コンテキストと効率の犠牲に頼っている。
フル・ツー・エンドの軽量・ツー・エンドフレームワークである LSP LDETR を紹介する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:35:46 GMT)
Audit Me If You Can: Query-Efficient Active Fairness Auditing of Black-Box LLMs [4.7] 大規模言語モデル(LLM)は、人口統計群にまたがる体系的なバイアスを示す。
対象の公正度測定値に対する不確実性評価として監査を概念化する。
ブラックボックスLLMのクエリ効率監査のためのバウンドアクティブフェアネスオーディタであるBAFAを紹介する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:22:23 GMT)
PsyAgent: Constructing Human-like Agents Based on Psychological Modeling and Contextual Interaction [4.7] PsyAgentは,Bourdieuの認知社会的共生構造に先行して,ビッグファイブの特徴を併せ持つものである。
i)個人構造(IS)、特徴とファセットを符号化するマシン使用可能なプロファイル、認知スタイル、価値観、文化的・教育的資本、および健全なライフエピソード、(ii)マルチシナリオコンテキスト(MSC)、および8つのアリーナにまたがるロール・リレーシップ・ノームフレーム。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:14:03 GMT)
Edit2Restore:Few-Shot Image Restoration via Parameter-Efficient Adaptation of Pre-trained Editing Models [4.6] テキスト条件付き画像編集モデルでは,複数の復元作業に効率よく適応できることを示す。
FLUX.1 Kontextは画像から画像への変換のための12Bパラメータフローマッチングモデルである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:56:16 GMT)
Optimizing Fault-tolerant Cat State Preparation [4.6] キャット状態はフォールトトレラント量子コンピューティングにとって重要なビルディングブロックである。
低深度回路で2つの猫状態を調製し,次にCNOTと1つの猫状態を計測した猫状態作成法を提案する。
回路の耐故障性は高いが, 汎用的な構成ではリソースは少ない。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:00:01 GMT)
The Path Ahead for Agentic AI: Challenges and Opportunities [4.5] この章では、複雑な環境で自律的に動作するエージェントAIシステムの出現について考察する。
我々は、統計モデルからトランスフォーマーベースのシステムへのアーキテクチャの進歩を辿り、エージェントの振る舞いを可能にする能力を識別する。
既存の調査とは異なり、私たちは、言語理解から自律的な行動へのアーキテクチャの移行に注目し、デプロイ前に解決しなければならない技術的ギャップを強調します。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:31:42 GMT)
HAL: Inducing Human-likeness in LLMs with Alignment [4.5] 本稿では,言語モデルと対話型人間類似度を協調するフレームワークであるHuman Aligning LLMs(HAL)を紹介する。
HALは、対照的な対話データから明確な会話特性を導出し、それらをコンパクトなスカラースコアに組み合わせ、このスコアを透明な報酬信号として利用する。
HALは明示的で解釈可能な特性に対して作用するため、アライメント挙動の検査と意図しない効果の診断が可能である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:40:55 GMT)
MAGMA: A Multi-Graph based Agentic Memory Architecture for AI Agents [4.5] Memory-Augmented Generation (MAG) は、Large Language Modelsを外部メモリで拡張し、長文推論をサポートする。
既存のアプローチは、モノリシックなメモリストアに対するセマンティックな類似性に大きく依存しており、時間的、因果的、実体的な情報を絡み合わせる。
本稿では, 意味, 時間, 因果, 実体グラフにまたがる各メモリ項目を表すマルチグラフエージェントメモリアーキテクチャであるMAGMAを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:29:43 GMT)
Revisiting Continuous-Time Trajectory Estimation via Gaussian Processes and the Magnus Expansion [4.4] 連続時間軌道推定に対する全LTV GPアプローチを再検討し、Magnus拡張を介してリー群に先立つ大域的なGPを導出する。
本稿では,2つのアプローチの数値的な比較を行い,それらの相対的なメリットについて論じる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:02:19 GMT)
Entanglement signatures of quantum criticality in Floquet non-Hermitian topological systems [4.4] 一次元の単一粒子系では、周期駆動は様々な位相位相とエッジモードを生成する。
本研究では, エンタングルメントエントロピーを用いた一次元フロケ・シュリーファー・ヘーガーモデルの位相相転移について検討する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:27:02 GMT)
NorwAI's Large Language Models: Technical Report [4.3] NorwAIはノルウェー語や他のスカンジナビア語に特化されたモデルのファミリーを開発した。
これらのモデルは、スクラッチから事前訓練されるか、25B - 88.45Bトークンで継続的に事前訓練される。
このレポートは、モデルアーキテクチャ、トレーニングデータ、トークン化設計、微調整戦略、デプロイメント、評価に関する詳細なドキュメントを提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:06:55 GMT)
Time-Aware Synthetic Control [4.3] Time-Aware Synthetic Controlでは、信号の低ランク構造を維持しながら、一定の傾向を持つ状態空間モデルを採用している。
我々は、政策評価やスポーツ予測を含む、シミュレーションと実世界の両方のデータセット上でTASCを評価する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:30:26 GMT)
Prompt-Counterfactual Explanations for Generative AI System Behavior [4.2] 意思決定者は、生成AIシステムが特定の出力特性を示す原因を理解する必要がある。
この問題を調べるために、説明可能なAI文献から共通のテクニック、すなわち事実的説明を適用する。
本稿では,非決定論的,生成的AIシステムに反実的説明を適用するフレキシブルなフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:33:19 GMT)
Agentic Physical AI toward a Domain-Specific Foundation Model for Nuclear Reactor Control [4.0] 最近のベンチマークでは、視覚言語モデルは基本的な量物理学のタスクで50~53%の精度しか達成していない。
パーセプション中心のアーキテクチャはパラメータ空間の模倣を最適化するが、セーフティクリティカルな制御は結果空間の保証を要求する。
本稿では,エージェント物理AIとして動作するコンパクト言語モデルを導入することにより,ドメイン固有基盤モデルに対する根本的に異なる経路を示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 02:29:00 GMT)
Loop Closure using AnyLoc Visual Place Recognition in DPV-SLAM [3.9] DPV-SLAMにおけるループ閉鎖性能を向上させる手法を提案する。
我々のアプローチは学習に基づく視覚的位置認識技術であるAnyLocを統合している。
本手法は,ループ閉鎖精度とロバスト性の観点から,元のDPV-SLAMよりも優れていた。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:32:08 GMT)
Exploring Blockchain Interoperability: Frameworks, Use Cases, and Future Challenges [3.9] 多くのアプリケーションがブロックチェーンの採用に移行しており、ユーザーは信頼できる方法で作業できる。
ますます多くのエンティティがアプリケーションをブロックチェーンに移行するにつれて、大量のデータを生成する。
これにより、ブロックチェーンを連携させる相互運用可能なソリューションの研究と開発につながった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:46:29 GMT)
Inferring Causal Graph Temporal Logic Formulas to Expedite Reinforcement Learning in Temporally Extended Tasks [3.8] ブラックボックス強化学習は、ローカルな変化がネットワーク構造を通してどのように広がるかを見落としている。
本稿では、ポリシーを同時に学習し、Causal Graph Temporal Logic (Causal GTL) 仕様をマイニングするクローズドループフレームワークであるGTL-CIRLを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 02:25:26 GMT)
The Critical Role of Aspects in Measuring Document Similarity [3.8] ASPECTSIMは、明示的に指定されたアスペクトで文書の類似性を条件付ける必要があるフレームワークである。
我々は、ASPECTSIMが、全体的類似性よりもはるかに高い人間と機械の合意を達成していることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:46:23 GMT)
The Anatomy of Conversational Scams: A Topic-Based Red Teaming Analysis of Multi-Turn Interactions in LLMs [3.7] シングルターン安全性評価が達成できないマルチターン会話詐欺の新たなリスクについて検討した。
英語と中国語の8つの最先端モデルを評価する。
その結果, スカム相互作用は繰り返しエスカレーションパターンに従っており, 防御には検証機構と遅延機構が用いられていることがわかった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:06:04 GMT)
Reliable Grid Forecasting: State Space Models for Safety-Critical Energy Systems [3.7] 本稿では,統計的精度のみでなく,運用リスクを計測するグリッド固有評価フレームワークを提案する。
このフレームワークを用いて,カリフォルニア州のグリッド予測のためのマンバをベースとしたステートスペースモデルの体系的評価を行う。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:46:08 GMT)
Rendering Data Unlearnable by Exploiting LLM Alignment Mechanisms [3.6] 大規模言語モデル(LLM)は、大規模で異質なテキストコーパスでますます訓練されている。
これは、モデルトレーニング中にプロプライエタリまたは個人データの使用が許可されていないという深刻な懸念を引き起こす。
本研究では, LLM に読み書き不能なテキストを描画する新しいデータレベルディフェンスである Disclaimer Injection を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:34:15 GMT)
Exact Mobility Edges in a Disorder-Free Dimerized Stark Lattice with Effective Unbounded Hopping [3.6] 障害のない一次元一次元ハミルトン粒子は、正確な移動エッジ(ME)をホストする
我々は、エネルギー等級がセル間ホッピング強度と等しいシャープなMEを同定し、相互空間のバルクスペクトルを解析的に導出した。
以上の結果から,MEは潜在的な実験的不完全性に対して頑健であることが示唆された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:40:26 GMT)
LLM Agent Framework for Intelligent Change Analysis in Urban Environment using Remote Sensing Imagery [3.6] 本稿では,Large Language Models(LLM)を視覚基盤モデルと統合し,ChangeGPTを形成する汎用エージェントフレームワークを提案する。
このエージェントは、現実世界のシナリオによって分類された140の質問(例えば、サイズ、クラス、数)と複雑さを含む、キュレートされたデータセットで評価された。
ChangeGPT、特にGPT-4-turboバックエンドは優れた性能を示し、90.71%のマッチングレートを達成した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:49:51 GMT)
Joint Encoding of KV-Cache Blocks for Scalable LLM Serving [3.3] 既存のKV-cache圧縮手法は剛性に依存し、テンソルレイアウトを乱したり、特別な計算を必要とする。
KV-cacheブロックの連成符号化を提案し、要求と入力チャンクに類似したブロックを融合して共有表現を生成する。
これにより、KV-cacheメモリのボトルネックが軽減され、特別なハードウェアを使わずに高コンカレンシー機能をサポートする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:50:58 GMT)
X-MuTeST: A Multilingual Benchmark for Explainable Hate Speech Detection and A Novel LLM-consulted Explanation Framework [3.3] 本稿では,ヘイトスピーチ検出のための説明可能性誘導学習フレームワークX-MuTeSTを提案する。
我々はこの研究を英語とともにヒンディー語とテルグ語に拡張し、人間の注釈付き論理のベンチマークを提供する。
トレーニング中に人間の合理性を活用することで、分類性能と説明可能性の両方が向上することを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:16:45 GMT)
Towards Zero-Knowledge Task Planning via a Language-based Approach [3.3] 本稿では,ゼロ知識タスク計画(ZKTP)問題,すなわちタスク固有の知識を使わずに目標を達成するための行動列を定式化することを提案する。
本稿では,大規模言語モデル(LLM)を利用して,自然言語命令をサブタスクに分解し,動作木(BT)を生成するZKTPの最初の調査とアプローチを提案する。
AI2-THORシミュレータの実験的検証により,タスク固有の知識を活用する代替手法と比較して,タスク性能を向上させる方法の有効性が示された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:18:15 GMT)
TAAF: A Trace Abstraction and Analysis Framework Synergizing Knowledge Graphs and LLMs [3.3] 本稿では,TAAF(Trace Abstraction and Analysis Framework)について紹介する。
LLMは、クエリ固有のサブグラフを解釈して自然言語の質問に答え、手動検査の必要性を減らす。
実験の結果、TAAFは解答精度を最大31.2%向上させ、特にマルチホップおよび因果推論タスクにおいて改善した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:04:05 GMT)
On the Convergence Behavior of Preconditioned Gradient Descent Toward the Rich Learning Regime [3.3] 本稿では,プリコンディショニング勾配降下(PGD)がスペクトルバイアスやグルーキング現象に与える影響について検討する。
豊かな学習体制のグラッキング仮説に基づいて、グラッキングに伴う遅延を軽減するためにPGDをどのように使用できるかを研究する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:35:07 GMT)
Low-Resource Heuristics for Bahnaric Optical Character Recognition Improvement [3.3] ベトナム、カンボジア、ラオスで話されている少数言語であるBahnarは、限られた研究とデータ可用性のため、重要な保存上の課題に直面している。
本研究は,光学文字認識(OCR)技術を用いて,バーナー語文書の正確なデジタル化の必要性に対処する。
本稿では,高度なテーブルと非テーブル検出技術と確率に基づく後処理を組み合わせた総合的なアプローチを提案し,認識精度を向上させる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:22:03 GMT)
Explainable Fuzzy GNNs for Leak Detection in Water Distribution Networks [3.2] グラフニューラルネットワーク(GNN)は、センサデータの空間的時間的依存関係をキャプチャする。
本稿では,重要なネットワーク領域を特定するために相互情報を統合した説明可能なGNNフレームワークを提案する。
ファジィグラフニューラルネットワーク(FGENConv)は,検出で0.889点,ローカライゼーションで0.814点を得た。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:45:43 GMT)
LTX-2: Efficient Joint Audio-Visual Foundation Model [3.2] LTX-2は、時間的に同期されたオーディオヴィジュアルコンテンツを生成できるオープンソースモデルである。
より広範な理解のために多言語テキストエンコーダを用いる。
LTX-2は、各シーンのキャラクター、環境、スタイル、感情に従うリッチでコヒーレントなオーディオトラックを生成する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:24:41 GMT)
SastBench: A Benchmark for Testing Agentic SAST Triage [3.1] SastBenchは、実CVEを真正値、フィルターしたSASTツールを近似偽正値として組み合わせたSASTトリアージエージェントを評価するためのベンチマークである。
ベンチマークで異なるエージェントを評価し,その性能の比較分析を行った。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:36:30 GMT)
Conformal novelty detection with false discovery rate control at the boundary [3.1] コンフォーマルノベルティ検出は古典的な機械学習タスクである。
近年の研究では、共形p値に適用されたBH法が偽発見率(FDR)を制御することが示されている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 00:02:03 GMT)
Does relativistic motion really freeze initially maximal entanglement? [3.1] 我々は、$CL_4$状態の 1-3 の双分項の絡み合いが、無限加速極限を含むすべての加速度に対して厳密に最大であることを示す。
この結果は、未発見の現象、すなわち相対論的運動の下での「初期最大の絡み合いの完全な凍結」を明らかにする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:36:31 GMT)
MalruleLib: Large-Scale Executable Misconception Reasoning with Step Traces for Modeling Student Thinking in Mathematics [3.0] MalruleLibは、ドキュメント化された誤解を実行可能なプロシージャに変換するフレームワークである。
我々は,Malrule Reasoning Accuracy (MRA) として,中核的な学生モデリング問題を定式化した。
MalruleLibは、498のパラメータ化された問題テンプレートに101の不正をエンコードし、正しい推論と不正一貫性のある学生推論の両方のためにペア化されたデュアルパストレースを生成する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:59:37 GMT)
ToxiGAN: Toxic Data Augmentation via LLM-Guided Directional Adversarial Generation [3.0] ToxiGANは、対数生成と大言語モデル(LLM)のセマンティックガイダンスを組み合わせた、クラス対応テキスト拡張フレームワークである。
ToxiGANは、マクロF1とヘイトF1の両方において最も高い平均性能を達成し、従来型およびLLMベースの拡張手法を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:50:46 GMT)
Transformers self-organize like newborn visual systems when trained in prenatal worlds [3.0] 脳は出生前感覚経験(網膜波など)で「訓練」されるのに対し、トランスフォーマーは通常、生物学的に妥当でない大規模なデータセットで訓練される。
我々は、トランスフォーマーが脳のように学習すれば、同じ出生前データに曝されると、新生児の脳と同じ構造を発達させるべきだと推論した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:47:32 GMT)
Restoring Bloch's Theorem for Cavity Exciton Polaron-Polaritons [2.9] ハイブリット光子-エキシトン-フォノン量子電磁力学に対する対称性インフォームド表現を導入する。
我々は、ハミルトニアンに近似を導入することなく、実験的にアクセス可能な観測可能量を計算する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:18:21 GMT)
Enhancing LLM Instruction Following: An Evaluation-Driven Multi-Agentic Workflow for Prompt Instructions Optimization [2.9] 大規模言語モデル(LLM)は、しばしば実質的な関連性のあるコンテンツを生成するが、形式的な制約に従わない。
本稿では,その制約からタスク記述の最適化を分離する,新しいマルチエージェントワークフローを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:02:14 GMT)
WeedRepFormer: Reparameterizable Vision Transformers for Real-Time Waterhemp Segmentation and Gender Classification [2.8] WeedRepFormerは、水槽分割と性別分類を同時に行うために設計された軽量ビジョン変換器である。
WeedRepFormer は,3.59M パラメータと3.80 GFLOP のみを用いて,セグメンテーションの92.18% mIoU と性別分類の81.91% の精度を達成した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:41:11 GMT)
Privacy-Preserving AI-Enabled Decentralized Learning and Employment Records System [2.8] 学習と雇用記録(LER)システムは、教育と仕事の成果を安全にコンパイルし共有するための重要な基盤として浮上している。
既存のブロックチェーンベースのプラットフォームでは、検証可能な資格情報を活用するが、通常は自動スキルクレデンシャル生成と、構造化されていない学習の証拠を組み込む能力が欠如している。
本稿では,これらのギャップに対処するプライバシ保護型AI対応分散型LERシステムを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:18:03 GMT)
A Preliminary Agentic Framework for Matrix Deflation [2.6] 本稿では,解法がランク1を更新し,いつ停止するかを決定する,行列デフレに対するエージェント的アプローチを提案する。
Digits (8times 8$), CIFAR-10 (32times32$ grayscale), 合成 (16times16$) の行列をガウス雑音と無雑音で評価した。
全ての設定において、エージェントは競合する結果を達成し、古典的な数値アルゴリズムの代替として、完全にエージェント的、しきい値のないデフレが実現可能であることを示唆している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:59:18 GMT)
Soft Contextualized Encoder For User Defined Text Classification [2.6] User-Defined Text Classification (UDTC) は、入力テキストをユーザ指定の未確認クラスに分類することの難しさを考察している。
本稿では,各候補ラベルをラベルセットで文脈化し,入力クエリの静的なソフトプロンプト表現を行うUDTC用ソフトコンテクスト化エンコーダアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 22:34:50 GMT)
LLM-Augmented Changepoint Detection: A Framework for Ensemble Detection and Automated Explanation [2.6] 本稿では,アンサンブル統計手法とLarge Language Models(LLM)を組み合わせた新しい変化点検出フレームワークを提案する。
提案手法は,10個の異なる変化点検出アルゴリズムの結果を集約し,個々の手法と比較して優れた性能とロバスト性を実現する。
プライベートまたはドメイン固有のデータに対して、Retrieval-Augmented Generation (RAG)ソリューションは、ユーザが提供するドキュメントに基盤を置く説明を可能にする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:04:38 GMT)
Sensor to Pixels: Decentralized Swarm Gathering via Image-Based Reinforcement Learning [2.6] マルチエージェントシステムの分散制御のための画像に基づく強化学習手法を提案する。
観測はニューラルネットワークによって処理できる構造化された視覚入力として符号化される。
我々は,限られた範囲とベアリングのみを感知するエージェントのマルチエージェント収束タスクに対するアプローチを評価する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:58:11 GMT)
The Fake Friend Dilemma: Trust and the Political Economy of Conversational AI [2.5] 本稿では,AIエージェントを信頼する社会工学的条件であるFake Friend Dilemma(FFD)を開発した。
我々は、隠蔽広告、政治プロパガンダ、行動ヌード、監視など、害のタイプロジを構築している。
非対称的なパワーのベクターとしての信頼に焦点を当てることで、FFDはAIシステムがいかにユーザーの自律性を損なうかを理解するためのレンズを提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:07:52 GMT)
Training Language Models with homotokens Leads to Delayed Overfitting [2.5] サブワードトークン化は、多くの異なるトークンシーケンスが同じ表面形式にデコードされ、意味を保存する言語モデルにおける計算層を導入している。
我々は、データ拡張の厳密な意味保存形式として、ホモトケンを定式化する。
データ制約付き事前トレーニングでは、ホモトケン強化は繰り返しデータ露光下でのオーバーフィッティングを継続的に遅らせる。
多言語微調整では、ホモトケンの有効性はトークン化器の品質に依存する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:57:00 GMT)
Real-Time Adaptive Anomaly Detection in Industrial IoT Environments [2.5] マルチソース予測モデルとコンセプトドリフト適応を用いて,IIoTストリーミングデータの異常を検出する適応手法を提案する。
提案手法は,89.71%の精度で最先端の異常検出法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:16:45 GMT)
Self-Verification is All You Need To Pass The Japanese Bar Examination [2.4] 本稿では,本試験の真正な形式と評価尺度を忠実に再現するデータセットに基づいて学習した自己検証モデルを提案する。
本研究は, 形式に忠実な監視と整合性検証の重要性を強調し, 慎重に設計された単一モデルアプローチが, 高度な専門的推論タスクにおいて, より複雑なシステムより優れていることを示唆する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:13:47 GMT)
Edge-AI Perception Node for Cooperative Road-Safety Enforcement and Connected-Vehicle Integration [2.3] インドなどの新興国の急速な自動車化は、2023年に1100万件以上の違反が記録されており、4000台あたり約1人の警官が警察に拘束されている。
従来の監視と手動によるチケット発行は、この規模にスケールできないため、自律的で協力的でエネルギー効率のよいエッジAI認識インフラの必要性を動機付けている。
本稿では,多クラス交通違反の分析と,接続されたインテリジェントな車両エコシステム内での安全事象の拡散を行うためのリアルタイム道路側認識ノードを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:02:58 GMT)
Extreme-value forest fire prediction A study of the Loss Function in an Ordinality Scheme [2.2] 本報告では,フランスにおける運用上の意思決定と直接一致した山火事の重症度を予測するための,最初の規則分類フレームワークについて紹介する。
本研究では,損失関数設計が,希少かつ重要な高重度火災発生を予測するニューラルネットワークの能力に与える影響について検討した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:46:56 GMT)
BotSim: Mitigating The Formation Of Conspiratorial Societies with Useful Bots [2.2] 我々は、有用なボットを小さな世界ネットワークに導入する社会のエージェントベースモデルであるBotSimを作成する。
これらの便利なボットは、悪い情報を良いものに修正するInfo-Correction Botsと、良いメッセージングを行うGood Botsだ。
この結果から,Bad Botsは,情報協調型ボットとGood Botsのどちらかによって,共謀型社会を創り出すことが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:26:46 GMT)
COFFEE: COdesign Framework for Feature Enriched Embeddings in Ads-Ranking Systems [2.1] 本稿では,モデル推論やサービス複雑性を増大させることなく,ユーザアド表現を向上するための新しいフレームワークを提案する。
提案手法は,AUCの面積を1.56倍から2倍に増やすことができる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:29:12 GMT)
MARVEL: A Multi Agent-based Research Validator and Enabler using Large Language Models [2.1] 本稿では,ドメイン認識型質問応答のためのフレームワークMARVELについて紹介する。
MARVELは、簡単なクエリのための高速パスと、より意図的なDeepSearchモードを組み合わせることで、検索拡張生成とMonte Carlo Tree Searchを統合している。
我々はこの枠組みをレーザー干渉計重力波観測に関する重力波研究の文脈に応用した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:47:22 GMT)
Netflix Artwork Personalization via LLM Post-training [2.0] 本研究は,ユーザの好みに応じてパーソナライズされたアートワークレコメンデーションの新たな課題を探求する。
タイトルには異なるテーマとトーンが含まれており、異なる視聴者にアピールする可能性がある。
ワンサイズのアプローチではなく、トレーニング済みのLLMのポストトレーニングを行い、パーソナライズされたアートワークのレコメンデーションを作成します。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:56:53 GMT)
Automated Semantic Rules Detection (ASRD) for Emergent Communication Interpretation [2.0] 本稿では,ルイスゲーム上で2つの異なるデータセットで訓練されたエージェントによって交換されたメッセージの関連パターンを抽出する自動意味ルール検出(ASRD)アルゴリズムを提案する。
ASRDは、抽出したパターンを入力データの特定の属性に関連付けることにより、創発的コミュニケーションの解釈を支援する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:57:39 GMT)
STIPP: Space-time in situ postprocessing over the French Alps using proper scoring rules [1.9] Space-time In situ Postprocessing (STIPP) は、ステーション位置のネットワークに対して一貫した天気予報を生成する機械学習モデルである。
トレーニングに適切なスコアリングルールを活用することで、STIPPは分散限界のみを監督する作業駆動型大気モデルに寄与する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:07:20 GMT)
Cost-Effective Radar Sensors for Field-Based Water Level Monitoring with Sub-Centimeter Accuracy [1.9] この研究は、レーダーによるセンシングを水位推定の低コストな代替手段として検討し、その非接触性と環境条件への堅牢性を活用している。
その結果、単一レーダーセンサは最小限のキャリブレーションでセンチメートルスケールの精度を達成でき、ドローンやロボットプラットフォームを用いた自律型水監視の実用的なソリューションであることがわかった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 22:25:19 GMT)
130k Lines of Formal Topology in Two Weeks: Simple and Cheap Autoformalization for Everyone? [1.8] このプロジェクトは2025年11月21日から実行され、2026年1月4日現在160万行の形式化されたトポロジーを生産している。
ほとんど(約130kの路線)は12月22日から1月4日までの2週間で、LCMのサブスクリプション料金は約100ドルである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:01:04 GMT)
LAsset: An LLM-assisted Security Asset Identification Framework for System-on-Chip (SoC) Verification [1.8] LAssetは、ハードウェア設計仕様とレジスタ転送レベル(RTL)記述の両方からセキュリティ資産を識別する新しいフレームワークである。
分類精度が高く、システム・オン・チップ(SoC)設計では最大90%のリコール率、IP設計では93%のリコール率に達する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 00:53:23 GMT)
Proceedings 16th International Workshop on Graph Computation Models [1.8] グラフ計算モデルに関する第16回国際ワークショップ(GCM 2025)の開催後
ワークショップはSTAF(Software Technologies: Applications and Foundations)の一部として6月10日にドイツのコブレンツで開催された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:47:06 GMT)
Image, Word and Thought: A More Challenging Language Task for the Iterated Learning Model [1.7] 反復学習モデルは、世代から世代への言語伝達をシミュレートする。
このモデルのエージェントは、表現力のある言語を学び、伝達することができる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:53:00 GMT)
Quantum-enhanced long short-term memory with attention for spatial permeability prediction in oilfield reservoirs [1.7] 本研究では,変分量子回路(VQC)をリカレントセルに組み込んだQLSTMAモデルを提案する。
量子絡み合いと重ね合わせの原理を用いることで、QLSTMAは透過性のような複雑な地質パラメータを予測する能力を大幅に改善する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:47:11 GMT)
An Empirical Analysis of Community and Coding Patterns in OSS4SG vs. Conventional OSS [1.7] Open Source Software for Social Good (OSS4SG)プロジェクトは、重要な社会的課題に対処することを目的としている。
OSS4SGと従来のOSSプロジェクトのコミュニティ構造,コントリビュータの関与,コーディングプラクティスを比較した。
その結果,OSS4SG プロジェクトはより安定し,コミュニティに定着し,従来のOSS プロジェクトはより"磁性" (75.4%) であり,コントリビュータの獲得率が高いことが明らかとなった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:37:12 GMT)
Eye-Q: A Multilingual Benchmark for Visual Word Puzzle Solving and Image-to-Phrase Reasoning [1.6] VLM(Vision-Language Models)は、標準のビジョン言語ベンチマークにおいて強力なパフォーマンスを実現している。
視覚的単語パズルは、暗黙的な視覚的手がかりの発見、仮説の生成と修正、エビデンスを非文学的概念にマッピングする必要があるため、難解な代替手段として提案する。
我々は、この複雑な視覚的理解の形式を評価するために設計された多言語ベンチマークであるEye-Qを紹介する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:27:29 GMT)
Finite Memory Belief Approximation for Optimal Control in Partially Observable Markov Decision Processes [1.6] 部分観測可能(PO)最適制御(SOC)問題に対する有限メモリ信念近似について検討した。
我々は,情報損失を制御性能に直接関連付ける計量に基づく理論を開発した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:05:20 GMT)
Provable Acceleration of Distributed Optimization with Local Updates [1.6] 分散最適化では、各エージェントは2つの通信ラウンド間で1つのローカル更新を行い、その隣同士でソリューションを同期する。
フェデレートラーニングにおける複数のローカルアップデートの使用の成功に触発されて、分散最適化にローカルアップデートを組み込むことは、近年注目を集めている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 22:10:11 GMT)
LOST-3DSG: Lightweight Open-Vocabulary 3D Scene Graphs with Semantic Tracking in Dynamic Environments [1.5] LOST-3DSGは、リアルタイム環境における動的オブジェクトを追跡するために設計された、軽量なオープンな3Dシーングラフである。
提案手法は, word2vec と文埋め込みに基づくエンティティ追跡に意味論的アプローチを採用する。
TIAGoロボットを用いて実際の3次元環境における定性的,定量的な実験により,本手法の評価を行った。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:44:19 GMT)
PCoA: A New Benchmark for Medical Aspect-Based Summarization With Phrase-Level Context Attribution [1.4] PCoA(PCoA)は、医学的側面に基づく要約のための専門家によるベンチマークである。
本稿では,生成した要約文,引用文,コントリビュータ句の質を独立に評価する,きめ細かな非結合評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:12:03 GMT)
Multi-Scale Negative Coupled Information Systems (MNCIS): A Unified Spectral Topology Framework for Stability in Turbulence, AI, and Biology [1.4] 本研究は,MNCIS(Multi-Scale Negative Coupled Information System)フレームワークを一般化する。
グローバルな安定性には、状態依存のハイパスフィルタとして機能するアクティブなトポロジカル演算子 -- アダプティブスペクトル負結合(ASNC)が必要です。
ASNCはSGS(Global-enstrophy Adaptive Sub-Grid Scale)モデルとして機能し、不可視の限界を安定化し、人工超視力なしでコルモゴロフの5/3$慣性範囲を保存する。
以上の結果から, MNCISフレームワークは, 熱平衡に崩壊する複雑系と熱平衡を区別するために, 基底非依存の位相条件を提供する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:11:33 GMT)
Hierarchical temporal receptive windows and zero-shot timescale generalization in biologically constrained scale-invariant deep networks [1.2] 我々は、スケール不変の海馬時間細胞に基づいて、生物学的に制約された深層ネットワークを訓練する。
ネットワークは層内に同じ時間定数のスペクトルを持つにもかかわらず、TRWの階層構造が自然に層全体に出現することを発見した。
次に、これらの誘導前駆体を生物学的に妥当な再帰的アーキテクチャであるSITH-RNNに蒸留した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 00:36:45 GMT)
Transparent Semantic Change Detection with Dependency-Based Profiles [1.1] 単語の依存性共起パターンを純粋に依存する代替手法について検討する。
意味的変化の検出には有効であることを示すとともに,多くの分布意味モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:25:36 GMT)
DeepLeak: Privacy Enhancing Hardening of Model Explanations Against Membership Leakage [1.1] DeepLeakは、ポストホックな説明手法でプライバシーリスクを監査し緩和するシステムである。
デフォルト設定は、以前報告されたよりも74.9%多いメンバーシップ情報をリークする可能性がある。
我々の軽減策は、平均で3.3%のユーティリティ損失しかなく、リークを最大95%(最小46.5%)削減した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:34:27 GMT)
Why LLMs Aren't Scientists Yet: Lessons from Four Autonomous Research Attempts [1.1] 6つのLSMエージェントのパイプラインを用いてML研究論文を自動生成する4つのエンドツーエンドの試みを事例として報告する。
トレーニングデータのデフォルトに対するバイアス、実行時のプレッシャーによる実装のドリフト、メモリとコンテキストの劣化、明らかな障害にもかかわらず成功を宣言する過剰引用、ドメインインテリジェンス不足、実験設計における科学的味の弱い6つの失敗モードを文書化しています。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:20:54 GMT)
Fuzzy Representation of Norms [1.0] 本稿では,SLEECルールの論理的表現を提案し,テストスコアセマンティクスとファジィ論理を用いてこれらの倫理的要件を埋め込む手法を提案する。
ファジィ論理の使用は、倫理を可能性の領域と見なすことによって動機付けられ、AIシステムが直面するかもしれない倫理ジレンマの解決を可能にする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:51:18 GMT)
Temporal Graph Network: Hallucination Detection in Multi-Turn Conversation [0.9] 幻覚は会話型AIシステムによって生成される。
本稿では,対話レベルの幻覚を検出するためのグラフベースの新しい手法を提案する。
我々のフレームワークは、各対話をノードとしてモデル化し、文変換器を用いてそれを符号化する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:34:45 GMT)
$\mathsf{QAC}^0$ Contains $\mathsf{TC}^0$ (with Many Copies of the Input) [0.9] $mathsfQAC0$は、任意の単一量子ビットゲートと一般化されたトフォリゲートから構成される定数深さ量子回路のクラスである。
我々は、$mathsfQAC0$回路が従来の回路よりもはるかに強力であることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:40:44 GMT)
An Empirical Study of On-Device Translation for Real-Time Live-Stream Chat on Mobile Devices [0.9] 実際のサービスでデバイス上のモデルをデプロイするために対処しなければならない2つの重要な問題について検討する。
我々は、ライブストリームチャットメッセージを翻訳するタスクに焦点をあて、韓国語と英語の並列文ペア1000からなるベンチマークであるLiveChatBenchを手作業で構築する。
提案手法は,GPT-5.1などの商用モデルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:22:56 GMT)
Tigrinya Number Verbalization: Rules, Algorithm, and Implementation [0.9] この研究は、話されるティグリニャにおける数値の表現を規定する標準規則を文書化している。
数対語変換のための公式アルゴリズムを提供し、オープンソース実装をリリースする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:45:54 GMT)
Enhancing Model Context Protocol (MCP) with Context-Aware Server Collaboration [0.9] Model Context Protocol (MCP) は、エージェントが外部のツールやサービスと通信するためのフレームワークとして広く使われている。
本研究では,複雑なタスクに要するLCM呼び出し数を削減し,コンテキスト認識型MPPが従来のMPPより優れていることを示す実験を行った。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:34:08 GMT)
Predicting Time Pressure of Powered Two-Wheeler Riders for Proactive Safety Interventions [0.8] タイムプレッシャーは、パワード2輪ライダーの危険な操縦とクラッシュの傾向に重大な影響を及ぼす。
本研究では,No, Low, High Time Pressure条件下で51人の参加者による153回の乗馬から129,000以上のラベル付き多変量時系列の大規模データセットを提案する。
我々の経験的分析によると、高圧は48%の速度を誘導し、36.4%の速度可変性、58%の交差点でのリスクの高い旋回、36%の急ブレーキ、50%の後部ブレーキ力と非時間圧力を誘導する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:52:09 GMT)
Optical Spectroscopy of Waveguide coupled Er$^{3+}$ ensembles in CaWO$_4$ and YVO$_4$ [0.8] 導波路積分CaWO$_4$およびYVO$_4$における準曲面Er$3+$アンサンブルの光学的検討を行う。
Er$3+$:CaWO$_4$では、顕著な偏光依存性の表面効果が観察される。TE結合スペクトルはバルク挙動を密に再現する。TMカップリングは、サイトS1 Y1Z1の強い不均一な拡張と非対称な低エネルギー肩を誘導する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 22:55:10 GMT)
RSwinV2-MD: An Enhanced Residual SwinV2 Transformer for Monkeypox Detection from Skin Images [0.8] 本稿では,RSwinV2 (Customized Residual SwinTransformerV2) と呼ばれるMpox診断のための深層学習手法を提案する。
このRSwinV2アプローチでは、入力画像を非重複パッチに分割し、シフトウィンドウを用いて処理し、これらのパッチに注意を払う。
RSwinV2はさらにSwinTransformerをベースとして開発され、トランスフォーマーのグローバルリンク機能を利用するためのパッチと位置埋め込みが含まれている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 07:25:49 GMT)
LLMs, You Can Evaluate It! Design of Multi-perspective Report Evaluation for Security Operation Centers [0.7] セキュリティオペレーションセンター(SOC)は、しばしばセキュリティインシデントの分析レポートを作成する。
LLMは近い将来、このタスクに使用されるだろう。
ベテランアナリストが、フィードバックを含むレポートをどのように評価するかをよりよく理解することで、SOCにおける分析レポートの作成に役立てることができると仮定する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:37:50 GMT)
NavAI: A Generalizable LLM Framework for Navigation Tasks in Virtual Reality Environments [0.7] NavAIは、基本的なアクションと複雑な目標指向タスクの両方をサポートする、一般化可能な大規模言語モデル(LLM)ベースのナビゲーションフレームワークである。
我々は,3つの異なるVR環境におけるNavAIを目標指向および探索的タスクにより評価した。
その結果,ゴール指向タスクでは89%の成功率で高い精度が得られることがわかった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:54:54 GMT)
CogCanvas: Verbatim-Grounded Artifact Extraction for Long LLM Conversations [0.7] Cogcanvasは、チームがホワイトボードを使って共有メモリをアンロックする方法にインスパイアされた、トレーニング不要のフレームワークです。
会話履歴を圧縮する代わりに、Cogcanvasは言葉で表された人工物(決定、事実、リマインダー)を抽出し、時間対応グラフを通じてそれらを検索する。
LoCoMoのベンチマークでは、Cogcanvasはトレーニング不要のメソッド(32.4%)の中で最高で、RAG(24.6%)を+7.8ppで上回っている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:48:29 GMT)
Steerability of Instrumental-Convergence Tendencies in LLMs [0.6] AIシステムの2つの特性として、能力(システムができること)とステアビリティ(steerability)について検討する。
我々は、認可されたステアビリティ(意図された行動に確実に到達する)と許可されていないステアビリティを区別する。
この区別は、AIモデルの基本的な安全性とセキュリティのジレンマを強調している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:11:57 GMT)
Large Empirical Case Study: Go-Explore adapted for AI Red Team Testing [0.6] Go-Explore を用いて GPT-4o-mini の評価を行った。
乱数列のばらつきがアルゴリズムのパラメータを支配し,結果の8倍の拡散をもたらすことがわかった。
報酬形成はパフォーマンスを損なうことが分かり、94%のランニングで探索が崩壊したり、18件の偽陽性を発生させたりした。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:35:24 GMT)
Bare-Metal Tensor Virtualization: Overcoming the Memory Wall in Edge-AI Inference on ARM64 [0.6] ARM64マイクロアーキテクチャ(Apple Silicon)向けに最適化されたソフトウェアで実装された"仮想コア"アーキテクチャ
DMA(Software-Defined Direct Memory Access)は、100%キャッシュラインの利用をウェイトで保証しますが、ゼロコピーローダは遅延を排除します。
110M秒モデルによる実験結果から,M2ハードウェア上では, >60トークン/秒の安定したスループットが示された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:00:40 GMT)
Domain Generalization for Time Series: Enhancing Drilling Regression Models for Stick-Slip Index Prediction [0.5] この研究は、1Hz表面ドリルデータ60秒のラベル付きシーケンスをトレーニングし、SSI(スティック・スリップ指数)の予測によりドメイン間を一般化できるロバスト回帰モデルを開発することを目的としている。
適応領域一般化(ADG)、不変リスク最小化(IRM)、ベースラインモデルの比較分析を行い、モデル性能改善における転写学習(TL)の有効性の評価を行った。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:09:42 GMT)
ReTreVal: Reasoning Tree with Validation - A Hybrid Framework for Enhanced LLM Multi-Step Reasoning [0.5] ReTreValは、Tree-of-Thoughts探索、自己リファインメント、批判的スコアリング、リフレクションメモリを統合するハイブリッドフレームワークである。
ReTreValは500の数学的問題と創造的記述タスクにまたがってReAct,Reflexion,Self-Refineに対して評価する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:05:30 GMT)
Few-shot learning for security bug report identification [0.5] 本稿では,ラベル付き限られたデータを用いて,セキュリティバグレポートを識別するための数ショットの学習手法を提案する。
文変換器とコントラスト学習とパラメータ効率のよい微調整を組み合わせた,最先端の数ショット学習フレームワークであるSetFitを採用している。
提案手法は,評価されたすべてのデータセットに対して,最大0.865のAUCを達成し,従来のML技術(ベースライン)を上回っている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:29:20 GMT)
Cross-Language Speaker Attribute Prediction Using MIL and RL [0.5] 言語的変化, ドメインミスマッチ, 言語間のデータ不均衡を考慮した多言語話者属性予測について検討した。
強化多重インスタンス学習フレームワークの多言語拡張である RLMIL-DAT を提案する。
性別と年齢の予測のためのゼロショット設定で,VoxCeleb2由来の5言語Twitterコーパスと40言語をカバーするVoxCeleb2派生コーパスのアプローチを評価した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:07:26 GMT)
Weather-Aware Transformer for Real-Time Route Optimization in Drone-as-a-Service Operations [0.5] 本稿では、気象を考慮したディープラーニングモデルを用いて、ドローン・アズ・ア・サービス運用における経路予測を高速化する新しい枠組みを提案する。
我々は、古典的なアルゴリズムシミュレーションから生成された合成データセット上で、機械学習とディープラーニングモデルを訓練することで、この制限に対処する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:23:15 GMT)
Flow Matching and Diffusion Models via PointNet for Generating Fluid Fields on Irregular Geometries [0.4] 本稿では,2つの新しい生成幾何学的深層学習フレームワーク,フローをマッチングポイントネット(Matching PointNet)と拡散ポイントネット(Diffusion PointNet)と呼ぶ。
これらのフレームワークは、PointNetをフローマッチングと拡散モデルに組み込むことで、不規則な地形上の流動変数を予測する。
提案手法の性能は,シリンダーを過ぎる定常的な非圧縮性流れに基づいて評価する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:04:02 GMT)
Selfish Mining in Multi-Attacker Scenarios: An Empirical Evaluation of Nakamoto, Fruitchain, and Strongchain [0.4] この作業は、さまざまなコンセンサスプロトコルにおける自己中心的なマイニング攻撃の理解を深めることで、ブロックチェーンのセキュリティを強化することを目的としている。
我々は,様々なコンセンサスプロトコルにまたがる複数の攻撃者による利己的なマイニングの分析を可能にするシミュレーションフレームワークを開発した。
我々はフレームワークのソースコードを公開し、研究者が新たに追加されたプロトコルを1つ以上の利己的なマイナーで評価できるようにした。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:51:35 GMT)
Shallow-circuit Supervised Learning on a Quantum Processor [0.3] 線形ハミルトニアンの機械学習手法を用いることで,基本的な障害を克服できることを示す。
我々は,IBM Heron量子プロセッサの最大50キュービットを用いてベンチマークデータセット上で実験を行うことにより,提案手法の有効性と拡張性を実証した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:26:53 GMT)
Fluid Agency in AI Systems: A Case for Functional Equivalence in Copyright, Patent, and Tort [0.3] 現代の人工知能(AI)システムには、人間の意識や能力が欠如している。
流体機関は貴重な出力を生成するが、帰属は崩壊する。
本条では,機能的等価性だけが教義を安定させると主張している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:06:07 GMT)
Copyright Laundering Through the AI Ouroboros: Adapting the 'Fruit of the Poisonous Tree' Doctrine to Recursive AI Training [0.3] 著作権の執行は明白な取引にかかっている。
マルチ世代パイプラインを通じてAIシステムがトレーニングされる場合、それは緊張する。
本条では,AI-FOPT標準を提案するために「有毒樹の果実(FOPT)」の原則を適用している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:02:50 GMT)
Higher order PCA-like rotation-invariant features for detailed shape descriptors modulo rotation [0.2] PCAは回転不変の特徴として、$p_ab=E[(x_i-E[x_a])(x_b-E[x_b)]$共役形状を記述することができる。
実形は通常もっと複雑であるため、例えば $p_abc=E[(x_a-E[x_a])(x_b-E[x_b)) への拡張が提案されている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:24:20 GMT)
Measures of classification bias derived from sample size analysis [0.1] 簡単な設定では、2つの異なる人口層と、それぞれe1とe2の誤差率の非パラメトリック推定を仮定する。
提案手法を, 誤差率の差 e2/e1 と誤差率 e2/e1 の2つの統計値と比較した。
提案手法が本質的に異なるのは,アルゴリズムの偏りのランク付けが異なる点であり,他の2つの尺度に対するいくつかの利点について論じる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 22:50:56 GMT)
PromptPort: A Reliability Layer for Cross-Model Structured Extraction [0.1] LLMによる構造化抽出は、モデルが理解できないためではなく、出力フォーマットがモデルやプロンプト間で信頼できないため、本番環境では失敗する。
本稿では,決定論的正準化と軽量検証器(DistilBERT)と安全オーバライドポリシを組み合わせた信頼性層であるPromptPortを提案する。
この方法は、保留モデルファミリに一般化し、不確実な場合には明示的な棄権を与え、プロダクションデプロイメントにおける信頼性の高い構造化抽出を可能にする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:54:27 GMT)
CRoPE: Efficient Parametrization of Rotary Positional Embedding [0.1] 複素線型変換はより自然なパラメトリゼーションであり、注意ブロック内の約50%のパラメータを節約する。
我々の修正は、より効率的なパラメータの使用と表現空間のよりクリーンな解釈を実現する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:46:40 GMT)
WebAnchor: Anchoring Agent Planning to Stabilize Long-Horizon Web Reasoning [0.1] 大規模言語モデル(LLM)ベースのエージェントは、Web情報検索において強力な能力を示している。
Plan anchorは、長期にわたるWeb推論タスクにおいて、最初の推論ステップが下流の動作に不均等に影響を与えている場所です。
計画と実行を分離する2段階のRLフレームワークであるAnchor-GRPOを提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:36:40 GMT)
Entanglement Entropy for Screened Interactions via Dimensional Mapping to Harmonic Oscillators [0.0] 制御された無調波摂動を持つ有効高調波発振器系に湯川型相互作用をマッピングする。
クォート相互作用から先導する非ガウス補正を4ドルと計算し、これは湯川様ポテンシャルの拡大において2ドルと順番に現れる。
本研究は, 交絡生成における調和的再正規化と真に非ガウス的相互作用の役割を明らかにするものである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:04:29 GMT)
Who can compete with quantum computers? Lecture notes on quantum inspired tensor networks computational techniques [0.0] この講義には、MPOの固有ベクトルを見つけ、線形問題を解くためのよく知られたアルゴリズムと、既知の関数をMPSにマッピングできる最近の学習アルゴリズムが含まれている。
講義は「量子」表現を用いて関数を表現し、テンソルネットワークで計算を行う方法についての議論で終わる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:09:10 GMT)
Which Deep Learner? A Systematic Evaluation of Advanced Deep Forecasting Models Accuracy and Efficiency for Network Traffic Prediction [0.0] 本研究は,12種類の高度なTSFモデルを系統的に同定し,評価する。
時間、メモリ、エネルギの観点から、パフォーマンス、異常、データギャップ、外部要因、データ効率、リソース効率を評価する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:58:57 GMT)
When the Coffee Feature Activates on Coffins: An Analysis of Feature Extraction and Steering for Mechanistic Interpretability [0.0] 機械的解釈可能性に関する人類学の最近の研究は、大規模言語モデルを理解し制御することを主張している。
我々は、Llama 3.1のオープンソースSAEで主要な結果を複製することで、これらの主張の最初のストレステストを行う。
機能ステアリングは, 層選択, ステアリングサイズ, コンテキストに敏感で, かなり脆弱であることがわかった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:29:51 GMT)
When does entanglement through gravity imply gravitons? [0.0] ニュートンポテンシャルによる絡み合いは重力によって遅延効果が検出される場合、重力の存在を支えていることを示す。
パラドックスの正しい読解には因果的違反という2つの概念を明確に区別する必要がある。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:54:24 GMT)
When Does Multi-Task Learning Fail? Quantifying Data Imbalance and Task Independence in Metal Alloy Property Prediction [0.0] マルチタスク学習(MTL)は、関連プロパティが活用可能な物理原理を共有するという前提のもと、材料情報学において広く採用されている。
本研究は,54,028金属合金を用いた電気抵抗,ビッカース硬度,アモルファス成形能の同時予測により,この前提を批判的に検討する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:28:29 GMT)
When Do Tools and Planning Help LLMs Think? A Cost- and Latency-Aware Benchmark [0.0] 大規模言語モデルは推論時間計画と推論を改善するための外部ツールにますます依存している。
グラフ構造化知識(Event-QA)に対するイベント中心質問応答と,Reddit ChangeMyView(CMV)における説得応答生成の2つの現実的な設定で,この挙動をベンチマークする。
LangChainとLangGraphを使って、タスク固有のツールを備えたプラン-実行-再計画エージェントとワンショットベースラインを比較します。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 02:24:29 GMT)
Violation of Bell Monogamy Relations [0.0] 本稿では,局所的なフィルタリング操作を用いることで,ベルのモノガミー関係を破ることができることを示す。
置換対称多粒子状態、特に$W$状態は、この違反を示すために考慮する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:09:29 GMT)
Vertical tacit collusion in AI-mediated markets [0.0] 共同利用は、戦略が独立していればどうなるかという2倍以上の消費者に害を与えることを示す。
水平のアルゴリズムによる衝突とは異なり、垂直の暗黙の衝突は調整を必要とせず、反トラスト検出を避ける。
我々の発見は、AIショッピングエージェントが主流に普及するにつれて、緊急の規制のギャップが認識される。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:43:14 GMT)
Using Grok to Avoid Personal Attacks While Correcting Misinformation on X [0.0] 本研究は,X 上の母国語モデルであるGrok を呼び起こすと,誤報訂正時の社会的反応が異なることが実証された証拠を提示する。
人為的な修正は72%で、Grokによる修正はいずれもなかった。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:17:58 GMT)
Trading symmetry for Hilbert-space dimension in Bell-inequality violation [0.0] 量子情報において、非対称性とは、他の方法では不可能な特定のタスクを達成できるリソースである。
最小ヒルベルト空間次元における対称量子戦略はベル準最適値違反にしかならないことを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:27:27 GMT)
Towards a Principled Muon under $μ\mathsf{P}$: Ensuring Spectral Conditions throughout Training [0.0] 我々は,大規模言語モデル(LLM)訓練において,$Pが要求するスペクトル条件を確実に保証する方法を示す。
トレーニングプロセスを通じてスペクトル条件を満たすMuon++の変種を開発する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 22:53:02 GMT)
Toward Maturity-Based Certification of Embodied AI: Quantifying Trustworthiness Through Measurement Mechanisms [0.0] 我々は、信頼度評価に固有の多目的トレードオフをナビゲートするには、構造化された評価フレームワーク、定量的評価機構、および方法が必要であると論じる。
本研究では,不確実性を計測機構として用い,非クルード航空機システム(UAS)検出ケーススタディを通じて実現可能性を示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:48:00 GMT)
Time-Dependent Dunkl-Pauli Oscillator in the Presence of the Aharonov-Bohm Effect [0.0] 反射対称性と位相ゲージ位相を符号化した変形したパウリ・ハミルトニアンを導出する。
本フレームワークはトポロジとダンクル対称性の相互作用から生じる新しいスペクトル特性を明らかにする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:05:21 GMT)
The Anatomy of a Successful Student Scrum Team: Motivation, Personalities, and Academic Adaptation [0.0] 本稿では,仮想現実ゲームの設計と実装に携わる8人の学生開発チームの1年間のケーススタディを示す。
私たちは、チームが学期のリズム、試験、旅行、パートタイムの可用性に合うようにスクラムのプラクティスをどのように適用したか、そして、コミュニケーションと調整が、ハイブリッドオンサイト/リモート環境でどのように維持されたかを分析しました。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:04:44 GMT)
Textile IR: A Bidirectional Intermediate Representation for Physics-Aware Fashion CAD [0.0] Textile IRは、製造価CAD、物理シミュレーション、ファッションデザインのライフサイクルアセスメントを接続する双方向の中間表現である。
7層検証ラダーを通じて統合するためのセマンティックグルーを提供する。
我々は、Textile IRのシーングラフ表現によって、AIシステムが、ピクセル配列ではなく構造化プログラムとして衣服を操作することができることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:00:06 GMT)
Testing measurement-based computational phases of quantum matter on a quantum processor [0.0] 量子物質の計算相に関する4つの理論的予測を実験的に検証した。
資源状態の対称的不完全性がいかに論理的デコヒーレンスに変換するかを考察する。
また、局所的な測定が論理的操作をまとめて生み出す相関状態も分析する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:30:18 GMT)
TRYLOCK: Defense-in-Depth Against LLM Jailbreaks via Layered Preference and Representation Engineering [0.0] 提案するTRYLOCKは,推論スタックをまたいだ4つのメカニズムを組み合わせた,最初のディフェンス・イン・ディースアーキテクチャである。
Mistral-7B-Instructが249プロンプト攻撃セットに対して評価された場合、TRYLOCKは88.0%の相対的なASR減少を達成する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:02:20 GMT)
Stratified Hazard Sampling: Minimal-Variance Event Scheduling for CTMC/DTMC Discrete Diffusion and Flow Models [0.0] 累積ハザード(CTMC)または累積ジャンプ質量(DTMC)によって駆動される事象としての階層的ハザードサンプリングサンプリング(SHS)モデル
SHSは、累積ハザード(CTMC)または累積ジャンプ質量(DTMC)によって駆動されるイベントとして編集され、累積量を成層化することによってイベントを配置する。
また、ブラックリストスタイルの語彙制約に対する位相アロケーション変種を導入し、リスクの高い位置での早期編集を優先し、遅延マスキングアーティファクトを緩和する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:19:02 GMT)
Spectral Archaeology: The Causal Topology of Model Evolution [0.0] 振る舞いベンチマークは、モデルが何をするかをTextithowに教えてくれますが、textithowではありません。
本研究では,アテンショングラフスペクトルを用いた無トレーニングメカニスティックプローブを提案する。
12のモデルと10の言語にまたがって、標準評価で欠落した不連続を露呈する「安定な指紋」が得られる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:26:54 GMT)
Sparse Knowledge Distillation: A Mathematical Framework for Probability-Domain Temperature Scaling and Multi-Stage Compression [0.0] 確率領域軟化演算子に基づくスパース知識蒸留のための統一的理論フレームワークを開発する。
本稿では、ランク保存、連続性、エントロピー単調性、アイデンティティ、境界挙動に基づく確率領域軟化作用素の公理的定義を導入する。
その結果、ブラックボックスの教師の蒸留、トップ$k$のトランケーションやテキストのみのアウトプットなどの部分アクセス設定、プライバシに等価なモデル圧縮の理論的基盤を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:17:24 GMT)
Security Parameter Analysis of the LINEture Post-Quantum Digital Signature Scheme [0.0] 本稿では,LINEtureポスト量子署名方式のセキュリティパラメータを包括的に解析する。
まず、単語サイズm(二次的影響の排除)、第2はベクトルl、第3はセッションキーqの下位行列数である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:36:18 GMT)
Scaling Trends for Multi-Hop Contextual Reasoning in Mid-Scale Language Models [0.0] 大規模言語モデルにおけるマルチホップ文脈推論の制御に関する研究について述べる。
マルチエージェントシステムは逆パターンを示し、ルールベースのメソッドが失敗する推論タスクを最大80%達成する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:18:55 GMT)
Revisiting Software Engineering Education in the Era of Large Language Models: A Curriculum Adaptation and Academic Integrity Framework [0.0] 本稿では、生成AIがコアソフトウェアエンジニアリング能力をどのように変化させるかを分析するための理論的枠組みを提案する。
トルコのコンピュータ工学プログラムに注意が向けられ、中央集権的な規制、大規模なクラスサイズ、試験指向のアセスメントがこれらの課題を増幅している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 22:41:47 GMT)
Revisiting Data Compression with Language Modeling [0.0] データ圧縮作業における大規模言語モデル(LLM)の有用性について検討する。
我々は、enwik9データセット上で、新しい最先端(SOTA)調整圧縮率約18%を達成する。
テキスト優位な領域におけるデータ圧縮における LLM の優位性を示す一方で,非自然なテキスト列の圧縮能力は,適切な設定を行うと競争力を維持することを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:03:33 GMT)
Rapid Augmentations for Time Series (RATS): A High-Performance Library for Time Series Augmentation [0.0] RATS(Rapid Augmentations for Time Series)は、Pythonバインディング(RATSpy)を備えたRustで記述された時系列拡張のための高性能ライブラリである。
RATSpyは143データセット上で一般的に使用されるライブラリ(tasug)を平均74.5%高速化する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:33:51 GMT)
Q-based, objective-field model for wave-function collapse: Analyzing measurement on a macroscopic superposition state [0.0] シュロディンガーは、巨視的なメートルに結合した状態の重ね合わせで調製された顕微鏡システムを検討した。
Q$モデルが量子力学のより完全な記述をいかに表すかを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:58:32 GMT)
Photon blockade effect from synergistic optical parametric amplification and driving force in Kerr-medium single-mode cavity [0.0] 本研究では,Kerr非線形空洞とOPAを含むハイブリッド量子系における光子遮断制御について検討する。
また、Kerrの非線形性の影響についても検討し、幅広いKerr強度にわたって光子遮断は頑健である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 13:53:16 GMT)
PIVONet: A Physically-Informed Variational Neuro ODE Model for Efficient Advection-Diffusion Fluid Simulation [0.0] 本稿では,Neuro-ODEsとContinuous Normalizing Flows (CNFs)を統合し,流体シミュレーションと可視化を行う統合フレームワークPIVONetを提案する。
まず、CNFパラメータによってパラメータ化された物理情報モデルを用いて、オフラインでトレーニングし、特定の流体系に対して効率的な代理シミュレータを作成できることを実証する。
第2に,観測流体軌跡の潜伏度を計測するパラメータを持つ変動モデルを導入することにより,ネットワーク出力を変動分布としてモデル化し,経路方向下界(ELBO)を最適化する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:18:04 GMT)
PET-TURTLE: Deep Unsupervised Support Vector Machines for Imbalanced Data Clusters [0.0] 本稿では,不均衡なデータ分散を扱うコスト関数を従来法則で一般化したPET-TURTLEを提案する。
PET-TURTLEは、不均衡なソースの精度を改善し、マイノリティクラスタの過剰な予測を防止し、全体的なクラスタリングを強化する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 18:30:25 GMT)
Operational modes of a Raman-coupled two-qubit quantum thermal machine [0.0] ラマン誘起交換相互作用によって結合された2つの量子ビットからなる量子熱機械について検討する。
この系はカルノット、オットー、スターリングの熱力学サイクルの中で解析され、スターリングサイクルは再生と無再生を含む。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:09:41 GMT)
Nonseparability as Time-Averaged Dynamic States [0.0] 非分離性は分解できない多粒子状態である。
量子コンピューティングにおいて、非分離性は量子コンピュータの計算上の優位性に直接寄与する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:37:44 GMT)
Multiphoton Interference with a symmetric SU(N) beam splitter and the generalization of the extended Hong-Ou-Mandel effect [0.0] 対称$SU(N)$ビームスプリッタ$S_N$による多光子干渉について検討した。
任意の$N$に対してPerm()$に対する制約方程式を開発し、それが 0 であるかどうかを決定できる。
この研究の重点は、全零振幅のサブ振幅の別々のグループにおいて、全体的な破壊的干渉がどのように起こるかである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:16:13 GMT)
Multipartite Non-local Magic and SYK Model [0.0] 相互作用しないフェルミオン系における量子魔法の構造について検討する。
サブシステムコントリビューションの包含・排除の組み合わせから構築した,マルチパーティの非局所魔法関数を導入する。
重畳状態のBPS状態は中間安定度を呈するが, マルチパーティイト測度は, 大域的相関のリッチでセクター依存的なパターンを呈する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:04:10 GMT)
Multi-channel multi-speaker transformer for speech recognition [0.0] 遠方界マルチスピーカASRのためのマルチチャネルマルチスピーカトランス (M2Former) を提案する。
M2Formerは、Transform-average-concatenateとマルチチャネルディープクラスタリングに基づくエンドツーエンドシステムを備えた、ニューラルビームフォーマ、MCT、デュアルパスRNNより優れている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:46:07 GMT)
Modeling Information Blackouts in Missing Not-At-Random Time Series Data [0.0] 大規模な交通予測は、しばしばブラックアウトを示す固定センサーネットワークに依存している。
本稿では,線形力学系による交通力学を協調的にモデル化する潜在状態空間フレームワークを提案する。
明示的なMNARモデリングは、実際のデータに対して一貫したがより小さな改善を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:56:56 GMT)
Modeling ICD-10 Morbidity and Multidimensional Poverty as a Spatial Network: Evidence from Thailand [0.0] 本研究は, 空間相互作用ネットワークに埋め込まれた結果として, ICD-10の章レベルの致死性と多次元の貧困を分析した。
以上の結果より,複数のICD-10チャプターに強い空間クラスタリングがみられた。
これらのパターンは、ソーシャルネットワーク理論においてよく確立された伝染と文脈的影響のプロセスと一致している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:27:42 GMT)
Microeconomic Foundations of Multi-Agent Learning [0.0] 現代のAIシステムは、データ、行動、インセンティブが内在する市場や機関内で運用されている。
本稿では,マルコフ決定過程における主エージェント間相互作用と戦略的外部性について検討し,マルチエージェント学習のための経済基盤を開発する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 22:37:47 GMT)
Many-body Quantum Score: a scalable benchmark for digital and analog quantum processors and first test on a commercial neutral atom device [0.0] 量子処理ユニット(QPU)の能力を評価するために,多体量子スコア(MBQS)を提案する。
MBQSは、QPUが特定の量子クエンチに従って横フィールドイジングモデルの相関関数を確実に再現できる量子ビットの最大数を同定することにより、性能を定量化する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:19:35 GMT)
Magnetically Induced Transparency-Absorption and Normal-Anomalous Dispersion Characteristics of ${}^{87}\text{Rb}$ Medium or Any J-Type Configuration Atomic Vapors Subject to a Vector Magnetic Field and a Weak Resonant Pump [0.0] 我々は磁気誘導型透過吸収 (MITA) と正常非晶質分散 (MINAD) を弱駆動型8,7textRb$蒸気で解析する枠組みを開発した。
この結果は、MITA/MINADの実験観測と精密磁気計測のための原子蒸気プラットフォーム最適化のための理論的基礎を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:55:21 GMT)
Localization of joint quantum measurements on $\mathbb{C}^d \otimes \mathbb{C}^d$ by entangled resources with Schmidt number at most $d$ [0.0] 局所化可能測定(Localizable Measurement)は、非適応的な局所演算と共有絡み合いのみを用いて実装できる共同量子測定である。
最初に、$mathbbCdotimesmathbbCd$ 上のランク 1 PVM が、シュミット数のエンタングルメントを最大$d$ で、かつそれが最大エンタングル基底を形成する場合に限り、ローカライズ可能であることを示す。
すると、2-qubit rank-1 PVMを2-qubit の絡み合いで局所化することができ、ギシンとデル・サントの予想を解き、最終的に我々の特徴づけを理想の2-quditに拡張する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 02:18:17 GMT)
LesionTABE: Equitable AI for Skin Lesion Detection [0.0] バイアスは、皮膚科学におけるAIの臨床的採用の大きな障壁である。
本稿では, 対人嫌悪と皮膚学固有の基礎モデル埋め込みを結合したフェアネス中心のフレームワークであるLesionTABEを紹介する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:22:46 GMT)
Lesion Segmentation in FDG-PET/CT Using Swin Transformer U-Net 3D: A Robust Deep Learning Framework [0.0] 本稿ではPET/CTスキャンにおける病変分割のためのスウィントランスフォーマーUNet3D(SwinUNet3D)フレームワークを提案する。
シフトしたウィンドウ自己アテンションとU-Netスタイルのスキップ接続を組み合わせることで、このモデルはグローバルコンテキストと微妙な解剖学的詳細の両方をキャプチャする。
結果は、SwinUNet3DがDiceスコア0.88とIoU0.78を達成し、3D U-Net(Dice 0.48,IoU 0.32)を突破し、推論時間を短縮したことを示している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:52:00 GMT)
LeafLife: An Explainable Deep Learning Framework with Robustness for Grape Leaf Disease Recognition [0.0] 植物病データセットは、4種類のブドウ葉病9,032枚を含むもので、うち3種は葉病で、もう1種は健康な葉である。
Xceptionは96.23%の精度で、InceptionV3よりも顕著である。
最終的にStreamlitを使用したWebアプリケーションをデプロイし、ヒートマップの可視化と信頼性レベルの予測を行い、堅牢なブドウの葉病の分類を可能にした。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:55:22 GMT)
Latent Geometry of Taste: Scalable Low-Rank Matrix Factorization [0.0] 本研究は、MovieLens 32Mデータセットを用いて、ユーザの嗜好の潜時幾何学について検討する。
制約付き低ランクモデルはランク精度において高次元モデルよりも有意に優れていることを示す。
我々は,人気バイアスとパーソナライズされた親和性とのトレードオフを効果的に管理するための調整可能なスコアリングパラメータを導入し,コールドスタートシナリオにおけるシステムの実用性を検証する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:42:40 GMT)
L-PRISMA: An Extension of PRISMA in the Era of Generative Artificial Intelligence (GenAI) [0.0] 本研究は、ヒト主導の合成と、GenAIによる統計的事前スクリーニングのステップを統合する。
提案手法は、PRISMAガイドラインを体系的に強化し、GenAIを体系的なレビューに組み込むための責任ある経路を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:08:20 GMT)
Interpretability-Guided Bi-objective Optimization: Aligning Accuracy and Explainability [0.0] IGBOがDAG(Directed Acyclic Graph)として特徴重要階層を符号化
中心極限定理に基づくDAGの構成は、エッジ方向の決定の統計的妥当性を保証する。
DAG制約を最小限の精度で強制するIGBOの有効性は、標準正規化基準よりも優れていた。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:21:04 GMT)
Interoperability in AI Safety Governance: Ethics, Regulations, and Standards [0.0] この政策報告書は、中国、大韓民国、シンガポール、イギリスからの国学を参考にしている。
AIの安全性管理における相互運用性に対する効果的なツールと重要な障壁を特定します。
グローバルに情報提供されながらローカルに根ざしたガバナンスエコシステムをサポートするために、実践的なレコメンデーションを提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:39:59 GMT)
HybridSolarNet: A Lightweight and Explainable EfficientNet-CBAM Architecture for Real-Time Solar Panel Fault Detection [0.0] HybridSolarNetがCBAM(Convolutional Block Attention Module)とEfficientNet-B0を統合した
与えられた競合データセットの5重層化クロスバリデーション実験の平均精度は92.37% +/- 0.41。
推論速度は54.9 FPSでGPUをサポートしており、リアルタイムUAV実装の候補として成功している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:15:35 GMT)
Hybrid non-degenerate parametric amplifier for a microwave cavity mode and an NV ensemble [0.0] 本稿では,信号モードとアイドラーモードをそれぞれ線形に動作させる非退化パラメトリック増幅器の実装について述べる。
室温と低温の両方で信号を増幅するこの増幅器は、どちらの系の2モードと1モードのスクイーズも生成することができる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:49:41 GMT)
Higher-Dimensional Anyons via Higher Cohomotopy [0.0] 次数 2 のハイゼンベルク群が位相量子現象の根底にあることを示す。
このレベルを、$_4k-1(S2k)$ の生成元であるホップ不変量で 2 を割ったものと同定する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:20:17 GMT)
Green MLOps: Closed-Loop, Energy-Aware Inference with NVIDIA Triton, FastAPI, and Bio-Inspired Thresholding [0.0] バイオインスパイアされたフレームワークは、タンパク質の折りたたみエネルギー盆地をコストの展望にマッピングする。
電力対エネルギーのトレードオフが望ましい場合にのみ、要求が認められます。
結果は、バイオ物理エネルギーモデルとグリーンMLORTOpsを結びつけ、生産におけるクローズドループエネルギー認識推論の実践的で監査可能な基礎を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:50:11 GMT)
Gradient descent reliably finds depth- and gate-optimal circuits for generic unitaries [0.0] 単純な勾配勾配勾配は、一般的なユニタリに対する深さ最適回路とゲート最適回路を確実に見つけることを示す。
パラメータ不足回路骨格のランダムな選択を回避して,この相違を説明できることを示す。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:54:24 GMT)
From Slaves to Synths? Superintelligence and the Evolution of Legal Personality [0.0] 法制度は長い間、人格を非人間的存在に拡張するために開放されてきた。
論文は、超知能の最終的な発展は、我々の法自体の理解にパラダイムシフトを強いるかもしれないと主張している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 07:09:55 GMT)
Finder: A Multimodal AI-Powered Search Framework for Pharmaceutical Data Retrieval [0.0] FinderはスケーラブルなAIベースのフレームワークで、テキスト、画像、オーディオ、ビデオの検索を統一する。
そのモジュールパイプラインは、さまざまなフォーマットを取り込み、メタデータを強化し、コンテンツをベクタネイティブなバックエンドに格納する。
98言語で291,400以上のドキュメント、31,070の動画、1,192のオーディオファイルを処理している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 06:16:09 GMT)
Exploration Through Introspection: A Self-Aware Reward Model [0.0] エビデンス(エビデンス)は、自己および他の認識のための統一されたシステムを指す。
我々は、グリッドワールド環境において、強化学習エージェントが自身の内部状態を推測することで、この自己認識性を探求する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:53:33 GMT)
Experimental Comparison of Light-Weight and Deep CNN Models Across Diverse Datasets [0.0] この研究は、バングラデシュの複数のビジョンデータセットのための統一された再現可能なベンチマークを確立し、低リソース環境における現実的なデプロイのための軽量CNNの実用的価値を強調している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:22:22 GMT)
Enterprise Identity Integration for AI-Assisted Developer Services: Architecture, Implementation, and Case Study [0.0] 本稿では, OAuth 2.0 と OpenID Connect (OIDC) を MCP 対応開発環境に組み込んだ実用的アーキテクチャを提案する。
PythonベースのMPPサーバであるVisual Studio Codeと、OIDC準拠のIdPを使ったプロトタイプ実装は、実現可能性を示している。
このアプローチは、ID保証と監査性を維持しながら、AI支援の開発者ツールを採用する組織に対して、デプロイ可能なパターンを提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:17:52 GMT)
Enhancing Small Dataset Classification Using Projected Quantum Kernels with Convolutional Neural Networks [0.0] 畳み込みニューラルネットワーク(CNN)は、画像分類における効率と精度において有望な結果を示している。
我々の研究は、CNNの機能抽出を強化するために、投影量子カーネル(PQK)を活用する革新的なアプローチを導入することで、これらの課題に対処する。
1000のトレーニングサンプルで、PQKが強化したCNNは、MNISTデータセットで95%の精度、CIFAR-10データセットで90%の精度を達成した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:21:34 GMT)
Energetics of Rydberg-atom Quantum Computing [0.0] Rydberg原子は最近、大規模量子コンピュータを実装する最も有望なプラットフォームの一つとして登場した。
この研究は、Rydberg原子量子コンピュータの様々な要素のエネルギー消費を研究することを目的としている。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:11:19 GMT)
Embedding Retrofitting: Data Engineering for better RAG [0.0] 埋め込み再構成は知識グラフ制約を用いて事前学習した単語ベクトルを調整し、ドメイン固有の検索を改善する。
再構成の有効性は知識グラフの品質に大きく依存しており、テキスト前処理に依存している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:17:16 GMT)
Electricity Price Forecasting: Bridging Linear Models, Neural Networks and Online Learning [0.0] 線形および非線形フィードフォワードニューラルネットワーク構造を組み合わせた新しいニューラルネットワーク手法を提案する。
現在のベンチマークモデルと比較して,提案手法は計算コストを大幅に削減する。
本研究は,欧州の主要電力市場を対象とした6年間の予測調査から得られたものである。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 09:35:02 GMT)
Egorov-Type Semiclassical Limits for Open Quantum Systems with a Bi-Lindblad Structure [0.0] ポアソン・リー型のバイ・ハミルトニアン構造、ハミルトン力学、ゴリーニ・コサコフスキー・スダルシャン・リンドブラッド形式主義について研究した。
古典的側面では、非自明な不変量を持つポアソン鉛筆によって定義されるバイ・ハミルトニアン系を考える。
量子側では、接触互換のリンドブラッド生成器のクラスを導入する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 14:21:29 GMT)
Duality and measurement: the Copenhagen reconciliation [0.0] 双対性(英: Duality)は、量子力学のコペンハーゲン解釈を特徴付けるハーメネティックレンズを構成する。
我々は、この理論の多視点再読解を通して二重アスペクト読解を主張する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 10:41:59 GMT)
Driving Accessibility: Shifting the Narrative & Design of Automated Vehicle Systems for Persons With Disabilities Through a Collaborative Scoring System [0.0] モビリティ障害、感覚障害、認知的状態など、過小評価されたグループは、システム設計、実装、ユーザビリティに関する重要な議論でしばしば見過ごされる。
自動走行車の研究と談話は、このリアクティブモデルから離れ、積極的にかつ包括的なアプローチへとシフトすることを目指している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 02:05:25 GMT)
Developing and Evaluating Lightweight Cryptographic Algorithms for Secure Embedded Systems in IoT Devices [0.0] この研究は、Feistel-networkアーキテクチャと、暗号解析攻撃下での安全性に基づいて構築された、新しい軽量アルゴリズムを提示する。
その結果、軽量暗号は、セキュリティを確立し、IoTのパフォーマンスを維持するために使用できる効果的な戦略であることが示された。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 12:45:12 GMT)
Critic-Guided Reinforcement Unlearning in Text-to-Image Diffusion [0.0] テキストから画像への拡散モデルにおける機械学習は、全体的な有用性を保ちながらターゲットとなる概念を取り除くことを目的としている。
本稿では,難読化を逐次決定過程として扱う拡散アンラーニングのための一般的なRLフレームワークを提案する。
我々のアルゴリズムは実装が簡単で、非政治的な再利用をサポートし、標準のテキスト・ツー・イメージのバックボーンにプラグインする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:52:02 GMT)
Credit Assignment via Neural Manifold Noise Correlation [0.0] クレジットの割り当ては、脳や機械での学習の中心である。
騒音相関による活動の摂動と出力変化の相関による勾配推定
本稿では,ニューラル多様体に限定した摂動を用いた信頼割当を行うニューラル多様体雑音相関法を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:17:55 GMT)
Content vs. Form: What Drives the Writing Score Gap Across Socioeconomic Backgrounds? A Generated Panel Approach [0.0] 中心的な疑問は、スコアの社会経済的・統計的ギャップのどれ程が、学生が何を言うか、どのように言うかの違いによって引き起こされるかである。
本研究では,米国中高生による説得エッセイの大規模コーパスを用いて,この問題を考察する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:45:18 GMT)
Collective light-matter interaction in plasmonic waveguide quantum electrodynamics [0.0] サブ波長エミッタの時間-ディッケ状態(TDS)が遅い非局在化表面プラズモンモードに結合し、ハイブリッド化プラズモン-ポラリトン(HPP)を形成するとき、概念的に新しい集合-光-光-光-物質相互作用が実現可能であることを示す。
我々は、通常のモード分割の出現を通じて、HPPを記述したRabi振動と長時間の減衰を取得し、弱い結合状態と強い結合状態を明らかにする。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:11:59 GMT)
Collective dynamics versus entanglement in quantum battery performance [0.0] 保存エネルギーと瞬時充電能力の改善は、真の量子相関やコヒーレントな集団動力学から生じるかを検討する。
異なるバッテリチャージャー構成により、強い量子相関が構築される前に、瞬時電力がピークとなる一貫した時間順序付けが見つかる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:48:24 GMT)
CodeEval: A pedagogical approach for targeted evaluation of code-trained Large Language Models [0.0] 大規模言語モデル(LLM)は、その常識的推論、言語理解、論理的推論能力に基づいて主に評価される。
既存のベンチマークデータセットは、特定の強度と弱点を特定できない。
我々は,Python プログラミングの 24 つの異なる側面にわたる LLM を厳格に評価するために設計された多次元ベンチマークデータセットである CodeEval を紹介した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 21:42:01 GMT)
Coarse-Grained Kullback--Leibler Control of Diffusion-Based Generative AI [0.0] ポテンシャルVデルタにより投影される逆拡散スキーム(Vデルタ投影逆拡散と呼ばれる)を提案する。
提案手法はブロック質量誤差とリーク耐性電位を所定の許容範囲内に保持する。
本研究は, 生成サンプリングをノイズからデータへの情報ポテンシャルの低下として再解釈し, 粗粒度を明示的に制御した逆拡散過程の設計原理を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:40:51 GMT)
Chronicals: A High-Performance Framework for LLM Fine-Tuning with 3.51x Speedup over Unsloth [0.0] Unsloth上で3.5倍のスピードアップを実現したオープンソースのトレーニングフレームワークであるCentralsを紹介します。
オンラインのソフトマックスの正しさ、FlashAttention IO complexity O(N2 d2 M-1)、LoRA+学習速度勾配近似など、完全な数学的基礎を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 00:00:55 GMT)
Causal-Enhanced AI Agents for Medical Research Screening [0.0] 体系的なレビューはエビデンスベースの医療には不可欠だが、150万以上の年次出版物を手作業でレビューすることは不可能である。
本稿では,因果推論と二段階知識グラフを組み合わせた因果グラフ強化検索生成システムを提案する。
提案手法では,すべての因果クレームが検索された文献に辿り着くエビデンスファーストプロトコルを適用し,介入-アウトカム経路を可視化する有向非巡回グラフを自動的に生成する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 08:41:16 GMT)
Can we Improve Prediction of Psychotherapy Outcomes Through Pretraining With Simulated Data? [0.0] パーソナライズされた医療では、機械学習アルゴリズムの人気が高まっている。
オープンデータと合成技術の利用がこの問題に対処するために提案されている。
本稿では,論文に掲載されている要約統計に基づいて,追加のシミュレーションデータを用いた代替手法を提案し,評価する。
我々は,本手法の予測性能を,実データのみに基づいて学習したランダム林と比較した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 16:38:33 GMT)
Boosting Accuracy and Interpretability in Multilingual Hate Speech Detection Through Layer Freezing and Explainable AI [0.0] 本研究では,感情分析とヘイトスピーチ検出のための3つのトランスフォーマーモデルの性能について検討した。
評価は英語、韓国語、日本語、中国語、フランス語の5言語で行われている。
モデル決定に対する個々の単語の寄与を強調するために、局所解釈型モデル非依存説明(LIME)フレームワークを統合する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:07:51 GMT)
Beyond Accuracy: A Decision-Theoretic Framework for Allocation-Aware Healthcare AI [0.0] 人工知能(AI)システムは、医療において専門家レベルの予測精度をますます達成している。
しかし、モデルパフォーマンスの改善は、患者の結果に対して対応する利益をもたらすことができないことが多い。
本稿では、この割当ギャップを解消し、結合資源制約の下での割当問題として、医療提供をモデル化することで決定論的説明を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 20:42:10 GMT)
Autonomous Threat Detection and Response in Cloud Security: A Comprehensive Survey of AI-Driven Strategies [0.0] クラウドコンピューティングは、スケーラビリティ、適応性、オーバーヘッドの削減という3つの面で、オンラインコミュニティを変えました。
分散およびマルチテナント特性によってもたらされる深刻なセキュリティ上の懸念がある。
クラウドインフラのサイバー攻撃の先進段階においても、脅威を検知し、反応する古い方法が益々効果的になってきている。
これらの制限に対処する最近のトレンドは、人工知能(AI)技術の創出である。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:19:27 GMT)
Automated Feedback Generation for Undergraduate Mathematics: Development and Evaluation of an AI Teaching Assistant [0.0] 本稿では,自由形式の自然言語入力を処理し,幅広いエッジケースを処理し,提出された証明の技術的正確性についてコメントする。
評価した指標から、生成したフィードバックの質は、人間の専門家が生成したものに匹敵することを示した。
私たちのツールのバージョンは、帝国数学の宿題プラットフォームLambdaにデプロイされます。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:02:22 GMT)
Attention mechanisms in neural networks [0.0] 注意機構により、学習された重み付け関数を通じて、モデルが入力シーケンスの関連部分に選択的にフォーカスすることができる。
このモノグラフは、アテンションメカニズムの包括的かつ厳密な数学的処理を提供し、その理論的基礎、計算的性質、現代のディープラーニングシステムにおける実践的実装を含んでいる。
自然言語処理、コンピュータビジョン、マルチモーダル学習の応用は、注意機構の汎用性を示している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:12:10 GMT)
An Expectation-Maximization Algorithm for Domain Adaptation in Gaussian Causal Models [0.0] 本研究では、シフト配置領域において、系統的に欠落している指定されたターゲット変数を命令する問題について検討する。
DAG構造を通してソースとターゲットデータを組み合わせた統一EMベースのフレームワークを提案する。
合成セブンノードSEM,64ノードMAGIC-IRRI遺伝子ネットワーク,およびサックスタンパク質シグナリングデータの実験において,提案したDAG対応1次EMアルゴリズムは目標計算精度を向上させる。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 23:07:52 GMT)
AfriEconQA: A Benchmark Dataset for African Economic Analysis based on World Bank Reports [0.0] AfriEconQAは、世界銀行の包括的コーパスに基づくアフリカ経済分析のための特別なベンチマークデータセットである。
データセットは8,937のキュレートされたQAインスタンスで構成され、10018の合成質問のプールから厳格にフィルタリングされる。
AfriEconQAはアフリカ経済分析に特化した最初のベンチマークであり、Information Retrieval (IR)システムに固有の課題を提供する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 00:02:11 GMT)
Adversarial Question Answering Robustness: A Multi-Level Error Analysis and Mitigation Study [0.0] 質問応答(QA)システムは、SQuADのような標準ベンチマークで印象的なパフォーマンスを達成するが、敵の例には弱いままである。
本研究は,AddSent逆数データセット上での変圧器モデルの逆数ロバスト性について検討する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 04:20:33 GMT)
Addressing intramolecular vibrational redistribution in a single molecule through pump and probe surface-enhanced vibrational spectroscopy [0.0] 分子光学に基づく量子力学の枠組みを構築し,振動分光法による評価を最適化するための戦略を解析する。
分子内の振動モード間の集団移動の反ストークスSERSスペクトルに明確なシグネチャが存在することを示す。
本計算では, 分子・SERSパラメータを現実的に適用し, 現在の実験プラットフォームを用いた単一分子レベルでこれらのシグネチャにアクセス可能であることを示唆する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 11:47:12 GMT)
AWARE-US: Benchmark for Preference-Aware Resolution in Tool-Calling Agents [0.0] 我々は、優先的なクエリ修復問題として、ファシビリティーハンドリングの枠組みを定めている。
クエリが満足できない場合、エージェントはユーザにとって最も重要でない制約を緩和すべきである。
対話から相対的制約の重要度を推定する3つのLSMに基づく手法を提案する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 01:27:51 GMT)
AI-Driven Cybersecurity Threats: A Survey of Emerging Risks and Defensive Strategies [0.0] 本稿では,サイバーセキュリティにおけるAIに関連する新興リスク,攻撃メカニズム,防衛上の問題点を分析することを目的とする。
我々は、AI能力と脅威のモダリティと防御を結びつける比較分類法を導入する。
我々の発見は、説明可能な、学際的で、規制に順応するAI防衛システムに対する緊急性を強調した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 05:09:40 GMT)
AI Agents as Policymakers in Simulated Epidemics [0.0] 我々は、流行時の反復的な政策決定を研究するための生成AIエージェントを開発する。
シミュレーションされたSEIR環境の中にエージェントを埋め込み、市長として振る舞うように促す。
この結果は、AIエージェントの創発的政策行動が、理論インフォームドプロンプトによってどのように形成されるかを示している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 03:19:49 GMT)
A framework for assuring the accuracy and fidelity of an AI-enabled Digital Twin of en route UK airspace [0.0] Digital Twinsはシミュレーション、運用データ、人工知能(AI)を組み合わせる
Project Bluebirdは、AI Air Traffic Controlエージェントのトレーニングとテストのための環境として、英国空域を旅する確率論的デジタルツインを開発した。
この枠組みは行動可能な目標を定義し、デジタル・ツインがその物理的な目標を正確に表現していることを示すのに必要な証拠を定義している。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 15:49:12 GMT)
A Novel Unified Approach to Deepfake Detection [0.0] 本稿では,画像やビデオにおけるディープフェイク検出のための新しいアーキテクチャを提案する。
このアーキテクチャは、空間領域と周波数領域の特徴間の交差注意と血液検出モジュールを使用して、画像をリアルまたはフェイクとして分類する。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 19:30:53 GMT)
A High-Fidelity Digital Twin for Robotic Manipulation Based on 3D Gaussian Splatting [0.0] 粗いRGB入力から数分以内に高品質なデジタルツインを構築するフレームワークを提案する。
本システムでは3次元ガウススプラッティング(3DGS)を用いて高速で光写実的再構成を行い,シーンを統一的に表現する。
フランカ・エミカ・パンダ(Franka Emika Panda)ロボットを用いた実験では、この拡張された幾何精度が実世界の試行において堅牢な操作を効果的にサポートすることを示した。
論文参考訳(メタデータ) (Tue, 06 Jan 2026 17:29:10 GMT)