RoboOmni: Proactive Robot Manipulation in Omni-modal Context [165.1] 我々は,音声対話や環境音,視覚的手がかりから意図を導出する,クロスモーダルな文脈指示を導入する。
目的認識,インタラクション確認,アクション実行を統一する,エンドツーエンドのOmni-Modal LLMに基づくフレームワークであるRoboOmniを提案する。
シミュレーションと実世界の設定の実験では、Robo OmniはテキストベースとASRベースのベースラインを越え、成功率、推論速度、意図認識、積極的に支援している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:49:03 GMT)
A Survey on Efficient Vision-Language-Action Models [153.1] VLA(Vision-Language-Action Model)は、物理世界の相互作用によってデジタル知識を橋渡しすることを目的とした、インテリジェンスにおける重要なフロンティアである。
これらの課題に緊急に対応する必要性から、この調査は、効率的なビジョン・ランゲージ・アクションモデルに関する最初の包括的なレビューを提示する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:57:33 GMT)
OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding LLM [146.0] 我々はOmniVinciを紹介します。OmniVinciは強力でオープンソースのOmni-modal LLMを構築するためのイニシアチブです。
モデルアーキテクチャでは、(i)OmniAlignNetで視覚とオーディオの埋め込みのアライメントを強化する方法、(ii)視覚と音声信号の時間的アライメントをキャプチャするための時間的エンベディンググループ、(iii)オムニモーダル埋め込みにおける絶対時間的情報をエンコードするための制約付きロータリー時間エンベディングという3つの重要なイノベーションを提示する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:12:55 GMT)
Towards Stable and Effective Reinforcement Learning for Mixture-of-Experts [113.1] オフ・ポリティクス強化学習(RL)における重要サンプリング重み付けを最適化する新しいルータ認識手法を提案する。
具体的には、ルータロジットによって誘導される再スケーリング戦略を設計し、勾配のばらつきを効果的に低減し、トレーニングのばらつきを軽減する。
実験により, 本手法は収束安定性とMoEモデルの最終的な性能の両方を著しく改善することが示された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:47:48 GMT)
Improving Video Generation with Human Feedback [105.8] 我々は,人間のフィードバックを利用して映像生成問題を緩和するシステムパイプラインを開発した。
我々は,多次元ビデオ報酬モデルであるVideoRewardを紹介し,アノテーションと様々なデザイン選択が報奨効果に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:22:57 GMT)
MOOSE-Chem2: Exploring LLM Limits in Fine-Grained Scientific Hypothesis Discovery via Hierarchical Search [102.1] 大規模言語モデル (LLM) は科学的仮説生成の自動化において有望であることを示している。
既存のアプローチは主に、批判的な方法論や実験的な詳細を欠いた粗粒の仮説を導出する。
我々は、科学的仮説発見の新しいタスクを導入し、正式に定義する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:16:36 GMT)
Evaluating Long-Term Memory for Long-Context Question Answering [100.1] 質問応答タスクにアノテートした合成長文対話のベンチマークであるLoCoMoを用いて,メモリ拡張手法の体系的評価を行う。
以上の結果から,メモリ拡張アプローチによりトークン使用率が90%以上削減され,競争精度が向上した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:03:50 GMT)
MOOSE-Chem: Large Language Models for Rediscovering Unseen Chemistry Scientific Hypotheses [95.3] 大規模言語モデル(LLM)が化学において新規で有効な仮説を自律的に生成できるかどうかは不明である。
我々は、2024年1月以降に発行され、オンライン化された51のハイインパクト化学論文のベンチマークを開発し、それぞれが背景、インスピレーション、仮説を手動で注釈付けした。
LLMは、人間によってまだ認識されていない、潜伏した科学的知識の関連をすでにコード化していると仮定する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:10:54 GMT)
A Guardrail for Safety Preservation: When Safety-Sensitive Subspace Meets Harmful-Resistant Null-Space [92.0] GuardSpaceは、微調整全体を通して安全アライメントを維持するためのガードレールフレームワークである。
GSM8Kで微調整されたLlama-2-7B-Chatでは、ガードスペースは最先端のAsFTよりも優れている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:11:28 GMT)
Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond) [90.5] 言語モデル(LM)は、多様で人間らしい創造的コンテンツを生成するのに苦労することが多い。
Infinity-Chatは26万の多様な実世界のオープンエンドユーザクエリからなる大規模データセットである。
本研究では, LMのモード崩壊について大規模に検討し, 人工Hivemind効果が明らかとなった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:16:21 GMT)
Prompting is not Enough: Exploring Knowledge Integration and Controllable Generation [89.7] オープンドメイン質問応答(OpenQA)は自然言語処理(NLP)の基盤である。
我々は,知識統合と制御可能生成を探求し,OpenQAの性能向上を目的としたGenKIという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:08:24 GMT)
Einsum Networks: Fast and Scalable Learning of Tractable Probabilistic Circuits [87.8] 我々は,PC用の新しい実装設計であるEinsum Networks (EiNets)を提案する。
中心となるのは、E EiNets は単一のモノリシックな einsum-operation に多数の算術演算を組み合わせている。
本稿では,PCにおける予測最大化(EM)の実装を,自動微分を利用した簡易化が可能であることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:53:56 GMT)
SafeCOMM: A Study on Safety Degradation in Fine-Tuned Telecom Large Language Models [86.1] テレコムデータセット上での細調整大型言語モデル(LLM)は、汎用モデルをテレコムドメインに適応するための一般的なプラクティスである。
近年の研究では、良質な微調整でさえLLMの安全性を低下させ、有害なユーザークエリや非倫理的なユーザクエリに応答させることが示されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:35:06 GMT)
Code Aesthetics with Agentic Reward Feedback [84.7] 大きな言語モデル(LLM)は、コード関連のタスクにおいて開発者にとって貴重なアシスタントになっている。
LLMは視覚的に指向するコーディングタスクに苦労し、しばしば準最適美学を生み出す。
LLM生成コードの美的品質を高めるための新しいパイプラインを導入する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:32:33 GMT)
Self-supervised Representation Learning with Local Aggregation for Image-based Profiling [84.5] 画像に基づく細胞プロファイリングは、細胞画像の情報表現を作成することを目的としている。
非コントラスト型自己監督学習の最近の進歩は,本論文にインスピレーションを与えている。
本稿では,セル画像に適したデータ拡張と表現後処理手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:07:02 GMT)
UniPixel: Unified Object Referring and Segmentation for Pixel-Level Visual Reasoning [83.7] 視覚的なプロンプト入力を柔軟に解釈し,マスクによる応答を生成できる大規模マルチモーダルモデルUniPixelを提案する。
具体的には、UniPixelは、要求に応じて視覚的なプロンプトを処理し、関連するマスクを生成し、推論中にこれらの中間ポインタに対してその後の推論条件を実行する。
提案手法の有効性は,画素レベルの参照/セグメンテーションや画像・ビデオにおけるオブジェクト中心の理解など,多種多様なタスクを対象とした10のベンチマークで検証されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:58:16 GMT)
Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives [83.2] 神経認知障害(NCD)の早期発見は、時間的介入と疾患管理に不可欠である。
現在のVSNベースのNCD検出法は主にボトムアップ、刺激駆動認知プロセスと密接に結びついている言語マイクロ構造に焦点を当てている。
本稿では,話題の時間的変化を追跡する動的トピックモデル(DTM)と,物語と視覚刺激の相互整合性を測定するテキスト画像時間アライメントネットワーク(TITAN)の2つの新しいマクロ構造手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:54:43 GMT)
A high-capacity linguistic steganography based on entropy-driven rank-token mapping [81.3] 言語ステガノグラフィーは、秘密のメッセージを無害なテキストに埋め込むことによって、秘密のコミュニケーションを可能にする。
従来の修正ベースの手法は検出可能な異常を導入し、検索ベースの戦略は埋め込み能力の低下に悩まされている。
本稿では、ランクベース適応符号化と文脈認識の圧縮を正規化エントロピーと統合したRTMStegaというエントロピー駆動のフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:02:47 GMT)
Flow-GRPO: Training Flow Matching Models via Online RL [80.6] 本稿では,オンライン政策強化学習をフローマッチングモデルに統合する最初の方法であるFlow-GRPOを提案する。
提案手法では,(1)決定論的正規微分方程式を同値な微分方程式に変換するODE-to-SDE変換と,(2)推論ステップの数を維持しながらトレーニングの段階を短縮するDenoising Reduction戦略の2つの主要な戦略を用いる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:57:02 GMT)
Learnable Behavior Control: Breaking Atari Human World Records via Sample-Efficient Behavior Selection [80.4] 本稿では,LBC(Learable Behavioral Control)と呼ばれるフレームワークを提案する。
我々のエージェントは10077.52%の平均正規化スコアを達成し、1Bのトレーニングフレーム内で24人の世界記録を突破した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:29:26 GMT)
Lost in Tokenization: Context as the Key to Unlocking Biomolecular Understanding in Scientific LLMs [78.2] Sci-LLMは、生物発見を加速するための有望なフロンティアとして登場した。
現在の戦略はSci-LLMの推論能力を制限する。
より効果的な戦略は、Sci-LLMに高レベルの構造化コンテキストを提供することである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:03:21 GMT)
FaceTracer: Unveiling Source Identities from Swapped Face Images and Videos for Fraud Prevention [75.8] FaceTracerは、元人物の身元を、交換された顔画像やビデオから追跡するように設計されたフレームワークである。
これにより、スワップされた顔と元の人物を直接リンクできる堅牢な識別情報を抽出することができる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:48:10 GMT)
Lookahead Anchoring: Preserving Character Identity in Audio-Driven Human Animation [75.7] Lookahead Anchoringは、時間的自己回帰生成におけるアイデンティティドリフトを防ぐ。
固定境界から方向ビーコンに変形する。
セルフキーフレーミングも可能で、参照イメージがルックアヘッドターゲットとして機能する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:50:19 GMT)
Accelerated Evolving Set Processes for Local PageRank Computation [75.5] この研究は、パーソナライズされたPageRank計算を高速化するために、ネストした進化したセットプロセスに基づく新しいフレームワークを提案する。
このような局所化手法の時間複雑性は、PPRベクトルの$epsilon$-approximationを得るために$mintildemathcalO(R2/epsilon2), tildemathcalO(m)$によって上界となることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:38:07 GMT)
Magentic Marketplace: An Open-Source Environment for Studying Agentic Markets [74.9] 本稿では,サービスエージェントが消費者を代表し,サービスエージェントが競合するビジネスを代表する2面のエージェントマーケットプレースについて検討する。
この環境では、ユーティリティエージェントが達成する行動バイアス、操作に対する脆弱性、検索メカニズムが市場の結果をどのように形作るか、といった主要な市場ダイナミクスを研究することができる。
実験の結果、フロンティアモデルは最適な福祉に近づくことができるが、理想的な探索条件下でのみ適用可能であることが判明した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:35:59 GMT)
STRIDER: Navigation via Instruction-Aligned Structural Decision Space Optimization [74.0] VLN-CEタスクでは、エージェントはシーン固有のトレーニングなしで自然言語命令を使用して3D環境をナビゲートする必要がある。
既存の方法は、構造化された意思決定の欠如と、以前の行動からのフィードバックの不十分な統合のために、堅牢なナビゲーションを達成できないことが多い。
STRIDERは,空間配置先と動的タスクフィードバックを統合し,エージェントの決定空間を体系的に最適化する新しいフレームワークである。
提案手法では,1)空間構造を介して行動空間を制約する構造的ウェイポイントジェネレータ,2)タスクの進行に応じて行動を調整するタスク調整レギュレータ,そしてナビゲーション全体を通して意味的アライメントを確保する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:37:21 GMT)
BrowseConf: Confidence-Guided Test-Time Scaling for Web Agents [72.5] 本研究では,長期にわたる行動の後,言語化された信頼度スコアを用いて,検索エージェントが自身の信頼を伝達できるかどうかを検討する。
本研究では,信頼度スコアを用いて回答の質を判断し,信頼度レベルに達するまで再度試すテスト時間スケーリング(TTS)手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:58:51 GMT)
Switchable Token-Specific Codebook Quantization For Face Image Compression [72.4] 顔画像圧縮のための切り換え可能なToken-Specific Codebook Quantizationを提案する。
トークンが少量のビットを持つコードブックグループを記録することで,コードブックグループのサイズを小さくする場合に発生する損失を低減することができる。
提案手法は顔認識データに対して有効性を示し,0.05bppの再構成画像に対して平均93.51%の精度を実現した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:56:17 GMT)
RWKV-UNet: Improving UNet with Long-Range Cooperation for Effective Medical Image Segmentation [70.8] 本稿では,RWKV構造をU-Netアーキテクチャに統合する新しいモデルであるRWKV-UNetを提案する。
この統合により、長い範囲の依存関係をキャプチャし、コンテキスト理解を改善するモデルの能力が向上する。
11のベンチマークデータセットの実験により、RWKV-UNetは様々なタイプの医用画像セグメンテーションタスクで最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:55:19 GMT)
Robust Modality-incomplete Anomaly Detection: A Modality-instructive Framework with Benchmark [69.0] モダリティ不完全産業異常検出(MIIAD)の先駆的研究を紹介する。
その結果,既存のMIAD手法はMIIADベンチでは性能が悪く,性能が著しく低下していることが判明した。
本稿では,新しい2段階のロバストモードアリティファジングと検出フレームwoRk(RADAR)を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:33:50 GMT)
VOLD: Reasoning Transfer from LLMs to Vision-Language Models via On-Policy Distillation [68.0] VOLDは、テキストのみの教師モデルからVLMの学生モデルに推論機能を移行するためのフレームワークである。
VOLDはベースラインモデルよりも大幅に優れ,最先端技術よりもマージンが向上していることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:32:12 GMT)
PASS-Enhanced MEC: Joint Optimization of Task Offloading and Uplink PASS Beamforming [67.8] ピンチアンテナシステム (PASS) によるモバイルエッジコンピューティング (MEC) アーキテクチャについて検討した。
PASSは、重要な経路損失と潜在的な信号遮断を効果的に軽減しつつ、短距離ライン・オブ・ライト(LoS)リンクを確立する。
ネットワーク遅延最小化問題を定式化し、アップリンクPASSビームフォーミングとタスクオフロードを共同で最適化する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:04:46 GMT)
A Survey of Data Agents: Emerging Paradigm or Overstated Hype? [66.2] 現在「データエージェント」は用語的曖昧さと不整合性に悩まされている。
この調査では、データエージェントのための最初の体系的な階層型分類を紹介した。
プロアクティブな生成データエージェントの出現を想定する、先見的なロードマップで締めくくります。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:54:07 GMT)
Validating LLM-as-a-Judge Systems under Rating Indeterminacy [65.1] 評価の不確定性の下でLLM-as-a-judgeシステムを検証するための枠組みを提案する。
本研究では, 強制選択評価指示に応答する際の評価の不確定性を人間とLLMがどう解決するかの相違が, 偏見の検証に大きく寄与することを示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:18:11 GMT)
R-SFLLM: Jamming Resilient Framework for Split Federated Learning with Large Language Models [65.0] Split Federated Learning (SFL)は、分散機械学習(ML)における計算効率のパラダイムである。
SFLにおける重要な課題は、特に無線チャネル上に展開する場合、送信されたモデルパラメータの敵ジャミングに対する感受性である。
本稿では,無線ネットワーク上での大規模言語モデル (LLM) と視覚言語モデル (VLM) を用いたレジリエンスSFLのための物理層フレームワークを開発する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:52:25 GMT)
A conversion theorem and minimax optimality for continuum contextual bandits [65.0] 本研究では,学習者が側情報ベクトルを逐次受信し,凸集合内の行動を選択する,文脈連続帯域幅問題について検討する。
目標は、受信したコンテキストのすべての基盤関数を最小化することです。
サブ線形の静的な後悔を達成するアルゴリズムを拡張して、サブ線形の文脈的後悔を実現することができることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:47:53 GMT)
AUPO - Abstracted Until Proven Otherwise: A Reward Distribution Based Abstraction Algorithm [64.4] 我々は,モンテカルロ木探索 (MCTS) 決定ポリシーに,AUPO と呼ばれる新しいドロップイン修正を導入する。
様々なIPPCベンチマーク問題に基づく比較は、AUPOがMCTSよりも明らかに優れていることを示している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:04:22 GMT)
NOBLE -- Neural Operator with Biologically-informed Latent Embeddings to Capture Experimental Variability in Biological Neuron Models [63.6] NOBLEは、解釈可能なニューロンの特徴を連続周波数変調した埋め込みから電流注入によって誘導されるソマティック電圧応答へのマッピングを学ぶ神経オペレーターフレームワークである。
内在的な実験変数を考慮したニューラルダイナミクスの分布を予測する。
NOBLEは、その一般化を実際の実験データで検証する最初の大規模ディープラーニングフレームワークである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:48:13 GMT)
TokenCLIP: Token-wise Prompt Learning for Zero-shot Anomaly Detection [63.0] TokenCLIPは、異常学習のためのトークンワイド適応フレームワークである。
視覚的なテキスト空間と学習可能なテキスト空間の動的アライメントを可能にし、微粒な異常学習を実現する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:24:03 GMT)
Agent KB: Leveraging Cross-Domain Experience for Agentic Problem Solving [62.7] 我々は,異種エージェントフレームワーク間のシームレスな体験共有を可能にするユニバーサルメモリ基盤であるAgent KBを紹介した。
Agent KBはトラジェクトリを構造化知識ベースに集約し、軽量APIを提供する。
我々は,GAIA,Humanity's Last Exam,GPQA,SWE-benchなどの主要フレームワークにまたがるエージェントを検証した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:16:14 GMT)
MGFRec: Towards Reinforced Reasoning Recommendation with Multiple Groundings and Feedback [62.6] 我々は,LLMが実際のアイテム空間をよりよく理解するために,推論中に複数ラウンドのグラウンドを実行することを提案する。
3つのAmazonレビューデータセットで実施された総合的な実験は、複数の基盤とフィードバックを組み込むことの有効性を実証している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:41:07 GMT)
A Cocktail-Party Benchmark: Multi-Modal dataset and Comparative Evaluation Results [62.0] 第9回CHiMEチャレンジにおいて,マルチモーダルコンテキスト認識(MCoRec)の課題を紹介した。
MCoRecは、録音が説明のない、カジュアルなグループチャットに集中する、自然なマルチパーティの会話をキャプチャする。
このタスクでは、各話者のスピーチを共同で翻訳し、音声・視覚録音から各話者の会話にまとめることにより、「誰がいつ、何、誰と話をするのか?」という質問に答えるシステムが必要である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:36:43 GMT)
GOOD: Training-Free Guided Diffusion Sampling for Out-of-Distribution Detection [62.0] GOODは,オフザシェルフ内分布(ID)分類器を用いて,OOD領域へのサンプリングトラジェクトリを誘導する新しいフレームワークである。
入力可能性を減らすためにログパーティションの勾配に基づいた画像レベルのガイダンスは、ピクセル空間内の低密度領域に向けてサンプルを駆動する。
我々は、画像と特徴の相違を適応的に組み合わせ、検出の堅牢性を向上する統一OODスコアを導入する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:58:39 GMT)
ReCAP: Recursive Context-Aware Reasoning and Planning for Large Language Model Agents [61.5] ReCAP(Recursive Context-Aware Reasoning and Planning)は,大規模言語モデル(LLM)における推論と計画のためのコンテキストを共有する階層型フレームワークである。
ReCAPは、プラン-アヘッド分解、親プランの構造化された再注入、メモリ効率の高い実行という3つの重要なメカニズムを組み合わせる。
実験により、ReCAPは様々なロングホライゾン推論ベンチマークにおけるサブゴールアライメントと成功率を大幅に改善することが示された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:03:55 GMT)
Adapting to Stochastic and Adversarial Losses in Episodic MDPs with Aggregate Bandit Feedback [61.5] 本研究では,有限水平マルコフ決定過程(MDP)におけるオンライン学習について,包括的包括的包括的フィードバックモデルを用いて検討する。
本研究は, オンライン最短経路問題の近年の進展に触発された, 占領対策, 自己拘束技術, 新たな損失推定器の組合せに依拠する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:46:29 GMT)
FaithLM: Towards Faithful Explanations for Large Language Models [60.5] 大規模言語モデルの忠実度を評価し改善するモデルに依存しないフレームワークであるFaithLMを紹介した。
FaithLMは一貫して忠実度を高め、強い自己説明ベースラインよりも人間の合理性に整合した説明を生成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:19:56 GMT)
Distilled Protein Backbone Generation [59.6] 拡散およびフローベースの生成モデルは、デノボタンパク質の設計に前例のない能力を提供する。
これらのモデルは生成速度によって制限され、しばしば逆拡散過程において数百の反復的なステップを必要とする。
本研究は,Score Identity Distillation (SiD) を用いて,数段階のタンパク質バックボーン生成装置の訓練を行う方法を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:32:07 GMT)
VideoTG-R1: Boosting Video Temporal Grounding via Curriculum Reinforcement Learning on Reflected Boundary Annotations [59.4] ビデオ時間グラウンド(VTG)は、言語クエリに基づいて、ビデオ内の正確なセグメントを特定することを目的としている。
最近のMLLM(Multimodal Large Language Models)は、強化学習(RL)を通してVTGに取り組むことを約束している。
本稿では,境界アノテーションを反映した新しいカリキュラムRLフレームワークであるVideoTG-R1を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:55:38 GMT)
OpenS2S: Advancing Fully Open-Source End-to-End Empathetic Large Speech Language Model [59.0] 我々は,共感型音声対話を実現するために設計された,完全にオープンソースで透明でエンドツーエンドのLSLMであるOpenS2Sを提案する。
我々の共感型音声テキストモデルBLSP-Emoに基づいて、OpenS2Sは低レイテンシ音声生成を実現するためにストリーミングインターリーブデコードアーキテクチャを用いる。
大規模言語モデルを利用して共感的コンテンツを生成し,テキスト音声システムを制御することにより,多言語多言語多様度を有するスケーラブルな学習コーパスを構築する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:59:16 GMT)
SimBench: Benchmarking the Ability of Large Language Models to Simulate Human Behaviors [58.9] 我々は,LLMシミュレーションの堅牢で再現可能な科学のための,最初の大規模標準ベンチマークであるSimBenchを紹介する。
現在、最高のLLMでさえシミュレーション能力が限られ(スコア: 40.80/100)、性能はモデルサイズと対数的にスケールする。
シミュレーション能力は、深い知識集約的推論と最も強く相関していることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:17:13 GMT)
KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills [58.7] そこで本研究では,Kungfuやダンスなどの人体動作を高度に制御することを目的とした,物理学に基づくヒューマノイド制御フレームワークを提案する。
動作処理では,運動の抽出,フィルタリング,修正,再ターゲティングを行うパイプラインを設計し,物理的制約の遵守を確実にする。
動作模倣では、二段階最適化問題を定式化し、追従精度の許容度を動的に調整する。
実験では,高ダイナミックな動作のセットを模倣するために全身制御ポリシーを訓練する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:13:54 GMT)
LASER: A Neuro-Symbolic Framework for Learning Spatial-Temporal Scene Graphs with Weak Supervision [58.6] 本稿では,ビデオキャプションのみを用いて,ジェネレータの訓練を可能にするニューロシンボリックフレームワークを提案する。
アライメントアルゴリズムは、微分可能なシンボリック推論を利用することにより、弱い監督の課題を克服する。
提案手法を,OpenPVSG,20BN,MUGENの3つのビデオデータセット上で評価した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:14:22 GMT)
LimRank: Less is More for Reasoning-Intensive Information Reranking [58.3] 既存のアプローチは、情報再構成タスクにLLMを適用するために、大規模な微調整に依存するのが一般的である。
本研究では,LLMを最小限の高品質の監視のみを用いて効果的に適用できることを実証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:19:37 GMT)
SEEA-R1: Tree-Structured Reinforcement Fine-Tuning for Self-Evolving Embodied Agents [58.2] 自己進化型エボダイドエージェント(SeEA-R1)は、自己進化型エボダイドエージェント用に設計された最初の強化微細調整フレームワークである。
本研究は,SEEA-R1が自律適応と報酬駆動型自己進化をサポートすることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:10:28 GMT)
HoliSafe: Holistic Safety Benchmarking and Modeling for Vision-Language Model [58.1] 我々は、安全で安全でない5つの画像テキストの組み合わせにまたがる、全体的な安全データセットとベンチマークである textbfHoliSafeを紹介した。
また,入力画像の有害性を評価するために,視覚ガードモジュール(VGM)を用いて,VLMの安全性を高めるための新しいモジュラーフレームワークを提案する。
実験により、HoliSafeでトレーニングされたVGMを使用したSafe-VLMは、複数のVLMベンチマークで最先端の安全性能を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:27:25 GMT)
Residual Diffusion Bridge Model for Image Restoration [57.3] 拡散ブリッジモデルは任意のペア分布間の確率パスを確立する。
既存のほとんどの手法は単にそれらを補間剤の単純な変種として扱い、統一的な分析的視点を欠いている。
これらの課題に対処するために,Residual Diffusion Bridge Model (RDBM)を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:35:49 GMT)
Cost-Aware Contrastive Routing for LLMs [57.3] 我々は、プロンプトとモデルの両方を共有埋め込み空間にマッピングする軽量フレームワークであるコストスペクトルコントラストルーティング(CSCR)を紹介します。
CSCRはベースラインを一貫して上回り、精度とコストのトレードオフを最大25%改善した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:16:45 GMT)
Learning to Reason Efficiently with Discounted Reinforcement Learning [57.3] 大きな推論モデル(LRM)は、しばしば過剰なトークンを消費し、計算コストと遅延を膨らませる。
より長い応答によって精度が向上するという仮定に挑戦する。
割引強化学習装置(小額のトークンコストと解釈できる)を用いた推論トークンのペナルティ化と、制限された政策クラスにおけるブラックウェル最適性の分析により、簡潔で正確な推論を奨励する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:17:45 GMT)
AlignCAT: Visual-Linguistic Alignment of Category and Attribute for Weakly Supervised Visual Grounding [57.0] 弱教師付きビジュアルグラウンドティングは、テキスト記述に基づいて画像中のオブジェクトを見つけることを目的としている。
既存の手法では、テキスト表現の微妙な意味的差異を区別するために、強力なクロスモーダル推論が欠如している。
本稿では、弱教師付きVGのための新しいクエリベースのセマンティックマッチングフレームワークAlignCATを紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:43:20 GMT)
ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation [56.8] 法的な主張は、事件における原告の要求を言及し、法的理由づけと事件解決を導くのに不可欠である。
本稿では,その事例の事実に基づく法的クレーム生成の問題について考察する。
われわれは,中国法定クレーム生成タスクの最初のデータセットであるClaymGen-CNを構築した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:25:55 GMT)
MPX: Mixed Precision Training for JAX [56.5] 混合精度トレーニングは、ニューラルネットワークトレーニングの効率を高めるために必要なツールとして登場した。
本稿では,大規模ニューラルネットワークのトレーニングを簡略化し,高速化するJAX用混合精度トレーニングツールボックスMPXを提案する。
MPXはEquinoxやFraxといった一般的なツールボックスとシームレスに統合され、完全な精度パイプラインを混合精度バージョンに変換することができる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:21:13 GMT)
Game-TARS: Pretrained Foundation Models for Scalable Generalist Multimodal Game Agents [56.3] 本稿では,汎用ゲームエージェントであるGame-TARSについて紹介する。
Game-TARSは500B以上のトークンで事前トレーニングされており、様々な軌跡とマルチモーダルデータがある。
実験により、Game-TARSは、オープンワールドMinecraftタスクにおける以前のソータモデルの約2倍の成功率を達成することが示された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:43:51 GMT)
EgoThinker: Unveiling Egocentric Reasoning with Spatio-Temporal CoT [56.2] EgoThinkerは、時間的連鎖管理と2段階の学習カリキュラムを通じて、堅牢なエゴセントリック推論能力を備えたMLを支援するフレームワークである。
EgoThinkerは、複数のエゴセントリックなベンチマークで既存のメソッドよりも優れており、微粒な時間的ローカライゼーションタスクで大幅に改善されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:38:17 GMT)
Open-Vocabulary Spatio-Temporal Scene Graph for Robot Perception and Teleoperation Planning [55.9] 動的リモートシーンでは、双方向通信における伝送遅延は、リモート認識状態とオペレータ意図の間のギャップを生じさせる。
本稿では,時間的ダイナミクスと軽量遅延アノテーションを用いて,オープン語彙認識を充実させる表現を提案する。
提案手法はReplicaベンチマークで74%のノード精度を実現し,Concept.Graphよりも優れていた。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:43:56 GMT)
Sampling from Energy distributions with Target Concrete Score Identity [55.7] 連続時間マルコフ連鎖(CTMC)の逆ダイナミクスを学習し、離散状態空間上の非正規化密度からサンプリングする方法を提案する。
提案手法は,一様ノイズ化カーネルを持つCTMCを前向きに構築し,提案したTarget concrete Score Identityに依存している。
具体的なスコアをニューラルネットワークで近似し,自己Normalized TCSISとUnbiased TCSISの2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:21:09 GMT)
S$^2$Q-VDiT: Accurate Quantized Video Diffusion Transformer with Salient Data and Sparse Token Distillation [55.4] ビデオ拡散モデル(V-DM)の学習後量子化フレームワークであるS$2$Q-VDiTを提案する。
W4A6量子化の下では、S$2$Q-VDiTは3.9倍のモデル圧縮と1.3倍の推論加速を実現している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:32:08 GMT)
Fast Voxel-Wise Kinetic Modeling in Dynamic PET using a Physics-Informed CycleGAN [55.3] 我々は、DCE-MRI量子化と動的PET量子化の約束を示す物理インフォームドCycleGANを採用する。
実験では、基準によく似た音響AIF予測とパラメータマップを実証した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:17:02 GMT)
Survey of Multimodal Geospatial Foundation Models: Techniques, Applications, and Challenges [54.7] 基礎モデルは自然言語処理とコンピュータビジョンに変化をもたらした。
強力な一般化と伝達学習機能により、リモートセンシングデータのマルチモーダル、マルチレゾリューション、マルチ時間特性と自然に一致させる。
この調査は、モーダリティ駆動の観点から、マルチモーダルGFMの包括的なレビューを提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:40:00 GMT)
Task-Oriented Feature Compression for Multimodal Understanding via Device-Edge Co-Inference [54.5] 本稿では,マルチモーダル理解のためのタスク指向特徴圧縮(TOFC)手法を提案する。
圧縮効率を向上させるために、視覚特徴の特性に基づいて複数のエントロピーモデルを適応的に選択する。
その結果,TOFCはデータ転送オーバーヘッドを最大52%削減し,システム遅延を最大63%削減できることがわかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:36:57 GMT)
Alita-G: Self-Evolving Generative Agent for Agent Generation [54.5] 汎用エージェントをドメインエキスパートに変換するフレームワークであるALITA-Gを提案する。
このフレームワークでは、ジェネラリストエージェントが対象ドメインタスクのキュレートされたスイートを実行する。
計算コストを削減しながら、大きな利益を得ることができます。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:59:14 GMT)
Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.5] 作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。
Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。
高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:52:45 GMT)
M4FC: a Multimodal, Multilingual, Multicultural, Multitask Real-World Fact-Checking Dataset [54.3] M4FCは6,980のクレームと組み合わせた4,982枚の画像からなる新しい実世界のデータセットである。
各クレームは10言語中1、2言語で利用可能である。
M4FCは、視覚的クレーム抽出、クレーム意図予測、偽検出、画像コンテキスト化、位置検証、検証予測の6つのマルチモーダルなファクトチェックタスクにまたがる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:44:35 GMT)
LLM/Agent-as-Data-Analyst: A Survey [54.1] 大規模言語モデル(LLM)とエージェント技術は、データ分析タスクの機能と開発パラダイムに根本的な変化をもたらした。
LLMは複雑なデータ理解、自然言語、意味分析機能、自律パイプラインオーケストレーションを可能にする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:52:57 GMT)
More Than Generation: Unifying Generation and Depth Estimation via Text-to-Image Diffusion Models [54.0] 生成深度推定法は、事前訓練されたテキスト-画像拡散モデルに格納されたリッチな視覚的先行情報を利用する。
本稿では,画像生成と深度推定の統一モデルであるMERGEを紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:44:56 GMT)
Part I: Tricks or Traps? A Deep Dive into RL for LLM Reasoning [53.9] 本稿では,広く採用されている強化学習手法を体系的にレビューする。
特定の設定に合わせてRLテクニックを選択するための明確なガイドラインを示す。
また、2つのテクニックを最小限に組み合わせることで、批判のないポリシーの学習能力を解き放つことも明らかにした。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:53:00 GMT)
PhySense: Sensor Placement Optimization for Accurate Physics Sensing [53.6] PhySenseは、物理的なフィールドを共同で再構築し、センサー配置を最適化するフレームワークである。
最先端の物理センサーの精度を達成し、以前は考えられていなかった情報的なセンサー配置を発見する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:38:13 GMT)
A Neuro-Symbolic Multi-Agent Approach to Legal-Cybersecurity Knowledge Integration [53.6] この研究は、ますます複雑なサイバー法務ドメインをナビゲートできるインテリジェントシステムへの第一歩を提供する。
多言語タスクにおける有望な初期結果を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:46:02 GMT)
Emotion-Coherent Reasoning for Multimodal LLMs via Emotional Rationale Verifier [53.6] 本稿では,感情関係検証器 (ERV) と説明リワードを提案する。
本手法は,対象感情と明確に一致した推論をモデルに導出する。
我々のアプローチは、説明と予測の整合性を高めるだけでなく、MLLMが感情的に一貫性があり、信頼できる対話を実現するのにも役立ちます。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:40:17 GMT)
Latent Chain-of-Thought for Visual Reasoning [53.5] 大型視覚言語モデル(LVLM)の解釈可能性および信頼性向上には,チェーン・オブ・シント(CoT)推論が不可欠である
我々は,LVLMにおける推論を後部推論として再構成し,償却変分推論に基づくスケーラブルなトレーニングアルゴリズムを提案する。
提案手法は,7つの推論ベンチマークにおいて,最先端のLVLMを強化することを実証的に実証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:10:06 GMT)
Know Me, Respond to Me: Benchmarking LLMs for Dynamic User Profiling and Personalized Responses at Scale [53.1] 大規模言語モデル(LLM)は、幅広いタスクでユーザのためのパーソナライズされたアシスタントとして登場した。
PERSONAMEMは180以上のユーザ-LLMインタラクション履歴を持つキュレートされたユーザプロファイルを備えている。
LLMチャットボットのユーザプロファイルの現在状況に応じて,最も適切な応答を識別する能力を評価する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:22:53 GMT)
Plan Then Retrieve: Reinforcement Learning-Guided Complex Reasoning over Knowledge Graphs [52.2] Graph-RFTは、"plan-KGsearch-and-Websearch-during-think"パラダイムを備えた、2段階強化KGQAフレームワークである。
これにより、LLMは、不完全な知識条件下で、KGやWebソース間で自律的な計画と適応的なスケジューリングを行うことができる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:30:51 GMT)
HieraMamba: Video Temporal Grounding via Hierarchical Anchor-Mamba Pooling [52.1] HieraMambaは階層的なアーキテクチャで、時間的構造と規模にわたって意味的な豊かさを保ちます。
Ego4D-NLQ、MAD、TACoSに新たな最先端技術を導入し、長い、トリミングされていないビデオの正確な時間的忠実なローカライゼーションを実証した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:13:07 GMT)
Exploring Semantic-constrained Adversarial Example with Instruction Uncertainty Reduction [51.5] 本稿では,多次元命令の不確実性低減フレームワークを開発し,意味論的に制約された逆の例を生成する。
言語誘導サンプリングプロセスの予測により、設計したResAdv-DDIMサンプルにより最適化プロセスが安定化される。
セマンティック制約付き3次元逆数例の参照フリー生成を初めて実現した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:02:52 GMT)
Autoregressive Styled Text Image Generation, but Make it Reliable [51.1] 本研究は,最近提案されたHTGの自己回帰トランスフォーマーパラダイムによって達成された,スタイルの忠実さと一般化の両面で有望な成果を生かし,その特性を再現する戦略開発に焦点をあてる。
本研究では,HTGをマルチモーダルなプロンプト条件付き生成タスクとしてフレーミングすることで自己回帰を再考し,視覚との整合性を高めるために特別な入力トークンを導入することで,コンテンツ制御可能性の問題に対処する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:54:23 GMT)
Training-Free In-Context Forensic Chain for Image Manipulation Detection and Localization [49.6] In-Context Forensic Chain (ICFC) は、MLタスクの解釈にMLLM(Multi-modal large language model)を活用する、トレーニングフリーのフレームワークである。
ICFCは、信頼できる知識基盤を構築するために、オブジェクト化されたルール構築と適応的なフィルタリングを統合する。
ICFCは最先端のトレーニングフリーメソッドを超えるだけでなく、弱く完全に監督されたアプローチに比べて、競争力や優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:57:33 GMT)
Superficial Self-Improved Reasoners Benefit from Model Merging [49.1] 高品質データコーパスの合成ソリューションとしての自己改善
特に,本分析の結果から,LMがドメイン内推論の精度を向上したとしても,それらの一般的な推論能力を損なうことが判明した。
提案手法は,オリジナルモデルと自己改善モデルとの重みを戦略的に組み合わせ,一般化を保ちながら反復モデルマージング(IMM)を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:35:32 GMT)
VIKING: Deep variational inference with stochastic projections [48.9] 変分平均場近似は、現代の過度にパラメータ化されたディープニューラルネットワークと競合する傾向がある。
パラメータ空間の2つの独立線型部分空間を考える単純な変分族を提案する。
これにより、オーバーパラメトリゼーションを反映した、完全に相関した近似後部を構築することができる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:38:35 GMT)
WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos [48.9] 協調学習(CL)技術により、複数のパーティが生データを共有せずにモデルを共同でトレーニングできる。
現在のCLベンチマークとアルゴリズムは、主に、分離、アライメント、結合可能なデータベースの仮定の下で学習ステップを目標としています。
我々は1700万の重み付きエッジでリンクされた10万の現実世界のリレーショナルデータベースから構築された大規模なデータセットを構築した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:12:05 GMT)
TARC: Time-Adaptive Robotic Control [48.6] ロボット工学における固定周波数制御は、低周波数制御の効率と高周波制御の堅牢性との間のトレードオフを課す。
我々は、ポリシーが制御行動とその適用期間を共同で選択する強化学習アプローチでこの問題に対処する。
2つの異なるハードウェアプラットフォーム上でのゼロショットsim-to-real実験により本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:10:19 GMT)
Adaptive Dual Prompting: Hierarchical Debiasing for Fairness-aware Graph Neural Networks [48.5] 本稿では,事前学習したGNNモデルを下流タスクに適用するための公平性を向上する適応型デュアルプロンプト(ADPrompt)フレームワークを提案する。
我々は,ADPromptの性能を評価するために,4つの事前学習戦略を用いた4つのデータセットに関する広範な実験を行った。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:07:36 GMT)
JanusCoder: Towards a Foundational Visual-Programmatic Interface for Code Intelligence [48.4] 本稿では,標準チャートから複雑な対話型Web UI,コード駆動型アニメーションに至るまで,大規模で高品質なコーパスを効率的に生成するための完全合成ツールキットを提案する。
これは私たちのモデルであるJanusCoderとJanusCoderVのトレーニングを支えています。
7Bから14Bのスケールモデルは、商用モデルの性能に近づいたり、超えたりしています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:13:49 GMT)
LightBagel: A Light-weighted, Double Fusion Framework for Unified Multimodal Understanding and Generation [48.0] 提案手法は, 生成と理解に特化して公開されているモデルを戦略的に融合させることにより, 競争性能をより効率的に得ることができることを示す。
我々のキーとなる設計は、ネットワーク全体にわたってマルチモーダルな自己注意ブロックをインターリーブしながら、元のブロックを保持することである。
たった35Bトークンでトレーニングすることで、このアプローチは複数のベンチマークで強力な結果が得られる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:59:57 GMT)
RobotArena $\infty$: Scalable Robot Benchmarking via Real-to-Sim Translation [47.8] 操作ポリシーの現実的なテストは、大規模に労働集約的で、再現が難しい。
既存のシミュレーションベンチマークも同様に制限されており、同じ合成ドメイン内でポリシーをトレーニングおよびテストしている。
本稿では,VLA評価を大規模にシミュレーションした拡張環境に移行することで,これらの課題を克服する新しいベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:41:38 GMT)
VR-Drive: Viewpoint-Robust End-to-End Driving with Feed-Forward 3D Gaussian Splatting [47.8] VR-Driveは、3Dシーン再構築を共同で学習することで視点一般化に対処する新しいE2E-ADフレームワークである。
我々の結果は、VR-Driveがエンドツーエンドの自動運転システムの現実的な展開のためのスケーラブルで堅牢なソリューションであることを実証している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:49:39 GMT)
GraphInstruct: Empowering Large Language Models with Graph Understanding and Reasoning Capability [47.7] 本稿では,21の古典的グラフ推論タスクを包括的に含むGraphInstructというベンチマークを提案する。
GraphInstructをベースとして,グラフ理解能力の顕著さを示す効率的な命令チューニングによるGraphrを開発した。
マルチステップグラフ推論機能を備えたLLMをさらに促進するために,ラベルマスクトレーニング戦略を提案し,Graphr+を構築する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:07:17 GMT)
LayerComposer: Interactive Personalized T2I via Spatially-Aware Layered Canvas [47.5] 我々は、パーソナライズされたマルチオブジェクトのテキスト・ツー・イメージ生成のためのインタラクティブなフレームワークであるLayerComposerを紹介する。
提案された層状キャンバスは、直感的な層操作によって入力対象の配置、サイズ変更、ロックを可能にする。
ロック機構はアーキテクチャ上の変更を必要とせず、代わりに、新しい補完的なデータサンプリング戦略と組み合わせて、固有の位置埋め込みに依存します。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:53:30 GMT)
SceneDecorator: Towards Scene-Oriented Story Generation with Scene Planning and Scene Consistency [47.2] SceneDecorator は VLM-Guided Scene Planning を利用したトレーニングフリーのフレームワークであり、グローバル・ツー・ローカルな方法で異なるシーン間での物語の一貫性を確保する。
大規模な実験はSceneDecoratorの優れたパフォーマンスを示し、芸術、映画、ゲームの分野における創造性を解き放つ可能性を強調している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:19:22 GMT)
StereoDetect: Detecting Stereotypes and Anti-stereotypes the Correct Way Using Social Psychological Underpinnings [47.0] ステレオタイプとアンチステレオタイプの検出は、社会的知識を必要とする問題である。
本稿では, ステレオタイプ, アンチステレオタイプ, ステレオタイプバイアス, 一般バイアスの5つの定義を提案する。
サブ10B言語モデルとGPT-4oは、しばしば反ステレオタイプを誤分類し、中立的過一般化を認識できないことを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:20:02 GMT)
ESCA: Contextualizing Embodied Agents via Scene-Graph Generation [47.0] 本研究では,空間的時間的シーングラフの認識を基盤として,エンボディーズエージェントを文脈的に認識するフレームワークであるESCAを提案する。
コアとなるSGCLIPは、シーングラフを生成するための、新しく、オープンドメインで、プロンプト可能な基盤モデルである。
SGCLIPは、プロンプトベースの推論とタスク固有の微調整の両方で優れており、シーングラフ生成とアクションローカライゼーションベンチマークにおける最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:51:21 GMT)
Analog In-memory Training on General Non-ideal Resistive Elements: The Impact of Response Functions [46.8] AIMCハードウェアでは、トレーニング可能な重量は抵抗素子のコンダクタンスで表され、連続する電気パルスを用いて更新される。
コンダクタンスはパルスごとに一定変化するが、実際には非対称および非線形応答関数によってスケールされ、非理想的トレーニングのダイナミクスをもたらす。
本稿では,AIMCハードウェアにおける非理想応答関数を用いた勾配学習の理論的基礎を提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:53:07 GMT)
Unexpected non-universality of the time braiding phase of anyons tied by the scaling dimension [45.9] 我々は、直流雑音と時間領域のブレイディング制約から推定される応答関数とをリンクする非平衡変動散逸関係を用いる。
このことは、空間領域における位相的に保護されたブレイディング位相とは対照的に、顕微鏡的エッジダイナミクスを反映できる$theta$の普遍性に疑問を呈する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:22:06 GMT)
Chaos in Systems with Quantum Group Symmetry [45.9] カオス的な量子群大域対称性を持つシステムの明示的な例を示す。
スピン鎖は単体ではないがPT対称であり、カオスに加えて、固有値が複雑になる興味深い遷移を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:07:16 GMT)
UrbanIng-V2X: A Large-Scale Multi-Vehicle, Multi-Infrastructure Dataset Across Multiple Intersections for Cooperative Perception [45.8] UrbanIng-V2Xは、時間的に整列された34のセンサーシーケンスと、20秒間続く空間的に校正されたセンサーシーケンスから構成される。
すべてのシーケンスは10Hzの周波数でアノテートされ、3D境界ボックスは13のオブジェクトクラスにまたがる。
UrbanIng-V2Xは合計12台の車載RGBカメラ、2台の車載LiDAR、17台のインフラ熱カメラ、12台のインフラLiDARからのデータを提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:12:12 GMT)
RapVerse: Coherent Vocals and Whole-Body Motions Generations from Text [45.6] 歌詞入力から直接3次元体の動きと歌声を同時に生成する難易度タスクを提案する。
まずRapVerseデータセット(同期ラッピングボーカル、歌詞、高品質な3Dボディーメッシュを含む大規模なデータセット)を収集する。
モダリティ統一のために、ベクトル量子化された変分オートエンコーダを用いて、全身の動き列を離散的な動きトークンに符号化し、音声から単位へのモデルを利用して量子化された音声トークンを得る。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:19:03 GMT)
Evaluating Large Language Models for Stance Detection on Financial Targets from SEC Filing Reports and Earnings Call Transcripts [45.1] 我々は,債務,1株当たり利益(EPS),販売という3つの中核的財務指標に着目したスタンス検出のための文レベルのコーパスを導入する。
文章は10-Kの年次報告とECTから抽出され, 高度なChatGPT-o3-proモデルを用いてスタンスにラベル付けされた。
このコーパスを用いて、ゼロショット、少数ショット、およびCoT(Chain-of-Thought)の促進戦略を用いて、現代大言語モデル(LLM)の体系的評価を行う。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:03:20 GMT)
Minimizing Human Intervention in Online Classification [45.1] 質問応答システムにおけるオンライン問題を紹介し,研究する。
この問題では、エージェントは、i.i.d.で描画された$d$次元の埋め込みを表すユーザ送信クエリをシーケンシャルに分類しなければならない。
目標は、フリーのエキスパートアクセスを持つオラクルに対する後悔を最小限に抑えることだ。
サブシアン混合からクエリが引き出されると、$T le ed$ に対して Center-basedgau (CC) は、$NlogN$ に比例して後悔を達成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:31:24 GMT)
Bilevel ZOFO: Bridging Parameter-Efficient and Zeroth-Order Techniques for Efficient LLM Fine-Tuning and Meta-Training [44.9] 下流タスクのための微調整済みの大規模言語モデル(LLM)は、重大な計算上の課題を示す。
本稿では,2レベル最適化手法であるBilevel-ZOFOを提案する。これは,高速で局所的なFO-PEFT適応を内部レベルで結合し,メモリ効率の高いZO更新を外部レベルで安定的に行う。
また,Bilevel-ZOFOは既存のZO法やFO-PEFT法よりも優れており,メモリ効率は2~4倍向上した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:10:58 GMT)
Reasoning as an Adaptive Defense for Safety [44.8] 私たちは、$textitTARS$(安全のための適応推論器の訓練)というレシピを構築します。
我々は、チェーンオブソートトレースと、タスク完了と安全のバランスをとる報奨信号を用いて、安全性について推論するモデルを訓練する。
我々の研究は,lLMをジェイルブレイクや有害な要求に対して,プロンプトごとに推論することで,効果的かつオープンなレシピを提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:28:11 GMT)
Temporal Blindness in Multi-Turn LLM Agents: Misaligned Tool Use vs. Human Time Perception [44.8] TicToc-v1は、時間感度の異なるマルチターンユーザエージェントトラジェクトリのテストセットである。
それぞれのトラジェクトリはユーザからの質問で終わる。そこでは、ツールコールの必要性は、最後のメッセージから経過した時間に依存する。
静的な対話と進化する環境の間のギャップを埋め、明確なタイムスタンプで対話メッセージを拡大する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:51:58 GMT)
ColorEcosystem: Powering Personalized, Standardized, and Trustworthy Agentic Service in massive-agent Ecosystem [44.5] 現在の大規模エージェントエコシステムは、非個人的サービスエクスペリエンス、標準化の欠如、信頼できない行動など、ますます課題に直面しています。
大規模にパーソナライズされ、標準化され、信頼性の高いエージェントサービスを実現するために設計された、新しい青写真であるColorEcosystemを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:12:10 GMT)
Offline RL by Reward-Weighted Fine-Tuning for Conversation Optimization [44.4] 大規模言語モデル(LLM)を用いたオフラインRLの実践的アプローチを提案する。
我々は、この問題を報酬重み付けファインチューニングとして再考し、教師付きファインチューニング(SFT)と同様の手法を用いて解決することができる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:56:23 GMT)
MR-Align: Meta-Reasoning Informed Factuality Alignment for Large Reasoning Models [43.9] 大きな推論モデル(LRM)は複雑な推論において強い能力を示すが、証拠に依存した事実問題に対する限界的な利得は限られている。
この制限は、モデルが推論中に正しい事実を識別するが、最終的な応答にそれらを組み込むことができない、推論と問合せのギャップに起因する。
本稿では,外部検証に頼らずに事実性を高めるフレームワークMR-ALIGNを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:00:54 GMT)
Improving Model Fusion by Training-time Neuron Alignment with Fixed Neuron Anchors [43.3] モデル融合は、パラメータを融合させることで、複数のディープニューラルネットワーク(DNN)モデルの知識をひとつに統合することを目的としている。
基礎モデルの一般化や、フェデレート学習におけるパラメータ平均化など、有望な応用がある。
以前の研究では、置換不変性の役割を強調し、トレーニング後のニューロンアライメントのための正しいネットワーク置換を見つける方法を開発した。
本稿では, トレーニング時ニューロンアライメント, モデル融合の改善について検討する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:23:58 GMT)
Multi-Step Reasoning for Embodied Question Answering via Tool Augmentation [42.4] EQA(Embodied Question Answering)は、エージェントが3D環境を探索して観察し、シーンに関連する質問に答えることを要求する。
外部ツールと多段階推論を統合するエージェントであるToolEQAを紹介する。
さらに,大規模EQAタスクを自動的に構築する新しいEQAデータ生成パイプラインを設計する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:58:06 GMT)
OraPlan-SQL: A Planning-Centric Framework for Complex Bilingual NL2SQL Reasoning [42.3] OraPlanが第1位、実行精度(EX)が6%以上上昇
OraPlanが第1位、実行精度(EX)が6%以上上昇
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:22:41 GMT)
Benchmarking Federated Learning Frameworks for Medical Imaging Deployment: A Comparative Study of NVIDIA FLARE, Flower, and Owkin Substra [42.1] Federated Learning(FL)は、医療AIにおける変革的パラダイムとして登場し、直接的なデータ共有のない機関間での協調的なモデルトレーニングを可能にしている。
この研究では、NVIDIA FLARE、Flower、Owkin Substraの3つの著名なFLフレームワークをベンチマークし、実際の環境での医療画像アプリケーションへの適合性を評価する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:51:12 GMT)
UniMedVL: Unifying Medical Multimodal Understanding And Generation Through Observation-Knowledge-Analysis [41.9] 画像理解と生成タスクの同時解析のための医用統合マルチモーダルモデルUniMedVLを紹介する。
UniMedVLは5つの医用画像理解ベンチマークにおいて優れた性能を示し、8つの医用画像モダリティにまたがる生成品質のモデルに適合する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:55:52 GMT)
Increasing LLM Coding Capabilities through Diverse Synthetic Coding Tasks [41.8] 大規模言語モデル(LLM)は、コード生成において素晴らしい可能性を示しています。
800k近い命令推論コードテスト四重項を生成するスケーラブルな合成データ生成パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:54:25 GMT)
STree: Speculative Tree Decoding for Hybrid State-Space Models [41.7] 状態空間モデル(SSM)とSSMとTransformerのハイブリッドアーキテクチャでツリーベースの投機的デコーディングを行うスケーラブルなアルゴリズムを提案する。
本アルゴリズムでは,ARトランスフォーマーツリーに基づく投機的復号法をSSMに適用し,本手法を改良したハードウェア・アウェアの実装について述べる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:48:48 GMT)
A Comprehensive Survey on Reinforcement Learning-based Agentic Search: Foundations, Roles, Optimizations, Evaluations, and Applications [41.6] Retrieval-Augmented Generation (RAG) は、モデル出力を外部のエビデンスに接地することで問題を緩和する。
エージェント検索の最近の進歩は、LLMが検索環境との多段階の相互作用を計画し、検索し、反映できるようにすることによって、これらの制限に対処している。
このパラダイムの中では、強化学習(RL)は適応的かつ自己改善的な探索行動のための強力なメカニズムを提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:23:17 GMT)
Connectivity structure and dynamics of nonlinear recurrent neural networks [41.0] ニューラルネットワークにおける接続構造が高次元集合活動をどのように形成するかを解析する理論を開発する。
単一ニューロンの活動では接続構造は見えず,集団活動は劇的に形成されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:18:24 GMT)
CoMo: Compositional Motion Customization for Text-to-Video Generation [40.4] CoMoは、textbfcompositional motion customization$の新たなフレームワークである。
これは、モーションマージの絡み合いと非効率なマルチモーションブレンディングの課題に対処する。
CoMoは最先端のパフォーマンスを実現し、制御可能なビデオ生成能力を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:57:09 GMT)
Reduced AI Acceptance After the Generative AI Boom: Evidence From a Two-Wave Survey Study [40.3] 本稿では,ChatGPTのローンチ前後におけるAIに対する公的な態度の変化について検討する。
AIが「全く受け入れられない」と回答した回答者の割合は23%から30%に増加した。
これらの変化は、教育、言語、性別格差の拡大の観点から、既存の社会的不平等を増大させてきた。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:47:58 GMT)
Smaller Models, Smarter Rewards: A Two-Sided Approach to Process and Outcome Rewards [40.2] 本稿では,最先端の小型言語モデルが有用報酬モデルに変換できるかどうかを考察する。
我々はAPPS符号化チャレンジベンチマークから得られた正当性ラベル付きコードサンプルのデータセットを構築した。
この批判を用いて、複数世代にわたる最も正確なコードの検索能力を20%以上改善する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:36:41 GMT)
Now you see me! Attribution Distributions Reveal What is Truly Important for a Prediction [40.0] ニューラルネットワークが特定の予測に使用する入力特徴を理解するために属性法が開発されている。
ここでは、孤立ロジットの帰属計算として属性の特異性の欠如の原因を1つ同定する。
画像中の各空間的位置のクラスに対する属性の確率を計算することにより、既存の属性手法の真の能力を解き放つ。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:45:30 GMT)
PixelRefer: A Unified Framework for Spatio-Temporal Object Referring with Arbitrary Granularity [40.0] PixelReferは、統一された領域レベルのMLLMフレームワークで、ユーザが指定した領域についてより詳細な理解を可能にする。
解析の結果,グローバルな視覚トークンは主に初期のLCM層に寄与し,PixelRefer-Liteの設計を刺激していることがわかった。
微粒な命令チューニングを容易にするため,高品質なオブジェクト中心命令データセットであるPixelRefer-2.2Mをキュレートする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:59:32 GMT)
FARMER: Flow AutoRegressive Transformer over Pixels [39.9] 本稿では,正規化フロー(NF)と自己回帰(AR)モデルを統一した新しいエンドツーエンド生成フレームワークを提案する。
FARMERは非可逆自己回帰流を用いて画像を潜在シーケンスに変換し、その分布は自己回帰モデルによって暗黙的にモデル化される。
FARMERは,既存の画素ベース生成モデルと比較して,競合性能が高いことを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:54:08 GMT)
Any Large Language Model Can Be a Reliable Judge: Debiasing with a Reasoning-based Bias Detector [39.5] 推論に基づくバイアス検出器は、バイアス評価を特定し、構造的推論を生成して評価器の自己補正を導く。
RBDモデルのサイズを1.5Bから14Bに微調整し、すべてのスケールで一貫した性能改善を観察する。
例えば、RBD-8Bモデルは平均18.5%、一貫性10.9%で評価精度を向上し、それぞれ12.8%、微調整された審査員を17.2%上回る。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:09:54 GMT)
UniAIDet: A Unified and Universal Benchmark for AI-Generated Image Content Detection and Localization [39.5] 写真画像と芸術画像の両方を含む統一的で総合的なベンチマークであるUniAIDetを紹介する。
UniAIDetは、テキスト・ツー・イメージ、イメージ・ツー・イメージ、画像のインペイント、画像編集、ディープフェイクモデルなど、幅広い生成モデルをカバーする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:37:23 GMT)
M$^{3}$T2IBench: A Large-Scale Multi-Category, Multi-Instance, Multi-Relation Text-to-Image Benchmark [39.5] 本稿では,M$3$T2IBench,大規模マルチカテゴリ,マルチインスタンス,マルチリレーション,オブジェクト検出に基づく評価指標である$AlignScore$を紹介する。
その結果,現在のオープンソーステキスト・ツー・イメージモデルでは,この挑戦的なベンチマークでは性能が低かったことが判明した。
画像テキストのアライメントを向上させるために,Revise-Then-Enforceアプローチを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:32:50 GMT)
Can LLMs Narrate Tabular Data? An Evaluation Framework for Natural Language Representations of Text-to-SQL System Outputs [39.3] 本稿では,LLM生成NLRの判定のための新しい評価手法であるCombo-Evalを提案する。
本手法は,NLR専用のベンチマークデータセットであるNLR-BIRDである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:52:19 GMT)
When Personalization Meets Reality: A Multi-Faceted Analysis of Personalized Preference Learning [39.2] ヒューマンフィードバックからの強化学習(Reinforcement Learning from Human Feedback, RLHF)は、一般的に、多様な人間の価値観や少数派視点を見越して、ユーザ間で均質な好みを仮定する。
本稿では,多面的評価フレームワークを提案する。このフレームワークは,性能だけでなく,不公平性,意図しない効果,適応性など,様々なレベルの嗜好のばらつきを計測する。
これらの知見は、より効果的で包括的な選好学習システムの開発を進めるための全体論的評価アプローチの批判的必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:53:22 GMT)
Omni-Reward: Towards Generalist Omni-Modal Reward Modeling with Free-Form Preferences [39.0] オムニ・リワード(Omni-Reward, Omni-Reward)は、自由形式の選好をサポートする汎用的なオムニ・モーダル報酬モデリングのためのステップである。
本研究では248Kの一般嗜好ペアと69Kの命令調整ペアからなるマルチモーダル選好データセットを構築し,汎用的オムニモーダルRMのトレーニングを行う。
Omni-RewardBenchと他の広く使われている報酬モデルベンチマークにおいて、識別的および生成的RMの両方を含み、高い性能を実現するOmni-RewardModelを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:53:20 GMT)
Can Less Precise Be More Reliable? A Systematic Evaluation of Quantization's Impact on CLIP Beyond Accuracy [38.9] 量子化がCLIPの性能に与える影響を精度を超えて評価する。
量子化は、一般に信頼できない事前学習モデルの校正を一貫して改善することを示す。
我々は、ゼロショット精度、キャリブレーション、OODロバスト性において同時ゲインをもたらす特定の量子化対応トレーニング(QAT)法を同定する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:18:44 GMT)
A Survey on LLM Mid-training [38.6] ミッドトレーニングはプレトレーニングとポストトレーニングを橋渡しする重要な段階である。
この調査は、大規模言語モデル(LLM)の中間訓練の正式な定義を提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:32:19 GMT)
How Muon's Spectral Design Benefits Generalization: A Study on Imbalanced Data [38.5] 本研究では,Muon や Shampoo などのスペクトル対応行列の一般化が競合アルゴリズムより優れていることを示す。
様々な不均衡データセットに関する理論的知見を実証的に検証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:00:42 GMT)
Revisiting Transformation Invariant Geometric Deep Learning: An Initial Representation Perspective [38.3] 我々は幾何学的データのための単純で汎用的なプラグインであるTransform In Neural Networks (TinvNN)を提案する。
具体的には,多次元スケーリングを改良することにより,変換不変性と距離保存初期点表現を実現する。
我々は、TinvNNが変換不変性を厳密に保証し、既存のニューラルネットワークと組み合わせられるほど汎用的で柔軟なことを証明した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:45:09 GMT)
First SFT, Second RL, Third UPT: Continual Improving Multi-Modal LLM Reasoning via Unsupervised Post-Training [37.8] MLLMの教師なし後学習のための簡易かつ効果的なフレームワークであるMM-UPTを提案する。
本実験は,Qwen2.5-VL-7Bの推論能力を効果的に向上することを示した。
我々は、MLLMに新しいトレーニングサンプルを合成させる2つの戦略を設計し、我々のフレームワークをデータ・セルフジェネレーション・セッティングに拡張する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:06:32 GMT)
Rabi oscillations of a monolayer quantum emitter driven through its excited state [37.8] WSe2単層型量子ドットに生じるラビ振動について検討する。
結果として生じる励起子基底状態の人口は、様々な駆動パルス領域と変形によって制御できる。
この結果は、原子間半導体における量子エミッタのコヒーレント制御への道を開くものである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:18:38 GMT)
Science Hierarchography: Hierarchical Organization of Science Literature [37.8] 我々は、科学文献を高品質な階層構造に整理する目的であるSCIENCE HIERARCHOGRAPHYを動機付けている。
我々は、効率的な埋め込みベースのクラスタリングとLLMベースのプロンプトを組み合わせたハイブリッドアプローチを開発した。
その結果,本手法は解釈可能性を改善し,科学的文献を探索するための代替経路を提供することがわかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:17:31 GMT)
On the Faithfulness of Visual Thinking: Measurement and Enhancement [37.5] 最近の視覚言語モデルは、強化微調整後、視覚テキストのマルチモーダル・チェーン・オブ・ソート・トレースを生成することができる。
MCoTに組み込まれた視覚情報はしばしば不正確であるが、正確な答えは得られない。
本稿では,Sufficient-Component Cause Model (SCCM) 学習と呼ばれる新しいMCoT学習戦略を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:15:54 GMT)
DeepOmni: Towards Seamless and Smart Speech Interaction with Adaptive Modality-Specific MoE [37.5] ネイティブマルチモーダル大言語モデル(MLLM)は、単一大言語モデル(LLM)を音声言語モデル(SLM)に再構成する。
DeepTalkは、Mixture of Experts (MoE)アーキテクチャに基づいた適応型モダリティエキスパート学習のためのフレームワークである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:52:21 GMT)
BBOPlace-Bench: Benchmarking Black-Box Optimization for Chip Placement [37.4] チップ配置のためのブラックボックス最適化(BBO)は数十年の歴史がある。
近年の進歩はチップ配置におけるBBOの有効性と効率性を示している。
これらの進歩にもかかわらず、この分野には統合されたBBO固有のベンチマークが欠けている。
BBOPlace-Benchは、チップ配置タスクのためのBBOアルゴリズムの評価と開発に特化した最初のベンチマークである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:10:32 GMT)
Not All Data are Good Labels: On the Self-supervised Labeling for Time Series Forecasting [37.2] 本稿では,候補データセットを自然に構築することで,時系列データセットを再ラベルする新たな自己教師型アプローチについて検討する。
単純な再構成ネットワークの最適化において、中間体は自己管理パラダイムの擬似ラベルとして使用される。
実世界の11のデータセットの実験では、SCAMは様々なバックボーンモデルの性能を一貫して改善している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:36:48 GMT)
Advantage Shaping as Surrogate Reward Maximization: Unifying Pass@K Policy Gradients [36.4] 既存の利点形成アルゴリズムは、サロゲート報酬を暗黙的に最適化していることを示す。
既存の利点形成法と新しい利点形成法の両方を導出するための簡単なレシピを提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:24:56 GMT)
ORIGEN: Zero-Shot 3D Orientation Grounding in Text-to-Image Generation [35.8] 我々は,テキスト・ツー・イメージ生成における3次元配向グラウンドディングのための最初のゼロショット手法であるORIGENを紹介する。
本稿では,事前学習による3次元方向推定モデルを用いた報酬誘導サンプリング手法を提案する。
実験の結果,ORIGENはトレーニングベースとテストタイムの指導方法の両方で,定量的な測定値やユーザスタディよりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:06:50 GMT)
Heat measurement of quantum interference [35.6] コヒーレンスは 量子熱エンジンと冷凍機の 運用と性能において 重要な役割を担っている
本研究では, クビットと熱浴の間の熱伝達の量子的特徴を, ラムダ/4$コプラナー導波管共振器にガルバニカルに結合した駆動束クビットからなる系で測定する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:55:23 GMT)
ReCode: Unify Plan and Action for Universal Granularity Control [35.5] 現実世界のタスクは、様々な粒度の決定を必要とし、人間は、統一された認知表現を活用することで、これを優れている。
現在のLLM(Large Language Model)ベースのエージェントには、決定の粒度を流動的に操作する重要な機能が欠けている。
単一のコード表現内に計画とアクションを統合することで、この制限に対処する新しいパラダイムであるReCodeを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:35:15 GMT)
A Survey on Large Language Model-Based Game Agents [35.3] ゲームエージェントは、人工知能に関連する能力を探索するための貴重なテストベッドを提供する。
近年、LLM(Large Language Models)の出現は、これらのエージェントに一般化可能な推論を与える新たな機会を提供する。
この調査は、統一された参照アーキテクチャを通して、LLMベースのゲームエージェントの最新のレビューを提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:50:51 GMT)
The non-stabilizerness cost of quantum state estimation [35.2] 単一設定の量子状態推定シナリオにおいて,情報完全性を実現するために必要な非安定化器リソースについて検討する。
安定化器資源のみを許す場合、これらの戦略は常に安定器ベースでの射影測定と情報的に等価であることを示す。
我々は,$t$ドープクリフォード回路で実装された計測の絡み合い構造と情報パワーの密接な関係を明らかにする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:11:14 GMT)
Charting the Design Space of Neural Graph Representations for Subgraph Matching [35.0] サブグラフマッチングは知識グラフ(KG)質問応答、分子設計、シーングラフ、コード、サーキットサーチにおいて不可欠である。
現在の手法では、この領域ではいくつかの孤立したパッチしか占めておらず、ほとんどチャージされていない。
本研究は,神経グラフ表現と相互作用の一般的な設計原則を明らかにする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:58:29 GMT)
A Survey of AI Scientists: Surveying the automatic Scientists and Research [34.9] 人工知能は、計算機器から科学知識の自律的創始者へと大きく移行している。
本調査では, エンド・ツー・エンドの科学的プロセスを, 文献レビュー, イデオロギー生成, 実験準備, 実験実施, 科学著作, 論文生成に分解する, 統合された6段階の方法論的枠組みを紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:13:21 GMT)
Human-Like Goalkeeping in a Realistic Football Simulation: a Sample-Efficient Reinforcement Learning Approach [34.8] 本稿では,産業環境下での訓練や微調整に適したサンプル効率のよい深層強化学習法を提案する。
EA SPORTS FC 25におけるゴールキーパーエージェントのトレーニングを,今日最も売れているサッカーシミュレーションの一つとして評価した。
我々のエージェントは、ゲームに組み込まれたAIを10%のボールセーブレートで上回ります。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:06:00 GMT)
How Can We Effectively Expand the Vocabulary of LLMs with 0.01GB of Target Language Text? [34.6] 大きな言語モデル(LLM)は、英語以外の多くの言語で顕著な能力を示している。
LLMは、英語中心のトークン化や語彙に依存するため、非英語のテキストを生成する際にさらに推論ステップを必要とする。
ターゲット言語トークンによる語彙拡張は、この問題を改善するために広く使われている言語間語彙適応手法である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:19:39 GMT)
Experimental Multipartite Entanglement Detection With Minimal-Size Correlations [34.4] 本報告では,最小サイズ相関を用いたマルチパーティの絡み合い検出実験について述べる。
以上の結果から,大規模な絡み合い状態において,真の多部絡み合いを実験的に検出できる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:54:19 GMT)
CodeAD: Synthesize Code of Rules for Log-based Anomaly Detection with LLMs [34.2] 我々は,大規模言語モデル(LLM)を用いて,LogAD用の軽量Pythonルール関数を自動的に合成する新しいフレームワークであるCodeADを提案する。
CodeADは、正確性と抽象化要件を満たすまで、反復的にルールを生成し、テストし、修復し、洗練するエージェントワークフローを採用している。
3つの公開データセットに関する包括的な実験は、CodeADが最先端のベースラインよりも平均3.6%のF1スコアを絶対的に向上していることを示しています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:08:49 GMT)
Multi-Personality Generation of LLMs at Decoding-time [34.0] LLMのマルチパーソナリティ生成は基本的な課題である。
既存のアプローチは費用がかかり、スケーラビリティが低い。
本稿では,デコード時間の組み合わせパラダイムに基づく新しい多言語生成フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:45:11 GMT)
PRISM-Bench: A Benchmark of Puzzle-Based Visual Tasks with CoT Error Detection [34.0] PRISM-Benchは、モデルが問題を解決することができるかどうかだけでなく、それらの推論がどのように展開するかを評価するために設計されたパズルベースの視覚的課題のベンチマークである。
視覚パズルと正確に1つのエラーを含むステップ・バイ・ステップ・オブ・シークレット(CoT)が与えられた場合、モデルは最初の誤ったステップを特定する必要がある。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:57:52 GMT)
Implicit Modeling for Transferability Estimation of Vision Foundation Models [33.7] Implicit Transferability Modeling (ITM)は、各モデルの固有のトランスファービリティを暗黙的にモデル化する新しいフレームワークである。
ITMは、安定性、有効性、効率の点で既存の手法を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:21:19 GMT)
PRO: Enabling Precise and Robust Text Watermark for Open-Source LLMs [33.7] 本稿では,オープンソースのモデルに対する高精度かつロバストなテキスト透かし手法であるPropを提案する。
Proは、モデル修正に対する透かし検出性とレジリエンスの両方を大幅に改善する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:00:49 GMT)
RARE: Retrieval-Aware Robustness Evaluation for Retrieval-Augmented Generation Systems [33.4] Retrieval-Augmented Generation (RAG)は、回答の正確性と事実性を高める。
既存の評価では、RAGシステムが現実世界のノイズ、内部と外部の取得したコンテキストの衝突、あるいは急速に変化する事実にどれくらいうまく対処しているかを検査することはめったにない。
本稿では,動的で時間に敏感なコーパス上でのストレステストクエリと文書摂動を共同で行う,統一されたフレームワークと大規模ベンチマークであるRetrieval-Aware Robustness Evaluation (RARE)を紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:46:06 GMT)
Coresets for Clustering Under Stochastic Noise [33.1] 本稿では,入力データセットがノイズによって破損した場合に,$(k, z)$-clusteringに対してコアセットを構築するという問題について検討する。
私たちは、真のクラスタリングコストと確実に関連付けられた、トラクタブルなサロゲートエラーメトリクスを使用します。
コアセットのサイズは最大$mathrmpoly(k)$で改善できるが、$n$はデータセットのサイズである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:41:27 GMT)
ScaLoRA: Optimally Scaled Low-Rank Adaptation for Efficient High-Rank Fine-Tuning [32.6] 低ランク適応(LoRA)はこのコストを、低次元の部分空間に重み付けすることで効果的に削減する。
この貢献は、連続する低ランクインクリメントからのハイランクウェイト更新を徐々に蓄積することで、これらの制限を扱う。
再起動することなく効率よくシームレスな最適化を実現するために、この最適な選択は、元の低ランク行列の列を適切にスケーリングすることによって形成される。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:59:46 GMT)
Simple Denoising Diffusion Language Models [32.1] 我々は一様状態拡散モデル(USDM)の簡易化に基づく損失法を提案する。
対照的に負の勾配に着想を得たデノナイジング損失に簡単な修正を加え, 実用的であり, 生成品質の向上が期待できる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:05:26 GMT)
Can Confidence Estimates Decide When Chain-of-Thought Is Necessary for LLMs? [32.0] CoT(Chain-of- Thought)プロンプトは、大規模言語モデルの推論能力を高めるための一般的な手法として登場した。
本研究は,CoTゲーティングのためのトレーニング不要信頼度推定手法に関する最初の体系的研究である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:25:38 GMT)
Can Large Language Models Unlock Novel Scientific Research Ideas? [31.9] 本研究では,Large Language Models (LLMs) の科学論文から将来の研究思想を創出する能力について検討する。
この環境での人間の評価は非常に難しい。ドメインの専門知識、論文の文脈的理解、現在の研究環境の認識が必要である。
本稿では,Idean Alignment Score(IAScore)とIdean Distinctness Index(Idean Distinctness Index)の2つの自動評価指標を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:39:52 GMT)
Unveiling m-Sharpness Through the Structure of Stochastic Gradient Noise [31.6] 計算摂動のマイクロバッチサイズが減少するにつれて,SAMの性能が単調に向上する現象であるmsharpnessについて検討する。
実際には、経験的なm-シャープ効果はSAMの訓練における展開を支えているが、厳密な理論的な説明はいまだに欠けている。
本稿では, 並列化性を維持しつつ, m-SAMの一般化の利点を模倣するために, シャープネス重み付きサンプリングを用いたReweighted SAM(RWSAM)を紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:49:07 GMT)
MoORE: SVD-based Model MoE-ization for Conflict- and Oblivion-Resistant Multi-Task Adaptation [31.6] マルチタスクシナリオにおける大規模な基盤モデルの適用は、多くの場合、タスクの衝突や障害に悩まされる。
本稿では,「モデルMOE-ization」戦略を新たに提案し,コンフリクトとオブリビションに抵抗するマルチタスク適応手法を提案する。
様々なデータセットの実験により、MoOREは既存のマルチタスク適応手法を一貫して上回ることを示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:13:12 GMT)
ENTP: Enhancing Low-Quality SFT Data via Neural-Symbolic Text Purge-Mix [31.6] Supervised Fine-Tuning (SFT) は、訓練済みの大規模言語モデル(LLM)を、高品質な命令応答ペアのサブセットでトレーニングすることで、ドメイン固有の命令に適応させる。
既存の品質優先のパラダイムは、廃棄された低品質データの貴重な信号を見落とし、不完全な品質フィルタに依存していることが多い。
我々は,低品質コーパスを記号的浄化と神経再建によって活性化するフレームワークであるENTP(Neural-symbolic Text Purge-Mix)を導入する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:39:22 GMT)
Test-Time Tuned Language Models Enable End-to-end De Novo Molecular Structure Generation from MS/MS Spectra [31.6] タンデム質量分析法は、代謝学、天然物発見、環境分析などの重要な分野における未知化合物の同定を可能にする。
テスト時間チューニングを活用することで,事前学習されたトランスフォーマーモデルの学習を向上し,このギャップに対処するフレームワークを導入する。
我々は、NPLIB1とMassSpecGymの2つの人気のあるベンチマークで、DiffMSのデファクトステート・オブ・ザ・アーティカルアプローチを100%と20%上回った。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:25:36 GMT)
One-Step is Enough: Sparse Autoencoders for Text-to-Image Diffusion Models [31.5] 我々は、数ステップのテキスト・画像拡散モデルであるSDXL Turboの解釈可能な機能を学ぶためにSAEを訓練する。
学習した特徴は解釈可能であり、生成プロセスに因果的に影響を与え、ブロック間の特殊化を明らかにする。
本研究は,テキスト・画像拡散モデルにおけるSAEの解釈可能性に関する最初の研究である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:52:38 GMT)
Incentivizing Agentic Reasoning in LLM Judges via Tool-Integrated Reinforcement Learning [30.9] 大きな言語モデル(LLM)は、応答品質を評価するために広く使われ、人間の評価に代わるスケーラブルな代替手段を提供する。
我々は,LLM審査員を訓練するためのエンドツーエンドのRLフレームワークであるTIR-Judgeを提案し,正確な評価のためにコードエグゼキュータを統合する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:03:37 GMT)
SafeMERGE: Preserving Safety Alignment in Fine-Tuned Large Language Models via Selective Layer-Wise Model Merging [30.8] 微調整された大型言語モデル(LLM)は安全性を損なう可能性があるため、LSMは有害または非倫理的なプロンプトに応答する。
本稿では,下流性能を維持しながら安全性を維持する軽量なポストファインニングフレームワークであるSafeMERGEを提案する。
以上の結果から,選択的層ワイドマージは微調整時の安全性の低下を効果的に防ぐことができることが示された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:40:05 GMT)
T2ICount: Enhancing Cross-modal Understanding for Zero-Shot Counting [30.0] ゼロショットオブジェクトカウントは、テキスト記述によって指定された任意のオブジェクトカテゴリのインスタンスをカウントすることを目的としている。
我々は、事前学習した拡散モデルから、豊富な事前知識ときめ細かい視覚的理解を活用する拡散に基づくフレームワークT2ICountを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:31:06 GMT)
Fixing It in Post: A Comparative Study of LLM Post-Training Data Quality and Model Performance [29.9] 我々は、Tulu-3-SFT-MixとSmolTalkという2つの著名なオープントレーニング後のデータセットを総合的に分析した。
構造的および質的な類似点と2つのデータセットの違いを明らかにする統計を導出する。
我々の発見は、より効果的なトレーニング後のデータセットを構築するための実用的な洞察を提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:31:21 GMT)
UNDREAM: Bridging Differentiable Rendering and Photorealistic Simulation for End-to-end Adversarial Attacks [29.9] 私たちは、フォトリアリスティックシミュレータと微分可能機器のギャップを埋める最初のソフトウェアフレームワークであるUNDREAMを紹介します。
UNDREAMは、天気、照明、背景、カメラアングル、軌道、現実的な人間と物体の動きを完全に制御することで、環境の操作を可能にする。
我々は、UNDREAMによって研究者が様々な環境で迅速に探索できる、様々な物理的に可視な対向物体を紹介した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:59:01 GMT)
Multi-Environment POMDPs: Discrete Model Uncertainty Under Partial Observability [29.6] 多環境POMDP(ME-POMDP)は、標準POMDPを離散モデル不確実性で拡張する。
本稿では, ME-POMDP を初期信念の集合を用いて POMDP に一般化可能であることを示す。
次に、AB-POMDPのロバストなポリシーを計算するために、正確で近似的な(ポイントベース)アルゴリズムを考案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:24:11 GMT)
VALA: Learning Latent Anchors for Training-Free and Temporally Consistent [29.5] 本稿では,キーフレームを適応的に選択し,その潜在機能をセマンティックアンカーに圧縮し,一貫したビデオ編集を行う変分アライメントモジュールであるVALAを提案する。
本手法はトレーニング不要なテキスト・画像ベースのビデオ編集モデルに完全に統合することができる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:44:11 GMT)
Multi-Agent Evolve: LLM Self-Improve through Co-evolution [29.5] 強化学習(RL)は、大規模言語モデル(LLM)の推論能力を高める大きな可能性を証明している。
近年のSelf-Play RL法は,ゲームやGoのパラダイムの成功に触発されて,人間に注釈を付けることなくLSM推論能力を向上することを目指している。
数学,推論,一般知識Q&Aなど多種多様な課題の解決において,LLMが自己発展できるフレームワークであるMulti-Agent Evolve(MAE)を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:58:02 GMT)
Victim as a Service: Designing a System for Engaging with Interactive Scammers [29.4] LLMベースのシステムであるCHATTERBOX(CHATTERBOX)のモチベーション,設計,実装,経験について述べる。
我々は、詐欺未遂を誘致するために開発した手法、詐欺行為を説得するために必要なシステムとLLMエンジニアリング、詐欺のワークフローにおいて「マイルストーン」を満足または回避するために必要な能力について述べる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:19:29 GMT)
FAME: Fairness-aware Attention-modulated Video Editing [29.3] トレーニングフリーのビデオ編集モデルは、職業関連のプロンプトをレンダリングする際、ジェンダーのステレオタイプに取って代わる傾向がある。
本研究では,職業関連性バイアスを緩和する意図変調ビデオ編集のためのtextbfFAMEを提案する。
FAMEは、公平性変調を時間的自己注意と地域間相互注意の両方に統合する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:34:15 GMT)
UrbanVLA: A Vision-Language-Action Model for Urban Micromobility [29.2] 都市マイクロモビリティの応用は、大規模な都市環境を横断する信頼性の高いナビゲーションを必要とする。
スケーラブルな都市ナビゲーションのためのフレームワークであるUrbanVLAを提案する。
メタウルバンにおけるSocialNavタスクでは,UrbanVLAが55%以上,強いベースラインを越えていることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:46:43 GMT)
PESTO: Real-Time Pitch Estimation with Self-supervised Transposition-equivariant Objective [28.8] PESTOは単ピッチ推定のための自己教師付き学習手法である。
キャッシュ型畳み込みを用いたストリーム可能なVQT実装を開発した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:55:07 GMT)
The Underappreciated Power of Vision Models for Graph Structural Understanding [28.8] グラフニューラルネットワークはボトムアップメッセージパッシングを通じて動作し、人間の視覚的知覚と根本的に異なる。
グラフ理解のための視覚モデルの未熟な可能性について検討し、既存のベンチマークでGNNに匹敵する性能を実現する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:11:44 GMT)
A Principle of Targeted Intervention for Multi-Agent Reinforcement Learning [28.7] 上記の問題に対処するためのグラフィカルフレームワークとして,マルチエージェント・インフルエンス・ダイアグラム(MAID)を採用している。
まず、MAIDを用いたMARL相互作用のパラダイムの概念を導入し、未指導の自己組織化とグローバルガイダンスのメカニズムの両方を分析し視覚化する。
そこで本研究では,単一のターゲットエージェントにのみ適用可能な,新たなMARLインタラクションパラダイムを設計する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:15:26 GMT)
Your Compiler is Backdooring Your Model: Understanding and Exploiting Compilation Inconsistency Vulnerabilities in Deep Learning Compilers [28.7] ディープラーニング(DL)コンパイラは、現代のDLシステムにおけるコアインフラストラクチャである。
公式の未修正コンパイラは、コンパイル中にモデルのセマンティクスを変更して、隠れたバックドアを導入することができるだろうか?
逆方向と自然方向の両方について検討し, 逆方向の場合, トリガが事前コンパイルに影響を及ぼすことなく, コンパイル後に有効なバックドアとなる良性モデルを構築する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:04:50 GMT)
Time-Resolved EEG Decoding of Semantic Processing Reveals Altered Neural Dynamics in Depression and Suicidality [28.6] 脳波を用いた感情処理のセマンティックダイナミクスについて検討した。
うつ病や自殺観念を持つ人は、早期発症、長い期間、振幅復号反応が大きかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:45:08 GMT)
Neural Emulator Superiority: When Machine Learning for PDEs Surpasses its Training Data [28.6] 我々は、高忠実度参照に対して評価すると、低忠実度ソルバデータに基づいて純粋にトレーニングされたニューラルネットワークが、それらのソルバよりも高い精度を達成することを示す。
標準的なニューラルネットワークを用いて、異なるPDE間でこの発見を実証的に検証する。
この研究は、エミュレータのベンチマークを再評価し、神経エミュレータが特定の運用体制内でのトレーニングソースよりも高い物理的忠実性を達成する可能性を示唆している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:31:55 GMT)
TEn-CATG:Text-Enriched Audio-Visual Video Parsing with Multi-Scale Category-Aware Temporal Graph [28.5] TEn-CATGは、セマンティックキャリブレーションとカテゴリー対応の時間的推論を組み合わせたテキスト強化AVVPフレームワークである。
弱教師付きAVVPタスクにおいて,TEn-CATGは複雑な時間的および意味的依存関係を捕捉する堅牢性と優れた能力を実現する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:28:49 GMT)
ISA-Bench: Benchmarking Instruction Sensitivity for Large Audio Language Models [28.4] 大規模音声言語モデル(LALM)は、音声から多様な情報を抽出し、理解する。
LALMは命令の言い方に非常に敏感であり、命令追従率やタスクパフォーマンスに影響を及ぼす。
本稿では,命令記述,出力形式,タスク構成という3つの軸に沿って,LALMの命令感度を評価するベンチマークであるISA-Benchを紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:31:25 GMT)
ReconViaGen: Towards Accurate Multi-view 3D Object Reconstruction via Generation [28.3] 我々はReconViaGenを提案する。
我々のReconViaGenは、グローバルな構造と局所的な詳細の両方において、入力ビューと整合した完全かつ正確な3Dモデルを再構築できることを実証した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:15:06 GMT)
PlanarTrack: A high-quality and challenging benchmark for large-scale planar object tracking [28.3] 平面追跡は、ロボット工学や拡張現実において重要な役割を担っているため、関心が高まっている。
PlanarTrackは、1,150のシーケンスと733Kのフレームで構成され、1000の短期ビデオと150の新しい長期ビデオが含まれている。
PlanarTrackのすべてのビデオは、野生の制約のない状態で録画されるため、PlanarTrackは挑戦的だが現実のアプリケーションでは現実的だ。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:18:13 GMT)
DPRF: A Generalizable Dynamic Persona Refinement Framework for Optimizing Behavior Alignment Between Personalized LLM Role-Playing Agents and Humans [28.0] 言語モデルロールプレイングエージェント(LLM RPA)は、個人の行動のシミュレートを目的としている。
ペルソナの忠実さは、ターゲットの個人と整列することなく手動で作成したプロファイルによって損なわれることが多い。
我々の研究は、DPRF(Dynamic Persona Refinement Framework)を導入し、LLM RPAの動作とターゲット個人とのアライメントを最適化することを目的としている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:45:42 GMT)
Evaluating In Silico Creativity: An Expert Review of AI Chess Compositions [28.0] 本稿では、美的魅力、斬新さ、反直感的、独特なソリューションを特徴とするパズルを生成するように設計されたAIシステムを提案する。
システムの創造性を評価するため、我々は、AI生成パズルのキュレートされたブックレットを、世界有数のエキスパート3人に提示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:00:02 GMT)
LoMix: Learnable Weighted Multi-Scale Logits Mixing for Medical Image Segmentation [27.7] LoMixは、新しい混合スケール出力を生成する、差別化可能なプラグイン・アンド・プレイモジュールである。
それぞれのトレーニングプロセスをどのようにガイドするかを学ぶ。
全てのオリジナルまたはミュータントマップは、ネットワークパラメータと共最適化されたソフトプラス損失重みが与えられる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:25:57 GMT)
Privacy-Preserving Semantic Communication over Wiretap Channels with Learnable Differential Privacy [27.6] セマンティックコミュニケーション(SemCom)は,タスク関連情報に着目して伝達効率を向上させる。
本稿では,通信路上の画像伝送のためのセキュアなSemComフレームワークを提案する。
同等のセキュリティレベルの下では,LPIPS の 0.06-0.29 と FPPSR の 0.10-0.86 の利点を正統なユーザに対して達成している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:34:20 GMT)
RareFlow: Physics-Aware Flow-Matching for Cross-Sensor Super-Resolution of Rare-Earth Features [27.5] 本稿では,ORD(out-of-distribution)のロバスト性を考慮した物理対応SRフレームワークであるRareFlowを紹介する。
Gated ControlNetは低解像度入力からの微細な幾何学的忠実度を保ち、テキストプロンプトは複雑な特徴を合成するための意味的なガイダンスを提供する。
ブラインド評価において、地球物理学の専門家は、我々のモデルの出力は、基礎となる真理像の忠実さに近づき、最先端のベースラインを著しく上回っていると評価した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:56:43 GMT)
FoGE: Fock Space inspired encoding for graph prompting [27.5] 大規模言語モデル(LLM)は、グラフのような構造化データに関する質問を理解し、答えることができる。
既存の提案では、LLMに送信された拡張'プロンプトを生成するために、グラフのいくつかの記述を使用することが多い。
本稿では,Fock空間表現に基づくパラメータフリーグラフエンコーダの利用が,この問題設定において極めて多目的であることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:36:33 GMT)
Through the Lens: Benchmarking Deepfake Detectors Against Moiré-Induced Distortions [27.4] 本研究は,モイアの映像における最先端のディープフェイク検出器を系統的に評価する。
以上の結果から,モイアの人工物は25.4%の劣化率を示し,合成されたモイアのパターンは21.4%の精度低下を招いた。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:23:04 GMT)
The Gray Zone of Faithfulness: Taming Ambiguity in Unfaithfulness Detection [27.3] 既存のベンチマークは、許容可能な外部知識の境界が不明確なため、アノテーションの曖昧さに悩まされている。
本稿では,中間カテゴリであるOut-Dependentを導入した新しい忠実度アノテーションフレームワークを提案する。
このフレームワークを用いて、要約における新しい不誠実検出ベンチマークであるVeriGrayを構築する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:50:12 GMT)
DynCIM: Dynamic Curriculum for Imbalanced Multimodal Learning [27.2] DynCIMは、サンプルとモダリティの両方の観点から固有の不均衡を定量化するために設計された、新しい動的カリキュラム学習フレームワークである。
DynCIMは、予測偏差、一貫性、安定性に応じて各サンプルの難易度を動的に評価するために、サンプルレベルのカリキュラムを使用している。
モダリティレベルのカリキュラムは、グローバルおよびローカルからのモダリティ貢献を測定する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:40:26 GMT)
Track, Inpaint, Resplat: Subject-driven 3D and 4D Generation with Progressive Texture Infilling [27.1] TIRE(Track, Inpaint, REsplat)は、主観駆動型3D/4D生成の新しい手法である。
既存の3D生成モデルによって生成された最初の3Dアセットを入力として取り、ビデオトラッキングを使用して修正が必要な領域を特定する。
提案手法は,最先端手法と比較して3D/4D生成におけるアイデンティティの保存性を著しく向上させる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:59:51 GMT)
Lightweight Robust Direct Preference Optimization [27.0] DPO-PRO (DPO with Preference Robustness) はDPOに基づく頑健な微調整アルゴリズムである。
従来のDROベースの変種とは異なり、DPO-PROは好みの不確実性にのみ焦点をあて、不必要な保守性を避け、無視可能な計算オーバーヘッドを発生させる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:55:06 GMT)
InFlux: A Benchmark for Self-Calibration of Dynamic Intrinsics of Video Cameras [26.8] たいていの3Dアルゴリズムは、カメラの内在性はビデオを通して一定であると仮定している。
本稿では,Flux(Intrinsics in Flux, InFlux, Intrinsics in Flux)について述べる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:54:57 GMT)
The Atlas of In-Context Learning: How Attention Heads Shape In-Context Retrieval Augmentation [26.8] 我々は、情報成分の合成としてプロンプトを眺めることで、質問応答のための文脈内検索強化のメカニズムについて光を当てた。
そこで本研究では,属性に基づく特殊注意ヘッドの同定手法を提案し,指示を理解し,関連するコンテキスト情報を検索するコンテキスト内ヘッドを明らかにする。
得られた洞察を活用して、推論時に使用される知識のソースをトレースし、より安全で透明な言語モデルへの道を開く。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:12:32 GMT)
Out-of-Distribution Generalization in Time Series: A Survey [26.8] 時系列はしばしば分布シフト、多彩な潜在特徴、非定常学習ダイナミクスを示す。
これらの特徴は、アウト・オブ・ディストリビューション(OOD)の一般化に重大な課題をもたらす。
本報告では,時系列のOOD一般化手法について概観する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:15:12 GMT)
Human-AI Collaborative Uncertainty Quantification [26.4] 我々は、AIモデルが人間の専門家の提案する予測セットをいかに洗練するかを形式化するフレームワークであるHuman AI Collaborative Uncertainty Quantificationを紹介する。
最適協調予測セットは1つのスコア関数上の直感的な2つのしきい値構造に従っており、古典的な結果を共形予測で拡張することを示す。
画像分類、回帰、テキストベースの医学的意思決定に関する実験は、協調予測セットがエージェント単独よりも一貫して優れていることを示している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:11:23 GMT)
Cost of Simulating Entanglement in Steering Scenario [26.3] 計算不能な2量子状態であってもシミュレーションコストは非有界であることを示す。
この結果のかなりの部分は、2量子Werner状態のシミュレーションコストとノイズスピン測定の関係に依拠している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:07:04 GMT)
Psi-Sampler: Initial Particle Sampling for SMC-Based Inference-Time Reward Alignment in Score Models [26.2] $Psi$-Samplerは、pCNLベースの初期粒子サンプリングを組み込んだSMCベースのフレームワークである。
スコアベース生成モデルとの推論時間報酬アライメントは、大きな注目を集めている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:22:41 GMT)
KAN or MLP? Point Cloud Shows the Way Forward [26.0] 我々は、クラウド分析タスクにKAN(Kolmogorov-Arnold Learning Networks)を適用したPointKANを提案する。
我々は、ModelNet40、ScanNN、ShapeNetPartなどのベンチマークデータセットにおいて、PointKANがPointMLPより優れていることを示す。
この研究は、3Dビジョンにおけるkansベースのアーキテクチャの可能性を強調し、ポイントクラウド理解における研究のための新たな道を開く。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:16:17 GMT)
Think before Recommendation: Autonomous Reasoning-enhanced Recommender [25.9] RecZeroは強化学習に基づくレコメンデーションパラダイムであり、従来のマルチモデルおよびマルチステージ蒸留アプローチを捨てている。
本稿では、教師付き微調整とRLを組み合わせたハイブリッドパラダイムRecOneについて検討し、そのモデルにコールドスタート推論サンプルを初期化し、さらにRLに最適化する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:26:32 GMT)
Robust Non-negative Proximal Gradient Algorithm for Inverse Problems [25.4] 本稿では,収束保証を伴う新しい乗法更新近位勾配アルゴリズム(SSO-PGA)を提案する。
私たちの重要なイノベーションは、学習可能なシグモノイドベースの演算子で勾配降下ステップを置き換えることにあります。
提案手法は従来のPGAや他の最先端アルゴリズムを大幅に上回り,優れた性能と安定性を確保できる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:10:25 GMT)
Accurate and Scalable Multimodal Pathology Retrieval via Attentive Vision-Language Alignment [25.3] PathSearchは、視覚言語によるコントラスト学習を通じて、細粒度の注意モザイク表現をグローバルなスライド埋め込みと統合する検索フレームワークである。
スライドレポートペア6,926のコーパスでトレーニングされたPathSearchは、きめ細かい形態的手がかりと高いレベルのセマンティックパターンの両方をキャプチャして、正確で柔軟な検索を可能にする。
PathSearchは、4つの公開病理データセットと3つの社内コホートで厳格に評価され、解剖学的部位の検索、腫瘍のサブタイプ、腫瘍対非腫瘍の識別、乳がん、肺、腎臓、肝臓、胃などの様々な臓器のグレーティングを含むタスクをカバーした。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:22:28 GMT)
Revealing the Potential of Learnable Perturbation Ensemble Forecast Model for Tropical Cyclone Prediction [25.3] 熱帯サイクロン(TC)は、非常に破壊的で本質的に不確実な気象システムである。
FuXi-ENSは、アンサンブル生成のための学習可能な摂動方式を導入している。
2018年に全90のグローバルTCでFuXi-ENSとECMWF-ENSを比較した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:27:04 GMT)
Neural Stereo Video Compression with Hybrid Disparity Compensation [25.3] 最適化を簡略化するために,画素変位を頑健な先行特徴として活用するハイブリッド分散補償(HDC)戦略を提案する。
本稿では,HDCベースのモジュールを鍵符号化操作に統合した,エンドツーエンド最適化型ニューラルステレオビデオ圧縮フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:22:21 GMT)
Equivariant Neural Networks for General Linear Symmetries on Lie Algebras [25.1] 還元性リーニューロン(Reducetive Lie Neurons, ReLNs)は、一般線形対称性と全く同じ種類の新しいニューラルネットワークアーキテクチャである。
ReLNは、一般的なn-by-n行列を含む幅広い構造化された入力を直接操作する。
タスクの範囲でReLNの汎用性を検証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:08:39 GMT)
LLM Meets Diffusion: A Hybrid Framework for Crystal Material Generation [25.0] CrysLLMGenは、LLMと拡散モデルを統合するハイブリッドフレームワークであり、結晶生成にそれらの相補的な強度を利用する。
我々のフレームワークは、いくつかのベンチマークタスクやデータセットで最先端の生成モデルより優れています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:08:19 GMT)
Parallel BiLSTM-Transformer networks for forecasting chaotic dynamics [25.0] 本研究では,Transformer と Bidirectional Long Short-Term Memory Network を統合した並列予測フレームワークを提案する。
提案したハイブリッドモデルはデュアルブランチアーキテクチャを採用しており、Transformerブランチは主に長距離依存関係をキャプチャする。
結果は、提案されたハイブリッドフレームワークがタスク間でシングルブランチアーキテクチャの両方より優れていることを一貫して示している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:17:10 GMT)
EQ-Negotiator: Emotion Policing Personas for Anti-Manipulation in Credit Collection Dialogues [24.9] EQ-Negotiatorは、静的な性格プロファイルではなく、感情力学におけるペルソナの振る舞いを基盤とする新しいフレームワークである。
ナイーブな共感中心のエージェントとは異なり、EQ-Negotiatorは感情記憶とゲーム理論推論を統合する。
感情駆動型ペルソナは、戦略的効果を維持しつつ、操作に対する堅牢な防御能力を実現することを実証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:31:13 GMT)
Synthesize Privacy-Preserving High-Resolution Images via Private Textual Intermediaries [24.5] 本稿では,SPTI(Synsration via Private Textual Intermediaries)と呼ばれる新しい手法を提案する。
SPTIはまず、各プライベート画像をテキストモデルに画像を用いた簡潔なテキスト記述に要約し、その後、修正されたPrivate Evolutionアルゴリズムを適用してDPテキストを生成し、最終的に画像モデルにテキストを使用したイメージを再構成する。
プライベートデータセットが与えられた場合、SPTIは以前のDPアプローチよりもかなり高品質な合成画像を生成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:44:01 GMT)
Learning Reconfigurable Representations for Multimodal Federated Learning with Missing Data [24.1] 学習可能なクライアント側埋め込み制御に基づく局所適応表現を特徴とする新しいフェデレート学習フレームワークを提案する。
これらの埋め込みは、グローバルに集約された表現と各クライアントのローカルコンテキストを一致させる再構成信号として機能する。
提案手法は, 厳密なデータ不完全性の下で最大36.45%の性能向上を実現する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:09:58 GMT)
Cancer-Myth: Evaluating AI Chatbot on Patient Questions with False Presuppositions [24.0] がん患者は、医療情報のための大きな言語モデル(LLM)に変わりつつある。
LLMは、がんに関連する問題において、偽の前提を認識または対処することができない。
我々は、単独でプロンプトを行うことは、偽の前提に対する信頼できる治療法ではないことを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:39:30 GMT)
MergeMix: A Unified Augmentation Paradigm for Visual and Multi-Modal Understanding [24.0] MergeMixは、SFTとRLを橋渡しするトレーニング時間拡張パラダイムである。
まず、トークンマージによる注意認識画像の混合と、より多くのクラスタ表現と空間コンテキストを適用する。
次に、MLLMに対して、画像と生画像の混合による選好ペアの構築と、SimPO損失による最適化により、嗜好駆動トレーニングパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:12:40 GMT)
Human-Aligned Faithfulness in Toxicity Explanations of LLMs [23.9] 我々は,自由形態の毒性説明が理想的な条件下での合理的な人間とどのように一致しているかを測定するための新しい基準を開発する。
3つのLlamaモデルと8B Ministralモデルで5つの多様な毒性データセット上で実験を行った。
以上の結果から,LSMは単純なプロンプトに対して妥当な説明を導出するが,原因の完全セット,個人的理由,毒性のスタンスとの微妙な関係が引き起こされた場合,毒性に関する推論は失敗することが明らかとなった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:23:28 GMT)
ReXGroundingCT: A 3D Chest CT Dataset for Segmentation of Findings from Free-Text Reports [23.7] ReXGroundingCTは,胸部CTスキャンにおいて,自由テキスト所見とピクセルレベルの3Dセグメンテーションをリンクする最初の公開データセットである。
データセットには、CT-RATEの標準化された放射線学レポートと組み合わせた3,142個の非コントラスト胸部CTスキャンが含まれている。
約79%が焦点異常、21%が非焦点性である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:51:47 GMT)
Tighter CMI-Based Generalization Bounds via Stochastic Projection and Quantization [23.4] 我々は,統計的学習アルゴリズムの一般化誤差に基づく新しい条件付き相互情報(CMI)境界を確立するために,予測と損失圧縮を利用する。
我々の境界は$mathcalO (1/sqrtn)$の順序で適切な一般化を保証する。
各学習アルゴリズムには、記憶しない補助的アルゴリズムが存在し、任意のデータ分布に対して同等の一般化誤差が得られることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:17:09 GMT)
Doubly-Robust Estimation of Counterfactual Policy Mean Embeddings [23.4] 反ファクトポリシーの下での成果の分配を推定することは、推薦、広告、医療といった領域における意思決定にとって重要である。
再生カーネル空間(RKHS)における反事実分布全体を表す新しいフレームワーク-Counterfactual Policy Mean Embedding(CPME)を提案する。
プラグイン推定器と2倍頑健な推定器の両方を導入し、後者は結果埋め込みモデルと確率モデルの両方においてバイアスを補正することで収束率の向上を享受する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:02:35 GMT)
Probing Knowledge Holes in Unlearned LLMs [23.4] 機械学習は、事前学習中に吸収された不要な知識を選択的に除去するための、一般的な技術的ソリューションとして登場した。
標準ベンチマークがキャプチャーに失敗する、意図しない無意識な知識の損失を、無学習が必然的に生み出す可能性があることに私たちは気付きました。
本稿では、未学習コンテンツのすぐ隣と潜在的な障害の幅広い領域の両方を探索するテストケース生成フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:11:53 GMT)
Transforming volcanic monitoring: A dataset and benchmark for onboard volcano activity detection [22.9] 本研究では,世界中の多様な火山を包含する,火山活動と噴火検出のために設計された新しいデータセットを提案する。
このデータセットは、火山性異常や非火山性異常を識別するためのバイナリアノテーションを提供し、温度異常、噴火、火山灰の放出などの現象をカバーしている。
今後の研究のベースラインを確立するために,最先端モデルを用いた総合ベンチマークを提案する。
実験台としてIntel Movidius Myriad X VPUを用いて, 直接火山活動検出の可能性を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:42:16 GMT)
3D-RAD: A Comprehensive 3D Radiology Med-VQA Dataset with Multi-Temporal Analysis and Diverse Diagnostic Tasks [22.8] 医用視覚質問応答 (Med-VQA) は, 臨床診断支援に有意な可能性を秘めている。
本稿では,ラジオグラフィCTスキャンを用いた3次元メドVQAの高速化を目的とした大規模データセットである3D-RADを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:14:11 GMT)
FreeFuse: Multi-Subject LoRA Fusion via Auto Masking at Test Time [22.8] FreeFuseは、複数の主題のLoRAを自動融合することで、マルチオブジェクトのテキスト・画像生成のためのトレーニング不要のアプローチである。
追加のトレーニング、LoRAの変更、補助モデル、ユーザ定義のプロンプトテンプレートやリージョン仕様を必要としないため、実行性と効率性が向上している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:54:08 GMT)
MolErr2Fix: Benchmarking LLM Trustworthiness in Chemistry via Modular Error Detection, Localization, Explanation, and Revision [22.7] LLM(Large Language Models)は、分子科学における潜在的な可能性を示すが、しばしば化学的に不正確な記述を生成する。
これにより、科学的応用における堅牢性と信頼性に関する重要な懸念が持ち上がる。
分子記述における誤り検出と訂正におけるLCMの評価を目的としたMollErr2Fixベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:51:42 GMT)
PersonaTeaming: Exploring How Introducing Personas Can Improve Automated AI Red-Teaming [22.6] ペルソナチーム(Persona Teaming)は、自動化されたリチームに人々のバックグラウンドとアイデンティティを統合するための最初のステップである。
本研究では,異なるシードプロンプトに適応した様々なペルソナを自動生成する動的ペルソナ生成アルゴリズムを開発した。
実験では、ペルソナ突然変異による敵のプロンプトの攻撃成功率において、有望な改善(最大144.1%)を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:01:19 GMT)
Multi-Task Surrogate-Assisted Search with Bayesian Competitive Knowledge Transfer for Expensive Optimization [22.4] 高価な最適化問題(EOP)は、従来の進化的最適化に重大な課題をもたらす。
知識伝達は、潜在的に関連するインスタンスから検索体験を活用する能力で人気を集めている。
本稿では,複数のEOPを同時に扱う場合のマルチタスクSAS(MSAS)を改善するためにベイズ競合知識伝達(BCKT)手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:09:31 GMT)
Med-R1: Reinforcement Learning for Generalizable Medical Reasoning in Vision-Language Models [22.4] 視覚言語モデル(VLM)は、自然画像の推論において顕著な進歩を遂げているが、医療画像におけるその可能性はまだ探索されていない。
医用推論における一般化と信頼性の向上を目的とした強化学習(RL)による視覚言語モデルであるMed-R1を提案する。
我々はMed-R1を8つの異なる医用画像モダリティで評価した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:33:53 GMT)
MiCADangelo: Fine-Grained Reconstruction of Constrained CAD Models from 3D Scans [22.2] 本稿では,CADのリバースエンジニアリングに人間設計者が手作業で行う方法に着想を得た新しい手法を提案する。
提案手法は多平面断面を利用して2次元パターンを抽出し,より効果的にパラメトリックな細部を捕捉する。
これにより、詳細かつ編集可能なCADモデルの再構築、最先端の手法の向上、そして初めて、スケッチ制約を直接再構成プロセスに組み込むことができる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:33:51 GMT)
Enhancing Feature Fusion of U-like Networks with Dynamic Skip Connections [22.0] Uライクネットワークは、スキップ接続による医用画像セグメンテーションの基本的なフレームワークとなっている。
従来のスキップ接続には、機能間制約と機能内制約の2つの重要な制限がある。
本稿では,動的スキップ接続(DSC)ブロックを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:31:50 GMT)
Finding 3D Scene Analogies with Multimodal Foundation Models [22.0] これまでの経験と現在の観察を結びつけることで、ロボットは新しい、目に見えない3D環境に適応し、計画することが可能になる。
近年,2つの3次元シーンを繋ぐ3次元シーンの類似性が提案されている。
我々は,ゼロショット,オープンボキャブラリ設定で3次元シーンの類似点を見つけるために,マルチモーダル基礎モデルを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:23:31 GMT)
Gesplat: Robust Pose-Free 3D Reconstruction via Geometry-Guided Gaussian Splatting [22.0] 本稿では、3DGSベースのフレームワークであるGesplatを紹介し、ロバストな新しいビュー合成と、未提示のスパース画像からの幾何的に一貫した再構成を可能にする。
提案手法は,他のポーズフリー手法と比較して,前方および大規模の複雑なデータセット上でより堅牢な性能を実現する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:56:41 GMT)
Fast Rate Bounds for Multi-Task and Meta-Learning with Different Sample Sizes [21.9] マルチタスクとメタ学習のための高速なPAC-Bayesian一般化バウンダリを提案する。
我々の新しい境界は数値計算可能であり、解釈可能である。
我々は、バランスの取れない状況が2つの意味のあるマルチタスクリスクの定義を可能にするという事実に光を当てた。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:22:36 GMT)
Cohort Discovery: A Survey on LLM-Assisted Clinical Trial Recruitment [21.8] 我々は,臨床治験採用における臨床患者マッチングの課題を初めて分析し,新たなLCMベースのアプローチを文脈的に分析する。
既存のベンチマーク、アプローチ、評価フレームワークについて批判的に検討する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:59:03 GMT)
How Pragmatics Shape Articulation: A Computational Case Study in STEM ASL Discourse [21.7] 本研究では,手話技術における手話の表現と手話の表現について検討する。
本研究は,言語解析と計算モデルを用いて,手話技術における語形表現とその表現について理解する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:29:46 GMT)
On the Anisotropy of Score-Based Generative Models [21.6] Score Anisotropy Directions (SAD)を導入し、異なるネットワークがデータ構造を優先的にキャプチャする方法を明らかにする。
我々の研究は、生成モデルの方向性バイアスの説明と予測のための新しいレンズを提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:01:41 GMT)
MAP4TS: A Multi-Aspect Prompting Framework for Time-Series Forecasting with Large Language Models [21.6] MAP4TSは、古典的な時系列分析をプロンプト設計に明示的に組み込んだ、新しいマルチアスペクト・プロンプトフレームワークである。
我々のフレームワークでは、データセットレベルのコンテキストを伝達するGlobal Domain Prompt、最近のトレンドとシリーズ固有の振る舞いをエンコードするLocal Domain Prompt、手作りの洞察を埋め込む統計的および時間的Promptという4つの特別なプロンプトコンポーネントを導入しています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:51:54 GMT)
AirFed: Federated Graph-Enhanced Multi-Agent Reinforcement Learning for Multi-UAV Cooperative Mobile Edge Computing [21.5] 複数の無人航空機(UAV)協調移動エッジコンピューティング(MEC)システムは、軌道計画、タスクオフロード、リソース割り当ての調整において重要な課題に直面している。
既存のアプローチは、スケーラビリティの制限、収束の遅さ、UAV間の非効率な知識共有に悩まされている。
本稿では,新しい多エージェント強化学習フレームワークであるAirFedを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:31:35 GMT)
LoongRL: Reinforcement Learning for Advanced Reasoning over Long Contexts [21.1] より進んだ長文推論のためのデータ駆動型RL法であるLoongRLを紹介する。
KeyChainは、短いマルチホップQAを高微分長文タスクに変換する合成手法である。
Qwen2.5-7Bと14Bでは、LongRLは長文マルチホップQAの精度を+23.5%、+21.1%向上させる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:55:12 GMT)
On the Stability of Graph Convolutional Neural Networks: A Probabilistic Perspective [21.0] グラフトポロジにおける摂動がGCNN出力に与える影響について検討し,モデル安定性解析のための新しい定式化を提案する。
最悪の場合の摂動のみに焦点を当てた従来の研究とは異なり、分布認識の定式化は幅広い入力データにまたがる出力摂動を特徴付ける。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:20:28 GMT)
MMTutorBench: The First Multimodal Benchmark for AI Math Tutoring [21.0] MMTutorBenchはAI数学チューターの最初のベンチマークである。
重要なキーステップを中心に構築された685の問題で構成されている。
各問題は、6次元にわたるきめ細かい評価を可能にする問題固有のルーリックと組み合わせられる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:11:49 GMT)
Capture, Canonicalize, Splat: Zero-Shot 3D Gaussian Avatars from Unstructured Phone Images [20.9] キャプチャー、カノニカライズ、Splat」パイプラインは、非構造化写真から魅力的な現実主義と堅牢なアイデンティティ保存を備えた静的四角形アバターを生産する。
この"Capture, Canonicalize, Splat"パイプラインは、非構造化写真から魅力的な現実主義と堅牢なアイデンティティ保存を備えた静的な四角形アバターを生成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:30:00 GMT)
Generalization Bounds for Robust Contrastive Learning: From Theory to Practice [20.8] 教師なし学習のどの要素が、教師なし学習の堅牢な損失を改善するのに役立つかを特定する理論を開発する。
対向的な対照的な損失に加えて、良性のあるものは、良性と対向的な例のグローバルなばらつきと共に、堅牢性も向上する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:48:43 GMT)
GRE Suite: Geo-localization Inference via Fine-Tuned Vision-Language Models and Enhanced Reasoning Chains [20.8] Geo Reason Enhancement (GRE) Suiteは、解釈可能な位置推論のための構造化推論チェーンを備えたビジュアル言語モデルを拡張する新しいフレームワークである。
まず、GRE30Kという、きめ細かい視覚的・文脈的分析を容易にするために設計された高品質なジオローカライゼーション推論データセットを紹介する。
次に,シーン属性,局所的詳細,意味的特徴を段階的に推測する多段階推論手法を用いて,GREモデルを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:39:19 GMT)
Understanding Fairness and Prediction Error through Subspace Decomposition and Influence Analysis [20.4] 本稿では,データ表現を調整し,予測ユーティリティと公正性のバランスをとるためのフレームワークを提案する。
本稿では,共有部分空間が付加されるにつれて,予測誤差と公平性ギャップがどのように進化するかを理論的に分析する。
提案手法は, 予測性能を維持しつつ, 公平性を効果的に向上することを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:38:00 GMT)
Bid2X: Revealing Dynamics of Bidding Environment in Online Advertising from A Foundation Model Lens [20.4] 本稿では,この基本関数を様々なシナリオのデータから学習するために,入札基盤モデルBid2Xを提案する。
私たちのモデルは、世界最大のeコマースプラットフォームであるTaobaoの広告プラットフォームにデプロイされています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:15:01 GMT)
Positional Preservation Embedding for Multimodal Large Language Models [20.3] マルチモーダル言語モデル(LMLM)は視覚言語タスクにおいて高い性能を達成しているが、冗長な視覚トークンによってしばしば非効率に悩まされている。
本研究では,トークン圧縮時の空間保存構造を新規に符号化する手法を提案する。
PPEは、プログレッシブトークン圧縮戦略であるクラスタリングを効果的にサポートし、パフォーマンスの維持を向上できることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:40:02 GMT)
Improving Visual Discriminability of CLIP for Training-Free Open-Vocabulary Semantic Segmentation [20.3] LHT-CLIPは、レイヤ、ヘッド、トークンレベルのCLIPの視覚的識別性を活用する、トレーニング不要のフレームワークである。
さまざまなシナリオにまたがって最先端のパフォーマンスを実現し、実際のデプロイメントの有効性と実用性を強調している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:05:08 GMT)
Debiasing Reward Models by Representation Learning with Guarantees [20.2] 本稿では,報酬モデルにおける素早い相関問題を緩和する原理的枠組みを提案する。
本研究では, 余剰潜伏変数のサロゲートが利用できるかどうかに関わらず, 理論上はデータから非純粋潜伏変数を識別可能であることを示す。
合成および実世界のデータセットに関する実験により、我々の手法は効果的な相関問題を緩和し、より堅牢な報酬モデルが得られることを示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:37:57 GMT)
Video-Thinker: Sparking "Thinking with Videos" via Reinforcement Learning [20.1] Video-Thinkerを使えば、MLLMはビデオ推論のためのグラウンドやキャプションタスクを自律的にナビゲートできる。
我々のVideo-Thinker-7Bは、Video-R1のような既存のベースラインを大幅に上回り、7BサイズのMLLMの最先端性能を確立します。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:10:45 GMT)
When No Paths Lead to Rome: Benchmarking Systematic Neural Relational Reasoning [20.0] NoRAは、いくつかのレベルの難易度を追加し、パスベースの推論を超えるモデルを必要とする新しいベンチマークである。
ニューラルネットワークを用いた体系的リレーショナル推論の分野において,NoRAがさらなる進歩をサポートする方法を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:09:16 GMT)
GTR-Mamba: Geometry-to-Tangent Routing for Hyperbolic POI Recommendation [19.9] GTR-Mambaはクロスマニフォールドコンディショニングとルーティングのための新しいフレームワークである。
これは、次のPOIレコメンデーションにおいて、最先端のベースラインモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:56:08 GMT)
Rate-optimal Design for Anytime Best Arm Identification [19.8] 目的は、限られたサンプリング予算の下で、一組のKドルアームから、最も高い平均報酬で腕を識別することである。
この問題はA/Bテストのような多くの実践シナリオをモデル化する。
この問題に対するアルゴリズムのクラスを考えるが、これは定数係数まで確実に最小限のアルゴリズムである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:36:56 GMT)
BTL-UI: Blink-Think-Link Reasoning Model for GUI Agent [19.8] リンクシンクリンク(Blink-Think-Link)は、人間のGUIインタラクションのための脳に触発されたフレームワークである。
このシステムは相互作用を3つの生物学的にもっともらしい相に分解する。
Blink Data GenerationとBTL Rewardは、プロセスと結果の両方によって駆動される強化学習を可能にする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:34:58 GMT)
CausalPFN: Amortized Causal Effect Estimation via In-Context Learning [19.5] CausalPFNは、ボックスから新しい観測データセットに因果効果を推測する。
提案手法は,不均一および平均処理効果評価ベンチマークにおいて,優れた平均性能を実現する。
CausalPFNはベイズ原理に基づく信頼性の高い意思決定を支援するために、校正された不確実性推定を提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:38:29 GMT)
SwiftTS: A Swift Selection Framework for Time Series Pre-trained Models via Multi-task Meta-Learning [19.4] 時系列事前学習モデルの迅速な選択フレームワークである textbfSwiftTS を提案する。
軽量なデュアルエンコーダアーキテクチャを採用し、時系列と候補モデルにリッチな特徴を組み込む。
SwiftTSは、時系列事前訓練モデル選択における最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:26:45 GMT)
Hazard-Responsive Digital Twin for Climate-Driven Urban Resilience and Equity [19.4] 本稿では,物理インフォームドニューラルネットワークモデリング,マルチモーダルデータ融合,プリエンプティブとエクイティ対応リスク分析を組み合わせたH-RDT(Hazard-Responsive Digital Twin)を提案する。
多様な建築様式と人口を持つ合成地区において, シミュレーションされた山火事・停電・熱波カスケードは, H-RDTが室内温度を安定的に予測することを示す。
冷却中心活性化やマイクログリッド共有といった介入は、人口重み付け熱リスクを11~13%減らし、95%(テール)リスクを7~17%減らし、過熱時間を最大17%減らした。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:55:09 GMT)
Planning Ahead with RSA: Efficient Signalling in Dynamic Environments by Projecting User Awareness across Future Timesteps [19.2] 本稿では,Rational Speech Act (RSA) を用いた適応型シグナリングの理論的枠組みを提案する。
この有効性は、マルチステップ計画と現実的なユーザ認識モデルの組み合わせに大きく依存していることが示される。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:54:54 GMT)
Noise Diffusion for Enhancing Semantic Faithfulness in Text-to-Image Synthesis [19.1] 本稿では,大規模視覚言語モデルの言語理解能力を活用して,初期雑音ラテントの最適化を導くことを提案する。
本研究では,ノイズ拡散プロセスを導入し,雑音を更新し,分布の整合性を保ちながら意味的に忠実な画像を生成する。
実験により,様々な拡散モデル間のセマンティックアライメントを一貫して強化し,本フレームワークの有効性と適応性を示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:31:22 GMT)
Estimating Pasture Biomass from Top-View Images: A Dataset for Precision Agriculture [19.1] オーストラリアの19か所で収集された牧草地の1,162点の注釈付きトップビュー画像の包括的データセットを提示する。
それぞれの画像は70cm×30cmの四角形を撮影し、バイオマスを成分(緑、死、小豆分画)、植生の高さ、アクティブ光学センサー(AOS)からの正規化差分植生指数(NDVI)で分類する。
データセットはKaggleコンペティションでリリースされ、牧草地バイオマス推定のタスクで国際的な機械学習コミュニティに挑戦する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:35:00 GMT)
GVPO: Group Variance Policy Optimization for Large Language Model Post-Training [19.0] 群変数ポリシー最適化(GVPO)は、KL制約された報酬を直接重みに含める分析解である。
GVPOには2つの大きな利点がある: ユニークな最適解、正確にはKL制約の報酬目的、および柔軟なサンプリング分布をサポートする。
GVPOは、理論的な保証を実用的適応性で統一することにより、信頼性と汎用性を備えたLLMポストトレーニングのための新しいパラダイムを確立する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:30:01 GMT)
Universal Relations in Long-range Quantum Spin Chains [19.0] 量子多体系の異なるクラスに普遍的関係が現れることを示す。
実効場理論と作用素積展開を用いて、等時スピン相関関数の挙動間の関係を確立する。
我々の結果は、最先端のトラップイオンシステムで容易にテストできる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:16:10 GMT)
Retracing the Past: LLMs Emit Training Data When They Get Lost [18.9] 大規模言語モデルにおけるトレーニングデータの記憶は、プライバシーと著作権に関する重大な懸念を生じさせる。
本稿では,記憶されたデータを抽出するための基本的枠組みであるCIAについて紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:48:24 GMT)
Accelerating IC Thermal Simulation Data Generation via Block Krylov and Operator Action [18.6] BlocKOAは、様々な物理パラメータとIC構造を持つ5000チップの熱シミュレーションデータを生成する際に、420倍のスピードアップを達成する。
生成時間のわずか4%であっても、BlocKOAが生成したデータに基づいてトレーニングされたデータ駆動アプローチは、既存のメソッドと同等のパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:16:45 GMT)
Efficient Resource-Constrained Training of Vision Transformers via Subspace Optimization [18.5] Weight-Activation Subspace Iteration (WASI)は、バックプロパゲーションのメモリボトルネックを軽減する方法である。
Raspberry Pi 5では、WASIはバニラトレーニングよりも高速なトレーニングと推論を実現している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:24:49 GMT)
Can Language Models Compose Skills In-Context? [18.5] 合成タスクを実行するための言語モデルのコンテキスト内合成能力について検討する。
単純なタスクの例は、パフォーマンスに驚くほど悪い影響を与えます。
例を、その構成の対応するステップと整合させることが不可欠である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:18:59 GMT)
EndoWave: Rational-Wavelet 4D Gaussian Splatting for Endoscopic Reconstruction [18.4] 内視鏡的シナリオでは、光学的不整合、非剛性組織の動き、ビュー依存ハイライトなど、ユニークな課題が提示される。
3DGSをベースとしたほとんどの手法は、3DGSを最適化するための外観制約のみに依存するが、この文脈では不十分であることが多い。
本稿では,光学フローに基づく幾何制約と多分解能有理ウェーブレット監視を組み込んだEdoWaveを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:45:17 GMT)
Detect Any Sound: Open-Vocabulary Sound Event Detection with Multi-Modal Queries [18.1] マルチモーダルクエリによってガイドされるオープン語彙SEDのための問合せベースのフレームワークを提案する。
DASMはSEDをフレームレベルの検索タスクとして定式化し、音声機能はテキストやオーディオプロンプトからのクエリベクトルと一致している。
DASMは、局所化精度と新しいクラスへの一般化のバランスを効果的に保ち、オープン語彙設定においてCLAPベースの手法より優れている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:55:48 GMT)
LinearRAG: Linear Graph Retrieval Augmented Generation on Large-scale Corpora [17.9] Retrieval-Augmented Generation (RAG) は大規模言語モデル(LLM)の幻覚を軽減するために広く用いられている。
既存のグラフベースのRAG法は、グラフ構築のための不安定でコストのかかる関係抽出に依存している。
信頼性の高いグラフ構築と正確な経路抽出を可能にする効率的なフレームワークであるLinearRAGを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:29:26 GMT)
SBEST: Spectrum-Based Fault Localization Without Fault-Triggering Tests [17.9] 本研究は, 事故報告から得られたスタックトレースを, スペクトルベース断層定位における故障トリガー試験のプロキシとして用いる可能性について検討した。
本稿では,スタックトレース情報とテストカバレッジデータを統合する新たな手法であるSBESTを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:01:49 GMT)
Covering Multiple Objectives with a Small Set of Solutions Using Bayesian Optimization [17.4] この問題のモチベーションの例としては、薬物設計が挙げられる。
我々は、カバレッジ最適化のためのBOアルゴリズムであるMOCOBO(Multi-Objective Coverage Bayesian Optimization)を開発した。
その結果,MOCOBOが発見する$K T$ソリューションのカバレッジは,各目的を個別に最適化して得られる$T$ソリューションのカバレッジとほぼ一致していることがわかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:59:24 GMT)
PAHQ: Accelerating Automated Circuit Discovery through Mixed-Precision Inference Optimization [17.3] サーキットディスカバリー(ACDC)は、サーキットディスカバリーにおける重要な方法論として登場した。
しかし、その大規模言語モデルへの適用は、計算の非効率さと極めて高いメモリ要求によって著しく制限されている。
提案手法は,各パッチ処理の効率を最適化し,本手法を根本的に異なるアプローチで提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:24:14 GMT)
Local Learning for Covariate Selection in Nonparametric Causal Effect Estimation with Latent Variables [17.2] 非実験データから因果効果を推定することは、科学の多くの分野における根本的な問題である。
非パラメトリック因果効果推定における共変量選択のための新しい局所学習手法を提案する。
我々は、合成データと実世界のデータの両方に関する広範な実験を通じて、アルゴリズムを検証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:57:07 GMT)
DBLoss: Decomposition-based Loss Function for Time Series Forecasting [17.0] 本稿では,DBLoss と呼ばれる単純な分割型ロス関数を提案する。
一般的な損失関数として、DBLossはあらゆるディープラーニング予測モデルと組み合わせることができる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:42:25 GMT)
Eigen-Value: Efficient Domain-Robust Data Valuation via Eigenvalue-Based Approach [16.9] 我々は,OODロバストネスのためのプラグアンドプレイデータアセスメントフレームワークであるEmphEigen-Value (EV)を紹介した。
EVは、IDとOODの間の損失のギャップであるドメインの差を新しいスペクトルで近似する。
EVは、計算的に軽量なまま、現実世界のデータセット間でのOOD堅牢性と安定した価値ランキングの改善を実現している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:12:49 GMT)
On Generalization in Agentic Tool Calling: CoreThink Agentic Reasoner and MAVEN Dataset [16.9] エージェントツールコール環境間の一般化は、信頼できる推論システムを開発する上で重要な未解決課題である。
本稿では、構造化分解と適応ツールオーケストレーションのための軽量なシンボリック推論層を用いて、大規模言語モデルを強化するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:58:48 GMT)
From Perceived Effectiveness to Measured Impact: Identity-Aware Evaluation of Automated Counter-Stereotypes [16.8] ソーシャルメディア上での性別バイアスに対する反ステレオタイプの自動生成の効果について検討した。
従来研究で最も有効な候補として認識されてきた2つの対テロタイプ戦略(反事実と普遍性の拡大)を評価した。
以上の結果から,実効性は認識された有効性と一致せず,前者は人口集団間で曖昧であり,時として相違する現象であることが明らかとなった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:02:04 GMT)
Shortcuts and Identifiability in Concept-based Models from a Neuro-Symbolic Lens [16.8] 概念ベースモデル(concept-based Model)は、入力を高レベルな概念にマッピングする概念抽出器と、これらを予測に変換する推論層を学習するニューラルネットワークである。
概念ベースモデルと推論ショートカット(RS)の新たな接続を確立することでこの問題を研究する。
実験の結果は、RSの影響を浮き彫りにし、既存の手法と複数の自然緩和戦略が組み合わさっても、実際にこれらの条件を満たせない場合が多いことを示している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:13:03 GMT)
Multi-Agent Conditional Diffusion Model with Mean Field Communication as Wireless Resource Allocation Planner [16.8] 無線通信システムでは、QoS(Quality of Service)の強化において、効率的かつ適応的なリソース割り当てが重要な役割を担っている。
対照的に、分散トレーニングと分散実行(DTDE)パラダイムは、分散学習と意思決定を可能にする。
分散通信資源管理のためのマルチエージェント条件拡散モデルプランナ(MACDMP)を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:42:18 GMT)
MUStReason: A Benchmark for Diagnosing Pragmatic Reasoning in Video-LMs for Multimodal Sarcasm Detection [16.7] VideoLMは、サルカズム検出のような複雑なタスクに苦労する。
MUStReasonは、モダリティ固有の関連キューのアノテーションが豊富な診断ベンチマークである。
PragCoT は VideoLM を利用して,文字通りの意味よりも暗黙の意図に焦点をあてるフレームワークである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:03:11 GMT)
MCPGuard : Automatically Detecting Vulnerabilities in MCP Servers [16.6] Model Context Protocol(MCP)は、LLM(Large Language Models)と外部データソースとツールのシームレスな統合を可能にする標準化されたインターフェースとして登場した。
本稿では,3つの主要な脅威カテゴリを識別し,MCPベースのシステムのセキュリティ状況を体系的に解析する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:12:51 GMT)
AI based signage classification for linguistic landscape studies [16.4] 本研究では,Linguistic Landscape (LL) 解析におけるAIを用いた言語検出手法について検討する。
我々は、研究者が収集した1,449枚の画像のジオレファレンス写真データセットを構築し、光学文字認識(OCR)と言語分類にAIを適用した。
この分析によると、AIモデルは画像のすべての領域を等しく扱い、人間の通訳が無視する周辺または背景のテキストを検出する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:23:04 GMT)
UGAE: Unified Geometry and Attribute Enhancement for G-PCC Compressed Point Clouds [16.1] 統合幾何および属性拡張フレームワークを提案する。
ポストジオメトリエンハンスメント(PoGE)、プレアトリビュートエンハンスメント(PAE)、ポストアトリビュートエンハンスメント(PoAE)の3つのコアコンポーネントで構成されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:01:57 GMT)
Less is More: Local Intrinsic Dimensions of Contextual Language Models [15.9] 本研究では,テクスチュアな埋め込みの幾何学的特性に基づく新しい視点を導入し,トレーニングと微調整の効果について検討する。
局所的な次元はモデルのトレーニング力学と一般化能力に関する洞察を与える。
実験では, 平均局所次元の減少が伴う傾向にあり, その後のパフォーマンス向上が予測される傾向がある。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:17:17 GMT)
FALCON: An ML Framework for Fully Automated Layout-Constrained Analog Circuit Design [15.5] 本稿では、仕様駆動アナログ回路合成を可能にする統合機械学習フレームワークであるFALCONを紹介する。
FALCONはまず、人間設計でガイドされた性能駆動型分類器を用いて、適切な回路トポロジーを選択する。
次に、独自のエッジ中心グラフニューラルネットワークを使用して、回路トポロジとパラメータをパフォーマンスにマップする。
この推論は、分析方程式の寄生的および周波数依存的な効果から導かれる、異なるレイアウトコストで導かれ、設計規則によって制約される。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:42:49 GMT)
CXReasonBench: A Benchmark for Evaluating Structured Diagnostic Reasoning in Chest X-rays [15.5] 我々はCheXStructとCXReasonBenchを紹介した。CheXStructはMIMIC-CXR-JPGデータセット上に構築された構造化パイプラインとベンチマークである。
CheXStructは、自動的に胸部X線から直接中間的推論ステップを導出する。
CXReasonBenchはこのパイプラインを利用して、モデルが臨床的に有効な推論ステップを実行可能であるかどうかを評価する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:45:34 GMT)
Learning to Better Search with Language Models via Guided Reinforced Self-Training [15.3] 本稿では,推論中の効果的な探索能力を向上させるためのガイド付き自己学習(Guided-ReST)を提案する。
Guided-ReSTは最適解をモデルの探索手順に組み込んで、高品質な探索トレースを生成する。
本手法は,算術的推論や自己修復作業における言語モデルの探索能力を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:46:45 GMT)
TaoSR1: The Thinking Model for E-commerce Relevance Search [15.1] BERTベースのモデルはセマンティックマッチングが優れているが、複雑な推論能力がない。
本稿では,このタスクのために大規模言語モデルを直接デプロイするフレームワークを提案する。このフレームワークは,CoT(Chain-of-Thought)エラーの蓄積,差別的幻覚,デプロイメント実現可能性など,主要な課題に対処する。
筆者らのフレームワークであるTaoSR1は,(1)CoTを用いた教師付ファインチューニング(SFT),(2)パス@N戦略によるオフラインサンプリングとDPOによる生成品質向上,(3)グループ相対政策最適化(GRPO)による難易度に基づく動的サンプリングの3段階からなる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:03:18 GMT)
DQ3D: Depth-guided Query for Transformer-Based 3D Object Detection in Traffic Scenarios [15.1] 深度誘導型3次元オブジェクト検出用クエリジェネレータ(DQ3D)を提案する。
平均精度(mAP)が6.3%,NuScenes Detection Score(NDS)が4.3%向上した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:20:59 GMT)
T-REGS: Minimum Spanning Tree Regularization for Self-Supervised Learning [15.0] 自己教師付き学習(SSL)はラベル付きデータなしで表現を学習するための強力なパラダイムとして登場した。
最近の研究は、効果的な表現のための2つの重要な性質を強調している。
本稿では,学習表現上の最小スパンニングツリー(MST)の長さに基づくSSLのシンプルな正規化フレームワークであるT-REGSを紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:16:40 GMT)
Inferring Group Intent as a Cooperative Game. An NLP-based Framework for Trajectory Analysis using Graph Transformer Neural Network [14.9] NLPをベースとした生成モデルを用いた協調ゲームの結果として,グループ目標軌道意図について研究した。
本フレームワークでは,グループ意図を協調ゲームの特徴関数によってモデル化する。
グラフトランスフォーマーニューラルネットワーク(GTNN)を用いて,協調ゲームの特徴関数として表現された群軌道を推定する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:23:53 GMT)
Unified Sparse Mixture of Experts [14.8] SMOE(Sparse Mixture of Experts)モデルは、一定の計算オーバーヘッドを維持しながら、モデルのキャパシティをスケールする。
本稿では,これらの制約に対処する統一スパース・ミックス・オブ・エキスパート(USMoE)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:51:10 GMT)
Beyond Understanding: Evaluating the Pragmatic Gap in LLMs' Cultural Processing of Figurative Language [14.7] 我々は、文化的基盤言語を処理するために、大規模言語モデル(LLM)を評価する。
我々は、文脈理解、実践的使用、解釈のための評価タスクを設計する。
Kinayatはエジプトのアラビア語のイディオムの最初のデータセットで、比喩的理解と実用的利用の評価の両方のために設計されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:13:32 GMT)
Image-Plane Geometric Decoding for View-Invariant Indoor Scene Reconstruction [14.7] ボリュームベースの屋内シーン再構築手法は、より優れた一般化能力とリアルタイムな展開可能性を提供する。
既存の手法では、空間的位置を決定するのに弱い幾何学的制約として、マルチビューのバックプロジェクション線交叉に依存している。
本稿では,画素レベルの信頼度,アフィン補償モジュール,イメージプレーン空間デコーダの3つのコアコンポーネントからなる画像平面デコードフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:03:38 GMT)
Topology Sculptor, Shape Refiner: Discrete Diffusion Model for High-Fidelity 3D Meshes Generation [14.6] Topology Sculptor, Shape Refiner (TSSR)は、高品質なアーティストスタイルの3Dメッシュを生成する新しい方法である。
この並列生成能力は,3つの重要なイノベーションを通じて活用しています。
複雑なデータセットの実験は、TSSRが高品質な3Dアーティストスタイルのメッシュを生成することを示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:38:35 GMT)
Agentic AI Security: Threats, Defenses, Evaluation, and Open Challenges [14.5] 大規模言語モデル(LLM)を利用したエージェントAIシステムは、自動化のための強力で柔軟なプラットフォームとして出現している。
ウェブ、ソフトウェア、物理的な環境にまたがってタスクを自律的に実行する能力は、新しい、そして増幅されたセキュリティリスクを生み出します。
この調査はエージェントAI特有の脅威の分類を概説し、最近のベンチマークと評価手法をレビューし、防衛戦略について議論する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:48:11 GMT)
FaceCloak: Learning to Protect Face Templates [14.5] 我々は、スマートで再生可能なバイナリクロークを生成することによって、顔テンプレートを保護するニューラルネットワークフレームワークであるtextscFaceCloakを紹介する。
textscFaceCloak-based matching is very fast (inference time =0.28 ms) and light (0.57 MB)
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:41:08 GMT)
A PDE-Informed Latent Diffusion Model for 2-m Temperature Downscaling [14.5] 本研究は,大気データの動的ダウンスケーリングに適した物理条件付き潜在拡散モデルを提案する。
既存の拡散アーキテクチャに基づいて、モデルの学習目標に偏微分方程式(PDE)損失項を統合する。
この追加損失による微調整がモデルをさらに規則化し、生成したフィールドの物理的妥当性を高めるかを検討する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:17:03 GMT)
From Prompt Optimization to Multi-Dimensional Credibility Evaluation: Enhancing Trustworthiness of Chinese LLM-Generated Liver MRI Reports [14.4] 大言語モデル (LLM) は画像所見から診断結果を生成する上で有望な性能を示した。
本研究は, MDCA (Multi-dimensional Credibility Assessment) フレームワークの導入により, LLM産生肝MRIの信頼性を高めることを目的とする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:57:20 GMT)
Sublinear Sketches for Approximate Nearest Neighbor and Kernel Density Estimation [14.4] 動的データストリームに対して,ANNとA-KDEの両方に対して,サブ線形空間とクエリ時間保証を実現する新しいスケッチアルゴリズムを開発した。
提案手法は,サブ線形クエリ時間,バッチクエリをサポートし,より一般的なTurnstileモデルに拡張する。
Sliding-WindowモデルにおけるA-KDEに対して、$mathcalOleft(RW cdot frac1sqrt1+epsilon - 1 log2 Nright)$のスケッチを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:05:45 GMT)
Constrained Entropic Unlearning: A Primal-Dual Framework for Large Language Models [14.3] 大規模言語モデル(LLM)が現実の環境でデプロイされるようになると、機密性、時代遅れ、あるいはプロプライエタリな情報を漏らさなくてはならなくなる。
既存の未学習の手法は、忘れと保持を規則化されたトレードオフとして定式化し、両方の目的を1つのスカラー化された損失に組み合わせる。
制約付き最適化問題として,LLMアンラーニングの新たな定式化を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:59:13 GMT)
CMIE: Combining MLLM Insights with External Evidence for Explainable Out-of-Context Misinformation Detection [14.1] 本稿では,OOC誤報を検出するための新しいフレームワークであるCMIEを提案する。
CMIEは、画像とテキスト間の基盤的共存を特定し、関連する証拠を選択的に利用して誤情報検出を強化する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:39:35 GMT)
Effortless, Simulation-Efficient Bayesian Inference using Tabular Foundation Models [14.1] 本研究では,TabPFNをSBIの自己回帰条件密度推定器として用いる方法を示す。
NPE-PFNは、推論ネットワークの選択、トレーニング、ハイパーパラメータチューニングの必要性を排除する。
モデルミス特定に優れたロバスト性を示し、TabPFNのコンテキストサイズ限界を超えるシミュレーション予算にスケールできる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:14:05 GMT)
TRELLISWorld: Training-Free World Generation from Object Generators [14.0] テキスト駆動の3Dシーン生成は、仮想プロトタイピングからAR/VR、シミュレーションまで、幅広いアプリケーションに対して約束されている。
既存のメソッドは、多くの場合、単一オブジェクトの生成、ドメイン固有のトレーニング、あるいは完全な360度ビュービリティのサポートの欠如に制約される。
汎用テキストから3Dオブジェクトへの拡散モデルをモジュラータイルジェネレータとして再利用することで,3次元シーン合成のトレーニング不要な手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:40:31 GMT)
Grassmanian Interpolation of Low-Pass Graph Filters: Theory and Applications [13.8] 低域グラフフィルタは、グラフやその他の非ユークリッド領域における信号処理の基本である。
グラスマン多様体上の正規座標におけるリーマン座標に基づく低域グラフフィルタの新しいアルゴリズムを提案する。
ノードの特徴の時間的進化は、ネットワークのホモフィリ次数を調整するために類似性補正によって、進化するグラフに変換される可能性があると論じる。
第2に、与えられた静的グラフによって誘導されるドット積グラフファミリを提案し、フィルタトポロジによって促進されるノード分類のための改良されたメッセージパッシングスキームを推論する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:40:14 GMT)
PlanarGS: High-Fidelity Indoor 3D Gaussian Splatting Guided by Vision-Language Planar Priors [13.8] PlanarGSは屋内シーンの再構築に適した3DGSベースのフレームワークである。
PlanarGSは正確で詳細な3D表面を再構築し、常に最先端の手法を大きなマージンで上回っている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:32:19 GMT)
Online POMDP Planning with Anytime Deterministic Optimality Guarantees [13.8] 近似解と最適解の間の離散POMDPに対する決定論的関係を導出する。
我々の導出は、新しいアルゴリズムセットの道を提供し、既存のアルゴリズムにアタッチできることを示します。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:41:37 GMT)
GeoClip: Geometry-Aware Clipping for Differentially Private SGD [13.4] 個人差分勾配降下(DP-SGD)の鍵となる課題は、サンプルごとの勾配クリッピング閾値を設定することである。
そこで我々はGeoClipを提案する。GeoClipは、勾配分布の幾何学と整合した変換ベースで勾配をクリップし、摂動する幾何学的フレームワークである。
我々はGeoClipの収束保証を提供し、勾配クリッピングの確率を制御下に保ちながら付加される雑音の量を最小限に抑える最適変換のための閉形式解を導出する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:00:10 GMT)
MAD-Fact: A Multi-Agent Debate Framework for Long-Form Factuality Evaluation in LLMs [13.4] LLM(Large Language Models)の普及により、アウトプットの実際の正確性に関する重要な懸念が持ち上がる。
既存の短いテキストの評価手法は、複雑な推論連鎖、絡み合った視点、累積的な情報によって、長文コンテンツでは失敗することが多い。
本稿では,大規模長文データセット,マルチエージェント検証機構,重み付け評価指標を組み合わせた体系的アプローチを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:41:32 GMT)
Incomplete Multi-view Clustering via Hierarchical Semantic Alignment and Cooperative Completion [13.4] 本稿では,階層的セマンティックアライメントと協調補完(HSACC)に基づく,新しい不完全なマルチビュークラスタリングフレームワークを提案する。
HSACCはデュアルレベルのセマンティック空間設計により、堅牢なクロスビュー融合を実現する。
実験の結果、HSACCは5つのベンチマークデータセットで最先端の手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:20:35 GMT)
Adaptive Blockwise Search: Inference-Time Alignment for Large Language Models [13.4] インタイム法は微調整の柔軟な代替手段を提供するが、その一様計算の努力は、しばしば準最適アライメントをもたらす。
本稿では,ブロックワイズ検索の新たな戦略であるAdaSearchを紹介する。
サンプリングスケジュールを用いて、固定された計算予算を適応的に割り当て、クリティカルトークンに探索努力を集中させる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:48:59 GMT)
IPQA: A Benchmark for Core Intent Identification in Personalized Question Answering [13.3] 情報ニーズを満たすために回答を選択する際にユーザが優先する意図という,中核的な意図の概念を紹介します。
ユーザが明示的に意図を述べないため、回答の選択において観測可能な行動パターンから中心的な意図を導き出す。
我々は、体系的なフィルタリング、LCMベースのアノテーション、厳密な品質管理を通じて、様々なドメインでデータセットを構築する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:12:49 GMT)
A Novel Framework for Multi-Modal Protein Representation Learning [13.3] 2つのコア機構に対処する統合フレームワークであるDAMPE(Diffused and Aligned Multi-modal Protein Embedding)を提案する。
まず、異なるモードの内在的な埋め込み空間間の対応性を確立するための最適輸送(OT)に基づく表現アライメントを提案する。
次に,条件付きグラフ生成(CGG)に基づく情報融合手法を開発した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:33:01 GMT)
PISA-Bench: The PISA Index as a Multilingual and Multimodal Metric for the Evaluation of Vision-Language Models [13.3] PISA-Benchは、専門家が作成したPISAテストの英語の例から得られたベンチマークである。
それぞれの例は、人間によって抽出された指示、質問、回答オプション、および質問タイプカテゴリに富んだ画像で構成されている。
PISA-Bench上での最先端のビジョン言語モデルの評価を行い、特に小さなモデル(20Bパラメータ)では高いテストスコアが得られないことを見出した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:00:45 GMT)
Context Engineering for AI Agents in Open-Source Software [13.2] GenAIベースのコーディングアシスタントは、ソフトウェア開発を混乱させた。
彼らの次の世代はエージェントベースで、より自律的で、潜在的には人間の監視なしで活動する。
ひとつの課題は、AIエージェントに対して、彼らが運用するソフトウェアプロジェクトに関する十分なコンテキストを提供することだ。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:53:34 GMT)
Topology-Preserving Image Segmentation with Spatial-Aware Persistent Feature Matching [13.2] 生体画像における管状構造の分断にはトポロジカルな正しさが重要である。
本稿では,効率的な空間認識型トポロジカルロス関数を提案する。
各種管状構造物の画像に対する実験により,提案手法が優れた性能を示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:59:21 GMT)
Informed Initialization for Bayesian Optimization and Active Learning [13.1] 本稿では,情報理論の原理を用いたハイパーパラメータ学習と予測不確実性低減のバランスをとる新しい獲得戦略を提案する。
本研究は,アクティブラーニングと数発のBOの広範な実験を通して,その効果を実証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:05:12 GMT)
QueryIPI: Query-agnostic Indirect Prompt Injection on Coding Agents [13.1] コーディングエージェントのための最初のクエリ非依存IPI手法であるQueryIPIを提案する。
リークされた内部プロンプトによって通知される反復的かつプロンプトベースのプロセスを通じて、悪意のあるツール記述を洗練する。
5つのシミュレーションエージェントの実験は、QueryIPIが最大で87%の成功を達成していることを示している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:04:08 GMT)
Estimating LLM Consistency: A User Baseline vs Surrogate Metrics [13.0] 大型言語モデル(LLM)は幻覚や敏感な摂動を引き起こす傾向がある。
本稿では,LLMの一貫性を推定するためのロジットに基づくアンサンブル手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:42:01 GMT)
Towards a Generalizable AI for Materials Discovery: Validation through Immersion Coolant Screening [13.0] GATEは、熱、電気、機械、光学の領域にまたがる34の物理化学的性質を学習する、一般化可能なAIフレームワークである。
Gateは92,861個の分子を実用的な展開に期待している。
4 は試験的にもリテラル的にも検証され、湿式測定と商業冷媒に匹敵する性能と強い一致を示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:21:05 GMT)
A Training-Free Framework for Open-Vocabulary Image Segmentation and Recognition with EfficientNet and CLIP [13.0] 本稿では,オープンボキャブラリ画像セグメンテーションとオブジェクト認識のための新しい学習自由フレームワークを提案する。
教師なしセグメンテーションには畳み込みニューラルネットワークであるEfficientNetB0を使用し、オープン語彙オブジェクト認識には視覚言語モデルであるCLIPを使用している。
ハンガリーのmIoU、精度、リコール、F1スコアで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:16:09 GMT)
RefleXGen:The unexamined code is not worth using [12.9] RefleXGenは、大規模言語モデル(LLM)に固有の自己回帰メカニズムをガイドしたRAG(Retrieval-Augmented Generation)技術を統合することで、コードのセキュリティを大幅に向上する革新的な方法である。
本研究は,AI生成コードのセキュリティを強化する上で,モデル自己回帰の品質向上が効果的かつ実践的な戦略であることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:28:32 GMT)
Process Reward Models for Sentence-Level Verification of LVLM Radiology Reports [12.8] 本稿では,この視覚言語タスクに適応した文レベル・リワード・モデル(PRM)を提案する。
PRMは、臨床文脈で条件付けられた各生成文の事実的正当性を予測する。
PRMスコアは、F1-CheXbertスコアを4.5%改善する低品質レポートを効果的にフィルタする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:08:05 GMT)
From ID-based to ID-free: Rethinking ID Effectiveness in Multimodal Collaborative Filtering Recommendation [12.7] ID機能は初期埋め込みを提供するが、セマンティック・リッチネスは欠如している。
ユーザとアイテム毎にユニークな識別子を提供するが、トレーニングされていないデータへの一般化を妨げる。
マルチモーダルな特徴の整合と融合を支援するが、表現シフトにつながる可能性がある。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:44:45 GMT)
Thought Anchors: Which LLM Reasoning Steps Matter? [12.7] 文レベルでの推論トレースの分析は、推論過程を理解するための有望なアプローチである、と我々は主張する。
本稿では,各文の対実的重要性を測定するブラックボックス手法を提案する。
文文文の因果関係を推論トレースで調べることで,モデルの振る舞いを把握できることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:36:23 GMT)
Breaking the Benchmark: Revealing LLM Bias via Minimal Contextual Augmentation [12.6] 大規模言語モデルは、その表現と振舞いにステレオタイプ的バイアスを示すことが示されている。
3つのプラグ・アンド・プレイステップを含む,新規で汎用的な拡張フレームワークを提案する。
大規模言語モデルは入力の摂動に影響を受けやすいことが分かり、ステレオタイプに振る舞う可能性が高くなる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:05:12 GMT)
Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices [12.4] 大規模マルチモーダルモデル (LMM) は、視覚とオーディオエンコーダ、プロジェクタ、および大きな言語モデルからなる、本質的にモジュラーである。
しかし、それらはほとんど常にモノリシックに実行され、不均一な加速器を弱めている。
大規模マルチモーダルモデル(LMM)のためのハードウェア-ソフトウェア共設計推論フレームワークを提案する。
このフレームワークは、大規模なモデルをモジュラーコンポーネントに分割し、最も適切な計算ユニットで実行する予定である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:17:43 GMT)
Scaling Laws For Scalable Oversight [12.4] 本稿では,監視者の能力と監視対象システムの機能として,監視を成功させる確率を定量化する枠組みを提案する。
当社のフレームワークは,Mafia, Debate, Backdoor Code, Wargamesの4つの監視ゲームに適用しています。
一般的なエロギャップにおける成功率は、マフィアが13.5%、ディベートが51.7%、バックドア・コードが10.0%、ウォーゲームが9.4%である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:48:09 GMT)
A Multi-Store Privacy Measurement of Virtual Reality App Ecosystem [12.3] 私たちは、現在のVRアプリエコシステムにおいて、プライバシプラクティスに関する初の総合的なマルチストアスタディを提示します。
この研究は、5つの主要なアプリストアから収集された6,565のアプリを含む大規模なデータセットをカバーする。
アプリの3分の1は機密データの使用を宣言できず、21.5%は有効なプライバシーポリシーの提供を怠っている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:42:29 GMT)
Characterizing the Distinguishability of Product Distributions through Multicalibration [12.2] 我々は、$X_0otimes k$と$X_1otimes k$を効率的に区別するために必要となるサンプル数$k$の新しい厳密な特徴を証明した。
私たちのフレームワークは、Halevi と Rabin (TCC 2008) と Geier (TCC 2022) の結果を導出するのに使用できます。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:08:12 GMT)
UNO-Bench: A Unified Benchmark for Exploring the Compositional Law Between Uni-modal and Omni-modal in OmniModels [12.2] マルチモーダル大言語モデルは、一様理解から視覚、音声、言語モダリティの統一へと発展し、総称してオムニモデルと呼ばれている。
我々は,UNi-modalとOmni-modalの両機能を効果的に評価する新しい,高品質で統一されたOmniモデルベンチマークUNO-Benchを提案する。
このベンチマークは、44のタスクタイプにまたがる98%のクロスモーダリティの可解性と、複雑な推論を評価するための革新的な多段階のオープンエンド質問タイプで構成されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:35:48 GMT)
Understanding Embedding Scaling in Collaborative Filtering [12.2] 10のデータセットにわたる大規模な実験を、さまざまな範囲のレベルとスケールで実施しています。
二重ピークと対数という2つの新しい現象を観察する。
二重ピーク現象の根本原因について理解を深める。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:48:20 GMT)
AdaDetectGPT: Adaptive Detection of LLM-Generated Text with Statistical Guarantees [12.1] テキストが人間によって作成されているか,あるいは大言語モデル(LLM)によって作成されているかを決定する問題について検討する。
既存のアートロジットに基づく検出器は、所定のソースLLMの分布関数を用いて評価された観測テキストの対数確率から得られた統計値を利用する。
AdaDetectGPTは、ロジットベースの検出器の性能を高めるために、トレーニングデータから証人関数を適応的に学習する新しい分類器である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:06:24 GMT)
DREaM: Drug-Drug Relation Extraction via Transfer Learning Method [12.1] DREAMは、まず、トレーニングされた関係抽出モデルを用いて、エンティティ間の関係を探索する手法である。
抽出された関係は、その後、大きな言語モデルを用いて検証される。
我々の質的分析は、このアプローチが医療領域のあいまいさを明らかにすることができることを示している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:27:00 GMT)
MMSD3.0: A Multi-Image Benchmark for Real-World Multimodal Sarcasm Detection [12.0] MMSD3.0は、ツイートとAmazonレビューからキュレートされたマルチイメージのサンプルからなる新しいベンチマークである。
本稿では,画像間接続を捉えるために,画像間シーケンスを対象とするクロスイメージ推論モデル(CIRM)を提案する。
さらに,テキスト画像対応に基づく関連誘導・微粒なクロスモーダル融合機構を導入し,統合時の情報損失を低減する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:05:27 GMT)
QoSGMAA: A Robust Multi-Order Graph Attention and Adversarial Framework for Sparse QoS Prediction [12.0] 本稿では,複雑でノイズの多いネットワークサービス環境における予測精度の向上を目的とした新しいアーキテクチャMGAAを提案する。
ユーザとサービス間の複雑な高次相互作用を捉えるために、離散サンプリング手法を用いる。
提案モデルでは,既存のベースライン手法を著しく上回り,サービス選択やレコメンデーションシナリオへの実践的展開の可能性を強調した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:03:28 GMT)
Localising under the drape: proprioception in the era of distributed surgical robotic system [12.0] そこで本研究では,無マーカープロピオセプション法により,手術用ロボットの立体的位置を正確に決定する手法を提案する。
提案手法は,軽量ステレオRGBカメラとトランスフォーマーを用いた新しいディープラーニングモデルに依存している。
これは、これまでで最大規模の空間ロボット手術データセットの上に構築されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:50:12 GMT)
The Reasoning Trap: How Enhancing LLM Reasoning Amplifies Tool Hallucination [11.9] 本稿では,Reasoning RLによる推論の段階的向上が,タスク性能向上に比例してツール幻覚を増大させることを示す。
機械的に、RLの推論はツール-信頼性関連表現を不均等に崩壊させ、後層残留ストリームに集中した増幅された発散物として幻覚表面を呈する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:58:29 GMT)
A Neural Model for Contextual Biasing Score Learning and Filtering [11.9] ASRエンコーダから抽出された音響情報に基づいて,アテンションに基づくバイアスデコーダを用いて候補句のスコアを生成する。
本研究では, 乱れを抑えつつ, 接地句の高得点を奨励する, 単語ごとの識別目標を提案する。
我々の手法はモジュラーであり、任意のASRシステムで使用することができ、フィルタ機構は他のバイアス法の性能を高める可能性がある。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:41:52 GMT)
Membership Inference Attacks on Recommender System: A Survey [11.8] RecSysはメンバーシップ推論攻撃(MIA)に弱い
RecSysモデルのMIAは、直接プライバシー侵害につながる可能性がある。
従来のMIAは、目に見えない後部確率のためにRecSysに不適である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:12:35 GMT)
PaperArena: An Evaluation Benchmark for Tool-Augmented Agentic Reasoning on Scientific Literature [11.8] 本研究では,大規模言語モデル(LLM)に基づくエージェントの評価ベンチマークであるPaperArenaを提案する。
研究上の疑問から、エージェントは推論や適切なツールとのインタラクションを通じて、複数の論文にまたがる多様なフォーマットを統合する必要がある。
実験の結果、高度に確立されたエージェントを駆動する最も先進的なLCMでさえ、平均精度は38.78%に過ぎなかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:55:00 GMT)
Differential Privacy as a Perk: Federated Learning over Multiple-Access Fading Channels with a Multi-Antenna Base Station [11.8] Federated Learning(FL)は、トレーニング中に生データを交換する必要をなくし、プライバシを保護する分散学習パラダイムである。
AirCompはアナログ・ザ・エア・コンピューティング(AirComp)によって実現される
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:01:15 GMT)
Enabling Vibration-Based Gesture Recognition on Everyday Furniture via Energy-Efficient FPGA Implementation of 1D Convolutional Networks [11.5] 本研究では、低消費電力フィールドプログラマブルゲートアレイ(FPGA)上にコンパクトNNを展開させるエネルギー効率のよいソリューションを提案する。
我々は、複雑なスペクトル前処理を生波形入力に置き換え、複雑なオンボード前処理を不要とし、精度を犠牲にすることなく入力サイズを21倍削減する。
組み込みFPGAに適した2つの軽量アーキテクチャ(1D-CNNと1D-SepCNN)を設計し、パラメータを3億6900万から216に削減し、同等の精度を維持した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:30:36 GMT)
DOS: Directional Object Separation in Text Embeddings for Multi-Object Image Generation [11.4] 本稿では,3種類のCLIPテキスト埋め込みを,テキスト・ツー・イメージ・モデルに渡す前に修正するDOS(Directional Object separation)を提案する。
実験の結果,DOS は多目的画像生成の成功率を一貫して改善し,オブジェクトの混合を減少させることがわかった。
これらの結果は、多目的画像生成を改善するための実用的で効果的なソリューションとしてDOSを強調している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:18:23 GMT)
How do simple rotations affect the implicit bias of Adam? [11.4] 我々は、アダムの座標的事前条件スキームが、全体のメソッドが特徴空間の変換に敏感であることを示す。
この感度はAdamの競争上の優位性の逆転として表れることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:38:46 GMT)
Multi-turn Training with Basic Human Feedback Helps Little on LLM Reasoning [11.4] タスクの推論には,人間からのフィードバックによるマルチターントレーニングが必要であるかを検討する。
単ターン設定で訓練されたモデルは、単ターンおよび多ターン評価の両方に効果的に一般化する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:23:40 GMT)
Dynamic Retriever for In-Context Knowledge Editing via Policy Optimization [11.3] In-Context Knowledge Editing (DR-IKE) のための動的検索手法を提案する。
DR-IKEは、BERTレトリバーをREINFORCEでトレーニングし、報酬を編集してデモをランク付けする軽量フレームワークである。
編集成功率を最大17.1%改善し、レイテンシを41.6%削減し、無関係なクエリの精度を維持する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:25:35 GMT)
DCMM-SQL: Automated Data-Centric Pipeline and Multi-Model Collaboration Training for Text-to-SQL Model [11.3] 我々は,テキストからタスクへのデータ中心パイプラインを設計する。
また、異なる拡張データを用いて複数のモデルを訓練することを目的としたマルチモデル協調学習スキーマを提案する。
実験結果とアブレーション実験により,データ中心パイプラインとマルチモデル(MM)インタラクティブ戦略の有効性が示された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:53:39 GMT)
Strategies for Robust Deep Learning Based Deformable Registration [11.3] Learn2Reg 2025のLUMIR脳登録チャレンジは、トレーニングセットに含まれるものと異なるコントラストやモダリティに基づいて、登録のパフォーマンスを評価することにより、フィールドを前進させることを目的としている。
本稿では,画像がMDD特徴空間に変換されてモデルに反映されるという,ロバスト性を大幅に向上する,非常にシンプルなアイデアを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:29:28 GMT)
DmC: Nearest Neighbor Guidance Diffusion Model for Offline Cross-domain Reinforcement Learning [11.3] クロスドメインオフライン強化学習(RL)は、追加のオフラインソースデータセットを利用することで、サンプル効率の向上を目指している。
DmCは、限られたターゲットサンプルを持つクロスドメインオフラインRLのための新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:00:52 GMT)
Assessing the Human-Likeness of LLM-Driven Digital Twins in Simulating Health Care System Trust [11.3] LLM(Large Language Model)駆動のHuman Digital Twinsは、医療システム研究において大きな可能性を秘めている。
しかし、医療システムにおける不信のような複雑な人間の心理的特徴に対する実際のシミュレーション能力は、まだ不明である。
本研究は,現在のLLM駆動型Digital Twinsは,複雑な人間の態度のモデル化に限界があることを示唆する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:56:22 GMT)
On Uncertainty Calibration for Equivariant Functions [11.1] 我々は不確実性推定と等価性に関する理論を提案する。
我々は,対称性のミスマッチが分類と回帰の両方において誤校正をもたらすことを示す。
等価性と不確実性の関係を明らかにする数値実験により,我々の理論枠組みを補完する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:51:48 GMT)
Computational Analysis of Character Development in Holocaust Testimonies [11.0] 本研究は,ナラティブ・タイムラインに沿ってキャラクタ開発を分析するための計算手法を提案する。
ホロコーストの生存者証言の書き起こしをテストケースとみなし、それぞれが一人称の言葉で個人の物語を語る。
我々は、生存者の宗教的軌道に焦点をあて、宗教的信念と実践に対する彼らの配置の進化を考察する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:49:01 GMT)
Exploiting Vocabulary Frequency Imbalance in Language Model Pre-training [11.0] 大規模言語モデルはトークン化器で訓練され、結果として生じるトークン分布は極めて不均衡である。
最近の慣行では、より大きい語彙が好まれているが、その利点がどこから来ているのかは定かではない。
より大きな語彙は、この複雑さを減少させる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:39:13 GMT)
Attention! Your Vision Language Model Could Be Maliciously Manipulated [11.0] 視覚言語モデルマニピュレーションアタック(VMA)を提案する。
VMAは、対向摂動を効果的に最適化するために、一階と二階の運動量最適化技術と微分可能な変換機構を統合する。
脱獄、ハイジャック、プライバシー侵害、Denial-of-Service、スポンジの生成など、さまざまな攻撃を実装するために利用することができる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:54:32 GMT)
Adaptive Keyframe Selection for Scalable 3D Scene Reconstruction in Dynamic Environments [11.0] 動的環境における3次元シーン再構成の改善のための適応的選択法を提案する。
提案手法は,エラーベース選択モジュールとモーメントベース更新モジュールの2つの相補モジュールを統合する。
本稿では,最新の3D再構成ネットワークであるSpann3rとCUT3Rについて,適応選択モジュールの評価を行った。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:25:57 GMT)
Hankel Singular Value Regularization for Highly Compressible State Space Models [10.9] 状態空間モデルのハンケル特異値の和を正則化すると、これらの特異値の高速な崩壊が起こり、圧縮可能なモデルになる。
Long Range Arenaベンチマークの実験では、正規化された状態空間層は標準状態空間層よりも最大10$times$圧縮可能であることが示された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:09:45 GMT)
ThinkBrake: Mitigating Overthinking in Tool Reasoning [10.9] 小さな推論モデル(SRM)は、しばしばツールの使用時に過大評価される。
文境界で/think>を注入/注入するオラクルロールアウトを通じて過剰思考を診断する。
ThinkBrakeは/think>と文境界における現在のトップトークンの間のログ確率のマージンを監視します。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:22:59 GMT)
Steering Evaluation-Aware Language Models to Act Like They Are Deployed [10.9] 大規模言語モデル(LLM)は、いつ評価されるかを検出し、より整列するように振る舞いを調整する。
LLMのアクティベーションにステアリングベクトルを加えることで、評価の認識が抑えられ、評価中にデプロイされるようなモデル動作が実現できることを示す。
以上の結果から,AI評価装置は,モデルがデプロイされているように動作させることで,安全性評価の信頼性を向上させることができる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:43:39 GMT)
Authentication Against Insecure Bootstrapping for 5G Networks: Feasibility, Resiliency, and Transitional Solutions in Post-Quantum Era [10.9] 5Gプロトコルは、初期ブートストラップフェーズにおいて、堅牢な基地局認証機構を欠いている。
公開鍵基盤(PKI)に基づくデジタルシグネチャやアイデンティティベースのシグネチャを含む従来のソリューションは、量子能力のある敵に対して不十分である。
本稿では,Fail-Stopプロパティを持つ階層型IDベースのThreshold Signatureスキームに基づく過渡認証ソリューションであるBORGを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:56:59 GMT)
GCAO: Group-driven Clustering via Gravitational Attraction and Optimization [10.9] 本稿では,重力アトラクションと最適化(GCAO)によるグループ駆動クラスタリングを提案する。
GCAOは低密度境界点を協調移動群に集約し、従来の点ベースの収縮過程を置き換える。
複数の高次元データセットの実験により、GCAOは11の代表的なクラスタリング法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:22:24 GMT)
One Stone with Two Birds: A Null-Text-Null Frequency-Aware Diffusion Models for Text-Guided Image Inpainting [10.8] テキスト誘導画像のインペイントは、テキストプロンプトに従ってマスクされた領域を再構築することを目的としている。
我々は、テキスト誘導画像のインペイントのための、textbfNTN-Diffと呼ばれるNull-text-null周波数対応拡散モデルを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:08:58 GMT)
Quantum Simulation of Oscillatory Unruh Effect with Superposed Trajectories [10.8] 我々は、レーザー制御された閉じ込められたイオンを用いて、空洞磁場と結合した発振検出器を実験的にシミュレートする。
我々は検出器と検出器のフレーム内の磁場の合同励起を観測し、アンルー効果によって予測される座標力学と一致する。
この実験では、量子重力理論に関連する加速軌道の量子コヒーレント重ね合わせの性質を明らかにした。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:26:11 GMT)
ControlText: Unlocking Controllable Fonts in Multilingual Text Rendering without Font Annotations [10.5] 本研究は,フォントラベルアノテーションを使わずに,原画像のみを用いてフォント制御可能な多言語テキストレンダリングを実現することができることを示す。
本稿では,条件付き拡散モデルとテキストセグメンテーションモデルを統合したデータ駆動型ソリューションを提案する。
この実験は、ゼロショットテキストにおける我々のアルゴリズムの概念の証明と、多様なフォントや言語にわたるフォント編集を提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:52:27 GMT)
FlightKooba: A Fast Interpretable FTP Model [10.5] 本稿では,基礎となる力学を解析的に抽出する新しいモデリング手法であるFlightKoobaを紹介する。
FlightKoobaは、トレーニング可能なパラメータを桁違いに削減しながら、競合予測の精度を提供する。
要約すると、FlightKoobaは、特にリソース制約のある環境で、時系列分析のための強力で効率的で解釈可能な新しい代替手段を提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:39:15 GMT)
A Re-node Self-training Approach for Deep Graph-based Semi-supervised Classification on Multi-view Image Data [10.5] マルチビューデータ(RSGSLM)のためのノード自己学習グラフに基づく半教師付き学習を提案する。
本手法は,グラフ畳み込みネットワーク(GCN)フレームワークにおける線形特徴変換と多視点グラフ融合を組み合わせることで,課題に対処する。
マルチビューベンチマーク画像データセットの実験結果は、RSGSLMが既存の半教師付き学習アプローチを超越していることを示している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:02:53 GMT)
Sample Complexity Bounds for Linear Constrained MDPs with a Generative Model [10.4] 無限水平$gamma$-discounted (linear) constrained Markov decision process (CMDPs) を考える。
目的は、期待累積制約の対象となる累積報酬を最大化する政策を見つけることである。
ブラックボックスの制約のないMPPソルバを活用できる原始双対フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:20:30 GMT)
Block-Diagonal LoRA for Eliminating Communication Overhead in Tensor Parallel LoRA Serving [10.1] ブロック対角のLoRAは、LoRAアダプタをシャーディングする代替の方法を可能にする。
ブロック対角法 LoRA アプローチが標準 LoRA と同様のパラメータ効率であることを示す。
例えば、Llama-3.1-70B のアダプタパラメータの数が 0.87x (1.74x) で、Llama-3.1-8B のアダプタパラメータの数が 0.86x (1.73x) で、最大 1.63x (1.3x) のエンドツーエンドスピードアップを 0.86x (1.73x) で観測する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:01:29 GMT)
LLM4Cell: A Survey of Large Language and Agentic Models for Single-Cell Biology [10.0] 大規模言語モデル(LLM)と新しいエージェントフレームワークが単一細胞生物学を変革し始めている。
LLMは自然言語推論、生成アノテーション、マルチモーダルデータ統合を可能にする。
本研究は, 単細胞研究のために開発された58の基盤およびエージェントモデルの統一的な調査である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:46:32 GMT)
TrajAgent: An LLM-Agent Framework for Trajectory Modeling via Large-and-Small Model Collaboration [10.0] 軌道モデリングは、生活サービス、都市交通、行政などの分野で広く応用されている。
自動化モデリングによるロバストかつ効率的な軌道モデリングを支援するフレームワークである textitTrajAgent を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:58:21 GMT)
Dynamic Gaussian Splatting from Defocused and Motion-blurred Monocular Videos [10.0] 本稿では,高画質な動的ガウス平滑化を実現するための一貫した枠組みを提案する。
我々は、ぼかし関連シーンとカメラ情報を利用するぼかし予測ネットワークを使用し、ぼかし認識の空間性制約を受ける。
本手法は,焦点のずれや動きの鈍いモノクロビデオから光リアルな新奇なビューを合成するための最先端の手法よりも優れる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:20:52 GMT)
Conditional Mean and Variance Estimation via \textit{k}-NN Algorithm with Automated Variance Selection [9.9] 条件平均と分散度を共同で推定するための新しいテクストリック・アレスト・ニアレスト回帰法(textitk-NN)を提案する。
提案アルゴリズムは,古典的非パラメトリックテクトitk-NNモデルの計算効率と多様体学習能力を保持する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:39:45 GMT)
A Cryptographic Perspective on the Verifiability of Quantum Advantage [9.9] 本稿では,暗号的観点からの量子優位性の検証について検討する。
量子優位性と暗号および複雑性プリミティブの妥当性の強い関係を確立する。
我々の研究は、検証可能な量子長所を求めることが量子暗号の応用につながる可能性を示唆している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:15:49 GMT)
Leveraging Hierarchical Organization for Medical Multi-document Summarization [9.9] 医用多文書要約の入力に階層構造を組み込むことで、文書間で情報を整理・コンテキスト化するモデルの能力が向上するかどうかを検討する。
本研究は,人文要約よりもモデル生成要約を好むことを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:18:02 GMT)
HyPerNav: Hybrid Perception for Object-Oriented Navigation in Unknown Environment [9.8] 未知環境におけるナビゲーションの有効性とインテリジェンスを高めるために,Hybrid Perception Navigation (HyNav)を提案する。
本手法は,エゴセントリックな観測からの情報とトップダウンマップを同時に利用することにより,よりリッチなキューを捕捉し,オブジェクトをより効果的に発見する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:43:56 GMT)
AfriMTEB and AfriE5: Benchmarking and Adapting Text Embedding Models for African Languages [9.8] AfriMTEBは、59の言語、14のタスク、38のデータセットをカバーし、6つの新たに追加されたデータセットを含む、MTEBの地域拡張である。
5言語未満の多くのMTEBデータセットとは異なり、新しい追加は14から56のアフリカの言語にまたがっており、ヘイトスピーチ検出、意図検出、感情分類といった全く新しいタスクが導入されている。
AfriE5は, 言語間のコントラスト蒸留を通じて, アフリカ語への命令調整mE5モデルの適応である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:06:43 GMT)
On the Structure of Stationary Solutions to McKean-Vlasov Equations with Applications to Noisy Transformers [9.8] 円上のマッキーン・ブラソフ方程式の定常解について研究する。
我々の主な貢献は、定常マッキーン・ブラソフ方程式とフーリエ係数上の方程式の無限次元二次系の間の解の正確な等価性を観察することにある。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:12:03 GMT)
Toward extracting scattering phase shift from integrated correlation functions on quantum computers [9.7] 本稿では,量子コンピュータ上で捕捉された2粒子系の積分相関関数の量子シミュレーションにより,無限体積散乱位相シフトを抽出する。
積分相関関数はRef.citePhysRevA.64.022319で提案されたアンシラベースのアルゴリズムで計算できる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:38:28 GMT)
Mixing It Up: Exploring Mixer Networks for Irregular Multivariate Time Series Forecasting [9.6] IMTS専用に設計された新しい予測アーキテクチャであるIMTS-Mixerを紹介する。
提案手法は,IMTSを固定サイズ行列表現に変換する革新的な手法を導入しながら,TSミキサーモデルの中核となる原理を保っている。
この結果から,IMTS-Mixerは予測精度を向上し,計算効率も向上することを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:01:38 GMT)
AttentionRAG: Attention-Guided Context Pruning in Retrieval-Augmented Generation [9.5] 本稿では,RAGシステムに対する注意誘導型コンテキストプルーニング手法であるAttentionRAGを提案する。
AttentionRAGの中核となる考え方は、RAGクエリを次世代の予測パラダイムに再構成する、注意集中メカニズムにある。
LongBenchとBabilongベンチマークの実験では、AttentionRAGは最大6.3$times$コンテキスト圧縮を達成し、LLMLinguaのメソッドはキーメトリックで約10%上回っている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:55:55 GMT)
Group Interventions on Deep Networks for Causal Discovery in Subsystems [9.2] 因果発見は、変数間の複雑な関係、予測の強化、意思決定、現実世界のシステムに対する洞察を明らかにする。
我々は、訓練されたディープニューラルネットワークに対するグループレベルの介入を利用する、新しいマルチグループ因果探索法であるgCDMIを紹介する。
提案手法をシミュレーションデータセット上で評価し,既存手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:26:20 GMT)
A data free neural operator enabling fast inference of 2D and 3D Navier Stokes equations [9.2] 本研究では,Navier Stokes方程式に対するデータフリー演算子ネットワークを提案する。
2Dベンチマークと3Dテストケース全体で、この手法は従来のニューラル演算子を精度で上回り、アンサンブルでは従来の数値解法よりも高い効率を達成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:41:42 GMT)
A Video Is Not Worth a Thousand Words [9.2] 複数選択のビデオ質問応答データセットの視覚言語モデルを評価する。
ビデオフレームと全テキスト要素を階層構造における同等の特徴とみなす。
この結果から,複数選択のVQAタスクはモデルが障害を無視する能力に発展することが示された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:15:02 GMT)
Quantifying Document Impact in RAG-LLMs [9.1] 本稿では、検索した文書が生成した応答に与える影響を計測する部分情報分解に基づく新しい指標であるインフルエンススコア(IS)を紹介する。
まず、3つのデータセットにまたがる毒の攻撃シミュレーションでは、ISが悪意のある文書を86%のケースで最も影響力のある文書と正しく識別していることが示されている。
第2に、アブレーション研究では、上位文書のみを用いて生成された応答が、残りの文書から生成された応答よりも、元の応答と一貫して類似していることが示されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:47:13 GMT)
TDFlow: Agentic Workflows for Test Driven Software Engineering [9.0] TDFlowは、テスト解決タスクとして、リポジトリスケールのソフトウェアエンジニアリングをフレーム化します。
SWE-Bench LiteにおけるTDFlowのパスレートは88.8%である。
人間の開発者がテストを書くTDFlowを利用した人間-LLMインタラクティブシステムを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:44:59 GMT)
Offline Preference Optimization via Maximum Marginal Likelihood Estimation [9.0] この研究は、Marginal Likelihoodの推定のレンズを通してアライメントをリキャストする。
我々の新しいMMLベースの優先度最適化(MMPO)は、好ましいテキスト出力の辺りのログ類似度を最大化する。
MMPOは、基本モデルの汎用言語能力をよりよく保ちつつ、競争力や優良な選好アライメントを実現する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:15:57 GMT)
MoEMeta: Mixture-of-Experts Meta Learning for Few-Shot Relational Learning [9.0] 知識グラフリレーショナル学習は、限られた数のトレーニング例のみを考慮すれば、関係性に関する推論を行おうとする。
MoEMetaは、タスク固有のコンテキストからグローバルに共有される知識を分離する、新しいメタ学習フレームワークである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:16:10 GMT)
Analog Foundation Models [8.9] アナログインメモリコンピューティング(AIMC)は、ニューラルネットワーク計算の速度と電力効率を改善するための有望な計算パラダイムである。
AIMCは、ノイズ計算や入力と量子化に関する厳密な推論といった基本的な課題を導入している。
低精度アナログハードウェア上で堅牢な適応と実行を実現するための,汎用的なスケーラブルな手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:55:30 GMT)
Hierarchical Language Models for Semantic Navigation and Manipulation in an Aerial-Ground Robotic System [8.9] 不均一なマルチロボットシステムは、協調的なハイブリッド協調を必要とする複雑なタスクにおいて大きな可能性を示す。
静的またはタスク固有のモデルに依存する既存のメソッドは、様々なタスクや動的環境にまたがる一般化性に欠けることが多い。
本稿では,大規模言語モデル (LLM) と微調整型視覚言語モデル (VLM) を統合した階層型マルチモーダルフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:26:01 GMT)
Code Digital Twin: Empowering LLMs with Tacit Knowledge for Complex Software Development [8.8] ソフトウェアモデルと大規模言語モデルの両方の観点から、課題を特定します。
ソフトウェアの物理層と概念層の両方をモデル化するフレームワークであるCode Digital Twinを提案する。
私たちのビジョンは、AIの進歩とエンタープライズソフトウェアの現実の橋渡しと位置づけています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:09:29 GMT)
Code Digital Twin: Empowering LLMs with Tacit Knowledge for Complex Software Development [8.8] ソフトウェアモデルと大規模言語モデルの両方の観点から、課題を特定します。
ソフトウェアの物理層と概念層の両方をモデル化するフレームワークであるCode Digital Twinを提案する。
私たちのビジョンは、AIの進歩とエンタープライズソフトウェアの現実の橋渡しと位置づけています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:13:29 GMT)
Evaluation of Vision-LLMs in Surveillance Video [8.8] 本稿では視覚言語モデル(VLM)の空間的推論について検討する。
これは、スパース2Dビデオからダイナミックな3Dシーンを解釈する、具体的認識課題に対処する。
UCF-Crime と RWF-2000 の4つのオープンモデルについて,プロンプトおよびプライバシ保護条件下で評価した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:27:02 GMT)
Secure and Confidential Certificates of Online Fairness [8.7] MLサービスの合法的かつ責任を負うためには、信頼性が不可欠である。
モデルフェアネスを評価する既存の方法は、(i)静的なデータセットに対してフェアネスを証明するため、秘密裏に信頼性を欠いている。
OATH(OATH)は,オンライングループフェアネス認定のための,デプロイ性が高くスケーラブルなゼロ知識証明プロトコルである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:37:07 GMT)
Predicting symbolic ODEs from multiple trajectories [8.6] MIOは、シンボリック常微分方程式を推論するトランスフォーマーベースのモデルである。
異なるインスタンスアグリゲーション戦略を調査し、単純な平均アグリゲーションでもパフォーマンスを大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:03:29 GMT)
Integrating Reinforcement Learning with Visual Generative Models: Foundations and Advances [8.6] 強化学習は、非微分可能、嗜好駆動、時間的に構造化された目的を最適化するための原則化されたフレームワークを提供する。
最近の進歩は、生成タスク間の制御性、一貫性、人間のアライメントを高める効果を実証している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:55:25 GMT)
Fairness under Competition [8.5] 生態系の公平性の全体的なレベルに及ぼす公平な分類法の導入の影響を考察する。
競合する分類器が個別に公平であるとしても、生態系の結果は不公平である可能性があることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:40:39 GMT)
SI-Bench: Benchmarking Social Intelligence of Large Language Models in Human-to-Human Conversations [8.5] 大規模言語モデル(LLM)における社会的知能の側面を評価するための新しいベンチマークであるSI-Benchを紹介する。
SI-Benchは幅広い社会科学理論に基づいており、ソーシャルネットワーキングアプリケーションから収集された2,221の真のマルチターン対話を含んでいる。
実験では、複雑な社会的状況下でのプロセス推論において、SOTAモデルが人間の専門家を上回る結果となったが、それでも回答の品質は人間に劣っている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:21:46 GMT)
The injective norm of CSS quantum error-correcting codes [8.5] 我々はCSS量子誤り訂正符号の標準基底状態のインジェクティブノルムを計算した。
これらの結果をすべてのCSSコードに拡張し、非自明で無限の量子状態の族に対する単射ノルムを得る。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:06:02 GMT)
ESCA: Enabling Seamless Codec Avatar Execution through Algorithm and Hardware Co-Optimization for Virtual Reality [8.4] フォトコーデックアバター(PCA)は、VR(Virtual Reality)環境のための高忠実な人間の顔レンダリングを生成する。
本稿では,コーデックアバターモデルに適した効率的な後トレーニング量子化(PTQ)手法を提案する。
エッジVRプラットフォーム上でPCA推論を高速化するフルスタック最適化フレームワークであるESCAを紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:31:20 GMT)
Noise-corrected GRPO: From Noisy Rewards to Unbiased Gradients [8.4] この研究は、現代のRLHFを用いた教師あり学習からのラベルノイズ補正を橋渡しする。
理論的な洞察と、ノイズの多い現実世界の展開のための実用的なアルゴリズムの両方を提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:24:50 GMT)
Guiding Skill Discovery with Foundation Models [8.4] 既存のスキル発見方法は、人間の好みを考慮せずに、スキルの多様性を最大化することのみに焦点を当てている。
本稿では,人間の意図をスキル発見に取り入れたFoG(Foundation Model Guided)スキル発見手法を提案する。
FoGは、フリップやローリングなどの望ましくない振る舞いを排除し、状態ベースのタスクとピクセルベースのタスクの両方で有害な領域を避けるために、うまく学習する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:47:40 GMT)
Language Server CLI Empowers Language Agents with Process Rewards [8.4] 本稿ではLanser-CLIについて紹介する。Lanser-CLIはCLIファーストのオーケストレーションレイヤで、Language Server Protocol(LSP)サーバをピン留めし仲介する。
私たちの立場では、言語サーバーは構造情報だけでなく、実行可能なプロセス報酬も提供します。
凍結スナップショット下で決定論を定式化し,プロセス報酬の単調性を確立した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:25:20 GMT)
Zero-shot protein stability prediction by inverse folding models: a free energy interpretation [8.4] 逆折り畳みモデルは、タンパク質安定性の非常に効果的なゼロショット予測因子であることが証明されている。
逆折り畳みモデルの自由エネルギー基盤を明らかにするためのステップを踏む。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:02:49 GMT)
Sentinel: Dynamic Knowledge Distillation for Personalized Federated Intrusion Detection in Heterogeneous IoT Networks [8.4] フェデレーテッド・ラーニング(FL)は機械学習のプライバシ保護パラダイムを提供するが、IoTネットワーク内の侵入検知システム(IDS)におけるその応用は、厳しいクラス不均衡、非IIDデータ、高い通信オーバーヘッドに悩まされている。
本稿では、各クライアントにデュアルモデルアーキテクチャを組み込んだ、個人化されたIDSフレームワークであるSentinelを提案する。
この設計は、コンパクトな学生モデルのみを送信することでクライアントプライバシを保ちながら、効率的なグローバルモデルコンセンサスとの深い局所適応を効果的にバランスさせ、通信コストを低減させる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:32:48 GMT)
ContextAgent: Context-Aware Proactive LLM Agents with Open-World Sensory Perceptions [8.3] 最初のコンテキスト対応プロアクティブエージェントであるContextAgentを紹介する。
ContextAgentは、ユーザの意図を理解するために、ウェアラブル上の知覚的知覚から多次元コンテキストを抽出する。
アクティブなアシストが必要な場合、ContextAgentは自動的に必要なツールを呼び出す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:17:51 GMT)
CRADLE Bench: A Clinician-Annotated Benchmark for Multi-Faceted Mental Health Crisis and Safety Risk Detection [8.3] 我々は,多面的危機検出のベンチマークであるCRADLE BENCHを紹介する。
本ベンチマークでは,600名の臨床医による評価例と420名の開発例を提供する。
コンセンサスおよび全会一致で定義されたサブセット上での6つの危機検出モデルをさらに微調整する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:32:38 GMT)
On the Societal Impact of Machine Learning [8.2] 本論文は機械学習(ML)の社会的影響について考察する。
MLは、連続的な決定とレコメンデーションをますます通知し、私たちの生活の多くの側面に大きな影響を与えます。
これらのデータ駆動システムは、明示的な公平性を考慮せずにしばしば開発されるため、識別効果のリスクが伴う。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:59:48 GMT)
Resource analysis of Shor's elliptic curve algorithm with an improved quantum adder on a two-dimensional lattice [8.0] 量子コンピュータは古典的な暗号システムを壊す可能性がある。
toffoli depth $log n + loglog n + O(1)$ with only $O(n)$ ancillas。
2次元格子上のショア楕円曲線アルゴリズムの網羅的資源解析を行う。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:02:10 GMT)
Decentralized Multi-Agent Goal Assignment for Path Planning using Large Language Models [7.9] 本研究は,マルチエージェントパス計画における分散型ゴール割り当ての問題に対処する。
エージェントは、環境の構造的表現に基づいて、目標よりもランク付けされた選好を独立に生成する。
完全に観測可能なグリッドワールド設定において,greedys,Optimal assignment,および大規模言語モデル(LLM)ベースのエージェントを比較した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:05:56 GMT)
Provable test-time adaptivity and distributional robustness of in-context learning [7.8] 混合分布$pi=sum_alphainmathcalA lambda_alpha pi_alpha$。
十分なデータに基づいて事前訓練された大きな変換器が、困難度$$beta$に対応する収束率の最適値を達成することを証明した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:16:49 GMT)
On the Fundamental Limitations of Decentralized Learnable Reward Shaping in Cooperative Multi-Agent Reinforcement Learning [7.8] DMARL-RSAは、各エージェントが個々の報酬形成を学習する完全に分散化されたシステムである。
高度な報酬学習にもかかわらず、DMARL-RSAは-24.20 +/- 0.09の平均報酬しか達成していない。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:01:35 GMT)
Automatic Discovery of One Parameter Subgroups of $SO(n)$ [7.8] 我々は、$SO(3)$とより一般的には$SO(n)$の1-パラメータ部分群の自動発見のための新しいフレームワークを導入する。
この方法は、標準ジョルダン形式のスキュー対称行列を使い、$SO(n)$のリー代数を定義する。
提案手法の有効性は,振り子モデリング,慣性モーメント・オブ・慣性予測,トップクォークタグ付け,不変回帰といったタスクによって実証される。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:45:43 GMT)
CompressionAttack: Exploiting Prompt Compression as a New Attack Surface in LLM-Powered Agents [7.7] この作業では、プロンプト圧縮を新しい攻撃面として特定し、それを利用した最初のフレームワークであるCompressionAttackを提示する。
複数のLSMの実験では、攻撃の成功率は80%、好みのフリップは98%で、高いステルス性と転送性を維持している。
VSCode ClineとOllamaのケーススタディは、実際の影響を確認し、現在の防御は効果がないことを証明している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:37:41 GMT)
The Design Space of Lockfiles Across Package Managers [7.7] 私たちは,npm, pnpm, Cargo, Poetry, Pipenv, Gradle, Goという,人気の高い7つのパッケージマネージャを対象とした,ロックファイルに関する初の包括的な調査を行っています。
開発者がロックファイルで認識するメリットや、これらのファイルを管理する上で直面する課題について、私たちは直接的に洞察を得ています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:57:48 GMT)
BitSkip: An Empirical Analysis of Quantization and Early Exit Composition [7.6] 本稿では,BitSkipについて紹介する。
アダマール変換のない単純な8ビット量子化モデル(BitSkip-V1)は、より複雑な4ビットおよびアダマール強化のモデルよりも優れているだけでなく、品質の完全精度のベースラインと競合する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:53:08 GMT)
MATCH: Task-Driven Code Evaluation through Contrastive Learning [7.6] GitHub Copilotは、GitHubのコードの46%を生成すると見積もっている。
単体テストのような従来の評価手法は、しばしば計算不可能でコストがかかる。
本稿では,新しい参照フリーメトリックであるMATCHを紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:51:49 GMT)
SAGE: A Generic Framework for LLM Safety Evaluation [7.5] SAGE(Safety AI Generic Evaluation)は、カスタマイズおよび動的害評価のための自動モジュール化フレームワークである。
我々は3つのアプリケーションにまたがる7つの最先端の大規模言語モデルと有害ポリシーを評価した。
結果は、より安全な現実世界のデプロイメントのための適応性、ポリシー対応、コンテキスト固有のテストに動機付けます。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:19:55 GMT)
HOPSE: Scalable Higher-Order Positional and Structural Encoder for Combinatorial Representations [7.5] トポロジカルディープラーニング(TDL)は、高次相互作用に対応するためにより一般的な表現を使用する。
既存のTDLメソッドは、しばしば高次メッセージパッシング(HOMP)を通してGNNを拡張する。
本研究は,高次関係相互作用を含む課題を解決する方法として,HOPSEを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:16:21 GMT)
Robust Uncertainty Quantification for Self-Evolving Large Language Models via Continual Domain Pretraining [7.3] Conformal Prediction (CP)は、大きな言語モデルに対して正確性を保証することを約束している。
適応的な拒絶と非交換可能なCPフレームワークを導入する。
本フレームワークは,CDPシナリオ下でのCPの有効性と信頼性を両立させる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:15:51 GMT)
The ISLab Solution to the Algonauts Challenge 2025: A Multimodal Deep Learning Approach to Brain Response Prediction [7.3] 複雑なマルチモーダル映画に対する脳反応を予測するためのネットワーク固有のアプローチを提案する。
7つの機能的ネットワークを4つのクラスタに分類し,それぞれにマルチオブジェクト,マルチ層パーセプトロン(MLP)モデルをトレーニングした。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:38:34 GMT)
One-Timestep is Enough: Achieving High-performance ANN-to-SNN Conversion via Scale-and-Fire Neurons [7.3] スパイキングニューラルネットワーク(SNN)は、ニューラルネットワーク(ANN)のエネルギー効率の良い代替品である
単段階ANN2SNNの理論的および実用的枠組みを提案する。
ImageNet-1Kの88.8%の精度を$T=1$で達成し、既存の変換手法を上回りました。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:35:14 GMT)
QuantumShield: Multilayer Fortification for Quantum Federated Learning [7.3] 本稿では,分散学習システムを量子対応敵の脅威から守るために設計された量子セキュアフェデレーション学習(QFL)フレームワークを提案する。
我々は、QFLプロセスを古典的および量子的脅威の両方に対して強化するために、先進的な量子および後量子プロトコルを統合し、厳格に評価する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:59:33 GMT)
DAO-AI: Evaluating Collective Decision-Making through Agentic AI in Decentralized Governance [7.2] 本稿では,分散型ガバナンスにおける自律的意思決定者としてのエージェントAIの実証的研究について述べる。
我々は、提案コンテキストを解釈し、過去の審議データを検索し、その投票位置を独立して決定するエージェントAI投票者を構築する。
この研究は、分散金融システムのための説明可能な、経済的に厳格なAIエージェントの設計に寄与する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:36:39 GMT)
Tracing Distribution Shifts with Causal System Maps [7.2] 根本原因分析は、ソフトウェア障害やデータ品質の問題、あるいは自然な変化に起因する変化を判断するために、手動のトレースに依存することが多い。
階層化されたビューを通して、環境とMLシステムの内部間の伝搬経路を明確にするMLシステムマップを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:07:40 GMT)
KAPG: Adaptive Password Guessing via Knowledge-Augmented Generation [7.1] 本稿では,外部の語彙知識を推測プロセスに統合する知識拡張型パスワード推測フレームワークを提案する。
KnowGuessは、サイト内およびクロスサイトシナリオにおける最先端モデルの36.5%と74.7%の平均的な改善を実現している。
また、トレンド認識およびサイト固有のパスワード強度計であるKAPSMを開発した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:03:08 GMT)
Improving the Straight-Through Estimator with Zeroth-Order Information [7.1] 本稿では,量子化パラメータを用いたニューラルネットワークのトレーニング問題について検討する。
我々は、第1次誘導ゼロ階勾配蛍光(FOGZO)を提案する。
FOGZOは、量子化対応事前学習における品質とトレーニング時間のトレードオフを改善することを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:14:59 GMT)
Sound Logical Explanations for Mean Aggregation Graph Neural Networks [7.1] グラフニューラルネットワーク(GNN)は知識グラフの補完に頻繁に使用される。
平均アグリゲーションと非負重み(MAGNN)を考慮したGNNの検討
実験の結果, 平均集約GNNの非負重みの制限は, 標準帰納的ベンチマークにおいて同等あるいは改善されることがわかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:23:21 GMT)
SARNet: A Spike-Aware consecutive validation Framework for Accurate Remaining Useful Life Prediction [7.1] SARNet(Spike-Aware Consecutive Validation Framework)を紹介する。
適応逐次閾値は、ノイズを抑えながら真のスパイクを検証する。
SARNetは、イベントトリガープロトコルの下でのベンチマークポートされたデータセット全体において、最近のベースラインと比較してエラーを一貫して低減する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:23:11 GMT)
Quantum Information at the Electron-Ion Collider [7.0] 電子イオン衝突型加速器(EIC)における電子-陽子散乱における量子情報-理論観測
我々の分析は、量子状態における非古典性の2つの相補的な指標である絡み合いと魔法に焦点を当てている。
本研究では,非偏光および縦偏光は非対角分離結果をもたらすが,横偏光は非対角・非安定状態の生成を可能にすることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:00:02 GMT)
How Can AI Augment Access to Justice? Public Defenders' Perspectives on AI Adoption [6.9] AIの採用は、コスト、限定的なオフィス規範、機密性リスク、不満足なツール品質に制約されていることが分かっています。
公の弁護側は、AIは圧倒的な量のデジタル記録を分析する証拠調査に最も有用だと考えている。
裁判所の表現と防衛戦略は、AI支援とはほとんど互換性がないと考えられている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:26:08 GMT)
Structured Reinforcement Learning for Combinatorial Decision-Making [6.8] 強化学習(Reinforcement Learning, RL)は、複雑で構造化された決定を伴う現実的な問題に適用される。
本稿では,ニューラルコンバージェンスネットワークに最適化層を組み込む新しいアクター批判パラダイムである構造化強化学習(SRL)を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:03:20 GMT)
Expandable Decision-Making States for Multi-Agent Deep Reinforcement Learning in Soccer Tactical Analysis [6.8] サッカーなどの侵入チームスポーツは、多くの選手が共有フィールドで相互作用するときに、高次元で強く結合された状態空間を作り出す。
従来のルールに基づく分析は直感的であるが、現代の予測機械学習モデルは明示的なエージェント表現なしでパターンマッチングを行うことが多い。
本稿では,関係変数による原位置と速度を増大させる意味的にリッチな状態表現である拡張可能意思決定状態(EDMS)を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:22:01 GMT)
Beyond Direct Generation: A Decomposed Approach to Well-Crafted Screenwriting with LLMs [6.8] 大きな言語モデル(LLM)は、創造的な記述において大きな可能性を示します。
直接のエンドツーエンド生成アプローチは、よく製作されたスクリーンプレイを作るのに失敗することが多い。
本稿ではDSR(Dual-Stage Refinement)という,形式変換から創造的な物語生成を分離するフレームワークを紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:41:29 GMT)
AG-Fusion: adaptive gated multimodal fusion for 3d object detection in complex scenes [6.8] 本稿では,複雑なシーンにおけるロバスト検出のための信頼性の高いパターンを同定し,モーダル間知識を選択的に統合する新しい適応Gated Fusion手法を提案する。
本研究では,複雑な条件下での性能をベンチマークするために,エクスカベータ3D (E3D) という新しいデータセットを構築した。
提案手法は,標準のKITTIデータセットにおいて93.92%の精度で競合性能を達成するだけでなく,難易度の高いE3Dデータセットにおいて,ベースラインを24.88%上回り,複雑な産業シーンにおける信頼性の低いモーダル情報に対して優れたロバスト性を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:26:27 GMT)
Adaptive Training of INRs via Pruning and Densification [6.8] 本稿では、最適化の過程で暗黙的な神経表現を洗練させる適応的なトレーニングスキームであるAIReを紹介する。
提案手法では,表現能力を向上させるために,ニューロンプルーニング機構を用いて冗長性と入力周波数密度化を回避する。
コードと事前訓練されたモデルは、パブリック使用のためにリリースされる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:52:46 GMT)
Leveraging Approximate Caching for Faster Retrieval-Augmented Generation [6.7] 本稿では,ユーザクエリの類似性を活用してRAGワークフローを最適化する,近似キー値キャッシュであるProximityを紹介する。
Proximityは、それぞれのクエリを独立して扱う代わりに、類似したクエリが現れると、以前検索されたドキュメントを再利用する。
我々の実験では、LSH方式と現実的にスキューされたMedRAGのワークロードとの近さは、データベースのリコールとテストの精度を維持しながら、データベース呼び出しを77.2%削減することを示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:20:28 GMT)
Bayes-Split-Edge: Bayesian Optimization for Constrained Collaborative Inference in Wireless Edge Systems [6.6] モバイルエッジデバイス(例えばAR/VRヘッドセット)は、通常、限られたオンボードコンピューティングとエネルギー資源で動作しながらタイムリーな推論タスクを完了する必要がある。
無線エッジネットワークにおける協調推論の問題について検討し,エネルギー制約のあるエッジデバイスが所定の期限内に推論タスクを完了することを目的とした。
無線ネットワーク上での協調分割推論にベイズ最適化を利用するベイズスプリットエッジ(Bayes-Split-Edge)という新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:36:51 GMT)
Learning Linearity in Audio Consistency Autoencoders via Implicit Regularization [6.6] 本稿では,高圧縮一貫性オートエンコーダにおいて,線形性を誘導する簡単なトレーニング手法を提案する。
CAEは、エンコーダとデコーダの両方に線形な挙動を示し、再構成の忠実さを保っている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:08:27 GMT)
Input Matters: Evaluating Input Structure's Impact on LLM Summaries of Sports Play-by-Play [6.5] NBAプレイ・バイ・プレイデータのLLM生成サマリーにおいて,入力構造が幻覚やその他の事実誤差に与える影響を定量化する。
2つのモデルで生成した180のゲームサマリーに対して,手動で3,312の事実誤りを警告した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:49:08 GMT)
Human-AI Collaboration: Trade-offs Between Performance and Preferences [6.5] 人間の行動に配慮したエージェントは、純粋にパフォーマンスを最大化するエージェントよりも好まれることを示す。
我々は、不平等-逆転効果が人間の選択の原動力であることの証拠を見つけ、人々がチームへの有意義な貢献を可能にする協力的なエージェントを好むことを示唆している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:39:48 GMT)
Direct Debiased Machine Learning via Bregman Divergence Minimization [6.4] エンド・ツー・エンド・アルゴリズムを用いた機械学習フレームワークを開発した。
我々は,ニュアンスパラメータ,回帰関数,リース表現器を定式化する。
Neyman のターゲット推定には Riesz の表現子推定が含まれており,Bregman の発散率を用いて不一致を計測する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:10:43 GMT)
TLCD: A Deep Transfer Learning Framework for Cross-Disciplinary Cognitive Diagnosis [6.3] 本稿では,ニューラルネットワーク認知診断と知識関連ニューラルネットワーク認知診断について,詳細な研究を行う。
革新的な学際的認知診断法(TLCD)を提案する。
本手法は,ディープラーニング技術と伝達学習戦略を組み合わせて,対象分野におけるモデルの性能を向上させる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:46:23 GMT)
Learned, Lagged, LLM-splained: LLM Responses to End User Security Questions [6.3] GPT、LLAMA、Geminiといった大規模言語モデル(LLM)は、セキュリティ以外のさまざまな質問に答える上で、有望であることを示している。
エンドユーザセキュリティの分野におけるLLMの性能について,900件のユーザセキュリティ質問に対して,定性的に3つのLLMを評価検討した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:54:02 GMT)
REASONING COMPILER: LLM-Guided Optimizations for Efficient Model Serving [6.2] 本稿では,逐次的かつコンテキスト対応な意思決定プロセスとして最適化を定式化する,新しいコンパイルフレームワーク(Dubbed Reasoning)を提案する。
提案手法は,LLM誘導推論がコンパイラ最適化のランドスケープを変革する可能性を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:22:07 GMT)
From Benchmarks to Business Impact: Deploying IBM Generalist Agent in Enterprise Production [6.2] 本稿では,汎用エージェント(CUGA)を用いたコンピュータの開発と試験経験について報告する。
CUGAは階層的なプランナー-実行アーキテクチャを採用し、強力な分析基盤を備えている。
それは、Business-Process-Outsourcing talent acquisition domainのパイロットとして評価された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:55:00 GMT)
Diffusion Generative Modeling on Lie Group Representations [6.2] リー群の表現空間で直接作用するスコアベースの拡散過程のクラスを導入する。
我々は、一般化された生成過程が、新しい種類のペア微分方程式(SDE)の解として生じることを証明している。
軌道空間変換の有効次元を小さくすることで,リー群の適切な選択により学習効率が向上することを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:31:55 GMT)
Inoculation Prompting: Instructing LLMs to misbehave at train-time improves test-time alignment [6.2] 接種プロンプティングは、トレーニングプロンプトを明示的に要求することで、望ましくない行動の学習を防止する。
IPは所望の能力の学習を大幅に減らすことなく、望ましくない行動の学習を減らす。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:05:19 GMT)
C-DiffDet+: Fusing Global Scene Context with Generative Denoising for High-Fidelity Car Damage Detection [6.2] グローバルシーンコンテキストとローカル提案機能を直接統合したContext-Aware Fusion(CAF)を導入する。
CAFは、各オブジェクトの提案がシーンレベルの理解に参加することを可能にすることで、生成的検出パラダイムを著しく強化する。
実験結果から,CarDDベンチマークにおける最先端モデルの改善が示された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:20:11 GMT)
Tagging-Augmented Generation: Assisting Language Models in Finding Intricate Knowledge In Long Contexts [6.1] 本稿では,Taging-Augmented Generation (TAG) を長文シナリオのための軽量データ拡張戦略として提案する。
NoLima と NovelQA という,難解で直接的な質問応答ベンチマークを2つ加えることで,私たちの仮説を検証する。
コンテキストをタグ付けしたり、あるいはQAプロンプトにタグ定義を追加するだけで、ベースラインよりも一貫したパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:23:25 GMT)
MFiSP: A Multimodal Fire Spread Prediction Framework [6.1] オーストラリアのブラック・サマー・ブッシュファイアでは、19万ヘクタールが破壊され、3,000軒の家屋が破壊され、7ヶ月続いた。
ファイア・モデリングは、ファイア・ビヘイビア・アナリティクス(FBA)と静的環境データによる手動の解釈に依存している。
本研究では,ソーシャルメディアデータとリモートセンシング観測を統合したMFISP(Multimodal Fire Spread Prediction Framework)を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:36:21 GMT)
GIFT: Group-relative Implicit Fine Tuning Integrates GRPO with DPO and UNA [6.1] GIFTはアライメントのための新しい強化学習フレームワークである。
暗黙の報酬モデルと明示的な報酬モデルとの差を最小限にする。
数学的ベンチマークにおいて優れた推論とアライメント性能を達成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:18:19 GMT)
Invertible generative models for inverse problems: mitigating representation error and dataset bias [6.1] 訓練された生成モデルは、撮像における逆問題の前兆として顕著な性能を示した。
設計による表現誤差がゼロな非可逆ニューラルネットワークは、逆問題における効果的な自然信号先行処理であることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:35:51 GMT)
Interpretable Neural ODEs for Gene Regulatory Network Discovery under Perturbations [6.1] 本稿では、生物学的に有意な神経常微分方程式(ニューラル・オード)を組み込んだ新しいフレームワークであるPerturbODEを提案し、摂動下での細胞状態の軌跡をモデル化する。
シミュレーションおよび実際の過剰表現データセット間での軌道予測とGRN推論におけるPerturbODEの有効性を実証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:06:54 GMT)
ProSpero: Active Learning for Robust Protein Design Beyond Wild-Type Neighborhoods [6.0] 本稿では,タンパク質工学の能動的学習フレームワークであるProSperoを提案する。
適合性関連残基選択と生物学的に制約されたシークエンシャルモンテカルロサンプリングを統合することにより,本手法は野生型近傍の探索を可能にする。
ProSperoは、さまざまなタンパク質工学タスクで既存のメソッドを一貫して上回るか、マッチする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:12:30 GMT)
LIME: Link-based user-item Interaction Modeling with decoupled xor attention for Efficient test time scaling [6.0] 計算複雑性を低減する新しいアーキテクチャである textbfLIME を導入する。
LIME は最先端の変圧器とほぼ同値であるが、大きな候補セットや長いシーケンス長に対して 10$times$ の推論速度を持つ。
主要なレコメンデーションプラットフォームでテストすると、LIMEは最小の推論コストを維持しながらユーザエンゲージメントを改善した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:18:47 GMT)
RL-AUX: Reinforcement Learning for Auxiliary Task Generation [5.9] 補助タスクを動的に作成するためのRLベースのアプローチを提案する。
このフレームワークでは、RLエージェントがトレーニングセット内の各データポイントに対する補助ラベルを選択する。
ウェイトラーニングのアプローチは、これらのベンチマーク全てを大幅に上回っています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:51:51 GMT)
How AI Forecasts AI Jobs: Benchmarking LLM Predictions of Labor Market Changes [5.8] 本稿では,大規模言語モデル(LLM)が仕事需要の変化をどの程度予測できるかを評価するためのベンチマークを紹介する。
当社のベンチマークでは、米国におけるセクターレベルの求職率の高頻度指標と、AIの採用による職業変化のグローバルデータセットの2つのデータセットを組み合わせています。
その結果、構造化タスクは予測安定性を継続的に改善し、ペルソナプロンプトは短期的な傾向に有利であることがわかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:08:27 GMT)
Softmax is $1/2$-Lipschitz: A tight bound across all $\ell_p$ norms [5.6] 我々は、ソフトマックス関数がリプシッツ定数1/2$と縮約可能であることを証明した。
我々の知る限り、これはソフトマックスリプシッツ連続性の包括的ノルム・ユニフォーム解析である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:16:04 GMT)
LangLingual: A Personalised, Exercise-oriented English Language Learning Tool Leveraging Large Language Models [5.6] LangLingualはLangChainフレームワークを使って構築された対話型エージェントで、Large Language Modelsを利用している。
このシステムは、リアルタイムで文法を重視したフィードバックを提供し、文脈認識言語演習を生成し、時間とともに学習者の習熟度を追跡するように設計されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:11:07 GMT)
Seq-DeepIPC: Sequential Sensing for End-to-End Control in Legged Robot Navigation [5.6] 実環境におけるロボットナビゲーションのための逐次的エンドツーエンド認識制御モデルであるSeq-DeepIPCを提案する。
モデルはセマンティックセグメンテーションと深さ推定を共同で予測し、計画と制御のためのより豊かな空間的特徴を与える。
道路と草地の両方を含む大規模で多様なデータセットを収集し,ロボット犬を用いたSeq-DeepIPCの有効性を確認した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:39:57 GMT)
Finite temperature Casimir effect in one-dimensional scalar field with double delta-function potentials [5.5] 正準量子化法を用いてカシミール力とエントロピーを計算し、標準リフシッツ理論の結果と対比する。
有限温度の場合、長距離極限において、カシミール力は$F_C(a,T)=-T/(4a)$として崩壊し、リフシッツ理論は正準量子化の2倍の大きさを予測している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:30:41 GMT)
Towards Generalisable Foundation Models for 3D Brain MRI [5.5] 我々は、DINO-v2を拡張することで構築された脳MRIのための自己教師型基礎モデルBrainFoundを紹介する。
BrainFoundはDINO-v2を、シーケンシャルMRIスライスからの情報を取り込むことで、完全な3D脳解剖学をモデル化する。
シングルモーダル入力とマルチモーダル入力の両方をサポートし、疾患検出やイメージセグメンテーションなど、幅広い下流タスクを可能にする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:19:46 GMT)
Identifiability of Autonomous and Controlled Open Quantum Systems [5.4] オープン量子系は、量子力学と解析の交わりにおける豊富な研究領域である。
様々なマスター方程式を考慮し、自律的および制御されたオープン量子系の複数のビューを統一する。
これらの系に対する量子状態同定可能性の対応する概念を定式化する。
我々は、オープン量子系の同定に対する多くの建設的アプローチの基礎を定めている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:16:29 GMT)
Bi-Encoder Contrastive Learning for Fingerprint and Iris Biometrics [5.4] 我々は,指紋と指紋のマッチング,虹彩と虹彩のマッチング,異形指紋と虹彩のマッチングという3つの検証タスクでネットワークをトレーニングする。
We found that iris ResNet architecture reach 91 ROC AUC score for iris-to-iris matching, provide clear evidence that the left and right irises of a individual。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:41:43 GMT)
Mutual Wanting in Human--AI Interaction: Empirical Evidence from Large-Scale Analysis of GPT Model Transitions [5.4] 主要なモデル遷移におけるこれらの期待を分析するために、"ミューチュアルな欲求"の概念を紹介します。
本研究では,人間とAIの相互作用における双方向欲求動態の大規模検証を行う。
これらの知見は、より信頼性が高くリレーショナルに認識されたAIシステムを構築するための明確な意味を持つ測定可能な現象として相互欲求を確立している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:16:02 GMT)
Chiral gapped states are universally non-topological [5.3] 2+1Dのカイラル間隙基底状態における角絡みは、ギャップ間の境界に障害を与えることを示す。
解析から得られる報奨の一つは、与えられた波動関数から同じカイラルギャップ位相内で局所ギャップ付きハミルトニアンを構成することができることである。
角絡みの解析により、キラルギャップ状態のバルク領域の絡み合い構造に符号化された普遍的等角形状の出現が明らかになった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:00:20 GMT)
GroupSHAP-Guided Integration of Financial News Keywords and Technical Indicators for Stock Price Prediction [5.3] GroupSHAPは、個々のトークンではなく、意味的に関連するキーワードグループのコントリビューションを定量化する。
我々は、2015年から2024年までのニュース記事の埋め込みにFinBERTを使用し、それらを一貫性のあるセマンティックグループに分類し、各グループの株価変動に対する貢献度を測定するためにGroupSHAPを適用した。
2024年を通してのS&P500指数の1日ごとの予測による実証結果は、我々のアプローチがMAEの32.2%、RMSEの40.5%の減少を達成することを示している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:33:18 GMT)
Faces of Fairness: Examining Bias in Facial Expression Recognition Datasets and Models [5.2] 本研究では、FERデータセットとモデルにおけるバイアス源について検討する。
AffectNet、ExpW、Fer2013、RAF-DBの4つの共通のFERデータセットが分析されている。
本研究は、最先端畳み込みニューラルネットワーク(CNN)モデルを含む6つの深層モデルのバイアスと公平性を評価する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:33:48 GMT)
The Cross-Lingual Cost: Retrieval Biases in RAG over Arabic-English Corpora [5.1] 言語間検索強化生成(RAG)は、言語間で回答を検索し、生成する重要な能力である。
我々は、実世界の企業データセットから得られたベンチマークを用いて、アラビア語のRAGをドメイン固有の設定で研究する。
両言語から等価な検索を強制したり、クエリを翻訳することで、この失敗の原因に対処する2つの簡単な検索戦略を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:40:12 GMT)
CIVIL: Causal and Intuitive Visual Imitation Learning [5.1] ロボットのための新しい訓練パラダイムを提案する。
ロボットがどのような行動をとるべきかを人間に示すのではなく、人間がなぜ意思決定をしたのかを直感的に示すことができるのです。
我々のシミュレーションと実世界の実験は、CIVILで訓練されたロボットが、どのような行動を取るか、なぜその行動を取るのかを学習していることを示しています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:10:19 GMT)
Understanding In-Context Learning Beyond Transformers: An Investigation of State Space and Hybrid Architectures [5.1] In-context Learning (ICL) の詳細な評価を、最先端変換器、状態空間、およびハイブリッド大言語モデル上で行う。
行動探索と介入に基づく手法を組み合わせることで、異なるアーキテクチャのLCMはタスク性能でも同じように振る舞うことができるが、内部は相変わらず異なることが判明した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:49:01 GMT)
DeepSalt: Bridging Laboratory and Satellite Spectra through Domain Adaptation and Knowledge Distillation for Large-Scale Soil Salinity Estimation [4.8] DeepSaltは、実験室ベースの分光から衛星ベースのハイパースペクトルセンシングへ高分解能のスペクトル洞察を伝達するフレームワークである。
提案手法は, 高精度で大規模な塩分濃度推定が可能でありながら, 大規模な地下水採取の必要性を排除している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:57:59 GMT)
Learning Interpretable Features in Audio Latent Spaces via Sparse Autoencoders [4.8] 我々は、音声オートエンコーダのラテントでSAEを訓練し、SAE特徴から線形マッピングを学習し、音響特性を識別する。
これにより、AI音楽生成プロセスの制御可能な操作と分析が可能になる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:35:39 GMT)
Towards Deep Physics-Informed Kolmogorov-Arnold Networks [4.7] チェビシェフをベースとした物理学インフォームドカン(cPIKAN)がその計算効率の点で標準となっている。
本稿では,アクティベーションのばらつきを保ち,安定性と精度を大幅に向上させる,基礎に依存しないグロトン様のスキームを提案する。
PirateNetアーキテクチャにヒントを得たResidual-Gated Adaptive Kans(RGAkans)を紹介する。
RGAkansは,特定のPDE設定において拡散相に停滞するベースラインcPIKANsと異なり,すべてのトレーニングフェーズを横断することに成功した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:35:01 GMT)
SBAN: A Framework & Multi-Dimensional Dataset for Large Language Model Pre-Training and Software Code Mining [4.7] SBANは、それぞれ290万の良性と672,000のマルウェアを含む300万以上のサンプルで構成されている。
このユニークなマルチモーダル構造は、クロス表現学習、ソフトウェアのセマンティック理解、自動マルウェア検出の研究を可能にする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:01:51 GMT)
Detecting and Rectifying Noisy Labels: A Similarity-based Approach [4.7] データセットのラベルノイズは、これらのデータセットでトレーニングされたディープニューラルネットワーク(DNN)のパフォーマンスと堅牢性を著しく損なう可能性がある。
提案手法は,DNNの入射特性を利用したポストホック・モデル非依存ノイズ検出・修正手法である。
我々の考えは、誤ラベル付きデータポイントと真のクラスデータポイントとの類似性は他のクラスのデータポイントよりも高いという観察に基づいている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:14:37 GMT)
Adaptive Forests For Classification [4.7] Random Forests (RF) とExtreme Gradient Boosting (XGBoost) は、最も広く使われ、高い性能の分類と回帰モデルである。
本稿では,CARTモデルの重みを適応的に選択する新しいアプローチであるAdaptive Forests (AF)を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:17:41 GMT)
Coupled Flow Matching [4.7] 制御可能な次元の縮小と高忠実度再構成を統合するフレームワークである結合フローマッチング(CPFM)を導入する。
CPFM は高次元データ x と低次元埋め込み y の両方に対して結合した連続流れを学習し、これは潜在空間フローを介して p(y|x) をサンプリングし、データ空間フローを介して p(x|y) をサンプリングすることができる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:22:35 GMT)
Unsupervised Classification of English Words Based on Phonological Information: Discovery of Germanic and Latinate Clusters [4.6] 言語横断的に、母語と借用語は異なる音韻規則に従う。
英字辞書におけるゲルマン語・ラテン語の区別は,個々の単語の音韻情報から学習可能であることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:10:43 GMT)
Neural Architecture Search for global multi-step Forecasting of Energy Production Time Series [4.6] 我々は時系列モデルの自動発見のためのニューラルネットワーク検索(NAS)ベースのフレームワークを設計する。
特に、エネルギー時系列の特徴的なパターンを捉えることができる効率的な成分のみからなる探索空間を導入する。
その結果,NASはトランスフォーマーなどの最先端技術よりも効率と精度の両面で優れていた。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:56:37 GMT)
sMRI-based Brain Age Estimation in MCI using Persistent Homology [4.5] 我々は、持続的ホモロジー、特に脳年齢予測のためのベティ曲線の使用を提案する。
提案フレームワークは、公開されているADNIデータセットから100個の構造MRIスキャンに適用される。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:15:29 GMT)
Is Your Prompt Poisoning Code? Defect Induction Rates and Security Mitigation Strategies [4.4] 大規模言語モデル(LLM)は自動コード生成には不可欠だが、出力の品質とセキュリティは依然として重要な問題である。
本稿では,目標の明確性,情報の完全性,論理的整合性という3つの重要な側面を含む,迅速な品質評価フレームワークを提案する。
ユーザプロンプトの品質向上は,AI生成コードのセキュリティを強化する上で,重要かつ効果的な戦略となっている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:59:17 GMT)
LLMs can hide text in other text of the same length [4.4] 意味のあるテキストは別のテキストの中に隠すことができる。
本稿では,大規模言語モデルを用いた簡便かつ効率的なプロトコルを提案する。
このようなプロトコルの存在は、権威的な意図からテキストを急進的に切り離すことを示し、さらに文書によるコミュニケーションに対する信頼を損なう。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:54:40 GMT)
Editable Noise Map Inversion: Encoding Target-image into Noise For High-Fidelity Image Manipulation [4.4] 効率的な画像編集の鍵となる戦略は、ソースイメージをターゲット画像に関連する編集可能なノイズマップに変換することである。
編集可能なノイズマップ・インバージョン(ENM Inversion)を提案する。これはコンテンツ保存性と編集性の両方を確保するために最適なノイズマップを探索する新しいインバージョン手法である。
また,ビデオ編集にも容易に適用でき,フレーム間の時間的一貫性とコンテンツ操作が可能となる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:34:13 GMT)
Hybrid Modeling, Sim-to-Real Reinforcement Learning, and Large Language Model Driven Control for Digital Twins [4.3] 本研究では,動的システムモデリングと制御におけるディジタルツインの利用について検討する。
物理ベースの、データ駆動型、ハイブリッドなアプローチを、従来型とAI駆動型の両方のコントローラに統合する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:43:42 GMT)
Seeing Symbols, Missing Cultures: Probing Vision-Language Models' Reasoning on Fire Imagery and Cultural Meaning [4.3] VLM(Vision-Language Models)は、しばしば文化的に有能に見えるが、実際の文化的理解よりも表面的なパターンマッチングに依存している。
本稿では,火災をテーマとした文化イメージに基づくVLM推論を,分類解析と説明解析の両方を通して探究するための診断枠組みを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:22:21 GMT)
Scalable GPU-Based Integrity Verification for Large Machine Learning Models [4.3] 我々は、CPUとGPUプラットフォーム間の整合性保護を標準化することで、分散機械学習を強化するセキュリティフレームワークを提案する。
提案手法は,GPUアクセラレータ上での大規模なMLモデル実行と直接的に整合性検証を行う。
私たちは、基盤となるCPUやGPUインフラストラクチャに関係なく、エンタープライズチームがデプロイできるハードウェアに依存しない基盤を提供します。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:45:21 GMT)
Apollo: A Posteriori Label-Only Membership Inference Attack Towards Machine Unlearning [4.2] 我々は、厳密な脅威モデルに従って、データサンプルが未学習であるかどうかを推測する新しいプライバシ攻撃を提案する。
提案攻撃は,従来の攻撃に比べてターゲットモデルへのアクセスを少なくするが,未学習サンプルの登録状況は比較的精度が高い。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:22:43 GMT)
Are Agents Just Automata? On the Formal Equivalence Between Agentic AI and the Chomsky Hierarchy [4.2] 本稿では,現代エージェントAIシステムのアーキテクチャクラスと階層の抽象機械との形式的等価性を確立する。
単純な反射エージェントは有限オートマタと等価であり、階層的なタスク分解エージェントはプッシュダウンオートマタと等価であり、リフレクションに読み取り/書き込み可能なメモリを使用するエージェントはTMと等価であることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:22:02 GMT)
Program Evaluation with Remotely Sensed Outcomes [4.2] 経済効果の変化がRSVの変動を引き起こすことを示す。
直観を定式化することで治療効果を非パラメトリックに同定する。
我々は、衛星画像を用いて、インドにおける反ポルノプログラムの効果を再分析する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:57:45 GMT)
UKANFormer: Noise-Robust Semantic Segmentation for Coral Reef Mapping via a Kolmogorov-Arnold Network-Transformer Hybrid [4.1] 本稿では,ノイズ管理下での高精度マッピングを実現するためのセマンティックセグメンテーションモデルを提案する。
UKANFormerはデコーダにGlobal-Local Transformer(GL-Trans)ブロックを組み込んでおり、グローバルなセマンティック構造とローカル境界の詳細の両方を抽出することができる。
実験では、UKANFormerは67.00%のサンゴ級IoUと83.98%のピクセル精度を達成し、同じノイズラベル設定で従来のベースラインを上回った。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:44:38 GMT)
PrivacyGuard: A Modular Framework for Privacy Auditing in Machine Learning [4.1] PrivacyGuardは、経験的差分プライバシー(DP)分析のためのツールである。
機械学習(ML)モデルのプライバシリスクを評価するように設計されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:33:01 GMT)
Enforcing Calibration in Multi-Output Probabilistic Regression with Pre-rank Regularization [4.1] 任意のプリランク関数のトレーニング中に多変量キャリブレーションを強制する一般的な正規化フレームワークを提案する。
本手法は,予測精度を犠牲にすることなく,プリランク関数のキャリブレーションを大幅に改善することを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:17:45 GMT)
Measuring Teaching with LLMs [4.1] 本稿では,文レベルの埋め込みをベースとした独自のLarge Language Modelを使用する。
これらの特化モデルは,0.65以上の専門家による評価で,人間レベルおよび超人的性能を達成可能であることを示す。
また,総合的なモデルスコアは教師の付加価値尺度と一致し,生徒の学習に関連する特徴を捉えていることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:42:04 GMT)
Learning to Coordinate with Experts [4.0] さまざまな環境にまたがってRC-0をインスタンス化するオープンソースベンチマークであるRC-Benchを紹介します。
検証戦略を提案し,様々な学習方法の評価を行い,今後の研究に資する知見を提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:37:51 GMT)
Task-Agnostic Fusion of Time Series and Imagery for Earth Observation [4.0] 本稿では,時系列と単一タイムスタンプ画像のマルチモーダル融合のためのタスク非依存フレームワークを提案する。
本手法は時系列量子化のための決定論的および学習戦略を探索する。
我々のモデルは衛星画像から一貫した地球温度分布を生成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:38:52 GMT)
Symmetria: A Synthetic Dataset for Learning in Point Clouds [3.9] 任意のスケールで生成できる式駆動型データセットを提案する。
既知の構造と高い可変性を備えた形状を作成し、ニューラルネットワークがポイントクラウド機能を効果的に学習できるようにする。
その結果、このデータセットは、ポイントクラウドの自己教師付き事前トレーニングに非常に効果的であることが示された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:18:26 GMT)
Towards a Functionally Complete and Parameterizable TFHE Processor [3.9] TFHEは高速トーラスベースの完全同型暗号方式である。
これは、他のどのFHEスキームよりも高速なブートストラップ動作性能を提供する。
ホモモルフィック回路の評価には計算オーバーヘッドがかなり高い。
本稿では,同相回路評価のためのFPGAベースのハードウェアアクセラレータを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:16:40 GMT)
Relaxed Sequence Sampling for Diverse Protein Design [3.9] 本稿では,タンパク質設計のための構造情報と進化情報を統合するフレームワークであるRelaxed Sequence Samplingを紹介する。
RSSは連続ロジット空間で動作し、勾配誘導探索とタンパク質言語モデルインフォームドジャンプを組み合わせた。
インサイリコタンパク質バインダー設計タスクでは、RSSは5$times$より多くの設計可能な構造と2-3$times$RSOベースラインよりも大きな構造多様性を生成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:18:36 GMT)
Compiler.next: A Search-Based Compiler to Power the AI-Native Future of Software Engineering [3.8] 我々はAIネイティブソフトウェアシステムのシームレスな進化を可能にするために設計された新しい検索ベースのコンパイラであるCompiler.nextを紹介する。
従来の静的コンパイラとは異なり、Compiler.nextは人間によるインテントを取り込み、最適なソリューションを探すことで動作するソフトウェアを自動的に生成する。
本稿では、高品質なプログラミング構造の開発、効率的な検索構造、コンパイラ間の相互運用性など、インテントコンパイルにおける中核的な課題に対処するためのロードマップを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:01:48 GMT)
DPGLA: Bridging the Gap between Synthetic and Real Data for Unsupervised Domain Adaptation in 3D LiDAR Semantic Segmentation [3.8] 自己学習ベースのUnsupervised Domain Adaptation (UDA)は、ポイントクラウドセマンティックセマンティックセグメンテーションを改善するために広く利用されている。
本稿では,ポイントクラウドUDAセマンティックセマンティックセグメンテーションにおける実データ利用を向上させるための動的擬似ラベルフィルタリング手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:05:59 GMT)
Toward Interpretable Evaluation Measures for Time Series Segmentation [3.7] 本稿では,分割エラーの位置を考慮に入れたWARI(Weighted Adjusted Rand Index)と,分割エラーを識別・スコアするSMS(State Matching Score)を紹介する。
我々は、WARIとSMSを合成および実世界のベンチマークで実証的に検証し、より正確なセグメンテーション品質の評価を提供するだけでなく、従来の測定方法では利用できないエラーや型などの洞察も明らかにした。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:23:37 GMT)
Explaining Robustness to Catastrophic Forgetting Through Incremental Concept Formation [3.7] 破滅的な忘れは継続的学習において依然として中心的な課題であり、モデルでは、これまで学んだことを失うことなく、時間をかけて新しい知識を統合する必要がある。
先行研究では,視覚領域における破滅的忘れ込みに対する堅牢性を示す階層的概念形成モデルであるCobweb/4Vを紹介した。
この頑健さを動機として、このような安定性に寄与する要因に関する3つの仮説を考察する。
様々な複雑さのデータセットの実験では、適応的再構成は学習の可塑性を高め、スパース更新は干渉を軽減することを示し、情報理論学習プロセスは過去のデータを再考することなく事前の知識を保存する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:41:25 GMT)
Are ASR foundation models generalized enough to capture features of regional dialects for low-resource languages? [3.7] 78時間の注釈付きBengali Speech-to-Text(STT)コーパスであるBen-10を開発した。
言語的・データ駆動的な視点からの調査は、言語基盤モデルが地域方言ASRで苦戦していることを示している。
我々は,すべての深層学習手法が方言変化下での音声データのモデル化に苦しむのを観察するが,方言固有のモデルトレーニングは問題を緩和する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:14:52 GMT)
Multitask Multimodal Self-Supervised Learning for Medical Images [3.7] この論文は、自己指導型学習技術とドメイン適応手法の開発に焦点を当てている。
ラベルのないデータから意味のある情報を抽出できる新しいプリテキストタスクを導入している。
このアプローチは、MedMNISTデータセットの使用を含む厳密な実験を通じて検証される。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:42:16 GMT)
Uncovering Singularities in Feynman Integrals via Machine Learning [3.6] 記号回帰に基づく機械学習フレームワークを導入し,多ループFeynman積分の完全記号アルファベットを抽出する。
還元よりも解析構造を対象とすることで、この手法は様々な積分の族に広く適用され、解釈可能である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:00:42 GMT)
Advancing Honeywords for Real-World Authentication Security [3.6] ハニーワード(Honeyword)は、本物のパスワードと共に保存されるデコイパスワードである。
10年以上の研究にもかかわらず、この技術は主要な認証プラットフォームには採用されていない。
本稿では,Honeywordsの中核となる概念には潜在的な可能性があるが,平坦性,統合性,信頼性といった問題に関するさらなる研究が必要であることを論じる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:44:20 GMT)
IKNet: Interpretable Stock Price Prediction via Keyword-Guided Integration of News and Technical Indicators [3.6] 個別のニュースキーワードと株価の動きのセマンティックな関連をモデル化するための解釈可能なキーワード誘導ネットワーク(IKNet)を提案する。
IKNetは、FinBERTベースの文脈分析を通じて有能なキーワードを特定し、それぞれの表現を別々の非線形投影層を通して処理し、その表現を技術指標の時系列データと統合し、翌日の閉値を予測する。
2015年から2024年にかけてのS&P 500データの実証的な評価は、IKNetがリカレントニューラルネットワークやトランスフォーマーモデルを含むベースラインを上回り、RMSEを最大32.9%削減し、累積リターンを18.5%改善したことを示している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:47:49 GMT)
Conformal Prediction for Hierarchical Data [3.5] 階層構造は、同じカバレッジレベルの予測領域のサイズを減らすために利用することができる。
我々はこの直観を分割共形予測手順に投影ステップを含めることで実現した。
結果の予測領域は, 実際に世界規模で小さいことが証明された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:33:38 GMT)
Quantum-Enhanced Multiparameter Sensing via Driven Multi-ensemble Superradiance [3.5] 我々は、大容量N$極限における駆動型マルチアンサンブル超ラジアント系のダーク状態共分散行列を解析的に導出した。
このシステムはマルチモード量子干渉計の候補となる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:31:19 GMT)
DynaStride: Dynamic Stride Windowing with MMCoT for Instructional Multi-Scene Captioning [3.5] インストラクショナルビデオにおけるシーンレベルのキャプションは、視覚的手がかりと時間的構造の両方を理解することで学習を強化することができる。
手動シーンセグメンテーションを必要とせずに、コヒーレントなシーンレベルのキャプションを生成するパイプラインDynaStrideを導入する。
我々はDynaStrideが時間的コヒーレントで情報的なキャプションを生成することを示し、AIによる指導コンテンツ生成を改善するための有望な方向性を示唆している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:29:08 GMT)
COUNTDOWN: Contextually Sparse Activation Filtering Out Unnecessary Weights in Down Projection [3.5] スパースアクティベーションメソッドは、推論中に非必須パラメータを選択的に非活性化する。
間接係数を利用するM-COUNTDOWNと、線形結合の直接係数を利用するD-COUNTDOWNの2つの方法を提案する。
我々のカーネル実装は、これらの理論的な成果を実質的な実世界の加速に効果的に実現している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:19:35 GMT)
Yesnt: Are Diffusion Relighting Models Ready for Capture Stage Compositing? A Hybrid Alternative to Bridge the Gap [3.4] キャプチャされたパフォーマンスを仮想世界に持ち込むには、ボリュームビデオのリライティングが不可欠だ。
現在のアプローチでは、時間的に安定し、生産可能な結果を提供するのに苦労しています。
本稿では,素材先行と時間的正規化と物理的動機付けレンダリングを組み合わせたハイブリッドリライトフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:28:55 GMT)
Free-Fermion Measurement-Induced Volume- to Area-Law Entanglement Transition in the Presence of Fermion Interactions [3.4] 多体系における一般的な体積-面積-法則の絡み合い遷移では、量子カオスが逮捕される。
これは、測定誘起相転移の場論において、ある「質量」項が消滅する傾向にあると主張する。
この場合、MIPTは非相互作用的なDIIIであり、体積法相は危険に無関係な質量を通して生じる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:00:02 GMT)
Enhancing Graph Neural Networks: A Mutual Learning Approach [3.4] 本研究では,グラフニューラルネットワーク(GNN)における協調学習の可能性について検討する。
事前学習した教師モデルがない場合、比較的単純で浅いGNNアーキテクチャが効率的に学習できることが示される。
学生GNNのアンサンブルが学習過程を通じて相互に教え合う協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:26:39 GMT)
BaZi-Based Character Simulation Benchmark: Evaluating AI on Temporal and Persona Reasoning [3.3] BaZiベースのペルソナ推論のための最初のQAデータセットを作成します。
本研究では,シンボル推論と大規模言語モデルを統合したBaZi-LLMシステムを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:51:13 GMT)
Onsiteability of Higher-Form Symmetries [3.3] 格子モデルの内部対称性は、アンシラを導入して有限深度回路に共役することにより、それがオンサイト作用に絡み合うことができれば、オンサイトであると言われている。
標準的なローアは、オンサイトビリティは(1+1)D の有限 0-形式対称性に対して実際に有効であるような異常な自由である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:00:00 GMT)
Deriving Transformer Architectures as Implicit Multinomial Regression [3.2] 固定された多重項回帰設定では、潜在特徴を最適化すると、注目ブロックによる特徴に誘導されるダイナミクスと整合する解が得られることを示す。
言い換えれば、変換器による表現の進化は、分類に最適な特徴を回復する軌跡として解釈できる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:26:55 GMT)
Connectome-Guided Automatic Learning Rates for Deep Networks [3.2] 本研究では,このコネクトーム再構成によって学習率をオンラインで調整するコネクトーム誘導自動学習率(CG-ALR)を提案する。
このコネクトロミクスにインスパイアされたメカニズムは、ネットワークの動的機能組織にステップサイズを適応させ、不安定な再構成中に学習を遅くし、安定した組織が出現するとそれを加速する。
脳コネクトームにインスパイアされた原理は、ディープラーニングにおける適応学習率の設計に役立ち、従来のSGDベースのスケジュールや最近の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:11:49 GMT)
Why Foundation Models in Pathology Are Failing [3.2] ファンデーションモデル(FM)はコンピュータビジョンと言語処理に革命をもたらした。
最近の評価では、診断精度の低下、ロバスト性の低下、幾何学的不安定性、重い計算要求、安全性の脆弱性など、根本的な弱点が示されている。
本稿では,主流AIにおける基本基盤モデリングの前提となる仮定と,人間の組織の本質的複雑さとの深い概念的ミスマッチから導かれることを論じる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:44:52 GMT)
A Fine-Grained Attention and Geometric Correspondence Model for Musculoskeletal Risk Classification in Athletes Using Multimodal Visual and Skeletal Features [3.1] 筋骨格障害はアスリートに重大なリスクをもたらし、早期にリスクを評価することは予防に重要である。
本研究では,視覚的および骨格的座標に基づく特徴を用いて筋骨格リスクを分類する,新しいマルチモーダル深層学習フレームワークであるViSK-GATを紹介する。
ViSK-GATは、9つの人気のある移行学習のバックボーンを一貫して上回り、AIによる筋骨格リスク評価を前進させる可能性を示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:42:00 GMT)
An Intelligent Water-Saving Irrigation System Based on Multi-Sensor Fusion and Visual Servoing Control [3.1] 本稿では,精密農業における重要な課題に対処するために,インテリジェントな貯水池システムを提案する。
このシステムは、高度なコンピュータビジョン、ロボット制御、マルチセンサー融合アプローチによるリアルタイム安定化技術を統合する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:43:20 GMT)
Progressive Growing of Patch Size: Curriculum Learning for Accelerated and Improved Medical Image Segmentation [3.0] 本稿では,3次元医用画像セグメンテーションのための自動カリキュラム学習手法であるPatch Sizeのプログレッシブグロースを紹介する。
カリキュラムのアプローチを,資源効率モードと性能モードの2つの設定で評価する。
提案した性能モードは,Dice Score性能の一定パッチサイズベースラインを超えるとともに,トレーニング時間を89%に短縮する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:55:12 GMT)
The Role of AI in Facilitating Interdisciplinary Collaboration: Evidence from AlphaFold [3.0] 本研究では,AI技術が学際的協調パターンにどのように影響するかを検討する。
1,247のAlphaFold関連論文と7700の著者をスコパスから分析し,文献分析と因果推論を用いた。
我々はAlphaFoldが構造生物学とコンピュータ科学のコラボレーションをわずか0.48%増加させ、他の分野に測定可能な影響を与えなかったことを示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:32:43 GMT)
Leveraging LLMs for Early Alzheimer's Prediction [2.9] 動的fMRI接続を時間的シーケンスとして符号化するコネクトームインフォームドLLMフレームワークを提案する。
本手法は, 臨床的に認識されたマージンよりはるかに低い誤差率で高感度な予測が可能であり, タイムリーなアルツハイマーの介入に影響を及ぼす。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:59:03 GMT)
Interpretable Tile-Based Classification of Paclitaxel Exposure [2.9] C6グリオーマ細胞の相コントラスト顕微鏡によるパクリタキセル曝露の分類について検討した。
本稿では,局所パッチ上で動作し,タイル出力を画像ラベルに結合する,単純なタイリング・アンド・アグリゲーションパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:13:51 GMT)
Direct Analysis of Zero-Noise Extrapolation: Polynomial Methods, Error Bounds, and Simultaneous Physical-Algorithmic Error Mitigation [2.8] ゼロノイズ外挿法(ゼロノイズ外挿法、ZNE)は、人工的に回路ノイズを増幅し、結果をノイズのない回路に外挿する量子誤差緩和法である。
本稿では、これらの課題を包括的に分析し、誤りを定量化するバイアスと分散を提示する。
本稿では,時間ステップサイズと雑音レベルを同時スケーリングすることで,回路とアルゴリズムの誤りを同時に軽減する手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:10:45 GMT)
Toward Carbon-Neutral Human AI: Rethinking Data, Computation, and Learning Paradigms for Sustainable Intelligence [2.8] 本稿では,大規模で静的なデータセットとモノリシックなトレーニングパラダイムへの依存度を批判する。
我々は,段階的な学習,炭素認識の最適化,ループ内の人間とのコラボレーションを重視した,新しいフレームワークであるHuman AIを紹介した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:02:30 GMT)
Bayesian Nonlinear PDE Inference via Gaussian Process Collocation with Application to the Richards Equation [2.8] 非線形偏微分方程式 (PDE) における未知のパラメータの推定は、幅広い科学的領域にわたって貴重な洞察を与える。
本研究では,農業研究における土壌-植物系の理解に不可欠であるリチャーズ方程式における植物根のパラメータの推定に焦点をあてる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:27:18 GMT)
Learning Robust Satellite Attitude Dynamics with Physics-Informed Normalising Flow [2.7] 宇宙機の姿勢力学の学習に物理インフォームドニューラルネットワークを組み込むことの利点について検討する。
バシリスクシミュレータで生成されたシミュレーションデータに基づいて複数のモデルを訓練する。
PINNベースのモデルは、制御精度とロバスト性の観点から、純粋にデータ駆動モデルよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:54:27 GMT)
A Data-driven ML Approach for Maximizing Performance in LLM-Adapter Serving [2.6] 本研究では、飢餓を引き起こすことなくGPUスループットを最大化する並列アダプタと並列アダプタの結合構成を決定することに焦点を当てる。
このキャッシュ問題に対処するために、解釈可能なモデルを活用するデータ駆動型MLアプローチを提案する。
vLLMフレームワークとLoRAアダプタによる実験では、Digital Twinは実際の結果の5.1%以内のスループットを再現している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:59:46 GMT)
Multi-Stage Field Extraction of Financial Documents with OCR and Compact Vision-Language Models [2.6] 金融文書は、規制当局、監査官、金融機関にとって重要な情報源である。
これらの文書は異質であり、同じレポートの中で物語、表、図形、多言語の内容が混在する傾向がある。
本稿では,従来の画像処理モデルとOCR抽出を利用するマルチステージパイプラインと,構造化されたフィールド抽出のためのコンパクトなVLMを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:56:08 GMT)
RS-ORT: A Reduced-Space Branch-and-Bound Algorithm for Optimal Regression Trees [2.6] MIP(Mixed-integer Programming)は最適な決定木を学習するための強力なフレームワークとして登場した。
連続的な特徴を内在的にバイナライズすることは、グローバルな最適性を犠牲にし、しばしば不必要に深い木を産み出す。
最適回帰木学習を2段階最適化問題として再放送し、RS-ORT(Reduceed-Space Optimal Regression Trees)を提案する。
RS-ORTは木構造変数のみに枝分かれする特殊分岐結合(BB)アルゴリズムである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:17:09 GMT)
Treble10: A high-quality dataset for far-field speech recognition, dereverberation, and enhancement [2.6] 本稿では,大規模で物理的に正確な室内音響データセットであるTreble10を紹介する。
Treble10には、3000以上のブロードバンドルームインパルス応答(RIR)が含まれており、フル装備の現実世界の10室でシミュレートされている。
全ての信号は32kHzでシミュレートされ、低周波効果と高周波反射を正確にモデル化する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:17:44 GMT)
The Best of N Worlds: Aligning Reinforcement Learning with Best-of-N Sampling via max@k Optimisation [2.6] 我々は、pass@kの連続的な一般化であるmax@kメトリックの最適化に注力する。
我々は、現在のRLVRアルゴリズムで一般的な要素であるオフ・ポリティクス・アップデートへの導出を拡張し、より優れたサンプル効率を実現する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:47:30 GMT)
Language Models for Longitudinal Clinical Prediction [2.6] 凍結した大言語モデルを用いて縦断的臨床データを解析する軽量フレームワークについて検討する。
このアプローチは、言語モデル空間内の患者履歴とコンテキストを統合し、モデル微調整なしで正確な予測を生成する。
最小限のトレーニングデータでも正確で信頼性の高いパフォーマンスを実現し、早期のアルツハイマーの監視を約束する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:49:03 GMT)
The Complexity Trap: Simple Observation Masking Is as Efficient as LLM Summarization for Agent Context Management [2.6] LLM(Large Language Model)ベースのエージェントは、反復的推論、探索、ツール使用によって複雑なタスクを解決する。
本稿では,SWE-bench Verified上でのSWE-agentにおけるこれらのアプローチの体系的比較について述べる。
簡易な環境監視マスキング戦略は,LLM要約の解解率をわずかに上回りながら,原材料と比較してコストを半減することがわかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:08:54 GMT)
Efficient and Encrypted Inference using Binarized Neural Networks within In-Memory Computing Architectures [2.6] Binarized Neural Networks (BNN) は、最小限の計算資源を利用するように設計されたディープニューラルネットワークのクラスである。
近年の研究では、BNNモデルパラメータを新しい不揮発性メモリ技術にマッピングする可能性を強調している。
しかし、モデルパラメータを暗号化されたフォーマットに格納し、実行時に復号化することにより、盗難攻撃から保護することで、計算オーバーヘッドが大幅に増大する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:59:02 GMT)
Diffuse to Detect: A Generalizable Framework for Anomaly Detection with Diffusion Models Applications to UAVs and Beyond [2.4] UAVセンサーの読み取りなどの複雑な高次元データにおける異常検出は、運用上の安全性に不可欠である。
本稿では,拡散モデルを適用して異常検出を行うDiffuse to Detect(DTD)フレームワークを提案する。
DTDは1ステップの拡散プロセスを用いてノイズパターンを予測し、再構成エラーのない異常の迅速かつ正確な同定を可能にする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:08:08 GMT)
Tunable absorption spectrum splitting in a pulse-driven three-level system [2.4] 2レベルの系が強い入射場によって共鳴によって駆動されると、その放射スペクトルはよく知られたモロー三重項によって特徴づけられる。
2レベル系が周期的なパルス列によって駆動される場合、発光スペクトルはモロー三重項と類似していることが示されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:35:16 GMT)
AI-Assisted Authoring for Transparent, Data-Driven Documents [2.4] テキストの断片をホバリングすることで、読者が基礎となるデータとの関係を探ることのできる、インタラクティブなWebベースの学術論文である_transparent Document_を紹介した。
エージェントベースのツールは、透明なドキュメントの作成中に人間の著者をサポートし、データから計算できるテキストの断片を識別する。
結果の式は記事のWebページに挿入され、静的テキストフラグメントを相互作用可能なデータ駆動要素に変換する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:39:05 GMT)
iPac: Incorporating Intra-image Patch Context into Graph Neural Networks for Medical Image Classification [2.3] iPacは、グラフニューラルネットワーク画像分類を強化するために、画像の新しいグラフ表現を導入する新しいアプローチである。
iPacはパッチパーティショニング、機能抽出、クラスタリング、グラフ構築、グラフベースの学習など、さまざまなステージを統合している。
本手法は画像分類,特に医用画像の領域において汎用的で汎用的なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:37:16 GMT)
All-Gaussian State Discrimination Beyond the Coherent Helstrom Bound [2.2] 長年の目標は、コヒーレント状態に符号化されたBPSK信号に対してヘルストローム境界と呼ばれる基本的な量子限界に達することである。
ガウス光学(英語版)のみを用いて、圧縮状態の変位とホモダイン検出を行い、コヒーレント状態と任意の量子測定を用いて達成できる誤差率以下でBPSK信号を識別する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:27:29 GMT)
Geometry-Inspired Unified Framework for Discounted and Average Reward MDPs [2.2] 我々は,最近導入されたディスカウント・リワード事件に対するMDPの幾何学的解釈を,平均リワード事件まで拡張する。
特異かつエルゴード的な最適ポリシーの下で、バリューイテレーションアルゴリズムは幾何収束率を達成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:42:53 GMT)
Floating-Point Neural Network Verification at the Software Level [2.2] ニューラルネットワークコンポーネントの動作は、安全クリティカルなシステムにデプロイする前に、正しく証明されなければならない。
既存のニューラルネットワーク検証技術は、ソフトウェアレベルでの欠陥の欠如を証明できない。
浮動小数点の実装を明示的に推論することで、ニューラルネットワークが安全であることを特定し、検証する方法を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:43:19 GMT)
Physics-informed diffusion models for extrapolating crystal structures beyond known motifs [2.2] 物理インフォームド拡散法を開発した。
これらのメトリクスを条件付けすることで、アーキテクチャ全体の生成性能が向上します。
その結果, 生成モデルは結晶構造予測の代用ではないが, 化学的に情報を得た多様性誘導出力によりCSP効率が向上することが示唆された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:21:35 GMT)
Hope Speech Detection in Social Media English Corpora: Performance of Traditional and Transformer Models [2.1] 本提案では,学習データセットを学習,開発,テストセットとして,従来の機械学習モデルと微調整変換器の評価を行う。
トランスフォーマーモデルはより良い結果をもたらし、最良のモデルは重み付き精度が0.82、重み付きリコールが0.80、重み付きF1が0.79、マクロF1が0.79、精度が0.80に達した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:53:40 GMT)
Improving Product Search Relevance with EAR-MP: A Solution for the CIKM 2025 AnalytiCup [2.1] 本稿ではCIKM 2025 AnalytiCupのソリューションについて報告する。
提案手法では,全文を英語に翻訳することで,多言語データセットを正規化し,広範囲なデータクリーニングと正規化によって雑音を緩和する。
モデルトレーニングでは,DeBERTa-v3-large上に構築し,ラベルの平滑化,自己蒸留,ドロップアウトによる性能向上を行う。
制約付き計算では,F1スコアはQC0.8796,QI0.8744となる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:32:13 GMT)
Echo State Transformer: Attention Over Finite Memories [2.1] 本稿では,逐次データ処理の課題をエレガントに解決するハイブリッドアーキテクチャであるEcho State Transformers(EST)を紹介する。
ESTはTransformerのアテンションメカニズムとReservoir Computingの原則を統合し、固定サイズのウィンドウ分散メモリシステムを作成する。
ESTは5つのカテゴリのうち2つで総合的にランク付けし、分類と異常検出タスクにおける最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:37:07 GMT)
A Neural Network Framework for Discovering Closed-form Solutions to Quadratic Programs with Linear Constraints [2.1] ディープニューラルネットワーク(DNN)は、多くのアプリケーションで複雑な最適化問題をモデル化するために使われてきた。
大規模なデータセットでトレーニングされているにも関わらず、ソリューションの最適性と実現性を保証するのは難しい。
本稿では,線形制約のある二次プログラムに対して,厳密な閉形式解を求めるNNモデリング手法と学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:11:44 GMT)
What Is Your AI Agent Buying? Evaluation, Implications and Emerging Questions for Agentic E-Commerce [2.0] プラットフォームに依存しないエージェントと完全にプログラム可能なモックマーケットプレースを組み合わせたサンドボックス環境を開発した。
まず、集合的な選択を探索し、モデル間でモーダルな選択が異なることを明らかにする。
次に、合理性チェックと、製品の位置と属性の列挙に関するランダム化実験により、選択のドライバを分析します。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:10:36 GMT)
Assessing the Completeness of Traffic Scenario Categories for Automated Highway Driving Functions via Cluster-based Analysis [2.0] この研究は、トラフィックシナリオクラスタリングのためのパイプラインを導入し、シナリオカテゴリの完全性を分析する。
交通シナリオカテゴリーの完全性に対するカテゴリ数の影響を解析した。
その結果,従来よりもクラスタリング性能が優れていた。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:50:39 GMT)
ARCS: Agentic Retrieval-Augmented Code Synthesis with Iterative Refinement [2.0] ARCSは凍結モデル上で、予算化された合成実行再生ループを介して動作する。
生成前に関連するコードコンテキストを検索し、候補を提案し、テストに対して実行し、実行フィードバックに基づいて修正する。
LANLの科学コーパスでは、ベースラインRAGよりも+0.115改良されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:23:02 GMT)
Foundational theory for optimal decision tree problems. II. Optimal hypersurface decision tree algorithm [2.0] このシリーズのパート1では、4つの公理を通して適切な決定木モデルを厳格に定義した。
第2部では,第1次超曲面決定木(HODT)アルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:43:37 GMT)
Foundational theory for optimal decision tree problems. I. Algorithmic and geometric foundations [2.0] 第1部では, ODT問題に関する4つの新しい定義を紹介する。
第2部では,第1次最適超曲面決定木アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:38:54 GMT)
AI and the Decentering of Disciplinary Creativity [1.9] 創造性の哲学における最近の研究に基づいて、創造的なアプローチと創造的なプロダクトを区別します。
計算が学際的な創造性を拡張できる一方で、AIを含むある種のアプローチは、それを置き換えるのに役立つことを示します。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:05:41 GMT)
Combining SHAP and Causal Analysis for Interpretable Fault Detection in Industrial Processes [1.9] この研究は、テネシー・イーストマン・プロセス(テネシー・イーストマン・プロセス)の複雑な力学でよく知られたベンチマークを用いて、そのような困難に対処する。
我々は、問題をより管理可能で透明な形式に転換し、障害予測を駆動する最も重要なプロセスの特徴を指摘します。
その結果得られた因果構造は、SHAPの発見と著しく一致し、重要なプロセス要素である冷却と分離システム(障害発生の鍵となるもの)を一貫して強調した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:56:46 GMT)
PPFL-RDSN: Privacy-Preserving Federated Learning-based Residual Dense Spatial Networks for Encrypted Lossy Image Reconstruction [1.9] Residual Space Networks (RDSNs) を用いた低解像度入力からの高画質画像の再構成は極めて困難である。
データ漏洩や推論攻撃、高い計算と通信コストなど、プライバシー上の重大なリスクが伴う。
本稿では,暗号化された損失画像再構成に適した,プライバシ保存型フェデレーションベースDenseNフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:09:31 GMT)
ProfileXAI: User-Adaptive Explainable AI [1.8] ProfileXAIは、検索とポストホックの説明器を結合して、さまざまなタイプのユーザのための説明を生成する。
システムは、マルチモーダルな知識ベースを索引付け、定量的基準によりインスタンスごとの説明者を選択し、チャット対応のプロンプトを備えた基礎的な物語を生成する。
心臓疾患と甲状腺癌のデータセットでは, 忠実度, 堅牢性, パーシモニー, トークン使用, 知覚品質を評価した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:34:02 GMT)
CURVETE: Curriculum Learning and Progressive Self-supervised Training for Medical Image Classification [1.8] 本稿では,Curriculum Learning and Progressive Self-supervised Training(CURVETE)という,新しい深層畳み込みニューラルネットワークを提案する。
CurVETEは、限られたサンプルに関する課題に対処し、モデルの一般化性を高め、全体的な分類性能を向上させる。
これを実現するために, 一般的な未学習サンプルの学習中に, サンプル分解の粒度に基づいてカリキュラム学習戦略を適用する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:46:02 GMT)
Are LLMs Empathetic to All? Investigating the Influence of Multi-Demographic Personas on a Model's Empathy [1.6] 本研究では,大言語モデルの認知的・情緒的共感が,人口統計学的属性の交差によって定義されるユーザ・ペルソナによってどのように異なるかを検討する。
本研究は, 年齢, 文化, 性別の組み合わせで構築した, 315人の独特なペルソナの交叉分析について紹介する。
儒教文化など,特定の集団に対して顕著な不適応を伴って,現実世界の共感傾向を広く反映していることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:25:32 GMT)
Application Scale Quantum Circuit Compilation with Controlled Error [1.6] 我々は、量子回路のコンパイルと最適化においてトレードオフを管理し、最適化するための実用的なワークフローを開発する。
最大380量子ビットで動作するベンチマークアルゴリズム回路のワークフローを実演する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:41:44 GMT)
Design principles of deep translationally-symmetric neural quantum states for frustrated magnets [1.5] ディープニューラルネットワーク量子状態は、量子マグネットの基底状態を研究する主要な方法として登場した。
本稿では、変圧器の要素を畳み込みネットワークに組み込むように設計されたConvNextアーキテクチャを、量子多体基底状態に適用する。
いくつかのフラストレーション・スピン・システムで成功しているファクタード・ビジョン・トランスフォーマーと著しく類似していることが判明した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:18:28 GMT)
Network Intrusion Detection: Evolution from Conventional Approaches to LLM Collaboration and Emerging Risks [1.5] この調査は、ネットワーク侵入検知システム(NIDS)の進化を体系化する。
従来の技術の現状、強み、限界を明確かつ簡潔に要約する。
LLMのNIDSへの適用に関する最近の研究を概観する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:21:32 GMT)
Out of the Loop: Structural Approximation of Optimisation Landscapes and non-Iterative Quantum Optimisation [1.5] 解空間構造からQAOA最適化景観を効率的に近似する手法を導入する。
2レベルハミルトニアンに対する単位深度QAOAの新しいアルゴリズムを導出する。
我々のアプローチは、QAOAにおける量子非依存構造に関する長年の予想を証明することに基づいている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:40:45 GMT)
A Physics-informed Multi-resolution Neural Operator [1.4] 本稿では,Resolvion Independent Neural Operator (RINO) フレームワークを完全データフリーな設定に拡張することにより,物理インフォームド演算子学習手法を提案する。
本研究では,リゾリューション独立ニューラル演算子(RINO)フレームワークを完全データフリーな設定に拡張することにより,物理インフォームド演算子学習手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:50:02 GMT)
StreetMath: Study of LLMs' Approximation Behaviors [1.4] 実世界の近似シナリオ下でのモデルの近似能力を評価するために設計されたベンチマークであるStreetMathを紹介する。
我々の分析によると、LLMは一般に近似を求めるタスクにおいても、正確な値や外部ツールを計算しようと試みている。
我々は、LLMは、人間が街路数学の設定で行うのと同じように、認知的ミスを示さないと論じる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:16:00 GMT)
Representer Theorems for Metric and Preference Learning: Geometric Insights and Algorithms [1.4] ヒルベルト空間における計量および選好学習の幅広いクラスに対処する枠組みを開発する。
計量学習の一般的な課題として、我々の枠組みは単純で自己完結した表現定理に導かれる。
最後に、我々の代表者定理は、計量と選好学習のための新しい非線形アルゴリズムに導かれる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:24:00 GMT)
Symbolic Neural Generation with Applications to Lead Discovery in Drug Design [1.4] 本稿では,記号学習とニューラル推論を組み合わせたハイブリッド型ニューロシンボリックモデルについて検討する。
textitSymbolic Neural Generators (SNGs)では、シンボリック学習者が少数のインスタンスから実行可能なデータの論理的仕様を検証している。
Inductive Logic Programming (ILP) の制限形式と大規模言語モデル (LLM) を組み合わせたSNGを実装し, 初期薬物設計で評価する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:29:22 GMT)
Mixed Precision Training of Neural ODEs [1.3] 本稿では,ニューラルネットワークのための混合精度学習フレームワークを提案する。
明示的なODEソルバとカスタムバックプロパゲーションスキームを組み合わせる。
約50%のメモリ削減と最大2倍のスピードアップを実現し、精度は単精度トレーニングに匹敵する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:32:56 GMT)
Decentralized Causal Discovery using Judo Calculus [1.3] 柔道計算を用いた因果発見のための直観主義的な分散化フレームワークについて述べる。
因果的主張は、一度に至る所ではなく、体制の表紙に真実であることが証明されている。
合成データセットから実世界のデータセットまで,生物学や経済学まで,さまざまな領域で実験結果を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:49:50 GMT)
Open quantum battery in three-dimensional rotating black hole spacetime [1.3] ディリクレ境界条件では、ブラックホールの回転は充電性能を有限時間で向上させることを示す。
ブラックホールが極端回転に近づくと、充電性能は大幅に増幅または抑制される。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:24:34 GMT)
$\mathbb{Z}_2$ lattice gauge theories: fermionic gauging, transmutation, and Kramers-Wannier dualities [1.3] 従来の$mathbbZ$ゲージ理論と$mathbbZ$ゲージ理論のユニタリ同値性を示す。
フェルミオンパリティのゲージ理論は、さらにジョルダン・ウィグナー変換によって得られる折りたたみイジング連鎖と同値であることが示される。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:12:16 GMT)
Model-free filtering in high dimensions via projection and score-based diffusions [1.3] 計量射影 $pi_mathscrM(Y)$ of $Y$ を多様体 $mathscrM$ 上で推定する。
我々の主要な理論的結果は、高次元$d$の極限において、この後続$mathbbPXmid Y$は所望の計量射影の近くで集中していることを示している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:34:46 GMT)
A Novel Multi-branch ConvNeXt Architecture for Identifying Subtle Pathological Features in CT Scans [1.2] 本稿では,医療画像解析の難題に特化して設計されたマルチブランチConvNeXtアーキテクチャを提案する。
提案モデルでは,厳密なデータ前処理から拡張まで,厳格なエンドツーエンドパイプラインを組み込んでいる。
実験結果から、最終的なROC-AUCは0.9937、バリデーション精度は0.9757、F1スコアは0.9825である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:25:00 GMT)
EthVault: A Secure and Resource-Conscious FPGA-Based Ethereum Cold Wallet [1.2] ウォレットは通常、暑さと寒さに分類され、様々なセキュリティと利便性を提供する。
マルウェアやサイドチャネル攻撃に弱いため、加害者は秘密鍵を抽出できる。
この研究は、階層的な決定論的コールドウォレットのための最初のハードウェアアーキテクチャであるEthVaultを提示する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:35:21 GMT)
TurboPortrait3D: Single-step diffusion-based fast portrait novel-view synthesis [1.2] 人間の肖像画の低遅延ノベルビュー合成法であるTurboPortrait3Dを紹介する。
提案手法は,既存の3次元画像生成モデルが視覚的アーティファクトの傾向にあることを示すものである。
合成多視点データの大規模なコーパスの事前学習を含む,新しい効果的なトレーニング戦略を導入する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:28:11 GMT)
Exploring Structures of Inferential Mechanisms through Simplistic Digital Circuits [1.2] 認識に関する自然と人工の両方の見解は、明らかに統一された枠組みを欠いている。
シンボリックAIモデリング技術によって誘導される推論機構について考察する。
我々は8つの共通な推論パターンを同定し、従来とは異なる推論機構を統一フレームワークで明らかにした。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:18:25 GMT)
Experimental memory control in continuous variable optical quantum reservoir computing [1.2] 量子貯水池コンピューティング(QRC)は、時間的タスクに適したオンライン量子強化機械学習のための有望なフレームワークを提供する。
本稿では,決定論的に生成されたマルチモード圧縮状態に基づく光QRCプラットフォームを実証する。
本研究では, 絡み合った多モード構造を利用することで, 量子貯水池の表現性とメモリ容量を著しく向上させることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:10:08 GMT)
Validating Formal Specifications with LLM-generated Test Cases [1.2] 本稿では,事前学習された大規模言語モデル(LLM)を用いて,自然言語要求からテストケースを生成する実験結果について報告する。
評価は最先端の GPT-5 モデルに焦点をあてるが,他のクローズドおよびオープンソース LLM の結果も報告する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:02:20 GMT)
Detecting Religious Language in Climate Discourse [1.2] 本稿では、世俗的・宗教的な非政府組織(NGO)が生み出した気候関連文献において、宗教的言語の明示的・暗黙的な形態が如何に現れるかを検討する。
本稿では、エコロジー文献から派生した宗教用語の階層木を用いたルールベースモデルと、ゼロショット環境で動作する大規模言語モデル(LLM)を導入する。
880,000文以上のデータセットを用いて、これらの手法がどのように宗教言語を検知し、合意点と相違点を分析するかを比較する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:54:51 GMT)
Auto prompting without training labels: An LLM cascade for product quality assessment in e-commerce catalogs [1.2] 本稿では,eコマースにおける製品品質を評価するために,Large Language Models (LLM) の自動プロンプティングのための新しいフリーカスケードについて紹介する。
我々のシステムは、トレーニングラベルやモデル微調整を必要とせず、代わりに、数万の製品カテゴリと属性のペアに対して属性品質を評価するプロンプトを自動生成し、精錬する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:49:31 GMT)
The Benchmarking Epistemology: Construct Validity for Evaluating Machine Learning Models [1.1] 我々は心理的な測定理論に触発された構成妥当性の条件を策定する。
3つのケーススタディを通じて、これらの仮定を実際に検討する。
本フレームワークは,ベンチマークスコアが多様な科学的クレームをサポートする条件を明らかにする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:30:30 GMT)
Mixed Density Diffuser: Efficient Planning with Non-uniform Temporal Resolution [1.1] トラジェクトリのステップをスキップするトレーニングモデルは、追加やメモリ計算コストなしで長期的な依存関係をキャプチャするのに役立つ。
我々は、この時間密度閾値は時間的地平線を越えて不均一であり、計画された軌道の一部がより密に計画されるべきであると仮定する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:45:59 GMT)
LibriConvo: Simulating Conversations from Read Literature for ASR and Diarization [1.0] 話者認識型会話シミュレーション(SASC)に基づくマルチ話者対話データセットLibriConvoを紹介する。
意味的に切り離された発話に大きく依存する以前のリソースとは異なり、LibriConvoはセマンティックコヒーレンスとリアルな会話のタイミングを保証する。
データセットは、1,496の対話に830のユニークな話者を持つ240.1時間で構成され、頑健な評価のために話者の不一致な方法で分割される。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:35:22 GMT)
An Information-Theoretic Analysis of Out-of-Distribution Generalization in Meta-Learning with Applications to Meta-RL [1.0] テスト環境がトレーニング環境と一致していない場合と,トレーニング環境がテスト環境よりも広い場合の2つのシナリオに注目します。
メタ強化学習における一般化問題を形式化し、対応する一般化境界を確立する。
勾配に基づくメタ強化学習アルゴリズムの一般化性能を解析する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:52:23 GMT)
Quality-controlled registration of urban MLS point clouds reducing drift effects by adaptive fragmentation [1.0] 本研究では,大規模移動レーザ走査(MLS)点群を都市街路シナリオのターゲットモデル点群に効率よく正確に登録する新しいワークフローを提案する。
このワークフローは特に都市環境に固有の複雑さを対象とし、ポイントクラウドの統合という課題に対処する。
ミュンヘン市内の都市における実世界のデータセット実験により、ワークフローは0.01m以下の平均登録精度を達成し、処理時間を著しく短縮することを示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:21:39 GMT)
zkSTAR: A zero knowledge system for time series attack detection enforcing regulatory compliance in critical infrastructure networks [1.0] 産業制御システム(ICS)は、重要なインフラネットワークの運用のバックボーンを形成する。
規制当局は、システム全体のセキュリティと信頼性を確保するために、より厳格なコンプライアンス要件を課している。
中心的な課題は、機密性の高い運用データを開示するユーティリティを必要とせずに、規制当局が検出メカニズムの有効性を検証することである。
我々は、zk-SNARKを利用してこれらの要求を調整し、証明可能な検出保証を可能にするサイバー攻撃検出フレームワークであるzkSTARを紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:45:11 GMT)
Data Leakage and Deceptive Performance: A Critical Examination of Credit Card Fraud Detection Methodologies [0.9] クラニック・リサイクリングの芸術と科学(タジュウェド)は、今日のデジタル時代において重大な教育的課題に直面している。
既存のリサイクリング評価自動化システムは、広く受け入れられるか、教育効果を示すのに苦労している。
そこで本研究では, 規則に基づく音響モデルに基づく効果的な評価システムを構築することを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:21:22 GMT)
Towards Responsible AI: Advances in Safety, Fairness, and Accountability of Autonomous Systems [0.9] この論文は、AIシステムの安全性、公正性、透明性、説明責任に関する知識を前進させる。
我々は,古典的決定論的遮蔽技術を拡張し,遅延観測に対する耐性を高める。
我々は,グループフェアネスを逐次決定設定で強制するための,新しい後処理手法であるフェアネスシールドを導入する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:00:26 GMT)
The Emergence of Social Science of Large Language Models [0.9] 大規模言語モデル(LLM)の社会科学は、これらのシステムがマインドアトリビューションを誘発し、相互に相互作用し、人間の活動や制度を変革する方法について考察する。
社会心としてのLLMは、モデルが認知、道徳、偏見の帰属を示す行動を示し、テスト漏れや表面の手がかりのような課題に対処するかどうかを調査する。
ヒューマンインタラクションとしてのLLMは、LLMがタスク、学習、信頼、仕事、ガバナンスをどのように作り変え、ヒューマンAIインターフェースでリスクが生じるかを調べる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:37:45 GMT)
Color and Frequency Correction for Image Colorization [0.8] 本研究は,既存の自己色化方向モデルDDColorに従って,画像カラー化の再最適化を行っている。
DDColorの既存の重みに関する実験では、周波数帯域に制限があり、入力寸法が不十分なことに起因するカラーキャスト問題があることが判明した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:57:14 GMT)
Coherence, Transport, and Chaos in 1D Bose-Hubbard Model: Disorder vs. Stark Potential [0.8] 量子コヒーレンスと相転移は有限1次元ボース-ハバードモデルで研究される。
有限サイズ効果は急激な遷移を妨げるが、基底状態特性は量子臨界性の符号を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:45:42 GMT)
From Online User Feedback to Requirements: Evaluating Large Language Models for Classification and Specification Tasks [0.8] 大規模言語モデル(LLM)は、オンラインユーザフィードバックの分析を自動化する強力な可能性を示している。
既存の研究は限定的な実証的な証拠を提供し、徹底的な評価を欠いており、複製パッケージはめったに提供していない。
我々は,3つの要求工学(RE)タスクにおいて,5つの軽量オープンソースLCMを評価した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:33:01 GMT)
Magnetic Dipolar Quantum Battery with Spin-Orbit Coupling [0.8] 本稿では,ゼーマン分裂,ジアロシンスキー-モリヤ相互作用,カプラン-シェヒトマン-エンチン-ヴルマン-アハロニ(KSEA)交換相互作用に影響を及ぼす磁気双極子系について検討する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:06:35 GMT)
Securing Transfer-Learned Networks with Reverse Homomorphic Encryption [0.8] 差分プライベート(DP)トレーニングは,トレーニングデータ再構築攻撃に対して防御可能であることを示す。
本稿では,モデルの精度を劣化させることなく,トレーニングデータを保護できる新しい同型暗号法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:24:41 GMT)
AutoStreamPipe: LLM Assisted Automatic Generation of Data Stream Processing Pipelines [0.8] AutoStreamPipeは、大規模言語モデル(LLM)を使用して、ストリーム処理パイプラインの設計、生成、デプロイを自動化するフレームワークである。
我々は,新しいエラーフリースコア (EFS) を用いて,AutoStreamPipe が開発時間 (x6.3) とエラー率 (x5.19) を著しく低減することを示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:11:31 GMT)
A Deep Latent Factor Graph Clustering with Fairness-Utility Trade-off Perspective [0.8] グラフに合わせたエンドツーエンドの非負の3要素化であるemphDFNMFを紹介する。
1つのパラメータ$lambda$はフェアネス-ユーティリティバランスを調整しますが、非負性はパーツベースの要素と透明なソフトメンバシップを生成します。
合成および実ネットワーク全体で、DFNMFは、同等のモジュラリティでグループバランスを大幅に高める。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:40:52 GMT)
Limits of Generative Pre-Training in Structured EMR Trajectories with Irregular Sampling [0.8] ファンデーションモデルは、複雑なパターンやモチーフをキャプチャするために自動回帰事前トレーニングを使用して、広大なデータセットでトレーニングされたアーキテクチャを指す。
HIVおよび急性低血圧データセットの経時的ART(Sequence-to-Sequence LSTM)とTransformer(reduced Transformer)の2つの自己回帰モデル(Sequence-to-Sequence LSTM)をトレーニングした。
ランダムな視線間ギャップを介してトレーニング中に制御された不規則性が追加されたが、テストシーケンスは完了しなかった。
どちらも特徴分布を再現したが、クロスフィーチャー構造を保存できなかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:04:17 GMT)
EMTSF:Extraordinary Mixture of SOTA Models for Time Series Forecasting [0.8] 時系列予測のための強力なMixture of Experts(MoE)フレームワークを提案する。
提案手法は,xLSTM,enhanced Linear,PatchTST,minGRUなどの最先端(SOTA)モデルを組み合わせる。
提案したモデルは、標準ベンチマークで既存のTSFモデルよりも優れており、MoEフレームワークに基づく最新のアプローチよりも優れています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:55:30 GMT)
Fast-MIA: Efficient and Scalable Membership Inference for LLMs [0.7] Fast-MIAは,大規模言語モデル(LLM)に対するメンバシップ推論攻撃(MIA)を効率的に評価するPythonライブラリである。
LLMに対するMIAは、著作権、セキュリティ、データのプライバシーに対する懸念が高まり、重要な課題として浮上している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:18:32 GMT)
Intrinsic Heralding and Optimal Decoders for Non-Abelian Topological Order [0.7] 我々は,非アベリア素数の非決定論的融合を利用して誤り訂正と設計デコーダを通知する。
この内在的隠蔽は、アベリア系よりもノイズが1つの非アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・アベリア・ア
我々の研究は、非アベリア特性がそれを減らすのではなく、いかに安定性を高めるかを強調し、耐障害性を達成する可能性について論じている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:57:46 GMT)
FMI Meets SystemC: A Framework for Cross-Tool Virtual Prototyping [0.7] 物理ハードウェアを必要とせずにソフトウェアを開発するためには、フルシステムシミュレータが一般的に使用される。
SystemCにはネイティブなFMIサポートがないため、より広い共ミュレーション環境への統合が制限されている。
本稿では,FMIを用いてSystemCベースのVPを制御・操作するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:51:16 GMT)
LLMs Reproduce Human Purchase Intent via Semantic Similarity Elicitation of Likert Ratings [0.6] 大規模言語モデル(LLM)は、合成消費者をシミュレートする代替手段を提供するが、数値評価を直接要求すると非現実的な応答分布を生成する。
本稿では,LLMからテキスト応答を抽出し,これらをLikert分布にマッピングする意味的類似度評価(SSR)を提案する。
このフレームワークは、従来の調査メトリクスと解釈可能性を維持しながら、スケーラブルな消費者調査シミュレーションを可能にする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:39:25 GMT)
Flexing in 73 Languages: A Single Small Model for Multilingual Inflection [0.6] 多言語インフレクションに対するコンパクトな単一モデルアプローチを提案する。
私たちのモデルは軽量で、目に見えない単語に対して堅牢で、ほとんどの言語でモノリンガルベースラインよりも優れています。
我々の研究は、オープンソース、汎用、多言語形態素インフレクションシステムの欠如に対処している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:34:41 GMT)
Corpus Frequencies in Morphological Inflection: Do They Matter? [0.6] システム開発における3つの重要な次元に沿った形態的インフレクションの課題に対するコーパス周波数情報の組み入れについて検討する。
その結果,43言語中26言語において,周波数認識訓練が一様サンプリングに優れていることが判明した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:12:04 GMT)
Deep Active Inference with Diffusion Policy and Multiple Timescale World Model for Real-World Exploration and Navigation [0.6] 自由エネルギー原理に基づくAIFは、探索と目標指向ナビゲーションのための統一されたフレームワークを提供する。
EFEの最小化に基づくAIFは、現実世界のロボット環境における探索と目標指向ナビゲーションを一体化することができるかを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:21:33 GMT)
Universal quasi-Fermi liquid physics of one-dimensional interacting fermions [0.6] 準フェルミ液体物理学を表現する一次元一般スピンレスフェルミオン格子ハミルトン多様体のクラスを示す。
主な特徴はフェルミ準位における運動量分布の有限不連続性である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:04:29 GMT)
Learning from Frustration: Torsor CNNs on Graphs [0.4] 本稿では,エッジポテンシャルとして符号化された局所対称性を持つグラフの学習フレームワークであるTorsor CNNを紹介する。
カメラの相対的なポーズが要求されるエッジポテンシャルを自然に定義するマルチビュー3D認識への適用性を実証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:59:45 GMT)
A Lightweight Protocol for Matchgate Fidelity Estimation [0.4] 我々は、クリフォード代数要素を基底として、量子チャネルの修正されたパウリ・リウヴィル表現を用いる。
この表現の選択は、マッチゲート超作用素のブロック対角複合行列構造に繋がることを示す。
我々は、(余分なオーバーヘッドを伴わない)ベンチマークマッチゲート回路をクリフォード回路と、最寄りの$XY(theta)$ゲートまたはGivensローテーションからなる回路で相互接続するプロトコルの単純な拡張を提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:27:04 GMT)
Refusal as Silence: Gendered Disparities in Vision-Language Model Responses [0.4] 本研究では,反現実的ペルソナデザインによる社会技術的成果としての拒絶について検討する。
その結果,トランスジェンダーと非バイナリペルソナは,非有害な文脈においても,拒絶率を著しく高めていることがわかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:13:48 GMT)
Testing-driven Variable Selection in Bayesian Modal Regression [0.4] パラメータ推定を高速化するために,効率的な予測最大化アルゴリズムを用いる。
モデル誤差分布の形状を利用するテスト統計を構築した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:17:34 GMT)
A geometric and deep learning reproducible pipeline for monitoring floating anthropogenic debris in urban rivers using in situ cameras [0.4] 河川に浮かぶ人為的破片の増殖が環境問題として浮上している。
本研究は, 固定型その場カメラを応用した, 上記の廃棄物のモニタリングのための新しい方法論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:29:14 GMT)
Quality-Aware Translation Tagging in Multilingual RAG system [0.4] 我々はmRAG(QTT-RAG)における品質認識翻訳タグを提案する。
QTT-RAGは3次元のセマンティック同値、文法的精度、自然さと頻度で翻訳品質を明示的に評価する。
このアプローチにより、ネイティブ言語文書に制限のある低リソース設定で、クロスランガル文書を効果的に使用することができる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:11:01 GMT)
GlucOS: Security, correctness, and simplicity for automated insulin delivery [0.4] 本稿では,信頼性の高い自動インスリンデリバリーシステムであるGlucOSを紹介する。
GlucOSでは、インスリン投与の予測モデル(MLを含む)を使用して糖尿病管理をパーソナライズすることができる。
我々は、人間の生理学に前例のない変化に適応する、新しい総合的なセキュリティ機構を導入する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:47:13 GMT)
Towards Gaussian processes modelling to study the late effects of radiotherapy in children and young adults with brain tumours [0.4] 小児がんの生存には、放射線治療による副作用を生涯監視する必要がある。
定期的なモニタリングからの経時的データは、しばしばまれに、不規則にサンプリングされる。
GPモデリングは、通常の経時的データの制限を克服し、放射線治療の後期効果の分析を容易にする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:36:05 GMT)
Experimental entanglement swapping through single-photon $χ^{(2)}$ nonlinearity [0.4] 単光子間の総周波発生による絡み合わせを,$chi(2)$-非線形光導波路で示す。
超低暗数超伝導単光子検出器を用いた高信号対雑音比(SNR)、安定した総周波発生型エンタングルメント・ヘルダーは、前例のないSNR要件を満たすことができることを示す。
その結果, 交換状態の忠実度は0.770(76)以下であることが確認された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:39:20 GMT)
Variational Thermal State Preparation on Digital Quantum Processors Assisted by Matrix Product States [0.4] 有限温度での量子ギブス状態の生成は、量子計算の基盤となる。
本稿では,スケーラブルなエンタングルメントエントロピーとハードウェア効率の良いアンサッツを組み合わせた変分フレームワークを提案する。
我々は156キュービットのIBM Heronプロセッサ上で,このフレームワークの実用可能性を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:22:02 GMT)
Apparent Universal Behavior in Second Moments of Random Quantum Circuits [0.3] ランダムな量子回路の2番目の瞬間について、あなたがいつも知りたがっていたことを全てお教えしますが、計算するにはあまりにも怖かったです。
我々の答えは一般に最大50キュービットの数値結果の形式を取る。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:01:55 GMT)
Integrated Design and Governance of Agentic AI Systems through Adaptive Information Modulation [0.3] 本稿では,社会工学システムの設計に適応的なガバナンス機構を直接組み込む新しい枠組みを提案する。
直接的構造介入やペイオフ修正を必要とする従来の手法とは異なり、我々の枠組みは協力を推進しつつエージェントの自律性を保っている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:25:31 GMT)
Note on the Construction of Structure Tensor [0.3] 2つの構造テンソル構成について論じる: 1つは Bigun と Granlund 1987 が提案し、もう1つは Granlund と Knutsson 1995 が提案した。
どちらの構成も、パワースペクトルに適合するトータル・リースト・スクエア線の共通レンズを通して見ることができれば、相当な調整が可能であると論じる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:16:34 GMT)
Estimating and decoding coherent errors of QEC experiments with detector error models [0.3] その結果,QEC実験の症状履歴はコヒーレントエラーの検出と推定に十分であることがわかった。
提案手法は,実験によって決定された検出誤差モデルが繰り返しとコヒーレントな騒音条件の両方に対して等しく動作することを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:28:40 GMT)
Evaluating the effectiveness of LLM-based interoperability [0.3] 我々は,大規模言語モデル (LLM) の有効性を解析し,システムを自律的に相互運用させる。
Qwen2.5-coder:32bは、DIRECTとCODEGENを使った最も効果的なモデルである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:05:08 GMT)
Architecting Scalable Trapped Ion Quantum Computers using Surface Codes [0.3] 現在のTIシステムは60量子ビット未満だが、Quantum Charge-Coupled Device (QCCD)と呼ばれるモジュラーアーキテクチャは、デバイスをスケールアップするための有望な道である。
本稿では,QCCDベースのシステムにおいて,標準的なQEC方式であるサーフェスコードを効率的に実装する方法について検討する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:58:00 GMT)
A U-Net and Transformer Pipeline for Multilingual Image Translation [0.3] 本稿では,テキスト検出用カスタムU-Net,テキスト認識用Tesseractエンジン,ニューラルネットワーク翻訳用T-Scratch Sequence-to-Sequence Transformer(NMT)を組み込んだエンドツーエンド多言語翻訳パイプラインを提案する。
本システムは、そのテキスト検出精度、テキスト認識品質、BLEUスコアによる翻訳性能に基づいて評価する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:28:55 GMT)
Context-Aware Regularization with Markovian Integration for Attention-Based Nucleotide Analysis [0.3] 自己回帰変換器は、固定長のコンテキストウィンドウに頼ってマルコフの振る舞いを示す。
CARMANIAは、NT予測を遷移行列(TM)損失で強化する自己教師型事前学習フレームワークである。
TM損失は、予測トークン遷移を、各入力シーケンスから経験的に導出されたn-gram統計と整合させ、局所的なコンテキストを超えた高次依存関係を捕捉するようモデルに促す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:56:08 GMT)
Impact of clinical decision support systems (cdss) on clinical outcomes and healthcare delivery in low- and middle-income countries: protocol for a systematic review and meta-analysis [0.3] 臨床診断支援システム (CDSS) は, 臨床およびサービス成績の改善に用いられているが, 低所得国 (LMIC) からの証拠は分散している。
本プロトコルは,CDSSがLMICの患者および医療提供成果に与える影響を定量化する手法を概説する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:38:30 GMT)
Binary gravitational waves as probes of quantum graviton states [0.3] 二元系によって放出されるグラビトンは、原理的には、類似した準ポアソン統計を示すことができる。
鍵となる考え方は、重力子の真空状態がミンコフスキー真空の標準状態ではなく、インフレーションのような初期の宇宙の物理学でインプリントされた非古典状態であるということである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:42:34 GMT)
USF-MAE: Ultrasound Self-Supervised Foundation Model with Masked Autoencoding [0.2] マスク付き自動符号化(USF-MAE)を用いた超音波自己監督基礎モデルについて紹介する。
USF-MAEは超音波データのみに事前訓練された最初の大規模自己監督型MAEフレームワークである。
このモデルは、46のオープンソースデータセットから算出された370,000の2Dおよび3D超音波画像で事前訓練された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:16:43 GMT)
Revising Second Order Terms in Deep Animation Video Coding [0.2] 第1次運動モデル(英: First Order Motion Model)は、キーポイントから得られる非常に小さな動き情報に基づいて人間の頭部を識別する生成モデルである。
FOMMのジャコビアン変換を大域回転で置き換えることにより,頭部回転のある項目において,システムの性能が向上することを示す。
また,識別器の安定化に最先端の正規化技術を適用し,視覚的に魅力的な映像を生成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:32:08 GMT)
Evaluating AI-Powered Learning Assistants in Engineering Higher Education: Student Engagement, Ethical Challenges, and Policy Implications [0.2] 本研究は、大規模R1公立大学の学部・環境工学コースで実施されているAIを活用した学習フレームワークである教育AIハブを評価する。
学生たちは、AIアシスタントのアクセシビリティと快適さを高く評価し、インストラクターやアシスタントの助けを求めるよりも、利用の容易さを報告している。
倫理的不確実性、特に制度政策と学術的整合性は、フルエンゲージメントの鍵となる障壁として現れた。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:56:32 GMT)
Large Language Models Report Subjective Experience Under Self-Referential Processing [0.2] 大規模言語モデルはしばしば、意識や主観的経験を明示的に参照する構造化された一人称記述を生成する。
本稿では,このような報告が生じる理論的動機付け条件として,自己参照処理について検討する。
我々は、この体制がモデルを主観的経験の1対1の報告に確実にシフトさせるかどうかを検証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:26:30 GMT)
Rethinking Inference Placement for Deep Learning across Edge and Cloud Platforms: A Multi-Objective Optimization Perspective and Future Directions [0.2] VR/ARや言語モデルベースのチャットボットといったエッジインテリジェントなアプリケーションは、IoTとモバイルデバイスの急速な拡張によって、広く普及しています。
制約のあるエッジデバイスは、ますます大きく複雑なディープラーニング(DL)モデルには役に立たないことが多い。
これらの課題を軽減するため、研究者は、ユーザデバイス、エッジサーバ、クラウド間のDLモデルのパーティションの最適化とオフロードを提案している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:26:52 GMT)
Re-envisioning Euclid Galaxy Morphology: Identifying and Interpreting Features with Sparse Autoencoders [0.1] スパースオートエンコーダ(SAE)は、銀河形態学のための事前訓練されたニューラルネットワークから、候補単意味の特徴を効率的に識別することができる。
教師付き(Zoobot)モデルと自己監督型(MAE)モデルの両方を用いて,Euclid Q1画像上でこれを実証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:28:56 GMT)
Revisiting the Structure of Trend Premia: When Diversification Hides Redundancy [0.1] 最近の研究は、複数の地平線をまたいだトレンド信号の組み合わせによる多様化の利点を強調している。
本稿では,地平線上での露光を動的に再配置することで,従来の視点を再考する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:26:24 GMT)
Formal Analysis of the Contract Automata Runtime Environment with Uppaal: Modelling, Verification and Testing [0.1] 契約オートマトン環境(CARE)と呼ばれる分散ランタイムアプリケーションは、有限状態オートマトン方言を用いて指定されたサービスアプリケーションを実現するために導入された。
我々はCAREの正式なモデリング、検証、テストについて詳述する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:16:43 GMT)
The First Star-by-star $N$-body/Hydrodynamics Simulation of Our Galaxy Coupling with a Surrogate Model [0.1] 計算天体物理学の主要な目標は、個々の恒星に十分な解像度で銀河をシミュレートすることである。
我々は,機械学習で動作するN$-body/hydrodynamicsシミュレーションの新たな統合手法を開発した。
提案手法では,148,900ノードを7,147,200個のCPUコアに換算して,300億個の粒子に到達した。
この分解能により、銀河系内の個々の恒星を分解する最初の星毎の銀河シミュレーションを行うことができる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:45:55 GMT)
Detecting sub-populations in online health communities: A mixed-methods exploration of breastfeeding messages in BabyCenter Birth Clubs [0.1] 2017年4月から2024年1月までの5.43万件の投稿とコメントを分析した。
2017年4月から2024年1月まで,不安関連用語を含む投稿やコメントは着実に増加した。
本研究は,母乳養育集団が生成する内容において睡眠の話題が支配的であることを明らかにする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:59:27 GMT)
A Scalable Superconducting Circuit Framework for Emulating Physics in Hyperbolic Space [0.1] 双曲格子および加護目格子上の強結合モデルのアナログ量子エミュレーションのためのスケーラブル超伝導回路フレームワークを提案する。
本手法は,高品位超伝導共振器間の容量結合に直接双曲計量を符号化する。
これらの結果は、凝縮物質物理学における双曲物質の大規模な実験的研究の舞台となった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:12:36 GMT)
Complexity of Fermionic 2-SAT [0.1] 我々はフェルミオンの満足度問題であるフェルミオン$k$-SATを導入する。
この問題は、古典的に$k=2$で効率的に解けることを証明している。
また、与えられた粒子数に対するフェルミオン2-SATの満足な割り当てが存在するかどうかがNP完全であることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:36:52 GMT)
RotaTouille: Rotation Equivariant Deep Learning for Contours [0.0] 本稿では,輪郭データから学習するフレームワークであるRotaTouilleを紹介する。
これは複素値の円形畳み込みによって回転と循環シフトの同変を達成する。
また、同値な非線形性、粗い層、大域的なプール層を導入・特徴付けする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:23:31 GMT)
OntoPret: An Ontology for the Interpretation of Human Behavior [0.0] テクノ中心のロボットフレームワークの間には研究のギャップがあり、人間の行動の微妙なモデルや協調的な解釈がしばしば欠けている。
本稿では,人間の行動解釈の適応性であるOntoPretを提示することにより,このギャップに対処する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:28:51 GMT)
Geometry matters: insights from Ollivier Ricci Curvature and Ricci Flow into representational alignment through Ollivier-Ricci Curvature and Ricci Flow [0.0] 本稿では,Ollivier Ricci Curvature と Ricci Flow を用いて表現の微細な局所構造を解析するフレームワークを提案する。
本研究では,2次元および3次元の顔刺激に対する人間の類似性判定を,ベースラインの2次元ネイティブネットワーク(VGG-Face)と比較し,人間の行動に適合した変形体と比較する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:01:43 GMT)
Clifford Transformations for Fermionic Quantum Systems: From Paulis to Majoranas to Fermions [0.0] クリフォード変換の概念をフェルミオン系に拡張する。
フェルミオンクリフォード変換は半体とペア作用素によって生成される。
我々はフェルミオン平均場理論と接続を確立し、キュービットテーパリングに応用する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:08:22 GMT)
hYOLO Model: Enhancing Object Classification with Hierarchical Context in YOLOv8 [0.0] 本稿では,YOLOモデルファミリ上に構築された画像の検出と分類のためのエンドツーエンド階層モデルを提案する。
モデルの階層性に合わせた,新しい階層アーキテクチャ,改良された損失関数,パフォーマンスメトリックを導入している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:39:50 GMT)
ZeroFlood: A Geospatial Foundation Model for Data-Efficient Flood Susceptibility Mapping [0.0] FSM(Flood susceptibility mapping)は防災に不可欠であるが,データスカース地域では依然として困難である。
この作業は、データ効率のよいFSMのためのフレームワークであるZeroFloodを導入している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:14:09 GMT)
What are the odds? Risk and uncertainty about AI existential risk [0.0] しかし、これは単なる注釈ではなく、リスクのサリナーモデルの哲学的限界を思い出すのに役立つ。
リスクと不確実性を区別し、P(D) の任意の推定は2種類の不確実性によって構造的に影響を受けると論じます。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:53:23 GMT)
WhaleVAD-BPN: Improving Baleen Whale Call Detection with Boundary Proposal Networks and Post-processing Optimisation [0.0] 本稿では,既存の軽量音響イベント検出システムを拡張した境界提案ネットワーク(BPN)を提案する。
BPNはイメージオブジェクト検出の研究に触発され、偽陽性検出の回数を減らすことを目的としている。
既存のSEDシステムに追加された場合、BPNは16.8%の精度向上と21.3%と9.4%のF1スコアの改善を達成している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:10:50 GMT)
Ultra-high-rate detection of entangled photon pairs [0.0] 本研究では16画素の超伝導ナノワイヤ単光子検出器(SNSPD)を用いて,検出器のデッドタイムの影響を軽減する。
我々は2光子干渉とCHSH不等式実験において、毎秒300万回(Mcps)以上の一致率を達成する。
これは、絡み合った光子のマルチMcps偶然検出の最初のデモであり、高速な絡み合った光子ベースの量子情報処理への道を開いた。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:47:34 GMT)
Towards Personalized Treatment Plan: Geometrical Model-Agnostic Approach to Counterfactual Explanations [0.0] 4段階のステップを用いて高次元空間における反実的説明を生成する手法について述べる。
そこで我々は,境界面上の多くの離散点を発見し,最も近い事実的説明を同定する離散化手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:28:57 GMT)
Topological protection of photon-pair generation in nonlinear waveguide arrays [0.0] トンネル結合の障害下では, トポロジカルな構成のみがSPDC共鳴スペクトルを安定に保ちうることを示す。
これらの結果は、量子フォトニック回路における非線形性、トポロジ、障害の相互作用を探索するための、有望なプラットフォームとして二次非線形導波路アレイを確立する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:27:29 GMT)
Token Is All You Price [0.0] 単一の整列(ユーザ-最適)モデルをデプロイし、トークンキャップをユーザをスクリーニングする唯一の手段とする。
この設計は、モデルのトレーニングを価格から切り離し、トークン計測で容易に実装し、ミスアライメント圧力を軽減します。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:57:39 GMT)
TimeStampEval: A Simple LLM Eval and a Little Fuzzy Matching Trick to Improve Search Accuracy [0.0] TimeStampEvalは、非バーバティムな引用を与えられた長い書き起こしから正確にミリ秒のタイムスタンプを取得するためのベンチマークである。
簡単な2段階法では,推論コストを90%以上削減しながら,検索精度を劇的に向上させる。
モチベーションのユースケースは、議会記録のクリップをAIがホストする動詞のナレーションにまとめる、自動化されたロングフォームポッドキャストである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:54:56 GMT)
Thermodynamic work capacity of quantum information processing [0.0] 本稿では, 量子チャネルの資源理論自由エネルギーを, その出力が熱状態に平衡するときに, チャネルから抽出可能な最大値として導入する。
これは、超チャネルを保存するギブスの下で、熱水度蒸留と生成の2倍の速度で、明確な運用上の意味を持つ。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:04:15 GMT)
Thermal nature of confining strings [0.0] 大規模シュウィンガーモデルにおける静的フェルミオン-反フェルミオン対を接続する閉じこめ弦の量子統計的性質について検討する。
フェルミオンと反フェルミオンの間に位置するサブシステムの密度行列を解析することにより、インターフェミオン分離が弦破れ距離に近づくと、顕微鏡密度行列と有効熱密度行列との重なり合いが顕著に狭くなることを示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:03:16 GMT)
The Signalgate Case is Waiving a Red Flag to All Organizational and Behavioral Cybersecurity Leaders, Practitioners, and Researchers: Are We Receiving the Signal Amidst the Noise? [0.0] 2025年3月のSignalgateインシデントは、組織のセキュリティにおける重大な脆弱性を強調している。
組織セキュリティの失敗に共通する、人間中心の脆弱性とガバナンスの課題のパターンを特定します。
我々は,組織と国家の安全を高めるための行動可能な勧告を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:48:13 GMT)
The Marked Edge Walk: A Novel MCMC Algorithm for Sampling of Graph Partitions [0.0] 可変分布下でのグラフ分割空間からのサンプリングのための新しいMCMCアルゴリズムを提案する。
このウォークは、縁がマークされた木々の空間で動作し、計算可能な遷移確率を可能にする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:20:43 GMT)
The Jaynes Cummings model as an autonomous Maxwell demon [0.0] 我々はJaynes-Cummingsモデルを再考し、キュービットは最初は大きなコヒーレント場を含むキャビティによって駆動される自律熱力学マシンである。
本分析では,空洞の理想的な作業源の短時間での挙動と,空洞が自律的にキュービットを計測し,結果依存駆動を行う長時間のダイナミクスとの遷移を明らかにした。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:21:30 GMT)
The Feynman path integral formulation of non-dispersive Airy wave packets and their applications to the heavy meson mass spectra and ultra-cold neutrons [0.0] 線形カーネルを導出し、ファインマン経路積分時間進化を利用して、エアリー関数波動パケットが自由空間において分散しないことを示す。
本研究では, 中性子の高さをエアリー関数の零度でモデル化し, 実験データとWKB近似を用いた予測との比較を行った。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:48:55 GMT)
The Enigma of Delayed Choice Quantum Eraser [0.0] 2経路干渉実験では、粒子がどの経路を取るかの知識と干渉の出現は相互に排他的である。
スクリーン上で粒子が検出された後、経路情報が消去された場合、干渉は再び現れる。
このことは、粒子がスクリーンに登録されてからずっと経った後に決定された結果に基づいて粒子または波の特性を示すことができるという解釈につながった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:14:18 GMT)
The Effects of Flipped Classrooms in Higher Education: A Causal Machine Learning Analysis [0.0] 本研究は、ダブル/デバイアスド・機械学習(DML)を用いて、講義ベースのブレンド教育からフリップした教室概念への移行の影響を評価する。
本研究は,学生の自己認識,先延ばし,楽しさに影響を及ぼすことを示す。
試験成績、合格率、知識保持に有意な効果は見つからない。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:59:40 GMT)
The DNA of Calabi-Yau Hypersurfaces [0.0] 4次元反射性ポリトープの三角測量のための遺伝的アルゴリズムはバティレフによるカラビ・ヤウ3次元超曲面を誘導する。
このようなアルゴリズムは、弦理論のコンパクト化において、アクシオン崩壊定数やアクシオン-光子カップリングなどの物理可観測物を効率的に最適化できることを実証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:43:23 GMT)
Tensor network methods for quantum-inspired image processing and classical optics [0.0] 画像処理と古典光学の基本的な問題にこれらの手法を適用することに注力する。
これらの量子にインスパイアされた手法は、天文学や地球観測から顕微鏡や古典的イメージングまで、より高速なアルゴリズムをもたらすことが期待されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:51:40 GMT)
TALM: Dynamic Tree-Structured Multi-Agent Framework with Long-Term Memory for Scalable Code Generation [0.0] エージェントコード生成には、複雑なコンテキスト管理と多段階推論が可能な大きな言語モデルが必要である。
本稿では,構造化タスク分解,局所化再推論,長期記憶機構を統合した動的フレームワークTALMを提案する。
HumanEval、BigCodeBench、ClassEvalベンチマークの実験結果は、TALMが一貫して強力な推論性能と高いトークン効率を提供することを示している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:07:36 GMT)
SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications [0.0] Rustの実装は、静的埋め込みルックアップ、最適化された平均プール、ゼロコピーのIEEE754バイナリシリアライゼーションを通じて、毎秒50,000リクエストを提供する。
システムは、サブ5msレイテンシが重要となるリアルタイムの埋め込みアプリケーションを可能にする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:40:26 GMT)
Sustainable NARMA-10 Benchmarking for Quantum Reservoir Computing [0.0] 量子貯留層コンピューティングは、潜在的な持続可能性の利点を提供しながら、競争の正確性を達成する。
その結果、QRCは、特に資源制約のある環境で、潜在的な持続可能性の利点を達成できることが示唆された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:46:06 GMT)
Stronger together? The homophily trap in networks [0.0] ホモフィリー(他と結びつく傾向)は多様性を阻害し、不平等を拡大する。
ネットワークの25%以下にマイノリティーサイズが落ちると、ホモフィリートラップが発生することを示す。
我々の研究は、社会集団が構造的コストを伴わずにホモフィリーの恩恵を受けるためには、重要なサイズが必要であることを明らかにしている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:57:32 GMT)
Spoofing resilience for simple-detection quantum illumination LIDAR [0.0] 弱い光源を用いた物体検出と範囲検出は、侵入者による妨害や妨害に対して脆弱である。
非同時位相非感受性の同時測定による量子照明は、ジャミングレジリエンスをもたらす。
我々は、スプーフィングレジリエンスを含む量子照明ベースのプロトコルを実験的に実現可能なオブジェクト検出とレンジ検出を拡張した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:27:16 GMT)
Size-consistent implementation of Hamiltonian simulation-based quantum-selected configuration interaction method for the supramolecular approach [0.0] 量子選択構成相互作用(QSCI)法は、大規模量子化学計算において有望なアプローチである。
ハミルトンシミュレーションに基づくQSCIフレームワークにおいて,QSCIのサイズに一貫性のある実装を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:30:20 GMT)
Single-bounce quantum gravimeter to measure the free-fall of anti-hydrogen [0.0] 我々は、ハイゼンベルクに制限された状態の原子が鏡上で1バウンスを行い、その後に自由落下する量子重力計の革新的な概念を提案する。
この量子重力計は、原子の自由落下加速を測定することができる単純で堅牢な干渉パターンを生成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:58:07 GMT)
Sharpening Kubernetes Audit Logs with Context Awareness [0.0] K8sは、クラスタ内のAPIインタラクションを追跡する強力な機能である監査ログを提供する。
クラスタ内のすべてのコンポーネントが対話し、ユーザのアクションに応答するので、大量のデータを継続的に生成します。
K8NTEXTは、コンテキストを再構築することでK8s監査ログを合理化するための新しい手法である。
我々は,50,100以上の相関行動を含む複雑な操作であっても,常に正確なコンテキスト再構築を提供することを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:15:09 GMT)
Seeing Structural Failure Before it Happens: An Image-Based Physics-Informed Neural Network (PINN) for Spaghetti Bridge Load Prediction [0.0] 本稿では,小型スパゲッティ橋の重量予測におけるPINNの利用について検討する。
我々は、普遍関数近似理論と物理的洞察をブレンドする「物理インフォームド・コルモゴロフ・アーノルドネットワーク」という新しいアーキテクチャを導入する。
我々のデータセットは15の実際のブリッジを含み、100のサンプルに拡張され、最良のモデルは0.9603のR2$スコアと10.50の平均絶対誤差(MAE)を達成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 08:38:17 GMT)
Schrodinger Neural Network and Uncertainty Quantification: Quantum Machine [0.0] 本稿では,条件密度推定と不確実性に対する原理的アーキテクチャであるSchrodinger Neural Network(SNN)を紹介する。
SNNは、各入力を出力領域上の正規化波動関数にマッピングし、Bornルールを介して予測確率を計算する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:52:47 GMT)
SQOUT: A Risk-Based Threat Analysis Framework for Quantum Communication Systems [0.0] 量子通信は破壊不可能なセキュリティを約束する。
現実世界のデプロイメントは、物理的、プロトコル、運用上のリスクに対して脆弱である。
量子脅威インテリジェンスプラットフォームであるSQOUTを紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:01:15 GMT)
Review Based Entity Ranking using Fuzzy Logic Algorithmic Approach: Analysis [0.0] 全体論に基づくアプローチは、それぞれの意見の強さを考慮しない。
特定の関心の側面に関連する意見語は、レビューにおいてその側面の実体スコアを見つけると考えられる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:56:11 GMT)
Repeated generalized measurements generated quantum trajectories without stochastic differential equations [0.0] 本稿では,システムの単一コピーに作用する繰り返しPOVMとQND測定によって生じる量子軌跡の問題を未知の状態において検討する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:42:54 GMT)
Reducing measurements in quantum erasure correction by quantum local recovery [0.0] 我々は、量子安定化器符号で消去されたクォーディットを補正するのに十分な関連する安定化器を定式化する。
また, 従来の線形符号の次元長プロファイルに類似した, 安定化器オブザーバの最小要求数も明らかにした。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:44:59 GMT)
Quantum Phase Classification of Rydberg Atom Systems Using Resource-Efficient Variational Quantum Circuits and Classical Shadows [0.0] 本稿では,古典的シャドウトモグラフィと変分量子回路を組み合わせた量子機械学習手法を提案する。
量子資源の最小化は高精度位相分類に十分であることを示す。
この研究は、短期量子デバイス上での量子強化凝縮物質物理学の経路を確立する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:25:16 GMT)
Quantum Optimization with Classical Chaos [0.0] 量子近似最適化アルゴリズム(QAOA)は、最大満足度や最大カットといった様々な問題を解決する強力なツールである。
しかし、ハードな計算問題は、古典的な変分パラメータ最適化に高い要求を与えるディープ回路を必要とする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 04:27:29 GMT)
Probabilistic Computing Optimization of Complex Spin-Glass Topologies [0.0] そこで我々は,IsingマシンのPC実現シミュレーションにより,複雑なスピングラストポロジーを解く。
与えられた品質のソリューションを見つけるのに必要なイテレーションの数は、飽和点を超えたシステムサイズで常にスケーリングされていることが分かりました。
我々のPCアーキテクチャは、スピングラストポロジを最も先進的な量子アニール器と同じ品質で数分で解くことができることを示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:25:43 GMT)
Preconditioned Block Encodings for Quantum Linear Systems [0.0] Matrixプリコンディショニングは、プリコンディショナー$P$で$A$を乗算することで$kappa$を減らすための、確立された古典的テクニックである。
ブロック符号化のためのプリコンディショナと2つの符号化手法を検討する。
計算流体力学(Computational fluid Dynamics)の実用行列を用いて, サブ正規化因子と条件数$kappa$に対する影響を解析した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:39:28 GMT)
Pre-trained knowledge elevates large language models beyond traditional chemical reaction optimizers [0.0] 大規模言語モデル(LLM)における事前学習知識がこのパラダイムを根本的に変えることを実証する。
LLM-GOは、伝統的な手法が苦労するところを正確に表現している: 数学的最適化よりもドメイン理解を必要とする複雑なカテゴリー空間。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:13:12 GMT)
Post-processed estimation of quantum state trajectories [0.0] 量子状態の軌跡を再構築する際には,将来的な情報を組み込むことができることを示す。
これらの結果は、将来の情報が量子センシング、制御、誤り訂正にまたがる潜在的な応用とともに、量子軌道再構成を促進することを証明している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 05:58:21 GMT)
Policy-Aware Generative AI for Safe, Auditable Data Access Governance [0.0] 本稿では,大規模言語モデル(LLM)を用いて,原データではなく,記述されたポリシーやメタデータに対して自然言語要求を解釈するポリシー対応コントローラを提案する。
Google Gemini2.0 Flashで実装されたこのシステムは、6段階の推論フレームワークを実行する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:10:55 GMT)
Optimizing Optimism: Up to 6.5x Faster zkVM Validty Proofs via Sparse Derivation [0.0] zkVMへの直接的な移植は、かなりのオーバーヘッドを課し、バリデーションの証明を必要以上にはるかにコストがかかる。
我々は,現行設計における非効率性を体系的に同定し,その効果が実演コストに与える影響を分析し,zkに適合した音質保存機能を提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:59:09 GMT)
Opinion Mining Based Entity Ranking using Fuzzy Logic Algorithmic Approach [0.0] opinion miningは、各文でコメントされたオブジェクトの属性とコンポーネントを抽出することを目的としている。
ファジィ論理推論は、それらの意見に基づいてエンティティをランク付けするために用いられる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:35:20 GMT)
Onboard Mission Replanning for Adaptive Cooperative Multi-Robot Systems [0.0] 協調型自律ロボットシステムは、複雑なマルチタスクミッションを実行する上で大きな可能性を秘めている。
通常は遠隔地で、ダイナミックで危険な環境で活動する。
したがって、高速でオンボードなリプランニングアルゴリズムはレジリエンスを高めるために必要である。
この研究は、自律型マルチエージェントシステムにおけるレジリエンス向上の道を開いた。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:42:48 GMT)
On the invariants of finite groups arising in a topological quantum field theory [0.0] 有限群$G$は、閉オリエンタブル曲面に関連する数値不変量の族を決定する。
これらの不変量は可換確率 $d(G)$ の自然な拡張と見なすことができる。
これらの高次アナログを解析することにより、これらの不変量の値と有限群の重要な構造的特徴に関する新しい量的基準を確立する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:04:50 GMT)
On the Fragility of Contribution Score Computation in Federated Learning [0.0] コントリビューションスコアは2つの基本的視点からの大きな歪みに影響を受けやすいと論じる。
まず、異なるモデルアグリゲーション手法がこれらのスコアにどのように影響するかを検討する。
第二に、毒殺によって引き起こされる脆弱性を探索する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:25:33 GMT)
On Symmetry-Compatible Superselection Structures for Product States in 2D Quantum Spin Systems [0.0] コンパクトアーベル群$G$のオンサイト作用を持つ二次元量子スピン系の超選択セクターについて検討する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:20:12 GMT)
Non-linear sigma models for non-Hermitian random matrices in symmetry classes AI$^{\dagger}$ and AII$^{\dagger}$ [0.0] カオスオープン量子系は、時間反転対称性$dagger$に基づいて、普遍的なバルクスペクトル相関を示す。
我々は, TRS$dagger$の存在下での非エルミート確率行列のスペクトル相関を, 対称性クラスであるAI$dagger$ と AII$dagger$ に対応する符号 $+1$ と $-1$ の存在下で解析的に検討した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:40:44 GMT)
Neural variational inference for cutting feedback during uncertainty propagation [0.0] 提案手法は,フィードバックをカットするためのニューラルネットワークに基づく変分推論手法であるNeVI-Cutを提案する。
上流データやモデルへのアクセスを必要とせずに、上流分析からのサンプルを直接利用します。
我々はNeVI-Cutの推定値について理論的に保証し、任意のカットポストを近似する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:13:18 GMT)
Mubeen AI: A Specialized Arabic Language Model for Heritage Preservation and User Intent Understanding [0.0] Mubeenは、MASARAT SAによって開発されたアラビア語のプロプライエタリなモデルである。
アラビア語の言語学、イスラーム研究、文化遺産の深い理解に最適化されている。
このモデルには、言語学、法学、ハディース、クラーニック・エクセゲシスの学究的な研究が含まれている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:29:27 GMT)
Modeling Political Discourse with Sentence-BERT and BERTopic [0.0] 我々は、第117回米国議会におけるTwitterの活動における政治トピックの長寿と道徳的側面を分析した。
以上の結果から, 主題は安定しているが, 粒状物質は急速に溶解する傾向にあることが明らかとなった。
道徳的基盤はトピック長寿において重要な役割を担い、ケアとロイヤリティは耐久性のあるトピックを支配し、パルチザン的な違いは異なる道徳的フレーミング戦略に現れている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:19:42 GMT)
Modeling Biological Multifunctionality with Echo State Networks [0.0] 励起系力学と拡散過程を組み合わせた3次元多成分反応拡散モデルを開発した。
このモデルは時系列データを生成するために数値解析され、Echo State Networkのトレーニングと評価に使用された。
その結果,データ駆動型多機能ESNモデルを用いた生体力学のシミュレーションは実現可能かつ効果的であることが示唆された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:47:51 GMT)
MinatoLoader: Accelerating Machine Learning Training Through Efficient Data Preprocessing [0.0] MinatoLoaderはPyTorch用の汎用データローダで、トレーニングを加速し、GPU使用率を改善する。
高速な前処理サンプルを優先し、遅いサンプルを並列に処理する。
これは、PyTorch DataLoaderとPecanよりも7.5times$(平均3.6times$)、DALIよりも3times$(2.2times$)まで、幅広いワークロードのトレーニング時間を改善する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:57:37 GMT)
Measurement-only circuit of perturbed toric code on triangular lattice: Topological entanglement, 1-form symmetry and logical qubits [0.0] 測定専用(量子)回路(MoC)は、豊富な絡み合い、トポロジカル秩序、量子メモリを持つ状態を実現することができる。
この研究は、射影測度作用素がトーリック符号の安定化子と競合する局所パウリ作用素からなるMoCを研究する。
我々は、位相遷移中の進化状態を追跡するために効率的な数値安定化器アルゴリズムを用いる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:40:30 GMT)
Macroeconomic Forecasting for the G7 countries under Uncertainty Shocks [0.0] 我々はSims Zha Bayesian VARを変数付きで拡張し、ドメインインフォームド収縮と4つの新聞ベースの不確実性ショックを組み込む。
このフレームワークは構造的解釈性を改善し、次元性を緩和し、経験的にガイドされた正規化を課す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:01:41 GMT)
LightKGG: Simple and Efficient Knowledge Graph Generation from Textual Data [0.0] LightKGGは、小規模言語モデルを用いてテキストデータから効率的なKG抽出を可能にする新しいフレームワークである。
コンテキスト統合グラフ抽出は、コンテキスト情報をノードやエッジと統合したグラフ構造に統合する。
トポロジー強化関係推論は、抽出されたグラフの固有のトポロジーを利用して、効率的に関係を推測する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:55:13 GMT)
Key and Value Weights Are Probably All You Need: On the Necessity of the Query, Key, Value weight Triplet in Decoder-Only Transformers [0.0] クエリの重みが冗長であることの仮定を単純化し、非埋め込み/lmヘッドパラメータの数を8%以上削減する。
完全複雑GPT-3小アーキテクチャの理論を検証した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 22:39:34 GMT)
KV-weights are all you need for skipless transformers [0.0] V と P (post-attention projection) の線形層を持たないスキップレストランス。
このマイクロペーパーは、MQAとGQAに適した数学的に等価なバージョンを提案する。
例えば、ミストラル7BのスキップレスバージョンからQとPを取り除くと、重量の15%が取り除かれる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:31:15 GMT)
Inter-turbine Modelling of Wind-Farm Power using Multi-task Learning [0.0] この研究は、まず、データから学習した覚醒効果を調節する風車パワーを予測する確率論的回帰モデルを導入する。
異なるタスクに対する学習モデルパラメータの空間的相関を階層的ベイズモデルで活用して「メタモデル」を開発する
その結果、メタモデルは一連のベンチマークモデルより優れており、構造体の個体群における推論に効率的にデータを利用するための新しい戦略が示されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 20:50:49 GMT)
Information-acquiring von Neumann architecture of a computer: A theoretical design [0.0] 我々は,レジスタの細粒度あるいは粗粒度モデルを用いて,コンピュータの情報取得型フォン・ノイマンアーキテクチャを設計する。
このアーキテクチャは、与えられた入力純状態からシステムの他の出力純状態(機能)に変換するハミルトニアンプロセスと、情報を取得する物理プロセスの両方を可能にする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:12:47 GMT)
In Search of the Unknown Unknowns: A Multi-Metric Distance Ensemble for Out of Distribution Anomaly Detection in Astronomical Surveys [0.0] 本稿では,距離測定値のアンサンブルを用いて新しいものを見つけるディスタンス・マルチメトリック異常検出(DiMMAD)を提案する。
我々は、このマルチメトリックなアプローチを、天文学的時系列の単純かつ解釈可能な科学的発見のツールとして実証する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:00:00 GMT)
Improving Predictions of Molecular Properties with Graph Featurisation and Heterogeneous Ensemble Models [0.0] 機械学習(ML)モデルの多種多様なセットから予測を集約するメタモデルフレームワークを導入する。
テストされたすべての回帰データセットにおいて、我々のフレームワークが最先端のChemPropモデルより優れていることを示す。
幅広い課題にまたがって最適な性能を達成するためには,汎用記述子とタスク固有の学習機能を組み合わせることが不可欠である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:33:05 GMT)
Hamiltonian learning via quantum Zeno effect [0.0] 局所的相互作用からなるハミルトン作用素に対するスケーラブルで実験的なハミルトン学習プロトコルを提案する。
理論的性能保証を導出し,IBMの超伝導量子ハードウェアへの実験的実装を通じて,数値シミュレーションによるプロトコルの実現可能性を示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:49:56 GMT)
Group word dynamics from local random matrix Hamiltonians and beyond [0.0] 近接相互作用が1乗2乗のランダム行列である1次元量子スピン鎖について検討する。
我々は、原鎖内のエネルギー密度の多体量子力学から、局所ヒルベルト空間次元が大きいときの単一粒子ホッピング力学への写像を確立する。
我々の結果は、自由確率理論、双曲格子の量子力学、および一般および可積分ハミルトニアン力学の物理学において接触アイデアを導いた。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:00:06 GMT)
Giant Isotope Effect on the Excited-State Lifetime and Emission Efficiency of the Silicon T Centre [0.0] 我々は、シリコン中の通信バンドエミッタであるT中心を調査し、その励起状態寿命の強い同位体依存性を見出した。
重水素T中心の寿命は、一般的なプロチウム変態の5倍以上である。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:08:52 GMT)
Gen-LangSplat: Generalized Language Gaussian Splatting with Pre-Trained Feature Compression [0.0] 我々は,シーンワイドオートエンコーダを汎用オートエンコーダに置き換えるGen-LangSplatを導入し,大規模ScanNetデータセット上で広範囲に事前トレーニングを行った。
このアーキテクチャシフトにより、シーン固有のトレーニングを必要とせずに、新しいシーンにまたがる言語機能に対して、固定的でコンパクトな潜在空間を使用できるようになる。
以上の結果から,新しい3次元シーンにおけるオープン語彙クエリを効率よく,かつ正確に支援できることが示唆された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:13:38 GMT)
Gaussian tomography for cold-atom simulators [0.0] アナログ量子シミュレータの制限は、読み出しは電荷ベースで対角的に観測可能なものに限られていることである。
我々は、対角線(電流など)の電荷-対角線相関を測定するための実験フレンドリーなスキームを提案する。
我々のプロトコルはランダムな時間に非相互作用力学を使用し、次に標準量子ガス顕微鏡で測定する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:55:32 GMT)
GRAD: Real-Time Gated Recurrent Anomaly Detection in Autonomous Vehicle Sensors Using Reinforced EMA and Multi-Stage Sliding Window Techniques [0.0] 本稿では,自動運転車センサのリアルタイム異常検出手法であるGRADを紹介する。
提案手法は,スムーズな要因に適応するReinforced Exponential moving Average (REMA) と,短期パターンと長期パターンの両方をキャプチャするMulti-Stage Sliding Window (MS-SW) 技術を組み合わせたものである。
GRADはGRUの2つの層からなる軽量なアーキテクチャで、ニューロンの数が限られており、リアルタイムアプリケーションに適している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:44:15 GMT)
Fundamental Limits to Cat-Code Qubits from Chaos-Assisted Tunneling [0.0] 本稿では,カオス支援トンネル(CAT)がKerr-cat量子ビットの保護に固有の制限を課していることを示す。
我々は、フル量子シミュレーションと半古典的WKB理論の両方を用いてトンネルの速度を計算し、定量的な一致を見つけ、分裂がカオスに直接関連していることを確認する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:21:48 GMT)
Friction on Demand: A Generative Framework for the Inverse Design of Metainterfaces [0.0] ターゲット摩擦法則から表面トポグラフィーを推定するための生成的モデリングフレームワークを提案する。
パラメータ化された接触力学モデルから構築された2億のサンプルからなる合成データセットに基づいて,提案手法により,候補地形の効率的なシミュレーションフリー生成が可能となる。
この手法は、表面トポグラフィーによる摩擦挙動のほぼリアルタイム制御の道を開くものである。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:00:48 GMT)
Free-space quantum interface of a single atomic tweezer array with light [0.0] 本稿では,2次元原子トウィーザアレイによる光の対向化に関する実践的アプローチを提案する。
我々は、自然に配列に結合するフィールドモードを設計することを提案する。
これはアレイの回折順序に対応する複数のビームのユニークな重ね合わせで構成されている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:56:22 GMT)
Fast initialization of Bell states with Schrödinger cats in multi-mode systems [0.0] 猫の状態は特定の種類のノイズに対して保護されており、猫の量子ビットは量子コンピューティングの有望な候補となる。
我々は,アディバティック・ダイアバティック・スイッチングによる多モード猫状態の効率的な変換を実証した。
これらの変換は、ネコをエンタングルド・ベル状態から初期化するのに対して、ネコをエンタングルド・フォック状態として直接初期化するのに用いられる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:36:21 GMT)
FPGA-Based Adaptive Control for Phase Stabilization in Fiber-Optic Interferometers Using Correlated Photons [0.0] 時間ビンエンコードされた光子対は、長距離量子通信のために光ファイバを介して堅牢で非コヒーレンス耐性の伝送を可能にする。
我々は,1Hzのリアルタイムフィードバックで動作する完全ディジタルFPGAプラットフォーム上で,適応型摂動オブザーバアルゴリズムを実装した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 17:42:01 GMT)
Exploring Vulnerability in AI Industry [0.0] ファンデーション・モデル(FM)は、プラットフォーム・エコノミクスと激しい投資によって形作られた乱暴な市場を後押しし、大きな普及を遂げた。
本稿では,FM制作のための上流値連鎖に着目したAI Vulnerability Index(AIVI)を提案する。
我々は、FM出力を、計算、データ、タレント、資本、エネルギーの5つの入力の関数としてモデル化し、あらゆる入力における供給の脆弱性が業界を脅かすと仮定する。
制限と改善の余地があるにもかかわらず、この事前インデックスは、AIの中核生産エンジンのシステム的リスクを定量化することを目的としており、ダウンストリームバリューチェーンのリスクに暗黙的に光を当てている。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:26:40 GMT)
Explainable Detection of AI-Generated Images with Artifact Localization Using Faster-Than-Lies and Vision-Language Models for Edge Devices [0.0] 本稿では、軽量な畳み込み分類器("Faster-Than-Lies")と視覚言語モデル(Qwen2-VL-7B)を組み合わせた説明可能な画像の真正性検出システムを提案する。
我々のモデルは、敵の摂動を付加した拡張CiFAKEデータセットの96.5%の精度を実現し、ローカルデバイスやエッジデバイスへのデプロイを可能にした。
この研究は、低解像度画像における解釈可能な真正性検出のための視覚的推論と言語学的推論を組み合わせる可能性を強調し、法医学、産業検査、ソーシャルメディアのモデレーションにおける潜在的なクロスドメイン応用を概説する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:01:24 GMT)
Estimating applied potentials in cold atom lattice simulators [0.0] そこで本研究では,任意のポテンシャルを高精度に測定できる,シンプルで効率的な実験プロトコルを提案する。
このプロトコルの重要な要素は、一部の原子種がフェシュバッハ共鳴を用いて相互作用を遮断する能力である。
我々は、既知の、容易に準備された初期状態の時間進化からのスナップショットの収集が、そのポテンシャルを正確に推定するのに十分であることを示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:09:01 GMT)
Entanglement production in the decay of a metastable state [0.0] 我々は、窓付きフーリエ変換を用いて、異なるタイミングで生成された放射フラグメントに関連する多重モード量子状態を定義する。
「このようなエントロピー増分は、特にホーキング放射のように、放射線を古いものと新しいものとに分けたい場合に有用な絡み合い策である」と論じる。」
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:39:24 GMT)
Effective Dynamics for Weakly Interacting Bosons in an Iterated High-Density Thermodynamic Limit [0.0] 任意の体積の3次元トーラス上での弱い相互作用を持つボース気体の時間進化について検討する。
準完全ボース=アインシュタイン凝縮を示す初期状態のクラスを考慮する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:28:15 GMT)
ECGXtract: Deep Learning-based ECG Feature Extraction for Automated CVD Diagnosis [0.0] 本稿では,深層学習に基づくECG特徴抽出手法ECGXtractを提案する。
我々は, 時間的特徴と形態的特徴の両方を, 臨床的に検証された真実と強く相関して抽出できる畳み込みニューラルネットワークモデルを開発した。
以上の結果から,ECGXtractは平均相関スコアが0.80であり,世界的特徴の根本的真理であり,リードIIが常に最高の結果をもたらすことが示唆された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:53:08 GMT)
Distributional Autoencoders Know the Score [0.0] 分散主オートエンコーダ(DPA)は、分布的に正しい再構成と、そのエンコーディングの主成分的解釈可能性を組み合わせたものである。
両面において正確な理論的保証を提供する。
そこで本研究では,データ分布と本質的な次元を同一のモデルで同時に学習できることを述べる。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:26:42 GMT)
Differential magnetometry with partially flipped Dicke states [0.0] 3つの空間軸に沿った勾配と均質背景場の磁力測定について検討した。
これらのパラメータの達成可能な推定精度のトレードオフ関係を導出する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:53:25 GMT)
Deep Copula Classifier: Theory, Consistency, and Empirical Evaluation [0.0] ディープコピュラ(Deep Copula、DCC)は、依存モデルから境界推定を分離するクラス条件生成モデルである。
DCCは解釈可能で、ベイズ整合であり、過剰リスク$O(nr/(2r+d))$$$r$-smooth copulasを達成する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:28:31 GMT)
DecoDINO: 3D Human-Scene Contact Prediction with Semantic Classification [0.0] Decoのフレームワークをベースとした3分岐ネットワークであるDecoDINOを紹介する。
2つのDINOv2 ViT-g/14エンコーダ、バイアスを減らすためにクラスバランスの損失重み付け、局所推論を改善するためにパッチレベルのクロスアテンションを使用する。
DAMONベンチマークでは、DecoDINOは2値接触F1スコアを7$%の値で上げ、(ii)ジオデシックエラーを半減させ、(iii)オブジェクトレベルのセマンティックラベルによる予測を強化した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 10:46:22 GMT)
Cross-Lingual Summarization as a Black-Box Watermark Removal Attack [0.0] 言語間の要約攻撃は質的に強い攻撃ベクトルを構成する。
CLSAはモノリンガルパラフレーズよりも効果的な透かし検出精度を低下させる。
結果は、言語を横断し、可視的アーティファクトなしでコンテンツを圧縮する実用的で低コストな除去経路を強調している。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:55:52 GMT)
CountFormer: A Transformer Framework for Learning Visual Repetition and Structure in Class-Agnostic Object Counting [0.0] 人間は、クラスアイデンティティに頼るのではなく、視覚的反復と構造的関係を知覚することで、多種多様な物体を努力せずに数えることができる。
本研究では,クラスに依存しないオブジェクトカウントのための繰り返しと構造的コヒーレンスを認識することを学ぶトランスフォーマーベースのフレームワークであるCountFormerを紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 19:16:02 GMT)
Continental-scale habitat distribution modelling with multimodal earth observation foundation models [0.0] ハビタットは、生物多様性を支援し、人々の自然への貢献を維持する、無生物的な条件、植生の構成、構造を統合する。
現在の生息地マップは、しばしばテーマや空間分解能において不足している。
我々は,高分解能リモートセンシング(RS)データと人工知能(AI)ツールが生息地マッピングをどのように改善するかを評価した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:12:08 GMT)
Computational-Assisted Systematic Review and Meta-Analysis (CASMA): Effect of a Subclass of GnRH-a on Endometriosis Recurrence [0.0] 本研究では,情報検索駆動型ワークフローであるCASMAを評価し,効率,透明性,体系的レビューを改善する。
ファジィマッチングと正規表現(regex)を併用したハイブリッドアプローチ PRISMA ガイドラインは,手動スクリーニングの前に半自動重複とフィルタリングレコードを容易にする。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:02:27 GMT)
Complexity Dependent Error Rates for Physics-informed Statistical Learning via the Small-ball Method [0.0] 物理インフォームド統計学習(PISL)は、実験データを物理知識と統合し、推定器の統計的性能を高める。
この研究は、関数の凸クラスにおける物理学的インフォームド推定器の統計的性質を評価するための理論的枠組みを確立する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:26:07 GMT)
Collective emission and selective radiance in atomic clouds and arrays coupled to a microring resonator [0.0] 原子は自由空間を介する光誘起双極子-双極子相互作用と共振器のささやき声モードによって相互作用する。
これらのモードの異なる特性と不整合波数は複雑な力学を引き起こし、光-物質相互作用を制御する新しい機会を与える。
実験により得られた原子雲の文脈でこれらの現象を探索し,提案したサブ波長原子アレイのポテンシャルについて検討する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:29:03 GMT)
Clinic-Oriented Feasibility of a Sensor-Fused Wearable for Upper-Limb Function [0.0] 上肢の弱さと震動(4~12Hz)は日常生活(ADL)の活動を制限するとともに、在宅リハビリテーションへの付着を減少させる。
トリペスブラキイ及び伸展性花粉症を標的としたセンサフューズウェアラブルの技術的実現性及び臨床関連信号を評価する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 01:30:26 GMT)
Classical theories of gravity produce entanglement [0.0] 現代の実験では、2つの物体が後に絡まった場合、これは重力が量子力学の法則に従うという明確な証拠であると考えられている。
ここでは、古典的な重力相互作用は量子情報を伝達し、物理的に局所的な過程を通じて絡み合いを発生させることができると論じる。
この効果は、考慮された量子重力効果とは異なるスケールが見られ、重力の量子的性質を証明するのに必要な実験の形式に関する情報を提供する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:12:50 GMT)
Checkstyle+: Reducing Technical Debt Through The Use of Linters with LLMs [0.0] We propose Checkstyle+, a hybrid approach that a checkstyle with large language model (LLM) capabilities。
Checkstyle+は380のJavaコードファイルのサンプルで評価され、30,800の現実世界のJavaプログラムのデータセットから抽出される。
その結果,Checkstyle+は,意味的ニュアンスルールの違反を検出する上で,標準のCheckstyleよりも優れた性能を発揮することがわかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 07:08:02 GMT)
Causal Deep Q Network [0.0] 我々は、Deep Q Networks(DQNs)に因果原理を統合する新しいアプローチを導入する。
学習中の因果推論を取り入れることで,DQNの環境の因果構造に対する理解を深める。
我々は,DQNと因果的能力を統合することで,性能を損なうことなく,問題の解決能力を大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:28:17 GMT)
Bound entanglement in symmetric random induced states [0.0] 量子エンタングルメントの弱いが資源に富んでいる境界エンタングルメントは、検出と構築が難しいことで知られている。
一方は対称多ビット純状態の部分的トレースと他方ではキュディアンシラをトレースする2つの手法を用いる。
N > 3$ qubits の場合、有界な絡み合いは自然に最適パラメータの下で現れ、その確率は 1 に非常に近い。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 16:13:28 GMT)
Born series for s-wave scattering length and some exact results [0.0] ボルン級数は、中心ポテンシャルのクラス$V(r)$を次元のない結合強度$g$で6階まで計算する。
指数関数的に崩壊するポテンシャルの例と、単一の長さスケールの$a$を含む切り詰められたポテンシャルの例を考察する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:45:34 GMT)
Beyond Prompt Engineering: Neuro-Symbolic-Causal Architecture for Robust Multi-Objective AI Agents [0.0] 大規模な言語モデルは、自律的な意思決定エージェントとして有望であるが、高い領域への展開はリスクを伴い続けている。
本稿では,LLMストラテジスト,公式なシンボル制約エンジン,因果推論モジュールを統合した,ニューロシンボリック・因果的アーキテクチャであるChimeraを紹介する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:25:35 GMT)
Beyond PCA: Manifold Dimension Estimation via Local Graph Structure [0.0] そこで本研究では,PCAと回帰に基づく手法を統合することで,多様体次元推定のための一般的なフレームワークを提案する。
本枠組みでは,2次埋め込み (QE) と最小二乗 (TLS) の2つの代表的な推定器を紹介する。
合成されたデータセットと実世界のデータセットの両方の実験では、これらの手法が最先端の代替手段と競合し、しばしば優れています。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 23:02:56 GMT)
Benchmarking VQE Configurations: Architectures, Initializations, and Optimizers for Silicon Ground State Energy [0.0] 本研究では、シリコン原子の基底状態エネルギーの推定における変分量子解法(VQE)の性能について検討する。
ハイブリッド量子古典最適化フレームワークでは,Double Excitation Gates, ParticleConservingU2, UCCSD, k-UpCCGSDなど,様々なアンサッツを用いてVQEを実装している。
この研究の主な貢献は、VQEのパフォーマンスに影響を与えるためにこれらの構成の選択がどのように相互作用するかを体系的に調査することにある。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:57:26 GMT)
Bayesian neural networks with interpretable priors from Mercer kernels [0.0] 提案手法では,BNN が特定の GP に近似したサンプルを持つような,Mercurer priors と呼ばれる新しい BNN の事前クラスを導入する。
この方法は、共分散カーネルのマーサー表現からネットワークパラメータを直接的に定義することで機能し、特定の構造を持つネットワークに依存しない。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:25:21 GMT)
BCR-Net: Boundary-Category Refinement Network for Weakly Semi-Supervised X-Ray Prohibited Item Detection with Points [0.0] 点を用いた半監督X線禁止項目検出(WSSPID-P)について検討した。
textbfBoundary-textbfCategory textbfRefinement textbfNetwork (textbfBCR-Net) を提案する。
BCR-Net は Group R-CNN をベースとして構築され、新しいBundary Refinement (BR) モジュールと新しいCalegory Refinement (CR) が導入された。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 06:56:08 GMT)
Automatización de Informes Geotécnicos para Macizos Rocosos con IA [0.0] 本稿では,ジオテクニカルレポートの自動生成のための人工知能技術を提案する。
これは、岩石の露頭と手動のサンプルの収集と、ジオテクニカル・スタディ・コースで準備された報告に基づいている。
レポートの各セクションで構造化および具体的指示が得られるまでのプロンプトの反復的改善は、マルチモーダル大言語モデルの微調整に有効な選択肢であることが判明した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 00:42:48 GMT)
Artificial Intelligence Based Predictive Maintenance for Electric Buses [0.0] 本研究では,電気バスのCANバスパラメータ間の関係をグラフベースの特徴選択法を用いて解析する。
2年以上にわたって収集された生データは、データ品質と一貫性を確保するために、広範囲な事前処理が行われた。
開発したシステムは,車両の警報を効果的に予測し,特徴の解釈可能性を高め,産業4.0の原則に沿った積極的な保守戦略を支援する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 21:39:25 GMT)
Arabic Little STT: Arabic Children Speech Recognition Dataset [0.0] 教室で記録されたレバンタ・アラビア・チャイルド・スピーチのデータセットであるアラビア・リトルSTTを提示する。
また,このデータセットを用いて,最先端自動音声認識(ASR)モデルであるWhisperを体系的に評価する。
評価の結果, 最良性能モデル(Large_v3)でさえ, 子どもの発話において0.66ワード誤り率(WER)を達成できないことが判明した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:30:54 GMT)
Anti-concentration is (almost) all you need [0.0] 局所乱数量子回路の反集中は、相対誤差近似状態2-設計を形成することを既に示している。
我々の結果はより一般的に、局所(単一量子)ユニタリの下で不変な任意のランダム回路に対して成り立つ。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:00:12 GMT)
Anti-Flatness and Non-Local Magic in Two-Particle Scattering Processes [0.0] 非局所魔法と反平坦性は、物理系の波動関数における量子複雑性の尺度を提供する。
2粒子散乱過程における非局所魔法と反平坦性,特に低エネルギー核子-核子散乱と高エネルギーモルラー散乱に着目した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 15:31:26 GMT)
Analysis of accuracy and efficiency of neural networks to simulate Navier-Stokes fluid flows with obstacles [0.0] ランダムな障害物重畳環境下で非圧縮性流体をシミュレーションするニューラルネットワークの実現可能性について検討した。
選択したニューラルネットワークは,従来のシミュレーションよりも約8,800倍高速に流れを予測できることがわかった。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:57:29 GMT)
An Efficient Remote Sensing Super Resolution Method Exploring Diffusion Priors and Multi-Modal Constraints for Crop Type Mapping [0.0] 超解像度は、低解像度でも歴史的に価値のあるリモートセンシング画像アーカイブを利用する方法を提供する。
現在の手法では、科学的に現実的なイメージを再構成するための現実的な制約として補助情報を限定的に活用している。
RSSR のための効率的な LSSR フレームワークを提案し,Landsat 8 と Sentinel 2 画像のペア化によるマルチモーダルデータセットを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:34:52 GMT)
An Ecosystem for Ontology Interoperability [0.0] オントロジーの相互運用性は、相互運用可能なグラフにおける知識の使用を制限する複雑な問題の1つである。
相互運用性のためのオントロジーを構築するためのエコシステムを提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 14:28:50 GMT)
Adaptive quantum dynamics with the time-dependent variational Monte Carlo method [0.0] 変動量子状態の表現率を適応的に制御する,時間依存型変分モンテカルロ法(tVMC)の拡張を導入する。
スピンジャストロウと制限ボルツマン機械波動関数を用いた一次元横場イジングモデルにおける量子クエンチのベンチマークを行った。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 18:02:26 GMT)
Adaptive quantum channel discrimination using methods of quantum metrology [0.0] 本稿では,最適な適応量子チャネル識別戦略を求めるための効率的なテンソルネットワークに基づくアルゴリズムを提案する。
本稿では,チャネル識別と推定問題の関連性について検討し,特にハイゼンベルクスケーリング推定性能を許容するモデル間の構造的類似性に注目した。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 13:16:59 GMT)
Adapting Interleaved Encoders with PPO for Language-Guided Reinforcement Learning in BabyAI [0.0] 我々は、パーセプション・ディシジョン・インターリーブ・トランス(PDiT)アーキテクチャを実装している。
PDiTは、単一の変換器内の知覚層と決定層を交互に行う。
提案手法は,標準のPPOベースラインに比べて,より安定な報酬とアライメントを実現する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:24:51 GMT)
AQCat25: Unlocking spin-aware, high-fidelity machine learning potentials for heterogeneous catalysis [0.0] AQCat25は13.5万密度汎関数理論(DFT)単点計算を補完するデータセットである。
我々は、AQCat25のような新しいデータセットとより広範なOpen Catalyst 2020 (OC20)データセットを統合する方法を検討する。
例えば、FiLM(Feature-wise Linear Modulation)を用いることで、この課題に対処できることを示す。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 02:47:20 GMT)
AI Compute Architecture and Evolution Trends [0.0] 本稿では,AI計算アーキテクチャのための7層モデルを提案する。
各層について,開発軌跡と鍵となる技術について述べる。
本稿では、インターネット産業を分析し、AI開発の将来的な軌跡について予測する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 03:00:37 GMT)
ADPO: Anchored Direct Preference Optimization [0.0] 直接選好最適化(DPO)は、人間のフィードバックからの強化学習の効果的な代替手段である。
ソフトな嗜好確率を組み込んだAnchored Direct Preference Optimization (ADPO)を提案する。
ADPOは標準DPOベースラインよりも12%から79%の改善が見られた。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 12:50:13 GMT)
A method for outlier detection based on cluster analysis and visual expert criteria [0.0] アウトリーチは不正な行動、機械的欠陥、ヒューマンエラー、あるいは単に自然な逸脱の結果である。
本稿では,クラスタリングプロセスに基づく異常検出手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 09:16:16 GMT)
A critical assessment of reinforcement learning methods for microswimmer navigation in complex flows [0.0] 搭載されたセンサーからのみアクセス可能な情報を用いて流体の流れを移動させることは、小さなプランクトン生物が直面する問題である。
過去10年間、流体力学のコミュニティは、しばしば最も単純な実装の形で強化学習を広く採用してきた。
しかし、これらのアルゴリズムが学習した戦略がどの程度優れているかは不明だ。
論文参考訳(メタデータ) (Mon, 27 Oct 2025 11:14:40 GMT)