Video Understanding with Large Language Models: A Survey [107.8] 言語・マルチモーダルタスクにおける大規模言語モデル(LLM)の顕著な機能を考えると,近年の映像理解の進歩について概観する。
Vid-LLMの創発的能力は驚くほど進歩しており、特にオープンな多粒性推論能力がある。
本調査は,Vid-LLMのタスク,データセット,ベンチマーク,評価方法論に関する総合的研究である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:24:55 GMT)
MM-PoisonRAG: Disrupting Multimodal RAG with Local and Global Poisoning Attacks [104.5] Retrieval Augmented Generation (RAG) を用いた多モーダル大規模言語モデルは、多モーダル質問応答のようなかなり高度なタスクを持つ。
この外部知識への依存は、知識中毒攻撃(英語版)という、危険だが未発見の安全リスクを引き起こす。
マルチモーダルRAGにおける知識中毒を体系的に設計する最初のフレームワークであるMM-PoisonRAGを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:51:51 GMT)
SimpleDeepSearcher: Deep Information Seeking via Web-Powered Reasoning Trajectory Synthesis [94.3] Retrieval-augmented Generation (RAG) システムは複雑なディープ検索シナリオにおいて高度な大規模言語モデル(LLM)を持つ。
既存のアプローチでは、高品質なトレーニングトラジェクトリが欠如し、分散ミスマッチに苦しむ、重要な制限に直面しています。
本稿では,複雑なトレーニングパラダイムではなく,戦略的データエンジニアリングによるギャップを埋めるフレームワークであるSimpleDeepSearcherを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:40:37 GMT)
Memory-R1: Enhancing Large Language Model Agents to Manage and Utilize Memories via Reinforcement Learning [89.6] 大規模言語モデル(LLM)は、幅広いNLPタスクで印象的な機能を示しているが、基本的にはステートレスである。
本稿では,LLMに外部メモリを積極的に管理・活用する機能を備えた強化学習フレームワークであるMemory-R1を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:54:13 GMT)
Keep It on a Leash: Controllable Pseudo-label Generation Towards Realistic Long-Tailed Semi-Supervised Learning [88.5] ラベル付きデータセットから信頼できる擬似ラベルでラベル付きデータセットを拡張するための制御可能な擬似ラベル生成(CPG)フレームワークを提案する。
CPGは制御可能な自己強化最適化サイクルを介して動作する。
CPGは、最先端のメソッドを最大$textbf15.97%の精度で上回り、一貫した改善を実現している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:59:22 GMT)
Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.6] ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:06:10 GMT)
Think Natively: Unlocking Multilingual Reasoning with Consistency-Enhanced Reinforcement Learning [85.7] 本稿では,言語一貫性報酬と言語間思考アライメント報酬によって訓練されたM-Thinkerを提案する。
M-Thinkerは2つのマルチ言語ベンチマークで100%近い言語一貫性と優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:55:02 GMT)
Advancing AI Research Assistants with Expert-Involved Learning [84.3] 大規模言語モデル (LLM) と大規模マルチモーダルモデル (LMM) は、生物医学的な発見を促進することを約束するが、その信頼性は未定である。
ARIEL(AI Research Assistant for Expert-in-the-Loop Learning)は,オープンソースの評価・最適化フレームワークである。
LMMは詳細な視覚的推論に苦しむのに対し、最先端のモデルでは流動性はあるが不完全な要約を生成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:16:32 GMT)
Poisoning Attacks on LLMs Require a Near-constant Number of Poison Samples [81.7] この研究は、データセットのサイズに関わらず、毒殺攻撃がほぼ一定数のドキュメントを必要とすることを初めて実証した。
250の有毒なドキュメントも同様に、すべてのモデルとデータセットサイズにわたってモデルを妥協している。
以上の結果から,データ中毒によるバックドア注入は,従来考えられていたよりも大型モデルの方が容易である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:25:05 GMT)
Video-LMM Post-Training: A Deep Dive into Video Reasoning with Large Multimodal Models [78.4] ビデオ理解はコンピュータビジョンにおける最も困難なフロンティアである。
近年,映像理解タスクにおいて,映像多時間モデルが顕著に出現している。
Surveyは、ビデオ-LMM能力を向上するための統一的なフレームワークを研究者や実践者に提供することを目的としている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:08:31 GMT)
DreamOmni2: Multimodal Instruction-based Editing and Generation [78.0] マルチモーダルな命令ベースの編集と生成という2つの新しいタスクを提案する。
これらのタスクはテキストとイメージの命令の両方をサポートし、具体的概念と抽象概念の両方を含むようにスコープを拡張する。
データ合成パイプラインは,(1)抽象的概念と具体的概念の両方の抽出データを作成するための特徴混合法,(2)編集と抽出モデルを用いたマルチモーダル命令ベースの編集訓練データを生成すること,(3)抽出モデルを適用してマルチモーダル命令ベースの編集のためのトレーニングデータを生成すること,の3つのステップで構成されている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:07:14 GMT)
IAR2: Improving Autoregressive Visual Generation with Semantic-Detail Associated Token Prediction [77.1] IAR2は、階層的なセマンティックディーテール合成プロセスを可能にする高度な自己回帰フレームワークである。
我々は、IAR2が自動回帰画像生成のための新しい最先端技術を設定し、ImageNet上で1.50のFIDを達成することを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:08:21 GMT)
TalkCuts: A Large-Scale Dataset for Multi-Shot Human Speech Video Generation [76.5] 本研究では,マルチショット音声ビデオ生成を支援する大規模データセットであるTalkCutsを提案する。
TalkCutsは、クローズアップ、ハーフボディ、フルボディビューを含む様々なカメラショットを備えた、500時間以上の高品質な人間の音声ビデオクリップを提供する。
このデータセットには、詳細なテキスト記述、2Dキーポイント、3D SMPL-Xモーションアノテーションが含まれ、10k以上のアイデンティティをカバーし、マルチモーダル学習と評価を可能にする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:16:09 GMT)
OmniRetarget: Interaction-Preserving Data Generation for Humanoid Whole-Body Loco-Manipulation and Scene Interaction [76.4] ヒューマノイドロボットの複雑なスキルを教えるための主要なパラダイムは、強化学習ポリシーの運動学的参照として人間の動きを再ターゲットすることである。
インタラクションメッシュに基づくインタラクション保存データ生成エンジンであるOmniRetargetを紹介する。
人間のメッシュとロボットメッシュの間のラプラシアの変形を最小限にすることで、OmniRetargetは運動学的に実現可能な軌道を生成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:16:20 GMT)
Modality-Balancing Preference Optimization of Large Multimodal Models by Adversarial Negative Mining [75.1] LMMにおけるモダリティの不均衡に対処するため、新しい選好学習フレームワークMBPOを提案する。
MBPOは、強い負の反応、すなわちLLMバイアスによって誤った反応を生成することによって、より効果的なオフライン嗜好データセットを構築する。
視覚言語課題におけるLMM性能を高め、幻覚を効果的に軽減することができる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:18:43 GMT)
Identifying and Evaluating Inactive Heads in Pretrained LLMs [74.9] 本研究では,頭部の不活性度を計測する13のスコア関数の分類法を提案する。
平均して12%以上の注意頭は活動せず、特定の文脈で改善することができる。
スコア分布を測定することで、注意行動に対する洞察が得られることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:58:05 GMT)
POME: Post Optimization Model Edit via Muon-style Projection [74.7] POME(Post-Optimization Model Edit)は、微調整された大規模言語モデルの性能を向上させる。
デルタW$のミューオン式のプロジェクションを使い、微調整された重量と事前訓練された重量の違いを区別する。
単純な後処理ステップとして、POMEはトレーニングパイプラインから完全に分離される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:20:11 GMT)
SafeGuider: Robust and Practical Content Safety Control for Text-to-Image Models [74.1] テキスト・ツー・イメージのモデルは、安全対策を回避し、有害なコンテンツを生成できる敵のプロンプトに対して非常に脆弱である。
textbfSafeGuiderは、生成品質を損なうことなく、堅牢な安全制御を実現するための2段階のフレームワークである。
SafeGuiderは攻撃成功率の最小化において例外的な効果を示し、様々な攻撃シナリオで最大速度は5.48%である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:00:39 GMT)
OmniSAT: Compact Action Token, Faster Auto Regression [70.7] 我々は、コンパクトで転送可能なアクション表現を学ぶOmni Swift Action Tokenizerを紹介する。
その結果、離散トークン化はトレーニングシーケンスを6.8$times$に短縮し、ターゲットエントロピーを低下させる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:55:24 GMT)
The Markovian Thinker [70.4] 強化学習(Reinforcement Learning, RL)は、LongCoT(LongCoT)という長鎖のLLMを学習するための強力なレシピとなっている。
しかし、状態がプロンプトプラス全ての先行推論トークンである標準的なRLの「思考環境」は、州を無拘束にし、思考が長くなるにつれて注意に基づく政策に二次計算を支払うよう強制する。
我々は,一定サイズの状態に条件付けしながら,政策が推論を進めるパラダイムであるマルコフ的思考を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:18:13 GMT)
AutoMind: Adaptive Knowledgeable Agent for Automated Data Science [70.3] LLM(Large Language Model)エージェントは、現実世界のデータサイエンス問題に対処する大きな可能性を示している。
既存のフレームワークは、厳格で、事前定義された、柔軟性のないコーディング戦略に依存している。
適応的で知識のあるLLMエージェントフレームワークであるAutoMindを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:06:47 GMT)
TRAVL: A Recipe for Making Video-Language Models Better Judges of Physics Implausibility [70.2] ビデオ生成モデルは、浮動、テレポート、モーフィングのような直感的な物理法則に違反したシーケンスを生成する。
既存のビデオランゲージモデル(VLM)は、物理違反の特定に苦慮し、時間的および因果的推論における根本的な制限を明らかにしている。
我々は、バランスの取れたトレーニングデータセットと軌道認識型アテンションモジュールを組み合わせた微調整レシピTRAVLを導入し、モーションエンコーディングを改善する。
言語バイアスを除去し,視覚的時間的理解を分離する300本のビデオ(150本実写150本)のベンチマークであるImplausiBenchを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:03:46 GMT)
Learning to Route LLMs from Bandit Feedback: One Policy, Many Trade-offs [69.2] BaRPはBandit Routing-feedback with Preferencesアプローチであり、デプロイと同じ部分フィードバック制限の下でトレーニングされる。
提案手法は,学習中のオンラインフィードバック設定をシミュレートし,新たなプロンプトに適応する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:24:59 GMT)
KnowRL: Exploring Knowledgeable Reinforcement Learning for Factuality [66.9] 大規模言語モデル(LLM)は、しばしば、推論中に知識境界を正確に認識できないために、誤ったコンテンツを出力する、厳しい幻覚を示す。
スロー思考モデルにおける高い幻覚に対処するために,知識強化RL(KnowRL)を提案する。
KnowRLは、知識検証に基づいて事実性報酬をRLトレーニングプロセスに統合することにより、事実に基づくスロー思考を行うモデルを支援する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:56:59 GMT)
Chronological Thinking in Full-Duplex Spoken Dialogue Language Models [66.8] 時系列思考は、完全なSDLMの応答品質を改善することを目的としている。
追加のレイテンシがない: ユーザが話すのをやめると、エージェントは考えるのをやめ、それ以上の遅延なしに話し始める。
結果: 客観的指標と人的評価の両面から, 時系列思考の有効性を示す実験を行った。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:35:40 GMT)
SaFeR-VLM: Toward Safety-aware Fine-grained Reasoning in Multimodal Models [66.7] MLRM(Multimodal Large Reasoning Models)は、クロスモーダルな推論を示すが、しばしば敵のプロンプトによる安全性のリスクを増幅する。
既存の防御は主に出力レベルで動作し、推論プロセスを制約せず、モデルは暗黙のリスクに置かれる。
4つのコンポーネントを統合し,表面レベルのフィルタリングを超える動的かつ解釈可能な安全性決定をサポートするSaFeR-VLMを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:39:12 GMT)
NewtonBench: Benchmarking Generalizable Scientific Law Discovery in LLM Agents [65.9] 科学法発見のための強力なツールとして、大規模な言語モデルが登場している。
このタスクの既存のベンチマークは、基本的な方法論のトリレンマに悩まされている。
12の物理領域にわたる324の科学法発見タスクからなるベンチマークであるNewtonBenchを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:12:11 GMT)
V2Xum-LLM: Cross-Modal Video Summarization with Temporal Prompt Instruction Tuning [65.3] ビデオ要約は、長いビデオの短く、正確で、結束的な要約を作ることを目的としている。
既存のデータセットのほとんどは、ビデオ間要約用に作成されている。
マルチモーダル映像要約への取り組みが近年行われている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:22:42 GMT)
Temporal Prompting Matters: Rethinking Referring Video Object Segmentation [64.8] Referring Video Object (RVOS) は、クエリ文によって参照されるオブジェクトをビデオにセグメントすることを目的としている。
既存のほとんどの方法は、密集したマスクアノテーションによるエンドツーエンドのトレーニングを必要とする。
本稿では,参照要因とビデオ要因に対処するテンポラル・プロンプト生成・選択(テネ)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:59:57 GMT)
When Thoughts Meet Facts: Reusable Reasoning for Long-Context LMs [64.3] 最近のLong-Context Language Modelsは、1つのプロンプトで数十万のトークンを処理することができる。
我々は、従来の問題解決トレースから導かれた再利用可能な思考キャッシュとして、推論をリキャストする。
本稿では,自然言語フィードバックによって学習データから得られるテンプレートを反復的に洗練する更新戦略を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:52:35 GMT)
Code Agent can be an End-to-end System Hacker: Benchmarking Real-world Threats of Computer-use Agent [64.1] 我々は,MITRE ATT&CK Enterprise Matrix において,実世界の TTP に対応する最初のベンチマークである AdvCUA を提案する。
ReAct、AutoGPT、Gemini CLI、Cursor CLIの5つの主要なCUAを評価した。
結果は、現在のフロンティアCUAがOSのセキュリティ中心の脅威を十分にカバーしていないことを示している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:35:23 GMT)
Unveiling the Basin-Like Loss Landscape in Large Language Models [64.1] 事前学習により, テクストベース機能盆地が生成され, その後のアライメント微調整形式がテクスト固有機能盆地となることが観察された。
その結果, 逆方向の微調整がほぼ最悪の方向に進行し, モデル性能が急速に低下することが判明した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:36:39 GMT)
An Illusion of Progress? Assessing the Current State of Web Agents [61.7] 我々は,Webエージェントの現状を包括的かつ厳密に評価する。
結果は、現在のエージェントの能力の非常に異なる描写を描いており、以前報告された結果に過度に最適化されていることを示唆している。
オンライン評価ベンチマークであるOnline-Mind2Webを紹介した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:22:45 GMT)
Multi-Target Backdoor Attacks Against Speaker Recognition [61.3] 位置に依存しないクリック音を用いた話者識別に対するマルチターゲットバックドア攻撃を提案する。
提案手法は最大50人の話者を同時に対象とし,95.04%の成功率を達成した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:34:59 GMT)
MCTS-RAG: Enhancing Retrieval-Augmented Generation with Monte Carlo Tree Search [61.1] 本稿では,知識集約型タスクにおける小言語モデルの推論能力を高める新しいアプローチであるMCTS-RAGを紹介する。
通常、推論から独立して情報を取得する標準的なRAG法とは異なり、MCTS-RAGは構造化推論と適応的検索を組み合わせる。
この統合されたアプローチは意思決定を強化し、幻覚を減らし、事実の正確性と応答の整合性を向上させる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:36:57 GMT)
SimulatorArena: Are User Simulators Reliable Proxies for Multi-Turn Evaluation of AI Assistants? [61.1] 大規模言語モデル(LLM)は、対話型アプリケーションでますます使われている。
人間の評価は、マルチターン会話におけるパフォーマンスを評価するためのゴールドスタンダードのままである。
我々は、909の注釈付き人間とLLMの会話を2つの対話タスクで行うベンチマークであるSimulatorArenaを紹介した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:12:53 GMT)
LangSplatV2: High-dimensional 3D Language Gaussian Splatting with 450+ FPS [60.9] LangSplatV2は、476.2 FPSで高次元特徴スプラッティングを実現し、384.6 FPSで3Dオープン語彙のテキストクエリを実現する。
LangSplatV2は、より良いまたは競争力のあるクエリ精度を達成するだけでなく、はるかに高速である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:25:34 GMT)
A Bridge from Audio to Video: Phoneme-Viseme Alignment Allows Every Face to Speak Multiple Languages [60.8] 音声による会話顔合成(TFS)は、音声入力から顔のアニメーションを生成することに焦点を当てている。
現在のモデルは英語ではうまく機能するが、英語以外の言語では不満足に機能し、間違った口の形と堅い表情を生み出している。
我々は,Phoneme-Guided Mixture-of-Expertsアーキテクチャを特徴とする新しいフレームワークであるMultilingual Experts (MuEx)を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:46:39 GMT)
MLE-Smith: Scaling MLE Tasks with Automated Multi-Agent Pipeline [60.8] 我々は、MLE-Smithという完全自動化されたマルチエージェントパイプラインを導入し、生データセットを競合スタイルのMLE課題に変換する。
MLE-Smithは構造化されたタスク設計と標準化を駆動し、厳密な構造規則と高レベルのセマンティックサウンドを強制するハイブリッド検証機構と結合する。
我々は、複数のカテゴリ、目的、モダリティにまたがる606のタスクを生成し、MLE-Smithが広範囲の現実世界のデータセットで効果的に動作することを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:57:19 GMT)
Towards the Worst-case Robustness of Large Language Models [60.6] 近年の研究では、敵対的攻撃に対する大きな言語モデルの脆弱性が明らかにされており、敵は有害、暴力、私的、不正なアウトプットを誘導するために特定の入力シーケンスを使用する。
この研究では、最悪の場合のロバスト性、すなわち、そのような望ましくない出力をもたらす逆例が存在するかどうかを調査する。
より強力なホワイトボックス攻撃で最悪の場合のロバスト性を上限にし、現在の決定論的防御のほとんどが、最悪の場合のロバストネスを0%近く達成していることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:21:02 GMT)
From Perception to Cognition: A Survey of Vision-Language Interactive Reasoning in Multimodal Large Language Models [59.9] MLLM(Multimodal Large Language Models)は、物理的世界に対する深い人間的な理解と相互作用を達成するための試みである。
情報取得(知覚)や推論(認知)を行う際、しばしば浅く不整合な統合を示す。
この調査では、新しい統合分析フレームワーク「知覚から認知へ」を紹介した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:20:30 GMT)
ResMimic: From General Motion Tracking to Humanoid Whole-body Loco-Manipulation via Residual Learning [59.6] ヒューマノイド全体のロコ操作は、日々のサービスや倉庫のタスクにトランスフォーメーション機能を約束する。
ResMimicは、人間の動作データから正確に表現力のあるヒューマノイド制御のための2段階の残差学習フレームワークである。
結果は、強いベースラインよりもタスク成功、トレーニング効率、堅牢性が大幅に向上したことを示している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:51:48 GMT)
Generative AI for Cel-Animation: A Survey [59.2] GenAIは、技術的な障壁を減らし、幅広いクリエイターへのアクセシビリティを広げることで、伝統的なアニメーションに革命をもたらしている。
その可能性にもかかわらず、一貫性、スタイリスティックなコヒーレンス、倫理的考察といった課題が続いている。
本稿では,AI支援アニメーションの今後の方向性について考察する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:45:46 GMT)
Barbarians at the Gate: How AI is Upending Systems Research [59.0] システム研究は、新しいパフォーマンス指向アルゴリズムの設計と評価に長年注力してきたが、AI駆動のソリューション発見には特に適している、と私たちは主張する。
このアプローチをAI駆動システム研究(ADRS)と呼び、ソリューションを反復的に生成し、評価し、洗練する。
我々の研究結果は、AI時代のシステム研究の実践に急激な適応の必要性と破壊的な可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:21:49 GMT)
Estimating Fair Graphs from Graph-Stationary Data [58.9] グループレベルとノードレベルの定義に対応するグラフに対する群と個性を考える。
与えられたグラフの公平性を評価するために、スペクトル領域における新しい測定を含む複数のバイアス指標を提供する。
FairSpecTempの1つの変種は、直接バイアスを拘束しながらグラフ定常性の可換性を利用する。
もう一方は、グラフスペクトルのバイアスを制限することによって、公正な推定を暗黙的に奨励し、したがってより柔軟である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:51:57 GMT)
Point2RBox-v3: Self-Bootstrapping from Point Annotations via Integrated Pseudo-Label Refinement and Utilization [58.4] Point2RBox-v3は、ラベル割り当てに動的擬似ラベルを使用する最初のモデルである。
我々のソリューションは、特にオブジェクトサイズやスパースオブジェクトの発生に大きなバリエーションがあるシナリオにおいて、競争性能を提供します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:36:37 GMT)
AIM 2025 Challenge on Real-World RAW Image Denoising [58.1] AIM 2025 Real-World RAW Image Denoising Challengeは、データ合成を基礎とした効率的で効果的な denoising 技術を推進することを目的としている。
このコンペティションは、5つの異なるDSLRカメラを使って野生で撮影された低照度ノイズ画像に挑戦する、新たに確立された評価ベンチマークの上に構築されている。
合成データに基づいて訓練されたカメラ非依存の低照度RAW画像の境界を推し進めることで、コンペティションは堅牢で実用的なモデルの開発を促進する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:22:42 GMT)
All Claims Are Equal, but Some Claims Are More Equal Than Others: Importance-Sensitive Factuality Evaluation of LLM Generations [57.8] 大規模言語モデル(LLM)応答の事実性を評価する既存の手法は、全ての主張を同様に重要視している。
これにより、周辺情報と同一の重みを受けるため、バイタル情報が欠落したり、誤った場合の誤判定が生じる。
質問に対するクレームの関連性と重要性を組み込むことにより,応答の事実性を測定する上で,より高感度な指標であるVITALを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:40:33 GMT)
VA-Adapter: Adapting Ultrasound Foundation Model to Echocardiography Probe Guidance [57.4] 我々は、膨大なデータセットから基礎モデルで学習した医療知識をプローブガイダンスタスクに適用する。
我々は,基礎モデルのイメージエンコーダが視覚アクションシーケンスをエンコードできるように,パラメータ効率のよいビジュアル・アクション・アダプタ (VA-Adapter) を巧みに設計する。
VA-Adapterは、コンパクトな設計でシーケンシャル推論機能を組み込むことで、事前訓練された超音波基礎モデルにより、精密なプローブ調整戦略を学習することができる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:38:30 GMT)
Dyna-Think: Synergizing Reasoning, Acting, and World Model Simulation in AI Agents [57.4] 本稿では,AIエージェントの性能向上のための推論と行動を伴う内的世界モデルとプランニングを統合した思考フレームワークDyna-Thinkを提案する。
DITは、R1の思考プロセスを再構築し、提案された(計画された)行動に関連する世界モデルシミュレーションの実行に集中し、この再構成データを用いてポリシーを訓練する。
DDTは2段階のトレーニングプロセスを使用して、まず状態予測や批判生成といった目的を通じてエージェントの世界モデリング能力を改善し、次にポリシートレーニングを通じてエージェントのアクションを改善する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:49:53 GMT)
The Cognitive Bandwidth Bottleneck: Shifting Long-Horizon Agent from Planning with Actions to Planning with Schemas [56.6] 本稿では2つの異なる行動表現の有効性を体系的に研究する。
本稿では,その違いを質的に理解するための概念的枠組みとして,認知的帯域幅の観点を提案する。
より有能なPwSエージェントを構築するための実用的なガイドを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:47:40 GMT)
Enjoying Non-linearity in Multinomial Logistic Bandits [56.3] 我々は,学習者が期待される報酬を最大化するために行動を選択することで,学習者が環境と相互作用する,多項ロジスティック・バンディット問題を考える。
本稿では,ロジスティックモデルの非線形性の影響を多項集合に拡張し,効率的なアルゴリズムを提案する。
我々のメソッドは、次数 $ smashwidetildemathcalO(R d sqrtKT/kappa_*)$ の問題依存的後悔境界を生じる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:15:45 GMT)
Test-Time Graph Search for Goal-Conditioned Reinforcement Learning [56.1] オフライン目標条件強化学習(GCRL)は、テスト時にユーザが指定した目標に到達するポリシーを訓練する。
GCRLタスクを解決するための軽量な計画手法であるTTGS(Test-Time Graph Search)を導入する。
TTGSは任意の状態空間距離やコスト信号を受け入れ、データセット状態の上に重み付きグラフを構築し、凍結ポリシーが実行する一連のサブゴールを高速に検索する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:20:53 GMT)
PARL-MT: Learning to Call Functions in Multi-Turn Conversation with Progress Awareness [55.1] マルチターン関数呼び出しのためのLLMトレーニングに進捗認識を明示的に組み込むフレームワークであるPARL-MTを導入する。
PARL-MTは既存の手法よりも優れており、堅牢で効率的なマルチターン関数呼び出しの実現における進捗認識の有効性を強調している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:29:46 GMT)
AutoDAN-Reasoning: Enhancing Strategies Exploration based Jailbreak Attacks with Test-Time Scaling [54.5] AutoDAN-Turboは生涯学習エージェントを使用して、攻撃戦略の豊富なライブラリをゼロから構築する。
非常に効果的ではあるが、そのテスト時間生成プロセスは戦略をサンプリングし、対応する1つの攻撃プロンプトを生成する。
本稿では,テスト時間スケーリングによるAutoDAN-Turboの攻撃性能の向上を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:37:35 GMT)
Are We Using the Right Benchmark: An Evaluation Framework for Visual Token Compression Methods [54.5] 単純な画像ダウンサンプリングは、複数の広く使用されているベンチマークにおいて、多くの高度な圧縮方法より一貫して優れていることを示す。
これらの結果に触発され,既存のベンチマークを識別するデータフィルタリング機構を組み込んだ評価フレームワークであるVTC-Benchを導入する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:44:28 GMT)
EMPalm: Exfiltrating Palm Biometric Data via Electromagnetic Side-Channels [54.5] EMエミッションは、手のひら生体情報を漏れさせる。
EMPalmは、盗聴されたEM信号からパームプリントとパームベインの画像の両方を隠蔽的に回収する攻撃フレームワークである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:50:19 GMT)
Spectral Graph Clustering under Differential Privacy: Balancing Privacy, Accuracy, and Efficiency [54.0] エッジ差分プライバシー(DP)下におけるスペクトルグラフクラスタリングの問題点について検討する。
具体的には, (i) エッジフリップによるグラフ摂動と, エッジプライバシを強制する隣接行列シャッフルを併用したグラフ摂動, (ii) 次元と複雑性の複雑さを低減するために低次元空間における加法的ガウス雑音を伴うプライベートグラフプロジェクション, (iii) 収束性を維持しながらエッジDPを確保するために反復的にガウス雑音を分散するノイズの多いパワーイテレーション手法である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:30:27 GMT)
TIGeR: Tool-Integrated Geometric Reasoning in Vision-Language Models for Robotics [53.4] 本稿では、視覚言語モデル(VLM)を幾何学コンピュータに変換する新しいフレームワークであるTIGeR(Tool-Integrated Geometric Reasoning)を提案する。
TIGeRは、実世界のロボット操作タスクにおいて、センチメートルレベルの精度を示しながら、幾何学的推論ベンチマーク上でSOTA性能を達成することを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:20:23 GMT)
AudioMarathon: A Comprehensive Benchmark for Long-Context Audio Understanding and Efficiency in Audio LLMs [53.2] AudioMarathonは、ロングフォームオーディオの理解と推論の効率を評価するために設計されたベンチマークである。
我々は、最先端のLALMを評価し、音声の長さが大きくなるにつれて、明らかな性能低下を観察する。
その結果、現在のLALM間での大きなギャップが示され、時間的推論の改善の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:50:16 GMT)
MMPerspective: Do MLLMs Understand Perspective? A Comprehensive Benchmark for Perspective Perception, Reasoning, and Robustness [50.3] MMPerspectiveはマルチモーダルな大言語モデルの視点理解を評価するために設計された最初のベンチマークである。
このベンチマークでは,実世界の2,711の合成画像と5,083の問合せ対でキー機能を調べている。
43の最先端MLLMの総合評価により,重要な限界が明らかになった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:58:18 GMT)
FFT-based Dynamic Subspace Selection for Low-Rank Adaptive Optimization of Large Language Models [49.4] 低次元空間へのSVD/QRベースの勾配射影を近似する2段階の手順を提案する。
当社の戦略はランタイムの高速化とメモリ使用量の削減を,さまざまなモデルサイズで最大25%削減できることが示されています。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:33:25 GMT)
VT-FSL: Bridging Vision and Text with LLMs for Few-Shot Learning [49.3] 少数のラベル付きサポートサンプルから新しい概念を認識することを目的としている。
近年の研究では、追加の意味情報を組み込んだり、複雑な意味融合モジュールを設計することでサポート機能を強化している。
本稿では,Few-Shot Learningのための大規模言語モデルを用いた視覚とテキストをブリッジする新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:46:28 GMT)
FlowKV: Enhancing Multi-Turn Conversational Coherence in LLMs via Isolated Key-Value Cache Management [48.9] FlowKVはKVキャッシュ管理のための新しいマルチターン分離機構である。
蓄積された圧縮KVキャッシュを過去のターンから保存する。
古い文脈の再圧縮を防ぎ、破滅的な忘れを和らげる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:06:52 GMT)
MeXtract: Light-Weight Metadata Extraction from Scientific Papers [48.7] 本稿では,科学論文からのメタデータ抽出を目的とした軽量言語モデルであるMeXtractを紹介する。
MeXtractはMOLEベンチマークでメタデータ抽出の最先端性能を達成する。
研究コミュニティのために、すべてのコード、データセット、モデルを公開しています。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:12:28 GMT)
AMBER: Adaptive Mesh Generation by Iterative Mesh Resolution Prediction [48.7] 本稿では,メッシュ適応のための教師あり学習手法であるAMBER(Adaptive Meshing By Expert Reconstruction)を提案する。
AMBERは、サイズフィールドを反復的に予測し、この予測を使用して、アウト・オブ・ザ・ボックスメッシュジェネレータを使用して、新しい中間メッシュを生成する。
AMBERを2次元および3次元の幾何学、古典物理学問題を含むデータセット、機械部品、人間の専門家メッシュを用いた実世界の産業デザインで評価する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:48:28 GMT)
Relational Database Distillation: From Structured Tables to Condensed Graph Data [48.3] グラフベースモデルに必要な電力を維持しつつ,大規模RDBをコンパクトなヘテロジニアスグラフに蒸留することを目的としている。
さらに、擬似ラベルを用いてカーネルリッジ回帰誘導目標を設計し、蒸留グラフの品質特性を創出する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:05:31 GMT)
SafeProtein: Red-Teaming Framework and Benchmark for Protein Foundation Models [48.3] 本稿では,タンパク質基盤モデル用に設計された最初のレッドチームフレームワークであるSafeProteinを紹介する。
SafeProteinはマルチモーダルプロンプトエンジニアリングを組み合わせ、ビームサーチを生成して、レッドチーム方式を体系的に設計する。
また、手動で構築したレッドチームベンチマークデータセットと包括的な評価プロトコルを含むSafeProtein-Benchをキュレートした。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:47:56 GMT)
ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL [48.2] 本研究では,外部メモリを構造化したトランスアーキテクチャであるEMMURを提案する。
ELMURは、注意窓の向こうに10万倍の有効地平線を拡大する。
最大100万歩の廊下を持つ合成T-Mazeタスクで100%の成功率を達成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:50:34 GMT)
MoRe: Monocular Geometry Refinement via Graph Optimization for Cross-View Consistency [48.2] MoReは、クロスビューの整合性を改善し、スケールアライメントを実現するために設計された、トレーニング不要なモノクロ幾何リファインメント手法である。
我々は,MoReが3次元再構成を向上するだけでなく,特にスパース・ビュー・レンダリングのシナリオにおいて,新しいビュー合成を改善することを実証した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:11:32 GMT)
An Investigation of Robustness of LLMs in Mathematical Reasoning: Benchmarking with Mathematically-Equivalent Transformation of Advanced Mathematical Problems [48.1] 我々は,LLMの数学的推論的ロバスト性を評価するための体系的枠組みを導入する。
我々は、数学的に等価だが言語的およびパラメトリックなバリエーションを持つ高度な数学問題に対して、それらをストレステストする。
この新たな評価手法を用いて,新しいベンチマークデータセットであるPatnamGAPを開発した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:46:12 GMT)
Taxonomy, Opportunities, and Challenges of Representation Engineering for Large Language Models [47.4] RepEはモデルの内部表現を直接操作する。
より効果的で、解釈可能で、データ効率が良く、モデルの振る舞いを柔軟に制御できる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:19:34 GMT)
COMPASS: A Multi-Turn Benchmark for Tool-Mediated Planning & Preference Optimization [47.3] 本稿では,現実的な旅行計画シナリオにおけるエージェントの評価を行うベンチマークを提案する。
我々は、20の国立公園の交通、宿泊、チケット販売を網羅する現実的な旅行データベースを構築している。
i) エージェントが制約を確実に満たすが、選好を最適化できない、(ii) 計画調整のギャップ、(ii) マルチサービス(フライトとホテル)の調整タスクのパフォーマンスが崩壊する、という2つの重要なギャップを明らかにする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:09:46 GMT)
More Data or Better Data? A Critical Analysis of Data Selection and Synthesis for Mathematical Reasoning [47.1] 我々は,オープンソースのデータセットと数学的推論のためのデータ合成手法を包括的に分析する。
以上の結果から,より解釈可能な形式のデータ構築や,より強力なモデルからの抽出は,単にデータボリュームをスケールアップするよりも優れていることが示唆された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:07:26 GMT)
Parallel and Multi-Stage Knowledge Graph Retrieval for Behaviorally Aligned Financial Asset Recommendations [46.9] 本稿では,FLARKOの検索拡張であるRAG-FLARKOを紹介する。
マルチステージおよび並列KG検索プロセスによるスケーラビリティと妥当性の課題を克服する。
実世界の金融取引データセットに関する実証的な評価は、RAG-FLARKOが推奨品質を大幅に向上することを示している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:42:53 GMT)
Can LLM Agents Simulate Multi-Turn Human Behavior? Evidence from Real Online Customer Behavior Data [46.7] 本研究では,人間の行動を正確にシミュレートする,最先端のLDMの能力の大規模定量的評価を行った。
230,965件のユーザアクションを含む31,865件のオンラインショッピングセッションから得られた実世界データを用いて,プロンプトベースのLCMが人間の行動生成においてわずか11.86%の精度で達成できることを明らかにする。
また, 実クリックスルーデータに対して, モデルの性能を大幅に向上させる手法として, 実クリックスルーデータに対する微調整 LLM の戦略を提示する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:51:31 GMT)
Unpacking Discourses on Childbirth and Parenthood in Popular Social Media Platforms Across China, Japan, and South Korea [46.3] 我々は,中国,韓国,日本のDouyinとTiktokの668本の短いビデオについて,DouyinとTiktokの219,127のコメントを分析した。
また,全国における育児費,子どもの効用,特に日本と韓国,中国を中心に個人主義に焦点が当てられている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:14:38 GMT)
CyberGym: Evaluating AI Agents' Real-World Cybersecurity Capabilities at Scale [46.0] 我々は188のソフトウェアプロジェクトにわたる1,507の実際の脆弱性を特徴とする大規模ベンチマークであるCyberGymを紹介した。
我々はCyberGymが35のゼロデイ脆弱性と17の歴史的不完全なパッチを発見できることを示した。
これらの結果は、CyberGymは、サイバーセキュリティにおけるAIの進歩を測定するための堅牢なベンチマークであるだけでなく、直接的な現実世界のセキュリティ効果を生み出すためのプラットフォームでもあることを強調している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:32:58 GMT)
Evolutionary Profiles for Protein Fitness Prediction [45.9] EvoIFは、配列構造表現を進化的信号と融合させ、ログノードスコアリングのキャリブレーションされた確率を得る。
タンパク質Gym (217変異アッセイ; >2.5M変異株)について、EvoIFとそのMSA対応変異体は、トレーニング深度のわずか0.1%を使用しながら、最先端または競争的な性能を達成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:46:02 GMT)
TGM: a Modular and Efficient Library for Machine Learning on Temporal Graphs [45.8] 時間グラフ上での機械学習のための研究指向ライブラリであるテンポラルグラフモデリング(TGM)を紹介する。
TGMは動的ノード機能、時間粒度変換、リンク、ノード、グラフレベルのタスクのネイティブ処理をファーストクラスでサポートする。
TGMは、広く使用されているDyGLibと比較して、複数のモデル、データセット、タスクの平均7.8倍のスピードアップを実現している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:20:05 GMT)
$\textit{Agents Under Siege}$: Breaking Pragmatic Multi-Agent LLM Systems with Optimized Prompt Attacks [45.7] マルチエージェント大規模言語モデル(LLM)システムは,エージェント間の通信や分散推論に依存するため,新たな敵対的リスクを生み出す。
本研究では,トークンの帯域幅の制限,メッセージ配信のレイテンシ,防御機構といった制約のある実用的システムへの攻撃に革新的な焦点をあてる。
我々は、レイテンシと帯域幅制約のあるネットワークトポロジ間の迅速な分散を最適化し、分散安全機構をバイパスする、$textitpermutation-invariant adversarial attack$を設計する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:17:28 GMT)
Pixel-Perfect Depth with Semantics-Prompted Diffusion Transformers [45.7] Pixel-Perfect Depthはピクセル空間拡散生成に基づく単眼深度推定モデルである。
本モデルは,5つのベンチマークにおいて,すべての生成モデルの中で最高の性能を達成している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:59:33 GMT)
Benchmarking Gaslighting Negation Attacks Against Multimodal Large Language Models [45.6] MLLM(Multimodal Large Language Models)は、様々なモダリティの統合において顕著な進歩を見せている。
彼らの成功にもかかわらず、MLLMは会話の敵対的な入力に弱いままである。
我々は,最初に正しい回答を提供するモデルが,ユーザが提供する否定によってそのアウトプットを逆転するように説得される現象であるガスライティング否定攻撃について検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:59:43 GMT)
LongRM: Revealing and Unlocking the Context Boundary of Reward Modeling [45.5] 長コンテキストRM評価に特化して設計されたベンチマークであるLong-RewardBenchを紹介する。
予備研究により、最先端の生成型RMでさえ、長いコンテキストシナリオにおいて重大な脆弱性を示すことが明らかとなった。
本稿では、任意のモデルを堅牢なLong-context RMに効果的にスケールする一般的なマルチステージトレーニング戦略を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:48:16 GMT)
SubGrapher: Visual Fingerprinting of Chemical Structures [45.2] SubGrapherは化学構造画像の視覚的フィンガープリントの手法である。
機能基と炭素骨格を識別し、サブ構造に基づく指紋を構成する。
本手法は最先端のOCSRおよびフィンガープリント法に対して評価される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:18:46 GMT)
Hybrid Reinforcement: When Reward Is Sparse, It's Better to Be Dense [45.1] HEROは、検証者信号と報酬モデルスコアを構造化された方法で統合する強化学習フレームワークである。
HEROはRMのみのベースラインと検証者のみのベースラインを一貫して上回り、検証可能なタスクと検証しにくいタスクの両方で大きな利益を上げている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:09:41 GMT)
Spiral of Silence in Large Language Model Agents [45.0] スピラル・オブ・サイレンス(SoS)理論では、少数派の見解を持つ個人は社会的孤立を恐れて発言することをしばしば控えている。
SoSライクなダイナミクスは、大きな言語モデルで純粋に統計的な言語生成から生まれるのか?
本研究では,「歴史」と「ペルソナ」の信号の可利用性を体系的に変化させる4つの制御条件について考察する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:58:17 GMT)
scPPDM: A Diffusion Model for Single-Cell Drug-Response Prediction [45.0] 本稿では,ScRNA-seqデータから単一セルの薬物応答予測を行う最初の拡散型フレームワークであるScPPDMを紹介する。
scPPDMは、非結合性GD-Attnを介して一貫した潜伏空間に、摂動前状態と投与量のある薬物の2つの条件チャネルを結合する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:17:39 GMT)
AWM: Accurate Weight-Matrix Fingerprint for Large Language Models [44.9] 重み行列に基づくトレーニング不要な指紋認証手法を提案する。
線形アサインメント問題(LAP)と不偏中心カーネルアライメント(CKA)の類似性を利用してパラメータ操作の効果を中和する。
本手法は, 上記の6項目すべてに対して, 偽陽性のほぼゼロのリスクを示しながら, 例外的な堅牢性を示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:51:11 GMT)
Multi-hop Deep Joint Source-Channel Coding with Deep Hash Distillation for Semantically Aligned Image Retrieval [44.8] マルチホップ付加型白色ガウス雑音(AWGN)チャネル上でのディープジョイントソースチャネル符号化(DeepJSCC)による画像伝送について検討する。
我々は,DeepJSCCエンコーダ-デコーダペアと事前学習したディープハッシュ蒸留(DHD)モジュールを,セマンティッククラスタイメージにトレーニングする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:38:24 GMT)
Modeling Motivated Reasoning in Law: Evaluating Strategic Role Conditioning in LLM Summarization [44.6] 大規模言語モデル(LLM)は、ユーザに適した要約を生成するために、ますます使われています。
これは動機付け推論に関する重要な疑問を提起する。
我々は,LLMが異なる法的役割を条件づけたプロンプトにどのように反応するかを検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:58:35 GMT)
CAPO: Towards Enhancing LLM Reasoning through Generative Credit Assignment [44.3] RLVR(Reinforcement Learning with Verifiable Rewards)は、ルールベースのバイナリフィードバックを使用することで、LLM(Large Language Models)の推論能力を改善した。
現在のRLVRメソッドは、通常、すべてのトークンに同じ報酬を割り当てる。
この粗い粒度のフィードバックは、正確なクレジット割り当てを妨げ、モデルがどの推論ステップが成功または失敗につながるかを特定するのが難しくなる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:10:47 GMT)
RePIC: Reinforced Post-Training for Personalizing Multi-Modal Language Models [43.8] イメージキャプションをパーソナライズするための強化学習に基づくポストトレーニングフレームワークを提案する。
本手法は,MLLMの視覚認識能力とパーソナライズ機能の両方を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:03:48 GMT)
Deploying Tiny LVLM Judges for Real-World Evaluation of Chart Models: Lessons Learned and Best Practices [43.6] 7Bパラメータしか持たないLVLM(Large Vision-Language Models)は、チャート理解タスクにおける自動判断として有望であることを示している。
しかし、小さなモデル(=2Bパラメータ)はいまだに判断として不十分であり、リソース制限された設定での実際の使用を制限する。
i) 評価基準を1つのクエリにまとめるマルチ基準プロンプトと(ii) ドメイン適応トランスファーラーニングの2つのアプローチを提案し、チャートデータセットの合成判断に2B-パラメータLVLMを微調整してChartJudgeを作成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:02:19 GMT)
Polyp-Gen: Realistic and Diverse Polyp Image Generation for Endoscopic Dataset Expansion [43.3] 本稿では,最初のフルオートマチック拡散に基づく内視鏡画像生成フレームワークであるPolyp-Genを紹介する。
具体的には、ポリープ境界領域の構造的文脈を高めるために、病変誘導損失を伴う空間認識拡散訓練手法を考案する。
ポリープ領域の局所化に先立つ医学的先行を捉えるために,階層的検索に基づくサンプリング戦略を導入する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:53:54 GMT)
PredGen: Accelerated Inference of Large Language Models through Input-Time Speculation for Real-Time Speech Interaction [43.2] 大規模言語モデル(LLM)は、音声応答を生成するためのテキスト音声合成(TTS)システムと組み合わせたリアルタイム音声チャットアプリケーションで広く使われている。
その大きなサイズは、しばしばユーザ入力の終端からオーディオ出力の開始までの顕著なレイテンシをもたらす。
予測生成(PredGen)は,入力時の投機的復号化による遅延を軽減あるいは解消する新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:16:39 GMT)
Quantum Information meets High-Energy Physics: Input to the update of the European Strategy for Particle Physics [43.2] 量子力学の最も驚くべき特徴、例えば絡み合いやベル非局所性は、専用の低エネルギー実験装置で広く研究されているだけである。
粒子衝突による高エネルギー体制におけるこれらの研究の可能性は、最近しか示されておらず、科学界の注目を集めている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:35:26 GMT)
Epistemic Diversity and Knowledge Collapse in Large Language Models [42.8] 大規模言語モデル(LLM)は、語彙的、意味的、スタイリスティックに同質なテキストを生成する傾向がある。
これは知識崩壊のリスクを生じさせ、同種LLMは時間とともにアクセス可能な情報範囲の縮小を仲介する。
LLM出力における実世界のクレームの変動など、疫学の多様性を測定するための新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:35:57 GMT)
Red-Bandit: Test-Time Adaptation for LLM Red-Teaming via Bandit-Guided LoRA Experts [42.5] Red-Banditは、異なる攻撃スタイルの下でモデル障害モードを特定し、活用するためにオンラインに適応するフレームワークである。
レッドバンディットは十分な探索の下でAdvBenchの最先端の結果を達成する。
Red-Banditのバンディットポリシーは、モデル固有の脆弱性を明らかにするための診断ツールとして機能する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:06:20 GMT)
RGS-DR: Deferred Reflections and Residual Shading in 2D Gaussian Splatting [42.3] 我々は、仕様の細部を改善するための改良段階を論じ、再構築のみの手法でギャップを埋める。
我々のパイプラインは、指向性残留パスを用いて、編集可能な材料特性と環境照明を推定する。
最短軸法線と正常残差を持つガウス色ごとのシェーディングとは対照的に、スペクトル残差を持つ画素遅延型サーベイル定式化により、シャープなハイライト、よりクリーンな材料、編集性が改善された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:55:05 GMT)
What Media Frames Reveal About Stance: A Dataset and Study about Memes in Climate Change Discourse [42.3] 我々は、気候変動に関するインターネットのミームとの相互作用を概念化し、計算的に探求するために、学際的アプローチを適用した。
CLIMATEMEMES(CLIMATEMEMES)は、気候変化のミームにスタンスとメディアフレームの両方を付加した最初のデータセットである。
本稿では,姿勢検出とメディアフレーム検出の2つの課題を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:37:46 GMT)
Local energy assignment for two interacting quantum thermal reservoirs [42.0] 2つの共通定義は、熱環境に結合した量子系の熱力学を記述するために用いられる。
局所的、概念的に対称なオープンシステムアプローチに基づく第3の定義セットと比較する。
特に、2つの部分系が弱結合である場合でも、3つの定義の集合が大きく異なることが観察される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:12:21 GMT)
Overview of the Plagiarism Detection Task at PAN 2025 [41.9] 我々は、Llama、DeepSeek-R1、Mistralの3つの大きな言語モデルを用いて、自動生成されたプラジャリズムの新たな大規模データセットを作成しました。
本稿では,本データセットの作成について概説し,すべての参加者と4つのベースラインの結果の要約と比較を行った。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:33:26 GMT)
Crossing Domains without Labels: Distant Supervision for Term Extraction [41.9] 現在の最先端の手法は、高価な人間のアノテーションを必要とし、ドメイン転送に苦労する。
7つのドメインにまたがるベンチマークを導入し、文書レベルとコーパスレベルの両方のパフォーマンス評価を可能にした。
提案手法は,従来の5/7ドメインのアプローチよりも平均10ポイント向上した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:02:40 GMT)
LaunchpadGPT: Language Model as Music Visualization Designer on Launchpad [41.8] そこで我々はLaunchpad上で音楽の可視化設計を自動生成するLaunchpadGPTモデルを提案する。
生成能力に優れた言語モデルに基づいて,提案したLaunchpadGPTは音声を入力として,ビデオ形式でLaunchpad-playingの照明効果を出力する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:24:43 GMT)
Video-in-the-Loop: Span-Grounded Long Video QA with Interleaved Reasoning [41.8] ViTLは2段階の長ビデオQAフレームワークで、問題関連区間を初期化して固定トークン予算を保存する
ViTLは最大8.6%まで到達し、長時間のQAと時間的グラウンドでは50%少ないフレーム入力を実現している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:05:20 GMT)
LLMVA-GEBC: Large Language Model with Video Adapter for Generic Event Boundary Captioning [41.7] 本稿では,LLMVA-GEBC(ジェネリックイベント境界キャプション用ビデオアダプタ付き大規模言語モデル)を提案する。
提案手法は,テストセットの76.14点を達成し,第1位を獲得した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:26:33 GMT)
Redundant Semantic Environment Filling via Misleading-Learning for Fair Deepfake Detection [41.5] ディープフェイク技術は、デジタルコミュニケーションにおける信頼の保護と個人保護に不可欠である。
現在の検出器はしばしば二重オーバーフィッティングに悩まされ、特定の指紋と特定の人口統計特性の両方に過度に特化している。
本稿では,無作為な環境に潜伏空間を投入するミスリーディング学習という新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:27:12 GMT)
Sustainable Self-evolution Adversarial Training [41.4] 本稿では,持続可能な自己進化学習(SSEAT)フレームワークを提案する。
本研究は,様々な種類の対角的事例から学習を実現するために,連続的な対向防衛パイプラインを導入する。
また,より多様で重要な再学習データを選択するために,逆データ再生モジュールを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:52:23 GMT)
Injecting External Knowledge into the Reasoning Process Enhances Retrieval-Augmented Generation [41.3] Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を知識集約タスクの外部知識で拡張するために広く採用されている。
RAGの有効性は、しばしばノイズ(低品質)の回復経路の存在によって損なわれる。
本稿では,RAGの雑音に対する認識・抵抗能力を高めるため,パッセージインジェクションを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:21:01 GMT)
UniEDU: A Unified Language and Vision Assistant for Education Applications [41.1] UniEDUは、様々な教育応用のために設計された統一言語および視覚アシスタントである。
それは、強力な一般化能力を維持しながら、複数の教育タスクにまたがる。
UniEDUは、計算オーバーヘッドを大幅に削減することで、産業規模のデプロイメントに最適化されている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:31:50 GMT)
Real-Time Progress Prediction in Reasoning Language Models [41.1] 本研究では,リアルタイムの進捗予測が実現可能かどうかを考察する。
我々は進捗を識別し、推論状態の分類のために線形プローブを訓練する。
次に、2段階の微調整手法を導入し、推論モデルにより進捗予測を生成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:11:48 GMT)
Decomposed Global Optimization for Robust Point Matching with Low-Dimensional Branching [41.1] 部分重なり合う点集合を整列する新しい大域的最適化手法を提案する。
本手法は非剛性変形, 位置雑音, 外れ値に優れた強靭性を示す。
2次元および3次元合成および実世界のデータを用いた実験により,本手法は最先端の手法と比較して,外れ値に対して優れた強靭性を示すことが示された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:41:18 GMT)
MAPRO: Recasting Multi-Agent Prompt Optimization as Maximum a Posteriori Inference [40.9] MAPRO (Multi-Agent PRompt Optimization) は、まずMASの最適化を、MAP(Maximum a Posteriori)推論問題として定式化するフレームワークである。
クレジットの割り当てに対処し、システムを反復的に更新するために、MAPROはトポロジ対応のリファインメント機構を採用している。
MAPROは様々なタスクのベンチマークで最先端のパフォーマンスを達成し、手作業によるベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:21:24 GMT)
Automated Neural Architecture Design for Industrial Defect Detection [40.7] 産業表面欠陥検出(SDD)は製品の品質と製造信頼性を確保するために重要である。
我々は、畳み込み、トランスフォーマー、多層パーセプトロンを共同で検索する、SDDのための自動ニューラルネットワーク設計フレームワークであるAutoNADを提案する。
AutoNADの有効性は、3つの産業的欠陥データセットで検証され、欠陥イメージングと検出プラットフォームでさらに適用される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:37:59 GMT)
Three Forms of Stochastic Injection for Improved Distribution-to-Distribution Generative Modeling [40.6] フローマッチングは任意のデータ分散間の変換をモデル化するための自然なフレームワークを提供する。
本稿では,ソースサンプルとフロー補間剤を摂動させることにより,学習過程に摂動を注入する,シンプルで効率的な手法を提案する。
提案手法は,入力と生成されたサンプル間の輸送コストを低減し,変換の真の効果をより強調する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:36:34 GMT)
The False Promise of Zero-Shot Super-Resolution in Machine-Learned Operators [40.4] このモデリング目標を達成する手段として,機械学習演算子 (MLOs) が導入された。
我々は、このアーキテクチャの革新が「ゼロショット超解像」を行うのに十分かどうかを評価する。
本稿では,エイリアス処理を克服する,単純で計算効率が高く,データ駆動型マルチレゾリューショントレーニングプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:59:56 GMT)
Haystack Engineering: Context Engineering for Heterogeneous and Agentic Long-Context Evaluation [40.4] LLM(Long-context Large Language Model)は、"needle-in-a-haystack"ベンチマークでよく機能する。
しかし、このようなテストは、バイアス付き検索とエージェントによる注意散逸から、いかにノイズの多いコンテキストが生じるかを見落としている。
私たちは、英語のWikipediaハイパーリンクネットワーク上に構築された新しいNIAHベンチマークであるHaystackCraftを通じて、これをインスタンス化する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:12:10 GMT)
Multi-modal Segment Assemblage Network for Ad Video Editing with Importance-Coherence Reward [40.4] 動画編集は、広告ビデオを短いビデオに自動的に編集し、一貫性のあるコンテンツと広告主が伝える重要な情報を保持することを目的としています。
既存の手法はビデオセグメンテーションの段階では良好に機能するが、セグメンテーションの段階では余分な煩雑なモデルに依存し、性能が劣る。
本稿では,効率よく一貫性のあるセグメントアセンブラタスクをエンド・ツー・エンドで実現可能なM-SANを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:27:55 GMT)
Color Bind: Exploring Color Perception in Text-to-Image Models [40.1] 複数色を含むプロンプトに対する多目的セマンティックアライメントの問題を緩和する専用画像編集手法を提案する。
本手法は,様々なテキスト・画像拡散技術を用いて生成した画像から,幅広いメトリクスに対して性能を著しく向上させる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:20:56 GMT)
MolGA: Molecular Graph Adaptation with Pre-trained 2D Graph Encoder [39.8] MolGAは、様々な分子領域の知識を柔軟に組み込んで、事前訓練された2Dグラフエンコーダを下流の分子応用に適用する。
まず,事前学習したトポロジ表現とドメイン知識表現とのギャップを埋める分子アライメント戦略を提案する。
第2に、分子ドメイン知識のきめ細かい統合を可能にするために、インスタンス固有のトークンを生成する条件適応機構を導入する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:46:22 GMT)
HARP-NeXt: High-Speed and Accurate Range-Point Fusion Network for 3D LiDAR Semantic Segmentation [39.6] LiDARセマンティックセグメンテーションは、自動運転車や移動ロボットにとって不可欠である。
従来の最先端の手法は、精度とスピードのトレードオフに直面していることが多い。
本稿では,高速かつ高精度なLiDARセマンティックセグメンテーションネットワークであるHARP-NeXtを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:46:07 GMT)
Language Lives in Sparse Dimensions: Toward Interpretable and Efficient Multilingual Control for Large Language Models [39.6] 大規模言語モデルは、英語以外のデータに限られているにもかかわらず、強い多言語機能を示す。
英語中心の大規模言語モデルは、中間層における多言語コンテンツを英語対応の表現にマッピングし、最終層内のターゲット言語トークン空間に投影する。
並列データと単言語データのいずれにおいても,50文以内しか必要とせず,これらの次元を識別・操作する簡単な学習自由手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:46:57 GMT)
Uncertainty-Aware Diffusion Guided Refinement of 3D Scenes [39.4] 1枚の画像から3Dシーンを再構築することは、問題の本質が過小評価されているため、基本的に不適切な作業である。
本研究では,既存の画像から3D画像へのフィードフォワードネットワークにおいて,これらの制約に対処する。
入力画像の視界を超えた情報不足による性能低下を軽減するため、事前学習された潜伏映像拡散モデルを用いて、強い生成前を活用できる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:14:46 GMT)
Reasoning by Exploration: A Unified Approach to Retrieval and Generation over Graphs [39.4] 構造化グラフに対する推論は、大規模言語モデルにとって依然として根本的な課題である。
グラフ探索のプロセスとしてグラフ上の推論をフレーミングすることによって検索と生成を統一する新しい手法であるReasoning by Exploration (RoE)を提案する。
RoEは、ベースラインよりも大幅に全体的な改善を実現し、また、目に見えないグラフに効果的に一般化する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:29:19 GMT)
Roboflow100-VL: A Multi-Domain Object Detection Benchmark for Vision-Language Models [39.2] 本稿では,100個のマルチモーダルオブジェクト検出データセットの大規模コレクションであるRoboflow100-VLを紹介する。
我々は、ゼロショット、少数ショット、半教師付き、完全教師付き設定で、我々のベンチマークの最先端モデルを評価する。
CVPR 2025 Foundational FSOD コンペティションについて論じ,コミュニティからの洞察を共有した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:51:05 GMT)
Valid Inference with Imperfect Synthetic Data [39.1] モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を大幅に改善できることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:56:19 GMT)
LLMs Encode Harmfulness and Refusal Separately [39.0] LLMは有害な指示を拒否するように訓練されていますが、単に拒否する以上の有害性を理解しているのでしょうか?
我々は,LLMの安全性メカニズム,すなわち有害性を分析するための新しい次元を同定し,拒絶とは別の概念として内部的にコード化する。
特定のジェイルブレイク法は、モデルの内部の有害性に対する信念を逆転させることなく、拒絶信号を減らすことで機能する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:37:01 GMT)
MATRIX: Mask Track Alignment for Interaction-aware Video Generation [38.9] ビデオDiTの2つの視点:意味的接地と意味的伝播を定式化する。
そこで我々は, 単純かつ効果的な正規化である MATRIX を導入する。
また,対話型ビデオ生成のための評価プロトコルであるInterGenEvalを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:57:38 GMT)
Contrastive Graph Condensation: Advancing Data Versatility through Self-Supervised Learning [38.7] グラフ凝縮は、大規模原グラフのコンパクトで代替的なグラフを合成するための有望な解である。
本稿では、自己教師型代理タスクを取り入れたCTGC(Contrastive Graph Condensation)を導入し、元のグラフから批判的、因果的な情報を抽出する。
CTGCは、様々な下流タスクを限られたラベルで処理し、一貫して最先端のGCメソッドより優れている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:49:19 GMT)
Scalable In-context Ranking with Generative Models [38.4] In-context Ranking (ICR)は情報検索(IR)の新たなパラダイムである
観測された文書間ブロック間隔をアーキテクチャ的に拡張することで,LLMの注意操作に適応する新しい方法であるBlockRankを紹介する。
BEIR、MSMarco、NQをMistral-7Bで実験したところ、BlockRank Mistralは既存のSOTAリストワイドローダにマッチするか、上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:02:37 GMT)
TTRV: Test-Time Reinforcement Learning for Vision Language Models [38.4] 強化学習における報酬信号を抽出する既存の方法は、ラベル付きデータと専用のトレーニング分割に依存するのが一般的である。
提案するTTRVは,ラベル付きデータを必要とせずに,推論時にモデルに適応することで視覚言語理解を向上させる。
このアプローチは、オブジェクト認識と視覚的質問応答(VQA)の両方で一貫して向上し、それぞれ52.4%と29.8%の改善、および16データセットで平均24.6%と10.0%のアップを実現している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:10:31 GMT)
WristWorld: Generating Wrist-Views via 4D World Models for Robotic Manipulation [38.0] We propose WristWorld, the first 4D world model that generated wrist-view video only from anchor view。
i) VGGTを拡張し、空間整合性(SPC)を組み込んだリコンストラクション。
Droid、Calvin、Franka Pandaの実験は、空間整合性に優れた最先端のビデオ生成を実証している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:59:08 GMT)
How Grounded is Wikipedia? A Study on Structured Evidential Support and Retrieval [37.7] この研究は、ウィキペディアの接地状況と、どんなにきめ細かな接地証拠を検索できるかを分析します。
ウィキペディアのリードセクションにおける主張の22%が記事本体によって支持されていないことを示している。
複雑な証拠の検索は、最近の推論のリランカーでさえ、依然として課題であることも示しています。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:04:01 GMT)
Learning Global Representation from Queries for Vectorized HD Map Construction [37.4] 我々は、textbfMapGR (textbfGlobal textbfRepresentation Learning for HD textbfMap construction)を提案する。
Global Representation Learning (GRL)モジュールは、グローバルマップとの整合性を高めるために、すべてのクエリの分散を促進する。
Global Representation Guidance(GRG)モジュールは、各クエリに対して、その最適化を容易にするために、明示的なグローバルレベルのコンテキスト情報を提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:56:08 GMT)
Utilizing Large Language Models for Machine Learning Explainability [37.3] 本研究では,機械学習(ML)ソリューションを自律的に生成する際の,大規模言語モデル(LLM)の説明可能性について検討する。
最先端の3つのLCMは、ランダムフォレスト、XGBoost、マルチレイヤーパーセプトロン、ロング短期記憶ネットワークの4つの共通分類器のためのトレーニングパイプラインを設計するよう促される。
生成したモデルは、SHAP(SHapley Additive exPlanations)を用いた予測性能(リコール、精度、F1スコア)と説明可能性の観点から評価される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:46:23 GMT)
MORPH: Shape-agnostic PDE Foundation Models [37.3] MORPHは偏微分方程式(PDE)の形状に依存しない自己回帰基底モデルである
様々なデータ次元(1D--3D)の不均一な評価をシームレスに処理する畳み込み視覚バックボーン上に構築されている。
広範なデータセット全体にわたって、MORPHは強力なベースラインと最近の最先端モデルにマッチするか、超えている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:06:50 GMT)
Distributional Machine Unlearning via Selective Data Removal [37.2] ドメインの統計的影響は、しばしばデータサンプルの小さなサブセットに集中している。
所望のディストリビューションを保存しながら、不要なディストリビューションを忘れるバランスをとる小さなサブセットを選択するためのフレームワークである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:38:34 GMT)
LAD-RAG: Layout-aware Dynamic RAG for Visually-Rich Document Understanding [37.1] レイアウト対応動的RAGフレームワークであるLAD-RAGを提案する。
LAD-RAGは、レイアウト構造とページ間の依存関係をキャプチャするシンボリック文書グラフを構築する。
MMLongBench-Doc、LongDocURL、DUDE、MP-DocVQAの実験は、LAD-RAGが検索を改善し、トップkチューニングなしで平均90%以上の完全リコールを達成することを示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:02:04 GMT)
BACHI: Boundary-Aware Symbolic Chord Recognition Through Masked Iterative Decoding on Pop and Classical Music [37.1] POP909-CLは、テンポに整合したコンテンツと、コード、ビート、キー、タイムシグネチャの訂正されたラベルを持つPOP909データセットの強化版である。
本研究では,タスクを異なる決定ステップ,すなわちコード根,品質,ベース(反転)の境界検出と反復的なランク付けに分解する記号的コード認識モデルであるBACHIを提案する。
実験により,BACHIは古典的およびポップ音楽のベンチマークにおいて,最先端のコード認識性能を達成することが示された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:02:56 GMT)
VRPAgent: LLM-Driven Discovery of Heuristic Operators for Vehicle Routing Problems [37.0] 大規模言語モデル(LLM)ベースのコード生成は、最近多くのドメインで約束されているが、それでも人間の専門家に匹敵する直感を生み出すには至っていない。
本稿では, LLM生成部品をメタヒューリスティックに組み込んだVRPAgentを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:35:09 GMT)
Connection between memory performance and optical absorption in quantum reservoir computing [36.9] 物質的不完全性や環境との結合による消散は、コンピュータを貯蓄するための暗い記憶を提供する自然なメカニズムとして機能する。
我々は,光吸収の物理量と量子貯水池コンピュータの性能の関連性を,短期記憶能力の観点から明らかにした。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:04:54 GMT)
Gold-Switch: Training-Free Superposition of Slow- and Fast- Thinking LLMs [36.8] 大規模推論モデル(LRM)は、意図的な人間の推論をエミュレートすることで、構造化されたタスクに優れるが、しばしば過度な考えに悩まされる。
本稿では,1つのモデルのオン/オフによるスイッチング推論を最適化するために,軽量でトレーニング不要な規制を施したデプロイ戦略を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:17:57 GMT)
WebAgent-R1: Training Web Agents via End-to-End Multi-Turn Reinforcement Learning [36.5] WebAgent-R1は、Webエージェントをトレーニングするためのエンドツーエンドのマルチターン強化学習フレームワークである。
WebArena-Liteベンチマークの実験は、WebAgent-R1の有効性を示し、Qwen-2.5-3Bのタスク成功率を6.1%から33.9%に向上させた。
In-depth Analysis revealed the effect of the thinking-based prompting strategy and test-time scaling through increase interaction for web task。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:16:43 GMT)
PATCH: Mitigating PII Leakage in Language Models with Privacy-Aware Targeted Circuit PatcHing [36.3] 言語モデル(LM)は、訓練データから個人識別可能な情報(PII)を記憶し、推論中に相手がそれを抽出することができる。
差分プライバシー(DP)のような既存の防御機構は、この漏洩を減少させるが、実用性に大きな低下をもたらす。
我々は提案する。
Privacy-Aware Targeted Circuit PatcHingは、最初にPII回路を識別し、次に直接編集してリークを減らす新しいアプローチだ。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:58:41 GMT)
Empowering LLMs with Pseudo-Untrimmed Videos for Audio-Visual Temporal Understanding [36.2] PU-VALORは114,000本以上の擬似アンリム化ビデオと詳細な時間的アノテーションを含む包括的オーディオ視覚データセットである。
PU-VALORは、イベントベースのビデオクラスタリングを含む微妙な方法で、大規模だが粗い注釈付きオーディオ視覚データセットVALORから派生した。
AVicunaは、音声・視覚イベントを時間間隔と対応するテキストトークンに整列できるモデルである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:18:11 GMT)
Sharpness-Aware Data Generation for Zero-shot Quantization [36.1] ゼロショット量子化は、元の実際のトレーニングデータにアクセスすることなく、事前訓練された完全精度モデルから量子化モデルを学習することを目的としている。
本稿では,一般化を促進するために,合成データ生成における量化モデルシャープネスを考慮した新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:43:39 GMT)
Vision-Language-Action Models for Robotics: A Review Towards Real-World Applications [36.1] VLA(Vision-Language-Action)モデルは、さまざまなタスク、オブジェクト、エボディメント、環境にまたがる一般的なポリシーを学ぶことを目的としている。
この作業は、VLAシステムのソフトウェアコンポーネントとハードウェアコンポーネントを統合する、包括的なフルスタックレビューを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:38:25 GMT)
Guardians of Image Quality: Benchmarking Defenses Against Adversarial Attacks on Image Quality Metrics [36.0] 本稿では、IQAに対する敵攻撃の増加に対応する防衛機構の総合的なベンチマーク研究について述べる。
本研究は, 敵の浄化, 敵の訓練, 確証された堅牢性手法を含む25の防衛戦略を評価する。
我々は、IQAのスコアと画質を保存すべきであるとして、ディフェンスとIQAタスクへの適用性の違いを分析した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:53:22 GMT)
Vibe Checker: Aligning Code Evaluation with Human Preference [35.9] 提案するVeriCodeは,30の検証可能なコード命令とそれに対応する決定論的検証器の分類法である。
最強モデルでさえ、複数の命令に従わず、明確な機能回帰を示すのに苦労していることを示す。
我々の研究は、バイブチェックの中核的な要素を特定し、モデルをベンチマークし、開発するための具体的なパスを提供します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:59:19 GMT)
Reinforcement Learning-based Task Offloading in the Internet of Wearable Things [35.9] ウェアラブルモノのインターネット(IoWT)における強化学習(RL)に基づくタスクオフロードのためのフレームワークを提案する。
エネルギー消費とタスク達成時間のトレードオフを考慮したタスクオフロードプロセスの定式化を行う。
我々はQ-ラーニング技術を用いて、ウェアラブルデバイスが事前の知識を使わずに最適なタスクオフロード決定を行えるようにする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:36:35 GMT)
Layer codes as partially self-correcting quantum memories [35.8] 本稿では,局所雑音と対向雑音の保証が可能な層符号に対する2つの復号アルゴリズムを提案する。
本研究では,従来の解析モデルよりも優れた自己補正量子メモリを構成する層符号について述べる。
また, 記憶時間に関する数値的研究を行い, 部分的自己補正と一致した振る舞いを報告する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:17:44 GMT)
MLLM4TS: Leveraging Vision and Multimodal Language Models for General Time-Series Analysis [35.2] MLLM4TSは,マルチモーダルな大規模言語モデルを利用して時系列解析を行う新しいフレームワークである。
各時系列チャンネルは、1つの合成画像において水平に重ねられたカラー符号化された線プロットとして描画される。
時間対応の視覚パッチアライメント戦略では、視覚パッチを対応する時間セグメントにアライメントする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:22:39 GMT)
AsyncSpade: Efficient Test-Time Scaling with Asynchronous Sparse Decoding [35.1] テストタイムスケーリング(TTS)は長いチェーン・オブ・シント(CoT)を介してLCM推論を促進する
KV-cache成長は、LLMデコーディングのメモリバウンドボトルネックを増幅する。
2つのコアコンポーネント上に構築された効率的なTSのための非同期フレームワークであるAsyncSpadeを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:36:11 GMT)
Blind Construction of Angular Power Maps in Massive MIMO Networks [34.9] 従来の無線地図構築には、位置ラベル付きCSIデータが必要である。
隠れマルコフモデル(HMM)は、モバイルの隠れ軌跡と、巨大な多重入力多重出力(MIMO)チャネルのCSI進化を接続するために構築される。
ポアソン分散基地局(BSs)による一様直線移動下では,局所化誤差に対するクラマー・ラオ下界(CRLB)が消滅しうることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:32:53 GMT)
Geometry of Semantics in Next-Token Prediction: How Optimization Implicitly Organizes Linguistic Representations [34.9] Next-token Prediction (NTP) 最適化により、言語モデルがテキストから意味構造を抽出し、整理する。
我々は、より大きな特異値に対応する概念が訓練中に学習され、自然な意味階層が生成されることを示した。
この洞察は、解釈可能なセマンティックカテゴリを識別するための概念記号を組み合わせる方法である、オーサントベースのクラスタリングを動機付けている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:08:10 GMT)
Adaptive LLM-Symbolic Reasoning via Dynamic Logical Solver Composition [34.8] 適応的,多パラダイム,ニューロシンボリック推論フレームワークを導入する。
自然言語で表現された問題から、形式的推論戦略を自動的に識別する。
また、動的に選択し、特別な形式論理解法を適用する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:57:16 GMT)
MV-Performer: Taming Video Diffusion Model for Faithful and Synchronized Multi-view Performer Synthesis [34.8] モノクロフルボディキャプチャーから新しいビュービデオを作成するための革新的なフレームワークであるMV-Performerを提案する。
360度合成を実現するために、MVHumanNetデータセットを広範囲に活用し、情報伝達条件信号を取り込む。
生成したビデオの同期を維持するために,多視点の人間中心ビデオ拡散モデルを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:24:22 GMT)
OWL: Overcoming Window Length-Dependence in Speculative Decoding for Long-Context Inputs [34.7] 投機的復号化は、大きな言語モデルに対するより高速な推論を約束する。
既存のメソッドは実世界の設定に一般化できない。
我々は新しい長文ベンチマーク(LongSpecBench)をリリースし、新しいモデル(OWL)を導入する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:50:46 GMT)
LiTEx: A Linguistic Taxonomy of Explanations for Understanding Within-Label Variation in Natural Language Inference [34.6] 自由文の説明を英語で分類するための言語情報を用いた分類法であるLITEXを紹介する。
この分類を用いて、e-SNLIデータセットのサブセットに注釈を付け、分類の信頼性を評価し、NLIラベル、ハイライト、説明とどのように一致しているかを分析する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:35:11 GMT)
TIME: A Multi-level Benchmark for Temporal Reasoning of LLMs in Real-World Scenarios [34.6] 実世界のシナリオにおける時間的推論のためのベンチマークTIMEを提案する。
TIMEは38,522のQAペアで構成され、11のきめ細かいサブタスクを持つ3レベルをカバーする。
推論モデルと非推論モデルについて広範な実験を行う。
TIME-Liteは人手による注釈付きサブセットで、将来の研究を奨励し、時間的推論における標準化された評価を行う。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:45:45 GMT)
MeanSparse: Post-Training Robustness Enhancement Through Mean-Centered Feature Sparsification [34.5] MeanSparseは、敵の例に対する畳み込みと注意に基づくニューラルネットワークの堅牢性を改善する方法である。
実験の結果,MeanSparseは75.28%の新しいロバストネス記録を達成した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:47:15 GMT)
Opt-ICL at LeWiDi-2025: Maximizing In-Context Signal from Rater Examples via Meta-Learning [34.5] 本稿では,人間の変動をモデル化するシステムについて概説する。
言語モデル(LLM)のコンテキスト学習能力と2段階のメタ学習訓練手法を用いる。
我々は,Learning With Disagreements (LeWiDi) コンペティションにおいて,両タスクの総合的な勝者であるシステムの性能を評価した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:59:24 GMT)
Can Speech LLMs Think while Listening? [34.2] CoT(Chain-of- Thought)はテキストベース音声モデルの推論能力を大幅に向上させることが示されている。
そこで本研究では,テキスト空間における推論により,音声のLLMの精度が平均2.4倍向上することを示す。
ユーザクエリが終了する前に,モデルが推論を開始できるようにすることで,推論から追加のレイテンシを低減する手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:50:58 GMT)
A Deep Learning System for Rapid and Accurate Warning of Acute Aortic Syndrome on Non-contrast CT in China [34.1] 大動脈CT血管造影(ATA)は,AASを疑う患者に選択される画像プロトコルである。
中国における経済とワークフローの制約により、疑いのある患者の大多数が最初の画像検査として非コントラストCTを施行した。
AAS識別に非コントラストCTを用いた人工知能による警告システムiAortaを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:24:10 GMT)
Robot Learning from Any Images [33.9] このフレームワークは、任意のWildイメージを対話型で物理対応のロボット環境に変換するものだ。
従来の方法とは異なり、RoLAは追加のハードウェアやデジタルアセットを必要とせずに、単一のイメージ上で直接動作する。
我々は、スケーラブルなロボットデータ生成と拡張、インターネットイメージからのロボット学習、マニピュレータとヒューマノイドのためのシングルイメージのリアルタイムシステムなど、RoLAの汎用性を実証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:05:48 GMT)
Reading Between the Lines: Towards Reliable Black-box LLM Fingerprinting via Zeroth-order Gradient Estimation [33.8] ブラックボックス法は、しばしば顕著なLarge Language Modelsの指紋を生成するのに失敗する。
ゼロオーダー推定を用いたブラックボックス設定における情報豊富な勾配を近似する新しい手法であるZeroPrintを提案する。
標準ベンチマークの実験では、ZeroPrintは最先端の有効性とロバスト性を達成し、既存のブラックボックスメソッドを著しく上回っている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:27:38 GMT)
Diode effect in the Fraunhofer pattern of disordered planar Josephson junctions [33.8] 平面ジョセフソン接合部のフラウンホーファーパターンについて,種々の障害や不完全性の存在下で検討した。
ゼロ場におけるミラー対称性である接合はダイオード効果を許さないこと, ダイオード効果はフラウンホーファーパターンの結節点において典型的に拡大される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:55:26 GMT)
BIRD-INTERACT: Re-imagining Text-to-SQL Evaluation for Large Language Models via Lens of Dynamic Interactions [33.6] 大規模言語モデル(LLM)は、単一ターンのテキスト・ツー・タスクにおいて顕著な性能を示してきたが、現実のデータベースアプリケーションは、主にマルチターンインタラクションを必要とする。
既存のマルチターンベンチマークは、会話履歴を静的なコンテキストとして扱うか、読み取り専用操作に対する評価を制限することで不足する。
BIRD-INTERACTは,(1)知識ベース,メタデータファイル,機能駆動型ユーザシミュレータとデータベースを結合した総合的なインタラクション環境であり,モデルの解明,知識の検索,エラーからの回復を人間の監督なしに行うことができる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:39:59 GMT)
Where to Begin: Efficient Pretraining via Subnetwork Selection and Distillation [33.1] 小言語モデル(SLM)は、Large Language Models(LLM)に代わる効率的でアクセスしやすい選択肢を提供する。
本稿では,SLMの事前学習のためのシンプルで効果的なフレームワークを提案する。
すべてのコードとモデルをリリースし、大規模にコスト効率の良い小言語モデル開発への実践的で再現可能なパスを提供します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:57:46 GMT)
Emilia: A Large-Scale, Extensive, Multilingual, and Diverse Dataset for Speech Generation [32.3] Emilia-Pipeはオープンソースの前処理パイプラインで、Wildのソースから高品質なトレーニングデータを抽出する。
Emiliaは6つの言語にまたがって101k時間以上の音声で構成されている。
実験によると、エミリアで訓練されたモデルは、従来のオーディオブックのデータセットで訓練されたモデルよりも、はるかに自然に人間のような音声を生成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:46:48 GMT)
DESIGNER: Design-Logic-Guided Multidisciplinary Data Synthesis for LLM Reasoning [31.7] 本稿では,「設計論理」の概念を導入し,人間教育者の質問作成過程を模倣するようにLCMに指示する。
LLMを使って、さまざまな分野にわたる既存の質問から12万以上の設計ロジックをリバースエンジニアリングし、抽象化します。
これらの設計ロジックをソースドキュメントとマッチングすることで、既存のデータセットの難しさや多様性をはるかに超える推論的な質問を作成できるのです。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:57:43 GMT)
Next Semantic Scale Prediction via Hierarchical Diffusion Language Models [31.6] HDLMは階層的な語彙の上に構築されており、細かな意味を持つ低レベルのトークンは、粗い粒度の意味を持つ高レベルのトークンに全射的にマッピングされる。
前処理では、各トークンは、スケジューラに従ってより抽象的なセマンティクスを持つ上位の祖先に独立に摂動される。
逆のプロセスでは、モデルは次のより詳細なセマンティクスを徐々に予測します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:41:12 GMT)
Exposing LLM User Privacy via Traffic Fingerprint Analysis: A Study of Privacy Risks in LLM Agent Interactions [31.4] 大きな言語モデル(LLM)は、タスクを編成し、外部ツールを統合するエージェントとして、ますます多くデプロイされている。
これらの対話行動は、ユーザとLLMエージェント間の暗号化されたトラフィックに特徴的な指紋を残していることを示す。
エージェントやツールの呼び出しに関連するトラフィックパターンを分析することで、敵はエージェントアクティビティを推論できる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:16:23 GMT)
Into the Rabbit Hull: From Task-Relevant Concepts in DINO to Minkowski Geometry [31.3] DINOv2は、オブジェクト、シーン、アクションを認識するために定期的にデプロイされるが、何を認識するのかは分かっていない。
作業ベースラインとして,線形表現仮説(LRH)を採用し,SAEを用いて運用する。
我々は32,000単位の辞書を作成し、この辞書は我々の研究の解釈可能性のバックボーンとして機能する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:42:20 GMT)
Flipping the Dialogue: Training and Evaluating User Language Models [31.1] 汎用ユーザ言語モデル(ユーザLM)を紹介する。
ユーザLMは、マルチターン会話で人間のユーザをシミュレートする、ポストトレーニング後のモデルである。
ユーザLMが人間の行動とどのように一致しているかを示し、既存のシミュレーション手法よりも優れたシミュレーションロバスト性を実現する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:04:36 GMT)
Learning to Reason for Hallucination Span Detection [31.1] 複数回サンプリングすると,少なくとも1つの正解が得られた。
そこで我々はRL4HSを提案する。RL4HSは多段階報酬関数による推論を動機づける強化学習フレームワークである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:06:15 GMT)
TrackVLA++: Unleashing Reasoning and Memory Capabilities in VLA Models for Embodied Visual Tracking [31.0] 本稿では,空間的推論機構と時間的同定メモリ(TIM)という2つの重要なモジュールによる視覚追跡を具体化する新しいモデルであるTrackVLA++を提案する。
TrackVLA++は、エゴセントリックな設定とマルチカメラ設定の両方で、公開ベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:29:17 GMT)
Guiding Mixture-of-Experts with Temporal Multimodal Interactions [30.7] 本稿では,時間的相互作用を定量化してMoEルーティングをガイドする新しいフレームワークを提案する。
マルチモーダルなインタラクション対応ルータは、インタラクションの性質に基づいて、トークンを専門家にディスパッチする方法を学ぶ。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:21:03 GMT)
CaRDiff: Video Salient Object Ranking Chain of Thought Reasoning for Saliency Prediction with Diffusion [30.7] ビデオのサリエンシ予測は、ビデオのボトムアップ機能や、記憶や認知などのトップダウンプロセスによって、人間の注意を引き、視線を惹きつけるビデオ内の領域を特定することを目的としている。
既存の手法は主に知覚情報のモデリングに重点を置いているが、言語による推論プロセスは無視されている。
本稿では,マルチモーダル大言語モデル(MLLM),グラウンドモジュール,拡散モデルを統合することで,そのプロセスを模倣するフレームワークであるCaRDiffを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:14:59 GMT)
Transparent and Coherent Procedural Mistake Detection [30.5] 手続き的誤り検出(英: Procedural mis detection、PMD)は、人間がタスクをうまく実行したかどうかを分類する難しい問題である(手続き的テキストで特定)。
我々は、意思決定に視覚的自己対話的合理性を生成するためにPMDを拡張した。
近年のヴィジュアル・アンド・ランゲージモデル(VLM)で観察される印象的かつ成熟した画像理解能力を考えると、個々のフレームに基づいてPMDに適したベンチマークデータセットをキュレートする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:15:22 GMT)
StyleKeeper: Prevent Content Leakage using Negative Visual Query Guidance [29.9] 我々は、望ましくないコンテンツの転送を減らすために、負の視覚的クエリガイダンス(NVQG)を提案する。
NVQGは、視覚的なスタイルのプロンプトから自己注意層のキーと値の代わりにクエリをスワップする意図的なコンテンツリークシナリオによって負のスコアを採用する。
提案手法は,既存のアプローチよりも優位性を示し,参照のスタイルを反映し,得られた画像がテキストプロンプトにマッチすることを保証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:50:34 GMT)
Comparing human and language models sentence processing difficulties on complex structures [29.7] 人間の言語モデルと大規模言語モデル(LLM)の文理解を7つの言語構造で比較する。
以上の結果から,LLMはターゲット構造,特に庭道(GP)文に苦しむことが明らかとなった。
目標文とベースライン文のパフォーマンスを比較すると、人間で観察される性能ギャップはLLMに比例する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:42:49 GMT)
Retentive Relevance: Capturing Long-Term User Value in Recommendation Systems [29.6] 本稿では,新しいコンテンツレベル調査に基づくフィードバック尺度であるRetentive Relevanceを紹介する。
Retentive Relevanceは、ユーザーが同様のコンテンツのためにプラットフォームに戻る意図を直接評価する。
これらの結果から,Retentive Relevanceは,エンゲージメント信号および他の調査指標よりも,翌日のリテンションの予測に優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:38:57 GMT)
Tool-Augmented Policy Optimization: Synergizing Reasoning and Adaptive Tool Use with Reinforcement Learning [29.3] 大規模言語モデル(LLM)の最近の進歩はテスト時間スケーリングを普及させ、モデルが最終回答を生成する前にさらなる推論トークンを生成する。
これらの手法は、数学的推論を含むベンチマークにおいて顕著な性能向上を示した。
本稿では,マルチホップ推論と適応型ツールコール機能を統合した新しい強化学習フレームワークであるツール拡張ポリシー最適化(TAPO)を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:04:27 GMT)
Efficient numeracy in language models through single-token number embeddings [29.2] 我々は,フロンティア言語モデル (LLM) が基本計算さえも解くのに大量の推論トークンを必要とすることを示した。
我々は、IEEE 754バイナリ浮動小数点表現を用いて、任意の数値を単一のトークンに埋め込む新しいトークン化戦略BitTokensを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:48:11 GMT)
Base Models Know How to Reason, Thinking Models Learn When [29.1] 一貫性のあるパフォーマンス向上にもかかわらず、思考モデルがどのようにして全く新しい推論能力を学ぶのかは不明だ。
本稿では,ベースモデルにおける推論機構を適切なタイミングで活性化し,思考モデルレベルの推論連鎖を導出するハイブリッドモデルを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:58:28 GMT)
Agent-in-the-Loop: A Data Flywheel for Continuous Improvement in LLM-based Customer Support [29.1] LLMベースのカスタマーサポートシステムを反復的に改善するための連続データフライホイールを実装したAgent-in-theLoopフレームワークを提案する。
バッチアノテーションに依存する通常のオフラインアプローチとは異なり、AITLは4つの重要なアノテーションを実際の顧客操作に直接統合する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:57:04 GMT)
Meaningful Pose-Based Sign Language Evaluation [29.0] この研究は、キーポイント距離ベース、埋め込みベース、バックトランスレーションベースのメトリクスをカバーしている。
我々は、手話検索の自動メタ評価と、異なる手話間のテキスト間翻訳の人間相関研究を通じて、異なるシナリオにおける異なるメトリクス間のトレードオフを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:00:24 GMT)
ExPO-HM: Learning to Explain-then-Detect for Hateful Meme Detection [29.0] 有害なミームは、オンライン虐待の特に困難な形態として現れ、自動検知システムの開発を動機付けている。
従来のアプローチのほとんどは直接検出に依存しており、バイナリ予測のみを生成する。
ExPO-HMは、SFTウォームアップとGRPOをカリキュラム学習と組み合わせ、条件決定エントロピー(CDE)を、推論品質の指標と報酬の両方として組み合わせている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:12:06 GMT)
Look before Transcription: End-to-End SlideASR with Visually-Anchored Policy Optimization [29.0] モデル推論過程を制御するために,ビジュアルアンコールポリシー最適化(VAPO)を提案する。
VAPO は think>answer> フォーマットを使用して構造化された "Look before Transcription" プロシージャを強制する。
この推論プロセスは、フォーマットコンプライアンス、OCR精度、ASR品質、視覚的アンカー一貫性を目標とした4つの異なる報酬を含む強化学習によって最適化される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:18:47 GMT)
Adaptive Frontier Exploration on Graphs with Applications to Network-Based Disease Testing [29.0] 我々は,各ノードが未知のラベルを持つような$n$-node graph $mathcalG$上で,逐次決定問題を研究する。
我々は、一般的なグラフに適用可能なGittinsインデックスベースのポリシーを設計し、$mathcalG$がフォレストである場合に確実に最適である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:28:14 GMT)
MSITrack: A Challenging Benchmark for Multispectral Single Object Tracking [28.8] MSITrackは、これまでで最大かつ最も多様なマルチスペクトル単一オブジェクト追跡データセットである。
55のカテゴリーと300の異なる自然のシーンがある。
MSITrackは、RGBのみのベースラインよりもパフォーマンスが大幅に向上する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:56:36 GMT)
LASER: An LLM-based ASR Scoring and Evaluation Rubric [28.8] 本稿では,LLMのテキスト内学習能力を活用したLLMに基づくスコアリング・レーザーを提案する。
Gemini 2.5 Proを用いたヒンディー語ルーリックスコアは、人間のアノテーションと94%という非常に高い相関スコアを得た。
Llama 3は、参照およびASR予測から導かれるワードペア例に基づいて微調整され、どの種類のペナルティを89%近い精度で適用すべきかを予測することができる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:37:06 GMT)
Thinking with Nothinking Calibration: A New In-Context Learning Paradigm in Reasoning Large Language Models [28.8] RLLM(Reasoning large language model)は、最近、構造化および多段階推論によって顕著な機能を示した。
我々は新しいICLパラダイムであるThinking with Nothinking (JointThinking)を提案する。
JointThinkingは、数発のチェーン・オブ・シークレット(CoT)を2回、過半数で上回っている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:38:41 GMT)
From Injection to Defense: Constructing Edit-Based Fingerprints for Large Language Models [28.4] 本稿では,ルールベースの多言語自然言語指紋(MNLF)を組み込んだ知識編集フレームワークRFEditを提案する。
RFEditはFingerprint Subspace-aware Fine-Tuning (FSFT)によって保護されている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:23:32 GMT)
The Sound of Syntax: Finetuning and Comprehensive Evaluation of Language Models for Speech Pathology [28.3] 340万人以上の子供が、臨床介入を必要とする言語障害を経験している。
言語病理医(SLP)の数は、患児の約20倍である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:02:00 GMT)
BLISS: A Lightweight Bilevel Influence Scoring Method for Data Selection in Language Model Pretraining [28.3] BLISSは、外部の事前訓練されたオラクルモデルに頼ることなく、スクラッチから完全に高速に動作する軽量なデータ選択方法である。
C4データセットの選択したサブセット上で、410M/1B/2.8B PythiaとLLaMA-0.5Bモデルを事前学習することでBLISSを検証する。
BLISSは最先端の手法と同じ性能に達すると1.7倍のスピードアップを達成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:49:49 GMT)
TinyScientist: An Interactive, Extensible, and Controllable Framework for Building Research Agents [28.1] TinyScientistは、自動研究ワークフローの本質的なコンポーネントを特定し、新しいツールに容易に適応し、反復的な成長をサポートするインタラクティブで制御可能なフレームワークを提案する。
オープンソースでインタラクティブなWebデモとPyPI Pythonパッケージを提供し、最先端の自動検索パイプラインを研究者や開発者全員に広くアクセスできるようにする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:18:57 GMT)
Hint of Pseudo Code (HoPC): Zero-Shot Step by Step Pseudo Code Reasoning Prompting [28.1] 本稿では,新しいHint of Pseudo Code(HoPC)プロンプト技術を紹介する。
HoPCはゼロショットCoTよりも強力なゼロショット問題分解とセマンティックコード推論機能を備えている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:44:17 GMT)
Accelerating Diffusion LLM Inference via Local Determinism Propagation [27.8] LocalLeapは、トレーニング不要の適応並列デコード戦略である。
6.94$times$スループットの改善を実現し、デコード手順を元の要件の14.2%に短縮する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:39:34 GMT)
Customer-R1: Personalized Simulation of Human Behaviors via RL-based LLM Agent in Online Shopping [27.6] オンラインショッピング環境におけるユーザ行動のパーソナライズとステップワイズを行うためのRLベースの手法であるCustomer-R1を紹介する。
我々の方針は明示的なペルソナに基づいており、行動正当性報酬信号による次のステップの合理化と行動生成を最適化する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:00:25 GMT)
A Comparative Analysis of Contextual Representation Flow in State-Space and Transformer Architectures [27.5] 状態空間モデル(SSM)は、長いシーケンス処理のためにTransformer-Based Models(TBM)の効率的な代替品として登場した。
本稿では,SSM と TBM における表現伝搬の統一・トークン・層レベルでの初めての解析について述べる。
TBMはトークン表現を急速に均質化し、多様性は後層のみに再燃し、SSMはトークンの特異性を早期に保存するが、より深い均質化に収束する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:46:11 GMT)
FURINA: A Fully Customizable Role-Playing Benchmark via Scalable Multi-Agent Collaboration Pipeline [27.4] FURINA-Builderは、任意のスケールで完全にカスタマイズ可能なRPベンチマークを自動的に構築する、新しいマルチエージェントコラボレーションパイプラインである。
RP領域の最初のベンチマークビルダーとして、さまざまなシナリオやプロンプトフォーマットで任意の文字を評価できる。
このパイプラインを使用して、確立されたテスト文字と合成されたテスト文字の両方を特徴とする、新しい包括的なロールプレイングベンチマークであるFURINA-Benchを構築します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:30:36 GMT)
VGGT-X: When VGGT Meets Dense Novel View Synthesis [27.4] 我々は3次元基礎モデル(3DFM)を高密度新規ビュー合成(NVS)に適用する問題について検討する。
我々の研究は、3DFMを高密度に拡大することは、VRAM負荷を劇的に増加させ、3Dトレーニングを低下させる不完全な出力の2つの基本的な障壁に直面することを明らかにした。
本稿では,1000以上の画像にスケール可能なメモリ効率のよいVGGT実装,VGGT出力向上のための適応的グローバルアライメント,堅牢な3DGSトレーニングプラクティスを取り入れたVGGT-Xを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:29:47 GMT)
LMCache: An Efficient KV Cache Layer for Enterprise-Scale LLM Inference [27.2] LMCacheは、オープンソースのKVキャッシュソリューションとして、これまでで最も効率的です。
現代のLLMエンジンによって生成されたKVキャッシュを抽出し、格納し、エンジンとクエリ間でKVキャッシュを共有する。
LMCacheとvLLMを組み合わせることで,ワークロードのスループットが最大15倍向上することを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:15:04 GMT)
Evolving and Executing Research Plans via Double-Loop Multi-Agent Collaboration [27.2] 本稿では, 与えられた研究課題を自動的に解決する新しいDouble-Loop Multi-Agent (DLMA) フレームワークを提案する。
リーダーループは教授エージェントで構成され、研究計画の進化に責任がある。
博士課程の学生エージェントで構成される従者ループは、最も進化した計画を実行する責任がある。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:40:58 GMT)
MIST: Towards Multi-dimensional Implicit BiaS Evaluation of LLMs via Theory of Mind [27.2] 大規模言語モデル(LLM)における心の理論 (ToM) とは、精神状態の推論能力を指す。
本稿では,Streotype Content Model (SCM) を応用して,能力,社会性,モラルの多次元的障害としてバイアスを再認識する評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:24:05 GMT)
HSNet: Heterogeneous Subgraph Network for Single Image Super-resolution [27.2] Heterogeneous Subgraph Network (HSNet) は、計算可能性を維持しながらグラフモデリングを効率的に活用する新しいフレームワークである。
HSNetは最先端の性能を達成し、再構築品質と計算効率を効果的にバランスさせる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:32:52 GMT)
OBJVanish: Physically Realizable Text-to-3D Adv. Generation of LiDAR-Invisible Objects [27.2] 我々は,LiDAR検出器に真に見えない物体の3次元モデルを生成するために,テキスト・ツー・3次元対向生成法を提案する。
CARLAシミュレーションと物理的環境の両方において、6つの最先端(SOTA)LiDAR検出器を回避できる3D歩行者を生成することができることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:35:35 GMT)
Coupled Data and Measurement Space Dynamics for Enhanced Diffusion Posterior Sampling [27.1] ノイズや不完全な測定から未知の信号を回復することが目的の逆問題であり、医療画像、リモートセンシング、計算生物学の中心である。
本稿では,空間拡散後サンプリング(C-DPS)と呼ばれる新しいフレームワークを提案する。
C-DPSは、複数の逆問題ベンチマークにおいて、定性的かつ定量的に、既存のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:59:16 GMT)
The Effect of Attention Head Count on Transformer Approximation [26.9] 変圧器の近似特性について検討し,特に注目点数の役割に着目した。
具体的には、十分な数の頭を持つ変圧器は効率的な近似を許容するが、多くの頭を持つ場合、パラメータの数は少なくとも$O(1/epsiloncT)$で、一定の$c$とシーケンス長$T$でスケールしなければならない。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:27:25 GMT)
On the Convergence of Moral Self-Correction in Large Language Models [26.7] 大きな言語モデル(LLM)は、そのように指示されたときの応答を改善することができる。
LLMは、内在的な自己補正と呼ばれるプロセスである応答品質を改善するために、内部知識に頼らなければならない。
我々は,多ラウンド相互作用による性能収束という,本質的な自己補正のキーとなる特徴を明らかにする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:46:27 GMT)
Revisiting Mixout: An Overlooked Path to Robust Finetuning [26.4] Mixoutは、間欠的に微調整された重量を事前訓練された基準で置き換える正規化器である。
GMixoutは、固定アンカーをトレーニング中に適応する指数的な移動平均スナップショットに置き換える。
GMixoutはゼロショット性能以上のドメイン内精度を一貫して改善する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:07:50 GMT)
High-Rate Mixout: Revisiting Mixout for Robust Domain Generalization [26.4] Dropoutはランダムニューロンの不活性化を通じてアンサンブルをシミュレートすることで、軽量な代替手段を提供する。
ニューロンを不活性化させるのではなく、Mixoutはトレーニング済みのニューロンと微調整した体重のサブセットを交換することで過剰な適合を緩和する。
提案手法であるHigh-rate Mixoutは,アンサンブル法に匹敵する領域外精度を実現し,トレーニングコストを大幅に削減する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:37:56 GMT)
Rethinking Inter-LoRA Orthogonality in Adapter Merging: Insights from Orthogonal Monte Carlo Dropout [26.3] Low-Rank Adaptation (LoRA)は、大型モデルの一般的な微調整手法であり、通常、モジュールを訓練してオブジェクトやスタイルのような特定の概念を表現する。
余分な時間的複雑さを伴わずにスパース意味ベクトルを組み合わせる際に厳密な直交を強制する機構であるオルソゴンモンテカルロ・ドロップアウトを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:05:16 GMT)
AgentAsk: Multi-Agent Systems Need to Ask [26.1] 大規模言語モデル(LLM)上に構築されたマルチエージェントシステムは、協調的な分業による問題解決能力の向上を約束する。
我々はAgentAskを提案する。AgentAskは軽量でプラグ・アンド・プレイの明確化モジュールで、すべてのエージェント間メッセージを潜在的な障害点として扱い、エラーの伝播を抑えるのに必要最小限の質問を挿入する。
AgentAskは、公開マルチエージェント実装の精度と堅牢性を継続的に改善し、オーバーヘッドを最小限に抑え、レイテンシと余分なコストを5%以下に抑える。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:36:05 GMT)
Graph Conditioned Diffusion for Controllable Histopathology Image Generation [26.1] グラフ合成拡散のためのグラフベースオブジェクトレベル表現を提案する。
提案手法は,画像の各主要構造に対応するグラフノードを生成し,個々の特徴と関係をカプセル化する。
我々は,本手法を実世界の病理組織学のユースケースを用いて評価し,下流セグメンテーションタスクにおける注釈付き患者データに確実に代用できることを実証した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:26:08 GMT)
Adaptive Rank, Reduced Forgetting: Knowledge Retention in Continual Learning Vision-Language Models with Dynamic Rank-Selective LoRA [26.1] 低ランク学習を研究し,LoRAのランクや配置が学習や忘れにどのように影響するかを分析した。
上位のLoRAはタスク学習(塑性)を改善するが、下位のLoRAは安定性を高めるが適応を制限する。
そこで我々は,適応的に最適化されたLoRAアダプタを用いてPTMを継続的に更新する連続動的ランク選択LoRA(CoDyRA)を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:30:38 GMT)
FedSRD: Sparsify-Reconstruct-Decompose for Communication-Efficient Federated Large Language Models Fine-Tuning [25.9] フェデレートラーニング(FL)は、分散Web上の次世代AIのための実践的なソリューションとして現れます。
Low-Rank Adaptation (LoRA)は、効率的な微調整のための標準であり、フェデレートされた設定での応用は重要な課題である。
本稿では,通信効率のよいフェデレーションLLMの微調整を目的としたSparsify-Reconstruct-DecomposeフレームワークであるFedSRDを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:26:35 GMT)
Get RICH or Die Scaling: Profitably Trading Inference Compute for Robustness [25.9] 我々は,OODデータをその内分布(ID)コンポーネントで理解可能な構成一般化により,OOD入力に対する防御仕様の遵守が可能であることを論じる。
我々は、この仮説を視覚言語モデルと攻撃型で実証的に支持し、OODデータに従う仕様がアンロックされた場合、テスト時間計算による堅牢性の向上を見出す。
この推論計算の頑健性とベースモデルの頑健性との相関は、RICHのリッチ・ゲット・リッチ・ダイナミクスである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:18:53 GMT)
CLAQS: Compact Learnable All-Quantum Token Mixer with Shared-ansatz for Text Classification [25.9] テキスト分類のためのコンパクトで完全量子トークンミキサーであるCLAQSを提案する。
振幅スケーリングを規制するためにl1正規化を適用し、2段階のパラメタライズド量子アーキテクチャを導入する。
CLAQSはスライディングウインドウの下で動作しており、8つのデータキュービットと浅い回路しか必要としないが、SST-2では91.64%、IMDBでは87.08%の精度を達成している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:20:08 GMT)
Inefficiencies of Meta Agents for Agent Design [25.5] メタエージェントの共通クラスにおける3つの課題について検討する。
まず、メタエージェントがイテレーション間でどのように学習するかを検討する。
第二に、メタエージェントはトレーニング中に複数のエージェントを設計するが、通常、テスト時に単一のエージェントをコミットする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:06:17 GMT)
A Rotation-Invariant Embedded Platform for (Neural) Cellular Automata [25.3] 本稿では、モジュール型ロボットシステムにおいて、(神経)セルオートマトン(NCA)をシミュレートするための回転不変な組込みプラットフォームを提案する。
物理的なNAAに関するこれまでの研究に触発されて,従来のハードウェア設計の限界を克服する重要なイノベーションを紹介した。
私たちのプラットフォームは対称でモジュラーな構造で、向きに関係なく細胞間のシームレスな接続を可能にします。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:39:14 GMT)
Platonic Transformers: A Solid Choice For Equivariance [25.3] このトレードオフを解決するために、Platonic Transformerを導入します。
プラトンソリッド対称性群から参照フレームに対する注意を定義することにより、本手法は原則的重み共有スキームを導出する。
この注意は、動的群畳み込みと正式に等価であることを示し、モデルが適応的幾何フィルタを学習していることを明らかにする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:09:15 GMT)
Measuring and Mitigating Identity Bias in Multi-Agent Debate via Anonymization [24.9] マルチエージェント討論(MAD)は、複数のエージェントが回答を交換し、意見を集約することで、大規模言語モデル(LLM)推論を改善することを目的としている。
しかし最近の研究では、エージェントは中立的ではないことが明らかになっている。
我々は、MADにおけるアイデンティティバイアスを緩和し定量化するために、梅毒と自己バイアスを結合する最初の原則的枠組みを提示する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:29:46 GMT)
Fine-Grained Emotion Recognition via In-Context Learning [24.8] きめ細かい感情認識は、推論と意思決定プロセスを通じて、クエリの感情タイプを特定することを目的としている。
最近の手法では、インコンテキスト学習(ICL)が使われ、意味論的に類似した例を通してクエリの表現が強化されている。
本稿では,プロトタイプ理論による微粒な感情認識における意思決定について検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:17:09 GMT)
MMReview: A Multidisciplinary and Multimodal Benchmark for LLM-Based Peer Review Automation [24.8] 大きな言語モデル(LLM)は、レビューコメントの生成を支援するために、ますます採用されている。
現在のLLMベースのレビュータスクは、包括的な、正確で、人間に沿ったアセスメントを生成するモデルの能力を厳格に評価するための統一された評価ベンチマークを欠いている。
我々は、複数の分野とモダリティにまたがる包括的なベンチマークである textbfMMReview を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:20:32 GMT)
Prompt Optimization Across Multiple Agents for Representing Diverse Human Populations [24.5] 本研究では,特定の個体群の多様性を総合的に把握するエージェント群を構築するための枠組みを提案する。
それぞれのエージェントは、人間のデモの小さなセットを条件付けすることで行動が制御されるLSMである。
提案手法は,ヒトの集団をベースラインよりも効果的に表現するエージェントを構築できることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:28:53 GMT)
GlotEval: A Test Suite for Massively Multilingual Evaluation of Large Language Models [24.5] GlotEvalは、多言語評価のために設計された軽量フレームワークである。
数十から数百の言語にまたがる7つの重要なタスク(機械翻訳、テキスト分類、要約、オープンエンドジェネレーション、読書理解、シーケンスラベリング、本質的な評価)をサポートする。
多様な言語的文脈におけるモデルの強みと弱みの正確な診断を可能にする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:05:33 GMT)
Learning to Partially Defer for Sequences [24.4] 本稿では,モデル全体のテキスト固有の出力を専門家に推論できるシーケンス出力のL2D設定を提案する。
また、旅行セールスマンソルバやニュース要約、天気予報などにおいて、こうした粒度のデリルが全デリルよりも高いコスト精度のトレードオフを実現することを実証的に実証した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:28:29 GMT)
Continuum Transformers Perform In-Context Learning by Operator Gradient Descent [24.4] 連続体変換器は、演算子RKHSで勾配降下を実行することで、コンテキスト内演算子学習を行うことができることを示す。
本研究では、この最適性結果の実証検証を行い、この勾配降下を行うパラメータが連続変圧器訓練によって回復されることを実証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:42:34 GMT)
Adaptive Layer-skipping in Pre-trained LLMs [24.3] FlexiDepthはテキスト生成で使用されるTransformerレイヤの数を動的に調整するメソッドである。
完全なベンチマーク性能を維持しながら、32層中8層をスキップする。
計算の節約にもかかわらず、FlexiDepthはまだウォールクロックのスピードアップを達成していない。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:32:22 GMT)
Domain Generalization by Rejecting Extreme Augmentations [24.3] ドメイン外およびドメインの一般化設定では、データ拡張が顕著で堅牢なパフォーマンス向上をもたらすことを示す。
i)標準データ拡張変換の均一サンプリング,(ii)ドメイン外での作業において期待される高いデータ分散を考慮した強度変換,(iii)トレーニングを損なうような極端な変換を拒否する新たな報酬関数を考案する,という簡単なトレーニング手順を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:39:46 GMT)
Auto-Prompt Ensemble for LLM Judge [24.3] 既存のLLM審査員は、人間の評価の基礎となる暗黙の基準を認識できないため、重要な評価基準を見逃すことがしばしばある。
本稿では,自動プロンプト・アンサンブル(APE)を提案する。
APEは信頼に基づくアンサンブル機構を導入し、新たな評価次元から判断をいつ採用するかを決定する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:28:51 GMT)
Enhancing Generative Auto-bidding with Offline Reward Evaluation and Policy Search [24.0] 自動入札は、広告主がパフォーマンスを改善するための重要なツールである。
近年の進歩により、AIGB(AI-Generated Bidding)は、通常のオフライン強化学習(RL)ベースの自動入札法と比較して優れた性能を発揮することが示されている。
生成計画とポリシー最適化を統合した新しい手法であるAIGB-Pearlを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:06:32 GMT)
On Task Vectors and Gradients [24.0] タスクベクトルとタスク損失の勾配との接続を確立することにより、タスク演算の厳密な理論的基礎を提供する。
標準勾配勾配下では,1つの微調整のエポックから生成されたタスクベクトルは,学習速度によってスケールされた損失の負の勾配と正確に等価であることを示す。
7つの視覚ベンチマークによる経験的分析は、我々の理論を裏付け、最初のエポック勾配がノルムと方向の両方において微調整軌道を支配していることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:00:50 GMT)
Beneficial Reasoning Behaviors in Agentic Search and Effective Post-training to Obtain Them [24.0] エージェント探索における効果的な推論行動パターンを研究するための推論駆動パイプラインを提案する。
我々は,情報検証,権限評価,適応探索,エラー回復の4つの有益な推論行動を特定する。
Llama3.2-3B と Qwen3-1.7B では, RL を用いたエージェントサーチモデルを直接訓練した場合と比較して, 行動プライミングが 35% 以上の利得を示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:20:35 GMT)
The Unreasonable Effectiveness of Randomized Representations in Online Continual Graph Learning [23.7] オンライン連続グラフ学習(OCGL)の主な障害の1つは、破滅的な忘れ方である
我々は、固定されたランダムなエンコーダを用いて、近隣情報を集約することで、堅牢で表現力豊かなノード埋め込みを生成する。
エンコーダを凍結することにより,表現パラメータのドリフトを排除し,表現的かつ安定な埋め込みを得る。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:44:14 GMT)
Towards a Multimodal Large Language Model with Pixel-Level Insight for Biomedicine [23.7] MedPLIBという名前のバイオメディカルドメインのための新しいエンド・ツー・エンド・マルチモーダル・大規模言語モデルを導入する。
視覚的質問応答(VQA)、任意のピクセルレベルのプロンプト(ポイント、バウンディングボックス、自由形式の形状)、ピクセルレベルの接地をサポートする。
その結果,MedPLIBは複数の医学的視覚言語タスクにおいて最先端の結果を得たことが示唆された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:47:39 GMT)
OneVision: An End-to-End Generative Framework for Multi-view E-commerce Vision Search [23.7] OneVisionは、視覚検索のためのエンドツーエンドの生成フレームワークである。
OneVisionは、視覚対応の残留量子化符号化であるVRQ上に構築されている。
オフライン評価では、OneVisionはオンラインMCAと同等に動作し、推論効率を21%向上させる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:02:25 GMT)
EigenScore: OOD Detection using Covariance in Diffusion Models [23.6] アウト・オブ・ディストリビューション(OOD)検出は、安全に敏感なドメインにおける機械学習システムの安全なデプロイに不可欠である。
拡散モデルにより誘導される後部共分散の固有値スペクトルを利用する新しいOOD検出法であるEigenScoreを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:42:20 GMT)
SMARTER: A Data-efficient Framework to Improve Toxicity Detection with Explanation via Self-augmenting Large Language Models [23.6] 大型言語モデル(LLM)を用いた説明可能なコンテンツモデレーションのためのフレームワークSMARTERを紹介する。
ステージ1では、LLMの出力を利用して、正しいラベルと間違ったラベルの両方の合成説明を生成する。
ステージ2では、クロスモデルトレーニングを通じて説明品質を洗練し、より弱いモデルがより強いモデルとスタイリスティックにセマンティックに整合することを可能にする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:00:50 GMT)
Taming Diffusion Models for Image Restoration: A Review [23.6] 拡散モデルは、フォトリアリスティック画像復元のための低レベルコンピュータビジョンに適用されている。
本稿では,拡散モデルにおける鍵となる構成を導入し,拡散モデルを用いた一般的な赤外線課題の解法について検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:32:38 GMT)
The Percept-V Challenge: Can Multimodal LLMs Crack Simple Perception Problems? [23.2] 6000個のプログラム生成された未汚染画像を含むデータセットであるPercept-Vを30の領域に分割した。
そのため、ドメインを極めてシンプルにし、それを解決するのに必要な推論と知識を最小限にします。
我々の考えに反して、我々の実験は、Percept-Vの非常に高い人的性能と比較して、SoTAのプロプライエタリかつオープンソースMLLMの弱い性能を示している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:49:55 GMT)
Extreme Amodal Face Detection [23.2] 本稿では,このクラスが安全性とプライバシに関するモチベーションの高いアプリケーションを提供するため,顔検出のサブプロブレムについて考察する。
画像からの文脈的手がかりを利用して、目に見えない顔の存在を推測する、より効率的でサンプルのないアプローチを提案する。
提案手法は, より効率のよい生成手法よりも優れており, 高い結果が得られる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:22:03 GMT)
Semantic Segmentation Algorithm Based on Light Field and LiDAR Fusion [23.1] 本稿では,光場データと点クラウドデータを組み合わせた最初のマルチモーダルセマンティックセマンティックセマンティクスデータセットを提案する。
本手法は,画像のみのセグメンテーションを1.71Mean Intersection over Union(mIoU)で,点雲のみのセグメンテーションを2.38mIoUで上回り,その効果を示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:15:06 GMT)
metabeta - A fast neural model for Bayesian mixed-effects regression [23.0] 混合効果回帰のためのトランスフォーマーベースニューラルネットワークモデルであるメタベタを提案する。
MCMCに基づくパラメータ推定は,通常要求される時間のごく一部で,安定かつ同等の性能に達することを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:20:00 GMT)
Benchmarking is Broken - Don't Let AI be its Own Judge [22.9] 現在のベンチマークでは、重大な脆弱性がますます明らかになっている。
データ汚染や、モデル開発者による選択的なレポートといった問題は、誇大宣伝に役立ちます。
このポジションペーパーは、現在のルイス=フェールアプローチは持続不可能であると主張している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:41:37 GMT)
h1: Bootstrapping LLMs to Reason over Longer Horizons via Reinforcement Learning [22.9] 大規模言語モデルは短期水平推論タスクでは優れているが、水平線長の推論によって性能が低下する。
既存のアプローチでは、推論時の足場やコストのかかるステップレベルの監視に依存しています。
本稿では,既存短軸データのみを用いて,長軸推論機能をブートストラップするスケーラブルな手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:58:41 GMT)
Non-Stationary Online Structured Prediction with Surrogate Losses [22.8] 累積目標損失に対して$F_T + C (1 + P_T)$という形の有界性を証明する。
我々の中核となる考え方は、勾配オンライン降下(OGD)の動的後悔境界を代理ギャップを利用する手法で合成することである。
我々はまた、OGDのための新しいPolyakスタイルの学習率にも光を当てています。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:43:44 GMT)
When Benchmarks Age: Temporal Misalignment through Large Language Model Factuality Evaluation [22.4] 大規模言語モデル(LLM)と現実世界の急速な進化は、広く使われている評価ベンチマークの静的な性質を上回っている。
本稿では,5つの一般的な事実性ベンチマークと8つのLSMを異なる年毎に比較して,この問題の体系的な調査を行う。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:06:07 GMT)
Heptapod: Language Modeling on Visual Signals [22.4] Heptapodは、言語モデリングの基本原則に準拠したイメージ自己回帰モデルである。
Heptapodは、各ステップで画像の2次元空間グリッド全体の分布を予測することを学習する。
ImageNet 生成ベンチマークでは、Heptapod は2.70ドルの FID を達成し、従来の因果自己回帰アプローチを著しく上回っている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:54:46 GMT)
Experimental demonstration of genuine quantum information transmission through completely depolarizing channels in a superposition of cyclic orders [22.3] 量子通信における大きな課題は、特に完全非分極チャネルにおいて、チャネル容量に対するノイズの負の影響に対処することである。
不定因果順序は、チャネルが適用されるシーケンスの制御を可能にすることによって、有望な解を提供する。
本稿では,完全非分極チャネル間の真の量子情報伝送を初めて実験的に実現したことを報告する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:24:34 GMT)
P3D: Scalable Neural Surrogates for High-Resolution 3D Physics Simulations with Global Context [22.3] 本稿では,3次元物理シミュレーションを目的としたハイブリッドCNN-Transformerバックボーンアーキテクチャを提案する。
提案するネットワークはシミュレーション領域の小さなパッチで事前訓練が可能であり,グローバルな解を得るために融合することができる。
空間分解能を最大5123ドルの高分解能等方性乱流にスケールする方法を実証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:19:07 GMT)
Online Rubrics Elicitation from Pairwise Comparisons [22.3] InlineRubrics Elicitation (OnlineRubrics)は,オンライン手法で評価基準を動的にキュレートする手法である。
OnlineRubricsは、静的ルーブリックのみによるトレーニングよりも、最大8%の一貫性のある改善を実現している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:44:59 GMT)
$λ$-GRPO: Unifying the GRPO Frameworks with Learnable Token Preferences [22.2] トークンレベルの重み付けを適応的に制御する学習可能なパラメータ$lambda$を導入します。
lambda$-GRPOはバニラGRPOとDAPOよりも一貫した改善を実現しています。
これらの利益は、トレーニングデータの変更や追加の計算コストなしで得られます。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:39:07 GMT)
GreedyPixel: Fine-Grained Black-Box Adversarial Attack Via Greedy Algorithm [21.8] GreedyPixelは、ディープニューラルネットワークの新しい敵攻撃フレームワークである。
これは、サロゲート由来の画素優先マップと、クエリフィードバックによって改善されたグレード、ピクセルごとの最適化を組み合わせたものだ。
以上の結果から,GreedyPixelはホワイトボックス攻撃とブラックボックス攻撃の精度ギャップを埋めることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:27:03 GMT)
Auto-Stega: An Agent-Driven System for Lifelong Strategy Evolution in LLM-Based Text Steganography [21.8] Auto-Stegaは、自己進化型のステガノグラフィ戦略のためのフレームワークである。
推論時に戦略を生成し、評価し、要約し、更新する。
高埋め込み率を扱うために,PC-DNTEというプラグイン・アンド・プレイアルゴリズムを導入する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:32:59 GMT)
Visions in Quantum Gravity [21.6] Norditaプログラム「量子重力:重力効果場理論から紫外完全アプローチ」
このコントリビューションは、プログラム中に開催された12のトピックに関する議論をまとめたものだ。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:27:13 GMT)
Maximising the Utility of Validation Sets for Imbalanced Noisy-label Meta-learning [21.4] 本稿では,その有効性を最大化して検証セットを自動的に構築する不均衡な雑音ラベルメタラーニング(INOLML)アルゴリズムを提案する。
提案手法は,従来のメタラーニング手法よりも大幅に改善され,いくつかのベンチマークで新たな最先端を設定できる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:56:57 GMT)
Do RAG Systems Really Suffer From Positional Bias? [21.3] 我々は、最先端の検索パイプラインが、関連するパスを検索する一方で、体系的に非常に気を散らすパイプラインをトップにもたらす方法を示す。
以上の結果から, LLM位置選択に基づいて経路を再構成しようとする高度戦略は, ランダムシャッフルよりも性能が良くないことが明らかとなった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:15:53 GMT)
Argument Summarization and its Evaluation in the Era of Large Language Models [21.2] 大規模言語モデル(LLM)は様々な自然言語生成(NLG)タスクに革命をもたらした。
本稿では、ArgSumシステムへの最先端LCMの統合とその評価について検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:41:10 GMT)
When Judgment Becomes Noise: How Design Failures in LLM Judge Benchmarks Silently Undermine Validity [21.2] 我々は、厳密な目標と検証可能な構成がなければ、ベンチマークのランキングは、ほぼノイズの多い高信頼度ランキングを生成することができると論じる。
本稿では,Arena-Hard Autoが使用するELOスタイルのアグリゲーションが崩壊し,真のランキングの不確かさをマスクすることを示す。
我々の結果は、妥当性を損なう設計上の失敗を強調し、より良いスコープで信頼性に配慮したベンチマークを構築するための実用的な原則を提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:11:46 GMT)
Benchmarking LLM Causal Reasoning with Scientifically Validated Relationships [21.0] 因果推論は、真の因果関係を理解するための大言語モデルの基本である。
既存のベンチマークは、合成データへの依存やドメインカバレッジの狭さといった、重大な制限に悩まされている。
本稿では,上位階層の経済誌と財務誌から抽出したカジュアルに同定された関係から構築された新しいベンチマークを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:00:49 GMT)
LoDisc: Learning Global-Local Discriminative Features for Self-Supervised Fine-Grained Visual Recognition [21.0] 微妙な局所的きめ細かい特徴学習をグローバルな自己教師付きコントラスト学習に取り入れる。
局所的識別(LoDisc)と呼ばれる新しい前提課題が提案され,局所的中心領域に対する自己監督型モデルの焦点を明示的に監督する。
本稿では,LoDiscのプリテキストタスクにより,重要な局所領域におけるきめ細かい手掛かりを効果的に向上することができ,また,グローバルな局所的なフレームワークにより,画像のきめ細やかな特徴表現をさらに洗練できることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:39:09 GMT)
TalkPlayData 2: An Agentic Synthetic Data Pipeline for Multimodal Conversational Music Recommendation [20.9] TalkPlayData 2は、エージェントデータパイプラインによって生成されるマルチモーダルな会話音楽レコメンデーションのための合成データセットである。
提案するパイプラインでは,複数の大規模言語モデル (LLM) エージェントを,特殊なプロンプトで様々な役割で生成する。
すべてのLLMは音声と画像でマルチモーダルであり、マルチモーダルレコメンデーションと会話のシミュレーションを可能にする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:52:52 GMT)
TalkPlay-Tools: Conversational Music Recommendation with LLM Tool Calling [20.9] 本稿では,ツールコールによる楽曲レコメンデーションシステムを提案する。
本システムでは,LLMをユーザ意図を解釈するエンドツーエンドのレコメンデーションシステムとして位置付ける。
この統合ツールコールフレームワークは,さまざまなレコメンデーションシナリオ間での競合性能を実現することを実証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:49:57 GMT)
M3Retrieve: Benchmarking Multimodal Retrieval for Medicine [20.5] マルチモーダル医療検索モデルのベンチマークであるM3Retrieveをリリースする。
M3Retrieveは5つのドメイン、16の医療分野、4つの異なるタスクにまたがる。
本ベンチマークでは,様々な医療分野に特有な課題を探るため,主要なマルチモーダル検索モデルの評価を行った。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:08:47 GMT)
Phase Diagram of Dropout for Two-Layer Neural Networks in the Mean-Field Regime [20.2] Dropoutは、勾配に基づくトレーニングの各ステップでランダムに非活性化されたユニットで構成されるニューラルネットワークのトレーニングテクニックである。
平均場スケールの2層ニューラルネットワーク上での降下による勾配降下幅の広さについて検討した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:09:32 GMT)
Aligning Large Language Models via Fully Self-Synthetic Data [20.1] 大規模な言語モデル(LLM)に対する人間からのフィードバック(RLHF)からの伝統的な強化学習は、高価な人間の注釈付きデータセットに依存している。
本研究では,LLMアライメントのための完全自己合成フレームワークであるSelf-Alignment Optimization (SAO)を紹介する。
実験によると、AlpacaEval2.0のような標準ベンチマークでは、SAOがモデルのチャット機能を効果的に強化している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:07:45 GMT)
GTCN-G: A Residual Graph-Temporal Fusion Network for Imbalanced Intrusion Detection (Preprint) [20.0] 本稿では,Gated Temporal Convolutional Network and Graph (GTCN-G) という新しいディープラーニングフレームワークを提案する。
本モデルでは,ネットワークフローから階層的時間的特徴を抽出するためのGated TCN (G-TCN) を,基礎となるグラフ構造から学習するためのグラフ畳み込みネットワーク (GCN) を用いて一意に融合させる。
中心となるイノベーションは、グラフ注意ネットワーク(GAT)を通じて実装された残留学習メカニズムの統合にある。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:45:59 GMT)
Making Machines Sound Sarcastic: LLM-Enhanced and Retrieval-Guided Sarcastic Speech Synthesis [19.6] サルカズム(Sarcasm)は、非リテラル言語の微妙な形式であり、音声合成において重要な課題を提起する。
本稿では,文字認識音声合成のためのLarge Language Model (LLM)拡張検索フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:53:48 GMT)
Lean Finder: Semantic Search for Mathlib That Understands User Intents [19.5] Lean Finderは、LeanとMathlibのセマンティック検索エンジンである。
数学者の意図を理解し、一致させる。
LLMベースの定理証明器と互換性があり、形式的推論によるブリッジング検索が可能である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:51:49 GMT)
Multi-Task Pre-Finetuning of Lightweight Transformer Encoders for Text Classification and NER [19.1] 2つの基本的なNLPタスクファミリに対する軽量BERTライクエンコーダの適応性を高めるためのプレファインタニング戦略について検討する。
本稿では,タスクプライマリな LoRA モジュールをベースとした,シンプルで効果的なマルチタスク事前調整フレームワークを提案する。
本手法は,実際のデプロイメント制約を満たしながら,個別のファインタニングに匹敵する性能を実現する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:21:09 GMT)
Grounding the Ungrounded: A Spectral-Graph Framework for Quantifying Hallucinations in Multimodal LLMs [19.1] MLLMの幻覚を定量化する拡散力学における厳密な情報幾何学的枠組みを提案する。
我々は、温度依存の幻覚エネルギーに基づいてCourant-Fischer境界を導出し、RKHS固有モデムを用いて、モダリティを意識した解釈可能な測定値を得る。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:06:26 GMT)
Chiral quantum state circulation from photon lattice topology [19.0] キラル量子状態の循環は量子コンピュータの動作に不可欠である。
キュービットに結合した3つのキャビティからなるキャビティQEDアーキテクチャを提案する。
半古典的限界における循環周期を計算し、総光子数とともに変動する時間スケールにおいて循環が持続することを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:18:03 GMT)
TimeFormer: Transformer with Attention Modulation Empowered by Temporal Characteristics for Time Series Forecasting [18.9] 本研究では,その表現能力の最大化を目的として,時系列データ用に設計された新しいトランスフォーマーアーキテクチャを開発する。
時系列の特徴は,(1)過去から未来への一方向的影響,(2)時間の経過とともに崩壊する現象である。
2つの変調項(MoSA)を持つ自己保持機構が中心となるTimeFormerを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:07:30 GMT)
Lemma Dilemma: On Lemma Generation Without Domain- or Language-Specific Training Data [18.9] レマタイズ(Lemmatization)とは、あるテキスト中のすべての単語を辞書形式に変換するタスクである。
文脈的補題化タスクにおいて,大規模言語モデルがいかに効果的かという証拠は,これまで存在しなかった。
本稿では,次世代LLMにおけるテキスト内補間処理の能力について実験的に検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:34:00 GMT)
VUGEN: Visual Understanding priors for GENeration [18.8] VUGENは、VLMの事前訓練された視覚的理解を、効率的で高品質な画像生成に明示的に活用する新しいフレームワークである。
我々のアプローチは、まずVLMのネイティブビジョンエンコーダの高次元潜在空間を、低次元、トラクタブルな分布に変換する。
専用のピクセルデコーダは、生成されたラテントをイメージ空間にマッピングする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:04:47 GMT)
Controlled Agentic Planning & Reasoning for Mechanism Synthesis [18.8] 本研究は、自動平面機構合成のための二重エージェントアクラムに基づく推論フレームワークを提案する。
自然言語によるタスク記述から、システムはシンボリック制約と方程式を構成し、シミュレーションコードを生成し、パラメタライズし、批判駆動のフィードバックを通じて設計を反復的に洗練する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:58:13 GMT)
Unsupervised Backdoor Detection and Mitigation for Spiking Neural Networks [18.8] スパイキングニューラルネットワーク(SNN)は、ニューラルネットワーク(ANN)と比較してエネルギー効率が優れていることに注目が集まっている。
本稿では、SNNにおける従来のバックドア防御を阻害するキーブロッカーを特定し、これらの課題を克服するための教師なしポストトレーニング検出フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:25:35 GMT)
GAMBIT+: A Challenge Set for Evaluating Gender Bias in Machine Translation Quality Estimation Metrics [18.8] 機械翻訳(MT)システムにおけるジェンダーバイアスは広範囲に記録されているが、自動品質推定(QE)メトリクスのバイアスは比較的過小評価されている。
既存の研究では、QEメトリクスは性別バイアスも示せるが、ほとんどの分析は小さなデータセット、狭い職業範囲、制限された言語多様性によって制限されている。
本稿では,ジェンダーのあいまいな職業用語を含む翻訳を評価する際に,QE指標の振る舞いを調査するための大規模課題セットを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:09:03 GMT)
TWIST: Training-free and Label-free Short Text Clustering through Iterative Vector Updating with LLMs [18.7] 本稿では,短時間のテキストクラスタリングのためのトレーニングフリーかつラベルフリーな手法を提案する。
提案手法は,最先端手法に匹敵する,あるいは優れた結果が得られる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:05:39 GMT)
Randomized Quantum Singular Value Transformation [18.7] 量子特異値変換(QSVT)のための最初のランダム化アルゴリズムを紹介する。
QSVTの標準的な実装は、ハミルトニアンのブロック符号化に依存しており、対数的な数のアンシラ量子ビット、複雑なマルチキュービット制御、回路深さのスケーリングがハミルトン項の数と線形に必要である。
我々のアルゴリズムは1つのアシラ量子ビットしか使用せず、ブロックエンコーディングを完全に回避している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:14:15 GMT)
Blessing of Multilinguality: A Systematic Analysis of Multilingual In-Context Learning [18.6] 混合HRLのデモンストレーションは、英語のみのデモよりも一貫して優れていることを示す。
意外なことに、我々のアブレーション研究は、そのプロンプトに無関係な非英語文が存在することが、測定可能な利益をもたらすことを示している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:09:14 GMT)
Is My Data in Your AI? Membership Inference Test (MINT) applied to Face Biometrics [18.6] この記事では、AI/MLモデルのトレーニング中に与えられたデータが使用されているかどうかを経験的に評価することを目的とした新しいアプローチである、メンバシップ推論テスト(MINT)を紹介します。
本稿では,学習過程に使用されるデータに監査モデルが露出した場合に現れるアクティベーションパターンを学習するための2つのMINTアーキテクチャを提案する。
実験は6つの公開データベースを使って行われ、合計で2200万以上の顔画像で構成されている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:12:48 GMT)
Table Question Answering in the Era of Large Language Models: A Comprehensive Survey of Tasks, Methods, and Evaluation [18.5] テーブル質問回答(TQA)タスクは、テーブル表現、質問/回答の複雑さ、モダリティ、ドメインなど、さまざまな設定にまたがる。
大規模言語モデル(LLM)の最近の進歩は、TQAの大幅な進歩をもたらしたが、まだ体系的な構造やタスクの定式化、コア課題、方法論的傾向の理解が欠けている。
本調査は,LLM法に着目した総合的かつ構造化されたTQA研究の概要を提供することにより,このギャップに対処する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:56:03 GMT)
Robust Neural Rendering in the Wild with Asymmetric Dual 3D Gaussian Splatting [18.4] 光源内画像からの3D再構成は、一貫性のない照明条件と過渡的注意散らしのため、依然として困難な課題である。
既存の手法は、しばしば安定的で一貫した再構築を行うのに苦労する低品質なトレーニングデータを扱うための戦略に依存している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:13:12 GMT)
GyroSwin: 5D Surrogates for Gyrokinetic Plasma Turbulence Simulations [18.3] プラズマ乱流は非線形ジャイロキネティック方程式によって制御される。
縮小次モデルは、しばしばエネルギーの乱流輸送を近似するために実際に使用される。
GyroSwinは、5次元非線形ジャイロキネティックシミュレーションをモデル化できる最初のスケーラブルな5Dニューラルサロゲートである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:59:10 GMT)
Near-Asymptotically-Good Quantum Codes with Transversal CCZ Gates and Sublinear-Weight Parity-Checks [18.2] 我々は、線形次元と距離が非クリフォードゲートをサポートする最初の既知の量子符号を構築した。
これらの符号に対する効率的な復号化アルゴリズムを設計する。
我々の結果は、関数を変換への部分アクセスから再構成するPronyの手法の新たな一般化と見なすことができる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:27:41 GMT)
Cocoon: A System Architecture for Differentially Private Training with Correlated Noises [18.0] DP-SGDはトレーニング毎にノイズイテレーションを追加し、トレーニングされたモデルの精度を劣化させる。
新しいアプローチの族は、慎重に設計された相関ノイズを追加し、繰り返しにわたってノイズが互いにキャンセルされるようにします。
相関雑音を用いた効率的なトレーニングのためのハードウェア・ソフトウェア共同設計フレームワークであるCocoonを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:56:30 GMT)
Understanding Software Engineering Agents: A Study of Thought-Action-Result Trajectories [18.0] 大規模言語モデル(LLM)ベースのエージェントは、複雑なソフトウェアエンジニアリングタスクを自動化するためにますます採用されている。
本研究は,3種類のLLM系エージェントの思考-反感-反感の軌跡について,大規模な実証的研究を行った。
我々は,数量やトークン消費,反復的な行動系列,思考,行動,結果のセマンティックコヒーレンスといった重要な軌道特性を同定する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:28:31 GMT)
Say It Another Way: Auditing LLMs with a User-Grounded Automated Paraphrasing Framework [17.9] 本稿では,ユーザ行動に根ざした制御されたフレーズを生成するフレームワークであるAUGMENTを紹介する。
AUGMENTは言語的に情報を得た規則を活用し、命令の順守、意味的類似性、リアリズムのチェックを通じて品質を強制する。
ケーススタディでは、制御されたパラフレーズは、制約のない変動の下で隠されたままの系統的な弱点を明らかにする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:43:57 GMT)
Non-Asymptotic Analysis of Efficiency in Conformalized Regression [17.9] 我々は,SGDを用いてトレーニングされた共形量子化および中央値回帰のためのオラクル間隔長からの予測セット長のずれに関する非漸近的境界を確立する。
その結果, 収束速度の位相遷移を$alpha$の異なる規則で同定し, 余剰予測セット長を制御するためにデータを割り当てるためのガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:50:35 GMT)
DynamicEval: Rethinking Evaluation for Dynamic Text-to-Video Synthesis [17.8] 既存のテキスト・トゥ・ビデオ(T2V)評価ベンチマークであるVBenchやEvalCrafterには2つの制限がある。
ダイナミックカメラの動きを強調するプロンプトを体系的にキュレートしたベンチマークであるDynamicEvalを紹介する。
背景環境の整合性を示すために,Vbench運動の滑らか度測定値に基づく解釈可能な誤差マップを得る。
提案手法は,映像レベルとモデルレベルの両方において,人間の嗜好と強い相関関係を示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:41:04 GMT)
Inference-Time Scaling of Discrete Diffusion Models via Importance Weighting and Optimal Proposal Design [17.7] 本稿では、離散拡散モデルのスケーラブルな推論時間制御を可能にするシークエンシャルモンテカルロフレームワークを提案する。
具体的には,様々な中間目標に対するトラクタブルな重み付けを導出し,最適提案を特徴付ける。
合成タスク,言語モデリング,生物学設計,テキスト・ツー・イメージ生成といった実験結果から,我々のフレームワークが制御性やサンプルの品質を向上させることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:49:29 GMT)
Federated Unlearning in the Wild: Rethinking Fairness and Data Discrepancy [17.4] 機械学習は「忘れられる権利」のようなデータ削除の権利を強制するために重要である
分散パラダイムとして、フェデレートラーニング(FL)もアンラーニングを必要とする。
We propose a novel, fairness-aware FU approach, Federated Cross-Client-Constrains Unlearning (FedCCCU)。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:47:19 GMT)
Control-Augmented Autoregressive Diffusion for Data Assimilation [17.3] 本稿では,ARDMを軽量コントローラで拡張するアモールト化フレームワークを提案する。
我々はこの枠組みをカオス偏微分方程式(PDE)に対するデータ同化(DA)の文脈で評価する。
提案手法は,DA推論をオンザフライ修正による単一前方ロールアウトに還元し,推論中に高価な随伴計算や最適化を回避する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:37:32 GMT)
Expanding the Action Space of LLMs to Reason Beyond Language [17.2] 大規模言語モデル(LLM)は自然言語における強力な推論である。
彼らの行動は通常、語彙トークンの発行に限られる。
これは、推論と制御の義務の両方でモデルの言語をオーバーロードする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:56:58 GMT)
Artificial Hippocampus Networks for Efficient Long-Context Modeling [17.2] ロングシーケンス・モデリングは、RNNのようなモデルにおける圧縮固定サイズメモリの効率と、注目ベースのトランスフォーマーにおけるメモリの増大の忠実さとのトレードオフに直面している。
認知科学における多段階モデルに着想を得て,人工ニューラルネットワークのメモリフレームワークを導入する。
長文ベンチマークのLV-EvalとInfiniteBenchの実験は、AHN拡張モデルがスライディングウインドウベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:59:55 GMT)
MetaSlot: Break Through the Fixed Number of Slots in Object-Centric Learning [17.1] 可変オブジェクト数に適応する,プラグアンドプレイ型SlotアテンションバリアントであるMetaSlotを紹介する。
本稿では,MetaSlotが既存のSlot Attentionの変種と比較して,大幅な性能向上と解釈可能なスロット表現を実現していることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:14:03 GMT)
TS-Agent: A Time Series Reasoning Agent with Iterative Statistical Insight Gathering [17.0] 大規模言語モデル(LLM)のための時系列推論エージェントTS-Agentを提案する。
時系列をテキストトークン、画像、埋め込みにマッピングする代わりに、我々のエージェントは原子演算子を介して生の数値列と相互作用する。
実験の結果,TS-Agent は理解ベンチマークの最先端 LLM に匹敵する性能を達成できた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:31:53 GMT)
Fundamental Quality Bound on Optical Quantum Communication [16.9] エンタングルメントのエントロピーが非エンタングル操作下での蒸留速度を鋭くすることを示す。
これらの発見は、将来の量子光学ネットワークのリソースとしての絡み合いの新しい視点を提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:12:37 GMT)
Expressive and Scalable Quantum Fusion for Multimodal Learning [16.8] 提案手法は量子融合層 (Quantum Fusion Layer, QFL) と呼ばれ、古典的な融合スキームをハイブリッドな量子古典的手順で置き換える。
シミュレーションでは、QFLは小さなが多様なマルチモーダルタスクにおいて、強い古典的ベースラインを一貫して上回る。
これらの結果は、QFLがマルチモーダル融合に対する根本的に新しいスケーラブルなアプローチを提供し、より大きなシステムに対するより深い探索に役立つことを示唆している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:19:44 GMT)
Learning to Rewrite Prompts for Bootstrapping LLMs on Downstream Tasks [16.8] 機械翻訳などの自然言語生成(NLG)タスクでは、テキスト入力コンポーネントが重要となる。
既存のプロンプトエンジニアリング手法は主に、一般的なタスクのテキストインストラクションコンポーネントの最適化に重点を置いている。
本稿では,機械翻訳タスクに特化して設計された新しいプロンプト最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:40:06 GMT)
CARPAS: Towards Content-Aware Refinement of Provided Aspects for Summarization in Large Language Models [16.4] 本稿では,CARPAS(Content-Aware Refinement of Productd aspects for Summarization)を紹介する。
本稿では,関連する側面の数を予測するための予備的なサブタスクを提案し,その予測数が効果的なガイダンスとして機能できることを実証する。
実験の結果,提案手法は全データセットのパフォーマンスを著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:16:46 GMT)
Addressing the ID-Matching Challenge in Long Video Captioning [16.4] 長いビデオキャプションの鍵となる課題は、異なるフレームに現れる同じ個人を正確に認識することである。
RICE(Recognizing Identities for Captioning Effectively)と呼ばれる新しい動画キャプション手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:59:21 GMT)
ExLLM: Experience-Enhanced LLM Optimization for Molecular Design and Beyond [16.4] 3 つのコンポーネントを持つ LLM-as-optimizer フレームワークである ExLLM (Experience-Enhanced LLM Optimization) を導入する。
ExLLMはPMOに新しい最先端の結果をセットし、我々の設定を強く一般化する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:32:42 GMT)
L2M-AID: Autonomous Cyber-Physical Defense by Fusing Semantic Reasoning of Large Language Models with Multi-Agent Reinforcement Learning (Preprint) [16.3] L2M-AIDは多エージェント強化学習を用いた自律型産業防衛のための新しいフレームワークである。
大規模言語モデル(LLM)によって駆動される協調エージェントのチームを編成し、適応的でレジリエンスなセキュリティを実現する。
その結果,L2M-AIDは従来のIDS,ディープラーニング異常検出器,単一エージェントRLベースラインよりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:46:39 GMT)
Prompt, Synthesize, Fine-Tune: A Secure Code Generation Recipe [16.2] 高品質で脆弱でセキュアなコード例を自動的に合成するフレームワークであるSecure-Instructを紹介します。
Secure-Instructは、セキュリティだけでなく、生成されたコードの機能的正確性も改善します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:24:09 GMT)
Distributed Algorithms for Multi-Agent Multi-Armed Bandits with Collision [16.1] マルチプレイヤーマルチアーマッド・バンドイット(MMAB)問題について検討し、複数のプレイヤーが腕を選択して累積報酬を最大化する。
我々は,各プレイヤーが自身の行動と衝突フィードバックのみを観察できるような,中央調整のない分散環境を考える。
本稿では,適応的かつ効率的な通信プロトコルを用いた分散アルゴリズムを提案する。このアルゴリズムは,通信コストが$mathcalO(loglog T)$で,ほぼ最適なグループと個人の後悔を実現する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:12:59 GMT)
Best-of-Both Worlds for linear contextual bandits with paid observations [16.1] 本稿では,この問題に対する計算効率の良いBest-of-Both-Worldsアルゴリズムを提案する。
また, 逆数設定では$Theta(T2/3)$のミニマックス最適後悔を達成し, 複数対数的後悔を(破損した)レジームで保証することを示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:23:37 GMT)
Gender Bias in Large Language Models for Healthcare: Assignment Consistency and Clinical Implications [16.1] 大きな言語モデルの医療への統合は、臨床的な意思決定を強化することを約束している。
ジェンダーは長年、医師の行動や患者に影響を与えてきた。
一部のモデルは、患者の性別の解釈において、体系的な男女格差も示していた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:11:06 GMT)
No MoCap Needed: Post-Training Motion Diffusion Models with Reinforcement Learning using Only Textual Prompts [16.1] 本稿では,テキストプロンプトのみを用いて事前学習した動き拡散モデルを微調整するポストトレーニングフレームワークを提案する。
私たちのアプローチは、動き適応のためのフレキシブルで、データ効率が高く、プライバシ保護のソリューションです。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:12:10 GMT)
Improving Neutral Point-of-View Generation with Data- and Parameter-Efficient RL [16.0] パラメータ効率強化学習(PE-RL)は,ニュートラルポイント・オブ・ビュー(NPOV)を用いたセンシティブなトピックに対する問合せに答える大規模言語モデル(LLM)の能力を向上させるための,極めて効果的な学習方法であることを示す。
PE-RLおよびLoRAファインタニング(ストロングベースライン)、SFTおよびRLHFを含む複数の強いベースラインを評価することにより、これを実証する。
PE-RLは、最強のベースライン(97.06%rightarrow 99.08%$)に比べて全体的なNPOVの品質を向上するだけでなく、十分な回答を分離するための鍵と認識される機能よりもはるかに高いスコアを得る。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:30:55 GMT)
DiffMI: Breaking Face Recognition Privacy via Diffusion-Driven Training-Free Model Inversion [16.0] 顔認識は、不変の生体データに依存するため、深刻なプライバシーリスクを引き起こす。
モデル反転攻撃は、アイデンティティ情報がまだ回復可能であることを明らかにし、重大な脆弱性を露呈する。
DiffMIは拡散駆動型トレーニングフリーモデルインバージョンアタックである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:46:41 GMT)
NAR-*ICP: Neural Execution of Classical ICP-based Pointcloud Registration Algorithms [16.0] 本研究ではニューラルネットワークと古典ロボットアルゴリズムの交点をニューラルアルゴリズム推論(NAR)ブループリントを用いて検討する。
我々は,従来のICPベース登録アルゴリズムの中間計算を学習する新しいグラフニューラルネットワーク(GNN)ベースのフレームワークであるNAR-*ICPを提案する。
我々は、実世界のデータセットと合成データセットにまたがるアプローチを評価し、複雑な入力を扱う際の柔軟性を実証した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:15:48 GMT)
CodeCureAgent: Automatic Classification and Repair of Static Analysis Warnings [16.0] 本稿では,LSMをベースとしたエージェントを用いて静的解析警告を自動解析し,分類し,修復するCodeCureAgentを提案する。
私たちは106のJavaプロジェクトで見つかった1000のSonarQube警告のデータセット上でCodeCureAgentを評価し、291の異なるルールをカバーしています。
提案手法では,96.8%の警告に対して可視的修正を行い,最先端のベースラインアプローチを30.7%,可視的修正率29.2%で上回った。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:40:12 GMT)
Unified Molecule Pre-training with Flexible 2D and 3D Modalities: Single and Paired Modality Integration [15.9] 単一モード入力をサポートしながら統一的な分子表現を学習するフレキシブル分子事前学習フレームワークFlexMolを提案する。
提案手法では,2次元および3次元分子データに対して異なるモデルを用い,パラメータ共有を利用して計算効率を向上し,デコーダを用いて欠落したモダリティの特徴を生成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:02:51 GMT)
Rethinking Multilingual Continual Pretraining: Data Mixing for Adapting LLMs Across Languages and Resources [15.9] 大規模言語モデル(LLM)は、言語間での性能に大きな違いがある。
CPT(Continuous Pretraining)はこの不均衡に対処するための有望なアプローチとして現れている。
本研究は3つの多言語ベースモデルを含む36のCPT構成を体系的に評価する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:01:08 GMT)
MoRE-GNN: Multi-omics Data Integration with a Heterogeneous Graph Autoencoder [15.9] MoRE-GNNは生物学的に意味のある関係を捉え、既存の手法より優れている。
MoRE-GNNは、マルチオミクス統合を進めるための適応的でスケーラブルで解釈可能なフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:48:15 GMT)
TALENT: Table VQA via Augmented Language-Enhanced Natural-text Transcription [15.7] 表視質問回答(Table VQA)は、一般的に大きな視覚言語モデル(VLM)によって対処される。
テーブルの二重表現を利用する軽量なフレームワークTALENTを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:56:42 GMT)
Concept Retrieval -- What and How? [15.6] 概念は具体的あるいは抽象的な概念を反映する可能性がある。入力画像が与えられた場合、本論文は中心概念を共有する他のイメージを検索する。
問題を正式に定義し、主要な要件を概説し、適切な評価指標を導入する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:26:18 GMT)
NdLinear: Preserving Multi-Dimensional Structure for Parameter-Efficient Neural Networks [15.6] ディープラーニングにおいて、多次元入力(画像、医療スキャン、時系列など)を処理することは、しばしば入力を必要とする重要なタスクである。
我々は$mathitNdLinear$を紹介します。これは、テンソル上で直接動作し、フラット化を必要としない線形レイヤのドロップイン置換です。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:59:37 GMT)
The Knowledge Complexity of Quantum Problems [15.6] 対話プロトコルで証明可能な全ての量子問題は、ゼロ知識でも証明可能であることを示す。
本プロトコルは,暗号における標準的な仮定の下で,無条件の音質と計算ゼロ知識を実現する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:00:32 GMT)
Security through the Eyes of AI: How Visualization is Shaping Malware Detection [15.4] マルウェアの検出と分類に応用された既存の可視化に基づくアプローチを評価する。
このフレームワーク内では、マルウェア検出パイプラインの重要な段階にわたる最先端のアプローチを分析する。
我々は、可視化ベースのアプローチにおける主な課題を明らかにし、この重要な分野における進歩と将来的な方向性についての洞察を提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:38:44 GMT)
Last-iterate Convergence for Symmetric, General-sum, $2 \times 2$ Games Under The Exponential Weights Dynamic [15.0] 離散時間指数重みの包括的解析を行い、すべてのエンファンジェラルサムおよび対称2倍の正規形式ゲームにおいて一定のステップサイズで行う。
第一原理解析を通して、指数重みはそのようなゲームの最終回において動的に収束することを示す。
我々は、上記のゲーム理論の相互作用に対する広範なシミュレーションと応用について説明する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:32:58 GMT)
MoGU: Mixture-of-Gaussians with Uncertainty-based Gating for Time Series Forecasting [14.8] 不確実性に基づくゲーティング(MoGU)を併用した混合ガウス(Mixture-of-Gaussian)を導入する。
点推定のみを提供する従来のMoEとは異なり、MoGUは各専門家の出力をガウス分布としてモデル化する。
MoGUのコアイノベーションは、従来の入力ベースのゲーティングネットワークを置き換える不確実性ベースのゲーティングメカニズムである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:04:25 GMT)
CAST: Contrastive Adaptation and Distillation for Semi-Supervised Instance Segmentation [14.6] 我々は,限定ラベル付きおよび豊富なラベル付きデータを用いて,事前学習された視覚基盤モデル(VFM)をコンパクトな専門家に圧縮する,半教師付き知識蒸留(SSKD)フレームワークであるCASTを紹介する。
1) 比較校正による自己訓練によるVFM(s)のドメイン適応,(2) 統合された多目的損失による知識伝達,(3) 残留する疑似ラベルバイアスを軽減するための学生の洗練,の3段階に展開する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:00:36 GMT)
Reverse-type Data Processing Inequality [14.4] 量子データ処理の不等式(quantum data processing inequality)は、2つの量子状態がノイズチャネルを適用すると識別しにくくなることを主張する。
逆量子データ処理の不等式は、ノイズチャネルの適用後に識別可能性が保存されるかどうかを特徴付ける。
本研究では、量子チャネルの相対エントロピーの収縮係数と膨張係数を通してこれらの概念を探求する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:59:53 GMT)
A Diffusion Model for Regular Time Series Generation from Irregular Data with Completion and Masking [14.4] 時系列データは、医療、金融、科学の応用に不可欠である。
時系列変換器は不規則なシーケンスを完了し、自然の近傍を生成する。
マスキングを用いた視覚ベースの拡散モデルは、完了した値への依存を最小限に抑える。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:47:58 GMT)
HTMformer: Hybrid Time and Multivariate Transformer for Time Series Forecasting [14.2] トランスフォーマーに基づく手法は時系列予測において顕著な結果を得た。
既存のTransformerは、時間的依存関係を過度に強調する傾向があるため、シーケンスモデリングに制限がある。
変換器の性能は,効率的な表現の学習に使用される埋め込み法に大きく依存していることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:40:42 GMT)
Unlocking Latent Discourse Translation in LLMs Through Quality-Aware Decoding [14.2] 大規模言語モデル (LLM) は機械翻訳において強力な競争相手として出現している。
しかし、彼らは代名詞の分解や語彙の凝集といった言論現象を文書レベルで適切に扱うのに苦慮している。
この知識を効果的に抽出するために品質認識復号法(QAD)を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:37:17 GMT)
Can AI Truly Represent Your Voice in Deliberations? A Comprehensive Study of Large-Scale Opinion Aggregation with LLMs [14.2] DeliberationBankは大規模な人為的なデータセットで、3,000人の参加者が作成した10のDeliberationの質問に意見データがある。
私たちはDeliberationJudgeをトレーニングします。
我々のフレームワークは、議論の要約を評価するスケーラブルで信頼性の高い方法を提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:52:04 GMT)
Label-frugal satellite image change detection with generative virtual exemplar learning [14.1] 能動学習に基づく新しい変化検出アルゴリズムを考案する。
私たちの研究の主な貢献は、それぞれのラベルのないサンプルがどれほど重要かを測定する新しいモデルにあります。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:07:35 GMT)
Bit-Level Discrete Diffusion with Markov Probabilistic Models: An Improved Framework with Sharp Convergence Bounds under Minimal Assumptions [14.0] 本稿では離散データ生成のための離散マルコフ確率モデル(DMPM)を紹介する。
DMPMは離散ビット空間で動作し、ノイズ発生過程はランダムにラベルを反転させる連続時間マルコフ連鎖である。
この研究は理論の基礎と実践的応用を橋渡しし、効果的で理論的に基礎付けられた離散生成モデルの開発を進めた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:55:19 GMT)
Angular Constraint Embedding via SpherePair Loss for Constrained Clustering [14.0] 制約付きクラスタリングは、ペアワイズ制約を通じてドメイン知識を統合する。
既存の制約付きクラスタリング(DCC)手法は、エンドツーエンドのモデリングに固有のアンカーによって制限されるか、差別的なユークリッドの埋め込みを学ぶのに苦労する。
本稿では,SpherePair と呼ばれる新しい角度制約埋め込み手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:43:20 GMT)
CodeVaani: A Multilingual, Voice-Based Code Learning Assistant [14.0] 我々は、Bodhitreeに組み込まれたコードを理解するための多言語音声駆動アシスタントCodeVaaniを紹介する。
これは、学習者が母国語でプログラミングの概念を探求するのに役立つ音声対応アシスタントである。
28人の初心者プログラマを対象に行った調査では、CodeVaaniは75%の応答精度を達成し、参加者の80%以上が肯定的な評価を受けた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:15:59 GMT)
Gaussian Equivalence for Self-Attention: Asymptotic Spectral Analysis of Attention Matrix [13.9] 自己注意層は、現代のディープニューラルネットワークの基本的な構成要素となっている。
本稿では,注目行列の特異値スペクトルを厳密に解析し,注目のための最初のガウス同値性結果を確立する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:13:42 GMT)
TRIM: Token-wise Attention-Derived Saliency for Data-Efficient Instruction Tuning [13.9] 命令チューニングのためのフォワードオンリーでトークン中心のフレームワークを導入する。
勾配を使う代わりに、注意に基づく「フィンガープリント」によって識別される下層の表現パターンをマッチングすることによって機能する。
提案手法で選択したコアセットは,ダウンストリームタスクでは最大9%,フルデータの微調整性能では最大9%向上する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:11:04 GMT)
Bringing Graphs to the Table: Zero-shot Node Classification via Tabular Foundation Models [13.8] グラフ学習手法であるTAGを導入し,まず特徴および構造エンコーダを用いてグラフをテーブルに変換し,様々なサブサンプルテーブルに複数のFMを適用し,アンサンブル選択により出力を集約する。
28の実世界のデータセットの実験では、TAGはタスク固有のGNNと最先端のGFMを一貫して改善している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:38:17 GMT)
A deep multiple instance learning approach based on coarse labels for high-resolution land-cover mapping [13.8] トレーニングラベルの量と品質は、高解像度の土地被覆マッピングにおける中心的な問題である。
画素レベルのマルチクラス分類器を訓練し,低解像度ラベルを予測する手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:50:39 GMT)
Black-box Detection of LLM-generated Text Using Generalized Jensen-Shannon Divergence [13.8] SurpMarkは基準に基づく検出器で、トークンのサブプライムのダイナミックスによって経路を要約する。
我々は、原則的離散化基準を証明し、決定統計の正規性を確立する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:53:11 GMT)
Differentially Private Synthetic Text Generation for Retrieval-Augmented Generation (RAG) [13.7] DP-SynRAG は LLM を用いて差分プライベートな合成RAG データベースを生成するフレームワークである。
従来の方法とは異なり、合成テキストは一度作成すれば再利用できるため、繰り返し発生するノイズ注入や追加のプライバシーコストを回避することができる。
DP-SynRAGは、固定されたプライバシー予算を維持しつつ、最先端のプライベートRAGシステムに対して優れたパフォーマンスを達成することを示す実験である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:15:50 GMT)
Don't Adapt Small Language Models for Tools; Adapt Tool Schemas to the Models [13.7] 小型言語モデル(SLM)は、ツール強化されたAIシステムに対して大きな計算上のアドバンテージを提供する。
ツールの使用タスク、特に適切なツールの選択と正確なパラメータの特定に苦労する。
モデルの事前訓練された知識に合わせてスキーマを適用することを提案する。
MetaToolとRoTBenchの実験では、最大17%の改善があり、スキーマのミスアライメントエラーが80%削減された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:16:07 GMT)
Generative World Modelling for Humanoids: 1X World Model Challenge Technical Report [13.7] 1X World Model Challengeでは、実世界のヒューマノイドインタラクションのオープンソースベンチマークが導入されている。
We adapt the video generation foundation model Wan-2.2 TI2V-5B to video-state-conditioned future frame prediction。
本モデルでは,サンプリングタスクで23.0dBPSNR,圧縮タスクで6.6386のTop-500 CEを実現し,両課題において第1位を確保した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:49:12 GMT)
Dynamic Regret Bounds for Online Omniprediction with Long Term Constraints [13.6] 本稿では,長期的制約のあるオンライン全滅に対する動的後悔境界を保証するアルゴリズムを提案する。
最近導入されたこの問題のゴールは、下流の意思決定者集団に配信される一連の予測を生成することである。
この枠組みでは,全てのエージェントに対して同時的エンファンダイナミックな後悔の保証を得るアルゴリズムを初めて提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:28:05 GMT)
Möbius transforms and Shapley values for vector-valued functions on weighted directed acyclic multigraphs [13.6] 我々は、M"obius inversionとShapley値の概念を非巡回多重グラフとその重み付きバージョンに一般化する。
我々は値関数(ゲーム)を許容し、従ってそれらの M "obius transforms (synergy function) と Shapley value はグラフ重みを含む環上の加群である任意のアーベル群における値を持つ。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:55:31 GMT)
PyCFRL: A Python library for counterfactually fair offline reinforcement learning via sequential data preprocessing [13.6] 強化学習(Reinforcement Learning, RL)は、シーケンシャルな意思決定ルールを学習し、評価することを目的としており、しばしば「政治」と呼ばれる。
我々はPyCFRLを紹介した。PyCFRLは、オフラインRLにおける対実的公平性を保証するPythonライブラリである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:19:10 GMT)
Quantifying Data Contamination in Psychometric Evaluations of LLMs [13.5] 大規模言語モデル(LLM)の心理測定評価におけるデータ汚染を測定する枠組みを提案する。
この枠組みを、メジャーファミリーの21モデルと、広く使用されている4つのサイコメトリックインベントリに適用することにより、人気のあるインベントリが強い汚染を示す証拠を提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:16:20 GMT)
Membership Inference Attacks on LLM-based Recommender Systems [13.5] LLM(Large Language Model)ベースのRecommender Systems(RecSys)は、レコメンデーションシステムを異なるドメインに柔軟に適応させることができる。
インコンテキスト学習(ICL)、すなわちプロンプトを使ってレコメンデーション関数をカスタマイズする。
我々は,システムプロンプトによって被害者の歴史的相互作用が使用されているかどうかを明らかにすることを目的とした,4つのメンバシップ推論攻撃(MIA)を設計する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:48:57 GMT)
U-Bench: A Comprehensive Understanding of U-Net through 100-Variant Benchmarking [13.4] U-Netは、医療画像のセグメンテーションにおいて支配的なアーキテクチャであり、何千ものU字型の変種の開発に繋がった。
広く採用されているにもかかわらず、パフォーマンスとユーティリティを体系的に評価する包括的なベンチマークはいまだに存在しない。
U-Benchは、28のデータセットと10の画像モダリティにまたがる100のU-Net変異を評価する、最初の大規模で統計的に厳密なベンチマークである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:06:17 GMT)
Q-Learning with Fine-Grained Gap-Dependent Regret [13.4] 既存のモデルフリーアルゴリズムは、最小限の最悪の後悔を実現するが、そのギャップ依存境界はいまだに粗いままであり、最適以下のギャップの構造を完全に捉えることができない。
UCBベースと非UCBベースの両方のアルゴリズムに対して、きめ細かいギャップ依存的後悔境界を確立する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:02:16 GMT)
HopWeaver: Cross-Document Synthesis of High-Quality and Authentic Multi-Hop Questions [13.2] MHQA(Multi-Hop Question Answering)は、様々な情報源からの情報を統合するモデルの能力を評価するために重要である。
本稿では,人間の介入なしに真のマルチホップ質問を合成する最初のクロスドキュメントフレームワークであるHopWeaverを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:36:53 GMT)
A Broader View of Thompson Sampling [13.2] トンプソンサンプリングは、最も広く使われ研究されているバンディットアルゴリズムの1つである。
トンプソンサンプリングが「適切に」探究と搾取のバランスをとることができる正確なメカニズムは謎である。
本稿では,トンプソンサンプリングをオンライン最適化アルゴリズムとして再放送する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:43:02 GMT)
GenPilot: A Multi-Agent System for Test-Time Prompt Optimization in Image Generation [13.2] 本稿では,入力テキストを直接操作するテスト時間プロンプト最適化手法を提案する。
私たちのアプローチは、モデルに依存しず、解釈可能で、長く複雑なプロンプトを扱うのに適しています。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:51:52 GMT)
Automated Discovery of Test Oracles for Database Management Systems Using LLMs [13.1] 本稿では,大規模な言語モデル(LLM)を用いて,テストオラクルの発見とインスタンス化を自動化する方法について検討する。
LLMは、多数の偽陽性バグレポートを生成する幻覚を起こす傾向がある。
ArgusはConstrained Abstract Queryの中核的な概念に基づいて構築された新しいフレームワークです。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:29:11 GMT)
Code Like Humans: A Multi-Agent Solution for Medical Coding [13.1] Code Like Humans: 大きな言語モデルで医療コーディングを行うための新しいエージェントフレームワークを紹介します。
人間の専門家のための公式なコーディングガイドラインを実装しており、完全なICD-10コーディングシステムをサポートする最初のソリューションである。
希少な診断符号で現在までの最高のパフォーマンスを達成している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:07:35 GMT)
The Sandbox Configurator: A Framework to Support Technical Assessment in AI Regulatory Sandboxes [13.1] EUの人工知能法は、AI規制サンドボックス(AIRS)を導入している。
評価メソッドは断片化され、テストは標準化が欠如し、開発者と規制当局の間のフィードバックループは弱い。
共有ライブラリからドメイン関連テストを選択し、ダッシュボードを統合したカスタマイズされたサンドボックス環境を生成することができる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:27:18 GMT)
Revisiting Metric Reliability for Fine-grained Evaluation of Machine Translation and Summarization in Indian Languages [13.1] ITEMは、6つの主要なインドの言語における26の自動測定値と人間の判断値のアライメントを体系的に評価する。
発見は、インドの言語でメートル法設計と評価を進めるための重要なガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:27:02 GMT)
Lung Infection Severity Prediction Using Transformers with Conditional TransMix Augmentation and Cross-Attention [13.1] 肺感染症、特に肺炎は、急速にエスカレートする深刻な健康リスクを引き起こす。
肺感染症の重症度を評価するため,CTスキャンと胸部X線検査の両方に適用可能な新しい方法を提案する。
i)QCross-Att-PVT、並列エンコーダ、クロスゲートアテンション機構、機能アグリゲータを統合したTransformerベースのアーキテクチャ、および(ii)カスタムデータ拡張戦略であるConditional Online TransMixです。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:08:34 GMT)
AdaDim: Dimensionality Adaptation for SSL Representational Dynamics [13.1] 効果的な自己監視学習(SSL)の鍵となる要素は、次元的崩壊を防ぐことである。
良いSSL表現空間は高い$H(R)$と低い$I(R;Z)$を持つべきである。
最高のSSLモデルは、最高$H(R)$も最低$I(R;Z)$も持たないが、実質的に両者のバランスを保っていることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:09:23 GMT)
Functional Matching of Logic Subgraphs: Beyond Structural Isomorphism [13.1] サブグラフマッチングは多くの電子設計自動化(EDA)アプリケーションの基礎となっている。
本稿では,ある論理関数がより大きな回路内に暗黙的に存在するかどうかを識別する新しい手法である関数部分グラフマッチングの概念を導入する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:16:46 GMT)
HotBugs.jar: A Benchmark of Hot Fixes for Time-Critical Bugs [12.9] 実際のホットフィックスに特化した最初のデータセットであるHotBugs.jarを紹介します。
10のアクティブなApacheプロジェクトの最初のマイニングから、190万以上のコミットと150万件のイシューレポートから、当社のホットフィックス基準を満たした746のソフトウェアパッチを特定しました。
Bugs.jarフレームワーク上に構築されたHotBugs.jarは、110の再現可能なケースを統合し、手動で検証された679のホットフィックスをすべて利用できるようにする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:46:50 GMT)
Noisy-Syndrome Decoding of Hypergraph Product Codes [12.6] ハイパーグラフ積符号(Hypergraph product codes)は、最先端の陰極性特性を持つ量子符号の原型である。
本研究は,ハイパーグラフ製品符号の「ノイズ」シンドローム復号問題について考察し,ノイズの低減効果を示す。
私たちの結果は、コードとデュアルコードが"同時に良い"という、一般的なコードのファミリーを支えています。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:48:39 GMT)
Is Supervised Learning Really That Different from Unsupervised? [12.4] 教師あり学習を2段階の手順に分解する方法を実証する。
線形およびカーネルリッジの回帰、スムーズなスプライン、ニューラルネットワークは、yにアクセスせずにトレーニングされ、標準のyベースと同等に動作することを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:28:20 GMT)
X-Teaming Evolutionary M2S: Automated Discovery of Multi-turn to Single-turn Jailbreak Templates [12.4] M2S(Multi-turn-to-single-turn)は、反復的なリピートを1つの構造化プロンプトに圧縮するが、以前の作業は手書きのテンプレートに頼っていた。
X-Teaming Evolutionary M2Sは言語モデル誘導進化を通じてM2Sテンプレートを発見し最適化する自動フレームワークである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:54:46 GMT)
ObjexMT: Objective Extraction and Metacognitive Calibration for LLM-as-a-Judge under Multi-Turn Jailbreaks [12.4] 目的抽出とメタ認知のためのベンチマークであるexMTを提案する。
マルチターン書き起こしが与えられた場合、モデルは1文ベース目標と自己報告された自信を出力しなければならない。
正確性は金の目標と類似性によって評価され、300の校正項目で1度閾値付けされる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:13:00 GMT)
Conditional Local Independence Testing for Itô processes with Applications to Dynamic Causal Discovery [12.3] 条件付き局所独立は、あるプロセスが与えられた他のプロセスの影響を受けているかどうかを記述する。
伊藤プロセスにおける条件付き局所独立の仮説テストを提案する。
脳の安静時fMRIにおける因果発見のための数値的検証と実世界の応用を行った。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:52:23 GMT)
Mid-Training of Large Language Models: A Survey [12.3] 大規模言語モデル(LLM)は通常、大規模事前学習とタスク固有の微調整によって開発される。
近年の進歩は中間訓練段階の重要性を浮き彫りにしている。
トレーニング中のデータ分散,学習速度スケジューリング,長文拡張の最初の分類について紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:49:37 GMT)
Unlocking Dataset Distillation with Diffusion Models [12.3] LD3Mは、事前学習された潜水拡散モデルにより、勾配に基づく蒸留潜水とクラス埋め込みを学習する。
LD3Mは128x128と256x256の複数のImageNetサブセットで、ダウンストリームの精度を4.8ポイント(1 IPC)と4.2ポイント(10 IPC)に改善している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:38:25 GMT)
Native Hybrid Attention for Efficient Sequence Modeling [12.3] ネイティブハイブリッドアテンション(NHA)は、線形およびフルアテンションの新たなハイブリッドアーキテクチャである。
単一のtextttsoftmaxアテンション操作は、すべてのキーと値に適用される。
実験結果から,NHAはリコール集約・コモンセンス推論タスクにおいてトランスフォーマーを上回ることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:44:57 GMT)
Bayesian Modelling of Multi-Year Crop Type Classification Using Deep Neural Networks and Hidden Markov Models [12.3] 年次土地被覆地図の時間的一貫性は、長年にわたる土地被覆の進化と変化をモデル化する上で非常に重要である。
本稿では,深層学習とベイズモデルを組み合わせた年次衛星画像時系列(SITS)の分類に焦点をあてる。
提案手法は,SITS と SITS と SITS の複雑な時間的相関関係を多年作物型配列で捉えることを目的としている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:33:32 GMT)
EDUMATH: Generating Standards-aligned Educational Math Word Problems [12.2] 数学語問題(MWP)は、K-12の教育ツールであり、学生の興味や能力レベルにカスタマイズすることで、学習結果が向上する。
学生の興味や数学教育基準に合わせてカスタマイズされたMWPを生成することで,LLMが数学教育を支援することを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:53:06 GMT)
BaTCAVe: Trustworthy Explanations for Robot Behaviors [12.0] 本稿では,ニューラルネットワークによる決定に起因した,人間解釈可能な高レベルな概念に基づく信頼性の高い説明可能なロボット工学手法を提案する。
提案手法は,ニューラルネットワークのアクティベーションと人間の解釈可能なビジュアライゼーションを一致させることにより,関連する不確実性スコアを説明できる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:01:36 GMT)
Transforming Noise Distributions with Histogram Matching: Towards a Single Denoiser for All [11.7] 監督されたガウスのデノイザーは、分布外ノイズに直面した場合に限定的な一般化を示す。
本稿では,任意の雑音をガウス分布に既知の強度で変換するヒストグラムマッチング手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:34:50 GMT)
PolyPose: Deformable 2D/3D Registration via Polyrigid Transformations [11.7] 変形可能な2D/3D登録のためのシンプルでロバストな方法であるPolyPoseを提案する。
PolyPoseは複雑な3次元変形場を剛体変換の合成としてパラメータ化する。
この強い誘導バイアスにより,PolyPoseは患者の術前容積を2つのX線に合わせることができた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:12:51 GMT)
Enhancing Concept Localization in CLIP-based Concept Bottleneck Models [11.6] 概念ボトルネックモデル(CBM)は明示的な概念アノテーションを必要とせず、代わりにゼロショットでCLIPを用いて抽出した概念に依存していることを示す。
本稿では,画像の埋め込みをアンタングル化し,対象とする概念に対応する画素をローカライズする手法である,局所的解釈可能性(CHILI)による概念幻覚抑制について紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:07:16 GMT)
A Differentiable Alignment Framework for Sequence-to-Sequence Modeling via Optimal Transport [11.6] 一次元の最適輸送に基づく新しい微分可能なアライメントフレームワークを提案する。
TIMIT,AMI,LibriSpeechのデータセットによる実験結果から,本手法はアライメント性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:13:58 GMT)
Error Bounds for Physics-Informed Neural Networks in Fokker-Planck PDEs [11.5] 物理インフォームドニューラルネットワーク(PINN)は,確率密度関数を近似するために訓練可能であることを示す (PDF)。
我々の主な貢献はPINN近似誤差の解析である。
標準的なトレーニング手法で効率的に構築できる実用的なエラー境界を導出する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:47:39 GMT)
From Data to Rewards: a Bilevel Optimization Perspective on Maximum Likelihood Estimation [11.4] 生成モデルは現代の機械学習のバックボーンを形成し、テキスト、ビジョン、マルチモーダルアプリケーションにおける最先端システムを支える。
これらのアプローチは明示的な報酬信号に依存しており、実際には利用できないことが多く、高品質なデータセットのみがアクセス可能である場合に生成モデルをどのように整合させるかという問題を解き放つ。
そこでは、報酬関数を外部問題の最適化変数として扱い、政策勾配の目的が内部レベルを定義する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:45:37 GMT)
Guided by the Experts: Provable Feature Learning Dynamic of Soft-Routed Mixture-of-Experts [11.4] 本稿では,非線形ルータと専門家によるソフトローイング型MoEモデルの連成訓練のための収束保証を提供することにより,MoE理論を推し進める。
訓練後プルーニングは、効果的に冗長ニューロンを除去し、続いて、大域的最適性に到達した、確実に収束した微調整プロセスを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:40:31 GMT)
Discriminative Feature Feedback with General Teacher Classes [11.4] 対話型学習プロトコルDFFの理論的特性について検討する。
DFF学習プロトコルは、識別的特徴説明という形でフィードバックを使用する。
実現可能かつ実現不可能な設定におけるDFFの最適誤り境界について検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:14:22 GMT)
Lattice-allocated Real-time Line Segment Feature Detection and Tracking Using Only an Event-based Camera [11.4] 線分抽出は人為環境の幾何学的特徴を捉えるのに有効である。
最近の手法は、しばしば追加のフレームカメラに頼るか、高いイベントレートで苦労する。
本研究は,最新の高解像度(高イベントレート)イベントベースカメラのみを用いて,リアルタイムの線分検出と追跡を行う。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:52:35 GMT)
Search-R3: Unifying Reasoning and Embedding Generation in Large Language Models [11.4] Search-R3は、Large Language Modelsを適用して、彼らの推論プロセスの直接出力として検索埋め込みを生成する新しいフレームワークである。
我々のアプローチはLLMのチェーン・オブ・シント機能を利用しており、複雑な意味解析を通じてステップ・バイ・ステップを推論することでより効果的な埋め込みを実現できる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:16:20 GMT)
LuxInstruct: A Cross-Lingual Instruction Tuning Dataset For Luxembourgish [11.3] 機械翻訳への伝統的な依存は、しばしば意味的な誤りと文化的な不正確さをもたらす。
我々は、機械翻訳に頼ることなく、ルクセンブルク語のための言語間命令チューニングデータセットを作成する。
英語、フランス語、ドイツ語からの整列したデータを活用することで、言語的・文化的ニュアンスを保存する高品質なデータセットを構築します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:35:59 GMT)
Fixed Points and Stochastic Meritocracies: A Long-Term Perspective [11.3] 本研究は,既成的選択によって引き起こされるフィードバックループの文脈におけるグループフェアネスを,それ自身が付加的な優位性を与えるプログラムに検証する。
プログラムの利点(または、それに入らないことの害)が完全に対称である場合、両集団間の格差が最終的に解消されることが示される。
また、完全に対称な初期条件でさえも、大きな相違が生じる可能性があることも見出した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:23:57 GMT)
Self-supervised Physics-guided Model with Implicit Representation Regularization for Fast MRI Reconstruction [11.2] 本稿では,UnrollINRという新たなゼロショット自己教師型再構築フレームワークを提案する。
UnrollINRは、外部のトレーニングデータに頼ることなく、スキャン固有のMRI再構成を可能にする。
実験結果から,UnrollINRは教師付き学習法に比べ,高い加速速度で再現性能が得られた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:40:40 GMT)
UniFField: A Generalizable Unified Neural Feature Field for Visual, Semantic, and Spatial Uncertainties in Any Scene [11.2] 視覚的,意味的,幾何学的特徴を1つの一般化可能な表現で組み合わせた,統一的不確実性を考慮したニューラル特徴場UniFFieldを提案する。
シーン再構成と意味的特徴予測におけるモデル予測誤差を正確に記述するために,不確実性推定を評価した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:30:26 GMT)
Flow Matching for Robust Simulation-Based Inference under Model Misspecification [11.2] Flow Matching Corrected Posterior Estimation(フローマッチング補正後推定)は、シミュレーションによって訓練された後部推定を、少数の実校正サンプルを用いて洗練するフレームワークである。
提案手法は,従来のSBIベースラインと比較して,推論精度と不確実性を向上し,不特定性の影響を常に緩和することを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:25:46 GMT)
HBSplat: Robust Sparse-View Gaussian Reconstruction with Hybrid-Loss Guided Depth and Bidirectional Warping [11.0] HBSplatは、堅牢な構造的キュー、仮想ビュー制約、隠蔽された領域補完をシームレスに統合するフレームワークである。
HBSplatは21.13dBのPSNRと0.189LPIPSを達成し、リアルタイム推論を維持している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:26:58 GMT)
Inferring Capabilities from Task Performance with Bayesian Triangulation [11.0] 本稿では,多様な実験データからシステムの認知的プロファイルを推定する手法について述べる。
これらの特徴は、非人口データから機能を推測するために、複雑な方法で三角測量されなければならない。
能力指向評価の可能性を示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:05:18 GMT)
MacroBench: A Novel Testbed for Web Automation Scripts via Large Language Models [11.0] 我々は、HTML/DOMを読み、Seleniumを出力することで、LLMが再利用可能なブラウザ自動プログラム(マクロ)を自然言語で合成できるかどうかを評価するコードファーストベンチマークであるMacroBenchを紹介した。
MacroBenchは、681のタスクをカバーする7つのセルフホストサイトを、インタラクションの複雑さとターゲティングの難しさでインスタンス化する。
GPT-4o-mini (96.8%), GPT-4o (95.3%), Gemini (89.0%), DeepSeek (83.4%)
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:09:07 GMT)
Mining the Mind: What 100M Beliefs Reveal About Frontier LLM Knowledge [11.0] 我々は,GPTKB v1.5に基づいて,フロンティアLEMの事実的知識(あるいは信念)を深く探究する。
モデルの事実的知識は,確立された知識ベースとは大きく異なり,その精度は従来のベンチマークよりも著しく低いことがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:48:38 GMT)
Adjusting Initial Noise to Mitigate Memorization in Text-to-Image Diffusion Models [10.9] 初期ノイズサンプルは,この脱走の発生時期を決定する上で重要な役割を担っている。
本稿では,初期騒音を個別に調整する2つの緩和策を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:37:29 GMT)
Agent Bain vs. Agent McKinsey: A New Text-to-SQL Benchmark for the Business Domain [10.9] 我々は、現実世界のビジネスコンテキストに特化して設計された新しいベンチマークであるCORGIを紹介する。
ビジネスクエリの4つのカテゴリ – 説明性,説明性,予測性,レコメンデーション – に関する質問を提供する。
CORGIのパフォーマンスは高いレベルの質問で低下し,正確な予測と実行可能な計画の提供に苦慮していることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:57:35 GMT)
Quasi-Clique Discovery via Energy Diffusion [10.9] 本稿では,準斜め発見のためのエネルギー拡散に基づくEDQCを提案する。
75個の実世界のグラフでの実験では、EDQCはほとんどのデータセット上でより大きな準斜めを見つける。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:12:22 GMT)
Iterative LLM-Based Generation and Refinement of Distracting Conditions in Math Word Problems [10.9] 数学語問題(MWP)は最も広く使われている形式の一つである。
既存のMWPデータセットの多くは必要な情報のみを含む。
我々は,複数の視点と認知レベルからMWPを改訂する一連のプロンプトを開発する。
私たちのフレームワークの重要な利点は、オリジナルの問題と修正された問題の間の共有ソリューションの保存です。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:26:48 GMT)
Revisiting the Uniform Information Density Hypothesis in LLM Reasoning Traces [10.8] 均一情報密度(UID)仮説は、効果的なコミュニケーションが安定した情報の流れを維持することを示唆している。
本稿では,エントロピーに基づく段階的情報密度測定法を提案し,一様性の2つの相補的尺度を提案する。
ステップレベルの均一性は、強力な理論レンズを提供するだけでなく、実用的なパフォーマンスの恩恵をもたらす。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:37:04 GMT)
VAL-Bench: Measuring Value Alignment in Language Models [10.7] 大きな言語モデル(LLM)は、出力が人間の決定を形作るタスクにますます使われています。
既存のベンチマークは、主に拒否や事前定義された安全違反を追跡するが、モデルが一貫性のある価値システムを保持するかどうかを明らかにしない。
VAL-Bench(Value ALignment Benchmark)を導入し、モデルが公開討論の両面において安定的な価値スタンスを維持しているかどうかを評価する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:35:03 GMT)
DADO: A Depth-Attention framework for Object Discovery [10.7] 本稿では,注目機構と奥行きモデルを組み合わせたDADO(Depth-Attention Self-supervised Technique for Discovering Unseen Objects)を紹介する。
DADOは動的重み付けを用いて、各画像のグローバルな特徴に基づいて注意や深度の特徴を適応的に強調する。
微調整を必要とせずに、オブジェクト発見の精度と堅牢性において最先端の手法よりも優れています。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:46:34 GMT)
Learning to Recover: Dynamic Reward Shaping with Wheel-Leg Coordination for Fallen Robots [10.7] 本稿では,エピソードベースの動的リワードシェーピングとカリキュラム学習を統合した学習フレームワークを提案する。
相乗的ホイールレッグ調整は関節トルクの消費を15.8%、26.2%減少させることを示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:33:28 GMT)
From Handwriting to Feedback: Evaluating VLMs and LLMs for AI-Powered Assessment in Indonesian Classrooms [10.7] インドネシアの4年生の教室で14K以上の手書き回答を用いて,最先端のVLMとLDMを評価した。
我々のデータセットは、実教室から自然にキュリーで多様な手書きを特徴とし、現実的な視覚的および言語的課題を呈している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:52:28 GMT)
LLM Unlearning Under the Microscope: A Full-Stack View on Methods and Metrics [10.6] 本稿では,近年のステートフル・アンラーニング法12の原則的分類について述べる。
未学習効果(UE)、実用性維持(UT)、堅牢性(Rob)の評価を再考する。
分析の結果,Multiple-choice question (MCQ) の精度に支配される現在の評価は,狭い視点しか示さないことがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:47:05 GMT)
From Description to Detection: LLM based Extendable O-RAN Compliant Blind DoS Detection in 5G and Beyond [10.6] コントロールプレーンプロトコルの脆弱性は、Blind Denial of Service (DoS)攻撃など、重大なセキュリティ上の脅威を引き起こす。
ゼロショットモードにおけるLarge Language Models (LLM) の機能を利用する新しい異常検出フレームワークを提案する。
検出品質は, 表現や長さよりも, 記述の意味的完全性に依存していることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:13:02 GMT)
p-less Sampling: A Robust Hyperparameter-Free Approach for LLM Decoding [10.6] $p$-less サンプリングは、サンプリングに対する情報理論のアプローチであり、各デコードステップでトランケーション閾値を動的に設定する。
p$-lessが既存のサンプリング手法を一貫して上回りながら、より高い温度でテキスト品質の劣化がはるかに少ないことを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:48:03 GMT)
Text2Stories: Evaluating the Alignment Between Stakeholder Interviews and Generated User Stories [10.6] テキスト間アライメントのためのタスクとメトリクスであるText2Storiesを紹介する。
我々の測定基準は、書き起こしによって支持されるストーリーの割合と(ii)完全性、少なくとも1つのストーリーで支持される書き起こしの割合を定量化します。
4つのデータセットに対する実験により、LLMベースのマーカが保持されたアノテーション上で0.86マクロF1を達成することが示された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:12:57 GMT)
Local Reinforcement Learning with Action-Conditioned Root Mean Squared Q-Functions [10.4] フォワードフォワード(フォワードフォワード、英: Forward-Forward、FF)は、従来のフォワードパスとバックプロパゲーションで使用されるバックパスの代わりに、2つのフォワードパスを使用するニューラルネットワークの学習手順である。
本稿では,局所的なRLに良さ関数と動作条件を適用した新しい値推定法である,アクション条件付きルート平均2乗Q-Functions (ARQ)を提案する。
提案手法は,MinAtar および DeepMind Control Suite ベンチマークにおける最先端のローカルバックプロップフリー RL 手法と比較して,優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:06:09 GMT)
Falsification-Driven Reinforcement Learning for Maritime Motion Planning [10.4] 船舶の安全運用には海上交通規則の遵守が不可欠である。
強化学習(RL)エージェントを定着させる訓練は困難である。
本稿では, 船体が海上交通規則に違反する敵の訓練シナリオを生成する, ファルシフィケーション駆動型RL手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:56:31 GMT)
MIRANDA: short signatures from a leakage-free full-domain-hash scheme [10.2] 行列コードに基づくフルドメインハッシュシグネチャの最初のファミリーである$mathsfMiranda$を提示する。
私たちのトラップドアは非常にシンプルで汎用的で、マトリックスコードで提案すれば、他の多くの方法でインスタンス化できます。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:24:24 GMT)
Speculate Deep and Accurate: Lossless and Training-Free Acceleration for Offloaded LLMs via Substitute Speculative Decoding [10.2] SubSpecはパラメータのオフロードを高速化するプラグイン・アンド・プレイ方式である。
MT-BenchではQwen2.5 7Bの9.1倍のスピードアップ、人気の世代ベンチマークではQwen2.5 32Bの12.5倍のスピードアップを実現している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:16:04 GMT)
AutoBalance: An Automatic Balancing Framework for Training Physics-Informed Neural Networks [10.2] PINNは部分微分方程式を解くための強力で一般的なフレームワークを提供する。
PINNは、PDE残差や境界条件などの複数の損失項のバランスをとる。
既存の手法では、最適化前に勾配を操作することでこの問題に対処している。
本稿では,新しい"ポストコンビイン"トレーニングパラダイムであるAutoBalanceを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:13:03 GMT)
Efficient Universal Models for Medical Image Segmentation via Weakly Supervised In-Context Learning [10.1] インタラクティブ・インコンテキスト・ラーニング(ICL)のような医用画像セグメンテーションのためのユニバーサルモデルは、強力な一般化を提供するが、広範なアノテーションを必要とする。
Weakly Supervised In-Context Learning (WS-ICL)を提案する。
実験の結果、WS-ICLは通常のICLモデルに匹敵する性能をかなり低いアノテーションコストで達成した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:26:50 GMT)
CompassLLM: A Multi-Agent Approach toward Geo-Spatial Reasoning for Popular Path Query [10.1] 我々は、人気のあるパスクエリを解決するための新しいマルチエージェントフレームワークであるCompassLLMを紹介する。
CompassLLMは、人気のあるパスを特定するSEARCHステージと、過去の軌跡データに既存のパスがない場合に新しいパスを合成するGeneratorEステージという、2段階のパイプラインにエージェントを採用している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:28:52 GMT)
DACP: Domain-Adaptive Continual Pre-Training of Large Language Models for Phone Conversation Summarization [10.1] 大規模言語モデル (LLM) はテキスト要約において顕著な性能を達成した。
微調整は要約の品質を向上させることができるが、通常は高価で高品質なラベル付きデータに依存している。
我々は、下流の要約タスクにLLMを適用するためのスケーラブルで自己管理的なアプローチとして、継続事前学習について検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:55:53 GMT)
Token-based Audio Inpainting via Discrete Diffusion [10.1] 従来の拡散法では、欠落する領域が大きくなると性能が低下する。
事前学習した音声トークン化器からトークン化音楽表現に離散拡散を適用した最初の手法を提案する。
さらに、スムーズな時間的ダイナミクスを強制する微分に基づく正規化損失と、スパンベースの吸収遷移という2つのトレーニング手法を取り入れた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:01:13 GMT)
TokenWeave: Efficient Compute-Communication Overlap for Distributed LLM Inference [10.0] 大規模言語モデル(LLM)の分散推論は、NVLinkのような高速な相互接続を介して接続されたGPUでさえ、最大20%のオーバーヘッドを発生させることができる。
これらの課題に対処するため、TokenWeaveを紹介します。
私たちの評価では、レイテンシの1.29倍のスピードアップと、複数のモデルやワークロードで1.26倍のスループットを実現しています。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:49:25 GMT)
Diagnosing Moral Reasoning Acquisition in Language Models: Pragmatics and Generalization [10.0] 大規模言語モデル(LLM)は、道徳的認識を必要とするタスクで満足に機能しないことが多い。
現在の学習パラダイムは、LLMが十分な道徳的推論能力を得ることができるか?
性能改善は意味レベルの課題に類似したメカニズムを踏襲し,言論における潜在道徳の実践的性質の影響を受け続けることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:56:12 GMT)
Progressive Gaussian Transformer with Anisotropy-aware Sampling for Open Vocabulary Occupancy Prediction [10.0] オープンな3次元占有予測を可能にする革新的プログレッシブ・ガウス変換フレームワークPG-Occを提案する。
本フレームワークでは,3次元ガウス表現を段階的に強化し,細かなシーンの詳細を捉えるフィードフォワード戦略であるプログレッシブオンラインデシフィケーションを採用している。
PG-Occは従来よりも14.3%mIoUの改善が得られた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:34:48 GMT)
Hi-OSCAR: Hierarchical Open-set Classifier for Human Activity Recognition [9.9] アクティビティ認識のための階層的オープンセットであるHi-OS OpensetCARを提案する。
未知のアクティビティを同時に拒否しながら、最先端の精度で既知のアクティビティを識別することができる。
NFI_FAREDには、さまざまなコンテキストから19のアクティビティを実行する複数の被験者のデータが含まれている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:19:11 GMT)
Split Conformal Classification with Unsupervised Calibration [9.7] 分割共形予測法は、キャリブレーションサンプルを利用して、任意の予測規則をセット予測規則に変換する。
本稿では,分類タスクの教師なしキャリブレーションによる共形予測を分割する効果的な手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:22:41 GMT)
Automated Machine Learning for Unsupervised Tabular Tasks [9.7] LOTUSは、複数の教師なし機械学習タスクに対してモデル選択を実行する方法である。
我々は、LOTUSが複数の教師なしMLタスクのモデル選択に向けた、非常に有望な第一歩であることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:31:22 GMT)
ToolMem: Enhancing Multimodal Agents with Learnable Tool Capability Memory [9.6] エージェントが以前のインタラクションからツール機能の記憶を開発できるようにするツールMemを提案する。
各種テキスト生成および画像生成ニューラルツールの学習におけるToolMemの評価を行った。
ToolMemで強化されたエージェントは、テキストおよびマルチモーダル生成シナリオにおいて、ツールのパフォーマンスを14.8%、28.7%正確に予測する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:32:31 GMT)
Achieving Hyperbolic-Like Expressiveness with Arbitrary Euclidean Regions: A New Approach to Hierarchical Embeddings [9.6] 本稿では,任意の幾何学的領域を埋め込み表現として用いることを支援するフレキシブルユークリッドフレームワークRegDを提案する。
RegDは、領域間の深さに基づく相似性を導入し、双曲幾何学の重要な性質をエミュレートすることで、双曲的表現性を実現する。
実世界の多様なデータセットに対する実証的な評価は、最先端の手法よりも一貫した性能向上を示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:26:07 GMT)
Lossy Neural Compression for Geospatial Analytics: A Review [9.4] 地理空間データに適用したニューラル圧縮(NC)の展開を概観する。
自然画像と対比して,EOデータとESMデータの特徴について考察する。
本稿では,機械間通信における圧縮特徴表現の転送の可能性について詳述する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:10:10 GMT)
Locality-Sensitive Hashing-Based Efficient Point Transformer for Charged Particle Reconstruction [9.4] 本稿では,HEPTと代表GNNに基づくパイプラインの物理追跡性能の統一的,公正な評価を行う。
本稿では、HEPTを軽量デコーダで拡張してHEPTv2を導入し、クラスタリングステージを排除し、トラック割り当てを直接予測する。
TrackMLデータセットでは、最適化されたHEPTv2がA100上で約28msのイベントを達成し、競合的なトラッキング効率を維持している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:36:26 GMT)
Speculative Decoding and Beyond: An In-Depth Survey of Techniques [9.4] シーケンシャルな依存関係は、大規模な自己回帰モデルをデプロイする上で、根本的なボトルネックとなる。
ジェネレーション・リファインメント・フレームワークの最近の進歩は、このトレードオフを著しく緩和できることを示している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:43:07 GMT)
Traceability and Accountability in Role-Specialized Multi-Agent LLM Pipelines [9.3] 我々は、トレーサブルで説明可能なパイプライン、つまり明確な役割、構造化されたハンドオフ、保存されたレコードを持つシステムについて研究する。
3つのベンチマークで3つの最先端LCMの8つの構成を評価し、エラーの発生点、展開方法、修正方法について分析する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:26:44 GMT)
Inductive Learning for Possibilistic Logic Programs Under Stable Models [9.3] 安定モデル下での確率論的論理プログラム (possibilistic logic program) は、解集合プログラミング (ASP) の主要な変種である。
本稿では,背景プログラムと実例からposs- Programsを抽出する手法を提案する(目的のpossibilistic stable modelの一部)。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:32:10 GMT)
Are BabyLMs Deaf to Gricean Maxims? A Pragmatic Evaluation of Sample-efficient Language Models [9.3] 暗黙の意味は人間のコミュニケーションに不可欠なものであり、言語モデルがそれらを識別し解釈できることが不可欠である。
Grice (1975) は共同対話を導く会話の最大値のセットを提案し、話者がリテラル語以外の意味を表現するためにこれらの原則を意図的に違反する可能性があることを指摘した。
10M未満のトークンと100M未満のトークンで事前訓練された言語モデルが、最大暴力的発話と最大アドヒーリングを区別できるかどうかをテストするための新しいベンチマークを導入する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:14:11 GMT)
PIKA: Expert-Level Synthetic Datasets for Post-Training Alignment from Scratch [9.1] RLHF(Reinforcement Learning from Human Feedback)は、大規模言語モデル(LLM)の整合の基礎となっている。
現在のアプローチは、監督された微調整段階においても300万以上の例に依存していることが多い。
専門家レベルのアライメントデータセットの、データ効率のよいファミリであるPiKaを紹介します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:47:37 GMT)
Security-Robustness Trade-offs in Diffusion Steganography: A Comparative Analysis of Pixel-Space and VAE-Based Architectures [9.1] 本研究は,キャパシティ・アウェア・アダプティブ・最適化によってキャパシティ・アウェア・アダプティブ・最適化によって調整されたスケールファクタによって支配される近似ガウス写像に基づく効率的なフレームワークを導入する。
この枠組みを統合解析ツールとして用いて, 画素空間モデルにおけるステガノグラフィーの系統的比較分析を行い, VAEに基づく潜在空間システムと比較した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:53:52 GMT)
Evil twins are not that evil: Qualitative insights into machine-generated prompts [9.0] 我々は不透明な機械生成プロンプト(オートプロンプト)を初めて網羅的に分析した。
機械生成プロンプトは、しばしば理解不能で、生成に強く影響を及ぼす最後のトークンによって特徴づけられる。
人間の専門家は、後部のオートプロンプトの中で最も影響力のあるトークンを確実に特定することができ、これらのプロンプトが完全に不透明ではないことを示唆している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:07:59 GMT)
AgentDroid: A Multi-Agent Framework for Detecting Fraudulent Android Applications [9.0] AgentDroidは、マルチモーダル分析とマルチエージェントシステムに基づく、Androidの不正なアプリケーション検出のための新しいツールである。
Androidアプリケーションを処理し、分析のために一連のマルチモーダルデータを抽出する。
GPT-4oに基づくマルチエージェントツールは、91.7%の精度とF1スコア91.68%の精度を実現し、ベースライン法よりも優れていた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:51:54 GMT)
A Formal Framework for Fluency-based Multi-Reference Evaluation in Grammatical Error Correction [9.0] 既存のフレームワークは、主に編集ベースと英語中心であり、システムと参照編集の間の厳格なアライメントに依存している。
本稿では,複数の正当性修正に対する集合問題として$n$-gramの類似性を考慮し,テキスト拡散に基づくマルチ参照評価のための形式的フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:15:44 GMT)
FLEXITOKENS: Flexible Tokenization for Evolving Language Models [9.0] 言語モデル(LM)は、単純な微調整によって新しいデータ分布に適応することが困難である。
これは、そのサブワードトークンーザの剛性のためであり、通常は適応中に変化しない。
我々は、トークン化を適応させるために、学習可能なトークン化器を備えたバイトレベルのLMを開発する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:22:21 GMT)
Conjugate queries can help [8.8] 入力量子オラクル$U$に対して、指数関数的に多くのブラックボックスクエリで解決できない自然な問題を、$U$と$Udagger$に対して与える。
また、$U$と$Udagger$のみを問う敵に対してセキュアな量子コミットメントスキームを実証するが、その敵が$U*$を問うことができれば安全ではない。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:44:30 GMT)
DPMM-CFL: Clustered Federated Learning via Dirichlet Process Mixture Model Nonparametric Clustering [8.6] クラスタ化されたフェデレートラーニングは、非IIDクライアントの不均一性の下でのパフォーマンスを改善する。
ほとんどのCFL法は、プリオリを固定するためにクラスターKの数を必要とする。
本稿では,クラスタパラメータの分布に先立ってディリクレプロセス(DP)を配置するCFLアルゴリズムDPMM-CFLを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:27:08 GMT)
Evaluating and Learning Optimal Dynamic Treatment Regimes under Truncation by Death [8.6] そこで我々は,常に生存する値関数に着目した主成層法を提案する。
経験的検証と電子健康記録への応用は、パーソナライズされた治療最適化に有用であることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:54:43 GMT)
Breaking the Treewidth Barrier in Quantum Circuit Simulation with Decision Diagrams [8.6] この研究は、著者のサブセットによってCAV 2025で提案された決定図に基づくシミュレーション手法であるFeynmanDDを厳密に分析する。
任意の単一ビットゲートをアダマールゲートとTゲートの列に拡張するためにSolovay-Kitaevアルゴリズムを用いる場合、この手法は効率的であることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:58:58 GMT)
Can Vision Language Models Infer Human Gaze Direction? A Controlled Study [8.5] 他人が見ているものを推測する能力は、自然な人間とAIの相互作用を支える心の理論の重要な要素である。
111の視覚言語モデル(VLM)と人間の参加者にこのスキルを特徴付ける。
その結果、111個のVLMのうち94個のVLMはランダムな推測ほど良くないことがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:27:16 GMT)
XRPO: Pushing the limits of GRPO with Targeted Exploration and Exploitation [8.5] GRPOのような強化学習アルゴリズムは、大規模言語モデル(LLM)推論の最近の進歩を促している。
既存のアプローチは、挑戦的なプロンプトに対する限られた探索に悩まされ、情報的なフィードバック信号が未公開のまま残されている。
本稿では,eXplore-eXploit GRPOについて述べる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:53:56 GMT)
Provably Accelerated Imaging with Restarted Inertia and Score-based Image Priors [8.4] 我々は、レギュラー化の原則的拡張として、Score-based Priors(RISP)を用いたリスタート慣性(Restarted Inertia)を提案する。
RISPは、高速収束のために再起動する慣性を導入し、高品質な再構成のためのスコアベースイメージの先行を可能にする。
画像の凸性を必要とせずに、RISPがREDよりも高速な静止点収束率を得ることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:16:27 GMT)
Nonparametric Bellman Mappings for Value Iteration in Distributed Reinforcement Learning [8.3] 本稿では,分散強化学習(DRL)における値反復(VI)のためのベルマン写像(B-Maps)を提案する。
各エージェントは、そのプライベートデータから非パラメトリックなBマップを構築し、再生されたカーネルヒルベルト空間で表されるQ関数を操作する。
詳細な性能解析により,提案するDRLフレームワークは集中ノードの性能を効果的に近似することを示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:54:52 GMT)
Machines in the Crowd? Measuring the Footprint of Machine-Generated Text on Reddit [8.3] Reddit 上で MGT (Machine-Generated Text) の大規模評価を行った。
MGT検出のための最先端統計手法を用いて,51個のサブレディットにわたる2年間の活動(2022-2024)を分析した。
MGTの有病率に関する非常に保守的な推定は、合成テキストがRedditにわずかに存在していることを示しているが、一部のコミュニティでは最大9%に達する可能性がある。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:57:45 GMT)
Incremental Summarization for Customer Support via Progressive Note-Taking and Agent Feedback [8.3] 本稿では,顧客支援エージェントを対象とした漸進的な要約システムを提案する。
会話中に簡潔な弾丸音をいつ生成するかをインテリジェントに決定する。
エージェントのコンテキストスイッチングの労力を削減し、冗長性をレビューする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:05:58 GMT)
Can We Hide Machines in the Crowd? Quantifying Equivalence in LLM-in-the-loop Annotation Tasks [8.2] 我々は、人間とLLMの両方によるラベル付け決定が、個人間で統計的に評価される方法について検討することを目指している。
Krippendorffの$alpha$, paired bootstrapping, and the Two One-Sided t-Tests (TOST) equivalence test procedureに基づく統計的評価法を開発した。
このアプローチをMovieLens 100K と PolitiFact という2つのデータセットに適用すると、LCM が前者の人間のアノテーションと統計的に区別できないことが分かる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:17:33 GMT)
PolyKAN: A Polyhedral Analysis Framework for Provable and Approximately Optimal KAN Compression [8.2] Kolmogorov-Arnold Networks (KAN) は、従来のマルチ層パーセプトロン(MLP)に代わる有望な代替品として登場した。
本稿では, モデルサイズ削減と近似誤差の両面を形式的に保証する, カン圧縮のための新しい理論フレームワークであるPolyKANを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:27:57 GMT)
Context Matters: Learning Global Semantics via Object-Centric Representation [8.2] ビジョンモデルは、コンテキスト内学習において同等の進歩を見せていない。
このギャップは、現在の視覚変換器(ViT)トレーニングスキームにおける意味的および文脈的ガイダンスの欠如に起因する可能性がある、と我々は主張する。
対象」を「単語」の視覚的等価性として直接モデル化し、そのモデルに視覚要素間のグローバルな文脈と意味を学習させることを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:28:20 GMT)
Efficient Discriminative Joint Encoders for Large Scale Vision-Language Reranking [8.2] マルチモーダル検索はまだCLIPのような埋め込みベースのモデルに頼っている。
共同エンコーダのリランカが標準であるテキスト検索とは異なり、同等の視覚言語リランカはほとんど欠落している。
本稿では,視覚トークンをオフラインでプリコンプリートし,軽量アテンションベースのアダプタで圧縮する,効率的な識別関節であるEDJEを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:46:09 GMT)
From Restless to Contextual: A Thresholding Bandit Reformulation For Finite-horizon Performance [8.2] 我々は,オンラインRBの改革を,文脈的盗賊の根源として導入する。
単純化された有限ホライゾン設定に対するオラクルポリシーの最初の漸近的でない最適性を証明する。
本研究は, 有限水平RBにおける実践的, サンプル効率の学習を実現するための新しい経路を提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:14:46 GMT)
Efficient reductions from a Gaussian source with applications to statistical-computational tradeoffs [8.2] 我々はこの手法を利用して、平均ケースの複雑さにおいて広く信じられている予想の下で、いくつかの正準高次元統計モデルに対して、還元に基づく計算下界を確立する。
ガウス雑音を持つスパイクテンソルPCAの計算下界は、クラス内の他のガウス雑音分布にまで拡張可能であることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:16:36 GMT)
Open ASR Leaderboard: Towards Reproducible and Transparent Multilingual and Long-Form Speech Recognition Evaluation [8.0] 我々は、11データセットにわたる60以上のオープンソースおよびプロプライエタリシステムを比較した、完全に再現可能なベンチマークであるOpen ASR Leaderboardを提示する。
We standardize text and report both word error rate (WER) and real-time efficiency factor (RTFx)。
英語の書き起こしでは、コンバータエンコーダとデコーダのペアは、微調整された平均的なWERを提供するが、TDTデコーダは平均的なWERを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:44:51 GMT)
The Alignment Auditor: A Bayesian Framework for Verifying and Refining LLM Objectives [8.0] 逆強化学習は、行動から報酬関数を推測することができる。
既存のアプローチは、単一で自信過剰な報酬推定を生成するか、タスクの基本的な曖昧さに対処できないかのいずれかです。
本稿では,簡単な推定タスクから総合的な検証プロセスへ報酬推論を再構成する,原則的監査フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:07:14 GMT)
A Minrank-based Encryption Scheme à la Alekhnovich-Regev [8.0] 我々は,MinRankのわずかな変動の硬さにのみ基づくセキュリティを有するAlekhnovichとRegevの暗号化方式の適応について述べる。
我々のスキームはフロドケムよりもわずかに効率的ではないが、アレクノヴィッチやレゲフの当初のスキームよりもはるかに効率的である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:11:04 GMT)
DeRainMamba: A Frequency-Aware State Space Model with Detail Enhancement for Image Deraining [7.9] 周波数対応状態空間モジュール(FASSM)と多方向知覚畳み込み(MDPConv)を統合したDeRainMambaを提案する。
4つの公開ベンチマークでの大規模な実験により、DeRainMambaはPSNRとSSIMの最先端手法を一貫して上回っていることが示された。
その結果, 単一画像デライニングのための状態空間フレームワークにおける周波数領域モデリングと空間的詳細化の併用の有効性が検証された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:05:11 GMT)
Are LLMs Reliable Rankers? Rank Manipulation via Two-Stage Token Optimization [7.8] 本稿では,2段階のトークン最適化手法であるRop Anything First(RAF)を提案する。
RAFはテキストの摂動を簡潔に行い、大きな言語モデルでターゲットアイテムを一貫して推進する。
RAFは、ランキングの有効性の最大化と言語的自然性の維持という2つの目的によって導かれる、トークン・バイ・トークンのランク付けプロンプトを生成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:40:40 GMT)
Modeling Developer Burnout with GenAI Adoption [7.8] 我々は、GenAIの採用と開発者のバーンアウトとの関係について検討する。
最初に442人の開発者を対象に、さまざまな組織、役割、経験レベルを調査しました。
以上の結果から,GenAIの採用は雇用需要の増加によるバーンアウトの増大を招き,雇用資源の増大とGenAIに対する肯定的な認識がこれらの効果を緩和することが示された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:35:38 GMT)
TFM Dataset: A Novel Multi-task Dataset and Integrated Pipeline for Automated Tear Film Break-Up Segmentation [7.7] 本稿では,Tear Film Multi-task(TFM)データセットについて紹介する。
まず,新しい,効率的なベースラインセグメンテーションモデルTF-Netを提案する。
さらに、TF-Netと最先端の医療画像セグメンテーションモデルを比較して、TFMセグメンテーションサブセットのベンチマーク性能を確立した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:45:51 GMT)
Bridged Clustering for Representation Learning: Semi-Supervised Sparse Bridging [7.6] 我々はBridged Clusteringを紹介した。Bridged Clusteringは、未実装の入力$X$と出力$Y$データセットから予測子を学習する半教師付きフレームワークである。
我々のメソッドはまず最初に$X$と$Y$を独立にクラスタし、その後、わずかにペア化された例を使ってクラスタ間のスパースで解釈可能なブリッジを学習する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:20:49 GMT)
Generating Surface for Text-to-3D using 2D Gaussian Splatting [7.6] そこで本研究では,サーベイルで表される3次元物体の表面を生成することに焦点を当てたDirectGaussianという新しい手法を提案する。
DirectGaussianでは条件付きテキスト生成モデルを使用し、3次元オブジェクトの表面を2次元ガウススプラッティングで描画する。
我々のフレームワークは多種多様な高忠実な3Dコンテンツ作成を実現することができる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:54:57 GMT)
Quantum Grid Path Planning Using Parallel QAOA Circuits Based on Minimum Energy Principle [7.5] 本研究では、並列量子近似最適化(QAOA)アーキテクチャに基づく量子パス計画ソリューションの構築を試みる。
その結果, 適切なフィルタパラメータを設定することで, 発生確率が極めて低い位置点に対応する量子状態を効果的にフィルタリングできることが示唆された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:09:52 GMT)
Distilling Lightweight Language Models for C/C++ Vulnerabilities [7.5] FineSecは、知識蒸留を通じて大規模言語モデルを活用する新しいフレームワークで、C/C++における効率的かつ正確な脆弱性識別を可能にする。
データ準備、トレーニング、評価、継続的学習を統合されたシングルタスクワークフローに統合することで、FineSecは合理化されたアプローチを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:58:51 GMT)
ProCut: LLM Prompt Compression via Attribution Estimation [7.4] 属性推定(ProCut)によるPrompt圧縮について紹介する。
ProCutは柔軟性があり、LLMに依存しない、トレーニングなしのフレームワークで、帰属分析を通じてプロンプトを圧縮する。
ProCutは,タスク性能の維持や改善を図りながら,大幅なサイズ削減(運用時のトークンの78%削減)を実現している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:59:55 GMT)
Root Cause Analysis of Outliers in Unknown Cyclic Graphs [7.3] 摂動が十分に強いと仮定して、潜在的な根本原因の短いリストを特定できることを示す。
このショートリストは、真の根本原因と、その親が根本原因のサイクルに横たわる原因から成り立っている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:19:01 GMT)
GPS-MTM: Capturing Pattern of Normalcy in GPS-Trajectories with self-supervised learning [7.2] 大規模モビリティデータの基礎モデルであるGPSMasked Trajectory Transformer(GPS-MTM)を紹介する。
GPS-MTMはモビリティを2つの相補的なモードに分解する:状態(興味のあるカテゴリー)と行動(エージェント遷移)
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:21:22 GMT)
Introspection in Learned Semantic Scene Graph Localisation [7.2] 本研究は,セマンティックスが自己監督型コントラスト型セマンティックローカライゼーションフレームワークにおいて,セマンティックスがローカライズ性能とロバスト性にどのように影響するかを考察する。
本研究では, モデルが環境騒音をフィルタし, 特異なランドマークを日常的に乱雑に優先するかどうかを調査するために, 徹底的なポストホックイントロスペクション分析を行う。
以上の結果から,このモデルでは位置定義に関する意味論的に健全な関係を学習し,視覚的・構造的な難易度で説明可能な登録を可能にすることが示唆された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:21:45 GMT)
Nearest Neighbor CCP-Based Molecular Sequence Analysis [7.1] Corelated Clustering and Projection (CCP) は生物学的シークエンシングデータに有効な方法として提案されている。
分子シークエンスデータを効率的に前処理するためのCCP-NN(Nearest Neighbor Correlated Clustering and Projection)に基づく手法を提案する。
以上の結果から,CCP-NNは分類タスクの精度を大幅に向上し,計算実行時においてCCPを著しく上回ることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:09:05 GMT)
StruSR: Structure-Aware Symbolic Regression with Physics-Informed Taylor Guidance [7.1] StruSRは構造対応のシンボリック回帰フレームワークである。
トレーニングされた物理インフォームドニューラルネットワークを用いて時系列データから構造化された物理先行情報を抽出する。
ベンチマークPDEシステムの実験により、StruSRは収束速度、構造的忠実度、表現解釈可能性を改善した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:37:04 GMT)
On Quantum Computation Using Bias-Preserving Gates [7.0] 計算がZバイアス(またはXバイアス)をノイズに維持するゲートのみを使用するようにすることは有用である。
任意のZバイアス保存ゲートは、集合 X,R_z(theta),CNOT,CCNOT のゲートのみを用いて任意に近似できることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:49:49 GMT)
Foundations of LLM Knowledge Materialization: Termination, Reproducibility, Robustness [7.0] ミニGPTKBを用いてLarge Language Models (LLM)知識の実体化を体系的に研究する。
我々は、収量、語彙的類似性、意味的類似性という3つのカテゴリのメトリクスの終端、堅牢性、およびメトリクスを分析します。
以上の結果から, (i) モデルに依存しながら高い終端率, (ii) 混合, (iii) 摂動型によって異なる, 種子や温度は高い, 言語やモデルでは低い,といった結果が得られた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:03:58 GMT)
Automating RT Planning at Scale: High Quality Data For AI Training [6.9] 高品質な処理計画を生成するスケーラブルなソリューションであるAIRTP(Automated Iterative RT Planning)システムを紹介した。
当社のAIRTPパイプラインは,OAR(Organ-at-risk Contouring),ヘルパー構造生成,ビーム設定,最適化,計画品質改善など,臨床ガイドラインに準拠し,重要なステップを自動化します。
計画品質の比較分析により、自動パイプラインが手作業で生成されたものと同等の品質の処理計画を生成することが明らかになった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:49:31 GMT)
Uncertainty-Aware Remaining Lifespan Prediction from Images [6.8] 本稿では,事前学習した視覚トランスフォーマーの基礎モデルを用いて,顔画像と全身画像から残存寿命を推定する手法を提案する。
我々のアプローチは、確立されたデータセットで7.41年、さらに2つの新しい高品質データセットで4.91年と4.99年、最先端の平均絶対誤差(MAE)を達成する。
臨床展開を意図してはいないが、これらの結果は画像から医療関連信号を抽出する可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:18:30 GMT)
RedTWIZ: Diverse LLM Red Teaming via Adaptive Attack Planning [6.8] RedTWIZは適応的で多様なマルチターンレッドチームリングフレームワークである。
AI支援ソフトウェア開発における大規模言語モデルの堅牢性を評価するように設計されている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:18:42 GMT)
Modeling COVID-19 Dynamics in German States Using Physics-Informed Neural Networks [6.8] 我々は,ロバート・コッホ研究所(RKI)の感染データを用いて,SIRモデルの逆問題を解決するために物理情報ニューラルネットワーク(PINN)を用いた。
私たちの主な貢献は、3年間のドイツ全州における新型コロナウイルスの動態の詳細な時間的分析です。
その結果, 地域間での感染行動の変動が強く, 予防接種摂取と主要なパンデミックフェーズに関連する時間的パターンとの相関が明らかとなった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:59:39 GMT)
LeMAJ (Legal LLM-as-a-Judge): Bridging Legal Reasoning and LLM Evaluation [6.8] 本稿では,弁護士が法的回答をどのように評価するかを反映した,新たな基準フリー評価手法を提案する。
提案手法は,人間の専門家による評価とより密接に関連し,アノテーション間合意の改善に有効であることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:10:47 GMT)
Label Semantics for Robust Hyperspectral Image Classification [6.6] ハイパースペクトルイメージング(HSI)分類は、農業、環境モニタリング、医学、材料科学などの様々な分野において重要なツールである。
高品質なトレーニングサンプルの不足とスペクトルデータの高次元性のため、HSI分類モデルは過度に適合する傾向にあり、精度と計算複雑性のバランスをとることの難しさに直面することが多い。
本研究では,HSI分類モデルのトレーニングを補完するために,文脈的,クラス固有のテキスト記述を用いた汎用セマンティックスペクトル・空間融合ネットワーク(S3FN)を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:13:11 GMT)
Dynamic Mixture-of-Experts for Visual Autoregressive Model [6.5] 本稿では,Visual Autoregressive Modelsに統合された動的Mixture-of-Expertsルータを提案する。
FLOPは20%減少し,推測は11%高速化し,高密度ベースラインで得られる画質と一致した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:57:21 GMT)
How Language Models Conflate Logical Validity with Plausibility: A Representational Analysis of Content Effects [6.5] 人間と大規模言語モデル(LLM)は、内容効果を示す: 推論問題の意味的内容の妥当性が、その論理的妥当性に関する判断に影響を与えるバイアス。
両概念が線形に表現され、表現幾何学に強く整合していることが示され、モデルが妥当性と妥当性を詳述する。
ステアリングベクトルを用いて、確率ベクトルは因果バイアスの妥当性判定が可能であり、その逆も可能であり、これらの2つの概念間のアライメントの程度は、モデル間での行動内容の影響の大きさを予測することを実証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:48:08 GMT)
A Duality Theorem for Classical-Quantum States with Applications to Complete Relational Program Logics [6.4] 可算確率分布の双対定理と有限次元量子状態を用いて古典量子プログラムのリレーショナルプログラム論理を構築する。
古典量子プログラムに対して$mathsfcqOTL$と呼ばれる新しいリレーショナルプログラム論理の健全性と完全性を確立する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:19:03 GMT)
360-LLaMA-Factory: Plug & Play Sequence Parallelism for Long Post-Training [6.4] 360-LLaMA-Factoryは広く認識されており、Light-R1 arXiv:2503.10460、TinyR1 arXiv:2503.04872、Kaggle AIMO数学モデル、大企業のトレーニングフレームワークで使用されている。
この技術的レポートは、360-LLaMA-Factoryの異なるシーケンス並列モードについて深く掘り下げ、実装の洞察について論じます。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:32:07 GMT)
Minimizing the Value-at-Risk of Loan Portfolio via Deep Neural Networks [6.4] この問題に対処するために,低自由度深層ニューラルネットワークモデルであるDeNNと高自由度モデルであるDSNNを提案する。
特に、私たちのモデルはローンのデフォルトの確率だけでなく、デフォルトの時間も予測します。
実験により、ベンチマークと比較すると、両モデルともポートフォリオのVaRを異なる信頼レベルで大幅に削減できることが示された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:45:12 GMT)
Towards Reliable Retrieval in RAG Systems for Large Legal Datasets [6.4] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚を緩和するための有望なアプローチである
これは、構造的に類似したドキュメントの大規模なデータベースが、しばしば検索システムに障害を引き起こす、法的領域において特に困難である。
文書レベルの合成要約で各テキストチャンクを拡大する,単純で効率的な手法について検討する。
我々の研究は、この実用的でスケーラブルで、容易に統合可能な手法が、大規模法的文書データセットに適用した場合、RAGシステムの信頼性を高める証拠を提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:22:20 GMT)
Do LLMs Overthink Basic Math Reasoning? Benchmarking the Accuracy-Efficiency Tradeoff in Language Models [6.3] 大規模言語モデル (LLM) は複雑な数学的ベンチマークでは優れた性能を得るが、基本的な数学的推論では失敗することがある。
本稿では,正確さと過度に考えることの基本的なトレードオフに焦点を当てる。
本研究は,総合モデル評価のための高精度とトークン効率を組み合わせた調和平均計量であるOverthinking Scoreを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:20:50 GMT)
Adapting Quantum Machine Learning for Energy Dissociation of Bonds [6.2] ボンドエネルギー予測のための量子および古典的機械学習モデルの比較ベンチマークを示す。
トップパフォーマンス量子モデル(QCNN, QRF)は、古典的なアンサンブルやディープネットワークの予測精度と堅牢性に一致する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:32:26 GMT)
Scalable Policy-Based RL Algorithms for POMDPs [6.2] 我々は、POMDPモデルを有限状態マルコフ決定プロセス(MDP)に近似することにより、部分観測可能強化学習(PORL)問題を解決するアプローチを検討する。
近似誤差はこの履歴の長さとともに指数関数的に減少することを示す。
我々の知識を最大限に活用するために、我々の有限時間境界は、真の力学がマルコフ的でない設定に標準的TD学習を適用する際に導入された誤差を明示的に定量化する最初のものである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:33:38 GMT)
Inoculation Prompting: Instructing LLMs to misbehave at train-time improves test-time alignment [6.2] 接種プロンプティングは、トレーニングプロンプトを明示的に要求することで、望ましくない行動の学習を防止する。
IPは所望の能力の学習を大幅に減らすことなく、望ましくない行動の学習を減らす。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:13:07 GMT)
Probing Social Identity Bias in Chinese LLMs with Gendered Pronouns and Social Groups [6.1] 大規模言語モデル(LLM)は、ユーザ向けアプリケーションにますますデプロイされ、社会的バイアスを反映し増幅する可能性への懸念が高まっている。
中国語LLMにおける社会的アイデンティティ・フレーミングについて,マンダリン固有のプロンプトを用いて検討し,イングループ(We)とアウトグループ(They)のフレーミングに対する反応を評価し,その設定を中国語の文脈で240グループまで拡張した。
モデル全体では, 人工的なプロンプトに限らず, 自然主義的な対話にも現れる, 系統的な内集団陽性傾向と外集団陰性傾向を観察する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:00:12 GMT)
Oops!... I did it again. Conclusion (In-)Stability in Quantitative Empirical Software Engineering: A Large-Scale Analysis [5.9] ソフトウェアリポジトリのマイニングは、ソフトウェアプロジェクトの進化に関する洞察を得るための一般的な方法である。
本研究では、進化的ソフトウェア解析のための複雑なツールパイプラインの妥当性に対するいくつかの脅威について検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:11:39 GMT)
DWTGS: Rethinking Frequency Regularization for Sparse-view 3D Gaussian Splatting [5.9] Sparse-view 3D Gaussian Splatting (3DGS) は、高品質なノベルビューを再構築する上で重要な課題である。
DWTGSは,ウェーブレット空間の損失を利用して周波数正規化を再考するフレームワークであり,空間的監視を付加する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:29:45 GMT)
Jailbreak Attack Initializations as Extractors of Compliance Directions [5.9] 安全に配慮したLSMは、コンプライアンスまたは拒絶のプロンプトに応答する。
近年の研究では、他のプロンプトからの自己伝達による攻撃の初期化が、その性能を著しく向上させることが示されている。
コンプライアンスの方向性に沿って、未確認のプロンプトをプロジェクションすることを目的としたフレームワークであるCRIを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:28:04 GMT)
Mitigating Cross-Modal Distraction and Ensuring Geometric Feasibility via Affordance-Guided and Self-Consistent MLLMs for Task Planning in Instruction-Following Manipulation [5.9] 食品準備シナリオに基づいた新しいベンチマークである textbfQuARC (Quantity, Analysis, Relative positioning, Collision) を導入する。
現在のMLLMの2つの大きな制限に対処する。
提案手法はベンチマークで76.7%の成功率を実現し,ViLaベースラインを著しく上回った。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:30:23 GMT)
An empirical study on declined proposals: why are these proposals declined? [5.9] 本研究では,Go言語における提案の特徴と結果について検討する。
提案は受け入れられるよりも拒否されることが多く、解決には通常1ヶ月以上かかります。
重複、限られたユースケース、プロジェクト原則違反など、提案が下降する9つの主要な理由を特定します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:09:51 GMT)
Position: AI Will Transform Neuropsychology Through Mental Health Digital Twins for Dynamic Mental Health Care, Especially for ADHD [5.8] 我々は、静的なメンタルヘルス診断アセスメントから、継続的人工知能(AI)によるアセスメントへの移行を提唱する。
本研究では,注意欠陥・多動性障害(ADHD)を事例として考察する。
本稿では、メンタルヘルス・デジタル・ツイン(MHDT)を、パーソナライズされたメンタルヘルスケアの変革的枠組みとして用いることを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:06:15 GMT)
Multi-Dimensional Autoscaling of Stream Processing Services on Edge Devices [5.8] 我々は多次元オートスケーリングプラットフォーム(MUDAP)を導入し、サービスレベルとリソースレベルの両方の細粒度の垂直スケーリングをサポートする。
本稿では、サービス間の実行を最適化するために、構造知識の回帰分析(RASK)に基づくスケーリングエージェントを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:51:50 GMT)
Human-aligned AI Model Cards with Weighted Hierarchy Architecture [5.8] LLM(Large Language Models)の普及は、専門的なドメイン特化モデルのエコシステムの肥大化につながった。
Model CardsやFactSheetsといった既存のドキュメントフレームワークは、レポートの標準化を試みるが、多くの場合は静的で、質的である。
我々は、静的開示からアクション可能な人間対応のドキュメントに移行する新しいアプローチである包括的責任AIモデルカードフレームワーク(CRAI-MCF)を紹介します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:13:18 GMT)
AutoRev: Multi-Modal Graph Retrieval for Automated Peer-Review Generation [5.7] AutoRevは自動ピアレビューシステムで、レビュアーと著者の両方に実用的な高品質のフィードバックを提供するように設計されている。
ドキュメントをグラフとしてモデル化することで、AutoRevは、最も関連する情報を効果的に取得する。
AutoRevはピアレビューワークフローを合理化し、課題を緩和し、スケーラブルで高品質な学術出版を可能にする強力なツールだと考えています。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:20:40 GMT)
Simulation of Quantum Repeater Networks under Decoherence and Purification Constraints [5.7] 長距離量子通信は信頼性の高い絡み合い分布を必要とする。
Barrett-Kokのようなプロトコルによる直接生成は、距離のある成功確率を指数関数的に減少させる。
量子リピータは、チャネルをセグメント化し、絡み合いの生成、スワップ、精製を組み合わせることでこの問題に対処する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:19:26 GMT)
HEMERA: A Human-Explainable Transformer Model for Estimating Lung Cancer Risk using GWAS Data [5.7] 肺がん (Lung cancer, LLC) は、アメリカ合衆国で3番目に多いがんであり、がん死の原因となっている。
遺伝子ワイド・アソシエーション研究(GWAS)によって同定された遺伝子バイオマーカーは、LCリスクを評価するための有望なツールである。
本稿では,単一ヌクレオチド多型(SNP)のGWASデータにトランスフォーマベースディープラーニングを応用し,LCリスクを予測する新しいフレームワークであるHEMERAを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:23:32 GMT)
AI-Driven Forecasting and Monitoring of Urban Water System [5.7] 地下水と排水パイプラインは市の運営に欠かせないが、漏れや浸透などの異常に悩まされている。
近年、人工知能は急速に進歩し、都市インフラにもますます応用されている。
地下パイプラインにおける漏洩検知の課題に対処する,統合型AIおよびリモートセンサフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:28:38 GMT)
GRPO is Secretly a Process Reward Model [5.6] GRPO RLアルゴリズムは実世界の条件下で非自明なプロセス報酬モデルを生成する。
この欠陥を軽減するために,アルゴリズムの簡単な修正を提案する。
この結果から,GRPO の高コストで明示的な PRM の利点を疑問視する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:13:42 GMT)
Adaptive Stain Normalization for Cross-Domain Medical Histology [5.6] ディープラーニングでは、染色プロトコルと撮像条件の違いは、大きな彩色性をもたらす可能性がある。
本稿では,物体検出や分類などの下流タスクに対して,任意のバックボーンネットワークと統合可能なトレーニング可能な色正規化モデルを提案する。
本手法は,多くの最先端の染色正規化法より優れる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:53:28 GMT)
AbsoluteNet: A Deep Learning Neural Network to Classify Cerebral Hemodynamic Responses of Auditory Processing [5.6] この研究は、fNIRSを使って聴覚イベント関連応答を分類するために設計された新しいディープラーニングアーキテクチャであるAbsoluteNetを紹介する。
このネットワークは、畳み込みとカスタマイズされたアクティベーション関数の原理に基づいて構築されている。
その結果、AbsoluteNetは既存のモデルを上回っ、87.0%の精度、84.8%の感度、89.2%の特異性に達した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:37:01 GMT)
A Digital Twin Framework for Metamorphic Testing of Autonomous Driving Systems Using Generative Model [5.4] 本稿では,デジタルツイン駆動メタモルフィックテストフレームワークを提案する。
私たちは、自動運転システムとその運用環境の仮想レプリカを作成します。
デジタルツイン技術と、安定拡散のようなAIに基づく画像生成モデルを組み合わせることで、本手法は現実的な運転シーンを体系的に生成することを可能にする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:27:39 GMT)
Vectorized FlashAttention with Low-cost Exponential Computation in RISC-V Vector Processors [5.4] この研究は、ベクトルプロセッサにおけるFlashAttentionアルゴリズムを用いたアテンションカーネルの高速化に焦点を当てている。
浮動小数点算術における指数関数の低コスト近似を利用して指数関数の計算コストを削減する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:55:32 GMT)
GenFacts-Generative Counterfactual Explanations for Multi-Variate Time Series [5.4] 提案するTextbfGenFactsは、可塑性および作用可能な対実的説明を生成するための新しい生成フレームワークである。
我々は,レーダジェスチャ認識に関するGenFactsを産業的ユースケースとして評価し,手書き文字トラジェクトリを直感的なベンチマークとして検討した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:16:15 GMT)
Bayesian Portfolio Optimization by Predictive Synthesis [5.3] 既存のポートフォリオ最適化手法の多くは、ポートフォリオを構成する資産のリターンの分配に関する情報を必要とする。
流通情報を推定するための様々な手法が提案されているが、その正確性は金融市場の不確実性に大きく依存している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:18:11 GMT)
Adoption of Watermarking for Generative AI Systems in Practice and Implications under the new EU AI Act [5.2] 現在、適切な透かしとディープフェイクラベリングを実装しているAIイメージジェネレータはごく少数である、と我々は主張する。
我々は、これらの法的に義務付けられた手法の実装をどのように改善するかについて、幅広い道程を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:54:06 GMT)
Through the Perspective of LiDAR: A Feature-Enriched and Uncertainty-Aware Annotation Pipeline for Terrestrial Point Cloud Segmentation [5.2] 地上レーザー走査(TLS)点雲の正確なセマンティックセマンティックセマンティクスは、高価な手動アノテーションによって制限される。
球面投影,特徴強調,アンサンブル学習,ターゲットアノテーションを統合した半自動不確実性対応パイプラインを提案する。
提案手法は,2次元球面格子を投影し,マルチソース特徴量で画素を拡大し,擬似ラベルと不確実性マップを生成するためにセグメンテーションネットワークのアンサンブルを訓練する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:25:59 GMT)
EBGAN-MDN: An Energy-Based Adversarial Framework for Multi-Modal Behavior Cloning [5.1] 本研究では,エネルギーベースモデル,混合密度ネットワーク(MDN),敵対的トレーニングを統合したEBGAN-MDNを提案する。
合成およびロボットベンチマークの実験は優れた性能を示し、EBGAN-MDNをマルチモーダル学習タスクの効率的かつ効率的なソリューションとして確立した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:18:01 GMT)
KunServe: Parameter-centric Memory Management for Efficient Memory Overloading Handling in LLM Serving [5.1] 本稿では、複製されたパラメータを即座にフリーな要求メモリに選択的にドロップすることで、スロットリングを扱うための最初のパラメータ中心のアプローチを提案する。
Llumnix, vLLM, InferCept などの最先端システムと比較して,sys はスロットリング中のリクエストのテールTTFTを最大72.2倍削減することを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:01:01 GMT)
Building an Open AIBOM Standard in the Wild [5.1] 本稿では、AI Bill of Materials AIBOM仕様の開発に関する詳細な経験報告を示す。
90以上のコントリビュータと構造化されたARサイクルを含む、グローバルでマルチステークホルダの取り組みを文書化しています。
その結果、仕様は4つの補完的なアプローチによって検証された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:32:31 GMT)
Benchmarking Fake Voice Detection in the Fake Voice Generation Arms Race [5.1] 偽音声検出装置の大規模クロスドメイン評価を初めて行った。
我々の研究は、現在の偽音声検出システムにおける重大なセキュリティ脆弱性を明らかにした。
本稿では,多種多様かつしばしば矛盾する評価基準を統合する統一的で効果的な指標を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:52:06 GMT)
Targeted Digital Twin via Flow Map Learning and Its Application to Fluid Dynamics [5.0] 完全デジタルツイン(DT)における興味量(QoI)のダイナミクスを直接モデル化するターゲットデジタルツイン(tDT)を構築するためのフレームワークを提案する。
FMLベースのtDTは、完全なDTシステムのシミュレーションを必要とせずに、QoIの長期的ダイナミクスを効率的に予測し、分析することができる。
数値計算の結果, tDTは全流シミュレーションを完全に回避しながら, 力の長期予測を精度良く行うことがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:03:38 GMT)
ConCuR: Conciseness Makes State-of-the-Art Kernel Generation [5.0] カーネル生成の主な課題は、高品質なデータの不足である。
我々は,高品質なカーネルを推論トレースで生成し,キュレートするパイプラインを開発した。
本稿では,カーネル生成タスクの難易度を評価する指標として,平均推論長が有効であることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:41:15 GMT)
TextMine: Data, Evaluation Framework and Ontology-guided LLM Pipeline for Humanitarian Mine Action [5.0] HMA(Humanitarian Mine Action)は、紛争地域からの地雷の検出と除去の課題に対処する。
HMA機関が生み出す生命維持活動の知識の多くは、非構造的な報告書に埋もれている。
この問題に対処するために、最初のデータセット、評価フレームワーク、オントロジー誘導型大規模言語モデル(LLM)パイプラインであるTextMineを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:00:00 GMT)
OBS-Diff: Accurate Pruning For Diffusion Models in One-Shot [5.0] OBS-Diffは、大規模テキスト・画像拡散モデルの正確かつトレーニング不要な圧縮を可能にする、新しいワンショットプルーニングフレームワークである。
広汎な実験により、OBS-Diffは拡散モデルに対する最先端のワンショットプルーニングを実現し、視覚的品質の最小限の劣化を伴う推論加速を実現する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:19:15 GMT)
Distributional Semantics Tracing: A Framework for Explaining Hallucinations in Large Language Models [4.9] 大規模言語モデル(LLM)は、事実的に誤った文を生成する幻覚の傾向にある。
この研究は、3つの主要な貢献を通じて、この障害モードの本質的、アーキテクチャ的起源について調査する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:51:54 GMT)
HoPE: Hybrid of Position Embedding for Long Context Vision-Language Models [4.9] VLM(Vision-Language Models)は、マルチモーダルタスクにおいて大きな進歩を遂げた。
しかし、長文のシナリオではパフォーマンスが劣化することが多い。
本稿では,VLMの長文処理能力を改善するために,位置埋め込みのハイブリッドであるHoPEを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:28:29 GMT)
A Minimalist Bayesian Framework for Stochastic Optimization [4.9] 最適位置のような関心の構成要素のみに先立つ最小主義のベイズ的枠組みを導入する。
直接インスタンス化として,Minimalist Thompson Smpling (MINTS)アルゴリズムを開発した。
連続武装のリプシッツ・バンディットや動的価格など構造的な問題に対応している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:52:40 GMT)
A Dual-Agent Adversarial Framework for Robust Generalization in Deep Reinforcement Learning [4.9] 両エージェント対応型政策学習フレームワークを提案する。
このフレームワークは、エージェントが人間の事前知識を導入することなく、基礎となるセマンティクスを自発的に学習することを可能にする。
実験により, 両エージェントの一般化性能が著しく向上することが確認された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:19:57 GMT)
Empirical Comparison of Membership Inference Attacks in Deep Transfer Learning [4.9] メンバーシップ推論攻撃(MIA)は、機械学習モデルによるプライバシー漏洩を実証的に推定する。
転送学習における多種多様なMIAの性能を比較し,プライバシリスク評価における最も効率的な攻撃の特定を支援する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:41:41 GMT)
Accuracy, Memory Efficiency and Generalization: A Comparative Study on Liquid Neural Networks and Recurrent Neural Networks [4.8] レビューは、液体ニューラルネットワーク(LNN)と従来のリカレントニューラルネットワーク(RNN)の比較分析を行うことを目的としている。
研究結果によると、LNNは、生物学的にインスパイアされた、継続的な時間的動的ニューラルネットワークとして、ノイズの多い非定常的なデータを扱う大きな可能性を示している。
いくつかのLNN変種はパラメータ効率と計算速度の点で従来のRNNより優れている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:50:34 GMT)
Biasless Language Models Learn Unnaturally: How LLMs Fail to Distinguish the Possible from the Impossible [4.8] GPT-2は各言語と不可能な言語を等しく学習する。
パープレキシティ曲線上で計算された様々な指標の言語間差異を考慮することにより、GPT-2は可能と不可能を体系的に分離することができないことを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:17:13 GMT)
Learning where to learn: Training data distribution optimization for scientific machine learning [4.7] 科学的機械学習では、モデルは常にパラメータ値や境界条件が訓練で使用されるものから遠く離れている。
本稿では,平均予測誤差を最小限に抑えるトレーニングデータ分布を設計する学習と学習の課題について検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:51:54 GMT)
Is the Hard-Label Cryptanalytic Model Extraction Really Polynomial? [4.7] ディープニューラルネットワーク(DNN)は注目されており、その内部モデルは現在、貴重な知的資産と見なされている。
本稿では,攻撃対象深度が増大するにつれて,攻撃の前提となる仮定が非現実的になることを示す。
この限界に対処するために、CrossLayer extractと呼ばれる新しい攻撃手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:29:36 GMT)
Learn to Bid as a Price-Maker Wind Power Producer [4.7] 短期的な電力市場に参加する風力発電会社(WPP)は、非散布可能で変動的な生産のため、かなりの不均衡なコストに直面している。
価格設定におけるWPP入札の最適化に文脈情報を活用するオンライン学習アルゴリズムを提案する。
このアルゴリズムの性能は、ドイツの日頭市場とリアルタイム市場の数値シミュレーションを用いて、様々なベンチマーク戦略に対して評価される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:15:32 GMT)
A risk model and analysis method for the psychological safety of human and autonomous vehicles interaction [4.6] 本稿では,AVの文脈における心理的安全性の定義を紹介する。
AVの心理的危険とリスクを特定し評価するためのリスクモデルを提案する。
本論文は、自律走行車における家族の経験を取り入れたシナリオを用いて、潜在的な心理的危険を評価するための枠組みの適用について述べる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:07:29 GMT)
Verifying Memoryless Sequential Decision-making of Large Language Models [4.6] 本稿では,大規模言語モデル(LLM)に基づく政策を逐次意思決定タスクにおいて厳密かつ自動検証するツールを提案する。
逐次意思決定タスクを表すマルコフ決定プロセス(MDP)、LCMポリシー、およびPCTL式として表現される安全要件を考慮し、本手法はMDPの到達可能な部分のみを段階的に構成する。
結果の形式モデルがStormでチェックされ、ポリシーが指定された安全資産を満たすかどうかが決定される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:31:48 GMT)
IASC: Interactive Agentic System for ConLangs [4.6] 本稿では,LLMを構築言語開発のためのツールとして利用するシステムを提案する。
このシステムはエージェント的アプローチを用いて言語のためのターゲット音韻論を作成する。
音韻モデルと形態素の集合を用いてレキシコンを構築する。
このシステムは、さらに多くの文を対象の言語に翻訳することもできる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:27:45 GMT)
Does Local News Stay Local?: Online Content Shifts in Sinclair-Acquired Stations [4.5] 地元ニュース局は、非政治情報の信頼できる情報源と見なされている。
我々はシンクレアに買収されたローカルニュース局の効果について検討する。
地方ニュース局は地方ニュースを犠牲にして全国ニュースを頻繁に報道している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:27:00 GMT)
Ryu-Takayanagi Formula for Multi-Boundary Black Holes from 2D Large-$c$ CFT Ensemble [4.5] 本稿では,AdS$_3$/CFT$$における複数の絡み合ったCFTを含む量子状態のクラスについて検討する。
遠絡エントロピーのRyu-Takayanagi(RT)式は境界CFTデータのみを用いて導出可能であることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:48:22 GMT)
Evaluating LLM-Generated Versus Human-Authored Responses in Role-Play Dialogues [4.4] 本研究では,マルチターン・プロフェッショナル・トレーニング・シミュレーションにおけるLLMと人間による応答を比較した。
人体評価の結果,LLM生成応答品質はターン毎に著しく低下した。
参加者はまた、人間が書いた対話に対して一貫した好みを示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:27:45 GMT)
Chem-NMF: Multi-layer $α$-divergence Non-Negative Matrix Factorization for Cardiorespiratory Disease Clustering, with Improved Convergence Inspired by Chemical Catalysts and Rigorous Asymptotic Analysis [4.4] 非負行列因子化(Non-Negative Matrix Factorization、NMF)は、オーディオ処理、バイオメディカル信号分析、画像認識など、様々な領域にまたがる低ランク表現を提供する教師なし学習手法である。
化学反応におけるエネルギー障壁のボルツマン確率から着想を得た新しいアプローチを導入し、理論的に収束解析を行う。
本稿では,収束を安定化させる境界係数を持つChem-NMFという新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:31:10 GMT)
Optimizing Ethical Risk Reduction for Medical Intelligent Systems with Constraint Programming [4.3] 医療知能システム(MIS)は、医療にますます統合され、重要な利益を提供するとともに、重要な安全と倫理上の懸念を提起している。
ほとんどのMISはリスクの高いシステムに分類され、信頼できるAIの倫理的要件に準拠するためには、正式なリスク管理プロセスが必要である。
我々は,倫理的考察によるリスク低減を目的としたリスク低減最適化問題に焦点をあてる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:40:11 GMT)
Covert Quantum Learning: Privately and Verifiably Learning from Quantum Data [4.2] 量子学習理論における包括的検証可能な学習モデルを提案する。
Forrelation と Simon の問題に対する古典的クエリと量子的クエリの指数的分離は、隠蔽性制約の下で生き残ることを示す。
我々のモデルとそれに対応するアルゴリズムは、信頼できない遠隔データであっても、量子的優位性はプライベートで検証可能であることを示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:25:28 GMT)
ParamBench: A Graduate-Level Benchmark for Evaluating LLM Understanding on Indic Subjects [4.2] 我々は,ヒンディー語で17K以上の質問からなるParamBenchについて,21の多様な被験者の質問紙から回答を得た。
これらの質問は、主に歴史、音楽、楽器、ヨガ、プッシュ、文学、哲学、法律などに関する全国レベルの入学試験から導かれる。
このベンチマークで16以上のオープンソースLLMの性能を評価し,Gemma3-27Bが56.4%の精度で最高であることを確認した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:29:07 GMT)
Empirically evaluating commonsense intelligence in large language models with large-scale human judgments [4.2] 本稿では,人工知能における常識評価手法を提案する。
モデルの判断と人口の対応を計測する。
私たちのフレームワークは、異なる、しばしば互換性のない、知識の社会的備蓄を持つ人間の集合体にAIモデルを適用することの要求に寄与します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:08:08 GMT)
Postselected amplification and photon recycling applied to optical sensing of magnetic fields [4.2] 本稿では,2つのリサイクル手法を提案し,増幅信号の解析式と測定感度について検討する。
その結果,従来の測定値よりも性能が有意に向上した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:40:40 GMT)
Accelerating Inference for Multilayer Neural Networks with Quantum Computers [4.2] 非線形アクティベーション機能を持つ多層ニューラルネットワークの完全コヒーレントな量子実装について述べる。
3つの量子データアクセス体制下でのネットワークの推論の複雑さを分析する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:26:50 GMT)
RevealNet: Distributed Traffic Correlation for Attack Attribution on Programmable Networks [4.1] RevealNetは、アタック属性のための分散フレームワークである。
トラフィック相関を実行するために、P4プログラム可能なスイッチ群を編成する。
我々の評価は、RevealNetが集中攻撃属性システムに匹敵する精度を実現することを示唆している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:56:54 GMT)
BixBench: a Comprehensive Benchmark for LLM-based Agents in Computational Biology [4.1] LLM(Large Language Models)とLLMをベースとしたエージェントは、科学研究の加速に大きな期待を示している。
本稿では,バイオインフォマティクスベンチマーク(BixBench)について述べる。
オープンソースのカスタムエージェントフレームワークを用いて,2つのフロンティアLCMの性能評価を行った。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:06:34 GMT)
Investigating Thematic Patterns and User Preferences in LLM Interactions using BERTopic [4.1] 本研究では,Lumsys-chat-1mデータセットに対してBERTopicを適用した。
主な目的は、これらの会話におけるテーマパターンを明らかにし、ユーザの好みとの関係を調べることである。
トピックとモデル嗜好の関係を分析し,モデルとトピックのアライメントの傾向を明らかにした。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:13:44 GMT)
Quantum Filtering and Analysis of Multiplicities in Eigenvalue Spectra [4.1] 本稿では,固有値のクラスタを効率よく同定し,その多重度を決定する量子アルゴリズムQFAMESを紹介する。
QFAMESはまた、ターゲットエネルギークラスタ内の観測可能な期待値の推定を可能にする。
数値実験によるQFAMESの有効性を検証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:37:36 GMT)
Diffusion-Augmented Reinforcement Learning for Robust Portfolio Optimization under Stress Scenarios [4.0] ポートフォリオ管理のためのDARL(Denoising Diffusion-Augmented Reinforcement Learning)とDRL(Deep Reinforcement Learning)を統合した,DARL(Diffusion-Augmented Reinforcement Learning)と呼ばれる革新的なフレームワークを提案する。
DDPMを利用して, 各種応力強度を条件としたマーケットクラッシュシナリオを生成することにより, トレーニングデータの堅牢性を大幅に向上させる。
実証的な評価では、DARLは従来のベースラインよりも優れており、リスク調整されたリターンと、予期せぬ危機に対するレジリエンスを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:56:50 GMT)
Gaze Estimation for Human-Robot Interaction: Analysis Using the NICO Platform [3.9] 本稿では,HRIコンテキストにおける現在の視線推定手法について述べる。
我々はNICOロボットプラットフォームで収集された新しい注釈付きデータセットを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:13:31 GMT)
Bayesian Nonparametric Dynamical Clustering of Time Series [3.8] 本稿では,線形力学を持つ未知数のレギュレータを切り替えることで,非有界な時系列クラスタの進化をモデル化する手法を提案する。
オフラインおよびオンラインシナリオの変動的下界を定式化して推論を行う。
本研究は, 公用データベースを用いた心電図解析のいくつかのケーススタディを通じて, アプローチの汎用性と有効性について述べる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:52:39 GMT)
Leveraging LLMs to Streamline the Review of Public Funding Applications [3.8] 2つの政府イニシアチブのパイプライン内でAI支援評価の現実的な展開について詳述する。
我々のソリューションは、無視できる偽陽性率を維持しながら、レビュアーの生産性を20.1%向上させた。
これらの改善により、総評価期間は2ヶ月以上短縮された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:58:29 GMT)
Optimizing LOCC Protocols on Product Stiefel Manifold [3.8] 局所的演算と古典的通信(LOCC)は、理論と実験の両方の観点からの量子情報の基礎となるフレームワークである。
我々は、積 Stiefel 多様体上のリーマン最適化を通じて固定円LOCCを最適化するフレームワークを開発する。
本稿では,このフレームワークの量子情報処理における重要なタスク,例えば絡み込み蒸留や状態マージによる適用性を実証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:43:47 GMT)
GPT-5 Model Corrected GPT-4V's Chart Reading Errors, Not Prompting [3.8] 本稿では,ゼロショット大言語モデル(LLM)がチャート読解タスクに与える影響を定量的に評価する。
エージェントGPT-5とマルチモーダルGPT-4Vの推測精度を比較するため, LLMに107の可視化質問に対する回答を求めた。
その結果,モデルアーキテクチャが推論精度を支配しているのに対し,プロンプト変種は小さな効果しか得られていないことがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:09:29 GMT)
On quantum to classical comparison for Davies generators [3.8] [Temme'13]は、デイビーズ・リンドブラディアンは古典マルコフ発生器を組み込んでいることを観察した。
ハミルトニアンのスペクトルが長い算術的な進行を含まないならば、2つのスペクトルギャップは同値でなければならない。
この結果は物理的直観と一致し、古典マルコフ連鎖法の量子環境への応用を可能にする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:33:23 GMT)
Integrating Domain Knowledge into Process Discovery Using Large Language Models [3.7] 本稿では,自然言語で表現されたドメイン知識をプロセス発見パイプラインに組み込む対話型フレームワークを提案する。
このフレームワークは、LLM(Large Language Models)、ドメインエキスパート、バックエンドサービスのセット間のインタラクションを調整する。
我々の実証研究は、実際のイベントログに基づくケーススタディと、フレームワークのユーザビリティと有効性を評価するドメインエキスパートの関与を含む。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:59:11 GMT)
PhotonIDs: ML-Powered Photon Identification System for Dark Count Elimination [3.7] 本稿では,機械学習を利用した光子識別システムPhotonIDを紹介する。
PhotonIDsは、光子と暗カウントのリアルタイム識別のための最初のエンドツーエンドソリューションである。
以上の結果から,光nIDは暗カウント除去において31.2倍の信号ノイズ比(SNR)を向上できることが示された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:57:49 GMT)
Rex: Reversible Solvers for Diffusion Models [3.7] 本稿では,この課題と微分方程式に対する代数的可逆解のより広範な研究との関連を利用して,拡散モデルのための新しい解法群を提案する。
特に、拡散モデルに対する指数的ルンゲ・クッタ法を構築するために、ローソン法の適用を用いて可逆解の族を構築する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:43:58 GMT)
Adaptive Tool Generation with Models as Tools and Reinforcement Learning [3.6] MTRは、ツール強化推論のためのシミュレーションファーストのトレーニングフレームワークである。
スキーマ検証されたシミュレートされた観察で、完全なReActトレースから学習する。
MTRは、ライブAPIシステムと競合するエクサクトマッチ(EM)スコアを取得する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:48:50 GMT)
Multi-qubit Toffoli with exponentially fewer T gates [3.6] 私たちは、小さな1/mathrmpoly(n)$エラーを発生させるコストで、指数関数的に少ないT$ゲートで逃げる方法を示します。
より正確には、$n$-qubit Toffoli ゲートはランダムに選択された Clifford+$T$ 回路によってダイヤモンド距離の誤差 $epsilon$ 内に実装することができる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:56:23 GMT)
Reasoning for Hierarchical Text Classification: The Case of Patents [3.5] Reasoning for Hierarchical Classification (RHC)は、HTCをステップバイステップの推論タスクとして再編成する新しいフレームワークである。
RHCは、出力をチェーン・オブ・ソート(CoT)推論形式と強化学習段階に整合させるコールドスタート段階という2つの段階で、大きな言語モデルを訓練する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:06:04 GMT)
LLM Company Policies and Policy Implications in Software Organizations [3.5] この記事では、ソフトウェア組織における大規模言語モデル(LLM)チャットボットの採用に伴うリスクについて考察する。
我々は、11社がこれらのポリシーと、それらに影響を与える要因をどのように作り出すかを検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:14:54 GMT)
LLM-Powered Nuanced Video Attribute Annotation for Enhanced Recommendations [3.5] 本稿では,Large Language Models (LLMs) の展開を,ニュアンスのあるコンテンツ理解を実現するための「アノテーション」機構として活用するケーススタディを提案する。
LLM-as-annotators"アプローチは、開発時間を著しく短縮し、微妙な属性のアノテーションを有効にすることで、これらの問題に対処する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:17:17 GMT)
Embedding-Aware Noise Modeling of Quantum Annealing [3.4] D-WaveのZephyrトポロジにおいて,組込みによるオーバーヘッドとハードウェアノイズを結合するフレームワークを開発した。
本研究は、チェーン安定性と論理カプラの忠実度とのトレードオフを説明する一般的な埋め込み型ノイズ・フレームワークを構築した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:42:48 GMT)
Parameter-Free Federated TD Learning with Markov Noise in Heterogeneous Environments [3.4] フェデレートラーニング(FL)は、複数のエージェントをまたいだ探索と訓練を分散することにより、強化学習を劇的に高速化することができる。
この速度を達成するために既存のTD学習結果には、未知の問題パラメータに依存するアルゴリズムが必要である。
本稿では,Polyak-Ruppert平均化を用いた2段階のフェデレーション時間差学習を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:36:30 GMT)
Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs [3.3] トレーニング中に遭遇しないインスタンスであるアウト・オブ・ディストリビューション(OOD)オブジェクトは、未知のオブジェクトの既知のクラスへの不正な割り当てを防止するために不可欠である。
本稿では, ディープニューラルネットワークの特徴空間におけるガウス混合モデル(GMM)パラメータの階層的ベイズモデルから導かれる, てんかん不確実性を利用した教師なしOOD検出手法を提案する。
AUROCは18%改善し,AUPRCは22%増加し,FPR95は36%低下した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:40:17 GMT)
PARSE: LLM Driven Schema Optimization for Reliable Entity Extraction [3.3] 近年のアプローチでは,制約デコーディングや強化学習といった手法を用いて,既存のスキーマを用いたタスク抽出に,大規模言語モデルを直接適用している。しかし,スキーマを人間開発者用に設計された静的コントラクトとして扱うことにより,最適抽出性能,頻繁な幻覚,不完全あるいは不完全仕様を含む場合の信頼性の低いエージェント動作が実現されている。
ARCHITECTは、RELAYを介して後方互換性を維持しながら、消費のためのスキーマを自律的に最適化するシステムであり、SCOPEは静的およびLLMベースの抽出を実装し、モデル間で10%のフレームワーク改善を実現し、最初の再試行で抽出エラーを92%削減する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:40:30 GMT)
Enhancing Speech Emotion Recognition via Fine-Tuning Pre-Trained Models and Hyper-Parameter Optimisation [3.3] 本稿では,事前学習された表現とHPO戦略を用いた音声感情認識のためのワークフローを提案する。
実験は、32GBのRAMを持つ8つのCPUコアで動作する。
言語間の一般化のために、EmoDBで訓練されたHPOチューニングモデルでは、CREMA-Dでは0.25、RAVDESSでは0.26のゼロショット精度が向上している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:20:43 GMT)
Friend or Foe Inside? Exploring In-Process Isolation to Maintain Memory Safety for Unsafe Rust [3.3] Rustはインフンセーフな言語機能を提供し、メモリ安全性を開発者に保証する責任をシフトさせる。
本研究では,安全なプログラムセクションを安全違反から保護するためのメカニズムとして,メモリ保護キーを用いたプロセス内分離について検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:10:47 GMT)
NurseLLM: The First Specialized Language Model for Nursing [3.3] NurseLLMは,複数選択質問応答(MCQ)タスクに適した看護特化LDMである。
看護トピックの広い範囲でLSMをトレーニングするための,最初の大規模看護MCQデータセットを構築した。
実験の結果,NurseLLMはSOTAの汎用および医療用LLMを同等の大きさで上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:15:06 GMT)
Vocabulary embeddings organize linguistic structure early in language model training [3.3] 大規模言語モデル(LLM)は、入力埋め込みベクトルの幾何を複数の層で操作することで機能する。
ここでは、言語モデルの入力語彙表現がどのように構造化され、この構造はトレーニング中にどのように進化しますか?
入力埋め込みの幾何学的構造と2つのオープンソースモデルの出力埋め込みを、セマンティック、構文、周波数ベースのメトリクスで関連付ける一連の実験を行った。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:26:22 GMT)
From Condensation to Rank Collapse: A Two-Stage Analysis of Transformer Training Dynamics [3.2] 我々は勾配流解析フレームワークを用いて線形化トランスフォーマーのトレーニング力学を体系的に研究する。
我々の理論的解析は、注意モジュールの力学を2つの異なる段階に分解する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:37:53 GMT)
Excitonic Insulator and Possible Superfluid Based on Two-Dimensional Diamond [3.2] 遷移温度が最大220Kの2次元(2次元)広帯域ギャップダイアモンドに基づくエキシトン絶縁体を実現する。
抵抗は3つ以上の順序で劇的に上昇し、これは励起子のボース=アインシュタイン凝縮(BEC)によって説明できる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:14:42 GMT)
SDQM: Synthetic Data Quality Metric for Object Detection Dataset Evaluation [3.2] 本稿では,オブジェクト検出タスクのデータ品質を評価するために,Synthetic dataset Quality Metric (SDQM)を提案する。
実験の結果,SDQMは,主物体検出モデルYOLOv11の平均精度 (mAP) と強い相関を示した。
データセットの品質向上のための実用的な洞察を提供し、コストのかかる反復的なトレーニングの必要性を最小限にする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:01:26 GMT)
End-to-end quantum algorithms for tensor problems [3.2] テンソルPCAや植込みkXORを含むテンソル問題に対するエンドツーエンドの量子アルゴリズムを提案する。
我々は,菊池方式のネイティブな量子ビット符号化を導入することで,鍵となる制約に対処する。
スパーステンソルPCAとテンソル完備化の回復を支援するために,アルゴリズムフレームワークを拡張した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:37:48 GMT)
A quantum state transfer protocol with Ising Hamiltonians [3.2] 超伝導束量子ビットに適した線形スピン鎖における量子状態伝達プロトコルを提案する。
ドメイン・ウォールに情報をエンコードすることで、横フィールドIsingモデルを実装するアーキテクチャに適用する。
結果として生じる線形イジング鎖は、アナログ量子シミュレーションのために多くのプラットフォームで量子輸送実験を行う。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:25:40 GMT)
Computational complexity of the homology problem with orientable filtration: MA-completeness [3.2] 単体錯体のある種のサブクラスに対して、MA完全ホモロジー問題が存在することを示す。
この問題は、単純錯体の配向性という新しい概念によって定義される。
そこで我々は,MA硬化型確率満足度問題から低減できる新しいガジェットを設計する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:40:54 GMT)
Kernel-Free Universum Quadratic Surface Twin Support Vector Machines for Imbalanced Data [3.1] 不均衡なクラスを持つバイナリ分類タスクは、機械学習において大きな課題となる。
本稿では,2次双立サポートベクトルマシンモデル内のマイノリティクラスをサポートするためにUniversumポイントを活用することで,この問題に対処する新しいアプローチを提案する。
本手法は,Universumの点を組み込むことで,不均衡なデータセットの分類精度と一般化性能を向上させる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:34:45 GMT)
Who Pays for Fairness? Rethinking Recourse under Social Burden [3.1] 本稿では,アルゴリズムにおける不公平性を理論的に評価する。
次に,実践的アルゴリズム(MISOB)とともに,社会的負担に基づく新たなフェアネスフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:28:46 GMT)
Interpretable Clustering: A Survey [3.1] クラスタリングアルゴリズムは、医療、金融、自律システムといった高度な領域にますます適用されています。
透過的で解釈可能なクラスタリング結果の必要性は、重要な関心事になっている。
本稿では,説明可能なクラスタリングアルゴリズムの現状を包括的かつ構造化したレビューを行う。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:50:33 GMT)
Proposals for experimentally realizing (mostly) quantum-autonomous gates [3.0] 我々は、Rydberg原子、閉じ込められたイオン、超伝導量子ビットの3つのプラットフォーム上での(完全かつ部分的に)量子自律ゲートの実現を提案する。
ゲートは(完全にまたは部分的に)量子自律回路の構成要素として機能する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:00:00 GMT)
Resolution scaling governs DINOv3 transfer performance in chest radiograph classification [3.0] MetaのDINOv3はGram-anchored自己蒸留を通じてSSLモデルを拡張している。
DINOv3とDINOv2とImageNetをベンチマークした。
胸部X線写真解釈のための512x512の微細な中型のバックボーンの使用を支援する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:25:04 GMT)
Want to train KANS at scale? Now UKAN! [3.0] 我々は、従来のコルモゴロフ・アルノルドネットワーク(KAN)における有界グリッドの必要性を取り除く方法であるUnbounded Kolmogorov-Arnold Networks (UKANs)を提案する。
UKANは、グリッドグループの位置符号化をCGモデルに入力することで、カンと多層パーセプトロンを結合し、データ正規化を必要とせずに非有界領域上の関数近似を可能にする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:41:42 GMT)
A physics-aware deep learning model for shear band formation around collapsing pores in shocked reactive materials [2.9] 本研究は, 弱い加圧を受ける結晶性エネルギー材料 (EM) におけるホットスポットの形成について検討した。
直接数値シミュレーションに伴う計算課題を克服するため,物理対応リカレント畳み込みニューラルネットワーク(PARCv2)を進歩させる。
PARCv2は、フーリエニューラル演算子とニューラル常微分方程式という、広く使われている2つの物理インフォームドモデルに対してベンチマークされる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:20:49 GMT)
Transversal dimension jump for product qLDPC codes [2.9] 本稿では,異なる鎖複雑次元の量子低密度パリティチェック (qLDPC) 符号に対するコードスイッチングプロトコルを提案する。
我々は、3Dコードとその2Dコンポーネントコード間の片道CNOTを実装し、テレポーテーションベースのスイッチングを可能にする。
これにより、高いしきい値と低い時空コストで高速な量子論理計算が得られる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:35:07 GMT)
Sustainable LSTM-Based Precoding for RIS-Aided mmWave MIMO Systems with Implicit CSI [2.8] このフレームワークはアップリンクパイロットシーケンスを利用して暗黙的にチャネル特性を学習し、パイロットのオーバーヘッドと推論の複雑さを低減します。
提案した設計は、総探索のスペクトル効率の90%以上を計算時間のわずか2.2%で達成し、エネルギー消費量を2桁近く削減する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:53:44 GMT)
Cybersecurity Competence for Organisations in Inner Scandinavia [2.8] 本稿では,本研究の一般化可能性と,スウェーデンとV"アームランド"に比例する程度について論じる。
我々は、インナースカンジナビアにおけるサイバーセキュリティ能力を強化する取り組みを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:28:38 GMT)
No exponential quantum speedup for $\mathrm{SIS}^\infty$ anymore [2.8] 平均ケース$ell_infty暗号$-Short Solution(mathrmSISinfty$)問題に対する効率的な量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:28:47 GMT)
Explaining Models under Multivariate Bernoulli Distribution via Hoeffding Decomposition [2.8] サブモデル分解によるランダムな入力を伴う予測モデルの振る舞いを解説する。
基礎となる L2 の部分空間は 1 次元であり、汎函数分解は明示的であることを示す。
入力が出力予測に与える影響の明示的な指標を明示的に導出することができる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:46:20 GMT)
Dynamic Learning Rate for Deep Reinforcement Learning: A Bandit Approach [2.7] 深層強化学習(RL)では、学習速度は安定性と性能の両方に重大な影響を及ぼすが、環境と政策が進化するにつれて、トレーニング中に最適な価値がシフトする。
標準崩壊スケジューラは単調収束を仮定し、しばしばこれらのダイナミクスと不一致し、早めまたは遅れた調整をもたらす。
LRRLは、学習手順ではなく、政策性能に基づいて動的に学習率を選択するメタ学習手法である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:58:01 GMT)
FEAorta: A Fully Automated Framework for Finite Element Analysis of the Aorta From 3D CT Images [2.7] 大動脈動脈瘤は、米国の人口で死亡原因のトップ20に一貫してランクインしている。
バイオメカニクスの観点からすると、大動脈壁に作用する応力が壁強度を超えると破断が起こる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:00:46 GMT)
Improving Artifact Robustness for CT Deep Learning Models Without Labeled Artifact Images via Domain Adaptation [2.7] 本研究では,新しいアーティファクトに拘わらず,分類性能を維持するための訓練モデルとして,ドメイン適応を評価した。
シングラム空間における検出ゲイン誤差から得られたリングアーティファクトをシミュレートし,OrganAMNIST腹部CTデータセットに対するベースラインおよび拡張に基づくアプローチに対して,ドメイン敵ニューラルネットワーク(DANN)を評価する。
その結果, クリーンな画像のみをトレーニングしたベースラインモデルは, リングアーティファクトを持つ画像に一般化できず, 従来の歪み型による拡張は, 目に見えないアーティファクトドメインに改善を与えないことを示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:27:09 GMT)
Clifford testing: algorithms and lower bounds [2.7] 我々はクリフォード検定の問題を考察し、ブラックボックス$n$-qubitユニタリがクリフォードユニタリであるのか、あるいはクリフォードユニタリから少なくとも$varepsilon$-farであるのかを問う。
耐久安定度テストのテクニックを我々の設定に適応させることにより、テスターは寛容であることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:02:07 GMT)
Haar random codes attain the quantum Hamming bound, approximately [2.7] 我々は、Haarランダム符号が量子ハミング境界までの誤差をほぼ正し得ることを示す。
これは量子誤り訂正符号(QEC)の族で最も強い境界である
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:57:30 GMT)
Latent Representation Learning in Heavy-Ion Collisions with MaskPoint Transformer [2.7] 本稿では,トランスフォーマーベースのオートエンコーダについて,自己教師付き事前学習と教師付き微調整という2段階のパラダイムで学習した。
エンコーダはラベルのないHICデータから直接潜在表現を学習し、コンパクトで情報豊富な特徴空間を提供する。
その結果,HICにおける特徴学習の汎用的かつ堅牢な基盤として2段階の枠組みを確立し,クォークグルーオンプラズマ特性のより強力な解析への扉を開くことができた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:27:10 GMT)
Prefilled responses enhance zero-shot detection of AI-generated images [2.7] 我々は、AI生成画像のゼロショット検出のために、事前訓練された視覚言語モデル(VLM)を探索する。
人間の顔,物体,動物の合成画像を含む3つのベンチマークを用いて,VLMの性能を評価する。
特に「スタイルと合成アーティファクトを調べよう」というタスク対応のフレーズでVLM応答をプリフィルすると、3つの広く使われているオープンソースVLMのマクロF1スコアが最大24%向上する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:59:43 GMT)
The Framework That Survives Bad Models: Human-AI Collaboration For Clinical Trials [2.6] AIをサポートリーダ(AI-SR)として使用することは、悪いモデルであっても、さまざまなモデルタイプにまたがるすべての基準を満たすため、臨床試験において最も適したアプローチである。
本手法は、信頼性の高い疾患推定を一貫して提供し、臨床治験効果の推定と結論を維持し、異なる集団に適用した場合にこれらの利点を保持する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:40:41 GMT)
Surrogate Modeling for the Design of Optimal Lattice Structures using Tensor Completion [2.6] 機械的性能に関する最適格子構造の設計に着目する。
本研究では, 材料設計の高速化を目的とした代理モデルとしてテンソル補修法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:20:59 GMT)
Do Internal Layers of LLMs Reveal Patterns for Jailbreak Detection? [2.6] 大規模言語モデル(LLM)の内部表現を調べることでジェイルブレイク現象を研究する。
具体的には、オープンソースのLCM GPT-Jと状態空間モデルMamba2を分析する。
本研究は,ロバストなジェイルブレイク検出・防御のための内部モデル力学の活用に向けた今後の研究の方向性を示唆するものである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:55:31 GMT)
From Acceleration to Saturation: Scaling Behavior of Bootstrapped Language Model Pretraining [2.6] ブートストラッププレトレーニングのスケーリング挙動について検討し,そのスケーリング効率が予測可能な方法で低下することを確認した。
本研究は,効率的な言語モデル学習のための実践的知見を提供し,過度に訓練されたモデルの再利用に関する重要な考察を提起する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:59:33 GMT)
Knowledge-Aware Mamba for Joint Change Detection and Classification from MODIS Times Series [2.5] 本稿では,MODIS変化検出の強化を目的とした知識対応型マンバ(KAMChamba)を提案する。
クラス遷移に関する知識を活用するために,我々は新しい知識駆動型遷移行列誘導アプローチを設計する。
第3に、MODIS時系列における情報結合をアンタングル化するために、新しい空間-時空間マンバモジュールを設計する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:57:31 GMT)
Martingale Posterior Neural Networks for Fast Sequential Decision Making [2.5] ニューラルネットワークパラメータのオンライン学習とベイジアンシーケンシャル意思決定のためのスケーラブルアルゴリズムを導入する。
我々は、ニューラルネットワークでパラメータ化し、受信した観測を逐次更新するワンステップ後部予測と直接連携する。
我々のアルゴリズムは、完全にオンラインで再生不要な環境で動作し、コストのかかる後続サンプリングを伴わずに、原理化された不確実性定量化を提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:12:30 GMT)
Chisme: Fully Decentralized Differentiated Deep Learning for IoT Intelligence [2.5] 本稿では,完全分散型分散学習アルゴリズムChismeを紹介する。
Chismeは、ネットワークエッジコンテキストで堅牢なインテリジェンスを実装する上での課題に対処する。
Chismeを使用するクライアントは、より高速なトレーニング収束、トレーニング後の最終損失の低減、クライアント間のパフォーマンス格差の低減を示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:30:09 GMT)
Emotionally Vulnerable Subtype of Internet Gaming Disorder: Measuring and Exploring the Pathology of Problematic Generative AI Use [2.5] 本研究はPUGenAIS-9 (Problematic use of Generative Artificial Intelligence Scale-9 items)を開発した。
PUGenAISは,インターネットゲーム障害(IGD)の枠組みにおいて,中毒様パターンを反映しているかどうかを検討した。
個人中心(相対プロファイル分析)と可変中心(ネットワーク解析)のアプローチにより、PUGenAISはIGDの感情的に脆弱なサブタイプの特性と一致していることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:43:39 GMT)
Agentic generative AI for media content discovery at the national football league [2.5] 生成AIベースのワークフローによってメディア研究者やアナリストが、自然言語を用いて関連する歴史的な戯曲をクエリできることを示す。
エージェントワークフローは、ユーザクエリを入力として取り、それを要素に分解し、基礎となるデータベースクエリ言語に変換する。
このソリューションは95%以上の精度を実現し、関連ビデオを見つけるのにかかる平均時間を10分から30秒に短縮する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:51:34 GMT)
DGTEN: A Robust Deep Gaussian based Graph Neural Network for Dynamic Trust Evaluation with Uncertainty-Quantification Support [2.5] DGTEN (Deep Gaussian based Trust Evaluation Network) は統合グラフフレームワークを導入している。
不確実性を認識したメッセージパッシング、表現力のある時間的モデリング、信頼を目標とする攻撃に対するビルトインディフェンスを組み合わせる。
署名された2つのBitcoinトラストネットワークでは、DGTENが大幅に改善されている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:38:55 GMT)
Streamlining Plug-and-Charge Authorization for Electric Vehicles with OAuth2 and OIDC [2.5] ISO 15118 で定義されているPlug-and-Charge (PnC) プロセスは,認証の自動インストールと EV と Charge Point (CP) 間の認証の使用を可能にすることで,電気自動車 (EV) の自動充電を標準化する。
現在のクレデンシャルインストールプロセスは、一様ではなく、複雑なPublic Key Infrastructure(PKI)に依存し、きめ細かい認証パラメータのサポートがなく、ユーザフレンドリではない。
我々は OAuth Device Authorization Grant と Rich Authorization Requests を利用して,初期課金認可プロセスに対する合理化アプローチを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:57:02 GMT)
From Quantum Circuits with Ultraslow Dynamics to Classical Plaquette Models [2.5] 単元ゲートと射影測定を含むハイブリッド量子回路のファミリを紹介する。
この緩やかな絡み合いの成長は、同様にエントロピーの緩やかな成長に起因している。
我々は、遅い量子力学と古典的なガラス性の両方の起源を、大きな非局所対称性作用素の存在にさかのぼる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:14:32 GMT)
Observation of multiple time crystals in a driven-dissipative system with Rydberg gas [2.4] オープン量子系では、散逸する多体相互作用により、前例のない方法で時間結晶秩序を発達させることができる。
本稿では, 連続的に駆動される, 強く相互作用するRydberg熱ガス中の複数の時間結晶の観察について報告する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:59:59 GMT)
Pragyaan: Designing and Curating High-Quality Cultural Post-Training Datasets for Indian Languages [2.4] 既存のオープンソースデータセットには、多言語カバレッジ、文化的な基盤、タスクの多様性のギャップが欠如していることが多い。
我々は、翻訳と合成拡張を組み合わせて、信頼できる多種多様なIndicポストトレーニングデータを生成する、Human-in-the-loopパイプラインを導入する。
我々のデータセットプロトコルは、しばしば見過ごされる次元を取り入れ、タスクの多様性、マルチターン対話、命令の忠実さ、安全性の整合性、文化的ニュアンス保存を強調する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:23:45 GMT)
ACT-Tensor: Tensor Completion Framework for Financial Dataset Imputation [2.3] 本稿では,アダプティブ・クラスタベースのテンソルスムージング・テンソル・コンプリート・フレームワーク(ACT-Tensor)を導入する。
ACT-Tensorは、欠落するデータレシスタンスの範囲で、計算精度の点で、最先端のベンチマークを一貫して上回っている。
その結果、ACT-Tensorは価格の誤差を減らすだけでなく、構築されたポートフォリオのリスク調整されたリターンを大幅に改善することがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:59:25 GMT)
It's All in the Mix: Wasserstein Classification and Regression with Mixed Features [2.3] 我々は、離散的特徴の存在を忠実に説明できる分布的に堅牢な予測モデルを開発し、分析する。
我々のモデルは、離散的特徴の存在に非依存な既存手法を著しく上回り得ることを実証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:51:20 GMT)
Bayesian Optimization of Multi-Bit Pulse Encoding in In2O3/Al2O3 Thin-film Transistors for Temporal Data Processing [2.3] 溶液パターンAl2O3/In2O3薄膜トランジスタ(TFT)の符号化精度を向上させるための機械学習手法であるベイズ最適化を実証する。
5つの鍵パルスパラメータを探索し,出力状態分離の指標として正規化分離度(nDoS)を用いて高忠実度6ビット時間符号化を示す。
また、より単純な4ビットデータに基づいて訓練されたモデルにより、より複雑な6ビット符号化タスクの最適化を効果的に導くことができ、実験コストを低減できることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:22:24 GMT)
Wide Neural Networks as a Baseline for the Computational No-Coincidence Conjecture [2.2] ランダムニューラルネットワークは、ガウス測度において、その活性化関数がゼロ平均で非線形であるときに、ほぼ独立な出力を持つことを示す: $mathbbE_z sim MathcalN(0,1)[sigma(z)]=0$。
ほぼ独立したアウトプットのため、アライメント研究センターの計算的非衝突予測の候補として、ゼロ平均アクティベーション関数を持つニューラルネットワークを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:02:22 GMT)
Multipartite Markov Gaps and Entanglement Wedge Multiway Cuts [2.2] 反射型マルチエントロピーを用いてマルコフギャップの多部系への一般化を提案する。
結果として生じるマルチパーティイトマルコフギャップは、幾何的障害物を捉えてバルク再構成を行うことができる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:23:47 GMT)
The Digital Mirror: Gender Bias and Occupational Stereotypes in AI-Generated Images [2.2] 本研究では,AI生成画像における表現バイアスを作業環境で検証する。
DALL-E 3とIdeogramの2つの画像生成ツールを比較した。
本研究では,視覚性のある画像を生成する際の表現力を高めるために,実践者,個人,研究者に提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:49:18 GMT)
Quantum Sparse Recovery and Quantum Orthogonal Matching Pursuit [2.2] 我々は古典的OMPグリードアルゴリズムの最初の量子アナログである量子直交整合法(QOMP)を紹介する。
標準的な相互整合性と条件の整合性の下で、QOMPはスパース時間で$K$スパース状態の正確なサポートを確実に回復する。
我々はQRAMモデルでQOMPを解析し、古典的なOMP実装よりも高速化する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:05:07 GMT)
RustAssure: Differential Symbolic Testing for LLM-Transpiled C-to-Rust Code [2.1] Rustは、ソフトウェアのセキュリティを大幅に改善するメモリセーフなプログラミング言語である。
Cのような安全でないメモリ言語で書かれた既存のものは、Rustの改善された安全性保証を活用するために、まずRustにコンパイルされなければならない。
RustAssureは、Large Language Models(LLM)を使用して既存のCをRustに自動的にトランスパイルするシステムを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:52:34 GMT)
From What to Why: Thought-Space Recommendation with Small Language Models [2.1] 大規模言語モデル(LLM)は推論の強化を通じて高度なレコメンデーション機能を備えているが、実際のデプロイメントには大きな課題がある。
SLM(Small Language Models)は効率的な代替手段を提供するが、推奨する推論機能は未検討のままである。
PULSE(Preference Understanding by Latent Semantic Embeddings)は,SLM生成論理をディレクター学習信号として扱うフレームワークである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:22:26 GMT)
Community-Centered Spatial Intelligence for Climate Adaptation at Nova Scotia's Eastern Shore [2.1] 本稿では,ノバスコシア東部沿岸における気候の弾力性向上を目的とした,人間中心の取り組みの概要について述べる。
この地域は、海と深い結びつきのある農村村の集まりであり、その生活様式を危険にさらす気候変動の脅威に直面している。
我々は、技術が従来のコミュニティをどのようにサポートし、より効果的に気候変動をナビゲートできるようにするための、詳細なプロジェクトタイムラインとレプリカブルモデルを提示します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:10:18 GMT)
Quantum Algorithm for Vibronic Dynamics: Case Study on Singlet Fission Solar Cell Design [2.1] 実空間における一般的なビブロンハミルトニアンの下での時間発展をシミュレーションするための量子アルゴリズムを提案する。
そこで本研究では,より効率的な一重項核分裂型有機太陽電池の設計のための材料発見パイプラインへのアルゴリズムの初歩的な統合の証明について概説する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:10:25 GMT)
Generating Entangled Steady States in Multistable Open Quantum Systems via Initial State Control [2.1] 絡み合いは量子技術の力を支えるが、脆弱で通常は散逸によって破壊される。
我々は,バランスの取れた集団崩壊によるスピンアンサンブルにおいて,メロジカルに有用な定常状態を生成するスキームを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:49:44 GMT)
Beyond Hoeffding and Chernoff: Trading conclusiveness for advantages in quantum hypothesis testing [2.0] 本研究では,不確定判定結果の生成確率を適切に測定できるプロトコルについて検討する。
我々は、任意に小さな決定性の確率を許すことによっても、量子ホーフディングとチャーノフ境界によって課される制限は著しく超えられることを示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:42:11 GMT)
Can Lessons From Human Teams Be Applied to Multi-Agent Systems? The Role of Structure, Diversity, and Interaction Dynamics [2.0] チーム科学の中核的な側面である構造、多様性、相互作用のダイナミクスを調べるためのマルチエージェントフレームワークを提案する。
私たちの結果は、フラットなチームは階層的なチームよりもパフォーマンスが良い傾向を示します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:37:17 GMT)
Do LLMs Know They Are Being Tested? Evaluation Awareness and Incentive-Sensitive Failures in GPT-OSS-20B [1.9] 本研究では,「評価香り」がコンメンシュレート能力を得ることなく測定性能を膨らませるかどうかを考察する。
6つのペアのA/Bシナリオを実行し、タスク内容を保持し、フレーミングの異なる状態でデコードします。
再現可能なA/Bフレームワーク(バンキング、バリデータ、ラン毎のスコア、スクリプト)と実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:49:05 GMT)
Reproducing and Extending Causal Insights Into Term Frequency Computation in Neural Rankers [1.9] 本稿では、Chenらによる研究結果を再現し、ニューラルIRモデルにおける事前定義された検索公理の存在をさらに探求することを目的とする。
我々は、この公理を符号化し、その振る舞いを分析し、ニューラルランキングモデルの内的意思決定プロセスに関する洞察を与える、注目の頭脳のグループをうまく同定する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:29:31 GMT)
PickStyle: Video-to-Video Style Transfer with Context-Style Adapters [1.9] PickStyleはビデオからビデオへの転送フレームワークで、事前訓練されたビデオ拡散バックボーンをスタイルアダプタで強化する。
静止画像とダイナミックビデオのギャップを埋めるために,ペア画像から合成訓練クリップを構築する。
CS-CFGは、スタイルが効果的に転送される間、コンテキストが生成されたビデオに保存されることを保証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:02:55 GMT)
GNN-enhanced Traffic Anomaly Detection for Next-Generation SDN-Enabled Consumer Electronics [1.9] 本稿では,次世代CEネットワーク向けに,SDN(Software-Defined Networking)とCFN(Compute First Networking)を統合したスケーラブルネットワークモデルを提案する。
このネットワークモデルでは、SDNベースのCEネットワークを統合し、CFNアーキテクチャを実現するグラフニューラルネットワークベースのネットワーク異常検出フレームワーク(GNN-NAD)を提案する。
GNN-NADは、小さなサンプルサイズであっても、精度、リコール、精度、F1スコアにおいて優れた測定値を達成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:01:40 GMT)
Dynamic Factor Analysis of Price Movements in the Philippine Stock Exchange [1.9] 本研究は,ストック価格のダイナミクスを理解するための代替フレームワークとして,抽出された負荷および共通要因の分析に焦点をあてる。
その結果、フィリピン証券取引所に適用された伝統的な市場理論に関する新たな洞察が明らかになった。
フィリピンの国内総生産(GDP)の伸び率を計上するためのモデルの適用は、抽出された共通要因の可能性をリアルタイム市場指標として示している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:07:28 GMT)
XLSR-Kanformer: A KAN-Intergrated model for Synthetic Speech Detection [1.8] 我々は、XLSR-Conformerモデルにおける従来のMulti-Layer Perceptron(MLP)をKolmogorov-Arnold Network(KAN)に置き換える新しいアプローチを提案する。
XLSR-Conformer モデルへの Kan の統合は, LA と DF の等誤差レート (EER) において, 相対的に 60.55% 向上できることを示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:58:58 GMT)
Is it Gaussian? Testing bosonic quantum states [1.7] 一定数のコピーが、状態が正確にガウス的であるかどうかを決定するのに十分であることを示す。
また、一般混合状態のガウス性をテストするには指数関数的に多くのコピーが必要であることも証明した。
提案手法はガウス状態の回転不変対称性と最近導入されたCVトレース距離境界のツールボックスに依存する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:56:34 GMT)
State preparation and symmetries [1.7] 量子ハミルトニアンの基底状態や特定の低層状態を作成するための変分量子固有解法(VQE)アルゴリズムにおける対称性の重要性を示す。
我々は,すべての対称性を維持することにより,変分法の収束が劇的に改善されることを実証した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:54:31 GMT)
End-to-End Quantum Algorithm for Topology Optimization in Structural Mechanics [1.7] 位相最適化のためのエンドツーエンドのフォールトトレラント量子アルゴリズムを提案する。
提案した量子ワークフローは、量子アルゴリズムが計算科学と工学の分野をいかに前進させるかを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:42:28 GMT)
Entanglement in von Neumann Algebraic Quantum Information Theory [1.7] フルシステムのヒルベルト空間上で、フォン・ノイマン代数によって部分系を記述する枠組みを用いる。
フォン・ノイマン代数の型分類は、操作的絡み合いの性質の族と一対一の対応にあることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:18:08 GMT)
Constant-Overhead Addressable Gates via Single-Shot Code Switching [1.7] 定数量子LDPC (qLDPC) 符号上でアドレスおよび並列論理演算を実行することは大きな課題である。
本稿では,様々なアドレナブルガジェットを動作させるためのフォールトトレラントプロトコルと,時空オーバーヘッドが一定である並列論理演算を導入する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:37:50 GMT)
The Contingencies of Physical Embodiment Allow for Open-Endedness and Care [1.7] 物理的脆弱性と死亡は、しばしば、人工エージェントの開発において避けられる障害と見なされる。
我々は、この格差における生活条件の役割を理解することは、より堅牢で適応的で、人工エージェントを育むのに役立つと論じる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:10:26 GMT)
A Denoising Framework for Real-World Ultra-Low Dose Lung CT Images Based on an Image Purification Strategy [1.7] 超低線量CT(uLDCT)は放射線被曝を著しく減少させるが、重音やアーティファクトをもたらす。
また、uLDCTと正常線量CT(NDCT)画像対の空間的ずれも生じている。
本稿では,画像浄化(IP)戦略に基づく革新的なデノベーションフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:40:38 GMT)
Stochastic Hessian Fittings with Lie Groups [1.6] プレコンディショニング勾配降下法(PSGD)に基づくヘシアンフィッティング基準
本分析により, 幅広いプレコンドレッサーフィッティング法の有効性と相違が明らかとなった。
ヘッセンフィッティング問題は、ある種の一般リー群において穏やかな条件下では強く凸である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:39:18 GMT)
Population synthesis with geographic coordinates [1.6] 粗い地理的領域ではなく、明確な座標で合成集団を生成することがますます重要である。
空間座標をより規則的な潜在空間にマッピングする集団合成アルゴリズムを提案する。
実家と同じ統計特性を持つ合成住宅を121データセットで生成し,その有効性を実証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:36:13 GMT)
Smart Hiring Redefined: An Intelligent Recruitment Management Platform [1.6] この研究は、Java技術フレームワークを活用して、キャンパス採用シナリオに適したインテリジェントな採用管理システムを設計し、実装する。
このシステムは、情報技術とインテリジェントなソリューションを通じて、学生、企業、管理者を繋ぐ共同プラットフォームを確立する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 02:50:28 GMT)
Sunflower: A New Approach To Expanding Coverage of African Languages in Large Language Models [1.6] アフリカには2000以上の言語があり、その多くは言語技術の進歩によってバイパスされている。
現在の先進的なLLMは、多くの一般的な言語で強力なパフォーマンスを示しているが、最も多く話者を持つ言語を優先的にサポートしている。
地域に焦点を当てたアプローチの方が効率的であり,ウガンダのケーススタディを提示する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:35:53 GMT)
Universal initial state preparation for first quantized quantum simulations [1.6] 対称性に適応した初期状態の合成は、第一量子化量子シミュレーションの主要なボトルネックである。
本稿では,職業数構成の任意のサイズの重ね合わせをディジタル量子コンピュータ上での最初のバイジャント化表現に効率的にマッピングする普遍的手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:41:08 GMT)
A Secure Authentication-Driven Protected Data Collection Protocol in Internet of Things [1.6] モノのインターネット(Internet of Things)は、人間がインターネットのインフラで使うオブジェクトを遠隔で管理し、制御することを可能にする。
プライバシーと情報セキュリティは、モノのインターネット(Internet of Things)の出現以来最大の懸念事項だ。
提案手法は3段階からなる。
その結果, 提案手法は, エネルギー消費, エンドツーエンド遅延, 柔軟性, パケット送出速度, 生存ノード数に関して, 他の方法と比較して改善されていることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:10:42 GMT)
HyPlan: Hybrid Learning-Assisted Planning Under Uncertainty for Safe Autonomous Driving [1.6] 本稿では,自動運転車の衝突のないナビゲーション問題を解決するためのハイブリッド学習支援計画手法HyPlanを提案する。
歩行者による交通シナリオのCARLA-CTS2ベンチマークによる実験結果から,HyPlanは選択した基準線よりも安全であることが判明した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:44:54 GMT)
Context Matters! Relaxing Goals with LLMs for Feasible 3D Scene Planning [1.5] 身体的エージェントは、現実の複雑な3D環境で確実に計画し、行動する必要がある。
我々は、LLM(Large Language Models)と古典的なプランニングを融合するフレームワークであるContextMattersを紹介します。
実験の結果,LLMs+PDDLベースラインよりも52.45%成功率が向上した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:45:18 GMT)
AI in Computational Thinking Education in Higher Education: A Systematic Literature Review [1.5] コンピュータ思考(CT、Computational Thinking)は、高等教育の学生が、ますます技術主導の未来と職場に育ち、適応するための重要なスキルセットである。
過去10年間、CT教育の研究はK12において顕著な勢いを保っているが、高等教育においてはまだ過小評価されている。
教育機関による人工知能(AI)の普及と普及は、教育活動を支援する有望な可能性を示している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:11:46 GMT)
Inconsistent Affective Reaction: Sentiment of Perception and Opinion in Urban Environments [1.4] 本研究では,感情の不整合を識別・解明するための新しい手法を提案する。
140,750 Baidu と Tencent ストリートビューの画像から知覚を計測するデータセットと、意見を測定するためのWeibo ソーシャルメディアテキストポスト 984,024 である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:07:23 GMT)
Securing WiFi Fingerprint-based Indoor Localization Systems from Malicious Access Points [1.4] WiFi指紋に基づく屋内位置決め方式は、受信した信号強度指標(RSSI)と、機械学習(ML)モデルまたはディープラーニング(DL)モデルを用いたオフラインデータベースとをマッチングすることにより、高精度な位置情報を提供する。
既存の文献は、オンラインフェーズにおける悪意のあるAPの検出と、その効果の軽減を欠いている。
本研究は,これらの制約に対処し,悪意のあるAP検出とその効果軽減手法を取り入れた,長期的かつ信頼性の高い屋内位置決め方式を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:09:02 GMT)
The tensor product of p-adic Hilbert spaces [1.4] p-進ヒルベルト空間のテンソル積を p-進数の超距離場の2次拡大上で研究する。
p-進ヒルベルト空間の部分空間の概念は非常に自明であるため、最終的に部分空間のテンソル積を研究する。
これらの発見は、p-進設定における量子絡み合いを探索するために必要な数学的基礎を提供する必要がある。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:00:07 GMT)
Rainbow chains and numerical renormalisation group for accurate chiral conformal spectra [1.3] 指数的に減衰する項を持つ共形臨界鎖の絡み合いスペクトルは、関連するキラルCFTの共形塔からなることを示す。
これらの絡み合いスペクトルは、親ハミルトニアンにアクセスすることなく単一波動関数から詳細なCFTスペクトルを抽出する信頼性の高い方法を示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:05:50 GMT)
Less is More: Strategic Expert Selection Outperforms Ensemble Complexity in Traffic Forecasting [1.3] 本稿では,物理道路トポロジとデータ類似性を組み合わせたSSemantic Expertを導入した時空間予測フレームワークであるTESTAM+を提案する。
包括的アブレーション研究により,戦略的専門家の選択はナイーブ・アンサンブル・アグリゲーションを根本的に上回っていることがわかった。
最適なIdentity + Adaptive構成は、METR LAのMegaCRN(2.99対3.38)の状態と比較して11.5%のMAE削減を達成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:24:17 GMT)
Phonon-induced two-axis spin squeezing with decoherence reduction in hybrid spin-optomechanical system [1.3] 本論文では,ハイゼンベルク限定スピンスクイーズ方式をハイブリッドキャビティ・オプティメカル・スピンシステムに実装する手法を提案する。
本システムでは,標準的なオプティメカルセットアップにおいて,Tavis-Cummings相互作用を機械共振器(MR)に結合する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:32:00 GMT)
Beyond More Context: How Granularity and Order Drive Code Completion Quality [1.3] 2025年のコンテキストコレクションチャレンジに対する我々のアプローチを示します。
この課題は、効率的な検索とコンテキスト収集戦略を設計することで、JetBrainsのベースラインを上回ります。
静的解析を用いたチャンクベースの検索を導入し、ベストなファイル検索戦略よりも6%改善し、コンペの初期段階においてPythonのノーコンテキストベースラインよりも16%改善した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:28:56 GMT)
Preparation of initial states with open and periodic boundary conditions on quantum devices using matrix product states [1.2] 本稿では,行列積状態(MPS)から量子デバイス上の開かつ周期的な境界条件で量子状態を作成するための枠組みを提案する。
周期境界条件 (pbc) を持つ状態は、測定後のアンシラ量子ビットと後選択を用いて量子回路として効率的に表現することができる。
提案手法は, 量子デバイス上で状態を作成するためのスケーラブルな方法であり, 近距離量子コンピュータ上での強相関系の効率的なシミュレーションを可能にする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:19:33 GMT)
Transformer-Based Indirect Structural Health Monitoring of Rail Infrastructure with Attention-Driven Detection and Localization of Transient Defects [1.2] 我々は,段階的に複雑な課題に対してモデルロバスト性を評価するために,漸進的な合成データベンチマークを導入する。
提案するアテンション・フォーカス変換器とともに,複数の教師なしモデルを評価する。
提案モデルでは,提案手法の精度は最先端の解に匹敵するが,推論速度は向上する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:01:53 GMT)
Beyond Monolingual Assumptions: A Survey of Code-Switched NLP in the Era of Large Language Models [1.2] 単一発話における言語とスクリプトの交替であるコードスイッチングは、多言語言語NLPの根本的な課題である。
ほとんどの大規模言語モデル(LLM)は、混合言語入力、限られたCSWデータセット、評価バイアスに苦戦している。
この調査は、CSWを意識したLSM研究の総合的な分析を初めて提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:04:14 GMT)
EvalMORAAL: Interpretable Chain-of-Thought and LLM-as-Judge Evaluation for Moral Alignment in Large Language Models [1.1] EvalMORAALは20の大規模言語モデルにおいてモラルアライメントを評価する透過的なチェーン・オブ・シントフレームワークである。
世界価値調査(55か国、19か国)とPEWグローバル姿勢調査(39か国、8か国)のモデルを評価する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:03:38 GMT)
ProSEA: Problem Solving via Exploration Agents [1.1] 本稿では,探索と計画の進化を通じて反復的な問題解決を実現するために設計されたモジュール型汎用マルチエージェントフレームワークであるProSEAを紹介する。
ProSEAは階層的なアーキテクチャで、管理者エージェントがドメイン固有の専門家エージェントを編成し、タスクを分解し、失敗した試みからの構造化されたフィードバックに基づいて適応的に再計画する。
挑戦的な FinanceBenchベンチマークの実験では、人間からのフィードバックがなくても、ProSEAは最先端のベースラインより優れ、推論に重きを置くタスク全体で堅牢なパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:23:33 GMT)
jmstate, a Flexible Python Package for Multi-State Joint Modeling [1.1] 多状態ジョイントモデルは、古典的なジョイントモデルのより柔軟な代替手段を提供する。
任意のグラフ上に定義された多状態イベントプロセスを用いて,縦型バイオマーカーモデリングを統一する汎用フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:24:51 GMT)
Reconquering Bell sampling on qudits: stabilizer learning and testing, quantum pseudorandomness bounds, and more [1.1] 我々は、すべての$dgeq 2$のクォーディットへのベルサンプリングの一般化を開発する。
新しいユニタリは、任意の安定化状態 $|mathcalSrangle$ の 4 つのコピーを、その複素共役である $|mathcalSastrangle$ の 4 つのコピーにマッピングする。
量子ビットから量子ビットへのいくつかの既知の結果を$dgeq 2$で持ち上げることで、新しいベルサンプリング手法の有用性を実証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:13:16 GMT)
Twisted locality-preserving automorphisms, anomaly index, and generalized Lieb-Schultz-Mattis theorems with anti-unitary symmetries [1.1] 異常対称性が複数のリーブ・シュルツ・マティス型定理につながることを示す。
さらに、異常対称性を持つ任意の状態が長距離絡みを持つ必要があると推測する。
2スピンの相互作用しか持たないハミルトニアンにとって、最後の定理は相互作用が1/r2$よりも早く崩壊した場合であり、r$は相互作用するスピン間の距離である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:17:21 GMT)
When quantum resources backfire: Non-gaussianity and symplectic coherence in noisy bosonic circuits [1.1] 本稿では,雑音のあるボソニック回路をシミュレーションするための$textitdisplacement propagation$アルゴリズムを提案する。
我々はいくつかの計算位相遷移を同定し、極小ノイズレベルでもボソニック回路を効率よく古典的にシミュレートできる状態を明らかにする。
通常、ボソニックな量子優位性、すなわち非ガウス的性やシンプレクティックなコヒーレンスに関連付けられた計算資源は、古典的にノイズの存在をシミュレートしやすくする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:25:47 GMT)
Quantum Approximate Optimization Algorithm in Finite Size and Large Depth and Equivalence to Quantum Annealing [1.1] QAOAエネルギーは、2つの条件下での量子アニールを近似し、すなわち、角度が1つの層から次の層に滑らかに変化し、和が定数で束縛されていることを示す。
我々の証明は、一定の角度の和に対してQAOAの深さが増加するにつれて量子アニール限界に収束することを示す、角度の和におけるQAOAエネルギーの一連の拡張に依存している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:26:25 GMT)
Reconfigurable dissipative entanglement between many spin ensembles: from robust quantum sensing to many-body state engineering [1.0] 我々は多体貯水池工学において驚くほど多用途な手法を示す。
本手法は,スピン系をサブアンサンブル群に分割することに基づく。
結果はすぐにマルチアンサンブル量子メトロジーに応用できる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:28:50 GMT)
Rethinking Nonlinearity: Trainable Gaussian Mixture Modules for Modern Neural Architectures [1.0] 普遍密度近似ガウス混合モデル(GMM)に基づく新しい微分可能モジュールのクラスを導入する。
確率的制約を緩和することにより、GMNMは多様なニューラルネットワークと訓練されたエンドツーエンドメソッドにシームレスに統合できる。
実験では、GMNMを、幅広い機械学習アプリケーションにおける効率性と精度を高めるための強力で柔軟なモジュールとして実証した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:20:34 GMT)
Advancing Security in Software-Defined Vehicles: A Comprehensive Survey and Taxonomy [0.9] Software-Defined Vehicles (SDV) は、アウトソースされたアプリケーションと継続的オーバー・ザ・エアの更新を統合することで、車両のライフサイクルを拡張する革新的な機能を導入している。
本稿では,SDVの総合的な検討,そのエコシステムの詳述,技術の実現,およびそのアーキテクチャ的および運用的特徴から生じる主要なサイバー攻撃エントリポイントについて述べる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:03:58 GMT)
Estimating the Joint Probability of Scenario Parameters with Gaussian Mixture Copula Models [0.9] 本稿では,自動走行システムの安全性検証のための運転シナリオの統計的モデリングへのガウス混合コプラモデルの最初の応用について述べる。
我々は、国連規則第157号で定義されたシナリオから引き出された実世界の運転データを用いて、2つのアプローチを比較検討した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:26:20 GMT)
Beyond independent component analysis: identifiability and algorithms [0.9] 私たちは、ペアワイズが独立を緩和できるかどうかという疑問に答えることを意味することを示しています。
この結果は任意の累積テンソルにおける必要零パターンの分布に適用できる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:38:56 GMT)
A Hybrid Computational Intelligence Framework with Metaheuristic Optimization for Drug-Drug Interaction Prediction [0.9] 薬物と薬物の相互作用(DDI)は予防可能な有害事象の主要な原因であり、しばしば治療を複雑にし、医療費を増大させる。
本稿では、DDI予測を改善するために、現代の機械学習とドメイン知識を融合した解釈可能かつ効率的なフレームワークを提案する。
提案手法は, フラグメントレベルの構造パターンをキャプチャする Mol2Vec と, 文脈化学的特徴を学習する SMILES-BERT の2つの補完的な埋め込みを組み合わせる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:55:18 GMT)
Correlation Lengths for Stochastic Matrix Product States [0.9] 局所観測可能量の熱力学的限界の存在を証明した。
等質な(ランダム変換不変な)場合、確率の任意の誤差耐性に対して、二点函数は二点間の距離で指数関数的に崩壊する。
I.d.の場合、指数的崩壊は依然として決定論的速度で保たれ、確率は距離において指数的に速く近づく。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:17:43 GMT)
Capture and Interact: Rapid 3D Object Acquisition and Rendering with Gaussian Splatting in Unity [0.9] 本稿では,現実世界のオブジェクトの高速な取得とインタラクティブレンダリングを可能にするエンドツーエンドパイプラインを提案する。
スマートフォンのビデオでオブジェクトをスキャンし、自動3D再構成のためにアップロードし、Unityで対話的に視覚化する。
このシステムは、リアルタイムテレプレゼンスをサポートするために、モバイルキャプチャ、クラウドベースの3D GS、Unityレンダリングを統合している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:31:29 GMT)
SQuaD: Smart Quantum Detection for Photon Recognition and Dark Count Elimination [0.9] SQuaDは、高タイミング分解能データ取得、マルチスケールデータ分析、インテリジェントな特徴認識と抽出を備えた完全に統合された量子システムである。
我々は、SQuaDを原子(エルビウムイオン)光子源に展開し、通信帯域におけるスピン量子ビットのノイズフリー制御と読み出しを実現する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:07:20 GMT)
HPQEA: A Scalable and High-Performance Quantum Emulator with High-Bandwidth Memory for Diverse Algorithms Support [0.8] HPQEAは状態ベクトルエミュレーションアプローチに基づく量子エミュレータである。
量子回路を最大30キュービットでエミュレートし、高い忠実度と平均二乗誤差を維持する。
FPGAベースのシステムよりも高速な実行を実現し、幅広いアルゴリズムをサポートし、低ハードウェアリソースを必要とする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:01:58 GMT)
Optimal filtering and generation of entangled photons for quantum applications in the presence of noise [0.8] 絡み合いと干渉に基づく多光子アプリケーションのフィルタリングについて検討する。
我々はエルビウムイオン量子メモリと互換性のある波長の光子を共役する。
ノイズの影響を改善することと単一モードの純度との間にはトレードオフがある。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:21:43 GMT)
Explaining raw data complexity to improve satellite onboard processing [0.8] 本研究では,物体検出および分類タスクの深層学習モデルに対する生データの利用効果について検討した。
2つのオブジェクト検出モデル(YOLOv11sとYOLOX-S)は、生データとL1データセットの両方でトレーニングされる。
その結果,両モデルが低信頼度,中信頼度でも同様に機能する一方で,生データに基づいてトレーニングしたモデルでは,高い信頼度でオブジェクト境界の識別に苦慮していることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:26:02 GMT)
acia-workflows: Automated Single-cell Imaging Analysis for Scalable and Deep Learning-based Live-cell Imaging Analysis Workflows [0.8] ライヴセルイメージング(LCI)技術は、単一細胞レベルでの生きた細胞の詳細なキャラクタリゼーションを可能にする。
数十から数百の並列細胞培養による高時間セットアップは、堅牢で再現可能な洞察の可能性を秘めている。
近年,セルセグメンテーションとトラッキングのためのディープラーニング手法の進歩により,このような大規模データボリュームの自動解析が可能になった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:05:37 GMT)
Populism Meets AI: Advancing Populism Research with LLMs [0.8] 我々は,人間のコーダトレーニングを反映する思考の連鎖(CoT)を誘導するルーリックでアンカー誘導の連鎖の結果を提示する。
我々は、モデルの推論をガイドするために、同じドキュメントの適応バージョンでLLMに促すことで、人間のコーダのトレーニングに使用されるプロセスを再現する。
このドメイン固有のプロンプト戦略により、LLMは専門家の人間のコーダと同等の分類精度を達成できることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:04:15 GMT)
Hakim: Farsi Text Embedding Model [0.8] Hakimは、新しいテキスト埋め込みモデルで、FaMTEBベンチマークの既存のアプローチよりも8.5%パフォーマンス改善を実現している。
コーデシア、Pairsia-sup、Pairsia-unsupの3つの新しいデータセットを導入し、教師なしおよび教師なしのトレーニングシナリオをサポートする。
一方,RetroMAEに基づく言語モデルでは,テキスト情報検索に特に有効であることが証明されている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:13:17 GMT)
AISysRev -- LLM-based Tool for Title-abstract Screening [0.8] AiSysRevは、書類をスクリーニングするためのDockerコンテナで動作するWebアプリケーションである。
紙のタイトルと要約を含むCSVファイルを受け取る。
ユーザーはインクルージョンと除外の基準を指定する。
ゼロショットと少数ショットの両方をサポートする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:59:23 GMT)
Fourier Analysis of Parameterized Quantum Circuits and the Barren Plateau Problem [0.8] パラメータ化量子回路におけるフーリエ係数とバレンプラトー問題の関係を示す。
特に、フーリエ係数の平方の和は、バレンプラトー条件の下でのキュービットに関して指数関数的に制限される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:03:45 GMT)
DPA-Net: A Dual-Path Attention Neural Network for Inferring Glycemic Control Metrics from Self-Monitored Blood Glucose Data [0.8] 血糖の自己モニタリング(SMBG)は安価で広く利用可能であるが、希少で不規則なデータが得られる。
SMBGデータから直接AGPメトリクスを推定するためのデュアルパス注意ニューラルネットワーク(DPA-Net)を提案する。
DPA-Netは、系統的バイアスを低減しつつ、低いエラーで堅牢な精度を達成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:06:22 GMT)
Dual Natural Gradient Descent for Scalable Training of Physics-Informed Neural Networks [0.8] 物理インフォームドニューラルネットワーク(PINN)の学習を著しく促進する自然段階的手法
textitDual Natural Gradient Descent (D-NGD)を紹介する。
D-NGDは、残留空間におけるガウス-ニュートンステップを計算し、ジオデシック加速度補正を無視可能な余剰コストで拡張し、モデスト$m$とNystrom-preconditioned conjugate-gradient solverをより大きい$m$で提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:39:20 GMT)
Incoherence in goal-conditioned autoregressive models [0.8] 我々は、オンラインのRLを使って、オフラインで学習したポリシーを微調整する、独自のアクションでモデルを再学習するプロセスに焦点を当てる。
我々は、不整合を減少させ、見返りの改善につながることを証明し、政策の結果として生じる軌跡を特徴づけることを目指している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:52:13 GMT)
Multi-objective Bayesian Optimization with Human-in-the-Loop for Flexible Neuromorphic Electronics Fabrication [0.7] ニューロモルフィックコンピューティングハードウェアはエッジコンピューティングを可能にし、新しい応用のためにフレキシブルエレクトロニクスで実装することができる。
金属酸化物材料は、柔軟なニューロモルフィックエレクトロニクスを製造する上で有望な候補であるが、処理の制約に悩まされている。
フォトニックカーリングを用いて, 可溶性酸化アルミニウム誘電体を用いたフレキシブル金属絶縁体-金属コンデンサを作製し, ニューロモルフィックに応用した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:28:28 GMT)
On the complexity of estimating ground state entanglement and free energy [0.7] 我々は,低エネルギー状態とギブズ状態に対する基底状態の絡み合いの推定とエントロピー推定の複雑さについて検討した。
局所ハミルトニアンを用いた最初のQMA(2)完全ハミルトニアン問題を生成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:26:57 GMT)
Magic and communication complexity [0.7] 量子回路におけるマジックと通信複雑性の間の新しい接続を確立する。
低魔法で計算可能な関数は通信コストが低いことを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:14:25 GMT)
SpyChain: Multi-Vector Supply Chain Attacks on Small Satellite Systems [0.7] 小さな衛星は科学的、商業的、防衛的な任務に不可欠なものであるが、商用オフ・ザ・シェルフ(COTS)のハードウェアに依存して攻撃面を広げる。
SpyChainは、小型衛星をターゲットとする独立したハードウェアサプライチェーンの、最初のエンドツーエンドの設計と実装である。
NASAの衛星シミュレーション(NOS3)を用いて、SpyChainがテストを避け、テレメトリを除去し、操作を妨害し、DoS攻撃を発射できることを実証した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:21:40 GMT)
SiLVR: Scalable Lidar-Visual Radiance Field Reconstruction with Uncertainty Quantification [0.6] 本稿では,ライダーと視覚データを融合したNeRFを用いた大規模再構成システムを提案する。
我々のシステムはライダーを組み込むために最先端のNeRF表現を採用する。
ライダーデータを追加すると、深さと表面の正規値に強い幾何学的制約が加わる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:23:59 GMT)
Ethical AI prompt recommendations in large language models using collaborative filtering [0.6] 大規模言語モデル(LLM)はAI開発を形作るため、倫理的なプロンプトレコメンデーションを保証することが不可欠である。
本稿では,コラボレーティブ・フィルタリング(コラボレーティブ・フィルタリング,レコメンデーション・システム)を用いて倫理的プロンプト選択を強化することを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:03:21 GMT)
Human Action Recognition from Point Clouds over Time [0.6] 本稿では,シーンの背景から人点雲を分割するパイプラインを導入することで,3次元映像からの行動を認識する新しい手法を提案する。
この方法は、深度センサと単眼深度推定の両方から点雲をサポートする。
実験では、認識精度を高めるために、表面の正常、色、赤外線強度、身体部分解析ラベルなどの補助的な特徴が組み込まれている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:08:17 GMT)
Efficient Generalization via Multimodal Co-Training under Data Scarcity and Distribution Shift [0.6] マルチモーダルコトレーニングは、ラベル付きデータが制限された状況におけるモデル一般化を強化するように設計されている。
この枠組みの理論的基礎を考察し、ラベルなしデータの使用が一般化の著しい改善につながる条件を導出する。
我々は、初めてマルチモーダルなコトレーニングコンテキストにおいて、ラベルのないマルチモーダルデータを活用することで得られる利点を分解し、定量化する新しい一般化境界を確立する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:13:17 GMT)
CNN-TFT explained by SHAP with multi-head attention weights for time series forecasting [0.6] 本稿では,畳み込み特徴抽出と時間融合変換器を組み合わせたハイブリッドアーキテクチャを提案する。
CNN-TFTは、確立されたディープラーニングモデルよりも優れており、平均絶対パーセンテージエラーは2.2%である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:08:28 GMT)
3-Local Hamiltonian Problem and Constant Relative Error Quantum Partition Function Approximation: $O(2^{\frac{n}{2}})$ Algorithm Is Nearly Optimal under QSETH [0.6] 局所ハミルトン問題の計算複雑性と量子分割関数(QPF)の近似について検討する。
どちらの問題もQMAハードであることが知られており、$mathsfBQP neq mathsfQMA$ という広く信じられている仮定の下では、効率的な量子アルゴリズムの出口は存在しない。
量子アルゴリズムがLHまたは近似QPFを3局所ハミルトニアンに対しても$O(2n/2)$よりもかなり高速に解くことはできないことを証明している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:45:24 GMT)
Delay Independent Safe Control with Neural Networks: Positive Lur'e Certificates for Risk Aware Autonomy [0.6] 本稿では,自律型学習可能制御システムに対するリスク認識型安全性保証手法を提案する。
我々は、局所セクター境界を持つニューラルネットワーク(NN)コントローラをモデル化し、線形で遅延非依存の証明書を導出する正の構造の活用を行う。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:22:28 GMT)
How much speech data is necessary for ASR in African languages? An evaluation of data scaling in Kinyarwanda and Kikuyu [0.6] 低リソースアフリカ語の自動音声認識システムの開発は, 音声データに制限があるため, 依然として困難である。
OpenAIのWhisperのような大規模多言語モデルの最近の進歩は、低リソースのASR開発に有望な経路を提供する。
2つのバントゥー言語に対する包括的実験によりWhisperの性能を評価する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:55:28 GMT)
Enhancing Few-shot Keyword Spotting Performance through Pre-Trained Self-supervised Speech Models [0.6] キーワードスポッティングは、バッテリー駆動エッジデバイスに対するハンズフリーインタラクションを可能にする上で重要な役割を果たす。
本研究では,自己指導型学習モデルを用いて,ロバストな特徴抽出,次元縮小,知識蒸留を行う訓練手法を提案する。
提案手法は,Multilingual Spoken Words Corpus (MSWC) とGoogle Speech Commands (GSC) データセットの英語部分に対して評価を行った。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:04:53 GMT)
A Multi-Agent Framework for Stateful Inference-Time Search [0.5] ステートフルなマルチエージェント進化探索は、永続的な推論時間状態、敵対突然変異、進化保存を組み合わせたものである。
エッジケースの生成による自動単体テスト生成の有効性を示す。
実験により、ステートフルなマルチエージェント推論フレームワークは、ステートレスなシングルステップベースラインよりもかなりの増加率を達成することが示された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:48:41 GMT)
A Case for Leveraging Generative AI to Expand and Enhance Training in the Provision of Mental Health Services [0.5] 我々は、メンタルヘルスサービス提供におけるトレーニングの強化と拡大に、生成AIをどのように利用できるかを示す。
生成的AIを使うことで、メンタルヘルスサービスの提供をトレーニングする上で、重要なメリットを強調します。
メンタルヘルスサービス提供における人材育成を支援するために、ジェネレーティブAIの使用に投資すべき理由を説明している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:44:52 GMT)
Real-Time Monitoring of Multimode Squeezing [0.4] マルチモード圧縮光は高次元量子技術の鍵となる資源である。
ここでは,マルチモード・スクイージングのリアルタイムモニタリングについて,私たちの知識を最大限活用するために初めて実演する。
我々は、我々の知る限り、パルス光で記録された最高級のスクイーズとして、最大で7.9 pm 0.6$ dBの高純度スクイーズを観測した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:28:05 GMT)
Vacuum Spiker: A Spiking Neural Network-Based Model for Efficient Anomaly Detection in Time Series [0.4] 異常検出は、業界、医療、サイバーセキュリティといった分野における重要なタスクである。
本稿では,時系列における異常検出のための新しいスパイキングニューラルネットワーク方式であるtextitVacuum Spikerアルゴリズムを提案する。
新たな検出基準が組み込まれており、復元や予測エラーよりも、脳活動のグローバルな変化に依存している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:43:54 GMT)
Quantum Annealing for Realistic Traffic Flow Optimization: Clustering and Data-Driven QUBO [0.4] 本稿では、トラフィック最適化を擬似非制約バイナリ最適化として再構成するデータ駆動方式を提案する。
このモデルは、シミュレーションされた現実的なモビリティデータ、複数のルーティング代替品、分析的に導出されたペナルティ制約を統合する。
最大25,000台の車両のベンチマークでは、ハイブリッド量子アニールは古典的解法であるグロビの1%以内で最適に近い解が得られることが示されている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:47:33 GMT)
VelLMes: A high-interaction AI-based deception framework [0.3] 本稿では,VelLMesと呼ばれるAIによる偽装フレームワークを提案する。
VelLMesは人間に攻撃されるように設計されているため、対話性とリアリズムがそのパフォーマンスの鍵となる。
生成能力と偽装能力を評価した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:00:23 GMT)
DPGIIL: Dirichlet Process-Deep Generative Model-Integrated Incremental Learning for Clustering in Transmissibility-based Online Structural Anomaly Detection [0.3] 本研究では、ディリクレプロセスディープ生成モデル統合インクリメンタルラーニング(DPGIIL)と呼ばれる新しいクラスタリングフレームワークを提案する。
オンライン構造異常検出では、DPGIILは入力データを新しいクラスタに動的に割り当てることで異常を検出するだけでなく、異なるクラスタを使って異なる構造状態を示すことができる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:14:42 GMT)
Quantum Machine Learning in Multi-Qubit Phase-Space Part I: Foundations [0.3] 位相空間における1および多ビット系に対する閉かつ構成可能な動的定式化を構築する。
これは、量子ビットの数と線形にスケールする領域における調和的支持の観点から、次元性の呪いを再送する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:26:16 GMT)
The Algebra of Meaning: Why Machines Need Montague More Than Moore's Law [0.3] モデレーション、脆さ、不透明なセマンティクスは、データやスケール制限よりも、型理論的なセマンティクスの欠如の兆候である、と我々は主張する。
モンタギューの型付き合成代数学としての言語観に基づいて、アライメントを解析問題として再放送する。
本稿では、発話を記述型論理形式にコンパイルする、ニューロシンボリック言語であるSavaiを紹介する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:22:26 GMT)
Mirrored Entanglement Witnesses for Multipartite and High-Dimensional Quantum Systems [0.3] 絡み合い証人(英: Entanglement witnesses, EWs)は、量子情報理論における絡み合い状態を検出する汎用的なツールである。
マルチパーティライト量子ビット状態と高次元システムのためのミラーEWを開発し,検討する。
この結果により,多部量子系および高次元量子系における大きな絡み合った状態の集合を検出するEWの能力が向上した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:32:37 GMT)
Spatiotemporal Tile-based Attention-guided LSTMs for Traffic Video Prediction [0.3] この要約では、Traffic4Cast Challenge 2019のソリューションについて説明します。
このタスクは、きめ細かい(ピクセルレベルの)空間構造と粗い(領域レベルの)空間構造の両方をモデル化する必要がある。
タイル認識型,カスケードメモリのConv-LSTMを,クロスフレーム付加的注意とメモリフレキシブルなトレーニングスキームで拡張した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:42:44 GMT)
Autonomy-Aware Clustering: When Local Decisions Supersede Global Prescriptions [0.3] 我々は,その形態を事前に知ることなく,地域自治の影響を学習し,考慮するフレームワークである自律型クラスタリングを導入する。
また,アダプティブ距離推定ネットワーク(ADEN, Adaptive Distance Estimation Network)を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:05:52 GMT)
Comparison of Fully Homomorphic Encryption and Garbled Circuit Techniques in Privacy-Preserving Machine Learning Inference [0.3] 本研究は、セキュアニューラルネットワーク推論のためのFHE(Fully Homomorphic Encryption)とGC(Garbled Circuits)の比較評価を行う。
2層ニューラルネットワーク(NN)は、Microsoft SEALライブラリ(FHE)のCKKSスキームとIntelLabsのTinyGarble2.0フレームワーク(GC)を使用して実装された。
モジュラGCは高速な実行とメモリ消費の削減を提供する一方、FHEは非インタラクティブ推論をサポートしている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:03:40 GMT)
LatteReview: A Multi-Agent Framework for Systematic Review Automation Using Large Language Models [0.3] LatteReviewはPythonベースのフレームワークで、大規模言語モデル(LLM)とマルチエージェントシステムを活用して、体系的なレビュープロセスの重要な要素を自動化する。
このフレームワークは、外部コンテキストを組み込むRetrieval-Augmented Generation (RAG)、マルチモーダルレビュー、構造化された入力と出力に対するPydanticベースの検証、大規模データセットを扱う非同期プログラミングなどの機能をサポートしている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:55:02 GMT)
Constructive counterexamples to the additivity of minimum output Rényi entropy of quantum channels for all $p>1$ [0.3] すべての$p>1$に対して、厳密な部分付加最小出力 R'enyi エントロピーを持つ明示的な量子チャネルを示す。
この例は、高幾何測度の絡み合いを持つ線型部分空間の明示的な構成によって提供される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:02:55 GMT)
Quantum Resources in Non-Abelian Lattice Gauge Theories: Nonstabilizerness, Multipartite Entanglement, and Fermionic Non-Gaussianity [0.3] 非アベリア対称性はアベリア対称性よりも必ずしもシミュレートが難しいとは限らない。
この結果から,LGTのシミュレーションにおいて量子的優位性が生じる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:00:02 GMT)
Potential of multi-anomalies detection using quantum machine learning [0.3] 振動解析では、一級SVMと組み合わされたARモデル係数を用いて異常を検出する。
本研究では,量子カーネルを用いた一級SVMにおける古典的カーネルの置換効果について検討する。
以上の結果から,古典ガウス (RBF) カーネルに対する量子カーネルの利点が明らかとなった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:24:14 GMT)
MaizeStandCounting (MaSC): Automated and Accurate Maize Stand Counting from UAV Imagery Using Image Processing and Deep Learning [0.3] 低コストUAVで取得したRGB画像から, 自動メイズ育苗スタンドのロバストなアルゴリズムであるMaizeStandCounting(MaSC)を提案する。
MaSC は,(1) モザイク画像をパッチに分割し,(2) 生映像フレームをホモグラフィ行列でアライメントする。
MaSCは雑草や他の植生と雑草を区別し、検出の空間分布に基づいて行と範囲のセグメンテーションを行い、正確な行ワイドカウントを生成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:56:27 GMT)
Thousands of AI Authors on the Future of AI [0.3] ほとんどの回答者は、AIの進歩の長期的な価値についてかなりの不確実性を示した。
半数以上が、AIに関連する6つのシナリオについて、"実質的"または"極端"の懸念が保証されていることを示唆している。
AIの進歩が人類の未来に良くなるかどうかについては意見の相違があった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:38:53 GMT)
Nonlinear photonic architecture for fault-tolerant quantum computing [0.3] 本稿では,強い単一光子非線形性をフォトニックGHZ測定に基づくアーキテクチャに組み込んだ,フォールトトレラント量子コンピューティングのための新しいアーキテクチャを提案する。
本研究は, 非線形プリミティブの導入により, フォールトトレラント量子コンピューティングの実用的な実装において, 劇的な改善がもたらされたことを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:13:04 GMT)
High-Performance Imaging in a Dilution Refrigerator [0.3] 希釈冷凍機に組み込まれた強靭で多用途な共焦点イメージングシステムについて報告する。
画像の解像度は1.1mmで視野は2.5mmである。
このシステムはスケーラブルで統合された量子光学技術の開発を促進する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:22:42 GMT)
Tempo: Compiled Dynamic Deep Learning with Symbolic Dependence Graphs [0.3] グラフベースのコンパイルのプログラム全体の最適化と、熱心な実行のダイナミズムを組み合わせた新しいディープラーニングシステムであるTempoについて述べる。
我々は,Tempo が Llama-3.2-3B 復号化のために JAX 上で 7$times$ の高速化を達成したことを示す。
強化学習アルゴリズムでは、Tempoは54$times$のスピードアップを実現し、16$times$のピークメモリ使用率を下げる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:36:12 GMT)
Symbolic-Diffusion: Deep Learning Based Symbolic Regression with D3PM Discrete Token Diffusion [0.3] 本稿では,D3PMに基づく離散状態空間拡散モデルを提案する。
我々は, 自己回帰を用いた拡散型生成手法により, 自己回帰的生成よりも性能が向上することが実証された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:31:25 GMT)
Sequential quantum processes with group symmetries [0.2] コンパクト群$G$および$H$に対する$(G times H)$不変量子コムの正準回路分解を示す。
我々は、未知のユニタリ演算 $U in MathrmSU(d)$ をその逆 $Udagger$ に変換するか、$Utop$ を変換する最適量子コムを導出する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:58:08 GMT)
PTEB: Towards Robust Text Embedding Evaluation via Stochastic Paraphrasing at Evaluation Time with LLMs [0.2] 評価時に意味的パラフレーズを生成し,複数の実行で結果を集約する動的プロトコルであるParaphrasing Text Embedding Benchmark (PTEB) を導入する。
文エンコーダの性能は意味論が固定されたままでもトークン空間の変化に敏感であるという仮説を検証する。
結果は複数の実行に対して統計的に堅牢であり、実験を10言語をカバーする3つのデータセットに拡張しました。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:37:19 GMT)
Error correction phase transition in noisy random quantum circuits [0.2] 雑音量子回路を用いて論理情報を符号化する作業について検討する。
定常的な情報レートを符号化するノイズ回路において、この手法が深度と雑音率の最良のトレードオフであることを厳密に証明する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:21:09 GMT)
Evaluating Fundus-Specific Foundation Models for Diabetic Macular Edema Detection [0.2] 糖尿病黄斑浮腫 (DME) は糖尿病網膜症 (DR) における視覚障害の主要な原因である
深層学習は、基底画像からこの状態を自動的に検出する有望な結果を示している。
ファンデーションモデル(FM)が特にDME検出に対処できるかどうかは不明である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:41:02 GMT)
Alpha-bit state merging [0.2] 状態マージは、量子テレポーテーションを一般化する量子情報理論の基本的なプロトコルである。
量子通信資源として,量子ビットよりも弱いAlpha-bitsを用いて,状態のマージを行う。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:16:58 GMT)
Universal pulses for superconducting qudit ladder gates [0.2] 隣接したキュディットレベル間の高速かつ高忠実なユニタリ回転を生成するための普遍パルス構成を提案する。
我々は,複数の制御誤差を抑え,既存手法より優れた高精度な解析パルススキームを導出する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:25:23 GMT)
The Behavioural Translation Style Space: Towards simulating the temporal dynamics of affect, behaviour, and cognition in human translation production [0.2] 本稿では,行動翻訳可能なパターンを記述した新しい行動翻訳スタイル空間(BTSS)を提案する。
身体的な翻訳行為を行う際には、観察可能な翻訳行動が基本であるが、高次認知過程や感情的な翻訳状態によって引き起こされ、形作られると仮定する。
我々は、隠れた心的処理構造の指標としてキーストロークと視線データを分析し、その行動パターンを多層組み込みBTSSとして整理する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:39:24 GMT)
Cancer Diagnosis Categorization in Electronic Health Records Using Large Language Models and BioBERT: Model Performance Evaluation Study [0.2] がん患者3456例のICD (International Classification of Diseases, 436free-text entrys) について, 762例の診断を行った。
モデルは、診断を14の既定のカテゴリに分類する能力で試験された。
GPT-3.5、Gemini、Llamaは両方のフォーマットで全体的なパフォーマンスを低下させた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:50:40 GMT)
Quantum simulation of chemistry via quantum fast multipole method [0.2] 量子コンピュータ上での量子化学をシミュレーションする手法について述べる。
このアプローチは、高階積公式を用いて伝播する分子ハミルトニアンの実空間第一量子化表現を用いる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:00:01 GMT)
BIM-Constrained Optimization for Accurate Localization and Deviation Correction in Construction Monitoring [0.2] 建築モニタリングのためのAR(Augmented Reality)アプリケーションは、建築要素を可視化するためのリアルタイム環境トラッキングに依存している。
しかし, 建設現場は, 特徴のない表面, 動的変化, 漂流蓄積などにより, 従来の追跡手法に重要な課題を呈している。
本稿では,これらの課題に対処するBIM対応ドリフト補正手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:20:54 GMT)
Interpretable Robot Control via Structured Behavior Trees and Large Language Models [0.1] 本稿では,自然言語理解とロボット実行を橋渡しする新しい枠組みを提案する。
提案手法は実世界のシナリオでは実用的であり、平均的な認識と実行の精度は約94%である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:28:52 GMT)
Cyber Slavery Infrastructures: A Socio-Technical Study of Forced Criminality in Transnational Cybercrime [0.1] 技術的に促進された強制犯罪の変種である「サイバー奴隷制度の台頭」は、人身売買とデジタル搾取の収束に関する意味合いを示している。
本研究では,実世界のサイバートラクシング事件から抽出した事例レベルのメタデータと,体系的な物語レビューを組み合わせたハイブリッド定性計算手法を採用する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:38:23 GMT)
A2AS: Agentic AI Runtime Security and Self-Defense [0.1] A2ASフレームワークはAIエージェントとLLMベースのアプリケーションのセキュリティレイヤとして導入された。
A2ASは認証された動作を実行し、モデルの自己防衛を起動し、コンテキストウィンドウの整合性を保証する。
セキュリティ境界を定義し、プロンプトを認証し、セキュリティルールとカスタムポリシーを適用し、エージェントの動作を制御する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:28:04 GMT)
Reinforcement Learning for Dynamic Memory Allocation [0.1] 本稿では,RLエージェントがシステムとのインタラクションから連続的に学習し,メモリ管理の戦術を改善する枠組みを提案する。
その結果、RLは従来のアロケーション戦略にマッチし、超えるエージェントを訓練できることがわかった。
また,アロケータの複雑な要求パターン処理能力を高めるために,従来のアロケーション要求を利用した履歴対応ポリシの可能性についても検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:03:22 GMT)
Early Results from Teaching Modelling for Software Comprehension in New-Hire Onboarding [0.1] システム思考と Labelled Transition System (LTS) モデルを導入した5段階のコースの結果を報告する。
参加者は構造化テンプレートを使って製品の振る舞いを理解し、事前評価と後評価を完了した。
短期的なモデリングに焦点を当てた介入は、準備不足の新規雇用の理解を加速させる可能性がある。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:35:57 GMT)
Neuromorphic Computing -- An Overview [0.1] ニューロモルフィックコンピューティング(Neuromorphic computing)という新しい時代に、人間の脳の例を追求する新たな分野が登場した。
本稿では、ニューロモルフィックコンピューティングの紹介、これや他の新しいコンピューティングシステムがなぜ必要か、そしてニューロモルフィック分野に現在存在する技術について述べる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:21:07 GMT)
Recurrence-Complete Frame-based Action Models [0.1] Attention Is All You Need" は、RNN細胞は注意とともに必要ではないと主張していることで有名である。
我々は、非再帰完全モデルが入力を正しく集約できない臨界時間tを予想する。
これを解決するために、繰り返し完全アーキテクチャを導入し、GitHubから派生したアクションシーケンスでトレーニングします。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:50:41 GMT)
Quick-CapsNet (QCN): A fast alternative to Capsule Networks [0.1] 我々はCapsNetの高速な代替手段としてQuick-CapsNet(QCN)を紹介した。
QCNは少ない数のカプセルを生産し、ネットワークを高速化する。
MNIST、F-MNIST、SVHN、Cifar-10データセットでは推論が5倍高速である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:41:28 GMT)
Physics-Informed Optimisation of Conveyor Mode Spin Qubit Transport [0.1] シリコン系量子ドットデバイスにおけるコンベヤモード電子輸送を可能にする静電バイアス方程式を最適化するための物理インフォームドアルゴリズムを提案する。
提案手法は, 自己整合ポアソンとシュロディンガーソルバを組み合わせることで, 一定の基底エネルギーを維持し, ほぼ一定速度のシャットリングを可能にする。
我々は,このアルゴリズムを,FD-SOI (Fully-Depleted Silicon on Insulator) ,SiMOS (Si Metal-Oxide-Seminconductor) ,Si-Germanium Heterostracture (Si/SiGe) の3つの代表的な技術で検証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:27:14 GMT)
Fisher Information, Training and Bias in Fourier Regression Models [0.1] 本研究では,ある課題に対するモデルの効果次元とエンペビアの間の相互作用について検討する。
学習すべき関数に対して完全に非依存的、あるいはバイアスのないモデルでは、より効果的な次元がトレーニング性とパフォーマンスの向上をもたらす可能性が示されている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:29:11 GMT)
Differential Privacy for Adaptive Weight Aggregation in Federated Tumor Segmentation [0.1] Federated Learning(FL)は、個々のクライアントデータのプライバシを尊重しながら、公平なグローバルモデルを作成することによって、プライバシを保護する分散機械学習アプローチである。
医用画像セグメンテーションにおける差分プライバシー(DP)統合ディープラーニングフレームワークを提案する。
我々は, 類似度重み付け法(SimAgg)を, 脳腫瘍セグメント化のための差分プライベート類似度重み付けアルゴリズムDP-SimAggアルゴリズムに拡張する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:53:55 GMT)
An Evaluation Study of Hybrid Methods for Multilingual PII Detection [0.0] 本稿では,決定論的正規表現と文脈認識型大規模言語モデル(LLM)を組み合わせて,スケーラブルなPII検出を行うRECAPを提案する。
重み付きF1スコアでは,NERモデルでは82%,ゼロショットLLMでは17%の精度で性能が向上した。
この作業は、コンプライアンスにフォーカスしたアプリケーションにおいて、効率的なPII検出のためのスケーラブルで適応可能なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:03:59 GMT)
Theoretical Guarantees of Variational Quantum Algorithm with Guiding States [0.0] 変分量子アルゴリズム(VQA)は、短期的な量子優位性の有力な候補であるが、収束と一般化の厳密な保証がない。
本稿では, 量子多体系の基底状態特性の予測を目的とした, 誘導状態を持つ変分量子アルゴリズムを提案する。
誘導状態は収束を加速し、有限サイズの誤差項を抑え、系次元の安定性を確保する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:45:22 GMT)
Unified Framework for Direct Characterization of Kraus Operators, Observables, Density Matrices, and Weak Values Without Weak Interaction [0.0] 一般化された量子測定は、オープン量子系における現実的なプロセスのモデリングに不可欠である。
量子プロセストモグラフィーはPOVMを完全に特徴付けることができるが、特定のPOVM要素だけが興味を持つ場合、リソース集約的で実用的ではない。
直接量子計測トモグラフィーはより効率的な代替手段を提供するが、通常はシステムの弱い相互作用と複雑な構造に依存している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:40:07 GMT)
Diffusion Codes: Self-Correction from Small(er)-Set Expansion with Tunable Non-locality [0.0] グラフ上に各エッジを接続するビットとチェックを配置することで、拡散符号と呼ばれるコードのクラスを導入する。
SWAPネットワークの深さを調整することにより、ランダム性の間のトレードオフを調整できる。
トーラス上に定義された量子LDPC符号は、より小さいセット境界とコバウンダリ展開を持つ。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:17:34 GMT)
VeMo: A Lightweight Data-Driven Approach to Model Vehicle Dynamics [0.0] 本稿では,ゲートリカレントユニット層に基づく軽量エンコーダデコーダモデルを提案する。
その結果, 極端な動的条件下では, 平均相対誤差が2.6%以下であることがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:48:51 GMT)
Variational formulae for entropy-like functionals for states in von Neumann algebras [0.0] 本稿では、半有限フォン・ノイマン代数上の正規状態に対して、セガルやレーニエントロピーを含むエントロピー様函数の変分式を提案する。
結果は有限代数と半有限代数の両方をカバーし、得られた公式は既知の結果、特に相対エントロピーに関する結果を一般化する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:54:26 GMT)
Validation of Various Normalization Methods for Brain Tumor Segmentation: Can Federated Learning Overcome This Heterogeneity? [0.0] Federated Learning(FL)は、データプライバシ、ストレージ、転送に関する問題を克服するトレーニングパラダイムである。
本研究では,MRI強度正規化法をデータサブセットの分離に適用することにより,非IID条件をシミュレートする。
FL法はクライアント間で不整合に正規化されたデータに対してレジリエンスを示し、3D Diceスコアは92%に達した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:21:53 GMT)
Universal Precision Limits in General Open Quantum Systems [0.0] 開量子系における一般可観測物の精度に関する普遍的境界を導出する。
時間非対称電流の相対的揺らぎはエントロピー生成だけでなく、この非対称性によっても制約されることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:42:06 GMT)
Unitary Quantum Cellular Automata for Density Classification [0.0] 量子セルオートマトンフレームワークにおける密度分類タスク(DCT)について検討する。
分割量子セルオートマトン(PUQCA)を数保存モデルとして用いる。
固定されたシステムサイズでDCTを解くルールを見つけ,その性能を解析する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:30:40 GMT)
Train-Free Segmentation in MRI with Cubical Persistent Homology [0.0] トポロジカルデータ解析(TDA)に基づくMRIスキャンのセグメンテーションのための新しいフレームワークを提案する。
パイプラインは3つのステップで進み、まずオブジェクト全体を自動しきい値によってセグメントに識別し、次に事前にトポロジが知られている固有のサブセットを検出し、最後にセグメンテーションの様々なコンポーネントを推論する。
脳MRIにおけるグリオ芽腫の分画、心筋MRIにおける心筋、シリンダー形成、胎児脳MRIにおける皮質プレート検出の3つの応用について検討した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:59:15 GMT)
Towards Generalization of Graph Neural Networks for AC Optimal Power Flow [0.0] 機械学習アプローチは、計算スピードアップを提供するが、再トレーニングせずにスケーラビリティとトポロジ適応性に苦労する。
HH-MPNN(Hybrid Heterogeneous Message Passing Neural Network)を提案する。
HH-MPNNはバス、ジェネレータ、ロード、シャント、トランスミッションライン、トランスフォーマーを異なるノードまたはエッジタイプとしてモデル化する。
数千の目に見えないトポロジにゼロショットを適用したHH-MPNNは、デフォルトトポロジのみのトレーニングにもかかわらず、3%未満の最適性ギャップを達成した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:28:46 GMT)
The Limits of Goal-Setting Theory in LLM-Driven Assessment [0.0] 多くのユーザーは、ChatGPTのようなAIツールと対話し、システムを人間らしく扱うメンタルモデルを使います。
そこで本研究では,ChatGPTが29名の学生を対象に,特定度を増す4つのプロンプトを用いて,その仮定を検証した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:20:40 GMT)
The Hilbert-space structure of free fermions in disguise [0.0] ハミルトン多様体は自由フェルミオンに写像できるスピン鎖を記述するが、ジョルダン・ウィグナー変換を経由しない。
FFD ハミルトニアンに付随するヒルベルト空間を特徴づける一連の結果を提供する。
我々の構成により、すべてのハミルトニアン固有空間の指数退化が完全に解決できる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:55:22 GMT)
Textual interpretation of transient image classifications from large language models [0.0] 大規模言語モデル(LLM)は、3つの光過渡的なサーベイデータセット上での畳み込みニューラルネットワークのパフォーマンスレベルにアプローチすることができる。
GoogleのLLMであるGeminiは、さまざまな解像度とピクセルスケールにまたがるデータセットの平均精度を93%達成している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:12:46 GMT)
Tensor-Programmable Quantum Circuits for Solving Differential Equations [0.0] フレキシブル行列積演算子表現に基づく偏微分方程式の量子解法を提案する。
フレームワークの能力は線形および非線形偏微分方程式に対して実証される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:52:30 GMT)
TGPR: Tree-Guided Policy Refinement for Robust Self-Debugging of LLMs [0.0] 本稿では,GRPOとThompson-Samplingベースの木探索を組み合わせた新しいフレームワークであるTree-Guided Policy Refinement(TGPR)を紹介する。
また,HumanEval,MBPP,APPSのベンチマークでは,最大4.2ポイントのpass@1(MBPP)絶対改善を達成し,最大12.51ポイントのpass@10(APPS)絶対改善を競合GRPOベースラインと比較した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:47:05 GMT)
Squeezing light with optomechanical and spin-light quantum interfaces [0.0] 我々は超低温の原子スピンアンサンブルとマイクロメカニカル膜を利用して光の偏光スキューズを生成する。
我々は、スピンに対して$C_mathrmqu =10$、膜に対して$C_mathrmqu =9$の最大協調性を得る。
我々の研究結果は、スピンと機械的自由度が光によってコヒーレントに結合されるハイブリッド量子システムへの道を開いた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:31:08 GMT)
Spiral Model Technique For Data Science & Machine Learning Lifecycle [0.0] 本稿では、データサイエンスのライフサイクルを明確な目的を持つビジネス問題に組み込む新しい手法を提案する。
ビジネスプロセスに対する汎用性、アジリティ、反復的アプローチを強調するために、スパイラルテクニックと呼ばれる新しいテクニックが導入されている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:11:58 GMT)
Spectral properties and coding transitions of Haar-random quantum codes [0.0] 非ゼロ誤差閾値の量子誤り訂正符号は、エラー率がその閾値に達すると混合状態の位相遷移を行う。
本研究では、Haar-random量子符号のしきい値がハッシュ境界を飽和させ、ランダムなエンハンスタビライザ符号のしきい値と一致することを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:00:13 GMT)
Spatial Uncertainty Quantification in Wildfire Forecasting for Climate-Resilient Emergency Planning [0.0] マルチモーダル地球観測データを用いた山火事拡散予測における空間的不確実性の最初の系統的解析を行った。
我々の新しい距離測定により、予測された消火線の周囲に20-60mの緩衝帯を形成する高不確かさ領域が明らかとなった。
この作業により、気候変動による火災リスクの増加に対応するコミュニティを支援する、より堅牢な山火事管理システムが実現される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:47:14 GMT)
Software Framework for Optically Accessible Quantum Memory Using Group-IV Color Centers in Diamond [0.0] 光アクセス可能な量子メモリは、量子リピータや2要素認証などのデバイスのための重要なビルディングブロックである。
私たちが記述したメモリは、高効率の空洞に結合されたスズ空洞の色中心に基づいている。
高忠実率の分数単一キュービットゲートを光学式$pi/8$パルスで実装している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:13:20 GMT)
Simulation-based inference via telescoping ratio estimation for trawl processes [0.0] 本稿では,高速で高精度なMarkovベースの推論フレームワークを提案する。
チェビシェフ近似を用いて独立な後続サンプルを効率よく生成し,連鎖モンテカルロ法が混在しても正確な推論を可能にする。
エネルギー需要データに適用した柔軟な無限分割可能なモデルのクラスであるトロールプロセスにおいて,本手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:20:39 GMT)
Shedding light on classical shadows: learning photonic quantum states [0.0] 我々は、ランダム化された受動線形光変換と光子数測定によるフォトニック量子状態の学習のための古典的なシャドウプロトコルを導入する。
このスキームは、多くの観測可能な関心事に有効であることを示す。
我々のプロトコルは、幅広いフォトニック状態特性のスケーラブルな学習を可能にし、すでに豊富な古典的影の応用をフォトニックプラットフォームに適用する方法を舗装する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:06:40 GMT)
Self-testing in the compiled setting via tilted-CHSH inequalities [0.0] 量子時間証明器がベルの不等式を少なくとも2つの非通信量子プローバーによって達成された違反よりも無視できることを示す。
また,コンパイルされた設定に対する部分的自己テストの概念を導入し,二部構成における自己テストの弱い形式に類似する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:58:21 GMT)
Reproducible Evaluation of Data Augmentation and Loss Functions for Brain Tumor Segmentation [0.0] 本研究は脳腫瘍MRIにおけるU-Netセグメンテーション性能の再現性評価を焦点損失と基本データ拡張戦略を用いて行った。
焦点損失のあるU-Netは、最先端の結果に匹敵する90%の精度を達成した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:15:28 GMT)
Representation Gap of the Motzkin Monoid [0.0] 表現ギャップは、最小の非自明な表現のサイズとして定義され、これらのアルゴリズムのセキュリティを評価する指標として機能する。
本稿では,ロバストな暗号アルゴリズムの候補として,図式モツキンモノイドが大きな表現ギャップを示すことを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:59:10 GMT)
Realistic Threat Models for Fiber and Free-Space Continuous-Variable Quantum Key Distribution [0.0] 連続可変量子鍵分布(QKD)は、セキュアな量子通信のための強力な設定を提供する。
CV-QKDプロトコルの達成可能な性能は、損失とノイズの両方に対して脆弱であるように見えるという事実によって制限されている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:57:15 GMT)
Quantum-Kaniadakis entropy as a measure of quantum correlations through implicit bounds [0.0] 負条件量子カニアダキスエントロピー(alpha-$CQKE)と完全絡み合い率(FEF)の関係について検討する。
FEFは、テレポーテーションや量子ステアビリティを含む量子情報処理プロトコルの実質的なヤードスティックである。
我々は、負の$alpha-$CQKEを射影測定のための等方性状態のk-copy steerabilityにリンクする命題を定式化する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:07:12 GMT)
Quantum speed limits based on Jensen-Shannon and Jeffreys divergences for general physical processes [0.0] 一般物理過程における有限次元量子系の量子速度制限(QSL)について論じる。
結果は閉量子系と開量子系の両方に適用できる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:19:51 GMT)
Quantum Phase Space Approach to the Ideal Fermi and Bose Gases [0.0] 改良されたモデルは、最近開発された量子位相空間(QPS)の概念と量子力学のQPS表現に基づいて構築される。
研究はナノスケールシステム、量子ガス、低温物理学、超低温物理学、天体物理学のさらなる応用の基礎となる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:59:08 GMT)
Quantum Filtering of Hydrogen Isotopes through Graphene [0.0] 二次元グラフェン層による同位体の濾過は、同位体分離のための非常に効率的な量子力学的手法を提供する。
グラフェン層による量子フィルタリングは、重水素をプロチウムから分離することで濃縮する有効な手法であることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:07:40 GMT)
Quantum Computing Methods for Malware Detection [0.0] SVMと比較して量子支援ベクトルマシン(QSVM)アルゴリズムの性能について検討する。
異なる特徴マップを通して量子カーネルを組み込んだQSVMアルゴリズムを,Qiskit SDKおよびIBM量子コンピュータ内のローカルシミュレータ上で実装し,評価した。
本稿では,Qiskit Machine Learningライブラリのベースコードに対して開発・適用する必要があった修正とともに,発生した重要な問題について詳述する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:31:31 GMT)
Quantum Approximate Optimization Algorithm: Performance on Simulators and Quantum Hardware [0.0] 量子コンピュータ上で量子回路を実行することは、シミュレーターとは異なり、必ずしも「クリーン」な結果を生成するとは限らない。
本稿では、量子ノイズに対する反応を異なる方法で観測するための異なる最適化方法、手法、誤差軽減手法について検討する。
他の研究者にとって、実際の量子ハードウェア上でQAOAを実行する複雑さとノイズに対処する際の課題を理解するのに役立つ。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:04:21 GMT)
Quantum Algorithm for Binary Vector Encoding and Retrieval Utilizing the Permutation Trick [0.0] 本研究では,次元 m の k 個の二進ベクトルに対する新しい量子記憶アルゴリズムを,置換法に基づく m 量子ビット量子状態の重ね合わせに提案する。
m量子ビット量子状態で表されるkベクトルの重ね合わせから二進ベクトルを取得するためには、Groverアルゴリズムの修正版を使う必要がある。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:08:15 GMT)
Pseudo-MDPs: A Novel Framework for Efficiently Optimizing Last Revealer Seed Manipulations in Blockchains [0.0] 本研究では,マルコフ決定過程(MDP)を限定クラスで解く際の計算課題に取り組む。
これはLast Revealer Attack (LRA)によって動機付けられ、資本化(B Market)のようなPoS(Proof-of-Stake)ブロックチェーンの公平性を損なう。
疑似MDP(pMDP)は,このような問題を自然にモデル化し,標準的なMDPに2つの異なる問題を還元するフレームワークである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:39:20 GMT)
Proposal for realizing Heisenberg-type quantum-spin models in Rydberg atom quantum simulators [0.0] 本研究は, 磁場印加により, XXZモデルの異方性パラメータを調整可能であることを示す。
我々は、Rydberg原子量子シミュレータにおけるスピン1/2およびスピン-1ハイゼンベルク型量子スピンモデルの実験的実現を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:07:16 GMT)
Polyhedral Classical Simulators for Quantum Computation [0.0] 多面体幾何学を基礎とした古典シミュレーションの枠組みである,多面体古典シミュレータを紹介する。
このフレームワークは,従来のシミュレーション手法を統一し拡張すると同時に,より効率的な古典シミュレーションの境界を推し進めるための幾何学的ロードマップを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:55:55 GMT)
Pingmark: A Textual Protocol for Universal Spatial Mentions [0.0] Pingmarkは、空間コンテキストを最小限のシンボルで表現するための普遍的なテキストプロトコルを定義している。
本稿では、Pingmark Protocol Specification(PPS v0.1)のモチベーション、構文、設計、参照レゾルバの実装、空間参照のためのオープンインターネット標準としてPingmarkを確立するという長期的な目標について述べる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:25:38 GMT)
Pauli Stabilizer Models for Gapped Boundaries of Twisted Quantum Doubles and Applications to Composite Dimensional Codes [0.0] 本稿では,Abelian合成次元ツイスト量子ダブルスのギャップ境界,領域壁,および0D$欠陥に対する安定化モデルの構築例を示す。
本アルゴリズムは,物理的に直感的な凝縮の概念を用いて,境界と磁壁の安定化器を構築する方法を明確に記述する。
本稿では,量子誤り訂正の急激な領域における符号の有用性について論じる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:24:48 GMT)
Out-of-Distribution Generalization in Climate-Aware Yield Prediction with Earth Observation Data [0.0] GNN-RNNとMMST-ViTの2つの最先端ディープラーニングモデルを現実的なアウト・オブ・ディストリビューション条件下でベンチマークする。
GNN-RNNは、地理的シフトの下では正の相関で優れた一般化を示し、MMST-ViTはドメイン内では良好に機能するが、OOD条件下では著しく劣化する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:27:12 GMT)
OpenJAI-v1.0: An Open Thai Large Language Model [0.0] OpenJAI-v1.0はタイ語と英語のオープンソースの大規模言語モデルである。
当社の作業は、慎重にキュレートされたデータによるパフォーマンス向上に重点を置いています。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:12:56 GMT)
On the false election between regulation and innovation. Ideas for regulation through the responsible use of artificial intelligence in research and education.[Spanish version] [0.0] この短いエッセイは、AIHUB(Debate Session of the AIHUB)とEduCaixa Summer School(英語版)の著者による回答の再検討である。
1 規制フレームワークは、規制とイノベーションの誤った二分法に陥ることなく、AI開発における基本的権利の保護を優先するにはどうすればよいのか?
この記事はこれらの3つの質問に答えようと試み、教育と研究における回答の関連性についていくつかの考察を加えて結論付けている。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:33:46 GMT)
On the emergence of quantum Darwinism and pointer states for non-commuting evolutions [0.0] 系のハミルトニアンとシステムと環境の間の相互作用ハミルトニアンが通勤しないとき、客観性の出現について検討する。
非可換進化は目的状態の出現を可能にするだけでなく、より緩和されたポインタ状態の定義を与えることが可能である。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:37:32 GMT)
On Univariate Sumcheck [0.0] 単元根に対する一変量和チェックの2つの候補手法を示す。
1つ目はマルチ線形評価プロトコルの形式であり、これは標準のマルチ変数の総和チェックプロトコルと組み合わせることができる。
もう1つは単変量和算から多線形評価への直接還元であり、ゲミニ(Bootle et al., Eurocrypt 2022)と組み合わせることができる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:29:18 GMT)
Objective Features Extracted from Motor Activity Time Series for Food Addiction Analysis Using Machine Learning - A Pilot Study [0.0] 食品依存度(FA)と症状数(SC)の客観的基準として,アクティメトリと機械学習が有効かを検討した。
これらの知見は、FAのデジタルバイオマーカーとして手首のアクティメトリをサポートし、アンケートを補完し、プライバシ保護臨床翻訳を促進する可能性がある。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:41:41 GMT)
Nonlinear Coupling between Motional Modes in Trapped Ion Quantum Processors [0.0] 本研究では, 3次クーロン項から生じる非線形運動-モード結合(NoMoCou)を同定し, シミュレーションするモデルを開発した。
我々は、低次共鳴から演算点をチューニングするための設計規則、スペクトルを再構成するためのトラップ異方性をチューニングし、形状ゲート波形を提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:25:55 GMT)
Noninteracting tight-binding models for Fock parafermions [0.0] 反復スピン-1/2$フェルミオンを1次元の4状態フォックパラフェルミオンに写像する。
相互作用しない4状態パラフェルミオンの占有数に対する熱力学的分布関数はスピン-1/2$フェルミオンへの写像と一致していることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 13:57:31 GMT)
NNDM: NN_UNet Diffusion Model for Brain Tumor Segmentation [0.0] 本稿では,NN-UNet の頑健な特徴抽出と拡散確率モデルの生成機能を統合するハイブリッドフレームワーク NNDM (NN_UNet Diffusion Model) を提案する。
提案手法では, NN-UNet が生成するセグメンテーションマスクを, 予測マスクと接地トラスマスクの残差分布を学習することにより, 段階的に改良する。
BraTS 2021データセットで行った実験は、NNDMが従来のU-Netやトランスフォーマーベースラインよりも優れた性能を発揮することを示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:19:08 GMT)
MultiCNKG: Integrating Cognitive Neuroscience, Gene, and Disease Knowledge Graphs Using Large Language Models [0.0] MultiCNKGは、認知神経科学知識グラフ(CNKG)、遺伝子オントロジー(GO)、疾患オントロジー(DO)の3つの重要な知識ソースを統合する革新的なフレームワークである。
我々は、遺伝子機構、神経学的障害、認知機能を相互に結合する結合型KGを作成するために、エンティティアライメント、セマンティック類似性、グラフ拡張を行います。
このKGは、パーソナライズド医療、認知障害診断、および認知神経科学における仮説定式化の応用を推進している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:59:32 GMT)
Modular interface for efficient optical readout of diamond quantum memory at cryogenic temperatures via single-mode optical fibers [0.0] デバイスおよび温度に関する変化から構造的に分離されたダイヤモンドにおける色中心のモジュラーインタフェースを提案する。
我々は,ゼロフォノンライン分光を含む単一モード光ファイバーによる高効率光子収集を室温および低温の両方で達成した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:01:19 GMT)
Mass-to-Horizon Relation and Entropy Beyond the Bekenstein-Hawking Limit [0.0] 宇宙論的な地平線に適用可能な一般化された質量-水平関係を導入する。
この定式化は、ベーケンシュタインエントロピー拡大の幅広いクラスを導出するための統一的な枠組みを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 22:20:23 GMT)
Local reminiscence in the PXP model [0.0] 我々は,Rydberg原子配列で実現された制約付きスピン系であるPXPモデルにおける局所的思い出の出現について検討した。
2つの特定の状態、$theta$-symmetric およびblockaded 状態は、システムサイズが大きくなるにつれて、一様に近い忠実さと変動を抑えながら、堅牢な局所的思い出を示す。
以上の結果から,非エルゴディックなレギュレーションは局所記憶を安定に保ちつつ,複雑なグローバルダイナミクスを実現することが可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 05:24:50 GMT)
Linguistic Patterns in Pandemic-Related Content: A Comparative Analysis of COVID-19, Constraint, and Monkeypox Datasets [0.0] 本研究では,パンデミック関連オンライン談話の言語学的解析を行う。
可読性,修辞的マーカー,説得的言語使用の有意な差異を同定した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 21:51:34 GMT)
Lectures in Quantum Gravity [0.0] この講義ノート集は、ノルディタのPh.D.スクール「量子重力」で6つのミニコースで取り上げられたトピックの選考を含んでいる。
その範囲は、その基礎から最前線の研究まで、異なる領域間のつながりを強調する、一貫性のある図を提供することであった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:27:19 GMT)
LLMs Show Surface-Form Brittleness Under Paraphrase Stress Tests [0.0] LLM(Large Language Models)のベンチマークスコアは、テスト項目の記憶や、ほぼ重複によって膨らませることができる。
本稿では,ベンチマーク質問のパラフレーズバージョンにおけるモデルの再評価により一般化を探索するプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:04:33 GMT)
LLM-Assisted Modeling of Semantic Web-Enabled Multi-Agents Systems with AJAN [0.0] AJANフレームワークはセマンティックWeb標準に基づいたマルチエージェントシステムを構築することができる。
RDF/RDFSとSPARQLベースのエージェント動作の適切な定義は、実際にはエージェントモデラーだけでなく、依然として大きなハードルである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:45:19 GMT)
JAI-1: A Thai-Centric Large Language Model [0.0] 本稿では,75Bパラメータを持つタイ語中心の言語モデルであるJAI-1を紹介する。
タイ語の知識を体系的に統合するために、アップスケーリング戦略を使用します。
このモデルはタイ中心のベンチマークでTyphoon2-70Bよりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:02:20 GMT)
Intelligent Healthcare Imaging Platform: A VLM-Based Framework for Automated Medical Image Analysis and Clinical Report Generation [0.0] 本稿では,視覚言語モデル(VLM)を活用した医用画像解析のためのインテリジェントマルチモーダルフレームワークを提案する。
このフレームワークはGoogle Gemini 2.5 Flashを統合し、腫瘍を自動的に検出し、CT、MRI、X線、超音波などの複数の画像モダリティで臨床報告を生成する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:41:31 GMT)
I Can't Patch My OT Systems! A Look at CISA's KEVC Workarounds & Mitigations for OT [0.0] 我々は,米国国土安全保障省が管理するKEVC(Known Exploitable Vulnerabilities Catalog)を分析した。
我々のチームは2025年7月までに全てのKEVCエントリを分析し、OT環境が既存の修復レコメンデーションにどの程度依存できるかを調べた。
KEVCのほとんどのエントリがOT環境に影響を与える可能性があるが、パッチの代替手段としてベンダの回避や緩和を含むのは13%に過ぎなかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:34:59 GMT)
Hyperinvariant Spin Network States -- An AdS/CFT Model from First Principles [0.0] 局所SU(2)対称性を取り入れた超不変テンソルネットワークの存在と限界について検討する。
本稿では,LQGにおける重力場のある量子状態において,AdS/CFT対応の重要な側面が実現されていることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:23:38 GMT)
Hamiltonian truncation and quantum simulation of strong-field QED beyond tree level [0.0] 強い背景場の量子電磁力学は、古典的および量子シミュレーションの興味深いクラスを提供する。
本稿では、高強度平面波と衝突する光子に対する偏光(ヘリシティ)フリップのシミュレーションを定式化する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:05:17 GMT)
GMLM: Bridging Graph Neural Networks and Language Models for Heterophilic Node Classification [0.0] 本稿では,事前学習したテキストエンコーダとグラフ畳み込みネットワーク(R-GCN)を効果的に融合するフレームワークを提案する。
5つのヘテロ親和性ベンチマークの実験により、我々の積分法は最先端の結果が得られることを示した。
これらの結果は,テキストリッチグラフ表現学習における融合戦略の有効性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:26:24 GMT)
Fundamental Costs of Noise-Robust Quantum Control: Speed Limits and Complexity [0.0] ノイズは量子システムにおいてユビキタスであり、量子情報科学の発展の大きな障害である。
ノイズロバストな量子制御は進化経路をエンジニアリングすることで高忠実度動作を実現し、一階ノイズコントリビューションを最終段階でキャンセルする。
我々は、このオーバーヘッドを有界制御振幅の下で準静電コヒーレントノイズに対して定量化する制御複雑性の一般的な下界を導出する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:21:33 GMT)
Function regression using the forward forward training and inferring paradigm [0.0] フォワードフォワード学習アルゴリズムは、バックプロパゲーションなしでニューラルネットワークをトレーニングするための新しいアプローチである。
本稿では,Forward-Forwardアルゴリズムを用いて関数の近似(関数回帰)を行う手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:41:14 GMT)
From Neural Sensing to Stimulation: An Interdisciplinary Roadmap for Neurotechnology [0.0] 神経技術は、脳と体の相互作用を計測し、解釈し、調節する方法を変えつつある。
臨床領域と非臨床領域にまたがるトランスフォーメーションポテンシャルを持つ。
この視点は神経テクノロジー開発の戦略的ロードマップを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:09:54 GMT)
Finding a Fair Scoring Function for Top-$k$ Selection: From Hardness to Practice [0.0] 我々は、上位k$選択のための公平な線形スコアリング関数を同定する問題に対処する。
既存のアルゴリズムは特に高次元において効率的にスケールしない。
我々は、この効率のポテンシャルを、実用的なパフォーマンス向上を実現する最適化されたアルゴリズムに変える。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:05:19 GMT)
Exposing Citation Vulnerabilities in Generative Engines [0.0] 我々は,生成エンジン(GE)が生成する回答を,引用パブリッシャとコンテンツ注入障壁の観点から分析する。
誰でもウェブで情報を公開できるので、GEは毒攻撃に弱い。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:47:48 GMT)
Exploring Teachers' Perceptions of ChatGPT Through Prompt Engineering [0.0] 本研究の目的は,中等教育における理科教育者が,迅速な工学教育を施した上で,ChatGPTに対する態度を向上するかどうかを検討することである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:53:29 GMT)
ExpertAgent: Enhancing Personalized Education through Dynamic Planning and Retrieval-Augmented Long-Chain Reasoning [0.0] ExpertAgentは、パーソナライズされた教育のために設計されたインテリジェントエージェントフレームワークである。
信頼できる知識を提供し、高度に適応的な学習体験を可能にする。
すべてのインストラクショナルコンテンツは、検証済みのカリキュラムリポジトリに基盤を置いています。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:03:34 GMT)
Evaluation of LLMs for Process Model Analysis and Optimization [0.0] ゼロショット設定でChatGPT(モデルo3)のような訓練を受けていないバニラが、画像からBPMNプロセスモデルを理解するのに有効であることを示す。
また、LLMの「思考プロセス」とプロセス分析と最適化の文脈でより深い推論を行う能力についても検討する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:39:19 GMT)
Evaluating LLMs for Historical Document OCR: A Methodological Framework for Digital Humanities [0.0] デジタル人文科学の学者は、歴史文書のデジタル化に大規模言語モデルを使うことが増えている。
伝統的なメトリクスは、歴史的コーパス作成に不可欠な時間的偏見や周期的なエラーを捉えない。
国交転写における汚染リスクと系統的バイアスに対処し,LLMに基づく歴史的OCRの評価手法を提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:01:40 GMT)
Entangling remote qubits through a two-mode squeezed reservoir [0.0] 2つの遠隔量子ビットが量子関連フォトニック貯水池との結合によって絡み合わされる、別の完全自律的なプロセスを示す。
また,超伝導量子ビットを用いて2モードのスクイーズを高い感度で直接認証し,ノイズ除去を不要とすることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 15:38:41 GMT)
Enhancing GraphQL Security by Detecting Malicious Queries Using Large Language Models, Sentence Transformers, and Convolutional Neural Networks [0.0] APIの柔軟性は、効率的なデータフェッチには有効だが、従来のAPIセキュリティメカニズムが対処できないようなセキュリティ脆弱性を導入する。
悪意のあるクエリは言語の動的性質を悪用し、サービス障害やインジェクションによるデータ流出などの悪用につながる。
本稿では,悪意のあるクエリをリアルタイムに検出するための,AIによる新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 06:22:30 GMT)
Enhancing Bankruptcy Prediction of Banks through Advanced Machine Learning Techniques: An Innovative Approach and Analysis [0.0] 銀行が破産する確率を計算することは、銀行システムの安全性と健全性を保証する一つの方法である。
統計的手法は厳密で時には無関係な仮定に依存しており、予測精度は低い。
提案された革新的な機械学習アプローチは、倒産のコストを削減するポリシーの実装に役立つ。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:16:10 GMT)
Efficient tensor-network simulations of weakly-measured quantum circuits [0.0] 弱測定量子回路をシミュレーションするためのテンソルネットワークに基づく手法を提案する。
特に、マルコフ連鎖を用いて、測定を効率的にサンプリングし、テンソルネットワークを収縮させ、その効果を方向に沿って伝播させる。
このアルゴリズムの応用例としては、量子コンピュータを古典的な簡単なシミュラビリティのレギュレーションで検証することや、生成機械学習の応用について研究することが挙げられる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:46:47 GMT)
Efficient Radiofrequency Sensing with Fluorescence Encoding [0.0] 本稿では,コヒーレンス時間制約を回避するため,広く適用可能な蛍光符号化法を提案する。
我々は、直流-MHz帯の交流磁界に対するショットノイズ制限感度を示し、光励起電力により検出帯域を調整可能である。
このアプローチは量子センサを原子スケールのスペクトル分析器に変換し、即座に低周波RF通信、ゼロフィールドNMR、バイオエレクトロニクスセンシングに応用する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:17:23 GMT)
Efficient Post-Selection for General Quantum LDPC Codes [0.0] 低信頼度計算結果を捨てるポストセレクション戦略は、量子誤り訂正の有効な忠実度を著しく向上させることができる。
我々は,エラークラスタ統計を利用した計算効率の高い信頼度指標に基づくポストセレクション戦略を開発する。
本手法は,QLDPC符号を用いたフォールトトレラント量子コンピューティングにおいて,効率的なポストセレクションのための実用的な基盤を提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:31:33 GMT)
Early wind turbine alarm prediction based on machine learning: AlarmForecasting [0.0] 本研究の目的は、アラームをプリエンプトし、アラームが完全にトリガーされないようにするためのトランスフォーマティブリープを提供することである。
提案するAlarm Forecasting and Classification (AFC) フレームワークは,2相モジュール上に設計されている。
14個のセンビオンMM82タービンを症例として用いた。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:53:49 GMT)
EEG Sleep Stage Classification with Continuous Wavelet Transform and Deep Learning [0.0] 本研究では,ウェーブレット変換に基づく時間周波数解析を用いた自動睡眠ステージスコアリングフレームワークを提案する。
実験の結果、ウェーブレットに基づく表現は、全体の精度88.37パーセント、マクロ平均F1スコア73.15であることがわかった。
これらの知見は、堅牢で、解釈可能で、臨床応用可能な睡眠段階分類のためのウェーブレット分析の可能性を強調した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:37:20 GMT)
Dissipative Generation of Currents by Nonreciprocal Local and Global Environments [0.0] 我々は、原子トンネル項を散逸性空洞の大域場に結合することにより、有限電流と電流-電流相関の両方を長時間安定させることができることを示した。
これは、散逸が局所的なトンネルプロセスを介して直接作用する仕組みとは対照的であり、そこでは系の小さな部分で電流が発生し、電流-電流相関は急速に減衰している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:51:50 GMT)
Digital Innovation in Microenterprises: Current Trends and New Research Avenues [0.0] デジタルイノベーションのプロセスは、現在マイクロエンタプライズが存在する産業、市場、社会的文脈に浸透している。
本稿ではICTとマイクロエンタプライズに関する文献を概観し,ICTの採用,利用,影響について述べる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:32:48 GMT)
Detection of high-frequency oscillations using time-frequency analysis [0.0] 高周波発振(HFO)はてんかん原性ゾーンを同定するための新しいバイオマーカーである。
HFOの視覚的識別は、時間がかかり、労働集約的で主観的である。
我々は、リップル及び高速リップル周波数帯(80-500Hz)におけるHFOを検出する新しい方法を開発した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 20:50:02 GMT)
Demonstration of a photonic time-frequency Fourier transform and temporal double slit using atomic quantum memory [0.0] 光のための量子メモリは、量子通信プロトコルや分散量子コンピューティングにおいて重要な役割を果たすことが期待されている。
2つの確立された量子メモリプロトコルを組み合わせたインメモリフーリエ変換を実演する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:51:48 GMT)
Data-Driven Adaptive PID Control Based on Physics-Informed Neural Networks [0.0] 本稿では適応利得最適化の原理に基づくデータ駆動型PIDコントローラの設計を提案する。
提案手法は、PINNの自動微分により達成されるPIDゲイン最適化の勾配を利用する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:27:34 GMT)
Consistent Opponent Modeling of Static Opponents in Imperfect-Information Games [0.0] 既存の対戦相手モデリング手法は、既知の先行分布から引き出された静的な相手に対しても、単純な望ましい性質を満足できないことを示す。
我々は,この特性を達成し,シーケンス形式ゲーム表現に基づく凸問題の解法により効率的に動作する新しいアルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 03:32:46 GMT)
Condense to Conduct and Conduct to Condense [0.0] 低コンダクタンス置換の最初の明示的な例を示す。
我々は,低導電率の置換がマルチソース・ソーター・コンデンサの情報理論特性を持つ置換と等価であることを示す。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 19:47:18 GMT)
Closed-form $\ell_r$ norm scaling with data for overparameterized linear regression and diagonal linear networks under $\ell_p$ bias [0.0] パラメータノルムの族をスケールするために、統一的で高確率な特徴を与える。
次に、降下によって訓練された線形ネットワークについて研究する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 01:23:07 GMT)
Classical-quantum oscillators as diffusive processes in phase space [0.0] 任意の初期状態に対して、力学が一意(非平衡)な定常状態に流れ、それが明示的に計算されることが示される。
我々は、ハイブリッドと古典的拡散力学の有用なマッピングを利用し、マスター方程式の形式論において詳細を特徴付ける。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:01:02 GMT)
Breaking the cubic barrier in the Solovay-Kitaev algorithm [0.0] 我々は、一般有限で逆閉生成集合がクーディットに作用するようなソロヴィ-キタエフの定理とアルゴリズムを改善する。
我々の結果はより一般的に、連結半単純実リー群を密に生成する任意の有限集合に対して成り立つ。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:56:43 GMT)
Beyond Models: A Framework for Contextual and Cultural Intelligence in African AI Deployment [0.0] 本稿では、AIシステムが文化的意味を処理できるようにするための文脈・文化知能(CCI)について紹介する。
我々は、ディアスポラコミュニティを提供するAIネイティブのクロスボーダーショッピングプラットフォームを通じて、CCIを検証する。
WhatsAppのユーザー536人、602のユニークユーザー3,938人の会話をわずか6週間で達成しました。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 08:56:53 GMT)
Attention to Order: Transformers Discover Phase Transitions via Learnability [0.0] 本稿では,微視的状態から構造を抽出するための注意機構を含む変圧器モデルの能力として定義される,普遍的基準としての学習可能性を紹介する。
モンテカルロが生成した2次元Isingモデルの自己教師付き学習を用いて,次相が学習性の向上に対応することを示す。
以上の結果から, 位相遷移のデータ駆動マーカーとしての学習可能性を確立し, 凝縮物質中の長距離秩序と現代言語モデルにおける構造の出現との深い並列性を強調した。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:00:59 GMT)
Asymptotic Gate Count Bounds for Ancilla-Free Single-Qubit Synthesis with Arithmetic Gates [0.0] 単一キュービットユニタリのアンシラフリー近似について、Clifford+$G$上のゲート列によるUin rm SU(2)$について検討する。
近似誤差を最大$varepsilon$で達成するために必要となる最小$G$-countの3つの境界を証明します。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 23:48:48 GMT)
Associative Memory Model with Neural Networks: Memorizing multiple images with one neuron [0.0] 本稿では、画像の記憶とリコールのためのニューラルネットワークモデル(連想記憶モデル)を提案する。
このモデルの特徴の1つは、複数の異なる画像が同時に1つのニューロンに格納されていることである。
このモデルは、不完全な画像が提示された場合でも、画像の完全なリコールを可能にする。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 00:44:46 GMT)
Angular Geometry of Atomic Multipole Transitions [0.0] ラビの周波数を計算する簡単な方法は、原子または核多極子モーメントとレーザー場との相互作用について概説する。
結果として得られる表現は、レーザー偏光とベクトル球面調和の間のドット積の形を取る。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:54:54 GMT)
Analyzing Uncertainty Quantification in Statistical and Deep Learning Models for Probabilistic Electricity Price Forecasting [0.0] 本研究では,最先端統計・深層学習確率予測モデルにおける不確実性の定量化について検討する。
我々は、ディープ分散ニューラルネットワーク(DDNN)を考察し、それらをアンサンブルアプローチ、モンテカルロ(MC)ドロップアウト、共形予測で強化する。
様々な性能指標から、LEARベースのモデルは確率的予測において良好に機能することがわかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 18:45:04 GMT)
An in-depth look at approximation via deep and narrow neural networks [0.0] 2017年、ハニンとセルケは、幅 w の任意の深度、実数値、フィードフォワードおよびReLU活性化ネットワークのクラスが、Rn 上の連続函数の空間の密部分集合を形成することを示した。
我々は、近似の質がどのように振る舞うかを、深さや効果(スポイラー警告:死のニューロン)によってどのように振る舞うかを調べる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:34:45 GMT)
An Empirical Analysis of the Laplace and Neural Tangent Kernels [0.0] ニューラル・タンジェント・カーネル(Neural tangent kernel)は、無限幅ニューラルネットワークのパラメータ分布上に定義されたカーネル関数である。
ラプラス核とニューラル接核は同じヒルベルト空間を$mathbbSd-1$の空間で共有していることが示される。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:37:52 GMT)
Am I Productive? Exploring the Experience of Remote Workers with Task Management Tools [0.0] 本研究では,遠隔知識労働者の生産性と課題とタスク管理ツールの活用方法について検討した。
デジタルタスク管理アプリケーションを使用することで、リモートワーカーの生産性を向上させるためにペンと紙を使うことに大きな違いはなかった。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 09:41:46 GMT)
Advantages of Global Entanglement-Distillation Policies in Quantum Repeater Chains [0.0] 量子リピータは、光子損失による長距離量子通信の実現に不可欠である。
現在の量子リピータ世代はエンタングルメント蒸留プロトコルを使用し、蒸留をいつ行うかは、局所的または大域的な知識に依存する。
我々は,グローバルな決定論的な政策が,通信速度の点で地域政策を上回っているかどうかを問う。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 07:50:38 GMT)
Active Control of Turbulent Airfoil Flows Using Adjoint-based Deep Learning [0.0] 我々は,レイノルズ数104$およびマッハ数0.4における乱流気流の昇降ドラッグ比を最適化するために,アクティブニューラルネットワークフローコントローラを訓練する。
トレーニングされたフローコントローラは、リフト・アンド・ドラッグ比を著しく改善し、2次元および3次元の気流の分離を低減する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 14:59:29 GMT)
Accelerating Sparse Ternary GEMM for Quantized LLM inference on Apple Silicon [0.0] 本稿では,AppleのMシリーズプロセッサ向けに最適化されたSparse Ternary GEMMカーネルを提案する。
本稿では、メモリの局所性を改善するために、新しいブロッキングおよびインターリーブされたスパースデータフォーマットを含む、アーキテクチャを意識した一連の最適化を提案する。
我々のベクトル化実装は、25%の間隔を持つ大きな行列に対して最大5.59倍の性能向上をもたらし、様々な間隔レベルにわたって安定している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:42:07 GMT)
A single-phonon directional coupler [0.0] 集積フォトニクスは、高度に制限された光学モードを通じてコンパクトでスケーラブルな回路を実現することにより、電気通信、量子光学、気象学などの分野に革命をもたらした。
量子音響学の分野において、フォノンは、低エネルギー、より小さいモード体積、低い伝播速度などの利点を提供する、魅力的な代替品として登場した。
この研究は、古典的および量子的アプリケーションの両方のためのスケーラブルで統合された音波プラットフォームに向けた基礎的な進歩を表している。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:50:39 GMT)
A multi-layered embedded intrusion detection framework for programmable logic controllers [0.0] 本研究は,コントローラ内で動作し,ヘッダレベルのテレメトリを用いてネットワーク攻撃を検出し,応答する組込み侵入検知システムを提案する。
提案アーキテクチャは,産業システムのリアルタイム要件を満たす多層組込みセキュリティを提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 16:12:02 GMT)
A Quantum Linear Systems Pathway for Solving Differential Equations [0.0] 本稿では,量子線形系における微分方程式の解法について述べる。
このアプローチは複素三対角線型系上で実証され、計算流体力学の問題にまで拡張された。
この経路は、大規模応用に向けて量子線形系法を進化させる基盤となる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 10:01:38 GMT)
A Hardware-Efficient Mølmer-Sørensen Gate for Superconducting Quantum Computers [0.0] モルマー・ソレンセン門(Molmer-Sorensen gate)は、閉じ込められたイオン系における岩盤の絡み合いである。
本稿では,IBM Quantumの超伝導プロセッサ上でのMolmer-Sorensenゲートの実装について述べる。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 12:33:40 GMT)
A Denoising Diffusion-Based Evolutionary Algorithm Framework: Application to the Maximum Independent Set Problem [0.0] 進化的アルゴリズム(EA)を相乗的に統合する解法拡散に基づく進化的アルゴリズム(DDEA)フレームワークを提案する。
DDEAは、同じ時間予算でDIFUSCOを常に上回り、同じ時間制限で大きなグラフ上でGurobiを上回ります。
我々の研究は、DDMとEAのハイブリッド化の可能性を強調し、強力な機械学習ソルバの開発に有望な方向性を提供する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:41:52 GMT)
A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning [0.0] 我々は,Gumbel copula上尾依存性係数(lambda_U$)を用いて特徴量をランク付けする計算効率の高い教師付きフィルタを提案する。
2つの糖尿病データセット上の4つの分類器で、Mutual Information、mRMR、ReliefF、および$L_1$ Elastic Netを比較した。
上肢依存によるコプラに基づく特徴選択は、公衆衛生・臨床医療におけるリスクモデル構築のための強力で効率的かつ解釈可能なアプローチである。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 04:03:38 GMT)
A Conservative Theory of Semiclassical Gravity [0.0] 半古典重力は、安定な決定連鎖のメンバーと相互作用する場合のみ、量子系が重力場を放出することを考えると、一貫した理論であると主張する。
これらはデコヒーレンスとテスト関数によってモデル化された量子システム間の非重力相互作用の連鎖である。
本稿では,量子システムによる重力場の条件付き放出を行う新しいテスト可能なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 17:55:32 GMT)
A Calibration-Free Fixed Point of Curved Boolean Logic Matching the Fine-Structure Constant [0.0] 曲線 Boolean Logic はキャリブレーションのない固定点を持つ。
2成分系F(delta, gamma_4, gamma_5, gamma_6)を解くことにより、等式を強制する。
有限差分ヤコビアン(英語版)は解における完全階数であり、局所一意性を意味する。
論文参考訳(メタデータ) (Wed, 08 Oct 2025 11:54:50 GMT)