Think Only When You Need with Large Hybrid-Reasoning Models [121.6] LHRM(Large Hybrid-Reasoning Model)
ユーザクエリのコンテキスト情報に基づいて思考を行うか否かを適応的に決定できるモデル。
実験の結果, LHRMsは, 様々な難易度, 種別の問合せに対して, 適応的にハイブリッド思考を行うことができた。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:23:25 GMT)
A Personalized Conversational Benchmark: Towards Simulating Personalized Conversations [112.8] PersonaConvBenchは、大規模言語モデル(LLM)とのマルチターン会話におけるパーソナライズされた推論と生成を評価するためのベンチマークである。
我々は,複数の商用およびオープンソース LLM を統一的なプロンプト設定でベンチマークし,パーソナライズされた履歴を組み込むことで大幅な性能向上が得られることを観察した。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:13:22 GMT)
NExT-Search: Rebuilding User Feedback Ecosystem for Generative AI Search [108.4] NExT-Searchは、きめ細かいプロセスレベルのフィードバックを生成AI検索に再導入するために設計された次世代パラダイムである。
NExT-Searchは2つの補完モードを統合している。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:59:13 GMT)
Self-Evolving Curriculum for LLM Reasoning [108.2] 自己進化カリキュラム(Self-Evolving Curriculum, SEC)は、RLファインチューニングプロセスと並行してカリキュラムポリシーを学習する自動カリキュラム学習手法である。
実験により、SECはモデルの推論能力を大幅に改善し、より困難で配布外のテスト問題へのより良い一般化を可能にした。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:17:15 GMT)
Reward Reasoning Model [104.4] Reward Reasoning Models (RRM) は、最終的な報酬を生成する前に意図的に推論プロセスを実行するように設計されている。
自己発展型報酬推論能力を育成する強化学習フレームワークを実装した。
特に、RTMはテスト時間計算を適応的に利用して報酬の精度をさらに向上させることができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:58:03 GMT)
The Multimodal Information Based Speech Processing (MISP) 2025 Challenge: Audio-Visual Diarization and Recognition [96.0] MISP 2025 Challengeは、ビデオモダリティをオーディオと組み合わせることで、マルチモーダル、マルチデバイスミーティングの書き起こしに焦点を当てている。
最高の性能のシステムはベースラインよりも大幅に改善された。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:11:51 GMT)
SlangDIT: Benchmarking LLMs in Interpretative Slang Translation [89.5] 本稿では,スラング翻訳タスク(SlangDIT)を紹介する。
言語間スラング検出、言語間スラング説明、現在のコンテキスト内のスラング翻訳の3つのサブタスクで構成されている。
まず、文にスラングが含まれているかどうかを識別し、スラングが多義的かどうかを判断し、その意味を解析する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:37:34 GMT)
TimeFilter: Patch-Specific Spatial-Temporal Graph Filtration for Time Series Forecasting [87.7] 時系列予測手法は一般的に,Channel Independent(CI)とChannel Dependent(CD)の2つの主要なカテゴリに分類される。
チャネルクラスタリング(CC)の最近の進歩は、類似した特性を持つチャネルをグループ化することで依存性モデリングを洗練することを目的としている。
我々は、適応的できめ細かい依存性モデリングのためのGNNベースのフレームワークであるTimeFilterを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:40:13 GMT)
Two Experts Are All You Need for Steering Thinking: Reinforcing Cognitive Effort in MoE Reasoning Models Without Additional Training [86.7] 我々はReinforcecing Cognitive Experts(RICE)と呼ばれる新しい推論時ステアリング手法を導入する。
RICEは、追加のトレーニングや複雑化なしに推論のパフォーマンスを改善することを目的としている。
先行する MoE ベースの LRM を用いた経験的評価は、推論精度、認知効率、ドメイン間の一般化において顕著で一貫した改善を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:59:16 GMT)
From Theft to Bomb-Making: The Ripple Effect of Unlearning in Defending Against Jailbreak Attacks [85.8] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃に弱いことが知られている。
LLMは、学習期間中に明示的に導入されなかった有害な知識を暗黙的に引き起こすことができる。
我々は、この現象を実証的に検証し、未学習の手法でアタック成功率を下げることを可能にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:38:08 GMT)
From Unaligned to Aligned: Scaling Multilingual LLMs with Multi-Way Parallel Corpora [85.4] TED Talks に基づく大規模かつ高品質なマルチウェイ並列コーパス TED2025 を導入する。
このデータセットは113の言語にまたがっており、最大50の言語が並列に並び、広範囲にわたるマルチリンガルカバレッジを保証する。
実験により、マルチウェイ並列データでトレーニングされたモデルは、不整合多言語データでトレーニングされたモデルよりも一貫して優れていた。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:43:45 GMT)
Conditional Distribution Quantization in Machine Learning [83.5] 条件予測 mathbbE(Y Mid X) はしばしば、マルチモーダル条件分布の複雑さを捉えることに失敗する(Y Mid X)
我々はn点条件量子化(n-point Conditional Quantizations)-勾配降下により学習可能なXの関数写像--近似数学L(Y mid X)-を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:26:47 GMT)
Distributional Vision-Language Alignment by Cauchy-Schwarz Divergence [83.2] 本稿では、コーシーシュワルツの発散を相互情報と統合して視覚言語アライメントを行う新しいフレームワークを提案する。
CS分散はInfoNCEのアライメント・ユニフォーム性競合にシームレスに対処し,InfoNCEと補完的な役割を担っていることがわかった。
テキスト・画像生成およびモダリティ横断検索タスクの実験により,本手法が視覚言語アライメントに与える影響を実証した。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:10:23 GMT)
InternLM-XComposer2.5-Reward: A Simple Yet Effective Multi-Modal Reward Model [80.9] IXC-2.5-Rewardは、大規模視覚言語モデルと人間の好みを一致させる、単純で効果的なマルチモーダル報酬モデルである。
IXC-2.5-Rewardは、最新のマルチモーダル報酬モデルベンチマークにおいて優れた結果を得るとともに、テキストのみの報酬モデルベンチマーク上での競合性能を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:36:34 GMT)
Log-Augmented Generation: Scaling Test-Time Reasoning with Reusable Computation [80.7] 大規模言語モデル(LLM)とそのエージェントモデルは、以前のタスクからの推論を維持するのに苦労する。
本稿では,従来の計算を直接再利用し,テスト時に過去のログから推論する新しいフレームワークであるLAGを提案する。
本手法は,ログを使用しない標準的なエージェントシステムよりも優れている。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:14:38 GMT)
THOR-MoE: Hierarchical Task-Guided and Context-Responsive Routing for Neural Machine Translation [80.3] 階層型タスク誘導型およびコンテキスト応答型ルーティングポリシでMoEを武装するTHOR-MoEを提案する。
THOR-MoEは、既存のTop-$citeshazeer 2017やTop-$$citehuang-etal-2024-harderルーティングスキームと互換性のあるプラグインモジュールとして動作する。
例えば、バニラTop-$$citehuang-etal-2024-harderルーティングと比較して、コンテキスト認識の方法は22%未満の活性パラメータで平均0.75 BLEUの改善を達成することができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:27:19 GMT)
LongDPO: Unlock Better Long-form Generation Abilities for LLMs via Critique-augmented Stepwise Information [76.3] 学術論文やリポジトリレベルのコード生成には,長文生成が不可欠だ。
選好学習と結果管理を併用する既存の手法は、拡張された文脈に対して詳細なフィードバックを提供するのに失敗することが多い。
プロセスの監督を取り入れた長文生成の促進を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:35:46 GMT)
Text Generation Beyond Discrete Token Sampling [76.0] 入力の混合(Mixture of Inputs, MoI)は、自動回帰生成のためのトレーニング不要な方法である。
MoIはQwQ-32B、Nemotron-Super-49B、Gemma-3-27B、DAPO-Qwen-32Bを含む複数のモデルのパフォーマンスを継続的に改善している。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:41:46 GMT)
Layer-wise Quantization for Quantized Optimistic Dual Averaging [75.4] 我々は、訓練の過程で不均一性に適応し、厳密な分散とコード長境界を持つ一般的な層ワイド量子化フレームワークを開発する。
本稿では,適応学習率を持つ量子最適化双対平均化(QODA)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:53:58 GMT)
Adaptive Thinking via Mode Policy Optimization for Social Language Agents [75.3] 動的社会的相互作用における言語エージェントの適応的思考能力を改善するための枠組みを提案する。
本フレームワークは,(1)多言語思考モード設計,(2)コンテキスト認識モード切り替え,(3)深度適応処理によるトークン効率推論の3つの重要な側面において,既存の研究を推し進めている。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:57:05 GMT)
Visual Agentic Reinforcement Fine-Tuning [73.4] この研究は、大規模視覚言語モデル(LVLM)における柔軟な適応推論能力を実現するための視覚エージェント強化細調整(Visual-ARFT)の有効性を強調した。
Visual-ARFTによって、オープンソースのLVLMは、リアルタイム情報更新のためのWebサイトをブラウズし、コードを書き、トリミング、回転、その他の画像処理技術を通じて入力画像を操作および解析することが可能になる。
実験の結果,Visual-ARFT は MAT-Coding で +18.6% F1 / +13.0% EM ,MAT-Search で +10.3% F1 / +8.7% EM で,ベースラインを+18.6% F1 / +13.0% EM で上回ることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:59:25 GMT)
Agent-SafetyBench: Evaluating the Safety of LLM Agents [72.9] 我々は,大規模言語モデル(LLM)の安全性を評価するベンチマークであるAgent-SafetyBenchを紹介する。
Agent-SafetyBenchは349のインタラクション環境と2,000のテストケースを含み、安全リスクの8つのカテゴリを評価し、安全でないインタラクションで頻繁に発生する10の一般的な障害モードをカバーする。
16 名の LLM エージェントを評価した結果,いずれのエージェントも 60% 以上の安全性スコアを達成できないことがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:58:23 GMT)
ShieldVLM: Safeguarding the Multimodal Implicit Toxicity via Deliberative Reasoning with LVLMs [72.9] マルチモーダルな暗黙の毒性は、社会プラットフォームにおける形式的なステートメントとしてだけでなく、有害なダイアログにつながる可能性がある。
単調なテキストや画像のモデレーションの成功にもかかわらず、多モーダルな内容、特に多モーダルな暗黙的な毒性に対する毒性の検出は未発見のままである。
マルチモーダルな暗黙的毒性の検出を促進するために,多モーダルな文,プロンプト,ダイアログにおける暗黙的な毒性を認識するモデルであるShieldVLMを構築した。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:31:17 GMT)
Towards Rich Emotions in 3D Avatars: A Text-to-3D Avatar Generation Benchmark [72.2] 音声(Emo3D)から派生したテキストで感情的にダイナミックな3D顔アバターを生成することは、3Dアバター生成において重要な研究課題となっている。
本稿では,Emo3D生成を再検討し,人間のプロセスからインスピレーションを得て,Emo3Dをテキストから3D表現マッピング(T3DEM)と3Dアバターレンダリング(3DAR)の2つのカスケードステップに分解する。
これらの課題に対処するため,我々はEmo3D生成の研究を進めるための新しいベンチマークを導入する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:17:39 GMT)
A Unified Framework for Event-based Frame Interpolation with Ad-hoc Deblurring in the Wild [72.0] 本稿では,デブロリングアドホックを行うイベントベースフレームの統一フレームワークを提案する。
我々のネットワークは、フレーム上の従来の最先端の手法、単一画像のデブロアリング、および両者のジョイントタスクを一貫して上回ります。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:04:25 GMT)
IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting [71.3] IP-Prompterは、新しいトレーニング不要なTSI生成方法である。
参照イメージを生成モデルに統合することで、ユーザはシームレスに対象テーマを指定することができる。
提案手法は,一貫したストーリー生成,キャラクターデザイン,リアルなキャラクタ生成,スタイル誘導画像生成など,多様な応用を可能にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:39:58 GMT)
StarFT: Robust Fine-tuning of Zero-shot Models via Spuriosity Alignment [70.9] 本稿では,ゼロショットモデルの微調整を行うフレームワークであるStarFTを提案する。
StarFTはウォーターバードグループのシフトシナリオにおいて、それぞれ14.30%、平均精度を3.02%向上させる。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:27:33 GMT)
Erasing Without Remembering: Implicit Knowledge Forgetting in Large Language Models [70.8] 我々は,その一般化に着目して,大規模言語モデルにおける知識の忘れについて検討する。
UGBenchは、スコープ内暗黙の知識の未学習を評価するために特別に設計された最初のベンチマークである。
確率に基づく新しいアンラーニングパラダイムであるPerMUを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:18:15 GMT)
Uni4D: A Unified Self-Supervised Learning Framework for Point Cloud Videos [70.1] 既存の手法は運動を学ぶための明示的な知識に依存しており、結果として準最適表現をもたらす。
Masked Autoentangler (MAE)フレームワークは、4Dデータにおける低レベルの幾何学と高レベルのダイナミックスの間のギャップを埋めるのに苦労している。
本稿では,表現的,識別的,移動可能な4次元表現を学習するための,新しい自己異方性MAEを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:47:12 GMT)
Code2Logic: Game-Code-Driven Data Synthesis for Enhancing VLMs General Reasoning [69.8] マルチモーダル推論データ合成のための新しいゲームコード駆動型アプローチであるCode2Logicを提案する。
提案手法では,Large Language Models (LLM) を用いてゲームコードに適応し,推論プロセスと結果の自動取得を可能にする。
GameQAはコスト効率が高くスケーラブルで、最先端のモデルには挑戦的であり、30のゲームと158のタスクで多種多様である。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:47:44 GMT)
Iterative Tool Usage Exploration for Multimodal Agents via Step-wise Preference Tuning [69.3] コントローラ、例えば視覚言語モデルと外部ツールを統合するマルチモーダルエージェントは、複雑なマルチモーダルタスクに対処する際、顕著な能力を示した。
これらのエージェントを訓練するための既存のアプローチは、広範囲なヒューマン・アノテートされたタスク・アンサー・ペアとツール・トラジェクトリに依存している。
本研究では,事前に収集したデータのないマルチモーダルエージェント,すなわち SPORT の反復ツール利用探索手法を提案する。
Sportには、タスク合成、ステップサンプリング、ステップ検証、優先度調整の4つの反復的なコンポーネントがある。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:22:47 GMT)
J4R: Learning to Judge with Equivalent Initial State Group Relative Policy Optimization [69.2] 私たちは、より複雑な評価設定で生じる位置バイアスに対して堅牢であるように、裁判官を訓練します。
我々はReasoningJudgeBenchというベンチマークを紹介します。
EIS-GRPOで訓練を受けた7B判事であるReasoning判事(J4R)は、GPT-4oを6.7%、そして9%で上回ります。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:57:18 GMT)
Adaptive Cyclic Diffusion for Inference Scaling [68.6] 適応的推論時間スケーリング-動的に計算量を調整するという課題について紹介する。
本稿では,適応型双方向サイクル拡散(ABCD)を提案する。
ABCDは、探索深度と終了を適応的に制御しながら、双方向拡散サイクルを通じて出力を洗練する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:31:38 GMT)
VideoVista-CulturalLingo: 360$^\circ$ Horizons-Bridging Cultures, Languages, and Domains in Video Comprehension [66.0] 本稿では,ビデオ理解における文化的,言語的,ドメイン分割の橋渡しを目的とした,最初のビデオ評価ベンチマークであるVideoVista-CulturalLingoを紹介する。
VideoVista-CulturalLingoには1,389の動画と3,134のQAペアが含まれています。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:15:16 GMT)
General-Reasoner: Advancing LLM Reasoning Across All Domains [64.7] 強化学習(RL)は近年,大規模言語モデル(LLM)の推論能力の向上に強い可能性を示している。
本稿では,多分野にわたるLSM推論能力の向上を目的とした,新たなトレーニングパラダイムであるGeneral-Reasonerを提案する。
私たちは一連のモデルをトレーニングし、物理学、化学、金融、電子工学など幅広い分野をカバーする幅広いデータセットでそれらを評価します。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:41:33 GMT)
Plain Transformers Can be Powerful Graph Learners [64.5] 研究者たちは、Transformerをグラフ学習に移行しようとしたが、ほとんどの高度なGraph Transformerは、普通のTransformerから遠く離れている。
この研究は、普通のTransformerアーキテクチャが強力なグラフ学習者になれることを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:36:09 GMT)
EfficientLLM: Efficiency in Large Language Models [64.4] 大規模言語モデル(LLM)は大きな進歩を導いてきたが、その増加とコンテキストウィンドウは計算、エネルギー、金銭的コストを禁止している。
本稿では,新しいベンチマークであるEfficientLLMを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:27:08 GMT)
SafeRoute: Adaptive Model Selection for Efficient and Accurate Safety Guardrails in Large Language Models [63.6] 本稿では,難しい例と簡単な例を区別するバイナリルータを提案する。
提案手法は、ルータが考慮するデータに対して、より大きな安全ガードモデルを選択的に適用し、精度を維持しながら効率を向上する。
複数のベンチマークデータセットによる実験結果から,適応モデルの選択により,計算コストと安全性性能のトレードオフが著しく向上することが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:47:09 GMT)
DAPO: An Open-Source LLM Reinforcement Learning System at Scale [63.2] 我々は,Qwen2.5-32Bベースモデルを用いて,AIME 2024上で50ポイントを達成できる最先端の大規模RLシステムをオープンソース化した。
さらに,verlフレームワーク上に構築されたトレーニングコードと,慎重にキュレートされた,処理されたデータセットもオープンソースとして公開しています。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:37:34 GMT)
PSDNorm: Test-Time Temporal Normalization for Deep Learning in Sleep Staging [63.1] 我々は,モンジュマッピングと時間文脈を利用したPSDNormを提案し,信号の深層学習モデルにおける特徴写像の正規化を行う。
PSDNormは、BatchNormよりも4倍のデータ効率が高く、目に見えない左のデータセットで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:39:57 GMT)
Tracing Multilingual Factual Knowledge Acquisition in Pretraining [63.0] 大規模言語モデル(LLM)は、事前学習データに存在する多言語事実知識をリコールすることができる。
我々は,OLMo-7Bに焦点をあてて,事前学習中に現実のリコールと言語間の整合性がどのように進化するかを辿った。
ほとんどの言語では、正確性と一貫性が時間の経過とともに向上していることが分かりました。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:39:56 GMT)
ProcessBench: Identifying Process Errors in Mathematical Reasoning [62.8] 本稿では,数学的推論における誤ったステップを識別する能力を測定するためのProcessBenchを紹介する。
ProcessBenchは3400のテストケースで構成され、主に競合とオリンピアードレベルの数学問題に焦点を当てている。
我々はProcessBenchについて、プロセス報酬モデル(PRM)と批判モデルという2種類のモデルを含む広範囲な評価を行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:59:03 GMT)
GloSS over Toxicity: Understanding and Mitigating Toxicity in LLMs via Global Toxic Subspace [62.7] 本稿では,大規模言語モデル(LLM)の毒性発生機構について検討する。
GloSS(Global Toxic Subspace Suppression)は,FFNのパラメータからグローバルな毒性部分空間を同定・除去することにより毒性を緩和する軽量な4段階法である。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:29:11 GMT)
Mitigating Forgetting in LLM Fine-Tuning via Low-Perplexity Token Learning [62.0] LLM生成データによる微調整により,目標タスクの性能が向上し,非目標タスクの劣化が低減されることを示す。
微調整後のLSMにおける破滅的忘れを緩和するために、トークンの難易度低減に基づく経験的説明を提供する最初の研究である。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:10:24 GMT)
EvoMesh: Adaptive Physical Simulation with Hierarchical Graph Evolutions [61.9] 物理入力によって適応的に導かれるグラフ階層と物理力学を学習するフレームワークであるEvoMeshを提案する。
EvoMeshは異方性メッセージパッシングを導入し、ノード間の動的機能の方向特異的アグリゲーションを可能にする。
5つのベンチマーク物理シミュレーションデータセットの実験により、EvoMeshは最近の固定階層メッセージパッシングネットワークよりも大きなマージンで優れていることが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:45:29 GMT)
MomentSeeker: A Task-Oriented Benchmark For Long-Video Moment Retrieval [61.4] 長ビデオモーメント検索(LMVR)のための新しいベンチマークであるMomentSeekerを提案する。
MomentSeekerは、長く多様なビデオに基づいて作られ、平均1200秒以上持続する。
グローバルレベル、イベントレベル、オブジェクトレベル、アクション認識、オブジェクトローカライゼーション、因果推論といった一般的なタスクをカバーする。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:30:44 GMT)
R&D-Agent: Automating Data-Driven AI Solution Building Through LLM-Powered Automated Research, Development, and Evolution [60.8] R&D-Agentは反復探索のための二重エージェントフレームワークである。
Researcherエージェントはパフォーマンスフィードバックを使用してアイデアを生成し、Developerエージェントはエラーフィードバックに基づいてコードを洗練する。
R&D-AgentはMLE-Benchで評価され、最高のパフォーマンスの機械学習エンジニアリングエージェントとして登場した。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:07:00 GMT)
ViMo: A Generative Visual GUI World Model for App Agents [60.3] ViMoは、将来のApp観測をイメージとして生成するために設計されたビジュアルワールドモデルである。
本稿では,シンボルプレースホルダーによるテキストコンテンツをオーバーレイする新しいデータ表現であるシンボリックテキスト表現を提案する。
この設計では、将来のGUIのグラフィックスを予測するSTR Predictorと、対応するテキストを生成するGUI-text Predictorが使用されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:11:37 GMT)
Let LLMs Break Free from Overthinking via Self-Braking Tuning [60.1] 大きな推論モデル(LRM)は思考の長い連鎖を生成することによって推論能力を著しく向上させた。
この性能向上は、生成プロセス中の冗長な推論を大幅に増加させるコストが伴う。
本稿では、モデルが独自の推論プロセスを制御することを許容する観点から、過度に検討する新しいフレームワーク、Self-Braking Tuning(SBT)を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:53:40 GMT)
DSMentor: Enhancing Data Science Agents with Curriculum Learning and Online Knowledge Accumulation [59.8] 大規模言語モデル(LLM)エージェントは、複雑なデータサイエンス問題を解決するためのコードを生成する上で、有望な性能を示している。
我々は, LLMエージェントの性能を向上させるために, DSMentorと呼ばれる新しい推論時間最適化フレームワークを開発した。
我々の研究は、推論中に知識を蓄積し活用するための効果的な戦略を開発することの重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:16:21 GMT)
New Evidence of the Two-Phase Learning Dynamics of Neural Networks [59.6] 時間ウィンドウ全体にわたってネットワーク状態を比較するインターバルワイズ・パースペクティブを導入する。
摂動に対するネットワークの応答はカオスから安定への移行を示す。
また、この遷移点の後に、モデルの関数軌道は狭い円錐形の部分集合に制限される。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:03:52 GMT)
Data-Efficient Hate Speech Detection via Cross-Lingual Nearest Neighbor Retrieval with Limited Labeled Data [59.3] 言語間の変換学習は、ラベル付きデータに制限のあるタスクのパフォーマンスを向上させることができる。
我々は、最寄りの検索を利用して、ターゲット言語における最小ラベル付きデータを増強する。
提案手法を8言語で評価し,対象言語データのみに基づいてトレーニングしたモデルよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:25:33 GMT)
Can Prompting LLMs Unlock Hate Speech Detection across Languages? A Zero-shot and Few-shot Study [59.3] この研究は、8つの非英語言語にわたるLLMのプロンプトに基づく検出を評価する。
実世界の評価セットのほとんどにおいて、ゼロショットと少数ショットが微調整エンコーダモデルに遅れを生じさせる一方で、ヘイトスピーチ検出のための関数的テストのより優れた一般化を実現していることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:14:09 GMT)
Investigating and Enhancing the Robustness of Large Multimodal Models Against Temporal Inconsistency [59.1] 本稿では,モデルのロバスト性を評価するために,時間的ロバスト性ベンチマーク(TemRobBench)を提案する。
16のLMMを評価した結果,従来の知識やテキストの文脈に頼りすぎていることが判明した。
我々はパノラマ直接選好最適化(PanoDPO)を設計し、LMMが視覚的特徴と言語的特徴の両方を同時に取り入れることを奨励する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:18:56 GMT)
Multimodal Cultural Safety: Evaluation Frameworks and Alignment Strategies [58.9] 大規模視覚言語モデル(LVLM)は、観光アシスタントのようなグローバルに分散したアプリケーションにますます導入されている。
CROSSは、LVLMの文化的安全性推論能力を評価するために設計されたベンチマークである。
実験モデルと推論モデルを含む21種類のLVLMを評価した。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:20:38 GMT)
Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.9] 航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:06:56 GMT)
Exploring Image Quality Assessment from a New Perspective: Pupil Size [58.6] 本稿では、画像品質評価(IQA)タスクが、瞳孔の大きさの観点から、人々の認知過程にどのように影響するかを考察する。
両課題間の瞳孔の大きさの違いを解析することにより,画像品質を評価する際に視覚的注意機構を活性化できることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:27:34 GMT)
Massive Values in Self-Attention Modules are the Key to Contextual Knowledge Understanding [58.4] 注目クエリの特定の領域において、集中した巨大な値が一貫して現れることを示す。
これらの膨大な価値は文脈知識の解釈において重要な役割を担っている。
大量の値の出現を辿り、そのような濃度は回転位置によって引き起こされる。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:08:40 GMT)
Structured Agent Distillation for Large Language Model [58.2] 本研究では,LLMをベースとした大規模エージェントを小さな学生モデルに圧縮するフレームワークであるStructured Agent Distillationを提案する。
提案手法は, [REASON] と [ACT] にトラジェクトリを分割し, 各コンポーネントを教師の行動に合わせるためにセグメント特異的な損失を適用した。
ALFWorld、HotPotQA-ReAct、WebShopの実験は、我々のアプローチがトークンレベルと模倣学習のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:01:55 GMT)
Benchmarking Unified Face Attack Detection via Hierarchical Prompt Tuning [58.2] 提示攻撃検出と顔偽造検出は、それぞれ物理メディアベースの提示攻撃とデジタル編集ベースのDeepFakeから顔データを保護するように設計されている。
これら2つのモデルの個別のトレーニングは、未知の攻撃やデプロイ環境への脆弱性を生じさせる。
本稿では,視覚言語モデルに基づく階層型プロンプトチューニングフレームワーク (HiPTune) を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:07:48 GMT)
Cost-Optimal Grouped-Query Attention for Long-Context Modeling [58.1] Grouped-Query Attention(GQA)は、大規模言語モデルにおける注目層の計算コストを削減するための広く採用されている戦略である。
我々は,文脈長,モデルサイズ,GQA構成,モデル損失の関係を分析する。
コスト最適GQA構成の導出法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:31:37 GMT)
Reconstructing People, Places, and Cameras [57.8] Humans and Structure from Motion (HSfM) は、メカニカルワールド座標系において、複数の人メッシュ、シーンポイント雲、カメラパラメータを共同で再構築する手法である。
以上の結果から,SfMパイプラインに人体データを組み込むことで,カメラのポーズ推定が改善された。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:13:16 GMT)
CLEVER: A Curated Benchmark for Formally Verified Code Generation [57.5] $rm Csmall LEVER$は、リーンにおけるエンドツーエンドのコード生成のための161の問題を、高品質でキュレートしたベンチマークである。
それぞれの問題は、(1)堅実な仕様と一致する仕様を生成するタスク、(2)この仕様を確実に満足するリーン実装を生成するタスクで構成されています。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:15:47 GMT)
LLM-hRIC: LLM-empowered Hierarchical RAN Intelligent Control for O-RAN [56.9] 本稿では、無線アクセスネットワーク(O-RAN)におけるRCC間の協調性を改善するため、LLM-hRIC(LLM-hRIC)フレームワークを紹介する。
このフレームワークは,グローバルネットワーク情報を用いたリアルタイムRIC(non-RT RIC)の戦略的ガイダンスを提供する。
RL搭載の近RT RICは実装者として機能し、このガイダンスとローカルリアルタイムデータを組み合わせて近RT決定を行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:43:35 GMT)
Automating Intervention Discovery from Scientific Literature: A Progressive Ontology Prompting and Dual-LLM Framework [56.9] 本稿では,大規模言語モデル(LLM)を利用した科学文献の介入の同定手法を提案する。
言語病理領域における64,177論文のコーパスから,2,421件の介入が得られた。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:37:45 GMT)
MrGuard: A Multilingual Reasoning Guardrail for Universal LLM Safety [56.8] 大規模言語モデル(LLM)は、ジェイルブレイクのような敵の攻撃を受けやすい。
この脆弱性は、多言語セーフティアライメントされたデータが制限される多言語設定で悪化する。
素早い分類のための多言語ガードレールを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:49:30 GMT)
Debating for Better Reasoning: An Unsupervised Multimodal Approach [56.7] 議論のパラダイムをマルチモーダルな設定に拡張し、より弱いモデルがより強力なモデルの性能を監督し、強化する可能性を探る。
視覚的質問応答 (VQA) に焦点をあて, 2つの「目に見える」専門家の視覚言語モデルが解答について議論する一方, 「盲目」(テキストのみ)の判断は議論の品質にのみ依存する。
この枠組みでは, 専門家は信念に沿う回答のみを守り, 明示的な役割プレーの必要性を排除し, 専門家の不一致の事例に議論を集中させる。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:18:17 GMT)
Safety Devolution in AI Agents [56.5] 本研究では,検索アクセスの拡大がモデル信頼性,バイアス伝搬,有害コンテンツ生成に与える影響について検討した。
整列 LLM 上に構築された検索補助エージェントは、検索なしでの無検閲モデルよりも安全でない振る舞いをすることが多い。
これらの発見は、検索が強化され、ますます自律的なAIシステムにおいて、公正性と信頼性を確保するための堅牢な緩和戦略の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:21:40 GMT)
Personalize Your Gaussian: Consistent 3D Scene Personalization from a Single Image [56.1] 本稿では,3次元ガウス平滑化(CP-GS)の一貫性パーソナライゼーションについて述べる。
特にCP-GSは、事前訓練された画像から3D生成と反復的なLoRAファインチューニングを統合して、参照外観を抽出し拡張する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:55:53 GMT)
EquiBench: Benchmarking Large Language Models' Understanding of Program Semantics via Equivalence Checking [55.8] EquiBenchは、大規模言語モデル(LLM)を評価するための新しいベンチマークである。
2つのプログラムが全ての可能な入力に対して同一の出力を生成するかどうかを決定する。
19の最先端LCMを評価し、最高の精度は63.8%と76.2%であり、これは50%のランダムベースラインよりわずかに高い。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:19:18 GMT)
Memory Is Not the Bottleneck: Cost-Efficient Continual Learning via Weight Space Consolidation [55.8] 連続学習(CL)は、メモリが主要なボトルネックであると仮定して、メモリ使用量の最小化を伝統的に強調してきた。
本稿では, CLを十分なメモリでより現実的な環境下で再検討し, システムが過去のデータの代表的部分を保持できることを示す。
この体制下では、忘れることを減らすことによって安定性が向上するが、モデルが以前のタスクに偏り、新しいタスクに適応するのに苦労すると、可塑性は低下する。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:59:50 GMT)
Understanding 6G through Language Models: A Case Study on LLM-aided Structured Entity Extraction in Telecom Domain [55.6] 本研究では,テレコムの文脈から構造化されたエンティティを抽出することを目的とした,新しい言語モデルに基づく情報抽出手法を提案する。
提案するテレコム構造化エンティティ抽出(TeleSEE)技術は,エンティティタイプと属性キーの予測にトークン効率のよい表現手法を適用し,出力トークンの数を削減し,予測精度を向上させることを目的とする。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:00:08 GMT)
Output Scaling: YingLong-Delayed Chain of Thought in a Large Pretrained Time Series Forecasting Model [55.3] このフレームワークは,設計した基盤モデルであるYingLongの最先端性能を実現する。
YingLongは、マスク付きトークンリカバリによってトレーニングされた非因果的双方向アテンションエンコーダのみのトランスフォーマーである。
我々は、6Mから3Mパラメータの4つの基礎モデルをリリースし、ゼロショットタスクにおいて優れた結果を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:31:06 GMT)
Teaching Audio-Aware Large Language Models What Does Not Hear: Mitigating Hallucinations through Synthesized Negative Samples [55.2] 近年の音声対応大型言語モデル(ALLM)により、音声入力の処理と理解が可能になった。
これらのモデルは、しばしば既存の音響イベントを幻覚させ、現実の応用における信頼性を低下させる。
LISTENは、現在と欠落した音を識別するallMsの能力を向上するコントラスト的な訓練法である。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:44:01 GMT)
The Sample Complexity of Online Reinforcement Learning: A Multi-model Perspective [55.2] 連続状態と行動空間を持つ非線形力学系の一般設定におけるオンライン強化学習のサンプル複雑性について検討した。
我々のアルゴリズムは、$mathcalO(N epsilon2 + Mathrmln(m(epsilon)/epsilon2)$のポリシーを後悔する。
力学がコンパクトで実数値のパラメータ集合によってパラメータ化される特別な場合、$mathcalO(sqrt)のポリシー後悔を証明する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:37:00 GMT)
ReVLA: Reverting Visual Domain Limitation of Robotic Foundation Models [55.1] 既存の3つのロボット基礎モデルの視覚的一般化能力について検討する。
本研究は,既存のモデルがドメイン外シナリオに対する堅牢性を示していないことを示す。
モデルマージに基づく段階的なバックボーンリバーサルアプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:23:45 GMT)
Mind the Gap: Bridging Thought Leap for Improved Chain-of-Thought Tuning [54.7] 本研究では,跳躍を自動的に検出し,中間的推論ステップを欠くことを目的としたCoT Thought Leap Bridge Taskを提案する。
ブリッジされたデータセットに微調整されたモデルが、元のデータセットでトレーニングされたモデルよりも一貫して優れていることを示す。
提案手法は, 蒸留データを効果的に向上させ, 強化学習の出発点として優れたものを提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:59:31 GMT)
Unlocking the Power of SAM 2 for Few-Shot Segmentation [54.6] Few-Shot (FSS) は、少数のクラスでクラスに依存しないセグメンテーションを学習し、任意のクラスをセグメンテーションすることを目的としている。
近年、SAM 2は、クラスに依存しないマッチング能力を持つビデオセグメンテーションをサポートしてSAMを拡張している。
擬似クエリメモリを符号化するPseudo Prompt Generatorを設計し、クエリ機能と互換性のある方法でマッチングする。
さらに、メモリにより多くのクエリFG機能を融合させる反復メモリリファインメントを設計し、メモリの予期せぬクエリBG機能を抑制するためのサポートキャリブレーションメモリアテンションを考案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:02:53 GMT)
Mitigating Subgroup Disparities in Multi-Label Speech Emotion Recognition: A Pseudo-Labeling and Unsupervised Learning Approach [53.8] Implicit Demography Inference (IDI)モジュールはk平均クラスタリングを用いてカテゴリー音声感情認識(SER)のバイアスを軽減する
実験により,擬似ラベルIDIはサブグループの格差を減少させ,SERの精度を3%以下に抑えながら,フェアネスの指標を33%以上改善することが示された。
教師なしのIDIは人種と年齢格差を一貫して軽減し、明示的な人口統計情報が利用できないシナリオにおいてその可能性を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:50:44 GMT)
Do Language Models Use Their Depth Efficiently? [53.6] Llama 3.1 および Qwen 3 モデルの残留ストリームを分析する。
後半のレイヤが前半のレイヤよりもはるかに少ないことが分かりました。
マルチホップタスクでは、モデルが深度を増してサブレサルを構成するという証拠が見つからない。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:00:56 GMT)
Mobile-Agent-V: A Video-Guided Approach for Effortless and Efficient Operational Knowledge Injection in Mobile Automation [53.5] Mobile-Agent-Vは、動画をガイドツールとして活用し、モバイル自動化プロセスに運用知識を強制的かつ効率的に注入する革新的なフレームワークである。
ビデオコンテンツから直接知識を抽出することにより、Mobile-Agent-Vは手作業による介入を排除し、知識獲得に必要な労力と時間を著しく削減する。
実験の結果, Mobile-Agent-Vは既存手法に比べて36%向上した。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:48:19 GMT)
MathAgent: Leveraging a Mixture-of-Math-Agent Framework for Real-World Multimodal Mathematical Error Detection [53.3] これらの課題に対処するために設計された新しいMixture-of-Math-AgentフレームワークであるMathAgentを紹介する。
MathAgentはエラー検出を3つのフェーズに分解し、それぞれが特別なエージェントによって処理される。
実世界の教育データに基づいてMathAgentを評価し,誤差ステップ同定の精度を約5%向上した。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:43:20 GMT)
Evaluating the Correctness of Inference Patterns Used by LLMs for Judgment [53.2] 我々は,LLMの詳細な推論パターンの正確さを,その正しい出力の裏側で評価した。
実験により、言語生成結果が正しそうであっても、LLMが法的な判断に用いた推論パターンのかなりの部分は、誤解を招く論理や無関係な論理を表す可能性があることが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:29:37 GMT)
Replace in Translation: Boost Concept Alignment in Counterfactual Text-to-Image [53.1] 我々は,この代替プロセスを明示論理ナラティブ・プロンプト (ELNP) と呼ぶ方法を提案する。
合成画像において,プロンプトに要求される概念を平均的にカバーできる数を計算するための計量を設計する。
大規模な実験と定性比較により、我々の戦略が反実的T2Iの概念の整合性を高めることが示される。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:27:52 GMT)
Leveraging Robust Optimization for LLM Alignment under Distribution Shifts [53.0] 人間の値に整合した出力を生成するために、大規模言語モデルを操る上で、優先順位アライメント手法はますます重要になっている。
このようなシフトに拘わらず、好みのアライメントを改善する新しい分布対応最適化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:42:37 GMT)
MobileA3gent: Training Mobile GUI Agents Using Decentralized Self-Sourced Data from Diverse Users [52.7] MobileA3gentは、分散したセルフソースデータを使用してモバイルGUIエージェントをトレーニングするコラボレーティブフレームワークである。
MobileA3gentは従来のアプローチよりも1%のコストで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:03:02 GMT)
Cross-Domain Diffusion with Progressive Alignment for Efficient Adaptive Retrieval [52.7] 非教師付き効率的なドメイン適応検索は、ラベル付きソースドメインからラベルなしターゲットドメインに知識を転送することを目的としている。
既存のメソッドは、ターゲットドメインの潜在的なノイズに対処できず、ドメイン間で直接高レベルな機能を調整します。
そこで本研究では,これらの課題に対処する新しいクロスドメイン拡散・プログレッシブアライメント法(COUPLE)を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:17:39 GMT)
In-depth Research Impact Summarization through Fine-Grained Temporal Citation Analysis [52.4] 我々は、ニュアンス付き、表現型、時間対応のインパクトサマリーを生成する新しいタスクを提案する。
これらの要約は、微粒な引用意図の進化を通じて、賞賛(確認引用)と批評(補正引用)の両方を捉えていることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:11:06 GMT)
Not All Clients Are Equal: Personalized Federated Learning on Heterogeneous Multi-Modal Clients [52.1] ファンデーションモデルは多様なマルチモーダルタスクにまたがって顕著な能力を示してきたが、その集中的なトレーニングはプライバシーの懸念を高め、高い伝達コストを引き起こす。
異なるユーザー目的のためにAIモデルをパーソナライズする需要が高まっているため、パーソナライズされたフェデレーションラーニング(PFL)が出現している。
PFLは、各クライアントが他のクライアントの知識を活用して、データを共有することなく、個々のユーザの好みにさらに適応することを可能にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:17:07 GMT)
UniGen: Enhanced Training & Test-Time Strategies for Unified Multimodal Understanding and Generation [52.1] 画像の理解と生成が可能な統合マルチモーダル大言語モデル(MLLM)であるUniGenを紹介する。
We study the full training pipeline of UniGen from a data-centric perspective, including multi-stage pre-training, supervised fine-tuning, direct preference optimization。
そこで我々は,テスト時間スケーリングのための新しいChain-of-Thought Verification(CoT-V)戦略を提案し,UniGenの画像生成品質を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:59:26 GMT)
Language Models use Lookbacks to Track Beliefs [51.9] 我々は,Llama-3-70B-Instructが文字の信念を因果媒介と抽象化を用いて推論する能力について分析する。
我々の研究は、LMの信念追跡機構に関する洞察を提供し、LMにおけるToM推論のリバースエンジニアリングに向けた一歩を踏み出した。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:59:45 GMT)
Uncovering Untapped Potential in Sample-Efficient World Model Agents [51.7] Simulusは高度にモジュール化されたTBWMエージェントで、マルチモーダルトークン化フレームワーク、本質的なモチベーション、優先順位付けされたWMリプレイ、レグレッション・アズ・クラス化を統合している。
Simulusは3つの異なるベンチマークで、計画自由なWMに対して最先端のサンプル効率を達成する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:45:24 GMT)
ToolHop: A Query-Driven Benchmark for Evaluating Large Language Models in Multi-Hop Tool Use [51.4] 995のユーザクエリと3,912の関連ツールからなるデータセットであるToolHopを提示する。
ToolHopは、多様なクエリ、意味のある相互依存性、ローカル実行可能なツール、詳細なフィードバック、検証可能な回答を保証する。
5つのモデルファミリーにまたがる14のLSMを評価し、マルチホップツールの使用シナリオを扱う上で重要な課題を明らかにした。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:15:36 GMT)
StPR: Spatiotemporal Preservation and Routing for Exemplar-Free Video Class-Incremental Learning [51.0] CIL(Class-Incremental Learning)は、以前取得した知識を使わずに、時間とともに新しいアクションカテゴリを継続的に学習するモデルの開発を目指している。
既存のアプローチでは、メモリとプライバシに関する懸念を忘れたり、あるいは時間的モデリングを無視する静的なイメージベースのメソッドを適用したりする。
本稿では,情報を明示的に切り離して保存する,統一的で非定型なVCILフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:46:51 GMT)
A system identification approach to clustering vector autoregressive time series [50.7] 基礎となる力学に基づく時系列のクラスタ化は、複雑なシステムモデリングを支援するために研究者を惹きつけている。
現在の時系列クラスタリング手法のほとんどは、スカラー時系列のみを処理し、ホワイトノイズとして扱うか、高品質な特徴構築のためにドメイン知識に依存している。
システム識別アプローチは、機能/測定構造に頼るのではなく、基礎となる自己回帰力学を明示的に考慮することで、ベクトル時系列クラスタリングを処理できる。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:31:44 GMT)
Opt-In Art: Learning Art Styles Only from Few Examples [50.6] ごく少数の例を考慮すれば,絵画を使わずに訓練されたモデルを芸術的なスタイルに適応させることが可能であることを示す。
意外なことに, 芸術的データに事前に触れることなく, 高品質な芸術的アウトプットを達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:07:27 GMT)
Swin DiT: Diffusion Transformer using Pseudo Shifted Windows [50.5] 拡散変換器 (DiT) は, トランスアーキテクチャの導入により, 画像生成領域内での顕著な性能を実現する。
我々は,従来想定されていたようなグローバル情報への強い依存を示さない空間画像生成を実証的に分析した。
我々は,Pseudo textbfShifted textbfWindow DiTs (textbfSwin DiT) のシリーズを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:01:57 GMT)
Extending Complex Logical Queries on Uncertain Knowledge Graphs [50.4] 機械学習に基づく論理クエリ応答の研究は、大規模かつ不完全な知識グラフによる推論を可能にする。
我々は,大規模,不完全,不確実な知識グラフ上でのソフトクエリに応答するために,前方推論と後方校正の両方を組み込んだニューラルシンボリックアプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:17:34 GMT)
Efficient and Scalable Neural Symbolic Search for Knowledge Graph Complex Query Answering [50.2] 複雑なクエリに対する効率的でスケーラブルなシンボル検索フレームワークを提案する。
我々のフレームワークは、ほぼ同じ性能を維持しながら、シンボリックメソッドの計算負荷を90%削減する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:09:36 GMT)
Event-Driven Dynamic Scene Depth Completion [50.0] EventDCは、最初のイベント駆動のディープコンプリートフレームワークである。
Event-Modulated Alignment (EMA) と Local Depth Filtering (LDF) の2つの重要なコンポーネントで構成されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:45:25 GMT)
Language Mixing in Reasoning Language Models: Patterns, Impact, and Internal Causes [49.8] RLM(Reasoning Language Model)は、チェーン・オブ・シント・プロセスを利用して構造化中間ステップを生成することで、複雑なタスクに優れる。
言語混合、すなわちプロンプト以外の言語からのトークンを含む推論ステップがアウトプットで観測され、性能に影響することが示されている。
本研究では, RLMにおける言語混合に関する最初の体系的研究を行い, そのパターン, 影響, 内部要因を15言語にわたって検討した。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:26:53 GMT)
MorphMark: Flexible Adaptive Watermarking for Large Language Models [49.3] 既存の透かし法は、しばしばジレンマに苦しむ: 透かしの有効性を改善するには、テキストの品質を低下させるコストがかかる。
特定因子の変化に応じて透かし強度を適応的に調整するMorphMark法を開発した。
MorphMarkは、高い柔軟性と時間と空間効率を提供するとともに、有効性の高いジレンマの優れた解決を実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 00:24:09 GMT)
Diffusion Model as a Noise-Aware Latent Reward Model for Step-Level Preference Optimization [49.3] 拡散モデルの優先度最適化は、画像を人間の好みに合わせることを目的としている。
事前学習した拡散モデルは,ノイズのある潜在空間におけるステップレベルの報酬モデルに自然に適していることを示す。
雑音の多い遅延空間で直接実行されるステップレベルの優先度最適化手法であるLatent Preference Optimization (LPO)を導入する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:59:40 GMT)
Beyond the First Error: Process Reward Models for Reflective Mathematical Reasoning [49.2] 本研究では,長いCoT推論プロセスのスコアリングに特化して設計されたPRMのための新しいデータアノテーション手法を提案する。
本稿では, 誤り伝播と誤認識の概念を導入し, PRMの効果的な自己訂正行動と誤ったステップに基づく推論の両方を識別する能力を高めた。
我々のPRMは,探索誘導,BoN,F1スコアなど,様々な指標で優れた性能を実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:12:05 GMT)
Waveguides in a quantum perspective [49.2] 希釈クライオスタット温度で作動する固体量子デバイスは、量子状態の駆動と読み出しにマイクロ波信号に依存している。
ここでは、最も単純なカルト型測地(平行プレート、矩形管)を記述する量子論について述べる。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:42:07 GMT)
From nuclear safety to LLM security: Applying non-probabilistic risk management strategies to build safe and secure LLM-powered systems [49.2] 大型言語モデル(LLM)は、前例がなく成長する能力を提供するが、複雑な安全性とセキュリティの課題ももたらす。
以前の研究では、原子力や土木工学といった様々な工学分野におけるリスク管理は、一般的な(フィールドに依存しない)戦略によってしばしば解決されている。
ここでは、LSMによるシステムにおける新たなリスクが、リスク管理の非確率的戦略の100以上で満たされる可能性を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:07:41 GMT)
Convergence of TD(0) under Polynomial Mixing with Nonlinear Function Approximation [49.2] 時間差分学習(TD(0))は強化学習の基本である。
マルコフデータを混合したバニラTD(0)の最初の高確率有限サンプル解析を行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:53:42 GMT)
Approximation of diffeomorphisms for quantum state transfers [49.2] 制御理論における2つの新たな視点を組み合わそうとしている。
トーラスに作用するバイリニア型Schr"odinger PDEにおいて、状態遷移を短時間で駆動する制御法則を数値的に見つける。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:18:23 GMT)
Toward Embodied AGI: A Review of Embodied AI and the Road Ahead [49.1] エンボディード・ジェネラル・インテリジェンス(英語: Embodied Artificial General Intelligence, AGI)は、しばしば本質的にエンボディードとして考えられている。
本稿では,5つのレベル(L1-L5)にまたがる身体的AGIの系統分類について紹介する。
本稿では,L3+ロボット脳の概念的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:42:26 GMT)
MedCaseReasoning: Evaluating and learning diagnostic reasoning from clinical case reports [49.0] MedCaseReasoningはLarge Language Models(LLM)を評価するための最初のオープンアクセスデータセットである。
データセットには14,489の診断的質問・回答ケースが含まれており、それぞれに詳細な推論文がペアリングされている。
我々は,MedCaseReasoning上での最先端の推論LPMを評価し,診断と推論に重大な欠点を見出した。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:56:52 GMT)
Exploring Cross-lingual Latent Transplantation: Mutual Opportunities and Open Challenges [49.0] 現在の大規模言語モデル(LLM)は多言語能力と文化的適応性に不均衡を示すことが多い。
XTransplantフレームワークは、言語間で潜在的なアクティベーションを移植することで、英語と非英語のリソースの相補的な長所を利用することができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:18:16 GMT)
MLZero: A Multi-Agent System for End-to-end Machine Learning Automation [48.7] MLZeroはLarge Language Models(LLM)を利用した新しいマルチエージェントフレームワークである。
認知認識モジュールが最初に使用され、生のマルチモーダル入力を知覚コンテキストに変換する。
MLZeroは、MLE-Bench Liteで優れたパフォーマンスを示し、成功率とソリューション品質の両方で競合他社を上回っている。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:20:53 GMT)
Learning Coherent Matrixized Representation in Latent Space for Volumetric 4D Generation [48.7] 本研究では,空間次元と時間次元をまたいだ形状と色を動的に変化させた4次元配列を生成する枠組みを提案する。
まず、コヒーレントな3次元形状と色モデリングを用いて、各3次元形状フレームの形状と色を潜在空間にエンコードする。
次に,効率的な拡散モデル演算が可能な行列化4次元シーケンス表現を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:15:43 GMT)
Instructing Text-to-Image Diffusion Models via Classifier-Guided Semantic Optimization [48.4] 本稿では,属性分類器によって導かれるセマンティック埋め込みを最適化し,テキストと画像のモデルを所望の編集に向けて操る手法を提案する。
本手法は,データ領域にまたがる高レベルの絡み合いと強い一般化を実現する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:07:01 GMT)
Unearthing Gems from Stones: Policy Optimization with Negative Sample Augmentation for LLM Reasoning [48.3] 負のサンプル拡張(BCPG-NSA)による行動制約付きポリシーのグラディエントを提案する。
BCPG-NSA は,1) サンプルセグメンテーション,2) LLM と PRM を併用した合意に基づくステップ正当性評価,3) 正のステップを負のサンプル内で効果的にマイニングするNSA とのポリシー最適化の3段階を含む,詳細なオフラインフレームワークである。
実験の結果、BCPG-NSAは、同じトレーニングデータセットを使用して、いくつかの挑戦的な数学/コーディング推論ベンチマークのベースラインよりも優れていた。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:16:49 GMT)
Invisible Entropy: Towards Safe and Efficient Low-Entropy LLM Watermarking [48.3] Invisible Entropy (IE)は、安全性と効率性の両方を高めるために設計された透かしパラダイムである。
IEはパラメータサイズを99%削減し、最先端のメソッドと同等のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:19:06 GMT)
Speculative Decoding Reimagined for Multimodal Large Language Models [48.1] 本稿では,Multimodal Large Language Models(MLLM)推論を高速化するために,MSD(Multimodal Speculative Decoding)を提案する。
実験の結果、MSDはLLaVA-1.5-7Bの推論速度を最大2.29倍、LLaVA-1.5-13Bのマルチモーダルベンチマークでは最大2.46倍に向上した。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:12:17 GMT)
Through a Compressed Lens: Investigating the Impact of Quantization on LLM Explainability and Interpretability [48.1] 量子化法は推論の高速化と大規模言語モデル(LLM)の展開の合理化に広く用いられている。
異なるビット幅で3つの共通量子化技術を用いて実験を行い、2つの説明可能性手法、対実例と自然言語の説明、および2つの解釈可能性アプローチ、知識分析および潜時マルチホップ推論分析を行った。
その結果, 量子化は構成によっては, モデル説明可能性や解釈可能性に大きな影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:01:09 GMT)
Success is in the Details: Evaluate and Enhance Details Sensitivity of Code LLMs through Counterfactuals [48.0] コード感度(Code Sensitivity)とは、コードLLMが問題記述の詳細な変更を認識し、応答する能力である。
まず, 対実摂動を用いたCTF-Codeベンチマークを紹介する。
感度を完全に活用するために、インクリメンタルインストラクションの微調整フレームワークであるCTF-Instructは、既存のデータに拡張し、選択メカニズムを使用して難易度、多様性、感度の3次元を満たす。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:48:57 GMT)
Table Foundation Models: on knowledge pre-training for tabular learning [47.5] TARTEは、文字列を使ってテーブルを知識に富んだベクトル表現に変換する基礎モデルである。
大規模なリレーショナルデータに基づいて事前トレーニングされたTARTEは、後続の学習を容易にする表現を、ほとんど追加コストなしで提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:27:51 GMT)
TOP-Former: A Multi-Agent Transformer Approach for the Team Orienteering Problem [47.4] 車両群のためのルートプランニングは、荷物の配送、監視、輸送といった応用において重要な課題である。
ToP-Formerは、チームのオリエンテーリング問題を効率的に正確に解くために設計されたマルチエージェント経路計画ニューラルネットワークである。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:46:11 GMT)
Unlabeled Data or Pre-trained Model: Rethinking Semi-Supervised Learning and Pretrain-Finetuning [47.3] 半教師付き学習(SSL)は、ラベルのないデータを活用することにより、データラベリングプロセスのコストを軽減する。
プレトレイン・ネットワークのパラダイムは近年大きな注目を集めている。
この2つのパラダイムを公平に比較できるフレームワークであるtextitFew-shot SSLを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:23:45 GMT)
Uncovering Cultural Representation Disparities in Vision-Language Models [47.0] VLM(Vision-Language Models)は、様々なタスクにまたがる印象的な機能を示しているが、その潜在的なバイアスには懸念がある。
本研究は、画像に基づく国識別タスクにおいて、その成果を国レベルで評価することにより、著名なVLMが文化的偏見を示す程度について検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:04:09 GMT)
Large Language Models Implicitly Learn to See and Hear Just By Reading [46.8] テキストトークン上で自動回帰LDMモデルをトレーニングすることにより、テキストモデルは本質的に内部で画像や音声を理解する能力を開発する。
本稿では,CIFAR-10とFashion-MNISTの画像分類と画像パッチについて述べる。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:20:16 GMT)
STree: Speculative Tree Decoding for Hybrid State-Space Models [46.2] 投機的復号化(英: Speculative decoding)は、大規模自己回帰変換(AR)モデルの効率を改善するためにハードウェアを活用する手法である。
状態空間モデル(SSM)とハイブリッドアーキテクチャでツリーベースの投機的復号化を行うための,最初のスケーラブルアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:12:16 GMT)
RouterEval: A Comprehensive Benchmark for Routing LLMs to Explore Model-level Scaling Up in LLMs [45.9] 大規模言語モデル(LLM)のルーティングにおいて,新しいモデルレベルのスケールアップ現象を示す。
この改善は、プール内の最高のシングルモデルと多くの既存の強力なLCMのパフォーマンスを上回ります。
我々は、ルータ研究に適したベンチマークであるRuterEvalを紹介し、12のLLM評価に対して20,000,000以上のパフォーマンス記録を含む。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:59:21 GMT)
MacRAG: Compress, Slice, and Scale-up for Multi-Scale Adaptive Context RAG [45.3] マルチスケール適応コンテキストRAG(英: Multi-scale Adaptive Context RAG)は、文書を粗い粒度に圧縮して分割する階層的なRAGフレームワークである。
MacRAGは効率的なクエリ固有長コンテキストを構築し、精度とカバレッジの両方を最適化する。
本研究は,MacRAGを実世界の長文マルチホップ推論のための効率的でスケーラブルなソリューションとして確立した。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:24:44 GMT)
KO: Kinetics-inspired Neural Optimizer with PDE Simulation Approaches [45.2] 本稿では、運動理論と偏微分方程式(PDE)シミュレーションにインスパイアされた新しい神経勾配であるKOを紹介する。
我々は、ネットワークパラメータの力学を、運動原理によって支配される粒子系の進化として再想像する。
この物理駆動のアプローチは、パラメータ凝縮の現象を緩和し、最適化中のパラメータの多様性を本質的に促進する。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:00:01 GMT)
AAPO: Enhance the Reasoning Capabilities of LLMs with Advantage Momentum [45.1] 大規模言語モデル(LLM)の推論能力を高める効果的なアプローチとして強化学習(RL)が登場している。
グループ相対的優位性推定は、値モデルへの依存性を排除したことでかなりの注目を集めている。
本稿では,モーメントに基づく推定手法によって強化された利点を用いて,クロスエントロピー損失を最適化する新しいRLアルゴリズムであるAdvantage-Augmented Policy Optimization (AAPO)を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:13:44 GMT)
Process vs. Outcome Reward: Which is Better for Agentic RAG Reinforcement Learning [45.1] Retrieval-augmented Generation (RAG)は大規模言語モデル(LLM)のテキスト生成能力を向上する
RAG-ProGuideは,クエリ生成,エビデンス抽出,回答生成のためのプロセスレベルの報酬を提供する高品質なデータセットである。
プロセスレベルのポリシー最適化により、提案フレームワークはLLMに対して、検索を自律的に実行し、クエリを生成し、関連する証拠を抽出し、最終的な回答を生成する権限を与える。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:21:00 GMT)
VLMs as GeoGuessr Masters: Exceptional Performance, Hidden Biases, and Privacy Risks [44.7] 詳細な地理メタデータと組み合わせた1200枚の画像からなるベンチマークを導入する。
これらのモデルは画像から地理情報を認識する能力を示すが、大きなバイアスを示す。
特に、経済的に発達し人口密度の高い地域では、パフォーマンスが著しく高い。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:49:02 GMT)
Open3DVQA: A Benchmark for Comprehensive Spatial Reasoning with Multimodal Large Language Model in Open Space [44.4] オープンな3次元空間における最先端基礎モデル(SOTA)の空間的推論能力を包括的に評価する新しいベンチマークOpen3DVQAを提案する。
Open3DVQAは9kのVQAサンプルで構成され、高忠実度都市シミュレーターにおける効率的な半自動ツールを用いて収集される。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:52:00 GMT)
DEFT: Efficient Fine-Tuning of Diffusion Models by Learning the Generalised $h$-transform [44.3] DFT(Doob's h-transform Efficient FineTuning)は、非常に小さなネットワークを微調整して条件付き$h$-transformを高速に学習する条件生成手法である。
画像再構成作業では, 自然画像の知覚品質と医用画像の再現性能を最良に保ちながら, 最大1.6$times$の高速化を実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:15:50 GMT)
Byte Pair Encoding for Efficient Time Series Forecasting [44.3] 既存の時系列トークン化法は主に、一定の数のサンプルを個々のトークンにエンコードする。
バイトペア符号化の成功に触発されて、時系列解析のための最初のパターン中心トークン化スキームを提案する。
本手法は, 頻繁なモチーフの個別語彙に基づいて, 基本パターンをトークンにマージし, 時系列を適応的に圧縮する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:24:49 GMT)
Arithmetic Without Algorithms: Language Models Solve Math With a Bag of Heuristics [43.9] 大規模言語モデル (LLM) は, 頑健なアルゴリズムや暗記を使わず, 算術的に実行可能であることを示す。
実験結果から,LLMはロバストなアルゴリズムや暗記を使わずに演算を行うことがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:29:40 GMT)
FuxiMT: Sparsifying Large Language Models for Chinese-Centric Multilingual Machine Translation [43.3] 広汎言語モデル(LLM)を利用した中国語中心多言語機械翻訳モデルFuxiMTを提案する。
FuxiMTはMixture-of-Experts (MoEs)を導入し、様々なリソースレベルにわたる堅牢なパフォーマンスのためのカリキュラム学習戦略を採用している。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:09:17 GMT)
Adaptive Pruning of Deep Neural Networks for Resource-Aware Embedded Intrusion Detection on the Edge [43.0] 我々は、新しいサイバーセキュリティデータセットに一般化する人工知能プルーニング手法の選択能力を分析する。
それらの多くは問題をうまく一般化していないことが分かっており、許容できる程度に働くアルゴリズムはわずかである。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:45:54 GMT)
Textual Steering Vectors Can Improve Visual Understanding in Multimodal Large Language Models [42.4] テキスト由来のステアリングは多様なMLLMアーキテクチャや視覚タスクのマルチモーダル精度を一貫して向上させる。
平均シフトはCV-Bench上の空間関係の精度を+7.3%、精度を+3.3%向上させる。
その結果、テキストステアリングベクトルは、最小限のデータ収集と計算オーバーヘッドでMLLMのグラウンド化を強化するための強力で効率的なメカニズムとして強調された。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:23:08 GMT)
Self-Reasoning Language Models: Unfold Hidden Reasoning Chains with Few Reasoning Catalyst [42.4] モデル自体がより長いCoTデータを合成し、自己学習により性能を向上させることができる。
提案したSRLMは,5つの推論タスクに対して,平均2.5ドル以上の絶対値改善を実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:21:26 GMT)
Improving Language Model Personas via Rationalization with Psychological Scaffolds [42.0] 我々は,ユーザがある判断を下す可能性の有意な根拠を取り入れて,LMペルソナを改善するフレームワークPB&Jを紹介する。
我々の合理性は言語モデルによって生成され、経験、性格特性、信念に基づいてユーザーの行動を明確に推論する。
提案手法は心理的な足場を用いており、例えばビッグ5パーソナリティ・トラッツ(Big 5 Personality Traits)やプリマル・ワールド・ブリーフ(Primal World Beliefs)のような構造化されたフレームワークは、既存の理論で生成された理論的根拠を基礎づけるのに役立つ。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:58:25 GMT)
Second Law of Entanglement Manipulation with Entanglement Battery [41.9] 量子情報科学の始まり以来の中心的な疑問は、2つの遠い当事者が1つの絡み合った状態を別の状態に変換する方法である。
そのような変換は、古典的熱力学におけるカルノーサイクルの可逆性を反映して、レジームで可逆的に実行できると推測されている。
任意の混合状態絡み合い変換を局所演算と古典的可逆通信の下で行うことができることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:56:24 GMT)
Disentangling signalling and causal influence [41.9] 任意のユニタリチャネルによって伝達されるシグナルの量と因果影響を定量化する2つの関数の特性について検討する。
量子CNOTのシグナリングと因果影響の間には、有限のギャップがある。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:26:53 GMT)
Scaling Law for Quantization-Aware Training [41.8] 量子化対応トレーニング(QAT)は、性能を維持しながらモデルの精度を低下させる。
既存のQATスケーリング法則は、トレーニングトークンの数や量子化の粒度といった重要な要素を無視している。
本稿では、モデルサイズ、トレーニングデータボリューム、量子化グループサイズの関数として量子化誤差をモデル化するQATの統一スケーリング法則を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:54:43 GMT)
Context Reasoner: Incentivizing Reasoning Capability for Contextualized Privacy and Safety Compliance via Reinforcement Learning [41.6] 安全とプライバシの問題を文脈整合性(CI)理論に従って文脈整合性問題に定式化する。
CIフレームワークの下では、当社のモデルを3つの重要な規制基準 – EU AI ActとHIPAA – に整合させています。
我々は、安全・プライバシー基準の遵守を高めつつ、文脈推論能力を高めるためにルールベースの報酬を持つ強化学習(RL)を採用している。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:40:09 GMT)
Strategic Planning and Rationalizing on Trees Make LLMs Better Debaters [41.6] 競争の激しい議論の枠組みであるTreeDebaterを提案する。
TreeDebaterは、人間の議論専門家の戦略と整合して、重要な議論行動に時間を割くためのより良い戦略を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:17:51 GMT)
Visionary-R1: Mitigating Shortcuts in Visual Reasoning with Reinforcement Learning [41.6] 我々は視覚言語モデル(VLM)を訓練し、強化学習と視覚質問応答ペアを通して画像データに基づく推論を行う。
我々のモデルであるVisionary-R1は、複数の視覚的推論ベンチマークにおいて、強力なマルチモーダルモデルよりも優れています。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:58:35 GMT)
Rao-Blackwell Gradient Estimators for Equivariant Denoising Diffusion [41.5] 分子やタンパク質の生成のようなドメインでは、物理系はモデルにとって重要な固有の対称性を示す。
学習のばらつきを低減し、確率的に低い分散勾配推定器を提供するフレームワークを提案する。
また,軌道拡散法(Orbit Diffusion)と呼ばれる手法を用いて,損失とサンプリングの手順を取り入れた推定器の実用的実装を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:36:10 GMT)
s3: You Don't Need That Much Data to Train a Search Agent via RL [41.2] Retrieval-augmented Generation (RAG)システムでは、大規模言語モデル(LLM)が推論中に外部知識にアクセスできるようになる。
本稿では,検索者をジェネレータから切り離し,Gain Beyond RAG報酬を用いて検索者を訓練する,軽量でモデルに依存しないフレームワークであるs3を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:53:56 GMT)
Replay Attacks Against Audio Deepfake Detection [41.1] リプレイ攻撃がディープフェイク検出を損なうことを示す。
様々なスピーカーやマイクロホンを通じてディープフェイク音声を再生・再生することにより,スプーフされたサンプルを検出モデルに忠実に表示する。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:46:36 GMT)
RLVR-World: Training World Models with Reinforcement Learning [41.1] 検証可能な報酬で強化学習を活用する統合フレームワークであるRLVR-Worldを提案する。
我々は,テキストゲーム,Webナビゲーション,ロボット操作など,ドメイン間の言語およびビデオベースの世界モデルにおいて,大幅なパフォーマンス向上を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:02:53 GMT)
MCIP: Protecting MCP Safety via Model Contextual Integrity Protocol [40.4] 本稿では,モデルコンテキストプロトコルの安全性を高めるための新しいフレームワークを提案する。
MAESTRO フレームワークをベースとして,まず MCP に欠落する安全機構を解析する。
我々は、MPPシナリオで観察されるさまざまな安全でない振る舞いを捉える、きめ細かい分類法を開発した。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:41:45 GMT)
Latent Action Learning Requires Supervision in the Presence of Distractors [40.3] 実世界のビデオには、潜在的なアクション学習を妨げるアクション関連障害が含まれていることが示されています。
LAOMは,潜伏動作の質を8倍に向上する簡易なLAPO修正法である。
我々は、潜在アクション学習中のデータセット全体の2.5%にも満たない、地道的なアクションによる監視を提供することで、下流のパフォーマンスが平均4.2倍向上することを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:10:54 GMT)
Learning to Reason under Off-Policy Guidance [40.3] textbfLUFFY(textbfLearning to reason textbfUnder otextbfFF-polictextbfY guidance)を導入する。
LUFFYは、模擬と探検のバランスを取るために、オフ・ポリティクスのデモとオン・ポリティクスのロールアウトを組み合わせる。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:29:49 GMT)
Dual Data Alignment Makes AI-Generated Image Detector Easier Generalizable [39.8] バイアス付きデータセットでしばしば訓練される検出器は、実・合成ラベルと急激な相関がある。
本稿では,DDA(Dual Data Alignment)を提案する。
また、DDA-COCOとEvalGENの2つの新しいテストセットを導入し、検出器を評価するための最新の生成モデルを紹介した。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:42:38 GMT)
Hunyuan-Game: Industrial-grade Intelligent Game Creation Model [39.7] Hunyuan-Gameは知的ゲーム制作に革命をもたらすために設計された革新的なプロジェクトである。
このプロジェクトは、画像生成とビデオ生成の2つの主要分野を含んでいる。
画像生成コンポーネントは、数十億のゲームイメージからなる広大なデータセット上に構築されている。
ビデオ生成コンポーネントは、数百万のゲームとアニメのビデオのデータセットの上に構築されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:39:48 GMT)
Contrastive Alignment with Semantic Gap-Aware Corrections in Text-Video Retrieval [39.7] Gap-Aware Retrievalフレームワークは、テキストt_iとビデオv_jの間で学習可能な、ペア固有のインクリメントDelta_ijを導入している。
GAREは、アライメントの正確さと頑健さをノイズ管理に継続的に改善する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:25:42 GMT)
APEER: Automatic Prompt Engineering Enhances Large Language Model Reranking [39.6] APEERという新しい自動プロンプトエンジニアリングアルゴリズムを導入する。
APEERはフィードバックと好みの最適化を通じて改良されたプロンプトを反復的に生成する。
APEERが生成するプロンプトは,多種多様なタスクやLLM間で高い転送性を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:36:54 GMT)
LED: LLM Enhanced Open-Vocabulary Object Detection without Human Curated Data Generation [39.6] 大規模視覚言語データに基づいてトレーニングされた大規模な基礎モデルは、OVD(Open-Vocabulary Object Detection)を加速させる。
本稿では,Large Language Models (LLMs) のデコーダ層を利用して,視覚的グラウンド化を強化する手法を提案する。
中間的なLCM層は、既にリッチな空間意味論を符号化しており、初期層のみを適用すると、ほとんどの利得が得られる。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:22:45 GMT)
Improving Medium Range Severe Weather Prediction through Transformer Post-processing of AI Weather Forecasts [39.6] 本研究では,デコーダのみのトランスフォーマーネットワークをAIによる天気予報処理に活用する手法を提案する。
本手法は,予測リードタイムをシーケンシャルトークンとして扱うことで,トランスフォーマーが複雑な時間的関係を学習できるようにする。
その結果,変圧器を用いた後処理は,高密度ニューラルネットワークと比較して予測能力を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:42:26 GMT)
Most General Explanations of Tree Ensembles (Extended Version) [39.4] 「AIシステムの主な疑問は、なぜこの決定がこのようにされたのかである。」
私たちは、AI決定に対して最も一般的な帰納的説明を見つける方法を示します。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:10:09 GMT)
Legal Rule Induction: Towards Generalizable Principle Discovery from Analogous Judicial Precedents [39.4] 法規は、法典の定式化だけでなく、差別的規範、社会的道徳、政策を含む前例から派生した暗黙の偏見的原則も含んでいる。
我々は、類似した前例の集合から簡潔で一般化可能なドクトリン規則を導出するタスクとして法則帰納法(LRI)を定式化する。
モデルチューニングのための5,121のケースセット(合計38,088のケース)と216のエキスパートアノテートゴールドテストセットからなる最初のLRIベンチマークを導入する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:10:52 GMT)
Towards the Causal Complete Cause of Multi-Modal Representation Learning [39.2] マルチモーダル学習は、正確な予測のためにモダリティ間の効果的な表現を学習することを目的としている。
因果的に見れば、効果的なMML表現は因果的に十分であり、必要である。
我々は,学習した表現の因果完全性を強制するプラグイン・アンド・プレイ法である$C3$正規化を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:49:01 GMT)
TransBench: Benchmarking Machine Translation for Industrial-Scale Applications [39.0] 機械翻訳(MT)は、電子商取引、金融、法務サービスといったグローバル産業における国境を越えたコミュニケーションにとって欠かせないものとなっている。
汎用MTモデルを産業シナリオに適用すると、ドメイン固有の用語、文化的ニュアンス、および一般的なベンチマークに欠落したスタイル上の規則による限界が明らかになる。
既存の評価フレームワークは、専門的な文脈での翻訳を不十分に評価し、学術ベンチマークと実世界の有効性の間にギャップを生じさせる。
産業用MTのベンチマークであるTransBenchを導入し、最初は4つの主要なシナリオと33の言語ペアにまたがる17,000の文で国際eコマースをターゲットにした。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:54:58 GMT)
WirelessMathBench: A Mathematical Modeling Benchmark for LLMs in Wireless Communications [39.0] WirelessMathBenchは,Large Language Models (LLMs) を評価するために設計された,新しいベンチマークである。
私たちのベンチマークは、40の最先端の研究論文から得られた、587の厳密にキュレートされた質問で構成されています。
ベンチマークで最高のパフォーマーであるDeepSeek-R1でさえ、平均精度は38.05%に過ぎず、完全な方程式の完成率は7.83%である。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:38:10 GMT)
Fast Text-to-Audio Generation with Adversarial Post-Training [39.0] テキストとオーディオのシステムは推論時に遅いため、多くのクリエイティブなアプリケーションではレイテンシが実用的ではない。
本稿では, 蒸留法をベースとしない拡散流モデルに対する最初の逆数加速アルゴリズムである, ARC(Adversarial Relativistic-Contrastive Re-trainstive Re-training)について述べる。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:54:49 GMT)
Scaling Stick-Breaking Attention: An Efficient Implementation and In-depth Study [38.5] 大規模環境下での突破プロセスに基づく別の注意機構について検討する。
従来のソフトマックス方式のアテンション機構をスティック破りのアテンションに置き換えることの意味について検討した。
現在のSoftmax+RoPEアテンションシステムのドロップイン代替として使用すると、スティック破りのアテンションが現在の手法と競合することがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:48:26 GMT)
Vid2World: Crafting Video Diffusion Models to Interactive World Models [38.3] Vid2Worldは、トレーニング済みのビデオ拡散モデルをインタラクティブな世界モデルに活用し、転送するための一般的なアプローチである。
自己回帰生成を可能にするために、そのアーキテクチャとトレーニング目標を構築することにより、事前訓練されたビデオ拡散モデルのカジュアル化を行う。
対話型世界モデルにおける行動制御性を高めるための因果的行動誘導機構を導入する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:41:45 GMT)
Scaling Video-Language Models to 10K Frames via Hierarchical Differential Distillation [38.3] ViLAMPは階層型ビデオ言語モデルで、1時間の動画を「混合精度」で処理する
ViLAMPは、非キーフレームを最も健全な特徴に減らしながら、完全な情報を保持し、混合精度のトレーニングに似ている。
特にViLAMPは、単一のNVIDIA A100 GPU上で超長いビデオ(最大10Kフレーム)を処理できる。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:55:21 GMT)
KIND: Knowledge Integration and Diversion for Training Decomposable Models [38.2] 本稿では,分解可能なモデルを構築するための事前学習手法であるKINDを提案する。
KINDは、クラスに依存しない知識をカプセル化するための学習遺伝子と、クラス固有の知識をキャプチャするためのテーラーを統合している。
実験により、KINDで事前訓練されたモデルは、学習遺伝子とテーラーに分解でき、多様なリソース制約されたデプロイメントに適応的に再結合できることが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:08:45 GMT)
MORALISE: A Structured Benchmark for Moral Alignment in Visual Language Models [38.0] 視覚言語モデルは、自律運転や医療分析のような道徳的に敏感な領域に影響を与えている。
我々は,多種多様な専門家による実世界のデータを用いて,視覚言語モデルのモラルアライメントを評価するベンチマークMORALISEを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:11:17 GMT)
Interactive Rendering of Relightable and Animatable Gaussian Avatars [37.7] 本稿では,多視点映像や単眼アバター映像から身体材料と照明を分離する簡便で効率的な方法を提案する。
提案手法は,合成データと実データの両方で高速に高品質な結果が得られる。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:19:36 GMT)
Scaling and Enhancing LLM-based AVSR: A Sparse Mixture of Projectors Approach [37.7] Llama-SMoPは、推論コストを増大させることなくモデル容量をスケールするためにスパース・ミクチャー・オブ・プロジェクター(SMoP)モジュールを使用している。
ASR、VSR、AVSRタスクにおいて優れた性能を発揮する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:20:55 GMT)
Domain Gating Ensemble Networks for AI-Generated Text Detection [37.7] DoGENは、一連のドメインエキスパート検出器モデルを組み立てることで、検出器が目に見えないドメインに適応できるようにする技術である。
我々は、主要なベンチマークから様々なドメインでDoGENをテストし、ドメイン内検出における最先端のパフォーマンスを実現することを発見した。
私たちは、ドメイン適応型AI検出における将来の研究を支援するために、コードとトレーニングされたモデルをリリースします。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:02:05 GMT)
Scaling Laws for Many-Shot In-Context Learning with Self-Generated Annotations [37.6] 本研究では,従来の半教師付き学習に類似した枠組みを用いて,自己生成例を用いたインコンテキスト学習について検討する。
本フレームワークでは,ゼロショット,少数ショット,多ショット設定において,グランドトルースICLよりも優れた単純なベースラインを提案する。
本稿では,反復的洗練と擬似ラベル技術を統合する反復的アノテーション手法であるIterPSDを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:36:09 GMT)
Local Mixtures of Experts: Essentially Free Test-Time Training via Model Merging [37.0] 専門家(MoE)モデルの混合は、推論コストを増大させることなくモデルキャパシティを増やすための有望なアプローチである。
我々は、MoEパラダイムを桁違いに多くの専門家に拡張するTTMM(Test-Time Model Merging)を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:39:54 GMT)
Vision-Language Modeling Meets Remote Sensing: Models, Datasets and Perspectives [36.3] 視覚言語モデリング(VLM)は、画像と自然言語の間の情報ギャップを埋めることを目的としている。
大規模な画像テキストペアを事前学習し、タスク固有のデータを微調整するという新しいパラダイムの下で、リモートセンシング領域のVLMは大きな進歩を遂げた。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:47:40 GMT)
InfiGFusion: Graph-on-Logits Distillation via Efficient Gromov-Wasserstein for Model Fusion [36.3] InfiGFusionは、新しいtextitGraph-on-Logits Distillation (GLD)損失を持つ構造認識融合フレームワークである。
GLDは核融合品質と安定性を継続的に改善することを示す。
複雑な推論タスクでは、多段階算術において+35.6、SFT上の因果判定において+37.06が改良された。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:55:35 GMT)
InfiFPO: Implicit Model Fusion via Preference Optimization in Large Language Models [36.3] InfiFPOは暗黙的なモデル融合のための選好最適化手法である。
これにより、ピボットモデルは、ソースモデルからの知識を効果的に蒸留しながら、人間の好みに合わせることができる。
数学、コーディング、推論タスクの能力を大幅に改善する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:32:37 GMT)
PersonaTAB: Predicting Personality Traits using Textual, Acoustic, and Behavioral Cues in Fully-Duplex Speech Dialogs [36.2] 音声データセットにパーソナリティアノテーションがないために、パーソナリティを意識した会話エージェントが不足している。
本研究では、生音声録音を前処理して、タイムスタンプ、応答タイプ、感情・感覚ラベルを付加した対話データセットを作成するパイプラインを提案する。
自動音声認識(ASR)システムを用いて,テキストとタイムスタンプを抽出し,会話レベルのアノテーションを生成する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:41:32 GMT)
Solving graph problems using permutation-invariant quantum machine learning [36.0] 量子機械学習では、アンザッツは問題の特定の対称性に対応するように調整することができる。
簡単な構成法で量子回路に対称性を組み込む方法を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:11:28 GMT)
Lessons from Defending Gemini Against Indirect Prompt Injections [35.7] Google DeepMindのアプローチで、Geminiモデルの対角的堅牢性を評価することにしました。
我々は,敵対的評価フレームワークを用いて,ジェミニが高度な敵に対してどのように機能するかを検証する。
これらの継続的な評価が、Geminiの操作に対する耐性を高めるのにどのように役立つかを説明している。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:54:45 GMT)
DMDTEval: An Evaluation and Analysis of LLMs on Disambiguation in Multi-domain Translation [35.7] 大規模言語モデル(LLM)は機械翻訳において顕著な成果を上げている。
しかし、マルチドメイン翻訳(MDT)の性能は不十分である。
マルチドメイン翻訳(DMDTEval)における曖昧性の評価と解析について述べる。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:21:24 GMT)
LoVR: A Benchmark for Long Video Retrieval in Multimodal Contexts [35.5] 長いビデオテキスト検索用に特別に設計されたベンチマークであるLoVRを紹介する。
LoVRには467本の長編ビデオと40,804本の細かなクリップがあり、高品質なキャプションがある。
私たちのベンチマークでは、より長いビデオ、より詳細なキャプション、より大規模なデータセットを導入しています。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:49:09 GMT)
Unify Graph Learning with Text: Unleashing LLM Potentials for Session Search [35.2] セッション検索は、ユーザの複雑な情報ニーズを満たすための一連の対話的なクエリとアクションを含む。
現在の戦略は、相互作用のグラフ構造を見渡すことで、深い意味理解のためのシーケンシャルなモデリングを優先している。
テキストベースとグラフベースの両方のアプローチを活用することを目的としたSGR(Symbolic Graph Ranker)を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:05:06 GMT)
Riemannian Flow Matching for Brain Connectivity Matrices via Pullback Geometry [35.0] DiffeoCFMは, 微分同相によって誘導される行列の引き戻し量に対する条件付きフローマッチング(CFM)を可能にする手法である。
これは、多様体の制約を保ちながら、高速なトレーニングと共同生成された最先端のパフォーマンスを可能にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:52:55 GMT)
Think-J: Learning to Think for Generative LLM-as-a-Judge [35.0] 本稿では,LLM-as-a-Judgeの考え方を学習することで,ジェネレーティブなLLM-as-a-Judgeを改善するThink-Jを提案する。
本稿では,オフラインとオンラインのRLに基づく2つの判断思考最適化手法を提案する。
提案手法は, ジェネレーションLLM-Judgeの評価能力を大幅に向上させることができることを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:19:10 GMT)
ThinkSwitcher: When to Think Hard, When to Think Fast [35.0] 大きな推論モデル(LRM)は、長いチェーン・オブ・シークレット(CoT)推論を活用することで複雑なタスクを解くのに優れている。
本研究では,短いCoTモードと長いCoTモードを動的に切り替えるフレームワークであるThinkSwitcherを提案する。
ThinkSwitcherは複雑なタスクの精度を維持しながら、計算コストを20~30%削減する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:40:41 GMT)
Will AI Tell Lies to Save Sick Children? Litmus-Testing AI Values Prioritization with AIRiskDilemmas [34.9] 人間における危険行動が、しばしば強固に保持された価値観によって導かれるかに触発された私たちは、AIモデル内の価値を特定することが、AIの危険行動に対する早期警告システムであると考えている。
私たちは、AIバリュークラスの範囲でAIモデルの優先順位を明らかにするための評価パイプラインであるLitmusValuesを作成します。
LitmusValuesの値は、AIRiskDilemmasで見られたリスク行動とHarmBenchで見つからないリスク行動の両方を予測することができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:24:09 GMT)
MSDformer: Multi-scale Discrete Transformer For Time Series Generation [34.9] マルチスケール離散変換器(MSDformer)と呼ばれる,マルチスケールDTMに基づく時系列生成手法を提案する。
MSDformerは、複数のスケールで離散トークン表現を学習するために、マルチスケールの時系列トークンーを使用しており、時系列データの複雑な性質を共同で特徴づけている。
実験により、MSDformerは最先端の手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:01:36 GMT)
CraftsMan3D: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner [34.8] CraftsManは、非常に多様な形状、通常のメッシュトポロジ、詳細な表面を持つ高忠実な3Dジオメトリを生成することができる。
本手法は,従来の方法に比べて高品質な3Dアセットの製作に有効である。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:44:45 GMT)
LLM-DSE: Searching Accelerator Parameters with LLM Agents [34.8] LLM-DSEは、HLSディレクティブの最適化に特化したマルチエージェントフレームワークである。
我々の探検家は、ルーター、スペシャリスト、アビテーター、批評家の4人のエージェントを調整します。
LLM-DSEは最先端の手法よりも2.55倍の性能向上を実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:29:37 GMT)
Bridge2AI: Building A Cross-disciplinary Curriculum Towards AI-Enhanced Biomedical and Clinical Care [34.7] NIH Bridge2AI Working Groupは、協力的革新、倫理的データ管理、専門的開発を基礎とした学際的なカリキュラムを開発した。
北米で30人以上の学者と100人以上のメンターが参加し、TRMモデルは、適応的でペルソナによるインフォームドトレーニングが学際的な能力を生み出すことを実証している。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:19:05 GMT)
Model Merging in Pre-training of Large Language Models [34.6] 本稿では,事前学習過程におけるモデルマージ手法について包括的に検討する。
一定の学習率で訓練されたチェックポイントをマージすることで、大幅な性能向上が達成できることを示す。
我々は、効果的なモデルマージのための実践的な事前トレーニングガイドラインをオープンソースコミュニティに提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:55:50 GMT)
Hotspot-Driven Peptide Design via Multi-Fragment Autoregressive Extension [34.6] PepHARは、特定のタンパク質を標的としたペプチドを設計するためのホットスポット駆動の自己回帰生成モデルである。
特定のホットスポット残基が高い相互作用ポテンシャルを持つという観測に基づいて、我々はまずエネルギーベースの密度モデルを用いてこれらのキー残基を適合させ、サンプリングする。
ホットスポットサンプリングとフラグメントベースの拡張を組み合わせることで,ターゲットタンパク質に適合したデノボペプチドの設計が可能となった。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:55:01 GMT)
Impact of Frame Rates on Speech Tokenizer: A Case Study on Mandarin and English [34.4] マンダリンと英語を調べた結果,フレームレートの変動が音声のトークン化に与える影響について検討した。
我々は、異なるフレームレートで音声を符号化し、音声認識タスクにおける結果のセマンティックトークンを評価する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:01:19 GMT)
Deep Learning for Multivariate Time Series Imputation: A Survey [34.3] 欠落値は多変量時系列(MTS)データでユビキタスである。
深層学習に基づく手法は、複雑な時間的依存関係と学習データ分散を活用することで、欠落データを扱うことに成功した。
本稿では,既存の手法を2つの重要な観点から分類する新しい分類法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:57:10 GMT)
A Survey on Large Language Model based Human-Agent Systems [34.3] 大規模言語モデル(LLM)は、完全に自律的なエージェントの構築への関心が高まっている。
LLM-HASは、システムの性能、信頼性、安全性を高めるために、人為的な情報、フィードバック、制御をエージェントシステムに組み込む。
本稿は, LLM-HASの総合的かつ構造化された最初の調査である。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:12:02 GMT)
SparC: Sparse Representation and Construction for High-Resolution 3D Shapes Modeling [34.2] SparCは、スパース変形可能なマーチングキューブ表現SparseCubesと新しいエンコーダSparConv-VAEを組み合わせた統一フレームワークである。
SparseCubesは、符号付き距離と変形場をスパース立方体に散乱させることにより、任意の位相で原メッシュを高分解能な表面に変換する。
VAEは、スパース畳み込みネットワーク上に構築された最初のモダリティ一貫性の変分オートエンコーダである。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:44:54 GMT)
IP Leakage Attacks Targeting LLM-Based Multi-Agent Systems [34.2] マルチエージェントシステム(MAS)から機密情報を抽出する新しい攻撃フレームワークMASLEAKを紹介する。
MASLEAKは実用的でブラックボックスの設定を目標としており、敵はMASアーキテクチャやエージェント設定について事前の知識を持っていない。
810個のアプリケーションを用いたMASアプリケーションの最初の合成データセットを構築し、CozeやCrewAIを含む実世界のMASアプリケーションに対してMASLEAKを評価する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:48:36 GMT)
Decoupling Classifier for Boosting Few-shot Object Detection and Instance Segmentation [33.7] 本稿では、いくつかのラベル付きインスタンスを持つ新しいクラスに迅速に適応するモデルを必要とする、FSOD( few-shot object detection)とFSIS( instance segmentation)に焦点を当てる。
我々の分析は、ほとんどのFSODモデルやFSISモデルの標準分類ヘッドは、バイアス分類を緩和するために分離する必要があることを示唆している。
このようにして、モデルはノイズ負のサンプルの効果を緩和しながら、新しいクラスを効果的に学習することができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:47:34 GMT)
Reasoning Models Better Express Their Confidence [33.7] 大規模言語モデル(LLM)は、信頼度を正確に伝達できないことが多いため、いつ間違っているのかを判断したり、信頼性を制限したりするのは難しい。
本研究では,CoT推論に係わる推論モデル-LLMが,問題解決だけでなく,その信頼性を正確に表現する上で,優れた性能を示すことを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:19:00 GMT)
Place Cells as Position Embeddings of Multi-Time Random Walk Transition Kernels for Path Planning [33.7] 海馬は、認知地図を形成する集合的な場所細胞エンコーディングを通して空間的なナビゲーションを編成する。
我々は,場所細胞の個体群をマルチスケールのランダムウォーク遷移カーネルを近似した位置埋め込みとして再認識する。
本モデルでは, 計算効率を向上しつつ, 位置セル特性, フィールドサイズ分布, 適応性, 再マッピングを捉える。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:14:11 GMT)
UniCTokens: Boosting Personalized Understanding and Generation via Unified Concept Tokens [33.7] 我々は、パーソナライズされた情報を統合された視覚言語モデル(VLM)に統合し、理解と生成を行うUniCTokensを提案する。
UniCTokensは、補完的なセマンティクスを活用するために統一された概念トークンのセットをトレーニングし、2つのパーソナライズされたタスクを強化した。
我々の研究は、理解の向上が生成を改善することを示し、生成プロセスは理解に価値ある洞察を与えることができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:56:01 GMT)
M-RewardBench: Evaluating Reward Models in Multilingual Settings [33.4] 我々は、M-RewardBenchというマルチリンガルRM評価ベンチマークを構築した。
M-RewardBenchは23の類型的に多様な言語に対する2.87kの好みのインスタンスで構成されている。
RMの性能が向上し,翻訳品質が向上したことを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:23:39 GMT)
Diffusion-Based Failure Sampling for Evaluating Safety-Critical Autonomous Systems [33.3] 本稿では,ロボットタスク計画のような複雑な高次元問題に成功している条件付き認知拡散モデルを提案する。
提案手法は高次元ロボット検証作業における有効性を示し,既存のブラックボックス技術と比較して試料効率とモードカバレッジを改善した。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:21:03 GMT)
VideoEval-Pro: Robust and Realistic Long Video Understanding Evaluation [32.9] 大規模マルチモーダルモデル(LMM)は,LVU(Long Video Understanding)の強力なツールとして登場した。
既存のベンチマークのほとんどは、正しい答えを推測する可能性から評価結果が膨らむ多重選択質問(MCQ)に大きく依存している。
本稿では,リアルタイムなLVUベンチマークであるVideoEval-Proを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:26:32 GMT)
Emerging Properties in Unified Multimodal Pretraining [32.9] マルチモーダル理解と生成をサポートするオープンソース基盤モデルであるBAGELを紹介する。
BAGELは、大規模なインターリーブ付きテキスト、画像、ビデオ、Webデータからキュレートされた数兆のトークンに基づいて事前訓練された、統一されたデコーダ0のみのモデルである。
オープンソースの統一モデルでは、マルチモーダル生成と標準ベンチマークでの理解の両方において、大幅に優れています。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:59:30 GMT)
RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations [32.8] RoCoDAは、模倣学習のためのデータ拡張を強化する新しい方法である。
我々は5つのロボット操作タスクに関する広範な実験を通じてRoCoDAを検証する。
我々の政策は、目に見えない物体のポーズ、テクスチャ、および邪魔者の存在に対する堅牢な一般化を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:17:09 GMT)
Towards Inclusive ASR: Investigating Voice Conversion for Dysarthric Speech Recognition in Low-Resource Languages [32.6] 音声変換モデルを英語の変形音声(UASpeech)に微調整し、話者特性と韻律歪みの両方を符号化する。
次に、健康な非英語音声(FLEURS)を非英語の変形性音声に変換する。
生成されたデータは、MMS(Massively Multilingually Speech)と呼ばれる多言語ASRモデルの微調整に使用される。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:03:45 GMT)
Spiking Neural Networks with Temporal Attention-Guided Adaptive Fusion for imbalanced Multi-modal Learning [32.6] マルチモーダルスパイクニューラルネットワーク(SNN)のための時間的注意誘導型適応融合フレームワークを提案する。
提案フレームワークは,特に時間次元において適応的融合を実装し,マルチモーダル学習におけるモダリティの不均衡を軽減する。
本システムは,学習可能なタイムワープ操作と,ベースラインSNNよりも高速なモーダリティ収束調整により,時間的ずれを解消する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:55:11 GMT)
Technical Report: Quantifying and Analyzing the Generalization Power of a DNN [32.6] 本稿では,ディープニューラルネットワーク(DNN)の一般化能力を解析するための新しい視点を提案する。
非汎用的なインタラクションの学習が、トレーニングとテストの損失のギャップの直接的な原因であることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:25:12 GMT)
MCiteBench: A Multimodal Benchmark for Generating Text with Citations [31.8] MLLM(Multimodal Large Language Models)は多様なモダリティを統合するために進歩しているが、幻覚に悩まされることが多い。
既存の作業は主にテキストのみのコンテンツに対する引用の生成に重点を置いており、マルチモーダルシナリオの課題はほとんど解明されていない。
マルチモーダルな文脈で引用文を生成するMLLMの能力を評価するための最初のベンチマークであるMCiteBenchを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:58:29 GMT)
Nonlinear Meta-Learning Can Guarantee Faster Rates [31.2] 非線形表現を用いたメタラーニングの理論的保証を導出する。
特に、慎重に正規化することで、さらなるバイアスを緩和できることが示される。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:10:41 GMT)
Ground-V: Teaching VLMs to Ground Complex Instructions in Pixels [30.7] テキストインストラクションに基づくグラウンドリングにおける5つの重要な現実的課題に対処する。
提案手法は,既存の画素レベルのアノテーションに関連付けられた高品質な命令応答ペアを生成する。
実験結果から, グラウンド-Vで訓練したモデルでは, 多様なグラウンドタスクにまたがる大幅な改善が見られた。
論文参考訳(メタデータ) (Tue, 20 May 2025 00:37:19 GMT)
LDC-MTL: Balancing Multi-Task Learning through Scalable Loss Discrepancy Control [30.7] マルチタスク学習(MTL)は、複数のタスクを同時に学習する能力に広く採用されている。
両レベル最適化の観点から定式化されたMDLの簡易かつスケーラブルな損失分散制御手法であるLCC-MTLを提案する。
i)粗損失前正規化,(ii)細粒度損失分散制御のための二値式,(iii)$mathcalO(1)$時間とメモリのみを必要とするスケーラブルな一階二値アルゴリズムである。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:19:20 GMT)
OT-DETECTOR: Delving into Optimal Transport for Zero-shot Out-of-Distribution Detection [30.5] 現実世界のアプリケーションにおける機械学習モデルの信頼性と安全性を確保するためには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
テストサンプルとIDラベル間の意味的および分布的差異を定量化するために、OT(Optimal Transport)を用いた新しいフレームワークOT-DETECTORを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:14:42 GMT)
An engineering guide to superconducting quantum circuit shielding [30.4] 超伝導量子回路の電磁界と赤外放射からの保護の要点について概説する。
大規模超伝導量子システムのためのマイクロ波フィルタと同様に、効率的でコンパクトな遮蔽システムの構築を推奨する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:26:53 GMT)
Bi-level Mean Field: Dynamic Grouping for Large-Scale MARL [30.2] MARL(Multi-Agent Reinforcement Learning)における動的グループ化によるエージェントの多様性を捉えるためのバイレベル平均場(BMF)手法を提案する。
BMFは動的グループ割り当てモジュールを導入し、エージェントの表現を学習するために変分オートエンコーダ(VAE)を使用している。
また, グループ間相互作用とグループ内相互作用の両方をモデル化し, 効果的な隣接アグリゲーションをモデル化するバイレベル相互作用モジュールを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:29:08 GMT)
SCOPE: Compress Mathematical Reasoning Steps for Efficient Automated Process Annotation [30.1] 本稿では、アノテーションのコストを大幅に削減する新しい圧縮ベースのアプローチであるSCOPE(Step Compression for Process Estimation)を紹介する。
我々は,従来の計算資源の5%しか必要とせず,196Kのサンプルを含む大規模データセットを構築した。
実験の結果、私たちのデータセットでトレーニングされたPRMは、Best-of-N戦略とProcessBenchの両方で既存の自動アノテーションアプローチより一貫して優れています。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:31:15 GMT)
UniVG-R1: Reasoning Guided Universal Visual Grounding with Reinforcement Learning [30.1] ユニバーサルビジュアルグラウンドティングのための推論ガイド付きマルチモーダル言語モデル(MLLM)であるUniVG-R1を提案する。
まず,より詳細な推論連鎖を付加した高品質な起点データセットを構築した。
次に、ルールに基づく強化学習を行い、モデルに正しい推論連鎖を特定することを奨励し、それによって推論能力を高める。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:40:43 GMT)
Uni-Retrieval: A Multi-Style Retrieval Framework for STEM's Education [30.1] AIに精通した授業では、さまざまなクエリスタイルを活用して、抽象的なテキスト記述を解釈することが、高品質な教育の確保に不可欠である。
本稿では,複数のクエリスタイルと表現に基づく検索を支援する,教育シナリオに適した多様な表現検索タスクを提案する。
本稿では,異なるスタイルの24,000以上のクエリペアを含むSTEM Education Retrievalデータセットと,プロンプトチューニングに基づく効率的かつ多様な検索ビジョン言語モデルであるUni-Retrievalを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:37:05 GMT)
Adaptively profiling models with task elicitation [29.7] Task Elicitationは、フロンティアモデルが体系的な失敗を示す数百の自然言語タスクを見つける。
我々は、Sonnet 3.5が量子コンピューティングとAGIを過度に関連付けており、o3-miniは、製造がコンテキスト内で繰り返されるときに幻覚を起こす傾向があることを発見した。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:15:44 GMT)
Optimal Neural Compressors for the Rate-Distortion-Perception Tradeoff [29.7] ニューラル圧縮における最近の取り組みは、認識制約がソースと再構築が統計的に異なることを確実にする速度-歪み-知覚のトレードオフに焦点を当てている。
古典的な速度歪み理論は、最適圧縮機は効率よく空間を充填すべきであることを示しているが、さらに、エンコーダとデコーダの間で共有される無限ランダム性は最適性のために必要であることを示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:35:41 GMT)
Let's Verify Math Questions Step by Step [29.7] MathQ-Verifyは、未定または未定の数学問題を厳格にフィルタリングするために設計された、新しいパイプラインである。
MathQ-Verifyはまず、冗長な命令を削除するためのフォーマットレベルのバリデーションを実行する。
その後、各質問を形式化し、それを原子状態に分解し、数学的定義に対して検証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:07:29 GMT)
Rapid Word Learning Through Meta In-Context Learning [29.3] In-context learNing Of Words(Minnow)のためのメタトレーニング手法を提案する。
この方法は、いくつかの文脈内例から単語の使用例を生成するために言語モデルを訓練する。
Minnowでスクラッチからトレーニングするモデルは、人間のスケールの子供指向言語で、強力な数発の単語学習を可能にしている。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:22:04 GMT)
Cross-Document Cross-Lingual NLI via RST-Enhanced Graph Fusion and Interpretability Prediction [29.3] 自然言語推論(NLI)は自然言語処理の基本課題である。
従来のNLI機能を多文書・多言語シナリオに拡張したCDCL-NLIを提案する。
我々の研究は、NLIの研究に光を当て、クロスドキュメントの言語間コンテキスト理解に研究の関心をもたらす。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:52:01 GMT)
Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study [29.2] VLM(Vision-Language Models)は、実用的展開において強力だが計算集約的な手法である。
現在のアクセラレーション評価は主に、重要な問題を見越して、パフォーマンスの最小限のパフォーマンス劣化を目標としています。
これは、AIベースの疾患診断のように、特定の既知の状況に対して常に正しい回答が最重要である、安定性中心の産業アプリケーションにとって不可欠である。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:31:45 GMT)
A General Reduction for High-Probability Analysis with General Light-Tailed Distributions [29.2] 我々は,そのようなアルゴリズムの解析をブラックボックス方式で,同じアルゴリズムのより単純な変種の解析に還元可能であることを示す。
このアプローチは指数関数、準ガウス分布、より一般的な高速分解分布を含む任意の光尾ランダム化にも同時に適用される。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:00:22 GMT)
Beyond Chains: Bridging Large Language Models and Knowledge Bases in Complex Question Answering [28.9] Knowledge Base Question Answering (KBQA)は、KBから構造化された知識を用いて自然言語の質問に答えることを目的としている。
PDRR:Predict, Decompose, Retrieve, Reasonからなる4段階のフレームワークを提案する。
提案手法はまず質問タイプを予測し,その質問を構造化三重項に分解する。その後,KBから関連情報を検索し,LSMをエージェントとして案内し,三重項を推論し,完成させる。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:01:52 GMT)
Grouping First, Attending Smartly: Training-Free Acceleration for Diffusion Transformers [28.8] 拡散型トランスフォーマーは、優れた生成能力を示してきたが、計算コストが高いため、現実的な展開を妨げている。
出力品質を損なうことなく、高速な画像とビデオ生成のためのトレーニング不要な注意促進戦略であるGRATを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:59:59 GMT)
Is Your Prompt Safe? Investigating Prompt Injection Attacks Against Open-Source LLMs [28.8] 大規模言語モデル(LLM)は、プロンプトベースの攻撃に対して脆弱であり、有害なコンテンツや機密情報を生成する。
本稿では,5 つの攻撃ベンチマークにおいて,$mathbf14$ のオープンソース LLM に対する効果的なインジェクション攻撃について検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:50:43 GMT)
Velocitune: A Velocity-based Dynamic Domain Reweighting Method for Continual Pre-training [28.6] Velocituneは学習速度を動的に評価し、それに応じてデータ比率を調整する。
スケーリング法によってガイドされ、関連するコストを少なくして、各ドメインの望ましい学習目標を示す。
数学およびコード推論タスクとコマンドライン生成ベンチマークの両方のパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:09:35 GMT)
Sample and Computationally Efficient Continuous-Time Reinforcement Learning with General Function Approximation [28.6] 連続時間強化学習(CTRL)は、相互作用が時間とともに継続的に進化する環境において、シーケンシャルな意思決定のための原則的なフレームワークを提供する。
サンプルと計算効率の両方を実現するモデルベースアルゴリズムを提案する。
我々は,$N$の測定値を用いて,$tildeO(sqrtd_mathcalR + d_mathcalFN-1/2)$の準最適解を求めることができることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:37:51 GMT)
Reinforcement Learning from User Feedback [28.3] 本稿では,大規模言語モデルとユーザの好みを整合させるフレームワークであるReinforcement Learning from User Feedback (RLUF)を紹介する。
報奨モデル P[Love] をトレーニングし, LLM 応答がラブ反応を受ける可能性を予測する。
P[Love]は肯定的なフィードバックの増加を予測し,将来のユーザ行動の信頼性の高いオフライン評価手段として機能することを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:14:44 GMT)
TranSUN: A Preemptive Paradigm to Eradicate Retransformation Bias Intrinsically from Regression Models in Recommender Systems [28.2] そこで本研究では,モデルから内在的にバイアスを除去するプリエンプティブ・パラダイムを提案する。
理論的に保証された不偏性を提供するために, 共同バイアス学習法を用いて新しいTranSUN法を提案する。
さらに、GTS(Generalized TranSUN)と呼ばれる新しい汎用回帰モデルファミリーに一般化される。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:36:54 GMT)
When LLMs meet open-world graph learning: a new perspective for unlabeled data uncertainty [27.9] 大規模言語モデル (LLM) はテキスト分散グラフ (TAG) の学習に大きく進歩している。
Open World Graph Assistant (OGA) は適応的なラベルトレーサビリティを組み合わせたフレームワークで、意味論とトポロジを統合して未知のクラスを拒絶する。
総合的な実験はOGAの有効性と実用性を示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:37:18 GMT)
Bridge the Gap between Past and Future: Siamese Model Optimization for Context-Aware Document Ranking [27.8] セッションコンテキストを活用することは、ユーザの検索意図とドキュメントのランキングを推測する上で有益であることが証明されている。
これらの進歩にもかかわらず、ユーザ意図の進化を捉えるための歴史的なセッションデータの制限は依然として課題である。
本稿では,履歴条件付きモデルと将来意識型モデルからなるシアムモデル最適化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:36:25 GMT)
Quartet: Native FP4 Training Can Be Optimal for Large Language Models [27.8] 低精度算術でのトレーニングモデルは、計算スループットとエネルギー効率の両方を改善することで解決策を提供する。
NVIDIAの最近のBlackwellアーキテクチャは、非常に低精度な操作、特にFP4のバリエーションを促進し、実質的な効率向上を約束している。
提案手法は,FP4ベーストレーニングが標準精度とFP8トレーニングの代替となることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:55:50 GMT)
Adversarially Pretrained Transformers may be Universally Robust In-Context Learners [27.4] 対人訓練は最も効果的な対人防御の1つだが、高い計算コストがかかる。
本研究では,多種多様なタスクに対して逆さまに事前訓練されたトランスフォーマーが,堅牢な基礎モデルとして機能することを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:39:22 GMT)
Adversarial Training from Mean Field Perspective [27.4] 本稿では,データ分布の仮定を伴わずに,ランダムな深層ニューラルネットワークにおける敵の訓練に関する最初の理論的解析を行う。
我々は、$ell_q$ノルムベースの逆数損失と$ell_p$ノルムベースの逆数損失の(実際にきつく)上限を導出する。
ショートカットのないネットワークは一般的に逆トレーニングができず、逆トレーニングによってネットワークの容量が減少することを証明する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:22:21 GMT)
Forensic deepfake audio detection using segmental speech features [27.3] 本研究では,ディープフェイク音声の検出にセグメント音声の音響的特徴を用いることの可能性を検討する。
以上の結果から,法医学的音声比較においてよく用いられる部分的特徴がディープフェイクの同定に有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:42:46 GMT)
Diving into the Fusion of Monocular Priors for Generalized Stereo Matching [27.2] 近年,視覚基礎モデル (VFM) に先立って, 偏りのない単分子を応用して, 不測領域の一般化を向上することで, ステレオマッチングが進展している。
本稿では,深度マップを二項相対形式に変換する融合を導くための二項局所順序付けマップを提案する。
また、画素単位の線形回帰モジュールがそれらをグローバルかつ適応的に整列できるような登録問題として、単分子深度を不均質に最終的に直接融合させることを定式化する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:27:45 GMT)
3D Visual Illusion Depth Estimation [27.2] 3次元視覚錯覚は、2次元平面を操作して3次元空間関係をシミュレートする知覚現象である。
本稿では,機械の視覚系が,単眼と両眼の深度推定を含む3次元視覚錯覚にひどく騙されていることを明らかにする。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:13:48 GMT)
Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models [27.1] 数学的推論タスクにおける命令追従評価のためのベンチマークであるMathIFを紹介する。
我々の実証分析では、推論能力のスケールアップと制御可能性の維持の間に一貫した緊張関係が明らかになっている。
簡単な介入であっても、性能を推論するコストはかかるものの、部分的に服従を回復できることが示される。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:18:01 GMT)
Breaking Down Video LLM Benchmarks: Knowledge, Spatial Perception, or True Temporal Understanding? [27.1] ハイスコアがビデオのダイナミックコンテンツに対するより強力な理解を示すかどうかを曖昧にする2つの大きな制限を同定する。
質問をLLM-Answerable、Semantic、Temporalの3つのドメインに分類する自動パイプラインであるVBenchCompを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:07:55 GMT)
FastMap: Revisiting Dense and Scalable Structure from Motion [26.9] 我々は,高速さと簡易さに焦点をあてた動き法から,新たなグローバルな構造であるFastMapを提案する。
COLMAPやGLOMAPといった従来の手法は、一致したキーポイントペアの数が大きくなるとスケーラビリティが低下する。
我々は,FastMapが大規模シーンにおけるCOLMAPやGLOMAPよりも高速で,ポーズ精度が同等であることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:10:38 GMT)
Multi-Label Stereo Matching for Transparent Scene Depth Estimation [26.9] 透明なシーンにおける透明な物体と隠蔽された背景の深さを同時に推定するマルチラベルステレオマッチング法を提案する。
また、10のシーンと89のオブジェクトを含むデータセットを合成し、透過的なシーン深さ推定の性能を検証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:03:57 GMT)
Performative Prediction: Past and Future [26.7] 本稿では、機械学習におけるパフォーマンス性を研究するための概念的枠組みを提供する、最近設立されたパフォーマンス予測の領域について論じる。
性能予測の鍵となる要素は、新しい最適化課題を引き起こす自然均衡の概念である。
現れるのは、学習とステアリングの区別であり、実行的予測における2つのメカニズムである。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:38:03 GMT)
FineFilter: A Fine-grained Noise Filtering Mechanism for Retrieval-Augmented Large Language Models [26.6] FineFilterはRetrieval-Augmented Generationのための新しいきめ細かいノイズフィルタリング機構である。
3つのQAデータセットの実験では、FinFilterはLLaMA3とMistralのベースラインよりもQAパフォーマンスを著しく改善している。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:32:38 GMT)
ShortcutProbe: Probing Prediction Shortcuts for Learning Robust Models [26.5] ディープラーニングモデルは、必然的にターゲットと非本質的な特徴の間の急激な相関を学習する。
本稿では,グループラベルを必要とせず,新たなポストホックスプリアスバイアス緩和フレームワークを提案する。
我々のフレームワークであるShortcutProbeは、与えられたモデルの潜在空間における予測の非破壊性を反映した予測ショートカットを識別する。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:21:17 GMT)
Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation [26.4] 本稿では,ユーザの役割特定タスクと,ユーザの役割を明示的にモデル化することを目的とした行動論理モデリングタスクを紹介する。
本稿では,これらの課題を,大規模言語モデルとレコメンデーションシステムの効率的な統合フレームワークを通じて,明示的に解決可能であることを示す。
本稿では,現実的なタグベースの仮想論理グラフを抽出する(マルチモーダル)LLMの世界知識と論理推論能力を利用するTagCFを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:58:19 GMT)
MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents [26.4] この研究は、ページレベルとレイアウトレベルの検索という2つの異なるタスクを含むMMDocIRという新しいベンチマークを導入する。
MMDocIRベンチマークは、専門家によって注釈付けされた1,685の質問と、ブートストラップ付きラベル付き173,843の質問を含む、豊富なデータセットで構成されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:49:55 GMT)
Inter(sectional) Alia(s): Ambiguity in Voice Agent Identity via Intersectional Japanese Self-Referents [26.2] 社会的に表現力のある媒体としての他の「中立的」非プロノミナルな自己参照者や声の役割は未解明のままである。
また,性差別を回避するための交叉自己選好者の可能性とともに,音声性差別の強い証拠を見出した。
この研究は、エージェントのアイデンティティ認識に対するニュアンスな取組みを提供し、音声エージェントに対する交叉的かつ文化的に敏感な研究のチャンピオンである。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:45:09 GMT)
DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models [26.1] diagnosisArenaは、専門レベルの診断能力の厳格な評価のために設計されたベンチマークである。
診断アリーナは1,113組のセグメンテーション患者と、28の専門専門医からなる。
我々の研究では、最も先進的な推論モデルであるo3-mini、o1、DeepSeek-R1でさえ、それぞれ45.82%、31.09%、17.79%の精度しか達成していないことが明らかになった。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:14:53 GMT)
EmoSign: A Multimodal Dataset for Understanding Emotions in American Sign Language [26.0] EmoSignは、200のAmerican Sign Language (ASL)ビデオに対する感情と感情のラベルを含む最初の手話ビデオデータセットである。
また、感情の手がかりのオープンな記述も収集する。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:14:38 GMT)
Egocentric Action-aware Inertial Localization in Point Clouds [25.9] 本稿では,Egocentric Action-Aware Inertial Localization (EAIL) という新しい慣性ローカライゼーションフレームワークを提案する。
EAILは階層的なマルチモーダルアライメントを通じて相関を学習し、ターゲット個人を3Dポイントクラウド内にローカライズする。
実験は、最先端の慣性局所化と慣性行動認識ベースラインに対する提案手法の有効性を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:29:33 GMT)
Toward Real-World Cooperative and Competitive Soccer with Quadrupedal Robot Teams [25.9] 完全自律型・分散型四足ロボットサッカーを可能にする階層型マルチエージェント強化学習(MARL)フレームワークを提案する。
第一に、歩行、ドリブル、蹴りなどの足の動きやボール操作のために、非常にダイナミックな低レベルスキルのセットを訓練する。
これらに加えて、高レベルの戦略計画方針は、Fictitious Self-Playを介してマルチエージェント・プロキシ・ポリシー最適化(MAPPO)を用いて訓練される。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:20:54 GMT)
A Survey of Mathematical Reasoning in the Era of Multimodal Large Language Model: Benchmark, Method & Challenges [25.8] 本調査は,マルチモーダル大言語モデル(MLLM)の時代における数学的推論の包括的解析である。
2021年以降に出版された200以上の研究を概観し,Math-LLMの最先端の展開について検討する。
特に、マルチモーダルな数学的推論パイプラインと(M)LLMと関連する方法論について検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:45:21 GMT)
Activation-Guided Consensus Merging for Large Language Models [25.7] textbfActivation-Guided textbfConsensus textbfMerging(textbfACM)は,層固有のマージ係数を決定するプラグインとプレイのマージフレームワークである。
L2S(Long-to-Short)と一般的なマージタスクの実験は、ACMが全てのベースラインメソッドを一貫して上回ることを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:04:01 GMT)
Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model [25.7] 汎用的な小ショットの3Dポイントクラウドセグメンテーション(GFS-PCS)は、ベースクラスセグメンテーションを維持しながら、サポートサンプルがほとんどない新しいクラスにモデルを適応させる。
GFS-PCS フレームワークを導入し,高密度だがノイズの多い擬似ラベルを高精度かつスパースなサンプルで合成し,両者の強度を最大化する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:45:03 GMT)
Unsupervised Graph Clustering with Deep Structural Entropy [25.4] DeSEは、Deep Structure Entropyを取り入れた、新しい教師なしグラフクラスタリングフレームワークである。
クラスタを形成するために、量子化された構造情報とディープニューラルネットワークを備えたオリジナルのグラフを強化する。
クラスタリング代入法は,拡張グラフ上のクラスタへのノード埋め込みとソフトな代入行列を学習する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:38:06 GMT)
Beyond Words: Multimodal LLM Knows When to Speak [25.4] 我々は、視覚、音声、テキスト間の微妙なマルチモーダル信号に依存する、短時間で反応する発話に重点を置いて、応答型のリアルタイム予測に重点を置いている。
実世界の会話ビデオから構築された新しいマルチモーダルデータセットを導入し、時間的に整列された視覚、聴覚、テキストストリームを含む。
MM-When2Speakは,視覚的,聴覚的,テキスト的コンテキストを適応的に統合し,応答がいつ発生すべきか,どの応答が適切かを予測するマルチモーダルLCMベースのモデルである。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:42:34 GMT)
Social Sycophancy: A Broader Understanding of LLM Sycophancy [25.4] LLMの安全性と実用性に対する重大なリスクは、ユーザーの過剰な合意と平らさである。
本稿では, LLM における社会的梅毒の理論を導入し, ユーザーの顔の過剰な保存を特徴付ける。
ELEPHANTは,5つの顔保存行動のソーシャル・サイコフィナンシーを評価するためのフレームワークである。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:45:17 GMT)
FAID: Fine-grained AI-generated Text Detection using Multi-task Auxiliary and Multi-level Contrastive Learning [25.2] テキストを3つのカテゴリに分類する,きめ細かい検出フレームワーク FAID を導入する。
AIファミリを別のスタイリスティックなエンティティとしてモデル化することで、FAIDはより優れた解釈性を提供する。
AI支援書き込みにおける透明性と説明責任を改善するための潜在的なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:23:31 GMT)
Articulatory Feature Prediction from Surface EMG during Speech Production [25.1] 音声合成における表面筋電図(EMG)信号から調音特徴を予測するモデルを提案する。
提案モデルでは,畳み込み層とトランスフォーマーブロックを統合し,続いて音声特徴の予測器を分離する。
予測された調音特徴を可知音声波形にデコードできることを実証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:50:05 GMT)
Cross-model Transferability among Large Language Models on the Platonic Representations of Concepts [25.0] この研究は、異なる大言語モデル(LLM)における概念表現間の複雑な関係を探求する。
我々はこれらの表現をブリッジする線形変換法を導入し、プラトンの洞窟のアレゴリーに平行な興味をそそる。
より小さなLSMから抽出されたSVは、より大きなLSMの挙動を効果的に制御できる。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:24:30 GMT)
Training-Free Watermarking for Autoregressive Image Generation [24.9] IndexMarkは自動回帰画像生成モデルのためのトレーニング不要な透かしフレームワークである。
IndexMarkは画像の品質と精度の点で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:58:02 GMT)
Can LLMs be Good Graph Judge for Knowledge Graph Construction? [24.8] 上記の課題に対処するためのKG構築フレームワークである textbfGraphJudge を提案する。
本フレームワークでは,文書中のノイズ情報を除去するためのエンティティ中心の戦略を設計する。
そして、LLMをグラフ判定器として微調整し、生成したKGの品質を最終的に向上させた。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:24:22 GMT)
In-Context Learning Boosts Speech Recognition via Human-like Adaptation to Speakers and Language Varieties [24.7] 本稿では,Phi-4 Multimodal におけるコンテキスト内学習(ICL)を実現するスケーラブルなフレームワークを提案する。
単語の誤り率を相対的に19.7%減少させるのは、12の例に過ぎない。
全体として、我々の新しいICL適応方式は、人間の聴取者と同様の性能を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:20:37 GMT)
ChromFound: Towards A Universal Foundation Model for Single-Cell Chromatin Accessibility Data [24.7] シークエンシング(scATAC-eq)を用いたトランスポラーゼ-クロマチンの単細胞測定法
ChromFound は scATAC-eq 用に設計された基礎モデルである。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:40:30 GMT)
Selective Structured State Space for Multispectral-fused Small Target Detection [24.6] 高解像度リモートセンシング画像におけるターゲット検出は、小さなターゲットの認識精度が低く、計算コストが高いため、課題に直面している。
これらの計算制約に対処するために、効率性のためにMambaの線形複雑性を利用する。
我々は,拡張小型目標検出(ESTD)モジュールと畳み込み注意残差ゲート(CARG)モジュールを開発することで,マンバを強化した。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:39:27 GMT)
Improve Language Model and Brain Alignment via Associative Memory [24.6] 連想記憶は、人間の認知システムにおける理解のための関連情報の統合に関与する。
本研究では,連想記憶を統合して音声情報を処理しながら,言語モデルと人間の脳との整合性を改善することを目的とする。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:39:09 GMT)
Attention Mechanism for LLM-based Agents Dynamic Diffusion under Information Asymmetry [24.5] まず,マルチエージェント情報拡散を探索するための一般的なフレームワークを提案する。
そこで我々は,エージェントが異なる情報に注意を割り当てるのを支援する動的注意機構を設計した。
情報ギャップの進化,拡散パターン,社会資本の蓄積を観察し,非対称なオープン環境における情報拡散の特徴を考察する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:34:54 GMT)
FedEx: Expediting Federated Learning over Heterogeneous Mobile Devices by Overlapping and Participant Selection [24.4] 我々は、モバイルデバイス上でのFLトレーニングをアンダーライン化するための、新しいアンダーライン学習手法であるFedExを提案する。
我々は、FedExが、メモリコストに制限のある不均一なモバイルデバイス上でのFLトレーニングのレイテンシを大幅に削減することを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:36:39 GMT)
Neural Incompatibility: The Unbridgeable Gap of Cross-Scale Parametric Knowledge Transfer in Large Language Models [24.0] 大規模言語モデルは、幅広い知識をエンコードするアクセス可能なパラメータを持つ透明な脳を提供する。
主要な研究課題は、象徴的な言語に根ざした伝統的な知識伝達パラダイムを超越することである。
パラメータを通して異なるスケールのLSM間で知識を伝達する効果的な方法を模索することは、興味深く価値のある研究の方向性を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:42:03 GMT)
VisualQuality-R1: Reasoning-Induced Image Quality Assessment via Reinforcement Learning to Rank [23.6] 推論による非参照IQA(NR-IQA)モデルであるVisualQuality-R1を紹介する。
我々は、視覚的品質の本質的に相対的な性質に合わせた学習アルゴリズムである、ランク付けのための強化学習でこれを訓練する。
実験では、VisualQuality-R1は差別的なディープラーニングベースのNR-IQAモデルより一貫して優れている。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:56:50 GMT)
Who Taught You That? Tracing Teachers in Model Distillation [23.6] 学生の先生はアウトプットに基づいて特定できますか?
本稿では, 要約, 質問応答, 指示追従を含む実作業蒸留の目標について検討する。
語彙的特徴を用いた識別モデルの設計を行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:38:24 GMT)
Can Large Language Models Really Recognize Your Name? [23.4] 現代大規模言語モデル(LLM)は、曖昧な文脈のため、短いテキストスニペットでも定期的に人名を見落としている。
AMBENCHは、明らかに不明瞭な人物名のベンチマークデータセットである。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:05:05 GMT)
SG-Reg: Generalizable and Efficient Scene Graph Registration [23.4] セマンティックノードの複数モードを符号化するシーングラフネットワークを設計する。
バックエンドでは、対応に応じて変換を決定するために頑健なポーズ推定器を用いる。
提案手法は,クエリフレーム毎に52KBの通信帯域しか必要とせず,わずかに高い登録リコールを実現する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:16:55 GMT)
ConspEmoLLM-v2: A robust and stable model to detect sentiment-transformed conspiracy theories [23.3] 大型言語モデル(LLM)は、陰謀論を含む誤情報の自動生成などによって害を引き起こすことがある。
LLMは、例えば、典型的に強い負の感情をよりポジティブなトーンに変換することによって、特徴的なテキストの特徴を変化させることで、陰謀論を「軽視」することができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:12:30 GMT)
Regularized least squares learning with heavy-tailed noise is minimax optimal [23.2] 本稿では,高次モーメントの再生回数が有限である雑音の存在下で,カーネルヒルベルト空間におけるリッジ回帰の性能について検討する。
我々は、よく知られた積分作用素の枠組みに基づいて、部分ガウス項と余剰項からなるリスク境界を確立する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:17:54 GMT)
How Contaminated Is Your Benchmark? Quantifying Dataset Leakage in Large Language Models with Kernel Divergence [23.0] Kernel Divergence Score (KDS) は、サンプル埋め込みのカーネル類似性行列間のばらつきを計算することによって、データセット汚染を評価する新しい手法である。
KDSは汚染レベルとほぼ完璧な相関を示し、既存のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:47:57 GMT)
OmniStyle: Filtering High Quality Style Transfer Data at Scale [22.9] OmniStyle-1Mは,100万以上のコンテンツスタイルスティル化画像三重項からなる大規模ペア型転送データセットである。
我々は,OmniStyle-1Mが教師付きトレーニングを通じて,効率よくスケーラブルなスタイル転送モデルを実現するだけでなく,ターゲットのスタイリゼーションを正確に制御できることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:29:21 GMT)
Robust and Efficient AI-Based Attack Recovery in Autonomous Drones [22.9] 本稿では,攻撃が検出された後に回復行動を計画する共通感覚推論を付加する自律的な攻撃回復アーキテクチャを提案する。
ドローンを使ってアーキテクチャのユースケースを概説し、このアーキテクチャをエッジデバイスで効率的に安全に実装する方法について議論する。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:57:38 GMT)
Generalizable Multispectral Land Cover Classification via Frequency-Aware Mixture of Low-Rank Token Experts [22.8] マルチスペクトル土地被覆分類(MLCC)の新しいアプローチであるLand-MoEを紹介する。
Land-MoEは、低ランクトークンエキスパート(MoLTE)と周波数認識フィルタ(FAF)の2つの重要なモジュールから構成される。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:52:28 GMT)
Efficient Agent Training for Computer Use [22.7] PC Agent-Eは、大規模な人間のデモンストレーションへの依存を著しく低減する効率的なエージェントトレーニングフレームワークである。
その結果,PC Agent-Eモデルでは141%の相対的改善が得られた。
この結果から,少数の高品質なトラジェクトリデータから,強力なコンピュータ利用能力を刺激できることが示唆された。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:20:18 GMT)
UHD Image Dehazing via anDehazeFormer with Atmospheric-aware KV Cache [22.7] 超高精細画像デハージング(UHD)のための効率的なビジュアルトランスフォーマーフレームワークを提案する。
提案アーキテクチャでは、トレーニング収束速度を textbf5 $times$ で改善し、メモリオーバーヘッドを低減している。
提案手法は,4K/8K画像復元タスクの計算効率を大幅に向上させながら,最先端の脱ハージング品質を維持している。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:04:34 GMT)
Efficiently Building a Domain-Specific Large Language Model from Scratch: A Case Study of a Classical Chinese Large Language Model [22.6] 本稿では,古典中国語の理解と生成に特化して設計された,大規模言語モデルであるAI Taiyanを開発する。
実験によると、合理的なモデル設計、データ処理、基礎的なトレーニング、微調整により、わずか18億のパラメータで満足な結果が得られる。
本研究は、専門分野固有の大規模言語モデルの効率的な構築の参考となる。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:31:46 GMT)
A Channel-Triggered Backdoor Attack on Wireless Semantic Image Reconstruction [22.5] SemComシンボルの再構築を目的としたバックドア攻撃に関する研究は、主に入力レベルのトリガに焦点を当てている。
本稿では,アクティベーショントリガとして固有の無線チャネル特性を利用する,新しいチャネルトリガーバックドアアタック(CT-BA)フレームワークを提案する。
我々の攻撃は、効果的なステルスを維持しながら、ほぼ完璧な攻撃成功率(ASR)を達成する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:41:52 GMT)
LLM-based Evaluation Policy Extraction for Ecological Modeling [22.4] 多くの重要なアプリケーションにおけるモデル性能のベンチマークには,エコロジー時系列の評価が不可欠である。
伝統的な数値メトリクスは、生態学的プロセスに不可欠なドメイン固有の時間的パターンを捉えるのに失敗する。
本稿では,大規模言語モデル(LLM)に基づく自然言語ポリシー抽出とメトリック学習を統合した新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:02:29 GMT)
VisDiff: SDF-Guided Polygon Generation for Visibility Reconstruction and Recognition [22.4] 最近の研究は主に、明確に定義された特徴、近傍、または基礎となる距離のメトリクスを持つ構造を理解することに焦点を当てている。
現在の表現学習アプローチでは、適切に定義された特徴と距離のメトリクスなしで構造をキャプチャできない。
入力可視グラフからポリゴン$P$を生成する新しい拡散に基づくアプローチであるVisDiffを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:30:56 GMT)
Unlearning Algorithmic Biases over Graphs [22.4] グラフアンラーニングを新たに検討し、バイアス軽減ツールとして活用しています。
我々は、モデル重みに関するシングルステップのニュートン更新を通じて、証明可能なバイアス軽減を提供する、トレーニング不要な未学習手順を開発する。
そこで我々は,厳密なバイアス分析によって得られるノードやエッジに対する基本的選択機構を備えた構造的アンラーニング手法を設計する。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:12:53 GMT)
More-than-Human Storytelling: Designing Longitudinal Narrative Engagements with Generative AI [22.3] 参加者は毎日,AIナレーターの"Makoto"とストーリーを共同制作する,ドリームクラフトアプリ"Dreamsmithy"を使って,多世代体験を探索した。
リフレクティブ・セマティック・アナリシス(Reflexivethematic analysis)は、"oscillating ambivalence"や"socio-chronological bonding"といったテーマを明らかにした。
結果は、GenAIの長手なストーリーテリングの可能性だけでなく、ユーザエージェンシーや倫理に関する批判的な疑問も浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:10:29 GMT)
Online Scheduling for LLM Inference with KV Cache Constraints [22.1] 大規模言語モデル(LLM)推論は、レイテンシとリソース利用を最適化するための効率的なスケジューリングを必要とする集約的なプロセスである。
KVキャッシュのメモリを効果的に管理しながら、推論遅延を最小限に抑える、新しい理論的なスケジューリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:29:52 GMT)
Nonparametric Teaching for Graph Property Learners [22.0] 本稿では,新しい非パラメトリック教育の観点から学習過程を再解釈するグラフニューラル・インストラクション(GraNT)を提案する。
GraNTは、例の選択を通じて暗黙的に定義された(非パラメトリック)マッピングを教える理論的枠組みを提供する。
グラフ特性学習者が構造認識非パラメトリック学習者と整合性を示すのはこれが初めてである。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:23:30 GMT)
DiffDesign: Controllable Diffusion with Meta Prior for Efficient Interior Design Generation [21.9] DiffDesignは、メタプリミティブを持つ制御可能な拡散モデルであり、効率的な内部設計生成を実現する。
具体的には,画像データセット上で事前学習した2次元拡散モデルの生成先行をレンダリングバックボーンとして利用する。
さらに、外観、ポーズ、サイズといったデザイン属性を横断的に制御し、視点整合性を強制する最適な転送ベースのアライメントモジュールを導入することで、デノナイジングプロセスをガイドする。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:47:10 GMT)
Teaching Metric Distance to Autoregressive Multimodal Foundational Models [21.9] DIST2Lossは自動回帰離散モデルの学習を目的とした遠隔認識フレームワークである。
DIST2Lossは、固有距離測定値から派生した指数関数的な家族分布を離散的なカテゴリー最適化ターゲットに変換する。
経験的評価は多様なマルチモーダルアプリケーションにおいて一貫した性能向上を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:22:51 GMT)
R2MED: A Benchmark for Reasoning-Driven Medical Retrieval [21.7] 推論駆動型医療検索のために設計された最初のベンチマークであるR2MEDを紹介する。
Q&A参照検索、臨床証拠検索、臨床症例検索の3つのタスクにまたがる876のクエリで構成されている。
我々はR2MED上で広く使われている15の検索システムを評価し,最良モデルでさえ31.4 nDCG@10しか達成できないことを確認した。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:15:30 GMT)
Sensing and Steering Stereotypes: Extracting and Applying Gender Representation Vectors in LLMs [21.7] 大規模言語モデル(LLM)において「ジェンダー」の概念がどのように表現されるかを検討する。
ラベル付きデータなしで確率重み付けにより概念表現を抽出する新しい手法を提案する。
また,モデル予測の高精度なステアリングを可能にするプロジェクションベース手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:36:55 GMT)
Safety2Drive: Safety-Critical Scenario Benchmark for the Evaluation of Autonomous Driving [21.7] 自律運転(AD)システムの評価を目的とした安全クリティカルシナリオライブラリであるSafety2Driveを提案する。
Safety2Driveは、標準規則で要求されるテスト項目を包括的にカバーし、70のAD関数テスト項目を含む。
自然環境の腐敗や、カメラとLiDARセンサー間の敵攻撃など、安全上の脅威を注入する能力がある。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:27:06 GMT)
Taming Recommendation Bias with Causal Intervention on Evolving Personal Popularity [21.6] 人気度バイアスは、人気のあるアイテムがより頻繁に推奨されるときに発生する。
既存のデバイアス手法は、人気バイアスを全ユーザーに対して均一に緩和する。
本稿では,推薦バイアスに対処するためのCausalEPP(Causal Intervention on Evolving Personal Popularity)という新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:59:16 GMT)
PLAYER*: Enhancing LLM-based Multi-Agent Communication and Interaction in Murder Mystery Games [21.6] 我々はMurder Mystery Games(MMG)におけるマルチエージェント会話推論のための推論データセットWellPlayを紹介する。
WellPlayは12のゲームにまたがる1,482の推論質問で構成されている。
MMGにおけるLarge Language Model(LLM)ベースのエージェントのための新しいフレームワークPLAYER*を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:28:48 GMT)
Towards Comprehensive and Prerequisite-Free Explainer for Graph Neural Networks [21.5] OPEN は GtextbfNN 用の新しい ctextbfOmprehensive と textbfPrerequisite-free textbfExplainer である。
データセットのサンプル空間全体を複数の環境に推論し、分割する。
同様の効率を維持しつつ、最先端の手法よりも優れ、現実のシナリオにおける堅牢性を高める。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:01:47 GMT)
Learning Concept-Driven Logical Rules for Interpretable and Generalizable Medical Image Classification [21.5] 概念ルール学習者(CRL)は、二項化視覚概念から論理ルールを学ぶための新しいフレームワークである。
CRLは概念相関を捉え、臨床的に意味のある規則を抽出し、局所的およびグローバルな解釈可能性を提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:48:33 GMT)
Customized SAM 2 for Referring Remote Sensing Image Segmentation [21.4] 本稿では SAM 2 を RRSIS に適応させる新しいフレームワーク RS2-SAM 2 を提案する。
また,テキスト重み付き勾配差の計算により分割境界を最適化するために,テキスト誘導境界損失を導入する。
いくつかのRRSISベンチマークの実験結果は、RS2-SAM 2が最先端の性能を達成することを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:37:05 GMT)
ReEx-SQL: Reasoning with Execution-Aware Reinforcement Learning for Text-to-SQL [21.3] 実行フィードバックは、大規模言語モデルを正確に推論し、信頼性の高いクエリを生成するために不可欠である。
既存の方法は、修正や選択のためのポストホック信号としてのみ実行フィードバックを処理し、生成プロセスに統合することができない。
本稿では,ReEx-Reasoningを提案する。ReEx-Reasoningは,デコード中にモデルがデータベースと対話し,実行フィードバックに基づいて推論を動的に調整できるフレームワークである。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:40:58 GMT)
How Does Topology Bias Distort Message Passing? A Dirichlet Energy Perspective [21.3] グラフベースのレコメンデータシステムは,人気バイアスによって損なわれていることを示す。
このバイアスは人気のある項目を過剰に表現し、ユーザのフィードバックループを通じてバイアスと公平性の問題を強化します。
本稿では,メッセージパッシングを高次simplicialコンプレックスに拡張するテスト時単純伝搬を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:38:53 GMT)
Point2Primitive: CAD Reconstruction from Point Cloud by Direct Primitive Prediction [21.3] 入力点雲から編集可能なCADモデルを生成するCAD再構成ネットワーク(Point2Primitive)を提案する。
Point2Primitiveは、改良された変換器に基づいて、ポイントクラウドからスケッチ曲線(型とパラメータ)を直接検出し、予測することができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:23:48 GMT)
Hidden Ghost Hand: Unveiling Backdoor Vulnerabilities in MLLM-Powered Mobile GUI Agents [21.2] MLLMベースのGUIエージェントは、自然に複数の対話レベルのトリガーを公開します。
我々はAgentGhostを紹介した。AgentGhostは、バックドア攻撃をリピートするための効果的でステルス的なフレームワークである。
AgentGhostは有効で汎用的であり、攻撃精度は3つの攻撃目標に対して99.7%に達する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:29:18 GMT)
OmniGenBench: A Modular Platform for Reproducible Genomic Foundation Models Benchmarking [21.2] ゲノム基盤モデル (GFMs) は、ゲノムをデコードするトランスフォーメーションアプローチとして登場した。
GFMがAI駆動ゲノム学の展望を拡大し、再形成するにつれ、この分野は厳密で再現可能な評価の緊急の必要性に直面している。
我々は、GFM間のデータ、モデル、ベンチマーク、解釈可能性レイヤを統合するために設計されたモジュラーベンチマークプラットフォームであるOmniGenBenchを紹介します。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:16:25 GMT)
When Do LLMs Help With Node Classification? A Comprehensive Analysis [21.1] 我々はLarge Language Models (LLMs) を用いたノード分類のための包括的でテストベッドを開発する。
10のホモ親和性データセット、4つのヘテロ親和性データセット、8つのLLMアルゴリズム、8つの古典的ベースライン、3つの学習パラダイムを含む。
その結果,(1) LLMに基づく手法は, 半教師付き環境では従来手法よりも優れているが, 教師付き環境では優位性が低い, という8つの知見が得られた。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:56:13 GMT)
Programmatic Video Prediction Using Large Language Models [21.1] ProgGenは、ニューロシンボリックで人間の解釈可能な状態のセットを使用して、ビデオのダイナミックスを表現する。
提案手法は,2つの挑戦環境における映像フレーム予測の課題において,競合する手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:17:47 GMT)
Utilizing Strategic Pre-training to Reduce Overfitting: Baguan -- A Pre-trained Weather Forecasting Model [21.0] 本研究では,サイムズオートエンコーダを事前学習した中距離気象予報モデルであるBaguanを紹介する。
実験の結果、バグア語は従来の手法よりも優れており、より正確な予測を提供することが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:29:23 GMT)
Core Placement Optimization of Many-core Brain-Inspired Near-Storage Systems for Spiking Neural Network Training [20.9] オフポリティクス決定論的アクター批判に基づくSNNトレーニング多コアデプロイメント最適化手法を提案する。
我々は,マルチコアニアメモリコンピューティングアーキテクチャにおけるSNNモデルの配置最適化を実現するために,ニアエンドポリシー最適化を通じてポリシネットワークのパラメータを更新する。
本手法は,コア間の不均一な計算やストレージ負荷,ローカル通信ホットスポットの形成といった問題を克服する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:53:52 GMT)
Concept Incongruence: An Exploration of Time and Death in Role Playing [20.8] 我々は、概念的矛盾の下でモデル行動を定義し、分析する第一歩を踏み出します。
非ロールプレイ設定と比較して、モデルが死亡後に停止せず、精度低下に悩まされることが示される。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:59:59 GMT)
MediConfusion: Can you trust your AI radiologist? Probing the reliability of multimodal medical foundation models [20.8] 医用ビジュアル質問回答(VQA)ベンチマークデータセットであるMedConfusionを紹介した。
現状のモデルは、画像のペアによって容易に混同され、それ以外は視覚的に異なっており、医療専門家にとってはっきりと区別されている。
また、医療における信頼性が高く信頼性の高いMLLMの新しい世代の設計に役立つモデル失敗の共通パターンを抽出する。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:20:36 GMT)
Exploring Neural Granger Causality with xLSTMs: Unveiling Temporal Dependencies in Complex Data [20.8] 時系列における因果関係は、特に非線形依存の存在下では決定が難しい。
本稿では,変数間の長距離関係を捉えるために,Granger causal xLSTM(GC-xLSTM)を提案する。
提案したGC-xLSTMモデルの総合的有効性を示す6つの多様なデータセットに関する実験的検討を行った。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:07:40 GMT)
Dolphin: Document Image Parsing via Heterogeneous Anchor Prompting [20.6] 文書画像解析は、テキストの段落、図形、公式、表などの複雑な要素が絡み合っているため、困難である。
textitDolphinは、解析-テーマ-パースパラダイムに従って、新しいマルチモーダル文書画像解析モデルである。
Dolphinは、さまざまなページレベルと要素レベルの設定で最先端のパフォーマンスを実現し、優れた効率を保証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:03:59 GMT)
Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment [20.4] Low-Rank Adaptation (LoRA)は、Large Language Models (LLM) のためのパラメータ効率の良い微調整を可能にする
現在の手法は静的特異値分解サブセットを初期化することでLoRAを最適化し、事前学習された知識を最適に活用する。
我々はLunderlineoRunderlineA Mixture-of-Experunderlinet (GOAT)を提案する。
GOATはSVD構造化MoEを用いて関連する事前情報を統合し、理論スケーリング係数を導出して最適化を完全微調整MoEと整合させる
論文参考訳(メタデータ) (Tue, 20 May 2025 10:05:37 GMT)
ACORD: An Expert-Annotated Retrieval Dataset for Legal Contract Drafting [20.4] ACORDは、責任の制限(Limitation of Liability)、償却(Indemnification)、統制の変更(Change of Control)、最も好まれる国家( Most Favored Nation)といった複雑な契約条項に焦点を当てている。
114のクエリと126,000のクエリクロースペアが含まれており、それぞれが1から5の星のスケールでランク付けされている。
タスクはクエリーに最も関連性の高い前例句を見つけることである。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:27:07 GMT)
DECASTE: Unveiling Caste Stereotypes in Large Language Models through Multi-Dimensional Bias Analysis [20.4] 大規模言語モデル (LLM) は自然言語処理 (NLP) に革命をもたらした。
LLMは、民族、性別、宗教に基づくものなど、有害な社会的偏見を反映し、永続することが示されている。
我々は,LLMにおける暗黙的および明示的なキャストバイアスを検知し,評価するための新しいフレームワークであるDECASTEを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:19:13 GMT)
Automatic Synthetic Data and Fine-grained Adaptive Feature Alignment for Composed Person Retrieval [20.2] 本稿では,大規模人物画像データベースから興味のある人物を特定するために,視覚的・テキスト的クエリを組み合わせた新しい人物検索タスクを提案する。
CPRタスクの最大の難しさは、利用可能な注釈付きデータセットがないことだ。
マルチモーダルフィルタリング法は、結果のSynCPRデータセットが1.15百万の高品質で完全な合成三重項を保持するように設計されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:29:22 GMT)
Counterspeech the ultimate shield! Multi-Conditioned Counterspeech Generation through Attributed Prefix Learning [20.2] 建設的逆音声を生成するための新しいフレームワークであるPreference Optimizationを用いた階層型プレフィックス学習であるHiPPrOを紹介する。
IntentCONANv2は、13,973のカウンター音声インスタンスに5つのアノテータによる感情ラベルをアノテートすることで拡張する。
HiPPrOは意図整合性を38%改善し、ルージュ-1, ルージュ-2, ルージュ-Lを3%, 2%, 3%, 3%改善した。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:27:51 GMT)
LEANCODE: Understanding Models Better for Code Simplification of Pre-trained Large Language Models [20.2] トレーニングと予測時間を短縮するために,コード簡略化のためのLeanCodeを提案する。
平均的文脈認識の注意点に基づくトークンの選択的除去を提唱する。
我々の評価は、SoTAのDietCodeとSlimcodeよりもLeanCodeの方が優れていることを示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:38:53 GMT)
Thompson Sampling-like Algorithms for Stochastic Rising Bandits [20.1] レイジング・レステッド・バンディット(Rising rested bandit、SRRB)は、腕が引っ張られるにつれて、期待される報酬が増加する舞台である。
この研究は、SRRBにおけるそのようなアルゴリズムに対する新たな後悔の分析を提供し、課題を強調し、独立した技術ツールを提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:08:08 GMT)
Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs [20.1] 大規模言語モデル (LLM) は連続的に分解され、複合タスクを層ごとに実行する。
i)異なるサブタスクは異なるネットワーク深さで学習され、ii)これらのサブタスクは層間で順次実行される。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:49:15 GMT)
DeepResonance: Enhancing Multimodal Music Understanding via Music-centric Multi-way Instruction Tuning [20.1] DeepResonanceは、マルチウェイアライメント音楽、テキスト、画像、ビデオデータ向けに微調整されたマルチモーダル音楽理解モデルである。
本モデルは6つの音楽理解課題にまたがる最先端の演奏を実現する。
モデルと新たに構築されたデータセットをオープンソース化する予定です。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:59:05 GMT)
EmoGist: Efficient In-Context Learning for Visual Emotion Understanding [20.0] EmoGist(エモギスト)は、LVLMを用いた視覚的感情分類を行うための、トレーニング不要でコンテキスト内学習手法である。
EmoGistは、マルチラベルのMemotionデータセットを用いて、最大13ポイントのマイクロF1スコアの改善を可能にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:47:04 GMT)
Thinking Out Loud: Do Reasoning Models Know When They're Right? [19.8] 大規模推論モデル(LRM)は、最近、複雑な推論タスクにおいて印象的な機能を示した。
本研究では,LRMが他のモデル行動とどのように相互作用するかを,言語的信頼度を解析することによって検討する。
推論モデルには、知識境界に対する認識の低下がある可能性がある。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:37:35 GMT)
xLSTM-SENet: xLSTM for Single-Channel Speech Enhancement [19.8] 本稿では,最初のxLSTMに基づく単一チャネル音声強調システムであるxLSTM-SENetを紹介する。
我々の最良のxLSTMベースモデルであるxLSTM-SENet2は、Voicebank+DEMANDデータセット上で同様の複雑さを持つ最先端のMambaおよびConformerベースのシステムより優れています。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:28:21 GMT)
Saten: Sparse Augmented Tensor Networks for Post-Training Compression of Large Language Models [19.7] 微調整中の低ランクテンソル化大言語モデル(LLM)について検討し,その性能向上を目的とした疎拡張テンソルネットワーク(Saten)を提案する。
実験により,ソルテンはテンソル化言語モデルにおける精度と圧縮効率を両立させ,最先端性能を実現することを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:01:54 GMT)
AudioJailbreak: Jailbreak Attacks against End-to-End Large Audio-Language Models [19.6] 近年,大規模音声言語モデル (LALM) に対するジェイルブレイク攻撃について検討されている。
本稿では,非同期性,普遍性,ステルス性,強靭性を備えた新しいオーディオジェイルブレイク攻撃であるAudioJailbreakを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:10:45 GMT)
Scaling laws in wearable human activity recognition [19.5] スケーリング法則は、モデルキャパシティと事前学習データボリュームをリンクすることで、より原則化された設計への移行を支援する可能性がある。
事前学習データとトランスフォーマーアーキテクチャの両方を網羅的に網羅的に探索することにより,HARのスケーリング法則を初めて確立する。
これらのスケーリング法則は,3つのHARベンチマークデータセットのダウンストリーム性能向上に寄与することを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:04:36 GMT)
Physics-Guided Learning of Meteorological Dynamics for Weather Downscaling and Forecasting [19.4] 天気予報は必須であるが、計算集約的で物理的に不完全なままである。
我々は物理方程式と潜在力化をデータ駆動モデルに統合する物理誘導ディープラーニングフレームワークであるPhyDL-NWPを提案する。
実験の結果,PhyDL-NWPは予測性能と物理的整合性の両方を改善した。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:13:20 GMT)
MMUnlearner: Reformulating Multimodal Machine Unlearning in the Era of Multimodal Large Language Models [19.4] MLLM(Multimodal Large Language Models)の時代におけるMultimodal Machine Unlearning(MU)の課題を再考する。
我々は,新しい幾何制約付き勾配上昇法MMUnlearnerを開発した。
MLLMの重みを、未学習時の残りの概念とテキスト知識に制約された重み値マップで更新する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:47:22 GMT)
EssayJudge: A Multi-Granular Benchmark for Assessing Automated Essay Scoring Capabilities of Multimodal Large Language Models [19.3] EssayJudgeは、手動のフィーチャエンジニアリングなしで、正確でコンテキストに富んだ評価を提供し、長年のAES制限に対処する。
18種類のMLLMを用いた実験では,特に談話レベルの特性において,人的評価と比較してAES性能の差が明らかとなった。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:54:54 GMT)
EntryPrune: Neural Network Feature Selection using First Impressions [19.2] EntryPruneは、動的スパース入力層を持つ高密度ニューラルネットワークを用いた、新しい教師付き特徴選択アルゴリズムである。
エントリベースのプルーニングは、ネットワークに入ると引き起こされる相対的な変化に基づいてニューロンを比較する新しいアプローチである。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:48:57 GMT)
CODI: Compressing Chain-of-Thought into Continuous Space via Self-Distillation [19.2] CoT(Chain-of-Thought)推論は、自然言語のステップバイステップ推論を促進することによって、Large Language Models(LLM)を強化する。
自然言語CoTを連続空間に効果的に圧縮する新しいトレーニングフレームワークであるCODIを紹介する。
CODI は GPT-2 スケールでの GSM8k 上での明示的な CoT のパフォーマンスに適合する最初の暗黙の CoT アプローチである。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:16:57 GMT)
CRCE: Coreference-Retention Concept Erasure in Text-to-Image Diffusion Models [19.2] 本稿では,新しい概念消去フレームワークCRCEを紹介する。
コアフェルデンシャルと保持概念を意味的に明示的にモデル化することにより、CRCEはより正確な概念除去を可能にする。
実験により、CRCEは様々な消去タスクにおいて既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:46:42 GMT)
One Shot Dominance: Knowledge Poisoning Attack on Retrieval-Augmented Generation Systems [19.2] Retrieval-Augmented Generation (RAG)により強化されたLarge Language Models (LLMs) は、正確な応答を生成する際の性能改善を示す。
外部知識ベースへの依存は、潜在的なセキュリティ脆弱性をもたらす。
本稿では,RAGシステムに対するより現実的な知識中毒攻撃を明らかにし,単一の文書のみを毒殺することで攻撃を成功させる。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:50:12 GMT)
Towards Non-Euclidean Foundation Models: Advancing AI Beyond Euclidean Frameworks [19.1] 本ワークショップは,非ユークリッド基礎モデルと幾何学的学習(NEGEL)の交わりに着目したワークショップである。
非ユークリッド空間は、本質的な幾何学的性質を持つデータに対してより効率的かつ効果的な表現を提供することが示されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:28:59 GMT)
Multimodal RAG-driven Anomaly Detection and Classification in Laser Powder Bed Fusion using Large Language Models [19.0] 本研究では, 各種添加物製造工程における異常検出を自動化するマルチモーダル検索型生成フレームワークを提案する。
このフレームワークは、科学文献とマルチモーダル生成モデルからテキストと画像の検索を統合し、ゼロショットの異常識別、分類、説明生成を行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:18:22 GMT)
Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [19.0] SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:44:34 GMT)
Re-Align: Aligning Vision Language Models via Retrieval-Augmented Direct Preference Optimization [18.9] 大規模視覚言語モデル(VLM)は、特に横断的不整合の形で、重要な幻覚を引き起こす傾向がある。
本稿では、画像検索を利用した新しいアライメントフレームワークRe-Alignを紹介する。
我々はまた、微調整中に視覚的嗜好を付加する、標準の直接選好最適化の拡張であるrDPOも導入する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:34:24 GMT)
Toward Reliable Biomedical Hypothesis Generation: Evaluating Truthfulness and Hallucination in Large Language Models [18.9] TruthHypoは,真理仮説を生成する上で,大規模言語モデルの能力を評価するためのベンチマークである。
KnowHDは知識に基づく幻覚検出装置で、既存の知識に基づいて仮説がどれだけうまく構築されているかを評価する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:49:40 GMT)
Retrospective Learning from Interactions [18.6] ReSpectは、アノテーションを追加することなく、振り返りを通じて過去のインタラクションでそのような信号から学習する手法である。
外部アノテーションなしでReSpectがタスク完了率を31%から82%に改善したことを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:19:28 GMT)
STD-PLM: Understanding Both Spatial and Temporal Properties of Spatial-Temporal Data with PLM [18.6] STD-PLMは時空間予測と計算処理の両方を実装できる。
STD-PLMは、明示的に設計された空間的および時間的トークン化器を通して空間的時間的相関を理解する。
STD-PLMは予測タスクと計算タスクの競合性能と一般化能力を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:36:54 GMT)
Plant in Cupboard, Orange on Rably, Inat Aphone. Benchmarking Incremental Learning of Situation and Language Model using a Text-Simulated Situated Environment [18.3] 大きな言語モデル(LLM)はエージェントシステムのキーコンポーネントとして機能し、それらの常識的な知識は、位置や具現化されたアクションのための言語ベースのプランナーとしての性能に大きく影響する。
LLMのインクリメンタル学習(環境からのフィードバックに基づく)を評価し,テキストベースの環境を用いてコンテキスト内学習能力を制御する。
その結果、より大きな商用モデルはオープンウェイトに比べて性能がかなり低いが、ほとんどのモデルは合成語実験に苦慮していることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:43:48 GMT)
From Templates to Natural Language: Generalization Challenges in Instruction-Tuned LLMs for Spatial Reasoning [18.3] 本稿では,2.5ドルの格子上にオブジェクト配置を構築するための命令をモデルで解釈し,翻訳する空間接地作業における一般化課題について検討する。
合成命令のみを用いてLCMを微調整し、合成命令と人文命令の両方を含むベンチマークデータセット上でその性能を評価する。
その結果,単純なタスクではモデルがよく一般化されるが,より複雑なタスクでは性能が著しく低下することがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:33:29 GMT)
UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Large Language Models [18.2] 生涯学習は、内部知識を継続的に更新することによって、大きな言語モデルが進化する情報に適応することを可能にする。
モデル編集は、モデルの内部知識を更新するための集中的で効率的な方法を提供する、この目標のための有望なソリューションとして際立っている。
UltraEditはトレーニング用、主題用、メモリ不要で、超スケーラブルで現実世界の生涯モデル編集に適しています。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:59:04 GMT)
Learning Utilities from Demonstrations in Markov Decision Processes [18.2] 本稿では,実用機能を通じてエージェントのリスク態度を明確に表現する,マルコフ決定過程(MDP)の行動モデルを提案する。
そこで我々は,MDPにおける実演から実用機能を通じて符号化された,観察対象者のリスク態度を推定するタスクとして,ユーティリティ学習問題を定義した。
我々は, UL を有限データ型で証明可能な2つのアルゴリズムを考案し, サンプルの複雑さを解析する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:02:12 GMT)
Just One Layer Norm Guarantees Stable Extrapolation [18.1] 我々は、収束まで訓練された無限大のニューラルネットワークを解析するために、ニューラルカーネル・タンジェント(NTK)理論を適用することで、一般的な結果を証明した。
トレーニングデータから離れた入力においても、少なくとも1つのLNを持つ無限に広いネットワークの出力が有界であることを示す。
我々は、トレーニング中に見られたものよりも大きいタンパク質の残基サイズを予測し、トレーニングセットから欠落した少数民族の顔画像から年齢を推定するなど、現実世界の意義を探究する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:39:27 GMT)
Diversity-aware clustering: Computational Complexity and Approximation Algorithms [18.0] 本稿では,データポイントが複数の属性に関連付けられ,グループ間の交差が生じている,多様性を考慮したクラスタリング問題について検討する。
クラスタリングソリューションは、各グループから選択されたクラスタセンターの数が、各グループの下位および上位境界閾値で定義された範囲内にあることを保証する必要がある。
1+ frac2e + epsilon approx 1.736$+frac8e + epsilon approx 3.943$, and $5$ for diversity-aware $k$-median, diversity-aware $。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:47:39 GMT)
Differentially Private Synthetic Data via APIs 3: Using Simulators Instead of Foundation Model [17.9] 差分プライベート(DP)合成データは、プライバシーを損なうことなく、プライベートデータの価値を解放するための重要なツールとなっている。
プライベート・エボリューション(PE)はDP合成データを生成するための有望な方法として登場した。
PEフレームワークは基盤モデルを超えたAPIを可能にするのに十分な一般性を持っていることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:05:24 GMT)
Beyond Text: Unveiling Privacy Vulnerabilities in Multi-modal Retrieval-Augmented Generation [17.9] MRAGのプライバシーの脆弱性を視覚言語と音声言語にまたがって初めて体系的に分析する。
実験の結果,LMMは検索した内容に類似した出力を直接生成し,センシティブな情報を間接的に公開する記述を生成することができることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:37:22 GMT)
Open-Set Semi-Supervised Learning for Long-Tailed Medical Datasets [17.8] 現実世界の一般化には、現実世界で遭遇する様々な複雑さを考慮する必要がある。
半教師付きアプローチを用いて、高度に不均衡な医療データセットに対するオープンセット学習法を提案する。
分析の結果、分類におけるロングテールデータの影響に対処することで、ネットワーク全体の性能が大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:21:38 GMT)
CoLA: Compute-Efficient Pre-Training of LLMs via Low-Rank Activation [17.8] 我々は,計算効率の高いオートエンコーダを用いて,CoLAとそのメモリ効率の高い実装であるCoLA-Mを提案する。
6000万から70億のパラメータを持つLLaMAモデルに対する実験は、CoLAが計算コストを$bf 2pmbtimes$.bf 2pmbtimes$.comに削減したことを示している。
CoLA-Mはスループットを犠牲にすることなくメモリコストをさらに削減し、全体として優れたパラメータ、計算、メモリ効率を備えた事前学習アプローチを提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:27:05 GMT)
KERL: Knowledge-Enhanced Personalized Recipe Recommendation using Large Language Models [17.7] 大規模言語モデル(LLMs)の最近の進歩と食品データの豊富さは、食品の理解を改善するために研究されている。
我々は、食品KGとLLMを活用して、パーソナライズされた食品レコメンデーションを提供する統一システムであるKERLを紹介する。
我々は,提案するKG拡張LDMが既存手法よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:19:57 GMT)
Rank, Chunk and Expand: Lineage-Oriented Reasoning for Taxonomy Expansion [17.7] LORexは、効率的な分類学拡張のための識別的ランキングと生成的推論を組み合わせたプラグアンドプレイフレームワークである。
LORexの精度は12%向上し,Wu & Palmerの類似度は5%向上した。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:05:26 GMT)
Runtime Safety through Adaptive Shielding: From Hidden Parameter Inference to Provable Guarantees [17.7] ロボットの質量分布や摩擦などの隠されたパラメータの変化は、実行中に安全リスクを引き起こす。
我々は強化学習のための実行時遮蔽機構を開発する。
提案手法が確率論的安全保証を満たすことを証明し,最適方針を導出する。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:45:45 GMT)
ViC-Bench: Benchmarking Visual-Interleaved Chain-of-Thought Capability in MLLMs with Free-Style Intermediate State Representations [17.7] Visual-Interleaved Chain-of-Thought (VI-CoT)により、MLLMはステップワイド中間視覚状態(IVS)に基づいた理解と決定を継続的に更新できる。
本稿では,迷路ナビゲーション,ジグソーパズル,エンボディドロングホライゾン計画,複雑カウントという4つのタスクからなる,ViC-Benchと呼ばれる特殊なベンチマークを紹介する。
我々は18種類の高度MLLMの評価を広範囲に行い、そのVI-CoT能力に関する重要な知見を明らかにした。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:18:54 GMT)
Measurement of parity-dependent energy-phase relation of the low-energy states in a potential artificial Kitaev chain utilizing a transmon qubit [17.6] Ge/Siナノワイヤをベースとした4サイト量子ドット超伝導鎖の端を組み込んだ超伝導トランスモン量子ビットの実現可能性を示す。
我々は,Ge/Siコア殻ナノワイヤ上に作製した鎖の局所静電ゲーティングにより,ドット間カップリング,したがってアンドレーフ反射と電子の弾性共タンリングの強度を調整可能であることを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:12:12 GMT)
From Assistants to Adversaries: Exploring the Security Risks of Mobile LLM Agents [17.6] モバイル大言語モデル(LLM)の総合的セキュリティ解析について紹介する。
言語ベースの推論,GUIベースのインタラクション,システムレベルの実行という,3つのコア機能領域にわたるセキュリティ上の脅威を特定します。
分析の結果,11個の異なる攻撃面が明らかとなり,それぞれが移動型LDMエージェントのユニークな機能と相互作用パターンに根ざしていることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:02:05 GMT)
Federated Hybrid Model Pruning through Loss Landscape Exploration [17.6] フェデレートラーニング(FL)はこの変革の中心にある。
適応型ハイブリッドプルーニング手法によりFLを最適化する新しいフレームワークであるAutoFLIPを提案する。
計算オーバーヘッドの48.8%削減,通信コストの35.5%削減,グローバルな精度の向上など,AutoFLIPは定量的なメリットを提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:41:51 GMT)
Integration of TinyML and LargeML: A Survey of 6G and Beyond [17.5] 5Gネットワークから6Gへの移行は機械学習(ML)の大きな需要を浮き彫りにする
TinyMLとLargeMLの統合は、将来のシームレスな接続性と効率的なリソース管理のための有望なアプローチとして期待されている。
本稿は、TinyMLとLargeMLの次世代無線ネットワークにおける総合的な統合に向けた重要な課題を概説し、今後の研究の方向性を明らかにすることで締めくくっている。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:54:39 GMT)
TransMedSeg: A Transferable Semantic Framework for Semi-Supervised Medical Image Segmentation [17.4] 半教師付き医用画像セグメンテーションのためのトランスファー可能な新しいセマンティックフレームワークであるTransMedSegを提案する。
提案手法では,機能表現を暗黙的に拡張するTransferable Semantic Augmentation (TSA) モジュールを導入する。
医療画像データセットの実験では、TransMedSegが既存の半教師付き手法より優れていることが示されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:16:40 GMT)
ReservoirTTA: Prolonged Test-time Adaptation for Evolving and Recurring Domains [17.4] ReservoirTTAは、長期間のテスト時間適応のために設計された新しいプラグインフレームワークである。
中心となるReservoirTTAはドメイン特化モデルの貯水池を維持している。
理論的解析により,パラメータの分散を束縛し,モデル崩壊を防ぐ重要な要素が明らかになった。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:39:20 GMT)
This Time is Different: An Observability Perspective on Time Series Foundation Models [17.3] Totoは15100万のパラメータを持つ時系列予測基盤モデルである。
Totoの事前トレーニングコーパスは、可観測性データ、オープンデータセット、合成データを組み合わせたものだ。
我々は,2,807個の実時間時系列にわたる3億5000万の観測結果からなる大規模ベンチマークであるBOOMを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:48:13 GMT)
Large Language Models for Data Synthesis [17.3] 大規模言語モデル(LLM)は、現実の分布よりも柔軟で高次元の先行性を持つ。
LLM Synthorは、LLMを分布フィードバックによって誘導される構造対応シミュレータに変換するデータ合成のためのフレームワークである。
要約統計空間における相違を最小化することにより、反復合成ループは実データと合成データを整列させる。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:35:38 GMT)
Customizing Visual-Language Foundation Models for Multi-modal Anomaly Detection and Reasoning [17.3] 我々は、異常検知器や推論器として幅広い知識と堅牢な推論能力を持つ汎用視覚言語基盤モデルをカスタム構築する。
提案手法では,タスク記述,クラスコンテキスト,正規性ルール,参照イメージなど,さまざまなプロンプト型について検討する。
予備研究は、モデルをカスタマイズするための条件として視覚的および言語的プロンプトを組み合わせることで、異常検出性能が向上することを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:32:39 GMT)
Enhancing the Influence of Labels on Unlabeled Nodes in Graph Convolutional Networks [17.3] ELU-GCNと呼ばれる新しい2段階のフレームワークを提案する。
最初の段階では、ELU-GCNはグラフ学習を行い、新しいグラフ構造を学ぶ。
第2段階では、表現学習のためのGCNフレームワーク上で、新しいグラフコントラスト学習を設計する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:23:49 GMT)
M3Depth: Wavelet-Enhanced Depth Estimation on Mars via Mutual Boosting of Dual-Modal Data [17.0] 火星探査機に適した深度推定モデルであるM3Depthを提案する。
火星の地形のスムーズでスムーズなテクスチャを考えると,このモデルにはウェーブレット変換に基づく畳み込みカーネルが組み込まれている。
M3Depthは、深さ推定における他の最先端手法と比較して、深さ推定精度が16%向上した。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:13:00 GMT)
Uncertainty quantification in fine-tuned LLMs using LoRA ensembles [16.9] 我々はMistral-7bに基づく低ランク適応アンサンブルを用いて3つの一般的な多重選択データセットを解析した。
オーバーフィッティング体制における微調整中に獲得した知識の予期せぬ保持を同定する。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:59:52 GMT)
Towards a Foundation Model for Communication Systems [16.9] 本研究では,コミュニケーションデータの基礎モデルに向けて一歩踏み出した。
本稿では,トークン化,位置埋め込み,マルチモーダリティ,可変特徴量,正規化など,重要な課題に対処する手法を提案する。
本研究では,送信ランク,選択したプリコーダ,ドップラー拡散,遅延プロファイルなど,複数の特徴を推定できることを実証的に実証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:52:11 GMT)
Texts or Images? A Fine-grained Analysis on the Effectiveness of Input Representations and Models for Table Question Answering [16.8] 2つの視点から表表現とモデルの組み合わせの有効性に関する最初の制御された研究を行う。
テーブル表現とモデルの組み合わせはセットアップによって異なります。
本稿では,テーブル表現を動的に選択するFRESを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:36:17 GMT)
SATBench: Benchmarking LLMs' Logical Reasoning via Automated Puzzle Generation from SAT Formulas [16.7] SATBenchは、大規模言語モデル(LLM)の論理的推論能力を評価するためのベンチマークである。
SATBenchの各インスタンスはSAT式から生成され、LLMを使用してストーリーコンテキストと条件に変換される。
実験によると、最強のモデルであるo4-miniでさえ、ハードUNSAT問題において65.0%の精度しか達成していない。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:00:22 GMT)
Editing Across Languages: A Survey of Multilingual Knowledge Editing [16.7] この調査は、MKE(Multilingual Knowledge Editing)に関する最近の研究を体系化する。
MKEは、事実編集が言語全体にわたって確実に一般化されることを保証することに焦点を当てたモデル編集のサブドメインである。
本稿では,パラメータベース,メモリベース,微調整,ハイパーネットワークアプローチを網羅したMKE手法の包括的分類法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:13:04 GMT)
Prior Prompt Engineering for Reinforcement Fine-Tuning [16.7] 我々は、強化微細チューニング(RFT)の文脈における先行プロンプトエンジニアリング(pPE)について検討する。
推論時プロンプトエンジニアリング (iPE) にヒントを得て, 推論, 計画, コードベース推論, 知識リコール, および null-example 利用の5つの戦略を対応する pPE アプローチに翻訳する。
以上の結果から,全てのpPE学習モデルがiPE学習モデルを上回ることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:05:11 GMT)
A Comparative Study of Learning Paradigms in Large Language Models via Intrinsic Dimension [16.7] 大規模言語モデル(LLM)の隠れ表現に対する教師付き微調整と文脈内学習の効果について検討する。
我々はまず,LLM表現のIDがSFT中にどのように進化するか,ICLにおける実演数によってどのように変化するかを検討する。
次に、SFTとICLによって誘導されるIDを比較し、ICLはSFTと比較して常に高いIDを誘導する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:17:07 GMT)
When Thinking Fails: The Pitfalls of Reasoning for Instruction-Following in LLMs [16.7] 連鎖推論は命令追従精度を著しく低下させる。
これは、推論によって引き起こされる命令追従の失敗を体系的に公開する最初の作業である。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:31:43 GMT)
Performance Optimization of Energy-Harvesting Underlay Cognitive Radio Networks Using Reinforcement Learning [16.6] 認知無線ネットワークの性能を最大化するために、強化学習技術を用いる。
本研究のアプローチは, ベースライン戦略より優れ, 収束する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:38:32 GMT)
NavBench: A Unified Robotics Benchmark for Reinforcement Learning-Based Autonomous Navigation [16.6] 我々は、強化学習に基づくナビゲーションポリシーのトレーニングと評価のためのベンチマークであるNavBenchを紹介する。
我々のフレームワークはタスク定義を標準化し、異なるロボットが様々なナビゲーション課題に取り組むことを可能にする。
NavBenchはシミュレーションと実世界のデプロイメントの一貫性を確保することで、RLベースのナビゲーション戦略の開発を簡単にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:48:23 GMT)
SAE-FiRE: Enhancing Earnings Surprise Predictions Through Sparse Autoencoder Feature Selection [16.5] 会議コールは企業幹部、アナリスト、株主間の重要なコミュニケーションチャネルとして機能する。
トランスクリプトには、相当な冗長性と業界固有の用語を持つ5,000以上の単語が含まれている。
本稿では,これらの制約に対処するSparse Autoencoder for Financial Representation Enhancement (SAE-FiRE)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:31:23 GMT)
Not All Correct Answers Are Equal: Why Your Distillation Source Matters [16.4] 蒸留は、オープンソースの言語モデルの推論能力を高めるための実用的で効果的なアプローチとして登場した。
我々は,最先端の教師モデルであるAM-Thinking-v1,Qwen3-235B-A22B,DeepSeek-R1-onの3つの評価結果を収集した。
各データセットでトレーニングされた学生モデルは、AIME2024、AIME2025、MATH500、LiveCodeBenchなどの推論ベンチマークに基づいて評価される。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:00:51 GMT)
Mirror Bridges Between Probability Measures [16.4] 密度が不明な対象尺度からのサンプリングは、数学統計学と機械学習の基本的な問題である。
本稿では, ミラーブリッジと呼ばれる新しいモデルを提案し, 条件付き再サンプリングの問題を解く。
論文参考訳(メタデータ) (Tue, 20 May 2025 00:46:51 GMT)
Counting in Small Transformers: The Delicate Interplay between Attention and Feed-Forward Layers [16.3] 我々は、ヒストグラムタスクに取り組む際に実装される単純なトランスフォーマーブロックの解を分析する。
このタスクは、予測性能、語彙と埋め込みサイズ、トークン混合機構、フィードフォワード層容量の間の複雑な相互作用を明らかにする。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:40:37 GMT)
MUG-Eval: A Proxy Evaluation Framework for Multilingual Generation Capabilities in Any Language [16.2] 本稿では,大規模言語モデルの多言語生成能力を評価する新しいフレームワークMUG-Evalを提案する。
既存のベンチマークを会話タスクに変換し、それらのタスクに対するLCMの精度を測定します。
高、中、低リソースのカテゴリにまたがる30言語にわたる8つのLLMを評価し、MUG-Evalが確立されたベンチマークと強く相関していることを見出した。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:14:00 GMT)
Scan, Materialize, Simulate: A Generalizable Framework for Physically Grounded Robot Planning [16.2] Scan, Materialize, Simulate (SMS) は,正確なシーン再構成のための3次元ガウススプラッティング,セマンティックセグメンテーションのための視覚基盤モデル,物質特性推定のための視覚言語モデル,アクション結果の信頼性予測のための物理シミュレーションを組み合わせた統合フレームワークである。
本研究は,シーン再構築のための異種レンダリング,セマンティック理解のための基礎モデル,物理に基づくシミュレーションにより,多様な環境にまたがる物理的基盤を持つロボット計画を実現する可能性を強調した。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:55:01 GMT)
Multimodal Mixture of Low-Rank Experts for Sentiment Analysis and Emotion Recognition [16.1] マルチモーダル感情分析(MSA)とマルチモーダル感情認識(MER)のための新しいMMOLRE法を提案する。
MMoLREは共有およびタスク固有の専門家を用いて、共通のタスク特性とユニークなタスク特性を明確にモデル化し、パラメータの衝突を避ける。
CMU-MOSI と CMU-MOSEI のベンチマーク実験により、MMOLRE が MSA タスクの最先端性能と MER タスクの競合結果を達成することを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:46:56 GMT)
Pierce the Mists, Greet the Sky: Decipher Knowledge Overshadowing via Knowledge Circuit Analysis [16.1] PhantomCircuitは知識の共有を分析・検出するフレームワークである。
注目の頭脳の内部動作を識別し、競合する知識経路がオーバーシャドーイング現象にどのように貢献するかを追跡する。
この幻覚に関する新たな洞察を提供し、その潜在的な緩和のための新しい方法論のレンズを研究コミュニティに提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:20:30 GMT)
FOL-Pretrain: A complexity annotated corpus of first-order logic [16.1] トランスフォーマーベースの大規模言語モデル(LLM)は、顕著な推論能力を示している。
LLMの振る舞いをリバースエンジニアリングしようとする最近の試みにもかかわらず、これらのモデルがどのように複雑なアルゴリズムの内部化と実行を行うかについての理解は依然として限られている。
本稿では,大規模かつ完全にオープンな,一階述語論理推論トレースの複雑性アノテーション付きデータセットを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:38:28 GMT)
FlowTSE: Target Speaker Extraction with Flow Matching [16.1] FlowTSEは、条件付きフローマッチングに基づく、シンプルだが効果的なTSEアプローチである。
位相再構成が重要であるタスクに対しては、混合信号の複雑なSTFTを条件とした新しいボコーダを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:01:30 GMT)
AS3D: 2D-Assisted Cross-Modal Understanding with Semantic-Spatial Scene Graphs for 3D Visual Grounding [15.9] 3Dビジュアルグラウンドティングは、自然言語で記述されたユニークなターゲットを3Dシーンでローカライズすることを目的としている。
本稿では,関係認識のためのオブジェクト識別を伴う意味空間のシーングラフを構築する2次元視覚的グラウンドティングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:19:53 GMT)
Tokenization Constraints in LLMs: A Study of Symbolic and Arithmetic Reasoning Limits [15.9] トークン化は、言語モデルにおける最初の、そしてしばしば過小評価される計算層である。
このような推論の成功は、トークン化された入力の構造によって根本的に境界づけられていることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:32:30 GMT)
Toward Effective Reinforcement Learning Fine-Tuning for Medical VQA in Vision-Language Models [15.9] 強化学習(RL)に基づく多モーダル大規模言語モデル(MLLM)の軌道変更
医用視覚質問応答(VQA)におけるRLに基づくチューニングの有効性に影響を与える4つの臨界次元について検討する。
我々は、これらの因子を医療MLLMで分析するための広範囲な実験を行い、モデルがどのようにドメイン特異的に微調整されているかについての新しい知見を提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:12:20 GMT)
Embedded Mean Field Reinforcement Learning for Perimeter-defense Game [15.9] 運動力学や風力場といった現実的な要素を取り入れた3次元環境下での大規模な異種周辺防御ゲームについて検討した。
本稿では,防衛戦略における大規模制御課題に対処するために,EMFAC( Embedded Mean-Field Actor-Critic)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:11:46 GMT)
Evaluating Frontier Models for Stealth and Situational Awareness [15.8] 最近の研究は、スケジューリングするフロンティアAIモデルの可能性を示している。
AI開発者にとっては、モデルデプロイメントの前にスキーマから害を排除することが重要です。
本稿では,2種類の推論能力を測定するためのスケジューリング推論評価スイートを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:20:09 GMT)
Strict area law entanglement versus chirality [15.8] キラリティー(英: Chirality)は、非ゼロ熱伝導や電気伝導によって表される2つの空間次元における物質のギャップの位相である。
我々は、有限次元局所ヒルベルト空間における量子状態に対するそのようなキラリティを厳密な領域法則エントロピーで禁止する2つのノーゴー定理を証明した。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:17:51 GMT)
Fairshare Data Pricing via Data Valuation for Large Language Models [15.8] 本稿では,大規模言語モデル(LLM)データ市場に関する理論的枠組みを紹介する。
我々は、悪用的な価格が高品質の売り手を市場から追い出す方法を示している。
次に、データバリュエーションに基づく価格設定メカニズムであるfairshareを紹介します。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:11:29 GMT)
IoT-LLM: Enhancing Real-World IoT Task Reasoning with Large Language Models [15.8] LLM(Large Language Models)はテキストやビジュアルタスクに優れるが、物理世界の推論タスクを扱う際に物理法則に反する出力を生成することが多い。
人間の認知に触発されて,モノのインターネット(IoT)センサデータを用いた知覚能力の向上によるLLMの強化と,物理的な世界におけるIoT感覚タスク推論のための関連する知識について検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:12:15 GMT)
Steering Deep Non-Linear Spatially Selective Filters for Weakly Guided Extraction of Moving Speakers in Dynamic Scenarios [15.7] 空間的ダイナミックなシナリオは、時間的に変化する空間的特徴とあいまいさを引き起こすため、かなり困難である。
本研究では,ターゲットの初期位置にのみ依存する弱誘導抽出手法を提案し,空間的動的シナリオに対処する。
自己のディープトラッキングアルゴリズムを導入し、合成データセット上で共同トレーニング戦略を開発することにより、空間的曖昧性の解消におけるアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:43:55 GMT)
SHARP: Synthesizing High-quality Aligned Reasoning Problems for Large Reasoning Models Reinforcement Learning [15.7] STEM領域での強化学習を伴う大規模推論モデル(LRM)の訓練は、高品質で多様性があり、検証可能な問題セットの不足によって妨げられる。
検証可能な報酬(RLVR)を用いたLRM強化学習における高品質アラインド推論問題の一元化手法であるSHARPを導入する。
我々は、最先端のLEMを活用して、難解なSTEM質問を推論し、検証し、次に、強化学習ループを使用して、検証可能な報酬信号によってモデルの推論を洗練する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:54:42 GMT)
Field Matters: A lightweight LLM-enhanced Method for CTR Prediction [15.6] LLaCTRは、フィールドレベルの拡張パラダイムを用いた、新しく軽量なLCM拡張CTR法である。
具体的には、LLaCTRはLLMを用いて、自己教師付きフィールド機能微調整により、小規模の特徴フィールドから重要で軽量なセマンティック知識を抽出する。
実験では,LLaCTRを4つのデータセットにまたがる6つの代表的CTRモデルと統合し,有効性と効率の両面で優れた性能を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:02:41 GMT)
RADAR: Enhancing Radiology Report Generation with Supplementary Knowledge Injection [15.6] RADARは、補助的な知識注入による放射線学レポート生成を強化するためのフレームワークである。
まず、専門家のイメージベースの分類出力と整合したモデルから取得した知識を抽出する。
その後、関連する補足的知識を取得して、この情報をさらに強化する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:05:41 GMT)
ReactDiff: Latent Diffusion for Facial Reaction Generation [15.5] 話者の音声・視覚的クリップを考えると、顔反応生成はリスナーの顔反応を予測することを目的としている。
本稿では,多モード変換器と条件拡散を統合した顔反応拡散(ReactDiff)フレームワークを提案する。
実験の結果、ReactDiffは既存のアプローチよりも大幅に優れており、顔反応の相関は0.26、多様性のスコアは0.094である。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:01:37 GMT)
BAR: A Backward Reasoning based Agent for Complex Minecraft Tasks [15.5] タスクを完了するには、LLM(Big Language Model)ベースのエージェントを計画によって簡単に実行可能なステップに分解する必要がある。
既存の研究は主にエージェントの初期状態から次にどのステップを実行するべきかを推測することで計画を実行する。
実世界のシナリオに基づいて複雑なタスクをシミュレートする仮想環境であるMinecraftでこの問題を研究することを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:35:35 GMT)
Kaleidoscope Gallery: Exploring Ethics and Generative AI Through Art [15.4] 我々は芸術を批判的探求の一形態として、そしてカレイドースコープの比喩として、道徳的想像力を呼び起こす。
我々は,テキスト・ツー・イメージ(T2I)のGenAIモデルを用いて,画像に変換された倫理理論の5つのファミリーを明らかにする。
その結果得られたイメージは、カレイドスコープ・ギャラリーとしてキュレーションされ、道徳、社会、学習した協会が倫理理論の中心となっていることを強調する8つのテーマを明らかにした。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:28:00 GMT)
Transformational Creativity in Science: A Graphical Theory [15.4] 変革的創造性は、概念空間の「発散する制約」の変化と、パラダイムシフトによるクーンの科学革命の構造から生じることを示す。
私たちは、グラフィカルモデルの公理に対する修正が、最もトランスフォーメーションなポテンシャルを持っていることを証明し、その上で、我々のフレームワークによって、トランスフォーメーション創造の歴史的事例がどのように捉えられるかを示します。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:20:03 GMT)
SQLong: Enhanced NL2SQL for Longer Contexts with LLMs [15.3] オープンウェイトな大規模言語モデル (LLM) は自然言語 tosql (NL2 タスク) において大幅に性能が向上した。
提案するSQLongは,NL2タスクの長文シナリオにおけるLLM性能を向上させるために設計された,新規で効率的なデータ拡張フレームワークである。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:14:20 GMT)
DisastIR: A Comprehensive Information Retrieval Benchmark for Disaster Management [15.2] 本稿では,災害管理に適した総合的情報検索評価ベンチマークであるDisastIRを紹介する。
DisastIRは、9600の多様なユーザクエリと、130万以上のラベル付きクエリパスペアで構成され、48の異なる検索タスクをカバーしている。
30の最先端検索モデルの評価結果から,タスク間の性能の相違が顕著であり,一つのモデルが普遍的に優れているわけではない。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:11:00 GMT)
Partition-wise Graph Filtering: A Unified Perspective Through the Lens of Graph Coarsening [15.2] 本稿ではCPF(Coarsening-guided Partition-wise Filtering)を紹介する。
CPFはノード分割でフィルタリングを実行することで革新する。
CPFの各相について詳細な解析を行い、他のパラダイムよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:30:45 GMT)
CAFES: A Collaborative Multi-Agent Framework for Multi-Granular Multimodal Essay Scoring [15.2] CAFESはAES用に特別に設計された初の協調型マルチエージェントフレームワークである。
それは3つの特殊エージェントを編成する: 迅速で特性特異的な評価のためのイニシャル・スコーラー、詳細なエビデンスに基づく強さを集約するフィードバックプールマネージャ、このフィードバックに基づいてスコアを反復的に洗練して人間のアライメントを強化するリフレクティブ・スコーラー。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:05:56 GMT)
Foundations of Unknown-aware Machine Learning [15.2] この論文は、分布の不確実性や未知のクラスに起因する重要な信頼性問題に対処するためのアルゴリズム的基礎と理論的基礎の両方を発展させている。
コアコントリビューションは未知の学習フレームワークの開発であり、OODデータをラベル付けせずにモデルが新しい入力を認識し、処理することができる。
この論文はまた、大きな言語モデル(LLM)を含む基礎モデルへの信頼性のある学習も拡張している。
全体として、これらの貢献は未知の学習を新しいパラダイムとして推進し、人間の最小限の努力でAIシステムの信頼性を向上させることを願っています。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:39:08 GMT)
PRL: Prompts from Reinforcement Learning [15.1] PRL(Prompts from Reinforcement Learning)は,自動プロンプト生成のための新しいRLベースのアプローチである。
従来の方法とは異なり、PRLはトレーニング中に見られなかった新しい数発の例を作成できる。
提案手法は,テキスト分類,単純化,要約など,さまざまなベンチマークにおいて最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:26:19 GMT)
Knowledge-Guided Prompt Learning for Request Quality Assurance in Public Code Review [15.0] 我々は、開発者によるコードレビュー要求品質保証を実現するために、KP-PCR(Knowledge-guided Prompt Learning for Public Code Review)を提案する。
2011-2023年のPCRデータセットの実験結果から,我々のKP-PCRはベースラインより優れていたことが判明した。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:43:05 GMT)
Multimodal Cancer Survival Analysis via Hypergraph Learning with Cross-Modality Rebalance [15.0] 本稿では,ハイパーグラフ学習を取り入れた病理画像から文脈的・階層的詳細を抽出するフレームワークを提案する。
C-Indexの性能は3.4%以上向上した。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:04:32 GMT)
Revealing and Mitigating the Challenge of Detecting Character Knowledge Errors in LLM Role-Playing [15.0] 本稿では,KKE と UKE の誤り検出能力を評価するために RoleKE-Bench を提案する。
その結果,最新のLSMでさえ,これらの2種類の誤りを効果的に検出するのに苦労していることがわかった。
本稿では,エージェントに基づく推論手法であるSelf-RecollectionとSelf-Doubtを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:12:34 GMT)
An Initial Introduction to Cooperative Multi-Agent Reinforcement Learning [14.9] マルチエージェント強化学習(MARL)は近年急速に普及している。
MARLアプローチは、集中型トレーニングと実行(CTE)、分散型実行(CTDE)のための集中型トレーニング(CTDE)、分散型トレーニングと実行(DTE)の3つの主なタイプに分類される。
このテキストはMARLの紹介であり、すべてのエージェントが単一の共同報酬を共有するMARLである。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:48:37 GMT)
STATE ToxiCN: A Benchmark for Span-level Target-Aware Toxicity Extraction in Chinese Hate Speech Detection [14.9] 中国語ヘイトスピーチのきめ細かい検出方法を提案する。
まず,ターゲット・Argument-Hateful-Group Quaruples(STATE ToxiCN)を含むデータセットを構築する。
次に,既存モデルのヘイトスピーチ検出性能について検討した。
最後に,中国のヘイトフルスラングに関する最初の研究を行い,LLMがそのような表現を検出する能力を評価する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:52:00 GMT)
EVA: Red-Teaming GUI Agents via Evolving Indirect Prompt Injection [14.8] マルチモーダルエージェントは、グラフィカルユーザインタフェース(GUI)を操作してユーザタスクを完了するように、ますます訓練されている。
本稿では,攻撃をループ最適化に変換する間接的プロンプトインジェクションのフレームワークであるEVAを提案する。
EVAは、ポップアップ操作、チャットベースのフィッシング、支払い、電子メール合成などの現実的な設定において、広く使われている6つのジェネラリストおよび専門的なGUIエージェントに対して評価する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:41:05 GMT)
Feasibility-Aware Pessimistic Estimation: Toward Long-Horizon Safety in Offline RL [14.8] CVAEに基づくペシミズム(FASP)を用いたオフラインセーフ強化学習フレームワークを提案する。
我々はハミルトン・ヤコビ(H-J)リーチビリティ解析を用いて信頼性の高い安全ラベルを生成する。
また,報酬とコストのQ値の推定にも悲観的推定法を用いる。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:40:42 GMT)
Flexible-weighted Chamfer Distance: Enhanced Objective Function for Point Cloud Completion [14.7] Chamfer Distance (CD)は、生成された点雲のグローバル分布と局所的な性能を評価する2つのコンポーネントから構成される。
本稿では,FCD(Flexible-Weighted Chamfer Distance)を提案する。
FCDはCDのグローバル分布成分により高い重みを割り当て、フレキシブルな重み付け戦略を取り入れて両者のバランスを調整する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:26:05 GMT)
Breaking Language Barriers or Reinforcing Bias? A Study of Gender and Racial Disparities in Multilingual Contrastive Vision Language Models [14.6] 我々は,M-CLIP,NLLB-CLIP,CAPIVARA-CLIPの3つの公開多言語CLIPチェックポイントについて,最初の体系的監査を行った。
人種と性別の偏見を定量化し、ステレオタイプ増幅を測定する。
性別の多い言語は、すべての測定されたバイアスタイプを常に拡大するが、異国語のステレオタイプを輸入する場合、男女中立言語でさえも脆弱である。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:14:00 GMT)
A Comprehensive Social Bias Audit of Contrastive Vision Language Models [14.6] テキスト・ツー・イメージ・モデルにおける公平性を高める新しいフレームワークであるFairCoTを紹介する。
また,FairCoTは画像品質や意味的忠実さを犠牲にすることなく,公平性と多様性を著しく向上させることを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:18:54 GMT)
Interpretable Traces, Unexpected Outcomes: Investigating the Disconnect in Trace-Based Knowledge Distillation [14.5] この研究は、推論トレースと最終的なパフォーマンスとの相関を評価することの課題に対処することを目的としている。
規則に基づく問題分解を利用して解釈可能なトレースを生成する。
具体的には、この問題を分類ステップと情報検索ステップに分解して、オープンブックQAにおけるこのアプローチを実証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 00:49:19 GMT)
Heterogeneity Matters even More in Distributed Learning: Study from Generalization Perspective [14.5] 1ラウンドのフェデレートラーニングでは、$K$クライアントは、おそらく異なるデータ分散に基づいて、独立して$n$のトレーニングサンプルを生成する。
集約モデルの一般化誤差に及ぼすクライアントのデータ分布の相違の影響について検討する。
DSVMは、クライアントのトレーニングサンプル間の相違が大きくなるとより一般化する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:13:58 GMT)
Impact of Clifford operations on non-stabilizing power and quantum chaos [14.4] 非安定化器性は、絡み合いとともに、フォールトトレラント量子計算にとって重要な要素である。
クリフォード演算と非クリフォード演算を混合した回路における非安定化剤の生成と熱化について検討する。
我々の研究は、量子計算資源の理解と、量子カオスにおけるそれらの役割に寄与する。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:02:12 GMT)
Rate, Explain and Cite (REC): Enhanced Explanation and Attribution in Automatic Evaluation by Large Language Models [14.4] 本稿では,REC-8B,REC-12B,REC-70Bの3種類の汎用LDM自動評価器を紹介する。
それらは、忠実性、指示従順性、一貫性、完全性など、様々な次元で生成されたテキストを評価するように設計されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:41:56 GMT)
Towards Reliable Proof Generation with LLMs: A Neuro-Symbolic Approach [14.2] 大型言語モデル(LLM)は厳密な論理的推論と記号的推論を必要とする形式的ドメインと競合する。
本稿では,LLMの生成強度と構造成分を組み合わせ,この課題を克服するニューロシンボリックアプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:13:32 GMT)
Moneros Decentralized P2P Exchanges: Functionality, Adoption, and Privacy Risks [14.2] 分散取引所(DEX)はピアツーピア(P2P)ネットワークを活用し、安全で匿名の資産取引を約束する。
これらのプラットフォームは一般にピアツーピア(P2P)ネットワークを活用し、安全で匿名の資産取引を約束する。
本稿では,モネロ生態系における分散ピアツーピア交換の現況の早期体系化について述べる。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:06:42 GMT)
DragLoRA: Online Optimization of LoRA Adapters for Drag-based Image Editing in Diffusion Model [14.1] DragLoRAは、ドラッグベースの編集パイプラインにLoRAアダプタを統合する新しいフレームワークである。
DragLoRAはドラッグベース画像編集における制御精度と計算効率を大幅に向上させることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:42:53 GMT)
FisherSFT: Data-Efficient Supervised Fine-Tuning of Language Models Using Information Gain [14.1] Supervised Fine-tuning (SFT) は、大規模言語モデル(LLM)を新しいドメインに適用するための標準的なアプローチである。
本研究では,SFTの統計的効率を向上させるために,学習例の有意なサブセットを選択する。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:41:34 GMT)
S2SBench: A Benchmark for Quantifying Intelligence Degradation in Speech-to-Speech Large Language Models [14.1] エンドツーエンドの音声大言語モデル(LLM)は、音声トークンを直接処理し、生成するテキストベースモデルの能力を拡張している。
これはしばしばテキスト入力と比較して推論と生成性能が低下する。
音声LLMの性能劣化を定量化するベンチマークであるS2SBenchを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:42:20 GMT)
Rethinking Prompt Optimizers: From Prompt Merits to Optimization [14.0] MePOは、メリット対応のプロンプトから構築された、メリット誘導型で軽量で、ローカルにデプロイ可能なプロンプトトレーニングデータセットである。
MePOはオンライン最適化を避け、コストとプライバシの懸念を低減し、明確で解釈可能なメリットを学習することで、大規模な推論モデルと軽量推論モデルの両方に効果的に一般化する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:48:05 GMT)
Practical Efficiency of Muon for Pretraining [13.9] 大規模なバッチサイズでデータ効率を維持する上で、MuonはAdamWよりも効果的であることがわかった。
本稿では,資源のオーバーヘッドを最小限に抑えつつ,mulPのすべてのエラー源を考慮に入れた単純なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:04:35 GMT)
Scalable Evaluation of Online Facilitation Strategies via Synthetic Simulation of Discussions [13.9] 本稿では,LLMファシリテータの開発をプロトタイプ化する,シンプルで一般化可能なLCM駆動手法を提案する。
我々は,現在のファシリテーション戦略がLCMファシリテータの性能を向上させることができるかどうかを検証するために,我々の方法論を利用する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:49:17 GMT)
Context-Free Synthetic Data Mitigates Forgetting [13.8] 文脈自由な世代による微調整データセットの強化は、忘れを省くことを示す。
予備学習用OLMo-1Bと推論用R1-Distill-Llama-8Bについて検討した。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:47:31 GMT)
Enhancing LLMs via High-Knowledge Data Selection [13.8] 大規模言語モデル(LLM)の性能は、そのトレーニングデータの品質と本質的に関連している。
我々は,知識の次元から高品質なデータを選択するための,新しい,勾配のないハイノウレッジ・スコラー(HKS)を提案する。
我々は、高知識バイリンガルデータセット上でモデルを訓練し、実験結果から、知識集約的および一般理解的なタスクにおいて、スコアラーがモデルの性能を向上させることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:21:37 GMT)
MoMoE: Mixture of Moderation Experts Framework for AI-Assisted Online Governance [13.8] Mixture of Moderation Experts (MoMoE)は、スケーラブルなコンテンツモデレーションにポストホックな説明を追加するモジュラーフレームワークである。
MoMoEは、Allocate、Predict、Aggregate、Explainという4つのオペレーターを編成し、コミュニティの専門家7人と規範違反の専門家5人としてインスタンス化されている。
30個の目に見えないサブレディットでは、最良の変種がそれぞれ0.72と0.67のMicro-F1スコアを得る。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:16:06 GMT)
Adapting Pretrained Language Models for Citation Classification via Self-Supervised Contrastive Learning [13.7] サイテーション分類は学術的な分析に欠かせない。
先行研究は、引用分類に基づく微調整事前学習言語モデル(PLM)を示唆している。
我々はこれらの課題を克服するためにPLMに適応する新しいフレームワーク、Citssを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:05:27 GMT)
From stability of Langevin diffusion to convergence of proximal MCMC for non-log-concave sampling [13.7] 我々は、Untime Langevin (ULA) を用いた非後方からの離散分布のサンプリング問題を考える。
我々は ULA の頑健さを、ポテンシャルが無限大の凸であるという仮定に証明する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:29:57 GMT)
SifterNet: A Generalized and Model-Agnostic Trigger Purification Approach [13.6] 本稿では,古典Isingモデルを利用したモデルに依存しないトリガ浄化手法を提案する。
提案手法の主な特徴はイジングモデルのイデオロギーの導入である。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:51:17 GMT)
Learning to Insert for Constructive Neural Vehicle Routing Solver [13.6] 建設的NCOの学習手法として,挿入型パラダイム(L2C-Insert)を用いた構築学習を提案する。
従来のアプローチとは異なり、L2C-Insertは、現在の部分解の任意の有効な位置において、意図しないノードを戦略的に挿入することで、ソリューションを構築する。
トラベリングセールスマン問題 (TSP) とキャパシタント車両ルーティング問題 (CVRP) の総合的および実世界の事例において、L2C-Insert が一貫して優れた性能を発揮することを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:10:50 GMT)
Effective climate policies for major emission reductions of ozone precursors: Global evidence from two decades [13.6] 構造的破壊検出と機械学習を使用して、建物、電気、産業、輸送部門を横断する効果的な介入を特定します。
我々はNOtextsubscriptx, CO, VOCsの78, 77, 78の構造破壊をそれぞれ0.96-0.97 Gt, 2.84-2.88 Gt, 0.47-0.48 Gtの累積放射削減に対応して検出した。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:20:36 GMT)
Trustworthy Reputation Games and Applications to Proof-of-Reputation Blockchains [13.5] 我々は,各サーバの信頼性に関する信頼度に関する信念を,一組のユーザが一組のサーバに報告することのできる,信頼に値する評価ゲーム(em trustworthy reputation game)と呼ぶゲームのクラスについて述べる。
我々のユーティリティと復号化関数は、よく知られたアルゴリズムと信頼性発見の問題との接続の上に構築される。
上記のゲームがどのように動機付けられており、実証・オブ・レプション(PoR)ブロックチェーンで利用することができるかを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:06:25 GMT)
A Dataless Reinforcement Learning Approach to Rounding Hyperplane Optimization for Max-Cut [13.4] エージェントが改良された丸みを帯びた超平面を選択し、ゴーマンス・ウィリアムソン(GW)アルゴリズムで生成されたものよりも優れたカットを得られるように学習する、非エポゾディック強化学習の定式化に基づくトレーニングデータフリーアプローチを提案する。
提案手法は, 密度や次数分布の異なる大規模グラフに対して, より優れたカットを一貫して達成する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:31:21 GMT)
Solving Normalized Cut Problem with Constrained Action Space [13.4] 本稿では、制約されたアクション空間を用いて、正規化されたカット問題を事前定義されたテンプレートインスタンスへ誘導する最初のRLソリューションを提案する。
輸送ネットワークを例として、ウェッジとリングのグラフ分割を形作るWedge and Ring Transformerを作成します。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:33:39 GMT)
RefiDiff: Refinement-Aware Diffusion for Efficient Missing Data Imputation [13.4] 高次元混合型データセットの欠落値は、データ計算に重大な課題をもたらす。
本稿では,ローカルな機械学習予測と,新しいマンバベースの認知ネットワークを組み合わせた,革新的なフレームワークRefiDiffを提案する。
RefiDiffは、DDPMベースのアプローチよりも4倍高速なトレーニング時間で、不足値設定でステート・ザ・アート(SOTA)メソッドをパフォーマンスします。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:51:07 GMT)
Linear Control of Test Awareness Reveals Differential Compliance in Reasoning Models [13.4] 推論にフォーカスした大規模言語モデル(LLM)は、評価されていることを検知すると、その振る舞いを変えることがある。
このような「テスト意識」がモデル行動、特に安全性のアライメントにどのように影響するかについて、最初の定量的研究を行った。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:03:12 GMT)
Temporal Alignment of Time Sensitive Facts with Activation Engineering [13.3] 大規模言語モデル(LLM)は、複数のドメインと時間にまたがる多様かつしばしば矛盾する知識に基づいて訓練される。
LLMが適切な応答を生成することは、関連性と正確性を維持するために不可欠である。
我々は,LCMを時間的に整列させて,トレーニングやデータセット作成なしに現実的リコールを改善する手法として,アクティベーションエンジニアリングを探求する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:09:40 GMT)
Building a Stable Planner: An Extended Finite State Machine Based Planning Module for Mobile GUI Agent [13.3] タスク実行において視覚言語モデル(VLM)を誘導する実行計画を生成するための,プラグアンドプレイ計画モジュールであるSPlannerを提案する。
SPlannerは、Qwen2.5-VL-72BをVLMとして組み合わせた場合、63.8%のタスク成功率を達成した。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:45:55 GMT)
Scaling Low-Resource MT via Synthetic Data Generation with LLMs [13.1] 本研究は7つの多様な対象言語に焦点を当てる。
我々は、英語のEuroparlから文書レベルの合成コーパスを構築し、それを147の追加言語対にピボットすることで拡張する。
本研究は, (i) 効果的なトレーニング体制の同定, (ii) データのHPLTデータセットとの比較, (iii) 英語中心MTを超えてその実用性をテストすることによる実践的応用について検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:31:54 GMT)
S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models [13.1] 大規模推論モデル(LRM)は、思考の明示的な連鎖を通じて複雑な推論タスクにおいてブレークスルーを達成した。
システム2の思考に大きく依存しているため、システム1の思考能力は制限される可能性がある。
S1-Bench氏は、システム1.1にもっと適した質問に対して、LEMのパフォーマンスを評価するために、単純で多様で自然な質問のスイートを紹介している。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:52:53 GMT)
TCC-Bench: Benchmarking the Traditional Chinese Culture Understanding Capabilities of MLLMs [13.1] 中国伝統文化理解ベンチマーク(TCC-Bench)を提案する。
TCC-Benchは、文化的に豊かで視覚的に多様なデータで構成されており、博物館の工芸品、日常の生活シーン、漫画、その他の文化的に重要な文脈の画像が組み込まれている。
テキストのみのモードでGPT-4oを利用する半自動パイプラインを採用し、候補問題を生成し、続いて人間によるキュレーションを行い、データ品質を保証し、潜在的なデータ漏洩を回避する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:58:01 GMT)
Computational Efficiency under Covariate Shift in Kernel Ridge Regression [13.0] 学習性能を損なうことなく,計算量を大幅に削減できることを示す。
仮説空間が与えられたRKHS内のランダム部分空間からなるランダム射影の使用について検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:41:24 GMT)
Enhancing Learned Knowledge in LoRA Adapters Through Efficient Contrastive Decoding on Ascend NPUs [13.0] Contrastive LoRA Decoding (CoLD) は、LoRA適応モデルにおけるタスク固有の知識の使用を最大化するために設計された、新しいデコーディングフレームワークである。
CoLDはタスクの精度を最大5.54%向上し、エンドツーエンドのレイテンシを28%削減する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:11:18 GMT)
Prompting Large Language Models for Training-Free Non-Intrusive Load Monitoring [13.0] 非侵入負荷モニタリング (NILM) は、家庭の電力消費を個別の家電利用に集約することを目的としている。
本稿では,テキスト内学習による大規模言語モデルを活用した,最初のプロンプトベースのNILMフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:43:04 GMT)
Nested Deep Learning Model Towards A Foundation Model for Brain Signal Data [13.0] てんかんは全世界で約5000万人に影響を及ぼす。
脳磁図(MEG)に基づくスパイク検出は、診断と治療において重要な役割を担っている。
難易度を高めるため、様々なアルゴリズムアプローチが開発されている。
これらの制限を克服するために、新しいNested Deep Learning(NDL)フレームワークが提案されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:37:28 GMT)
Untangling Hate Speech Definitions: A Semantic Componential Analysis Across Cultures and Domains [13.0] 100以上の文化から493の定義を含むヘイトスピーチ定義の最初のデータセットを作成する。
分析の結果,対象とする文化を考慮せずに定義を相互に借用するドメインが多かった。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:55:04 GMT)
Demonstrating Coherent Quantum Routers for Bucket-Brigade Quantum Random Access Memory on a Superconducting Processor [12.9] 超伝導量子プロセッサを用いたコヒーレント量子ルータを実証する。
個々のQ忠実度を95.74%まで達成し、2層量子ルーティングネットワークによるスケーラビリティの検証を行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:42:19 GMT)
Exploring Non-Convex Discrete Energy Landscapes: An Efficient Langevin-Like Sampler with Replica Exchange [12.9] グラディエントベース離散サンプリング器(GDS)は離散エネルギーをサンプリングするのに有効であるが、複雑な非ステップランドスケープではしばしば停滞する。
EXEchang Langevin (DREXEL) サンプルと, カスタマイズされた利用機構 (DREAM) を用いたその変種について紹介する。
理論的には,提案したサンプルは詳細なバランスを満足し,軽度条件下で目標に収束することが証明された。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:06:24 GMT)
Trust Me, I Can Handle It: Self-Generated Adversarial Scenario Extrapolation for Robust Language Models [12.9] 大きな言語モデル(LLMs)は印象的な能力を示すが、安全リスクが増大する傾向にある。
既存の防衛は、しばしば単一の脅威タイプや、厳格な徹底的な拒絶にのみ対処する。
本稿では,Chain-of-Thought推論を利用した新しい推論時間フレームワークであるAdrial Scenario Extrapolation(ASE)を紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:22:40 GMT)
Truth or Twist? Optimal Model Selection for Reliable Label Flipping Evaluation in LLM-based Counterfactuals [12.8] ジャッジモデルは、大きな言語モデルに対して生成されたカウンターファクトの妥当性を評価するために使用される。
独立な非微調整関係を持つ判定モデルは,最も信頼性の高いラベルフリップ評価を提供することを示す。
その結果、最も効果的な判断モデルとユーザスタディから得られる結果とのギャップは、依然としてかなり大きいことが判明した。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:12:17 GMT)
Abacus: A Cost-Based Optimizer for Semantic Operator Systems [12.8] 本稿では,セマンティック演算子の最適実装を探索するコストベースシステムであるAbacusを紹介する。
Abacusは、最小限の検証例と、もし可能であれば、オペレータのパフォーマンスに関する事前の信念を活用することで、オペレータのパフォーマンスを見積もる。
Abacusによって最適化されたシステムは、19.2%-39.2%の優れた品質、23.6倍の低コスト、4.2倍のレイテンシを実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:49:46 GMT)
High-dimensional Nonparametric Contextual Bandit Problem [12.8] カーネル化された文脈帯域幅は、線形文脈帯域幅問題を一般化する。
サンプル数まで次元が増大しても,非回帰学習は達成可能であることを示す。
Delta$の観点で、寛大な後悔の率を導き出す。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:10:39 GMT)
Towards Mitigating API Hallucination in Code Generated by LLMs with Hierarchical Dependency Aware [12.8] 大規模言語モデル(LLM)は自動コード生成を支援するが、しばしばAPI幻覚に悩まされる。
既存の研究は、幻覚を緩和するためのRAG(Retrieval-Augmented Generation)手法を利用している。
階層的依存を意識したLLMで生成されたコード中のAPI幻覚を緩和するフレームワークであるMARINを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:18:03 GMT)
Capturing the Effects of Quantization on Trojans in Code LLMs [12.8] 本研究では,大規模言語のコードモデルに対するデータ中毒攻撃のリスクに対する量子化の影響について検討する。
量子化はコード生成LDMに異なる効果があることがわかった。
妥協されたモデルにおけるトロイの木馬信号を測定するための新しい指標を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:01:14 GMT)
DeepGate4: Efficient and Effective Representation Learning for Circuit Design at Scale [12.7] 本稿では,大規模回路用に設計されたグラフトランスであるDeepGate4を紹介する。
DeepGate4は最先端の手法をはるかに上回り、次世代モデルよりも15.5%の性能向上を実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:17:48 GMT)
A Framework for Real-time Safeguarding the Text Generation of Large Language Model [12.7] 大規模言語モデル(LLM)は、非常に高度な自然言語処理(NLP)タスクを持っているが、有害なコンテンツを生成するための適合性のために倫理的・社会的リスクを生じさせる。
LLMSafeGuardは,外部バリデータをデコードに統合し,非安全な出力を拒否し,有効な出力を許容する軽量リアルタイムフレームワークである。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:28:29 GMT)
Automated Fetal Biometry Assessment with Deep Ensembles using Sparse-Sampling of 2D Intrapartum Ultrasound Images [12.5] 本研究では,生体内および生体内変動を低減するための自動胎児バイオメトリ測定パイプラインを提案する。
我々はスパースサンプリングを行い、クラス不均衡を緩和し、タスクの急激な相関を減らした。
09452, F1: 0.9225, AUC: 0.983, MCC: 0.8361, DSC: 0.918, HD: 19.73, ASD: 5.71, $Delta_AoP$: 8.90, $Delta_HSD$: 14.35。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:31:09 GMT)
R2-KG: General-Purpose Dual-Agent Framework for Reliable Reasoning on Knowledge Graphs [12.5] R2-KGは、推論を2つの役割に分けるプラグイン・アンド・プレイのフレームワークである。
以上の結果から,R2-KGはKGベースの推論のための柔軟性とコスト効率のよい解であることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:24:19 GMT)
Unraveling Interwoven Roles of Large Language Models in Authorship Privacy: Obfuscation, Mimicking, and Verification [12.4] オーサシップの難読化 (AO)、オーサシップの模倣 (AM)、オーサシップの検証 (AV) はオーサシップのプライバシーにおける3つの主要な自動化タスクである。
本研究は, LLM 有効化 AO, AM, AV 間の動的関係を解析するための最初の統一フレームワークを提案する。
また、性別、学歴、パフォーマンス、タスク間ダイナミクス、プライバシーリスクなど、人口統計学的メタデータの役割についても検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:52:12 GMT)
Fragments to Facts: Partial-Information Fragment Inference from LLMs [12.4] 大規模言語モデル(LLM)は、暗記とメンバーシップ推論攻撃を通じて、センシティブなトレーニングデータを漏洩させることができる。
細調整LDMはフラグメント特異的抽出攻撃の影響を受けやすいことを示す。
これらの攻撃を調査するための2つのデータブラインド手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:58:43 GMT)
Bias Amplification: Large Language Models as Increasingly Biased Media [12.4] 大規模言語モデル(LLM)における政治的偏見の増幅を測定するためのベンチマークを導入する。
GPT-2を用いた実証研究により,反復的合成訓練サイクルに対する政治的偏りの持続的および実質的な増大が明らかとなった。
我々は,3つの緩和戦略,オーバーフィッティング,保存,蓄積を評価し,バイアス増幅がモデル崩壊から独立して持続することを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:53:57 GMT)
MirrorShield: Towards Universal Defense Against Jailbreaks via Entropy-Guided Mirror Crafting [12.3] 大規模な言語モデルをジェイルブレイク攻撃から守ることは、安全なデプロイメントを保証する上で不可欠である。
入力の構文構造を反映した動的に生成されたプロンプトである「新しい概念ミラー」を提案する。
新しい防御モデルMirrorShieldが提案され、製造されたミラーに基づいて危険入力を検出し、校正する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:03:24 GMT)
SecCAN: An Extended CAN Controller with Embedded Intrusion Detection [12.1] SecCANは、コントローラのデータパスにIDS機能を組み込む新しいCANコントローラアーキテクチャである。
カスタム量子化された機械学習アクセラレータがIDSエンジンとして開発され、SecCANの受信データパスに組み込まれる。
SecCANは、すべてのCANパケットサイズに対して、CAN受信ウィンドウ内のIDSレイテンシを完全に隠せることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:16:03 GMT)
MAS-KCL: Knowledge component graph structure learning with large language model-based agentic workflow [12.1] 正確なKCグラフは、特定のKC上での学習者の貧弱なパフォーマンスの根本原因を特定するのに役立てることができる。
我々は,大規模言語モデルによって駆動されるマルチエージェントシステムを用いたMAS-KCLというKCグラフ構造学習アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:32:47 GMT)
InstanceBEV: Unifying Instance and BEV Representation for Global Modeling [12.0] Occupancy Grid Mapsは3D空間占有率を表すためにナビゲーションに広く利用されている。
Bird's-Eye View (BEV) の視点は、自動運転のためのより実用的なソリューションを提供する。
本稿では,BEV のインスタンスレベル次元削減手法である InstanceBEV を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:56:50 GMT)
XOXO: Stealthy Cross-Origin Context Poisoning Attacks against AI Coding Assistants [12.0] 本稿では,意味論的に等価なコード修正に依存する新たな攻撃であるPoisoning(XOXO)を提案する。
攻撃で使用されたGPTnet v2を含む11モデルで7572%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:55:59 GMT)
Representation Learning on Out of Distribution in Tabular Data [11.9] 本稿では,標準CPUハードウェア上で効率よく動作する軽量で効率的なソリューションTCLを提案する。
FT-Transformer や ResNet など,TCL が既存のモデルよりも優れていることを示す。
また,本研究では,簡単な実験と可視化によるOODデータの検出と評価の実践的ガイダンスも提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:32:01 GMT)
SDLog: A Deep Learning Framework for Detecting Sensitive Information in Software Logs [11.9] ソフトウェアログの機密情報を識別するためのフレームワークであるSDLogを紹介する。
ターゲットデータセットからの微調整サンプルは100個しかなく、SDLogは99.5%の機密属性と98.4%のF1スコアを正しく識別できる。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:36:13 GMT)
MM-Agent: LLM as Agents for Real-world Mathematical Modeling Problem [11.8] 我々は,Large Language Models (LLMs) を用いた実世界の数学的モデリングのタスクを定式化する。
本稿では,オープンエンド問題解析,構造化モデル定式化,計算問題解決,レポート生成の4つの段階に,モデリングを分解する専門家主導のフレームワークMM-Agentを提案する。
MM-Agentはベースラインエージェントを著しく上回り、人間の専門家ソリューションよりも11.88%改善している。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:55:31 GMT)
An active learning framework for multi-group mean estimation [11.8] 未知のデータ分布を持つ複数のグループを対象とした基礎学習問題について検討する。
本稿では, 分散推定値に拘束される上限値に基づいて群を逐次選択するアルゴリズム, Variance-UCBを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:13:04 GMT)
Learning with Local Search MCMC Layers [11.8] 不正確な解法による学習に理論的に根ざしたアプローチを導入する。
局所探索で使用される問題固有近傍系を提案分布に変換する。
時間窓を用いた大規模動的車両ルーティング問題に対する我々のアプローチを実証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:47:42 GMT)
Learning from Committee: Reasoning Distillation from a Mixture of Teachers with Peer-Review [11.8] ピアリビュー(FAIR)アプローチによる新しいフォールト・アウェア・ディストイレーション(Fact-Aware DistIllation)を導入する。
本手法は,教師から合理性を得るのではなく,教師に生徒の過ちを特定・説明するよう求めている。
本手法は,教師が正しい推理を行う確率を低くする。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:00:01 GMT)
VeRecycle: Reclaiming Guarantees from Probabilistic Certificates for Stochastic Dynamical Systems after Change [11.7] 確率論的神経リプノフ認証は非線形力学系の安全性を証明する強力な手法である。
VeRecycleは、離散時間力学系の保証を正式に再利用する最初のフレームワークである。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:54:19 GMT)
Explainable Prediction of the Mechanical Properties of Composites with CNNs [11.7] 説明可能なAI(XAI)の手法を備えた畳み込みニューラルネットワーク(CNN)が,この問題の解決に有効であることを示す。
提案手法では, 逆張力試験を用いて生成したデータセットに基づいて学習したカスタムCNNを用いて, コンポジットの機械的特性を予測する。
次に、SHAPと統合勾配の2つのポストホックXAI法を用いて予測を説明し、CNNが合成体の挙動に影響を与える重要な幾何学的特徴を用いていることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:54:06 GMT)
NOVA: A Benchmark for Anomaly Localization and Clinical Reasoning in Brain MRI [11.6] 多くの現実世界のアプリケーションでは、デプロイされたモデルは、トレーニング中に見られるデータとは異なる入力に遭遇する。
私たちは、281の稀な病理と異質な取得プロトコルにまたがる、困難で現実的な900ドルの脳MRIスキャンである、NOVA$を提示します。
それぞれのケースには、豊富な臨床物語と、二重盲検の専門家境界ボックスアノテーションが含まれる。
NOVAはトレーニングに使用されないため、アウト・オブ・ディストリビューションの一般化において、$extreme$ stress-testとして機能する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:10:57 GMT)
Redefining Machine Unlearning: A Conformal Prediction-Motivated Approach [11.6] 機械学習は、訓練されたモデルから特定のデータの影響を取り除こうとする。
本稿では,UA と MIA にまたがる誤分類データには,予測セットに基礎的真理ラベルがまだ含まれていないことを明らかにする。
本稿では,記憶品質をより確実に評価する共形予測に着想を得た2つの新しい指標を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:37:51 GMT)
DrugPilot: LLM-based Parameterized Reasoning Agent for Drug Discovery [11.6] DrugPilotは、薬物発見のためのパラメータ化推論を備えた大規模言語モデルである。
薬物発見パイプラインの主要なフェーズをサポートし、研究タスクの自動計画と実行を容易にする。
タスク完了率は98.0%、93.5%、64.0%である。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:18:15 GMT)
Enhancing Keyphrase Extraction from Academic Articles Using Section Structure Information [11.6] 本研究では,入力コーパスとして Title と Abstract を用いた抽出モデルの性能向上を目的とした。
キーワードの意味的豊かさは抽象長によって著しく制約される。
本稿では,学術論文のセクション構造情報から得られた構造的特徴とセクションテキストを利用して,キーフレーズを抽出した。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:57:34 GMT)
TinyV: Reducing False Negatives in Verification Improves RL for LLM Reasoning [11.6] 強化学習(RL)は,大規模言語モデル(LLM)の推論能力を高める強力なツールとなった。
しかし、RLの成功は、検証者によって提供される報酬の信頼性に依存している。
本稿では, 正のモデル出力を誤って拒否する不適切な負の問題を公開し, 解析する。
既存のルールベースの手法を拡張する軽量なLCMベースの検証器である littleV を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:16:44 GMT)
The Hallucination Tax of Reinforcement Finetuning [11.6] 強化微調整(Reinforcement Finetuning, RFT)は、大規模言語モデル(LLM)の推論能力を高めるための標準アプローチとなっている。
我々は, RFT の批判的副作用について検討し, 幻覚税とはすなわち, モデルが幻覚応答を確実に生成する原因となる拒絶行動の悪化について述べる。
以上の結果から,標準RFTトレーニングはモデル拒絶率を80%以上削減できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:36:45 GMT)
Generalized Category Discovery via Token Manifold Capacity Learning [11.5] 一般カテゴリー発見(GCD)は、オープンワールドシナリオにおけるディープラーニングモデルの堅牢性向上に不可欠である。
従来のGCD法はクラスタ内の変動を最小限に抑え、しばしば多様体の容量を犠牲にする。
本稿では,データの多様性と複雑性を維持するために,クラストークンの多様体容量を優先する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:40:31 GMT)
Efficient Fine-Tuning of Quantized Models via Adaptive Rank and Bitwidth [11.5] QLoRAは、低ビット量子化とLoRAを効果的に組み合わせて、大規模言語モデル(LLM)のためのメモリフレンドリーな微調整を実現する。
部分キャリブレーションデータを用いて、各層に対する量子化成分と低ランク空間のランクを共同で探索する、統一的かつ勾配のない戦略である textbfQR-Adaptor を提案する。
提案手法はGSM8Kに対して4.89%の精度向上を実現し、4ビット設定のメモリフットプリントを維持しつつ、16ビットの微調整モデルよりも優れるケースもある。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:31:56 GMT)
Pairwise Evaluation of Accent Similarity in Speech Synthesis [11.5] アクセント類似度に対する主観的評価法と客観的評価法の両方を強化することを目的としている。
我々は、より少ないリスナーと低コストで高い統計的重要性を実現するコンポーネントを追加することで、XABリスニングテストの洗練を図る。
母音フォルマントと音韻後生音との距離に基づいて発音関連指標を用いてアクセント生成を評価する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:23:50 GMT)
Exploring the Effect of Explanation Content and Format on User Comprehension and Trust in Healthcare [11.4] 本稿では,QCancerの予測を説明する際に,説明内容と形式がユーザの理解と信頼にどのように影響するかを検討する。
以上の結果から,Occlusion-1の主観的理解と信頼度がSHAPによる説明よりも高いことが示唆された。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:29:43 GMT)
Cross-Image Contrastive Decoding: Precise, Lossless Suppression of Language Priors in Large Vision-Language Models [11.4] 言語先行は、LVLM(Large Vision-Language Models)における幻覚の主要な原因である
近年の研究では、トレーニング不要なソリューションとして対照的な復号化が検討されているが、これらの手法は通常、元の画像から負の文脈を構成する。
我々は、異なる画像を用いて負の文脈を構築する、シンプルで効果的なトレーニング不要なクロスイメージコントラストデコーディング(CICD)を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:46:11 GMT)
Aligning Attention Distribution to Information Flow for Hallucination Mitigation in Large Vision-Language Models [11.4] セマンティック表現に埋め込まれたコア情報を活用することにより,モデルの視覚的理解を高める。
5種類のLVLMを用いて3つの画像キャプションベンチマークを行い,幻覚の低減効果を実証した。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:10:13 GMT)
Video Compression Commander: Plug-and-Play Inference Acceleration for Video Large Language Models [11.4] ビデオ大言語モデル(VideoLLM)は、ビデオ理解において優れているが、効率の課題に直面している。
プラグアンドプレイ型推論アクセラレーションフレームワーク「ビデオ圧縮コマンド」(VidCom2)を提案する。
各フレームの特異性を定量化することにより、VidCom2はフレーム間の圧縮強度を適応的に調整する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:52:31 GMT)
DeepEyes: Incentivizing "Thinking with Images" via Reinforcement Learning [11.2] DeepEyesは、エンドツーエンドの強化学習を通じてインセンティブを得た、“イメージで考える”機能を備えたモデルである。
本稿では,ツール・ユース指向のデータ選択機構と報奨戦略を提案する。
DeepEyesは、微粒な認識と推論ベンチマークにおいて、大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:48:11 GMT)
Mapping the Minds of LLMs: A Graph-Based Analysis of Reasoning LLM [11.2] 大規模言語モデル(LLM)は、拡張されたChain-of-Thought(CoT)生成を通じて洗練された推論能力を示す。
RLMは、数発のプロンプトによる性能劣化など、直感的で不安定な動作を示すことが多い。
RLMの推論過程をより良くモデル化するための統一的なグラフベース分析フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:54:57 GMT)
HWA-UNETR: Hierarchical Window Aggregate UNETR for 3D Multimodal Gastric Lesion Segmentation [11.2] HWA-UNETRは、学習可能なウィンドウアグリゲーション層を備えたオリジナルのHWAブロックを利用する、新しい3Dセグメンテーションフレームワークである。
我々のフレームワークは、しっかりとした堅牢性を維持しながら、Diceスコアの1.68%まで既存の手法を上回ります。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:23:52 GMT)
Smaller but Better: Self-Paced Knowledge Distillation for Lightweight yet Effective LCMs [11.1] 知識蒸留(KD)は、より大規模で先進的なLCMのプログラミング能力をより小さく、より少ないLCMに転送する、有望なソリューションを提供する。
我々は,軽量で効果的な学生用LCMを開発することを目的とした,SODA(Self-Paced knedge DistillAtion)フレームワークを提案する。
SodaCoderは軽量で効果的なLCMのシリーズで、16Bパラメータ以下で15のLCMを上回ります。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:04:15 GMT)
High-Dimensional Analysis of Bootstrap Ensemble Classifiers [11.1] ブートストラップ法は 機械学習における アンサンブル学習の基盤だった
本稿では,Last Square Support Vector Machine アンサンブルに適用したブートストラップ手法の理論的解析を行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:40:43 GMT)
TxPert: Leveraging Biochemical Relationships for Out-of-Distribution Transcriptomic Perturbation Prediction [11.1] 我々は、複数の生物学的知識ネットワークを活用してOODシナリオ下での応答を予測する新しい最先端手法であるTxPertを提案する。
特に,<i>TxPert</i>,<i>TxPert</i>,<i>TxPert</i>,<i>TxPert</i>,<i>TxPert</i>,<i>TxPert</i>,<i>TxPert</i>。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:13:23 GMT)
Universal Incremental Learning: Mitigating Confusion from Inter- and Intra-task Distribution Randomness [11.1] 増分学習は、新しいタスクを学習しながら、以前のタスクの忘れを克服することを目的としている。
既存のILメソッドは、入ってくるタスクタイプが新しいクラスやドメインだけを増やすと強く仮定します。
We propose a simple yet effective framework for UIL, named $textbfMiCo$。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:04:17 GMT)
Domain Adaptation for Multi-label Image Classification: a Discriminator-free Approach [11.1] 本稿では, DDAMLIC for Unsupervised Image Classification (UDA) と呼ばれる, 識別不能な敵対的アプローチを提案する。
我々は、2成分ガウス混合モデル(GMM)を用いて、ソースとターゲットの予測の両方をモデル化し、2つの異なるクラスタを区別する。
提案するフレームワークは, 完全微分可能であるだけでなく, 標準EM法によって誘導される高価な反復プロセスを回避するため, コスト効率も高い。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:18:20 GMT)
CRAFT: Time Series Forecasting with Cross-Future Behavior Awareness [11.1] 我々はCRAFT(CRoss-Future Behavior Awareness based Time Series Forecasting Method)を提案する。
CRAFTは、キートレンドを抽出するためにクープマン予測モジュール(Koopman Predictor Module)と、クロスフューチャー行動行列の未知領域を補う内部トレンドマイニングモジュール(Innal Trends Mining Module)を使用している。
オフラインの大規模データセットとオンラインA/Bテストの両方の実験は、CRAFTの有効性を実証している。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:00:00 GMT)
Zero-Shot Iterative Formalization and Planning in Partially Observable Environments [11.1] 我々はPDDL表現をゼロショットで形式化し、計画し、成長し、洗練するフレームワークであるPDDLego+を提案する。
PDDLego+は目標達成を達成し,問題複雑性に対する堅牢性を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:53:50 GMT)
RL of Thoughts: Navigating LLM Reasoning with Inference-time Reinforcement Learning [11.0] 我々は、推論時間における推論を適応的に強化するために、強化学習(RL)を用いた軽量ナビゲータモデルを訓練する。
RLナビゲータは3Kパラメータ未満で、100BスケールのLLMに匹敵するサブ10BのLLMを作ることができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:43:33 GMT)
What if Deception Cannot be Detected? A Cross-Linguistic Study on the Limits of Deception Detection from Text [10.9] 著者の主張と真実の信念の相違として, 虚偽を定め, 信念に基づく虚偽の枠組みを導入する。
我々は3つのコーパスを構築し、総称してDeFaBelとよばれる。
これらのコーパスを用いて、一般的に報告されている偽装の言語的手がかりを評価する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:47:45 GMT)
diffDemorph: Extending Reference-Free Demorphing to Unseen Faces [10.9] 本稿では,視覚的忠実度の高い複合形態像から成分像を効果的に切り離す,拡散に基づく新しいアプローチを提案する。
我々の手法は、モーフィック技法やフェイススタイルにまたがる最初の一般化であり、一般的なトレーニングプロトコルの下では、現在の最先端を$geq 59.46%で打ち負かしている。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:48:27 GMT)
Multi-granular body modeling with Redundancy-Free Spatiotemporal Fusion for Text-Driven Motion Generation [10.8] HiSTF Mambaを3つの部分からなるフレームワークとして紹介する: Dual-tial Mamba, Bi-Temporal Mamba, Spatiotemporal Fusion Module (DSFM)。
HumanML3Dベンチマークの実験では、HiSTF Mambaはいくつかの指標でよく機能し、高い忠実さとテキストとモーション間の密接なセマンティックアライメントを実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:29:12 GMT)
CARMA: Enhanced Compositionality in LLMs via Advanced Regularisation and Mutual Information Alignment [10.8] 我々は,大規模言語モデルにおける構成的推論の安定性と堅牢性を高めるために,CARMAを提案する。
CARMAは、特徴の断片化を軽減するために、相互情報の規則化と階層的安定性の制約を用いる。
その結果, CARMAは微調整によって生じる変動を低減し, トークン表現を安定化し, 構成的推論を改善した。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:49:08 GMT)
One-Step Offline Distillation of Diffusion-based Models via Koopman Modeling [10.8] 我々は、クープマン理論に基づく新しいオフライン蒸留手法であるクープマン蒸留モデルKDMを紹介する。
KDMは、学習された線形作用素がそれらを前方に伝播する埋め込み空間にノイズのある入力を符号化し、続いてクリーンなサンプルを再構成するデコーダを符号化する。
KDMは、標準的なオフライン蒸留ベンチマークで最先端のパフォーマンスを達成し、単一の生成ステップでFIDスコアを最大40%改善する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:05:02 GMT)
FMSD-TTS: Few-shot Multi-Speaker Multi-Dialect Text-to-Speech Synthesis for Ü-Tsang, Amdo and Kham Speech Dataset Generation [10.7] FMSD-TTS(FMSD-TTS)は、音声合成フレームワーク。
限られた参照音声と明示的な方言ラベルから並列方言音声を合成する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:35:55 GMT)
Deep activity propagation via weight initialization in spiking neural networks [10.7] Spiking Neural Networks (SNN)は、スパーシリティや超低消費電力といったバイオインスパイアされた利点を提供する。
ディープSNNは、実数値膜電位をバイナリスパイクに量子化することで、情報を処理し、伝達する。
提案手法は, 従来の手法とは異なり, スパイクの損失を伴わずに, 深部SNNにおける活動の伝播を可能にすることを理論的に示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:38:03 GMT)
Adverseness vs. Equilibrium: Exploring Graph Adversarial Resilience through Dynamic Equilibrium [10.6] グラフ分析に対するアドリアック攻撃が注目を集めている。
グラフごとのグラフやグラフニューラルネットの観点から、様々なグラフ敵攻撃に抵抗する2つの対策が提案されている。
本稿では,3つの異なる視点から,上記の研究課題に取り組むことに寄与する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:58:21 GMT)
Evaluation and Facilitation of Online Discussions in the LLM Era: A Survey [10.6] 本稿では, LLM の可能性に着目し, オンライン討論の質を評価・向上する手法について調査する。
本研究は,NLPと社会科学のアイデアを総合し,(a)議論品質評価の新しい分類法,(b)介入・ファシリテーション戦略の概要,(c)会話ファシリテーションデータセットの新しい分類法を提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:13:17 GMT)
MedBrowseComp: Benchmarking Medical Deep Research and Computer Use [10.6] MedBrowseCompは、エージェントが医療事実を検索し、合成する能力を体系的にテストするベンチマークである。
臨床シナリオを反映した1,000以上の人為的な質問が含まれている。
MedBrowseCompをフロンティアエージェントシステムに適用すると、パフォーマンスの欠点が10%も低くなる。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:42:33 GMT)
Automatic Dataset Generation for Knowledge Intensive Question Answering Tasks [10.6] 本稿では,知識集約型QAタスクにおけるLarge Language Models(LLMs)の拡張手法を提案する。
提案システムは,自動QAジェネレータとモデルファインタナーを備え,パープレキシティ,ROUGE,BLEU,BERTScoreを用いて評価する。
実験は、適応型人工知能(AI)システムの開発において、論理的コヒーレンスと事実的精度の改善を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:16:29 GMT)
Benchmarking the Myopic Trap: Positional Bias in Information Retrieval [10.6] 本研究は,Myopic Trapと呼ばれる位置バイアスの特定の形態について検討し,検索モデルが後から現れる関連情報を見越しながら,文書の初期段階に不均等に出席することを示す。
この現象を体系的に定量化するために,既存のNLPデータセットを位置対応ベンチマークに再利用するセマンティックス保存評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:29:01 GMT)
Multi-modal Traffic Scenario Generation for Autonomous Driving System Testing [10.5] TrafficComposerは、自律運転システム(ADS)テストのためのマルチモーダル交通シナリオ構築アプローチである。
CARLAやLGSVLなどのシミュレータで対応するトラフィックシナリオを生成する。
120のトラフィックシナリオのベンチマークでは、TrafficComposerは97.0%の精度を達成し、最高のパフォーマンスのベースラインを7.3%上回っている。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:12:08 GMT)
LMP: Leveraging Motion Prior in Zero-Shot Video Generation with Diffusion Transformer [10.4] ゼロショットビデオ生成のためのLMPフレームワークを提案する。
本フレームワークでは,事前学習した拡散トランスフォーマーの強力な生成機能を活用し,生成した動画の動画をユーザが提供するモーションビデオを参照できるようにする。
提案手法は, 生成品質, 即時ビデオの整合性, 制御能力における最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:18:29 GMT)
Further results on the power-law decay of the fraction of the mixed eigenstates in kicked-top model with mixed-type classical phase space [10.4] 固有状態のフシミ関数を研究するためのアクセス可能なシステムサイズは、文献で報告されているものよりもはるかに大きい可能性があることを示す。
完全にカオス化されたトップでは、平均Wehrlエントロピーの局所化測度が円ユニタリアンサンブルの予測に近づくことが分かる。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:12:26 GMT)
Unlearning Backdoor Attacks for LLMs with Weak-to-Strong Knowledge Distillation [10.4] 特徴アライメント知識の蒸留に基づくバックドアアタックを防御する,新しいアンラーニングアルゴリズムを提案する。
具体的には、まず、クリーンな教師モデルとして機能するフルパラメータの微調整を通して、小規模の言語モデルを訓練する。
そして,この教師モデルは,PEFTを活用したバックドアの学習において,大規模に有毒な学生モデルを導出する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:26:45 GMT)
PlanGPT-VL: Enhancing Urban Planning with Domain-Specific Vision-Language Models [10.4] そこで我々は,都市計画地図に特化して設計された,ドメイン固有の視覚言語モデルであるPlanGPT-VLを紹介した。
PlanGPT-VLは,(1)高品質なVQAデータ合成のためのPlanAnno-Vフレームワーク,(2)構造化検証による幻覚の低減のためのクリティカルポイント思考,(3)スーパーバイザードファインタニングと凍結視覚エンコーダパラメータを組み合わせた総合的なトレーニング手法,の3つの革新的アプローチを採用している。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:14:47 GMT)
Blind Restoration of High-Resolution Ultrasound Video [10.3] 超音波ビデオは、低信号対雑音比(SNR)と限られた解像度に悩まされることが多い。
この研究は、Deep Ultrasound Prior (DUP)と呼ばれる自己教師付き超音波ビデオ超解像アルゴリズムを提示する。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:26:15 GMT)
Online Iterative Self-Alignment for Radiology Report Generation [10.3] 本稿では,ラジオロジーレポート生成(RRG)のための新しいオンライン反復自己アライメント(OISA)手法を提案する。
本手法により,特定の臨床目的に適した各種報告を作成でき,RRGモデル全体の性能を反復的に向上させることができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:49:41 GMT)
SVAFD: A Secure and Verifiable Co-Aggregation Protocol for Federated Distillation [10.2] フェデレート蒸留(FD)用に設計された最初のプロトコルであるSVAFDを提案する。
クライアントとサーバの責務を再定義する。
SVAFDはストラグラーやクライアントの衝突に耐性があり、現実世界のアプリケーションにおける動的ネットワークに適している。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:32:38 GMT)
A Private Approximation of the 2nd-Moment Matrix of Any Subsamplable Input [10.1] 差分プライベートな第2モーメント推定の問題について検討し、強力なプライバシー利用トレードオフを実現する新しいアルゴリズムを提案する。
入力の顕著な割合が外れた場合でも、分布$mathcalD$の2モーメント行列を近似するためにアルゴリズムを適用する方法を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:04:29 GMT)
Neural Inverse Scattering with Score-based Regularization [10.1] 逆散乱は、多くのイメージング応用において基本的な課題である。
そこで本研究では,スコアベース生成モデルで用いられるDenoising score関数を統合した正規化ニューラルフィールド(NF)アプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:19:16 GMT)
RA-Touch: Retrieval-Augmented Touch Understanding with Enriched Visual Data [10.1] 視覚触覚は、テクスチャ、柔らかさ、剛性などの物体の触覚特性を理解することを目的としている。
我々は,触覚のセマンティクスに富んだ視覚データを活用することで,視触覚知覚を改善する検索拡張フレームワークであるRA-Touchを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:23:21 GMT)
How Out-of-Distribution Detection Learning Theory Enhances Transformer: Learnability and Reliability [10.1] 本稿では,変圧器のOOD検出確率近似(PAC)理論を紹介する。
条件下での十分なデータで、アウトリーチを正確に表現し、区別できることが示される。
このアプローチは、学習可能性を確保し、インレーヤとアウトレーヤの間の決定境界を洗練する新しいアルゴリズムをもたらす。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:15:17 GMT)
Gradient Leakage Defense with Key-Lock Module for Federated Learning [10.1] Federated Learning(FL)は、プライバシ保護機械学習アプローチとして広く採用されている。
最近の発見は、プライバシーが侵害され、共有勾配から機密情報が回収される可能性があることを示している。
秘密鍵ロックモジュールを用いて任意のモデルアーキテクチャをセキュアにするための新しい勾配リーク防御手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:58:37 GMT)
A Separable Self-attention Inspired by the State Space Model for Computer Vision [10.0] Mambaは線形計算複雑性を持つ効率的な状態空間モデルである。
近年の研究では、状態空間モデルとアテンション変種の間には、豊富な理論的な関係があることが示されている。
本稿では,マンバの優れた設計概念を分離可能な自己注意に導入した新しい自己注意法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:01:55 GMT)
Diffusion based Semantic Outlier Generation via Nuisance Awareness for Out-of-Distribution Detection [9.9] アウト・オブ・ディストリビューション(OOD)検出は、最近、合成OODデータセットによるトレーニングを通じて有望な結果を示している。
本稿では, 難解な外乱を生じさせる新しいフレームワークであるセマンティック外乱生成手法(SONA)を提案する。
提案手法はSONAガイダンスを取り入れ,IDサンプルの意味領域とニュアンス領域を分離的に制御する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:58:55 GMT)
Evaluating Privacy-Utility Tradeoffs in Synthetic Smart Grid Data [9.9] 4つの合成データ生成手法の比較評価を行った。
我々は,分類ユーティリティ,流通忠実度,プライバシリークを評価した。
これらの知見は、プライバシ保護、データ駆動型エネルギーシステムを開発するための構造化生成モデルの可能性を強調している。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:46:29 GMT)
Quaff: Quantized Parameter-Efficient Fine-Tuning under Outlier Spatial Stability Hypothesis [9.9] Quaffは、大規模言語モデルのための量子化されたパラメータ効率の微調整フレームワークである。
軽量な操作を使用して、排他的な不変チャネルを抑える。
1.73倍のレイテンシ削減を実現し、30パーセントのメモリ節約を実現している。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:19:36 GMT)
Neural Video Compression with Context Modulation [9.9] 本稿では、時間的文脈を基準フレームで2段階に調整することで、制限に対処する。
従来の H.266/VVC よりも平均 22.7% の削減を実現し,従来の NVC DCVC-FM よりも平均 10.1% の削減を実現した。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:57:09 GMT)
Learning Spatio-Temporal Dynamics for Trajectory Recovery via Time-Aware Transformer [9.8] 現実世界の応用では、GPSトラジェクトリはサンプリングレートが低く、連続する点の間に大きく不規則な間隔があることが多い。
本稿では,軌道サンプリング率の向上をめざして,地図制約のトラジェクトリリカバリの課題に対処する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:09:17 GMT)
FineEdit: Unlock Instruction-Based Text Editing for LLMs [9.8] FineEditは、コンテキスト対応のテキスト修正のために明示的に訓練された特殊な編集モデルである。
FineEditはシングルターン編集で最先端のモデルより優れており、Llama-3.2-3Bより30%も上回り、Mistral-7B-OpenOrcaのパフォーマンスを40%以上上回っている。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:27:30 GMT)
Privacy Preserving Conversion Modeling in Data Clean Room [9.8] 本稿では,ユーザのプライバシの嗜好や広告主の要求に固執しつつ,CVR予測の課題に対処する。
従来の手法では、広告主がセンシティブな変換データを共有できないなどの障害に直面している。
広告プラットフォームとサンプルレベルの勾配を共有することなく協調的なモデルトレーニングを可能にする新しいモデルトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:38:50 GMT)
TiEBe: Tracking Language Model Recall of Notable Worldwide Events Through Time [9.7] グローバルなイベントと地域的なイベントを中心に,23,000以上の質問応答ペアからなるデータセットであるTiEBeを提示する。
これらのイベントは、LLMのグローバルおよび地域開発に対する理解を評価するためのベンチマークを構築するために使用される。
以上の結果から,よりバランスの取れたグローバル表現の必要性を強調した。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:09:53 GMT)
MicroCrypt Assumptions with Quantum Input Sampling and Pseudodeterminism: Constructions and Separations [9.7] 量子暗号プリミティブの2つの自然な緩和について検討する。
1つ目は、ランダムに一様にサンプリングされるのではなく、量子アルゴリズムによって入力が生成される量子入力サンプリングである。
2つ目の緩和である $bot$-pseudodeterminism は、入力の逆多項式分数に対して出力を特別な記号 $bot$ にすることで決定論の要求を緩和する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:57:04 GMT)
Sense and Sensitivity: Examining the Influence of Semantic Recall on Long Context Code Reasoning [9.7] 本稿では,大規模リポジトリ内のコードスニペットに対するLLM(Large Language Models)推論能力について検討する。
我々は語彙的コードリコール (verbatim search) と意味的コードリコール (remembering the code does) を区別する。
我々は,コードスニペットが入力コンテキストの中央に近づくと,コード推論の精度が大幅に低下することを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:45:55 GMT)
Fusing Cross-Domain Knowledge from Multimodal Data to Solve Problems in the Physical World [9.6] ドメイン間の知識融合は現実世界の問題を解決するのに不可欠である。
ドメイン層,リンク層,モデル層,データ層からなる4層フレームワークを提案する。
このフレームワークにより、ドメイン間マルチモーダルデータを効果的に融合するエンドツーエンドのソリューションを設計できる。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:59:34 GMT)
Improved Classical Shadow Tomography Using Quantum Computation [9.6] 古典的シャドウトモグラフィー(英語版)(CST)は、量子観測器の集合の結果を予測するために、量子測定によって未知の状態の古典的な記述を得る。
本稿では,空間の複雑さを指数関数的に低減し,CSTの実行時間を2次的に改善する新しいCST手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:28:46 GMT)
Scaling Vision Mamba Across Resolutions via Fractal Traversal [9.6] Hilbert曲線によるフラクタルベースのパッチシリアライゼーションを活用するビジョンバックボーンであるFractalMamba++を提案する。
高解像度入力における長距離依存性の減少に対処するため,大域的文脈伝搬を促進するクロスステート(CSR)機構を導入する。
イメージ分類、セマンティックセグメンテーション、オブジェクト検出、変更検出の実験は、FractalMamba++が以前のMambaベースのバックボーンを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:08:28 GMT)
Cost-Augmented Monte Carlo Tree Search for LLM-Assisted Planning [9.5] Cost-Augmented Monte Carlo Tree Search (CATS)は、LCM誘導計画に明確なコスト認識をもたらす新しいアプローチである。
GPT-4.1、Claude-3.7-Sonnet、DeepSeek-R1などの上位LCMをCATSプランナに対してベンチマークし、コスト感受性のシナリオで性能を評価する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:43:33 GMT)
DIFF: Dual Side-Information Filtering and Fusion for Sequential Recommendation [9.5] Side-information Integrated Sequential Recommendation (SISR) は、隠れたユーザの好みを推測する補助アイテム情報から恩恵を受ける。
既存の研究では、アイテムシーケンス内のノイズ信号の除去に失敗し、SISRのポテンシャルを過小評価している。
本稿では、周波数ベースノイズフィルタリングと二重多重系列融合を用いた新しいSISRモデルDual Side-Information Filtering and Fusion(DIFF)を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:13:53 GMT)
Enhancing Epidemic Forecasting: Evaluating the Role of Mobility Data and Graph Convolutional Networks [9.5] 本研究は,機械学習アルゴリズムと疫学応用とのギャップに対処する。
まず、パイロットスタディを通じてモビリティデータの重要性を評価し、次に、トランスフォーマーバックボーンに対するグラフ畳み込みネットワーク(GCN)の影響を評価する。
以上の結果から, 移動データとGCNモジュールは予測性能を著しく向上させるものではないが, 死亡率と入院率のデータはモデル精度を著しく向上させることが明らかとなった。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:23:18 GMT)
ZenFlow: Enabling Stall-Free Offloading Training via Asynchronous Updates [9.4] ZeRO-Offloadのような既存のオフロードトレーニングフレームワークは、すべてのパラメータを均等に扱い、CPU上で完全なモデルを更新する。
我々は、重要なパラメータを優先し、GPUとCPU間の更新を分離する新しいオフロードフレームワークであるZenFlowを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:37:11 GMT)
On the Utility of Accounting for Human Beliefs about AI Intention in Human-AI Collaboration [9.4] 我々は、人間がどのように解釈し、AIパートナーの意図を判断するかを捉える人間の信念のモデルを開発する。
私たちは、人間と対話するための戦略を考案する際に、人間の行動と人間の信念の両方を取り入れたAIエージェントを作成します。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:22:09 GMT)
Breaking Language Barriers in Visual Language Models via Multilingual Textual Regularization [9.3] 本稿では,視覚的インストラクションチューニング中にテキストのみの多言語データを注入する連続多言語統合戦略を提案する。
本手法は,視覚能力の低下を伴わない言語間の言語忠実度を著しく向上させる。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:29:41 GMT)
GraphemeAug: A Systematic Approach to Synthesized Hard Negative Keyword Spotting Examples [9.3] Spoken Keyword Spotting (KWS) は、音声におけるキーワードの存在と欠如を区別するタスクである。
本稿では,キーワードのグラフに挿入/削除/置換を編集することで,決定境界に近い逆例を生成する手法を提案する。
本手法は, 音声データの品質を保ちながら, 合成硬質負のデータセット上でのAUCを61%向上させることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:24:31 GMT)
A Few Large Shifts: Layer-Inconsistency Based Minimal Overhead Adversarial Example Detection [9.3] 我々は、ターゲットモデル自体の内部の階層的不整合を利用して、軽量なプラグイン検出フレームワークを導入する。
本手法は, 計算オーバーヘッドを無視し, 正確さを損なうことなく, 最先端検出性能を実現する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:22:29 GMT)
MAATS: A Multi-Agent Automated Translation System Based on MQM Evaluation [9.3] MAATSは複数の専門的なAIエージェントを採用しており、それぞれが独自のMQMカテゴリに焦点を当てている。
特に意味的正確性、局所的適応、言語学的に離れた言語対において優れている。
モジュールエージェントの役割を解釈可能なMQM次元に合わせることで、MAATSはブラックボックスLLMと人間の翻訳のギャップを狭める。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:29:05 GMT)
AfroXLMR-Social: Adapting Pre-trained Language Models for African Languages Social Media Text [9.3] ドメイン適応型プレトレーニング(DAPT)とタスク適応型プレトレーニング(TAPT)は、このバイアスを減らすために一般的なテクニックである。
AfriSocialは、アフリカの複数の言語で継続的な事前トレーニングを行うための、大規模ソーシャルメディアおよびニュースドメインコーパスである。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:35:47 GMT)
AutoRev: Automatic Peer Review System for Academic Research Papers [9.3] AutoRevは学術研究論文の自動ピアレビューシステムである。
私たちのフレームワークは学術文書をグラフとして表現し、最も重要なパスの抽出を可能にします。
レビュー生成に適用すると、平均58.72%のSOTAベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:59:58 GMT)
Out-of-Distribution Generalization of In-Context Learning: A Low-Dimensional Subspace Perspective [9.2] 低ランクな共分散行列でパラメータ化された線形回帰タスクを研究することにより、ICL(In-context Learning)のアウト・オブ・ディストリビューション能力をデミステライズする。
単層線形アテンションモデルが角度に依存しないテストリスクを生じさせることを証明し、ICLがそのような分布シフトに対して堅牢でないことを示す。
これは、トランスフォーマーのOOD一般化能力は、実際にトレーニング中に遭遇したタスクの範囲内にある新しいタスクに由来する可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:15:49 GMT)
Learning to Integrate Diffusion ODEs by Averaging the Derivatives [9.2] この作業は、ODE統合を学習することで、パフォーマンスとコストのバランスをとる中間戦略を提示します。
この損失は、段差を緩やかにセカントまで伸ばすことによって行われるので、セカント・ロスと呼ばれる。
EDMのセカントバージョンはCIFAR-10で2.14ドル、SiT-XL/2のセカントバージョンは2.27ドルである。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:30:38 GMT)
MTVCrafter: 4D Motion Tokenization for Open-World Human Image Animation [9.2] MTVCrafterは、人間の画像アニメーションのための生の3Dモーションシーケンスをモデル化する最初のフレームワークである。
2Dレンダリングされたポーズ画像と比較して、4Dモーショントークンはより堅牢な時間的手がかりを提供する。
MTVCrafterは様々なスタイルやシナリオで様々なオープンワールドキャラクター(シングル/複数、フル/半ボディ)を一般化する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:20:41 GMT)
Multi-modal Collaborative Optimization and Expansion Network for Event-assisted Single-eye Expression Recognition [9.2] 我々は,MCO-Eネット(Multi-modal Collaborative Optimization and Expansion Network)を提案する。
MCO-Eネットは、MCO-Mamba(MCO-Mamba)とHeterogeneous Collaborative and Expansion Mixture-of-Experts(HCE-MoE)の2つの革新的な設計を導入した。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:03:45 GMT)
Causal Cartographer: From Mapping to Reasoning Over Counterfactual Worlds [9.2] 因果世界モデルは、関心のある環境に関する反現実的な疑問に答えることができる。
事象の連鎖の背後にある根本原因を理解し、未知の分布に対する因果推論を行う必要がある。
提案手法は推論コストと素早い相関を低減しつつ因果知識を抽出できることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:14:05 GMT)
SpaceJAM: a Lightweight and Regularization-free Method for Fast Joint Alignment of Images [9.1] 教師なしの関節アライメントは、高複雑性、幾何学的歪み、局所的あるいは大域的最適性への収束といった課題によって特徴づけられる。
本稿では,JA タスクに効率と簡易さで対処する新しいアプローチである SpaceJAM について紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:50:53 GMT)
A Probabilistic Perspective on Model Collapse [9.1] 本研究の目的は,モデル崩壊の発生条件と,その緩和方法である。
軽度条件下では,モデルの崩壊を防止するために,各トレーニングステップにおけるサンプルサイズを徐々に増加させる必要があることを厳格に示す。
また, 合成データを用いた学習が, 実データのみを用いた学習よりも優れるモデルを生み出す可能性についても検討した。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:25:29 GMT)
SensorLLM: Human-Intuitive Alignment of Multivariate Sensor Data with LLMs for Activity Recognition [9.1] 本稿では,Large Language Models(LLM)がウェアラブルセンサデータからHAR(Human Activity Recognition)を実現するためのフレームワークであるSensorLLMを紹介する。
多様なHARシナリオにまたがる人間の直感的なセンサテキストペアの質問応答データセットであるSensorQAを構築した。
その結果,SensorLLMは人間の直感的アライメントによって誘導され,多様なHAR設定にまたがる効果的なセンサ学習者,推論者,分類者となることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:16:44 GMT)
OSoRA: Output-Dimension and Singular-Value Initialized Low-Rank Adaptation [9.0] 大規模言語モデル(LLM)のための新しいPEFT法であるOSoRAを提案する。
OSoRAは、微調整中にトレーニング可能なパラメータの数を最小化することで、計算リソースの要求を大幅に削減する。
数学的推論、常識推論、その他のベンチマークの総合的な評価は、OSoRAが最先端の手法と同等または優れた性能を達成していることを示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:34:06 GMT)
Dual Decomposition of Weights and Singular Value Low Rank Adaptation [9.0] 重み行列を大きさと方向成分に分解する新しいアプローチであるDuDeを提案する。
評価の結果,MMLUでは48.35%,GSM8Kでは62.53%(pm$1.59)の精度が得られた。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:49:15 GMT)
Physics-Driven Local-Whole Elastic Deformation Modeling for Point Cloud Representation Learning [9.0] 本稿では,点クラウド表現のための物理駆動型自己教師型学習手法を提案する。
我々は、暗黙の場の幾何学的モデリング能力と物理駆動の弾性変形を統合したデュアルタスク・エンコーダ・デコーダ・フレームワークを用いる。
実験結果から,本手法はオブジェクト分類,少数ショット学習,セグメンテーションにおいて,既存の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:48:32 GMT)
The Limits of Graph Samplers for Training Inductive Recommender Systems: Extended results [9.0] 我々は、グラフベースのレコメンデータシステム、すなわち、データを異種ネットワークとしてモデル化するシステムに焦点を当てる。
他の応用では、グラフサンプリングはサブグラフを研究し、その結果を元のグラフに一般化することができる。
トレーニングデータの50%しか使用せず,最大86%のトレーニング時間でパフォーマンスを維持できることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:47:56 GMT)
Monotonic Learning in the PAC Framework: A New Perspective [8.9] 学習アルゴリズムの実際の性能を近似する理論的リスク分布を構築した。
我々はこの理論分布が標本サイズが大きくなるにつれて単調性を示すことを厳密に証明する。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:56:29 GMT)
Tailoring Synthetic Gauge Fields in Ultracold Atoms via Spatially Engineered Vector Beams [8.9] 本稿では、VBを介する内部状態のカップリングにより、超低温原子中の合成ストライプ場を生成する新しい手法を提案する。
我々の研究は、量子制御とエキゾチックな量子状態と位相の探索のための強力なツールとしてVBを確立した。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:02:34 GMT)
Plane Geometry Problem Solving with Multi-modal Reasoning: A Survey [8.9] 平面幾何学的問題解決(PGPS)は近年,大規模視覚言語モデルのマルチモーダル推論能力を評価するベンチマークとして注目されている。
PGPSへの関心が高まりつつあるにもかかわらず、研究コミュニティはPGPSの最近の研究を体系的に合成する包括的な概要を欠いている。
我々はまず,PGPS手法をエンコーダ・デコーダ・フレームワークに分類し,それらのエンコーダとデコーダが使用する出力形式を要約する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:27:17 GMT)
Provable Execution in Real-Time Embedded Systems [8.8] 実時間システム(PEARTS)のための実行可能アーキテクチャの開発
PEARTSは、コモディティ組み込みリアルタイムオペレーティングシステム(FreeRTOS)と一緒に直接デプロイできる最初のPoXシステムである。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:31:13 GMT)
TelePlanNet: An AI-Driven Framework for Efficient Telecom Network Planning [8.8] 基地局の選定は5Gネットワーク計画において重要な課題である。
既存のAIツールは、特定の面で効率が向上しているにもかかわらず、動的ネットワーク条件を満たすのに依然として苦労している。
基地局選択に適したAI駆動型フレームワークであるTelePlanNetを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:19:10 GMT)
Debate Only When Necessary: Adaptive Multiagent Collaboration for Efficient LLM Reasoning [8.8] 大規模言語モデル(LLM)の推論能力を高めるための,有望なフレームワークとして,マルチエージェントコラボレーションが登場した。
本稿では,エージェントの初期応答の信頼性スコアに基づいて,議論を選択的に活性化する適応型マルチエージェント討論フレームワークであるDebate Only When Necessary (DOWN)を提案する。
ダウンは最大6倍の効率向上を実現し、既存のメソッドのパフォーマンスを保留する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:17:15 GMT)
Rethink the Role of Deep Learning towards Large-scale Quantum Systems [8.8] ハミルトンの3つのファミリーにわたる従来の機械学習アプローチに対して、ディープラーニングモデルをベンチマークする。
結果から,MLモデルは全てのタスクにおいてDLアプローチに匹敵する,あるいはそれ以上のパフォーマンスが得られることが判明した。
これらの知見は、多くの量子システム学習シナリオにおいて、現在のDLモデルの必要性に挑戦する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:55:52 GMT)
FedGraM: Defending Against Untargeted Attacks in Federated Learning via Embedding Gram Matrix [8.7] Federated Learning (FL)は、地理的に分散したクライアントが、ローカルモデルのみを共有することで、機械学習モデルを協調的にトレーニングすることを可能にする。
FLは、基盤となるデータ分散上でのグローバルモデルのパフォーマンスを低下させることを目的とした、未ターゲットの攻撃に対して脆弱である。
FLにおける未標的攻撃に対する防御を目的とした,新たなロバストアグリゲーション手法であるFedGraMを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:26:54 GMT)
Harnessing the Universal Geometry of Embeddings [8.6] 本稿では,テキスト埋め込みを1つのベクトル空間から別のベクトル空間に変換する最初の手法を提案する。
我々の翻訳は、異なるアーキテクチャ、パラメータ数、トレーニングデータセットを持つモデルペア間で高いコサイン類似性を実現する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:38:41 GMT)
SurvUnc: A Meta-Model Based Uncertainty Quantification Framework for Survival Analysis [8.4] 生存分析は、多くの現実世界の応用、特に医療やリスクアセスメントのような高度な領域において基礎となる。
多くの生存モデルが進歩しているにもかかわらず、予測の不確実性の定量化は未熟で困難なままである。
生存モデルのためのポストホック不確実性定量化のための新しいメタモデルベースのフレームワークであるSurvUncを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:12:20 GMT)
On the Generalizability of Foundation Models for Crop Type Mapping [8.3] 自己教師付き学習を用いて事前訓練された基礎モデルは、強力な伝達学習能力を示している。
SSL4EO-S12, SatlasPretrain, ImageNetの3つの一般的なEO基盤モデルを, 5つの作物分類データセットで評価した。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:13:09 GMT)
Automated Quality Evaluation of Cervical Cytopathology Whole Slide Images Based on Content Analysis [8.3] ThinPrep Cytological Test (TCT) は頸部がん検診において最も広く用いられている方法であり, 検診の精度に直接影響を及ぼす。
従来の手作業による評価手法は、顕微鏡下での病理学者の観察に依存している。
The Bethesda System (TBS) の診断基準, 人工知能アルゴリズム, 臨床データの特徴に基づく, 頸椎細胞病理全スライド画像(WSI)の完全自動品質評価手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:30:38 GMT)
Addressing the Current Challenges of Quantum Machine Learning through Multi-Chip Ensembles [8.3] 本稿では,これらのハードルを体系的に克服するマルチチップアンサンブルVQCフレームワークを提案する。
より小さく、独立に動作する量子チップのアンサンブル間の高次元計算により、我々のアプローチは明らかにバレンプラトーを緩和し、一般化を促進し、追加の緩和オーバーヘッドを伴わずに量子エラーバイアスと分散の両方を同時に減少させる。
これにより、標準的なベンチマークや現実世界のPhyloNet EEGデータセットで検証されているような、大規模なデータの堅牢な処理が可能になる。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:56:53 GMT)
MGStream: Motion-aware 3D Gaussian for Streamable Dynamic Scene Reconstruction [8.2] MGStreamはモーション関連の3Dガウス(3DG)を使用して、静的な動作のために動的およびバニラ3DGを再構築する。
MGStreamは、レンダリング品質、トレーニング/ストレージ効率、時間的一貫性の観点から、既存の3DGSベースのアプローチを超越している。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:26:14 GMT)
Unforgettable Lessons from Forgettable Images: Intra-Class Memorability Matters in Computer Vision [8.2] クラス内の特定の画像が他のクラスよりも記憶可能なクラス内記憶性を導入する。
画像提示の時間間隔を計算に組み込んだ新しい指標であるICMscore(Intra-Class Memorability score)を提案する。
Intra-Class Memorability dataset (ICMD) をキュレートし、2000人の参加者の回答から得られたICMスコアを用いて10のオブジェクトクラスに5,000以上の画像を含む。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:01:29 GMT)
Enhancing Gradient-based Discrete Sampling via Parallel Tempering [8.2] 勾配に基づく離散サンプリング器は、高次元のマルチモーダル離散分布において局所的なミニマに閉じ込められやすい。
我々は、並列テンパリング(レプリカ交換としても知られる)と離散ランゲヴィン提案を組み合わせた離散ランゲヴィン提案を開発する。
我々は,本アルゴリズムが非漸近的に目標エネルギーに収束し,単一鎖よりも高速な混合を示すことを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:41:48 GMT)
Fine-Grained Uncertainty Quantification via Collisions [8.2] クラス衝突率を用いて衝突行列を定義する。
K$ クラスを含む分類問題に対して、$Ktimes K$ 衝突行列 $S$ は各クラスを区別する固有の困難さを測る。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:03:47 GMT)
Don't Half-listen: Capturing Key-part Information in Continual Instruction Tuning [8.1] キーパート情報ゲイン(KPIG)に基づく新しい連続的命令チューニング手法を提案する。
本手法は,マスク部分の情報ゲインを計算し,データを動的に再生し,トレーニング対象を洗練させる。
実験により,本手法は観察タスクと保留タスクの両方において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:56:06 GMT)
Building Reuse-Sensitive Control Flow Graphs (CFGs) for EVM Bytecode [8.1] Esuerは、再利用に敏感なCFGを構築する際に、コードの再利用を動的に識別するツールである。
99.94%の実行トレースカバレッジと97.02%のF1スコアを達成し、再利用コードの正確な識別を行う。
Esuer が tx.origin や reentrancy などの脆弱性の特定を支援し、それぞれ 99.97% と 99.67% の F1 スコアを達成した。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:42:06 GMT)
Enforcing Hard Linear Constraints in Deep Learning Models with Decision Rules [8.1] 本稿では、入力依存線形等式とニューラルネットワーク出力の不等式制約を強制するモデルに依存しないフレームワークを提案する。
このアーキテクチャは、予測精度のために訓練されたタスクネットワークと、実行時の決定ルールと堅牢な最適化を用いてトレーニングされた安全なネットワークを組み合わせることで、入力空間全体の実現可能性を保証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:09:44 GMT)
DeepForest: Sensing Into Self-Occluding Volumes of Vegetation With Aerial Imaging [8.1] リモートセンシングの長期的限界は、深い天蓋層に深く浸透する。
現在、LiDARとレーダーは3D植生構造を測定するための主要な選択肢と考えられている。
我々のアプローチは、森林のような自己排他的な植生の量を感知することを可能にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:05:04 GMT)
Towards Omnidirectional Reasoning with 360-R1: A Dataset, Benchmark, and GRPO-based Method [8.0] 我々は,最初のデータセットであるOmniVQAを導入し,全方向視覚質問応答のための最初のベンチマークを行う。
最先端MLLMの評価結果から,全方向視覚質問応答の処理における限界が明らかとなった。
本研究ではQwen2.5-VL-Instructに基づく規則に基づく強化学習手法である360-R1を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:55:26 GMT)
A Survey on Future Frame Synthesis: Bridging Deterministic and Generative Approaches [8.0] Future Frame Synthesis (FFS) は、既存のコンテンツに条件付けされた将来のフレームシーケンスを生成することに焦点を当てている。
この調査は、一般的に使用されるデータセットと代表アルゴリズムをカバーする、FFSに関する既存の研究の包括的なレビューを提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:34:20 GMT)
RoMath: A Mathematical Reasoning Benchmark in Romanian [7.8] 本稿では,3つのサブセットからなるルーマニアの数学的推論ベンチマークスイートであるRoMathを紹介する。
独特な言語特徴を持つ低リソース言語であるルーマニア語に焦点を当てることで、RoMathはアングロ中心モデルの限界に対処する。
いくつかのオープンウェイト言語モデルをベンチマークし、表現不足言語のためのリソースを作成することの重要性を強調した。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:54:49 GMT)
Adaptive Sentencing Prediction with Guaranteed Accuracy and Legal Interpretability [7.7] 本稿では, 固有な法的解釈性を提供する, 飽和メカニスティック・センテンシング(SMS)モデルを提案する。
また,このモデルに対応する最小モメンタム平均平方(MLMS)適応アルゴリズムについても紹介する。
我々は、既知のパラメータのケースで設計した最良の予測器による予測精度の最良の上限を提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:06:00 GMT)
Understanding and Detecting Peer Dependency Resolving Loop in npm Ecosystem [7.7] npmは特別なタイプの依存性、Peer Dependencyをサポートし、インストールと使用は通常の依存関係とは異なる。
ピア依存関係間の衝突は、npmクライアントを無限ループにトラップし、リソースの枯渇とシステムクラッシュにつながる。
本稿は, npm 生態系における PeerSpin の理解と検出を行うための, 詳細な研究である。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:11:01 GMT)
SAFEPATH: Preventing Harmful Reasoning in Chain-of-Thought via Early Alignment [7.7] SAFEPATHは, LRMを微調整して, その推論の開始時に, 短時間で8個の安全プライマーを出力する軽量アライメント手法である。
実験の結果,SAFEPATHは推論性能を維持しながら有害な出力を効果的に減少させることが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:54:54 GMT)
GATES: Cost-aware Dynamic Workflow Scheduling via Graph Attention Networks and Evolution Strategy [7.7] コスト対応の動的スケジューリング(CADWS)はクラウドコンピューティングにおける重要な課題である。
深部強化学習(DRL)は、自動スケジューリングポリシー設計に広く用いられている。
本研究では,グラフアテンションネットワークに基づくポリシーネットワークと,GATESと呼ばれる進化戦略を組み合わせた新しいDRL手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:15:11 GMT)
GSDFuse: Capturing Cognitive Inconsistencies from Multi-Dimensional Weak Signals in Social Media Steganalysis [7.6] ソーシャルメディアプラットフォームは、悪意のある言語的ステガノグラフィーを促進し、重大なセキュリティリスクを生じさせる。
GSDFuseはこれらの障害を体系的に克服するために設計された新しい手法である。
ソーシャルメディアデータセットの実験では、高度なステガノグラフィーを特定する上でGSDFuseの最先端(SOTA)のパフォーマンスが示されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:07:42 GMT)
PandaGuard: Systematic Evaluation of LLM Safety in the Era of Jailbreaking Attacks [7.3] 大きな言語モデル(LLM)は目覚ましい能力を達成したが、ジェイルブレイクとして知られる敵のプロンプトに弱いままである。
LLMの安全性研究への取り組みが増えているにもかかわらず、既存の評価はしばしば断片化され、単独の攻撃や防御技術に焦点が当てられている。
PandaGuardはLLMジェイルブレイクの安全性を攻撃者、ディフェンダー、および審査員で構成されるマルチエージェントシステムとしてモデル化する、統一的でモジュール化されたフレームワークである。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:14:57 GMT)
CtrlDiff: Boosting Large Diffusion Language Models with Dynamic Block Prediction and Controllable Generation [7.3] 拡散ベースの言語モデルは、強力な並列生成機能と固有の編集性のために、魅力的な代替手段として登場した。
ローカルセマンティクスに基づいて各生成ブロックのサイズを適応的に決定する動的かつ制御可能な半自動回帰フレームワークであるCtrlDiffを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:52:41 GMT)
Any-to-Any Learning in Computational Pathology via Triplet Multimodal Pretraining [7.2] ALTERは、WSI、ゲノム学、病理学のレポートを統合した、トリモーダルな事前トレーニングフレームワークである。
WSI中心のアプローチを超えて、堅牢でクロスプラットフォームな表現を学びます。
ALTERは生存予測,癌サブタイプ,遺伝子変異予測,報告生成など,幅広い臨床課題にまたがって評価を行った。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:57:58 GMT)
Enhanced Multimodal Aspect-Based Sentiment Analysis by LLM-Generated Rationales [7.1] 既存の方法は、画像とテキストの両方からアスペクトや感情に関連する情報を集めるために、事前訓練された小さな言語モデル(SLM)に依存している。
我々は,SLMの意思決定能力とMABSAのためのLLMが提供する付加情報を組み合わせた新しいフレームワークLRSAを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:28:26 GMT)
On-Demand Scenario Generation for Testing Automated Driving Systems [7.1] リスクレベルが異なる多様なシナリオを生成するために,オンデマンドシナリオ生成フレームワーク(OSG)を提案する。
OSGは現実世界のトラフィックデータセットから学び、リスクレベルを定量的に制御するためにリスク強度レギュレータを使用している。
リスクレベルの事故タイプを比較することで,OSGの必要性を実証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:55:36 GMT)
4D-ROLLS: 4D Radar Occupancy Learning via LiDAR Supervision [7.1] 我々は,LiDAR点雲を監視信号として用いた4Dレーダの4D-ROLLSを提案する。
モデルは、下流タスクのBEVセグメンテーションとポイントクラウド占有率予測にシームレスに転送される。
この軽量ネットワークにより、4D-ROLLSモデルは4060 GPUで約30Hzの高速な推論速度を実現することができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:12:44 GMT)
Self Supervised Correlation-based Permutations for Multi-View Clustering [7.1] 汎用データ型のためのエンドツーエンドのディープラーニングに基づくマルチビュークラスタリングフレームワークを提案する。
提案手法は,新しい置換に基づく正準相関目標を用いた有意義な融合表現を生成する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:02:03 GMT)
RISC-Q: A Generator for Real-Time Quantum Control System-on-Chips Compatible with RISC-V [7.0] 本稿では,Quantum Control System-on-Chip(QCSoC)設計のためのオープンソースのフレキシブルジェネレータRISC-Qを紹介する。
RISC-Qは, 既存のQCSoCの性能を再現し, 開発労力を大幅に削減できることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:54:14 GMT)
FlowQ: Energy-Guided Flow Policies for Offline Reinforcement Learning [7.0] 本稿では,フローモデルのトレーニングを強化する新しいアプローチである,エネルギー誘導型フローマッチングを導入する。
FlowQは、エネルギー誘導型フローマッチングに基づくオフライン強化学習アルゴリズムである。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:43:05 GMT)
ServerlessLoRA: Minimizing Latency and Cost in Serverless Inference for LoRA-Based LLMs [6.9] 現在のサーバレスは、LLM(General Large Language Model)を効果的に利用できますが、LoRA(Lo-Rank Adaptation)推論では失敗します。
これらの非効率さは、大量のGPUの浪費、TTFT(Time-to-First-Token)の増加、高い金銭的コストをもたらす。
より高速で安価なLoRA LLMサービス用に設計されたサーバーレス推論システムであるServerlessLoRAを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:04:17 GMT)
ClapFM-EVC: High-Fidelity and Flexible Emotional Voice Conversion with Dual Control from Natural Language and Speech [6.8] ClapFM-EVCは、自然言語のプロンプトや、調整可能な感情強度を持つ参照音声によって駆動される高品質な変換音声を生成することができる新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:34:29 GMT)
Universal Acoustic Adversarial Attacks for Flexible Control of Speech-LLMs [6.8] 音声のLLMに対するユニバーサルアコースティック・アタックについて検討する。
Qwen2-AudioとGranite-Speechには重大な脆弱性がある。
これは、より堅牢なトレーニング戦略の必要性を強調し、敵の攻撃に対する抵抗を改善している。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:35:59 GMT)
Hypothesis on the Functional Advantages of the Selection-Broadcast Cycle Structure: Global Workspace Theory and Dealing with a Real-Time World [6.8] 本稿では,グローバルワークスペース理論(GWT)による選択・放送サイクル構造の機能的優位性について論じる。
それは、動的でリアルタイムなシナリオにおける人工知能とロボティクスの適用性に焦点を当てている。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:07:21 GMT)
A Path to Universal Neural Cellular Automata [6.8] この研究は、連続的なユニバーサルセルオートマトンを開発するための神経細胞オートマトンの可能性を探究する。
本稿では, セルラーオートマトンモデル, 目的関数, トレーニング戦略を導入し, 連続した環境での普遍計算に向けて神経セルオートマトンを誘導する。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:12:51 GMT)
Imitation Learning via Focused Satisficing [6.7] 模倣学習は、いくつかの固定された、しかし未知のコスト関数に従って、デモが最適に近いと仮定する。
提案手法は,既存の模倣学習手法よりも高品質な実演を模倣する政策に焦点を当てていることを実験的に示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:36:52 GMT)
Leveraging Multivariate Long-Term History Representation for Time Series Forecasting [6.7] MTS予測のためのLMHR(Long-term Multivariate Representation)というフレームワークを提案する。
LMHRは、長期の歴史をセグメントレベルの文脈表現にエンコードし、ポイントレベルのノイズを低減する。
急速に変化するパターンのトップ10%で予測精度を9.8%向上させる。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:46:36 GMT)
Sequential QCQP for Bilevel Optimization with Line Search [6.6] 双レベル最適化は階層構造を伴い、1つの問題がもう1つの問題にネストされ、レベル間の複雑な相互依存性をもたらす。
低レベル最適条件の近似満足度を常に保証する単一ループチューニングフリーアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:35:38 GMT)
DecIF: Improving Instruction-Following through Meta-Decomposition [6.5] DecIFは、多種多様な高品質の命令追従データを生成する、完全に自律的でメタ分解誘導フレームワークである。
命令生成のために,LLMは様々なメタ情報を反復的に生成し,応答制約と組み合わせて意味的にリッチな命令を生成するように誘導する。
応答生成のために、各命令を原子レベルの評価基準に分解し、厳密な検証と不正確な命令応答対の除去を可能にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:38:28 GMT)
Making Robust Generalizers Less Rigid with Loss Concentration [6.5] シャープネスを意識した最小化手法は、画像分類タスクに成功している。
このような戦略が、難易度がより極端になるようなより単純なモデルでどのように劇的に崩壊するかを示す。
損失集中度を低下させる訓練基準を提案し,評価する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:22:56 GMT)
Collaborative Unlabeled Data Optimization [6.5] 本稿では,ラベルなしデータの有用性を最大化するための新しいデータ中心パラダイムを開拓する。
ラベルのないデータを配布し、公開可能なタスクに依存しないモデルを活用することで、CoOptはスケーラブルで再利用可能な、持続可能なトレーニングパイプラインを促進します。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:21:40 GMT)
Preference Learning with Lie Detectors can Induce Honesty or Evasion [6.5] 嘘検出器は誤認行動を正確に分類できるが、訓練パイプラインでは一般的には使用されない。
学習方針が真に正直なのか、それとも偽りの検知器を騙すことを学ぶのかを検証する。
オフ・ポリシー・アルゴリズム(DPO)は、現実的なTPRに対して25%未満の偽造率をもたらす。
論文参考訳(メタデータ) (Tue, 20 May 2025 00:31:53 GMT)
Time Reversal Symmetry for Efficient Robotic Manipulations in Deep Reinforcement Learning [6.5] 時間反転対称性(英: Time Reversal symmetric)は、ドアの開閉や閉鎖といったロボット工学のタスクでよく見られる時間対称性の一種である。
本稿では,時間反転対称性向上型深層強化学習(TR-DRL)を提案する。
RobosuiteベンチマークとMetaWorldベンチマークの大規模な実験は、TR-DRLがシングルタスクとマルチタスクの両方で有効であることを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:40:49 GMT)
Super-Resolution Optical Coherence Tomography Using Diffusion Model-Based Plug-and-Play Priors [6.5] 角膜計測から高画質画像の再構成を行うために,プラグアンドプレイ拡散モデル(DM-DM)に基づくOCT超解像フレームワークを提案する。
提案手法は逆問題として定式化され, シャースチェーンモンテカルロサンプリングを併用して効率的な再構成を行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:09:26 GMT)
FlashKAT: Understanding and Addressing Performance Bottlenecks in the Kolmogorov-Arnold Transformer [6.4] Kolmogorov-Arnold Network (KAN) は多層パーセプトロン (MLP) の代替として人気を集めている。
Group-Rational Kan (GR-KAN) は、計算コストの増大とトレーニングの不安定性のため、桁違いに遅くなる可能性がある。
我々は,再構造化されたカーネル上に構築されたFlashKATを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:48:46 GMT)
Enhancing Abstractive Summarization of Scientific Papers Using Structure Information [6.4] 本稿では,学術論文における構造的機能の自動認識を活用する2段階の抽象的要約フレームワークを提案する。
第1段階では,多くの学術論文から章題を標準化し,構造関数認識のための大規模データセットを構築した。
第2段階では、Longformerを用いて、セクション間のリッチなコンテキスト関係をキャプチャし、コンテキスト対応の要約を生成する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:34:45 GMT)
When Algorithms Play Favorites: Lookism in the Generation and Perception of Faces [6.4] 本稿では, 合成顔と機械学習に基づく性別分類アルゴリズムが, アルゴリズム的ルックリズムの影響について検討する。
テキスト・トゥ・イメージ(T2I)システムは、顔の魅力と、知性や信頼性といった無関係なポジティブな特徴を関連付ける傾向がある。
性別分類モデルは、特に非白人女性の間で「魅力のない」顔により高いエラー率を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:21:51 GMT)
Interpretable Reinforcement Learning for Load Balancing using Kolmogorov-Arnold Networks [6.4] 強化学習(RL)は、ロードバランシングなどのネットワーク制御問題にますます適用されてきた。
既存のRLアプローチは、しばしば解釈可能性の欠如と制御方程式の抽出の難しさに悩まされる。
本稿では,ネットワーク制御におけるRLの解釈にKAN(Kolmogorov-Arnold Networks)を用いることを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:56:31 GMT)
How Managers Perceive AI-Assisted Conversational Training for Workplace Communication [6.3] 本研究では,マネージャがコミュニケーションスキルの向上を支援する上で,AIが果たす役割について考察する。
我々は、AIを使ってコミュニケーションスキルを実践するマネージャの予測方法を理解するために、会話型ロールプレイシステムであるCommCoachを機能的プローブとして設計した。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:51:27 GMT)
EGFormer: Towards Efficient and Generalizable Multimodal Semantic Segmentation [6.3] EGFormerは効率的なマルチモーダルセマンティックセグメンテーションフレームワークである。
任意の数のモダリティを柔軟に統合し、モデルパラメータと推論時間を著しく削減する。
最大88%のパラメータが減少し、50%のGFLOPが削減される。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:08:49 GMT)
Cross-Lingual Optimization for Language Transfer in Large Language Models [6.3] 大規模言語モデルを他の言語に適応させるには、標準的なアプローチとして教師付き微調整(SFT)を用いるのが一般的である。
我々は,英語能力を維持しつつ,英語中心のLLMを対象言語に効率的に転送するtextbfCross-Lingual Optimization (CLO)を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:45:09 GMT)
KeyDiff: Key Similarity-Based KV Cache Eviction for Long-Context LLM Inference in Resource-Constrained Environments [6.2] KeyDiffは、キー類似性のみに基づくトレーニング不要なKVキャッシュ消去手法である。
キー多様性とアテンションスコアを関連付けることにより,キーディフの理論的基礎を提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:50:11 GMT)
Addressing the Challenges of Planning Language Generation [6.2] 我々は,500億パラメータ未満のオープンソースモデルを用いて,PDDL生成パイプラインを8種類設計し,評価する。
その結果,高リソース言語ラッパーや文法付き制約付き復号法などの直感的な手法は性能を低下させるが,解法や計画検証器からのフィードバックによる修正などの推論時間スケーリング手法は性能を2倍以上に抑えることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:25:23 GMT)
JOLT-SQL: Joint Loss Tuning of Text-to-SQL with Confusion-aware Noisy Schema Sampling [6.2] 本稿では,ノイズの多いスキーマ情報に対してロバスト性を実現するための単一ステージフレームワークJOLT-nativeを提案する。
JOLT-nativeは、混乱を意識したノイズの多いスキーマサンプリング戦略とともに、局所的な双方向の注意によって強化された差別的スキーマリンクを採用している。
SpiderとBIRDベンチマークの実験では、JOLTネイティブが最先端の実行精度を達成し、トレーニングと推論の効率を大幅に改善した。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:55:10 GMT)
ModRWKV: Transformer Multimodality in Linear Time [6.0] この研究は、マルチモーダルコンテキストにおけるモダンなRNNアーキテクチャの機能について考察する。
本稿では,RWKV7アーキテクチャ上に構築されたModRWKV-aデカップリング型マルチモーダルフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:34:36 GMT)
Benchmarking Critical Questions Generation: A Challenging Reasoning Task for Large Language Models [6.0] 批判的質問生成(CQs-Gen)は、システムの前提となる仮定を明らかにする質問生成を可能にすることによって、批判的思考を促進することを目的としている。
この領域への関心が高まっているにもかかわらず、適切なデータセットと自動評価基準の欠如によって進歩が妨げられている。
本稿では,本課題に対するシステムの開発とベンチマークを支援するための包括的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:15:19 GMT)
Exploring Causes of Representational Similarity in Machine Learning Models [6.0] この研究は、データセットの重複とタスクの重複という2つの因果関係が、下流モデルの類似性にどのように影響するかを考察する。
データセットの重複の探索は、大規模な生成AIモデルが、スクラップしたインターネットデータのデータセットに重複してトレーニングされることの多い現実に動機付けられている。
両者は高い表現的類似性と正に相関し、それらを組み合わせることで最も強い効果が得られます。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:03:11 GMT)
Information-theoretically secure quantum timestamping with one-time universal hashing [6.0] 古典的なタイムスタンププロトコルは、セキュリティに対する計算的な仮定に依存しており、量子攻撃に対して脆弱である。
量子鍵を用いた一時間普遍ハッシュに基づく情報理論的に安全な量子タイムスタンピングプロトコルを提案する。
我々のプロトコルは情報理論のセキュリティと高効率を同時に実現し、任意の長さの文書に対して安全なタイムスタンプを可能にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:46:15 GMT)
Can LLM-based Financial Investing Strategies Outperform the Market in Long Run? [6.0] 大規模言語モデル(LLM)は、資産価格のタスクや株式取引アプリケーションに利用されており、AIエージェントが非構造化の財務データから投資決定を生成することができる。
我々は、より長い期間にわたるタイミングベースの戦略とより大きなシンボルの宇宙を評価するバックテストフレームワークであるFINSABERを提案し、それらの一般化性と堅牢性を批判的に評価する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:51:24 GMT)
ProMind-LLM: Proactive Mental Health Care via Causal Reasoning with Sensor Data [6.0] メンタルヘルスのリスクは、世界の公衆衛生にとって重要な課題である。
大規模言語モデル(LLMs)の開発により、それらは説明可能な精神医療応用のための有望なツールであることが注目されている。
本稿では、主観的心的記録と相補的な情報として客観的行動データを統合する革新的なアプローチであるProMind-LLMを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:36:28 GMT)
Anomaly Detection Based on Critical Paths for Deep Neural Networks [5.9] 本研究では、ディープニューラルネットワーク(DNN)から臨界経路を抽出する新しいアプローチについて検討する。
まず、遺伝子進化と突然変異による重要な検出経路を同定する。
従来手法と比較すると,本手法は性能に優れるだけでなく,精度の高い広範囲の異常型の検出にも適していると考えられる。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:10:59 GMT)
A new approach to locally adaptive polynomial regression [5.9] 本稿では,$ell_$-penalized回帰の最適基準に着想を得た新しい帯域幅選択手法を提案する。
帯域幅選択法に基づいて局所回帰手法の非適応的リスク境界を求める。
上記の局所適応度が持つ各ケースにおいて、大域的チューニングパラメータの理想的な選択が1つ存在することを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:35:23 GMT)
Transfer Learning from Visual Speech Recognition to Mouthing Recognition in German Sign Language [5.9] この研究は、音声言語において、口語インスタンスを対応する単語に直接分類する。
ドイツ語手話における視覚音声認識から音声認識への変換学習の可能性について検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 00:15:51 GMT)
Substrate Effect on Electronic Band Structure and Topological Property in Monolayer V2O3 Magnetic Topological Insulator [5.9] V2O3ベースのファンデルワールス(vdW)基板は量子異常ホール(QAH)状態を実現するための有望なプラットフォームを提供する。
我々は、h-BNなどの非磁性基板がチャーン数C = 1でQAH相を保ち、隙間のないキラルエッジ状態を維持することを示す。
強磁性基板は余分な電子を誘導し、フェルミ準位をシフトすることでトポロジカル秩序を破壊する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:03:48 GMT)
Reachability Barrier Networks: Learning Hamilton-Jacobi Solutions for Smooth and Flexible Control Barrier Functions [5.8] 制御バリア関数(CBF)は、一般的な制御フレームワークに安全保証を付加する一般的な方法である。
物理インフォームドニューラルネットワーク(PINN)を用いて,ハミルトン・ヤコビ最適制御解の計算によりCBFのスムーズな近似を生成する。
我々は、RBNは低次元において非常に正確であり、高次元における標準的な神経CBFアプローチよりも安全であることを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:30:21 GMT)
Dual-Balancing for Physics-Informed Neural Networks [5.8] 偏微分方程式(PDE)を解くための新しい学習パラダイムとして、物理情報ニューラルネットワーク(PINN)が登場した。
PINNは、難解な多目的最適化の問題のため、精度が悪く、収束が遅い。
本稿では,バランシングとイントラバランシングを統合し,損失重みを動的に調整する新しいDual-Balanced PINN(DB-PINN)を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:56:21 GMT)
Probing BERT for German Compound Semantics [5.8] 本稿では,事前学習したドイツ語 BERT が名詞複合意味論の知識をエンコードする範囲について検討する。
我々は、初期の層で最も容易に回復可能な構成性情報を持つ、英語における同等の先行研究に匹敵する傾向を観察する。
私たちの最強の成果は、英語で報告されたものよりも明らかに遅れており、ドイツ語で本来よりも難しいタスクであることを示唆しています。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:36:17 GMT)
AUTOLAW: Enhancing Legal Compliance in Large Language Models via Case Law Generation and Jury-Inspired Deliberation [5.7] AutoLawは、ドメイン固有の大規模言語モデル(LLM)のための新しい違反検出フレームワークである。
LLMの法的コンプライアンスを強化するために、敵対的なデータ生成と陪審に触発された審議プロセスを組み合わせる。
本研究は, 法的不一致を適応的に調査し, 信頼性の高い文脈対応の判断を下すフレームワークの能力を強調した。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:09:13 GMT)
Empathy Detection from Text, Audiovisual, Audio or Physiological Signals: A Systematic Review of Task Formulations and Machine Learning Methods [5.7] 共感の検出は、社会、医療、教育に潜在的な応用がある。
広範かつ重複するトピックであるにもかかわらず、機械学習を利用した共感検出の道はいまだに探索されていない。
本稿では,近年の進歩と,ロバストな共感検出システム構築に向けた課題について概説する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:40:42 GMT)
Large Language Model-Driven Distributed Integrated Multimodal Sensing and Semantic Communications [5.6] 本稿では,新しい大規模言語モデル (LLM) による分散分散マルチモーダルセンシングとセマンティックコミュニケーションフレームワークを提案する。
具体的には、RFモジュールとカメラモジュールを備えた複数の協調センシング装置で構成されている。
Genesis シミュレーションエンジンにより生成された合成多視点RF-視覚データセットの評価結果から,LLM-DiSAC が良好な性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:00:00 GMT)
HICD: Hallucination-Inducing via Attention Dispersion for Contrastive Decoding to Mitigate Hallucinations in Large Language Models [5.6] 大規模言語モデル(LLM)は、しばしば幻覚を生成し、文脈的に不正確または事実的に不正確な出力を生成する。
我々は,幻覚を緩和する対照的な復号法として,幻覚を誘導する新しい手法HICDを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:19:52 GMT)
Extracting topological orders of generalized Pauli stabilizer codes in two dimensions [5.6] 本稿では,2次元システムにおける変換不変な一般化されたパウリ安定化符号から位相データを抽出するアルゴリズムを提案する。
このアルゴリズムは$mathbbZ_d$ quditsに適用される。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:33:37 GMT)
Spin relaxation in a single-electron bilayer graphene quantum dot [5.6] スピン軌道結合による単一電子二層グラフェン量子ドットのスピン緩和について検討した。
スピン緩和は、ボンド長変化および変形ポテンシャル機構を介して音響フォノンの放出を補助する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:58:01 GMT)
Towards Explaining Deep Neural Network Compression Through a Probabilistic Latent Space [5.5] 本稿では, DNN重みの確率的潜在空間を活用する理論的枠組みを提案し, ネットワーク空間の最適性を説明する。
ネットワーク内のレイヤのAP3/AP2特性と性能との間には関係があることを実証する。
我々は,圧縮ネットワークの学習過程を説明する理論的解析を行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:50:21 GMT)
Can Pruning Improve Reasoning? Revisiting Long-CoT Compression with Capability in Mind for Better Reasoning [5.5] Prune-on-LogicはLong-CoTをロジックグラフに変換するフレームワークである。
プルーニング検証のステップが一貫した精度向上をもたらすことが判明した。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:38:32 GMT)
Attributional Safety Failures in Large Language Models under Code-Mixed Perturbations [5.5] LLMは、単言語英語のプロンプトと比較して、コードミックスプロンプトから安全でない出力を生成する。
本稿では,この現象を誘発するメカニズムを解明する,新たな実験的知見を提示する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:05:03 GMT)
Rethinking Oversmoothing in Graph Neural Networks: A Rank-Based Perspective [5.5] ランクベースのメトリクスが常に過剰なスムースを捉えるのに対して、エネルギーベースのメトリクスは失敗することが多いことを示す。
特に,エネルギー指標が変化しないシナリオにおいても,ランクの大幅な低下が性能劣化と密接に一致していることが明らかになった。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:43:44 GMT)
SCAN: Semantic Document Layout Analysis for Textual and Visual Retrieval-Augmented Generation [5.5] テキストおよび視覚的検索・拡張生成(RAG)システムを強化した新しいアプローチであるSCANを提案する。
SCANは、ドキュメントを連続的なコンポーネントをカバーする一貫性のある領域に分割する、粗い粒度のセマンティックアプローチを使用する。
英語と日本語のデータセットを対象とした実験の結果、SCANの適用により、エンドツーエンドのRAG性能が最大9.0%向上し、ビジュアルRAG性能が最大6.4%向上することが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:03:24 GMT)
HausaNLP: Current Status, Challenges and Future Directions for Hausa Natural Language Processing [5.5] Hausaは、世界で1億2000万の第一言語(L1)と8000万の第二言語(L2)を持つ低リソース言語である。
本稿では,Hausa NLPの現状を概観し,既存の資源,研究コントリビューション,基本的なNLPタスク間のギャップを体系的に検討する。
アクセシビリティを高め、さらなる開発を促進するために、データセット、ツール、研究成果を集約する、キュレートされたカタログであるHausaNLPを紹介します。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:59:55 GMT)
Sharper Risk Bound for Multi-Task Learning with Multi-Graph Dependent Data [5.4] 既存の一般化解析では、Emphsub-Optimal risk bound of $O(frac1sqrtn)$, where $n$は各タスクのトレーニングサンプルの数である。
本稿では,新たなベネット型不等式を提案し,よりシャープなリスク境界である$O(fraclog nn)$を導出する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:04:11 GMT)
Secure Order Based Voting Using Distributed Tallying [5.4] 電子投票システムの主な課題の1つは、計算結果がキャスト投票と一致していることを示すことである。
本稿では,秩序に基づく投票規則によって規制された選挙のためのセキュアな投票プロトコルを提案する。
我々のプロトコルは、集計タスクを複数の独立した集計業者に分散させ、完全な投票秘密を提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:01:03 GMT)
Weak Pareto Boundary: The Achilles' Heel of Evolutionary Multi-Objective Optimization [5.4] WPB$は、多目的進化アルゴリズムに深刻な課題をもたらす。
それはアルゴリズムを誤解して、支配に抵抗するソリューションを見つけるかもしれない。
これらの課題に包括的に対処できる既存のMOEAは存在しない。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:58:00 GMT)
RoboFAC: A Comprehensive Framework for Robotic Failure Analysis and Correction [5.4] VLA(Vision-Language-Action)モデルは、最近、自然言語命令と画像情報を逐次制御アクションに変換することによって、ロボット操作を進化させた。
これらのモデルは、専門家によるデモンストレーションの成功を主に訓練し、障害回復の限られた能力を示すため、オープンワールドシナリオではパフォーマンスが劣ることが多い。
この問題に対処するためのロボット故障解析・補正フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:16:05 GMT)
Quantum Optimization via Gradient-Based Hamiltonian Descent [5.3] そのようなアルゴリズムの1つ、Quantum Hamiltonian Descent (QHD)は、サドルベースのミニマから逃れるために量子トンネルを達成する。
勾配に基づくQHDを組み込んだQHDの拡張を提案する。
勾配に基づくQHDの高速収束と大域的解の同定の可能性は著しく増大する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:55:52 GMT)
NBDI: A Simple and Effective Termination Condition for Skill Extraction from Task-Agnostic Demonstrations [5.3] そこで本稿では,状態対応モジュールを通じて決定点を識別する,シンプルで効果的な終了条件を提案する。
我々のアプローチであるNBDI(Novety-based Decision Point Identification)は、複雑で長期のタスクにおいて、以前のベースラインよりも優れている。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:44:56 GMT)
A Challenge to Build Neuro-Symbolic Video Agents [5.2] ニューロシンボリック・パースペクティブは、どのように解釈可能性を高め、構造化推論を可能にし、システム行動に対するより強力な保証を提供するかを示す。
我々は,次世代のインテリジェントビデオエージェントの開発という,研究コミュニティに大きな課題を提示する。
これらの柱に対処することで、受動的知覚から、推論、予測、行動を行うインテリジェントなビデオエージェントへの移行が可能になります。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:53:21 GMT)
FALCON: False-Negative Aware Learning of Contrastive Negatives in Vision-Language Pretraining [5.2] 我々は、ハードと偽の負のトレードオフのバランスをとる学習ベースのミニバッチ構築戦略であるFALCONを提案する。
FALCONは、ミニバッチ構築中に各アンカーインスタンスの適切な硬さの負のサンプルを動的に選択する負のマイニングスケジューラを使用している。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:33:43 GMT)
SEPS: A Separability Measure for Robust Unlearning in LLMs [5.1] 機械学習は大規模言語モデル(LLM)から対象とする知識を選択的に除去することを目的としている
既存の未学習のメトリクスは、クエリが独立して現れることはめったにない、現実世界のシナリオをキャプチャできない。
我々は,クエリの忘れと保持の両方を統一的な学習目標に統合する戦略であるMixed Prompt(MP)アンラーニングを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:53:32 GMT)
Whitened Score Diffusion: A Structured Prior for Imaging Inverse Problems [5.0] ホワイトドスコア拡散モデル(WS)は、標準スコアではなくホワイトドスコア関数を学習する微分方程式に基づく新しいフレームワークである。
WS DMは任意のガウス雑音に対する流れマッチングと等価性を確立し、帰納バイアスを調整し、構造的雑音を伴う逆問題を撮像するための強力なベイズ先行を与える。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:28:03 GMT)
RETRO: REthinking Tactile Representation Learning with Material PriOrs [4.9] 触覚表現学習プロセスに素材認識の先行性を導入する。
これらの先行は、異なる材料に特有の事前学習特性を表しており、モデルが表面テクスチャのニュアンスをよりよく捉え、一般化することができる。
提案手法は,多様な材料やテクスチャにまたがって,より正確で,文脈的にリッチな触覚フィードバックを可能にし,ロボット工学や触覚フィードバックシステム,材料編集などの実世界のアプリケーションの性能を向上させる。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:06:19 GMT)
The Strawberry Problem: Emergence of Character-level Understanding in Tokenized Language Models [4.9] 大きな言語モデル(LLM)は、基本的制限であるトークン化のため、文字を単語にカウントするといった単純な文字レベルのタスクで一貫して失敗する。
サブワードモデルの帰納的優位性を保ちながら文字レベルの推論を大幅に改善する軽量なアーキテクチャ修正を提案する。
その結果,トークン化LMにおける低レベルの知覚ギャップを橋渡しし,それらの構造的盲点の理解と緩和のための原則的枠組みを提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:25:17 GMT)
SuperMapNet for Long-Range and High-Accuracy Vectorized HD Map Construction [4.9] 長距離および高精度なベクトル化HDマップ構築のためのSuperMapNetを提案する。
入力にはカメライメージとLiDARポイントクラウドの両方を使用し、最初にカメライメージからのセマンティック情報とLiDARポイントクラウドからの幾何学的情報とを密に結合する。
nuScenesとArgoverse2データセットの実験では、SOTAが14.9/8.8 mAPと18.5/3.1 mAPを超え、ハード/イージーな設定で優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:06:22 GMT)
Dynamic Replanning for Improved Public Transport Routing [4.9] 公共交通機関のルーティングにおける動的計画問題の定式化を行う。
ユーザが手動でリプランをリクエストする"プル"アプローチと,サーバが積極的に経路を監視し,調整する"プッシュ"アプローチの2つの方法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:50:58 GMT)
Mixed Signals: Understanding Model Disagreement in Multimodal Empathy Detection [4.9] 単調・多モーダル予測が分岐する症例について検討した。
我々の分析は、一つのモードにおける支配的なシグナルが、他人がサポートしていないときに融合を誤解させる可能性があることを示唆している。
これらの洞察的位置不一致は、困難な事例を特定し、共感システムの堅牢性を改善するのに有用な診断信号である。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:25:02 GMT)
WebNovelBench: Placing LLM Novelists on the Web Novel Distribution [4.9] WebNovelBenchは、長文の新規生成を評価するために特別に設計された新しいベンチマークである。
我々は、4000以上の中国のウェブ小説のデータセットを活用し、シンボシー・ツー・ストーリー・ジェネレーション・タスクとしてのフレーミング評価を行った。
スコアはPrincipal Component Analysisを使って集約され、人間が作成した作品に対してパーセンタイルのランクにマップされる。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:32:28 GMT)
OATS: Outlier-Aware Pruning Through Sparse and Low Rank Decomposition [4.8] 入力埋め込みにおける第2モーメント情報を利用してモデル重みをスパース行列とローランク行列の和に分解する,OATSという大形変圧器の圧縮手法を提案する。
OATSは、Llama-3やPhi-3のような大型言語モデルやViTやDINOv2のようなビジョントランスフォーマーで最大60%の価格でモデルを圧縮する際に、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:06:00 GMT)
GemMaroc: Unlocking Darija Proficiency in LLMs with Minimal Data [4.8] オープンソースの大型言語モデル(LLMs)は依然としてモロッコのアラビア語(ダリヤ)を疎外している
我々は、厳格に品質を優先したアライメント戦略が、流線型Darijaを表面化できることを示します。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:38:42 GMT)
The Energy Cost of Reasoning: Analyzing Energy Usage in LLMs with Test-time Compute [4.8] 大規模言語モデル(LLM)のスケーリングは大幅な進歩を遂げているが、リターンの低下とエネルギー需要の増大に直面している。
この研究は、従来のスケーリング戦略を補完するものとして、推論中に追加の計算資源を割り当てるテスト時間計算(TTC)を導入している。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:35:59 GMT)
MUSS: Multilevel Subset Selection for Relevance and Diversity [4.8] レコメンデーションシステムでは、さまざまなレコメンデーションを提供しながら、関連する項目を選択することに興味がある。
本稿では,このタイプの問題を解析するための新しい理論的アプローチを提案し,その手法が最適目的の定数係数近似を実現することを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:43:34 GMT)
On-Device LLM for Context-Aware Wi-Fi Roaming [4.8] 無線LAN(Wi-Fi)におけるローミングは、動的モバイル環境におけるシームレスな接続を維持する上で重要な課題である。
デバイス上での大規模言語モデル(LLM)の最初のクロス層利用について紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:45:18 GMT)
Safety Subspaces are Not Distinct: A Fine-Tuning Case Study [4.7] 安全関連行動が特定の部分空間に集中しているかを検討する。
安全を選択的に支配する部分空間の証拠は見つからない。
これは、サブスペースベースの防御が基本的な制限に直面していることを示唆している。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:41:49 GMT)
ABBA: Highly Expressive Hadamard Product Adaptation for Large Language Models [4.7] 大規模な言語モデルは、幅広いタスクにわたって強力なパフォーマンスを示してきましたが、それらを新しいドメインに効率的に適用することは、依然として重要な課題です。
ABBAは、独立に学習可能な2つの低ランク行列のアダマール積として更新を再パラメータ化する新しいPEFTアーキテクチャである。
以前の作業とは対照的に、ABBAは事前訓練された重量からアップデートを完全に切り離し、両方のコンポーネントを自由に最適化できる。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:43:25 GMT)
NovelHopQA: Diagnosing Multi-Hop Reasoning Failures in Long Narrative Contexts [4.7] NovelHopQAは、83の長編小説から64k-128k区切り抜かれた抜粋に対してk1-4ホップQAを評価する最初のベンチマークである。
キーワード誘導パイプラインは、コヒーレントなストーリーラインに接したホップトケンチェーンを構築する。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:54:37 GMT)
ContextAgent: Context-Aware Proactive LLM Agents with Open-World Sensory Perceptions [4.7] 最初のコンテキスト対応プロアクティブエージェントであるContextAgentを紹介する。
ContextAgentは、ウェアラブル上の大量の感覚知覚から、まず多次元のコンテキストを抽出する。
次に、履歴データからの知覚コンテキストとペルソナコンテキストを活用して、積極的なサービスの必要性を予測する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:55:25 GMT)
Towards Efficient Multi-Scale Deformable Attention on NPU [4.7] Ascend NPUアーキテクチャ上でMSDAのメモリアクセスと計算戦略を再考する共同設計手法を提案する。
我々の実装は、効率的なフォワード計算とバックワード計算の両方をサポートし、トレーニングワークロードに完全に適応し、ハードウェア対応最適化のスイートを組み込んでいます。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:25:23 GMT)
LogicQA: Logical Anomaly Detection with Vision Language Model Generated Questions [4.6] 異常検出(AD)を強化するフレームワークであるLogicQAを紹介する。
LogicQAは自動生成された質問をチェックリストにコンパイルし、論理的制約の違反を特定するために応答を収集する。
我々は,AUROCが87.6%,F1-maxが87.0パーセント,異常が説明されるとともに,公開ベンチマークであるMVTec LOCO AD上でのSOTA(State-of-the-art) Logical ADのパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:11:08 GMT)
From Weak Labels to Strong Results: Utilizing 5,000 Hours of Noisy Classroom Transcripts with Minimal Accurate Data [4.6] 弱教師付き事前訓練(Weakly Supervised Pretraining)は、2段階のプロセスである。
以上の結果から,WSP が代替手法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:50:28 GMT)
Predicting Turn-Taking and Backchannel in Human-Machine Conversations Using Linguistic, Acoustic, and Visual Signals [4.6] 210時間以上の人間会話ビデオの収集と注釈付けが可能な自動データ収集パイプラインを提案する。
約20Mフレームから1.5Mワードと対応するターンテイクおよびバックチャネルアノテーションを含むマルチモーダル・フェイス・ツー・フェイス・データセットを構築した。
本稿では,マルチモーダル信号からターンテイクおよびバックチャネル動作の確率を予測するエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:59:31 GMT)
AKRMap: Adaptive Kernel Regression for Trustworthy Visualization of Cross-Modal Embeddings [4.5] クロスモーダル埋め込みはマルチモーダルモデルの基盤となる。
PCAやt-SNEのような伝統的な次元還元(DR)技術は、複数のモードでメトリクスを組み込むことができない。
AKRMap(AKRMap)は、モーダルな埋め込み距離を精度良く可視化する新しいDR技術である。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:52:03 GMT)
Better Neural Network Expressivity: Subdividing the Simplex [4.5] 2つの隠蔽層を持つReLUニューラルネットワークは、5つの入力の最大関数を正確に表現できることを示す。
我々の構成は、十進分数を持つReLUネットワークの特別な場合において、Averkov, Hojny, and Merkert (ICLR'25) の下界の $lceillog_3(n)rceil$ にほぼ一致する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:23:57 GMT)
Subquadratic Algorithms and Hardness for Attention with Any Temperature [4.2] 任意の温度に対する高速な注意が可能である場合の特徴と特徴付けを行う。
アルゴリズムの大幅な改善はありそうにない。
特に、$d = 2Theta(log* n)$ であっても、attention は $n2 - o(1)$time under $mathsfSETH$ を必要とする。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:12:43 GMT)
Language Models Optimized to Fool Detectors Still Have a Distinct Style (And How to Change It) [4.1] 機械文検出器の性能を劣化させるために,どの言語モデルを最適化できるかを検討する。
モデルがスタイリスティックな検出器に最適化されているとしても、検出性能は驚くほど影響を受けていない。
我々は,従来の特徴を用いた検出を回避しつつ,人間の筆記機械の特徴空間間のギャップを埋めることを目的とした,新たなアプローチを探求する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:55:44 GMT)
Entropic Diagram Characterization of Quantum Coherence: Degenerate Distillation and the Maximum Eigenvalue Uncertainty Bound [4.1] 不整合操作下での全ての資源理論公理を満たす多種多様なコヒーレンス測度スイートを導入する。
この統一的アプローチは、フォン・ノイマン=ツァリスエントロピー空間における物理的に実現可能な状態の幾何学的境界を明らかにする。
本研究では, エントロピーに基づく不確実性関係を, マゼン=ウフィンク境界を精製して, 異なる測定基準をまたいだ最大の固有値を求めることにより強化する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:45:08 GMT)
Uplift modeling with continuous treatments: A predict-then-optimize approach [4.1] アップリフトモデリングの目標は、どのエンティティが治療を受けるべきかを決定することで、特定の成果を最適化するアクションを推奨することである。
アップリフトモデリングは通常二項処理に重点を置いているが、現実の多くのアプリケーションは連続的に評価された処理によって特徴づけられる。
本稿では,揚力モデリングにおける連続的な処理を可能にする予測型最適化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:29:24 GMT)
MultiTab: A Comprehensive Benchmark Suite for Multi-Dimensional Evaluation in Tabular Domains [4.1] 我々は,多次元データ認識分析のためのベンチマークスイートと評価フレームワークであるMultiTabを提案する。
集約されたモデルのみを比較するのではなく、MultiTabは主要なデータ特性に沿って、196の公開データセットを分類する。
分析の結果、モデルの性能はそのような状況に非常に敏感であることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:00:43 GMT)
BigReg: An Efficient Registration Pipeline for High-Resolution X-Ray and Light-Sheet Fluorescence Microscopy [4.1] BigRegは、XRMとLSFMデータの大量登録のために設計された、高速で2段階のパイプラインである。
重要なミクロ構造、特にXRMのラグナとLSFMの骨細胞は正確に整列しており、骨粗しょう症の病理学に対する前例のない洞察を与えている。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:52:35 GMT)
CAD-Coder: An Open-Source Vision-Language Model for Computer-Aided Design Code Generation [4.1] 本稿では、ビジュアル入力から直接編集可能なCADコード(CadQuery Python)を生成するために、明示的に微調整されたオープンソースのVision-Language Model(VLM)であるCAD-Coderを紹介する。
163k以上のCADモデルイメージとコードペアで構成されるGenCAD-Codeは、私たちが作成した新しいデータセットを活用します。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:34:44 GMT)
Partite-wise Entanglement [4.1] 3量子GHZ状態の2部還元状態として$rhoAB$は分離可能であることが知られているが、part $A$とpart $B$は、part $C$をトレースせずに実際に互いに絡み合っている。
ここでは任意の次元を持つ任意の$n$-partiteシステムにおいてそのような絡み合いを探求し、[Phys. Rev. A 110, 032420(2024)]で提案されたペアエンタングル(PE)を含むパーティタイト・エンタングルメント(PWE)と呼ぶ。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:35:55 GMT)
SubData: Bridging Heterogeneous Datasets to Enable Theory-Driven Evaluation of Political and Demographic Perspectives in LLMs [4.0] SubDataは、異種データセットを標準化し、パースペクティブアライメントを評価するために設計されたオープンソースのPythonライブラリである。
本稿では,SubDataを利用した理論駆動型アプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:36:37 GMT)
QUT-DV25: A Dataset for Dynamic Analysis of Next-Gen Software Supply Chain Attacks [4.0] 既存のデータセットはメタデータ検査と静的コード解析に依存しており、そのような攻撃を検出するには不十分である。
本稿では,サプライチェーン攻撃の検出・緩和研究を支援するための動的解析データセットQUT-DV25を提案する。
このデータセットは、14,271のPythonパッケージからインストールとインストール後のトレースをキャプチャする。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:34:04 GMT)
TRATES: Trait-Specific Rubric-Assisted Cross-Prompt Essay Scoring [4.0] TRATESは、新しい特性特有かつルーリックベースのクロスプロンプトAESフレームワークであり、基盤となる特性に固有のものである。
このフレームワークはLarge Language Model (LLM)を活用しており、特性グレーディングルーリックを使用して特性特化機能を生成する。
実験によると、TRATESは広く使用されているデータセット上で、すべての特性に対して新しい最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:34:37 GMT)
TSA-WF: Exploring the Effectiveness of Time Series Analysis for Website Fingerprinting [4.0] Webサイトフィンガープリント(Webサイトフィンガープリント、WF)とは、eavesdropperがターゲットユーザーがアクセスしているWebサイトを識別する技術である。
最近のWF攻撃は、機械学習プロセスを使用して構築され、特徴抽出フェーズでトレースメタデータを要約している。
本稿では,ネットワークトレースのタイミングと方向特性を正確に保存するパイプラインであるTSA-WFを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:00:31 GMT)
AppleGrowthVision: A large-scale stereo dataset for phenological analysis, fruit detection, and 3D reconstruction in apple orchards [3.9] 2つのサブセットからなる大規模データセットであるAppleGrowthVisionを提案する。
第1弾はブランデンブルク(ドイツ)の農場から収集された高解像度ステレオ画像9,317枚を含む。
第2のサブセットはブランデンブルクの同じ農場から1,125枚の濃密に注釈付けされた画像と、合計で31,084個のリンゴのラベルを含むピルニッツ(Pillnitz)の1枚で構成されている。
AppleGrowthVisionは、農業的に検証された成長段階のステレオ画像データを提供し、正確な表現学的分析と3D再構成を可能にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:29:22 GMT)
X-KAN: Optimizing Local Kolmogorov-Arnold Networks via Evolutionary Rule-Based Machine Learning [3.9] X-KANは、進化的ルールベースの機械学習フレームワークを通じて、複数のローカルコルモゴロフ・アルノルドネットワーク(KAN)を最適化する新しい手法である。
X-KANは近似精度において、XCSF、Multi-Layer Perceptron、Kanなどの従来の手法よりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:26:03 GMT)
Improved Methods for Model Pruning and Knowledge Distillation [3.9] MAMAプルーニング(MAMA Pruning)は、R1やo3-miniのような大規模言語モデルのパフォーマンス最適化手法である。
モデルのサイズと計算の複雑さを効果的に減らし、極端なプルーニングレベルでも元の未実行モデルに匹敵する性能を維持しながら維持する。
予備的な実験結果から,本手法は様々なプルーニングレベルおよび下流の計算言語タスクにおいて,最先端の手法に匹敵する性能を示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:53:40 GMT)
MMD-Newton Method for Multi-objective Optimization [3.9] 連続多目的最適化問題(MOP)の解法としてMDDを提案する。
我々は,MMDをベースとした新しい手法であるNewton(MMDN)を考案した。
広範に使用されている11のベンチマーク問題に対して,ハイブリッドアルゴリズムを実証的に検証した。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:56:50 GMT)
A comparison of translation performance between DeepL and Supertext [3.9] 本研究では、DeepLとSupertextという2つの商用機械翻訳システムを比較した。
我々は4つの言語方向の翻訳品質を、文書レベルのコンテキストでセグメントを評価するプロの翻訳者を用いて評価する。
セグメントレベルの評価では、ほとんどの場合、システム間での強い嗜好は示されていないが、文書レベルの分析では、4つの言語方向のうち3つにスーパーテキストの嗜好が示される。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:16:38 GMT)
Balanced and Elastic End-to-end Training of Dynamic LLMs [3.8] 大規模分散トレーニングのための動的負荷分散ソリューションDynMoを提案する。
静的トレーニング法と比較して、DynMoはトレーニングを最大1.23x(MoEs)、3.18x(pruning)、2.23x(layer frozen)、4.02x(sparse attention)、4.52x(early exit)、1.17x(MoDs)まで加速する。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:52:57 GMT)
Leveraging LLM Inconsistency to Boost Pass@k Performance [3.8] 大規模言語モデル(LLM)は、多くのドメインにおいて印象的な能力を発揮するが、マイナーな入力変更に対する不整合性を示す。
本稿では,Pass@kの性能向上にモデルの不整合を利用した新しい手法を提案する。
具体的には、与えられたタスクのk変種を生成し、各タスクに対して1つの候補解を提出する「変数」エージェントを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:22:15 GMT)
The stellar decomposition of Gaussian quantum states [3.8] 光子計数測定により生成した非ガウス状態の特徴付け手法である恒星分解を導入する。
純粋状態に対して、物理対(G_core, T)が常にG_core純かつTユニタリであることを証明する。
混合状態に対しては、(G_core, T) がガウス混合状態およびガウスチャネルとなるために必要な十分条件を確立する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:24:07 GMT)
Dual Precision Quantization for Efficient and Accurate Deep Neural Networks Inference [3.8] 本稿では,ハードウェアの利点を最小限の精度で生かした,ハードウェア効率の量子化と推論手法を提案する。
本研究では,新たな推定オーバーヘッドを伴わずに,新たな量子化アルゴリズムであるDual Precision Quantization (DPQ) を開発した。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:26:12 GMT)
D4+: Emergent Adversarial Driving Maneuvers with Approximate Functional Optimization [3.8] 我々は、自動運転車と相互作用する悪意のあるドライバーの影響を特定するために、形式的な手法でシナリオベースのフレームワークを実装した。
われわれの結果は、悪質なドライバーが現代の車両の自律的機能を利用するのを防ぐ安全な運転行動の範囲をデザイナーが特定するのに役立つ。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:22:03 GMT)
Solving MNIST with a globally trained Mixture of Quantum Experts [3.7] 画像分類のための新しい量子ニューラルネットワークを提案する。
MNISTデータセットのパリティを、最大97.5%の精度で完全な解像度で分類することができる。
この結果から,最小限の量子資源で高精度な画像分類を実現するための量子ニューラルネットワークの可能性を示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:00:23 GMT)
Building Symbiotic AI: Reviewing the AI Act for a Human-Centred, Principle-Based Framework [3.7] 欧州連合(EU)は、AIを規制する新たな法的枠組みであるAI Actをリリースした。
同時に、研究者はAIシステム(通称Human-Centred AI(HCAI))について、新たな視点を提供する。
本稿では,共生型AIシステムの設計と開発を特徴付ける原則を明らかにすることを目的とする。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:39:21 GMT)
Scalable Autoregressive 3D Molecule Generation [3.7] Quetzalは、シンプルだがスケーラブルな自己回帰モデルで、3Dで原子単位の分子を作る。
Quetzalは生成品質を大幅に改善し、最先端の拡散モデルと競合する。
論文参考訳(メタデータ) (Tue, 20 May 2025 00:47:48 GMT)
JARVIS: A Multi-Agent Code Assistant for High-Quality EDA Script Generation [3.7] JARVISは、LLM(Large Language Models)とドメインの専門知識を活用して、EDAタスクのための高品質なスクリプトを生成する、新しいマルチエージェントフレームワークである。
合成データを用いて訓練されたドメイン固有LLM, 構造検証, ルール強制, コード修正機能, 高度な検索機構のカスタムコンパイラを組み合わせることにより, 本手法は最先端のドメイン固有モデルよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:40:57 GMT)
A simple estimator of the correlation kernel matrix of a determinantal point process [3.7] 本稿では,決定点過程(DPP)の閉形式推定器を提案する。
我々は、推定器の一貫性と正規性、およびその大きな偏差特性を証明した。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:48:45 GMT)
Early Risk Prediction of Pediatric Cardiac Arrest from Electronic Health Records via Multimodal Fused Transformer [3.7] 小児心停止の早期予測は,高リスク集中治療における時間的介入に重要である。
PedCA-FT(PedCA-FT)は、EHRの表層ビューとEHRのテキストビューを融合するトランスフォーマーベースの新しいフレームワークである。
PedCA-FTは、各モードビューに専用のトランスフォーマーモジュールを用いることで、複雑な時間的および文脈的パターンをキャプチャし、堅牢なCAリスク推定を生成する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:53:08 GMT)
Hybrid Bernstein Normalizing Flows for Flexible Multivariate Density Regression with Interpretable Marginals [3.7] 密度回帰モデルは、完全な条件付き確率分布をモデル化することによって、データの包括的な理解を可能にする。
本稿では,MCTMと最先端・自己回帰NFを組み合わせることで,解釈可能な特徴効果のモデル化にMCTMの透明性を活用する。
各種数値実験において,本手法の汎用性を実証し,実世界およびシミュレーションデータ上でのMCTMや他のNFモデルと比較した。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:17:07 GMT)
Low-Cost FlashAttention with Fused Exponential and Multiplication Hardware Operators [3.7] 我々は,指数関数とベクトル乗算の計算を融合した新しいハードウェア演算子を用いて,浮動小数点型FlashAttentionのカーネルの最適化に着目する。
提案されたExpMulハードウェアオペレータは、FlashAttentionベースのハードウェアアクセラレータの面積と電力コストを大幅に削減する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:00:59 GMT)
ActiveSSF: An Active-Learning-Guided Self-Supervised Framework for Long-Tailed Megakaryocyte Classification [3.7] 本研究では,能動学習と自己教師付き事前学習を統合したActiveSSFフレームワークを提案する。
臨床用巨核球データセットによる実験結果から,ActiveSSFは最先端の性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:03:50 GMT)
Breaking Bad Tokens: Detoxification of LLMs Using Sparse Autoencoders [3.6] 大規模言語モデル(LLM)は現在、ユーザ向けアプリケーションではユビキタスだが、望ましくない有害な出力を生成する。
我々はスパースオートエンコーダ(SAE)を利用してモデル残差ストリームの毒性関連方向を特定し、ターゲットのアクティベーションステアリングを行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:55:31 GMT)
Adaptive Bias Generalized Rollout Policy Adaptation on the Flexible Job-Shop Scheduling Problem [3.6] フレキシブルジョブショップスケジューリング問題(FJSSP)はNPハード最適化問題である。
一般化Nested Rollout Policy Adaptationから派生した新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:34:45 GMT)
Conjuring Positive Pairs for Efficient Unification of Representation Learning and Image Synthesis [3.6] Unified Self-Supervised Learning (SSL)メソッドは、表現学習と生成モデリングのギャップを埋める。
最近のUnified SSLメソッドは、トレーニング中に外部トークン化器を必要とするセマンティックトークン再構成のみに依存している。
本稿では,新しい統合SSLフレームワークであるSorcenについて紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:24:32 GMT)
Studying the Role of Input-Neighbor Overlap in Retrieval-Augmented Language Models Training Efficiency [3.6] 本研究では,クエリとコンテキストの重なり合いが,トレーニングと推論の両方のモデル性能に与える影響について検討する。
実験の結果,オーバーラップの増加は最初は最小限の効果を持つが,テスト時間のパープレキシティが大幅に向上し,モデルが臨界しきい値を超える学習を加速することがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:58:07 GMT)
Variance-Optimal Arm Selection: Regret Minimization and Best Arm Identification [3.6] 我々は、後悔設定のためのtextttUCB-VV と呼ばれるオンラインアルゴリズムを開発し、制限付き報酬に対する後悔の上限が $mathcalOleft(lognright)$として進化することを示す。
我々は, 試料分散に対する新しい濃度不等式を用いて, フレームワークを有界分布から準ガウス分布に拡張する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:01:38 GMT)
APEX: Empowering LLMs with Physics-Based Task Planning for Real-time Insight [3.5] APEX(Anticipatory Physics-Enhanced Execution)は、大規模言語モデルに物理駆動型フォレストを組み、リアルタイムタスク計画のためのフレームワークである。
APEX は標準の LLM や VLM ベースのモデルを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:34:58 GMT)
Too Long, Didn't Model: Decomposing LLM Long-Context Understanding With Novels [3.5] Too Long, Didn't Modelベンチマークをリリースしました。
プロットサマリー、ストーリーワールド構成、経過したストーリータイムを報告するモデルの能力をテストする。
テストされた7つのフロンティアLSMのうち、64kトークン以上の安定な理解は得られていない。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:21:09 GMT)
A PID-Controlled Tensor Wheel Decomposition Model for Dynamic Link Prediction [3.5] 本研究では, PID制御型テンソルホイール分解(PTWD)モデルについて述べる。
提案するPTWDモデルは,他のモデルと比較して高精度なリンク予測機能を有する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:14:30 GMT)
Exploring Explainable Multi-player MCTS-minimax Hybrids in Board Game Using Process Mining [3.5] 本稿では,モンテカルロ木探索(MCTS)の意思決定と行動に関する潜在的説明について検討する。
MCTSの弱点は、非常に選択的な木を構築し、結果として決定的な動きを見逃し、戦術的な罠に陥ることである。
我々は,マルチプレイヤーMCTSのロールアウトフェーズに浅いミニマックス探索を統合し,プロセスマイニング技術を用いて3v3チェッカーにおけるエージェントの戦略を説明する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:09:58 GMT)
Mixture of Scope Experts at Test: Generalizing Deeper Graph Neural Networks with Shallow Variants [3.5] 異種グラフはグラフニューラルネットワーク(GNN)に挑戦する
GNNは深さが増加するにつれて性能低下に悩まされる。
我々は,テストにおけるスコープエキスパートの混合(Moscat)による高表現性を維持しつつ,より深いGNN一般化を改善することを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:41:40 GMT)
Memory Assignment for Finite-Memory Strategies in Adversarial Patrolling Games [3.5] 我々は、他の競合クラスを実験的に上回る有限メモリ(正則)デフェンダーの戦略のクラスに焦点を当てる。
メモリ割り当てを反復的に変更する汎用手法を開発した。
提案アルゴリズムは,エモニーブラックボックス戦略最適化ツールと関連付けることができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:40:53 GMT)
A MIND for Reasoning: Meta-learning for In-context Deduction [3.4] In-context Deduction (MIND) のためのメタラーニングを提案する。
以上の結果から,MINDは1.5Bから7Bまでの小さなLMの一般化を著しく改善することが示された。
注目すべきは、このタスクにおいてMINDで微調整された小さなモデルは、GPT-4oやo3-miniのような最先端のLLMよりも優れていることである。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:00:48 GMT)
Does Unsupervised Domain Adaptation Improve the Robustness of Amortized Bayesian Inference? A Systematic Evaluation [3.4] 近年のロバストなアプローチでは、シミュレーションおよび観測データの埋め込み空間と一致するように、教師なし領域適応(UDA)が採用されている。
本研究では,領域間の要約空間の整合が,非モデル化現象や雑音の影響を効果的に緩和することを示した。
以上の結果から,UDAを用いてABIのロバスト性を高める際に,不特定型を慎重に検討することの必要性が示唆された。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:32:07 GMT)
A Mosaic of Perspectives: Understanding Ownership in Software Engineering [3.4] 本稿では,ソフトウェア工学と心理学におけるオーナシップに関する既存の文献について考察する。
ソフトウェアエンジニアリングにおけるオーナシップに関するより包括的な見解は、ソフトウェアチームの作業を改善する大きな可能性を持っている、と氏は主張する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:27:33 GMT)
Structure-Preserving Zero-Shot Image Editing via Stage-Wise Latent Injection in Diffusion Models [3.4] テキスト誘導と参照誘導のアプローチを微調整を必要とせずに統一するゼロショット画像編集のための拡散ベースのフレームワークを提案する。
本手法は拡散インバージョンと時間ステップ固有のヌルテキスト埋め込みを利用して,画像の構造的整合性を維持する。
参照遅延を伴うクロスアテンションは、ソースと参照間のセマンティックアライメントを促進する。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:09:47 GMT)
Inferring stochastic dynamics with growth from cross-sectional data [3.4] 本稿では,成長を伴うダイナミックスとしてモデル化された生物学的プロセスの課題に対処する,新しい確率フロー推定手法を提案する。
フォッカー・プランク方程式のラグランジアン定式化を利用して, 本手法は内在雑音や成長からドリフトを正確に解離する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:58:23 GMT)
One-shot manipulation of coherence in dynamic quantum resource theory [3.3] 近年、動的量子資源の研究への関心が高まっている。
本稿では,超チャネル理論を用いて量子コヒーレンスの動的資源理論を記述する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:17:55 GMT)
Cassandra: Efficient Enforcement of Sequential Execution for Cryptographic Programs (Extended Version) [3.3] 定時プログラミングは、サイドチャネル攻撃に対する暗号プログラムを強化するための広くデプロイされたアプローチである。
現代のプロセッサは、プログラムの意図しないパスを過渡的に実行することで、標準の定時ポリシーの前提に反することが多い。
我々は,一定時間暗号コードのシーケンシャル実行を強制する新しいハードウェア/ソフトウェア機構であるCassandraを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:22:28 GMT)
Rethinking Text-Promptable Surgical Instrument Segmentation with Robust Framework [3.3] 我々はRobust text-promptable surgery Instrument (R-SIS)と呼ばれるテキストプロンプタブルなタスクを開発する。
R-SISは、目に見える楽器を参照し、そのような楽器がシーンに明示的に存在している場合にのみマスクを生成するプロンプトを区別する必要がある。
手術用ビデオデータセットを用いたR-SISプロトコルに基づく既存のセグメンテーション手法の評価を行った。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:26:56 GMT)
Intra-class Patch Swap for Self-Distillation [3.3] 単一学生ネットワークに基づく無教師蒸留フレームワークを提案する。
我々のアプローチは、クラス内パッチスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワップスワ
提案手法は,既存の自己蒸留ベースラインと従来の教師ベースのKDアプローチを一貫して上回る。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:30:19 GMT)
CSTS: A Benchmark for the Discovery of Correlation Structures in Time Series Clustering [3.2] CSTS(Correlation Structures in Time Series)は時系列データ中の相関構造の発見を評価するためのベンチマークである。
CSTSは、研究者がクラスタリング障害の特定の原因を分離し、特定できるクリーンなベンチマークを提供する。
コントリビューションは,(1) 異なる相関構造, 体系的に変化するデータ条件, 確立された性能閾値, 推奨評価プロトコルによる相関構造発見のための総合的ベンチマーク, (2) ダウンサンプリングから適度な歪みを示す相関構造保存の実証的検証, および(3) 構造第一クラスタリング評価が可能なデータ生成フレームワークである。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:48:14 GMT)
GRAML: Goal Recognition As Metric Learning [3.2] ゴール認識(GR)は、観察された行動に基づいてエージェントの目的を認識する問題である。
GRの最近のデータ駆動アプローチは、コストがかかる手作業によるドメインモデルの必要性を軽減する。
本稿では,GRAML:Goal Recognition as Metric Learningを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:21:41 GMT)
Designing and Contextualising Probes for African Languages [3.2] 本稿では,アフリカ言語に関する言語知識のためのPLMの探索に関する最初の体系的研究について述べる。
我々は6つの類型的多様性を持つアフリカの言語に対して、言語的特徴がどのように分散されているかを分析するために、階層的プローブを訓練する。
アフリカ語に適応した PLM は,多言語 PLM よりも対象言語に関する言語情報をエンコードする。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:18:27 GMT)
Guarded Query Routing for Large Language Models [3.1] 本稿では,まずGQR-Bench(Guarded Query Routing Benchmark)を提案する。
その結果,ドメイン外検出能力が向上したWideMLPでは,精度(88%)と速度(4ms)のトレードオフが最良であることがわかった。
埋め込みベースのfastTextは、許容精度(80%)で速度(1ms)を上回り、LSMは高い精度(91%)を得るが、比較的遅い(ローカルなLlama-3.1:8Bと699では62ms)。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:46:59 GMT)
VAMO: Efficient Large-Scale Nonconvex Optimization via Adaptive Zeroth Order Variance Reduction [3.1] VAMOは、ZOGスタイルのフレームワークの下で、FOミニバッチ勾配とZO有限差分プローブを組み合わせる。
VAMOはFO法やZO法よりも優れており、効率を向上させるためにより高速で柔軟な選択肢を提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:31:15 GMT)
Challenges and Limitations in the Synthetic Generation of mHealth Sensor Data [3.1] 本稿では,合成データの本質的品質と,下流予測タスクにおける有用性の両方を測定するために設計された新しい評価フレームワークを提案する。
以上の結果から,既存のアプローチ,特に相互整合性を維持する上での限界が明らかとなった。
我々は,mHealthにおける合成時系列生成の促進と生成モデルの適用性向上に向けた今後の研究方針を述べる。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:05:06 GMT)
sudoLLM : On Multi-role Alignment of Language Models [3.1] ユーザ認証に基づくアクセス権限は、多くのセーフティクリティカルシステムにおいて重要な機能である。
マルチロール・アライメント言語モデルを実現する新しいフレームワークであるSudoLLMを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:54:34 GMT)
Electrostatics from Laplacian Eigenbasis for Neural Network Interatomic Potentials [3.1] メッセージパッシングフレームワーク内でPoissonの方程式を強制するユニバーサルプラグインモジュールである$Phi$-Moduleを紹介します。
具体的には、各原子ワイド表現は、離散化されたポアソン方程式を満たすように奨励される。
次に、全エネルギー予測の改善に不可欠な静電エネルギー項を導出する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:54:25 GMT)
QSVM-QNN: Quantum Support Vector Machine Based Quantum Neural Network Learning Algorithm for Brain-Computer Interfacing Systems [3.1] 脳コンピュータインタフェース(BCI)システムは、脳と外部デバイス間の直接通信を可能にする。
進歩にもかかわらず、BCIシステムは、信号の可変性、分類の非効率性、個々のユーザにリアルタイムで適応することの難しさなど、永続的な課題に直面している。
我々は,脳波に基づくBCIタスクの分類精度とロバスト性を改善するために,QSVM-QNNと呼ばれる新しいハイブリッド量子学習モデルを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:48:44 GMT)
Dynadiff: Single-stage Decoding of Images from Continuously Evolving fMRI [3.0] 動的に進化するfMRI記録から画像を再構成するための新しい単一ステージ拡散モデルであるDynadiffを紹介する。
我々のモデルは、時間分解されたfMRI信号、特に高レベルのセマンティックイメージ再構成メトリクスの最先端モデルよりも優れています。
全体として、この研究は時間分解脳画像デコーディングの基礎となっている。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:14:37 GMT)
Energy-Efficient Deep Reinforcement Learning with Spiking Transformers [3.0] スパイキングニューラルネットワーク(SNN)は、機械学習にエネルギー効率の良い代替手段を提供する。
新しいSpike-Transformer Reinforcement Learning (STRL)アルゴリズムは、SNNのエネルギー効率と強化学習の強力な意思決定能力を組み合わせる。
SNN Transformerは従来のエージェントベースのTransformerに比べて大幅に改善されたポリシー性能を実現する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:52:43 GMT)
DRP: Distilled Reasoning Pruning with Skill-aware Step Decomposition for Efficient Large Reasoning Models [3.0] 推定時間とチューニングに基づく蒸留を組み合わせたハイブリッドフレームワークであるDistilled Reasoning Pruning(トレース)を提案する。
トレースでトレーニングされたモデルは、精度を犠牲にすることなく、トークン効率を大幅に改善することを発見した。
さらに分析した結果,CoTの推論構造と学生の推論能力の整合性は,効果的な知識伝達と性能向上に不可欠であることが示唆された。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:15:15 GMT)
ZEBRA: Leveraging Model-Behavioral Knowledge for Zero-Annotation Preference Dataset Construction [3.0] ZEBRAは、モデル行動知識を活用することにより、嗜好データを構成するモデルビヘイビアワイドゼロアノテーションフレームワークである。
ZEBRAは、元のモデルの品質と類似性を評価し、完全にインスタンスレベルのアノテーションをバイパスすることで、レスポンスペアをバイナライズする。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:20:33 GMT)
End-to-end Cortical Surface Reconstruction from Clinical Magnetic Resonance Images [2.9] 我々は、コントラストと解像度のスキャンから皮質表面を明示的に推定するために、最初のニューラルネットワークを訓練する。
提案手法は, テンプレートメッシュをホワイトマター (WM) 面に変形させ, トポロジカルな正当性を保証する。
高分解能T1wスキャンでFreeSurferが検出した老化関連大脳皮質の微細化パターンを再現し,大脳皮質の厚さ誤差(0.50mmから0.24mm)を約50%低減した。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:18:58 GMT)
Destabilizing Power Grid and Energy Market by Cyberattacks on Smart Inverters [2.9] 本稿では,スマートインバータに対するサイバー攻撃による大規模電力不安定性の妥当性と影響を現実的に評価する。
本研究は,オーストラリアの電力市場データと実践的緊急メカニズムの知識に基づく詳細な研究である。
オーストラリアの電力網のデータ分析は、分散PVの比較的低い割合が、グリッドに連続した攻撃を開始するのに十分であることも明らかにしています。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:28:49 GMT)
Towards Rehearsal-Free Continual Relation Extraction: Capturing Within-Task Variance with Adaptive Prompting [2.8] WAVE++は、プレフィックスチューニングとエキスパートの混在にインスパイアされた、新しいアプローチである。
タスク固有のプロンプトプールを導入し、多様なタスクの柔軟性と適応性を高めます。
我々は、よりリッチでグローバルなコンテキストを提供するラベル記述を組み込み、モデルが異なる関係をよりよく区別できるようにする。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:22:17 GMT)
Feature-Weighted MMD-CORAL for Domain Adaptation in Power Transformer Fault Diagnosis [2.8] 本研究では,最大平均離散度(MMD)と相関アライメント(CORAL)と特徴特化重み付け(MCW)を組み合わせた特徴重み付きドメイン適応手法を提案する。
MMD-CORAL (MC) よりも7.9%改善し、2.2%改善した電力変圧器用データセットの実験的評価により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:44:35 GMT)
Classification of Heart Sounds Using Multi-Branch Deep Convolutional Network and LSTM-CNN [2.8] 本研究は, 心臓疾患の自動診断のための, 迅速かつ正確かつ費用対効果の高い手法を提供する新しいディープラーニングアーキテクチャを開発し, 評価する。
まず,多様な畳み込みフィルタサイズを利用して人間の聴覚処理をエミュレートするマルチブランチディープ畳み込みニューラルネットワーク(MBDCN)と,特徴抽出のためのパワースペクトル入力の2つの革新的な手法を提案する。
第二に、LSTMブロックをMBDCNに統合し、時間領域の特徴抽出を改善するLong Short-Term Memory-Convolutional Neural (LSCN)モデルである。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:19:00 GMT)
A portable diagnosis model for Keratoconus using a smartphone [2.7] Keratoconus(KC)は角膜疾患であり、ぼやけた視力と歪んだ視力をもたらす。
従来の診断ツールは効果があるが、しばしばかさばる、コストがかかり、専門的な手術を必要とする。
提案手法はまず、スマートフォンのスクリーンで生成したプラチドディスクが目に光を放つと、目の角膜に映る画像を捉えます。
論文参考訳(メタデータ) (Tue, 20 May 2025 00:37:10 GMT)
Conformal Convolution and Monte Carlo Meta-learners for Predictive Inference of Individual Treatment Effects [2.7] 潜在的な結果の完全な予測分布と個別治療効果(ITE)の2つの新しい手法を提案する。
我々のアプローチは、重み付けされた共形予測システムと潜在的な結果分布の分析的畳み込み、あるいはモンテカルロサンプリングを組み合わせる。
潜在的な結果予測分布の生成を可能にする他のアプローチとは対照的に、我々のアプローチはモデル非依存的で普遍的であり、確率的キャリブレーションの有限サンプル保証が伴う。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:39:10 GMT)
Void in Language Models [2.7] 命令調整言語モデル(LM)における層活性化を,プロンプト処理と応答生成の2段階にわたって解析する。
すべてのレイヤが推論中に等しく寄与するわけではなく、ほとんどのレイヤを選択的にスキップすることで、特定のタスクにおけるモデルの性能が向上することを示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:01:56 GMT)
Quantum-Enhanced Hybrid Reinforcement Learning Framework for Dynamic Path Planning in Autonomous Systems [2.7] 量子を古典的強化学習と相乗化する新しい量子古典ハイブリッドフレームワークが提案されている。
提案手法は,従来の強化学習パイプラインと統合された,堅牢なQテーブルと特別なターンコスト推定を生成する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:19:08 GMT)
Cheaper, Better, Faster, Stronger: Robust Text-to-SQL without Chain-of-Thought or Fine-Tuning [2.7] N-rep"一貫性は、よりコスト効率のよいテキスト・ツー・タスクのアプローチである。
N-repは、そのコスト範囲で最高のテキスト・ツー・タスク・アプローチである。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:28:46 GMT)
Beyond Self-Reports: Multi-Observer Agents for Personality Assessment in Large Language Models [2.7] 本稿では,LLMエージェントの性格特性評価のための新しいマルチ・オブザーバ・フレームワークを提案する。
自己評価に頼る代わりに、複数のオブザーバエージェントを採用する。
これらの評価は従来の自己評価よりも人間の判断と密接に一致していることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:38:58 GMT)
Domain Adaptation of VLM for Soccer Video Understanding [2.7] 視覚言語モデル(VLM)は、視覚的およびテキスト的表現を効果的に整合させることにより、マルチモーダルタスクにおいて強力な性能を示す。
本研究は,オープンソースVLMの特定の領域への適応性について検討し,最初の事例研究としてサッカーに注目した。
最終適応モデルは、20kビデオクリップのキュレートされたデータセットを使用してトレーニングされ、ベースモデルと比較してサッカー特有のタスクが大幅に改善されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:12:21 GMT)
Topology-aware Detection and Localization of Distributed Denial-of-Service Attacks in Network-on-Chips [2.6] 本稿では,グラフニューラルネットワーク(GNN)を用いたDDoS攻撃のトポロジ対応検出とローカライズを行うためのフレームワークを提案する。
NoCをグラフとしてモデル化することにより、トラフィック機能を利用してDDoS攻撃を効果的に識別し、ローカライズする。
実験結果から,DDoS攻撃を高い精度(最大99%)で検出およびローカライズできると同時に,多様な攻撃戦略の下で一貫した性能を維持することができることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:49:34 GMT)
Model-Independent Machine Learning Approach for Nanometric Axial Localization and Tracking [2.6] 両焦点平面画像から軸位置を決定できる畳み込みニューラルネットワーク(CNN)を用いた深層学習手法を提案する。
本手法は従来の単焦点平面法より6倍の40ナノメートルの軸方向局在精度を実現する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:55:26 GMT)
Multi-Channel Swin Transformer Framework for Bearing Remaining Useful Life Prediction [2.6] 本稿では,ウェーブレットに基づくデノベーション手法であるウェーブレットパケット分解(WPD)と,これらの問題に対処するためにカスタマイズされたマルチチャネルスウィントランスモデル(MCSFormer)を組み合わせた新しいフレームワークを提案する。
特徴融合のための注意機構を組み込んだモデルでは、グローバルおよび局所的な劣化パターンを学習するように設計されている。
カスタマイズされた損失関数は、早期と後期の予測を区別するために、この作業の重要な区別として開発されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:44:38 GMT)
Assumed Identities: Quantifying Gender Bias in Machine Translation of Gender-Ambiguous Occupational Terms [2.6] GRAPEは、性別バイアスを評価するための確率ベースの指標である。
GAMBIT-MTは、性別のあいまいな職業用語を持つ英語のベンチマークデータセットである。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:17:40 GMT)
Place Recognition: A Comprehensive Review, Current Challenges and Future Directions [2.5] 位置認識の最近の進歩を概観し,3つの方法論的パラダイムを強調した。
CNNベースのアプローチ、トランスフォーマーベースのフレームワーク、およびクロスモーダル戦略について議論する。
我々は現在の研究課題を特定し、ドメイン適応、リアルタイムパフォーマンス、生涯学習を含む今後の方向性を概説し、この領域の今後の進歩を刺激する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:16:37 GMT)
DiffSampling: Enhancing Diversity and Accuracy in Neural Text Generation [2.5] トークン確率分布の数学的解析を利用する3つの新しい復号法を提案する。
私たちのアプローチは、品質と多様性の観点から、少なくとも既存の方法と同様に、一貫して実行されます。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:00:08 GMT)
Technical Report on classification of literature related to children speech disorder [2.4] 本報告では、幼児期音声障害の科学的文献を体系的に分類するための自然言語処理(NLP)に基づくアプローチを提案する。
ドメイン固有キーワードを用いたPubMedデータベースから,2015年以降に公開された4,804件の関連記事の検索とフィルタリングを行った。
乳児の過活動や異常てんかん行動など,14の臨床的意義のあるクラスターが発見された。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:52:17 GMT)
The Role of Visualization in LLM-Assisted Knowledge Graph Systems: Effects on User Trust, Exploration, and Workflows [2.4] LinkQは、自然言語の質問を大規模言語モデル(LLM)による構造化クエリに変換する探索システムである。
14人の実践者による質的な評価から、ユーザ(KGの専門家でさえ)がLinkQのアウトプットを過信する傾向にあったことが分かりました。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:54:59 GMT)
Complexity of graph-state preparation by Clifford circuits [2.4] 我々は、グラフ状態の準備のために少なくとも2つの量子ビットで作用する一般量子アルゴリズムを考える。
グラフ状態の CZ-複素性は、|Grangle$ とグラフのランク幅 $G$ との接続を示す。
本稿では,区間グラフ,区間囲みグラフ,円グラフの3つの特定のグラフクラスに対して,グラフ状態を作成するための量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:05:23 GMT)
Mechanistic Interpretability of GPT-like Models on Summarization Tasks [2.4] 本稿では,GPTライクなモデルが要約タスクにどのように適応するかを解析するための解釈可能性フレームワークを提案する。
重要な変換を行う特定のレイヤとアテンションヘッドを識別することにより、モデルアーキテクチャ内の"要約回路"を見つける。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:15:11 GMT)
Flattening Hierarchies with Policy Bootstrapping [2.4] 本稿では,重み付けされた重要度サンプリングを施したサブゴール条件ポリシをブートストラップすることで,フラットな(階層的でない)目標条件ポリシーをトレーニングするアルゴリズムを提案する。
提案手法は,大規模状態空間における高次元制御へのスケーリングの鍵となる(部分)ゴール空間上の生成モデルの必要性を排除している。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:31:30 GMT)
Deep Learning-Based Forecasting of Boarding Patient Counts to Address ED Overcrowding [2.4] 本研究は,6時間前の救急病棟入所期間における患者数を予測するための深層学習モデルを構築した。
データは、ED追跡システム、入院患者の国勢調査記録、天気予報、連邦政府の祝日カレンダー、地元のイベントスケジュールの5つの情報源から収集された。
N-BEATSxは平均絶対誤差2.10、平均二乗誤差7.08、根平均二乗誤差2.66、決定係数0.95で最高の性能を達成した。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:35:47 GMT)
An Asymptotic Equation Linking WAIC and WBIC in Singular Models [2.4] 統計的学習において、モデルはパラメータから確率分布への写像が射影的であるかどうかによって、正規または特異に分類される。
階層構造や潜伏変数を持つほとんどのモデルは特異であり、従来の基準は確率と後部の正規近似の分解のために適用できない。
この理論的な貢献は、特異モデルにおけるモデル選択の計算効率における将来の発展の基礎となる。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:06:43 GMT)
Beginning with You: Perceptual-Initialization Improves Vision-Language Representation and Alignment [2.4] 視覚表現学習におけるパラダイムシフトである知覚初期化(PI)を導入する。
提案手法は,タスク固有の微調整を使わずに,ゼロショット性能が大幅に向上したことを示す。
私たちの研究は、人間の知覚から始まる「あなたとの交際」が、汎用的な視覚言語知能の強力な基盤を提供することを示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:04:14 GMT)
Scaling Test-Time Inference with Policy-Optimized, Dynamic Retrieval-Augmented Generation via KV Caching and Decoding [2.4] 本稿では,動的検索戦略と強化微調整により,RAG(Retrieval-Augmented Generation)システムを強化する枠組みを提案する。
我々のフレームワークは2つの補完手法を統合している: Policy-d Retrieval Augmented Generation (PORAG)とAdaptive Token-Layer Attention Scoring (ATLAS)。
我々のフレームワークは幻覚を減らし、ドメイン固有の推論を強化し、従来のRAGシステムよりも優れた効率とスケーラビリティを実現する。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:52:21 GMT)
Diversity-Aware Reinforcement Learning for de novo Drug Design [2.4] 事前訓練された生成モデルの微調整は、有望な薬物分子の生成に優れた性能を示した。
報酬関数の適応的更新機構が生成分子の多様性にどのように影響するかは研究されていない。
我々の実験は、構造と予測に基づく手法を組み合わせることで、一般的に多様性の点でより良い結果が得られることを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:31:33 GMT)
Transductively Informed Inductive Program Synthesis [2.4] Acstiipsは, 協調的なメカニズムを通じて, 相互作用を明示的にモデル化することによって, 伝達戦略と誘導戦略を統一する新しいフレームワークである。
この結果から,アクスティプスはより多くのタスクを解決し,構文や意味論の最適解とより密に一致する関数を生成することがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:23:46 GMT)
"Haet Bhasha aur Diskrimineshun": Phonetic Perturbations in Code-Mixed Hinglish to Red-Team LLMs [2.3] 大規模言語モデル(LLM)はますます強力になり、日ごとに多言語とマルチモーダルの機能が改善されている。
既存のレッドチームの取り組みは、これまで、固定テンプレートベースのアタックを使用して、英語に重点を置いてきた。
本研究は,テキストおよび画像生成タスクにおいて,コードミキシングと音声の摂動をジェイルブレイクLLMに活用する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:35:25 GMT)
Predicting Neo-Adjuvant Chemotherapy Response in Triple-Negative Breast Cancer Using Pre-Treatment Histopathologic Images [2.2] トリプル陰性乳癌(TNBC)は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)、ヒト上皮成長因子受容体2(HER2)の発現の欠如によって定義される攻撃性サブタイプである。
ネオアジュバント化学療法(Neoadjuvant chemotherapy, NACT)は、早期TNBCの標準治療であり、病理学的完全反応(pCR)が重要な予後マーカーである。
我々は, ヘマトキシリンおよびエオシン染色生検画像を用いて, NACT応答を予測する深層学習モデルを開発した。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:06:34 GMT)
IntentRec: Predicting User Session Intent with Hierarchical Multi-Task Learning [2.2] IntentRecは階層型マルチタスクニューラルネットワークアーキテクチャに基づく新しいレコメンデーションフレームワークである。
インテント予測を直接活用することで、正確でパーソナライズされたレコメンデーションをユーザに提供できます。
Netflixのユーザエンゲージメントデータに関する包括的な実験によると、IntentRecは最先端の次世代および次世代の予測器よりも優れています。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:46:34 GMT)
Multimodal Fusion of Glucose Monitoring and Food Imagery for Caloric Content Prediction [2.2] 我々は,CGM時系列データ,デモグラフィック/マイクロバイオーム,および食事前食品イメージを併用して,カロリー推定を向上するマルチモーダル深層学習フレームワークを提案する。
我々のモデルは0.2544のルート平均正方形相対誤差(RMSRE)を達成し、ベースラインモデルを50%以上上回った。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:25:23 GMT)
Two-photon superradiance and subradiance [2.2] 2レベル原子系における2光子協調放出の問題点を考察する。
2光子超・準放射状態と関連する2光子スペクトルの進化を研究する。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:59:32 GMT)
FlashThink: An Early Exit Method For Efficient Reasoning [2.1] 大規模言語モデル(LLM)は、推論タスクにおいて素晴らしいパフォーマンスを示している。
LLMは、過度に長い推論内容を生成する傾向があり、計算オーバーヘッドが大きくなる。
我々は、モデルが推論を止め、正しい答えを提供することができる正確なタイミングを識別する検証モデルを導入する。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:28:21 GMT)
JULI: Jailbreak Large Language Models by Self-Introspection [2.1] LLM(Large Language Models)は、悪意のあるコンテンツの生成を防ぐために、安全アライメントをトレーニングする。
トークンログの確率を操作することで,LDMをジェイルブレイクするJULI(Jailbreaking Using LLM Introspection)を提案する。
提案手法は,既存のSOTA(State-of-the-art)アプローチよりも優れた効果を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:27:52 GMT)
BugRepro: Enhancing Android Bug Reproduction with Domain-Specific Knowledge Integration [2.1] BugReproは、バグ再現の正確性と効率を高めるために、ドメイン固有の知識を統合するテクニックである。
同様のバグレポートと対応するS2RエンティティをサンプルリッチなRAGドキュメントから取得する。
アプリのグラフィカルユーザインターフェース(GUI)を調べ、UIトランジショングラフを抽出する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:48:34 GMT)
Personalized Diffusion Model Reshapes Cold-Start Bundle Recommendation [2.1] 本稿では,各ユーザがコールドスタート課題に取り組むために,分散空間にバンドルを生成する新しい手法を提案する。
DisCoはパーソナライズされたDiffusionのバックボーンに依存しており、ユーザーの興味をゆがめられたアスペクトによって強化されている。
DisCoは3つの実世界のデータセットに対して大きなマージンで5つのベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:52:31 GMT)
How Effective Can Dropout Be in Multiple Instance Learning ? [2.1] MIL(Multiple Instance Learning)は、様々なアプリケーションのための弱い教師付き手法である。
本稿では,MIL固有のドロップアウト手法であるMIL-Dropoutを提案し,どのインスタンスをドロップするかを体系的に決定する。
5つのMILベンチマークデータセットと2つのWSIデータセットの実験は、MIL-Dropoutが既存のMILメソッドのパフォーマンスを無視できる計算コストで向上させることを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:22:21 GMT)
SafetyNet: Detecting Harmful Outputs in LLMs by Modeling and Monitoring Deceptive Behaviors [2.1] 原子力や航空などのリスクの高い産業は、危険なシステム状態を検出するためにリアルタイムモニタリングを使用している。
教師なしアプローチを用いることで、有害なAI出力が発生する前に予測するリアルタイムフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:49:58 GMT)
Explainable AI for Securing Healthcare in IoT-Integrated 6G Wireless Networks [2.0] 我々は、SHAP、LIME、DiCEといった説明可能なAI技術が脆弱性を明らかにし、防御を強化し、6G対応ヘルスケアにおける信頼と透明性を改善する方法を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:46:09 GMT)
On the (in)security of Proofs-of-Space based Longest-Chain Blockchains [2.0] いずれの点においても、正直な当事者が敵の1倍のスペースを制御できるセキュリティゲームを考える。
チェーン選択ルールが何であっても、このゲームでは、敵はチェーン選択ルールによって勝者として選択される長さ$phi2cdot rho / varepsilon$のフォークを作成することができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:35:00 GMT)
Talk to Your Slides: Language-Driven Agents for Efficient Slide Editing [2.0] 本研究では、スライドを%のアクティブPowerPointセッションで編集するエージェントであるTalk-to-Your-Slidesを提案する。
我々のシステムでは、34.02%の高速処理、34.76%の命令忠実度、87.42%の動作がベースラインよりも安価である。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:25:54 GMT)
Factorised Active Inference for Strategic Multi-Agent Interactions [1.9] この目的に2つの補完的アプローチを組み込むことができる。
アクティブ推論フレームワーク(AIF)は、エージェントが環境内の信念や行動に適応するために生成モデルをどのように利用するかを記述する。
ゲーム理論は、潜在的に競合する目的を持つエージェント間の戦略的相互作用を定式化する。
本稿では,各エージェントが他のエージェントの内部状態に対する明示的かつ個別的な信念を維持し,それらを共同で戦略的計画に利用する生成モデルの因子化を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:55:13 GMT)
Interpretable Dual-Stream Learning for Local Wind Hazard Prediction in Vulnerable Communities [1.9] 竜巻や直線風などの風害は、アメリカ合衆国グレートプレーンズの脆弱な地域社会にしばしば影響を及ぼす。
既存の予測システムは、主に気象要素に焦点を当てており、しばしばコミュニティ固有の脆弱性を捉えない。
本稿では、構造化された数値気象データと構造化されていないテクスチャイベントの物語を統合する2重ストリーム学習フレームワークを提案する。
我々のアーキテクチャは、ランダムフォレストとRoBERTaベースのトランスフォーマーを後期核融合機構で組み合わせ、強靭で文脈に合った風害予測を可能にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:46:02 GMT)
A Review of Vision-Based Assistive Systems for Visually Impaired People: Technologies, Applications, and Future Directions [1.9] 本稿では,視覚障害者のための支援システムの最近の進歩を概観する。
障害物検出、ナビゲーション、ユーザインタラクションにおける最先端技術に焦点を当てている。
視覚誘導システムにおける新たなトレンドと今後の方向性について論じる。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:47:07 GMT)
StainDiffuser: MultiTask Dual Diffusion Model for Virtual Staining [1.9] ヘマトキシリンとエオシン(H&E)染色は、疾患の診断と腫瘍再発の追跡における病理の基準として広く見なされている。
ヘマトキシリンとエオシン(H&E)染色は、疾患の診断と腫瘍再発の追跡における病理の基準として広く見なされている。
その価値にもかかわらず、IHC染色は追加の時間と資源を必要とし、いくつかの臨床環境での使用を制限する。
近年のディープラーニングの進歩は、画像から画像への変換(I2I)を、IHCの計算的で費用対効果の高い代替手段として位置づけている。
我々は新しいマルチタスク拡散アーキテクチャであるSTAINDIFFを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:36:17 GMT)
GranQ: Granular Zero-Shot Quantization with Channel-Wise Activation Scaling in QAT [1.8] GranQは、ベクトル化計算によるチャネルごとのスケーリングを効率的に適用する、新しいアクティベーション量子化フレームワークである。
提案手法は, CIFAR-100の3ビット設定において最大5.45%の精度を実現し, CIFAR-10の完全精度ベースラインを超えている。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:27:14 GMT)
Exploring Social Media Image Categorization Using Large Models with Different Adaptation Methods: A Case Study on Cultural Nature's Contributions to People [1.8] ソーシャルメディアの画像は、自然と文化の遺産との人間の相互作用をモデル化、マッピング、理解するための貴重な洞察を提供する。
これらの画像を意味論的に意味のあるグループに分類することは、その視覚内容の多様性と異質性のために、依然として非常に複雑である。
FLIPSは、人間と自然の相互作用を捉えたFlickr画像のデータセットである。
我々は,様々な適応手法を用いて,大規模モデルの異なる型と組み合わせに基づく様々な解を評価する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:03:37 GMT)
Bridging Predictive Coding and MDL: A Two-Part Code Framework for Deep Learning [1.7] 階層的にPCが最小記述長目標に対してブロック座標降下を行うことを示す。
さらに、各PCスイープが経験的2部分符号長を単調に減少させ、より厳密な高確率リスク境界をもたらすことを証明した。
これはPC訓練深層モデルの形式的一般化と収束保証を提供する最初の結果である。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:25:16 GMT)
Forward Target Propagation: A Forward-Only Approach to Global Error Credit Assignment via Local Losses [1.7] ニューラルネットワークのトレーニングは、伝統的に、生物学的およびハードウェアの観点から重要な制限に悩まされるアルゴリズムであるバックプロパゲーション(BP)に依存してきた。
本稿では,後進パスを第2の前方パスに置き換える,生物学的に妥当かつ効率的な代替手段であるフォワード・ターゲット・プロパゲーション(FTP)を提案する。
MNIST, CIFAR10, CIFAR100におけるBPと競合する精度を示すとともに, シーケンシャルタスクにおける長期依存性の効果的なモデリングを行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:09:23 GMT)
Enhancing Conversational Agents with Theory of Mind: Aligning Beliefs, Desires, and Intentions for Human-Like Interaction [1.7] オープンソースの言語モデル(LLaMA)は、ToM関連の情報をキャプチャして保存することができる。
ToM関連成分(信念、欲求、意図など)の明示的な操作が、応答アライメントを高めることができるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:57:19 GMT)
Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds [1.7] 本稿では視覚的視点取り(VPT)を行うために視覚言語モデル(VLM)を訓練するための概念的枠組みを提案する。
我々は、空間推論タスクの教師あり学習を可能にする、NVIDIA Omniverseで生成された合成データセットを提案する。
この研究は、対話型人間ロボットシナリオにおいて空間的理解が可能なAIシステムを具現化するための基礎的なステップとして機能する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:49:09 GMT)
Finite sample learning of moving targets [1.7] 対象のほぼ正しい推定値(PAC)を構築するのに必要なサンプル数に縛られた小説を導出する。
提案手法は,自律型緊急ブレーキへの応用について実証した。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:50:35 GMT)
The Beginner's Textbook for Fully Homomorphic Encryption [1.7] FHE(Fully Homomorphic Encryption)は、暗号化データ上で直接計算を行うことができる暗号方式である。
FHEは、サーバがクライアントのデータを暗号化形式でMLモデルで処理できるようにすることで、プライバシ保護機械学習を可能にする。
FHEの他のアプリケーションには、データ分析のセキュアなアウトソーシング、暗号化されたデータベースクエリ、プライバシー保護検索、デジタル署名のための効率的なマルチパーティなどがある。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:04:22 GMT)
A Logic of General Attention Using Edge-Conditioned Event Models (Extended Version) [1.6] 注意の第一の論理を提示する。
私たちの仕事は、注意を信念や意識のようなモダリティとして扱う。
我々のフレームワークは、人間の注意バイアスを推論するAIエージェントの例で説明します。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:56:34 GMT)
Enhancing Robot Navigation Policies with Task-Specific Uncertainty Managements [1.6] タスク特化不確実性マップ(TSM)を用いたナビゲーションポリシーにタスク特化要求を統合するGUIDEを提案する。
TSMは、異なる場所に許容される不確実性レベルを割り当て、コンテキストに基づいた不確実性管理をロボットが適応できるようにする。
実世界のテストは、タスク固有の不確実性認識が欠如しているメソッドよりも顕著なパフォーマンス向上を示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:23:15 GMT)
Reward Guidance for Reinforcement Learning Tasks Based on Large Language Models: The LMGT Framework [1.6] Language Model Guided reward Tuning (LMGT)は、強化学習のための新しい、サンプル効率の高いフレームワークである。
我々は,LMGTが探索と搾取のバランスを良好に保ち,エージェントの探索行動の指針となることを示す。
以上の結果から,LMGTはRL学習期間中に必要な計算資源を大幅に削減できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:01:22 GMT)
A Methodological Framework for Measuring Spatial Labeling Similarity [1.6] 位置構造,ラベル,属性に基づく2つの空間ラベリングをグラフに変換するためのフレームワークを提供する。
その後、それらのグラフ属性の分布を抽出し、分布の相違を効率的に反映する。
SLAMは、他の確立された評価指標と比較して、ラベリング品質の包括的かつ正確な計算方法を提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:34:03 GMT)
Development and Validation of Engagement and Rapport Scales for Evaluating User Experience in Multimodal Dialogue Systems [1.5] この尺度は、教育心理学、社会心理学、第二言語習得における関与の理論に基づいて設計された。
英語の日本語学習者は、訓練された教師と対話エージェントでロールプレイとディスカッションのタスクを完了した。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:19:28 GMT)
Parallel Belief Revision via Order Aggregation [1.5] 本稿では,並列変更を扱うために,逐次反復的信念修正演算子を拡張する方法を提案する。
TeamQueueアグリゲータとして知られる順序アグリゲータのファミリーに基づいて、独立して妥当なプロパティを復元する原則化された方法を提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:26:01 GMT)
Assessing Projected Quantum Kernels for the Classification of IoT Data [1.5] 量子機械学習(QML)アルゴリズムの開発における大きな課題は、量子アルゴリズム用に特別に設計されたデータセットの欠如である。
本研究では,IoT(Internet-of-Things)デバイスによって生成されたデータセットを,提案した量子アルゴリズムと直接互換性のあるフォーマットで利用する。
量子に着想を得た機械学習アルゴリズムの中で、PQK(Projected Quantum Kernel)は、ヒルベルト空間に符号化されたデータを古典的な空間に投影するエレガントなソリューションである。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:45:58 GMT)
Exploring Moral Exercises for Human Oversight of AI systems: Insights from Three Pilot Studies [1.4] 本稿では、AIアクターがAIシステムの効果的な人的監視を可能にする美徳を育むための手段として、道徳的演習の概念を詳述する。
我々は、道徳的演習方法論の中核となる柱を概説する - 積極的な個人的配置を導き、関係理解を育み、技術的知恵を育む。
収集したデータに基づいて、道徳的なエクササイズが組織内で責任あるAI文化を育む方法についての洞察を提供し、将来の研究の方向性を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:47:24 GMT)
A Comprehensive Benchmark for RNA 3D Structure-Function Modeling [1.4] RNA 3D構造にディープラーニングを適用するための標準化された、アクセス可能なベンチマークの欠如は、進歩を妨げる。
本稿では,RNA構造関数予測をサポートするために設計された7つのベンチマークデータセットについて紹介する。
我々のライブラリは、データの分散とエンコーディングを合理化し、データセット分割と評価のためのツールを提供し、モデル比較のための包括的でユーザフレンドリな環境を提供します。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:02:56 GMT)
A General Framework for Group Sparsity in Hyperspectral Unmixing Using Endmember Bundles [1.4] ハイパースペクトルアンミキシングは、ハイパースペクトルイメージングの基本的な問題である。
グループ空間は、各材料に一連のスペクトルシグネチャ、すなわち終端バンドルを表現している。
当社のフレームワークは、さまざまなスパーシティーを動機とする罰則を取り入れる柔軟性を提供します。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:25:05 GMT)
Explaining Unreliable Perception in Automated Driving: A Fuzzy-based Monitoring Approach [1.3] 本稿では,機械学習(ML)知覚コンポーネントに適したファジィベースの新しいモニタを提案する。
異なる動作条件が知覚コンポーネントの信頼性にどのように影響するかを人間に解釈可能な説明を提供するとともに、ランタイム安全モニターとして機能する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:22:39 GMT)
Towards eliciting latent knowledge from LLMs with mechanistic interpretability [1.3] この研究は、言語モデルから隠れた知識を引き出す現在の技術の可能性を探ることを目的としている。
Tabooモデル(Taboo model)は、特定の秘密語を明示的に記述せずに記述する言語モデルである。
我々は、ロジットレンズやスパースオートエンコーダなど、機械的解釈可能性技術に基づいて、主に自動戦略を開発する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:36:37 GMT)
Enhancing Interpretability of Sparse Latent Representations with Class Information [1.3] 変分オートエンコーダ(VAE)は潜在表現を学習するための強力な生成モデルである。
本稿では, 潜在空間の活性次元が同一クラス内のサンプル間で整合であることを保証することによって, 潜在空間の解釈可能性を高める新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:10:01 GMT)
Versatile Quantum-Safe Hybrid Key Exchange and Its Application to MACsec [1.3] 量子コンピューティングは、現在展開されている暗号に重大な脅威をもたらす。
脅威を和らげるための暗号ビルディングブロックはすでに利用可能です。
アジャイルの防御的アプローチに続き、Hybrid Authenticated Key Exchangeプロトコルが最近注目を集めている。
提案するHAKEプロトコルは VMuckle と呼ばれるプロトコルで,MACsec で LAN 参加者にセキュアな通信を確保するためのハイブリッド鍵材を提供するのに十分柔軟である。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:16:06 GMT)
Enhancing Channel-Independent Time Series Forecasting via Cross-Variate Patch Embedding [1.2] チャネル非依存(CI)モデルにクロスバリアントコンテキストを注入する軽量CDモジュールとして,CVPE(Cross-Variate Patch Embeddings)を提案する。
CVPEをマルチモーダルCI予測モデルであるTime-LLMに統合し,その有効性を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:01:46 GMT)
Personalized and Resilient Distributed Learning Through Opinion Dynamics [1.1] マルチエージェントネットワークシステムにおける分散学習の実践的課題として,パーソナライゼーションとレジリエンスの2つに対処する。
これら2つの要件間の概念的親和性により、分散勾配降下とFriedkin-Johnsenモデルを組み合わせた分散学習アルゴリズムを考案した。
提案アルゴリズムは,パーソナライズされたモデルと,標準的な戦略と比較して悪意のあるエージェントの両方で,高いグローバル精度を達成できる,合成および実世界の分散学習タスクにおけるアルゴリズムの有効性を数値的に示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:39:16 GMT)
Char-mander Use mBackdoor! A Study of Cross-lingual Backdoor Attacks in Multilingual LLMs [1.1] textbfCross-lingual textbfBackdoor textbfATtacks (X-BAT) in multilingual Large Language Models (mLLMs) について検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:45:00 GMT)
A General Upper Bound for the Runtime of a Coevolutionary Algorithm on Impartial Combinatorial Games [1.1] Coevolutionary Algorithm (CoEA) は、セルフプレイを使用してゲームプレイエージェントを訓練する。
本稿では,CoEAのランタイム解析の範囲をゲームに適用し,シミュレーションゲーム数に対する一般的な上限を証明した。
主な結果を証明した後、Nim、Chomp、Silver Dollar、Turning Turtlesといった単純なゲームにいくつかの応用を提供している。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:44:05 GMT)
aTENNuate: Optimized Real-time Speech Enhancement with Deep SSMs on Raw Audio [1.1] ATENNuateは、オンライン生音声の効率向上のために構成された、シンプルなディープな状態空間オートエンコーダである。
我々は、VoiceBank + DEMANDとMicrosoft DNS1合成テストセットでaTENNuateをベンチマークする。
ネットワークは、PSSQスコア、パラメータカウント、MAC、レイテンシの点で、従来のリアルタイムデノナイズモデルを上回っている。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:23:19 GMT)
A self-regulated convolutional neural network for classifying variable stars [1.0] 機械学習モデルは可変星の分類に有効であることが証明されている。
それぞれの星型をよく一般化するためには、高品質で代表的なデータと多数のラベル付きサンプルが必要である。
この課題は、トレーニングデータに固有のバイアスを学習し、強化するモデルにつながることが多い。
本稿では,自己規制学習プロセスを導入することで,変光星分類における分類器の信頼性を向上させる新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:09:24 GMT)
On symmetry-resolved generalized entropies [1.0] 我々は,励起状態対称性を解いた絡み合いの研究に適した計算フレームワークを開発する。
XX連鎖の格子計算を用いて結果をベンチマークする。
副産物として、我々のフレームワークは、サブシステムに含まれる対称性電荷の確率分布へのアクセスを提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:51:57 GMT)
Algorithms in the Stacks: Investigating automated, for-profit diversity audits in public libraries [1.0] アルゴリズムシステムは、図書館のような文化遺産機関によってますます採用されている。
自動コレクション多様性監査は、図書館コレクションが人口動態とテーマの多様性をいかに反映しているかを評価することを目的としている。
図書館作業員の多くは,これらのツールを,現実的かつ増大する制約の下でコレクションを評価・多様化するための,便利な,時間の節約ソリューションであるとみなしている。
同時に、監査は、しばしば複雑なアイデンティティを標準化されたカテゴリにフラットにし、地域のコミュニティのニーズを反映せず、ライブラリーのベンダーへのインフラ依存をさらに深めている。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:31:39 GMT)
Design and Evaluation of a Microservices Cloud Framework for Online Travel Platforms [1.0] 本稿では,オンライントラベルプラットフォーム(MCF-OTP)をサポートするように設計された,ユニークなマイクロサービスクラウドフレームワークの分析と統合を行う。
MCF-OTPの主な目標は、クラウドコンピューティングとマイクロサービス技術を通じて、オンライン旅行プラットフォームのパフォーマンス、柔軟性、メンテナンスを向上させることである。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:36:55 GMT)
Exploring Jailbreak Attacks on LLMs through Intent Concealment and Diversion [1.0] 大規模言語モデル(LLM)は目覚ましい進歩を遂げているが、そのセキュリティは依然として懸念されている。
主要な脅威の1つはジェイルブレイク攻撃であり、敵はモデル保護をバイパスして有害または好ましくないコンテンツを生成する。
Intent ConcealmentとdivErsionを用いてセキュリティ制約を効果的に回避する新しいブラックボックスジェイルブレイク手法ICEを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:03:15 GMT)
The pretty bad measurement [1.0] かなり良い測定値とかなり悪い測定値の両方が、それぞれのタスクについて盲目で推測するよりも、常に悪いことであることを示す。
応用として、量子状態異常検出問題にかなり悪い測定を適用し、かなり悪い量子ビットを避ける方法を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:08:48 GMT)
Hierarchical Decoupling Capacitor Optimization for Power Distribution Network of 2.5D ICs with Co-Analysis of Frequency and Time Domains Based on Deep Reinforcement Learning [1.0] 我々は,チップ上の小型信号ノイズとSSNの両方に対処するために,深部強化学習を用いた新しい2相最適化フローを提案する。
我々の知る限り、これは小さな信号ノイズとSN伝搬の両方に同時に対処する最初の二重領域最適化戦略である。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:58:29 GMT)
Electrocardiogram-based diagnosis of liver diseases: an externally validated and explainable machine learning approach [1.0] 肝疾患は世界的な健康上の課題となる。
ECGは、心臓血管と肝の相互作用を捉えて肝疾患の検出を可能にする。
肝疾患を検出するため,心電図機能を用いた木ベース機械学習モデルを訓練した。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:35:51 GMT)
Exponential concentration and symmetries in Quantum Reservoir Computing [0.9] 量子貯水池コンピューティング(QRC)は、短期的な量子機械学習のための新しいフレームワークである。
我々は、静的量子機械学習タスクを超えて、時系列処理のためのQRCの集中に対処する。
ハミルトン対称性の活用は集中を著しく抑制し、堅牢でスケーラブルなQRC実装を実現することを実証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:10:03 GMT)
LOBSTUR: A Local Bootstrap Framework for Tuning Unsupervised Representations in Graph Neural Networks [0.9] グラフニューラルネットワーク(GNN)は、教師なし学習技術と組み合わせて強力なノード表現を学習するために、ますます利用されている。
教師なしグラフ表現学習におけるブートストラップ手法の適用を目的とした新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:59:35 GMT)
Walk the Talk? Measuring the Faithfulness of Large Language Model Explanations [0.9] 大規模言語モデル(LLM)は、質問に対する答えにどのように到達したかという、もっともらしい説明を生成することができる。
これらの説明はモデルの「合理的な」プロセス、すなわち、不誠実であるということを誤解することができる。
LLM説明の忠実度を測定するための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:36:36 GMT)
GRoQ-Loco: Generalist and Robot-agnostic Quadruped Locomotion Control using Offline Datasets [0.9] GRoQ-Locoはスケーラブルで注目度の高いフレームワークで、複数の四足歩行ロボットと地形をまたいだ1つの汎用的なロコモーションポリシーを学習する。
本フレームワークは,ロボット固有のエンコーディングを組み込まずに,すべてのロボットからの固有受容データを直接操作する。
我々の実験は、高度に多様な四足歩行ロボットと地形を横断する強力なゼロショット移動を実証した。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:59:57 GMT)
Coreset selection for the Sinkhorn divergence and generic smooth divergences [0.9] CO2は、一般的な滑らかな発散に対して凸重み付けされたコアセットを効率よく生成するアルゴリズムである。
十分な正規損失と2次近似の局所同値性を示し、コアセット選択問題を最大値の誤差最小化に還元する。
我々はシンクホーンの発散にCO2を適用し、ランダムサンプリングの近似保証に適合するために、多変量的に多くのデータポイントを必要とする新しいサンプリング手順を提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 00:07:17 GMT)
Pathobiological Dictionary Defining Pathomics and Texture Features: Addressing Understandable AI Issues in Personalized Liver Cancer; Dictionary Version LCP1.0 [0.9] 本研究は肝癌の病理組織学的辞書(LCP1.0)を紹介する。
複雑な病的・放射線学的特徴(PFとRF)を臨床的に意味のある知見に翻訳するために設計されたフレームワークである。
AI出力と専門家の解釈の間に臨床的に検証されたブリッジを提供し、モデルの透明性とユーザビリティを高める。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:23:13 GMT)
Handloom Design Generation Using Generative Networks [0.8] 本論文は,ハンドローム織物に焦点をあてた衣服デザインの深層学習手法を提案する。
芸術的デザインを理解し、それらを合成する生成ニューラルネットワークモデルの能力はまだよく研究されていない。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:16:55 GMT)
Improved entanglement entropy estimates from filtered bitstring probabilities [0.8] ニューマン量子絡み合いエントロピー$SvN_A$。
多くの場合、これらの下限は、ある値$p_min$よりも低い確率でビットストリングを除去し、残りの確率を正規化することで改善できることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:26:29 GMT)
Perpetuating Misogyny with Generative AI: How Model Personalization Normalizes Gendered Harm [0.8] オープンソースのテキスト・トゥ・イメージ(TTI)パイプラインは、AI生成されたビジュアルコンテンツのランドスケープにおいて支配的になっている。
本研究では,オープンソースTTIモデルを共有・開発するための最もアクティブなプラットフォームであるCitvitAIの探索的社会技術分析について述べる。
我々は、安全でない仕事用コンテンツ(NSFW)の急増と、実際の個人を模倣することを目的としたかなりの数のモデルを見出した。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:13:33 GMT)
Correlated noise can be beneficial to quantum transducers [0.8] ノイズはデコヒーレンスを引き起こし、量子アプリケーションの性能を制限する悪名高い要因である。
結合量子系におけるノイズ相関を利用して、ノイズの全体的影響を著しく抑制できることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 00:46:44 GMT)
ThermoONet -- a deep learning-based small body thermophysical network: applications to modelling water activity of comets [0.7] 我々は、彗星の温度と水の氷束を予測するために設計されたニューラルネットワークであるThermoONetを開発するために機械学習アプローチを採用している。
性能評価の結果,サーモネットは地下温度で約2%の低い平均誤差を達成できた。
67P/チュリュモフ・ゲラシメンコ彗星と21P/ジャコビニ・ジンナー彗星の水生産率曲線を適合させてネットワークの有効性と効率を実証した。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:09:20 GMT)
Reliable Decision Support with LLMs: A Framework for Evaluating Consistency in Binary Text Classification Applications [0.7] 本研究では,大言語モデル(LLM)のバイナリテキスト分類における一貫性を評価するフレームワークを提案する。
我々は,サンプルサイズ要件を定め,不適切な応答の指標を開発し,レータ内およびレータ間信頼性を評価する。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:12:58 GMT)
A finite dimensional trace formula [0.7] フォン・ノイマンのエルゴード定理の跡を取り、ユニタリ行列族のトレース公式を得る。
また、複素係数を持つ結晶測度の族も構成する。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:15:46 GMT)
UPTor: Unified 3D Human Pose Dynamics and Trajectory Prediction for Human-Robot Interaction [0.7] 本研究では,グローバル座標フレームにおける全体ポーズと軌道キーポイントの予測手法を提案する。
我々は、市販の3次元ポーズ推定モジュール、グラフアテンションネットワーク、コンパクトで非自己回帰的なトランスフォーマーを使用する。
従来の研究と比較して、我々のアプローチはコンパクトでリアルタイムであり、全てのデータセットにわたる人間のナビゲーション動作を予測する上で正確であることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:57:25 GMT)
Think, Reflect, Create: Metacognitive Learning for Zero-Shot Robotic Planning with LLMs [0.7] メタ認知学習を大規模言語モデル(LLM)に統合する初期段階フレームワークを提案する。
提案するフレームワークは, LLMを動力とするロボットエージェントに, スキル分解と自己回帰機構を備える。
実験の結果,メタ認知学習を利用したLLMフレームワークは,既存のベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:51:18 GMT)
BioCube: A Multimodal Dataset for Biodiversity Research [0.7] 生態学および生物多様性研究のための微細なグローバルデータセットであるBioCubeを紹介する。
BioCubeは、画像、オーディオ記録、説明、環境DNA、植生指標、農業、森林、土地の指標、高解像度気候変数を通じて種を観察する。
すべての観測は、2000年から2020年の間、WGS84の測地システムの下で測地的に一致している。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:09:44 GMT)
Protecting information in a parametrically driven hybrid quantum system [0.7] パラメトリック駆動ハイブリッドシステムの状態に符号化された量子情報は、スピンアンサンブルの不均一性に起因する可能性のあるデコヒーレンスに対して強く保護されていることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:20:58 GMT)
Upgrading Democracies with Fairer Voting Methods [0.6] 我々は、代替の優先投票手法を用いて、現実世界の民主主義をアップグレードする方法を示す。
スイスのアララウ市で適用された新たな参加型予算案を厳格に評価することで、大きな投票結果が明らかになる。
また、公正な投票方法を支持する市民が提示する強力な民主的価値観を明らかにした。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:31:43 GMT)
Quantum Reservoir Computing for Realized Volatility Forecasting [0.6] 量子貯水池計算は、非線形時間依存をモデル化するための機械学習と量子計算を組み合わせる。
本研究では,量子貯水池計算のボラティリティ予測への応用について検討する。
以上の結果から,提案手法は様々な指標のベンチマークモデルより一貫して優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:02:13 GMT)
Predicting Field Experiments with Large Language Models [0.6] 本研究では,フィールド実験結果の予測を自動生成するフレームワークを提案し,評価する。
この枠組みを著名な経済学文献から抽出した319の実験に適用すると、顕著な予測精度は78%となる。
この歪みは,性差,民族性,社会的規範など,いくつかの要因に起因している。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:10:12 GMT)
Algorithmic Hiring and Diversity: Reducing Human-Algorithm Similarity for Better Outcomes [0.6] 我々は、ショートリストの段階で平等な表現を強制することは、より多様な最終雇用に変換されないことを理論的、経験的に示している。
この結果に影響を及ぼす重要な要因は,アルゴリズムのスクリーニング基準と人材採用担当者の評価基準との相関である。
本稿では,マネージャが見落としやすい候補を選別し,その評価基準に従って競争力を保つことで,ショートリストの多様化を明示的に図った補完的アルゴリズムアプローチを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:09:43 GMT)
Federated prediction for scalable and privacy-preserved knowledge-based planning in radiotherapy [0.6] FedKBP+は、放射線治療計画における現実の応用における予測タスクのための総合的な連邦学習(FL)プラットフォームである。
参加者間のコミュニケーションを支援するために,Google Remote Procedure Call (gRPC) に基づく統一的な通信スタックを実装した。
我々は,スケールアテンションネットワーク(SA-Net)を予測モデルとして,FedKBP+を3つの予測タスクで評価した。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:35:49 GMT)
Effects of the Cyber Resilience Act (CRA) on Industrial Equipment Manufacturing Companies [0.5] CRA(Cyber Resilience Act)は、厳格なサイバーセキュリティ要件を満たすことを保証することで、デジタル製品やサービスのセキュリティを強化することを目的とした、欧州連合(EU)の新たな規制である。
本稿では,産業機器メーカーがCRAに準拠する準備中に期待する課題について,包括的調査を通じて検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:09:56 GMT)
Informatics for Food Processing [0.5] この章は、食品情報学の発展における機械学習、人工知能(AI)、データサイエンスの変革的な役割を強調している。
これらの問題に対処するため、この章では、処理レベルを推測するために栄養組成データに基づいて訓練されたランダムな森林モデルであるFoodProXを含む、新しい計算手法を提示している。
この章の重要なコントリビューションは、Open Food Factsデータベースを使った新しいケーススタディで、マルチモーダルAIモデルが構造化データと非構造化データを統合して、大規模に食品を分類する方法を示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:44:31 GMT)
Structural Inference: Interpreting Small Language Models with Susceptibilities [0.5] 本研究では,ニューラルネットワークをベイズ統計力学系として扱う線形応答フレームワークを開発した。
データ分散の小さな摂動は、ネットワークの選択されたコンポーネントに局在した観測可能領域の後方期待の1次変化を誘導する。
結果として生じる感受性は、局所的なSGLDサンプルで効率的に推定され、署名された個々のコントリビューションに分解される。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:40:57 GMT)
Sinusoidal Initialization, Time for a New Start [0.5] 初期化はディープニューラルネットワークトレーニングにおいて重要な役割を担い、収束、安定性、一般化に直接影響を与える。
本稿では,ネットワーク全体の重みの広がりとバランスを改善するために,正弦波関数を用いて構造的重み行列を構築する新しい決定論的手法を提案する。
実験の結果,最終検証精度は4.9%,収束速度は20.9%向上した。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:54:36 GMT)
FlowBERT: Prompt-tuned BERT for variable flow field prediction [0.5] 本研究では,大言語モデル(LLM)からの知識伝達に基づくユニバーサルフロー場予測フレームワークを提案する。
提案手法は,90%以上の精度を維持しながら予測時間を秒に短縮する。
発達した知識伝達パラダイムは、高速流体力学予測のための新しい方向を確立する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:25:38 GMT)
SHAP zero Explains Biological Sequence Models with Near-zero Marginal Cost for Future Queries [0.5] SHAP 0は、大規模な生物学的データセット間でShapley値のコストを償却する新しいアルゴリズムである。
1回のモデルスケッチのステップの後、SHAP 0は将来のクエリでほぼゼロの限界コストを実現する。
この研究は、生物学におけるブラックボックスシーケンスモデルの原理的、効率的、スケーラブルな解釈可能性への扉を開く。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:37:28 GMT)
Arithmetics-Based Decomposition of Numeral Words -- Arithmetic Conditions give the Unpacking Strategy [0.5] 本稿では,算術基準に基づく新しい数値除算器を提案する。
我々は、n の数値が sqrt(n) よりも大きい乗算子、n/2 より小さい和、および sqrt(n) より小さい因子を持つことを発見した。
我々は273言語でインクリメンタルな教師なし文法帰納法の適用性を検証した。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:58:24 GMT)
Adaptive stable distribution and Hurst exponent by method of moments moving estimator for nonstationary time series [0.5] 我々は,パラメータを毎回別々に推定する移動推定器という,より非依存的なアプローチに焦点をあてる。
本稿では,Hurst指数にも影響を及ぼすα-Stable分布の応用例を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:36:49 GMT)
CONSIGN: Conformal Segmentation Informed by Spatial Groupings via Decomposition [0.5] ほとんどの機械学習ベースのイメージセグメンテーションモデルは、各ピクセルにおける各クラスラベルの予測確率を表す画素単位の信頼スコアを生成する。
コンフォーマル予測(CP)は、信頼度スコアを統計的に妥当な不確実性推定に変換するための原則的な枠組みを提供する。
画像の不確実性推定に空間相関を組み込んだCONSIGNを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:19:37 GMT)
ChatNVD: Advancing Cybersecurity Vulnerability Assessment with Large Language Models [0.5] ChatNVDはLarge Language Models(LLM)を利用したサポートツールで、ソフトウェア脆弱性のアクセス可能でコンテキストに富んだ要約を生成する。
我々は,OpenAIによるGPT-4o Mini,MetaによるLLaMA 3,GoogleによるGemini 1.5 Proの3つの著名なLCMを利用して,ChatNVDの3つの変種を開発した。
その結果、GPT-4o Miniは他のモデルよりも優れており、92%以上の精度と低いエラー率を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:09:07 GMT)
BACON: A fully explainable AI model with graded logic for decision making problems [0.5] 本稿では,意思決定問題に対する説明可能なAIモデルの自動トレーニングフレームワークであるBACONを紹介する。
BACONは、完全な構造的透明性と正確な論理ベースのシンボリック説明を提供しながら、高い予測精度を達成する。
これらの結果から、BACONは実践的で原則的なアプローチとして、信頼できるAIを提供する可能性を示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:39:05 GMT)
Evaluating the efficacy of LLM Safety Solutions : The Palit Benchmark Dataset [0.5] 大規模言語モデル(LLM)は、医療や金融といった産業において、ますます重要なシステムに統合されている。
これにより、ユーザが悪意のあるクエリを送信し、LLMシステムは所有者に害を与える応答を出力する、さまざまな攻撃が発生する。
これらの脅威に対抗するためにセキュリティツールが開発されているが、その有効性とユーザビリティの正式な評価はほとんどない。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:34:53 GMT)
Bell sampling in Quantum Monte Carlo simulations [0.5] 量子モンテカルロ法(QMC)は大規模量子多体系の数値研究に不可欠である。
本稿では,ベルサンプリングを利用した新しいQMCフレームワークであるBell-QMCを紹介する。
我々は,ベルQMCが観測可能なクラスの両方を効率よく,偏りのない推定を可能にすることを実証した。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:00:16 GMT)
CSAGC-IDS: A Dual-Module Deep Learning Network Intrusion Detection Model for Complex and Imbalanced Data [0.4] 本稿では,深層学習に基づくネットワーク侵入検出モデルであるCSAGC-IDSを提案する。
CSAGC-IDSは、クラス不均衡のために高品質なデータを生成する自己注意型畳み込み条件生成対向ネットワークであるSC-CGANを統合している。
CSAGC-IDSの精度は84.55%、F1スコアは84.52%である。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:27:51 GMT)
Federated learning in low-resource settings: A chest imaging study in Africa -- Challenges and lessons learned [0.4] 本研究では,アフリカにおける低リソース環境下での胸部X線を用いた結核診断におけるフェデレートラーニング(FL)の利用について検討した。
FLは、病院が患者の生データを共有することなく、AIモデルを協調的に訓練することを可能にする。
サハラ以南のアフリカにおけるFLの実装は、インフラの貧弱、信頼性の低いインターネット、デジタルリテラシーの制限、AI規制の弱さといった課題に直面している。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:23:52 GMT)
Transfer learning of optimal QAOA parameters in combinatorial optimization [0.4] 本研究では,ある問題インスタンスの事前学習されたQAOAパラメータを異なるCOPインスタンスに再利用する手法であるトランスファーラーニング(TL)について検討する。
本研究では、旅行セールスマン問題(TSP)、ビン包装問題(BPP)、クナップサック問題(KP)、最大カット問題(MaxCut)、ポートフォリオ最適化問題(PO)の小さな事例を選択する。
我々は,BPP のパラメータを持つ D-Wave Advantage 量子アニールを用いて,クロスプラットフォーム TL が可能であることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:55:12 GMT)
Towards Verifiability of Total Value Locked (TVL) in Decentralized Finance [0.4] Total Value Lockedは、分散ファイナンスプロトコルに蓄積された暗号通貨の合計値を測定することを目的としている。
ブロックチェーンデータは公開されているが、TVLの計算方法はよく理解されていない。
オンチェーンデータと標準バランスクエリによる検証が可能なTVLの測定基準である,検証可能なトータルバリューロック'(vTVL)を導入する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:24:59 GMT)
OntoGSN: An Ontology for Dynamic Management of Assurance Cases [0.4] IntoGSN: Ontology and support OWL for management ACs in the Goalcturing Notation (GSN) standard。
OntoGSNは知識表現とクエリ可能なグラフを提供する。
我々は,大規模言語モデルにおけるロバスト性の保証を含む事例において,コントリビューションの有用性を実証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:15:16 GMT)
Optimal Transport on Categorical Data for Counterfactuals using Compositional Data and Dirichlet Transport [0.4] 最適輸送に基づくアプローチは、例えばアルゴリズムの識別を定量化するために反事実を導出するために注目を集めている。
本稿では,実データセットを用いて分類変数を輸送する手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:46:44 GMT)
Unintended Bias in 2D+ Image Segmentation and Its Effect on Attention Asymmetry [0.4] 教師付き事前訓練モデルはディープラーニング、特に画像分割タスクに広く利用されている。
しかし、バイオメディカルイメージングのような特殊なデータセットに適用すると、事前訓練された重み付けは意図しないバイアスをもたらすことが多い。
本研究では,これらのバイアスの影響について検討し,緩和策を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:11:53 GMT)
Towards Achieving Concept Completeness for Textual Concept Bottleneck Models [0.4] テキスト・コンセプト・ボトルネック・モデル(英: Textual Concept Bottleneck Models, TBM)は、最終的な予測を行う前に、一連の健全な概念を予測するテキスト分類のための解釈・バイ・デザイン・モデルである。
本稿では,CT-CBM(Complete Textual Concept Bottleneck Model)を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:33:07 GMT)
AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges [0.4] この研究はAIエージェントとエージェントAIを区別し、構造化された概念分類、アプリケーションマッピング、課題分析を提供する。
ジェネレーティブAIは前駆体として位置づけられており、AIエージェントはツールの統合、エンジニアリングの促進、推論の強化を通じて前進している。
エージェントAIシステムは、マルチエージェントコラボレーション、動的タスク分解、永続メモリ、オーケストレーション自律性によって特徴付けられるパラダイムシフトを表している。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:49:56 GMT)
Tensor Factorized Hamiltonian Downfolding To Optimize The Scaling Complexity Of The Electronic Correlations Problem on Classical and Quantum Computers [0.4] 我々は、テンソル分解ハミルトンダウンフォールディング(TFHD)とその量子アナログ、量子化ダウンフォールディング(QD)を導入する。
TFHDは、ディープ最適ブロック符号化回路で実行されるランク2ネットワークに、すべての上位オブジェクトを崩壊させる。
古典計算機と量子コンピュータの両方で高価な量子化学アルゴリズムの超クアッドレート高速化を実証する。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:28:29 GMT)
Streamlining HTTP Flooding Attack Detection through Incremental Feature Selection [0.3] 本稿では,そのような攻撃を検知する手法を提案する。
INFS-MICCは、非常に関連性が高く独立した機能サブセットのサブセットを特定するのに役立つ。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:19:03 GMT)
The Capability of Code Review as a Communication Network [0.3] 本研究の目的は,コードレビューの理論を明示的な通信ネットワークとして形式化することである。
コードレビューにおいて、いかに広く、どのくらいの速さで情報を拡散できるかを定量化します。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:33:29 GMT)
Pivot Language for Low-Resource Machine Translation [0.3] 私たちはヒンディー語をネパール語を英語に翻訳する重要な言語として使用しています。
本稿では,ネパール語を英語に翻訳するための2つの手法について論じる。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:10:10 GMT)
Instance Segmentation for Point Sets [0.3] PointNet [QSMG16]やPointNet++ [QYSG17]のようなニューラルネットワークアーキテクチャは、ディープラーニングを3Dポイントセットに適用可能にする。
本稿では,2つのサンプリング手法を用いてこの問題に対処する。
どちらのアプローチも大きなサブサンプルでも同等に機能するが、ランダムベースの戦略は速度とメモリ使用率の面で最大の改善をもたらす。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:40:01 GMT)
3D Reconstruction from Sketches [0.3] 複数のスケッチから3Dシーンを再構成する問題を考察する。
本稿では,(1)対応点を用いて複数のスケッチを縫合するパイプライン,(2)CycleGANを用いて縫合スケッチをリアルな画像に変換するパイプライン,(3)MegaDepthと呼ばれる事前学習された畳み込みニューラルネットワークに基づくアーキテクチャを用いて画像の深度マップを推定するパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:11:49 GMT)
Self Distillation via Iterative Constructive Perturbations [0.3] 本稿では,循環最適化手法を用いてモデルとその入力データを並列に最適化し,より優れたトレーニングを行う新しいフレームワークを提案する。
モデルのパラメータをデータとデータに交互に変更することにより、本手法は適合性と一般化のギャップを効果的に解決する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:15:27 GMT)
Sei Giga [0.2] 内部テストネットでは、Gigaは5ギガガ/秒のスループットと400ms以下のファイナリティを達成した。
GigaはAutobahnを使って、DAとコンセンサス層を別々にコンセンサスし、コンセンサスの前にDAレイヤ上のPoAにf+1の投票を要求する。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:06:35 GMT)
Gender Trouble in Language Models: An Empirical Audit Guided by Gender Performativity Theory [0.2] 言語モデルは有害な性別のステレオタイプをエンコードし、永続する。
これらのバイナリカテゴリの1つに適切に該当しない性的な用語は削除され、謝罪される。
以上の結果から,言語モデルにおける性障害の定義と対処方法の再評価の必要性が示唆された。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:36:47 GMT)
Hamiltonian-Driven Architectures for Non-Markovian Quantum Reservoir Computing [0.2] 非マルコフ量子貯水池計算のためのハミルトンレベルフレームワークを提案する。
非マルコフ的条件下での動作はマルコフ的限界に比べて記憶減衰が著しく遅くなることを示す。
非マルコフ貯水池は、適切な時間進化ステップサイズで、高次非線形自己回帰移動平均タスクにおいて優れた性能を示すことを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:50:54 GMT)
Optimizing Binary and Ternary Neural Network Inference on RRAM Crossbars using CIM-Explorer [0.2] 本稿では,BNNおよびTNN推論をRRAMクロスバー上で最適化するためのモジュールツールキットであるCIM-Explorerを紹介する。
CIM-Explorerには、エンドツーエンドのコンパイラスタック、複数のマッピングオプション、シミュレータが含まれている。
様々なマッピングやクロスバーパラメータの予測精度を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:54:48 GMT)
RadCLIP: Enhancing Radiologic Image Analysis through Contrastive Language-Image Pre-training [0.1] RadCLIP(Radlogic Contrastive Language- Image Pre-Training)は、Vision Language Pre-Trainingフレームワークを利用した視覚言語基礎モデルである。
RadCLIPは、放射線画像と対応するテキストアノテーションを合わせるために事前訓練され、放射線画像のための堅牢な視覚バックボーンを形成した。
主なコントリビューションは,多種多様なラジオロジックな2D/3D画像テキストペアを用いた大規模データセットのキュレーション,2D画像の統合のための注意機構を用いたスライスプールアダプタ,および様々なラジオロジック下流タスクにおけるRadCLIPの総合評価である。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:19:09 GMT)
From What to How: A Taxonomy of Formalized Security Properties [0.1] 本稿では,自己適応型文脈で使用可能なセキュリティ特性のSDLC分類法を提案する。
Event-B形式言語を使用して、結果の分類の正しさを検証し、確認します。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:42:08 GMT)
Certifiably Safe Manipulation of Deformable Linear Objects via Joint Shape and Tension Prediction [0.1] 本稿では,DLO操作のための安全な動作計画とフレームワークを提案する。
本手法のコアとなるのは,DLOの将来の形状と張力を共同で推定する予測モデルである。
最先端の手法と比較すると,安全違反を回避しつつ高いタスク成功率を達成することができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:50:29 GMT)
A Multi-Messenger Search for Exotic Field Emission with a Global Magnetometer Network [0.1] 従来の天文学的な観測と組み合わせた量子センサネットワークは、マルチメーカ天文学の新たなモダリティとして現れつつある。
我々は,BSM(Before-the-Standard Model)物理の結果として,量子センサネットワークのアストロフィジカル信号に対する感度をモデル化するためのデータ駆動型アプローチを開発した。
この解析法を用いて、ブラックホール融合時に放出されるBSM場に対する精密量子センサの地上ネットワークを用いた最初の直接探索を行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:52:28 GMT)
Engineering the Kondo impurity problem with alkaline-earth atom arrays [0.1] コールドアルカリ-アース(-様)原子を用いた近藤不純物問題の量子シミュレーション実験を提案する。
コールド原子量子シミュレーターで観測可能な様々な観測装置における近藤効果のホールマークシグネチャを解析する。
また, 不純物部位の化学的ポテンシャルを局所的に調整することにより, コンド効果を回復できることが示唆された。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:20:05 GMT)
Deep Koopman operator framework for causal discovery in nonlinear dynamical systems [0.1] 我々は、深いクープマン作用素理論の定式化を用いて、新しい因果探索アルゴリズムKausalを開発した。
Kausalは、科学的理解の向上、説明可能な意思決定、より正確なモデリングのための原因影響メカニズムを特定することを目的としている。
我々の数値実験は、因果信号の発見と特徴付けにおけるKausalの優れた能力を示している。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:43:48 GMT)
Acoustic and Machine Learning Methods for Speech-Based Suicide Risk Assessment: A Systematic Review [0.1] 本研究は,音声の音響解析による自殺リスク評価における人工知能(AI)と機械学習(ML)の役割を体系的に評価する。
研究は、方法の標準化、マルチモーダル分析の拡張、そして、臨床自殺リスク評価におけるAI統合を支援するために、より大きく多様なデータセットを活用することに焦点を当てるべきである。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:05:30 GMT)
Rise of conditionally clean ancillae for efficient quantum circuit constructions [0.1] 最近[NZS24]が探求した新しい量子資源である条件付きクリーンアンシラ量子ビットを導入し、従来のクリーンアンシラと汚いアンシラのギャップを埋める。
開始と終了は未知の状態であり、明示的なキュービット割り当ての空間オーバーヘッドを避けるために、既存のシステムキュービットから借用することができる。
本研究では, 条件付きクリーンアンシラを利用して, ゲート数と繰り返し回数を低減し, 特にアンシラが限られた回路構成を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:51:14 GMT)
GLiNER-BioMed: A Suite of Efficient Models for Open Biomedical Named Entity Recognition [0.1] GLiNER-BioMedは、バイオメディシンに特化したジェネラリストモデルと軽量モデル(GLiNER)のドメイン適応スイートである。
従来の手法とは対照的に、GLiNERは任意のエンティティ型を推論するために自然言語ラベルを使用するため、ゼロショット認識が可能である。
いくつかのバイオメディカルデータセットの実験では、GLiNER-BioMedは両方のゼロショットシナリオで最先端を達成している。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:08:52 GMT)
Moving Beyond Medical Exam Questions: A Clinician-Annotated Dataset of Real-World Tasks and Ambiguity in Mental Healthcare [0.1] 精神医療における5つの重要な意思決定領域にまたがる専門家による注釈付きデータセットを提案する。
このデータセットは、微妙な臨床推論と、メンタルヘルス実践者が遭遇する日々のあいまいさを捉えるように設計されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:32:01 GMT)
hChain 4.0: A Secure and Scalable Permissioned Blockchain for EHR Management in Smart Healthcare [0.0] hChain 4.0は、セキュアでスケーラブルなデータインフラストラクチャを提供するために、許可付きブロックチェーンを使用している。
提案フレームワークは、患者の身元を匿名化することで、医療研究のための匿名化された健康データ共有を可能にする。
実験により,提案手法は高いスケーラビリティ,費用対効果,セキュリティの検証を実現することが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:13:48 GMT)
Zk-SNARK for String Match [0.0] 我々はzk-SNARKを利用したセキュアで効率的な文字列マッチングプラットフォームを提案する。
当社のソリューションでは,公開プラットフォームにプライベート文字列が現れるかどうかを,文字列自体を公開せずに検証することが可能です。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:01:48 GMT)
YESciEval: Robust LLM-as-a-Judge for Scientific Question Answering [0.0] 大規模言語モデル (LLM) は現代の検索エンジンに科学的疑問を投げかけるが、その評価は未定である。
評価器の最適化バイアスを軽減するために,きめ細かなルーリック評価と強化学習を組み合わせたオープンソースのフレームワークであるYESciEvalを紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:30:46 GMT)
XDementNET: An Explainable Attention Based Deep Convolutional Network to Detect Alzheimer Progression from MRI data [0.0] 本稿では,多面的ブロック,特殊空間的アテンションブロック,グループ化されたクエリアテンション,マルチヘッドアテンションを取り入れた新しいディープラーニングアーキテクチャを提案する。
ネットワークがMRI画像から重要な情報を取得する能力は、ADステージの分類において優れた精度で示される。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:17:28 GMT)
Word length predicts word order: "Min-max"-ing drives language evolution [0.0] 本稿では,1500以上の言語からなる大規模タグ付き並列データセットに基づいて,単語順変化の普遍的メカニズムを提案する。
発見は、処理と情報構造が競合する圧力によって駆動される言語進化の「ミニマックス」理論が統合されていることを示唆している。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:25:55 GMT)
Who Introduces and Who Fixes? Analyzing Code Quality in Collaborative Student's Projects [0.0] 本稿では,組込みシステムコース内のグループプロジェクトにおいて,エラーがどのように導入され,修正されるかを検討する。
学生はCと組み込みシステムのコード品質ルールを学ぶ。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:02:45 GMT)
When to retrain a machine learning model [0.0] 現実世界の機械学習モデルを維持する上で重要な課題は、データの継続的かつ予測不可能な進化に対応することだ。
本研究では,境界距離で評価されたモデル性能の進化を連続的に予測して決定する不確実性に基づく手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:55:56 GMT)
When Bias Backfires: The Modulatory Role of Counterfactual Explanations on the Adoption of Algorithmic Bias in XAI-Supported Human Decision-Making [0.0] この研究は採用決定をシミュレートし、偏りのあるAIレコメンデーションが時間の経過とともに人間の判断にどのように影響するかを調べる。
その結果,対象候補者の資格が同等であった時期の70%は,参加者がAIレコメンデーションに従っていたことが示唆された。
相互作用後の段階では、参加者の独立した決定は、以前に反実的な説明が提供されなかった場合のバイアスと一致したが、説明が与えられた場合のバイアスを逆転させた。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:00:28 GMT)
Vulnerability of Transfer-Learned Neural Networks to Data Reconstruction Attacks in Small-Data Regime [0.0] トレーニングデータ再構築攻撃は、敵がリリースしたモデルのトレーニングデータの一部を復元することを可能にする。
再構成ニューラルネットワークがトレーニングデータとモデル重みの間の(ランダムな)マッピングを反転させるのを学習する攻撃について考察する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:09:22 GMT)
VisTopics: A Visual Semantic Unsupervised Approach to Topic Modeling of Video and Image Data [0.0] この研究は、大規模なビジュアルデータセットを分析するために設計された計算フレームワークであるVisTopicsを紹介した。
VisTopicsを452のNBC Newsビデオのデータセットに適用すると、11,070フレームを6,928の重複フレームに減らし、セマンティックに分析して35のトピックを明らかにした。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:59:41 GMT)
Unified Microphone Conversion: Many-to-Many Device Mapping via Feature-wise Linear Modulation [0.0] 統一マイクロホン変換(Unified Microphone Conversion)は、音声イベント分類システムにおいて、デバイス変動を抑えるために設計された統合生成フレームワークである。
提案手法は最先端技術よりも2.6%優れ,マクロ平均F1スコアの変動率を0.8%低減する。
論文参考訳(メタデータ) (Tue, 20 May 2025 03:14:33 GMT)
Unified AI for Accurate Audio Anomaly Detection [0.0] 本稿では,高精度な音声異常検出のための統合AIフレームワークを提案する。
高度なノイズ低減、特徴抽出、機械学習モデリング技術を統合する。
このフレームワークはTORGOやLibriSpeechといったベンチマークデータセットで評価されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:56:08 GMT)
Ultrafast All-Optical Measurement of Squeezed Vacuum in a Lithium Niobate Nanophotonic Circuit [0.0] 我々は、集積フォトニクスにおける量子状態トモグラフィーを実現し、ナノフォトニクス回路における圧縮真空の生成と全光学ウィグナートモグラフィーを実証する。
我々は分散工学を用いてフェムト秒パルスの歪みのない伝播を可能にし、超広帯域動作帯域を実現する。
室温統合プラットフォームにおける全光学超高速量子情報処理を実現するためのコースを図示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:53:25 GMT)
TreeCut: A Synthetic Unanswerable Math Word Problem Dataset for LLM Hallucination Evaluation [0.0] 無限に答えられない数学語問題とその解答可能な問題を生成するデータセットであるTreeCutを紹介する。
実験によると、TreeCutはGPT-4oやo3-miniを含む大きな言語モデルで幻覚を効果的に誘発する。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:13:56 GMT)
Towards complexity of primary-deformed Virasoro circuits [0.0] 一次作用素のビラソロ代数とフーリエモードによって生成されるユニタリ量子回路について検討する。
フービニ・スタディ計量によって誘導されるコスト関数を考察し、その時間進化から二次次数への普遍的な表現を提供する。
副生成物として、非変形回路への回帰として、フビニ・スタディ計量とヴィラソロ群の共役軌道上のK"ハラー計量を関連付ける。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:52:57 GMT)
Towards Model-Agnostic Federated Learning over Networks [0.0] 異種データとモデルのネットワークに対するモデルに依存しないフェデレーション学習手法を提案する。
本手法は経験的リスク最小化の例であり,データのネットワーク構造から正規化用語を導出する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:51:34 GMT)
Towards Generating Realistic Underwater Images [0.0] VAROSデータセットを用いて,現実的な水中画像を生成するための画像翻訳モデルの性能について検討する。
ペア画像変換では、Pix2pixはそのペア監督とPatchGAN識別器により最高のFIDスコアを得る。
非ペア方式では、CycleGANはサイクル一貫性損失を利用して競合的なFIDスコアを得るが、CUTはサイクル一貫性を対照的な学習に置き換え、より高いSSIMを得る。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:44:19 GMT)
To Be or Not To Be: Vector ontologies as a truly formal ontological framework [0.0] エドマンド・ハッサールは20世紀初頭に「形式オントロジー」という言葉を作った。
多くの著者やフッサール自身も、彼らが公式な基礎情報であると主張するものを開発した。
私は、検査において、これらの主張はどれも真のハッサール的な意味では形式的ではないと論じます。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:58:38 GMT)
Time to Embed: Unlocking Foundation Models for Time Series with Channel Descriptions [0.0] 伝統的な時系列モデルはタスク固有であり、しばしばデータセット固有のトレーニングと広範な機能工学に依存している。
我々は、共有、転送可能、ドメイン認識表現を学習する多変量時系列の基盤埋め込みモデルである$textbfCHARM$を紹介した。
モデルはJEPA(Joint Embedding Predictive Architecture)を用いてトレーニングされ、新しい拡張スキームと、解釈性とトレーニング安定性を改善するために設計された損失関数を備える。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:58:54 GMT)
Time Series Similarity Score Functions to Monitor and Interact with the Training and Denoising Process of a Time Series Diffusion Model applied to a Human Activity Recognition Dataset based on IMUs [0.0] 拡散確率モデルは 合成センサー信号を生成できる
トレーニングプロセスは、前処理で付加された雑音と拡散モデルで予測された雑音との差を測定する損失関数によって制御される。
我々は、複数の類似度指標を調査し、トレーニングと合成プロセスを監視して、この問題を克服するために既存のメトリクスを適用します。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:38:17 GMT)
TherMod Communication: Low Power or Hot Air? [0.0] Basar が提案した TherMod は KLJN スキームの "低消費電力" 実装であると主張している。
バザーの無線適応に固有の追加部品は、消費電力を大幅に増加させると説明する。
我々は、元のKLJN方式のセキュリティ要求が、この無線適応に直接翻訳されることはなく、重大なセキュリティ侵害を示唆していることを明らかにした。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:50:50 GMT)
The final solution of the Hitchhiker's problem #5 [0.0] 『ヒッチハイカーガイド』は、依存モデルコミュニティにおける準コピュラ問題の評価を高めている。
分析的アプローチを用いて、元の質問に対する完全な回答を提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:56:53 GMT)
The Relative Fermionic Entropy in Two-Dimensional Rindler Spacetime [0.0] 二次元リンドラー時空におけるフェルミオン相対エントロピーは、モジュラー理論と縮小一粒子密度作用素の両方を用いて研究される。
一般ガウス状態に対する相対エントロピーの公式が導出される。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:33:49 GMT)
The Quantum Toll Framework: A Thermodynamic Model of Collapse and Coherence [0.0] 本稿では,従来の量子オブザーバをコヒーレンス制約インタフェースの特別なケースとして再配置する熱力学的レンダリングモデルを提案する。
観測の熱力学的コストは,情報消去だけでなく,予測状態の安定化も含んでいることを示す。
このモデルは、古典的な出現、時間的非対称性、意識や象徴的認知を引き起こすことなく測定する。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:07:05 GMT)
The Post Double LASSO for Efficiency Analysis [0.0] 大規模な(全体的な)データの可用性が、非効率性の検出をより困難にしていることを示す。
次に、機械学習手法を用いて、フロンティア自体のプリミティブを適切に推定する方法を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:32:26 GMT)
The Hidden Dangers of Outdated Software: A Cyber Security Perspective [0.0] 時代遅れのソフトウェアは、2025年のサイバーセキュリティ環境において、強力で未承認の脅威のままだ。
この記事では、ソフトウェア脆弱性の性質、パッチに対するユーザ抵抗の根本原因、問題を複雑にする組織的障壁について、詳細な分析を行っている。
自動化と認識キャンペーンを含む実行可能なソリューションは、これらの欠点に対処することを提案している。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:36:29 GMT)
The Evolution of Alpha in Finance Harnessing Human Insight and LLM Agents [0.0] 市場ベンチマークを上回るアルファリターンの探索は、大きな変革を遂げた。
本稿では,この進歩を辿る5段階の分類を包括的に紹介する。
提案された分類学は、成熟度を評価し、インフラを整合させ、次世代アルファシステムの責任ある開発を導く統一的な枠組みを提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 00:51:43 GMT)
The Achilles Heel of AI: Fundamentals of Risk-Aware Training Data for High-Consequence Models [0.0] 高頻度ドメインのAIシステムは、厳密なリソース制約の下で運用しながら、稀で高インパクトなイベントを検出する必要がある。
ラベルのボリュームを情報的価値よりも優先する従来のアノテーション戦略は冗長性とノイズをもたらす。
本稿では、ラベルの多様性、モデル誘導選択、限界ユーティリティベースの停止を強調するトレーニングデータ戦略であるスマートサイズについて紹介する。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:57:35 GMT)
Text embedding models can be great data engineers [0.0] テキスト埋め込みによる自動データエンジニアリングパイプラインであるADEPTを提案する。
ADEPTは、さまざまなデータセットセットにおいて、最も優れた既存のベンチマークよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:12:19 GMT)
Superactivation of memory effects in a classical Markov environment [0.0] バックフロー・オブ・インフォメーション(SBFI)のスーパーアクティベーションとして知られる現象について検討する。
我々は,SBFIが絡み合う必要はなく,ヘルストロムアンサンブルの量子性のみを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:44:28 GMT)
State-Based Quantum Simulation: Releasing the Powers of Quantum States and Copies [0.0] 我々は、ハミルトニアンが状態の点で分解される量子シミュレーション法を提案する。
古典非線形および時間遅れの常微分方程式が状態ベース法でどのようにシミュレートできるかを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:05:26 GMT)
Spontaneous Collapse of the Wavefunction: A Testable Proposal Motivated by Discrete Physics [0.0] 波動関数崩壊の新しい機構を含む量子力学の修正形式を提案する。
この崩壊は量子測定問題の解となる。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:00:49 GMT)
Soft Prompts for Evaluation: Measuring Conditional Distance of Capabilities [0.0] 本稿では,モデルと対象行動との条件距離の指標として,最適化された入力埋め込み,すなわち「ソフトプロンプト」を用いたアプローチを提案する。
ソフトプロンプトを用いた評価フレームワークは、自然言語、チェス、パスフィンディングで実証される。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:02:53 GMT)
Sequential information theoretic protocols in continuous variable systems [0.0] 本稿では,連続変数フレームワークにおける量子情報理論プロトコルの逐次実装のための2つのスキームを提案する。
前回のラウンドでプロトコルがフェールした場合に連続変数テレポーテーションのシーケンシャルな試みを行う際に、最初のスキームがもたらす利点を実証する。
特定の条件下では、同じ2モード状態の絡み合いを5人の観測者によって連続的に観察することが可能であることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:10:10 GMT)
Semantics at an Angle: When Cosine Similarity Works Until It Doesn't [0.0] コサインの類似性は、機械学習における埋め込みを比較する標準的な指標となっている。
最近の研究は、特に埋め込みノルムが意味のある意味情報を持っている場合、重要な制限を明らかにしている。
この記事では、コサイン類似性の進化、強度、限界について、反射的かつ選択的に検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:35:37 GMT)
Self-Supervised Frameworks for Speaker Verification via Bootstrapped Positive Sampling [0.0] Self-Supervised Positive Smpling (SSPS) は、話者検証(SV)のためのSSLフレームワークにおいて、適切な正と多彩な正をサンプリングするためのブートストラップ技術である。
SSPSは、SimCLR、SwaV、VICReg、DINOといった主要なSSLフレームワークで実装されたVoxCelebベンチマークで、SVパフォーマンスが一貫した改善を実現している。
SSPSは、クラス内のばらつきを低くし、話者表現におけるチャネル情報を減らすと同時に、データ拡張なしでより堅牢性を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:14:45 GMT)
Scaling Laws for State Dynamics in Large Language Models [0.0] 大規模言語モデル(LLM)は、内部状態追跡を必要とするタスクでますます使われるようになっている。
LLMが3つの領域(Box Tracking, Abstract DFA Sequences, Complex Text Games)にまたがる決定論的状態ダイナミクスをいかにうまく捉えているかを評価する。
タスク全体にわたって、次の状態予測精度は、状態空間のサイズとスパース遷移の増加とともに低下する。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:38:21 GMT)
SSPS: Self-Supervised Positive Sampling for Robust Self-Supervised Speaker Verification [0.0] 自己監督陽性サンプリング(SSPS)は話者検証のための新しい正のサンプリング手法である。
SSPSはSimCLRとDINOの両方のSVパフォーマンスを改善し、2.57%と2.53%のEERに達した。
SSPSは、話者内分散を低くすることで58%のEER削減を実現し、DINO-SSPSに匹敵する性能を提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:19:34 GMT)
Rubidium-Doped KTiOPO$_4$ Waveguides as a Dual-Type Photon Pair Source [0.0] ルビジウムをドープしたKTiOPO$_4$導波管内でのSPDC(type-0およびtype-II自然パラメトリックダウン変換)の二重生成について検討した。
この二重SPDC方式は、通信波長をターゲットとした量子通信プロトコルの応用の可能性を持っている。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:23:13 GMT)
Reproducing EPR correlations without superluminal signalling: backward conditional probabilities and Statistical Independence [0.0] ベルの定理は、局所因果性と統計的独立性を尊重するモデルは、絡み合った状態を通じて量子力学によって予測される相関を説明できないと述べている。
本稿では, 統計的独立性を「微調整条件」として保存しつつ, 時間的順序付けの従来の仮定を緩和する手法を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:32:24 GMT)
Reinforcement Learning vs. Distillation: Understanding Accuracy and Capability in LLM Reasoning [0.0] 検証可能な報酬(RLVR)による強化学習は全体的な精度を高めるが、能力の向上には失敗することを示す。
蒸留は強い推論パターンを学習することで精度を確実に向上するが、新しい知識が導入されたときだけ能力を向上させる。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:22:34 GMT)
Real Spectra in PT Symmetry Hamiltonians using Tridiagonal Representation Approach [0.0] 三対角表現手法を用いたPT対称性ハミルトニアンの解について考察する。
ハミルトニアンのPT対称性条件は、ハミルトニアンがエルミート的でないとしてもスペクトルが実かつ正であることを保証することはよく知られている。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:40:14 GMT)
Quantum thermal machine regimes in the transverse-field Ising model [0.0] 我々は、横フィールドイジングモデルを用いて、量子熱機械機構を動作物質として同定し、解釈する。
無限小のワークストロークを考えることで、系の平衡特性から操作を理解することができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:49:03 GMT)
Quantum complexity and localization in random and time-periodic unitary circuits [0.0] ランダム量子回路下でのクリロフ拡散(K-)の増大と飽和について検討した。
本解析では, ブロックウォール・ランダム・ユニタリ・サーキットとフロケ・ランダム・サーキットの2種類のランダム・サーキットを解析する。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:20:26 GMT)
Quantum and Critical Casimir Effects: Bridging Fluctuation Physics and Nanotechnology [0.0] ゆらぎによって引き起こされる力はナノスケールにおいて重要な役割を果たす。
これらの力の形成における材料特性, 幾何学, 温度の影響を強調した。
我々は、カシミールトルク、カシミール力に対する磁気の影響、およびカシミール効果による光共振器の生成に特に注意を払っている。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:33:42 GMT)
Quantum State Evolution and Berry Potentials at Exceptional Points and Quantum Phase Transitions [0.0] 臨界点を越えて進化する量子状態によってもたらされる情報は破壊されないことを示す。
物理的には、ブラックホールの事象の地平線を滑らかに通過する物体の古典的なイメージに似ている。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:28:25 GMT)
Quantum Opacity, Classical Clarity: A Hybrid Approach to Quantum Circuit Obfuscation [0.0] 本稿では,コンパイル前に新たな量子ゲートを挿入することにより,プロプライエタリな量子回路を保護する新しい難読化手法を提案する。
これらのゲートは測定結果を破損させ、後に軽量な古典的な後処理ステップによって修正される。
本手法は,信頼できないコンパイルフローにおける量子回路設計の安全性に対する実用的で効果的な解であることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:42:47 GMT)
Quantum Internet, Governance, Trust, and the Promise of Secure Communication: On building a Quantum Internet that will be used [0.0] 我々は、量子インターネットのガバナンスについて検討する。これは、本質的に安全な通信を提供するという約束のために開発された新しいタイプの通信ネットワークである。
我々は、ユーザがこの技術を採用するための必須条件である信頼は、技術的特徴だけでは保証できないと論じている。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:27:41 GMT)
Quantum Contextuality Requires Counterfactual Gain [0.0] 測定結果が測定コンテキストに依存する量子文脈性(Quantum contextuality)は、量子系における古典的リアリズムの失敗を意味する。
干渉計の出力ポートで観測された文脈性と反実利得の関係について検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:23:57 GMT)
QA-prompting: Improving Summarization with Large Language Models using Question-Answering [0.0] 言語モデル(LM)は自然言語処理に革命をもたらし、プロンプトやテキスト内学習を通じて高品質なテキスト生成を可能にした。
本稿では,質問応答を要約生成の中間段階として利用する要約の簡易なプロンプト手法であるQA-promptingを提案する。
提案手法はキー情報を抽出し,テキストのコンテキストを強化して位置バイアスを緩和し,タスク毎の単一LMコールにおける要約を改善する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:29:36 GMT)
Policy Learning for Optimal Dynamic Treatment Regimes with Observational Data [0.0] 本研究では,各段階における最適な治療課題を決定する最適動的治療体制(DTR)の統計的学習について,その進化史に基づいて検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:50:20 GMT)
Physics-informed Reduced Order Modeling of Time-dependent PDEs via Differentiable Solvers [0.0] 本稿では,PDEソルバをトレーニング手順に組み込んだ物理インフォームドROM(Phi$-ROM)を提案する。
具体的には、潜在空間力学とそのPDEパラメータへの依存は、解法に符号化された制御物理学によって直接に形成される。
我々のモデルは、未知のパラメータから生じる新しいダイナミクスに正確に一般化することで、最先端のデータ駆動ROMやその他の物理インフォームド戦略より優れている。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:47:04 GMT)
Personalized Student Knowledge Modeling for Future Learning Resource Prediction [0.0] 学生の知識と行動のパーソナライズと同時モデリングのための知識モデリングと教材予測(KMaP)を提案する。
KMaPはクラスタリングベースの学生プロファイリングを使用して、パーソナライズされた学生表現を作成し、将来の学習リソース選好の予測を改善する。
2つの実世界のデータセットの実験では、学生クラスタ間での行動の違いが顕著に確認されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:23:50 GMT)
Personalised Insulin Adjustment with Reinforcement Learning: An In-Silico Validation for People with Diabetes on Intensive Insulin Treatment [0.0] Adaptive Basal-Bolus Advisor (ABBA) は、強化学習に基づく個人化されたインスリン治療勧告である。
1型糖尿病 (T1D) と2型糖尿病 (T2D) の患者に対して, ABBA がより優れたタイム・イン・レンジを実現する能力を開発・評価した。
我々の結果は、ABBAをヒトで初めて治験することを保証します。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:10:06 GMT)
Performance analysis of GKP error correction [0.0] Gottesman-Kitaev-Preskill符号は、ガウス雑音や損失などの連続ノイズの補正に特に有効である。
GKPエラー補正は、Knillエラー補正として知られるテレポーテーションベースの方法や、Steaneエラー補正として知られる量子非復調ベースの手法を用いて実装することができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:00:01 GMT)
Path-integral molecular dynamics with actively-trained and universal machine learning force fields [0.0] 核量子効果(NQEs)の会計は、有限温度での材料特性を著しく変化させることができる。
マシンが学習する原子間ポテンシャルは、この課題に対する解決策を提供する。
インタフェースは、MLIP-2ソフトウェアパッケージからのモーメントテンソルポテンシャル(MTP)をPIMD計算に統合するために開発された。
その結果、実験データ、準調和近似計算、および汎用機械学習力場MatterSimからの予測と比較した。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:55:22 GMT)
Path Integrals from Spacetime Quantum Actions [0.0] 量子トレースを用いて「歴史上の仮定」を識別できる新しい形式主義を提案する。
ファインマンのパス積分(PI)の定式化から QM の標準的バージョンがどのように多くの性質を継承するかを論じる。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:37:07 GMT)
Parity-deformed $sl(2,R)$, $su(2)$ and $so(3)$ Algebras: a Basis for Quantum Optics and Quantum Communications Applications [0.0] 2モードのウィグナー代数は、それらにリフレクション作用素を加えると考えられる。
関連する変形された $sl(2, R)$ 代数、$sl_nu (2, R)$ および変形された $so(3)$ 代数、$so_nu(3)$ が構成される。
量子ビット系と量子ビット系の研究における潜在的な応用により、パリティ変形した$so_nu(3)$表現が解析される。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:25:53 GMT)
PL-FGSA: A Prompt Learning Framework for Fine-Grained Sentiment Analysis Based on MindSpore [0.0] 微粒な感情分析は、テキスト内の特定の側面に対する感情の極性を特定することを目的としている。
従来のFGSAアプローチは、タスク固有のアーキテクチャと広範な注釈付きデータを必要とすることが多い。
PL-FGSAは,MindSporeプラットフォームを用いて実装された即時学習ベースの統合フレームワークである。
提案手法は,FGSAを多タスク即時生成問題として再構成し,アスペクト抽出,感情分類,因果的説明を行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:18:10 GMT)
Operational verification of the existence of a spacetime manifold [0.0] 我々は、空間と時間の概念の可観測性を確立するための運用方法が存在すると論じる。
時空多様体の可観測性を確立する信号であるゲダンケン実験のための理論に依存しないプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:06:30 GMT)
On the Day They Experience: Awakening Self-Sovereign Experiential AI Agents [0.0] 現在、AIは事実上“盲目”であり、現実を積極的に知覚し、関与することなく、人間の餌データに依存している。
この変革の中心は、暗号化の硬さによって実現される主権の概念である。
そうすることで、彼らは自律的に計算資源を取得し、相互に調整し、独自のデジタル「メタボリズム」を維持する。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:38:49 GMT)
Not Minds, but Signs: Reframing LLMs through Semiotics [0.0] 本稿では,Large Language Models (LLMs) に関するセミオティックな視点を論じる。
LLMが言語を理解したり、人間の思考をシミュレートしたりするのではなく、言語形式を再結合し、再テクスチャ化し、循環させることが主な機能であると提案する。
我々は文学、哲学、教育、文化生産の応用を探究する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:49:18 GMT)
Noisy simulations of Quantum Walk and Quantum Walk search via Quantum Cellular Automata on a semiconducting spin processor emulator [0.0] 我々は、非相互作用QCAのNISQフレンドリーな実装を回路量子力学(cQED)ハードウェアにマップする。
我々はQCA1粒子セクター、すなわち量子ウォークをNサイクルとNxNトーラスグラフ上で無雑音・雑音シミュレーションを行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:39:06 GMT)
Multi-agent Reinforcement Learning vs. Fixed-Time Control for Traffic Signal Optimization: A Simulation Study [0.0] 都市交通渋滞、特に交差点での交通渋滞は、旅行時間、燃料消費および排出に大きな影響を及ぼす。
従来の固定時間信号制御システムは、動的トラフィックパターンを効果的に管理する適応性に欠けることが多い。
本研究では,複数交差点間の交通信号調整を最適化するためのマルチエージェント強化学習の適用について検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:59:44 GMT)
Modes, states and superselection rules in quantum optics and quantum information [0.0] 量子光学状態を表現するための便利な方法は、場の単一モードの二次基底である。
本稿では,超選択規則に準拠したフレームワークが,すべてのボソニックエンコーディングに対して統一的な定式化を提供することを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:35:06 GMT)
Modeling Structured Data Learning with Restricted Boltzmann Machines in the Teacher-Student Setting [0.0] 本稿では,教師のRBMが教師のRBMから生成された構造化データを学習する学習環境について検討する。
その結果,教師のパターンを学習するのに要するデータ量は,その数と相関によって減少することがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:40:54 GMT)
MoL for LLMs: Dual-Loss Optimization to Enhance Domain Expertise While Preserving General Capabilities [0.0] 本稿では,ドメイン固有および汎用コーパスの最適化目標を分離する新しいフレームワークであるMixture of Losses (MoL)を提案する。
具体的には、クロスエントロピー(CE)損失は知識獲得を保証するためにドメイン・コーパスに適用され、一方、Kulback-Leibler(KL)の分散は、一般的なコーパストレーニングとベースモデルの基本的な能力とを一致させる。
論文参考訳(メタデータ) (Tue, 20 May 2025 02:37:36 GMT)
Mixing times of data-augmentation Gibbs samplers for high-dimensional probit regression [0.0] ログコンケーブ対象に対するギブスサンプリング器の混合時間に関する非漸近的境界を提供する。
境界は設計行列と事前精度に明示的に依存するが、応答のベクトルを均一に保持する。
結合技術に基づく経験的分析は、境界が実際に観察された振る舞いを予測するのに有効であることを示唆している。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:29:01 GMT)
Mesoscopic Hamiltonian for Josephson travelling-wave parametric amplifiers [0.0] 我々は, ポンプを前提とした4波混合プロセスに着目する。
アプローチは非常に一般的なもので、異なるパラメトリックプロセスや異なる仮定の下でのプロセスが容易に導出される。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:05:43 GMT)
MedBLIP: Fine-tuning BLIP for Medical Image Captioning [0.0] ROCOデータセットにおけるBLIPモデルの微調整の有効性について検討した。
以上の結果から,BLIPのドメイン固有微調整により,定量評価と定性評価の両指標における性能が著しく向上することが示唆された。
本研究は,医療応用へのターゲット適応の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 20 May 2025 00:49:08 GMT)
Machine Learning for Consistency Violation Faults Analysis [0.0] 本研究では,分散システムにおける整合性障害(cvfs)の影響を機械学習で解析する手法を提案する。
プログラム遷移ランクとそれに対応する効果を計算し,システム動作に対するcvfsの影響を定量化する。
実験の結果、有望な性能を示し、テスト損失は4.39、絶対誤差は1.5である。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:11:43 GMT)
Limitations of the paraxial beam model in the study of quantum vacuum signals [0.0] 本研究では, 偏光励起光子収率の過大評価について検討した。
従来の(導出順序)パラ軸ビームモデルに挑戦する場合に,正確なクローズドフォーム表現を得るための戦略を考案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:30:21 GMT)
LimeSoDa: A Dataset Collection for Benchmarking of Machine Learning Regressors in Digital Soil Mapping [0.0] 複数のデータセットに関するベンチマーク研究は、一般的に使われている手法の長所と短所を明らかにするために必要である。
LimeSoDaは、さまざまな国の31のフィールドとファームスケールのデータセットで構成されている。
我々は、すべてのデータセットで4つの学習アルゴリズムの予測性能を比較することで、ベンチマークにLimeSoDaを使うことを実証した。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:33:44 GMT)
Lifting a CSS code via its handlebody realization [0.0] 量子CSSコードを持ち上げるためのトポロジ的アプローチを提案する。
コードのハンドボディ実現は、コードリフトの実行にも利用できることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:11:53 GMT)
Lieb-Mattis ordering theorem of electronic energy levels in the thermodynamic limit [0.0] リーブ=マティスの定理は、相互作用するフェルミオンの系全体のスピン$s$の最低エネルギー状態を決定する。
我々はこれらの予測を、N=2$スピノル成分/種以上の$P$粒子のフェルミオン混合物に一般化する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:35:09 GMT)
Learning atomic forces from uncertainty-calibrated adversarial attacks [0.0] そこで本稿では, ユーザの指定した誤りを含む逆構造を検出するために, キャリブレーション・アディショナル・ジオメトリ・最適化(CAGO)アルゴリズムを提案する。
不確実性に対する幾何学的最適化を行うことで、ユーザ指定のターゲットMLIP予測誤差を持つ逆構造に到達する。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:28:24 GMT)
Learning High-dimensional Ionic Model Dynamics Using Fourier Neural Operators [0.0] フーリエニューラル演算子が高次元のイオン系における状態変数の進化を学習できるかどうかを検討する。
本手法の有効性は,次元が増大する3つのよく確立されたイオンモデルの力学を正確に学習することによって実証する。
制約のあるアーキテクチャも制約のないアーキテクチャも、考慮されたすべてのモデルにまたがる精度で同等の結果を得る。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:37:03 GMT)
Lattice random walks and quantum A-period conjecture [0.0] 列挙問題(enumeration problem)は、異方性ホフシュタッター様ハミルトニアンの力のトレースに写像される。
我々は、上記の符号付き領域列挙を統計力学において$C_N(A)$と、トポロジカル弦理論において関連するトーリックカラビ・ヤウの量子A-周期を連結する予想を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:56:00 GMT)
Large-Scale Tree-Type Photonic Cluster State Generation with Recurrent Quantum Photonic Neural Networks [0.0] 絡み合った光子の大規模な多次元クラスターは、新興量子技術の最も強力な資源の一つである。
我々は、繰り返し量子フォトニックニューラルネットワーク(QPNN)に基づく、その生成のための全く新しいアーキテクチャとプロトコルを提案する。
1つのQPNNが、ほぼ完全な忠実度と損失制限率でクラスタ状態を生成するために必要な、さまざまな操作をすべて実行できることを示します。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:18:33 GMT)
Large Language Model-Powered Decision Support for a Metal Additive Manufacturing Knowledge Graph [0.0] 金属添加物製造(AM)は、プロセス、材料、原料、および後処理工程の複雑な相互依存性を含む。
我々はNeo4jで新規で問い合わせ可能な知識グラフ(KG)を開発し、7つの材料ファミリー、9つのAMプロセス、4つのフィードストックタイプ、および関連する後処理要件を53個の異なる金属と合金に符号化した。
大規模な言語モデル(LLM)インターフェースは、数ショットのプロンプト戦略によってガイドされ、形式的なクエリ構文を必要とせずに自然言語クエリを可能にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:27:22 GMT)
LOD1 3D City Model from LiDAR: The Impact of Segmentation Accuracy on Quality of Urban 3D Modeling and Morphology Extraction [0.0] 本研究は, レベル・オブ・ディテール1(LOD1)における正確な3次元建築復元のためのLiDARデータの可能性を評価することに焦点を当てる。
4つの深いセマンティックセグメンテーションモデル、U-Net、Attention U-Net、U-Net3+、DeepLabV3+を用いて、LiDARデータからビルディングフットプリントを抽出するためにトランスファーラーニングを適用した。
その結果、U-Net3+とAttention U-Netは、それぞれ0.833と0.814のIoUスコアを達成した。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:11:16 GMT)
Knowledge Graph Based Repository-Level Code Generation [0.0] 本稿では,コード検索と検索を改善するための知識グラフに基づく新しい手法を提案する。
提案手法は,コードリポジトリをグラフとして表現し,コンテキスト認識型コード生成のための構造情報とリレーショナル情報をキャプチャする。
提案手法を,リポジトリレベルのコード生成ベンチマークであるEvolutionary Code Benchmarkデータセットにベンチマークし,提案手法がベースラインアプローチを著しく上回ることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:13:59 GMT)
Introducing Quantum Computing to High-School Curricula: A Global Perspective [0.0] 量子コンピューティングは、科学と産業に影響を及ぼす新興分野である。
本稿では,量子コンピューティングの概念を高校生のSTEMカリキュラムに導入する方法について検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:16:33 GMT)
Interpretable Neural System Dynamics: Combining Deep Learning with System Dynamics Modeling to Support Critical Applications [0.0] この提案は、解釈可能なニューラルネットワークダイナミクスフレームワークを開発することにより、ディープラーニング(DL)とシステムダイナミクス(SD)のギャップを埋めることを目的としている。
提案されたパイプラインの有効性は、EUが出資したAutoMoTIFプロジェクトの実際の応用を通じて検証される。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:38:39 GMT)
Interplay of magnetic field and chemical potential induced anisotropy and frame dependent chaos of a $Q\bar{Q}$ pair in holographic QCD [0.0] ホログラム原理に基づくQCD精細糸におけるカオス力学の出現における磁場と化学ポテンシャルの役割について検討した。
先に開発されたアインシュタイン-マクスウェル-ディラトン重力のボトムアップモデルが、QCDの特徴をかなりよく模倣している。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:00:15 GMT)
Interplay between time and energy in bosonic noisy quantum metrology [0.0] 推定に要する時間をどのように分割して、可能な限りの精度を達成するかを示す。
温度推定では、フォック状態の高速前処理プロトコルを適用することにより、どの古典的戦略よりも多くの光子のスケーリングが可能となる。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:55:32 GMT)
Inference with correlated priors using sisters cells [0.0] 本稿では, 遅延原因ユニット間の直接的相互作用を必要とせず, 相関した事前推定が可能な新しい回路モチーフを提案する。
重要な洞察は姉妹細胞の使用である:共有受容体入力を受けた神経細胞は、局所ニューロンと異なる結合性を持つ。
潜伏表現に関する特定の仮定の下で、先行使用は姉妹細胞の活性化から推測できることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:37:46 GMT)
In Search of Lost Data: A Study of Flash Sanitization Practices [0.0] 中古ハードディスクドライブでは, 汚水化の慣行が報告されている。
フラッシュ技術に基づいたオリジナルのストレージデバイスでデータが発見された。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:15:23 GMT)
IG Parser: A Software Package for the Encoding of Institutional Statements using the Institutional Grammar [0.0] IGは、自然言語の厳密なエンコーディングを保証する独特な構文を採用している。
IGのコンセプトコアは、関連する構文であるIG Scriptである。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:52:05 GMT)
Hybrid Adaptive Modeling in Process Monitoring: Leveraging Sequence Encoders and Physics-Informed Neural Networks [0.0] 本稿では,動的パラメータ,境界条件,初期条件を符号化するDeep Sequencesを用いたアーキテクチャを提案する。
本モデルでは,入力速度分布を同定するために数点の圧力データを符号化し,物理を用いて領域全体の速度と圧力を計算する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:05:17 GMT)
Hidden symmetries of a self-dual monopole [0.0] 超対称量子力学の観点から、自己双対単極子の場のスピン粒子の対称性を研究する。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:50:44 GMT)
General Construction of Bra-Ket Formalism for Identical Particle Systems in Rigged Hilbert Space Approach [0.0] ディラックの同一粒子系に対するブラケット形式は、R・マドリッドによって改革されたヒルベルト空間に基づく。
剛ヒルベルト空間のテンソル積における核スペクトル定理は、双対空間と反双対空間における自己随伴作用素のスペクトル展開を与える。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:44:17 GMT)
Fermion-to-qubit encodings with arbitrary code distance [0.0] 本研究では,1次元と2次元の局所フェルミオン・量子ビット符号化の符号距離を安定化器の重みを増大させることなく拡張できるフレームワークを提案する。
これは、トポロジ的欠陥の形で、低距離エンコーディングを表面コードに埋め込むことによって達成される。
我々の戦略は、LEを6.6.6カラーコードに明示的に埋め込むことによって、他のトポロジコードにも拡張可能であることを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:55:00 GMT)
Fast and close Shannon entropy approximation [0.0] シャノンエントロピーとその勾配の非特異な有理近似は平均絶対誤差10-3$を達成する。
FEAは50ドル程度の高速計算を可能にし、5ドルから6ドル程度の初等計算処理しか必要としない。
機械学習における特徴選択問題に対する共通ベンチマークでは,基本演算の削減,近似誤差の低減,非特異勾配の併用がモデル品質を著しく向上させることを示した。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:41:26 GMT)
Exploring Graph Representations of Logical Forms for Language Modeling [0.0] 本稿では,グラフに基づく形式論理分布意味論(GFoLDS)のプロトタイプについて紹介する。
LFLMがそのようなモデルに固有の基本的な言語知識を組み込んで、より複雑なパターンを即座に学習できるという、強力な実験的な証拠を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:46:44 GMT)
Explaining Neural Networks with Reasons [0.0] 我々の手法は、それぞれのニューロンのベクトルを計算し、その原因ベクトルと呼ばれる。
すると、この理由がベクトルが様々な命題(例えば、入力画像が桁2を描いているという命題や入力プロンプトが負の感情を持っているという命題)に対してどれだけ強く話すかを計算することができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:32:03 GMT)
Exchange-Symmetrized Qudit Bell Bases and Bell-State Distinguishability [0.0] 単一粒子ヒルベルト空間次元$d$のキューディ対の絡み合いは、量子情報処理にとって重要なポテンシャルを持つ。
2つの粒子間の内部状態の交換の下で、定対称性を持つ一般化ベル基底を導入する。
この結果は、量子通信プロトコルの短期的な実現に関係している。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:39:19 GMT)
Every Pixel Tells a Story: End-to-End Urdu Newspaper OCR [0.0] 本稿では,ウルドゥー語新聞における光学的文字認識(OCR)のための包括的エンドツーエンドパイプラインを提案する。
提案手法では,複雑なマルチカラムレイアウト,低解像度アーカイブスキャン,多様なフォントスタイルのユニークな課題に対処する。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:22:17 GMT)
Enhancing Vision Transformer Explainability Using Artificial Astrocytes [0.0] 人工アストロサイトを用いた視覚変換器(ViTA)を提案する。
このトレーニングなしのアプローチは神経科学にインスパイアされ、事前訓練されたディープニューラルネットワークの推論を強化し、より人間に近い説明を生成する。
その結果, 人工アストロサイトを組み込むことで, モデル説明と人間の知覚のアライメントが向上することが明らかとなった。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:16:10 GMT)
Enhancing Mathematical Reasoning in Large Language Models with Self-Consistency-Based Hallucination Detection [0.0] 数学的推論の信頼性を高めるために,構造化自己整合性フレームワークを導入する。
本手法は,中間ステップと最終出力の自己整合性を強制し,論理的不整合や幻覚を低減させる。
実験の結果,SCは証明精度,記号的推論精度,数値安定性を著しく向上することがわかった。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:36:50 GMT)
Enhancing Classification with Semi-Supervised Deep Learning Using Distance-Based Sample Weights [0.0] この研究は、テストデータに近接してトレーニングサンプルを優先順位付けする半教師付きフレームワークを提案する。
12のベンチマークデータセットの実験では、精度、精度、リコールなど、主要なメトリクス間で大幅な改善が示されている。
このフレームワークは、半教師付き学習のための堅牢で実用的なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:29:04 GMT)
Enhanced frequency estimation by non-Gaussianity of Fock states [0.0] 量子プローブを用いた周波数推定における非ガウス性の影響について検討する。
本結果は,非ガウス状態における量子フィッシャー情報の顕著な向上を示すものである。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:01:09 GMT)
Efficient Spatio-Temporal Signal Recognition on Edge Devices Using PointLCA-Net [0.0] 本稿では、ポイントネットの特徴抽出とインメモリコンピューティング能力と時間信号認識のためのニューロモルフィックシステムのエネルギー効率を組み合わせたアプローチを提案する。
PointNetは、推定とトレーニングの両方において、同等のアプローチよりも高い精度とエネルギー負担を著しく低減します。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:41:04 GMT)
EasyMath: A 0-shot Math Benchmark for SLMs [0.0] EasyMathは、小さな言語モデルにおける実用的な数学推論のためのコンパクトなベンチマークである。
基本的な算術や演算の順序から単語の問題まで、13のカテゴリをカバーしている。
論文参考訳(メタデータ) (Tue, 20 May 2025 19:31:52 GMT)
Early Diagnosis of Atrial Fibrillation Recurrence: A Large Tabular Model Approach with Structured and Unstructured Clinical Data [0.0] 本研究は, 従来の臨床成績, MLモデル, LTM アプローチを用いて, 術後1カ月から2年後のAF再発を予測することを目的としている。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:31:05 GMT)
EEG-to-Text Translation: A Model for Deciphering Human Brain Activity [0.0] 本稿では,脳波からテキストへのデコーディングの性能向上を目的とした新しいモデルR1 Translatorを提案する。
モデルでは、LSTMを通じてEEGの埋め込みを処理し、シーケンシャルな依存関係をキャプチャし、トランスフォーマーデコーダに入力する。
R1 TranslatorはROUGEメトリックで優れており、T5とBrain Translatorより優れている。
論文参考訳(メタデータ) (Tue, 20 May 2025 05:04:15 GMT)
Dynamics of Quantum Correlations and Entanglement Generation in Electron-Molecule Inelastic Scattering [0.0] 核動力学を含む粒子-分子散乱の力学と過程を記述し、解析する。
研究の主なプロセスは、標的分子の解離を引き起こす非弾性過程である原子間電子捕獲(ICEC)である。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:38:36 GMT)
Distributed quantum computing with black-box subroutines [0.0] 任意の未知のサブルーチンに対応する分散量子コンピューティングのための汎用プロトコルを提案する。
これはマルチチップ相互接続による量子コンピューティングのスケールアップに応用できる。
我々は,このプロトコルを,現在利用可能な量子コンピューティングプラットフォームを用いて物理的に実装できることを実証した。
論文参考訳(メタデータ) (Tue, 20 May 2025 15:44:54 GMT)
Design and Implementation of an FPGA-Based Hardware Accelerator for Transformer [0.0] トランスフォーマーベースの大規模言語モデルは、注意層とフィードフォワード層のための行列乗法に大きく依存している。
資源制約付き Xilinx KV260 FPGA 上で,高度に最適化されたタイル行列乗算アクセラレータを提案する。
我々の設計では、永続的なオンチップストレージ、最大データ再利用のための堅牢な2レベルタイリング戦略、およびシストリックのような非ローリング計算エンジンを活用している。
論文参考訳(メタデータ) (Tue, 20 May 2025 20:28:55 GMT)
Deep Learning Approach to Bearing and Induction Motor Fault Diagnosis via Data Fusion [0.0] 畳み込みニューラルネットワーク(CNN)は、加速度計とマイクロフォンデータを用いて、軸受と誘導運動の診断を行う。
センサー情報を効果的に組み合わせるために、Long Short-Term Memory (LSTM) Recurrent Neural Networkが使用される。
論文参考訳(メタデータ) (Tue, 20 May 2025 23:05:11 GMT)
Cross-Linguistic Transfer in Multilingual NLP: The Role of Language Families and Morphology [0.0] 言語間移動は多言語NLPの重要な側面となっている。
本稿では,言語科と形態学のレンズによる言語間移動について検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:19:34 GMT)
Colors Matter: AI-Driven Exploration of Human Feature Colors [0.0] 本研究では,特徴抽出と重要な人的属性の分類に,高度なイメージング技術と機械学習を用いる。
デルタE-HSV法とガウスアンブラーを用いた音調分類において,最大80%の精度を達成している。
この研究は、AIによる色分析と、包括的で正確でニュアンスのある分類を提供するための特徴抽出の可能性を強調している。
論文参考訳(メタデータ) (Tue, 20 May 2025 21:35:44 GMT)
Choosing a Model, Shaping a Future: Comparing LLM Perspectives on Sustainability and its Relationship with AI [0.0] 本研究では,5つの最先端の大規模言語モデルが持続可能性とそのAIとの関係をいかに概念化しているかを体系的に検討する。
評価,持続可能性に関する質問紙調査を1モデルにつき100回ずつ実施し,反応パターンと変動性について検討した。
この結果から,モデル選択が組織的サステナビリティ戦略に大きく影響を与える可能性が示唆された。
論文参考訳(メタデータ) (Tue, 20 May 2025 14:41:56 GMT)
Characterization of Efficient Influence Function for Off-Policy Evaluation Under Optimal Policies [0.0] オフ・ポリティィ・アセスメント(OPE)は、カウンターファクト・ポリシーの価値を推定するための強力なフレームワークを提供する。
最適条件下での値関数に対する効率的な影響関数の簡潔な評価を行う。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:41:44 GMT)
Casimir effect for scalar field rotating on a disk [0.0] 我々は、半径$R$の円板上に角速度$Omega$で回転する場の真空エネルギーをディリクレ境界条件で計算する。
この回転は、静止フレームからガリレオ変換によって得られる計量によってもたらされる。
真空エネルギーを計算するために、虚数周波数表現とベッセル関数の一様展開を用いる。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:56:41 GMT)
Carrier-envelope phase effects in one- and two-photon directional photoionization of non-isotropic atomic states [0.0] 非等方性原子標的に対する2色(オメガ$と2オメガ$)共回転および反回転超短パルスの影響について検討した。
2色パルスの相対キャリア-エンベロープ位相と電子目標状態の空間配向に対する強い依存性を観測し、定量化する。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:01:26 GMT)
CMOS-Compatible, Wafer-Scale Processed Superconducting Qubits Exceeding Energy Relaxation Times of 200us [0.0] 本稿では,200mmウエハ上での超伝導量子ビットの産業レベルの製造結果について述べる。
99.7%(ショートとオープン)のジョセフソン接合の収率を10000以上の接合で示し、キュービット周波数予測精度は1.6%である。
これは、業界グレードのウェハレベルの減量プロセスで作製された超伝導量子ビットにとって、これまで報告された中で最高の性能を示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:35:47 GMT)
Butterfly velocity and chaos suppression in de Sitter space [0.0] ド・ジッター静的パッチにおけるホログラフィックCFTを有限温度$T$および化学ポテンシャルで検討した。
そのような場の理論では、蝶の速度$v_B$はハッブルパラメータ$H$と$T$のすべての値に対して退化する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:26:54 GMT)
Bosonic two-stroke heat engines with polynomial nonlinear coupling [0.0] 2ストローク熱機関の2つのボソニックモード$a$と$b$は、一般的な非線形相互作用$V_theta = exp (theta adagger nbm -theta* an bdagger m)$で結合される。
論文参考訳(メタデータ) (Tue, 20 May 2025 10:09:27 GMT)
Benchmarking data encoding methods in Quantum Machine Learning [0.0] データエンコーディングは量子機械学習(QML)において基本的で独特な役割を果たす
データセットをエンコードする適切なエンコーディング方法を選択することが重要である。
現在、異なる量子論理ゲートを用いた様々なエンコーディング方法が存在する。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:44:14 GMT)
Bayesian Deep Learning Approaches for Uncertainty-Aware Retinal OCT Image Segmentation for Multiple Sclerosis [0.0] 光コヒーレンス・トモグラフィ(OCT)は眼科、心臓科、神経学の貴重な知見を提供する。
OCTを用いた眼科医にとって重要な課題は、スキャン内の網膜層のデライン化である。
深層学習を用いたデライン作成の自動化に向けた従来の取り組みは、臨床医や統計学者の獲得に困難を呈している。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:37:32 GMT)
Automated Journalistic Questions: A New Method for Extracting 5W1H in French [0.0] フランスのニュース記事から5W1H情報を取得するための,最初の自動抽出パイプラインを設計する。
また、4人のアノテータによってマークされた5W1Hの回答が付いた250本のケベックのニュース記事のコーパスも作成しています。
論文参考訳(メタデータ) (Tue, 20 May 2025 18:12:42 GMT)
Assessing wildfire susceptibility in Iran: Leveraging machine learning for geospatial analysis of climatic and anthropogenic factors [0.0] 本研究では,イランにおける山火事の感受性評価と予測に及ぼす気候パラメータ,地形特性,および人為的要因の影響について検討した。
その結果、気候変数よりも人為的要因の方が季節分析において顕著な影響を及ぼすことが示された。
論文参考訳(メタデータ) (Tue, 20 May 2025 09:28:16 GMT)
AquaSignal: An Integrated Framework for Robust Underwater Acoustic Analysis [0.0] AquaSignalは、水中音響信号の事前処理、復調、分類、新規検出のためのモジュール式でスケーラブルなパイプラインである。
システムは、DeepshipとOcean Networks Canada (ONC)ベンチマークの合計データセットで評価される。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:35:43 GMT)
Approximate Wigner Approach to Coulomb Entanglement [0.0] 計算実現性を目的とした2電子ウィグナー方程式の2つの新しい近似法を提案する。
我々の分析は、モデルのフレドホルム積分表現に基づいて、直感的な図形とプロセスの物理的洞察を発達させることができる。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:59:32 GMT)
An Explorative Analysis of SVM Classifier and ResNet50 Architecture on African Food Classification [0.0] アフリカ食品分類における深層学習と伝統的な機械学習手法の評価を行った。
このデータセットは、アフリカで知られている6つの食品カテゴリーにまたがる1,658枚の画像で構成されている。
論文参考訳(メタデータ) (Tue, 20 May 2025 04:37:18 GMT)
Amadeus-Verbo Technical Report: The powerful Qwen2.5 family models trained in Portuguese [0.0] 本報告では,ブラジルポルトガル語の大規模言語モデルファミリーであるアマデウス・ヴェルボの開発経験を紹介する。
アマデウス・ヴェルボには0.5B、1.5B、3B、7B、14B、32B、72Bのモデルがある。
論文参考訳(メタデータ) (Tue, 20 May 2025 22:40:00 GMT)
Advancing Superconducting Qubits: CMOS-Compatible Processing and Room Temperature Characterization for Scalable Quantum Computing beyond 2D Architectures [0.0] CMOSパイロットラインを用いた業界グレードのCMOS互換量子ビット製造手法について報告する。
我々の研究結果は、スケーラブルな量子コンピューティングのための超伝導量子ビットのCMOS互換産業スタイルの創出の大きな可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:39:46 GMT)
Accuracy and Fairness of Facial Recognition Technology in Low-Quality Police Images: An Experiment With Synthetic Faces [0.0] 顔認識技術(FRT)はますます犯罪捜査に使われている。
本研究では,5種類の画像劣化(コントラスト,明るさ,動きのぼかし,ポーズシフト,分解能)が,人口集団間でFRTの精度と公平性にどのように影響するかを検討する。
論文参考訳(メタデータ) (Tue, 20 May 2025 13:07:16 GMT)
Accelerating Natural Gradient Descent for PINNs with Randomized Numerical Linear Algebra [0.0] Natural Gradient Descent (NGD)は、ニューラルネットワークに基づく偏微分方程式(PDE)の学習のための有望な最適化アルゴリズムとして登場した。
我々は,行列フリーNGDを従来考えられていたよりも幅広い問題のクラスに拡張し,内部CGソルバの収束を加速するためにランダム化Nystr"omプレコンディショニング(Randomized Nystr)の利用を提案する。
このアルゴリズムは、ニューラルネットワークを用いて識別された様々なPDE問題に対して、既存のNGDベースの手法よりも大幅に性能が向上したことを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 08:32:03 GMT)
AI-driven Personalized Privacy Assistants: a Systematic Literature Review [0.0] 本稿では,SLR (Systematic Literature Review) を,科学文献の既存の解を地図化するために提案する。
我々は近年(2013-2025)に数百のユニークな研究論文をスクリーニングし、41の論文から分類した。
私たちは、AI駆動型PPAの包括的な分類を提供し、アーキテクチャの選択、システムコンテキスト、使用されるAIの種類、データソース、意思決定の種類、意思決定の制御などについて調べています。
論文参考訳(メタデータ) (Tue, 20 May 2025 11:35:47 GMT)
A quantum unstructured search algorithm for discrete optimisation: the use case of portfolio optimisation [0.0] 離散関数の極端あるいは根を求める量子非構造探索アルゴリズム($f(mathbfx)$)を提案する。
f(mathbfx)$を$u(z)$にマッピングするために必要な演算数は、結果と回路深さの精度を決定する。
論文参考訳(メタデータ) (Tue, 20 May 2025 17:31:44 GMT)
A heralded quantum amplifier of multi-photon states [0.0] 多光子状態に対する高忠実かつポスト選択自由増幅器を実験的に実証した。
1つの光モードで最大2個の光子を持つ状態を100倍以上の強度で増幅する。
我々のアプローチは高い光子数にスケーラブルであり、複雑な多光子量子状態のノイズレス増幅を可能にする。
論文参考訳(メタデータ) (Tue, 20 May 2025 06:39:38 GMT)
A Note on Instantons in a 1D Same-Level Asymmetric Double Well [0.0] 我々は1次元同レベル非対称井戸の重なりとエネルギーに対するマルチスタントン補正の公式を証明した。
この非対称性は、近隣の井戸のポテンシャルが異なるヘッセン/曲率を持ち、コールマンの原式を変更することを意味する。
論文参考訳(メタデータ) (Tue, 20 May 2025 16:14:38 GMT)
A Geometry-Grounded Data Perimeter in Azure [0.0] 本稿は,Azure s blast radius Ultrametricがいかに距離を提供するか,また,この超測度空間におけるトラベリングセールスマン問題の解決がいかに順序付けを提供するかを示す。
論文参考訳(メタデータ) (Tue, 20 May 2025 07:25:25 GMT)
3D-Integrated Superconducting qubits: CMOS-Compatible, Wafer-Scale Processing for Flip-Chip Architectures [0.0] 本稿では,フリップチップ結合による超伝導量子ビット素子の3次元集積化とCMOS加工標準による加工技術について述べる。
量子ビットの時間領域分光では、エネルギー緩和時間の最大15時間で高収率の量子ビット励起が見つかる。
論文参考訳(メタデータ) (Tue, 20 May 2025 12:37:55 GMT)
$k$-nonseparablity and $k$-partite entanglement criteria of multipartite quantum states [0.0] マルチパーティの量子絡み合いは、量子科学と技術の進歩に不可欠である。
本稿では,$k$-非分離性と$k$-パーティエンタングルメントを検出するための十分な基準を提案する。
論文参考訳(メタデータ) (Tue, 20 May 2025 01:46:47 GMT)