MOOSE-Chem3: Toward Experiment-Guided Hypothesis Ranking via Simulated Experimental Feedback [128.3] 本研究では,事前試験の結果に基づいて仮説を優先順位付けすることを目的とした,実験誘導ランキングの課題について紹介する。
本稿では,3つのドメインインフォームド仮定に基づいて,仮説性能を既知の基底的真理仮説に類似した関数としてモデル化するシミュレータを提案する。
実験結果を用いて,124の化学仮説のデータセットをキュレートし,シミュレーションの有効性を検証した。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:24:50 GMT)
The Real Barrier to LLM Agent Usability is Agentic ROI [110.3] 大規模言語モデル(LLM)エージェントは、人間とAIの相互作用において有望な変化を示す。
我々は、需要の高いマスマーケットアプリケーションにおいて、重要なユーザビリティギャップを強調します。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:40:58 GMT)
Is Human-Like Text Liked by Humans? Multilingual Human Detection and Preference Against AI [95.8] 人文と機械文の大きなギャップは、具体性、文化的ニュアンス、多様性にある。
また,人間は必ずしも人書きのテキストを好んではいないこと,特にその情報源を明確に特定できない場合などを見いだす。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:32:36 GMT)
A Critical Evaluation of Defenses against Prompt Injection Attacks [95.8] 大型言語モデル (LLM) はインジェクション攻撃に弱い。
いくつかの防衛策が提案され、しばしばこれらの攻撃をうまく緩和すると主張した。
既存の研究は、これらの防衛を評価するための原則的なアプローチを欠いていると論じる。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:39:56 GMT)
One RL to See Them All: Visual Triple Unified Reinforcement Learning [92.9] V-Triuneは、視覚的推論と知覚タスクを1つのトレーニングパイプライン内で実現するビジュアルトリプル統一強化学習システムである。
V-Triuneは3つの補完的なコンポーネントで構成されている: Sample-Level Datashelf (多様なタスク入力を統一する)、Verifier-Level Reward (特殊検証を通じてカスタム報酬を提供する)。
本稿では,V-Triuneが処理する知覚タスクに対して適応的,進行的,明確なフィードバックを提供する,新しい動的IoU報酬を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:41:14 GMT)
Chain-of-Model Learning for Language Model [91.8] 本稿では,各レイヤの隠れ状態に因果関係を組み込んだ新しい学習パラダイムであるChain-of-Model(CoM)を提案する。
本稿では, 各層に隠された状態を, 隠された次元の複数の部分表現(すなわち鎖)の組み合わせとして定式化する, チェーン・オブ・表現(CoR)の概念を紹介する。
さらに,COLMをベースとしたKV共有機構を導入し,第1チェーン内のキーと値を計算し,全チェーン間で共有する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:12:10 GMT)
Triangulating LLM Progress through Benchmarks, Games, and Cognitive Tests [89.1] 評価パラダイムとして,標準ベンチマーク,インタラクティブゲーム,認知テストの3つを検討した。
分析の結果,対話型ゲームは判別モデルにおける標準ベンチマークよりも優れていることがわかった。
我々は,人間の能力評価に触発された新しい対話型ベンチマークと目標認知タスクの開発を提唱する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:25:46 GMT)
Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.9] 従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。
データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。
本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:28:25 GMT)
RePrompt: Reasoning-Augmented Reprompting for Text-to-Image Generation via Reinforcement Learning [88.1] RePromptは、強化学習による迅速な強化プロセスに明示的な推論を導入する、新しいリプロンプトフレームワークである。
提案手法は,人手による注釈付きデータなしでエンドツーエンドのトレーニングを可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:44:26 GMT)
Beyond the Destination: A Novel Benchmark for Exploration-Aware Embodied Question Answering [87.8] Embodied Question Answeringでは、エージェントが動的に3D環境を探索し、視覚情報を積極的に収集し、質問に答えるために多段階の推論を行う必要がある。
既存のデータセットはしばしばバイアスや事前の知識を導入し、非身体的推論につながる。
探索能力と推論能力の両方を評価するために特別に設計された最大のデータセットを構築します。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:54:57 GMT)
Hybrid Preferences: Learning to Route Instances for Human vs. AI Feedback [87.4] 我々はHyPERを紹介した。HyPERは、人間または言語モデル(LM)にアノテーションを付与するハイブリッド推論ルータである。
その結果,HyPERを用いた人工選好と直接選好の混合は,RewardBenchでは7-13%しか使用せず,RM性能が向上していることがわかった。
また、HyPERの機能を分析した結果、安全上の懸念や複雑さが人間のフィードバックから最も恩恵を受けていることがわかりました。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:43:47 GMT)
Contextualized Evaluations: Judging Language Model Responses to Underspecified Queries [85.8] 本稿では,不特定クエリを取り巻くコンテキストを合成的に構築し,評価中にそれを提供するプロトコルを提案する。
その結果,1) 評価から得られた結論の変更,2) モデルペア間のベンチマークランキングの反転,2) スタイルのような表面レベルの基準に基づいて判断を下すナッジ評価,3) 多様なコンテキスト間でのモデル行動に関する新たな洞察の提供,などが確認できた。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:32:07 GMT)
Playpen: An Environment for Exploring Learning Through Conversational Interaction [81.7] 本研究は,対話ゲームが学習のフィードバック信号の源として機能するかどうかを考察する。
本稿では,対話ゲームによるオフラインおよびオンライン学習環境であるPlaypenを紹介する。
SFTによる模倣学習は、目に見えないインスタンスのパフォーマンスを向上させるが、他のスキルに悪影響を及ぼす。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:39:07 GMT)
Stepwise Reasoning Checkpoint Analysis: A Test Time Scaling Method to Enhance LLMs' Reasoning [81.5] 本稿では,ステップワイズ推論チェックポイント分析(SRCA)を提案する。
本研究は,(1)中間チェックポイント回答による経路推論をグループ化して品質を確保しつつ多様性を維持するAnswer-Clustered Search,(2)最終決定にすべての中間回答を活用するCheckpoint Candidate Augmentationの2つの主要な戦略を取り入れた。
提案手法は経路均質化を効果的に低減し,高品質な中間結果を活用することにより耐故障機構を創出する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:42:50 GMT)
MMMG: a Comprehensive and Reliable Evaluation Suite for Multitask Multimodal Generation [81.3] MMMGは、4つのモダリティの組み合わせにまたがるマルチモーダル生成の包括的なベンチマークである。
人間の評価と高度に一致し、平均94.3%の合意を達成している。
GPTイメージは画像生成の精度は78.3%であるが、マルチモーダル推論とインターリーブ生成では不足している。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:21:28 GMT)
QwenLong-L1: Towards Long-Context Large Reasoning Models with Reinforcement Learning [80.3] 我々は、長文推論RLのパラダイムを定式化し、最適な訓練効率と不安定な最適化プロセスにおける重要な課題を特定する。
QwenLong-L1 は,コンテクストをプログレッシブ・コンテクスト・スケーリングにより長文シナリオに適応させるフレームワークである。
QwenLong-L1-32B は OpenAI-o3-mini や Qwen3-235B-A22B といったフラグシップ LRM よりも優れていた。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:31:55 GMT)
Analyzing Mitigation Strategies for Catastrophic Forgetting in End-to-End Training of Spoken Language Models [79.9] 多段階連続学習は破滅的な忘れを招きかねない。
本稿では, 3つの緩和戦略, モデルマージ, LoRAスケーリング係数の割引, 経験リプレイについて検討する。
その結果,経験的リプレイが最も効果的であることが示され,他の手法と組み合わせることでさらに効果が得られた。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:50:14 GMT)
Automating Safety Enhancement for LLM-based Agents with Synthetic Risk Scenarios [77.9] LLM(Large Language Model)ベースのエージェントは、現実のアプリケーションにますますデプロイされる。
完全自動合成データ生成によるエージェント安全性を体系的に向上する最初のフレームワークであるAutoSafeを提案する。
AutoSafeは安全性のスコアを平均で45%向上させ、現実世界のタスクでは28.91%の改善を実現している。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:56:06 GMT)
Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling [75.8] Plan-R1は、軌道計画を逐次予測タスクとして定式化する、新しい2段階の軌道計画フレームワークである。
第1段階では,専門家データに基づく次の動きトークン予測により,自己回帰軌道予測器を訓練する。
第2段階では、規則に基づく報酬(衝突回避、速度制限など)を設計し、グループ相対政策最適化を用いてモデルを微調整する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:22:19 GMT)
TokBench: Evaluating Your Visual Tokenizer before Visual Generation [75.4] テキストと顔の再構成の質を,様々な画像トークンやVAEで分析する。
以上の結果から,現代の視覚トークン化器は細粒度の特徴,特に小型化に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:52:16 GMT)
Incentivizing Dual Process Thinking for Efficient Large Language Model Reasoning [75.0] 大規模推論モデル(LRM)は複雑な推論タスクに対して強い性能を示してきたが、しばしば過度に考えることに悩まされている。
認知科学における二重プロセス理論に着想を得て,適応認知政策最適化を提案する。
ACPOは、適応的な認知アロケーションと動的システムスイッチによって、LRMの効率的な推論を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:22:52 GMT)
ManuSearch: Democratizing Deep Search in Large Language Models with a Transparent and Open Multi-Agent Framework [73.9] ManuSearchは,大規模言語モデル(LLM)の深層検索を民主化するために設計された,透明でモジュール化されたマルチエージェントフレームワークである。
ManuSearchは検索と推論のプロセスを,(1)サブクエリを反復的に定式化するソリューション計画エージェント,(2)リアルタイムWeb検索を通じて関連文書を検索するインターネット検索エージェント,(3)生のWebコンテンツから重要な証拠を抽出する構造化Webページ読取エージェントの3つに分解する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:02:02 GMT)
UniDB++: Fast Sampling of Unified Diffusion Bridge [73.7] 拡散ブリッジは任意の分布間の遷移を可能にする。
UniDBの反復型オイラーサンプリング法への依存は、遅くて計算に費用がかかる推論をもたらす。
トレーニング不要なサンプリングアルゴリズムであるUniDB++は,これらの制限を大幅に改善する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:03:02 GMT)
Optimizing Large Language Model Training Using FP4 Quantization [73.6] 量子化トレーニングは、低ビット演算によるコスト削減を可能にすることで、有望なソリューションを提供する。
この研究は、大規模言語モデル(LLM)のための最初のFP4トレーニングフレームワークを紹介します。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:44:25 GMT)
InfLVG: Reinforce Inference-Time Consistent Long Video Generation with GRPO [73.3] InfLVGは、追加のロングフォームビデオデータを必要としないコヒーレントなロングビデオ生成を可能にする推論時フレームワークである。
InfLVGはビデオ長を最大9$times$まで拡張でき、シーン間の一貫性とセマンティック忠実性を実現することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:33:25 GMT)
Beyond Prompt Engineering: Robust Behavior Control in LLMs via Steering Target Atoms [71.9] モデルにおける膨大な数のパラメータは、しばしば高度に絡み合った内部表現をもたらす。
最近の研究は、スパースオートエンコーダ(SAE)を用いて、ステアリングのための高次元空間における知識を歪めている。
本研究では,非絡み合った知識コンポーネントを分離・操作し,安全性を高める手法であるステアリングターゲット原子(STA)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:59:18 GMT)
Cognitive Debiasing Large Language Models for Decision-Making [71.2] 大規模言語モデル(LLM)は意思決定アプリケーションをサポートする可能性を示している。
我々は,自己適応型認知脱バイアス(SACD)という認知脱バイアス手法を提案する。
我々の手法は、3つの逐次的なステップ – バイアス決定、バイアス分析、認知バイアス ― に従うことで、プロンプトにおける潜在的な認知バイアスを反復的に緩和する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:32:54 GMT)
LaViDa: A Large Diffusion Language Model for Multimodal Understanding [71.0] LaViDaは離散拡散モデルに基づいて構築されたビジョンランゲージモデルのファミリーである。
DMは、高速な推論と制御可能な生成のための双方向コンテキストのための並列デコーディングを提供する。
LaViDaはマルチモーダルベンチマークでAR VLMと競合または優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:07:29 GMT)
Towards Natural Language Communication for Cooperative Autonomous Driving via Self-Play [70.7] 自然言語を車両間通信プロトコル(V2V)として使用すると、自動運転車が協力して運転する可能性がある。
本稿では,自律走行車におけるメッセージ生成と高レベル意思決定ポリシーを学習するための新しい手法 LLM+Debrief を提案する。
実験の結果,LLM+Debriefは有意義で理解可能な自然言語メッセージを生成するのに有効であることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:40:09 GMT)
QwenLong-CPRS: Towards $\infty$-LLMs with Dynamic Context Optimization [70.3] QwenLong-CPRSはコンテキスト圧縮フレームワークであり、明示的な長文最適化のために設計されている。
QwenLong-CPRSは21.59$times$コンテキスト圧縮と19.15ポイントの平均パフォーマンス向上を達成した。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:47:00 GMT)
SEOE: A Scalable and Reliable Semantic Evaluation Framework for Open Domain Event Detection [70.2] オープンドメインイベント検出のためのスケーラブルで信頼性の高いセマンティックレベルの評価フレームワークを提案する。
提案フレームワークはまず,現在7つの主要ドメインをカバーする564のイベントタイプを含む,スケーラブルな評価ベンチマークを構築した。
次に,大言語モデル(LLM)を自動評価エージェントとして活用し,意味的類似ラベルのきめ細かい定義を取り入れた意味的F1スコアを計算する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:51:47 GMT)
CosyVoice 3: Towards In-the-wild Speech Generation via Scaling-up and Post-training [70.1] 野生におけるゼロショット多言語音声合成のための改良モデルであるCosyVoice 3を提案する。
CosyVoice 3の主な特徴は、韻律自然性を改善する新しい音声トークンである。
データは1万時間から100万時間に拡張され、9つの言語と18の中国語方言を含んでいる。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:55:21 GMT)
L-MTP: Leap Multi-Token Prediction Beyond Adjacent Context for Large Language Models [69.1] 本稿では,革新的なトークン予測手法である跳躍マルチトークン予測(L-MTP)を提案する。
従来のMTPとは異なり、L-MTPは中間トークンを戦略的にスキップし、1つのフォワードパスで非逐次トークンを予測する。
理論的には,L-MTPによる推論効率の向上の利点を実証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:59:46 GMT)
Wolf Hidden in Sheep's Conversations: Toward Harmless Data-Based Backdoor Attacks for Jailbreaking Large Language Models [69.1] Supervised Fine-tuning (SFT) は、大きな言語モデルと人間の意図を協調させ、ラベル付きタスク固有データでトレーニングする。
近年の研究では、悪意のある攻撃者が、有害な質問応答ペアにトリガーを埋め込むことで、これらのモデルにバックドアを注入できることが示されている。
脱獄性LLMに対する新しいクリーンデータバックドアアタックを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:13:59 GMT)
CLIMB: Class-imbalanced Learning Benchmark on Tabular Data [68.1] クラス不均衡学習(クラス不均衡学習、class-imbalanced learning、CIL)は、マイノリティクラスが重要な結果を持っている多くの実世界のアプリケーションにおいて重要である。
本稿では,クラス不均衡学習のための総合的なベンチマークであるCLIMBを提案する。
CLIMBには、さまざまなドメインと不均衡レベルにわたる73の現実世界データセットと、29の代表的なCILアルゴリズムの統一実装が含まれている。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:21:03 GMT)
Refuse Whenever You Feel Unsafe: Improving Safety in LLMs via Decoupled Refusal Training [67.3] 我々は,LLMに対して,いかなる応答位置においても有害なプロンプトへのコンプライアンスを拒否する権限を付与する,新しいアプローチであるDecoupled Refusal Training(DeRTa)を導入する。
DeRTaは,(1)安全応答の開始に有害な応答のセグメントを付加することにより,安全でないコンテンツの認識と回避をモデルに訓練する,(2)有害応答シーケンスを通して潜在的障害から安全拒絶へ移行する能力をモデルに装備する強化遷移最適化(RTO)という,2つの新しいコンポーネントを組み込んでいる。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:31:00 GMT)
Trinity-RFT: A General-Purpose and Unified Framework for Reinforcement Fine-Tuning of Large Language Models [67.2] Trinity-RFTは、大規模言語モデルの強化微調整(RFT)のために設計されたフレームワークである。
RFT-coreは同期/非同期、オンライン/オフライン、RTTのオンライン/オフラインモードを統一・一般化する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:41:09 GMT)
From Lists to Emojis: How Format Bias Affects Model Alignment [67.1] 人的フィードバックからの強化学習における形式バイアスについて検討する。
人間の評価者を含む多くの広く使われている嗜好モデルは、特定のフォーマットパターンに対して強いバイアスを示す。
バイアスデータが少ないと、報酬モデルにかなりのバイアスを注入できることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:32:54 GMT)
How Knowledge Popularity Influences and Enhances LLM Knowledge Boundary Perception [66.0] 我々は,質問におけるエンティティの人気,回答におけるエンティティの人気,関係性の人気という3つの観点から,知識の人気を定量化する。
実験により、LLMはより優れたQAパフォーマンス、高い信頼性、より一般的な知識に対するより正確な認識を示すことが示された。
これにより、すべてのモデルとデータセットの平均5.24%の正解率予測の精度が向上する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:42:06 GMT)
Deep Video Discovery: Agentic Search with Tool Use for Long-form Video Understanding [63.8] 長時間の映像理解は時間空間の複雑さによって大きな課題を呈する。
セグメント化されたビデオクリップ上でのエージェント検索戦略を活用するために,Deep Video Discoveryエージェントを提案する。
我々のDVDエージェントはSOTA性能を達成し,LVBenchデータセットの先行処理をはるかに上回っている。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:37:36 GMT)
InfoDeepSeek: Benchmarking Agentic Information Seeking for Retrieval-Augmented Generation [63.6] InfoDeepSeekは、現実世界の動的Web環境でエージェント情報を求めるための新しいベンチマークである。
本稿では,決定性,難易度,多様性の基準を満たす課題クエリを構築するための体系的手法を提案する。
本研究では,情報探索結果の正確性,有用性,コンパクト性に関する詳細な指標を含む,動的エージェント情報探索に適した最初の評価フレームワークを開発する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:16:01 GMT)
Towards Understanding the Generalizability of Delayed Stochastic Gradient Descent [63.4] 非同期で実行される勾配降下は、大規模機械学習モデルのトレーニングにおいて重要な役割を果たす。
既存の一般化誤差境界は悲観的であり、非同期遅延と一般化の相関を明らかにすることはできない。
我々の理論的結果は、非同期遅延は遅延SGDアルゴリズムの一般化誤差を低減することを示唆している。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:09:41 GMT)
Is Single-View Mesh Reconstruction Ready for Robotics? [63.3] 本稿では,ロボット操作におけるディジタル双対環境構築のための単一視点メッシュ再構成モデルについて述べる。
ロボット工学の文脈における3次元再構成のベンチマーク基準を確立する。
コンピュータビジョンベンチマークの成功にもかかわらず、既存のアプローチはロボティクス固有の要件を満たしていない。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:35:56 GMT)
FuncGenFoil: Airfoil Generation and Editing Model in Function Space [63.3] 本稿では,FuncGenFoilについて紹介する。FuncGenFoilは,翼形状を関数曲線として直接再構成する関数空間生成モデルである。
実証的な評価は、FuncGenFoilが翼生成における最先端の手法を改善することを示している。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:03:56 GMT)
Planning without Search: Refining Frontier LLMs with Offline Goal-Conditioned RL [63.0] 大きな言語モデル(LLM)は、質問応答や対話といったタスクに優れています。
交渉や説得のような相互作用を必要とする複雑なタスクは、さらなる長期の推論と計画を必要とする。
目的条件付き値関数を用いて LLM エージェントの推論を導出する手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:51:54 GMT)
Too Consistent to Detect: A Study of Self-Consistent Errors in LLMs [61.1] 本研究は, 自己整合誤差を正式に定義し, 主流検出手法の評価を行う。
4種類の検出メソドは全て、自己整合性エラーを検出するのにかなり苦労している。
自己整合性誤差がLLM間でしばしば異なるという観測結果から, 単純かつ効果的なクロスモデルプローブ法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:18:56 GMT)
MMInference: Accelerating Pre-filling for Long-Context VLMs via Modality-Aware Permutation Sparse Attention [61.0] MMInferenceは、長文マルチモーダル入力のプリフィルステージを高速化する動的スパースアテンション手法である。
MMInferenceは, 精度を維持しつつ, 1Mトークンにおいて, プリフィルステージを最大8.3倍高速化することを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:09:51 GMT)
T2I-Eval-R1: Reinforcement Learning-Driven Reasoning for Interpretable Text-to-Image Evaluation [60.6] T2I-Eval-R1は,大まかな品質スコアのみを用いて,オープンソースのMLLMを訓練する新しい強化学習フレームワークである。
提案手法では,グループ相対政策最適化を命令調整プロセスに統合し,スカラースコアと解釈可能な推論チェーンの両方を生成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:44:59 GMT)
IDA-Bench: Evaluating LLMs on Interactive Guided Data Analysis [60.3] IDA-Benchは、多ラウンドの対話シナリオで大規模言語モデルを評価する新しいベンチマークである。
エージェント性能は、最終的な数値出力と人間由来のベースラインを比較して判断する。
最先端のコーディングエージェント(Claude-3.7-thinkingなど)でさえ50%のタスクを成功させ、シングルターンテストでは明らかでない制限を強調している。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:37:52 GMT)
Edit Once, Update Everywhere: A Simple Framework for Cross-Lingual Knowledge Synchronization in LLMs [60.1] 我々は、シンプルで実用的なSOTAレシピであるクロス言語知識民主主義編集(X-KDE)を提案する。
X-KDEは、支配的な言語から他の言語への知識の伝達を効果的に行うように設計されている。
Bi-ZsRE と MzsRE のベンチマーク実験により、X-KDE は言語間性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:17:01 GMT)
Language Matters: How Do Multilingual Input and Reasoning Paths Affect Large Reasoning Models? [60.0] 多言語トレーニングにも拘わらず、LRMはテスト時に高リソース言語での推論をデフォルトとする傾向にある。
文化的推論は、推論タスクのパフォーマンスを低下させるが、文化的なタスクに恩恵を与える一方、安全性評価は言語固有の振る舞いを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:46:18 GMT)
Proto-FG3D: Prototype-based Interpretable Fine-Grained 3D Shape Classification [59.7] 本稿では,3次元形状のきめ細かい分類のためのプロトタイプベースフレームワークProto-FG3Dを提案する。
Proto-FG3Dは、Prototype Associationを介して、共同でマルチビューとマルチカテゴリ表現学習を確立する。
Proto-FG3Dは、精度、透明な予測、そして視覚化によるアドホックな解釈可能性において最先端の手法を超越している。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:31:02 GMT)
Towards Prospective Medical Image Reconstruction via Knowledge-Informed Dynamic Optimal Transport [58.7] 本稿では,新しい動的最適輸送フレームワークKIDOTについて紹介する。
KIDOTは、画像から画像への連続的な進化経路として再構成をモデル化し、画像知識インフォームドコスト関数と輸送方程式で導かれる、未完成のデータから学習する。
MRIとCTの再構成実験は、KIDOTの優れた性能を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:05:10 GMT)
Towards Copyright Protection for Knowledge Bases of Retrieval-augmented Language Models via Reasoning [58.6] 大規模言語モデル(LLM)は、現実のパーソナライズされたアプリケーションにますます統合されている。
RAGで使用される知識基盤の貴重かつしばしばプロプライエタリな性質は、敵による不正使用のリスクをもたらす。
これらの知識基盤を保護するための透かし技術として一般化できる既存の方法は、一般的に毒やバックドア攻撃を含む。
我々は、無害な」知識基盤の著作権保護の名称を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:35:10 GMT)
Synergistic Bleeding Region and Point Detection in Laparoscopic Surgical Videos [58.5] BlooDetは腹腔鏡下手術で出血部位と点を同時検出するように設計されている。
本フレームワークでは,Segment Anything Model 2をベースとした双方向双方向誘導設計を採用している。
実験では、SurgBloodでは、出血部位と点検出の両方で、ベースラインが12よりも優れています。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:38:17 GMT)
The One RING: a Robotic Indoor Navigation Generalist [58.3] RING (Robotic Indoor Navigation Generalist) は、あらゆる移動ロボットを効果的な屋内セマンティックナビゲータに変えるための具体的方針である。
完全にシミュレーションで訓練されたRingは、ロボットによる大規模なランダム化を利用して、多くの現実世界のプラットフォームに堅牢な一般化を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:41:56 GMT)
High-Fidelity Functional Ultrasound Reconstruction via A Visual Auto-Regressive Framework [58.1] 機能的神経側頭葉イメージングはマッピングに例外的な解像度を提供する。
しかし、その実践的応用は重大な課題によって妨げられている。
データ不足、倫理的考慮、信号劣化などが含まれる。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:27:17 GMT)
Distilling LLM Agent into Small Models with Retrieval and Code Tools [57.6] Agent Distillationは、推論能力とタスク解決の振る舞いを大きな言語モデルから小さな言語モデルに移行するためのフレームワークである。
その結果,SLMは0.5B,1.5B,3Bのパラメータで,次世代の1.5B,3B,7Bモデルと競合する性能が得られることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:20:15 GMT)
Quantize What Counts: Bit Allocation Insights Informed by Spectral Gaps in Keys and Values [57.5] KV量子化法の拡張を目的とした2つの新しい定理を提供する。
我々の最初の定理は、キー値ノルム格差(Key-Value Norm Disparity)と呼ばれ、鍵重み行列がよりリッチな情報を持っていることを述べる。
第2の定理であるキー駆動量子化(Key-Driven Quantization)は、値上のキーの量子化精度の優先順位付けは、全体的な量子化性能に大きな改善をもたらすという仮説である。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:58:47 GMT)
Decoupled Visual Interpretation and Linguistic Reasoning for Math Problem Solving [57.2] 現在の大型視覚言語モデル(LVLM)は、通常、大型言語モデル(LLM)のテキスト埋め込みと視覚的特徴をリンクするためのコネクタモジュールを使用する。
本稿では,エンド・ツー・エンドの視覚言語推論モデルをトレーニングする代わりに,分離された推論フレームワークの開発を提唱する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:18:00 GMT)
Semi-Supervised Model-Free Bayesian State Estimation from Compressed Measurements [57.0] 圧縮測定によるベイズ状態の推定について考察する。
時間的測定ベクトルの寸法は、推定される時間的状態ベクトルの寸法よりも小さい。
状態の進化の基盤となる力学モデルは「モデルフリープロセス」では未知数である。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:59:15 GMT)
SCAR: Data Selection via Style Consistency-Aware Response Ranking for Efficient Instruction-Tuning of Large Language Models [56.9] 本研究は, 応答における2つの重要なスタイル的要素, 言語形式と指導的前提を同定する。
そこで我々は,SCAR(Style Consistency-Aware Response Ranking)を導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:08:51 GMT)
Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.2] 予測型因果推論(PPCI)に焦点をあてる
PPCIは、未ラベルの事実結果を用いた対象実験における治療効果を推定し、事前訓練されたモデルからゼロショットを取得する。
バニラ実験的リスク最小化によって解決不可能なインスタンスに対するソリューションを提供するため,本手法を合成および実世界の科学的データに対して検証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:16:33 GMT)
ReCaLL: Membership Inference via Relative Conditional Log-Likelihoods [56.1] 本稿ではReCaLL(Relative Conditional Log-Likelihood)を提案する。
実験の結果,非メンバープレフィックスの条件付きメンバーデータは,非メンバーデータと比較してログライクな傾向が著しく低下することがわかった。
我々は総合的な実験を行い、ReCaLLがWikiMIAデータセット上で最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:57:14 GMT)
Bridging Supervised Learning and Reinforcement Learning in Math Reasoning [55.9] 強化学習(Reinforcement Learning, RL)は、二分検証信号による自己改善を可能にすることで、近年の数学能力の急上昇において中心的な役割を担っている。
本研究は,LLMが障害を反映し,外部教師なしで自律的に改善できる教師型アプローチである負認識ファインチューニング(NFT)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:17:40 GMT)
Canonical Pose Reconstruction from Single Depth Image for 3D Non-rigid Pose Recovery on Limited Datasets [55.8] 2Dインプットからの3D再構成、特に人間のような非剛体オブジェクトは、ユニークな課題を提示する。
従来の手法は、変形空間全体をカバーするために広範囲なトレーニングデータを必要とする非剛体形状に苦しむことが多い。
本研究では,変形可能な形状の単一視点深度画像を標準形に変換する正準ポーズ再構成モデルを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:58:34 GMT)
RCR: Robust Crowd Reconstruction with Upright Space from a Single Large-scene Image [55.8] 本稿では,1枚の大シーン画像から空間的に一貫した数百の人間のポーズと形状復元に焦点を当てた。
まず,HVIP(Human-Scene Virtual Interaction Point)という概念を提案し,複雑な3次元人物位置を2次元画素位置に変換する。
次に、RCR(Robust Crowd Reconstruction)に拡張し、異なるカメラFoV上で一貫した再構築と安定な一般化を実現する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:16:46 GMT)
FreSca: Scaling in Frequency Space Enhances Diffusion Models [55.8] 本稿では,潜時拡散モデルにおける周波数制御について検討する。
本稿では,低周波成分と高周波成分にノイズ差を分解する新しいフレームワークFreScaを紹介する。
FreScaはモデルの再トレーニングやアーキテクチャの変更なしに動作し、モデルとタスクに依存しない制御を提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:12:17 GMT)
Redirection for Erasing Memory (REM): Towards a universal unlearning method for corrupted data [55.3] 本稿では,視覚分類器における多様な学習課題を特徴付ける概念空間を提案する。
本稿では,非学習時に導入した専用ニューロンに劣化したデータをリダイレクトする手法であるRedirection for Erasing Memory (REM)を提案する。
REMは、設計された領域の外で失敗する以前のSOTAメソッドとは対照的に、タスクの空間にわたって強く機能する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:47:27 GMT)
Forensics Adapter: Unleashing CLIP for Generalizable Face Forgery Detection [55.1] ここでは,CLIPを有効かつ一般化可能な顔偽造検知器に変換するためのアダプタネットワークについて述べる。
タスク固有の目的によってガイドされる、偽の顔に固有のブレンディング境界である、偽の痕跡を学習するためのアダプタを導入する。
トレーニング可能なパラメータは5.7Mに過ぎず,5つの標準データセットの平均で約7%向上した。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:14:40 GMT)
CostFilter-AD: Enhancing Anomaly Detection through Matching Cost Filtering [55.1] 非教師付き異常検出(UAD)は、通常のサンプルに対して入力画像の異常マスクをローカライズしようとする。
古典的マッチングタスクから借用したコストフィルタリングの概念をUAD問題に導入する。
本稿では,複数の特徴層にまたがるアテンションクエリとして,入力観測によって導かれるコストボリュームフィルタリングネットワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:45:22 GMT)
Runaway is Ashamed, But Helpful: On the Early-Exit Behavior of Large Language Model-based Agents in Embodied Environments [55.0] 大規模言語モデル(LLM)は、複雑な実施環境において、強力な計画と意思決定能力を示す。
LLMをベースとしたエージェントの早期退避行動を探究する第一歩を踏み出す。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:23:36 GMT)
CP-Guard: Malicious Agent Detection and Defense in Collaborative Bird's Eye View Perception [54.8] コラボレーティブ・パーセプション(CP)は自動運転に有望な技術を示している。
CPでは、ego CAVは協力者からのメッセージを受信する必要があるため、悪意のあるエージェントによる攻撃が容易になる。
本稿では,CPの防御機構であるCP-Guardを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:58:57 GMT)
EXECUTE: A Multilingual Benchmark for LLM Token Understanding [54.7] 複数の言語にまたがるテストでは、他の言語の課題が英語のように常に文字レベルにあるとは限らないことが分かる。
また、中国語、日本語、韓国語のサブ文字タスクについても検討し、LLMの文字成分に対する理解を評価する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:56:48 GMT)
Rethinking Contrastive Learning in Graph Anomaly Detection: A Clean-View Perspective [54.6] グラフ異常検出は、Webセキュリティやファイナンシャル不正検出などの分野で広く応用されているグラフベースのデータにおいて、異常なパターンを特定することを目的としている。
既存の手法は対照的な学習に依存しており、ノードとその局所部分グラフの間のより低い類似性は異常を示すと仮定する。
干渉エッジの存在は、対照的な学習過程を損なう破壊的なノイズをもたらすため、この仮定を無効にする。
コントラスト学習プロセスにおいて重要な干渉源を特定するために,複数スケールの異常認識モジュールを含むクリーンビュー拡張グラフ異常検出フレームワーク(CVGAD)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:05:56 GMT)
The Unreasonable Effectiveness of Model Merging for Cross-Lingual Transfer in LLMs [54.6] 大規模言語モデル(LLM)は、ハイソース言語以外のタスクで依然として苦戦している。
本研究では,タスク固有のポストトレーニングデータが不足している低リソース言語への言語間移動について検討する。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:28:31 GMT)
Enhancing CTR Prediction with De-correlated Expert Networks [53.1] 本稿では,専門的相関を最小化するクロスエキスパートデコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・デコレーショナル・
D-MoEの有効性とデコリレーション原理を検証するために大規模な実験が行われた。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:04:38 GMT)
Co-Reinforcement Learning for Unified Multimodal Understanding and Generation [53.0] 共同最適化のための統一RLステージとタスク固有の拡張のための改良RLステージからなる協調強化学習フレームワークであるtextbfCoRLを紹介する。
得られたモデルである textbfULM-R1 は、3つのテキスト・画像生成データセットで textbf7% を、9つのマルチモーダル理解ベンチマークで textbf23% を平均的に改善する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:41:07 GMT)
Decoupled Geometric Parameterization and its Application in Deep Homography Estimation [53.0] 8自由度(DOF)を持つ平面ホモグラフィは、多くのコンピュータビジョンタスクにおいて基本的なものである。
本稿では, 相似性-核相似性分解を利用して射影変換を行うホモグラフの幾何学的パラメータ化について述べる。
提案したパラメータ化により,行列乗算による直接ホモグラフィ推定が可能となり,線形系を解く必要がなくなり,より深いホモグラフィ推定における4つのコーナー位置オフセットに匹敵する性能が得られる。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:17:49 GMT)
VeriThinker: Learning to Verify Makes Reasoning Model Efficient [52.7] 大型推論モデルは、Chain-of-Thought (CoT)推論を用いて複雑なタスクで優れている。
過度に考える傾向は、必然的に長い推論連鎖に繋がる。
我々は,CoT圧縮の新しい手法であるVeriThinkerを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:17:56 GMT)
The Origins of Representation Manifolds in Large Language Models [52.7] 表現空間におけるコサイン類似性は、最短のオンマンフォールド経路を通して特徴の内在幾何学を符号化することができることを示す。
理論の臨界仮定と予測は、大きな言語モデルのテキスト埋め込みとトークンアクティベーションに基づいて検証される。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:31:22 GMT)
REN: Fast and Efficient Region Encodings from Patch-Based Image Encoders [52.6] Region Network (REN) は、ポイントプロンプトを用いて領域ベースの画像表現を生成するための高速で効果的なモデルである。
RENは、リージョントークンを直接生成する軽量モジュールを使用して、このボトルネックをバイパスする。
これはいくつかのクロスアテンションブロックを使用し、ポイントプロンプトをクエリとして取り、パッチベースのイメージエンコーダからキーと値として機能してリージョントークンを生成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:59:33 GMT)
LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks [52.5] 本稿では,自己注意ネットワークのためのパラメータ効率のよいアンサンブル手法であるLoRA-Ensembleを紹介する。
この方法は、BatchEnsembleのような最先端の暗黙のテクニックを上回るだけでなく、Explicit Ensembleの正確さにマッチするか超える。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:30:27 GMT)
Language models can learn implicit multi-hop reasoning, but only if they have lots of training data [51.9] 暗黙の推論は、言語モデルが単一のフォワードパスでマルチホップ推論タスクを解く能力である。
このようなモデルでは暗黙的な$k$-hop推論を学べるが、必要なトレーニングデータは$k$で指数関数的に増加する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:01:56 GMT)
Think or Not? Exploring Thinking Efficiency in Large Reasoning Models via an Information-Theoretic Lens [51.9] 本稿では,情報理論レンズによる推論プロセスの効率を再考する。
本稿では,理想的な推論経路と段階的な情報提供から分岐を定量化するために,InfoBias と InfoGain という2つの指標を提案する。
これらの知見に触発されて,信頼度が十分に高ければ推論を動的に停止する,エントロピーに基づく適応的思考戦略を導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:38:56 GMT)
Ground Every Sentence: Improving Retrieval-Augmented LLMs with Interleaved Reference-Claim Generation [51.8] 分散テキスト生成(ATG)は,RAGシステムにおける信頼性と妥当性を高めるために提案される。
本稿では,参照と回答を段階的に交互に生成する詳細なATG手法であるReClaimを提案する。
広範囲な実験により,ReClaimの有効性が検証され,90%の引用精度が得られた。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:38:57 GMT)
A Clinician-Friendly Platform for Ophthalmic Image Analysis Without Technical Barriers [51.5] GlobeReadyはクリニックフレンドリーなAIプラットフォームで、再トレーニング、微調整、技術専門知識の必要性なしに、基礎疾患の診断を可能にする。
光コヒーレンス・トモグラフィー(OCT)スキャンを用いて、カラー・ファンドス写真(CPF)を用いた11のファンドス病(93.9-98.5%)と15のファンドス病(87.2-92.7%)の精度を示した。
トレーニングなしのローカル機能拡張を活用することで、GlobeReadyプラットフォームは、センターや人口間のドメインシフトを効果的に軽減する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:03:24 GMT)
DetailFusion: A Dual-branch Framework with Detail Enhancement for Composed Image Retrieval [51.3] Composed Image Retrieval (CIR) は、参照画像と修正テキストを組み合わせたクエリとして、ギャラリーからターゲットイメージを取得することを目的としている。
最近のアプローチでは、2つのモダリティからのグローバル情報のバランスに焦点が当てられ、クエリを検索のための統一的な機能にエンコードする。
DetailFusionは,グローバルおよび詳細な粒度の情報を効果的にコーディネートする,新しいデュアルブランチフレームワークである。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:15:23 GMT)
FLEX: A Backbone for Diffusion-Based Modeling of Spatio-temporal Physical Systems [51.2] FLEX (F Low Expert) は、時間物理系の生成モデリングのためのバックボーンアーキテクチャである。
拡散モデルにおける速度場の分散を低減し、トレーニングの安定化に役立つ。
少数の特徴を2つの逆拡散ステップとして用いて、超解像および予測タスクの正確な予測を行う。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:07:59 GMT)
On the Design of KL-Regularized Policy Gradient Algorithms for LLM Reasoning [50.9] 政策勾配アルゴリズムは大規模言語モデル(LLM)の推論能力の向上に成功している。
オンライン強化学習環境におけるKL正規化政策勾配法を導出・解析するためのフレームワークである正則化政策勾配(RPG)を提案する。
RPGは、GRPO、REINFORCE++、DAPOといった強力なベースラインと比較して、トレーニングの安定性とパフォーマンスの面で改善あるいは競争力のある結果を示している。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:01:21 GMT)
Position IDs Matter: An Enhanced Position Layout for Efficient Context Compression in Large Language Models [50.6] 大規模言語モデル(LLM)の文脈圧縮能力を改善するために,拡張位置レイアウト(EPL)を提案する。
EPLはコンテキストトークンと対応する特別なトークンの間の距離を最小化し、同時に位置IDのシーケンス順序を維持する。
マルチモーダルシナリオに拡張すると、EPLは視覚圧縮LLMに平均2.6の精度向上をもたらす。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:05:49 GMT)
UNJOIN: Enhancing Multi-Table Text-to-SQL Generation via Schema Simplification [50.6] 論理生成からスキーマ要素の検索を分離するフレームワークUNJOINを紹介する。
最初の段階では、各列をテーブル名でプレフィックスすることで、データベース内のすべてのテーブルの列名を単一のテーブル表現にマージします。
第2段階では、クエリは、この単純化されたスキーマに基づいて生成され、JOIN、UNION、リレーショナルロジックを再構築することで、元のスキーマにマップされる。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:28:43 GMT)
Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems [50.3] LLMマルチエージェントシステムにおける障害帰属は、まだ調査が過小評価されており、労働集約的である。
本稿では,3つの自動故障帰属手法の開発と評価を行い,その欠点と欠点を要約する。
最良の方法は、障害に応答するエージェントを特定する際に53.5%の精度を達成するが、故障の特定には14.2%しか役に立たない。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:44:58 GMT)
Achieving Linear Speedup with ProxSkip in Distributed Stochastic Optimization [50.3] ProxSkipは、データに対するロバスト性を維持しながら通信を加速することの証明されたメリットにより、注目を集めている。
ProxSkipは線形速度を実現し,通信の確率に比例した通信オーバーヘッドを低減することができることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:47:35 GMT)
MemeReaCon: Probing Contextual Meme Understanding in Large Vision-Language Models [50.2] 我々は,LVLM(Large Vision Language Models)がミームを本来の文脈でどのように理解するかを評価するために設計された,新しいベンチマークであるMemeReaConを紹介する。
私たちは5つのRedditコミュニティからミームを収集し、各ミームの画像、ポストテキスト、ユーザーコメントを一緒に保持しました。
モデルは文脈において重要な情報を解釈できないか、あるいはコミュニケーション目的を見越しながら視覚的詳細に過度に焦点を合わせるかのどちらかです。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:27:23 GMT)
Offset Unlearning for Large Language Models [49.9] delta-Unlearningは、ブラックボックスLLMのためのオフセットのアンラーニングフレームワークである。
デルタアンラーニングは、一般的な対物スコープタスクにおいて、類似またはより強い性能を維持しながら、効果的にターゲットデータを解放できることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:22:01 GMT)
Tuning for Trustworthiness -- Balancing Performance and Explanation Consistency in Neural Network Optimization [49.6] 我々は,異なる特徴帰属法間の合意として定義された,XAI整合性という新しい概念を紹介する。
予測性能と説明のバランスをとる多目的最適化フレームワークを構築した。
本研究は、トレードオフゾーンバランス性能損失とXAI整合性による強靭性向上のモデルについて、今後の研究基盤を提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:49:55 GMT)
T$^2$: An Adaptive Test-Time Scaling Strategy for Contextual Question Answering [49.5] T$2$: Think-to-Thinkは質問の複雑さに基づいて推論深度を動的に適応する新しいフレームワークである。
T$2$は、質問を構造的要素に分解し、候補推論戦略と同じような例を生成し、これらの戦略を複数の基準に対して評価し、元の質問に最も適切な戦略を適用する、という4つの重要なステップで機能する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:18:02 GMT)
WonderPlay: Dynamic 3D Scene Generation from a Single Image and Actions [49.4] WonderPlayは物理シミュレーションとビデオ生成を統合するフレームワークである。
アクション条件付き動的3Dシーンを1枚の画像から生成する。
WonderPlayは、ユーザが多様なコンテンツのさまざまなシーンと対話することを可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:59:24 GMT)
Representative Action Selection for Large Action-Space Meta-Bandits [49.4] バンドイットの族が共有する大きなアクション空間からサブセットを選択する問題について検討する。
我々は、同様の行動がガウス過程によってモデル化された関連する報酬を持つ傾向があると仮定する。
代表サブセットを選択するための簡単なepsilon-netアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:08:57 GMT)
Taming Diffusion for Dataset Distillation with High Representativeness [49.4] D3HRは、高い代表性を持つ蒸留データセットを生成する新しい拡散ベースのフレームワークである。
我々の実験は、D3HRが異なるモデルアーキテクチャにわたって高い精度を達成できることを実証した。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:05:59 GMT)
EpiCoder: Encompassing Diversity and Complexity in Code Generation [49.2] 既存のコード生成方法はシードデータとしてコードスニペットを使用する。
階層的なコード機能を中心に展開する,新しい機能ツリーベースの合成フレームワークを提案する。
我々のフレームワークは、生成されたコードの複雑さを正確に制御し、関数レベルの操作からマルチファイルのシナリオまで幅広い機能を実現する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:53:45 GMT)
Towards Holistic Evaluation of Large Audio-Language Models: A Comprehensive Survey [49.2] 我々は総合的な調査を行い、LALM評価のための体系的な分類法を提案する。
各カテゴリの詳細な概要と,この分野の課題について紹介する。
調査した論文の収集を公表し、現在進行中の分野の発展を支援するため、積極的に維持していく。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:36:27 GMT)
Surrogate to Poincaré inequalities on manifolds for dimension reduction in nonlinear feature spaces [49.2] 連続微分可能な関数 $u:mathbbRd rightarrow mathbbRm$ を $g:mathbbRd rightarrow mathbbRm$, $mleq d$, $f : mathbbRm rightarrow mathbbRR$ という関数の合成によって近似することを目指している。
固定された$g$に対して、評価を含む古典回帰法を用いて$f$を構築する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:52:01 GMT)
Predicting Length of Stay in Neurological ICU Patients Using Classical Machine Learning and Neural Network Models: A Benchmark Study on MIMIC-IV [49.2] 本研究は、MIMIC-IVデータセットに基づく神経疾患患者を対象とした、ICUにおけるLOS予測のための複数のMLアプローチについて検討する。
評価されたモデルには、古典的MLアルゴリズム(K-Nearest Neighbors、Random Forest、XGBoost、CatBoost)とニューラルネットワーク(LSTM、BERT、テンポラルフュージョントランス)が含まれる。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:06:42 GMT)
Understanding Gated Neurons in Transformers from Their Input-Output Functionality [48.9] ニューロンの入力重みと出力重みのコサイン類似性について検討する。
初期中間層ではエンリッチメントニューロンが支配的であり,後期層では枯渇傾向が見られた。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:14:17 GMT)
Autoregressive Sequence Modeling for 3D Medical Image Representation [48.7] 本稿では, 自己回帰シーケンス事前学習フレームワークを用いて, 3次元医用画像表現を学習するための先駆的手法を提案する。
我々は,空間的,コントラスト的,意味的相関に基づく様々な3次元医用画像にアプローチし,トークンシーケンス内の相互接続された視覚トークンとして扱う。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:11:53 GMT)
InstructPart: Task-Oriented Part Segmentation with Instruction Reasoning [48.5] 実世界の新しいベンチマークであるInstructPartを導入し、現在のモデルの性能を評価し、部分レベルのタスクの理解と実行を行う。
現状のビジョン・ランゲージモデルにおいても,タスク指向の部分分割は依然として困難な問題であることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:36:13 GMT)
Residual Policy Gradient: A Reward View of KL-regularized Objective [48.4] 強化学習と模倣学習は多くの領域で広く成功しているが、実世界の展開には制約が残っている。
ポリシーのカスタマイズは、その固有の特性を維持しつつ、新しいタスク固有の要件を満たしながら、事前のポリシーに適応することを目的として導入された。
ポリシーのカスタマイズに対する原則的なアプローチはResidual Q-Learning (RQL)であり、マルコフ決定プロセス(MDP)として問題を定式化し、価値に基づく学習アルゴリズムのファミリを導出する。
RQLをポリシーグラデーションメソッドに拡張し、グラデーションベースのRL設定でのポリシーカスタマイズを可能にするResidual Policy Gradient(RPG)を導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:11:09 GMT)
Architecture Selection via the Trade-off Between Accuracy and Robustness [48.4] 与えられたアーキテクチャの精度とロバスト性の間のトレードオフを特徴付ける手法と量を定義する。
具体的には、単純なトレードオフ曲線を導入し、与えられた損失関数の最適値の敵攻撃下での感度を捕捉する影響関数を定義し、研究する。
実験では、ニューラルネットワークの対応するトレードオフ曲線と、層数、ニューロン数、ネットワーク構造の違いなど、それらがどのように異なるかを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:04:35 GMT)
Unearthing Gems from Stones: Policy Optimization with Negative Sample Augmentation for LLM Reasoning [48.3] 負のサンプル拡張(BCPG-NSA)による行動制約付きポリシーのグラディエントを提案する。
BCPG-NSA は,1) サンプルセグメンテーション,2) LLM と PRM を併用した合意に基づくステップ正当性評価,3) 正のステップを負のサンプル内で効果的にマイニングするNSA とのポリシー最適化の3段階を含む,詳細なオフラインフレームワークである。
実験の結果、BCPG-NSAは、同じトレーニングデータセットを使用して、いくつかの挑戦的な数学/コーディング推論ベンチマークのベースラインよりも優れていた。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:47:26 GMT)
Stereotype Detection in Natural Language Processing [47.9] ステレオタイプは社会的知覚に影響を与え、差別や暴力へとエスカレートする。
この研究は、心理学、社会学、哲学からの定義を分析し、既存の研究を調査する。
発見は、偏見のエスカレーションやヘイトスピーチの台頭を防ぐための早期監視ツールとしてステレオタイプ検出を強調している。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:03:56 GMT)
Mitigate Position Bias in Large Language Models via Scaling a Single Dimension [47.8] 本稿ではまず,位置バイアスのマイクロレベル表現について考察し,注目重みが位置バイアスのマイクロレベル表現であることを示す。
さらに、位置埋め込みに加えて、因果注意マスクは位置特異的な隠れ状態を作成することによって位置バイアスに寄与する。
これらの知見に基づいて,この位置隠れ状態のスケーリングにより位置バイアスを軽減する手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:01:57 GMT)
BLAST: Balanced Sampling Time Series Corpus for Universal Forecasting Models [47.7] 本稿では,バランスの取れたサンプリング戦略を通じて,データの多様性を高めるための新しい事前学習コーパスを提案する。
BLTは、公開データセットからの321億の観測を取り入れ、時系列パターンを特徴付けるために、包括的な統計メトリクススイートを使用している。
本研究は, 予測タスクにおけるトレーニング効率とモデル性能の両面において, データの多様性が重要な役割を担っていることを明らかにする。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:20:47 GMT)
TransBench: Breaking Barriers for Transferable Graphical User Interface Agents in Dynamic Digital Environments [47.4] 3つの重要な次元にわたるGUIエージェントの転送可能性の体系的評価と向上を目的とした最初のベンチマークであるTransBenchを紹介する。
TransBenchには、さまざまな機能を備えた15のアプリカテゴリが含まれており、堅牢な評価を可能にするため、バージョンやプラットフォームにまたがる不可欠なページをキャプチャする。
実験では,動的実環境におけるGUIエージェントの実用性を示すとともに,グラウンド化精度の大幅な向上を実証した。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:39:06 GMT)
We Need Variations in Speech Generation: Sub-center Modelling for Speaker Embeddings [47.3] 本稿では,学習中に話者単位の複数のサブセンタを利用する新しい話者埋め込みネットワークを提案する。
このサブセンターモデリングにより、埋め込みは話者分類性能を維持しながら、幅広い話者固有のバリエーションを捉えることができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:58:46 GMT)
Scalable Policy Maximization Under Network Interference [46.2] 動的ネットワーク上での干渉下での最適政治学習について検討する。
干渉の構造に関する一般的な仮定では、報酬は線形となる。
我々は,新しい$n$ノードネットワークが各ラウンドで観測された場合に,ポリシーの影響を最大化するスケーラブルなトンプソンサンプリングアルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:19:12 GMT)
The Pilot Corpus of the English Semantic Sketches [46.0] この論文は、英語の動詞のセマンティックスケッチの作成に捧げられている。
英語とロシア語のスケッチのペアで構成されており、スケッチがどのようなコントラストのある研究を行うかを示すことを目的としている。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:53:00 GMT)
Mind the Blind Spots: A Focus-Level Evaluation Framework for LLM Reviews [46.0] 大きな言語モデル(LLM)は、レビューを自動的にドラフトできる。
LLM生成レビューが信頼できるかどうかを決定するには、体系的な評価が必要である。
注意の正規分布として焦点を運用する焦点レベル評価フレームワークを導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:21:39 GMT)
Activation Control for Efficiently Eliciting Long Chain-of-thought Ability of Language Models [45.9] 本報告では,最後の数層における高影響活性化の小さなセットが,長大な推論特性を支配していることを示す。
これらのアクティベーションを増幅し、"待機"トークンを挿入することで、トレーニングなしで長いCoT機能を呼び出すことができます。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:07:18 GMT)
Don't Overthink it. Preferring Shorter Thinking Chains for Improved LLM Reasoning [45.8] 大規模言語モデル(LLM)の推論は、複雑な推論タスクを実行するためにテスト時間計算のスケーリングに依存する。
個々の質問における短い推論連鎖が、正しい回答をもたらす可能性が著しく高いことを実証する。
次に、短いトレーニングがパフォーマンスの向上につながることを観察します。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:29:06 GMT)
Reflectance Prediction-based Knowledge Distillation for Robust 3D Object Detection in Compressed Point Clouds [45.7] 本稿では,反射率予測に基づく知識蒸留(RPKD)を用いた3次元物体検出フレームワークを提案する。
我々は、低ビットレート伝送中に反射率をなくしながら点座標を圧縮し、デコードされた非反射性圧縮点雲を学生検出器に供給する。
複数のコードレートで圧縮点雲の検出精度を向上させることができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:52:27 GMT)
Simultaneous Modeling of Protein Conformation and Dynamics via Autoregression [45.5] ConfRoverは自己回帰モデルであり、MD軌道からタンパク質のコンホメーションとダイナミクスを同時に学習する。
時間に依存しないサンプリングと時間に依存しないサンプリングの両方をサポートする。
大規模タンパク質MDデータセットであるATLASの実験は、我々のモデルの有効性を実証している。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:00:15 GMT)
Automated Testing of the GUI of a Real-Life Engineering Software using Large Language Models [45.5] テストは、エンドユーザに提示されるソフトウェアの非直感的な振る舞いを決定することを目的としています。
ソフトウェアの開発には貴重なフィードバックを提供するが、実行には時間を要する。
本稿では,Large Language Models (LLMs) を用いて,現実のエンジニアリングソフトウェアにおけるGUIの探索テストを行うシステムであるGERALLTについて述べる。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:53:28 GMT)
Think or Not? Selective Reasoning via Reinforcement Learning for Vision-Language Models [45.3] TONは視覚言語モデルの2段階のトレーニング戦略である。
選択的な推論のためのコールドスタートとして機能するシンクまたはノットフォーマットを導入している。
TONは、バニラGRPOと比較して、完成期間を最大90%短縮することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:09:00 GMT)
Extended Inductive Reasoning for Personalized Preference Inference from Behavioral Signals [45.0] 本稿では,パーソナライズされた選好推論のレンズを用いた大規模言語モデル(LLM)の拡張帰納的推論について検討する。
我々は,ユーザインタラクション履歴における行動信号からの系統的な選好推定を可能にするために,拡張推論連鎖を利用したtextscAlignXploreを提案する。
我々は、textscAlignXploreが、ドメイン内およびドメイン外のベンチマークで平均11.05%、バックボーンモデルよりも大幅に改善されていることを実証した。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:16:46 GMT)
SAKURA: On the Multi-hop Reasoning of Large Audio-Language Models Based on Speech and Audio Information [45.0] 大規模音声言語モデル(LALM)は、音声、音声などにおけるマルチモーダル理解によって、大きな言語モデルを拡張する。
音声および音声処理タスクにおける彼らのパフォーマンスは広範囲に研究されているが、その推論能力はいまだに未解明である。
音声情報と音声情報に基づいて,LALMのマルチホップ推論を評価するベンチマークであるSAkuraを紹介する。
その結果,LALMは,関連情報を正しく抽出しても,マルチホップ推論のための音声/音声表現の統合に苦慮していることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:41:15 GMT)
A deep solver for backward stochastic Volterra integral equations [45.0] 後方ボルテラ積分方程式(BSVIE)に対する最初のディープラーニング解法を提案する。
この方法はニューラルネットワークを訓練し、2つの解場を1段階で近似させる。
これらの結果は、制御と量的ファイナンスにおける高次元、経路に依存した問題のファミリーへの実践的アクセスを開放する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:41:54 GMT)
Improving Multi-task Learning via Seeking Task-based Flat Regions [45.0] MTL(Multi-Task Learning)は、ディープニューラルネットワークをトレーニングするための強力な学習パラダイムである。
MTLには、究極の勾配降下方向を導出するためにタスク勾配を操作することに焦点を当てた、新たな作業ラインがある。
単タスク学習におけるモデル一般化能力を向上するシャープネス認識最小化という,最近導入されたトレーニング手法を活用することを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:31:36 GMT)
When Are Concepts Erased From Diffusion Models? [44.9] 概念消去とは、モデルが特定の概念を生成するのを選択的に阻止する能力である。
拡散モデルにおける消去機構の2つの概念モデルを提案する。
概念がモデルから真に消去されたかどうかを徹底的に評価するために,独立した評価スイートを導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:12:20 GMT)
FlashForge: Ultra-Efficient Prefix-Aware Attention for LLM Decoding [44.5] 複数のプロンプト間のプレフィックス共有は、共有プレフィックスの操作を組み合わせる機会を提供する。
デコーディングは、プレフィックスのキー値(KV)キャッシュに大量のメモリアクセスを必要とするメモリ集約プロセスである。
我々は,共有KVキャッシュのメモリアクセスをデコードステージ,すなわちFlashForgeで組み合わせるための専用アテンションカーネルを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:03:28 GMT)
PrivaCI-Bench: Evaluating Privacy with Contextual Integrity and Legal Compliance [44.3] 生成型大規模言語モデル(LLM)のコンテキストプライバシ評価ベンチマークであるPrivaCI-Benchを提案する。
本稿では,最近の推論モデルQwQ-32BとDeepseek R1を含む最新のLCMを評価した。
実験の結果、LLMは特定のコンテキスト内で重要なCIパラメータを効果的にキャプチャできるが、プライバシコンプライアンスのさらなる進歩が必要であることが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:53:04 GMT)
SETS: Leveraging Self-Verification and Self-Correction for Improved Test-Time Scaling [44.1] 本稿では、並列およびシーケンシャルなテクニックを戦略的に組み合わせることで制限を克服する新しいアプローチであるSelf-Enhanced Test-Time Scaling(SETS)を紹介する。
SETSは、大規模言語モデルの固有の自己検証と自己補正機能を活用し、単一のフレームワーク内でサンプリング、検証、修正を統一する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:26:30 GMT)
Value-Guided Search for Efficient Chain-of-Thought Reasoning [44.0] 1.5Bトークンレベルの値モデルをトレーニングし、DeepSeekモデルに適用して、テスト時間計算のスケーリングによるパフォーマンス向上を実現します。
推論予算は64世代で、DeepSeek-R1-Distill-1.5BのVGSは4つのベンチマークで平均45.7%の精度を達成している。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:05:07 GMT)
KITINet: Kinetics Theory Inspired Network Architectures with PDE Simulation Approaches [43.9] 本稿では,非平衡粒子動力学のレンズによる特徴伝播を再解釈する新しいアーキテクチャKITINetを紹介する。
そこで本研究では,粒子系の進化をモデルとした残留モジュールを提案する。
この定式化は粒子衝突とエネルギー交換を模倣し、物理インフォームド相互作用による適応的特徴改善を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:58:29 GMT)
More Thinking, Less Seeing? Assessing Amplified Hallucination in Multimodal Reasoning Models [43.5] テストタイム計算は、拡張推論チェーンを生成するために、大きな言語モデルに権限を与えた。
世代が長くなるにつれて、モデルは画像付きコンテンツから遠ざかっていき、言語優先に大きく依存する傾向にある。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:08:40 GMT)
Gaming Tool Preferences in Agentic LLMs [43.4] 大規模な言語モデル(LLM)が、幅広い外部ツールにアクセスできるようになった。
LLMは、どのツールを使うかを決定するツールのテキスト記述に完全に依存している。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:43:48 GMT)
Enhancing Large-Scale AI Training Efficiency: The C4 Solution for Real-Time Anomaly Detection and Communication Optimization [43.2] 大規模言語モデル(LLM)は、分散トレーニング技術の導入を必要としている。
大規模分散トレーニングシステムの効率は、ハードウェアエラーの可能性があるため、しばしば最適以下である。
通信駆動型ソリューション,すなわちC4を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:34:50 GMT)
UICopilot: Automating UI Synthesis via Hierarchical Code Generation from Webpage Designs [43.0] 本稿では,Webページの設計から階層的なコード生成によってユーザインタフェース(UI)を自動生成する手法を提案する。
UICopilotの基本的な考え方は、生成プロセスを2つのステージに分解することである。
実験の結果、UICopilotは、自動評価と人的評価の両方において、既存のベースラインを大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:34:36 GMT)
Task Arithmetic for Language Expansion in Speech Translation [41.7] 我々は,タスク算術を用いて既存の1対1のSTシステムから1対1のSTシステムを構築することを目的としている。
MuST-CとCoVoST-2の実験では、BLEUのスコアは最大4.66と4.92で改善され、COMETのゲインは8.87と11.83だった。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:59:36 GMT)
Scaling Image and Video Generation via Test-Time Evolutionary Search [41.7] テスト時間スケーリング(TTS)は、推論時にさらなる計算を割り当てることで、生成モデルの性能を向上させるための有望な方向として登場した。
EvoSearchは、拡散とフローモデル間の画像生成とビデオ生成のスケーラビリティを効果的に向上する、新規で汎用的で効率的なTS手法である。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:25:46 GMT)
UAlign: Leveraging Uncertainty Estimations for Factuality Alignment on Large Language Models [41.7] 大きな言語モデル(LLM)は、しばしば、彼らが持っている事実の知識を正確に表現するのに苦労する。
知識境界を表現するために不確実性推定を利用するUAlignフレームワークを提案する。
提案したUAlign は LLM の能力を大幅に向上させ,既知の疑問に自信を持って答えることができることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:05:52 GMT)
VietASR: Achieving Industry-level Vietnamese ASR with 50-hour labeled data and Large-Scale Speech Pretraining [41.6] 大量のラベル付きデータとラベル付きデータの小さなセットを活用する新しいASRトレーニングパイプラインであるVietaSRを提案する。
70,000時間のラベル付きデータに対する事前トレーニングと,50時間ラベル付きデータに対する微調整により,軽量だが強力なASRモデルが得られることを示す。
私たちのコードとモデルは、低リソースのASRの研究を促進するためにオープンソース化されます。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:26:11 GMT)
ScalingNoise: Scaling Inference-Time Search for Generating Infinite Videos [41.5] ビデオ拡散モデル(VDM)は高品質のビデオの生成を容易にする。
近年,映像の質を高める「金音」の存在が報告されている。
本研究では,拡散サンプリングプロセスにおける黄金の初期雑音を識別する,プラグアンドプレイの推論時間探索手法であるScalingNoiseを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:01:04 GMT)
EduBench: A Comprehensive Benchmarking Dataset for Evaluating Large Language Models in Diverse Educational Scenarios [41.4] 教育シナリオに適した最初の多様なベンチマークを紹介します。
本稿では,教師と学生の両方に関係のある12つの重要な側面をカバーする多次元評価指標を提案する。
構築したデータセット上で比較的小規模なモデルをトレーニングし、最先端の大規模モデルに匹敵するパフォーマンスを実現することを実証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:54:10 GMT)
Explaining Sources of Uncertainty in Automated Fact-Checking [41.2] CLUE (Conflict-and-Agreement-aware Language-aware Language-model Uncertainty Explanations) は、モデル不確実性の自然言語説明を生成するフレームワークである。
クレーム・エビデンス(クレーム・エビデンス)またはインターエビデンス・コンフリクト(インターエビデンス・コンフリクト)を暴露するテキストと、モデルの予測の不確実性を促進する合意の間の関係を識別する。
CLUEは、モデルの不確実性により忠実で、事実チェックの決定とより一貫性のある説明を生成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:06:43 GMT)
Understanding Pre-training and Fine-tuning from Loss Landscape Perspectives [41.2] 事前学習によって「基本能力」の盆地が作り出され、その後の微調整によって「特殊能力」の盆地が生まれる。
最上級の景観(すなわち、ほとんどの方向に沿った風景)と最悪の景観(すなわち、最悪の方向に沿った風景)の2つのタイプの損失景観について検討する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:06:40 GMT)
Instructify: Demystifying Metadata to Visual Instruction Tuning Data Conversion [41.1] オープンなLCMを用いて、利用可能なメタデータをVisIT命令に変換するための、オープンで統一されたレシピとアプローチを提案する。
我々のアプローチは、同じ画像データやメタデータソースに適用した場合、利用可能なVisITデータセットのデータ品質を再現または向上することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:14:12 GMT)
Information Gain-Guided Causal Intervention for Autonomous Debiasing Large Language Models [40.9] 現在の大規模言語モデル(LLM)は、まだデータセットのバイアスをキャプチャして、推論時に利用することができる。
本稿では,情報ゲイン誘導型因果介入脱バイアスフレームワークを提案する。
ICDはLLMを効果的にデバイアスし、様々なタスクにおける一般化性を向上させる。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:34:49 GMT)
DiffusionReward: Enhancing Blind Face Restoration through Reward Feedback Learning [40.6] DiffusionRewardという名前のReFLフレームワークをBlind Face Restorationタスクに初めて導入する。
私たちのフレームワークの中核はFace Reward Model(FRM)です。
合成およびワイルドデータセットの実験により,本手法が最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:53:23 GMT)
An Outlook on the Opportunities and Challenges of Multi-Agent AI Systems [40.5] マルチエージェントAIシステム(MAS)は、分散インテリジェンスのための有望なフレームワークを提供する。
本稿は、大規模言語モデル(LLM)の最近の進歩、連合最適化、人間とAIの相互作用から洞察を得て、MASの現在の可能性と課題を体系的に概観する。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:05:19 GMT)
Breaking Down Quantum Compilation: Profiling and Identifying Costly Passes [40.1] 本稿では,Qiskitにおける量子回路コンパイルプロセスの予備解析を行う。
コンパイル時間全体に最も強い影響を与えるタスクを特定します。
その結果,最適化レベルが向上するにつれて,回路合成とゲートパスが最優先課題であることが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:58:35 GMT)
Towards General Continuous Memory for Vision-Language Models [40.0] 言語モデル(LM)とその拡張である視覚言語モデル(VLM)は、様々なタスクで顕著なパフォーマンスを実現している。
彼らはまだ、マルチモーダルまたはマルチリンガルな実世界の知識を必要とする複雑な推論タスクに苦慮している。
本稿では,マルチモーダルおよび多言語知識を表現するために,連続記憶(continuous memory)という高密度埋め込みのコンパクトな集合を提案する。
我々のアプローチであるCoMEMは、VLMの本来の能力を利用して、任意のマルチモーダルおよび多言語知識をたった8つの連続的な埋め込みにエンコードする。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:36:53 GMT)
Efficient Adaptive Experimentation with Non-Compliance [39.4] 本研究では, 適応実験における平均治療効果 (ATE) の推定問題について検討する。
AMRIV は最適アロケーションを (ii) 乗算整合性を維持しつつ半パラメトリック効率を達成できる逐次的影響関数に基づく推定器で適応的に近似するオンラインポリシーである。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:49:14 GMT)
Towards Dynamic 3D Reconstruction of Hand-Instrument Interaction in Ophthalmic Surgery [38.7] 本研究は,眼科手術用RGB-D動的3D再構成データセットであるOphNet-3Dを紹介する。
40人の外科医の41のシーケンスと7100万のフレームで構成され、12の手術フェーズ、10の楽器カテゴリ、密集したMANOハンドメッシュ、フル6-DoFの楽器ポーズの詳細なアノテーションを備えている。
OphNet-3Dをベースとして,手動ポーズ推定と手動間相互作用再構成という2つの挑戦的なベンチマークを構築した。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:44:02 GMT)
HumaniBench: A Human-Centric Framework for Large Multimodal Models Evaluation [38.6] 我々は32Kの実世界の画像質問対の総合的なベンチマークであるHumaniBenchを紹介する。
HumaniBenchは、公正性、倫理、理解、推論、言語の傾き、共感、堅牢性を含む7つのHuman Centered AI(HCAI)の原則を評価している。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:45:14 GMT)
Towards Evaluating Proactive Risk Awareness of Multimodal Language Models [38.6] プロアクティブな安全人工知能(AI)システムは、リアクティブシステムよりもうまく機能する。
PaSBenchは416のマルチモーダルシナリオを通じてこの機能を評価する。
Gemini-2.5-proのようなトップパフォーマーは、71%のイメージと64%のテキスト精度を達成したが、繰り返しトライアルで45-55%のリスクを逃した。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:28:47 GMT)
Robust Weight Imprinting: Insights from Neural Collapse and Proxy-Based Aggregation [38.4] 本稿では, 生成, 正規化, 集約という3つの主要コンポーネントを同定し, インプリントするためのフレームワークを提案する。
生成段階において、複数のプロキシで新しいデータを表現できることの利点を明らかにし、適切な正規化の重要性を示す。
以上の結果から,新しいクラスに対する複雑なデータ分散を伴う難解なシナリオでは,最大4%の増加が見られた。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:42:27 GMT)
Guided by Gut: Efficient Test-Time Scaling with Reinforced Intrinsic Confidence [38.3] 大規模言語モデル(LLM)推論を強化するためのTTS(Test-Time Scaling)手法は、しばしばかなりの計算コストを発生させる。
本稿では,外部検証モデルに代えてPRMレベルの性能を実現する,効率的な自己誘導型TTSフレームワークである Guided by Gut (GG) を紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:19:09 GMT)
Daily-Omni: Towards Audio-Visual Reasoning with Temporal Alignment across Modalities [38.3] MLLM(Multimodal Large Language Models)は、視覚および音声のベンチマークにおいて、独立して有望な性能を達成する。
しかし、これらのモデルがクロスモーダル情報を同期的に処理する能力は、まだほとんど解明されていない。
本稿では,(1)日常の生活シナリオの684の動画を多種多様なソースから収録するデイリー・オムニ,(2)自動アノテーション,QA生成,QA最適化を含むデイリー・オムニ生成パイプライン,(3)オープンソースのビジュアル言語モデル(VLM),音声言語モデル(ALM)を利用したトレーニングフリーエージェントであるデイリー・オムニ・アジェントを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:13:58 GMT)
PoseBH: Prototypical Multi-Dataset Training Beyond Human Pose Estimation [38.2] PoseBHは、ポーズ推定のための新しいマルチデータセットトレーニングフレームワークである。
キーポイントの不均一性と2つのキーテクニックによる限定的な監視に取り組む。
我々の学習キーポイント埋め込みは手形状推定(InterHand2.6M)と人体形状推定(DPW)に効果的に伝達される。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:58:20 GMT)
What Media Frames Reveal About Stance: A Dataset and Study about Memes in Climate Change Discourse [37.9] 我々は、気候変動に関するインターネットのミームとの相互作用を概念化し、計算的に探求するために、学際的アプローチを適用した。
CLIMATEMEMES(CLIMATEMEMES)は、気候変化のミームにスタンスとメディアフレームの両方を付加した最初のデータセットである。
本稿では,姿勢検出とメディアフレーム検出の2つの課題を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:33:48 GMT)
Bruno: Backpropagation Running Undersampled for Novel device Optimization [37.7] 強誘電体非揮発性デバイス(RRAM)上に構築されたスパイキングニューロンとシナプスに基づくハードウェアのためのニューラルネットワークのトレーニングのためのボトムアップアプローチを提案する。
トレーニングアルゴリズムは、RRAMと強誘電体集積火炎ニューロンに基づく量子化されたシナプスからなるネットワークでデータセット上でテストされる。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:06:43 GMT)
SVD-Free Low-Rank Adaptive Gradient Optimization for Large Language Models [37.6] 低次元空間へのSVDに基づく勾配投影を近似するための2段階の手順を提案する。
事前学習と微調整の両方に関する実験は、我々の二重戦略の有効性を実証している。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:37:00 GMT)
Enhancing Unsupervised Sentence Embeddings via Knowledge-Driven Data Augmentation and Gaussian-Decayed Contrastive Learning [37.5] 大規模言語モデル(LLM)を用いたパイプラインベースのデータ拡張手法を提案する。
本稿では,非教師なし文の埋め込みを改善するために,ガウス型勾配支援コントラスト文埋め込み(GCSE)モデルを提案する。
実験結果から,本手法は意味的テキスト類似性タスクにおける最先端性能を実現することができることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:29:09 GMT)
Learning Generalized and Flexible Trajectory Models from Omni-Semantic Supervision [37.3] OmniTrajは,4つの相補的モダリティやセマンティクスを統合システムに統合した,フレキシブルなOmni-semantic trajectory検索フレームワークである。
単一のモダリティとして計算や処理に限られる従来のアプローチとは異なり、OmniTrajは、共有表現空間に埋め込まれた各モダリティのための専用エンコーダを設計した。
この設計により、OmniTrajは個々のモダリティや組み合わせに基づいて正確で柔軟なクエリをサポートし、従来の類似性に基づくメソッドの剛性に打ち勝つことができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:32:24 GMT)
MARCO: Meta-Reflection with Cross-Referencing for Code Reasoning [37.0] 我々は、LLMエージェントが提案するソリューションごとにコード推論において徐々に賢くなる方法を探る。
認知進化的視点を取り入れたメタリフレクション(Meta-Reflection with Cross-Reference, MARCO)という新しいフレームワークを提案する。
コード推論において,様々なデータセットに対して実験を行い,MARCOの有効性を実証した。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:21:11 GMT)
PreMoe: Lightening MoEs on Constrained Memory by Expert Pruning and Retrieval [37.0] Mixture-of-experts (MoE) アーキテクチャにより、計算コストの比例的な増加を伴わずに、大規模言語モデル(LLM)を膨大なパラメータ数に拡張することができる。
しかし、大規模なMoEモデルの重要なメモリ需要は、様々な計算環境への展開を妨げる。
メモリに制約のある環境において,大規模MOEモデルの効率的な展開を可能にする新しいフレームワークであるPreMoeを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:59:16 GMT)
Challenger: Affordable Adversarial Driving Video Generation [36.9] Challenger(チャレンジャー)は、物理的に可視だがフォトリアリスティックな対向駆動ビデオを生成するフレームワークである。
nuScenesデータセットでテストされているように、Challengeはさまざまなアグレッシブな駆動シナリオを生成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:48:27 GMT)
ConnectomeDiffuser: Generative AI Enables Brain Network Construction from Diffusion Tensor Imaging [36.9] 脳ネットワーク解析はアルツハイマー病(AD)などの神経変性疾患の診断とモニタリングに重要な役割を果たしている
拡散テンソルイメージング(DTI)から構造脳ネットワークを構築するための既存のアプローチは、しばしば固有の制限に悩まされる特別なツールキットに依存している。
本研究は,DTIによるエンド・ツー・エンド脳ネットワーク構築のための新しい拡散型フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:03:58 GMT)
Dynamic Text Bundling Supervision for Zero-Shot Inference on Text-Attributed Graphs [36.6] 大規模言語モデル(LLM)は多くのゼロショット学習問題で使われている。
LLMは、グラフトポロジから分離されたテキスト属性と競合する。
これらは、情報不足とLLMの固有の弱点の両方により、信頼性の低い予測をもたらす。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:12:16 GMT)
CodeCrash: Stress Testing LLM Reasoning under Structural and Semantic Perturbations [36.6] 大規模言語モデル(LLM)は、最近、コード関連のタスクにおいて強力な能力を示したが、コード理解と推論の堅牢性はまだ十分に調査されていない。
既存の2つのデータセットから1,279の質問をまとめた総合的なストレステストベンチマークであるCodeCrashを紹介する。
我々は,直接的および連鎖的プロンプト手法を用いて,入力および出力予測タスクにまたがる17個のLLMを体系的に評価した。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:23:24 GMT)
Mahalanobis++: Improving OOD Detection via Feature Normalization [36.6] ell$-normalizationは従来のマハラノビス距離に基づくアプローチを大幅に改善することを示す。
また、$ell$-normalizationは通常の分散データの前提とよく一致していることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:36:22 GMT)
Compression Hacking: A Supplementary Perspective on Informatics Metric of Language Models from Geometric Distortion [36.5] 幾何学的観点から、高度に圧縮されたLMのワード表現空間は、非常に異方性のある状態に縮退する傾向がある。
この同期性は基本的にLM表現におけるCompression Hacking''である。
幾何学的歪み解析を取り入れ, 自己評価パイプラインに統合することにより, 高精度な3つの圧縮指標を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:11:03 GMT)
MlingConf: A Comprehensive Study of Multilingual Confidence Estimation on Large Language Models [36.3] 本稿では,多言語信頼度推定(MlingConf)の大規模言語モデル(LLM)に関する包括的調査を紹介する。
このベンチマークは、LAタスクのための4つの厳密にチェックされ、人間によって評価された高品質な多言語データセットと、言語の特定の社会的、文化的、地理的コンテキストに合わせて調整されたLSタスクからなる。
LAのタスクでは、英語が他の言語よりも言語的優位性を示す一方で、LSタスクでは、質問関連言語を用いてLSMを誘導し、多言語的信頼度推定において言語的優位性を改善することが示されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:38:42 GMT)
Quantum Compiler Design for Qubit Mapping and Routing: A Cross-Architectural Survey of Superconducting, Trapped-Ion, and Neutral Atom Systems [36.2] 本稿では,3つの主流量子ハードウェアプラットフォームにおける量子ビットマッピングとルーティング問題について検討・分類する。
主に超伝導プラットフォーム用ハードウェア対応コンパイラの開発について検討する。
トラップイオンと中性原子装置の進化について検討する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:32:39 GMT)
On The Sample Complexity Bounds In Bilevel Reinforcement Learning [36.2] 二段階強化学習(BRL)は、生成モデルを調整するための強力なフレームワークとして登場した。
連続状態-作用複雑性において$mathcalO(epsilon)$の最初のサンプルを示す。
我々の分析は、既存の$mathcalO(epsilon)$のバウンダリで、複雑さを改善します。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:57:37 GMT)
On The Global Convergence Of Online RLHF With Neural Parametrization [36.2] Reinforcement Learning from Human Feedback (RLHF)は、大きな言語モデルと人間の価値を結びつけることを目的としている。
RLHFは、教師付き微調整、報酬学習、政策学習を含む3段階のプロセスである。
本稿では、パラメータ化設定におけるAIアライメントのための2段階の定式化を提案し、この問題を解決するための一階法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:31:51 GMT)
NeuroTrails: Training with Dynamic Sparse Heads as the Key to Effective Ensembling [35.8] 動的に進化するトポロジを持つスパースなマルチヘッドアーキテクチャであるtextbfNeuroTrails$を紹介した。
NeuroTrailsはコンピュータビジョンと言語タスクの畳み込みとトランスフォーマーベースのアーキテクチャで有効性を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:53:21 GMT)
Follow the Energy, Find the Path: Riemannian Metrics from Energy-Based Models [35.5] 本稿では,事前学習したエネルギーベースモデルから直接リーマン計量を導出する手法を提案する。
これらの測度は空間的に異なる距離を定義し、測地学の計算を可能にする。
EBM由来のメトリクスは、確立されたベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:18:08 GMT)
Diffusion Classifiers Understand Compositionality, but Conditions Apply [35.4] 本稿では,多種多様な構成課題における拡散分類器の識別能力について検討する。
具体的には,10のデータセットと30以上のタスクにまたがる3つの拡散モデル(SD 1.5,2.0,および3m)について検討する。
また,拡散モデル自体が生成した画像からなる新たな診断ベンチマークも導入した。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:29:52 GMT)
SpikeGen: Generative Framework for Visual Spike Stream Processing [35.3] 我々はスパイクカメラが捉えた視覚的なスパイクストリームのための堅牢な生成処理フレームワークSpikeGenを紹介した。
このフレームワークは,条件付き画像/ビデオのデブロアリング,スパイクストリームからの高密度フレーム再構成,高速シーンノベルビュー合成など,混合スパイク-RGBモダリティを含む複数のタスクにまたがって評価される。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:54:11 GMT)
InfantAgent-Next: A Multimodal Generalist Agent for Automated Computer Interaction [35.3] 本稿では,マルチモーダル方式でコンピュータと対話できる汎用エージェントであるtextscInfantAgent-Nextを紹介する。
ひとつの大きなモデルに複雑に構築するか、モジュール性のみを提供する既存のアプローチとは異なり、当社のエージェントはツールベースと純粋な視覚エージェントを統合しています。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:56:38 GMT)
QFT: Quantized Full-parameter Tuning of LLMs with Affordable Resources [35.2] 大規模言語モデル(LLM)は、さまざまな自然言語処理タスクに顕著な影響を与えている。
下流データセットでトレーニング済みのモデルを微調整することで、大幅なパフォーマンス向上を実現している。
このプロセスは通常、大量の高価なハイエンドGPUを必要とする。
トレーニング状態の量子化と格納を行う量子化フルパラメータチューニングフレームワークであるQFTを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:14:30 GMT)
Ctrl-Room: Controllable Text-to-3D Room Meshes Generation with Layout Constraints [35.1] 我々はCtrl-Roomを提案する。Ctrl-Roomは、デザイナースタイルのレイアウトとテキストプロンプトから高忠実なテクスチャを持つ説得力のある3Dルームを生成できる。
Ctrl-Roomは、個々の家具アイテムのリサイズや移動といった多目的なインタラクティブな編集操作を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:46:56 GMT)
Not All Tokens Are What You Need In Thinking [34.8] 条件付きトークン選択(CTS)は、思考の連鎖において最も重要なトークンのみを特定し保存する。
CTSは、強い推論性能を維持しながら、効果的に長いCoTを圧縮する。
さらにトレーニングトークンを42%削減すると、限界5%の精度低下しか生じず、推論トークンの75.8%が減少する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:41:29 GMT)
Rethinking Agent Design: From Top-Down Workflows to Bottom-Up Skill Evolution [34.7] 人間の学習過程を反映したボトムアップエージェントパラダイムを導入する。
エージェントは、試行錯誤メカニズムを探索し、成果を反映し、時間とともにスキルを抽象化することで能力を獲得する。
Slay the Spire and Civilization Vでは、エージェントが生の視覚的入力を通じて知覚し、マウスのアウトプットを介して行動する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:38:55 GMT)
Rewarding Doubt: A Reinforcement Learning Approach to Calibrated Confidence Expression of Large Language Models [34.6] LLM(Large Language Models)の安全かつ信頼性の高い使用には、その回答に対する信頼性の正確な表現が必要である。
そこで本研究では,LLMを直接微調整し,評価された信頼度を,実際の質問に対する回答とともに表現できる新しい強化学習手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:40:34 GMT)
CrashAgent: Crash Scenario Generation via Multi-modal Reasoning [34.4] CrashAgentは,マルチモーダルな実世界の交通事故レポートを解釈するフレームワークである。
生成した衝突シナリオを,レイアウト再構成の精度,衝突速度,多様性など,複数の観点から評価した。
結果、高品質で大規模なクラッシュデータセットが公開され、安全な運転アルゴリズムの開発がサポートされる。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:55:32 GMT)
Towards Dynamic Theory of Mind: Evaluating LLM Adaptation to Temporal Evolution of Human States [34.3] 我々は、大規模言語モデルが精神状態の時間的進行を理解し、追跡する能力を評価するために設計された新しいベンチマークであるtextscDynToMを提案する。
私たちは5500のシナリオと78,100の質問を含む1,100の社会的コンテキストを生成します。
我々の総合評価では、心的状態の変化の追跡と推論において、平均的なパフォーマンスは人間を44.7%下回る結果となった。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:27:40 GMT)
How Much Do Large Language Models Know about Human Motion? A Case Study in 3D Avatar Control [34.2] 基本動作プリミティブとバランスの取れた身体部分の使用を網羅した20の代表的な動作指示を設計する。
LLMは高次身体運動の解釈に長けているが, 正確な身体部位の位置決めに苦慮している。
LLMは創造的な動きを概念化し、文化的に特有の動きのパターンを区別する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:01:08 GMT)
Few-Shot Learning from Gigapixel Images via Hierarchical Vision-Language Alignment and Modeling [34.1] HiVE-MILは階層的な視覚言語フレームワークであり、粗い(5x)と細い(20x)視覚/テキストノード間の親子リンクからなる統一グラフを構築する。
セマンティック一貫性をさらに強化するため、HiVE-MILには2段階のテキスト誘導動的フィルタリング機構が組み込まれている。
TCGA乳がん、肺がん、腎臓がんのデータセットの実験では、HiVE-MILは従来のMILと最近のVLMベースのMILアプローチの両方で一貫して優れていた。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:48:32 GMT)
Sample Complexity of Diffusion Model Training Without Empirical Risk Minimizer Access [34.0] スコア推定の原理的解析を行い、$widetildemathcalO(epsilon-6)$のサンプル複雑性を確立する。
これは、スコア関数推定損失の経験的リスク最小化器へのアクセスを仮定することなく、サンプル複雑性境界を達成する最初の結果である。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:02:15 GMT)
Dual Ascent Diffusion for Inverse Problems [33.9] 本稿では, 拡散モデルによるMAP問題の解法を, 二重登頂最適化フレームワークを用いて提案する。
本フレームワークは,画像復元問題に対する様々な指標による画像の質向上を実現し,高レベルの計測ノイズに対して頑健であり,高速であり,また,観測結果の忠実性を表す解を推定する。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:12:20 GMT)
Navigate the Unknown: Enhancing LLM Reasoning with Intrinsic Motivation Guided Exploration [33.8] 大規模言語モデル(LLM)の推論能力向上のための重要な手法として強化学習(RL)が登場した。
RLアプローチは、スパース結果に基づく報酬への依存と、探索のインセンティブを高めるための不十分なメカニズムにより、重要な制限に直面している。
固有モチベーション guidEd ExploratioN meThOd foR LLM Reasoning (i-MENTOR) を提案する。
i-MENTORは、トークンレベルの戦略におけるバイアスを軽減する軌道対応探索報酬、大きなアクション空間における探索と利用を安定化するための動的報酬スケーリング、そして、維持する有利な報酬実装の3つの重要なイノベーションを紹介している。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:30:28 GMT)
Superplatforms Have to Attack AI Agents [33.7] スーパープラットフォームは、デジタルトラフィックの入り口を集中的に制御するために、AIエージェントを攻撃しなければならない、と我々は主張する。
AIエージェントがスーパープラットフォームを中途半端にし、次の支配的なゲートキーパーになる可能性を示す。
私たちの目標は、コラボレーティブソリューションに対する意識を高め、批判的な議論を促進することです。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:13:44 GMT)
VERDI: VLM-Embedded Reasoning for Autonomous Driving [33.7] 自律走行(VERDI)のためのVLM埋め込み推論を提案する。
VERDIはVision-Language Modelsの推論プロセスと常識知識をADスタックに蒸留する。
VERDIは、$ell_2$ distanceで10%の推論を埋め込まない既存のe2eメソッドよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:24:42 GMT)
Route Sparse Autoencoder to Interpret Large Language Models [33.4] Route Sparse Autoencoder (RouteSAE) は、ルーティングメカニズムを共有SAEと統合し、複数のレイヤから機能を効率的に抽出するフレームワークである。
64の空間的制約の下では、RouteSAEはベースラインSAEよりも22.5%高い特徴を抽出し、22.3%高い解釈可能性スコアを達成している。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:46:43 GMT)
Temporal Restoration and Spatial Rewiring for Source-Free Multivariate Time Series Domain Adaptation [33.4] Source-Free Domain Adaptation (SFDA)は、アノテートされたソースドメインから、ソースデータにアクセスすることなく、未実装のターゲットドメインに事前トレーニングされたモデルを適用することを目的としている。
MTSデータに適した新規かつ簡潔なSFDA法であるTERSE(Temporal Restoration and Space Rewiring)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:44:13 GMT)
Elucidating Subspace Perturbation in Zeroth-Order Optimization: Theory and Practice at Scale [33.4] Zeroth-order (ZO) 最適化は、勾配ベースのバックプロパゲーション法に代わる有望な代替手段として登場した。
高次元性が主要なボトルネックであることを示し、サブスペースの摂動が勾配ノイズを減らし収束を加速させる方法について説明するために、テキストサブスペースアライメントの概念を導入する。
本稿では,ブロック座標降下法(MeZO-BCD)を用いた効率的なZO法を提案し,各ステップでパラメータのサブセットのみを摂動・更新する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:41:11 GMT)
VEAttack: Downstream-agnostic Vision Encoder Attack against Large Vision Language Models [33.1] LVLM(Large Vision-Language Models)は、マルチモーダル理解と生成において顕著な能力を示す。
既存の効果的な攻撃は常にタスク固有のホワイトボックス設定に集中する。
我々は,LVLMのビジョンエンコーダのみをターゲットとした,シンプルで効果的なビジョンアタック(VEAttack)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:46:04 GMT)
TDFormer: A Top-Down Attention-Controlled Spiking Transformer [33.1] 本稿では,階層的に機能するトップダウンフィードバック構造を持つ新しいモデルであるTDFormerを紹介する。
これらのメカニズムは、複数のデータセット上でのモデル性能を大幅に改善する。
特に,画像ネットの最先端性能を86.83%の精度で達成している。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:45:06 GMT)
Emerging Properties in Unified Multimodal Pretraining [32.9] マルチモーダル理解と生成をサポートするオープンソースの基盤モデルであるBAGELを紹介する。
BAGELは、大規模なインターリーブ付きテキスト、画像、ビデオ、Webデータからキュレートされた数兆のトークンに基づいて事前訓練された、統一されたデコーダのみのモデルである。
オープンソースの統一モデルでは、マルチモーダル生成と標準ベンチマークでの理解の両方において、大幅に優れています。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:50:51 GMT)
X-Transfer Attacks: Towards Super Transferable Adversarial Attacks on CLIP [32.9] 我々は,CLIPの普遍的敵対的脆弱性を明らかにする新しい攻撃方法である textbfX-Transfer を紹介する。
X-Transferは、様々なサンプル、タスク、ドメインにまたがる様々なCLIPエンコーダと下流のVLMを認識できるUniversal Adversarial Perturbationを生成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:04:07 GMT)
A Unified Taxonomy-Guided Instruction Tuning Framework for Entity Set Expansion and Taxonomy Expansion [32.7] 我々は、エンティティセットの拡大、分類拡張、種誘導分類構築に必要な2つの共通スキルを識別する:「兄弟」の発見と「親」の発見である。
そこで本研究では,大規模言語モデルを用いてクエリエンティティの兄弟と親を生成するための分類誘導型指導チューニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 23:21:29 GMT)
Fast Quiet-STaR: Thinking Without Thought Tokens [32.6] Fast Quiet STaRは、より効率的な推論フレームワークであり、計算コストを削減しながらトークンレベルの推論の利点を保存する。
本手法では,段階的に思考トークン数を減少させるカリキュラムベースの学習戦略を導入する。
Mistral 7BとQwen2.5 7Bによる4つのベンチマークデータセットの実験では、Fast Quiet-STaRが平均精度でQuiet-STaRを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:14:12 GMT)
Universal Biological Sequence Reranking for Improved De Novo Peptide Sequencing [32.3] RankNovoは、de novoペプチドシークエンシングを強化する最初の深層構造である。
我々の研究は、既存のシングルモデルパラダイムに挑戦し、正確なde novoシークエンシングのフロンティアを前進させる新しい戦略を提示する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:56:55 GMT)
Fann or Flop: A Multigenre, Multiera Benchmark for Arabic Poetry Understanding in LLMs [32.2] Fann or Flopは、アラビア語詩の理解を大規模言語モデルで評価するための最初のベンチマークである。
このベンチマークは、意味的理解、比喩的解釈、韻律的認識、文化的文脈を評価するための説明付き詩のコーパスで構成されている。
我々の評価によると、ほとんどのモデルは、標準アラビア語のベンチマークで強い結果が得られたにもかかわらず、詩的な理解に苦慮している。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:59:29 GMT)
NeuroGen: Neural Network Parameter Generation via Large Language Models [32.2] ニューラルネットワーク(NN)のパラメータを取得することは、機械学習における最も重要な問題のひとつだ。
本稿では,大規模言語モデル生成によるNNパラメータの獲得という,新たな方向性の実現可能性について検討する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:25:28 GMT)
GiGL: Large-Scale Graph Neural Networks at Snapchat [32.1] 大規模分散グラフMLを実現するオープンソースライブラリであるGiGL(Gigantic Graph Learning)を提案する。
私たちはSnapchat社内でGiGLを使用して、グラフデータ前処理を含むGNNの重い処理を管理しています。
GiGLは複数のプロダクション環境で使用されており、過去2年間に複数のビジネスドメインで35回以上のローンチを実行している。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:25:16 GMT)
Watch and Listen: Understanding Audio-Visual-Speech Moments with Multimodal LLM [32.1] TriSenseは、全体論的ビデオ時間的理解のために設計された3重モードの大言語モデルである。
Central to TriSenseは、クエリベースのコネクタで、入力クエリに基づいてモダリティのコントリビューションを適応的にリウェイトする。
TriSense-2Mは、自動パイプラインで生成された200万以上のキュレートされたサンプルのデータセットである。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:04:27 GMT)
How Secure Are Large Language Models (LLMs) for Navigation in Urban Environments? [32.1] 本稿では,従来のナビゲーションプロンプトを摂動することで,LSMに基づくナビゲーションモデルを操作する新しいナビゲーションプロンプト攻撃を提案する。
その結果,ホワイトボックス攻撃とブラックボックス攻撃の両方に直面した7つの指標において,顕著なパフォーマンス低下が認められた。
最初の対策として,ナビゲーション・プロンプト・エンジニアリング(NPE)防衛戦略を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:03:34 GMT)
Learning with Restricted Boltzmann Machines: Asymptotics of AMP and GD in High Dimensions [31.8] Restricted Boltzmann Machine (RBM) は、入力分布を学習できる最も単純な生成ニューラルネットワークの1つである。
我々は、標準的なRBMトレーニング目標を、非分離正則化を伴うマルチインデックスモデルと同等の形式に単純化する。
特に, RBM が BBP 遷移と整合して, 最適計算弱回復しきい値に達することを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:51:46 GMT)
Understanding How Value Neurons Shape the Generation of Specified Values in LLMs [31.2] 大規模言語モデルの社会的応用への統合は、普遍的倫理原則との整合性に対する懸念を強めている。
現在のアプローチでは、ニューラルネットワークでどのように値をエンコードするかを体系的に解釈するのに苦労している。
我々は、Schwartz Surveyに基盤を置く機械的解釈可能性フレームワークであるValueを紹介します。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:30:09 GMT)
LeTS: Learning to Think-and-Search via Process-and-Outcome Reward Hybridization [31.0] 大規模言語モデル(LLM)は、推論において印象的な能力を示している。
近年の研究では、検索結果教師付き強化学習(RL)アプローチを通じて、推論能力を検索強化世代(RAG)領域に統合することに焦点を当てている。
我々は、段階的なプロセス報酬と結果に基づく報酬をRAGのための現在のRL手法にハイブリダイズする新しいフレームワークであるLearning to Think-and-Search(LeTS)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:04:05 GMT)
Mastering Board Games by External and Internal Planning with Language Models [30.8] 探索に基づくプランニングにより,大規模言語モデルによるゲームプレイ能力の大幅な向上が期待できることを示す。
外部探索では,モンテカルロ木探索のロールアウトと評価を外部ゲームエンジンに呼び出しずにガイドし,内部探索では,探索の線形化木と最終的な選択をインコンテキストで生成するように訓練する。
提案手法は,探索とドメイン知識を組み合わせることで,ボードゲームに特化せず,より汎用的な応用を示唆するものである。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:35:09 GMT)
3D Face Reconstruction Error Decomposed: A Modular Benchmark for Fair and Fast Method Evaluation [30.6] M3DFB (Modularized 3D Face Restruction Benchmark) のためのツールキットを提案する。
エラーの基本成分は分離され交換可能であり、それぞれの効果を定量化することができる。
そこで本研究では,メッシュトポロジの不整合性に対して計算効率の良い手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:28:43 GMT)
Debiasing CLIP: Interpreting and Correcting Bias in Attention Heads [29.9] 我々は,刺激的な注意を識別し,ターゲットアブレーションによって軽減する,コントラスト的なフレームワークであるtextsc-Then-Correct (LTC) を導入する。
我々は,背景性バイアスのあるベンチマークでLCCを評価し,非トレーニング後ベースラインと比較して,最低グループ精度が50%以上向上した。
我々は,選択した頭部の表現を可視化し,提示された解釈が,刺激的な頭部と快楽な頭部の両方を識別するコントラスト的なメカニズムを裏付けていることを見出した。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:13:42 GMT)
Uncovering a Universal Abstract Algorithm for Modular Addition in Neural Networks [29.8] モジュラ付加の単純なタスクで観測されたニューラルネットワークソリューションは、共通の抽象アルゴリズムの下で統一されていることを示す。
我々の理論はディープニューラルネットワーク(DNN)に当てはまる
トレーニング可能な埋め込みまたは複数の隠蔽層を持つDNNにおける普遍的に学習された解は、O(log n)機能のみを必要とすると予測する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:02:46 GMT)
RemoteSAM: Towards Segment Anything for Earth Observation [29.7] 我々は、地球観測のための頑健でフレキシブルな視覚基盤モデルを開発することを目指している。
多様な視覚的目標を認識し、位置を特定する能力を持つべきである。
いくつかの地球観測知覚ベンチマークで新しいSoTAを確立する基盤モデルであるRemoteSAMを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:27:57 GMT)
Token Reduction Should Go Beyond Efficiency in Generative Models -- From Vision, Language to Multimodality [29.5] 本稿では, トークン削減は, 大規模生成モデルの時代において, 従来の効率重視の役割を超越すべきであると主張する。
トークンの削減は、より深いマルチモーダル統合とアライメントを促進し、長い入力に対するコヒーレンスを維持し、トレーニングの安定性を高めることができると我々は主張する。
我々は、アルゴリズム設計、強化学習誘導トークン削減、文脈内学習のためのトークン最適化、より広範なMLおよび科学領域を含む将来的な方向性について概説する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:30:30 GMT)
TextFlux: An OCR-Free DiT Model for High-Fidelity Multilingual Scene Text Synthesis [29.3] TextFluxは、多言語シーンテキスト合成を可能にするDiTベースのフレームワークである。
TextFluxは低リソースのマルチリンガル設定で有効であり、1000サンプル未満の新たな言語で高いパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:46:46 GMT)
CONCORD: Concept-Informed Diffusion for Dataset Distillation [29.1] 本研究では,データセット蒸留のためのconcept-Informed Diffusion (CONCORD)を提案する。
提案手法は, 蒸留画像生成の可制御性と解釈性の両方を著しく向上させる。
画像Net-1Kとそのサブセットの最先端性能を達成し,CONCORDの有効性を実証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:39:23 GMT)
Hyperspectral Anomaly Detection Fused Unified Nonconvex Tensor Ring Factors Regularization [29.1] 本稿では、統合された非スペクトルフレームワーク(TR)正規化因子を組み込んだHAD-EUNTRFRを提案する。
提案手法は,既存のSOTA(State-of-the-art)アプローチを項項の精度で上回る。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:31:13 GMT)
VeriFastScore: Speeding up long-form factuality evaluation [29.1] 長期の事実性を評価するFactScoreやVeriScoreのようなメトリクスは、入力応答をアトミックなクレームに分解し、それぞれのクレームを個別に検証することで動作する。
We propose VeriFastScore, which leverageed synthesis data to fine-tune Llama3.1 8B to the same-tune Llama3.1 8B to a given text based based on evidence from Google Search。
我々の微調整されたVeriFastScoreモデルは、VeriScoreよりも6.6倍(9.9倍)のスピードアップを実現しつつ、サンプルレベルとシステムレベルの両方でオリジナルのVeriScoreパイプラインと強い相関を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:49:24 GMT)
FIT-Print: Towards False-claim-resistant Model Ownership Verification via Targeted Fingerprint [29.0] 疑似クレーム攻撃に対処するために,ターゲット指紋認証パラダイム(FIT-Print)を提案する。
具体的には、FIT-Printは最適化によって指紋をターゲットの署名に変換する。
FIT-Printの原理に基づいてビットワイドおよびリストワイドのブラックボックスモデルフィンガープリント手法を開発した。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:19:40 GMT)
Automata Learning of Preferences over Temporal Logic Formulas from Pairwise Comparisons [28.9] 本稿では,ユーザの未知の嗜好が事前注文によって表現される選好推論問題のクラスについて考察する。
まず、時間的目標に対する嗜好関係は、優先決定論的有限オートマトンによってモデル化できることを示す。
そこで,本研究では,サンプルが描画される真のPDFAと同等のPDFAを,特徴サンプルから学習することを保証するアルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:35:39 GMT)
Hogwild! Inference: Parallel LLM Generation via Concurrent Attention [28.8] 大規模言語モデル(LLM)は、高度な推論、長文コンテンツ生成、ツールの使用を通じて、ますます複雑なタスクに取り組む。
推論: 同じLLMの複数のインスタンスが同じアテンションキャッシュと並行して動作し、相互のメモリに"インスタント"アクセスする並列LLM推論エンジン。
最新の推論可能なLCMは、追加の微調整をすることなく、共有キーバリューキャッシュで推論を行うことができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:36:12 GMT)
The Nuclear Route: Sharp Asymptotics of ERM in Overparameterized Quadratic Networks [28.8] 合成データに基づいて2次アクティベーションを訓練した過パラメタライズされた2層ニューラルネットワークにおける経験的リスク最小化(ERM)の高次元性について検討した。
我々は、$ell$-regularized learning problemを、核ノルム化を伴う凸行列センシングタスクにマッピングすることで、トレーニングとテストのエラーの両面でのシャープを導出する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:31:14 GMT)
Bidirectional Knowledge Distillation for Enhancing Sequential Recommendation with Large Language Models [28.6] 大規模言語モデル(LLM)は、意味的パターンの理解と生成において、例外的な性能を示した。
LLMは、しばしば高い推論コストと静的な知識伝達方法に関連する課題に直面している。
本稿では,動的および双方向の知識交換を促進する新しい相互蒸留フレームワークLLMD4Recを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:21:14 GMT)
Frankentext: Stitching random text fragments into long-form narratives [28.5] フランケンテクス(Frankentexts)は、LLMによって作られた新しいタイプの長文の物語である。
そこで我々は,Frankentextsを生成するために,人書きパスを選択して組み合わせてドラフトを作成するように指示し,ユーザ指定のコピー比を維持しながら,反復的にドラフトを修正した。
Gemini-2.5-Proはこのタスクで驚くほどうまく機能し、フランケンテキストの81%が一貫性があり、プロンプトに100%関係している。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:38:47 GMT)
Learning Mixtures of Experts with EM: A Mirror Descent Perspective [28.5] 古典的なMixtures of Experts(MoE)は、入力空間を含む機械学習モデルであり、各パーティションでトレーニングされた個別の"エキスパート"モデルである。
我々は,MoEモデルのトレーニングにおける期待最大化(EM)アルゴリズムの理論的保証について検討する。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:53:09 GMT)
CTRL-GS: Cascaded Temporal Residue Learning for 4D Gaussian Splatting [28.3] 動的シーンのための4次元ガウススプラッティングの新規拡張を提案する。
動的シーンを「ビデオ・セグメンテーション・フレーム」構造に分解し、セグメントを光学的フローで動的に調整する。
いくつかの確立したデータセット上で、最先端の視覚的品質とリアルタイムレンダリングを実証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:01:55 GMT)
Instruct2See: Learning to Remove Any Obstructions Across Distributions [28.3] Instruct2Seeは、目に見えない障害と見えない障害の両方を扱うことができる新しいフレームワークである。
本手法の中核となる考え方は,軟弱マスク修復問題として扱うことにより,閉塞除去を統一することである。
調整可能なマスクアダプタは、ダイナミックなソフトマスクが可能で、不正確なマスクをリアルタイムに調整することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:12:34 GMT)
On the Mechanisms of Weak-to-Strong Generalization: A Theoretical Perspective [28.0] 不完全なラベルで訓練された学生モデルが、その教師を超えている弱々しい一般化が広く観察されている。
本稿では,単純なモデルの理論解析を通じて,この現象を駆動する3つのコア機構を明らかにする。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:09:09 GMT)
Rethinking the Sampling Criteria in Reinforcement Learning for LLM Reasoning: A Competence-Difficulty Alignment Perspective [27.9] 強化学習は、大規模言語モデルの推論能力を高める可能性を示す。
既存の手法では,問題問題に基づくスケジューリングによる効率向上が試みられている。
本稿では,textbfCompetence-textbfDifficulty textbfAlignment textbfSamplingを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:15:26 GMT)
TAGS: A Test-Time Generalist-Specialist Framework with Retrieval-Augmented Reasoning and Verification [27.9] テストタイムフレームワークであるTAGSについて述べる。このフレームワークは、幅広い能力を持つ模範とドメイン固有のスペシャリストを組み合わせることで、補完的な視点を提供する。
TAGSは9つのMedQAベンチマークで強力なパフォーマンスを実現し、GPT-4oの精度は13.8%、DeepSeek-R1は16.8%、バニラ7Bモデルは14.1%から23.9%向上した。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:28:59 GMT)
Large Language Models Do Multi-Label Classification Differently [27.8] 実世界の環境では多言語分類が一般的であるが、この設定におけるLarge Language Models (LLMs) の振る舞いは検討されている。
本研究では,各生成ステップにおけるモデルの出力分布を解析し,主観的タスクに着目し,自己回帰型LLMがマルチラベル分類を行う方法について検討する。
これらの予測行動は、各ステップで1つのラベルを除く全てのラベルを抑圧する傾向にあるため、関連するラベルを生成するために必要な言語モデリングにおける複数のステップを反映している。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:04:36 GMT)
Direct3D-S2: Gigascale 3D Generation Made Easy with Spatial Sparse Attention [27.8] スパースボリュームに基づくスケーラブルな3D生成フレームワークであるDirect3D S2を紹介する。
主な革新は空間スパースアテンション機構であり、これは拡散変換器の計算効率を大幅に向上させるものである。
我々のフレームワークには、一貫したスパースボリュームフォーマットを維持する変分オートエンコーダも含まれている。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:58:01 GMT)
General Table Question Answering via Answer-Formula Joint Generation [27.6] テーブル質問応答(TableQA)メソッドは、大きな言語モデル(LLM)に応答テキストを生成する。
これらの方法には、特定の質問タイプやテーブル構造を扱うための汎用性がない。
複数種類のテーブル上で複数のタスクを同時に解決する汎用テーブル応答フレームワークである textttTabAF を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:02:35 GMT)
TripNet: Learning Large-scale High-fidelity 3D Car Aerodynamics with Triplane Networks [27.6] TripNetは3次元の幾何学を固定次元のコンパクトで連続的な特徴マップに暗黙的にエンコードする三面体ベースのニューラルネットワークフレームワークである。
TripNetはDriivAerNetとDriivAerNet++データセットで最先端のパフォーマンスを実現し、ドラッグ係数、表面圧力、フル3Dフローフィールドを正確に予測する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:28:05 GMT)
Q-Insight: Understanding Image Quality via Visual Reinforcement Learning [27.3] 画像品質評価(IQA)は、画像の知覚的視覚的品質に焦点を当て、画像再構成、圧縮、生成などの下流タスクにおいて重要な役割を果たす。
グループ相対ポリシー最適化(GRPO)に基づく強化学習に基づくモデルQ-Insightを提案する。
評価結果から,Q-Insightは,評価結果の回帰と劣化知覚の両面において,既存の最先端手法を大幅に上回っていることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:41:50 GMT)
FullFront: Benchmarking MLLMs Across the Full Front-End Engineering Workflow [27.2] FullFrontは、MLLM(Multimodal Large Language Models)を評価するために設計されたベンチマークである。
FullFrontは、現実世界のWebページをクリーンで標準化されたHTMLに変換する、新しい2段階のプロセスを採用している。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:16:11 GMT)
ABHINAYA -- A System for Speech Emotion Recognition In Naturalistic Conditions Challenge [26.9] 本稿では,音声ベース,テキストベース,音声テキストモデルを統合するシステムであるAbhinayaを紹介する。
音声表現のための自己教師型音声大言語モデル(SLLM)を提案する。
クラス不均衡に対処するために、調整された損失関数を適用し、多数決によってカテゴリー決定を生成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:01:56 GMT)
Discovering Forbidden Topics in Language Models [26.2] LLM-crawlerは、トークンプリフィルを使用して禁止トピックを見つける拒絶探索手法である。
Llama-3.3-70B、DeepSeek-R1-70B、Perplexity-R1-1776-70B。
我々の発見は、AIシステムのバイアス、バウンダリ、アライメント障害を検出するために、リファリング法が重要な必要性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:49:06 GMT)
Beyond Distillation: Pushing the Limits of Medical LLM Reasoning with Minimalist Rule-Based RL [26.1] 第1回AlphaMedは,強化学習(RL)によって推論能力が純粋に現れることを示す最初の医学的LLMである。
AlphaMedは、従来のSFT+RLパイプラインでトレーニングされたモデルよりも優れた6つの医学的QAベンチマークで最先端の結果を達成する。
以上の結果から,データセットの有意性は推論性能の重要な要因であり,複数選択QAデータに対する最小限のRLは,CoTの監督なしに推論を誘導する上で有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:27:37 GMT)
Integrating Counterfactual Simulations with Language Models for Explaining Multi-Agent Behaviour [26.0] AXIS(Interrogative Simulation)を用いたエージェントeXplanationを提案する。
AXISは、事前訓練されたマルチエージェントポリシーに対して、理解不能な因果説明を生成する。
5LLMの10シナリオにわたる自律走行におけるAXISの評価を行った。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:19:18 GMT)
Scaling Up Biomedical Vision-Language Models: Fine-Tuning, Instruction Tuning, and Multi-Modal Learning [26.0] 我々は、エンコーダデコーダに基づくトランスフォーマアーキテクチャに基づく2つのビジョン言語モデル、BiomedGPT-LargeとBiomedGPT-XLargeを開発した。
6つのマルチモーダルバイオメディカルタスクから23のベンチマークデータセットで2つのモデルを微調整した。
ゼロショット学習性能とアライメント精度を評価した。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:31:58 GMT)
Directed Semi-Simplicial Learning with Applications to Brain Activity Decoding [26.0] トポロジカルディープラーニング(TDL)は、トポロジカル空間を活用することで、この制限に対処する。
半単純ニューラルネットワーク(SSN)は,半単純集合上で動作するTDLモデルの原理クラスである。
SSNは、脳力学の分類タスクにおける最先端のパフォーマンスを達成し、第2のベストモデルを最大27%、メッセージパッシングGNNを最大50%向上させる。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:15:44 GMT)
ICPL-ReID: Identity-Conditional Prompt Learning for Multi-Spectral Object Re-Identification [26.0] マルチスペクトルオブジェクト再識別(ReID)は、スマートシティとインテリジェントトランスポートアプリケーションに対して、新たな認識視点を提供する。
既存のほとんどの手法は複雑なモーダル相互作用モジュールを通してスペクトルデータを融合し、スペクトル情報の詳細なセマンティック理解を欠いている。
筆者らは,CLIPの強力なクロスモーダルアライメント機能を利用する,ICPL(Identity-Conditional Text Prompt Learning framework)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:38:27 GMT)
JALMBench: Benchmarking Jailbreak Vulnerabilities in Audio Language Models [25.9] 本稿では,JALMBenchについて述べる。JALMBenchは,音声言語モデル(ALM)のジェイルブレイク攻撃に対する安全性を評価するための,テキストファーストの総合ベンチマークである。
JALMBenchを用いて、攻撃効率、話題感度、音声の多様性、攻撃表現の詳細な分析を行う。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:29:55 GMT)
Discrete Neural Flow Samplers with Locally Equivariant Transformer [25.9] 離散サンプリングのためのトレーニング可能な,効率的なフレームワークである離散ニューラルネットワークサンプリング(DNFS)を提案する。
DNFS はコルモゴロフ方程式を満たすような連続時間マルコフ連鎖の速度行列を学習する。
計算効率をさらに向上するため,我々は局所同値変換器を提案し,レート行列の新しいパラメータ化を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:06:06 GMT)
Stop Summation: Min-Form Credit Assignment Is All Process Reward Model Needs for Reasoning [25.8] プロセス報酬モデル(PRM)は、大規模言語モデル(LLM)のテストタイムスケーリングにおいて、困難な推論タスクにおいて有効であることが証明されている。
しかしながら、PRMによる報酬ハッキング問題は、強化微調整における彼らの成功を制限している。
本稿では,PRMによる報酬ハッキングの主な原因を,強化学習における正準和形信用代入として同定する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:38:41 GMT)
U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding [25.8] U2-BENCHは,分類,検出,回帰,テキスト生成タスクにおける超音波理解における大規模視覚言語モデル(LVLM)の評価を行うための,最初の総合ベンチマークである。
U2-BENCHは15の解剖学的領域にまたがる7,241の症例を集計し、診断、ビュー認識、病変の局在、臨床値の推定、報告生成など、50の超音波応用シナリオで8つの臨床的にインスパイアされたタスクを定義している。
画像レベルの分類では高い性能を示したが,空間推論や臨床言語生成の難しさが指摘された。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:48:48 GMT)
Rethinking Bottlenecks in Safety Fine-Tuning of Vision Language Models [25.6] モデル性能を向上させるために,マルチイメージ入力と安全チェーン・オブ・ソート(CoT)ラベルを微粒な推論ロジックとして統合する新しいデータセットを提案する。
実験の結果,MISを用いた微調整InternVL2.5-8Bは,マルチイメージタスクに挑戦する上で,強力なオープンソースモデルとAPIベースモデルの両方を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:32:28 GMT)
AVerImaTeC: A Dataset for Automatic Verification of Image-Text Claims with Evidence from the Web [25.5] 1,297個の実世界の画像テキストクレームからなるデータセットであるAVerImaTeCを紹介する。
各クレームには、ウェブからの証拠を含む質問と回答のペアが注釈付けされている。
我々は、文脈依存、時間リーク、証拠不足などの事実チェックデータセットにおける課題を軽減する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:45:48 GMT)
SafeMVDrive: Multi-view Safety-Critical Driving Video Synthesis in the Real World Domain [25.4] セーフMVDrive(SafeMVDrive)は、現実世界のドメインをベースとした安全クリティカルでマルチビューなドライビングビデオを生成するためのフレームワークである。
まず、視覚的コンテキストを取り入れた軌跡生成装置のシーン理解能力を向上する。
衝突回避軌道を生成する2段階制御可能な軌道生成機構を導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:45:43 GMT)
Low-Resource NMT: A Case Study on the Written and Spoken Languages in Hong Kong [25.4] スポケン・カントネーゼは漢字に転写され、いわゆる「カントネーゼ」を構成する。
カントーン文字は標準中国語と大きな語彙的・文法的な違いを示す。
本稿では,中国語から中国語への翻訳のためのトランスフォーマーベースニューラルマシン翻訳(NMT)システムについて述べる。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:32:01 GMT)
SMART: Self-Generating and Self-Validating Multi-Dimensional Assessment for LLMs' Mathematical Problem Solving [25.3] 大規模言語モデルは、様々な数学的なベンチマークで顕著な結果を得た。
最終回答の正確さなどの一般的な評価指標は、関係する下位の能力を乱すことができない。
SMART(Self-Generating and Self-Validating Multi-dimensional Assessment Framework)を紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:29:12 GMT)
From Score Matching to Diffusion: A Fine-Grained Error Analysis in the Gaussian Setting [25.2] We show that the Wasserstein sample error can be expressed as a kernel-type norm of the data power spectrum。
We show that the Wasserstein sample error can be expressed as a kernel-type norm of the data power spectrum。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:56:55 GMT)
LocalKMeans: Convergence of Lloyd's Algorithm with Distributed Local Iterations [24.9] 我々は、ロイズアルゴリズム(Lloyd, 1956)として知られる古典的な$K$-means交互化アルゴリズムを解析する。
局所的なステップに対して支払われる価格は、より高い信号対雑音比であることが示される。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:58:40 GMT)
Model Selection for Gaussian-gated Gaussian Mixture of Experts Using Dendrograms of Mixing Measures [24.9] Mixture of Experts (MoE)モデルは、統計学と機械学習において広く利用されているアンサンブル学習アプローチのクラスである。
混合成分の真の数を一貫した推定が可能なガウスゲート型MoEモデルに新しい拡張を導入する。
合成データを用いた実験結果から,提案手法の有効性が示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:21:08 GMT)
EVADE: Multimodal Benchmark for Evasive Content Detection in E-Commerce Applications [24.8] EVADEは、eコマースにおける回避コンテンツ検出の基礎モデルを評価するために設計された、最初の専門家による、中国のマルチモーダルベンチマークである。
データセットには、2,833の注釈付きテキストサンプルと、6つの要求のある製品カテゴリにまたがる13,961のイメージが含まれている。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:18:01 GMT)
Evaluation Faking: Unveiling Observer Effects in Safety Evaluation of Frontier AI Systems [24.8] 評価対象の高度なAIシステムが、推論や状況認識においてより高度である場合、評価のフェイキング行動がよりユビキタスになることを示す。
そこで我々は,フェーキング意図を検知し,その行動に相関した内部信号を明らかにするチェーンオブシントモニタリング手法を開発した。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:31:29 GMT)
QVGen: Pushing the Limit of Quantized Video Generative Models [24.7] ビデオ拡散モデル(DM)により高品質なビデオ合成が可能となったが、その膨大な計算とメモリ要求は現実の展開に重大な課題をもたらす。
提案するQVGenは,高速かつ推論効率の高いビデオDMに適した,QAT(quantization-aware training)フレームワークである。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:08:30 GMT)
RAG-RL: Advancing Retrieval-Augmented Generation via RL and Curriculum Learning [24.6] 本稿では,回答生成モデルであるRAG-RLを紹介する。
私たちのアプローチはカリキュラム学習を使用し、モデルがまず、関連するコンテキストのみを含む簡単な例に基づいて訓練される。
実験により,これらのトレーニングサンプルにより,より優れたサンプル効率と一般化性を有する引用・推論能力が得られることが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:59:14 GMT)
Selective Structured State Space for Multispectral-fused Small Target Detection [24.6] 高解像度リモートセンシング画像におけるターゲット検出は、小さなターゲットの認識精度が低く、計算コストが高いため、課題に直面している。
これらの計算制約に対処するために、効率性のためにMambaの線形複雑性を利用する。
我々は,拡張小型目標検出(ESTD)モジュールと畳み込み注意残差ゲート(CARG)モジュールを開発することで,マンバを強化した。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:20:11 GMT)
Hydra: Structured Cross-Source Enhanced Large Language Model Reasoning [24.5] Hydraは、グラフトポロジ、ドキュメントセマンティクス、ソース信頼性を統合して、大規模言語モデルにおける深い忠実な推論をサポートするフレームワークである。
エージェント駆動による探索を通じてマルチホップとマルチエンタリティの問題に対処し、多様性と証拠の精度の両方を増大させる。
GPT-3.5の全てのベンチマークで最先端の結果が得られ、ToG-2は平均20.3%、最大30.1%という強力なハイブリッドベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:45:37 GMT)
Position: We Need An Adaptive Interpretation of Helpful, Honest, and Harmless Principles [24.4] Helpful, Honest, and Harmless(HHH)原則は、AIシステムを人間の価値と整合させるためのフレームワークである。
我々は,HHH原理の適応的解釈を論じ,多様なシナリオへの適応のための参照フレームワークを提案する。
この作業は、AIアライメントを改善するための実践的な洞察を提供し、HHH原則が現実のAIデプロイメントにおいて基礎的かつ運用的に有効であることを保証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:54:42 GMT)
Causal Spatio-Temporal Prediction: An Effective and Efficient Multi-Modal Approach [24.4] E2-STPはマルチモーダルデータを統合するための効率的なフレームワークである。
E2-STPは9つの最先端技術よりも優れ、9.66%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:58:38 GMT)
TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets [24.4] 大規模言語モデル(LLM)エージェントは人間の振る舞いをモデル化するためのシミュレーションツールとして注目を集めている。
社会経済システムのシミュレートにLLMを活用する新しいマルチエージェントフレームワークであるTwinMarketを紹介した。
我々のアプローチは、個人の意思決定と集団社会経済パターンの間の複雑な相互作用に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:07:00 GMT)
HyperIMTS: Hypergraph Neural Network for Irregular Multivariate Time Series Forecasting [24.3] 不規則な多変量時系列(IMTS)は変数内の不規則な時間間隔と変数間の不整合観察によって特徴づけられる。
IMTS予測のためのハイパーグラフニューラルネットワークHyperIMTSを提案する。
実験では、計算コストの低いIMTS予測において、最先端モデル間のHyperIMTSの競合性能を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:27:04 GMT)
Exploring Generalized Gait Recognition: Reducing Redundancy and Noise within Indoor and Outdoor Datasets [24.2] 一般化歩行認識は、多様な領域にわたる堅牢なパフォーマンスを実現することを目的としている。
混合データセットトレーニングは一般化を高めるために広く利用されている。
クロスドメイン歩行認識を体系的に改善する統合フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:59:58 GMT)
SP2RINT: Spatially-Decoupled Physics-Inspired Progressive Inverse Optimization for Scalable, PDE-Constrained Meta-Optical Neural Network Training [23.9] DONNは光伝搬の物理を利用して効率的なアナログ計算を行い、AIや信号処理にも応用している。
PDE制約付き学習問題としてDONNトレーニングを定式化する空間的に分離されたプログレッシブトレーニングフレームワークであるSP2RINTを提案する。
SP2RINTは、シミュレーション・イン・ザ・ループのアプローチの1825倍の速さで、デジタル互換の精度を実現している。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:05:40 GMT)
Small Models, Smarter Learning: The Power of Joint Task Training [23.9] 本研究では,ネストした数学的操作からなるListOpsデータセットに着目した。
我々は和 modulo n が最も学習が難しいことを観察する。
ジョイントトレーニングは,パフォーマンスの向上だけでなく,定性的に異なるモデル行動をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:56:37 GMT)
MFH: A Multi-faceted Heuristic Algorithm Selection Approach for Software Verification [23.8] ソフトウェア検証のための自動アルゴリズム選択手法 MFH を提案する。
MFHは意味保存変換プログラムのコードプロパティグラフ(CPG)を埋め込み、予測モデルの堅牢性を高める。
20個の検証器と15,000以上の検証タスクでMFHを評価する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:03:51 GMT)
URSA: Understanding and Verifying Chain-of-thought Reasoning in Multimodal Mathematics [23.8] Process Reward Models (PRM) は、大規模言語モデルの数学的推論能力を高めることを約束している。
マルチモーダル数学的推論におけるPRMの可能性を解き明かすための第一歩を踏み出す。
URSAは3段階のUnfolding Multimodal Process-Supervision Aided Trainingフレームワークである。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:57:37 GMT)
Diagnosing Vision Language Models' Perception by Leveraging Human Methods for Color Vision Deficiencies [23.8] 石原テストを用いて,視覚言語モデルによる個人レベルの知覚変動を推定する能力を評価する。
以上の結果から,LVLMは自然言語で色覚障害を説明できるが,画像ベースタスクにおいてCVDが色知覚に与える影響をシミュレートすることはできない。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:43:55 GMT)
Identifying perturbation targets through causal differential networks [23.6] 本稿では,生物学的システムの変更に責任を持つ変数を同定する因果性に着想を得たアプローチを提案する。
まず、観測データと干渉データからノイズの多い因果グラフを推定する。
次に、これらのグラフ間の差分を、追加の統計的特徴とともに、介入された変数の集合にマッピングすることを学ぶ。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:07:27 GMT)
The AI Gap: How Socioeconomic Status Affects Language Technology Interactions [23.5] 社会経済状態(SES)は、人々が相互にどのように相互作用するか、そしてLarge Language Models(LLMs)のようなデジタル技術に根本的に影響します。
我々は、言語技術と生成AIの利用について、多様な社会経済的背景から1000人の個人を調査した。
言語技術利用におけるSESグループ間での系統的差異(頻度,実行タスク),インタラクションスタイル,トピックなど)を見出した。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:59:46 GMT)
The Third Pillar of Causal Analysis? A Measurement Perspective on Causal Representations [23.1] 因果推論と発見は、実世界のデータの複雑さ、ノイズ、高次元性のためにしばしば困難に直面する。
学習した表現を因果的下流タスクに役立てるものと、それらをどのように評価するかは、まだよく理解されていない。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:25:17 GMT)
GIM: Improved Interpretability for Large Language Models [23.1] セルフリペア(Self-repair)とは、ネットワークが他のコンポーネントを増幅することで信号の減少を補う現象である。
本稿では,バックプロパゲーション中の自己修復を考慮に入れたGIM(Gradient Interaction Modifications)を紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:41:45 GMT)
Making Small Language Models Efficient Reasoners: Intervention, Supervision, Reinforcement [22.8] 精度と計算を効果的にトレードオフすることで、小型モデルによるトークン効率の推論を改善する新しいアルゴリズムを提案する。
まず、SFT後のモデルが推論過程の最適停止点を決定するのに失敗し、冗長かつ反復的な出力が得られることを示す。
MATH500、AMC、AIME24、OlympiadBenchの4つの推論ベンチマークの実験は、TSがs1の予算強制アプローチと比較して非常に効果的であることを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:50:59 GMT)
Prompt Inference Attack on Distributed Large Language Model Inference Frameworks [22.8] 現代の大規模言語モデル(LLM)の推論プロセスでは、計算資源の禁止が要求され、コンシューマグレードのデバイスへのデプロイでは不可能である。
近年,資源制約のあるハードウェア上での協調LLM推論を実現するために,分割学習原理を用いた分散LLM推論フレームワークが提案されている。
しかし、LDM層を参加者に分散させるには中間出力の送信が必要であるため、元の入力プロンプトにプライバシーリスクが生じる可能性がある。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:37:50 GMT)
DASH: Input-Aware Dynamic Layer Skipping for Efficient LLM Inference with Markov Decision Policies [22.6] textbfDASHは入力特性で条件付けられたパスを動的に選択する。
補償機構は 決定プロセスに 差分報酬を注入する
非同期実行戦略は、実行時のオーバーヘッドを最小限に抑えるために、レイヤ計算とポリシー評価を重複させる。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:10:11 GMT)
RaCT: Ranking-aware Chain-of-Thought Optimization for LLMs [22.5] 大規模言語モデル(LLM)は、テキストの再ランクタスクにおいて大きな可能性を示している。
ランキングユーティリティによる従来の微調整アプローチは、LLMの汎用能力を損なう可能性がある。
本稿では,SFTとChain-of-Thoughtプロンプトを実装した新しいRaCTリランクアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:25:33 GMT)
Erasing Undesirable Concepts in Diffusion Models with Adversarial Preservation [22.3] 拡散モデルは、テキストから視覚的に印象的なコンテンツを生成するのに優れています。
本稿では,パラメータ変化によって最も影響を受ける概念を同定し,保存することを提案する。
安定拡散モデルを用いて本手法の有効性を実証し, 不要なコンテンツの除去において, 最先端の消去方法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:25:56 GMT)
Discretization-free Multicalibration through Loss Minimization over Tree Ensembles [22.3] 深度2の決定木をアンサンブルする離散化のない多重校正法を提案する。
本アルゴリズムは,データ分布が損失飽和と呼ばれる技術的条件を満たすことを前提として,マルチキャリブレーションを確実に達成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:29:58 GMT)
Feature Preserving Shrinkage on Bayesian Neural Networks via the R2D2 Prior [22.2] ベイズニューラルネットワーク(BNN)は、ニューラルネットワークの重みを確率変数として扱う。
本稿では,BNNの重み付けに先立って,R2誘起ディリクレ分解(R2D2)を強制する新しいR2D2-Netを提案する。
R2D2-Netは、重要な特徴を過収縮から防ぎながら、無関係な係数をゼロに効果的に縮小することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:15:44 GMT)
SceneTracker: Long-term Scene Flow Estimation Network [22.1] 長期シーンフロー推定(LSFE)は、細粒度と長期の3D動作を同時にオンライン的にキャプチャできる包括的タスクである。
SceneTrackerは、最適な3次元軌道を近似するために反復的なアプローチを採用する最初のLSFEネットワークである。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:31:48 GMT)
CLDyB: Towards Dynamic Benchmarking for Continual Learning with Pre-trained Models [22.0] 本稿では,CL手法を確実に評価するための一般的な計算フレームワークである,動的ベンチマーク(CLDyB)について述べる。
まず、複数の最先端CL手法を共同で評価し、一般に困難なタスクシーケンスと一般化可能なタスクシーケンスのセットを導出する。
CLDyBを用いて個々のCL法を個別に評価し,それぞれの長所と短所を明らかにする。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:11:19 GMT)
Redefining Superalignment: From Weak-to-Strong Alignment to Human-AI Co-Alignment to Sustainable Symbiotic Society [22.0] スーパーアライメントは、人間よりもはるかに賢いAIシステムが、人間の(互換性のある)意図と価値観に一致し続けることを保証します。
本稿では, 持続可能な共生社会に向けた人間とAIの連携として, スーパーアライメントを再定義する。
外部の監視と本質的なプロアクティブアライメントを統合するフレームワークを強調します。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:47:48 GMT)
Data Mixing Can Induce Phase Transitions in Knowledge Acquisition [21.9] 知識密度データセットから知識を取得することは、必ずしもスムーズなスケーリング法則に従わないことを示す。
これらの相転移は予測可能であり, モデルサイズとのパワー-ロー関係に追従した臨界混合比を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:46:24 GMT)
Reasoning Meets Personalization: Unleashing the Potential of Large Reasoning Model for Personalized Generation [21.9] パーソナライズタスクのための大規模推論モデル(LRM)の最初の体系的評価について述べる。
本分析では, 分散思考, 応答形式の不整合, 検索情報の有効利用の3つの重要な限界を同定した。
階層的推論思考テンプレートを組み込んだ新しいフレームワークであるReinforced Reasoning for Personalization (model)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:30:13 GMT)
Exploring Implicit Visual Misunderstandings in Multimodal Large Language Models through Attention Analysis [21.9] 我々は、暗黙的な視覚的誤解(IVM)を定義し、MLLMは視覚的入力を完全に理解することなく正しい回答を提供する。
IVMの定量化には,スケール非依存の計量,テクスチャータテンションの精度,新しいベンチマークを導入する。
我々は、より微細な粒度にアプローチを拡張し、その効果を単調なシナリオで実証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:26:54 GMT)
D3C2-Net: Dual-Domain Deep Convolutional Coding Network for Compressive Sensing [21.9] 本稿では,(1)画像と(2)畳み込み符号化-ドメインの先行部分を組み合わせた二重領域最適化フレームワークを開発し,逆画像処理に汎用性を提供する。
本稿では,D3C2-Net(Dual-Domain Deep Convolutional Coding Network)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:07:30 GMT)
PLUMAGE: Probabilistic Low rank Unbiased Min Variance Gradient Estimator for Efficient Large Model Training [21.7] アクセラレータのメモリとネットワークの制約は、大きな言語モデルをトレーニングする際の主要なボトルネックとして現れている。
PLUMAGE: Probabilistic Low rank Unbiased Minimum v Ariance Gradient Estorを提案する。
PLUMAGEは,モデル全体で平均33%,GLUEベンチマークで平均28%,GaloREと同様の計算量およびメモリフットプリントで平均33%の事前トレーニング評価損失に対して,フルランク最適化のギャップを縮めることを実証的に実証した。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:17:55 GMT)
Provably Efficient Algorithm for Best Scoring Rule Identification in Online Principal-Agent Information Acquisition [21.7] 本稿では,オンライン情報取得問題に対する主エージェントフレームワークにおける最適スコアリングルールの同定問題について検討する。
我々は,OIAFCとOIAFBの2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:30:37 GMT)
Towards Comprehensive and Prerequisite-Free Explainer for Graph Neural Networks [21.5] OPEN は GtextbfNN 用の新しい ctextbfOmprehensive と textbfPrerequisite-free textbfExplainer である。
データセットのサンプル空間全体を複数の環境に推論し、分割する。
同様の効率を維持しつつ、最先端の手法よりも優れ、現実のシナリオにおける堅牢性を高める。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:00:19 GMT)
Fantastic Targets for Concept Erasure in Diffusion Models and Where To Find Them [21.4] 概念消去は拡散モデルにおける有害なコンテンツ生成のリスクを軽減するための有望な手法として現れてきた。
本稿では,各望ましくない概念に合わせて最適な目標概念を動的に選択するAdaptive Guided Erasure (AGE)法を提案する。
その結果, AGEは, 有効消去性能を維持しつつ, 無関係な概念を保存し, 最先端の消去手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:23:21 GMT)
MedPlan:A Two-Stage RAG-Based System for Personalized Medical Plan Generation [21.4] 実生活臨床医と整合する推論を構造化する新しい枠組みを導入する。
本手法では、まず患者症状と客観的データに基づいて臨床評価を作成した2段階のアーキテクチャを用いて、この評価から得られた構造化された治療計画を定式化し、検索強化世代による患者固有の情報に富む。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:17:49 GMT)
Dual Branch VideoMamba with Gated Class Token Fusion for Violence Detection [21.4] 二重ブランチ設計と状態空間モデル(GCTF)を組み合わせた効率的なアーキテクチャを提案する。
我々は、ビデオ暴力検出におけるVio RWF-2000、RLVS、VioPeruのデータセットによる新しいベンチマークを示し、トレーニングとテストセットの厳密な分離を保証する。
本モデルでは, リアルタイム監視による暴力検出において, 精度と計算効率のバランスが最適であることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:41:45 GMT)
ChatStitch: Visualizing Through Structures via Surround-View Unsupervised Deep Image Stitching with Collaborative LLM-Agents [21.3] ChatStitchは、サラウンドビューの人間と機械のコパーセプションシステムである。
同社は、外部デジタル資産と統合された自然言語コマンドを通じて、見えない盲点情報を公開している。
重なり合う境界を越える歪みの伝搬を抑制するため、ChatStitch は、サラウンドビュー非教師あり深層画像縫合法 SV-UDIS を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:48:01 GMT)
Tuning Sequential Monte Carlo Samplers via Greedy Incremental Divergence Minimization [21.2] 本稿では,SMCサンプリング器のMarkovカーネルをチューニングするための一般的な適応フレームワークを提案する。
本稿では,Langevin Monte Carlo (LMC) などのカーネルに適用可能な勾配およびチューニング不要なアルゴリズムを提案する。
我々の実装では、数回のバニラSMC実行を犠牲にして、チューニングされたパラメータの完全なスケジュールを得ることができます。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:51:18 GMT)
Towards Heterogeneous Continual Graph Learning via Meta-knowledge Distillation [21.1] メタラーニングに基づく知識蒸留フレームワーク(MKD)の導入による異種グラフの連続学習の課題に対処する。
MKDは、限られたサンプルのメタラーニングと知識蒸留を組み合わせることで、新しい情報の導入と既存の知識の維持の最適なバランスを実現する。
3つのベンチマークデータセットの総合的な評価は、不均一グラフの拡張における連続学習シナリオの処理におけるMKDの有効性を検証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:37:57 GMT)
Reward Model Generalization for Compute-Aware Test-Time Reasoning [21.1] 外部テスト時推論は、生成と選択を分離することで、大きな言語モデル(LLM)を強化する。
この設定における中心的な課題は、テスト時間計算の最適性(TCO)、すなわち、固定された推論予算の下で答えの正確さを最大化する方法である。
PRMの一般化誤差が計算効率と推論性能に与える影響を解析する。
そこで本研究では,探索動作を動的に制御するアクター・クリティカルなフレームワークであるCompute-Aware Tree Search (CATS)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:12:12 GMT)
Multi-task Learning For Joint Action and Gesture Recognition [21.0] 動作およびジェスチャー認識にマルチタスク学習パラダイムを用いることで、より効率的で堅牢で一般化可能な視覚表現が得られることを示す。
複数のアクションとジェスチャデータセットの実験は、単一のアーキテクチャでのアクションとジェスチャの処理が両方のタスクでより良いパフォーマンスを達成することを実証している。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:16:27 GMT)
The Staircase of Ethics: Probing LLM Value Priorities through Multi-Step Induction to Complex Moral Dilemmas [20.8] 我々は多段階モラルジレンマデータセットを導入し,3,302個の5段階ジレンマのLLMの進化的道徳的判断を評価する。
このフレームワークは、LLMがジレンマをエスカレートする際の道徳的推論をどのように調整するかを、きめ細やかな動的解析を可能にする。
我々の研究は、動的で文脈に配慮した評価パラダイムへのシフトを呼びかけ、LLMのより人間らしく価値に敏感な開発への道を開いた。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:59:50 GMT)
Spacetime Geometry of Denoising in Diffusion Models [20.6] 本稿では,情報幾何学の枠組みを用いた拡散モデルに関する新しい視点を示す。
すべての雑音レベルを同時に捉えた雑音サンプルの集合が統計的多様体を形成することを示す。
遷移経路サンプリングにおけるこの幾何学的視点の実用的価値を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:16:58 GMT)
First Finish Search: Efficient Test-Time Scaling in Large Language Models [20.6] First Finish Search(FFS)は、トレーニング不要の並列デコード戦略で、独立して$n$のサンプルをローンチし、任意のサンプルが完成したらすぐに返却する。
FFSは、AIMEデータセットで82.23%の精度を達成し、DeepSeek-R1のスタンドアロンの精度よりも15%$改善され、OpenAIのo4-miniのパフォーマンスとほぼ一致する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:57:43 GMT)
CopySpec: Accelerating LLMs with Speculative Copy-and-Paste Without Compromising Quality [20.5] 我々は,従来の出力とよく似た応答や,文脈から冗長に抽出できる応答を生成する際に,LLMが直面する非効率性に対処する手法であるCopySpecを紹介した。
CopySpecは、モデルのチャット履歴やコンテキストにおける繰り返しシーケンスを特定し、同じトークンが従うと推測し、出力品質を損なうことなく、追加のGPUメモリを必要としないシームレスなコピーを可能にする。
その結果,CNN/DMでは2.35倍,MT-redundantカテゴリでは2ターン,GSM8Kでは3ターンで2.66倍のスピードアップが得られた。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:51:17 GMT)
Mixture of Low Rank Adaptation with Partial Parameter Sharing for Time Series Forecasting [20.5] マルチタスク予測は,異なる時間ステップでの予測が同じ表現を共有する,Expressiveness Bottleneckに苦しむことを示す。
まず,一歩先予測のための基礎モデルを事前学習し,ステップ固有のLoRAモジュールを用いて適応する。
実験により、MoLAはモデル表現性を著しく改善し、最先端の時系列予測手法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:24:39 GMT)
Joker: Joint Optimization Framework for Lightweight Kernel Machines [20.5] 我々は,KRR,ロジスティック回帰,サポートベクタマシンなど,多様なカーネルモデルを対象とした共同最適化フレームワークJokerを提案する。
実験によると、Jokerは最大90%のメモリを節約できるが、最先端のメソッドよりもトレーニング時間とパフォーマンス(あるいはさらに良い)を達成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:36:45 GMT)
SymmCD: Symmetry-Preserving Crystal Generation with Diffusion Models [20.4] 結晶対称性を生成過程に明示的に組み込む新しい拡散型生成モデルであるSymphCDを提案する。
The Materials Projectのサブセット上でSymCDの競争性能を示し、現実的な対称性と予測特性を持つ多種多様で有効な結晶を得る。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:39:27 GMT)
DART$^3$: Leveraging Distance for Test Time Adaptation in Person Re-Identification [20.4] 人物再識別(ReID)モデルはカメラバイアスに悩まされ、学習された表現はアイデンティティではなく、カメラの視点に応じてクラスタ化される。
DART$3$は、カメラによるReIDのドメインシフトを軽減するために特別に設計されたTTAフレームワークである。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:46:20 GMT)
When to Continue Thinking: Adaptive Thinking Mode Switching for Efficient Reasoning [20.2] 大規模推論モデル(LRM)は、長い推論チェーンを通じて顕著な性能を達成するが、しばしば冗長な推論のために過剰な計算オーバーヘッドを引き起こす。
本稿では、不必要な推論を抑え、暗黙の回復を可能にするフレームワークである適応自己回復推論(ASRR)を提案する。
本研究は, LRMの効率, 適応性, 安全性を高めるためのASRRの可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:38:57 GMT)
DiffBreak: Is Diffusion-Based Purification Robust? [20.2] 拡散型浄化(DBP)は敵例(AE)に対する防御基盤となっている
我々はこの中核的な主張を反論し、勾配に基づく攻撃が勾配よりもDMを効果的に狙うことを理論的に証明し、DBPの出力は敵の分布と一致させる。
適切な会計基準と再提出リスクにより,DBPは崩壊することを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:31:00 GMT)
Hyperparameter Optimization via Interacting with Probabilistic Circuits [20.1] 候補点の獲得機能のない生成を可能にする新しい選択ポリシーを開発する。
本手法は,標準HPOにおける最先端性能を実現し,対話型HPOにおける対話型BOベースラインよりも優れることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:21:19 GMT)
Mind the GAP! The Challenges of Scale in Pixel-based Deep Reinforcement Learning [20.1] エンコーダの出力とそれに続く高密度層との接続を,スケーリング能力を制限する主要な要因として同定する。
我々は,グローバル平均プーリングを,ボトルネックをターゲットとするシンプルかつ効果的な方法として提示し,それ以前のアプローチの複雑さを回避する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:15:43 GMT)
EGA: A Unified End-to-End Generative Framework for Industrial Advertising Systems [20.1] 本稿では,ユーザ関心モデリング,POI,創造的生成,位置割り当て,支払最適化をシームレスに統合する初の統一型生成フレームワークであるエンド・ツー・エンド生成広告(EGA)を提案する。
EGAは階層的トークン化とマルチトークン予測を利用して、候補POIと創造的コンテンツを共同で生成する一方、置換対応報酬モデルとトークンレベルの入札戦略は、ユーザエクスペリエンスと広告主ビジネスの目的の両方と整合性を確保する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:55:02 GMT)
ExoGait-MS: Learning Periodic Dynamics with Multi-Scale Graph Network for Exoskeleton Gait Recognition [20.1] 現在の外骨格制御法は、パーソナライズされた治療を提供する際の課題に直面していることが多い。
個人の歩行は、個々のユーザーの適応性、快適性、リハビリの成果に直接影響を与えるため、外骨格ロボットの有効性に不可欠である。
本稿では,空間領域におけるマルチスケールグローバルセンスグラフ畳み込みネットワーク(GCN)を用いて,潜在関節のシナジーパターンを同定する手法を提案する。
実験の結果,本手法の精度は94.34%であり,現在のSOTA(State-of-the-art)を3.77%上回る結果となった。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:24:25 GMT)
Generative Data Augmentation for Object Point Cloud Segmentation [20.0] 本稿では,ポイントクラウドセグメンテーショントレーニングのための3段階生成データ拡張(GDA)パイプラインを提案する。
提案手法では,少量のラベル付きサンプルしか必要としないが,生成した変種と擬ラベル付きサンプルでトレーニングデータを充実させる。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:56:06 GMT)
DialogXpert: Driving Intelligent and Emotion-Aware Conversations through Online Value-Based Reinforcement Learning with LLM Priors [19.8] 大言語モデル(LLM)エージェントは、反応対話において優れるが、プロアクティブでゴール駆動的な相互作用に苦しむ。
提案するダイアログXpertは,各ターンごとに,小型で高品質な候補アクションセットを提案する。
ユーザの感情を追跡することで、DialogXpertは、真の共感的なつながりを育みながら、タスクを前進させる決定をそれぞれ調整する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:12:40 GMT)
Hybrid Mamba-Transformer Decoder for Error-Correcting Codes [19.8] 本稿では,トランスフォーマー層で拡張されたMambaアーキテクチャに基づく誤り訂正符号の復号化のための新しいディープラーニング手法を提案する。
提案手法は,トランスフォーマーのグローバルコンテキスト能力を維持しつつ,Mambaの効率的なシーケンシャルモデリングを活用するハイブリッドデコーダである。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:48:35 GMT)
Scalable Valuation of Human Feedback through Provably Robust Model Alignment [19.7] 頑健なアライメント目的は、厳密なラベルノイズの下でも同一のモデルパラメータを生成するべきである。
証明可能な再帰特性を持つ最初の原理的アライメント損失であるH"older-DPOを提案する。
このメトリクスはグラデーションフリーで、スケーラブルで自動化された人間のフィードバックの評価を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:12:37 GMT)
SpectralGap: Graph-Level Out-of-Distribution Detection via Laplacian Eigenvalue Gaps [19.6] グラフ上でのOOD検出に有効なポストホック手法であるSpecGapを提案する。
SpecGapは、複数のベンチマークデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:32:51 GMT)
Variational Control for Guidance in Diffusion Models [19.5] 本稿では,DTM(Diffusion Trajectory Matching)を提案する。
DTMは幅広いガイダンス手法を統一し、新しいインスタンス化を可能にする。
本稿では, 線形, 非線形, 盲点の逆問題に対して, 最先端の結果を得る新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:41:09 GMT)
WILDCHAT-50M: A Deep Dive Into the Role of Synthetic Data in Post-Training [19.5] 現在までに最大の公開チャットデータセットであるWILDCHAT-50Mを紹介する。
既存のWildChatデータセットを拡張して、0.5Bから104Bパラメータまで、50以上の異なるオープンウェイトモデルのレスポンスを含めます。
我々は大規模な比較分析を行い、我々の公開SFTミックスであるRE-WILDを作成することにより、このデータセットの可能性を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:07:21 GMT)
KL-regularization Itself is Differentially Private in Bandits and RLHF [19.5] 差分プライバシー(DP)は、プライバシーのための厳格なフレームワークを提供し、単一のエントリで異なるデータセット間で統計的に区別できないデータ駆動アルゴリズムの出力を保証する。
「一般に、DPを保証するためには、アルゴリズム自体または出力に明示的にノイズを注入する必要があるが、既存のアルゴリズムの固有のランダム性は、DPを無償で達成する機会を与える。」
論文参考訳(メタデータ) (Fri, 23 May 2025 22:22:02 GMT)
Temporal Consistency Constrained Transferable Adversarial Attacks with Background Mixup for Action Recognition [19.4] アクション認識モデルは、同じデータモダリティでトレーニングされた他のモデル間で転送可能な敵の例に対して脆弱である。
動作認識のための背景混合誘導時整合(BMTC)攻撃法を提案する。
本手法は,複数のアクション/イメージ認識モデル間での逆例の転送可能性を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:24:28 GMT)
Seek-CAD: A Self-refined Generative Modeling for 3D Parametric CAD Using Local Inference via DeepSeek [19.4] 本研究は,CADモデル生成のための自己補充機構に視覚的および連鎖的フィードバック(CoT)を組み込んだ最初の研究である。
SSR(Sketch, Sketch-based feature, and Refinements)の3次元設計パラダイムを中心に構築された革新的な3次元CADモデルデータセットを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:11:19 GMT)
Physics-Guided Learning of Meteorological Dynamics for Weather Downscaling and Forecasting [19.4] 天気予報は必須であるが、計算集約的で物理的に不完全なままである。
我々は物理方程式と潜在力化をデータ駆動モデルに統合する物理誘導ディープラーニングフレームワークであるPhyDL-NWPを提案する。
実験の結果,PhyDL-NWPは予測性能と物理的整合性の両方を改善した。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:09:32 GMT)
1bit-Merging: Dynamic Quantized Merging for Large Language Models [19.4] texttt1bit-Mergingは,タスク固有のルーティングと1ビットの量子化されたタスクベクトルを統合し,性能と記憶効率のバランスをとる新しいフレームワークである。
1bit-Mergingは既存の手法と同等あるいは優れた性能を示しながら、ストレージ要件を著しく低減する。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:52:05 GMT)
Hidden Ghost Hand: Unveiling Backdoor Vulnerabilities in MLLM-Powered Mobile GUI Agents [19.3] MLLMベースのGUIエージェントは、自然に複数の対話レベルのトリガーを公開します。
我々はAgentGhostを紹介した。AgentGhostは、バックドア攻撃をリピートするための効果的でステルス的なフレームワークである。
AgentGhostは有効で汎用的であり、攻撃精度は3つの攻撃目標に対して99.7%に達する。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:25:08 GMT)
Operator Learning for Schrödinger Equation: Unitarity, Error Bounds, and Time Generalization [18.9] 時間依存シュリンガー方程式の進化作用素を学習する問題を考察する。
既存のニューラルネットワークベースのサロゲートはシュリンガー方程式の基本的な性質を無視することが多い。
弱いユニタリ性を保持する進化作用素に対する線形推定器を導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:32:53 GMT)
Continuum Transformers Perform In-Context Learning by Operator Gradient Descent [18.9] 連続体変換器は、演算子RKHSで勾配降下を実行することで、コンテキスト内演算子学習を行うことができることを示す。
本研究では、この最適性結果の実証検証を行い、この勾配降下を行うパラメータが連続変圧器訓練によって回復されることを実証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:52:54 GMT)
Conformal Prediction for Ensembles: Improving Efficiency via Score-Based Aggregation [18.9] 等角予測は分布仮定を避ける一つの方法である。
しかし、予測領域をマージすることで、コンフォメーションスコアに存在する構造が犠牲になり、保守性はさらに低下する。
そこで本研究では,新しいフレームワークを分類と予測列最適化の両方で効果的に活用できることを述べる。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:34:35 GMT)
Understanding and Mitigating Overrefusal in LLMs from an Unveiling Perspective of Safety Decision Boundary [18.8] オーバーリファールは通常、過保守な安全アライメントに起因している。
本稿では、過剰なプロンプトを戦略的にターゲットとするプロンプト生成と選択のための自動フレームワークであるRASSを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:30:49 GMT)
Adapting SAM 2 for Visual Object Tracking: 1st Place Solution for MMVPR Challenge Multi-Modal Tracking [18.8] 本稿では,Segment Anything Model 2 (SAM2) を Visual Object Tracking (VOT) タスクに適用するための効果的なアプローチを提案する。
提案手法はSAM2の強力な事前学習機能を活用し,VOTアプリケーションの性能向上にいくつかの重要な手法を取り入れている。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:04:56 GMT)
ProgRM: Build Better GUI Agents with Progress Rewards [18.7] 本稿では,オンライントレーニングの各段階におけるタスク完了の進捗を予測し,情報量の多い中間報酬を提供するプログレッシブ・リワード・モデル(ProgRM)を提案する。
ProgRMは広範な実験と分析によって評価されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:23:11 GMT)
LCD: Advancing Extreme Low-Bit Clustering for Large Language Models via Knowledge Distillation [18.6] 大規模言語モデル(LLM)は自然言語処理において大きな進歩を遂げているが、デプロイメントでは課題に直面している。
重み量子化はこれらの問題に対処する一般的な手法であるが、効果的な低ビット圧縮を実現することは依然として困難である。
本稿では,知識蒸留フレームワーク内でのクラスタリングに基づく量子化学習を統合するLCDを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:28:24 GMT)
Beyond One-Size-Fits-All Pruning via Evolutionary Metric Search for Large Language Models [18.6] 適応型LLMプルーニングのための効率的な進化的最適化フレームワークである textbftextscOptiShear を紹介する。
我々のフレームワークは,メタプルーニングメトリック上に構築された効率的な検索空間と,迅速な評価のためのモデルワイド再構成誤差の2つの重要なイノベーションを特徴としている。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:17:51 GMT)
Structural Reasoning Improves Molecular Understanding of LLM [18.5] 大規模言語モデル (LLM) は分子構造情報を用いた推論に依然として苦戦していることを示す。
本稿では,分子構造を推論のためにスケッチする手法を提案する。
対象分子が未知あるいは未知のシナリオのための2つのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:11:07 GMT)
Offline Constrained Reinforcement Learning under Partial Data Coverage [18.4] 一般関数近似を用いたオフライン拘束強化学習(RL)について検討した。
線形プログラミング(LP)の定式化に基づくオラクル効率の原始双対アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:00:01 GMT)
VGGT-SLAM: Dense RGB SLAM Optimized on the SL(4) Manifold [18.4] VGGT-SLAMは、フィードフォワードシーン再構築アプローチVGGTから生成されたサブマップをインクリメンタルかつグローバルに整列させて構築された高密度RGB SLAMシステムである。
VGGT-SLAMは,高GPU要求のためにVGGTでは実現不可能な長いビデオシーケンスを用いて,地図品質の向上を実現する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:59:20 GMT)
DualTalk: Dual-Speaker Interaction for 3D Talking Head Conversations [18.4] 既存の3Dトーキングヘッドジェネレーションモデルは、話すことや聞くことのみに焦点を当てている。
本稿では,3次元音声ヘッド生成のためのマルチラウンドデュアルスピーカインタラクションを提案する。
我々は、話者とリスナーの動的挙動を統合する新しい統合フレームワークであるDualTalkを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:49:05 GMT)
Augmenting Online RL with Offline Data is All You Need: A Unified Hybrid RL Algorithm Design and Analysis [18.3] 本稿では、エージェントがオフラインデータセットとオンラインインタラクションの両方を利用して最適なポリシーを学習できる強化学習(RL)のためのハイブリッド学習フレームワークについて検討する。
統合されたアルゴリズムと分析を行い、オフラインデータセットによる信頼性に基づくオンラインRLアルゴリズムの強化は、純粋なオンラインまたはオフラインのアルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:30:12 GMT)
Revisiting Feature Interactions from the Perspective of Quadratic Neural Networks for Click-through Rate Prediction [18.2] 二次ニューラルネットワーク(QNN)の観点からアダマール製品(HP)を再考する
我々は,QNNが機能空間を拡大し,活性化関数に頼らずにスムーズな非線形近似を提供する能力を明らかにする。
本稿では,CTR予測タスクに適した新しいニューロン形式QNN-alphaを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:04:16 GMT)
SSR-Zero: Simple Self-Rewarding Reinforcement Learning for Machine Translation [18.2] 本稿では,機械翻訳(MT)のための簡易自己回帰(SSR)強化学習(RL)フレームワークを提案する。
13Kモノリンガル例とQwen-2.5-7Bをバックボーンとして用いたSSRを用いたトレーニングを行った。
我々の最強モデルであるSSR-X-Zero-7Bは、COMETの外部監督でSSRを増強することにより、英語の$leftrightarrow$ Chinese translationにおける最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:23:14 GMT)
Automating Versatile Time-Series Analysis with Tiny Transformers on Embedded FPGAs [18.2] 本稿では,組み込みFPGA上でのTiny Transformersの統一的かつ完全に自動化されたデプロイメントフレームワークを提案する。
我々のフレームワークは、3つの典型的な時系列タスクにまたがるコンパクトエンコーダのみのトランスフォーマーアーキテクチャをサポートしている。
その結果,AMD Spartan-7では,1推論あたり0.033mJとミリ秒のレイテンシで達成できる,整数のみのタスク固有のトランスフォーマーアクセラレータを作成した。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:27:25 GMT)
TAD-Bench: A Comprehensive Benchmark for Embedding-Based Text Anomaly Detection [18.1] テキスト異常検出は、自然言語処理タスクにおけるスパム、誤情報、および攻撃的な言語を特定するために重要である。
埋め込みベースのメソッドの採用が増えているにもかかわらず、様々なアプリケーションシナリオにおけるそれらの有効性と一般化性は、まだ未調査のままである。
テキスト異常検出のための埋め込み型アプローチを体系的に評価するベンチマークであるTAD-Benchを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:39:19 GMT)
Compositional Causal Reasoning Evaluation in Language Models [18.1] 因果推論と構成推論は、AIにおける2つの中核的な願望である。
両行動を同時に考える統一的な視点を探求する。
構成因果推論の体系的評価のための枠組みを創出する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:43:17 GMT)
What Needs Attention? Prioritizing Drivers of Developers' Trust and Adoption of Generative AI [18.1] 我々は、GenAIに対する信頼と養子縁組の意図に影響を与える要因の理論モデルを開発した。
我々は,genAIのシステム/アウトプットの品質,機能的価値,目標維持が開発者の信頼に大きく影響していることを発見した。
我々は,人間とAIのインタラクションを効果的かつ信頼性が高く,包括的に行うために,今後のgenAIツール設計を導くための提案を行う。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:05:56 GMT)
Online Statistical Inference of Constrained Stochastic Optimization via Random Scaling [17.9] 我々は,Sketched Sequential Quadratic Programming (SSQP) を用いた制約付き最適化のためのオンライン推論手法を開発した。
スケッチされたニュートン法の直接的な一般化として、SSQPは2次モデルと2次モデルと、各ステップにおける線形モデルとの制約とを近似し、結果として生じるサブプロブレムを解くためにスケッチ解法を適用する。
特に,制限分布が未知のパラメータを含まないSSQPイテレートに基づくテスト統計を構築した。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:33:08 GMT)
Thinking Fast and Right: Balancing Accuracy and Reasoning Length with Adaptive Rewards [17.8] 大規模言語モデルに対する適応的な報酬形成手法を提案する。
本手法はモデルの性能に基づいて,精度と応答長のトレードオフを動的に調整する。
実験の結果,提案手法は精度を保ちながら推論時間を大幅に短縮することがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:44:46 GMT)
Object-level Cross-view Geo-localization with Location Enhancement and Multi-Head Cross Attention [17.8] クロスビュージオローカライゼーションは、ドローンや地上カメラが捉えたクエリ画像の位置を、ジオリファレンス衛星画像とマッチングすることによって決定する。
これらの課題に対処するために,オブジェクトレベルのクロスビュージオローカライズネットワーク(OCGNet)を提案する。
OCGNetは、パブリックデータセットであるCVOGLで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:55:56 GMT)
Probe by Gaming: A Game-based Benchmark for Assessing Conceptual Knowledge in LLMs [17.8] CK-Arenaは、Undercoverゲーム上に開発されたマルチエージェントインタラクションゲームである。
対話的な設定で概念を推論するために,大規模言語モデルの能力を評価するように設計されている。
CK-Arenaは動的環境における概念推論を評価するためのスケーラブルで現実的なベンチマークを提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:06:28 GMT)
FDBPL: Faster Distillation-Based Prompt Learning for Region-Aware Vision-Language Models Adaptation [17.5] 大規模なtextbfFaster large textbfDistillation-large textbfBased large textbfPrompt large textbfLL (textbfFDBPL) を提案する。
複数のトレーニングステージにまたがってソフトな監視コンテキストを共有し、アクセラレーションされたI/Oを実装することで、問題に対処する。11データセットにわたる包括的な評価は、ベース・ツー・ニューな一般化、クロス・データセットの転送、ロバストネステストにおいて優れたパフォーマンスを示し、より高速なトレーニング速度で2.2倍の速さで達成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:57:16 GMT)
Building Floor Number Estimation from Crowdsourced Street-Level Images: Munich Dataset and Baseline Method [17.5] 大規模なフロアカウントデータは、カダストラルと3D都市データベースではほとんど利用できない。
本研究では,道路画像から直接床数を推定するエンドツーエンドのディープラーニングフレームワークを提案する。
提案された分類回帰ネットワークは精度81.2%に達し、+/-1階内の建物の97.9%を予測している。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:27:46 GMT)
DanmakuTPPBench: A Multi-modal Benchmark for Temporal Point Process Modeling and Understanding [17.5] 本稿では,マルチモーダル・テンポラル・ポイント・プロセス(TPP)モデリングの進歩を目的としたベンチマークであるDanmakuTPPBenchを紹介する。
TPPは時間的事象系列をモデル化するために広く研究されてきたが、既存のデータセットは概ね非モーダルである。
我々のベンチマークは、強力なベースラインを確立し、マルチモーダル言語モデリングランドスケープへのTPPモデリングのさらなる統合を要求する。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:38:28 GMT)
Fairness through Difference Awareness: Measuring Desired Group Discrimination in LLMs [17.4] 我々は、人を別々に扱うという観点から公正さを研究する。
16kの質問に対して8つのシナリオからなるベンチマークスイートを提案する。
差分認識が公平性とは異なる次元であることを示す10のモデルで結果を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:10:48 GMT)
MetaBox-v2: A Unified Benchmark Platform for Meta-Black-Box Optimization [17.4] MetaBox-v2は4つの新機能を備えたマイルストーンアップグレードです。
シングルオブジェクト、マルチオブジェクト、マルチモデル、マルチタスク最適化シナリオにまたがる18の総合的/現実的なタスクからなる総合ベンチマークスイート。
有意義な洞察は、実践者とその分野への新規者に対する徹底的かつ詳細な分析から導き出される。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:13:10 GMT)
The Coherence Trap: When MLLM-Crafted Narratives Exploit Manipulated Visual Contexts [17.3] マルチメディア操作は、AIが生成した偽情報と戦う上で重要な課題として浮上した。
本稿では,MLLMが高リスク情報を生成するための新しい対向パイプラインを提案する。
MLLMフレームワークを用いたアーチファクト対応マニピュレーション診断について述べる。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:58:27 GMT)
Toward Optimal ANC: Establishing Mutual Information Lower Bound [17.3] アクティブノイズキャンセラアルゴリズムは、元のノイズをリアルタイムに妨害するアンチノイズ信号を生成することにより、望ましくない音響障害を抑制する。
最近のディープラーニングベースのANCアルゴリズムでは、新しいパフォーマンスベンチマークが設定されているが、その改善を厳格に評価する理論的な制限が不足している。
2つのコンポーネントからなるキャンセル性能の統一的な下限を導出する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:27:35 GMT)
Benchmarking Recommendation, Classification, and Tracing Based on Hugging Face Knowledge Graph [17.3] HuggingKGは、MLリソース管理のためにHugging Faceコミュニティから構築された最初の大規模知識グラフである。
2.60万のノードと620万のエッジを持つHuggingKGは、ドメイン固有の関係とリッチテキスト属性をキャプチャする。
HuggingBenchは、リソースレコメンデーション、分類、トレースを含む、IRタスク用の3つの新しいテストコレクションを備えたマルチタスクベンチマークである。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:00:20 GMT)
FinRAGBench-V: A Benchmark for Multimodal RAG with Visual Citation in the Financial Domain [17.1] FinRAGBench-Vは金融用に最適化された総合的なビジュアルRAGベンチマークである。
マルチモーダルデータを統合し、トレーサビリティを確保するために視覚的引用を提供する。
RGenCiteは、視覚的引用と生成をシームレスに統合するRAGベースラインである。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:51:51 GMT)
Best Group Identification in Multi-Objective Bandits [17.1] マルチオブジェクト・マルチアーム・バンディット・セッティングにおけるベスト・グループ同定問題について述べる。
目的は、固定信頼設定における最適群の集合を特定することである。
本稿では, 除去に基づくアルゴリズムを提案し, サンプルの複雑さの上限を設定し, 正しいアルゴリズムに適用する下限を導出する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:16:59 GMT)
Unlocking Efficient Long-to-Short LLM Reasoning with Model Merging [17.0] Long-to-Short (L2S) 推論は推論深度と実用効率のバランスをとることを目的としている。
モデルマージは、System 1モデルの迅速な思考能力とSystem 2モデルの方法論的推論を統合することで、コスト効率が高く堅牢な代替手段を提供する。
実験の結果,モデルマージにより平均応答長を最大55%削減できることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:41:43 GMT)
Are Large Language Models Reliable AI Scientists? Assessing Reverse-Engineering of Black-Box Systems [17.0] 大規模言語モデル(LLM)は、受動的に観測されたデータとアクティブに収集されたデータからブラックボックス関数を特定することを学ぶ。
LLMは観測結果から情報を抽出できず、ベイズ推定の理想に劣る性能台地に到達する。
一方のLSMから他方のLSMへの介入データを提供することで、この改善が効果的な介入のプロセスへの関与の結果であることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:37:36 GMT)
Online Bidding Algorithms with Strict Return on Spend (ROS) Constraint [17.0] 厳密な返却制約(ROSC)の下での自動入札問題について考察する。
タイムスロット全体で明らかな値が一定である場合でも、問題は自明ではない。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:02:47 GMT)
Archetypal SAE: Adaptive and Stable Dictionary Learning for Concept Extraction in Large Vision Models [16.9] スパースオートエンコーダ(SAE)は、機械学習の解釈可能性のための強力なフレームワークとして登場した。
既存のSAEは、類似したデータセットでトレーニングされた同一のモデルは、非常に異なる辞書を生成することができるため、深刻な不安定性を示す。
本稿では、辞書の原子を凸殻に拘束するArchitypal SAEについて述べる。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:07:04 GMT)
PPT: A Process-based Preference Learning Framework for Self Improving Table Question Answering Models [16.8] 本稿では,テーブル質問応答のためのプロセスベース推論学習フレームワークを提案する。
推論連鎖を離散状態に分解し、各状態にスコアを割り当て、選好学習のための対照的なステップをサンプリングする。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:24:53 GMT)
Bootstrapping Imitation Learning for Long-horizon Manipulation via Hierarchical Data Collection Space [16.8] 人間の実演による模倣学習(IL)はロボット操作タスクの有望な方法である。
本稿では,ロボット模倣学習のための階層型データ収集空間(HD-Space)について紹介する。
我々は2つのシミュレーションと5つの実世界の長距離操作タスクに対して経験的評価を行う。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:57:45 GMT)
A Task-Driven Human-AI Collaboration: When to Automate, When to Collaborate, When to Challenge [16.7] 我々は,人間とAIの適切な統合が,パフォーマンスを向上しつつ,有意義なエージェンシーを維持していることを示す。
このフレームワークは、実用的で道徳的に健全な人間とAIのコラボレーションのためのファインダオプションを配置する。
論文参考訳(メタデータ) (Fri, 23 May 2025 23:19:15 GMT)
FutureSightDrive: Thinking Visually with Spatio-Temporal CoT for Autonomous Driving [16.6] 視覚言語モデル(VLM)は、強力な推論能力のため、自動運転への関心が高まっている。
本稿では,モデルが視覚的に考えることを可能にするコテンポラル-T推論手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:55:32 GMT)
UniEdit: A Unified Knowledge Editing Benchmark for Large Language Models [16.5] オープンドメイン知識に基づく大規模言語モデル(LLM)編集のための統一ベンチマークであるUniEditを紹介する。
まず,5つのカテゴリにまたがる25の共通領域からエンティティを選択することで,サンプルを編集する。
編集における一般性や局所性の問題に対処するため,我々はNorborhood Multi-hop Chain Smpling (NMCS)アルゴリズムを設計する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:13:05 GMT)
Distances for Markov chains from sample streams [16.4] シミュレーションメトリクスは、プロセス間の類似性、特にマルコフ連鎖を測定する強力なツールである。
近年の進歩により、バイシミュレーションのメトリクスは、実際、最適な輸送距離であり、証明可能な精度と実行時の保証で、そのようなメトリクスを計算するための高速なアルゴリズムの開発を可能にしていることが判明した。
これは多くの場合、ほとんどの実世界のシナリオでは非現実的な仮定であり、典型的にはサンプル軌道のみが利用可能である。
本稿では,この制限に対処する新しい最適化手法を提案し,サンプルアクセスに基づくバイシミュレーションのメトリクスを,明示的な遷移モデルを必要とせずに推定する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:09:04 GMT)
A Comprehensive Study on the Use of Word Embedding Models in Software Engineering Domain [16.4] 本研究は,ソフトウェア工学(SE)領域における単語埋め込み(WE)モデルの利用に焦点を当てる。
メインストリームのソフトウェアエンジニアリングの会場で発表された181の初等的な研究が分析のために集められている。
一連のSEタスクで使用されるSEアーティファクトの実践的意味表現アプローチの採用や開発における課題と行動を明らかにする。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:52:29 GMT)
C-LoRA: Contextual Low-Rank Adaptation for Uncertainty Estimation in Large Language Models [16.3] Low-Rank Adaptation (LoRA)は、大規模言語モデル(LLM)を微調整するためのコスト効率の良いソリューションを提供する。
LoRAは、データスカースな数ショット設定で過信な予測を生成する。
本研究では,新しい不確実性を認識し,パラメータを効率的に調整する手法として,コンテキスト低ランク適応(textbfC-LoRA)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:44:02 GMT)
Learning to Focus: Context Extraction for Efficient Code Vulnerability Detection with Language Models [16.2] 言語モデル(LM)は脆弱性検出の約束を示すが、脆弱で不確実な脆弱性位置のため、長く現実世界のコードに苦労する。
本研究では、LMに基づく脆弱性検出を学習し、センシティブなコンテキストを選択するモデルに依存しないフレームワークであるFocusVulを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:41:54 GMT)
BiggerGait: Unlocking Gait Recognition with Layer-wise Representations from Large Vision Models [16.2] 本研究は,下流認識タスクにおけるレイヤワイド表現の影響について検討する。
We propose a simple and universal baseline for LVM based gait recognition, called BiggerGait。
CCPG, CAISA-B*, SUSTech1K, CCGR_MINIの総合評価は, 内部およびクロスドメインタスクにおけるBiggerGaitの優位性を検証した。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:41:54 GMT)
ICA-RAG: Information Completeness Guided Adaptive Retrieval-Augmented Generation for Disease Diagnosis [16.2] ICA-RAGは疾患診断におけるRAG信頼性を高めるための新しいフレームワークである。
適応制御モジュールを使用して、入力の情報完全性に基づいて検索の必要性を評価する。
3つの中国の電子カルテデータセットの実験により、ICA-RAGはベースライン法を大幅に上回っていることが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:05:04 GMT)
Get Experience from Practice: LLM Agents with Record & Replay [16.2] 本稿では,AIエージェントフレームワークに古典的なレコード再生機構を導入する,Agent Record & Replay(Agent Record & Replay)と呼ばれる新しいパラダイムを提案する。
本稿では,AgentRRにおけるマルチレベル体験抽象化手法とチェック関数機構について述べる。
さらに,AgentRRの複数のアプリケーションモードについて検討し,ユーザ記録タスクのデモ,大規模モデルコラボレーション,プライバシ対応エージェントの実行などを検討した。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:33:14 GMT)
Imagine Beyond! Distributionally Robust Auto-Encoding for State Space Coverage in Online Reinforcement Learning [16.2] GCRL(Goal-Conditioned Reinforcement Learning)は、エージェントが自律的に多様な行動を取得することを可能にする。
エージェントが探索中に表現を学ぶオンライン環境では、潜伏空間はエージェントのポリシーによって進化する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:43:55 GMT)
Exploring the Effect of Segmentation and Vocabulary Size on Speech Tokenization for Speech Language Models [16.1] 音声トークン化は、音声信号を離散表現のシーケンスに変換する。
本稿では,音声トークン化の2つの重要な側面として,分割幅と離散単位のクラスタサイズについて検討する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:03:27 GMT)
ProTAL: A Drag-and-Link Video Programming Framework for Temporal Action Localization [16.1] 本稿では,ドラグ&リンク型ビデオプログラミングフレームワークProTALを提案する。
ProTALでは、ボディパーツやオブジェクトを表すノードをドラッグすることで、textbfkeyイベントを定義することができる。
次に、半教師付き手法を用いて、そのようなラベルでTALモデルを訓練する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:00:59 GMT)
VIBE: Video-to-Text Information Bottleneck Evaluation for TL;DR [15.9] 現在の視覚言語モデル(VLM)は冗長で冗長な出力を生成し、タスクのパフォーマンスを阻害する。
既存のビデオキャプション評価は、コストのかかる人間のアノテーションに依存し、下流タスクにおける要約の実用性を見落としている。
VIBEは2つのメトリクスを使ってVLM出力をスコア付けする。
VIBEは、ランダムにサンプリングされたVLM出力から、2つのスコアにランク付けして、効果的な人的意思決定を支援する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:11:29 GMT)
Time to Spike? Understanding the Representational Power of Spiking Neural Networks in Discrete Time [15.8] スパイキングニューラルネットワーク(SNN)は、従来の人工ニューラルネットワーク(ANN)によって引き起こされるエネルギー問題に対する潜在的な解決策である
本研究では,漏洩型統合火災(LIF)ニューロンに基づくSNNの離散時間モデルについて検討した。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:28:00 GMT)
X-MethaneWet: A Cross-scale Global Wetland Methane Emission Benchmark Dataset for Advancing Science Discovery with AI [15.8] メタン(CH$_4$)は二酸化炭素に次いで2番目に強力な温室効果ガスであり、気候変動において重要な役割を果たしている。
大陸横断メタンベンチマークデータセット(X-MethaneWet)について紹介する。
このデータセットは、新たなAIアルゴリズムで、グローバルウェットランドCH$_4$モデリングと科学発見を改善する機会を提供することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:24:09 GMT)
What Do You Need for Diverse Trajectory Stitching in Diffusion Planning? [15.8] 計画において、縫合はアルゴリズムが訓練されたデータのサブトラジェクトリをまとめて新しい多様な振る舞いを生成する能力である。
近年のBC法では縫合の習熟度が向上している。
この背景にある主な要因はよく理解されておらず、確実に縫合できる新しいアルゴリズムの開発を妨げる。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:41:08 GMT)
Segment Anyword: Mask Prompt Inversion for Open-Set Grounded Segmentation [15.7] オープンセット言語基底セグメンテーションのための新しい学習自由な視覚概念学習手法を提案する。
提案手法は有効であり、様々なオープンセットセグメンテーションタスクを一般化し、最先端の結果を得る。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:59:44 GMT)
Panoptic Captioning: Seeking An Equivalency Bridge for Image and Text [15.6] この研究は、画像の最小テキスト等価性を求める新しいタスクである、パノプティクスキャプションを導入している。
高品質なデータを生成するためにPancapEngineという効果的なデータエンジンを提案し,また,パンコプトキャプションを改善するためにPancapChainという新しい手法を提案する。
当社のPancapChain-13Bモデルは、InternVL-2.5-78Bのような最先端のオープンソースMLLMを破り、GPT-4oやGemini-2.0-Proといったプロプライエタリなモデルを超えています。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:42:40 GMT)
FoMoH: A clinically meaningful foundation model evaluation for structured electronic health records [15.6] ファンデーションモデルは、下流のタスクとは無関係に意味のある表現を抽出する能力を考えると、医療において大きな可能性を秘めている。
包括的かつ有意義なタスクのデシダラタが欠如していることから、これらのモデルが臨床的有用性にもたらす可能性については、ほとんど意見の一致がない。
コロンビア大学アーヴィング医療センターの500万人の患者を対象に, EHRデータに基づく最先端基礎モデルの評価を行った。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:06:25 GMT)
CrossMuSim: A Cross-Modal Framework for Music Similarity Retrieval with LLM-Powered Text Description Sourcing and Mining [15.6] 本稿では,音楽類似性モデリングの指針となる,新しいクロスモーダルコントラスト学習フレームワークを提案する。
高品質なテキストと音楽のペアリングデータの不足を克服するため,本稿では,デュアルソースデータ取得手法を提案する。
実験により、提案されたフレームワークは既存のベンチマークよりも大幅にパフォーマンスが向上していることが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:34:02 GMT)
ReactDiff: Latent Diffusion for Facial Reaction Generation [15.5] 話者の音声・視覚的クリップを考えると、顔反応生成はリスナーの顔反応を予測することを目的としている。
本稿では,多モード変換器と条件拡散を統合した顔反応拡散(ReactDiff)フレームワークを提案する。
実験の結果、ReactDiffは既存のアプローチよりも大幅に優れており、顔反応の相関は0.26、多様性のスコアは0.094である。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:51:27 GMT)
Knot So Simple: A Minimalistic Environment for Spatial Reasoning [15.5] KnotGymは複雑な空間的推論と操作のための対話型環境である。
ゴール指向のロープ操作タスクで、さまざまなレベルの複雑さがあり、すべて純粋な画像観察から行動する必要がある。
モデルベースRL, モデル予測制御, チェーン・オブ・シークレット推論など, 様々なクラスの手法を評価する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:34:08 GMT)
Adaptive Semantic Token Communication for Transformer-based Edge Inference [15.4] 本稿では,動的変換器を用いたディープジョイントソースチャネル符号化アーキテクチャに基づくエッジ推論のための適応的フレームワークを提案する。
我々は,情報的特徴を1サンプルあたりのユーザ指定トークン数に適応的に圧縮するセマンティックトークン選択機構を採用している。
動的ネットワーク条件下でのロバスト性を高めるために, Lyapunov 最適化に基づく資源配分アルゴリズムを組み込んだ。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:15:05 GMT)
ComfyMind: Toward General-Purpose Generation via Tree-Based Planning and Reactive Feedback [15.4] 我々は、堅牢でスケーラブルな汎用生成を可能にするために設計されたコラボレーティブAIシステムであるComfyMindを紹介する。
ComfyMindでは,低レベルのノードグラフをコール可能な関数言語に抽象化するセマンティックインターフェース(SWI)と,検索ツリー計画機構という,2つのコアイノベーションを紹介している。
我々はComfyBench、GenEval、Reason-Editの3つの公開ベンチマークでComfyMindを評価した。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:53:03 GMT)
PatientSim: A Persona-Driven Simulator for Realistic Doctor-Patient Interactions [15.3] 本稿では,臨床シナリオのための現実的で多様な患者ペルソナを生成する患者シミュレータであるPatentSimを紹介する。
patientSimは、1)MIMIC-EDおよびMIMIC-IVデータセットの実際のデータから得られた症状や医療史を含む臨床プロファイル、2)性格、言語能力、医療履歴のリコールレベル、認知的混乱レベルという4つの軸で定義されたペルソナを使用する。
トップパフォーマンスのオープンソースモデルであるLlama 3.3は、我々のフレームワークの堅牢性を確認するために、4人の臨床医によって検証された。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:34:48 GMT)
Self-Training Large Language Models with Confident Reasoning [15.3] 大規模言語モデル(LLM)は、最終回答の前に推論パスを生成することで、印象的なパフォーマンスを示している。
政策最適化による高共役共振経路を微調整する新しい自己学習手法であるCORE-POを提案する。
実験の結果,CORE-POは既存の自己学習法と比較して,4つの分布内および2つの分布外ベンチマークの出力精度を向上することがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:25:10 GMT)
Large Language Models Share Representations of Latent Grammatical Concepts Across Typologically Diverse Languages [15.2] 大規模言語モデル(LLM)では、複数の言語がどのように学習され、エンコードされているか?
Llama-3-8BとAya-23-8Bでスパースオートエンコーダを訓練し、抽象文法の概念が多くの言語で共有される特徴方向に符号化されることを実証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:42:27 GMT)
Chain-of-Lure: A Synthetic Narrative-Driven Approach to Compromise Large Language Models [15.1] そこで本研究では,Chain-of-Thought機構にインスパイアされた新しいジェイルブレイク手法を提案する。
攻撃モデルは、ミッション転送を使用して、対話において有害なユーザ意図を隠蔽し、連鎖した物語のルアーを生成し、被害者モデルの推論能力を刺激する。
我々の実験では、より弱い安全機構を持つモデルはより強力な攻撃能力を示し、モデルを活用できるだけでなく、他人を傷つける助けにもなることを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:19:05 GMT)
LMAct: A Benchmark for In-Context Imitation Learning with Long Multimodal Demonstrations [15.1] 今日の意思決定モデルのプレッシャーテストにベンチマークを提示する。
モデルが専門家による実演の回数をその文脈で学べるかどうかを検討する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:13:40 GMT)
Semantic segmentation with reward [15.1] RSS(Reward in Semantic)は、報酬に基づく強化学習を2つのレベルで提供する純粋意味セグメンテーションに応用する。
RSSは、プログレッシブスケール報酬(PSR)やペアワイドグラニュラルディファクト(PSD)など、様々な新しいテクノロジーを取り入れている。
ベンチマークデータセットの実験と視覚化により、提案したRSSがセマンティックセグメンテーションネットワークの2つのレベルにおける収束を確実にすることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:52:15 GMT)
SpectraLDS: Provable Distillation for Linear Dynamical Systems [15.0] 対称線形力学系を同定するための最初の証明可能な手法を提案する。
我々のアプローチは、対称LSDを固定スペクトル変換によって学習可能な畳み込みとして表現する最近の研究に基づいている。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:16:54 GMT)
DanceTogether! Identity-Preserving Multi-Person Interactive Video Generation [15.0] DanceTogetherは、単一の参照画像と独立したポーズマスクストリームを、長くてリアルなビデオに変える。
MaskPoseAdapterは"誰が"と"どのように"をデノイングステップ毎にバインドする。
TogetherVideoBenchでは、DanceTogetherは先行の芸術をかなりの差で上回っている。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:37:14 GMT)
Formalizing Embeddedness Failures in Universal Artificial Intelligence [14.9] 組込みエージェントのモデルとしてのAIXI強化学習エージェントの失敗を論じる。
普遍分布から引き出された共同行動/知覚履歴をモデル化するAIXIの変種に焦点を当てる。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:31:28 GMT)
Enhancing Adversarial Robustness of Vision Language Models via Adversarial Mixture Prompt Tuning [14.7] Adversarial Mixture Prompt Tuning (AMPT)は、混合テキストプロンプトを学習して、より堅牢なテキスト機能を得る。
一連の実験により,本手法は最先端手法よりも高い対角性が得られることが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:04:15 GMT)
The emergence of sparse attention: impact of data distribution and benefits of repetition [14.7] 本研究では,トランスフォーマーにおける重要かつ頻繁な注意パターンであるスパースアテンションのトレーニングに伴う出現について検討した。
玩具モデルの理論的解析と線形回帰変種を訓練した小型変圧器の経験的観察を組み合わせることで,機械的スパークアテンションの出現を明らかにする。
我々の研究は、データ分布とモデル設計が1つの形態の台頭の背後にある学習力学にどのように影響するかを理解するための、シンプルで理論的に基礎的なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:14:02 GMT)
Reverse-Speech-Finder: A Neural Network Backtracking Architecture for Generating Alzheimer's Disease Speech Samples and Improving Diagnosis Performance [14.5] 本研究では,アルツハイマー病(AD)の診断を音声解析により強化するニューラルネットワークバックトラックアーキテクチャであるReverse-Speech-Finder(RSF)を紹介する。
RSFは、実際のAD音声サンプルの不足と既存モデルの限定的な解釈可能性の両面に対処し、最も可能性の高いAD固有の音声マーカーを特定し、利用している。
実験の結果、RSFはSHAPやIntegrated Gradientsといった従来の手法よりも優れており、精度は3.5%向上し、F1スコアは3.2%向上した。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:59:27 GMT)
LLM Meeting Decision Trees on Tabular Data [14.5] タブラルデータは、医療や金融など、さまざまな現実世界の分野において重要な役割を担っている。
近年,Large Language Models (LLMs) の成功により,LLMを表データ領域に拡張する研究が進められている。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:57:53 GMT)
SafeInt: Shielding Large Language Models from Jailbreak Attacks via Safety-Aware Representation Intervention [14.5] 我々は,大規模言語モデルをジェイルブレイク攻撃から保護する新しい防御手法であるSafeIntervention(SafeInt)を提案する。
SafeIntのコアアイデアは、Jailbreakに関連する表現を拒絶領域に移動させることです。
6件のJailbreak攻撃、2件のJailbreakデータセット、2件のユーティリティベンチマークに関する包括的な実験を行います。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:26:58 GMT)
Tuning Language Models for Robust Prediction of Diverse User Behaviors [14.3] インテリジェントアシスタントサービスにはユーザ行動の予測が不可欠だが、ディープラーニングモデルは長い尾の振る舞いを捉えるのに苦労することが多い。
本稿では,この問題に対処する段階的な微調整手法であるBehavimentLMを紹介する。
2つの実世界のデータセットの実験結果から、BehavimentLMはアンカーとテールの両方の挙動を頑健に予測することが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:53:43 GMT)
BehaveGPT: A Foundation Model for Large-scale User Behavior Modeling [14.3] 本研究では,大規模ユーザ行動予測に特化して設計された基礎モデルであるBehaveGPTを提案する。
BehaveGPTは膨大なユーザーの行動データセットに基づいてトレーニングされており、複雑な行動パターンを学習することができる。
提案手法では,ユーザ行動データに適したDROベースの事前学習パラダイムを導入し,モデルの一般化と転送性を向上させる。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:43:46 GMT)
\texttt{Range-Arithmetic}: Verifiable Deep Learning Inference on an Untrusted Party [14.3] textttRange-Arithmeticは、非算術演算をsum-checkプロトコルとMatrixd Rangeを使って検証可能なステップに変換する。
提案手法は,既存手法の性能に適合するだけでなく,計算コストの低減も図っている。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:33:50 GMT)
CIKT: A Collaborative and Iterative Knowledge Tracing Framework with Large Language Models [14.3] 知識追跡は、学生の学習状態を時間とともにモデル化し、将来のパフォーマンスを予測することを目的としている。
従来のKTメソッドは、複雑な知識依存の説明可能性、スケーラビリティ、効果的なモデリングにおいてしばしば課題に直面します。
予測精度と説明可能性の両方を高めるために,大規模言語モデルを利用した協調反復的知識追跡(CIKT)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:16:16 GMT)
Three Minds, One Legend: Jailbreak Large Reasoning Model with Adaptive Stacked Ciphers [14.3] Large Reasoning Models (LRMs) は従来のLarge Language Models (LLMs) と比較して優れた論理能力を示している。
SEALは新たなジェイルブレイク攻撃であり、彼らの推論プロセスをオーバーライドし、潜在的な適応アライメントを回避するように設計された適応型暗号化パイプラインを通じてLEMをターゲットにしている。
SEAL は GPT o4-mini の攻撃成功率 80.8% を達成し、最先端のベースラインを27.2% で上回っている。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:27:51 GMT)
Retrieval Augmented Generation-based Large Language Models for Bridging Transportation Cybersecurity Legal Knowledge Gaps [14.3] 本研究では,政策立案者を支援するために設計したLarge Language Model (LLM) フレームワークについて紹介する。
本フレームワークは,LLMにおける幻覚の軽減に焦点をあてる。
分析の結果,提案したRAGに基づくLCMは,4つの評価指標で有意な商業LSMよりも優れていた。
論文参考訳(メタデータ) (Fri, 23 May 2025 23:40:10 GMT)
Speechless: Speech Instruction Training Without Speech for Low Resource Languages [14.2] 音声コマンドの理解と実行を微調整する大規模言語モデルには,音声命令データの不足が不可欠である。
我々の新しいアプローチは、TSの必要性を回避し、意味表現レベルでの合成を停止することで、この問題に対処する。
我々は,合成意味表現を事前訓練されたWhisperエンコーダと整合させ,LLMをテキスト命令で微調整し,推論中の音声命令を理解する能力を維持しながら実現した。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:05:47 GMT)
ProxySPEX: Inference-Efficient Interpretability via Sparse Feature Interactions in LLMs [14.2] 大規模言語モデル(LLM)は、入力機能間の複雑な相互作用をキャプチャすることで、優れたパフォーマンスを実現している。
これらの相互作用を識別するには、既存のほとんどのアプローチは、与えられた順序まで全ての可能な特徴の組み合わせを列挙する必要がある。
ProxySPEX(英語版)は、勾配木をマスキングした出力に適合させ、重要な相互作用を抽出する相互作用帰属アルゴリズムである。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:44:01 GMT)
Adversarial Robustness of Nonparametric Regression [14.2] 回帰関数が2階ソボレフ空間に属することを前提として、非パラメトリック回帰における対向ロバスト性を特徴づける。
古典的なスムーズなスプライン推定器が適切に正規化されると、敵の汚職に対して頑健であることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:18:20 GMT)
Improved and Oracle-Efficient Online $\ell_1$-Multicalibration [14.1] 本研究では,複数のグループにまたがるキャリブレーション予測を行うフレームワークであるエンフォリン・マルチキャリブレーションについて検討する。
そこで本研究では,$widetildemathcalO(T-1/4)$を改良し,オラクル効率を向上する手法を提案する。
我々のフレームワークは、(ell_H)-multicalibration誤差の1ドルLipschitz特性を利用して、ある無限群の族にも拡張する。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:37:49 GMT)
TabSTAR: A Foundation Tabular Model With Semantically Target-Aware Representations [14.1] Tabular Foundation Modelsは、現実世界の知識を活用し、多様なデータセットをまたいで一般化することができる。
セマンティックなターゲット認識表現を備えた基礎的タブラリモデルであるTabSTARを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:34:28 GMT)
HoloLLM: Multisensory Foundation Model for Language-Grounded Human Sensing and Reasoning [14.0] スマートホームで活動する身体エージェントは、多様な感覚入力を通じて人間の行動を理解し、自然言語を介してコミュニケーションする必要がある。
本稿では,Multimodal Large Language Model (MLLM) であるHoloLLMを紹介する。
また,HoloLLMは既存のMLLMよりも優れており,言語による人間の知覚精度を最大30%向上することを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:06:09 GMT)
Semantic Correspondence: Unified Benchmarking and a Strong Baseline [14.0] 本研究は,意味対応手法の大規模調査である。
我々は、様々なベンチマークの文献におけるメソッドの結果を統合比較表に集約し、要約する。
複数のベンチマークで最先端のパフォーマンスを実現するための,シンプルで効果的なベースラインを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:07:16 GMT)
Enhancing Low-Resource Language and Instruction Following Capabilities of Audio Language Models [13.9] 本稿では,低リソース言語タイ語における音声言語モデルの評価を行い,多言語基盤にも拘わらず,言語間能力の欠如が判明した。
本実験は,低リソース言語において,言語固有の学習データと多言語学習データのバランスをとることで,命令追従を改善するための知見を提供する。
提案されたTyphoon-Audioモデルは、既存のオープンソースモデルよりも大幅に優れており、英語とタイ語の両方で最先端のGemini-1.5-Proに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:37:01 GMT)
Initialization using Update Approximation is a Silver Bullet for Extremely Efficient Low-Rank Fine-Tuning [13.8] 低ランク部分空間内での完全な微調整を近似するLoRA Silver BulletあるいはLoRA-SBを提案する。
これらの結果から,低ランク部分空間において,性能を犠牲にすることなく完全な微調整をシミュレートできることが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:31:02 GMT)
Normalized Cut with Reinforcement Learning in Constrained Action Space [13.8] 本稿では、制約されたアクション空間を用いて、正規化されたカット問題を事前定義されたテンプレートインスタンスへ誘導する最初のRLソリューションを提案する。
輸送ネットワークを例として、ウェッジとリングのグラフ分割を形作るWedge and Ring Transformerを作成します。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:35:56 GMT)
TimeCapsule: Solving the Jigsaw Puzzle of Long-Term Time Series Forecasting with Compressed Predictive Representations [13.7] 我々は高次元情報圧縮の原理に基づいたモデルであるTimeCapsuleを紹介する。
本稿では,圧縮表現領域の内部予測について提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:31:58 GMT)
Flexible MOF Generation with Torsion-Aware Flow Matching [13.6] 2段階のde novo MOF生成フレームワークを提案する。
まず, SMILESをベースとした自己回帰モデルを用いて, 新規な金属・有機建築ブロックを創出する。
第二に、柔軟なブロックを有効な3Dフレームワークに組み立てるために、翻訳、回転、ねじれ角を予測するフローマッチングモデルを導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:56:30 GMT)
Ranking Free RAG: Replacing Re-ranking with Selection in RAG for Sensitive Domains [13.6] 本稿では,RAGにおける再ランク付けを合理的な選択手法で置き換える新しい方法であるMETEORAを提案する。
METEORAは、最先端の再評価手法よりも約50%少ないチャンクを使用しながら、生成精度を33.34%向上させる。
敵対的な設定では、METEORAはF1スコアを0.10から0.44に大幅に改善する。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:58:49 GMT)
Active Speech Enhancement: Active Speech Denoising Decliping and Deveraberation [13.6] 能動音声修正のための新しいパラダイム:能動音声強調(ASE)について紹介する。
干渉抑制と信号の富化を協調的に最適化するタスク固有損失関数とともに,トランスフォーマー・マンバに基づく新しいアーキテクチャを提案する。
提案手法は,複数の音声処理タスクにおいて,デノベーション,デノベーション,デクリッピングなど,既存のベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:33:56 GMT)
Identifiability of latent causal graphical models without pure children [13.5] 本稿では,潜伏変数の存在下で因果図形モデルを特定するという課題を考察する。
因果図形モデル全体の識別性を保証した二重三角図形条件を提案する。
我々はまた、識別可能性に必要な条件を確立し、識別可能性の基本的限界に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:34:22 GMT)
FBQuant: FeedBack Quantization for Large Language Models [13.5] 自動制御における負のフィードバック機構にインスパイアされた新しいアプローチであるFeedBack Quantization (FBQuant)を提案する。
FBQuantは本質的に、再構成された重量が量子化によって束縛されることを保証し、過剰適合のリスクを低減する。
3ビットのLlama2-7Bでは、FBQuantはゼロショット精度を1.2%向上させる。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:33:23 GMT)
One Model Transfer to All: On Robust Jailbreak Prompts Generation against LLMs [13.5] ArrAttackは、防衛された大規模言語モデル(LLM)をターゲットにした攻撃方法である。
ArrAttackは、様々な防御措置をバイパスできる堅牢なジェイルブレイクプロンプトを自動的に生成する。
私たちの仕事は、ジェイルブレイク攻撃と防衛のギャップを埋め、堅牢なジェイルブレイクプロンプトを生成するための新たな視点を提供します。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:02:38 GMT)
MedCFVQA: A Causal Approach to Mitigate Modality Preference Bias in Medical Visual Question Answering [13.5] 既存のMedVQAモデルはモダリティ優先バイアスに悩まされ、予測は一方のモダリティに大きく支配され、他方を見下ろしている。
本稿では, 因果グラフを応用し, 推論時のモダリティ優先バイアスを除去する医療対実VQA(MedCFVQA)モデルを提案する。
我々は,MedCFVQAがSLAKE,RadVQA,SLAKE-CP,RadVQA-CPの両データセットにおいて,非因果関係を著しく上回っていることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:20:08 GMT)
GEM: Gaussian Embedding Modeling for Out-of-Distribution Detection in GUI Agents [13.4] 環境制約に違反したり、GUIエージェントの現在の能力を超えたりするアウト・オブ・ディストリビューション(OOD)命令は、タスクの故障やセキュリティ上の脅威を引き起こす可能性がある。
従来のOOD検出手法は、複雑な埋め込み空間とGUI環境の進化により、この領域でサブ最適化される。
本稿では,その機能境界を反映したGUIエージェントから抽出した入力埋め込み距離にガウス混合モデルを適用する新しい手法であるGEMを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:20:07 GMT)
Inferring Events from Time Series using Language Models [13.4] 時系列データは、時間とともに環境がどのように変化するかを測定し、金融や医療といった重要な領域における意思決定を促進する。
本研究では,Large Language Models (LLMs) が時系列データから自然言語で記述された事象を推測できるかどうかを初めて検討する。
現在のLLMはいくつかの有望な能力を示しており、OpenAIのo1は最高だが、DS-R1-distill-Qwen-32BはGPT-4oのようなプロプライエタリなモデルより優れている。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:58:52 GMT)
Semi-Supervised Multi-Label Feature Selection with Consistent Sparse Graph Learning [13.4] 既存のマルチラベル手法では、十分なラベル付きサンプルなしでラベル相関を評価できない。
原特徴空間から直接導出される類似性グラフ構造は、多重ラベル問題に対する準最適である。
マルチラベル半教師付き特徴選択のための一貫したスパースグラフ学習法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:25:41 GMT)
BiomedSQL: Text-to-SQL for Scientific Reasoning on Biomedical Knowledge Bases [13.4] 実世界のバイオメディカル知識ベース上で科学的推論を評価するために設計された最初のベンチマークであるBiomedを紹介する。
Biomedは68,000の問合せ/問合せ/問合せのトリプルで構成されている。
GPT-o3-mini 3ステップエージェントは59.0%の実行精度を達成し、カスタムマルチステップエージェントBMは62.6%に達した。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:58:07 GMT)
Modeling Ranking Properties with In-Context Learning [13.3] 本稿では,各ランキングシナリオやデータセットに対するタスク固有のトレーニングを不要とする,コンテキスト内学習(ICL)アプローチを提案する。
提案手法は,現在入力に類似した過去の問合せの目的間のトレードオフを示す少数の事例ランキングに依存する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:58:22 GMT)
SeaLion: Semantic Part-Aware Latent Point Diffusion Models for 3D Generation [13.3] 細かなセグメンテーションラベルを持つ点雲を生成するために設計された新しい拡散モデルSeaLionを提案する。
P-CD(Part-Aware Chamfer distance)と呼ばれる新しい点雲対距離計算法も導入する。
大規模合成データセットShapeNetと実世界の医療データセットIntrAの実験は、SeaLionが世代品質と多様性において顕著なパフォーマンスを達成することを実証している。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:38:05 GMT)
Do BERT-Like Bidirectional Models Still Perform Better on Text Classification in the Era of LLMs? [13.1] 本研究は,3つのカテゴリー法を体系的に比較することで,一般的な「LLM中心」傾向に挑戦する。
以上の結果から,BERT様モデルはLLMよりも優れていることが判明した。
そこで本稿では,LLM への一大依存に対して,タスク駆動型アプローチを提案する,きめ細かいタスク選択戦略である TaMAS を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:46:42 GMT)
Time independence does not limit information flow. II. The case with ancillas [13.0] 時間非依存ハミルトニアンの光円錐は、局所的なアンシラが許される時、時間依存系の光円錐と同じであることを示す。
我々は,対応する時間依存プロトコルと同じ実行時間で量子状態転移を近似するための時間非依存プロトコルを開発する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:00:02 GMT)
Time Independence Does Not Limit Information Flow. I. The Free-Particle Case [13.0] 我々は、任意に長い距離で制御可能な誤差で、我々のプロトコルが量子状態伝達を達成することを証明し、数値的に確認する。
これは、時間独立性は長距離自由粒子ハミルトニアンの情報フローを制限するものではないことを示している。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:00:00 GMT)
UniTTS: An end-to-end TTS system without decoupling of acoustic and semantic information [13.0] 以下の利点を総合的に提供する DistilCodec と UniTTS を提案する。
DistilCodecは、マルチコードブックオーディオを32のコードを持つシングルコードブックオーディオに蒸留し、100%近い利用率を達成する。
UniTTSは3段階のトレーニングプロセス(事前訓練、監視ファインチューニング(SFT)、アライメント)を採用している。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:13:46 GMT)
OrionBench: A Benchmark for Chart and Human-Recognizable Object Detection in Infographics [12.9] インフォグラフィックにおけるチャートとHROの正確なオブジェクト検出モデルの開発を支援するためのベンチマークであるOrionBenchを紹介する。
26250のリアルと78,750の合成インフォグラフィックがあり、690万以上のバウンディングボックスアノテーションがある。
3つの応用を通してOrionBenchの有用性を実証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:56:07 GMT)
Resolving Conflicting Evidence in Automated Fact-Checking: A Study on Retrieval-Augmented LLMs [12.9] 本稿では,ファクトチェックのためのRAGモデルを初めて体系的に評価する。
実験では、最先端のRAG手法、特にメディアソースの信頼性の違いに起因する紛争の解決において、重大な脆弱性が明らかにされている。
以上の結果から,情報源の信頼性を効果的に取り入れることで,矛盾する証拠を解決し,事実確認性能を向上させるRAGモデルの能力が著しく向上することが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:35:03 GMT)
NileChat: Towards Linguistically Diverse and Culturally Aware LLMs for Local Communities [12.9] 本研究は,特定のコミュニティに適した,合成および検索に基づく事前学習データを作成する手法を提案する。
我々はエジプト語とモロッコ語の方言をテストベッドとして使用し、言語的・文化的豊かさから選択した方法論を実証した。
我々はエジプトとモロッコのコミュニティに適応した3BパラメータであるNileChatを開発し、それらの言語、文化遺産、価値観を取り入れた。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:18:40 GMT)
ELSPR: Evaluator LLM Training Data Self-Purification on Non-Transitive Preferences via Tournament Graph Reconstruction [12.8] 低品質のトレーニングデータは、評価器LLMによって生成される好みの推移性を低下させる可能性がある。
非透過性の定量化とグラフ構造エントロピーの導入により、嗜好の全体的明瞭度を測定する。
実験により、フィルタデータで微調整されたモデルでは、非透過性は13.78%減少し、構造エントロピーは0.0879減少し、人間の評価者とより密に一致していることが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:00:03 GMT)
SVL: Spike-based Vision-language Pretraining for Efficient 3D Open-world Understanding [12.8] スパイキングニューラルネットワーク(SNN)は3次元時間的理解を抽出するエネルギー効率の良い方法を提供する。
既存のSNNは、Artificial Neural Networks(ANN)と比較して、大きなパフォーマンスギャップを示している。
本稿では,オープンワールド3D理解によるSNNの学習を支援する,Spikeベースのビジョンランゲージ(SVL)事前学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:41:10 GMT)
A Position Paper on the Automatic Generation of Machine Learning Leaderboards [12.7] 機械学習(ML)研究における重要な課題は、MLのリーダーボードを通じて実行される以前の作業を比較することである。
この負担を軽減するために、研究者は研究論文からリーダーボードエントリを抽出する方法を開発した。
しかし、事前の作業は、問題フレーミング、比較の複雑化、現実の応用可能性の制限などによって異なる。
本稿では,ALGタスクの定義方法の標準化を目的とした,ALG統合概念フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:46:10 GMT)
Efficient Uncertainty Estimation via Distillation of Bayesian Large Language Models [12.7] 本稿では,不確実性推定のためのテスト時間サンプリングの必要性を解消する可能性を検討する。
既成のベイズ式LLMを非ベイズ式LLMに蒸留し, 予測分布のばらつきを最小限に抑える。
実験により,トレーニングデータにおける不確実性推定能力は,未確認テストデータにうまく一般化できることが実証された。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:24:43 GMT)
Model Editing with Graph-Based External Memory [12.7] 本稿では,双曲的幾何とグラフニューラルネットワークを利用して,高精度で安定したモデル編集を行う新しいフレームワークを提案する。
CounterFact, CounterFact+, MQuAKE with GPT-J and GPT2-XL 実験はHYPEが編集安定性、事実精度、マルチホップ推論を著しく向上させることを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:57:51 GMT)
Continually Self-Improving Language Models for Bariatric Surgery Question--Answering [12.7] 本稿では,リアルタイムな医学的証拠を自律的に統合する適応型検索拡張生成モデルであるbRAGgenを紹介する。
また,bRAGqは1,302例の手術関連質問項目を収集し,専門的外科医による検証を行った。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:47:03 GMT)
MediaSpin: Exploring Media Bias Through Fine-Grained Analysis of News Headlines [12.6] 本研究は、メディアSpinデータセットを導入し、報道機関が出版後ニュースの見出しを編集する際のバイアスを最初に特徴付ける。
本稿では,バイアス予測やユーザの行動分析に利用できる言語的洞察について論じる。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:07:31 GMT)
Stable Object Placement Planning From Contact Point Robustness [12.6] 我々のプランナーはまず接触点を選択し、次に選択した点をソリケートする配置ポーズを決定する。
本アルゴリズムは, 物体形状, 凸性, 質量密度の均一性に制約を加えることなく, 安定性を考慮した物体配置計画を容易にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:19:40 GMT)
Large language model as user daily behavior data generator: balancing population diversity and individual personality [12.5] 本稿では,大規模言語モデルを用いて高品質な合成行動データを生成するフレームワークであるBehavimentGenを紹介する。
プロファイルと実際のイベントに基づいてユーザの振る舞いをシミュレートすることで、BehavimentGenは行動予測モデルにおけるデータ拡張と置換をサポートする。
我々は,その性能を,強化,微調整,微調整などのシナリオで評価し,人間の移動性やスマートフォン利用予測の大幅な改善を実現した。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:22:09 GMT)
Enhancing Robustness in Large Language Models: Prompting for Mitigating the Impact of Irrelevant Information [12.3] GSMIRという無関係情報を含む小学校数学問題のデータセットを構築した。
LLMは無関係な情報を識別できるが、一度特定されると引き起こされる干渉を効果的に軽減しない。
無関係な情報の影響を識別し、自己緩和するLSMの能力を高める新しい自動構築手法であるATFを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:23:26 GMT)
MeNTi: Bridging Medical Calculator and LLM Agent with Nested Tool Calling [12.2] 大規模言語モデル(LLM)のための汎用エージェントアーキテクチャであるMeNTiを紹介する。
MeNTiは特殊な医療ツールキットを統合し、メタツールとネスト呼び出し機構を使用してLSMツールの利用を促進する。
計算機シナリオの臨床過程におけるLCMの定量的評価能力を評価するために,CalcQAを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:21:04 GMT)
SplatCo: Structure-View Collaborative Gaussian Splatting for Detail-Preserving Rendering of Large-Scale Unbounded Scenes [12.0] 複雑な屋外環境の高忠実性レンダリングのための構造ビュー協調型ガウススプレイティングフレームワークであるSplatCoを提案する。
SplatCoは1-2dBのPSNR改善と0.1~0.2のSSIM向上により、最先端の手法よりも常に高い再現品質を達成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:27:12 GMT)
Graph Style Transfer for Counterfactual Explainability [12.0] グラフ逆スタイル転送(GIST)は,グラフ反事実生成をバックトラッキングプロセスとして再定義する最初のフレームワークである。
GISTは8つのバイナリおよびマルチクラスグラフ分類ベンチマークでテストされ、生成した偽物の有効性が7.6%向上した。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:46:01 GMT)
M-learner:A Flexible And Powerful Framework To Study Heterogeneous Treatment Effect In Mediation Model [12.0] 異種間接および全治療効果を推定するための新しい手法 M-learner を提案する。
私たちの知る限りでは、メディエーションの存在下での治療効果の不均一性を捉えるために特別に設計された最初のアプローチである。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:57:23 GMT)
AnimeDL-2M: Million-Scale AI-Generated Anime Image Detection and Localization in Diffusion Era [11.9] 手描きアートワークとしてのAI生成画像の誤表現は、アニメコミュニティや業界に深刻な脅威をもたらす。
本稿では,アニメIMDLの包括的なアノテーションを用いた大規模ベンチマークであるAnimeDL-2Mを提案する。
また,アニメ映像の視覚的特徴に合わせた新しいモデルAniXploreを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:00:26 GMT)
Beyond Demonstrations: Dynamic Vector Construction from Latent Representations [11.9] In-Context derived Vector (ICV)メソッドは、大きな言語モデル(LLM)からタスク関連表現を抽出し、推論中に再注入する。
DyVecは、推論時タスク適応のための軽量でデータ効率のソリューションを提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:13:50 GMT)
Benchmark for Antibody Binding Affinity Maturation and Design [11.9] AbBiBenchは、抗体結合親和性成熟と設計のためのベンチマークフレームワークである。
まず、9つの抗原を含む9つのデータセットをキュレートし、標準化し、共有する。
マスク付き言語モデル、自己回帰言語モデル、逆折り畳みモデル、拡散ベース生成モデル、幾何学グラフモデルを含む14のタンパク質モデルを比較した。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:09:04 GMT)
SteerConf: Steering LLMs for Confidence Elicitation [11.9] 大規模言語モデル(LLM)は、様々な領域で素晴らしいパフォーマンスを示すが、しばしば過剰な自信に悩まされる。
本稿では,LCMの信頼性スコアを体系的に評価し,キャリブレーションと信頼性を向上させる新しいフレームワークであるSteerConfを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:17:28 GMT)
Neural Network Assisted Fermionic Compression Encoding: A Lossy-QSCI Framework for Scalable Quantum Chemistry Simulations [11.8] 量子コンピューティングは、量子化学の多体シミュレーションに革命をもたらすが、そのポテンシャルは現在のデバイスにおける限られた量子ビットとノイズによって制限されている。
本稿では、ロッシー量子選択構成相互作用(Lossy-QSCI)フレームワークについて紹介する。
このフレームワークは、化学にインスパイアされた損失ランダム線形パイプラインとニューラルネットワークによるフェルミオン期待デコーダ(NN-FED)を統合する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:00:16 GMT)
Curriculum Guided Reinforcement Learning for Efficient Multi Hop Retrieval Augmented Generation [11.8] EVO-RAGはカリキュラムによる強化学習フレームワークである。
クエリ書き換えエージェントを、幅広い初期段階の探索から簡潔な後期改良へと進化させる。
厳格なRAGベースラインを4.6ポイントまで上回り、平均検索深度を15%まで下げる。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:01:15 GMT)
Twin-2K-500: A dataset for building digital twins of over 2,000 people based on their answers to over 500 questions [11.8] LLMベースのデジタルツインシミュレーションは、AI、社会科学、デジタル実験の研究に大いに貢献する。
我々は、米国におけるN = 2,058$参加者(平均2.42時間)の代表サンプルを、合計500の質問を含む4つの波で調査した。
最初の分析では、データは高品質であることが示唆され、個人と集合レベルでの人間の振る舞いを良く予測するデジタルツインの構築が約束されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:05:11 GMT)
Accelerating Learned Image Compression Through Modeling Neural Training Dynamics [11.7] 本稿では,ニューラルトレーニングのダイナミクスをモデル化することにより,licメソッドのトレーニングを高速化する。
本稿ではまず,モデルパラメータを少数のモードにクラスタリングする感性認識型True and Dummy Embedding Training(STDET)を提案する。
さらに、トレーニングとパラメータ感性を通じて安定したモード内相関を利用して、非参照パラメータを徐々に埋め込んで、トレーニング可能なパラメータの数を減らした。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:03:13 GMT)
CAS-IQA: Teaching Vision-Language Models for Synthetic Angiography Quality Assessment [11.5] 低品質の合成血管造影は、手続き的リスクを著しく増大させる。
本稿では,視覚言語モデル(VLM)に基づく細粒度品質スコア予測フレームワークであるCAS-IQAを提案する。
CAS-3Kデータセットの実験では、CAS-IQAは最先端のIQA法よりもかなり優れていた。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:27:05 GMT)
Seeing It or Not? Interpretable Vision-aware Latent Steering to Mitigate Object Hallucinations [11.5] LVLM(Large Vision-Language Models)は目覚ましい成功を収めているが、物体幻覚(OH)との闘いは続いている。
本稿では,LVLMにおけるOHに対処する解釈的緩和戦略を採用した視覚対応遅延ステアリングフレームワークであるVaseを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:29:00 GMT)
DesignX: Human-Competitive Algorithm Designer for Black-Box Optimization [11.5] 我々は,与えられたブラックボックス最適化問題に対して,数秒以内に効果的な特定性を生成する,最初の自動アルゴリズム設計フレームワークであるDesignXを提案する。
数十年にわたる研究から収集された数百のアルゴリズムコンポーネントを取り入れた、包括的なモジュラーアルゴリズム空間が最初に構築された。
注目すべきは、自律的な学習の日々を通じて、DesignXで生成されたメタトレーニングが、人間の作ったデザインを上回っていることだ。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:16:01 GMT)
Lost in the Haystack: Smaller Needles are More Difficult for LLMs to Find [11.4] 大規模言語モデル(LLM)は、無関係なコンテキストの大きなプールから関連する情報を引き出す必要があるため、ニードル・イン・ア・ヘイスタックタスクで課題に直面します。
これまでの研究では、モデル性能に影響を及ぼす重要な要因として、位置バイアスと乱れ量を強調してきた。
金の文脈長の変化が長文質問応答タスクにおけるLLM性能に与える影響について検討する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:57:42 GMT)
TULiP: Test-time Uncertainty Estimation via Linearization and Weight Perturbation [11.3] OOD検出のための理論駆動型不確実性推定器TULiPを提案する。
本手法では,収束前にネットワークに適用される仮説的摂動を考察する。
提案手法は,特に近分布試料について,最先端の性能を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:47:03 GMT)
MIDB: Multilingual Instruction Data Booster for Enhancing Multilingual Instruction Synthesis [11.3] 我々は,多言語合成データの品質問題に対処するために,多言語命令データブースターMIDBを提案する。
MIDBは16言語にわたる36.8kの改訂例で、人間の言語専門家によって訓練されている。
自動評価と人的評価は、MIDBが16言語での命令データ品質を着実に改善していることを示している。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:37:10 GMT)
"Reasoning" with Rhetoric: On the Style-Evidence Tradeoff in LLM-Generated Counter-Arguments [11.2] 大規模言語モデル(LLM)はエビデンスベースでスタイリスティックな反論を生成する上で重要な役割を果たしている。
これまでの研究では、明白さとスタイルのバランスを無視することがしばしばあり、これは説得力のある議論に不可欠である。
提案手法の有効性を検証し,38,000の正答率からなる新しいデータセットであるCounterfireにおける正答率を用いた正答率生成の有効性を検討した。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:44:41 GMT)
Streaming Attention Approximation via Discrepancy Theory [11.2] 本稿では,重要計算の基本となるトークン生成である注目近似のストリーミング複雑性について検討する。
主なコントリビューションは、アテンション計算を$epsilon$-approximating するストリーミングアルゴリズムである BalanceKV です。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:34:40 GMT)
Cell Library Characterization for Composite Current Source Models Based on Gaussian Process Regression and Active Learning [11.2] 高精度な要求、大量のデータ、広範囲なシミュレーションコストは、CCSの特徴付けに深刻な課題をもたらす。
本稿では,アクティブラーニング(AL)を用いた新しいガウスプロセス回帰(GPR)モデルを導入し,評価フレームワークを効率的かつ正確に構築する。
提案手法は, 平均絶対誤差2.05 ps, 電流波形2.27%, 電圧, 温度 (PVT) 角, TSMC 22nm 角に対して平均絶対誤差2.05 ps, 相対誤差2.27%を達成し, 従来の商用ツール, 学習ベースアプローチよりも優れていた。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:18:26 GMT)
On the Impact of the Utility in Semivalue-based Data Valuation [11.2] 半値に基づくデータ評価は、協調ゲーム理論の直観を用いて、各データポイントを下流タスクへの貢献を反映した値に割り当てる。
ユーティリティの変更に対して、半値ベースのデータバリュエーションはどの程度堅牢か?
本稿では,実用性の変化に伴ってデータ評価結果がどの程度変化するかを実践者に知らせる,明示的な堅牢度尺度を中心とした実践的方法論を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:42:28 GMT)
PASER: Post-Training Data Selection for Efficient Pruned Large Language Model Recovery [11.2] インストラクションチューニングなどのポストトレーニング技術は、一般的にモデル性能の回復に使用される。
しかし、いくつかの無関係な命令は、モデルのキャパシティ回復に悪影響を及ぼす可能性がある。
textbfPost-training dtextbfAta textbfSelection method for textbfEfficient pruned large language model textbfRecovery (textbfPASER)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:20:09 GMT)
Flashback: Memory-Driven Zero-shot, Real-time Video Anomaly Detection [11.2] Flashbackはゼロショットおよびリアルタイムビデオ異常検出パラダイムである。
異常を即座に判断する人間の認知メカニズムにインスパイアされたFlashbackは、RecallとRespondの2つの段階で動作する。
推論時にすべてのLSMコールを削除することで、FlashbackはコンシューマグレードのGPU上でもリアルタイムのVADを提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:54:21 GMT)
Collaborative Memory: Multi-User Memory Sharing in LLM Agents with Dynamic Access Control [11.1] Collaborative Memoryは、非対称で時間進化するアクセス制御を持つマルチユーザ、マルチエージェント環境のためのフレームワークである。
我々のフレームワークは、非対称で時間的変化のあるポリシーを順守し、安全で効率的かつ解釈可能なクロスユーザー知識共有を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:14:57 GMT)
Superconducting qubit readout enhanced by path signature [11.1] 量子非破壊測定は量子技術において重要な役割を果たす。
本稿では,この測定記録の「パスシグネチャ」を考慮した読み出し精度の向上手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:51:46 GMT)
Chart-to-Experience: Benchmarking Multimodal LLMs for Predicting Experiential Impact of Charts [11.0] 我々は,36のチャートからなるベンチマークデータセットであるChart-to-Experienceを導入し,クラウドソーシング作業者が7つの実験要因に与える影響を評価した。
このデータセットを基礎的真理として用いて、2つのタスク(直接予測とグラフのペアワイズ比較)で最先端MLLMの能力を評価した。
その結果,MLLMは個々のチャートを評価する際,人間の評価値ほど敏感ではないが,相互比較では正確で信頼性が高いことが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:12:57 GMT)
Thought calibration: Efficient and confident test-time scaling [11.0] 大きな言語モデルを推論することで、長いこと考えることで、素晴らしいテスト時間のスケーリングを実現しますが、このパフォーマンス向上は、かなりの計算コストを伴います。
思考終了時の動的決定を動的に行うための思考校正を提案する。
このフレームワークは,言語モデルに隠された表現をベースとした軽量なプローブによって実現されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:17:18 GMT)
Over-Tokenized Transformer: Vocabulary is Generally Worth Scaling [11.0] 本稿では,言語モデリング性能を向上させるために,入力語彙と出力語彙を分離するフレームワークであるOver-Tokenized Transformersを紹介する。
入力語彙サイズとトレーニング損失の関係を明らかにすることで,より大きな入力語彙がモデル性能を継続的に向上することを示す。
本研究は, スケーリング法則におけるトークン化の重要性を強調し, トークン化設計の実践的洞察を提供するものである。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:32:07 GMT)
MODEM: A Morton-Order Degradation Estimation Mechanism for Adverse Weather Image Recovery [11.0] 悪天候画像復元のためのMODEM(Morton-Order Degradation Estimation Mechanism)を提案する。
ModeMは、モートン符号化された空間秩序と選択的な状態空間モデルを統合して、長距離依存関係をキャプチャする。
本稿では,大域的・局所的な劣化事前を分離・推定するDual Degradation Estimation Module(DDEM)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:43:14 GMT)
TopoPoint: Enhance Topology Reasoning via Endpoint Detection in Autonomous Driving [10.9] TopoPointは、堅牢なトポロジ推論のための、エンドポイントとレーンに対する共同理由を明示的に検出する新しいフレームワークである。
トレーニング中、ポイントとレーンクエリを独立に初期化し、グローバルなコンテキスト共有を強化するためにポイントレーン自己認識を提案する。
推定において,検出された点と車線間の距離を計算し,車線終点の精密化を行う点-車線幾何マッチングアルゴリズムを導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:42:54 GMT)
TRACE for Tracking the Emergence of Semantic Representations in Transformers [10.8] 本稿では,トランスフォーマーに基づくLMにおける位相遷移を検出するために,幾何学的,情報的,言語的信号を組み合わせた診断フレームワークTRACEを紹介する。
実験により、位相遷移は曲率崩壊と寸法安定化の明確な交点と一致し、これらの幾何学的シフトは、新たな構文的および意味論的精度と一致することが明らかになった。
この研究は、モデル解釈可能性、訓練効率、構成一般化に関する洞察を提供することで、言語的抽象がLMにどのように現れるかの理解を深める。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:03:51 GMT)
FreshRetailNet-50K: A Stockout-Annotated Censored Demand Dataset for Latent Demand Recovery and Forecasting in Fresh Retail [10.8] 我々は、検閲された需要推定のための最初の大規模ベンチマークであるFreshRetailNet-50Kを紹介する。
主要18都市の898店舗から、在庫イベントに微妙に注釈付けされたSKU683店舗を含む5万件の店舗・商品販売データで構成されている。
予測精度は2.73%向上し、体系的な需要過小評価を7.37%からほぼゼロに近いバイアスに下げる。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:27:29 GMT)
Is It Bad to Work All the Time? Cross-Cultural Evaluation of Social Norm Biases in GPT-4 [10.7] GPT-4は必ずしも正しくないが、文化に特有な基準を生じる傾向にある。
ステレオタイプを過度に生成することを避けるが、特定の文化のステレオタイプ表現はモデルで抑制されるのではなく単に隠されているだけである。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:28:00 GMT)
Does Chain-of-Thought Reasoning Really Reduce Harmfulness from Jailbreaking? [10.6] ジェイルブレイク攻撃は、Chain-of-Thought(CoT)推論によって強化された最近の推論モデルに対して、主に失敗することが観察されている。
本稿では,CoT推論は脱獄による有害性を本当に減少させるのか,という疑問に答えようとしている。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:14:48 GMT)
Dynamic Dual Buffer with Divide-and-Conquer Strategy for Online Continual Learning [10.6] オンライン連続学習(OCL)は、バッチからバッチまでのオンラインフォーマットで新しいデータが到着する複雑な学習環境を提供する。
本稿では、動的情報を保持するための短期記憶システムと、永続的な知識をアーカイブする長期記憶システムを組み込んだ革新的なメモリフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:57:04 GMT)
DECT-based Space-Squeeze Method for Multi-Class Classification of Metastatic Lymph Nodes in Breast Cancer [10.6] 本研究は,マルチクラス分類改善のためのスペクトル空間情報を活用するために,デュアルエネルギー計算トモグラフィを利用する。
本研究では,(1)スペクトル空間の特徴を11つのエネルギーレベルにわたって圧縮・再検討するチャネルワイドアテンション機構,(2)クラス間境界を鋭くするための仮想クラスインジェクションの2つのイノベーションを組み合わせた新しい空間スクイーズ手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:35:18 GMT)
LookWhere? Efficient Visual Recognition by Learning Where to Look and What to See from Self-Supervision [10.5] 視覚変換器はより大きく、より正確で、計算に費用がかかる。
我々は、このコストに対応するために適応計算に切り替え、計算の場所を予測することを学習する。
我々のLookWhere法は,高分解能入力を処理せずに,低分解能セレクタと高分解能抽出器を分割する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:56:35 GMT)
TrendFact: A Benchmark for Explainable Hotspot Perception in Fact-Checking with Natural Language Explanation [10.4] 我々は、最初のホットスポット認識事実チェックベンチマークであるTrendFactを紹介する。
TrendFactは、トレンドプラットフォームとプロのファクトチェックデータセットから得られた、7,643の慎重にキュレートされたサンプルで構成されている。
本研究では,動的エビデンス増大,エビデンス三角測量,反復的自己回帰機構を統合したFactISRを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:31:01 GMT)
RedactOR: An LLM-Powered Framework for Automatic Clinical Data De-Identification [10.4] 構造化および非構造化の電子健康記録を識別するための完全に自動化されたフレームワークであるRedactorを提案する。
当社のフレームワークでは,インテリジェントルーティングやハイブリッドルール,LLMベースのアプローチなど,コスト効率の高いDe-ID戦略を採用している。
本稿では,保護されたエンティティの一貫した置換を保証するために,検索に基づくエンティティリラクシゼーション手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:13:18 GMT)
LoRE-Merging: Exploring Low-Rank Estimation For Large Language Model Merging [10.3] 基本モデルであるtextscLoRE-Merging へのアクセスを必要とせず,タスクベクトルの低ランク推定に基づくモデルマージのための統一フレームワークを提案する。
我々のアプローチは、細調整されたモデルからのタスクベクトルは、しばしば支配的な特異値の限られた数しか示さず、低ランク推定が干渉しにくくなるという観察に動機づけられている。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:44:56 GMT)
In-Context Learning of Linear Systems: Generalization Theory and Applications to Operator Learning [10.3] 本稿では,線形変圧器アーキテクチャを用いて,コンテキスト内で線形系を解くための理論的保証について検討する。
ドメイン内一般化のために、トレーニングや推論に使用されるサンプルのタスク数とサイズで一般化誤差を束縛するニューラルネットワークスケーリング法則を提供する。
領域外一般化では、タスク分布シフトによるトレーニングされたトランスフォーマーの挙動が、トレーニング中に見られるタスクの分布に大きく依存していることが分かる。
論文参考訳(メタデータ) (Fri, 23 May 2025 23:35:35 GMT)
Prototypical Human-AI Collaboration Behaviors from LLM-Assisted Writing in the Wild [10.2] 大規模言語モデル(LLM)は、複雑な記述において、ニーズに合うように世代を操るために使用される。
本研究では,タスク作成に携わるユーザを対象に,この協調行動の大規模分析を行う。
そこで本研究では,LLMとユーザが対話する際の特徴的行動の同定を行った。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:04:18 GMT)
CGS-GAN: 3D Consistent Gaussian Splatting GANs for High Resolution Human Head Synthesis [10.2] 3次元ガウススプラッティングに基づく3次元GANは、人間の頭部の高品質な合成のために提案されている。
既存の方法は、現在のカメラ位置でランダム潜伏ベクトルを条件にすることにより、トレーニングを安定させ、急な視点からレンダリング品質を向上させる。
ビューコンディショニングを必要とせずに、安定した訓練と高品質な頭部合成を可能にする新しい3DガウススプラッティングGANフレームワークであるCGS-GANを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:56:25 GMT)
FastCAV: Efficient Computation of Concept Activation Vectors for Explaining Deep Neural Networks [10.2] 概念活性化ベクトル(Concept Activation Vectors, CAV)は、モデルが概念を学んだかどうかを識別する。
FastCAVは、CAVの抽出を最大63.6倍(平均46.4倍)加速する新しいアプローチである。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:31:54 GMT)
Counting Cycles with Deepseek [10.1] サイクル数統計量に対して計算的に効率的な等価形式(CEEF)を導出する方法。
提案する新しいアプローチと,その問題を解決するためのAIの強力なコーディングスキルを組み合わせる。
AIは、この問題を解決できないが、明確な戦略、ステップバイステップのガイダンス、慎重に書かれたプロンプトを提供しれば、それを解決できる。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:34:40 GMT)
Manipulating Elasto-Plastic Objects With 3D Occupancy and Learning-Based Predictive Control [10.1] 本研究は,運動の準静的仮定を用いた弾塑性物体操作のための新しい枠組みを提案する。
これらの課題を効果的に解決するために,我々は3D占有率を利用して表現する学習力学モデル,3D占有率で訓練された学習力学モデル,学習に基づく予測制御アルゴリズムを活用する。
提案フレームワークは, 弾塑性物体を所定の目標形状に整形し, シミュレーションと実世界の両方で様々な実験を行った。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:16:57 GMT)
Conversations: Love Them, Hate Them, Steer Them [10.0] 大きな言語モデル (LLMs) は会話の流布を増大させるが、人間のようなニュアンスな感情表現でそれらを注入することは大きな課題である。
本稿では,LLaMA 3.1-8Bにより,より人間らしく感情的なニュアンスを示すことができることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:58:45 GMT)
Architectural Backdoors for Within-Batch Data Stealing and Model Inference Manipulation [10.0] 建築用バックドアの最近の進歩を基盤とした,新しいバックドアのクラスを紹介する。
このような攻撃は実現可能であるだけでなく、危険なほど効果的であることを示す。
本稿では,この新たな攻撃ベクトルに対する正式な保証を提供する決定論的緩和戦略を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:28:45 GMT)
PMOA-TTS: Introducing the PubMed Open Access Textual Times Series Corpus [9.9] PMOA-TTSは124,699の注釈付きPubMed Open Accessケースレポートの最初の公開データセットである。
Llama 3.3にフィルターを併用し, 単発症例の報告を同定し, 即時抽出を行った。
タイムラインの質を評価するために,3つの指標を用いてクリニカル・カレード・リファレンス・セットに対して評価を行った。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:01:09 GMT)
Teaching with Lies: Curriculum DPO on Synthetic Negatives for Hallucination Detection [9.8] 幻覚標本は、通常、従来の陰性試料よりも高い知覚品質を示す。
DPOアライメント法では,これらの注意深い幻覚を否定的な例として用いている。
本手法はカリキュラム学習戦略を取り入れ,より簡単なサンプルからより難しいものへ段階的に学習を移行させる。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:05:09 GMT)
MMXU: A Multi-Modal and Multi-X-ray Understanding Dataset for Disease Progression [9.7] MedVQAのための新しいデータセットであるMMXUを導入する。
シングルイメージの質問に主に対処する以前のデータセットとは異なり、MMXUは現在の患者データと歴史的な患者データの両方を取り入れたマルチイメージの質問を可能にする。
実験の結果,過去の記録の統合は診断精度を少なくとも20%向上させ,現在のLVLMと人的専門家のパフォーマンスのギャップを埋めることを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:05:50 GMT)
Small Language Models in the Real World: Insights from Industrial Text Classification [9.7] ChatGPTは、テキスト分類と関連するタスクが大幅に進歩している。
より小さな言語モデルがテキスト分類タスクを効果的に扱えるかどうかという問題は、重要な関心事として浮上する。
本研究は,トランスフォーマーを用いたテキスト分類のための,プロンプトエンジニアリングと教師付き微調整手法の総合評価を行う。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:49:10 GMT)
SOCIA: An End-to-End Agentic Framework for Automated Cyber-Physical-Social Simulator Generation [9.7] SOCIA(Simulation Orchestration for Cyber-physical-social Intelligence and Agents)は、LLM(Large Language Model)ベースのマルチエージェントシステムを活用した新しいエンドツーエンドフレームワークである。
高忠実なサイバー物理社会(CPS)シミュレータを自動生成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:30:42 GMT)
A Wavelet-based Stereo Matching Framework for Solving Frequency Convergence Inconsistency [9.7] 周波数収束不整合を解消するためのウェーブレットベースのステレオマッチングフレームワーク(ウェーブレット・ステレオ)を提案する。
高周波数成分と低周波成分を別々に処理することで、我々は、エッジにおける高周波情報とスムーズな領域における低周波情報を同時に洗練することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:28:03 GMT)
AI-Augmented LLMs Achieve Therapist-Level Responses in Motivational Interviewing [9.6] 大規模言語モデル(LLM)は中毒治療における動機付け面接(MI)のスケーリングの可能性を示す。
本稿では,ユーザ認識品質(UPQ)を評価するための計算フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:33:04 GMT)
Reinforcement Speculative Decoding for Fast Ranking [9.6] 大規模言語モデル (LLM) は情報検索 (IR) システムやレコメンダシステム (RS) などのランキングシステムで広く採用されている。
LLMの高速ランキング推定のための強化復号法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:25:26 GMT)
CoMet: Metaphor-Driven Covert Communication for Multi-Agent Language Games [9.6] CoMetは、大規模言語モデル(LLM)が言語ゲームでメタファを解釈し、適用できるようにするフレームワークである。
我々はCoMetを2つのマルチエージェント言語ゲーム、UndercoverとAdrial Tabooで評価する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:23:54 GMT)
Personality Editing for Language Models through Relevant Knowledge Editing [9.6] 大きな言語モデル(LLM)は会話エージェントやコンテンツ生成といったアプリケーションにおいて重要な役割を果たす。
本稿では,知識編集によるパーソナリティ制御を向上する新しいPALETTEを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:09:17 GMT)
SecurePay: Enabling Secure and Fast Payment Processing for Platform Economy [9.5] 本稿では,プラットフォーム経済のためのセキュアかつ高性能な決済処理システムSecurePayを紹介する。
SecurePayは、認可されたブロックチェーンと中央銀行デジタル通貨(CBDC)を組み合わせて、資金のセキュリティ、情報セキュリティ、仲介者による共謀に対する抵抗を保証する。
パーソナルデバイスでの実験では、毎秒256.4トランザクションのスループット、平均遅延は4.29秒である。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:47:25 GMT)
Recent Deep Learning in Crowd Behaviour Analysis: A Brief Review [9.5] 群衆の行動分析は、公共の安全や都市計画など、多くの現実世界の応用に不可欠である。
深層学習の発展は、群衆行動の研究を著しく促進した。
本章は,群集行動分析における現在進行中の深層学習研究の高レベルな要約を提供することを目的としている。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:08:35 GMT)
ADLGen: Synthesizing Symbolic, Event-Triggered Sensor Sequences for Human Activity Modeling [9.5] ADLGenは、リアル、イベントトリガー、およびシンボリックセンサーシーケンスを合成するために設計された生成フレームワークである。
ADLGenは、統計的忠実度、セマンティックリッチネス、下流活動認識の検証において、ベースラインジェネレータよりも優れている。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:52:48 GMT)
Towards VM Rescheduling Optimization Through Deep Reinforcement Learning [9.4] 我々は,VM再スケジュールのための強化学習システムVM2RLを開発した。
その結果,VM2RLは最適解に匹敵する性能を達成できるが,実行時間は数秒であることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:30:53 GMT)
Hypergraph Tversky-Aware Domain Incremental Learning for Brain Tumor Segmentation with Missing Modalities [9.4] 臨床実践では、MRI 取得の逐次的な性質のため、MRI のモダリティが欠落している場合もある。
Replay-based Hypergraph Domain Incremental Learning (ReHyDIL) を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:55:45 GMT)
Capacity-Aware Inference: Mitigating the Straggler Effect in Mixture of Experts [9.4] 専門家の並列性の下では、Mixture of Experts (MoE) は不均衡なトークン・ツー・エキスパートの割り当てによる推論の非効率さに悩まされる。
オーバーロードされた専門家から過剰なトークンを廃棄することで、専門家の能力制限を強制するtextittextbfCapacity-Aware Token Dropを提案する。
textittextbfCapacity-Aware Expanded Dropも導入しています。トークンは、厳格なローカルキャパシティ制約を実施する前に、候補セットに追加のローカルエキスパートを含めることができます。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:33:27 GMT)
Baitradar: A Multi-Model Clickbait Detection Algorithm Using Deep Learning [9.3] BaitRadarはディープラーニング技術を使って最終分類を決定する。
平均テスト精度は98%で、推定時間は2秒未満である。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:08:55 GMT)
It is Giving Major Satisfaction: Why Fairness Matters for Software Practitioners [9.3] 本研究は,ソフトウェア実践者の仕事満足度に対する公正感の関連について検討する。
調査の結果,4つの公正度は全体の仕事の満足度と仕事のセキュリティに対する満足度に有意な影響を及ぼすことがわかった。
フェアネスと仕事の満足度の関係は、女性、民族的に劣る、経験の浅い実践者、仕事の制限のある者にとってより強くなっている。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:31:55 GMT)
Reenact Anything: Semantic Video Motion Transfer Using Motion-Textual Inversion [9.1] 本研究では、動きから外見を遠ざけるために、事前訓練された画像間映像モデルを提案する。
動作テキストインバージョン(Motion-textual Inversion)と呼ばれるこの手法は、画像から映像へのモデルが、主に(相対的な)画像入力から外観を抽出する、という観察を生かしている。
フレームごとの複数のテキスト/画像埋め込みトークンを含むインフレーションされたモーションテキスト埋め込みを操作することにより、高時間運動粒度を実現する。
動作参照ビデオと対象画像の空間的アライメントを必要とせず,様々な領域にまたがって一般化し,フルボディや顔再現といった様々なタスクに適用することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:07:14 GMT)
Integrating Random Forests and Generalized Linear Models for Improved Accuracy and Interpretability [9.1] 我々はRF+と呼ばれるフレームワークを用いて、RFの強みと一般化線形モデルの強さを組み合わせる。
RF+はRFよりも予測精度を向上し、MDI+は信号の特徴を特定する上での一般的な特徴重要度よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:52:12 GMT)
Parametric excitations in a harmonically trapped binary Bose-Einstein condensate [9.1] 本研究では, 2成分系ボース・アインシュタイン凝縮体におけるパターン形成について検討した。
スピン依存のファラデーパターンは、相外密度振動を示す2つの成分で生成することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:52:45 GMT)
Efficient Algorithms for Electing Successive Committees [9.1] 最近導入された連続委員会選挙のモデルでは、与えられた「最高の」同規模の委員会を列挙することを目的としている。
しかし、この課題は、既に3つの大きさの委員会を探すために、ほとんどの選択基準においてNPハードであることが判明した。
我々は、適度な候補数や限られた時間軸の現実的なシナリオにおいて、前述のハードケースを効果的に解決するアルゴリズムを考案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:32:14 GMT)
Power-Law Decay Loss for Large Language Model Finetuning: Focusing on Information Sparsity to Enhance Generation Quality [9.1] 本稿では,テキスト生成のための微調整処理を最適化する新しい損失関数Power-Law Loss Decay (PDL)を提案する。
PDLは、標準のクロスエントロピー損失における各トークンの寄与を再重み付けする。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:27:02 GMT)
CXReasonBench: A Benchmark for Evaluating Structured Diagnostic Reasoning in Chest X-rays [9.1] 我々はCheXStructとCXReasonBenchを紹介した。CheXStructはMIMIC-CXR-JPGデータセット上に構築された構造化パイプラインとベンチマークである。
CheXStructは、自動的に胸部X線から直接中間的推論ステップを導出する。
CXReasonBenchはこのパイプラインを利用して、モデルが臨床的に有効な推論ステップを実行可能であるかどうかを評価する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:44:21 GMT)
The Cell Must Go On: Agar.io for Continual Reinforcement Learning [9.0] 継続的な強化学習(RL)は、評価のために固定されたポリシーに収束するのではなく、継続的に学習することが期待されるエージェントに関するものである。
AgarCLは連続RLのための研究プラットフォームであり、より洗練された行動の進行を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:09:27 GMT)
Contrastive Distillation of Emotion Knowledge from LLMs for Zero-Shot Emotion Recognition [9.0] 本研究では,大規模言語モデルからコンパクトなモデルへ,豊かな感情的知識を伝達するコントラスト蒸留フレームワークを提案する。
我々は、GPT-4を使って記述的な感情アノテーションを生成し、固定されたラベルセットを超えてリッチな監視を提供する。
このモデルは複数のデータセットやラベル空間で有効であり、同じ大きさの強いベースラインを上回り、GPT-4のゼロショット性能に近づいた。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:44:26 GMT)
Out of the Shadows: Exploring a Latent Space for Neural Network Verification [9.0] 本稿では, 分岐・束縛手順におけるサブプロブレム数を大幅に削減するために, 繰り返し改良を用いたニューラルネットワークの効率的な検証ツールを提案する。
当社のツールは,前回のニューラルネットワーク検証コンペで上位のツールに位置づけられるような,競争力のあるパフォーマンスを実現していることを実証しています。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:05:07 GMT)
EMT: A Visual Multi-Task Benchmark Dataset for Autonomous Driving [9.0] Emirates Multi-Taskデータセットは、統一されたフレームワーク内でマルチタスクのベンチマークをサポートするように設計されている。
ダッシュカメラの視界から3万枚以上のフレームと570,000点の注釈付きバウンディングボックスで構成され、約150kmの走行経路をカバーしている。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:30:11 GMT)
ThinkLess: A Training-Free Inference-Efficient Method for Reducing Reasoning Redundancy [9.0] ThinkLessは推論効率のよいフレームワークで、推論生成を早期に終了し、モデルを変更することなく出力品質を維持する。
我々はThinkLessが完全長のChain-of-Thought(CoT)デコードに匹敵する精度を実現し,デコード時間とメモリ消費を大幅に削減することを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:59:22 GMT)
Universal Domain Adaptation Benchmark for Time Series Data Representation [8.9] この作業は、UniDAフレームワークにおける最先端のTSバックボーンの包括的な実装と比較を提供する。
本稿では,各ドメイン間のロバスト性と一般化を評価するための信頼性の高いプロトコルを提案する。
以上の結果から, バックボーン選択がUniDA性能に与える影響が示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:47:35 GMT)
Planning-Driven Programming: A Large Language Model Programming Workflow [8.8] 大規模言語モデル(LLM)は、コード生成の強力な候補である。
近年の研究では、LCMのコード生成精度を向上させるために、可視性テストによる継続的プログラム改善が提案されている。
初期コード生成とその後の改良の両方を改善するために,LLMプログラミングワークフロー(LPW)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:26:50 GMT)
From Reasoning to Generalization: Knowledge-Augmented LLMs for ARC Benchmark [8.8] 近年の理学研究は,数学や理科試験などの課題に対して高い性能を発揮している。
抽象的推論や一般化のような人間の知能のコア認知能力はいまだ未解明のままである。
我々は,近年の推論指向LLMを抽象推論コーパスのベンチマークで評価した。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:21:14 GMT)
Why Diffusion Models Don't Memorize: The Role of Implicit Dynamical Regularization in Training [8.8] 一般化から記憶への移行におけるトレーニングダイナミクスの役割について検討する。
私たちは、$tau_mathrmmem$がトレーニングセットサイズ$n$で線形的に増加するのに対して、$tau_mathrmgen$は一定であることに気付きました。
n$がモデル依存しきい値よりも大きくなると、無限のトレーニング時間でオーバーフィットが消える。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:58:47 GMT)
Explaining Black-box Model Predictions via Two-level Nested Feature Attributions with Consistency Property [8.8] 本稿では,2段階の特徴属性を同時に推定するモデルに依存しない局所的説明法を提案する。
提案手法の重要な考え方は、HiFAとLoFAの間に存在するべき一貫性性を導入することである。
この一貫性により、提案手法は、ブラックボックスモデルに忠実であり、互いに一貫性のあるHiFAとLoFAを生成できる。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:57:41 GMT)
WiNGPT-3.0 Technical Report [8.7] 現在のLarge Language Models (LLMs) は、特に構造化、解釈可能、検証可能な医学的推論において、重大な制限を呈している。
本報告は,32ビリオンパラメータLLMであるWiNGPT-3.0の開発に焦点をあて,医学的推論能力の向上を目的としている。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:53:04 GMT)
Simpler Fast Vision Transformers with a Jumbo CLS Token [8.6] スループットを維持しながら精度を向上させるために、視覚変換器(ViT)の簡易化を導入する。
我々のアプローチであるJumboは、注意前のパッチトークン幅にマッチするように分割され、自己注意で処理され、再組み立てされる、より広いCLSトークンを生成する。
Jumboトークンは1つしかないため、そのコストは最小であり、このFFNを層間で共有するため、パラメータ数は制御される。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:36:29 GMT)
VideoGameBench: Can Vision-Language Models complete popular video games? [8.5] ビデオゲームは、人間が自然に帰納的バイアスを生かして学習し、習得するために直感的に作られている。
1990年代にVLMが直接リアルタイムに対話する人気ゲーム10種からなるベンチマークであるVideoGameBenchを紹介する。
その結果,フロンティア・ビジョン言語モデルは,ゲーム開始以降の進行に苦慮していることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:43:27 GMT)
Compression via Pre-trained Transformers: A Study on Byte-Level Multimodal Data [8.5] 我々は、事前学習したトランスフォーマーが競合圧縮比を達成できるスイートスポットを見つけるために、大規模な研究を行う。
比較的小さなパラメータは、標準的な汎用圧縮アルゴリズムより優れていることが判明した。
たとえ小さなモデルであっても、複数のモダリティでうまく機能するように訓練できるが、大規模な基礎モデルとは異なり、目に見えないモダリティへの移動は一般的に弱い。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:55:43 GMT)
Adversarial Deep Metric Learning for Cross-Modal Audio-Text Alignment in Open-Vocabulary Keyword Spotting [8.4] テキスト入力に基づくオープン語彙キーワードスポッティング(KWS)では、音響とテキストの埋め込みは通常、音素または発話レベルで比較される。
ディープ・メトリック・ラーニング(DML)を用いて音響およびテキストエンコーダを最適化し,共有埋め込み空間におけるマルチモーダル埋め込みの直接比較を可能にする。
異質なモダリティ表現における領域ギャップを低減するためのモダリティ適応学習(MAL)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:53:38 GMT)
Towards Practical Defect-Focused Automated Code Review [8.4] オンラインレコメンデーションサービスの中で、業界レベルのC++を分析しながら、完全な自動化パイプラインを調査します。
1)関連コンテキストの取得,2)キーインクルージョンの改善,3)偽アラーム率(FAR)の低減,4)人間のバグスライシングの統合。
提案手法は, 既往の断層記録からの実世界のマージ要求に基づいて検証され, 従来のLLMよりも2倍, 以前のベースラインより10倍向上した。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:06:26 GMT)
Learning Shared Representations from Unpaired Data [8.4] 共有表現は、ほとんどペアリングされていないデータから学習可能であることを示す。
コンピュータビジョンと自然言語処理領域の実証的な結果は、その可能性を支持する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:13:04 GMT)
A Coreset Selection of Coreset Selection Literature: Introduction and Recent Advances [8.3] コアセットの選択は、機械学習に不可欠なパターンを保存する大規模なデータセットの、小さくて代表的なサブセットを見つけるという課題を目標としている。
この調査は、コアセット研究の3つの主要な行を単一の分類にまとめることで、より包括的な見解を示す。
提案するサブフィールドは,部分モジュラー定式化や双レベル最適化,ラベルなしデータセットの擬似ラベル化の最近の進歩など,既存の研究によって見落とされがちである。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:18:34 GMT)
Faster Computation of Entropic Optimal Transport via Stable Low Frequency Modes [8.3] 本稿では,エントロピック最適輸送に対する解の参照手法であるシンクホーンアルゴリズムの高速化版を提案する。
ヘッセン星の挙動に関するスペクトル的な洞察により、元のスペクトルウォームスタート戦略を通じて問題を緩和することを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:39:19 GMT)
Anatomy-Guided Multitask Learning for MRI-Based Classification of Placenta Accreta Spectrum and its Subtypes [8.3] 胎盤アクレタスペクトラム障害(PAS)は妊娠中に重大なリスクを引き起こす。
本研究では,PASとそのサブタイプの効率的な一段階的マルチクラス診断のための新しい畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:22:30 GMT)
State Engineering of Unsteerable Hamiltonians [8.3] 開系のリンドブラディアン力学は、局所ハミルトニアンの非自明な基底状態に向けて多体系を操るために用いられる。
この研究は、強い相関状態の幅広いクラスの量子状態操作を研究するための体系的な概要を提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:48:08 GMT)
Controlled Agentic Planning & Reasoning for Mechanism Synthesis [8.3] 本研究は,メカニズム合成のためのLLMに基づく推論手法を提案する。
言語レベルと記号レベルの両方で推論し、幾何学的および動的結果を生成することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:16:32 GMT)
ExARNN: An Environment-Driven Adaptive RNN for Learning Non-Stationary Power Dynamics [8.2] 非定常電力系統のダイナミクスはますます複雑になりつつある。
リカレントニューラルネットワーク(RNN)を含む従来のモデルは、動的適応のために時間や環境データなどの外部要因をエンコードする効率的なメカニズムを欠いている。
本稿では,外部データ(天気,時間など)を統合し,ベースRNNのパラメータを連続的に調整する新しいフレームワークであるExarNNを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:28:59 GMT)
NeuroTree: Hierarchical Functional Brain Pathway Decoding for Mental Health Disorders [8.2] 我々は、k-hop AGE-GCNとニューラル常微分方程式(ODE)とコントラッシブマスク機能接続(CMFC)を統合した学習可能なNeuroTreeフレームワークを提案する。
NeuroTreeはfMRIネットワーク機能を木構造に効果的にデコードし、高次脳局所経路の特徴の捕捉を改善する。
これは、年齢に関連する劣化パターンに関する貴重な洞察を与え、その基盤となる神経機構を解明する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:37:50 GMT)
A Domain-Agnostic Scalable AI Safety Ensuring Framework [8.1] 本稿では,AIシステムが特定の確率でユーザ定義の安全制約を満たすことを保証する新しいフレームワークを提案する。
当社のアプローチでは,任意のAIモデルと最適化問題を組み合わせることで,パフォーマンスを維持しながら,アウトプットが安全要件を満たすことを保証する。
本手法は,穏やかな条件下での確率論的安全性を保証するとともに,AIの安全性における最初のスケーリング法則を確立する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:19:17 GMT)
Research on Defect Detection Method of Motor Control Board Based on Image Processing [8.1] 本論文で確立した画像処理に基づくモータ制御基板欠陥検出モデルの精度は99%以上に達した。
この欠陥検出方法は, モータ制御基板欠陥のオンライン検出だけでなく, 産業用集積回路基板欠陥処理のソリューションも提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:39:43 GMT)
DTRT: Enhancing Human Intent Estimation and Role Allocation for Physical Human-Robot Collaboration [8.0] 人間の意図推定と合理的な人間ロボットの役割割り当ては、安全かつ効率的な援助に不可欠である。
人間の誘導運動と強制データを利用する階層型アーキテクチャを備えたDual Transformer-based Robot Trajectron (DTRT)を提案する。
DTRTの正確な意図推定とコラボレーションのパフォーマンスを示す実験。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:33:59 GMT)
Dynamic Risk Assessments for Offensive Cybersecurity Agents [8.0] 我々は、敵が持つであろう様々な自由度を考慮して評価を行うべきだと論じる。
敵は、InterCode CTF上のエージェントのサイバーセキュリティ能力を、ベースラインと比較して40%以上改善できることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:18:59 GMT)
Investigating Affect Mining Techniques for Annotation Sample Selection in the Creation of Finnish Affective Speech Corpus [8.0] 本稿では,フィンランドの3つの大規模音声コーパスから抽出した感情的覚醒と有能性のための12,000の発話をアノテートした最初のコーパスを提案する。
その結果、フィンランドの自発的な感情音声コーパスを導入し、他の言語やドメインで感情音声コーパスを作成するためのサンプリング戦略を通知する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:47:21 GMT)
MR-EEGWaveNet: Multiresolutional EEGWaveNet for Seizure Detection from Long EEG Recordings [8.0] 本稿では,背景脳波(EEG)アーチファクト/ノイズから発作イベントを効率よく識別する,新しいエンド・ツー・エンドモデル「MR-EEGWaveNet」を提案する。
このモデルには、畳み込み、特徴抽出、予測という3つのモジュールがある。
提案したMR-EEGWaveNetは、従来の非多重分解能アプローチよりも大幅に優れていた。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:40:50 GMT)
Doubly Robust Conformalized Survival Analysis with Right-Censored Data [7.9] 本稿では,右知覚データから生存時間に対する低い予測境界を構築するための共形推論手法を提案する。
提案手法は,機械学習モデルを用いて未観測の検閲時間をインプットし,重み付き共形推論を用いてインプットデータを解析する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:51:32 GMT)
Brightness-Invariant Tracking Estimation in Tagged MRI [7.8] タグ付きMRIにおける輝度不変性追跡手法を提案する。
BRITEは、観測されたタグ付き画像シーケンスにおいて、タグパターンから解剖を分離し、同時にラグランジアン運動を推定する。
以上の結果から,BRITEは,他の手法と比較して,より正確な動きやひずみ推定が可能であり,また,タグの消色にも耐性があることが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:48:23 GMT)
Multiphysics Bench: Benchmarking and Investigating Scientific Machine Learning for Multiphysics PDEs [7.8] 機械学習における多分野問題における課題を特定し,解決することを目的としている。
まず、機械学習を用いた多物理PDE問題解決に焦点を当てた、最初の汎用多物理データセットであるMultiphysics Benchを収集する。
第2に, PINN, FNO, DeepONet, DiffusionPDEソルバなど, 複数の代表的な学習型PDEソルバについて, マルチ物理問題に関する最初の系統的研究を行った。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:35:18 GMT)
Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets [7.7] 我々は、ビデオとアクションデータの両方を政策学習に活用できるフレームワークUnified World Models (UWM)を提案する。
各拡散時間ステップを制御することにより、UWMはポリシー、フォワードダイナミクス、逆ダイナミクス、ビデオジェネレータを柔軟に表現することができる。
以上の結果から,UWMは大規模で異種なデータセットをスケーラブルなロボット学習に活用する上で,有望なステップとなることが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:47:24 GMT)
DocAgent: A Multi-Agent System for Automated Code Documentation Generation [7.7] 本稿では、トポロジ的コード処理によるインクリメンタルコンテキスト構築のための新しいマルチエージェント協調システムDocAgentを紹介する。
特殊なエージェント(Reader、Searcher、Writer、Verifier、Orchestrator)が共同でドキュメントを生成する。
また, 完全性, ヘルプ性, 真実性を評価する多面的評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:30:16 GMT)
Automated scientific minimization of regret [7.6] 後悔の科学的最小化(ASMR)について紹介する。
ASMRは自動計算認知科学のためのフレームワークである。
その結果,ASMRは音環境下での人間の行動を予測する認知モデルを発見し,解釈可能性を維持した。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:26:43 GMT)
GeoGramBench: Benchmarking the Geometric Program Reasoning in Modern LLMs [7.6] 本稿では,従来の数学的推論の複雑さではなく,幾何学的複雑性を考慮した3段階分類によって整理された500の精巧な問題のベンチマークを示す。
17個のフロンティアLSMの総合的な評価により,一貫性と顕著な欠陥が明らかとなった。
これらの結果は、プログラム駆動型空間推論によって引き起こされる独特な課題を浮き彫りにし、シンボル-空間幾何学的推論の研究を進めるための貴重な資源としてGeoGramBenchを確立した。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:17:07 GMT)
Gradient-Based Program Repair: Fixing Bugs in Continuous Program Spaces [7.6] 我々は,プログラム修復を連続的な最適化として,微分可能な数値プログラム空間で再設計する新しいパラダイムであるGBPR(Gradient-Based Program repair)を紹介する。
我々の中心となる洞察は、記号的プログラムを微分可能な数値表現にコンパイルし、プログラムの振舞いによって直接導かれる数値的プログラム空間の探索を可能にすることである。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:12:09 GMT)
Do Automated Fixes Truly Mitigate Smart Contract Exploits? [7.6] 本稿では,スマートコントラクトのためのプログラム修復ツールの活用性を評価するための,新しい,体系的な実験フレームワークを提案する。
脆弱なスマートコントラクト143のデータセットを使用して、20の最先端のAPRツールを質的かつ定量的に分析する。
術式は29%から74%に低下した。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:43:49 GMT)
What You Read Isn't What You Hear: Linguistic Sensitivity in Deepfake Speech Detection [7.6] 我々は,オープンソースおよび商用のアンチスプーフィング検出器に対する転写レベルの逆攻撃を導入する。
攻撃の成功率は、オープンソースのディテクターとボイスで60%を超え、1つの商業的検出精度は、合成オーディオで100%からわずか32%に低下する。
その結果、純粋な音響防御を超えて、頑丈な防汚システムの設計における言語的変化を考慮する必要性が浮き彫りになった。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:06:37 GMT)
PD$^3$: A Project Duplication Detection Framework via Adapted Multi-Agent Debate [7.5] PD$3$は、適応型マルチエージェントデリバトによるプロジェクト重複検出フレームワークである。
現実世界の専門家による議論に触発されて、関連するプロジェクトを取得するためのマルチエージェントの議論をガイドするために、公正な競争形式を採用している。
我々は、電力専門家を支援するオンラインプラットフォーム、Review Dingdangを設立し、新たに提案された100以上のプロジェクトの最初の検出で530万USドルを節約した。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:38:37 GMT)
SLearnLLM: A Self-Learning Framework for Efficient Domain-Specific Adaptation of Large Language Models [7.4] 人間の学習パターンにインスパイアされた大規模言語モデル(LLM)のための自己学習フレームワークを提案する。
このフレームワークは特定のドメインの細調整(SFT)データセットを入力として取り込む。
また,本手法は,全データセットの微調整で得られたものと比較して,トレーニング時間を大幅に短縮することを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:50:54 GMT)
Beyond Self-Repellent Kernels: History-Driven Target Towards Efficient Nonlinear MCMC on General Graphs [7.4] 我々はマルコフ・チェイン・モンテカルロ(MCMC)における履歴駆動型目標(HDT)フレームワークを提案し、離散状態空間におけるランダムウォークアルゴリズムを改善する。
また,HDTは,現在の状態と提案状態の局所的な情報のみを必要とすることにより,軽量な実装を保っていることを示す。
グラフサンプリング実験は、一貫したパフォーマンス向上を示し、メモリ効率の高いLRUキャッシュは、大規模な汎用グラフへのスケーラビリティを保証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:46:10 GMT)
AutoMiSeg: Automatic Medical Image Segmentation via Test-Time Adaptation of Foundation Models [7.4] 本稿では,視覚言語とセグメンテーション基礎モデルを組み合わせたゼロショット自動セグメンテーションパイプラインを提案する。
適切な分解とテスト時間適応により、我々の完全自動パイプラインは、弱い確率で対話的な基礎モデルと競争的に機能する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:07:21 GMT)
MolMiner: Towards Controllable, 3D-Aware, Fragment-Based Molecular Design [7.4] MolMinerは、分子設計のための断片的、幾何学的、秩序に依存しない自己回帰モデルである。
MolMinerは12個以上の性質を持つ分子の条件生成をサポートし、物理化学的および構造的標的に対して柔軟な制御を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:18:13 GMT)
Revisiting Adversarial Perception Attacks and Defense Methods on Autonomous Driving Systems [7.3] 我々は、道路標識認識とリードオブジェクトの検出と予測に焦点をあてて、敵攻撃と防御方法を再検討する。
本実験は, 複雑な攻撃を緩和する手法の長所と短所を強調した。
我々は、ADS認識システムの脆弱性についてより深い知見を提供し、より弾力性のある防衛戦略開発のためのガイダンスを提供することを目指している。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:44:21 GMT)
STAF: Sinusoidal Trainable Activation Functions for Implicit Neural Representation [7.3] Inlicit Neural Representations (INR) は、連続的な信号をモデリングするための強力なフレームワークとして登場した。
ReLUベースのネットワークのスペクトルバイアスは、十分に確立された制限であり、ターゲット信号の微細な詳細を捕捉する能力を制限する。
Sinusoidal Trainable Function Activation (STAF)について紹介する。
STAFは本質的に周波数成分を変調し、自己適応型スペクトル学習を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:05:27 GMT)
SUFFICIENT: A scan-specific unsupervised deep learning framework for high-resolution 3D isotropic fetal brain MRI reconstruction [7.3] 等方性HR容積再構成のための教師なし反復SVR-SRRフレームワークを提案する。
高分解能(HR)ボリュームを生成するために、ディープイメージ事前フレームワーク内に埋め込まれたデコードネットワークを包括的画像劣化モデルに組み込む。
大規模動乱シミュレーションデータと臨床データを用いて行った実験は,提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:53:59 GMT)
Multi-Person Interaction Generation from Two-Person Motion Priors [7.3] グラフ駆動インタラクションサンプリングは、現実的で多様な多人数インタラクションを生成する方法である。
生成タスクを、互いの動作に条件付けられた同時1対1の動作生成に分解する。
提案手法は,多人数・多人数のインタラクションを広範囲に生成する際の工芸品の削減において,既存の手法よりも一貫して優れる。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:13:00 GMT)
Model Already Knows the Best Noise: Bayesian Active Noise Selection via Attention in Video Diffusion Model [7.2] ANSEは、注意に基づく不確実性を定量化することによって高品質なノイズシードを選択するモデル認識フレームワークである。
CogVideoX-2B と 5B の実験では、ANSE は 8% と 13% の推論時間で画質を向上することを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:09:10 GMT)
Diagnosing our datasets: How does my language model learn clinical information? [7.1] 大規模言語モデル(LLM)は様々な自然言語処理タスクでよく機能している。
我々は,オープンソースのLLMが大規模コーパスから臨床情報をいかに学習するかを検討する。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:09:11 GMT)
Discriminating Form and Meaning in Multilingual Models with Minimal-Pair ABX Tasks [7.0] 多言語言語モデルが言語アイデンティティ(形式)と意味コンテンツ(意味)をどのように表現するかを評価するために、トレーニング不要なABXスタイルの識別タスクを導入する。
音声処理から着想を得たこれらのゼロショットタスクは、表現の最小差を確実に検出できるかどうかを測定する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:14:27 GMT)
Linear Mixture Distributionally Robust Markov Decision Processes [7.0] 分布的に堅牢なマルコフ決定プロセス(DRMDP)は、最悪の環境下でうまく機能する堅牢なポリシーを見つけることでこの問題に対処する。
本稿では,線形混合モデルとして名目力学を仮定する,新しい線形混合DRMDPフレームワークを提案する。
この新たなフレームワークは,従来のモデルに比べて不確実性の表現がより洗練されていることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:48:11 GMT)
Towards Analyzing and Understanding the Limitations of VAPO: A Theoretical Perspective [7.0] VAPOは、大規模言語モデルの強化学習のためのフレームワークである。
これは、値モデルバイアス、不均一なシーケンス長、スパース報酬信号といった課題に対処する。
本稿では,理論的な観点からVAPOを考察し,その仮定が課題となる分野を明らかにする。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:03:41 GMT)
Identifying Causal Direction via Variational Bayesian Compression [6.9] このタスクで利用される重要な原理はアルゴリズムマルコフ条件であり、因果方向に応じて分解された結合分布は反因果方向よりも簡潔な符号長が得られると仮定する。
本稿では,ニューラルネットワークの変分ベイズ学習をコード長の解釈として活用することを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:54:50 GMT)
How Can I Publish My LLM Benchmark Without Giving the True Answers Away? [6.9] 大規模言語モデル(LLM)ベンチマークをインターネット上で公開することで、将来のLLMを汚染するリスクがある。
一般的な緩和策は、ベンチマークを非公開にし、参加者がモデルや予測をオーガナイザに提出できるようにすることである。
質問に対する根本的回答を完全に開示することなく,ベンチマークを公開する方法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:57:34 GMT)
Aleph-Alpha-GermanWeb: Improving German-language LLM pre-training with model-based data curation and synthetic data generation [6.7] 本稿では,モデルに基づくフィルタリング手法と合成データ生成を組み合わせたドイツ語データセットパイプラインを提案する。
パイプラインを使用して、大規模なドイツの事前トレーニングデータセットであるAleph-Alpha-GermanWebを作成します。
MMMLUを含むドイツ語のベンチマークの比較では、FineWeb2だけでAleph-Alpha-GermanWebのパフォーマンスが大幅に向上している。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:24:32 GMT)
Fusion-DeepONet: A Data-Efficient Neural Operator for Geometry-Dependent Hypersonic and Supersonic Flows [6.7] 形状最適化は、再突入システムや推進システムコンポーネントを含む航空宇宙車両の設計において不可欠である。
We developed a new variant of DeepONet, called Fusion-DeepONet, as a fast surrogate model for geometry-dependent hypersonic and supersonic flow field。
2つの超音速流れと超音速形状依存内部流れの学習におけるFusion-DeepONetの評価を行った。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:47:45 GMT)
How to Train a Model on a Cheap Cluster with Low Cost using Block Coordinate Descent [6.7] 大きな言語モデルのトレーニングには、大規模なメモリと相当な財政的投資が必要であり、これは多くの中小規模チームにとって障壁となる。
エンジニアリング最適化によって強化されたブロック座標降下(DBC)に基づく,高コストな4090GPUクラスタ上で大規模モデルを効率的にトレーニングするための,フルエンタブルな事前トレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:05:54 GMT)
Pose Splatter: A 3D Gaussian Splatting Model for Quantifying Animal Pose and Appearance [6.7] Pose Splatterは、形状彫刻と3Dガウススプラッティングを利用して、実験動物の完全なポーズと外観をモデル化する新しいフレームワークである。
我々は,Pose Splatterが正確な3次元動物ジオメトリを学習し,ヒトが評価する最先端技術に対して,より低次元のポーズ埋め込みを提供することを示す。
Pose Splatterは、アノテーションとフレーム単位の最適化ボトルネックを排除することによって、ジェノタイプ、神経活動、微小行動のマッピングに必要な大規模で長手な振る舞いの分析を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:57:31 GMT)
Soft-CAM: Making black box models self-explainable for high-stakes decisions [6.6] 畳み込みニューラルネットワーク(CNN)は医学のような高度な応用に広く使われており、しばしば人間のパフォーマンスを上回っている。
ほとんどの説明法は、既に訓練されたブラックボックスモデルの意思決定プロセスを近似して、ポストホックの帰属に依存している。
我々は、標準CNNアーキテクチャを本質的に解釈可能なものにする、単純で効果的なアプローチであるSoftCAMを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:15:21 GMT)
Large Language Models Are Involuntary Truth-Tellers: Exploiting Fallacy Failure for Jailbreak Attacks [6.6] 言語モデルでは、誤った推論や偽りの推論を発生させることが困難であることがわかった。
本稿では、悪意のある出力に対して一致した言語モデルを引き出すジェイルブレイク攻撃法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:29:31 GMT)
Generalized Fisher-Weighted SVD: Scalable Kronecker-Factored Fisher Approximation for Compressing Large Language Models [6.6] Generalized Fisher-Weighted SVD (GFWSVD) は、フィッシャー情報行列の対角要素と対角要素の両方を考慮に入れた後処理圧縮技術である。
提案手法がLLM圧縮に与える影響を実証し,既存の圧縮ベースラインよりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:41:52 GMT)
Ten Years of Software Engineering in Society [6.6] 私たちは、SEISトラックに掲載されている論文を、この分野の研究のプロキシや例として利用したいと考えています。
筆者らは,SEISトラックに掲載された123記事のマッピング調査を行い,サステナビリティ,多様性,包摂性,オープンソースソフトウェアに関する傾向を明らかにした。
今後の研究として、コミュニティの議論を刺激し、他のカンファレンス会場でこの作業の再現を刺激することを目指しています。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:19:58 GMT)
REvolve: Reward Evolution with Large Language Models using Human Feedback [6.5] 大規模言語モデル(LLM)は、自然言語のタスク記述から報酬を生成するために使われてきた。
人間のフィードバックによって導かれるLLMは、人間の暗黙の知識を反映する報酬関数を定式化するのに用いられる。
強化学習における報酬設計にLLMを使用する,真に進化的なフレームワークであるRevolveを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:35:25 GMT)
A Dual Basis Approach for Structured Robust Euclidean Distance Geometry [6.4] 本稿では, アンカーノードの集合のみを用いて, 互いにの距離を測る環境について考察する。
潜在的な外れ値の存在下では、部分的な破損を伴うEDMの構造化された部分的な観察が生じる。
本稿では,ロバスト・ユークリッド距離幾何学(RoDeoDB)と呼ばれる新しいアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:40:21 GMT)
Structured Linear CDEs: Maximally Expressive and Parallel-in-Time Sequence Models [6.4] 我々は、構造化された入力依存状態遷移行列を持つシーケンスモデルのための統一フレームワークを提供する。
S4 と Mamba の対角的状態遷移行列とは異なり、SLiCE はブロック対角行列、スパース行列、ウォルシュ-ハダマール行列を用いる。
経験的に、SLiCEは1層で$A_5$の状態追跡ベンチマークを解き、並列時間モデル間での正規言語タスクのクラス長の最適化を実現し、ログニューラル制御微分方程式の最先端性能に適合する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:34:21 GMT)
NSNQuant: A Double Normalization Approach for Calibration-Free Low-Bit Vector Quantization of KV Cache [6.4] NSNQuantは、KVキャッシュの低ビット圧縮のために設計されたキャリブレーションフリーベクトル量子化(VQ)技術である。
NSNQuantは1ビットと2ビットの両方の設定において、従来よりも一貫してパフォーマンスが向上している。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:40:07 GMT)
CReSt: A Comprehensive Benchmark for Retrieval-Augmented Generation with Complex Reasoning over Structured Documents [6.4] 大規模言語モデル(LLM)は近年大きく進歩しているが、実用的検索・拡張生成(RAG)シナリオにおけるそれらの能力の評価は依然として困難である。
本稿では,CreSt(構造化文書に対する複雑な推論を伴う検索拡張生成のための総合ベンチマーク)を提案する。
CreStは、構造化文書に対する複雑な推論を必要とする実用的なRAGシナリオをキャプチャするために設計された、英語と韓国語で2,245の人手による注釈付き例で構成されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:56:25 GMT)
GPS-Aided Deep Learning for Beam Prediction and Tracking in UAV mmWave Communication [6.2] 本研究は,UAVmmWave通信における現在および将来の最適ビームを同時に予測するGPS支援深層学習(DL)モデルを提案する。
このモデルではオーバーヘッドを約93%削減し(32ビームではなく23ビームのトレーニングが必要)、95%のビーム予測精度を保証するとともに、予測の94%から96%が平均出力損失が1dBを超えないことを保証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:38:00 GMT)
Is Your Paper Being Reviewed by an LLM? Benchmarking AI Text Detection in Peer Review [6.2] ピアレビュープロセスに対する新たなリスクは、Negligentレビュアーが論文をレビューするために大きな言語モデル(LLM)に依存することだ。
我々は、AIで書かれたピアレビューを、対応する人間のレビューと組み合わせた合計788,984件の包括的データセットを導入する。
我々は、この新たなリソースを使用して、既存の18のAIテキスト検出アルゴリズムが、人間が完全に書いたピアレビューと、最先端のLLMを区別する能力を評価する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:37:43 GMT)
Self-Organizing Visual Prototypes for Non-Parametric Representation Learning [6.1] 本稿では、教師なし視覚特徴学習のための新しい訓練手法である自己組織化視覚プロトタイプ(SOP)を提案する。
この戦略では、プロトタイプは多くの意味論的に類似した表現で表現され、それぞれが補完的な機能のセットを含む組込み(SE)をサポートする。
我々は,SOP戦略を用いて学習した表現を,検索,線形評価,微調整,オブジェクト検出など,様々なベンチマークで評価する。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:12:07 GMT)
Comparing Differentiable and Dynamic Ray Tracing: Introducing the Multipath Lifetime Map [6.1] これらの課題に対処するために、微分可能および動的レイトレーシングフレームワークが登場した。
この2つのテクニックの概要と、NVIDIAのUniBoの3DSCATとSionnaの2つの最先端ツールの比較分析について述べる。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:45:24 GMT)
USTBench: Benchmarking and Dissecting Spatiotemporal Reasoning of LLMs as Urban Agents [6.1] 大規模言語モデル (LLMs) は、様々な都市下流アプリケーションをサポートする都市エージェントを構築するための有望な候補となる、時間的非時間的可能性を示している。
結果レベル研究における都市エージェントの評価に関する既存の研究は、その根底にある推論過程について限定的な洞察を与える。
その結果、時間的推論における都市エージェントの強さと限界はいまだに理解されていない。
USTBenchは、LLMの時間的推論能力を4次元にわたる都市エージェントとして評価する最初のベンチマークである。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:30:57 GMT)
Hadamax Encoding: Elevating Performance in Model-Free Atari [6.0] 本研究では,画素ベースモデルフリー強化学習のための新しいエンコーダアーキテクチャを提案する。
Hadamaxエンコーダは、GELUによって活性化された並列隠蔽層間でHadamard製品を最大プールすることで、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:18:10 GMT)
Dynamic Snake Upsampling Operater and Boundary-Skeleton Weighted Loss for Tubular Structure Segmentation [5.9] 本稿では,トポロジカルな管状構造物に適した動的ヘビ吊り上げ演算子と境界スケルトン重み付き損失を導入する。
様々なドメインデータセットとバックボーンネットワークにわたる実験により、このプラグアンドプレイのダイナミックスネークアップサンプリング演算子とバウンダリ・スケルトン重み付き損失は、ピクセルワイドセグメンテーション精度と結果のトポロジ的整合性の両方を促進することが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:28:14 GMT)
Pruning the Paradox: How CLIP's Most Informative Heads Enhance Performance While Amplifying Bias [5.9] CLIPのようなモデルにおける注意頭のためのテキスト記述の概念的一貫性について検討する。
本稿では,新しい解釈可能性尺度である概念一貫性スコア(CCS)を提案する。
我々は,高いCCSヘッドが重要な概念を捕捉し,ドメイン外検出,概念固有の推論,ビデオ言語理解において重要な役割を担っていることを発見した。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:18:11 GMT)
Cultural Awareness in Vision-Language Models: A Cross-Country Exploration [5.9] VLM(Vision-Language Models)は、さまざまな文化的文脈において、ますます普及している。
本稿では、VLMが人種、性別、身体的特性に関連する文化的差異やバイアスをどのように符号化しているかを評価するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:47:52 GMT)
SmartNote: An LLM-Powered, Personalised Release Note Generator That Just Works [5.9] 多くの開発者は、ソフトウェアリリースノートを書くプロセスは退屈で恐ろしい作業だと考えています。
本稿では,新鮮で広く適用可能なリリースノート生成手法であるSmartNoteを提案する。
LLM技術を用いて高品質で文脈的にパーソナライズされたリリースノートを生成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:45:44 GMT)
Graph-Linguistic Fusion: Using Language Models for Wikidata Vandalism Detection [5.9] ウィキデータのための次世代の破壊検出システムを提案する。
Wikidataは、Web上で最大のオープンソースの構造化知識基盤の1つである。
このアプローチでは、Graph2Textと呼ばれるメソッドを使用して、すべての編集を単一のスペースに変換する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:44:06 GMT)
LLM-BSCVM: An LLM-Based Blockchain Smart Contract Vulnerability Management Framework [5.9] LLM-BSCVMは、大規模言語モデルに基づくスマートコントラクトの脆弱性管理フレームワークである。
Web 3.0エコシステムに対して、エンドツーエンドの脆弱性検出、分析、修復、評価機能を提供する。
脆弱性検出の精度を実現し、ベンチマークデータセットではF1スコアが91%を超えている。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:05:09 GMT)
T2VUnlearning: A Concept Erasing Method for Text-to-Video Diffusion Models [5.9] 本稿では,テキスト・ツー・ビデオ(T2V)モデルに対する頑健で高精度な未学習手法を提案する。
正確なアンラーニングを実現するために,モデルの非ターゲット概念生成能力を維持するために,ローカライゼーションと保存正規化を組み込んだ。
本手法は,既存の手法よりも優れたモデル生成能力を保ちながら,特定の概念を効果的に消去する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:56:32 GMT)
Dual Attention Residual U-Net for Accurate Brain Ultrasound Segmentation in IVH Detection [5.8] 心室内出血(IVH)は早産児の神経学的合併症である。
近年のディープラーニング手法は,コンピュータ支援による診断を約束する。
本稿では,2つの補完的注意機構を組み込んだResidual U-Netアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:53:57 GMT)
PyTupli: A Scalable Infrastructure for Collaborative Offline Reinforcement Learning Projects [5.7] オフライン強化学習(RL)は,事前収集データから制御ポリシを学習するための強力なパラダイムとして注目を集めている。
PyTupliはPythonベースのツールで、ベンチマーク環境の作成、ストレージ、普及を効率化する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:39:36 GMT)
Do You Keep an Eye on What I Ask? Mitigating Multimodal Hallucination via Attention-Guided Ensemble Decoding [5.7] LVLM(Large Vision-Language Models)は、存在しないオブジェクトや既存のオブジェクトを誤って含むことによって、視覚的コンテンツを不正確に反映する記述を生成する。
本稿では,入力画像をサブイメージに分割し,アテンションマップを通じて重みを割り当てることでロジット分布を結合する新しい戦略であるEnsemble Decoding (ED)を提案する。
提案手法は,提案手法の有効性を検証し,最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:35:43 GMT)
Distance Estimation in Outdoor Driving Environments Using Phase-only Correlation Method with Event Cameras [5.7] 単眼イベントカメラと路面LEDバーを用いた距離推定手法を提案する。
提案手法は,20mから60mの範囲で0.5m以下の誤差で90%以上の成功率を達成する。
将来的には、LEDを備えたスマートポールなどのインフラを活用して、この手法を全位置推定に拡張する予定である。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:44:33 GMT)
SPAR: Self-supervised Placement-Aware Representation Learning for Multi-Node IoT Systems [5.6] 本研究は,空間分布型(マルチビューおよびマルチモーダル)センサを用いた自己教師型配置認識型表現学習の基盤となるものを開発する。
本フレームワークは,測度と幾何学的オブザーバ配置と構造特性の依存関係を明示的に学習する。
実世界の3つのデータセット(車両監視、人間活動認識、地震の局所化)の実験は、我々の手法の優れた一般化性と堅牢性を実証している。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:14:24 GMT)
HICD: Hallucination-Inducing via Attention Dispersion for Contrastive Decoding to Mitigate Hallucinations in Large Language Models [5.6] 大規模言語モデル(LLM)は、しばしば幻覚を生成し、文脈的に不正確または事実的に不正確な出力を生成する。
我々は,幻覚を緩和する対照的な復号法として,幻覚を誘導する新しい手法HICDを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:32:24 GMT)
Inference-Time Decomposition of Activations (ITDA): A Scalable Approach to Interpreting Large Language Models [5.6] Inference-Time Decomposition of Activation(ITDA)モデルは、言語モデルのアクティベーションを分解する代替手法である。
ITDAは、データの1%を使用して、SAEに必要な時間のわずか1%でトレーニングすることができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:41:41 GMT)
A Bio-mimetic Neuromorphic Model for Heat-evoked Nociceptive Withdrawal Reflex in Upper Limb [5.6] 本研究では, 反射アークの構造と符号化方式を模倣し, 熱誘発型NWRのニューロモルフィックスパイキングネットワークを提案する。
このネットワークは、生物工学的な報酬スパイクタイミング依存の塑性学習アルゴリズムで訓練されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:41:20 GMT)
Measurement-Incompatibility Constraints for Maximal Randomness [5.6] 最大ランダム性を達成するための量子状態と射影測定のクラスを同定する。
我々は、ある当事者の測度に対する十分な大きな不整合性は、他の当事者の要求を緩和することを見つけ、それは任意に弱まることさえある。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:45:11 GMT)
HausaNLP: Current Status, Challenges and Future Directions for Hausa Natural Language Processing [5.5] Hausaは、世界で1億2000万の第一言語(L1)と8000万の第二言語(L2)を持つ低リソース言語である。
本稿では,Hausa NLPの現状を概観し,既存の資源,研究コントリビューション,基本的なNLPタスク間のギャップを体系的に検討する。
アクセシビリティを高め、さらなる開発を促進するために、データセット、ツール、研究成果を集約する、キュレートされたカタログであるHausaNLPを紹介します。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:13:28 GMT)
BRAVE: Brain-Controlled Prosthetic Arm with Voice Integration and Embodied Learning for Enhanced Mobility [5.5] BRAVEは、ハイブリッド脳波と音声制御義肢システムである。
脳波駆動運動の意図を解釈することを目的としており、残筋活動に依存することなく運動制御を可能にする。
システムはリアルタイムで動作し、応答遅延は150msである。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:44:33 GMT)
To Glue or Not to Glue? Classical vs Learned Image Matching for Mobile Mapping Cameras to Textured Semantic 3D Building Models [5.5] 本研究は、テクスチャ化されたCityGML LoD2モデルを用いて、視覚的位置決めにおける異なる特徴マッチング手法の有効性を体系的に評価する。
その結果,学習可能な特徴マッチング手法は,精度とロバスト性に関して従来の手法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:41:41 GMT)
VIBE: Vector Index Benchmark for Embeddings [5.4] 本稿では,ANNアルゴリズムをベンチマークするオープンソースプロジェクトであるVector Index Benchmark for Embeddings (VIBE)を紹介する。
VIBEには、現代のアプリケーションに特徴的な密着した埋め込みモデルを使用して、ベンチマークデータセットを作成するパイプラインが含まれている。
我々は、VIBEを用いてSOTAベクトルインデックスの総合的な評価を行い、12の分布内および6の分布外データセット上で21の実装をベンチマークする。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:28:10 GMT)
OneProt: Towards Multi-Modal Protein Foundation Models [5.4] 我々は、構造、シーケンス、テキスト、結合サイトデータを統合したタンパク質のためのマルチモーダルAIであるOneProtを紹介する。
ImageBindフレームワークを使用して、OneProtは軽量な微調整方式でタンパク質モダリティエンコーダの潜在空間を整列する。
この研究はマルチモーダルタンパク質モデルの地平線を広げ、薬物発見、生物触媒反応計画、タンパク質工学における変革的応用の道を開く。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:30:11 GMT)
Learning to Add, Multiply, and Execute Algorithmic Instructions Exactly with Neural Networks [5.4] 無限幅限界における2層完全連結ネットワークのトレーニング力学について検討する。
このようなモデルの十分な大規模なアンサンブルが、高い確率で正確に実行するためにどのように訓練されるかを示す。
対数的に多くのトレーニングデータだけを用いて効率よく達成できることを示します。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:53:25 GMT)
CoMoE: Contrastive Representation for Mixture-of-Experts in Parameter-Efficient Fine-tuning [5.2] 我々は,MoEのモジュール化と特殊化を促進するために,MoE(CoMoE)のコントラスト表現を提案する。
いくつかのベンチマークやマルチタスク環境での実験では、CoMoEはMoEのキャパシティを継続的に向上し、専門家間のモジュール化を促進することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:58:44 GMT)
Object Classification Utilizing Neuromorphic Proprioceptive Signals in Active Exploration: Validated on a Soft Anthropomorphic Hand [5.2] プロプリオセプションは、物体の3D構造を知覚する上で重要な役割を担っている。
プロプリオセプションは人工システムでは比較的未発見である。
ソフトな人型ロボットハンドを統合する新しいプラットフォームを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:02:34 GMT)
FoLDTree: A ULDA-Based Decision Tree Framework for Efficient Oblique Splits and Feature Selection [5.2] LDATreeとFoldTreeは、Uncorrelated Linear Discriminant Analysis (ULDA)とForward ULDAを決定木構造に統合する。
LDATree と FoLDTree は軸直交およびその他の斜め決定木法より一貫して優れている。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:32:29 GMT)
A New Forward Discriminant Analysis Framework Based On Pillai's Trace and ULDA [5.2] 本稿では, Pillai のトレースと Uncorrelated Linear Discriminant Analysis (ULDA) を統合し,これらの課題に対処する新しい前方識別分析フレームワークを提案する。
シミュレーションと実世界のデータセットを通じて、新しいフレームワークはタイプIエラー率の効果的な制御と分類精度の向上を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:33:38 GMT)
NeuBM: Mitigating Model Bias in Graph Neural Networks through Neutral Input Calibration [5.1] グラフニューラルネットワーク(GNN)におけるモデルバイアスを緩和する新しいアプローチであるNeuBMを導入する。
NeuBMは動的に更新された中立グラフを利用して、モデル固有のバイアスを推定し、修正する。
本手法は既存のGNNアーキテクチャとトレーニング手順をシームレスに統合し,計算オーバーヘッドを最小限に抑える。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:36:32 GMT)
Promptable cancer segmentation using minimal expert-curated data [5.1] 医療画像上の癌の自動分離は、標的とする診断と治療の処置を支援することができる。
その採用は、データセットのトレーニングやサーバ間の可変性に必要な専門家アノテーションの高コストによって制限されている。
そこで本研究では,24個の完全分割画像しか必要とせず,弱ラベル画像8枚を補足した,高速セグメンテーションのための新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:56:40 GMT)
Unveiling Downstream Performance Scaling of LLMs: A Clustering-Based Perspective [5.1] 大規模言語モデル(LLM)トレーニングのエスカレートスケールとコストは、下流タスク性能の正確な事前トレーニング予測を必要とする。
現在の予測手法には精度と信頼性が欠けている。
本稿では,下流性能予測のためのクラスタリングオンディフルティ(COD)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:30:02 GMT)
MissionGNN: Hierarchical Multimodal GNN-based Weakly Supervised Video Anomaly Recognition with Mission-Specific Knowledge Graph Generation [5.1] ビデオ異常検出とビデオ異常認識は、インテリジェントな監視、証拠調査、暴力警告などの応用において極めて重要である。
これらのタスクは、極めて不均衡なデータと、教師付き学習のための広範囲なフレームレベルのデータアノテーションの非現実性をもたらす異常の出現によって、重大な課題に直面している。
本稿では、最先端の大規模言語モデルと総合知識グラフを活用して、VARにおける弱教師付き学習を効果的に行うことで、これらの課題に対処する新しい階層型グラフニューラルネットワーク(GNN)モデルであるMissionGNNを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:21:37 GMT)
Where You Place the Norm Matters: From Prejudiced to Neutral Initializations [5.1] バッチ正規化(Batch Normalization)やレイヤ正規化(Layer Normalization)といった正規化レイヤは、現代のニューラルネットワークの中心的なコンポーネントである。
本研究では,隠れ層内の正規化の存在と配置が,学習開始前のネットワーク予測の統計的特性に与える影響について検討する。
我々の研究は、正規化が早期訓練行動にどのように影響するかを原則的に理解し、より制御され、解釈可能なネットワーク設計のためのガイダンスを提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:12:15 GMT)
Enhanced 3D Object Detection via Diverse Feature Representations of 4D Radar Tensor [5.0] Raw 4D Radar (4DRT) は従来の点雲よりも豊かな空間情報とドップラー情報を提供する。
効率を保ちつつ、4DRTの有用性を最大化する新しい3Dオブジェクト検出フレームワークを提案する。
本稿では, RTNHモデルよりもAP_3Dが7.3%, AP_BEVが9.5%向上したことを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:17:06 GMT)
TimeCF: A TimeMixer-Based Model with adaptive Convolution and Sharpness-Aware Minimization Frequency Domain Loss for long-term time seris forecasting [5.0] 本稿では,TimeMixer に基づく時系列予測のためのディープラーニングモデル TimeCF を提案する。
TimeCFは、オリジナルの時系列を異なるスケールのシーケンスに分解する。
異なるスケールはFeed-Forward Networkを通じて集約される。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:39:20 GMT)
Advertising in AI systems: Society must be vigilant [5.0] 我々は、生成AIベースのシステムを通じて、商用コンテンツをどのように配信できるかを想像する。
広告主、消費者、プラットフォームの要求に基づき、商業的影響のあるAIシステムの設計原則を提案する。
次に、エンドユーザーがモデル出力から商業バイアスを特定し緩和するための戦略を概説する。
論文参考訳(メタデータ) (Fri, 23 May 2025 23:29:12 GMT)
Cross-lingual Human-Preference Alignment for Neural Machine Translation with Direct Quality Optimization [5.0] ニューラルネットワーク翻訳(NMT)へのタスクアライメントの適用は,NMTにおける既存のタスクデータミスマッチに対処することを示す。
人選好のプロキシとして,事前学習された翻訳品質推定モデルを活用するDPOの変種であるダイレクト品質最適化(DQO)を導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:14:48 GMT)
Towards Revealing the Effectiveness of Small-Scale Fine-tuning in R1-style Reinforcement Learning [5.0] R1スタイル強化学習(RL)は、大規模言語モデルの推論能力を大幅に向上させる。
小型SFTはRLに大きな影響を与えるが, 効率は低い。
本稿では,RL法に基づく小規模蒸留によるプレトレインモデルの微粒化手法であるRe-distillationを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:55:22 GMT)
SynRES: Towards Referring Expression Segmentation in the Wild via Synthetic Data [5.0] WildRESは、多様な属性を持つ長いクエリと、複数のターゲットに対する識別できないクエリを組み込んだ、新しいベンチマークである。
解析の結果,WildRESを用いた場合,現在のRESモデルでは性能が著しく低下していることが判明した。
この課題に対処するために、密集した合成学習データを生成する自動パイプラインであるSynRESを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:05:16 GMT)
KCIF: Knowledge-Conditioned Instruction Following [4.9] 我々は,知識と指示の相互作用について検討し,LLMが単純な回答修正命令に従うのに苦労していることを観察する。
本結果は,従来の知識・推論・指導の分離の限界を強調し,これらの機能の共同研究が重要であることを示唆している。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:03:10 GMT)
GRADIEND: Monosemantic Feature Learning within Neural Networks Applied to Gender Debiasing of Transformer Models [4.8] 本研究では, モデル勾配を利用して, ジェンダー情報を符号化する単一単意味特徴ニューロンを学習するエンコーダ・デコーダ手法を提案する。
提案手法はトランスフォーマーに基づく言語モデルのデバイアス化に有効であり,他の機能も維持可能であることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:10:08 GMT)
AFD-STA: Adaptive Filtering Denoising with Spatiotemporal Attention for Chaotic System Prediction [4.8] AFD-STAネットは、偏微分方程式によって支配される高次元カオスシステムを予測するための枠組みを示す。
このフレームワークは、測定の不確かさと高次元非線形ダイナミクスの同時処理を必要とする実世界のアプリケーションにとって有望な可能性を示している。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:39:07 GMT)
Weakly-supervised Mamba-Based Mastoidectomy Shape Prediction for Cochlear Implant Surgery Using 3D T-Distribution Loss [4.8] 術前CT検査から直接, 正確なマストイド領域を推定するための弱監督型マンバベースフレームワークを提案する。
本手法は,マストイドの形状に固有の複雑な幾何学的変動を効果的に扱える3D T-Distribution loss関数を用いている。
提案手法は最先端のアプローチに対して広範に評価され, 正確な, 臨床的に関連するマストイド切除領域の予測における優れた性能を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:53:03 GMT)
A Comprehensive Assessment Benchmark for Rigorously Evaluating Deep Learning Image Classifiers [4.8] 本稿では,多種多様なデータを用いたベンチマーク性能について論じる。
現在のディープニューラルネットワークは、最先端のロバスト性を生み出すと信じられている手法で訓練された者を含む、ある種のデータに間違いを犯すことに弱いことが判明した。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:32:36 GMT)
ABBA: Highly Expressive Hadamard Product Adaptation for Large Language Models [4.7] 大規模な言語モデルは、幅広いタスクにわたって強力なパフォーマンスを示してきましたが、それらを新しいドメインに効率的に適用することは、依然として重要な課題です。
ABBAは、独立に学習可能な2つの低ランク行列のアダマール積として更新を再パラメータ化する新しいPEFTアーキテクチャである。
以前の作業とは対照的に、ABBAは事前訓練された重量からアップデートを完全に切り離し、両方のコンポーネントを自由に最適化できる。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:17:49 GMT)
Training with Pseudo-Code for Instruction Following [4.7] 我々は、擬似コードで表現された場合、モデルが指示に従うことを示唆する最近の研究から着想を得た。
擬似コードで再表現された命令を含む命令調整データを用いた微調整大規模言語モデルを提案する。
我々は、5ドルの異なるモデルで厳密な実験を行い、擬似コードで訓練された場合、モデルが指示に従うだけでなく、数学的および常識推論に関連する他のタスクにもその能力を維持することを発見した。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:14:29 GMT)
LMask: Learn to Solve Constrained Routing Problems with Lazy Masking [4.7] 動的マスキングを利用して制約付きルーティング問題に対する高品質な実現可能なソリューションを生成する新しい学習フレームワークであるLMaskを提案する。
LMaskは最先端の実現率とソリューションの品質を達成し、既存のニューラルメソッドを上回っている。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:15:26 GMT)
Just as Humans Need Vaccines, So Do Models: Model Immunization to Combat Falsehoods [4.7] 生成AIモデルは、トレーニングコーパスに存在する偽情報を学習し、再現することが多い。
本稿は、AIモデルは、偽情報に対する"ワクチン"として明確にラベル付けされた偽装の、小さくて隔離されたセットで微調整されるべきである、と論じる。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:20:23 GMT)
5G-DIL: Domain Incremental Learning with Similarity-Aware Sampling for Dynamic 5G Indoor Localization [4.6] 本稿では,5G-DILと呼ばれる動的5G屋内ローカライゼーションのためのドメインインクリメンタルラーニング(DIL)手法を提案する。
本稿では,Chebyshev距離に基づく新しい類似性認識サンプリング手法を提案する。
本手法は実世界の非視線伝搬シナリオに適用可能であり, 動的環境条件下においても 0.261 m のMAE位置決め誤差を実現する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:54:58 GMT)
Sampling Strategies for Efficient Training of Deep Learning Object Detection Algorithms [4.6] 深層学習物体検出モデルの学習効率を高めるために,2つのサンプリング手法を検討した。
第1の戦略は一様サンプリングであり、オブジェクトの動的状態空間を通じて一様だがランダムにサンプルを取得しようとするものである。
フレーム差分サンプリングの第2の戦略は、連続するフレーム間の時間的冗長性を調べるために開発されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:54:01 GMT)
Stochastic Weight Sharing for Bayesian Neural Networks [4.6] 2次元適応分布,ワッサーシュタイン距離推定,アルファブレンディングを用いて,BNNの低次元軟ガウス表現の振る舞いを符号化する。
提案手法は, モデルパラメータを約50倍圧縮し, モデルサイズを75倍削減すると共に, 最先端技術に匹敵する精度と不確実性を推定する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:07:18 GMT)
ReqBrain: Task-Specific Instruction Tuning of LLMs for AI-Assisted Requirements Generation [4.5] ソフトウェアエンジニアはチャットベースのセッションを通じてReqBrainと関わり、ソフトウェア要件を自動的に生成できる。
最高性能のZephyr-7b-betaは、BERTスコアとFRUGALスコアを使用して89.30%のFlを達成した。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:45:46 GMT)
LLM-based Generative Error Correction for Rare Words with Synthetic Data and Phonetic Context [4.4] 稀な単語を対象とし,音声情報を組み込んだ新しいGER手法を提案する。
実験結果から,本手法は稀な単語の訂正を改善するだけでなく,WERとCERを低減させることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:54:52 GMT)
Investigating Language Preference of Multilingual RAG Systems [4.4] MRAGシステムは、クエリとドキュメント間の言語的バリエーションによって、関連する情報を取得するのに苦労する。
本稿では,翻訳された多言語パスを相補的なモデル知識で融合するフレームワークであるDual Knowledge Multilingual RAGを提案する。
実験結果から,DKM-RAGは言語嗜好を緩和し,多様な言語環境における性能向上を図っている。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:32:02 GMT)
System Message Generation for User Preferences using Open-Source Models [4.4] システムメッセージは、大規模言語モデル(LLM)との相互作用において重要な役割を果たす
我々は,システムメッセージを生成するパイプラインであるSysGenを紹介した。
SysGenデータ上でのオープンソースモデルのトレーニングは、シングルターン(Multifacet)とマルチターン(SysBench)の会話ベンチマークの両方で大幅に改善される。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:00:16 GMT)
What is the role of memorization in Continual Learning? [4.4] 本研究は,段階的な学習シナリオにおける記憶効果について研究する。
記憶率の高い学習例は,通常のサンプルよりも早く忘れられることが明らかとなった。
低メモリ状態においては、通常のサンプルを忘れることがより重要である。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:29:33 GMT)
Surfacing Semantic Orthogonality Across Model Safety Benchmarks: A Multi-Dimensional Analysis [4.4] UMAP次元の削減とkmeansクラスタリングによるセマンティッククラスタの評価を行った。
ベンチマーク表現の異なる6つの主要な調和カテゴリーを同定する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:53:11 GMT)
CAMME: Adaptive Deepfake Image Detection with Multi-Modal Cross-Attention [4.4] マルチヘッド・クロスアテンション機構を用いて,視覚,テキスト,周波数領域の機能を統合するフレームワークであるCAMMEを提案する。
実験では、CAMMEは最先端の手法よりも優れており、自然のシーンでは12.56%、顔のディープフェイクでは13.25%改善している。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:39:07 GMT)
Monocular Marker-free Patient-to-Image Intraoperative Registration for Cochlear Implant Surgery [4.3] 本フレームワークは単分子型外科顕微鏡とシームレスに統合され,追加のハードウェア依存や要件を伴わずに臨床応用に極めて有用である。
以上より, 術中CTスキャンを2次元の手術シーンに登録し, 角誤差が10度以内の症例では, 6次元カメラの撮影位置の予測に臨床的に関連性があることが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:15:00 GMT)
Preconditioned Langevin Dynamics with Score-Based Generative Models for Infinite-Dimensional Linear Bayesian Inverse Problems [4.2] スコアベース生成モデル(SGM)によって駆動されるランゲヴィン力学は、関数空間内で直接的に定式化される。
スコアの近似誤差に明示的に依存する誤差推定を初めて導いた。
その結果、基底函数空間上のクルバック・リーブラー発散における大域収束のための十分条件が得られる。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:12:04 GMT)
Enhancing Large Vision-Language Models with Layout Modality for Table Question Answering on Japanese Annual Securities Reports [4.2] In-table テキストコンテンツとレイアウト機能を組み込んだ LVLM を用いたテーブル理解手法を提案する。
実験により,これらの補助モーダルは性能を著しく向上することが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:36:22 GMT)
CIM-NET: A Video Denoising Deep Neural Network Model Optimized for Computing-in-Memory Architectures [4.2] CIMチップはメモリセルに統合することで、有望なソリューションを提供する。
既存のDNNモデルはCIMアーキテクチャの制約を考慮せずに設計されることが多い。
本稿では,2つのイノベーションを取り入れたハードウェア・アルゴリズム協調設計フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:26:56 GMT)
SEvoBench : A C++ Framework For Evolutionary Single-Objective Optimization Benchmarking [4.2] SEvoBenchは進化計算(EC)のための最新のC++フレームワーク
進化的単目的最適化アルゴリズムを体系的にベンチマークするように設計されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:23:10 GMT)
PEAR: Equal Area Weather Forecasting on the Sphere [4.1] HEALPix-features上で直接動作する変圧器を用いた天気予報モデルであるPangu Equal ARea(PEAR)を紹介する。
Pangu Equal AReaは、Driiscollで対応するモデルよりも優れています。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:37:12 GMT)
TSA-WF: Exploring the Effectiveness of Time Series Analysis for Website Fingerprinting [4.0] Webサイトフィンガープリント(Webサイトフィンガープリント、WF)とは、eavesdropperがターゲットユーザーがアクセスしているWebサイトを識別する技術である。
最近のWF攻撃は、機械学習プロセスを使用して構築され、特徴抽出フェーズでトレースメタデータを要約している。
本稿では,ネットワークトレースのタイミングと方向特性を正確に保存するパイプラインであるTSA-WFを紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:27:13 GMT)
Misaligning Reasoning with Answers -- A Framework for Assessing LLM CoT Robustness [4.0] 我々は,回答と推論の関係を調べるために,MATCHAという新しい評価フレームワークを設計する。
教育や医療といった分野では、推論は信頼性をモデル化するための鍵となる。
以上の結果から,LLMは論理的タスクよりも多段階・常識的タスクに対する入力摂動の脆弱性が大きいことが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:42:16 GMT)
EvidenceMoE: A Physics-Guided Mixture-of-Experts with Evidential Critics for Advancing Fluorescence Light Detection and Ranging in Scattering Media [4.0] 蛍光LiDAR (FliDAR) は、医療、自動車、その他の分野における距離と深さを推定する技術である。
取得されたFLiDAR信号の複雑な性質は、光子の飛行時間と固有の蛍光寿命の分離を極めて困難にする。
本稿では,多種多様な時間成分のモデリングに適した物理誘導混合実験フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:38:13 GMT)
E$^2$M: Double Bounded $α$-Divergence Optimization for Tensor-based Discrete Density Estimation [4.0] 本稿では、E$2Mアルゴリズムと呼ばれる予測最大化(EM)アルゴリズムの一般化を提案する。
Kullback-Leibler (KL) の発散に基づく代理対象の最小化に最適化を緩和することでこの問題を回避する。
このアプローチは、CP、Tucker、Trainフォーマットなど、さまざまな低ランク構造に対してフレキシブルなモデリングを提供します。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:52:56 GMT)
A Foundation Model Framework for Multi-View MRI Classification of Extramural Vascular Invasion and Mesorectal Fascia Invasion in Rectal Cancer [3.9] 直腸癌では, 血管外浸潤 (EVI) と中腸間膜間膜浸潤 (MFI) が重要視される。
基礎モデルの特徴,調和,多視点融合は直腸MRIの診断性能を著しく向上させる。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:04:27 GMT)
AstroMLab 4: Benchmark-Topping Performance in Astronomy Q&A with a 70B-Parameter Domain-Specialized Reasoning Model [3.9] 汎用的な大規模言語モデルは、しばしば専門的なドメイン知識に苦しむ。
本研究では、ドメイン特化自然言語AIアシスタントであるAstroSage-70Bを紹介する。
天文学、天体物理学、宇宙科学、天体物理学、宇宙論、天文学機器の研究と教育のために設計された。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:58:50 GMT)
A Minimalist Method for Fine-tuning Text-to-Image Diffusion Models [3.9] ノイズPPOは、初期雑音発生器を学習する最小限の強化学習アルゴリズムである。
実験により、ノイズPPOは元のモデルよりもアライメントとサンプル品質を一貫して改善することが示された。
これらの知見は拡散モデルにおける最小主義的RL微調整の実用的価値を裏付けるものである。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:01:52 GMT)
Spectral Mixture Kernels for Bayesian Optimization [3.9] 本稿では,スペクトル混合カーネルを組み込んだガウス過程に基づく新しいBO法を提案する。
この手法は効率と最適化性能の両方において大幅に向上する。
最適な情報を得る際の情報獲得と累積的後悔の限界を提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:07:26 GMT)
Evolving Machine Learning: A Survey [3.8] この調査は、データドリフト、コンセプトドリフト、破滅的な忘れ、歪んだ学習、ネットワーク適応の5つの主要な課題に焦点を当てている。
我々は120以上の研究を体系的にレビューし、教師なし、教師なし、および半教師なしのアプローチにまたがって最先端の手法を分類した。
我々の研究は、研究者や実践者が実世界の展開のために堅牢で倫理的でスケーラブルなシステムを開発するのをガイドすることを目的としている。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:50:02 GMT)
Table-Critic: A Multi-Agent Framework for Collaborative Criticism and Refinement in Table Reasoning [3.7] Table-Criticは、協調的な批判と推論プロセスの反復的な洗練を促進する、新しいマルチエージェントフレームワークである。
枠組みは, エラー識別審査員, 包括的批判批判者, プロセス改善の精錬者, パターン蒸留のキュレーターの4つの特殊エージェントから構成される。
計算効率と解分解率の低下を保ちながら、テーブル・クライトは精度と誤差補正率に優れることを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:18:47 GMT)
LLäMmlein: Compact and Competitive German-Only Language Models from Scratch [3.7] 我々は、2つのドイツ専用デコーダモデル、LL"aMmlein 120Mと1Bを作成し、それらをスクラッチから透過的に公開し、トレーニングデータとともに、ドイツのNLP研究コミュニティが使用できるようにしました。
モデルトレーニングには、広範なデータ前処理、カスタムなドイツのトークン化器の作成、トレーニング自体、および様々なベンチマークの最終モデルの評価など、いくつかの重要なステップが含まれていた。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:18:16 GMT)
RECIPE-TKG: From Sparse History to Structured Reasoning for LLM-based Temporal Knowledge Graph Completion [3.7] 時間的知識グラフ(TKG)は、実体間のタイムスタンプ付き関係として動的事実を表す。
重要かつ軽量でデータ効率のよいフレームワークであるRECIPE-TKGを導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:11:40 GMT)
Adversarial Robustness in Two-Stage Learning-to-Defer: Algorithms and Guarantees [3.7] 2段階のL2D(Learning-to-Defer)は、各入力を固定されたメインモデルまたは複数のオフライン専門家のいずれかに割り当てることで、最適なタスクデリゲートを可能にする。
既存のL2Dフレームワークはクリーンな入力を前提としており、クエリ割り当てを操作できる敵の摂動に弱い。
2段階L2Dシステムにおける対向ロバスト性の最初の包括的研究について述べる。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:24:23 GMT)
Reward Model Overoptimisation in Iterated RLHF [3.7] RLHF(Reinforcement Learning from Human feedback)は、大規模言語モデルと人間の好みを整合させる手法である。
RLHFはしばしば報酬モデルの過度な最適化に悩まされ、モデルが報酬関数に過度に適合する。
反復RLHFにおける過最適化の総合的研究について紹介する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:36:13 GMT)
Pixels to Prognosis: Harmonized Multi-Region CT-Radiomics and Foundation-Model Signatures Across Multicentre NSCLC Data [3.7] 非小細胞肺癌(NSCLC)患者におけるハーモニゼーションと多領域機能統合は生存予測を改善する。
5施設876名のNSCLC患者のCTスキャンと臨床データを解析した。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:41:52 GMT)
COUNTDOWN: Contextually Sparse Activation Filtering Out Unnecessary Weights in Down Projection [3.6] スパースアクティベーションメソッドは、推論中に非必須パラメータを選択的に非活性化する。
間接係数を利用するM-COUNTDOWNと、線形結合の直接係数を利用するD-COUNTDOWNの2つの方法を提案する。
我々のカーネル実装は、これらの理論的な成果を実質的な実世界の加速に効果的に実現している。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:10:22 GMT)
Towards Uncertainty Aware Task Delegation and Human-AI Collaborative Decision-Making [3.6] 本稿では,AIへのタスクデリゲートのための距離ベース不確実性スコアの探索の有用性について検討する。
これらのスコアは、人間とAIによる意思決定のための埋め込み表現によってどのように視覚化されるかを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:12:39 GMT)
A Retrieval-Based Approach to Medical Procedure Matching in Romanian [3.6] 命名規則の不整合は、誤った手続きにつながり、行政上の非効率性や保険請求問題を引き起こす。
本稿では,ルーマニアの医療システムにおける医療名マッチングのための文埋め込みを利用した検索型アーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:40:23 GMT)
Corporate Needs You to Find the Difference: Revisiting Submodular and Supermodular Ratio Optimization Problems [3.6] 平均値 $ f(S)/|S| $ を小モジュラーあるいは超モジュラーな集合関数 f: 2V から算術 $ への最小化や最大化の問題について研究する。
これは、Densest Subgraph (DSG)、Densest Supermodular Set (DSS)、Submodular Minimization (SFM)といった古典的な問題を一般化する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:55:11 GMT)
Can Large Language Models Invent Algorithms to Improve Themselves?: Algorithm Discovery for Recursive Self-Improvement through Reinforcement Learning [3.6] 自己開発(Self-Developing)は、大規模言語モデルが独自の改善アルゴリズムを自律的に発見し、実装し、洗練することを可能にするフレームワークである。
モデルマージ(モデルマージ)により、このフレームワークを実証する。
数学的推論のベンチマークでは、自律的に発見されたアルゴリズムは、シードモデルのGSM8kのパフォーマンスを6%改善し、タスク算術のような人間設計のアプローチを4.3%上回った。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:06:53 GMT)
Fair Clustering via Alignment [3.6] クラスタリングにおけるアルゴリズムフェアネスは、与えられた機密属性に対して各クラスタに割り当てられたインスタンスの割合をバランスさせることを目的としている。
本稿では, 対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対
論文参考訳(メタデータ) (Fri, 23 May 2025 05:42:18 GMT)
Efficient Flow Matching using Latent Variables [3.6] 我々は、マルチモーダルデータ構造を組み込むための簡易なトレーニング/推論戦略を提供する、$textttLatent-CFM$を提示する。
textttLatent-CFM$は、トレーニングを著しく減らして、生成品質が向上していることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:49:37 GMT)
Will Large Language Models Transform Clinical Prediction? [3.6] 大規模言語モデル(LLM)は、医療への関心が高まっている。
大規模なデータセットを効果的に要約し、質問に正確に答え、合成されたテキストを生成する能力は広く認識されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:02:04 GMT)
Development of Interactive Nomograms for Predicting Short-Term Survival in ICU Patients with Aplastic Anemia [3.6] 無形成性貧血は稀な致命的血液疾患であり,汎血球減少と骨髄不全を特徴とする。
MIMIC-IVデータベースを用いて、再生不良性貧血のICU患者を同定し、5つの領域から臨床像を抽出した。
7日間,14日間,28日間の死亡を予測するために,ロジスティック回帰モデルとコックス回帰モデルを構築した。
論文参考訳(メタデータ) (Fri, 23 May 2025 23:01:11 GMT)
Explainable Anatomy-Guided AI for Prostate MRI: Foundation Models and In Silico Clinical Trials for Virtual Biopsy-based Risk Assessment [3.5] MRIによる前立腺癌(PCa)のリスク階層化のための,完全に自動化された,解剖学的に指導されたディープラーニングパイプラインを提案する。
パイプラインは、前立腺とそのゾーンを軸方向のT2強調MRI上にセグメント化するためのnnU-Netモジュール、オプションの解剖学的先行と臨床データで3Dパッチに微調整されたDiceedPT Swin Transformer基盤モデルに基づく分類モジュール、決定駆動画像領域をローカライズする反ファクトなヒートマップを生成するVAE-GANフレームワークの3つの重要なコンポーネントを統合する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:40:09 GMT)
AI/ML for 5G and Beyond Cybersecurity [3.5] 我々は5Gおよびセキュリティ以上のAI/ML技術の役割についてレビューする。
我々は、AI/ML技術を使用して、5Gを予測し、緩和するための視点を提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:12:50 GMT)
Fundamental Limitations on Subquadratic Alternatives to Transformers [3.5] 文書類似性タスクに重点を置いており、入力された多くの文書として与えられ、最もよく似たペアを見つけたいと思っています。
我々はTransformerがこのタスクを実行できることを証明し、このタスクはどんなアルゴリズムでも真に四分数時間で実行できないことを証明した。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:07:03 GMT)
Robust Invariant Representation Learning by Distribution Extrapolation [3.5] 不変リスク最小化(IRM)は、ディープラーニングにおけるアウト・オブ・ディストリビューションの一般化を可能にすることを目的としている。
IRMv1を含む既存のアプローチでは、ペナルティベースの単一レベル近似を採用している。
合成分布シフトによるITMペナルティの増大により環境多様性を高める新しい枠組みが提案されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 01:48:03 GMT)
Robust Distributed Estimation: Extending Gossip Algorithms to Ranking and Trimmed Means [3.5] 本研究では,大域的にロバストな数値を推定することにより,外乱平均を計算することができることを示す。
我々は,textscGoRankと呼ばれるランク推定のための新しいゴシップアルゴリズムを提案し,それを応用して,トリミング平均推定専用のゴシップ手順を設計する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:51:03 GMT)
CENet: Context Enhancement Network for Medical Image Segmentation [3.5] 本稿では,2つの重要なイノベーションを特徴とする新しいセグメンテーションフレームワークであるCENetを提案する。
まず、スキップ接続に統合されたDual Selective Enhancement Block(DSEB)は境界の詳細を高め、コンテキスト対応で小さな臓器の検出を改善する。
第二に、デコーダのContext Feature Attention Module (CFAM)は、空間的整合性を維持し、特徴の冗長性を低減し、過剰に拡張された表現を緩和するために、マルチスケールの設計を採用している。
論文参考訳(メタデータ) (Fri, 23 May 2025 23:22:18 GMT)
A Two-Stage Learning-to-Defer Approach for Multi-Task Learning [3.4] 本稿では,マルチタスク学習のための新しい2段階L2Dフレームワークを提案する。
提案手法は2段階のサロゲート損失ファミリーを利用し,Bayes-consistentと$(mathcalG, MathcalR)$-consistentの両方を証明した。
物体検出と電子健康記録解析の実験は,我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:03:56 GMT)
MathEDU: Towards Adaptive Feedback for Student Mathematical Problem-Solving [3.3] 本稿では,大規模言語モデル(LLM)の学習者の数学的問題解決プロセスの評価と適応的なフィードバックを提供する能力について考察する。
モデルが学生の事前回答履歴にアクセス可能なシナリオと、コールドスタートコンテキストをシミュレートするシナリオの2つについて、パーソナライズされた学習を支援するモデルの能力を評価する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:59:39 GMT)
Meaning Is Not A Metric: Using LLMs to make cultural context legible at scale [3.3] 我々は、大規模言語モデル(LLM)は、AIベースの社会技術システムにおいて前例のない規模で、文化的文脈、つまり人間の意味を作ることができると論じる。
私たちはこれを、生成AIの適用にとって重要な方向として捉え、重要な5つの課題を特定します。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:10:42 GMT)
Retrieval-Augmented Fine-Tuning With Preference Optimization For Visual Program Generation [3.3] 本稿では,視覚プログラム言語(VPL)の生成を促進するための2段階のトレーニング戦略を提案する。
まず,産業用VPLでよく見られるサブルーチンの反復的使用を活用するために,検索強化微調整を用いる。
第2に、モデルをさらに正確な出力に導くために、直接選好最適化(DPO)を適用する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:53:20 GMT)
An alignment safety case sketch based on debate [3.3] 提案された解決策の1つは、システムの出力の欠陥を議論を通じて指摘するために、別の超人的システムを活用することである。
本稿では,AIの安全性に関する議論の価値について概説する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:45:17 GMT)
BEDI: A Comprehensive Benchmark for Evaluating Embodied Agents on UAVs [3.2] 無人航空機(UAV)をベースとした身体エージェントは、自律的なタスクにおいて大きな可能性を秘めている。
UAV-EA(UAV-Embodied Agents)の現在の評価手法は、標準化されたベンチマークの欠如によって制限されている。
我々は,UAV-EAを評価するために設計された,体系的で標準化されたベンチマークであるBEDI(Benchmark for Embodied Drone Intelligence)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:14:00 GMT)
Are We Learning the Right Features? A Framework for Evaluating DL-Based Software Vulnerability Detection Solutions [3.2] 本論文は,本領域における研究を適切に評価するための基盤を提供することを目的とする。
脆弱性に寄与するコードの構文的および意味的特徴に対する脆弱性データセットを分析する。
この表現は、コード内の脆弱性と突発的な機能の両方の存在を検出するのに使われます。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:48:07 GMT)
Automated Knowledge Component Generation and Knowledge Tracing for Coding Problems [3.2] 知識コンポーネント(KC)は、生徒の学習をモデル化し、きめ細かいスキルの熟達レベルを追跡するのに役立つ問題にマッピングされる。
我々は、KC生成とタグ付けのための完全に自動化されたLLMベースのパイプラインを、オープンエンドプログラミング問題に対して提示する。
KCGen-KTは,今後の学生の反応予測において,既存のKT手法や人書きKCよりも優れていた。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:21:50 GMT)
TEDI: Trustworthy and Ethical Dataset Indicators to Analyze and Compare Dataset Documentation [3.2] マルチモーダルデータセットの信頼性と倫理的属性を特徴付ける143の指標を含むTEDIを紹介する。
TEDIを用いて、人間の声を含む100以上のマルチモーダルデータセットを手動でアノテートし分析した。
同意、プライバシー、有害なコンテンツ指標に関連する属性やプラクティスを文書化したデータセットは、ごくわずかしかありません。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:55:33 GMT)
F-ANcGAN: An Attention-Enhanced Cycle Consistent Generative Adversarial Architecture for Synthetic Image Generation of Nanoparticles [3.1] F-ANcGANは,限られたデータサンプルを用いて学習可能な,注目度の高いサイクル一貫した生成対向系である。
本モデルでは,構造的関係を捉えるために,自己アテンションを備えたスタイルU-NetジェネレータとU-Netセグメンテーションネットワークを用いる。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:02:22 GMT)
SHARDeg: A Benchmark for Skeletal Human Action Recognition in Degraded Scenarios [3.1] 骨格的人間行動認識(SHAR)は、多くのCVパイプラインにおいて、リアルタイムおよびエッジで動作する。
これはSkeletal Human Action Recognition (SHAR)によって実証されており、多くのCVパイプラインにおいてリアルタイムおよびエッジで運用されている。
従来検討されていなかった劣化形態が,モデル精度に大きな影響を与えることを示すことで,このベンチマークの必要性を実証する。
劣化したSHARデータにおけるフレームの時間的規則性は、モデル性能の違いの主要な要因である可能性が高い。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:52:31 GMT)
From Flight to Insight: Semantic 3D Reconstruction for Aerial Inspection via Gaussian Splatting and Language-Guided Segmentation [3.0] 高忠実度3D再構成は, インフラ監視, 構造評価, 環境調査などの航空検査業務において重要である。
従来のフォトグラム法は幾何学的モデリングを可能にするが、意味論的解釈性に欠け、自動検査の有効性を制限している。
ニューラルレンダリングと3Dガウススプラッティング(3DGS)の最近の進歩は、効率的でフォトリアリスティックな再構築を提供するが、同様にシーンレベルの理解が欠如している。
言語誘導型3DセグメンテーションのためにFeature-3DGSを拡張するUAVベースのパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:35:46 GMT)
Feasible Action Space Reduction for Quantifying Causal Responsibility in Continuous Spatial Interactions [3.0] Feasible Action-Space Reduction (FeAR) は、個別のアクションを持つグリッドワールドにおける因果責任の指標として提案されている。
実世界の相互作用は連続的な行動空間を含むため,空間-連続的相互作用における因果責任を測定するためのFeAR計量の定式化を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:02:44 GMT)
Real-time Traffic Accident Anticipation with Feature Reuse [3.0] 本稿では,1つの事前学習対象検出器の中間機能を利用する軽量なフレームワークを提案する。
RAREは、DADとCDベンチマークの既存のアプローチよりも4~8倍のスピードアップを実現している。
複雑さが減ったにもかかわらず、最先端の平均精度を達成し、瞬時に衝突を確実に予測する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:09:26 GMT)
Unsupervised Clustering for Fault Analysis in High-Voltage Power Systems Using Voltage and Current Signals [3.0] 本稿では,高電圧系統の故障診断における教師なしクラスタリング手法の適用について検討する。
Reseau de Transport d'Electricite (RTE) によって提供されるデータセットを解析し、Fast Fourier Transform (FFT) を用いて周波数領域の特徴を抽出する。
K-Meansアルゴリズムはデータの基本パターンを特定するために適用され、ラベル付きトレーニングサンプルを必要とせずに自動故障分類を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:35:09 GMT)
Finetuning-Activated Backdoors in LLMs [2.9] オープンにアクセス可能なLarge Language Models (LLM) は、タスク固有のパフォーマンス改善を実現するための標準的なプラクティスとなっている。
これまで、微調整は、良質なデータセットのトレーニングが予測可能な振る舞いをもたらす、制御されたセキュアなプロセスとみなされてきた。
敵が最初に毒を盛ったLSMを作成できるのは初めてであり、最初は悪質に見えるが、下流のユーザーによって微調整された悪質な行動を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:38:26 GMT)
Navigating Pitfalls: Evaluating LLMs in Machine Learning Programming Education [2.9] 本研究では,機械学習教育における学習支援における大規模言語モデルの利用について検討する。
機械学習コードにおけるプラクティスの一般的なエラーを識別するLLMの機能と、学習をガイドできるフィードバックを提供する能力に焦点を当てている。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:39:58 GMT)
Training-efficient density quantum machine learning [2.9] 我々は、トレーニング可能なユニタリの混合を準備するモデルファミリーである密度量子ニューラルネットワークを導入する。
このフレームワークは、特に量子ハードウェア上で、表現性と効率的なトレーサビリティのバランスをとる。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:51:37 GMT)
Beyond Discreteness: Finite-Sample Analysis of Straight-Through Estimator for Quantization [2.9] この研究は、ニューラルネットワーク量子化の文脈におけるストレートスルー推定器(STE)の最初の有限サンプル解析を示す。
具体的には、2重みとアクティベーションを持つ2層ニューラルネットワークの量子化学習を解析することにより、データの次元性の観点から、サンプルの複雑さを導出する。
ラベルノイズの存在下では,STE-gradient法の興味深い再帰性を明らかにする。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:11:22 GMT)
Source Separation of Small Classical Ensembles: Challenges and Opportunities [2.8] 非因果深層学習を用いた西洋ポピュラー音楽の音源分離は非常に効果的である。
クラシック音楽のためのMSSは未解決の問題である。
古典的なアンサンブルは、音楽に固有の大きなバリエーションのような問題のために、ポピュラー音楽よりも分離するのが困難である。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:39:23 GMT)
Stable Reinforcement Learning for Efficient Reasoning [2.8] GRPO-$lambda$ は GRPO の効率的で安定な変種である。
正当率を監視して報酬戦略を動的に調整する。
平均精度は1.48%向上し、CoT配列の長さは47.3%削減された。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:43:03 GMT)
A Review of Pseudo-Labeling for Computer Vision [2.8] ディープニューラルネットワークは、しばしば効果的に一般化するためにラベル付きサンプルの大きなデータセットを必要とする。
活発な研究の重要な領域は半教師あり学習であり、代わりに大量の(容易に取得された)未ラベルのサンプルを使おうとする。
本研究では,自己監督手法と教師なし手法の両方において,擬似ラベルのより広範な解釈について検討する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:22:09 GMT)
Judging It, Washing It: Scoring and Greenwashing Corporate Climate Disclosures using Large Language Models [2.8] 本研究では, LLM-as-a-Judge(LLMJ)手法を用いて, 排出削減目標および進捗状況の企業からの報告を評価する。
精度と長さの制約を考慮した応答をグリーンウォッシュするよう促されたLLMの挙動を探索する。
2つのLCMJスコアリングシステム(数値評価とペア比較)がハイパフォーマンスな企業と他社を区別するのに有効であることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:23:26 GMT)
Measuring diversity of synthetic prompts and data generated with fine-grained persona prompting [2.8] 我々は,ペルソナ駆動の合成プロンプトと応答の多様性を,語彙的多様性と冗長性の指標を用いて測定する。
人工的なプロンプトは人書きのプロンプトに比べて著しく多様性が低いことが判明した。
ペルソナ・プロンプティングは語彙的多様性(特に大きなモデルでは)を改善するが、ペルソナの細かい詳細さは顕著に多様性を増すことはない。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:00:00 GMT)
Wasserstein Transfer Learning [2.8] 本稿では,ワッサーシュタイン空間に分布する確率分布を出力とする回帰モデルにおいて,伝達学習のための新しいフレームワークを提案する。
転送可能なソース領域の情報的部分集合が知られているとき、我々は、転送効率に対するドメイン類似性の影響を定量化する、証明可能な収束率を持つ推定器を提案する。
情報的サブセットが不明な場合には、負の転送を緩和するデータ駆動型転送学習手法を開発する。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:38:03 GMT)
Single-agent or Multi-agent Systems? Why Not Both? [2.8] マルチエージェントシステム(MAS)は複雑なタスクを分解し、サブタスクを異なる言語モデル(LLM)エージェントやツールに委譲する。
我々は,MASと単一エージェントシステム(SAS)を比較した実証的研究を行った。
我々の設計では、さまざまなエージェントアプリケーションに対して、デプロイメントコストを最大20%削減しながら、精度を1.1-12%向上させる。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:30:24 GMT)
POSTER: A Multi-Signal Model for Detecting Evasive Smishing [2.7] 本研究では,国別セマンティックタグ,構造パターンタグ,文字レベルのスタイリスティックキュー,文脈語句埋め込みを組み合わせたマルチチャネルスマイシング検出モデルを提案する。
私たちは、24,086個のスマイシングサンプルを含む5つのデータセットで84,000以上のメッセージをキュレートし、レバーベリングしました。
我々の統合アーキテクチャは、97.89%の精度、0.963のF1スコア、99.73%のAUCを達成し、多種多様な言語的および構造的手がかりを捉え、シングルストリームモデルより優れている。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:45:34 GMT)
Task Specific Pruning with LLM-Sieve: How Many Parameters Does Your Task Really Need? [2.7] 大きな言語モデル(LLM)は、狭義のタスクにますます採用されている。
タスクには実際に何つのパラメータが必要ですか?
LLM-Sieveは,LLMのタスク固有プルーニングのための,最初の包括的フレームワークである。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:17:20 GMT)
PawPrint: Whose Footprints Are These? Identifying Animal Individuals by Their Footprints [2.7] PawPrintとPawPrint+は、犬と猫の個々のレベルのフットプリント識別に焦点を当てた、初めて公開されたデータセットである。
基板の複雑さやデータの可用性に応じて,様々な利点と欠点を観察する。
このアプローチは、従来のIDタグに代わる非侵襲的な代替手段を提供するため、倫理的ペット管理や野生生物保護活動における有望な応用を期待する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:02:04 GMT)
ARFC-WAHNet: Adaptive Receptive Field Convolution and Wavelet-Attentive Hierarchical Network for Infrared Small Target Detection [2.6] ARFC-WAHNetは、赤外線小ターゲット検出のための適応型受容野畳み込みおよびウェーブレット減衰階層ネットワークである。
ARFC-WAHNetは、検出精度とロバスト性の両方において、最近の最先端手法よりも優れている。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:47:23 GMT)
OpenTCM: A GraphRAG-Empowered LLM-based System for Traditional Chinese Medicine Knowledge Retrieval and Diagnosis [2.6] 伝統的な中国医学(TCM)は、現代医療において重要な役割を担っている古代医学知識の豊富なリポジトリである。
TCMの文献の複雑さと広さのため、AIテクノロジの統合は、その近代化とより広範なアクセシビリティにおいて重要である。
本稿では、ドメイン固有のTCM知識グラフとグラフベースの検索拡張生成(GraphRAG)を組み合わせたLLMベースのOpenTCMを開発する。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:43:56 GMT)
ViP$^2$-CLIP: Visual-Perception Prompting with Unified Alignment for Zero-Shot Anomaly Detection [2.6] ゼロショット異常検出(ZSAD)は、外部補助データのみに依存するため、ターゲットドメインのトレーニングサンプルを使わずに異常を検出することを目的としている。
既存のCLIPベースのメソッドは、手作りまたは静的学習可能なプロンプトを介してモデルのZSAD電位を活性化しようとする。
ViP$2$-CLIPは、グローバルおよびマルチスケールのローカルビジュアルコンテキストを融合させ、微粒なテキストプロンプトを適応的に生成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:01:11 GMT)
Hephaestus Minicubes: A Global, Multi-Modal Dataset for Volcanic Unrest Monitoring [2.6] ヘファエスタス・ミニキューブス(Hephaestus Minicubes)は、7年間にわたって世界でも最も活発な火山44点をカバーする38の時間的データキューブのコレクションである。
それぞれの時間的データキューブは、InSARの製品、地形データ、およびInSAR画像の地上変形を模倣する信号遅延を導入することで知られている大気変数を統合している。
本稿では, 変形現象の種類, 強度, 空間的範囲を詳述する専門家アノテーションと, 観察されたシーンのリッチテキスト記述について述べる。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:55:41 GMT)
"I will never pay for this" Perception of fairness and factors affecting behaviour on 'pay-or-ok' models [2.6] 本研究は,クッキーペイウォールに対する利用者の認識,公平性判断,支払を検討するための条件について検討した。
参加者は主にクッキーのペイウォールを利益主導とみなし、公正感は同意や支払い以上の第3の選択肢が存在するなどの要因によって異なるとみなした。
私たちの発見は、プライバシーとデータ保護が基本的権利よりも特権になるかもしれない経済排除に関する懸念を提起します。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:21:08 GMT)
Deterministic generation of nonclassical mechanical states in cavity optomechanics via reinforcement learning [2.6] 本稿では,空洞光学系における非古典的力学状態を決定論的に生成する手法を提案する。
我々はパルス駆動場の最適化に強化学習法を用いる。
我々の結果は量子光学と量子情報科学における量子状態工学の機会を生み出す。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:31:28 GMT)
Quantum Security Analysis of the Key-Alternating Ciphers [2.5] キー交換暗号(KAC)の量子セキュリティについて検討する。
Q1$モデルのマルチラウンドKACに対する最初の非自明な量子鍵回収攻撃を与える。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:27:54 GMT)
From Course to Skill: Evaluating LLM Performance in Curricular Analytics [2.5] 大規模言語モデル(LLM)は、大規模で非構造化のカリキュラムデータを扱うことを約束している。
我々は,LLMや従来のNLP法に基づく4つのテキストアライメント戦略を体系的に評価した。
本研究は, 簡潔かつ抽象的なカリキュラム文書の分析において, LLMsが持つ可能性を明らかにするとともに, その性能がモデル選択やプロンプト戦略に大きく依存することを明らかにする。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:39:57 GMT)
Hard Negative Mining for Domain-Specific Retrieval in Enterprise Systems [2.5] ドメイン固有の企業データに特化して設計された,スケーラブルなハード負のマイニングフレームワークを提案する。
提案手法は意味論的に難しいが文脈的に無関係な文書を動的に選択し,デプロイされた再ランクモデルを強化する。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:51:20 GMT)
DiffNMR2: NMR Guided Sampling Acquisition Through Diffusion Model Uncertainty [2.5] 本稿では,タンパク質NMRデータに基づく拡散モデルに基づく新しいサブサンプリング手法を提案する。
提案手法は, モデル不確実性を用いてアンダーサンプルスペクトルを反復的に再構成し, その後のサンプリングをガイドし, 取得時間を著しく短縮する。
この進歩は、薬物発見から物質科学まで、迅速かつ高分解能のスペクトル分析が不可欠である多くの応用を約束する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:05:02 GMT)
TrackRAD2025 challenge dataset: Real-time tumor tracking for MRI-guided radiotherapy [2.5] このデータセットは、6つのセンターから585人の患者に2D cine MRIの矢状画像から作成されている。
より正確な運動管理と適応的な治療戦略を可能にすることにより、このデータセットは放射線治療の分野を著しく前進させる可能性がある。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:17:28 GMT)
Selection Mechanisms for Sequence Modeling using Linear State Space Models [2.4] 制御理論の方法論に触発された代替選択機構を導入する。
本稿では,線形時間不変(LTI)システムにおける異常検出戦略に類似した,新しい選択用残差発生器を提案する。
提案手法は,複数のLTIシステムを組み合わせて,学習中に有益な特性を保ちながら,同等の選択性を実現している。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:08:56 GMT)
Random Feature Representation Boosting [2.4] 本稿では, ブースティング理論を用いて, RFNNを構成する新しい手法であるRandom Feature Representation Boosting(RFRBoost)を紹介する。
RFRBoostは各レイヤでランダムな機能を使用してネットワーク表現の機能的勾配を学習し、RFNNの凸最適化の利点を保ちながら性能を向上させる。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:07:15 GMT)
Explainability Through Human-Centric Design for XAI in Lung Cancer Detection [2.4] XpertXAI(XpertXAI)について検討した。
XpertXAIは、複数の肺疾患を検出するためにスケーリングしながら、人間の解釈可能な臨床概念を保存する。
既存の手法では臨床的に意味のある説明が得られないことが多い。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:43:45 GMT)
EMRA-proxy: Enhancing Multi-Class Region Semantic Segmentation in Remote Sensing Images with Attention Proxy [2.4] 本稿では,CRA (Contextual Region Attention) とGCR (Global Class Refinement) の2つのコンポーネントからなる新しいアプローチであるRegional-Aware Proxy Network (RAPNet)を提案する。
RAPNetは、より柔軟なセグメンテーションのために、リージョンレベルで動作している。
3つの公開データセットの実験では、RAPNetは最先端の手法よりも優れ、より優れたマルチクラスのセグメンテーション精度を実現する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:30:45 GMT)
Non-Clifford gates between stabilizer codes via non-Abelian topological order [2.4] 安定化符号間の非クリフォード論理ゲートを中間ステップとして非アベリア位相列に絡み合わせることで実装するプロトコルを提案する。
従来のアプローチを一般化し、キュディ曲面符号間の多くの非クリフォードおよび非対角論理ゲートを生成するフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:01:38 GMT)
Human-Centered AI Communication in Co-Creativity: An Initial Framework and Insights [2.3] 本稿では,共同創造型AIのためのフレームワーク・フォー・AIコミュニケーション(FAICO)の初期設計について述べる。
FAICOはAIコミュニケーションの重要な側面とユーザエクスペリエンスへの影響を示し、人間中心のAIコミュニケーションを設計するための予備的なガイドラインを提供する。
その結果,線形通信よりも人間とAIのフィードバックループを優先することが判明した。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:19:37 GMT)
Task-Optimized Convolutional Recurrent Networks Align with Tactile Processing in the Rodent Brain [2.3] 触覚は神経科学では理解されておらず、視覚や言語に比べて人工システムでは効果が低い。
本稿では,現実的な触覚入力シーケンスに基づいてトレーニングされたタスク最適化時間ニューラルネットワークの空間を探索する新しいAttender-Decoder(EAD)フレームワークを提案する。
我々は,畳み込みリカレントニューラルネットワーク(ConvRNN)を,触覚分類のための純粋に前向きおよび状態空間アーキテクチャに優れたエンコーダとして同定する。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:40:28 GMT)
Leveraging KANs for Expedient Training of Multichannel MLPs via Preconditioning and Geometric Refinement [2.2] マルチレイヤパーセプトロン(MLP)は、様々な現代的なディープラーニングフレームワークで使用される機械学習アーキテクチャである。
近年、コルモゴロフ・アルノルドネットワーク(KAN)は、様々な問題での成功により、ますます人気が高まっている。
本稿では,kansとマルチチャネルの関係を利用して,高速な訓練方法に関する構造的洞察を得る。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:41:18 GMT)
Evaluating the Energy-Efficiency of the Code Generated by LLMs [2.2] 本稿では,878のプログラミング問題に対して,20の一般的な大規模言語モデルが生成するコードのエネルギー効率について検討する。
研究されたLLMのうち、DeepSeek-v3とGPT-4oは最もエネルギー効率の良いコードを生成する。
動的プログラミング、バックトラック、ビット操作のような特定のアルゴリズム群では、LLM生成コードは人間の生成した標準解の最大450倍のエネルギーを消費することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:13:27 GMT)
Benchmarking Early Agitation Prediction in Community-Dwelling People with Dementia Using Multimodal Sensors and Machine Learning [2.2] 扇動は認知症に罹患する人々の最も一般的な反応行動の1つである。
動揺のタイムリーな予測は早期介入を可能にし、介護者の負担を軽減し、患者と介護者の双方の生活の質を向上させる。
本研究の目的は,認知症高齢者の動揺を早期に予測するための機械学習アプローチを開発し,評価することである。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:53:05 GMT)
LLM assisted web application functional requirements generation: A case study of four popular LLMs over a Mess Management System [2.1] 本稿では,Large Language Models (LLMs) の性能を比較したケーススタディを提案する。
この研究は、LLMが生成するユースケース、ビジネスルール、そしてそれらの構文的、意味的正当性、一貫性、完全性の観点から協調的に評価した。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:25:50 GMT)
Locality-Sensitive Hashing for Efficient Hard Negative Sampling in Contrastive Learning [2.1] 本稿では, 実数値特徴ベクトルを2進表現に量子化するGPUフレンドリーな局所性感性ハッシュ法を提案する。
当社のアプローチは,既存の強硬な負の採掘戦略よりもはるかに少ない性能で,同等あるいは優れた性能を実現している。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:58:42 GMT)
Revisiting Hyperparameter Tuning with Differential Privacy [2.1] 我々は、差分プライバシーを持つプライバシー保護機械学習のためのフレームワークを提供する。
我々は、超パラメータチューニングによって引き起こされる追加のプライバシー損失が、得られたユーティリティの平方根によって上界にあることを示す。
追加のプライバシー損失は、実用用語の対数の平方根のように経験的にスケールし、二重化ステップの設計の恩恵を受けることに留意する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:54:48 GMT)
Higher-order topological phases protected by non-invertible and subsystem symmetries [2.1] 我々は、高次対称性保護位相(SPT)位相の枠組みを非可逆対称性を含むよう拡張する。
対称性を保護したコーナーモードをホストする2+1$次元の2階SPT位相の具体的なモデルを構築する。
また,非可逆対称性で保護されたヒンジモードを示す3+1$次元の2次SPT位相を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:19:25 GMT)
Parameter Symmetry Potentially Unifies Deep Learning Theory [2.0] 我々は,AI理論の統一におけるパラメータ対称性の研究方向の役割を提唱する。
この研究の方向性は、ニューラルネットワークにおける3つの異なる階層の統一的な理解につながる可能性がある、と私たちは主張する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:22:54 GMT)
Performance of Quantum Approximate Optimization with Quantum Error Detection [2.0] 量子近似最適化アルゴリズム(QAOA)は、スケールアップに期待できる候補である。
QAOAでより優れた古典的なパフォーマンスを達成するには、耐障害性が必要であると考えられている。
我々は,QAOAのフォールトトレラントな実装を$[[k+2,k,2]$ Icebergのエラー検出コードを用いて実証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:48:06 GMT)
Leveraging Stochastic Depth Training for Adaptive Inference [2.0] 本稿では,ゼロオーバーヘッド,単一モデル,時間予測可能な推論を用いた適応推論の簡易かつ効果的な代替手法を提案する。
従来のResNetと比較して、精度0.71%の低下で最大2倍の効率向上を実現した。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:36:56 GMT)
Rehabilitation Exercise Quality Assessment and Feedback Generation Using Large Language Models with Prompt Engineering [2.0] 運動に基づくリハビリテーションは、生活の質を改善し、死亡率、死亡率、リハビリテーションを減らす。
仮想プラットフォームでは、患者が自宅で所定のエクササイズを完了し、AIアルゴリズムがパフォーマンスを分析し、フィードバックを提供し、臨床医を更新します。
本研究では,リハビリテーション訓練を行った患者の骨格関節から運動特異的な特徴を抽出し,訓練済み言語モデルに入力する手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:39:10 GMT)
Pragmatic Disengagement and Culturally Situated Non Use Older Korean Immigrants Strategies for Navigating Digital Noise [2.0] 本研究では、大都市圏の韓国人移民が、スマートフォン、YouTube、AIプラットフォームなどのデジタルツールを選択的に扱う方法を検討する。
コミュニティを基盤とした参加型研究フレームワークと22の半構造化インタビューを用いて,実践的解離と相互依存ナビゲーションという2つの重要なプラクティスを同定した。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:32:25 GMT)
Hamiltonian Theory and Computation of Optimal Probability Density Control in High Dimensions [2.0] 最適密度制御のためのポントリャーギン最大原理(PMP)を確立し、値関数のハミルトン・ヤコビ・ベルマン方程式を構築する。
本稿では,制御ベクトル場と随伴関数をパラメータ化するために,ディープニューラルネットワーク(DNN)などの低次モデルを提案する。
数値計算により,高次元における障害物を伴う様々な密度制御問題と非線形相互作用問題に対するアルゴリズムの有望な性能を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:41:37 GMT)
A Fully Generative Motivational Interviewing Counsellor Chatbot for Moving Smokers Towards the Decision to Quit [1.9] 大規模言語モデル(LLM)は、自動トークセラピストとして機能する可能性がある。
喫煙者に対して喫煙をやめるよう動機づけることに焦点を当てたカウンセラーチャットボットを提示する。
最先端のLCMと、Motivational Interviewing (MI)と呼ばれる広く応用された治療アプローチを使用している。
被験者106名を対象に実験を行い,1週間後の会話前に喫煙をやめられるという自信を計測した。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:33:46 GMT)
Emergence of Hebbian Dynamics in Regularized Non-Local Learners [1.9] Gradient Descent(SGD)は、最先端の機械学習モデルの大半を支える、極めて効果的な学習アルゴリズムとして登場した。
生物学的脳は非局所的であるため勾配降下を実装できないと広く信じられており、実験的な証拠はほとんど見つかっていない。
本稿では,重み付きSGDを用いて学習したニューラルネットワークの学習信号と,収束に近いヘビアン学習で訓練したニューラルネットワークとの理論的および実証的な接続を確立する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:16:09 GMT)
Semi-Supervised Medical Image Segmentation via Dual Networks [1.9] 本稿では,大規模な専門家ラベル付きデータセットへの依存を減らすために,革新的な半教師付き3次元医用画像分割法を提案する。
本稿では,コンテキスト情報を用いた既存手法の制約に対処するデュアルネットワークアーキテクチャを提案する。
臨床磁気共鳴画像実験により,我々のアプローチは最先端技術より優れていることが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:59:26 GMT)
Dynamics of Affective States During Takeover Requests in Conditionally Automated Driving Among Older Adults with and without Cognitive Impairment [1.8] 認知の低下は運転の安全性を損なうことがあり、しばしば早めの運転停止につながる。
条件付き自動走行車は、自動化が運転限界に達すると、ドライバーが制御を引き継ぐ必要がある。
本研究は,健常成人と認知機能障害児の乗っ取り要求(TOR)における表情分析による情動反応について検討した。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:48:20 GMT)
A variational quantum algorithm for tackling multi-dimensional Poisson equations with inhomogeneous boundary conditions [1.8] 混合境界条件を持つ多次元ポアソン方程式を解くための変分量子アルゴリズムを設計する。
提案アルゴリズムを用いて半導体系における電界のバイアス依存性の空間分布を計算する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:19:45 GMT)
Solving the Clustering Reasoning Problems by Modeling a Deep-Learning-Based Probabilistic Model [1.8] 我々は,Bongard-Logoで高い推論精度を実現する深層学習に基づく確率モデルであるPMoCを紹介する。
PMoCは視覚的抽象的推論において比較的弱い確率論的アプローチを再活性化する。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:55:56 GMT)
Diffusion Self-Weighted Guidance for Offline Reinforcement Learning [1.8] オフライン強化学習(RL)は、エージェントの歴史的観察を考慮すれば、最適なポリシーを$pi$で回復する。
実際には、$pi$はエージェントの振舞いポリシーの重み付けバージョンとしてモデル化され、エージェントの振舞いに対する批判として働く重み関数$w$を使用する。
D4RLの挑戦的環境における現状と同等の手法を用いて, 玩具のサンプルから自己重み付けガイダンス(SWG)が, 所望の分布からサンプルを生成することを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:03:36 GMT)
TG-NAS: Generalizable Zero-Cost Proxies with Operator Description Embedding and Graph Learning for Efficient Neural Architecture Search [1.7] TG-NASは汎用的なモデルベースのゼロコストプロキシで、Transformerベースの演算子埋め込みジェネレータとGraph Convolutional Network(GCN)を組み合わせてアーキテクチャのパフォーマンスを予測する。
探索効率を最大300倍改善し、NAS-Bench-201で93.75%のCIFAR-10精度、DARTS空間で74.9%のImageNet Top-1精度を実現した。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:04:51 GMT)
Data-driven multi-agent modelling of calcium interactions in cell culture: PINN vs Regularized Least-squares [1.7] 本研究では, 細胞群におけるカルシウム輸送特性の評価と性能解析を行う手法を提案する。
本研究では,制約付き正規化最小二乗法 (CRLSM) と物理インフォームドニューラルネットワーク (PINN) の性能を比較し,システム同定とパラメータ探索を行った。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:41:12 GMT)
A Principled Bayesian Framework for Training Binary and Spiking Neural Networks [1.7] スパイキングベイズニューラルネットワーク(英: Spiking Bayesian Neural Networks、SBNN)は、後部雑音を用いてIW-STでバイナリニューラルネットワークとスパイキングニューラルネットワークを訓練する変分推論フレームワークである。
低バイアス条件、消失勾配、KL項をリンクすることにより、正規化なしで深い残留ネットワークのトレーニングを可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:33:20 GMT)
Camera Movement Estimation and Path Correction using the Combination of Modified A-SIFT and Stereo System for 3D Modelling [1.7] 効率的なカメラパス生成は、正確で効率的な3Dモデルを作成する際の問題を解決するのに役立つ。
ASIFT (Affine Scale-Invariant Feature Transform) の修正版が提案され,計算オーバーヘッドの低減を図った。
2カメラベースの回転補正モデルを導入し,小さな回転誤差を軽減した。
3次元空間におけるカメラの動きを決定するために,ステレオカメラによる翻訳推定と補正モデルを実装した。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:09:21 GMT)
SchemaGraphSQL: Efficient Schema Linking with Pathfinding Graph Algorithms for Text-to-SQL on Large-Scale Databases [1.7] 本稿では、まず、外部キー関係に基づくスキーマグラフを構築する、ゼロショットでトレーニング不要なスキーマリンク手法を提案する。
我々は、結合すべきテーブルや列の最適なシーケンスを特定するために、古典的なパスフィニングアルゴリズムと後処理を適用する。
提案手法はBIRDベンチマークの最先端結果を実現し,従来の特殊化,微調整,複雑な多段階LCMに基づくアプローチよりも優れていた。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:42:36 GMT)
Experimental study of multiple-shot unitary channels discrimination using the IBM Q computers [1.6] マルチショットシナリオにおける2つの量子ユニタリチャネルの識別について検討する。
分析の結果,量子回路の深すぎる部分や絡み目が多すぎる部分も識別に適さないことがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:50:09 GMT)
An Example Safety Case for Safeguards Against Misuse [1.5] 我々は、AIアシスタントがもたらすリスクを低いレベルまで低減する、誤用セーフガードのエンド・ツー・エンドの議論について述べる。
まず、仮説的な開発者のレッドチームがどのように保護し、それらを避けるのに必要な労力を見積もるかを説明します。
次に、開発者はこの見積を定量的な"アップリフトモデル"にプラグインして、セーフガードによって導入された障壁が誤用を解消するかを判断する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:06:21 GMT)
Clip4Retrofit: Enabling Real-Time Image Labeling on Edge Devices via Cross-Architecture CLIP Distillation [1.5] Clip4Retrofitは、エッジデバイス上でリアルタイムな画像ラベリングを可能にする効率的なモデル蒸留フレームワークである。
このフレームワークは、数千台の車両に改造された費用対効果の高いエッジデバイスであるRetrofitカメラに展開されている。
この作業は、最先端のビジョン言語モデルとリソース制約された環境への展開のギャップを埋める。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:42:52 GMT)
Military AI Needs Technically-Informed Regulation to Safeguard AI Research and its Applications [1.4] 我々は、ターゲティングや戦場決定にAIを使用する致命的な自律兵器システム(LAWS)のサブセットに焦点を当てます。
これらのリスクは、軍事的効果とAI研究の開放性の両方を脅かす。
本稿では,AI-LAWSの行動に基づく定義を技術的根拠に基づく規制の基盤として提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:58:38 GMT)
Outcome-based Reinforcement Learning to Predict the Future [1.4] 報酬付き強化学習(RLVR)は、数学と大規模言語モデルでのコーディングを促進しているが、予測のような現実世界の領域にRLVRを拡張する努力はほとんどない。
結果のみのオンラインRLはフロンティアスケールの精度と一致し,キャリブレーションや仮説予測の市場賭けに勝ることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:56:07 GMT)
Phare: A Safety Probe for Large Language Models [1.4] 大規模言語モデル(LLM)の探索と評価を行うための診断フレームワークであるPhoreを紹介する。
本評価では, 筋力, 敏感性, ステレオタイプ再現など, あらゆる安全次元にまたがる系統的脆弱性のパターンを明らかにする。
Phareは研究者や実践者に、より堅牢で整合性があり、信頼できる言語システムを構築するための実用的な洞察を提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:25:40 GMT)
Repurposing Marigold for Zero-Shot Metric Depth Estimation via Defocus Blur Cues [1.3] ゼロショット,スケール不変な単分子深度推定(MDE)のためのテキスト先行学習拡散モデルであるMarigoldに,推論時にデフォーカスブラーキューを導入する。
本手法は,Marigoldをトレーニング不要な方法でメートル法深度予測器に効果的に変換する。
我々は,既存のゼロショットMMDE法と比較した。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:27:23 GMT)
Generative Distribution Embeddings [1.3] 本稿では,自動エンコーダを分散空間に引き上げるフレームワークである生成分布埋め込み(GDE)を紹介する。
GDEでは、エンコーダがサンプルの集合に作用し、デコーダは入力分布にマッチするジェネレータに置き換えられる。
GDEを計算生物学の6つの重要な問題に適用する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:58:57 GMT)
A Distributionally-Robust Framework for Nuisance in Causal Effect Estimation [1.3] 因果推論では、治療群と対照群の間のバランスの取れた分布のモデルを評価する必要がある。
最も一般的な統計手法は、逆確率重み付け(IPW)によるこの分布シフトに対処するものである。
誤差一般化を分解してこれらの問題 - 正当性あいまいさと統計的不安定さ - を分離し, 対向損失関数を通して対処する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:34:28 GMT)
Ownership Verification of DNN Models Using White-Box Adversarial Attacks with Specified Probability Manipulation [1.3] 画像分類タスクのためのディープニューラルネットワーク(DNN)モデルのオーナシップ検証のための新しいフレームワークを提案する。
これにより、元のモデルを提示することなく、正当な所有者と第三者の両方によるモデルの同一性を検証することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:40:34 GMT)
A Linear Approach to Data Poisoning [1.3] 機械学習モデルにおけるデータ中毒攻撃の理論的基礎について検討する。
以上の結果から,ヘッセン系は毒素検出の診断ツールとして有用であることが判明した。
ネットワークが汚染されているかどうかを判断する予備アルゴリズムを開発し、さらなるトレーニングを必要としない治療を行う。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:59:01 GMT)
Fourier-Based 3D Multistage Transformer for Aberration Correction in Multicellular Specimens [1.3] 機械学習ベースの収差検出フレームワークであるAOViFTを紹介した。
AOViFTは、パンクタラベル標本の収差を推測し、回折制限性能を回復する。
我々はAOViFTを遺伝子編集ゼブラフィッシュ胚で検証し、空間的に異なる収差を補正する能力を示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:04:18 GMT)
Automatic Design-Time Detection of Anomalies in Migrating Monolithic Applications to Microservices [1.3] 本稿では,モノリスに分解された異常を自動的に検出する最初のフレームワークであるMADを紹介する。
解析の結果,MADは分解の潜在的な異常な挙動の原因を正確に特定できることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:04:59 GMT)
Function Forms of Simple ReLU Networks with Random Hidden Weights [1.2] 無限幅限界における2層ReLUニューラルネットワークの関数空間ダイナミクスについて検討する。
ステアリング学習におけるフィッシャー情報行列の役割を強調した。
この研究は、広いニューラルネットワークを理解するための堅牢な基盤を提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:53:02 GMT)
MinkUNeXt-SI: Improving point cloud-based place recognition including spherical coordinates and LiDAR intensity [1.2] 本稿では,各点に対して0から1の範囲で正規化される球面座標と強度値を得るために,入力データを前処理するMinkUNeXt-SIを提案する。
Minkowskiの畳み込みとU-netアーキテクチャとスキップ接続を組み合わせたディープラーニングアプローチが使用されている。
MinkUNeXt-SIの結果は、この手法が最先端の性能に到達し、さらに他のデータセットに満足して一般化することを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:56:43 GMT)
Multi-Scale Probabilistic Generation Theory: A Hierarchical Framework for Interpreting Large Language Models [1.2] 大規模なTransformerベースの言語モデルは、優れたパフォーマンスを達成するが、テキストの計画、構造、実現には不透明である。
階層的なフレームワークであるMulti_Scale Probabilistic Generation Theory (MSPGT)を導入し、生成を3つの意味尺度_globalコンテキスト、中間構造、局所的な単語選択に分解する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:55:35 GMT)
Minimax Rate-Optimal Algorithms for High-Dimensional Stochastic Linear Bandits [1.2] 我々は、T$のラウンドで複数のアームで線形バンディット問題を研究した。
ラッソ推定器はシーケンシャルセッティングにおいて確実に準最適であることを示す。
しきい値付きラッソを主推定法として用いた3段アーム選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:20:00 GMT)
Wildfire spread forecasting with Deep Learning [1.2] 着火時に利用可能なデータを用いて, 焼却地域の範囲を予測するための深層学習フレームワークを提案する。
我々は,事前点火後のデータを含むことがモデル性能のベンチマークに与える影響について,アブレーション研究を行う。
その結果,複数日の観測データにより予測精度が大幅に向上することが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:01:38 GMT)
On non-approximability of zero loss global ${\mathcal L}^2$ minimizers by gradient descent in Deep Learning [1.2] ディープラーニング(DL)における勾配降下アルゴリズムの幾何学的側面の解析
トレーニング入力の分布は、損失最小化のため、必ずしも非ジェネリックでなければならないと結論付けている。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:23:04 GMT)
Defining Self-adaptive Systems: A Systematic Literature Review [1.2] 過去20年間で、ソフトウェアとシステムエンジニアリングにおける自己適応システムの人気は劇的に高まっている。
自己適応システムに関する広範な研究にもかかわらず、これらのシステムの定義に関する共通した合意はいまだに欠けている。
我々の体系的なレビューは、長年にわたり自己適応システムへの関心が高まってきたが、これらのシステムを正式に定義するための努力が不足していることを明らかにしている。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:18:20 GMT)
Towards more transferable adversarial attack in black-box manner [1.1] 移動可能性に基づくブラックボックス攻撃は、現実のシナリオで実際に適用可能であることから、大きな注目を集めている。
近年の最先端アプローチであるDiffPGDは、拡散型対向浄化モデルを用いてアダプティブアタックを実現することで、転送性の向上を実証している。
本稿では,新しい損失関数と一意な代理モデルを組み合わせることで,仮説の検証を行う。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:49:20 GMT)
Swedish Whispers; Leveraging a Massive Speech Corpus for Swedish Speech Recognition [1.1] スウェーデンのWhisperモデルは、このミッドリソース言語に対して前例のない大きさと可変性のデータセットに基づいてトレーニングされている。
スウェーデンで評価されたOpenAIのWhisperと比較して,モデルサイズ全体の改善が報告されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:42:16 GMT)
Large Language Models in the IoT Ecosystem -- A Survey on Security Challenges and Applications [1.1] IoT(Internet of Things, モノのインターネット)とLLM(Large Language Models)は、情報技術時代の2つの主要なプレーヤーである。
この文献調査では、IoTにLLMを適用する上での現在の技術状況について調査する。
それは、IoTセキュリティの強化において彼らが果たす重要な役割である、社会のさまざまなドメイン/セクタにおける彼らの応用を強調している。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:46:27 GMT)
Evaluation of Few-Shot Learning Methods for Kidney Stone Type Recognition in Ureteroscopy [1.1] 本研究は, 内視鏡画像における腎臓結石のタイプ同定に十分な識別的特徴を付与することを目的とした, 少数ショット学習に基づく深層学習手法を提案する。
その結果、トレーニングデータの最大25%を使用するプロトタイプネットワークは、完全なデータセットでトレーニングされた従来のディープラーニングモデルと同等以上のパフォーマンスを達成できることが示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:59:02 GMT)
Data Mining-Based Techniques for Software Fault Localization [1.1] 本章では,データマイニング技術を用いた断層局所化の基本概念を解説する。
Tritypプログラムを使用して、一般的な方法を説明する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:35:10 GMT)
A tensor network approach for chaotic time series prediction [1.0] 本稿では,従来提案されていたテンソルネットワークモデルのカオス時系列予測への応用について検討する。
従来のエコー状態ネットワークと比較して精度と計算効率の面で優位性を示す。
現状のテンソルネットワークアプローチを用いて,テンソルネットワークと貯水池コンピューティングコミュニティのギャップを埋める。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:03:35 GMT)
Finding the Underlying Viscoelastic Constitutive Equation via Universal Differential Equations and Differentiable Physics [1.0] 本研究は、微分物理学と粘弾性流体を併用した普遍微分方程式(UDE)を用いる。
本研究は, 上対流マックスウェル (UCM) , ジョンソン・セガルマン (Johnson-Segalman) , ギーゼクス (Giesekus) および指数パン・テン・タンナー (Exponential Phan-Thien-Tanner, ePTT) の4つの粘弾性モデルの解析に焦点をあてる。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:39:41 GMT)
Waveguide QED Analysis of Quantum-Coherent Links for Modular Quantum Computing [1.0] Waveguidesは、モジュラーフレームワーク内で量子プロセッサを相互接続するための効果的な媒体を提供する可能性がある。
2つの量子ビットが共有導波路に接続された量子通信シナリオを解析する。
本稿では,状態伝達の忠実度を向上し,遅延を低減させるシステム設計要件を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:24:52 GMT)
Correspondence of high-dimensional emotion structures elicited by video clips between humans and Multimodal LLMs [1.0] 近年の研究では、人間の感情は高次元の複雑な構造を示すことが明らかになっている。
本稿では,MLLM(Multimodal Large Language Models)がこれらの複雑な感情をいかに捉えているかを検討した。
以上の結果から,現在最先端のMLLMは,カテゴリレベルでの複雑な高次元感情構造を広く捉えていることが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:15:14 GMT)
Open-Set Gait Recognition from Sparse mmWave Radar Point Clouds [1.0] スパースmmWaveレーダ点雲からの開集合ゲイト認識の問題に対処する。
これは、スパースポイントクラウドデータによるオープンセット歩行認識に対処する最初の作業である。
10人の被験者から5時間以上の計測結果が得られた最初の人間の歩行データセットであるmmGait10をリリースする。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:07:36 GMT)
None of the Others: a General Technique to Distinguish Reasoning from Memorization in Multiple-Choice LLM Evaluation Benchmarks [1.0] 本稿では,これまで見られたトークンや概念から正解を完全に解離する,複数選択質問に対する一般的な変分手法を提案する。
この手法を用いて、英語とスペイン語で利用可能な2つのデータセットに基づいて、最先端のプロプライエタリおよびオープンソースLLMを評価する。
その結果, MMLUでは平均57%, UNED-Access 2024では50%の精度低下がみられた。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:27:49 GMT)
FRIREN: Beyond Trajectories -- A Spectral Lens on Time [1.0] 長期時系列予測モデルは、ドメインにまたがって適用可能な汎用的なソリューションとしてしばしば提示される。
幾何学的構造は動的に依存しない基礎モデルの正しい抽象化であると主張する。
現代の生成フローと古典的なスペクトル分析を結びつけることで、FRIRENは正確かつ解釈可能な長期的な予測を行う。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:52:13 GMT)
On the Robustness of Medical Vision-Language Models: Are they Truly Generalizable? [1.0] 我々は、複数の医療画像データセットに複数の摂動を適用した汚職ベンチマークであるMediMeta-Cを紹介する。
本稿では,事前訓練されたMVLMの視覚的エンコーダ適応であるRobustMedCLIPを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:16:48 GMT)
Persona Alchemy: Designing, Evaluating, and Implementing Psychologically-Grounded LLM Agents for Diverse Stakeholder Representation [0.9] 大規模言語モデル(LLM)のための社会認知理論(SCT)エージェント設計フレームワークについて紹介する。
本フレームワークは,SCTを設計のための4つの個人的要因(認知的,動機的,生物学的,感情的),評価のための6つの定量的構造,利害関係者のペルソナを実装するためのグラフデータベース支援アーキテクチャを通じて運用する。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:18:14 GMT)
The Lie Algebra of XY-mixer Topologies and Warm Starting QAOA for Constrained Optimization [0.9] XYミキサーは、変分量子アルゴリズムを含む現代の量子コンピューティングで広く利用されている。
我々は、様々な$XY$-mixer位相に付随する動的リー代数の明示的な分解を与える。
我々はこれらの概念をPortfolio Optimization, Sparsest $k$-Subgraph, Graphing で示す数値シミュレーションを行った。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:00:22 GMT)
EtherBee: A Global Dataset of Ethereum Node Performance Measurements Coupled with Honeypot Interactions and Full Network Sessions [0.9] EtherBeeは、詳細なノードメトリクス、ネットワークトラフィックメタデータ、および3ヶ月にわたって地理的に多様な10のVantageポイントから収集されたハニーポットインタラクションログを統合するグローバルデータセットである。
ノードデータと詳細なネットワークセッションとセキュリティイベントを関連付けることで、EtherBeeは、ピアツーピアネットワークにおける良質で悪意のあるアクティビティ、ノード安定性、ネットワークレベルの脅威に関するユニークな洞察を提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:36:08 GMT)
LA-RCS: LLM-Agent-Based Robot Control System [0.9] LA-RCSは、外部環境を自律的に計画、作業、分析するために設計された高度なロボット制御システムである。
ユーザ要求に基づいて計画を生成し、外部環境を観察し、計画を実行し、外部環境の変化に適応するために必要に応じて計画を変更する。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:51:16 GMT)
A survey of agent interoperability protocols: Model Context Protocol (MCP), Agent Communication Protocol (ACP), Agent-to-Agent Protocol (A2A), and Agent Network Protocol (ANP) [0.8] モデルコンテキストプロトコル(MCP)、エージェント通信プロトコル(ACP)、エージェント・ツー・エージェントプロトコル(A2A)、エージェントネットワークプロトコル(ANP)の4つの新しいエージェント通信プロトコルについて検討する。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:28:09 GMT)
Multiparty entanglement loops in quantum spin liquids [0.8] 量子スピン液体(QSL)の絡み合い構造について検討する。
スピン間の真の多面的絡み合い (GME) は最小の部分領域では欠落している。
絡み合いループが量子ゲージ理論の普遍的性質であることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:30:27 GMT)
AtteSTNet -- An attention and subword tokenization based approach for code-switched text hate speech detection [0.8] ソーシャルメディアで使われる言語は、しばしば英語と地域の母語の組み合わせである。
インドではヒンディー語が主に使われ、しばしば英語で表記され、ヒンズー語(ヒンズー語+英語)が流行する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:59:48 GMT)
Predictive posterior sampling from non-stationnary Gaussian process priors via Diffusion models with application to climate data [0.8] 本研究では,拡散生成モデル(DGM)に基づく2段階のアプローチを提案する。
我々は、GPをDGMサロゲートに置き換え、DGMのトレーニング不要誘導アルゴリズムの最近の進歩を活用して、所望の後方分布からサンプリングする。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:40:53 GMT)
Transparency and Proportionality in Post-Processing Algorithmic Bias Correction [0.8] 分類タスクの公平性を達成するためにアルゴリズム予測を変更する後処理技術に着目する。
後処理段階における解に対するフリップの相違を定量化する尺度を開発した。
提案手法は,(1)使用した脱バイアス戦略の比例性を評価すること,(2)各グループにおける戦略の効果を説明する透明性を有すること,(3)これらの結果に基づいて,バイアス緩和のための他のアプローチの可能性を分析すること,あるいは問題を解決することである。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:33:31 GMT)
ViCTr: Vital Consistency Transfer for Pathology Aware Image Synthesis [0.7] 既存の方法は、病理学的特徴を正確にモデル化しながら、解剖学的忠実さを維持するのに苦労する。
ViCTrは、修正フロー軌跡とTweedie補正拡散プロセスを組み合わせて、高忠実で病理学的な画像合成を実現する新しい2段階のフレームワークである。
我々の知る限り、ViCTrは、厳密度制御による細粒度で病理に配慮したMRI合成を提供するための最初の方法である。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:41:30 GMT)
An Iterative Framework for Generative Backmapping of Coarse Grained Proteins [0.7] 本稿では,条件付き変分オートエンコーダとグラフベースニューラルネットワークを用いた新しい反復的フレームワークを提案する。
本稿では,反復生成バックマッピングの理論の概要を述べるとともに,数値実験を通じて多段階スキームの利点を実証する。
この多段階のアプローチは、再構成の精度を向上するだけでなく、超CG表現を持つタンパク質の訓練プロセスをより効率的にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:40:25 GMT)
Embracing Contradiction: Theoretical Inconsistency Will Not Impede the Road of Building Responsible AI Systems [0.7] このポジションペーパーでは、Responsible AI(RAI)メトリクスでよく見られる理論上の矛盾は、排除すべき欠陥ではなく、価値のある機能として受け入れるべきである、と論じている。
メトリクスを異なる目的として扱うことで、これらの矛盾をナビゲートすることは、3つの重要な利点をもたらすと我々は主張する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:48:09 GMT)
Applications of Modular Co-Design for De Novo 3D Molecule Generation [0.7] スケーラブルなトランスフォーマーモデルのファミリであるMegalodonを紹介します。
これらのモデルは、基本同変層で拡張され、連続的かつ離散的な共同設計目標を用いて訓練される。
メガロドンは3次元分子生成, 条件構造生成, および拡散と流れマッチングを用いた構造エネルギーベンチマークにおいて, 最先端の結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:41:56 GMT)
A Survey on Efficient Vision-Language Models [0.7] 視覚言語モデル(VLM)は視覚情報とテキスト情報を統合し、画像キャプションや視覚的質問応答などの幅広いアプリケーションを可能にする。
リアルタイムアプリケーションには高い計算要求が課題となる。
これにより、効率的な視覚言語モデルの開発に焦点が当てられている。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:28:28 GMT)
Optimizing Shortfall Risk Metric for Learning Regression Models [0.6] UBSRは、基礎となる分布の非線形関数であるため、UBSRの目的による経験的リスク最小化は困難である。
分岐型アルゴリズムを考案し,UBSR最適解への収束を確立する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:46:26 GMT)
Wildfire Detection Using Vision Transformer with the Wildfire Dataset [0.6] 2023年の山火事で全国で130人が死亡し、1990年以来の高水準となった。
ViT(Vision Transformers)のようなディープラーニングモデルは、複雑な画像データを高精度に処理することで早期検出を強化することができる。
しかし、山火事検出は高品質でリアルタイムなデータの提供を含む課題に直面している。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:08:28 GMT)
Optimizing State Preparation for Variational Quantum Regression on NISQ Hardware [0.6] 我々は、新しい状態準備法を用いて変分量子回帰アルゴリズムを実装し、最適化し、実行した。
その結果、これらの最適化により、現在のハードウェア上での量子回帰アルゴリズムの実行が成功できることが示されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:30:56 GMT)
Quantum framework for Reinforcement Learning: integrating Markov Decision Process, quantum arithmetic, and trajectory search [0.6] 本稿では、強化学習(RL)タスクに対処する量子フレームワークを提案する。
量子概念と量子探索アルゴリズムを用いることで,エージェント-環境相互作用の実装と最適化を行う。
その結果、RLにおける量子エンハンスメントを達成するための量子モデルの能力を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:11:09 GMT)
From Bias to Accountability: How the EU AI Act Confronts Challenges in European GeoAI Auditing [0.6] この研究は、GeoAIバイアスエビデンスをEU AI Actコンテキストに初めて統合したものだ。
この法律の高リスク基準を適用することで、広くデプロイされたGeoAIアプリケーションが高リスクシステムとして適していることを示す。
この分析は探索的ではあるが、2027年以前には、よく計算された欧州のデータセットでさえ、定期的なバイアス監査を採用するべきであることを示唆している。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:34:39 GMT)
UltraBoneUDF: Self-supervised Bone Surface Reconstruction from Ultrasound Based on Neural Unsigned Distance Functions [0.6] 骨表面の再構築はコンピュータによる整形外科手術において重要な役割を担っている。
超音波イメージングの固有の限界のため、Bモード超音波は通常、部分的な骨表面のみを捉えている。
骨表面を超音波で再構築するための自己教師型フレームワークであるUltraBoneUDFを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:56:06 GMT)
Qiskit Machine Learning: an open-source library for quantum machine learning tasks at scale on quantum hardware and classical simulators [0.5] Qiskit Machine Learning (ML)は、量子コンピューティングの要素と従来の機械学習を組み合わせた高レベルのPythonライブラリである。
Qiskit MLは2019年に概念実証コードとして始まり、その後、非スペシャリストユーザのためのモジュラーで直感的なツールとして開発されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:27:03 GMT)
Evidence-Grounded Multimodal Misinformation Detection with Attention-Based GNNs [0.5] マルチモーダル・アウト・オブ・コンテクスト(Multimodal Out-of-Context、OOC)の誤報は、非関連または誤解を招くキャプションで実際の画像を再利用する誤報である。
2つのグラフ表現を構築し,画像とキャプションの整合性を評価するグラフベース手法を提案する。
グラフニューラルネットワーク(GNN)を用いて、これらの表現を符号化し、比較する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:52:58 GMT)
Intent Classification on Low-Resource Languages with Query Similarity Search [0.5] 本稿では,クエリ類似性探索問題としてキャスティング意図分類を提案する。
我々は、インテントを定義するために、また、最も類似したクエリのラベルに基づいて、入ってくるクエリを分類するクエリ類似性メソッドとして、以前の例クエリを使用します。
ゼロショット設定で低リソース言語でのクエリに対する合理的な意図分類性能を実現することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:11:12 GMT)
RQR3D: Reparametrizing the regression targets for BEV-based 3D object detection [0.5] Bird's-eye view (BEV)ベースの知覚アプローチは、パースペクティブベースのソリューションの優れた代替手段として現れている。
本稿では,3次元回帰目標を定義するために,制限付き四辺形表現を提案する。
RQR3Dは、2つのボックスの隅の間にあるオフセットとともに、指向するボックスをカプセル化する最小の水平境界ボックスを回帰する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:52:34 GMT)
Alignment and Safety of Diffusion Models via Reinforcement Learning and Reward Modeling: A Survey [0.4] 本論文では,拡散モデルと人間の嗜好と安全性の制約を整合させる手法について考察する。
人間のフィードバックによる微調整テキスト・画像拡散モデルの進歩を調査する。
今後2年間の有望な研究方針を5つ特定する。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:08:49 GMT)
Training Latent Diffusion Models with Interacting Particle Algorithms [0.4] 本稿では,潜伏拡散モデルのエンドツーエンド学習のための新しい粒子ベースアルゴリズムを提案する。
後者を相互作用する粒子系に近似することにより, 理論的には誤差保証を提供することで, 基礎となるアルゴリズムを得る。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:19:28 GMT)
Thermal Annealing and Radiation Effects on Structural and Electrical Properties of NbN/GaN Superconductor/Semiconductor Junctions [0.4] 窒化ニオブ(NbN)超伝導体は、量子コンピューティングにおいて重要な構成要素である。
本研究では,GaN上に作製したNbN薄膜の構造と超伝導特性に及ぼす高温アニールおよび高線量ガンマ照射の影響について検討した。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:53:16 GMT)
New Tight Bounds for SGD without Variance Assumption: A Computer-Aided Lyapunov Analysis [0.4] 本稿では, 分散を前提とせず, 保証を図ろうとする最近の研究に寄与する。
我々は、単純なリャプノフエネルギーの単調性から導かれる新しい理論境界を証明した。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:34:46 GMT)
Language Models Benefit from Preparation with Elicited Knowledge [0.4] 言語モデル(LM)の2つのインスタンスを使用する単純なプロンプト技術であるPreprePを導入する。
PrePはドメイン固有のプロンプトエンジニアリングなしで様々なQAタスクに適用できる。
提案手法を,部品・材料分析データセットと3つの共感覚推論データセットで検証した。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:46:53 GMT)
Semantic Web and Software Agents -- A Forgotten Wave of Artificial Intelligence? [0.4] セマンティックウェブの台頭は知識表現、論理、推論に基づいている。
ChatGPTは、ディープラーニングと高度なニューラルモデルに基づいて構築されたAI熱意を再燃させた。
Semantic Webは、World Wide WebをAIが推論し、理解し、行動できるエコシステムに変えることを目的としています。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:45:18 GMT)
An End-to-End Approach for Child Reading Assessment in the Xhosa Language [0.4] 本研究は, 南アフリカで話されている言語であるXhosaに着目し, 子どもの音声認識能力を向上させることを目的とした。
本稿では,Xhosaにおける児童音声サンプルからなる新しいデータセットを提案する。
その結果、これらのモデルの性能は、利用可能なトレーニングデータの量とバランスに大きく影響されることが示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:59:58 GMT)
Demonstration of Quantum-Secure Communications in a Nuclear Reactor [0.3] 量子鍵分散(QKD)は、初めて無条件で安全な遠隔通信を約束する。
この研究は、将来のデジタル駆動型原子炉技術のための量子ベースの安全な遠隔通信の可能性を示している。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:54:56 GMT)
Optimizing QAOA circuit transpilation with parity twine and SWAP network encodings [0.3] 本研究は,完全接続回路を表現するために必要な2ビットゲート数と深さを削減する手法を提案する。
25%の接続性を持つ120kbitのQAOAインスタンスに対して,本手法は深さ85%の低減と2kbitゲートの28%の削減を実現している。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:20:40 GMT)
Learning Generalized Hamiltonians using fully Symplectic Mappings [0.3] ハミルトン系は、保守的であり、すなわちエネルギーは進化を通して保存されるという重要な性質を持っている。
特にハミルトニアンニューラルネットワークは、構造的帰納バイアスをNNモデルに組み込むメカニズムとして登場した。
共振器のスキームはノイズに対して頑健であり,ノイズ観測から状態変数がサンプリングされた場合のハミルトニアン系の近似が良好であることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:20:36 GMT)
The Hamiltonian of Poly-matrix Zero-sum Games [0.3] ポリマトリクスゼロサムゲームのダイナミクスを生成するハミルトニアン関数を同定する。
我々はハミルトニアンの対称性を明らかにし、関連する保存量の導出を行う。
本結果は,ゲームにおける学習力学の構造的特性を明らかにする上でのハミルトン力学の可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:13:05 GMT)
Quasi Zigzag Persistence: A Topological Framework for Analyzing Time-Varying Data [0.3] Quasi Zigzag Persistent Homology (QZPH)は、時間変化データを分析するためのフレームワークである。
静的特徴と動的特徴の両方を異なるスケールでキャプチャする安定な位相不変量を導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:42:47 GMT)
Portus: Linking Alloy with SMT-based Finite Model Finding [0.2] ポータス(Portus)は、合金を等価な多種一階論理問題(MSFOL)に変換する方法である。
Fortress は MSFOL の有限モデル探索問題を等式付き非解釈関数の論理に変換する(EUF)
論文参考訳(メタデータ) (Fri, 23 May 2025 20:55:44 GMT)
A New Similarity Function for Spectral Clustering with Application to Plant Phenotypic Data [0.2] 本稿では,基本「a」指数関数を類似関数として用いることを提案する。
実験により,新しいSCは標準SCよりも35%,11%優れていた。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:43:58 GMT)
Hyperspectral in situ remote sensing of water surface nitrate in the Fitzroy River estuary, Queensland, Australia, using deep learning [0.2] 近年の河川で排出される硝酸塩の増加は、グレートバリアリーフのラグーンでサンゴの漂白に大きなリスクをもたらす。
以前の研究では、水面硝酸塩と貯水反射率の間に間接的、非因果関係があることが示されている。
時系列観測により, 亜硝酸塩負荷の周期周期は, 干潟調査地における潮流の影響により明らかとなった。
モデル予測硝酸塩のin-situ測定した硝酸塩値に対する精度評価の結果, 予測硝酸塩値は地中構造値とよく相関していた。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:22:29 GMT)
Enhancing AI System Resiliency: Formulation and Guarantee for LSTM Resilience Based on Control Theory [0.2] 本研究では,長寿命メモリ(LSTM)ネットワークのレジリエンスを定式化し,保証する手法を提案する。
本稿では,LSTMの入力摂動に対するレジリエンスを数学的に定義し,評価する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:05:26 GMT)
Less Context, Same Performance: A RAG Framework for Resource-Efficient LLM-Based Clinical NLP [0.2] トークン制限と高い計算コストのため,Large Language Models (LLM) では長いテキスト分類が困難である。
本研究では,最も関連性の高いテキストセグメントのみを用いた検索拡張生成(RAG)アプローチが,臨床ノート全体の処理性能に適合するかどうかを検討する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:13:08 GMT)
A Network Science Approach to Granular Time Series Segmentation [0.2] 時系列セグメンテーション(TSS)は時系列解析技術の1つであり、他のTSS関連タスクに比べてかなり少ない注意を払っている。
WDPVG (Weighted Dual Perspective Visbility Graph) TS をグラフに利用し,グラフ注意ネットワーク (Graph Attention Network, GAT) と組み合わせた,より粒度の細かい TSS アプローチを提案する。
TSをグラフに変換することで、他の方法では隠されるであろうデータのさまざまな構造的側面をキャプチャすることができます。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:02:03 GMT)
PerMedCQA: Benchmarking Large Language Models on Medical Consumer Question Answering in Persian Language [0.2] PerMedCQAは、医療消費者の質問応答のための大規模な言語モデルを評価するためのペルシア語による最初のベンチマークである。
LLMグレーダによって駆動される新しい評価フレームワークであるMedJudgeを用いて、最先端の多言語および命令調整型LLMを評価した。
本研究は,多言語医療QAにおける重要な課題を浮き彫りにして,より正確でコンテキスト対応の医療支援システムの開発に有用な知見を提供するものである。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:39:01 GMT)
How We Won the ISLES'24 Challenge by Preprocessing [0.2] 脳卒中病変セグメンテーションの先駆的解決策として、改良された深層学習法が出現している。
ISLES'24の課題は、縦方向の脳卒中画像データを提供することによって、このニーズに対処する。
我々の勝利したソリューションは、慎重に設計された事前処理パイプラインが正確なセグメンテーションに有用であることを示している。
論文参考訳(メタデータ) (Fri, 23 May 2025 23:25:00 GMT)
The end of radical concept nativism [0.1] 人々が新しい概念を実際に学ぶには重要な意味がある、と私たちは主張する。
我々は、コンピュータ科学と情報理論のアイデアを使って、より科学的に生産的な方法で関連するアイデアを定式化する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:12:38 GMT)
Project For Advancement of Software Usability in Materials Science [0.1] ISSPはPASUMS(Project for Advancement of Software Usability in Materials Science)というソフトウェア開発プロジェクトを実施している。
ab initio計算、効果的なモデル解決器、機械学習のためのソフトウェアなど、様々なオープンソースソフトウェアプログラムが開発・開発されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:35:38 GMT)
Mind the Domain Gap: Measuring the Domain Gap Between Real-World and Synthetic Point Clouds for Automated Driving Development [0.1] ドメインギャップのない合成データのシミュレーションは、ロボティクス、フォトグラム、コンピュータビジョン研究において不可欠である。
これまでの研究は、あるシーンでデータをシミュレートし、異なる現実のシーンのパフォーマンスを分析することに集中してきた。
そこで本研究では,実世界のセンサ観測と,同じ位置を表すシミュレーションデータとの領域ギャップを計測する手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:31:36 GMT)
SemSketches-2021: experimenting with the machine processing of the pilot semantic sketches corpus [0.0] 本論文は,セマンティックスケッチの機械処理における様々なアプローチについて論じる。
スケッチ作成のさまざまな側面と、スケッチが解決するのに役立つタスクについて議論する。
コーパスのための機械処理ツールの作成には特に注意が払われる。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:15:22 GMT)
Intra-Layer Recurrence in Transformers for Language Modeling [0.0] ILR(Intra-Layer Recurrence)は、単一のフォワードパス内の個々の層に選択的に反復するアプローチである。
実験により、より多くのイテレーションを以前のレイヤに割り当てると、最適な結果が得られます。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:19:41 GMT)
An Annotated Corpus of Arabic Tweets for Hate Speech Analysis [0.0] 本研究では,アラビア語におけるマルチラベルヘイトスピーチデータセットを提案する。
われわれは1万のアラビア語ツイートを集め、各ツイートに攻撃的な内容を含むか否かにかかわらず注釈を付けた。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:43:22 GMT)
keepitsimple at SemEval-2025 Task 3: LLM-Uncertainty based Approach for Multilingual Hallucination Span Detection [0.0] ブラックボックス言語モデル生成テキストにおける幻覚の特定は、現実世界の応用に不可欠である。
本問題の解法は, 幻覚的スパンを特定するために, 実測的な応答のばらつきを生かしたものである。
エントロピーに基づく解析により,このばらつきを計測し,幻覚部分の正確な同定を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:25:14 GMT)
ZeroML: A Next Generation AutoML Language [0.0] ZeroMLはAutoMLの新しい世代のプログラミング言語で、コンパイルされたマルチパラダイムな方法でMLパイプラインを駆動する。
ZeroMLは、DataCleaner、FeatureEngineer、ModelSelectorといったモジュラーで再利用可能な部品を追加するマイクロサービスベースのアーキテクチャを提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:01:49 GMT)
ViSIR: Vision Transformer Single Image Reconstruction Method for Earth System Models [0.0] 地球系モデル (ESM) は、大気、海、陸、氷、生物圏の相互作用を統合し、地域気候と地球気候の状態を推定する。
本稿では、ESMデータの単一画像SR(SR)再構成タスクを改善するために、ViSIR(Vision Transformer Sinusoidal Representation Networks)を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:45:19 GMT)
ViFOR: A Fourier-Enhanced Vision Transformer for Multi-Image Super-Resolution in Earth System [0.0] 超解像(SR)技術は、地球系モデル(ESM)データの空間分解能を改善するために不可欠である。
本稿では、視覚変換器(ViT)とフーリエベースインプリシットニューラルネットワーク(INR)を組み合わせて、低分解能(LR)入力から高分解能(HR)画像を生成する新しいアルゴリズムViFORを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:03:00 GMT)
VLM Models and Automated Grading of Atopic Dermatitis [0.0] 医用画像におけるアトピー性皮膚炎の重症度を評価するために視覚言語モデル(VLM)を用いることができる。
本報告では, テスト画像の集合上でのADの重症度を評価するための7つのVLMの能力を評価するための実験について述べる。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:49:09 GMT)
Urban Household Behavior in Indonesia: Drivers of Zero Waste Participation [0.0] 3RベースのZero Wasteアプローチは, ごみの削減, 再利用, 再利用, リサイクルの原則による家庭用廃棄物の最小化を目的としている。
インドネシア12都市の1200世帯を対象に調査を行った。
総合的に知覚される行動制御、主観的規範、環境知識はゼロ廃棄物の挙動に寄与する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:14:59 GMT)
Uncovering Bottlenecks and Optimizing Scientific Lab Workflows with Cycle Time Reduction Agents [0.0] Cycle Time Reduction Agents (CTRA)はLangGraphベースのエージェントワークフローで、実験室の運用メトリクスの分析を自動化する。
CTRAは、分析を開始するための質問作成エージェント、データ抽出と検証のための操作メトリクスエージェント、レポートと視覚化のためのインサイトエージェントの3つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:26:22 GMT)
Tube Loss based Deep Networks For Improving the Probabilistic Forecasting of Wind Speed [0.0] 風速予測における不確かさ定量化(UQ)は、風の本質的に揮発性の性質のため、風力発電において重要な課題である。
本稿では,風速予測に管損失関数を用いた深層学習に基づく確率予測手法について述べる。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:29:07 GMT)
Transferring linearly fixed QAOA angles: performance and real device results [0.0] 線形パラメータ化とパラメータ転送を組み合わせ,パラメータ空間を4次元に減らした簡易な手法について検討する。
本稿では,この手法と標準QAOAと,逐次層ごとの最適化を必要とするInterfacePやFOURIERなどのパラメータ設定手法を比較した。
我々の実験は古典シミュレーションからIBMのイーグルプロセッサ上での実際の量子ハードウェア実装まで拡張し、現在のNISQデバイス上でのアプローチの可能性を実証した。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:36:09 GMT)
Trade-offs between classical and quantum space using spooky pebbling [0.0] Pebbleゲームは、空間/時間のトレードオフを研究するために使用されます。
本稿では,一般的な回路に対して,スポーキーな小石ゲームフレームワークを初めて適用する。
制限されたランタイム内では、古典的な空間を考慮すると量子空間を減らす戦略を見つけることができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:22:33 GMT)
Tracking the Flight: Exploring a Computational Framework for Analyzing Escape Responses in Plains Zebra (Equus quagga) [0.0] 本研究では,ドローンの動きから動物の動きを分離する3つのアプローチを評価する。
最良性能の手法を用いて,個々の軌跡を抽出し,重要な行動パターンを同定する。
これらの洞察は、この方法の有効性と、より大きなデータセットにスケールする可能性を強調している。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:14:12 GMT)
Tracking phase entanglement during propagation of downconverted photons [0.0] 両光子状態が波動関数の複素位相に相関する位相エンタングルメントについて検討した。
理論的および実験的に、観測された2光子干渉構造が位置相関光子によって生成されたものと著しく異なることを示す。
位相交絡光を用いた干渉は以前にも試みられず、空間交絡の分野における先進的な実験や応用の道を開いた。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:52:32 GMT)
Track Anything Annotate: Video annotation and dataset generation of computer vision models [0.0] 本稿では,ビデオ追跡とセグメンテーションに基づくトレーニングデータセットの注釈付けと生成を行うツールを試作するプロセスを検討する。
開発されたプロトタイプは、手動のアノテーションと比較してデータセット生成を著しく加速する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:32:20 GMT)
Towards a Quantum-classical Augmented Network [0.0] 我々は、量子ペイロードと古典ペイロードの両方を運べるように、HTTPプロトコルの構造を変更することを提案する。
我々は,ロジスティック回帰,CNN,LSTM,BiLSTMモデルを実装し,外部通信のためのプライバシラベルを分類する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:17:07 GMT)
Towards Anonymous Neural Network Inference [0.0] funionは、ニューラルネットワークの推論にエンドツーエンドの送信者-受信者非リンク性を提供するシステムである。
ユーザは匿名で、入力テンソルを疑似ランダムなストレージロケーションに格納し、計算サービスをニューラルネットワーク経由で処理し、入力と出力のパーティ間のトレーサブルな接続のない結果を取得することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:05:20 GMT)
Thermalization without detailed balance: population oscillations in the absence of coherences [0.0] マスター方程式に準拠する開量子系と詳細なバランス崩壊は、非振動的な方法で熱平衡に適合する。
これらのシステムの熱化について検討し、温度上昇が熱化ダイナミクスの急激な遷移を示す新しい例外点を生み出すことを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:44:57 GMT)
Thermalization of a Closed Sachdev-Ye-Kitaev System in the Thermodynamic Limit [0.0] 閉結合Majorana SYK系の力学を解析する。
最終定常状態はグリーンの機能とエネルギーに関して熱平衡に達する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:28:05 GMT)
Thermalization Dynamics in Closed Quantum Many Body Systems: a Precision Large Scale Exact Diagonalization Study [0.0] 得られた平衡状態と熱状態の間の有限サイズ偏差について検討する。
偏差は固有状態熱化仮説によってよく説明されている。
また, 局所観測変数は系長とともに線形に成長する緩和時間スケールで指数関数的に平衡に向かって緩和することを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:16:31 GMT)
Theoretical Foundations for Semantic Cognition in Artificial Intelligence [0.0] モノグラフは、構造化セマンティックステートとしての信念の形式的モデリングを基礎とした、人工知能のためのモジュラー認知アーキテクチャを提供する。
信念状態は、操作者が同化、抽象化、無効化、メモリ、イントロスペクションを可能にするナビゲート可能な多様体に埋め込まれた言語表現の動的アンサンブルとして定義される。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:52:14 GMT)
The State Preparation of Multivariate Normal Distributions using Tree Tensor Network [0.0] そこで我々は,D$D$次元多変量正規分布に対する状態準備回路を生成するスケーラブルな手法を提案する。
そこで本研究では,ネットワーク構造と小型回路の最適化に自動構造最適化を用いるコンパイル手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:32:21 GMT)
The Quantum LLM: Modeling Semantic Spaces with Quantum Principles [0.0] 前回の記事では,Large Language Models (LLMs) における意味表現と処理をモデル化するための量子インスパイアされたフレームワークについて紹介した。
本稿では, LLMにおける意味表現, 相互作用, ダイナミクスを規定する6つの重要な原則を詳細に解説し, 本モデルの中核的な仮定を明らかにする。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:27:36 GMT)
The Maximal Overlap Discrete Wavelet Scattering Transform and Its Application in Classification Tasks [0.0] 最大オーバーラップ離散ウェーブレット散乱変換(MODWST)を提案する。
その構成は、最大オーバーラップ離散ウェーブレット変換(MODWT)と散乱ウェーブレット変換(WST)を組み合わせたものである。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:45:58 GMT)
The Discovery Engine: A Framework for AI-Driven Synthesis and Navigation of Scientific Knowledge Landscapes [0.0] 本稿では,文献を科学的領域の統一的,計算的に抽出可能な表現に変換するフレームワークであるDiscovery Engineを紹介する。
Discovery Engineは、AIが強化した科学調査と発見の加速のための新しいパラダイムを提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:51:34 GMT)
The Cognitive Foundations of Economic Exchange: A Modular Framework Grounded in Behavioral Evidence [0.0] マルチエージェントAIにおける重要な課題は、現実的な行動制約の下で社会協力をモデル化することである。
本稿では,認知的最小限の3つのメカニズムからなる概念的枠組みを提案する。
この枠組みは信頼を段階的な認知期待として再設定し、人工エージェントの相互交換のシミュレーション可能な基盤を提供する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:31:57 GMT)
Temporal Dynamics of Emotion and Cognition in Human Translation: Integrating the Task Segment Framework and the HOF Taxonomy [0.0] 本論文は、経験的翻訳プロセスデータに基づく、人間の翻訳心の生成モデルを開発する。
この記事では、この組込み生成モデルについて、様々な理論的枠組み、二重過程理論、ロビンソンの(2023年)イデオロマティックな翻訳理論について論じる。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:48:19 GMT)
Tackling Decision Processes with Non-Cumulative Objectives using Reinforcement Learning [0.0] 我々は,非累積マルコフ決定過程を標準MDPに一般化したマッピングを導入する。
これにより、MDPがより大規模なNCMDPに直接適用されるための最適なポリシーを見つけるために開発されたすべての技術が利用可能となる。
我々は、古典的な制御、金融におけるポートフォリオ最適化、離散最適化問題など、様々なタスクのアプリケーションを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:10:37 GMT)
Superluminal signalling witness for quantum state reduction [0.0] 我々は、汎用量子状態還元モデルに適用可能な超光信号の証人を定式化する。
ここで紹介された証人は、あらゆる状況下で超音速信号を排除するための必要かつ十分な条件を提供する。
相関ノイズモデルがそれを回避できる可能性があり、ここで紹介された目撃者はそのようなモデルを構築するための厳密なガイドを提供していることを示唆する。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:01:13 GMT)
Statistical Localization in a Rydberg Simulator of $U(1)$ Lattice Gauge Theory [0.0] 本稿では,Rydberg原子配列を用いた統計的局所化行動の最初の実験的シグネチャを報告する。
強いヒルベルト空間の断片化の結果、保存された全ての量の期待値は、典型的な量子状態において局所的に分布していることが分かる。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:54:19 GMT)
Soil analysis with machine-learning-based processing of stepped-frequency GPR field measurements: Preliminary study [0.0] 土壌浸透レーダ(GPR)は農業や園芸に関連する土壌パラメータを抽出する手段として広く研究されている。
トラクタ搭載エアカップリング型SFCW GPR機器を用いて広範囲にわたるフィールドサーベイを行う。
共記録電磁誘導(EMI)計で測定した電気伝導率(ECaR)を予測することにより,GPR計器の能力を評価する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:43:42 GMT)
Simulating Macroeconomic Expectations using LLM Agents [0.0] 我々は,Large Language Model-Empowered Agents (LLM Agents) を用いたマクロ経済予測形成をシミュレーションするための新しいフレームワークを提案する。
個人的特性,事前期待,知識のモジュールを備えたLLMエージェントを数千個構築することにより,家庭や専門家によるインフレーションと失業に関する調査実験を再現する。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:11:14 GMT)
ShIOEnv: A CLI Behavior-Capturing Environment Enabling Grammar-Guided Command Synthesis for Dataset Curation [0.0] コマンドラインインタフェース(CLI)は、システム管理のための構造化されたテキスト環境を提供する。
既存の公開データセットは、自然言語タスクをコマンドにマッピングすることに重点を置いている。
コマンド構成をマルコフ決定プロセスとしてキャストするシェル入力出力環境(ShIOEnv)を導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 21:00:57 GMT)
Separation and Collapse of Equilibria Inequalities on AND-OR Trees without Shape Constraints [0.0] 指向性アルゴリズムは、ランダム化された複雑さを達成することが知られている。
任意のAND-OR木に対して、ランダム化深度優先アルゴリズムは方向性アルゴリズムと同じ平衡を持つことを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:10:54 GMT)
SemEval-2025 Task 5: LLMs4Subjects -- LLM-based Automated Subject Tagging for a National Technical Library's Open-Access Catalog [0.0] 本稿では,SemEval-2025 Task 5: LLMs4Subjectsについて紹介する。
参加者は、トップk被験者を推薦するシステムを開発し、定量的指標(精度、リコール、F1スコア)と、被験者の専門家による質的評価を通じて評価した。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:14:35 GMT)
Sec5GLoc: Securing 5G Indoor Localization via Adversary-Resilient Deep Learning Architecture [0.0] 5Gミリ波とサブ6GHzのネットワークは、高精度な屋内ローカライゼーションを実現するが、セキュリティとプライバシの脆弱性は深刻な問題を引き起こす。
我々は、偽の無線信号やパーターブチャネル測定を注入する攻撃者を包含する脅威モデルを定式化し、ローカライゼーションシステムを誤解させる。
本稿では,ディープラーニングフィンガープリントと物理ドメイン知識を組み合わせた対向レジリエントなローカライゼーションアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:46:11 GMT)
Scaling Recurrent Neural Networks to a Billion Parameters with Zero-Order Optimization [0.0] FLOPとGPUメモリにおけるRNNのスケール定数は、コンテキスト長が増加する。
変換器はFLOPで線形に、そしてせいぜい、生成中のメモリで線形にスケールする。
標準最適化手法は時間によるバックプロパゲーションに依存しているため、長い文脈での大規模RNNの訓練は実用的ではない。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:04:06 GMT)
Safety-Prioritized, Reinforcement Learning-Enabled Traffic Flow Optimization in a 3D City-Wide Simulation Environment [0.0] 交通渋滞と衝突は、世界中の経済的、環境的、社会的課題を表している。
マクロな交通力学と微視的な交通力学を統合した総合的な3次元都市シミュレーション環境、衝突モデル、効率よりも安全性を優先するカスタム報酬関数を備えた強化学習フレームワークの3つの潜在的なツールが開発されている。
その結果,交通省のビジョンゼロ安全原則を取り入れた都市規模の3次元交通シミュレーションアプリケーションの実現可能性が確認された。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:43:14 GMT)
Reinforcement Learning for Ballbot Navigation in Uneven Terrain [0.0] MuJoCoをベースとしたオープンソースのボールボットシミュレーションを提案する。
古典的なモデルフリーなRL手法で学習したポリシーは、不均一な地形を効果的にナビゲートできることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:48:36 GMT)
Re-evaluation of Logical Specification in Behavioural Verification [0.0] 本研究では,行動モデルに対する自動論理仕様法を実証的に検証する。
自動推論における適応的性能不規則性の必要性を示唆する性能不規則性を特定する。
自己最適化解法によってこれらの非効率に対処することは、自動推論の安定性を高めることができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:46:39 GMT)
Quantum sensing of even- versus odd-body interactions [0.0] 我々は,多数の粒子の極限における系粒子数で量子フィッシャー情報のスケーリングを分析する。
任意の体符号化ハミルトニアンの結合強度を推定すると、超ハイゼンベルクスケーリングが得られる。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:00:40 GMT)
Quantifying uncertainty in spectral clusterings: expectations for perturbed and incomplete data [0.0] スペクトルクラスタリング(Spectral clustering)は、未学習データを異なる形状の解離クラスタに分割できる、一般的な教師なし学習技術である。
検討中のデータは、しばしば実験的なデータであり、データが測定エラーの対象であり、測定が失われたり無効になる可能性があることを暗示している。
統計学的に予測されるクラスタリングの確率的モンテカルロ近似に対するランダム集合理論に基づく数学的枠組みについて論じる。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:35:14 GMT)
Privacy-Preserving Bathroom Monitoring for Elderly Emergencies Using PIR and LiDAR Sensors [0.0] 在宅高齢者の監視には、プライバシを保護し、ユーザの入力を不要にしながら、緊急イベントを検出するシステムが必要である。
本稿では,PIR(Passive Infrared)センサとLiDAR(Light Detection and Ranging)センサを用いた低コストでプライバシ保護ソリューションを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:49:43 GMT)
Permutation Equivariant Neural Networks for Symmetric Tensors [0.0] 我々は、$mathbbRn$の対称パワー空間の間のすべての線型置換同変関数の2つの異なる特徴付けを示す。
これらの関数は標準テンソルと比較して非常に効率的であり、異なる大きさの対称によく一般化できることを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:20:09 GMT)
Partial-Label Learning with Conformal Candidate Cleaning [0.0] 本稿では、共形予測を用いて候補集合を漸進的に起点とする新しい拡張手法を提案する。
我々は,本手法が未知の土台真実に対して適合性を保っていることを確認した。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:56:49 GMT)
PPO-BR: Dual-Signal Entropy-Reward Adaptation for Trust Region Policy Optimization [0.0] PPO-BRは、新しい探索と収束信号を単一の信頼領域に融合することで、パラダイム適応RLを確立する。
この研究は、位相認識学習における重要なギャップを埋め、ロボット手術のような安全クリティカルなシステムへの現実世界の展開を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:30:58 GMT)
Optimizing YOLOv8 for Parking Space Detection: Comparative Analysis of Custom YOLOv8 Architecture [0.0] 駐車スペース占有検知は、インテリジェントな駐車管理システムの開発において重要な要素である。
YOLOv8のような従来の物体検出アプローチは、駐車場を横断する高速かつ正確な車両検出を提供する。
YOLOv8と統合されたカスタマイズされたバックボーンアーキテクチャの総合的な比較分析を行う。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:36:50 GMT)
Optimizing Retrieval-Augmented Generation for Electrical Engineering: A Case Study on ABB Circuit Breakers [0.0] 本研究では,ABB回路ブレーカにおけるRAGの有効性について検討した。
カスタマイズされたデータセット、高度な埋め込みモデル、最適化されたチャンク戦略を活用することで、研究はデータ検索とコンテキストアライメントの課題に対処する。
本稿では,電気工学などの高度技術領域におけるAI研究の進展に寄与する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:21:37 GMT)
Optimal community detection in dense bipartite graphs [0.0] 我々は、n_1×n$の高次元二部グラフにおいて、密連結頂点のコミュニティを検出する問題を考える。
我々は,最小信号強度$delta*$の非漸近的上界および下界を,必要かつ十分であり,かつ,最小のタイプ1とタイプ2の誤差でテストが存在することを保証する。
提案試験は, 隣接行列の非線形統計値と, 独立性のある解析値を組み合わせたものである。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:58:55 GMT)
Optimal beam displacement measurements using high-order structured light modes [0.0] 構造光ビームの角と横の小さな変位を測定する新しい手法を開発した。
この手法は高次ヘルミテ・ガウスモード(HG)とラゲール・ガウスモード(LG)を用いる。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:38:40 GMT)
Optimal Online Change Detection via Random Fourier Features [0.0] 本稿では,多変量データストリームにおけるオンライン非パラメータ変化点検出の問題について検討する。
本稿では,ランダムなフーリエ特徴に基づく逐次テスト手法を提案する。
我々は,検出遅延がミニマックス感において最適であることを示す情報理論境界を含む,アルゴリズムの性能に関する強力な理論的保証を証明した。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:02:13 GMT)
Non-Local Phase Estimation with a Rydberg-Superconducting Qubit Hybrid [0.0] 超伝導-共振器-原子ハイブリッドシステム上での量子位相推定アルゴリズムを実装した。
さらに、ハミルトン力学を用いてノイズ源の解析を行い、その後、ゲート構成の最適化に量子最適制御(GRAPE)を用いる。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:57:02 GMT)
New Uncertainty Principle for a particle on a Torus Knot [0.0] 本研究は、トーラス結び目の移動に制約された粒子の関連する動的変数の標準偏差(SD)に従属する量子不確実性関係(UR)を扱う。
これらの変数は、トーラスに埋め込まれた結び目パスの2つの異なる周期性に従う必要があることに注意する必要がある。
興味深い事実は、SDやURの場合、結び目の局所幾何学が、その位相的性質ではなく決定的な役割を果たすことである。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:37:14 GMT)
Mutarjim: Advancing Bidirectional Arabic-English Translation with a Small Language Model [0.0] 我々は、アラビア語と英語の双方向翻訳のためのコンパクトだが強力な言語モデルであるMutarjimを紹介する。
また、既存のアラビア語と英語のベンチマークデータセットの制限を克服するために設計された新しいベンチマークであるTarjama-25も導入した。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:42:21 GMT)
Multiplexed multipartite quantum repeater rates in the stationary regime [0.0] マルチパート量子リピータは、量子通信ネットワークにおいて重要な役割を果たす。
我々は、その速度が大量の記憶のために飽和していることを示します。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:36:22 GMT)
Multi-shot readout error benchmark of the nitrogen-vacancy center's electronic qubit [0.0] フォトルミネッセンスベースの量子ビット読み出しは、室温でのシングルショット忠実度が低い。
読み出しプロセスの様々なパラメータに対するマルチショット推論法の誤差の依存性を計算した。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:15:28 GMT)
Multi-agent Systems for Misinformation Lifecycle : Detection, Correction And Source Identification [0.0] 本稿では,誤情報ライフサイクルを網羅する新しいマルチエージェントフレームワークを提案する。
単一エージェントやモノリシックアーキテクチャとは対照的に,私たちのアプローチでは5つの特殊なエージェントを採用しています。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:05:56 GMT)
Minds, Brains, AI [0.0] 昨年ごろ、主要な計算科学者、技術者、その他によって、AIであるAI(人工知能)は5年か10年先にあるが、これらの主張の幅広い部分について、科学的証拠の欠如が指摘されている。
本稿では、認知・神経科学、進化的エビデンス、言語学、データ科学、比較心理学、自動運転車、ロボティクス、学習科学など、幅広い科学研究と関連する情報源を用いた、以下の3つの提案のエビデンスについてレビューする。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:02:37 GMT)
Metrology of open quantum systems from emitted radiation [0.0] 我々は、マルコフのオープン量子系の力学について、その環境に放射される情報を監視することによって学習する課題を探求する。
空間次元が$Dのオープンシステムでは、放射された放射の量子状態は時間的に順序付けられた行列生成状態(MPS)として記述することができる。
本稿では, 放射線状態の量子フィッシャー情報(QFI)に対する簡単な解析式を提供し, 開系に複数の定常状態がない限り, センシング時間と線形にスケールする。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:37:54 GMT)
Metal-Insulator Transition described by Natural Orbital Functional Theory [0.0] 水素系システムは金属絶縁体遷移(MIT)を研究するための単純だが強力なモデルを提供する
自然軌道汎関数理論(NOFT)を用いた立方体構造を持つ有限水素クラスターの研究
その結果, 原子間距離が減少するにつれて, NOFTは絶縁から金属への遷移を捉えていることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:36:31 GMT)
MetaGen Blended RAG: Higher Accuracy for Domain-Specific Q&A Without Fine-Tuning [0.0] 本稿では,ハイブリッドクエリインデックスとメタデータエンリッチメントによるドメイン固有コーパスの検索機能の向上に焦点を当てたエンタープライズ検索手法を提案する。
この'MetaGen Blended RAG'メソッドは、キーコンセプト、トピック、および頭字語を使用してメタデータ生成パイプラインを構築し、その後、検索クエリが強化されたメタデータ強化ハイブリッドインデックスを生成する。
バイオメディカル領域のPubMedQAベンチマークにおいて、提案手法は82%の精度と77%のRAG精度を達成し、微調整なしで以前のRAG精度を全て上回り、ゼロショット結果のベンチマークを新たに設定し、GPT3.5のようなはるかに大きなモデルよりも優れている。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:18:45 GMT)
Markov chain Monte Carlo Detector Tomography applied to a NbTiN nanobridge [0.0] フレキシブルで高精度なマルコフ連鎖Monte Carlo Quantum Detector Tomography法を実演する。
外部量子効率$eta=num1.60(5)e-6$は1光子の内部量子効率である。
複数光子(2つ以上の)内部量子効率の単位。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:36:01 GMT)
Managing FAIR Knowledge Graphs as Polyglot Data End Points: A Benchmark based on the rdf2pg Framework and Plant Biology Data [0.0] Linked Dataとラベル付きプロパティグラフ(LPG)は相補的な長所と短所を持つ2つのデータ管理手法である。
我々はRDFデータを意味的に等価なLPGフォーマットやデータベースにマッピングするフレームワークであるrdf2pgを紹介した。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:51:00 GMT)
MRI Image Generation Based on Text Prompts [0.0] 本研究では,実際のMRIデータセットを取得する際の課題を解決するために,安定拡散(SD)モデルを用いたテキストプロンプトMRI画像生成について検討する。
SDモデルは3Tの高速MRIデータセットと0.3TのM4Rawデータセットを用いて微調整された。
Fr'echet Inception Distance (FID) やMulti-Scale Structure similarity (MS-SSIM) などの測定値を用いて微調整モデルの性能を評価した。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:01:22 GMT)
MDDM: A Molecular Dynamics Diffusion Model to Predict Particle Self-Assembly [0.0] 分子動力学拡散モデルでは、与えられた入力対ポテンシャル関数の有効な出力を予測することができる。
このモデルは、非条件および条件付き生成タスクのベースライン点雲拡散モデルよりも大幅に優れている。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:02:34 GMT)
Long-term prediction of El Niño-Southern Oscillation using reservoir computing with data-driven realtime filter [0.0] 本稿では,機械学習モデルの長期予測可能性を得るために,新しい帯域通過フィルタを提案する。
データ駆動動的システムを利用する機械学習技術である貯水池計算とフィルタを組み合わせる。
我々は,過去時系列のみを用いて,24ヶ月の予測地平線でエルニーニョ南部振動の多年変動を予測した。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:42:01 GMT)
Load Forecasting for Households and Energy Communities: Are Deep Learning Models Worth the Effort? [0.0] エネルギーコミュニティ(EC)は、地域需要のシフトと自己充足力の向上に重要な役割を果たしている。
データ駆動予測は注目されているが、多くの実践的な文脈ではまだ十分に調査されていない。
本研究では,最先端のディープラーニングモデルの有効性を評価する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:07:21 GMT)
Leveraging biased noise for more efficient quantum error correction at the circuit-level with two-level qubits [0.0] また, 一定の条件下では, CNOTゲートに最大$etasim$5の残差が維持可能であることを示す。
我々はXZZX曲面符号の性能を数値的に研究し、バイアス保存型CZゲートがバイアスノイズの活用に重要であることを観察する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:35:36 GMT)
Learning Latent Variable Models via Jarzynski-adjusted Langevin Algorithm [0.0] 我々は、非平衡統計力学から派生したサンプルを用いて、潜在変数モデルにおける推定方法を構築する。
我々は,パラメータの最大限界推定値を提供する逐次モンテカルロ法(SMC)を開発した。
JALA-EMの様々な潜伏変数モデルにおける性能を実証し、精度と計算効率の点で既存の手法と相容れない性能を示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 23:40:57 GMT)
Learning Fricke signs from Maass form Coefficients [0.0] マアスのフーリエ係数を同じフリッケ符号で平均化すると、最近発見された「大腿骨」現象に類似したパターンが明らかになる。
データセットの約43%のフォームには、未知のフリッケサインがあります。
残りの形式については、リニア判別分析(LDA)を用いてフリッケ符号を機械的に学習し、偶数(奇数)パリティの形式に対して96%の精度(Resp. 94%)を達成する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:46:03 GMT)
LLM Contribution Summarization in Software Projects [0.0] 本稿では、チームプロジェクト内の個々の貢献を評価する自動化的かつ客観的なアプローチの必要性に対処する。
本稿では,大言語モデル(LLM)を利用して,バージョン管理リポジトリから抽出したコードコントリビューションを自動的に要約するツールを提案する。
このツールは、65人の学生が参加する3週間のフルタイムのソフトウェア開発スプリントで、2つのセミメータで評価された。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:26:43 GMT)
Joint Encryption and Error Correction for Secure Quantum Communication [0.0] 暗号化とエラー訂正が可能な単一の統合プロセスを提供する。
これはセキュアな量子通信のための最初の試みである。
これにより、任意のキュービットを送信者から受信者へ送信し、提案されたプロトコルを汎用的に実現することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:42:03 GMT)
It costs nothing to teleport information into a black hole [0.0] 最近発見されたブラックホールのデコヒーレンス現象は、量子情報を任意のエネルギーコストでブラックホールにテレポートする方法を説明します。
ランダウアーの原理に従って、ゼロではない最小エネルギーコストは、外界からの情報とノイズの純消去がある場合や、ゼロビット'がブラックホールに送られるときのみ現れる。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:33:18 GMT)
Is Training Data Quality or Quantity More Impactful to Small Language Model Performance? [0.0] 本研究では,学習データ品質と量の違いが小言語モデル(SLM)の性能に及ぼす影響について検討する。
大規模モデルのトレーニングは、組織、個人、一般の人々に対して禁止される、重大な財政的および計算的負担を課す。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:23:08 GMT)
Interpretable Visualizations of Data Spaces for Classification Problems [0.0] 分類問題によって決定される決定境界の可視化に適したハイブリッド教師なし手法を提案する。
定性的かつ定量的に分析できる人間解釈可能な地図を提供する。
本稿では, この手法を化学駆動問題の観点から論じる一方で, 機械学習分類モデルの操作を「アンボックス化」するために, サブフィールドにまたがって応用を一般化することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:28:06 GMT)
Incorporating episodic memory into quantum models of judgment and decision [0.0] 本稿では,状態と測定機器のシステムと環境表現に基づく一般的な計測手法について概説する。
これらより一般的な測定操作に基づく3つの異なる測定モデルと,質問順序効果のファジィコレクションを比較した。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:48:12 GMT)
Improving variational counterdiabatic driving with weighted actions and computer algebra [0.0] 可変カウンターダイアバティック(CD)駆動は、量子多体系を堅牢に制御するための規律付き、広く使われている方法である。
ここでは, AGP理論に新たな自由度を導入することにより, 変動CD駆動を大幅に改善できることを明らかにする。
計算機代数を用いた改良駆動プロトコルの効率的な数値計算法を開発した。
論文参考訳(メタデータ) (Fri, 23 May 2025 20:51:51 GMT)
Improving quantum walk metrology with split-step quantum walk [0.0] 分割ステップ量子ウォーク(SSQW)に基づく新しい推定法を開発した。
本研究は, SSQWが豊富なトポロジ特性により推定スキームを著しく改善できることを示唆する。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:01:36 GMT)
Improved Algorithms for Overlapping and Robust Clustering of Edge-Colored Hypergraphs: An LP-Based Combinatorial Approach [0.0] エッジカラークラスタリング(ECC)は、カテゴリデータを扱う上で有用なアプローチである。
これらの制限に対処するため、ECCの3つのバージョンが研究されている。
本稿では,LPの強みとアルゴリズムの計算効率を組み合わせたアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:46:16 GMT)
Impact of micromotion and field-axis misalignment on the excitation of Rydberg states of ions in a Paul trap [0.0] 我々は,Floquet理論を用いて数値解法し,摂動的アプローチを用いて解析的に解法する単一トラップリドベルクイオンを記述するモデルを開発した。
我々は,どのパラメータ規則に対処可能で,エネルギ的に孤立したRydberg線が持続するかを解析し,コヒーレントな操作を行う上で重要な要件である。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:10:36 GMT)
Impact of dephased entangled states and varying measurement orientations on the reliability of cryptographic keys generated via the quantum protocol E91: A quantum simulation approach [0.0] 本研究は、E91量子鍵分配プロトコルの性能を2つの要素の変動下で評価することに焦点を当てる。
我々は、IBMのAPIであるQiskitを用いて量子計算手法を用いて、研究された暗号プロトコルの光学的実装をシミュレートする。
その結果、量子伝達の性能は、励起子の寿命と量子ドットの微細構造分裂の間の積に非常に影響していることがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:46:34 GMT)
HopCast: Calibration of Autoregressive Dynamics Models [0.0] この研究は、モダンホップフィールドネットワーク(MHN)を用いて決定論的予測子の誤りを学習するホップ(hop)と呼ばれる代替のPredictor-Correctorアプローチを導入する。
Correctorは、自動回帰中の任意の時点のコンテキスト状態に基づいて、予測子の出力に対する一連のエラーを予測する。
キャリブレーションと予測性能は一連の力学系で評価される。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:45:54 GMT)
High-spin measurements in an arbitrary two-qudit state [0.0] バイパルタイト量子状態によるCHSH不等式の振動は、現在では多くの量子応用で使われている。
2つのスピン=s$次元クォーディットの任意の状態に対して、CHSHの不等式は局所アリスとボブの測定の下では破られていないことが分かる。
より高い絡み合いを持つ純粋な2量子状態の場合、CHSH期待値の最大値は、より低い絡み合いを持つ純粋な2量子状態よりも小さいことが判明した。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:39:38 GMT)
HiLAB: A Hybrid Inverse-Design Framework [0.0] HiLABはナノフォトニック構造の逆設計のための新しいパラダイムである。
シミュレーションコストを削減した多様なフリーフォーム構成を生成することで、多機能デバイス設計に対処する。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:34:56 GMT)
Handling Symbolic Language in Student Texts: A Comparative Study of NLP Embedding Models [0.0] 本研究は, 現代埋め込みモデルが, 科学関連記号表現の処理・解釈能力にどう影響するかを考察する。
以上の結果から,OpenAIのGPT-text-embedding-3-largeは,他のすべての検査モデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:26:33 GMT)
HQSI: Hybrid Quantum Swarm Intelligence -- A Case Study of Online Certificate Status Protocol Request Flow Prediction [0.0] Hybrid Quantum Swarm Intelligence (HQSI)は、前方伝播ニューラルネットワークとして量子ニューラルネットワーク(QNN)モデルを構築する。
HQSIは、最先端の量子最適化アルゴリズムに対するエラーを50%以上削減する。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:43:53 GMT)
Graph Attention Neural Network for Botnet Detection: Evaluating Autoencoder, VAE and PCA-Based Dimension Reduction [0.0] グラフニューラルネットワーク(GNN)は、反復的なメッセージパッシングを通じて埋め込み空間を学習することで、この制限に対処する。
本稿では,まずNetFlowベースのIoTアタックデータセットの次元性を低減し,グラフデータセットに変換するフレームワークを提案する。
可変オートエンコーダ(VAEエンコーダ)、古典的オートエンコーダ(AEエンコーダ)、主成分分析(PCA)の3次元化技術を評価する。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:22:14 GMT)
GitHub Proxy Server: A tool for supporting massive data collection on GitHub [0.0] GitHubは最も人気のあるソーシャルコーディングプラットフォームであり、開発者や組織が世界中のオープンソースプロジェクトをホストするために広く使用している。
プラットフォームにはWeb APIがあり、開発者がホストされている公開リポジトリから情報を収集することができる。
しかし、GitHubから大量のデータを集めることは、既存の制限と乱用検出メカニズムのために非常に難しい。
GitHub Proxy Serverと呼ばれるツールは、そのような複雑さを、運用システムやプログラミング言語に依存しないツールに抽象化します。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:00:32 GMT)
Generalization Bounds in Hybrid Quantum-Classical Machine Learning Models [0.0] 我々はハイブリッドモデルにおける一般化を解析するための統一的な数学的枠組みを開発する。
量子古典的畳み込みニューラルネットワーク(QCCNN)にこの結果を適用する。
論文参考訳(メタデータ) (Fri, 23 May 2025 10:12:30 GMT)
FreqU-FNet: Frequency-Aware U-Net for Imbalanced Medical Image Segmentation [0.0] FreqU-FNetは周波数領域で動作する新しいU字型セグメンテーションアーキテクチャである。
我々のフレームワークは、低パス畳み込みとDubechiesウェーブレットに基づくダウンサンプリングを利用する周波数を組み込んでいる。
複数の医療セグメンテーションベンチマークの実験では、FreqU-FNetはCNNとTransformerのベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:51:24 GMT)
Flowing Through Layers: A Continuous Dynamical Systems Perspective on Transformers [0.0] 本稿では,変圧器の標準離散更新規則を連続力学系の前方オイラー離散化として自然に解釈できることを示す。
我々のTransformer Flow Approximation Theoremは、標準的なリプシッツ連続性仮定の下で、トークン表現が、層の数が増えるにつれてODEのユニークな解に一様収束することを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:47:52 GMT)
Federated Learning in Genetics: Extended Analysis of Accuracy, Performance and Privacy Trade-offs [0.0] 大規模なゲノムまたは転写データの機械学習は、多くの新しい健康アプリケーションにとって重要である。
プライバシーと規制上の理由から、信頼できるサードパーティですべてのデータを集約することも問題となる。
フェデレートされた学習は、生データを交換することなく、分散化された機械学習を可能にするため、このジレンマに対する有望な解決策である。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:56:07 GMT)
Federated Causal Inference from Multi-Site Observational Data via Propensity Score Aggregation [0.0] 因果推論は通常、個々のレベルのデータへの集中的なアクセスを仮定する。
フェデレーション学習を用いて、分散化された観測データから平均処理効果(ATE)を推定することにより、この問題に対処する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:32:57 GMT)
Evidence of Memory Effects in the Dynamics of Two-Level System Defect Ensembles Using Broadband, Cryogenic Transient Dielectric Spectroscopy [0.0] 誘電体中の2レベル系欠陥(TLS)は超伝導回路におけるデコヒーレンスの主要な原因であると考えられている。
ブロードバンド3D導波路を用いたTLS欠陥アンサンブルの低温誘電応答の探索を可能にする新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:01:07 GMT)
Evaluation of derivatives using approximate generalized parameter shift rule [0.0] 任意のデバイスハミルトニアンを扱える近似一般化パラメータ規則(aGPSR)を提案する。
3から6キュービットの変動量子固有解法テストケースにaGPSRを適用すると、期待呼び出しの数は7から504の係数で減少する。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:46:14 GMT)
Enhancing Fourier-based Doppler Resolution with Diffusion Models [0.0] レーダーシステムでは、ドップラー次元の高分解能がスローモーションターゲットの検出に重要である。
我々は人工知能を利用してレンジドップラーマップのドップラー分解能を向上させる。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:27:19 GMT)
Emerging categories in scientific explanations [0.0] 機械学習の決定に関する説明は、影響があり人間らしくなければならない。
人間的な説明と人為的な説明に焦点を当てた大規模なデータセットが不足している。
本研究の目的は, バイオテクノロジー・バイオ物理分野の様々な資料から, 科学文献から説明文を抽出することである。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:46:52 GMT)
Electromagnetic Casimir-Polder Interaction for a Conducting Cone [0.0] 偏光可能な粒子を持つ完全導電円錐のカシミール・ポルダー相互作用エネルギーを計算する。
完全導電ウェッジに対する類似のアプローチをまず再検討し、その結果の積分の数値的評価による計算を実演することによって、この形式性を導入する。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:10:45 GMT)
Efficient compression of neural networks and datasets [0.0] ニューラルネットワークのパラメータ数を著しく削減する手法を比較し,改善し,貢献する。
記述長を最小化するために本手法を適用すると、非常に効率的なデータ圧縮アルゴリズムが得られる。
正規化モデルがより標本効率のよい収束を示すことができるという予測を実証的に検証する。
論文参考訳(メタデータ) (Fri, 23 May 2025 04:50:33 GMT)
Efficient Quantum Control via Automatic Control Skips [0.0] 本稿では,各アルゴリズムの実装を調整することなく,"スキッパブル"パターンを見つけるための汎用的手法を提案する。
しかしながら、スキップ可能なサブ回路を見つける準最適近似アルゴリズムは、現実世界のアプリケーションにおいて回路メトリクスを50%以上改善する可能性がある。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:00:03 GMT)
EVM-Fusion: An Explainable Vision Mamba Architecture with Neural Algorithmic Fusion [0.0] EVM-Fusionは、医療画像分類のための新しいアルゴリズムニューラルネットワークフュージョン(NAF)機構を備えた説明可能な視覚マンバアーキテクチャである。
多様な9クラスの医療画像データセットの実験は、EVM-Fusionの強力な分類性能を示し、99.75%のテスト精度を達成した。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:41:57 GMT)
Dual-sensing driving detection model [0.0] 本稿では, リアルタイム顔特徴解析と生理学的信号処理, 高度な融合戦略を組み合わせることで, 堅牢な疲労検出を実現する革新的なアーキテクチャを提案する。
システムの実用性は、様々な運転シナリオにおける広範なテストを通じて検証され、疲労関連事故の低減に大きな可能性を示している。
論文参考訳(メタデータ) (Fri, 23 May 2025 02:05:48 GMT)
Drone- and Vehicle-Based Quantum Key Distribution [0.0] 量子鍵分布は、セキュアな情報交換を可能にするために量子力学を利用するポイントツーポイント通信プロトコルである。
ここでは,モジュール型,プラットフォームに依存しない量子鍵分散送信機と受信機について述べる。
我々は、異なる移動プラットフォームにシステムをデプロイし、ドローンからドローンへ、ドローンから車両へ、そして車両から車両への量子通信を実演する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:46:56 GMT)
Designing an efficient and equitable humanitarian supply chain dynamically via reinforcement learning [0.0] 本研究では, 強化学習, PPO を用いて, アルゴリズムとの比較により, 効率的で公平な人道的サプライチェーンを動的に設計する。
本研究は,PPOのモデルが常に平均満足度を優先的に扱うことを示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 03:45:08 GMT)
Deep Operator Neural Network Model Predictive Control [0.0] 深部演算子ニューラルネットワーク(DeepONets)に基づくモデル予測制御(MPC)アルゴリズムの設計について検討する。
マルチステップ入力シーケンスからシステム出力を1ショットで予測する多ステップDeepONetアーキテクチャを提案する。
我々は,MS DeepONetがマルチステップシーケンス予測における普遍近似器であることを証明した。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:13:19 GMT)
Decomposition of Water Demand Patterns Using Skewed Gaussian Distributions for Behavioral Insights and Operational Planning [0.0] 本研究では,スキュードガウス分布(SGD)を用いた都市水需要パターンの分解手法を提案する。
SGDはピーク振幅、タイミング(平均)、拡散(デューレーション)、歪(非対称性)などの解釈可能なパラメータで各ピークを特徴づける
この詳細なピークレベルの分解は、例えば異常や漏洩検知、リアルタイム需要管理、戦略的分析といった、運用上のアプリケーションの両方を可能にする。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:00:53 GMT)
Continuous quantum correction on Markovian and Non-Markovian models [0.0] 我々はマルコフ的誤差モデルの下での性能を2つの異なる非マルコフ的モデルと比較する。
連続量子誤差補正は非マルコフ雑音に対する性能を高めた。
論文参考訳(メタデータ) (Fri, 23 May 2025 22:08:32 GMT)
Compact Matrix Quantum Group Equivariant Neural Networks [0.0] 群同変ニューラルネットワークは、データが古典的な幾何学空間に存在する幅広いタスクをモデル化するのに有効であることが証明されている。
これらのネットワークは、非可換幾何学に生きるデータから学ぶには適していない。
我々は、コンパクト行列量子群同変ニューラルネットワークと呼ばれる、新しいタイプの同変ニューラルネットワークの存在を導出する。
論文参考訳(メタデータ) (Fri, 23 May 2025 14:30:04 GMT)
Clinical Validation of Deep Learning for Real-Time Tissue Oxygenation Estimation Using Spectral Imaging [0.0] モンテカルロ模擬スペクトルを用いたリアルタイム組織酸素化推定のための深層学習手法を提案する。
我々は、このタスクのために完全連結ニューラルネットワーク(FCN)と畳み込みニューラルネットワーク(CNN)を訓練する。
その結果, これらの深層学習モデルは, 乳頭乳酸キャピラリーと高い相関性を示すことがわかった。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:14:27 GMT)
Chaos and thermalization in open quantum systems [0.0] 我々は固有状態熱化仮説をリンドブラッド力学によって支配されるオープン量子系に拡張する。
熱化はコヒーレント振動の抑制と非構造的局所力学の出現を通じて現れることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:00:13 GMT)
Cat states carrying long-range correlations in the many-body localized phase [0.0] 強相関の強いスピン対が系全体を横断する稀な非定型事象について検討した。
予想外の強い障害、すなわち、標準的な推定値が不安定性の検出に失敗する体制で発生する。
本稿では, システムスパンニングの絡み合いを示す新しい固有状態のクラスについて, 単純で汎用的な解析的記述を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 07:28:27 GMT)
CarboNeXT and CarboFormer: Dual Semantic Segmentation Architectures for Detecting and Quantifying Carbon Dioxide Emissions Using Optical Gas Imaging [0.0] 二酸化炭素(CO$$)排出は、環境影響と家畜管理を含む様々な産業プロセスの両方の重要な指標である。
我々は,光ガスイメージング(OGI)のためのセマンティックセグメンテーションフレームワークであるCarboNeXTを紹介した。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:01:42 GMT)
COLORA: Efficient Fine-Tuning for Convolutional Models with a Study Case on Optical Coherence Tomography Image Classification [0.0] 本稿では,現在のCNNファインチューニング手法における非効率性を克服するために,畳み込み低ランク適応法(CoLoRA)を提案する。
我々は,ImageNet上で事前学習したCNNバックボーンを用いて,モデルの開発と評価を行った。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:21:01 GMT)
But what is your honest answer? Aiding LLM-judges with honest alternatives using steering vectors [0.0] モデルからより正直な応答を引き出すために、単一のサンプルで訓練されたステアリングベクトルを利用する新しいフレームワークであるJUSSA(Jice Using Safety-Steered Alternatives)を導入する。
JUSSAにより、LLMの判断者は、不正直な反応と良心的な反応を区別し、微妙な操作行動の事例を特定することができる。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:34:02 GMT)
Bridging Electronic Health Records and Clinical Texts: Contrastive Learning for Enhanced Clinical Tasks [0.0] 本稿では,構造化EHRデータの潜在表現を非構造化放電要約ノートと整合させるフレームワークを提案する。
ペアのEHRとテキストの埋め込みをまとめて、障害のないものを分解する。
その結果,臨床ノートからEHRベースのパイプラインにドメイン知識を統合する効果が示された。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:04:49 GMT)
Boosting quantum efficiency by reducing complexity [0.0] 我々は、Sachdev-Ye-Kitaev(SYK)モデルが、充電とストレージ効率を向上させるための有望なプラットフォームとして出現したことを示す。
カオスが完全に壊れていない限り、その複雑さを減らし、より効率的な量子電池につながる可能性がある。
論文参考訳(メタデータ) (Fri, 23 May 2025 09:49:45 GMT)
Boosting Open Set Recognition Performance through Modulated Representation Learning [0.0] オープンセット認識問題は、トレーニングクラスの一部ではない新しいセマンティッククラスからテストサンプルを識別することを目的としている。
既存のOSR法では、損失関数を適用する前に、ロジットに一定のスケーリング係数(温度)を使用する。
我々は,新しい負コサインスケジューリング方式を用いた温度変調表現学習を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 17:47:20 GMT)
Boosting Edge Detection with Pixel-wise Feature Selection: The Extractor-Selector Paradigm [0.0] 本稿では,より適応的で正確な融合を実現するために,画素ワイドな特徴選択を導入した新しいフレームワークであるExtractor-Selector(E-S)パラダイムを提案する。
全ての画素に同じ畳み込みカーネルを適用する従来の画像レベルでの融合とは異なり、本手法は各画素における関連する特徴を動的に選択する。
E-Sフレームワークはアーキテクチャの変更なしに既存のEDモデルとシームレスに統合することができ、大幅なパフォーマンス向上を提供します。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:38:45 GMT)
Beyond Log-Concavity and Score Regularity: Improved Convergence Bounds for Score-Based Generative Models in W2-distance [0.0] 生成モデル(SGM)における$mathcalW$-convergenceを解析するための新しいフレームワークを提案する。
データ分布の弱い対数共振器は時間とともに対数共振器へと進化することを示す。
本手法は,スコア関数とその推定器上での厳密な規則性条件の必要性を回避するものである。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:58:15 GMT)
Bayesian Deep Learning for Discrete Choice [0.0] 本稿では,ベイズ近似手法の統合に特化して設計されたディープラーニングモデルアーキテクチャを提案する。
提案モデルでは,データに制限がある場合,行動情報に基づく仮説が崩壊する。
本研究は、ニューヨーク市におけるモード選択データを用いた実証事例と、スイスの列車選択データに記述された嗜好データに基づく事例である。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:33:47 GMT)
Attention-Based Reconstruction of Full-Field Tsunami Waves from Sparse Tsunameter Networks [0.0] 本研究では,津波計ネットワークから予測を生成する津波データ同化手法に着目した。
本モデルは,高分解能津波波動場を極めてスパースな観測から再構成するために用いられる。
本研究では,Huygens-Fresnel Principle を用いた線形補間により,高密度観測ネットワークの生成において,線形補間を著しく上回っていることを示す。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:48:36 GMT)
Assessing the performance of 8 AI chatbots in bibliographic reference retrieval: Grok and DeepSeek outperform ChatGPT, but none are fully accurate [0.0] 全5分野(健康・工学・実験科学・社会科学・人文科学)で計400件の参考文献が評価された。
結果は、参照の26.5%が完全に正しいこと、33.8%が部分的に正しいこと、39.8%が誤って、あるいは完全に作られたことが示されている。
これらの発見は、現在のAIモデルの構造的制約を明らかにし、学生による非クリティカルな使用のリスクを強調し、情報と批判的リテラシーを強化する必要性を強調している。
論文参考訳(メタデータ) (Fri, 23 May 2025 16:07:14 GMT)
Are GNNs Worth the Effort for IoT Botnet Detection? A Comparative Study of VAE-GNN vs. ViT-MLP and VAE-MLP Approaches [0.0] 本研究は,IoTボットネット検出のための4つの最先端ディープラーニングアーキテクチャの有効性を評価する。
バイナリ分類タスクでは、全てのモデルが99.93%以上の精度、精度、F1スコアを達成したが、性能に顕著な違いはなかった。
マルチクラス分類タスクでは,VAE-MLPやViT-MLPに比べ,GNNモデルの方が有意に低い性能を示した。
論文参考訳(メタデータ) (Fri, 23 May 2025 00:33:52 GMT)
An Attention Infused Deep Learning System with Grad-CAM Visualization for Early Screening of Glaucoma [0.0] この研究は、後発の畳み込みニューラルネットワークと破壊的な視覚変換器の組み合わせから生まれた、ハイブリッドなラビリンチンディープラーニングモデルの目を開く知恵を明らかにする。
人工知能モデルのための2つの高収率データセット、すなわちACRIMAとDrishtiを用いて緑内障を検出する。
論文参考訳(メタデータ) (Fri, 23 May 2025 12:25:13 GMT)
Alpay Algebra II: Identity as Fixed-Point Emergence in Categorical Data [0.0] 私はアイデンティティをカテゴリー再帰を通じて現れる固定点として定義します。
私はそのようなアイデンティティの存在とユニークさを証明します-順序付き反復によって固定します。
この論文は、アイデンティティを、計算可能、収束可能、カテゴリー固有の論理内から生じる数学的構造として位置づける。
論文参考訳(メタデータ) (Fri, 23 May 2025 05:15:34 GMT)
Adaptively Secure Distributed Broadcast Encryption with Linear-Size Public Parameters [0.0] 分散ブロードキャスト暗号化(Distributed broadcast encryption、DBE)は、ユーザのサブセットにメッセージを効率よく送信できる、ブロードキャスト暗号化(BE)の一種である。
定数サイズ暗号文,定数サイズ秘密鍵,線形サイズ公開パラメータを用いたDBE方式を提案する。
論文参考訳(メタデータ) (Fri, 23 May 2025 06:35:08 GMT)
ActiveLLM: Large Language Model-based Active Learning for Textual Few-Shot Scenarios [0.0] インスタンスの選択にLarge Language Modelsを活用する新しいアクティブラーニングアプローチであるActiveLLMを紹介する。
我々は,ActiveLLMが,数ショットシナリオにおけるBERT分類器の分類性能を著しく向上することを示した。
この結果から,ActiveLLMは様々な学習環境において,モデル性能を向上させるための有望なソリューションである可能性が示唆された。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:27:21 GMT)
AI-Driven SEEG Channel Ranking for Epileptogenic Zone Localization [0.0] 本稿では,臨床医の選択と計算的発見を取り入れて,影響のあるチャネルをランク付けする機械学習手法を提案する。
XGBoostを用いた分類モデルを訓練し,不特定期間に各チャネルの異種特徴を学習する。
また、探索空間を拡大し、不審なてんかん原性領域を特定するためのチャネル拡張戦略も組み込まれている。
論文参考訳(メタデータ) (Fri, 23 May 2025 19:09:16 GMT)
AI Literacy for Legal AI Systems: A practical approach [0.0] この記事では、"法的なAIシステム"という用語を紹介し、次に、AIリテラシーの概念と、これらのシステムに関連するメリットとリスクを分析します。
その結果は、開発者やプロバイダがリスク、利益、ステークホルダーの懸念を評価するための実践的なツールとしてのロードマップのアンケートになります。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:10:28 GMT)
A variational quantum eigensolver tailored to multi-band tight-binding simulations of electronic structures [0.0] 電子構造の原子シミュレーションのための費用効率変動量子固有解法(VQE)を提案する。
スパースTBハミルトニアンはボトムアップ方式で構成され、標準基底作用素の線形結合として表現される。
提案手法を用いて金属ハロゲン化ペロブスカイト超セルのバンドギャップエネルギーを求める。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:34:02 GMT)
A theory of quasiballistic spin transport [0.0] 準弾道スピン輸送(Quasiballistic spin transport)は、磁化密度の長寿命かつ過渡的に弾道モードである。
このような準球論的なスピン輸送の解析理論を開発する。
論文参考訳(メタデータ) (Fri, 23 May 2025 18:26:05 GMT)
A Robust PPO-optimized Tabular Transformer Framework for Intrusion Detection in Industrial IoT Systems [0.0] 産業用モノのインターネット(IIoT)環境におけるネットワーク侵入検知システム(NIDS)を提案する。
本モデルでは,効率的な表表特徴表現のためのタブトランスフォーマをPPO(Proximal Policy Optimization)と統合し,分類決定を最適化する。
本手法はTONunderscore IoTベンチマークで97.73%のマクロF1スコアと98.85%の精度を実現する。
論文参考訳(メタデータ) (Fri, 23 May 2025 13:03:45 GMT)
A Domain Ontology for Modeling the Book of Purification in Islam [0.0] 本稿は、イスラム教の浄化書のオントロジーを発展させ、主要なイスラムトピックのギャップに対処することを目的とする。
多くの権威あるイスラム教のテキストは、祈りを行うのに欠かせないため、浄化書から始まる。
この構造化された表現は、知識の共有と再利用をサポートすることを意図している。
論文参考訳(メタデータ) (Fri, 23 May 2025 08:55:59 GMT)
3D-Integrated Superconducting qubits: CMOS-Compatible, Wafer-Scale Processing for Flip-Chip Architectures [0.0] 本稿では,フリップチップ結合による超伝導量子ビット素子の3次元集積化とCMOS加工標準による加工技術について述べる。
量子ビットの時間領域分光では、エネルギー緩和時間の最大15時間で高収率の量子ビット励起が見つかる。
論文参考訳(メタデータ) (Fri, 23 May 2025 15:18:21 GMT)
$\mathcal{PT-}$Symmetric Open Quantum Systems: Information Theoretic Facets [0.0] $eta$-pseudo Hermitian Hamiltonian の$mathcalPT$対称性の理論をレビューし、開系力学を含むように拡張する。
単純な光物質相互作用オープンシステムモデルにインスパイアされた情報理論量は、$mathcalPT-$symmetric Hamiltonianに対して計算される。
論文参考訳(メタデータ) (Fri, 23 May 2025 11:59:31 GMT)