Safety at Scale: A Comprehensive Survey of Large Model Safety [298.1] 我々は、敵攻撃、データ中毒、バックドア攻撃、ジェイルブレイクとプロンプトインジェクション攻撃、エネルギー遅延攻撃、データとモデル抽出攻撃、出現するエージェント固有の脅威を含む、大規模なモデルに対する安全脅威の包括的分類を提示する。
我々は、大規模なモデル安全性におけるオープンな課題を特定し、議論し、包括的な安全性評価、スケーラブルで効果的な防御機構、持続可能なデータプラクティスの必要性を強調します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:47:50 GMT)
LAM SIMULATOR: Advancing Data Generation for Large Action Model Training via Online Exploration and Trajectory Feedback [121.8] AIエージェントのための大規模アクションモデル(LAM)は、素晴らしいポテンシャルを提供するが、高品質なトレーニングデータを必要とするため、課題に直面している。
LAM SIMULATORは,高品質なフィードバックによるエージェントタスクのオンライン探索を目的とした総合的なフレームワークである。
本フレームワークは,動的タスククエリジェネレータ,広範囲なツールコレクション,および大規模言語モデル(LLM)エージェントがツールを呼び出し,リアルタイムフィードバックを受信できる対話型環境を備えている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:36:02 GMT)
Contra4: Evaluating Contrastive Cross-Modal Reasoning in Audio, Video, Image, and 3D [107.7] Contra4は、画像、オーディオ、ビデオ、および3Dの4つのモードにまたがる、対照的な相互モーダル推論のためのデータセットである。
コントラ4は、人間の注釈付きキャプションとモデルの混合フィルタを組み合わせて高品質な監視を確実にし、174kのトレーニング例と2.3kの試験セットを手作業で検証する。
タスク固有の微調整はベースラインと比較してパフォーマンスを56%向上させるが、最先端のモデルでは全体の56%の精度と4つのモダリティ設定で42%の精度しか達成していない。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:12:13 GMT)
LLMs instead of Human Judges? A Large Scale Empirical Study across 20 NLP Evaluation Tasks [106.1] 人間の判断の代わりにLPMを用いてNLPモデルを評価する傾向が高まっている。
JUDGE-BENCHは20個のNLPデータセットのコレクションで、人間のアノテーションで、幅広い評価された特性やデータの種類をカバーしています。
アノテーションを複製できるため、オープンウェイトモデルとプロプライエタリモデルの両方をカバーする11の現在のLCMを評価します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:31:19 GMT)
Follow the Flow: Fine-grained Flowchart Attribution with Neurosymbolic Agents [106.0] フローチャートは意思決定プロセスを視覚化するための重要なツールです。
視覚言語モデルは、これらの図を分析する際に、存在しない接続や決定経路を幻覚させる。
LLM応答を参照してフローチャートを接地する特定の成分をトレースするフローチャートについて紹介する。
本稿では, グラフベースの推論により微細なホック帰属を行うニューロシンボリック・エージェントであるFlowPathAgentを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:02:41 GMT)
How much do language models memorize? [104.2] 我々は記憶を2つの構成要素に分けている:「文体記憶」と「文体一般化」である。
一般化を完全に排除すると、モデルキャパシティを見積もるトータル・メモリ化を計算することができる。
サイズが大きくなるデータセット上で言語モデルをトレーニングし、キャパシティが満たされるまでモデルを記憶し、その時点での「グルーキング」が始まり、モデルが一般化し始めるにつれて意図しない記憶が減少するのを観察する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:13:41 GMT)
Self-Challenging Language Model Agents [98.6] 本稿では,エージェントが自ら生成する高品質なタスクについて,エージェントを訓練するためのセルフチェンジフレームワークを提案する。
このフレームワークは、Llama-3.1-8B-Instructの2倍の改善を実現している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:23:33 GMT)
Learning of Population Dynamics: Inverse Optimization Meets JKO Scheme [98.0] 個体群動態の学習は、粒子の進化を管理する基礎過程の回復を伴う。
近年の手法では、これを確率空間におけるエネルギー問題とみなし、有名なJKOスキームを効率的な時間離散化に活用している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:08:03 GMT)
NTIRE 2025 Challenge on RAW Image Restoration and Super-Resolution [97.7] 本報告では,NTIRE 2025 RAW画像復元と超解法チャレンジについて概説し,提案手法と結果について述べる。
この課題のゴールは、(i)ぼかしとノイズ劣化を伴うRAW画像の復元、(ii)未知のノイズとぼかしを考慮したRAWベイア画像の2倍のスケールアップである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:34:21 GMT)
EarthMind: Towards Multi-Granular and Multi-Sensor Earth Observation with Large Multimodal Models [96.2] 我々は,多粒子・多センサ地球観測(EO)データ理解のための新しい視覚言語フレームワークであるEarthMindを提案する。
EarthMind は,(1) 画素レベルの理解を高めるために LLM 内で注意を喚起する空間アテンション・プロンプティング (SAP) と、(2) 異質なモダリティを共有空間に整合させるクロスモーダル・フュージョン (Cross-modal Fusion) の2つのコアコンポーネントを備えている。
マルチセンサ・フュージョン評価を容易にするため,2000以上のマルチセンサ・イメージ・クエクション・ペアを用いた総合ベンチマーク「EarthMind-Bench」を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:36:05 GMT)
SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.3] We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。
従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:42:36 GMT)
Self-ensemble: Mitigating Confidence Distortion for Large Language Models [89.0] 大規模言語モデルでは,複数問合せ質問に対する信頼度歪みが問題となる。
この問題を解決するために自己組織化を提案する。
3つのLLMおよびデータセットの実験結果から,自己アンサンブルが信頼歪問題に包括的に対処できることが示されている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:59:29 GMT)
Ola: Pushing the Frontiers of Omni-Modal Language Model [88.7] 我々はOlaについて述べる。Olaは、画像、ビデオ、音声の理解間での競合性能を実現するオムニモーダル言語モデルである。
Olaは、いくつかの重要かつ効果的な改善を通じて、高度な視覚的理解と音声認識機能を備えている。
我々は、Olaを、この新興分野における将来の研究を進めるための、完全にオープンなオムニモーダル理解ソリューションにすることを目指している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:33:24 GMT)
Dynamic Search for Inference-Time Alignment in Diffusion Models [87.4] 探索問題としての拡散における推論時間アライメントと動的拡散探索(DSearch)を提案する。
DSearchは、デノナイズプロセスからサブサンプルを取得し、中間ノードの報酬を近似する。
また、ビーム幅と木の拡大を動的に調整し、高次世代を効率的に探索する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:37:06 GMT)
Self-supervised Latent Space Optimization with Nebula Variational Coding [87.2] 本稿では,クラスタ化埋め込みに繋がる変分推論モデルを提案する。
textbfnebula anchorsと呼ばれる潜伏空間に新たな変数を導入し、トレーニング中に潜伏変数がクラスタを形成するように誘導する。
各潜在機能は最も近いアンカーでラベル付けできるため、クラスタ間の分離をより明確にするために、自己教師付き方法でメートル法学習を適用することも提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:13:32 GMT)
CAP-Net: A Unified Network for 6D Pose and Size Estimation of Categorical Articulated Parts from a Single RGB-D Image [86.8] 本稿では,ロボット操作作業における調音物体のカテゴリーレベルのポーズ推定に取り組む。
そこで本研究では,Categorical Articulated Partsの6次元ポーズとサイズを推定するためのシングルステージネットワークCAP-Netを提案する。
我々は,RGB画像と実センサからシミュレーションした深度雑音を特徴とするRGB-D調音データセットであるRGBD-Artデータセットを紹介した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:45:53 GMT)
AI Debate Aids Assessment of Controversial Claims [86.5] AIの議論が、新型コロナウイルス(COVID-19)の事実性主張に反対する2つのAIシステムを議論することで、偏見のある裁判官を真実に導くことができるかどうかを調査する。
人間の研究では、2つのAIアドバイザシステムが対立するエビデンスに基づく議論を提示し、判定精度と信頼性の校正を改善していることがわかった。
我々のAIジャッジスタディでは、人間のようなペルソナを持つAIジャッジが、人間のジャッジ(70.1%)とデフォルトのAIジャッジ(69.8%)よりさらに高い精度(78.5%)を達成することが分かりました。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:01:53 GMT)
Unlocking Aha Moments via Reinforcement Learning: Advancing Collaborative Visual Comprehension and Generation [85.2] 視覚的理解と生成の協調的共進化を可能にすることを提案する。
教師付き微調整は、真のCoTを生成する基礎的な能力を持つMLLMを指導する。
画像生成におけるAhaモーメントを解き、テキスト・ツー・イメージタスクから統合画像生成へMLLMを前進させる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:39:28 GMT)
Align is not Enough: Multimodal Universal Jailbreak Attack against Multimodal Large Language Models [83.8] マルチモーダル・ユニバーサル・ジェイルブレイク・アタック・フレームワークを提案する。
LLaVA,Yi-VL,MiniGPT4,MiniGPT-v2,InstructBLIPなどのMLLMの望ましくないコンテキスト生成を評価する。
本研究は,MLLMにおける堅牢な安全対策の必要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:33:56 GMT)
AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning [82.4] AgentCPM-GUIは、堅牢で効率的なオンデバイスGUIインタラクションのために構築されている。
私たちのトレーニングパイプラインには、知覚を高めるためのグラウンドアウェア事前トレーニングが含まれています。
AgentCPM-GUIは5つの公開ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:30:29 GMT)
Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive Effective Reinforcement Learning for LLM Reasoning [80.9] RLVR(Reinforcement Learning with Verifiable Rewards)は,Large Language Models(LLM)の推論能力向上のための強力なアプローチとして登場した。
本研究では,トークンエントロピーパターンの新たな視点からRLVRの先駆的な探索を行う。
トークンのごく一部だけが高いエントロピーを示しており、これらのトークンは様々な推論経路に向けてモデルを操る重要なフォークとして機能する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:54:39 GMT)
RAW Image Reconstruction from RGB on Smartphones. NTIRE 2025 Challenge Report [80.6] 本稿では, sRGB (Reverse ISP) からのRAW再構成に関する第2の課題について述べる。
メタデータを使わずに対応するsRGB画像からRAWセンサイメージを回収することを目的としている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:58:31 GMT)
E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models [78.2] 3次元幾何学基礎モデル(GFM)の総合ベンチマークを初めて提示する。
GFMは、単一のフィードフォワードパスで密度の高い3D表現を直接予測し、スローまたは未使用のカメラパラメータを不要にする。
我々は16の最先端GFMを評価し、タスクやドメイン間の長所と短所を明らかにした。
すべてのコード、評価スクリプト、処理されたデータは公開され、3D空間インテリジェンスの研究が加速される。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:53:09 GMT)
Rydberg Atomic Quantum MIMO Receivers for The Multi-User Uplink [77.3] 本稿では,マルチユーザアップリンクにおけるRydberg原子量子多重出力多重出力(RAQ-MIMO)レシーバの柔軟なアーキテクチャを提案する。
RAQ-MIMOシステムの対応する信号モデルは、量子物理学から無線通信への道を開いたものである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:16:54 GMT)
Value Compass Benchmarks: A Platform for Fundamental and Validated Evaluation of LLMs Values [76.7] 大きな言語モデル(LLM)は驚くべきブレークスルーを達成する。
価値を人間に合わせることは 責任ある開発に欠かせないものになっています
3つの望ましい目標を達成するLLMの評価はいまだに欠けている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:40:42 GMT)
AdaWorld: Learning Adaptable World Models with Latent Actions [76.5] 我々は,効率的な適応を実現する革新的な世界モデル学習手法であるAdaWorldを提案する。
主要なアイデアは、世界モデルの事前トレーニング中にアクション情報を統合することである。
次に、これらの潜伏行動を条件とした自己回帰的世界モデルを開発する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:37:52 GMT)
TextDestroyer: A Training- and Annotation-Free Diffusion Method for Destroying Anomal Text from Images [76.3] TextDestroyerは、シーンテキスト破壊のためのトレーニングおよびアノテーションなしのメソッドである。
提案手法は,復元前のガウス分布を用いて遅延開始符号中のテキスト領域をスクランブルする。
TextDestroyerの利点は、(1)労働集約型データアノテーションとリソース集約型トレーニングを排除し、(2)より徹底的なテキスト破壊を実現し、認識可能なトレースを防止し、(3)より優れた一般化能力を示し、現実世界のシーンと生成された画像の両方でうまく機能する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:08:07 GMT)
Zero-Shot Streaming Text to Speech Synthesis with Transducer and Auto-Regressive Modeling [76.2] 既存の手法は主に、自然なストリーミング音声合成を実現するために、将来のテキストに依存するルックメカニズムを使用している。
本稿では,高品質な音声フレームをフレーム単位で生成するためのストリーミングフレームワークLEを提案する。
実験結果から,LEは現行のストリーミングTTS法より優れ,文レベルのTSシステムよりも高い性能を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:03:25 GMT)
Multi-Modal Dataset Distillation in the Wild [75.6] そこで我々は,マルチモーダル・データセット蒸留法(MDW)を提案し,ノイズの多いマルチモーダル・データセットをコンパクトなクリーン・データセットに蒸留し,効果的かつ効率的なモデルトレーニングを行う。
具体的には、MDWは蒸留中の学習可能な微粒な対応を導入し、蒸留されたデータを適応的に最適化し、対応識別領域を強調する。
MDWの理論的および経験的有効性は、様々な圧縮比で従来の手法を15%以上上回る、顕著なスケーラビリティで検証されている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:18:20 GMT)
Near-Optimal Clustering in Mixture of Markov Chains [74.4] 我々は、長さ$H$の軌跡を、大きさ$S$の有限状態空間上の未知のエルゴードマルコフ鎖の1つによって生成される、$T$ trajectories of length $H$の問題を研究する。
我々は、連鎖の遷移核間の重み付きKL分散によって支配されるクラスタリングエラー率に基づいて、インスタンス依存で高い確率の低い境界を導出する。
次に,新しい2段階クラスタリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:10:40 GMT)
KDRL: Post-Training Reasoning LLMs via Unified Knowledge Distillation and Reinforcement Learning [72.5] 教師の指導(KD)と自己探索(RL)を通じて推論モデルを協調的に最適化するテキスト化後学習フレームワークである textbfKDRL を提案する。
まず、GRPOとKDを統合する統一目的を定式化し、異なるKL近似、KL係数、報酬誘導KD戦略が学習後の全体的なダイナミクスと性能にどのように影響するかを体系的に検討する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:46:41 GMT)
The Energy Loss Phenomenon in RLHF: A New Perspective on Mitigating Reward Hacking [72.5] この研究は、人間からのフィードバックからの強化学習におけるエネルギー損失現象と、そのハッキング報酬への関連を識別する。
報酬計算において最終層におけるエネルギー損失の増加をペナルティ化し,過大なエネルギー損失を防止するEnergy Los-Aware PPOアルゴリズム(EPPO)を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:30:23 GMT)
ReelWave: Multi-Agentic Movie Sound Generation through Multimodal LLM Conversation [72.2] 本稿では,自律型サウンドディレクタによって教師される音声生成のためのマルチエージェントフレームワークを提案する。
Foley ArtistはComposerとVoice Actorのエージェントと共同で働き、共同でオフスクリーンサウンドを自動生成して全体の生産を補完する。
本フレームワークは,映画から抽出した映像クリップに調和した,リッチで関連性の高い音声コンテンツを生成できる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:38:46 GMT)
Learning Video Generation for Robotic Manipulation with Collaborative Trajectory Control [72.0] 本稿では,協調的軌跡定式化を通じてオブジェクト間ダイナミクスをモデル化する新しいフレームワークであるRoboMasterを紹介する。
オブジェクトを分解する従来の方法とは異なり、我々のコアは、相互作用プロセスを3つのサブステージ(相互作用前、相互作用後、相互作用後)に分解することである。
提案手法は既存の手法よりも優れており,ロボット操作のための軌道制御ビデオ生成における最先端性能を確立している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:57:06 GMT)
RewardBench 2: Advancing Reward Model Evaluation [71.7] リワードモデルは、好みのデータからニュアンスされた信号をキャプチャするために、言語モデルの訓練後を通して使用される。
コミュニティは報酬モデルを評価するためのベストプラクティスを確立し始めている。
本稿では,新しいマルチスキル報酬モデルベンチマークであるRewardBench 2を紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:54:04 GMT)
ReAgent-V: A Reward-Driven Multi-Agent Framework for Video Understanding [71.7] ReAgent-Vは、新しいエージェントビデオ理解フレームワークである。
推論中に効率の良いフレーム選択とリアルタイムの報酬生成を統合する。
12のデータセットに対する大規模な実験は、一般化と推論において大きな成果を上げている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:23:21 GMT)
Beyond In-Context Learning: Aligning Long-form Generation of Large Language Models via Task-Inherent Attribute Guidelines [71.1] In-context Learning (ICL) は、事前訓練された大規模言語モデル(LLM)の重要かつ完全には理解されていない能力である。
タスク言語とフォーマット特性をキャプチャする2つのガイドラインの並列ストリームを効率よく生成するLongGuideを提案する。
LongGuideはガイドラインの最良の組み合わせを自動的に選択し、ゼロショット設定と少数ショット設定の両方で、強力なオープンソースLLMとクローズドソースLLMの両方を5%以上改善する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:35:24 GMT)
Unified Scaling Laws for Compressed Representations [69.7] 各種圧縮表現上でのトレーニングにおいて,統合スケーリングフレームワークがモデル性能を正確に予測できるかどうかを検討する。
我々の主な発見は、単純な「容量」計量が存在するという理論と経験の両方を実証することである。
我々は、圧縮されたフォーマットの精度を直接比較し、スパース量子化されたフォーマットのトレーニングのためのより良いアルゴリズムを導出するために、定式化を拡張した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:52:51 GMT)
Monge-Ampere Regularization for Learning Arbitrary Shapes from Point Clouds [69.7] 任意の曲面型をモデル化するための新しい暗黙曲面表現であるスケールド2乗距離関数 (S$2$DF) を提案する。
S$2$DFは、ゼロレベルセットでのUDFの非微分可能性問題に効果的に対処しながら、内部領域と外部領域を区別しない。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:19:39 GMT)
EPFL-Smart-Kitchen-30: Densely annotated cooking dataset with 3D kinematics to challenge video and language models [69.0] キッチン環境内のモーションキャプチャプラットフォームで収集したEPFL-Smart-Kitchen-30データセットについて紹介する。
9台の静止RGB-Dカメラ、慣性測定ユニット(IMU)、ヘッドマウント型HoloLens2ヘッドセットが3D手、体、眼の動きを捉えた。
このデータセットは、シンクロナイズドエキソセントリック、エゴセントリック、深さ、IMU、視線、体、手動の4種類のレシピを調理する16人の被験者の29.7時間にわたる多視点アクションデータセットである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:46:44 GMT)
STRICTA: Structured Reasoning in Critical Text Assessment for Peer Review and Beyond [68.5] 本研究では,テキストアセスメントをステップワイド推論プロセスとしてモデル化するために,Structured Reasoning In Critical Text Assessment (STRICTA)を導入する。
STRICTAは、因果性理論に基づく相互接続推論ステップのグラフに評価を分解する。
約40人のバイオメディカル専門家が20以上の論文について4000以上の推論ステップのデータセットにSTRICTAを適用した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:18:21 GMT)
Improving Factuality with Explicit Working Memory [68.4] 大規模な言語モデルは、幻覚として知られる、事実的に不正確なコンテンツを生成することができる。
EWE(Explicit Working Memory)は、外部リソースからのリアルタイムフィードバックを受信するワーキングメモリを統合することで、長文テキスト生成における事実性を高める新しい手法である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:27:09 GMT)
General search techniques without common knowledge for imperfect-information games, and application to superhuman Fog of War chess [68.2] 我々は、戦争チェスのための最初の超人的AIであるObscuroを提示する。
不完全な情報ゲームにおける検索の進歩を導入し、強力でスケーラブルな推論を可能にした。
最先端のAIと人間のプレーヤーに対する実験は、Obscuroがかなり強いことを示している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:41:27 GMT)
Growing Through Experience: Scaling Episodic Grounding in Language Models [67.3] 言語モデル(LM)は、物理的な計画タスクに長けるために、堅牢なエピソジックグラウンドを必要とする。
現在のエピソジックな基盤アプローチは、スケーラビリティと統合に苦労しています。
本稿では,より小規模から大規模にエピソジックな動作を効果的に伝達する,スケーラブルな弱から強のエピソジックな学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:52:19 GMT)
VL-RewardBench: A Challenging Benchmark for Vision-Language Generative Reward Models [66.6] 視覚言語生成報酬モデル(VL-GenRM)は、マルチモーダルAIシステムの調整と評価において重要な役割を果たす。
現在の評価方法は、主に従来のタスクからのAIアノテーション付き好みラベルに依存している。
VL-RewardBenchは、一般的なマルチモーダルクエリ、視覚幻覚検出、複雑な推論タスクにまたがる包括的なベンチマークである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:46:18 GMT)
Inverse Entropic Optimal Transport Solves Semi-supervised Learning via Data Likelihood Maximization [65.9] 条件分布は機械学習の中心的な問題です
ペアデータとペアデータの両方を統合する新しいパラダイムを提案する。
提案手法は任意の誤差で理論上真の条件分布を復元可能であることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:23:53 GMT)
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator [65.6] 大規模言語モデル(LLM)は、自然言語処理タスクの範囲で例外的な性能を示した。
特定の意味のないセパレータトークン(句読点)は意味的に意味のあるトークンと比較して注意点に不均等に寄与する。
SepLLMは,これらのセグメントを圧縮し,冗長なトークンを除去することによって推論を高速化する,プラグアンドプレイフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:46:43 GMT)
Multilingual Text-to-Image Generation Magnifies Gender Stereotypes and Prompt Engineering May Not Help You [64.7] 多言語モデルは、モノリンガルモデルと同様に、有意な性別バイアスに悩まされていることを示す。
多言語モデルにおけるジェンダーバイアスの研究を促進するための新しいベンチマークMAGBIGを提案する。
以上の結果から,モデルが強い性バイアスを示すだけでなく,言語によって異なる行動を示すことが明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:04:03 GMT)
Enhancing Speech Emotion Recognition with Graph-Based Multimodal Fusion and Prosodic Features for the Speech Emotion Recognition in Naturalistic Conditions Challenge at Interspeech 2025 [64.6] 自然条件課題におけるInterSPEECH 2025音声感情認識のための頑健なシステムを提案する。
提案手法は,最先端の音声モデルと韻律的・スペクトル的手法によって強化されたテキスト特徴を組み合わせる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:46:02 GMT)
Large Model Based Agents: State-of-the-Art, Cooperation Paradigms, Security and Privacy, and Future Trends [64.6] 近い将来、LM駆動の汎用AIエージェントが、生産タスクにおいて不可欠なツールとして機能することが予想される。
本稿では,将来のLMエージェントの自律的協調に関わるシナリオについて検討する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:11:00 GMT)
Matryoshka Model Learning for Improved Elastic Student Models [62.2] MatTAは、新しいTeacher-TA-Studentレシピを使用して、複数の正確な学生モデルをトレーニングするためのフレームワークである。
本手法はパブリックモデルであるGPT-2 Medium上で実証し,SAT Mathで24%,LAMBADAベンチマークで10%以上の相対的な改善を実現した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:31:47 GMT)
Flex3D: Feed-Forward 3D Generation with Flexible Reconstruction Model and Input View Curation [61.0] テキスト, 単一画像, スパース画像から高品質な3Dコンテンツを生成するための新しいフレームワークFlex3Dを提案する。
我々は、微調整された多視点画像拡散モデルとビデオ拡散モデルを用いて、候補視のプールを生成し、ターゲット3Dオブジェクトのリッチな表現を可能にする。
第2段階では、キュレートされたビューは、任意の数の入力を効果的に処理できるトランスフォーマーアーキテクチャ上に構築されたフレキシブルリコンストラクションモデル(FlexRM)に入力されます。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:28:40 GMT)
NTIRE 2025 the 2nd Restore Any Image Model (RAIM) in the Wild Challenge [60.4] NTIRE 2025チャレンジは、現実世界の画像復元のための新しいベンチマークを確立した。
この挑戦には300近い登録があり、51チームが600以上の結果を出した。
トップパフォーマンスの手法は、画像復元の最先端に進み、20名以上の専門家の審査員から全会一致で承認された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:43:35 GMT)
MSDA: Combining Pseudo-labeling and Self-Supervision for Unsupervised Domain Adaptation in ASR [59.8] 本稿では,自己教師付き学習と半教師付き技術を統合する,サンプル効率のよい2段階適応手法を提案する。
MSDAは、ASRモデルの堅牢性と一般化を強化するように設計されている。
本稿では,メタPLがASRタスクに効果的に適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:10:21 GMT)
Protocol Models: Scaling Decentralized Training with Communication-Efficient Model Parallelism [59.8] モデルスケーリングはディープラーニングの大幅な進歩につながったが、これらのモデルを分散環境でトレーニングすることは依然として難しい。
本研究では,前処理と後処理の両方を圧縮し,最大99%の圧縮が可能となる新しい圧縮アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:19:22 GMT)
Absorb and Converge: Provable Convergence Guarantee for Absorbing Discrete Diffusion Models [59.5] 吸収率行列を用いた離散拡散モデルに対する第1次有限時間誤差境界と収束速度解析を提供する。
我々は、吸収率行列の下での$tau$-leapingと均一化サンプリングの双方に対する最初の収束保証を確立する。
適切な仮定の下では、早期に停止することなく収束保証を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 23:14:35 GMT)
Foundations and Recent Trends in Multimodal Mobile Agents: A Survey [59.4] モバイルエージェントは、複雑で動的なモバイル環境におけるタスクの自動化に不可欠である。
近年の進歩により、リアルタイム適応性とマルチモーダルインタラクションが向上している。
これらの進歩は、プロンプトベースの方法とトレーニングベースの方法の2つの主要なアプローチに分類する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:17:34 GMT)
Instruction-Following Pruning for Large Language Models [58.3] 我々は、モデルに対する固定的なプルーニングマスクを決定する従来の静的プルーニングアプローチを超えて移動する。
本手法では,プルーニングマスクは入力依存型であり,ユーザ命令に記述された情報に基づいて動的に適応する。
我々の手法は「命令追従プルーニング」と呼ばれ、ユーザ命令を入力とし、与えられたタスクに対して最も関連性の高いモデルパラメータを動的に選択するスパースマスク予測器を導入している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:33:43 GMT)
The Male CEO and the Female Assistant: Evaluation and Mitigation of Gender Biases in Text-To-Image Generation of Dual Subjects [58.3] 本稿では,Paired Stereotype Test (PST) フレームワークを提案する。
PSTクエリT2Iモデルは、男性ステレオタイプと女性ステレオタイプに割り当てられた2つの個人を描写する。
PSTを用いて、ジェンダーバイアスの2つの側面、つまり、ジェンダーの職業におけるよく知られたバイアスと、組織力におけるバイアスという新しい側面を評価する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:57:09 GMT)
MIRAGE: Assessing Hallucination in Multimodal Reasoning Chains of MLLM [58.2] マルチモーダル幻覚は多源性であり、様々な原因から生じる。
既存のベンチマークでは、知覚誘発幻覚と推論誘発幻覚を適切に区別することができない。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:16:04 GMT)
Improving Medical Large Vision-Language Models with Abnormal-Aware Feedback [58.0] 医学的異常を明らかにするための新しいUMed-LVLMを提案する。
本稿では,GPT-4Vを用いた診断手法を提案する。
UMed-LVLMは既存のMed-LVLMよりも医療異常の同定と理解に優れていた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:56:36 GMT)
SVQA-R1: Reinforcing Spatial Reasoning in MLLMs via View-Consistent Reward Optimization [57.5] 本稿では,R1スタイルのトレーニングを空間VQAに拡張する最初のフレームワークであるSVQA-R1を提案する。
特に,オブジェクト間の空間的関係を摂動させることで,視点に一貫性のある報酬を構成する新しいグループワイドRL戦略であるSpatial-GRPOを紹介する。
我々のモデルSVQA-R1は空間的VQAベンチマークの精度を劇的に向上させるだけでなく、教師付き微調整データを使用しなくても解釈可能な推論経路を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:58:43 GMT)
HOSIG: Full-Body Human-Object-Scene Interaction Generation with Hierarchical Scene Perception [57.4] HO SIGは階層的なシーン認識を通じて全体インタラクションを合成するための新しいフレームワークである。
我々のフレームワークは、自己回帰生成による運動長の無制限化をサポートし、手動による介入を最小限に抑える。
この研究は、シーン認識ナビゲーションとデクスタラスオブジェクト操作の間に重要なギャップを埋める。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:08:08 GMT)
Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search [57.3] 大規模言語モデル(LLM)は、様々な領域にまたがる顕著な推論能力を示している。
近年の研究では、テスト時間計算の増加はLLMの推論能力を高めることが示されている。
そこで我々は,1)COAT推論形式を内部化するための小規模な形式調整段階,2)強化学習を活用した大規模自己改善段階を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:42:17 GMT)
Reinforcement Learning Tuning for VideoLLMs: Reward Design and Data Efficiency [56.5] 本稿では、離散的かつ連続的な報酬信号を通して意味的推論と時間的推論の両方を監督する二重回帰定式化を提案する。
我々は,ビデオQA,テンポラルビデオグラウンディング,グラウンドドビデオQAを含む8つの代表的なビデオ理解タスクに対するアプローチを評価した。
その結果、MLLMを用いた推論中心のビデオ理解の進展において、報酬設計とデータ選択の重要性が浮き彫りになった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:28:26 GMT)
Collapse of Dense Retrievers: Short, Early, and Literal Biases Outranking Factual Evidence [56.1] 検索モデルは、Retrieval-Augmented Generation (RAG)のような情報検索(IR)アプリケーションで一般的に使用される。
我々は、Dragon+やContrieverのようなリトリーバーに対する、短いドキュメントの好みなどのバイアスの影響を定量化する。
私たちは大きな脆弱性を発見し、リトリバーが短いドキュメント、早い位置、繰り返しのエンティティ、リテラルマッチを好んで、答えの存在を無視しながら表示します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:19:43 GMT)
A Hitchhiker's Guide to Scaling Law Estimation [56.1] スケーリング法則は、より少ないパラメータやより少ないトレーニングセットで訓練が容易なモデルから外挿することで、ターゲットとなる機械学習モデルの損失を予測する。
我々は1000以上のスケーリング法則を推定し、新しいモデルファミリーにおけるスケーリング法則を推定するためのベストプラクティスを導出する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:33:41 GMT)
Certified Robustness to Clean-Label Poisoning Using Diffusion Denoising [56.0] 我々は、$ell$-normの条件で、クリーンラベル毒殺攻撃に対する認証された防御を提示する。
$randomized$$smoothingによって達成された対向的堅牢性に触発されて、オフザシェルフ拡散復調モデルが、改ざんしたトレーニングデータの衛生化をいかに行うかを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:19:25 GMT)
Are Transformers Able to Reason by Connecting Separated Knowledge in Training Data? [55.9] 人間は、様々な情報源からの知識を統合することで、顕著な構成的推論を示す。
本稿では,このスキルを再現する上でのトランスフォーマーの可能性を検証するための合成学習タスクを提案する。
数発のChain-of-Thoughtプロンプトにより、TransformersはFTCT上でコンストラクショナル推論を行うことができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:17:04 GMT)
BehaviorBox: Automated Discovery of Fine-Grained Performance Differences Between Language Models [55.2] 本稿では,性能を考慮した文脈埋め込みを用いた言語モデルの自動比較手法を提案する。
提案手法は,2つのLM間の生成容易性について,その相違点を示すコヒーレントな特徴を抽出する。
本研究では,サイズ,モデルファミリ,ポストトレーニングの異なるモデルを比較し,コーパスレベルの難易度だけでは見つからないパフォーマンスの有意義な違いを示す,特定のコンテキストに対する洞察を列挙する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:44:06 GMT)
UMA: Ultra-detailed Human Avatars via Multi-level Surface Alignment [55.1] 多視点ビデオから鮮明なダイナミック性とフォトリアリスティックな外観を持つアニマタブルな人間のアバターモデルを学ぶことは、コンピュータグラフィックスとビジョンにおいて重要な基礎研究課題である。
本稿では,基本的な2次元ビデオポイントトラッカーからのガイダンスを用いて,潜時変形モデルを提案し,アニマタブルキャラクタの3次元変形を監督する。
提案手法は,先行技術に比べてレンダリング品質と幾何学的精度が大幅に向上したことを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:42:33 GMT)
ORMind: A Cognitive-Inspired End-to-End Reasoning Framework for Operations Research [53.7] ORMindは認知にインスパイアされたフレームワークで、反ファクト推論を通じて最適化を強化する。
提案手法は,要求を数学的モデルや実行可能なコードに変換するエンド・ツー・エンドのワークフローを実装し,人間の認識をエミュレートする。
現在はLenovoのAIアシスタントで内部でテストされており、ビジネスとコンシューマの両方の最適化機能を強化する予定である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:11:21 GMT)
Revisiting LRP: Positional Attribution as the Missing Ingredient for Transformer Explainability [53.2] 階層的関連性伝播は、ディープラーニングにおける説明可能性に対する最も有望なアプローチの1つである。
そこで我々は,様々な位置符号化手法にまたがる属性の伝播を目的とした,理論的なLRP規則を提案する。
本手法は,視力とNLP説明可能性の両面において,最先端の課題を著しく上回っている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:07:55 GMT)
ESGenius: Benchmarking LLMs on Environmental, Social, and Governance (ESG) and Sustainability Knowledge [53.2] ESGeniusは、環境・社会・ガバナンス(ESG)における大規模言語モデル(LLM)の熟練度の評価と向上のためのベンチマークである。
ESGeniusはESGenius-QAとESGenius-Corpusの2つの重要なコンポーネントから構成される。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:19:09 GMT)
$IF-GUIDE$: Influence Function-Guided Detoxification of LLMs [53.1] 本研究では,大規模言語モデルにおける有害な行動の出現に,トレーニングデータがどのように寄与するかを検討する。
我々は,任意のトレーニングデータ内の有害トークンを識別するために,影響関数を利用する$proactive approach$-$IF-Guide$-$を提案する。
IF-Guideは,無検閲モデルと比較して,暗黙的および暗黙的な毒性$-$byを10$times$に大幅に低減することを示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:32:36 GMT)
A Complexity-Based Theory of Compositionality [53.0] AIでは、構成表現は配布外一般化の強力な形式を可能にすることができる。
ここでは、構成性に関する直観を考慮し、拡張する、表現的構成性と呼ばれる定義を提案する。
私たちは、AIと認知科学の両方において、文学全体から異なる直観を統一する方法を示します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:11:54 GMT)
Knowledge or Reasoning? A Close Look at How LLMs Think Across Domains [52.9] この研究は、最終回答の精度を超えて、医学と数学の領域におけるステップバイステップの推論を研究する。
使用した知識の正しさと推論の質を判断する,きめ細かい評価フレームワークを導入する。
この枠組みを用いて,医学・数学領域における教師付き微調整(SFT)および/または強化学習(RL)で訓練されたR1蒸留およびベースQwenモデルについて検討した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:01:00 GMT)
MaxSup: Overcoming Representation Collapse in Label Smoothing [52.7] ラベル平滑化(LS)は、ニューラルネットワーク予測における過信を減らすために広く採用されている。
LSコンパクトは、過剰に厳密なクラスタに表現を特徴付け、クラス内の多様性を希薄にする。
正しい予測と誤予測の両方に一様正則化を適用するMax Suppression(MaxSup)を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:13:24 GMT)
Latent Structured Hopfield Network for Semantic Association and Retrieval [52.6] エピソード記憶は、オブジェクト、場所、時間などの意味的要素をコヒーレントなイベント表現に関連付けることによって、過去の経験を思い出すことができる。
本稿では,連続ホップフィールドアトラクタダイナミクスを自動エンコーダアーキテクチャに統合するフレームワークであるLatent Structured Hopfield Network (LSHN)を提案する。
我々の研究は、生物学的に基底化されたアトラクタ機構を通じて、セマンティック要素をエピソードメモリトレースに動的にバインドする方法の計算的視点を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:24:36 GMT)
Feel the Force: Contact-Driven Learning from Humans [52.4] 操作中のきめ細かい力の制御は、ロボット工学における中核的な課題である。
We present FeelTheForce, a robot learning system that model human tactile behavior to learn force-sensitive control。
提案手法は,5つの力覚的操作タスクで77%の成功率を達成した,スケーラブルな人間の監督において,堅牢な低レベル力制御を実現する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:57:52 GMT)
ReFoCUS: Reinforcement-guided Frame Optimization for Contextual Understanding [52.1] ReFoCUS(Reinforcement-guided Frame Optimization for Contextual UnderStanding)は、新しいフレームレベルのポリシー最適化フレームワークである。
ReFoCUSは、参照LMMから派生した報酬信号を用いて、フレームに対するモデル固有の嗜好を反映して、強化学習を通じてフレーム選択ポリシーを学習する。
提案手法は複数のビデオQAベンチマークにおける推論性能を継続的に改善する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:08:07 GMT)
AdvPrompter: Fast Adaptive Adversarial Prompting for LLMs [51.2] 大規模言語モデル(LLM)は、不適切または有害なコンテンツの生成につながるジェイルブレイク攻撃に対して脆弱である。
本稿では,AdvPrompter という別の LLM を用いて,人間可読な逆数プロンプトを数秒で生成する手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:59:01 GMT)
Enhancing Transformers for Generalizable First-Order Logical Entailment [51.0] 本稿では,変圧器の1次論理的推論能力をパラメータ化知識を用いて一般化する。
本稿では,一階述語論理エンターメントの性能を大幅に向上させる論理認識アーキテクチャTEGAを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:36:26 GMT)
Image Generation from Contextually-Contradictory Prompts [51.0] 本稿では,プロキシプロンプトのシーケンスを用いて認知過程をガイドする段階認識プロンプト分解フレームワークを提案する。
本手法は,文脈矛盾の存在下でのきめ細かな意味制御と正確な画像生成を可能にする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:48:12 GMT)
Are Pixel-Wise Metrics Reliable for Sparse-View Computed Tomography Reconstruction? [50.7] 解剖学的構造全体にわたる構造的完全性を評価するために,解剖学的評価尺度の組を提案する。
CAREは、重要な構造物の解剖学的保存を促進するために、訓練中に構造的罰則を取り入れている。
CAREはCT再建における構造的完全性を大幅に改善し、大臓器では+32%、小臓器では+22%、小腸では+40%、血管では+36%となる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:07:10 GMT)
NoiseAR: AutoRegressing Initial Noise Prior for Diffusion Models [50.5] NoiseARは拡散モデルに先立つ自己回帰初期雑音の新しい手法である。
空間パッチやトークン上での自己回帰的確率的モデリングタスクとして,初期雑音先行パラメータの生成を定式化する。
実験により,ノイズレーダが初期雑音を発生させることで,サンプル品質が向上し,条件付き入力との整合性が向上することを示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:32:35 GMT)
SafeSwitch: Steering Unsafe LLM Behavior via Internal Activation Signals [50.5] 大規模言語モデル(LLM)は、様々なタスクにまたがる例外的な能力を示すが、有害なコンテンツを生成することでリスクを引き起こす。
LLMは、内部状態の安全性に関する内部評価を同様に行うことができることを示す。
本稿では,プロバーをベースとした内部状態モニタを用いて,安全でない出力を規制するSafeSwitchを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:19:01 GMT)
Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems [50.3] LLMマルチエージェントシステムにおける障害帰属は、まだ調査が過小評価されており、労働集約的である。
本稿では,3つの自動故障帰属手法の開発と評価を行い,その欠点と欠点を要約する。
最良の方法は、障害に応答するエージェントを特定する際に53.5%の精度を達成するが、故障の特定には14.2%しか役に立たない。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:25:55 GMT)
Medical World Model: Generative Simulation of Tumor Evolution for Treatment Planning [50.2] 臨床診断に基づいて将来の疾患状態を視覚的に予測する医用世界モデル(MeWM)を紹介する。
MeWMは、(i)政策モデルとして機能する視覚言語モデルと、(ii)ダイナミックスモデルとして腫瘍生成モデルから構成される。
シミュレーション後腫瘍に対する生存解析を適用した逆ダイナミクスモデルを提案し,治療効果の評価と最適な臨床行動計画の選択を可能にした。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 23:50:40 GMT)
Data Poisoning for In-context Learning [49.8] In-context Learning (ICL)は、新しいタスクに適応する革新的な能力として認識されている。
本論文は、ICLのデータ中毒に対する感受性の重大な問題について述べる。
ICLの学習メカニズムを活用するために考案された特殊攻撃フレームワークであるICLPoisonを紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:16:50 GMT)
LoGU: Long-form Generation with Uncertainty Expressions [49.8] 不確実性を伴う長文生成(LoGU)の課題について紹介する。
不確実性抑制と不確実性誤認の2つの主要な課題を特定します。
当社のフレームワークでは,原子的クレームに基づく不確実性を改善するため,分割・分散戦略を採用している。
提案手法が精度を向上し,幻覚を低減し,応答の包括性を維持できることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:52:50 GMT)
ImpRAG: Retrieval-Augmented Generation with Implicit Queries [49.5] ImpRAGは、検索と生成を統一モデルに統合するクエリフリーなRAGシステムである。
我々は、ImpRAGが、多様な形式を持つ未確認タスクの正確なマッチスコアを3.6-11.5改善したことを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:38:21 GMT)
WorldExplorer: Towards Generating Fully Navigable 3D Scenes [49.2] WorldExplorerは、幅広い視点で一貫した視覚的品質で、完全にナビゲート可能な3Dシーンを構築する。
私たちは、シーンを深く探求する、短く定義された軌道に沿って、複数のビデオを生成します。
我々の新しいシーン記憶は、各ビデオが最も関連性の高い先行ビューで条件付けされている一方、衝突検出機構は劣化を防止している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:41:31 GMT)
Self-Refining Language Model Anonymizers via Adversarial Distillation [49.2] 大きな言語モデル(LLM)は、個人情報を推測する能力がプライバシーのリスクを生じさせるセンシティブなドメインで、ますます使われています。
本稿では,SLM(Small Language Model)を訓練し,効率的な匿名化を実現するための新しい蒸留フレームワークであるSEAL(Self-refining Anonymization with Language Model)を紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:21:27 GMT)
Erwin: A Tree-based Hierarchical Transformer for Large-scale Physical Systems [49.0] 計算多体物理学の手法にインスパイアされた階層型トランスフォーマーであるErwinを紹介する。
宇宙論、分子動力学、PDE解法、粒子流体力学など、複数の領域にわたるエルウィンの有効性を実証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:57:48 GMT)
Measuring Data Diversity for Instruction Tuning: A Systematic Analysis and A Reliable Metric [48.8] サンプルレベルの「ノーベルティ」に基づく新しい多様性指標であるNovellSumを提案する。
シミュレーションデータと実世界のデータの両方の実験により、NovellSumは正確に多様性の変動を捉え、命令調整されたモデルの性能と0.97の相関を達成している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:41:05 GMT)
Data Pruning by Information Maximization [48.8] コアセット選択(coreset selection)とも呼ばれる新しいデータプルーニング手法であるInfoMaxを提案する。
これによってInfoMaxは、コアセットの全体的な情報性を高める。
実験では、さまざまなデータプルーニングタスクにおいてInfoMaxの優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:06:42 GMT)
RoboEgo System Card: An Omnimodal Model with Native Full Duplexity [48.5] RoboEgo (別名:FLM-Ego)は、両方の課題に対処するために設計された統一モデルシステムである。
FLM-Egoにはバックボーンとアルゴリズムが組み込まれており、80ミリ秒のレイテンシの理論的二重化を実現している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:53:10 GMT)
MoDA: Modulation Adapter for Fine-Grained Visual Grounding in Instructional MLLMs [48.5] MoDAは、命令誘導変調により、事前整列された視覚的特徴を洗練するために設計された軽量モジュールである。
実験の結果,MoDAは視覚的接地を改善し,文脈的に適切な応答を生成することがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:38:50 GMT)
Abstractive Visual Understanding of Multi-modal Structured Knowledge: A New Perspective for MLLM Evaluation [48.5] MLLM(Multi-modal large language model)は、多種多様なシナリオやオブジェクトの包括的理解を可能にする。
MLLMの評価ベンチマークやリーダーボードの普及にもかかわらず、彼らはMLLMが視覚的に現れる構造化された抽象化で世界的知識を理解する上で重要な能力を見落としている。
構造化理解のためのマルチモーダルマップを基盤とした,革新的なベンチマークであるM3STRを提案する。
その結果,抽象的視覚情報を構造化知識で処理し,MLLMの総合的推論能力を向上させるための重要な軌道を図った。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:00:35 GMT)
Generalizing from SIMPLE to HARD Visual Reasoning: Can We Mitigate Modality Imbalance in VLMs? [48.4] 視覚言語モデル(VLM)は視覚的質問応答とイメージキャプションに優れる。
しかし、多段階の視覚的推論では性能が劣り、モダリティの不均衡や脆さの認識がもたらされる。
本稿では,VLMがアルゴリズムによる視覚的推論を行う能力を評価するための合成フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:48:29 GMT)
RAISE: Reasoning Agent for Interactive SQL Exploration [47.8] 本稿では,スキーマリンク,クエリ生成,反復的改善を1つのエンドツーエンドコンポーネントに統一する新しいフレームワークを提案する。
本手法は、不慣れなデータベースを扱う際に、人間がどう答えるかをエミュレートする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:07:08 GMT)
MoviePuzzle: Visual Narrative Reasoning through Multimodal Order Learning [47.6] MoviePuzzleは、ビジュアルな物語の推論と全体論的映画理解をターゲットとする、新しい挑戦である。
本研究では,映像モデルの時間的特徴学習と構造学習を増幅するMoviePuzzleタスクを提案する。
提案手法はMoviePuzzleベンチマークの既存の最先端手法よりも優れている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:20:31 GMT)
MedHELM: Holistic Evaluation of Large Language Models for Medical Tasks [47.5] 大規模言語モデル(LLM)は、医学試験においてほぼ完璧なスコアを得る。
これらの評価は、実際の臨床実践の複雑さと多様性を不十分に反映している。
MedHELMは,医療業務におけるLCMの性能を評価するための評価フレームワークである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:19:10 GMT)
Towards the Effect of Examples on In-Context Learning: A Theoretical Case Study [47.4] In-context Learning (ICL)は、大規模言語モデル(LLM)がダウンストリームタスクに適応するための強力な機能として、いくつかの例(デモ)を活用することで登場した。
本稿では,2進分類タスクの理論的研究を行い,ICLが事前学習中にLLMが学習した知識と実例をどのように統合するかをよりよく理解する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:02:33 GMT)
GLoSS: Generative Language Models with Semantic Search for Sequential Recommendation [46.9] セマンティック検索(GLoSS)を用いた生成低ランク言語モデルを提案する。
GLoSSはセマンティック検索を使用して、語彙マッチングを超えて関連するアイテムを検索する。
我々は、GLoSSを3つの実世界のAmazonレビューデータセット、美容、トイ、スポーツで評価し、最先端のパフォーマンスを達成することを発見した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:31:42 GMT)
Unique Hard Attention: A Tale of Two Sides [46.8] 左端と右端に注意を向けた有限精度変換器は線形時間論理(LTL)と同値であることが示されている
左端に注意を払っているモデルは、Emphsoftの注意と等価であることを示し、実世界のトランスフォーマーを右アテンションモデルより近似した方がよいことを示唆している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:30:46 GMT)
Thinking in Character: Advancing Role-Playing Agents with Role-Aware Reasoning [46.5] 本稿では,RAR(Role Identity Activation)とRSO(Reasoning Style Optimization)の2つの重要な段階からなる新しいRole-Aware Reasoning(RAR)手法を提案する。
RIAは、アテンションディバージョンに対抗するために推論中にキャラクタープロファイルでモデルを明示的にガイドし、RSOは、LEM蒸留によるキャラクターとシーンの推論スタイルを調整し、スタイルのドリフトを緩和する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:55:04 GMT)
MAPLE: A Mobile Agent with Persistent Finite State Machines for Structured Task Reasoning [46.2] アプリケーションインタラクションをFSM(Finite State Machine)として抽象化する,状態認識型マルチエージェントフレームワークMAPLEを提案する。
それぞれのUI画面を離散状態として、ユーザアクションをトランジションとしてモデル化し、FSMがアプリケーション実行の構造化された表現を提供できるようにします。
MAPLEは、計画、実行、検証、エラー回復、知識保持という4段階のタスク実行に責任を持つ特殊エージェントで構成されている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:32:13 GMT)
Meta-Learning Approaches for Speaker-Dependent Voice Fatigue Models [45.8] 我々は,この課題をメタ学習問題として再考し,複雑さを増大させる3つのアプローチを探る。
事前学習した音声埋め込みを用いて、シフトワーカーの大規模な縦長データセット上でこれらの手法を評価する。
その結果,全てのメタラーニング手法が横断的および従来型の混合効果モデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:11:58 GMT)
Data-Efficient Operator Learning via Unsupervised Pretraining and In-Context Learning [45.8] 本研究では,PDE演算子学習のための教師なし事前学習を設計する。
シミュレーションソリューションを使わずにラベルなしのPDEデータをマイニングし、物理に着想を得た再構成ベースのプロキシタスクでニューラルネットワークを事前訓練する。
提案手法は,データ効率が高く,より一般化可能であり,従来の視覚予測モデルよりも優れる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:01:45 GMT)
Depth-Constrained ASV Navigation with Deep RL and Limited Sensing [45.8] 本研究では,深度制約下でのASVナビゲーションのための強化学習フレームワークを提案する。
環境意識を高めるため,GPレグレッションをRLフレームワークに統合する。
我々は,実世界の水環境に対して,訓練された政策が適切に一般化されることを保証する効果的なシミュレート・トゥ・リアル・トランスファーを実証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:35:37 GMT)
Toward Scientific Reasoning in LLMs: Training from Expert Discussions via Reinforcement Learning [45.6] ゲノム工学に関する10年以上にわたる科学フォーラムの議論から構築された新しいベンチマークであるGenome-Benchを紹介する。
我々のパイプラインは生の対話を、3000以上の高品質な質問応答対をサポートする強化学習フレンドリーな多重選択質問形式に変換する。
その結果,ジェノム・ベンチのベースモデルと比較して,科学的議論による強化学習によりモデル性能が15%以上向上することが示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:31:08 GMT)
OpenUni: A Simple Baseline for Unified Multimodal Understanding and Generation [44.3] マルチモーダルな理解と生成を統一するための軽量でオープンソースなベースラインであるOpenUniを紹介します。
統一モデル学習における一般的なプラクティスに触発されて、トレーニングの複雑さとオーバーヘッドを最小限にする効率的なトレーニング戦略を採用しました。
我々は,1) 高品質で命令整合性のある画像を生成すること,2) GenEval, DPG-Bench, WISE などの標準ベンチマークにおいて,1.1B と 3.1B のみ活性化パラメータで例外的な性能を達成できることを実証した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:04:26 GMT)
On-device Streaming Discrete Speech Units [44.3] 離散音声単位(DSU)は、自己教師型音声モデル(S3M)の特徴をクラスタリングすることに由来する。
その結果,6.5%の文字誤り率(CER)を相対的に増加させるだけで,浮動小数点演算(FLOP)を50%削減できることがわかった。
これらの知見は,資源制約環境下でのリアルタイム音声処理におけるDSUの可能性を明らかにするものである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:30:38 GMT)
React to Surprises: Stable-by-Design Neural Feedback Control and the Youla-REN [44.0] 学習に基づく制御のための非線形ポリシーの安定化のパラメータ化について検討する。
本稿では,ユラ・クッセラパラメータ化の非線形バージョンとロバストニューラルネットワークを組み合わせた構造を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:36:24 GMT)
To Each Metric Its Decoding: Post-Hoc Optimal Decision Rules of Probabilistic Hierarchical Classifiers [44.0] 本稿では,目標距離に対する出力確率分布の最適復号化のためのフレームワークを提案する。
より複雑な予測設定のために最適な決定ルールを導出し、候補がノードの集合に限られている場合に普遍的なアルゴリズムを提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:29:40 GMT)
What Has Been Lost with Synthetic Evaluation? [43.8] 大規模言語モデル(LLM)は、データ生成にますます使われている。
オーバーテキストベンチマークを生成することにより, LLM が要求を満たすことができるかどうかを検討する。
我々は、LLMが人間によって認可されたものよりも難易度が低いことを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:12:19 GMT)
The Surprising Effectiveness of Negative Reinforcement in LLM Reasoning [43.3] 検証可能な報酬を伴う強化学習(RLVR)は、言語モデル(LM)のトレーニングに有望なアプローチである
我々は学習信号を正しい応答の強化と正負の正負の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の
我々は、NSRが不正確な世代を抑え、確率質量を他の可算候補に向けて再分配することで、モデルの以前の信念に導かれることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:10:54 GMT)
Bone Soups: A Seek-and-Soup Model Merging Approach for Controllable Multi-Objective Generation [42.7] Bone Soupは、最初に一連のバックボーンモデルを探し、その後スープを作る新しいモデルマージアプローチである(つまり、バックボーンモデルを統合する)。
骨スープは, 制御可能な多目的生成において, 強い制御性とパレート最適性を示すことを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:51:19 GMT)
A-MEM: Agentic Memory for LLM Agents [42.5] 大規模言語モデル(LLM)エージェントは、歴史的経験を活用するためにメモリシステムを必要とする。
現在のメモリシステムは基本的なストレージと検索を可能にするが、洗練されたメモリ構造は欠如している。
本稿では, LLMエージェントに対して, エージェント方式で動的に記憶を整理できる新しいエージェントメモリシステムを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:21:21 GMT)
Fire360: A Benchmark for Robust Perception and Episodic Memory in Degraded 360-Degree Firefighting Videos [42.3] Fire360は、安全クリティカルな消火シナリオにおける認識と推論を評価するためのベンチマークである。
データセットには、さまざまな条件下でのプロのトレーニングセッションからの228の360度ビデオが含まれている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:45:56 GMT)
Towards Human-like Preference Profiling in Sequential Recommendation [42.1] RecPOは、シーケンシャルなレコメンデーションのための優先順位最適化フレームワークである。
これは、推定された嗜好階層と時間信号に基づいて適応的な報酬マージンを利用する。
タイムリーな満足感、コヒーレントな嗜好の維持、変化する状況下での識別の行使など、人間の意思決定の重要な特徴を反映している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:09:29 GMT)
KnowShiftQA: How Robust are RAG Systems when Textbook Knowledge Shifts in K-12 Education? [41.5] K-12 教育領域における質問応答ツールとして,RAG (Retrieval-Augmented Generation) システムの可能性が示唆された。
これらの教科書とLLM(Large Language Models)に固有のパラメトリック知識の相違は、RAGシステムの有効性を損なう可能性がある。
KnowShiftQAはこれらの相違をシミュレートし、仮説的知識の更新を意図的に回答とソース文書の両方に適用する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:22:49 GMT)
Tadashi: Enabling AI-Based Automated Code Generation With Guaranteed Correctness [41.5] 我々は、機械学習ベースのコード生成に不可欠なデータセットのキュレーションを研究者が支援するエンドツーエンドシステムであるTadashiを紹介した。
多面的スケジュールの候補変換を信頼性と実用性の両方で適用し、検証し、評価できるエンドツーエンドシステムを提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:26:08 GMT)
FDSG: Forecasting Dynamic Scene Graphs [41.2] 本稿では,将来的なエンティティラベル,バウンディングボックス,および未観測フレームの関係を予測する新しいフレームワークを提案する。
時間アグリゲーションモジュールは、予測情報と観測情報とをクロスアテンションを介して統合することにより、予測をさらに洗練する。
Action Genomeの実験は、FDSGが動的シーングラフ生成、シーングラフ予測、シーングラフ予測において最先端の手法より優れていることを示している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:46:22 GMT)
UniversalCEFR: Enabling Open Multilingual Research on Language Proficiency Assessment [41.0] 我々は13言語でCEFRスケールに従って注釈付きテキストの大規模多言語多次元データセットであるUniversalCEFRを紹介する。
自動可読性と言語習熟度の評価の両方においてオープンな研究を可能にするために、UniversalCEFRは505,807個のCEFRラベル付きテキストからなる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:21:16 GMT)
GETReason: Enhancing Image Context Extraction through Hierarchical Multi-Agent Reasoning [41.0] GETReasonは、表面レベルの画像記述を超えて、より深い文脈意味を推測するフレームワークである。
また、推論に基づく画像理解を評価するための新しい指標であるGREATを紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:33:47 GMT)
Multimodal Banking Dataset: Understanding Client Needs through Event Sequences [40.2] 我々は,大手銀行の200万人以上の企業顧客に関する情報を含む,初めて産業規模で一般公開されたマルチモーダルバンキングデータセットMBDを提示する。
クライアントは、銀行取引9億5000万、ジオロケーションイベント1B、技術サポートを伴う対話の5M埋め込み、4つの銀行製品の月次集計購入など、いくつかのデータソースで表現されている。
本稿では,将来の購入予測やモダリティマッチングなど,いくつかの重要な実践課題を提案する新しいマルチモーダルベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:03:06 GMT)
FlexiSAGA: A Flexible Systolic Array GEMM Accelerator for Sparse and Dense Processing [40.2] 一般行列乗算(GEMM)の疎密処理のためのAIハードウェアアクセラレータFlexiSAGAを提案する。
本稿では,高密度かつスパースな畳み込みと完全連結演算子のほぼ最適処理を可能にする,FlexiSAGAアーキテクチャに特化されたDNNプルーニング手法を提案する。
我々の結果は、DNNのスパースオーバーダンス推論のスピードアップが1.41から4.28までで、商用および文学報告されたアクセラレータプラットフォームよりも優れていたことを示している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:45:37 GMT)
MLA-Trust: Benchmarking Trustworthiness of Multimodal LLM Agents in GUI Environments [40.2] MLA-Trustは,完全性,コントロール可能性,安全性,プライバシという4つの側面にまたがって,MLAの信頼性を評価する,初めての総合的かつ統一的なフレームワークである。
ウェブサイトやモバイルアプリケーションをリアルなテストベッドとして利用し、34のハイリスクな対話タスクを設計し、リッチな評価データセットをキュレートします。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:56:27 GMT)
(Im)possibility of Automated Hallucination Detection in Large Language Models [40.1] 大規模言語モデル(LLM)が生成する幻覚を自動的に検出する可能性を分析するための理論的枠組みを提案する。
未知のターゲット言語から抽出された例に基づいて訓練されたアルゴリズムが、LLMの出力が正しいか、幻覚を構成するかを確実に判断できるかどうかを検討する。
我々は、専門家ラベル付きフィードバックの使用、すなわち、正の例(誤記)と負の例(誤記)の両方で検出器を訓練することで、この結論を劇的に変えることを示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:53:18 GMT)
Hume: Introducing System-2 Thinking in Visual-Language-Action Model [40.1] Humeは、価値誘導されたSystem-2思考とカスケードされたアクション記述を備えたデュアルシステムビジョン・ランゲージ・アクションモデルである。
システム1(System 1)は、システム2の選択されたアクションを採り、巧妙なロボット制御のためにカスケードされたアクションを演ずる軽量な反応性ビズモータポリシーである。
我々は,Humが既存のVision-Language-Actionモデルよりも,複数のシミュレーションベンチマークと実ロボットのデプロイで優れていることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:02:39 GMT)
Playing with Transformer at 30+ FPS via Next-Frame Diffusion [40.0] Next-Frame Diffusion (NFD) は、ブロックワイズ因果的注意を組み込んだ自己回帰拡散変換器である。
視覚的品質とサンプリング効率の両面でNFDが自己回帰ベースラインを上回っていることを示す。
310Mモデルを用いて,A100 GPU上で30フレーム/秒(FPS)以上の自己回帰ビデオ生成を実現する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:16:01 GMT)
StochasTok: Improving Fine-Grained Subword Understanding in LLMs [39.9] サブワードレベルの理解は、多桁数字の理解、綴りミス、略語、韻律、言葉遊びなど、多くのタスクに不可欠である。
現在の大きな言語モデル(LLM)は、一見単純なサブワードレベルのタスクに苦しむことが多い。
我々はStochasTokを紹介した。StochasTokは、トレーニング中にトークンをランダムに分割し、LCMが"内部構造を見る"ことを可能にする、シンプルで効率的なトークン化スキームである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:51:11 GMT)
Contrastive Alignment with Semantic Gap-Aware Corrections in Text-Video Retrieval [39.7] Gap-Aware Retrievalフレームワークは、テキストt_iとビデオv_jの間で学習可能な、ペア固有のインクリメントDelta_ijを導入している。
GAREは、アライメントの正確さと頑健さをノイズ管理に継続的に改善する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:17:05 GMT)
Semantic Integrity Constraints: Declarative Guardrails for AI-Augmented Data Processing Systems [39.2] セマンティッククエリにおけるLLM出力に対する正当性条件を指定・強制するためのセマンティック整合性制約(SIC)を導入する。
SICは、従来のデータベース整合性制約をセマンティックセッティングに一般化し、グラウンド、サウンドネス、排他といった一般的なタイプの制約をサポートする。
本稿では,SICをクエリ計画と実行環境に統合するシステム設計について述べる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:31:38 GMT)
EdiText: Controllable Coarse-to-Fine Text Editing with Diffusion Language Models [39.2] EdiTextは、制御可能なテキスト編集方法であり、様々なスケールで参照テキストを所望の属性に修正する。
テキスト編集の程度を広範囲に調整できるSDEditベースの編集技術を統合する。
本稿では,参照テキストの微妙な制御を可能にする自己条件付けに基づく,新たな微細な編集手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:12:36 GMT)
G4Seg: Generation for Inexact Segmentation Refinement with Diffusion Models [38.4] 本稿では, 大規模テキスト・画像モデルを用いて不正確な拡散(IS)課題に取り組むことの問題点について考察する。
我々は,原画像とマスク条件生成画像とのパターンの相違を利用して,粗大なセグメント化改善を容易にする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:05:28 GMT)
EXP-Bench: Can AI Conduct AI Research Experiments? [38.3] 我々は、AIエージェントを完全な研究実験で評価するための新しいベンチマークであるEXP-Benchを紹介する。
EXP-Benchは、研究の疑問と不完全なスターターコードから、AIエージェントに対して仮説を定式化し、実験手順を設計し、実装し、それらを実行し、結果を分析するよう挑戦する。
このパイプラインでEXP-Benchは、51の上位AI研究論文から461のAI研究タスクをキュレートした。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:59:50 GMT)
CiteEval: Principle-Driven Citation Evaluation for Source Attribution [38.2] CiteEvalは、きめ細かい引用評価に焦点を当てた、引用評価フレームワークである。
CiteBenchは、引用品質に関する高品質なヒューマンアノテーションを備えたベンチマークである。
CiteEval-Autoは、人間の判断と強い相関を示すモデルベースのメトリクスのスイートである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:15:34 GMT)
Sharpness-Aware Data Poisoning Attack [38.0] 最近の研究は、データ中毒攻撃に対するディープニューラルネットワーク(DNN)の脆弱性を強調している。
我々は「SAPA(シャープネス・アウェア・データ・ポジショニング・アタック)」と呼ばれる新たな攻撃方法を提案する。
特に、DNNの損失ランドスケープシャープネスの概念を活用して、最悪の再訓練モデルに対する中毒効果を最適化する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:11:38 GMT)
SmolVLA: A Vision-Language-Action Model for Affordable and Efficient Robotics [37.8] 視覚言語モデル(VLM)は、豊富な視覚的および言語的知識を符号化した大規模マルチモーダルデータセットで事前訓練された。
SmolVLAは、トレーニングと推論の両方のコストを大幅に削減する、小さく、効率的で、コミュニティ主導のVLAである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:30:19 GMT)
Modeling All-Atom Glycan Structures via Hierarchical Message Passing and Multi-Scale Pre-training [37.8] 我々は、全原子量グリカンモデリングのためのGlycanAAモデルを紹介する。
GlycanAAは、局所的な原子レベルの相互作用からグローバルな単糖レベルの相互作用を捉えるために、階層的なメッセージパッシングを行う。
我々は,グリカンの依存性のレベルが異なるモデルを実現するために,マルチスケールマスク予測アルゴリズムを設計する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:08:39 GMT)
Minimum optical depth multiport interferometers for approximating arbitrary unitary operations and pure states [37.7] 我々は、マルチポート干渉計を用いて、純状態の準備とユニタリ操作を与えられた不忠実さで近似する問題に対処する。
数値計算により、任意の次元$d$の純粋な状態が不忠実で作成できることが示される。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:59:28 GMT)
Unraveling Spatio-Temporal Foundation Models via the Pipeline Lens: A Comprehensive Review [37.7] ディープラーニングモデルは、予測のようなタスクをサポートするために、そのようなデータに有用なパターンを利用する。
従来のディープラーニングモデルは、通常、ユースケースごとに個別のトレーニングが必要です。
これらの基盤モデルは、複数のタスクを解決できる統一されたフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:46:42 GMT)
Enumerate-Conjecture-Prove: Formally Solving Answer-Construction Problems in Math Competitions [37.1] 本稿では,様々な数学コンペティションにおける3,431の回答構成問題のデータセットであるConstructiveBenchについて述べる。
ECPは、パターン駆動の導出と形式的定理の証明を統合するモジュラー・ニューロシンボリックな手法である。
ECPが構築した回答と組み合わせると、最先端のDeepSeek-Prover-V2-7Bモデルはリーンの3,431の建設的問題の858の正解を生成する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:18:33 GMT)
Low-Rank Head Avatar Personalization with Registers [36.8] 本稿では,頭部アバター生成のためのジェネリックモデルの低ランクパーソナライズのための新しい手法を提案する。
我々のアプローチは目に見えない顔を忠実に捉え、既存の手法を定量的に質的に上回ります。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:53:14 GMT)
Invariance Makes LLM Unlearning Resilient Even to Unanticipated Downstream Fine-Tuning [36.5] 機械学習は、大規模言語モデル(LLM)におけるプライバシーと安全性の懸念に対する有望な解決策を提供する
不変リスク最小化(IRM)に触発されて、非学習に初めて不変を導入する。
我々は、頑健性を高める正規化ベースのフレームワークである不変LLMアンラーニング(ILU)を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:38:43 GMT)
HybGRAG: Hybrid Retrieval-Augmented Generation on Textual and Relational Knowledge Bases [36.5] 本稿では,レトリバーバンクと批評家モジュールからなるHQA用HybGRAGについて,次のような利点がある。
STaRKベンチマークの実験では、HybGRAGはパフォーマンスが大幅に向上し、hit@1の平均相対的な改善は51%である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:52:12 GMT)
Deterministic and statistical calibration of constitutive models from full-field data with parametric physics-informed neural networks [36.1] フルフィールド変位データからモデルキャリブレーションを行うためのパラメトリック物理インフォームドニューラルネットワーク(PINN)について検討した。
PINNの高速評価により、ほぼリアルタイムでキャリブレーションを行うことができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:05:23 GMT)
FormFactory: An Interactive Benchmarking Suite for Multimodal Form-Filling Agents [36.1] 現在のオンラインフォームフィリングツールは概ねルールベースであり、汎用的で生成性に欠ける。
本稿では,Webベースのインターフェース,バックエンド評価モジュール,データセットで構成される対話型ベンチマークスイートであるFormFactoryを提案する。
本ベンチマークでは,多種多様な実世界のシナリオを網羅し,多種多様なフィールドフォーマットを取り入れ,高忠実度なフォームインタラクションをシミュレートする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:34:57 GMT)
MTCMB: A Multi-Task Benchmark Framework for Evaluating LLMs on Knowledge, Reasoning, and Safety in Traditional Chinese Medicine [36.1] MTCMBは、知識QA、言語理解、診断推論、処方薬の生成、安全性評価の5つのカテゴリにまたがる12のサブデータセットから構成される。
予備的な結果は、現在のLSMは基礎知識でうまく機能するが、臨床推論、処方薬計画、安全コンプライアンスでは不足していることを示している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:01:40 GMT)
ARFlow: Human Action-Reaction Flow Matching with Physical Guidance [36.1] Action-Reaction Flow Matching (ARFlow)は、直接アクションから反応へのマッピングを確立する新しいフレームワークである。
本手法では,身体の浸透を効果的に防止する,フローマッチング(FM)に特化して設計された物理誘導機構を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:31:13 GMT)
Enhancing LLM-based Hatred and Toxicity Detection with Meta-Toxic Knowledge Graph [35.7] メタ有害知識グラフ上でのグラフ検索を利用して,憎悪や毒性を検出するメタトックスと呼ばれる新しい手法を提案する。
まず,LSMを用いて3段階のパイプラインから有害情報を抽出し,総合的なメタ有害知識グラフを構築する。
第2に、正確な有毒な知識を補うために、検索およびランキングプロセスを介してグラフを問い合わせる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:45:29 GMT)
Articulate-Anything: Automatic Modeling of Articulated Objects via a Vision-Language Foundation Model [35.2] Articulate-Anythingは、テキスト、画像、ビデオを含む多くの入力モダリティから、多種多様な複雑なオブジェクトの明瞭化を自動化する。
本システムでは,メッシュ検索機構を通じて既存の3Dデータセットを,反復的に提案,評価,洗練を行うアクタ・クリティカル・システムとともに活用する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:59:31 GMT)
Exploring the Potential of LLMs as Personalized Assistants: Dataset, Evaluation, and Analysis [35.2] HiCUPIDは、パーソナライズされたレスポンスを提供するためのLarge Language Models(LLM)の可能性を調査し、解き放つための新しいベンチマークである。
会話データセットに加えて、HiCUPIDはLlama-3.2ベースの自動評価モデルを提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:25:46 GMT)
R2SM: Referring and Reasoning for Selective Masks [35.2] 選択マスク(R2SM)に対する参照と推論という新しいタスクを導入する。
このタスクは、ユーザ意図によって駆動されるマスクタイプの選択を組み込むことで、テキスト誘導セグメンテーションを拡張する。
本稿では,COCOA-cls,D2SA,MUVAのアノテーションを付加して構築したR2SMデータセットについて述べる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:36:31 GMT)
TSRating: Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment [35.0] 本稿では,様々な領域から収集された時系列データの質を評価するフレームワークであるTSRatingを提案する。
評価精度, 効率, ドメイン適応性の観点から, TSR がベースラインより優れていることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:52:55 GMT)
Is Extending Modality The Right Path Towards Omni-Modality? [34.8] 対象ドメインと言語データに基づいて,市販の言語モデルを微調整したマルチモーダルモデルのトレーニング手法であるモーダリティの拡張の効果について検討する。
これらのトレードオフを分析し、現在のアプローチによる真正のモダリティの実現可能性に関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:01:40 GMT)
Stochastic Layer-Wise Shuffle for Improving Vision Mamba Training [34.8] 最近のVision Mamba(Vim)モデルは、配列長のほとんど線形な複雑さを示している。
SLWS(Layer-Wise Shuffle)は、Vimトレーニングを効果的に改善できる新しい正規化手法である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:41:08 GMT)
Spatial Coordinates as a Cell Language: A Multi-Sentence Framework for Imaging Mass Cytometry Analysis [34.6] 画像質量(IMC)は、質量の分析力と細胞表現型の空間分布を組み合わせることで、高次元空間プロファイリングを可能にする。
近年の研究では、大きな言語モデル(LLM)を利用して、遺伝子またはタンパク質の発現を生物学的文脈に翻訳することで、細胞状態を抽出している。
マルチ文アプローチを用いて,単一セル表現と空間情報を自然言語に統合する新しいフレームワークであるSpatial2Sentenceを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:38:59 GMT)
Knowing Before Saying: LLM Representations Encode Information About Chain-of-Thought Success Before Completion [34.6] ゼロショット・チェーン・オブ・サート・プロセスの成功を完了前に予測できるかどうかを検討する。
LLM表現に基づく探索分類器は,単一トークンが生成される前にも良好に動作することがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:26:59 GMT)
Position: It's Time to Act on the Risk of Efficient Personalized Text Generation [34.5] 我々は、特定の個人を偽装する可能性もまた、新しい安全リスクをもたらすと論じている。
例えば、この技術はフィッシングメールや不正なソーシャルメディアアカウントの作成を可能にする。
これらのリスクは、他の偽装攻撃の非常に疑わしいリスクと相補的であり、異なるものである、と我々は主張する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:49:20 GMT)
Hanfu-Bench: A Multimodal Benchmark on Cross-Temporal Cultural Understanding and Transcreation [34.2] Hanfu-Benchは、専門家による新しいマルチモーダルデータセットである。
文化的な視覚的理解と文化的なイメージの再現という2つの中心的な課題から構成される。
我々の評価では, 閉鎖型VLMは視覚的カットラル理解の非専門家と同等に機能するが, 人間の専門家では10%弱に低下する。
トランスクリエーション作業では,多面的評価により,最高の性能モデルがわずか42%の成功率を達成したことが示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:43:46 GMT)
Generate, Not Recommend: Personalized Multimodal Content Generation [34.0] コンテンツフィルタリングと選択を超えて、パーソナライズされたアイテムを直接マルチモーダル形式で生成する新しいパラダイムを提案する。
我々は、LMM(Large Multimodal Models)を活用し、教師付き微調整およびオンライン強化学習戦略の両方でそれらを訓練する。
2つのベンチマークデータセットとユーザによる実験により,提案手法の有効性が確認された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:10:08 GMT)
Combining Different Existing Methods for Describing Steganography Hiding Methods [34.0] 本稿では,ステガノグラフィにおける記述的手法の概念の紹介を目的とする。
本論文の主な目的は,既存の記述と分類対象を組み合わせることで,隠蔽方法の詳細な分類と記述を実現することである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:02:54 GMT)
OmniCaptioner: One Captioner to Rule Them All [34.0] 細かなテキスト記述を生成するための多目的視覚キャプションフレームワークを提案する。
低レベルのピクセル情報を意味的にリッチなテキスト表現に変換することで、われわれのフレームワークは視覚とテキストのモダリティのギャップを埋める。
OmniCaptionerの汎用性と適応性は、言語と視覚的モダリティのギャップを埋めるための新たな視点を提供することができると信じています。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:38:26 GMT)
Active Layer-Contrastive Decoding Reduces Hallucination in Large Language Model Generation [33.8] 近年の復号化手法は、生成時に次のトークンをどのように選択するかを精査することによって、大規模言語モデル(LLM)の事実性を向上している。
LLMは、特に長い文脈で幻覚を起こす傾向にある。
ActLCD(Active Layer-Contrastive Decoding)は,生成時にコントラスト層をいつ適用するかを積極的に決定する,新しいデコーディング戦略である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:11:11 GMT)
Reassessing Large Language Model Boolean Query Generation for Systematic Reviews [33.7] 大規模言語モデル (LLM) は複雑なクエリの開発を支援するために開発された。
この研究は、オリジナル作品の重要な側面を見落としている2つの研究を体系的に再現した。
その結果,クエリの有効性はモデルやプロンプト設計によって大きく異なることがわかった。
本研究は,モデルおよびプロンプト特異的最適化の重要性を強調した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:57:53 GMT)
Place Cells as Proximity-Preserving Embeddings: From Multi-Scale Random Walk to Straight-Forward Path Planning [33.7] 海馬は、認識地図を形成する場所の細胞集団を通して空間的なナビゲーションを可能にする。
マルチスケールランダムウォーク遷移を符号化するための近接保存型ニューラル埋め込みを提案する。
我々のフレームワークは、拡張性のあるナビゲーションのための空間的および時間的符号化を統一する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:36:50 GMT)
A minimalistic representation model for head direction system [33.7] 本稿では,方向(HD)システムに対する最小限の表現モデルを提案する。
本研究の目的は,HD細胞の本質的特性を捉えた頭部方向の高次元的表現を学習することである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:36:30 GMT)
Unified Analysis of Decentralized Gradient Descent: a Contraction Mapping Framework [33.4] 分散勾配降下(DGD)と拡散は、分散機械学習におけるワークホースである。
本稿では,DGDの解析と拡散のための基本的フレームワークを提案する。
これらのツールの使用は、ノイズフリーとノイズフリーの両体制において、厳密な収束境界をもたらす。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:50:30 GMT)
Mixture of Experts Provably Detect and Learn the Latent Cluster Structure in Gradient-Based Learning [33.3] MoEは、バニラルータを備えた特殊なモデルのアンサンブルで、各入力を適切な専門家に動的に配布する。
我々は,各専門家が個々のクラスタに対応するより単純な関数を弱めに回復する能力を活用して,この問題をより簡単なサブプロブレムに分割することに成功していることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:26:44 GMT)
Active Learning via Vision-Language Model Adaptation with Open Data [33.3] アクティブラーニング(AL)は、ラベリングとモデルトレーニングのための最も情報性の高いデータを戦略的に選択することで、データラベリングのコストを削減することを目的としている。
近年のAL法では VLM を探索しているが,VLM の事前表現データのような公開公開データの活用はされていない。
本研究では、タスク関連事例を検索してタスク特化例を増やすことで、そのようなデータを活用する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:30:04 GMT)
Non-literal Understanding of Number Words by Language Models [33.2] 人間は自然に、文脈、世界知識、話者意図を組み合わせた、意味のない数字を解釈する。
大規模言語モデル (LLM) も同様に数字を解釈し, ハイパボラ効果と実効ハロ効果に着目した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:56:25 GMT)
AI Scientists Fail Without Strong Implementation Capability [33.2] 人工知能(AI)科学者の出現は、科学的発見のパラダイムシフトを表している。
最近のAI Scientist研究は、独立した科学的発見のための十分な能力を示している。
この大きな進歩にもかかわらず、AI Scientistはコンピュータ科学の分野における画期的な成果をまだ生み出していない。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:59:10 GMT)
MotionSight: Boosting Fine-Grained Motion Understanding in Multimodal LLMs [32.8] 我々は、物体中心の視覚スポットライトと動きのぼけを視覚的プロンプトとして生み出す新しいゼロショット手法であるMotionSightを紹介した。
我々は、SFTや嗜好データ、Theta(40K)ビデオクリップ、Theta(87K)QAといった階層的なアノテーションを備えた、ビデオモーション理解のための最初の大規模データセットであるMotionVid-QAをキュレートした。実験の結果、MotionSightは最先端のオープンソースパフォーマンスと商用モデルとの競争性を達成している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:44:56 GMT)
SEA: Low-Resource Safety Alignment for Multimodal Large Language Models via Synthetic Embeddings [32.7] MLLM(Multimodal Large Language Models)は、重大なセキュリティ上の脆弱性を持つ。
テキストアライメントを含む既存の低リソースのセキュリティアライメント手法は、追加のモダリティによって引き起こされるセキュリティリスクに悩まされている。
勾配更新による追加モダリティの埋め込みを最適化するSEA(Synthetic Embedding augmented safety alignment)を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:55:31 GMT)
SwiftKV: Fast Prefill-Optimized Inference with Knowledge-Preserving Model Transformation [32.6] 本稿では,プロンプトトークンのプリフィル計算(FLOP)を削減することを目的とした,新しいモデル変換および蒸留手法であるSwiftKVを提案する。
SwiftKVは、後のレイヤのKVキャッシュを以前のレイヤの出力を使ってプリフィルし、プロンプトトークンが後層のレイヤをスキップできるようにする。
Llama-3.1-70B の 16K トークン/s に変換される正規化推論スループットの 560 TFlops/GPU を実現することができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:08:06 GMT)
Angles Don't Lie: Unlocking Training-Efficient RL Through the Model's Own Signals [32.6] 大規模言語モデル(LLM)のためのRFTパラダイムは、均一なデータサンプリングの下で同じクエリが冗長に露出するため、効率が悪い。
グラディエント駆動型アングルインフォームドナビゲーションRLフレームワークを提案する。
モデル固有の角度集中信号を利用することで、GAIN-RLは各エポックにおけるトレーニングデータを動的に選択し、一貫したインパクトのある勾配更新を確実にする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:40:38 GMT)
LlamaRL: A Distributed Asynchronous Reinforcement Learning Framework for Efficient Large-scale LLM Training [32.6] 強化学習(RL)は、大規模言語モデル(LLM)の能力向上のための訓練後の最も効果的なアプローチとなっている。
本稿では,LlamaRLについて述べる。LlamaRLは大規模LLMの効率的なトレーニングに最適化された,完全に分散された非同期RLフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:49:51 GMT)
When Should Dense Retrievers Be Updated in Evolving Corpora? Detecting Out-of-Distribution Corpora Using GradNormIR [32.5] 本稿では,コーパスがインデックス化前の高密度検索器と比較して分布外(OOD)であるかどうかを予測するための新しいタスクを提案する。
我々は、勾配ノルムを利用してOODコーパスを効果的に検出する、教師なしのアプローチであるGradNormIRを紹介した。
BEIRベンチマークの実験では、GradNormIRはドキュメントコレクションの進化において、高密度検索のタイムリーな更新を可能にする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:06:35 GMT)
Overcoming Multi-step Complexity in Multimodal Theory-of-Mind Reasoning: A Scalable Bayesian Planner [32.3] 本稿では,ToM推論を段階的にベイズ更新に分解するスケーラブルなベイズToMプランナを提案する。
提案フレームワークでは,より小さな言語モデルでToM固有の推定を専門に行うことのできる,弱いストロング制御を導入している。
提案手法は,マルチモーダルToMベンチマークにおける最先端技術よりも4.6%の精度向上を実現している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:23:45 GMT)
SteerPose: Simultaneous Extrinsic Camera Calibration and Matching from Articulation [32.3] 本稿では,他の視点で2次元ポーズを回転させるニューラルネットワークであるSteerPoseを提案する。
異なるマッチングを統合することで、SteerPoseは外部カメラキャリブレーションと対応検索を同時に行う。
本手法は, 新規動物の3次元ポーズをマルチカメラで再現できることを実証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:52:35 GMT)
EgoBrain: Synergizing Minds and Eyes For Human Action Understanding [31.9] EgoBrainは、長期にわたって人間の脳の自我中心の視覚と脳波を同期させる、世界初の大規模な、時間的に整列したマルチモーダルデータセットである。
このデータセットは、毎日29種類の活動に携わる40人の参加者から、同期された32チャンネル脳波記録と1対1のビデオの61時間からなる。
すべてのデータ、ツール、取得プロトコルはオープンに共有され、認知コンピューティングにおけるオープンサイエンスを育む。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:14:02 GMT)
A combined Machine Learning and Finite Element Modelling tool for the surgical planning of craniosynostosis correction [31.9] 本研究は,患者の手術成績をリアルタイムに予測するツールを開発することを目的とする。
提案手法は, 3次元写真に基づくパーソナライズされた合成頭蓋骨を作成することを含む。
所望の手術結果を達成するために、機械学習サロゲートモデルを用いる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:11:50 GMT)
Esoteric Language Models [31.6] 我々は,ARとMDMのパラダイムを融合した新しいモデルのファミリーであるEso-LMを紹介する。
Eso-LMは、標準言語モデリングベンチマークに新しい状態を設定した。
我々は、並列生成を保持しながら、DMs*のKVキャッシュを導入する**です。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:47:27 GMT)
Standard Benchmarks Fail - Auditing LLM Agents in Finance Must Prioritize Risk [31.4] 標準ベンチマークでは、大規模言語モデル(LLM)エージェントが金融面でどれだけうまく機能するかを定めているが、デプロイの安全性についてはほとんど語っていない。
我々は、精度の指標とリターンベースのスコアが、幻覚的な事実、古いデータ、敵の迅速な操作などの脆弱性を見渡すことで、信頼性の錯覚をもたらすと論じている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:13:24 GMT)
Human-Centric Evaluation for Foundation Models [31.4] 本稿では,問題解決能力,情報品質,インタラクション体験の3つの要素に着目した人間中心型主観評価フレームワークを提案する。
我々は540以上の参加者主導による評価を行い、人間とモデルはオープンエンドの研究タスクで協力する。
この結果からGrok 3の優れたパフォーマンスが注目され、続いてDeepseek R1とGemini 2.5が続き、OpenAI o3が遅れています。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:33:29 GMT)
WebChoreArena: Evaluating Web Browsing Agents on Realistic Tedious Web Tasks [31.2] WebChoreArenaは、532の精査されたタスクからなる、完全に再現可能な新しいベンチマークである。
WebChoreArenaは、完全に再現可能で広く採用されている4つのWebArenaシミュレーション環境の上に構築されている。
WebChoreArena で LLM が進化するにつれて, 性能が大幅に向上することが実証された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:59:45 GMT)
Cross-Lingual Transfer of Cultural Knowledge: An Asymmetric Phenomenon [31.0] 大規模言語モデル(LLM)の言語適応における言語間の文化的知識伝達について検討する。
低リソース言語は主に知識を制限された逆流を持つ英語に伝達するのに対し、英語と他の高リソース言語間の双方向の文化的伝達を観察する。
この非対称な現象を説明するために、我々は、事前学習データ転送においてより頻繁に現れる文化知識という周波数ベースの仮説を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:45:09 GMT)
GCoT: Chain-of-Thought Prompt Learning for Graphs [31.0] 思考の連鎖(CoT)は自然言語処理(NLP)において顕著な成功を収めた
しかし、その膨大なポテンシャルはグラフに対してほとんど探索されていない。
テキストフリーグラフのための最初のCoTプロンプト学習フレームワークであるGCoTを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:02:08 GMT)
SAM2-LOVE: Segment Anything Model 2 in Language-aided Audio-Visual Scenes [30.9] 本稿では,テキスト,音声,視覚表現を学習可能なトークンに統合する新しいフレームワークSAM2-LOVEを紹介する。
技術的には、SAM2のマルチモーダル理解を改善することを目的としたマルチモーダル融合モジュールを含む。
SAM2-LOVEは、Ref-AVSベンチマークにおいて、$calmathJ&F$において、SOTAよりも8.5%高い性能を示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:36:25 GMT)
IMAGHarmony: Controllable Image Editing with Consistent Object Quantity and Layout [30.8] QL-Editは、複雑なシーンにおけるオブジェクト量と空間構造のきめ細かい制御を可能にすることを目的としている。
IMAGHarmonyは、マルチモーダルセマンティクスを統合し、オブジェクトのカウントとレイアウトを明示的にモデル化する構造対応フレームワークである。
実験では、IMAGHarmonyは構造的アライメントと意味的精度において、最先端の手法を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:59:09 GMT)
MiLiC-Eval: Benchmarking Multilingual LLMs for China's Minority Languages [30.7] 大規模言語モデル(LLM)は、高リソース言語では優れているが、低リソース言語(LRL)では苦戦している。
中国のマイノリティ言語向けに設計されたベンチマークであるMiLiC-Evalを紹介します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:06:53 GMT)
Quantum Cognition Machine Learning for Forecasting Chromosomal Instability [30.7] 循環腫瘍細胞(CTC)の形態から染色体不安定性の正確な予測は、液体生検診断における高い転移能を有するCTCのリアルタイム検出を可能にする。
本稿では,転移性乳癌患者のCTCにおける形態予測的染色体不安定性を推定するための量子認知機械学習(QCML)の応用について紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:55:33 GMT)
Read it in Two Steps: Translating Extremely Low-Resource Languages with Code-Augmented Grammar Books [30.6] 本稿では,文法規則検索と適用という2つの重要なステップに分解することで,極めて低リソースな言語を翻訳する上での文法書の役割について検討する。
実験の結果,コードルールの使用はルール検索と適用の両方を大幅に促進し,最終的に13.1%のBLEU翻訳の改善が得られた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:36:37 GMT)
Demonstrating magnetic field robustness and reducing temporal T1 noise in transmon qubits through magnetic field engineering [30.5] 超伝導トランスモン量子ビットのコヒーレンスはしばしばエネルギー緩和時間(T1)の変動によって破壊される
捕捉された磁束と外部印加された静磁場の両方が、平均値やキュービット周波数を著しく劣化させることなく、T1の時間変動を抑えることを示した。
興味深いことに、タンタルを担持したニオブ (Nb/Ta) 容量パッドとアルミニウムベースのジョセフソン接合 (JJs) を用いたトランスモン量子ビットは、600mGの磁場で冷却しても、300ms付近でT1寿命を維持した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:22:54 GMT)
Respond Beyond Language: A Benchmark for Video Generation in Response to Realistic User Intents [30.2] RealVideoQuestは、リアルタイムで視覚的に接地されたクエリに応答するテキスト・ツー・ビデオ(T2V)モデルの能力を評価するように設計されている。
ビデオ応答インテントで7.5Kの実際のユーザクエリを特定し、4.5Kの高品質なクエリとビデオのペアを構築する。
実験によると、現在のT2Vモデルは、実際のユーザクエリに効果的に対処するのに苦労している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:52:21 GMT)
Egocentric Speaker Classification in Child-Adult Dyadic Interactions: From Sensing to Computational Modeling [30.1] 自閉症スペクトラム障害(Autism spectrum disorder、ASD)は、社会的コミュニケーション、反復行動、感覚処理における課題を特徴とする神経発達状態である。
ASDにおける重要な研究領域は、治療中の子供の行動変化を評価することである。
これらの相互作用における子どもの行動を理解する基本的な側面は、自動音声理解である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:51:54 GMT)
Generative Next POI Recommendation with Semantic ID [29.8] Point-of-interest(POI)レコメンデーションシステムは、ユーザの好みや履歴チェックインに基づいて、ユーザの次の目的地を予測することを目的としている。
既存のPOIレコメンデーションメソッドは通常、POIに対してランダムな数値IDを使用する。
セマンティックIDを用いたジェネレーティブNext POIレコメンデーション(GNPR-SID)を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:04:16 GMT)
RemoteSAM: Towards Segment Anything for Earth Observation [29.7] 我々は、地球観測のための頑健でフレキシブルな視覚基盤モデルを開発することを目指している。
多様な視覚的目標を認識し、位置を特定する能力を持つべきである。
いくつかの地球観測知覚ベンチマークで新しいSoTAを確立する基盤モデルであるRemoteSAMを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:46:01 GMT)
Improving Knowledge Distillation Under Unknown Covariate Shift Through Confidence-Guided Data Augmentation [29.6] 知識の蒸留は 基礎モデルから 小規模の学生ネットワークへ 知識を伝達するための 確立されたツールとなりました
この研究は、知識蒸留における共変量シフトの一般的な実践的問題に対処する。
本稿では,教師と生徒の意見の不一致を最大化して画像を生成する,拡散型データ拡張戦略を提案する。
実験の結果,CelebAとSpuCo Birdsでは,最悪のグループと平均グループ精度が有意に向上し,ImageNetでは刺激的なmAUCが得られた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:15:59 GMT)
Targeted control of fast prototyping through domain-specific interface [29.0] 工業デザイナーは長い間、プロトタイプモデルのターゲット制御を達成するための自然で直感的な方法を模索してきた。
大規模言語モデルはこの分野において有望であることを示しているが、プロトタイプモデルを言語で制御する可能性はまだ部分的には使われていない。
両言語間の媒体として機能するインタフェースアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:56:31 GMT)
VARD: Efficient and Dense Fine-Tuning for Diffusion Models with Value-based RL [29.0] VAlue-based Reinforced Diffusion (VARD) は、中間状態から報酬の期待を予測する値関数を初めて学習する新しい手法である。
提案手法は,バックプロパゲーションによる効果的な,安定したトレーニングを可能にしつつ,事前訓練されたモデルに近づき続ける。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:53:20 GMT)
Comprehensive Vulnerability Analysis is Necessary for Trustworthy LLM-MAS [28.7] 大規模言語モデルに基づくマルチエージェントシステム (LLM-MAS) は、ハイテイクなアプリケーションにますます多くデプロイされている。
LLM-MASは、エージェント間通信、信頼関係、ツール統合を通じて、ユニークな攻撃面を導入している。
本稿では,多様な研究を統一するLSM-MASの脆弱性解析のための体系的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:46:15 GMT)
Cycle Consistency as Reward: Learning Image-Text Alignment without Human Preferences [28.7] 本稿では,周期整合性を監視信号として活用する手法を提案する。
テキスト・ツー・イメージ・モデルを用いてテキストを画像空間にマッピングし、元の画像と再構成との類似性を計算する。
サイクル一貫性スコアを用いて候補をランク付けし、866K比較ペアの選好データセットを構築する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:42:58 GMT)
MINT: Multimodal Instruction Tuning with Multimodal Interaction Grouping [28.7] 我々は,マルチモーダルインタラクションのタイプに基づいた,シンプルながら驚くほど効果的なタスクグループ化戦略であるMINTを紹介する。
提案手法は,マルチモーダル命令チューニングにおいて,既存のタスクグループ化ベースラインを大幅に上回ることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:55:23 GMT)
Act Only When It Pays: Efficient Reinforcement Learning for LLM Reasoning via Selective Rollouts [28.2] ロールアウト前に非形式的なプロンプトをスキップすることで,計算オーバーヘッドのかなりの部分が回避可能であることを示す。
我々は,非形式的プロンプトを予測・スキップするオンライン軽量プリロールアウトフィルタリングアルゴリズムであるGRESOを提案する。
GRESOは, ロールアウト時に最大2.4倍, トレーニング時間全体で最大2.0倍の高速化を達成でき, 精度は低下しない。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:03:00 GMT)
Watching the Watchers: Exposing Gender Disparities in Machine Translation Quality Estimation [28.0] 本稿では,QE指標の性別バイアスを定義し,検討する。
男性求心性翻訳は女性求心性翻訳よりも高く,性中立性翻訳はペナルティ化されている。
調査の結果は,ジェンダーを中心としたQE指標の開発と評価に新たな焦点をあてることの必要性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:32:06 GMT)
TaxaDiffusion: Progressively Trained Diffusion Model for Fine-Grained Species Generation [27.5] TaxaDiffusionは、拡散モデルのための分類学的インフォームドトレーニングフレームワークである。
動物像の微細化を図り、形態的・身元的精度の高い画像を生成する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:43:55 GMT)
Schema as Parameterized Tools for Universal Information Extraction [27.5] ユニバーサル情報抽出(UIE)は、主に大言語モデル(LLM)を用いた抽出生成手法を用いる。
構造化IEツール(SPT)と呼ばれる適応型テキスト・構造生成フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:12:44 GMT)
Forensic deepfake audio detection using segmental speech features [27.3] 本研究では,ディープフェイク音声の検出にセグメント音声の音響的特徴を用いることの可能性を検討する。
法医学的音声比較(FVC)で一般的に用いられる部分的特徴はディープフェイクを特定するのに有効であるが、いくつかのグローバル特徴はほとんど価値がない。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:02:04 GMT)
CSVAR: Enhancing Visual Privacy in Federated Learning via Adaptive Shuffling Against Overfitting [27.3] CSVARは、セキュアなデータ送信と各トレーニングエポックのための難読化画像を生成するためのイメージシャッフルフレームワークである。
それは、過度に適合するプライバシーリークと生画像の送信リスクの両方に対処する。
人間の目に対して高い知覚的曖昧さを示す、視覚的に難解な画像を生成することができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:30:12 GMT)
AidAI: Automated Incident Diagnosis for AI Workloads in the Cloud [27.1] AidAIは顧客中心のシステムであり、顧客に即時インシデント診断を提供する。
AidAIは平均マイクロF1スコア0.854、マクロF1スコア0.816を大きなオーバーヘッドなく達成している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:41:25 GMT)
Towards Scalable Video Anomaly Retrieval: A Synthetic Video-Text Benchmark [26.9] ビデオ異常検索は、自然言語クエリを用いてビデオ内の異常事象をローカライズし、公衆の安全を促進することを目的としている。
既存のデータセットは、現実世界の異常の長い尾の性質と、大規模な収集を妨げるプライバシーの制約によって、データの不足に悩まされている。
SVTA(Synthetic Video-Text Anomaly benchmark)は,クロスモーダルな異常検索のための大規模なデータセットである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:23:58 GMT)
Pragmatics in the Era of Large Language Models: A Survey on Datasets, Evaluation, Opportunities and Challenges [26.8] NLPにおける実用能力を評価するために設計されたリソースのレビューを行う。
タスク設計,データ収集方法,評価手法,および実世界のアプリケーションとの関係について分析する。
本調査は,実用的評価の状況を明確にし,より包括的で目標とするベンチマークの開発を導くことを目的としている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:40:17 GMT)
Distractor-free Generalizable 3D Gaussian Splatting [26.8] DGGSは、未発見の課題に対処する新しいフレームワークである。 $textbfDistractor-free Generalizable 3D Gaussian Splatting$ (3DGS)。
クロスシーンの一般化可能な列車設定におけるトラクタデータによる3次元不整合とトレーニング不安定性を緩和する。
我々の一般化可能なマスク予測は、既存のシーン固有の訓練方法よりも精度が高い。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:22:27 GMT)
Identifying Materials-Level Sources of Performance Variation in Superconducting Transmon Qubits [26.5] 本研究では、超伝導トランスモン量子ビットチップと既知の性能指標を用いて、デバイス間性能変動の基盤となる材料レベルソースを特定する。
エッチング基板トレンチの深さ, 表面酸化物の厚さ, 側壁の形状の変動の傾向を調べた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:21:27 GMT)
Through a Steerable Lens: Magnifying Neural Network Interpretability via Phase-Based Extrapolation [26.5] 本稿では,ネットワーク勾配を無限小運動の形式として扱うことにより,クラス間の暗黙の経路を可視化する新しいフレームワークを提案する。
合成と実世界の両方のデータセットの実験では、フェーズ中心の補間が知覚的に整合し、意味的に意味のある変換をもたらすことが示されている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:39:40 GMT)
Incentivizing Reasoning for Advanced Instruction-Following of Large Language Models [26.4] CoT(Chain-of- Thought)は、大規模言語モデル(LLM)の能力を普遍的に改善することが期待される。
テスト時間計算のスケーリングに対する推論をインセンティブ化することで,複雑な命令処理におけるLLMの強化手法を提案する。
より優れたCoT施行のためのサンプルワイドコントラストによる複雑な指示の下での推論の浅く、重要でない性質に対処する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:11:44 GMT)
Efficient Learning of Balanced Signed Graphs via Sparse Linear Programming [26.3] バランスの取れた符号グラフは、単純線型変換を通して対応する正のグラフの1つにマップする固有ベクトルを持つ。
データから直接、バランスの取れたラプラシアングラフを学習する効率的な方法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:09:51 GMT)
Disentangling Likes and Dislikes in Personalized Generative Explainable Recommendation [26.2] ユーザの感情に焦点をあてた新しいデータセットと評価手法を導入する。
購入後のレビューから,ユーザの肯定的,否定的な意見を明示的に抽出し,データセットを構築する。
生成した説明文がユーザの感情に合致するかどうかに基づいてシステムを評価することを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:41:09 GMT)
Detecting Multimedia Generated by Large AI Models: A Survey [26.0] この調査の目的は、学術的なギャップを埋め、グローバルなAIセキュリティ努力に貢献することである。
メディアモダリティによって分類された検出手法のための新しい分類法を提案する。
ソーシャルメディアの観点から焦点を絞った分析を行い、より広範な社会的影響を強調します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:47:24 GMT)
Improving LLM-Generated Code Quality with GRPO [26.0] コード品質の様々な側面を定量化するライブラリを開発し,GRPOの報酬として利用する。
この測定によりGRPOはコード品質を向上し、専門家や盲目の人間アノテータによって確認される。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:50:16 GMT)
NAVER LABS Europe Submission to the Instruction-following Track [25.9] We describe NAVER LABS Europe submit to the instruction-following speech processing short track at IWSLT 2025。
ASR,ST,SQAタスクを英語の音声入力から中国語,イタリア語,ドイツ語の3言語に同時実行可能なシステムを開発した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:52:57 GMT)
Regularized Federated Learning for Privacy-Preserving Dysarthric and Elderly Speech Recognition [25.8] 本稿では,プライバシ保存型変形性関節症および高齢者の音声認識における正規化FL手法の体系的検討を行う。
正規化FLシステムは、統計的に有意なWERの0.55%の絶対値(2.13%の相対値)の還元により、ベースラインのFedAvgシステムより一貫して優れている
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:34:20 GMT)
Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS [25.3] In-context Learning (ICL) は、大規模言語モデルで高度なプロンプトと高品質なデモンストレーションを通じて下流タスクを実行できる。
本稿では,**Hi**gh-level **A**utomated **R**easoning paradigm in **ICL*を紹介する。
提案手法は,ドメイン間を効果的に一般化しながら,異なるサイズのモデル間での性能を向上させる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:26:19 GMT)
A Diffusion-Based Method for Learning the Multi-Outcome Distribution of Medical Treatments [25.2] 医学では、治療は複数の相互依存的な結果に影響を及ぼすことが多い。
治療効果を予測する機械学習手法のほとんどは、単一アウトカム設定に重点を置いている。
複数の結果の連成分布を学習するための拡散法DIMEを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:49:55 GMT)
CoDial: Interpretable Task-Oriented Dialogue Systems Through Dialogue Flow Alignment [24.9] 専門家の知識を実行可能な会話ロジックに変換する新しいフレームワークであるCoDialを導入する。
CoDialはColangのような既存のガードレール言語で簡単に実装できる。
推論ベースモデルのSTARデータセット上での最先端のパフォーマンスを実現し、よく知られたMultiWOZデータセット上の同様のベースラインと競合する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:12:27 GMT)
Surrogate Signals from Format and Length: Reinforcement Learning for Solving Mathematical Problems without Ground Truth Answers [24.9] 本研究は,代用信号として形式と長さを応用し,数学的問題解決のためにLLMを訓練するものである。
本研究は,形式的正当性のみに着目した報奨関数が,初期の標準GRPOアルゴリズムに匹敵する性能向上をもたらすことを示す。
その結果、フォーマット長のサロゲート信号を利用するGRPOアプローチは、マッチするだけでなく、標準のGRPOアルゴリズムの性能を上回る。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:24:21 GMT)
Small Language Models are the Future of Agentic AI [24.7] スモールランゲージモデル(SLM)は十分に強力であり、本質的にはより適しており、エージェントシステムにおける多くの呼び出しに対して経済的である。
本稿では,エージェントシステムにおけるSLM導入の潜在的な障壁について論じ,汎用LLM-to-SLMエージェント変換アルゴリズムの概要を述べる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:35:16 GMT)
Reasoning-Table: Exploring Reinforcement Learning for Table Reasoning [24.6] Reasoning-Tableは、テーブル推論への強化学習(RL)の最初の応用であり、最先端の性能を実現している。
Reasoning-Tableは大きな言語モデルを推論する堅牢なテーブルとして登場し、Claude-3.7-Sonnetのようなより大きなプロプライエタリなモデルを4.0%上回っている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:18:09 GMT)
VideoCap-R1: Enhancing MLLMs for Video Captioning via Structured Thinking [24.5] 本稿では,ビデオMLLMのためのGRPOベースのRLポストトレーニングについて,初めて体系的な研究を行った。
我々は、まず、ビデオの主題を分析する構造化思考を実行するために、VideoCap-R1を開発した。
実験によると、VideoCap-R1はQwen2VL-7Bベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:30:09 GMT)
GSCodec Studio: A Modular Framework for Gaussian Splat Compression [24.4] GSCodec Studioは、GSの再構築、圧縮、レンダリングのための統合されたフレームワークである。
このフレームワークは多種多様な3D/4DGS再構成手法とGS圧縮技術をモジュールコンポーネントとして組み込んでいる。
GSCodec Studioは、コミュニティリサーチと独自の調査からベストプラクティスを統合することで、コンパクトな表現と圧縮ソリューションの開発を支援します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:04:25 GMT)
Zoom-Refine: Boosting High-Resolution Multimodal Understanding via Localized Zoom and Self-Refinement [24.3] MLLM(Multimodal Large Language Models)は高解像度画像の正確な解釈に苦慮することが多い。
この問題に対処するためのMLLM機能を強化した新しいトレーニングフリーのZoom-Refineを導入する。
本手法は, 空間的局所化, 文脈的推論, 比較分析にMLLM固有の能力を活用し, 追加の訓練や外部の専門家を必要とせずに活用する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:32:35 GMT)
Online Competitive Information Gathering for Partially Observable Trajectory Games [24.3] ゲーム理論エージェントは、相手に関する情報を最適に収集する計画を立てなければならない。
我々は、軌道空間における競合情報収集行動を認めるPOSGの有限履歴/水平改良を定式化する。
これらのゲームにおいて,状態空間の粒子ベース推定を活用し,グラデーションプレイを行う合理的な軌道計画を計算するためのオンライン手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:45:58 GMT)
Understanding and Improving Laplacian Positional Encodings For Temporal GNNs [24.2] 本稿では,超ラプラシアンエンコーディングと時間スライスエンコーディングを接続する理論的枠組みを提案する。
また,5万のアクティブノードを持つグラフにスケーリングしながら,最大56倍の高速実行を実現し,計算オーバーヘッドを削減する新たな手法も導入する。
その結果, 位置符号化は特定のシナリオにおける性能を著しく向上させるが, その効果はモデルによって異なることがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:30:58 GMT)
MVAN: Multi-View Attention Networks for Fake News Detection on Social Media [24.2] 既存の偽ニュース検出手法は、ロングテキストコンテンツからヒントを見つけることに焦点を当てている。
本稿では,より現実的なシナリオにおいて,偽ニュース検出の問題を解決する。
我々は,新しいニューラルネットワークモデル textbfMulti-textbfView textbfAttention textbfNetworks を開発した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:05:23 GMT)
DIS-CO: Discovering Copyrighted Content in VLMs Training Data [24.2] モデルの開発において,著作権付きコンテンツの含意を推測する新しいアプローチであるdis-COを提案する。
対象とする著作権物質から特定のフレームでVLMを何度もクエリすることで、dis-COは自由形式のテキスト補完を通じてコンテンツのアイデンティティを抽出する。
以上の結果から,dis-COは検出性能を著しく向上し,最良先行法の平均AUCをほぼ倍増させることがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:40:39 GMT)
SRPO: Enhancing Multimodal LLM Reasoning via Reflection-Aware Reinforcement Learning [24.1] MLLM(Multimodal large language model)は、タスク推論において有望な能力を示すが、明示的な自己回帰と自己補正を必要とする複雑な問題に悩まされている。
既存のリフレクション手法は単純で、意味のあるインストラクティブフィードバックを生成するのに苦労している。
本稿では,2段階のリフレクション対応強化学習フレームワークであるグループ相対ポリシー最適化 (SRPO) を用いたマルチモーダル自己回帰強化推論を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:21:44 GMT)
Silence is Golden: Leveraging Adversarial Examples to Nullify Audio Control in LDM-based Talking-Head Generation [24.1] 肖像画のプライバシーを積極的に保護する2段階の手法を提案する。
まず,音声合成における音声制御を無視するために,Nullification Losが提案される。
第2に, 逆潜伏特性を最適化し, 頑健な摂動を発生させるため, LDMの抗浄化損失を適用した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:26:46 GMT)
LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning? [23.9] LEGO-Puzzlesは、11の異なるタスクにまたがる1,100の精巧にキュレートされた視覚的質問応答(VQA)サンプルで構成されている。
最も強力なMLLMでさえ、テストケースの約半分しか答えられません。
実験の結果,GPT-4o と Gemini-2.0-Flash はこれらの命令に従う能力に制限があり,他のMLLM は入力画像を複製するか,全く無関係な出力を生成することがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:06:01 GMT)
Generating by Understanding: Neural Visual Generation with Logical Symbol Groundings [23.9] このような論理積分モデルを構築するために,Abductive Visual Generation (AbdGen) アプローチを提案する。
本手法は, 論理的推論システムと様々なニューラル生成モデルを統合するために応用できることを実験的に示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:59:40 GMT)
RDB2G-Bench: A Comprehensive Benchmark for Automatic Graph Modeling of Relational Databases [23.8] RDB-to-graphモデリングは、クロステーブルな依存関係をキャプチャするのに役立つ。
グラフモデリングに共通のルールを適用すると、最高のグラフモデルと比較して10%パフォーマンスが低下します。
我々は,そのような手法を評価するための最初のベンチマークフレームワークであるRDB2Gを紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:34:10 GMT)
NUTSHELL: A Dataset for Abstract Generation from Scientific Talks [23.8] 音声から抽象的生成(SAG)は、記録された科学的プレゼンテーションから抽象化を自動的に生成することを目的としている。
我々は,NUTSHELLを紹介した。これは*ACLカンファレンスの講演を,対応する要約と組み合わせた新しいデータセットである。
SAGの課題を取り上げ,NUTSHELLでのトレーニングのメリットを実証した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:51:11 GMT)
Visual Explanation via Similar Feature Activation for Metric Learning [23.6] クラスアクティベーションマップ(CAM)はソフトマックスベースの畳み込みニューラルネットワークの解釈可能性を調べるために広く利用されている。
類似特徴活性化マップ(SFAM)と呼ばれる新しい視覚的説明法を提案する。
SFAMは、ユークリッド距離またはコサイン類似度を類似度計量として用いて、CNNモデルに対して非常に有望な解釈可能な視覚的説明を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:14:37 GMT)
SAM-I2V: Upgrading SAM to Support Promptable Video Segmentation with Less than 0.2% Training Cost [23.5] 本稿では,PVSモデルを構築するための画像と映像の効果的なアップグレード手法であるSAM-I2Vを紹介する。
我々のアプローチでは、事前訓練されたSAMをPVSをサポートするよう戦略的にアップグレードし、トレーニングの複雑さとリソース要求を大幅に削減する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:30:14 GMT)
Algorithmic Fidelity of Large Language Models in Generating Synthetic German Public Opinions: A Case Study [23.5] 本研究では,大規模言語モデル(LLM)のアルゴリズム的忠実度について検討する。
我々は、人口動態の特徴をペルソナのプロンプトに組み込むことで、ドイツのサブポピュレーションを反映した合成世論を生成するよう、異なるLLMに促す。
以上の結果から,Llama は他の LLM よりも,特にグループ内での意見の多様性が低い場合には,サブポピュレーションの表現に優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:24:38 GMT)
Guiding Reasoning in Small Language Models with LLM Assistance [23.3] 小さな言語モデルは、深く、多段階の論理的推論を必要とするタスクに適していると疑念を抱いた。
本稿では,Small Reasons, Large Hintsというフレームワークについて紹介する。
数学的推論データセットを用いた実験により, ターゲットとなる外部足場の性能が著しく向上することが示された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:10:54 GMT)
BenchmarkCards: Standardized Documentation for Large Language Model Benchmarks [23.3] 大規模言語モデル(LLM)は多様なタスクを処理できる強力なツールである。
利用可能な多くのオプションを考えると、適切なベンチマークを見つけることは難しい。
直感的で検証可能なドキュメントフレームワークである textttBenchmarkCards を紹介します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:50:17 GMT)
Learning to Explore: An In-Context Learning Approach for Pure Exploration [23.2] 本研究は, 純粋探索(Pure Exploring)としても知られる, 能動的逐次仮説試験問題について検討する。
In-Context Pure Exploration (ICPE, In-Context Pure Exploration) は, Transformer を用いて経験から直接探索戦略を学習する,コンテキスト内学習手法である。
ICPEは教師付き学習と強化学習を組み合わせて、事前の仮定を必要とせず、関連するタスクをまたいだ潜在構造を特定し、活用する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:04:50 GMT)
PMNO: A novel physics guided multi-step neural operator predictor for partial differential equations [23.0] 本稿では,複雑な物理系の長期予測における課題に対処する物理誘導多段階ニューラル演算子(PMNO)アーキテクチャを提案する。
PMNOフレームワークは、シングルステップ入力をフォワードパス内の複数ステップの履歴データに置き換え、バックプロパゲーション中に暗黙のタイムステッピングスキームを導入する。
様々な物理系におけるPMNO予測器の優れた予測性能を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:33:50 GMT)
OmniV2V: Versatile Video Generation and Editing via Dynamic Content Manipulation [23.0] OmniV2Vは様々な操作に基づいて様々なシナリオで動画を生成・編集できるビデオモデルである。
さらに、LLaVAに基づく視覚テキスト命令モジュールを設計し、視覚コンテンツと命令の対応を効果的に理解できるようにする。
実験によると、OmniV2Vは、多くのビデオ生成および編集タスクのための、最良のオープンソースおよび商用モデルと同様に、時には優れた機能を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:42:06 GMT)
LongDWM: Cross-Granularity Distillation for Building a Long-Term Driving World Model [22.9] ドライビングワールドモデルは、現在の状態と行動の状態に基づいて、ビデオ生成によって未来をシミュレートするために使用される。
最近の研究は、ディフュージョントランスフォーマー(DiT)を駆動世界モデルのバックボーンとして利用し、学習の柔軟性を向上させる。
我々は、シンプルで効果的な長期運転世界モデルを構築するためのソリューションをいくつか提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:19:23 GMT)
Descriptive History Representations: Learning Representations by Answering Questions [22.8] 本稿では,記述的歴史表現(DHRs: Descriptive History Representations)を紹介する。
DHRはタスク関連クエリに対処するために必要な情報を収集することに集中し、最適な制御のために履歴を要約する構造化された方法を提供する。
これは、効果的な意思決定に必要な、厳密な歴史的詳細と予測構造を捉えた表現をもたらす。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:00:41 GMT)
Diff2Flow: Training Flow Matching Models via Diffusion Model Alignment [22.7] 拡散モデルは高忠実度出力によって生成タスクに革命をもたらしたが、フローマッチング(FM)はより高速な推論と経験的な性能向上を提供する。
この研究は、事前学習された拡散モデルからフローマッチングへの知識の伝達を効率的に行うという重要な課題に対処する。
本稿では,拡散とFMパラダイムを体系的にブリッジする新しいフレームワークであるDiff2Flowを提案し,時間ステップを再スケーリングし,補間を整列させ,拡散予測からFM互換速度場を導出する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:05:05 GMT)
General agents need world models [22.6] 多段階の目標指向タスクに一般化できるエージェントは、その環境の予測モデルを学んだに違いない。
このモデルはエージェントの方針から抽出でき、エージェントのパフォーマンスや目標の複雑さを増大させるには、より正確な世界モデルを学ぶ必要がある。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:01:13 GMT)
Dictionaries to the Rescue: Cross-Lingual Vocabulary Transfer for Low-Resource Languages Using Bilingual Dictionaries [22.6] 言語間の語彙移動は、事前訓練された言語モデルを新しい言語に適応させる上で有望な役割を担っている。
モノリンガルまたはパラレルコーパスを利用する既存のアプローチは、限られたリソースを持つ言語に適用する場合、課題に直面します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:52:52 GMT)
LinearVC: Linear transformations of self-supervised features through the lens of voice conversion [22.5] LinearVCは、自己教師付き表現の構造に光を当てる単純な音声変換手法である。
自己教師付き特徴の単純な線形変換は音声を効果的に変換することを示す。
我々の研究は、実践的な音声変換と、自己教師付き音声表現のより広い理解の両方に影響を及ぼす。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:18:02 GMT)
The time scale of redundancy between prosody and linguistic context [22.0] 単語の韻律的特徴は、拡張された過去の文脈を確実に予測する必要がある。
また、単語の韻律的特徴は、将来の単語と多少の冗長性を示すが、1-2ワードの短いスケールしか持たない。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:12:00 GMT)
Fodor and Pylyshyn's Legacy -- Still No Human-like Systematic Compositionality in Neural Networks [22.0] 現代のニューラルなメタラーニングシステムは、メタラーニング設定の非常に狭く制限された定義の下では、そのようなタスクしか実行できない、と我々は主張する。
我々は、フォーダーとピリシンの遺産は存続し、現在まで、ニューラルネットワークで学習された人間のような体系的な構成性は存在しないと主張している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:02:53 GMT)
Jigsaw-R1: A Study of Rule-based Visual Reinforcement Learning with Jigsaw Puzzles [22.0] 本稿では、ジグソーパズルを構造化実験フレームワークとして用いて、ルールベースの視覚的RLについて包括的に研究する。
Jigsawのパズルは、固有の真実、調整可能な困難、複雑な意思決定を要求する。
MLLMは、最初は最も単純なジグソーパズルのランダムな推測に近づき、ほぼ完璧な精度を達成し、微調整によって複雑で目に見えない構成に一般化する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:10:33 GMT)
Completing A Systematic Review in Hours instead of Months with Interactive AI Agents [21.9] 我々は、大規模な言語モデルを利用した人間中心の対話型AIエージェントInsightAgentを紹介する。
InsightAgentは意味論に基づく大規模な文献コーパスを分割し、より焦点を絞った処理にマルチエージェント設計を採用する。
9人の医療専門家によるユーザスタディでは、可視化と相互作用機構が合成SRの品質を効果的に向上することを示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:34:14 GMT)
Different Speech Translation Models Encode and Translate Speaker Gender Differently [21.9] 多様な音声翻訳モデル間で性別のエンコーディングを評価するために,探索手法を用いる。
その結果,従来のエンコーダ・デコーダモデルではジェンダー情報をキャプチャするが,新しいアーキテクチャでは音声エンコーダをアダプタを介して機械翻訳システムに統合する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:58:41 GMT)
Connecting Neural Models Latent Geometries with Relative Geodesic Representations [21.7] 遅延構造を異なる潜在空間間で共有する場合、表現間の相対距離を歪みまで保存できることが示される。
異なるニューラルモデルは、ほぼ同じ基礎多様体をパラメータ化し、プルバック計量に基づく表現を導入すると仮定する。
本手法は,オートエンコーダと視覚基盤識別モデルを対象として,モデルの縫合と検索のタスクについて検証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:34:55 GMT)
Analyzing the Importance of Blank for CTC-Based Knowledge Distillation [21.7] 我々は, ブランクトークン処理に焦点をあてて, さまざまなCTCベースの蒸留変種について検討する。
空白除去のような一般的なアプローチは,必ずしも棚から外れているとは限らない。
知識蒸留におけるCTC損失を,性能劣化を最小限に抑えて除去することができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:08:38 GMT)
Ultra-High-Resolution Image Synthesis: Data, Method and Evaluation [21.5] Aesthetic-4Kデータセットは、超高解像度画像合成に関する包括的な研究のためにキュレートされている。
Diffusion-4Kは超高解像度画像の直接生成のための革新的なフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:19:40 GMT)
MODS: Multi-source Observations Conditional Diffusion Model for Meteorological State Downscaling [21.4] 我々はMODS(Multi-source Observation Down-Scaling Model)を提案する。
静止衛星グリッドサット、極軌道衛星(AMSU-A、HIRS、MHS)のデータを条件として、地形データ(GEBCO)を条件として融合する条件拡散モデルである。
トレーニング中、多様な条件入力から潜伏した特徴を別々に抽出し、マルチソースのクロスアテンションモジュールを介してERA5マップに融合する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:40:16 GMT)
Small Stickers, Big Meanings: A Multilingual Sticker Semantic Understanding Dataset with a Gamified Approach [21.3] 我々は,多種多様で高品質で,文脈的に共鳴するステッカークエリを収集するために設計された,ゲーミフィケーションアノテーションフレームワークであるSticktionaryを紹介した。
次に、60時間以上のコントリビュータによって注釈付けされた1,115の英語と615の中国語クエリを含む、多言語ステッカークエリデータセットであるStickerQueriesを紹介する。
第3に,本手法がステッカー領域におけるクエリ生成品質,検索精度,意味理解を著しく向上させることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:38:45 GMT)
PerSRV: Personalized Sticker Retrieval with Vision-Language Model [21.3] 本稿では,Personalized Sticker Retrieval with Vision-Language Model framework,すなわちPerSRVを提案する。
ステッカーレベルのセマンティック理解のために, 微調整したLLaVA-1.5-7Bを用いて人間のようなステッカーセマンティクスを生成する。
第3に、ユーザの過去のインタラクションに基づいて、スタイルセントロイドをクラスタリングし、個人の嗜好モデリングを実現する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:26:30 GMT)
TAH-QUANT: Effective Activation Quantization in Pipeline Parallelism over Slow Network [21.2] 本稿では,パイプライン並列性に特化した新しいアクティベーション量子化フレームワークTAH-Quant(Tile-wise Adaptive Hadamard Quantization)を紹介する。
提案手法は,精密制御のための細粒度タイルワイド量子化,最適ビット使用のためのエントロピー誘導トークンレベル適応ビット割り当て,およびピボット要素スワップを用いたアダマール変換を統合し,量子化出力を効果的に抑制する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:13:41 GMT)
Developing a Mixed-Methods Pipeline for Community-Oriented Digitization of Kwak'wala Legacy Texts [21.2] クワクワラ(Kwak'wala)は、カナダのブリティッシュコロンビア州で話されている言語である。
フランツ・ボアズとジョージ・ハントが共同で作成した初期の11巻以上のテキストがスキャンされたが、機械で読めないままである。
我々は、Kwak'walaテキストを効果的に分離するために、既製のOCRメソッド、言語識別、マスキングを組み合わせて提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:20:09 GMT)
Sensitivity-Aware Density Estimation in Multiple Dimensions [21.0] 我々は,不均一な確率でサンプリングされる多次元問題の文脈において,確率密度を推定する最適化問題を定式化する。
検出器感度を不均一密度とみなし、グリッド上のスプラインによって提供される計算速度とフレキシブルな境界条件を利用する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 23:28:49 GMT)
DNAEdit: Direct Noise Alignment for Text-Guided Rectified Flow Editing [20.9] ノイズ領域のガウス雑音を改良するために, 直接雑音アライメント(DNA)を提案する。
また、ターゲットのプロンプト誘導生成過程を制御するための移動速度誘導(MVG)も導入する。
DNAEditは、最先端のテキストガイド編集方法よりも優れたパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:41:33 GMT)
DLP: Dynamic Layerwise Pruning in Large Language Models [20.8] プルーニングはパラメータスケールの削減とLarge Language Models(LLM)の推論効率の向上のために広く採用されている。
動的レイヤワイズ・プルーニング(DLP)と呼ばれる新しい手法を提案する。
モデル重みと入力アクティベーション情報を統合することで各層の相対的重要性を適応的に決定し,それに応じてプルーニング率を割り当てる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:53:09 GMT)
Q-STRUM Debate: Query-Driven Contrastive Summarization for Recommendation Comparison [20.8] Q-STRUM DebateはSTRUM-LLMの新たな拡張であり,クエリに関連する項目の集中的かつコントラスト的な要約を生成するために,議論スタイルのプロンプトを利用する。
3つのデータセットにわたる実験により、Q-STRUM Debateは、キーコントラストの要約基準において、既存の手法よりも大幅に性能が向上することを示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:47:49 GMT)
Middle-Layer Representation Alignment for Cross-Lingual Transfer in Fine-Tuned LLMs [20.8] 中層は言語間アライメントの可能性が強い。
スロットフィリング、機械翻訳、構造化テキスト生成の実験は、言語間転送における一貫した改善を示している。
我々は、個別に訓練されたアライメントモジュールを既存のタスク固有のモジュールとマージすることができ、完全に再トレーニングすることなく言語間の機能を改善することを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:09:36 GMT)
FreqPolicy: Frequency Autoregressive Visuomotor Policy with Continuous Tokens [20.7] 本稿では,階層的な周波数成分を段階的にモデル化するビジュモータポリシー学習のための新しいパラダイムを提案する。
さらに精度を高めるために,動作空間の滑らかさと連続性を維持する連続潜在表現を導入する。
我々の手法は、精度と効率の両方で既存の手法より優れている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:13:51 GMT)
Incentivizing LLMs to Self-Verify Their Answers [20.3] 大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な進歩を示している。
自明な回答を自己検証するために LLM をインセンティブとするフレームワークを提案する。
我々はQwen2.5-Math-7BとDeepSeek-R1-Distill-Qwen-1.5Bに基づいて自己検証モデルを訓練する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:54:29 GMT)
Cross-Lingual Generalization and Compression: From Language-Specific to Shared Neurons [20.1] 事前学習中に多言語言語モデルがどのように進化するかを考察する。
我々は、各層にまたがる一様言語識別機能から、より特殊な層関数への遷移を観察する。
言語間の同じ概念に対する信頼性の高い予測因子として出現する特定のニューロンを同定する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:06:30 GMT)
HENT-SRT: Hierarchical Efficient Neural Transducer with Self-Distillation for Joint Speech Recognition and Translation [20.0] HENT-SRTは、ASRと翻訳タスクを分解して、再注文の処理を改善する新しいフレームワークである。
ASRトランスデューサのベストプラクティスを取り入れて計算効率を向上させる。
提案手法は,アラビア語,スペイン語,マンダリンの3つの会話データセットを用いて評価した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:37:50 GMT)
Trade-offs in Data Memorization via Strong Data Processing Inequalities [20.0] 最近の研究では、大規模な言語モデルのトレーニングには、かなりの量のトレーニングデータの記憶が伴うことが示されている。
このような暗記は、センシティブなユーザデータをトレーニングする際のプライバシー侵害につながる可能性があるため、学習におけるデータ暗記の役割を研究する動機となる。
本稿では, 強データ処理の不等式とデータ記憶との新たな接続に依存する, 過剰なデータ記憶の下位境界を証明するための一般的な手法を開発する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:41:49 GMT)
Leveraging Variation Theory in Counterfactual Data Augmentation for Optimized Active Learning [20.0] アクティブラーニング(AL)は、モデルがユーザフィードバックからインタラクティブに学習することを可能にする。
本稿では,ALに反実データ拡張手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:56:42 GMT)
TACLR: A Scalable and Efficient Retrieval-based Method for Industrial Product Attribute Value Identification [19.9] 製品属性値識別 (PAVI) のための最初の検索手法である TACLR (Contrastive Learning Retrieval) を導入する。
TACLRは、製品プロファイルと候補値を埋め込みに符号化し、その類似性に基づいて値を取得することにより、情報検索タスクとしてPAVIを定式化する。
1)正規化された出力を生成しながら暗黙的およびOOD値を効果的に処理し、(2)数千のカテゴリ、数千の属性、そして数百万の値にスケールし、(3)高負荷の産業展開のための効率的な推論をサポートする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:43:02 GMT)
Efficient Egocentric Action Recognition with Multimodal Data [19.7] 入力モードの異なるサンプリング周波数が自我中心の動作認識性能とCPU使用量に与える影響を解析する。
以上の結果から,RGBフレームのサンプリングレートの低減は,高周波数の3Dハンドポーズ入力を補完することで,CPU要求を大幅に低減しつつ高い精度を維持できることが判明した。
このことは、XRデバイス上で効率的なリアルタイムEARを実現するための実行可能なアプローチとして、マルチモーダル入力戦略の可能性を強調している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:04:23 GMT)
Many-for-Many: Unify the Training of Multiple Video and Image Generation and Manipulation Tasks [19.6] 拡散モデルは、多くの視覚生成および操作タスクにおいて印象的な性能を示している。
我々は、様々な視覚生成と操作タスクから利用可能なトレーニングデータを活用する統一されたフレームワーク、すなわち、many-for-manyを導入する。
我々の共同学習は、映像生成性能を改善した統一的な視覚生成と操作モデルをもたらす。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:05:44 GMT)
Echoes of Phonetics: Unveiling Relevant Acoustic Cues for ASR via Feature Attribution [19.3] 本稿では,現代コンフォーマーを用いたASRシステムにおいて,関連する音響的手がかりを特定するために,特徴属性手法を適用した。
発声音, 摩擦音, 母音を解析することにより, 特徴属性が時間領域と周波数領域の音響特性とどのように一致しているかを評価する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:11:16 GMT)
SAB3R: Semantic-Augmented Backbone in 3D Reconstruction [19.2] オープン語彙セグメンテーションと3次元再構成の目的を統一する新しいタスクであるMap and Locateを導入する。
具体的には、MapとLocateは、未提示のビデオからポイントクラウドを生成し、オープン語彙クエリに基づいてオブジェクトインスタンスをセグメント化する。
このタスクは、現実世界のAIアプリケーションへの重要なステップとして機能し、再構築、認識、再編成を橋渡しする実践的なタスクを導入します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:00:04 GMT)
Domain Regeneration: How well do LLMs match syntactic properties of text domains? [19.0] 我々は、広く使われているオープンソースのLCMに、寛容にライセンスされた英語のテキストであるウィキペディアとニューステキストの2つのドメインからテキストを再生するよう促す。
この再生パラダイムは、LLMが意味的に制御された設定で、元の人間のテキストドメインと忠実に一致できるかどうかを調査することを可能にする。
その結果, 再生分布の大部分は, 平均値, 標準偏差が低く, 長い尾部が減少していることがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:27:28 GMT)
V-VAE: A Variational Auto Encoding Framework Towards Fine-Grained Control over Human-Like Chat [19.0] ロールプレイとペルソナベースのチャットアプローチは、静的な役割記述、粗い信号空間、低品質の合成データに大きく依存している。
人間のようなチャットは、感情的なトーン、状況認識、進化するパーソナリティなどの微妙な潜伏特性をモデル化する必要がある。
これらの制約に対処するため、変分自動符号化モジュールと細粒度で解釈可能な潜伏変数を含むV-VAEフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:38:02 GMT)
DRAG: Distilling RAG for SLMs from LLMs to Transfer Knowledge and Mitigate Hallucination via Evidence and Graph-based Distillation [18.9] 我々は、大規模言語モデルから小さなLMにRAG知識を蒸留する新しいフレームワークである$texttDRAG$を紹介した。
提案手法はエビデンスと知識グラフに基づく蒸留を利用して, 蒸留モデルが重要な事実知識を維持しつつ, モデルサイズと計算コストを大幅に削減する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:59:51 GMT)
Second quantization of nonlinear Vlasov-Poisson system for quantum computation [18.8] ヴラソフ・ポアソン方程式は線形で有限次元であり、第二量子化によって離散的である。
量子化線形系が非線形力学を捉えることができることを示す数値シミュレーションを提示する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:20:25 GMT)
From Street Views to Urban Science: Discovering Road Safety Factors with Multimodal Large Language Models [18.7] 都市・交通研究は長い間、重要な変数と道路安全のような社会的結果の間の統計的に意味のある関係を明らかにすることを模索してきた。
解釈可能な仮説推論のためのマルチモーダル大言語モデル(MLLM)に基づくアプローチを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:40:56 GMT)
Privacy amplification by random allocation [18.2] 我々は,ユーザのデータがランダムに選択された$k$ステップにおいて,$t$ステップのシーケンス(あるいはセット)から一様に選択されるサンプリングスキームのプライバシアンプリフィケーション特性について考察する。
このスキームの既存の分析は、シャッフルによるプライバシーの増幅に頼り、過度に保守的な境界を導いたり、モンテカルロシミュレーションを必要とする。
特に、ランダムな$k$-out-of-t$アロケーションのプライバシ保証は、よく研究されている独立性(あるいはPoisson)サブサンプリングのプライバシー保証によって上限づけられることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:39:42 GMT)
In the Picture: Medical Imaging Datasets, Artifacts, and their Living Review [18.2] 本稿では,複数の医用画像アプリケーションにまたがる公開データセットとその関連研究成果を継続的に追跡するリビングレビューを提案する。
医用画像データセットの作成に関する重要な考察、データアノテーションのベストプラクティスの見直し、ショートカットの重要性と人口分布の多様性について議論し、ライフサイクル全体を通してデータセットを管理することの重要性を強調する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:18:57 GMT)
Automating Versatile Time-Series Analysis with Tiny Transformers on Embedded FPGAs [18.2] 本稿では,組み込みFPGA上でのTiny Transformersの統一的かつ完全に自動化されたデプロイメントフレームワークを提案する。
我々のフレームワークは、3つの典型的な時系列タスクにまたがるコンパクトエンコーダのみのトランスフォーマーアーキテクチャをサポートしている。
その結果,AMD Spartan-7では,1推論あたり0.033mJとミリ秒のレイテンシで達成できる,整数のみのタスク固有のトランスフォーマーアクセラレータを作成した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:38:07 GMT)
Learning Treatment Representations for Downstream Instrumental Variable Regression [18.1] 本稿では,表現学習過程において,機器変数を明示的に組み込むことで,治療表現を構築する新しい手法を提案する。
我々の手法は、限られた楽器で高次元内在変数を扱うための枠組みを提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:41:23 GMT)
Emergence and Effectiveness of Task Vectors in In-Context Learning: An Encoder Decoder Perspective [18.1] プレトレーニング中にトランスフォーマーがどのようにタスクベクトルを形成し、そのタスク符号化品質がICLタスク性能を予測するかを検討する。
私たちの経験的洞察は、その表現を通じて、大きな言語モデルの成功と失敗モードの理解を深めました。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:55:12 GMT)
Quantifying Misattribution Unfairness in Authorship Attribution [18.1] 著者のミスアトリビューションは、現実の生活に重大な影響を及ぼす可能性がある。
著者帰属システムに対する標準的な評価基準は、この公正性の概念を明示的に考慮していない。
著者が書いたテキストの上位kにどのくらいの頻度でランク付けされているかに基づいて、単純な測度であるMisattribution Unfairness Index (MAUIk)を導入する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 23:28:24 GMT)
The Complexity of Sequential Prediction in Dynamical Systems [18.1] 進化関数が未知のとき,力学系の次の状態を予測するための学習の課題について検討する。
実現可能な設定では、時間的地平線(英語版)の偶数増加関数(英語版)により誤りの総数が増加することが示される。
対照的に、一般に研究されているマルコフ的後悔の概念の下では、可能なレートは$Theta(T)$と$tildeTheta(sqrtT)$のみである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:07:59 GMT)
Towards Collaborative Anti-Money Laundering Among Financial Institutions [18.0] ルールベースの手法が最初に導入され、現在でも現在の検知システムで広く使われている。
実際には、マネーロンダリングは通常複数の金融機関にまたがる。
複数の施設におけるマネーロンダリング対策を支援するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:06:01 GMT)
EGA-V1: Unifying Online Advertising with End-to-End Learning [17.9] EGA-V1は、オンライン広告ランキングを一つのモデルとして統一するエンドツーエンドの生成アーキテクチャである。
EGA-V1はカスケードステージを1つのモデルに置き換え、完全な候補広告コーパスから最適な広告シーケンスを直接生成する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:46:57 GMT)
Two-Stage Learning of Stabilizing Neural Controllers via Zubov Sampling and Iterative Domain Expansion [17.9] 連続時間システムのための制御器とリアプノフ関数を協調的に合成する新しい2段階学習フレームワークを提案する。
SMTソルバに頼ってリアプノフ条件を正式に検証する既存のシステムとは異なり、最先端のニューラルネットワーク検証器$alpha,!
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:20:09 GMT)
When LLMs Team Up: The Emergence of Collaborative Affective Computing [17.8] 本調査は, Affective Computing (AC) におけるLarge Language Models (LLMs) ベースのコラボレーションシステムの概要を概観することを目的とする。
LLMは、感情的な理解と生成タスクに対する統一的なアプローチを提供し、動的でリアルタイムな相互作用の可能性を高める。
この研究は、ACのLLMと協調的なインテリジェンスを体系的に探求する最初のものであり、人間のようなソーシャルインテリジェンスにアプローチするより強力なアプリケーションへの道を開いた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:00:54 GMT)
DNTextSpotter: Arbitrary-Shaped Scene Text Spotting via Improved Denoising Training [17.7] 任意のテキストスポッティングのための新しいDenoising Training(DNTextSpotter)を提案する。
DNTextSpotterは、denoising部のクエリをノイズのある位置クエリとノイズのあるコンテンツクエリに分解する。
4つのベンチマークで最先端の手法よりも優れています。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:53:59 GMT)
BOPO: Neural Combinatorial Optimization via Best-anchored and Objective-guided Preference Optimization [17.7] 目的値を介して解の選好を利用する訓練パラダイムであるBOPO(Best-anchored and Objective-Guided Preference Optimization)を提案する。
ジョブショップ問題(JSP)、トラベルセールスマン問題(TSP)、フレキシブルジョブショップスケジューリング問題(FJSP)の実験は、BOPOが最先端のニューラルメソッドより優れていることを示している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:44:17 GMT)
From Turbulence to Tranquility: AI-Driven Low-Altitude Network [17.7] 低高度経済(LAE)ネットワークは、都市移動、緊急対応、航空ロジスティクスにおいてトランスフォーメーションの可能性を秘めている。
これらのネットワークは、スペクトル管理、干渉緩和、動的およびリソース制約された環境におけるリアルタイム調整において重大な課題に直面している。
本研究では、機械学習に基づくスペクトルセンシングと共存、人工知能(AI)最適化資源割り当てと軌道計画、テストベッド駆動検証と標準化の3つの要素を探索する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:12:44 GMT)
Fast and Robust Rotation Averaging with Anisotropic Coordinate Descent [17.6] 我々は、異方性回転平均化の最適性、堅牢性、効率のギャップを埋める。
提案アルゴリズムは,移動データセットの公開構造上での最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:55:02 GMT)
RoToR: Towards More Reliable Responses for Order-Invariant Inputs [17.5] リストワイズ入力に対する言語モデル(LM)の位置バイアスの緩和は、よく知られた重要な問題である。
位置IDの変更を最小限に抑えた真の順序不変入力のためのゼロショット不変LMであるRoToRを提案する。
Selective Routing を用いた RoToR は,ゼロショット方式で実用的なリストワイズ入力タスクを効果的に処理できることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:54:00 GMT)
Hierarchical Retrieval with Evidence Curation for Open-Domain Financial Question Answering on Standardized Documents [17.5] 標準化されたドキュメントは、反復的なボイラープレートテキストや同様のテーブル構造など、同様のフォーマットを共有している。
この類似性により、従来のRAGメソッドは、ほぼ重複したテキストを誤識別し、精度と完全性を損なう重複検索につながる。
本稿では,これらの問題に対処するためのEvidence Curationフレームワークを用いた階層検索手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:12:15 GMT)
The Dual Power of Interpretable Token Embeddings: Jailbreaking Attacks and Defenses for Diffusion Model Unlearning [17.5] 本稿では,解釈可能なアタックトークンの埋め込みを学習するアタック手法を提案する。
攻撃トークンの埋め込みは、テキストプロンプト、初期ノイズ、未学習モデル間で転送可能である。
我々は、未学習モデルと既存のジェイルブレイク攻撃の両方から保護する防衛方法を開発した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:10:29 GMT)
Exploring Flow-Lenia Universes with a Curiosity-driven AI Scientist: Discovering Diverse Ecosystem Dynamics [17.4] 連続セルオートマトン(CA)を用いたフローレニアにおけるシステムレベルダイナミクスの自動発見法を提案する。
この方法は、CAの進化的・生態系的ダイナミクスの自己組織化につながる過程を明らかにすることを目的としている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:48:26 GMT)
A Dual-Directional Context-Aware Test-Time Learning for Text Classification [17.4] 動的双方向エルマン注意ネットワーク(DBEAN)を提案する。
DBEANは双方向の時間的モデリングと自己注意を組み合わせる。
クリティカルな入力セグメントを動的に重み付けし、計算効率を維持する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:47:08 GMT)
Trajectory First: A Curriculum for Discovering Diverse Policies [17.3] 多様な方法でタスクを解くことができるため、エージェントはタスクのバリエーションに対してより堅牢になり、局所最適性が低下する。
多様なエージェントを並列に訓練する強力な強化学習フレームワークとして、制約付き多様性最適化が登場した。
ステップベースの政策を学習する前に,まず軌道レベルを探索するカリキュラムを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:47:51 GMT)
From Real World to Logic and Back: Learning Generalizable Relational Concepts For Long Horizon Robot Planning [17.2] 人間は限られたデモンストレーションから効率的に一般化するが、ロボットは学習した知識を複雑で目に見えないタスクに移すことに苦慮している。
ロボットが無意味で無意味なデモの小さなセットから直接、自律的にリレーショナル概念を発明できる最初の方法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:06:25 GMT)
When LLMs Play the Telephone Game: Cultural Attractors as Conceptual Tools to Evaluate LLMs in Multi-turn Settings [17.1] 大規模言語モデル(LLM)は相互に相互作用し、オンラインで大量のテキストを生成する。
単一の出力レベルで無視される小さなバイアスは、反復的なインタラクションで増幅されるリスクである。
テキスト毒性, 肯定性, 難易度, および伝達鎖間の長さの進化を追跡することにより, バイアスやアトラクタの存在を明らかにする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:34:39 GMT)
Unsupervised Rhythm and Voice Conversion to Improve ASR on Dysarthric Speech [17.1] 変形性関節症に対する音声変換法について検討し,ASRの性能改善について検討した。
音節に基づくリズムモデリング手法を導入することにより、リズム・アンド・ボイス(RnV)変換フレームワークを拡張した。
Torgoコーパスの実験により,LF-MMIが単語誤り率の大幅な低減を実現していることが明らかになった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:57:36 GMT)
Retrieval-Augmented Generation with Estimation of Source Reliability [17.0] Reliability-Aware RAG (RA-RAG) は複数のソースの信頼性を推定し、この情報を検索プロセスと集約プロセスの両方に組み込む。
異質なソース信頼性を持つ実世界のシナリオを反映したベンチマークを導入する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:34:14 GMT)
Social Cooperation in Conversational AI Agents [17.0] これらの課題は、人間の社会的知性を明示的にモデル化することで克服できると我々は主張する。
人間がコミュニケーションするために使用する戦略を数学的にモデル化し、長期間にわたって互いに推論することで、我々は新しいゲーム理論の目的を導き出すことができるかもしれない。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:02:36 GMT)
Tug-of-war between idiom's figurative and literal meanings in LLMs [17.0] 非構成的比喩的意味はしばしばイディオムの解釈から強く分かれる。
この双対性は、比喩的な意味でイディオムを解釈する2つの意味の表現と決定を学習するモデルを必要とする。
我々は、機械的解釈可能性のツールを用いて、大きな事前訓練された因果変換器がこの曖昧さにどう対処するかを追跡する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:29:46 GMT)
ShapeLLM-Omni: A Native Multimodal LLM for 3D Generation and Understanding [17.0] ShapeLLM-Omniは、任意のシーケンスで3Dのアセットとテキストを理解し、生成できる3Dの大規模言語モデルである。
3D対応離散トークンに基づいて、3D-Alpacaという大規模連続トレーニングデータセットを革新的に構築する。
我々の研究は、基本的な3D機能を備えたマルチモーダルモデルを効果的に拡張する試みであり、将来の3DネイティブAIの研究に寄与する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:40:50 GMT)
Agentic Episodic Control [16.9] 強化学習(RL)は、ゲームプレイから科学的発見、AIアライメントに至るまで、AIのブレークスルーを推進してきた。
近年の進歩は、豊かな世界知識と推論能力を持つ大規模言語モデルが、意味的状態モデリングとタスクに依存しない計画を可能にすることで、RLを補完する可能性があることを示唆している。
本稿では,RLを大規模言語モデルと統合して意思決定を促進する新しいアーキテクチャであるエージェント・エピソディクス・コントロール(AEC)を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:57:37 GMT)
DualMap: Online Open-Vocabulary Semantic Mapping for Natural Language Navigation in Dynamic Changing Scenes [16.7] DualMapは、ロボットが動的に変化する環境を理解し、ナビゲートできるオンラインのオープン語彙マッピングシステムである。
提案するハイブリッドセグメンテーションとオブジェクトレベルのステータスチェックにより,従来の手法が必要とする3Dオブジェクトのマージが不要になる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:59:10 GMT)
MOSS: Multi-Objective Optimization for Stable Rule Sets [16.6] 安定な決定ルールセットを構築するための多目的最適化フレームワークであるMOSSを提案する。
MOSSは、予測性能と安定性の両方の観点から、最先端のルールアンサンブルよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:20:12 GMT)
Principal-Agent Bandit Games with Self-Interested and Exploratory Learning Agents [16.5] 本研究では,エージェントが武器を弾くためのインセンティブを提案することで,主役が未知の環境と間接的に対話する繰り返しプリンシパル・エージェント・バンディットゲームについて検討する。
既存の作業の多くは、エージェントが報酬手段について十分な知識を持っていると仮定し、常に欲張りに振る舞うが、多くのオンラインマーケットプレースでは、エージェントは未知の環境を学び、時には探索する必要がある。
そこで我々は,報酬推定を反復的に更新する探索行動を持つ自己関心学習エージェントをモデル化し,推定報酬プラスインセンティブを最大化するアームを選択するか,一定の確率で任意に探索するアームを選択する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:32:57 GMT)
Adversarial Inception Backdoor Attacks against Reinforcement Learning [16.4] 最近の研究は、訓練時間、バックドア中毒に対するDeep Reinforcement Learning (DRL)アルゴリズムの脆弱性を実証している。
本稿では,厳格な報酬制約の下で,DRLに対する新たなバックドア攻撃法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:41:35 GMT)
Learning Actionable Counterfactual Explanations in Large State Spaces [16.3] 実世界の行動に根ざした3つの談話型を紹介する。
高レベル連続(emphhl-continuous)、高レベル離散(emphhl-discrete)、高レベルID(emphhl-id)CFE。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:35:54 GMT)
Does Time Have Its Place? Temporal Heads: Where Language Models Recall Time-specific Information [16.3] テンポラルヘッド(英: Temporal Head)は、主に時間的知識を扱う特定のアテンションヘッドである。
これらのヘッドの値を調整することで、時間的知識をどのように編集できるかを実証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:47:44 GMT)
Asymptotically exact variational flows via involutive MCMC kernels [16.1] Involutive MCMCカーネルから,チューニング不要で,表現的に正確な変動フローを構築するための一般的なレシピを提案する。
これにより、証明可能な全変分収束を持つ3つの新しい変分族が導かれる。
後続近似,モンテカルロ推定,正規化定数推定など,タスク間のフローの競合性能を実証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:44:35 GMT)
A Survey of 3D Reconstruction with Event Cameras [16.1] イベントカメラはスパースで時間的に密度の高いデータストリームを生成し、堅牢で正確な3D再構成を可能にする。
これらの能力は、自律運転、ロボティクス、空中ナビゲーション、没入型バーチャルリアリティーなど、さまざまな分野にまたがるトランスフォーメーションアプリケーションに対して、大きな保証を提供する。
本調査は, イベント駆動型3D再構築における最先端技術に向けた, 明確かつモチベーションの高いロードマップを提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:47:02 GMT)
Enhancing Interpretable Image Classification Through LLM Agents and Conditional Concept Bottleneck Models [16.0] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、画像分類を解釈可能で人間可読な概念によって管理されるプロセスに分解する。
環境フィードバックに応答してコンセプトバンクを調整する動的エージェントベースのアプローチを導入する。
また,従来のCBMの概念スコアリング機構の限界を克服するために,条件付き概念ボトルネックモデル(CoCoBM)を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:25:52 GMT)
E^2GraphRAG: Streamlining Graph-based RAG for High Efficiency and Effectiveness [15.8] 本稿では,グラフベースのRAGフレームワークであるE2GraphRAGを提案する。
E2GraphRAGはGraphRAGの最大10倍のインデックス化を実現し、LightRAGの100倍の高速化を実現している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:43:01 GMT)
DiffVLA: Vision-Language Guided Diffusion Planning for Autonomous Driving [15.8] VLM(Vision-Language Model)による新しいハイブリッドスパース距離拡散政策を提案する。
提案手法は,現実的,反応的な合成シナリオを含む自律的グランドチャレンジ2025において,優れた性能を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:51:36 GMT)
MASt3R-SLAM: Real-Time Dense SLAM with 3D Reconstruction Priors [15.8] 我々はMASt3Rからボトムアップを設計したリアルタイム単分子高密度SLAMシステムを提案する。
本システムは固定カメラモデルやパラメトリックカメラモデルでは仮定しないが,Wild ビデオシーケンス上では堅牢である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:44:10 GMT)
Representations of Fact, Fiction and Forecast in Large Language Models: Epistemics and Attitudes [15.8] 合理的な話者は、自分が知っていること、知らないことを知っていなければならない。
現在の大規模言語モデルでは、不確実な実環境における事実の評価と信頼性に基づいて、対応する発話を生成することが依然として課題である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:19:42 GMT)
Achieving Dimension-Free Communication in Federated Learning via Zeroth-Order Optimization [15.7] 本稿では,クライアント間のスカラー値を一定数送信することで,通信コストを$mathscrO(d)$から$mathscrO(d)$に削減する新しい通信アルゴリズムであるDeComFLを提案する。
古典的なディープラーニングトレーニングと大規模言語モデルの微調整の両方を含む経験的評価は、通信オーバーヘッドを大幅に削減することを示している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 23:58:41 GMT)
MixFlows: principled variational inference via mixed flows [15.7] MixFlowsは、初期参照分布に対するマップの繰り返し適用の混合からなる、新しいバリエーションファミリである。
また,MixFlowsは,フローマップがエルゴード的かつ測度保存的である場合にMCMCライクな収束を保証することを示す。
また,不正確な離散化ハミルトン力学と決定論的運動量リフレッシュを併用したMixFlowの実装も開発した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:06:57 GMT)
RADAR: Enhancing Radiology Report Generation with Supplementary Knowledge Injection [15.6] Radarは、補助的な知識注入による放射線学レポート生成を強化するためのフレームワークである。
まず、専門家のイメージベースの分類出力と整合したモデルから取得した知識を抽出する。
その後、関連する補足的知識を取得して、この情報をさらに強化する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:56:06 GMT)
AdaRewriter: Unleashing the Power of Prompting-based Conversational Query Reformulation via Test-Time Adaptation [15.6] AdaRewriterは、テスト時間適応による結果管理報酬モデルを用いたクエリ再構成のための新しいフレームワークである。
AdaRewriterは、ほとんどの設定で既存のメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:18:26 GMT)
SPEAR: Security Posture Evaluation using AI Planner-Reasoning on Attack-Connectivity Hypergraphs [15.6] SPEARは、セキュリティ姿勢評価と分析のためのツールサポートを備えたフォーマルなフレームワークである。
ネットワークシステムにおける脆弱性とコンフィギュレーションをモデル化するために、AI計画の因果形式を使用する。
ドメインの専門家に理解可能な方法で提示できる、さまざまなセキュリティ強化戦略のセットを特定します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:38:47 GMT)
Large Language and Reasoning Models are Shallow Disjunctive Reasoners [15.6] 大規模言語モデル(LLM)は、体系的な推論に苦慮している。
本稿では,定性的空間的および時間的推論のための体系的関係合成を必要とするタスクに焦点をあてる。
ゼロショット LRM はシングルパス推論タスクでは LLM よりも優れていますが,マルチパス設定では苦労しています。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:37:39 GMT)
EnigmaToM: Improve LLMs' Theory-of-Mind Reasoning Capabilities with Neural Knowledge Base of Entity States [15.6] 理論-オブ-ミンド(ToM)は人間の相互作用の基本であるが、Large Language Models (LLMs) の課題は残る。
Enigma(エニグマ)の神経知識ベースを統合することでToM推論を強化する新しいニューロシンボリックフレームワークであるEnigmaToMを提案する。
ToMi, HiToM, FANToM ベンチマークによる実験結果から, EnigmaToM は様々な大きさの LLM における ToM 推論を大幅に改善することが示された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:15:13 GMT)
Efficiency without Compromise: CLIP-aided Text-to-Image GANs with Increased Diversity [15.5] テキスト・ツー・イメージ・タスクに適応したスライシング・アディバーショナル・ネットワーク(SAN)を用いた2つの特殊識別器を提案する。
提案手法はSCADと呼ばれ,より優れたサンプル忠実度を持つ与えられたプロンプトに対する多様性の顕著な向上を示す。
SCADは、最新の大規模GANと競合するゼロショットFIDを2桁の訓練コストで達成した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:54:41 GMT)
Unpacking Softmax: How Temperature Drives Representation Collapse, Compression, and Generalization [15.5] モデルの表現を形作る際に,ソフトマックス関数が果たす重要な役割について検討する。
ランク欠陥バイアスという概念は、ソフトマックスに基づくディープネットワークがクラス数よりもはるかに低いランクの解を見出す現象である。
本研究では,ソフトマックスのダイナミックスを利用して圧縮表現を学習するか,あるいはアウト・オブ・ディストリビューションデータ上での性能を向上させるかを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:38:10 GMT)
Detoxification of Large Language Models through Output-layer Fusion with a Calibration Model [15.4] 既存のLarge Language Model (LLM) の解毒法は、大規模な非毒性または人為的な嗜好データに基づく訓練に依存している。
生成パイプラインの軽量な介入により目標LSMの解毒過程を導出する,コンパクトで事前訓練された校正モデルを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:36:32 GMT)
The Landscape of Arabic Large Language Models (ALLMs): A New Era for Arabic Language Technology [15.4] アラビア世界は、アラビア語固有の大規模言語モデルを開発する上で、異なる課題に直面している。
本稿では、ALMの発端から現在までの軌跡について考察する。
また、アラブ世界におけるALLMの課題と機会についても論じる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:45:19 GMT)
SpeechVerifier: Robust Acoustic Fingerprint against Tampering Attacks via Watermarking [15.3] 本稿では,公開音声のみを用いて,音声の整合性を積極的に検証するSpeechVerifierを提案する。
音声フィンガープリントと透かしにインスパイアされたSpeechVerifierは、(i)効果的に改ざん攻撃を検知し、(ii)良性操作に頑健であり、(iii)公開音声のみに基づいて整合性を検証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:22:08 GMT)
Logits are All We Need to Adapt Closed Models [15.2] アプリケーション固有のコンテンツ生成に向けて,ブラックボックス大言語モデルを操るトークンレベルの確率再重み付けフレームワークを提案する。
このようなアクセスが利用可能であれば、迅速なエンジニアリングを超えて、より強力な適応技術を可能にするだろう、と私たちは主張する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:53:46 GMT)
Confidence-Aware Self-Distillation for Multimodal Sentiment Analysis with Incomplete Modalities [15.2] マルチモーダル感情分析は、マルチモーダルデータを通して人間の感情を理解することを目的としている。
既存のモダリティの欠如を扱う方法は、データ再構成や共通部分空間投影に基づいている。
マルチモーダルな確率的埋め込みを効果的に組み込んだ信頼性認識型自己蒸留(CASD)戦略を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:48:41 GMT)
Mixed-View Panorama Synthesis using Geospatially Guided Diffusion [15.1] 混合ビューパノラマ合成の課題を紹介する。
目標は、小さな入力パノラマセットと、その地域の衛星画像が与えられた新しいパノラマを合成することである。
混合ビュー設定は、世界中の任意の場所でパノラマ合成をサポートするのに最も自然であると主張する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:43:53 GMT)
SALAD: Systematic Assessment of Machine Unlearing on LLM-Aided Hardware Design [15.0] 大規模言語モデル(LLM)は、ハードウェア設計自動化のための変換機能を提供する。
LLMは、Verilog評価データ汚染、知的財産権(IP)設計リーク、悪意のあるVerilog生成のリスクなど、重要なデータセキュリティ上の課題を提起する。
SALADは、機械学習を利用してこれらの脅威を緩和する包括的アセスメントである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:59:08 GMT)
PIP: Perturbation-based Iterative Pruning for Large Language Models [15.0] PIP (Perturbation-based Iterative Pruning) は,大規模言語モデルを最適化する新しい二重ビュー構造化プルーニング手法である。
勾配差の計算により、PIPはこれらの2つの見解の区別に苦慮している人たちを反復的に引き起こす。
実験の結果,PIPは元のモデルの精度の85%以上を維持しつつ,パラメータ数を約20%削減できることがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:12:41 GMT)
MAGIK: Mapping to Analogous Goals via Imagination-enabled Knowledge Transfer [14.9] 強化学習エージェントは通常、新しいタスクが以前に学習したタスクと構造的類似性を共有する場合であっても、広範囲な再訓練を必要とする。
我々は、RLエージェントがターゲット環境と対話することなく、類似したタスクに知識を伝達できる新しいフレームワークMAGIKを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:01:14 GMT)
Unveiling Audio Deepfake Origins: A Deep Metric learning And Conformer Network Approach With Ensemble Fusion [14.9] 本研究は, 深度多値Nペア損失と実効強調, フェイク分散フレームワークを組み合わせた新しい音源追跡システムを提案する。
本稿では,Frechet Distanceと標準メトリクスを用いて提案手法の評価を行い,ベースラインシステム上でのソーストレースにおける優れた性能を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:42:09 GMT)
RePaViT: Scalable Vision Transformer Acceleration via Structural Reparameterization on Feedforward Network Layers [14.9] 我々は、注意層ではなく、フィードフォワードネットワーク(FFN)層が視覚変換器(ViT)の推論遅延の主な要因であることを明らかにした。
本研究では,テスト中の効率的なFFN層に対するポストトレーニング後構造的再パラメータ化を容易にする新しいチャネルアイドル機構を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:39:14 GMT)
Quantitative Error Feedback for Quantization Noise Reduction of Filtering over Graphs [14.8] 本稿では,分散グラフフィルタリングにおける量子化雑音の低減を目的とした,革新的な誤りフィードバックフレームワークを提案する。
これは状態空間デジタルフィルタの誤差スペクトル形成技術に由来するため、異なる領域にわたる量子化フィルタリングプロセス間の接続を確立する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:57:04 GMT)
Learning a Neural Solver for Parametric PDE to Enhance Physics-Informed Methods [14.8] データに基づいて訓練された物理インフォームド反復アルゴリズムを用いて偏微分方程式(PDE)の解法を学習することを提案する。
本手法は,各PDEインスタンスに自動的に適応する勾配降下アルゴリズムの条件付けを学習する。
複数のデータセットに対する経験的実験を通じて,本手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:52:50 GMT)
Neuron Empirical Gradient: Discovering and Quantifying Neurons Global Linear Controllability [14.7] ニューロン実験勾配(NEG)は,活性化の変化が予測にどのように影響するかを捉える。
また, NEGは, スキルニューロン探索により, 多様なプロンプトにまたがる言語スキルを効果的に捉えていることを示す。
さらに分析は、効率性、堅牢性、柔軟性、相互依存といった、NEGベースのスキル表現の重要な特性を強調している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:01:12 GMT)
Benford's Curse: Tracing Digit Bias to Numerical Hallucination in LLMs [14.6] 大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な性能を示すが、基本的な数値問題ではしばしば失敗する。
ベンフォードの法則に触発されて、ウェブコレクトされたコーパスにおける長い尾の桁の分布は、事前学習中にLLMによって学習される可能性があると仮定する。
オープンソースのLLMはベンフォードの法則に類似した、一貫した桁偏差パターンを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:44:30 GMT)
Macroscopic entanglement of three magnon modes in three cavities via optical parametric amplifier [14.4] 3つのキャビティ系において3つのマグノンモードの2部および三部を交互に生成する手法を提案する。
絡み合いは浴槽温度に対して頑丈である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:28:17 GMT)
Rig3R: Rig-Aware Conditioning for Learned 3D Reconstruction [14.3] マルチカメラリグからのエージェントポーズと3Dシーン構造の推定は、自律運転などのAIアプリケーションにおいて中心的なタスクである。
リグ構造を組み込んだ事前マルチビュー再構成モデルの一般化であるRig3Rを導入する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:15:00 GMT)
Turning to Online Forums for Legal Information: A Case Study of GDPR's Legitimate Interests [14.2] オンラインサービスやツールを構築する実践者は、しばしば法的なガイダンスのためにReddit、Law Stack Exchange、Stack Overflowといったオンラインフォーラムに目を向ける。
本研究は,実践者がオンラインフォーラムを用いて,実践において正当な利益を付与する上で,共通の混乱領域を特定する方法を検討するものである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:16:01 GMT)
MLLMs Need 3D-Aware Representation Supervision for Scene Understanding [14.1] 3DRSは、事前訓練された3D基礎モデルから監督を導入することでMLLM 3D表現学習を強化するフレームワークである。
本手法は3次元モデルから抽出したリッチな3次元知識とMLLMの視覚的特徴を一致させ,シーン理解を効果的に改善する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:58:24 GMT)
Mitigating Data Poisoning Attacks to Local Differential Privacy [14.1] 本稿では,新しい防御機能群を含む一般的な周波数推定のための包括的緩和フレームワークを提案する。
そこで本研究では,ウシの報告を正確に識別する新たな手法を提案する。
攻撃行動がステルス化し、悪意のあるユーザを直接フィルタリングするのは難しい場合、隠れた敵のパターンを効果的に認識できる検出法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:37:15 GMT)
WHEN TO ACT, WHEN TO WAIT: Modeling Structural Trajectories for Intent Triggerability in Task-Oriented Dialogue [13.9] タスク指向対話システムは、ユーザ発話が意味的に完全であるように見えるが、適切なシステムアクションに必要な構造情報がない場合、しばしば困難に直面する。
我々は、UserLLMとAgentLLMの対話を通して非対称情報ダイナミクスをモデル化するフレームワークSTORMを提案する。
コントリビューションには,(1)対話システムにおける非対称情報処理の形式化,(2)協調理解の進化をモデル化する意図形成,(3)タスクパフォーマンスとともに内部認知改善を測定する評価指標などが含まれている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:11:10 GMT)
Frugal Machine Learning for Energy-efficient, and Resource-aware Artificial Intelligence [13.8] FML(Frugal Machine Learning)とは、機械学習(ML)モデルを設計するプラクティスである。
FMLの戦略は、入力自由度、学習プロセス自由度、モデル自由度に大別できる。
この章では、FMLの最近の進歩、応用、オープンな課題について説明する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:56:21 GMT)
SMOTE-DP: Improving Privacy-Utility Tradeoff with Synthetic Data [13.7] 合成データ生成の適切なメカニズムにより、大きなユーティリティ損失を伴わずに、強力なプライバシ保護を実現することができることを示す。
我々は,このSMOTE-DP技術が,堅牢なプライバシ保護を保証するだけでなく,下流学習タスクにおいて有効性を維持する合成データを生成することを理論的および実証的な実証を通じて証明した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:27:10 GMT)
Automatic Stage Lighting Control: Is it a Rule-Driven Process or Generative Task? [13.7] 本稿では、経験豊富な照明技術者であるSkip-BARTから学ぶエンドツーエンドのソリューションを提案する。
提案手法では,BARTモデルを用いて音声を入力とし,光色と値(強度)を出力として生成し,新しいスキップ接続機構を組み込む。
定量的解析と人的評価の両面から,Skip-BARTが従来のルールベース手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:42:36 GMT)
Enhancing Biomedical Multi-modal Representation Learning with Multi-scale Pre-training and Perturbed Report Discrimination [13.7] 大規模にラベル付けされていないバイオメディカルイメージで事前訓練された視覚言語モデルは、一般化可能な意味表現を学ぶ。
本稿では,事前学習型バイオメディカルビジョン言語モデルのための新しい手法,摂動レポート識別法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:23:25 GMT)
STORM: Benchmarking Visual Rating of MLLMs with a Comprehensive Ordinal Regression Dataset [13.6] STORMは、ユニバーサルビジュアルレーティングのためのMLLMの信頼に値する順序回帰能力を刺激するためのデータ収集とベンチマークである。
本稿では,ラベル候補を動的に考慮し,解釈可能な思考を提供する粗大な処理パイプラインを提案する。
本ベンチマークは,MLLMのオールインワンおよびゼロショット性能を,評価ラベルの基本的な共通順序関係の理解を必要とするシナリオで評価することを目的とする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:48:15 GMT)
Humans Coexist, So Must Embodied Artificial Agents [13.6] 共存は、人間との長期的、その間における相互作用の前提条件である。
我々は,人工知能コミュニティが共存するエンボディエージェントを開発するための重要な研究指針を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:32:56 GMT)
CONFETTI: Conversational Function-Calling Evaluation Through Turn-Level Interactions [13.6] 大規模言語モデル(LLM)の機能呼び出し機能と応答品質を評価するための対話型ベンチマークを提案する。
CONFETTIはこのギャップを109の人間シミュレーションによる会話を通じて解決し、313のユーザターンと86のAPIをカバーする。
我々は、一連の最先端のLCMを評価し、利用可能なAPIの数、会話の長さ、連鎖関数呼び出しについて、それらの性能を分析した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:48:11 GMT)
RARE: Retrieval-Augmented Reasoning Enhancement for Large Language Models [13.5] RARE(Retrieval-Augmented Reasoning Enhancement)は相互推論フレームワーク(rStar)の汎用的拡張である
これは、コモンセンスや医学的推論といった複雑な知識集約的なタスクに対して、大規模言語モデル(LLM)の推論精度と事実整合性を高めることを目的としている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:40:21 GMT)
MentalChat16K: A Benchmark Dataset for Conversational Mental Health Assistance [13.4] MentalChat16Kは、人工的なメンタルヘルスカウンセリングデータセットと匿名化されたテキストのデータセットを組み合わせた、英国のベンチマークデータセットである。
このキュレートされたデータセットは、対話型メンタルヘルス支援のための大規模言語モデルの開発と評価を容易にするように設計されている。
データセットは患者のプライバシ、倫理的考慮、責任あるデータの使用を優先する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:53:02 GMT)
Who is Helping Whom? Analyzing Inter-dependencies to Evaluate Cooperation in Human-AI Teaming [13.3] 本研究では,人間とエージェントの協力関係を評価するための重要な指標として,建設的相互依存の概念を提案する。
その結果,訓練されたエージェントは高いタスク報酬を得られるが,協調行動の誘発には失敗していることがわかった。
分析の結果,チームリングのパフォーマンスは必ずしもタスク報酬と相関していないことが明らかとなり,タスク報酬だけでは協調を確実に測定できないことがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:06:41 GMT)
Robust Federated Learning against Noisy Clients via Masked Optimization [13.2] 本研究では,この複雑なラベルノイズ問題に対処するための2段階最適化フレームワークMaskedOptimを提案する。
第1段階は、ラベルノイズ率の高いノイズの多いクライアントの検出を容易にするように設計されている。
第2段階では、ノイズの多いクライアントのデータのラベルをエンドツーエンドのラベル修正メカニズムで修正することに焦点を当てている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:35:42 GMT)
PAIR-Net: Enhancing Egocentric Speaker Detection via Pretrained Audio-Visual Fusion and Alignment Loss [13.2] エゴセントリックビデオにおけるアクティブな話者検出(ASD)は、不安定な視点、動きのぼやけ、オフスクリーン音声源などによる固有の課題を提示する。
本稿では,部分的に凍結したWhisperオーディオエンコーダと,微調整されたAV-HuBERTビジュアルバックボーンを統合する効果的なモデルであるPAIR-Netを紹介する。
実世界の自我中心の条件下では,事前学習音声の付加価値とアライメントに基づくアライメント・ベース・フュージョンが重要である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:49:52 GMT)
INVARLLM: LLM-assisted Physical Invariant Extraction for Cyber-Physical Systems Anomaly Detection [13.2] サイバー物理システム(CPS)は、物理法に違反しているサイバー物理攻撃に対して脆弱である。
大規模言語モデル(LLM)を用いて,CPS文書から意味情報を抽出し,物理的不変量を生成するハイブリッドフレームワークを提案する。
このアプローチは、LLMセマンティック理解と経験的検証を組み合わせて、解釈可能性と信頼性の両方を保証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:27:40 GMT)
Flow2Code: Evaluating Large Language Models for Flowchart-based Code Generation Capability [13.2] Flow2Codeは、フローチャートベースのコード生成評価のための新しいベンチマークである。
評価は15言語にまたがっており、コード、プログラミング、擬似コードという3つのタイプの16,866のフローチャートに合わせた5,622のコードセグメントを含んでいる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:48:57 GMT)
Retrieval-Augmented Generation of Ontologies from Relational Databases [13.2] 本稿では、RDBオントロジーの検索拡張反復生成であるRIGORについて述べる。
リレーショナルを人間の最小限の労力でリッチスキーマに変換するアプローチが紹介されている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:10:05 GMT)
Should Decision-Makers Reveal Classifiers in Online Strategic Classification? [13.1] エージェントの現在の分類器へのアクセス制限が意思決定者のパフォーマンスに与える影響について検討する。
この設定では、意思決定者は、完全な知識設定よりも多くの間違いを発生させる。
以上の結果から,分類器へのアクセスを控えることによって,意思決定者のパフォーマンスを低下させる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:53:49 GMT)
SPACE: Your Genomic Profile Predictor is a Powerful DNA Foundation Model [13.1] ゲノムプロファイル予測のための教師付きトレーニングは、純粋なシークエンス事前学習の代替としてより効果的であることを示す。
我々のモデルは最先端のパフォーマンスを達成し、教師付きゲノムプロファイルで訓練されたDNAモデルが強力なDNA表現学習者として機能することを確立した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:23:05 GMT)
An Accurate and Efficient Vulnerability Propagation Analysis Framework [13.1] ソフトウェアサプライチェーンにおける脆弱性の影響範囲と進化を定量化する新しい手法を提案する。
Java Mavenエコシステムで私たちのアプローチのプロトタイプを実装し、100の現実世界の脆弱性で評価します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:55:45 GMT)
Which Factors Make Code LLMs More Vulnerable to Backdoor Attacks? A Systematic Study [12.9] 本研究は, バックドアの有効性に影響する要因を系統的に検討し, 脅威の程度を把握している。
非常に低い毒殺率で攻撃が効果的でないという、圧倒的な合意が間違っていることが分かっています。
本研究は, 極めて低毒率設定に対する防衛機構の緊急性を強調した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:07:34 GMT)
Beyond Pretty Pictures: Combined Single- and Multi-Image Super-resolution for Sentinel-2 Images [12.9] SEN4Xは、シングルイメージとマルチイメージの利点を組み合わせたハイブリッド超解像度アーキテクチャである。
センチネル2の画像を2.5mの地中サンプリング距離にアップグレードする。
最先端の超高解像度ベースラインよりも性能が大幅に向上することがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:11:16 GMT)
Zero-Shot Text-to-Speech for Vietnamese [12.8] PhoAudiobookはベトナム語による音声合成のための991時間の高品質なオーディオを含むデータセットである。
我々は、VALL-E、VoiceCraft、XTTS-V2の3つの主要なゼロショットTSモデルについて実験を行った。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:07:06 GMT)
Exchangeability in Neural Network Architectures and its Application to Dynamic Pruning [12.7] NNにおけるパラメータと中間値の対称性を,交換確率の統計的性質を用いて定式化する。
原理的動的プルーニングアルゴリズム ExPrune を導出し, 入力毎の対称性誘起冗長性を除去する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:50:15 GMT)
Learning Abstract World Models with a Group-Structured Latent Space [12.7] 学習された遷移モデルの表現多様体に幾何的事前を課すことができるかを示す。
実験により、これは完全な非構造的アプローチよりも潜伏遷移モデルのより良い予測に繋がることを示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:43:18 GMT)
A Descriptive and Normative Theory of Human Beliefs in RLHF [12.6] 我々は,訓練対象者の能力に対する人間の信念も,嗜好生成において重要な役割を担っていることを示唆する。
人工的な実験を通して、人間の嗜好ラベル付け者がエージェントの最適性を仮定することがしばしば最適であることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:52:55 GMT)
In-context learning and Occam's razor [12.6] 我々はオッカムのカミソリと文脈内学習の関連を描いている。
特に,テキスト内学習者の訓練に使用される次点の予測損失は,事前符号化と呼ばれるデータ圧縮手法と直接的に等価であることを示す。
我々の理論と実証実験は、文脈内学習の規範的な説明を提供するだけでなく、現在の文脈内学習手法の欠点を解明する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:26:31 GMT)
Recent Developments in GNNs for Drug Discovery [12.6] 計算薬物発見におけるグラフニューラルネットワーク(GNN)の最近の展開と役割を概観する。
この領域の最近の展開を要約することで、GNNが複雑な分子パターンを理解する能力を強調します。
本稿は、この重要な研究領域における、簡単な議論と共通する傾向をまとめてまとめてまとめる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:24:05 GMT)
Motion aware video generative model [12.5] 拡散に基づくビデオ生成は、視覚内容とセマンティックコヒーレンスに前例のない品質をもたらす。
現在のアプローチは、基礎となる運動物理学を明示的にモデル化することなく、統計的学習に依存している。
本稿では、物理インフォームド周波数領域を用いて、生成したビデオの物理的妥当性を高める手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:42:54 GMT)
Adaptive Destruction Processes for Diffusion Samplers [12.4] 本稿では,拡散サンプリング装置におけるトレーニング可能な破壊プロセスの課題とメリットについて考察する。
ステップ数に制限がある場合、生成過程と破壊過程の両方を訓練することで、より高速な収束とサンプリング品質の向上が期待できる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:07:27 GMT)
VM14K: First Vietnamese Medical Benchmark [12.4] 最初のベトナムの医療質問ベンチマークでは、34の医療専門分野に14,000の多重選択質問が提供されている。
本ベンチマークは,精査試験や臨床記録など,様々な検証可能な資料を用いて構築した。
この設計により、対象言語における言語モデルの医学的理解の幅と深さを評価することができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:32:15 GMT)
R-LoRA: Randomized Multi-Head LoRA for Efficient Multi-Task Learning [12.4] Low-Rank Adaptation (LoRA)は、低ランク行列による重み更新を近似することにより、コスト効率のよいソリューションを提供する。
マルチタスク学習におけるLoRAの能力を高めるために,マルチヘッドランダム化を取り入れたR-LoRAを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:26:07 GMT)
When Lower-Order Terms Dominate: Adaptive Expert Algorithms for Heavy-Tailed Losses [12.4] 我々は、損失の範囲や第2モーメントに関する事前知識を必要としない適応アルゴリズムを開発する。
既存の適応アルゴリズムは、通常、彼らの後悔の保証において下位項と見なされるものを持っている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:29:05 GMT)
Random Policy Evaluation Uncovers Policies of Generative Flow Networks [12.3] Generative Flow Network(GFlowNet)は、エージェントがポリシーとフロー関数を学習する確率的フレームワークである。
本稿では,GFlowNetsとRLの最も基本的なコンポーネントであるポリシー評価の基本的な関係を明らかにする。
本稿では,GFlowNetsと同様の報酬マッチング効果を達成できる修正ランダムポリシー評価アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:26:49 GMT)
CVC: A Large-Scale Chinese Value Rule Corpus for Value Alignment of Large Language Models [12.2] 本研究では,中国中核値に基づく階層的価値枠組みを提案し,主次元3,コア値12,派生値50を包含する。
我々は,人間のアノテーションによって拡張・拡張された25万以上の値規則を含む大規模中国価値コーパス(CVC)を構築した。
われわれの研究は、中国の特徴を表す総合的な価値評価とアライメントのための文化的適応型ベンチマークフレームワークを確立する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:56:59 GMT)
Argument-Centric Causal Intervention Method for Mitigating Bias in Cross-Document Event Coreference Resolution [12.2] クロスドキュメントイベント参照解決(CD-ECR)は、複数のドキュメントにまたがるイベントの言及が、同じ実世界の出来事を指すかどうかを判断する。
本稿ではArgument-Centric Causal Intervention(ACCI)に基づく新しい手法を提案する。
ACCIは、引き起こし語摂動の因果的影響を定量化する反ファクト的推論モジュールと、意味論的根拠のある情報に対する高い感度を促進するために、引数認識拡張モジュールを統合する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:46:59 GMT)
Neural Topic Modeling with Large Language Models in the Loop [12.1] 大規模言語モデル(LLM)とニューラルトピックモデル(NTM)を統合する新しいフレームワークを提案する。
既存の多くのNTMに組み込む柔軟性により,学習トピックや文書表現におけるNTMの効率を保ちながら,トピックの解釈可能性を高めることができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:21:35 GMT)
Transformers as Multi-task Learners: Decoupling Features in Hidden Markov Models [12.1] トランスフォーマーベースのモデルは、幅広いタスクにわたってシーケンス学習において顕著な能力を示している。
マルチタスク一般化能力の基盤となるメカニズムを明らかにするために,トランスフォーマーの階層的挙動について検討する。
我々の明示的な構成は経験的観察と密接に一致し、様々なタスクにわたるシーケンス学習におけるトランスフォーマーの有効性と効率の理論的支援を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:39:31 GMT)
Alignment as Distribution Learning: Your Preference Model is Explicitly a Language Model [12.1] 人間のフィードバックからの強化学習によるアライメントは理論的正当性に欠け、決定論的解のインセンティブを与える。
本稿では, 優先最大推定, 優先蒸留, 逆KL最小化の3つの基本学習目標を提案する。
我々は、我々の分布学習フレームワーク、特に嗜好蒸留が、RLHFとDPOのパフォーマンスを一貫して上回るか、あるいは一致しているかを実証的に示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:36:31 GMT)
Quantum Speedups for Bayesian Network Structure Learning [12.0] ノードが$n$のネットワークの場合、最も高速な既知のアルゴリズムは、最悪の場合は$O(2nn2)$で実行され、20年で改善はない。
量子コンピューティングの最近の進歩に触発されて、ある定数$c$が2ドル以下であれば、時間$O(cn)$で量子アルゴリズムによって解けるかどうかを問う。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:23:07 GMT)
Stress-Testing ML Pipelines with Adversarial Data Corruption [11.9] 規制当局は現在、ハイテイクシステムは現実的で相互依存的なエラーに耐えられるという証拠を要求している。
SAVAGEは依存性グラフとフレキシブルな汚いテンプレートを通じて、データ品質の問題を正式にモデル化するフレームワークです。
Savanageは、脆弱性のあるデータサブポピュレーションと微調整による汚職の深刻度を効率的に識別するために、双方向の最適化アプローチを採用している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:41:24 GMT)
Sounding Like a Winner? Prosodic Differences in Post-Match Interviews [11.9] 本研究では,試合後テニス面接における勝ち負けに関連する韻律的特徴について検討した。
ピッチや強度などの韻律的要素を分析することで、選手が試合に勝ったか負けたかを判断する。
その結果,SSL表現が勝敗を効果的に区別できることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:45:39 GMT)
Bayes optimal learning of attention-indexed models [11.9] 本稿では,深い注意層における学習を解析するための理論的枠組みであるAIMを紹介する。
ベイズ最適一般化誤差に対する閉形式予測を導出し、鋭い位相遷移を同定する。
本稿では, 近似メッセージパッシングアルゴリズムを提案し, 降下勾配が最適性能に達することを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:11:26 GMT)
Machine-Learned Sampling of Conditioned Path Measures [11.8] 本稿では,一般的な事前プロセス下での後方経路測度からサンプリングするアルゴリズムを提案する。
得られたアルゴリズムは理論的に接地されており、ニューラルネットワークとシームレスに統合して、対象の軌道アンサンブルを学習することができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:25:03 GMT)
HoH: A Dynamic Benchmark for Evaluating the Impact of Outdated Information on Retrieval-Augmented Generation [11.8] Retrieval-Augmented Generation (RAG) は、知識の陳腐化問題に対処するための効果的なアプローチとして登場した。
時代遅れの情報がRAGに与える影響を評価するために特別に設計された最初のベンチマークであるHoHを紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:39:49 GMT)
Robust Multimodal Learning via Cross-Modal Proxy Tokens [11.7] クロスモーダルプロキシトークン(CMPT)は、明示的なモダリティ生成や補助的ネットワークを必要とすることなく、欠落したモダリティのクラストークンを近似する。
フリーズユニモーダルエンコーダに低ランクアダプタを使用し、タスク固有の損失を伴うアライメント損失を共同で最適化する。
我々の手法は、堅牢なマルチモーダル学習のための柔軟で効率的なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:21:11 GMT)
Understanding Overadaptation in Supervised Fine-Tuning: The Role of Ensemble Methods [11.7] 監視された微調整は、基礎モデルを専門的なタスクに適応するための支配的なアプローチである。
視覚モデルでは、事前訓練されたモデルと微調整されたモデルを組み合わせることでこの問題を軽減することが示されている。
アンサンブルモデルは基礎モデルからの一般的な知識を保持するだけでなく、微調整されたドメイン自体においても、微調整されたモデルよりも優れる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:23:16 GMT)
Motion-compensated cardiac MRI using low-rank diffeomorphic flow (DMoCo) [11.7] 自由呼吸および非ゲート型3次元心臓磁気共鳴イメージング(MRI)のための教師なしモーション補償画像再構成アルゴリズム
静止画像テンプレートの変形として,各動き位相に対応する画像量を表現する。
より拘束された運動モデルでは、現在の3次元シネMRIの動作補償アルゴリズムと比較して回復性の向上が期待できる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:13:13 GMT)
CNNSum: Exploring Long-Context Summarization with Large Language Models in Chinese Novels [11.6] CNNSumは,中国小説をベースとした多スケール長文要約ベンチマークである。
CNNSumは4つのサブセットにまたがって、合計695のサンプルで、長さは16kから128kである。
我々は、多数のLCMをベンチマークし、異常な出力タイプを要約するために詳細な人間の評価を行う。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:31:07 GMT)
VRD-IU: Lessons from Visually Rich Document Intelligence and Understanding [11.6] Visually Rich Document Understanding (VRDU)は、文書インテリジェンスにおいて重要な分野として登場した。
フォームライクなドキュメントは、複雑なレイアウト、マルチステークホルダーの関与、高い構造的多様性のために、ユニークな課題を提起します。
VRD-IUコンペティション(VRD-IUコンペティション)は、マルチフォーマットフォームからキー情報を抽出し、ローカライズすることに焦点を当てている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:28:28 GMT)
SeaSplat: Representing Underwater Scenes with 3D Gaussian Splatting and a Physically Grounded Image Formation Model [11.6] 本研究では,最近の3次元放射場の発展を生かした水中シーンのリアルタイムレンダリングを可能にするSeaSplatを紹介する。
SeaSplatを、アメリカ領ヴァージン諸島の水中車両が収集したSeaThru-NeRFデータセットの現実世界のシーンに適用する。
水中画像形成はシーン構造を学習し, 深度マップを改良し, 3次元ガウス表現の活用による計算精度の向上を図った。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:45:29 GMT)
NepTrain and NepTrainKit: Automated Active Learning and Visualization Toolkit for Neuroevolution Potentials [11.5] トレーニングデータセットの初期化と管理に特化したNepTrainKitとNepTrainKitを開発しました。
NepTrainはオープンソースのPythonパッケージで、非物理的構造を識別・削除するための結合長フィルタリングメソッドを備えている。
NepTrainKitは、NEPトレーニングデータセット用に特別に設計されたGUIソフトウェアである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:56:11 GMT)
ResearchCodeBench: Benchmarking LLMs on Implementing Novel Machine Learning Research Code [11.4] 大規模言語モデル(LLM)は、機械学習の研究を変革する上で有望であることを示しているが、最近の研究論文から新しいアイデアを忠実に実装する能力は、事前学習の残余が不明である。
我々は、LLMの最先端MLコントリビューションを上位2024~2025研究論文から実行可能なコードに変換する能力を評価する、212のコーディング課題のベンチマークであるResearchCodeBenchを紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 23:04:12 GMT)
The Ultimate Test of Superintelligent AI Agents: Can an AI Balance Care and Control in Asymmetric Relationships? [11.3] シェパードテストは、超知能人工エージェントの道徳的および関係的な次元を評価するための新しい概念テストである。
私たちは、AIが知的エージェントを操作、育む、そして機器的に使用しない能力を示すときに、重要な、潜在的に危険な、知能のしきい値を越えることを主張する。
これには、自己利益と従属エージェントの幸福の間の道徳的なトレードオフを評価する能力が含まれる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:53:56 GMT)
Whale: Large-Scale multilingual ASR model with w2v-BERT and E-Branchformer with large speech data [11.2] 本稿では,大規模音声認識モデルWhaleの開発について報告する。
WhisperやOWSMのようなモデルと同様に、Whaleは大きなモデルサイズと多種多様なデータセットの両方を活用している。
Librispeechテストクリーンセットでワードエラー率2.4%、CSJ eval3で文字エラー率3.4%、Whisper large-v3とOWSM v3.1を上回っている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:52:50 GMT)
A Closer Look at the Existing Risks of Generative AI: Mapping the Who, What, and How of Real-World Incidents [11.1] 我々は、生成的AI障害に特化して分類を構築し、それらが引き起こす害にマッピングする。
本報告では、各種類の害、基礎となる障害モード、害のあるステークホルダー、およびそれらの共通する共起事故の頻度について報告する。
私たちの仕事は、政策立案者、開発者、ジェネレーティブAIユーザに実用的な洞察を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:08:46 GMT)
Scalable Multi-Robot Informative Path Planning for Target Mapping via Deep Reinforcement Learning [11.1] マルチロボットインフォーマティブパス計画問題に対する深層強化学習手法を提案する。
ここでは、各ロボットが発見した目標を最大化し、未知の静的障害物を回避し、ロボット同士の衝突を防ぐ。
提案手法は、発見対象数において、最先端のアプローチを少なくとも26.2%上回っている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:56:43 GMT)
Fact-Checking of AI-Generated Reports [11.1] 本稿では,関連画像を用いたAI生成レポートのファクトチェック手法を提案する。
具体的には,本研究は,実文と偽文とを区別し,実文と偽文とを関連づけることによって,実文と偽文とを区別する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:45:38 GMT)
Comparing LLM-generated and human-authored news text using formal syntactic theory [11.1] この研究は、ニューヨーク・タイムズ風のテキストを6つの大きな言語モデルで生成したテキストと、実際の人間によるNYTの文章とを総合的に比較した初めてのものである。
テキストの文法構造を解析するために,ヘッド駆動のフレーズ構造文法を用いる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:04:34 GMT)
FLEX: A Large-Scale Multi-Modal Multi-Action Dataset for Fitness Action Quality Assessment [11.0] AQA(Action Quality Assessment)は、人間の行動の質を定量化し、フィードバックを提供する技術である。
本研究では,表面筋電図(SEMG)信号をAQAに組み込んだ最初のマルチモーダル・マルチアクション・大規模データセットであるFLEXデータセットを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:44:02 GMT)
GFlowNet Training by Policy Gradients [11.0] 我々は,従来の強化学習(RL)において,GFlowNetのフローバランスを保ち,期待される累積報酬を最適化する,ポリシーに依存した新たなGFlowNetトレーニングフレームワークを提案する。
これにより,新しいポリシベースのGFlowNetトレーニング手法の導出が可能になる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:04:59 GMT)
TAG-INSTRUCT: Controlled Instruction Complexity Enhancement through Structure-based Augmentation [10.9] 本稿では,構造化セマンティック圧縮と制御難易度増大による命令複雑性を向上させる新しいフレームワークであるTAG-INSTRUCTを提案する。
解析の結果,TAG-INSTRUCTは異なる命令合成フレームワーク間の制御性と安定性に優れることがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:00:28 GMT)
Learning Sparsity for Effective and Efficient Music Performance Question Answering [10.9] 本稿では,音楽AVQAに特化して設計されたスパース学習フレームワークであるSparsifyを紹介する。
3つのスパーシフィケーション戦略をエンドツーエンドパイプラインに統合し、Music AVQAデータセット上で最先端のパフォーマンスを達成する。
訓練時間の28.32%削減し、精度を保ちながら完全に訓練された高密度なものと比較して、明確な効率向上を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:02:03 GMT)
Red-Teaming LLM Multi-Agent Systems via Communication Attacks [10.9] 大規模言語モデルに基づくマルチエージェントシステム(LLM-MAS)は、メッセージベースのコミュニケーションを通じて高度なエージェント協調を可能にすることで、複雑な問題解決能力に革命をもたらした。
エージェント・イン・ザ・ミドル(AiTM, Agent-in-the-Middle)は、エージェント間メッセージのインターセプトと操作によってLLM-MASの基本的な通信機構を利用する新たな攻撃法である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:51:09 GMT)
Elucidating the representation of images within an unconditional diffusion model denoiser [10.9] 生成拡散モデルは、ノイズ除去のためにトレーニングされたニューラルネットワークを用いてスコアを推定することにより、多様な画像データセット上の確率密度を学習する。
本稿では,その内部表現とスコアの計算をよりよく理解するために,ImageNetデータセットをデノナイズするために訓練されたUNetについて検討する。
UNetの中間ブロックは、個々の画像を活性チャネルのスパース部分集合に分解し、これらのチャネルの空間平均のベクトルは、基礎となるクリーン画像の非線形表現を提供することができることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:33:34 GMT)
Black-Box Crypto is Useless for Pseudorandom Codes [10.8] 擬似乱数符号(英: pseudorandom code)は、任意の数の符号化が任意の計算上の有界敵に対してランダムに現れるという性質を持つ鍵付き誤り訂正スキームである。
ランダムエラーの一定率を許容するコードの疑似ランダム性は、ほぼすべての汎用暗号プリミティブに対するブラックボックスの削減に基づいてはならないことを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:41:08 GMT)
Optimus: Accelerating Large-Scale Multi-Modal LLM Training by Bubble Exploitation [10.8] マルチモーダル大言語モデル(MLLM)は、大規模言語モデル(LLM)を複数のデータタイプに拡張した。
既存のシステムは、GPUバブルによるMLLMのトレーニングに非効率である。
本稿では,エンドツーエンドのMLLMトレーニング時間を短縮する分散MLLMトレーニングシステムOptimusを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:02:34 GMT)
The Actor-Critic Update Order Matters for PPO in Federated Reinforcement Learning [10.7] 我々は、異なるクライアントからの批判者の分散を取り除くために、更新順序(まずアクタ、次に批判)を反転させるFedRACを提案する。
実験結果から,提案アルゴリズムはより高い累積報酬を得て,より高速に5つの実験に収束することが示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:20:22 GMT)
Client Selection for Federated Policy Optimization with Environment Heterogeneity [10.7] 政策反復(PI)は、強化学習(RL)の多くのアルゴリズムに影響を与えた。
本稿では,Approximate PI (API) のフェデレーションバージョンを調査し,そのエラー境界を導出する。
環境の不均一性に起因する追加近似誤差を軽減するために,クライアント選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:16:31 GMT)
$Ψ$-Sampler: Initial Particle Sampling for SMC-Based Inference-Time Reward Alignment in Score Models [10.5] スコアベース生成モデルとの推論時間報酬アライメントは、大きな注目を集めている。
我々は、pCNLに基づく初期粒子サンプリングを組み込んだSMCベースのフレームワークである$Psi$-Samplerを紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:02:33 GMT)
Inverse Design in Distributed Circuits Using Single-Step Reinforcement Learning [10.5] DCIDAは、ターゲット転送関数のほぼ最適設計サンプリングポリシーを学習する設計探索フレームワークである。
本実験では,DCIDA の Transformer ベースのポリシネットワークが設計誤差を大幅に低減することを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:31:52 GMT)
Assumption-free stability for ranking problems [10.5] 例えば、候補リストの上位k$項目を選択したり、集合内の全ての項目の完全なランキングを取得するなどである。
これらの問題はしばしば不安定であり、ノイズの多いデータからランクを推定すると、小さな摂動に対して高い感度を示す。
安定したランク付けを実現するための2つの新しいランク付け演算子を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:02:13 GMT)
GRAM: Generative Recommendation via Semantic-aware Multi-granular Late Fusion [10.5] 本稿では,セマンティック・アウェア・マルチグラニュラ・レイトフュージョンを用いたジェネレーティブ・レコメンダを提案する。
まず、暗黙的な階層的・協調的な項目関係を符号化する意味-語彙変換を設計する。
第2に,情報損失を最小限に抑えたリッチなセマンティクスを効率的に統合する多粒ラテックフュージョンを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:42:46 GMT)
The Hitchhikers Guide to Production-ready Trustworthy Foundation Model powered Software (FMware) [10.4] ファンデーションモデル(FM)は、これらのFMをコアコンポーネントとして統合するシステムであるFMwareを有効にすることで、ソフトウェア産業を変革している。
KDD 2025のチュートリアルでは、課題のキュレートされたカタログと実世界の生産上の懸念を組み合わせた、FMwareの総合的な探索について紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:08:34 GMT)
Implicit Reasoning in Transformers is Reasoning through Shortcuts [10.4] テストタイム計算は、言語モデルの複雑な多段階推論機能を強化するための新しいパラダイムとして登場しつつある。
マルチステップタスクにおいて,言語モデルがどのように暗黙的推論を行うかを検討する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:06:31 GMT)
K12Vista: Exploring the Boundaries of MLLMs in K-12 Education [10.3] 提案するK12Vistaは,中国語の教科知識理解と推論のための,最も包括的なマルチモーダルベンチマークである。
K12Vistaは、小学校から高校までの5つの中核教科に33,000の質問と3つの質問タイプがある。
また、推論プロセスと解答正当性の両方を総合的に評価する高度なプロセス評価モデルであるK12-PEMを開発した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:46:38 GMT)
Forcrat: Automatic I/O API Translation from C to Rust via Origin and Capability Analysis [10.2] ライブラリ機能の重要なサブセットであるI/O APIを置き換えることに重点を置いています。
本稿では,2つの静的解析手法,起点解析と機能解析,エラーソース解析を提案し,その結果を用いてI/O APIを置き換える。
提案手法は,(1)変換後にテストスイートをパスした32プログラム,(2)14秒で422kLOCを効率よく解析,変換し,(3)広く適用でき,I/O APIコールの82%を置き換える。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:34:06 GMT)
Enhancing GOP in CTC-Based Mispronunciation Detection with Phonological Knowledge [10.1] 本稿では,音素クラスタと一般的な学習者誤りに基づく音素置換を制限したアライメントフリーGOPを提案する。
子どもと成人の音声を含む2つのL2英語音声データセット、My Pronunciation Coach (MPC) とSpeechOcean762についてGOPを評価した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:45:29 GMT)
Generating Diverse Challenging Terrains for Legged Robots Using Quality-Diversity Algorithm [10.1] ロボットをテストし、その脆弱性を発見するには、多様で困難な地形を生成する必要がある。
本稿では,足歩行ロボットの弱点を明らかにするために,多種多様な地形を創出する品質多様性フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:44:58 GMT)
ExpertLongBench: Benchmarking Language Models on Expert-Level Long-Form Generation Tasks with Structured Checklists [10.0] 本稿では、9つのドメインから11のタスクを含むエキスパートレベルのベンチマークであるExpertLongBenchを紹介する。
各タスクには、ドメインの専門家が設計または検証したルーリックが含まれており、タスク要求を特定し、出力評価をガイドする。
ベンチマークで長大モデル出力の正確な評価を支援する評価フレームワークであるCLEARを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:39:02 GMT)
GenDMR: A dynamic multimodal role-swapping network for identifying risk gene phenotypes [10.0] 単一ヌクレオチド多型(SNP)の空間構造をコード化する新しい手法を開発する。
SNPと脳領域の病気リスクを適応的に定量化するために,マルチスタンス・アテンション・モジュールを提案する。
GenDMRはADNI公開データセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:12:53 GMT)
Redundancy, Isotropy, and Intrinsic Dimensionality of Prompt-based Text Embeddings [9.9] Promptベースのテキスト埋め込みモデルは、カスタマイズされたプロンプトを受け取るとタスク固有の埋め込みを生成する。
実験の結果, 埋め込みの次元の25%しか保持しない, 単純な次元削減であっても, 性能はわずかに低下することがわかった。
分類とクラスタリングでは、埋め込みを元の寸法の0.5%未満に減らしても、性能劣化は非常に小さい。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:50:38 GMT)
On the original Ulam's problem and its quantization [9.8] 一般共鳴の下では、古典的部分線型フェルミ・ウラム加速器はその量子化とは大きく異なる挙動を示す。
量子加速器では、エネルギー成長と準エネルギースペクトルの形状との間の直接的および明示的な関係を明らかにする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:49:54 GMT)
Entity Image and Mixed-Modal Image Retrieval Datasets [9.7] 本稿では,画像の検索を厳格に評価するための新しいベンチマークを提案する。
We present two new datasets: the Entity Image dataset (EI), including canonical image for Wikipedia entity and the Mixed-Modal Image Retrieval dataset (MMIR), from the WIT dataset。
我々は,学習コーパスと混合モーダル検索のための評価セットとして,ベンチマークの有用性を実証的に検証した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:04:06 GMT)
Diversity-oriented Data Augmentation with Large Language Models [9.5] 我々はtextbfunderline Di-textbfunderline 指向データ textbfunderlineAugmentation framework (textbfDoAug) を提案する。
具体的には、多様性指向の微調整手法を用いて、多彩なパラフレーズを生成することでテキストデータセットを増強できる多彩なパラフレーズとしてLLMを訓練する。
その結果, ラベルの整合性を維持しつつ, 微調整LDMオーグメンタにより多様性が向上し, 下流タスクの堅牢性と性能が向上することがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:51:20 GMT)
Domain Lexical Knowledge-based Word Embedding Learning for Text Classification under Small Data [9.5] この問題の根本原因は、文脈に基づくBERTのキーワードの埋め込みは、分類のための差別的なテキスト表現を生成するのに十分な差別的でないことである。
この発見を動機として,ドメイン固有の語彙知識を用いて単語埋め込みを強化する手法を開発した。
知識に基づく埋め込み拡張モデルでは、BERTをクラス内の類似性とクラス間の差異を最大化する新しい空間に埋め込む。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:59:41 GMT)
A Platform for Investigating Public Health Content with Efficient Concern Classification [9.5] 本稿では,大規模言語モデルと軽量分類器間の知識伝達のための教師学生向けフレームワークであるAccessScopeを提案する。
ConcernScopeは公衆衛生に関する分類の上に構築されており、大量のファイルをアップロードしたり、特定のURLを自動的にスクラップしたり、直接テキスト編集したりすることができる。
オンラインコミュニティデータセットに見られる共通の関心事の有用な例を見つけるためのガイド付きデータ探索,186,000サンプルの時系列分析による関心事の傾向の同定,重要な出来事の前後における話題頻度の傾向の探索など,このプラットフォームのいくつかの応用例を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:36:13 GMT)
SynthRL: Scaling Visual Reasoning with Verifiable Data Synthesis [9.5] 推論指向RL学習における自動データスケーリングのためのスケーラブルで保証されたパイプラインであるSynthRLを提案する。
実験により,SynthRLのスケーラビリティと有効性を示す。
合成データを用いて訓練されたモデルは、5つの領域外視覚数学推論ベンチマークで一貫したゲインを得る。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:45:16 GMT)
Towards Better Generalization and Interpretability in Unsupervised Concept-Based Models [9.3] 本稿では、LCBM(Learningable Concept-Based Model)という、画像分類のための教師なし概念ベースモデルを提案する。
我々はLCBMが既存の教師なし概念ベースモデルを上回る一般化能力を示し、ブラックボックスモデルの性能とほぼ一致することを示した。
概念埋め込みの利用にもかかわらず、我々は概念の局所的な線形結合によるモデル解釈可能性を維持している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:26:41 GMT)
CoRE: Condition-based Reasoning for Identifying Outcome Variance in Complex Events [9.3] どの潜伏状態が特定の結果をもたらすかを知ることは、複雑な事象の結果に関する主張を批判的に検証するのに有用である。
目標と状態からなる2つの既存のデータセットからアノテーションを合成し、拡張することで、これを処理します。
様々な大きさのオープンかつクローズドなLCMを推論タスクで検討し、すべてのコンテキストが利用可能でない場合、条件が有用であることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:09:20 GMT)
LLM in the Loop: Creating the PARADEHATE Dataset for Hate Speech Detoxification [9.3] 解毒のための高品質な並列データセット、特にヘイトスピーチは、人間のアノテーションのコストと感度のために不足している。
本稿では, GPT-4o-mini を利用した新しいLCM-in-the-loopパイプラインを提案する。
我々は, PARADEHATEを8K以上のヘイト/非ヘイトテキストペアのベンチマークとしてリリースし, 幅広いベースライン手法の評価を行った。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:45:05 GMT)
An Insight into Security Code Review with LLMs: Capabilities, Obstacles, and Influential Factors [9.3] セキュリティコードレビューは時間と労力を要するプロセスです。
既存のセキュリティ分析ツールは、一般化の貧弱、偽陽性率の高い、粗い検出粒度に悩まされている。
大きな言語モデル(LLM)は、これらの課題に対処するための有望な候補と考えられている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:06:31 GMT)
Neuroplastic Expansion in Deep Reinforcement Learning [9.3] 学習エージェントにおける可塑性の喪失は、強化学習における学習と適応を著しく阻害する。
本稿では,認知科学における皮質拡大に触発された新しいアプローチであるニューロプラスティック・エクスパンジョン(NE)を提案する。
NEは、ネットワークを小さな初期サイズからフル次元に動的に拡大することにより、トレーニングプロセス全体を通して学習性と適応性を維持します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:04:04 GMT)
Tomographic Foundation Model -- FORCE: Flow-Oriented Reconstruction Conditioning Engine [9.2] 深層学習はCT画像再構成を著しく進歩させた。
ディープラーニングの手法は、ほぼペアのデータでうまく機能するが、それらは本質的に幻覚のリスクを負う。
我々は新しいCTフレームワークFORCE(Flow-Oriented Restruction Conditioning Engine)を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:25:12 GMT)
Superhuman performance of a large language model on the reasoning tasks of a physician [9.2] 数百人の医師のベースラインに対する難治性臨床症例に対する大規模言語モデル(LLM)の医師評価の結果を報告する。
本研究は, 鑑別診断生成, 診断推論の表示, トリアージ差分診断, 確率的推論, 管理推論の5つの実験を行った。
次に, ボストンにある第3次学術医療センターの救急室で無作為に選択された患者を対象に, 人間の専門家とAIの第2の意見を比較検討した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:29:39 GMT)
SuffixDecoding: Extreme Speculative Decoding for Emerging AI Applications [9.1] 投機的復号化は、大規模言語モデル(LLM)推論の遅延を低減するために広く採用されている。
エージェントフレームワークは、同様のサブタスクを実行するマルチエージェントパイプラインや、アウトプットを反復的に拡張するセルフリファインメントループなど、反復的な推論要求を送信します。
本稿では,効率的な接尾辞木を用いて長いトークン列をキャッシュする新しい手法であるemphSuffixDecodingを紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:27:12 GMT)
On Universality Classes of Equivariant Networks [9.1] 分離制約を超えた同変ニューラルネットワークの近似パワーについて検討する。
分離電力が表現力を完全に捉えていないことを示す。
浅い同変ネットワークが普遍性を達成できるような設定を同定する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:07:52 GMT)
CatCMA with Margin: Stochastic Optimization for Continuous, Integer, and Categorical Variables [9.1] 本研究では,混合可変ブラックボックス最適化(MV-BBO)に焦点を当てる。
連続変数、整数変数、カテゴリー変数に対処する。
混合カテゴリブラックボックス最適化法であるMargin (CatCMAwM) を用いたCatCMAを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:28:33 GMT)
Integrating Neural and Symbolic Components in a Model of Pragmatic Question-Answering [9.0] 本稿では確率論的認知モデルを強化するニューロシンボリックフレームワークを提案する。
認知モデルにニューラルモジュールを組み込むための様々なアプローチについて検討する。
ハイブリッドモデルは、人間の回答パターンを予測する際に、従来の確率モデルの性能と一致したり、超えたりすることができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:34:37 GMT)
Enhancing Sample Generation of Diffusion Models using Noise Level Correction [9.0] 提案手法は, 推定雑音レベルと雑音の真の距離を多様体に合わせることで, サンプル生成を向上する手法である。
具体的には,事前学習した騒音レベル補正ネットワークを導入し,騒音レベル推定を改良する。
実験結果から,本手法は,制約のない生成シナリオと制約のない生成シナリオの両方において,サンプルの品質を著しく向上することが示された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:05:40 GMT)
ViTA-PAR: Visual and Textual Attribute Alignment with Attribute Prompting for Pedestrian Attribute Recognition [9.0] 歩行者属性認識(PAR)は、衣服、アクセサリー、性別などの個人の詳細な属性を特定することを目的としている。
ViTA-PARは4つのPARベンチマークで検証され、効率的な推論で競合性能を達成する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:07:06 GMT)
WoMAP: World Models For Embodied Open-Vocabulary Object Localization [8.9] WoMAP (World Models for Active Perception) はオープン語彙オブジェクトローカライゼーションポリシーをトレーニングするためのレシピである。
我々は,WoMAPがTidyBot上で強力な一般化とsim-to-real転送を実現することを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:35:14 GMT)
Subword models struggle with word learning, but surprisal hides it [8.9] 単語と文字のモデルにおける単語学習を,心理言語学的語彙決定タスクを用いて研究する。
サブワードLMは高い精度で単語や非単語を識別するのに苦労するが、文字LMはこの課題を簡単かつ一貫して解決する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:05:04 GMT)
Bypassing Skip-Gram Negative Sampling: Dimension Regularization as a More Efficient Alternative for Graph Embeddings [8.9] 提案手法は, ノード操作よりもSGNSノードワイド・リパルスの方がスケーラブルであることを示す。
本稿では,SGNSを用いて既存のアルゴリズムのスケーラビリティを向上させるフレキシブルアルゴリズム拡張フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:43:55 GMT)
CCFC: Bridging Federated Clustering and Contrastive Learning [8.8] 本稿では,クラスタコントラスト・フェデレーション・クラスタリング(CCFC)という新しいフェデレーション・クラスタリング手法を提案する。
CCFCは、実用的な観点から、デバイス障害を扱う上で優れた性能を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:36:47 GMT)
Needle: A Generative AI-Powered Multi-modal Database for Answering Complex Natural Language Queries [8.8] マルチモーダルデータセットは、各項目にエンコードされたリッチな情報を適切にキャプチャする詳細な記述を見逃すことが多い。
このドメインでは、複雑な自然言語クエリに答えることが大きな課題になります。
本稿では, 基礎モデルを用いて合成サンプルを生成するモンテカルロ法を提案する。
当社のシステムはオープンソースであり,研究者や開発者が容易に採用できるように設計されている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:22:19 GMT)
BabyLM's First Constructions: Causal interventions provide a signal of learning [8.7] 本研究では,2024年のBabyLMチャレンジから構築学習を評価する。
以上の結果から, 発達的に妥当なデータ量で訓練しても, モデルは多種多様な構成を表わすことが明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:19:38 GMT)
Real-time Adapting Routing (RAR): Improving Efficiency Through Continuous Learning in Software Powered by Layered Foundation Models [8.7] 既存のルーティングモデルは、慎重にキュレートされたデータから最適なルーティング決定を学ぶことに依存する。
本稿では、FMルーティング決定を継続的に適用するためのRAR(Real-time Adaptive Routing)を提案する。
RARは計算コストの高いモデルへの要求を50.2%削減し、一般的な応答品質の90.5%を維持している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:54:12 GMT)
S2A: A Unified Framework for Parameter and Memory Efficient Transfer Learning [8.6] 本研究では,微調整時の活性化のメモリフットプリントを低減するため,新しいPETLフレームワークであるStructure to Activation (S2A)を提案する。
具体的には,1)パラメトリックモデル構造におけるアクティベーションモジュールの設計(バイアス,プロンプト,サイドモジュール)からなり,パラメータやアクティベーションメモリの大幅な削減を実現している。
提案手法は既存のPETL技術よりも優れており,GPUメモリフットプリントの4倍の削減を実現しているだけでなく,可変パラメータの少ない精度で競合性能を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:54:10 GMT)
On the Hardness of Approximating Distributions with Probabilistic Circuits [8.6] 任意の分布を有界$f$-divergenceで近似することは任意のモデルに対して$mathsfNP$-hardであることを示す。
次に、分解可能なPCのクラスとさらに決定論的PCとの近似の指数的なサイズギャップを証明した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:35:07 GMT)
A 2-Stage Model for Vehicle Class and Orientation Detection with Photo-Realistic Image Generation [8.4] この問題に対処するために,光実写画像生成を用いた2段階検出モデルを提案する。
当社のモデルは,車両のクラスと方向を検出するために,主に4つのステップを踏む。
IEEE BigData Challenge 2022 Vehicle Class and Orientation Detection (VOD) の4位にランクインした。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:38:10 GMT)
GrammaMT: Improving Machine Translation with Grammar-Informed In-Context Learning [8.2] GrammaMTは、Interlinear Glossed Text (IGT) を用いた機械翻訳のための文法的に認識可能なプロンプト手法である
GrammaMTは、グロスショット、チェーングロス、モデルグロスの3つのプロンプト戦略を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:23:25 GMT)
Sheep Facial Pain Assessment Under Weighted Graph Neural Networks [8.1] ヒツジが検出した顔のランドマークをリンクし、痛みレベルを定義するために、新しい重み付きグラフニューラルネットワーク(WGNN)モデルを提案する。
YOLOv8n検出器アーキテクチャは、羊の顔のランドマークデータセットで平均平均精度(mAP)が59.30%に達する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:24:09 GMT)
Prediction hubs are context-informed frequent tokens in LLMs [8.1] ハッチネス(Hubness)は、高次元データに標準距離測定を適用する際に生じる、不均等な他の点の最も近い隣人である。
自己回帰型大言語モデル(LLM)は高次元表現で機能するので、それらがハブ性にも影響されるかどうかを問う。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:26:26 GMT)
RadarSplat: Radar Gaussian Splatting for High-Fidelity Data Synthesis and 3D Reconstruction of Autonomous Driving Scenes [8.1] 高忠実度3Dシーン再構成は、既存のデータセットから新たなデータ生成を可能にすることで、自動運転において重要な役割を果たす。
レーダーは、雨や霧、雪など、光学センサーがしばしば苦労する悪天候の状況において、頑丈さのために自律運転に不可欠である。
本稿では,ガウススプラッティングと新しいレーダノイズモデリングを統合し,リアルなレーダデータ合成と3次元再構成を実現するRadarSplatを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:14:27 GMT)
Polishing Every Facet of the GEM: Testing Linguistic Competence of LLMs and Humans in Korean [8.1] KoGEMは韓国のLLMと人間の言語能力を評価するために設計された。
5つの主要なカテゴリと16のサブカテゴリを含む1.5kの多重選択QAペアで構成されている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:27:46 GMT)
Human Heterogeneity Invariant Stress Sensing [8.0] ストレスは身体と精神の健康に影響を与え、ウェアラブルデバイスは生理的信号を通じて日々のストレスを検出するために広く使われてきた。
HHISS(Human Heterogeneity Invariant Stress Sensing)は、ストレス信号における一貫したパターンを見つけるための領域一般化手法である。
HHISSは、トレーニング中に見えない新しい人、環境、ストレスタイプをより正確に行うのに役立つ。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:00:00 GMT)
Brain network science modelling of sparse neural networks enables Transformers and LLMs to perform as fully connected [8.0] 動的スパーストレーニング(DST)は、ANNの計算要求を削減できるが、ピーク性能を高いスパシティレベルに維持することは困難である。
Cannistraci-Hebb training (CHT)は、DSTにおける接続性を高める脳誘発の方法である。
CHTの主な欠点は2つある: (i) 時間複雑性は$O(Nd3)$ - Nノードネットワークサイズ、dノード度 - 超スパースなレシエーションに制限されている。
我々はCHリンク予測のGPUフレンドリな行列ベースの近似を導入し、複雑さを$O(N3)$に減らした。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:19:36 GMT)
Beyond black and white: A more nuanced approach to facial recognition with continuous ethnicity labels [8.0] 我々は,アイデンティティごとの離散値ではなく,連続変数としての民族ラベルの使用を改訂することを提案する。
民族ごとの同一のアイデンティティ数を持つことは、バランスの取れたデータセットを表すものではないことを示す。
65以上の異なるモデルをトレーニングし、オリジナルのデータセットの20以上のサブセットを作成しました。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:49:36 GMT)
Analyzing Character Representation in Media Content using Multimodal Foundation Model: Effectiveness and Trust [8.0] 人口統計次元に沿った文字分布が利用できるとしても、一般大衆にどの程度役に立つのか?
我々の研究は、新しいAIベースの文字表現と可視化ツールを提案しながら、ユーザースタディを通じてこれらの疑問に対処する。
比較言語画像事前学習(CLIP)基盤モデルを用いて視覚的画面データを解析し,年齢と性別の次元で文字表現を定量化する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:46:28 GMT)
VirnyFlow: A Design Space for Responsible Model Development [7.9] VirnyFlowは、データサイエンティストが問題の特定のコンテキストに合わせてMLパイプラインを構築するのを支援するように設計されている。
従来のAutoMLフレームワークとは異なり、VirnyFlowでは、ユーザがカスタマイズされた最適化基準を定義することができる。
VirnyFlowは、5つの実世界のベンチマークにおいて、最適化品質とスケーラビリティの両方で最先端のAutoMLシステムを大幅に上回っていることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:16:48 GMT)
Estimating LLM Consistency: A User Baseline vs Surrogate Metrics [7.9] 大型言語モデル(LLM)は幻覚を起こしやすく、急激な摂動に敏感である。
LLMの一貫性を推定するためのロジットに基づくアンサンブル法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:55:44 GMT)
SpatialLLM: A Compound 3D-Informed Design towards Spatially-Intelligent Large Multimodal Models [7.8] 人間は自然に3D空間の関係を理解し、異なる方向から車両の衝突を予測するような複雑な推論を可能にする。
現在の大型マルチモーダルモデル(LMM)は3次元空間推論の能力を欠いている。
本研究では,高度な3次元空間推論能力を持つ大規模マルチモーダルモデルであるSpatialLLMを紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:45:13 GMT)
Reasoning-Based Approach with Chain-of-Thought for Alzheimer's Detection Using Speech and Large Language Models [7.8] 高齢化に伴い認知症は著しく増加している。
近年の音声モデルと大規模言語モデル(LLM)を用いた研究は認知症診断と治療の新しい可能性をもたらす。
我々のチェーン・オブ・ソート(CoT)推論手法は、音声と言語モデルを組み合わせたものである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:49:48 GMT)
Geometry Meets Incentives: Sample-Efficient Incentivized Exploration with Linear Contexts [7.8] プリンシパルは、自己関心のあるエージェントのシーケンスと対話することで、時間とともに探索し、学習することを目的としている。
この問題に対するインセンティブ互換アルゴリズムの主な課題は、適度な量の初期データを集めることである。
これらの探索障壁は、利用可能な一連の行動において、穏やかな幾何学的条件下で消失することを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:50:00 GMT)
Robust Satisficing Gaussian Process Bandits Under Adversarial Attacks [7.7] そこでは、敵条件下であっても、事前に定義された性能閾値$tau$を一貫して達成することが目標である。
本稿では,頑健な充足の異なる定式化に基づく2つの新しいアルゴリズムを提案し,それらが一般的な頑健な充足フレームワークの例であることを示す。
具体的には、2つの残念な境界を導き出す: 1つは、敵の特定の条件と満足しきい値$tau$を仮定し、もう1つは摂動の規模でスケールするが、敵の仮定を必要としない。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:04:18 GMT)
Learning Optimal Posted Prices for a Unit-Demand Buyer [7.7] 本研究では,単価購入者に対して,個別の商品価値を持つ最適アイテム価格を学習する問題について検討する。
文献では、サンプルアクセスモデルと価格クエリモデルという2つの一般的なクエリモデルについて考察する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:48:12 GMT)
Statement-Tuning Enables Efficient Cross-lingual Generalization in Encoder-only Models [7.5] 大言語モデル(LLM)はゼロショットと少数ショットのタスクで優れているが、エンコーダのみのモデルで同様のパフォーマンスを達成することは困難である。
最近の研究はステートメントチューニングを用いてゼロショットの一般化に適応し、タスクを有限テンプレートに再構成する。
このアプローチを多言語NLPに拡張し、エンコーダがゼロショット言語間一般化を達成できるかどうかを探索する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:28:03 GMT)
FaceCoT: A Benchmark Dataset for Face Anti-Spoofing with Chain-of-Thought Reasoning [7.4] Face Anti-Spoofing (FAS) は、通常、プレゼンテーションアタックに対する防御において、単一の視覚的モダリティに依存する。
FAS用に調整された最初の大規模ビジュアル質問回答(VQA)データセットであるFaceCoTを紹介する。
我々は、データセットを拡張し、アノテーションの品質を高めるために、強化学習により洗練されたキャプションモデルを開発する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:29:41 GMT)
Semantic Palette-Guided Color Propagation [7.3] 従来のアプローチは、ピクセルの類似度を測定するために、色、テクスチャ、明度などの低レベルの視覚的手がかりに依存することが多い。
色伝搬に対する意味論的パレット誘導手法を提案する。
提案手法により,効率よくかつ高精度な画素レベルの色編集が可能となり,局所的な色変化がコンテンツ認識方式で伝播されることが保証される。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:57:34 GMT)
Compiler Optimization via LLM Reasoning for Efficient Model Serving [7.3] 本稿では,コンパイルフレームワーク(REASONING COMPILER)を導入し,最適化を逐次的かつコンテキスト対応な意思決定プロセスとして定式化する。
主要なニューラルネットワークよりもはるかに少ないサンプルで、相当なスピードアップを実現しています。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:02:46 GMT)
NMCSE: Noise-Robust Multi-Modal Coupling Signal Estimation Method via Optimal Transport for Cardiovascular Disease Detection [7.3] 最適輸送理論により分布整合性の問題を再検討するノイズ・ロバスト多モード結合信号推定法(NMCSE)を提案する。
CVD検出では,97.38%の精度と0.98のAUCを達成し,最先端の手法より優れ,実世界の臨床応用において堅牢な性能を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:15:24 GMT)
Why Gradients Rapidly Increase Near the End of Training [7.2] この増加は、体重減少、正規化層、学習率スケジュールの意図しない相互作用によるものであることを示す。
本稿では、この動作を修正しながら、トレーニングを通して損失値の低減を図った簡単な修正を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:51:04 GMT)
Towards Efficient Few-shot Graph Neural Architecture Search via Partitioning Gradient Contribution [7.2] Gradient Contribution (GC) 法は、モジュール間の勾配方向のコサイン類似性を効率的に計算する。
Unified Graph Neural Architecture Search (UGAS)フレームワークはMPNNとGTの最適な組み合わせを探索する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:03:12 GMT)
Wake Vision: A Tailored Dataset and Benchmark Suite for TinyML Computer Vision Applications [7.2] 低消費電力デバイスのためのティニー機械学習(TinyML)は、大規模で高品質なデータセットを作成するための体系的な方法論を欠いている。
プロダクショングレードシステムに適したバイナリ分類データセットを生成するための自動パイプラインを提案する。
対象とする2つのカテゴリにまたがる大規模TinyMLデータセットの自動生成に適用可能性を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:23:34 GMT)
Leveraging Human Production-Interpretation Asymmetries to Test LLM Cognitive Plausibility [7.2] 大規模言語モデルが人間に類似した言語を処理するかどうかを検討する。
いくつかのLCMは、生産と解釈の間に人間のような対称性を定量的に、質的に反映していることがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:07:33 GMT)
TIIF-Bench: How Does Your T2I Model Follow Your Instructions? [7.1] 本稿では, TIIF-Bench (Text-to-Image Instruction following Benchmark) を提案する。
TIIF-Benchは、複数の次元に沿って組織された5000のプロンプトから構成されており、難易度と複雑さの3つのレベルに分類される。
T2Iモデルのテキスト合成精度と美的コヒーレンスを評価するために,テキストレンダリングとスタイル制御という2つの重要な属性が導入された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:44:07 GMT)
Understanding the Identity-Transformation Approach in OIDC-Compatible Privacy-Preserving SSO Services [7.1] OpenID Connect(OIDC)により、市販のブラウザを持つユーザは、別の信頼できるWebシステムに設定されたユーザ名と認証(IdP)によって、Redependent Party(RP)と呼ばれる複数のWebサイトにログインすることができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:11:01 GMT)
PointT2I: LLM-based text-to-image generation via keypoints [7.1] PointT2Iは、プロンプトに記述された人間のポーズと正確に一致するイメージを効果的に生成するフレームワークである。
我々のフレームワークは、微調整なしでキーポイント誘導画像生成にLLMを活用するための最初のアプローチである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:55:20 GMT)
Discriminating Form and Meaning in Multilingual Models with Minimal-Pair ABX Tasks [7.0] 多言語言語モデルが言語アイデンティティ(形式)と意味コンテンツ(意味)をどのように表現するかを評価するために、トレーニング不要なABXスタイルの識別タスクを導入する。
音声処理から着想を得たこれらのゼロショットタスクは、表現の最小差を確実に検出できるかどうかを測定する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:51:26 GMT)
Feature-aware Hypergraph Generation via Next-Scale Prediction [7.0] 本稿では,ハイパグラフトポロジと特徴を協調的に生成する階層的アプローチであるFAHNES(Feature-aware hypergraph generation via next-scale prediction)を紹介する。
FAHNESはノードを粗くすることでマルチスケールの表現を構築し、局所的な拡張と改善によってより微細なレベルを再構築することを学ぶ。
合成ハイパーグラフ,3Dメッシュ,分子データセット上でFAHNESを評価する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:24:08 GMT)
Parallel Repetition for Post-Quantum Arguments [6.9] 公開コイン対話型引数の並列反復は,時間後設定においても指数速度で音質誤差を減少させることを示す。
この結果を一般化して、並列反復検証器が少なくとも$t$の実行を受け入れた場合にのみ受け入れるしきい値検証器の保持を行う。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:36:31 GMT)
Benchmarking 3D Human Pose Estimation Models under Occlusions [6.9] HPE(Human Pose Estimation)は、視覚データから人体上のキーポイントを検出し、位置を特定する。
本稿では,現実的な閉塞条件下での3次元HPEモデルのロバスト性に関するベンチマークを示す。
我々は、畳み込み、トランスフォーマーベース、グラフベース、拡散に基づく9つの最先端2D-to-3D HPEモデルを評価する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:24:00 GMT)
MMD-Flagger: Leveraging Maximum Mean Discrepancy to Detect Hallucinations [6.8] 幻覚コンテンツ,MDD-Flagger をフラグする新しい手法を提案する。
これは分布間の非パラメトリック距離である最大平均離散(MMD)に依存する。
高レベルの観点から、MDD-Flaggerは、生成された文書と様々な温度パラメータで生成された文書の間のMDDを追跡する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:50:58 GMT)
Curriculum Learning with Quality-Driven Data Selection [6.8] OpenAIのGPT-4は、MLLM(Multimodal Large Language Models)の開発に多大な関心を集めている。
画像とテキストの相関とモデルパープレクシリティを利用して、様々な品質のデータを評価し、選択する新しいデータ選択手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:14:22 GMT)
DRAUN: An Algorithm-Agnostic Data Reconstruction Attack on Federated Unlearning Systems [6.8] Unlearning(FU)により、クライアントは、協調的に訓練されたグローバルモデルから特定のデータの影響を取り除くことができる。
悪意のあるサーバは、未学習の更新を利用して削除要求のデータを再構築する。
この研究は、FUシステムで未学習データに対する最初の攻撃フレームワークであるDRAUNを提示する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:20:54 GMT)
Hierarchical Material Recognition from Local Appearance [6.8] 地域の外観から階層的認識のための材料分類を導入する。
分類学クラスの画像と深度マップを組み込んだ多種多様なアプリ内データセットをコントリビュートする。
本稿では,グラフアテンションネットワークに基づく階層的材料認識手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:21:06 GMT)
LLMs as World Models: Data-Driven and Human-Centered Pre-Event Simulation for Disaster Impact Assessment [6.8] 本研究では,複数の大規模言語モデル(LLM)について検討し,地震の影響を推定する。
我々のフレームワークは、ジップコードと郡規模で修正メルカリー強度(MMI)予測を生成する。
2014年ナパ地震と2019年リッジクレスト地震のUSGS'Did You Feel It?
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:07:53 GMT)
Cross-Lingual Transfer of Debiasing and Detoxification in Multilingual LLMs: An Extensive Investigation [6.8] 近年のジェネレーティブ・大型言語モデル(LLM)は英語以外の言語では顕著な性能を示した。
これらの言語で刺激されると、より有害な社会的偏見と毒性のレベルを表現する傾向がある。
異なる微調整法がモデルのバイアスや毒性に与える影響について検討するが、その効果は、流動的で多様なテキストを生成する能力にも及んでいる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:03:39 GMT)
TransAct V2: Lifelong User Action Sequence Modeling on Pinterest Recommendation [6.7] 本稿では,PinterestのHomefeedランキングシステムの生産モデルであるTransAct V2を紹介する。
1) CTR予測を改善するために非常に長いユーザシーケンスを活用すること、2) ユーザアクション予測を改善するためにNext Action Loss関数を統合すること、3) 拡張されたユーザアクションシーケンスの計算要求を処理するように調整されたスケーラブルで低レイテンシなデプロイメントソリューションを採用すること、である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:15:20 GMT)
CleanAgent: Automating Data Standardization with LLM-based Agents [6.7] 異なる列型を標準化するための宣言的で統一されたAPIを備えたPythonライブラリを提案する。
Dataprep.Cleanは、特定のカラムタイプを1行のコードで標準化可能にすることで、コーディングの複雑さを大幅に削減する。
データ標準化プロセスを自動化するために、Dataprep.CleanとLLMベースのエージェントを統合するCleanAgentフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:45:04 GMT)
A personalized time-resolved 3D mesh generative model for unveiling normal heart dynamics [6.6] 心臓左室の形状と運動パターンの分布を学習するための条件付き生成モデルであるMeshHeartを開発した。
MeshHeartに基づいて、3D+t心筋メッシュ配列の潜時空間を調査し、そのパーソナライズされた規範パターンから実際の心臓の偏差を定量化する距離距離測度である潜時デルタを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:43:09 GMT)
Provably Safe Reinforcement Learning from Analytic Gradients [6.5] おそらく安全な強化学習は研究の活発な分野である。
大規模なsim-to-realギャップを防ぐために、トレーニング中にセーフガードを統合する必要がある。
解析勾配に基づく強化学習のための最初の効果的な安全ガードを開発する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:35:03 GMT)
Mind the Gap: A Practical Attack on GGUF Quantization [6.5] 本稿では,学習後量子化手法GGUFの最初の攻撃について紹介する。
我々は、量子化誤差に基づいて重みを拘束しながら、ターゲットの悪意あるLLMを訓練する。
我々の攻撃は、最も広く使われている訓練後の量子化法が、敵の干渉の影響を受けやすいことを強調している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:21:07 GMT)
FinRobot: Generative Business Process AI Agents for Enterprise Resource Planning in Finance [6.5] 我々は、ERPシステムのための最初のAIネイティブフレームワークを提示し、生成ビジネスプロセスAIエージェントの新しいアーキテクチャを導入する。
提案システムは、生成AIとビジネスプロセスモデリングとマルチエージェントオーケストレーションを統合し、エンドツーエンドの自動化を可能にする。
GBPAは処理時間の最大40%削減、エラー率94%削減、規制コンプライアンスの改善を実現している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:22:28 GMT)
Variational Adaptive Noise and Dropout towards Stable Recurrent Neural Networks [6.5] 本稿では、リカレントニューラルネットワーク(RNN)のための新しい安定学習理論を提案する。
明示的な正規化項を暗黙的な正規化に変換することで、ノイズとドロップアウトを同時に引き出すことができることを示す。
また、RNNの主目的を最適化するために、それぞれのスケールと比率を適切に調整することもできる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:13:22 GMT)
iQUEST: An Iterative Question-Guided Framework for Knowledge Base Question Answering [6.5] iQUESTは、複雑なクエリを単純なサブクエリに繰り返し分解する質問誘導KBQAフレームワークである。
グラフニューラルネットワーク(GNN)を統合して、各推論ステップに2ホップ隣の情報を組み込む。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:30:02 GMT)
SwiftEdit: Lightning Fast Text-Guided Image Editing via One-Step Diffusion [6.4] 我々は,テキスト誘導画像編集を実現するシンプルな,かつ高効率な編集ツールであるSwiftEditを紹介した。
SwiftEditの進歩には、2つの新しいコントリビューションがある。
特にSwiftEditは、従来のマルチステップメソッドよりもはるかに高速な、インスタントテキストガイドの画像編集を可能にする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:59:20 GMT)
Measuring topological invariants of even-dimensional non-Hermitian systems through quench dynamics [6.3] 非エルミート的(NH)トポロジカル不変量(英語版)は、NHトポロジカル位相の研究において中心的な役割を果たす。
等次元系におけるNH位相不変量を直接測定するための一般的な枠組みを提案する。
熱処理後のスピンテクスチャから構築した動的場の巻線パターンからNHトポロジカル不変量を抽出できることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:48:03 GMT)
Quantifying task-relevant representational similarity using decision variable correlation [6.3] 決定相関変数(DVC)を用いた2つの観察者(モデルまたは脳)の意思決定戦略の類似性を特徴付ける新しいアプローチを提案する。
本手法は,サルV4/IT記録と画像分類タスクを訓練したモデルを用いて評価する。
モデル-モデル類似度はサル-モンキー類似度に匹敵するが,モデル-キー類似度は一貫して低く,ImageNet-1kの性能向上とともに低下する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:45:05 GMT)
Neural Variance-aware Dueling Bandits with Deep Representation and Shallow Exploration [6.3] ニューラルネットワークを利用して非線形ユーティリティ関数を近似する分散認識アルゴリズムを提案する。
十分広いニューラルネットワークに対して,我々のアルゴリズムが次数$bigollt(d sqrtsum_t=1T sigma_t2 + sqrtdTrt)のサブ線形累積平均後悔を達成できることを示す理論的保証を確立する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:58:48 GMT)
unMORE: Unsupervised Multi-Object Segmentation via Center-Boundary Reasoning [6.3] 教師なしマルチオブジェクトセグメンテーションは、単一画像において難しい問題である。
本稿では,現実世界の画像中の多くの複雑な物体を識別する新しい2段階パイプラインであるunMOREを紹介する。
本手法は,すべてのベースラインが崩壊する混雑した画像に優れる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:22:51 GMT)
2D Entanglement from a Single Motzkin Spaghetto [6.1] エンタングルメントエントロピーの体積スケーリングを伴う独特な基底状態を有する近傍の2つのサイト間でのみ相互作用する2次元格子系を提案する。
テンソルネットワーク表現は、低い階数を持つテンソルで構成され、同様の大域幾何学を持つ。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:00:00 GMT)
Cross-Institutional Dental EHR Entity Extraction via Generative AI and Synthetic Notes [6.1] 本研究は, 未構造化テキストから診断情報を抽出することにより, 歯科記録に欠落する構造データの問題に対処する。
我々は、GPT-4を利用した高度なAIおよびNLP手法を用いて、RoBERTaモデルの微調整のための合成ノートを生成する。
2つのデータセットからランダムに選択した120個の臨床ノートを用いてモデルの評価を行い,診断精度の向上を実証した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:52:22 GMT)
From Features to Structure: Task-Aware Graph Construction for Relational and Tabular Learning with GNNs [6.1] タスク対応グラフ拡張のための統合フレームワークであるauGraphを紹介する。
auGraphは、属性をノードに選択的にプロモートすることで、ベースグラフ構造を強化する。
タスク関連構造信号を注入しながら、元のデータスキーマを保存する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:42:53 GMT)
The Promise of Spiking Neural Networks for Ubiquitous Computing: A Survey and New Perspectives [6.1] スパイキングニューラルネットワーク(SNN)は、低消費電力計算を実現するためにスパースでイベント駆動のシグナリングを利用する、バイオインスパイアされたネットワークのクラスとして登場した。
ユニークで有望な機能にもかかわらず、SNNは限定的な注目を集め、ユビキタスコンピューティングコミュニティ内では未探索のままである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:47:48 GMT)
Policy Newton Algorithm in Reproducing Kernel Hilbert Space [6.1] カーネルヒルベルト空間(RKHS)の再生に代表されるRLポリシーに特化して設計された最初の2次最適化フレームワークであるPolicy Newtonを紹介する。
本手法は,立方体正規化補助目的関数を最適化することにより,逆ヘッセン作用素の直接計算を回避できる。
おもちゃの金融資産配分問題に関する実証評価は、これらの理論的性質を検証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:32:52 GMT)
Speed-up of Vision Transformer Models by Attention-aware Token Filtering [6.1] 本稿では, 注意認識トークンフィルタリング(ATF)と呼ばれる, ViT モデルのための新しい高速化手法を提案する。
ATFは、新しいトークンフィルタリングモジュールとフィルタリング戦略の2つの主要なアイデアで構成されている。
ATFは、検索リコール率を維持しながら、ViTモデルであるSigLIPの2.8倍のスピードアップを提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:34:55 GMT)
SafeOR-Gym: A Benchmark Suite for Safe Reinforcement Learning Algorithms on Practical Operations Research Problems [6.0] SafeOR-Gymは、複雑な制約下での安全なRLに適した、9つのオペレーションリサーチ(OR)環境のベンチマークスイートである。
各環境は、コストベースの制約違反によって特徴づけられる現実的な計画、スケジューリング、制御の問題を捉えます。
我々はこれらの環境にまたがって、最先端の安全RLアルゴリズムをいくつか評価し、幅広い性能を明らかにした。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:59:45 GMT)
Gradient-Based Model Fingerprinting for LLM Similarity Detection and Family Classification [6.0] 大規模言語モデル(LLM)は、現代のアプリケーションにおいて重要なソフトウェアコンポーネントである。
類似性検出と家族分類のための勾配型フィンガープリントフレームワークGuardを提示する。
本稿では,ランダムな入力摂動に対する応答を解析することにより,モデル固有の行動シグネチャを抽出する。
広く採用されているセーフテンソルフォーマットをサポートし、勾配特性の統計解析を通じて高次元指紋を構築する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:08:01 GMT)
Common Corpus: The Largest Collection of Ethical Data for LLM Pre-Training [6.0] 言語モデル事前学習のための最大のオープンデータセットであるCommon Corpusを紹介する。
データセットには、ヨーロッパの主要言語から、事前トレーニングデータセットにはほとんど存在しない低リソース言語まで、さまざまな言語が含まれている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:43:15 GMT)
Principled data augmentation for learning to solve quadratic programming problems [6.0] 線形プログラム(LP)や二次プログラム(QP)のためのL2O(Learning-to-Optimize Method)が注目を集めている。
MPNNはそのような最適化問題を解決するために軽量でデータ駆動のプロキシを約束する。
しかし、堅牢なMPNNはデータスカース設定では依然として困難である。
この研究は、MPNNを通じてQP用に調整されたデータ拡張に対する原則的なアプローチを導入している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:40:18 GMT)
T-SHIRT: Token-Selective Hierarchical Data Selection for Instruction Tuning [6.0] Token-Selective HIeRarchical Data Selection for Instruction Tuning (T-SHIRT)は、新しいデータ選択フレームワークである。
我々は、キュレートされたデータセットでチューニングされたモデルが、大規模データセット全体においてトレーニングされたモデルよりも優れていることを実証した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:59:17 GMT)
Efficient Generative Modeling with Residual Vector Quantization-Based Tokens [5.9] ResGenは、高速サンプリングによる高忠実度生成のための効率的な残留ベクトル量子化に基づく生成モデルである。
我々は,ImageNet 256x256における条件付き画像生成とゼロショット音声合成の2つの課題に対して,提案手法の有効性と一般化性を検証する。
RVQの深さを拡大するにつれて、我々の生成モデルは、同様の大きさのベースラインモデルと比較して、より優れた生成忠実度またはより高速なサンプリング速度を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:03:20 GMT)
Improving Transformer World Models for Data-Efficient RL [5.9] 本稿では, Craftax-classicベンチマークにおいて, アートパフォーマンスの新たな状態を実現するためのモデルベースRLへのアプローチを提案する。
このアルゴリズムは, わずか1Mの環境ステップで69.66%の報酬を達成し, 53.2%のDreamerV3を著しく上回り, 初めて65.0%以上の人的パフォーマンスを達成した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:00:58 GMT)
Deep learning methods for modeling infrasound transmission loss in the middle atmosphere [5.8] 我々は,世界規模でシミュレーションされた温度と風場からTLを予測しながら,予測誤差を最小限に抑えるために,最適化された畳み込みネットワークを開発した。
実装されたモデルは、周波数帯全体(0.1-3.2Hz)における平均誤差8.6dBのTLを予測し、現実的な大気シナリオを探索する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:10:29 GMT)
Urban Safety Perception Assessments via Integrating Multimodal Large Language Models with Street View Images [5.8] 都市の安全知覚を測定することは、伝統的に人的資源に大きく依存する重要かつ複雑な作業である。
マルチモーダル大規模言語モデル(MLLM)の最近の進歩は、強力な推論と分析能力を示している。
都市全体の安全指標を迅速に評価するための,CLIP機能とK-Nearest Neighbors(K-NN)検索に基づく手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:10:45 GMT)
Riemannian Time Warping: Multiple Sequence Alignment in Curved Spaces [5.8] 時間変動による複数の信号の時間的アライメントは、音声認識やロボットモーション学習など、多くの分野において重要である。
本稿では,データを埋め込んだリーマン多様体の幾何学的構造を考慮し,複数の信号を効率的に整列させる手法を提案する。
LBRのアイワロボットによるテストを含む、合成データと現実世界のデータの実験では、RTWは平均化と分類の両方において、最先端のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:12:02 GMT)
TurnBench-MS: A Benchmark for Evaluating Multi-Turn, Multi-Step Reasoning in Large Language Models [5.7] 本論文では,対話型コードブレークタスクによるマルチターン・マルチステップ推論を評価する新しいベンチマークであるTurnBenchを紹介する。
各エピソードにおいて、モデルはシーケンシャルな推測を行い、構造化されたフィードバックを受け取り、複数のラウンドで手がかりを統合することによって、隠れた論理的または算術的なルールを明らかにする必要がある。
TurnBenchには、標準推論をテストするClassicと、複雑さを増し堅牢な推論チェーンを必要とするNightmareの2つのモードがある。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:47:50 GMT)
CLIP-driven rain perception: Adaptive deraining with pattern-aware network routing and mask-guided cross-attention [5.6] 降雨パターンを自動的に知覚する新しいCLIP駆動型降雨知覚ネットワーク(CLIP-RPN)を提案する。
CLIP-RPNは、CLIPのクロスモーダルな視覚言語アライメント機能を通じて、セマンティック・アウェア・レインパターン認識を確立する。
また,マルチスケールで降雨マスクを予測するマスク誘導型クロスアテンション機構 (MGCA) も導入した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:49:04 GMT)
Self-Refining Training for Amortized Density Functional Theory [5.6] そこで本稿では,自己修復学習戦略を導入することにより,大規模な事前コンパイルデータセットに対するアモータイズDFTソルバの依存性を低減する手法を提案する。
本手法は, 生成試料と基底状態エネルギーで定義される対象ボルツマン分布との差分を測定するKL偏差の変動上界の最小化として導出する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:32:32 GMT)
WCTC-Biasing: Retraining-free Contextual Biasing ASR with Wildcard CTC-based Keyword Spotting and Inter-layer Biasing [5.5] そこで本研究では,CTCに基づくモデルにおけるレアワードの認識精度を,追加の訓練やテキスト音声システムなしで向上させる手法を提案する。
キーワード検出には,高速かつ不明瞭な一致に寛容なワイルドカードCTCを採用する。
日本語音声認識の実験では,未知語に対するF1スコアが29%向上した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:30:26 GMT)
CHEQ-ing the Box: Safe Variable Impedance Learning for Robotic Polishing [5.5] 本研究では, 可変インピーダンスを有するロボット研磨のためのハイブリッドRLアルゴリズムCHEQの実験的検討を行った。
ハードウェア上では、CHEQは効果的な研磨動作を実現し、8時間のトレーニングを必要とせず、5回の障害しか発生しない。
その結果、ハードウェア上で直接訓練された実世界のコンタクトリッチなタスクに対して、適応型ハイブリッドRLの可能性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:06:28 GMT)
GD doesn't make the cut: Three ways that non-differentiability affects neural network training [5.4] 本稿では,非微分可能関数(NGDM)に適用される手法と,微分可能関数に対する古典的勾配降下(GD)との区別を批判的に検討する。
我々の研究は、強い仮定に対する過度な信頼から生まれた、影響力のある文学におけるアルゴリズムの批判的な誤解を識別する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:49:57 GMT)
Schemato - An LLM for Netlist-to-Schematic Conversion [5.4] ネットリストからスキーマ変換のための大規模言語モデル(LLM)を提案する。
特に、LTSpiceで使用されるテキストベースのスキーマ記述である.ascファイルにネットリストを変換するアプローチについて検討する。
実験の結果、Spicetoは平均グラフ編集距離スコアと平均構造類似度指数測定値で、それぞれ1.8倍と4.3倍のコンパイル成功率でスケールした。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:43:49 GMT)
Density Ratio Estimation-based Bayesian Optimization with Semi-Supervised Learning [5.3] この課題を解決するために,半教師付き学習を用いた密度比推定に基づくベイズ最適化を提案する。
本手法の実証的な結果といくつかの基本手法を,未ラベルの点サンプリングと固定サイズのプールを持つ2つの異なるシナリオで示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:02:57 GMT)
BridG MT: Enhancing LLMs' Machine Translation Capabilities with Sentence Bridging and Gradual MT [5.3] 本稿では, 文列をブリッジとして生成し, 翻訳し易いものから難しいものへと徐々に移行するBridG MTと, 文列を先行翻訳を用いて逐次変換するGradual MTを提案する。
7言語にまたがる4つのLLM実験により,本手法が翻訳性能を効果的に向上することを示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:28:27 GMT)
Model Internal Sleuthing: Finding Lexical Identity and Inflectional Morphology in Modern Language Models [5.3] 現代における大規模言語モデルがどのように語彙的同一性や屈折形態を表現しているかを考察する。
モデルは、初期層に線形に語彙情報を集中し、後期層に非線形に集中することを発見した。
注目すべきは、これらのパターンは、アーキテクチャ、サイズ、トレーニング体制の違いにもかかわらず、私たちがテストする16のモデルすべてに現れます。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:01:56 GMT)
SPILL: Domain-Adaptive Intent Clustering based on Selection and Pooling with Large Language Models [5.3] Selection and Pooling with Large Language Models (SPILL) は、微調整なしでインテントクラスタリングを行うための直感的でドメイン適応的な手法である。
私たちのゴールは、既存の埋め込みを、さらなる微調整なしに、新しいドメインデータセットにより一般化できるようにすることです。
提案手法は,より大規模なモデルを用いて微調整を必要とするモデルであっても,他の最先端の研究と同等の結果が得られる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:04:32 GMT)
Evaluating Large Language Models in Crisis Detection: A Real-World Benchmark from Psychological Support Hotlines [5.2] PsyCrisisBenchは、Hangzhou Psychological Assistance Hotlineの540の注釈付きテキストのベンチマークである。
気分認識、自殺の考えの検出、自殺計画の特定、リスクアセスメントの4つの課題を評価する。
QwQ-32Bのようなオープンソースモデルは、ほとんどのタスクにおいてクローズソースと互換性があるが、クローズドモデルはムード検出においてエッジを保持していた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:18:24 GMT)
SPAC: A Python Package for Spatial Single-Cell Analysis of Multiplex Imaging [5.2] 多重蛍光顕微鏡は、空間的に解決された複数のバイオマーカーの詳細な測定を同時に取得する。
我々は,PythonベースのパッケージであるSPAC(SPAtial Single-Cell Analysis)を開発し,モジュール型SPACエコシステム内で対応する光沢のあるアプリケーションを開発した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:36:32 GMT)
Large language models can learn and generalize steganographic chain-of-thought under process supervision [5.2] CoT(Chain-of- Thought)推論は意思決定プロセスに関する洞察を提供する。
CoTモニタリングは、モデルをデプロイする際のリスクを軽減するために使用できる。
負荷を含む推論トレースにおける特定の文字列の使用をペナライズすることで、モデルが代替文字列の代わりになることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:45:15 GMT)
Pitfalls of Scale: Investigating the Inverse Task of Redefinition in Large Language Models [5.1] 逆タスクは、LLM(Large Language Models)がスケールアップするにつれて、潜在的な推論ギャップを明らかにすることができる。
以上の結果から,モデル性能はスケールとともに低下するだけでなく,その誤信も増大することがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:40:35 GMT)
I see what you mean: Co-Speech Gestures for Reference Resolution in Multimodal Dialogue [5.0] 本稿では,表現ジェスチャを中心としたマルチモーダル参照解決タスクを提案する。
頑健なジェスチャー埋め込みを学習する上での課題を同時に解決する。
本研究は,人間と機械の相互作用のより自然主義的なモデルに向けての一歩となる,参照分解におけるジェスチャーと音声の相補的役割を強調した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:52:36 GMT)
GeoLocSFT: Efficient Visual Geolocation via Supervised Fine-Tuning of Multimodal Foundation Models [5.0] GeoLocSFTは、地理的に多様なMR600kデータセットから慎重に選択されたイメージ-GPSペアでトレーニングされています。
この制限されたデータにもかかわらず、私たちのSFT中心のアプローチはベースラインモデルを大幅に改善します。
本研究は,惑星規模の画像測位における高品質の監督と効率的なSFTの能力を明らかにするものである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:16:19 GMT)
Akan Cinematic Emotions (ACE): A Multimodal Multi-party Dataset for Emotion Recognition in Movie Dialogues [4.9] アカン会話感情データセット(Akan Conversation Emotion dataset)は、アフリカ語における最初のマルチモーダル感情対話データセットである。
385の感情ラベル付き対話と6,162の発話が音声、視覚、テキストのモダリティにわたって含まれている。
このデータセットに韻律ラベルがあることは、最初の韻律的に注釈付けされたアフリカの言語データセットにもなった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:11:29 GMT)
DiffuseSlide: Training-Free High Frame Rate Video Generation Diffusion [4.9] 本稿では,事前学習した拡散モデルを用いた高速FPSビデオ生成のためのトレーニング不要な手法を提案する。
我々の手法であるDiffuseSlideは、低FPSビデオから鍵フレームを活用する新しいパイプラインを導入し、ノイズリジェクションやスライディングウインドウ遅延デノイングといった革新的な手法を適用した。
広範にわたる実験により,提案手法は映像品質を著しく改善し,時間的コヒーレンスと空間的忠実度を向上することを示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:12:41 GMT)
Flexible Mixed Precision Quantization for Learned Image Compression [4.8] 本稿では、異なるビット幅を量子化されたネットワークの異なる層に割り当てるフレキシブル混合精密量子化法(FMPQ)を提案する。
また、量子化ビット幅の所望分布を探索する際の時間複雑度を低減する適応探索アルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:12:50 GMT)
Mitigating Disparate Impact of Differentially Private Learning through Bounded Adaptive Clipping [4.8] 差別化プライバシ(DP)は、プライバシ保護機械学習に不可欠なフレームワークとなっている。
DP学習でよく用いられるグラディエントクリッピングは、挑戦的なサンプルから大きな勾配を抑えることができる。
適応的なクリッピングによってこの問題が増幅されることが示され、これにより、小さな値に束縛されたクリッピングを小さくして、適合する多数派と一致させることがしばしばある。
本稿では,過度な勾配抑制を防止するために,可変な下界を導入する有界適応クリッピングを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:44:17 GMT)
Fairness Dynamics During Training [4.8] 本研究では,Large Language Model (LLM) トレーニング中の公正度動態を調査し,バイアスや緩和の診断を可能にする。
モデル事前トレーニングにおいて, 平均ランクとJensen-Shannon Divergence by Partsという, 公平度ダイナミクスを均一に評価するための2つの新しい指標を紹介した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:15:37 GMT)
Optimal T depth quantum circuits for implementing arbitrary Boolean functions [4.7] 任意の$n$-input $m$-output Boolean関数$fに対して最適なT深度量子回路を得るための一般的な構成を示す。
ブール関数の代数正規形式(ANF)を検査することでこれを実現できる。
本研究の結果は,Sボックスとブロック暗号の実装における証明可能な下位境界を説明するものである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:07:54 GMT)
A Quantum Information Theoretic Approach to Tractable Probabilistic Models [4.7] 量子情報理論の枠組みを用いて機械学習モデルを研究する。
我々は、正の実数値確率に対する回路評価を、正半定値行列に対する回路評価に一般化する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:07:08 GMT)
Red Teaming AI Policy: A Taxonomy of Avoision and the EU AI Act [4.6] もっとも顕著なのは、EU AI Act(「AIA」)を通じて、AI規制の形式が出現し始めていることである。
2027年までにAIAは完全な効力を発揮し、企業はこの新しい法律に照らして行動を調整する。
我々は、AIAが課す規制負担を最小限に抑えるため、企業が関与する可能性のある「回避」を推論するための枠組みと分類について提示する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:48:54 GMT)
Interpretable reinforcement learning for heat pump control through asymmetric differentiable decision trees [4.6] そこで本研究では,非対称なソフトDDT構築法を提案する。
従来のソフトなDDTとは異なり、我々の手法は必要に応じてノードを拡大することで木を適応的に構築する。
家庭用エネルギー管理システムにおいて, 透明性, 効率, 高性能な意思決定を実現するための非対称DDTの可能性を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:16:00 GMT)
Floquet-ADAPT-VQE: A Quantum Algorithm to Simulate Non-Equilibrium Physics in Periodically Driven Systems [4.6] フロケ・ヒルベルト空間の定式化を用いて、ハミルトニアンを時間に依存しない形式に変換し、パウリ分解を与える。
本稿では、周期的に駆動される量子系の非平衡物理学をシミュレートするハイブリッド量子古典アルゴリズムFloquet-ADAPT-VQEを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:04:54 GMT)
hqQUBO: A Hybrid-querying Quantum Optimization Model Validated with 16-qubits on an Ion Trap Quantum Computer for Life Science Applications [4.5] 本稿では,ライフサイエンス問題に対する最大16キュービットの量子コンピュータ上でのディジタルシミュレーションの大規模実装について述べる。
我々の研究は、実際の量子プロセッサ上でのライフサイエンスタスクの大規模シミュレーションへの道を開いた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:36:30 GMT)
MedVAE: Efficient Automated Interpretation of Medical Images with Large-Scale Generalizable Autoencoders [4.5] MedVAEは6つの大規模2Dおよび3Dオートエンコーダのファミリーで、医療画像の符号化を小型の潜伏表現として行うことができる。
MedVAE オートエンコーダを 1,052,730 個の医用画像を用いた新しい2段階トレーニング手法を用いて訓練する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:28:21 GMT)
DeepSeek in Healthcare: A Survey of Capabilities, Risks, and Clinical Applications of Open-Source Large Language Models [4.5] DeepSeek-R1は、DeepSeekが開発した最先端のオープンソース大規模言語モデル(LLM)である。
パーミッシブなMITライセンスでリリースされているDeepSeek-R1は、プロプライエタリなモデルの透明性と費用対効果を提供する。
数学、医療診断、コード生成、薬学研究など、構造化された問題解決領域を卓越している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:17:04 GMT)
Splintering Nonconcatenative Languages for Better Tokenization [4.5] 本稿では,テキストを線形形式に再構成する前処理ステップであるSPLINTERを提案する。
我々は、ヘブライ語、アラビア語、マレー語におけるトークン語彙を評価する本質的な尺度を用いて、そのメリットを実証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:43:46 GMT)
A Survey on Event-driven 3D Reconstruction: Development under Different Categories [4.5] イベントカメラは、高時間分解能、低レイテンシ、高ダイナミックレンジのため、3次元再構成に注目が集まっている。
本稿では,ステレオ,モノクラー,マルチモーダルシステムを含むイベント駆動型3D再構成手法の総合的なレビューを行う。
ニューラルラディアンス場やイベントデータを用いた3次元ガウススプラッティングといった新興トレンドも取り上げている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:58:10 GMT)
Stop Chasing the C-index: This Is How We Should Evaluate Our Survival Models [4.4] 多くの生存分析と時間-時間モデルが誤って評価されていることを論じる。
適切な評価基準を選択するための重要なデシラタのセットを示し、それらの長所と短所について議論する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:59:34 GMT)
Sparse Imagination for Efficient Visual World Model Planning [4.4] 世界モデルに基づく計画では、エージェントが将来の状態をシミュレートし、情報的選択を行うことにより、複雑な環境における意思決定を大幅に改善した。
しかし、世界モデルの予測精度を確保するには、しばしばかなりの計算資源を必要とする。
フォワード予測時に処理されるトークンの数を削減して計算効率を向上させることで,効率的なビジュアルワールドモデルプランニングのためのスパースイマジネーションを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:36:14 GMT)
Sample Compression for Continual Learning [4.4] 連続学習アルゴリズムは、一連のタスクから学習することを目的としており、トレーニング分布を静止しないものにしている。
提案手法はCoP2L(Continual Pick-to-Learn)と呼ばれ,各タスクの最も代表的なサンプルを効率的に保持することができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:53:28 GMT)
A meaningful prediction of functional decline in amyotrophic lateral sclerosis based on multi-event survival analysis [4.3] 筋萎縮性側索硬化症(Amyotrophic lateral sclerosis、ALS)は、進行性麻痺を引き起こす運動ニューロンの変性障害である。
本稿では,ALS患者が有意な機能障害を経験するまでの時間を予測するための新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:04:59 GMT)
Variational Inference for Latent Variable Models in High Dimensions [4.3] 後部近似のための平均場変動LDA(MFVI)の統計的精度を定量化するための一般的な枠組みを提案する。
我々は、有名なディリクレ割当(モデル)について「MFVIが機能する正確な体制」をつかむ。
このモデルに対して部分的にグループ化されたVIアルゴリズムを提案し,その動作を示し,その正確な性能を導出する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:19:58 GMT)
TalTech Systems for the Interspeech 2025 ML-SUPERB 2.0 Challenge [4.3] 事前訓練された言語埋め込みモデルと、言語間で共有エンコーダを持つ軽量音声認識モデルからなるハイブリッド言語識別システムを用いる。
音声認識には3つのモデルを使用し、トレーニングデータの可用性と保留データの性能に応じて、各言語に1つのモデルのみを適用する。
システムは、チャレンジで総合的なスコアを獲得しました。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:16:09 GMT)
ThinkEval: Practical Evaluation of Knowledge Preservation and Consistency in LLM Editing with Thought-based Knowledge Graphs [4.2] 本稿では,新しいモデル編集設定,深層編集を提案し,編集手法が接続された事実をどう扱えないかを示す。
ThinkEvalは、モデル編集テクニックを体系的に評価するフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:24:12 GMT)
Assigning Distinct Roles to Quantized and Low-Rank Matrices Toward Optimal Weight Decomposition [4.1] 我々は,低ランク成分をアクティベーションに敏感な重みを捕捉する特定の役割に割り当てる,ODLRI(Outlier-Driven Low-Rank Initialization)を導入する。
Llama2 (7B, 13B, 70B)、Llama3-8B、Mistral-7Bの実験は、ODLRIが一貫してアクティベーション・アウェア・エラーを低減し、量子化スケールを最小化し、低ビット設定におけるパープレキシティとゼロショット精度を改善することを示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:15:13 GMT)
Agnostic Reinforcement Learning: Foundations and Algorithms [4.1] この論文は、学習理論の観点から関数近似を伴うRLの統計的複雑さを厳密に検証する。
学習者は与えられたクラス$Pi$の最良のポリシーを見つけようとするが、$Pi$が基礎となるタスクに対して最適なポリシーを含んでいるという保証はない。
この包括的枠組みの中で、理論的な保証付き新しい学習アルゴリズムを設計し、任意のアルゴリズムの基本性能境界を特徴づける。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:12:24 GMT)
TimeGraph: Synthetic Benchmark Datasets for Robust Time-Series Causal Discovery [4.1] 合成時系列ベンチマークデータセットの総合的なスイートであるTimeGraphを紹介する。
各データセットには、様々な密度と多様なノイズ分布を特徴とする、完全に定義された因果グラフが付属する。
我々は、最先端因果探索アルゴリズムの体系的評価を通じて、TimeGraphの有用性を実証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:34:11 GMT)
The State of Large Language Models for African Languages: Progress and Challenges [4.1] 本稿では,6つの大言語モデル (LLM) ,8つの小言語モデル (SLM) および6つの特殊SLM (SSLM) のアフリカ言語カバレッジを比較検討する。
評価対象は、言語カバレッジ、トレーニングセット、技術的な制限、スクリプトの問題、言語モデリングのロードマップなどだ。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:39:40 GMT)
Data Augmentation for Time-Series Classification: An Extensive Empirical Study and Comprehensive Survey [4.0] データ拡張(DA)は時系列分類(TSC)において重要なアプローチとなっている
TSCにおけるDAの現在の状況は、断片化された文献レビュー、誤った方法論上の課題、アクセス可能なユーザ指向ツールの不足に悩まされている。
本研究では,これらの課題に対して,TSCドメイン内のDA方法論の総合的な検討を通じて対処する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:00:25 GMT)
Hyperspherical Analysis of Dimer-Dimer Scattering in One-Dimensional Systems [3.9] adiabatic hyperspherical representation (AHR) を用いた1次元量子系における4体散乱の包括的解析について述べる。
本研究では,速度可変離散化法(SVD)を導入し,ポテンシャル曲線の急激な回避交叉による数値的課題を克服する。
その結果,AHR+SVDフレームワークの低次元量子システムにおける高精度な小天体散乱計算のパワーと柔軟性が明らかにされた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:11:30 GMT)
A Conformal Risk Control Framework for Granular Word Assessment and Uncertainty Calibration of CLIPScore Quality Estimates [3.9] 本稿では,CLIPScore値の分布の生成と校正のための簡単な手法を提案する。
タスク固有の制御変数に対してCLIPScore値を校正し、制限に対処する。
提案手法は,誤った単語を効果的に検出すると同時に,望ましいリスクレベルに整合した形式的な保証を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:58:26 GMT)
Fractionalization as an alternate to charge ordering in electronic insulators [3.9] 格子の部分充填時の電子系の非圧縮絶縁相は、格子対称性を破る電荷秩序としばしば関連付けられる。
ここでは「量子電荷液体 (Quantum Charge Liquids, QCL)」と呼ばれる絶縁状態が格子変換対称性を保持する部分的な格子充填で観測される可能性を探る。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:00:00 GMT)
Bidirectional Soft Actor-Critic: Leveraging Forward and Reverse KL Divergence for Efficient Reinforcement Learning [3.7] SAC(Soft Actor-Critic)アルゴリズムは伝統的に、ポリシー更新の逆KL(Kulback-Leibler)の分散を最小化することに頼っている。
本稿では,SAC内における前方KL分岐の代替的利用について検討する。
提案アルゴリズムは,まず明示的な前方KLプロジェクションを用いてポリシを初期化し,次に逆KLの発散を最適化してこれを洗練する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:15:30 GMT)
PixFoundation: Are We Heading in the Right Direction with Pixel-level Vision Foundation Models? [3.7] 画素レベルのMLLMの現在の傾向は、大規模ラベル付きデータに基づいて画素レベルの接地監督を訓練することである。
最近の視覚中心のベンチマークで評価すると、このようなMLLMは視覚的質問応答(VQA)の弱い能力を示す。
画素レベルの接地監督のないMLLMは,そのようなタスクにおいて,技術状況よりも優れることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:35:13 GMT)
Improved Regret Bounds for Gaussian Process Upper Confidence Bound in Bayesian Optimization [3.7] ガウス過程 GP-UCB アルゴリズムは高い確率で $tildeO(sqrtT)$ cumulative regret を達成することを示す。
我々の分析では、平方指数核の下では$O(sqrtT ln4 T)$ regretとなる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:38:58 GMT)
Diffusion Models for Tabular Data Imputation and Synthetic Data Generation [3.7] 拡散モデルは、複雑なデータ分布をキャプチャできる強力な生成モデルとして登場した。
本稿では,3つの重要な拡張を導入した表データの拡散モデルを提案する。
コンディショニングアテンション機構は、条件と合成データの関係をキャプチャするモデルの能力を改善するように設計されている。
変換器層は条件(エンコーダ)や合成データ(デコーダ)内の相互作用をモデル化し、動的マスキングにより、欠落したデータ計算と合成データ生成タスクの両方を効率的に処理できる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:47:55 GMT)
The Brain's Bitter Lesson: Scaling Speech Decoding With Self-Supervised Learning [3.6] 我々は、異種脳記録から学ぶための自己教師型目標とアーキテクチャを共に開発する。
約400時間のMEGデータと900の被験者にスケールすると、私たちのアプローチは、参加者、データセット、タスク、さらには新しい被験者への一般化を示しています。
最先端モデルの15~27%の改善を実現し、非侵襲的なデータと外科的復号性能を一致させる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:59:47 GMT)
Large Language Models for EEG: A Comprehensive Survey and Taxonomy [3.6] 大言語モデル(LLM)と脳波(EEG)の研究は、ニューラルデコード、脳-コンピュータインターフェース(BCI)、感情コンピューティングにおける新たな方向性を可能にしている。
本調査は,脳波分析と応用にLLMを用いた最近の進歩の体系的レビューと構造的分類を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:58:57 GMT)
SoK: Concurrency in Blockchain -- A Systematic Literature Review and the Unveiling of a Misconception [3.5] 並行性と並列性は両刃の剣である。
スループットが向上する一方で、競合条件や非決定性、デッドロックやライブロックといった脆弱性も導入されている。
本稿では、スマートコントラクトに関する最初の調査を行い、重要な側面に整理された体系的な文献レビューを提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:13:03 GMT)
A Mosaic of Perspectives: Understanding Ownership in Software Engineering [3.4] 本稿では,ソフトウェア工学と心理学におけるオーナシップに関する既存の文献について考察する。
ソフトウェアエンジニアリングにおけるオーナシップに関するより包括的な見解は、ソフトウェアチームの作業を改善する大きな可能性を持っている、と氏は主張する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:35:10 GMT)
RL-SPH: Learning to Achieve Feasible Solutions for Integer Linear Programs [3.4] RL-SPHは、非二項整数を含むILPに対しても独立に実現可能な解を生成することができる新しい強化学習ベーススタートプライマーである。
実験により、RL-SPHは、既存の原始よりも平均44倍低い原始ギャップと2.3倍低い積分を達成し、高品質な実現可能な解を迅速に得ることが示された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:21:03 GMT)
Synthetic Data Augmentation using Pre-trained Diffusion Models for Long-tailed Food Image Classification [3.4] 長期食品分類のための2段階合成データ拡張フレームワークを提案する。
生成対象に対して正のプロンプトで条件付き参照セットを生成し、生成対象と類似した特徴を共有するクラスを負のプロンプトとして選択する。
提案手法の有効性を2つの長期食品ベンチマークデータセットに示すとともに,トップ1の精度で過去の研究よりも優れた性能を示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:51:28 GMT)
MoCA: Multi-modal Cross-masked Autoencoder for Digital Health Measurements [3.4] マルチモーダルクロスマスクオートエンコーダ(Multi-modal Cross-masked Autoencoder, MoCA)と呼ばれる自己教師型学習フレームワークを提案する。
我々は,MoCAにおけるクロスモダリティマスキング方式の有効性を理論的に保証する。
この研究は、デジタルヘルスとマルチモーダルデータにおける自己教師型学習の変革の可能性を強調している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:07:25 GMT)
Stochastic interior-point methods for smooth conic optimization with applications [3.3] 一般円錐最適化のためのインテリアポイント法を4つの新しいSIPM変種とともに導入する。
未熟な仮定の下では、提案したSIPMの複雑さを確立し、これは多対数係数まで、制約のない最適化の最良の結果と一致する。
頑健な線形回帰、マルチタスク関係学習、クラスタリングデータストリームの実験は、我々のアプローチの有効性と効率を実証している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:57:52 GMT)
Adversarial learning for nonparametric regression: Minimax rate and adaptive estimation [3.2] 逆数$L_risks と $1 leq leq infty$ の最小収束率を確立し、極大最適性を達成する部分的局所推定器を提案する。
我々は、対数係数の中で、非対数クラスと対数クラスの広い範囲で最適な速度を達成することが示されるデータ駆動適応推定器を構築する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:38:47 GMT)
Probing Equivariance and Symmetry Breaking in Convolutional Networks [3.2] textttRapidashは、同変および非同変モデルの異なる変種を可能にする統一群畳み込みアーキテクチャである。
この結果から, より制約のある同変モデルの方が, タスクの幾何に整合すると, より制約の少ない代替モデルより優れていることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:43:00 GMT)
The CASE Framework -- A New Architecture for Participatory Research and Digital Health Surveillance [3.2] 本稿では,適応型文脈認識参加型研究のためのオープンソースプラットフォームであるCASEフレームワークを提案する。
CASEはイベント駆動アーキテクチャを実装しており、参加者の反応、外部データ、時間的条件、進化中のユーザ状態に基づくリアルタイム適応を可能にする。
ケースは、さまざまな領域にまたがって展開され、国家の疾病監視プラットフォームに電力を供給し、政治イベント中のリアルタイムの感情分析を可能にした。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:37:01 GMT)
Zero-Shot Temporal Resolution Domain Adaptation for Spiking Neural Networks [3.2] スパイキングニューラルネットワーク(SNN)は、生物学的にインスパイアされたディープニューラルネットワークであり、時間的情報を効率的に抽出する。
SNNモデルパラメータは時間分解能に敏感であり、エッジでのターゲットデータの時間分解能が同じでない場合、大幅な性能低下を引き起こす。
本稿では,ニューロンパラメータを適応させる3つの新しい領域適応手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:28:50 GMT)
A Comparative Study of SMT and MILP for the Nurse Rostering Problem [3.2] 本研究では,多種多様な実世界のスケジューリング制約をモデル化可能な汎用制約定式化を提案する。
我々は、学術的および現実世界にインスパイアされたロスター問題に関して、Z3 と Gurobi を比較した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:55:12 GMT)
Exploring Prompt Patterns in AI-Assisted Code Generation: Towards Faster and More Effective Developer-AI Collaboration [3.2] 本稿では,AI支援コード生成に必要となるインタラクション数を最小化するために,構造化されたプロンプトパターンの適用について検討する。
我々は,開発者とAI間の往復通信を減らすことの有効性を評価するために,異なる7つのプロンプトパターンを分析した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:43:08 GMT)
Prisma: An Open Source Toolkit for Mechanistic Interpretability in Vision and Video [3.1] 視覚力学的解釈可能性の研究を加速するために設計されたオープンソースのフレームワークであるPrismaを紹介する。
75以上のビジョンとビデオトランスフォーマーにアクセスするための統一ツールキット、スパースオートエンコーダ(SAE)、トランスコーダ、クロスコーダトレーニングのサポート、80以上の事前訓練されたSAEウェイトスイート、アクティベーションキャッシング、回路解析ツール、可視化ツールを提供する。
解析の結果,実効性SAEは言語SAEよりも空間パターンが著しく低いこと,SAE再建がモデル損失を減少させる場合があること,など,驚くべき結果が得られた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:24:10 GMT)
Enabling Probabilistic Learning on Manifolds through Double Diffusion Maps [3.1] 本稿では,PLoM(Probabilistic Learning on Manifolds)アプローチの拡張に基づく確率的サンプリングのための生成学習フレームワークを提案する。
我々は、システム全体の動的複雑さを保ちながら、潜在空間で直接、全順序ISDEを解く。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:58:49 GMT)
AI Data Development: A Scorecard for the System Card Framework [3.1] 本稿では,AIデータセットの開発を評価するために設計されたスコアカードを紹介する。
この手法は、データセットの品質と完全性を評価するために、取り込み形式と評価基準を用いて構造化されたアプローチに従う。
スコアカードは、技術的および倫理的な側面に対処し、データプラクティスの全体的評価を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:35:45 GMT)
Bayesian and Markovian classical feedforward for discriminating amplitude damping channels [3.1] 我々は,各ステップでヘルストローム計測と古典情報フィードフォワードを利用する単純な適応プロトコルを起動する。
前者は限られたパラメータの領域に対してわずかに有利である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:38:56 GMT)
Neural Operators for Predictor Feedback Control of Nonlinear Delay Systems [3.0] 我々は,予測設計を演算子学習問題として再認識し,ニューラル演算子を介して予測子マッピングを学習する。
近似予測器の下では,閉ループ非線形遅延システムの半言語的実用安定性を実現する。
ニューラル演算子モデルを用いた5リンクロボットマニピュレータの制御によるアプローチの実証を行った。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:44:53 GMT)
ZEBRA: Leveraging Model-Behavioral Knowledge for Zero-Annotation Preference Dataset Construction [3.0] ZEBRAは、モデル行動知識を活用することにより、嗜好データを構成するモデルビヘイビアワイドゼロアノテーションフレームワークである。
ZEBRAは、元のモデルの品質と類似性を評価し、完全にインスタンスレベルのアノテーションをバイパスすることで、レスポンスペアをバイナライズする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:16:11 GMT)
Non-Markovianity in Discrete-Time Open Quantum Random Walk on Arbitrary Graphs [2.9] 任意のグラフに適用可能な離散時間オープン量子ウォーク(DTOQW)の新しいモデルを提案する。
異なる次元のクラウス作用素を適用することにより、量子ウォークの力学における雑音の影響について検討する。
パスグラフ、サイクルグラフ、スターグラフ、完全グラフ、完全二部グラフなど、さまざまなグラフのウォークを実装している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:56:23 GMT)
CleanS2S: Single-file Framework for Proactive Speech-to-Speech Interaction [2.9] CleanS2Sは、会話型AIの単一ファイル実装とプロアクティブ対話機能を進化させる、ヒューマンライクな音声インタラクションフレームワークである。
本システムは,音声認識言語モデルとテキスト音声合成を,リアルタイムな中断を伴う統合パイプラインに統合する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:40:46 GMT)
Enhancing Interpretability of Quantum-Assisted Blockchain Clustering via AI Agent-Based Qualitative Analysis [2.8] 本稿では,定量的クラスタリング評価とAIエージェントを用いた定性解釈を組み合わせた2段階分析フレームワークを提案する。
この研究は、量子支援ブロックチェーン分析における解釈可能性のフロンティアを前進させ、将来の自律的なAIオーケストレーションクラスタリングフレームワークの基盤となる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:15:48 GMT)
SemiVT-Surge: Semi-Supervised Video Transformer for Surgical Phase Recognition [2.8] 本稿では,ロバストな擬似ラベリングフレームワークを用いたビデオトランスフォーマーモデルを提案する。
ラベルなしデータを組み込むことで,RAMIEの最先端性能が4.9%向上した。
本研究は半教師的外科的位相認識のための強力なベンチマークを確立した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:32:12 GMT)
Ridgeformer: Mutli-Stage Contrastive Training For Fine-grained Cross-Domain Fingerprint Recognition [2.7] 無接触指紋認識は 顕著な課題に直面しています
これらには、アウト・オブ・フォーカスの画像取得、指紋隆起と谷のコントラストの低減、指の位置のばらつき、視点歪みなどが含まれる。
マルチステージトランスを用いたコンタクトレス指紋マッチング手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:51:45 GMT)
PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion [2.7] 治療ペプチドSMILESの同時生成と最適化のための多目的離散拡散モデルであるPepTuneを提案する。
拡散過程を導出するために,推測時間多目的誘導アルゴリズムであるモンテカルロツリーガイダンス(MCTG)を導入する。
PepTune を用いて, 多様な化学修飾ペプチドを同時に生成し, 複数の治療特性に最適化した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:07:55 GMT)
Segment Anything for Histopathology [2.7] ビジョンファウンデーションモデル(VFM)は、自動的および対話的セグメンテーションのより堅牢な代替手段を提供する。
本稿では,多種多様なデータセットを用いたSAMのトレーニングに基づく核セグメンテーションのためのVFMであるPathoSAMを紹介する。
私たちのモデルはオープンソースで、データアノテーションの一般的なツールと互換性があります。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:30:46 GMT)
Parameter Efficient Fine-Tuning of Segment Anything Model for Biomedical Imaging [2.7] Segment Anything Model (SAM) のようなビジョン基盤モデルは、一般化の改善を通じてこの問題に対処する。
バイオメディカル画像に応用されたSAMのためのPEFTの総合的研究に貢献する。
PEFT層の配置は、視覚変換器のタイプよりも効率性が高いことが判明した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:30:23 GMT)
A Scaling Law for Token Efficiency in LLM Fine-Tuning Under Fixed Compute Budgets [2.6] 計算予算の固定化により,大規模言語モデル(LLM)のスケーリング法則を導入する。
我々の定式化は確立された手続きに従って調整される。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:33:23 GMT)
Explainable AI Systems Must Be Contestable: Here's How to Make It Happen [2.6] 本稿では、説明可能なAIにおける競合性の最初の厳密な形式的定義について述べる。
我々は、ヒューマン中心のインターフェース、技術プロセス、組織アーキテクチャにまたがる、設計やポストホックメカニズムのモジュール化されたフレームワークを紹介します。
私たちの作業は実践者に、真のリコースと説明責任をAIシステムに組み込むためのツールを提供しています。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:32:05 GMT)
AutoChemSchematic AI: A Closed-Loop, Physics-Aware Agentic Framework for Auto-Generating Chemical Process and Instrumentation Diagrams [2.6] 現在のAI手法では、化学プロセスのスケーリングにおいて重要な役割を担っているにもかかわらず、PFDやPIDを自動生成することはできない。
産業用PFDとPIDの自動生成のための閉ループ対応物理フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:08:24 GMT)
Ask in Any Modality: A Comprehensive Survey on Multimodal Retrieval-Augmented Generation [2.5] Retrieval-Augmented Generation (RAG)は、外部の動的情報を統合することで問題を軽減し、現実のグラウンドを改善する。
クロスモーダルアライメントと推論は、単調なRAG以上の難題をもたらす。
この調査は、より有能で信頼性の高いAIシステムを開発するための基盤となる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:15:08 GMT)
Tracr-Injection: Distilling Algorithms into Pre-trained Language Models [2.5] 本稿では, RASP で書かれたアルゴリズムを事前学習した言語モデルに直接蒸留する方法である tracr-injection を提案する。
提案手法はモデル残差ストリーム内の解釈可能な部分空間をどうやって生成するかを示し, RASP アルゴリズムに存在する変数に復号化することができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:23:49 GMT)
The Unified Cognitive Consciousness Theory for Language Models: Anchoring Semantics, Thresholds of Activation, and Emergent Reasoning [2.5] 大規模な言語モデル(LLMs)でのわずかなショットラーニングでは、深いパラドックスが明らかになっている。
我々は、LCMを無意識の基質として再構成するUCCT(Unified Cognitive Consciousness Theory)を通してこの問題に対処する。
本稿では,意味的アンカーを確率論的相転移として定式化するThreshold-Crossing Dynamics理論を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:12:43 GMT)
How well do LLMs reason over tabular data, really? [2.5] 大規模言語モデル(LLM)は自然言語処理に優れるが、表形式のデータよりもその推論能力についてはあまり知られていない。
LLM-as-a-judge法により,より信頼性の高い評価結果が得られることを示す。
次に、実際には3つの共通の特徴、欠落値、重複エンティティ、構造変化を反映した表形式の入力を拡張する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:39:29 GMT)
Hybrid AI for Responsive Multi-Turn Online Conversations with Novel Dynamic Routing and Feedback Adaptation [2.5] 本稿では,RAGとインテントベースの缶詰応答を統合した新しいハイブリッドフレームワークを提案する。
本フレームワークでは,対話コンテキストマネージャを用いて,マルチターンインタラクションにおけるコヒーレンスを保証し,インテントを洗練するためのフィードバックループを組み込む。
実験結果から,提案手法は高い精度 (95%) と低レイテンシ (180ms) のバランスが得られた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:59:27 GMT)
Generalized Bayesian deep reinforcement learning [2.5] マルコフ依存を前提として,未知環境のダイナミクスを深層生成モデルを用いてモデル化することを提案する。
これらのモデルに可能性関数が存在しない場合、一般化された予測順序(または述語)スコアリング規則(SR)を学習して訓練する。
政策学習では,後部分布に関する期待値関数を最大化することにより,最適な政策を学習するためのトンプソンサンプリング(ETS)を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:22:35 GMT)
SAEBench: A Comprehensive Benchmark for Sparse Autoencoders in Language Model Interpretability [2.5] SAEBenchは8つのメトリクスにわたるSAEパフォーマンスを測定する総合的な評価スイートである。
最近提案された8つのSAEアーキテクチャとトレーニングアルゴリズムをまたいだ200以上のSAEスイートをオープンソースにしています。
評価の結果,プロキシメトリクスのゲインは,実用的なパフォーマンスに確実に変換されないことがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:20:51 GMT)
SysLLMatic: Large Language Models are Software System Optimizers [2.4] 提案するシステムSysLLMaticは,大規模言語モデルとプロファイリング誘導フィードバックとシステム性能の洞察を統合したシステムである。
我々は、HumanEval_Bench(C++の競合プログラミング)、SciMark2(Javaの科学的カーネル)、DaCapoBench(Javaの大規模ソフトウェアシステム)の3つのベンチマークスイートで評価した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 01:57:21 GMT)
Something Just Like TRuST : Toxicity Recognition of Span and Target [2.4] 本稿では毒性検出の改善を目的とした包括的データセットであるTRuSTを紹介する。
我々は、毒性検出、標的群同定、有害スパン抽出について、最先端の大規模言語モデル(LLM)をベンチマークする。
微調整されたモデルは、特定のソーシャルグループではパフォーマンスが低いものの、ゼロショットや少数ショットのプロンプトを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 23:48:16 GMT)
Attention Is Not Always the Answer: Optimizing Voice Activity Detection with Simple Feature Fusion [2.4] 本研究は,Wav2vec 2.0, HuBERT, WavLM, UniSpeech, MMS, Whisper など,Mel-Frequency Cepstral Coefficients (MFCCs) とpre-trained model (PTM) の特徴について検討した。
結合性,付加性,横断性という3つの融合戦略を用いて,両方の特徴型を組み合わせた統合型フレームワークであるFusionVADを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:47:42 GMT)
MUDI: A Multimodal Biomedical Dataset for Understanding Pharmacodynamic Drug-Drug Interactions [2.4] 本稿では,薬物と薬物の相互作用を理解するための大規模マルチモーダルバイオメディカルデータセットMUDIを紹介する。
MUDIは薬理学的テキスト、化学式、分子構造グラフ、および310,532の注釈付き薬物対にわたる画像を組み合わせることで、薬物の包括的なマルチモーダル表現を提供する。
レイトフュージョン投票と中間フュージョン戦略の両方を用いてベンチマークモデルを評価する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:36:08 GMT)
MS-RAFT-3D: A Multi-Scale Architecture for Recurrent Image-Based Scene Flow [2.4] 我々は,光学的フローから画像に基づくシーンフローに至るまで,階層的に成功したアイデアを一般化するマルチスケールアプローチを開発した。
特徴量とコンテキストエンコーダの適切な概念を考慮し,KITTIとSpringの最先端技術よりも優れたシーンフローアプローチを設計することに成功している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:59:05 GMT)
Explain-then-Process: Using Grammar Prompting to Enhance Grammatical Acceptability Judgments [2.4] 大規模言語モデル(LLM)は文法的な規則を説明することができるが、文の受理性を判断する際にはそれらの規則を適用するのに失敗することが多い。
本稿では「文法プロンプト(grammar prompting)」について説明する。
LLMのメタ言語的説明をターゲットモデルにフィードバックすることで、ルールの理解とそれの使用の間のギャップを埋める。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:42:33 GMT)
Tight qubit uncertainty relations studied through weak values in neutron interferometry [2.3] ハイゼンベルクの不確実性原理は、量子測定の誤差と、測定対象に対して誘導された乱れの間のトレードオフ関係を記述している。
普遍的有効関係は2003年に大沢によって導出され、一般的な概念の誤りと乱れを定義する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:07:01 GMT)
LibriBrain: Over 50 Hours of Within-Subject MEG to Improve Speech Decoding Methods at Scale [2.2] LibriBrainは、音声復号のためにこれまでで最大の単一オブジェクトMEGデータセットである。
オブジェクト内データのこの前例のない深さ」は、これまで非侵襲的な方法で利用できなかったスケールでの神経表現の探索を可能にする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:59:41 GMT)
Classical-to-quantum transfer of geometric phase for non-interferometric phase measurement and manipulation of quantum state [2.2] 古典ビームの幾何位相を測定するために, 対光子の量子相関に基づく非干渉計測手法を提案する。
古典的なポンプビームの幾何位相を偏光絡み合ったペア光子に転送することで、量子状態を容易に制御できる。
その結果,ベル状態とベル様の最大絡み合い状態の遷移が生じ,ベルパラメータと状態の正弦波変調が観測された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:31:35 GMT)
LASPA: Language Agnostic Speaker Disentanglement with Prefix-Tuned Cross-Attention [2.2] アクセント、音声解剖学、言語音声構造などの声質特性の重複は、言語情報と話者情報の分離を複雑にする。
これらのコンポーネントの分離は、話者認識の精度を大幅に向上させる。
そこで本稿では,接頭辞付きクロスアテンションを通じて共同学習を統合する,新しい非絡み合い学習戦略を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:59:31 GMT)
SEA-HELM: Southeast Asian Holistic Evaluation of Language Models [2.1] 東南アジア(SEA)言語に対する包括的かつ文化的に代表される評価スイートであるSEA-HELMについて述べる。
1)NLPクラシック、(2)LDM特化、(3)SEA言語学、(4)SEA文化、(5)安全の5つの中核柱から構成される。
SEA-HELMは現在、フィリピン、インドネシア、タミル、タイ、ベトナムをサポートしている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:23:18 GMT)
Wait, that's not an option: LLMs Robustness with Incorrect Multiple-Choice Options [2.1] 本研究は,LLMの命令追従能力と批判的推論とのバランスを評価するための新しいフレームワークを提案する。
トレーニング後のアライメントモデルでは,無効なオプションの選択がデフォルトとなることが多いが,ベースモデルでは,モデルサイズに合わせてスケールするリファリング機能が改善されている。
さらに、同様の指示追従バイアスを示す並列人間の研究を行い、これらのバイアスがアライメントに使用される人間のフィードバックデータセットを通してどのように伝播するかを示唆した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:08:56 GMT)
Minimal Pair-Based Evaluation of Code-Switching [2.1] 既存のメソッドは言語の範囲が広いわけではなく、多様なコードスイッチング現象を考慮できないか、スケールしない。
本稿では,CSの最小対に基づく介入を提案し,各最小対は自然発生のCS文と最小操作の変種を含む。
我々の人間実験は、すべての言語ペアにおいて、バイリンガルが自然発生のCS文を常に好んでいることを示している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:27:53 GMT)
Code-Switching and Syntax: A Large-Scale Experiment [2.1] 構文だけでは、最小ペアのコードスイッチング人間の文を区別する自動システムには十分であることを示す。
学習した構文パターンは、目に見えない言語ペアによく一般化する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:32:14 GMT)
Electro-optic sampling of the electric-field operator for ultrabroadband pulses of Gaussian quantum light [2.1] 中赤外スペクトル範囲では、電気光学サンプリングは光パルスの電場における量子ゆらぎを特徴づける手段を提供する。
本稿では,マルチモード量子光の完全なキャラクタリゼーションを可能にする2ポートEOS技術に基づくプロトコルを提案する。
われわれは,超高速マルチモード量子光を特徴付ける汎用ツールとして,この2ポートEOS技術を確立した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:41:44 GMT)
Public versus Less-Public News Engagement on Facebook: Patterns Across Bias and Reliability [2.1] 本稿では、Facebookのよりパブリックな領域と、よりパブリックでない領域とのインタラクションパターンを包括的に比較した最初の例を示す。
分析の結果、ニュースの相互作用の31%が公共の場で発生し、ニュースクラス間で大きな違いがあることがわかった。
これらの調査結果は、Facebook上のニュース拡散を完全に理解するために、公開と非公開の両方のエンゲージメントを調べる必要性を強調している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:31:35 GMT)
Getting almost all the bits from a quantum random access code [2.0] 量子ランダムアクセスコード(QRAC)は$n$-bit文字列を$x$で$m$-qubit量子状態に符号化する。
すべてのQRACに対して、小さなハミング距離までのフル$n$-bit文字列$x$を回復する測度が存在する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:24:30 GMT)
Keypoint-Integrated Instruction-Following Data Generation for Enhanced Human Pose and Action Understanding in Multimodal Models [2.0] 現在の視覚言語マルチモーダルモデルは、一般的な視覚的理解タスクに適している。
本研究では,人間のキーポイントとキャプションやバウンディングボックスといった従来の視覚的特徴を統合することで,そのようなデータを生成する手法を提案する。
このデータセットを用いてLLaVA-1.5-7Bモデルを微調整し、ベンチマークで評価し、大幅な改善を実現した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:12:50 GMT)
A Data-Based Architecture for Flight Test without Test Points [2.0] 本研究では,航空機の低次モデル(ROM)を作成する機械学習手法を提案する。
ROMはパイロットが飛ぶあらゆる条件に基づいて予測を生成することができる。
本稿では,T-38C飛行試験データを用いて,この「ポイントレス」アーキテクチャの単一例を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 23:05:52 GMT)
Trojan Horse Hunt in Time Series Forecasting for Space Operations [2.0] 競技の主な課題は、45個の毒入りモデルのトレーニングデータに注入された45個のトリガーのセットを再構築することである。
競争の影響は宇宙領域に限らず、高度時系列解析の他の多くの安全クリティカルな応用にも及んでいる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:38:16 GMT)
Four Principles for Physically Interpretable World Models [2.0] 世界モデルにおける潜在表現には、意味のある物理量とダイナミクスへの直接マッピングがない。
我々は、物理的に情報を得た世界モデルから物理的に解釈可能な世界モデルへの根本的なシフトを論じる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:56:42 GMT)
ReconXF: Graph Reconstruction Attack via Public Feature Explanations on Privatized Node Features and Labels [1.9] グラフニューラルネットワーク(GNN)は多くのアプリケーションで高いパフォーマンスを達成するが、ブラックボックスモデルとして機能する。
説明可能性の方法は、予測のための重要なノード属性を識別する機能レベルの説明を提供することによって、この問題に対処する。
既存のグラフ再構成攻撃は元の補助データへのアクセスを前提としているが、実際のシステムはノードの特徴やラベルを保護するために差分プライバシーを使用する。
本稿では,公開説明と民営化補助データを備えたシナリオを対象としたグラフ再構成攻撃ReconXFを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:06:02 GMT)
SALF-MOS: Speaker Agnostic Latent Features Downsampled for MOS Prediction [1.9] 音声合成の評価は、客観的指標または主観的指標を用いて行うことができる。
Speaker Agnostic Latent Features (SALF)-Mean Opinion Score (MOS)は,5。
畳み込みのシーケンスを用いて、平均二乗誤差(MSE)、線形一致相関係数(LCC)、スピアマンランク相関係数(SRCC)、ケンドールランク相関係数(KTAU)に基づいて、音声サンプルの潜時特徴を得る。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:45:40 GMT)
Generalization Bounds for Heavy-Tailed SDEs through the Fractional Fokker-Planck Equation [1.8] 重み付きSDEに対して、非自明な情報理論項を伴わない高確率境界一般化を証明した。
以上の結果から,重尾は問題構造によって有益か有害かのどちらかである可能性が示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:31:53 GMT)
Unveiling the Lack of LVLM Robustness to Fundamental Visual Variations: Why and Path Forward [1.8] V$2$R-Benchは、LVLMの視覚変化ロバスト性を評価するためのベンチマークフレームワークである。
本研究では,複雑な視覚言語タスクに優れた高度なモデルが,オブジェクト認識などの単純なタスクでは著しく性能が劣っていることを示す。
これらの脆弱性は、パイプラインアーキテクチャにおけるエラーの蓄積と、マルチモーダルアライメントの不十分に起因する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:24:17 GMT)
Do Large Language Models (Really) Need Statistical Foundations? [1.8] 大規模言語モデル(LLM)は、構造化されていないデータを処理するための新しいパラダイムである。
本稿では, LLM の開発と応用が, 統計学的な貢献から真に恩恵を受けるかどうかを論じる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:12:28 GMT)
Learning to Explain: Prototype-Based Surrogate Models for LLM Classification [1.7] 大規模言語モデル (LLM) は、自然言語処理における顕著な性能を示しているが、その決定過程はほとんど不透明である。
プロトタイプベースのサロゲートフレームワークである textbfProtoSurE を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:47:57 GMT)
JanusDNA: A Powerful Bi-directional Hybrid DNA Foundation Model [1.6] 大規模言語モデル(LLM)は自然言語処理に革命をもたらし、他のシーケンシャルなデータタイプにもますます適用されてきている。
我々は、新しい事前学習パラダイムに基づいて構築された、最初の双方向DNA基盤モデルであるJanusDNAを紹介する。
JanusDNAは、1つの80GB GPU上で1つのヌクレオチド分解能で100万塩基対を処理する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:18:29 GMT)
CACTI: Leveraging Copy Masking and Contextual Information to Improve Tabular Data Imputation [1.6] CACTIは,欠落パターンやコンテキスト情報の構造を生かした,暗黙の自動符号化手法である。
この結果から,データセット固有のコンテキスト情報と欠落パターンを活用して計算性能を向上させることの価値を強調した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:50:22 GMT)
Inducing, Detecting and Characterising Neural Modules: A Pipeline for Functional Interpretability in Reinforcement Learning [1.6] ネットワーク重みの空間性と局所性がRLポリシネットワークにおける機能モジュールの出現にいかに寄与するかを示す。
これらの手法を2Dおよび3D MiniGrid環境に適用すると、異なる軸に対して異なるナビゲーションモジュールが一貫した出現を示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:38:54 GMT)
Unified Large Language Models for Misinformation Detection in Low-Resource Linguistic Settings [1.6] ウルドゥー語のような地域言語でニュースを検出するための資源と戦略には顕著なギャップがある。
現在のUrduのフェイクニュースデータセットはドメイン固有であり、一般にはアクセスできないことが多い。
本稿では,Urduニュースのための最初のベンチマーク大規模FNDデータセットについて述べる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:19:28 GMT)
Investigating Energy Efficiency and Performance Trade-offs in LLM Inference Across Tasks and DVFS Settings [1.6] 大規模言語モデル(LLM)は、幅広い自然言語処理(NLP)タスクにおいて顕著な性能を示した。
しかしながら、彼らの推論ワークロードは計算的かつエネルギー集約的であり、持続可能性や環境への影響に関する懸念を提起している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:12:24 GMT)
LoRACode: LoRA Adapters for Code Embeddings [1.6] コード検索のためのタスク固有アダプタを構築するために,ローランド適応(LoRA)に基づくパラメータ効率の微調整手法を提案する。
提案手法では,トレーニング可能なパラメータの数をベースモデルの2%未満に削減し,広範なコードコーパスを高速に微調整する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:19:34 GMT)
Fingerprinting Deep Learning Models via Network Traffic Patterns in Federated Learning [1.5] フェデレートラーニング(FL)は、分散機械学習パラダイムとしてますます採用されている。
FLは、ネットワークトラフィック分析を通じて間接的なプライバシー侵害を受けやすい。
本稿では,FL環境に展開する深層学習モデルのフィンガープリントの実現可能性について,ネットワーク層トラフィック情報の解析により検討する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:37:20 GMT)
Temporal Causal-based Simulation for Realistic Time-series Generation [1.5] 因果発見(Causal Discovery)は、観察された変数間の関係を明らかにする上で、特に時間的設定において重要な役割を果たす。
因果構造、効果、時間に関する簡易な仮定に基づく生成技術は、シミュレーションデータの品質と多様性を制限する。
本稿では,実時間時系列データとその関連する時間因果グラフを生成するための堅牢なフレームワークである時間因果シミュレーション(TCS)を紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:59:48 GMT)
Gain-assisted control of the photonic spin Hall effect [1.5] 反射型プローブ光におけるフォトニックスピンホール効果(SHE)を制御するためのゲインアシストモデルを提案する。
ゲインアシストに基づくフォトニックSHEの測定は、光センシングのようなスピン関連の応用を可能にする可能性がある。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:51:56 GMT)
AIMSCheck: Leveraging LLMs for AI-Assisted Review of Modern Slavery Statements Across Jurisdictions [1.4] 英国とカナダから新たにアノテートされたデータセットであるAIMS.ukとAIMS.caを紹介する。
次に、コンプライアンス検証のためのエンドツーエンドフレームワークであるAIMSCheckを紹介する。
我々の実験は、オーストラリアにおけるデータセットで訓練されたモデルが、イギリスとカナダの司法管轄区域でよく一般化されていることを示している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:40:59 GMT)
Energy Considerations for Large Pretrained Neural Networks [1.4] 複雑なニューラルネットワークアーキテクチャは、大量の電気を消費する膨大な計算資源を必要とする。
これまでの研究は主にモデル圧縮に重点を置いてきたが、モデルの性能は同等だった。
圧縮モデルと非圧縮モデルの両方に関連するエネルギー使用量を定量化することにより、電力消費を減らす手段として圧縮について検討する。
プルーニングと低ランク因数分解はエネルギー使用量や他の関連する統計に関して有意な改善を示さないが、ステガノグラフィー容量の削減は、ほぼすべてのケースにおいて大きなメリットをもたらす。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:39:24 GMT)
VLCD: Vision-Language Contrastive Distillation for Accurate and Efficient Automatic Placenta Analysis [1.4] 胎盤の病理検査は、出産に伴う健康リスクの検出および緩和に有効な方法である。
近年のAIの進歩により、胎盤の写真と、出産関連病理の徴候の検出と分類のための病理報告が利用できるようになった。
本稿では,その精度と効率を高めるために,視覚言語によるコントラスト学習フレームワークの2つの改良を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:12:27 GMT)
KokoroChat: A Japanese Psychological Counseling Dialogue Dataset Collected via Role-Playing by Trained Counselors [1.3] 本研究は、カウンセラーがカウンセラー-クライアント間相互作用をシミュレートするロールプレイングアプローチを採用する。
我々は6,589の長文対話からなる心理カウンセリング対話データセットであるKokoroChatを構築した。
実験結果から,ココロチャットを用いたオープンソースLLMは,カウンセリング応答の質とカウンセリング対話の自動評価の両方を改善した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:20:53 GMT)
Understanding synchronization between quantum self-sustained oscillators through coherence generation [1.3] 位相同期を3つの設定で検討する。
量子位相同期の鍵となる結合密度行列におけるコヒーレンス要素のサブセットを同定する。
我々のアプローチは、位相同期と様々な情報理論測度との関係についての貴重な洞察を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:08:20 GMT)
RAFT: Robust Augmentation of FeaTures for Image Segmentation [1.3] RAFTは、最小ラベル付き実世界のデータを用いて画像分割モデルを適応するための新しいフレームワークである。
我々は,合成から現実の「SYNTHIA->Cityscapes」と「GTAV->Cityscapes」ベンチマークの実験を行った。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:27:34 GMT)
Maximal Non-Kochen-Specker Sets and a Lower Bound on the Size of Kochen-Specker Sets [1.3] 本稿では、10ベクトルの弱い下界を確立し、24ベクトルの現在の最もよく知られた境界を超えない。
また,2次元球面上の直角廊下をナビゲートする際の移動ソファー問題の一般化への興味深い関係を強調した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:45:42 GMT)
SEMNAV: A Semantic Segmentation-Driven Approach to Visual Semantic Navigation [1.3] ビジュアルセマンティックナビゲーション(VSN)はロボット工学における基本的な問題であり、エージェントは未知の環境で対象物に向かって移動しなければならない。
ほとんどの最先端のVSNモデルは、実世界のレンダリングシーンが使用されるシミュレーション環境で訓練されている。
本研究では,環境の視覚的入力表現としてセマンティックセグメンテーションを活用する新しい手法であるSEMNAVを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:19:41 GMT)
An Approximation Theory Perspective on Machine Learning [1.2] 浅層/深層ネットワークの役割を含む機械学習の新たなトレンドについて論じる。
関数近似は機械学習の基本的な問題であるにもかかわらず、近似理論は分野の理論的基礎において中心的な役割を果たすものではない。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:50:18 GMT)
An Introduction to Flow Matching and Diffusion Models [1.2] 拡散モデルとフローベースモデルは、幅広いデータモダリティにまたがる生成AIの最先端技術となっている。
これらのメモは、2025年のIAP(冬)期間にMITが作成したもので、他のコースコンテンツに付随することを意図している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:07:25 GMT)
Algorithms for Sparse LPN and LSPN Against Low-noise [1.2] ランダムノイズ(LPN)問題を伴う古典的学習環境のスパース変種を考察する。
我々の主な貢献は、LSPN(Learning Sparse Parities)問題とスパースCSP(SparseCSP)問題の両方に対して、低雑音に対する学習アルゴリズムを提供する新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:28:36 GMT)
Continuous Approximation of the Ising Hamiltonian: Exact Ground States and Applications to Fidelity Assessment in Ising Machines [1.2] 離散イジング・ハミルトニアンを連続的な枠組みに再構成することで、大規模イジング問題を解くための新しい分析的アプローチを提案する。
提案手法を検証するため, 解析解と量子インスパイアされたIsingアルゴリズムと量子Isingマシンから得られた解を比較した数値実験を行った。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:24:10 GMT)
Challenges in designing research infrastructure software in multi-stakeholder contexts [1.2] 本研究では,マルチステークホルダ環境における自動ソフトウェア出版のための研究基盤ソフトウェア設計の課題について検討する。
研究ソフトウェア技術者(RSE)とインフラ施設職員(IF)にまたがる技術的、組織的、社会的要求を調査する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:50:30 GMT)
MSDNet: Multi-Scale Decoder for Few-Shot Semantic Segmentation via Transformer-Guided Prototyping [1.2] 少数のアノテーション付きの例だけで、クエリイメージ内のオブジェクトをセグメント化するという課題に、Semanticは対処している。
本稿では,Transformerアーキテクチャに基づく新しいFew-shot Semanticフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:22:19 GMT)
Automated Manifold Learning for Reduced Order Modeling [1.1] 本研究では,時空間データからシステムダイナミクスを探索するための幾何学的表現学習法について検討する。
本研究では,このようなデータの類似性構造を空間的近接グラフにエンコードする。
そこで本研究では,古典的および深層学習に基づく多様体学習手法を応用し,次数の減少を学習する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:49:55 GMT)
MTevent: A Multi-Task Event Camera Dataset for 6D Pose Estimation and Moving Object Detection [1.1] MTeventは、非常にダイナミックな環境での6次元ポーズ推定と移動物体検出のために設計されたデータセットである。
セットアップはステレオカメラとRGBカメラで、それぞれ平均16秒で75のシーンを撮影しています。
RGB画像上でNVIDIAのFoundationPoseを用いて6次元ポーズ推定を行い,0.22の平均リコールを実現した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:59:15 GMT)
No Train Yet Gain: Towards Generic Multi-Object Tracking in Sports and Beyond [1.1] スポーツ分析には多目的追跡(MOT)が不可欠であり、パフォーマンス評価と戦術的洞察を可能にする。
従来のトラッキング・バイ・検出手法は広範囲なチューニングを必要とするが、セグメンテーションに基づくアプローチはトラック処理に苦労する。
我々は,時間的に伝播するセグメンテーションマスクをアソシエーションキューとして統合し,ビデオ単位のチューニングを伴わずにロバスト性を向上させるためのトラッキング・バイ・検出フレームワークであるMcByteを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:00:15 GMT)
Prompt Engineering Large Language Models' Forecasting Capabilities [1.0] 最小限のベースラインを超えて予測精度を高めることはめったにない。
いくつかの戦略は精度に強い負の影響を示し、特にベイズ的推論への関与を奨励した。
これらの結果は、予測のような複雑なタスクの文脈では、基本的なプロンプト改善だけでは利得が限られていることを示唆している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:07:11 GMT)
Perturbative partial moment matching and gradient-flow adaptive importance sampling transformations for Bayesian leave one out cross-validation [1.0] 我々は、$T(boldsymboltheta)=boldsymboltheta + h Q(boldsymboltheta)$ for $0hll 1,$という形の摂動変換の使用を動機付けている。
我々はロジスティック回帰と浅いReLU活性化ニューラルネットワークの場合のクローズドフォーム表現を導出する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:06:11 GMT)
From Guidelines to Practice: A New Paradigm for Arabic Language Model Evaluation [0.9] まず、既存のアラビア評価データセットを分析し、言語的正確性、文化的アライメント、方法論的厳密性において重要な課題を特定した。
アラビア語のDepth Miniデータセット(ADMD)は10のドメインにまたがる490の課題の集合である。
以上の結果から,文化的な理解と専門知識を必要とする分野において,様々な領域におけるモデル性能の顕著な変動が明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:39:50 GMT)
ReGA: Representation-Guided Abstraction for Model-based Safeguarding of LLMs [0.9] 大きな言語モデル(LLM)は様々なタスクで大きな成功を収めていますが、安全性とセキュリティに関する懸念が生まれています。
機械学習モデルを解析し、監視するために、モデルに基づく分析は、ステートフルなディープニューラルネットワークにおいて顕著な可能性を示している。
本稿では,表現誘導抽象化を用いたモデルベース分析フレームワークReGAを提案し,LLMを有害なプロンプトや世代に対して保護する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:17:38 GMT)
Directed st-connectivity with few paths is in quantum logspace [0.9] 有向グラフ上の$st$-pathをカウントするための$mathsfBQSPACE(Olog2 n/ log n)$プロシージャを提示する。
これは、$mathsfBQSPACE$と$mathsfL$と$mathsfL$を分離した最初の自然言語候補となる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:35:17 GMT)
New aspects of quantum topological data analysis: Betti number estimation, and testing and tracking of homology and cohomology classes [0.9] トポロジカルデータ解析における中心的課題であるベッチ数の推定(正規化)のために、いくつかの量子アルゴリズムが提案されている。
近ごろ、ベッチ数の推定がNPハード問題であることが証明され、この問題に対する一般的な量子優位性を達成するための複雑性理論上の制限が明らかにされた。
我々は、より情報的な形で単純複体が特定され、代替量子アルゴリズムがベッチ数と永続ベッチ数を推定できるシナリオを考察する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:43:58 GMT)
QARI-OCR: High-Fidelity Arabic Text Recognition through Multimodal Large Language Model Adaptation [0.9] 本稿では、アラビア語に段階的に最適化された視覚言語モデルであるQari-OCRを紹介する。
Qari-OCRは、ワード誤り率(WER)0.0160、文字誤り率(CER)0.061、BLEUスコア0.737の新たなオープンソースステート・オブ・ザ・アートを確立している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:21:06 GMT)
Composable Building Blocks for Controllable and Transparent Interactive AI Systems [0.8] AIモデルのブラックボックス問題は、全体としてインタラクティブシステム全体に広まり続けている。
XAI技術は、ポストホックメソッドを採用するか、本質的に解釈可能なモデルに移行することで、AIモデルをよりアクセスしやすくする。
本稿では,対話型システムを構造ブロックのシーケンスとして表現する手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:10:51 GMT)
Neural-network-assisted Monte Carlo sampling trained by Quantum Approximate Optimization Algorithm [0.8] 本稿では、量子回路と生成型ニューラルサンプリング(GNS)を組み合わせたハイブリッド量子古典MCMCフレームワークを提案する。
GNSは量子出力を効率的にエミュレートするために古典的なサロゲートとして機能し、回路制約を解除する。
これらの結果から,NISQデバイスのためのサンプリングベース量子アルゴリズムとして本手法が確立された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:26:26 GMT)
A Dynamic Framework for Semantic Grouping of Common Data Elements (CDE) Using Embeddings and Clustering [0.8] 本研究の目的は、異種バイオメディカルデータセット間の共通データ要素(CDE)の調和を容易にする動的でスケーラブルなフレームワークを開発することである。
本手法では,CDEを意味的関係やパターンをキャプチャする高密度ベクトルに変換するコンテキスト対応テキスト埋め込みに,Large Language Models (LLMs) を利用する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:43:37 GMT)
Evaluating the Effectiveness of Pre-Trained Audio Embeddings for Classification of Parkinson's Disease Speech Data [0.8] パーキンソン病のバイオマーカーとしての音声障害
ディープアコースティックな特徴はPD分類の可能性を示唆しているが、その効果は話者の違いによってしばしば異なる。
本研究では,PD分類における3つの事前学習オーディオ埋め込みの有効性について検討した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:32:54 GMT)
Dependency of quantum time scales on symmetry [0.8] 時間(英: Time)は、物理学、特に量子力学のレベルでは最も理解されていない量の一つである。
本稿では、スピン分解分散状態からのスピン分解および角度分解光電子分光に基づく実験的手法を用いて、アイゼンバッド・ウィグナー・スミス(EWS)光電子分光の時間遅延を決定する。
系の次元性、あるいはむしろ対称性の間の直接的なリンクが見つかる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:35:57 GMT)
BD at BEA 2025 Shared Task: MPNet Ensembles for Pedagogical Mistake Identification and Localization in AI Tutor Responses [0.7] 本稿では,AIを活用したチュータの教育能力評価に関するBEA 2025共有タスクについて紹介する。
我々のシステムは、BERTとXLNetの事前学習の利点を組み合わせたトランスフォーマーベースの言語モデルMPNet上に構築されている。
提案手法は両トラックにおいて, 一致マクロF1スコアが約0.7110, ミステイク同定が約0.5543, 公式テストセットが0.5543であった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:57:49 GMT)
MADCluster: Model-agnostic Anomaly Detection with Self-supervised Clustering Network [0.7] 自己教師付きクラスタリングを利用したモデルに依存しない異常検出フレームワークMADClusterを提案する。
中心となる考え方は、通常のパターンデータを'単一クラスタ'にクラスタ化すると同時に、クラスタセンタを学習し、このセンタに近いデータをマッピングすることです。
4つの時系列ベンチマークデータセットの実験では、MADClusterを適用することで、比較モデルの全体的なパフォーマンスが向上することが示された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:51:15 GMT)
Improved belief propagation is sufficient for real-time decoding of quantum memory [0.7] Relay-BPは大規模量子コンピュータのリアルタイム量子回路デコードをターゲットにしている。
回路ノイズの復号化問題に対して高い精度を実現する。
Relay-BPは本質的に並列であり、FPGAやASICによる高速な低フットプリントデコードを可能にする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:23:00 GMT)
Falsification of Unconfoundedness by Testing Independence of Causal Mechanisms [0.7] 本研究では,観測データを用いた設定において,未測定の共起の仮定をfalsifyするアルゴリズムを提案する。
提案手法は, 未測定の凹凸が観察因果機構に依存性を生じさせる可能性を秘めている。
本手法は,シミュレーションデータと半合成データの両方の共振を効率よく検出できることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:46:06 GMT)
Neural shape reconstruction from multiple views with static pattern projection [0.7] カメラとプロジェクタの両方が動いている間、複数の画像をキャプチャして対象物体の形状を復元する手法を提案する。
合成画像と実画像の両方を用いて3次元再構成を行った。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:29:18 GMT)
Implicit Deformable Medical Image Registration with Learnable Kernels [0.7] 変形可能な医用画像登録は、コンピュータ支援の介入において必須の課題である。
最近のAI手法は、精度とスピードで従来の技術より優れている。
正確かつ信頼性の高い変形を予測できる新しい暗黙の登録フレームワークを導入する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:27:11 GMT)
RATFM: Retrieval-augmented Time Series Foundation Model for Anomaly Detection [0.7] テスト時間適応の例を取り入れた検索拡張時系列基礎モデル(RATFM)を提案する。
RATFMはドメイン依存の微調整を回避しつつ、ドメイン内の微調整に匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:25:35 GMT)
A Tale of Two Symmetries: Exploring the Loss Landscape of Equivariant Models [0.6] 制約のないモデルのパラメータ対称性が同変部分空間の損失ランドスケープに何の影響も与えないことを示す。
驚いたことに、最終的に緩和によって発見された重みは、隠された層における群表現の異なる選択に対応する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:15:36 GMT)
Quantum Ensembling Methods for Healthcare and Life Science [0.6] 我々は、医療や生命科学における小さなデータ問題において、量子アンサンブルモデルがいかに効果的かを研究する。
最大26キュービットのシミュレーションと56キュービットの量子ハードウェアを用いて、バイナリ分類のための複数の種類の量子アンサンブルを構築した。
我々はこれらの量子アンサンブルを腎細胞癌患者からの合成データセットと遺伝子発現データに基づいてテストし、免疫療法に対する患者反応を予測する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:54:51 GMT)
Reflection-Based Memory For Web navigation Agents [0.6] リフレクション・アジュメンテーション・プランニング(Respection-Augment Planning, ReAP)は, 自己回帰を用いて過去の成功と失敗の両方を活用できるウェブナビゲーションシステムである。
提案手法は, これまでに失敗したタスクに対して, 11ポイント, 29ポイントのベースライン結果を改善する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:39:55 GMT)
Dynamic Consistent $k$-Center Clustering with Optimal Recourse [0.6] 我々は、$k$-centerクラスタリング問題において、決定論的定数係数近似を開発することにより、最適リコース境界を許容することを証明する。
当社のインクリメンタルアルゴリズムは,Charikar,Chekuri,Feder,Motwaniによる8ドルの近似アルゴリズムよりも改善されている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:28:36 GMT)
Target Driven Adaptive Loss For Infrared Small Target Detection [0.6] 我々は、赤外線小目標検出(IRSTD)の性能を高めるために、ターゲット駆動適応型(TDA)損失を提案する。
提案手法をIRSTDの3つのデータセット上で評価する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:11:29 GMT)
Flux Trapping Characterization for Superconducting Electronics Using a Cryogenic Widefield NV-Diamond Microscope [0.6] 超伝導体におけるフラックストラップの高速, マイクロスケールイメージングが可能な極低温広視野NVダイアモンド磁気顕微鏡を提案する。
Nb薄膜とパターン付きストリップの渦放出場を測定し,10〜20mu$m帯の放電挙動のクロスオーバーを明らかにする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:26:55 GMT)
Signature Maximum Mean Discrepancy Two-Sample Statistical Tests [0.5] この研究は、統計的ツールとしてsig-MMDを適用する際の可能性と課題を理解することを目的としている。
我々は,Sig-MMDの導入と解説を行い,その実用化のために容易にアクセス可能で検証可能な実例を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:26:58 GMT)
Synthesis of discrete-continuous quantum circuits with multimodal diffusion models [0.5] 量子演算の効率的なコンパイルは、量子コンピューティングのスケーリングにおいて依然として大きなボトルネックとなっている。
対象ユニタリをコンパイルするための回路構造とその連続パラメータを同時に生成するマルチモーダルデノナイジング拡散モデルを提案する。
我々は、異なる実験でモデルをベンチマークし、様々なキュービット数、回路深さ、パラメータ化ゲートの比率にまたがる手法の精度を分析した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:35:33 GMT)
Shape and Texture Recognition in Large Vision-Language Models [0.5] この研究は、Large Shape and Texturesデータセット(LAS&T)を導入している。
このデータセットは、LVLM(Large Vision-Language Models)が2Dおよび3Dシーンの形状、テクスチャ、材料を効果的に理解する方法のベンチマークに使用される。
形状認識には, 方向, テクスチャ, 色, 環境によって異なる同一形状の画像をマッチングするモデルの能力をテストする。
テクスチャと材料認識のために,異なる物体や環境にまたがる同一のテクスチャと材料を用いた画像の識別能力を評価した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:47:34 GMT)
An adaptive data sampling strategy for stabilizing dynamical systems via controller inference [0.5] 本稿では,データ収集時の不安定性を回避するため,システムの安定化を同時に図りながらデータを生成する適応型サンプリング手法を提案する。
軽微な仮定の下では、この手法は、安定化に有益で最小のサイズのデータセットを確実に生成する。
提案手法は、エッジケースにおける安定化システムへの扉を開き、不安定な状態やデータ収集が本質的に困難である場合に制限することを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:56:17 GMT)
CogniAlign: Word-Level Multimodal Speech Alignment with Gated Cross-Attention for Alzheimer's Detection [0.5] 本稿では,アルツハイマー検出のためのマルチモーダルアーキテクチャであるCogniAlignを紹介する。
音声とテキストのモダリティと、2つの非侵入的な情報ソースを統合している。
精度は90.36%で、既存の最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:17:01 GMT)
A Systematic Mapping Study on Software Architecture for AI-based Mobility Systems [0.5] 我々は、AIベースの安全クリティカルシステムにおける、既存のアーキテクチャの欠落の概要、安全性への貢献、および成熟度レベルの提供を目的としている。
1,639の初等研究から,AIベースの安全クリティカルシステムにおいて,ソフトウェアアーキテクチャによる安全性保証を扱う38の関連研究を選択した。
選択された研究は、様々な基準を用いて、研究の質問に答え、この研究領域のギャップを識別した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:29:54 GMT)
Learning Circuits with Infinite Tensor Networks [0.5] 量子コンピュータ上のハミルトニアンシミュレーションはゲート数によって制約され、回路深さを減らすための技術が動機となっている。
我々はテンソルネットワークを利用して回路設計を支援し、量子機械学習にインスパイアされたユニタリ合成を可能にする。
提案手法は, 基底状態を効率的に生成し, 無限系と有限系の両方で時間発展を行う回路を求める。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:00:01 GMT)
Rethinking Image Histogram Matching for Image Classification [0.5] 畳み込みニューラルネットワークは、分類タスクにおいて顕著な成果を示した。
悪天候下で撮影された低コントラスト画像に対して、しばしば劣化した性能を示す。
本稿では、画像ヒストグラムマッチング(HM)を再考し、下流分類器のための微分可能パラメトリックHM前処理を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:09:12 GMT)
System Calls for Malware Detection and Classification: Methodologies and Applications [0.5] この章では、マルウェアの検出と分類にシステムコールがどのように使われているかについて詳しく説明している。
静的解析や動的解析、サンドボックス処理などのテクニックをカバーしている。
この章では、これらのテクニックが、Windows、Linux、Androidなど、さまざまなシステムにまたがってどのように適用されるかについても論じている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:11:27 GMT)
MultiFlow: A unified deep learning framework for multi-vessel classification, segmentation and clustering of phase-contrast MRI validated on a multi-site single ventricle patient cohort [0.5] MultiFlowSegは、左右の肺動脈、大動脈、上大静脈、下大静脈の5つの主要な血管を同時に分類し、分割する。
セグメンテーションが成功したときの流れ曲線はMultiFlowDTCの訓練に使われ、これは異なる流れの表現型を特定するために深部時間クラスタリングを適用した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:24:24 GMT)
The Impact of Software Testing with Quantum Optimization Meets Machine Learning [0.5] 本研究では、CI/CDパイプラインにおけるテストケースの優先順位付けを最適化するために、Quantum AnnealingとMLを統合するハイブリッドフレームワークを提案する。
欠陥検出効率は25%向上し、テスト実行時間の30%削減を実現している。
このフレームワークは、2025年代のハイブリッド量子古典的エコシステムの量子ハードウェア制限、CI/CD統合、スケーラビリティに対処する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:04:10 GMT)
Cross-resonance control of an oscillator with an auxiliary fluxonium qubit [0.5] 補助量子ビットとしてフラキソニウムを用いたCDゲート方式を提案する。
提案したゲートはフラキソニウムの外部フラックスを変調してクロス共鳴的に適用する。
99.9%を超えるユニタリ忠実度を有するCDゲートを数値的に示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:37:10 GMT)
GASP: Gaussian Splatting for Physic-Based Simulations [0.4] 既存の物理モデルでは、三角形や四面体メッシュ、マーチングキューブ、ケージメッシュなどのメッシュ機構が追加されている。
我々は3次元ガウス成分と整合するように、基底のニュートン力学を修正した。
結果の解は、ブラックボックスとして扱われるあらゆる物理エンジンに統合できる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:44:35 GMT)
Analysis of LLM Bias (Chinese Propaganda & Anti-US Sentiment) in DeepSeek-R1 vs. ChatGPT o3-mini-high [0.4] DeepSeek-R1は、プロパガンダと反米感情の両方において、かなり高い割合を示した。
これらの偏見は政治的な話題に限らず、文化やライフスタイルのコンテンツにも浸透した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:54:06 GMT)
Prepare-and-Magic: Semi-Device Independent Magic Certification in the Prepare-and-Measure Scenario [0.4] 本研究では,PAMシナリオにおける非安定化状態の認定のためのフレームワークを開発する。
安定化器と非安定化器状態とを区別できる次元証人を導入する。
我々は、これらの証人のしきい値違反が非安定化剤性を証明するという分析的証明を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:11:10 GMT)
DeCo: Defect-Aware Modeling with Contrasting Matching for Optimizing Task Assignment in Online IC Testing [0.4] ICテストにおけるタスク割り当てを最適化するための革新的なアプローチであるDeCoを提案する。
DeCoは、ICテストレポートから新たな欠陥認識グラフを構築し、欠陥の識別を強化するために、共障害関係をキャプチャする。
エンジニアとタスクの欠陥認識表現を定式化し、局所的およびグローバルな構造モデリングによって強化される。
実世界のデータセットの実験では、DeCoがさまざまなシナリオにおけるタスク処理の成功率が最も高く、80%を超えていることが示されている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:17:33 GMT)
Investigating the Impact of Word Informativeness on Speech Emotion Recognition [0.4] 本研究では,事前学習した言語モデルから派生した単語情報度を用いて,意味的に重要なセグメントを識別する手法を提案する。
音響的特徴はこれらの特定セグメントに対してのみ計算され、感情認識の精度が向上する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:30:48 GMT)
Confidence intervals for forced alignment boundaries using model ensembles [0.4] 強制アライメントは、音声を正書法や音声の書き起こしと整列するための一般的なツールである。
本稿では,ニューラルネットワークアンサンブル手法を用いて,これらの境界に対する信頼区間を導出する手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:12:28 GMT)
An End-to-End Approach for Child Reading Assessment in the Xhosa Language [0.4] 本研究は, 南アフリカで話されている言語であるXhosaに着目し, 子どもの音声認識能力を向上させることを目的とした。
本稿では,Xhosaにおける児童音声サンプルからなる新しいデータセットを提案する。
その結果、これらのモデルの性能は、利用可能なトレーニングデータの量とバランスに大きく影響されることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:47:01 GMT)
Tunable direct bandgap and optical response in \ch{Mo_{1-x}W_xS2} monolayer alloys: A first-principles investigation [0.3] 本研究では, 単層chMo_1-xW_xS2合金の構造, 電子的および光学的性質について検討した。
これらの合金は熱力学的に安定であり, 特性2H結晶構造を維持している。
以上の結果から,単層型chMo_1-x W_xS2を電子的汎用プラットフォームとして評価した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:20:39 GMT)
Quantum Vacuum in Matter [0.3] 量子場理論は真空は空空間ではなく、量子ゆらぎ電磁場に満ちていると述べている。
このパースペクティブは、真空修飾凝縮系に関する最近の実験的および理論的発展について論じる。
次に、様々なエネルギースケールの材料における真空電磁場を増強するための最も有望な空洞設計について概説する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:56:09 GMT)
Optimizing the Training Schedule of Multilingual NMT using Reinforcement Learning [0.3] マルチ言語NMTのトレーニングスケジュールを最適化するために強化学習を利用する2つのアルゴリズムを提案する。
LRLとHRLを用いた8対1の翻訳データセットでは,単言語バッチのランダム選択と多言語バッチのシャッフルの両方に関して,BLEUとCOMETのスコアが向上する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:35:16 GMT)
Speech-to-Speech Translation Pipelines for Conversations in Low-Resource Languages [0.3] 人間の会話のための音声音声翻訳は増え続けているが、品質は言語対によって大きく異なる。
低リソース言語であるトルコ語とパシュト語をフランス語から翻訳するコミュニティの文脈で、我々は微調整とテストのデータを収集しました。
60以上のパイプラインを評価し,各方向に最適なパイプラインを決定した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:02:44 GMT)
3MDBench: Medical Multimodal Multi-agent Dialogue Benchmark [0.3] 3MDBenchは、LVLM駆動の遠隔医療相談をシミュレートし評価するためのオープンソースのフレームワークである。
内部推論によるマルチモーダル対話は、非対話設定よりもF1スコアが6.5%向上する。
診断畳み込みネットワークからLVLMのコンテキストに予測を注入すると、F1は最大20%上昇する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:50:59 GMT)
An Empirical Study of Group Conformity in Multi-Agent Systems [0.3] 本研究では,Large Language Models (LLMs) が,5つの論点に関する議論を通じて世論を形成する方法について考察する。
2500以上の議論をシミュレートすることで、当初中立なエージェントが中心的な処分を課し、時間とともに特定のスタンスを採用するかを分析します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:22:29 GMT)
Survey on Vision-Language-Action Models [0.3] この研究は、オリジナルの研究を表現していないが、AIが文学レビューの自動化にどのように役立つかを強調している。
今後の研究は、AI支援文学レビューのための構造化されたフレームワークの開発に焦点を当てる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:38:08 GMT)
Latent Space Topology Evolution in Multilayer Perceptrons [0.3] 本稿では,多層パーセプトロン(MLP)の内部表現を解釈するフレームワークを提案する。
我々は、単純化された地図によって連結された単純化された複合体の列である単純化されたタワーを構築し、ネットワーク層間のデータの進化を捉える。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:51:53 GMT)
Prospects for NMR Spectral Prediction on Fault-Tolerant Quantum Computers [0.2] トレードオフは、結果のスペクトルは古典的な計算のために課税されているシミュレーションを使って解釈する必要があることである。
これらのシミュレーションがフォールトトレラント量子計算の有望なターゲットであることを実証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:19:28 GMT)
Unsupervised Time-Series Signal Analysis with Autoencoders and Vision Transformers: A Review of Architectures and Applications [0.2] ラベルなしの時系列データは教師なし学習の進歩を促している。
本稿では、教師なし信号解析におけるオートエンコーダと視覚変換器の適用の最近の進歩を概観する。
これらのモデルが特徴抽出、異常検出、様々な信号タイプにまたがる分類を可能にする方法について検討する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:26:54 GMT)
Quantum Index Report 2025 [0.2] 量子技術は、理論的概念から商業的な可能性を持った有形技術へと進化している。
1つの課題は、量子技術が非専門家の理解に高い障壁をもたらすことである。
量子インデックスレポート(Quantum Index Report)は、複雑さを減らし、より広い聴衆が量子ランドスケープをより深く理解できるようにすることを目的としている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:47:11 GMT)
Optimization Strategies for Variational Quantum Algorithms in Noisy Landscapes [0.2] 変分量子固有解法(VQE)は、ハミルトニアンを最小化することで分子基底エネルギーを近似する。
VQEは量子相転移とエキゾチック状態の探索によって凝縮物質物理学に寄与する。
本研究は,進化に基づく,Swarmに基づく,音楽に触発された手法を含む50以上のメタヒューリスティック最適化アルゴリズムを体系的に評価する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:22:30 GMT)
Learning thermodynamic master equations for open quantum systems [0.2] 本稿では、学習可能で熱力学的に一貫した項を含むオープン量子システムのためのデータ駆動モデルを提案する。
訓練されたモデルは、環境との結合のハミルトニアンおよび線形成分を直接推定するので、解釈可能である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:11:16 GMT)
Higher Hall conductivity from a single wave function: Obstructions to symmetry-preserving gapped edge of (2+1)D topological order [0.2] U(1)対称性を持つ(2+1)Dトポロジカル秩序相は対称ギャップ状態を持つか、そうでないかである。
最近、フェルミオン分数量子ホール(FQH)状態に有効な「高い」ホール導電率が存在することが判明した。
本研究では、FQH状態の単一波動関数から高ホール導電率を抽出し、「部分回転」ユニタリの期待値を評価する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:39:23 GMT)
Synchronic Web Digital Identity: Speculations on the Art of the Possible [0.2] 本論文は、国立研究所の観点から、このようなインフラを構築する機会と意義について論じる。
この議論の技術的基盤はシンクロニック・ウェブ(英語版)の出現である。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:42:43 GMT)
Multi Part Deployment of Neural Network [0.2] 本稿では,複数のサーバにまたがるニューラルネットワークを分割する分散システムアーキテクチャを提案する。
Multi-Part Neural Network Execution Engineは、分散パーティション間のシームレスな実行とトレーニングを容易にする。
Neuron Distributorモジュールは、ニューロン数、パーセンテージ、識別子、ネットワーク層に基づく柔軟なパーティショニング戦略を可能にする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:24:29 GMT)
Class Incremental Learning for Algorithm Selection [0.2] 最適化シナリオにおけるアルゴリズム選択の関連性について検討する。
破滅的な忘れを抑える能力に関して,8つの連続学習手法をベンチマークした。
リハーサルに基づく手法は,他のCIL手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:18:07 GMT)
Predicting Post-Surgical Complications with Quantum Neural Networks: A Clinical Study on Anastomotic Leak [0.2] 医学診断における量子機械学習の適用について検討する。
本研究は, 術後合併症の重篤な解離性漏出の予測に焦点をあてる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:13:10 GMT)
Multi-Platform Methane Plume Detection via Model and Domain Adaptation [0.2] 本研究では、ESMイメージング分光ミッションのデータを用いて、宇宙に浮かぶメタンプラム分類器を開発した。
我々は、教師なし画像と画像の変換技術であるCycleGANを用いて、空中と宇宙のコンテキスト間のデータ分布を整列する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:38:41 GMT)
An Entanglement Monotone from the Contextual Fraction [0.2] 我々は、文脈分数に依存する絡み合いモノトンを定義する。
我々は、任意の分離可能な状態が、ベルのシナリオに関して必ずしも非コンテキストであることを示します。
2量子状態の場合、状態依存のベルシナリオを関連付け、対応する文脈分画が絡み合い単調であることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:44:17 GMT)
Quantum error mitigation for rotation symmetric bosonic codes with symmetry expansion [0.2] 雑音のない対称部分空間に仮想的に状態を投影する量子誤差緩和のクラスを提案する。
対称展開は光子損失の影響を劇的に抑制することを示す。
我々の新しい誤差軽減手法は、短期ボゾン量子コンピューティングパラダイムにおける計算精度を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 23:09:13 GMT)
Early Detection of Patient Deterioration from Real-Time Wearable Monitoring System [0.1] TARLは、心拍数時系列において、シェープレットとして知られる代表サブシーケンスの構造関係をモデル化する革新的なアプローチである。
TARLは、心拍数時系列におけるシェープレットダイナミクスをモデル化するためのシェープレット遷移知識グラフを作成する。
これらの表現は説明的構造を捉え、将来の心拍数トレンドを予測し、早期疾患の検出を支援する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:20:42 GMT)
Guiding Generative Storytelling with Knowledge Graphs [0.1] 大規模言語モデル(LLM)は、自動ストーリ生成において大きな可能性を示しています。
生成的ストーリーテリングを支援するための構造化データの使用は、まだ未定である。
本稿では,ナレッジグラフが物語の質を向上し,ユーザ主導の修正を可能にすることによって,LLMベースのストーリーテリングを向上する方法について検討する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:37:17 GMT)
Natural, Artificial, and Human Intelligences [0.0] 言語とともに、発明、複雑な推論、実施、自己認識の能力として要約できる重要な要素が4つあると考えている。
人間の知能の最もユニークな成果については、言語とともに、発明、複雑な推論の能力、実施、自己認識の4つの重要な要素が存在すると考えています。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:11:49 GMT)
Duality on the Thermodynamics of the Kirchhoff-Law-Johnson-Noise (KLJN) Secure Key Exchange Scheme [0.0] 本研究では,Vadai,Mingesz,Ginglによって提案された一般化Kirchhoff-Law-Johnson-Noiseセキュア鍵交換方式における情報漏洩検出の双対性について検討した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:17:48 GMT)
scDataset: Scalable Data Loading for Deep Learning on Large-Scale Single-Cell Omics [0.0] scDatasetは、フォーマット変換を必要とせずに、1つ以上のAnnDataファイルで直接動作する。
scDatasetは、AnnLoaderよりも48$times$のスピードアップ、HuggingFaceデータセットより27$times$のスピードアップ、シングルコア設定でBioNeMoよりも18$times$のスピードアップを達成する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:11:49 GMT)
mdok of KInIT: Robustly Fine-tuned LLM for Binary and Multiclass AI-Generated Text Detection [0.0] 自動検出は、人間が機械生成したテキストを表示するのを助けることができる。
このノートは、テキスト分類のための微調整された小さなLLMに基づいて、ロバスト検出における我々のmdokアプローチを記述している。
これは、Voight-Kampff Generative AI Detection 2025の両方のサブタスクに適用される。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:07:32 GMT)
Z-Error Loss for Training Neural Networks [0.0] 異常勾配を伝播することで、モデル性能と一般化を低下させることができる。
本稿では,Z-Error Lossを提案する。Z-Error Lossは,各バッチにおけるアウト・オブ・ディストリビューション(out-of-distribution)として認識されるデータポイントの寄与を隠蔽することにより,トレーニング中のアウトラヤの影響を最小限に抑える,統計的に原理化されたアプローチである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:35:30 GMT)
Will artificial agents pursue power by default? [0.0] 先進的なAIによる破滅的なリスクを心配する研究者たちは、人類に対する権力を追求するために十分な能力を持つAIエージェントを期待すべきだと主張した。
本稿では,機器収束と電力探索の概念を抽象的・決定論的枠組みで定式化することを目的とする。
私はこの主張が少なくとも真実の要素を含んでいると結論づけるが、予測実用性に限界があるかもしれない。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:54:18 GMT)
Violation of Universal Operator Growth Hypothesis in $W_3$ Conformal Field Theories [0.0] 我々は、$W_3$対称性を持つ大きな中心電荷共形場理論が、Liouvillian が$W_3$ジェネレータを組み込むように修正された場合、予想される作用素成長境界の違反を示すことを示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:59:59 GMT)
Variance-Based Defense Against Blended Backdoor Attacks [0.0] バックドア攻撃は、AIモデルをターゲットにした微妙ながら効果的なサイバー攻撃のクラスである。
本稿では,与えられたデータセット上でモデルをトレーニングし,有毒なクラスを検出し,攻撃トリガの重要部分を抽出する新しい防御手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:01:35 GMT)
Unwrapping photonic reservoirs: enhanced expressivity via random Fourier encoding over stretched domains [0.0] フォトニック貯留層コンピューティング(RC)システムは、光波の複雑な伝播と非線形相互作用を利用して情報処理を行う。
本稿では,入射位相を複数回ラップした散乱支援フォトニック蓄光器符号化方式を提案する。
本研究では, 複射率の低下による非線形分離性を阻害する代わりに, 包み込みにより貯水池の予測性能が著しく向上することを示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:07:00 GMT)
Universal Bound on the Eigenvalues of 2-Positive Trace-Preserving Maps [0.0] 我々は、その最小固有値の観点から、任意の2-正のトレース保存写像のトレース上の上限を証明した。
この不等式が一般に成り立つためには2-正則性が必要であることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:18:00 GMT)
Time inversion symmetry in the Dirac and Schrödinger-Pauli theories [0.0] 電子のディラック理論では、磁気秩序は非相対論的極限においても時間反転対称性を破る。
Schr"odinger-Pauli 理論では、時間反転対称性はスピン軌道結合がない状態で効果的に保存される。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:56:47 GMT)
Thermalization and irreversibility of an isolated quantum system II [0.0] 拡散非平衡状態情報の消去による絡み合いエントロピーの不可逆的な成長を数値的に示す。
我々の研究は、熱力学の第2法則、したがって統計物理学におけるエルゴード仮説が量子情報の観点から理解され、証明できることを実証している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:13:25 GMT)
The iSWAP gate with polar molecules: Robustness criteria for entangling operations [0.0] ハミルトンパラメータの準静的な偏差に対してロバストなゲートを設計するための量子最適制御フレームワークを開発する。
ベル状態のような絡み合った状態の準備は、グローバルな制御のみでも堅牢にできることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:52:17 GMT)
Temporal CW polarization-tomography of photon pairs from the biexciton radiative cascade: theory and experiment [0.0] 半導体量子ドットからのバイエキシトン・エキシトン放射カスケード中に放出される光子対の分極の時間的相関について検討した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:38:02 GMT)
TE-PAI: Exact Time Evolution by Sampling Random Circuits [0.0] 量子ハミルトニアンの下での時間進化のシミュレーションは、量子コンピュータの最も自然な応用の1つである。
TE-PAIは、ランダムな量子回路をサンプリングすることによって、時間進化を正確にシミュレートする。
浅い回路深度を達成しつつ、離散化やアルゴリズム誤差を伴わずに時間進化をシミュレートすることを証明する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 03:40:46 GMT)
Systematic Hazard Analysis for Frontier AI using STPA [0.0] 現在、フロンティアAI企業は、ハザードを特定し分析するための構造化アプローチの詳細を記述していない。
システム理論プロセス分析(Systems-Theoretic Process Analysis)は、複雑なシステムがいかに危険に晒されるかを特定するための体系的な方法論である。
我々は、フロンティアAIシステムにおいて、スコープを広げ、トレーサビリティを向上し、安全性保証の堅牢性を強化する能力を評価する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:28:34 GMT)
Strict advantage of complex quantum theory in a communication task [0.0] 量子論における複素振幅の存在が、対応する実定式化よりも運用上の優位性をもたらすかを検討する。
複雑な量子論が通信コストを著しく低くする単純な通信課題を同定する。
これは複素量子論の厳密な運用上の利点を裏付けるものである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:37:26 GMT)
Stock Market Telepathy: Graph Neural Networks Predicting the Secret Conversations between MINT and G7 Countries [0.0] 米国とカナダは、予測プロセスにおける株価指数に関して最も影響力のあるG7諸国である。
インドネシアとトゥルキエは最も影響力のあるMINT国である。
その結果,MTGNNは,MINTおよびG7諸国の株式市場指標の価格予測において,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:58:21 GMT)
Statistical Taylor Expansion [0.0] 統計的テイラー展開は、従来のテイラー展開における入力された正確な変数を、既知の分布を持つ確率変数に置き換え、結果平均と偏差を計算する。
従来の統計とは違って、各入力サンプルカウントを入力として要求する。
本稿では、分散算術と呼ばれる統計テイラー展開の実装と分散算術に関する試験について述べる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:24:37 GMT)
SpeechT: Findings of the First Mentorship in Speech Translation [0.0] 本研究は、音声翻訳における最初のメンターシップの詳細と発見について述べる(SpeechT)。
メンターシップの要件を満たすため、参加者はデータ準備、モデリング、高度な研究を含む重要な活動に従事した。
このプロジェクトは、アラビア語、ベンガル語、ガリシア語、インドネシア語、日本語、スペイン語など、英語以外の様々な言語をカバーしていた。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:11:35 GMT)
Singularity Blockchain Key Management via non-custodial key management [0.0] web3ウォレットアプリケーションの主な目的は、ユーザのための秘密鍵を管理することである。
ユーザキーをバックアップする新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:44:50 GMT)
Simulating open-system molecular dynamics on analog quantum computers [0.0] アナログ量子シミュレータは開分子系をシミュレートできることを示す。
特に, 混成核子 (MQB) を用いたイオンシミュレータは, 幅広い縮合相の分子をシミュレートできることを示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:59:07 GMT)
ShaTS: A Shapley-based Explainability Method for Time Series Artificial Intelligence Models applied to Anomaly Detection in Industrial Internet of Things [0.0] 本研究は,時系列モデルにおけるシェープリー値説明の精度向上を目的とした,モデルに依存しない説明可能な人工知能手法であるShaTS(Shapley Value for Time Series Model)を提案する。
SWaTデータセットで実施された実験では、ShaTSが臨界時刻を正確に識別し、センサ、アクチュエータ、異常の影響を正確に特定し、説明可能性とリソース効率の両方の観点からSHAPを上回ります。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:07:27 GMT)
Selecting for Less Discriminatory Algorithms: A Relational Search Framework for Navigating Fairness-Accuracy Trade-offs in Practice [0.0] 機械学習モデルは、高い意思決定を通じて社会に組み込まれている。
機械学習モデルが高い意思決定を通じて社会に浸透するにつれて、与えられたタスク、オーディエンス、セクターに対して適切なアルゴリズムを選択することは、重要な課題である。
モデルフェアネスの伝統的な評価は、しばしば客観的な数学的性質としてフェアネスを定式化し、理想的な情報条件下でのモデル選択を最適化問題として扱う。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:28:51 GMT)
Second-order AAA algorithms for structured data-driven modeling [0.0] 本稿では,周波数領域データから直接2次微分構造を持つ動的システム構築のための3つのデータ駆動モデリング手法を提案する。
2階構造偏心形式に基づいて、よく知られたAdaptive Antoulas-Andersonアルゴリズムを2階系に拡張する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:34:18 GMT)
Resampled Confidence Regions with Exponential Shrinkage for the Regression Function of Binary Classification [0.0] 我々は,再サンプリングテストに基づいて,任意のユーザ・センサ信頼度レベルと有限サンプルサイズに対する回帰関数の分布自由信頼領域を構築した。
有限擬次元および逆リプシッツパラメータ化を持つモデルクラスに対する新しい経験的リスクベースアプローチの強い均一性を証明する。
また、k-ネアレスト近傍法についても検討し、排除の確率に基づいて強い点を有界に証明する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:40:06 GMT)
Real-time respiratory motion forecasting with online learning of recurrent neural networks for accurate targeting in externally guided radiotherapy [0.0] リアルタイム反復学習(Real-time Recurrent Learning, RTRL)は、非定常呼吸データ内のパターンを学習できる潜在的なソリューションであるが、複雑さが高い。
本研究は,放射線治療中の呼吸運動を正確に予測する資源効率の高いオンラインRNNアルゴリズムの能力を評価する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:32:05 GMT)
Quantum thermal machines in BTZ black hole spacetime [0.0] 作業媒質としてUruh-DeWitt検出器を用いたオットー熱力学サイクルについて検討した。
熱機械が作動する熱・冷水貯留層をモデル化するために,フィールドの熱特性を利用する。
本研究では,相対論的量子熱機械の有限時間動作を理解するための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:20:30 GMT)
Quantum dynamics of semiconductor quantum dot Josephson junctions [0.0] ジョセフソン接合は、様々な電圧可変超伝導量子デバイスを実現するために使われてきた。
この研究は、相量子力学が基礎となる多体形式から自己整合的に得られる経路積分の定式化を用いる。
結果は単粒子ハミルトニアン(英語版)で要約することができ、通常のジョセフソン接合と直接比較することができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:55:43 GMT)
Quantum correlation beyond entanglement: Holographic discord and multipartite generalizations [0.0] 量子不協和のような重ね合わせから生じる量子相関は、ホログラフィーにおいてほとんど探索されていないより広い視点を提供することを示す。
ホログラフィック系とハールランダム状態の両方において、不協和は絡み合いを超え、マルコフギャップと非蒸留性絡み合いに関連付けられた追加の量子相関が明らかになる。
ホログラフィにインスパイアされたマルチエントロピーを含む,不協和音の多部一般化を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:01:09 GMT)
Quantum Complexity and Chaos in Many-Qudit Doped Clifford Circuits [0.0] 奇素次元$d$のクォーディットに作用するドッピングクリフォード回路における量子複雑性とカオスの出現について検討する。
ドッピングされたクリフォード・ウィンガルテン計算とレプリカテンソルネットワーク形式を用いて、正確な結果を導き、大規模シミュレーションを行う。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:01:01 GMT)
Q-ARDNS-Multi: A Multi-Agent Quantum Reinforcement Learning Framework with Meta-Cognitive Adaptation for Complex 3D Environments [0.0] Q-ARDNS-Multiは高度なマルチエージェント量子強化学習フレームワークである。
量子回路をRYゲート、メタ認知適応、マルチエージェント調整機構と統合する。
Q-ARDNS-Multiは、ロボット工学、自律ナビゲーション、不確実性の下での意思決定において、スケーラブルで人間らしいアプローチを提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:43:33 GMT)
Propaganda and Information Dissemination in the Russo-Ukrainian War: Natural Language Processing of Russian and Western Twitter Narratives [0.0] この記事は、戦争の開始時から収集されたプロパガンダアカウントと信頼できるアカウントからのつぶやきの分析を行う。
我々は、自然言語処理と機械学習アルゴリズムを利用して感情を評価し、主要なテーマを特定する。
以上の結果から,情報生成・拡散・ターゲットの仕方において,両面から異なる視点を対象とする異なる戦略が示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:52:04 GMT)
Probing Quantum Spin Systems with Kolmogorov-Arnold Neural Network Quantum States [0.0] 学習可能な正弦波活性化関数を持つsk波関数は、基底状態エネルギー、忠実度、および様々な相関関数を捉えることができることを示す。
鎖長の異なる$J_1-J_2$モデルの研究では、SineKANモデルが、以前に検討された神経状態のアンセットよりも優れていることが判明した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:18:40 GMT)
Predictive-CSM: Lightweight Fragment Security for 6LoWPAN IoT Networks [0.0] この研究は、この問題に対してより適応的で行動に配慮したアプローチをとる防衛戦略を探求する。
予測CSM(Predictive-CSM)と呼ばれるシステムでは,2つの軽量機構が組み合わさっている。
我々は,初期フラグメントインジェクション,リプレイヘッダ,フェイクデータによる浸水など,一連の攻撃シミュレーションを用いて,本システムをテストに適用した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:15:18 GMT)
Predicting Postoperative Stroke in Elderly SICU Patients: An Interpretable Machine Learning Model Using MIMIC Data [0.0] 高齢者集中治療室(SICU)患者における術後脳卒中は重要な合併症である。
我々はMIMIC-IIIデータベースとMIMIC-IVデータベースから19,085名の高齢者SICU入院を併用したコホートを構築した。
最初の24時間集中治療室滞在からの臨床データを用いて,院内脳卒中を予測するための解釈可能な機械学習フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:53:12 GMT)
PolyPrompt: Automating Knowledge Extraction from Multilingual Language Models with Dynamic Prompt Generation [0.0] 大規模言語モデル(LLM)の多言語機能を強化するための新しいパラメータ効率フレームワークであるPolyPromptを紹介する。
提案手法では,各言語に対するトリガトークンの集合を勾配に基づく探索により学習し,入力クエリの言語を識別し,推論中にプロンプトにプリコンパイルされた対応するトリガトークンを選択する。
我々は20億のパラメータモデルで実験を行い、15の類型的および資源的多様言語にわたる世界MMLUベンチマークで評価を行い、ナイーブおよびトランスレーショナル・ピペリンベースラインと比較して3.7%-19.9%の精度向上を示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:50:52 GMT)
Policy as Code, Policy as Type [0.0] 我々は、AgdaやLeanといった言語でABACポリシーがいかに複雑な型として表現できるかを示します。
そして、人気のある強力なオープンソースABACポリシー言語であるRegoと真っ向から対決します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:04:48 GMT)
Physical Observers and Quantum Reconstructions [0.0] 観測者は観測システムに関する予測情報のみを保持する。
エネルギー散逸の限界を低くすることで、この原理は直接的にコンパクトな予測モデルに導かれる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:37:54 GMT)
Path Signatures for Feature Extraction. An Introduction to the Mathematics Underpinning an Efficient Machine Learning Technique [0.0] データストリームからの機械学習のための特徴抽出の手段として,パスシグネチャのトピックを紹介する。
この記事では、シグネチャ方法論の基礎となる数学的理論を強調し、厳密な証明の技術的な詳細を掘り下げることなく概念的性格を強調する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:55:26 GMT)
Overcoming Data Scarcity in Scanning Tunnelling Microscopy Image Segmentation [0.0] 本稿では,数ショット学習と教師なし学習の両方を用いたSTM画像のセグメンテーションに対する自動アプローチを提案する。
3つの異なる表面における原子の特徴を認識するために,本手法の有効性を実証する。
この研究は、STM画像の効率的かつ物質に依存しない自動セグメンテーションに向けた重要なステップである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:47:37 GMT)
Optimizing Temperature Distributions for Training Neural Quantum States using Parallel Tempering [0.0] 温度最適化は変分アルゴリズムの成功率を大幅に向上させることができることを示す。
我々はこれを、制限されたボルツマンマシンとフィードフォワードネットワークという2つの異なるニューラルネットワークを用いて実証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:20:51 GMT)
Optimal compilation of parametrised quantum circuits [0.0] パラメトリクス量子回路は、量子デバイス上で回路を実行する前に古典的なアルゴリズムによって位相が決定される位相ゲートを含む。
これらのアルゴリズムを可能な限り効率的にするためには、最も少ない数のパラメータを使うことが重要である。
パラメータ数を最小化する一般的な問題はNPハードであるが、パラメトリッド位相ゲートとは別個の回路に制限されている場合、最適パラメータカウントを *can* で効率的に見つけることができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:50:26 GMT)
Optical Properties and Spin States of Inter-layer Carbon Defect Pairs in Hexagonal Boron Nitride: A First-Principles Study [0.0] 六方晶窒化ホウ素(hBN)の置換炭素欠陥は顕著な単一光子放出物質(SPE)である
我々は密度汎関数理論を用いて同一炭素種の層間二量体(C$_X$C$_X$)を研究する。
これらのC$_X$C$_X$ペアは室温で安定な三重項スピン状態を示すことができる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:28:01 GMT)
On the Baltimore Light RailLink into the quantum future [0.0] 本研究の目的は、NISQデバイスにおける固有のノイズをどのように活用し、現実世界の問題を効果的に解決できるかを明らかにすることである。
乱れの列車交通を管理するためのソリューションを生成・分析する。
我々の研究は、路面電車と鉄道の再スケジュールへの量子コンピューティングパラダイムの初歩的な応用を示している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:30:35 GMT)
Novel Benchmark for NER in the Wastewater and Stormwater Domain [0.0] 本研究では, 排水管理のためのドメイン固有テキストコーパスを開発した。
LLMベースのアプローチを含む最先端のNER手法を評価し、将来の戦略の信頼性の高いベースラインを提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:54:16 GMT)
Not All Jokes Land: Evaluating Large Language Models Understanding of Workplace Humor [0.0] プロのユーモアステートメントのデータセットと,各ステートメントの適切性を決定する機能を開発する。
5つの大言語モデルに対する評価は、LLMがユーモアの妥当性を正確に判断するのに苦戦していることを示している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:00:50 GMT)
Non-maximally entangled mixed states of X and non-X types as teleportation channels [0.0] ベル-CHSH不等式に違反する混合スピン-1/2状態はテレポーテーションに有用である。
ベル不平等に違反しない状態もあるが、それでもテレポーテーションチャネルとして有用である。
本研究では,テレポーテーションチャネルとしての有効性が研究されている非最大絡み合い型の混合状態のクラスを構築する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:57:42 GMT)
Non-adiabatically driven quantum interference effects in the ultracold K + KRb $\longrightarrow$ Rb + K$_{2}$ chemical reaction [0.0] K + KRb $longrightarrow$ Rb + K$_2$化学反応は、最初の超低温原子-珪藻化学反応である。
その結果、励起電子状態との結合によって媒介される短距離力学が量子干渉効果をもたらすことが示された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:20:17 GMT)
Model-agnostic Mitigation Strategies of Data Imbalance for Regression [0.0] データ不均衡は、回帰タスクにおいて広範囲にわたる課題として持続し、モデルパフォーマンスのバイアスを導入し、予測信頼性を損なう。
既存のサンプリング手法を構築・改善する高度な緩和手法を提案する。
モデルのアンサンブル(不均衡緩和で訓練されたモデルと、非バランスで訓練されたモデル)の構築は、これらの負の効果を著しく減少させることを実証する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:46:08 GMT)
Mixture equivalence principles and post-quantum theories of gravity [0.0] モラー・ローゼンフェルト半古典重力が弱いMEPに反することを示す。
我々は、モラー・ローゼンフェルト半古典重力はブラックホール時空の文脈における量子重力の半古典的極限ではないと主張する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:49:26 GMT)
Memory-Efficient FastText: A Comprehensive Approach Using Double-Array Trie Structures and Mark-Compact Memory Management [0.0] FastTextは、単語表現を学習するための基本的なアルゴリズムとして自らを確立した。
しかし、ハッシュベースのバケット機構は、大規模産業展開に重大な制限をもたらす。
本稿では,FastTextのメモリ管理を再定義するメモリ最適化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 02:11:22 GMT)
Memory Access Characterization of Large Language Models in CPU Environment and its Potential Impacts [0.0] 機械学習アルゴリズムはますます価値のあるツールであることが示されている。
加速器なしでより大きなモデルで推論を実行することは不可能である。
キャッシュアーキテクチャの変更により,CPUのみの環境におけるLCMの高速化を目指す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:12:22 GMT)
Magneto-optical trapping of aluminum monofluoride [0.0] 我々はモノフッ化アルミニウム(AlF)の磁気光学トラップ(MOT)を実証する。
MOTは227.5nm付近の強いA$1Pileftarrow$X$1Sigma+$遷移で動作する。
AlFのレーザー冷却とトラップは、冷却原子物理学へのアルカリ-アース原子の導入と概念的に類似している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:15:14 GMT)
MMD-Sense-Analysis: Word Sense Detection Leveraging Maximum Mean Discrepancy [0.0] 本稿では,MMD(Maximum Mean Discrepancy)を利用して意味論的に意味のある変数を選択する手法であるMDD-Sense-Analysisを提案する。
この方法は、感覚変化中の単語の識別と、複数の歴史的期間にわたるその進化の説明を可能にする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:40:46 GMT)
Load Forecasting for Households and Energy Communities: Are Deep Learning Models Worth the Effort? [0.0] エネルギーコミュニティ(EC)は、地域需要のシフトと自己充足力の向上に重要な役割を果たしている。
データ駆動予測は注目されているが、多くの実践的な文脈ではまだ十分に調査されていない。
本研究では,最先端のディープラーニングモデルの有効性を評価する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:14:39 GMT)
Leveraging Natural Language Processing to Unravel the Mystery of Life: A Review of NLP Approaches in Genomics, Transcriptomics, and Proteomics [0.0] 本稿では,NLP法を生物配列データに適用し,ゲノム学,転写学,トランスフォーマーに焦点をあてる。
我々は、Word2vecのような古典的なアプローチからハイエナ演算子を用いた高度なモデルに至るまで、様々なNLP手法がDNA、RNA、タンパク質配列、ゲノム全体を解析するためにどのように適応されているかを検討する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:54:03 GMT)
Learning collective variables that preserve transition rates [0.0] 集団変数(CV)は、高次元系の希少事象を捉える上で重要な役割を担っている。
本稿では,多様体学習のツールをグループ不変の成果化と統合したニューラルネットワークベースのCVの設計法を提案する。
遷移速度再現のための拡散テンソルにおける一様正定性の必要性に挑戦する実証的証拠を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:18:16 GMT)
Learnable Activation Functions in Physics-Informed Neural Networks for Solving Partial Differential Equations [0.0] 種々の部分微分方程式(PDE)の活性化と基底関数について検討する。
我々は収束挙動,安定性,高周波近似能力を評価する。
以上の結果から,kansは機能的次元の呪いに直面し,より深いネットワークにおける難解な最適化の展望を生んでいることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:24:13 GMT)
Joule expansion of a quantum gas [0.0] 古典的なジュール膨張実験を再考し、現在は量子分解性原子ボースガスを用いている。
温度変化が観測されなかった古典ガス実験とは対照的に, 冷却効果と加熱効果の両方を観察, 定量的に説明する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:14:34 GMT)
Is PMBOK Guide the Right Fit for AI? Re-evaluating Project Management in the Face of Artificial Intelligence Projects [0.0] 本稿では,Project Management Body of Knowledge (PMBOK) Guideフレームワークが人工知能(AI)ソフトウェアプロジェクトに適用可能であることを批判的に評価する。
PMBOKガイドのギャップには、データ管理への限定的な注力、反復的開発へのサポート不足、倫理的・多分野的な課題に関するガイダンスの欠如などが含まれる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:54:54 GMT)
Investigating Privacy Leakage in Dimensionality Reduction Methods via Reconstruction Attack [0.0] 我々は,低次元埋め込みから高次元データを再構成できるニューラルネットワークを開発した。
MNISTとNIH Chest X-rayのデータセットを用いて,再建品質に影響を及ぼす重要な要因を同定する。
実験の結果,PCA や Isomap を実行する前に画像に大きなノイズを加えると,この攻撃はひどく歪んだ再構成を生じることがわかった。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:37:36 GMT)
Inverse Microparticle Design for Enhanced Optical Trapping and Detection Efficiency in All Six Degrees of Freedom [0.0] 本稿では、効率的な電磁散乱解法と共役法を組み合わせて、共役光力学に適した印刷可能なマイクロ粒子を逆設計する計算フレームワークを提案する。
これにより、標準定在波光トラップにおける全ての翻訳度および回転度の自由度に対する量子制限運動制御の実現可能性が改善される。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:27:00 GMT)
Introduction of Additive Particle Theory for Path Integral Approaches [0.0] 経路積分アプローチは多ボソン系において成功している。
多重フェルミオン系では、符号問題のために経路積分アプローチは実現不可能である。
符号問題を回避する近似法を生成するために,加法粒子(AP)理論を導入する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:09:47 GMT)
Impact of the honeycomb spin-lattice on topological magnons and edge states in ferromagnetic 2D skyrmion crystals [0.0] 二次元ハニカム格子上に安定化した強磁性スカイミオン結晶(SkXs)のマグノンバンドトポロジーと関連するトポロジーエッジ状態(TESs)を理論的に検討した。
特定の特徴マグノンモード(楕円歪みや三角形歪みモードなど)は、三角ベースのSkXに存在しない自明なチャーン数を取得する。
この研究はさらにマグノントポロジーの顕著なリッチさを明らかにし、磁場駆動のスカイミオン変形によって生じる65個の異なるトポロジカルマグノン相を同定した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 19:29:14 GMT)
Hypertokens: Holographic Associative Memory in Tokenized LLMs [0.0] HDRAMは、トランスフォーマー潜在空間を拡散スペクトルチャネルとして扱うシンボリックメモリフレームワークである。
分散情報は、原則化されたdespreadingを通じて回復する。
アーキテクチャの変更なしに連想検索を大幅に改善する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:11:45 GMT)
Heart Rate Classification in ECG Signals Using Machine Learning and Deep Learning [0.0] 本研究は心電図信号からの心拍を2つの異なるアプローチで分類する。
従来の機械学習は、手作りの機能と、ECGビートを変換した画像によるディープラーニングを利用している。
SVMやAdaBoostのようなモデルではスコアが大幅に低くなり、このタスクには限定的な適合性を示した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:16:16 GMT)
Generative AI for Multiple Choice STEM Assessments [0.0] 本研究では,「幻覚」が教育的目的に果たすことができる生成型AIの利用について検討する。
本稿では,オンライン指導のためのM"obiusプラットフォームについて述べる。
本稿では,これらの数学的意味論と効果的に相互作用するプロンプトの製作方法を検討する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:17:37 GMT)
Generalized Hall Conductivities in Local Commuting Projector Models: Generalized Symmetries and Protected Surface Modes [0.0] 我々は (2+1)D と (3+1)D の局所通勤プロジェクタモデルを構築し、非ゼロ一般化ホール導電率を持つ。
ホール導電性は、表面電流とバルクフラックス挿入と多くのボディチャーン数によって計算される。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:11:25 GMT)
GMLM: Bridging Graph Neural Networks and Language Models for Heterophilic Node Classification [0.0] 我々は,グラフニューラルネットワーク (GNN) と事前学習言語モデル (PLM) を効率的に組み合わせた新しいアーキテクチャである textbfGraph Masked Language Model (GMLM) を提案する。
GMLMは3つの重要なイノベーションを紹介している: (i) スケーラブルなPLMテキスト処理のためのtextbfdynamic 能動ノード選択戦略; (ii) 学習可能なグラフtextt[MASK]トークンによるソフトマスクを用いたGNN固有のtextbfcontrastive pretrainingステージ; (iii) テキストbfdicated fusion。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:42:48 GMT)
From Initial Data to Boundary Layers: Neural Networks for Nonlinear Hyperbolic Conservation Laws [0.0] ニューラルネットワークを用いた非線形厳密な双曲保存則に対する初期境界値問題に対するエントロピー解の近似に対処する。
トレーニング中の高速収束と正確な予測を組み合わせた、効率的で信頼性の高い学習アルゴリズムの設計のための、汎用的で体系的なフレームワークが導入された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:12:13 GMT)
Formal Security Analysis of SPV Clients Versus Home-Based Full Nodes in Bitcoin-Derived Systems [0.0] セキュリティは、世界的コンセンサスとモデルによるトランザクションの受け入れ、執行能力、および敵の条件下での分散確率の分散に対する抵抗である。
その結果、SPVクライアントはスクリプト検証を省略するが、正直な大まかな仮定の下では暗号的に十分であることが示された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:20:25 GMT)
Focusing on Students, not Machines: Grounded Question Generation and Automated Answer Grading [0.0] 本論文は,授業教材に根ざした質問を生成し,生徒の回答を自動的に評価するシステムの基礎を提示する。
ビジュアルレイアウトで文書をチャンクする高度な手法を導入し、特にPDF文書をターゲットとした。
自動グルーピングシステムの比較を容易にするために、短い回答の自動グルーピングのための新しいベンチマークを導入した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:32:23 GMT)
Feasibility Study of CNNs and MLPs for Radiation Heat Transfer in 2-D Furnaces with Spectrally Participative Gases [0.0] そこで我々は,2次元壁状領域における放射熱伝達解を近似する代理モデルを構築した。
この研究の独創性は、CNNアーキテクチャに適合するために問題(ガスと壁の特性)の入力を適応させることにある。
CNNアーキテクチャの性能は、より古典的なアーキテクチャと比較される。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 14:06:44 GMT)
FSM Modeling For Off-Blockchain Computation [0.0] ブロックチェーンに対するスマートコントラクトのメリットは、ブロックチェーンのサイズと実行によるコストの増大にあります。
スマートコントラクトの特定の部分をオフチェーンで実行する際に発生する3つの根本的な問題に対処する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:46:31 GMT)
Exploring quantum properties of bipartite mixed states under coherent and incoherent basis [0.0] 我々は、コヒーレンスを推定するために使用される基底の正しい選択が分離可能な基底であることを示す。
まずベル状態とその1つの状態を用いて準備された2つの量子ビット混合状態における絡み合いと量子コヒーレンスを計算する。
次に、これらの混合状態のテレポーテーション忠実度を計算し、従来のテレポーテーション忠実度より大きい領域を求める。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:00:24 GMT)
Evaluation of Seismic Artificial Intelligence with Uncertainty [0.0] ディープラーニングモデル(DLM)の評価と比較のための評価フレームワークを開発する。
私たちのフレームワークは、実践者が自身の問題に対して最適なモデルを選択し、パフォーマンスの期待を定めるのに役立ちます。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:04:47 GMT)
Euclidean-Monte-Carlo-informed ground-state preparation for quantum simulation of scalar field theory [0.0] 1+1次元の量子場理論の基底状態を作成するための、効率的な量子回路を生成するための、完全に古典的なパイプラインを提案する。
この研究は、古典的に得られた状態の知識を体系的に応用し、自然における理論の量子場の正確な初期状態を作成する方法を開く。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 23:02:45 GMT)
Estimating properties of a homogeneous bounded soil using machine learning models [0.0] 本研究は, 水分測定から土壌特性を推定することに焦点を当てた。
本研究では, 垂直浸透を規定する初期境界値問題を, 均質で有界な土壌プロファイルで解くことによって生成したシミュレーションデータについて考察する。
2出力回帰タスクとして定式化されるパラメータ識別問題に対処するため,様々な機械学習モデルについて検討する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:25:03 GMT)
Enhancing Customer Service Chatbots with Context-Aware NLU through Selective Attention and Multi-task Learning [0.0] 顧客意図を予測するためのコンテキスト認識型NLUモデルを提案する。
新規な選択的アテンションモジュールは、関連するコンテキスト特徴を抽出するために使用される。
当社では、Walmartのカスタマケアドメインの本番環境にモデルをデプロイしています。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:24:28 GMT)
Engram Memory Encoding and Retrieval: A Neurocomputational Perspective [0.0] エングラム理論は、長期記憶を支えるために物理的および生化学的変化を継続する神経細胞のスパース集団が存在していることを示唆している。
本稿では, 細胞性神経科学と計算モデルからの知見を合成し, エングラム研究における重要な課題に対処する。
それは、可塑性と空間的制約の相互作用から記憶効率、容量、安定性が現れることを示唆している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:30:39 GMT)
Energetics of self-organization in a dissipative two-site quantum system driven by single-photon pulses [0.0] 散逸性量子系における非平衡自己組織化の原理を見つけることは開問題である。
量子コヒーレンスがこのようなインプリントを、現在のモデルにおける自己組織化のエネルギー学に残すことを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:15:33 GMT)
Emergent symmetry in a two-Higgs-doublet model from quantum information and magic [0.0] 我々は、遷移行列による初期状態密度行列の可換性によって符号化された一般的な量子情報理論の原理で研究する。
任意の初期状態を散乱するポテンシャルのクォート部分の$mathrmSO(8)$対称性を示す一貫した条件の集合を見つける。
これは、初期状態におけるボース対称性を考慮し、アイソスピンとフレーバー部分空間の間の絡み合いをもたらす。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 04:53:35 GMT)
Emergence of thermodynamic functioning regimes from finite coupling between a quantum thermal machine and a load [0.0] 機械と負荷の結合の温度と大きさを調整することにより、熱機械は4つのモードで動作可能であることを示す。
結合強度を増加させると, エンジンモードが抑制され, 冷凍機モードは実現不可能であることが示される。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 16:40:21 GMT)
Embedded Acoustic Intelligence for Automotive Systems [0.0] この抽象概念は、学位論文研究の知見を活用して、自動車システムインテリジェンスを強化する。
自動車のホイールベース内に設置したマイクロホンから音響署名を抽出し,解釈することにより,道路タイプを分類することに集中する。
提案手法は,道路面の予測,アクティブな道路騒音キャンセリングのための適応学習支援,都市計画のための貴重な洞察を生み出すことを目的としている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:34:40 GMT)
Efficient fiber coupling of telecom single-photons from circular Bragg gratings [0.0] 光共振器における量子ドットの3つの実験条件下でのファイバー結合性能について検討する。
先端に3Dプリント光学系を有する単モード繊維の結合効率と空間変位に対する感度を定量化する。
メカニカルに安定なファイバーカップリング源を実現するためには, 繊維キャビティの不整合に対する空間的耐性を正確に定量化する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:31:27 GMT)
Efficient Speech Translation through Model Compression and Knowledge Distillation [0.0] 本稿では,音声翻訳のための大規模音声モデルの効率的な展開という課題に対処する。
我々は,4ビット量子化(QLoRA)による低ランク適応,知識蒸留に基づく反復層プルーニングを用いる。
筆者ら(学生)モデルは,モデルパラメータとストレージフットプリントの両方を最大50%削減すると同時に,ドメイン内(教師)モデルの翻訳品質の97-100%を維持できる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:59:54 GMT)
ETDI: Mitigating Tool Squatting and Rug Pull Attacks in Model Context Protocol (MCP) by using OAuth-Enhanced Tool Definitions and Policy-Based Access Control [0.0] モデルコンテキストプロトコル(MCP)は、大規模言語モデル(LLM)の機能拡張において重要な役割を果たす。
標準の MCP 仕様では,特に Tool Poisoning や Rug Pull 攻撃など,重大なセキュリティ上の脆弱性が報告されている。
本稿では,MPPの強化を目的としたセキュリティ拡張であるETDI(Enhanced Tool Definition Interface)を紹介する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:22:38 GMT)
Dynamic Software Updating in Java -- Comparing Concepts and Resource Demands [0.0] 動的ソフトウェア更新(DSU)は、ソフトウェア進化において非常に有用な機能である。
ダウンタイムコストの削減、セキュリティ強化、プロファイリング、新機能のテストに使用することができる。
このトピックによって導入された様々な問題に関して、動的ソフトウェア更新に関する多くの研究と解決策がある。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:04:49 GMT)
Don't Push the Button! Exploring Data Leakage Risks in Machine Learning and Transfer Learning [0.0] 本稿では、意図しない情報がトレーニングデータを汚染し、モデルの性能評価に影響を与える機械学習(ML)における重要な問題に対処する。
新たなデータに対する評価と実際のパフォーマンスの相違は大きな懸念事項である。
データ漏洩と対処中の特定のタスクとの関係を調査し、Transfer Learningにおけるその発生を調査し、標準的なインダクティブMLとトランスダクティブMLフレームワークを比較します。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:53:48 GMT)
Distributionally Robust Learning in Survival Analysis [0.0] 我々は、分散ロバスト学習(DRL)アプローチをCoxレグレッションに組み込む革新的なアプローチを導入する。
DRLフレームワークをワッサーシュタイン距離に基づく曖昧性集合で定式化することにより、基礎となるデータ分布の仮定に敏感でない変種コックスモデルを開発する。
従来の手法と比較して,予測精度とロバスト性の観点から,回帰モデルが優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 06:11:22 GMT)
Distinguishing Autonomous AI Agents from Collaborative Agentic Systems: A Comprehensive Framework for Understanding Modern Intelligent Architectures [0.0] 大規模言語モデルの出現は、人工知能の2つの異なる相互接続パラダイム、すなわちスタンドアロンAIエージェントと協調エージェントAIエコシステムを触媒した。
本研究は, 運用原則, 構造構成, 配置方法論の体系的解析を通じて, これらのアーキテクチャを識別するための決定的な枠組みを確立する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:52:23 GMT)
Dirty and Clean-Label attack detection using GAN discriminators [0.0] 本研究は、GAN識別器を用いて、異なるレベルの修正画像に対して単一のクラスを保護する。
その結果, 単一クラスでのトレーニング後, GAN識別器の信頼度スコアは, ラベルの誤りを識別するための閾値を与える可能性が示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 00:32:07 GMT)
Dhvani: A Weakly-supervised Phonemic Error Detection and Personalized Feedback System for Hindi [0.0] CAPT(Computer-Assisted Pronunciation Training)は、英語で広く研究されている。
15億人の話者の基盤を持つインド語への適用には、依然として重大なギャップがある。
本稿では,ヒンディー語のための新しいCAPTシステムであるDhvaniを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:45:52 GMT)
Deep Learning in Business Analytics: A Clash of Expectations and Reality [0.0] ディープラーニング(DL)の利点は多様体であるが、これまでのところ、幅広い業界採用を妨げる制限が伴っている。
ディープラーニングの採用は、計算複雑性だけでなく、ビッグデータアーキテクチャの欠如、透明性(ブラックボックス)の欠如、スキル不足、リーダシップのコミットメントにも影響している。
この結果から,ビジネス分析における構造化データセットの予測モデルとして,勾配向上が考えられることが強く示唆された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:31:16 GMT)
Covariant correlation-disturbance and its experimental realization with spin-1/2 particles [0.0] 任意の次元のヒルベルト空間における逐次$n$アウトカム量子測定における相関と外乱の正確なトレードオフ関係を定式化する。
我々は、単一光子検出器の特性雑音の直接推定、暗カウント、有限検出効率の最適トレードオフ関係を利用する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:37:52 GMT)
Converting entanglement into ensemble basis-free coherence [0.0] コヒーレンス(Coherence)は、与えられた量子系に量子的性質が存在する程度に対処する。
量子状態のアンサンブルに対するコヒーレンス対策は、現在も活発な研究領域である。
本稿では,一定量の絡み合いからアンサンブルコヒーレンスを生成する2つの方法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:32:11 GMT)
Contrastive Learning for Efficient Transaction Validation in UTXO-based Blockchains [0.0] 本稿では,ビットコインなどのUTXOベースのブロックチェーンのスケーラビリティに対する機械学習(ML)アプローチを紹介する。
私たちのソリューションでは、MLを使用して、UTXOセットシャーディングだけでなく、入ってくるトランザクションのルーティングも最適化しています。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:54:39 GMT)
Confabulation dynamics in a reservoir computer: Filling in the gaps with untrained attractors [0.0] 貯水池コンピュータ(RC)における衝突の発生状況について検討する。
RCが与えられたアトラクションのダイナミクスを再構築するために訓練された場合、彼らは時にアトラクションを構築するために訓練されていないアトラクションを組み立てる。
本稿では,再建に失敗する場合にUAが果たす役割と,再建されたアトラクション間の遷移をモデル化する場合の影響について述べる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:06:28 GMT)
Concept Based Explanations and Class Contrasting [0.0] 本稿では,概念に基づく説明手法を導入し,個々のクラスの予測と2つのクラスを対比する手法を提案する。
我々は、ImageNet1Kでトレーニングされたオープンソースの分類モデルでテストする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:09:12 GMT)
Comparison of spectrogram scaling in multi-label Music Genre Recognition [0.0] 本稿では、モデルトレーニングのための複数の前処理手法とアプローチについて述べ、比較する。
実験には、18000以上のエントリを手動でラベル付けしたカスタムデータセットが使用されている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:11:36 GMT)
Classifying Entanglement by Algebraic Geometry [0.0] 論文は代数幾何学的ツールを用いた多部交絡の特徴をカバーしている。
我々は多部交絡を$k$secibilityant variety of the variety $ell$-multilinear rankで分類するアルゴリズムを確立する。
本稿では,このアルゴリズムに基づくマルチキュービットおよびトリパルタイトエンタングルメントの微細構造分類について述べる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:38:21 GMT)
ChitroJera: A Regionally Relevant Visual Question Answering Dataset for Bangla [0.0] 我々は大規模なBangla VQAデータセットであるChitroJeraを導入し、多種多様なローカルなデータソースから15万以上のサンプルを収集した。
我々は,テキストエンコーダ,画像エンコーダ,マルチモーダルモデル,新しいデュアルエンコーダモデルの性能を評価する。
既存のデータセットの未開発状況を考えると、Banglaにおけるビジョンランゲージタスクの範囲を拡大するChitroJeraを想定する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:38:12 GMT)
Cavity QED with molecular defects coupled to to a photonic crystal cavity [0.0] 我々は、寿命制限エミッタを集積フォトニックキャビティ内の集団共鳴に組み込むために、恒久的なスペクトルチューニングを実装した。
これは、複数のコヒーレント量子エミッタとスケーラブルなナノフォトニクスを組み合わせた固体キャビティQEDの根本的な課題に対処する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:37:02 GMT)
Catching Stray Balls: Football, fandom, and the impact on digital discourse [0.0] 本稿では,サッカーに対する感情的反応がReddit上のデジタル空間におけるオンライン談話にどのように影響するかを検討する。
現実世界の出来事がコミュニティをまたがる感情の変化を引き起こすことが示されています。
否定的な感情は問題のある言語と相関し、結果が直接感情やポストの習慣に影響を与える。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:16:06 GMT)
Can the Infamous Boundary Be Found in Macromolecules? Also, von Neumann vs. Schroedinger ensembles, and `Hund's Paradox' in quantum chemistry [0.0] ジョン・ベルは古典物理学が量子物理学から切り離された点について「悪名界」という言葉を作った。
ここでは、この問題は熱アンサンブルの選択と量子化学におけるいわゆる「フンズ・パラドックス」に密接に関係していることを示します。
非対称高分子中に潜むIBを明らかにする実験的なセットアップを提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 20:11:14 GMT)
Can We Trust Machine Learning? The Reliability of Features from Open-Source Speech Analysis Tools for Speech Modeling [0.0] 機械学習に基づく行動モデルは、オーディオ視覚記録から抽出された特徴に依存している。
機械学習ツールは、振る舞いに関連する情報をキャプチャする際の信頼性を保証するための検証を欠くことが多い。
自閉症児を対象に,広範に使用されている2つの音声分析ツールOpenSMILEとPratから抽出した音声特徴を評価し,その信頼性を評価する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 18:55:53 GMT)
COALESCE: Economic and Security Dynamics of Skill-Based Task Outsourcing Among Team of Autonomous LLM Agents [0.0] COALESCEは、自律型大規模言語モデル(LLM)エージェントが特定のサブタスクを、特殊で費用対効果の高いサードパーティのLCMエージェントにアウトソースできるように設計された、新しいフレームワークである。
239の理論的シミュレーションによる総合的な検証は41.8%のコスト削減の可能性を示している。
240の実際のLCMタスクにわたる大規模な実証検証により、適切なエプシロン-グレディー探索によって20.3%のコスト削減が確認された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 17:22:47 GMT)
Building Entity Association Mining Framework for Knowledge Discovery [0.0] 実体や概念や関連採掘の相互作用を捉えることは、テキストマイニングにおいて重要な要素である。
文書フィルタリング(Document filtering)、様々なソース(または技術)をプラグインやアソシエーションマイニングとして利用し、テキストマイニングビジネスのユースケースを構築する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:08:38 GMT)
Bemba Speech Translation: Exploring a Low-Resource African Language [0.0] 本稿では,国際音声言語翻訳会議(IWSLT 2025)へのシステム提出について述べる。
我々はWhisperとNLLB-200をベースとしたカスケード音声翻訳システムを構築し,バックトランスレーションなどのデータ拡張技術を採用した。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 12:55:06 GMT)
Behind Closed Words: Creating and Investigating the forePLay Annotated Dataset for Polish Erotic Discourse [0.0] 本稿では,エロティックなコンテンツ検出のためのポーランド語データセットであるforePLayを紹介する。
このデータセットは、曖昧さ、暴力、社会的受容不能な次元を含む多次元分類を含む24k以上の注釈付き文を特徴としている。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 21:36:22 GMT)
Automated machine learning: AI-driven decision making in business analytics [0.0] 本稿では、ビジネス分析におけるアプリケーションにおけるAutoMLの可能性について分析する。
H2O AutoMLフレームワークは、手動でチューニングされたMLモデルに対してベンチマークされた。
高速で、使いやすく、信頼性の高い結果を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 07:25:41 GMT)
Assurance of AI Systems From a Dependability Perspective [0.0] リスクの高いコンピュータベースのシステムに対する古典的保証の原則を概説する。
次に、人工知能(AI)と機械学習(ML)を用いたシステムへのこれらの原則の適用を検討する。
AIとMLを用いた認識を必要とするガードに対しては、これらの要素に置かれる信頼を最小限にする方法を検討する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 22:38:38 GMT)
Are Hilbert Spaces Unphysical? Hardly, My Dear! [0.0] 任意の量子系の状態がヒルベルト空間のベクトルであることは広く受け入れられている。
この論文は、物理的状態がヒルベルト空間の要素であるという仮定に固有の、想定できない難しさを指摘しようとする。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:03:03 GMT)
Are Crypto Ecosystems (De)centralizing? A Framework for Longitudinal Analysis [0.0] 本稿では、暗号エコシステムの分散化を経時的に測定するフレームワークを提案し、よく使われる分散化メトリクスと比較する。
我々の分析によると、暗号通貨は時間とともに分散化が進んでいるが、最近のトレンドはコンセンサス層やNTTマーケットプレース、開発者への集中化へのシフトを示している。
我々のフレームワークと結果は、暗号エコシステムの設計、規制、実装について研究者、政策立案者、実践者に知らせます。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 23:45:33 GMT)
Anomaly of conserved and nonconserved axial charges in Hamiltonian lattice gauge theory [0.0] 保存された軸方向電荷は連続時空における軸方向の異常関係を正しく再現することを示す。
我々の発見は、格子ゲージ理論のための量子コンピューティングの研究に貴重な洞察を与えるだろう。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 05:27:31 GMT)
Agentic AI and Multiagentic: Are We Reinventing the Wheel? [0.0] AI Agenticという言葉は、基本的にAIエージェントのバズワードとしてよく使われ、AI Multiagenticはマルチエージェントシステムのバズワードとして使われる。
この混乱は、自律エージェントとマルチエージェントシステムの分野における数十年の研究を見落としている。
この論文は、科学と技術に関する厳密さと、AIにおける最先端技術から確立された用語の使用を提唱している。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:19:11 GMT)
Advanced Nanostructured Topical Therapeutics for Psoriasis: Strategic Synthesis, Multimodal Characterization, and Preliminary Pharmacodynamic Profiling [0.0] Psoriasisは長期にわたる炎症性皮膚疾患であり、治療は困難である。
魚コラーゲンと寒天を原料としたゲル中で, 金属酸化物ナノ粒子と天然植物抽出物を配合した新しい局所処理法を開発した。
この定式化は乾生の動物モデルで試験された。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 11:56:19 GMT)
A is for Absorption: Studying Feature Splitting and Absorption in Sparse Autoencoders [0.0] 階層的特徴のスパース分解と分割は堅牢ではないことを示す。
具体的には、モノセマンティックな特徴が本来あるべき場所に放たれるのに失敗し、代わりに子供の特徴に"吸収"されることを示す。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 10:58:16 GMT)
A first look at ROS 2 applications written in asynchronous Rust [0.0] ROS 2の既存のリアルタイムスケジューリングとレスポンスタイム分析技術は、C++で記述されたアプリケーションに焦点を当てている。
非同期Rust ROS 2バインディングとさまざまな非同期ランタイムRustのR2Rの実行モデルを分析する。
本稿では,スレッド優先化とコールバック・ツー・スレッドマッピング方式を含む決定論的リアルタイム操作を目的としたR2Rアプリケーションの構造化手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 13:09:50 GMT)
A Study on the MCP x A2A Framework for Enhancing Interoperability of LLM-based Autonomous Agents [0.0] 現代のAIシステムでは、自律エージェントと外部ツールとの統合が、実用的なAIアプリケーションを構築する上で不可欠な要素となっている。
本稿では,Googleが開発したオープンソースのエージェント・ツー・エージェント(A2A)プロトコルと,Arthropicが導入したモデルコンテキストプロトコル(MCP)の詳細な技術分析と実装手法について述べる。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 15:46:16 GMT)
A Practical Guide for Supporting Formative Assessment and Feedback Using Generative AI [0.0] 大規模言語モデル(LLM)は、学生、教師、同僚が「学習者が行く場所」、「学習者が現在いる場所」、「学習者を前進させる方法」を理解するのに役立つ。
本総説では,LSMを形式的評価に統合するための総合的な基盤を提供する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:21:31 GMT)
A Novel Context-Adaptive Fusion of Shadow and Highlight Regions for Efficient Sonar Image Classification [0.0] 影領域は、対象の検出と分類に不可欠な手段を提供するが、既存の研究は主にハイライトに基づく分析に焦点を当てている。
本稿では,高度な画像処理技術を活用して識別影を抽出・統合し,特徴を強調表示するコンテキスト適応型ソナー画像分類フレームワークを提案する。
S3Simulator+は、水中ソナードメインに特化された物理インフォームドノイズを海軍機雷シナリオに組み込んだ拡張データセットである。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 09:01:46 GMT)
A New Genuine Multipartite Entanglement Measure: from Qubits to Multiboundary Wormholes [0.0] 量子系における真の多重粒子絡みを特徴付ける新しい尺度として、潜在エントロピー(L-エントロピー)を導入する。
本研究は,多粒子状態絡み合いモノトンとして機能し,混合多粒子状態への拡張を短時間で行うことを実証する。
CFT双対のLエントロピーのページ状曲線を多境界ワームホールモデルに導出することによりホログラフィーへの応用を考察する。
論文参考訳(メタデータ) (Mon, 02 Jun 2025 08:35:40 GMT)