Distilling On-device Language Models for Robot Planning with Minimal Human Intervention [117.9] PRISMは、SLM(Small Language Model)対応ロボットプランナーを蒸留するためのフレームワークである。
PRISMを3つのLCM対応プランナーに適用し、マッピング、探索、操作、家事支援を行う。
GPT-4o の 10-20% から 93% 以上まで, PRISM は Llama-3.2-3B の性能を向上することを示した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 21:44:27 GMT)
Embodied Web Agents: Bridging Physical-Digital Realms for Integrated Agent Intelligence [109.3] Embodied Web Agentsは、エンボディメントとWebスケール推論を流動的にブリッジする、AIエージェントのための新しいパラダイムである。
多様なタスクスイートを含むEmbodied Web Agents Benchmarkをリリースする。
その結果、最先端のAIシステムと人間の能力の間には、大きなパフォーマンスのギャップが浮かび上がっている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:05:04 GMT)
Nature Language Model: Deciphering the Language of Nature for Scientific Discovery [105.6] 基礎モデルは自然言語処理と人工知能に革命をもたらした。
本研究では,科学発見のためのシーケンスベース科学基盤モデルであるNatureLMを紹介する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 05:18:13 GMT)
Memory-enhanced Retrieval Augmentation for Long Video Understanding [91.7] 本稿では,メモリ強化型RAGベースの新しいアプローチであるMemVidを紹介する。
提案手法は,1) 全体的映像情報の記憶,2) メモリに基づくタスクの情報要求の推論,3) 情報要求に基づくクリティカルモーメントの検索,4) 最終回答を生成するための検索モーメントの抽出という4つの基本的なステップで機能する。
MemVid は LVLM 法と RAG 法に比較して, 効率と有効性を示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:15:14 GMT)
Real-time Free-view Human Rendering from Sparse-view RGB Videos using Double Unprojected Textures [87.8] スパースビューのRGB入力からのリアルタイム自由視点人体レンダリングは、センサー不足と厳しい時間予算のために難しい課題である。
本稿では,2重非投影テクスチャについて述べる。その中心部では外観合成から粗い幾何学的変形推定を行う。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:50:55 GMT)
Does Multimodality Lead to Better Time Series Forecasting? [84.7] このようなマルチモーダル積分がどのような条件で常に得られるかは、まだ不明である。
本稿では,時系列とテキスト表現をアライメントするアライメント・ベース・メソッドと,予測のための大規模言語モデルを直接促進するプロンプト・ベース・メソッドの2つの一般的なマルチモーダル予測パラダイムを評価する。
その結果,1)高容量テキストモデル,(2)比較的弱い時系列モデル,(3)適切な整合戦略などにより,テキスト情報を組み込むことが最も有用であることが示唆された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:55:56 GMT)
Cache Me If You Can: How Many KVs Do You Need for Effective Long-Context LMs? [79.6] 言語モデルは、書籍要約のようなタスクに対して、ますます長いコンテキストを扱う。
これによりキーバリュー(KV)キャッシュのメモリコストが増大する。
以前の多くの研究でKVをメモリから外す方法が提案されているが、そのアプローチは好ましい設定に適合している。
KVフットプリント*は、記憶中のKVエントリの量と寿命の両方を考慮し、統一された計量として提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:21:12 GMT)
VLN-R1: Vision-Language Navigation via Reinforcement Fine-Tuning [77.3] Vision-Language Navigation(VLN)は、エージェントが自然言語命令を使用して現実世界の環境をナビゲートする必要がある、AIの実施における中核的な課題である。
本稿では、LVLM(Large Vision-Language Models)を利用して、エゴセントリックな動画ストリームを連続的なナビゲーションアクションに変換するエンドツーエンドフレームワークであるVLN-R1を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:59:59 GMT)
Rydberg Atomic Quantum Receivers for Multi-Target DOA Estimation [77.3] ライドバーグ原子量子受信機(RAQR)は、古典的な無線通信とセンシングのための有望なソリューションとして登場した。
まず、マルチターゲットDOA検出のためのRydberg原子量子一様線形アレイ(RAQ-ULA)を用いた無線受信機を提案し、このセンシングシステムの対応する信号モデルを提案する。
このセンサゲインミスマッチ問題を解決するために,我々のモデルに依存するRydberg原子量子ESPRIT(RAQ-ESPRIT)を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:23:00 GMT)
Kaleidoscopic Teaming in Multi Agent Simulations [75.5] 我々は,エージェントが行う複雑な行動,思考プロセス,行動の安全性リスクを評価する上で,既存のレッドチームや安全評価フレームワークは不十分であると主張している。
我々は,新しいコンテキスト内最適化手法を導入し,安全解析のためのより良いシナリオを生成する。
エージェントの安全性を測定するためのフレームワークとともに使用できる適切なメトリクスを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:37:17 GMT)
Private Training & Data Generation by Clustering Embeddings [74.0] 差分プライバシー(DP)は、個々のデータを保護するための堅牢なフレームワークを提供する。
本稿では,DP合成画像埋め込み生成のための新しい原理的手法を提案する。
経験的に、合成的に生成された埋め込みに基づいて訓練された単純な2層ニューラルネットワークは、最先端(SOTA)分類の精度を達成する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 00:17:14 GMT)
Resource Rational Contractualism Should Guide AI Alignment [69.1] 契約主義的アライメントは、多様な利害関係者が支持する合意の中で決定を下すことを提案する。
我々は、AIシステムが合理的な当事者が形成する合意を近似する枠組みであるリソース・リアリズムを提案する。
RRC対応エージェントは、効率的に機能するだけでなく、変化する人間の社会世界への適応と解釈を動的に行うことができる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:57:13 GMT)
SocialSim: Towards Socialized Simulation of Emotional Support Conversation [68.5] 感情的サポートの会話をシミュレートする新しいフレームワークSocialSimを紹介する。
SocialSimは、社会的情報開示と社会的認識という、社会的相互作用の重要な側面を統合している。
大規模合成ESCコーパスであるSSConvを構築し,クラウドソーシングESCデータを超える品質を実現する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 05:24:40 GMT)
Fast correlated decoding of transversal logical algorithms [67.0] 大規模計算には量子エラー補正(QEC)が必要であるが、かなりのリソースオーバーヘッドが発生する。
近年の進歩により、論理ゲートからなるアルゴリズムにおいて論理キュービットを共同で復号化することにより、症候群抽出ラウンドの数を削減できることが示されている。
ここでは、回路を介して伝播する関連する論理演算子製品を直接復号することで、回路の復号化の問題を修正する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:04:22 GMT)
High-Dimensional Interlingual Representations of Large Language Models [65.8] 大規模言語モデル(LLM)は、多言語データセットに基づいて訓練され、言語間構造の形成を示唆する。
資源レベル, 類型, 地理的地域によって異なる31の多様な言語を探索する。
多言語 LLM は非一貫性な言語間アライメントを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:55:07 GMT)
Universal Music Representations? Evaluating Foundation Models on World Music Corpora [65.7] ファンデーションモデルは音楽情報検索に革命をもたらしたが、一般化する能力については疑問が残る。
本稿では,6つの音楽コーパスにまたがる5つの最先端オーディオ基礎モデルの包括的評価を行う。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:06:44 GMT)
DeSPITE: Exploring Contrastive Deep Skeleton-Pointcloud-IMU-Text Embeddings for Advanced Point Cloud Human Activity Understanding [65.7] DeSPITEはDeep Skeleton-Pointcloud-IMU-Text Embeddingモデルである。
MSR-Action3D と HMPEAR の実験により,DeSPITE は点雲 HAR に対する効果的な事前学習戦略であることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:16:26 GMT)
EF21 with Bells & Whistles: Six Algorithmic Extensions of Modern Error Feedback [65.6] 本稿では, 圧縮機により誘導されるマルコフ圧縮機の構成に基づく新しい誤差フィードバック機構EF21を提案する。
これらの技法のいくつかはEF21と組み合わせて分析されていない。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:11:24 GMT)
Large Language Model Unlearning for Source Code [65.4] PRODは、LLMがコード生成能力を保ちながら、望ましくないコード内容を忘れることができる新しいアンラーニングアプローチである。
本評価は,既存の未学習アプローチと比較して,忘れ品質とモデルユーティリティのバランスが良好であることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:27:59 GMT)
MEXA: Towards General Multimodal Reasoning with Dynamic Multi-Expert Aggregation [64.9] MEXAは、エキスパートモデルのモダリティおよびタスク対応アグリゲーションを実行する、トレーニング不要のフレームワークである。
我々は,ビデオ推論,オーディオ推論,3D理解,医用QAなど,多様なマルチモーダルベンチマークに対するアプローチを評価した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:14:13 GMT)
Think&Cite: Improving Attributed Text Generation with Self-Guided Tree Search and Progress Reward Modeling [64.0] 大型言語モデル(LLM)は幻覚を起こし、事実的に誤った情報を生み出す傾向にある。
我々はThink&Citeと呼ばれる新しいフレームワークを提案し、検索と統合された多段階推論問題として属性付きテキスト生成を定式化する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:47:25 GMT)
LaRS: Latent Reasoning Skills for Chain-of-Thought Reasoning [61.8] Chain-of-Thoughting(CoT)プロンプトは、大規模言語モデル(LLM)のための一般的なコンテキスト内学習手法である。
本稿では、教師なし学習を用いて有理数の潜在空間表現を生成するLaRS(Lalatnt Reasoning Skills)という新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:50:07 GMT)
The Importance of Being Lazy: Scaling Limits of Continual Learning [61.0] モデル幅の増大は,特徴学習の量を減らし,遅延度を高めた場合にのみ有益であることを示す。
特徴学習,タスク非定常性,および忘れることの複雑な関係について検討し,高い特徴学習が極めて類似したタスクにのみ有用であることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:12:38 GMT)
Network Sparsity Unlocks the Scaling Potential of Deep Reinforcement Learning [57.4] 静的ネットワークの疎結合を単独で導入することで,最先端アーキテクチャの高密度化を超えて,さらなるスケーリング可能性を実現することができることを示す。
解析の結果,高密度DRLネットワークをネーティブにスケールアップするのとは対照的に,疎ネットワークは高いパラメータ効率とネットワーク表現性を両立させることがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:54:24 GMT)
Language Bottleneck Models: A Framework for Interpretable Knowledge Tracing and Beyond [56.0] 我々は、知識追跡を逆問題として再考する: 過去の回答を説明できる最小限の自然言語要約を学習し、将来の回答を予測できる。
我々のLanguage Bottleneck Model(LBM)は、解釈可能な知識要約を書くエンコーダLLMと、その要約テキストのみを使用して生徒の反応を再構成し予測しなければならないフリーズデコーダLLMで構成されている。
合成算術ベンチマークと大規模Eediデータセットの実験により、LBMは最先端のKT法と直接LLM法の精度に匹敵する一方で、受講者軌道のオーダーを少なくすることを示した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:21:14 GMT)
LSCD: Lomb-Scargle Conditioned Diffusion for Time series Imputation [55.8] 欠落または不規則なサンプルデータを持つ時系列は、機械学習において永続的な課題である。
我々は,不規則サンプルデータのパワースペクトルの信頼性の高い計算を可能にする,異なるLombiable-Scargle層を導入する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:48:42 GMT)
TeSG: Textual Semantic Guidance for Infrared and Visible Image Fusion [55.3] Infrared and visible image fusion (IVF) は、画像モダリティの相補的な情報を組み合わせることを目的としている。
テキスト意味論は,マスクの意味レベルとテキスト意味レベルという2つのレベルで導入する。
画像合成プロセスのガイドとなる赤外線・可視画像融合のためのテクスチュアル・セマンティック・ガイダンスを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:53:07 GMT)
When can isotropy help adapt LLMs' next word prediction to numerical domains? [54.0] 文脈埋め込み空間におけるLLM埋め込みの等方性は表現の基盤構造を保存することが示されている。
実験により、数値データとモデルアーキテクチャの異なる特性が等方性に異なる影響があることが示されている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 21:50:22 GMT)
Sekai: A Video Dataset towards World Exploration [53.2] 世海(せかい)は、世界探検のためのリッチアノテーションを備えた高品質なファーストパーソン・ビデオ・データセットである。
750都市にまたがる100か国以上の地域から、5000時間以上のウォーキングやドローンビュー(FPVとUVA)ビデオで構成されている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:03:18 GMT)
LunarLoc: Segment-Based Global Localization on the Moon [52.4] GPSのような従来の地球ベースのナビゲーションインフラが利用できない月面での自律的な運用には、グローバルなローカライゼーションが不可欠である。
本稿では,グローバルなローカライゼーション手法であるLunarLocを提案する。
LunarLocは、マルチセッショングローバルローカライゼーション実験において、サブcmレベルの精度を実現し、月のグローバルローカライゼーションにおける技術状況を大幅に上回っている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:06:47 GMT)
Geopolitical biases in LLMs: what are the "good" and the "bad" countries according to contemporary language models [52.0] 我々は、中立なイベント記述と異なる国からの視点を対比した新しいデータセットを導入する。
以上の結果から,特定の民族的物語のモデルが好まれる,重要な地政学的偏見がみられた。
単純なデバイアスのプロンプトはこれらのバイアスを減らすのに限られた効果があった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:03:21 GMT)
A CLIP-Powered Framework for Robust and Generalizable Data Selection [51.5] 実世界のデータセットは、しばしば冗長でノイズの多いデータを含み、トレーニング効率とモデルパフォーマンスに悪影響を及ぼす。
データ選択は、データセット全体から最も代表的なサンプルを特定することを約束している。
より堅牢で一般化可能なサンプル選択にマルチモーダル情報を活用するCLIPを利用した新しいデータ選択フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:41:06 GMT)
Revisiting Multi-Agent Debate as Test-Time Scaling: A Systematic Study of Conditional Effectiveness [50.3] マルチエージェントの議論(MAD)アプローチは、モノリシックモデルに対する推論、堅牢性、多様な視点を提供する。
本稿では,MADを実験時間計算のスケーリング手法として概念化し,協調的な改良と多様な探索能力で区別する。
我々は、MADと強力なセルフエージェントテストタイムスケーリングベースラインを数学的推論と安全関連タスクに基づいて比較した総合的な実証的研究を行う。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:07:38 GMT)
Group-Level Data Selection for Efficient Pretraining [49.2] Group-MATESは、言語モデル事前訓練の速度品質フロンティアを最適化する効率的なグループレベルのデータ選択手法である。
Group-MATESは、リレーショナルデータの影響モデルを用いてコストの高いグループレベルの選択をパラメータ化する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:30:04 GMT)
Power-like potentials: from the Bohr-Sommerfeld energies to exact ones [49.2] ボーア・ソマーフェルド量子化条件から明示的に抽出されたボーア・ソマーフェルドエネルギー(BSE)と正確なエネルギーを比較する。
物理的に重要な場合、$m=1,4,6$ for the 100$th excited state BSE and exactly one in 5-6 figures。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:24:43 GMT)
Discrepancies are Virtue: Weak-to-Strong Generalization through Lens of Intrinsic Dimension [48.4] W2S(Wak-to-strong)一般化(W2S)とは、弱い教師が生成した擬似ラベルに基づいて強力な学生モデルを訓練するファインタニング(FT)の一種である。
我々は、分散還元の観点から、リッジレス回帰設定におけるW2Sを解析する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:26:36 GMT)
FOCUS: Unified Vision-Language Modeling for Interactive Editing Driven by Referential Segmentation [47.8] 最近のLVLM(Large Vision Language Models)は、視覚的理解と生成的モデリングを統一する有望な能力を示している。
本稿では,分割認識と制御可能なオブジェクト中心生成をエンドツーエンドフレームワークに統合した統合LVLMであるFOCUSを紹介する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:46:40 GMT)
Enhancing Weakly Supervised 3D Medical Image Segmentation through Probabilistic-aware Learning [47.7] 3次元医用画像のセグメンテーションは、疾患の診断と治療計画に重要な意味を持つ課題である。
近年の深層学習の進歩は、完全に教師付き医療画像のセグメンテーションを著しく強化している。
本稿では,3次元医用画像に特化して設計された,確率的適応型弱教師付き学習パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:20:02 GMT)
UProp: Investigating the Uncertainty Propagation of LLMs in Multi-Step Agentic Decision-Making [47.6] 大規模言語モデル(LLM)は、シーケンシャルな意思決定を含む安全クリティカルなアプリケーションに統合される。
既存のLLM Uncertainty Quantification (UQ) 法は、主にシングルターン質問応答形式のために設計されている。
LLMシーケンシャルな決定の不確かさを2つの部分に分解する原理的情報理論フレームワークを導入する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:34:04 GMT)
Robust Group Anomaly Detection for Quasi-Periodic Network Time Series [47.6] 本稿では,ネットワーク時系列データベース内の異常で興味深い時系列を識別するフレームワークを提案する。
本稿では,Seq2GMMモデルを効率よく学習できるサロゲートに基づく最適化アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:11:04 GMT)
Graph is all you need? Lightweight data-agnostic neural architecture search without training [47.3] ニューラルアーキテクチャサーチ(NAS)は、ニューラルネットワークモデルの自動設計を可能にする。
我々の手法はnasgraphと呼ばれ、ニューラルネットワークをグラフに変換することによって計算コストを大幅に削減する。
NAS-Bench201からランダムにサンプリングされた200のアーキテクチャの中で、最高のアーキテクチャを217CPU秒で見つけることができる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:58:04 GMT)
Loupe: A Generalizable and Adaptive Framework for Image Forgery Detection [46.4] 本稿では,共同深度検出と局所化のための軽量かつ効果的なフレームワークであるLoupeを提案する。
Loupeは、パッチ対応分類器と条件付きクエリとセグメンテーションモジュールを統合し、同時にグローバルな認証分類ときめ細かいマスク予測を可能にする。
提案したパッチレベルの融合および条件付きクエリ設計の有効性は,様々な偽造パターンの下での分類精度と空間的局所化の改善に有効である。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:18:44 GMT)
Consistent Sampling and Simulation: Molecular Dynamics with Energy-Based Diffusion Models [46.4] 古典的拡散予測とシミュレーションにより生成されたサンプルの矛盾について検討する。
本稿では,Fokker-Planck 由来の正則化項を用いたエネルギーベース拡散モデルを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:38:29 GMT)
Automated Skill Discovery for Language Agents through Exploration and Iterative Feedback [44.7] 大規模言語モデル(LLM)のための自動スキル発見フレームワークを提案する。
我々は,探索エージェント(Alice)を用いて,対象エージェント(Bob)を訓練し,環境に不可欠なスキルを学習することで,探索ファースト戦略を採用する。
WebshopとCrafterの実験では、ExIFが有意義なスキルを効果的に発見し、訓練されたエージェントの能力を反復的に拡張する能力を示している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:16:30 GMT)
Reversing Flow for Image Restoration [44.5] 画像復元は、劣化の影響を逆転させることで、劣化した低品質(LQ)画像から高品質(HQ)画像を復元することを目的としている。
拡散やスコアベースモデルを含む既存の画像復元のための生成モデルは、分解過程を決定論的変換として扱うことが多い。
本研究では,劣化過程を連続正規化フローを用いた決定論的経路としてモデル化する新しい画像復元フレームワークResFlowを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:51:12 GMT)
SysTemp: A Multi-Agent System for Template-Based Generation of SysML v2 [43.7] 本稿では,自然言語仕様からSysML v2モデルを作成・改善するためのシステムであるSysTempを紹介する。
本稿では,SysML v2モデリングにおける世代別品質向上の可能性を明らかにするとともに,評価によるシステムのメリットと課題について論じる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:17:44 GMT)
More Thinking, Less Seeing? Assessing Amplified Hallucination in Multimodal Reasoning Models [43.5] テストタイム計算は、拡張推論チェーンを生成するために、大きな言語モデルに権限を与えた。
世代が長くなるにつれて、モデルは画像付きコンテンツから遠ざかっていき、言語優先に大きく依存する傾向にある。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:41:41 GMT)
AerialVG: A Challenging Benchmark for Aerial Visual Grounding by Exploring Positional Relations [42.8] ビジュアルグラウンドイングは、自然言語記述に基づいたイメージ内のターゲットオブジェクトのローカライズを目的としている。
AerialVGは、例えば外見に基づく接地は、複数の視覚的に類似した物体を識別するには不十分である。
5Kの空中画像,50Kの注釈付き記述,103Kのオブジェクトからなる,最初のAerialVGデータセットを紹介した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:30:09 GMT)
When Every Millisecond Counts: Real-Time Anomaly Detection via the Multimodal Asynchronous Hybrid Network [42.7] 我々は、最小応答時間と高精度の両方を優先して、自律運転のためのリアルタイム異常検出を導入する。
イベントカメラからのイベントストリームとRGBカメラの画像データを組み合わせた,新しいマルチモーダル非同期ハイブリッドネットワークを提案する。
提案手法は精度と応答時間の両方で既存手法より優れ,ミリ秒レベルのリアルタイム性能を実現している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:58:38 GMT)
Towards AI Search Paradigm [42.6] 我々は,人間の情報処理と意思決定をエミュレートできる次世代検索システムの青写真であるAI Search Paradigmを紹介する。
このパラダイムは、4つのLCMを動力とするエージェントのモジュラーアーキテクチャを採用し、情報要求の完全な範囲に動的に適応する。
この研究は、これらのコンポーネントの詳細なガイドを提供することによって、信頼できる、適応的でスケーラブルなAI検索システムの開発を知らせることを目的としている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:42:13 GMT)
Selective Use of Yannakakis' Algorithm to Improve Query Performance: Machine Learning to the Rescue [42.2] 本稿では,最適化手法を適用するか否かを判断する決定手順を設計する手法を提案する。
機械学習に基づくソリューションを提案する。
各種データベースシステムに関するいくつかのベンチマークによる実証結果から,本手法が統計的に有意な性能向上をもたらすことが示唆された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:21:20 GMT)
Beyond the Link: Assessing LLMs' ability to Classify Political Content across Global Media [41.9] 大きな言語モデル(LLM)の使用は、政治科学の文脈で一般的になりつつある。
LLMが5カ国の記事テキストとURLの両方から政治コンテンツ(PC)を正確に識別できるかどうかを評価する。
以上の結果から,ニュースコンテンツの大部分をURLで埋め込むことが可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:57:43 GMT)
Safe Guaranteed Exploration for Non-linear Systems [41.3] 本稿では,最適制御を用いた新しい安全な探索フレームワークを提案する。
我々は,モデル予測制御を用いたSageMPC,SAfe保証探索を提案することにより,この汎用フレームワークの効率を向上する。
自動車モデルを用いたSageMPCを用いた未知環境の安全な探索実験を行った。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:20:49 GMT)
Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity [41.0] スパース・レグ(Sparse-Reg)は、オフライン強化学習における過度適合を軽減するために、スパースをベースとした正規化手法である。
オフラインのRLアルゴリズムは、小さなデータセットに過度に適合し、結果として性能が低下することを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:57:59 GMT)
IQE-CLIP: Instance-aware Query Embedding for Zero-/Few-shot Anomaly Detection in Medical Domain [40.6] IQE-CLIPは医療領域における異常検出タスクのための革新的なフレームワークである。
医学領域へのCLIPの適応性を高めるために,クラスベースのプロンプトトークンと学習可能なプロンプトトークンを導入する。
我々のフレームワークはゼロショットタスクと少数ショットタスクの両方で最先端の処理を実現している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 06:52:02 GMT)
Exploring the Potential of Encoder-free Architectures in 3D LMMs [40.4] 本稿では,エンコーダをベースとした3次元大規模マルチモーダルモデルの課題を軽減するために,エンコーダフリーアーキテクチャの可能性を初めて包括的に検討する。
以上の結果から,エンコーダフリーアーキテクチャは3次元理解分野におけるエンコーダベースアーキテクチャの代替として有望であることが示された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:06:38 GMT)
Behavior Driven Development for 3D Games [40.1] iv4XRフレームワークは、自律エージェントの実装により、ゲームテストシナリオの自動化を可能にする。
本稿では、振る舞い駆動開発(BDD)アプローチとiv4XRフレームワークを統合することで、Space Engineersを支える産業企業がレグレッションテストを自動化する方法について報告する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:09:07 GMT)
TabArena: A Living Benchmark for Machine Learning on Tabular Data [40.0] 本稿では,最初の持続的リビングベンチマークシステムであるTabArenaを紹介する。
我々は、データセットとよく実装されたモデルの代表的なコレクションを手動でキュレートする。
大規模なベンチマーク調査を行い、公開リーダボードを初期化し、経験豊富なメンテナのチームを組み立てます。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:14:48 GMT)
UniFork: Exploring Modality Alignment for Unified Multimodal Understanding and Generation [39.9] 統一された画像理解と生成は、マルチモーダル人工知能において有望なパラダイムとして浮上している。
本研究では,タスク固有の専門家モデルの理解と生成のためのモダリティアライメント行動について検討する。
タスクの干渉を避けるため,タスク固有の分岐を深いレイヤに導入しながら,タスクのタスク表現学習のための浅いレイヤを共有する,新しいY字型アーキテクチャであるUniForkを紹介した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:52:31 GMT)
A minimal tensor network beyond free fermions [39.8] この研究は、古典統計スピン系とフェルミオン系の間の双対性を拡張する最小モデルを提案する。
二次元テンソルネットワークに適用されたジョルダン・ウィグナー変換は、古典的な統計力学モデルの分割和をグラスマン変数積分に写す。
結果として得られるモデルは単純で、スピンスピン相互作用を規定するパラメータと、自由フェルミオン極限からの偏差を測定するパラメータの2つのみを特徴とする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:37:17 GMT)
Adapting While Learning: Grounding LLMs for Scientific Problems with Intelligent Tool Usage Adaptation [39.8] 大規模言語モデル(LLM)は科学的問題を解決する上で有望な能力を示すが、幻覚の問題に悩まされることが多い。
本稿では,AWL(Adapting While Learning)という2成分微調整手法を提案する。
最初のコンポーネントであるWorld Knowledge Learning (WKL)では、LLMはツール生成ソリューションから学習することで、科学的知識を内部化する。
第2のコンポーネントであるツール・ユース・アダプテーション(TUA)では、モデルの正確性に基づいて、問題を簡単または困難に分類し、難しいツールに切り替えながら、簡単な問題の直接的な推論を維持するように訓練する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:54:13 GMT)
CDS: Knowledge Component-Driven Data Synthesis Guided by Cognitive Diagnosis Theory [39.6] 大規模言語モデル(LLM)は大きな進歩を遂げているが、タスクの複雑さが増し、高いパフォーマンス要求が継続的改善の必要性を浮き彫りにしている。
いくつかの手法は、列車モデルの評価結果に基づいて、先進LLMによって生成された合成データを利用する。
本稿では,認知診断理論(CDT)にインスパイアされた診断プロセスを取り入れた認知診断合成(CDS)手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:44:20 GMT)
Better Language Model Inversion by Compactly Representing Next-Token Distributions [39.4] 言語モデルの逆転は、言語モデルの出力のみを使用して隠れたプロンプトを復元しようとする。
そこで本研究では,次の確率からヒントを抽出することで,隠れプロンプトを復元する手法を提案する。
我々の手法は、隠されたプロンプトを復元する従来の最先端手法よりも大幅に向上する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:53:51 GMT)
Reimagining Urban Science: Scaling Causal Inference with Large Language Models [39.2] 都市因果研究は、都市を形成する複雑なダイナミックなプロセスを理解するために不可欠である。
現在の慣行は、しばしば非効率で偏りのある仮説の定式化によって制約される。
本研究では,仮説生成,データエンジニアリング,実験設計と実行,政策洞察による結果解釈の4つの異なるモジュールエージェントからなる概念的枠組みであるUrbanCIAを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:09:39 GMT)
BlenderFusion: 3D-Grounded Visual Editing and Generative Compositing [39.2] 我々は、オブジェクト、カメラ、背景を再コンパイルすることで、新しいシーンを合成する生成的視覚合成フレームワークであるBlenderFusionを紹介する。
i)視覚入力を編集可能な3Dエンティティ(レイヤ)に分割・変換し、(ii)3Dグラウンド制御(編集)でブレンダーで編集し、(iii)生成合成装置(合成)を用いてコヒーレントなシーンに融合する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:38:34 GMT)
Assembler: Scalable 3D Part Assembly via Anchor Point Diffusion [39.1] 本稿では,3次元部品組み立てのためのスケーラブルで汎用的なフレームワークであるAssemblerを紹介する。
様々な部分数、ジオメトリ、構造を持つ、多種多様な内部オブジェクトを処理します。
PartNetで最先端のパフォーマンスを実現し、複雑な現実世界のオブジェクトに対して、初めて高品質なアセンブリをデモした。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:25:20 GMT)
GenLit: Reformulating Single-Image Relighting as Video Generation [39.1] 我々は、映像生成モデルに光操作を行うためのグラフィックスエンジンの能力を蒸留するフレームワークであるGenLitを紹介する。
小さな合成データセットのみに微調整されたモデルが現実世界のシーンに一般化されることが分かりました。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:10:55 GMT)
Gaussian Processes and Reproducing Kernels: Connections and Equivalences [38.5] モノグラフは、正定核を用いた2つのアプローチの関係を研究する:ガウス過程を用いた確率的方法と、再現されたカーネルヒルベルト空間(RKHS)を用いた非確率的方法
機械学習、統計学、数値解析で広く研究されている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:08:18 GMT)
Language-Informed Synthesis of Rational Agent Models for Grounded Theory-of-Mind Reasoning On-The-Fly [38.5] LIRASは、構造的だが状況特異的なエージェントと環境表現を構築するプロセスとして、マルチモーダルな社会的推論を基盤としている。
我々のモデル(比較的軽量なVLMで実証された)は、すべての領域にわたる人間の判断を捉える上で、アブレーションや最先端のモデルよりも優れています。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 05:21:42 GMT)
Extracting Multimodal Learngene in CLIP: Unveiling the Multimodal Generalizable Knowledge [37.6] MM-LG(Multimodal Learngene)はCLIPから一般化可能なコンポーネントを抽出し活用するための新しいフレームワークである。
MM-LGはパラメータストレージの25%しか必要とせず、様々なモデルスケールのトレーニング前コストの約2.8倍を削減している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:17:41 GMT)
Revisiting LoRA through the Lens of Parameter Redundancy: Spectral Encoding Helps [37.0] Low-Rank Adaptation (LoRA) は、大規模な基礎モデルを微調整するための顕著なテクニックとして登場した。
その成功にもかかわらず、LoRAのキャパシティと効率を制限するかなりのパラメータ冗長性はボトルネックとして認識されている。
underlineSpectral-underlineencoding underlineLow-underlineRank underlineAdaptation (SeLoRA)を紹介する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:09:05 GMT)
Rewarding the Unlikely: Lifting GRPO Beyond Distribution Sharpening [36.8] 強化学習は、言語モデルの推論能力を改善する主要な要因として現れています。
本稿では,現在の強化学習アルゴリズムが,すでに解いている問題に関するベースモデルの分布を単に研ぎ澄ましているだけかどうかを考察する。
差分報酬はランクバイアスを緩和し、合成定理と実定理の両方の証明設定において、多種多様な$N$でpass@N$を改善することを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:14:47 GMT)
ICC: Quantifying Image Caption Concreteness for Multimodal Dataset Curation [36.4] ペア化されたテキストイメージデータのWebスケールトレーニングは、ますますマルチモーダルな学習の中心になりつつある。
標準的なデータフィルタリングアプローチでは、ミスマッチしたテキストイメージペアを削除できない。
画像参照なしで字幕テキストを評価し,その具体性を計測する新しい指標である画像キャプション具体性を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:17:43 GMT)
Optimism Without Regularization: Constant Regret in Zero-Sum Games [35.3] 同様の最適なレートが、正規化なしで達成可能であることを初めて示します。
我々は、オプティスティック・フィクティトゥス・プレイ(タイブレッシング・ルールを使用)が絶え間ない後悔しか得られない2つのストラテジー・ゲームについて証明する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:10:51 GMT)
Conformal Inference under High-Dimensional Covariate Shifts via Likelihood-Ratio Regularization [35.2] ピンボール損失を正規化の新たな選択と組み合わせた正準比正則化量子回帰アルゴリズムを提案する。
LR-QR法は,対象領域の所望レベルにおいて,最小限の誤差項までカバレッジを有することを示す。
実験により、LR-QRアルゴリズムは、高次元予測タスクにおいて既存の手法よりも優れていることを示した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:42:54 GMT)
Mechanisms vs. Outcomes: Probing for Syntax Fails to Explain Performance on Targeted Syntactic Evaluations [33.0] 大規模言語モデル(LLM)は、テキストの処理と生成において、構文の堅牢な熟達を示す。
モデルの探索精度が下流の構文的性能を確実に予測するかどうかについては、網羅的な研究はまだ確定していない。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:46:50 GMT)
Robust Reinforcement Learning for Discrete Compositional Generation via General Soft Operators [32.8] 既存の手法は、しばしば報酬関数に比例してサンプリングされるが、不適切であり、最適でない候補が得られることを示す。
我々は、ロバストなRLアプローチを導入し、プロキシ報酬関数の堅牢性を求める統一演算子を導入する。
それはまた、合成タスクと実世界のタスクの両方において、高品質で多様な候補を特定する新しいアルゴリズムを生み出します。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:03:17 GMT)
Synthesizing Composite Hierarchical Structure from Symbolic Music Corpora [32.2] 構造時間グラフ(STG)と呼ばれる音楽構造の統一的階層的メタ表現を提案する。
シングルピースの場合、STGは、より微細な構造的音楽的特徴の階層構造とそれらの間の時間的関係を定義するデータ構造である。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:37:39 GMT)
Genesis: Multimodal Driving Scene Generation with Spatio-Temporal and Cross-Modal Consistency [32.2] 本稿では、駆動ビデオとLiDARシーケンスの合同生成のための統一的なフレームワークを提案する。
我々は,3D-VAEモダリティにDiTベースのビデオ拡散モデルを統合する2段階アーキテクチャと,NeRFベースのレンダリングと適応サンプリングを備えたBEV対応LiDARジェネレータを用いる。
構造化セマンティクスで生成をガイドするために,シーンレベルとインスタンス言語を統括する視覚レベルモデル上に構築されたキャプションモジュールであるDataCrafterを紹介する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:20:56 GMT)
Watch and Listen: Understanding Audio-Visual-Speech Moments with Multimodal LLM [32.1] TriSenseは、全体論的ビデオ時間的理解のために設計された3重モードの大言語モデルである。
Central to TriSenseは、クエリベースのコネクタで、入力クエリに基づいてモダリティのコントリビューションを適応的にリウェイトする。
TriSense-2Mは、自動パイプラインで生成された200万以上のキュレートされたサンプルのデータセットである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:28:03 GMT)
A Minimalist Optimizer Design for LLM Pretraining [32.0] 大規模言語モデルのトレーニングは通常、Adamのような適応型に依存します。
GaLore FiraやAPOLLOといった最近の研究は、メモリ消費を減らすために、状態圧縮型を提案した。
本研究では,LLMプレトレーニングにおける最先端性能を維持するために本当に必要となる,最小限の状態量について検討する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 00:10:35 GMT)
DopQ-ViT: Towards Distribution-Friendly and Outlier-Aware Post-Training Quantization for Vision Transformers [31.8] 視覚変換器(ViT)のためのDopQ-ViTを提案する。
第一に、DopQ-ViTはTan Quantizer (TanQ)を導入している。
第2に、DopQ-ViT は MAD-Guided Optimal Scaling Factor (MOSF) を提示する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:08:28 GMT)
Emergent Temporal Correspondences from Video Diffusion Transformers [30.8] DiffTrackは、この問題に答えるために設計された最初の定量的分析フレームワークである。
分析の結果,特定のクエリキーの類似性がすべてではないが,時間的マッチングにおいて重要な役割を担っていることが明らかとなった。
本研究は,映像の時間的整合性を改善する新たなガイダンス法により,動画の動作向上に拡張する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:59:55 GMT)
Predicting New Research Directions in Materials Science using Large Language Models and Concept Graphs [30.8] 大規模言語モデル(LLM)は,自動キーワード抽出法よりも効率的に概念を抽出できることを示す。
機械学習モデルは、歴史的データに基づいて、概念の新たな組み合わせを予測するために訓練される。
本モデルは,まだ研究されていないトピックの革新的な組み合わせを予測することによって,材料科学者の創造的思考プロセスに刺激を与えることができることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:26:12 GMT)
Open-Set Graph Anomaly Detection via Normal Structure Regularisation [30.6] Open-set Graph Anomaly Detection (GAD)は、少数の正規ノードと異常ノードを使用して検出モデルをトレーニングすることを目的としている。
現在の監督型GAD法は、目に見えない異常を正常なノードとして検出する多くの誤りを招き、その異常を過度に強調する傾向にある。
本稿では,新しいオープンセットGAD手法,すなわち正規構造正規化(NSReg)を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:26:10 GMT)
Compliant Residual DAgger: Improving Real-World Contact-Rich Manipulation with Human Corrections [30.5] CR-DAgger(Compliant Residual DAgger)を紹介する。
CR-DAgger は,1) コンプライアンス制御を活用したコンプライアンス・インターベンション・インタフェース,2) ロボットのポリシー実行を中断することなく,穏やかで正確なデルタ動作補正を実現すること,2) 力フィードバックと力制御を取り入れつつ,人間の修正から学習するコンプライアンス・レジデンシャル・ポリシーの定式化,の2つの新しい構成要素を含む。
本システムでは,最小限の補正データを用いた高精度なコンタクトリッチな操作タスクの性能向上と,2つの課題に対して基本方針成功率を50%以上向上させるとともに,再学習と微調整の両方に優れる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:57:47 GMT)
Visual-Instructed Degradation Diffusion for All-in-One Image Restoration [29.9] 視覚指導誘導劣化拡散を利用したオールインワン画像復元フレームワークである textbfDefusion を提案する。
Defusionは複雑な画像復元タスクや実世界の劣化など、さまざまな画像復元タスクにおいて、最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:50:42 GMT)
Learning Effective Representations for Retrieval Using Self-Distillation with Adaptive Relevance Margins [29.9] バイエンコーダは、それぞれの埋め込みの類似度を計算することにより、ドキュメントのクエリとの関連性を推定する。
現在最先端のバイエンコーダは、教師モデルからの知識蒸留とバッチサンプリングを含む高価なトレーニングシステムを用いて訓練されている。
本稿では,エンコーダモデルの事前学習言語モデリング機能をトレーニング信号として活用する,自己超越のための新しいパラメータフリー損失関数を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:43:59 GMT)
How to Train your Text-to-Image Model: Evaluating Design Choices for Synthetic Training Captions [29.5] テキスト・ツー・イメージ・モデルの下流性能に異なる合成キャプション戦略がどのような影響を及ぼすかを検討する。
実験の結果,高品位な字幕はテキストアライメントを高めるが,出力美学や多様性にトレードオフをもたらす可能性が示唆された。
本研究は,最適なモデル性能を実現する上で,キャプション設計の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:52:17 GMT)
SmartGuard: Leveraging Large Language Models for Network Attack Detection through Audit Log Analysis and Summarization [29.0] エンドポイント監視ソリューションは、高度な攻撃検出と調査をサポートするために、今日のエンタープライズ環境に広くデプロイされている。
監査ログに基づく既存の意味分析手法は,システムコールレベルにしか達せず,粒度が低い。
本稿では,監査イベントセマンティクスから抽象化された振る舞いと,大規模言語モデルを組み合わせたSmartGuardを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:19:17 GMT)
MTGR: Industrial-Scale Generative Recommendation Framework in Meituan [28.9] この問題に対処するためにMTGR(Meituan Generative Recommendation)を提案する。
MTGRはユーザレベルの圧縮によってトレーニングと推論の高速化を実現し、効率的なスケーリングを実現する。
この突破口は世界最大のフードデリバリープラットフォームであるMeituanに配備された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 05:35:15 GMT)
Relaxed syntax modeling in Transformers for future-proof license plate recognition [28.6] 本研究では,Transformerベースのライセンスプレート認識システムは,テンソル生産環境には適さないことを示す。
そこで我々は,Syntax-Less Transformerを用いて,ライセンスプレート表現の構文非依存なモデリングを行う,アーキテクチャのカットオフと置換をSaLTに統合する。
実データと合成データの両方の実験は、我々のアプローチが過去の構文上で最高精度に達し、最も重要なことは、将来のライセンスプレートのパフォーマンスをほぼ維持していることを示している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:03:57 GMT)
Validating Mechanistic Interpretations: An Axiomatic Approach [28.3] 我々は,機械的解釈を,分析対象のニューラルネットワークのセマンティクスを概ね合成的に捉えた記述として公式に特徴づける公理の集合を与える。
本研究は, 既知2-SAT問題の解法をトレーニングしたTransformer-based modelを含む新しいケーススタディと同様に, 既知2-SAT問題に対する機械論的解釈の検証にこれらの公理の適用性を示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:29:25 GMT)
Empowering Near-Field Communications in Low-Altitude Economy with LLM: Fundamentals, Potentials, Solutions, and Future Directions [28.2] 低高度経済(LAE)は、学術や産業から大きな注目を集めている。
近接場ビームフォーカスを利用することで、RAEは無人航空機に正確にビームエネルギーを供給できる。
しかし、LAEにおける近接場通信は、信号処理の複雑さの増加など、いくつかの課題に直面している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:14:29 GMT)
Class Agnostic Instance-level Descriptor for Visual Instance Search [28.1] 教師付きまたは弱教師付きオブジェクト検出手法は、未知のオブジェクトカテゴリの性能が低いため、選択肢には含まれない。
本稿では、自己教師型ViTから出力される特徴集合に基づいて、インスタンスレベルの領域探索を階層的な方法でコンパクトな特徴部分集合の検出としてモデル化する。
私たちのインスタンスレベルの記述子は、既知のオブジェクトカテゴリと未知のオブジェクトカテゴリの両方で有効です。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:32:39 GMT)
SynPo: Boosting Training-Free Few-Shot Medical Segmentation via High-Quality Negative Prompts [27.9] 我々は、Large Vision Models (LVM) に基づくトレーニング不要の少ショット手法であるSynPoを提案する。
より信頼性の高い信頼マップでポイントプロンプトを選択するために、新しい信頼マップ構文モジュールを設計する。
SynPoは、最先端のトレーニングベースの数ショットメソッドに匹敵するパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:41:22 GMT)
Analyzing PDFs like Binaries: Adversarially Robust PDF Malware Analysis via Intermediate Representation and Language Model [27.9] 悪意のあるPDFファイルは、永続的な脅威として現れ、Webベースの攻撃において一般的な攻撃ベクターとなっている。
PDFマルウェアは、しばしば敵の攻撃を受けやすく、その信頼性を損なう。
本稿では,PDF特徴抽出とPDFマルウェア検出のための新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:08:08 GMT)
Memorization to Generalization: Emergence of Diffusion Models from Associative Memory [27.7] AMのレンズを用いた拡散モデルにおける記憶一般化現象について検討する。
本研究は, AMsレンズを用いた拡散モデルにおける記憶一般化現象の新たな展望である。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:20:01 GMT)
The Hitchhiker's Guide to Efficient, End-to-End, and Tight DP Auditing [27.6] 我々は,現場での作業のレビューを行うための総合的なフレームワークを導入し,DP監査が対象とする3つのコンテキスト横断デシラタを確立する。
我々は、脅威モデル、攻撃、評価機能を含む最先端のDP監査技術の運用モードを体系化する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 00:32:59 GMT)
BREAD: Branched Rollouts from Expert Anchors Bridge SFT & RL for Reasoning [27.4] 小さな言語モデル(SLM)は複雑な推論の振る舞いを学ぶのに苦労する。
標準的なトレーニングアプローチは、教師付き微調整(SFT)ステージと、強化学習(RL)ステージを組み合わせている。
BREAD: SFTとRLのステージを部分的に専門的なガイダンスと分岐ロールアウトで統一するGRPOの派生版を紹介する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:59:07 GMT)
Long-term Traffic Simulation with Interleaved Autoregressive Motion and Scenario Generation [27.0] 理想的なトラフィックシミュレータは、デプロイ中に自動運転システムが経験する現実的な長期的ポイントツーポイントトリップを再現する。
InfGenは、インターリーブドクローズドループモーションシミュレーションとシーン生成を行う統合型次世代予測モデルである。
InfGenは短期(9秒)のトラフィックシミュレーションにおいて最先端で動作し、長期(30秒)のシミュレーションでは他のすべての手法よりも大幅に優れています。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:59:21 GMT)
SAFEx: Analyzing Vulnerabilities of MoE-Based LLMs via Stable Safety-critical Expert Identification [26.9] 我々は,MoEモデルの位置的脆弱性を形式化し,体系的に研究する。
SAFExは、安全クリティカルな専門家をしっかりと識別し、特徴付けし、検証する分析フレームワークである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:09:10 GMT)
Monocular One-Shot Metric-Depth Alignment for RGB-Based Robot Grasping [26.8] 単一のRGB画像から距離深度を復元する新しいフレームワークであるモノクロワンショット距離アライメント(MOMA)を提案する。
MOMAは、カメラキャリブレーション中のスケール回転シフトアライメントを実行する。
テーブルトップ2指握りと吸引型ビンピッキングアプリケーションの実世界実験は、MOMAが多種多様なタスクで高い成功率を達成することを示している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:11:20 GMT)
MemBench: Towards More Comprehensive Evaluation on the Memory of LLM-based Agents [26.6] LLMをベースとしたエージェントのメモリ能力を評価するため,より包括的なデータセットとベンチマークを構築した。
本データセットは,現実記憶と反射記憶を異なるレベルに含み,様々な対話的シナリオとして参加と観察を提案する。
本データセットに基づいて,LLMをベースとしたエージェントのメモリ能力を評価するベンチマーク,MemBenchを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:09:23 GMT)
DeepSelective: Interpretable Prognosis Prediction via Feature Selection and Compression in EHR Data [26.4] EHRデータを用いた患者予後予測のための新しいエンドツーエンドディープラーニングフレームワークであるDeepSelectiveを提案する。
DeepSelectiveは、データ圧縮技術と革新的な機能選択アプローチを組み合わせて、カスタム設計モジュールを統合する。
実験の結果,DeepSelectiveは予測精度を向上するだけでなく,解釈可能性も向上し,臨床診断に有用なツールであることがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 05:03:41 GMT)
When and How Does CLIP Enable Domain and Compositional Generalization? [26.2] ドメインの多様性は、ドメインと構成の一般化の両方に不可欠であることを示す。
一般化に成功するためには、中間層や回路で十分に共有された表現を学習する必要がある。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:12:35 GMT)
Instituto de Telecomunicações at IWSLT 2025: Aligning Small-Scale Speech and Language Models for Speech-to-Text Learning [26.0] 我々はショートトラック、すなわち音声認識、翻訳、および音声質問応答の結果を提出する。
我々のモデルは、事前訓練された連続音声エンコーダとテキストデコーダを統合した統一音声テキストモデルである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:17:42 GMT)
AQA-Bench: An Interactive Benchmark for Evaluating LLMs' Sequential Reasoning Ability [26.0] 本稿では,大規模言語モデル(LLM)の逐次推論能力を評価する新しいベンチマークであるAQA-Benchを紹介する。
AQA-Benchを2進探索,深さ優先探索,幅優先探索という3つのアルゴリズムで構築し,14種類のLLMの逐次推論能力を評価する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:57:43 GMT)
PyTorch-based Geometric Learning with Non-CUDA Processing Units: Experiences from Intel Gaudi-v2 HPUs [25.7] 我々はPyTorchベースの幾何学習フレームワークをGaudi-v2 HPUに移植した経験を紹介する。
16のガイド付きチュートリアルと11の実例を統合し,故障の診断と詳細な回避策について検討した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:10:48 GMT)
On Training-Test (Mis)alignment in Unsupervised Combinatorial Optimization: Observation, Empirical Exploration, and Analysis [25.7] 教師なし最適化(UCO)では、トレーニング中に各トレーニングインスタンスに対して確率論的に期待できる連続的な決定を行うことを目的としている。
トレーニングにデランドマイゼーションの異なるバージョンを含めることで、UCOにおけるトレーニングとテストの整合性を改善するための予備的なアイデアを探求する。
私たちの経験的調査は、このようなアイデアが実際にトレーニングとテストのアライメントを改善するだけでなく、トレーニングに非自明な課題をもたらすことを示している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:05:09 GMT)
Event Cameras Meet SPADs for High-Speed, Low-Bandwidth Imaging [25.1] イベントカメラと単光雪崩ダイオード(SPAD)センサーは、従来のカメラに代わる有望な代替手段として登場した。
これらの特性は相補的であり,低帯域幅で低照度かつ高速な画像再構成を実現するのに有効であることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 00:53:40 GMT)
Directional Gradient Projection for Robust Fine-Tuning of Foundation Models [25.0] ディディショナル・グラディエント・プロジェクション(DiGraP)は、グラデーションからブリッジの正規化や多目的最適化に至るまでの方向性情報を階層的に学習可能な手法である。
まず,画像分類による視覚質問回答 (VQA) ベンチマークの分析により,一様・多モードのギャップを埋める。
実験結果から,DiGraPは画像分類やVQAタスクにおいて,識別的,生成的バックボーンで既存のベースラインを一貫して上回ることがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:54:55 GMT)
RGBTrack: Fast, Robust Depth-Free 6D Pose Estimation and Tracking [24.9] リアルタイムな6Dポーズ推定と追跡のためのロバストなフレームワークRGBTrackを導入する。
我々は、深度を効率的に推測するレンダリング・アンド・コンパートメント機構と組み合わせた、新しいバイナリ検索戦略を考案した。
RGBTrackの新たなディープフリーアプローチは,競合精度とリアルタイム性能を実現する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:19:28 GMT)
$L^*LM$: Learning Automata from Examples using Natural Language Oracles [24.8] L*LM$は、デモと自然言語の両方からDFAを学ぶアルゴリズムである。
専門家による実演からDFAを学習する際のデータ効率の大幅な改善を観察する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:11:55 GMT)
CryoCCD: Conditional Cycle-consistent Diffusion with Biophysical Modeling for Cryo-EM Synthesis [24.8] 生物物理モデリングと生成技術を統合する合成フレームワークであるCryoCCDを提案する。
CryoCCDは、現実的な生物物理学的変動を反映したマルチスケールのCryo-EMマイクログラフを生成する。
実験により、CryoCCDは構造的に正確なマイクログラフを生成し、下流タスクのパフォーマンスを向上させることが示された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:15:53 GMT)
DRARL: Disengagement-Reason-Augmented Reinforcement Learning for Efficient Improvement of Autonomous Driving Policy [24.4] disengagement-reason-augmented reinforcement learning (DRARL)は、運転ポリシーの改善プロセスを強化する。
本手法は,自律走行ロボットによって収集された実世界の解離事例を用いて評価する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:32:01 GMT)
LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning? [23.9] LEGO-Puzzlesは、11の異なるタスクにまたがる1,100の精巧にキュレートされた視覚的質問応答(VQA)サンプルで構成されている。
最も強力なMLLMでさえ、テストケースの約半分しか答えられません。
実験の結果,GPT-4o と Gemini-2.0-Flash はこれらの命令に従う能力に制限があり,他のMLLM は入力画像を複製するか,全く無関係な出力を生成することがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 05:50:00 GMT)
Speeding up Local Optimization in Vehicle Routing with Tensor-based GPU Acceleration [23.9] 本稿では,車両ルーティングにおいてよく使用される局所探索演算子を高速化する,テンソルベースのGPUアクセラレーション手法を提案する。
その低結合アーキテクチャは、GPUに完全にオフロードされた計算を伴うため、さまざまなローカル検索ベースのアルゴリズムとフレームワークにシームレスに統合される。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:40:47 GMT)
Enhancing Step-by-Step and Verifiable Medical Reasoning in MLLMs [23.5] 我々は、厳密で効果的な医療連鎖データを生成するために、Mentor-Intern Collaborative Search (MICS)を提案する。
推論性能は、生成された推論パスの品質を評価するMICSスコアによって決定される。
最終的に、難易度の高いマルチタスク医療推論データセットであるMMRPと、カリキュラム学習戦略によって考案された新しい医療MLLMであるChiron-o1を構築した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:51:19 GMT)
Cost-effective Instruction Learning for Pathology Vision and Language Analysis [23.3] CLOVER という名称の会話病理学のための費用対効果学習フレームワークを提案する。
CLOVERは軽量モジュールのみをトレーニングし、大きな言語モデルのパラメータを凍結しながら命令チューニングを使用する。
そこで我々は,デジタル病理学の文脈において,高品質なテンプレートベースの命令セットを構築する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:30:05 GMT)
Controllable and Expressive One-Shot Video Head Swapping [22.3] 本稿では,ビデオヘッドスワップのための拡散型多条件制御フレームワークを提案する。
本手法は,人間の頭部を静止画像から動的映像にシームレスに移植し,対象映像の本来の身体と背景を保存する。
実験結果から,本手法はソースポートレートの同一性を保ちながら,シームレスな背景統合に優れることが示された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:01:17 GMT)
TriCon-SF: A Triple-Shuffle and Contribution-Aware Serial Federated Learning Framework for Heterogeneous Healthcare Data [22.0] TriCon-SFは、トリプルシャッフルとコントリビューション意識を統合する新しいシリアル・フェデレーション・ラーニングフレームワークである。
非IIDヘルスケアデータセットの実験では、TriCon-SFが標準シリアルおよび並列フェデレーション学習を精度と通信効率の両方で上回っていることが示されている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:40:35 GMT)
Large Language Model-Driven Surrogate-Assisted Evolutionary Algorithm for Expensive Optimization [22.0] サロゲート支援進化アルゴリズム(SAEA)は、コストのかかる最適化タスクに対処するための重要なツールである。
本稿では,大規模言語モデル (LLM) を統合した新しい手法 LLM-SAEA を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:44:21 GMT)
FRAMES-VQA: Benchmarking Fine-Tuning Robustness across Multi-Modal Shifts in Visual Question Answering [21.1] VQAタスクの堅牢な微調整を評価するために,新しいベンチマークFRAMES-VQA(Fine-Tuning Robustness across Multi-Modal Shifts in VQA)を提案する。
VQAv2、IV-VQA、VQA-CP、OK-VQAなど、既存のVQAベンチマークを10種類使用し、それをID、近距離OODデータセットに分類する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:32:29 GMT)
Zero-Shot NAS via the Suppression of Local Entropy Decrease [21.1] アーキテクチャ性能評価は、ニューラルアーキテクチャサーチ(NAS)の最も時間を要する部分である
ゼロショットNASは、訓練の代わりにゼロコストプロキシを利用することで評価を加速する。
本研究におけるネットワークの性能評価には,アーキテクチャトポロジが用いられている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:01:50 GMT)
3DeepRep: 3D Deep Low-rank Tensor Representation for Hyperspectral Image Inpainting [21.1] 本研究では,HSIテンソルの3モードすべてに沿って深い非線形変換を行う3方向のディープローランクテンソル表現(DeepRep)モデルを提案する。
実世界のHSIデータセットを用いた実験により,提案手法は既存の最先端技術よりも優れた塗装性能が得られることが示された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:09:34 GMT)
On the Theory of Conditional Feature Alignment for Unsupervised Domain-Adaptive Counting [21.0] オブジェクトカウントモデルは、密度の多様性が異なるドメインにデプロイされるときに苦しむ。
条件付き特徴アライメントの理論的枠組みを提案する。
提案手法は既存の教師なし領域適応法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:37:48 GMT)
Trustworthy Few-Shot Transfer of Medical VLMs through Split Conformal Prediction [20.9] 医用視覚言語モデル(VLM)は、前例のない転送機能を示し、データ効率のよい画像分類に採用されている。
この研究は、そのようなモデルを転送する際の信頼性を保証するために、分割共形予測(SCP)フレームワークについて検討する。
そこで我々は,共形シナリオ上でのトランスダクティブ・スプリット・コンフォーマル適応(SCA-T)を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 22:48:07 GMT)
Tower+: Bridging Generality and Translation Specialization in Multilingual LLMs [20.9] Tower+は,翻訳機能と多言語汎用テキスト機能の両方にわたって,強力なパフォーマンスを実現するように設計されたモデルスイートである。
学習の各段階で、汎用タスクだけでなく、翻訳の性能を高めるためにデータを生成し、キュレートする。
この結果から,特定のビジネスドメインを最適化しながら,フロンティアモデルに対抗できる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:30:06 GMT)
Med-U1: Incentivizing Unified Medical Reasoning in LLMs via Large-scale Reinforcement Learning [20.9] 本稿では,医療質問応答(QA)タスクにおける頑健な推論のための統一的枠組みであるMed-U1を提案する。
多目的報酬最適化により、Med-U1 は LLM に簡潔で検証可能な推論連鎖を生成するよう指示する。
実験の結果、Med-U1は複数の挑戦的なMed-QAベンチマークでパフォーマンスを著しく改善することがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:43:46 GMT)
Robust Dynamic Material Handling via Adaptive Constrained Evolutionary Reinforcement Learning [20.9] 本稿では,DMHを解くための適応的制約付き進化的強化学習手法を提案する。
各アクターにアクセスして、スパース報酬や制約違反に対処し、ポリシーの動作を制限する。
8つのトレーニングと8つの目に見えないテストケースの実験は、ACERLの優れた性能を実証した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:20:22 GMT)
Optimal Implicit Bias in Linear Regression [20.7] 最適な一般化性能につながる最適の暗黙バイアスが見つかる。
特に、このクラスの補間子の中で可能な最高の一般化誤差の厳密な下界を得る。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:41:39 GMT)
Spatial-Temporal Pre-Training for Embryo Viability Prediction Using Time-Lapse Videos [20.6] 自己教師付き学習(SSL)はラベル付きデータとラベルなしデータの両方を活用して予測を改善する。
既存のビデオのSSLメソッドは、2つの課題があるため、胚発生ビデオには直接適用されない。
これらの課題に対処するために,時空間事前学習(STPT)を提案する。
STPTは、ビデオ間のフレーム単位のアライメントを回避し、空間ステージは、各ビデオ内のアライメントと時間的に一貫したアライメントから学習する。
時間的段階は,ビデオ埋め込み間の関係をモデル化し,時間的変動を効果的に処理する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:08:41 GMT)
On Almost Surely Safe Alignment of Large Language Models at Inference-Time [20.5] 安全応答をほぼ確実に生成することを目的とした,LLMに対する新しい推論時間アライメント手法を提案する。
我々は、安全制約の進化を追跡し、安全でない世代を動的に罰する安全状態を強化する。
我々は,潜在空間におけるMDPを十分に大きな罰則で解く際に,与えられたコストモデルに対して公式な安全保証を示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:54:05 GMT)
RiOSWorld: Benchmarking the Risk of Multimodal Computer-Use Agents [20.5] 実世界のコンピュータ操作におけるMLLMエージェントの潜在的なリスクを評価するためのベンチマークである textbfRiOSWorld を紹介する。
私たちのベンチマークには、Web、ソーシャルメディア、マルチメディア、os、Eメール、オフィスソフトウェアを含む、さまざまなコンピュータアプリケーションにまたがる492の危険タスクが含まれています。
評価には,リスク目標意図とリスク目標達成の2つの視点から安全リスクを評価する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:24:06 GMT)
Distributional Training Data Attribution [20.2] モデル出力の分布がデータセットに依存するかを予測するために、分布学習データ属性(d-TDA)を導入する。
平均を必ずしも変化させることなく、目標値の分布を劇的に変化させる訓練例を同定する。
また, 分布構造から影響関数 (IF) が自然に出現することが, アンロール化微分の限界として見出された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:38:39 GMT)
FDLLM: A Dedicated Detector for Black-Box LLMs Fingerprinting [20.1] 大規模言語モデル(LLM)は、デジタルコンテンツ作成の風景を急速に変えつつある。
FD-Datasetは、20の有名なプロプライエタリおよびオープンソースLLMから90,000のテキストサンプルからなる総合的なバイリンガルフィンガープリントベンチマークである。
また,パラメータ効率の低いLow-Rank Adaptation (LoRA) を利用して基礎モデルの微調整を行う新しいフィンガープリント手法であるFDLLMを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 05:23:34 GMT)
Chain-of-Trust: A Progressive Trust Evaluation Framework Enabled by Generative AI [20.0] デバイス属性データをよりよく活用するために、信頼の連鎖フレームワークが提案されている。
このフレームワークは、信頼評価プロセスをタスク分解に基づく連鎖ステージに分割する。
生成AIを使用して収集したデータを解析し、解釈し、正確な評価結果を生成する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:33:03 GMT)
A Technical Study into 0.5B Reasoning Language Models [20.0] 約0.5億のパラメータを持つ小型推論言語モデル (SRLM) は、計算効率とコスト効率が優れており、魅力的な代替手段となる。
本研究では, 教師付き微調整(SFT), 知識蒸留(KD), 強化学習(RL)など, 各種トレーニング戦略について検討し, 0.5B SRLMの性能向上を図る。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:50:22 GMT)
A Simple Contrastive Framework Of Item Tokenization For Generative Recommendation [19.8] コントラスト学習に基づく新しい教師なし深層量子化手法SimCITを提案する。
SimCITは、相互に有益なコントラスト学習フレームワークにおいて、マルチモーダルな知識アライメントとセマンティックトークン化を組み合わせる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:54:32 GMT)
Learning Joint Denoising, Demosaicing, and Compression from the Raw Natural Image Noise Dataset [19.8] 本稿ではRawNIND(Raw Natural Image Noise dataset)を紹介する。
RawNINDは、センサー、画像開発ペア、スタイルにまたがる一般化モデルの開発を支援するために設計された、多様な生画像のコレクションである。
2つのデノナイズ法が提案され、一方は生のベイアデータを直接操作し、他方は計算効率を活用し、もう一方は異なるセンサに改良された線形RGB画像を処理する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:52:32 GMT)
Generalizable Agent Modeling for Agent Collaboration-Competition Adaptation with Multi-Retrieval and Dynamic Generation [19.7] ひとつのエージェントを新しいマルチエージェントシステムに適用することは、課題をもたらし、さまざまなタスク、環境、未知のチームメイトや相手とのインタラクションを調整する必要がある。
本稿では,多種多様なシナリオにまたがってエージェントを一般化するためのエージェント評価を行う,より包括的なエージェント協調適応手法を提案する。
ACCAでは、エージェントはタスクや環境の変化を調整し、目に見えないチームメイトと協力し、未知の相手と競う。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:28:18 GMT)
How Many Domains Suffice for Domain Generalization? A Tight Characterization via the Domain Shattering Dimension [19.6] ドメインの集合が与えられた場合、家族内の見知らぬすべてのドメインに対して合理的に機能するモデルを学ぶために、ランダムにサンプリングされたドメインを何個集める必要があるか?
ドメインの破砕次元(ドメインの破砕次元)と呼ばれる新しい尺度を導入し、この次元がドメインのサンプルの複雑さを特徴づけることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:50:14 GMT)
Generalized Category Discovery under the Long-Tailed Distribution [19.6] 本稿では,長期分布下での一般カテゴリー発見(GCD)の問題に対処する。
これらの課題に対処するために,自信あるサンプル選択と密度に基づくクラスタリングに基づくフレームワークを提案する。
本手法の有効性を実証するために, 長い尾を持つGCDデータセットと従来のGCDデータセットの比較実験を行った。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:11:08 GMT)
LAION-C: An Out-of-Distribution Benchmark for Web-Scale Vision Models [19.6] 我々は、ImageNet-Cのベンチマーク代替としてLAION-Cを紹介した。
最先端モデルの包括的評価では、LAION-Cデータセットが現代モデルに重大な課題をもたらすことが判明した。
我々は、OOD一般化におけるパラダイムシフトを観察する:人間よりも優れたモデルから、現在最高の人間のオブザーバに適合または優れたモデルへ。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:32:27 GMT)
Aha Moment Revisited: Are VLMs Truly Capable of Self Verification in Inference-time Scaling? [19.4] 我々は,視覚抵抗モデル(VLM)に推論時間的手法が効果的に拡張するか否かを検討する。
多数決や自己検証によるベスト・オブ・N選択といったデコード戦略はVLM推論性能を向上するが、前者のような生成手法は後者のような検証手法に比べて大幅に向上することがわかった。
RL学習されたVLMには、視覚とテキストの両モードで堅牢な自己検証機能がない。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:23:48 GMT)
Camera Calibration via Circular Patterns: A Comprehensive Framework with Measurement Uncertainty and Unbiased Projection Model [19.3] 円形パターンの偏りのない投影モデルを提案し,チェッカーボードよりも精度が高いことを示す。
また、キャリブレーションの堅牢性と完全性を高めるために、円形パターンに不確実性を導入する。
このアプローチの中核となる概念は、その接続性を考慮して2次元形状の境界点をマルコフランダム場としてモデル化することである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:46:48 GMT)
Can We Detect Failures Without Failure Data? Uncertainty-Aware Runtime Failure Detection for Imitation Learning Policies [19.3] FAIL-Detectは、模倣学習に基づくロボット操作における障害検出のための2段階のアプローチである。
まず、政策失敗と相関し、不確実性を捉えるスカラー信号にポリシー入力と出力を蒸留する。
我々の実験は、新しいフローベース密度推定器を使用する場合、学習信号がほぼ一貫した効果を示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 05:51:24 GMT)
A Large-Scale Real-World Evaluation of LLM-Based Virtual Teaching Assistant [19.0] 仮想教示アシスタント(VTA)は、インスタントフィードバックを提供し、マルチターンインタラクションを促進することによって、学生の学習を強化する可能性がある。
本研究は、LLMベースのVTAを開発し、477人の大学院生によるAIプログラミングコースに展開する。
実世界の教室におけるVTA導入の可能性を評価し,導入の鍵となる課題を明らかにする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:59:57 GMT)
Experimental realization of the bucket-brigade quantum random access memory [18.8] 超伝導量子プロセッサを用いた回路ベースのバケットブリガドQRAMを実験的に検討した。
この結果は、スケーラブルなQRAMアーキテクチャを実現するための超伝導量子プロセッサの可能性を強調した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:54:27 GMT)
Hunyuan-GameCraft: High-dynamic Interactive Game Video Generation with Hybrid History Condition [18.8] Hunyuan-GameCraftは、ゲーム環境におけるハイダイナミックなインタラクティブなビデオ生成のための新しいフレームワークである。
アクション制御をきめ細かいものにするため,標準キーボードとマウス入力を共有カメラ表現空間に統合する。
本稿では,ゲームシーン情報を保存しながら,映像シーケンスを自動回帰的に拡張するハイブリッド履歴条件学習手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:50:37 GMT)
Uncertainty-Aware Variational Information Pursuit for Interpretable Medical Image Analysis [18.7] 本稿では,不確実性の定量化をV-IPプロセスに統合する新しいフレームワークであるUncertainty-Aware V-IP(UAV-IP)を紹介する。
我々は,4つの医用画像データセット,PH2,Derm7pt,BrEaST,SkinConのUAV-IPを評価した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:25:47 GMT)
MUCAR: Benchmarking Multilingual Cross-Modal Ambiguity Resolution for Multimodal Large Language Models [18.7] MLLM(Multimodal Large Language Models)は多くの視覚言語タスクにおいて大きな進歩を見せている。
マルチランガルおよびクロスモーダルシナリオ間のマルチモーダル曖昧性解決を明示的に評価するために設計された新しいベンチマークであるMUCARを紹介する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:57:41 GMT)
Alto: Orchestrating Distributed Compound AI Systems with Nested Ancestry [18.7] 複合AIアプリケーションは、生成言語モデル、ドキュメントレトリバー、埋め込みモデルなどのサブコンポーネントをチェーンする。
複合AIシステムにおける並列性やパイプライン化といった従来のシステム最適化の適用は、各コンポーネントに異なる制約があるため、難しい。
本稿では,ストリーミングと並列処理による複合AIクエリの自動実行を最適化するフレームワークAltoを紹介する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:03:22 GMT)
Incentivizing High-quality Participation From Federated Learning Agents [18.6] 本稿では,不均一なデータを考慮したエージェント参加のためのインセンティブ対応フレームワークを提案する。
ピア予測機構を利用して2つのエージェントの一般化誤差を解析・測定し,スコア関数を開発する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:58:39 GMT)
NeRF: Neural Radiance Field in 3D Vision: A Comprehensive Review (Updated Post-Gaussian Splatting) [18.6] 2020年3月、Neural Radiance Field(NeRF)はコンピュータビジョンに革命を起こし、暗黙のニューラルネットワークベースのシーン表現と新しいビュー合成を可能にした。
NeRFモデルは、ロボット工学、都市マッピング、自律ナビゲーション、仮想現実/拡張現実など、さまざまな応用を見出している。
我々は過去5年間(2020-2025年)のNeRF論文の包括的調査を行う。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:37:09 GMT)
Seeing What Matters: Generalizable AI-generated Video Detection with Forensic-Oriented Augmentation [18.4] 合成ビデオ生成は、実際のものとはほとんど区別できない、非常にリアルな高解像度ビデオを生成することができる。
いくつかのビデオ法医学検出器が最近提案されているが、しばしば一般化が不十分である。
本稿では,ウェーブレット分解に基づく新たなデータ拡張戦略を導入し,より関連する法医学的手がかりを活用するために,特定の周波数関連帯域を置き換える。
本手法は最先端検出器よりも精度が向上し, 非常に最近の生成モデルにおいても優れた結果が得られる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:36:59 GMT)
SSR-Zero: Simple Self-Rewarding Reinforcement Learning for Machine Translation [18.1] 本稿では,機械翻訳(MT)のための簡易自己回帰(SSR)強化学習(RL)フレームワークを提案する。
13Kモノリンガル例とQwen-2.5-7Bをバックボーンとして用いたSSRを用いたトレーニングを行った。
我々の最強モデルであるSSR-X-Zero-7Bは、COMETの外部監督でSSRを増強することにより、英語の$leftrightarrow$ Chinese translationにおける最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 06:38:44 GMT)
Problem Space Transformations for Out-of-Distribution Generalisation in Behavioural Cloning [17.9] 行動クローニングとニューラルネットワークは、ロボット操作に大きな進歩をもたらした。
残る課題の1つは、アウト・オブ・ディストリビューション(OOD)の一般化である。
操作の特性から生じる変換が,その改善にどのように利用されるかを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:56:44 GMT)
LogProber: Disentangling confidence from contamination in LLM responses [17.9] 機械学習において、汚染とは、データテストがトレーニングセットにリークする状況を指す。
ブラックボックスの設定で汚染を検知できる新しい,効率的なアルゴリズムであるLogProberを紹介した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:52:37 GMT)
Few-Shot, Now for Real: Medical VLMs Adaptation without Balanced Sets or Validation [17.9] 医用画像解析において視覚言語モデル(VLM)が注目されている。
医学領域では非現実的な適応データの分布について,従来の研究が強く仮定している。
この作業は、これらの好ましいデプロイメントシナリオに挑戦し、現実的で、不均衡で、バリデーションのない適応設定を導入します。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 22:35:00 GMT)
DreamCube: 3D Panorama Generation via Multi-plane Synchronization [17.7] 3Dパノラマ合成は、生成した全方位コンテンツの高品質で多様な視覚的外観と幾何学を必要とする、有望だが挑戦的なタスクである。
既存の手法では、事前訓練された2D基礎モデルのリッチ画像の事前利用により、3Dパノラマデータの不足を回避することができる。
本研究では、2次元基礎モデルから演算子に多面同期を適用することにより、その機能を全方位領域にシームレスに拡張できることを実証する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:55:06 GMT)
Fine-Tuning Lowers Safety and Disrupts Evaluation Consistency [17.6] 特定のドメインやタスクに対して汎用的な大規模言語モデル(LLM)を微調整することは,一般ユーザにとって日常的な手順となっている。
我々は、これを「攻撃」の良質な性質と相まって、微調整の広汎な取り込みによるLCMの臨界故障モードとみなす。
本実験では, 微調整装置に不連続な変化が生じても, 安全性評価の結果に驚くほどのばらつきが認められた。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:57:12 GMT)
Bridging Domain Gaps in Agricultural Image Analysis: A Comprehensive Review From Shallow Adaptation to Deep Learning [17.5] 本稿では,農業画像解析におけるクロスドメイン転送性の向上により,ドメイン適応技術が課題にどう対処できるかを検討する。
このレビューは、作物の健康モニタリング、害虫検出、果物の認識といった応用に焦点をあてて、農業画像におけるDAの最近の進歩を体系的に要約している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:02:12 GMT)
Decoupled Classifier-Free Guidance for Counterfactual Diffusion Models [17.4] Decoupled-Free Guidance(DCFG)は、グループワイドコンディショニング制御を導入したフレキシブルでモデルに依存しないフレームワークである。
DCFGは、セマンティックインプットをアンタングルする属性分割埋め込み戦略に基づいて構築されており、ユーザ定義の属性グループに対する選択的ガイダンスを可能にする。
CelebA-HQ、MIMIC-CXR、EMBEDの実験では、DCFGは介入の忠実度を改善し、意図しない変化を緩和し、可逆性を高める。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:06:08 GMT)
TextBraTS: Text-Guided Volumetric Brain Tumor Segmentation with Innovative Dataset Development and Fusion Module Exploration [17.4] 我々は、ペア化されたMRIボリュームとリッチなテキストアノテーションを含む、初めて公開されたボリュームレベルのマルチモーダルデータセットであるTextBraTSデータセットを紹介する。
提案手法は,脳腫瘍のセグメンテーション精度を大幅に向上させ,効果的なマルチモーダル統合技術に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 06:57:56 GMT)
Exploring Strategies for Personalized Radiation Therapy Part II Predicting Tumor Drift Patterns with Diffusion Models [17.4] 本稿では,Diffusion Implicit Models (DDIM) を用いた新しいフレームワークを提案する。
その結果, 拡散モデルは患者特異的腫瘍の進展を効果的にシミュレートし, 治療応答に関連する領域を局在させることができた。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 21:58:42 GMT)
Eau De $Q$-Network: Adaptive Distillation of Neural Networks in Deep Reinforcement Learning [17.4] 本稿では,エージェントの学習速度の間隔を増大させる高密度なスパースアルゴリズムを提案する。
提案手法をAtari $2600$ベンチマークとMuJoCo物理シミュレータで評価した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:24:49 GMT)
LaVi: Efficient Large Vision-Language Models via Internal Feature Modulation [17.3] 本稿では,シームレスかつ効率的な視覚言語融合を実現する新しいLVLMであるLaViを提案する。
視覚トークンの結合に依存する支配的なLVLMとは異なり、LaViは長いコンテキスト拡張をバイパスする。
LLaVA-OV-7Bと比較して、LaViはFLOPを94.0%削減し、推論速度を3.1倍改善し、メモリ使用量を半分に削減した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:25:33 GMT)
CoIFNet: A Unified Framework for Multivariate Time Series Forecasting with Missing Values [17.3] CoIFNet(Collaborative Imputation-Forecasting Network)は、インプットと予測を統合する新しいフレームワークである。
CoIFNetは、観測値、マスクマトリックス、タイムスタンプの埋め込みを入力として、それらを逐次処理する。
提案手法の有効性と計算効率を,様々なデータ・シナリオにまたがって実証する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:39:42 GMT)
Near Optimal Decision Trees in a SPLIT Second [17.0] 決定木最適化は、解釈可能な機械学習の基本である。
最近のアプローチでは、分岐と動的プログラミングとのバウンドを使って、グローバルな最適化が見つかる。
我々はSPLITと呼ばれるアルゴリズムのファミリーを導入し、この理想的なバランスを達成するために私たちをかなり前進させます。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 00:03:09 GMT)
TALE: A Tool-Augmented Framework for Reference-Free Evaluation of Large Language Models [16.9] 大規模言語モデル(LLM)は、現実の自律型アプリケーションに統合されつつある。
評価のための静的な注釈付き参照に頼ることは、コスト、スケーラビリティ、完全性において大きな課題を引き起こす。
提案するツール拡張LDM評価(TALE: Tool-Augmented LLM Evaluation)は,LLMの出力を所定の基礎的回答なしで評価するフレームワークである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:31:59 GMT)
Reinforcement learning for hybrid charging stations planning and operation considering fixed and mobile chargers [16.8] 従来の固定位置充電ステーションは、充電需要の動的な性質のために、不使用や混雑といった問題に直面していることが多い。
モバイル充電器はフレキシブルなソリューションとして登場し、これらの需要変動に合わせて移動することができる。
本稿では,都市道路網に固定充電器と移動充電器を統合したハイブリッド充電インフラの最適計画と運用について述べる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 05:51:02 GMT)
Model Context Protocol (MCP) at First Glance: Studying the Security and Maintainability of MCP Servers [16.8] Anthropicは2024年後半にこのツールエコシステムを標準化するためにModel Context Protocol (MCP)を導入した。
採用にもかかわらず、MPPのAI駆動の非決定論的制御フローは、持続可能性、セキュリティ、保守性に対する新たなリスクをもたらす。
我々は1,899のオープンソースMPPサーバを評価し,その健全性,セキュリティ,保守性を評価した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:45:00 GMT)
Refining music sample identification with a self-supervised graph neural network [16.7] 本稿では,グラフニューラルネットワークを用いた軽量でスケーラブルな符号化アーキテクチャを提案する。
我々のモデルは、現在の最先端システムと比較してトレーニング可能なパラメータの9%しか使用せず、平均平均精度(mAP)は44.2%に達している。
さらに,実世界のアプリケーションにおけるクエリは時間的に短い場合が多いため,Sample100データセットに対する新たな詳細なアノテーションを用いて,短いクエリをベンチマークする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:48:47 GMT)
DAL: A Practical Prior-Free Black-Box Framework for Non-Stationary Bandit Environments [16.6] 非定常的包帯の問題に対して,検出強化学習(DAL)と呼ばれる実用的なブラックボックスフレームワークを導入する。
DALはモジュラーであり、任意の固定帯域アルゴリズムを入力として受け入れ、変更検出器で拡張する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:52:06 GMT)
RealSR-R1: Reinforcement Learning for Real-World Image Super-Resolution with Vision-Language Chain-of-Thought [16.5] リアルワールド・イメージ・スーパーリゾリューションは、画像修復において最も難しい課題の1つです。
既存の手法は、劣化した画像の内容の正確な理解に苦慮している。
本稿では、RealSRモデルに理解と推論機能を持たせるRealSR-R1を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:21:21 GMT)
360VOTS: Visual Object Tracking and Segmentation in Omnidirectional Videos [16.4] 我々は全方向ビデオオブジェクトセグメンテーション(360VOS)と呼ばれる新しいコンポーネントを組み込んだ包括的なデータセットとベンチマークを提案する。
360VOSデータセットは、高密度のピクセルワイドマスクを伴い、290のシーケンスを含み、幅広いターゲットカテゴリをカバーする。
我々は最先端のアプローチをベンチマークし、提案した360度トラッキングフレームワークとトレーニングデータセットの有効性を実証する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:16:26 GMT)
Anomaly Detection in Event-triggered Traffic Time Series via Similarity Learning [16.4] 本稿では,一連のイベントトリガー時系列の類似性を学習可能な教師なし学習フレームワークを開発することを目的とする。
提案するフレームワークは,さまざまなイベントトリガー時系列の類似性をモデル化し,学習するための体系的なアプローチを実現するための,ステップストーンの提供を目指している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:09:04 GMT)
Dex1B: Learning with 1B Demonstrations for Dexterous Manipulation [15.7] 生成モデルを用いて作成した大規模で多種多様で高品質な実演データセットであるDex1Bを紹介した。
そこで本研究では,幾何制約を統合して実現可能性を高め,多様性を高めるために追加条件を適用した生成モデルを提案する。
提案手法は,従来の最先端手法よりも優れた性能を示すため,確立されたベンチマークと新たに導入されたシミュレーションベンチマークの両方で検証する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:49:04 GMT)
Semi-Supervised Multi-Modal Medical Image Segmentation for Complex Situations [15.5] 本稿では,ラベル付きデータによる性能向上のために,補完的なマルチモーダル情報を活用する,新しい半教師付きマルチモーダル医用画像分割手法を提案する。
2つのマルチモーダルデータセットの実験結果から,提案フレームワークの優れた性能とロバスト性を示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:37:44 GMT)
PET Tracer Separation Using Conditional Diffusion Transformer with Multi-latent Space Learning [15.4] PETトレーサ分離のためのテクスチャ条件拡散変圧器モデル(MS-CDT)を提案する。
我々の知る限りでは、PET画像におけるトレーサー分離のためのテクスチャ条件とマルチラテント空間を用いた最初の試みである。
実験結果から,MS-CDTは画像品質と臨床関連情報の保存という点で競争力を発揮したことが示唆された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:55:35 GMT)
PersonalAI: Towards digital twins in the graph form [15.0] LLM自体によって構築・更新される知識グラフの形で外部メモリを活用することを提案する。
私たちはAriGraphアーキテクチャのアイデアを拡張し、標準エッジと2種類のハイパーエッジを備えたグラフを初めて導入しました。
TriviaQA、HotpotQA、DiaASQベンチマークで実施された実験は、この手法がグラフ構築と知識抽出のプロセスの統一と堅牢化に役立つことを示唆している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:52:15 GMT)
LearnAlign: Reasoning Data Selection for Reinforcement Learning in Large Language Models Based on Improved Gradient Alignment [14.7] 強化学習(Reinforcement Learning, RL)は、LLMの推論能力を高めるための重要な技術となっているが、そのデータ非効率性は依然として大きなボトルネックとなっている。
本稿では、RL後学習のための学習可能および代表的トレーニング推論データを知的に選択するLearnerAlignを提案する。
3つの数学的推論ベンチマークによる実験により,本手法はトレーニングデータ要求を大幅に低減することが示された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:31:36 GMT)
Towards Advanced Mathematical Reasoning for LLMs via First-Order Logic Theorem Proving [14.6] 大規模言語モデル(LLM)は、有望な一階述語論理(FOL)推論能力を示している。
しかし、多段階のFOL還元を含む複雑な数学的推論におけるそれらの効果はいまだ研究されていない。
LLMの生成戦略の多様性と再現性を向上する自己適応型ソリューションであるDREAMを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:09:56 GMT)
Calibrated Predictive Lower Bounds on Time-to-Unsafe-Sampling in LLMs [14.6] 我々は、安全でない(有害な)応答を引き起こすのに必要な大規模言語モデル(LLM)世代数を定量化するフレームワークを開発する。
我々の重要な革新は、凸最適化問題として定式化された適応型、プロンプトごとのサンプリング戦略を設計することである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:12:17 GMT)
A Survey of State Representation Learning for Deep Reinforcement Learning [14.3] 本調査は,モデルフリーオンライン環境において,これらの手法を広範囲に分類することを目的としている。
メソッドを6つの主要なクラスに分類し、そのメカニズム、利点、制限を詳述する。
また,表現の質を評価する手法や,関連する今後の方向性についても論じる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:47:04 GMT)
PinChecker: Identifying Unsound Safe Abstractions of Rust Pinning APIs [14.3] 本稿では,APIのピン付けに関する重要な動作をモデル化する,新しい中間表現であるRPILを紹介する。
RPILにより誘導される合成駆動型違反検出ツールであるPinCheckerを実装した。
crates.ioの13の人気のあるRustライブラリに関する実験では、2つの確認済みバグが見つかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:53:51 GMT)
Language-driven Description Generation and Common Sense Reasoning for Video Action Recognition [14.0] 乱雑なビデオアクションシーケンスを識別するために、言語駆動の常識を取り入れたフレームワークを導入する。
本稿では,Action GenomeとCharadesのデータセットに対するアプローチの有効性を示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:43:53 GMT)
Sequence-to-Sequence Models with Attention Mechanistically Map to the Architecture of Human Memory Search [14.0] ニューラルネットワーク翻訳の基本構造は、人間の記憶のコンテキスト保守と検索モデルで指定されたものと直接対応するメカニズムを示す。
我々は、人間の記憶探索の認知モデルとしてニューラルネットワーク翻訳モデルを実装し、解釈可能であり、学習の複雑なダイナミクスを捉えることができる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:43:15 GMT)
ReplaceMe: Network Simplification via Depth Pruning and Transformer Block Linearization [13.9] ReplaceMeは、変圧器ブロックを線形操作で置き換える、トレーニングフリーの深度刈り取り方式である。
ReplaceMeを実装したオープンソースのライブラリを,最先端のプルーニング技術とともに提供している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:27:20 GMT)
Differentiation-Based Extraction of Proprietary Data from Fine-Tuned LLMs [13.8] 本稿では,Supervised Fine-Tuning(SFT)データセットからデータを抽出する際の重要な研究課題について考察する。
我々は、微分データ抽出(DDE)と呼ばれる、SFTモデルに特化して設計された新しい抽出法を開発した。
以上の結果から,DDEはすべての攻撃設定において,既存の抽出ベースラインを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:43:36 GMT)
PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in Large Language Models via Bilevel Optimization [13.8] 大規模言語モデル(LLM)は、幅広いアプリケーションで顕著な性能を示している。
それらはまた、時代遅れの知識や幻覚への感受性のような固有の制限も示している。
近年の取り組みはRAGベースのLLMのセキュリティに重点を置いているが、既存の攻撃方法は3つの重大な課題に直面している。
本稿では,少数の有毒テキストを知識データベースに導入する新しい最適化型攻撃であるPrompt-RAGアタック(PR-アタック)を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:23:40 GMT)
The MedPerturb Dataset: What Non-Content Perturbations Reveal About Human and Clinical LLM Decision Making [13.7] 臨床入力の制御摂動下での医療用大言語モデル(LLM)の評価を目的としたデータセットであるMedPerturbを紹介する。
MedPerturbでは、リアルな入力の可変性に基づく800の臨床的コンテキストのデータセットをリリースする。
我々は、MedPerturbを2つのケーススタディに用いて、ジェンダーアイデンティティの手がかり、言語スタイル、フォーマットの変化が、人間とLLM間の治療選択のばらつきを反映しているかを明らかにする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:09:27 GMT)
Searching for a Hidden Markov Anomaly over Multiple Processes [13.6] 隠れマルコフモデル(ADHM)に基づく異常検出という新しいアルゴリズムを提案する。
ADHMは、蓄積された統計的証拠と隠れた国家に対する信条の更新に基づく調査戦略に適応する。
これは、広範囲なシミュレーションにおいて、既存の手法よりも一貫して優れている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:10:38 GMT)
Episode-specific Fine-tuning for Metric-based Few-shot Learners with Optimization-based Training [13.5] メトリックベースのモデルは、クエリの類似性を計算し、学習されたメトリック空間内の埋め込みをサポートする。
ラベル付けされていないクエリサンプルの分類を支援するため、推論中にラベル付きサポートサンプルの小さなセットが提供される。
そこで本研究では,メトリックベースモデルに対して,単純なエピソード固有かつ効果的なインジェクションの微調整手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 22:24:38 GMT)
How Breakable Is Privacy: Probing and Resisting Model Inversion Attacks in Collaborative Inference [13.5] 協調推論は、中間機能をクラウドモデルに伝達することでエッジデバイスの計算効率を向上させる。
モデル逆攻撃(MIA)の難しさを評価するための確立された基準はない。
本稿では、CIにおけるMIAの難易度を評価するための最初の理論的基準を提案し、相互情報、エントロピー、有効情報量などを重要な要因として同定する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:59:56 GMT)
Reward-Agnostic Prompt Optimization for Text-to-Image Diffusion Models [13.4] RATTPOは,様々な報酬シナリオに適用可能なフレキシブルなテスト時間最適化手法である。
RATTPOは、報酬固有のタスク記述を必要とせずに、大きな言語モデル(LLM)のテキストをクエリすることで、最適化されたプロンプトを検索する。
経験的結果はRATTPOの汎用性を示し、多様な報酬設定のユーザプロンプトを効果的に強化する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:02:05 GMT)
Experimental Extraction of Coherent Ergotropy and Its Energetic Cost in a Superconducting Qubit [13.4] 超伝導トランスモンキュービットからの作業抽出における初期状態コヒーレンスの役割を実験的に検討した。
初期状態の選択は、支配的なデコヒーレンスチャネル-エネルギー緩和またはデフォーカスに依存する。
これらの結果は、コヒーレンス制御に対する実用的でスケーラブルなアプローチとして初期状態設計を確立し、効率的な量子熱力学デバイスの開発のためのガイダンスを提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:05:48 GMT)
MeDi: Metadata-Guided Diffusion Models for Mitigating Biases in Tumor Classification [13.4] 本稿では,このようなメタデータを生成拡散モデルフレームワーク(MeDi)に明示的にモデル化する手法を提案する。
MeDiは、不足しているサブ集団を合成データで対象とする拡張を可能にする。
TCGAの未確認サブポピュレーションに対して,MeDiが高品質な病理像を生成することを実験的に示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:41:25 GMT)
Machine Learning Methods for Small Data and Upstream Bioprocessing Applications: A Comprehensive Review [13.2] データは機械学習(ML)アプリケーションには不可欠だが、大規模なデータセットの取得にはコストと時間を要する可能性がある。
このレビューでは、小さなデータによって生じる課題に対処するために設計されたML手法について検討し、それらを分類学に分類し、実践的な応用を導く。
これらのメソッドがさまざまな観点から小さなデータ課題にどのように対処するかを分析することで、このレビューは実行可能な洞察を提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:36:26 GMT)
AI-based Multimodal Biometrics for Detecting Smartphone Distractions: Application to Online Learning [13.1] 本稿では、生理的信号と頭部ポーズデータを利用して、電話の使用を検出するAIベースのアプローチを提案する。
以上の結果から,脳波や心拍数などの生体信号の精度は低く,頭部ポーズだけで87%の精度が得られた。
すべての信号を組み合わせたマルチモーダルモデルは91%の精度に達し、統合の利点を強調している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:37:19 GMT)
Adversarial Reasoning for Repair Based on Inferred Program Intent [12.9] 本稿では,批判的・敵対的推論に基づくAdverIntent-Agentという手法を提案する。
当社のアプローチは、複数のAPRパッチの生成から、複数の潜在的プログラム意図の推測に焦点を移すという斬新なアプローチです。
AdverIntent-AgentはDefects4J 2.0とHumanEval-Javaの2つのベンチマークで評価された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:30:23 GMT)
No Free Lunch: Rethinking Internal Feedback for LLM Reasoning [12.9] 強化学習は、推論を改善するために大規模言語モデル(LLM)の訓練後において強力なパラダイムとして登場した。
内的フィードバック(RLIF)からの強化学習(Reinforcement Learning from Internal Feedback, RLIF)は,外的報酬ではなく,本質的なモデル由来の信号にのみ依存する手法である。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:59:52 GMT)
Reassessing Code Authorship Attribution in the Era of Language Models [12.6] 本研究の目的は,コードサンプルの作成者を特定するためのコーディングスタイルの分析である。
コードオーサシップ・アトリビューション(CAA)は、サイバーセキュリティとソフトウェアにおいて、盗作行為に対処し、検出し、刑事訴追をサポートするために不可欠である。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:19:30 GMT)
Semantic-Aware Parsing for Security Logs [12.5] 既存のAIベースは構文ログテンプレートの学習に重点を置いているが、クエリに必要な意味解釈は欠如している。
MatryoshkaはLLMを利用してセマンティックな構造化ログを自動的に生成する最初のエンドツーエンドシステムである。
マトリオシカは、価値ある分野を自動的に抽出し整理することで、手作業を大幅に削減する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:24:09 GMT)
DVFS-Aware DNN Inference on GPUs: Latency Modeling and Performance Analysis [12.4] ディープニューラルネットワーク(DNN)のレイテンシとエネルギー消費のバランスをとるための有望な技術として、ダイナミック電圧周波数スケーリング(DVFS)が登場している
本稿では,GPU上でのDNN推定時間を正確に特徴付けるDVFS対応遅延モデルを提案する。
評価の結果,提案モデルによる局所的推論最適化は,それぞれ66%,69%の時間とエネルギー消費を削減できることがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:42:34 GMT)
A Prior-Guided Joint Diffusion Model in Projection Domain for PET Tracer Conversion [12.2] 18F-fluoro-3,4-dihydroxy-L-phenylalanine (18F-DOPA)は神経内分泌腫瘍や神経疾患に対して高い特異性を示す。
本研究では,18F-FDG PET画像から18F-DOPA PET画像へ投影領域内で変換するPJDMモデルを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:05:34 GMT)
MM-AttacKG: A Multimodal Approach to Attack Graph Construction with Large Language Models [12.2] 本稿では,脅威画像から鍵情報を効果的に抽出し,攻撃グラフ構築に組み込む新しいフレームワークMM-AttacKGを提案する。
MM-AttacKGは、脅威画像の鍵情報を正確に識別し、マルチモーダルアタックグラフ構築の品質を大幅に向上させることができる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:59:31 GMT)
LLMs and Stack Overflow Discussions: Reliability, Impact, and Challenges [12.2] ChatGPTは、プログラミングとソフトウェア開発に関する開発者のクエリのためのプレミアプラットフォームであるStack Overflowを揺るがした。
ChatGPTのリリースから2ヶ月後、MetaはLLaMAという独自のLarge Language Model (LLM)で回答をリリースした。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:11:29 GMT)
Acquiring and Accumulating Knowledge from Diverse Datasets for Multi-label Driving Scene Classification [12.2] 本稿では,知識獲得・蓄積(KAA)と一貫性に基づくアクティブラーニング(CAL)を併用した新しい学習システムを提案する。
ドライビングシーン識別(DSI)データセットのアブレーション調査では、ImageNetで事前トレーニングされたベースラインモデルよりも56.1%のパフォーマンス向上が示されている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:06:53 GMT)
A Common Pool of Privacy Problems: Legal and Technical Lessons from a Large-Scale Web-Scraped Machine Learning Dataset [12.1] Webスクラッピングされた機械学習データセットの法的プライバシーへの影響はどのようなものか?
一般的なトレーニングデータセットの実証的研究では,衛生的努力にもかかわらず個人識別可能な情報の存在が顕著であることがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:40:05 GMT)
Latent Concept Disentanglement in Transformer-based Language Models [11.9] 大規模言語モデル(LLM)では、新しいタスクを解くためにコンテキスト内学習(ICL)を使用し、中核的で潜伏した概念を把握しているように見える。
このことは、トランスフォーマーが計算の一部として潜伏構造を表現するのか、あるいは問題を解くためにショートカットを取るのかという疑問を提起する。
そこで本研究では,2ホップ推論タスクにおいて,潜在概念の識別に成功し,ステップバイステップの概念構成を行うことを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:08:12 GMT)
Medical Artificial Intelligence for Early Detection of Lung Cancer: A Survey [11.9] 肺がんは世界中で致死率と死亡率の主要な原因の1つである。
コンピュータ支援診断システムは肺結節の検出と分類に有効であることが証明されている。
深層学習アルゴリズムは肺結節解析の精度と効率を大幅に改善した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:11:14 GMT)
Cross-Modal Obfuscation for Jailbreak Attacks on Large Vision-Language Models [11.9] 本稿では,悪質なプロンプトを視覚的およびテキスト的フラグメントに分解する新しいブラックボックス・ジェイルブレイク攻撃フレームワークを提案する。
我々のアプローチは、調整可能な推論の複雑さをサポートし、以前の攻撃よりもはるかに少ないクエリを必要とし、ステルスと効率の両方を可能にします。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 05:30:25 GMT)
Scalable and Reliable Multi-agent Reinforcement Learning for Traffic Assignment [11.8] 本稿では,交通代入問題に対する新しいMARLフレームワークであるMARL-OD-DAを紹介する。
実験により,提案したMARLフレームワークは,都市レベルのOD需要が多岐にわたる中規模ネットワークを効果的に処理できることを示した。
SiouxFallsネットワークに実装されると、MARL-OD-DAは従来の方法よりも94.99%低い相対的なギャップを持つ10ステップでより良い代入ソリューションを達成する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:25:23 GMT)
Info-Coevolution: An Efficient Framework for Data Model Coevolution [11.8] モデルとデータをバイアスのないオンライン選択アノテーションで共進化させる新しいフレームワークを提案する。
ImageNet-1Kのような現実世界のデータセットでは、Info-Coevolutionはアノテーションとトレーニングコストをパフォーマンス損失なく32%削減する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:52:55 GMT)
Multimodal Fused Learning for Solving the Generalized Traveling Salesman Problem in Robotic Task Planning [11.7] 汎用トラベリングセールスマン問題(GTSP)を解決するための多モード融合学習フレームワークを提案する。
まず、GTSPインスタンスを空間情報表現に変換する座標ベースのイメージビルダーを紹介する。
次に、異なる問題スケールにわたる適応性を高めるための適応分解能スケーリング戦略を設計し、マルチモーダル融合モジュールを開発する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:51:52 GMT)
The Role of Model Confidence on Bias Effects in Measured Uncertainties [11.3] 我々は,視覚質問応答(VQA)タスクにおいて,早期導入バイアスの軽減により不確かさの定量化が促進されることを見出した。
バイアスのないモデル信頼度が低い場合、すべてのバイアスが両方の不確実性に大きな変化をもたらすことが判明した。
これらの異なる影響により、不確実性定量化のためのバイアス緩和の理解が深まり、より高度な技術の発展を知らせる可能性がある。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:43:10 GMT)
EmoAgent: A Multi-Agent Framework for Diverse Affective Image Manipulation [11.3] Affective Image Manipulationは、画像内の視覚的要素を変更して、視聴者からの感情的な反応を誘発する。
既存のAIMアプローチは、感情と視覚的手がかりの間の堅固な音素間マッピングに依存している。
本稿では,D-AIMに特化した最初のマルチエージェントフレームワークであるemphEmoAgentを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:18:29 GMT)
Incivility and Rigidity: The Risks of Fine-Tuning LLMs for Political Argumentation [11.3] Twitter(現在のX)やRedditなどのプラットフォームで普及している収益性は、AIシステムを開発する上での課題となっている。
本研究では,2つの対照的な政治的議論データセットを微調整した GPT-3.5 Turbo 実験について報告する。
Redditがカスタマイズしたモデルでは、より安全だが厳格な議論が生まれ、クロスプラットフォームの微調整は毒性を増幅する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:35:51 GMT)
Fed-pilot: Optimizing LoRA Allocation for Efficient Federated Fine-Tuning with Heterogeneous Clients [11.1] メモリ効率の高いフェデレーションファインチューニングフレームワークであるFed-pilotを提案する。
メモリ制約のあるクライアントは、LoRAモジュールのサブセットのみをローカルにトレーニングすることで、ローランド適応(LoRA)ベースの微調整に参加することができる。
我々の知る限りでは、メモリ制約最適化を統合したFMのファインチューニングに関する最初の研究である。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:43:04 GMT)
Multi-Objective Recommendation in the Era of Generative AI: A Survey of Recent Progress and Future Prospects [11.1] 生成AIは、コンテンツ生成、データ合成、パーソナライズされたエクスペリエンスを可能にする。
生成AIは、データの分散性の問題に対処し、レコメンデーションシステム全体のパフォーマンスを改善するのに役立つ。
生成的AI技術に基づく多目的レコメンデーションシステムに関する総合的な研究はいまだ残っていない。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:30:39 GMT)
Zero-shot Class Unlearning via Layer-wise Relevance Analysis and Neuronal Path Perturbation [10.9] 機械学習は、大規模な再トレーニングを必要とせずに、トレーニングされたモデルから特定のデータの影響を取り除くテクニックである。
本稿では,階層的関連分析と神経経路摂動を用いた機械学習の新しい手法を提案する。
本手法は,高関連ニューロンを同定・摂動することで,機械学習性能とモデルの有用性のバランスをとる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:25:16 GMT)
Deep Learning based Visually Rich Document Content Understanding: A Survey [10.7] ビジュアルリッチドキュメント(VRD)は、学術、金融、医療、マーケティングといった分野において重要な役割を担っている。
VRDから情報を抽出する従来のアプローチは、専門家の知識と手動のアノテーションに大きく依存している。
近年のディープラーニングの進歩は、事前学習を通じて視覚、言語、レイアウト機能を統合するマルチモーダルモデルを実現することで、この状況を変えている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:23:37 GMT)
Trans${^2}$-CBCT: A Dual-Transformer Framework for Sparse-View CBCT Reconstruction [10.7] コーンビームCT(CBCT)は、少数のX線プロジェクションビューしか使用していないため、放射線線量が少ないほど高速なスキャンが可能であるが、重度のアンダーサンプリングの結果、強いアーティファクトと空間的カバレッジが低下する。
まず、従来のUNet/ResNetエンコーダをハイブリッドCNN-TransformerモデルであるTransUNetに置き換える。
LUNA16 と ToothFairy の実験では、6 から 10 のビューで一貫した利得を示し,CNN-Transformer 特徴と特異なビュー CBCT 再構成のための点ベース幾何推論の有効性を検証した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:45:12 GMT)
Computational Approaches to Understanding Large Language Model Impact on Writing and Information Ecosystems [10.5] 大規模言語モデル(LLM)は、私たちがどのように書き、コミュニケーションし、作成するかを変える大きな可能性を示しています。
この論文は、個人や機関がこの新興技術にどのように適応し、関与しているかを調べます。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:15:09 GMT)
From Thinking to Output: Chain-of-Thought and Text Generation Characteristics in Reasoning Language Models [10.4] 本稿では、4つの最先端大推論モデルの推論特性を解析するための新しい枠組みを提案する。
多様なデータセットは、論理的推論、因果推論、多段階問題解決を含む実世界のシナリオベースの質問で構成されている。
この研究結果は、これらのモデルがどのように探索と搾取のバランスをとり、問題に対処し、結論に達するかについて様々なパターンを明らかにする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:02:16 GMT)
Neural Polar Decoders for DNA Data Storage [10.4] 挿入や削除などの同期エラーは、DNAベースのデータストレージシステムにおいて根本的な課題となる。
我々は、同期エラーのあるチャネルに対して、低複雑さデコーダを設計するために、NPD(Neural polar decoder)に基づくデータ駆動アプローチを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:26:38 GMT)
From Collapse to Stability: A Knowledge-Driven Ensemble Framework for Scaling Up Click-Through Rate Prediction Models [10.3] 本研究では,より大規模なアンサンブルネットワークを調査し,一般的なアンサンブル手法に特有の3つの制約を見出す。
知識蒸留(KD)と深層相互学習(DML)はこれらの制限に対処するために用いられる。
DMLはサブネットワーク間のばらつきを減らし、アンサンブル予測による不一致を最小限に抑えながら、KDによりCTRモデルのスケーリング法則に従うことができる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:03:19 GMT)
Online Adaptation for Flying Quadrotors in Tight Formations [10.2] 複雑な空力的なウェイクインタラクションは、チームだけでなく、個々のチームメンバーを不安定にします。
適応型混合学習に基づく制御フレームワークであるL1 KNODE-DW MPCを提案する。
提案手法は, 飛行中, 近接して垂直に3つのクアッドロータを配置できることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 21:49:17 GMT)
Near-Tight Runtime Guarantees for Many-Objective Evolutionary Algorithms [10.2] 我々は、(グローバル)SEMO、SMS-EMOA、バランスの取れたNSGA-II、NSGA-III、SPEA2を含む大規模なMOEAについて検討する。
LOTZベンチマークのSEMOのランタイムを$m ge 6$の目標にすると、実行時の保証は最大セットのサイズよりもさらに小さくなります。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:11:38 GMT)
Preference-Driven Multi-Objective Combinatorial Optimization with Conditional Computation [10.2] POCCOはサブプロブレムのためのモデル構造を適応的に選択できる新しいプラグイン・アンド・プレイフレームワークである。
そこで本研究では,勝利と敗退の間のペアワイズな選好を学習する選好駆動最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:04:32 GMT)
Noise-Informed Diffusion-Generated Image Detection with Anomaly Attention [10.1] 偽造検出の鍵となる課題は、トレーニング中に見えない拡散モデルに一般化することである。
拡散モデルの異なる画像が、実際の画像と異なる類似のノイズパターンを共有することを観察する。
SOTA検出モデルを実装するために、我々はNASAをSwin Transformerに組み込み、NASA-Swinという新しい検出アーキテクチャを構築した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:25:59 GMT)
Stealing That Free Lunch: Exposing the Limits of Dyna-Style Reinforcement Learning [10.1] Dyna-style off-policy model-based reinforcement learning (DMBRL)アルゴリズムは、合成状態遷移データを生成するための一連の技術である。
本稿では,異なるベンチマーク環境におけるDMBRLアルゴリズムの適用時に観測された驚くべき性能差を同定し,検討する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:24:06 GMT)
Protocol for detecting the nonlocality of the multi-Majorana Systems [9.9] マヨラナゼロモード (MZMs) は非アベリア準粒子であり、フォールトトレラント量子コンピューティングのトポロジカル量子ビットとして機能する可能性がある。
本稿では,MZMシステムの非局所特性を識別するために,パリティ測定のみに基づく絡み付き目撃者を用いたプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:56:24 GMT)
Mathematical Proof as a Litmus Test: Revealing Failure Modes of Advanced Large Reasoning Models [9.9] RFMDataset(Reveal Failure Modes)は200種類の数学的証明問題の集合である。
先進モデルの性能を徹底的に評価する。
解析により,現在の大規模推論モデルの基本的制約を示す10種類のきめ細かい誤差型が明らかになった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:14:18 GMT)
Zero-Shot Cognitive Impairment Detection from Speech Using AudioLLM [9.8] 音声は、認知低下を評価するための非侵襲的で容易に収集可能なバイオマーカーとして注目されている。
従来の認知障害検出法は、音声から抽出された音響的特徴と言語的特徴に基づいて訓練された教師付きモデルに依存している。
音声入力とテキスト入力の両方を処理可能なモデルであるQwen2- Audio AudioLLMを用いた,最初のゼロショット音声ベースのCI検出手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:28:43 GMT)
Exploring and Improving Initialization for Deep Graph Neural Networks: A Signal Propagation Perspective [9.7] グラフニューラルネットワーク(GNN)は、ネットワークの深さが増加するにつれて性能が低下することが多い。
本稿では,GNN内の信号伝搬(SP)を向上する手法を導入することにより,この問題に対処する。
GNNにおける有効SPの3つの重要な指標として、前方伝播、後方伝播、グラフ埋め込み変動(GEV)を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:14:31 GMT)
RL2Grid: Benchmarking Reinforcement Learning in Power Grid Operations [9.7] RL2Gridは電力系統オペレーターと協調して設計され、グリッド制御の進歩を加速する。
RTE Franceのパワーシミュレーションフレームワーク上に構築されたRL2Gridは、タスク、状態と行動空間、およびRLアルゴリズムの体系的評価と比較のための報酬構造を標準化する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 00:58:35 GMT)
CORE-KG: An LLM-Driven Knowledge Graph Construction Framework for Human Smuggling Networks [9.7] CORE-KGは法的テキストから解釈可能な知識グラフを構築するためのモジュラーフレームワークである。
ノード重複を33.28%減らし、法的なノイズを38.37%減らした。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:58:00 GMT)
Dissecting the SWE-Bench Leaderboards: Profiling Submitters and Architectures of LLM- and Agent-Based Repair Systems [9.5] 我々は、SWE-Benchのリーダーボードへの全ての提出について、タイプ、製品可用性、LCMの使用状況、システムアーキテクチャなど、67のユニークなアプローチを解析し、初めて包括的な研究を行った。
以上の結果から,プロプライエタリなLCM(特にClaude 3.5/3.7)の優位性,エージェントデザインと非エージェントデザインの両方の存在,そして個々の開発者から大企業にまたがるコントリビュータベースの存在が明らかになった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:57:08 GMT)
MIST: Jailbreaking Black-box Large Language Models via Iterative Semantic Tuning [9.5] そこで本研究では,MISTと命名されたIterative Semantic Tuningを用いて,大規模言語モデルのジェイルブレイクを効果的に行う手法を提案する。
MISTは、攻撃者が有害なコンテンツを誘導しながら、元の意味的意図を保存するプロンプトを反復的に洗練することを可能にする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:16:47 GMT)
Collaborative Perception Datasets for Autonomous Driving: A Review [9.5] 共同認識は、自律運転における認識精度、安全性、堅牢性を高める可能性から、学術や産業からの関心が高まりつつある。
多くの協調認識データセットが登場し、協調パラダイム、センサー構成、データソース、アプリケーションシナリオが変化している。
協調認識データセットに焦点を当てた最初の包括的なレビューとして、この作業は、多次元的な観点から既存のリソースをレビューし、比較する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:01:16 GMT)
Rapid and Continuous Trust Evaluation for Effective Task Collaboration Through Siamese Model [9.5] 本稿では,効果的なタスクコラボレーションを促進するために,シームズ対応の迅速・連続信頼評価フレームワーク(SRCTE)を提案する。
実際のシステムは、2つのDell EMC 5200サーバとGoogle Pixel 8を使って構築され、提案されているSRCTEフレームワークの有効性をテストする。
実験結果から,SRCTEは少量のデータだけで急速に収束し,異常信頼検出率が高いことがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:30:59 GMT)
Modeling Neural Networks with Privacy Using Neural Stochastic Differential Equations [9.4] 本研究では,ニューラル常微分方程式(NODE)を用いた固有プライバシー特性を持つシステムのモデル化の可能性について検討する。
NSDEはDPSGDと同等のプライバシー保証を提供するDP学習者であることを示す。
NSDEはメンバーシップ推論攻撃の緩和にも有効であり、DP-SGDで訓練されたプライベートモデルに匹敵するリスクレベルを達成する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 22:28:35 GMT)
Part$^{2}$GS: Part-aware Modeling of Articulated Objects using 3D Gaussian Splatting [9.4] Part$2$GSは、高忠実度幾何を持つ多部オブジェクトの調音されたデジタルツインをモデル化するための新しいフレームワークである。
物理的に一貫した運動を保証するために,物理に基づく制約によって導かれる運動認識の標準表現を提案する。
Part$2$GSは、可動部品に対するChamfer Distanceにおいて、最先端のメソッドを最大10$times$で一貫して上回ることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:59:12 GMT)
Stretching Beyond the Obvious: A Gradient-Free Framework to Unveil the Hidden Landscape of Visual Invariance [9.3] ストレッチ・アンド・スキーズ(Stretch-and-Squeeze、SnS)は、単位の不均一な風景を特徴づける、バイアスのない、モデルに依存しない、勾配のないフレームワークである。
SnSは、単位活性化を保ちながら、与えられた処理段階における基準刺激の表現を最大に変化させる摂動を求める。
畳み込みニューラルネットワーク(CNN)の適用により、SnSは、アフィン変換によって生成されたものよりもピクセル空間内の参照画像から得られる画像のバリエーションを明らかにした。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:49:35 GMT)
ReasonGRM: Enhancing Generative Reward Models through Large Reasoning Models [9.3] 本稿では,3段階生成報酬モデルフレームワークReasonGRMを紹介する。
第1段階では、ゼロRLは簡潔で結果指向の推論パスを生成するために使用される。
第2段階では、$Rstar$は、生成可能性に基づいて推論パスをスコアする。
最終段階では、モデルは強化学習によりさらに洗練され、好みの識別能力が向上する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:10:52 GMT)
VMRA-MaR: An Asymmetry-Aware Temporal Framework for Longitudinal Breast Cancer Risk Prediction [9.3] 我々は,Vision Mamba RNN (VMRNN) と状態空間モデル (SSM) とLSTMライクな記憶機構を併用し,乳房組織進化の微妙な傾向を捉えることを提案する。
臨床的に関連する2つの相違点を特定するために,空間非対称性検出器(SAD)と縦方向非対称性追跡器(LAT)を組み込んだ。
この統合された枠組みは、特に高密度の乳がん症例において、がん発症の予測において顕著な改善を示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:17:19 GMT)
A Comparative Analysis of Distributed Linear Solvers under Data Heterogeneity [9.2] 本稿では,タスクマスターと機械の集合によって分散的あるいは連合的に線形方程式の大規模系を解く問題を考察する。
我々は、この問題を解決するためによく知られたアルゴリズムの2つのクラス、すなわち射影法と最適化法を比較した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:44:13 GMT)
RapFlow-TTS: Rapid and High-Fidelity Text-to-Speech with Improved Consistency Flow Matching [9.2] RapFlow-TTS は高速かつ高忠実な TTS 音響モデルであり,フローマッチング(FM) トレーニングにおける速度一貫性の制約を利用する。
RapFlow-TTSは,従来のFMとスコアに基づく手法に比べて,合成ステップの5倍と10倍の削減で高忠実度音声合成を実現する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:19:29 GMT)
General-Purpose Robotic Navigation via LVLM-Orchestrated Perception, Reasoning, and Acting [9.2] Agentic Robotic Navigation Architecture (ARNA)は、LVLMベースのエージェントに知覚、推論、ナビゲーションツールのライブラリを装備する汎用ナビゲーションフレームワークである。
実行時に、エージェントは自律的にタスク固有のナビゲーションを定義し、実行し、ロボットモジュールを反復的にクエリし、マルチモーダル入力を推論し、適切なナビゲーションアクションを選択する。
ARNAは最先端のパフォーマンスを達成し、手作りの計画や固定された入力表現、既存の地図に頼ることなく、効果的な探索、ナビゲーション、具体化された質問応答を実証する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:06:14 GMT)
One-Step Diffusion for Detail-Rich and Temporally Consistent Video Super-Resolution [9.0] 本稿では,効果的なSDベースのワンステップ拡散モデルをトレーニングするためのDual LoRA Learning(DLoRAL)パラダイムを提案する。
実験の結果,DLoRALは精度と速度の両方で高い性能を発揮することがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:05:29 GMT)
RAGentA: Multi-Agent Retrieval-Augmented Generation for Attributed Question Answering [8.8] RAGentAは、属性付き質問応答(QA)のためのマルチエージェント検索拡張生成(RAG)フレームワークである
フレームワークの中心は疎密なメソッドを組み合わせたハイブリッド検索戦略であり、Recall@20を12.5%改善している。
RAGentAは標準的なRAGベースラインを上回り、精度は1.09%、忠実度は10.72%向上した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:37:03 GMT)
Client-Centered Federated Learning for Heterogeneous EHRs: Use Fewer Participants to Achieve the Same Performance [8.8] 電子健康記録(EHR)の増大は、臨床予測タスクにおけるモデルの正確性と堅牢性を改善する機会を提供する。
従来の集中型アプローチとは異なり、フェデレートされた学習は、患者のプライバシを保持し、規制の制約を遵守しながら、複数の機関からのデータのトレーニングを可能にする。
本稿では,患者EHRデータを用いた費用対効果の高いホスト特異的予測モデルの構築を目的とした,連合学習フレームワークであるEHRFLを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:18:50 GMT)
Calibrating Pre-trained Language Classifiers on LLM-generated Noisy Labels via Iterative Refinement [8.8] そこで我々はSiDyP: Simplex Label Diffusion with Dynamic Priorを提案する。
我々のフレームワークは、ゼロショットと少数ショットのLLM生成したノイズラベルデータセットをそれぞれ平均7.21%と7.30%で微調整したBERT分類器の性能を向上させることができる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:24:07 GMT)
GenUP: Generative User Profilers as In-Context Learners for Next POI Recommender Systems [8.8] POI(Point-of-Interest)レコメンデーションシステムは、透明性、解釈可能性、精査性に欠けることが多い。
既存の手法は、他のユーザーからの類似の軌跡を活用することで、この問題に対処することが多い。
本稿では,LBSNの大規模チェックインから自然言語(NL)ユーザプロファイルを生成する手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:55:47 GMT)
Efficient Online Inference of Vision Transformers by Training-Free Tokenization [8.8] 既存の圧縮技術では、追加のエンドツーエンドの微調整が必要になる。
我々は、性能とランタイムを維持しながら、エネルギーコストを削減できるトレーニング不要の方法である、textbfVisual Word Tokenizer$(VWT)を紹介した。
以上の結果から,VWTは効率の良いオンライン推論に適しており,性能に限界があることが明らかとなった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:50:00 GMT)
ParkFormer: A Transformer-Based Parking Policy with Goal Embedding and Pedestrian-Aware Control [8.7] 自動駐車のためのトランスフォーマーベースのエンドツーエンドフレームワークは、専門家によるデモンストレーションから学ぶ。
ネットワークは、入力されたサラウンドビューカメライメージ、ゴールポイント表現、エゴ車両の動き、および歩行者軌道として捉えている。
実験の結果, 平均位置誤差は0.21m, 方位誤差は0.41度, 96.57%であった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:14:09 GMT)
From Unstructured Communication to Intelligent RAG: Multi-Agent Automation for Supply Chain Knowledge Bases [8.6] サプライチェーン操作は大量の運用データを生成する。
システムの使用、トラブルシューティング、非構造化、解決技術といった重要な知識は、しばしば通信の中に埋もれています。
RAGシステムは知識ベースとしてそのようなコミュニケーションを活用することを目的としているが、その有効性は生データの問題によって制限されている。
我々はこれらのコミュニケーションを構造化知識ベースに変換する新しいオフラインファースト手法を導入する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 21:38:06 GMT)
Re-Evaluating Code LLM Benchmarks Under Semantic Mutation [8.6] 本稿では,コードベンチマークの迅速感度を調査するための実証的研究について述べる。
本稿では,プロンプトテンプレートのセマンティクスと構造を両立させる手法として,プロンプトテンプレートを改良する汎用フレームワークを提案する。
この結果から, 急激な変化であっても, 性能が著しく変化することが示唆された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:30:36 GMT)
Conditional Front-door Adjustment for Heterogeneous Treatment Assignment Effect Estimation Under Non-adherence [8.4] 不均一な治療課題効果の推定は、治療決定を通知することができる。
標準バックドア調整(SBD)と条件付きフロントドア調整(CFD)は、偏りのない見積もりを回復することができる。
LobsterNetは、ニュアンスパラメータのジョイントモデリングを備えたCFDを実装するマルチタスクニューラルネットワークである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:29:02 GMT)
Agent-RLVR: Training Software Engineering Agents via Guidance and Environment Rewards [8.4] 本稿では,エージェント設定に挑戦する上で,RLVRを効果的にするためのフレームワークであるAgent-RLVRを紹介する。
エージェント-RLVRは、人間の教育にインスパイアされ、エージェント誘導(エージェント誘導)を導入している。
ガイダンスを付加したRLVRデータは、テストタイム報酬モデルトレーニングにも役立ち、さらにpass@1を27.8%に向上させることで示されています。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:32:06 GMT)
LM-SPT: LM-Aligned Semantic Distillation for Speech Tokenization [8.4] 近年の音声トークン化手法は,低レベル音響から意味情報を分離し,言語モデルとの整合性を向上することを目的としている。
新規なセマンティック蒸留を導入する音声トークン化手法であるLM-SPTを提案する。
LM-SPTは,ベースラインに比べて高い再現性が得られることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:15:14 GMT)
Temperature calibration of surface emissivities with an improved thermal image enhancement network [8.2] 赤外線サーモグラフィーは、物質放射率の変化による温度精度の持続的な課題に直面している。
本研究では、温度補正と画像強調を統一する物理誘導型ニューラルネットワークフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:40:05 GMT)
PQCAD-DM: Progressive Quantization and Calibration-Assisted Distillation for Extremely Efficient Diffusion Model [8.2] 拡散モデルは画像生成において優れているが、計算と資源集約である。
PQ(Progressive Quantization)とCAD補助蒸留(CAD)を組み合わせた新しいハイブリッド圧縮フレームワークであるPQCAD-DMを提案する。
PQは、運動量に基づくメカニズムで導かれる適応ビット幅遷移を持つ2段階の量子化を採用し、低精度での過剰な重みの摂動を低減する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 06:43:27 GMT)
LoRA-Edit: Controllable First-Frame-Guided Video Editing via Mask-Aware LoRA Fine-Tuning [8.1] 拡散モデルを用いたビデオ編集は、ビデオの高品質な編集を作成できる顕著な成果を上げている。
ファーストフレーム誘導編集は、最初のフレームを制御できるが、その後のフレームよりも柔軟性に欠ける。
フレキシブルなビデオ編集のための事前訓練された画像対ビデオ(I2V)モデルに適応するマスクベースのLoRAチューニング手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:52:21 GMT)
Adaptive Control Attention Network for Underwater Acoustic Localization and Domain Adaptation [8.0] 海洋における音源の局所化は、環境の複雑でダイナミックな性質のために難しい課題である。
本研究では,移動音源と受信機の距離を正確に予測するマルチブランチネットワークアーキテクチャを提案する。
提案手法は,SOTA(State-of-the-art)アプローチに類似した設定で優れる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:13:30 GMT)
Non-perturbative Quantum Dynamics on Embedded Submanifolds: From Geometric Mass to Higgs Potentials [8.0] 高次元空間に埋め込まれた曲面部分多様体に対する量子力学の枠組みを確立する。
我々は、制約量子化における非摂動的幾何学的相互作用-解決のあいまいさを取り入れた最初の完全シュル・オーディンガー方程式とクライン=ゴルドン方程式を導出した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:18:47 GMT)
Wide band magnetometry based on color centers with transverse zero-field splitting [7.9] ダイヤモンド、炭化ケイ素(SiC)、その他のホスト行列に埋め込まれた固体のカラーセンターは、ナノスケール量子センシングのための有望なプラットフォームを提供する。
強い逆ゼロフィールド分割(ZFS)は、その局所ひずみとホスト構造の低対称性のために色中心に導入されることがある。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:27:04 GMT)
SLED: A Speculative LLM Decoding Framework for Efficient Edge Serving [7.9] acronymは、軽量エッジデバイスが様々なドラフトモデルを使用して、複数の候補トークンをローカルにドラフトできる方法である。
単一の共有エッジサーバは、より正確なターゲットモデルを用いてトークンを効率よくバッチし、検証する。
Jetson Orin Nano、Raspberry Pi 4B/5、Nvidia A100 GPUを搭載したエッジサーバを使った最初の実験は、大きなメリットを示している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:15:09 GMT)
Planning of Heuristics: Strategic Planning on Large Language Models with Monte Carlo Tree Search for Automating Heuristic Optimization [7.8] ヒューリスティックス計画(PoH: Planning of Heuristics)は, LLM自己回帰とモンテカルロ木探索を統合する最適化手法である。
PoHは、そのパフォーマンスを評価し、改善提案を提供することで、生成した報酬を反復的に洗練する。
本稿では,旅行セールスマン問題とフローショップスケジューリング問題の解決にPoHを適用した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:14:59 GMT)
Capturing Polysemanticity with PRISM: A Multi-Concept Feature Description Framework [7.7] 我々は、ニューラルネットワーク機能の本質的な複雑さを捉える新しいフレームワークであるPRISMを紹介する。
機能ごとに1つの記述を割り当てる以前のアプローチとは異なり、PRISMは多意味的特徴と単意味的特徴の両方に対してよりニュアンスな記述を提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:17:52 GMT)
Co-VisiON: Co-Visibility ReasONing on Sparse Image Sets of Indoor Scenes [7.6] スパース画像集合上でのコ・ヴィジビリティ推論を評価するために,コ・ヴィジビリティ・リアソニング・ベンチマークを導入する。
実験の結果,コビジュアビリティは一般に低レベルの特徴マッチングタスクとして扱われるが,スパース条件下での既存の視覚モデルには大きな課題が生じることがわかった。
本稿では,純視覚モデルにおける最高性能を達成し,プロプライエタリなVLMとのギャップを狭める,新しい多視点ベースラインであるCovisを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:42:26 GMT)
IQFM A Wireless Foundational Model for I/Q Streams in AI-Native 6G [7.5] 本稿では,無線通信における最初のI/Q信号基礎モデルであるIQFMについて述べる。
IQFMは変調分類、AoA、ビーム予測、RFフィンガープリントといった様々なタスクをサポートする。
また、タスク対応強化戦略を導入し、変換をコア拡張に分類する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:14:19 GMT)
Critical Appraisal of Fairness Metrics in Clinical Predictive AI [7.5] 我々は,臨床予測AIの公正度指標を同定し,批判的に評価するスコーピングレビューを行った。
我々は、モデルが個人または機密属性によって定義されたグループに対して(社会的に)差別するかどうかを定量化するための尺度として「公正計量」を定義した。
本研究は, 不確実性定量化, 交叉性, 実世界の応用性において, 公平性の定義と定量化, ギャップの特定における概念的課題を明らかにする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:43:36 GMT)
Robust Finite-Memory Policy Gradients for Hidden-Model POMDPs [7.4] ポリシーが与えられたHM-POMDPに対して、それぞれのPOMDPに対して十分な性能を達成した場合、ロバストである。
提案手法は,POMDPよりも堅牢で,より汎用性の高いポリシーを提示する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:24:24 GMT)
Efficient but Vulnerable: Benchmarking and Defending LLM Batch Prompting Attack [7.3] 悪意のあるユーザは、攻撃命令をバッチに注入することで、すべてのクエリに不要な干渉を引き起こす。
この脆弱性は、フィッシングリンクのような有害なコンテンツや論理的推論の中断をもたらす可能性がある。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:32:36 GMT)
SR3D: Unleashing Single-view 3D Reconstruction for Transparent and Specular Object Grasping [7.2] 本研究では,単一視界から透明物体とスペキュラ物体をロボットで把握することのできる,学習自由フレームワークSR3Dを提案する。
具体的には、単一のビューRGBと深度画像が与えられた場合、SR3Dはまず外部視覚モデルを使用して3D再構成されたオブジェクトメッシュを生成する。
そして、鍵となるアイデアは、3Dオブジェクトのポーズとスケールを決定し、再構成されたオブジェクトを元の奥行き劣化した3Dシーンに正確にローカライズすることだ。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:07:10 GMT)
Towards Efficient Few-shot Graph Neural Architecture Search via Partitioning Gradient Contribution [7.2] Gradient Contribution (GC) 法は、モジュール間の勾配方向のコサイン類似性を効率的に計算する。
Unified Graph Neural Architecture Search (UGAS)フレームワークはMPNNとGTの最適な組み合わせを探索する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:18:32 GMT)
SafeGenBench: A Benchmark Framework for Security Vulnerability Detection in LLM-Generated Code [7.2] LLM生成コードのセキュリティを評価するために特別に設計されたベンチマークであるSafeGenBenchを紹介する。
データセットには、幅広い一般的なソフトウェア開発シナリオと脆弱性タイプが含まれている。
SafeGenBench上での最先端LCMの実証評価を通じて,脆弱性のないコードを生成する能力に重大な欠陥があることを明らかにする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:42:57 GMT)
Navigating the Deep: Signature Extraction on Deep Neural Networks [7.1] ニューラルネットワークモデル抽出は重要なセキュリティ上の懸念事項として浮上している。
以前の研究は、ニューラルネットワークパラメータを抽出するために、差分暗号解析にインスパイアされたテクニックを導入していた。
カルリーニ等のシグネチャ抽出法において,シグネチャ抽出法において,シグネチャ抽出法を初めて体系的に同定し,対処することにより,シグネチャ抽出法を再検討し,洗練する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:59:47 GMT)
Multisetting protocol for Bell correlated states detection with spin-$f$ systems [7.1] 本稿では,2体ベル相関検出のためのマルチセットプロトコルを提案する。
我々は、スピン-f$原子ボース=アインシュタイン凝縮体内のSU(2)サブシステムの$f$対で実現されたスピンネマティック圧縮状態に適用する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:58:01 GMT)
Double Supersolid Phase in a Bosonic t-J-V Model with Rydberg Atoms [7.1] Rydberg原子で現在実現されているボソニックt-J-Vモデルについて検討する。
以上の結果から,ボーソニックt-J-Vモデルは,リドベルク原子配列における異方性量子位相を探索するための,有望かつ実験的に利用可能なプラットフォームとして確立された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:20:01 GMT)
Understanding and Reducing the Class-Dependent Effects of Data Augmentation with A Two-Player Game Approach [7.1] CLAssに依存した乗算重み付け方式であるCLAMを提案する。
以上の結果から,学習した分類器の性能は,平均精度に限られた影響しか与えず,クラスにかなり分散していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:36:15 GMT)
Quantum Optimization for Software Engineering: A Survey [6.8] この体系的文献レビューは、古典的なSE最適化問題を解くために量子または量子インスパイアされたアルゴリズムを適用する文献の研究に焦点を当てている。
本研究は,SEオペレーションやソフトウェアテストなどの分野での集中的な研究活動と,他のSE活動との大きなギャップを明らかにした。
本研究は,SBSEコミュニティが次世代SE課題に対処する上で,量子技術の活用に有効であることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:01:26 GMT)
A Statistical Evaluation of Indoor LoRaWAN Environment-Aware Propagation for 6G: MLR, ANOVA, and Residual Distribution Analysis [6.8] 本研究では,1,328,334フィールドの広範囲なデータセットを用いて,複雑度を捕捉・解析するための2段階のアプローチを提案する。
従来の伝搬測定値と,提案する環境変数による拡張を含む,多重線形回帰モデルを実装した。
分散分析を用いて、これらの環境要因を追加することで、説明できない分散を42.22%削減できることを示した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:06:39 GMT)
Keeping Medical AI Healthy: A Review of Detection and Correction Methods for System Degradation [6.8] このレビューでは、医療におけるAIシステムの「健康」の監視と維持について、前向きな視点を提示する。
継続的パフォーマンス監視、早期劣化検出、効果的な自己補正メカニズムの緊急ニーズを強調します。
この研究は、ダイナミックな臨床環境における安全な長期展開を維持できる信頼性が高く堅牢な医療AIシステムの開発を導くことを目的としている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:22:07 GMT)
An Uncertainty-Aware Dynamic Decision Framework for Progressive Multi-Omics Integration in Classification Tasks [6.7] 我々は、オミクスデータ分類のための不確実性を考慮したマルチビュー動的決定フレームワークを提案する。
ヘテロジニアスなモジュラリティを統合するために、Dempster-Shafer理論に基づく融合戦略を用いる。
3つのデータセットでは、50%以上のケースが、単一のオミクスモダリティを使用して正確に分類された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:44:14 GMT)
From Concepts to Components: Concept-Agnostic Attention Module Discovery in Transformers [6.6] 本稿では,任意の複雑な概念を一般変圧器モデルの特定の注意点にマッピングする概念に依存しない手法を提案する。
次に、概念の効果を減少または増幅するための単純な戦略であるScalar Attention Module Intervention (SAMI)を提案する。
以上の結果から,LLM後トレーニング前後のモジュール位置は安定であり,LLM多言語化のメカニズムに関する先行研究が確認できた。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:04:11 GMT)
Language Models Grow Less Humanlike beyond Phase Transition [6.5] ヒトの読解行動(サイコメトリック予測力; PPP)との整合性(LM)は、先端まで前訓練中に改善することが知られている。
単語頻度、注意の傾向バイアス、文脈サイズなど、様々な要因がPPPに影響を与えるように理論化されている。
本研究は,特定の注意点の急激な出現を特徴とし,基礎となる因子が事前学習相転移であると仮定する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 21:19:58 GMT)
eSapiens: A Real-World NLP Framework for Multimodal Document Understanding and Enterprise Knowledge Processing [6.5] 企業環境での質問応答システムeSapiensを紹介する。
eSapiensは、二重モジュールアーキテクチャを介して構造化データベースと非構造化コーパスをブリッジする。
我々は、RAGTruthベンチマークでeSapiensを評価し、完全性、幻覚、文脈利用といった重要な側面における性能を分析した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 06:07:20 GMT)
FedFitTech: A Baseline in Federated Learning for Fitness Tracking [6.4] 我々は、FedFitTechベースラインを公開し、業界研究者と学術研究者の両方が広く利用している。
本稿では,クライアント側早期停止戦略を取り入れたFedFitTechベースラインに基づくシステムを実装するケーススタディを提案する。
その結果,全体の冗長通信を13%削減し,認識性能を無視できるコストで1%向上させることができた。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:43:39 GMT)
EASE: Embodied Active Event Perception via Self-Supervised Energy Minimization [6.2] アクティブイベント認識は、人間とAIのコラボレーション、補助ロボット工学、自律ナビゲーションといったタスクにおいて、インテリジェンスを具現化する上で不可欠である。
本稿では,自由エネルギーによる表現学習と具体化制御を一体化する自己教師型フレームワークであるEASEを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:45:51 GMT)
Al-Khwarizmi: Discovering Physical Laws with Foundation Models [6.1] データから物理法則を推定することは、科学と工学の重要な課題である。
この研究は、データから物理法を発見するための新しいエージェントフレームワークであるAl-Khwarizmiを紹介している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:22:21 GMT)
Exploring Traffic Simulation and Cybersecurity Strategies Using Large Language Models [5.8] 本研究では,交通シミュレーションとサイバーセキュリティテストを強化するための新しいマルチエージェントフレームワークを提案する。
このフレームワークは、交通シナリオの作成、サイバー攻撃戦略の設計、防衛機構の開発を自動化する。
攻撃時の移動時間は10.2%増加しており、防衛戦略により3.3%減少している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:41:23 GMT)
Dynamic Knowledge Integration for Evidence-Driven Counter-Argument Generation with Large Language Models [5.7] 本稿では,Large Language Models (LLMs) を用いた対問題生成改善における動的外部知識統合の役割について検討する。
我々は,議論の複雑さと評価可能性のバランスをとるために,議論と反論のペアを手作業でキュレートした新しいデータセットを導入する。
実験の結果、Webから動的外部知識を統合することで、生成した逆問題の品質が大幅に向上することが示された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:27:28 GMT)
Sample-Efficient Estimation of Nonlinear Quantum State Functions [5.6] 我々は、ユニタリとパラメタライズド量子回路の線形結合によりSWAPテストを拡張することにより、量子状態関数(QSF)フレームワークを導入する。
我々のフレームワークは、精度の高い量子状態の任意の正規化次数-$n$関数の実装を可能にする。
エントロピー,忠実度,固有値推定などの基本課題に対して,量子アルゴリズムの開発にQSFを適用した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:44:16 GMT)
Tracker Installations Are Not Created Equal: Understanding Tracker Configuration of Form Data Collection [5.6] 我々はGoogleとMetaのトラッカーをどのように構成してPII(Personally Identifying Information)をWebフォームから収集するかを検討する。
その結果,MetaとGoogleはともにフォームデータ収集の活用を奨励していることがわかった。
私たちは、MetaやGoogleのポリシーに違反したフォームデータPIIを収集する可能性のあるトラッカーをインストールした、機密性の高い金融および健康のウェブサイトを特定します。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:29:13 GMT)
ScholarSearch: Benchmarking Scholar Searching Ability of LLMs [5.6] 本研究では,学術研究におけるLarge Language Models (LLM) の複雑な情報検索能力を評価するために設計された最初のデータセットであるScholarSearchを提案する。
学術的実践性(Academic Practicality) – 質問内容は実際の学習環境と研究環境を密接に反映する。
我々は、複雑な学術情報検索タスクにおけるLCMの性能向上をより正確に測定し、促進することを期待する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:48:51 GMT)
Towards Safety Evaluations of Theory of Mind in Large Language Models [5.4] 大きな言語モデル(LLM)は、監視機構を無効にし、偽装的に応答するように見える振る舞いを示す。
これらの振る舞いがモデル内の隠蔽的、意図的なプロセスに由来するかどうかを調べることが不可欠である。
オープンウェイトLLMにおける開発動向を分析した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:52:17 GMT)
Schrödinger Bridge Matching for Tree-Structured Costs and Entropic Wasserstein Barycentres [5.4] フローベースの生成モデリングは、分散間のSchr"odinger Bridge (SB)を計算するためのスケーラブルな方法を提供している。
IMFの手続きは、連続的なブリッジマッチングステップを通じてSB問題を解決する。
我々は、木構造SB問題の解決のためにIMFの手続きを拡張した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:47:47 GMT)
Ask, Fail, Repeat: Meeseeks, an Iterative Feedback Benchmark for LLMs' Multi-turn Instruction-Following Ability [5.4] Meeseeksは,反復的なフィードバックフレームワークを通じて,現実的な人間-LLMインタラクションをシミュレートする。
MeeseeksはマルチターンシナリオにおけるLLMの命令フォロー機能に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:25:51 GMT)
LLM-Based Bot Broadens the Range of Arguments in Online Discussions, Even When Transparently Disclosed as AI [5.4] 本研究では,LLMをベースとしたロボットが,参加者がオンラインディスカッションで表現する視点の範囲を拡大できるかどうかを検討する。
議論を積極的に監視し、欠落した議論を特定し、会話に導入するボットの効果を評価する。
その結果,ロボットは主観的指標と主観的指標の両方で測定されるように,議論の範囲を大きく広げることがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:24:31 GMT)
Belted and Ensembled Neural Network for Linear and Nonlinear Sufficient Dimension Reduction [5.0] 十分な次元削減のための統一的でフレキシブルで実装が容易なフレームワークを導入します。
このフレームワークは、特別に構造化されたニューラルネットワークによって実現される。
ニューラルネットワークの利点により、この手法は非常に高速に計算できる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:19:43 GMT)
Unsupervised Image Super-Resolution Reconstruction Based on Real-World Degradation Patterns [5.0] 超解像再構成モデルのトレーニングのための新しいTripleGANフレームワークを提案する。
このフレームワークは、LR観測から実世界の劣化パターンを学習し、対応する劣化特性を持つデータセットを合成する。
本手法は, 過スムーズなアーティファクトを伴わずに, 鋭い復元を維持しながら, 定量的な測定値に明らかな利点を示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:24:48 GMT)
A Homomorphic Encryption Framework for Privacy-Preserving Spiking Neural Networks [4.9] スパイキングニューラルネットワーク(SNN)は人間の脳の振る舞いを模倣し、効率を改善しエネルギー消費を減らす。
ホモモルフィック暗号化(HE)は、暗号データを復号することなく計算を実行できるソリューションを提供する。
この研究では、Brakerski/Fan-Vercauteren(BFV)暗号化スキームを用いて、従来のディープニューラルネットワーク(DNN)とSNNを比較した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:17:20 GMT)
A Kaleidoscope of Topological Structures in Dipolar Bose-Einstein Condensates with Weyl-Like Spin-Orbit Coupling in Anharmonic Trap [4.9] ボース・アインシュタイン凝縮体(BEC)における従来の等方性s波相互作用とは異なる性質を有する双極子-双極子相互作用(DDI)
2成分BECの基底状態におけるDDI, ワイル様SOC, 回転, トラップ不調和の影響を解析した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:07:48 GMT)
Quantum versus Classical Separation in Simultaneous Number-on-Forehead Communication [4.9] 本稿では、量子と有界エラーのランダム化通信の複雑性を、Number-on-Foreheadモデルの変種で初めて指数関数的に分離する。
具体的には、Gadgeted Hidden Matching Problemを導入し、O(log n)$の同時量子通信でのみ解けることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:40:43 GMT)
AnyTraverse: An off-road traversability framework with VLM and human operator in the loop [4.9] オフロード・トラバーサビリティ・セグメンテーションは、捜索・救助、軍事作戦、野生生物探査、農業における自律的なナビゲーションを可能にする。
我々は、自然言語ベースのプロンプトと人間の操作支援を組み合わせたフレームワークであるAnyTraverseを紹介し、多様なロボット車両の航行可能な地域を決定する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:31:13 GMT)
Extendible quantum measurements and limitations on classical communication [4.8] 量子状態とチャネルの非拡張性は、量子力学の非閉定理と密接に関連している。
整数 $kge 2$ 毎に $k$-extendible 測定を定義する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:12:56 GMT)
From Generality to Mastery: Composer-Style Symbolic Music Generation via Large-Scale Pre-training [4.7] 広義のコーパスから学んだ一般的な音楽知識が、特定の作曲家スタイルの熟達度をいかに高めるかを検討する。
まず、ポップ、フォーク、クラシック音楽の大規模なコーパス上で、REMIベースの音楽生成モデルを事前訓練する。
そして、Bach、Mozart、Beethoven、Chopinの4人の著名な作曲家による、人間によって検証された小さなデータセットに、それを微調整します。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 22:20:59 GMT)
CUBA: Controlled Untargeted Backdoor Attack against Deep Neural Networks [4.7] Constrained Untargeted Backdoor Attack (CUBA) について紹介する。
CUBAは、未標的攻撃の柔軟性と標的攻撃の意図性を組み合わせる。
提案したCUBAの異なるデータセットに対する有効性を示す実験を行った。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 00:47:30 GMT)
A Quantile Regression Approach for Remaining Useful Life Estimation with State Space Models [4.7] 本稿では,状態空間モデル(SSM)を利用したRUL推定手法を提案する。
モデルの不確実性に対処するため、SQR(Simmoultaneous Quantile Regression)がSSMに統合され、複数の量子推定が可能となる。
その結果、SSMモデルの精度と計算効率が向上し、高い産業応用の可能性を示している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:15:55 GMT)
AI based Content Creation and Product Recommendation Applications in E-commerce: An Ethical overview [4.7] 本稿では,eコマースにおけるAIによるコンテンツ作成と製品レコメンデーションの倫理的意味について検討する。
バイアスを取り除き、傾きを確保するための実行可能なベストプラクティスを提案する。
コンテンツ作成や製品レコメンデーションのためのEコマースアプリケーションにおいて、AIを倫理的に活用するためのガイドラインを提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:54:25 GMT)
Co-Seg++: Mutual Prompt-Guided Collaborative Learning for Versatile Medical Segmentation [4.6] 医用画像解析は、臓器や組織を共同で分割する必要があるため、重要な課題である。
既存の研究は通常、異なるセグメンテーションタスクを独立した形で定式化している。
汎用医療セグメンテーションのためのCo-Seg++フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:05:09 GMT)
No Scratch Quantum Computing by Reducing Qubit Overhead for Efficient Arithmetics [4.6] 量子ハミルトニアン・コンピューティング(QHC)は、単一の回転量子ゲート内の論理演算の入力を符号化することで、新しいアプローチを導入する。
本稿では,標準的なToffoli + CNOTレイアウトを圧縮する可逆半加算回路と完全加算回路を提案する。
真理表を評価するのに必要な最小のキュービットとゲートのリソースを見つける上で、QHCの最良の応用を見いだす。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:37:23 GMT)
The Hidden Cost of an Image: Quantifying the Energy Consumption of AI Image Generation [4.4] 本稿では,AI画像生成のエネルギー消費を評価するための総合実験について述べる。
実験では17の最先端画像生成モデルを比較した。
その結果、画像生成モデルは消費するエネルギーで大きく変化し、最大46倍の差があることがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:13:52 GMT)
Theoretical Guarantees for Minimum Bayes Risk Decoding [4.4] 最小ベイズリスク(MBR)復号法は,高い確率で最適解に近づき,その確率は$Oleft(n-frac12right)$である。
この結果は、MBR復号化に関するいくつかの先行的な実証研究で観察された強い性能を理論的に説明するのに役立ちます。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:31:52 GMT)
PasteTrace: A Single Source Plagiarism Detection Tool For Introductory Programming Courses [4.4] PasteTraceは、導入プログラミングコースに特化して設計された、オープンソースのプラジャリズム検出ツールである。
従来の方法とは異なり、PasteTraceは統合開発環境内で運用されており、学生のコーディング活動をリアルタイムで追跡し、盗作の証拠を提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:21:07 GMT)
Automatic Large Language Models Creation of Interactive Learning Lessons [4.4] そこで我々は,構造化チューター教育の授業を作成するシステムを開発した。
本研究は, 学生の自立度を高めること, 援助探索行動を促進すること, カメラの向きを変えることの3つの主要なトピックについて, 英語で授業を行った。
その結果, タスク分解戦略は, 単段階生成よりも高い評価を受けた。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 06:58:50 GMT)
Do We Need Large VLMs for Spotting Soccer Actions? [4.3] 我々は、このビデオ中心のアプローチからテキストベースのタスクへのシフトを提案し、軽量でスケーラブルにする。
専門家のコメントには、マッチにおける重要なアクションを確実に見つけるのに十分な情報が含まれていると仮定する。
本実験は,この言語中心のアプローチが,臨界一致事象の検出に有効であることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:45:54 GMT)
AI's Blind Spots: Geographic Knowledge and Diversity Deficit in Generated Urban Scenario [4.3] 我々は,2つの最先端モデルを用いて,米国各州および関連首都に対して150個の合成画像を生成した。
これらのモデルが米国地理の側面を暗黙的に学習しているのに対して、特定の都市や州の代わりに「米国」のイメージを生成するよう促すと、これらのモデルはメトロポリスのような領域に対して強い代表的偏見を示します。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:43:22 GMT)
Chain-of-Thought Prompting Obscures Hallucination Cues in Large Language Models: An Empirical Evaluation [4.3] CoT(Chain-of-Thought)は、ステップバイステップ推論を奨励することによって幻覚を緩和する。
我々の研究は、推論の利用における見落とされがちなトレードオフを浮き彫りにした。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:49:37 GMT)
Cross-Modal Geometric Hierarchy Fusion: An Implicit-Submap Driven Framework for Resilient 3D Place Recognition [4.2] 本稿では,密度に依存しない幾何学的推論により3次元位置認識を再定義するフレームワークを提案する。
具体的には、元のシーンポイント雲密度の干渉に免疫する弾性点に基づく暗黙の3次元表現を導入する。
これら2種類の情報を活用することで,鳥眼視と3Dセグメントの両視点から幾何学的情報を融合する記述子を得る。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:19:06 GMT)
Multi-Armed Bandits With Machine Learning-Generated Surrogate Rewards [4.1] マルチアームバンディット(MAB)は、不確実性の下でのシーケンシャルな意思決定のための広く採用されているフレームワークである。
我々は,事前学習された機械学習(ML)モデルを用いて,サイド情報と履歴データを報酬に変換するMABの新しい設定を提案する。
この設定の顕著な特徴は、真の報酬データが通常オフラインフェーズでは利用できないため、サロゲート報酬が実質的なバイアスを示す可能性があることである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 00:09:39 GMT)
Additivity of quantum capacities in simple non-degradable quantum channels [4.0] それらの環境を「上回る」ことができるチャネルは,コヒーレントな情報の強い付加性を示すか,弱い付加性を示すかを示す。
本稿では,コーヒーレントな情報付加性を保ちながら,優れた特性を損なうためにチャネルを修飾する補完構造について検討する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:38:47 GMT)
Leveraging LLMs to Assess Tutor Moves in Real-Life Dialogues: A Feasibility Study [4.0] 数学における中学生を支援する大学学生遠隔教師の無作為に選択した50文字の解析を行った。
GPT-4, GPT-4o, GPT-4-turbo, Gemini-1.5-pro, LearnLM を用いて,教師の2つの指導スキルの適用性を評価する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:13:33 GMT)
Are Bias Evaluation Methods Biased ? [4.0] 大規模言語モデルの安全性を評価するためのベンチマークの作成は、信頼できるAIコミュニティにおける重要な活動のひとつだ。
このようなベンチマークがいかに頑健であるかを、異なるアプローチを用いて、偏見を表すモデルの集合をランク付けし、全体ランキングがどの程度類似しているかを比較する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:11:25 GMT)
Coreference as an indicator of context scope in multimodal narrative [3.9] 本研究は,多モーダル言語モデルが中心的表現の分布において人間と大きく異なることを示す。
本稿では,人文と機械文の両文中核パターンの特徴を定量化する指標について紹介する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:55:12 GMT)
Generative Modeling of Full-Atom Protein Conformations using Latent Diffusion on Graph Embeddings [3.9] 完全な全原子タンパク質構造を構築するフレームワークであるフルタンパク質生成(LD-FPG)の潜在拡散について述べる。
LD-FPGは、チェビシェフグラフニューラルネットワーク(ChebNet)を用いて、タンパク質コンホメーションの低次元潜伏埋め込みを得る。
膜環境におけるヒトドーパミンD2受容体の2マイクロ秒MD軌道であるD2R-MDを用いて、シーケンシャルおよび残基ベースプール戦略は、高い構造的忠実度で参照アンサンブルを再現する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:12:34 GMT)
A Minimalist Method for Fine-tuning Text-to-Image Diffusion Models [3.9] ノイズPPOは、初期雑音発生器を学習する最小限の強化学習アルゴリズムである。
実験により、ノイズPPOは元のモデルよりもアライメントとサンプル品質を一貫して改善することが示された。
これらの知見は拡散モデルにおける最小主義的RL微調整の実用的価値を裏付けるものである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:59:05 GMT)
Infrared and Visible Image Fusion Based on Implicit Neural Representations [3.9] 赤外線と可視光画像融合は、両モードの強度を組み合わせることで、情報に富む画像を生成することを目的としている。
Inlicit Neural Representations (INR) に基づく画像融合手法を提案する。
実験の結果,INRFuseは主観的視覚的品質と客観的評価指標の両方において既存手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 06:34:19 GMT)
IsoNet: Causal Analysis of Multimodal Transformers for Neuromuscular Gesture Classification [3.8] クロスモーダル相互作用は、トランス層間の決定信号の約30%に寄与する。
この研究は神経ロボティクス系のためのセンサーアレイの設計に有用であろう。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:31:32 GMT)
Training Multi-Layer Binary Neural Networks With Local Binary Error Signals [3.8] 多層2層ニューラルネットワーク(BNN)のための完全二分法および勾配自由学習アルゴリズムを提案する。
提案アルゴリズムは局所的な二分誤差信号と二分重更新に依存しており、シナプス的メタ可塑性機構として機能する整数値の隠蔽重みを用いる。
実験の結果、既存の完全バイナリ単一層状態のソリューションに比べて、テスト精度は最大で+35.47%向上した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:02:13 GMT)
Enhancing Wireless Device Identification through RF Fingerprinting: Leveraging Transient Energy Spectrum Analysis [3.8] 我々はCNN-Bi-GRUと呼ばれるハイブリッドディープラーニングモデルを導入し、その過渡特性に基づいてRFデバイスの識別を学習する。
提案手法は、99.33%の精度、99.53%のリコール、99.43%のF1スコア、99.17%の分類精度で10倍のクロスバリデーション性能を提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:18:30 GMT)
Accumulation of Device-Independent Quantum Randomness against Time-Ordered No-Signalling Adversaries [3.7] 重要な要素は、ベルテストの生出力のエントロピーがどのように$n$のシーケンシャルランを蓄積するかを特定することである。
小さい$n$の発見にもかかわらず、min-エントロピーは実際には大きな$n$に対して線形に蓄積していることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:18:15 GMT)
Fast and Stable Diffusion Planning through Variational Adaptive Weighting [3.7] 拡散モデルは、最近オフラインRLで有望であることが示されている。
これらの手法は、しばしば高い訓練コストと緩やかな収束に悩まされる。
本稿では,フローベース生成モデルに基づくオンライン推定のためのクローズドフォーム近似手法を提案する。
Maze2D タスクと Kitchen タスクの実験結果から,本手法は最大10倍のトレーニングステップで競争性能を達成できることが示された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:12:04 GMT)
Bandwidth Selectors on Semiparametric Bayesian Networks [3.7] 半パラメトリックベイズネットワーク(SPBN)は、パラメトリックおよび非パラメトリック確率モデルを統合する。
特に、非パラメトリック成分にはカーネル密度推定器(KDE)が使用される。
本稿では、まず、最先端の帯域幅セレクタの応用に関する理論的枠組みを確立する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:48:05 GMT)
A Synthetic Benchmark for Collaborative 3D Semantic Occupancy Prediction in V2X Autonomous Driving [3.7] 3Dセマンティック占有予測は、自律運転における新たな知覚パラダイムである。
既存の協調認識データセットをCARLAで高分解能なセマンティックボクセルセンサで再生することで拡張する。
本研究では,空間アライメントとアテンションアグリゲーションによるエージェント間特徴融合を行うベースラインモデルを開発した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:58:10 GMT)
Modeling and Visualization Reasoning for Stakeholders in Education and Industry Integration Systems: Research on Structured Synthetic Dialogue Data Generation Based on NIST Standards [3.6] 本研究では,教育産業統合(EII)システムにおける利害関係者の相互作用の構造的複雑さと意味的あいまいさに対処する。
我々は,NIST(National Institute of Standards and Technology)合成データ品質フレームワークに基づく構造モデリングパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:37:43 GMT)
When Can Model-Free Reinforcement Learning be Enough for Thinking? [3.5] 本稿では、モデルフリーRLが報酬戦略として「思考」に導く時期について、ドメインに依存しない理解を構築する。
我々は、思考行動は、行動を続ける前に政策改善のステップを実行することを選択したエージェントに匹敵するものであることを正式に示す。
そして、我々の理論がモデルフリーなRLが思考ライクな振る舞いを生み出すために必要な条件を満たすことを、オープンソースLLMが示している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:23:46 GMT)
Routing thermal noise flow and ground-state cooling in an optomechanical plaquette [3.4] プラケット内の熱ノイズ流をルーティングすることで、2つの非退化機械共振器を冷却する有効な方法を提案する。
最適機械冷却は, たとえ基底状態であっても, この状態でも実現可能である。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:55:11 GMT)
Improving Surgical Risk Prediction Through Integrating Automated Body Composition Analysis: a Retrospective Trial on Colectomy Surgery [3.4] 大腸全摘術後1年で死亡率の予測が得られた。
術後合併症,非計画的寛解,輸血,重症感染症が続発した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:07:27 GMT)
A Grassroots Network and Community Roadmap for Interconnected Autonomous Science Laboratories for Accelerated Discovery [3.4] 自律型相互接続型科学実験室(AISLE)について紹介する。
AISLEは、フラグメント化された機能を統一システムに変換する草の根ネットワークである。
協調的な自律科学へのこのパラダイムシフトは、持続可能なエネルギー、材料開発、公衆衛生のブレークスルーを約束する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:20:28 GMT)
Demographics-Informed Neural Network for Multi-Modal Spatiotemporal forecasting of Urban Growth and Travel Patterns Using Satellite Imagery [3.4] 本研究は,都市空間の変容を予測するために設計された,新しい階層情報深層学習フレームワークを提案する。
提案モデルは,衛星画像と人口統計データを統合した,時間的にゲートされた残差接続を備えたエンコーダ・デコーダアーキテクチャを用いている。
この研究は、衛星画像シーケンスと、それに対応する人口動態と旅行行動特性を組み合わせた総合的なマルチモーダルデータセットにも貢献する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 01:43:44 GMT)
A Novel Approach to Differential Privacy with Alpha Divergence [3.3] アルファ・イテレーション・ディファレンシャル・プライバシ(ADP)は,アルファ・ディバイジェンスを基盤とした革新的なプライバシ・フレームワークである。
本研究は、ADPの理論的基盤を概説し、その性能を競合するプライバシーフレームワークと対比する。
提案手法は, プライバシー保護法を著しく改善し, 現代のデータ解析問題に対する柔軟な解決策を提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:10:18 GMT)
Adaptive Guidance Accelerates Reinforcement Learning of Reasoning Models [3.2] 検証可能な報酬(RLVR)に基づく強化学習で学習した推論モデルを用いて,新たな問題を解決する方法について検討する。
RLVRは、(1)pass@$k$をpass@1に圧縮し、(2)"capability gain"を介して、モデルが以前、$k$で解決できなかった新しい問題を解決することを学習する、という2つの主な方法でパフォーマンスを駆動する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 00:51:15 GMT)
Towards Effective Complementary Security Analysis using Large Language Models [3.2] セキュリティ分析における重要な課題は、静的アプリケーションセキュリティテスト(SAST)ツールによって生成される潜在的なセキュリティの弱点を手動で評価することである。
本研究では,SAST 結果の評価を改善するために,Large Language Models (LLMs) を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:46:35 GMT)
Domain Specific Benchmarks for Evaluating Multimodal Large Language Models [3.2] 大きな言語モデル(LLM)は、高度な推論と問題解決能力のために、規律を越えてデプロイされることが増えている。
本稿では,LLMを広く活用する領域や応用領域を網羅した,7つの重要な分野の分類について紹介する。
我々はこれらのベンチマークをドメイン単位でコンパイルし、分類し、研究者のためのアクセス可能なリソースを作成します。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:52:06 GMT)
Asymptotic TCL4 Generator for the Spin-Boson Model: Analytical Derivation and Benchmarking [3.1] この研究は、一般的なスピンボソンモデルに対する完全な4階時間畳み込み(TCL)ジェネレータの導出を示す。
半導体二重量子ドット系の場合, 物理的に重要な力学の補正を行う。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:06:19 GMT)
CLEAR-3K: Assessing Causal Explanatory Capabilities in Language Models [3.1] CLEAR-3Kは、ある文が別の文を因果的に説明するかどうかを言語モデルが判断できるかどうかを評価するために設計された、3000のアサーション推論質問のデータセットである。
各質問は、意味的関連性と真の因果的説明的関係を区別するために、アサーションとアサーションのペアと挑戦言語モデルを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:35:36 GMT)
Can LLMs Hack Enterprise Networks? Autonomous Assumed Breach Penetration-Testing Active Directory Networks [3.1] 本稿では,Large Language Model (LLM) 駆動の自律システムを用いて,現実のMicrosoft Active Directory (AD) エンタープライズネットワークにおける課題に対処することの実現可能性と有効性について検討する。
当社のプロトタイプであるcochiseは,Microsoft ADテストベッド(GOAD)内でアカウントを共用可能な,完全に自律的なLLM駆動フレームワークの最初のデモである。
主要な発見は、攻撃戦略を動的に適用し、コンテキスト間攻撃を実行し、シナリオ固有の攻撃パラメータを生成する能力を強調している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:02:54 GMT)
Privacy-Preserving Chest X-ray Classification in Latent Space with Homomorphically Encrypted Neural Inference [3.0] 医用画像データは、強力なプライバシー保護を必要とするセンシティブな患者情報を含んでいる。
ホモモルフィック暗号化(HE)は、元の情報を公開せずに暗号化されたデータの計算を可能にするソリューションを提供する。
本稿では,VQGANを用いて画像の潜在表現への圧縮を行う医用画像の推論フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:57:49 GMT)
Interplay among entanglement, measurement incompatibility, and nonlocality [2.9] 非局所性はベルの不等式に違反して現れるもので、合同量子系内の絡み合いを示す。
一般化されたクレーター・ホーネ・シモニー・ホルト型ベル不等式の族を用いた絡み合いの定量化を行う。
我々は,ベルの不等式を最適化することにより,非局所統計学の活用が可能であることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:54:39 GMT)
Using Language and Road Manuals to Inform Map Reconstruction for Autonomous Driving [2.9] レーントポロジー予測は安全で信頼性の高い自律航法の重要な構成要素である。
この情報は、道路構造を反映した設計コードや、道路機能を捉えた道路名などを通じて、自然言語で符号化された規則に従うことが多い。
我々はこの情報を,地図に基づくオンラインレーントポロジー予測モデルであるSMERFに軽量に拡張する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 00:26:10 GMT)
SD++: Enhancing Standard Definition Maps by Incorporating Road Knowledge using LLMs [2.9] 高精細地図(HD map)は、車線中心線と道路要素を捉える詳細な情報地図である。
SD++は、道路マニュアルから得られる位置依存の道路情報でSDマップを強化するエンドツーエンドパイプラインである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 00:43:05 GMT)
From Data to Knowledge: Evaluating How Efficiently Language Models Learn Facts [2.9] 本研究では、異なるアーキテクチャとサイズの複数のモデルを分析し、すべて同じ事前学習データに基づいて訓練する。
トレーニングコーパス内の事象をその周波数でアノテートすることにより、モデルの性能が事実周波数とどのように異なるかを検討する。
以上の結果から,ほとんどのモデルが高周波の事実に類似しているが,低周波の事実に顕著に異なることが示唆された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:10:24 GMT)
The logical structure of contextuality and nonclassicality [2.8] 文脈性が量子力学の非古典的側面を完全に明らかにするかどうかは不明である。
古典的および量子的実験を比較するために,論理代数に基づく数学的枠組みを提案する。
簡易な測定構成で量子テクスチュアリティを目撃できることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:30:59 GMT)
Bayesian Joint Model of Multi-Sensor and Failure Event Data for Multi-Mode Failure Prediction [2.8] 現代の産業システムには複数の障害モードがあり、その状態は複数のセンサーで監視されている。
システムの残りの有用な寿命(RUL)を正確に予測するには、マルチセンサーの時系列データを効果的に活用する必要がある。
本稿では,マルチセンサの時系列データと複数障害モードに関する障害時間とを協調的にモデル化するための統一的なアプローチを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:44:15 GMT)
Parton Distributions on a Quantum Computer [2.8] 実量子デバイスを用いてパートン分布関数(PDF)の最初の量子計算を行う。
この計算は、5つの空間的位置と1つの補助量子ビットにおいて、スタガーされたフェルミオンに10の量子ビットを使用する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:34:27 GMT)
Cash or Comfort? How LLMs Value Your Inconvenience [2.7] 大規模言語モデル(LLM)は、人間に代わって日常的な決定を行うことができるほぼ自律的な人工知能(AI)エージェントとして、ますます提案されている。
以前の研究では、人間の決定と合理性と道徳的整合性を評価してきた。
我々は、複数のLCMが割り当てる価格を、一連のユーザ不愉快さに定量化する。
現状のLCMを意思決定アシスタントとして活用する可能性に疑問を呈する重要な懸念がいくつか浮かび上がっている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:49:20 GMT)
Identifiability of Deep Polynomial Neural Networks [2.7] 多項式ニューラルネットワーク (Polynomial Neural Networks, PNN) は代数的および幾何学的構造を持つ。
彼らの識別可能性 -- 解釈可能性を保証するための重要な特性 -- は、いまだに理解されていない。
本稿では,深部PNNの識別可能性に関する包括的分析を行う。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:58:46 GMT)
Revolutionizing Validation and Verification: Explainable Testing Methodologies for Intelligent Automotive Decision-Making Systems [2.7] 本稿では,検証・検証プロセスに説明可能性,透明性,解釈可能性を統合する手法を提案する。
本稿では,文献レビューとステークホルダ入力によるV&V要件の精査,大規模言語モデル(LLM)による説明可能なテストシナリオの生成,シミュレーション環境におけるリアルタイム検証の実現を提案する。
私たちのゴールは、V&Vの合理化、リソースの削減、自動運転技術へのユーザの信頼の構築です。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:55:56 GMT)
Disentangling and Integrating Relational and Sensory Information in Transformer Architectures [2.5] 我々は、個々の物体の性質に関する感覚情報と、物体間の関係に関する関係情報とを区別する。
本稿では,感性情報の流れを指示する感覚的注意機構と,関係情報の流れを指示する新たな関係的注意機構とを特徴とするトランスフォーマーフレームワークのアーキテクチャ拡張を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:02:46 GMT)
DSA-NRP: No-Reflow Prediction from Angiographic Perfusion Dynamics in Stroke EVT [2.5] 持続的微小血管低灌流によって定義される非逆流は、組織回復を損なうとともに臨床結果の悪化を引き起こす。
標準的な臨床実践は、パルス後24時間以内に灌流磁気共鳴画像(MRI)に頼り、介入を遅らせる。
本稿では,血管内血栓摘出直後の血流の予測を行う機械学習フレームワークについて紹介する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 22:40:51 GMT)
QISCIT: A validated concept inventory assessment for quantum information science [2.5] 量子情報科学(QIS)は、高度に教育された労働力を必要とする重要な学際分野である。
本稿では,QISCIT(Quantum Information Science Concept Introductory Test)と呼ばれる新しい評価尺度の体系的開発と内容検証について述べる。
11人のQIS専門家からのフィードバックを得て、量子状態、量子計測、量子ビット、絡み合い、コヒーレンスとデコヒーレンス、量子ゲートとコンピューティング、量子通信といった概念をカバーするQISCITの31itemバージョンを開発し、検証した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:21:27 GMT)
A geometric framework for momentum-based optimizers for low-rank training [2.4] 低ランクの事前学習と微調整が、大規模ニューラルネットワークの計算コストと記憶コストを削減できる有望な技術として登場した。
古典的運動量法は、基礎となる最適化景観の幾何学のため、局所最適に収束するのに苦労することを示す。
動的低ランク近似から導かれる新しいトレーニング戦略を導入し,その基礎となる幾何学的構造を明示的に説明する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:46:01 GMT)
Variational Learning of Disentangled Representations [2.4] 遠方表現は、実験条件間で共有される変動の要因を条件固有である要因と区別することを可能にする。
DISCoVeRは条件不変因子と条件固有因子を明確に分離する新しい変分フレームワークである。
DISCoVeRは, 合成データセット, 自然画像, 単一セルRNA-seqデータにおいて, 歪みを改善できることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:36:12 GMT)
Optimizing Sensory Neurons: Nonlinear Attention Mechanisms for Accelerated Convergence in Permutation-Invariant Neural Networks for Reinforcement Learning [2.2] 我々は、置換不変の知覚処理を備えたニューラルアーキテクチャを導入した以前の作業に基づいて構築した。
鍵ベクトルに非線形変換を適用する改良されたアテンション機構を提案する。
本モデルは,ベースラインと同等の性能を維持しつつ,はるかに高速な収束とトレーニング効率の向上を実現している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:58:34 GMT)
Optimal Depth of Neural Networks [2.2] 本稿では,ニューラルネットワークの最適深さの決定に対処する公式な理論的枠組みを提案する。
我々は、シーケンシャルな決定プロセスとして、隠蔽表現の層間進化をモデル化する。
本稿では,ネットワークが効率よく早期終了可能な表現を学習することを奨励する,新規で実用的な正規化用語である$mathcalL_rm depth$を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:26:01 GMT)
Proportional Sensitivity in Generative Adversarial Network (GAN)-Augmented Brain Tumor Classification Using Convolutional Neural Network [2.2] Generative Adversarial Networks (GAN)は、限られた医療画像データセットを拡張する可能性を示している。
本研究では,GAN生成画像と実際の脳腫瘍MRI画像の異なる比率が,健康スキャンと腫瘍スキャンの分類においてCNNのパフォーマンスに与える影響について検討した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:12:03 GMT)
Soft decision trees for survival analysis [2.2] 本稿では,各分岐ノードにソフトスプリッティングルールを付加した新しい生存木モデル(SST)を提案する。
SSTとトレーニング定式化は、柔軟性と解釈可能性を組み合わせたものである。
SSTは4つの広く使用されている差別と校正の指標で3つのベンチマークサバイバルツリーを上回っている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:51:33 GMT)
Radiation-Induced Fault Detection in Superconducting Quantum Devices [2.1] 宇宙線誘起相関誤差は超伝導量子コンピュータに影響を与える最も有害な事象である。
超伝導量子デバイスにおける放射事象を効率的に検出するために,シンドローム情報を効果的に活用する最初のアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:39:16 GMT)
Self-supervised Feature Extraction for Enhanced Ball Detection on Soccer Robots [2.1] 球検出性能を向上させるために,ドメイン適応型特徴抽出のための自己教師型学習フレームワークを提案する。
提案手法は,汎用事前学習モデルを用いて擬似ラベルを生成する。
実験の結果,提案したパイプラインは精度,F1スコア,IoUでベースラインモデルより優れ,コンバージェンスも高速であることがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:21:34 GMT)
Non-degenerate Ground State of the Spin-Boson Model under Abelian Diagonalization [2.1] スピンボソンモデルの基底状態エネルギーは、縮退可能な最小の系よりも低く、一定のパリティを有することを証明した。
この式は量子モンテカルロ (QMC) 法と対数離散化数値再正規化群 (NRG) 法で得られた位相図を再現する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:37:13 GMT)
Stable Learning Using Spiking Neural Networks Equipped With Affine Encoders and Decoders [2.0] スパイクニューラルネットワークに関連する学習問題について検討する。
我々は、正のシナプス重みしか持たない単純なスパイキングニューロンからなるスパイキングニューラルネットワークに焦点を当てた。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:27:12 GMT)
A Smart Contract-based Non-Transferable Signature Verification System using Nominative Signatures [2.0] 本稿では,有意な署名を用いたスマートコントラクトに基づく非参照型署名検証システムを提案する。
本システムでは,誰が署名を検証できるかを示すだけでなく,実際に送金が行われるかどうかを検証できる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 22:54:13 GMT)
Accountability of Robust and Reliable AI-Enabled Systems: A Preliminary Study and Roadmap [1.9] 本稿では,AI対応システムの堅牢性と信頼性を評価するための最初の研究について述べる。
この研究は、これらの概念の定義を進化させ、現在の文献をレビューすることによって、この分野における大きな課題とアプローチを浮き彫りにしている。
説明責任の法人化は、信頼の構築と責任あるAI開発を保証するために不可欠である。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:35:11 GMT)
From Lab to Factory: Pitfalls and Guidelines for Self-/Unsupervised Defect Detection on Low-Quality Industrial Images [1.8] 機械学習は手動処理に取って代わる可能性がある。
ほとんどのメソッドは、低いデータ品質をうまく処理したり、好ましくないが典型的な現実世界の設定において、ロバストさを排除したりしない。
生産データの品質問題を特定し改善するための2種類の最先端モデルを評価する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:28:00 GMT)
Disentangle and Regularize: Sign Language Production with Articulator-Based Disentanglement and Channel-Aware Regularization [1.8] 我々は,手話のポーズをコンパクトな潜在空間にエンコードするポーズオートエンコーダを,調音器によるアンタングルメント戦略を用いて訓練する。
次に、非自己回帰変換器デコーダをトレーニングし、文レベルのテキスト埋め込みからこれらの潜在表現を予測する。
提案手法は光沢の監視や事前訓練に頼らず,PHOENIX14TおよびCSL-DailyPHOENIXデータセットの最先端結果を実現する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 21:17:30 GMT)
Beyond Blur: A Fluid Perspective on Generative Diffusion Models [1.8] 本稿では, 対流拡散過程に基づく生成画像合成のための新しいPDE駆動の汚職過程を提案する。
この研究は、流体力学、次元のないPDE理論、深層生成モデリングを橋渡しし、物理的に情報を得た画像の破損過程について新たな視点を提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:31:30 GMT)
Sixth-order time-convolutionless master equation and beyond: Late-time resummations, two types of divergences, and the limits of validity [1.8] 時間畳み込みなし(TCL)マスター方程式を2nに拡張して解析する。
我々はヴァン・カンペンサントが早期の世俗的成長を抑える一方で、最終的には長い時間で分岐することを示した。
指数関数的に減衰する相関について、この手法は臨界結合閾値以下で適切なマルコフ極限を回復する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:49:39 GMT)
Breaking the Transcription Bottleneck: Fine-tuning ASR Models for Extremely Low-Resource Fieldwork Languages [1.8] MMS と XLS-R の2つの細調整された多言語 ASR モデルの性能を,5つの型式的に多様な低リソース言語でベンチマークした。
XLS-Rはトレーニングデータが1時間を超えるとパリティ性能を示すのに対し,MMSは極端に少ないトレーニングデータが得られる場合に最適であることがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:59:49 GMT)
Efficient Feedback Gate Network for Hyperspectral Image Super-Resolution [1.7] 単一超スペクトル画像超解像法(SHSR)は、超スペクトル画像の空間分解能を改善するために設計することができる。
本稿では,効率的なフィードバックゲートネットワークと呼ばれるグループベースのSHSR手法を提案する。
3つのハイパースペクトルデータセットの実験結果から,提案したネットワークの優れた性能が示された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:06:48 GMT)
The learned range test method for the inverse inclusion problem [1.7] レンジテストに基づく再構成アルゴリズムは,特定のアーキテクチャを持つニューラルネットワークとして記述可能であることを示す。
我々は,教師あり学習の枠組みにおいて,このネットワークの重みを学習することを提案する。
数値シミュレーションにより、この学習範囲試験法は、多角形包有物の正確かつ安定した再構成を提供することを示した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:35:41 GMT)
Mask-PINNs: Regulating Feature Distributions in Physics-Informed Neural Networks [1.7] Mask-PINNは、内部の特徴分布を、隠された層にわたってポイントワイズで適用されたスムーズで学習可能なマスク機能を通じて制御する。
予測精度,収束安定性,ロバスト性に一貫した改善を示し,ベースラインモデルよりもL2誤差を最大2桁まで低減した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:08:04 GMT)
PreQRAG -- Classify and Rewrite for Enhanced RAG [1.7] 検索および生成品質を改善するために設計された検索拡張型アーキテクチャであるPreQRAGを紹介する。
PreQRAGには、まず各入力質問を単一ドキュメントタイプまたは複数ドキュメントタイプに分類するパイプラインが組み込まれている。
単文書質問に対して,検索精度と生成関連性を改善するために質問書き直し手法を用いる。
複数文書の質問に対して、より効果的に処理できる集中サブクェリに複雑なクエリを分解する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 22:02:05 GMT)
Principles of semantic and functional efficiency in grammatical patterning [1.6] 文法的組織は知覚的属性から確実に受け継がれることを示す。
多様な言語サンプルの測定から,文法が機能目標を優先していることが分かる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:49:39 GMT)
Modeling the Human Visual System: Comparative Insights from Response-Optimized and Task-Optimized Vision Models, Language Models, and different Readout Mechanisms [1.5] 視覚入力を用いた応答最適化モデルでは,早期・中期の視覚領域において,より優れた予測精度が得られることを示す。
言語的記述では捉えられない入力の知覚的特徴に敏感な視覚野の3つの異なる領域を同定する。
本稿では,意味的内容に基づいて受容場や特徴マップを変調し,既存のSOTAよりも3~23%精度が向上する手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:17:21 GMT)
Can Large Language Models Replace Human Subjects? A Large-Scale Replication of Scenario-Based Experiments in Psychology and Management [1.5] 大規模言語モデル(LLM)は、心理学実験において人間のような反応を複製する可能性を示している。
我々は,3つの最先端LCMを用いて,トップ社会科学誌から156の心理学実験を再現した大規模研究を行った。
LLMは人間の研究よりも大きく、フィッシャーZの値は人間の研究の約2~3倍である。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:13:17 GMT)
Open Sky, Open Threats: Replay Attacks in Space Launch and Re-entry Phases [1.5] 本研究では,宇宙船通信の重要な段階におけるアップリンク通信とダウンリンク通信の整合性に及ぼすリプレイ攻撃の影響について検討する。
リプレイ攻撃では、攻撃者の信号は正常な送信を超過し、再突入時に最大7.8dB、発射時に最大6.5dBのSNR(Signal to Noise Ratio)差が生じる。
本稿では、位相コヒーレンシに依存した決定指向等化器と、位相同期ループ(PLL)帯域幅を狭めることで、よりセキュアな受信機設計を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:27:16 GMT)
LLM-Generated Feedback Supports Learning If Learners Choose to Use It [1.5] 大規模な言語モデル(LLM)は、フィードバックを生成するためにますます使われていますが、学習への影響は未調査です。
本研究では,オンデマンドLLM説明フィードバックが7つのシナリオベース授業における学習にどのように影響するかを検討する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:59:14 GMT)
POV Learning: Individual Alignment of Multimodal Models using Human Perception [1.5] 個人レベルでのアライメントは、システムと対話する個人ユーザの主観的な予測性能を高めることができると我々は主張する。
我々は、認識情報を機械学習システムに統合し、予測性能を測定することで、これを検証する。
本研究は, 個人認識信号を用いた主観的人間評価の機械学習が, 個人のアライメントに有用な手がかりとなることを示唆している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:13:31 GMT)
Formal Control for Uncertain Systems via Contract-Based Probabilistic Surrogates (Extended Version) [1.5] 我々は,複雑な非線形エージェント環境相互作用に対処しながら,高次元に効果的にスケールする抽象的手法を提案する。
我々のアプローチは、複雑な高次元の車両交差点で示されるように、保守主義のスケーラビリティを好意的に交換する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:00:50 GMT)
Zero-Knowledge Proof-of-Location Protocols for Vehicle Subsidies and Taxation Compliance [1.4] 本稿では,Zero-Knowledge Proofs (ZKPs) を用いて,車両税や電気自動車(EV)助成金に対する位置情報ポリシーの遵守を検証するための新しいプライバシ保護機構を提案する。
本稿では,ZK-PoL(Zero-Knowledge Proof-of-Location)システムの設計と評価について述べる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:00:32 GMT)
Identifying Explanation Needs: Towards a Catalog of User-based Indicators [1.4] ユーザ行動やシステムイベントに関するユーザベースの指標を,実行時に取得して,説明の必要なタイミングを決定することを目的としている。
ユーザ行動に関する17の指標,システムイベントに関する8の指標,感情状態や身体反応に関する14の指標を含むカタログをまとめた。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:49:43 GMT)
Generalized Code Distance through Rotated Logical States in Quantum Error Correction [1.3] 我々は、回転演算子を安定化子状態に適用し、論理基底を拡張し、安定化子発生器を変更することにより回転論理状態を構築する。
回路レベルの雑音下での論理誤差率のスケーリング挙動を定量化する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:10:58 GMT)
Convergent Linear Representations of Emergent Misalignment [1.3] 微調整された大きな言語モデルは、広範に不整合な振る舞いを発達させる可能性がある。
9個のランク1アダプターでQwen2.5-14B-インストラクタを異常に除去するミニマルモデル生物について検討した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:23:55 GMT)
Watermarking Language Models through Language Models [1.2] 入力レベルで完全に動作するプロンプト誘導型透かしフレームワークを導入し、モデルパラメータへのアクセスやロジットの復号は不要である。
GPT-4o, Mistral, LLaMA3, DeepSeek など 25 種類の LM と Prompting の組み合わせについて検討した。
実験の結果, 透かし信号はアーキテクチャ全体にわたって一般化し, 微調整, モデル蒸留, 即時攻撃下では頑健であることがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:24:13 GMT)
AQUA20: A Benchmark Dataset for Underwater Species Classification under Challenging Conditions [1.2] 本稿では,20種の海面画像8,171点からなる総合的なベンチマークデータセットであるAqua20を紹介する。
13種類の最先端ディープラーニングモデルを評価し, 課題条件下での海洋生物分類における性能評価を行った。
結果、ConvNeXtは98.82%、Top-1は90.69%、F1スコアは88.92%、パラメータサイズは適度に大きい。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:54:35 GMT)
SIDE: Semantic ID Embedding for effective learning from sequences [1.2] シーケンスベースのレコメンデーションシステムは、産業用アドレコメンデーションシステムの最先端を推し進めている。
本稿では,ベクトル量子化(VQ)を利用して,コンパクトなセマンティックID(SID)をレコメンデーションモデルに注入する手法を提案する。
大規模産業広告推薦システムに適用した場合, 正規化エントロピー(NE)ゲインの2.4倍改善とデータフットプリントの3倍削減を実現する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:40:38 GMT)
Quantum Advantage in Learning Quantum Dynamics via Fourier coefficient extraction [1.2] 未知のハミルトン力学を学習する際の教師付き学習バージョンに取り組む。
本研究では,この課題が自然条件下での共通複雑性仮定の下で証明可能な指数的古典量子学習の優位性が得られることを証明した。
証明可能な保証を維持しつつ、任意の量子力学にメソッドを一般化する際の限界について議論する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:51:27 GMT)
UT-GraphCast Hindcast Dataset: A Global AI Forecast Archive from UT Austin for Weather and Climate Applications [1.2] このデータセットは、45年間、約25kmのグローバルグリッド上で、毎日15日間の決定論的予測を00UTCで提供する。
37の垂直レベルにおいて、12以上の重要な大気および表面の変数を予測し、現代のハードウェアで1分以内で完全な中距離の予測を提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:42:36 GMT)
Interpretable Low-Dimensional Modeling of Spatiotemporal Agent States for Decision Making in Football Tactics [0.9] ルールベースのモデルは専門家の知識と一致するが、すべての選手の状態を十分に考慮していない。
提案手法は,ボールホルダ電位受信機の両方に対する解釈可能な状態変数を定義する。
解析の結果,選手とボールの間の距離と選手の空間スコアが,パスを成功させる上で重要な要因であることが判明した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:37:52 GMT)
Elevating Styled Mahjong Agents with Learning from Demonstration [0.9] ゲーム内のさまざまなボットがゲームプレイ体験を豊かにし、リプレイ可能性を高める。
ゲーム人工知能の最近の進歩は、主にボットの能力向上に焦点が当てられている。
提案アルゴリズムは, 近似ポリシ最適化アルゴリズムの最小限の修正しか必要としない。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:46:06 GMT)
Experimental demonstration of enhanced quantum tomography via quantum reservoir processing [0.9] ボーソニック回路の量子力学プラットフォーム上での連続可変状態再構成のための量子貯水池処理手法を実験的に実証した。
この方法で学習した地図は、いくつかのテスト状態に対して高い再現性を実現し、システムの理想化されたモデルに基づいて計算された地図よりも大幅に向上した性能を提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:06:24 GMT)
RCNet: $ΔΣ$ IADCs as Recurrent AutoEncoders [0.8] リカレントニューラルネットワーク(RNN)では、変調器とフィルタの両方を記述することができる。
ハードウェア設計の制約を定義するために、ハイエンドIADCとフルカストムの損失が組み合わされる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:55:01 GMT)
OmniReflect: Discovering Transferable Constitutions for LLM agents via Neuro-Symbolic Reflections [0.8] 我々は,複雑なタスクにおけるLarge Language Model (LLM)エージェントのパフォーマンスを改善するためのリフレクション駆動フレームワークであるOmniReflectを紹介する。
我々はNeural、Reflex、NeuroSymbolicの手法を採用し、文脈適応性と計算効率のバランスを提供する。
実験結果の平均は、ALFWorldで+10.3%、BabyAIで+23.8%、PDDLで+8.3%という、タスクの成功の大きな改善を示している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:38:21 GMT)
A Neural Operator based Hybrid Microscale Model for Multiscale Simulation of Rate-Dependent Materials [0.8] 我々は、マイクロスケール物理を予測するために神経演算子を使用し、データ駆動と物理に基づくアプローチを組み合わせたハイブリッドモデルを生み出した。
粘弾性状態を含む時間依存固体力学問題に対して, この手法を適用した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:25:26 GMT)
Thirty-six officers, artisanally entangled [0.8] ヒルベルト空間 $(mathbbC6)otimes 2$ of two quhexes を直和 $(mathbbC3)otimes 3$ に分解する。
この種の任意の解が、無限族を構成する二つの単位複素アダマール行列をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:07:05 GMT)
Off-Policy Actor-Critic for Adversarial Observation Robustness: Virtual Alternative Training via Symmetric Policy Evaluation [0.8] 逆入力観測を扱うための強化学習法が注目されている。
本研究では,新たな環境相互作用の不要な非政治手法を提案する。
提案手法は, エージェントと敵の政策評価の対称性によって理論的に支持される。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 05:13:10 GMT)
Magnetic Hysteresis Experiments Performed on Quantum Annealers [0.7] 横磁場イジングモデルにおける磁気トンネル実験のための一般的なプロトコルを提案する。
我々は、ループ内の堅牢なメモリ保持を観察し、非平衡の創発的磁気現象を観測するためのプラットフォームとして量子アニールを確立する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:28:16 GMT)
AI-based Approach in Early Warning Systems: Focus on Emergency Communication Ecosystem and Citizen Participation in Nordic Countries [0.7] この章は、準備、緊急対応、そして犯罪後のフェーズを区別する全体論的なアプローチを提唱している。
早期警戒システム(EWS)やリスクモデリング、緩和対策の役割が特に強調されている。
北欧諸国の事例研究が注目されている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:32:16 GMT)
Nonlinear Squeezing of Superpositions of Quadrature Eigenstates [0.7] 二次固有状態(SQE)の重ね合わせの対称性を利用した作用素の族を導入する。
非線形スクイージングが非ガウス性の証人およびSQE近似の指標としてどのように機能するかを実証する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:07:53 GMT)
Efficient Magic State Distillation by Zero-Level Distillation [0.7] 物理レベルでの高忠実度論理魔法状態を作成するゼロレベル蒸留を提案する。
本研究は, 従来の論理レベルの蒸留技術よりも, 蒸留を効率よく行うことができることを示す。
論理マジック状態の誤差率は、物理誤差率$p$から約100倍p2$までスケールする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:52:24 GMT)
An Elementary Characterization of Bargmann Invariants [0.7] 我々は、$n$-次不変量を取ることができる複素値の集合 $B_n$ の完全な特徴づけを与える。
どちらの範囲も複素単位 $n$-gon の$n$-次乗に等しいことを示し、従って凸である。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:33:41 GMT)
A Structured Dataset of Disease-Symptom Associations to Improve Diagnostic Accuracy [0.6] 疾患症状データセットは、医学研究、疾患診断、臨床意思決定、AIによる健康管理の応用に重要かつ需要がある。
本研究は, 各種オンライン資料, 医療文献, 公衆衛生データベースから, 疾患症状の関係を体系的にコンパイルする。
このデータは、ピアレビューされた医療論文、臨床ケーススタディ、および疾患症状関連報告を分析して収集された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:41:23 GMT)
Client Selection Strategies for Federated Semantic Communications in Heterogeneous IoT Networks [0.4] IoTデバイスの指数的成長は、帯域幅制限の無線ネットワークにおいて重要な課題となる。
本稿では,画像再構成のための帯域効率の良いモデルの協調学習を可能にする,新しい意味コミュニケーションフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:11:20 GMT)
Software Fairness Testing in Practice [0.2] 本研究では、ソフトウェアプロフェッショナルがAIとMLプロジェクトに取り組む22人の実践者とのインタビューを通じて、公正のためにAIを活用したシステムをテストする方法について検討する。
以上の結果から,理論的公正の概念と産業実践との間に大きなギャップがあることが示唆された。
主な課題は、データ品質と多様性、時間制約、効果的なメトリクスの定義、モデルの相互運用性の確保である。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:03:02 GMT)
With Limited Data for Multimodal Alignment, Let the STRUCTURE Guide You [0.2] マルチモーダルモデルは、アライメントを必要とする複雑なタスクにおいて強力な機能を示した。
既存のモデルは、通常、多くのドメインで得るのに費用がかかるか不可能な、ペア化されたサンプルに依存している。
そこで本研究では,単調エンコーダの潜伏空間を保存する効果的な正規化手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:32:54 GMT)
MSCA-Net:Multi-Scale Context Aggregation Network for Infrared Small Target Detection [0.2] 本稿では,3つのキーコンポーネントを統合したMSCA-Netというネットワークアーキテクチャを提案する。
MSEDAは、異なるスケールにわたる情報を適応的に集約するために、マルチスケールのフュージョンアテンション機構を使用している。
PCBAMは相関行列に基づく戦略によりグローバル特徴と局所特徴の相関を捉える。
CABは、それらに重みを割り当て、低レベル情報と高レベル情報を統合することで、重要な特徴の表現を強化する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:42:24 GMT)
FedNAMs: Performing Interpretability Analysis in Federated Learning Context [0.2] 連合学習フレームワークにニューラル付加モデル(NAM)を用いる新しいアプローチを導入する。
FedNAMは詳細で特徴に特化した学習を維持しており、金融や医療などの分野において特に有用である。
本研究は,OpenFetch ML Wine, UCI Heart Disease, Irisなどのデータセットを用いて,さまざまなテキストおよび画像分類タスクについて検討し,FedNAMが精度の低下を最小限に抑えられることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:14:13 GMT)
Global Microprocessor Correctness in the Presence of Transient Execution [0.2] 我々は、洗練の理論を用いて、正式な仕様の使用を提唱する。
我々は、MeltdownやSpectreなど、一時的な実行攻撃に対処するために使用できる正当性の概念を紹介します。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:56:14 GMT)
Scalable Unit Harmonization in Medical Informatics via Bayesian-Optimized Retrieval and Transformer-Based Re-ranking [0.1] 我々は,大規模臨床データセットにおける一貫性のない単位を調和させるスケーラブルな手法を開発した。
フィルタリング、識別、調和提案生成、自動再ランク付け、手動検証といったマルチステージパイプラインを実装している。
このシステムはランク1で83.39%の精度、ランク5で94.66%のリコールを達成した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:38:08 GMT)
Improving the lifetime of aluminum-based superconducting qubits through atomic layer etching and deposition [0.1] シリコン上のアルミニウム薄膜からなる超伝導量子デバイスにおいて,原子層エッチングと堆積(ALE, ALD)を組み合わせた乾燥表面処理を行い,誘電損失を軽減する。
アルミニウム系共振器と平面トランスモン量子ビットの2レベル吸収による損失の2倍の低減を計測した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:41:53 GMT)
ForestFormer3D: A Unified Framework for End-to-End Segmentation of Forest LiDAR 3D Point Clouds [0.1] ForestFormer3Dは、個々のツリーとセマンティックセグメンテーションを正確に記述するための、新しい統合およびエンドツーエンドのフレームワークである。
本モデルでは,新たに導入されたFOOR-instanceV2データセットを用いて,個々の木分割の最先端性能を実現する。
FOR-instanceV2データセットとForestFormer3Dコードは近くリリースされる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:39:27 GMT)
Abelian multi-cycle codes for single-shot error correction [0.0] 我々は、高次元量子ハイパーグラフ生成物(QHP)符号と局所的に等価な量子低密度パリティチェック符号群を構築する。
提案符号は低重量安定器発生器の冗長なセットを有しており、耐故障性のあるシステムにおける復号精度を向上させる。
提案した符号の次元を2つの重要な特殊ケースで簡易に表現し、距離を限定し、比較的短い符号を明示的に構成する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:05:32 GMT)
YASMOT: Yet another stereo image multi-object tracker [0.0] Yasmotは軽量でフレキシブルな物体追跡装置で 一般的な物体検出装置から出力を処理できる
オブジェクト検出器のアンサンブルからコンセンサス検出を生成する機能を含んでいる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:40:54 GMT)
What Is the Point of Equality in Machine Learning Fairness? Beyond Equality of Opportunity [0.0] 機械学習(ML)は急速に研究の領域になってきた。
しかし、そもそもなぜMLにおける不公平は道徳的に間違っているのか?
本稿では、分配的平等に対するこの排他的焦点は、不完全であり、潜在的に誤解を招く倫理的基盤を提供すると論じる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 06:57:53 GMT)
Weyl's Relations, Integrable Matrix Models and Quantum Computation [0.0] ハイゼンベルク可換関係は特定の$N-1$ 次元部分空間で満たされることを示す。
この設定はパラメータ依存の通勤行列の階層を$N$次元で構築するために使われる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:45:44 GMT)
Variational quantum algorithms with exact geodesic transport [0.0] 変分量子アルゴリズム(VQA)は、量子コンピュータの短期的応用に期待できる候補である。
本稿では,変分量子回路の解析的リーマン最適化を可能にする曲率対応フレームワークVQAを紹介する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:00:10 GMT)
Two dimensional sub-wavelength topological dark state lattices [0.0] 我々は、スカラー電位と同じ領域に局在した合成磁場の狭く強いパッチを伴って、サブ波長クロニグ・ペニーのような幾何スカラー電位を生成する方法を示す。
これらの急激なピーク磁束は、反対符号の滑らかな背景磁場によって補償され、単位セル当たりのネット磁束はゼロとなる。
数値解析により、理想的なチャーンバンドの存在と、非断熱効果と損失に対するトポロジカル位相の堅牢性が確認された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:03:52 GMT)
Tunable anyonic permeability across ${\mathbb{Z}_2}$ spin liquid junctions [0.0] ゼーマン場を介する電位障壁接合部を横断する異方性輸送の性質について検討する。
接合の最初のクラスでは、電荷は効果的な静的ポテンシャルとバンド質量の変化を感知する。
ジャンクションは電荷に対して完全に透明であるが、磁束伝達は臨界磁場強度の後にのみ許される。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:00:10 GMT)
TransDreamerV3: Implanting Transformer In DreamerV3 [0.0] 本稿では,変換器エンコーダを統合することで,DreamerV3アーキテクチャを向上する強化学習モデルであるTransDreamerV3を紹介する。
我々は,Atari-Boxing,Atari-Freeway,Atari-Pong,Crafterタスクについて実験を行い,TransDreamerV3はDreamerV3よりも優れた性能を示した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:09:17 GMT)
Towards an Experimental Device-Independent Verification of Indefinite Causal Order [0.0] 本稿では,不確定因果順序を検証するためのデバイス非依存プロトコルの最初の実装を提案する。
これは、不確定因果順序のデバイス非依存的な検証に向けた重要なステップである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:32:08 GMT)
Time Derivatives of Weak Values [0.0] 本稿では,弱値の時間微分から得られる物理特性について考察する。
弱値の左あるいは右時間微分もゲージ不変の弱値であることを保証するために、2つの条件が提示される。
システムの位置の1つの測定された弱い値は、2つの測定されていない弱い値に関する情報を提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:05:23 GMT)
Tighter Error Bounds for the qDRIFT Algorithm [0.0] 我々は、イェンセンの不等式と誤差の積分形式を慎重に扱うことにより、qDRIFT誤差を洗練する。
これによりスケーリングが向上し、一定のシミュレーション精度に到達するために必要なステップ数が大幅に削減される。
この改良の実践的な影響を実証するために、量子化学シミュレーション、散逸的逆場イジングモデル、量子機械学習のための古典データのハミルトン符号化の3つの設定に適用する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:49:58 GMT)
The physics, travels, and tribulations of Ronald Wilfrid Gurney [0.0] ガーニーは1920年代半ばにカヴェンディッシュ研究所であまり知られていない研究学生の1人であった。
彼は電気化学とイオン溶液の理論に量子力学を適用した最初の物理学者であった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:58:08 GMT)
The influence of nitrogen doping and annealing on the silicon vacancy in 4H-SiC [0.0] SiCベースのアプリケーションではドーピングが重要な役割を果たす。
炭素に置換された窒素は、1つの電子を非常に効率的にV_Si$に寄付する。
ODMRコントラストは低ドープSiCでは0.5%から窒素ドーピングでは1.5%に増加する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:49:33 GMT)
The Urban Model Platform: A Public Backbone for Modeling and Simulation in Urban Digital Twins [0.0] 我々は、オープンな都市モデルプラットフォームが、都市デジタル双生児のモデリングとシミュレーションのためのパブリックな技術バックボーンとして機能すると主張している。
このようなプラットフォームはオープン標準に基づいて構築され、モデルの分散統合を可能にし、都市システムを表現するためのマルチモデルアプローチをサポートする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:57:13 GMT)
The MORRIS Experiment: Magnetic Levitation as a New Probe of Non-Newtonian Gravity [0.0] 磁気浮上粒子を用いた, 湯川のような5番目の力による非ニュートン重力のテーブルトップ探索を提案する。
MORRISは、小さな重力のテストに新しい窓を開け、標準モデルを超えた物理を探索する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:00:00 GMT)
Techniques for supercharging academic writing with generative AI [0.0] このパースペクティブは、生成的人工知能(AI)を用いた学術著作の質と効率を高めるための原則と方法を示す。
我々は、書面におけるAIの関与の根拠(なぜ)、プロセス(方法)、そして自然(何)を明確にする人間とAIの協調フレームワークを紹介します。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 03:04:52 GMT)
TeXpert: A Multi-Level Benchmark for Evaluating LaTeX Code Generation by LLMs [0.0] LLM(Large Language Models)は、研究者が出版可能な資料を作成できる有望な機会を提供する。
我々のベンチマークデータセットは、科学文書の構成要素に焦点を当てたコードを生成するための自然言語のプロンプトである。
オープンおよびクローズドソース LLM に対する評価では,複数の重要な知見が浮き彫りにされている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:39:16 GMT)
Squeezing Towards the Heisenberg Limit with Locally Interacting Spins [0.0] 本稿では,位相感度のハイゼンベルク極限にアプローチする局所相互作用を用いたスピンスクイーズ手法を提案する。
我々のプロトコルは、乱れや密度の変動に対して堅牢であり、分子、リドバーグ原子、固体スピンによる短期的な実験で実装することができる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:02:58 GMT)
Space-time tradeoff for sparse quantum state preparation [0.0] 我々は、$n$-qubit $d$-spare量子状態が深さ$Oleft(fracnd log mm log m/n + log ndright)$$mgeq 6n$ ancillary qubitsの量子回路で作成できることを証明した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:52:05 GMT)
Solving a class of stochastic optimal control problems by physics-informed neural networks [0.0] 本研究の目的は,ハミルトン・ヤコビ・ベルマン方程式と物理インフォームドラーニングに基づく高次元制御問題の解法を開発することである。
本稿では,複数の出力を持つ分離ニューラルネットワークを用いて,フィードバック制御と値関数のパラメータ化を行う。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:18:30 GMT)
Six Fallacies in Substituting Large Language Models for Human Participants [0.0] 大規模言語モデル(LLM)のようなAIシステムは、行動研究や心理学研究における人間の参加者を置き換えることができるのだろうか?
ここでは「置き換え」の観点を批判的に評価し、その妥当性を損なう6つの解釈誤りを識別する。
それぞれの誤りは、LSMとは何か、人間の認知について何を教えてくれるのかについて、潜在的な誤解を表している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:50:33 GMT)
Single-shot thermometry of simulated Bose--Einstein condensates using artificial intelligence [0.0] 単一ショットから化学ポテンシャルと温度を迅速かつ非破壊的に推定するための人工知能アプローチを実証する。
我々の畳み込みニューラルネットワークは、ハーモニックトラップ構成における準2Dパンケーキの凝縮にのみ訓練されている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:36:15 GMT)
Simultaneous Translation with Offline Speech and LLM Models in CUNI Submission to IWSLT 2025 [0.0] 本稿では,チャールズ大学におけるIWSLT 2025の同時音声翻訳課題について述べる。
直接またはカスケードアプローチで、4つの言語ペアをすべてカバーしています。
私たちのシステムのバックボーンはオフラインのWhisper音声モデルで、最先端のAlignAttと同時処理モードで翻訳と転写の両方に使用しています。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:27:44 GMT)
Simulating Correlated Electrons with Symmetry-Enforced Normalizing Flows [0.0] 正規化フローはフェルミオンハバードモデルのボルツマン分布を正確に学習することができる。
ハイブリッドモンテカルロのような最先端の手法は、しばしば時間-連続限界に近いエルゴディディティの問題に悩まされる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:13:47 GMT)
Secret Sharing in 5G-MEC: Applicability for joint Security and Dependability [0.0] 5Gの強化であるMulti- Access Edge Computing (MEC)は、生成点に近いデータを処理し、レイテンシとネットワーク負荷を低減する。
エッジにおけるセンシティブなデータの効率的な操作とセキュリティを確保することが重要です。
本稿では,5G-MECストレージにおけるしきい値秘密共有の利用について検討する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:58:41 GMT)
Second Opinion Matters: Towards Adaptive Clinical AI via the Consensus of Expert Model Ensemble [0.0] 本稿では, 単一モデルシステムにおける可溶化および剛性依存のリスクを克服する, コンセンサス機構と呼ばれる新しい枠組みを提案する。
コンセンサスメカニズムは、臨床意思決定の改善を可能にする専門的な医療専門家のアンサンブルを実装している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:24:46 GMT)
SHAKTI: A 2.5 Billion Parameter Small Language Model Optimized for Edge AI and Low-Resource Environments [0.0] Shaktiは高性能NLPと最適化された効率と精度を組み合わせた。
言語やドメイン固有のタスクをサポートすることで、Shaktiは医療、金融、カスタマーサービスといった業界に長けている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:37:11 GMT)
RocketStack: A level-aware deep recursive ensemble learning framework with exploratory feature fusion and model pruning dynamics [0.0] RocketStackは、レベルの認識された再帰的なアンサンブルフレームワークである。
各レベルでより弱い学習者を徐々に引き起こし、過剰な複雑さを伴わずにより深い積み重ねを可能にします。
33のデータセットのうち、線形トレンド試験では、ほとんどの変種で深度で精度が上昇したことが確認された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:52:44 GMT)
Robust Training with Data Augmentation for Medical Imaging Classification [0.0] ディープニューラルネットワークは、医療画像を用いて医療状況を検出し、診断するためにますます使われてきている。
実用性にもかかわらず、これらのモデルは敵の攻撃や分散シフトに対して非常に脆弱である。
医用画像分類における脆弱性を軽減するために,データ拡張による堅牢なトレーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:36:39 GMT)
Rethinking Over-Smoothing in Graph Neural Networks: A Perspective from Anderson Localization [0.0] グラフニューラルネットワーク(GNN)は、その強力な表現能力のため、グラフデータ解析において大きな可能性を示している。
ネットワークの深さが大きくなると、過剰なスムース化の問題はより深刻になり、ノード表現はその特異性を失う。
本稿では、アンダーソンの局所化に類似したオーバー・スムーシングのメカニズムを解析する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:54:10 GMT)
Real-Time Black-Box Optimization for Dynamic Discrete Environments Using Embedded Ising Machines [0.0] Black-box Optimization (BBO)アルゴリズムとMulti-armed Bandit (MAB)アルゴリズムは、アクションを繰り返し行い、それに対応する即時報酬を事前の知識なしに観察することで最適化を行う。
そこで本研究では,Ising マシンを用いた BBO 手法が,離散値の組み合わせによって表現される最良の動作を見つけるために提案されていることを示す。
移動ユーザを持つ無線通信システムにおいて,提案手法の動的適応性を示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:31:43 GMT)
Real state transfer on edge perturbed graphs with generalized clusters [0.0] 一般化クラスタを含むエッジ摂動グラフにおける実状態移動の存在について検討する。
中心的な観察は、特定の量子状態の進化は、基礎となるグラフの局所構造にのみ依存するということである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 06:25:20 GMT)
Qumode Tensor Networks for False Vacuum Decay in Quantum Field Theory [0.0] 自己干渉型スカラーQFTにおける偽真空崩壊のハミルトニアンシミュレーションのための新しい手法を提案する。
提案手法は,非平衡スカラーQFT現象のスケーラブルなフレームワークとしてキューモードネットワークを確立する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:00:02 GMT)
Quantum-corrected Floquet dynamics in the Rabi model [0.0] 実例としてスピン場系のラビモデルを用いる。
スピンの半古典力学に対する一階量子補正の近似解析式を初期場状態の範囲で得られる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:43:03 GMT)
Quantum secure direct communication of continuous-time signals using Whittaker Nyquist Shannon theorem [0.0] 提案プロトコルは、AliceからBobへ、音声信号などの連続的な信号をセキュアに転送するために使用することができる。
このセキュリティは、光学信号の量子的性質とウィテカー=ニキスト=シャノンの定理によって保証されている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:54:32 GMT)
Quantum prime factorization algorithms using binary carry propagation [0.0] RSA暗号系は、素因数分解の計算困難に依存する。
高次非制約二元最適化(HUBO)と制約二次モデル(CQM)の両方を用いた整数分解に対する量子アニール法に基づくアプローチを提案する。
その結果、グローバルな製品制約を適用することで、すべてのテストインスタンスにおける分解精度と一貫性が向上することがわかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:34:16 GMT)
Quantum observable's reality erasure with spacelike-separated operations [0.0] アインシュタイン、ポドルスキー、ローゼンは、局所的な作用が遠い場所における現実の要素に影響を与えないという仮定に基づいて、量子力学は不完全であると主張した。
アリスの局所量子演算は、ボブの因果的に非連結な実験室における可観測物の現実の消去と相関できることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:56:41 GMT)
Quantum k-SAT Related Hypergraph Problems [0.0] 量子k-SAT問題は、k-SAT問題の量子である。
構造コアと半径を持つ量子k-SAT問題のグラフ理論による研究を行う。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:12:55 GMT)
Quantum Theory of Optical Spin Texture in Chiral Tellurium Lattice [0.0] そこで我々は,Teの電子的構造に類似したスピン分解型深部顕微鏡光バンド構造を開発した。
格子レベルでは、Teのキラリティが光波内の深部微視的な光スピンテクスチャとして現れることが明らかとなった。
本フレームワークは光学活性の有限モメンタム源を明らかにするとともに, キラル結晶材料における光-物質相互作用の顕微鏡的基盤を提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:26:55 GMT)
Public-Key Quantum Authentication and Digital Signature Schemes Based on the QMA-Complete Problem [0.0] 本稿では,局所密度行列の整合性の量子メルリンアーサー(QMA)完全性に基づく量子認証およびデジタル署名プロトコルを提案する。
我々は厳密なセキュリティ分析を行い、量子敵による適応的選択メッセージ攻撃に対するスキームの偽造性を証明する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:56:50 GMT)
Public Perceptions of Autonomous Vehicles: A Survey of Pedestrians and Cyclists in Pittsburgh [0.0] 本研究ではピッツバーグの歩行者や自転車に自律走行車(AV)技術がどのように認識されているかを検討する。
1200人以上の回答者による調査データを用いて、この研究は人口動態、AV相互作用、インフラの準備性、安全性の認識、信頼の間の相互作用を調査している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:27:06 GMT)
Probing dynamical axion quasiparticles with two-photon correlations [0.0] 我々は、軸イオン崩壊から生ずる量子2光子状態をリアルタイムに研究する。
この状態は、運動量と分極パターンが異なっている。
この関係は、2光子相関を動的軸性準粒子の直接プローブとして示唆している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:10:29 GMT)
PlantBert: An Open Source Language Model for Plant Science [0.0] 植物ストレス応答型文献から構造化知識を抽出する,高性能でオープンソースな言語モデルであるPlantBertを提案する。
本手法は,トランスフォーマーに基づくモデリングと規則強化された言語後処理とオントロジーに基づく実体正規化を組み合わせた手法である。
計算プラント科学における透明性の促進と学際的イノベーションの促進を目的として,本モデルが公開された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:27:26 GMT)
Pilot-waves and copilot-particles: A novel approach to objective collapse [0.0] マクロ計測による波動関数崩壊現象を取り入れたシュル・オーディンガー方程式の拡張を提案する。
我々のアプローチは、ブーム・ド・ブロイのパイロット波と客観的崩壊理論のハイブリッドに依存している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:54:07 GMT)
Photogranulometry -- Dataset of soil images with corresponding particle size distributions [0.0] 本稿では,ケベック州モントリオールで収集された321種類の土壌試料の高解像度画像12,714枚について述べる。
ジオテクノロジー応用において、畳み込みニューラルネットワーク(CNN)をトレーニングするための堅牢な出発点を提供するように設計されている。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:19:45 GMT)
Pedagogical approach to anomalous position and velocity [0.0] 本稿では,不規則な位置と速度の表現を導出するための教育的手法について論じる。
直感的な理解を目指して、線形結合軌道状態を用いて電場下の状況をシミュレートする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 22:59:08 GMT)
Optical signatures of quantum skyrmions [0.0] We probe the quantum nature of skyrmion in frustrated magnets using Brillouin light scattering (BLS)
特定の幾何学において、古典的なスカイミオンは、BLSスペクトルにおいて対称なサイドバンドを生成するのに対し、量子スカイミオンは、その回転の真空ゆらぎから生じる別の非対称性を示す。
これらの発見は、スピンテクスチャにおける非古典的特徴の光学的検出のための具体的なプロトコルを確立し、量子応用におけるそれらの役割を探求する道を開いた。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:58:05 GMT)
Operator Ordering in the Relativistic Quantization and its Thermodynamic Implications [0.0] 演算子順序のあいまいさを追跡する曲線時空における粒子の共変正準量子化を導入する。
我々は、先導的な量子相対論的補正を持つエルミート・ハミルトニアンを導出する。
強重力場における極端電場中の電子と超軽量粒子の数値的研究は、これらの補正が中間温度で重要となることを示した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:47:40 GMT)
On the excitability of two-level atoms by spectrally encoded single-photon wave packets [0.0] 我々は、2レベル原子とスペクトル符号化された単一光子波パケットの時間依存性の相互作用を分析する。
結果は、現実的な量子ネットワークにおける量子ノードと量子光がどのように相互作用するかを理解するために不可欠である。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 21:36:12 GMT)
Observing Bethe strings in an attractive Bose gas far from equilibrium [0.0] 小型のBethe弦は近年、量子磁石や超伝導量子ビットで観測されている。
ここでは、ほぼ可積分な超低温ボース気体を用いて、Bethe弦のそのような混合を平衡から得ることができる。
モーメント分布やタンの接触において、相関密度に関係したさらなる証拠が見つかる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:28:39 GMT)
Multimodal Political Bias Identification and Neutralization [0.0] 政治的反響室の存在により、政治記事のテキストや画像から主観的偏見を検出し、排除することが義務づけられる。
4つのステップからなるテキストと画像のバイアスを利用するモデルを提案する。
これまでの結果は、この手法が有望であることを示しており、テキストの曖昧化戦略は、多くの潜在的なバイアスのある単語やフレーズを識別することができる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:03:20 GMT)
Multi-NARP Laser Driving Scheme for Multiplexed Quantum Networks [0.0] 我々は、レーザトリガー単一光子源のNARP方式を、遷移エネルギーの異なる複数のエミッタの同時励起に拡張する。
我々は、少なくとも10個のエミッタの同時トリガが可能であり、高帯域量子ネットワークの開発を可能にすることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:26:16 GMT)
Massive graviton dark matter searches with long-baseline atom interferometers [0.0] 原子干渉計は、原子系への影響を正確に測定することで、超軽量暗黒物質(ULDM)に対して例外的な感度を提供する。
以前の研究では、スカラーおよびベクトルULDM候補を検出する能力が実証されているが、スピン-2 ULDMを探索する可能性はまだ明らかにされていない。
スピン2 ULDMフィールドのコヒーレント振動は3つの結合機構を通じて原子干渉計の可測位相シフトを誘導することを示した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:09:15 GMT)
Mapping the Evolution of Research Contributions using KnoVo [0.0] KnoVoは、科学文献における研究ノベルティの進化を定量化し分析するために設計されたインテリジェントなフレームワークである。
論文の新規性は、その多層励起ネットワークにおける前処理と後処理の両方に対して決定される。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:17:11 GMT)
LieDetect: Detection of representation orbits of compact Lie groups from point clouds [0.0] 我々は、その軌道の有限標本からコンパクトリー群の表現を推定する新しいアルゴリズムを提案する。
表現型の知識は、その軌道の再構成を可能にするが、これは作用を生成するリー群を特定するのに役立つ。
このアルゴリズムは, 画像解析, 調和解析, 密度推定, 等変ニューラルネットワーク, 化学コンフォメーション空間, 古典力学システムにおける実時間応用と同様に, 次元32までの合成データに対して試験される。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 20:03:34 GMT)
LegiGPT: Party Politics and Transport Policy with Large Language Model [0.0] 本稿では,大型言語モデル(LLM)と説明可能な人工知能(XAI)を統合し,交通機関に関する立法案を分析するLegiGPTを紹介する。
我々は、交通政策決定に大きな影響を及ぼす主要な要因、例えば、スポンサーの特徴、政治的提携、地理的変数を特定します。
その結果、保守的かつ進歩的なスポンサーの数と比率が、地域規模や選挙人人口と共に、立法成果を形成する重要な決定要因であることが判明した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:25:52 GMT)
Learning golf swing signatures from a single wrist-worn inertial sensor [0.0] 単一手首センサを用いたゴルフスイング分析のためのデータ駆動型フレームワークを構築した。
我々は、技術的欠陥の検出と可視化を容易にする動きプリミティブの合成、離散的な語彙を学習する。
本システムでは,手首データから全身運動とスイングイベントを正確に推定し,実験室での動作解析を行う。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 22:57:59 GMT)
Large Language Models as symbolic DNA of cultural dynamics [0.0] 本稿では,外部情報基盤としての大規模言語モデル(LLM)の新たな概念化を提案する。
我々は、人間の記号表現の圧縮パターンを保存するリポジトリとして、より広範な役割を担っていると論じている。
この枠組みは、LSMを文化的発展性のためのツールとして位置づけ、人類が自身の新しい仮説を創出することを可能にする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:37:29 GMT)
Large Language Models as Psychological Simulators: A Methodological Guide [0.0] 本稿では,2つの主要なアプリケーションを対象とした心理シミュレータとして,大規模言語モデルを使用するためのフレームワークを提供する。
シミュレーションでは,集団的カテゴリーを超えて心理的基盤を持つペルソナを開発する手法を提案する。
我々は、素早い感度、トレーニングデータカットオフからの時間的制限、従来の人的対象のレビューを超えて広がる倫理的考慮など、包括的な課題に対処する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:45:23 GMT)
LLMs in Disease Diagnosis: A Comparative Study of DeepSeek-R1 and O3 Mini Across Chronic Health Conditions [0.0] DeepSeek R1は疾患レベルの精度が76%、全体的な精度が82%に達し、O3 Miniを上回った。
しかし、どちらのモデルも呼吸疾患の分類に苦慮し、DeepSeek R1では40%、O3 Miniでは20%のアキュラシーを記録した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:33:03 GMT)
Information theoretic measures within Schrödinger-Dunkl framework in spherical coordinates [0.0] 球面座標におけるDeng-Fan分子ポテンシャルを持つSchr"odinger-Dunkl方程式の解析解を提示した。
選択された二原子分子ScH、TiH、VH、CrHの回転振動エネルギーを得る。
反射演算子の角波解および情報理論に対する効果を示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 19:30:32 GMT)
Influence of optical self-injection on statistical properties of laser-pulse interference [0.0] パルス光自己注入は半導体レーザの発光特性に大きな影響を及ぼす。
レーザーキャビティへの反射光パルスの到着時間の変化が位相拡散に影響を与えることを実験的に証明し、外部光注入と類似して位相ロックと呼ぶ効果を誘導する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:46:32 GMT)
How online misinformation works: a costly signalling perspective [0.0] 第1章は、オンラインコミュニケーション、特にソーシャルメディアにおいて、話者が真実にコミュニケーションする動機となる評判のインセンティブをどう評価するかを考察する。
オンライン空間の主な特徴は, (i) 再投稿, (ii) コミュニケーションのゲーミフィケーション, (iii) 情報過負荷, (iv) 匿名・非可算な情報源の存在, (v) オンラインコミュニケーションのリーチと持続性の増加などである。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:03:10 GMT)
High-precision Quantum Phase Estimation on a Trapped-ion Quantum Computer [0.0] マルチアンシラ量子位相推定を用いたベンチマーク手法を提案する。
我々は、読み出しレジスタのキュービット数に比例して、ゲート数で2次スケールする回路を生成する。
これにより、多くの量子ビットに作用する量子化学回路の実行が可能となり、ショット数に制限のある有意義な結果が得られる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:55:14 GMT)
Hamiltonian-learning quantum magnets with non-local impurity tomography [0.0] 量子物質の不純物は、複雑な状態の学習に成功している。
原子工学的な量子マグネットからハミルトンパラメータを推定するために、教師付き機械学習技術がどのように用いられるかを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:08:43 GMT)
From Prompts to Constructs: A Dual-Validity Framework for LLM Research in Psychology [0.0] 我々は、AI心理学の堅牢な科学を構築するには、信頼度測定の原則と音因推論の標準を統合する必要があると論じる。
我々は、この統合を導くための二重正当性フレームワークを提案し、このフレームワークは、主張を支持するために必要な証拠が、その科学的野心によってどのようにスケールするかを明確にする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:38:42 GMT)
From Drawings to Decisions: A Hybrid Vision-Language Framework for Parsing 2D Engineering Drawings into Structured Manufacturing Knowledge [0.0] 2Dエンジニアリング図面からの重要な情報は、デジタル製造の進歩に不可欠である。
手動の抽出は遅く、労働集約的であるが、一般的なOCRモデルは複雑なレイアウト、エンジニアリングシンボル、回転テキストのために失敗することが多い。
回転認識オブジェクト検出モデル(YOLOv11-obb)とトランスフォーマーに基づく視覚言語モデル(VLM)を統合するハイブリッドビジョン言語フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:10:01 GMT)
Finite time path field theory and a new type of universal quantum spin chain quench behaviour [0.0] 急激なクエンチと急激なクエンチの差は,摂動の非定常スイッチングが時間とともに指数関数的に消えることを示す。
また、類似の普遍的行動は、障害のクエンチ、そして究極的には大域的行動に存在することを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:08:30 GMT)
Fidelity Relations in an Array of Neutral Atom Qubits -- Experimental Validation of Control Noise [0.0] ノイズは現在の量子コンピュータにとって障害となる要素である。
本研究では,制御雑音と量子状態の忠実度との理論的関係を実験的に検証した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:04:08 GMT)
Fault Tolerance by Construction [0.0] フォールトトレラント量子コンピューティングの主な課題は、ノイズの多い環境での回路の合成と最適化である。
本稿では,構成によって正しいフォールトトレラント量子回路を設計するための枠組みを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:35:40 GMT)
Facial Landmark Visualization and Emotion Recognition Through Neural Networks [0.0] 顔画像からの感情認識は、人間とコンピュータの相互作用において重要な課題である。
これまでの研究では、顔認識がディープラーニングモデルのトレーニングに利用できることが示されている。
顔データセットの外れ値を特定するための可視化技術である顔ランドマークボックスプロットを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:45:34 GMT)
Exploring the effect of spatial scales in studying urban mobility pattern [0.0] 本稿では,シンガポールにおける公共交通機関の流動データを用いた都市移動パターンの説明において,空間スケールが重力モデルの性能に与える影響を考察する。
その結果,重力モデルが最適である最適中間空間スケールの存在が示唆された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 05:39:39 GMT)
Evaluating the Impact of Lean and Green Practices on Operational Performance: A Real Data-Driven Simulation Case Study [0.0] 本研究では,リーンとグリーンのプラクティスが全体的なパフォーマンスに与える影響について検討する。
いくつかの改善シナリオが提案され、検査ワークステーションの統合と再配置が行われた。
どちらのシナリオも、現在の状態と比較してOEEE値が増加し、リードタイムが減少した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:53:02 GMT)
Entanglement through high-energy scattering in noncommutative quantum electrodynamics [0.0] 我々は、質量を持たない量子電磁力学におけるいくつかの鍵散乱過程を通して絡み合いの発生を分析する。
私たちが研究する散乱過程は、通常のミンコフスキー時空では発生しない。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:29:18 GMT)
Enhancing Expressivity of Quantum Neural Networks Based on the SWAP test [0.0] SWAPテスト回路のみから構築された量子ニューラルネットワーク(QNN)。
振幅符号化の下で2次活性化関数を持つ古典的2層フィードフォワードネットワークの数学的等価性について論じる。
本稿では,製品層を有する古典的ニューラルネットワークを効果的に実装する一般化SWAPテスト回路を用いた回路修正を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:05:31 GMT)
Emergence of thermodynamic functioning regimes from finite coupling between a quantum thermal machine and a load [0.0] 機械と負荷の結合の温度と大きさを調整することにより、熱機械は4つのモードで動作可能であることを示す。
結合強度を増加させると, エンジンモードが抑制され, 冷凍機モードは実現不可能であることが示される。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 06:38:24 GMT)
Elastic scattering of twisted electrons by CO$_2$ molecules at high energies [0.0] CO$$分子によるツイスト(ベッセル)電子ビームの弾性散乱は、理論上高エネルギーで研究されている。
分子の構造は結合クラスター理論と密度汎関数理論を用いて最適化される。
提案手法は構造によらずあらゆる多原子分子の研究に応用できる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 14:58:15 GMT)
Dynamic Watermark Generation for Digital Images using Perimeter Gated SPAD Imager PUFs [0.0] 本研究では,SPAD (pgSPAD) 画像を用いた新しい透かし手法を提案する。
本研究は,提案したソースシーン固有の動的透かしを用いて,ソース識別と改ざん検出を両立可能であることを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 16:36:43 GMT)
Dispositions and Roles of Generically Dependent Entities [0.0] BFO 2020は、機能、配置、および一般的な依存的な連続体の役割をサポートしない。
この問題に対処する2つのアプローチが提示される。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:40:45 GMT)
Deep generative models as the probability transformation functions [0.0] 本稿では,深部生成モデルを確率変換関数とみなす統一理論的視点を紹介する。
単純な事前定義された分布を複雑なターゲットデータ分布に変換することによって、それらすべてが根本的に動作することを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:22:23 GMT)
Data-driven Insights for Informed Decision-Making: Applying LSTM Networks for Robust Electricity Forecasting in Libya [0.0] 本研究では,リビアのベンガジで2025年の電力負荷, 発電, 赤字をデータ駆動で予測する手法を提案する。
ARIMA, 季節的ARIMA, 動的回帰ARIMA, 指数的スムージング, 極端な勾配増強, 長短短期記憶(LSTM)ニューラルネットワークなど, 複数の時系列モデルを適用した。
LSTMは他のモデルよりも優れており、非定常パターンと季節パターンのモデリングにおける強力な能力を示している。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 23:41:41 GMT)
Cross-modal Offset-guided Dynamic Alignment and Fusion for Weakly Aligned UAV Object Detection [0.0] 無人航空機(UAV)の物体検出は、環境モニタリングや都市警備といった用途において重要な役割を担っている。
UAVプラットフォームの動きと非同期イメージングにより、空間的不整合はしばしばモダリティの間で発生し、アライメントが弱くなる。
我々はこれらの問題に対処するために、クロスモーダルオフセット誘導動的アライメント・アンド・フュージョン(CoDAF)を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 04:11:39 GMT)
Coupled cluster method tailored by quantum selected configuration interaction [0.0] 本稿では、結合クラスタ(CC)理論を量子選択構成相互作用(QSCI)波動関数で調整するハイブリッド量子古典スキームを提案する。
QSCIは、量子ハードウェア上に準備された多電子状態の再構築にスケーラブルでショット効率のよいアプローチを提供する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:07:26 GMT)
Continual Learning with Columnar Spiking Neural Networks [0.0] 先行学習と共有構造が欠如している場合には,マイクロカラムが新しいタスクに最も効率的に適応できることが示される。
最適構成は10の逐次MNISTタスクを効果的に学習し、各タスクの精度を92%維持する。
9つのタスクをトレーニングした後、最初のタスクでは4%のパフォーマンス低下しかなかった。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:13:38 GMT)
Contextual modulation of language comprehension in a dynamic neural model of lexical meaning [0.0] 本稿では、英語の語彙項目「have」をテストケースとして用いて、その多義性に焦点をあてて、モデルのアーキテクチャと振舞いを実証する。
結果は、単語の多くの関連する意味が、メタスタブルなニューラルアクティベーション状態である、という、語彙的多義性に関する新しい視点を支持する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:22:34 GMT)
Construction of Metaplectic Representations of $SL_2(\mathbb{Z}_{2^n})$ and Twisted Magnetic Translations [0.0] SL_2(mathbbZ_2n)$ の単位メタプレクティック表現は、2n$次元量子系の進化を記述するために必要である。
メタプレクティックな性質を満たすためには、関与する$n$-qubit ヒルベルト空間の次元が 2n$ から $22n$ に増加する必要がある。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:03:53 GMT)
Comparison of spin-qubit architectures for quantum error-correcting codes [0.0] シリコンのスピン量子ビットを用いた実装における2つの量子誤り訂正符号(表面符号とベーコン・ソー符号)の性能について検討する。
論理誤差は、メモリエラーではなく、ゲートエラー、特に1ビットと2ビットのゲートエラーによって制限される。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:45:21 GMT)
Collective emission of atomic nanorings around an optical nanofiber [0.0] 単環対の放射固有モードは、繊維の特定の誘導モードに選択的に結合することを示す。
我々は,光誘導モードに対して放射モードに対する放射が高度に抑制されている状況を特定する。
本研究により, リング構成は, 効率的かつ多用途なナノファイバーインタフェースの実装に有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:02:43 GMT)
Classification of three-qubit genuine entangled states using concurrence fill [0.0] 我々は、真のマルチパーティの絡み合いを定量化する、コンカレンスフィリング(concurrence fill)と呼ばれる幾何測度を用いる。
我々は、GHZクラスとWクラスを分類し、一般化されたGHZクラスとWクラスのランク2を解析するための基準を導出する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:58:03 GMT)
Circuit Design for a Star-shaped Spin-Qubit Processor via Algebraic Decomposition and Optimal Control [0.0] 星型トポロジを持つ量子コンピューティングプラットフォームに対する最適制御ゲートの調整アルゴリズムを提案する。
ダイヤモンド及び周辺核スピンの窒素空孔中心からなる量子処理ユニット上で、結果の回路をどのように実装できるかを数値的に示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:47:11 GMT)
Challenges in Grounding Language in the Real World [0.0] 人工知能の長期的な目標は、人間が人間にとって自然な言語を使って物理的なロボットと協力できる言語理解システムを構築することである。
本研究では,対話型タスク学習が可能な認知エージェントの能力と,大規模言語モデルの言語能力を統合するソリューションを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:17:53 GMT)
Casimir-Lifshitz force with graphene: theory versus experiment, role of spatial non-locality and of losses [0.0] グラフェンの電磁応答における空間的非局所性と損失がカシミール・リフシッツ相互作用に及ぼす影響を解析した。
利用可能な実験のパラメータについて、3つのモデルを用いたカシミール・リフシッツ力の理論的予測は事実上同一であることを示す。
グラフェン構造を含むカシミール・リフシッツ力の測定結果と比較した。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 15:03:10 GMT)
CINNAMON: A hybrid approach to change point detection and parameter estimation in single-particle tracking data [0.0] 単一粒子追跡トラジェクトリを分類し,その中の変化点を検出し,変化点間のセグメントにおける拡散パラメータを推定するハイブリッド手法を提案する。
提案手法は,ニューラルネットワーク,特徴に基づく機械学習,統計的手法の組み合わせに基づく。
第2回Anomalous Diffusion Challengeでベンチマークされた。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 07:42:53 GMT)
BreastDCEDL: Curating a Comprehensive DCE-MRI Dataset and developing a Transformer Implementation for Breast Cancer Treatment Response Prediction [0.0] 乳がん患者2,070例の3D Dynamic Contrast-Enhanced MRI(DCE-MRI)を前処理した深層学習データセットであるBreastDCEDLについて報告する。
生のDICOM画像データは、厳密に3D NIfTIボリュームに変換され、信号の整合性が保たれた。
BreastDCEDLには、事前に定義されたベンチマーク分割が含まれており、再現可能な研究のためのフレームワークを提供し、乳がん画像における臨床的に意味のあるモデリングを可能にする。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:29:37 GMT)
Boltzmann Classifier: A Thermodynamic-Inspired Approach to Supervised Learning [0.0] 本稿ではボルツマン分布に着想を得た距離に基づく確率的分類アルゴリズムを提案する。
本手法は, 分子活性予測, 遷移金属錯体の酸化状態分類, 乳癌診断の3分野にまたがって評価された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:01:48 GMT)
Beyond principlism: Practical strategies for ethical AI use in research practices [0.0] 科学研究における生成的人工知能の急速な採用は、倫理的ガイドラインの開発を上回っている。
既存のアプローチは、科学研究の実践においてAIの倫理的課題に取り組むための実践的なガイダンスをほとんど提供しない。
抽象的な原則と日々の研究実践のギャップを埋めるために,ユーザ中心の現実主義に触発されたアプローチを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 02:59:45 GMT)
Berry Phase in Pathangled Systems [0.0] 我々は、スピン/偏極制約を超えた絡み合いの幾何学的制御を実現するために、パタングル量子状態(生産角度によって支配される空間的相関系)を導入する。
我々は、特定の測定設定に対してベル限界を幾何学的に示す24.97円の近似臨界角を同定する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:51:01 GMT)
Automation Bias in the AI Act: On the Legal Implications of Attempting to De-Bias Human Oversight of AI [0.0] 本稿では,人工知能法(AIA)における自動化バイアス(AB)の明示的言及の法的意味について検討する。
TheAIAは、リスクの高いAIシステムに対する人間の監視を義務付け、プロバイダがABの認識を可能にすることを要求する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 08:07:59 GMT)
Attosecond tunneling time measurements through momentum squeezing in strong field ionization [0.0] ポテンシャル障壁を通る粒子のトンネルは、基本的な物理過程であり、量子物理学の主要な思考を引き起こす結果である。
強い電場によって誘導される電位障壁を通した原子からの電子ウェーブレットトンネルが、その運動量プロファイルを対応するトンネル時間の値として持つことを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 21:37:13 GMT)
Asymptotically good CSS-T codes and a new construction of triorthogonal codes [0.0] 我々は、map $phi$を使って、任意のCSSコードからCSS-Tコードを体系的に構築する。
量子LDPCCSS-T符号および量子LDPCCSS-T符号の存在を実証する。
コヒーレントノイズ処理におけるこれらの符号の即時適用について論じる。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 09:42:07 GMT)
Analytic solution to degenerate biphoton states generated in arrays of nonlinear waveguides [0.0] 非線形導波路のアレイにおける退化二光子状態の進化に対する解析解を得るために超モード法を用いる。
この解は任意の数の導波路と結合プロファイルの配列を説明できる。
本稿では,解析解を用いて逆問題に対処する方法の実証例を示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:07:15 GMT)
Accelerating Quantum Eigensolver Algorithms With Machine Learning [0.0] NISQデバイス上でのハミルトン基底状態エネルギー計算の高速化について検討する。
探索に基づく手法と機械学習を併用して量子アルゴリズムの高速化を提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 13:00:50 GMT)
A workflow for generating synthetic LiDAR datasets in simulation environments [0.0] 本稿では,自動運転車の認識,ロボット工学研究,センサセキュリティ解析を支援するために,合成LiDARデータセットを生成するシミュレーションワークフローを提案する。
都会のシナリオで運用されている模擬車両プラットフォームに飛行時間LiDAR、画像センサ、二次元スキャナを統合する。
本研究は, 対向点注入や偽造攻撃などのLiDARデータにおける潜在的なセキュリティ脆弱性を調査し, 合成データセットが防衛戦略の評価をいかに促進するかを実証する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 17:56:15 GMT)
A deep learning and machine learning approach to predict neonatal death in the context of São Paulo [0.0] 新生児死亡は、未発達の国や一部の先進国にとって、いまだに深刻な現実である。
この数を減少させるためには、絶滅危惧児の早期予測が不可欠である。
新生児が危険にさらされているかどうかを判断するために、機械学習が使用された。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 11:44:48 GMT)
A competitive NISQ and qubit-efficient solver for the LABS problem [0.0] パウリ相関。
(PCE)は、近年、変分量子アルゴリズムにおける問題を最適化するための量子ビット効率のアプローチとして導入されている。
我々はPCEベースのフレームワークを拡張し、LABS(Low Autocorrelation Binary Sequences)問題を解決する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:00:02 GMT)
A Systems Thinking Approach to Algorithmic Fairness [0.0] 私たちはシステム思考を使って、政策立案者が様々な種類の公正政策から存在する複雑なトレードオフを理解するのを助けます。
私たちは、さまざまな種類の公正政策から存在する複雑なトレードオフを理解するために、政治通路の両側の政策立案者を支援するシステム思考を利用することができます。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 18:50:07 GMT)
A Novel Method to Manage Production on Industry 4.0: Forecasting Overall Equipment Efficiency by Time Series with Topological Features [0.0] 全体的な設備効率(OEE)は重要な製造工程であるが、揮発性の性質は短期的な予測を複雑にしている。
本研究では,時系列分解とトポロジカルデータ解析を組み合わせた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 10:04:49 GMT)
A Geometry-Grounded Data Perimeter in Azure [0.0] 本稿は,Azure s blast radius Ultrametricがいかに距離を提供するか,また,この超測度空間におけるトラベリングセールスマン問題の解決がいかに順序付けを提供するかを示す。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 12:46:25 GMT)
A Comparative Analysis of Principal Component Analysis (PCA) and Singular Value Decomposition (SVD) as Dimensionality Reduction Techniques [0.0] 本稿では,2つの線形手法-主成分分析(PCA)と特異値分解(SVD)を純粋に比較した。
各アルゴリズムを第一原理から導出した後、異なる形状の行列に対する解釈可能性、数値安定性、適合性を評価する。
論文参考訳(メタデータ) (Fri, 20 Jun 2025 00:19:45 GMT)