Open-world machine learning: A review and new outlooks [117.3] オープンワールド機械学習の全体像を論じる。
未知の拒絶、新奇な発見、継続的な学習を調査する。
これは研究者がそれぞれの分野でより強力なAIシステムを構築するのを助けることを目的としている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 06:21:00 GMT)
DreamJourney: Perpetual View Generation with Video Diffusion Models [91.9] 永続ビュー生成は、単一の入力画像からのみ任意のカメラ軌跡に対応する長期映像を合成することを目的としている。
近年の手法では、予め訓練されたテキスト・画像拡散モデルを用いて、カメラの動きに沿った未確認領域の新しいコンテンツを合成する。
本稿では,映像拡散モデルの世界シミュレーション能力を活用して,新たなシーンビュー生成タスクを起動する2段階フレームワークであるDreamJourneyを紹介する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 12:51:34 GMT)
JarvisArt: Liberating Human Artistic Creativity via an Intelligent Photo Retouching Agent [74.6] 写真のリタッチは現代のビジュアルなストーリーテリングに不可欠なものとなり、ユーザーは美学を捉え創造性を表現できる。
本稿では,マルチモーダル言語モデル(MLLM)に基づくエージェントであるJarvisArtを紹介し,ユーザ意図を理解し,プロのアーティストの推論プロセスを模倣し,Lightroom内の200以上の修正ツールをインテリジェントにコーディネートする。
実世界のユーザ編集から構築した新しいベンチマークであるMMArt-Benchを開発した。
JarvisArt は GPT-4o よりもパフォーマンスが向上し、MMArt-Bench で平均ピクセルレベルのメトリクスが60%向上した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 06:36:00 GMT)
AnyMAC: Cascading Flexible Multi-Agent Collaboration via Next-Agent Prediction [70.6] 本稿では,グラフ構造ではなくシーケンシャル構造を用いて,マルチエージェント協調を再考するフレームワークを提案する。
提案手法は,(1)各ステップで最も適したエージェントロールを選択するNext-Agent Predictionと,(2)各エージェントが前ステップから関連する情報にアクセスできるようにするNext-Context Selectionの2つの重要な方向に焦点を当てる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:34:43 GMT)
OWMM-Agent: Open World Mobile Manipulation With Multi-modal Agentic Data Synthesis [70.4] オープンワールドのモバイル操作タスクは、オープンエンドの命令や環境への一般化が必要なため、依然として課題である。
本稿では,多視点のシーンフレームとエージェント状態を維持した新しいマルチモーダルエージェントアーキテクチャを提案する。
我々は,グローバルなシーン理解,ロボットの状態追跡,マルチモーダルアクション生成を統一モデルで実現した,モバイルマニピュレータのための基礎モデルであるOWMM-VLMについて紹介する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:48:50 GMT)
ReNeg: Learning Negative Embedding with Reward Guidance [69.8] テキスト・ツー・イメージ(T2I)生成アプリケーションでは、負の埋め込みは生成品質を向上させるための単純で効果的なアプローチであることが証明されている。
Rewardモデルにより導かれる改良された負の埋め込みを学習するために設計されたエンドツーエンドの手法であるReNegを紹介する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 13:41:27 GMT)
PhysUniBench: An Undergraduate-Level Physics Reasoning Benchmark for Multimodal Models [69.7] 大規模言語モデル(MLLM)の推論能力の評価と改善を目的とした大規模ベンチマークであるPhysUniBenchを提案する。
PhysUniBenchは、3,304の物理問題から成っている。
ベンチマークの構成には、複数のロールアウト、専門家レベルの評価、解決が容易な問題の自動フィルタリング、そして5段階の難易度グレーディングシステムを含む、厳格な多段階プロセスが含まれていた。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 09:55:42 GMT)
How Numerical Precision Affects Arithmetical Reasoning Capabilities of LLMs [69.6] 本稿では,トランスフォーマーに基づく大規模言語モデルの算術性能に影響を与える重要な要因として,数値精度を同定する。
その結果,数値精度の低いトランスフォーマーでは,繰り返し加算や整数乗算などの算術的なタスクに対処できないことがわかった。
対照的に、標準的な数値精度のトランスフォーマーは、モデルサイズを大幅に小さくすることで、これらのタスクを効率的に処理することができる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 09:18:16 GMT)
Aligning Frozen LLMs by Reinforcement Learning: An Iterative Reweight-then-Optimize Approach [65.7] Iterative Reweight-then-IROは、凍結ベースモデルのRLスタイルアライメントを実行するフレームワークである。
テスト時には、値関数を使用して、検索ベースの最適化プロセスを介してベースモデル生成をガイドする。
特に、ユーザは、OpenAIの強化微調整(RFT)と同様、自身のデータセットにモデルをアライメントするためにIROを適用することができる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 21:49:02 GMT)
OpusLM: A Family of Open Unified Speech Language Models [56.1] OpusLMは、213K時間の音声テキストペアと292Bのテキスト専用トークンで継続的に事前トレーニングされている。
本稿では,トークン化,マルチストリーム言語モデル,マルチステージトレーニング戦略に関するSpeechLMの設計について述べる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 06:30:59 GMT)
CultureMERT: Continual Pre-Training for Cross-Cultural Music Representation Learning [55.8] CultureMERT-95Mは、異文化間の音楽表現学習を強化するために開発された多文化的な基礎モデルである。
650時間のマルチカルチャーデータ混合のトレーニングは、様々な西洋音楽のオートタグタスクにおいて、ROC-AUCとAPの平均4.9%の改善をもたらす。
タスク算術は、西欧以外の自動タグタスクの多文化的に訓練されたモデルと同等に機能し、西洋のデータセットに回帰しない。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 21:16:39 GMT)
Cite Pretrain: Retrieval-Free Knowledge Attribution for Large Language Models [53.2] 信頼できる言語モデルは、正しい答えと検証可能な答えの両方を提供するべきです。
現在のシステムは、外部レトリバーを推論時にクエリすることで、引用を挿入する。
本稿では,合成QAペアを継続的に事前訓練するActive Indexingを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 04:48:05 GMT)
Optimization-Free Patch Attack on Stereo Depth Estimation [51.8] ステレオ深さ推定(SDE)に対する最初の逆パッチアタックである PatchHunter を提示する。
PatchHunterは、SDEの仮定を乱すために作られた、構造化された視覚パターンの空間に対する強化学習駆動の探索として、パッチ生成を定式化している。
PatchHunterは、KITTIデータセット、CARLAシミュレータ、現実世界の車両展開という3つのレベルにまたがって検証します。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:23:02 GMT)
Exploring the Roles of Large Language Models in Reshaping Transportation Systems: A Survey, Framework, and Roadmap [51.2] 大型言語モデル(LLM)は、輸送上の課題に対処するための変革的な可能性を提供する。
LLM4TRは,交通におけるLSMの役割を体系的に分類する概念的枠組みである。
それぞれの役割について,交通予測や自律運転,安全分析,都市移動最適化など,さまざまな応用について検討した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:19:45 GMT)
Learning Time-Aware Causal Representation for Model Generalization in Evolving Domains [50.7] 動的因果要因と因果機構のドリフトを組み込んだ時間認識型構造因果モデル(SCM)を開発した。
本研究では,時間領域毎に最適な因果予測値が得られることを示す。
合成と実世界の両方のデータセットの結果から,SynCは時間的一般化性能に優れることが示された。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 14:05:37 GMT)
Resolving the Ti-V Phase Diagram Discrepancy with First-Principles Calculations and Bayesian Learning [47.8] チタン-バナジウム(Ti-V)二元合金が体中心立方晶(BCC)の相違点を示すか、あるいは完全に可溶であるかについては、対立する実験は意見が一致しない。
先導的な仮説は、合金の調製時の酸素汚染の相違によるものである。
私たちは熱力学推論に積極的に訓練されたモーメントポテンシャルを結合するab initio + machine-learningワークフローを使用します。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 14:09:15 GMT)
Efficient Strategy Synthesis for MDPs via Hierarchical Block Decomposition [47.1] ソフトウェア製品ラインとロボティクスはマルコフ決定プロセス(MDP)を利用して不確実性を捉え、シーケンシャルな意思決定問題を解析する。
従来の政策合成法の有用性にもかかわらず、それらは大きな状態空間にスケールできない。
提案手法は, MDPを動的に精製し, 最も脆弱な MDP 領域を反復的に選択することにより, 大規模な MDP における政策合成を高速化する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 19:03:03 GMT)
Multi-agent Embodied AI: Advances and Future Directions [46.2] エンボディード人工知能(Embodied AI)は、インテリジェントな時代における先進技術の適用において重要な役割を担っている。
本稿では,研究の現状を概観し,重要な貢献を分析し,課題と今後の方向性を明らかにする。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:06:15 GMT)
Evaluating Rank-N-Contrast: Continuous and Robust Representations for Regression [45.0] この文書は2023年に出版された『Rank-N-Contrast』(arXiv:2210.01189v2)の評価である。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:04:40 GMT)
Direct Discriminative Optimization: Your Likelihood-Based Visual Generative Model is Secretly a GAN Discriminator [38.9] 我々は,確率に基づく生成学習とGAN型識別を統合した統合フレームワークとして,直接識別最適化(DDO)を提案する。
我々の重要な洞察は、学習可能な対象モデルと固定参照モデルとの確率比を用いて、識別器を暗黙的にパラメータ化することである。
GANとは異なり、このパラメータ化はジェネレータと識別器ネットワークの共同トレーニングの必要性を排除し、十分に訓練されたモデルの完全なポテンシャルへの直接的、効率的、効果的な微調整を可能にする。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 15:54:27 GMT)
AI Safety vs. AI Security: Demystifying the Distinction and Boundaries [37.6] しばしば「AI安全」と「AI安全」が使われ、時には相互に使用され、概念的に混乱する。
本稿では,AIセーフティとAIセキュリティの正確な研究境界の明確化と記述を目的とした。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:36:03 GMT)
Scene-R1: Video-Grounded Large Language Models for 3D Scene Reasoning without 3D Annotations [37.2] ビデオグラウンドのフレームワークであるScene-R1は、ポイントワイドな3Dインスタンスの監視なしに、3Dシーンについて推論することを学ぶ。
Scene-R1は3D視覚的質問応答タスクに適応して、ビデオから直接自由形式の質問に答えることもできる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:29:10 GMT)
Towards Zero-Shot Coordination between Teams of Agents: The N-XPlay Framework [37.1] 人気のある2エージェントZSCベンチマークのNエージェント拡張であるN-player Overcookedを紹介する。
次に、Nエージェント、複数チーム設定でZSC用のN-XPlayを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 03:04:53 GMT)
Data-Dependent Regret Bounds for Constrained MABs [36.2] 本稿では,制約付きMAB設定におけるデータ依存的後悔境界の研究を開始する。
データ依存の後悔境界は制約の存在によって引き起こせるのか?
具体的には、制約のある最も困難で自然な設定に重点を置いています。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 12:44:40 GMT)
Dual Debiasing for Noisy In-Context Learning for Text Generation [35.6] 文脈学習では、大きな注釈付きコーパスから引き出された高品質なデモンストレーションに大きく依存する。
既存のアプローチでは、ノイズのあるサンプルがクリーンなアノテーションよりも高いパープレキシティをもたらすと仮定して、局所的なパープレキシティをランク付けすることでノイズの多いアノテーションを検出する。
我々は、ノイズの多いアノテーションの下でテキスト生成のためのパープレキシティに基づくパラダイムを再検討し、パープレキシティの2つのバイアス源を強調した。
合成された隣接体を用いて、パープレキシティ推定を明示的に補正し、ロバストなサンプルクリーンネススコアを生成する双対脱バイアスフレームワークを導入する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:56:37 GMT)
A Survey of AI Agent Protocols [35.4] 大きな言語モデル(LLM)エージェントが外部ツールやデータソースと通信する標準的な方法はありません。
この標準化されたプロトコルの欠如は、エージェントが協力したり、効果的にスケールするのを難しくする。
LLMエージェントの統一通信プロトコルは、これを変更できる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 17:39:43 GMT)
UniMoT: Unified Molecule-Text Language Model with Discrete Token Representation [35.3] トークン化アーキテクチャを採用した統一分子テキストLLMであるUniMoTを紹介する。
ベクトル量子化駆動型トークン化器は、分子を因果依存性を持つ分子トークンの配列に変換する。
UniMoTは、分子間テキストとテキスト間タスクの両方を実行するマルチモーダル・ジェネラリストとして登場した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:13:11 GMT)
Towards a Unified Textual Graph Framework for Spectral Reasoning via Physical and Chemical Information Fusion [33.5] 本稿では,先行知識グラフと大規模言語モデルを統合する,新しいマルチモーダルスペクトル分析フレームワークを提案する。
本手法は,物理スペクトル測定と化学構造セマンティクスを統一的なテクスチャグラフ形式で表現することで橋渡しする。
本フレームワークは,ノードレベル,エッジレベル,グラフレベルなど,複数のスペクトル分析タスクにおいて一貫したパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:58:30 GMT)
Online Multi-LLM Selection via Contextual Bandits under Unstructured Context Evolution [31.4] 大規模言語モデル(LLM)は多様な応答挙動、コスト、強度を示す。
我々はLinUCBに基づくアルゴリズムを開発し、将来の文脈予測に頼ることなく、確実にサブ線形後悔を実現する。
私たちのアルゴリズムは理論的に根拠があり、オフラインの微調整やデータセット固有のトレーニングは必要ありません。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 10:01:46 GMT)
Two Heads are Actually Better than One: Towards Better Adversarial Robustness via Transduction and Rejection [31.4] これまで特定の防御の脆弱性を示すのにしか使われていなかったTramerによるリダクション手法の新たな応用が、効果的な防御を構築するのに有効であることを示す。
我々の理論は、選択モデルを学ぶための新しいトランスダクティブアルゴリズムを設計することを促す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 00:00:46 GMT)
AgriCHN: A Comprehensive Cross-domain Resource for Chinese Agricultural Named Entity Recognition [30.5] 本稿では,AgriCHNについて紹介する。AgriCHNは,自動化農業エンティティアノテーションの精度を高めるために設計された,包括的なオープンソース中国語リソースである。
データセットは、合計4,040件の文と15,799件の農業団体の言及をカプセル化した、豊富な農業記事から慎重に収集されている。
ベンチマークタスクは、いくつかの最先端のニューラルNERモデルを使用して構築されている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 04:21:11 GMT)
Deep Learning Framework Testing via Model Mutation: How Far Are We? [30.3] 既存の突然変異に基づく検査手法の欠陥検出機能を再検討する。
わずか23モデルで39のユニークな欠陥を特定しました。そのうち31は開発者によって確認され、8つは修正されました。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:44:33 GMT)
MoORE: SVD-based Model MoE-ization for Conflict- and Oblivion-Resistant Multi-Task Adaptation [29.2] マルチタスクシナリオにおける大規模な基盤モデルの適用は、多くの場合、タスクの衝突や障害に悩まされる。
本稿では,「モデルMOE-ization」戦略を新たに提案し,コンフリクトとオブリビションに抵抗するマルチタスク適応手法を提案する。
様々なデータセットの実験により、MoOREは既存のマルチタスク適応手法を一貫して上回ることを示した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 15:53:00 GMT)
Beyond Functional Correctness: Investigating Coding Style Inconsistencies in Large Language Models [28.7] 大規模言語モデル(LLM)は、コード生成の分野にパラダイムシフトをもたらした。
我々は、コードLLMによって生成されたコードと、人間の開発者が書いたコードとのコーディングスタイルの違いを経験的に分析する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 17:44:03 GMT)
Answer-Centric or Reasoning-Driven? Uncovering the Latent Memory Anchor in LLMs [28.6] 大きな言語モデル(LLM)は印象的な推論機能を示している。
彼らの成功の多くは、真の推論よりも、暗記された回答推論パターンに起因している、とエビデンスは示唆している。
本稿では, 応答キューを体系的に操作し, 間接的, 行動解析によるモデル行動の探索を行う5段階の応答可視プロンプトフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:15:45 GMT)
RoboMonkey: Scaling Test-Time Sampling and Verification for Vision-Language-Action Models [28.4] 我々は、Vision-Language-Action(VLA)モデルのテスト時間スケーリングフレームワークであるRoboMonkeyを紹介した。
RoboMonkeyは、VLAから小さなアクションの集合をサンプリングし、ガウス摂動と過半数投票を適用してアクション提案分布を構築し、次に視覚言語モデル(VLM)ベースの検証器を使用して最適なアクションを選択する。
既存のVLAとRoboMonkeyのペアリングは大きなパフォーマンス向上をもたらし、アウト・オブ・ディストリビューションタスクでは25%、イン・ディストリビューションタスクでは8%の絶対的な改善を実現している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 20:56:17 GMT)
Histopathology Image Report Generation by Vision Language Model with Multimodal In-Context Learning [27.5] トレーニングセットから派生したコンテキストをマルチモーダルなインコンテキスト学習機構に統合する,PathGenICというインコンテキスト学習フレームワークを提案する。
提案手法は意味論的に類似したスライド表現(WSI)-レポートペアを動的に検索し,適応的なフィードバックを取り入れてコンテキスト関連性と生成品質を向上させる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:56:45 GMT)
Multilingual Tokenization through the Lens of Indian Languages: Challenges and Insights [27.4] 本稿では17言語にわたるトークン化戦略の本質的な評価について述べる。
ボトムアップとトップダウンのトークン化アルゴリズムのトレードオフを定量化する。
極端に低リソースな言語は、関連する高リソースな言語で訓練されたトークン化ツールの恩恵を受けることができることを示す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:47:33 GMT)
PhysiX: A Foundation Model for Physics Simulations [27.4] 物理シミュレーションのための最初の大規模基礎モデルであるPhysorXを紹介する。
PhysiXはデータボトルネックに効果的に対処し、タスク固有のベースラインを上回ります。
その結果,自然ビデオから学んだ知識が物理シミュレーションにうまく移行できることが示唆された。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:10:12 GMT)
A Closer Look into Mixture-of-Experts in Large Language Models [26.5] エクササイズ・オブ・エクササイズ(Mixture-of-experts, MOE)は,その特性と顕著な性能から注目を集めている。
MoEアーキテクチャは計算効率を犠牲にすることなくモデルサイズを増大させることができる。
本稿は,MoEベースの大規模言語モデルの内部動作を理解するための最初の試みである。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:56:18 GMT)
EditLord: Learning Code Transformation Rules for Code Editing [26.4] 既存のアプローチはしばしばコード編集を暗黙のエンドツーエンドのタスクとして定式化し、コード編集の手順が本質的に離散的で明示的なステップで構成されているという事実を省略する。
コード変換のステップを明確にするコード編集フレームワークであるEditLordを紹介します。
我々の重要な洞察は、訓練コードペアからコード編集ルールを簡潔なメタルールセットとして抽出するために、言語モデル(LM)を帰納学習者として使うことである。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:12:15 GMT)
IRT-Router: Effective and Interpretable Multi-LLM Routing via Item Response Theory [26.4] 大規模言語モデル (LLM) は、幅広い自然言語タスクにおいて例外的な性能を示した。
強力なモデルはより良い結果をもたらすが、より小さなモデルはよりコスト効率が良いが、能力は低い。
ユーザクエリを最適なLLMに効率的にルーティングするマルチLLMルーティングフレームワークであるIRT-Merciを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 03:39:58 GMT)
Sharper Bounds for Chebyshev Moment Matching, with Applications [26.3] 本研究では,チェビシェフモーメントの雑音測定により,確率分布をほぼ復元する問題について検討する。
任意のリプシッツ函数のチェビシェフ展開の係数に束縛された大域的崩壊を利用することで、ワッサーシュタイン距離の正確な回復が以前よりも多くのノイズで可能であることを証明できる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 21:53:59 GMT)
MTSIC: Multi-stage Transformer-based GAN for Spectral Infrared Image Colorization [26.3] 既存のカラー化手法は、スペクトル情報に制限があり、特徴抽出能力が不十分なシングルバンド画像に依存している。
本稿では、スペクトル情報を統合し、赤外線画像のカラー化を強化するために、GAN(Generative Adversarial Network)ベースのフレームワークを提案する。
実験の結果,提案手法は従来の手法よりも優れ,赤外線画像の視覚的品質を効果的に向上させることがわかった。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 01:42:25 GMT)
DRIMV_TSK: An Interpretable Surgical Evaluation Model for Incomplete Multi-View Rectal Cancer Data [26.1] 直腸癌に関するさらなるデータは、技術の発展とともに収集することができる。
人工知能の発展に伴い、直腸癌治療への応用が可能になってきている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:38:45 GMT)
Leveling the Playing Field: Carefully Comparing Classical and Learned Controllers for Quadrotor Trajectory Tracking [26.1] 強化学習(RL)のような学習ベースの制御アプローチは、最近、四足歩行追跡やドローンレースといったタスクに対して、印象的な結果を生み出した。
しかしながら、このような非常に異なるコントローラのクラスの性能を確実に比較することは、一見するとより複雑である。
ベンチマークのためのクラス最高のRLと幾何学的コントローラを合成するためのベストプラクティスのセットを開発する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:03:00 GMT)
Gaussian Process Latent Variable Modeling for Few-shot Time Series Forecasting [25.6] 時系列予測は資源配分、工業生産、都市管理の最適化に不可欠である。
既存のモデルは、長期の依存関係をキャプチャし、数ショットのシナリオで様々なメタ知識を明示的にモデル化するのに苦労している。
本稿では,メタラーニングに基づくガウス的プロセス潜在変数モデルであるMetaGPを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 10:39:07 GMT)
SRPO: Enhancing Multimodal LLM Reasoning via Reflection-Aware Reinforcement Learning [25.0] MLLM(Multimodal large language model)は、タスク推論において有望な能力を示すが、明示的な自己回帰と自己補正を必要とする複雑な問題に悩まされている。
既存のリフレクション手法は単純で、意味のあるインストラクティブフィードバックを生成するのに苦労している。
本稿では,2段階のリフレクション対応強化学習フレームワークであるグループ相対ポリシー最適化 (SRPO) を用いたマルチモーダル自己回帰強化推論を提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 03:17:00 GMT)
Zero-Shot Conversational Stance Detection: Dataset and Approaches [24.9] スタンス検出は、ソーシャルメディアデータを用いて特定のターゲットに対する世論を識別することを目的としている。
我々は、ZS-CSDという、大規模で高品質なゼロショットスタンス検出データセットを手動でキュレートする。
SITPCL, 話者インタラクションとターゲット認識型プロトタイプ型コントラスト学習モデルを提案し, ゼロショット環境でのベンチマーク性能を確立する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 12:02:06 GMT)
STAGE: A Stream-Centric Generative World Model for Long-Horizon Driving-Scene Simulation [24.9] STAGEは、階層的な特徴調整と、持続可能なビデオ合成のためのマルチフェーズ最適化の先駆けとなる自動回帰フレームワークである。
HTFTはビデオ生成プロセスを通してビデオフレーム間の時間的一貫性を高める。
我々はNuscenesデータセット上で600フレームの高品質なドライビングビデオを生成しました。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:27:24 GMT)
Beyond instruction-conditioning, MoTE: Mixture of Task Experts for Multi-task Embedding Models [24.1] 本研究では,Mixture of Task Experts (MoTE) トランスフォーマーブロックを導入し,特殊な埋め込みを生成するモデル能力を向上する。
MoTEは、検索データセットで64%高いパフォーマンス向上と、すべてのデータセットで43%高いパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:28:25 GMT)
Wireless-Friendly Window Position Optimization for RIS-Aided Outdoor-to-Indoor Networks based on Multi-Modal Large Language Model [23.9] 本稿では、RIS支援屋外屋内(O2I)ネットワークにおいて、窓の位置と窓面配置された知的表面(RIS)のビーム方向を調整し、室内無線および日光性能を最適化することを目的とする。
計算結果から,提案フレームワークは,初期性能,収束速度,最終結果,時間的複雑性の観点から,優れた最適化性能を達成できることが示された。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:31:18 GMT)
Domain Generalization using Action Sequences for Egocentric Action Recognition [22.4] エゴセントリックな視覚は、観察者が着用するカメラによって特徴づけられ、照明、視点、環境の様々な変化を捉えている。
本稿では,エゴセントリック行動認識のための領域一般化手法を提案する。
アクションシーケンスを活用することで、目に見えない環境にまたがるモデルの一般化能力を高めることを目指している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 11:33:08 GMT)
Breaking Single-Tester Limits: Multi-Agent LLMs for Multi-User Feature Testing [22.1] アプリケーション機能テストのためのマルチユーザ対話タスクを自動化するために,LLM(Large Language Models)を利用した新しいマルチエージェントアプローチであるMAdroidを提案する。
具体的には、MAdroidは、ユーザエージェント(オペレータ)とスーパーバイザーエージェント(コーディネータとオブザーバ)の2つの機能タイプを採用している。
マルチユーザ対話型タスク41件を含む評価は,96.8%の動作類似性を有するタスクの82.9%を達成し,提案手法の有効性を示した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 01:38:53 GMT)
SoK: Stablecoin Designs, Risks, and the Stablecoin LEGO [21.8] このSoKは157件の研究研究、95件のアクティブ・スタティック・コイン、44件のセキュリティ・インシデントを通じて、このギャップに直面している。
1)安定性は固有の性質ではなく、市場の信頼と継続的な流動性の間の相互作用に依存する創発的で脆弱な状態である。
歴史的失敗を現在の設計にマッピングする定量的方法論であるStablecoin LEGOフレームワークを紹介した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:19:42 GMT)
Reimagining Parameter Space Exploration with Diffusion Models [21.2] ニューラルネットワークを新しいタスクに適用するには、通常、タスク固有の微調整が必要である。
タスク固有パラメータをタスクの同一性から直接生成する生成的代替手法について検討する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 20:30:17 GMT)
TyphoFormer: Language-Augmented Transformer for Accurate Typhoon Track Forecasting [21.0] 本稿では,自然言語記述を補助的プロンプトとして組み込んだTyphoFormerを提案する。
各時間ステップ毎に,北大西洋ハリケーンデータベースに記録された数値属性に基づいて,Large Language Model (LLM) を用いて簡潔なテキスト記述を生成する。
言語記述は、高レベルの気象学的意味を捉え、数値時系列入力に先立って、補助的な特別なトークンとして組み込まれている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 06:14:57 GMT)
A Locally Differential Private Coding-Assisted Succinct Histogram Protocol [20.8] 簡潔なヒストグラムは、クライアント間で頻繁なアイテムとその頻度をキャプチャする。
ローカルディファレンシャルプライバシ(LDP)が利用され、有望な結果が示されている。
この研究は、誤り訂正符号を用いて簡潔なヒストグラムを構築するための最初の実用的な$(epsilon,delta)$-LDPプロトコルを示す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 17:30:31 GMT)
G-Adaptivity: optimised graph-based mesh relocation for finite element methods [20.2] メッシュ再配置(r適応性)は、メッシュ幾何学を最適化し、与えられた計算予算で最適解の精度を得る。
最近の機械学習のアプローチは、そのような古典的な手法のための高速なサロゲートの構築に焦点を当てている。
有限要素法(FEM)における最適メッシュ転位を実現するための,新しい,効果的なアプローチを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:37:31 GMT)
Comba: Improving Bilinear RNNs with Closed-loop Control [19.8] 本稿では,これらのモデルの利点と限界を包括的に分析したBilinear RNNの概念を紹介する。
我々は,状態フィードバックと出力フィードバックの両補正を併用した,スカラー+低ランク状態遷移を取り入れた新しいバイリニアRNNであるCombaを提案する。
また,大規模コーパス上での340M/1.3Bパラメータのトレーニングモデルと,ハードウェア効率のよいチャンクワイド並列カーネルを実装した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:52:34 GMT)
DUMP: Automated Distribution-Level Curriculum Learning for RL-based LLM Post-training [19.7] 本稿では,分布レベルの学習可能性の概念に基づくカリキュラム学習フレームワークを提案する。
我々のフレームワークは、高い平均的優位性(探索)または低いサンプル数(探索)で分布を優先順位付けする。
実験の結果,本フレームワークは収束速度と最終性能を大幅に改善することがわかった。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 17:04:35 GMT)
Unlearning Isn't Invisible: Detecting Unlearning Traces in LLMs from Model Outputs [19.1] 大規模言語モデル(LLM)のための機械学習(MU)は、特定の望ましくないデータや知識を訓練されたモデルから取り除こうとする。
未学習のトレース検出という新たな脆弱性を特定します。
すべてのモデルサイズにわたる未学習トレースの検出において, 誤り関連プロンプトが90%以上の精度で可能であることを示す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:53:12 GMT)
CLiViS: Unleashing Cognitive Map through Linguistic-Visual Synergy for Embodied Visual Reasoning [18.9] CLiViSは、オープンワールドの視覚知覚を編成してシーンコンテキストを更新する、トレーニング不要のフレームワークである。
この写像は、低レベルの知覚と高レベルの推論をブリッジして、エンボディされたシーンの構造化された表現を構成する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:11:40 GMT)
FedBaF: Federated Learning Aggregation Biased by a Foundation Model [18.9] ファンデーションモデルを新しいアプリケーションに適用するための既存のアプローチは、しばしばフェデレートラーニング(FL)に依存し、グローバルモデルの初期化に使用する際に、ファンデーションモデルの重みをクライアントに開示する。
本稿では,FedBaF(FedBaF)によるFederated Learning Aggregation Biasedを紹介する。FedBaFは,FLアグリゲーションフェーズにおいて,事前学習した基礎モデルの重みを動的に統合する手法である。
従来の方法とは異なり、FedBaFは基礎モデルの機密性を保ちながら、特に非IIDおよび敵のシナリオにおいて、より正確なモデルのトレーニングにその能力を活用している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 23:50:22 GMT)
KAG-Thinker: Teaching Large Language Models to Think with Human-like Reasoning Process [18.8] KAG-Thinkerはパラメータライト大言語モデル(LLM)上に構築された新しいヒューマンライクな推論フレームワークである
このフレームワークは、構造化思考プロセスを確立することにより、複雑な問題を扱うための人間の認知メカニズムをシミュレートする。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 14:58:53 GMT)
Step-Opt: Boosting Optimization Modeling in LLMs through Iterative Data Synthesis and Structured Validation [18.2] Step-Opt-Instructは、既存のデータセットを拡張し、最適化モデリングに適した高品質な微調整データを生成するフレームワークである。
LLaMA-3-8B や Mistral-7B などのオープンソース LLM を微調整し,NL4OPT,MAMO,IndustrialOR などのベンチマーク上で最先端のパフォーマンスを実現するStep-Opt-a モデルを開発した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:42:27 GMT)
Incorporating Rather Than Eliminating: Achieving Fairness for Skin Disease Diagnosis Through Group-Specific Expert [18.2] 本稿では,FairMoEについて紹介する。FairMoEは,実験モジュールを階層的に混合し,グループ固有の学習者として機能するフレームワークである。
グループラベルに基づいてデータを厳格に割り当てる従来の方法とは異なり、FairMoEはデータを最も適した専門家に動的にルーティングする。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:42:00 GMT)
THCM-CAL: Temporal-Hierarchical Causal Modelling with Conformal Calibration for Clinical Risk Prediction [18.0] コンフォーマル因果モデルを用いた時間階層因果モデルTHCM-CALを提案する。
本フレームワークは,ノードが2つのモードから臨床エンティティを表現するマルチモーダル因果グラフを構築する。
階層的な因果発見を通じて、THCM-CALは、スライス内同一モダリティシークエンシング、スライス内相互モダリティトリガー、スライス間リスク伝播の3つの臨床基盤的相互作用を推測する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:43:42 GMT)
Federated Learning With Energy Harvesting Devices: An MDP Framework [17.9] フェデレートラーニング(FL)は、エッジデバイスがローカルなトレーニングを行い、パラメータサーバと通信することを要求する。
実用FLシステムにおける重要な課題は、バッテリ寿命を制限し、学習性能に影響を及ぼす、バッテリ制限のエッジデバイスが急速に枯渇することである。
FLシステムにエネルギー回収技術を導入し、環境エネルギーを捕捉し、エッジデバイスに連続的な電力を供給する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 06:59:52 GMT)
Exploring the Secondary Risks of Large Language Models [17.8] 良心的衝動時の有害または誤解を招く行動に特徴付けられる二次的リスクを導入する。
敵の攻撃とは異なり、これらのリスクは不完全な一般化から生じ、しばしば標準的な安全メカニズムを回避する。
本研究では,ブラックボックス型多目的検索フレームワークSecLensを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:39:53 GMT)
HIDE and Seek: Detecting Hallucinations in Language Models via Decoupled Representations [17.7] 現代言語モデル(LM)は、しばしば、入力コンテキストに事実的に不正確または不誠実なコンテンツを生成する。
Decoupled rEpresentations (HIDE) による効果的な幻覚検出のためのシングルパストレーニングフリーアプローチを提案する。
その結果、HIDEは、ほぼすべての設定において、他のシングルパスメソッドよりも優れています。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:02:49 GMT)
Exploring Strategies for Personalized Radiation Therapy Part I Unlocking Response-Related Tumor Subregions with Class Activation Mapping [17.4] 本研究は, 標準放射能, 勾配に基づく特徴, クラスアクティベーションマッピングにより強化された畳み込みニューラルネットワークという, 治療応答を予測するための3つのアプローチを比較する。
ガンマナイフ治療39例の脳転移69例について検討した。
Pixel wise CAMは、分類精度において放射能と勾配に基づく手法の両方に優れていた。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 01:24:25 GMT)
A Dual-Directional Context-Aware Test-Time Learning for Text Classification [17.4] 動的双方向エルマン注意ネットワーク(DBEAN)を提案する。
DBEANは双方向の時間的モデリングと自己注意を組み合わせる。
クリティカルな入力セグメントを動的に重み付けし、計算効率を維持する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:00:14 GMT)
Programmable-Room: Interactive Textured 3D Room Meshes Generation Empowered by Large Language Models [16.8] Programmable-Roomは、自然言語命令を与えられた3Dルームメッシュをインタラクティブに生成し、編集するフレームワークである。
部屋のそれぞれの属性を正確に制御するために、難易度タスクを、部屋メッシュの可塑性3D座標の作成など、より単純なステップに分解する。
統合されたフレームワークで様々な分解タスクをサポートするため、ビジュアルプログラミング(VP)を取り入れる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 13:00:06 GMT)
Towards Fundamental Limits for Active Multi-distribution Learning [16.6] 我々は,多分布学習のための新しいアルゴリズムを開発し,ラベルの複雑さを向上する。
実現可能な設定のバウンダリは情報理論的に最適であり、設定の$knu/varepsilon2$項は適切な学習者にとって基本的なものであることを示す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 06:08:58 GMT)
SCISSOR: Mitigating Semantic Bias through Cluster-Aware Siamese Networks for Robust Classification [16.6] ショートカット学習は、モデル一般化をアウト・オブ・ディストリビューションデータに損なう。
本稿では,SCISSOR(Semantic Cluster Intervention for Suppressing ShORtcut)を提案する。
コンピュータビジョンではChest-XRay,Not-MNIST,NLPタスクではGYAFC,Yelpの4つのベンチマークでSCISSORを評価した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:12:29 GMT)
SELFI: Selective Fusion of Identity for Generalizable Deepfake Detection [16.5] 顔認証はディープフェイク検出のための強力な信号を提供する。
偏見を減らすためにアイデンティティーの手がかりを抑えるものもあれば、法医学的な証拠としてそれらに依存するものもある。
textbfSELFI(textbfSELective textbfIdentity)を提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:11:35 GMT)
Log-Normal Multiplicative Dynamics for Stable Low-Precision Training of Large Networks [16.0] 神経科学の研究により、生物学的シナプスは、ノイズのある乗法動力学により遷移を説明できる対数正規分布に従うことが示されている。
人工ニューラルネットワークのための新しいLog-Normal Multiplicative Dynamics (LMD)アルゴリズムを提案する。
以上の結果より,低精度前方操作下でのスクラッチの安定かつ高精度なトレーニングを実現することが示唆された。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 17:37:22 GMT)
Physics-informed mixture of experts network for interpretable battery degradation trajectory computation amid second-life complexities [15.7] PIMOEは、部分的なフィールドアクセス可能な信号を用いて1サイクルでバッテリー劣化軌跡を計算する。
77の条件と67,902サイクルにわたる207個のバッテリーで検証されている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:26:59 GMT)
Balancing Interference and Correlation in Spatial Experimental Designs: A Causal Graph Cut Approach [15.6] 本稿では,実験データから得られる情報の量を最適化するための空間実験の設計に焦点を当てる。
因果効果推定器の平均二乗誤差(MSE)に対する代理関数を提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:42:50 GMT)
Improving Compiler Bug Isolation by Leveraging Large Language Models [14.7] 本稿では,AutoCBIという新しいコンパイラバグ分離手法を提案する。
我々は、広く使われているGCCおよびLLVMコンパイラの120の現実世界バグに対して、最先端のアプローチ(DiWi、RecBi、FuseFL)に対してAutoCBIを評価した。
特に、GCC/LLVMの上位1位では、AutoCBIは66.67%/69.23%、300%/340%、100%/57.14%のバグをRecBi、DiWi、FuseFLより分離している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 09:09:30 GMT)
RPLKG: Robust Prompt Learning with Knowledge Graph [14.5] CLIPのようなマルチモーダル事前トレーニングモデルでは、さまざまな実験でパフォーマンスが大幅に向上した。
既存の手法はしばしば解釈可能性に欠け、高い計算コストを課す。
本稿では,知識グラフを用いたロバスト・プロンプト学習(RPLKG)を提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:27:10 GMT)
Risk-Guided Diffusion: Toward Deploying Robot Foundation Models in Space, Where Failure Is Not An Option [14.2] 近年のジェネレーティブAI手法は,大規模・クロスボデーメントデータセットから意味的に認識されたナビゲーションポリシーを学習する。
人間の認知科学に触発されて、速く学習された「システム-1」と遅い物理ベースの「システム-2」を融合させるリスク誘導拡散フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:39:04 GMT)
May the Feedback Be with You! Unlocking the Power of Feedback-Driven Deep Learning Framework Fuzzing via LLMs [14.0] ディープラーニング(DL)フレームワークのバグを見つけるためのシンプルで効果的な方法はファズテスト(ファズリング)です。
本稿では,DLフレームワークに対するフィードバック駆動ファジィのシールを壊すためのFUELを提案する。
FUELはPyTorchとサマリーの104のバグを検出し、93が新たなバグとして確認され、47がすでに修正され、5がCVE IDに割り当てられた。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:51:53 GMT)
Self-Preference Bias in LLM-as-a-Judge [13.9] 大規模言語モデル(LLM)における自己参照バイアスを測定するための新しい指標を提案する。
以上の結果から, GPT-4は自己選好バイアスがかなり高いことが示唆された。
このことは、偏見の本質は難易度にあることを示唆し、自己選好バイアスは LLM がより親しみやすいテキストを好むため存在することを示唆している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:39:06 GMT)
Cross-Camera Distracted Driver Classification through Feature Disentanglement and Contrastive Learning [13.6] ドライバ行動監視ネットワーク(DBMNet)は軽量のバックボーンに依存しており、カメラのビュー情報を破棄するためにアンタングルモジュールを統合する。
DBMNetは、既存のアプローチと比較して、Top-1の精度が7%向上している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:43:18 GMT)
Reasoning Circuits in Language Models: A Mechanistic Interpretation of Syllogistic Inference [13.6] 言語モデル(LM)に関する最近の研究は、体系的な推論原理を学べるかという議論を巻き起こしている。
本稿では,シロメトリクス推論の機械論的解釈について述べる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 10:50:24 GMT)
The Hive Mind is a Single Reinforcement Learning Agent [13.3] 本論文はミツバチの群集における巣場選択の集団決定モデルから導いたものである。
本研究は, オンライン強化学習(RL)エージェントが複数の並列環境と相互作用し, 創発的分散認知が等価であることを示す。
我々の分析は、認知に制限された有機体群が、より複雑で強化可能な存在と同等である可能性を示唆している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 21:04:22 GMT)
LFR-PINO: A Layered Fourier Reduced Physics-Informed Neural Operator for Parametric PDEs [12.7] 物理インフォームド・ニューラル作用素はパラメトリック偏微分方程式を解くための強力なパラダイムとして登場した。
LFR-PINOは、2つの重要な革新をもたらす新しい物理インフォームドニューラル演算子である。
各ネットワーク層に対して特別なパラメータ生成を可能にする階層型ハイパーネットワークアーキテクチャと、パラメータ数を著しく削減する周波数領域削減戦略である。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 04:28:03 GMT)
CEGA: A Cost-Effective Approach for Graph-Based Model Extraction and Acquisition [12.7] モデル抽出攻撃(MEA)に対するGNNの脆弱性を評価する。
本稿では,非常に実用的で未探索なシナリオに適したノードクエリ戦略を提案する。
本手法は,複数の学習サイクルにまたがるノード選択機構を反復的に改良する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 13:11:42 GMT)
SynDaCaTE: A Synthetic Dataset For Evaluating Part-Whole Hierarchical Inference [11.9] 本稿では,シンダカテ(SynDaCaTE)と略してキャプションテストと評価のためのシンセティック・ダタセットを提案する。
置換同変自己アテンションは,部分間推論に極めて有効であることを示す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 03:01:16 GMT)
Taming OOD Actions for Offline Reinforcement Learning: An Advantage-Based Approach [11.8] オフライン強化学習(RL)は、オンラインインタラクションなしで、固定データセットから意思決定ポリシーを学ぶことを目的としている。
本稿では, OOD アクションを体系的に評価する新しい手法として, アドバンテージベースの拡散アクター・クリティカル (ADAC) を提案する。
ADACはD4RLベンチマークのほとんど全てのタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 13:05:20 GMT)
HalluRNN: Mitigating Hallucinations via Recurrent Cross-Layer Reasoning in Large Vision-Language Models [11.8] HalluRNNは繰り返しの層間推論によってモデルの安定性を向上させる。
DG-DPUモジュールのみを微調整することで、HaluRNNは複数のベンチマークで堅牢で堅牢なパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 04:56:55 GMT)
Learning Aerodynamics for the Control of Flying Humanoid Robots [11.8] 空飛ぶヒューマノイドロボットは、特に空気力学的力によって、モデリングと制御の課題に直面している。
技術的貢献には、ジェットエンジンのヒューマノイドロボットであるiRonCub-Mk1の機械設計が含まれる。
この科学的貢献は、古典的および学習技術を用いて空気力学的力をモデル化し、制御するための包括的なアプローチを提供する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 15:50:05 GMT)
RLRC: Reinforcement Learning-based Recovery for Compressed Vision-Language-Action Models [11.7] VLA(Vision-Language-Action Model)は、複雑なロボット操作タスクを解く上で、目覚ましい能力と有望な可能性を示してきた。
パラメータのかなりのサイズと高い推論レイテンシは、現実世界のデプロイメントに重大な課題をもたらします。
圧縮VLAの3段階回収法であるRLRCを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:45:32 GMT)
Stochastic Gradient Descent for Nonparametric Regression [11.2] 本稿では,非パラメトリック加法モデルをトレーニングするための反復アルゴリズムを提案する。
結果の不等式は、モデルの誤特定を可能にする託宣を満足していることが示される。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 03:14:14 GMT)
Truthful Elicitation of Imprecise Forecasts [11.2] 我々は,信頼の集合として与えられる不正確な予測を評価するための枠組みを提案する。
集約手順上でランダム化される適切なスコアリングルールを用いて,不正確予測の真正推論が達成可能であることを示す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 13:20:05 GMT)
List-Decodable Byzantine Robust PIR: Lower Communication Complexity, Higher Byzantine Tolerance, Smaller List Size [11.0] プライバシ保護プリミティブ(Private Information Retrieval, PIR)は、暗号におけるプライバシ保護プリミティブである。
本稿では,2つの完全リスト復号化可能なBRPIRスキームを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:52:24 GMT)
PiCo: Jailbreaking Multimodal Large Language Models via $\textbf{Pi}$ctorial $\textbf{Co}$de Contextualization [10.9] 先進MLLMにおける多層防御機構をバイパスする新しいジェイルブレイクフレームワークであるPiCoを提案する。
コードスタイルの視覚命令に有害な意図を埋め込むことで、Gemini-Pro Visionでは84.13%、GPT-4では52.66%のアタック成功率(ASR)を達成した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 04:48:47 GMT)
Protecting Your Voice: Temporal-aware Robust Watermarking [10.9] textbfunderline-aware textbfunderlineerlineust wattextbfunderlineermarking (emphTrue)
統合コンテンツ駆動エンコーダは、ウォーターマークされた波形再構成のために設計されている。
時間対応ゲート畳み込みネットワークは、ビットワイズで透かしを復元するように細心に設計されている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 15:59:07 GMT)
Toward Autonomous UI Exploration: The UIExplorer Benchmark [10.7] UIエクスプローラーベンチ(UIExplore-Bench)は、UI探索に特化した最初のベンチマークである。
ベンチマークでは、標準化されたGitLabサンドボックス環境において、構造化モード(DOMツリーのようなレイアウト情報へのアクセスをグラニングする)またはスクリーンモード(スクリーンショットやヒューマンライクなマウス/キーボードのインタラクションのようなGUIのみの観察に基づいて)のエージェントを3つのレベルにわたって評価している。
以上の結果から,UIExplore-AlGoは平均hUFOスコアを最大77.2%,スクリーンモードは最大59.0%,Sparseレベルは特に優れていた。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:16:27 GMT)
MDAA-Diff: CT-Guided Multi-Dose Adaptive Attention Diffusion Model for PET Denoising [10.5] そこで本研究では,多線量PET復調のための新しいCT-Guided Multi-Dose Adaptive Attention Denoising Diffusion Model (MDAA-Diff)を提案する。
提案手法は,低用量条件下での消音性能を向上させるために,解剖学的ガイダンスと線量レベル適応を統合した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:17:06 GMT)
Measuring and Augmenting Large Language Models for Solving Capture-the-Flag Challenges [10.5] CTFコンペティションはサイバーセキュリティ教育とトレーニングに不可欠である。
大規模言語モデル(LLM)が進化するにつれて、CTFの課題解決を自動化する能力への関心が高まっている。
我々はCTFAgentを提案する。CTFAgentはCTF問題解決のための新しいフレームワークである。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:56:20 GMT)
Prototypical Human-AI Collaboration Behaviors from LLM-Assisted Writing in the Wild [10.2] 大規模言語モデル(LLM)は、複雑な記述において、ニーズに合うように世代を操るために使用される。
本研究では,タスク作成に携わるユーザを対象に,この協調行動の大規模分析を行う。
そこで本研究では,LLMとユーザが対話する際の特徴的行動の同定を行った。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:54:21 GMT)
Reflective Verbal Reward Design for Pluralistic Alignment [10.2] 個人化報酬モデル学習のための新たな報酬モデリング手法を提案する。
提案手法は言語モデルを用いて,エージェントの振る舞いを批判し,嗜好を構築する反射的対話を通してユーザを誘導する。
対象者30名を対象に,非反射性言語報酬モデルよりも9~12%精度が向上した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:04:11 GMT)
A Multimodal In Vitro Diagnostic Method for Parkinson's Disease Combining Facial Expressions and Behavioral Gait Data [10.0] パーキンソン病(PD)は、患者とその家族の生活に重大な課題をもたらす。
In vitroでの診断は、非侵襲的な性質と低コストのために注目されている。
本稿では, 顔表情と行動歩行を利用して, PDのマルチモーダルインビトロ診断法を提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:20:46 GMT)
Risk Bounds For Distributional Regression [9.9] 連続ランクスコア(CRPS)と最悪の平均二乗誤差(MSE)に対して、一般的な上限が設定される。
シミュレーションデータと実データの両方の実験は、理論的な貢献を検証し、その実用性を実証した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:03:34 GMT)
DuaShepherd: Integrating Stepwise Correctness and Potential Rewards for Mathematical Reasoning [9.4] 本稿では,2つの相補的な報酬信号,正当性,ポテンシャルを統合した新たな報酬モデリングフレームワークを提案する。
これら2つの信号を複合確率に組み合わせることで,複数のベンチマークで一貫した性能向上を実現している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 01:11:01 GMT)
LLM-driven Medical Report Generation via Communication-efficient Heterogeneous Federated Learning [9.4] 我々は,医療報告生成(MRG)モデルのプライバシ保護,マルチセンター開発を可能にするフレームワークであるFedMRGを提案する。
FL-LLMチューニングにおける通信オーバヘッドの基本的な課題を低ランク因子化を用いて解決する。
MRGエンコーダにおけるクライアント認識のコントラスト学習によりFedMRGをさらに強化し,診断誘導のプロンプトを併用した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 03:13:08 GMT)
VLA-OS: Structuring and Dissecting Planning Representations and Paradigms in Vision-Language-Action Models [9.4] VLA-OSは,様々なタスク計画パラダイムを備えた統一型VLAアーキテクチャシリーズである。
様々な対象カテゴリ(剛体・変形可能)、視覚的モーダル性(2D・3D)、環境(シミュレーション・実世界)、エンドエフェクター(グリッパー・デキスタスハンド)の総合的な実験スイートを設計する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 03:07:48 GMT)
LaPuda: LLM-Enabled Policy-Based Query Optimizer for Multi-modal Data [9.4] 大規模言語モデル(LLM)は、機械学習とディープラーニングの分野で重要な瞬間となっている。
本稿では,LLM のクエリ最適化能力について検討し,新しい LLM とポリシーに基づくマルチモーダルクエリである LaPuda を設計する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:01:37 GMT)
3D Gaussian Splatting for Fine-Detailed Surface Reconstruction in Large-Scale Scene [9.3] 本稿では,大規模な表面を細部まで細部まで再現し,フルサイズの画像で観察する手法を提案する。
粗大なモデルを効率的に再構築するための粗大な戦略を導入し, 適応的なシーン分割とサブシーン精錬を行った。
無人航空機で撮影された公開データセット GauU-Scene V2 で実験が行われた。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:41:28 GMT)
Evaluating LLMs with Multiple Problems at once [9.2] 本稿では,複数の問題を同時に抱えたLLMの評価のメリットと実効性を示す。
我々はZeMPE(Zero-shot Multi-Problem Evaluation)と呼ばれる新しいベンチマークを導入する。
以上の結果から,LCMは単一データソースから複数の問題を処理できるだけでなく,個別に処理できるが,複数の問題処理能力に乏しい条件が存在することがわかった。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 20:28:53 GMT)
Robust Foreground-Background Separation for Severely-Degraded Videos Using Convolutional Sparse Representation Modeling [8.9] 本稿では、畳み込み表現(CSR)に基づく新しい前景モデルを用いた前景背景分離(FBS)手法を提案する。
2種類の劣化ビデオを用いた既存手法に比べて,本手法が優れていることを示す実験を行った。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:28:04 GMT)
Optimizing Mastery Learning by Fast-Forwarding Over-Practice Steps [8.7] ファストフォワードはオーバープラクティスを最大3分の1まで削減できる。
残りの全ての経路が完全にマスターされている場合、生徒が問題解決のステップを完了する必要はない。
ファストフォワードは学生の実践効率を向上させるかもしれないが、実践的な影響の大きさは学生のモチベーションを維持する能力にも依存する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 04:14:26 GMT)
ChildGuard: A Specialized Dataset for Combatting Child-Targeted Hate Speech [8.5] ChildGuardは、年齢層にまたがる、子供をターゲットにしたヘイトスピーチのさまざまなコンテキストを捉えている。
我々は、Large Language Models (LLMs)を含む既存の最先端のヘイトスピーチ検出手法をベンチマークする。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 10:53:17 GMT)
Trajectory Prediction for Autonomous Driving: Progress, Limitations, and Future Directions [8.4] 本稿では,既存の解を分類する分類法を提案する最近の軌道予測手法について概説する。
予測パイプラインの概観も提供されており、文献に存在する入力と出力のモダリティ、モデリング機能、予測パラダイムを網羅している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 17:15:03 GMT)
State Engineering of Unsteerable Hamiltonians [8.3] 開系のリンドブラディアン力学は、局所ハミルトニアンの非自明な基底状態に向けて多体系を操るために用いられる。
この研究は、強い相関状態の幅広いクラスの量子状態操作を研究するための体系的な概要を提供する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:39:23 GMT)
Benchmarking and Building Zero-Shot Hindi Retrieval Model with Hindi-BEIR and NLLB-E5 [8.2] Hindi-BEIRベンチマークを導入し,7つのタスクにまたがる15のデータセットについて検討した。
我々は,Hindi-BEIRベンチマークを用いた最先端多言語検索モデルの評価を行い,課題とドメイン固有の課題を特定する。
我々は,ヒンディー語学習データを必要とせずにヒンディー語をサポートするため,ゼロショットアプローチを利用する多言語検索モデルであるNLLB-E5を紹介する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 17:29:02 GMT)
AdRo-FL: Informed and Secure Client Selection for Federated Learning in the Presence of Adversarial Aggregator [8.2] Federated Learning (FL)は、クライアントのデータを公開することなく、協調学習を可能にする。
最近の研究は、敵アグリゲータがクライアントの選択を操作してバイパス保護を行う重大な脆弱性を示している。
本稿では,AdRo-FL(Adversarial Robust Federated Learning)を提案する。
AdRo-FLは、安全でないベースラインに比べて、最大で1.85タイム=高速なタイム・トゥ・精度、最大で1.06タイム=高い最終精度を実現している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 20:23:28 GMT)
Towards Deeper GCNs: Alleviating Over-smoothing via Iterative Training and Fine-tuning [7.8] Graph Convolutional Networks (GCNs) は、過度なスムーシングによるディープアーキテクチャのパフォーマンス低下に悩まされている。
本稿では,その表現能力を維持しつつ,深いGCNを段階的に構築する新たなトレーニング戦略である層ワイド・グラデュアル・トレーニング(LGT)を提案する。
LGTはベンチマークデータセットで最先端のパフォーマンスを実現し、32層設定でも精度を大幅に向上する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 04:09:02 GMT)
AdaptGOT: A Pre-trained Model for Adaptive Contextual POI Representation Learning [7.3] 本稿では,Adaptive表現学習技術とGeographical-Co-Occurrence-Text表現を統合したAdaptGOTモデルを提案する。
アダプGOTモデルは、(1)KNN、密度ベース、重要度ベース、カテゴリー認識といった高度な混合サンプリング手法を統合して複雑なコンテキスト近傍を捕捉するコンテキスト近傍生成、(2)高品質でカスタマイズされた表現を導出し、POI間の複雑な相互関係を効率的に捉えるように設計された注意機構によって強化された高度なGOT表現、(3)位相整合性を保証するMoEベースの適応エンコーダ・デコーダアーキテクチャ、の3つの主要な構成要素から構成される。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:06:06 GMT)
PAGENT: Learning to Patch Software Engineering Agents [7.1] 本報告では,7つのLLMコードエージェントが生成したパッチの欠陥について,実証的研究を行った。
パッチにまたがる障害原因の分類を提示する。
このような型関連エラーに対処する第一歩として,我々はPAGENT(パッチエージェント)を設計した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:00:00 GMT)
SAVANT: Vulnerability Detection in Application Dependencies through Semantic-Guided Reachability Analysis [7.0] Java開発におけるオープンソースのサードパーティライブラリの依存関係の統合は、重大なセキュリティリスクをもたらす。
Savantは、セマンティックプリプロセッシングとLLMによるコンテキスト分析を組み合わせて、正確な脆弱性検出を行う。
Savantは83.8%の精度、73.8%のリコール、69.0%の精度、78.5%のF1スコアを達成し、最先端のSCAツールを上回っている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 19:48:13 GMT)
Flatness After All? [6.7] 我々は、ヘッセンの柔らかいランク測度を用いて平坦度を測定することで一般化を評価することができると論じる。
非校正モデルに対しては、よく知られた竹内情報基準に平坦度尺度を接続し、過度に自信のないモデルに対する一般化ギャップの信頼性評価を行う。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 20:33:36 GMT)
Predicting Mild Cognitive Impairment Using Naturalistic Driving and Trip Destination Modeling [6.7] 本研究は,ネブラスカ州における高齢ドライバーの運転習慣を分析するために,自宅,職場,医療アポイントメント,社会活動,過激なジオハッシングなどの特定の旅行先を取り入れた新しいアプローチを提案する。
C5.0、ランダムフォレスト、サポートベクターマシンなどの先進的な機械学習モデルとデータ視覚化を組み合わせた2倍の方法論を用いて、認知障害の予測におけるこれらの位置ベース変数の有効性を評価した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 03:19:59 GMT)
ConsumerBench: Benchmarking Generative AI Applications on End-User Devices [6.6] クラウドのみの環境からエンドユーザデバイスに移行したGenerative AI(GenAI)アプリケーションは、リソース管理、システム効率、ユーザエクスペリエンスにおいて、新たな課題をもたらしている。
本稿では,エンドユーザーデバイス上で動作するGenAIモデルのシステム効率と応答時間を評価するための総合的なベンチマークフレームワークであるConsumerBenchを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 01:32:22 GMT)
Actionable Interpretability via Causal Hypergraphs: Unravelling Batch Size Effects in Deep Learning [6.6] ハイパーグラフベースの因果関係フレームワークであるHGCNetを導入し,バッチサイズが勾配雑音,ミニマシャープネス,モデル複雑性といった一般化にどのように影響するかを明らかにする。
do-calculusを用いて、バッチサイズの介入による直接的および媒介的効果を定量化し、最適化に関する解釈的、因果的な洞察を提供する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 21:38:43 GMT)
Non-asymptotic approximations of Gaussian neural networks via second-order Poincaré inequalities [6.5] NNの出力に対するQCLTを確立するための代替手法として,2次ポインカーの不等式(Poincar'e inequalities)を用いる方法を検討する。
NNの出力に対するQCLTの確立には,我々のアプローチがいかに有効かを示す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 10:53:24 GMT)
Curse of Dimensionality in Neural Network Optimization [6.5] 本稿では,所望の精度を達成するために必要な最適化において,次元の呪いの存在を示す。
局所リプシッツ連続活性化関数が用いられるとき、次元性の呪いは持続する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 12:43:59 GMT)
Research on Model Parallelism and Data Parallelism Optimization Methods in Large Language Model-Based Recommendation Systems [6.5] 推薦システムにおける大規模言語モデル (LLM) はますます顕著になっている。
本稿では,最適化手法の2つのクラス,モデル並列性とデータ並列性について系統的に検討する。
シミュレーションサービス環境における実世界のレコメンデーションデータセットを用いて行った実験は、提案したハイブリッド並列化スキームがトレーニングスループットを30%以上向上することを示した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:37:25 GMT)
Recursive Gaussian Process State Space Model [6.4] 動作領域とGPハイパーパラメータの両方に適応可能な新しいオンラインGPSSM法を提案する。
ポイントを誘導するオンライン選択アルゴリズムは、情報的基準に基づいて開発され、軽量な学習を実現する。
合成データセットと実世界のデータセットの総合的な評価は,提案手法の精度,計算効率,適応性を示す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 15:06:18 GMT)
LoLA-SpecViT: Local Attention SwiGLU Vision Transformer with LoRA for Hyperspectral Imaging [6.4] 軽量なスペクトルビジョン変換器であるtextbfLoLA-SpecViT (Low-rank adaptation Local Attention Spectral Vision Transformer) を提案する。
提案モデルでは,3次元畳み込みスペクトルフロントエンドと局所窓ベースの自己アテンションを組み合わせ,スペクトル特徴抽出と空間一貫性の両立を図る。
我々のフレームワークは、農業、環境モニタリング、リモートセンシング分析における実世界のHSIアプリケーションに対して、スケーラブルで一般化可能なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:46:00 GMT)
CodeMorph: Mitigating Data Leakage in Large Language Model Assessment [6.3] コードのための大規模言語モデルのベンチマークリークに関する懸念は、データ汚染とインフレーションされた評価指標の問題を提起している。
我々は、複数のプログラミング言語をサポートするために設計されたアプローチであるCodeMorphを提案し、データ漏洩を軽減するために、ファイル間の依存関係を保存する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:04:12 GMT)
Taming the Untamed: Graph-Based Knowledge Retrieval and Reasoning for MLLMs to Conquer the Unknown [6.2] マルチモーダルな大言語モデル(MLLM)は、限られた関連する知識のため、ほとんど遭遇しないドメイン固有のタスクで失敗することが多い。
マルチモーダル・ナレッジグラフ (MH-MMKG) を構築し, マルチモーダルと複雑な実体関係を包含する。
また,MH-MMKGに基づく複雑な知識検索と推論のためのモデルの能力を評価するために,一連の挑戦的なクエリを設計する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:01:02 GMT)
Research on the recommendation framework of foreign enterprises from the perspective of multidimensional proximity [6.0] 本研究は、多次元近接理論を用いて、高品質な海外出資企業の選定基準を検討する。
現地の産業戦略に沿った企業を 特定する。
複数基準の意思決定分析では、トップ5の企業が地域投資の最も適した候補としてランク付けされている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 09:29:51 GMT)
Learning Personalized Utility Functions for Drivers in Ride-hailing Systems Using Ensemble Hypernetworks [5.8] 配車システムでは、ドライバーは注文特性、交通条件、個人の嗜好などの要因に基づいて、乗車要求を受理するか拒否するかを決定する。
ランダムユーティリティ最大化(Random Utility Maximization)アプローチのような伝統的なモデルは、典型的には、属性間の線形相関を仮定してドライバの判断を予測する。
ハイパーネットワークとアンサンブル学習を用いて,パーソナライズされたユーティリティ関数を学習する手法を開発した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 10:16:34 GMT)
Data Quality Issues in Multilingual Speech Datasets: The Need for Sociolinguistic Awareness and Proactive Language Planning [5.7] いくつかの言語では、Mozilla Common Voice 17.0、FLEURS、VoxPopuliデータセットが重大な品質問題に悩まされている。
マクロレベルの問題は、制度化されていない、しばしばリソース不足の言語でより一般的であることが分かりました。
今後のデータセット開発においてこれらの問題を緩和するためのガイドラインと勧告を提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 00:34:18 GMT)
Steerable Transformers for Volumetric Data [5.6] 本稿では, ステアブル・コンボリューションによって抽出された特徴に作用する同変アテンション機構を提案する。
2次元と3次元の両方の実験により、ステアブルな畳み込みネットワークにステアブルなトランスフォーマー層を追加することにより、性能が向上することが示された。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 19:41:45 GMT)
Regular Tree Search for Simulation Optimization [5.5] 本稿では,適応サンプリングと探索空間分割を統合した正規木探索というランダムアルゴリズムのクラスを提案する。
我々は、目的関数の連続性を必要とせず、最適性ギャップを含む仮定に基づいて、準ガウス雑音の下でのグローバル収束を証明した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 12:07:01 GMT)
Fetuses Made Simple: Modeling and Tracking of Fetal Shape and Pose [5.5] Skinned Multi-Person Linear Model (SMPL) に基づく3次元統計的胎児体モデルを提案する。
提案アルゴリズムは、画像空間における身体のポーズと、標準ポーズ空間における身体形状を反復的に推定する。
本モデルでは,時系列を通して身体の形状や動きを捉え,直感的に可視化する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 23:45:35 GMT)
LastingBench: Defend Benchmarks Against Knowledge Leakage [5.5] 大規模言語モデル(LLM)の複雑さは、タスク固有のデータを記憶することで、標準的な質問回答(QA)ベンチマークで"熱"する能力に関する懸念を提起する。
これは、真のモデル機能ではなく、データ漏洩の影響を反映しているため、ベンチマーク評価の妥当性を損なう。
LastingBenchは、知識リークに対して既存のベンチマークを継続的に強化し、保護するために設計された、新しいフレームワークである。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 13:01:04 GMT)
Rethinking the Role of Operating Conditions for Learning-based Multi-condition Fault Diagnosis [5.4] 産業システムでは多条件故障診断が一般的であり,従来の診断手法には大きな課題がある。
近年の深層学習の進展に伴い,多条件故障診断のパラダイムとして,伝達学習が断層診断分野に導入されている。
本稿では, 可変速度および可変負荷シナリオにおいて, 様々な条件下でのエンド・ツー・エンド領域の一般化手法の性能について検討する。
2段階の診断フレームワークが提案され,運用条件に著しい影響のあるシナリオ下での故障診断性能の向上を目的としている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 15:34:51 GMT)
HIRE: Lightweight High-Resolution Image Feature Enrichment for Multimodal LLMs [5.4] 我々は,高分解能な特徴生成の自然な拡張として,特徴アップサンプリングの直感性を開発する。
本研究では,浅部機能拡張器がトレーニング時間や推論時間を大幅に削減し,計算コストを抑えることにより,競争結果の達成を実証する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 06:13:56 GMT)
DRAMA-X: A Fine-grained Intent Prediction and Risk Reasoning Benchmark For Driving [5.4] 既存のベンチマークでは、安全クリティカルな状況下でのマルチクラスの意図予測は評価されていない。
DRAMAデータセットから構築した詳細なベンチマークであるDRAMA-Xを紹介する。
我々は,エゴ車の推論パイプラインを反映した軽量でトレーニング不要なフレームワークであるSGG-Intentを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:01:42 GMT)
A novel fast short-time root music method for vibration monitoring of high-speed spindles [5.0] 本稿では,FFT高速化したLaczosの対角化を利用して計算複雑性を低減する高速短時間ルートMUMU (fSTrM) を提案する。
本研究では,fSTrMが1.2Hzの周波数分解能(vs.12.5 Hz),93%の検知レートを5dB SNRで達成し,高調波コンテンツ解析により欠陥重大度を定量化することを示した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:35:38 GMT)
Infected Smallville: How Disease Threat Shapes Sociality in LLM Agents [5.0] 生成因子をベースとしたモデルを用いて,行動免疫系の仮説を検証した。
感染発生のニュースを読むエージェントは、そのようなニュースを受け取らなかったエージェントに比べて、社会的エンゲージメントが著しく低下した。
本研究は,複雑な社会動態を大規模に探索する実験ツールとしてのGABMの可能性を明らかにするものである。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 00:28:08 GMT)
The Evolution of Natural Language Processing: How Prompt Optimization and Language Models are Shaping the Future [5.0] 大規模言語モデル(LLM)は自然言語処理(NLP)の分野に革命をもたらした。
LLMによる迅速なエンジニアリングとその後の最適化戦略のアイデアは、様々なNLPタスク間で大きなパフォーマンス向上をもたらす、特に影響のあるトレンドとして現れている。
本稿では,多種多様な最適化戦略の可能性について,一意かつ包括的な知見を提供する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 12:25:37 GMT)
Adaptive Multi-prompt Contrastive Network for Few-shot Out-of-distribution Detection [4.9] アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)データセットでトレーニングされたモデルが利用できない出力を生成するのを防ぐために、アウト・オブ・ディストリビューション(OOD)サンプルを区別する試みである。
ほとんどのOOD検出方法は、トレーニングのために多くのIDサンプルを必要とし、実際の応用を著しく制限する。
クラス間およびクラス内分布の学習により,ID-OOD分離境界に適応する適応型マルチプロンプトコントラストネットワーク(AMCN)を提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:31:29 GMT)
LLM-Prompt: Integrated Heterogeneous Prompts for Unlocking LLMs in Time Series Forecasting [4.9] 時系列予測は、変数間の時間的依存関係を将来の状態推論のためにモデル化することを目的としている。
近年の研究では,大規模言語モデル (LLM) が時系列予測において有望な性能を達成することが示されている。
マルチプロンプト情報とモーダル間セマンティックアライメントを組み合わせたLLMベースの時系列予測フレームワークLLM-Promptを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:22:25 GMT)
Residual Connection-Enhanced ConvLSTM for Lithium Dendrite Growth Prediction [4.9] リチウムデンドライトの成長は、充電可能な電池の性能と安全性に大きな影響を及ぼす。
本研究では,デンドライト成長パターンの予測モデルを提案し,精度と計算効率を向上した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:27:59 GMT)
The value of human and machine in machine-generated creative contents [4.8] 機械生成コンテンツからの「想像」と「創造性」は、機械の達成に悪影響を及ぼすべきではない。
人間の解釈がなければ、機械が生成した内容は大きな言語モデルの想像上の空間に残る。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 20:32:07 GMT)
Novel Multicolumn Kernel Extreme Learning Machine for Food Detection via Optimal Features from CNN [4.8] 本稿では,効率的なニューラルネットワークから最適な特徴を抽出し,選択するためのハイブリッドフレームワークを提案する。
我々は,カーネル極端学習機械(KELM)を非線形決定境界と優れた一般化能力により活用する。
提案するフレームワークの評価には、9つのパブリックデータセットを使用して、大規模な食品/食品以外のデータセットを用意している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 04:54:04 GMT)
Research on Low-Latency Inference and Training Efficiency Optimization for Graph Neural Network and Large Language Model-Based Recommendation Systems [4.6] 本研究では、ハイブリッドグラフニューラルネットワーク(GNN)とLarge Language Model(LLM)ベースのレコメンデータシステム(ReS)における計算ボトルネックについて考察する。
FPGAとLoRAをリアルタイムデプロイメントに使用することを推奨している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 03:10:50 GMT)
Safe Pruning LoRA: Robust Distance-Guided Pruning for Safety Alignment in Adaptation of LLMs [4.6] Low-Rank Adaptation (LoRA) を用いた細調整大型言語モデル(LLM)は、計算コストを削減しつつ適応性を向上する。
既存の安全アライメント手法は、複雑なパラメータシフトを捉えるのに苦労し、最適化された安全性とユーティリティのトレードオフにつながる。
安全性を弱めるLoRA層を選択的に除去する新しいプルーニングベースアプローチであるSafe Pruning LoRA(SPLoRA)を提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 14:59:54 GMT)
Physics-informed KAN PointNet: Deep learning for simultaneous solutions to inverse problems in incompressible flow on numerous irregular geometries [4.5] Kolmogorov-Arnold Networks (KAN) は、従来の多層パーセプトロン(MLP)の代替として注目されている。
本稿では,計算領域の幾何学的特徴を捉えるために,共有kansをPointNetアーキテクチャに統合する物理インフォームドポイントネット(PI-KAN-PointNet)を紹介する。
PI-KAN-PointNetは、特に非滑らかな幾何学を含む未知の境界条件の値に対して、より正確な予測をもたらす。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 19:18:19 GMT)
Scalable Machine Learning Algorithms using Path Signatures [4.4] この論文は、スケーラブルな機械学習パイプラインにおいて、パスシグネチャの表現力を利用する方法を研究する。
理論的ロバスト性と計算効率を組み合わせ、粗い経路理論と確率論的モデリング、ディープラーニング、カーネルメソッドをブリッジする一連のモデルを導入している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:36:34 GMT)
Deep Binding of Language Model Virtual Personas: a Study on Approximating Political Partisan Misperceptions [4.2] 大規模言語モデル(LLM)は、人間の振る舞いをシミュレートする能力が高まっている。
本稿では, マルチターンインタビュー文として, 合成ユーザバックストリーを用いた仮想ペルソナ構築手法を提案する。
我々の生成したバックストリーはより長く、細部が豊富で、特定の個人を記述するのに一貫性がある。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 03:50:53 GMT)
UIShift: Enhancing VLM-based GUI Agents through Self-supervised Reinforcement Learning [4.2] GUIエージェントのための効果的なビジョン言語モデル(VLM)のトレーニングは通常、大規模な注釈付きデータセットよりも教師付き微調整(SFT)に依存している。
本稿では,その遷移の原因となる動作を推定することにより,VLMがGUIトランジションペアから学習できるようにする,自己教師型逆動的タスクを提案する。
VLMベースのGUIエージェントを自己教師付き強化学習により拡張するフレームワークであるUI-shiftを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:05:57 GMT)
Enhancing Glucose Level Prediction of ICU Patients through Hierarchical Modeling of Irregular Time-Series [4.1] 本研究は, ICU患者における血糖値の予測を目的としたMulti-source Irregular Time-Series Transformer (MITST) を提案する。
MITSTは様々な臨床データ(検査結果、薬品、バイタルサインを含む)を事前に定義された集計なしで統合する。
MITSTは、AUROCで1.7ポイント(pp)、AUPRCで1.8ppという統計学的に有意な(p 0.001 )改善を達成している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:18:52 GMT)
Can Generated Images Serve as a Viable Modality for Text-Centric Multimodal Learning? [4.0] 本研究は,テキスト・トゥ・イメージ(T2I)モデルにより生成した画像が,テキスト中心のタスクにおいて重要な相補的モダリティとして機能するかどうかを体系的に検討する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:32:09 GMT)
EQuARX: Efficient Quantized AllReduce in XLA for Distributed Machine Learning Acceleration [3.8] TPU用のXLAコンパイラ(EQuarX)内で、ネイティブな動的ブロックワイドな量子化AllReduceを提案する。
TPUフレンドリーな量子化と通信と計算の深いパイプライン化により、t8精度のEQuARXはベースラインのBF16 AllReduceよりも1.8倍のスピードアップを達成する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 06:54:52 GMT)
Bayesian Social Deduction with Graph-Informed Language Models [3.8] 社会的推論は、大きな言語モデルにとって難しい課題である。
本稿では,信念推論を構造化確率モデルに外部化するハイブリッド推論フレームワークを提案する。
提案手法はエージェント・エージェント・プレイにおけるより大きなモデルとの競合性能を実現する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:45:28 GMT)
FaithfulSAE: Towards Capturing Faithful Features with Sparse Autoencoders without External Dataset Dependencies [3.7] 本稿では,モデル自身の合成データセット上でSAEを学習するFithfulSAEを提案する。
より低OOD命令データセット上でのSAEのトレーニングにより,SAEの種子間安定性が向上することが実証された。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 10:18:25 GMT)
AbRank: A Benchmark Dataset and Metric-Learning Framework for Antibody-Antigen Affinity Ranking [3.7] AbRankは、アフィニティ予測をペアのランキング問題として再設定する大規模なベンチマークと評価フレームワークである。
グラフベースのアプローチであるWALLE-Affinityを導入し、タンパク質言語モデルの埋め込みを構造情報と統合し、相互結合の嗜好を予測する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 23:34:46 GMT)
Exploiting Efficiency Vulnerabilities in Dynamic Deep Learning Systems [3.6] 本研究は,ディープラーニングシステム(DDLS)における動的挙動のセキュリティへの影響について検討する。
我々は、現在のシステムが、敵入力によって悪用可能な効率上の脆弱性をいかに公開しているかを示す。
本稿では,現代DDLSに対する効率攻撃の実現可能性について検討し,目標防衛を開発することを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:13:14 GMT)
Enhancing Stress-Strain Predictions with Seq2Seq and Cross-Attention based on Small Punch Test [3.5] 本稿では,SPT負荷変位データから高強度鋼の真の応力-ひずみ曲線を予測するための新しいディープラーニング手法を提案する。
提案手法では,Gramian Angular Field (GAF) を用いてロード置換シーケンスを画像に変換し,空間的特徴をキャプチャし,LSTMに基づくエンコーダデコーダアーキテクチャを備えたSequence-to-Sequence(Seq2Seq)モデルを用いる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 11:14:54 GMT)
The World Wide recipe: A community-centred framework for fine-grained data collection and regional bias operationalisation [3.5] 本稿では,文化に配慮した参加型データ収集のためのフレームワークであるWorld Wideのレシピを紹介する。
バイアス運用を分析して、現在のシステムがいくつかの次元でどのようにパフォーマンスが低下しているかを強調します。
これらのT2Iモデルは、一般的に、各地域固有の料理の品質のアウトプットを生成しない。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:40:59 GMT)
SSAVSV: Towards Unified Model for Self-Supervised Audio-Visual Speaker Verification [3.4] 非対称なマスキングとマスク付きデータモデリングを用いたコントラスト学習に基づく自己教師付き学習フレームワークを提案する。
我々は、音声と視覚入力のための単一の共有バックボーンを用いて、自己教師型音声視覚話者検証のための統合されたフレームワークを用いる。
本手法は,従来の手法に比べて計算コストを低減しつつ,ラベル付きデータを使わずに競争性能を向上する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 12:02:53 GMT)
Enhancing Few-shot Keyword Spotting Performance through Pre-Trained Self-supervised Speech Models [3.3] キーワードスポッティングは、バッテリー駆動エッジデバイスに対するハンズフリーインタラクションを可能にする上で重要な役割を果たす。
本研究では,自己指導型学習モデルを用いて,ロバストな特徴抽出,次元縮小,知識蒸留を行う訓練手法を提案する。
提案手法は,Multilingual Spoken Words Corpus (MSWC) とGoogle Speech Commands (GSC) データセットの英語部分に対して評価を行った。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 11:39:11 GMT)
How to Train Your Multi-Exit Model? Analyzing the Impact of Training Strategies [3.2] 早期の出口は、トレーニング可能な内部分類器をバックボーンネットワークにアタッチすることで、ネットワークの前方通過が早期に終了することを可能にする。
既存のアーリーエグジット法は、一般的には、バックボーンと出口ヘッドを同時に訓練するジョイントトレーニングアプローチ、またはヘッドを別々に訓練するディスジョイントアプローチを採用する。
本稿では,早期からのトレーニングダイナミクスを分析し,トレーニング戦略の選択を導くための指標について紹介する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 10:00:51 GMT)
Causal Spherical Hypergraph Networks for Modelling Social Uncertainty [3.0] 本稿では,社会基盤予測の枠組みであるCausal Spherical Hypergraph Networks(Causal-SphHN)を提案する。
提案手法は, 個人を超球面埋め込みとして, グループコンテキストをハイパーエッジとして表現し, 意味的および関係的幾何を捉える。
SNARE(オフラインネットワーク)、PHEME(オンライン談話)、AMIGOS(マルチモーダル・エフェクト)の実験は、Causal-SphHNが強いベースライン上での予測精度、堅牢性、キャリブレーションを改善することを示した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:30:04 GMT)
Evaluating Sensitivity Parameters in Smartphone-Based Gaze Estimation: A Comparative Study of Appearance-Based and Infrared Eye Trackers [2.9] 本研究では,スマートフォンを用いた深層学習眼球追跡アルゴリズムの評価を行い,その性能を市販の赤外線眼球追跡装置と比較した。
本研究の目的は,現実的なモバイル利用条件下での外観に基づく視線推定の実現可能性を検討することである。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:46:23 GMT)
Large Language Model Guided Self-Debugging Code Generation [2.8] PyCapsuleはPythonコード生成の新しいフレームワークである。
プロンプト推論、反復的なエラー処理、ケーステストなどが特徴である。
HumanEvalで最大5.7%、HumanEval-ETで最大10.3%、BigCodeBenchで最大24.4%を達成している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:27:49 GMT)
Democracy of AI Numerical Weather Models: An Example of Global Forecasting with FourCastNetv2 Made by a University Research Lab Using GPU [2.6] 本稿では,大学研究グループ間でAIによる世界天気予報モデルの民主化の可能性を示す。
グラフィックス処理ユニット(GPU)とNVIDIAのFourCastNetv2のような無償のAIモデルを活用しています。
i)FourCastNetv2を活用して、指定されたアプリケーションプログラミングインターフェース(API)を介して予測を作成すること、(ii)NVIDIAハードウェアを使用して、オリジナルのFourCastNetモデルをトレーニングすることの両方を実証する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 00:51:40 GMT)
Inference-Time Gaze Refinement for Micro-Expression Recognition: Enhancing Event-Based Eye Tracking with Motion-Aware Post-Processing [2.5] イベントベースの視線追跡は、きめ細かい認知状態の推測に重要な可能性を秘めている。
本稿では、既存の事象に基づく視線推定モデルの出力を高めるために、モデルに依存しない推論時間改善フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 11:04:09 GMT)
Tunable Antichiral Hinge State in Photonic Synthetic Dimensions [2.4] 両面/バルクディラック点がヒンジ状態によって接続されている3次元高次トポロジ絶縁体/セミメタールにおいて,反キラルヒンジ状態が出現することを提案する。
合成次元に沿って所望の可変トンネルを生成するための長手および電気光学変調器を導入する。
我々の研究は、新しいトポロジカル物質とそのデバイス応用を探求する道を開く、頑丈で調整可能なヒンジステートトランスポートを提示する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 08:54:29 GMT)
Fuzzing-based Mutation Testing of C/C++ CPS [2.4] CとC++ソフトウェアの最先端の突然変異テスト技術は、シンボリック実行に依存している。
本稿では,C および C++ ソフトウェアにおけるファジテストの有効性を実証したファジテストに依存することを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:57:49 GMT)
Optically tunable linear and nonlinear enhancement of index of refraction [2.4] 屈折率調整による材料の光学特性の制御は、現在の最先端技術に革命をもたらし、高損失媒体における光伝搬を制御できる。
量子力学的手法を用いて, 線形および非線形条件下での屈折率(EIR)向上のためのプラズモニックアナログの光学的チューニングを実演する。
提案手法は, 屈折率を全光学的に調整し, プラズマナノ構造の光学特性をコヒーレントに制御し, 損失補償伝搬とゼロインデックスを高屈折率・高屈折率プラズマメタマテリアルに応用する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 12:39:40 GMT)
ZigzagPointMamba: Spatial-Semantic Mamba for Point Cloud Understanding [2.1] PointMambaのような状態空間モデル(SSM)は、ポイントクラウドの自己教師型学習のための効率的な特徴抽出を可能にする。
既存のPointMambaベースの手法は、複雑なトークン順序付けとランダムマスキングに依存している。
これらの課題に対処するためにZigzagPointMambaを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 17:43:01 GMT)
On the non-Markovian quantum control dynamics [2.1] 非マルコフ量子力学の開ループ制御と閉ループ計測フィードバック制御について検討する。
量子空洞電気力学(Cavity-QED)システムを例に挙げる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:05:30 GMT)
Do LLMs Know When to Flip a Coin? Strategic Randomization through Reasoning and Experience [1.7] 戦略的ランダム化はゲーム理論の鍵となる原理であるが、大きな言語モデル(LLM)では未探索のままである。
我々は,天地競馬に触発された新たなゼロサムゲームを提案し,ナッシュ均衡は最大エントロピー戦略に対応する。
より弱いモデルはプロンプトによらず決定論的であることを示し、強いモデルは明示的なヒントの下でランダム化を増大させることを示した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:26:33 GMT)
PhysID: Physics-based Interactive Dynamics from a Single-view Image [1.7] 単一視点画像から物理に基づくインタラクティブなダイナミクスの作成を効率化するPhysIDを提案する。
物理的に妥当なリアルタイムレンダリングを実現するために,デバイス上の物理ベースのエンジンをユーザインタラクションと統合する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 15:57:58 GMT)
Efficient Multi-Task Inferencing with a Shared Backbone and Lightweight Task-Specific Adapters for Automatic Scoring [1.3] 本稿では,タスク固有の微調整のための軽量LoRAアダプタにより拡張された共有バックボーンモデルアーキテクチャを提案する。
GPUメモリ消費を60%削減し、推論遅延を40%削減しながら、競争力のあるパフォーマンスを実現している。
この結果は、自動スコアリングシステムにおける公正性と透明性を維持しながら、学習結果を向上するスケーラブルなAIの可能性を強調している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 20:56:52 GMT)
DrivAer Transformer: A high-precision and fast prediction method for vehicle aerodynamic drag coefficient based on the DrivAerNet++ dataset [1.2] 本研究では、DrivAer Transformerと呼ばれるポイントクラウド学習フレームワークを提案する。
DAT構造はDrivAerNet++データセットを使用しており、産業標準の3D車両形状の高忠実なCFDデータを含んでいる。
この枠組みは車両設計プロセスの加速と開発効率の向上が期待されている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:51:51 GMT)
Learning to Dock: A Simulation-based Study on Closing the Sim2Real Gap in Autonomous Underwater Docking [1.1] 各種コントローラの訓練を通じて,自律ドッキングにおけるシム2リアルギャップの低減に関するシミュレーション研究を行う。
私たちは、元々のトレーニングディストリビューションの外部にある可能性のある、さまざまなペイロードの下でドッキングするという現実的な課題に重点を置いています。
本研究は,ドッキングコントローラのトレーニングにおいて,シミュリアルギャップを緩和するための知見を提供する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 21:32:06 GMT)
Regulation Compliant AI for Fusion: Real-Time Image Analysis-Based Control of Divertor Detachment in Tokamaks [1.0] 本研究は, 分散器分離制御を成功させるために, リアルタイムAIにより実現された線形・解釈可能な制御系を実装し, 検証する。
本研究は, 離着陸と再離着陸の両目的に対して, 目標から平均2%の絶対差を持つフィードバック分岐器の離着陸制御を実証する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:21:26 GMT)
Structural restrictions in local causal discovery: identifying direct causes of a target variable [0.9] 観測的関節分布から対象変数の直接的な原因の集合を学ぶことは、科学の基本的な問題である。
ここでは、完全なDAGではなく、1つのターゲット変数の直接的な原因を特定することにのみ関心があります。
これにより、識別可能性の仮定を緩和し、より高速で堅牢なアルゴリズムを開発することができる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 17:16:22 GMT)
An intelligent tutor for planning in large partially observable environments [0.9] 本研究では,部分的に観測可能な環境下での計画のための知的チューターを開発し,評価する。
計画戦略を教えるための知的家庭教師と比べ、この新しい知的家庭教師は2つの革新を組み合わせている。
330人の参加者による事前登録実験では、新しいインテリジェントチューターは、部分的に観察可能な環境で良い判断を下す能力を向上させるのに非常に効果的であることが示された。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 12:40:16 GMT)
Probing for Phonology in Self-Supervised Speech Representations: A Case Study on Accent Perception [0.9] 本研究では,音韻的特徴レベルの変化が音節アクセントの知覚にどのように影響するかを検討する。
本研究は,ヒンディー語母語話者の英語で一意に生成する,ラビオ・アポキシマント,ラピオ・タップ,レトロフレックス・ストップの3つのセグメントに着目した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 01:44:19 GMT)
Is Your Automated Software Engineer Trustworthy? [0.9] 大規模言語モデル(LLM)は、ソフトウェア工学のタスクでますます使われています。
LLMはすべての問題に応答し、入力があいまいであったり、出力が間違っていたとしても、すべてのケースに対してパッチを生成する。
これは、幻覚的なコード変更や、あいまいな問題レポートに基づいたレスポンスといった、信頼性の低い振る舞いにつながります。
我々は、LLMベースのソフトウェアエージェントが入力が未定義の場合に動作しないかどうかを評価するベンチマークであるBouncerBenchを紹介する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 20:56:20 GMT)
Triadic Novelty: A Typology and Measurement Framework for Recognizing Novel Contributions in Science [0.8] 既存のメトリクスは、新奇さと人気を両立させ、それらに挑戦する人たちよりも既存のパラダイムに適合するアイデアを弱めます。
本研究は, 異なるタイプの新規性が出現し, 保持され, 認識されるかをよりよく理解するために, 理論駆動の枠組みを開発する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 23:09:04 GMT)
Reinforcing User Interest Evolution in Multi-Scenario Learning for recommender systems [0.8] 現実世界のレコメンデーションシステムでは、ユーザーはホームページ、検索ページ、関連するレコメンデーションページなどの様々なシナリオに従事している。
ユーザの関心は、意思決定プロセスと嗜好表現の違いにより、さまざまなシナリオで矛盾する可能性がある。
本稿では,複数のシナリオにまたがるユーザ関心の進化をモデル化することにより,シナリオ間でのユーザの嗜好をモデル化する新しい強化学習手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 11:27:53 GMT)
Experimental Evidence for the Propagation and Preservation of Machine Discoveries in Human Populations [0.7] 超人的な能力を持つインテリジェントマシンは、人間の発見を超えた問題解決戦略を明らかにする可能性がある。
我々は、機械が人間の問題解決に根本的な影響を及ぼすための3つの重要な条件を特定した。
これらの条件が満たされれば、マシンが発見した戦略を人によって伝達し、理解し、保存することができることを実証する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 15:38:26 GMT)
Out of Control -- Why Alignment Needs Formal Control Theory (and an Alignment Control Stack) [0.7] このポジションペーパーでは、形式的最適制御理論はAIアライメント研究の中心となるべきであると論じている。
それは、一般的なAIの安全性とセキュリティのアプローチとは異なる視点を提供する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:45:19 GMT)
Robust LLM Unlearning with MUDMAN: Meta-Unlearning with Disruption Masking And Normalization [0.6] 言語モデルは、広範囲の安全性を調整した後でも、危険な知識とスキルを保持することができる。
近年の研究では、特別な未学習の方法であっても容易に逆転できることが示されている。
Disruption Maskingは、ウェイトを更新するだけを可能にするテクニックです。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 10:40:17 GMT)
Residue Number System (RNS) based Distributed Quantum Multiplication [0.5] 本稿では,Residue Number System(RNS)に基づく分散量子乗法を提案する。
我々は、量子リソース使用量の推定を行い、既存の分散量子乗算器の6から16キュービットの出力と比較する。
我々の比較分析では、トフォリの深さは46.018%、Tゲートの減少は34.483%から86.25%と推定されている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:00:03 GMT)
Quantum-Hybrid Support Vector Machines for Anomaly Detection in Industrial Control Systems [0.4] 本研究では,CPS(Cyber-Physical Systems)の3つの一般的なデータセットを用いた量子ハイブリッド支援ベクトルマシン(QSVM)のパラメータ化に焦点を当てた。
その結果、QSVMは従来のカーネルメソッドよりも優れており、F1スコアは13.3%高い。
この取り組みは、QSVMがICSの異常検出において大きなアドバンテージを提供し、最終的に重要なインフラストラクチャのセキュリティと整合性を高めることを示唆している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 21:37:26 GMT)
Steering LLMs for Formal Theorem Proving [0.3] 大規模言語モデル(LLM)は、Leanのような証明アシスタントを使って形式的な定理を証明することを約束している。
LLMは正しい戦術を予測できるが、候補戦術の範囲内で適切にランク付けする上での課題に直面している。
我々は、アクティベーションステアリングを用いてLSMの応答を誘導し、推論時の世代を改善する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:24:27 GMT)
Quasiparticle Dynamics in NbN Superconducting Microwave Resonators at Single Photon Regime [0.3] NbN超伝導マイクロ波導波路共振器の性能に及ぼす準粒子エネルギーの影響について検討した。
準粒子動力学の影響を評価するため, 温度変動に対応する共振周波数と内部品質係数を測定した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 21:14:55 GMT)
A Solvable Semi-infinite Fock-state-lattice SSH Model: the Stable Topological Zero Mode and the Non-Hermitian Bound Effect [0.2] 半無限FSLに基づくSu-Schrieffer-Heeger(SSH)モデルのHermitian領域および非Hermitian領域における位相特性について検討した。
従来のSSHモデルよりも安定な位相零モードが見出され、固有領域壁の境界状態から導かれる。
我々の研究は、有望なFSLシミュレータに基づく無限異方性トポロジモデルにおいて、ユニークなトポロジ特性を探求する第一歩を踏み出す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 13:12:08 GMT)
Auto-Lesion Segmentation with a Novel Intensity Dark Channel Prior for COVID-19 Detection [0.2] 本研究は,他の肺疾患との鑑別を目的としたCTベースの放射線治療フレームワークを開発した。
画像は、新型コロナウイルス(COVID-19)、非新型コロナウイルス(non-COVID-19)、または正常の3つのクラスに分類される。
最高の性能分類モデルであるResidual Neural Network(Resnet-50)は、平均精度、精度、リコール、F1スコアが98.8%、99%、98%、98%に達した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 12:24:47 GMT)
Bayesian Inference for Left-Truncated Log-Logistic Distributions for Time-to-event Data Analysis [0.2] 本稿では,左絡みログロジクス(LTLL)分布のパラメータを推定するためのベイズ的手法を提案する。
特に,左旋回により表面が不規則な場合には,より安定で信頼性の高いパラメータ推定が可能であることを示す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 23:10:07 GMT)
Unveiling Factors for Enhanced POS Tagging: A Study of Low-Resource Medieval Romance Languages [0.2] Part-of-speech (POS) タグは、自然言語処理パイプラインの基本コンポーネントである。
本研究は,中世オクシタン,中世スペイン語,中世フランス語の多種多様なコーパスにおけるPOSタグ付け性能の中央決定要因を体系的に検討した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 13:33:07 GMT)
Machine Learning Model Integration with Open World Temporal Logic for Process Automation [0.1] 本稿では,各種機械学習モデルの出力をPyReasonフレームワークに直接統合する新しい手法を提案する。
一般化されたアノテート論理におけるPyReasonの基盤は、様々なMLモデルの実数値出力をシームレスに組み込むことを可能にする。
この統合は、製造業、医療、ビジネスオペレーションなど、多くの領域にまたがる実用性を見出す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:13:13 GMT)
Erbium Quantum Memory Platform with Long Optical Coherence via Back-End of Line Deposition on Foundry-Fabricated Photonics [0.1] この研究は、量子メモリプラットフォームと低損失のファウントリー回路のバックエンド・オブ・ラインデポジションによるモノリシックな統合を実証する。
窒化ケイ素ナノフォトニック導波路に酸化チタン(mathrmTiO$)の薄膜を堆積し,Er光コヒーレンスについて検討した。
結果は最先端のエルビウムデバイスに匹敵する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:52:01 GMT)
From Tiny Machine Learning to Tiny Deep Learning: A Survey [0.1] エッジデバイスの急速な成長は、エッジに人工知能(AI)をデプロイする需要を加速させた。
TinyDLの出現は、リソース制約の厳しいハードウェアにディープラーニングモデルをデプロイするためのパラダイムシフトである。
この調査は、研究者や実践者にとって基礎となる資源として機能することを目的としており、生態系の全体像を提供する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:09:07 GMT)
Anthropocentric bias in language model evaluation [0.0] 本稿では, 無視された2種類の人間中心バイアスについて述べる。
能力に拘わらずLCMのパフォーマンスを阻害する補助要因を見渡せます。
真に有能でない人間とは異なる 機械的戦略を否定する
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:53:40 GMT)
Trustworthy Chronic Disease Risk Prediction For Self-Directed Preventive Care via Medical Literature Validation [0.0] 個人的・生活習慣的要因のみを用いて,13の慢性疾患の発症リスクを予測する深層学習モデルを構築した。
我々は、SHAPに基づく説明可能性を用いて、最も影響力のあるモデルの特徴を特定し、確立した医学文献に対して検証する。
この研究は、自己指導型予防ケアのための信頼できる機械学習ツールの開発の基礎を築いた。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 07:08:56 GMT)
Expanding Relevance Judgments for Medical Case-based Retrieval Task with Multimodal LLMs [0.0] 我々は、MLLM(Multimodal Large Language Model)を用いて、関連判断を拡張し、新しい自動判断データセットを作成する。
以上の結果から,MLLMが関連判断の規模を拡大する可能性を示し,医療・マルチモーダルIRタスクにおける検索評価を支援する上で有望な方向性を提供する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:29:33 GMT)
VReaves: Eavesdropping on Virtual Reality App Identity and Activity via Electromagnetic Side Channels [0.0] 本稿では,VRアプリ識別とアクティビティ認識のためのVRヘッドセットの電磁エマレーション側チャネルを盗聴するシステムであるVReavesについて述べる。
まず、信号処理パイプラインを介して、VRヘッドセットに埋め込まれたIoTセンサー(カメラやマイクなど)から電磁エマニュエーションを特徴付ける。
市販の市販VRデバイスを用いた実験により,電磁エマレーション側チャネルによるVRアプリの識別とアクティビティ認識の効率化が実証された。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 03:53:24 GMT)
VR-FuseNet: A Fusion of Heterogeneous Fundus Data and Explainable Deep Network for Diabetic Retinopathy Classification [0.0] 本稿では,VR-FuseNetと呼ばれる新しいハイブリッドディープラーニングモデルを提案することによって,糖尿病網膜症自動検出のための包括的アプローチを提案する。
提案したVR-FuseNetモデルは、最先端の畳み込みニューラルネットワークであるVGG19と、その深い階層的特徴抽出で知られるResNet50V2の強みを組み合わせたものだ。
このモデルは、糖尿病網膜症分類タスクにおけるハイブリッド特徴抽出の有効性を示すすべてのパフォーマンス指標において、個々のアーキテクチャよりも優れている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 17:45:24 GMT)
Time-Contrastive Pretraining for In-Context Image and Video Segmentation [0.0] In-context Learning (ICL)は、ラベル付きデータを最小限にした新しいタスクを可能にする。
我々は、視覚的ICLのためのプロンプトレトリバーを事前訓練する時間的コントラスト型自己監督型目標であるTemporalを紹介した。
ICLをビデオオブジェクトセグメンテーション(VOS)タスクとして定式化する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:26:20 GMT)
Theory of Magnon Purcell Effect in Cavity Magnonic System [0.0] 開放マグノン系の崩壊ダイナミクスに対する空洞効果の系統的解析を行う。
我々の発見と方法論は、空洞磁気量子制御、量子情報処理、およびマグノン量子デバイスの開発における研究を進める上で貴重な知見を提供することができる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 03:11:59 GMT)
The Quantum Wave Function as a Complex Probability Distribution [0.0] 波動関数とその複素共役は複素確率分布と解釈できることを示す。
量子論におけるプロセスの考え方を受け入れることは、大きな物体に古典的な振る舞いが現れる理由を説明するかもしれないことが示唆されている。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 19:21:00 GMT)
The Impact of AI-Generated Solutions on Software Architecture and Productivity: Results from a Survey Study [0.0] AIツールを使用するソフトウェア実践者の調査を行った。
結論として、AIツールはソフトウェアエンジニアの生産性を大幅に向上させる。
しかし、AIツールを使用することによる生産性の利点は、プロジェクトがより複雑になるにつれて減少します。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:03:32 GMT)
The Dirac--Bergmann approach to optimal control theory [0.0] 古典系と量子系の両方において最適制御のための新しい枠組みを提案する。
制御理論で用いられる標準ポントリャーギンの原理とは対照的に、我々の手法は最適解を得るために変分を実行する必要性を回避している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 06:23:22 GMT)
TPTT: Transforming Pretrained Transformer into Titans [0.0] TPTT(Transforming Pretrained Transformer into Titans)は、事前トレーニングされたトランスフォーマーモデルを強化するための新しいフレームワークである。
メモリ・アズ・ゲート(MaG)や混合線形アテンション(LiZA)などの技術を採用している。
約10億パラメータのモデルを用いたMMLUベンチマークにおけるTPTTの有効性を示す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 10:06:07 GMT)
Systemic Constraints of Undecidability [0.0] 本稿では,システムの構造的特性としての計算不能を緩和するシステム的不決定性の理論を提案する。
決定不能なシステムの計算に機能的に関与するサブシステムは、その決定不能性を継承する。
我々のフレームワークは、オラクルの模倣を解除し、アーキテクチャの革新によって計算限界を回避できるという見解に挑戦する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:56:26 GMT)
Sensing Electric Currents in an a-IGZO TFT-Based Circuit Using a Quantum Diamond Microscope [0.0] 量子ダイヤモンド顕微鏡(Quantum Diamond Microscope、QDM)は、電子回路のキャラクタリゼーションを可能にする新しい磁気イメージングツールである。
16アモルファス-インジウム-ガリウム-亜鉛酸化物(a-IGZO)薄膜トランジスタ(TFT)からなる電流ミラー回路のウエハレベル電流検出を実証する。
本研究は, 新興半導体技術の非侵襲診断ツールとしてのQDMの機能を明らかにするものである。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 15:38:58 GMT)
Secure Energy Transactions Using Blockchain Leveraging AI for Fraud Detection and Energy Market Stability [0.0] 本研究の目的は、米国の分散型エネルギー市場のための安全でインテリジェントで効率的なエネルギー取引システムを開発し、構築することである。
このデータセットは、シミュレーションされたピアツーピア(P2P)エネルギー交換ネットワークから120万以上の匿名化されたエネルギー取引記録で構成されている。
提案されたシステムアーキテクチャには、ブロックチェーン層と人工知能(AI)層という、2つのレイヤの統合が含まれる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 21:09:29 GMT)
Saturable global quantum sensing [0.0] 我々は、固定的だが最適化された設定に対して、グローバルセンシングに対する運用上の動機付けされたアプローチを提供する。
提案手法は,測定値とプローブ作成を同時に最適化する飽和精度境界を与える。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:51:30 GMT)
SING: SDE Inference via Natural Gradients [0.0] 本稿では,SDE推論を自然勾配(Sing)を用いて提案し,モデルと変分後部の基底幾何学を効率的に活用する。
SINGは、難解な積分を近似し、計算を時間内に並列化することにより、潜在SDEモデルの高速かつ信頼性の高い推論を可能にする。
SINGは、様々なデータセットにおける状態推定とドリフト推定において、先行手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 19:36:11 GMT)
Revealing Quantum Information Encoded in Classical Images [0.0] 画像特徴抽出のための2つのCNOTゲートのみで設計された単純な量子前処理フィルタカーネルについて検討する。
CNOTゲートが2つしかない小さな回路は3つの異なる空間対称性で設計でき、それぞれが異なる分類に影響を及ぼす。
このフィルタは、単純で狭いネットワークと組み合わせて分類を改善するが、複雑な古典的手法を超えない。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 00:56:09 GMT)
Quantum-Enhanced Reinforcement Learning for Power Grid Security Assessment [0.0] グリッド演算子が複雑なネットワークの膨大な決定空間と非線形挙動をナビゲートするために、強化学習(RL)エージェントが提案されている。
RLを電力グリッドセキュリティアセスメントに適用することは、特に厄介な事態解析の問題に対して、スケールすることが困難であることが証明されている。
これらのRLフレームワークへの量子コンピューティングの統合は、計算効率の向上とエージェントの習熟度の向上によってスケールするのに役立つ。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 00:27:03 GMT)
Quantum Magic in Discrete-Time Quantum Walk [0.0] 離散時間量子ウォーク(DTQW)における量子魔法の生成と進化について検討する。
以上の結果から,DTQWはコインの初期状態に強く依存し,動的に重要なマジックを生成できることが判明した。
シングルウォーカーの場合、魔法と絡み合いの関係は非自明で長い時間に相補的であることが分かる。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:30:24 GMT)
Predicting Stock Market Crash with Bayesian Generalised Pareto Regression [0.0] 極端に負のリターンはまれではあるが、経済的に大きな混乱を引き起こす。
本稿では,インド株式市場の極端な損失を予測するため,ベイジアン一般化パレート回帰モデルを開発する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:36:05 GMT)
Predicting E-commerce Purchase Behavior using a DQN-Inspired Deep Learning Model for enhanced adaptability [0.0] 本稿では,Deep Q-Network (DQN) にインスパイアされたアーキテクチャを活用し,電子商取引環境における購入意図と製品需要を予測する新しいアプローチを提案する。
我々は,885,000以上のユーザセッションからなる大規模eコマースデータセット上で,それぞれ1,114の特徴を特徴付けるモデルを評価した。
精度は88%,AUC-ROCスコアは0.88である。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:12:26 GMT)
PhysicsNeRF: Physics-Guided 3D Reconstruction from Sparse Views [0.0] PhysicsNeRFは、スパースビューからの3D再構成のための物理的基盤となるフレームワークである。
ディープランキング、RegNeRFスタイルの整合性、スパシティ事前、クロスビューアライメントの4つの相補的な制約で、Neural Radiance Fieldsを拡張する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 09:36:55 GMT)
Physically motivated decompositions of single qutrit gates [0.0] ユニタリ 3 * 3 行列 (U(3)) の多くのパラメータ化が存在する。
一般ユニタリ行列の1つの分解は、対角行列の指数の積と対角行列の指数の積として表すことができる。
この分解は、固定周波数共振制御パルスを用いた超伝導クォートリットの制御に関係している。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 19:40:21 GMT)
OpenMAP-BrainAge: Generalizable and Interpretable Brain Age Predictor [0.0] 我々は,年齢予測モデルを構築し,人口統計学的・技術的MRIスキャンに頑健な年齢予測モデルを構築した。
モデルでは、3つの視点からT1次元擬似3次元MRIを処理し、線形脳情報を含む。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:24:42 GMT)
Numerical simulation of transient heat conduction with moving heat source using Physics Informed Neural Networks [0.0] 本稿では,移動源を含む熱伝達の数値シミュレーションに物理情報ニューラルネットワーク(PINN)を用いる。
転帰学習を通した連続的なタイムステッピングを用いた新しいトレーニング手法を提案する。
移動熱源を有する均質媒質中の温度分布を推定するために, 提案手法を用いた。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 14:51:46 GMT)
Nonreciprocal transmission in hybrid atomic ensemble-optomechanical systems [0.0] 原子アンサンブルを組み込んだハイブリッド光学系における完全光非相互伝送について検討する。
我々は、最適な非相互伝達に必要な条件を導出し、結合の複雑な性質に依存することを示す。
これらの知見は、非相互光学デバイスの設計に有用な洞察を与える。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 14:41:18 GMT)
Mind the Gap: Assessing Wiktionary's Crowd-Sourced Linguistic Knowledge on Morphological Gaps in Two Related Languages [0.0] 本研究は、ラテン語とイタリア語のコーパスに注釈を付ける新しい神経形態解析器をカスタマイズする。
Wiktionaryからコンパイルされた欠陥動詞のクラウドソースリストを計算的に検証する。
以上の結果から,Wiktionaryはイタリアの形態的ギャップを高い信頼性で評価する一方で,ラテン・レマタの7%は非欠陥性を示すコーパスが強いことが示唆された。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:46:30 GMT)
Kernel Limit of Recurrent Neural Networks Trained on Ergodic Data Sequences [0.0] 我々は、リカレントニューラルネットワーク(RNN)の接点を、隠されたユニットの数、シーケンス内のデータサンプル、隠された状態更新、トレーニングステップを同時に無限に成長させるものとして特徴づける。
これらの手法は、データサンプルの数とニューラルネットワークのサイズが無限に増加するにつれて、データシーケンスに基づいてトレーニングされたRNNのニューラルネットワーク(NTK)制限を引き起こす。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:08:09 GMT)
Imaging of microwave magnetic field orientation using continuous-wave experiments on nitrogen-vacancy centers in diamond [0.0] ダイヤモンド中の窒素空孔(NV)中心は、dcとacの磁場を撮像するのに非常に適している。
NV中心での連続波実験のみを用いてマイクロ波磁場の配向のイメージングを実演する。
また、平面上へのマイクロ波場の投影は、単方向のNV中心を用いて画像化できることを示した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 12:04:02 GMT)
Global Variational Quantum Circuits for Arbitrary Symmetric State Preparation [0.0] 我々は、大域的な一軸ねじれと大域的な回転からなる変分回路を用いて、任意の対称状態を効率的に作成する。
回路はローカルアドレス可能性やアンシラ量子ビットを必要としない。
このプロトコルは、典型的な実験ノイズレベルの存在下で、$gtrsim 95%のフィデリティを達成できると推定する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 12:22:48 GMT)
Generative Grasp Detection and Estimation with Concept Learning-based Safety Criteria [0.0] 本稿では,適切なツールを検出し,最適なグリップを生成するロボットグリップアルゴリズムのパイプラインを提案する。
本稿では,この手法の一貫性とハンドオーバ位置を改善するための基準を示す。
このアプローチは、ロボットが特定のツールやオブジェクトを拾えるようにカメラシステムが設定された産業環境でテストされた。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:33:25 GMT)
Flat bands in tight-binding lattices with anisotropic potentials [0.0] ブラヴェス格子上の強結合モデルは、ある方向に沿って変化し、横方向に沿って一定である異方性オンサイトポテンシャルを持つ。
有界ポテンシャルに対しては、フラットバンド固有状態はポテンシャル強度に関係なく常に局所化される。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:34:31 GMT)
Faster Low-Rank Approximation and Kernel Ridge Regression via the Block-Nyström Method [0.0] Block-Nystr"omはブロック対角構造をNystr"omメソッドに注入するアルゴリズムである。
第二次最適化のための改良されたプレコンディショナー構築にBlock-Nystr"omが利用できることを示す。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:50:37 GMT)
Emergent Holographic Spacetime from Quantum Information [0.0] ホログラフィー双対性は、量子多体系の観点から重力理論を記述する。
量子情報理論は、これらのシステムの微細構造を直接重力時空のジオメトリーに接続する重要なツールを提供する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 15:48:10 GMT)
Einstein causality of quantum measurements in the Tomonaga-Schwinger picture [0.0] 選択量子測度は、空間的分離領域上の状態非依存の非音速可換関係を満たすことを示す。
測定が瞬時に行われると仮定される単純なシナリオでは、これは非選択的測定に対する量子の無シグナリングを意味する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 13:14:29 GMT)
Edge of Many-Body Quantum Chaos in Quantum Reservoir Computing [0.0] 貯水池コンピューティングでは、一般的に最適なパフォーマンスは、秩序とカオスの境界であるカオスの端で達成される。
ここでは、有名なSachdev-Ye-Kitaevモデルに実装されたQRCを用いて量子多体対向体を同定する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 02:33:49 GMT)
Derandomizing Simultaneous Confidence Regions for Band-Limited Functions by Improved Norm Bounds and Majority-Voting Schemes [0.0] 雑音の入出力測定から帯域制限関数に対する同時信頼領域を構築する。
我々は、サンプルサイズと、どの配置に縛られるかを規定する入力がどの程度情報的であるかに基づいて、近似しきい値を導出する。
インプット毎の集約間隔でさえ、同時カバレッジ保証を維持していることを証明します。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 17:14:38 GMT)
Context-Aware Scientific Knowledge Extraction on Linked Open Data using Large Language Models [0.0] 本稿では,クエリ固有の知識を抽出し,洗練し,ランク付けするシステムであるWISE(Workflow for Intelligent Scientific Knowledge extract)を紹介する。
WISEは、様々な情報源から知識を体系的に探求し、合成することによって、詳細な、組織化された回答を提供する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 04:22:34 GMT)
Can Schroedingerist Wavefunction Physics Explain Brownian Motion? III: A One-Dimensional Heavy and Light Particles Model Exhibiting Brownian-Motion-Like Trajectories and Diffusion [0.0] 有限級数を与え、BML軌道と拡散の基準を満たす一次元モデルを導入する。
プランクの定常摂動と光粒子の分子質量が拡散係数に現れることに留意する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:09:16 GMT)
CSDN: A Context-Gated Self-Adaptive Detection Network for Real-Time Object Detection [0.0] 本稿では,自然言語処理アーキテクチャと人間の視覚知覚に触発されたトランスフォーマーベースの検出ヘッダであるContext-Gated Scale-Adaptive Detection Network (CSDN)を紹介する。
CSDNは、従来の自己アテンション層とクロスアテンション層を新しいゲーティングメカニズムで置き換える。
提案する検出ヘッドは, 各種CNN検出器のネイティブヘッドを直接置き換えることができ, 事前学習重量の微調整を数ラウンド行うだけで検出精度が大幅に向上する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 11:12:52 GMT)
Automated Selfish Mining Analysis for DAG-Based PoW Consensus Protocols [0.0] 利己的なマイニングは、仕事の証明プロトコルにおける報酬を最大化するための戦略的なルール破りである。
本稿では,Proof-of-Work,GhostDAG,Parallel Proof-Workなど,幅広いプロトコルをカバーする汎用攻撃モデルを提案する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 17:26:16 GMT)
An Interpretable Transformer-Based Foundation Model for Cross-Procedural Skill Assessment Using Raw fNIRS Signals [0.0] 本稿では,FNIRS信号の最小処理に基づく解釈可能なトランスフォーマーベース基礎モデルを提案する。
このモデルは全てのタスクにおいて88%以上の分類精度を達成し、マシューズ相関係数はETIで0.91を超える。
これは、30個未満のラベル付きサンプルと軽量(2kパラメータ未満)アダプターモジュールを使用する新しい緊急気道手順に一般化する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 18:30:58 GMT)
Aged to Perfection: Machine-Learning Maps of Age in Conversational English [0.0] この研究は、現代英語のサンプルであるBritish National Corpus 2014を用いて、異なる年齢層にわたる言語パターンを調査している。
本研究は, 話者人口と発話時間, 語彙の多様性, 単語選択などの言語的要因との関係について検討する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 13:08:57 GMT)
Advanced Modeling for Exoplanet Detection and Characterization [0.0] この研究は、太陽系外惑星を発見する方法としてケプラーデータセットからの恒星の光度曲線を含む。
本研究は,光曲線と機械学習手法を用いて,それらの物理特性を推定する。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 09:49:35 GMT)
A TRNG Implemented using a Soft-Data Based Sponge Function within a Unified Strong PUF Architecture [0.0] 本稿では,強力なPUFで利用可能な静的エントロピーの組み合わせを利用した統一PUF-TRNGアーキテクチャを提案する。
修正デュプレックススポンジ構造に基づく新しいデータ後処理アルゴリズムを提案する。
その結果, 安定かつロバストなTRNG設計であり, 優れたミニエントロピーと適度なデータレートが得られた。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 19:23:17 GMT)
A Random Matrix Theory of Pauli Tomography [0.0] QST再構成における Deltahatrho = hatrho-hatrhoprime$ の誤差の詳細な特徴は、量子論と実験において明らかに重要である。
我々は、情報完全ベースにおける状態トモグラフィーの完全ランダム行列理論(RMT)を考案した。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 16:41:42 GMT)
A Geometric Substructure for Quantum Dynamics [0.0] 閉量子系の理論は、基礎となる部分構造の同定によって拡張される。
リーマン部分構造への一般化の可能性は推測され、背景重力場との予期せぬ相互作用が示唆される。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 05:17:28 GMT)
A Comparative Study of Open-Source Libraries for Synthetic Tabular Data Generation: SDV vs. SynthCity [0.0] 合成データジェネレータは、実データの統計的および構造的特性を複製することで、有望なソリューションを提供する。
本研究では,広く利用されている2つのオープンソースライブラリの合成データ生成装置の性能評価を行った。
論文参考訳(メタデータ) (Sat, 21 Jun 2025 22:45:40 GMT)