VideoPrism: A Foundational Visual Encoder for Video Understanding [90.0] VideoPrismは、単一の凍結モデルで多様なビデオ理解タスクに取り組む汎用ビデオエンコーダである。
我々は,36Mの高品質ビデオキャプチャ対と582Mの動画クリップを含む異種コーパス上で,VoicePrismを事前訓練した。
我々は、Webビデオ質問応答から科学用CVまで、ビデオ理解タスクの4つのグループでビデオPrismを広範囲にテストし、33の動画理解ベンチマークのうち31で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:16:44 GMT)
Open-FinLLMs: Open Multimodal Large Language Models for Financial Applications [89.0] オープンソースのマルチモーダル金融 LLM である textitOpen-FinLLMs を紹介する。
FinLLaMAは52ビリオンのトーケンコーパス、FinLLaMA-Instructは573Kの財務命令で微調整され、FinLLaVAは1.43Mのマルチモーダルチューニングペアで強化されている。
我々は、14の財務タスク、30のデータセット、および4つのマルチモーダルタスクにわたるOpen-FinLLMをゼロショット、少数ショット、教師付き微調整設定で評価した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:25:35 GMT)
Data Shapley in One Training Run [88.6] Data Shapleyは、機械学習コンテキストにおけるデータのコントリビューションに寄与するための、原則化されたフレームワークを提供する。
既存のアプローチでは、計算集約的な異なるデータサブセット上の再学習モデルが必要である。
本稿では、対象とするデータモデルに対するスケーラブルなデータ属性を提供することにより、これらの制限に対処するIn-Run Data Shapleyを紹介する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:16:12 GMT)
From Low Rank Gradient Subspace Stabilization to Low-Rank Weights: Observations, Theories, and Applications [85.2] 大規模言語モデルにおける重み行列の非一様低ランク特性について検討する。
WeLore(Weight Low-Rank Projection)は、重み圧縮とメモリ効率の微調整を一体化したものである。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:59:36 GMT)
Unlocking Smarter Device Control: Foresighted Planning with a World Model-Driven Code Execution Approach [83.2] 本研究では,自然言語理解と構造化推論を優先し,エージェントの環境に対するグローバルな理解を高める枠組みを提案する。
本手法は,従来の手法,特にタスク成功率の44.4%向上を達成している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 02:50:58 GMT)
RoboCerebra: A Large-scale Benchmark for Long-horizon Robotic Manipulation Evaluation [80.2] 長距離ロボット操作における高レベル推論評価のためのベンチマークであるRoboCerebraを紹介する。
データセットはトップダウンパイプラインを通じて構築され、GPTはタスク命令を生成し、それらをサブタスクシーケンスに分解する。
以前のベンチマークと比較すると、RoboCerebraはアクションシーケンスが大幅に長く、アノテーションがより密度が高い。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:15:49 GMT)
What Makes a Good Natural Language Prompt? [72.3] 我々は,2022年から2025年にかけて,NLPおよびAIカンファレンスを主導する150以上のプロンプト関連論文を対象としたメタ分析調査を実施している。
本研究では,6次元に分類した21の特性を含む,迅速な品質評価のための特性・人間中心のフレームワークを提案する。
次に、複数プロパティのプロンプト強化を実証的に検討し、単一プロパティのプロンプトが最大の影響を与える場合が多いことを観察する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 23:19:27 GMT)
Enhancing Input-Label Mapping in In-Context Learning with Contrastive Decoding [71.0] 大規模言語モデル(LLM)は、コンテキスト内学習(ICL)を通じて、様々なタスクで優れる
In-Context Contrastive Decoding (ICCD)を導入する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:11:40 GMT)
On Path to Multimodal Historical Reasoning: HistBench and HistAgent [67.5] HistBenchは、AIの歴史的推論能力を評価するために設計された、414の高品質な質問の新しいベンチマークである。
タスクは、一次資料に基づく事実検索から、原稿や画像の解釈分析まで、幅広い歴史的問題にまたがる。
我々は、OCR、翻訳、アーカイブ検索、ヒストリーにおける画像理解のための慎重に設計されたツールを備えたヒストアジェント(HistAgent)を提示する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 21:54:14 GMT)
KnowCoder-V2: Deep Knowledge Analysis [64.6] 我々は、深い知識分析能力を持つ深層研究を支援するtextbfKnowledgeable textbfDeep textbfResearch (textbfKDR) フレームワークを提案する。
大規模なドメイン関連データをオフラインで体系的な知識にプリプロセスするために、独立した知識組織フェーズを導入する。
そして、オンラインの方法で複雑な知識計算を行うための、新たな推論ステップによって、ディープリサーチを拡張します。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:01:25 GMT)
Spark Transformer: Reactivating Sparsity in FFN and Attention [63.2] 本稿では, FFNとアテンション機構の両方において, 高レベルのアクティベーション間隔を実現する新しいアーキテクチャであるSpark Transformerを紹介する。
これによりFLOPの2.5倍の削減が可能となり、CPUでは1.79倍、GPUでは1.40倍となる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:51:13 GMT)
Learning Temporally Consistent Video Depth from Video Diffusion Priors [62.4] 本研究は,ストリーム映像深度推定の課題に対処する。
フレームやクリップ間でコンテキスト情報を共有することは、時間的一貫性を育む上で重要である、と我々は主張する。
本稿では,任意の長さの動画に対して一貫したコンテキスト認識学習と推論戦略を提案し,クロスクリップなコンテキストを提供する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:24:16 GMT)
Transferring Features Across Language Models With Model Stitching [61.2] 言語モデルの残差ストリーム間のアフィンマッピングは、モデル間で表現された特徴を転送するための安価な方法であることを示す。
小型モデルと大規模モデルは、非常によく似た表現空間を学習し、より小さなモデルでSAEなどの高価なコンポーネントをトレーニングし、FLOPの貯蓄でより大きなモデルに転送する動機付けをする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:03:25 GMT)
Active Test-time Vision-Language Navigation [60.7] ATENAは、不確実なナビゲーション結果に対するエピソードフィードバックを通じて、実用的な人間とロボットのインタラクションを可能にする、テスト時のアクティブな学習フレームワークである。
特にATENAは、成功エピソードにおける確実性を高め、失敗エピソードにおいてそれを減らすことを学び、不確実性の校正を改善している。
さらに,自信ある予測に基づいて,エージェントがナビゲーション結果を評価することができる自己学習戦略を提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 02:24:44 GMT)
Grounded Persuasive Language Generation for Automated Marketing [59.2] 本稿では,大規模言語モデル(LLM)を用いて,説得力のあるマーケティングコンテンツの自動生成を実現するエージェントフレームワークを開発する。
提案手法は,生成したコンテンツとユーザの好みを一致させると同時に,有用な事実属性を強調表示するように設計されている。
我々は、不動産マーケティングの分野において、潜在的住宅購入者の焦点を絞った体系的な人物実験を行う。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:54:20 GMT)
Can MLLMs Guide Me Home? A Benchmark Study on Fine-Grained Visual Reasoning from Transit Maps [56.8] MLLMの詳細な視覚的理解と空間的推論能力を評価するためのベンチマークであるReasonMapを紹介する。
ReasonMapには、13か国30都市からの高解像度のトランジットマップが含まれており、2つの質問タイプと3つのテンプレートにまたがる1008の質問応答ペアが含まれている。
基本および推論変種を含む15種類のMLLMの包括的評価は、直感的パターンを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:57:03 GMT)
Causal Graph based Event Reasoning using Semantic Relation Experts [56.3] 本稿では,大規模言語モデル(LLM)が推論中の因果関係を明確に表現するための並列メカニズムとして,因果事象グラフの生成について検討する。
LLMを用いて特定の意味関係に着目した専門家をシミュレートする因果グラフ生成のための協調的アプローチを提案する。
また、説明にイベントの因果連鎖を必要とする、説明可能なイベント予測タスクも導入する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 20:15:45 GMT)
How Important are Videos for Training Video LLMs? [56.0] 画像のみのトレーニングでは,ビデオLLMの方が時間的推論能力が高いことが示唆された。
本稿では,注釈付き画像のシーケンスと時間的機能に着目した質問を含む簡易な微調整手法を提案する。
これは、現在のモデルによるリアルタイムビデオに見られる豊富な時間的特徴の最適部分利用を示唆している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 21:32:19 GMT)
AfroBench: How Good are Large Language Models on African Languages? [55.4] AfroBenchは、64のアフリカ言語にわたるLLMのパフォーマンスを評価するためのベンチマークである。
AfroBenchは9つの自然言語理解データセット、6つのテキスト生成データセット、6つの知識と質問応答タスク、1つの数学的推論タスクで構成される。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:23:49 GMT)
AutoGUI: Scaling GUI Grounding with Automatic Functionality Annotations from LLMs [54.6] そこで本稿では,UI要素に詳細な機能記述を自動アノテートする textbfAutoGUI パイプラインを提案する。
提案したパイプラインを用いて高品質なAutoGUI-704kデータセットを構築し,多種多様な機能アノテーションを特徴とする。
我々のデータセットは、VLMのUIグラウンド機能を大幅に強化し、大きなスケーリング効果を示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 05:23:58 GMT)
Modeling Earth-Scale Human-Like Societies with One Billion Agents [54.5] Light Societyはエージェントベースのシミュレーションフレームワークである。
社会的プロセスはエージェントと環境状態の構造的遷移として形式化される。
10億以上のエージェントによる社会の効率的なシミュレーションを支援する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:14:12 GMT)
Ferret: Federated Full-Parameter Tuning at Scale for Large Language Models [54.0] 大規模言語モデル(LLM)は多くの現実世界のアプリケーションで必須となっている。
Ferretは、LLMのスケーラブルなフルパラメータチューニングを実現するために、ランダム性を共有する最初の一階法である。
フェレットは高い計算効率、通信オーバーヘッドの低減、高速収束を実現する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:15:47 GMT)
R2D2: Remembering, Reflecting and Dynamic Decision Making with a Reflective Agentic Memory [53.9] 現在のモデルは、Web構造の可視化と理解が限られているため、効率的なナビゲーションとアクション実行に苦しむことが多い。
提案したR2D2フレームワークは,2つのパラダイムを統合することで,これらの課題に対処する。
本研究は,記憶を増強したナビゲーションと反射学習を組み合わせることで,Webエージェントの能力が向上することが示唆された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 05:48:21 GMT)
Meta-Adaptive Prompt Distillation for Few-Shot Visual Question Answering [53.8] 大規模マルチモーダルモデル(LMM)は、最小限の監督で新しいタスクを実行するために、コンテキスト内学習(ICL)に依存することが多い。
ICLの性能、特に小さなLMMでは、一貫性がなく、例の増加とともに常に単調に改善するとは限らない。
メタラーニング手法を提案することで,LMMの少数ショット機能を実現する方法を提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:37:22 GMT)
Curriculum Reinforcement Learning from Easy to Hard Tasks Improves LLM Reasoning [52.3] 強化学習(RL)による言語モデルの推論能力の向上を目指す。
我々は,LLMが徐々に推論スキルを構築できるように,タスクを簡単から困難(E2H)にスケジュールすることを提案する。
E2H Reasonerは小型LLM(1.5B〜3B)の推論能力を著しく改善する
論文参考訳(メタデータ) (Sat, 07 Jun 2025 02:41:54 GMT)
Modern applications of machine learning in quantum sciences [52.1] 本稿では、教師なし、教師なし、強化学習アルゴリズムにおけるディープラーニングとカーネル手法の使用について述べる。
我々は、微分可能プログラミング、生成モデル、機械学習に対する統計的アプローチ、量子機械学習など、より専門的なトピックについて議論する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:27:43 GMT)
Geopolitical biases in LLMs: what are the "good" and the "bad" countries according to contemporary language models [52.0] 我々は、中立なイベント記述と異なる国からの視点を対比した新しいデータセットを導入する。
以上の結果から,特定の民族的物語のモデルが好まれる,重要な地政学的偏見がみられた。
単純なデバイアスのプロンプトはこれらのバイアスを減らすのに限られた効果があった。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 10:45:17 GMT)
Continuous-Time SO(3) Forecasting with Savitzky--Golay Neural Controlled Differential Equations [51.5] この研究は、$SO(3)$で連続時間回転オブジェクトの力学をモデル化することを提案する。
単純化された動作仮定に依存する既存の手法とは異なり、本手法は下層の物体軌道の一般的な潜在力学系を学習する。
実世界のデータに対する実験結果から、既存の手法と比較して魅力的な予測能力が示された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 12:41:50 GMT)
SudoLM: Learning Access Control of Parametric Knowledge with Authorization Alignment [51.3] 我々は,特定のパラメトリック知識のアクセス制御をLLMが学べるフレームワークであるSudoLMを提案する。
2つのアプリケーションシナリオの実験は、SudoLMがユーザのパラメトリック知識へのアクセスを効果的に制御し、その汎用性を維持することを実証している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 05:42:06 GMT)
Log-Sum-Exponential Estimator for Off-Policy Evaluation and Learning [50.9] 従来の逆確率スコア推定よりも優れた対数推定演算子(log-sum-exponential (LSE)演算子)に基づく新しい推定器を提案する。
我々のLSE推定器は, 重み付き条件下での分散低減とロバスト性を示す。
政治以外の学習シナリオでは、LSE推定器と最適ポリシーの間のパフォーマンスギャップである後悔の限界を確立します。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:37:10 GMT)
THU-Warwick Submission for EPIC-KITCHEN Challenge 2025: Semi-Supervised Video Object Segmentation [49.5] 本手法は,SAM2からの大規模視覚前訓練と深度に基づく幾何学的手法を組み合わせて,複雑なシーンと長期追跡を扱う。
VISORテストセットでは、J&Fスコアが90.1%に達する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 10:33:16 GMT)
Contextual Experience Replay for Self-Improvement of Language Agents [47.5] 本稿では,言語エージェントに対する効率的な自己改善を実現するために,コンテキスト体験リプレイ(CER)を提案する。
CERは過去の経験を蓄積し、動的メモリバッファに合成する。
我々は WebArena と VisualWebArena のベンチマークで CER を評価した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:47:35 GMT)
Multi-GraspLLM: A Multimodal LLM for Multi-Hand Semantic Guided Grasp Generation [46.0] 自動接触アノテーションを備えた,最初の大規模マルチハンドグリップデータセットであるMulti-GraspSetを提案する。
そこで我々は,Multi-GraspLLMを提案する。
提案手法は実環境実験とシミュレータの両方において既存手法よりも優れている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:35:13 GMT)
Modality-Specialized Synergizers for Interleaved Vision-Language Generalists [45.8] ビジョンランゲージ・ジェネリスト(VLG)は、テキストと画像の両方を理解し、生成することができる。
1つの主な制限は、個別のテキストトークンと連続した画像の特徴を同時にモデル化するために、統一アーキテクチャと同じパラメータセットを適用することである。
最近の研究は、モダリティを意識したエキスパートモデルを導入することで、この問題に対処しようとしている。
本稿では,既存のVLGの統一アーキテクチャを効率的に最適化する新しい設計であるMODALITY-SPECIALIZED SynERGIZERS (MOSS)を紹介する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:15:52 GMT)
Multi-StyleGS: Stylizing Gaussian Splatting with Multiple Styles [45.6] 3Dガウススプラッティング(GS)は現実的な3Dシーンモデリングのための有望かつ効率的な手法として登場した。
これらの課題に対処するために,Multi-StyleGSと呼ばれる新しい3D GSスタイリングソリューションを導入する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:54:34 GMT)
Mechanistic evaluation of Transformers and state space models [45.6] 言語モデリングのための状態空間モデル(SSM)は、2次アテンション変換器に代わる効率的でパフォーマンスの高い代替品である。
Associative Recall(AR)において、トランスフォーマーとベースSSMモデルのみが完全に成功することがわかった。
すべてのアーキテクチャがARと同じメカニズムを学んでおり、同じ3つのモデルがそのタスクで成功しています。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 22:30:22 GMT)
They want to pretend not to understand: The Limits of Current LLMs in Interpreting Implicit Content of Political Discourse [45.3] 暗黙のコンテンツは政治的談話において重要な役割を担い、聴衆に影響を与えるために不合理性や前提といった実践的な戦略を採用する。
初回は,マニピュティブな暗黙的内容の注釈付きイタリア語の政治演説を含むIMPAQTSコーパスを活用している。
すべてのテストされたモデルは、前提と不適応を解釈するのに苦労していることを実証する。
我々は,現在のLLMには,暗黙的言語を正確に解釈するために必要な重要な実用的能力が欠けていると結論づける。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 12:10:41 GMT)
LitMAS: A Lightweight and Generalized Multi-Modal Anti-Spoofing Framework for Biometric Security [45.2] 音声,顔,虹彩,指紋に基づく生体認証システムにおいて,スプーフィング攻撃を検出するためのフレームワークであるLitMASを提案する。
LitMASの中核にはModality-Aligned concentration Lossがあり、クラス間の分離性を高めている。
6Mパラメータだけで、LitMASは最先端のメソッドを7つのデータセットで平均1.36%のEERで上回っている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:04:08 GMT)
Training-Free Tokenizer Transplantation via Orthogonal Matching Pursuit [45.2] 大規模言語モデルにおいて,トークン化剤を移植するためのトレーニング不要な手法を提案する。
それぞれの語彙外トークンを,共有トークンの疎線形結合として近似する。
我々は,OMPがベースモデルの性能を最良にゼロショット保存できることを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:51:27 GMT)
From Model-Based and Adaptive Control to Evolving Fuzzy Control [45.0] ファジィシステムは、データストリームから規則ベース構造を漸進的に更新することでファジィモデルを構築し、適応する。
本稿では,古典ファジィと適応モデリングおよび制御フレームワークの歴史的発展とコアコントリビューションについて再考する。
安全性、解釈可能性、原則化された構造進化など、主要な課題と今後の方向性について議論する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:00:52 GMT)
Boosting LLM Reasoning via Spontaneous Self-Correction [43.5] 数学推論を改善するためのアプローチの1つは自己補正である。
既存の自己補正アプローチは、修正を独立したポストジェネレーションとして扱う。
本研究では,LLMが単一推論パスでインターリーブされた解と検証を生成できる自己補正手法であるSPOCを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 21:23:00 GMT)
DriveSuprim: Towards Precise Trajectory Selection for End-to-End Planning [43.3] DriveSuprimは、自動運転車の軌道選択のための選択に基づくパラダイムである。
衝突回避や規則の遵守など、最先端のパフォーマンスを実現する。
様々な運転シナリオにおいて高い軌道品質を維持する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:39:06 GMT)
Hybrid Extractive Abstractive Summarization for Multilingual Sentiment Analysis [42.9] このモデルは、TF-IDFに基づく抽出とXLM-R抽象モジュールを統合し、動的しきい値設定と文化的適応によって強化される。
10言語にわたる実験では、ベースラインよりも大幅に改善され、英語では0.90の精度、低リソース言語では0.84の精度が達成された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 21:44:31 GMT)
RestoreGrad: Signal Restoration Using Conditional Denoising Diffusion Models with Jointly Learned Prior [42.6] 本稿では,信号復元のための条件付きDDPMの改良を,より情報に富んだ先行手法を用いて提案する。
RestoreGradと呼ばれる提案されたフレームワークは、DDPMを可変オートエンコーダフレームワークにシームレスに統合する。
音声と画像の復元タスクにおいて、RestoreGradはより高速な収束(5~10倍のトレーニングステップ)を示し、復元信号のより良い品質を実現する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 22:44:02 GMT)
DOF-GS:Adjustable Depth-of-Field 3D Gaussian Splatting for Post-Capture Refocusing, Defocus Rendering and Blur Removal [42.4] 我々は,有限開口カメラモデルと明示的で微分可能なデフォーカスレンダリングを備えた新しい3DGSベースのフレームワークであるDOF-GSを紹介する。
その結果, DOF-GSは, 撮影後再フォーカス, 調整可能なデフォーカス, 高品質なオールインフォーカスレンダリングをサポートすることがわかった。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 05:21:24 GMT)
LookAlike: Consistent Distractor Generation in Math MCQs [42.2] そこで我々はLookAlikeを提案する。LookAlikeは優先最適化によるエラー・ディトラクタの整合性を改善する手法である。
主なイノベーションは、(a)モデル不整合から合成選好ペアをマイニングすること、(b)教師付き微調整の交互化である。
LookAlike は LLM-as-a-judge 評価の下で、イントラクタ生成の精度51.6%、エラー生成の精度57.2% を達成する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:24:53 GMT)
Directly Forecasting Belief for Reinforcement Learning with Delays [41.5] 遅延を伴う強化学習は、実際の出来事の遅れを知覚的に知覚することが困難である。
我々は、DFBT(Directly Forecasting Belief Transformer)という新しい信念推定手法を開発した。
DFBTは、段階的に中間状態を段階的に推定することなく、観測から状態を直接予測する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:11:22 GMT)
AutoPal: Autonomous Adaptation to Users for Personal AI Companionship [41.4] 本稿では、パーソナルAIコンパニオンにおける自律的適応の必要性を強調する。
エージェントのペルソナを制御可能かつ真正に調整できる階層型フレームワークであるAutoPalを考案する。
実験はAutoPalの有効性を示し、AIコンパニオンにおける自律的適応性の重要性を強調している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:11:04 GMT)
SLAC: Simulation-Pretrained Latent Action Space for Whole-Body Real-World RL [41.3] 有能な家庭用・産業用ロボットの構築には、移動マニピュレータのような多目的で高自由度(DoF)システムの制御を習得する必要がある。
本稿では,タスク非依存の潜在行動空間を事前学習するために,低忠実度シミュレータを活用することで,実世界のRLを複雑な実施のために実現可能なSLACを提案する。
本研究では,2次元モバイル操作タスクのスイート上での既存手法に対するSLACの評価を行い,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:55:43 GMT)
Broaden your SCOPE! Efficient Multi-turn Conversation Planning for LLMs with Semantic Space [40.9] 本稿では,効率を向上したセマンティック空間会話計画(SCOPE)という新しい手法を提案する。
SCOPEは会話の密接なセマンティック表現を利用して効率的に会話計画を行う。
その結果、SCOPEは従来のシミュレーションベースの計画アルゴリズムの70倍の速さで会話計画を行うことができる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:51:18 GMT)
Watermark under Fire: A Robustness Evaluation of LLM Watermarking [40.5] WaterParkは10の最先端の透かしと12の代表的な攻撃を統合する統合プラットフォームである。
我々は既存の透かしを総合的に評価し、様々な設計選択が攻撃の堅牢性に与える影響を明らかにする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:30:59 GMT)
Scalable Gaussian Processes with Latent Kronecker Structure [40.2] クロネッカー積のような行列構造は演算を著しく加速させることができるが、それらの応用は一般に近似や非現実的な仮定を必要とする。
我々は、潜在クロネッカー積の射影として観測値のカーネル行列を表現し、潜在クロネッカー構造を活用することを提案する。
提案手法は,最大500万例の実世界のデータセットにおいて,最先端のスパースと変分GPより優れていることを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:47:36 GMT)
MedCite: Can Language Models Generate Verifiable Text for Medicine? [40.0] 既存のLLMベースの質問応答システムでは、引用生成と評価機能が欠如している。
医療用LLMを用いた引用生成の設計と評価を容易にする最初のエンドツーエンドフレームワークであるnameを紹介する。
本稿では,高品質な引用を生成する新しいマルチパス検索手法を提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:46:18 GMT)
Mixture of Decoding: An Attention-Inspired Adaptive Decoding Strategy to Mitigate Hallucinations in Large Vision-Language Models [39.9] 混合復号法 (Mixture of Decoding, MoD) は幻覚緩和のための新しいアプローチである。
画像トークンに対するモデルの注意の正しさを評価することによって、デコード戦略に適応する。
MoDは、複数の主要なベンチマークで既存のデコード手法を著しく上回っている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:59:06 GMT)
LLM-attacker: Enhancing Closed-loop Adversarial Scenario Generation for Autonomous Driving with Large Language Models [39.1] 大規模言語モデル(LLM)を利用したアクセルループ逆シナリオ生成フレームワーク
交通参加者の行動を操作して安全クリティカルな事象を誘発する逆シナリオ生成法が開発されている。
LLM攻撃者は、他の方法よりも危険なシナリオを作成でき、それを用いて訓練されたADSは、通常のシナリオでのトレーニングの半分の衝突率を達成する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:26:30 GMT)
Taxonomizing Representational Harms using Speech Act Theory [38.4] 生成言語システムによって引き起こされる表現的害の特定に理論的に寄与する。
我々は,ステレオタイピング,非表現,消去の新たな定義を提供する。
次に、我々の枠組みを用いて、表現的害を引き起こす食行為のきめ細かい分類法を開発する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:08:54 GMT)
SpikePingpong: High-Frequency Spike Vision-based Robot Learning for Precise Striking in Table Tennis Game [37.8] SpikePingpongは、スパイクベースのビジョンと模倣学習を統合した新しいシステムだ。
スパイクカメラベースのモジュールであるSONICは、ボールラケット接触予測においてミリレベルの精度を達成する。
IMPACTは戦略的計画モジュールであり、ターゲットとするテーブル領域への正確なボール配置を可能にする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:04:48 GMT)
Beyond Classification: Towards Speech Emotion Reasoning with Multitask AudioLLMs [37.6] 我々は,意味的に整合したエビデンスに基づく説明を行うことで,感情認識を強化する戦略を開発する。
本稿では、推論強化データ監視、デュアルエンコーダアーキテクチャ、タスク代替トレーニングを組み合わせた統合フレームワークを提案する。
IEMOCAPとMELDの実験により、我々のアプローチは感情予測精度を向上するだけでなく、生成した応答のコヒーレンスと明解なグラウンド化も向上することが示された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:52:58 GMT)
DISC: Plug-and-Play Decoding Intervention with Similarity of Characters for Chinese Spelling Check [37.4] 中国語スペルチェック(CSC)モデルのための軽量なプラグアンドプレイDECモジュールを提案する。
DISCは文字間の音声的類似度とグリフ的類似度を測定し、推論フェーズのみにこの類似度情報を組み込む。
3つのCSCベンチマーク実験により,提案手法はモデル性能を著しく向上し,現在の最先端モデルに近づき,さらに超えることを示した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:15:13 GMT)
On the Adaptive Psychological Persuasion of Large Language Models [37.2] 我々は,Large Language Models (LLMs) が自律的に説得し,説得に抵抗できることを示した。
総合的な心理的説得戦略を11つ導入する。
最適戦略を自律的に選択するようにLLMを訓練する適応型フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:52:50 GMT)
Integrating AI Planning Semantics into SysML System Models for Automated PDDL File Generation [37.0] 本稿では,計画ドメイン定義言語(PDDL)に基づく計画意味論のシステムモデルへの直接統合を可能にするSysMLプロファイルを提案する。
再利用可能なステレオタイプは、型、述語、関数、アクションといった主要なPDDL概念に対して定義されている。
このアプローチは、自動およびモデルベースの計画記述の生成をサポートし、エンジニアリング設計におけるシステムモデリングとAI計画の間の再利用可能なブリッジを提供する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:46:14 GMT)
Performance Gap in Entity Knowledge Extraction Across Modalities in Vision Language Models [36.2] 視覚言語モデル(VLM)は、画像から情報を取り出し、推論するのに優れている。
しかし、特定のエンティティに関する内部知識を活用する能力は、まだ探索されていない。
本研究は,テキストで記述されたエンティティと画像で表現されたエンティティについて,現実的な質問に答える際のモデル性能の相違について検討する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 12:05:54 GMT)
High-Fidelity Scientific Simulation Surrogates via Adaptive Implicit Neural Representations [35.7] 入射神経表現(INR)は空間的に構造化されたデータをモデリングするためのコンパクトで連続的なフレームワークを提供する。
近年のアプローチでは、剛性幾何学的構造に沿った付加的な特徴を導入することでこの問題に対処している。
機能適応型INR(FA-INR)を提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:45:17 GMT)
Right Is Not Enough: The Pitfalls of Outcome Supervision in Training LLMs for Math Reasoning [35.1] 細粒度アノテーションを持つ新しいデータセットであるMathOlympiadEvalを導入し、LLMの回答の正しさとプロセスの正しさの間に大きなギャップがあることを明らかにした。
LLM-as-a-judgeのような既存の自動化手法は、これらの推論の欠陥を確実に検出するのに苦労する。
そこで我々はParaStepVerifierを提案する。ParaStepVerifierは数学的解の厳密なステップバイステップ検証のための新しい手法である。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:54:56 GMT)
Seeing Far and Clearly: Mitigating Hallucinations in MLLMs with Attention Causal Decoding [33.3] 我々は,トークンインタラクションプロセスから直接適切なコンテキスト情報を抽出できると主張している。
復号化戦略における因果推論に着想を得て、因果マスクを活用してマルチモーダルトークン間の情報伝達を確立することを提案する。
FarSightは汎用的なプラグ・アンド・プレイ・デコード方式で,外部トークンからの注意干渉を低減する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:03:28 GMT)
Understanding Nonlinear Implicit Bias via Region Counts in Input Space [33.3] 我々は、同じ予測ラベルを持つ入力空間内の連結領域のカウントによって、暗黙バイアスを特徴づける。
小さい領域のカウントは幾何学的に単純な決定境界と一致し、良い一般化性能とよく相関している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:17:19 GMT)
Gaussian Mapping for Evolving Scenes [33.0] 本稿では,最新の変化を反映して連続的に3次元表現を更新する動的シーン適応機構を提案する。
また,できるだけ多くの情報を保存しながら,時代遅れの観測を破棄する新しい管理機構を提案する。
合成, 実世界の両方のデータセット上でガウス写像(GaME)を評価し, 美術品の状態よりも高精度であることが確認された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 20:04:54 GMT)
Multimodal Spatial Language Maps for Robot Navigation and Manipulation [32.9] マルチモーダル空間言語マップは、事前訓練されたマルチモーダル特徴と環境の3次元再構成を融合する空間地図表現である。
視覚言語マップ(VLMaps)と音声視覚言語マップ(AVLMaps)の拡張の2つの例を示す。
これらの機能は、移動ロボットやテーブルトップマニピュレータに拡張され、視覚、オーディオ、空間的手がかりによって案内されるナビゲーションとインタラクションをサポートする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:02:13 GMT)
Parametric Gaussian Human Model: Generalizable Prior for Efficient and Realistic Human Avatar Modeling [32.5] フォトとアニマタブルな人間のアバターは、バーチャル/拡張現実、テレプレゼンス、デジタルエンターテイメントの鍵となる。
本稿では,人間を3DGSに統合する汎用的で効率的なフレームワークであるParametric Gaussian Human Model(PGHM)を提案する。
実験の結果、PGHMは最適化からスクラッチまでの手法よりもはるかに効率が良く、1被写体あたり約20分で同等の視覚的品質のアバターを生産できることがわかった。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:53:30 GMT)
VisioMath: Benchmarking Figure-based Mathematical Reasoning in LMMs [31.3] 大規模マルチモデル (LMM) は、様々な領域にまたがる顕著な問題解決能力を示している。
Mathは、画像ベースの回答選択を含むマルチモーダルコンテキストにおける数学的推論を評価するために設計されたベンチマークである。
Mathは8,070のイメージと1,800の複数選択の質問で構成されている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:24:13 GMT)
Self-Adapting Improvement Loops for Robotic Learning [30.8] 専門家によるデモンストレーションで訓練されたビデオ生成モデルは、ロボットタスクを解くためのパフォーマンスの高いテキスト条件付きビジュアルプランナーとして利用されてきた。
本研究では,自己生成トラジェクトリ上で,ドメイン内ビデオモデルを反復的に更新する自己改善ループ(SAIL)を提案する。
従来のドメイン内ビデオモデルトレーニングでは,新規タスクの繰り返しに対して,パフォーマンスが継続的に向上することが確認できた。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:34:37 GMT)
A Systematic Investigation on Deep Learning-Based Omnidirectional Image and Video Super-Resolution [30.6] 本稿では,全方位画像とビデオ超解像の最近の進歩を体系的に概観する。
新しいデータセットである360Instaを導入し、全方位画像とビデオをオーステンシャルに劣化させた。
提案したデータセットと公開データセットの両方において,既存手法の総合的質的,定量的評価を行う。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:24:44 GMT)
BLEUBERI: BLEU is a surprisingly effective reward for instruction following [30.0] 基本的な文字列マッチングの指標であるBLEUは、一般的な命令追従データセット上での人間の嗜好と一致して、強い報酬モデルと驚くほど一致していることを示す。
BLEUBERI学習モデルは、報酬モデル誘導RLを用いて訓練されたモデルと競合することを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 21:56:23 GMT)
Retrieval-augmented Large Language Models for Financial Time Series Forecasting [29.8] 我々は、金融時系列予測のための新しいドメイン固有検索器FinSeerを備えた、最初の検索拡張世代(RAG)フレームワークであるFinSragを紹介する。
FinSeer は LLM フィードバックによって改良された候補選択機構と類似性駆動型トレーニング目標を活用し、財務ノイズを除去しながらクエリを歴史的に影響力のあるシーケンスと整合させる。
我々は、より広範な金融指標を統合する新しいデータセットをキュレートすることで、検索コーパスを強化し、これまで見過ごされていた市場のダイナミクスを捉えます。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:43:58 GMT)
The global convergence time of stochastic gradient descent in non-convex landscapes: Sharp estimates via large deviations [29.6] 一般の非損失関数の大域的最小値に到達するのに、降下勾配に要する時間について検討する。
ニューラルネットワークへの応用により、我々は局所ミニマを用いた損失関数の解析の一連の改良と拡張を提供する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 21:03:25 GMT)
Fast Causal Discovery by Approximate Kernel-based Generalized Score Functions with Linear Computational Complexity [29.4] 我々は,$mathcalO(n)$時間と空間複素量を持つカーネルベース一般化スコア関数を提案する。
提案手法は計算コストを大幅に削減するだけでなく,特に大規模データセットの精度も向上する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:25:52 GMT)
Restoring Calibration for Aligned Large Language Models: A Calibration-Aware Fine-Tuning Approach [29.1] 大言語モデル(LLM)の成功のための重要な技術である選好アライメント
本稿では,リコメンデーションアライメントがキャリブレーションになぜ影響するか,この問題にどう対処するかを検討する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 02:46:20 GMT)
RED QUEEN: Safeguarding Large Language Models against Concealed Multi-Turn Jailbreaking [29.0] 我々は,害の防止という目的の下に悪意のある意図を隠蔽し,マルチターンシナリオを構築する新しいジェイルブレイク手法RED QUEEN ATTACKを提案する。
我々の実験によると、全てのLLMはRED QUEEN ATTACKに対して脆弱であり、GPT-4oで87.62%、Llama3-70Bで75.4%に達する。
安全を優先するために, RED QUEEN GUARDと呼ばれる簡単な緩和戦略を導入する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:11:07 GMT)
Robustifying Vision-Language Models via Dynamic Token Reweighting [28.7] 大きな視覚言語モデル(VLM)は、ジェイルブレイク攻撃に対して非常に脆弱である。
マルチモーダル・ジェイルブレイク攻撃を緩和する新しい推論時防御法を提案する。
視覚的モダリティによって誘導される安全関連分布シフトの新しい定式化を導入する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:22:05 GMT)
Improved Sample Complexity for Private Nonsmooth Nonconvex Optimization [28.5] データセットのサイズが$widetildeOmega(sqrtd/alphabeta3+d/epsilonalphabeta2)$である限り、$(alpha,beta)$-stationaryポイントを返すシングルパス$(epsilon,delta)$-DPアルゴリズムを提供する。
次に、サンプルの複雑さを$widetildeOmegaleft(d/beta2+d3/4/epsilonalphaに改善するマルチパス時間アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:12:38 GMT)
Revisiting semi-supervised learning in the era of foundation models [28.4] 半教師付き学習(SSL)は、ラベル付きデータとともに豊富なラベル付きデータを活用して学習を強化する。
我々は,凍結視覚基盤モデル(VFM)が性能的に劣るSSLベンチマークデータセットを開発し,代表的なSSLメソッドを体系的に評価する。
ラベル付きデータのみを用いたパラメータ効率細調整(PEFT)は、ラベルなしデータを活用することなく、SSLのパフォーマンスとよく一致します。
ノイズの多い擬似ラベルの悪名高い問題を克服するため,より堅牢な擬似ラベルを生成するために,複数のPEFTアプローチとVFMバックボーンのアンサンブルを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 21:56:23 GMT)
Face recognition on point cloud with cgan-top for denoising [28.2] ノイズの多い点雲上でのエンドツーエンドの3D顔認識を提案する。
CGAN-TOP (Consulal Generative Adrial Network on Three Orthogonal Planes) は、点雲のノイズを取り除くために設計されている。
リンクされた動的グラフ畳み込みニューラルネットワーク(LDGCNN)は、処理されたポイントクラウドから顔を認識するように適合する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:09:31 GMT)
VeriThoughts: Enabling Automated Verilog Code Generation using Reasoning and Formal Verification [28.2] 本稿では、推論に基づくVerilogコード生成用に設計された新しいデータセットであるVeriThoughtsを紹介する。
我々は,生成したハードウェア記述の品質と正確性を評価するために,形式的検証手法に基づく新しいベンチマークフレームワークを構築した。
We present a suite of small-scale model based for Verilog generation。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 23:58:45 GMT)
Active Preference Optimization for Sample Efficient RLHF [27.8] ヒューマンフィードバック(RLHF)からの強化学習を用いた大規模言語モデル(LLM)のアライメント
状況の均一なサンプリングは、最適政策と一定の準最適差を被る政策につながる可能性があることを示す。
我々は,最も不確実なコンテキストに対する嗜好を反復的に収集するアルゴリズムである$textttAPO$を提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:03:51 GMT)
Xeno-learning: knowledge transfer across species in deep learning-based spectral image analysis [27.3] クセノラーニング(xeno-learning)は、クセノ移植に触発された異種間知識伝達パラダイムである。
臓器のスペクトルは種によって異なるが,病理学や外科手術による相対的な変化は同等である。
結果として生じる倫理的、金銭的、そしてパフォーマンス上の利点は、提案された知識伝達パラダイムに高い影響を約束する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:19:06 GMT)
Policy Filtration for RLHF to Mitigate Noise in Reward Models [27.3] PF-PPOのためのポリシーフィルタリング
PF-PPOはポリシー学習時の信号対雑音比を改善する。
コード生成および数理推論タスクにおけるPF-PPOの有効性を検証する実験を行う。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 02:45:11 GMT)
When Incentives Backfire, Data Stops Being Human [27.3] 大規模言語モデルの普及は、人間の生成したデータの質と整合性を脅かすと論じる。
既存のデータ収集システムは、本質的な人間のモチベーションを犠牲にして、スピード、スケール、効率を優先する。
コントリビュータの本質的なモチベーションに合わせて,データ収集システムを再考する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:57:55 GMT)
LLM4DSR: Leveraging Large Language Model for Denoising Sequential Recommendation [27.3] シーケンスレコメンダは、ユーザの過去のインタラクションシーケンスに基づいてレコメンデーションを生成する。
これらの配列は、しばしばノイズ相互作用によって汚染され、レコメンデーション性能を著しく損なう。
広い言語モデル (LLM) には広い知識と意味論的推論能力が備わっており、この情報ギャップを埋めるための有望な道筋を提供する。
LLMを用いてシーケンシャルなレコメンデーションを識別するLLM4DSRを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:28:59 GMT)
Psychological Counseling Cannot Be Achieved Overnight: Automated Psychological Counseling Through Multi-Session Conversations [26.4] マルチセッション・サイコ・カウンセリング・会話データセット(MusPsy-Dataset)について紹介する。
私たちのMusPsy-Datasetは、公開されている心理的ケースレポートの実際のクライアントプロファイルを使って構築されます。
私たちはまた、クライアントの進捗を追跡し、時間とともにカウンセリングの方向性を調整することを目的としたMusPsy-Modelを開発しました。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 02:00:45 GMT)
Deep Learning for Retinal Degeneration Assessment: A Comprehensive Analysis of the MARIO AMD Progression Challenge [26.3] MICCAI 2024で開かれたMARIOチャレンジは、加齢関連黄斑変性(AMD)の自動検出とモニタリングの進歩に焦点を当てている
主要なデータセットはフランスのブレストから提供され、参加チームによってモデルのトレーニングとテストに使用された。
アルジェリアからの補助的なデータセットは、人口と装置のシフトを評価するために後処理に使用された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 12:21:51 GMT)
RecipeGen: A Step-Aligned Multimodal Benchmark for Real-World Recipe Generation [26.2] レシピベースのText-to-Image (T2I), Image-to-Video (I2V), Text-to-Video (T2V) 生成のための,最初の大規模実世界のベンチマークであるRecipeGenを紹介する。
RecipeGenには、レシピ26,453件、画像196,724件、ビデオ4,491件が含まれており、さまざまな材料、調理手順、スタイル、料理の種類をカバーしている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:35:35 GMT)
BTPD: A Multilingual Hand-curated Dataset of Bengali Transnational Political Discourse Across Online Communities [25.6] 本稿では,3つのオンラインプラットフォームから収集したベンガル政治談話(BTPD)の多言語データセットについて述べる。
本稿では,その話題と多言語コンテンツについて概観する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:43:35 GMT)
MarginSel : Max-Margin Demonstration Selection for LLMs [25.6] 本稿では、ICLプロンプトのハードデモ例を選択し、各テストインスタンスに適応する2段階の方法を提案する。
提案手法は,F1スコアをランダムに選択した場合に比べて2-7%向上する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:50:01 GMT)
Label-semantics Aware Generative Approach for Domain-Agnostic Multilabel Classification [25.4] マルチラベルテキスト分類のための堅牢で効率的なドメインに依存しない生成モデルフレームワークを提案する。
提案手法は,事前に定義されたラベル記述を利用し,入力テキストに基づいてこれらの記述を生成するように訓練する。
提案モデルの有効性を,評価されたすべてのデータセットにまたがって,新たな最先端性能を実現することによって実証する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:07:07 GMT)
From Offline to Online Memory-Free and Task-Free Continual Learning via Fine-Grained Hypergradients [25.0] 継続的学習(CL)は、基礎となる分散が時間とともに変化する非定常データストリームから学ぶことを目的としている。
オンラインCL(onCL)は依然としてメモリベースのアプローチに支配されている。
トレーニング中に勾配更新を再バランスするオンラインメカニズムであるFine-Grained Hypergradientsを導入する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:29:37 GMT)
Remote entanglement generation via enhanced quantum state transfer [24.7] 本稿では,ジグザグ構成に基づく新しい量子状態伝達方式を提案する。
この新たなパラメータは、中間量子ビットの人口を抑えることができ、損失を低減できることを示す。
その結果、スケーラブルでノイズ耐性のある量子通信と計算のための拡張量子状態伝達方式の可能性を強調した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 05:24:16 GMT)
MSL: Not All Tokens Are What You Need for Tuning LLM as a Recommender [24.0] 提案するMasked Softmax Loss (MSL) は,大規模言語モデル (LLM) を推奨する。
MSLは、損失計算中に架空のアイテム記述につながる可能性のある無効トークンを識別し、マスクすることで、LMLを改善している。
4つの公開データセットで実施された大規模な実験は、MSLの有効性をさらに検証し、NDCG@10で平均42.24%の改善を達成した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:59:52 GMT)
Short-length Adversarial Training Helps LLMs Defend Long-length Jailbreak Attacks: Theoretical and Empirical Evidence [23.2] 本論文は, 敵のジェイルブレイク攻撃に焦点をあて, 敵のセイルブレイク攻撃に対して, 長さ$Theta(M)$で防御するためには, LLMを長さ$Theta(sqrtM)$のプロンプトに合わせるだけで十分であることを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:51:41 GMT)
VideoAuteur: Towards Long Narrative Video Generation [22.9] 本稿では,調理領域における長めの物語生成を促進するために,大規模な調理ビデオデータセットを提案する。
生成ビデオにおける視覚的・意味的コヒーレンスを高めるために,Long Narrative Video Directorを導入する。
本手法は,視覚的細部および意味的整合性の生成における大幅な改善を示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:44:59 GMT)
OneSug: The Unified End-to-End Generative Framework for E-commerce Query Suggestion [22.6] OneSugは、eコマースクエリ提案のためのエンドツーエンドの生成フレームワークである。
OneSugは、KuaishouプラットフォームのEコマース検索エンジンで1ヶ月以上にわたって、全トラフィックに成功している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 20:24:05 GMT)
Direct Prediction Set Minimization via Bilevel Conformal Classifier Training [22.5] コンフォーマル予測(CP)は、ブラックボックス分類器のラッパーとして機能する有望な不確実性定量化フレームワークである。
CPの標準的なキャリブレーション法は大きな予測セットを生成する傾向があるため、実際は役に立たない。
本稿では,予測集合のサイズを直接最小化するために,共形原理を深部分類器の訓練プロセスに統合する問題を考察する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:19:00 GMT)
CHATS: Combining Human-Aligned Optimization and Test-Time Sampling for Text-to-Image Generation [22.1] 人間の嗜好アライメントのような重要なコンポーネントは、生成品質を保証する上で重要な役割を果たす。
そこで我々はCHATS(Combining Human-Aligned Optimization and Test-time Sampling)を紹介した。
我々はCHATSが例外的なデータ効率を示すことを観察し、小型で高品質な漏えいデータセットでのみ強力な性能を達成する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:16:28 GMT)
Manual2Skill: Learning to Read Manuals and Acquire Robotic Skills for Furniture Assembly Using Vision-Language Models [21.7] 我々は,ロボットが高レベルの手動指示で案内される複雑な組み立てタスクを実行できる新しいフレームワークであるManual2Skillを提案する。
提案手法では、視覚言語モデル(VLM)を用いて、命令画像から構造化された情報を抽出し、この情報を用いて階層的なアセンブリグラフを構築する。
実世界のIKEA家具の組み立てに成功して, Manual2Skillの有効性を実証した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 05:10:37 GMT)
ECAMP: Entity-centered Context-aware Medical Vision Language Pre-training [21.3] 本稿では,新しいEntity-centered Context-aware Medical Vision-Language Pre-trainingフレームワークを提案する。
まず,大規模言語モデルを用いた医療報告からエンティティ中心のコンテキストを抽出する。
次に、エンティティ・アウェア・リバランス係数と記述子マスキング戦略をマスキング言語モデルに組み込む。
粗い画像表現と細かな画像表現の両方のセマンティック統合を改善するため、コンテキスト誘導型超解像タスクをマルチスケールのコンテキスト融合設計と共に提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:04:59 GMT)
Protap: A Benchmark for Protein Modeling on Realistic Downstream Applications [21.2] $textbfProtap$は、バックボーンアーキテクチャ、事前トレーニング戦略、ドメイン固有のモデルを体系的に比較するベンチマークである。
Protapは3つの一般的なタスクと2つの新しい特殊タスクの5つのアプリケーションをカバーする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:13:29 GMT)
Zero-shot Generalist Graph Anomaly Detection with Unified Neighborhood Prompts [21.1] グラフ異常検出(GAD)は、通常のパターンから著しく逸脱したグラフ内のノードを特定することを目的としている。
既存のGADメソッドは、1-model-for-one-datasetアプローチである。
ゼロショット・ジェネラリストの新規なGADアプローチUNPromptを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:22:18 GMT)
LLM-SRBench: A New Benchmark for Scientific Equation Discovery with Large Language Models [20.8] LLM(Large Language Models)は、仮説生成に埋め込まれた科学的知識を活用する可能性に関心を寄せている。
既存のベンチマークは、LLMによる暗記の影響を受けやすい一般的な方程式に依存しており、発見を反映しないインフレーションされたパフォーマンス指標に繋がる。
本稿では,4つの領域にまたがる239の課題を伴う総合的なベンチマークであるLSM-SRBenchを紹介する。
我々のベンチマークは、2つの主要なカテゴリで構成されている: LSR-Transformは、一般的な物理モデルからあまり一般的でない数学的表現に変換し、記憶された形式を超えた推論をテストする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:58:44 GMT)
Adapt Once, Thrive with Updates: Transferable Parameter-Efficient Fine-Tuning on Evolving Base Models [20.6] 本稿では,タスク固有パターンに着目してPEFTモジュールを強化する新しいアプローチであるTrans-PEFTを紹介する。
7つのベースモデルと12のデータセットにわたる実験では、Trans-PEFTトレーニングされたモジュールが、再チューニングすることなく、更新されたベースモデルのパフォーマンスを維持できることが示されている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:50:12 GMT)
LLM4Vuln: A Unified Evaluation Framework for Decoupling and Enhancing LLMs' Vulnerability Reasoning [20.5] 大規模言語モデルの脆弱性推論機能を評価する統合評価フレームワークを導入する。
我々は,3,528の制御シナリオにおいて,6つの代表的なLSMを,147のグランドトルース脆弱性と147の非加重性ケースでテストした。
本研究は,知識強化,文脈補充,即時的スキームの様々な影響を明らかにするものである。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:03:11 GMT)
Towards Black-Box Membership Inference Attack for Diffusion Models [20.2] 本稿では,イメージ・ツー・イメージ・バラツキAPIのみを用いた新たなメンバシップ推論攻撃手法を提案する。
私たちのアプローチでは、サンプルがトレーニングセットの一部であったかどうかを分類することができます。
実験結果は従来手法より一貫して優れていた。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:23:08 GMT)
SDP-CROWN: Efficient Bound Propagation for Neural Network Verification with Tightness of Semidefinite Programming [19.7] 本稿では,新しいハイブリッド検証フレームワークであるSDP-CROWNを提案する。
SDP-CROWNは、SDP緩和の厳密さと有界伝播検証器のスケーラビリティを組み合わせる。
最大65万のニューロンと247万のパラメータを持つ大モデル上での検証性能を著しく改善した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 05:06:07 GMT)
PartInstruct: Part-level Instruction Following for Fine-grained Robot Manipulation [19.6] 本稿では,パートレベルの命令を用いたロボット操作モデルの訓練と評価を行うための,最初の大規模ベンチマークであるPartInstructを紹介する。
PartInstructは、14のカテゴリにまたがる513のオブジェクトインスタンスで構成され、それぞれにアノテートされた部分レベルの情報と、16のタスククラスに編成された1302のきめ細かい操作タスクで構成されている。
トレーニングセットは3Dシミュレータで合成された1万以上のエキスパート・デモからなり、各デモは高レベルなタスク・インストラクション、ベース部分に基づくスキル・インストラクションの連鎖、およびオブジェクトとその部分に関する地中3D情報と組み合わせられる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:34:23 GMT)
Honey, I shrunk the hypothesis space (through logical preprocessing) [19.5] ILPシステムがそれを検索する前に仮説空間を縮めるアプローチを導入する。
本手法では,学習例に関わらず,最適仮説に適さないルールを見つけるために,背景知識を用いる。
実験の結果,予測精度を維持しながら学習時間を著しく短縮できることがわかった。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:53:02 GMT)
SAFER: A Calibrated Risk-Aware Multimodal Recommendation Model for Dynamic Treatment Regimes [18.9] 動的治療体制(DTR)のためのリスク対応型リコメンデーションフレームワークSAFERを紹介する。
SAFER は構造化 EHR と臨床ノートを統合し、互いに学習し、ラベルの不確実性に対処できるようにする。
実験により、SAFERは複数のレコメンデーション指標と対実死亡率で最先端のベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:05:43 GMT)
Identity Deepfake Threats to Biometric Authentication Systems: Public and Expert Perspectives [18.5] 生成AI(Gen-AI)のディープフェイクは、バイオメトリック認証に対して急速に進化する脅威となる。
専門家は、顔や音声認識などの静的なモダリティの偽造について、重大な懸念を表明している。
本稿では、悪意あるアクターが生体認証システムに対して使用する特定の攻撃ベクトルをマッピングする新しいDeepfake Kill Chainモデルを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:02:23 GMT)
Unlocking the Capabilities of Large Vision-Language Models for Generalizable and Explainable Deepfake Detection [18.1] 現在のLVLM(Large Vision-Language Models)は、マルチモーダルデータの理解において顕著な能力を示している。
深度検出のためのLVLMの潜在能力を解き放つ新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:33:19 GMT)
SafeLawBench: Towards Safe Alignment of Large Language Models [18.0] 大きな言語モデル(LLM)の安全性を評価するための明確な基準が欠如している。
SafeLawBenchは、法的基準に基づいて、安全リスクを3つのレベルに分類する。
24,860のマルチチョイス質問と1,106のオープンドメイン質問回答(QA)タスクで構成されている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:09:59 GMT)
WorldLLM: Improving LLMs' world modeling using curiosity-driven theory-making [17.8] LLM(Large Language Models)は、一般的な世界知識を持つが、シミュレーションのような構造化されたドメイン固有のコンテキストにおいて、正確な予測を生成するのに苦労することが多い。
本稿では,ベイジアン推論と自律能動探索と強化学習を組み合わせることで,LLMに基づく世界モデリングを促進するフレームワークWorldLLMを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:13:34 GMT)
Basis Transformers for Multi-Task Tabular Regression [17.6] 本稿では,表型データを扱う上での課題に対処するために,新しいテキストベーストランスフォーマーアーキテクチャを提案する。
我々の設計では、中央値R2$スコアの0.338と、OpenML-CTR23ベンチマークの34タスク間の標準偏差が最低値である。
我々のモデルは、最高のパフォーマンスのベースライン言語モデルよりも5倍少ないパラメータを持つ。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 21:29:25 GMT)
Generalization and Robustness of the Tilted Empirical Risk [17.5] 教師付き統計学習アルゴリズムの一般化誤差(リスク)は、これまで見られなかったデータに対する予測能力を定量化する。
指数的傾きにインスパイアされたcitetli 2020tiltedは、機械学習アプリケーションのための非線形リスク指標として、経験的リスク(TER)を傾けることを提案した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:10:54 GMT)
Vision-EKIPL: External Knowledge-Infused Policy Learning for Visual Reasoning [17.4] 本稿では,textbfVision-EKIPLと呼ばれる新しいRLフレームワークを提案する。
RLトレーニングプロセス中に外部補助モデルによって生成された高品質なアクションを導入し、ポリシーモデルの最適化を導く。
最先端(SOTA)と比較して、Reason-RFT-CoTベンチマークで最大5%の性能改善を実現している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:37:46 GMT)
TorchTitan: One-stop PyTorch native solution for production ready LLM pre-training [17.2] 本稿では,オープンソースのPyTorchネイティブ分散トレーニングシステムであるTorchTitanを紹介する。
最先端のテクニックを統一し、統合を合理化し、オーバーヘッドを減らす。
大型言語モデル (LLM) のLlama 3.1 ファミリー上での TorchTitan の評価を行った。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:16:22 GMT)
Reading in the Dark with Foveated Event Vision [16.8] RGBカメラを搭載した現在のスマートグラスは、低照度および高速な動作シナリオにおいて環境を知覚するのに苦労している。
スマートグラスのためのイベントベース光学文字認識(OCR)手法を提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 20:50:24 GMT)
PhysLab: A Benchmark Dataset for Multi-Granularity Visual Parsing of Physics Experiments [16.8] 我々は、複雑な物理実験を行う学生をキャプチャする最初のビデオデータセットであるPhysLabを紹介した。
このデータセットには4つの代表的な実験が含まれており、多様な科学機器と豊かな人間と物体の相互作用(HOI)パターンが特徴である。
PhysLabは620の長ビデオで構成され、さまざまなビジョンタスクをサポートするマルチレベルアノテーションを提供する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 02:28:24 GMT)
Black-Box Forgery Attacks on Semantic Watermarks for Diffusion Models [16.6] 攻撃者は、異なる潜在空間やアーキテクチャであっても、無関係なモデルを利用して、強力で現実的な偽造攻撃を行うことができることを示す。
第1は、対象の透かしを実画像に印字し、無関係のLCMにおいて任意の画像の潜在表現を操作する。
第2の攻撃は、透かし画像を反転させて任意のプロンプトで再生することにより、目標の透かしで新たな画像を生成する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 12:42:15 GMT)
The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity [16.3] 大規模な推論モデルは、回答を提供する前に詳細な思考プロセスを生成する。
我々は, LRM がある種の複雑さを超えて完全に精度の低下に直面していることを示す。
また、より深く推論の痕跡を調べ、探索された解のパターンを研究する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 22:42:29 GMT)
Graph Neural Networks in Modern AI-aided Drug Discovery [16.3] AI助薬発見のための強力なツールとして、グラフニューラルネットワーク(GNN)が登場した
GNNは、薬物様分子の複雑な位相的および幾何学的特徴を学ぶための直感的で表現力豊かなフレームワークを提供する。
本総説では薬物発見におけるGNNの方法論的基礎と代表的応用について概説する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 20:29:59 GMT)
GELD: A Unified Neural Model for Efficiently Solving Traveling Salesman Problems Across Different Scales [16.2] 本稿では,旅行セールスマン問題の解法として,GELDというニューラルネットワークを用いた新しい解法を提案する。
GELDは軽量なグローバルビュー推論(GE)とヘビーウェイトなローカルビューデコーダ(LD)を統合し、埋め込み表現を充実させる。
合成データセットと実世界のデータセットの両方で実施された大規模な実験は、GELDが7つの最先端モデルより優れていることを示した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:00:05 GMT)
A Survey of Retentive Network [16.1] Retentive Network(RetNet)は、ニューラルネットワークアーキテクチャの大幅な進歩を表し、Transformerの効率的な代替手段を提供する。
RetNetは、再帰の帰納バイアスと注意の世界的な依存性モデリングを統一する保持メカニズムを導入している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:09:26 GMT)
Label Distribution Learning using the Squared Neural Family on the Probability Simplex [15.7] ラベル分布学習モデルSNEFY-LDLを提案する。
単純体上の全ての可能なラベル分布の確率分布を推定する。
基礎構造ラベル分布を予測し、ラベル分布の信頼区間を構築し、異なるラベル間の相関を測定できる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 12:09:15 GMT)
Quantile Regression with Large Language Models for Price Prediction [15.3] 大規模言語モデル(LLM)は、回帰を含む構造化予測タスクにおいて有望であることを示している。
我々は,LLMが完全な予測分布を生成できる新しい量子レグレッション手法を提案する。
量子ヘッドを微調整したMistral-7Bモデルは、点推定と分布推定の両方において従来の手法よりも大幅に優れている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:19:28 GMT)
Stacey: Promoting Stochastic Steepest Descent via Accelerated $\ell_p$-Smooth Nonconvex Optimization [15.2] 我々は、非ユークリッドスムーズな最適化タスクを処理するために、Staceyと呼ばれる新しい高速化された$ell_p$急降下アルゴリズムを導入する。
アルゴリズムの基礎に関する理論的保証を提供するのに加えて、我々のアプローチと一般的な手法を実証的に比較する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:47:07 GMT)
The State-of-the-Art in Lifelog Retrieval: A Review of Progress at the ACM Lifelog Search Challenge Workshop 2022-24 [15.0] ACM Lifelog Search Challenge (LSC)は、ライフログデータの探索を支援するシステムを歓迎し、比較する会場である。
本稿では,2022年から2024年までのACM LSCにおける対話型ライフログ検索の最近の進歩を概観する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 10:19:37 GMT)
The Fundamental Limits of Structure-Agnostic Functional Estimation [14.9] 既存の一階法が最適であることを示す。
ブラックボックスニュアンス関数推定を用いた関数推定問題の定式化を行う。
この結果は,機能的推定におけるいくつかの明確なトレードオフを浮き彫りにした。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:12:28 GMT)
Neural Spectral Band Generation for Audio Coding [14.5] 私の研究は、パラメトリックな非ブラインド帯域拡張に対する新しいアプローチを提案する。
従来のスペクトル帯域レプリケーションは、オーディオ帯域拡張に対するよく確立されたパラメトリックアプローチである。
ディープニューラルネットワークに基づく音声帯域拡張手法が提案されている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:35:08 GMT)
ShapeICP: Iterative Category-level Object Pose and Shape Estimation from Depth [14.4] 単一深度画像からのカテゴリーレベルのオブジェクトのポーズと形状推定は、ロボット操作のようなタスクに潜在的に有用であることから、最近研究の注目を集めている。
以前の作業のほとんどは、未知の少なくとも1つのソリューションを得るためのデータ駆動アプローチに大きく依存しています。
従来の研究とは対照的に、ポーズアノテートされたデータから学習する必要のない反復推定手法を用いてこの問題にアプローチする。
提案アルゴリズムであるShapeICPは,反復的最近点(ICP)アルゴリズムに基づいているが,カテゴリレベルのポーズおよび形状推定タスクに付加的な機能を備えている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:56:49 GMT)
Monocular Dynamic Gaussian Splatting: Fast, Brittle, and Scene Complexity Rules [14.4] 我々は多くのガウススプティングに基づく手法を組織化し、ベンチマークし、分析する。
その違いがパフォーマンスに与える影響を定量化します。
ガウス法に基づく手法の高速なレンダリング速度は、最適化の脆さを犠牲にしている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 05:26:58 GMT)
Runtime Analysis of the SMS-EMOA for Many-Objective Optimization [14.3] 本稿では,多目的最適化のためのSMS-EMOAの厳密な分析を行う。
まず,2目的OJZJベンチマークを多目的に提案する。
SMS-EMOA は GSEMO と NSGA-II に匹敵する性能を示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:04:03 GMT)
Cavity Optomechanical Quantum Memory for Twisted Photons Using a Ring BEC [14.3] リングトラップに閉じ込められた原子ボース・アインシュタイン凝縮体をベースとした量子メモリプラットフォームを提案し,ラゲール・ガウスビームで駆動されるファブリ・ペロ空洞内に配置する。
電磁誘導による透過性に基づくプロトコルとは対照的に、我々のメモリは内部原子レベルの変化を必要としない。
代わりに、光状態は凝縮体の大きなヒルベルト空間に格納され、現在利用可能なものよりも3桁の保存時間が得られる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:09:17 GMT)
United Minds or Isolated Agents? Exploring Coordination of LLMs under Cognitive Load Theory [14.1] 大規模言語モデル(LLM)は、複雑で多面的なタスクに顕著なパフォーマンス天井を示す。
CoThinkerは認知的過負荷を軽減し、協調的な問題解決能力を高めるために設計された新しいフレームワークである。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:48:04 GMT)
Do Protein Transformers Have Biological Intelligence? [13.9] 我々は、9000以上のタンパク質データに有意なラベルを付与するタンパク質機能データセット、すなわちProtein-FNを導入する。
第2に、計算効率の良いタンパク質機能予測のための新しいトランスフォーマーアーキテクチャ、Sequence Protein Transformer (SPT) を考案する。
第3に、タンパク質モデルの決定過程を効率的に解釈できる、Sequence Scoreと呼ばれる新しい説明可能な人工知能(XAI)技術を開発した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:52:52 GMT)
ZeroDL: Zero-shot Distribution Learning for Text Clustering via Large Language Models [13.9] 大規模言語モデル(LLM)に向けたタスクを文脈化するための,シンプルで効果的な手法を提案する。
テキストクラスタリングタスクの有効性を示すとともに,テキストからテキストへのクラスタリングをLLMに委ねることで,複数のデータセットの改善を実現している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:44:07 GMT)
GLASS: Guided Latent Slot Diffusion for Object-Centric Learning [13.7] 本稿では,生成画像空間で学習するスロットアテンションモデルであるGLASSについて紹介する。
我々の実験は、GLASSが最先端のスロットアテンション手法を、(ゼロショット)オブジェクト発見のようなタスクの幅広いマージンで超越していることを示している。
GLASSは、複雑な現実的なシーンの合成生成にスロットアテンションを初めて適用することを可能にする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:45:15 GMT)
GraphRAG under Fire [13.7] この研究は、GraphRAGの攻撃に対する脆弱性を調べ、興味深いセキュリティパラドックスを明らかにする。
既存のRAG中毒攻撃は、GraphRAGのグラフベースのインデックスと検索により、従来のRAGよりも効果が低い。
GragPoisonは、基礎となる知識グラフの共有関係を利用して、有害なテキストを作る新しい攻撃だ。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:27:41 GMT)
SPC to 3D: Novel View Synthesis from Binary SPC via I2I translation [13.6] シングル光子カメラ(SPC)は、低照度と高照度の両方で、非常に高速な撮像を可能にする。
SPC画像のバイナリの性質は、特にテクスチャや色において、深刻な情報損失をもたらす。
本稿では,バイナリSPC画像を高品質なカラー化新規ビューに変換するモジュール型2段階フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:33:21 GMT)
Learning Robust Heterogeneous Graph Representations via Contrastive-Reconstruction under Sparse Semantics [13.6] マスケードオートエンコーダ(MAE)とコントラスト学習(CL)はグラフ自己教師学習において2つの重要なパラダイムである。
本稿ではヘテロジニアスグラフのための新しい二チャンネル自己教師型学習フレームワークHetCRFを紹介する。
HetCRFは2段階のアグリゲーション戦略を用いて埋め込みセマンティクスを適応し、MAEとCLの両方と互換性がある。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:35:42 GMT)
On Adversarial Robustness of Language Models in Transfer Learning [13.4] 転送学習は、標準的なパフォーマンス指標を改善する一方で、敵攻撃に対する脆弱性の増加につながることがよく示される。
以上の結果から, モデルサイズ, アーキテクチャ, 適応手法の複雑な相互作用が示唆された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:27:26 GMT)
Mind the Gap: A Readability-Aware Metric for Test Code Complexity [13.3] 単体テストに適したテスト意識認知複雑度尺度であるCCTRを紹介する。
EvoSuite, GPT-4o, Mistral Large-1024が生成した15,750のテストスイートをDefects4JおよびSF110から350クラスにわたって評価した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:16:13 GMT)
Beyond Surface Similarity: Evaluating LLM-Based Test Refactorings with Structural and Semantic Awareness [13.3] CTSESは、CodeBLEU、METEOR、ROUGE-Lを統合した複合計量であり、振る舞い、語彙的品質、構造的アライメントのバランスをとる。
我々の結果は、CTSESは既存のメトリクスよりも、開発者の期待と人間の直感に合わせた、より忠実で解釈可能な評価を得られることを示しています。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:18:17 GMT)
Denoising Programming Knowledge Tracing with a Code Graph-based Tuning Adaptor [13.1] プログラミング知識追跡は、学習者のコーディング活動に基づいたプログラミング知識の習得レベルを動的に診断することを目的としている。
ノイズの影響を識別・緩和し,既存のPKTモデルを強化するためのコードグラフベースのチューニングアダプタであるCodaを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:15:26 GMT)
Legal Mathematical Reasoning with LLMs: Procedural Alignment through Two-Stage Reinforcement Learning [12.9] 法的な数学的推論は、大規模言語モデル(LLM)を高い法的文脈に適用するために不可欠である。
中国初の法的数学的推論ベンチマークであるLexNumを提示する。
また、効率的な法的推論訓練のための2段階強化学習フレームワークであるLexPamを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:22:31 GMT)
DONUT: A Decoder-Only Model for Trajectory Prediction [12.9] トラジェクトリをアンロールするデコーダオンリーネットワークであるDONUTを提案する。
我々は、過去の軌跡を符号化し、単一の自己回帰モデルで将来の軌跡を予測する。
実験により、デコーダのみのアプローチがエンコーダ-デコーダベースラインより優れていることを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:24:29 GMT)
Measurement to Meaning: A Validity-Centered Framework for AI Evaluation [12.6] 我々は、利用可能な証拠から得られる評価的クレームのタイプを推論するための構造化されたアプローチを提供する。
私たちのフレームワークは、機械学習の現代的なパラダイムに適しています。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 20:35:52 GMT)
Polar Hierarchical Mamba: Towards Streaming LiDAR Object Detection with Point Clouds as Egocentric Sequences [12.4] リアルタイム物体検出は、リアルタイム認識が低レイテンシと高スループットを必要とする自動運転車にとって不可欠である。
最近のMambaベースの状態空間モデル(SSM)は、LiDARの認識を約束しているが、フルスキャン環境でのみである。
我々は、極座標ストリーミングLiDAR用に設計された新しいSSMアーキテクチャであるPolar Hierarchical Mambaを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 22:53:50 GMT)
Controllable Coupled Image Generation via Diffusion Models [12.4] 結合画像生成のタスクに対する注意レベル制御法を提案する。
提案手法は,モデルのクロスアテンションモジュールの背景およびエンティティコンポーネントをアンハングリングする。
この重み制御パラメータの列を、背景の結合性やテキスト・画像のアライメント、全体的な視覚的品質を評価するために、組み合わせた目的で最適化する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:09:08 GMT)
PlanGenLLMs: A Modern Survey of LLM Planning Capabilities [12.3] LLMは計画を生成する大きな可能性を秘めており、初期世界の状態を望ましい目標状態に変換する。
これらのシステムの多くは特定の問題に適応しており、それらを比較したり、新しいタスクに最適なアプローチを決定することは困難である。
我々の調査は、このギャップを埋めるために、現在のLLMプランナの概要を概観することを目的としている。
1990年、カルタムとウィルキンスによる基礎研究に基づいて、完全性、実行可能性、最適性、表現、一般化、効率の6つの重要な性能基準を検証した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 22:56:33 GMT)
CVC: A Large-Scale Chinese Value Rule Corpus for Value Alignment of Large Language Models [12.2] 本研究では,中国中核値に基づく階層的価値枠組みを提案し,主次元3,コア値12,派生値50を包含する。
我々は,人間のアノテーションによって拡張・拡張された25万以上の値規則を含む大規模中国価値コーパス(CVC)を構築した。
われわれの研究は、中国の特徴を表す総合的な価値評価とアライメントのための文化的適応型ベンチマークフレームワークを確立する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:06:31 GMT)
MutualNeRF: Improve the Performance of NeRF under Limited Samples with Mutual Information Theory [12.1] 本稿では,限定サンプル下でのニューラルレーシアンスフィールド(NeRF)性能向上フレームワークであるMutualNeRFを紹介する。
我々は、画像間の相関を均一に測定する指標として、単純だが理論的に堅牢な概念であるMutual Informationを導入する。
限られたサンプル下での実験では、異なる設定で最先端のベースラインよりも一貫した改善が見られた。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:20:53 GMT)
CleanVul: Automatic Function-Level Vulnerability Detection in Code Commits Using LLM Heuristics [12.1] 本稿では,Large Language Model (LLM) を用いて,VFCからの脆弱性修正変更を自動的に識別する手法を提案する。
VulSifterは大規模な研究に適用され、GitHubで127,063のリポジトリをクロールした。
次に,8,203個の関数からなる高品質なデータセットであるCleanVulを開発した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:32:18 GMT)
Hi-LSplat: Hierarchical 3D Language Gaussian Splatting [11.8] Hi-LSplatは3Dオープン語彙クエリのためのビュー一貫性のある階層型言語ガウシアンスプラッティングである。
2つの階層的なセマンティックデータセットを構築し、異なるセマンティックレベルを識別するモデルの能力をよりよく評価する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:56:19 GMT)
from Benign import Toxic: Jailbreaking the Language Model via Adversarial Metaphors [11.8] 本稿では,AdVersArial meTAphoR(AVATAR)を利用して大規模言語モデルを誘導し,脱獄の悪質な隠喩を校正する新たな攻撃フレームワークを提案する。
AVATARは脱獄性LDMを効果的かつ効果的に導入できることを示す実験結果が得られた。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:56:14 GMT)
Mitigating Object Hallucination via Robust Local Perception Search [11.6] 局所知覚探索(Local Perception Search, LPS)は、単純かつ訓練のない推論における復号法であり、幻覚を効果的に抑制する。
LPSはベースラインに比べて幻覚の発生率を著しく低下させ,特に騒音条件下では異常な性能を示した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:27:26 GMT)
AI-Generated Compromises for Coalition Formation [11.4] エージェント提案間の妥協を見つけることは、議論、調停、交渉のようなAIサブフィールドの基本である。
エージェント境界合理性と不確実性を組み込んだモデルを定式化し、妥協提案を生成するAI手法を開発する。
提案手法では,自然言語処理技術と大規模言語モデルを用いて,テキスト上の意味的距離空間を誘導する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:28:27 GMT)
FiRe: Fixed-points of Restoration Priors for Solving Inverse Problems [11.4] ニューラルネットワークの認知に基づく暗黙の先行は、広く使われているアルゴリズムの中心となっている。
本稿では,前兆の概念を拡大するための新しい枠組みとして,前兆の固定点(FiRe)を導入する。
一般的な復元モデルです
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:52:50 GMT)
Rewriting the Budget: A General Framework for Black-Box Attacks Under Cost Asymmetry [11.3] 非対称なクエリコストで決定に基づく攻撃を行うための一般的なフレームワークを提案する。
異なるクエリタイプのバランスをとることで、総攻撃コストを最小限に抑える効率的なアルゴリズムを設計する。
提案手法は,既存手法に比べてクエリコストを一貫して低減し,摂動を小さくする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 22:02:27 GMT)
EndoARSS: Adapting Spatially-Aware Foundation Model for Efficient Activity Recognition and Semantic Segmentation in Endoscopic Surgery [11.3] 内視鏡手術は、ロボットによる最小侵襲手術のための金の標準である。
従来のディープラーニングモデルは、しばしばクロスアクティビティな干渉に悩まされ、下流の各タスクで最適以下のパフォーマンスをもたらす。
本研究では,内視鏡下手術活動認識とセマンティックセグメンテーションに特化して設計された,新しいマルチタスク学習フレームワークであるEndoARSSを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:18:43 GMT)
Can LLMs Generate Reliable Test Case Generators? A Study on Competition-Level Programming Problems [11.1] 大規模言語モデル(LLM)は、推論中に複雑なタスクに対処できるコード生成において顕著な能力を示している。
テストケースジェネレータ(LLM生成)のベンチマークであるTCGBenchを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:53:03 GMT)
ASPO: Constraint-Aware Bayesian Optimization for FPGA-based Soft Processors [11.1] ASPO は BO がカテゴリーパラメータを含む制約を扱えるように、解離形式を利用するアプローチである。
ASPOは、新しくカスタマイズされたBO共分散カーネルを使用してカテゴリパラメータをサポートする。
また、BO取得関数を潜在的評価時間でペナルティすることで、設計評価手順を高速化する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:46:40 GMT)
nvBench 2.0: Resolving Ambiguity in Text-to-Visualization through Stepwise Reasoning [10.9] 我々は、不明瞭なシナリオでText2VISシステムを評価するための新しいベンチマークであるnBench 2.0を紹介する。
nvBench 2.0には7,878の自然言語クエリと24,076の視覚化が含まれている。
我々はまた、nvBench 2.0でトレーニングされたLLMベースのモデルであるStep-Text2Visを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:35:57 GMT)
Exploring Visual Prompting: Robustness Inheritance and Beyond [10.9] ビジュアル・プロンプティング(VP)が直面するトレードオフを軽減するため,PBL(Prompt Boundary Loosening)という戦略を提案する。
VPと自然に互換性のある軽量なプラグアンドプレイ戦略として、PBLは、ソースモデルがロバストモデルであるときに、効果的にロバストネスの継承を成功させる。
我々の発見は普遍的であり、提案した戦略の重要な利点を実証している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:56:32 GMT)
DivScore: Zero-Shot Detection of LLM-Generated Text in Specialized Domains [10.7] DivScoreは、正規化エントロピーに基づくスコアリングとドメイン知識の蒸留を用いたゼロショット検出フレームワークである。
我々は、DivScoreが、AUROCが14.4%、リコールが64.0%、最先端の検出器を一貫して上回っていることを示す。
敵対的な設定では、DivScoreは他のベースラインよりも優れた堅牢性を示し、AUROCでは平均22.8%、リコールでは29.5%の優位性を達成した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:03:35 GMT)
Conditional Denoising Diffusion for ISAC Enhanced Channel Estimation in Cell-Free 6G [10.7] ISAC (Cell-free Integrated Sensing and Communication) は、第6世代 (6G) ネットワークに革命をもたらすことを目的としている。
チャネル推定は、セルレスISACシステムにおいて、信頼性の高い通信を保証するための重要なステップである。
本稿では, 条件付き騒音拡散モデルにおいて, 感覚情報を重要な入力として活用する新しい枠組みを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 22:45:21 GMT)
Understanding Sharpness Dynamics in NN Training with a Minimalist Example: The Effects of Dataset Difficulty, Depth, Stochasticity, and More [10.7] シャープさのあるディープニューラルネットワークをトレーニングする場合、安定性の端で飽和する前に、しばしば増加する。
本研究では、この現象をミニマリストモデル、すなわち1層に1つのニューロンを持つディープ線形ネットワークを用いて研究する。
この単純なモデルは、最近の経験的研究で観察されたシャープネスのダイナミクスを効果的に捉え、ニューラルネットワークのトレーニングをよりよく理解するための簡単なテストベッドを提供する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 22:35:13 GMT)
Free Random Projection for In-Context Reinforcement Learning [10.6] 自由確率論に基づく入力写像である自由ランダム射影を導入する。
フリーランダムプロジェクションは、既存のコンテキスト内強化学習フレームワークにシームレスに統合される。
マルチ環境ベンチマークの実証結果は、自由乱射影が標準乱射影よりも一貫して優れていることを示している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:36:09 GMT)
Mixture of Small and Large Models for Chinese Spelling Check [10.6] 大規模言語モデル (LLM) の時代、中国語のスペルチェック (CSC) タスクは様々な LLM 手法が開発されてきた。
高品質なドメインデータに依存した細調整のBERTベースのモデルは優れた性能を示すが、編集パターンの過度な適合に悩まされている。
本稿では,ビーム探索復号フェーズにおける小型モデルとLCMの確率分布を効果的に組み合わせた動的混合手法を提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:29:10 GMT)
How do datasets, developers, and models affect biases in a low-resourced language? [10.3] mBERTとBanglaBERTを用いた感情分析モデルのアルゴリズムによる評価を行った。
分析の結果,BSAモデルは類似のセマンティックな内容や構造を持つにもかかわらず,異なるアイデンティティカテゴリーに偏りが認められた。
また,事前学習したモデルと,多様な背景を持つ個人が作成したデータセットを組み合わせることで生じる不整合や不確実性についても検討した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:46:35 GMT)
SOPHY: Learning to Generate Simulation-Ready Objects with Physical Materials [10.2] SOPHYは3次元物理を意識した形状合成のための生成モデルである。
本手法は, 物理接地力学に関連する形状, テクスチャ, 材料特性を共同で合成する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:07:23 GMT)
Equilibrium Distribution for t-Distributed Stochastic Neighbor Embedding with Generalized Kernels [10.0] 一般化されたカーネルによるt-SNEの収束について検討し、2023年に Auffinger と Fletcher の結果を拡張した。
特定の条件下では、データポイントの数が分散するにつれて、t-SNEアルゴリズムは幅広い入出力カーネルの平衡分布に収束することを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:37:00 GMT)
Stepwise Decomposition and Dual-stream Focus: A Novel Approach for Training-free Camouflaged Object Segmentation [9.9] 我々は、textbfMultimodal textbfStepwise textbfDecomposition Chain of Thought (MSD-CoT) を介して textbfRegion-constrained textbfDual-stream textbfVisual textbfPrompting (RDVP) を相乗化する新しいトレーニングフリーなテスト時間適応フレームワークを提案する。
RDVPは、前景と背景点の視覚的プロンプトを視覚的および独立的にサンプリングする空間的制約を注入し、意味的相違を効果的に緩和する
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:50:26 GMT)
ASMA: An Adaptive Safety Margin Algorithm for Vision-Language Drone Navigation via Scene-Aware Control Barrier Functions [9.6] VLNを運用するドローンプラットフォームについて検討し、新しいシーン認識CBFを定式化することによって安全性を向上させる。
CBFのないベースラインシステムは、コマンドを順序づけられたランドマークのシーケンスに変換するために、モーダルな注意を持つビジョンランゲージを使用する。
ASMAは移動物体を追跡し、シーン認識CBF評価をオンザフライで実行し、追加の制約として機能する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:26:59 GMT)
Automated Repair of Ambiguous Natural Language Requirements [9.4] ソフトウェア工学における大規模言語モデル(LLM)は、自然言語(NL)の役割を増幅している。
我々は、コード生成の不確実性を低減してアプローチするあいまいなNL要求の自動修復を導入する。
我々の結果は、SpecFixが要求の23.93%を修正し、修正された要求に対して33.66%のモデルPass@1が改善されたことを示している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:36:11 GMT)
Graph-based RAG Enhancement via Global Query Disambiguation and Dependency-Aware Reranking [9.3] PankRAGはグローバルに認識され、階層的なクエリ解決戦略である。
解決されたサブクエリ間の依存関係構造を利用するために、依存性対応のリランカを適用する。
PankRAGは、複数のベンチマークで最先端のアプローチを一貫して上回っている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:17:14 GMT)
Harnessing Vision-Language Models for Time Series Anomaly Detection [9.3] 時系列異常検出(TSAD)は、医療、金融、産業モニタリングなど様々な分野で重要な役割を果たしてきた。
従来の手法は、主に数値データに基づくドメイン固有モデルの訓練に重点を置いていたが、人間の専門家が文脈異常を識別しなければならない視覚的時間的推論能力は欠如している。
比較的軽量な事前学習型ビジョンエンコーダ上に構築された視覚スクリーニングステージであるViT4TSと,グローバルな時間的コンテキストとVLM推論能力を統合するVLM4TSという2段階のソリューションを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:27:30 GMT)
KNN-Defense: Defense against 3D Adversarial Point Clouds using Nearest-Neighbor Search [9.0] KNN-Defense という防衛戦略が提案され、多様体の仮定と特徴空間における最近傍探索が基礎となっている。
トレーニングセットから隣接するサンプルのセマンティックな類似性を活用することで、入力を復元する。
ModelNet40データセットの実証的な結果は、KNN-Defenseが様々な攻撃タイプにわたってロバスト性を大幅に改善することを示した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:54:02 GMT)
A Novel Quantum Realization of Jet Clustering in High-Energy Physics Experiments [8.8] 高エネルギー粒子衝突ではクォークとグルーオンが生成され、すぐにジェットとして知られる衝突粒子噴霧を形成する。
正確なジェット・クラスタリングは、起源のクォークやグルーオンの情報を保持するために重要である。
この研究は、ジェットクラスタリングに革命をもたらす量子コンピューティングの可能性を強調した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:59:00 GMT)
Harnessing On-Device Large Language Model: Empirical Results and Implications for AI PC [8.8] エッジデバイス上の大規模言語モデル(LLM)は、大きなプライバシー上のメリットを提供する。
これらのオンデバイスLSMは、モデル容量の削減と必要な圧縮技術のために本質的に性能上の制限に直面している。
デバイス上でのLCMを評価するために,モデル能力,開発効率,システム資源を包含する体系的方法論を導入する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 02:45:47 GMT)
Prediction-Enhanced Monte Carlo: A Machine Learning View on Control Variate [8.8] 予測強化モンテカルロ(PEMC)は、最新のMLモデルを予測子として活用するフレームワークである。
PEMCは不偏性を維持しながらばらつきを一貫して減らし、標準モンテカルロの基準線を強力に強化する可能性を強調している。
PEMCのより広範な有効性と汎用性は、局所的なボラティリティモデルに基づく分散スワップのような株式デリバティブと、ヒース・ジャロー・モートン(HJM)金利モデルに基づく交換価格などの金利デリバティブの3つの例を通して説明する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:51:59 GMT)
Certifiably Robust Model Evaluation in Federated Learning under Meta-Distributional Shifts [8.7] 異なるネットワーク "B" 上でモデルの性能を保証する。
我々は、原則付きバニラDKWバウンダリが、同じ(ソース)ネットワーク内の未確認クライアント上で、モデルの真のパフォーマンスの認証を可能にする方法を示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:54:52 GMT)
Breaking Data Silos: Towards Open and Scalable Mobility Foundation Models via Generative Continual Learning [8.7] 我々はモビリティ基盤モデルのトレーニングのためのスケーラブルでプライバシ保護のフレームワークであるMoveGCLを提案する。
MoveGCLは、凍結教師モデルから生成された合成軌跡を再生することにより、分散モデルと進行モデルの進化を可能にする。
6つの実世界の都市データセットの実験は、MoveGCLがジョイントトレーニングに匹敵するパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:19:11 GMT)
Active Contour Models Driven by Hyperbolic Mean Curvature Flow for Image Segmentation [8.7] 平均曲率フロー駆動型アクティブ輪郭モデル (PMCF-ACM) は画像セグメンテーションにおいて広く用いられている。
可変初期速度場を導入した双曲型平均曲率流駆動型ACMを提案する。
実験により、HMCF-ACMとHDRF-ACMの両方がより正確なセグメンテーションを実現できることが示された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:29:40 GMT)
LLMs Can Simulate Standardized Patients via Agent Coevolution [8.5] 標準化された患者(SP)を用いた医療従事者の養成は、依然として複雑な課題である。
EvoPatientは、患者エージェントと医師エージェントがマルチターン対話を通じて診断プロセスをシミュレートする、新しいシミュレートされた患者フレームワークである。
我々のフレームワークは、既存の推論手法を10%以上改善し、要求アライメントと人間の嗜好を改善する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 02:01:42 GMT)
AI PsyRoom: Artificial Intelligence Platform for Segmented Yearning and Reactive Outcome Optimization Method [8.3] 心理学的カウンセリングは、メンタルヘルスサービスの需要の増加と専門職の不足により、大きな課題に直面している。
大規模言語モデル(LLM)は、心理学的カウンセリング、特に共感と感情的支援を支援する可能性がある。
本稿では,共感的,感情的ニュアンスのある会話を生成することで,心理カウンセリングを強化するためのマルチエージェント・シミュレーション・フレームワークであるAI PsyRoomを紹介する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 10:01:55 GMT)
JESTR: Joint Embedding Space Technique for Ranking Candidate Molecules for the Annotation of Untargeted Metabolomics Data [8.2] 本稿ではアノテーションのための新しいパラダイム(JESTR)を紹介する。
分子指紋やスペクトルを明示的に構築する従来のアプローチとは異なり、JESTRはそれらの表現を結合空間に効果的に埋め込む。
JESTRを3つのデータセット上でmol-to-specおよびspec-to-FPアノテーションツールに対して評価する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:23:44 GMT)
An Adaptively Inexact Method for Bilevel Learning Using Primal-Dual Style Differentiation [8.1] 線形演算子を学習するための二段階学習フレームワークを検討する。
このフレームワークでは、学習可能なパラメータは、凸最適化問題の解法にも依存する損失関数によって最適化される。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:21:01 GMT)
Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning [8.0] 本稿では,車線描画画像の異常検出を分類問題に変換する。
本研究では,データ前処理,マスク付き画像モデリング(MiM)手法による自己教師付き事前学習,ラベル平滑化によるクロスエントロピーベース損失を用いた微調整,後処理からなる4相パイプラインを提案する。
その結果,提案パイプラインは車線描画画像異常検出において優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 22:29:37 GMT)
EV-LayerSegNet: Self-supervised Motion Segmentation using Event Cameras [8.0] イベントベースの動作セグメンテーションのための自己教師型CNNであるEV-LayerSegNetを紹介する。
シーンダイナミクスの階層化表現に着想を得て,アフィン光フローとセグメンテーションマスクを別々に学習することが可能であることを示す。
我々は、アフィンの動きのみを模擬したデータセット上でネットワークをトレーニングし、IoUを達成し、検出率は最大71%と87%である。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:07:59 GMT)
LADSG: Label-Anonymized Distillation and Similar Gradient Substitution for Label Privacy in Vertical Federated Learning [7.8] 本稿では,勾配置換,ラベルの匿名化,異常検出を統合した統一防衛フレームワークを提案する。
LADSGはラベル推論攻撃の成功率を30-60%削減し、計算オーバーヘッドを最小限に抑える。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 10:10:56 GMT)
Verifying Fault-Tolerance of Quantum Error Correction Codes [7.8] 大規模フォールトトレラント量子コンピューティングは、ノイズを抑制するために量子エラー訂正符号(QECC)に依存している。
本稿では,量子プログラム言語におけるQECC実装のフォールトトレランスを定式化する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:31:08 GMT)
EasyFS: an Efficient Model-free Feature Selection Framework via Elastic Transformation of Features [7.8] 本稿では,従来のモデル認識手法よりも優れた性能を実現するために,機能拡張と圧縮による効率的なモデルフリー特徴選択フレームワーク,すなわちEasyFSを提案する。
21の異なるデータセットの実験では、EasyFSは回帰タスクの10.9%、分類タスクの5.7%で最先端のメソッドよりも優れており、時間の94%以上を節約している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:43:16 GMT)
Learning Distribution-Wise Control in Representation Space for Language Models [7.8] 学習可能な介入は、概念のサブスペースにポイントワイズ制御を適用することを目的としており、ハイレベルな振る舞いを変更するのに有効であることが証明されている。
我々は、このアプローチを分布レベルにまで拡張し、モデルがポイントワイズ変換だけでなく、概念部分空間の周辺領域も学習できるようにする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:52:58 GMT)
SPHERE: Unveiling Spatial Blind Spots in Vision-Language Models Through Hierarchical Evaluation [7.7] 現在の視覚言語モデルは、基本的な空間的手がかりを把握できるが、人間のような理解や現実世界の応用に必要な多次元空間的推論に苦慮している。
我々は,新しい人間注釈付きデータセットをサポートする階層的評価フレームワークであるSPHEREを開発した。
最先端モデルのベンチマーク評価では、特に距離と近接性についての推論において、重大な欠陥が示される。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:56:54 GMT)
IQFM A Wireless Foundational Model for I/Q Streams in AI-Native 6G [7.5] 本稿では,無線通信における最初のI/Q信号基礎モデルであるIQFMについて述べる。
IQFMは変調分類、AoA、ビーム予測、RFフィンガープリントといった様々なタスクをサポートする。
また、タスク対応強化戦略を導入し、変換をコア拡張に分類する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:01:38 GMT)
Scoring the Unscorables: Cyber Risk Assessment Beyond Internet Scans [7.4] パブリックかつ容易に利用可能な技術シグネチャを用いて、高度に正確なサイバーリスク評価モデルを構築することが可能であることを示す。
我々の研究では、これらの技術署名と組織のサイバーセキュリティ姿勢には強い関係があることが示されています。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:44:09 GMT)
PCoT: Persuasion-Augmented Chain of Thought for Detecting Fake News and Social Media Disinformation [7.4] 我々は、ゼロショット分類における偽情報検出を改善するために、PCoT(Persuasion-Augmented Chain of Thought)を導入する。
オンラインニュースやソーシャルメディアの投稿でPCoTを広範囲に評価した。
われわれは、EUDisinfoとMultiDisの2つの新しい最新の偽情報データセットを公開している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:46:02 GMT)
Scaling over Scaling: Exploring Test-Time Scaling Plateau in Large Reasoning Models [7.3] 大規模推論モデル(LRM)は、内部テストタイムスケーリングによる推論性能の向上能力を示した。
これらのスケーリング境界を推し進めるにつれて、現実的な限界を理解し、最適なリソース割り当てを達成することが重要な課題となります。
本稿では,テストタイムスケーリングのスケーリングプレートを調査し,TTSPM(Test-Time Scaling Performance Model)を導入する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 22:18:32 GMT)
Graph-Based Physics-Guided Urban PM2.5 Air Quality Imputation with Constrained Monitoring Data [7.1] この研究はグラフベースの物理誘導学習フレームワークであるGraPhyを紹介した。
カリフォルニアの社会経済的に不利なサンホアキン・バレーのデータを用いた実験では、GraPhyは平均二乗誤差(MSE)、平均絶対誤差(MAE)、R-二乗値(R2)で評価された全体的な最高の性能を達成し、様々なベースラインモデルと比較してパフォーマンスを9%から56%改善した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 20:33:52 GMT)
Non-Intrusive Load Monitoring Based on Image Load Signatures and Continual Learning [7.1] 非侵入負荷モニタリングは、回路内の各電気機器の動作状態とエネルギー消費を特定する。
本稿では,「画像負荷シグネチャ」と連続学習を統合した非侵入的負荷監視手法を提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:13:15 GMT)
Distributionally Robust Learning in Survival Analysis [6.9] 我々は、分散ロバスト学習(DRL)アプローチをCoxレグレッションに組み込む革新的なアプローチを導入する。
DRLフレームワークをワッサーシュタイン距離に基づく曖昧性集合で定式化することにより、基礎となるデータ分布の仮定に敏感でない変種コックスモデルを開発する。
従来の手法と比較して,予測精度とロバスト性の観点から,回帰モデルが優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 21:40:39 GMT)
Rescaled Influence Functions: Accurate Data Attribution in High Dimension [6.8] 本稿では,データ帰属のための新しいツールであるRescaled Influence Function (RIF) について述べる。
実世界のデータセットでIFとRIFを比較し,実世界の予測精度が大幅に向上したことを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:19:21 GMT)
A Deep RL Approach on Task Placement and Scaling of Edge Resources for Cellular Vehicle-to-Network Service Provisioning [6.8] エッジリソースのサービスタスク配置とスケーリングの相互依存問題に対処する。
本稿では,ハイブリッド行動空間で動作する新しいDeep Reinforcement Learning (DRL) アプローチを提案する。
実世界のC-V2Nトラフィックデータセットを用いたシミュレーションによりDHPGの性能を評価する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:26:58 GMT)
Verified Universal Breakdown of Kibble-Zurek Scaling in Fast Quenches [6.6] 十分に高速なクエンチの下では、欠陥密度と凍結時間がクエンチ速度から独立し、クエンチ範囲と普遍的にスケールする。
本研究では,Landau-Zenerモデルと1D Rice-Meleモデルにおける高速量子クエンチをシミュレートするために,単一イオン量子ビットを用いてこの予測を実験的に検証した。
以上の結果から, 高速クエンチ下でのKZMの普遍性低下が予測されたことの直接的実験的証拠が得られた。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:44:41 GMT)
Feint Behaviors and Strategies: Formalization, Implementation and Evaluation [6.6] フェント行動は、ほとんどの競争力のあるマルチプレイヤーゲームにおいて重要な戦術である。
アクションレベルと戦略レベルの両方において、初となるフェント行動の包括的形式化を導入する。
マルチプレイヤーゲームにおいて,具体的実装と定量的評価を行う。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:22:33 GMT)
Dialogue Without Limits: Constant-Sized KV Caches for Extended Responses in LLMs [6.2] 精度を保ちながら一定サイズのKVキャッシュを維持する推論時間手法であるMorphKVを提案する。
保持や損失圧縮とは異なり、MorphKVは最近のトークンの注意パターンによってガイドされる軽量更新を通じてKVキャッシュを反復的に洗練する。
我々の研究では、52.9$%のメモリセーブと18.2$%の精度が、最先端の先行研究と比較して高いことを示している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:03:06 GMT)
Analysis of Thompson Sampling for Controlling Unknown Linear Diffusion Processes [6.1] 線形拡散過程は、不確実性の下での動的決定のための標準連続時間モデルとして機能する。
未知のドリフト行列を持つ線形拡散過程における決定のためのトンプソンサンプリングアルゴリズムについて検討する。
我々は,トンプソンサンプリングが最適制御動作を高速に学習することを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 21:53:52 GMT)
Experimental Evaluation of Static Image Sub-Region-Based Search Models Using CLIP [5.7] マルチモーダルテキストイメージモデルは、広範な画像コレクションにおいて効果的なテキストベースのクエリを可能にした。
本研究では,不明瞭なテキストクエリを補完する位置ベースのプロンプトを追加することで,検索性能が向上するかどうかを検討する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 22:31:24 GMT)
SAFE: Finding Sparse and Flat Minima to Improve Pruning [5.5] 平坦度を目的とする空間制約最適化問題としてプルーニングを定式化する。
本稿では,SAFEと拡張されたSAFE$+$を提案する。
SAFEは、競争力と確立されたベースラインを比較することで、より優れた一般化性能を持つスパースネットワークを一貫して獲得する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:12:03 GMT)
Learning What Matters Now: A Dual-Critic Context-Aware RL Framework for Priority-Driven Information Gain [5.5] 本稿では,CA-MIQ (Context-Aware Max-Information Q-learning) を提案する。
ビルトインシフト検出器は、過渡的な探索と選択的批評家のリセットをトリガーし、優先修正後のエージェントの再フォーカスを可能にする。
CA-MIQはミッション・サクセス・レートの約4倍の精度で達成される。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 12:55:10 GMT)
SAR2Struct: Extracting 3D Semantic Structural Representation of Aircraft Targets from Single-View SAR Image [5.5] 本稿では,SARターゲット構造回復という新しい課題を提案する。
ターゲットのコンポーネントと、そのコンポーネント間の構造的関係を、単一ビューのSAR画像から推測することを目的としている。
実験により各ステップの有効性を検証し,航空機目標の3次元的構造表現をSAR画像から直接抽出できることを初めて実証した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 10:57:30 GMT)
Stochastic Training for Side-Channel Resilient AI [5.4] 電力と電磁放射を利用するサイドチャネル攻撃は、エッジデバイス上で訓練されたAIモデルを脅かす。
本稿では,このような脅威に対するレジリエンスを高めるための新しいトレーニング手法を提案する。
Google Coral Edge TPUの実験結果は、サイドチャネルのリークが減少し、tスコアが20,000以上のトレースよりも遅くなったことを示している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:10:03 GMT)
FREE: Fast and Robust Vision Language Models with Early Exits [5.4] 我々は、GANベースのフレームワークにおいて、敵対的なトレーニングアプローチであるFREEを紹介する。
提案手法は,最小限の性能低下で推論速度を向上する入力適応推論を実行することに焦点を当てる。
我々は,提案手法が比較性能を維持しつつ,1.51倍以上の速度で推論処理を高速化することを確認した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:26:58 GMT)
Differentially Private Sparse Linear Regression with Heavy-tailed Responses [5.2] 本稿では,高次元条件下での重み付き応答を用いたDPスパース線形回帰の包括的研究を行う。
DP-IHT-H法は,ハマー損失とプライベート反復硬度閾値を利用して (tildeObiggl( s* frac12) cdot biggl(fraclog dnbiggr)fraczeta1 + zeta1 + zeta2 + 2zetaの誤差境界を求める。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:56:20 GMT)
FedALT: Federated Fine-Tuning through Adaptive Local Training with Rest-of-World LoRA [5.2] ファインチューニングされた大型言語モデル(LLM)は、プライバシ保護の適応を可能にするが、モデルアグリゲーションによるクロスクライアント干渉に悩まされる。
我々は,新しいパーソナライズされたLoRAファインチューニングアルゴリズムである textbfFedALT を提案する。
我々は、FedALTが、最先端のパーソナライズされたLoRAファインチューニング手法を著しく上回っていることを実証した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:17:03 GMT)
A Concise Primer on Solid-State Quantum Emitters [5.1] 量子エミッタは、オンデマンドのフォトニック資源として必須である。
量子ドット、ダイヤモンドの欠陥センター、炭化ケイ素の欠陥センターの3つのプラットフォームを強調します。
量子通信、計算、センシングを含む量子応用におけるそれらの進歩について論じる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:47:50 GMT)
Emergent Viscous Hydrodynamics From a Single Quantum Particle [5.0] 本研究では,空間的デコヒーレンスが,開放量子系のリアルタイム長波長状態における流体力学的挙動にどのように寄与するかを考察する。
我々の結果は、数自由度を持つ量子系における流体力学の挙動の開始について、新たな光を放った。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:29:28 GMT)
Curvature Enhanced Data Augmentation for Regression [4.9] 回帰タスクに対する曲率強化マニフォールドサンプリング(CEMS)手法を提案する。
CEMSは、ディストリビューションとアウト・オブ・ディストリビューションの両方のシナリオで優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:18:37 GMT)
Linear Discriminant Analysis with Gradient Optimization on Covariance Inverse [4.9] 線形識別分析(LDA)は統計的パターン認識と分類の基本的な方法である。
本研究では,勾配降下による逆共分散行列を直接最適化する手法である勾配最適化付きLDA(LDA-GO)を提案する。
このアルゴリズムは、コレスキー分解を通じて逆共分散行列をパラメータ化し、計算複雑性を低減するために低ランク拡張を組み込み、多重初期化戦略を考える。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:50:43 GMT)
Deep Inertial Pose: A deep learning approach for human pose estimation [4.6] 最も効率的な方法は、Muntw Awindaデータを用いて第4次角度誤差7.96を達成したハイブリッドLSTM-Madgwickの分離である。
この研究は、ニューラルネットワークが人間のポーズを推定するために訓練できることを示し、その結果は最先端のフュージョンフィルタに匹敵する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:12:49 GMT)
BriefMe: A Legal NLP Benchmark for Assisting with Legal Briefs [4.5] 法務NLPで過小評価されている法的作業の核心は、法務ブリーフィングの執筆と編集である。
法的なブリーフィングに焦点を当てた新しいデータセットであるBRIEFMEを紹介する。
言語モデルには3つのタスクが含まれており、議論の要約、議論の完了、事例検索というブリーフを書く際に、法的専門家を支援する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:33:44 GMT)
Can Biologically Plausible Temporal Credit Assignment Rules Match BPTT for Neural Similarity? E-prop as an Example [4.5] 本稿では,タスク精度に適合した場合に,BPTT(Backproagation Through Time)に匹敵する,ニューラルネットワークの類似性を実現する生物学的に妥当な学習規則の存在を示す。
また、モデルアーキテクチャと初期条件が、特定の学習規則よりも神経類似性を決定する上で、より重要な役割を担っていることも明らかにした。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:32:15 GMT)
On the Need to Monitor Continuous Integration Practices -- An Empirical Study [4.4] 継続的統合(CI)は、ソフトウェア開発を強化するために広く採用されているプラクティスの集合を含んでいる。
この記事では、CIプラクティスの監視に関する開発者の認識について説明する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:15:42 GMT)
From Threat to Tool: Leveraging Refusal-Aware Injection Attacks for Safety Alignment [4.4] LLM攻撃技術を応用したトレーニングフリーでモデルに依存しないフレームワークであるRefusal-Aware Adaptive Injection (RAAI)を紹介する。
RAAIは内部の拒絶信号を検出し、事前に定義されたフレーズを適応的に注入することで、有害で流用な完了を誘導する。
実験の結果,RAAIはLDMを効果的に脱獄させ,平均で2.15%から61.04%までの有害反応率を増加させた。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:19:01 GMT)
Efficient Parallelization of Message Passing Neural Network Potentials for Large-scale Molecular Dynamics [4.2] 本稿では,MPNNモデルに対して,冗長計算を行なわずに各MP層内の局所的原子間のみに付加的なデータ通信を最小化する,効率的な並列アルゴリズムを提案する。
このアプローチにより、MPNNモデル上では1億以上の原子の厳密な局所モデルと同様に、大規模な分子動力学シミュレーションが可能になる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:29:50 GMT)
A Framework for Controllable Multi-objective Learning with Annealed Stein Variational Hypernetworks [4.2] 最適解の集合はパレート集合を近似する。
現在の手法では、ハイパーボリューム値を最大化しながら、どのようにソリューションを多様化させるかという課題に直面している。
本稿では,Stein Variational Gradient Descentを用いた新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:50:42 GMT)
Cross-Entropy Games for Language Models: From Implicit Knowledge to General Capability Measures [4.0] 大規模言語モデル (LLM) はテキスト上の確率測度を定義する。
これらの尺度に基づくゲームは、クロスエントロピー(Xent)ゲームに基づくゲームとして定式化することができる。
Xent Game空間は、基本的なゲーム理論の一貫性公理から構築可能でありながら、多くの興味深い例を含むのに十分な大きさであることを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:25:10 GMT)
Dark Channel-Assisted Depth-from-Defocus from a Single Image [4.0] 我々は、暗いチャネルを補完的なキューとして使用し、1つの空間可変デフォーカス画像からシーンの深さを推定する。
提案手法は, 局所的なデフォーカスのぼかしとコントラストの変動をキー深さの手がかりとする。
現実的な深度誘起デフォーカスのぼかしを用いた実データによる実験により、単一画像DFDに暗黒チャネルを組み込むことで、意味のある深度推定結果が得られることが示された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:49:26 GMT)
C-PATH: Conversational Patient Assistance and Triage in Healthcare System [3.9] C-PATH(Conversational patient Assistance and Triage in Healthcare)は、大規模言語モデル(LLM)を利用した対話型AIシステムである。
C-PATHは、LLaMA3アーキテクチャ上に構築された多段階パイプラインを使用して、医療知識、対話データ、臨床要約に基づいて微調整されている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:48:47 GMT)
Fuse and Federate: Enhancing EV Charging Station Security with Multimodal Fusion and Federated Learning [3.8] 電気自動車のグローバルな普及は、スマートグリッドインフラの重要な構成要素として、電気自動車供給装置(EVSE)を確立している。
EVSEシステムは、ネットワーク偵察、バックドア侵入、分散型サービス拒否(DDoS)攻撃など、重要なサイバーセキュリティ上の課題に直面している。
本稿では,ネットワークトラフィックやカーネルイベントを含むマルチモーダルデータソースを利用して,複雑な攻撃パターンを識別する新しい侵入検出フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:34:10 GMT)
Shuffling Cards When You Are of Very Little Brain: Low Memory Generation of Permutations [3.4] 置換のジェネレータはメモリが限られており、"Guesser"はメモリが無制限である。
任意の$m$-bit Dealerに対して、期待して$Omega(n/m+log m)$正しい推測を達成できる(計算的に強力な)推測器が存在することを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:05:34 GMT)
UStyle: Waterbody Style Transfer of Underwater Scenes by Depth-Guided Feature Synthesis [3.3] 本稿では,水中画像間で水体スタイルを伝達する最初のデータ駆動学習フレームワークであるUStyleを紹介する。
本研究では,物理に基づく水体合成を統合した深度認識型白化色変換(DA-WCT)機構を提案する。
UF7Dデータセットは、7つの異なる水体スタイルにまたがる高解像度水中画像の収集である。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:50:10 GMT)
Scaling Inference-Efficient Language Models [3.3] モデルアーキテクチャは推論レイテンシに影響を与えており、同じサイズのモデルでは最大3.5倍のレイテンシの差が生じる可能性がある。
我々は、モデルパラメータ数、トレーニングトークンの数、モデルアーキテクチャを共最適化するために、Chinchillaスケーリングの法則を変更します。
下流タスクの精度を維持しつつ、推論遅延を1.8倍改善するMorph-1Bモデルをリリースする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:03:08 GMT)
Enhanced quantum sensing in time-modulated non-Hermitian systems [3.3] 本稿では, 時間変調型NHシステムにおいて, 量子センシングの高度化を実現するための2つの理論スキームを提案する。
固有値に基づく量子センサは、従来のヘルミタンセンサに比べて9.21倍改善されている。
固有状態に基づく量子センサでは、拡張は従来のヘルミタンセンサーの最大50倍に達する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 02:21:17 GMT)
SecEmb: Sparsity-Aware Secure Federated Learning of On-Device Recommender System with Large Embedding [3.2] フェデレートされたレコメンデータシステム(FedRec)は、協調トレーニング技術を通じてユーザデータを保護するソリューションとして登場した。
典型的なFedRecでは、エッジデバイスとサーバ間で完全なモデルと全体の重み付け更新を送信します。
既存のスパシティ対応のフェデレーションプロトコルは、一般的に効率性のためにプライバシを犠牲にする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:39:22 GMT)
Not quite Sherlock Holmes: Language model predictions do not reliably differentiate impossible from improbable events [3.1] 言語モデルがこれを行う能力は、決して堅牢ではないことを示す。
Llama 3 Gemma 2 や Mistral NeMo を含むテストされたすべてのモデルは、より悪くパフォーマンスする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:08:30 GMT)
An Optimized Ensemble Deep Learning Model For Brain Tumor Classification [3.1] 脳腫瘍の不正確な同定は、寿命を著しく低下させる。
本研究は,脳腫瘍を効率よく分類するための伝達学習(TL)を用いた,革新的な最適化に基づく深層アンサンブル手法を提案する。
Xception, ResNet50V2, ResNet152V2, InceptionResNetV2, GAWO, GSWOはそれぞれ99.42%, 98.37%, 98.22%, 98.26%, 99.71%, 99.76%に達した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:13:23 GMT)
CAtCh: Cognitive Assessment through Cookie Thief [3.0] 自発音声からアルツハイマー病と関連する認知症(ADRD)を予測するために、いくつかの機械学習アルゴリズムが開発されている。
これらのアルゴリズムはいずれも、ADRDの前駆者であり危険因子である広範な認知障害(CI)の予測のために翻訳されていない。
我々は,ADRDの予測のために提案された音声ベースのオープンソース手法と,患者の音声記録からCIを予測するタスクに対するマルチモーダル感情分析の手法について検討した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:41:34 GMT)
ARGOS: Anomaly Recognition and Guarding through O-RAN Sensing [3.0] ローグ基地局(RBS)の攻撃、特にダウングレード脆弱性を悪用した攻撃は、引き続き永続的な脅威である。
本研究は、近リアルタイムRIC内に展開された総合的なO-RAN準拠侵入検知システム(IDS)であるARGOSを紹介する。
ARGOSは、O-RANコンテキスト内で探索されていない領域であるRBSのダウングレード攻撃を、リアルタイムで検出する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 20:32:23 GMT)
Empowering COVID-19 Detection: Optimizing Performance Through Fine-Tuned EfficientNet Deep Learning Architecture [2.7] 新型コロナウイルス(COVID-19)は、感染を抑えるために早期かつ正確に検出する必要がある、非常に伝染性の呼吸器疾患である。
専門家は放射線画像、特に胸部X線を診断プロトコルの貴重なアプローチとして用いている。
本研究では, 深層学習アルゴリズムを用いたX線画像(X線)を用いた新型コロナウイルス患者を迅速かつ正確に同定する可能性について検討した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:14:35 GMT)
The OCR Quest for Generalization: Learning to recognize low-resource alphabets with model editing [2.7] 我々は,アルファベットなどの新しいデータ分布に一般化可能なモデルの構築を,集中的な微調整戦略よりも高速に行うことを目的としている。
最先端のメタラーニングとは対照的に、データのスパース分布におけるドメインマージの有効性を示す。
この研究は、表現不足のアルファベットを簡単に適用できるモデルを構築するための新しいアプローチに寄与する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:05:33 GMT)
An Agentic Framework for Autonomous Metamaterial Modeling and Inverse Design [2.7] フォトニックメタマテリアルの逆設計のためのフレームワークを開発し,実証する。
フレームワークの有効性は、自動化、推論、計画、適応の能力で実証されている。
特に、Agenic Frameworkは内部のリフレクションと決定の柔軟性を持ち、高度に多様性があり、潜在的に新しい出力を可能にする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 22:10:05 GMT)
QML Essentials -- A framework for working with Quantum Fourier Models [2.6] このフレームワークはPennyLaneシミュレータに基づいており、変分量子回路の評価と訓練を容易にする。
これは、高速フーリエ変換による対応するスペクトルを計算するための2つの方法と、三角法を用いて期待値の拡張に基づく別の分析方法を提供する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:22:43 GMT)
Artificial Intelligence and Civil Discourse: How LLMs Moderate Climate Change Conversations [2.6] 大規模言語モデル(LLM)は、オンラインプラットフォームやデジタル通信空間に統合されつつある。
本研究は,LLMが自然に温暖な気候変化の会話を,それぞれのコミュニケーション行動を通じてどのように行うかを検討する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:32:47 GMT)
Recursive Learning-Based Virtual Buffering for Analytical Global Placement [2.5] 本稿では,MLBuf-RePlAceを提案する。
MLBuf-RePlAceをOpenROADのデフォルトの仮想バッファリングベースのタイミング駆動グローバルプレーサと比較する。
MLBuf-RePlAceは、ルート後電力の劣化なしに、オープンソースのOpenROADフロー内での全負スラック(TNS)において(最大、平均、平均)改善(56%、31%)を達成する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:22:31 GMT)
Rethinking Benign Overfitting in Two-Layer Neural Networks [2.5] 我々は、クラス依存の異種ノイズを取り入れて特徴雑音データモデルを洗練し、ニューラルネットワークにおける過剰適合現象を再検討する。
ニューラルネットワークは「データノイズ」を利用して暗黙的な特徴を学習し、長い尾を持つデータの分類精度を向上させる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:10:47 GMT)
Hybrid Vision Transformer-Mamba Framework for Autism Diagnosis via Eye-Tracking Analysis [2.5] 本研究では,視覚変換器(ViT)とビジョン・マンバを組み合わせたハイブリッドなディープラーニングフレームワークを提案する。
このモデルは、注意に基づく融合を用いて視覚、音声、顔の手がかりを統合し、空間的、時間的両方のダイナミクスをキャプチャする。
Saliency4ASDデータセットでテストした結果、提案されたViT-Mambaモデルは既存の手法より優れており、精度0.96、スコア0.95F1、感度0.97、特異度0.94を達成している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:27:24 GMT)
Exploring Image Transforms derived from Eye Gaze Variables for Progressive Autism Diagnosis [2.5] 現在の診断技術は効果があるが、時間集約的であり、社会的・経済的コストが高い。
この研究は、AIを利用した補助技術を導入し、ASD診断と管理を効率化する。
本システムは,視線変数から得られる画像変換と転写学習を統合して,ALDの診断を行う。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:00:17 GMT)
Toward Total Recall: Enhancing FAIRness through AI-Driven Metadata Standardization [2.4] 本稿では,GPT-4とCEDAR知識ベースからの構造化メタデータテンプレートを組み合わせることで,メタデータを自動的に標準化する手法を提案する。
我々の標準化プロセスでは、CEDARテンプレートを使用してGPT-4をガイドし、メタデータのエントリを大まかに修正する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 23:07:07 GMT)
Spatial Disparities in Fire Shelter Accessibility: Capacity Challenges in the Palisades and Eaton Fires [2.4] この研究は、2025年1月に南カリフォルニアで始まったパリセードとイートン火災における避難所へのアクセシビリティの問題について調査した。
その結果、特に地理的に孤立した地域や山岳地帯において、深刻な避難所不足と避難所へのアクセスの不平等が明らかとなった。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:55:27 GMT)
Transferable Sequential Recommendation with Vanilla Cross-Entropy Loss [2.0] Sequential Recommendation (SR)システムでは、インタラクション履歴を分析してユーザの好みをモデル化する。
現在の手法は、新しいドメインに適応する際にかなりの微調整コストを発生させる。
MMM4Recは、効率的な伝達学習のための専用代数的制約機構を組み込んだ、新しいマルチモーダルSRフレームワークである。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:50:16 GMT)
Dynamic spillovers and investment strategies across artificial intelligence ETFs, artificial intelligence tokens, and green markets [1.9] 本稿では,R2分解を用いたAI,AIトークン,グリーンマーケット間のリスク流出について検討する。
AIトークンとグリーンボンドはリスクレシーバーとして機能するのに対し、AIとクリーンエネルギーはリスクトランスミッターとして機能する。
また、AIトークンは、AIトークンやグリーンアセットと比較して、ハッシュ化が難しく、ヘッジ能力に制限があることもわかりました。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:07:19 GMT)
Path Integral Optimiser: Global Optimisation via Neural Schrödinger-Föllmer Diffusion [1.8] 我々は,大域的最適化のための神経拡散過程の早期研究について述べる。
ボルツマン分布を用いて最適化をシュリンガー橋サンプリング問題の解法として定式化することができる。
このオプティマイザの理論的バウンダリ、おもちゃのタスクに関する結果、モデルを動機づける理論の要約を提供する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:46:18 GMT)
Is Your Training Pipeline Production-Ready? A Case Study in the Healthcare Domain [1.8] SPIRAはML-Enabled System(MLES)を作成し、音声分析によって呼吸不全を診断するプロジェクトである。
SPIRAのトレーニングパイプラインの最初のバージョンでは、重要なソフトウェア品質特性が欠けていた。
本稿では,MLESの概要を述べるとともに,継続的トレーニングサブシステムのアーキテクチャの3つのバージョンを比較した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 23:00:13 GMT)
Monitoring Continuous Integration Practices in Industry: A Case Study [1.7] ソフトウェア開発における継続的インテグレーション(CI)プラクティスの監視のメリットと課題について検討する。
私たちの目標は、ブラジルの3つの組織を使用して、業界における7つのCIプラクティスを監視することの影響を評価することです。
企業はCIプラクティスのプラクティス監視を採用し、CIサービスがダッシュボードに機能監視を統合することを推奨しています。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:31:50 GMT)
A Hypernetwork-Based Approach to KAN Representation of Audio Signals [1.6] Inlicit Neural representations (INR) はマルチメディアデータを効率的に符号化する方法として有名になったが、音声信号への応用は限られている。
本研究では,学習可能なアクティベーション関数を用いた新しいアーキテクチャであるKAN(Kolmogorov-Arnold Network)を,音声表現のための効果的なINRモデルとして紹介する。
そこで我々は,INRパラメータを更新するハイパーネットワークアーキテクチャであるFewSoundを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:42:58 GMT)
Flood-DamageSense: Multimodal Mamba with Multitask Learning for Building Flood Damage Assessment using SAR Remote Sensing Imagery [1.4] Flood-DamageSenseは、ビルレベルの洪水被害評価のために構築された最初のディープラーニングフレームワークである。
このアーキテクチャは、SAR/InSARの前と後のシーンを非常に高解像度の光学ベースマップで融合させる。
エンドツーエンドのポストプロセッシングパイプラインは、ピクセルレベルの出力を実行可能なビルディングスケールのダメージマップに変換する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 05:19:10 GMT)
Skewness of von Neumann entropy over Bures-Hall random states [1.3] 我々は、フォン・ノイマンエントロピーによって測定された、ビュール・ハルアンサンブル上のバイパルタイト系の絡み合いの度合いについて研究する。
主な結果は第三累積の正確な閉形式公式であり、フォン・ノイマンエントロピーの分布により正確な近似をもたらす。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:55:57 GMT)
Enabling On-Device Medical AI Assistants via Input-Driven Saliency Adaptation [1.2] 大規模言語モデル(LLM)は、医療シナリオに重大な影響を与えるが、エッジデバイスなどのリソース制約のあるリアルタイム環境へのデプロイには、違法に大きいままである。
汎用圧縮フレームワークによって最適化された新しい医療アシスタントシステムを導入し,LLMを専門分野への展開に適したものにする。
ドメイン固有データに対するニューロンの塩分濃度を計測することにより、無関係なニューロンを積極的にプーンし、性能を保ちながらモデルサイズを小さくすることができる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:37:42 GMT)
Taming Wild Branches: Overcoming Hard-to-Predict Branches using the Bullseye Predictor [1.1] 我々は,Bulseye予測器と呼ばれる28KBのH2Pターゲットサブシステムを備えた159KBのTAGE-SC-L予測器を拡張した。
セット連想型H2P識別表(HIT)を用いて問題のあるPCを特定し、2つの枝特異的パーセプトロンの1つに分類する。
これにより平均MPKIは3.4045、CycWpPKIは145.09となる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:50:11 GMT)
Adam assisted Fully informed Particle Swarm Optimzation ( Adam-FIPSO ) based Parameter Prediction for the Quantum Approximate Optimization Algorithm (QAOA) [1.0] 量子近似最適化アルゴリズム(Quantum Approximate Optimization Algorithm, QAOA)は、マックス・カット問題などの最適化問題の解法として用いられる顕著な変分アルゴリズムである。
QAOAの重要な課題は、高品質なソリューションにつながる適切なパラメータを効率的に特定することである。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:14:41 GMT)
Scalable Offline ASR for Command-Style Dictation in Courtrooms [1.0] 我々はCommand-style dictationのためのオープンソースのフレームワークを提案する。
リソース集約型オンラインシステムと高遅延バッチ処理のギャップに対処する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:26:45 GMT)
Examining the Mental Health Impact of Misinformation on Social Media Using a Hybrid Transformer-Based Approach [1.0] 虚偽の物語の未確認の拡散は、精神的健康に大きな影響を与え、ストレス、不安、誤報によって引き起こされるパラノイアに寄与する。
本研究では,RoBERTa-LSTM分類器を用いたハイブリッドトランスフォーマーによる誤情報検出,メンタルヘルスへの影響評価,誤情報曝露に関連する障害の分類を行う。
提案モデルでは, 誤情報, 精神保健への影響, 障害分類の精度が98.4, 87.8, 77.3であった。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:59:18 GMT)
Automatic Speech Recognition of African American English: Lexical and Contextual Effects [1.0] 本研究では,CCR(Consonant Cluster Reduction)とING-reuction(ING-reuction)の2つの重要な変数に着目した。
CCRとING-deuctionの存在がASRの誤認識を増加させるかどうかを調べる。
この分析により, LMを含まないASR系において, CCRとINGが単語誤り率(WER)に与える影響は小さいが有意であることが明らかとなった。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:30:59 GMT)
Uncertainty Estimation on Graphs with Structure Informed Stochastic Partial Differential Equations [1.0] グラフニューラルネットワークは、様々なネットワークモデリングタスクで目覚ましい結果を得たが、グラフ上の不確実性を正確に推定することは難しいままである。
本稿では,SPDEへのガウス過程アプローチによる空間時空間雑音を取り入れた新しいメッセージパッシング方式を提案する。
提案手法は,空間的および時間的不確かさを同時に捕捉し,共分散カーネルのスムーズさを明示的に制御し,低ラベルと高ラベルの両方でグラフ上の不確かさを推定する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:58:38 GMT)
Multimodal Integration of Longitudinal Noninvasive Diagnostics for Survival Prediction in Immunotherapy Using Deep Learning [0.8] 我々は,新しいニューラルネットワークアーキテクチャ,マルチモーダルトランスフォーマーに基づくシンプルな時間的注意(MMTSimTA)ネットワークを開発した。
免疫療法を施行した694人の大膵コホートから, 術前および治療中の血液測定, 処方薬およびCTベースの臓器量を統合し, 死亡率を予測した。
以上の結果より,新しいアーキテクチャを用いた非侵襲的経時的データの統合は,特に短期生存予測において,マルチモーダル予後の向上をもたらすことが示唆された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:52:25 GMT)
A Novel Neural Filter to Improve Accuracy of Neural Network Models of Dynamic Systems [0.7] 本稿では,ニューラルネットワークを用いた動的システムの長期予測精度を高めるニューラルネットワークフィルタを提案する。
拡張カルマンフィルタによって動機付けられたニューラルネットワークフィルタは、ニューラルネットワークの状態予測と物理系からの計測とを組み合わせて、推定状態の精度を向上させる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:42:29 GMT)
Robust Learnability of Sample-Compressible Distributions under Noisy or Adversarial Perturbations [0.7] 2018年、アシュティアーニらは、分布クラスの構造的性質として、元々リトルストーンとウォーマス (1986) によるエンハンブル圧縮性を再編成した。
我々は、必要かつ十分な条件のセットを条件として、摂動サンプルからでも、サンプル圧縮可能なファミリーが学習可能であることを確証する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:11:50 GMT)
Training-Free Identity Preservation in Stylized Image Generation Using Diffusion Models [0.7] モザイク復元コンテンツイメージ(Mosaic Restored Content Image)は、アイデンティティ保存型画像合成のためのトレーニング不要のフレームワークである。
提案手法は,高スタイリスティックな忠実度と頑健なアイデンティティの整合性を同時に維持する上で,ベースラインモデルを大幅に上回ることを示した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:54:02 GMT)
Employing Discrete Fourier Transform in Representational Learning [0.7] 確立されたアプローチは、オートエンコーダを使用して、ネットワークの圧縮点における潜在表現を抽出することである。
入力の離散フーリエ変換(DFT)を用いて、別の学習目標を提案する。
我々は,CIFAR-10の52.8%の精度をResNet-50で達成し,従来のオートエンコーダを12.8ポイント上回る性能で検証した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:17:24 GMT)
Learning Fluid-Structure Interaction Dynamics with Physics-Informed Neural Networks and Immersed Boundary Methods [0.6] 物理インフォームドニューラルネットワーク(PINN)と没入境界法(IBM)を組み合わせて流体構造相互作用(FSI)問題を解決するニューラルネットワークアーキテクチャを導入する。
本手法は, 統一パラメータ空間を持つ単一FSIネットワークと, 流体領域と構造領域を分離したパラメータ空間を保持するイノベーティブなユーレリア・ラグランジアンネットワークの2つの異なるアーキテクチャを特徴とする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:02:42 GMT)
Quantum transduction via generalized continuous-variable teleportation [0.5] 量子テレポーテーション(quantum teleportation)は、異なるシステム間で量子状態を転送する。
ボソニックモードの観点では、量子テレポーテーションは、絡み合いとバランスの取れたビームスプリッターのための2モードのスクイーズに依存している。
本稿では,従来のトランスダクション装置と狭帯域絡みにのみ依存しながら,テレポーテーションによるトランスダクションを実現することを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:16:02 GMT)
The robustness condition for general disordered discrete time crystals, and subspace-thermal DTCs from phase transitions between different n-tuple DTCs [0.5] 駆動周期の任意の倍数に対応する新しいフロケット時間結晶モデルを提案する。
これらの周期の異なる時間結晶間の遷移は、サブスペース-熱的離散時間結晶と呼ばれる新しい物質相をもたらす。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:42:54 GMT)
Interpretable Depression Detection from Social Media Text Using LLM-Derived Embeddings [0.4] ソーシャルメディアにおける抑うつ言語検出の精度と解釈は、精神状態の早期介入に有用である。
ソーシャルメディアデータを含む3つの分類課題に対して,大規模言語モデル(LLM)と従来の機械学習分類器の性能について検討した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:19:45 GMT)
\textit{QuantMCP}: Grounding Large Language Models in Verifiable Financial Reality [0.4] 大規模言語モデル(LLM)は、財務分析と意思決定に革命をもたらすという大きな約束を持っている。
しかし、その直接的な適用は、データ幻覚の問題や、リアルタイムで検証可能な財務情報へのアクセスの欠如によって、しばしば妨げられている。
本稿では,金融現実にLLMを厳格に活用するための新しいフレームワークであるQuantMCPを紹介する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:52:39 GMT)
Improving Wildlife Out-of-Distribution Detection: Africas Big Five [0.3] 本研究では,野生生物,特にビッグファイブの分布外検出について検討した。
我々は,NCM(Nearest Class Mean)と非パラメトリックコントラスト学習アプローチをベースラインとして,一般的な分類エンコーダの事前学習および予測機能を活用する。
その結果、特徴に基づく手法は、様々な分類しきい値にまたがるより強力な一般化能力を反映していることがわかった。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:02:48 GMT)
NSD-Imagery: A benchmark dataset for extending fMRI vision decoding methods to mental imagery [0.3] NSD-Imageryは精神画像と組み合わせた人間のfMRI活動のベンチマークデータセットである。
心的画像における復号法の性能は、視覚再建における性能と大きく切り離されていることを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 19:11:24 GMT)
LLM-D12: A Dual-Dimensional Scale of Instrumental and Relational Dependencies on Large Language Models [0.3] 人々が大規模言語モデル(LLM)とどのように相互作用するかを理解することへの関心が高まっている。
LLM-D12(LLM-D12)とよばれるLCM依存度を測定する新しい12項目アンケートを開発し,その妥当性を検証した。
このスケールは、著者の以前の理論的研究に基づいており、それに応じてアイテムが開発され、イギリスで526人の参加者から回答が集められた。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:42:21 GMT)
On the critical finite-size gap scaling for frustration-free Hamiltonians [0.3] フラストレーションフリーハミルトニアンに対する臨界有限サイズギャップスケーリングが逆二乗型であることを証明する。
このことは、連続体極限において共形場理論を生成する能力にさらなる制限を与える。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:00:52 GMT)
Ai-Driven Vulnerability Analysis in Smart Contracts: Trends, Challenges and Future Directions [0.3] 数値オーバーフロー、再侵入攻撃、不正アクセス許可などの脆弱性は、数百万ドルの損失をもたらしている。
従来のスマートコントラクト監査技術は、拡張性、自動化、開発パターンの進化への適応性の制限に直面しています。
本稿では、機械学習、ディープラーニング、グラフニューラルネットワーク、トランスフォーマーベースモデルに焦点をあて、スマートコントラクトにおける脆弱性検出のための新しいAI駆動技術について検討する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:44:26 GMT)
Learning quantum phase transition in parametrized quantum circuits with an attention mechanism [0.2] 多体量子状態と量子相転移を学習することは、量子多体物理学における大きな課題である。
本稿では,パラメータ化量子回路のパラメータを直接学習することにより,物理オブザーバブルの測定を回避できる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:21:40 GMT)
Incorporating Failure of Machine Learning in Dynamic Probabilistic Safety Assurance [0.1] より広範な因果安全分析の一環として, SafeML と Bayesian Networks (BNs) を統合する安全保証フレームワークを導入し, ML 障害をモデル化する。
交通標識認識を用いた自動車小隊のシミュレーションシステムに対するアプローチを実証する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:16:05 GMT)
Large Language Models Are Democracy Coders with Attitudes [0.1] V-Demプロジェクトの民主主義指標のコーディングには,最先端の2つのLarge Language Modelを使用します。
膨大な量の情報にアクセスすることで、これらのモデルは、人間が持つ可能性のある認知バイアスなしに、レジームの多くの「ソフト」特性を評価することができるかもしれない。
これらのモデルが人間の評価から逸脱した場合、それらは異なるが一貫した方法で実施されることを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 12:45:18 GMT)
EconEvals: Benchmarks and Litmus Tests for LLM Agents in Unknown Environments [0.1] 我々は,未知の環境下で行動し,学習し,戦略を立てるLLMエージェントのベンチマークを開発する。
また, LLM および LLM エージェントの新しい定量尺度であるlitmus test も提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 20:42:00 GMT)
Sleep Stage Classification using Multimodal Embedding Fusion from EOG and PSM [0.1] 本研究では,マルチモーダル埋め込み深層学習モデルであるImageBindを用いて,睡眠段階分類のためのデュアルチャネルEOG信号とPSMデータを統合する手法を提案する。
以上の結果から,ImageBindの微調整により分類精度が向上し,既存のモデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 20:18:45 GMT)
Zero Shot Composed Image Retrieval [0.0] 合成画像検索(CIR)により、ユーザは、きめ細かいテキスト編集を施すことで、ターゲット画像を見つけることができる。
Zero-shot CIRは、イメージとテキストを別途トレーニング済みの視覚言語エンコーダで埋め込むもので、FashionIQベンチマークで20-25%のRecall@10にしか達しない。
我々は、視覚的特徴とテキスト的特徴を1つの埋め込みに融合する軽量Q-FormerでBLIP-2を微調整することで、これを改善した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:38:43 GMT)
Variational quantum algorithm based on Lagrange polynomial encoding to solve differential equations [0.0] 本稿では、ラグランジュ符号化と微分量子回路を組み合わせた新しい変分量子アルゴリズム(VQA)の2つの異なるアーキテクチャを導入する。
提案した新しいVQAは, 従来の変分量子アルゴリズムと比較してゲートの複雑さが小さくなり, 解の類似性や品質が向上することが示されている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:01:09 GMT)
Validating Quantum State Preparation Programs [0.0] 本稿では、Coq証明アシスタントで実装された高保証フレームワークであるPqasmについて述べる。
このフレームワークの鍵は、量子重ね合わせ状態を含むプログラムのプログラム正当性保証を、重ね合わせのないプログラム状態に対するプログラム正当性保証に還元することである。
我々は、QuickChickプロパティベースのテストフレームワークを使用して状態準備プログラムをテストする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 23:43:25 GMT)
TrustConnect: An In-Vehicle Anomaly Detection Framework through Topology-Based Trust Rating [0.0] 車両内ネットワークの信頼性を評価するためのフレームワークであるTrustConnectを提案する。
提案するフレームワークは,全車両部品の相互依存性と,その値とリモートインジェクションに対する脆弱性の相関を利用する。
提案手法の有効性は,様々なシナリオを対象としたプログラミングシミュレーションによって検証されている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:06:41 GMT)
Topology Estimation of Simulated 4D Image Data by Combining Downscaling and Convolutional Neural Networks [0.0] 本研究では,現在の処理能力を超える位相的複雑度と大きさを示す4次元画像型データキューブのタイプを推定する。
合成された4Dデータと実世界の3Dデータセットを用いた実験は、計算複雑性の問題を回避することができることを示した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 03:33:16 GMT)
Through the Gaps: Uncovering Tactical Line-Breaking Passes with Clustering [0.0] ラインブレーキングパス(LBP)は、フットボールにおいて重要な戦術的行動であり、防御線を貫通し、高価値空間にアクセスできる。
我々は,同期イベントによるLPPの検出と分析と,エリートマッチからのデータの追跡を行う,教師なしクラスタリングベースのフレームワークを提案する。
我々のアプローチは、垂直空間分割によって相手チームの形状をモデル化し、オープンプレイ内の防御線を妨害するパスを特定します。
2022 FIFAワールドカップのチームと選手間でこれらの指標を評価し、垂直進行と構造破壊の様式的な違いを明らかにした。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 05:08:24 GMT)
Theory of itinerant collisional spin dynamics in nondegenerate molecular gases [0.0] 超低温だが非退化極性分子の2つの電場型回転状態に1/2$自由度をエンコードした反復動力学を研究する。
電界閉じ込めによる衝突遮蔽により全衝突路の損失をほぼ完全に抑制できることを示す。
この研究は、超低温分子衝突の領域と多体スピン物理学の間の橋渡しを確立する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:10:20 GMT)
The Currents of Conflict: Decomposing Conflict Trends with Gaussian Processes [0.0] 時間的・空間的に異なるコンフリクトイベントのデータを用いて、時間空間的コンフリクトの傾向を推定する方法を示す。
これらの傾向は、コンフリクトトラップ、拡散、テンポ空間のコンフリクト露光に関する洞察を得るために研究することができる。
最後に、この手法により、推定されたテンポ空間衝突パターンを将来の時間単位に外挿することができる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:16:28 GMT)
Simulating discrete-time quantum walk with urn model [0.0] エルンモデルは長い間、計算過程、確率分布、強化力学の研究に用いられてきた。
一方、離散時間量子ウォーク(DTQW)は、量子計算と量子情報理論の基本的な構成要素である。
この研究は、urnモデルと離散時間量子ウォークの間の新しい接続を探求し、urnベースのプロセスが量子状態の進化とアルゴリズム的振る舞いに対する洞察を提供する方法に焦点を当てた。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:54:09 GMT)
Simulating Macroeconomic Expectations using LLM Agents [0.0] 我々は,Large Language Model-Empowered Agents (LLM Agents) を用いたマクロ経済予測形成をシミュレーションするための新しいフレームワークを提案する。
個人的特性,事前期待,知識のモジュールを備えたLLMエージェントを数千個構築することにより,家庭や専門家によるインフレーションと失業に関する調査実験を再現する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:13:05 GMT)
Rules and Meaning in Quantum Mechanics [0.0] 物理学哲学と言語哲学の交点における研究を追求している。
標準的なQMの意味的事実の競合する説明を批判的に分析する。
1) アインシュタインの不完全性論の再構成は局所的、分離的、分類的 QM が存在しないと結論付ける。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:26:31 GMT)
Review: Quantum Metrology and Sensing with Many-Body Systems [0.0] 量子センシングのための別のフレームワークが、量子多体システムを利用して開発されている。
多体プローブは平衡と非平衡の両方のシナリオで用いられている。
量子臨界は、量子増強感度を達成するための資源として特定されている。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:44:13 GMT)
Recursive Semantic Anchoring in ISO 639:2023: A Structural Extension to ISO/TC 37 Frameworks [0.0] ISO 639:2023はISO言語コードファミリを統一し、コンテキストメタデータを導入するが、方言のドリフトとクレオールの混合を扱うためのマシンネイティブメカニズムは欠如している。
我々はセマンティックアンカリングの形式化を提案し、すべての言語エンティティに$chi$ 固定ポイント演算子のファミリ $phi_n,m$ そのモデル境界セマンティックドリフトを提案する。
このフレームワークはISO/TC 37と互換性があり、将来の標準のためにAIで処理可能なドリフト対応セマンティックレイヤを提供する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:36:13 GMT)
RARL: Improving Medical VLM Reasoning and Generalization with Reinforcement Learning and LoRA under Data and Hardware Constraints [0.0] Reasoning-Aware Reinforcement Learning frameworkは、医療ビジョン言語モデルの推論能力を高める。
低ランク適応とカスタム報酬関数を用いた軽量ベースモデルQwen2-VL-2B-Instructを微調整する。
RARLは医用画像解析および臨床推論におけるVLM性能を著しく改善することを示した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:26:23 GMT)
Quasi-Discrete Time Crystals in the quasiperiodically driven Lipkin-Meshkov-Glick model [0.0] 離散時間結晶(DTC)は、物質の顕著な非平衡相である。
準周期Thue-Morse駆動におけるLipkin-Meshkov-Glickモデルのダイナミクスについて検討する。
この結果から, 準周期駆動プロトコルは, 新たな非平衡相を実現する上で有望な経路となることが示唆された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 09:06:31 GMT)
Quantum accessible information and classical entropy inequalities [0.0] 我々は、[7]で最近得られた最適性基準が、特定の状態のアンサンブルに適用された場合、シャノンエントロピーの非自明な下限につながると主張している。
これらの不等式は, 鋭いピラミッドや平らなピラミッドに対応する状態アンサンブルの場合において証明する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:50:49 GMT)
Q-Policy: Quantum-Enhanced Policy Evaluation for Scalable Reinforcement Learning [0.0] 本稿では,政策評価と最適化を数学的に高速化するハイブリッド量子古典的強化学習フレームワークを提案する。
Q-Policyは量子重ね合わせで値関数を符号化し、複数の状態-作用対の同時評価を可能にする。
今後の量子デバイス上でのスケーラブルなRLの理論的基盤としてQ-Policyの可能性を支持する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:41:22 GMT)
Position Prediction Self-Supervised Learning for Multimodal Satellite Imagery Semantic Segmentation [0.0] マルチモーダル衛星画像セマンティックセグメンテーションのための位置予測自己教師付き学習手法LOCA(Location-aware)を提案する。
提案手法は,SatMAEのチャネル群をマルチスペクトルからマルチモーダルデータに拡張することで,衛星データのユニークな課題に対処する。
Sen1Floods11フラッドマッピングデータセットに対する我々のアプローチの評価を行い、衛星画像の再構成に基づく自己教師型学習手法を著しく上回る結果を得た。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 16:16:29 GMT)
Partial order and topology of Hermitian matrices and quantum Choquet integrals for density matrices with given expectation values [0.0] 集合 $M$ of $dtimes d$ Hermitian matrices (observables) は L の部分順序を持つ部分順序集合として研究される。
上集合と下集合は、エルミート行列の文脈において累積性の概念を定義する。
形式主義の応用は密度行列を見つけることであり、与えられた期待値は$n$(非可換可観測量)である。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:32:27 GMT)
Online SLA Decomposition: Enabling Real-Time Adaptation to Evolving Network Systems [0.0] 本研究では,実世界のシステムの動的性質を考察し,その動的性に対処するオンライン学習分解フレームワークを提案する。
最新のフィードバックに基づいてリスクモデルを継続的に更新するフレームワークを提案する。
解析モデルに基づくシミュレータに関する実証研究により,提案手法が最先端の静的アプローチより優れていることを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 08:59:14 GMT)
Memory cost of quantum contextuality with Pauli observables [0.0] メルミンのペンタグラムの10ドル3キュービット可観測器が生成する文脈性をシミュレートするためのメモリコストは、わずか$log(5) approx 2.32$ bitsであることを示す。
また、量子予測のサブセットをシミュレートするために、メモリに結果を追加する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:18:23 GMT)
LoopDB: A Loop Closure Dataset for Large Scale Simultaneous Localization and Mapping [0.0] LoopDBは、さまざまな環境にわたってキャプチャされた1000以上のイメージからなる、困難なループクロージャデータセットである。
データセットは高解像度カメラを用いて収集され、ループクロージャアルゴリズムの精度をベンチマークするのに適切な画像を提供する。
ベンチマークの目標に加えて、データセットはディープニューラルネットワークに基づいた微調整ループクロージャメソッドのトレーニングや微調整に使用することができる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:39:39 GMT)
Learning Pareto-Optimal Rewards from Noisy Preferences: A Framework for Multi-Objective Inverse Reinforcement Learning [0.0] そこで我々は,人間の嗜好を潜在ベクトル値報酬関数としてモデル化する,嗜好に基づく多目的逆強化学習(MO-IRL)の理論的枠組みを提案する。
本研究は,実践的アライメント技術と理論的保証のギャップを埋め,アライメント行動の学習の原則的基盤を提供するものである。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:39:58 GMT)
Learnable Activation Functions in Physics-Informed Neural Networks for Solving Partial Differential Equations [0.0] 偏微分方程式(PDE)を解くための物理インフォームドニューラルネットワーク(PINN)の学習可能なアクティベーション機能について検討する。
非線形波動,混合物理,流体力学など多種多様なPDEの活性化と基底関数について検討した。
以上の結果から,kansは機能的次元の呪いに直面し,より深いネットワークにおける難解な最適化の展望を生んでいることが示唆された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:13:50 GMT)
Is Optimal Transport Necessary for Inverse Reinforcement Learning? [0.0] 逆強化学習(IRL)は、専門家によるデモンストレーションから報酬関数を回復することを目的としている。
IRLにおける最適輸送(OT)の2つの簡単な代替案を提案する。
我々の単純な報酬は、最近のOTベースのアプローチと一致しているか、上回っていることを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:29:37 GMT)
Interpretation of Deep Learning Model in Embryo Selection for In Vitro Fertilization (IVF) Treatment [0.0] 専門家の胚学者は、通常、胚を選別するためにブラストシストの画像をレビューすることで、胚を格付けする。
本研究では、畳み込みニューラルネットワーク(CNN)と長期記憶アーキテクチャ(LSTM)を融合した、胚を分類するための説明可能な人工知能フレームワークを提案する。
本モデルは,XAIによる解釈性を維持しつつ,胚の分類において高い精度を達成する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:25:22 GMT)
Interpretable LLMs for Credit Risk: A Systematic Review and Taxonomy [0.0] 大規模言語モデル(LLM)は、財務文書の分析を通じて信用リスクの評価を可能にする。
本稿では、信用リスク推定におけるLSMに基づくアプローチに着目した、最初の体系的レビューと分類について述べる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 12:46:05 GMT)
FuncGNN: Learning Functional Semantics of Logic Circuits with Graph Neural Networks [0.0] And-Inverter Graph synthesiss (AIG) は、現代の回路におけるブール論理を表現するために広く採用されている。
マルチグラニュラリティトポロジカルパターンを抽出するために,ハイブリッド機能アグリゲーションを統合したFuncGNNを提案する。
FuncGNNは、それぞれ2.06%と18.71%の改善を実現し、トレーニング時間を約50.6%、GPUメモリ使用量を約32.8%削減した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 13:04:07 GMT)
From Theory to Practice: Analyzing VQPM for Quantum Optimization of QUBO Problems [0.0] 変分量子パワー法(VQPM)は、古典的パワーアルゴリズムを量子設定に適用する。
本稿では,これらのロック機構を活用して,VQPMをQUBO問題に適用するための詳細な戦略を提案する。
この結果から,VQPMは量子コンピュータの量子最適化アルゴリズムとして,QUBO問題に有効であることが示唆された。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:01:35 GMT)
Extending dependencies to the taggedPBC: Word order in transitive clauses [0.0] 本稿では, POSタグとともに依存情報をタグ付きPBCの全言語に転送するデータセットのCoNLLU形式バージョンについて報告する。
依存性アノテートされたコーパスもGitHub経由で研究とコラボレーションが可能である。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 12:52:45 GMT)
Explaining Risks: Axiomatic Risk Attributions for Financial Models [0.0] 近年、機械学習モデルは非常に複雑なブラックボックス構造を犠牲にして大きな成功を収めている。
金融などのリスクの高い分野では、リスクは平均的な予測と同じくらい重要である。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 04:15:27 GMT)
Emergent Holographic Spacetime from Quantum Information [0.0] ホログラフィー双対性は、量子多体系の観点から重力理論を記述する。
量子情報理論は、これらのシステムの微細構造を直接重力時空のジオメトリーに接続する重要なツールを提供する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 00:05:10 GMT)
Dissipative quantum phase transitions monitored by current fluctuations [0.0] 散逸相転移(DPT)は、非平衡開量子系の物理的性質の急激な変化によって定義される。
ここでは、オープン量子システムと環境の間の単位時間あたりの平均量子ジャンプとして定義される$textitoutput current$を考える。
本稿では, 出力電流変動, 特にその動的相関, パワースペクトル, 特性時間スケールが, DPTに関する貴重な情報を提供することができることを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 11:34:24 GMT)
Detecting and Mitigating SQL Injection Vulnerabilities in Web Applications [0.0] 本研究は, 効果的な検出・防止戦略の実践的洞察を提供することにより, この分野に貢献する。
この研究は、脆弱性評価と修復に対する体系的なアプローチを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 01:06:31 GMT)
Design and Implementation of a RISC-V SoC with Custom DSP Accelerators for Edge Computing [0.0] 乗算 (M) とアトミック演算 (A) を拡張したRV32I ベース命令セットについて検討する。
本研究は,組込みシステムにおけるRISC-Vの利点と,カスタムアクセラレータのスケーラビリティを示すものである。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:17:40 GMT)
Depth-Optimal Quantum Layout Synthesis as SAT [0.0] 量子回路は、キュービットに適用されるゲートで構成されている。
現在の量子ハードウェアプラットフォームはバイナリCXゲートに接続制限を課している。
CXゲートはノイズが多いため、マッピングされた回路のCXカウントやCX深さを減らすことが重要である。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 10:47:58 GMT)
Clustering-induced localization of quantum walks on networks [0.0] 量子ウォークは量子情報理論におけるパラダイムモデルである。
高度にクラスタ化されたネットワークにおいて、ローカライゼーションがどのように現れるかを示す。
次に、Kleinbergの小規模ネットワークやHolme-Kimのパワーロークラスタネットワークにもローカライゼーションが存在することを示す。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:29:41 GMT)
Classical Simulation of an All-Optical Toffoli Gate using Soliton Scattering through Asymmetric Potential Wells [0.0] 非対称P"oschl-Teller電位井戸による空間ソリトン散乱に基づく全光トフォリゲートを数値シミュレーションする。
本研究では,2つのソリトン成分の相対的空間順序付けにおいて,対象ビットの論理状態を符号化する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:12:46 GMT)
Caterpillar GNN: Replacing Message Passing with Efficient Aggregation [0.0] 我々は、より強くより構造化された集約機能のために、いくつかの表現性を取り除き、非効率な集約機構を導入する。
当社のアプローチでは、従来のメッセージパッシングと、色付きあるいは平らなウォークに基づくシンプルなメソッドのシームレスなスケーリングを可能にします。
そこで我々は,Catapillar GNNが計算グラフの隠蔽層におけるノード数を著しく削減しつつ,同等の予測性能を実現することを示した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 12:52:27 GMT)
Can In-Context Reinforcement Learning Recover From Reward Poisoning Attacks? [0.0] テキスト内強化学習(ICRL)の劣化・破壊性について検討する。
本稿では,AT-DPT(Adversarially Trained Decision-Pretrained Transformer)と呼ばれる,新たな逆トレーニングフレームワークを提案する。
本手法は,攻撃者に対して,有害な環境報酬によるDPTの真の報酬を最小限に抑えるよう同時に訓練し,有害なデータから最適な行動を推測するDPTモデルを提案する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 18:39:47 GMT)
CAG-VLM: Fine-Tuning of a Large-Scale Model to Recognize Angiographic Images for Next-Generation Diagnostic Systems [0.0] 本稿では,2段階の医師培養パイプラインとバイリンガル(日本語/英語)CAG画像レポートデータセットを紹介する。
539の試験から14,686のフレームをサンプリングし、キーフレームの検出と左右のラテラルに注釈を付ける。
我々はCNNを243の独立した試験に適用し,1,114のキーフレームを抽出し,その前処理レポートと専門家公認診断・治療概要とを組み合わせた。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 10:40:58 GMT)
Bio-Inspired Classification: Combining Information Theory and Spiking Neural Networks -- Influence of the Learning Rules [0.0] トレーニングスパイキングニューラルネットワーク(SNN)は、そのユニークな性質のため、難しい。
バイオインスパイアされた学習ルールを含む,選択された学習アルゴリズムの種類が,複雑性の正確な分類に与える影響を考察する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 10:43:09 GMT)
Authoritarian Recursions: How Fiction, History, and AI Reinforce Control in Education, Warfare, and Discourse [0.0] 論文は、人工知能システムが教育、軍事活動、デジタル談話の機関的制御を統合する方法を理論的に論じている。
インテリジェントシステムは、効率性と中立性という概念の下で階層構造を正規化する方法を分析する。
ケーススタディには、教育における自動プロクター、戦争における自律的ターゲティング、社会プラットフォームにおけるアルゴリズムによるキュレーションなどが含まれる。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 21:39:07 GMT)
An Efficient Digital Watermarking Technique for Small Scale devices [0.0] 本研究では,軽量なウォーターマーキング手法であるFast Wavelet Transform & Additive Quantization Index Modulation schemeを導入する。
この方法は低周波FWTサブバンドを用いたYCbCr色空間の輝度成分に透かしを埋め込む。
抽出および埋め込みプロセスは40ミリ秒未満で実行され、Raspberry Pi 5でテストする場合は最小のRAMを必要とする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 07:06:20 GMT)
Alignment Drift in CEFR-prompted LLMs for Interactive Spanish Tutoring [0.0] 本稿では,第二言語学習における適応型チューターとしてのLarge Language Models(LLMs)の可能性について検討する。
スペイン語の教師と学生の対話を,7Bから12Bまでの大きさの命令調整型オープンソースのLLMを用いてシミュレートした。
次に、チューターモデルからの出力を用いて、3つの習熟度レベルにわたるテキストの難易度を制御するCEFRベースのプロンプトの有効性を評価する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:30:53 GMT)
Advancing Question Generation with Joint Narrative and Difficulty Control [0.0] 本稿では,これら2つの属性を同時制御し,読解的質問の生成を可能にする,共同物語・難易度制御のための戦略を提案する。
我々の評価は、全てのインスタンスで有効ではないが、このアプローチが実現可能であるという予備的な証拠を提供する。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 14:26:11 GMT)
Accounting for plasticity: An extension of inelastic Constitutive Artificial Neural Networks [0.0] 我々は,非弾性人工ニューラルネットワーク(iCANN)の既存の枠組みを,可塑性を取り入れて拡張し,より複雑な物質挙動をモデル化する適用性を高める。
我々のフレームワークは、線形および非線形キネマティック硬化挙動の両方をキャプチャする。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 06:08:04 GMT)
A fidelity-driven approach to quantum circuit partitioning via weighted hypergraphs for noise-resilient computation [0.0] 本稿では、量子回路を忠実度対応ハイパーグラフに変換する新しいフレームワークであるFidelipartを紹介する。
6-qubit/22-gate, 10-qubit/55-gate, 24-qubit/88-gateベンチマーク上で, BQSKitのQuick Partitionerに対するFidelipartの評価を行った。
結果、Fidelipartの優れた性能を示し、SWAPゲートの削減は77.3%から100%、カットキュービットの52.2%まで低下した。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 17:13:51 GMT)
A Statistical Framework for Model Selection in LSTM Networks [0.0] LSTMネットワークにおける系統的モデル選択のための統一的な統計フレームワークを提案する。
我々のフレームワークは、情報基準や縮小推定といった古典的なモデル選択のアイデアを、シーケンシャルニューラルネットワークに拡張する。
いくつかのバイオメディカルデータ中心の例は、提案フレームワークの柔軟性と性能の向上を示している。
論文参考訳(メタデータ) (Sat, 07 Jun 2025 15:44:27 GMT)