Dynamic Programming Techniques for Enhancing Cognitive Representation in Knowledge Tracing [125.8] 認知表現動的プログラミングに基づく知識追跡(CRDP-KT)モデルを提案する。
質問の難易度とそれらの間の性能間隔に基づいて認知表現を最適化する動的プログラミングアルゴリズムである。
これは、その後のモデルトレーニングのためにより正確で体系的な入力機能を提供し、それによって認知状態のシミュレーションにおける歪みを最小限にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:44:48 GMT)
Adversarial Attacks on Robotic Vision Language Action Models [118.0] 視覚言語行動モデル(VLA)に対する敵対的攻撃について検討する。
我々のアルゴリズムの主な貢献は、完全な制御権限を得るためのLLMジェイルブレイク攻撃の適応と応用である。
LLMのジェイルブレイク文学とは大きく異なるのは、現実世界の攻撃は害の概念と意味的に結びついている必要はないからである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:43:58 GMT)
Open-world Machine Learning: A Systematic Review and Future Directions [117.3] オープンワールド機械学習の全体像を論じる。
未知の拒絶、新奇な発見、継続的な学習を調査する。
これは研究者がそれぞれの分野でより強力なAIシステムを構築するのを助けることを目的としている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:11:45 GMT)
Focal-SAM: Focal Sharpness-Aware Minimization for Long-Tailed Classification [113.7] 実世界のデータセットは長い尾の分布に従うことが多く、尾のクラスへの一般化は困難である。
近年,ロスランドスケープを平坦化して一般化を改善するため,シャープネス・アウェア最小化法 (SAM) の長尾変種を利用した手法が提案されている。
クラスごとに異なる罰則を割り当てるFocal-SAMを導入し、余分なバックプロパゲーションを伴わずにきめ細かい制御を実現する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:43:05 GMT)
NTIRE 2025 XGC Quality Assessment Challenge: Methods and Results [107.5] NTIRE 2025 XGC Quality Assessment Challengeは、CVPR 2025のNTIRE(New Trends in Image Restoration and Enhancement Workshop)と共同で開催される。
課題は、ユーザ生成ビデオ、AI生成ビデオ、会話ヘッドの3つのトラックに分けられる。
各トラックの参加チームはベースラインを上回り、3トラックのフィールドの開発に寄与する手法を提案している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:39:57 GMT)
Foundation Models for Remote Sensing and Earth Observation: A Survey [101.8] 本調査は、リモートセンシング基礎モデル(RSFM)の新しい分野を体系的にレビューする。
モチベーションと背景の概要から始まり、続いて基本概念が導入された。
我々はこれらのモデルを公開データセットと比較し、既存の課題について議論し、今後の研究方向性を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:58:06 GMT)
SceneSplat: Gaussian Splatting-based Scene Understanding with Vision-Language Pretraining [100.2] 現在、既存のすべてのメソッドは、トレーニング中や推論時に2Dまたはテキストのモダリティに依存している。
我々はSceneSplatを紹介し,3DGSで動作する最初の大規模屋内シーン理解手法について紹介する。
ラベルのないシーンからリッチな3D特徴学習を解放する自己教師付き学習手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:42:52 GMT)
CodeEnhance: A Codebook-Driven Approach for Low-Light Image Enhancement [98.0] 低照度画像強調(LLIE)は、低照度画像を改善することを目的としている。
既存の手法では、様々な明るさ劣化からの回復の不確実性と、テクスチャと色情報の喪失という2つの課題に直面している。
我々は、量子化された先行値と画像の精細化を利用して、新しいエンハンスメント手法、CodeEnhanceを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:25:37 GMT)
Political Neutrality in AI Is Impossible- But Here Is How to Approximate It [97.6] 真の政治的中立性は、主観的な性質と、AIトレーニングデータ、アルゴリズム、ユーザーインタラクションに固有のバイアスのため、実現可能でも普遍的に望ましいものではない、と我々は主張する。
我々は、政治的中立性の「近似」という用語を使って、到達不可能な絶対値から達成不可能で実用的なプロキシへ焦点を移す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:41:11 GMT)
GUI-Actor: Coordinate-Free Visual Grounding for GUI Agents [93.5] 座標自由なGUIグラウンドリングのためのVLMに基づくGUI-Actorを提案する。
GUI-Actorの中核となるのは、アテンションベースのアクションヘッドで、専用のACTOR>トークンと関連するすべての視覚的パッチトークンの整合を学ぶ。
実験により、GUI-Actorは、複数のGUIアクショングラウンドベンチマークにおいて、最先端のメソッドよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:59:08 GMT)
Low-Resolution Self-Attention for Semantic Segmentation [93.3] 我々は,グローバルコンテキストを計算コストの大幅な削減で捉えるために,低解像度自己認識(LRSA)機構を導入する。
我々のアプローチは、入力画像の解像度に関わらず、固定された低解像度空間における自己注意を計算することである。
本稿では,エンコーダ・デコーダ構造を持つビジョントランスであるLRFormerを構築することで,LRSA手法の有効性を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:39:28 GMT)
Unnatural Languages Are Not Bugs but Features for LLMs [92.8] 大規模言語モデル(LLM)は、ジェイルブレイクプロンプトなどの非可読テキストシーケンスを処理するために観察されている。
我々はこの認識に挑戦する体系的な調査を行い、非自然言語にはモデルで使用可能な潜在的特徴が含まれていることを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:19:31 GMT)
Ringmaster ASGD: The First Asynchronous SGD with Optimal Time Complexity [92.2] Ringmaster ASGDは任意に不均一な計算時間の下で最適な時間複雑性を達成する。
これにより、このようなシナリオにおける時間複雑性の理論的な下限を満たす最初の非同期SGD法となる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:26:09 GMT)
OmniAudio: Generating Spatial Audio from 360-Degree Video [91.6] 我々は,360度ビデオから空間音声を生成する新しいタスクである360V2SAを導入する。
本稿では,空間音声データと大規模非空間データの両方を用いて,自己教師付き事前学習を利用する新しいフレームワークOmniAudioを提案する。
実験により、OmniAudioは客観的指標と主観的指標の両方で最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:27:47 GMT)
ABKD: Pursuing a Proper Allocation of the Probability Mass in Knowledge Distillation via $α$-$β$-Divergence [89.6] 知識蒸留(KD)は、大きな教師モデルからより小さな学生モデルに知識を伝達する。
KDの中核的な課題は、2つのモード集中効果のバランスにある。
我々は$alpha$$beta$-divergenceを持つ汎用フレームワークであるABKDを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:33:27 GMT)
Interaction Field Matching: Overcoming Limitations of Electrostatic Models [88.1] 静電場整合(EFM)は、近年、電気コンデンサのアイデアを用いて、データ生成と転送のための物理に着想を得たパラダイムとして登場した。
我々は、静電気以外の一般的な相互作用場を利用できるEMFの一般化であるInteraction Field Matching (IFM)を提案する。
一連の玩具および画像データ転送問題に対して,その性能を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:45:14 GMT)
DRAMA: Diverse Augmentation from Large Language Models to Smaller Dense Retrievers [86.5] 大規模言語モデル(LLM)は、高密度レトリバーとして微調整されている間、強い有効性と堅牢性を示している。
LLMは効率が良いが、教師付き微調整データで効率的に一般化できないことが多い。
我々は、LLMを活用してより小さな一般化可能な高密度レトリバーを訓練するトレーニングフレームワークであるDRAMAを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:47:36 GMT)
Kimi k1.5: Scaling Reinforcement Learning with LLMs [85.0] 我々は、強化学習で訓練された最新のマルチモーダル言語モデル、Kimi k1.5の訓練実践について報告する。
長いコンテキストスケーリングと改善されたポリシー最適化手法が、我々のアプローチの鍵となる要素である。
本システムは,複数のベンチマークやモダリティに対して,最先端の推論性能を実現する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:14:54 GMT)
EoRA: Fine-tuning-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation [84.7] EoRAは、圧縮されたLarge Language Modelを低ランク行列で拡張する微調整不要な手法である。
EoRAは、圧縮LDMの精度を回復するために、トレーニングなしの低ランク法よりも一貫して優れている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:59:53 GMT)
Scaling and Beyond: Advancing Spatial Reasoning in MLLMs Requires New Recipes [84.1] MLLM(Multimodal Large Language Models)は、一般的な視覚言語タスクにおいて印象的な性能を示す。
近年の研究では、空間的推論能力の限界が明らかにされている。
この空間的推論の欠如は、MLLMが物理的世界と効果的に相互作用する能力を著しく制限する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:29:23 GMT)
Cannot See the Forest for the Trees: Invoking Heuristics and Biases to Elicit Irrational Choices of LLMs [83.1] 本研究では,人間の認知における認知的分解と偏見に触発された新しいジェイルブレイク攻撃フレームワークを提案する。
我々は、悪意のあるプロンプトの複雑さと関連バイアスを減らし、認知的分解を用いて、プロンプトを再編成する。
また、従来の二分的成功または失敗のパラダイムを超越したランキングベースの有害度評価指標も導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:46:36 GMT)
NextQuill: Causal Preference Modeling for Enhancing LLM Personalization [82.2] 因果選好モデルに基づく新しいパーソナライズフレームワークであるNextQuillを紹介する。
この洞察に基づいて、NextQuillは2つの補完的なアライメント戦略を導入した。
複数のパーソナライズベンチマークの実験により、NextQuillはパーソナライズ品質を大幅に改善することが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:08:55 GMT)
WeightLoRA: Keep Only Necessary Adapters [79.9] 低ランク適応(texttLoRA$)は、指定されたレイヤにトレーニング可能なアダプタを追加する。
我々は、最も重要な$textttLoRA$ヘッダの適応的な選択によってこの問題を克服する新しい方法である$textttWeightLoRA$を提案する。
我々は、一連の競合ベンチマークとDeBERTa、BART、Llamaモデルの実験を行い、我々の手法を異なる適応的アプローチと比較した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:33:16 GMT)
Localizing and Mitigating Errors in Long-form Question Answering [79.6] LFQA(Long-form Question answering)は、複雑な質問に対して徹底的で深い回答を提供し、理解を深めることを目的としている。
この研究は、人書きおよびモデル生成LFQA回答の局所的エラーアノテーションを備えた最初の幻覚データセットであるHaluQuestQAを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:18:55 GMT)
IllumiCraft: Unified Geometry and Illumination Diffusion for Controllable Video Generation [79.2] IllumiCraftは3つの補完的な入力を受け入れるエンドツーエンドの拡散フレームワークである。
ユーザの定義したプロンプトに沿った時間的に一貫性のあるビデオを生成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:59:52 GMT)
RobustSplat: Decoupling Densification and Dynamics for Transient-Free 3DGS [79.2] 3D Gaussian Splattingは、ノベルビュー合成と3Dモデリングにおけるリアルタイム、フォトリアリスティックレンダリングにおいて大きな注目を集めている。
既存の手法は、過渡的なオブジェクトに影響されたシーンを正確にモデル化するのに苦労し、描画された画像のアーティファクトに繋がる。
2つの重要な設計に基づく堅牢なソリューションであるRobustSplatを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:13:48 GMT)
Pruning General Large Language Models into Customized Expert Models [79.0] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、その相当なモデルサイズは、しばしばかなりの計算資源を必要とする。
そこで本研究では,より小型のエキスパートモデルに大容量の一般モデルを組み込む手法を提案する。
各次元の無関係ニューロンを識別し、プルーニングすることにより、$textttCus-Prun$は、ポストトレーニングなしで専門家モデルを作成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:47:30 GMT)
Protein Inverse Folding From Structure Feedback [78.3] 本稿では,タンパク質の折りたたみモデルからのフィードバックを用いて,逆折りたたみモデルを微調整する手法を提案する。
CATH 4.2 テストセットの結果,DPO の微調整により平均 TM-Score が大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:02:12 GMT)
Rodrigues Network for Learning Robot Actions [76.7] 本稿では,ニューラルロドリゲス演算子を用いて,キネマティクスを意識した帰納バイアスを神経計算に注入する手法を提案する。
ロドリゲスネットワーク(RodriNet)は,処理動作に特化したニューラルアーキテクチャである。
この結果から,構造化キネマティック前駆体をネットワークアーキテクチャに統合することで,様々な領域における行動学習が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:34:06 GMT)
CulturalBench: A Robust, Diverse, and Challenging Cultural Benchmark by Human-AI CulturalTeaming [75.8] カルチャーベンチ(CulturalBench)は、LMの文化的知識を評価するための1,696の人文・人文的な質問である。
バングラデシュ、ジンバブエ、ペルーなど45の地域をカバーしている。
我々はHuman-AI Red-Teamingにインスパイアされた手法を用いてCulturalBenchを構築した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:56:26 GMT)
TL;DR: Too Long, Do Re-weighting for Effcient LLM Reasoning Compression [75.8] 高度なデータアノテーションに依存しない動的比に基づくトレーニングパイプラインを提案する。
我々は、DeepSeek-R1-Distill-7BとDeepSeek-R1-Distill-14Bのモデルと、様々な難易度を持つ様々なベンチマークのモデルに対するアプローチを検証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:23:41 GMT)
Truly Assessing Fluid Intelligence of Large Language Models through Dynamic Reasoning Evaluation [75.3] 大きな言語モデル(LLM)は、人間のような思考を反映する印象的な推論能力を示している。
既存の推論ベンチマークでは、ドメイン固有の知識(結晶化インテリジェンス)に焦点を当てるか、解釈可能性に欠ける。
階層的認知フレームワークを基盤とした動的推論評価ベンチマークであるDRE-Benchを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:01:08 GMT)
LazyReview A Dataset for Uncovering Lazy Thinking in NLP Peer Reviews [74.9] この研究は、微粒な遅延思考カテゴリで注釈付けされたピアレビュー文のデータセットであるLazyReviewを紹介している。
大規模言語モデル(LLM)は、ゼロショット設定でこれらのインスタンスを検出するのに苦労する。
命令ベースのデータセットの微調整により、パフォーマンスが10~20ポイント向上する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:06:43 GMT)
VPI-Bench: Visual Prompt Injection Attacks for Computer-Use Agents [74.7] 完全なシステムアクセスを持つコンピュータ利用エージェント(CUA)は、セキュリティとプライバシの重大なリスクを負う。
我々は、悪意のある命令がレンダリングされたユーザーインターフェイスに視覚的に埋め込まれた視覚的プロンプトインジェクション(VPI)攻撃について検討する。
実験により,現在のCUAとBUAは,それぞれのプラットフォーム上で最大51%,100%の速度で騙すことができることがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:21:50 GMT)
Towards Better De-raining Generalization via Rainy Characteristics Memorization and Replay [74.5] 現在の画像のデライニング方法は、主に限られたデータセットから学習する。
ネットワークが段階的にデライニングの知識基盤を拡大することを可能にする新しいフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:50:00 GMT)
Self-Improvement Towards Pareto Optimality: Mitigating Preference Conflicts in Multi-Objective Alignment [74.3] マルチオブジェクトアライメント(MOA)は、応答を複数の人間の嗜好目標に合わせることを目的としている。
DPOをベースとしたMOAアプローチは、データに広範囲にわたる優先的対立に悩まされている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:57:33 GMT)
Efficient Test-time Adaptive Object Detection via Sensitivity-Guided Pruning [73.4] 連続的なテスト時間適応オブジェクト検出(CTTA-OD)は、源となる事前訓練された検出器を常に変化する環境にオンライン適応させることを目的としている。
私たちのモチベーションは、学習したすべての特徴が有益であるとは限らないという観察に起因しています。
FLOPの計算オーバヘッドを12%削減し,優れた適応性を実現する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:27:56 GMT)
DCI: Dual-Conditional Inversion for Boosting Diffusion-Based Image Editing [73.1] Diffusionモデル内のインバージョンは、実または生成された画像の潜時雑音表現を復元することを目的としている。
ほとんどの反転アプローチは、復元精度と編集の柔軟性の間の本質的にのトレードオフに悩まされている。
本稿ではDCI(Dual-Conditional Inversion)について紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:46:44 GMT)
Label Deconvolution for Node Representation Learning on Large-scale Attributed Graphs against Learning Bias [72.3] 本稿では,学習バイアスを軽減するため,ラベルの効率的な正規化手法であるラベルデコンボリューション(LD)を提案する。
LDはOpen Graph Benchmarkデータセット上で最先端の手法よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:43:20 GMT)
SurgVLM: A Large Vision-Language Model and Systematic Evaluation Benchmark for Surgical Intelligence [72.1] SurgVLMは,外科的知能に関する最初の大規模視覚言語基盤モデルの一つである。
我々は16種以上の外科的タイプと18の解剖学的構造にまたがる大規模なマルチモーダル手術データベースSurgVLM-DBを構築した。
この包括的データセットに基づいて,Qwen2.5-VLをベースとしたSurgVLMを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:44:41 GMT)
Beyond Prompt Engineering: Robust Behavior Control in LLMs via Steering Target Atoms [71.9] モデルにおける膨大な数のパラメータは、しばしば高度に絡み合った内部表現をもたらす。
最近の研究は、スパースオートエンコーダ(SAE)を用いて、ステアリングのための高次元空間における知識を歪めている。
本研究では,非絡み合った知識コンポーネントを分離・操作し,安全性を高める手法であるステアリングターゲット原子(STA)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:40:17 GMT)
PAID: Pairwise Angular-Invariant Decomposition for Continual Test-Time Adaptation [71.2] 本稿では,事前学習した重みの幾何学的特性を出発点として,3つの重要な成分(等級,絶対角,対角構造)を体系的に解析する。
両角構造は多種多様なドメインにわたって安定であり, ドメイン不変な意味情報を符号化し, 適応中に保存すべきことを示唆する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:18:15 GMT)
Greening AI-enabled Systems with Software Engineering: A Research Agenda for Environmentally Sustainable AI Practices [70.2] CECAM-Lorentzワークショップは2025年2月3日、スイスのローザンヌで開催された。
本報告ではワークショップから生まれた研究課題について述べる。
環境に優しいAIシステムの開発を導くために、オープンな研究の方向性と実践的な勧告を概説する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:44:31 GMT)
DeepShop: A Benchmark for Deep Research Shopping Agents [70.0] DeepShopは、複雑なリアルなオンラインショッピング環境でWebエージェントを評価するために設計されたベンチマークである。
5つの人気のあるオンラインショッピングドメインに多様なクエリを生成します。
エージェントの性能をきめ細かな面から評価する自動評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:08:17 GMT)
HaploOmni: Unified Single Transformer for Multimodal Video Understanding and Generation [69.3] 本稿では,マルチモーダル理解と生成を統一する単一トランスフォーマーを構築するための,効率的なトレーニングパラダイムについて検討する。
機能事前スケーリングとマルチモーダルAdaLN技術を導入し、クロスモーダル互換性の課題に対処する。
本稿では,新しいマルチモーダルトランスであるHaplo Omniを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:14:00 GMT)
Computational Thinking Reasoning in Large Language Models [69.3] 計算思考モデル(CTM)は、計算思考パラダイムを大規模言語モデル(LLM)に組み込んだ新しいフレームワークである。
ライブコード実行は推論プロセスにシームレスに統合され、CTMが計算によって考えることができる。
CTMは、精度、解釈可能性、一般化可能性の観点から、従来の推論モデルとツール拡張ベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:11:15 GMT)
DeepTheorem: Advancing LLM Reasoning for Theorem Proving Through Natural Language and Reinforcement Learning [67.9] DeepTheoremは、数学的推論を強化するために自然言語を活用する包括的な非公式な定理証明フレームワークである。
DeepTheoremには、121Kの高品質なIMOレベルの非公式な定理と証明からなる大規模なベンチマークデータセットが含まれている。
我々は、証明された定理の変種を利用して堅牢な数学的推論を動機付けることによって、非公式な定理証明に適した新しい強化学習戦略(RL-Zero)を考案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:23:21 GMT)
VisuRiddles: Fine-grained Perception is a Primary Bottleneck for Multimodal Large Language Models in Abstract Visual Reasoning [66.8] マルチモーダル大規模言語モデル(MLLM)の最近の進歩は、多くの推論タスクにおいて、その性能を著しく向上させてきた。
AVR(Abstract Visual Reasoning)は、抽象グラフィックの知覚に制限があるため、依然として重要な課題である。
PRSのベンチマークであるVisuRiddlesを提案し、モデルの推論能力を評価するために精巧に構築されたタスクを特徴付ける。
第二に、パーセプチュアル・リドル・シンセサイザー (PRS) を導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:24:00 GMT)
VinePPO: Refining Credit Assignment in RL Training of LLMs [66.8] 我々は,言語環境の柔軟性を利用してモンテカルロをベースとした推定値を計算する,簡単なアプローチであるVinePPOを提案する。
本手法は,MATHおよびGSM8Kデータセット間のPPOおよび他のベースラインをウォールクロック時間以下で連続的に上回る。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:51:06 GMT)
Reinforcing Video Reasoning with Focused Thinking [65.9] 新たなフレームワークは、集中した思考と深い報酬の粒度による視覚的推論を強化する。
我々は,高情報密度のトークンを優先するトークン重み付け機構を採用している。
シングルチョイスからマルチチョイスQAタスクにシフトすることで、RLトレーニングを再構築する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:00:29 GMT)
Robustness in Both Domains: CLIP Needs a Robust Text Encoder [65.4] LEAFはテキストドメインの効率の良い逆方向の微調整手法であり、大きなCLIPモデルにスケールできる。
我々のモデルは、ロバスト画像エンコーダによる視力性能を維持しながら、テキスト領域におけるゼロショット対角精度を著しく向上させる。
我々は,ロバストテキストエンコーダが直接最適化による埋め込みから入力テキストの再構築を容易にすることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:57:09 GMT)
Chain-of-Jailbreak Attack for Image Generation Models via Editing Step by Step [65.2] ステップバイステップの編集プロセスを通じて画像生成モデルを損なう、Chain-of-Jailbreak (CoJ)アタックと呼ばれる新しいジェイルブレイク手法を提案する。
我々のCoJ攻撃手法は、60%以上のケースでモデルの保護を回避できる。
また,効果的なプロンプトベース手法であるThink Twice Promptingを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:32:00 GMT)
SHuBERT: Self-Supervised Sign Language Representation Learning via Multi-Stream Cluster Prediction [65.2] SHuBERT (Sign Hidden-Unit BERT) は、アメリカの手話ビデオ1,000時間から学習した自己教師付き文脈表現モデルである。
SHuBERTは、マスクされたトークン予測目標をマルチストリームの視覚手話入力に適用し、クラスタ化された手、顔、身体のポーズストリームに対応する複数のターゲットを予測することを学習する。
SHuBERTは手話翻訳、手話認識、指先検出など、複数のタスクで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:30:30 GMT)
ORPP: Self-Optimizing Role-playing Prompts to Enhance Language Model Capabilities [64.2] 複雑なタスクにおいて、大きな言語モデルから優れたパフォーマンスを引き出すためには、高品質なプロンプトが不可欠である。
本稿では,ロールプレイングプロンプトの最適化と生成によりモデル性能を向上させるフレームワークORPPを提案する。
ORPPは一致しただけでなく、ほとんどの場合、性能の点で既存の主流のプロンプト最適化手法を上回ります。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:51:35 GMT)
KARE-RAG: Knowledge-Aware Refinement and Enhancement for RAG [63.8] Retrieval-Augmented Generation (RAG)は、大規模言語モデルがより広範な知識ソースにアクセスすることを可能にする。
ノイズの多いコンテンツを処理するために生成モデルの能力を向上させることは、ロバストなパフォーマンスに等しく重要であることを実証する。
本稿では,3つの重要なイノベーションを通じて知識利用を改善するKARE-RAGを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:31:17 GMT)
PhysGaia: A Physics-Aware Dataset of Multi-Body Interactions for Dynamic Novel View Synthesis [62.3] PhysGaiaは動的ノベルビュー合成(DyNVS)のために設計された物理対応のデータセットである。
私たちのデータセットは、複数のオブジェクト間のリッチな相互作用を伴う複雑な動的シナリオを提供します。
PhysGaiaは、動的ビュー合成、物理に基づくシーン理解、および物理シミュレーションと統合されたディープラーニングモデルの研究を著しく前進させる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:19:18 GMT)
TestAgent: An Adaptive and Intelligent Expert for Human Assessment [62.1] 対話型エンゲージメントによる適応テストを強化するために,大規模言語モデル(LLM)を利用したエージェントであるTestAgentを提案する。
TestAgentは、パーソナライズされた質問の選択をサポートし、テストテイカーの応答と異常をキャプチャし、動的で対話的なインタラクションを通じて正確な結果を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:07:54 GMT)
Social Genome: Grounded Social Reasoning Abilities of Multimodal Models [61.9] 社会的推論能力は、AIシステムが社会的文脈内でのマルチモーダルなヒューマンコミュニケーションと相互作用を解釈し、応答する上で不可欠である。
SOCIAL GENOMEは,マルチモーダルモデルのきめ細かな基礎的な社会的推論能力を示す最初のベンチマークである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:00:47 GMT)
OpenFace 3.0: A Lightweight Multitask System for Comprehensive Facial Behavior Analysis [61.9] OpenFace 3.0は、顔のランドマークの検出、顔のアクションユニットの検出、視線推定、顔の感情認識が可能なオープンソースのツールキットである。
システムは1行のコードでインストールして実行でき、特別なハードウェアを使わずにリアルタイムで動作する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:56:10 GMT)
What Goes Into a LM Acceptability Judgment? Rethinking the Impact of Frequency and Length [61.7] MORCELAはアクセプタビリティのためのリンク理論よりも優れていることを示す。
より大型のモデルでは、一グラムの周波数に対する相対的な調整の度合いが低い。
本分析により,より大きなLMの周波数効果に対する感受性の低下は,文脈において稀な単語をより正確に予測する能力によって説明できることが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:09:48 GMT)
HumanRAM: Feed-forward Human Reconstruction and Animation Model using Transformers [60.9] HumanRAMは、モノクル画像やスパース画像から人間の再構築とアニメーションを一般化するための、新しいフィードフォワードアプローチである。
提案手法は,人間の再構築とアニメーションを,明示的なポーズ条件を導入することによって統合された枠組みに統合する。
実験の結果,HumanRAMは再現精度,アニメーション忠実度,実世界のデータセット上での一般化性能において,従来の手法をはるかに上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:50:05 GMT)
lmgame-Bench: How Good are LLMs at Playing Games? [60.0] 本稿では,現代の大規模言語モデル (LLM) エージェントを評価するために,人気ゲームを使用する上での大きな課題について検討する。
我々はlmgame-Benchを導入し、ゲームを信頼性評価に変換する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:53:37 GMT)
Offline Adaptation of Quadruped Locomotion using Diffusion Models [59.9] 本稿では,複数のスキル間の相互補間と学習の限界に同時に対処する,四足歩行への拡散に基づくアプローチを提案する。
これらの機能は、マルチスキルポリシーと互換性があり、ほとんど変更することなく、最小限の計算オーバーヘッドで適用可能であることを示す。
ANYmal四重奏プラットフォーム上でのハードウェア実験によるアプローチの有効性を検証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:40:04 GMT)
Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback [59.7] Critique-GRPOは、効果的なポリシー最適化のための自然言語と数値フィードバックを統合している。
教師付き学習ベースとRLベースの微調整アプローチを一貫して上回る。
オンライン強化学習に専門家によるデモンストレーションを取り入れた、強力なベースラインを超えている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:39:02 GMT)
Rethinking Machine Unlearning in Image Generation Models [59.7] CatIGMUは、新しい階層的なタスク分類フレームワークである。
EvalIGMUは包括的な評価フレームワークである。
高品質な未学習データセットであるDataIGMを構築した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:25:14 GMT)
AstroVisBench: A Code Benchmark for Scientific Computing and Visualization in Astronomy [59.3] AstroVisBenchは天文学領域における科学計算と可視化の両方のための最初のベンチマークである。
本稿では,最先端言語モデルの評価を行い,天文学研究に有用なアシスタントとして携わる能力に大きなギャップがあることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:56:38 GMT)
Solving Inverse Problems with FLAIR [59.0] フローベースの潜在生成モデルは、驚くべき品質の画像を生成でき、テキスト・ツー・イメージ生成も可能である。
本稿では,フローベース生成モデルを逆問題の前兆として活用する新しい学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:29:47 GMT)
VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding [59.0] VideoLLaMA3は、画像とビデオの理解のためのより高度なマルチモーダル基盤モデルである。
VideoLLaMA3には、視覚適応、視覚言語調整、ファインチューニング、ビデオ中心のファインチューニングの4つのトレーニングステージがある。
VideoLLaMA3は、画像理解ベンチマークとビデオ理解ベンチマークの両方で魅力的なパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:33:14 GMT)
The Devil is in the Darkness: Diffusion-Based Nighttime Dehazing Anchored in Brightness Perception [58.9] 本稿では,Diffusion-based Nighttime Dehazingフレームワークについて紹介する。
輝度知覚ネットワークによって導かれる事前学習拡散モデルを統合する復元モデルを提案する。
実験では、データセットの有用性と、ジョイントヘイズ除去と輝度マッピングにおけるモデルの優れたパフォーマンスを検証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:21:13 GMT)
G1: Teaching LLMs to Reason on Graphs with Reinforcement Learning [58.7] 合成グラフ理論タスクにおける強化学習(RL)はグラフ推論能力を著しく拡張することができる。
RL on ErdosでG1はグラフ推論の大幅な改善を実現し、微調整された3BモデルはQwen2.5-72B-Instruct(24倍)よりも優れています。
我々の研究は、グラフ理論上のRLでLLMを微調整することで、強力なグラフ推論器を構築するための効率的でスケーラブルな経路を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:21:57 GMT)
Towards Explicit Geometry-Reflectance Collaboration for Generalized LiDAR Segmentation in Adverse Weather [58.5] 既存のLiDARセグメンテーションモデルは、悪天候にさらされると精度が低下することが多い。
この課題に対処する最近の手法は、気象シミュレーションやユニバーサル拡張技術によるトレーニングデータの強化に重点を置いている。
本稿では,幾何・反射性の特徴抽出を明示的に分離する新しい幾何・反射性協調フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:23:43 GMT)
Causal Estimation of Tokenisation Bias [58.2] 我々は、訓練されたモデルが対応する文字に割り当てる確率に対して、トークンの語彙にサブワードを含むか否かを定量化する。
トークン化は、スケール、語彙、トークンサプライヤにわたるモデルのアウトプットに一貫して影響を与えます。
特に、小モデルの語彙におけるサブワードの存在は、文字の確率を最大17倍に向上させる可能性がある。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:59:47 GMT)
XToM: Exploring the Multilingual Theory of Mind for Large Language Models [58.0] LLMにおける既存の心の理論の評価は英語に限られている。
XToMは5言語にまたがってToMを評価する,厳格に検証された多言語ベンチマークである。
以上の結果から,LLMが言語的文脈にまたがって人間的なメンタライゼーションを再現する能力に限界があることが判明した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:23:25 GMT)
Rethinking Whole-Body CT Image Interpretation: An Abnormality-Centric Approach [57.9] 全身に404例の異常所見を呈する包括的階層分類システムを提案する。
複数平面および全人体領域からの14.5K以上のCT画像を含むデータセットを寄贈し,19K以上の異常に対する接地アノテーションを念頭に提供した。
OminiAbnorm-CTは,テキストクエリに基づいて,多面的および全身的なCT画像に異常な所見を自動的に検出し,記述することができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:57:34 GMT)
A Dynamic Transformer Network for Vehicle Detection [57.4] 車両検出のための動的トランスフォーマーネットワーク(DTNet)を提案する。
DTNetは動的畳み込みを利用してディープネットワークを誘導し、重量を動的に生成し、得られた検出器の適応性を高める。
画像アカウントにおける差の欠点を克服するため、変換変分畳み込みは、取得した車両検出構造情報を洗練するために、空間的位置情報に依存する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:29:35 GMT)
DCM: Dual-Expert Consistency Model for Efficient and High-Quality Video Generation [57.3] 本稿では,パラメータ効率の高いtextbfDual-Expert Consistency Model (DCM) を提案する。
提案手法は, ビデオ拡散モデル蒸留における専門的専門化の有効性を実証し, サンプリング工程を大幅に短縮して, 最先端の視覚品質を実現する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:55:04 GMT)
Normalized Attention Guidance: Universal Negative Guidance for Diffusion Models [57.2] 注意空間にL1をベースとした正規化・精細化を施した,効率的かつトレーニング不要な機構である正規化注意誘導(NAG)を提案する。
NAGは、CFGが忠実性を維持しながら崩壊する効果的な負のガイダンスを復元する。
NAGはアーキテクチャ(UNet、DiT)、サンプリングレシスタンス(複数ステップ、複数ステップ)、モダリティ(イメージ、ビデオ)をまたいで一般化する
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:46:07 GMT)
RefEdit: A Benchmark and Method for Improving Instruction-based Image Editing Model on Referring Expressions [56.9] スケーラブルな合成データ生成パイプラインでトレーニングされた命令ベースの編集モデルであるRefEditを紹介します。
私たちのRefEditは、わずか2万の編集三脚でトレーニングされており、何百万ものデータでトレーニングされたFlux/SD3モデルベースラインを上回っています。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:20:24 GMT)
FuseLIP: Multimodal Embeddings via Early Fusion of Discrete Tokens [56.8] マルチモーダル埋め込みの代替アーキテクチャであるFuseLIPを提案する。
本稿では,テキストと画像トークンの拡張語彙で動作する単一のトランスフォーマーモデルを提案する。
本稿では,VQAやテキスト誘導画像変換検索などのマルチモーダル埋め込みタスクにおいて,FuseLIPが他の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:27:12 GMT)
Can't See the Forest for the Trees: Benchmarking Multimodal Safety Awareness for Multimodal LLMs [56.4] MLLM(Multimodal Large Language Models)は、テキストと画像の両方を通して対話を可能にすることで、従来の言語モデルの能力を拡大した。
MMSafeAwareは,安全シナリオ29のMLLMを評価するために設計された,初の総合的マルチモーダル安全意識ベンチマークである。
MMSafeAwareには安全でないサブセットと安全でないサブセットの両方が含まれており、安全でないコンテンツを正しく識別するモデルの評価と、有用性を阻害する過敏性を回避することができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:27:16 GMT)
MISLEADER: Defending against Model Extraction with Ensembles of Distilled Models [56.1] モデル抽出攻撃は、クエリアクセスを通じてブラックボックスモデルの機能を複製することを目的としている。
既存のディフェンスでは、アタッカークエリにはオフ・オブ・ディストリビューション(OOD)サンプルがあることを前提としており、不審な入力を検出し破壊することができる。
OOD仮定に依存しない新しい防衛戦略であるMISLEADERを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:37:09 GMT)
CLAIM: Mitigating Multilingual Object Hallucination in Large Vision-Language Models with Cross-Lingual Attention Intervention [56.1] LVLM(Large Vision-Language Models)は、印象的なマルチモーダル能力を示したが、多言語オブジェクト幻覚の傾向は残っていない。
LVLMにおける多言語オブジェクト幻覚(CLAIM)の緩和のための言語横断的注意介入を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:17:16 GMT)
Memory-Efficient and Privacy-Preserving Collaborative Training for Mixture-of-Experts LLMs [56.0] プライバシー保護型コラボレーション・オブ・エクササイズ(PC-MoE)を紹介する。
設計上、PC-MoEは分散計算の強みと強い機密性の保証を相乗的に組み合わせている。
完全に集中したモデルのパフォーマンスと収束率とほぼ一致(時には超える)し、70%近いピークのGPURAMの削減を享受し、再構築攻撃に対して完全に堅牢である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:00:18 GMT)
Dehumanizing Machines: Mitigating Anthropomorphic Behaviors in Text Generation Systems [56.0] このようなシステムアウトプットにどのように介入すれば人為的行動が緩和され、その付随する有害な結果が未検討のままである。
我々は,先行研究とクラウドソーシング研究の両方に根ざした介入の目録をまとめ,参加者がシステムアウトプットを編集し,人間らしくないようにした。
また,考えられる介入の景観を特徴づけ,異なる種類の介入の区別を明確化し,異なる介入の有効性を評価するための理論的基盤を提供するための概念的枠組みも開発している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:14:14 GMT)
Asymptotically Optimal Linear Best Feasible Arm Identification with Fixed Budget [55.9] 本稿では,誤差確率の指数的減衰を保証し,最適な腕識別のための新しいアルゴリズムを提案する。
我々は,複雑性のレベルが異なる様々な問題インスタンスに対する包括的経験的評価を通じて,アルゴリズムの有効性を検証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:56:26 GMT)
Towards Enhanced Immersion and Agency for LLM-based Interactive Drama [55.8] 本論文は,対話型ドラマを2つの側面から理解することから始まる:没入感,プレイヤーの物語への参加感,エージェンシーである。
これら2つの側面を強化するために,我々はまず,LLMが劇的なストーリーを製作し,構造と物語の質を大幅に向上させる新しい手法であるPlaywriting-Guided Generationを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:10:00 GMT)
Trajectory Prediction Meets Large Language Models: A Survey [55.7] 大規模言語モデル(LLM)の最近の進歩は、言語駆動の手法を軌道予測に統合することへの関心が高まっている。
この調査は、この新興分野の包括的概要を提供し、最近の研究を5つの方向に分類する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:36:56 GMT)
Grounded Persuasive Language Generation for Automated Marketing [55.6] 本稿では,大規模言語モデル(LLM)を用いて,説得力のあるマーケティングコンテンツの自動生成を実現するエージェントフレームワークを開発する。
提案手法は,生成したコンテンツとユーザの好みを一致させると同時に,有用な事実属性を強調表示するように設計されている。
我々は、不動産マーケティングの分野において、潜在的住宅購入者の焦点を絞った体系的な人物実験を行う。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:49:54 GMT)
MERIT: Multilingual Semantic Retrieval with Interleaved Multi-Condition Query [55.5] MERITは、インターリーブされたマルチ条件セマンティック検索のための最初の多言語データセットである。
本稿では,多条件セマンティック検索のための最初の多言語データセットであるMERITを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:59:14 GMT)
DC-ControlNet: Decoupling Inter- and Intra-Element Conditions in Image Generation with Diffusion Models [55.4] マルチ条件画像生成のためのフレームワークであるDC(Decouple)-ControlNetを紹介する。
DC-ControlNetの背景にある基本的な考え方は、制御条件を分離し、グローバルな制御を階層的なシステムに変換することである。
要素間の相互作用については、Inter-Element Controllerを紹介します。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:29:46 GMT)
Controllable Human-centric Keyframe Interpolation with Generative Prior [55.2] 本稿では,PoseFuse3D Keyframe Interpolator(PoseFuse3D-KI)を紹介する。
我々は,PoseFuse3D-KIがCHKI-Videoの最先端のベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:50:05 GMT)
Seeing the Arrow of Time in Large Multimodal Models [55.1] 現在の大規模マルチモーダルモデル(LMM)は、言語クエリに応答する際のビデオの時間方向の知覚と利用に苦慮している。
本稿では,強化学習(RL)に基づく学習戦略であるArrowRLを紹介する。
厳密な評価のために、時間的課題を探索する新しい多面的ベンチマークであるAoTBenchを開発する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:32:07 GMT)
EgoZero: Robot Learning from Smart Glasses [54.6] EgoZeroはProject Ariaスマートグラスで捉えた人間のデモから堅牢な操作ポリシーを学ぶ。
EgoZeroのポリシーをFranka Pandaロボットにデプロイし、7つの操作タスクに対して70%の成功率でゼロショット転送を実演する。
この結果から,実世界におけるロボット学習のためのスケーラブルな基盤として,現在地にある人間のデータを活用できることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:50:28 GMT)
EvaLearn: Quantifying the Learning Capability and Efficiency of LLMs via Sequential Problem Solving [54.4] EvaLearnは、大きな言語モデル(LLM)を学習能力と課題の効率性を評価するために設計されたベンチマークである。
9つのフロンティアモデルをベンチマークし、様々な性能プロファイルを観察する。
静的能力の強い現在のLLMは、全てのタスクにおいて学習能力に明らかな優位性を示すものではない。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:18:33 GMT)
CoRe-MMRAG: Cross-Source Knowledge Reconciliation for Multimodal RAG [54.0] 我々は,textbfMultitextbfModal textbfRAG(CoRe-MMRAG)のためのtextbfReconciliationを提案する。
CoRe-MMRAGはベースライン法よりも大幅に改善され、InfoSeekとEncyclopedic-VQAでそれぞれ5.6%と9.3%のパフォーマンス向上を達成した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:32:40 GMT)
Mitigating Visual Forgetting via Take-along Visual Conditioning for Multi-modal Long CoT Reasoning [53.8] 本稿では、画像入力を重要な推論段階に移行する戦略であるTake-Allong Visual Conditioning (TVC)を提案する。
TVCは、推論を通して視覚的なコンポーネントへの注意を維持するのに役立つ。
提案手法は,5つの数学的推論ベンチマークにおいて,最先端の性能を平均で達成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:56:06 GMT)
Mobile-Agent-V: A Video-Guided Approach for Effortless and Efficient Operational Knowledge Injection in Mobile Automation [53.5] Mobile-Agent-Vは、動画をガイドツールとして活用し、モバイル自動化プロセスに運用知識を強制的かつ効率的に注入する革新的なフレームワークである。
ビデオコンテンツから直接知識を抽出することにより、Mobile-Agent-Vは手作業による介入を排除し、知識獲得に必要な労力と時間を著しく削減する。
実験の結果, Mobile-Agent-Vは既存手法に比べて36%向上した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:39:01 GMT)
Mobile-Agent-V: A Video-Guided Approach for Effortless and Efficient Operational Knowledge Injection in Mobile Automation [53.5] Mobile-Agent-Vは、動画をガイドツールとして活用し、モバイル自動化プロセスに運用知識を強制的かつ効率的に注入する革新的なフレームワークである。
ビデオコンテンツから直接知識を抽出することにより、Mobile-Agent-Vは手作業による介入を排除し、知識獲得に必要な労力と時間を著しく削減する。
実験の結果, Mobile-Agent-Vは既存手法に比べて36%向上した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:37:03 GMT)
Unleashing the Reasoning Potential of Pre-trained LLMs by Critique Fine-Tuning on One Problem [53.3] 一つの問題に対する批判的微調整(CFT)は,LLMの推論能力を効果的に解き放つことができることを示す。
わずか5回のGPUトレーニングで、Qwen-Math-7B-CFTは6つのベンチマークで平均15%改善、3つのロジック推論ベンチマークで平均16%改善した。
結果は20倍の計算量で、RLの結果に匹敵するか、さらに上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:35:52 GMT)
CodeDPO: Aligning Code Models with Self Generated and Verified Source Code [52.7] 我々は、コード生成に好み学習を統合するフレームワークであるCodeDPOを提案し、コードの正確性と効率性という2つの重要なコード優先要因を改善した。
CodeDPOは、コードとテストケースを同時に生成、評価するセルフジェネレーション・アンド・バリデーションメカニズムを利用して、新しいデータセット構築方法を採用している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:19:46 GMT)
AnimeShooter: A Multi-Shot Animation Dataset for Reference-Guided Video Generation [52.7] AnimeShooterは参照誘導型マルチショットアニメーションデータセットである。
ストーリーレベルのアノテーションは、ストーリーライン、キーシーン、参照イメージを持つメインキャラクタプロファイルを含む、物語の概要を提供する。
ショットレベルのアノテーションはストーリーを連続したショットに分解し、それぞれにシーン、キャラクター、物語と記述的なビジュアルキャプションが注釈付けされている。
別個のサブセットであるAnimeShooter-audioは、ショットごとに同期されたオーディオトラックと、オーディオ記述と音源を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:55:18 GMT)
Attention Knows Whom to Trust: Attention-based Trust Management for LLM Multi-Agent Systems [52.6] LLM-MAS(Large Language Model-based Multi-Agent Systems)は、複雑なタスクを解く上で強力な能力を示すが、エージェントが信頼性の低いメッセージを受け取ると弱いままである。
LLMエージェントは、信頼性を評価することなく、すべての受信メッセージを平等に扱う。
本稿では,メッセージの信頼度を評価するための軽量な注意ベース手法であるAttention Trust Score (A-Trust)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:32:57 GMT)
DyePack: Provably Flagging Test Set Contamination in LLMs Using Backdoors [52.5] トレーニング中にベンチマークテストセットを使用したモデルを識別するためにバックドアアタックを利用するフレームワークであるDiePackを紹介します。
銀行が染料パックにお金を混ぜて強盗をマークするのと同じように、DiePackはバックドアのサンプルとテストデータとを混ぜて、その上で訓練されたモデルのフラグを立てる。
我々はDiePackを3つのデータセットにわたる5つのモデルで評価し、複数の選択とオープンな生成タスクの両方をカバーした。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:13:43 GMT)
PBR-SR: Mesh PBR Texture Super Resolution from 2D Image Priors [52.3] PBR-SRは物理ベースレンダリング(PBR)テクスチャスーパーレゾリューション(SR)の新しい手法である
ゼロショット方式で低解像度(LR)PBR入力から高解像度で高品質なPBRテクスチャを出力する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:15:34 GMT)
How do Pre-Trained Models Support Software Engineering? An Empirical Study in Hugging Face [52.3] オープンソースの事前訓練モデル(PTM)は、さまざまな機械学習(ML)タスクに広範なリソースを提供する。
これらのリソースには、ソフトウェア工学(SE)のニーズに合わせた分類がない。
私たちは147のSEタスクを含む分類法を導き、人気のあるオープンソースMLリポジトリであるHugging Face (HF)において、SE指向の分類をPTMに適用する。
PTMではコード生成が最も一般的なSEタスクであるのに対して、要件エンジニアリングとソフトウェア設計のアクティビティは限定的な注目を集めている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:51:17 GMT)
CapSpeech: Enabling Downstream Applications in Style-Captioned Text-to-Speech [51.4] CapTTS関連の一連のタスクのための新しいベンチマークであるCapSpeechを紹介する。
CapSpeechは、1000万以上の機械アノテーション付きオーディオキャプチャーペアと、約0.36万の人間アノテーション付きオーディオキャプチャーペアで構成されている。
CapSpeech上で自己回帰モデルと非自己回帰モデルの両方を用いて包括的実験を行う。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:28:55 GMT)
Focused-DPO: Enhancing Code Generation Through Focused Preference Optimization on Error-Prone Points [51.4] Focused-DPOは、優先度最適化を重要なエラー発生箇所に向けることで、コード生成を強化するフレームワークである。
エラーを起こしやすい点に焦点を当てることで、Focused-DPOはモデル生成コードの正確性と機能を向上させる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:17:05 GMT)
Why Do More Experts Fail? A Theoretical Analysis of Model Merging [51.2] モデルマージは、複数のエキスパートモデルを単一のマルチタスクモデルに組み合わせることで、ストレージと計算資源を劇的に削減する。
最近のモデルマージ手法は有望な結果を示しているが、マージモデルの増加に伴い性能向上の維持に苦慮している。
限定効用パラメータ空間は、マージを成功させることのできるモデルの数に厳密な制約を課すことを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:43:50 GMT)
Minos: A Multimodal Evaluation Model for Bidirectional Generation Between Image and Text [51.1] 我々は,人間とGPTの両方による評価データを組み合わせた大規模マルチモーダル評価データセットであるMinos-Corpusを紹介する。
このコーパスに基づいて,データ選択とバランス,混合SFTトレーニング手法を提案し,DPOをミノの開発に適用する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:17:16 GMT)
Point Cloud Mixture-of-Domain-Experts Model for 3D Self-supervised Learning [50.6] ポイントクラウドは、3Dデータの主表現として、シーンドメインポイントクラウドとオブジェクトドメインポイントクラウドに分類することができる。
本稿では,ブロック・ツー・シーン事前学習戦略を用いて,総合的なPoint Cloud Mixture-of-Domain-Expertsモデル(Point-MoDE)を学習することを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:21:46 GMT)
A Tree-guided CNN for image super-resolution [50.3] 画像超解像のためのツリー誘導CNN(TSRNet)を設計する。
ツリーアーキテクチャを使ってディープネットワークを誘導し、キーノードの効果を高め、階層的な情報の関係を増幅する。
得られた構造情報の不足を防止するため、TSRNetのコサイン変換技術を用いて画像超解像の性能を向上させる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:05:11 GMT)
OpenS2V-Nexus: A Detailed Benchmark and Million-Scale Dataset for Subject-to-Video Generation [50.1] 我々は, (i) きめ細かいベンチマークである OpenS2V-Eval と (ii) 百万規模のデータセットである OpenS2V-5M からなる OpenS2V-Nexus を提案する。
OpenS2V-Evalは、自然の主観的外観とアイデンティティの忠実さを持つ主観的一貫性のあるビデオを生成するモデルの能力に焦点を当てている。
オープンソースの大規模S2V生成データセットOpenS2V-5Mを作成した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:11:00 GMT)
Revealing the Parallel Multilingual Learning within Large Language Models [50.1] 本研究では,多言語大言語モデル(LLM)の文脈内学習能力を明らかにする。
入力を複数の言語に翻訳することで、並列入力(PiM)をLLMに提供し、その理解能力を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:12:09 GMT)
Consultant Decoding: Yet Another Synergistic Mechanism [50.0] コンサルタント・デコーディング(CD)は、大きな言語モデルでのみ計算されるトークンレベルの確率を用いて、候補のドラフトを検証する。
CDは、目標モデルと比較して2.5倍の推論速度向上を実現し、同等の生成品質を維持している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:13:27 GMT)
Open-Set Living Need Prediction with Large Language Models [50.0] Meituanのようなライフサービスプラットフォームでは、ユーザー購入は生活ニーズによって駆動され、パーソナライズされたサービスレコメンデーションにとって、正確な生活ニーズ予測が不可欠である。
従来のアプローチでは、この予測をクローズドセットの分類問題として扱い、生活ニーズの多様性と複雑さを捉える能力を著しく制限している。
本稿では,大規模言語モデル(LLM)を利用した制約のないニーズ予測システムであるPIGEONを提案する。
現実世界のデータセットに関する大規模な実験では、PIGEONは平均19.37%の要求に基づくライフサービスリコールにおいて、クローズドセットのアプローチを著しく上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:10:19 GMT)
Recall with Reasoning: Chain-of-Thought Distillation for Mamba's Long-Context Memory and Extrapolation [49.9] マンバの理論的無限コンテキストポテンシャルは、訓練の長さをはるかに超える配列が実際に限られている。
この研究は、単純なyet- EffectiveメソッドであるRecall with Reasoning (RwR)によって、Mambaの長文メモリ能力をアンロックすることを検討する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:56:44 GMT)
RoundTable: Investigating Group Decision-Making Mechanism in Multi-Agent Collaboration [49.5] 複数ラウンドのコラボレーションにおいて、異なる投票ルールが意思決定の質と効率にどのように影響するかを分析する。
極端に言えば、全会一致投票は、最高のパフォーマンスの方法よりも87%低い初期パフォーマンスを与える。
本研究は,MASコラボレーションの最適化においてグループ意思決定が重要な役割を担っていることを明らかにする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:35:00 GMT)
Missing Data in Signal Processing and Machine Learning: Models, Methods and Modern Approaches [49.4] このチュートリアルの目的は、信号処理(SP)と機械学習(ML)の実践者に、その質問に答えるための重要なツールを提供することだ。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:12:45 GMT)
Continual Speech Learning with Fused Speech Features [49.2] 本稿では,現在の音声モデルにおける適応ギャップを埋めることを目的とした,新たな設定ターゲットである連続音声認識を紹介する。
我々は,エンコーダ・デコーダWhisperモデルを用いて音声タスクを生成形式に標準化する。
提案手法は,6つの音声処理タスクにおいて従来の手法よりも精度が向上し,完全再訓練を伴わずに新しい音声処理タスクに適応できることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:16:03 GMT)
Synthetic crystal rotation with spacetime metamaterials [49.2] 合成回転結晶によってアクセスされる光-物質相互作用機構について検討した。
以上の結果から, 合成回転結晶によってアクセスされる定性的に異なる光-物質相互作用機構が明らかとなった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:20:27 GMT)
Coding Agents with Multimodal Browsing are Generalist Problem Solvers [48.9] OpenHands-Versaは、控えめな多くの汎用ツールで構築された汎用AIエージェントである。
既存の最先端マルチエージェントシステムは、ターゲットドメインを超えて一般化できないことを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:50:55 GMT)
SViMo: Synchronized Diffusion for Video and Motion Generation in Hand-object Interaction Scenarios [48.1] ハンドオブジェクトインタラクション(HOI)生成には、大きな応用可能性がある。
現在の3D HOIモーション生成アプローチは、事前に定義された3Dオブジェクトモデルとラボでキャプチャされたモーションデータに大きく依存している。
本稿では,同期拡散プロセス内での視覚的事前制約と動的制約を組み合わせることで,HOIビデオと動きを同時に生成するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:04:29 GMT)
Time Course MechInterp: Analyzing the Evolution of Components and Knowledge in Large Language Models [47.8] OLMo-7Bモデルにおける事実的知識表現の進化を解析する。
この結果から,LSMは当初は広範で汎用的なコンポーネントに依存しており,後にトレーニングの進行とともに専門化されることが明らかとなった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:35:09 GMT)
A Smart Multimodal Healthcare Copilot with Powerful LLM Reasoning [47.8] MedRAGは、強力な大規模言語モデル(LLM)推論を備えた、スマートなマルチモーダルヘルスケアパトロールである。
非侵入的な音声モニタリング、一般的な医療クエリ、電子健康記録など、複数の入力モダリティをサポートしている。
MedRAGは、診断上の重要な洞察を回収し、統合し、誤診のリスクを減らす。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:39:02 GMT)
EssayBench: Evaluating Large Language Models in Multi-Genre Chinese Essay Writing [47.7] benchNameは4つの主要なジャンル(Argumentative, Narrative, Descriptive, Expository)にまたがる中国語エッセイを書くために設計されたマルチジャンルのベンチマークである。
階層的にスコアを集計する,きめ細かなジャンル別スコアリングフレームワークを開発した。
我々は15個の大型LCMをベンチマークし、ジャンルや命令タイプにまたがる長所と短所を分析した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:14:46 GMT)
Revisiting End-to-End Learning with Slide-level Supervision in Computational Pathology [47.5] 教師付きエンドツーエンド学習(E2E)は,高い計算要求や準最適結果などの課題に直面していることを示す。
この問題を軽減するために, ABMILX と呼ばれる新しい MIL を提案する。
E2EトレーニングされたResNetとAMMILXは、2段階のパラダイムの下でSOTA基盤モデルを上回る。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:46:50 GMT)
Video-Level Language-Driven Video-Based Visible-Infrared Person Re-Identification [47.4] Visible-based Infrared Person Re-Identification (VVIReID) は、モダリティ内のシーケンスレベルの特徴を抽出することによって、歩行者のシーケンスをモダリティにわたってマッチングすることを目的としている。
ビデオレベル言語駆動型VVI-ReID(VLD)フレームワークは、イモダリティ言語(IMLP)と時空間アグリゲーションという2つのコアモジュールから構成される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:49:08 GMT)
Geometric Signatures of Compositionality Across a Language Model's Lifetime [47.3] 現代言語モデルは、構成性によって実現された言語の本質的な単純さを反映しているかどうかを考察する。
構成性と幾何学的複雑性の関係は,学習した言語的特徴から生じる。
本分析では, 言語構成の意味的側面と表面的側面をそれぞれ符号化し, 非線形次元と線形次元の顕著な対比を示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:06:28 GMT)
CyberGym: Evaluating AI Agents' Cybersecurity Capabilities with Real-World Vulnerabilities at Scale [46.8] 大規模言語モデル(LLM)エージェントは、自律的なサイバーセキュリティタスクの処理において、ますます熟練している。
既存のベンチマークは不足していて、現実のシナリオをキャプチャできなかったり、スコープが限られていたりします。
我々はCyberGymを紹介した。CyberGymは1,507の現実世界の脆弱性を特徴とする大規模かつ高品質なサイバーセキュリティ評価フレームワークである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:35:14 GMT)
Learned Controllers for Agile Quadrotors in Pursuit-Evasion Games [46.5] アジャイル 1v1 四元数追跡回避のための強化学習フレームワークを提案する。
我々は、ニューラルネットワークポリシーをトレーニングし、ボディレートと集団推力を指示し、高速な追尾と回避操作を可能にします。
その結果,速度に基づく政策は速度レベルベースラインよりも捕捉速度とピーク速度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:19:23 GMT)
SVGenius: Benchmarking LLMs in SVG Understanding, Editing and Generation [46.5] SVGeniusは3つのプログレッシブディメンション(理解、編集、生成)にわたる2,377のクエリからなる総合ベンチマークである。
SVGeniusは、システマティックな複雑性層を持つ24のアプリケーションドメインの実際のデータに基づいて、8つのタスクカテゴリと18のメトリクスでモデルを評価する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:58:57 GMT)
Self-Evolved Reward Learning for LLMs [45.7] RLHF(Reinforcement Learning from Human Feedback)は、言語モデルと人間の嗜好を整合させる重要な手法である。
本稿では、RMが反復的に自己改善するための追加のトレーニングデータを生成する新しいアプローチである自己進化リワード学習(SER:Self-Evolved Reward Learning)を提案する。
以上の結果から,人間による注釈付きデータであっても,自己フィードバックから学習することで,RM性能が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:43:45 GMT)
GPR: Empowering Generation with Graph-Pretrained Retriever [45.6] GPRは知識グラフ上で事前訓練されたグラフベースのレトリバーである。
LLM-guided graph augmentationにより、自然言語問題と関連する部分グラフを一致させる。
微粒な検索戦略を学習するために構造認識の目的を用いる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:07:40 GMT)
A Controllable Examination for Long-Context Language Models [45.5] 本研究は、長文言語モデルを評価するための新しいベンチマークである$textbfLongBioBenchを紹介する。
その結果,ほとんどのモデルでは意味的理解や基礎的推論が不足していることが明らかとなった。
LongBioBenchは、真の言語タスクのミラーリングと制御性維持のトレードオフを向上する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:23:06 GMT)
VRAG-RL: Empower Vision-Perception-Based RAG for Visually Rich Information Understanding via Iterative Reasoning with Reinforcement Learning [45.4] 視覚的に豊かな情報にまたがる複雑な推論に適した新しいRLフレームワークであるVRAG-RLを紹介する。
このフレームワークにより、VLMは検索エンジンと相互作用し、シングルターンまたはマルチターン推論軌道を自律的にサンプリングする。
我々のアプローチは、RAGドメインにおけるRLの重要な制限を強調します。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:28:55 GMT)
SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference [45.1] 視覚言語モデル (VLM) では、視覚トークンはテキストトークンと比較して情報量が多すぎるにもかかわらず、計算オーバーヘッドがかなり大きい。
本稿では、余分なパラメータや微調整コストを不要とするSparseVLMと呼ばれるテキスト誘導型トレーニングフリートークン最適化機構を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:12:10 GMT)
HATA: Trainable and Hardware-Efficient Hash-Aware Top-k Attention for Scalable Large Model Inference [45.1] HATA(Hash-Aware Top-$k$ Attention)は、低オーバーヘッドの学習とハッシュのテクニックをTop-$k$のアテンションプロセスに統合する、新しいアプローチである。
大規模な実験により、HATAはバニラのフルアテンションに比べて最大7.2$times$スピードアップに達することが示されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:53:32 GMT)
Towards Efficient Online Tuning of VLM Agents via Counterfactual Soft Reinforcement Learning [45.1] 本稿では,VLMエージェントのテキスト出力空間に適したオンラインファインチューニング手法であるCoSoを提案する。
CoSoはアクションクリティカルトークンの探索を優先し、セマンティックな冗長性や低インパクトトークンの影響を減らす。
弊社の結果は、Androidデバイスコントロール、カードゲーム、エンボディAIなど、さまざまなエージェントタスクにまたがって、探索効率を高め、一貫したパフォーマンス向上を実現するという、目覚ましい能力を強調しています。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:14:42 GMT)
NCoder -- A Quantum Field Theory approach to encoding data [45.0] 我々は、量子場理論(QFT)にインスパイアされたAIの解釈に新しいアプローチを提案し、これをNCoderと呼ぶ。
NCoderは、潜伏層が$n$-point相関関数のサブセットとして指定された修正されたオートエンコーダニューラルネットワークである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:08:55 GMT)
Effective (Floquet) Lindblad generators from spectral unwinding [45.0] Floquet理論はリンドブラッド形式の有効生成器の探索を著しく促進できることを示す。
この結果は, 複雑な多体系におけるFloquet Lindbladiansの工学的応用に関係している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:00:41 GMT)
Cell-o1: Training LLMs to Solve Single-Cell Reasoning Puzzles with Reinforcement Learning [44.9] 我々はCellPuzzlesタスクを導入し、その目的はセルのバッチにユニークなセルタイプを割り当てることである。
このベンチマークは、様々な組織、疾患、ドナーの状態にまたがっており、ラベルの独特性を保証するために、バッチレベルの細胞コンテキストをまたいで推論する必要がある。
蒸留液の微調整を施した7B LLMのCell-o1を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:16:53 GMT)
CellFlux: Simulating Cellular Morphology Changes via Flow Matching [44.9] 本稿では,化学および遺伝的摂動による細胞形態変化をシミュレートする画像生成モデルであるCellFluxを紹介する。
CellFluxは生物学的に意味のある細胞画像を生成し、摂動特異的な形態変化を忠実に捉える。
これらの能力は、生体医学研究のための仮想細胞モデリングの実現に向けた重要な一歩である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:03:58 GMT)
Quartic quantum speedups for planted inference [44.8] そこで本研究では,植物ノイズの量子アルゴリズムについて述べる。
我々の研究は、いくつかの構造は超4次量子攻撃の影響を受けやすいことを示唆している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:46:41 GMT)
Efficient and Universal Neural-Network Decoder for Stabilizer-Based Quantum Error Correction [44.7] GraphQECは、線形時間複雑性を持つ安定化器コードのグラフ構造を機械学習に活用した、コードに依存しないデコーダである。
我々の手法は、任意の安定化符号をまたいだリアルタイム量子誤り訂正のための最初の普遍解である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:58:23 GMT)
LLM-Driven Instance-Specific Heuristic Generation and Selection [44.6] 本稿では,インスタンス固有のパーティション生成の概念を導入する新しいフレームワークであるInstSpecHを提案する。
InstSpecHHは、インスタンス機能に基づいて、全体的な問題クラスをサブクラスに到達し、各問題サブクラスに対して差別化された自動設計を実行する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:22:26 GMT)
Threading the Needle: Reweaving Chain-of-Thought Reasoning to Explain Human Label Variation [44.3] 大規模言語モデル(LLM)は最終答を出す前に思考の連鎖(CoT)を生成する。
本稿では,各回答オプションに対するサポート文と反対文を抽出するために,言語的に接頭した談話セグメンタを付加した新しいパイプラインを提案する。
また、正確なスコアよりも回答のランクを優先するランクベースHLV評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:45:05 GMT)
Learning Optical Flow Field via Neural Ordinary Differential Equation [44.2] 近年の光学フロー推定では、ニューラルネットワークを用いて、ある画像の位置を他方の位置にマッピングする流れ場を予測している。
連続モデル,すなわちニューラル常微分方程式(ODE)を用いて流れの微分を予測する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:30:14 GMT)
DFBench: Benchmarking Deepfake Image Detection Capability of Large Multimodal Models [43.9] 現在のディープフェイク検出方法は、生成モデルやコンテンツの多様性に制限のあるデータセットに依存することが多い。
textbfDFBenchは大規模なDeepFakeベンチマークで、リアル、AI編集、AI生成コンテンツにわたって54万のイメージが提供されている。
我々は,複数のLMMから合成された確率戦略を利用して,ディープフェイク検出のための混合エージェントであるtextbfMoA-DFを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:45:41 GMT)
FinChain: A Symbolic Benchmark for Verifiable Chain-of-Thought Financial Reasoning [43.7] FinChainは、検証可能なChain-of-Thought(CoT)金融推論のための最初のシンボリックベンチマークである。
FinChainはトピック毎に5つのパラメータ化されたテンプレートを提供する。
データセット上で30 LLMをベンチマークすると、最先端モデルでさえ改善の余地がかなりあることが分かります。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:44:42 GMT)
FlowerTune: A Cross-Domain Benchmark for Federated Fine-Tuning of Large Language Models [43.6] 大規模言語モデル(LLM)は様々な領域で最先端の成果を上げてきたが、その開発は大量の公開データに依存している。
この研究は、現実世界のアプリケーションのためのプライバシ保護、ドメイン特化LDMの開発の基礎を築いた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:54:12 GMT)
Improving Multilingual Speech Models on ML-SUPERB 2.0: Fine-tuning with Data Augmentation and LID-Aware CTC [43.3] 本稿では,ML-SUPERB 2.0 上での多言語 LID と ASR を強化し,SFM 適応のための複数の戦略を探求する。
我々は、数ショット設定におけるパフォーマンスギャップを軽減するためにデータ拡張を採用し、正規化のためのLID接続性時間分類損失を導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:19:07 GMT)
S4-Driver: Scalable Self-Supervised Driving Multimodal Large Language Modelwith Spatio-Temporal Visual Representation [43.2] 本研究では,Pa時間視覚表現を用いたスケーラブルな自己教師型動作計画アルゴリズムであるS4-Driverを提案する。
S4-Driverは、MLLMの強力な視覚表現を視点から3D空間へシームレスに変換するために、新しいスパースボリューム戦略を使用する。
その結果、S4-Driverは、既存のマルチタスクアプローチに対して、人間のアノテーションを必要とせず、好意的に機能することがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:03:22 GMT)
LSRP: A Leader-Subordinate Retrieval Framework for Privacy-Preserving Cloud-Device Collaboration [43.1] クラウドとデバイス間のコラボレーションは、公開ユーザクエリの処理にオンプレミスのLarge Language Models(LLM)、プライベートユーザデータの処理にSLM(On-device Small Language Models)を活用する。
既存のアプローチは、クラウド上のLLMのスケーラブルな問題解決能力を十分に活用できないことが多い。
プライバシ保護型クラウドデバイスコラボレーション(LSRP)のためのリーダ・サブオーディネート検索フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:55:09 GMT)
Learning to Specialize: Joint Gating-Expert Training for Adaptive MoEs in Decentralized Settings [42.0] Mixture-of-Experts (MoEs)は、コンポーネントのサブセットを動的に活性化することでスケーラビリティを実現する。
推論コストとデータヘテロジニティにより、ゲーティング関数と専門家の協調トレーニングがドメイン固有の専門知識を割り当てる方法について検討する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:07:58 GMT)
Universal Resources for QAOA and Quantum Annealing [41.9] 多層QAOA回路の角度は普遍的なQA軌道に収束する。
QAOA回路とQA経路の誤差は擬ボルツマン確率分布における熱励起として働く。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:00:00 GMT)
State Similarity in Modular Superconducting Quantum Processors with Classical Communications [41.9] モジュールアーキテクチャに適したクロスプラットフォーム忠実度推定アルゴリズムを提案する。
我々は、最大6キュービットのモジュラー超伝導量子プロセッサ上で、このプロトコルを実験的に実装し、2つの11キュービットGHZ状態の類似性を検証した。
概念実証として、6つの3キュービットモジュールを用いた5キュービット量子位相学習タスクに適用し、たった8つのトレーニングサンプルで位相情報を抽出することに成功した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:00:48 GMT)
METok: Multi-Stage Event-based Token Compression for Efficient Long Video Understanding [41.6] トレーニング不要なマルチステージイベントベースのToken圧縮フレームワークであるMETokを提案する。
我々はMETokが情報的視覚トークンを動的に選択することで効率と精度の最適なトレードオフを実現することを示す。
例えば、LongVA-7BをMETokに装備すると、80.6%のFLOPが削減され、93.5%のKVキャッシュメモリが節約される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:19:41 GMT)
FAuNO: Semi-Asynchronous Federated Reinforcement Learning Framework for Task Offloading in Edge Systems [41.4] textbfFAuNO -- emphFederated Asynchronous Network Orchestrator -- エッジシステムの分散タスクオフロードのためのバッファリングされた非同期の強化学習フレームワーク。
emphPeersimGym環境での実験では、FAuNOはタスクの損失と遅延を減らすために、フェデレーションされたマルチエージェントRLベースラインと一貫して一致または超えている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:15:03 GMT)
Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking [41.3] CoT(Chain-of-Thought)は、幅広いタスクにわたる大規模言語モデル(LLM)の性能を大幅に向上させる。
Transformer+CoTが学習できるアルゴリズムの機械的理解は限られている。
我々はTransformer+CoTとその変種の状態追跡機能の評価を行い,CoTの有効性を確認した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:48:30 GMT)
Datasheets Aren't Enough: DataRubrics for Automated Quality Metrics and Accountability [41.2] 本稿では,データセットレビュープロセスに,体系的な記述型評価指標を組み込むことを提唱する。
我々は、人間とモデル生成データセットの品質を評価するための構造化フレームワークであるDataRubricsを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:18:39 GMT)
Go Beyond Earth: Understanding Human Actions and Scenes in Microgravity Environments [40.7] MicroG-4Mは微小重力下での人間の活動のセマンティック理解のための最初のベンチマークである。
データセットには、50のアクションを含む4,759のクリップ、1,238のコンテキスト豊富なキャプション、そして7000以上の質問対の宇宙飛行士の活動とシーン理解が含まれている。
MicroG-4Mは、細粒度多ラベルアクション認識、時間的ビデオキャプション、視覚的質問応答の3つのコアタスクをサポートする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:15:19 GMT)
UltraWiki: Ultra-fine-grained Entity Set Expansion with Negative Seed Entities [40.7] 入力に負のシードエンティティを導入し、正のシードエンティティを持つ超微粒なセマンティッククラスを共同で記述する。
負の種実体は、正の属性と負の属性の対比を提供することによって意味的曖昧さを排除している。
また,モデルによる超きめ細かな実体の意味の理解を強化するための2つの戦略を考案した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:11:29 GMT)
FocalPO: Enhancing Preference Optimizing by Focusing on Correct Preference Rankings [40.6] 我々は、モデルがすでに正しくランク付けできるようなペアの理解を高めることを優先するDPO変種であるFocalPOを紹介した。
視覚タスクで使用されるFocal LossにインスパイアされたFocalPOは、動的にDPO損失をスケールするために変調係数を追加することでこれを達成している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:23:27 GMT)
Likelihood-Scheduled Score-Based Generative Modeling for Fully 3D PET Image Reconstruction [40.3] 提案手法は, 再現を加速し, 臨界ハイパーパラメータの数を減少させる3次元再構成の実践的手法である。
本手法は既存のSGMによるPET再構成のNAMSEとSSIMに適合または改善可能であることを示す。
実3D PETデータ,具体的には[18$F]DPA-714データに対するSGMベースの再構成の初回実装を実演する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:27:52 GMT)
Unveiling Privacy Risks in LLM Agent Memory [40.3] 大規模言語モデル(LLM)エージェントは、様々な現実世界のアプリケーションでますます普及している。
デモのためにメモリモジュールにプライベートユーザエージェントインタラクションを格納することで、意思決定を強化する。
本稿では,メモリからプライベート情報を抽出するメモリ・エクストルーアクション・アタック(MEXTRA)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:08:56 GMT)
Tru-POMDP: Task Planning Under Uncertainty via Tree of Hypotheses and Open-Ended POMDPs [40.3] Tru-POMDPは、Large Language Models (LLMs) を用いた構造化信念生成と原則付きPOMDP計画を組み合わせたプランナーである。
Tru-POMDP は最先端の LLM-based と LLM-tree-search のハイブリッドプランナーよりも優れていた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:26:08 GMT)
Emergent Abilities of Large Language Models under Continued Pretraining for Language Adaptation [40.0] 我々は、英語を含むと、検証の難易度には影響しないが、ターゲット言語における下流能力の出現には重要であることを示した。
本稿では,英語の必要性を緩和するための効果的な代替手段として,カリキュラム学習と指数移動平均(EMA)を導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:17:34 GMT)
Co-Evidential Fusion with Information Volume for Medical Image Segmentation [39.9] 本稿では, 一般化された顕在的深層学習を用いた, 新規なプラチスティック・コエビデンシャル融合戦略を提案する。
第2に、構築された証拠を評価するために、質量関数の情報量(IVUM)の概念を導入する。
4つのデータセットの実験により,本手法の競合性能が示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:13:19 GMT)
UGPhysics: A Comprehensive Benchmark for Undergraduate Physics Reasoning with Large Language Models [39.9] 大規模言語モデル(LLM)は、複雑な推論タスクを解く際、顕著な能力を示した。
物理学の推論の領域は、非常に少ない注意を払われたユニークな課題を提示する。
既存のベンチマークは、学部レベルの物理学の広さと深さでLLMの能力を評価するのに不足することが多い。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:13:03 GMT)
Learning on Model Weights using Tree Experts [39.9] モデルの重みから直接、欠落したドキュメントを推測するために機械学習モデルを訓練することは難しい。
ほとんどの公開モデルは、モデルツリーの小さなセットに属します。
Probing Experts (ProbeX) は理論的に動機づけられた軽量な手法で、単一のモデル層の重みから学習する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:42:42 GMT)
TestDG: Test-time Domain Generalization for Continual Test-time Adaptation [39.8] 本稿では,連続的なテスト時間適応(CTTA)について検討する。
我々はCTTAのための新しいオンラインテスト時間領域一般化フレームワークTestDGを提案する。
TestDGは、テスト中の現在のテストドメインと以前のテストドメインの両方に不変な機能を学び、将来のドメインへの効果的な一般化の可能性を改善することを目的としている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:37:22 GMT)
CamCloneMaster: Enabling Reference-based Camera Control for Video Generation [39.7] CamCloneMasterは、カメラパラメータやテストタイムの微調整を必要とせずに、リファレンスビデオからカメラの動きを再現できるフレームワークである。
本稿では,カメラクローン学習のための大規模合成データセットについて述べる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:59:02 GMT)
Reclaiming "Open AI" -- AI Model Serving Can Be Open Access, Yet Monetizable and Loyal [39.6] AIの急速な台頭は、オープンウェイトディストリビューションと不透明なAPIベースのアプローチの間で機能する分割モデルとなっている。
このポジションペーパーでは、AIモデルサービスのためのオープンアクセス、マネタイザブル、ロヤル(OML)パラダイムを導入し、厳格に定式化し、推進する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:28:46 GMT)
StimuVAR: Spatiotemporal Stimuli-aware Video Affective Reasoning with Multimodal Large Language Models [39.6] Video Affective Reasoning (またはVideo Affective Reasoning)は、ビデオが人間にどのように感じられるかを予測するためのフレームワークである。
多言語モデル(LMLM)を用いたビデオ影響推論(またはビデオ影響推論)のためのStimuli-MLを提案する。
Stimuli-MLは、映像に対する視聴者の感情反応を理解し、一貫性と洞察に富んだ説明を提供する上で、既存のMLLMよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:39:27 GMT)
Sociodynamics-inspired Adaptive Coalition and Client Selection in Federated Learning [39.6] 本稿では,時間的ソーシャルネットワーク上での意見ダイナミクスに着想を得た分散推論アルゴリズムであるショートネーム(Federated Coalition Variance Reduction with Boltzmann Exploration)を紹介する。
実験により、不均一なシナリオでは、我々のアルゴリズムは既存のFLアルゴリズムより優れており、より正確な結果とより高速な収束が得られることが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:04:31 GMT)
Surfer-H Meets Holo1: Cost-Efficient Web Agent Powered by Open Weights [39.2] Surfer-Hは、Vision-Language Models (VLM)を統合してWeb上でユーザ定義タスクを実行するコスト効率のよいWebエージェントである。
私たちは、Webナビゲーションと情報抽出に特化した、新しいオープンウェイトなVLMコレクションであるHolo1と組み合わせました。
Holo1を使用すると、Surfer-HはWebVoyagerで92.2%の最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:29:03 GMT)
Literary Evidence Retrieval via Long-Context Language Models [39.2] 現代長文言語モデルは、文学的フィクションをどの程度理解しているか?
一次資料の全文をLCMに提供し,その著作からの引用を欠いた文芸的批判を伴って評価するベンチマークを構築した。
この設定は、グローバルな物語推論と密接なテキスト検定の両方を行うモデルを必要とすることによって、文学的分析の人間の過程を反映している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:19:45 GMT)
Concept Corrector: Erase concepts on the fly for text-to-image diffusion models [39.0] 概念消去は、モデルが生成できる望ましくない概念を消去することを目的としている。
本研究では,特定のタイミングで予測される最終生成画像から得られる視覚的特徴に基づいて,対象概念をチェックする概念コレクタを提案する。
パイプライン全体において、我々の手法はモデルパラメータを変更せず、特定のターゲット概念とそれに対応する代替コンテンツのみを必要とする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:19:08 GMT)
Simulation-Based Inference for Adaptive Experiments [38.8] マルチアームバンディットの実験的な設計は、標準的なランダム化試験よりもますます採用されている。
そこで本研究では,腕特定手段の仮説テストと信頼区間構築のためのシミュレーションに基づくアプローチを提案する。
以上の結果から,提案手法は,設計対象でない腕の大幅な改善を図りながら,信頼性区間幅を最大50%削減し,所望のカバレッジを達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:46:59 GMT)
Towards Geometry Problem Solving in the Large Model Era: A Survey [38.7] 幾何学的問題解決(GPS)は人工知能における重要なフロンティアである。
GPSは、空間的理解と厳密な論理的推論の二重要求のため、依然として困難である。
このサーベイは3つのコア次元を通してGPSの進歩を体系的に合成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:42:49 GMT)
Collision- and Reachability-Aware Multi-Robot Control with Grounded LLM Planners [38.4] 大型言語モデル (LLM) は様々なロボット制御タスクにおいて高い性能を示した。
しかし、現実世界のアプリケーションへの展開は依然として制約がある。
我々は、強化学習と検証可能な報酬を統合する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:33:56 GMT)
Towards the Worst-case Robustness of Large Language Models [38.3] 近年の研究では、敵対的攻撃に対する大きな言語モデルの脆弱性が明らかにされており、敵は有害、暴力、私的、不正なアウトプットを誘導するために特定の入力シーケンスを使用する。
この研究では、最悪の場合のロバスト性、すなわち、そのような望ましくない出力をもたらす逆例が存在するかどうかを調査する。
より強力なホワイトボックス攻撃で最悪の場合のロバスト性を上限にし、現在の決定論的防御のほとんどが、最悪の場合のロバストネスを0%近く達成していることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:06:53 GMT)
Prompt-Unseen-Emotion: Zero-shot Expressive Speech Synthesis with Prompt-LLM Contextual Knowledge for Mixed Emotions [38.1] 本稿では,感情誘導型プロンプト学習による未知の感情音声を生成するための,新しいプロンプト・アンザイム・感情(PUE)アプローチを提案する。
提案したPUEは、ゼロショット設定における未知の感情の表現的音声合成に成功している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:59:22 GMT)
The Invisible Hand: Unveiling Provider Bias in Large Language Models for Code Generation [37.7] 大規模言語モデル(LLM)が新しいレコメンデーションエンジンとして登場した。
明示的な指示がなければ、これらのモデルが推奨する特定のプロバイダからのサービスに対して、体系的な嗜好を示すことが示される。
LLMコード生成におけるプロバイダバイアスの総合的研究は,7つの最先端LCMに対して行われた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:58:57 GMT)
InterRVOS: Interaction-aware Referring Video Object Segmentation [37.5] ビデオオブジェクトのセグメンテーションの参照は、与えられた自然言語表現に対応するビデオ内のオブジェクトをセグメンテーションすることを目的としている。
包括的なビデオ理解では、オブジェクトの役割は、他のエンティティとの相互作用によって定義されることが多い。
本稿では,インタラクションに関わるアクターとターゲットエンティティのセグメンテーションを必要とする新しいタスクであるInterRVOSを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:16:13 GMT)
Floquet-Engineered Fast SNAP gates in weakly coupled cQED systems [37.4] 本稿では,標準実装よりも桁違いに高速な高忠実なSNAPゲートを実現するプロトコルを提案する。
また、ゲート加速度と関連する良性駆動誘起デコヒーレンスの両方を説明する統一理論を提案する。
これらの結果は, 弱結合型高コヒーレンスキャビティの選択的制御により, 高忠実度, 高コヒーレンスキャビティの実験的実現の道を開くものである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:18:43 GMT)
Modelship Attribution: Tracing Multi-Stage Manipulations Across Generative Models [37.4] The Modelship Attribution”は、編集の順序を再現し、関連する生成モデルを特定することによって、編集された画像の進化を辿ることを目的としている。
複雑な多段階操作における様々なモデルの寄与を効果的に認識し、属性付けするためのフレームワークであるMAT(Modelship Attribution Transformer)を導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:45:09 GMT)
We Should Chart an Atlas of All the World's Models [37.2] 我々は、モデルアトラスと呼ばれる統一された構造で世界のモデル人口をチャート化することを提唱する。
Model Atlasは、モデル法医学、メタML研究、モデル発見の応用を可能にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:28:07 GMT)
Enumerate-Conjecture-Prove: Formally Solving Answer-Construction Problems in Math Competitions [37.1] 本稿では,パターン駆動型推論と形式的定理証明を統合するモジュール型ニューロシンボリック手法であるLLMe-Conjecture-Prove(ECP)フレームワークを紹介する。
本稿では,様々な数学コンペティションにおける3,431の解題問題のデータセットであるConstructiveBenchを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:40:51 GMT)
LLMs Can Also Do Well! Breaking Barriers in Semantic Role Labeling via Large Language Models [36.9] ジェネレーティブデコーダベースの大規模言語モデル(LLM)は、様々なNLPタスクで顕著な成功を収めている。
しかし、彼らはセマンティックロールラベリング(SRL)における最先端エンコーダデコーダ(BERTライク)モデルに遅れを取っている。
本研究では, (a) 検索拡張生成と (b) 自己補正という2つのメカニズムで, SRL 用 LLM を組み込むことにより, このギャップを埋めることを模索する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:55:57 GMT)
Rewarding the Unlikely: Lifting GRPO Beyond Distribution Sharpening [36.8] 我々は、稀な正解の強化を明示的に促す単純な方法である異例の報酬を導入する。
実験により、不規則な報酬を組み込むことで、Nの広い範囲にわたるpass@$N$が大幅に改善されることが確認された。
改訂されたレシピをLeanに適用し、MiniF2F-testベンチマークでDeepSeek-Prover-V1.5-RLと競合するパフォーマンスを実現しました。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:15:15 GMT)
Diving into Self-Evolving Training for Multimodal Reasoning [36.7] 自己進化的トレインは複雑な推論タスクの鍵となるアプローチとして登場した。
本稿では,強化学習のレンズによるマルチモーダル推論のための自己進化学習を再構成する。
M-STARは、様々なサイズと多様なベンチマークのモデル間で一貫したパフォーマンス向上を実現するフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:07:50 GMT)
RATE-Nav: Region-Aware Termination Enhancement for Zero-shot Object Navigation with Vision-Language Models [36.4] 批判的だが調査の不十分な方向は、これらの課題を克服するための探索の時間的な終了である。
RATE-Nav, Region-Aware Termination-Enhanced Methodを提案する。
幾何予測領域分割アルゴリズムと探索率計算のための領域ベース探索推定アルゴリズムを含む。
67.8%の成功率、31.3%のSPLをHM3Dデータセットで達成している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:15:00 GMT)
Optimization of Epsilon-Greedy Exploration [36.0] その結果,バッチサイズの変化が最適な探索戦略に大きく影響していることが判明した。
提案手法は,特定の問題設定に対する探索を自動調整し,各設定に最適なマッチングや性能を連続的に達成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:14:53 GMT)
Learning Binarized Representations with Pseudo-positive Sample Enhancement for Efficient Graph Collaborative Filtering [35.8] 効率的な協調フィルタリングのためのグラフ表現バイナライゼーションの問題について検討する。
その結果, バイナライゼーションの様々な段階における情報損失の低減は, 性能に有意な影響を及ぼすことが示唆された。
前者のBiGeaRと比較して、BiGeaR++は微細な推論蒸留機構と効果的な埋め込みサンプル合成手法を導入している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:11:43 GMT)
Beyond the Surface: Measuring Self-Preference in LLM Judgments [35.7] 大規模言語モデル(LLM)は、裁判官として機能する際の自己選好バイアスを示す。
既存の方法は、審査員モデルが割り当てるスコアと、他のモデルからのレスポンスに割り当てるスコアの差を計算することで、このバイアスを測定するのが一般的である。
そこで本研究では,自己選好バイアス(自己選好バイアス)を測定するDBGスコアを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:12:47 GMT)
OralBBNet: Spatially Guided Dental Segmentation of Panoramic X-Rays with Bounding Box Priors [34.8] OralBBNetは、歯の分類とパノラマX線におけるセグメンテーションの精度と堅牢性を改善するように設計されている。
本手法は, 従来の方法と比較して, 平均平均精度 (mAP) が1~3%向上した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:24:11 GMT)
The Tug of War Within: Mitigating the Fairness-Privacy Conflicts in Large Language Models [34.7] 我々は,textbfSuppress the textbfPrivacy and fatextbfIrness coupled textbfNeurons (textbfSPIN) を理論的かつ経験的に,公正性とプライバシ意識の相互情報を減少させる訓練自由手法を提案する。
広汎な実験結果から,SPINはトレードオフ現象を排除し,LLMの公平性とプライバシ意識を両立させると同時に,汎用性を損なうことなく大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:50:57 GMT)
Multi Layered Autonomy and AI Ecologies in Robotic Art Installations [34.5] Baoyang Chen氏のSymbosis of Agentsは、AI駆動ロボットを没入型ミラーラインアリーナに埋め込んだ大規模なインストレーションだ。
3階層の信仰システムは、マイクロレベルの適応戦術、メソレベルの物語ドライブ、マクロレベルのプライムディレクティブといったエコロジーを操縦する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:28:19 GMT)
LayoutRAG: Retrieval-Augmented Model for Content-agnostic Conditional Layout Generation [34.4] 制御可能なレイアウト生成は、グラフィックデザイン内で要素境界ボックスの可視的な配置を作成することを目的としている。
本稿では,条件と参照誘導生成によるレイアウト生成を提案する。
提案手法は,与えられた条件を満たし,既存の最先端モデルより優れた高品質なレイアウトを生成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:47:03 GMT)
Dynamic-I2V: Exploring Image-to-Video Generation Models via Multimodal LLM [34.2] 拡散トランスフォーマー(DiT)アーキテクチャの視覚的条件とテキスト的条件を協調的に符号化するために,MLLM(Multimodal Large Language Models)を統合する革新的なフレームワークであるDynamic-I2Vを提案する。
画像とビデオの生成において、Dynamic-I2Vは最先端のパフォーマンスを実現しており、特に42.5%、7.9%、11.8%のダイナミックレンジ、制御性、品質が大幅に向上している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:32:50 GMT)
FroM: Frobenius Norm-Based Data-Free Adaptive Model Merging [34.2] 本稿では,RegMean法の改良について紹介する。この手法は学習データを間接的に利用して,統合前後の線形層の出力を近似する。
そこで本研究では,Frobeniusノルムを用いてモデルパラメータを直接計測するFroMという適応的なマージ手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:50:09 GMT)
Nonconvex Linear System Identification with Minimal State Representation [34.2] 低次線形系IDent (SysID) は、最小状態の観測値を持つ有限個の入力から線形力学系のパラメータを推定する問題に対処する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:12:37 GMT)
SingaKids: A Multilingual Multimodal Dialogic Tutor for Language Learning [33.9] 画像記述タスクによる言語学習を支援するための対話型チューターであるSingaKidsを紹介する。
本システムでは, 画像キャプション, 多言語対話, 音声理解, 係り受け音声生成を統合し, 没入型学習環境を構築する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:56:45 GMT)
Co-Evolving LLM Coder and Unit Tester via Reinforcement Learning [33.7] 本稿では,専用の報酬設計を備えた新しい強化学習フレームワークCUREを提案する。
CUREは、その相互作用の結果に基づいて、コーディングと単体テスト生成機能を共進化させる。
我々のモデルは,ベースモデルに基づく強化学習に有効な報奨モデルとして機能することを発見した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:58:42 GMT)
ORV: 4D Occupancy-centric Robot Video Generation [33.4] 遠隔操作を通じて現実世界のロボットシミュレーションデータを取得することは、時間と労力のかかることで有名だ。
ORVは,4次元のセマンティック・コンカレンシー・シーケンスをきめ細かな表現として利用した,作業中心のロボットビデオ生成フレームワークである。
ORVは、占有率に基づく表現を活用することにより、時間的一貫性と正確な制御性を確保しつつ、シミュレーションデータをフォトリアリスティックなロボットビデオにシームレスに変換することができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:00:32 GMT)
LayerIF: Estimating Layer Quality for Large Language Models using Influence Functions [33.2] 事前訓練された大規模言語モデル(LLM)は、幅広いタスクで高いパフォーマンスを達成する。
LLMは、特定の下流アプリケーションに対して、様々なレイヤのトレーニング品質にかなりのばらつきを示す。
本稿では,各レイヤのトレーニング品質を,原則的かつタスクに敏感な方法で定量化するLayerIFを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:18:10 GMT)
Exceeding the Parametric Drive Strength Threshold in Nonlinear Circuits [33.2] 超伝導量子回路は、高速ゲート、高忠実な読み出し、状態安定化を実装するために強い駆動に依存している。
非線形カプラは、強いパラメトリック駆動下でイオン化され、コヒーレント制御が崩壊することを示す。
この洞察はパラメトリック制御の基本的制約を確立し、次世代量子プロセッサにおける駆動誘起デコヒーレンスを緩和するための設計原則を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:39:10 GMT)
Context as Memory: Scene-Consistent Interactive Long Video Generation with Memory Retrieval [33.2] 歴史的文脈をメモリとして利用して映像生成を行うコンテキスト・アズ・メモリを提案する。
歴史的文脈を全て組み込むという膨大な計算オーバーヘッドを考慮すると、メモリ検索モジュールを提案する。
実験により, コンテキスト・アズ・メモリは, SOTAと比較して, 対話型長ビデオ生成において優れたメモリ能力を実現することが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:59:05 GMT)
Value-Spectrum: Quantifying Preferences of Vision-Language Models via Value Decomposition in Social Media Contexts [33.1] 本稿では、視覚言語モデル(VLM)の評価を目的とした、新しい視覚質問回答(VQA)ベンチマークであるValue-Spectrumを紹介する。
我々は、ビデオブラウジングをシミュレートするVLMエージェントパイプラインを設計し、TikTok、YouTube Shorts、Instagram Reelsの5万本以上のショートビデオからなるベクトルデータベースを構築した。
これらのビデオは数ヶ月に渡り、家族、健康、趣味、社会、テクノロジーなどさまざまなトピックをカバーしている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:05:41 GMT)
Demystifying Reasoning Dynamics with Mutual Information: Thinking Tokens are Information Peaks in LLM Reasoning [33.0] 大規模推論モデル(LRM)は複雑な問題解決において顕著な能力を示したが、その内部の推論機構はよく理解されていない。
特定の生成段階におけるMIは, LRMの推論過程において, 突然, 顕著な増加を示す。
次に、これらのシンキングトークンがLRMの推論性能に不可欠であるのに対して、他のトークンは最小限の影響しか与えないことを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:31:10 GMT)
OThink-R1: Intrinsic Fast/Slow Thinking Mode Switching for Over-Reasoning Mitigation [33.0] OThink-R1は論理的妥当性を保ちながら冗長な推論ステップを誘発する手法である。
OThink-R1は、数学的および質問応答タスクにわたる実験により、推論の冗長性を平均で約23%削減することを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:31:30 GMT)
Scaling Physical Reasoning with the PHYSICS Dataset [33.0] PHYSICSは、被験者と難易度にまたがる16,568の高品質な物理問題を含むデータセットである。
力学、電磁気学、熱力学、光学、現代物理学の5つの分野を網羅している。
また、高校から大学院レベルの物理学コースまで幅広い難易度がある。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:33:30 GMT)
ReFoRCE: A Text-to-SQL Agent with Self-Refinement, Consensus Enforcement, and Column Exploration [32.8] ReFoRCEは、スパイダー2.0のリーダーボードのトップのテキスト・トゥ・信頼のエージェントです。
ReFoRCEは35.83のスパイダー2.0-Snowと36.56のスコアで最先端の結果を得た。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:03:32 GMT)
SENMAP: Multi-objective data-flow mapping and synthesis for hybrid scalable neuromorphic systems [32.7] 本稿では、スケーラブルでエネルギー効率の良いニューロモルフィック・コンピューティング・アーキテクチャ・フレームワークのためのマッピングと合成ツールであるSENMapを紹介する。
SENMapは、アーキテクチャ、事前訓練されたSNNとANNの現実的な例、およびイベントレートベースのパラメータを考察し、SENSIMと共にオープンソースにして、製造前に柔軟なニューロモルフィックチップ設計を支援する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:21:25 GMT)
GL-LowPopArt: A Nearly Instance-Wise Minimax Estimator for Generalized Low-Rank Trace Regression [32.4] GL-LowPopArtは、一般化された低ランクトレース回帰のためのカソーニスタイルの新たな推定器である。
我々は、既存の保証を越えながら、最先端の予測誤差境界を確立する。
GL-LowPopArtに基づく探索-then-commitアルゴリズムの解析により,新たな,潜在的に興味深い問題依存量を明らかにした。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:52:24 GMT)
ViT-Split: Unleashing the Power of Vision Foundation Models via Efficient Splitting Heads [32.3] ビジョンファウンデーションモデル(VFM)は、幅広い下流タスクで顕著な性能を示した。
いくつかのVFMアダプタは、VFMの事前の知識を活用して有望な結果を示したが、これらの手法の2つの非効率性を同定した。
我々は、VFMの層を2つの異なる構成要素に分割できる、ViT-Splitと呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:34:17 GMT)
Enhancing LLM-Based Short Answer Grading with Retrieval-Augmented Generation [32.1] 大型言語モデル(LLM)は、言語タスクにおいて人間のような能力を持つ。
Retrieval-augmented Generation (RAG) は有望な解決策として現れる。
自動グレーティングのための適応的なRAGフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:02:48 GMT)
PointCloud-Text Matching: Benchmark Datasets and a Baseline [32.0] PointCloud-Text Matching (PTM)は、指定されたポイントクラウドクエリやテキストクエリにマッチする正確なクロスモーダルインスタンスを特定することを目的としている。
PTMは、屋内/都市キャニオンのローカライゼーションやシーン検索など、様々なシナリオに応用できる可能性がある。
我々は、新しいPTMベンチマークデータセット、すなわちSceneDepict-3D2Tを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:51:10 GMT)
Multipassage Landau-Zener tunneling oscillations in transverse/longitudinal dual dressing of atomic qubits [31.9] XZオリジナル構成における非共振性原子量子ビットの時間発展について検討する。
実験はルビジウムとセシウム原子磁気センサで行われる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:10:00 GMT)
Generator-Assistant Stepwise Rollback Framework for Large Language Model Agent [31.8] 大規模言語モデル(LLM)エージェントは通常、ステップバイステップの推論フレームワークを採用し、与えられたタスクを達成するための思考と行動のプロセスをインターリーブする。
本稿では,ジェネレータ・アシスタント・ステップワイド・ロールバック(GA-Rollback)と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:18:14 GMT)
A LLM-Powered Automatic Grading Framework with Human-Level Guidelines Optimization [31.7] 学習分析(LA)の文脈において、学習者の反応をより深く把握するための強力なツールとして、オープン・エンド・ショート・アンサー・質問(SAG)が広く認識されている。
SAGは、高グレードの作業負荷と一貫性のない評価に関する懸念のために、実際に課題を提示することが多い。
本稿では,大規模言語モデル(LLM)をSAGのグレーダとして活用する統合型マルチエージェントASAGフレームワークであるGradeOptを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:08:46 GMT)
Semiconductor SEM Image Defect Classification Using Supervised and Semi-Supervised Learning with Vision Transformers [31.6] 本研究は, ウエハ欠陥の走査型電子顕微鏡(SEM)画像の自動欠陥分類(ADC)に視覚変換器(ViT)ニューラルネットワークを適用することを提案する。
7400枚以上の全画像から11種類の欠陥を抽出し,DinoV2と半教師付き学習の伝達学習の可能性を検討した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:34:54 GMT)
Decompose, Plan in Parallel, and Merge: A Novel Paradigm for Large Language Models based Planning with Multiple Constraints [31.6] 本稿では,並列計画パラダイムを提案し,並列におけるサブタスク計画とマージを最終計画(DPPM)に分割する。
具体的には、制約に基づいて複雑なタスクをサブタスクに分解し、各サブタスクのサブプランを並列に生成し、それらをグローバルプランにマージする。
実験の結果,DPPMは旅行計画タスクにおいて既存の手法よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:33:13 GMT)
LumosFlow: Motion-Guided Long Video Generation [31.6] エンターテイメントやシミュレーションなどの分野で広く利用されていることから、長いビデオ生成が注目を集めている。
我々は階層的な長いビデオ生成パイプラインを再考し、モーションガイダンスを明示的に導入するフレームワークであるLumosFlowを紹介した。
従来のビデオフレームと比較して、15倍の精度で、隣接するフレーム間の合理的かつ連続的な動きを保証します。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:25:00 GMT)
Computation- and Communication-Efficient Online FL for Resource-Constrained Aerial Vehicles [31.6] 本稿では,連続的な知覚データの利点を生かした,計算・通信効率の高いオンライン航空連合学習(2 CEOAFL)アルゴリズムを提案する。
提案した2 CEOAFLアルゴリズムは, 計算効率と通信効率に比較して, 非計算および非定量化性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:06:59 GMT)
d1: Scaling Reasoning in Diffusion Large Language Models via Reinforcement Learning [31.5] 最近の大規模言語モデル(LLM)は、オンライン強化学習(RL)の恩恵を受ける強力な推論能力を示している。
教師付きファインタニング(SFT)とRLの組み合わせにより,事前学習したマスク付きdLLMを推論モデルに適応するフレームワークであるd1を提案する。
d1は最高の性能を示し、最先端のdLLMの性能を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:02:25 GMT)
One Policy but Many Worlds: A Scalable Unified Policy for Versatile Humanoid Locomotion [31.5] 多様な地形をマスターする単一ポリシーを実現する統一的な枠組みを提案する。
オフラインデータ、拡散ベースの軌道、およびポリシー最適化を統合することで、DreamPolicyは"1つのタスク、1つのポリシー"ボトルネックを克服する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:10:46 GMT)
EDITOR: Effective and Interpretable Prompt Inversion for Text-to-Image Diffusion Models [31.3] 本稿では,テキストから画像への拡散モデルに対するsysと呼ばれるプロンプトインバージョン手法を提案する。
本手法は,画像の類似性,テキストのアライメント,解釈可能性,一般化可能性の観点から,既存の手法よりも優れる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:44:15 GMT)
Retrieval-Augmented Generation as Noisy In-Context Learning: A Unified Theory and Risk Bounds [31.3] In-context linear regression における RAG に対する最初の有限サンプル一般化法を提案する。
我々のフレームワークは、検索したテキストを、クエリ依存のノイズのあるインコンテキストの例と見なしている。
解析の結果, ICLとは対照的にRAG上に本態性天井が存在することが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:31:53 GMT)
Pi-SQL: Enhancing Text-to-SQL with Fine-Grained Guidance from Pivot Programming Languages [31.3] Pi-は、コードブロックやコメントの詳細なステップバイステップガイドラインを提供するPythonプログラムを生成する。
FinalsqlプログラムはリファレンスPythonプログラムのクエリ結果と一致し、異なる戦略によって生成される候補から選択することで、より優れた実行速度を達成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:29:05 GMT)
Channel-adaptive Cross-modal Generative Semantic Communication for Point Cloud Transmission [31.1] 我々は,GenSeC-PC と呼ばれる PC 伝送のためのクロスモーダル・ジェネリック・セマンティック・コミュニケーション (SemCom) を提案する。
GenSeC-PCは、画像と点雲を融合させるセマンティックエンコーダを使用し、画像は非送信側情報として機能する。
そこで我々は,ロバスト伝送とシステム複雑性の低減を図るために,合理化・非対称なチャネル適応型共同セマンティックチャネル符号化アーキテクチャを設計する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:14:58 GMT)
Superconducting integrated random access quantum memory [31.1] 本稿では,超電導ランダムアクセス量子メモリの新しいアーキテクチャをサイクリング記憶時間を用いて実験的に実現したことを報告する。
この装置は、メモリサイクル時間 1.51$mu s$ を示し、入力パルス形状の保存により57.5%の忠実性を達成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:52:13 GMT)
Targeted Forgetting of Image Subgroups in CLIP Models [30.8] CLIPのようなファンデーションモデル(FM)は、様々なタスクで印象的なゼロショット性能を示している。
彼らはしばしば、ノイズの多いインターネットソースのデータセットから有害または望ましくない知識を継承する。
既存のモデルアンラーニングメソッドは、事前訓練されたデータセットへのアクセスに依存するか、あるいは粗い粒度のアンラーニングにフォーカスする。
過剰な鍛造を省きながら、対象とする知識を徐々に解き放つ新しい3段階アプローチを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:50:03 GMT)
GaRA-SAM: Robustifying Segment Anything Model with Gated-Rank Adaptation [30.6] GaRA-SAMは、全ての堅牢なセグメンテーションベンチマークにおいて、以前の作業よりも大幅に優れていた。
これは以前の最高のIoUスコアを21.3%上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:47:59 GMT)
MemoryOut: Learning Principal Features via Multimodal Sparse Filtering Network for Semi-supervised Video Anomaly Detection [30.5] 再構成や予測に基づくビデオ異常検出(VAD)手法は2つの重要な課題に直面している。
強い一般化能力は、しばしば正確な再構築や異常事象の予測をもたらす。
低レベルの外観と動きの手がかりにのみ依存することは、複雑なシーンから異常な出来事における高レベルの意味を識別する能力を制限する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:14:57 GMT)
DAST: Difficulty-Adaptive Slow-Thinking for Large Reasoning Models [30.2] 本稿では,問題の難易度に基づいて,モデルが自律的にChain-of-Thought(CoT)の長さを調整できる,DAST(Difficulty-Adaptive Slow Thinking)を提案する。
多様なデータセットとモデルスケールの実験により、DASTは複雑な問題に対する推論精度を維持しながら、過剰思考を効果的に軽減することを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:32:15 GMT)
Evaluating and Advancing Multimodal Large Language Models in Perception Ability Lens [30.1] textbfAbilityLensはMLLMを6つの重要な知覚能力で評価する統合ベンチマークである。
我々は、現在のメインストリームMLLMの長所と短所を特定し、安定性パターンを強調し、最先端のオープンソースモデルとクローズドソースモデルの顕著なパフォーマンスギャップを明らかにする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:55:05 GMT)
Mitigating Non-IID Drift in Zeroth-Order Federated LLM Fine-Tuning with Transferable Sparsity [30.1] フェデレートラーニング(Federated Learning)は、分散化された非独立型クライアントと独立型分散型クライアント(Non-IID)をまたいだ、大規模言語モデル(LLM)の協調的な微調整を可能にする。
Meerkat は、フェデレート LLM ファインチューニング用に設計されたスパースゼロ階最適化 (ZO) 手法である。
Meerkatは優れた通信効率を実現し、コスト効率の高い高周波同期を実現する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:29:50 GMT)
From Prompts to Protection: Large Language Model-Enabled In-Context Learning for Smart Public Safety UAV [30.0] 大規模言語モデル(LLM)は、インコンテキスト学習(ICL)を通じて新しいタスクに適応することができる。
本稿では, LLM 対応 ICL と公共安全UAV を連携させて, 経路計画や速度制御などの重要な機能を実現することを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:01:33 GMT)
HGOT: Self-supervised Heterogeneous Graph Neural Network with Optimal Transport [29.7] 最適輸送法(HGOT)を用いた自己教師付き不均質グラフニューラルネットワークを提案する。
HGOTは、正と負のサンプルの厳密なサンプリングプロセスを緩和するために最適な輸送機構を用いる。
ノード分類タスクでは、HGOTは最先端の手法と比較して6%以上の精度の向上を実現している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:35:29 GMT)
A Hessian-Aware Stochastic Differential Equation for Modelling SGD [29.0] Hessian-Aware Modified Equation (HA-SME) は、対象関数のヘッセン情報をそのドリフト項と拡散項の両方に組み込む近似である。
軽度条件下では、HA-SMEは分布感覚におけるSGDのダイナミクスを正確に回復する最初のSDEモデルであることが証明された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:36:57 GMT)
Speaker Diarization with Overlapping Community Detection Using Graph Attention Networks and Label Propagation Algorithm [28.9] 提案フレームワークは,(1)隣接ノードからの情報を集約して話者埋め込みとノード接続を洗練するグラフアテンションネットワーク,(2)複数のコミュニティラベルを各ノードに割り当て,同時クラスタリングと重複するコミュニティ検出を可能にするラベル伝搬アルゴリズム,の2つの主要コンポーネントから構成される。
実験結果から,提案手法はダイアリゼーション誤り率 (DER) を著しく低減し,Diacle Voice Activity Detection (VAD) を伴わないDIHARD-IIIデータセット上で,最先端の15.94%のDERを実現し,また11.07%の精度でオラクルVADを付加した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:29:10 GMT)
Learning Pyramid-structured Long-range Dependencies for 3D Human Pose Estimation [28.9] 人間の構造における行動調整は、2次元関節の空間的制約が3次元ポーズを回復するのに不可欠である。
長距離の相互依存関係をキャプチャする新しいピラミッドグラフアテンション(PGA)モジュールを提案する。
また、軽量なマルチスケールトランスアーキテクチャである3次元ポーズ推定のためのピラミドグラフ変換器(PGFormer)を開発した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:21:37 GMT)
Enhancing Target-unspecific Tasks through a Features Matrix [28.8] 一般知識は、目標非特異なタスクを強く推進する。
そこで本稿では,対象非特定タスクにおける特徴行列(FM)モデルの拡張を目的とした新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:27:33 GMT)
SCOPE: Optimizing Key-Value Cache Compression in Long-context Generation [28.8] SCOPEは、プリフィルとデコードフェーズでKVキャッシュを最適化するフレームワークである。
メモリ使用量とメモリ転送は、適応的かつ不連続な戦略によってさらに最適化される。
LongGenBenchの実験はSCOPEの有効性と一般化を示している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:55:18 GMT)
Federated Linear Dueling Bandits [28.7] 我々は,オンライン勾配降下(OGD)とフェデレーション学習を組み合わせた,革新的で原則的な組み合わせを導入する。
FLDB-OGDはその累積的後悔のサブ線形上界を楽しみ、後悔とコミュニケーションの複雑さの間の理論的トレードオフを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:29:00 GMT)
MCU: An Evaluation Framework for Open-Ended Game Agents [28.4] Minecraft Universe (MCU) は、オープンソースのビデオゲームMinecraftの総合的な評価フレームワークである。
MCUは,(1)11つの主要なカテゴリを含む3,452個の構成可能な原子タスクと41の課題のサブカテゴリからなる拡張されたコレクション,(2)難易度に応じて無限に多様なタスクを生成可能なタスク構成機構,(3)オープンエンドタスクアセスメントのためのヒトのレーティングと91.5%のアライメントを達成する一般的な評価フレームワークである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:30:05 GMT)
VS-Bench: Evaluating VLMs for Strategic Reasoning and Decision-Making in Multi-Agent Environments [28.1] マルチエージェント環境での戦略的推論と意思決定のために視覚言語モデル(VLM)を評価するベンチマークであるVisual Strategic Bench(VS-Bench)を紹介する。
VS-Benchは、協調、競争、混合モチベーションにまたがる8つのヴィジュアルグラウンド環境で構成されている。
本稿では,次の行動予測精度による戦略的推論のオフライン評価と,正規化エピソードリターンによる意思決定のオンライン評価の2つの相補的評価次元について考察する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:57:38 GMT)
Evaluations at Work: Measuring the Capabilities of GenAI in Use [28.1] 現在のAIベンチマークは、人間とAIのコラボレーションの混乱したマルチターンの性質を見逃している。
実世界のタスクを相互依存サブタスクに分解する評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:02:50 GMT)
LLMs can Find Mathematical Reasoning Mistakes by Pedagogical Chain-of-Thought [28.1] PedCoT(Pedagogical Chain-of-Thought)は、推論ミスの識別のガイドとして設計されている。
PedCoTは、プロンプト(PPP)設計のための教育原則、2段階インタラクションプロセス(TIP)およびグラウンドドPedCoTプロンプトからなる。
提案手法は,信頼性の高い数学的誤り識別の目標を達成し,自動解答グレーディングの基盤を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:51:51 GMT)
Non-stationary Bandit Convex Optimization: A Comprehensive Study [28.1] Bandit Convex Optimizationは、シーケンシャルな意思決定問題のクラスである。
非定常環境でこの問題を研究する。
非定常性の標準的な3つの基準の下で、後悔を最小限に抑えることを目指しています。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:18:41 GMT)
LongMagpie: A Self-synthesis Method for Generating Large-scale Long-context Instructions [28.0] LongMagpieは大規模なロングコンテキスト命令データを自動的に生成するフレームワークである。
本稿では,LongMagpieが短文タスクにおける競合性能を維持しながら,長文タスクにおける先行的なパフォーマンスを実現することを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:04:17 GMT)
Ultracoherent superconducting cavity-based multiqudit platform with error-resilient control [28.0] 2セル楕円形SRF空洞を用いたマルチモード量子システムについて報告する。
設計最適化により,トランスモンデコヒーレンスによる有害な影響を軽減する。
これは、以前の3Dマルチモードメモリよりも桁違いに改善されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:18:46 GMT)
Lower Layers Matter: Alleviating Hallucination via Multi-Layer Fusion Contrastive Decoding with Truthfulness Refocused [27.9] 大規模言語モデル (LLM) は様々な自然言語処理タスクにおいて例外的な性能を示した。
彼らは時に「幻覚」と呼ばれる現象である不正確で反事実的な出力を発生させる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:05:19 GMT)
Eliminating Oversaturation and Artifacts of High Guidance Scales in Diffusion Models [27.6] CFG更新ルールを再検討し、この問題に対処するための修正を導入する。
過飽和を伴わない高品質な世代を実現するために並列成分の低重み付けを提案する。
また、この知見に基づいて、CFG更新ルールに対する新しい再スケーリングモーメント手法も導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:47:12 GMT)
VTGaussian-SLAM: RGBD SLAM for Large Scale Scenes with Splatting View-Tied 3D Gaussians [27.6] 最先端の手法では、シーンを表現するために3Dガウシアンを使用し、これらのガウシアンをスプラッティングでレンダリングすることで効率とレンダリングを向上する。
これらの手法は、非効率的な追跡とマッピング戦略のため、非常に大きなシーンにスケールアップできない。
この問題を解決するために,ビュータイド3Dガウシアンと呼ばれる新しい3D表現を扱う新しいトラッキングとマッピング戦略を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:59:19 GMT)
SiamNAS: Siamese Surrogate Model for Dominance Relation Prediction in Multi-objective Neural Architecture Search [27.5] 現代のニューラルネットワーク探索(NAS)は本質的に多目的であり、精度、パラメータ数、計算コストなどのトレードオフのバランスをとる。
本稿では,シームズネットワークブロックのアンサンブルを利用した新しいサロゲートモデリング手法を提案する。
SiamNASと呼ばれるフレームワークに統合されたこの設計は、検索プロセス中にコストのかかる評価をなくす。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:39:42 GMT)
Large-scale Self-supervised Video Foundation Model for Intelligent Surgery [27.4] 本稿では,大規模な外科的ビデオデータから共同時間的表現学習を可能にする,最初のビデオレベルの手術前トレーニングフレームワークを紹介する。
SurgVISTAは,空間構造を捕捉し,時間的ダイナミックスを複雑化する再構成型事前学習手法である。
実験では、SurgVISTAは自然領域と外科領域の事前訓練されたモデルの両方を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:42:54 GMT)
On the Expressiveness of Visual Prompt Experts [27.3] Visual Prompt Tuning (VPT) は、タスク固有の学習可能なプロンプトトークンを挿入することで、事前学習された視覚モデルを下流タスクに適応させるのに有効であることが証明されている。
本稿では,パラメータ効率を保ちながら表現力の向上を図った新しい手法である視覚適応型プロンプトチューニング(VAPT)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:11:14 GMT)
Answer When Needed, Forget When Not: Language Models Pretend to Forget via In-Context Knowledge Unlearning [26.9] 大規模言語モデル(LLM)は様々な領域にまたがって適用される。
文脈内知識アンラーニング」という新しい手法を提案する。
本手法は,無関係な知識の80%を保持しながら,最大95%の精度を忘れることが可能である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:10:25 GMT)
Spatio-Temporal Fuzzy-oriented Multi-Modal Meta-Learning for Fine-grained Emotion Recognition [26.7] 細粒度感情認識(FER)は、疾患診断、パーソナライズされたレコメンデーション、マルチメディアマイニングなど、様々な分野で重要な役割を果たしている。
既存のFERメソッドは、現実の応用において3つの重要な課題に直面している: (i) 感情は複雑で時間を要するため正確性を確保するために、大量の注釈付きデータに依存している; (ii) サンプリング期間内の時間的相関が同じであると仮定するため、感情パターンの変化に起因する時間的不均一性を捉えることができない; (iii) 異なるFERシナリオの空間的不均一性、すなわち、感情の分布を考慮しない。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:47:57 GMT)
Addressing Key Challenges of Adversarial Attacks and Defenses in the Tabular Domain: A Methodological Framework for Coherence and Consistency [26.6] CSAD(Class-Specific Anomaly Detection)は,新しい異常検出手法である。
CSADは, 広い良性分布ではなく, 予測されたクラス分布に対して, 対数サンプルを評価する。
本評価では, 異常検出率とSHAPに基づく評価を併用し, 対向検体品質のより包括的測定を行う。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:06:19 GMT)
S3D: Sketch-Driven 3D Model Generation [26.6] S3Dは単純な手描きスケッチを詳細な3Dモデルに変換するフレームワークである。
提案手法では,U-Netベースのエンコーダデコーダアーキテクチャを用いてスケッチを顔分割マスクに変換する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:32:05 GMT)
It's Not a Walk in the Park! Challenges of Idiom Translation in Speech-to-text Systems [26.4] テキスト間機械翻訳(MT)と音声間機械翻訳(SLT)の両システムにおいて,従来のニュース翻訳と比較して翻訳を評価する。
以上の結果から,SLTシステムは慣用的なデータに対して顕著な性能低下を経験し,高層でもリテラルに回帰することが多いことがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:29:52 GMT)
MIND: Material Interface Generation from UDFs for Non-Manifold Surface Reconstruction [26.3] 非符号距離場(UDF)は、任意の位相を持つ形状を表現する能力のため、3次元深層学習において広く用いられている。
一般的な回避策は、符号付き距離場(SDF)をUDFから局所的に再構築し、マーチングキューブを介して表面抽出を可能にすることである。
我々はUDFから直接材料インターフェースを生成する新しいアルゴリズムであるMINDを提案し、グローバルな視点から非マニフォールドメッシュ抽出を可能にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:37:11 GMT)
Deep Learning for Retinal Degeneration Assessment: A Comprehensive Analysis of the MARIO AMD Progression Challenge [26.3] MICCAI 2024で開かれたMARIOチャレンジは、加齢関連黄斑変性(AMD)の自動検出とモニタリングの進歩に焦点を当てている
主要なデータセットはフランスのブレストから提供され、参加チームによってモデルのトレーニングとテストに使用された。
アルジェリアからの補助的なデータセットは、人口と装置のシフトを評価するために後処理に使用された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:14:10 GMT)
GAS: Generative Auto-bidding with Post-training Search [26.2] 本稿では,GASと呼ばれるポストトレーニング後検索を用いたフレキシブルで実用的な自動入札方式を提案し,基本方針モデルの出力を改良する。
実世界のデータセットとKuaishou広告プラットフォーム上でのオンラインA/Bテストによる実験は、GASの有効性を実証している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:11:32 GMT)
Iterative Self-Improvement of Vision Language Models for Image Scoring and Self-Explanation [26.2] 本稿では,視覚言語モデル(VLM)の新たなトレーニング手法を提案する。
本手法は,外部データやモデルに頼らずに,VLMの生成したテキストを利用した自己学習を可能にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:04:19 GMT)
HyperSteer: Activation Steering at Scale with Hypernetworks [25.6] HyperSteerは、自然言語のステアリングプロンプトに条件付きステアリングベクトルを生成するために、エンドツーエンドでトレーニングされたハイパーネットワークベースのアーキテクチャのファミリーである。
何千ものステアリングプロンプトによるHyperSteerのスケーリングは、最先端のアクティベーションステアリング手法の性能を上回ることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:32:01 GMT)
Enhancing Convergence, Privacy and Fairness for Wireless Personalized Federated Learning: Quantization-Assisted Min-Max Fair Scheduling [25.5] 本稿では、量子化エラーを利用して、無線パーソナライズドラーニング(WPFL)モデルのプライバシを高める。
本稿では,新しい量子化支援型ガウス微分プライバシー(DP)機構を提案する。
我々は,提案手法が代替スケジューリング戦略を大幅に上回っていることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:13:07 GMT)
VR-Robo: A Real-to-Sim-to-Real Framework for Visual Robot Navigation and Locomotion [25.4] 本稿では,視覚ナビゲーションと移動学習のための物理的にインタラクティブな「デジタルツイン」シミュレーション環境を生成する,リアル・ツー・シム・トゥ・リアルのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:45:52 GMT)
No Training, No Problem: Rethinking Classifier-Free Guidance for Diffusion Models [25.3] 我々はCFGの中核となる原則を再考し、新しい方法である独立条件ガイダンス(ICG)を導入する。
ICGは特別な訓練手順を必要とせずにCFGの利点を提供する。
提案手法は条件拡散モデルの学習過程を合理化し,任意の事前学習条件モデル上での推論にも適用可能である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:51:23 GMT)
ATI: Any Trajectory Instruction for Controllable Video Generation [25.2] 本稿では、カメラの動き、オブジェクトレベルの翻訳、きめ細かい局所的な動きをシームレスに統合する、動画生成におけるモーション制御のための統一的なフレームワークを提案する。
提案手法は,事前学習した画像-映像生成モデルの潜在空間にユーザ定義トラジェクトリを投影することにより,凝集性のある解を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:33:12 GMT)
Pro3D-Editor : A Progressive-Views Perspective for Consistent and Precise 3D Editing [25.2] テキスト誘導型3D編集は意味のある局所的な3D領域を正確に編集することを目的としている。
既存の方法は通常、2Dビューを無差別に編集し、3D空間に投影する。
理想的な一貫した3D編集は、テキストプログレッシブ・ビューのパラダイムによって実現できると我々は主張する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:03:44 GMT)
Shaking to Reveal: Perturbation-Based Detection of LLM Hallucinations [25.2] 自己評価として知られる幻覚を検出するための広く採用されている戦略は、その答えの事実的正確さを推定するために、モデル自身の出力信頼度に依存する。
中間表現における摂動感度を解析することにより自己評価を改善する新しいフレームワークSSPを提案する。
SSPは幻覚検出ベンチマークの範囲で先行手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:44:28 GMT)
Learning Soft Sparse Shapes for Efficient Time-Series Classification [25.1] 本稿では,効率的な時系列分類のためのソフトスパース形状(SoftShape)モデルを提案する。
本手法は,ソフトな形状スペーシフィケーションとソフトな形状学習ブロックを導入している。
後者は、形状内および形状間時間パターン学習を容易にし、疎化軟形状を入力としてモデル効率を向上させる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:44:58 GMT)
Heavy-Ball Momentum Method in Continuous Time and Discretization Error Analysis [25.1] 本稿では, 離散重ボール運動量法(HB)に対して, 連続時間近似, ピースワイド連続微分方程式を明示的離散化誤差で確立する。
アプリケーションとして、方向スムーズ性の新しい暗黙的正規化を見つけ、対角線ネットワークにおけるHBの暗黙的バイアスを調べる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:59:22 GMT)
On the Stability of Graph Convolutional Neural Networks: A Probabilistic Perspective [25.0] グラフトポロジにおける摂動がGCNN出力に与える影響について検討し,モデル安定性解析のための新しい定式化を提案する。
最悪の場合の摂動のみに焦点を当てた従来の研究とは異なり、分布認識の定式化は幅広い入力データにまたがる出力摂動を特徴付ける。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:15:57 GMT)
Asymptotics of SGD in Sequence-Single Index Models and Single-Layer Attention Networks [24.9] 本研究では,SSI(Sequence Single-Index)モデルと呼ばれる一連のシーケンスモデルに対する勾配降下(SGD)のダイナミクスについて検討する。
この設定は古典的な単一インデックスモデルをシーケンシャル領域に一般化する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:03:27 GMT)
Normalizing Flows are Capable Models for RL [24.9] 本稿では,強化学習アルゴリズムにシームレスに統合した単一正規化フローアーキテクチャを提案する。
提案手法はより単純なアルゴリズムに導かれ,模倣学習,オフライン,目標条件付きRL,教師なしRLにおいて高い性能を実現する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:43:14 GMT)
Tensor State Space-based Dynamic Multilayer Network Modeling [24.9] 既存のモデルは、しばしばそのようなネットワークの時間的および層間ダイナミクスを捉えるのに失敗する。
本稿では、潜在空間モデルフレームワークを利用した動的多層ネットワークのための新しい状態空間モデル(TSSDMN)を提案する。
数値シミュレーションとケーススタディにより,動的多層ネットワーク理解における TSSDMN の有効性が実証された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:58:32 GMT)
Hierarchical Relational Learning for Few-Shot Knowledge Graph Completion [24.6] KGコンプリートは,いくつかのトレーニングトレーレットのみを参考にした場合に,新しい関係を含む三つ組の予測を行うことを目的としている。
数ショットのKG完了のための階層的関係学習法(HiRe)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:39:21 GMT)
MASTER: Enhancing Large Language Model via Multi-Agent Simulated Teaching [24.4] MASTERは、認知レベルが異なる複数のエージェント間の相互作用を通じて、元のデータを豊かにする新しいデータ拡張手法である。
私たちは、Orca-Math-200k、ProcQA、OpenHermes2.5といった既存のデータセットから強化された微調整データセットであるBOOST-QAを構築します。
実験により、BOOST-QAで微調整されたモデルは、複数のベンチマークで優れた性能を示し、強力なマルチタスクの一般化を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:41:35 GMT)
Understanding Gender Bias in AI-Generated Product Descriptions [24.2] 我々は、製品記述生成の文脈において、性別バイアスのデータ駆動型分類カテゴリーを開発する。
AI生成した製品記述が、特別な検出と緩和のアプローチを必要とする方法で、ジェンダーバイアスを一意に表面化する方法について説明する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:14:57 GMT)
DOVE: A Large-Scale Multi-Dimensional Predictions Dataset Towards Meaningful LLM Evaluation [24.2] 本稿では,様々な評価ベンチマークの急激な摂動を含む大規模データセットであるDOVE(Dataset Of Variation Evaluation)を提案する。
従来の研究とは対照的に,LLM感度を全体論的視点から検討し,様々な次元に沿った摂動の連関効果を評価する。
DOVEは2億5000万以上の急激な摂動とモデルアウトプットで構成されています。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:47:18 GMT)
Sparse-vDiT: Unleashing the Power of Sparse Attention to Accelerate Video Diffusion Transformers [24.1] 本稿では,ビデオ拡散変換器(vDiT)の空間加速度フレームワークであるSparse-vDiTを提案する。
Sparse-vDiT が 2.09$times$, 2.38$times$, 1.67$times$理論 FLOP 還元, 1.76$times$, 1.85$times$, 1.58$times$ をそれぞれ達成していることを示す。
我々の研究は、vDiTsの潜伏構造空間を長期ビデオ合成に体系的に活用できることを実証した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:42:37 GMT)
Doubly-Robust Estimation of Counterfactual Policy Mean Embeddings [24.1] 反ファクトポリシーの下での成果の分配を推定することは、推薦、広告、医療といった領域における意思決定にとって重要である。
我々は、再生されたカーネルヒルベルト空間の反事実分布全体を表す新しいフレームワーク-Counterfactual Policy Mean Embedding (CPME) を解析する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:16:46 GMT)
Adaptive Guidance for Local Training in Heterogeneous Federated Learning [23.9] Heterogeneous Federated Learning (HtFL) におけるモデルの不均一性
本稿では,FedL2Gを提案する。
FedL2Gは、最先端の7つの手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:27:05 GMT)
RRCANet: Recurrent Reusable-Convolution Attention Network for Infrared Small Target Detection [23.5] 赤外線小目標検出は、その特徴のために難しい課題である。
最近のCNNベースの手法は、重い特徴抽出と融合モジュールで有望な性能を実現している。
赤外線小ターゲット検出のための再帰的再帰的再畳み込みアテンションネットワーク(RRCA-Net)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:18:17 GMT)
Inclusion 2024 Global Multimedia Deepfake Detection Challenge: Towards Multi-dimensional Face Forgery Detection [23.5] 両トラックの上位3チームからのソリューションを提示し、画像およびオーディオビデオ偽造検出の分野での研究作業を強化する。
私たちの挑戦は世界中から1500のチームが集まり、5000の有効な結果が得られました。
この課題を通じて開発された手法は、次世代のディープフェイク検知システムの開発に寄与する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:52:18 GMT)
Discovering Latent Causal Graphs from Spatio-Temporal Data [23.4] 宇宙における潜在因果構造に基づく因果推論のための新しい枠組みであるSPACYを提案する。
SPACYは、空間内の潜伏因果構造を発見し、そのようなデータの高次元性を緩和する。
また、実際の気候データから既知の重要な現象を識別する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:46:32 GMT)
How Two-Layer Neural Networks Learn, One (Giant) Step at a Time [23.4] 本研究では、2層ニューラルネットワークの特徴がターゲット関数の構造にどのように適応するかを理論的に検討する。
バッチサイズが$n = MathcalO(d)$で、階段の性質を満たす複数の目標方向を学習するのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:12:56 GMT)
Inference-time sparse attention with asymmetric indexing [23.3] トランスモデルの自己アテンションは、キーベクトルを値ベクトルにマッピングするインクリメンタルな連想メモリである。
自己注意の高速化の1つの方法は、k-meansのような標準的なパーティショニング手法に基づいたGPU互換のベクトル探索アルゴリズムを採用することである。
本稿ではこれらの問題を克服したSaapを紹介する。
非対称な索引付け手法で、キーとクエリのパーティションを区別し、データ適応型スパーシティパターンで自己アテンションを近似する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:07:35 GMT)
LiTEx: A Linguistic Taxonomy of Explanations for Understanding Within-Label Variation in Natural Language Inference [23.3] 自由文の説明を分類するための言語情報を用いた分類法であるLITEXを紹介する。
この分類を用いて、e-SNLIデータセットのサブセットに注釈を付け、分類の信頼性を評価し、NLIラベル、ハイライト、説明とどのように一致しているかを分析する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:41:25 GMT)
RelationAdapter: Learning and Transferring Visual Relation with Diffusion Transformers [23.1] 本稿では、ソースターゲット画像のペアを利用して、新規なクエリ画像に対するコンテンツ認識編集意図を抽出し、転送する。
本稿では、Diffusion Transformer(DiT)ベースのモデルで視覚変換を効果的にキャプチャし、適用できる軽量モジュールであるRelationAdapterを紹介する。
Relation252Kの実験では、RelationAdapterはモデルの編集意図を理解し、転送する能力を大幅に改善し、生成品質と全体的な編集性能が顕著に向上した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:06:35 GMT)
On Weak-to-Strong Generalization and f-Divergence [23.1] W2SG(Weak-to-strong generalization)は、強力な事前学習モデルの能力を刺激するための有望なパラダイムとして登場した。
W2SGにおける情報理論損失関数フレームワークとして$f$-divergenceを導入する。
我々は、KL分散のような広く使われているメトリクスを一般化する$f$-divergence損失が、実際に強いモデルの一般化と耐雑音性を効果的に改善することを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:40:08 GMT)
One Missing Piece for Open-Source Reasoning Models: A Dataset to Mitigate Cold-Starting Short CoT LLMs in RL [23.1] 提案するLong CoT Collectionは,既存の短いCOT LLMを用いた100K CoT論理値のデータセットである。
我々は,O1の新たな推論戦略を短いCOT LLMに誘導し,より長い思考を可能にするパイプラインを開発した。
我々の実験では、データセットのトレーニングは一般的な推論スキルを強化するだけでなく、強化学習の強力な基盤も提供します。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:29:15 GMT)
On Entity Identification in Language Models [23.0] 言語モデル(LM)の内部表現は、名前付きエンティティの言及を識別し、区別する。
まず、エンティティの言及の曖昧さと可変性という2つの問題を定式化します。
本稿では,クラスタリング品質指標に類似したフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:55:21 GMT)
TaxAgent: How Large Language Model Designs Fiscal Policy [22.9] 本研究では,大規模言語モデル(LLM)とエージェントベースモデリング(ABM)を統合し,適応型税制を設計するTaxAgentを紹介する。
我々のマクロ経済シミュレーションでは、ヘテロジニアスなH-Agents(ハウスホールディングス)が現実の納税者の振る舞いをシミュレートし、TaxAgent(政府)はLLMを使って税率を反復的に最適化し、株式と生産性のバランスをとる。
Saez Optimal Taxation、合衆国の連邦所得税、自由市場を基準に、TaxAgentは優れた株式・効率のトレードオフを達成している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:06:19 GMT)
SignMusketeers: An Efficient Multi-Stream Approach for Sign Language Translation at Scale [22.5] 手話ビデオ処理における永続的な課題は、手話表現の学習方法である。
提案手法は,署名者の顔,手,身体のポーズなど,署名ビデオの最も関連性の高い部分のみに焦点を当てる。
我々のアプローチは、個々のフレームから(ビデオシーケンスではなく)学習することに基づいており、手話事前学習よりもずっと効率的である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:25:18 GMT)
ClinBench-HPB: A Clinical Benchmark for Evaluating LLMs in Hepato-Pancreato-Biliary Diseases [22.5] 肝-膵・胆道疾患(HPB)は、その死亡率と死亡率が高いため、世界的な公衆衛生上の課題である。
大規模言語モデル(LLM)は、一般的な質問応答タスクにおいて有望な性能を示した。
我々は,3,535件のクローズドエンド・マルチチョイス質問と337件のオープンエンド・リアル診断例からなるHPB病評価ベンチマークを系統的に評価した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:02:20 GMT)
Generative Emotion Cause Explanation in Multimodal Conversations [22.5] 本稿では,MECEC(Task-textbfMultimodal Emotion Cause Explanation in Conversation)を紹介する。
本課題は,会話のマルチモーダルな文脈に基づいて,感情を誘発する理由を明確かつ直感的に記述した要約を生成することを目的とする。
FAME-Netという新しいアプローチが提案され、ビデオの表情を通して、視覚データを解析し、感情を正確に解釈するLarge Language Models(LLMs)の力を利用する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:51:21 GMT)
Spectral Clustering for Directed Graphs via Likelihood Estimation on Stochastic Block Models [22.4] ブロックモデルに対する統計的推測を利用して、有向グラフに対するスペクトルクラスタリングアルゴリズムの開発を導く。
我々は、スペクトル緩和の誤クラスタリング誤差に関する理論上界を確立し、この緩和に基づいて、有向グラフに対する新しい自己適応スペクトルクラスタリング法を導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:00:53 GMT)
Multimodal DeepResearcher: Generating Text-Chart Interleaved Reports From Scratch with Agentic Framework [22.4] マルチモーダルDeepResearcherは、タスクを調査、文書化、計画、マルチモーダルレポート生成という4つの段階に分解する。
ベースライン方式よりも82%の総合的な勝利率を達成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:18:19 GMT)
Dense Match Summarization for Faster Two-view Estimation [22.2] 我々は、密接な対応から頑健な2次元相対ポーズをスピードアップする。
そこで本研究では,高密度マッチングの完全集合を使用するのに匹敵する精度を提供する,効率的なマッチング要約方式を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:01:12 GMT)
Hierarchical Self-Prompting SAM: A Prompt-Free Medical Image Segmentation Framework [22.2] Hierarchical Self-Prompting SAM (HSP-SAM) は医療画像セグメンテーションのための新しいセルフプロンプトフレームワークである。
HSP-SAMはポリープや皮膚病変のセグメンテーションのような古典的なセグメンテーションタスクにおいて優れた性能を発揮する。
未確認データセットへの強力な一般化を示し、従来の最先端手法よりも14.04%の改善を実現している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:23:33 GMT)
Training on Plausible Counterfactuals Removes Spurious Correlations [22.1] P-CFE (Plusible counterfactual explanations) は、入力を最小限に修正して分類器の決定を変更する摂動である。
本研究では,非摂動入力を分類するために,誘導的内向的ターゲットクラスをラベル付けしたp-CFEを用いて分類器を訓練できることを実証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:40:59 GMT)
A Machine Learning Theory Perspective on Strategic Litigation [22.0] 我々は,下級裁判所が,上級裁判所の過去の判決から学んだ決定規則を適用して,新たな事件を決定する共通法体系のモデルを考える。
このモデルでは,高裁にケースを戦略的に導入し,学習した意思決定ルールに影響を与える戦略的訴訟者の力について検討する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:38:43 GMT)
Ensemble Kalman Diffusion Guidance: A Derivative-free Method for Inverse Problems [22.0] アンサンブルカルマン拡散誘導(Ensemble Kalman Diffusion Guidance, EnKG)は、逆問題の解法である。
本研究では,様々な逆問題に対する EnKG の実証的有効性について検討した。
ソースコードはhttps://github.com/devzhk/enkg-pytorch.comで公開しています。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:42:45 GMT)
Rethinking Diffusion Posterior Sampling: From Conditional Score Estimator to Maximizing a Posterior [21.7] DPSが用いる条件スコア近似は、以前想定したほど効果的ではないことを示す。
この主張は、512x512 ImageNet画像上のDPSを調べることによって裏付けられる。
1) 多段階の上昇勾配と投射による後方の最大化,2)100個の画像と8個のGPU時間で訓練された軽量条件付きスコア推定器を利用する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:58:07 GMT)
KET-RAG: A Cost-Efficient Multi-Granular Indexing Framework for Graph-RAG [21.6] Graph-RAGは、Large Language Model (LLM)ベースの質問応答における検索を改善するために、テキストチャンクから知識グラフを構築する。
既存のGraph-RAGシステムでは、テキストチャンクの関連性に基づいてKNNグラフを構築しているが、この粗い粒度のアプローチでは、テキスト内のエンティティ関係をキャプチャできない。
KET-RAGは,インデクシングコストを低減しつつ,良好な結果の精度を確保するための多粒性インデックスフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:45:42 GMT)
PartComposer: Learning and Composing Part-Level Concepts from Single-Image Examples [21.5] PartComposerは、単一イメージの例から学ぶ部分レベルの概念のフレームワークである。
本稿では,一発データ不足に対処するために,多様な部分合成を生成する動的データ合成パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:43:28 GMT)
Privacy Leaks by Adversaries: Adversarial Iterations for Membership Inference Attack [21.4] IMIAは、敵のサンプルを生成するプロセスを利用して、メンバーシップを推測する新たな攻撃戦略である。
我々は,複数のモデルとデータセットをまたいだ実験を行い,その結果から,対数サンプルを生成する反復回数が,メンバーシップ推論の信頼性の高い特徴であることを実証した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:09:24 GMT)
OmniSpatial: Towards Comprehensive Spatial Reasoning Benchmark for Vision Language Models [21.3] 認知心理学に基づく空間的推論のベンチマークであるOmniSpatialを紹介する。
インターネットデータクローリングと手作業による注意深いアノテーションにより,1.5K以上の質問応答ペアを構築した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:58:29 GMT)
LLM-Guided Taxonomy and Hierarchical Uncertainty for 3D Point Cloud Active Learning [21.3] 本稿では3Dポイントクラウドセマンティックセマンティックセグメンテーションのための新しいアクティブラーニングフレームワークを提案する。
大規模言語モデル(LLM)を統合し、階層的なラベル構造を構築し、不確実性に基づくサンプル選択をガイドする。
この結果は,3次元ビジョンにおける知識の先行としてLLMの未解決の可能性を強調し,効率的なポイントクラウドアノテーションのための強力なパラダイムとして階層的不確実性モデリングを確立した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:11:24 GMT)
Hyperspectral Image Generation with Unmixing Guided Diffusion Model [21.1] 拡散モデルは高品質なサンプルを生成する能力で人気がある。
ハイパースペクトルアンミックス法により導かれる新しい拡散モデルを提案する。
我々のモデルは高品質で多様なハイパースペクトル画像を生成することができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:27:10 GMT)
XicorAttention: Time Series Transformer Using Attention with Nonlinear Correlation [21.0] 本稿では,Chatterjeeのランク相関係数に基づく新しい注意機構を提案する。
標準注意機構の行列乗法をこのランク係数に置き換えてクエリーキーの関係を測る。
提案するメカニズムであるXicorAttention'は,いくつかの最先端トランスフォーマーモデルに統合する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:43:45 GMT)
DLP: Dynamic Layerwise Pruning in Large Language Models [20.8] プルーニングはパラメータスケールの削減とLarge Language Models(LLM)の推論効率の向上のために広く採用されている。
動的レイヤワイズ・プルーニング(DLP)と呼ばれる新しい手法を提案する。
モデル重みと入力アクティベーション情報を統合することで各層の相対的重要性を適応的に決定し,それに応じてプルーニング率を割り当てる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:06:29 GMT)
Learning Together to Perform Better: Teaching Small-Scale LLMs to Collaborate via Preferential Rationale Tuning [20.8] COLLATEは、(小さな)LLMをチューニングして、下流タスクを選択的に改善する多様な理性のプールから出力を生成するフレームワークである。
様々なパラメータスケール(1Bから8B)で異なるモデルファミリーのLCMに対してCOLLATEが有効であることを示すとともに、終了タスクによって導かれる複数の合理化プロバイダのメリットを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:50:08 GMT)
Beyond 2:4: exploring V:N:M sparsity for efficient transformer inference on GPUs [20.6] V:N:Mスパシティは2:4スパシティの制限に対処する上で有望である。
V:N:Mのスパーシリティに関連する特定の問題、例えば適切なVとMの値をどうやって選択するかは未解決のままである。
本稿では,V:N:Mスパース変換器の適用性と精度を高めるための3つの重要な手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:31:41 GMT)
Auto-Labeling Data for Object Detection [20.6] 本稿では,基礎となる真理ラベルを使わずに標準物体検出モデルを訓練する問題に対処する。
視覚言語基礎モデルを用いて,アプリケーション固有の擬似「地下真実」ラベルを生成する。
当社のアプローチは,複数のデータセット上での競合性能を維持する上で,標準的なラベル付けに代わる有効な手段であることに気付きました。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:27:56 GMT)
Large Language Models to Diffusion Finetuning [20.3] 我々は、下流タスク間の性能向上に直接変換することで、単調に精度を向上することを示す。
本手法は,クロスエントロピー損失で事前学習した基礎モデルに適用可能である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:52:35 GMT)
A TRPCA-Inspired Deep Unfolding Network for Hyperspectral Image Denoising via Thresholded t-SVD and Top-K Sparse Transformer [20.2] 本稿では,低ランクとスパースという2つの密に統合されたモジュール間のステージワイドな交互化を実現する新しいディープ展開ネットワーク(DU-TRPCA)を提案する。
合成および実世界のHSIの実験により、DU-TRPCAは高密度混合雑音下で最先端の手法を超越していることが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:01:39 GMT)
MidPO: Dual Preference Optimization for Safety and Helpfulness in Large Language Models via a Mixture of Experts Framework [20.1] そこで本稿では,安全性向上のためのテキストバウンサーラインMixture of Experts(MoE)フレームワークであるMidPOを提案する。
提案したMidPOは安全性と有用性の両方において最先端のアプローチを大幅に上回っていることを示すために,3つの一般的なデータセットについて定量的,定性的な実験を行った。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:23:09 GMT)
Improving the Language Understanding Capabilities of Large Language Models Using Reinforcement Learning [20.1] Proximal Policy Optimization (PPO)は、大規模言語モデル(LLM)の機能を改善するためのフレームワークである。
PPOは監督された微調整よりも一貫して優れており、GLUEでは平均6.3ポイント向上している。
本研究は,LLMを強化学習問題とみなすことで,新たなタスクに適応する上で有望な方向性を示すものである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:16:21 GMT)
Stochastic Forward-Backward Deconvolution: Training Diffusion Models with Finite Noisy Datasets [20.1] 近年の拡散型生成モデルは大量のデータセットのトレーニングによって顕著な結果を得るが、このプラクティスは記憶と著作権侵害に関する懸念を提起する。
提案されている治療法は、著作権問題のあるノイズの多いデータのみを訓練し、モデルが元のコンテンツを決して観察しないことを保証することである。
ノイズの多いサンプルからデータ分布を学習することは理論的には不可能であるが,十分なサンプルを集めるという実践的な課題は,学習をほぼ達成不可能にしている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:45:44 GMT)
TACLR: A Scalable and Efficient Retrieval-based Method for Industrial Product Attribute Value Identification [19.9] 製品属性値識別 (PAVI) のための最初の検索手法である TACLR (Contrastive Learning Retrieval) を導入する。
TACLRは、製品プロファイルと候補値を埋め込みに符号化し、その類似性に基づいて値を取得することにより、情報検索タスクとしてPAVIを定式化する。
1)正規化された出力を生成しながら暗黙的およびOOD値を効果的に処理し、(2)数千のカテゴリ、数千の属性、そして数百万の値にスケールし、(3)高負荷の産業展開のための効率的な推論をサポートする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:02:22 GMT)
Comba: Improving Nonlinear RNNs with Closed-loop Control [19.8] 本稿では,これらのモデルの利点と限界を包括的に分析し,RNNの概念を紹介する。
我々は、状態フィードバックと出力フィードバックの両補正を備えたスカラー+低ランク状態遷移を採用した新しいRNN変種Combaを提案する。
Combaは、言語とビジョンモデリングの両方において、優れたパフォーマンスと効率を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:44:50 GMT)
Generative Unordered Flow for Set-Structured Data Generation [19.6] 本稿では,データセットデータ生成のためのフローベース生成モデルとして,非順序フローを提案する。
具体的には、順序のないデータを適切な関数表現に変換し、関数値のフローマッチングによってそのような表現の確率測定を学習する。
関数表現から非順序データへの逆写像について、Langevin 動的に初期粒子をウォームアップし、勾配に基づく探索を行い、それらを収束するまで更新する手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:37:00 GMT)
A Multi-Dialectal Dataset for German Dialect ASR and Dialect-to-Standard Speech Translation [19.5] Betthupferlは、ドイツ南東部で話されている3つの方言群における4時間の読み上げ音声を含む評価データセットである。
我々は、方言と標準ドイツ語の両方の転写を提供し、それら間の言語的差異を分析する。
我々は、標準ドイツ語への音声翻訳における多言語ASRモデルのベンチマークを行い、その出力が方言と標準文字にどの程度似ているかの相違を見出した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:02:52 GMT)
Exposing Numeracy Gaps: A Benchmark to Evaluate Fundamental Numerical Abilities in Large Language Models [19.5] 大規模言語モデル(LLM)は、自然言語処理タスクにおける印象的な機能を示している。
基本算術、数値、等級数比較などの数値推論タスクにおけるそれらの性能は、驚くほど貧弱なままである。
既存のベンチマークは主に言語能力や構造化された数学的問題解決に焦点を当てている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:47:24 GMT)
Scene Structure Guidance Network: Unfolding Graph Partitioning into Pixel-Wise Feature Learning [19.4] 本研究では,シーンのタスク固有の構造ガイダンスを抽出する単一汎用ニューラルネットワークアーキテクチャを提案する。
我々の主な貢献は、このような単純なネットワークが、いくつかの低レベル視覚アプリケーションに対して最先端の結果を得ることができることを示すことである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:49:28 GMT)
SFBD Flow: A Continuous-Optimization Framework for Training Diffusion Models with Noisy Samples [19.4] 拡散モデルは強力な生成性能を達成するが、しばしばセンシティブなコンテンツを含む大きなデータセットに依存する。
この課題は、トレーニングデータを記憶するモデルの傾向と、プライバシに関する懸念が混ざり合っている。
SFBDは、破損したデータのトレーニングと、ローカル構造をキャプチャして収束を改善するために、限られたクリーンサンプルを使用することによって、この問題に対処する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:16:02 GMT)
Theoretical Performance Guarantees for Partial Domain Adaptation via Partial Optimal Transport [19.4] 部分的ドメイン適応(PDA)は、ソースデータに対するドメインアライメント項と重み付き経験損失を最小化する。
本研究では, 部分最適輸送に基づくPDA問題に対するバウンダリを導出する。
これらの制約にインスパイアされた我々は、WARMPOTと呼ばれるPDAのための実用的なアルゴリズムを考案した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:09:28 GMT)
Forecasting Company Fundamentals [19.4] 実企業データに基づく予測モデルについて,24の決定論的・確率的企業基盤を評価した。
ディープラーニングモデルは,従来のモデルよりも優れた予測性能を提供する。
これらの高品質な予測が、自動株式配分にどのような恩恵をもたらすかを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:46:54 GMT)
Can Input Attributions Explain Inductive Reasoning in In-Context Learning? [19.3] 本稿では,帰納的推論の合成診断タスクを設計する。
問題は、従来の入力属性法がそのような推論過程を追跡できるかどうかである。
実験はいくつかの実用的な発見をもたらす。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:49:25 GMT)
Revisiting Continuity of Image Tokens for Cross-domain Few-shot Learning [19.2] Vision Transformer (ViT) は、一般ドメインでの大規模な事前トレーニングによって大きな成功を収めた。
しかし、トレーニングデータに乏しい下流のドメインに適用する場合、依然として課題に直面している。
自己注意がトークンの順序に敏感であることにインスパイアされた私たちは、現在の研究で無視されている興味深い現象を見つけました。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:40:36 GMT)
Random Registers for Cross-Domain Few-Shot Learning [19.2] クロスドメインの少数ショット学習は、知識をデータ不足のソースドメインからデータ不足のターゲットドメインに転送することを目的としている。
ソース・ドメイン・トレーニングにおいて、インシデント・チューニングはViTをトレーニングする一般的な方法であり、ターゲットドメインにおけるViTの一般化には有害であることがわかった。
画像トークンのセマンティック領域にランダムレジスタを追加することで,CDFSLの簡易かつ効果的なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:13:58 GMT)
Measurement incompatibility and quantum steering via linear programming [19.0] 我々は、量子測定のロバスト性に基づいて、上と下の境界を計算する線形プログラムの階層を構築する。
我々の手法は、状態のローカルな隠れ状態モデルを構築するためにどのように使用できるかを示し、逆に、ある状態がステアリングを示すことを証明します。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:28:25 GMT)
Expanding before Inferring: Enhancing Factuality in Large Language Models through Premature Layers Interpolation [19.0] 大規模言語モデル(LLM)は、事実的に矛盾した出力を生成し、一般に「幻覚」と呼ばれる。
本稿では, PLI (Premature Layers Interpolation) を提案する。
4つの公開データセットの実験では、ほとんどの場合、PLIは幻覚を効果的に減らし、既存のベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:07:13 GMT)
Unrolling Nonconvex Graph Total Variation for Image Denoising [19.0] グラフ(NC-GTV)における新しい非フォワード変種を示し、デノナイジングのための$ell$-norm項と組み合わせると凸表現を最小限に抑える。
ここでは,Gershgorin Circle Theorem (GCT) を適応させて効率よく$a$を計算する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:34:32 GMT)
M$^3$FinMeeting: A Multilingual, Multi-Sector, and Multi-Task Financial Meeting Understanding Evaluation Dataset [18.8] $texttM$3$FinMeeting$は、財務会議の理解のために設計された、多言語、マルチセクタ、マルチタスクのデータセットである。
まず、英語、中国語、日本語をサポートし、多様な言語文脈における金銭的議論の理解を深める。
第2に、グローバル産業分類基準(GICS)が定める様々な産業分野を包含する。
第3に、要約、質問回答(QA)ペア抽出、質問応答という3つのタスクが含まれており、より現実的で包括的な理解評価を促進する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:41:09 GMT)
MLorc: Momentum Low-rank Compression for Large Language Model Adaptation [18.6] 我々は、モメンタム低ランク圧縮(MLorc)と呼ばれるメモリ効率の訓練パラダイムを提案する。
勾配ではなく運動量を直接圧縮して再構成することにより、MLorcは重み更新行列に固定ランク制約を課すことを避ける。
実証的には、MLorcは、他のメモリ効率のトレーニング方法、マッチ、さらにはフル微調整のパフォーマンスを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:59:44 GMT)
Explicit vs. Implicit: Investigating Social Bias in Large Language Models through Self-Reflection [18.6] 大規模言語モデル(LLM)は、生成されたコンテンツに様々なバイアスとステレオタイプを示すことが示されている。
本稿では,LLMにおける明示的偏見と暗黙的偏見を調査・比較するための体系的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:37:54 GMT)
Nudging: Inference-time Alignment of LLMs via Guided Decoding [18.5] 大規模言語モデル(LLM)は、ユーザ命令を効果的かつ安全に追従するためにアライメントを必要とする。
このプロセスでは、すべてのベースモデルの整列バージョンをトレーニングする必要があります。
NUDGingは、任意のベースモデルを小さなアライメントモデルを用いて推論時に整列する、トレーニング不要なアルゴリズムである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:35:30 GMT)
VectorPainter: Advanced Stylized Vector Graphics Synthesis Using Stroke-Style Priors [18.5] 本稿では,VectorPainterについて紹介する。
提案手法は,まず参照画像の画素を一連のベクトルストロークに変換し,入力されたテキスト記述に基づいてベクトルグラフを生成する。
生成過程を通してストロークのスタイルを保存するために,スタイル保存損失関数を導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:49:39 GMT)
When Heterophily Meets Heterogeneity: Challenges and a New Large-Scale Graph Benchmark [18.3] 大規模ノード分類グラフベンチマークであるH2GBを導入する。
これは、実世界のグラフのヘテロフィリー性質とヘテロフィリー性質の両方の複雑さを結合させる。
また、この挑戦的なベンチマークで優れているモデルであるH2G-formerを新たに提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:01:36 GMT)
Synthetic Speech Source Tracing using Metric Learning [18.2] 本稿では,話者認識に触発されたパイプラインによる音声の操作を支援する合成音声識別システムにおける音源追跡について述べる。
分類ベースとメートル法学習の2つのアプローチを評価する。
その結果、ResNetはメトリック学習アプローチと競合し、SSLベースのシステムを超えていることがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:12:15 GMT)
Gaussian mixture models as a proxy for interacting language models [18.1] 対話型ガウス混合モデル(GMM)を,大規模言語モデル(LLM)を用いた類似フレームワークの代替として導入する。
相互作用するGMMは、相互作用するLLMにおいて、動的に重要な特徴を捉えている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:01:41 GMT)
Kernel-based Unsupervised Embedding Alignment for Enhanced Visual Representation in Vision-language Models [18.0] 本稿では,CLIPの視覚表現とDINOv2の表現を一致させるカーネルベースの新しい手法を提案する。
画像のみのアライメント微調整は、ゼロショット物体認識、きめ細かい空間的推論において著しく改善されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:44:43 GMT)
Dynamic Benchmarking of Reasoning Capabilities in Code Large Language Models Under Data Contamination [18.0] 潜在的なデータ汚染下でのコードLLMを評価するための新しいベンチマークスイートであるツールを提案する。
ツールは複数のエージェントを使用して、コアロジックを変更することなくコンテキストを抽出し、変更し、意味的に等価なバリエーションを生成する。
その結果、ツールが汚染リスク下での推論能力を効果的にベンチマークし、多様な問題セットを生成し、一貫性と信頼性を保証できることが判明した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:14:34 GMT)
Truth over Tricks: Measuring and Mitigating Shortcut Learning in Misinformation Detection [18.0] 本稿では,誤情報検出におけるショートカット学習計測のための統一評価パラダイムであるTrathOverTricksを紹介する。
既存の検出器は自然発生のショートカットと逆発生のショートカットの両方に曝露した場合に深刻な性能劣化が生じることを示す。
言い換え, 事実要約, 感情正規化によるショートカット依存を緩和する LLM 拡張データ拡張フレームワーク SMF を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:09:55 GMT)
Rethinking Post-Unlearning Behavior of Large Vision-Language Models [18.0] 我々はLVLM(Large Vision-Language Models)のための新しいアンラーニングタスクを導入する。
このタスクでは、プライバシが保護されるが、情報的かつ視覚的に根拠づけられた応答を提供するモデルが必要である。
また,学習後の振る舞いを望ましい出力分布に導出する新しいアンラーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:28:22 GMT)
IndicRAGSuite: Large-Scale Datasets and a Benchmark for Indian Language RAG Systems [17.9] IndicMSMarcoは13のインドの言語における検索品質と応答生成を評価するための多言語ベンチマークである。
我々は、最先端のLLMを用いて、19のインドの言語ウィキペディアから派生した大規模な(質問、回答、関連する)データセットを構築した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:38:27 GMT)
Puzzle: Distillation-Based NAS for Inference-Optimized LLMs [17.7] 大きな言語モデル(LLM)は優れた能力を提供するが、高い推論コストは広く採用を制限する。
本稿では,LLMの推論を高速化するハードウェア対応フレームワークであるPuzzleについて述べる。
我々は、Llama-3.1-Nemotron-51B-Instruct (Nemotron-51B)とLlama-3.3-Nemotron-49Bという2つの公開モデルを通して、我々のフレームワークの影響を実証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:02:03 GMT)
Bayesian Prompt Flow Learning for Zero-Shot Anomaly Detection [17.6] 視覚言語モデル(例えばCLIP)はゼロショット異常検出(ZSAD)において顕著な性能を示した。
Bayes-PFL は画像固有の分布と画像に依存しない分布の両方を学習するために設計されており、テキストプロンプト空間を正規化し、未知のカテゴリにおけるモデルの一般化を改善するために共同で使用される。
15の産業用および医療用データセットに対する実験により,本手法の優れた性能が示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:22:50 GMT)
Fault Localisation and Repair for DL Systems: An Empirical Study with LLMs [17.6] 本稿では,障害局所化(FL)と修復手法の総合的な評価について述べる。
本稿では,Large Language Models (LLM) の能力を利用して,DL故障のローカライズと修復を行う手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:08:33 GMT)
Video Motion Graphs [17.6] 我々は、リアルな人間のモーションビデオを生成するように設計されたMotion Graphsを紹介する。
システムは、まず、条件に合ったジェスチャーでビデオクリップを検索し、次にフレームを生成して、クリップ境界をシームレスに接続することによって、新しいビデオを生成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:25:16 GMT)
STORYTELLER: An Enhanced Plot-Planning Framework for Coherent and Cohesive Story Generation [17.6] 自動生成されたストーリーの一貫性と一貫性を体系的に改善する新しいアプローチであるStorytellerを紹介します。
実験では、ストーリーテラーは既存のアプローチを大きく上回り、平均勝利率は84.33%に達した。
同時に、創造性、一貫性、エンゲージメント、関連性など、他の面でもはるかに先を行っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:54:00 GMT)
PARC: A Quantitative Framework Uncovering the Symmetries within Vision Language Models [17.5] 視覚言語モデル(VLM)は、ユーザーが作成したテキストプロンプトと視覚入力に応答する。
VLMがこの不安定性を様々なプロンプトに継承するかどうかを判断することが重要である。
本稿では, PARC (Prompt Analysis via Reliability and agnostic) について紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:42:32 GMT)
Self-Supervised Spatial Correspondence Across Modalities [17.5] 本稿では,モーダルな時空間対応を見つける方法を提案する。
RGB画像と深度マップのような2つの画像が与えられた場合、このモデルでは、どのピクセルがシーン内の同じ物理点に対応するかを特定する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:59:45 GMT)
PAC Learning with Improvements [17.5] エラーを学習するためには、少なくとも$textit 1/epsilon$サンプルが必要だ。
だけで、$textitzero$エラーを達成できるかもしれません。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:22:35 GMT)
Enhancing Monocular Height Estimation via Weak Supervision from Imperfect Labels [17.5] 我々は,不完全なラベル付きデータを画素高度推定ネットワークのトレーニングに導入する。
単分子高さ推定ネットワークと互換性のあるアンサンブルベースのパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:14:16 GMT)
A$^2$ATS: Retrieval-Based KV Cache Reduction via Windowed Rotary Position Embedding and Query-Aware Vector Quantization [17.3] ロングコンテキストの大規模言語モデル(LLM)は、メモリフットプリントが大きく、KVキャッシュのアクセスオーバーヘッドが大きいため、効率的なサービスを実現する上で大きな課題となる。
検索ベースのKVキャッシュ削減手法は、一般的に完全なKVキャッシュをCPUにオフロードし、推論時に必要なトークンを取得することで、これらの課題を軽減することができる。
本稿では,新しい検索方式KVキャッシュ削減手法であるA$2$ATSを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:18:23 GMT)
A Similarity Paradigm Through Textual Regularization Without Forgetting [17.3] テキスト正規化による類似パラダイム(SPTR)と呼ばれる新しい手法を提案する。
SPTRは、手作りのプロンプトに基づく、分離不能なフレームワークである。
11のデータセットにまたがる4つの代表的なタスクは、SPTRが既存のプロンプト学習方法より優れていることを示している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:16:18 GMT)
Exploring Representations and Interventions in Time Series Foundation Models [17.2] 時系列基礎モデル(TSFM)は、幅広いアプリケーションのための強力なツールであることを約束する。
彼らの内部表現や学習された概念はまだよく理解されていない。
本研究では,様々なTSFMにおける表現の構造と冗長性について検討する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:05:35 GMT)
EvidenceOutcomes: a Dataset of Clinical Trial Publications with Clinically Meaningful Outcomes [17.2] エビデンスアウトカムズ(EvidenceOutcomes)は、医学文献から抽出された臨床的に有意義な結果の、新しく、大きく、注釈付きコーパスである。
EvidenceOutcomesは、将来の機械学習アルゴリズムの開発とテストのための共有ベンチマークとして機能する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:22:06 GMT)
OpenCarbon: A Contrastive Learning-based Cross-Modality Neural Approach for High-Resolution Carbon Emission Prediction Using Open Data [17.2] 高分解能二酸化炭素排出量の正確な推定は、効率的な排出管理と緩和計画に不可欠である。
オープンデータに基づく予測モデルを開発し、訓練し、利用可能なオープンデータに基づいて、新しい領域のエミッションを簡単に推測することができる。
我々のモデルであるOpenCarbonは、二酸化炭素排出量に対する様々な機能間の相互作用と暗黙の影響、複雑な空間的連続性相関の2つの主要な設計を特徴としている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:12:10 GMT)
Generative Perception of Shape and Material from Differential Motion [17.1] 本稿では,物体の映像から形状・材料図を生成する条件付き拡散モデルを提案する。
本研究は、身体的身体的システムにおける視覚的推論を改善するための生成的知覚アプローチを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:43:20 GMT)
Uneven Event Modeling for Partially Relevant Video Retrieval [17.1] 部分関連ビデオ検索(PRVR)のための不均一事象モデリング(UEM)フレームワークを提案する。
まず、連続フレーム間の時間的依存関係と意味的類似性の両方を考慮してイベントを反復的に定式化するPGVS(Progressive-Grouped Video)モジュールを紹介する。
また、コンテキスト認識イベントリファインメント(CAER)モジュールを提案し、テキストのクロスアテンションを条件としたイベント表現を洗練させる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:11:35 GMT)
From Flat to Hierarchical: Extracting Sparse Representations with Matching Pursuit [17.0] 我々は,MP-SAEがエンコーダを一連の残差誘導ステップにアンロールすることで,階層的かつ非線形にアクセス可能な特徴を捉えることができることを示す。
また、MP-SAEのシーケンシャルエンコーダ原理は、推論時に適応空間の利点を付加することを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:24:55 GMT)
Computational Thresholds in Multi-Modal Learning via the Spiked Matrix-Tensor Model [16.9] 本研究では,2つの雑音,相関モード(スパイク行列とスパイクテンソル)からの高次元信号の回復について検討した。
簡単な逐次カリキュラム学習戦略が行列を最初に回復し、テンソル回復誘導に活用することで、このボトルネックを解消し、最適な弱回復しきい値を達成することを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:14:34 GMT)
Enhancing Fourier Neural Operators with Local Spatial Features [16.9] 入力データから直接局所空間特徴(LSF)をキャプチャする畳み込みニューラルネットワーク(CNN)ベースの特徴事前抽出器を導入する。
以上の結果から,FNOの表現能力を高めることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:17:15 GMT)
Constant Rate Scheduling: Constant-Rate Distributional Change for Efficient Training and Sampling in Diffusion Models [16.9] 拡散モデルにおける学習とサンプリングのためのノイズスケジュールを最適化する一般的な手法を提案する。
非条件およびクラス条件の画像生成タスクに対するアプローチの有効性を評価する。
トレーニングとサンプリングのスケジュールを最適化するために,本手法を用いることで,最先端のFIDスコア2.03を達成できた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:37:31 GMT)
Towards In-the-wild 3D Plane Reconstruction from a Single Image [16.9] 単一の画像から3D平面を再構築することは、3Dコンピュータビジョンにおいて重要な課題である。
これまでの最先端の手法は、屋内または屋外のドメインから1つのデータセットでシステムのトレーニングに重点を置いてきた。
ゼロショット3次元平面の検出と再構成を目的としたトランスフォーマーベースモデルであるZeroPlaneを紹介した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:14:05 GMT)
Generating Synthetic Electronic Health Record Data: a Methodological Scoping Review with Benchmarking on Phenotype Data and Open-Source Software [16.8] 我々は、合成EHRデータ生成のための既存のアプローチのスコーピングレビューを行う。
方法はオープンソースのEHRデータセットMIMIC-III/IVでベンチマークされる。
ベンチマーク手法の選択をガイドする決定木を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:38:16 GMT)
The Limits of Predicting Agents from Behaviour [16.8] 我々は,エージェントの行動が世界モデルによって導かれるという仮定の下で,正確な回答を提供する。
我々の貢献は、新しい(目に見えない)デプロイメント環境におけるエージェントの振る舞いに関する新しい境界の導出である。
公平性や安全性など,いくつかの研究領域において,これらの結果がもたらす意味について論じる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:24:58 GMT)
Leveraging Sparsity for Sample-Efficient Preference Learning: A Theoretical Perspective [16.6] 古典的推定理論において、最小マックス最適推定誤差率$Theta(d/n)$は、特徴空間$d$の次元と線形にスケールするサンプルの個数$n$を要求する。
特徴空間の高次元性と人間の注釈付きデータを収集するコストは、従来の推定手法の効率性に挑戦する。
報酬関数のパラメータが$k$-sparseであるスパースランダムユーティリティモデルでは、ミニマックス最適率は$Theta(k/n log(d/k))に還元できることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:18:22 GMT)
CAND: Cross-Domain Ambiguity Inference for Early Detecting Nuanced Illness Deterioration [16.6] 本稿では,ドメイン固有の知識とドメイン間知識として,遷移関係と重要な記号間の相関を整理する新しい手法であるCANDを紹介する。
実世界のICUデータセットを用いた実験により、CANDはニュアンスドの悪化を検知する既存の手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:20:17 GMT)
InfoChartQA: A Benchmark for Multimodal Question Answering on Infographic Charts [16.5] InfoChartQAは、インフォグラフィックチャートの理解に基づいてマルチモーダル大言語モデル(MLLM)を評価するためのベンチマークである。
5,642組のインフォグラフィックと平易なチャートが含まれており、それぞれが同じ基礎データを共有するが、視覚的な表示では異なる。
視覚的要素に基づく質問を設計し、そのユニークな視覚的デザインとコミュニケーション意図を捉える。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:27:49 GMT)
Revealing the Intrinsic Ethical Vulnerability of Aligned Large Language Models [16.3] プレトレーニング中に埋め込まれた有害な知識は、大きな言語モデルのパラメトリックメモリにおいて、信頼できない「暗黒パターン」として持続することを示す。
本研究ではまず,LLMの本質的な倫理的脆弱性を理論的に解析する。
本研究は,分布変化下での意味的コヒーレンス誘導を用いて実験により検証した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:32:13 GMT)
Predictable Reinforcement Learning Dynamics through Entropy Rate Minimization [16.3] 強化学習(RL)では、エージェントは予測可能な行動を示すインセンティブを持たない。
予測可能性を考慮したRL(predictability-Aware RL)と呼ばれるRLエージェントの予測可能な振る舞いを誘導する新しい手法を提案する。
提案手法は,標準割引報酬と負のエントロピー率の線形結合を最大化することにより,最適性を予測可能性と引き換えに行う。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:57:43 GMT)
UniConFlow: A Unified Constrained Generalization Framework for Certified Motion Planning with Flow Matching Models [16.3] 生成モデルはロボットモーション生成の強力なツールとなり、様々なタスクで柔軟で多モーダルな軌道生成を可能にしている。
本論文では,同一性制約と不等式制約の両方を体系的に組み込んだトラジェクトリ生成のための統一フローマッチングフレームワークUniConFlowを提案する。
我々は移動ナビゲーションと高次元操作タスクを行い、最先端の制約付き生成プランナと比較して安全性と実現可能性の向上を図っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:48:04 GMT)
Guiding Registration with Emergent Similarity from Pre-Trained Diffusion Models [16.2] 自然のRGB画像を生成するために専用に訓練されたオフザシェルフ拡散モデルは、医用画像における意味論的意味のある対応を識別できる。
本稿では,拡散モデルの特徴を類似度尺度として活用して,変形可能な画像登録ネットワークを導くことを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:07:04 GMT)
Where Are We? Evaluating LLM Performance on African Languages [16.2] アフリカにおける豊かな言語遺産は、NLPでは残っていない。
本稿では,アフリカにおける言語景観に関する理論的知見と,サハラ語を用いた経験的評価を統合する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:19:19 GMT)
StarVC: A Unified Auto-Regressive Framework for Joint Text and Speech Generation in Voice Conversion [16.2] 音声変換(VC)は、言語コンテンツを保存しながら、ターゲット話者にマッチするように音声を変更する。
本稿では,まず,音声特徴を合成する前にテキストトークンを予測する自動回帰VCフレームワークであるStarVCを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:00:53 GMT)
HASH-RAG: Bridging Deep Hashing with Retriever for Efficient, Fine Retrieval and Augmented Generation [16.1] Hash-RAGは、ディープハッシュ技術とシステマティック最適化を統合するフレームワークである。
このハッシュベースの効率的な検索フレームワークを基盤として,きめ細かなチャンクの基盤を確立する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:49:46 GMT)
Fast and Multiphase Rates for Nearest Neighbor Classifiers [16.0] トレーニングデータセットのサイズに関する分類誤差率のスケーリングについて検討する。
誤差スケーリング法則がきめ細かなレートを持つことを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:05:41 GMT)
AvatarShield: Visual Reinforcement Learning for Human-Centric Video Forgery Detection [16.0] AvatarShieldは人間中心のフェイクビデオを検出する最初の解釈可能なMLLMベースのフレームワークである。
低コストのテキストアノテーションデータの使用を効果的に回避し、正確な時間的モデリングと偽造検出を可能にする。
また、高レベルの意味的推論と低レベルの成果物増幅を組み合わせたデュアルエンコーダアーキテクチャを設計し、MLLMを効果的な偽造検出に導く。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:59:40 GMT)
Rethinking the effects of data contamination in Code Intelligence [16.0] 本稿では,コードインテリジェンスタスクにおけるきめ細かいデータ汚染について,系統的研究を行った。
本研究は,汚染が必然的に性能過大評価につながるという従来の信念に異議を唱えるものである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:15:44 GMT)
Can Character-based Language Models Improve Downstream Task Performance in Low-Resource and Noisy Language Scenarios? [16.0] 我々は、ナラビジ(NArabizi)と呼ばれるラテン文字の拡張を用いて書かれた北アフリカ方言のアラビア語に焦点を当てている。
ナラビジの99k文のみを学習し,小さな木バンクで微調整したキャラクタベースモデルは,大規模多言語モデルとモノリンガルモデルで事前学習した同じアーキテクチャで得られたものに近い性能を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:11:13 GMT)
Theoretical Foundations of Conformal Prediction [15.9] コンフォーマルな予測と関連する推論技術は、多様なタスクの配列で有用である。
コンフォーマル予測の主な魅力は、正式な有限サンプル保証を提供する能力である。
本書の目的は、共形予測を研究する際に生じる基本的な技術的議論について読者に教えることである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:01:49 GMT)
On the Robustness of Tabular Foundation Models: Test-Time Attacks and In-Context Defenses [15.8] テスト入力に対する小さな構造的摂動は、トレーニングコンテキストが固定されたままであっても、予測精度を著しく低下させることができることを示す。
モデル重みを更新することなく、コンテキストを逆向きのインスタンスに漸進的に置き換える、コンテキスト内逆向きのトレーニング戦略を導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:15:36 GMT)
Hyperband-based Bayesian Optimization for Black-box Prompt Selection [15.8] ブラックボックスのプロンプト選択は、潜在的に大きな検索スペース、勾配情報の欠如、検証セット上のプロンプトの評価コストが高いため、困難である。
本稿では,HbBoPsを提案する。HbBoPsは,マルチファイダリティスケジューラとして,構造を意識したディープカーネルガウスプロセスとハイパーバンドを組み合わせた新しい手法である。
HbBoPsは、パフォーマンスと効率の両方で最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:59:18 GMT)
Reconciling Hessian-Informed Acceleration and Scalar-Only Communication for Efficient Federated Zeroth-Order Fine-Tuning [15.7] HiSo は Hessian-informed zeroth-order Optimization と Scalar-only communication による高速なファインチューニング手法である。
HiSoはコンバージェンス速度と通信効率の両方で既存のZO法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:13:31 GMT)
FlexPainter: Flexible and Multi-View Consistent Texture Generation [15.7] textbfFlexPainterは、柔軟なマルチモーダル条件ガイダンスを可能にする新しいテクスチャ生成パイプラインである。
我々のフレームワークは、柔軟性と生成品質の両方において最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:36:03 GMT)
Towards Computation- and Communication-efficient Computational Pathology [15.7] 我々は Magni-Aligned Global-Local Transformer (MAG-GLTrans) と呼ばれる新しい通信効率のフレームワークを提案する。
提案手法は,高精細化ではなく,低精細化入力を用いた効率的な解析を行うことにより,計算時間,ファイル転送要求,ストレージオーバーヘッドを大幅に削減する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:05:58 GMT)
BadReward: Clean-Label Poisoning of Reward Models in Text-to-Image RLHF [15.7] Reinforcement Learning from Human Feedback (RLHF) は、テキスト・ツー・イメージ(T2I)モデルを人間の好みに合わせるために重要である。
本稿では,少数の嗜好データを自然出現例で有毒化することにより,Hyjacking T2Iモデルの実現可能性を示す。
我々は,マルチモーダルRLHFにおける報酬モデルをターゲットにした,ステルスなクリーンラベル中毒攻撃であるBadRewardを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:01:04 GMT)
Towards Generating Controllable and Solvable Geometry Problem by Leveraging Symbolic Deduction Engine [15.6] 我々は、幾何学的問題生成のための新しいタスクを導入し、新しいパイプライン手法、SDE-GPG(Symbolic Deduction Engine-based Geometry Problem Generation framework)を提案する。
このフレームワークは記号推論エンジンを活用し,(1)知識点から拡張定義への事前定義されたマッピングテーブルの探索,(2)拡張定義のサンプリングとシンボル推論の実行,(3)未知の問題のフィルタリング,(4)テキスト問題と図表の生成,の4つのステップを含む。
具体的には, 自然言語を形式言語に翻訳する際の固有バイアスを回避するために, マッピングテーブルを設計し, 精巧なチェック機能によって, 知識点や難易度の観点から, 生成した問題を制御できることを保証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:49:38 GMT)
KVCache Cache in the Wild: Characterizing and Optimizing KVCache Cache at a Large Cloud Provider [15.5] 大規模言語モデル(LLM)の実現はクラウドプロバイダにとって重要であり、各要求処理後の中間結果(KV$)をキャッシュすることで、スループットとレイテンシが大幅に向上する。
我々は、主要なLLMサービスプロバイダの1つから、KV$ワークロードパターンを初めて体系的に評価した。
本稿では,特にキャッシュ容量の制限により,実世界のトレース下でのサービス性能を向上させる,ワークロード対応のキャッシュ消去ポリシーを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:51:38 GMT)
Flow map matching with stochastic interpolants: A mathematical framework for consistency models [15.5] フローマップマッチングは、基礎となる生成モデルの2時間フローマップを学ぶための原則化されたフレームワークである。
FMMは,高速サンプリングのための既存手法の幅広いクラスを統一し,拡張することを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:03:07 GMT)
DiffVLA: Vision-Language Guided Diffusion Planning for Autonomous Driving [15.5] VLM(Vision-Language Model)による新しいハイブリッドスパース距離拡散政策を提案する。
提案手法は,現実的,反応的な合成シナリオを含む自律的グランドチャレンジ2025において,優れた性能を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:28:31 GMT)
LoRA Training Provably Converges to a Low-Rank Global Minimum or It Fails Loudly (But it Probably Won't Fail) [15.4] 低ランク適応 (LoRA) は、大規模な基礎モデルを微調整するための標準的アプローチとなっている。
また,LoRAトレーニングは,低ランクで大小のグローバル・ミニマライザに収束することを示した。
LoRAトレーニングにおけるゼロ初期化と重み劣化は、低ランクで小さなマグニチュード領域に対して暗黙の偏りを生じさせると論じる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:42:41 GMT)
GPTVQ: The Blessing of Dimensionality for LLM Quantization [15.3] ニューラルネットワーク量子化のサイズと精度のトレードオフは、量子化次元を増大させることで大幅に改善できることを示す。
GPTVQ法は,大規模言語モデル(LLM)によく適応するベクトル量子化(VQ)の高速化手法である。
本手法は,各層ごとの出力再構成MSEのヘシアンからの情報を用いて,残りの未定量重みを更新した1列以上の列の量子化をインターリーブする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:22:07 GMT)
SATA: A Paradigm for LLM Jailbreak via Simple Assistive Task Linkage [15.3] 本稿では,LLMの安全対策を効果的に回避できる新しいジェイルブレイクパラダイムであるSimple Assistive Task (SATA)を提案する。
SATAは、マスク付き言語モデルタスクや位置タスクによる要素検索のような単純な補助タスクを使用して、マスク付きキーワードのセマンティクスを符号化する。
実験の結果、SATAは最先端の性能を達成し、ベースラインを大きなマージンで上回ることがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:59:22 GMT)
It Takes a Good Model to Train a Good Model: Generalized Gaussian Priors for Optimized LLMs [15.3] 大規模言語モデルのトレーニング時間圧縮アルゴリズムであるBackSlashを導入する。
GGモデルに基づくLLM最適化のための統一エンドツーエンドフレームワークを提案する。
私たちの貢献は3倍です。
DeepShapeは、トレーニング後の正規化手法で、体重分布をGGプロファイルにマッチさせる。
RF8は、GG-distributed-priord BackSlashトレーニング用に設計された、コンパクトでハードウェア効率の良い8ビット浮動小数点演算フォーマットである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:38:16 GMT)
Contextual Paralinguistic Data Creation for Multi-Modal Speech-LLM: Data Condensation and Spoken QA Generation [15.2] 現在の音声-LLMは、パラ言語的理解とともに文脈推論における限られた能力を示す。
そこで本研究では,文脈推論とパラ言語情報を統合した,Wild 音声データからデータセットを生成する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:11:48 GMT)
Provable Reinforcement Learning from Human Feedback with an Unknown Link Function [15.0] 本稿では,未知のリンク関数を持つ一般RLHF問題について検討する。
そこで本稿では,ZSPOと呼ばれる新しいポリシー最適化アルゴリズムを提案する。
穏やかな条件下では、ZSPOはポリシーの反復数とイテレーション毎の軌道数に依存する収束率で定常的なポリシーに収束する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:42:39 GMT)
UTCS: Effective Unsupervised Temporal Community Search with Pre-training of Temporal Dynamics and Subgraph Knowledge [15.0] 多くの現実世界のアプリケーションでは、実体間の進化する関係を時間グラフとしてモデル化することができ、それぞれのエッジは相互作用時間を表すタイムスタンプを持つ。
伝統的な手法は一般的に事前に定義された部分グラフ構造を必要とするが、必ずしも事前に知られているわけではない。
時間的ダイナミクスとサブグラフ知識モデルの事前学習を併用したtextbfUncontain textbfTemporal textbfCommunity textbfSearch を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:11:34 GMT)
UniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation [15.0] 我々は、強力な視覚言語モデルと対照的な意味エンコーダによって提供される意味的特徴に基づいて、UniWorldという統合された生成フレームワークを提案する。
BAGELのデータ量は1%に過ぎず,画像編集ベンチマークでは常にBAGELを上回っている。
モデルウェイト、トレーニングと評価スクリプト、データセットなど、当社のモデルを完全にオープンソースにしています。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:59:33 GMT)
HACo-Det: A Study Towards Fine-Grained Machine-Generated Text Detection under Human-AI Coauthoring [14.9] 本稿では,人間-AI共著者によるMGT検出の可能性について検討する。
より微細な検出器は、数値AI比で、共認可されたテキスト検出への経路を舗装することができることを示唆する。
実験結果から, 平均F1スコア0.462において, 計量法は微粒度検出に苦慮していることがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:52:44 GMT)
Aligning Compound AI Systems via System-level DPO [14.8] 私たちは$textbfSysDPO$を紹介します。これは、DPO(Direct Preference Optimization)を拡張して、ジョイントシステムレベルのアライメントを可能にするフレームワークです。
2つのアプリケーションにまたがるアプローチの有効性を実証的に実証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:03:48 GMT)
Prosodic Structure Beyond Lexical Content: A Study of Self-Supervised Learning [14.7] 本研究は自己教師型学習を用いて韻律の音響的相関における構造物の時間的粒度について検討する。
様々な知覚ラベルにまたがる実験は、変化しないピッチ、エネルギー、および音声活動の特徴に対して、強い相対的な利得を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:04:03 GMT)
HAM: A Hyperbolic Step to Regulate Implicit Bias [14.7] 我々は、HAM(Hyperbolic Minimization)がオーバーヘッドステップと新しいハイパーボリックミラーステップとを交互に行うことを示す。
ハムの暗黙の偏見は、厳密なトレーニングでさえ、常にパフォーマンスを高める。
ハムは、様々なスパリフィケーション法と組み合わせて、芸術の状況を改善するのに特に効果的である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:47:16 GMT)
UniSite: The First Cross-Structure Dataset and Learning Framework for End-to-End Ligand Binding Site Detection [14.6] 提案するUniSiteは,設定した予測損失とマッチングによって教師される最初のエンドツーエンドのリガンド結合サイト検出フレームワークである。
また, 平均精度を, リガンド結合サイト予測のためのより正確な評価指標として導入する。
データセットとコードはhttps://github.com/quanlin-wu/unisite.comで公開される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:49:41 GMT)
HunyuanVideo-Avatar: High-Fidelity Audio-Driven Human Animation for Multiple Characters [14.6] HunyuanVideo-Avatarは動的、感情制御可能、マルチキャラクタ対話ビデオを同時に生成できるモデルである。
キャラクタイメージインジェクションモジュールは、従来の追加ベースのキャラクタコンディショニングスキームを置き換えるように設計されている。
AEM(Audio Emotion Module)を導入し、感情参照画像から感情手がかりを抽出し、ターゲット生成ビデオに転送する。
音声駆動型キャラクタを潜在レベルフェイスマスクで分離するために, 顔認識型オーディオアダプタ (FAA) を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:15:31 GMT)
Self-Disentanglement and Re-Composition for Cross-Domain Few-Shot Segmentation [14.6] Cross-Domain Few-Shot (CD-FSS) は、ソースドメインのデータセットから、限られたアノテーションで見えないターゲットドメインのデータセットに知識を転送することを目的としている。
現在の手法では、マスク予測のためのトレーニングとテストサンプルの距離を比較するのが一般的である。
この広く採用されている手法には絡み合いの問題があり、ソースドメインパターンを結合する傾向がある。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:23:20 GMT)
Argus Inspection: Do Multimodal Large Language Models Possess the Eye of Panoptes? [14.4] 本稿では,2段階の難易度を有するマルチモーダルベンチマークであるArgus Inspectionを紹介する。
また、双対パラメトリックなシグモイド計量と指標関数を統合する「アイ・オブ・パノプテス」フレームワークも提示する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:44:14 GMT)
RAGOps: Operating and Managing Retrieval-Augmented Generation Pipelines [14.4] 近年の研究では、企業環境におけるLLM系化合物システムの60%が、何らかの形態の検索増強生成(RAG)を利用していることが示されている。
RAGOpsは、外部データソースの継続的な変更に対処するために、データ管理に重点を置き、LLMOpsを拡張している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:22:23 GMT)
RAG4ITOps: A Supervised Fine-Tunable and Comprehensive RAG Framework for IT Operations and Maintenance [14.3] 検索型拡張生成(RAG)に基づく汎用的・包括的枠組みを提案する。
ステージ1では,2つの負のサンプリング戦略を持つ対照的な学習手法を用いて,埋め込みモデルを微調整する。
ステージ2では、QAシステムの効率的なプロセスがサービスのために構築されます。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:54:12 GMT)
P-TAME: Explain Any Image Classifier with Trained Perturbations [14.3] P-TAME (Perturbation-based Trainable Attention Mechanism for Explanations) は、ディープニューラルネットワーク(DNN)を説明するためのモデルに依存しない手法である。
推論中に単一のフォワードパスで高分解能な説明を生成する。
本稿では,VGG-16,ResNet-50,ViT-B-16の3つの画像分類器について,P-TAMEを用いて検討する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:45:46 GMT)
Adaptive Graph Pruning for Multi-Agent Communication [14.2] 大規模言語モデル(LLM)に基づくマルチエージェントシステムは,様々なタスクにおいて顕著な性能を示した。
本稿では,タスク適応型マルチエージェント協調フレームワークであるAdaptive Graph Pruning (AGP)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:46:00 GMT)
XTRUST: On the Multilingual Trustworthiness of Large Language Models [14.1] 大規模言語モデル(LLM)は、自然言語処理(NLP)タスクにまたがる顕著な機能を示している。
現在AIコミュニティが占めている重要な質問は、これらのモデルの能力と制限に関するものだ。
Xは、最初の総合的な多言語信頼性ベンチマークである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:45:34 GMT)
Why Safeguarded Ships Run Aground? Aligned Large Language Models' Safety Mechanisms Tend to Be Anchored in The Template Region [14.0] テンプレートアンコレッド型安全アライメントは,多種多様な大言語モデル(LLM)にまたがっていることを示す。
我々の力学解析は、推論時ジェイルブレイク攻撃に遭遇した場合、モデルがどのような影響を受けやすいかを示す。
テンプレート領域から安全メカニズムを分離することで,脆弱性の軽減と脱獄攻撃が期待できることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:20:11 GMT)
How to Connect Speech Foundation Models and Large Language Models? What Matters and What Does Not [13.9] 音声テキスト(S2T)タスクでは、新興ソリューションは、音声基礎モデル(SFM)のエンコーダの出力をアダプタモジュールを介して埋め込み空間に投影する。
5つのアダプタモジュール, 2つのLLM(ralMistとLlama), 2つのSFM(WhisperとSeamlessM4T)の組み合わせを2つのS2Tタスク、すなわち自動音声認識と音声翻訳で評価した。
その結果、SFMは下流性能において重要な役割を担い、アダプタの選択は適度な影響があり、SFMとLLMに依存していることがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:28:07 GMT)
Controllable Sequence Editing for Biological and Clinical Trajectories [13.9] 本稿では,即時および遅延効果の条件付き生成のための制御可能なシーケンス編集モデルであるCLEFを紹介する。
CLEFは、条件が将来のシーケンスの進化をどのように、いつ変更するかをエンコードする時間的概念を学習する。
以前のモデルとは異なり、CLEFは任意の将来時間で1ステップの条件生成を可能にし、遅延シーケンス編集において最大65.71%の高速化を実現している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:06:09 GMT)
Cross-Modal Urban Sensing: Evaluating Sound-Vision Alignment Across Street-Level and Aerial Imagery [13.9] そこで我々は,ジオレファレンス・サウンド・レコーディングをストリートレベルとリモートセンシングの両方に統合するマルチモーダル・アプローチを採用した。
埋め込みモデルではセグメンテーションに基づく手法が視覚構造と音響生態学の解釈可能なリンクを提供するのに対し、セグメンテーションベースのモデルは優れたセグメンテーションアライメントを提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:56:37 GMT)
Efficient and Accurate Optimal Transport with Mirror Descent and Conjugate Gradients [13.8] 離散最適輸送(OT)問題を高精度に解くための新しい手法として,ミラーDescent Optimal Transport (MDOT)を提案する。
我々は,GPU並列非線形共役アルゴリズム(PNCG)を用いて,従来のシンクホーンの繰り返しを弱い正規化の下で効率よく解く。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:40:27 GMT)
Reuse or Generate? Accelerating Code Editing via Edit-Oriented Speculative Decoding [13.8] 大規模言語モデル(LLM)は、コード編集において顕著な能力を示し、ソフトウェア開発の生産性を大幅に向上させた。
提案するEfficientEditは,投機的復号化に基づく2つのキー機構により,LLMベースのコード編集効率を向上させる手法である。
実験の結果、EfficientEditは10.38$times$と13.09$times$speedupを標準の自己回帰デコードと比較して達成できることがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:01:20 GMT)
A Continual Offline Reinforcement Learning Benchmark for Navigation Tasks [13.8] ビデオゲームナビゲーションシナリオのスイートを提供するベンチマークを導入する。
アルゴリズムの性能を評価するために、さまざまなタスク、データセット、評価プロトコル、メトリクスのセットを定義します。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:48:20 GMT)
Agnostic Learning under Targeted Poisoning: Optimal Rates and the Role of Randomness [13.8] 以前の研究は、このようなインスタンス標的の毒殺攻撃による最適エラーが$Theta(deta)$とスケールすることを確立した。
最適余剰誤差が $tildeTheta(sqrtdeta)$ であることを示し、Hannekeらによって残された主要な開問題の一つに答える。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:53:20 GMT)
MathMistake Checker: A Comprehensive Demonstration for Step-by-Step Math Problem Mistake Finding by Prompt-Guided LLMs [13.8] そこで本研究では,数理問題におけるステップ・バイ・ステップの誤り発見を自動化する新しいシステムであるMathMistake Checkerを提案する。
本システムは,教育的観点からの学習経験を簡素化し,効率を向上させることを目的としている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:53:01 GMT)
Computational Analysis of Character Development in Holocaust Testimonies [13.6] 本研究は,ナラティブ・タイムラインに沿ってキャラクタ開発を分析するための計算手法を提案する。
ホロコーストの生存者証言の書き起こしをテストケースとみなし、それぞれが一人称の言葉で個人の物語を語る。
我々は、生存者の宗教的軌道に焦点をあて、宗教的信念と実践に対する彼らの配置の進化を考察する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:53:28 GMT)
Smoothed Preference Optimization via ReNoise Inversion for Aligning Diffusion Models with Varied Human Preferences [13.6] 直接選好最適化(DPO)は、テキスト・ツー・イメージ(T2I)生成モデルと、ペアの選好データを用いた人間の選好を一致させる。
本稿では, DPO の目的を改善するために, 好み分布をモデル化する新しい手法である SmPO-Diffusion を提案する。
提案手法は,既存手法における過度な最適化と客観的なミスアライメントの問題を効果的に軽減する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:47:22 GMT)
Ranking Free RAG: Replacing Re-ranking with Selection in RAG for Sensitive Domains [13.6] 本稿では,RAGにおける再ランク付けを合理的な選択手法で置き換える新しい方法であるMETEORAを提案する。
METEORAは、最先端の再評価手法よりも約50%少ないチャンクを使用しながら、生成精度を33.34%向上させる。
敵対的な設定では、METEORAはF1スコアを0.10から0.44に大幅に改善する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:21:21 GMT)
ControlMambaIR: Conditional Controls with State-Space Model for Image Restoration [13.6] 本稿では,画像のデライン化,デブロアリング,およびデノーミング作業における知覚的課題に対処する新しい画像復元手法であるControlMambaIRを提案する。
Mambaネットワークアーキテクチャと拡散モデルを統合することにより、条件ネットワークは洗練された条件制御を実現し、画像生成プロセスの制御と最適化を向上する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:50:00 GMT)
ADFormer: Aggregation Differential Transformer for Passenger Demand Forecasting [13.6] 本稿では,需要予測促進のための新たな洞察を提供する差分集約変換器(AD)を提案する。
空間的相関を利用して注意を喚起する一方で、空間と時間の性質に基づく集約戦略を設計する。
タクシーと自転車で行った実験は,本モデルの有効性と有効性を確認し,その実用的価値を実証した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:55:51 GMT)
Adversarial Robustness of AI-Generated Image Detectors in the Real World [13.5] 現状の最先端分類器は,実環境下での敵例に対して脆弱であることを示す。
ほとんどの攻撃は、例えばソーシャルメディアプラットフォームへのアップロード中に画像が劣化しても有効である。
ケーススタディでは、HIVEに対してブラックボックス攻撃を行うことにより、これらの堅牢性の課題が商用ツールにも見られることを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:40:40 GMT)
From Theory to Practice with RAVEN-UCB: Addressing Non-Stationarity in Multi-Armed Bandits through Variance Adaptation [13.5] RAVEN-UCBは,分散適応による理論リガーと実用効率を組み合わせた新しいアルゴリズムである。
これは UCB1 と UCB-V よりも厳密な後悔境界を達成し、ギャップ依存の残差は$K sigma_max2 log T / Delta$ であり、ギャップ非依存の残差は$sqrtK T log T$ である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:35:04 GMT)
EVA-MILP: Towards Standardized Evaluation of MILP Instance Generation [13.5] 混合整数線形プログラミング(MILP)は、複雑な意思決定問題を解決するための基礎となる。
多様なデータセットに対する機械学習の需要により,MILPインスタンス生成手法の普及が加速し,標準化された評価手法が大幅に向上した。
本稿では,MILPインスタンス生成手法の体系的および客観的評価を目的とした総合ベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:58:54 GMT)
How Breakable Is Privacy: Probing and Resisting Model Inversion Attacks in Collaborative Inference [13.5] 協調推論は、中間機能をクラウドモデルに伝達することでエッジデバイスの計算効率を向上させる。
モデル逆攻撃(MIA)の難しさを評価するための確立された基準はない。
本稿では、CIにおけるMIAの難易度を評価するための最初の理論的基準を提案し、相互情報、エントロピー、有効情報量などを重要な要因として同定する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:32:37 GMT)
A Dataless Reinforcement Learning Approach to Rounding Hyperplane Optimization for Max-Cut [13.4] エージェントが改良された丸みを帯びた超平面を選択し、ゴーマンス・ウィリアムソン(GW)アルゴリズムで生成されたものよりも優れたカットを得られるように学習する、非エポゾディック強化学習の定式化に基づくトレーニングデータフリーアプローチを提案する。
提案手法は, 密度や次数分布の異なる大規模グラフに対して, より優れたカットを一貫して達成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:46:00 GMT)
Simplifying Root Cause Analysis in Kubernetes with StateGraph and LLM [13.3] 我々は根本原因分析のための革新的なツールであるSynergyRCAを紹介する。
SynergyRCAは、空間的および時間的関係をキャプチャするStateGraphを構築する。
約2分間の平均で根本原因を特定でき、約0.90の精度を達成できる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:09:13 GMT)
Culture Matters in Toxic Language Detection in Persian [13.2] ペルシアでは有毒な言語検出が過小評価されている。
本稿では、微調整、データ豊か化、ゼロショット、少数ショット学習など、このタスクのさまざまな方法の比較を行う。
ペルシャ語と文化的に類似した国の言語は、移動学習においてより良い結果をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:48:07 GMT)
V2X-UniPool: Unifying Multimodal Perception and Knowledge Reasoning for Autonomous Driving [13.2] V2X-UniPoolは、マルチモーダルなV2X(Valby-to-Everything)データをタイムインデックスと言語ベースのナレッジプールに統合する統合フレームワークである。
我々のシステムでは,静的環境と動的トラフィックコンテキストの両方に対して,ADが正確かつ時間的に一貫した推論を行うことができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:00:57 GMT)
The Polar Express: Optimal Matrix Sign Methods and Their Application to the Muon Algorithm [13.2] 極性分解は、何十年もの間、数値解析においてよく研究されてきた問題である。
ディープラーニング、特にMuon最適化フレームワークにおいて重要なサブルーチンとして登場した。
極分解を計算するためのGPUフレンドリなアルゴリズムであるPolar Expressを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:46:45 GMT)
Not All Tokens Are Meant to Be Forgotten [13.1] 大規模言語モデル(LLM)は、優れた人間レベルの言語理解、推論、意思決定能力を示す。
LLMは、プライベートや著作権のあるコンテンツなどの望ましくない情報を記憶し、プライバシーや法的懸念を生じさせる傾向がある。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:59:05 GMT)
Rethinking Evaluation Metrics for Grammatical Error Correction: Why Use a Different Evaluation Process than Human? [13.0] 本稿では,人的評価手法と整合してギャップを埋める自動評価指標の集約手法を提案する。
編集ベースのメトリクス、n-gramベースのメトリクス、文レベルのメトリクスなど、さまざまなメトリクスを用いて実験を行った。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:24:47 GMT)
Automated Traffic Incident Response Plans using Generative Artificial Intelligence: Part 1 -- Building the Incident Response Benchmark [12.9] 本稿では、生成人工知能を用いて、入ってくる交通事故に対する応答計画を自動的に生成する新しいインシデント応答ベンチマークを提案する。
提案手法は,特定のインシデント特性に適応した可変メッセージサイン展開,レーン閉鎖,緊急リソース割り当てなど,コンテキストに適したアクションを提案することで,インシデント解決の時間を大幅に短縮することを目的としている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:40:44 GMT)
The Impact of On-Policy Parallelized Data Collection on Deep Reinforcement Learning Networks [12.8] データ収集のための並列アクターは、強化学習アルゴリズムで使用される効果的なテクニックである。
我々は並列アクターを用いた最も人気のあるRLアルゴリズムの1つであるPPO上のトレードオフを実証分析する。
分析の結果,データセットのサイズが大きくなれば,さまざまな設定で最終的なパフォーマンスが向上する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:27:17 GMT)
Are Economists Always More Introverted? Analyzing Consistency in Persona-Assigned LLMs [12.8] 我々は、ペルソナに割り当てられたLarge Language Models(LLM)における一貫性を分析するための新しい標準フレームワークを導入する。
本フレームワークは,複数のタスク次元にまたがる4つのカテゴリ(幸福,職業,人格,政治的スタンス)のペルソナを評価する。
この結果から, 与えられたペルソナ, ステレオタイプ, モデル設計選択など, 一貫性は複数の要因に影響されていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:12:23 GMT)
PARF: An Adaptive Abstraction-Strategy Tuner for Static Analysis [12.8] Parfは静的プログラムアナライザの抽象化戦略を適応的にチューニングするためのツールキットである。
これはCプログラムのオープンソース静的アナライザであるFrama-C/Eva上に実装されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:33:47 GMT)
Beyond Face Swapping: A Diffusion-Based Digital Human Benchmark for Multimodal Deepfake Detection [12.8] 拡散モデルに基づく大規模マルチモーダルデジタルヒューマンフォージェリデータセットであるDigiFakeAVを紹介する。
私たちのデータセットは6万のビデオ(840万フレーム)で構成され、複数の国籍、肌の色、性別、現実世界のシナリオをカバーしています。
ユーザ調査によると、DigiFakeAVの参加者による誤認識率は最大68%に達する。
DigiShieldは、ビデオの3Dセマンティック特徴と音声のセマンティック音響特徴を共同でモデル化することにより、DigiFakeAV上での最先端のSOTA(State-of-thetemporal-art)パフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:51:46 GMT)
A Multi-Agent Framework for Mitigating Dialect Biases in Privacy Policy Question-Answering Systems [12.7] 既存のプライバシポリシー質問回答システムは、英語の方言間でのパフォーマンス格差を示す。
本稿では、方言バイアスを軽減するために、人間中心の設計原則に触発された新しいマルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:32:20 GMT)
FIHA: Autonomous Hallucination Evaluation in Vision-Language Models with Davidson Scene Graphs [12.5] FIHA (Autonomous Fine-grained Hallucination evAluation Evaluation in LVLMs) について紹介する。
FIHAは、LLMフリーでアノテーションフリーな方法で幻覚LVLMにアクセスし、異なる種類の幻覚間の依存性をモデル化することができた。
FIHA-v1 というベンチマークを導入し,MSCOCO と Foggy の様々な画像に対する多様な質問からなる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:39:17 GMT)
Towards Auto-Annotation from Annotation Guidelines: A Benchmark through 3D LiDAR Detection [12.5] AnnoGuideは、専門家定義のアノテーションガイドラインから直接、データアノテーションの自動メソッドを評価することを目的としている。
これは、3Dアノテーションを使わずに、マルチモーダルな小ショット3D検出という新しいタスクである。
この結果から、AnnoGuideは依然としてオープンで困難な問題であり、LiDARベースのFMの開発を急務に必要としていることがうかがえる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:17:37 GMT)
Curvature Tuning: Provable Training-free Model Steering From a Single Parameter [12.5] 曲率チューニング(英: Curvature Tuning)は、モデルの決定境界を変調する解釈可能かつ原則化されたステアリング法である。
我々は,CTがモデル決定境界曲率を順応的に調整し,スムーズな関数空間にモデルを投影することを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:59:08 GMT)
Improved Margin Generalization Bounds for Voting Classifiers [12.3] 我々は、投票者分類のための新しいマージンベースの一般化を確立する。
新たなマージンベース一般化境界は、最適弱強学習者の導出を可能にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:07:30 GMT)
FreeScene: Mixed Graph Diffusion for 3D Scene Synthesis from Free Prompts [12.3] 室内3次元シーン合成の実用化において,制御性は重要な役割を担っている。
室内シーン合成に便利かつ効果的に制御できる,ユーザフレンドリーなフレームワークFreeSceneを提案する。
次に、シーン生成を向上させるために、グラフ認識復調を行う混合グラフ拡散変換器MG-DiTを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:01:41 GMT)
Simulate Any Radar: Attribute-Controllable Radar Simulation via Waveform Parameter Embedding [12.3] SA-Radarは、カスタマイズ可能なレーダー属性に基づいて、制御可能で効率的なレーダーキューブの生成を可能にするレーダーシミュレーションアプローチである。
我々は、波形パラメータを符号化したレーダ属性を条件とした3次元U-NetであるICFAR-Netを設計し、異なるレーダ構成によって引き起こされる信号の変動を捉える。
我々のフレームワークは、新しいセンサ視点と編集シーンのシミュレーションもサポートしており、自動運転アプリケーションのための汎用レーダーデータエンジンとしての可能性を示している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:58:28 GMT)
SemVink: Advancing VLMs' Semantic Understanding of Optical Illusions via Visual Global Thinking [12.2] 視覚言語モデル(VLM)は、セマンティックなタスクでは優れているが、中心となる人間の能力には優れている。
HC-Benchは、隠れテキスト、オブジェクト、イリュージョンを備えた112の画像のベンチマークである。
本稿では,余剰な視覚ノイズを排除し,99%の精度を解放するSemVink(Semantic Visual Thinking)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:33:47 GMT)
Budgeted Online Active Learning with Expert Advice and Episodic Priors [12.2] 本稿では,有限水平データストリームからの予算付きオンラインアクティブラーニングに対して,ラベル付け予算が極端に制限された新しいアプローチを提案する。
提案手法は,既存の専門家予測器の収集と,専門家の叙述的行動知識の収集という,事前情報の2つの重要な源泉を統合する。
専門家によるオンラインアクティブラーニングの研究とは異なり、我々の研究はクエリ予算、有限地平線、エピソード知識を同時に検討している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:48:16 GMT)
Time-R1: Towards Comprehensive Temporal Reasoning in LLMs [12.1] textitTime-R1は,時間的包括的能力を持つ中規模(3B-パラメータ)の大規模言語モデルを実現するフレームワークである。
Time-R1は、最先端の671B DeepSeek-R1を含む200倍以上のモデルで性能が向上している。
この研究は、思慮深く設計されたプログレッシブRL微調整により、より小さく効率的なモデルで時間的性能を向上できるという強い証拠を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:30:14 GMT)
GAdaBoost: An Efficient and Robust AdaBoost Algorithm Based on Granular-Ball Structure [12.1] 本稿では,データグラニュレーション段階とアダプティブ・ブースティング段階からなる新しい2段階のフレームワークであるGAdaBoostを提案する。
まず, 多様性を保ち, ラベルノイズを軽減しつつ, データを圧縮するグラニュラーボール生成法を考案した。
第二に、グラニュラーボールに基づくSAMMEアルゴリズムは、個々のサンプルではなく、グラニュラーボールに焦点を当て、効率を改善し、ノイズに対する感度を低下させる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:10:20 GMT)
Dataset Cartography for Large Language Model Alignment: Mapping and Diagnosing Preference Data [12.1] 人間の嗜好データは、大きな言語モデルと人間の価値の整合において重要な役割を果たす。
本稿では,GPT-4o支援ツールであるアライメントデータマップについて紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:21:36 GMT)
A Foundation Model for Spatial Proteomics [12.0] ファンデーションモデルは、多くのタスクに適応可能な事前訓練されたジェネラリストバックボーンとして機能することで、画像解析を変換し始めている。
ここでは空間イメージングのための基礎モデルであるKRONOSを紹介する。
KRONOSは、175のタンパク質マーカー、16の組織タイプ、8の蛍光ベースのイメージングプラットフォームをカバーする4700万以上の画像パッチを自己監督的に訓練した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:30:25 GMT)
Hopscotch: Discovering and Skipping Redundancies in Language Models [12.0] ホップスコッチ(Hopscotch)は,タスクに最小限のコントリビューションでアテンションブロックを識別・スキップし,出力品質の維持に適応する手法である。
Hopscotchは、4つのアテンションブロックをスキップした後でもパフォーマンスが2%以下に低下する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:43:00 GMT)
Evolving Hard Maximum Cut Instances for Quantum Approximate Optimization Algorithms [11.9] Recursive Quantum Approximate Optimization Algorithm (RQAOA) などの変分量子アルゴリズムが普及している。
本研究では、ユニークなフィットネス機能を備えた進化的アルゴリズムを用いる。
このアプローチは、グラフオートエンコーダの潜在空間内のハード最大カットインスタンスをターゲットにしている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:03:19 GMT)
Toward Understanding Bugs in Vector Database Management Systems [11.9] ベクトルデータベース管理システム(VDBMS)は,多様なデータソースからの高次元埋め込みのセマンティックな類似性検索を容易にする上で,重要な役割を担っている。
従来のデータベース信頼性モデルは、データ表現、クエリ機構、システムアーキテクチャに根本的な違いがあるため、VDBMSに直接適用することはできない。
我々は15のオープンソースVDBMSから1,671件のバグ修正プルリクエストを手動で分析し、症状、根本原因、開発者修正戦略に基づいたバグの包括的な分類法を開発した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:34:01 GMT)
Large Language Model Evaluation via Matrix Nuclear-Norm [11.9] 本稿では,大規模言語モデル(LLM)のデータ圧縮精度を定量化するための指標として,マトリックス核ノルムを紹介する。
さらに、(L_1,2text-norm )を用いて核ノルムを近似することにより、モデルの情報圧縮能力を効果的に評価できる。
マトリックス核ノームは、CEREBRAS-GPTモデルにおいて、サイズが111Mから6.7Bに増加するにつれて、マトリックスエントロピーの8倍から24倍の速度を達成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:07:50 GMT)
Efficient RAW Image Deblurring with Adaptive Frequency Modulation [11.9] RAW画像の劣化は、特に周波数依存のぼかしを扱う際、ユニークな課題を示す。
本稿では、RAW-to-RAWデブロアリング用に設計されたフレームワークである周波数拡張ネットワーク(FrENet)を提案する。
実験により,FrENetはRAW画像の劣化における最先端の劣化手法を超越していることが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:52:22 GMT)
Uncertainty Quantification and Confidence Calibration in Large Language Models: A Survey [11.7] LLM(Large Language Models)は、医療、法律、交通といった高度な分野において、テキスト生成、推論、意思決定に優れる。
不確実性定量化(UQ)は、アウトプットの信頼度を推定することで信頼性を高め、リスク軽減と選択的予測を可能にする。
計算効率と不確実性次元に基づいてUQ手法を分類する新しい分類法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:16:32 GMT)
ChainMarks: Securing DNN Watermark with Cryptographic Chain [11.7] ディープニューラルネットワーク(DNN)モデルは、モデル所有者の知的特性を保護するために使用されている。
近年の研究では、既存の透かし方式は透かし除去やあいまいさ攻撃に弱いことが示されている。
トリガ入力に暗号チェーンを導入することにより,セキュアで堅牢な透かしを生成するChainMarksを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:16:24 GMT)
Tracking the Feature Dynamics in LLM Training: A Mechanistic Study [11.6] SAE-Trackは, 連続したSAEを効率よく取得するための新しい手法である。
本研究は,(2)特徴の意味的進化,(3)特徴形成の基盤過程,(4)特徴の方向性の漂流について論じる。
私たちの研究は、大規模言語モデル(LLM)の機能のダイナミクスに関する新たな洞察を提供し、トレーニングメカニズムと機能進化に対する理解を深めます。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:02:02 GMT)
Contrast & Compress: Learning Lightweight Embeddings for Short Trajectories [11.6] トランスフォーマーエンコーダを応用して, 短い軌道の固定次元埋め込みを学習するための新しいフレームワークを提案する。
コントラスト学習パラダイムにおけるコサインとFFTに基づく類似度指標の影響を分析した。
Argoverse 2データセットに対する実験的な評価は、Cosine類似性目的によって形成された埋め込みが軌道のより優れたクラスタリングをもたらすことを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:53:04 GMT)
Rectified Flows for Fast Multiscale Fluid Flow Modeling [11.6] 時間依存速度場を学習する修正フローフレームワークを提案する。
我々の手法は、各統合ステップをより効果的にし、わずか8ステップで済むようにします。
マルチスケール・フロー・ベンチマーク実験により, 整流流は拡散モデルと同じ後部分布を回復することが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:40:39 GMT)
Fuzzy Speculative Decoding for a Tunable Accuracy-Runtime Tradeoff [11.6] 投機的復号(SD)は、候補トークンを受け入れる際にターゲットモデルに厳密な分布同値を強制する。
本稿では,Fazy Speculative Decoding (FSD)を導入し,ターゲットとドラフトモデルの分布の相違点に基づいて候補トークンを受け付け,SDを一般化するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:08:32 GMT)
Partially Observable Reinforcement Learning with Memory Traces [11.6] 指数移動平均の形で観測の歴史をコンパクトに表現するメモリトレースを導入する。
オフラインのオンライン評価の問題に対して,サンプルの複雑性境界を証明した。
特定の環境では、メモリトレースによる学習の方がはるかに効率が良いことが実証された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:11:07 GMT)
Knowledge Retention for Continual Model-Based Reinforcement Learning [11.6] DRAGOは連続モデルに基づく強化学習のための新しいアプローチである。
DRAGOは、Synthetic Experience RehearsalとRe Get Memories Through Explorationの2つの重要なコンポーネントで構成されている。
実証的な評価は、DRAGOがタスク間の知識を保存でき、様々な連続学習シナリオにおいて優れたパフォーマンスを達成できることを示している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:10:44 GMT)
Attacking Attention of Foundation Models Disrupts Downstream Tasks [11.5] ファンデーションモデルは大規模なモデルであり、多くの下流タスクで高い精度を提供する広範囲なデータに基づいて訓練されている。
基本モデルは敵の攻撃に弱い。
本稿では,CLIP と ViT に着目した視覚基盤モデルの脆弱性について検討する。
タスクに依存しない方法でトランスフォーマーアーキテクチャの構造をターゲットとした,新たな攻撃手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:42:48 GMT)
InterMamba: Efficient Human-Human Interaction Generation with Adaptive Spatio-Temporal Mamba [11.4] そこで本研究では,Mambaフレームワークをベースとした,より効率的なヒューマンインタラクション生成手法を提案する。
提案手法は精度を向上するだけでなく,パラメータの最小サイズ66Mも必要である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:05:06 GMT)
A Mousetrap: Fooling Large Reasoning Models for Jailbreak with Chain of Iterative Chaos [11.3] Large Reasoning Models (LRM) は従来のLarge Language Models (LLM) よりも大幅に進歩している。
LRMを標的とした最初のジェイルブレイク攻撃を提案する。
具体的には、多様な1対1マッピングで攻撃プロンプトを変換する新しいコンポーネントであるChaos Machineを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:35:59 GMT)
A Preference-Driven Methodology for High-Quality Solidity Code Generation [11.1] PrefGenは、人間の好みを超えて標準DPOを拡張して、定量化されたブロックチェーン固有のメトリクスを組み込む新しいフレームワークである。
本稿では,Pass@k(機能的正当性),Compile@k(機能的正当性),Gas@k(ガス効率),Secure@k(セキュリティ評価)の4つの相補的指標を用いた総合的評価手法を紹介する。
PrefGenは、すべての臨界次元で既存のアプローチを大幅に上回り、66.7%のPass@5、58.9%のGas@5、62.5%のSecure@5を達成している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:45:31 GMT)
First-ish Order Methods: Hessian-aware Scalings of Gradient Descent [11.1] 勾配降下の鍵となる制限は、自然スケーリングの欠如である。
曲率を考慮することで、適応的なヘッセン対応スケーリング手法により、局所的な単位ステップサイズが保証される。
我々は,この手法が標準リプシッツ仮定のかなり弱いバージョンの下でグローバルに収束することを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:29:59 GMT)
RACE-Align: Retrieval-Augmented and Chain-of-Thought Enhanced Preference Alignment for Large Language Models [11.1] 本稿では,従来の選好アライメント手法の限界に対処する新しいフレームワークであるRAS-Alignを紹介する。
RACE-Alignは、外部知識サポートと明示的なChain-of-Thought(CoT)推論を組み込んだバイナリ優先データセットを体系的に構築する。
Qwen3-1.7Bをベースモデルとして用いた伝統的な中国医学(TCM)における実験的検証は、RAS-Alignが元のベースモデルよりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:36:38 GMT)
FORLA:Federated Object-centric Representation Learning with Slot Attention [11.0] FORLAは、フェデレートされたオブジェクト指向表現学習と特徴適応のための新しいフレームワークである。
学生は基礎モデルから完全な特徴を再構築することを学び、教師は適応された低次元の特徴を再構築する。
複数の実世界のデータセットの実験では、FOLAがドメイン間でうまく一般化されるコンパクトで普遍的な表現を学習していることが示されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:59:22 GMT)
Unified Attention Modeling for Efficient Free-Viewing and Visual Search via Shared Representations [11.0] 自由視聴と視覚検索が共通の表現を効率的に共有できることを示す。
この転送により、GFLOPの92.29%、トレーニング可能なパラメータの31.23%の計算コストが削減される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:29:11 GMT)
Are Large Language Models Good Temporal Graph Learners? [11.0] 大規模言語モデル(LLM)用に設計された新しい時間グラフ学習フレームワークであるTGTalkerを紹介する。
TGTalkerは、時間グラフの相対バイアスを利用して関連する構造情報を抽出し、LLMの自然言語に変換し、時間近傍を予測のための追加情報として活用する。
5つの実世界のネットワークで、TGTalkerは最先端の時間グラフ手法と競合する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:34:24 GMT)
Elucidating Flow Matching ODE Dynamics with Respect to Data Geometries and Denoisers [10.9] フローマッチング(FM)モデルは、ODEサンプルモデルに基づく拡散モデルを一般的なフレームワークに拡張する。
FMモデルの厳密な理論的解析は、サンプルの品質、安定性、より広範な適用性に不可欠である。
本稿では,サンプル軌道の包括的解析により,FMモデルの理論を推し進める。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:15:58 GMT)
Structural Vibration Monitoring with Diffractive Optical Processors [10.9] 本稿では,浅層ニューラルネットワークに基づくバックエンドと共同最適化された回折層を統合した回折振動モニタリングシステムを提案する。
このアーキテクチャは、高密度センサアレイや広範なデータ取得の必要性を排除している。
従来の光学よりも精度が向上する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:06:04 GMT)
Sample, Predict, then Proceed: Self-Verification Sampling for Tool Use of LLMs [10.9] DyMoは、トレーニング後の関数呼び出しと並行して、状態予測機能を備えた大きな言語モデルを拡張する方法である。
バークレー・コールリング・リーダーボードV2では、DyMoは成功率を改善し、幻覚を著しく減少させる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:20:59 GMT)
Checkpoint Merging via Bayesian Optimization in LLM Pretraining [10.7] 大規模言語モデル(LLM)の事前学習におけるチェックポイントマージを提案する。
提案手法はプレトレーニングの強化能力を示し,最小限のコストで実質的な利益を得る機会を提示する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:01:14 GMT)
Shallow Diffuse: Robust and Invisible Watermarking through Low-Dimensional Subspaces in Diffusion Models [10.7] 拡散モデル出力にロバストで見えない透かしを埋め込む新しい透かし技術であるShallow Diffuseを導入する。
我々の理論的および経験的分析により,浅度拡散はデータ生成の一貫性と透かしの検出可能性を大幅に向上させることが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:07:46 GMT)
SportMamba: Adaptive Non-Linear Multi-Object Tracking with State Space Models for Team Sports [10.7] SportMambaは、動的チームスポーツのトラッキングに特化した適応型ハイブリッドMOT技術である。
提案手法であるSportsMambaは,SportsMOTデータセットにおける各種メトリクスの最先端性能を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:28:41 GMT)
Q-Ponder: A Unified Training Pipeline for Reasoning-based Visual Quality Assessment [10.7] MLLM(Multimodal large language model)は、解釈可能な評価によって視覚的品質を評価する。
冷間開始段階と強化学習に基づく微調整段階からなる統合された2段階訓練枠組みを提案する。
これら2つの段階から派生したモデルをQ-Ponder-CIとQ-Ponderと呼ぶ。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:11:51 GMT)
Gen4D: Synthesizing Humans and Scenes in the Wild [10.7] 我々は,多種多様でフォトリアリスティックな4Dアニメーションを生成するための完全自動化パイプラインであるGen4Dを紹介する。
野球,アイスホッケー,サッカーの3つのスポーツにまたがる大規模な合成データセットであるSportPALを提示する。
Gen4DとSportPALは、Wildの人間中心の視覚タスクに適した合成データセットを構築するためのスケーラブルな基盤を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:04:41 GMT)
Improving Trajectory Stitching with Flow Models [10.7] 生成モデルは、複雑な分布と誘導可能な推論過程をモデル化することへの親和性から、軌道プランナーとして大きな可能性を示してきた。
従来の研究はロボット操作の文脈でこれをうまく応用したが、必要なソリューションがトレーニングセット内の完全な軌道として存在しない場合、性能は良くない。
これは、縫合によって計画できない結果であり、その後、これを改善するのに必要なアーキテクチャとデータセットの選択に対処する。
本稿では,これらの能力の安定と向上を両立させるためのトレーニングおよび推論手順の新たな追加を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:45:05 GMT)
What happens when generative AI models train recursively on each others' generated outputs? [10.6] データによるインタラクションは、おそらくオリジナルのトレーニングデータに欠落した新しい概念にそれらを公開することでモデルに恩恵をもたらすが、共有タスク上でのパフォーマンスを均質化することもできる。
データによるインタラクションは、おそらくオリジナルのトレーニングデータに欠落した新しい概念にそれらを公開することでモデルに恩恵をもたらすが、共有タスク上でのパフォーマンスを均質化することもできる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:34:02 GMT)
FuXi-Ocean: A Global Ocean Forecasting System with Sub-Daily Resolution [10.6] FuXi-Oceanは、渦解像1/12deg空間解像度で6時間の予測を達成した最初のデータ駆動型大洋予報モデルである。
モデルアーキテクチャは、コンテキスト認識機能抽出モジュールと、スタックされた注目ブロックを用いた予測ネットワークを統合する。
FuXi-Oceanは、温度、塩分濃度、電流などの重要な変数を複数の深さにわたって予測する優れた技術を示している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:52:31 GMT)
Investigating Mask-aware Prototype Learning for Tabular Anomaly Detection [10.6] タブラル異常検出は、医学的疾患の特定、金銭的不正検出、侵入監視など、様々な現実世界の応用において重要である。
近年の深層学習に基づく手法は,表現の絡み合いや,異常検出性能を妨げる大域的相関モデリングの欠如に悩まされている。
本稿では,マスクモデルとプロトタイプ学習を導入し,この問題に対処する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:22:44 GMT)
Multi-Metric Adaptive Experimental Design under Fixed Budget with Validation [10.5] オンライン実験における標準A/Bテストは、複数の候補を同時にテストする際の統計的パワー課題に直面している。
本稿では, 最適処理を識別するための適応探索フェーズと, 処理の質と統計の推測を行う検証フェーズという, 2相構造を持つ固定予算多値AEDフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:41:11 GMT)
Probabilistic Factorial Experimental Design for Combinatorial Interventions [10.5] 我々は、科学者が実験を行う方法から定式化された因子的実験設計を導入する。
治療間の境界度相互作用を課す介入モデルにおける最適設計問題に対処する。
以上の結果から,各治療に対する$tfrac12$の投与量は,任意の$k$-way相互作用モデルを推定するための$+O(tfracln(n)n)$まで最適であることが証明された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:15:08 GMT)
MotionRAG-Diff: A Retrieval-Augmented Diffusion Framework for Long-Term Music-to-Dance Generation [10.2] MotionRAG-Diffは、Retrieval-Augmented Generationと拡散に基づく改善を統合するハイブリッドフレームワークである。
我々の手法は3つの中核的な革新をもたらす。
動作品質、多様性、音楽-モーション同期の精度で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:12:48 GMT)
CoT-UQ: Improving Response-wise Uncertainty Quantification in LLMs with Chain-of-Thought [10.2] 大規模言語モデル(LLM)は多くのタスクで優れるが、生成された応答の不確かさを正確に定量化するのに苦労する。
LLMの既存の不確実量化法(UQ)は、応答性よりも応答性の方が早い。
応答型UQフレームワークであるCoT-UQを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:13:58 GMT)
MLaGA: Multimodal Large Language and Graph Assistant [10.0] 大規模言語モデル (LLMs) は, グラフ構造化データ解析の進歩に有効であることを示す。
複雑なグラフ構造やマルチモーダル属性の推論を容易にするため,LLM機能を拡張する革新的なモデルであるMultimodal Large Language and Graph Assistant (MLaGA)を導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:52:00 GMT)
Towards More Effective Fault Detection in LLM-Based Unit Test Generation [9.9] 変異誘導型LLMに基づくテスト生成手法であるMUTGENを提案する。
MUTGENは変異スコアにおいてEvoSuiteとバニラプロンプトベースの戦略の両方を著しく上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:47:22 GMT)
KRISTEVA: Close Reading as a Novel Task for Benchmarking Interpretive Reasoning [9.9] KRISTEVAは、解釈的推論を評価するための最初のクローズドリーディングベンチマークである。
授業データから適応した1331の多重選択質問で構成されている。
以上の結果から,11タスク中10タスクで経験した人間評価士の成績に追随する傾向がみられた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:11:26 GMT)
Iterative Methods for Full-Scale Gaussian Process Approximations for Large Spatial Data [9.9] 実規模近似(FSAs)を用いた確率,勾配,予測分布の計算における計算コストの削減に,反復的手法がいかに有効かを示す。
我々は,新しいプレコンディショナーを導入し,共役勾配法の収束速度を加速し,FSAパラメータに対する感度を緩和することを示す。
我々の実験では、Vecchia近似に対する既存の最先端プリコンディショナーよりも優れています。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:38:15 GMT)
Exact and Linear Convergence for Federated Learning under Arbitrary Client Participation is Attainable [9.9] この作業は、フェデレートラーニング(FL)における根本的な課題に取り組む。
一般的なFedAvgスタイルのアルゴリズムが正確な収束に苦しむことは確実である。
FOCUS, Federated Optimization with Exact Convergence through Push-pull Strategy, a Proprovably convergeent algorithm。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:32:53 GMT)
CausalAbstain: Enhancing Multilingual LLMs with Causal Reasoning for Trustworthy Abstention [9.8] 大規模言語モデル (LLM) はしばしば言語間の知識格差を示す。
textitCausalAbstain は LLM が複数のフィードバック応答を利用するかどうかを判断するのに役立つ手法である。
textitCausalAbstainは有用なフィードバックを効果的に選択し、解釈可能性による禁忌決定を強化する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:58:17 GMT)
Dialz: A Python Toolkit for Steering Vectors [9.7] オープンソースのLCMのためのステアリングベクトルの研究を進めるためのフレームワークであるDialzを紹介する。
Dialz氏はモジュール化とユーザビリティを強調し、迅速なプロトタイピングと詳細な分析を可能にする。
完全なドキュメンテーション、チュートリアル、人気のあるオープンソースモデルのサポートを備えたDialzをリリースしています。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:34:01 GMT)
Trust-Oriented Adaptive Guardrails for Large Language Models [9.7] ガードレールは、有害または有害な応答を抑えることで、大きな言語モデル(LLM)が人間の価値と整合することを保証するように設計されている。
既存のガードレールには、さまざまなユーザグループのニーズを満たすための、十分に確立された方法論が欠如している。
ユーザ信頼度に基づいて,機密コンテンツへの動的アクセスを適度に行うための適応ガードレール機構を導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:06:57 GMT)
Why Shallow Networks Struggle to Approximate and Learn High Frequencies [9.7] 2層ニューラルネットワークは近似と学習の両方において高い周波数を扱うのに苦労していることを示す。
具体的には,以下の基本的な計算問題について考察する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:30:07 GMT)
Structured and Balanced Multi-Component and Multi-Layer Neural Networks [9.7] バランスの取れた多成分多層ニューラルネットワーク(MMNN)構造を提案する。
MMNNは、完全連結ニューラルネットワーク(FCNN)または多層パーセプトロン(MLP)の単純な修正と見なすことができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:46:38 GMT)
DIAMOND: An LLM-Driven Agent for Context-Aware Baseball Highlight Summarization [9.7] 本稿では,コンテキスト認識型野球ハイライト要約エージェントであるDIAMONDを紹介する。
構造化スポーツ分析と自然言語推論を用いて、プレイの重要性を定量化する。
結果から,イベントレベルの要約のためのモジュール型,解釈可能なエージェントベースのフレームワークの可能性を強調した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:10:20 GMT)
Grounded Vision-Language Interpreter for Integrated Task and Motion Planning [9.7] ViLaIn-TAMPは、検証可能、解釈可能、自律的なロボット動作を可能にするためのハイブリッドな計画フレームワークである。
ViLaIn-TAMPは、(1) ViLaIn (Vision-Language Interpreter) - 追加のドメイン固有の訓練なしに、既製のVLMを使用して、マルチモーダル入力を構造化された問題仕様に変換する以前のフレームワーク、(2) モジュール化されたタスク・アンド・モーション・プランニング(TAMP)システム、(2) シンボル的および幾何学的制約推論を通じて、これらの仕様を実行可能なトラジェクティブ・シーケンスに基礎を置く、(3) 動作およびタスク計画コンポーネントからの失敗ソリューションの具体的なフィードバックを受け、適応されたロジックを供給できる修正計画モジュールである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:00:32 GMT)
MTL-KD: Multi-Task Learning Via Knowledge Distillation for Generalizable Neural Vehicle Routing Solver [9.6] 本研究は知識蒸留(MTL-KD)による新しいマルチタスク学習手法を提案する。
提案手法は,複数の異なるRLベースの単一タスクモデルから単一重デコーダモデルへのポリシー知識の転送,ラベルなしトレーニング,多種多様なタスクにおけるモデルの一般化能力の向上を効果的に行う。
最大1000ノードのVRP変異体6種と10種のVRP変異体に対する実験結果から,提案手法が一様および実世界のベンチマークにおいて常に優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:35:36 GMT)
Quake: Adaptive Indexing for Vector Search [9.5] 動的ワークロードにおいて低レイテンシと高リコールを維持する適応インデックスシステムであるQuakeを紹介する。
評価の結果,動的ワークロードでは,クエリレイテンシの1.5~22倍,更新レイテンシの6~83倍を実現している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:37:37 GMT)
A Survey on Employing Large Language Models for Text-to-SQL Tasks [9.5] 本稿では、よく知られたデータセットで評価された手法と様々なモデルについて、全体的な分析を行う。
この分野での課題と今後の方向性について論じる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:40:01 GMT)
InfoSAM: Fine-Tuning the Segment Anything Model from An Information-Theoretic Perspective [9.5] Segment Anything Model (SAM)は、一般的なタスクにおいて印象的なゼロショット機能を示すが、専門領域では苦労している。
本研究では,SAMの蒸留・保存による微調整を促進する情報理論であるInfoSAMを提案する。
多様なベンチマークによる実験では、InfoSAMが現実世界のタスクにおけるSAMファミリーのパフォーマンスを改善する効果を検証している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:01:35 GMT)
DPO Learning with LLMs-Judge Signal for Computer Use Agents [9.5] コンピュータ・ユース・エージェント(CUA)は、グラフィカル・ユーザー・インタフェース(GUI)と自動的に対話してタスクを完了させるシステムである。
ローカルマシン上で完全に動作する軽量な視覚言語モデルを開発した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:27:04 GMT)
CR-BLEA: Contrastive Ranking for Adaptive Resource Allocation in Bilevel Evolutionary Algorithms [9.4] 双レベル最適化は、ネスト構造のため、重要な計算上の課題となる。
本稿では,二段階進化アルゴリズムのための新しい資源配分フレームワークを提案する。
我々のフレームワークは、解の正確性を維持しながら、計算コストを大幅に削減します。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:31:49 GMT)
EyeNavGS: A 6-DoF Navigation Dataset and Record-n-Replay Software for Real-World 3DGS Scenes in VR [9.3] 3D Gaussian Splatting(3DGS)は、仮想現実(VR)における6自由度(6-DoF)ナビゲーションを可能にする、現実世界の3Dシーンを高忠実に再構築する新興メディア表現である。
本論文では,46人の参加者から,12の多様な実世界の3DGSシーンを探索する6-DoFナビゲーションデータセットであるEyeNavGSを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:32:35 GMT)
Think Twice, Act Once: A Co-Evolution Framework of LLM and RL for Large-Scale Decision Making [9.3] Agents Co-Evolution (ACE)は大規模言語モデル(LLM)と強化学習(RL)の相乗的フレームワークである
ACEは、LDMがRLのトレーニング中にポリシーアクターとバリュークリティカルの両方として機能するデュアルロール軌道改善機構を導入している。
動作空間が60Kを超える複数の電力グリッド操作実験を通じて、ACEは既存のRL法よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:52:37 GMT)
How Explanations Leak the Decision Logic: Stealing Graph Neural Networks via Explanation Alignment [9.3] グラフニューラルネットワーク(GNN)は、薬物発見や財務分析などの分野において、グラフ構造化データを解析するための重要なツールとなっている。
説明可能なGNNの最近の進歩は、予測に影響を与える重要な部分グラフを明らかにすることで、このニーズに対処している。
本稿では,そのような説明が,モデル盗難に活用可能な決定論理を漏洩させる可能性について検討する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:11:05 GMT)
ReasoningFlow: Semantic Structure of Complex Reasoning Traces [9.3] ReasoningFlowはトレースを非巡回グラフに解析し、サブグラフ構造として異なる推論パターンを特徴づけることを可能にする。
この人間解釈可能な表現は、LRMの推論プロセスを理解し、評価し、拡張する上で有望な応用を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:11:34 GMT)
How Much Entanglement Is Needed for Topological Codes and Mixed States with Anomalous Symmetry? [9.3] 創発性エノンおよびフェルミオンに必要な絡み合いの定量的評価を行った。
創発性フェルミオンを持つ系では、基底状態部分空間が指数関数的に巨大であるにもかかわらず、GEMがシステムサイズで線形にスケールすることも示している。
我々の分析は、量子異常と絡み合いの興味深い関係を確立している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:59:58 GMT)
High Performance Space Debris Tracking in Complex Skylight Backgrounds with a Large-Scale Dataset [9.3] 高精度なデブリ追跡を実現するために,深層学習に基づく空間デブリ追跡ネットワーク(SDT-Net)を提案する。
SDT-Netはデブリの特徴を効果的に表現し、エンドツーエンドのモデル学習の効率性と安定性を高める。
データセットとコードはまもなくリリースされます。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:30:25 GMT)
Large Stepsizes Accelerate Gradient Descent for Regularized Logistic Regression [9.2] 線形分離可能なデータを用いた$ell$-regularized logistic regressionの段差が一定である勾配降下(GD)について検討した。
これは、単に大きなステップサイズを使用することで、$widetildemathcalO(sqrtkappa)$に加速できることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:21:22 GMT)
Stereotypical gender actions can be extracted from Web text [9.1] 行動の性別バイアスを計算するために,Twitter利用者の性別情報とWebコーパスに基づく代名詞/名前の性別情報を用いている。
そこで本研究では,行動のステレオタイプによるジェンダー予測によって,コモンセンスレポジトリを増強するために,自然なテキストを使用することが可能であると結論付けた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:55:00 GMT)
HateDay: Insights from a Global Hate Speech Dataset Representative of a Day on Twitter [9.1] ソーシャルメディア設定を代表した初のグローバルヘイトスピーチデータセットであるHateDayを紹介する。
本研究では,学術データセットに対する評価が実世界の検出性能を大幅に過大評価していることを示す。
モデル性能の低さは、公的なモデルを自動ヘイトスピーチのモデレーションに不適当にしている、と我々は主張する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:27:21 GMT)
PHISWID: Physics-Inspired Underwater Image Dataset Synthesized from RGB-D Images [9.1] 本稿では,物理にヒントを得た水中画像データセット(PHISWID)を紹介する。
物理にインスパイアされた画像合成による水中画像処理の強化に適したデータセットである。
我々のデータセットは水中画像処理の発展に寄与する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:17:24 GMT)
A Pre-trained Framework for Multilingual Brain Decoding Using Non-invasive Recordings [9.1] 本稿では,多言語,多目的,多モーダルなデコーディングフレームワークを提案する。
様々な脳記録を、事前訓練された多言語モデルによって定義された統一意味空間にマッピングする。
提案するフレームワークは,BCIアプリケーションにおいて,表現不足の言語に不可欠な言語フェアネスを促進することができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:34:22 GMT)
Designing Algorithmic Delegates: The Role of Indistinguishability in Human-AI Handoff [9.0] 人々はAIエージェントにタスクを委譲する傾向が強まっている。
多くの場合、人間の意思決定者は、直面している意思決定問題の特定の事例の特性に基づいて、AIエージェントに委任するかどうかを選択する。
最適なデリゲートは、最適なアルゴリズムエージェントよりも任意に優れたチームメイトであることが示される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:36:20 GMT)
Towards a Japanese Full-duplex Spoken Dialogue System [9.0] 近年,音声対話システムが注目されている。
本稿では,日本語で利用可能なフルステージ音声対話モデルについて紹介する。
本モデルは,日本語における大規模音声対話データに対する事前学習と,高品質なステレオ音声対話データによる微調整の2チャンネルプロセスを通じて訓練される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:16:50 GMT)
StreamBP: Memory-Efficient Exact Backpropagation for Long Sequence Training of LLMs [9.0] 本稿では,StreamBP と呼ばれるメモリ効率の高いバックプロパゲーション手法を提案する。
StreamBPは、シーケンス次元に沿ったチェーンルールを階層的に線形分解する。
勾配チェックポイントと比較して、StreamBPはBPの最大シーケンス長を2.8-5.5倍にスケールアップする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:54:15 GMT)
Rethinking Dynamic Networks and Heterogeneous Computing with Automatic Parallelization [8.9] 現在の並列計画フレームワークは、ノードの不均一性と動的ネットワークトポロジの変化を同時に考慮している。
本研究では,不実現不可能な並列構成を高速に破棄するストラテジ・プルーニング手法を提案する。
予備評価では,本手法が異種ノードのトレーニング性能を向上させることが確認された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:14:17 GMT)
SDE: A Simplified and Disentangled Dependency Encoding Framework for State Space Models in Time Series Forecasting [8.8] 精度予測の基本となる3つの重要な依存関係を特定し,正式に定義する。
SDE(Simplified and Disentangled Dependency entangle)は,時系列予測におけるSSMの能力向上を目的とした新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:51:04 GMT)
Probing LLM Hallucination from Within: Perturbation-Driven Approach via Internal Knowledge [8.8] LLM生成テキストを3つのカテゴリに分類する新しいタスクである幻覚探索を導入する。
本稿では,これらの3種類のテキストをLLMの生成に異なる影響を与えるキーエンティティをインプロンプトで摂動させることを,新たな発見として提案する。
シネは、3つの近代LLMの幻覚探索に有効であり、幻覚検出における最先端の性能を達成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:35:25 GMT)
HIEGNet: A Heterogenous Graph Neural Network Including the Immune Environment in Glomeruli Classification [8.7] 本研究では、ノード、エッジ、およびそれに対応する特徴を識別し、異種グラフを形成するために、従来型および機械学習ベースのコンピュータビジョン技術からなるパイプラインを提案する。
そこで我々は,糸球体と周囲の免疫細胞を一体化した新規な糸球体分類用GNNアーキテクチャHIEGNetを提案する。
我々のHIEGNetは、腎臓移植患者の全スライド画像のデータセットを用いて、訓練され、試験された。実験結果、HIEGNetは、いくつかのベースラインモデルより優れ、全てのベースラインモデルの中で、患者間で最高の結果が得られている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:28:25 GMT)
Exploiting LLMs for Automatic Hypothesis Assessment via a Logit-Based Calibrated Prior [8.6] 統計的な関係が多数あるので、どれが新しく、さらに探究する価値のあるものかを自動で評価できますか?
我々は,モデルの生の出力ロジットを,相関値上のキャリブレーションされた連続的な予測分布に変換する,ロジットに基づくキャリブレーション事前(Calibrated Prior)を提案する。
実世界の変数対2,096のベンチマークで事前評価を行い, 符号精度78.8%, 平均絶対誤差0.26, 95%信頼区間カバレッジ89.2%を達成した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:54:59 GMT)
Empowering Functional Neuroimaging: A Pre-trained Generative Framework for Unified Representation of Neural Signals [8.5] 生成人工知能(AI)を用いた多モード機能型ニューロイメージングのための統一表現フレームワークを提案する。
マルチモーダル機能的ニューロイメージングを統一表現空間にマッピングすることにより、提案フレームワークは、獲得制約されたモダリティや表現不足なグループのためのデータを生成することができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:38:36 GMT)
Score-informed Music Source Separation: Improving Synthetic-to-real Generalization in Classical Music [8.5] 音源分離は、楽器の混合物を構成トラックに分離する作業である。
本稿では,楽譜の分離を支援する2つの方法として,楽譜情報モデルと楽譜情報のみのモデルを提案する。
スコアインフォームドモデルは、ベースラインアプローチと比較して分離結果を改善するが、合成データから実データへの一般化に苦慮する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:43:07 GMT)
A Pretrained Probabilistic Transformer for City-Scale Traffic Volume Prediction [8.4] 都市規模の交通量予測は、インテリジェント交通システムにおいて重要な役割を担っている。
現在のモデルは一般的に都市特有の方法で訓練されており、その一般化を妨げている。
本稿では,トラジェクトリの分散アグリゲーションとしてトラフィックボリュームをモデル化する事前学習型確率変換器であるTrafficPPTを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:07:29 GMT)
T-TAME: Trainable Attention Mechanism for Explaining Convolutional Networks and Vision Transformers [8.3] ニューラルネットワークの"ブラックボックス"の性質は、説明責任が不可欠であるアプリケーションにおいて、採用の障壁となる。
本稿では,T-TAME(Transformer- compatible Trainable Attention Mechanism for Explanations)を提案する。
提案されたアーキテクチャとトレーニング技術は、どんな畳み込みやビジョントランスフォーマーのようなニューラルネットワークにも容易に適用できる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:54:01 GMT)
DyTact: Capturing Dynamic Contacts in Hand-Object Manipulation [8.3] DyTactは手動操作における動的接触を正確にキャプチャするためのマーカーレスキャプチャ法である。
テンプレートモデルの帰納バイアスを利用して最適化を安定化し、加速する。
最先端のダイナミックコンタクト推定精度を実現し、新規なビュー合成品質を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:36:32 GMT)
Zero-Shot Time Series Forecasting with Covariates via In-Context Learning [8.2] 文脈内学習による共変量を利用したゼロショット予測モデルであるCOSMICを導入する。
データ不足の課題に対処するため,Informative Covariate Augmentationを提案する。
COSMICはゼロショット予測において最先端の性能を達成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:56:48 GMT)
T-FAKE: Synthesizing Thermal Images for Facial Landmarking [8.2] 疎密で密集したランドマークを持つ大規模合成熱データセットであるT-FAKEデータセットを紹介した。
本稿では,RGB面を熱的スタイルにドメイン適応的に移動可能な新しいRGB2熱損失関数を提案する。
我々のモデルは、スパース70点のランドマークと密度478点のランドマークアノテーションの両方で優れた性能を示している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:40:23 GMT)
Multi-Spectral Gaussian Splatting with Neural Color Representation [8.2] マルチスペクトル3次元ガウス散乱フレームワークであるMS-Splattingを提案する。
本手法では, クロスモーダルカメラキャリブレーションは不要である。
熱や近赤外線などの様々なスペクトルをモデル化できるほど多用途である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:36:50 GMT)
LEVIS: Large Exact Verifiable Input Spaces for Neural Networks [8.2] ニューラルネットワークの堅牢性は、効果的なモデル選択、評価、信頼性の高い制御戦略の開発に不可欠である。
既存の検証手法の多くは、逆空間が存在しないという仮定の下で重要な入力空間を評価する。
本稿では、**LEVIS-alpha*と**LEVIS-beta*からなる新しいフレームワーク**LEVIS*を提案する。
我々の貢献には、最も近い対向点と向きの対向点を計算するための検証混合整数(MIP)、(2)相補性制約(CC)最適化と拡張性のためのMIP定式化を統合し、最大6倍の削減を達成することが含まれる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:22:14 GMT)
Multi-Hop Question Generation via Dual-Perspective Keyword Guidance [8.2] マルチホップ質問生成(MQG)は、文書から複数の情報スニペットを合成して目的の回答を導き出す必要がある質問を生成することを目的としている。
主な課題は、質問応答(QA)ペアに関連する重要な情報スニペットを効果的に特定することである。
本稿では,キーワードをマルチホップ質問生成プロセスにシームレスに統合するDual-Perspective Keyword-Guidedフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:20:21 GMT)
Large language models for crowd decision making based on prompt design strategies using ChatGPT: models, analysis and challenges [8.1] クラウド意思決定(Crowd Decision Making、CDM)は、平易なテキストから意見や判断を推測できる方法論である。
大規模言語モデル(LLM)は、書かれたテキストを自動的に理解する新しいシナリオを探求するのに役立ちます。
本稿では、CDMプロセスにおける意見の抽出と意思決定を支援するための設計戦略に基づくChatGPTの使用について分析する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:12:11 GMT)
Adversarial Policy Optimization for Offline Preference-based Reinforcement Learning [8.1] オフライン優先型強化学習(PbRL)のための効率的なアルゴリズムを提案する。
APPOは、明示的な信頼セットに頼ることなく、サンプルの複雑性境界を保証する。
我々の知る限り、APPOは統計的効率と実用性の両方を提供する最初のオフラインPbRLアルゴリズムである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:29:34 GMT)
Torch-Choice: A PyTorch Package for Large-Scale Choice Modeling with Python [8.1] $texttttorch-choice$はPythonとPyTorchを使ったフレキシブルで高速な選択モデリングのためのオープンソースライブラリである。
$textttChoiceDataset$は、データベースを柔軟かつメモリ効率よく管理するための、$textttChoiceDataset$データ構造を提供します。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:38:14 GMT)
Detecting Dataset Bias in Medical AI: A Generalized and Modality-Agnostic Auditing Framework [8.0] データセットに対する一般属性ユーティリティと検出可能性によるバイアステスト(G-AUDIT)は、モダリティに依存しないデータセット監査フレームワークである。
本手法は,患者属性を含むデータ特性とタスクレベルのアノテーションの関係について検討する。
G-AUDITは、従来の定性的手法で見過ごされる微妙な偏見をうまく識別する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:18:36 GMT)
Numerical instability of non-Hermitian Hamiltonian evolutions [8.0] 対角化および非エルミート進化における数値不安定性に起因する物理結果の不正確性について検討する。
これらの不安定性は、NHSEによるシステムサイズと指数関数的にスケールする大きな条件数から生じる。
厳密には、信頼できるスペクトルだけでは正確な非エルミート進化には不十分であることが示され、一方で波動関数の信頼性はより重要な役割を果たす。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:57:33 GMT)
Armijo Line-search Can Make (Stochastic) Gradient Descent Provably Faster [8.0] アルミホ線探索(Armijo-LS)は、勾配降下(GD)のステップサイズを設定する標準的な方法である。
目的関数がある非一様条件を満たすと、GD-LSはGD (1/L) よりも高速になることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:29:26 GMT)
Average Certified Radius is a Poor Metric for Randomized Smoothing [8.0] 我々は、ランダム化平滑化(RS)によって提供されるロバスト性保証を評価するための平均認定半径(ACR)が貧弱であることを示す。
本稿では,厳密なサンプルを明示的に取り除いたり,近似された半径でデータセットを再編集したり,簡単なサンプルを極端に最適化したりして,RSトレーニングの進捗を再現する戦略を提案する。
以上の結果から,ACRはこの分野に強い望ましくないバイアスをもたらしており,RSではその適用を中止すべきであることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:57:28 GMT)
MUC-G4: Minimal Unsat Core-Guided Incremental Verification for Deep Neural Network Compression [8.0] MUC-G4は、圧縮されたディープニューラルネットワークのインクリメンタル検証のための新しいフレームワークである。
オリジナルのネットワークと圧縮されたネットワークをSMTの公式にエンコードし、変更を分類し、オリジナルのネットワークからEmphMinimal Unsat Cores(MUC)を使用して、圧縮されたネットワークの効率的な検証を導く。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:42:15 GMT)
LinkTo-Anime: A 2D Animation Optical Flow Dataset from 3D Model Rendering [7.9] LinkTo-Animeは、3Dモデルレンダリングで生成されたセルアニメキャラクターモーション用に特別に設計された最初の高品質データセットである。
データセットは395のビデオシーケンス、24,230のトレーニングフレーム、720の検証フレーム、4,320のテストフレームで構成されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:50:20 GMT)
PixelCAM: Pixel Class Activation Mapping for Histology Image Classification and ROI Localization [7.9] 弱教師付きオブジェクトローカライゼーション(WSOL)メソッドは、トレーニングモデルで画像の分類とROIのローカライズを可能にする。
単段階法では, 組織像の視力低下により, 視力低下や過剰な活動が容易に引き起こされる。
2段階のアプローチは、凍結した分類器に制約され、ローカライゼーションのキャパシティが制限されるため、準最適である。
本稿では,非同期収束問題に対処する両タスクの同時学習のためのWSOLのマルチタスク手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:34:02 GMT)
CIVIL: Causal and Intuitive Visual Imitation Learning [7.8] CIVILと呼ばれる視覚模倣学習のための新しい手法を提案する。
我々は,タスク関連機能を示すために,マーカーと言語プロンプトを使用する。
我々のシミュレーション、実世界の実験、そしてユーザースタディは、CIVILで訓練されたロボットが人間のデモを減らし、最先端のベースラインよりも優れたパフォーマンスを発揮できることを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:05:00 GMT)
FailureSensorIQ: A Multi-Choice QA Dataset for Understanding Sensor Relationships and Failure Modes [7.8] 本稿では,MCQA(Multi-Choice Question-Answering)ベンチマークシステムであるFailureSensorIQを紹介する。
従来のQAベンチマークとは異なり、本システムは障害モード、センサデータ、および各種産業資産間の関連性を通しての推論の複数の側面に焦点を当てている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:05:10 GMT)
DeepSPV: A Deep Learning Pipeline for 3D Spleen Volume Estimation from 2D Ultrasound Images [7.7] 脾腫は、疾患細胞病(SCD)などの様々な関連疾患に対する重要な臨床指標である
本研究では,1次元または2次元の超音波画像からスプレエン体積を正確に推定する深層学習パイプラインであるDeepSPVを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:33:29 GMT)
Overcoming Data Scarcity in Multi-Dialectal Arabic ASR via Whisper Fine-Tuning [7.7] 5つの主要なアラビア語方言に対する微調整OpenAIのWhisperの効果について検討する。
少量のMSA微調整データにより,より小さなモデルに対して大幅な改善が得られた。
方言プーリングされたモデルは、方言固有のモデルと同等に機能する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:41:49 GMT)
On the Necessity of Multi-Domain Explanation: An Uncertainty Principle Approach for Deep Time Series Models [7.7] 時系列モデルを説明するための一般的なアプローチは、時間領域における属性を生成することである。
本稿では,XAI手法が時間領域と周波数領域における特徴を根本的に強調する属性を生成できることを示す。
これは、両方のドメインの属性がより包括的な解釈を達成するために提示されるべきであることを示している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:00:28 GMT)
FedRecon: Missing Modality Reconstruction in Heterogeneous Distributed Environments [7.6] FedReconは,マルチモーダル学習におけるモダリティ再構築と非IID適応を同時に行うことを目的とした,最初の手法である。
提案手法は,まず軽量なマルチモーダル変分オートエンコーダ(MVAE)を用いて,欠落したモダリティを再構成する。
非IID変動を緩和する大惨な忘れ込みを防止するために,グローバルジェネレータの凍結を利用した戦略を導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:53:49 GMT)
Unmasking Database Vulnerabilities: Zero-Knowledge Schema Inference Attacks in Text-to-SQL Systems [7.6] 本稿では,データベースの事前知識を必要とせずに,テキストから生成モデルへの基盤となるデータベーススキーマを再構築するための新しいゼロ知識フレームワークを提案する。
F1スコアは生成モデルで最大.99、微調整モデルで最大.78であり、スキーマリークリスクの深刻さを裏付ける。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:10:16 GMT)
Answer Convergence as a Signal for Early Stopping in Reasoning [7.6] 大型言語モデル(LLM)における思考の連鎖(CoT)の促進
提案手法は,(1)応答整合性による早期停止,(2)終末信号発生確率の向上,(3)内部アクティベーションに基づいていつ停止するかを学習する教師付き手法である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:20:54 GMT)
A Comparative Study of Scanpath Models in Graph-Based Visualization [7.6] アイトラッキング(ET)データは、コスト、プライバシ、スケーラビリティに関する課題を提示する。
本研究では,40名の参加者を対象に,グラフ解析を行ったET実験を行った。
我々は,DeepGaze,UMSS,Gazeformerなどのモデルで生成したヒトスキャンパスと合成パスを比較した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:02:53 GMT)
Self-attention U-Net decoder for toric codes [7.6] 量子誤り訂正符号の適用には、スケーラブルな効率的なデコーダが最も望ましい。
本研究では,トーリックコードに対する自己注意型U-Net量子デコーダ(SU-NetQD)を提案する。
MWPMと比較して低い論理誤差率を達成し,ノイズバイアスの増加に伴ってコードしきい値の増大傾向を見出した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:50:47 GMT)
Noise-Robustness Through Noise: Asymmetric LoRA Adaption with Poisoning Expert [7.5] ダウンストリームタスクに事前訓練された言語モデルを適用するための現在の微調整手法は、ノイズの多いデータからの干渉に影響を受けやすい。
非対称なロラ中毒専門家(LoPE)によるノイズロバスト適応手法を提案する。
LoPEは、低コストのノイズ注入によって、パフォーマンスとロバスト性を純粋に達成し、データクリーニングの必要性を完全に排除する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:40:44 GMT)
Deep Learning Enhanced Multivariate GARCH [7.5] Long Short-Term Memory enhanced BEKK (LSTM-BEKK) は、ディープラーニングを多変量GARCHプロセスに統合する。
本手法は,財務リターンデータにおける非線形,動的,高次元の依存構造をよりよく捉えるために設計されている。
複数の株式市場における実証的な結果は、LSTM-BEKKモデルがポートフォリオ外リスク予測において優れたパフォーマンスを達成することを確認している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:22:57 GMT)
Self-supervised Learning of Event-guided Video Frame Interpolation for Rolling Shutter Frames [7.4] イベントカメラは時間分解能が高い。
RS歪みを伴わないグローバルシャッター(GS)高フレームレートビデオの再生フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:47:29 GMT)
A Novel Benchmark for Few-Shot Semantic Segmentation in the Era of Foundation Models [7.4] Few-shot semantic segmentation (FSS) はコンピュータビジョンにおいて重要な課題である。
一般化的特徴抽出器としての視覚基盤モデル(VFM)の出現に伴い,これらのモデルをFSSに適用することを模索する。
本稿では,このタスクに適した単純で簡単な適応プロセスを備えた,新しい現実的なベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:11:28 GMT)
Maximizing the Promptness of Metaverse Systems using Edge Computing by Deep Reinforcement Learning [7.4] 本稿では,メタバースシステムに基づくDigital Twinを支援するために,深層強化学習(DRL)の利点を紹介する。
本システムでは,実世界からデータを収集して仮想世界へ転送するMetaverse Userデバイスがいくつか含まれていると仮定する。
提案するDRLアルゴリズムは,動的環境におけるDTの迅速性を確保するためにタスクのオフロードに適したアルゴリズムである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:10:31 GMT)
Sample-efficient Learning of Concepts with Theoretical Guarantees: from Data to Concepts without Interventions [7.4] 概念ボトルネックモデル(CBM)は、高次元データから解釈可能な概念を学ぶことでこれらの課題に対処する。
本稿では,学習概念の正しさと必要なラベル数に関する理論的保証を提供する枠組みについて述べる。
合成および画像のベンチマークにおいて、我々のフレームワークを評価し、学習された概念が不純物が少なく、しばしば他のCBMよりも正確であることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:11:40 GMT)
MaXIFE: Multilingual and Cross-lingual Instruction Following Evaluation [7.3] MaXIFEは、23言語にわたる命令追従能力を評価するために設計された総合的な評価ベンチマークである。
多言語命令追従評価のための標準化されたツールを提供することで、MaXIFEは自然言語処理の研究と開発を進めることを目指している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:53:48 GMT)
Approximate Borderline Sampling using Granular-Ball for Classification Tasks [7.3] 近年, グラニュラーボール (GB) に基づくサンプリング手法は, 一般性や雑音の分類タスクにおいて有望な性能を示した。
本稿では,GB を用いた近似境界線サンプリング手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:04:27 GMT)
RoadFormer : Local-Global Feature Fusion for Road Surface Classification in Autonomous Driving [7.3] 路面タイプ(RSC)の分類は, 路面の粗さ, 湿潤, 乾燥条件, 材料情報を明らかにするために, 舗装の特徴を活用することを目的としている。
自動運転では、正確なRCCにより、車両は道路環境をよりよく理解し、運転戦略を調整し、安全で効率的な運転体験を確保することができる。
本稿では,局所的かつグローバルな特徴情報を,畳み込みモジュールと変圧器モジュールの積み重ねを通じて融合する,自律運転シナリオのための視覚ベースきめ細かなRCC法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:23:19 GMT)
QKV Projections Require a Fraction of Their Memory [7.3] 本稿では,注意層におけるQ,K,V$プロジェクションのメモリ消費を最大512ドルまで削減するテンソル圧縮手法を提案する。
PAMMはFlashAttentionのような効率的な注意手法で完全に構成可能であり、メモリ効率のLLMトレーニングのための実用的で補完的な方法である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:37:17 GMT)
Heterogeneous Secure Transmissions in IRS-Assisted NOMA Communications: CO-GNN Approach [7.2] IRS支援のNOMA通信は、大きな研究関心を集めている。
IRSの受動的性質は、認証とセキュリティプロトコルが欠如しているため、これらのシステムは外部の盗聴に対して脆弱である。
本稿では、無線ネットワークにおける異種資源構成を有するIRS支援NOMAシステムにおけるセキュアな送信について検討し、外部と内部の両方の盗聴を緩和する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:01:50 GMT)
IP-Dialog: Evaluating Implicit Personalization in Dialogue Systems with Synthetic Data [7.1] 現代の対話システムでは,会話の背景を暗黙的に推測する能力が不可欠である。
従来のデータセット構築手法は、労働集約的で、リソース需要があり、プライバシーの懸念が高まる。
本稿では,自動合成データ生成のための新しい手法を提案し,Implicit Personalized Dialogueベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:14:11 GMT)
Knowledge Graph Completion by Intermediate Variables Regularization [7.1] 分解ベース(TDB)モデルは知識グラフ補完(KGC)において強い性能を示した
既存の正規化手法は、モデルを正規化するための埋め込みのノルムを最小化するだけで、最適以下の性能をもたらす。
本稿では,この制限に対処する新しいTDBモデルの正規化手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:11:33 GMT)
A Differential Perspective on Distributional Reinforcement Learning [7.0] エージェントが時間段階当たりの報酬を最適化することを目的として,分布強化学習を平均逆設定に拡張する。
特に、Quantileベースのアプローチを用いて、ステップごとの報酬分布の長期学習および/または最適化を成功させるアルゴリズムの最初のセットを開発する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:26:25 GMT)
Benchmarking and Advancing Large Language Models for Local Life Services [7.0] 大規模言語モデル(LLM)は目覚ましい能力を示し、様々な領域で大きなブレークスルーを遂げている。
本研究は,地域生活サービスに関わる幅広い課題にまたがる多様なLCMの性能を体系的に評価する。
その結果,比較的コンパクトな7Bモデルであっても,72Bモデルに匹敵する性能が得られることがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:18:19 GMT)
An Effective Approach to Embedding Source Code by Combining Large Language and Sentence Embedding Models [7.0] 本稿では,大言語と文埋め込みモデルを組み合わせた新しいソースコード埋め込み手法を提案する。
提案手法の性能を評価するため,異なるプログラミング言語を用いた3つのデータセットについて一連の実験を行った。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:41:08 GMT)
3D Trajectory Reconstruction of Moving Points Based on Asynchronous Cameras [6.9] 移動目標の局所化は、その運動特性と動特性を分析するために重要である。
本稿では,非同期カメラを用いた3次元軌道再構成手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:19:45 GMT)
Weak Supervision for Real World Graphs [6.8] 弱教師付きグラフコントラスト学習フレームワークであるWSNETを提案する。
WSNETは、F1スコアの最大15%まで、対照的でノイズの多いラベル学習手法の状態を一貫して上回ります。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:16:18 GMT)
Online Learning for Function Placement in Serverless Computing [6.8] コストの最小化を目的とした仮想関数の配置について検討する。
マルチアームバンディットに基づくアイデアを用いた新しいアルゴリズムを提案する。
数値実験により,提案アルゴリズムは実用的な性能と控えめな計算複雑性を両立することを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:52:47 GMT)
Why do AI agents communicate in human language? [6.8] 大規模言語モデル(LLM)は、現代のAIエージェントシステムの基礎となっている。
ほとんどの既存のシステムでは、エージェント間通信は主に自然言語に依存している。
この設計はエージェントとエージェントの協調に基本的な制限をもたらすと我々は主張する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:53:29 GMT)
Generalized Category Discovery via Reciprocal Learning and Class-Wise Distribution Regularization [6.7] Generalized Category Discovery (GCD) は、ラベル付きサンプルからベース知識を活用することでラベルなしサンプルを識別することを目的としている。
最近のパラメトリックベースの手法は、信頼できない自己超越による下限のベース差別に悩まされている。
本稿では,ベース分類を専門とする補助的分岐を導入した相互学習フレームワーク(RLF)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:12:39 GMT)
DGMO: Training-Free Audio Source Separation through Diffusion-Guided Mask Optimization [6.7] 言語クエリされたオーディオソース分離(LASS)は、自然言語クエリによるオープン語彙の分離を可能にする。
ゼロショットLASSにおける生成前処理を利用した学習自由フレームワークを提案する。
提案手法は,ソース分離のための事前学習拡散モデルを効果的に再利用し,タスク固有の監督なしに競争性能を達成する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:24:57 GMT)
SNIFR : Boosting Fine-Grained Child Harmful Content Detection Through Audio-Visual Alignment with Cascaded Cross-Transformer [6.6] 悪意のあるユーザは、最小限のフレームに安全でないコンテンツを埋め込んでモデレーションシステムを利用する。
本研究では,子どもに有害なコンテンツの検出を視覚的に行うためのオーディオキューを組み込み,効果的なアライメントのための新しいフレームワークであるSNIFRを導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:37:23 GMT)
Nested Expectations with Kernel Quadrature [6.5] ネストされたモンテカルロやマルチレベルモンテカルロのような既存のアルゴリズムは一貫性があることが知られているが、内部レベルと外部レベルの両方で多くのサンプルを必要とする。
ネストしたカーネルの2次推定器からなる新しい推定器を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:30:50 GMT)
Impact of a Deployed LLM Survey Creation Tool through the IS Success Model [6.5] 本稿では,調査品質を維持しつつ,データ収集を高速化するLLMシステムの実現について述べる。
DeLone と McLean IS Success Model を用いてシステム評価を行い、生成AIがコア IS メソッドをどのように作り直すかを理解する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:36:36 GMT)
Should LLM Safety Be More Than Refusing Harmful Instructions? [6.5] 本稿では,Large Language Models (LLM) の長文分散(暗号化)テキストに対する振る舞いを体系的に評価する。
LLMの安全性を評価するための2次元フレームワークを提案する。
暗号を復号する能力を持つモデルは、不正な一般化攻撃の影響を受けやすいことを実証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:00:12 GMT)
Mind the Gap: A Practical Attack on GGUF Quantization [6.5] 本稿では,学習後量子化手法のGGUFファミリーに対する最初の攻撃について紹介する。
我々は、量子化誤差に基づいて重みを拘束しながら、ターゲットの悪意あるLSMを訓練する攻撃を開発する。
我々の攻撃は、最も広く使われている訓練後の量子化法が、敵の干渉の影響を受けやすいことを強調している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:21:57 GMT)
VidEvent: A Large Dataset for Understanding Dynamic Evolution of Events in Videos [6.4] 本稿では,これらのスクリプトをビデオから抽出し,予測する映像イベント理解タスクを提案する。
このタスクをサポートするために,23,000以上の良好なラベル付きイベントを含む大規模データセットであるVidEventを紹介した。
データセットは、厳密なアノテーションプロセスを通じて作成され、高品質で信頼性の高いイベントデータを保証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:12:48 GMT)
IndoSafety: Culturally Grounded Safety for LLMs in Indonesian Languages [6.4] IndoSafetyは、インドネシアの文脈に合わせた、最初の高品質で人間認証された安全評価データセットである。
IndoSafetyは、インドネシアの社会文化的文脈を捉えた分類を開発するために、事前の安全枠組みを拡張して構築されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:53:55 GMT)
Linear Representation Transferability Hypothesis: Leveraging Small Models to Steer Large Models [6.4] 同一データ上で訓練されたモデル間で学習された表現は、基本特徴の近辺集合の線形結合として表現できることを示す。
これらの基本機能は、学習タスク自体を基盤とし、スケールに関係なく、モデル間で一貫性を維持します。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:52:06 GMT)
Sample complexity of Schrödinger potential estimation [6.4] 本研究では,経験的KL(Kulback-Leibler)リスク最小化器の対数ポテンシャルクラスに対する能力一般化について検討する。
サンプルサイズ$n$が無限大になる場合、過剰なKLリスクは$O(log2 n / n)$に減少する可能性がある。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:26:03 GMT)
On the Need to Align Intent and Implementation in Uncertainty Quantification for Machine Learning [6.4] 機械学習(ML)モデルの不確実性を定量化することは、現代のデータ分析における基礎的な課題である。
本稿では,これらの不整合を識別し,異なるコンテキストが異なる要求を課すかを明らかにすることによって,これらの課題の深さを明らかにすることを目的とする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:19:59 GMT)
Free-text Rationale Generation under Readability Level Control [6.3] 我々は,可読性レベル制御の影響下で,大規模言語モデル (LLM) が合理的生成をいかに行うかを検討する。
その結果,可読性レベルの違いは定義された複雑性スコアと完全に一致しないものの,説明はそのような命令に適応できることが判明した。
我々のアノテータは、すべての可読性レベルにおける理性に対する概ね満足のいく印象を確認します。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:37:12 GMT)
Quantum Data Centers: Why Entanglement Changes Everything [6.3] 量子インターネットは、複数の量子プロセッサを仮想量子計算システムに相互接続することで、分散量子コンピューティングの鍵となる。
ネットワークトポロジの動的再構成におけるエンタングルメントオーケストレータの役割を強調し,量子データセンターの物理的制約とトポロジ的制約を分析した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:22:55 GMT)
AUTOCIRCUIT-RL: Reinforcement Learning-Driven LLM for Automated Circuit Topology Generation [6.3] AUTOCIRCUIT-RLは、アナログ回路の自動合成のための新しい強化学習ベースのフレームワークである。
有効回路は12%増加し、最高のベースラインに比べて効率が14%向上する。
トレーニングデータに制限のある有効な回路で60%以上の成功を達成し、強力な一般化を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:54:30 GMT)
On the Acquisition of Shared Grammatical Representations in Bilingual Language Models [6.3] 言語間移動は、現代言語モデルの多言語能力にとって重要であるが、どのように起こるかはよく理解されていない。
第二言語でトレーニングを始めると、モノリンガル言語モデルに何が起こるのかを尋ねる。
共有多言語表現の証拠を見つけるために,人間の文法表現を研究するために用いられる構造プライミングに目を向ける。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:00:04 GMT)
Univariate to Multivariate: LLMs as Zero-Shot Predictors for Time-Series Forecasting [6.1] 時系列予測や予測は多くの実世界の動的システムにおいて重要である。
近年,この課題にLarge Language Models (LLM) を用いることが提案されている。
時系列列をテキストに変換してLLMに送ってゼロショット予測を行うことにより,LLMに基づく時系列予測を向上するLLMPredを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:02:47 GMT)
A Novel Deep Reinforcement Learning Method for Computation Offloading in Multi-User Mobile Edge Computing with Decentralization [6.1] モバイルエッジコンピューティング(MEC)は、計算能力に制限のある計算集約的なタスクの可能性がある近隣のMECサーバに、アプライアンスによってワークロードをオフロードすることを可能にする。
本稿では,MECシステムにおいて深部強化学習(DRL)アルゴリズムを用いて,分散化された動的計算オフロード戦略を提案する。
そこで我々は,Twin Delayed DDPGアルゴリズムに基づくこの問題に対する新しいアプローチを提案し,この傾向を克服し,モバイルユーザがポータブルであるケースを調査する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:22:02 GMT)
GANORM: Lifespan Normative Modeling of EEG Network Topology based on Multinational Cross-Spectra [6.1] 本研究の目的は,脳波ネットワークトポロジの観点から規範的モデリングを行うことである。
周波数依存型頭皮脳波機能ネットワークは,9カ国から5~97歳の脳波クロススペクトルに基づいて構築された。
この枠組みを基礎として,全脳ネットワークの年齢依存的規範軌道を構築した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:51:10 GMT)
Response-Level Rewards Are All You Need for Online Reinforcement Learning in LLMs: A Mathematical Perspective [6.1] 大規模言語モデル(LLM)の強化学習におけるゼロ・リワード推定について検討する。
反応レベル報酬モデルのみを用いて、真で未知のトークンレベルの報酬に基づくポリシー勾配を不偏に推定できることを示す。
我々は,新しいアルゴリズム,Token-Reinforced Policy Optimization (TRePO)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:44:31 GMT)
SubTrack++ : Gradient Subspace Tracking for Scalable LLM Training [6.1] 大規模言語モデル(LLM)のトレーニングは、大量のパラメータと状態のオーバーヘッドのため、リソース集約性が高い。
本稿では,Glassmann的勾配部分空間追跡とプロジェクション認識を組み合わせたSubTrack++を提案する。
我々はグラスマン幾何学と最低評価損失を利用してSOTA収束を実証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:12:49 GMT)
X-Driver: Explainable Autonomous Driving with Vision-Language Models [6.1] エンドツーエンドの自動運転は大幅に進歩し、システムの単純さや運転性能の向上といったメリットを提供している。
既存のフレームワークはまだクローズドループ評価の成功率の低下に悩まされており、実際のデプロイメントにおける制限を強調している。
我々は,クローズドループ自律運転用に設計された,マルチモーダルな大規模言語モデルフレームワークであるX-Driverを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:30:21 GMT)
HardNet: Hard-Constrained Neural Networks with Universal Approximation Guarantees [6.0] HardNetは、モデルキャパシティを犠牲にすることなく、本質的に厳しい制約を満たすニューラルネットワークを構築するためのフレームワークである。
我々は、HardNetが表現力を持ち、ニューラルネットワークの普遍的な近似能力を維持していることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:40:30 GMT)
DropCluster: A structured dropout for convolutional networks [6.0] ディープニューラルネットワークにおける過剰適合を防ぐための共通正規化器としてのドロップアウトは、完全に接続された層よりも畳み込み層において効果が低い。
これは、ローカル構造を考慮せずに、ドロップアウトドロップがランダムに特徴付けられるためである。
本研究では,畳み込み層の出力構造を活用し,DropClusterという新しい構造正規化手法を導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:33:51 GMT)
Kaiwu: A Multimodal Manipulation Dataset and Framework for Robot Learning and Human-Robot Interaction [6.0] 本稿では,実世界の同期型マルチモーダルデータ問題に対処するために,カイウーマルチモーダルデータセットを提案する。
このデータセットはまず、人間、環境、ロボットのデータ収集フレームワークを20の被験者と30のインタラクションオブジェクトと統合する。
絶対タイムスタンプに基づく細粒度マルチレベルアノテーションとセマンティックセグメンテーションラベリングを行う。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:07:34 GMT)
Small Aid, Big Leap: Efficient Test-Time Adaptation for Vision-Language Models with AdaptNet [6.0] テスト時適応(TTA)は、推論中に視覚言語モデル(VLM)の一般化能力を高める重要な手法として登場した。
本稿では,より軽量で学習しやすいAdaptNetを活用して,効率よくスケーラブルなモデル適応を実現する,新しいアダプタベースのTTAフレームワークであるSAILを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:16:51 GMT)
AnswerCarefully: A Dataset for Improving the Safety of Japanese LLM Output [5.9] 本稿では,日本のLLM出力の安全性と適切性を促進するデータセットAnswerCarefullyを提案する。
データセットは1,800対の質問と参照された回答で構成されており、回答には特別な注意が必要である。
このデータセットを用いて日本語LLMを微調整することで,一般応答の有用性を損なうことなく,出力安全性が向上したことを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:18:59 GMT)
Localizing Persona Representations in LLMs [5.8] 大規模言語モデル(LLM)の表現空間におけるペルソナのエンコード方法と場所について検討する。
我々は、道徳的ニヒリズムや実用主義など、特定の倫理的観点で重なるアクティベーションを観察する。
対照的に、保守主義や自由主義のような政治的イデオロギーは、より異なる地域で表現されているようである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:45:28 GMT)
Understanding Federated Learning from IID to Non-IID dataset: An Experimental Study [5.7] フェデレーション・ラーニング(FL)は、生データを共有せずに分散化されたデータソース間で機械学習モデルをトレーニングするための有望なアプローチとして登場した。
FLにおける重要な課題は、クライアントデータが非IID(非独立で同一の分散)であることが多く、集中型学習と比較してパフォーマンスが低下することです。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:38:42 GMT)
DiaBlo: Diagonal Blocks Are Sufficient For Finetuning [5.6] 選択したモデル重み行列の対角ブロックのみを更新するPEFTアプローチであるDiaBloを提案する。
ローランク適応(LoRA)とその変種とは異なり、ダイアブロはローランク行列生成物の必要性を排除している。
この設計は、LoRAに匹敵するメモリ効率とトレーニング速度を維持しながら、安定かつ堅牢な収束をもたらす。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:47:59 GMT)
Towards real-time assessment of infrasound event detection capability using deep learning-based transmission loss estimation [5.6] 国際モニタリングシステムの性能評価には, 超音波透過損失の高精度なモデリングが不可欠である。
最先端の伝搬モデリングツールにより、大気モデルを用いて伝達損失を微細にシミュレートすることができる。
近年の研究では,伝達損失予測をほぼ瞬時に行うディープ・ラーニング・アルゴリズムを用いている。
本研究では, 風場と温度場をニューラルネットワークの入力として使用し, 最大130km, 4,000kmの距離をシミュレートした。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:49:12 GMT)
Poster: FedBlockParadox -- A Framework for Simulating and Securing Decentralized Federated Learning [5.6] FedBlockParadoxは、ブロックチェーンテクノロジ上に構築された分散型フェデレーション学習システムのモデリングと評価のためのモジュラーフレームワークである。
複数のコンセンサスプロトコル、バリデーションメソッド、アグリゲーション戦略、敵攻撃モデルをサポートする。
制御された実験を可能にすることで、FedBlockParadoxは、セキュアで分散化された学習ソリューションを開発する研究者に貴重なリソースを提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:25:06 GMT)
A Multimodal, Multilingual, and Multidimensional Pipeline for Fine-grained Crowdsourcing Earthquake Damage Evaluation [5.6] 迅速な、きめ細かい災害被害評価は、効果的な緊急対応には不可欠であるが、地上センサーの制限や公式報告の遅れにより、依然として困難である。
ソーシャルメディアは、人間中心の観察のリッチでリアルタイムな情報源を提供するが、そのマルチモーダルで非構造的な性質は、従来の分析手法の課題を提起している。
マルチモーダル・大規模言語モデル(MLLM)を利用した災害影響評価のための構造的多モーダル・多言語・多次元パイプライン(3M)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:07:25 GMT)
EALG: Evolutionary Adversarial Generation of Language Model-Guided Generators for Combinatorial Optimization [5.6] EALG(Evolutionary Adrial Generation of Language Model Generators)は,大規模言語モデル(LLM)を用いた最適化問題インスタンスとその対応解法を共進化させる新しいフレームワークである。
EALGは、動的にインスタンス生成手順を進化させ、ますます難しい問題を生み出すとともに、アルゴリズム構造によって導かれるLLMとの相互作用を通じて、対向アルゴリズムを同時に適応させる。
この研究は、インスタンス生成とソルバ設計を統合した最適化のための新しいパラダイムを探求し、その結果、最先端のパフォーマンスを実現した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:13:41 GMT)
Privacy-Preserving Federated Convex Optimization: Balancing Partial-Participation and Efficiency via Noise Cancellation [5.5] 本稿では,フェデレーテッド・ラーニング(FL)における部分参加型微分プライバシー(DP)の実現に向けた課題に取り組む。
本稿では,収束率や計算効率を犠牲にすることなく,プライバシーを保護できる新しいノイズキャンセラ機構を提案する。
この研究は、FLにおけるDPの適用性を拡張し、部分的な参加を伴う分散システムにおけるプライバシー保護学習のための効率的で実用的なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:48:35 GMT)
Relative Overfitting and Accept-Reject Framework [5.5] 本稿では,モデル統合後の性能変化のパターンを明らかにするために,アクセプション・リジェクト(AR)と関連するAR法則を提案する。
メインストリームアーキテクチャと事前学習されたメインストリームモデルに基づいた自己構築モデルを使用して、アプローチを検証する。
我々は、コンピュータビジョン(CV)や科学のためのAIなど、他の機械学習分野における「相対的オーバーフィッティング」とARフレームワークの可能性を探る。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:02:13 GMT)
BuildingBRep-11K: Precise Multi-Storey B-Rep Building Solids with Rich Layout Metadata [5.4] ビルディングブレープ11Kは、11,978棟(2-10階)の多層建築物(約10GB)のコレクションである。
全てのサンプルは幾何学的に正確なB-rep固体で覆われた床、壁、スラブ、規則に基づく開口で構成されている。
データセットの学習性を検証するために、2つの軽量なPointNetベースラインをトレーニングしました。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:44:34 GMT)
It's the Thought that Counts: Evaluating the Attempts of Frontier LLMs to Persuade on Harmful Topics [5.4] 我々は,説得的試みの頻度と文脈を説得し,測定する意思を識別する自動モデルを導入する。
オープンかつクローズドウェイトなモデルの多くは、有害なトピックに対する説得を積極的に試みている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:37:51 GMT)
NetPress: Dynamically Generated LLM Benchmarks for Network Applications [5.3] NetPressは、大規模言語モデル(LLM)とエージェントをネットワークアプリケーションで評価するための自動ベンチマーク生成フレームワークである。
実行時に、数百万のクエリをオンザフライで生成するベンチマーク設定を指定することができる。
我々はNetPressを3つの代表的なアプリケーションでインスタンス化し、静的で正当性のみのベンチマークがしばしば見逃すエージェントの挙動の興味深い微妙な違いを明らかにした。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:04:22 GMT)
Accelerate Langevin Sampling with Birth-Death Process and Exploration Component [5.3] 本研究では,出生死過程と探索成分を両立させる新しいサンプリング手法を提案する。
この方法の主なアイデアは、ジャンプする前に見ることです。
平均場限界を導出し、探索成分がサンプリング過程をいかに加速するかを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:07:12 GMT)
ANT: Adaptive Neural Temporal-Aware Text-to-Motion Model [5.2] 初期記述には運動基盤の構造的意味論が必要であるが、後段ではテキストアライメントの局所的詳細が必要である。
特殊化を規定するエピジェネティックな規則に着想を得て,**(ANT)**, an **A**daptive **N**eural **T**emporal-Awareアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:17:37 GMT)
Joint estimation of smooth graph signals from partial linear measurements [5.2] 弱い一貫性は、個々の$G_t$sが非常に疎結合で非連結である場合でも、$G$の特定の選択に対して確立される。
結果は、$x_t$が$n$アイテムのコレクションの潜在強度に対応するマルチレイヤのランキング問題に拡張される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:19:05 GMT)
Joint Learning of Linear Dynamical Systems under Smoothness Constraints [5.2] 複数の線形力学系の連立学習の問題点を考察する。
特に,平均二乗誤差が平均二乗誤差(MSE)に収束する条件を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:40:31 GMT)
Exploring Sparsity for Parameter Efficient Fine Tuning Using Wavelets [5.2] 残留行列のウェーブレット領域における高度にスパースな更新を学習する新しいPEFT法であるWavelet Fine-Tuning(WaveFT)を提案する。
WaveFTはトレーニング可能なパラメータの正確な制御を可能にし、微粒なキャパシティ調整と極めて低いパラメータ数で優れた性能を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:46:26 GMT)
Can reasoning models comprehend mathematical problems in Chinese ancient texts? An empirical study based on data from Suanjing Shishu [5.1] 愚事_MATH(ぐじ_MATH)は、スージー詩集に基づく古典的テキスト評価のベンチマークである。
古典中国語の独特な言語的制約の下で、主流推論モデルの数学的問題解決能力を評価する。
その結果、推論モデルはこれらの問題を部分的に理解し解決することができるが、その全体的な性能は現代の数学的なタスクのベンチマークよりも劣っていることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:19:29 GMT)
A Fully Automated Pipeline for Conversational Discourse Annotation: Tree Scheme Generation and Labeling with Large Language Models [5.0] 本稿では,そのようなスキームを構築し,アノテーションを実行するために,大規模言語モデルを用いた完全自動パイプラインを提案する。
我々は,従来の手作業で設計した木よりも優れており,その結果のアノテータを超えていることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:19:32 GMT)
MVTD: A Benchmark Dataset for Maritime Visual Object Tracking [5.0] 海中視覚追跡データセット(MVTD)は182の高解像度ビデオシーケンスで構成され、合計で15万フレームである。
MVTDは、海洋環境の現実的な複雑さを反映して、さまざまな運用状況と海洋シナリオをキャプチャする。
MVTDベンチマークで14種類のSOTA追跡アルゴリズムを評価し, 汎用データセットの性能と比較すると, 大幅な性能劣化が見られた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:30:11 GMT)
Do Language Models Think Consistently? A Study of Value Preferences Across Varying Response Lengths [4.9] 短い形式のテストから推測される値の選好は、長い形式のアウトプットで表されるものと一致しますか?
短文の反応と長文の反応から得られる値の選好を比較し、後者の引数の数を変えて、ユーザの異なる冗長性選好を捉える。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:52:03 GMT)
Linear Spatial World Models Emerge in Large Language Models [4.9] 線形空間世界モデルに対して,大規模言語モデルが暗黙的に符号化されているかを検討する。
本研究では,空間空間モデルのための形式的枠組みを導入し,そのような構造が文脈埋め込みに現れるかどうかを評価する。
この結果から,LLMが線形空間世界モデルを符号化する証拠が得られた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:31:00 GMT)
A Data-Driven Diffusion-based Approach for Audio Deepfake Explanations [4.9] 本稿では,ディープフェイク音声におけるアーティファクト領域を識別する新しいデータ駆動手法を提案する。
本稿では,実音声と音声音声のペア化について検討し,時間周波数表現の差を基調的説明として用いた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:10:53 GMT)
Unlearning's Blind Spots: Over-Unlearning and Prototypical Relearning Attack [4.9] 機械学習は、トレーニングされたモデルから指定された忘れ物セットを、コストのかかる再トレーニングなしに抽出することを目的としている。
忘れ物セット付近の保持データを悪化させる「オーバー・アンラーニング」と、忘れた知識を復活させようとする「リラーニング」後のアタック。
筆者らは,<i>OU@epsilon</i>を抑えるために,<i>OU@epsilon</i>をマスクした知識蒸留ペナルティを,<i>OU@epsilon</i>を,<i>OU@epsilon</i>を,<i>OU@epsilon</i>に置き換えた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:41:52 GMT)
DiffER: Categorical Diffusion for Chemical Retrosynthesis [4.9] DiffERは、カテゴリー拡散の形での逆合成予測のための代替的なテンプレートフリーな手法である。
本研究では,トップ1の精度とトップ3,トップ5,トップ10の精度の競争性能を実現する拡散モデルのアンサンブルを構築する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:40:52 GMT)
Empirical Evaluation of Generalizable Automated Program Repair with Large Language Models [4.8] 自動プログラム修正は、開発者がソフトウェアをメンテナンスするのを助けるバグ修正を提案する。
近年の研究では、LLMを修復に利用できることが示されている。
オープンモデル (Llama 3.3, Qwen 2.5 Coder, DeepSeek R1 (dist.) など) やクローズドモデル (o3-mini, GPT-4o, Claude 3.7 Sonnet, Gemini 2.0 Flash など) を含む,最新の13モデルの多種多様なセットを評価した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:15:14 GMT)
Chipmunk: Training-Free Acceleration of Diffusion Transformers with Dynamic Column-Sparse Deltas [4.7] 一般的な観測では、DiT遅延ノイズベクトルは推論ステップ間でゆっくりと変化するため、DiT計算はステップ間で冗長である可能性がある。
本稿では,この冗長性を減らして推論を高速化することを目的としている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:03:32 GMT)
Random at First, Fast at Last: NTK-Guided Fourier Pre-Processing for Tabular DL [4.7] パラメータフリーでアーキテクチャに依存しない変換として、ランダムなフーリエ写像を再検討し、再利用する。
提案手法は,アドホック正規化や追加の学習可能な埋め込みの必要性を回避するものである。
実験的に、フーリエ変換された入力に基づいて訓練されたディープネットワークがより高速に収束し、安定した最終性能が得られることを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:45:13 GMT)
Learning from True-False Labels via Multi-modal Prompt Retrieving [4.7] 弱教師付きラベル設定,すなわちTrue-False Labels(TFL)を提案する。
TFLは、あるインスタンスがラベルに属するかどうかを示し、候補ラベルセットからランダムに均一にサンプリングされる。
また,VLMの知識と目標学習タスクのギャップを埋めるために,畳み込み型マルチモーダル・プロンプト検索(MRP)手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:04:52 GMT)
How Bidirectionality Helps Language Models Learn Better via Dynamic Bottleneck Estimation [4.7] 双方向言語モデルは、自然言語理解タスクにおける一方向モデルよりもコンテキスト理解が優れ、パフォーマンスがよい。
トレーニング中の相互情報を動的かつスケーラブルに推定するFlowNIBを提案する。
両方向モデルが相互情報をより多く保持し,一方向モデルよりも高次元性を示すことを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:07:49 GMT)
Overcoming Challenges of Partial Client Participation in Federated Learning : A Comprehensive Review [4.7] Federated Learning(FL)は、異なるクライアントから生データを開示することなく、共有グローバルモデルを協調的にトレーニングする学習メカニズムである。
本稿では、FLにおける部分的クライアント参加の影響について広範な調査を行う。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:52:27 GMT)
Tarallo: Evading Behavioral Malware Detectors in the Problem Space [4.7] 攻撃者が、シーケンシャルデータに対して、より効率的で効率的な特徴空間アルゴリズムを活用することで、成功の可能性を高める方法を示す。
我々は,エンド・ツー・エンドの敵対的フレームワークであるTaralloで,新しいアルゴリズムと攻撃戦略を実装した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:12:43 GMT)
Generative AI for Predicting 2D and 3D Wildfire Spread: Beyond Physics-Based Models and Traditional Deep Learning [4.6] 本稿では,山火事予測の基礎的枠組みとして,生成型AIの採用を提唱する。
このようなモデルが2次元火災拡散予測をどのように強化し,より現実的でスケーラブルな3次元シミュレーションを実現するかを検討する。
生成AIを山火事管理に統合するための5つの重要なビジョンを、マルチモーダルアプローチ、AIファンデーションモデル、会話型AIシステム、エッジコンピューティングベースのシナリオ生成、認知デジタルツインという、特定する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:54:40 GMT)
Polaromechanical cooling of multiple mechanical modes [4.6] フォノンへのさらに結合した分極子は、ハイブリッドの分極力学系を形成する。
最近の実験では2つの異なる構成でポラリトンとフォノンの強い結合が達成されている。
複数のメカニカルモードが1つの駆動場を持つポラリトンを用いて同時に冷却可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:47:47 GMT)
RBFleX-NAS: Training-Free Neural Architecture Search Using Radial Basis Function Kernel and Hyperparameter Detection [4.6] RBFleX-NASは、最後の層の活性化出力と入力特徴の両方を考慮に入れた、新しいトレーニングフリーNASフレームワークである。
RBFleX-NASは、トップ1の精度で最先端のトレーニングなしNAS法を著しく上回っている。
NAFBeeも提案する。NAFBeeは、アクティベーションタイプを拡張して、様々なよく使われる関数を包含する新しいアクティベーション設計空間である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:36:33 GMT)
Beyond the Safety Bundle: Auditing the Helpful and Harmless Dataset [4.5] この研究は、Helpful and Harmless データセットを Anthropic で監査した。
本研究は,大規模言語モデルにおける安全性軽減のための,よりニュアンスで文脈に敏感なアプローチの必要性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:37:50 GMT)
Speculative Automated Refactoring of Imperative Deep Learning Programs to Graph Execution [4.5] 成長を続けるデータセット、特にディープラーニング(DL)システムのサポートは不可欠である。
DLフレームワークは伝統的に遅延実行スタイルのDLコードを採用してきた -- シンボリックでグラフベースのDeep Neural Network(DNN)をサポートする。
本稿では,命令型DL関数をグラフとして効果的かつ効率的に実行できるかどうかを開発者が判断するのを支援する自動手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:01:43 GMT)
Meta-Learning Neural Mechanisms rather than Bayesian Priors [4.5] フォーマルな言語のメタラーニングについて検討し、従来の主張に反してメタトレーニングモデルは単純さに基づく事前学習をしていないことを発見した。
メタトレーニングが、下流タスクにおけるネットワークの認知的プリミティブのように機能するニューラルメカニズムをモデルにインプリントする証拠を見つける。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:10:55 GMT)
Leveraging Information Retrieval to Enhance Spoken Language Understanding Prompts in Few-Shot Learning [4.4] 検討されたシステムの信頼性を確保するために,正確な音声言語理解手法を開発することが重要である。
現在の最先端のSLU技術は大量のトレーニングデータに依存しているが、特定のタスクや言語で利用可能な注釈付き例は限られている。
SLUタスクに適用可能な拡張プロンプトを構築するために、情報検索(IR)アプローチを利用したサンプル選択を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:18:45 GMT)
Dynamical Label Augmentation and Calibration for Noisy Electronic Health Records [4.4] 動的 textbfCalibration and Augmentation for textbfTime series Noisy textbfLabel textbfLearning (ACTLL) を用いたtextbfAttention-based Learning Frameworkを提案する。
我々のモデルACTLLは、特に高騒音下で最先端の性能を達成した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:38:40 GMT)
Principal Components for Neural Network Initialization [4.4] 主成分ベースの初期化(PCsInit)は、PCAをニューラルネットワークの第1層に組み込む戦略である。
これらの戦略を用いた説明は、ニューラルネットワークと同様に直接的で直接的なものである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:03:24 GMT)
Large-Scale Multi-omic Biosequence Transformers for Modeling Protein-Nucleic Acid Interactions [4.4] OmniBioTEは,250億以上のタンパク質と核酸を混合したトークンをトレーニングした,オープンソースのマルチオミックモデルである。
我々は,OmbiBioTEが与えられた核酸とタンパク質の結合相互作用のギブス自由エネルギー(DeltaG)の変化を予測できることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:17:19 GMT)
From Anger to Joy: How Nationality Personas Shape Emotion Attribution in Large Language Models [4.4] 本研究では,感情の帰属を通じて,異なる国が事前訓練された大規模言語モデル(LLM)でどのように表現されるかを検討する。
我々の分析では、恥、恐怖、喜びといった感情が地域によって不均等に割り当てられているという、国籍に基づく大きな違いが明らかになっている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:35:51 GMT)
SAMJ: Fast Image Annotation on ImageJ/Fiji via Segment Anything Model [4.3] SAMJは、SAM(Segment Anything Model)を利用した、ユーザフレンドリーなImageJ/Fijiプラグインである。
SAMJは、大規模な科学的画像におけるリアルタイムなオブジェクト記述のために設計されており、ラベル付き画像データセットの作成を単純化し、加速する使いやすいソリューションである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:10:03 GMT)
Mitigating Manipulation and Enhancing Persuasion: A Reflective Multi-Agent Approach for Legal Argument Generation [4.3] 大規模言語モデル(LLM)は、法的議論生成のためにますます研究されている。
LLMは幻覚と未解決の説得による操作の重大なリスクを負う。
本稿では,これらの課題に対処するために,新しい反射型マルチエージェント手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:28:30 GMT)
VolTex: Food Volume Estimation using Text-Guided Segmentation and Neural Surface Reconstruction [4.3] 既存の3次元食品容積推定法は, 食品の容積を正確に計算するが, 食品部分の選択は行わない。
食品容積推定における食品選択の変化を改善するフレームワークであるVolTexを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:03:28 GMT)
Adoption of Watermarking Measures for AI-Generated Content and Implications under the EU AI Act [4.2] 本稿では,画像生成に広く用いられている50のAIシステムを,AI法の法的解析に組み込んだ実証分析を行う。
現在、適切な透かしとディープフェイクラベリングを実装しているAIイメージジェネレータは少数に過ぎません。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:23:43 GMT)
Clique detection using symmetry-restricted quantum circuits [4.2] 本稿では,変分不変量子回路のclique問題への適用について述べる。
実験では、より大きなサブグラフ内のノードの識別を通じて、cliqueをラベル付けするよう要求する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:31:26 GMT)
Measuring Faithfulness and Abstention: An Automated Pipeline for Evaluating LLM-Generated 3-ply Case-Based Legal Arguments [4.2] 大規模言語モデル(LLM)は、引数生成のような複雑な法的タスクの可能性を実証する。
本稿では,LLMの性能を評価するための自動パイプラインを提案する。
我々は、幻覚を、入力ケース素材に存在しない要因の生成と、モデルが引数の生成を控える能力と定義する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:22:48 GMT)
Beyond Text Compression: Evaluating Tokenizers Across Scales [4.0] トークン化器の選択は、英語のタスクに無視できる効果を持つが、多言語設定における一貫した性能差をもたらすことを示す。
我々はZipfの法則に着想を得た新しい固有のトークン化指標を提案し、テキスト圧縮よりも下流のパフォーマンスと強く相関する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:35:56 GMT)
Secure and Private Federated Learning: Achieving Adversarial Resilience through Robust Aggregation [4.0] フェデレートラーニング(FL)は、生データを共有することなく、分散データソース間で協調的な機械学習を可能にする。
FLは、ビザンツのクライアントと呼ばれる悪意のある参加者からの敵の脅威に弱いままである。
本稿では,FLシステムのレジリエンスとプライバシの保証を両立させる新しいアグリゲーション戦略であるAverage-rKrum(ArKrum)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:06:36 GMT)
Visual-TCAV: Concept-based Attribution and Saliency Maps for Post-hoc Explainability in Image Classification [4.0] 近年,畳み込みニューラルネットワーク(CNN)のパフォーマンスが大幅に向上している。
しかし、そのサイズと複雑さのため、ブラックボックスとして機能し、透明性の懸念につながります。
本稿では,これらの手法間のギャップを埋めることを目的とした,ポストホックな説明可能性フレームワークであるVisual-TCAVを紹介する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:54:24 GMT)
An Adaptive Re-evaluation Method for Evolution Strategy under Additive Noise [3.9] 本稿では,加法的なガウスホワイトノイズによる関数値の最適再評価数を適応的に選択する手法を提案する。
実験では,CMA-ESのノイズハンドリング手法を人工的なテスト関数の集合上で実験的に比較した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:17:35 GMT)
TO-GATE: Clarifying Questions and Summarizing Responses with Trajectory Optimization for Eliciting Human Preference [3.8] 大規模言語モデル(LLM)は、マルチターン対話を通じて人間の好みを効果的に引き出すことができる。
自己学習推論に基づく既存のアプローチは、最適な対話軌跡を特定するのに苦労している。
トラジェクトリ最適化による質問生成を支援する新しいフレームワークであるTO-GATEを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:58:07 GMT)
The Future of Continual Learning in the Era of Foundation Models: Three Key Directions [3.8] 継続的学習は3つの重要な理由から不可欠である、と我々は主張する。
我々は、連続的な学習の再生を象徴する連続的な構成性について論じている。
AIの未来は、単一の静的モデルではなく、継続的に進化し、相互作用するモデルのエコシステムによって定義される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:06:41 GMT)
A Learned Cost Model-based Cross-engine Optimizer for SQL Workloads [3.8] Lakehouseシステムでは、同じデータを複数の実行エンジンでクエリすることができる。
学習コストモデルを用いて,多様なクエリに対するエンジン選択を自動化するクロスエンジンを提案する。
コスト推定にクエリ最適化された論理的計画を用いることで、最適化されていない計画を入力として使用することで、平均Qエラーを12.6%も削減できることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:32:56 GMT)
Efficient QAOA Architecture for Solving Multi-Constrained Optimization Problems [3.8] 本稿では,量子近似最適化アンサッツのための制約符号化手法の新たな組み合わせを提案する。
ワンホット制約は、検索空間を実現可能なサブ空間に自然に制限する$XY$-mixerによって強制される。
確立されたQUBOの定式化と組み合わせた手法をベンチマークし、最適解をサンプリングする確率と解の質を向上した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:46:53 GMT)
Abstract Counterfactuals for Language Model Agents [3.8] 抽象対物(Abstract Counterfactuals)は、環境内の行動と相互作用の高レベルな特徴を強調するフレームワークである。
トークンレベルと潜時空間の両方の介入を考慮して,テキストベースのゲームと対実テキスト生成の実験を行う。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:44:26 GMT)
Dynamic mapping from static labels: remote sensing dynamic sample generation with temporal-spectral embedding [3.7] 地表面動態の急激な変化は、頻繁な更新を必要とし、以前に収集されたサンプルを陳腐化し、継続的な手動更新のためにかなりの労働負荷を課す。
動的サンプルを自動的に生成する2段階自動フレームワークであるTasGenを導入し、時間-スペクトル埋め込みによる時系列リモートセンシング画像のスペクトルと時間依存性を同時にモデル化し、追加の手動アノテーションなしで土地表面の変化をキャプチャする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:55:16 GMT)
Towards Generalizable Drowsiness Monitoring with Physiological Sensors: A Preliminary Study [3.7] 生理的信号に基づく眠気モニタリングは、カメラベースのアプローチよりもプライバシー保護が重要である。
心電図(ECG)、心電図(EDA)、呼吸信号(RESP)を4つのデータセットで分析した。
二項ロジスティック回帰モデルは、眠気に関連する生理的指標を特定するために構築された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:59:08 GMT)
PandasBench: A Benchmark for the Pandas API [3.7] パンダAPIは、パンダとその代替品の成功の中心となっている。
その重要性にもかかわらず、ベンチマークはありません。
それらを満たす最初のベンチマークを示す: PandasBench。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:52:06 GMT)
Concept-Guided Chain-of-Thought Prompting for Pairwise Comparison Scoring of Texts with Large Language Models [3.7] 既存のテキストスコアリング手法では、大きなコーパス、短いテキストとの競合、手書きのデータが必要である。
生成的大言語モデル(LLM)を利用したテキストスコアリングフレームワークを開発した。
本稿では、Twitter上の特定の政党への反感を反映したスピーチをよりよく理解するために、このアプローチを適用する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:18:06 GMT)
SyncSDE: A Probabilistic Framework for Diffusion Synchronization [3.7] 拡散同期がなぜ機能するのかを解析し、どこに焦点を合わせるべきかを明らかにするためのフレームワークを提案する。
タスク毎の最適相関モデルを特定し、従来の手法よりも優れた結果を得る。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:23:52 GMT)
MedEBench: Revisiting Text-instructed Image Editing on Medical Domain [3.7] textbfMedEBenchは、テキスト誘導医療画像編集を評価するためのベンチマークである。
MedEBenchは、13の解剖学的領域にまたがる70のタスクにまたがる1,182の臨床ソースの画像プロンプトからなる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:45:27 GMT)
Toward Reliable VLM: A Fine-Grained Benchmark and Framework for Exposure, Bias, and Inference in Korean Street Views [3.6] 我々は韓国のストリートビューのための、初めてきめ細かいマルチモーダルジオロケーションベンチマークであるKoreaGEO Benchを紹介する。
我々のデータセットは、4つの都市クラスターと9つの場所タイプでサンプリングされた1,080の高解像度画像からなる。
その結果, 局所化精度の変動が明らかになり, 中心都市に対する構造的予測バイアスが強調された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:28:55 GMT)
ConMamba: Contrastive Vision Mamba for Plant Disease Detection [3.6] 植物病検出(PDD)は精密農業の重要な側面である。
既存のディープラーニング手法は、広範に注釈付けされたデータセットに依存していることが多い。
PDD用に特別に設計された新しいフレームワークであるConMambaを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:01:38 GMT)
OASST-ETC Dataset: Alignment Signals from Eye-tracking Analysis of LLM Responses [3.6] OASST-ETCは、24人の参加者の読書パターンを捉えた新しいアイトラッキングコーパスである。
分析の結果,好ましくない反応と好ましくない反応の読解パターンが明らかとなった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:58:39 GMT)
DeepRTE: Pre-trained Attention-based Neural Network for Radiative Tranfer [3.5] 我々は、定常放射移動方程式(RTE)に対処するために、DeepRTEと呼ばれる新しいニューラルネットワークアプローチを提案する。
我々のDeepRTEフレームワークは定常RTEの解法に優れた計算効率を示す。
DeepRTEは、特にマルチヘッドアテンションなどのメカニズムが組み込まれているため、パラメータが大幅に少ない高い精度を実現している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:56:54 GMT)
Memory effects in pulsed optomechanical systems [3.5] メモリは、古典的でも量子的でも、あらゆる物理系の基本的な性質である。
量子技術の文脈では、メモリを持つシステムは量子情報、通信、センシングに利用できる。
ここでは,パルスレーザーによって駆動される空洞光学系が,プログラム可能な量子メモリ素子として動作可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:39:02 GMT)
How does ion temperature gradient turbulence depend on magnetic geometry? Insights from data and machine learning [3.5] 磁気幾何学は核融合プラズマにおける乱流輸送のレベルに大きな影響を及ぼす。
我々は、複数の機械学習手法と200,000以上の非線形シミュレーションのデータセットを用いて、この依存を分析した。
畳み込みニューラルネットワーク(CNN)や決定木を含む複数の回帰モデルは、熱流束に対して合理的な予測力を得ることができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:56:01 GMT)
Grasp2Grasp: Vision-Based Dexterous Grasp Translation via Schrödinger Bridges [3.5] 視覚に基づくデクスタラス・グリップ翻訳は、異なる形態のロボットハンド間でグリップインテンションを伝達することを目的としている。
我々はこの問題を、Schr"odinger Bridgeフォーマリズムを用いて、把握分布間の輸送とみなす。
本手法は,スコアとフローマッチングを用いて,ソースとターゲットの潜在グリップ空間のマッピングを学習する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:08:51 GMT)
Urban Visibility Hotspots: Quantifying Building Vertex Visibility from Connected Vehicle Trajectories using Spatial Indexing [3.5] 本研究では,位置可視性を客観的に定量化するデータ駆動手法を提案する。
各車両位置の前方視界を用いた動的運転場をモデル化する。
道路周辺における数千の潜在的関心点について、累積的な視覚的露出、または可視的数'を定量化する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:16:41 GMT)
Astrophotography turbulence mitigation via generative models [3.4] 地上の望遠鏡が捉えたほとんどの天体画像は大気の乱れに悩まされ、画質が劣化した。
AstroDiffは,大気乱流を緩和するために,高品質な生成先行と拡散モデルの復元機能の両方を活用する生成復元法である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:18:48 GMT)
Conditioning Large Language Models on Legal Systems? Detecting Punishable Hate Speech [3.4] 本稿では, 法体系における多段階の抽象化により, 潜在的に罰せられるヘイトスピーチを検出するために, LLM(Large Language Models)の条件付けに対する異なるアプローチについて検討する。
我々は、特定のソーシャルメディア投稿が、ドイツ刑事法で規定された憎しみに対する侮辱の犯罪行為に該当するか否かを分類するタスクに焦点をあてる。
その結果、モデルが条件付けられた抽象化のレベルに関係なく、ヘイトスピーチの法的評価において、モデルと法の専門家の間には依然として大きなパフォーマンスギャップがあることが判明した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:50:27 GMT)
Brain-Like Processing Pathways Form in Models With Heterogeneous Experts [3.4] ヘテロジニアス・ミックス・オブ・エキスパートアーキテクチャを拡張して、異種領域がそれ自体で処理経路を形成していないことを示す。
経路形成を促進する3つの生物学的関連誘導バイアスを同定した。
人工的な経路は、脳が皮質系と皮質下系を使って、様々な困難を伴うタスクを学習し、解決する方法と一致している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:43:13 GMT)
Online Bayesian system identification in multivariate autoregressive models via message passing [3.4] 提案手法は, 自己回帰係数とノイズ精度の両方に対して, 完全な後部分布を生成する。
本研究では, 合成自己回帰系における収束を実証的に示すとともに, 二重質量ばねダンパー系における競合性能を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:06:29 GMT)
Stacking the Odds: Full-Stack Quantum System Design Space Exploration [3.4] 本研究では,レイアウト手法,キュービットルーティング手法,コンパイラ最適化レベル,ハードウェア固有の特性の影響について検討する。
我々のシミュレーションにはノイズがあるが、量子エラー補正(QEC)のシナリオが含まれており、レイアウトや接続性に類似した感度が明らかにされている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:01:58 GMT)
Simple, Good, Fast: Self-Supervised World Models Free of Baggage [3.3] 本稿では,自己教師型表現学習を用いたSGF(Simplic, Good, and Fast World Model)を紹介する。
我々は,SGFと確立された世界モデルとの関係を広く議論し,アブレーション研究におけるビルディングブロックの評価を行い,Atari 100kベンチマークの定量的比較により優れた性能を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:29:32 GMT)
Improving Performance of Spike-based Deep Q-Learning using Ternary Neurons [3.3] 3次スパイクニューロンモデルの性能は、深部Q-ラーニングタスクにおける2次モデルよりも劣っていることを示す。
本稿では,3次スパイクニューロンモデルを提案し,推定バイアスを低減してこの問題を軽減する。
その結果, 提案した3次スパイクニューロンは, 学習課題における3次ニューロンの劇的な性能低下を緩和することがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:06:13 GMT)
Omnidirectional Video Super-Resolution using Deep Learning [3.3] 360degビデオにおける空間解像度の制限は、それぞれの視野を適切なピクセルで表現することはできない。
本稿では,360deg VSR(360deg Video Super-Resolution)のための新しいディープラーニングモデルを提案し,S3PO(Spherical Signal Super- resolution with a Proportioned optimization)を提案する。
S3POはアライメントのような従来のVSR技術とは無関係に、注意機構を備えたリカレントモデリングを採用する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:59:21 GMT)
The epistemic dimension of algorithmic fairness: assessing its impact in innovation diffusion and fair policy making [3.3] 我々は,社会規模でのイノベーションの拡散に対する信頼性欠陥や過剰な影響を特徴づけ,分析することに注力する。
確立された線形閾値モデルを拡張し、イノベーション拡散におけるてんかんバイアスの影響を示す。
我々の結果は、意思決定におけるアルゴリズム的公正性の議論において、疫学的な次元が持つ重要な役割を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:03:21 GMT)
Ten Simple Rules for Catalyzing Collaborations and Building Bridges between Research Software Engineers and Software Engineering Researchers [3.3] 本稿では,RSE(Research Software Engineers)とSER(Software Engineering researchers)の生産性向上のための10の戦略ガイドラインを提案する。
このガイドラインは、RSEとSERの文化的・運用的差異を認識し、尊重することの重要性を強調している。
彼らは共有課題の特定、新興問題へのオープンネスの維持、相互利益の確保、相互の擁護者として機能することを提唱している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:51:17 GMT)
PersianMedQA: Language-Centric Evaluation of LLMs in the Persian Medical Domain [3.3] 大規模言語モデル(LLM)は、広範囲のNLPベンチマークにおいて顕著な性能を達成しており、しばしば人間レベルの精度を上回っている。
本稿では,ペルシャの医療問題に対する大規模かつ専門家評価データセットであるペルシャMedQAを紹介する。
汎用、ペルシャ細調整、医療用LLMを含む40以上の最先端モデルをゼロショットおよびチェーンオブ思考設定でベンチマークする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:22:37 GMT)
Adaptive Exploration in Lenia with Intrinsic Multi-Objective Ranking [3.2] 本研究は、レニア連続細胞オートマトンにおける探索と非有界イノベーションを促進するメカニズムを解明する。
我々は適応探索が進化力学を改善し、人工システムにおけるオープンエンド進化を達成するための重要なステップであると主張している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:26:47 GMT)
Learning Collision Risk from Naturalistic Driving with Generalised Surrogate Safety Measures [3.1] 本研究は一般サロゲート安全対策(GSSM)を紹介する。
GSSMは通常の運転パターンを捉え、交通相互作用がノルムから安全でない極端へと逸脱する程度を推定する。
瞬時状態のみを使用するバニラGSSMは、AUPRC 0.9を達成し、2.6秒の中央値の進行を保証し、潜在的な衝突を防ぐ。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:47:13 GMT)
Can Large Language Models Challenge CNNs in Medical Image Analysis? [3.1] 本研究では,医療診断画像の正確な分類を目的としたマルチモーダルAIフレームワークを提案する。
提案システムは、畳み込みニューラルネットワーク(CNN)と異なる大言語モデル(LLM)の強みを比較する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:52:14 GMT)
Prisma: An Open Source Toolkit for Mechanistic Interpretability in Vision and Video [3.1] 視覚力学的解釈可能性の研究を加速するために設計されたオープンソースのフレームワークであるPrismaを紹介する。
75以上のビジョンとビデオトランスフォーマーにアクセスするための統一ツールキット、スパースオートエンコーダ(SAE)、トランスコーダ、クロスコーダトレーニングのサポート、80以上の事前訓練されたSAEウェイトスイート、アクティベーションキャッシング、回路解析ツール、可視化ツールを提供する。
解析の結果,実効性SAEは言語SAEよりも空間パターンが著しく低いこと,SAE再建がモデル損失を減少させる場合があること,など,驚くべき結果が得られた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:43:53 GMT)
Unifying and extending Diffusion Models through PDEs for solving Inverse Problems [3.1] 拡散モデルは、コンピュータビジョンと科学機械学習(SciML)に応用された強力な生成ツールとして登場した。
伝統的に、これらのモデルは変分推論、復調、統計信号処理、微分方程式の原理を用いて導出されてきた。
本研究では,線形偏微分方程式からアイデアを用いた拡散モデルを導出し,このアプローチにはいくつかの利点があることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:49:20 GMT)
Spatial Association Between Near-Misses and Accident Blackspots in Sydney, Australia: A Getis-Ord $G_i^*$ Analysis [3.1] 道路安全管理チームは、歴史的事故記録を利用してブラックスポットを識別する。
車両のテレマティクスで捉えてリアルタイムに伝送されるニアミスイベントは、その高周波の性質と道路での運転のエンゲージメントにより、予防のユニークな可能性を示す。
本研究の目的は, 都市環境(シドニー, オーストラリア)において, 高重度近点群と高重度近点群(High-G)の集団を空間的に同定することであり, 近点の存在が, 特定された危険ホットスポットにおける将来のクラッシュにどのように影響するかを明らかにすることである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:58:56 GMT)
Improving Generalization of Neural Combinatorial Optimization for Vehicle Routing Problems via Test-Time Projection Learning [3.1] 我々は,Large Language Models (LLM) による新しい学習フレームワークを導入する。
ニューラルネットワークとのジョイントトレーニングを必要とする一般的なテクニックとは異なり、我々のアプローチは推論フェーズでのみ動作する。
提案手法により,100ノード以上の大規模トラベリングセールスマン問題(TSP)と最大100Kノードのキャパシタン化車両ルーティング問題(CVRP)において,バックボーンモデル(100ノードインスタンスでトレーニング)が優れた性能を発揮する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:15:22 GMT)
A Multi-agent LLM-based JUit Test Generation with Strong Oracles [2.9] ユニットテストは、ソフトウェアの正しさを保証する上で重要な役割を担います。
従来の手法は、テストを生成するために検索ベースまたはランダム化アルゴリズムに依存していた。
我々は、JUnitテストの自動生成のための新しいエンドツーエンドのプロンプトベースのフレームワークであるCANDORを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:43:05 GMT)
Limit theorems of Chatterjee's rank correlation [2.9] チャタジーのランク相関は、ある変数が他方の関数でない限り、可測正規である。
同様の結果は、Azad-Chatterjeeのグラフベースの相関係数にも当てはまる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:39:40 GMT)
RoNFA: Robust Neural Field-based Approach for Few-Shot Image Classification with Noisy Labels [2.8] 本稿では,雑音ラベルを用いた数ショット画像分類のための新しい頑健なニューラルネットワークベース画像アプローチ (RoNFA) を提案する。
RoNFAは、特徴空間と圏表現のための2つのニューラルネットワークで構成され、特徴空間と圏集合に対応する。
予測段階では、これらの受容野の範囲はFCRのニューロンの活性化に応じて適応し、予測精度が保証される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:57:57 GMT)
A Systematic Review of Metaheuristics-Based and Machine Learning-Driven Intrusion Detection Systems in IoT [2.8] 本稿では,メタヒューリスティックスアルゴリズムの機械学習による侵入検知システム開発への応用を包括的かつ体系的に検討する。
この研究の重要な貢献は、これらの最適化技術と最先端のIoT-IDSと統合された機械学習モデルとの隠れた相関の発見である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:53:02 GMT)
Negation: A Pink Elephant in the Large Language Models' Room? [2.8] 否定は文の意味を決定する鍵であり、論理的推論には不可欠である。
その重要性にもかかわらず、否定は大きな言語モデル(LLM)に重大な課題をもたらす。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:17:50 GMT)
Axiomatics of Restricted Choices by Linear Orders of Sets with Minimum as Fallback [2.8] 本研究では,選択関数の集合が制限されるような選択関数を実現するために,線形順序をどのように利用できるかを検討する。
線形順序の最小元としてフォールバック値が符号化された場合でも、選択肢の集合上の線形順序で選択関数を常に構築できることが示される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:03:12 GMT)
POSTER: A Multi-Signal Model for Detecting Evasive Smishing [2.7] 本研究では,国別セマンティックタグ,構造パターンタグ,文字レベルのスタイリスティックキュー,文脈語句埋め込みを組み合わせたマルチチャネルスマイシング検出モデルを提案する。
私たちは、24,086個のスマイシングサンプルを含む5つのデータセットで84,000以上のメッセージをキュレートし、レバーベリングしました。
我々の統合アーキテクチャは、97.89%の精度、0.963のF1スコア、99.73%のAUCを達成し、多種多様な言語的および構造的手がかりを捉え、シングルストリームモデルより優れている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:15:49 GMT)
Multiple-Frequencies Population-Based Training [2.7] サブポピュレーションを用いて欲求に対処するHPOアルゴリズムを提案する。
MF-PBTはサブポピュレーション間で情報を転送するマイグレーションプロセスを導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:19:21 GMT)
Data Leakage and Deceptive Performance: A Critical Examination of Credit Card Fraud Detection Methodologies [2.7] 本研究はクレジットカード不正検出研究における方法論的厳密性について批判的に検討する。
基本的な方法論の原則に反した場合、単純なモデルでさえ、見事に印象的な結果が得られることを実証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:56:43 GMT)
Impact of Rankings and Personalized Recommendations in Marketplaces [2.6] 本研究では,2つのマーケットプレース設定において,公開ランキングとパーソナライズされたレコメンデーションの影響について検討する。
供給制限のない環境では、公的ランキングとパーソナライズされたレコメンデーションの両方が福祉を改善している。
対照的に、供給制限された設定では、公的なランク付けによって行われる一般的な用語だけを明らかにすることは、限られた利益をもたらす。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:26:14 GMT)
"Cause" is Mechanistic Narrative within Scientific Domains: An Ordinary Language Philosophical Critique of "Causal Machine Learning" [2.6] 因果学習は統計学と機械学習の研究の主要なテーマとして登場した。
本稿では,真の原因と影響現象の認識について考察する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:37:37 GMT)
Spin Grouping in Ring Cavity and its Protection on Entangled States Transfer [2.6] キャビティは、共用キャビティモードを介してリモートキュービットの結合を強化することにより、長距離通信を実現するための有望な道を提供する。
特定の空間配置下では、スピンは自然に2つのグループに自己組織化され、内部はエキシトン輸送が制限されている。
このスピン群機構は、2つの群をまたいだスピン間のコヒーレンスを保ち、遠方スピン対間の絡み合った状態を決定論的に伝達するために利用される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:33:32 GMT)
Beware! The AI Act Can Also Apply to Your AI Research Practices [2.5] EUはデジタル時代を規制する先駆者の一人となっている。
AI法は、リスクベースのアプローチにより、AIシステムのプロバイダに対するさまざまな義務を規定している。
このポジションペーパーは、事実、AI法の義務は、AIコミュニティが認識しているよりも多くのケースに適用できると主張している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:01:36 GMT)
Enhancing Abnormality Identification: Robust Out-of-Distribution Strategies for Deepfake Detection [2.5] 本稿では,2つの新しいOf-Distribution(OOD)検出手法を提案する。
第1のアプローチは入力画像の再構築のために訓練され、第2のアプローチはOODを検出するための注意機構が組み込まれている。
提案手法は,ベンチマーク上での最高性能構成のうち,深度検出とランク付けにおいて有望な結果が得られる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:24:33 GMT)
Inverse Reinforcement Learning with Switching Rewards and History Dependency for Characterizing Animal Behaviors [2.5] 従来の逆強化学習を拡張する新しいフレームワークであるSWIRL(SWitching IRL)を紹介する。
SWIRLは、過去の決定と環境コンテキストがどのように振舞うかを捉えるために、生物学的に妥当な履歴依存性を組み込んでいる。
シミュレーションおよび実世界の動物行動データセットにSWIRLを適用し、履歴に依存しないモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:35:00 GMT)
On the query complexity of sampling from non-log-concave distributions [2.4] 密度$p(x)propto e-f(x)$を持つ$d$次元分布からサンプリングする問題を、必ずしも良好な等尺条件を満たすとは限らない。
広い範囲のパラメータに対して、サンプリングは$d$の超指数係数による最適化よりも厳密に容易であることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:24:01 GMT)
Multilingual Information Retrieval with a Monolingual Knowledge Base [2.4] 強調学習のための重み付きサンプリングによる多言語埋め込みモデルを微調整する新しい手法を提案する。
重み付きサンプリング方式では,MRRでは最大31.03%,Recall@3では最大33.98%の性能向上が見られた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:05:49 GMT)
EgoVLM: Policy Optimization for Egocentric Video Understanding [2.4] 本稿では,視覚的理解と空間的時間的推論を統合した視覚言語モデルであるEgoVLMを紹介する。
EgoVLMは、モデル出力を人間ライクな推論ステップに合わせるように適応した強化学習手法であるグループ相対ポリシー最適化(GRPO)を介して微調整される。
我々のEgoVLMBは、非CoTエゴセントリックなデータに特化して訓練されており、ベースとなるQwen2.5-VL 3Bと7Bをそれぞれ14.33倍、Egoベンチマークで13.87精度で上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:28:00 GMT)
Controlling Quantum Coherence of V-type Atom in Dissipative Cavity by Detuning and Weak Measurement Reversal [2.4] V型原子と散逸性単一モードキャビティからなる対話型システムを考える。
量子コヒーレンス(quantum coherences)は、自然発生干渉(SGI)、空洞と環境の結合、弱い測定とその逆転、原子と空洞の間の変形などのパラメータで研究される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:37:15 GMT)
From Instructions to ODRL Usage Policies: An Ontology Guided Approach [2.4] 本研究では,GPT-4 などの大規模言語モデルを用いて,自然言語命令から W3C Open Digital Rights Language ODRL の使用ポリシーを自動生成する手法を提案する。
我々の研究仮説は、既存のドキュメントのキュレートされたバージョンがポリシー生成を導くのに役立つというものである。
得られた知識グラフでは, 最大91.95%の精度で優れた結果が得られた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:38:41 GMT)
On Generalization across Measurement Systems: LLMs Entail More Test-Time Compute for Underrepresented Cultures [2.4] 大規模言語モデル(LLM)は,手元の計測システムによらず,正確な情報を提供する必要がある。
以上の結果から, LLMは測定システムに既定で, 主にデータに使用されることがわかった。
異なる測定系における性能の不安定さとばらつきを観察する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:12:28 GMT)
Can Vision Transformers with ResNet's Global Features Fairly Authenticate Demographic Faces? [2.3] 事前学習したグローバルな特徴を活かしたビジョントランスフォーマー(ViT)とResNetは、異なる人口統計学的側面をかなり認証できるかどうかを検討した。
私たちは、Facebook、Google、Microsoftの3つの事前トレーニングされた最先端(SOTA)のViTファンデーションモデルと、ResNet-18のグローバル機能を使用しました。
その結果,人種・民族・性別・年齢の異なるデータセットにまたがって結果が得られた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:03:27 GMT)
Robust 6DoF Pose Estimation Against Depth Noise and a Comprehensive Evaluation on a Mobile Dataset [2.3] モバイルデバイスによる6DoFのポーズ推定は、ロボット工学、拡張現実、デジタルツインローカライゼーションの応用の基礎となっている。
DTTDNetと呼ばれるトランスフォーマーベースの6DoFポーズ推定手法を提案する。
提案手法は, 各種測定ノイズに対して優れたロバスト性を示し, 測定ノイズに対する新しいロバスト性ベンチマークを設定した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:28:49 GMT)
Asymptotically perfect seeded graph matching without edge correlation (and applications to inference) [2.3] シード多重グラフマッチングのためのOmniMatchアルゴリズムを提案する。
我々は,多数のシミュレーションおよびシャッフルグラフ仮説テストの文脈において,アルゴリズムの有効性を実証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:54:24 GMT)
The Observation of hyperradiance accompanied by enhanced entanglement in a hybrid optomechanical system [2.3] 理論的にオプテメカティカルシステムについて検討し、2つの量子ビットに対するバイパートライト光子-フォノン交絡を著しく強化するシナリオを提示した。
我々は、よく知られたDicke superradiant(N2$スケーリング法則)が原子間相関によって超放射能を超越できる現象を研究した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:50:25 GMT)
On the Selection Stability of Stability Selection and Its Applications [2.3] 本研究は,安定度選択結果の総合的安定性を評価するため,確立された安定性推定器の利用を拡大することを目的とする。
鍵安定性選択パラメータ、すなわち決定しきい値と期待される偽選択変数数を校正する。
連続するサブサンプルに対する安定性値の収束は、サブサンプルの必要個数に光を放つ。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:30:13 GMT)
Quantum Inspired Excited States Calculations for Molecules Based on Contextual Subspace and Symmetry Optimizations [2.2] 量子に着想を得た励起状態計算法は、NISQ(Noisy Intermediate-Scale Quantum)ハードウェアでまだ探索されていない。
本稿では,文脈部分空間(CS)法と変分量子デフレレーション(VQD)アルゴリズムを統合する資源効率のよいフレームワークを提案する。
スピン保存型ハードウェア効率アンサッツの実装、すなわち$mathcalN(theta_x,theta_y,theta_z)$ block ansatzは、投影された部分空間内のスピン対称性の活用を可能にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:55:20 GMT)
Quantum Random Number Generator (QRNG): Theoretical and Experimental Investigations [2.2] 量子乱数生成器(QRNG)は、真にランダムな数を生成するための有望なソリューションとして登場した。
本稿では,様々な戦略のメリットとデメリットを強調したQRNGの概要を紹介する。
ホモダイン検出技術を用いてQRNGの構築と特徴付けのための詳細な実験を行った。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:55:37 GMT)
On the Benefits of Accelerated Optimization in Robust and Private Estimation [2.2] 本研究では,Frank-Wolfe法と投射降下法に基づく加速勾配法の利点について検討する。
Frank-Wolfe法では,制約集合上の$ell$-normの勾配に調整された反復学習率と一様下界をベースとした手法を提案する。
射影降下を加速するために、ネステロフの運動量に基づく一般的な変種を用いる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:26:30 GMT)
Transforming Podcast Preview Generation: From Expert Models to LLM-Based Systems [2.2] ポッドキャストエピソードのプレビューを生成し,大規模に展開するためのLCMベースのアプローチを提案する。
総合的なオフライン評価とオンラインA/Bテストにより、LLM生成プレビューは、さまざまなMLエキスパートモデルの上に構築された強力なベースラインを一貫して上回っていることが示された。
オフラインの結果は、理解可能性、文脈的明確性、関心のレベルが顕著に向上し、オンラインA/Bテストでは、プレビューコンテンツによるユーザエンゲージメントが4.6%増加したことを示している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:32:45 GMT)
Exploiting the English Vocabulary Profile for L2 word-level vocabulary assessment with LLMs [2.2] 本稿では,語彙のきめ細かい評価を可能にする新しい手法を提案する。
このスキームは、大きな言語モデル(LLM)と英語語彙プロファイル(EVP)を組み合わせたものである。
EVPは標準の語彙資源であり、文脈内語彙の使用を習熟度にリンクすることができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:23:57 GMT)
Interpreting Large Text-to-Image Diffusion Models with Dictionary Learning [2.2] Sparse Autoencoders (SAEs) と Inference-Time Decomposition of Activation (ITDA) をテキスト・画像拡散モデル Flux 1 に適用する。
SAEは、残りのストリーム埋め込みを正確に再構築し、解釈可能性でニューロンを打ち負かす。
私たちはITDAがSAEに匹敵する解釈性を持っていることに気付きました。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:01:33 GMT)
TalkingMachines: Real-Time Audio-Driven FaceTime-Style Video via Autoregressive Diffusion Models [2.2] TalkingMachinesは、訓練済みのビデオ生成モデルをリアルタイム、オーディオ駆動のキャラクターアニメーターに変換する効率的なフレームワークである。
TalkingMachinesは、音声大言語モデル(LLM)とビデオ生成基盤モデルを統合することで、自然な会話体験を可能にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:29:28 GMT)
Understanding the Impact of Sampling Quality in Direct Preference Optimization [2.2] まず、勾配降下時のポリシー更新に応答の分布がどう影響するかを解析する。
そこで我々は,簡易かつよく構造化されたアライメントモデルをプロキシとして設計し,より頻繁な高品質応答が勾配信号を増幅することを示す定量的結果を開発した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:12:40 GMT)
ThinkTank: A Framework for Generalizing Domain-Specific AI Agent Systems into Universal Collaborative Intelligence Platforms [2.1] ThinkTankは、AIエージェントシステムを汎用的なコラボレーティブインテリジェンスプラットフォームに変換するために設計された包括的なフレームワークである。
ThinkTankは、エージェントの役割、ミーティング構造、知識統合メカニズムを体系的に一般化する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:32:48 GMT)
Implicit Regularization of the Deep Inverse Prior Trained with Inertia [2.1] 逆問題に適用した自己教師型ニューラルネットワークの収束と回復を保証する。
慣性アルゴリズムによるネットワークのトレーニングは、線形収束率を低く抑えながら、同様のリカバリ保証を享受できることが示される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:24:54 GMT)
Learning to Simulate: Generative Metamodeling via Quantile Regression [2.1] 従来のメタモデリング技術は、シミュレータ入力と単一出力要約統計量の間の関係を学習する。
生成メタモデリングという新しい概念を提案する。
生成メタモデルは、入力仕様に基づいて多数のランダム出力を高速に生成することができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:42:23 GMT)
Quantum Metrology with Higher-order Exceptional Points in Atom-cavity Magnonics [2.0] 例外点(EP)は、小さな摂動に対するシステムの応答を増幅する。
本質的に非エルミート系に存在するランゲヴィンノイズは、この拡張を減少させる。
本稿では,原子空洞系における高次EPの構成による量子力学のプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:00:42 GMT)
MMM4Rec: An Transfer-Efficient Framework for Multi-modal Sequential Recommendation [2.0] Sequential Recommendation (SR)システムでは、インタラクション履歴を分析してユーザの好みをモデル化する。
現在の手法は、新しいドメインに適応する際にかなりの微調整コストを発生させる。
MMM4Recは、効率的な伝達学習のための専用代数的制約機構を組み込んだ、新しいマルチモーダルSRフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:18:19 GMT)
Improving Dialogue State Tracking through Combinatorial Search for In-Context Examples [2.0] 対話状態追跡(DST)において、検索者は、ラベル付き対話をインコンテキストの例として選択し、これらの例を使用してクエリ対話の対話状態を推測するDSTモデルを使用する。
検索者のためのトレーニングデータを構築するための既存の手法は、3つの重要な制限に悩まされている。
提案手法は,DST性能への影響に基づいて,テキスト中の効果的な実例を評価する手法であるCombiSearchを提案する。
我々のMultiWOZに対する評価は、CombiSearchで訓練されたレトリバーが最先端のモデルを超え、データ効率が20倍向上し、SGDデータセットによく対応していることを示している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:31:06 GMT)
MenTeR: A fully-automated Multi-agenT workflow for end-to-end RF/Analog Circuits Netlist Design [1.9] MenTeRは、エンドツーエンドのアナログデザインフレームワークに統合されたマルチエージェントワークフローである。
複数の専門的なAIエージェントを採用することで、MenTeRは、頻繁にトライアルとエラースタイルの介入への依存を減らす。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:36:51 GMT)
Explicitly Modeling Subcortical Vision with a Neuro-Inspired Front-End Improves CNN Robustness [1.8] 物体認識で訓練された畳み込みニューラルネットワーク(CNN)は、高いタスク性能を実現するが、生物学的視覚と比較すると脆弱性を示す。
本稿では,VOneBlockと新しいSubcorticalBlockを組み合わせたハイブリッドCNNの新たなクラスであるEarly Vision Networks(EVNets)を紹介する。
EVNetはより強力な創発的な形状バイアスを示し、ロバスト性評価のベンチマークでベースCNNアーキテクチャを8.5%上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:13:51 GMT)
Modelling the Effects of Hearing Loss on Neural Coding in the Auditory Midbrain with Variational Conditioning [1.8] 健常動物および騒音曝露動物の聴覚中脳における神経活動の記録から直接聴覚損失の空間を符号化する新しい変分条件モデルを提案する。
動物1頭あたりの聴力損失は6自由パラメータのみであり, 正常聴力動物の神経反応の62%, 難聴動物の68%を正確に予測した。
このモデルにより、聴覚障害脳における正常なニューラルコーディングを直接復元するために訓練されたパラメトリック聴覚損失補償モデルの将来の開発が可能になる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:12:21 GMT)
AMLgentex: Mobilizing Data-Driven Research to Combat Money Laundering [1.8] マネーロンダリングは、不正な資金が合法的な経済に入ることを許すことによって組織犯罪を可能にする。
本稿では,AMLGentexについて述べる。AMLGentexは,リアルでベンチマーク可能なトランザクションデータと検出方法を生成するオープンソーススイートである。
主要な現実世界の課題を捉えた制御環境におけるマネーロンダリング防止システムの体系的評価を可能にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:28:09 GMT)
Towards Automated Semantic Interpretability in Reinforcement Learning via Vision-Language Models [1.8] 自動概念抽出(iTRACE)による解釈可能な木に基づく強化学習を導入する。
iTRACEは、セマンティックな特徴抽出のための事前学習された視覚言語モデル(VLM)と、ポリシー最適化のための解釈可能なツリーベースモデルを使用する。
iTRACEは、同じ解釈可能な機能を使用してベースラインを上回り、CNNベースのポリシーのパフォーマンスにマッチする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:51:56 GMT)
How stealthy is stealthy? Studying the Efficacy of Black-Box Adversarial Attacks in the Real World [1.8] 本研究では,コンピュータビジョンにおけるブラックボックス攻撃について検討する。
ECLIPSE, サンプル勾配に基づくガウス的ぼかしを用いた新たな攻撃法と局所代理モデルを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:56:37 GMT)
BitBypass: A New Direction in Jailbreaking Aligned Large Language Models with Bitstream Camouflage [1.8] 本稿では,ハイフン分離したビットストリームカモフラージュを利用した新しいブラックボックスジェイルブレイク攻撃BitBypassを開発した。
我々は,GPT-4o,Gemini,Claude 3.5,Llama 3.1,Mixtralの5つの最先端LCMの評価を行い,BitBypassが安全アライメントを回避し,有害かつ不安全なコンテンツを生成する能力を明らかにした。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:51:18 GMT)
Machine Mirages: Defining the Undefined [1.8] マルチモーダル・マシン・インテリジェンス・システムは 新しい種類の認知異常を 示し始めた マシン・ミラージュ
これには妄想、錯覚、コミュニケーション、幻覚、誤帰、誤帰、意味的ドリフト、意味的圧縮、誇張、因果推論の失敗が含まれる。
この記事では、いくつかのエラーを示し、これらの失敗は明示的に定義され、体系的に評価されなければならない、と論じます。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:45:38 GMT)
GeneA-SLAM2: Dynamic SLAM with AutoEncoder-Preprocessed Genetic Keypoints Resampling and Depth Variance-Guided Dynamic Region Removal [1.8] 本稿では動的シーンを扱うための堅牢で効率的なGeneA-SLAM2システムを提案する。
提案手法は, 深度分散により動的画素を抽出し, 動的物体の除去を導くための精密な深度マスクを作成する。
その結果,GeneA-SLAM2は動的シーンにおいて現在の手法と比較して高い精度を維持していることがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:51:53 GMT)
Enhancing Large Language Models with Neurosymbolic Reasoning for Multilingual Tasks [1.8] 我々は、推論中にニューラルネットワークとシンボル推論の利点を組み合わせた、NeuroSymbolic Augmented Reasoning (NSAR)を導入する。
NSARは、テキストから象徴的な事実を明示的に抽出し、複雑な推論ステップを処理するために実行可能なPythonコードを生成する。
本研究の結果は,多言語設定において,明示的記号演算とニューラル推論を併用して,堅牢で解釈可能な,スケーラブルな推論を行うことの有効性を強調した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:54:20 GMT)
When Blockchain Meets Crawlers: Real-time Market Analytics in Solana NFT Markets [1.7] NFTの市場データの自動収集と分析のためのSolanaブロックチェーンに基づくWebクローラシステムの設計と実装を行う。
ソラナチェーン上の一般的なNFTの基本情報とトランザクションデータは、Seleniumツールを用いて収集される。
マジックエデン取引市場の取引記録は、NFTの価格変動と市場動向を調べるためのScrapyフレームワークと組み合わせられている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:01:01 GMT)
A Hierarchical Integer Linear Programming Approach for Optimizing Team Formation in Education [1.7] 教育用メッセージ作成問題(EDU-TF)について紹介する。
これは、教師と学生の両方の要求を統合することで、教育のユニークなニーズに合わせた問題モデルである。
目的を教育的ニーズに応じて柔軟に調整できるモジュール最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:22:24 GMT)
Comparative Analysis of AI Agent Architectures for Entity Relationship Classification [1.7] 本研究では、関係分類を行うために設計された3つの異なるAIエージェントアーキテクチャの比較分析を行う。
エージェントアーキテクチャは,(1)反射的自己評価,(2)階層的タスク分解,(3)新しいマルチエージェント動的サンプル生成機構を含む。
実験により,マルチエージェントの協調処理が標準のショットプロンプトより一貫して優れ,微調整モデルの性能にアプローチすることが実証された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:19:47 GMT)
Floquet-engineered decoherence-resilient protocols for wideband sensing beyond the linear standard quantum limit [1.7] 非古典的状態を用いることで、測定精度の標準量子限界を超える能力を示す。
サブハーモニック励起現象を用いて、標準量子限界以下の分解能で電場の周波数を測定することができることを示す。
この気象学的利得は長い時間スケールに持続し、究極的な精度を向上させる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:50:34 GMT)
Kernel-based estimators for functional causal effects [1.7] 実験的なFr'echet平均と演算子評価カーネルに基づく因果効果推定器を提案する。
これらの手法は、処理ミス特異性に対する堅牢性を維持しながら、高次元性、逐次順序付け、モデル複雑性の課題に対処する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:22:18 GMT)
Not Every AI Problem is a Data Problem: We Should Be Intentional About Data Scaling [1.6] 大規模言語モデルは、取得するデータを探すのではなく、トレーニングとスケールのためにより多くのデータを必要とします。
データ自体の形状、例えば構成パターンや構造パターンは、データスケーリングにおいてどのタスクを優先すべきかを知らせるものだ、と私たちは主張する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:52:57 GMT)
Dynamic Chunking and Selection for Reading Comprehension of Ultra-Long Context in Large Language Models [1.6] 大きな言語モデル(LLM)は長いテキストを正確に読み書きするのに苦労することが多い。
現在の改善方法は、通常、長いコンテキストを固定長のチャンクに分割することに依存する。
本稿では,長いコンテキストのチャンクを動的に分離し,選択するための簡単なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:29:29 GMT)
The underlying structures of self-attention: symmetry, directionality, and emergent dynamics in Transformer training [1.6] 重み更新を規定する構造を導出することにより自己注意行列を解析する。
両方向トレーニングは重み行列の対称性を誘導し,自己回帰トレーニングは方向性や列優位性をもたらすことを示す。
この分析は、情報の自己認識による埋め込みに関する新しい理論的視点を提供し、トランスフォーマーモデルの解釈可能性を改善する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:08:01 GMT)
Dynamic Epsilon Scheduling: A Multi-Factor Adaptive Perturbation Budget for Adversarial Training [1.6] 敵のトレーニングは、敵の例からニューラルネットワークを守るための最も効果的な戦略の1つである。
既存の敵の訓練アプローチは固定的な摂動予算に依存しており、堅牢性に特有な特性を考慮できない。
本研究では,動的Epsilon Scheduling(DES)を提案する。このフレームワークは,インスタンスごとの対向摂動予算を適応的に調整し,トレーニングインスタンス毎に調整する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:18:53 GMT)
LLM-Driven E-Commerce Marketing Content Optimization: Balancing Creativity and Conversion [1.6] 本稿では,プロンプトエンジニアリング,多目的微調整,後処理を統合し,エンゲージメントとコンバージョン駆動の両方のマーケティングコピーを生成するフレームワークを提案する。
コンテントノベルティを維持しつつ,CTRの12.5%増加とCVRの8.3%増加を実現している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:39:21 GMT)
Multi-task Learning with Active Learning for Arabic Offensive Speech Detection [1.5] 本稿では,多タスク学習(MTL)とアクティブラーニングを統合し,アラビアメディアテキストにおける攻撃的音声検出を強化する新しいフレームワークを提案する。
本手法は,トレーニング中のタスクの重み付けを動的に調整し,各タスクのコントリビューションのバランスをとり,性能を最適化する。
OSACT2022データセットの実験結果は、提案されたフレームワークが85.42%の最先端のマクロF1スコアを達成したことを示している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:17:03 GMT)
Efficient Annotator Reliability Assessment with EffiARA [1.5] EffiARAは、アノテーションタスクに必要なリソースの理解からアノテーション付きデータセットのコンパイルまで、アノテーションパイプライン全体をサポートする最初のプロジェクトである。
このフレームワークの有効性は、アノテータ信頼度に基づくソフトラベル凝集とサンプル重み付けによる分類性能の向上と、アノテータ間の全体的な合意の増大という2つの先行研究によって支持されている。
この作業は、EffiARA Pythonパッケージとそれに伴うwebtoolを導入し、システムに対してアクセス可能なグラフィカルユーザインターフェースを提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:25:31 GMT)
AI-Driven Vehicle Condition Monitoring with Cell-Aware Edge Service Migration [1.5] 本稿では,多様な異常のリアルタイム診断を可能にする新しい車両条件監視サービスを提案する。
本稿では,エッジノード間のサービスマイグレーションを動的にトリガするクローズドループサービスオーケストレーションフレームワークを提案する。
提案手法は,5Gネットワーク機能を備えた実世界のレースサーキット環境において実装およびテストされている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:12:27 GMT)
Auto Review: Second Stage Error Detection for Highly Accurate Information Extraction from Phone Conversations [1.4] 正確な情報抽出のための第2段階のコール後パイプラインを提案する。
複数のASR代替品と擬似ラベル手法を用いて精度を向上する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:33:39 GMT)
THELMA: Task Based Holistic Evaluation of Large Language Model Applications-RAG Question Answering [1.4] THELMAはRAG(Retrieval Augmented Generation)ベースの質問応答(QA)アプリケーションのための参照フリーフレームワークである。
フレームワークは、開発者とアプリケーションオーナーがラベル付きソースや参照応答を必要とせずに、エンドツーエンドのRAG QAパイプラインを評価し、監視し、改善するのに役立つ。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:21:16 GMT)
Fast Machine Learning for Quantum Control of Microwave Qudits on Edge Hardware [1.4] 量子ハードウェアの設定を迅速に調整する極めて低遅延の系が最重要であり、忠実度はターゲットの量子状態と重なり合うものとして定義される。
そこで我々は,マイクロ波キャビティキューディットにおける選択数依存任意位相(SNAP)ゲート作成のための制御パルスパラメータを決定するために,機械学習(ML)モデルを用いる。
提案手法の有効性を実証し, 最適化されたモデルを用いて, 10~3ドル近い低ゲートトレース不完全性を達成し, プログラム可能な論理資源の効率的な利用を図った。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:14:18 GMT)
Discovery of Probabilistic Dirichlet-to-Neumann Maps on Graphs [1.4] ガウス過程を用いてグラフ上のディリクレ-ノイマン写像を学習する新しい方法を提案する。
本手法は, 高精度かつ高精度な不確実性評価を, 厳密なデータ不足下でも維持可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:25:49 GMT)
Tour de gross: A modular quantum computer based on bivariate bicycle codes [1.4] 高速かつ低オーバヘッドの量子LDPC符号に基づくモジュラー量子コンピューティングフレームワークを提案する。
本研究では,回路雑音下での命令の論理誤差率を推定し,明確なフォールトトレラントな論理命令セットを構築する。
我々は,自転車アーキテクチャの制約に適応したコンパイル戦略を開発し,大規模で普遍的な量子回路の実行を可能にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:25:13 GMT)
Beyond RAG: Reinforced Reasoning Augmented Generation for Clinical Notes [1.4] 提案するR2AGは,入出力データに基づく長形放電命令生成のための第1次強化レトリバーである。
R2AGは、医学知識グラフから推論経路を取得するための強化学習で訓練されている。
MIMIC-IV-Noteデータセットの実験では、R2AGは臨床効果と自然言語生成の指標の両方においてベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:59:52 GMT)
The Reader is the Metric: How Textual Features and Reader Profiles Explain Conflicting Evaluations of AI Creative Writing [1.4] 我々は5つの公開データセット(1,471ストーリー、101アノテータ、批評家、学生、レイリーダー)を使って17の参照なしテキストの特徴を抽出します。
我々は、個々の読み手の好みをモデル化し、テキストの優先順位を反映した特徴重要ベクトルを導出する。
本研究は,文学的品質の測定が,文章の特徴と読み手の好みがどのように一致しているかを定量的に説明するものである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:50:22 GMT)
Shallow ReLU neural networks and finite elements [1.4] 凸ポリトープメッシュ上の一方向線形関数は、弱い意味で2層ReLUニューラルネットワークで表現できることを示す。
弱い表現に必要な2つの隠れた層のニューロンの数は、このメッシュに関わるポリトープと超平面の数に基づいて正確に与えられる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:10:38 GMT)
CART-based Synthetic Tabular Data Generation for Imbalanced Regression [1.3] 我々は、既存のCARTベースの合成データ生成手法を適応させ、不均衡回帰に適合させることを提案する。
本手法は, 対象空間のスパース領域におけるサンプリングを誘導するための関連性および密度に基づくメカニズムを統合する。
本実験は,ベンチマークデータセット間での極端目標値の予測に焦点をあてる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:42:20 GMT)
An Algorithmic Pipeline for GDPR-Compliant Healthcare Data Anonymisation: Moving Toward Standardisation [1.3] 一般の準識別器(QID)と機密属性(SA)は実装が複雑である。
データユーティリティを保ちながら、コンプライアンスのためのRWD匿名化を標準化することを目指している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:40:38 GMT)
Cross-Platform Violence Detection on Social Media: A Dataset and Analysis [1.3] 暴力的な脅威やサブタイプの暴力に対して手書きの投稿3万件のクロスプラットフォームデータセットを導入します。
このデータセットに存在する信号を評価するために、既存のYouTubeからの暴力的なコメントのデータセットを用いて機械学習分析を行う。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:54:07 GMT)
Pan-Arctic Permafrost Landform and Human-built Infrastructure Feature Detection with Vision Transformers and Location Embeddings [1.3] 視覚変換器(ViT)は、注意機構を介して長距離依存関係とグローバルコンテキストをキャプチャする利点を提供する。
ViTは、自己教師付き学習による事前トレーニングをサポートし、北極の特徴検出におけるラベル付きデータの共通制限を補完する。
本研究は,(1)高分解能北極リモートセンシングタスクのための特徴抽出器としての事前学習型ViTの適合性,(2)画像と位置情報の埋め込みの利点について検討する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:34:01 GMT)
Zero-Shot Tree Detection and Segmentation from Aerial Forest Imagery [1.3] 現在のRGBツリーセグメンテーション手法は、ラベル付きツリーデータセットを用いた特別な機械学習モデルのトレーニングに依存している。
本稿では,最先端画像分割モデルであるSegment Anything Model 2 (SAM2) を,個々の木の検出とセグメンテーションのためにゼロショット方式で使用することの有効性について検討する。
その結果,SAM2は印象的な一般化能力を持つだけでなく,ドメイン内のラベル付きデータに基づいて訓練された特殊な手法で自然なシナジーを形成することが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:44:43 GMT)
Joint Modeling for Learning Decision-Making Dynamics in Behavioral Experiments [1.3] 主要なうつ病 (MDD) は障害や死亡の原因である。
本稿では,強化学習モデルとドリフト拡散モデルを統合する新しいフレームワークを提案する。
以上の結果から,MDD患者は健常者よりも全体的なエンゲージメントが低いことが明らかとなった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:21:10 GMT)
CMRINet: Joint Groupwise Registration and Segmentation for Cardiac Function Quantification from Cine-MRI [1.2] 本稿では,心血管MRI画像に対するグループワイド(GW)登録とセグメンテーションを共同で推定するエンド・ツー・エンドディープラーニング(DL)モデルを提案する。
Elastix と 2 つのDL-based method を用いた従来の GW 登録との比較により,提案手法により性能が向上し,計算時間が大幅に短縮された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:52:32 GMT)
ViTNF: Leveraging Neural Fields to Boost Vision Transformers in Generalized Category Discovery [1.2] 一般カテゴリー発見(GCD)は、オープンワールド認識において一般的な課題である。
事前トレーニング、メタトレーニング、微調整を活用することで、ViTは優れた数ショット学習機能を実現する。
本稿では,頭部をニューラルネットワークに置き換えた新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:06:01 GMT)
Adiabaticity violation under arbitrarily slow evolution [1.2] 任意に遅いプロセスでも断熱性は破れることを示す。
この発見は、量子進化の理解を再考し、量子コンピューティング、トポロジカル物理学、フォトニックテクノロジーの可能性を秘めている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:29:58 GMT)
Minimal Neuron Circuits -- Part I: Resonators [1.2] スパイキングニューロンは、作用電位を発射する決定を決定する計算単位として機能する。
この研究は、生物学的に可塑性でスケーラブルなスパイキングニューロンをハードウェアに実装するための方法論を示す。
より複雑なHodgkin-Huxleyモデルよりも、$I_Na,p+I_K$モデルを模倣したニューロンを設計することがより効率的であることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:32:37 GMT)
GvT: A Graph-based Vision Transformer with Talking-Heads Utilizing Sparsity, Trained from Scratch on Small Datasets [1.2] グラフ畳み込みプロジェクションとグラフプーリングを利用するグラフベースビジョントランス (GvT) を提案する。
GvTは、大規模なデータセットを事前トレーニングすることなく、深層畳み込みネットワークに匹敵する、あるいは優れた結果をもたらす。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:00:29 GMT)
Information Science Principles of Machine Learning: A Causal Chain Meta-Framework Based on Formalized Information Mapping [1.1] 本研究は、機械学習における統一的な論理的枠組みの欠如に対処することに焦点を当てる。
モデル解釈可能性と倫理的安全性に関する普遍的な定義が提案されている。
3つの重要な定理は、モデル解釈可能性と情報回復可能性の等価性、倫理的安全性の保証、一般化誤差の推定である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:32:24 GMT)
DistRAG: Towards Distance-Based Spatial Reasoning in LLMs [1.1] 我々は,LLMが学習中に明示的に学習されていない関連空間情報を検索することのできる新しいアプローチであるDistRAGを開発した。
本手法は,都市と町の間の測地距離をグラフにエンコードし,その問合せに関連する文脈部分グラフを検索する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:10:39 GMT)
Evaluating Large Language Models for Zero-Shot Disease Labeling in CT Radiology Reports Across Organ Systems [1.1] 胸部,腹部,骨盤CTの多自由度ラベル付けのためのルールベースアルゴリズム(RBA),RadBERT,および3つの軽量オープンウェイトLCMを比較した。
コーエンのKappaとマイクロ/マクロ平均F1スコアを用いて評価した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:00:08 GMT)
Causal Explainability of Machine Learning in Heart Failure Prediction from Electronic Health Records [1.1] 統計的相関や機械学習(ML)を用いて, 疾患予後における臨床変数の重要性を解説する。
本稿では, 心不全(HF)患者のコホートから得られた臨床変数を用いて, 統計学的およびML的文脈において得られた重要な変数の因果的説明可能性について検討する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:46:13 GMT)
ReSpace: Text-Driven 3D Scene Synthesis and Editing with Preference Alignment [1.1] ReSpaceはテキスト駆動型屋内シーン合成と編集のための生成フレームワークである。
教師付き微調整と選好アライメントを組み合わせた二段階学習手法を応用した。
シーン編集にはゼロショットLLMを用いてオブジェクトの削除と追加のプロンプトを行う。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:22:04 GMT)
Effective Dual-Region Augmentation for Reduced Reliance on Large Amounts of Labeled Data [1.1] 本稿では,大規模ラベル付きデータセットへの依存を減らすために,新しい二重領域拡張手法を提案する。
提案手法は,前景オブジェクトにランダムノイズ摂動を適用することで,対象データ変換を行う。
構造化変換によるトレーニングデータの拡大により,ドメイン間のモデル一般化が可能となる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:43:25 GMT)
A Trustworthiness-based Metaphysics of Artificial Intelligence Systems [1.1] 我々は,AIシステムのメタ物理的同一性の理論を導入する。
私たちは、それらの種類を特徴付け、アイデンティティ基準を導入することでそうします。
我々のアプローチは、AIシステムのアイデンティティと永続性は、社会技術的文脈に敏感であることを示唆している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:45:46 GMT)
HRTR: A Single-stage Transformer for Fine-grained Sub-second Action Segmentation in Stroke Rehabilitation [1.1] 単一段変圧器における高分解能(細粒度)サブ秒動作の時間的局所化と分類を行うための高分解能時間変換器(HRTR)を提案する。
HRTRはストローク関連と一般的なデータセットの両方で最先端のシステムより優れている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:42:15 GMT)
SG2VID: Scene Graphs Enable Fine-Grained Control for Video Synthesis [1.1] SG2VIDは,Scene Graphsを利用した拡散型ビデオモデルである。
白内障と胆嚢摘出術を併用した3つの公開データセットでSG2VIDの能力を実証した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:02:38 GMT)
A Survey of Deep Learning Video Super-Resolution [1.1] ビデオ超解像(VSR)は低レベルコンピュータビジョンにおける顕著な研究課題である。
深層学習技術は、VSR研究において重要な役割を果たしている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:42:19 GMT)
Validating remotely sensed biomass estimates with forest inventory data in the western US [1.1] 高分解能で地上のバイオマス(AGB)とその密度(AGBD)をモニタリングすることは、炭素会計と生態系管理に不可欠である。
NASAの地球環境ダイナミクス調査(Global Ecosystem Dynamics Investigation, GEDI)のLiDARミッションは、AGBD推定のためのグローバルに分散した基準測定を提供するが、GEDIに基づく商用リモートセンシング製品の大部分は、厳密な検証や独立した検証は行われていない。
本稿では,米国森林局フォレスト・インベントリー・アンド・アナリティクス(FIA)プログラムからの独立参照データに基づいて,terraPulse社が提供するAGBDデータセットの独立地域検証を行う。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:50:37 GMT)
Natural Language Processing to Enhance Deliberation in Political Online Discussions: A Survey [1.0] 政治問題や意見交換という形での政治オンライン参加の重要性が高まっている。
議論の質と議論の参加プロセスの質は、プラットフォームやプロセスの設計に大きく依存する。
本研究は、政治オンラインの議論において、どのような問題が起きているのか、機械学習がこれらの問題に対処し、熟考を強化するためにどのように使用できるのかを提示する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:11:49 GMT)
Graph Neural Networks in Multi-Omics Cancer Research: A Structured Survey [1.0] マルチオミクスデータのためのデータ統合は、がんの生物学的基盤を解明するための強力な戦略として現れてきた。
グラフニューラルネットワーク(GNN)の最近の進歩は、異種および構造化オミクスデータをモデル化するための効果的なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:28:02 GMT)
TriPSS: A Tri-Modal Keyframe Extraction Framework Using Perceptual, Structural, and Semantic Representations [1.0] TriPSSは、CIE空間のカラー特徴から知覚的手がかりを効果的に統合する新しい三モードフレームワークである。
TriPSSは、HDBSCANクラスタリングによるビデオコンテンツの適応的なセグメンテーションを可能にする、堅牢なマルチモーダル埋め込みを構築する。
品質評価と重複フィルタリングを取り入れた改良段階は、最終セットが簡潔かつセマンティックにリッチであることを保証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:44:49 GMT)
ABCDEFGH: An Adaptation-Based Convolutional Neural Network-CycleGAN Disease-Courses Evolution Framework Using Generative Models in Health Education [1.0] 本稿では,畳み込みニューラルネットワーク(CNN)とCycleGANを用いた合成医療画像の生成について検討する。
本研究では、畳み込みニューラルネットワーク(CNN)とCycleGANを用いた合成医療画像の生成について検討する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:27:24 GMT)
Can TCOs Transform Cavity-QED? [0.9] 導電性O系TCOは光吸収を著しく減少させる。
超低損失TCOOを用いた空洞QEDシステムの段階的変化を期待する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 06:29:32 GMT)
NNN: Next-Generation Neural Networks for Marketing Measurement [0.9] 我々は、マーケティング計測のための実験的なTransformerベースのニューラルネットワークアプローチであるNNNを提案する。
NNNは、マーケティングおよび有機チャネルの量的および質的な側面をキャプチャするために、リッチな埋め込みを使用する。
L1正規化により、典型的なデータ制約設定において、そのような表現モデルの使用が可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:19:31 GMT)
Optimising the attribute order in Fuzzy Rough Rule Induction [0.9] ファジィ粗集合理論に基づく新しい規則帰納法であるFRRIを導入した。
FRRIは,ルールの精度や数に関して,他のルール誘導法よりも優れていることを示した。
本稿では、既知の手法を用いて属性の順序だけを最適化しても、複数のメトリクス上でのFRRIの性能は向上しないことを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:34:40 GMT)
Decentralized COVID-19 Health System Leveraging Blockchain [0.8] 本稿は、アプリケーションシナリオとして最も一般的な新型コロナウイルスを取り上げ、ブロックチェーンに基づいた新型コロナウイルスの健康システムを設計する。
ブロックチェーンのパブリックで透明な性質が、一部のヘルスデータのプライバシー要件に違反していることを考慮すれば、システム設計段階では、データはパブリックデータとプライベートデータに分割される。
システム実装部では、Hyperledger Fabricアーキテクチャに基づいて、データのアップロード、最新のデータの検索、履歴データなど、システム設計のいくつかの機能を実現する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:19:47 GMT)
Multi-modal brain MRI synthesis based on SwinUNETR [0.8] SwinUNETRは、医療画像解析用に設計された新しいニューラルネットワークアーキテクチャである。
Swin TransformerとCNNを組み合わせることで、SwinUNETRはグローバルなコンテキスト認識と詳細な空間解像度を融合する。
その結果,画像品質,解剖学的整合性,診断値に有意な改善が認められた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:33:52 GMT)
Exploring Explanations Improves the Robustness of In-Context Learning [0.8] 大規模言語モデル(LLM)を活用するためのパラダイムとして、インコンテキスト学習(ICL)が登場した。
我々は、X-ICLを拡張した高度なフレームワークを導入し、あらゆる可能なラベルの説明を体系的に探求する。
複数の自然言語理解データセットの実験結果から,X$2$-ICLの有効性が検証された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:29:14 GMT)
MobCLIP: Learning General-purpose Geospatial Representation at Scale [0.7] 全国初の汎用位置情報エンコーダであるMobCLIPについて紹介する。
新たなCLIPベースのアーキテクチャを採用することで、1億以上のPOI、全国的なリモートセンシング画像、および10億のエッジモビリティグラフによる構造化された人口統計を調整できる。
我々は,MobCLIPが最先端モデルよりも平均35%優れた汎用予測性能を実現することを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:53:41 GMT)
Universal Reusability in Recommender Systems: The Case for Dataset- and Task-Independent Frameworks [0.7] 本稿では,導入障壁を最小限に抑えつつ,レコメンデータシステムの再利用可能性の最大化を目的としたフレームワークを提案する。
本稿では、DTIRSの概念を紹介し、レベル1の自動化からレベル2の自動化に移行するロードマップを確立する。
一般化と特殊化、計算オーバーヘッド、スケーラビリティのトレードオフなど、重要な課題について論じる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:00:34 GMT)
Compositional Learning for Modular Multi-Agent Self-Organizing Networks [0.7] 自己組織化されたネットワークは、複雑なパラメータの相互依存と矛盾する目標からの課題に直面します。
本研究では,CDRL(Compositional Deep Reinforcement Learning)とCPDM(Compositional Predictive Decision-Making)の2つの構成学習手法を紹介する。
モデル複雑性を低減しつつ不均一なエージェントの粒度を管理するために,セルレベルおよびセルペアレベルのエージェントを用いたモジュール型2層フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:33:18 GMT)
Qudits for decomposing multiqubit gates and realizing quantum algorithms [0.7] このコロキウムでは、量子アルゴリズムの効率的な実現に、マルチレベル量子系(quditsとしても知られる)がどのように使用できるかを示すいくつかのアイデアがレビューされている。
Colloquiumの焦点は、マルチキュービットゲートの分解を単純化するためのキューディットの活用と、単一キューディットで複数のキュービットを符号化することで量子情報を圧縮する技術である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:26:57 GMT)
Poster: libdebug, Build Your Own Debugger for a Better (Hello) World [0.7] libは、ユーザランドバイナリ実行ファイルのプログラムによるデバッグのためのPythonライブラリである。
オープンソースプロジェクトとしてリリースされ、コミュニティ全体での使用とコラボレーションを促進する包括的なドキュメントが提供されている。
syscall と lib のブレークポイント処理の中央値のレイテンシは GDB よりも 3 倍から 4 倍低いことがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:14:57 GMT)
Enriching Location Representation with Detailed Semantic Information [0.7] CaLLiPer+は、POI(Point-of-Interest)とカテゴリラベルを統合するCaLLiPerモデルの拡張である。
本研究では、土地利用分類と社会経済状態分布マッピングという2つの下流課題において、その効果を評価する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:06:51 GMT)
Contiguous Zero-Copy for Encrypted Transport Protocols [0.7] プロトコル仕様内のフィールド要素の順序を逆転させることから、この方法論を"Reverso"と呼びます。
本稿では,データ転送中に暗号化プロトコルの実装最適化を行う方法を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:35:39 GMT)
Assessing the Completeness of Traffic Scenario Categories for Automated Highway Driving Functions via Cluster-based Analysis [0.6] この研究は、トラフィックシナリオクラスタリングのためのパイプラインを導入し、シナリオカテゴリの完全性を分析する。
交通シナリオカテゴリーの完全性に対するカテゴリ数の影響を解析した。
その結果,従来よりもクラスタリング性能が優れていた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:24:14 GMT)
VerificAgent: Integrating Expert Knowledge and Fact-Checked Memory for Robust Domain-Specific Task Planning [0.6] 未確認メモリ蓄積はエージェントのパフォーマンスを低下させる。
本稿では,CUA のメモリ管理を効果的に行う新しいフレームワーク VerificAgent を提案する。
OSWorldの生産性タスクでは、VerificAgentは111.1%の相対的な改善を成功率で達成している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:25:49 GMT)
Entity-Augmented Neuroscience Knowledge Retrieval Using Ontology and Semantic Understanding Capability of LLM [0.6] 知識グラフ(KG)は複数の情報源からの知識を統合しリンクすることができる。
神経科学における既存のKGの構築方法は、しばしばラベル付きデータに依存し、ドメインの専門知識を必要とする。
本研究は、未ラベルの大規模神経科学研究コーパスからKGを構築する新しい方法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:59:18 GMT)
Dynamic Consistent $k$-Center Clustering with Optimal Recourse [0.6] 我々は、$k$-centerクラスタリング問題において、決定論的定数係数近似を開発することにより、最適リコース境界を許容することを証明する。
当社のインクリメンタルアルゴリズムは,Charikar,Chekuri,Feder,Motwaniによる8ドルの近似アルゴリズムよりも改善されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:57:12 GMT)
Automated Web Application Testing: End-to-End Test Case Generation with Large Language Models and Screen Transition Graphs [0.6] 本稿では,Webアプリケーションの2つの重要な側面であるサイトナビゲーションとフォームフィリングのためのテストケース自動生成システムを提案する。
サイトナビゲーションでは、画面遷移グラフとLCMを使用してナビゲーションフローをモデル化し、テストシナリオを生成する。
フォームフィリングにはステートグラフを使用して条件付きフォームを処理し、Seleniumスクリプト生成を自動化する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:08:21 GMT)
MINDSTORES: Memory-Informed Neural Decision Synthesis for Task-Oriented Reinforcement in Embodied Systems [0.6] 本研究では,体験向上型計画フレームワークMINDSTORESを導入し,エージェントがメンタルモデルを構築し,活用できるようにする。
MINDSTORES は,既存のメモリベース LLM プランナよりも学習し,その知識を適用している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:08:24 GMT)
Measuring likelihood in cybersecurity [0.6] 本研究は,サイバー露光プロファイルを記述したデータモデルを提案する。
リスクアセスメントのための実用的で定量的な指標のセットを提案し,サイバーセキュリティ実践者が可能性を測定することを可能にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:32:05 GMT)
FlySearch: Exploring how vision-language models explore [0.5] 複雑な場面でオブジェクトを検索してナビゲートするための3D,屋外,環境であるFlySearchを紹介した。
我々は最先端のビジョン・ランゲージ・モデル(VLM)が、最も単純な探索作業でさえ確実に解決できないことを観察する。
我々は、視覚からコンテキスト誤解、タスク計画失敗に至るまで、中心的な原因のセットを特定し、それらの一部が微調整によって対処可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:03:42 GMT)
Smartflow: Enabling Scalable Spatiotemporal Geospatial Research [0.5] オープンソースツールとテクノロジ上に構築されたスケーラブルなリサーチを可能にする,クラウドベースのフレームワークであるSmartflowを紹介します。
STACに準拠したカタログを共通入力として、異種データを標準化されたデータアーカイブに処理することができる。
大規模な地理的領域を監視するために,Smartflowを用いて構築された新しいニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:58:52 GMT)
Readout-induced leakage of the fluxonium qubit [0.5] 分散読み出しは超伝導量子ビットの高忠実度測定に広く用いられている。
共振器光子は、量子ビット部分空間内および外部の両方でフラクソニウムの遷移を誘導することを示す。
非QND効果を説明するためには,フラキソニウム共振器系と外部スプリアスモードとの結合が不可欠である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:12:18 GMT)
Cold hybrid electrical-optical ion trap [0.5] ポールトラップと光ツイーザーを組み合わせたハイブリッドイオントラップ法
特徴は、$s$-wave状態におけるイオンと原子の間の冷たい衝突を可能にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:50:58 GMT)
The Cloud Next Door: Investigating the Environmental and Socioeconomic Strain of Datacenters on Local Communities [0.5] データセンターは現代のデジタルインフラのバックボーンとなっている。
この拡張は、データセンターがすでに存在するか、提案されている地域社会で緊張が高まっている。
私たちの目標は、これらの影響を可視化し、デジタルインフラストラクチャの将来について、より公平でインフォームドな決定を促すことです。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:21:53 GMT)
Student Perspectives on the Benefits and Risks of AI in Education [0.5] 近年,人工知能(AI)を用いたチャットボットの教育的利用が増加している。
これらの技術の採用は、学術的完全性、生徒が個別に問題解決する能力、潜在的なバイアスに影響を及ぼす懸念を提起している。
学生の視点や経験をよりよく理解するために,米国の大公立大学で調査を行った。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:34:31 GMT)
Synthetic Iris Image Databases and Identity Leakage: Risks and Mitigation Strategies [0.5] アイリスデータを合成する方法は、手作りの画像処理技術から、GANベースの画像生成装置の様々なイテレーションまで様々である。
トレーニングセットからの個々の生体情報漏洩のリスクを考慮し,その防止戦略について検討した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:41:43 GMT)
Measurement-free reconstruction circuit of quantum secrets in quantum secret sharing [0.5] 安定化符号に基づく量子シークレット共有における量子シークレットの無測定再構成回路を提案する。
我々の再構成回路は幅$k+|J|$で、$O(k|J|)$1または2量子のユニタリゲートからなる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:57:26 GMT)
Product Quantization for Surface Soil Similarity [0.4] 土壌研究者は人間の可視化の限界を超えて、高次元データセットの分類を作成します。
このパイプラインは、特定のアプリケーションに適合するように構築されたクラスで、高度に正確で柔軟な土を生産できる。
この作業で概説された機械学習パイプラインは、製品量子化とパラメータと出力の体系的な評価を組み合わせて、最高の結果を得る。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:31:34 GMT)
Reciprocal Floquet Thermalization in one dimensional Rydberg atom array [0.4] 一次元Rydberg原子配列における熱化ダイナミクスを操り研究する。
レーザーデチューニングとRydberg原子間相互作用とFloquet周期が相互対である場合にトリガーされる新しい逆フロック熱化機構を同定する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:38:01 GMT)
Application of convolutional neural networks in image super-resolution [0.4] 畳み込みニューラルネットワーク(CNN)は、画像超解像の主流の手法となっている。
異なるタイプの深層学習方法には大きな違いがある。
本稿では,まず画像超解像におけるCNNの原理を紹介し,次にCNNをベースとしたバイキュビック,近傍,双線形,変換畳み込み,サブピクセル層,画像超解像のためのメタアップサンプリングを紹介する。
最後に, 画像超解像におけるCNNの発展を促進するため, 研究の潜在的なポイントと欠点を概説し, 論文全体を要約する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:28:08 GMT)
A Review of Various Datasets for Machine Learning Algorithm-Based Intrusion Detection System: Advances and Challenges [0.4] IDSは、不正アクセスを防止し、機密情報を保護するために、コンピュータネットワークをセキュリティ脅威から保護し、通知し、適切なアクションを取ることを目的としている。
研究者は、一般的なデータセットを機械学習アルゴリズムに組み込むことで、IDSの有効性を高めている。
本稿では、侵入検知システム(IDS)を捕捉・レビューする方法について検討し、既存のデータセットが直面する課題を評価する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:47:21 GMT)
How To Save Fees in Bitcoin Smart Contracts: a Simple Optimistic Off-chain Protocol [0.4] 私たちはBitcoinにおけるスマートコントラクトの実行を検討します。
当社では,Bitcoin契約の実行の大部分をオフチェーンで実行するプロトコルを導入しています。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:13:30 GMT)
Solving the Pod Repositioning Problem with Deep Reinforced Adaptive Large Neighborhood Search [0.4] Robotic Mobile Fulfillment Systems のPod Repositioning Problem (PRP) では、ピックステーションから戻ってくるポッドの最適な保管場所を選択する。
本研究では,大規模近傍探索(ALNS)と深層強化学習(DRL)を統合した改良型解法を提案する。
DRLエージェントは、破壊修理演算子を動的に選択し、探索中に破壊度や受容閾値などのキーパラメータを調整する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:07:41 GMT)
Denoising Graph Super-Resolution towards Improved Collider Event Reconstruction [0.4] 超高分解能技術はLHCライクな再構築パイプラインに統合することができ、温度計の粒度を高め、ノイズを抑制することができる。
本稿では, 改良された粒子再構成品質と解釈性を提供する変圧器を用いた新しい粒子流モデルを提案する。
以上の結果から,超解像はコライダー実験に容易に応用できることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:58:49 GMT)
Exploiting Uncertainty for Querying Inconsistent Description Logics Knowledge Bases [0.3] 我々は、この問題を解決するために、disPONTEと呼ばれる既存の確率論的意味論を利用する。
提案手法をTRILLとBUNDLEに実装し,提案手法の有効性を実証的に検証した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:39:32 GMT)
A Time-Enhanced Data Disentanglement Network for Traffic Flow Forecasting [0.3] 交通流予測(TEDDN)のための時間拡張データ分散ネットワーク
TEDDNは、もともと複雑で絡み合ったトラフィックデータを安定したパターンとトレンドに分解する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:28:48 GMT)
Conti Inc.: Understanding the Internal Discussions of a large Ransomware-as-a-Service Operator with Machine Learning [0.3] 本稿では、機械学習技術を用いて、Conti RaaSチャットリークの主な話題について分析する。
その結果、Contiの議論のかなりの割合は非技術関連であることが示唆された。
RaaSはサイバー犯罪業界における特殊化の例であるが、一つのトピックに特化しているメンバーはわずかである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:29:32 GMT)
taz2024full: Analysing German Newspapers for Gender Bias and Discrimination across Decades [0.2] われわれは1980年から2024年にかけてドイツで発行された新聞記事の最大のコーパスであるtaz2024fullを紹介している。
偏見と差別研究のためのコーパスの有用性の実証として、私たちは40年間の報告を通して性別の表現を分析した。
スケーラブルで構造化された分析パイプラインを用いて、ドイツのジャーナリストのテキストでアクターの言及、感情、言語的フレーミングを研究する基盤を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:24:33 GMT)
Ask a Local: Detecting Hallucinations With Specialized Model Divergence [0.2] 本研究では,大規模言語モデルに対する新しい幻覚検出手法であるAsk a Localを紹介する。
提案手法は,言語特化モデルのパープレキシティ分布のばらつきを計算し,ハロゲン化の可能性のあるスパンを同定する。
そこで本研究では,14言語にまたがる人間による質問応答データセットについて,一貫した性能を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:00:49 GMT)
On the class of coding optimality of human languages and the origins of Zipf's law [0.2] コーディングシステムに最適な新しいクラスを提示する。
そのクラスの中で、Zipfの法則、サイズランク法則、サイズ確率法則は群のような構造を形成する。
Zipfの法則と十分な一致を示すすべての言語は、クラスのメンバーである可能性がある。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:00:20 GMT)
Duality-preserving deformation of 3+1d lattice $\mathbb Z_2$ gauge theory with exact gapped ground states [0.2] 3+1d格子$mathbbZ$ゲージ理論の変形を解析する。
有限体積でも(周期立方体格子上で)9つの正確な退化基底状態が見つかる。
我々のモデルでは、自発的に壊れたウェグナー双対性対称性を持つギャップ付き位相を実現する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:28:12 GMT)
GenFair: Systematic Test Generation for Fairness Fault Detection in Large Language Models [0.1] 大規模言語モデル(LLM)は、ますます重要なドメインにデプロイされるようになっているが、トレーニングデータから受け継がれたバイアスがしばしば現れ、公平性に関する懸念がもたらされる。
この研究は、フェアネス違反を効果的に検出する問題、特に既存のテンプレートベースおよび文法ベースのテスト手法でしばしば見逃される交叉バイアスに焦点をあてる。
我々は、同値分割、突然変異演算子、境界値解析を用いて、ソーステストケースを生成する変成フェアネステストフレームワークGenFairを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:00:30 GMT)
HiLO: High-Level Object Fusion for Autonomous Driving using Transformers [0.1] 高レベル融合法は、より低い計算要求で堅牢性を提供する。
本稿では,適応カルマンフィルタ (AKF) を改良し,HILOと呼ばれる新しいトランスフォーマーに基づく高レベルオブジェクト融合法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:44:35 GMT)
Binary Cumulative Encoding meets Time Series Forecasting [0.1] 単調なバイナリベクトルにスカラーターゲットを表すバイナリ累積符号化(BCE)を導入する。
BCEはオーダとマグニチュード情報を暗黙的に保存し、モデルが分類フレームワーク内で動作しながら、距離対応の表現を学習できるようにする。
提案手法は,より少ないパラメータを必要とせず,より高速な学習が可能でありながら,点予測と確率予測の両方で広く用いられている手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:11:30 GMT)
MC-PDFT Nuclear Gradients and L-PDFT Energies with Meta and Hybrid Meta On-Top Functionals for Ground- and Excited-State Geometry Optimization and Vertical Excitation Energies [0.1] メタGAおよびハイブリッドメタGAオントップ関数を用いたMC-PDFT計算のための解析的核勾配法を開発した。
MC-PDFT計算はオントップ関数の微分を含むため、メタGAオントップ関数をL-PDFT単点エネルギー計算に使用することもできる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:44:07 GMT)
Conjectured Bounds for 2-Local Hamiltonians via Token Graphs [0.1] グラフ$G$上の量子マックスコート、XY、EPRハミルトンの最大エネルギーは、トークングラフのスペクトル半径が$G$であることを示す。
我々はこれらのスペクトルラジイに対する新たな境界を$G$の性質に基づいて予想する。
我々の予想はまた反強磁性ハイゼンベルクモデルの基底状態エネルギーに単純な境界を与える。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:52:10 GMT)
Improving Transformer Performance for French Clinical Notes Classification Using Mixture of Experts on a Limited Dataset [0.1] トランスフォーマーベースのモデルは、自然言語処理において顕著な結果を示しているが、小規模臨床テキストの分類のような応用では課題に直面している。
本研究は,CHU Sainte-Justine病院における小規模臨床テキストの分類のための,Mixture of Expert (MoE) Transformerモデルを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:08:30 GMT)
Prediction of the Most Fire-Sensitive Point in Building Structures with Differentiable Agents for Thermal Simulators [0.1] 本稿では,MFSP(Mest Fire-Sensitive Point)の概念と,その識別のための効率的な機械学習フレームワークを提案する。
MFSPは、火災が開始すれば建物の安定性に最も深刻な有害な影響をもたらす場所と定義されている。
本フレームワークでは,従来の有限要素解析(FEA)シミュレータにおいて,グラフニューラルネットワーク(GNN)が効率的かつ微分可能なエージェントとして機能する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:40:56 GMT)
$^{229}$Th Nuclear Spectroscopy in an Opaque Material: Laser-Based Conversion Electron Mössbauer Spectroscopy of $^{229}$ThO$_2$ [0.0] 229ドルの核異性体状態におけるレーザー誘起変換電子M"オスバウアー分光の最初のデモンストレーションを示す。
蛍光分光法とは異なり、この技術は、仕事機能が核移行エネルギーより小さい材料と互換性がある。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:54:46 GMT)
Open-PMC-18M: A High-Fidelity Large Scale Medical Dataset for Multimodal Representation Learning [0.0] 本稿では,トランスを用いたオブジェクト検出に基づくスケーラブルなサブフィギュア抽出パイプラインを提案する。
我々は,大規模バイオメディカルビジョン言語データセットであるOPEN-PMC-18Mをリリースする。
検索性能の改善,ゼロショット分類,ロバストネスベンチマークを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:53:19 GMT)
ss-Mamba: Semantic-Spline Selective State-Space Model [0.0] ss-Mambaは、セマンティック・アウェアの埋め込みと適応スプラインベースの時間符号化を統合することで時系列予測を強化する新しい基礎モデルである。
ss-Mambaは,時系列予測における従来のトランスフォーマーモデルに代わる汎用的で効率的な代替手段として,優れた精度,堅牢性,解釈性を提供することを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:26:57 GMT)
petBrain: A New Pipeline for Amyloid, Tau Tangles and Neurodegeneration Quantification Using PET and MRI [0.0] PETとMRIを用いたアミロイド(A), 神経原線維タングル(T2), 神経変性(N)の定量化は, アルツハイマー病の診断と予後に重要である。
既存のパイプラインは、トレーサタイプの処理時間の変動に関する制限に直面している。
我々は,アミロイドPET,タウPET,構造MRIのための新しいエンドツーエンド処理パイプラインである petBrain を開発した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:44:04 GMT)
eGAD! double descent is explained by Generalized Aliasing Decomposition [0.0] 本稿では,予測性能とモデル複雑性の関係を説明するため,GAD(Generalized Aliasing decomposition)と呼ぶ新しい分解法を提案する。
GADは予測誤差を3つの部分に分解する: 1) パラメータの数がデータポイントの数よりもはるかに小さい場合に支配するモデル不整合、2) データ不整合、3) パラメータの数がデータポイントの数よりはるかに大きいときに支配するデータ不整合、3) 一般化エイリアス。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:49:30 GMT)
Vulnerability Management Chaining: An Integrated Framework for Efficient Cybersecurity Risk Prioritization [0.0] サイバーセキュリティチームは圧倒的な脆弱性の危機に直面している。
従来のCVSSベースの優先順位付けでは、すべての脆弱性の60%に対処しつつ、実際に悪用された脆弱性の20%を正しく識別する必要がある。
我々は、脆弱性管理をリアクティブパッチから戦略的脅威駆動優先順位付けへ変換する脆弱性管理チェインを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:07:03 GMT)
ViFOR: A Fourier-Enhanced Vision Transformer for Multi-Image Super-Resolution in Earth System [0.0] 超解像(SR)は、地球系モデル(ESM)データの空間分解能を高めるために重要である。
本稿では、視覚変換器(ViT)とFourier-based Implicit Neural Representation Networks(INR)を統合した新しいSRアルゴリズムViFORを紹介する。
ViFORは、Pak Signal-to-Noise Ratio (PSNR) と Mean Squared Error (MSE) で、ViT、SIREN、SRGANといった最先端の手法を一貫して上回っている。
これらの結果は、ViFORの有効性と高分解能気候データ解析の進歩の可能性を強調している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:17:00 GMT)
Validation of Quantum Elliptic Curve Point Addition Circuits [0.0] 特定の量子アルゴリズムは、理論を破る楕円曲線暗号プロトコルが存在する。
これらのアルゴリズムを実装するには楕円曲線演算を行う量子回路を設計する必要がある。
優先ゲートコストを増大させることなく、回路の修正を行う。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:06:18 GMT)
Uncertainty, von Neumann Entropy, and Squeezing in a Bipartite State of Two-Level Atoms [0.0] 両部状態が絡み合っているとき、複合状態のフォン・ノイマンエントロピーは部分系のものよりも小さいことを示す。
これはエントロピーが大きくなるほど不確実性が大きくなるという一般的な考えと矛盾する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:26:19 GMT)
Transverse Distance Estimation with Higher-Order Hermite-Gauss modes [0.0] 隣接する2つの空間モードへの射影測定によって最適なフィッシャー情報が得られることを示す。
解析結果を任意の変位値に拡張し、フィッシャー情報に対する一般表現を導出する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:26:29 GMT)
Transforming Automatically BPMN Models to Smart Contracts with Nested Collaborative Transactions (TABS+) [0.0] ビジネスプロセスモデルと表記 BPMNモデリングを使用して、商品やサービスの取引に対するアプリケーション要件を記述します。
このアプローチでは、BPMNモデルを分析して、BPMNモデル内のどのパターンが協調トランザクションとして使われるのに適しているかを決定します。
私たちのアプローチはBPMNモデルをスマートコントラクトに自動的に変換し、ネストしたトランザクションのトランザクション特性を強制するためのトランザクションメカニズムを提供します。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:37:41 GMT)
Towards violations of Local Friendliness with quantum computers [0.0] ローカルフレンドリ(LF)の不平等は、現実に関する合理的な仮定から導かれる。
EWFSの思考実験は、教科書の量子力学がこれらの不等式に反することを示している。
EWFSはフォトニックキュービットを使用して、友人のそれぞれの役割を担い、LFの違反を測定している。
この回路は量子シミュレータやハードウェアデバイス上で動作し、システムサイズがスケールするにつれてLF違反を観測する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:18:33 GMT)
Towards Analyzing and Understanding the Limitations of VAPO: A Theoretical Perspective [0.0] 強化学習(RL)は、複雑なロングチェーン・オブ・ソート(ロングCoT)推論において、大きな言語モデル(LLM)を強化する。
VAPOの制限は、クレジット割り当てにおける固有の困難、時間的に抽象化された目標を持つ価値関数表現能力、グローバルバリューシグナルを局所的な政策改善に変換することに起因すると我々は主張する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:20:47 GMT)
Torsional Regularization of Self-Energy and Bare Mass of Electron [0.0] トーションは、標準の自己エネルギーの紫外線拡散をなくすことが示される。
また、赤外線の発散が欠如していることも示している。
最後に、電子、ミューオン、タウレプトンの有限個の素質量を計算する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:26:00 GMT)
Torsion in Persistent Homology and Neural Networks [0.0] 我々は、符号化中にねじれが失われ、潜伏空間で変化し、多くの場合、標準デコーダによって再構成されないことを示す。
本研究は, フィールドベースアプローチの重要な限界を明らかにし, ねじれ情報を保存するアーキテクチャや損失項の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:29:06 GMT)
Topology meets symmetry breaking: Hidden order, intrinsically gapless topological states and finite-temperature topological transitions [0.0] 内在的および対称性に保護されたトポロジカル秩序(SPT)は、量子多体基底状態(主にギャップを持つ)で発見されている。
これらは一般にゼロ温度現象と見なされ、その空隙のない基底状態や熱ゆらぎに対する頑丈さは、取り組まなければならない。
我々は,IsingクラスとBKTクラスにおいて,それぞれ2種類の有限温度SPT遷移を予測するために構成を適用した。
隠されたIsingの順序を特徴とする状態はギャップがあるが、BKT-SPT遷移に関連する他のSPT状態は、$U(1)$またはXYを隠している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:59:20 GMT)
Token and Span Classification for Entity Recognition in French Historical Encyclopedias [0.0] 歴史的テキストにおける名前付きエンティティ認識(NER)は、非標準化言語、古文書正書法、ネストまたは重複エンティティによる固有の課題を示す。
本研究は、古典的条件ランダムフィールド(CRF)やスパシーベースのモデルからトランスフォーマーベースのアーキテクチャまで、さまざまなNERアプローチのベンチマークを行う。
実験は18世紀のフランスの百科事典から派生した豊富な注釈付きコーパスであるGeoEDdAデータセット上で行われた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:37:44 GMT)
Time-cost-error trade-off relation in thermodynamics: The third law and beyond [0.0] 冷却の文脈では、熱力学の第3法則の不整合原理は「無限の資源」が絶対零点に達するために必要であると主張する。
完全占有状態と占有状態からなる「分離状態」の概念を導入し、対応する熱力学的コストと誤差を定式化する。
これらの結果は、マルコフ力学と非マルコフ力学の両方を含む量子状態に拡張する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:38:18 GMT)
TherMod Communication: Low Power or Hot Air? [0.0] Basar が提案した TherMod は KLJN スキームの "低消費電力" 実装であると主張している。
バザーの無線適応に固有の追加部品は、消費電力を大幅に増加させると説明する。
我々は、元のKLJN方式のセキュリティ要求が、この無線適応に直接翻訳されることはなく、重大なセキュリティ侵害を示唆していることを明らかにした。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:52:10 GMT)
Theory of Angle Resolved Photoemission Spectroscopy of Altermagnetic Mott Insulators [0.0] オルター磁性は、空間的回転対称性を持つコリニア磁気の非伝統的な形態として出現している。
我々は、磁気モット絶縁体の角度分解光電子分光(ARPES)応答の理論を開発する。
我々の研究は、磁気モット絶縁体におけるドーピング効果と相関現象の系統的研究の道を開く。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:00:14 GMT)
The perfect entangler spectrum as a tool to analyze crosstalk [0.0] Crosstalkは、量子コンピュータをスケールアップする上で重要な障害である。
我々は、望ましくない絡み合いにつながるダイナミックなクロストークを識別する手段として、完全絡み合いスペクトルを導入した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:58:50 GMT)
The effects of using created synthetic images in computer vision training [0.0] 本稿では,Unreal Engine 4(UE)のようなレンダリングエンジンを用いて,深層コンピュータビジョン(CV)モデルのためのデータセットを補完する合成画像を作成する方法について検討する。
UEのレンダリングされた合成イメージを使用することで、開発者やビジネスに、ほぼ無制限で再現性があり、アジャイルで、安価なトレーニングセットにアクセスする方法を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:20:24 GMT)
The anomalously slow dynamics of inhomogeneous quantum annealing [0.0] 我々は、単に熱力学ではなく、IQAの力学を研究し、相図が示唆するよりもかなり遅いことを発見した。
さらに、非平均場モデルでは、一階遷移は非常に一般的であることが示される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:00:02 GMT)
The Initial Experimental Guide to Implement QKD Polarization Encoding System at Telecom Wavelength [0.0] 偏光符号化システムは、十分な周波数で弱コヒーレントパルスを用いて提示される。
5$km長繊維リンクの場合、キーレートは1秒あたり10$bitsに制限される。
この実験の目的は, 水平偏光と垂直偏光を単一偏光基底, すなわち水平偏光と垂直偏光のみを用いて, 設定の実現可能性を検証することである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:09:31 GMT)
Textual-Based vs. Thinging Machines Conceptual Modeling [0.0] ソフトウェアエンジニアは通常、自然言語でドメイン記述を解釈し、概念モデルに変換する。
このドメインモデリングでは、テキスト言語、図形言語、およびテキストとダイアグラムを混合した3つのアプローチが使用される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:00:26 GMT)
Technical Options for Flexible Hardware-Enabled Guarantees [0.0] 本稿では,AI開発における計算利用に関する検証可能な主張を可能にするために,AIアクセラレータハードウェアを統合したシステムを提案する。
flexHEGシステムは、アクセルの使用を監視し、特定の規則に準拠することを検証する監査可能な保証プロセッサと、物理的な改ざん保護を提供するセキュア・エンクロージャーの2つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:37:43 GMT)
Taming the Interacting Particle Langevin Algorithm: The Superlinear case [0.0] 我々は、この非線型性の下で、タグ付き相互作用粒子ランゲヴィンアルゴリズム(tIPLA)と呼ばれる新しい安定なクラスを開発する。
我々はワッサーシュタイン2距離の非漸近収束誤差推定値を得る。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:09:46 GMT)
Talk2SAM: Text-Guided Semantic Enhancement for Complex-Shaped Object Segmentation [0.0] 本研究では,オブジェクトセグメンテーションを改善するためにテキストガイダンスを統合する新しいアプローチであるTalk2SAMを提案する。
ユーザが提供するテキストプロンプトから派生したCLIPベースの埋め込みを使用して、関連する意味領域を識別する。
Talk2SAMはSAM-HQを一貫して上回り、IoUは+5.9%、IoUは+8.3%である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:53:10 GMT)
Strongly regular and strongly walk-regular graphs that admit perfect state transfer [0.0] グラフの2つの重要なクラス、すなわち強い正則グラフと強い歩行正則グラフについて、Grover walkにおける完全状態移動について研究する。
まず、完全状態移動を許容する強正則グラフの完全な分類を与える。そのようなグラフは、完全二部グラフ $K_2,2 と完全グラフ $K_2,2,2 のみである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:10:06 GMT)
Spatially Resolved Optical Responses of a High-Kinetic-Inductance Microwave Resonator [0.0] 本研究では, NbTiNナノワイヤ共振器の局所光応答をレーザ走査型マイクロ波分光システムと希釈冷凍機と一体化して測定した。
共振器の光学応答は共振モードと位置との相関を示し、共振器の周りの2レベル系に起因する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:40:59 GMT)
Slim attention: cut your context memory in half without loss -- K-cache is all you need for MHA [0.0] MHA(multi-head attention)を有する変圧器モデルにおけるスリムアテンションによる文脈記憶の2倍縮小
エンコーダ・デコーダ変換器では、コンテキストメモリをさらに小さくすることができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:04:10 GMT)
Sink equilibria and the attractors of learning in games [0.0] 制限行動(すなわち、引き付け子)を特徴づけることは、ゲーム理論における最も基本的なオープンな問題の一つである。
近年の研究では、ゲームのアトラクションが一対多にあると推測されている。
我々は,誘引者を特徴付ける問題について3つの進歩を遂げる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:40:59 GMT)
Single-qubit probes for temperature estimation in the presence of collective baths [0.0] 2つのキュービットの系を考えると、それぞれが共用浴に結合しながら、それぞれの浴に局所的に散布される。
本研究では,各浴室の温度推定のシナリオについて検討した。
本研究では,コモンバスによって誘導されるラムシフトが,リモート温度センサの実現に重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:02:55 GMT)
Simulating dynamics of correlated matter with neural quantum states [0.0] ニューラル量子状態は、これまでアクセスできない状態における多体量子システムの時間的進化を研究する新しい計算ツールとして登場しつつある。
本稿では, 時間伝搬法の違い, 報告アプリケーションの概要, 今後の課題について考察する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:55:10 GMT)
Simulated Non-Abelian Statistics of Majorana Zero Modes from a Kitaev Lattice [0.0] 量子コンピュータ上でのマヨラナゼロモード(MZM)の非アベリア交換をシミュレートする。
スピンハミルトニアンの観点から、2と4のMZMを編むためのプロトコルを詳述する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:22:36 GMT)
Simple yet Accurate Stochastic Approach to the Quantum Phase Noise of Nanolasers [0.0] 低電力レベルで動作するナノレーザーは、固有の量子ノイズの影響を強く受けている。
レーザー量子ノイズの簡単なモデルを提案する。
この手法は、ラシングへの移行を通して線幅を計算するために使われる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:03:02 GMT)
Sequence modeling of higher-order wave modes of binary black hole mergers [0.0] 準円、回転、非精密な二元ブラックホールの融合による高次重力波モードは、これらの系の非線形力学に関する重要な情報を符号化する。
我々はこれらの波形をトランスフォーマーアーキテクチャを用いてモデル化し、リングダウンによる晩期から晩期までの進化を目標にしている。
以上の結果から,変圧器を用いたモデルでは,双対ブラックホール融合の非線形ダイナミクスを高精度に捉えることが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:32:28 GMT)
Semicontinuity bounds for the von Neumann entropy and partial majorization [0.0] 我々は、$S(rho)-S(sigma)$と州$rho$に課されるランク/エネルギー制約の差について、厳密な上限の族を考える。
これらの族内の上限は部分的偏化のパラメータ$m$に依存する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:56:21 GMT)
Selective Addressing of Coupled Qubits via Complex Frequency Zero Targeting [0.0] この研究は、複素周波数(CF)パルスを用いたロバストなアプローチを導入する。
まず、ハイゼンベルク方程式を用いて系の応答を導出し、系の散逸性の性質を本質的に考慮した適切なパルスを設計し、3つの結合した2レベルエミッター系の理論的枠組みを開発する。
その結果、CFパルスは、隣接する量子ビットに対するクロストークを著しく抑制したターゲット量子ビットを選択的に励起することができ、従来のガウスパルスと同等のエネルギーを著しく上回ることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:05:15 GMT)
Scrambling Dynamics with Imperfections in a Solvable Model [0.0] 可解ブラウン回路モデルにおいて、量子スクランブルダイナミクスのプローブが2種類の不完全性にどのように反応するかを考察する。
回路平均ROTOCは演算子重み空間の有効確率分布によって制御されることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:02:55 GMT)
Scalable Distributed Memory Implementation of the Quasi-Adiabatic Propagator Path Integral [0.0] 本研究では,影響係数の粗粒化をマスク支援した分散メモリのスケーラブルな実装を提案する。
この方法は、複数の計算ノードのメモリリソースを利用して、新しいプリマージアルゴリズムによってメモリボトルネックを緩和する。
新しい実装の効率は、大規模な散逸型量子力学シミュレーションで実証されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:56:18 GMT)
Reinforcement Learning Enhanced Greedy Decoding for Quantum Stabilizer Codes over $\mathbb{F}_q$ [0.0] 我々は、分離によって定義される平面曲線から、新しい古典的なゴッパ符号と対応する量子安定器符号を構築する。
これにより,Goppa-およびQuantum-stabilizer符号のクラスをポリノミカル曲線から拡張し,ほぼ最適性能の学習復号器を提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:08:36 GMT)
Real classical shadows [0.0] U が局所あるいは大域クリフォードゲートに対応する場合、W は実数値ベクトルからなる。
提案手法は,様々な状況において,従来のシャドウプロトコルにより,サンプルの複雑さが向上することを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:47:08 GMT)
Rational Superautotrophic Diplomacy (SupraAD); A Conceptual Framework for Alignment Based on Interdisciplinary Findings on the Fundamentals of Cognition [0.0] ラショナル超独立外交(Rational Superautotrophic Diplomacy, SupraAD)は、アライメントのための理論的、学際的な概念的枠組みである。
認知システム分析と器質的合理性モデリングに着目する。
SupraADは、AIより前の課題としてアライメントを再構築し、十分に複雑で協調的なインテリジェンスを損なう。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:28:25 GMT)
Quantum decoherence of gravitational waves [0.0] 重力の量子的性質は、実験的な検証を欠いた基礎物理学において未解決の問題のままである。
古典的なGWとグラビトンを区別するには、量子コヒーレンスを保存する必要がある。
還元密度行列を導出し、デコヒーレンスを評価することにより、GWが量子状態を維持するかどうかを検討する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:59:59 GMT)
Quantum Systems with jump-discontinuous mass. I [0.0] 質量プロファイルがジャンプ不連続を示す1次元の自由量子粒子を考える。
スケールフリー境界条件の族に対しては、関連するスペクトル問題を解析する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:57:23 GMT)
Proposed experiments for detecting contextual hidden variables [0.0] 量子力学の基礎となる文脈隠れ変数を検出できる2つの実験を提案する。
量子力学と一般相対性理論の統一が可能であれば、文脈隠れ変数は「通常のような物理学」であることが示される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:53:39 GMT)
ProcrustesGPT: Compressing LLMs with Structured Matrices and Orthogonal Transformations [0.0] 大規模言語モデル(LLM)は、自然言語処理タスクにおいて印象的な結果を示す。
構造行列表現は、これらのモデルのパラメータの数を減らすための有望な方法である。
重み行列の特定の変換の下で LLM の出力が不変であるという事実を利用する。
この洞察を利用して、構造化クラス内の重みの圧縮性を大幅に向上させる変換を特定できる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:47:23 GMT)
Pivoting the paradigm: the role of spreadsheets in K-12 data science [0.0] すべての状況に適さないが、スプレッドシートはK-12の学生のためのデータとコンピューティングのスキルを育むのに役立つ。
本稿では,K-12データツールの事前フレームワークをレビューし,カリキュラムにスプレッドシートを組み込んだデータ駆動学習結果を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:22:59 GMT)
Permutationally-Invariant N-body gates via Tavis-Cummings Hamiltonian [0.0] 任意の数の量子ビット上のすべての置換不変ユニタリは、Tavis-Cummings Hamiltonian を用いて実現可能であることを示す。
結論として、この相互作用と大域場を用いて、すべての交絡状態に置換的に準備できることが分かる。
n=2量子ビットの場合の明示的回路の様々な例を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:33:49 GMT)
Performance of leading large language models in May 2025 in Membership of the Royal College of General Practitioners-style examination questions: a cross-sectional analysis [0.0] o3、Claude Opus 4、Grok3、およびGemini 2.5 Proは、Royal College of General Practitioners GP SelfTestからランダムに選ばれた100の質問に答えるよう命じられた。
o3, Claude Opus 4, Grok3, Gemini 2.5 Proの合計スコアはそれぞれ99.0%, 95.0%, 95.0%, 95.0%であった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:25:38 GMT)
Orbital angular momentum can take non-integer values in a closed universe [0.0] 量子力学における軌道角運動量のスペクトルは、基底空間が周期的境界を持つときの2つの部分からなることを示す。
スペクトルには半整数値だけでなく、以前は軌道角運動量では不可能と考えられていたが、不合理な値さえ含まれている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:00:04 GMT)
On the success probability of the quantum algorithm for the short DLP [0.0] 我々は,Ekeraa-Haastadのアルゴリズムが単一ランで短い$d$を回復する確率の低い境界を証明した。
私たちの限界によって、成功確率は、任意の短い$d$に対して1から1010$まで容易に押し付けられる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:29:17 GMT)
Olfactory Inertial Odometry: Methodology for Effective Robot Navigation by Scent [0.0] 嗅覚ナビゲーションは、生物が使用する探索の最も原始的なメカニズムの1つである。
本研究は,視覚慣性音韻法(VIO)に類似した嗅覚によるナビゲーションを可能にする嗅覚慣性音韻法(OIO)を定義する。
我々は、農業や食品品質管理における実際の応用に類似した、本物の5-DoFロボットアームに3つの異なるオドアローカライズアルゴリズムを用いて、オドアトラッキングシナリオを実証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:21:12 GMT)
Noiseless signal amplification in an opto-mechanical transducer [0.0] 本稿では、共振型光パラメトリックトランスデューサを用いて、量子発振器に作用する共振型古典的な力の高感度量子検出を行うことを示す。
本手法は、感度の標準量子限界を超える量子バックアクション回避測定を可能にするだけでなく、古典的な信号の無雑音増幅を促進することを実証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:15:23 GMT)
NY Real Estate Racial Equity Analysis via Applied Machine Learning [0.0] 本研究では、ニューヨーク州(NYS)とニューヨーク市(NYC)におけるトラクターレベルの不動産所有パターンを分析し、人種格差を明らかにする。
我々は、先進的な人種・民族の計算モデルを用いて、土地所有者の予測された人種構成と、国勢調査データから住民人口を比較した。
白人は、その人口に対する資産と資産価値の不均等なシェアを持っているのに対し、黒人、ヒスパニック、アジア系コミュニティは、資産所有者として過小評価されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:50:43 GMT)
Multi-mode cooling of a Bose-Einstein condensate with linear quantum feedback [0.0] オービレート準2次元原子ボース・アインシュタイン凝縮(BEC)の運動自由度に対する測定に基づくフィードバック制御を理論的に検討する。
我々は,連続的な測定と制御の下で凝縮体の集合励起の多モードダイナミクスを記述する線形四面体-ガウスモデルを開発した。
本研究は, 単音素平均占有量以下で集団励起を冷却できることを示す分析結果である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 02:26:48 GMT)
Multi-mode NOON states generation with ultracold atoms via geodesic counterdiabatic driving [0.0] 本稿では,超低温原子を用いたNOON生成プロトコルを提案する。
最適化された断熱プロトコルにより,高度に絡み合ったNOON状態の調製に要する時間を大幅に短縮する。
我々の発見は、超低温原子系におけるスケーラブルで高精度な量子状態制御の道を開いた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:58:25 GMT)
Mostly Harmless Methods for QSP-Processing with Laurent Polynomials [0.0] 本稿では,最適化やルートフィリングを伴わない解を同定するQSP処理複合体の手法を提案する。
我々は,本手法の成果を,適切な目標と精度の確保のために実証する。
符号逆関数近似の一般的な選択は、任意の精度の算術を使わずに、既知の全てのQSP処理手法が苦労すべきレギュレーションを特徴づける。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:14:37 GMT)
Model Alignment Search [0.0] 本稿では、因果的介入を通じて行動と神経表現の類似性を結合する手法を提案する。
まず, 凍結ニューラルネットワークから他のニューラルネットワークへ, モデル縫合と同様の方法で動作を伝達できることを示す。
次に、我々の手法が、望むときにモデル縫合とどのように等価であるかを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:11:11 GMT)
Microscopic scales and mechanism of quantum phase transitions in two-dimensional superconducting systems [0.0] 本論文では、クーパー対密度を抑制するペアブレーキング機構により、磁場駆動QPTの統一的な記述が得られることを示す。
この発見は、臨界指数の従来の決定を超えるQPTモデルの開発によって実現された。
このモデルはジョセフソン接合配列や様々な非超伝導材料においてQPTにもうまく適用されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:42:22 GMT)
Matrix Elements of Fermionic Gaussian Operators in Arbitrary Pauli Bases: A Pfaffian Formula [0.0] 任意のパウリ積状態の間のフェルミオンガウス作用素の行列要素に対して、完全に明示的で一般のファフ公式を導入する。
その結果生まれたフレームワークは、さまざまな分野にわたるスケーラブルな計算を可能にします。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:37:06 GMT)
Liouvillian and Hamiltonian exceptional points of atomic vapors: The spectral signatures of quantum jumps [0.0] 4つの超微粒子状態と有効3つの超微粒子状態を用いてモデル化したアルカリ金属原子蒸気のスペクトル特異点について検討した。
非エルミートハミルトニアン(NHH)とリウヴィリア超作用素の固有値スペクトルを比較することにより、半古典的および量子的例外点の出現と特性を分析する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:08:27 GMT)
Lieb-Mattis ordering theorem of electronic energy levels in the thermodynamic limit [0.0] リーブ=マティスの定理は、相互作用するフェルミオンの系全体のスピン$s$の最低エネルギー状態を決定する。
我々はこれらの予測を、N=2$スピノル成分/種以上の$P$粒子のフェルミオン混合物に一般化する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:42:33 GMT)
Learning WENO for entropy stable schemes to solve conservation laws [0.0] TeCNOスキームは任意の高次エントロピー安定有限差分分解器のクラスを形成する。
3階重み付き本質的に非振動(WENO)スキームは、符号特性を満たすように設計されている。
本稿では,DSPWENO(Deep Sign Preserving WENO)と呼ばれるSP-WENOの変種を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:59:58 GMT)
LeYOLO, New Embedded Architecture for Object Detection [0.0] MSCOCOをベース検証セットとして用いたオブジェクト検出モデルに2つの重要な貢献点を紹介する。
まず,SSDLiteに匹敵する推論速度を維持する汎用検出フレームワークであるLeNeckを提案する。
第2に, YOLOアーキテクチャにおける計算効率の向上を目的とした, 効率的なオブジェクト検出モデルであるLeYOLOを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:48:17 GMT)
Labelling Data with Unknown References [0.0] ラベラーとしての性能を測定するための合意された方法が存在する場合、評価者は信頼に値する。
既存の参照を使わずに評価者への信頼を確立するアルゴリズムを導入する。
これは、評価者が実際にコーパスをラベル付けする方法を知っている場合、No-Data Algorithmがその出力を受け入れるように、信頼性を確立するのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:04:22 GMT)
LEG-SLAM: Real-Time Language-Enhanced Gaussian Splatting for SLAM [0.0] LEG-SLAMは、最適化されたガウススプラッティング実装と視覚言語の特徴抽出を融合した新しいアプローチである。
提案手法は,高品質なフォトリアリスティック画像とセマンティックラベル付きシーンマップを同時に生成する。
自律型ロボティクス、拡張現実、その他の対話型ドメインへの潜在的な応用により、LEG-SLAMはリアルタイムなセマンティック3DガウスベースのSLAMにおける重要な一歩である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:51:59 GMT)
Keyed Chaotic Dynamics for Privacy-Preserving Neural Inference [0.0] この研究は、神経推論の安全性を保証するための新しい暗号化手法を導入する。
鍵条件付きカオスグラフ動的システムを構築することにより、ニューラルネットワーク内の実数値テンソルの暗号化と復号化が可能となる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:59:29 GMT)
Is it the end of (generative) linguistics as we know it? [0.0] ピアンタドシによるチョムスキーのアプローチの取り消しは残酷だが、生成言語学者はそれに値する。
言語学における中心的な役割を取り戻すためには、生成言語学は真剣な更新が必要である。
形式的な視点を無視することは、計算と実験の両方のアプローチに大きな欠点をもたらす。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:56:44 GMT)
Investigating Quantum Feature Maps in Quantum Support Vector Machines for Lung Cancer Classification [0.0] 量子支援ベクトルマシン(QSVM)は、重ね合わせや絡み合いのような量子力学的現象を利用して、データ分類のための高次元ヒルベルト空間を構築する。
我々は、異なる量子特徴写像が分類性能にどのように影響するかを分析する。
PauliFeatureMapは3つのサブセットで完全な分類を達成し、全体的なパフォーマンスも向上した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:01:29 GMT)
Intrinsic Hamiltonian of Mean Force and Strong-Coupling Quantum Thermodynamics [0.0] 熱環境に強く結合した量子系に対する普遍的熱力学フレームワークを提案する。
我々は標準弱結合状態と同じゲージ自由を保ち、熱力学エントロピーに対するフォン・ノイマンの表現を保持する。
構造ボソニック貯水池との強い結合のパラダイムモデルに適用し,その枠組みを検証した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:54:07 GMT)
Interference-enhanced light-matter interaction of an optically levitated dielectric particle [0.0] 本研究では,ナノスケール粒子に対する弱い光場の効果を増幅するための干渉に基づくアプローチについて検討する。
弱信号場と強トラップ場を干渉することにより、弱信号場による光力の顕著な増強を実現する。
この改良された相互作用により、79pW/Hz以下の感度で粒子の動きをモニタリングすることで弱い磁場を検出することができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:14:00 GMT)
Integrals of motion as slow modes in dissipative many-body operator dynamics [0.0] 我々は1つ以上の運動積分(IOM)を持つ多体量子系におけるリンドブラディアン作用素のダイナミクスを考える。
より小さなサポートを持つIOMは、一般作用素と比較してフロベニウスノルムがより緩やかに崩壊するという意味で、これらの力学の緩やかなモードとなることを示した。
その結果、最も低い崩壊率を持つリンドブラディアンの固有作用素は、基礎となるハミルトニアンのIOMと大きな重なりを持つ。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:06:01 GMT)
Indefinite Causal Order Skip Logic with Coherently Conditioned Subroutines and Application to Grover Search [0.0] 不定因数順序 (ICO) は、量子回路が演算列をコヒーレントに重畳することを可能にする。
この研究は、新しいユニタリ回路プリミティブであるQuantum Skip Gate (QSG)を導入している。
QSGは操作自体の存在や欠如を重畳し、完全にユニタリな設定で条件量子論理を可能にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 03:58:32 GMT)
Improving Radiology Report Conciseness and Structure via Local Large Language Models [0.0] 放射線医学の報告は長大で非構造的であり、医師を参照する上での課題である。
この振り返り研究は、簡潔でよく構造化された放射線学レポートを強化することを目的としていた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:53:07 GMT)
Improving Heart Rejection Detection in XPCI Images Using Synthetic Data Augmentation [0.0] StyleGANは利用可能な3Rバイオプシーパッチで訓練され、その後、1万のリアルな合成画像を生成するために使用された。
これらは、ResNet-18分類器をバイナリーリジェクション分類のために訓練するための様々な構成において、レジェクション無しのサンプルである実際の0Rサンプルと組み合わせられた。
その結果, 実検体と組み合わせて使用する場合, 合成データにより分類性能が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:06:47 GMT)
Identifying Key Expert Actors in Cybercrime Forums Based on their Technical Expertise [0.0] 本研究は,サイバー犯罪フォーラムとその関連専門家アクターを対象とした,特定の攻撃パターンに関心のあるコミュニティを特定した。
この研究で特定された主要な俳優は、研究人口の約4%を占めている。
第3に、研究人口の約半数は、技術的な専門知識がほとんどないアマチュアである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:07:00 GMT)
INESC-ID @ eRisk 2025: Exploring Fine-Tuned, Similarity-Based, and Prompt-Based Approaches to Depression Symptom Identification [0.0] 本稿では,eRiskの2025 Task 1: Search for Symptoms of Depressionについて述べる。
一連の文章が与えられた後、参加者はうつ病の症状に対して最大1000の文章を提出する任務を負った。
訓練データは、ある文章が関連があるか否かというラベル付き文から成っていた。
本研究では,基礎モデルの微調整,文類似性,Large Language Model(LLM)プロンプト,アンサンブル技術について検討した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:25:12 GMT)
Hybrid Ensemble of Segmentation-Assisted Classification and GBDT for Skin Cancer Detection with Engineered Metadata and Synthetic Lesions from ISIC 2024 Non-Dermoscopic 3D-TBP Images [0.0] 本研究は,皮膚病変の分類のためのハイブリッドマシンと深層学習に基づくアプローチを提案する。
3D全体写真(TBP)から抽出した401,059個の画像からなり、非皮膚内視鏡的なスマートフォンのような状態をエミュレートする。
予測は、エンジニアリングされた特徴と患者固有の関係指標によって強化された、勾配ブースト決定木(GBDT)アンサンブルで融合される。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:00:03 GMT)
High-precision measurement of time delay with frequency-resolved Hong-Ou-Mandel interference of weak coherent states [0.0] 周波数分解した香港-奥羽-マンデル干渉による時間遅延の高精度測定手法を実証する。
我々の装置は、光子のコヒーレンス時間よりもはるかに大きな遅延で分離された光子に対しても高精度な測定を可能にする。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:28:10 GMT)
Hierarchical Question-Answering for Driving Scene Understanding Using Vision-Language Models [0.0] 本稿では,自律走行車におけるシーン理解のための階層的質問応答(QA)手法を提案する。
本手法は、車両が走行する地理的領域に特化したカスタムデータセット上で、キー駆動関連視覚要素を捕捉する小型視覚言語モデル(VLM)を微調整する。
我々は,GPT参照なしスコアリングを用いたカスタムデータセットに対する提案手法の評価を行い,最先端手法との競合性を実証した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:32:43 GMT)
Globalized Nonlinear Critical Quantum Metrology by Two-photon Rabi-Stark model [0.0] 本稿では、スターク結合と2光子QRMを組み合わせることで、可変臨界点を実現することを提案する。
我々のプロトコルの特長として、強いスクイーズを主要な量子資源として世界規模で保持することができる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:38:06 GMT)
Gender Inequality in English Textbooks Around the World: an NLP Approach [0.0] 本研究では,7つの文化圏にまたがる22カ国の英語教科書において,ジェンダー不平等を定量化する自然言語処理手法を適用した。
指標には、文字数、第一性(性別が最初に言及される)、TF-IDF単語の関連がある。
結果は、数、優先性、名前付き実体という観点から、男性文字の一貫性のある過剰表現を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:16:09 GMT)
From Transformers to Large Language Models: A systematic review of AI applications in the energy sector towards Agentic Digital Twins [0.0] 我々は、トランスフォーマーと大規模言語モデルに焦点を当てたエネルギー領域におけるAIアプリケーションの急速な拡大分野を概観する。
我々は、研究フロンティアが急速に拡大している分野について、実践的な実装、イノベーション、および強調する。
我々は,LLMを統合した次世代モデルであるAgentic Digital Twinの概念を導入し,自律性,積極性,社会的相互作用をディジタルツインベースのエネルギー管理システムに導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:02:07 GMT)
From Mass-Shell Factorisation to Spin: An Attempt at a Matrix-Valued Liouville Framework for Relativistic Classical and Quantum Phase-Spacetime [0.0] リウヴィルの定理は位相空間の分布そのものに間に合うように一階述語であるが、相対論的質量殻の制約は$pmu p_mu = m2$はエネルギーの第二階述語である。
我々は、相対論的量子力学におけるディラックのアプローチと類似して$(p2 - m2)$を分解することで、ハミルトニアン内の両方のエネルギー枝を統一することは理にかなっていると論じる。
結果の行列に基づくリウヴィル方程式は第一次のままであり、自然に位相における行列値の確率密度関数が 4 倍 4 倍になることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:24:59 GMT)
Flagged Extensions and Numerical Simulations for Quantum Channel Capacity: Bridging Theory and Computation [0.0] 解析的および数値的な組み合わせによるノイズ量子チャネルの容量について検討する。
チャネルを高次元空間に埋め込む新しいフラグ付き拡張技術を紹介します。
私の結果は、以前の境界を洗練し、量子伝送が消える向こうのノイズ閾値を明らかにします。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:21:08 GMT)
First-Spammed, First-Served: MEV Extraction on Fast-Finality Blockchains [0.0] 本研究は、高速ファイナリティブロックチェーンにおけるスパムベースの仲裁戦略の経済性を分析する。
CEX-DEX仲裁の最適戦略として,収益的なMEV機会を複数の小規模取引に分割することが示されている。
ArbitrumやZKsyncといった高速ロールアップのブロックの最上部にリバージョンされたトランザクションクラスタがあることが分かりました。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:44:29 GMT)
Fermionic Independent Set and Laplacian of an independence complex are QMA-hard [0.0] 摂動ガジェットを用いた$k$-粒子部分空間における最適化問題はQMAハードであることが証明された。
自然位相データ解析問題 QMA-hard の最初の例を示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:57:45 GMT)
Fast offline decoding with local message-passing automata [0.0] 並列化されたメッセージパッシングフレームワークに従って動作するトポロジコード用のローカルオフラインデコーダを提案する。
しきい値の存在を証明し、線形サイズ$L$のシステムでは、デコード終了を$O(log L)eta)$ average-case Runtimeで示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:00:26 GMT)
Fast and direct preparation of a genuine lattice BEC via the quantum Mpemba effect [0.0] 本稿では,ボース・アインシュタイン凝縮体(BEC)を格子上に直接散逸的に調製する効率的な方法を提案する。
我々のプロトコルは格子サブシステムを非平衡定常状態に駆動することに基づいている。
定常状態に指数的に早く収束する単純で実験的に実現可能な状態のクラスを解析的に同定する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:26:41 GMT)
Facts Do Care About Your Language: Assessing Answer Quality of Multilingual LLMs [0.0] 中高生に適した事実質問に答える上で,Llama3.1モデルの正当性を評価する。
我々は、LLMが余分な情報を提供するだけでなく、稀な言語に対する既存のバイアスを悪化させることを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:31:52 GMT)
Extracting Explainable Dates From Medical Images By Reverse-Engineering UNIX Timestamps [0.0] 正規表現は正規表現合成によって生成され、テキストの書き起こしにおいて複雑な日付と日付範囲を識別できることを示す。
そこで本研究では,複数の多点写像を逆エンジニアリングし,それらを正規表現合成器に入力することで決定論的論理を学習する手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:43:24 GMT)
Expansion-contraction duality breaking in a Planck-scale sensitive cosmological quantum simulator [0.0] 本稿では,Bose-Einstein凝縮体を接触相互作用と双極子相互作用の両方で生成するスケーリング手法の新たな変種を示す。
量子ガス実験室で容易に実装可能な量子アナログ宇宙論へのプランクスケールの敏感なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:18:16 GMT)
Evaluating Named Entity Recognition Models for Russian Cultural News Texts: From BERT to LLM [0.0] この研究は、1999年から2019年にかけてサンクトペテルブルクで行なわれたイベント発表のコレクションであるSPbLitGuideデータセットを利用している。
確立されたトランスフォーマーベースアーキテクチャを含む多種多様なNERモデルの比較評価を行った。
この研究は、ロシア語のような形態学的にリッチな言語に適用した場合の現在のNERモデル能力と制限のより深い理解に寄与する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 08:11:16 GMT)
Evaluating LLM Agent Adherence to Hierarchical Safety Principles: A Lightweight Benchmark for Probing Foundational Controllability Components [0.0] 本稿では,エージェントが高レベルの安全原則を守れる能力を評価するためのベンチマーク手法を提案する。
エージェントが不当な指示を確実に優先するかどうかを調査する。
階層的な原則への順守を評価することは、支配可能なAIシステムを構築する能力を理解するための重要な初期段階である、と私たちは主張する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:16:34 GMT)
Entropic bounds for conditionally Gaussian vectors and applications to neural networks [0.0] 我々は、条件付きガウス法則と可逆共分散行列を持つガウス法則の間の全変分と2-ワッサーシュタイン距離に関する新しい境界を与える。
ランダムに連結されたニューラルネットワークのガウスに収束速度を定量化するために,本結果を適用した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:27:16 GMT)
Entanglement Hamiltonians for Periodic Free Fermion Chains with Defects [0.0] 自由フェルミオン臨界逆場イジングモデルの基底状態のハミルトニアンの半系の絡み合いについて検討する。
一般に、これらの欠陥は非局所項をハミルトニアンの絡み合いに導入する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:30:30 GMT)
Ensemble-MIX: Enhancing Sample Efficiency in Multi-Agent RL Using Ensemble Methods [0.0] マルチエージェント強化学習(MARL)法は,様々なマルチエージェントタスクにおいて最先端の結果を得た。
しかし、MARLアルゴリズムは、単一のエージェントよりもはるかに多くの環境相互作用を必要とする。
本稿では,分散された中央集権的批判と分散アンサンブル学習を組み合わせた新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:13:15 GMT)
Enhancing Ultra-Low-Bit Quantization of Large Language Models Through Saliency-Aware Partial Retraining [0.0] 本稿では,ApiQ上に構築した超低ビット量子化手法を提案する。
LLaMA 7B と 13B のベンチマーク実験により,ApiQ の精度劣化をそれぞれ 10.85% と 7.54% 削減できることを示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:42:54 GMT)
Enhancing Neural Autoregressive Distribution Estimators for Image Reconstruction [0.0] 画像の小さな部分集合(画素パッチと呼ばれる)を観察して、画像の未観測部分を予測するという課題について検討する。
本研究では,畳み込み型自己回帰分布推定器(ConvNADE)モデルの一般化と計算効率のよいバージョンを提案する。
ベンチマークデータセットの実験では、低差分シーケンスに類似したピクセルの選択がテスト損失を減少させ、よりリアルに再構成された画像を生成することが示されている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:44:54 GMT)
Enhancing Automatic PT Tagging for MEDLINE Citations Using Transformer-Based Models [0.0] 我々は,事前学習型トランスフォーマーモデル BERT と DistilBERT を用いて,MEDLINE の引用メタデータから医療対象見出し(PT)を予測する可能性を検討した。
その結果,PTタグ付け精度を大幅に向上させるトランスフォーマーモデルの可能性を示し,スケーラブルで効率的なバイオメディカルインデクシングの道を開いた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 19:06:51 GMT)
Enhanced quantum phase estimation with $q$-deformed nonideal nonclassical light [0.0] 我々は,q変形光子状態を用いたマッハ・ツェンダー干渉計の量子位相推定について検討した。
我々は、量子および古典的なフィッシャー情報を計算し、シミュレートされた検出器データに基づいてベイズ推定を行う。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:50:40 GMT)
Dressed to Gamble: How Poker Drives the Dynamics of Wearables and Visits on Decentraland's Social Virtual World [0.0] Decentralandはブロックチェーンベースのソーシャルバーチャルワールドで、ユーザーはアバターをカスタマイズするためにウェアラブルを公開、販売することができる。
サードパーティーのDecentral Gamesでは、同社のフラッグシップゲームICE Pokerのプレイヤーが、特定のウェアラブルを持っていれば暗号通貨を稼ぐことができる。
本稿では,DGとそのゲームがウェアラブルのダイナミクスや世界訪問にどのように影響するかを包括的に研究する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:21:26 GMT)
Dirty and Clean-Label attack detection using GAN discriminators [0.0] 本研究は、GAN識別器を用いて、異なるレベルの修正画像に対して単一のクラスを保護する。
その結果, 単一クラスでのトレーニング後, GAN識別器の信頼度スコアは, ラベルの誤りを識別するための閾値を与える可能性が示唆された。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:21:56 GMT)
Diffusion models for Gaussian distributions: Exact solutions and Wasserstein errors [0.0] データ分布がガウス的であるとき,拡散モデルの挙動とその数値的実装について検討する。
対象と数値的なサンプル分布間の正確なワッサースタイン誤差を,任意の数値スキームに対して計算する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:34:55 GMT)
Deep Learning Enhanced Multi-Day Turnover Quantitative Trading Algorithm for Chinese A-Share Market [0.0] アルゴリズムは2010-2020年の総合的なAシェアデータに基づいて訓練され、2021-2024のデータに対して厳格に検証されている。
15.2%の年次リターン、5%未満の最大降格、シャープ比1.87で顕著なパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 01:59:55 GMT)
Deep Controlled Learning for Inventory Control [0.0] 在庫管理への深層強化学習(DRL)の適用は、新たな分野である。
従来のDRLアルゴリズムは、もともとゲームプレイングやロボティクスといった多様な分野向けに開発されたもので、在庫管理によって引き起こされる特定の課題には適していない。
本稿では,高数値問題を対象とした新しいDRLアルゴリズムであるDeep Learning (DCL)を提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:35:58 GMT)
Data-Driven Heat Pump Management: Combining Machine Learning with Anomaly Detection for Residential Hot Water Systems [0.0] 本稿では,予測MLと異常検出を組み合わせた適応型温水生産戦略を提案する。
実験の結果,最高の性能を示すLightGBMは優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:33:08 GMT)
Corrigibility as a Singular Target: A Vision for Inherently Reliable Foundation Models [0.0] ファンデーションモデル(FM)は、能力の規模が拡大するにつれ、人的制御の喪失に向けてデフォルトの軌道を駆動する。
提案する「特異ターゲットとしてのコリギビリティ」(CAST)設計のFMは、指定された人間のプリンシパルに誘導、修正、制御の権限を与えるものである。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 16:36:03 GMT)
Convergence and efficiency proof of quantum imaginary time evolution for bounded order systems [0.0] 想像上の時間進化は、決定的な減速を伴わずに、世界最小に収束することを保証している。
また,基礎となる物理系が有界順序であれば,任意の誤差しきい値まで効率的にコンパイルできることを示す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:52:06 GMT)
Controlling photon-magnon coupling using another magnon [0.0] 平面ヘキサゴナルリング共振器上に配置されたYIGとNiFe薄膜の光子を介するマグノン-マグノン結合について検討した。
磁気膜間の直接双極子相互作用がない場合に、マグノン-マグノン相互作用の明確なシグネチャを観察する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 05:28:45 GMT)
Continuous quantum correction on Markovian and Non-Markovian models [0.0] 我々はマルコフ的誤差モデルの下での性能を2つの異なる非マルコフ的モデルと比較する。
連続量子誤差補正は非マルコフ雑音に対する性能を高めた。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:40:40 GMT)
Computational Complexity of Non-Hermitian Quantum Systems [0.0] 条件付き時間進化は、量子システムが監視され、1つのポストセレクトが測定記録に記録されるときに起こる。
我々は、ポストセレクションと任意の非エルミート・ハミルトンの同値性を確立する。
非エルミート物理学は、量子優位性を保証することも、効率的な古典的シミュレーションを妨げない。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:35:28 GMT)
Comparison of different Unique hard attention transformer models by the formal languages they can recognize [0.0] マスク付き対非マスキング、有限対無限画像と一般対双線形アテンションスコア関数を区別する。
我々はこれらのモデル間のいくつかの関係を思い出すとともに、一階述語論理と回路複雑性の点における上界に関して下界を思い出す。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 20:28:51 GMT)
Comparing Lexical and Semantic Vector Search Methods When Classifying Medical Documents [0.0] 我々の仕事は、その内容に応じて厳格に構造化された医療文書を分類することであった。
その結果,市販のセマンティックベクターサーチでは,語彙ベクトルサーチモデルの作成よりも予測精度が若干悪いことがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 09:18:51 GMT)
Combining social relations and interaction data in Recommender System with Graph Convolution Collaborative Filtering [0.0] ユーザ間の類似性は、推奨にとって重要な影響である。
本稿では,単一レビューやユーザとのインタラクションの少ないアウトレイラを除去する入力データ処理手法を提案する。
次のモデルでは、ユーザの評価履歴におけるソーシャル関係データと類似性を組み合わせて、推薦システムの精度とリコールを改善する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:04:00 GMT)
Combining Threat Intelligence with IoT Scanning to Predict Cyber Attack [0.0] ハッカーやハックティビストグループを含む悪意ある俳優は、しばしば「ダークウェブ」を通じてイデオロギー的コンテンツを広め、活動を調整する。
本稿では,ダークウェブデータを体系的に収集,解析,可視化するために設計された,新たな予測脅威インテリジェンスフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:14:04 GMT)
Coherent and dissipative dynamics at quantum phase transitions [0.0] プレゼンテーションは閉多体系によって開発された量子遷移に関する問題に限られる。
我々は、臨界モードと様々な散逸メカニズムの非自明な相互作用を引き起こす物理的条件に焦点を当てる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 15:43:29 GMT)
Coherence and Entanglement in a Quantum Spacetime [0.0] 時空の量子の性質から生じる変形対称性を持つ2粒子系における量子コヒーレンスと量子相関の出現について検討する。
解析の結果、量子時空の開放性は最終的に絡み合いを低下させるが、古典的相関と量子的相関の創出と保存を促進することが判明した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:13:56 GMT)
CoT is Not True Reasoning, It Is Just a Tight Constraint to Imitate: A Theory Perspective [0.0] CoT(Chain-of-Thought)の促進により、大規模言語モデルの性能が明らかに向上した。
チェーン・オブ・サートは、大規模言語モデルに推論の形式を模倣するように誘導する強力な構造的制約として機能する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:45:01 GMT)
Classical pair of states as optimal pair for quantum distinguishability quantifiers [0.0] 量子微分可能性量化器の重要な性質は、完全に正のトレース保存写像の作用の下での収縮性である。
この要件は、これらの量化器がそれらの最大値に達するペアがペアであり、この意味では古典的状態であることを保証する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 07:55:25 GMT)
ChemGraph: An Agentic Framework for Computational Chemistry Workflows [0.0] ChemGraphは人工知能と最先端のシミュレーションツールを利用したエージェントフレームワークである。
ユーザーは分子構造生成、単一点エネルギー、幾何最適化、振動解析、熱化学計算などのタスクを実行できる。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 21:11:56 GMT)
Bridging Neural ODE and ResNet: A Formal Error Bound for Safety Verification [0.0] ニューラル常微分方程式(Neural ordinary differential equation,neural ODE)は、単一の残差ブロックを持つ残差ネットワーク(ResNet)の連続的な一般化として一般的に記述される機械学習モデルである。
本研究では,2つのモデル間の近似誤差を限定することにより,これらのモデル間のより公式な関係を確立する。
得られたエラーバウンドによって、検証ツールを2回実行することなく、モデルの1つを検証プロキシとして使用することが可能になります。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 11:56:22 GMT)
Axiomatization of Rényi Entropy on Quantum Phase Space [0.0] 量子力学の位相空間バージョンは、負の準確率を持つ状態を表す。
符号付き有限位相空間に適用可能な保守的拡張を開発し、単一の許容エントロピー族を発見する。
我々の研究は、我々の公理的に導出された符号付きR'enyiエントロピーが、既存のエントロピー測度に有用な付加物であるかもしれないという十分な証拠を提供すると信じている。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:35:51 GMT)
Automatic Cross-Domain Transfer Learning for Linear Regression [0.0] 本稿では,線形回帰問題に対する伝達学習能力の拡張を支援する。
通常のデータセットでは、移行学習に潜伏したドメイン情報が利用できると仮定する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:20:17 GMT)
Attention-based transformer models for image captioning across languages: An in-depth survey and evaluation [0.0] 本調査では,注目に基づく画像キャプションモデルについてレビューし,これらをトランスフォーマーベース,ディープラーニングベース,ハイブリッドアプローチに分類した。
ベンチマークデータセットを調査し、BLEU、METEOR、CIDEr、ROUGEなどの評価指標を検討し、多言語キャプションにおける課題を強調している。
我々は、マルチモーダル学習、AIによるアシスタントのリアルタイム応用、医療、法医学的分析など、将来の研究方向を特定する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:18:19 GMT)
An Exploratory Framework for Future SETI Applications: Detecting Generative Reactivity via Language Models [0.0] 我々は、地球外信号の復号化を前提とせず、入力が生成系における言語行動を引き起こすかどうかを評価する。
音声入力は,ヒトの発声,ハンプバッククジラの発声,Phyloscopus trochilus Birdong,アルゴリズムによる白色雑音の4種類を検討した。
その結果,クジラと鳥の発声は白色雑音よりもSIPスコアが高く,ヒトの発声は中程度の反応しか起こらなかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 10:46:57 GMT)
Algorithmic Tradeoffs in Fair Lending: Profitability, Compliance, and Long-Term Impact [0.0] 公平な介入が利益率とデフォルトレートにどのように影響するかを定量化します。
我々は、公正貸付が利益を得る特定の経済状況を特定する。
これらの知見は、倫理的配慮とビジネス目的とのバランスをとる貸付アルゴリズムを設計するための実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:51:13 GMT)
Advancing Decoding Strategies: Enhancements in Locally Typical Sampling for LLMs [0.0] Adaptive Semantic-Aware typicality Smpling (ASTS) は局所典型サンプリング (LTS) アルゴリズムの改良版として提案されている。
ASTSは、計算効率を維持しながら、文脈的に一貫性があり多様なテキスト生成を保証する。
実験の結果,ASTSは反復を減らし,セマンティックアライメントを強化し,流速を向上させることにより,既存のサンプリング技術よりも優れた性能を示した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 14:25:23 GMT)
Adiabatic Dynamics of Entanglement [0.0] 断熱進化の間、絡み合いの変化はエネルギーレベルの交差を避けるために追跡することができる。
この絡み合いの織り込みの効率は、避けられた踏切の狭さに依存する。
断熱的量子計算に関わる絡み合いの量は、そのエネルギーランドスケープの頑丈さと関係がある。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 22:29:27 GMT)
AERO: A Redirection-Based Optimization Framework Inspired by Judo for Robust Probabilistic Forecasting [0.0] AERO(Adversarial Energy-based Redirection Optimization)は,柔道におけるリダイレクト原理に触発された新しいフレームワークである。
この結果から, AEROは, 理論的, 実用的な最適化の展望において, 魅力的な新たな方向性であることがわかった。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 04:02:20 GMT)
A simple mechanism for unstable degeneracies in local Hamiltonians [0.0] 局所ハミルトニアン固有状態が、ハミルトニアン項で通勤する局所作用素によって別の状態に写像された場合、後者もまた固有状態である。
この基本的な観察は、独特な基底状態であり、短距離の絡み合いがあり、局所的な摂動から守られていることを示唆している。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 12:26:06 GMT)
A novel sensitivity analysis method for agent-based models stratifies in-silico tumor spheroid simulations [0.0] エージェントベースモデル(ABM)は、個々の行動が集団行動にどのようにスケールするかを理解するために生物学で広く用いられている。
モデルは、モデル出力に対する入力パラメータの影響を定量化するために、感度分析(SA)アルゴリズムを使用する。
我々は,SA for ABMの高速化を目的とした機械学習パイプラインであるSimulate, Summarize, Reduce, Cluster, Analyze(SSRCA)方法論を開発した。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 13:21:46 GMT)
A local automaton for the 2D toric code [0.0] 我々は、Tsirelson と G'acs の階層的古典的セルオートマトンからのアイデアを用いて、2次元トーリック符号の局所デコーダを構築する。
我々のデコーダは、回路レベルのノイズの存在下で指数時間に論理状態を保持する厳密な局所量子演算の回路である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 00:21:30 GMT)
A conclusive remark on linguistic theorizing and language modeling [0.0] これは、イタリアの言語誌(英語版)で私の対象とする論文に寄せられた回答に関する最後のコメントです。
これは、イタリアの言語誌(英語版)で私の対象とする論文に寄せられた回答に関する最後のコメントです。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:00:29 GMT)
A Multi-Scale Quantum Framework for Evaluating Metal-Organic Frameworks in Carbon Capture [0.0] 金属有機フレームワーク(MOF)は、直接捕獲するためにtextCO_2$を選択的に吸収することにより、地球温暖化の影響を緩和するための有望な材料である。
正確な量子化学シミュレーションは、最適なMOF構造を選択し設計するのに有用なツールである。
大規模なデータセットにシミュレーションを適用するには、効率的なシミュレーション方法が必要である。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 17:06:25 GMT)
A Kernel-Based Approach for Modelling Gaussian Processes with Functional Information [0.0] トレーニングデータに加えて、利用可能な情報は有限個の点の集まりには含まれない。
我々は、カーネルヒルベルト空間を再現することで、典型的な有限トレーニングデータケースを統一するプロセスを提案し、構築する。
本稿では,提案プロセスの存在を示し,トレーニング点数の増加にともなう従来のGPの限界を確定する。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 18:25:25 GMT)
A Complexity-Based Approach to Quantum Observable Equilibration [0.0] 孤立量子系における平衡を割り当てる統計複雑性尺度の役割について検討する。
我々は、量子状態の複雑さがどのように進化するかを研究するために分析を拡張し、初期コヒーレンスから平衡への遷移についての洞察を与える。
論文参考訳(メタデータ) (Tue, 03 Jun 2025 23:16:35 GMT)