PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild [167.7] 本報告では,CVPR 2025と共同で開催されている第4回PVUWチャレンジについて概観する。
課題は、複雑なシーンビデオオブジェクトセグメンテーションに焦点を当てたMOSEと、モーションガイドによる言語ベースのビデオセグメンテーションをターゲットとするMeViSの2つのトラックである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:02:47 GMT)
Nemotron-H: A Family of Accurate and Efficient Hybrid Mamba-Transformer Models [164.5] ネモトロン-Hは8Bと56B/47Bハイブリッド・マンバ・トランスフォーマーのファミリーである。
私たちは共通のTransformerモデルアーキテクチャにおけるほとんどの自己注意レイヤをMambaレイヤに置き換えます。
Nemotron-Hモデルは、他の同様のサイズのオープンソーストランスフォーマーモデルと比較して、精度が良いか低いかのどちらかを提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:36:01 GMT)
InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models [137.7] InternVL3は、ネイティブなマルチモーダル事前学習パラダイムを備えたInternVLシリーズの重要な進歩である。
特に、InternVL3-78B は MMMU ベンチマークで72.2 のスコアを獲得し、オープンソースの MLLM に新しい最先端技術を設定する。
オープンサイエンスの原則を追求するため、我々は、次世代MLLMのさらなる研究・開発を促進するために、トレーニングデータとモデルウェイトの両方を公開します。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:50:27 GMT)
SimpleAR: Pushing the Frontier of Autoregressive Visual Generation through Pretraining, SFT, and RL [112.9] この作業は、複雑な古風な修正を伴わない、バニラ自動回帰視覚生成フレームワークであるSimpleARを提示する。
我々は,高忠実度1024×1024解像度画像を生成し,テキスト・ツー・イメージ・ベンチマークで競合する結果が得られることを示した。
これらの発見を共有し、コードをオープンソース化することによって、自己回帰的な視覚生成の可能性を明らかにしたいと考えています。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:59:46 GMT)
PonderV2: Pave the Way for 3D Foundation Model with A Universal Pre-training Paradigm [111.2] 本稿では,効率的な3D表現の獲得を容易にするために,新しいユニバーサル3D事前学習フレームワークを提案する。
PonderV2は、11の室内および屋外ベンチマークで最先端のパフォーマンスを達成したことで、その効果が示唆された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:03:46 GMT)
DataSentinel: A Game-Theoretic Detection of Prompt Injection Attacks [101.5] LLM統合されたアプリケーションとエージェントは、インジェクション攻撃に弱い。
検出方法は、入力が注入プロンプトによって汚染されているかどうかを判定することを目的とする。
本研究では,迅速なインジェクション攻撃を検出するゲーム理論手法であるDataSentinelを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:26:21 GMT)
A Dual-Space Framework for General Knowledge Distillation of Large Language Models [98.7] 知識蒸留(KD)は、より小さなモデルに知識を移すことによって、大きな言語モデル(LLM)を圧縮する有望なソリューションである。
現在のWhite-box KDフレームワークには2つの制限がある。
我々は,教師の予測ヘッドとKDの学生モデルを統合する,二空間知識蒸留(DSKD)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:38:47 GMT)
CAP-Net: A Unified Network for 6D Pose and Size Estimation of Categorical Articulated Parts from a Single RGB-D Image [86.8] 本稿では,ロボット操作作業における調音物体のカテゴリーレベルのポーズ推定に取り組む。
そこで本研究では,Categorical Articulated Partsの6次元ポーズとサイズを推定するためのシングルステージネットワークCAP-Netを提案する。
我々は,RGB画像と実センサからシミュレーションした深度雑音を特徴とするRGB-D調音データセットであるRGBD-Artデータセットを紹介した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:30:26 GMT)
LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving [84.3] この作業では、複雑な自律運転シナリオの意思決定コンポーネントとして、Large Language Models(LLM)を採用している。
大規模実験により,提案手法は単車載タスクのベースラインアプローチを一貫して超えるだけでなく,複数車載コーディネートにおいても複雑な運転動作の処理にも有効であることが示された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:45:30 GMT)
Retro-Search: Exploring Untaken Paths for Deeper and Efficient Reasoning [84.3] MCTSにインスパイアされた検索アルゴリズムであるRetro-Searchを導入し,大規模モデルから高品質な推論経路を抽出する。
Retro-Searchは、より良い、しかし短いトレースを見つけるための推論パスをふりかえりに修正する。
当社のアプローチでは,モデルが独自のRetro-Search-edトレースに基づいて微調整される自己改善と,弱いから強い改善の2つのユースケースを実現しています。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:07:31 GMT)
Deep Learning in Concealed Dense Prediction [83.9] 本稿では,農業,産業等において大きな価値を持つ,複雑な課題のファミリーであるCDP(Concealed Dense Prediction)を紹介し,レビューする。
CDPの本質的な特徴は、ターゲットが周囲に隠されているため、それらを完全に知覚するには、きめ細かい表現、事前の知識、補助的推論などが必要であることである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:44:42 GMT)
ARLON: Boosting Diffusion Transformers with Autoregressive Models for Long Video Generation [83.6] 本稿では,長期ビデオ生成のための自己回帰モデルを用いた拡散変換器を高速化するフレームワークARLONを提案する。
潜在ベクトル量子変分オートコーダ(VQ-VAE)は、DiTモデルの入力潜時空間をコンパクトなビジュアルトークンに圧縮する。
適応ノルムベースのセマンティックインジェクションモジュールは、ARモデルから粗い離散視覚ユニットをDiTモデルに統合する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:06:28 GMT)
3DAffordSplat: Efficient Affordance Reasoning with 3D Gaussians [82.7] 人間の指示を3Dオブジェクトの機能領域に関連付けるためには,3D割当推論が不可欠である。
3DAffordSplatは3DGSベースの価格推論に適した,最初の大規模マルチモーダルデータセットである。
AffordSplatNetは,3DGS表現を用いた割当推論に特化して設計された新しいモデルである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:21:47 GMT)
Do "New Snow Tablets" Contain Snow? Large Language Models Over-Rely on Names to Identify Ingredients of Chinese Drugs [79.0] 伝統的な中国医学(TCM)は医療に採用され、臨床応用をサポートするために、LLM(Large Language Models)が出現している。
これらのモデルの基本的な要件は、TCM薬物成分の正確な同定である。
我々の系統的分析では、一貫した障害パターンが明らかである: モデルでは、しばしば文字通り、薬物名を理解し、関連性に関係なく共通のハーブを過剰に使用し、不慣れな定式化に直面した時に不規則な振る舞いを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:51:02 GMT)
PointDGMamba: Domain Generalization of Point Cloud Classification via Generalized State Space Model [77.0] 領域一般化(DG)は、最近、点雲分類の一般化性を改善するために研究されている。
本稿では、DG PCCにおける状態空間モデル(SSM)の一般化可能性について研究する。
本稿では,未知の領域に対して強い一般化性を持つ新しいフレームワークであるPointDGMambaを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:31:03 GMT)
SpoofCeleb: Speech Deepfake Detection and SASV In The Wild [76.7] SpoofCelebは、音声ディープフェイク検出(SDD)とスポフィングロバスト自動話者検証(SASV)のために設計されたデータセットである。
SpoofCelebは、1,251人のユニークな話者による250万以上の発話で構成され、自然界の状況下で収集されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:53:00 GMT)
Looking beyond the next token [75.0] トレーニングデータシーケンスの再構成と処理により、モデルが真のデータ生成プロセスをより正確に模倣できるようになる、と我々は主張する。
本手法は, 長期的目標を追加費用なしで自然に生成することを可能にした。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:09:06 GMT)
LazyReview A Dataset for Uncovering Lazy Thinking in NLP Peer Reviews [74.9] この研究は、微粒な遅延思考カテゴリで注釈付けされたピアレビュー文のデータセットであるLazyReviewを紹介している。
大規模言語モデル(LLM)は、ゼロショット設定でこれらのインスタンスを検出するのに苦労する。
命令ベースのデータセットの微調整により、パフォーマンスが10~20ポイント向上する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 10:07:33 GMT)
TIS-DPO: Token-level Importance Sampling for Direct Preference Optimization With Estimated Weights [73.9] 本稿では,TIS-DPO と呼ばれるトークン単位の重要度サンプリング DPO の目的について,その報酬に基づいて各トークンに重要度を割り当てる手法を提案する。
TIS-DPOは、無害性、有用性アライメントおよび要約タスクにおいて、様々なベースライン手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:59:54 GMT)
An Efficient and Mixed Heterogeneous Model for Image Restoration [71.9] 現在の主流のアプローチは、CNN、Transformers、Mambasの3つのアーキテクチャパラダイムに基づいている。
混合構造融合に基づく効率的で汎用的なIRモデルであるRestorMixerを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:19:12 GMT)
Zero-Shot Whole-Body Humanoid Control via Behavioral Foundation Models [71.3] 教師なし強化学習(RL)は、複雑な環境下で幅広い下流タスクを解くことができる事前学習エージェントを目標としている。
本稿では,ラベルのない行動データセットからトラジェクトリを模倣するための,教師なしRLの正規化アルゴリズムを提案する。
我々は,この手法の有効性を,挑戦的なヒューマノイド制御問題において実証する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 10:41:11 GMT)
PARTFIELD: Learning 3D Feature Fields for Part Segmentation and Beyond [71.0] PartFieldは、パートベースの3D機能を学ぶためのフィードフォワードアプローチである。
PartFieldは、他のクラスに依存しない部分分割方法よりも最大20%正確で、多くの場合、桁違いに高速です。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:58:16 GMT)
Can Learned Optimization Make Reinforcement Learning Less Difficult? [70.5] 学習の最適化が強化学習の難しさを克服するのに役立つかどうかを検討する。
本稿では, 塑性, 探索および非定常性のための学習最適化手法(OPEN)を用いて, 入力特性と出力構造がこれらの困難に対して予め提案された情報によって通知される更新規則をメタラーニングする。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:07:30 GMT)
Elucidating the Design Space of Multimodal Protein Language Models [69.5] マルチモーダルタンパク質言語モデル(PLM)は、シーケンスとトークンに基づく構造情報を統合する。
本稿では,マルチモーダルPLMの設計空間を体系的に解明し,その限界を克服する。
我々の進歩はよりきめ細かな監督にアプローチし、トークンベースのマルチモーダルPLMが堅牢な構造モデリングを実現することを実証する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:59:43 GMT)
Automated Proof Generation for Rust Code via Self-Evolution [69.3] 私たちは、Rustコードの自動証明生成を可能にする、人書きスニペットの欠如を克服するフレームワークであるSAFEを紹介します。
SAFEは、細調整されたモデルの自己老化能力を訓練するために、多数の合成不正確な証明を再利用する。
我々は、人間の専門家によるベンチマークで52.52%の精度で達成し、GPT-4oのパフォーマンス14.39%を大きく上回った。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:39:09 GMT)
A Minimalist Approach to LLM Reasoning: from Rejection Sampling to Reinforce [69.0] 我々はGRPOを強化的なアルゴリズムの観点から再検討し、そのコアコンポーネントを分析する。
単純な拒絶サンプリングベースラインであるRAFTは,GRPOやPPOよりも競争性能が高いことがわかった。
この知見に触発されて、完全に正しくないサンプルと完全に正しいサンプルの両方をフィルタリングするポリシー勾配の最小限の拡張であるReinforce-Rejを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:15:02 GMT)
Everybody Prune Now: Structured Pruning of LLMs with only Forward Passes [68.9] バックプロパゲーションの不要な勾配のない構造化プルーニング手法であるBonsaiを紹介する。
ボンサイは少ないリソースでより良い圧縮を実現するが、セミ構造化プルーニングによって生成されるモデルよりも2倍高速なモデルも生成する。
この結果から,バックプロップを必要条件として取り除くことで,最先端の効率性と性能が向上する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:24:22 GMT)
System-1.x: Learning to Balance Fast and Slow Planning with Language Models [68.8] 言語モデルは、2つの異なるモードで長期計画問題の解決に使用できる。
高速な 'System-1' モード、明示的な検索やバックトラックなしで直接計画を生成する、遅い 'System-2' モード、ステップバイステップの計画。
LLMを用いた制御可能な計画フレームワークであるSystem-1.x Plannerを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:41:17 GMT)
Omni$^2$: Unifying Omnidirectional Image Generation and Editing in an Omni Model [68.2] 約360ドルで全方位画像(ODI)が注目されており、様々なバーチャルリアリティ(VR)や拡張現実(AR)アプリケーションで広く利用されている。
我々は,テキストバウンサーラインOmniの方向性画像生成と編集のためのテキストバウンサーラインOmniモデルを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:53:11 GMT)
DataDecide: How to Predict Best Pretraining Data with Small Experiments [68.0] 私たちはDataDecideのモデル、データ、評価を公開しています。
最大100Bトークン,最大1Bパラメータのモデルサイズ,および3つのランダムシードを用いて,25コーパスにわたる事前学習実験を行った。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:02:15 GMT)
Bipartite Ranking From Multiple Labels: On Loss Versus Label Aggregation [66.3] 両部ランク付けは基本的な教師付き学習問題であり、ROC曲線(英語版)(AUC)の下で最大領域を持つインスタンスのランク付けを1つのバイナリターゲットラベルに対して学習することを目的としている。
このようなラベルを1つのコヒーレントなランキングにどうやって合成できるのか?
本研究では,ベイズ最適解を特徴付けることにより,損失集約とラベル集約という2つの手法を解析する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:25:27 GMT)
LLM$\times$MapReduce-V2: Entropy-Driven Convolutional Test-Time Scaling for Generating Long-Form Articles from Extremely Long Resources [65.4] ロングフォーム生成は、幅広い実用用途に欠かせない。
短期から長期の世代は注目されているが、極端に長い資源から長いテキストを生成することは、比較的過小評価されている。
LLM$times$MapReduce-V2は,大規模言語モデルによる極めて長い入力処理能力の向上を目的とした,新しいテスト時間スケーリング戦略である。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:28:58 GMT)
When is Task Vector Provably Effective for Model Editing? A Generalization Analysis of Nonlinear Transformers [64.2] タスク算術は、タスクベクトルの重み付き和を追加することで、事前訓練されたモデルを編集することを指す。
本稿では,非関連タスクと非関連タスクのセットを同時に学習する上で,タスク追加の有効性を理論的に証明する。
ドメイン外タスクの否定を実現するために,タスク演算の適切な選択を証明した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:04:39 GMT)
DeepMLF: Multimodal language model with learnable tokens for deep fusion in sentiment analysis [62.3] DeepMLFは、深層融合に適した学習可能なトークンを持つ新しいマルチモーダル言語モデルである。
以上の結果から,より深層核融合により,既存のアプローチよりも優れた核融合深度 (5-7) が得られることが確認された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:28:02 GMT)
FEAT: Free energy Estimators with Adaptive Transport [61.9] 自由エネルギー推定のための新しいフレームワークである適応輸送を用いた自由エネルギー推定器(FEAT)を提案する。
FEATは、インターポーラントを介して実装された学習された輸送を、自由エネルギー差の変分上と下の境界とともに活用する。
おもちゃの例、分子シミュレーション、量子場理論に関する実験的検証は、既存の学習法よりも改善されていることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:16:18 GMT)
Understanding LLMs' Cross-Lingual Context Retrieval: How Good It Is And Where It Comes From [61.6] 12言語にわたる40以上の大言語モデル(LLM)の言語間コンテキスト検索能力を評価する。
いくつかの小さな訓練後のオープンLLMは、強い言語間コンテキスト検索能力を示している。
また, 大規模プレトレーニングでは, xMRCの性能が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 06:35:27 GMT)
ViMo: A Generative Visual GUI World Model for App Agent [60.3] ViMoは、将来のApp観測をイメージとして生成するために設計されたビジュアルワールドモデルである。
本稿では,シンボルプレースホルダーによるテキストコンテンツをオーバーレイする新しいデータ表現であるシンボリックテキスト表現を提案する。
この設計では、将来のGUIのグラフィックスを予測するSTR Predictorと、対応するテキストを生成するGUI-text Predictorが使用されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:03:10 GMT)
VideoPanda: Video Panoramic Diffusion with Multi-view Attention [57.9] 高解像度パノラマビデオコンテンツはバーチャルリアリティーにおける没入的な体験にとって最重要であるが、特殊な機器や複雑なカメラのセットアップを必要とするため、収集は容易ではない。
VideoPandaはテキストのみとシングルビューのビデオという2つの条件を使って共同で訓練されている。
実世界のビデオデータセットと合成ビデオデータセットの両方に対する大規模な評価は、VideoPandaがより現実的で一貫性のある360$circ$ panoramasを生成することを示している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:58:15 GMT)
MM-Eureka: Exploring the Frontiers of Multimodal Reasoning with Rule-based Reinforcement Learning [55.8] MMK12データセットとMM-EUREKAを7B,32Bパラメータで導入する。
前者は、人間の検証された答えと解法を含む多様な知識領域を特徴とする高品質なマルチモーダル数学推論データセットである。
後者は,オンラインフィルタリングを利用したルールベース強化学習と,トレーニング安定性を高めるための2段階トレーニング戦略を用いたマルチモーダルモデルである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:22:45 GMT)
Do We Truly Need So Many Samples? Multi-LLM Repeated Sampling Efficiently Scales Test-Time Compute [55.3] 本稿では,テスト時間計算のスケールアップによるLCM性能向上のための,シンプルで効果的で費用効率のよい手法を提案する。
当社の戦略は,複数のモデルを組み込んで,補完的な強みを活用するという,新たなツイストによって,繰り返しサンプリングされる投票フレームワークを基盤としています。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 06:58:14 GMT)
AI threats to national security can be countered through an incident regime [55.2] 我々は、AIシステムからの潜在的な国家安全保障脅威に対抗することを目的とした、法的に義務付けられたポストデプロイAIインシデントシステムを提案する。
提案したAIインシデント体制は,3段階に分けられる。第1フェーズは,‘AIインシデント’とみなすような,新たな運用方法を中心に展開される。
第2フェーズと第3フェーズでは、AIプロバイダが政府機関にインシデントを通知し、政府機関がAIプロバイダのセキュリティおよび安全手順の修正に関与するべきだ、と説明されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:13:33 GMT)
Efficient Hybrid Language Model Compression through Group-Aware SSM Pruning [54.6] 注意と状態空間モデル(SSM)を組み合わせたハイブリッドアーキテクチャは、最先端の精度と実行時のパフォーマンスを達成する。
近年の研究では、アテンションのみのモデルに圧縮と蒸留を適用することで、トレーニングコストのごく一部でより小さく、より正確なモデルが得られることが示されている。
本稿では,SSMブロックの構造的整合性とそのシーケンスモデリング機能を維持するグループ対応プルーニング戦略を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:26:29 GMT)
Know Where You're Uncertain When Planning with Multimodal Foundation Models: A Formal Framework [54.4] 認識と計画生成の不確実性を解消し、定量化し、緩和する包括的枠組みを提案する。
本稿では,知覚と意思決定の独特な性質に合わせた手法を提案する。
この不確実性分散フレームワークは, 変動率を最大40%削減し, タスク成功率をベースラインに比べて5%向上させることを示した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 22:37:07 GMT)
RankAlign: A Ranking View of the Generator-Validator Gap in Large Language Models [51.1] 我々は,モデルが生成した解答と,その解答の検証,ジェネレータとバリケータのギャップとの相違について考察する。
この測定結果から,質問応答,語彙意味論タスク,次の単語予測など,さまざまな設定に大きなギャップがあることが分かる。
次にランキングベースのトレーニング手法である RankAlign を提案し、そのギャップを平均で 31.8% に拡大し、すべてのベースライン手法を上回ります。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:53:31 GMT)
PaMi-VDPO: Mitigating Video Hallucinations by Prompt-Aware Multi-Instance Video Preference Learning [50.8] ビデオマルチモーダル大言語モデル(VLLM)における幻覚の低減を支援する直接選好最適化(DPO)
本稿では、嗜好アノテーションの不要なオンライン嗜好学習フレームワークであるVDPO(Video Direct Preference Optimization)を提案する。
本稿では,Prompt-aware Multi-instance Learning VDPOを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:20:46 GMT)
PuzzleBench: A Fully Dynamic Evaluation Framework for Large Multimodal Models on Puzzle Solving [50.5] 我々は、OVPG(Open-ended Visual Puzzle Generation)という、完全に動的なマルチモーダル評価フレームワークを提案する。
OVPGは、パズル解決タスクにおいて、新しく、多様性があり、検証可能な評価データを自動的に生成することを目的としている。
OVPG上に構築されたPuzzleBenchは11,840のVQAサンプルからなる動的でスケーラブルなベンチマークである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:29:31 GMT)
Work Statistics and Quantum Trajectories: No-Click Limit and non-Hermitian Hamiltonians [50.2] 本稿では,連続監視量子システムにおける量子作業統計の枠組みについて述べる。
我々のアプローチは自然に量子ジャンププロセスから生じる非エルミート力学を取り入れている。
局所スピンモニタリング下での一次元横フィールドイジングモデルを解析することにより,我々の理論的枠組みを説明する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 23:21:58 GMT)
Contextual AD Narration with Interleaved Multimodal Sequence [50.2] このタスクは、視覚障害者が映画のような長めのビデオコンテンツにアクセスするのを助けるために、視覚障害者のための視覚要素の記述を作成することを目的としている。
ビデオ機能、テキスト、文字バンク、コンテキスト情報を入力として、生成されたADは名前で文字に対応することができる。
我々は、ADを生成するためのシンプルで統一されたフレームワークを通じて、事前訓練された基礎モデルを活用することを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:30:02 GMT)
Recognition of Geometrical Shapes by Dictionary Learning [49.3] 形状認識のための辞書学習を初めて行う方法を提案する。
基礎となる最適化手法の選択は、認識品質に大きな影響を及ぼす。
実験結果から,辞書学習は形状認識タスクの興味深い方法である可能性が確認された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:05:16 GMT)
Global restrictions under local state discrimination [49.2] 局所的な識別性は、二粒子状態のグローバルな性質を制限することができる。
グローバルな行動を制限する強力なツールとなり得ることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 10:20:10 GMT)
Dynamical Casimir effect in superconducting cavities: from photon generation to universal quantum gates [49.2] 第1章は、動的カシミール効果(DCE)の様々な側面と、回路量子電磁力学(cQED)の文脈におけるその意味を探求する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:28:00 GMT)
OmniVDiff: Omni Controllable Video Diffusion for Generation and Understanding [48.4] 単一拡散モデルを用いて複数の映像コンテンツを合成し,理解することを目的とした,制御可能なビデオ拡散のための新しいフレームワークOmniVDiffを提案する。
我々のモデルは,テキスト条件付きビデオ生成,ビデオ理解,X条件付きビデオ生成という3つの重要な機能をサポートしている。
これらの多様なタスクを統合ビデオ拡散フレームワークに統合することにより、OmniVDiffは制御可能なビデオ拡散の柔軟性とスケーラビリティを向上させる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:05:46 GMT)
Gaussian Differentially Private Human Faces Under a Face Radial Curve Representation [48.3] 本稿では,ガウシアン・ディファレンシャル・プライベート(GDP)の人間の顔を3Dで表すという課題について考察する。
関数の集合として3次元顔の新たな表現である顔放射曲線を提案する。
提案手法は, 平均面形状を保存し, 従来のプライバシ予算よりも少ないノイズを注入する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:26:49 GMT)
Taming Consistency Distillation for Accelerated Human Image Animation [47.6] DanceLCMは、たった2-4ステップで、最先端のビデオ拡散モデルに匹敵する結果を得る。
コードとモデルは公開されます。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:44:53 GMT)
InterAnimate: Taming Region-aware Diffusion Model for Realistic Human Interaction Animation [47.1] 本稿では,現実的な顔のインタラクションをアニメーションするための新しい動作パラダイムを提案する。
本手法は, 解剖学的・時間的接触力学と生体力学的に妥当な変形効果を同時に学習する。
結果は、InterAnimateが非常にリアルなアニメーションを生成し、新しいベンチマークを設定していることを示している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 06:32:45 GMT)
From Gaze to Insight: Bridging Human Visual Attention and Vision Language Model Explanation for Weakly-Supervised Medical Image Segmentation [47.0] 視覚言語モデル(VLM)は、テキスト記述を通して意味的コンテキストを提供するが、説明精度は欠如している。
本稿では,その補完的強みを活かし,視線と言語指導を統合した教師教育フレームワークを提案する。
本手法は,8.78%,80.53%,84.22%のDiceスコアをそれぞれ達成し,アノテーション負担を増大させることなく視線ベースラインよりも3.5%向上した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:32:15 GMT)
Position Paper: Rethinking Privacy in RL for Sequential Decision-making in the Age of LLMs [46.8] マルチスケール保護,行動パターン保護,協調プライバシ保護,コンテキスト認識適応という,4つの基本原則に基づいて構築された新たなプライバシパラダイムについて論じる。
これらの原則は、医療、自動運転車、およびLSMによる意思決定支援システムのような高度な領域において、RLシステムがより広く普及するにつれて、プライバシー、実用性、解釈可能性の間に固有の緊張関係を浮き彫りにする。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 10:45:55 GMT)
ARise: Towards Knowledge-Augmented Reasoning via Risk-Adaptive Search [46.8] 動的検索強化生成(RAG)と中間的推論状態のリスクアセスメントを統合する新しいフレームワークであるARiseを紹介する。
ARiseは最先端のKAR手法を最大23.10%、最新のRAG搭載の大きな推論モデルを最大25.37%上回っている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 06:06:50 GMT)
Are We Solving a Well-Defined Problem? A Task-Centric Perspective on Recommendation Tasks [46.7] 我々はRecSysタスクの定式化を解析し、入力出力構造、時間力学、候補項目選択といった重要なコンポーネントを強調した。
本稿では,タスク特異性とモデル一般化可能性のバランスについて考察し,タスク定式化がロバストな評価と効率的なソリューション開発の基礎となることを明らかにする。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:19:42 GMT)
Single-Input Multi-Output Model Merging: Leveraging Foundation Models for Dense Multi-Task Learning [46.5] モデルマージは、シングルタスクのチェックポイントをマルチタスクモデルにマージするための、柔軟で計算的に抽出可能なアプローチである。
本研究は,タスク固有デコーダの存在により,文献で研究されている単一入出力・複数出力モデルのマージ設定と定性的に異なることを示す。
SIMO設定に対する2つの単純かつ効率的な修正を提案し,統合後の特徴表現を再調整する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:10:46 GMT)
Lightning IR: Straightforward Fine-tuning and Inference of Transformer-based Language Models for Information Retrieval [43.4] 検索シナリオにトランスフォーマーベースの言語モデルを適用するための,使い易いフレームワークであるLightning IRを紹介する。
Lightning IRは、細調整やインデックス付けから検索と再ランク付けまで、検索パイプラインのすべてのステージをサポートするモジュラーとアーキテクチャを提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:46:44 GMT)
Flyweight FLIM Networks for Salient Object Detection in Biomedical Images [42.8] 本研究では,FLIMネットワークのバックプロパゲーションを伴わない拡張分離型畳み込みカーネルと多層拡散層を学習する手法を提案する。
また,カーネル冗長性とエンコーダサイズを低減するため,新しいネットワーク単純化手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:57:40 GMT)
Opinion: Revisiting synthetic data classifications from a privacy perspective [42.1] 合成データは、AI開発の増大するデータ要求を満たすための費用対効果のソリューションとして浮上している。
従来の合成データ型の分類は、合成データを生成するための絶え間なく増加する手法を反映していない。
我々は、プライバシーの観点をよりよく反映した、合成データ型をグループ化する、別のアプローチを例に挙げる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 10:00:22 GMT)
FlowUnits: Extending Dataflow for the Edge-to-Cloud Computing Continuum [41.9] FlowUnitsは、処理オペレータを、さまざまなリージョンで透過的に複製可能な、結合的で独立した管理可能なコンポーネントに整理する。
当社のアプローチでは,エッジとクラウドリソースを統合データ処理パイプラインにシームレスに統合しながら,データフローの単純さを維持しています。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:14:08 GMT)
Video Summarization with Large Language Models [41.5] 本稿では,近年のLarge Language Models (LLM) の機能を活用したビデオ要約フレームワークを提案する。
LLM-based Video Summarization (LLMVS) と呼ばれる我々の手法は、ビデオフレームをMulti-Modal Large Language Model (MLLM) を用いて一連のキャプションに変換する。
実験の結果,提案手法は標準ベンチマークにおける既存手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:56:14 GMT)
Measurement of the g factor of ground-state 87Sr at the parts-per-million level using co-trapped ultracold atoms [39.6] 我々は、光学的に閉じ込められた基底状態の超低温87Sr原子の核磁気共鳴を実証する。
近くで超低温87Rbの雲が共存するスキームを用いて、2桁以上の原子87Srの核g因子gIの測定を改善する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:43:03 GMT)
Unsupervised Model Tree Heritage Recovery [39.1] ニューラルネットワーク収集のための教師なしモデルツリー遺産復元の課題について紹介する。
我々の仮説では、モデルウェイトがこの情報を符号化し、ウェイトを考慮すれば、基盤となるツリー構造をデコードすることが課題である。
実験により,本手法が複雑なモデルツリーの再構成に成功していることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:53:58 GMT)
Dynamic Compressing Prompts for Efficient Inference of Large Language Models [38.6] 大規模言語モデル(LLM)は、高度なプロンプト技術のために、様々なタスクで優れたパフォーマンスを示している。
プロンプト圧縮は簡単な解決策だが、既存の手法では、重要な情報を保持し、状況の変化に適応し、異なるタスクにまたがって効果的を維持するという課題に直面している。
本手法は,性能を最大限に保ちつつ,プロンプトトークンの数を削減する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:20:45 GMT)
Kimina-Prover Preview: Towards Large Formal Reasoning Models with Reinforcement Learning [38.4] Kimina-Proverは、形式的定理証明のための新しい推論駆動探索パラダイムを開拓した大きな言語モデルである。
Qwen2.5-72Bから大規模な強化学習パイプラインでトレーニングされたKimina-Proverは、Lean 4の証明生成において、強力なパフォーマンスを示している。
Kimina-Prover は miniF2F ベンチマークに新しい最先端をセットし、pass@8192 で 80.7% に達した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:23:44 GMT)
The Sword of Damocles in ViTs: Computational Redundancy Amplifies Adversarial Transferability [38.3] 視覚変換器(ViT)における計算冗長性の役割と,その逆変換性への影響について検討する。
データレベルとモデルレベルを含む2種類の冗長性を同定し、攻撃効果を増幅する。
この知見に基づいて,注目空間の操作,アテンションヘッドの置換,クリーントークンの正規化,ゴーストモエの多様化,テスト時間逆行訓練など,一連のテクニックを設計する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 01:59:47 GMT)
Seeing like a Cephalopod: Colour Vision with a Monochrome Event Camera [37.9] セファロポッドは1種類の光受容体を持つにもかかわらず、独特の色の識別能力を示す。
我々は、この生物学的メカニズムから着想を得て、ボールレンズとイベントベースのカメラを組み合わせたスペクトルイメージングシステムを設計する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:47:11 GMT)
WaterFlow: Learning Fast & Robust Watermarks using Stable Diffusion [37.6] WaterFlowは、学習した潜伏依存の透かしに基づいて、高忠実度視覚透かしのための高速かつ極めて堅牢なアプローチである。
WaterFlowは、一般的な堅牢性に対して最先端のパフォーマンスを示し、難しい組み合わせ攻撃に対して効果的に防御できる最初の方法である。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 23:27:52 GMT)
PraNet-V2: Dual-Supervised Reverse Attention for Medical Image Segmentation [37.5] PraNet-V2は、医療画像のポリプセグメンテーションを強化するフレームワークである。
PraNet-V2には、明示的なバックグラウンド監視、独立したバックグラウンドモデリング、セマンティックに強化されたアテンション融合が含まれている。
本フレームワークは,4つのpolypセグメンテーションデータセットに対して高い性能を示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:49:29 GMT)
Towards Efficient Partially Relevant Video Retrieval with Active Moment Discovering [36.9] 能動モーメント探索(AMDNet)を用いた簡易かつ効果的な手法を提案する。
私たちは、彼らのクエリとセマンティックに一致したビデオモーメントを見つけることを約束しています。
2つの大規模なビデオデータセットの実験は、AMDNetの優位性と効率性を示している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:00:18 GMT)
GraphicBench: A Planning Benchmark for Graphic Design with Language Agents [36.9] GraphicBenchは、グラフィックデザインのための新しい計画ベンチマークで、4つのタイプにわたる1,079のユーザクエリと入力イメージをカバーする。
3つの設計専門家と46のアクション(ツール)を備えたLLMエージェントフレームワークであるGraphicTownを紹介します。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:26:59 GMT)
AFlow: Automating Agentic Workflow Generation [36.6] 大規模言語モデル(LLM)は、様々な領域にわたる複雑なタスクを解く上で、顕著な可能性を示している。
我々は、Monte Carlo Tree Searchを使って、この空間を効率的に探索する自動化フレームワークであるAFlowを紹介します。
6つのベンチマークデータセットに対する実証的な評価は、AFlowの有効性を示し、最先端のベースラインよりも平均5.7%向上している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:44:55 GMT)
A PyTorch-Compatible Spike Encoding Framework for Energy-Efficient Neuromorphic Applications [36.5] スパイキングニューラルネットワーク(SNN)は、特にスパーススパイク列車の処理において、有望なエネルギー効率の利点を提供する。
本稿ではスパイクエンコーディングのための新しいオープンソースのPythonフレームワークPyTorchを紹介する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:50:03 GMT)
The Pitfalls of Imitation Learning when Actions are Continuous [33.4] 本研究では,連続的な状態・動作制御システムにおいて,専門家のデモレータを模倣する問題について検討する。
指数的安定性と呼ばれる制御理論的性質を満たす力学であっても、任意の滑らかな決定論的模倣ポリシーは必ず誤りを被ることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:25:03 GMT)
Learning to Be A Doctor: Searching for Effective Medical Agent Architectures [32.8] 本稿では,医療エージェントアーキテクチャの自動設計のための新しいフレームワークを紹介する。
自動機械学習(AutoML)の成功に触発され、階層的で表現力のあるエージェント検索空間を定義する。
本フレームワークは,多様な機能ノード型からなるグラフベースのアーキテクチャとして医療エージェントを概念化する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:44:21 GMT)
A Clean Slate for Offline Reinforcement Learning [30.9] オフライン強化学習(RL)は曖昧な問題定義と絡み合ったアルゴリズム設計によって妨げられている。
我々は、厳格な分類法と、オンラインチューニング予算を明確に定量化する透明な評価プロトコルを導入する。
我々は,TD3-AWR(モデルフリー)とMoBRAC(モデルベース)という,確立されたベースラインを大幅に上回る2つの新しいアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:59:05 GMT)
Disambiguation for Video Frame Interpolation [30.5] ビデオフレームのタイム・ツー・ロケーションマッピングに対する新しいアプローチを提案する。
この複雑なタイム・ツー・ロケーションのマッピングを暗黙的に学習するようにネットワークに強制するのではなく、オブジェクトの移動距離に関する明確なヒントをネットワークに提供する。
この方法は、モデルに対するより明確な学習目標を提供し、オブジェクトの速度に関連する不確実性を低減します。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:18:31 GMT)
What Is a Good Caption? A Comprehensive Visual Caption Benchmark for Evaluating Both Correctness and Thoroughness [30.4] CAPabilityは、6つの重要なビューにまたがる12次元にわたる視覚的キャプションを評価するための総合的なベンチマークである。
我々は、生成したキャプションを評価するために、視覚要素アノテーションで1万1千近い人注画像や動画をキュレートした。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:58:38 GMT)
Reimagining Urban Science: Scaling Causal Inference with Large Language Models [29.7] 本研究は,構造的ギャップを識別するための研究トピック,データソース,方法論的アプローチを分類する分析によって,現在の都市因果研究を考察する。
本稿では,仮説生成,データエンジニアリング,実験設計と実行,政策勧告による結果解釈の4つの異なるモジュールエージェントからなるAutoUrbanCI概念フレームワークを提案する。
本稿では,厳密性と透明性の評価基準を提案し,人間とAIのコラボレーション,エクイティ,説明責任に対する影響を考察する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:58:11 GMT)
Nondeterministic Polynomial-time Problem Challenge: An Ever-Scaling Reasoning Benchmark for LLMs [29.4] 非決定論的多項式時間問題(Nondeterministic Polynomial-time Problem Challenge, NPPC)は、大規模言語モデル (LLM) の非決定論的推論ベンチマークである。
NPPCは、難解で、ハック不能で、自動検証可能で、一般的なものである。
NPPCは、LLMが人工知能(AGI)に向かわせるための、調査不可能でハック不能なテストベッドとして機能する、最初のスケール可能な推論ベンチマークである、と我々は信じている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:40:29 GMT)
QAVA: Query-Agnostic Visual Attack to Large Vision-Language Models [29.2] 特定の画像や質問を対象とする敵攻撃は、大きな視覚言語モデル(LVLM)を導き、誤った回答を与える。
問合せ非依存型視覚攻撃(QAVA)を導入し,不明確で未知の質問に対する誤った応答を生成する頑健な敵の例を作成することを目的とした。
本研究は,LVLMに対する視覚的敵対攻撃の範囲を広げ,これまで見過ごされていた脆弱性を明らかにする。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 10:00:01 GMT)
FaceSpeak: Expressive and High-Quality Speech Synthesis from Human Portraits of Different Styles [29.2] 視覚駆動型テキスト音声(TTS)学者は、実際の顔について調査を行った。
そこで我々は,多様なイメージスタイルから有能なアイデンティティ特性と感情表現を抽出する,新しいFaceSpeakアプローチを提案する。
余分な情報を緩和し、結果として文字のペルソナと密接に一致した音声が合成される。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:16:19 GMT)
Streamlining Biomedical Research with Specialized LLMs [29.1] 本稿では,最先端のドメイン特化言語モデルと高度な情報検索技術を統合した新しいシステムを提案する。
本稿では,頑健な質問応答モデルを活用することで,応答精度を向上させるシステムの能力を示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 06:05:56 GMT)
Bridging Distribution Gaps in Time Series Foundation Model Pretraining with Prototype-Guided Normalization [29.1] 本稿では,Transformerアーキテクチャ内でのドメイン対応適応正規化戦略を提案する。
従来のLayerNormをプロトタイプ誘導動的正規化機構(ProtoNorm)に置き換える。
本手法は,従来の事前学習手法よりも,分類タスクと予測タスクの両方において優れていた。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 06:23:00 GMT)
CARE: Aligning Language Models for Regional Cultural Awareness [28.7] 既存の言語モデル(LM)はしばしば西洋中心のバイアスを示し、多様な文化的知識を表現するのに苦労する。
これに対処する以前の試みは、合成データに頼り、文化的な知識を英語でのみ表現するものだった。
まず、中国文化とアラブ文化に関する2,580の質問に対して、人選好による24.1k応答の多言語リソースであるCAREを紹介した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:34:48 GMT)
Unmasking Deceptive Visuals: Benchmarking Multimodal Large Language Models on Misleading Chart Question Answering [28.5] 誤解を招くチャートの視覚化は、知覚を歪め、誤った結論につながる可能性がある。
大規模言語モデル(MLLM)の最近の進歩は、強力なチャート理解能力を示している。
本稿では,ミスリーディングチャート質問回答ベンチマーク(Misleading Chart Question Answering (Misleading ChartQA)ベンチマーク)を紹介する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:48:57 GMT)
ReTool: Reinforcement Learning for Strategic Tool Use in LLMs [27.1] ReToolは、ツール統合学習によるロングフォーム推論を強化する。
モデルは400のトレーニングステップで67%の精度を達成する。
注目すべきは、ReTool-32Bが72.5%の精度で設定できることだ。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:10:22 GMT)
AwesomeMeta+: A Mixed-Prototyping Meta-Learning System Supporting AI Application Design Anywhere [26.8] AwesomeMeta+は、メタ学習の重要なコンポーネントを標準化するために設計されたプロトタイピングと学習システムである。
設計からデプロイメントまで、メタ学習システムエンジニアリングのライフサイクル全体をサポートするために開発されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:14:54 GMT)
Air Quality Prediction with Physics-Guided Dual Neural ODEs in Open Systems [26.7] 大気汚染は人間の健康と生態系を著しく脅かし、公共政策を知らせるために効果的な大気質予測を必要とする。
伝統的なアプローチは一般に物理学に基づくモデルとデータ駆動モデルに分類される。
本稿では,ニューラルネットワークの2つの枝を統合した物理誘導型アプローチであるAirDualODEを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:41:17 GMT)
Adaptive Multi-Scale Decomposition Framework for Time Series Forecasting [26.1] 本稿では,時系列予測のための新しい適応型マルチスケール分解(AMD)フレームワークを提案する。
我々のフレームワークは時系列を複数のスケールで異なる時間パターンに分解し、MDM(Multi-Scale Decomposable Mixing)ブロックを活用する。
提案手法は,時間依存性とチャネル依存性の両方を効果的にモデル化し,マルチスケールデータ統合を改良するために自己相関を利用する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:28:27 GMT)
Slice+Slice Baby: Generating Last-Level Cache Eviction Sets in the Blink of an Eye [25.7] 我々はIntelプロセッサ上のエビクションセットを見つける技術に3つの主要な貢献をしている。
まず、メモリアクセス時間を比較し、アドレスマップのキャッシュスライスを特定する。
次に、既知のハッシュ関数を用いて、スライス識別法におけるエラー率を減らし、テストされていないメモリアドレスへのスライスマッピングを外挿することで作業を削減する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:11:38 GMT)
Enhancing Autonomous Driving Systems with On-Board Deployed Large Language Models [25.4] 本研究では,低レベルモデル予測制御器(MPC)と局所展開型大規模言語モデル(LLM)を組み合わせたハイブリッドアーキテクチャを提案する。
DecisionxLLMモジュールは、ロボットの状態情報を自然言語命令に対して評価し、所望の運転行動への順守を保証する。
本稿では、検索型拡張生成(RAG)、低ランク適応(LoRA)、微調整、量子化を利用するアプローチを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:49:17 GMT)
No Need to Talk: Asynchronous Mixture of Language Models [25.4] Smalltalk LMは、ほぼ非同期な方法で言語モデルの混合を訓練するための革新的な方法である。
推測では、短いプレフィックスによると、軽量ルータが与えられたシーケンスを単一の専門家に指示する。
言語モデリング実験により、SMALLTALK LMは高密度モデルベースラインよりも非常に低いパープレキシティを実現することが示された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 22:26:58 GMT)
Graph Linearization Methods for Reasoning on Graphs with Large Language Models [25.4] グラフは、ローカル依存やグローバルアライメントなど、自然言語テキストの特定の特性を反映するように線形化されるべきである。
グラフ集中度と退化度に基づくグラフ線形化法を開発した。
本研究は,LLMに適した新しいグラフ表現を導入し,マルチモーダル処理のトレンドとグラフ機械学習の潜在的な統合に寄与する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:38:16 GMT)
Breaking the Data Barrier -- Building GUI Agents Through Task Generalization [25.1] 本研究では,データ豊かで推論集約的なタスクにおける視覚言語モデル(VLM)のトレーニングを提案する。
本稿では,GUI認識,マルチモーダル推論,テキスト推論など,手軽に利用できるインストラクションチューニングデータを用いて,さまざまなタスクを探索する。
われわれの研究はGUIエージェントのドメイン間知識伝達に関する貴重な知見を提供し、データの不足に対処するための実践的なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:13:46 GMT)
OctGPT: Octree-based Multiscale Autoregressive Models for 3D Shape Generation [25.0] OctGPTは3次元形状生成のための新しいマルチスケール自己回帰モデルである。
従来の3D自動回帰手法の効率と性能を劇的に向上させる。
高品質でスケーラブルな3Dコンテンツ作成のための新しいパラダイムを提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:40:13 GMT)
HypoBench: Towards Systematic and Principled Benchmarking for Hypothesis Generation [24.7] 仮説生成手法を複数の側面にわたって評価するための新しいベンチマークである hypoBench を紹介する。
既存の6つの仮説生成手法と組み合わせた4つの最先端LCMの評価を行った。
結果は、現在の仮説生成手法がすべての関連するパターンや意味のあるパターンを完全には明らかにしていないため、改善の余地がまだ大きいことを示している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:00:00 GMT)
Vivid4D: Improving 4D Reconstruction from Monocular Video by Video Inpainting [24.4] そこで我々は,視線を増大させることにより4次元モノクロ映像合成を向上させる新しいアプローチであるVivid4Dを紹介した。
これは、観察されたビューを新たな視点に歪曲するビデオインペインティングタスクとして、ビュー増強を再構成する。
実験により,本手法はモノラルな4次元シーンの再現と完了を効果的に改善することが示された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:38:14 GMT)
Rethinking Theory of Mind Benchmarks for LLMs: Towards A User-Centered Perspective [24.3] Theory-of-Mind (ToM) タスクは、人間がLMのToM能力をベンチマークするために設計されている。
このアプローチにはいくつかの制限があります。
ヒューマン・コンピュータ・インタラクション(HCI)の観点から、これらの制限はToMベンチマークにおけるToMの定義と基準を再考するきっかけとなる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:44:43 GMT)
Improving Instruct Models for Free: A Study on Partial Adaptation [24.1] そこで本研究では,ベースモデルとインストラクションモデルのパフォーマンストラジェクトリについて,インストラクションチューニングの強度をスケールダウンさせることにより検討する。
複数のモデルファミリとモデルサイズにまたがって、命令調整結果の強度を低下させることで、数ショットのインコンテキスト学習ベンチマークにおいて物質的改善が達成されることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 21:35:09 GMT)
AskQE: Question Answering as Automatic Evaluation for Machine Translation [24.1] 本稿では,重要なMTエラーを検出し,実用的なフィードバックを提供するための質問生成および回答フレームワークであるAskQEを紹介する。
そこでAskQEはKendallのTau相関と判定精度を、他のQE指標と比較して高く評価する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:57:42 GMT)
Transforming Future Data Center Operations and Management via Physical AI [24.1] ミッションクリティカルなインフラとしてのデータセンターは、人工知能(AI)とデジタル経済の成長を支えている。
Internet DCからAI DCへの進化は、ビジネスレジリエンスの向上とオーナシップの総コスト削減のために、データセンタの運用と管理に関する新たな課題を導入している。
我々は,DCの運用と管理を進めるための新しい物理AI(PhyAI)フレームワークを提案し,開発する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:06:12 GMT)
TAMP: Token-Adaptive Layerwise Pruning in Multimodal Large Language Models [23.9] MLLM(Multimodal Large Language Models)は多様なマルチモーダルデータやタスクを理解する上で,優れた汎用性を示している。
本稿では,MLLMに適した簡易かつ効果的な刈取フレームワークであるTAMPを提案する。
我々は、視覚言語タスク用に設計されたLLaVA-NeXTと、音声、視覚、言語モーダルを処理可能なVideoLLaMA2の2つの最先端MLLMに対して、本手法の有効性を検証する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:52:43 GMT)
Advanced Architectures Integrated with Agentic AI for Next-Generation Wireless Networks [23.9] 本稿では,ネットワーク運用の簡素化,運用費の削減(OpEx),新サービスモデルの展開を目的とした最先端技術について検討する。
i) 長期6Gネットワークの進化に対処しながら、サービスのシームレスな拡張を可能にするコントロールプレーンとユーザプレーンを備えた、新しい、より効率的な6Gアーキテクチャの提供に重点を置いている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:24:26 GMT)
Exploring Persona-dependent LLM Alignment for the Moral Machine Experiment [23.7] 本研究では,道徳機械実験の様々な文脈における社会主導型意思決定と人的判断の整合性について検討した。
LLMのモラル決定は人格によって大きく異なり、人間よりも重要なタスクに対するモラル決定のシフトが大きいことが判明した。
道徳的決定を伴うアプリケーションにこれらのモデルを配置する際の倫理的意味とリスクについて論じる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:29:51 GMT)
Mamba as a Bridge: Where Vision Foundation Models Meet Vision Language Models for Domain-Generalized Semantic Segmentation [23.7] Vision Foundation Models(VFM)とVision-Language Models(VLM)はドメイン一般化セマンティック(DGSS)で注目を集めている。
本稿では, VFM と VLM の強度を効率よく組み合わせた, マンバをベースとした新しい融合フレームワーク MFuser を提案する。
提案手法は,高い計算オーバーヘッドを伴わずに,高精度な特徴局所性と強いテキストアライメントを実現する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:14:58 GMT)
LLaVA-ReID: Selective Multi-image Questioner for Interactive Person Re-Identification [23.6] 対話型人物再識別(Inter-ReID)という新しいタスクを導入する。
Inter-ReIDは対話に基づく検索タスクであり、目撃者との対話を通じて初期記述を反復的に洗練する。
LLaVA-ReIDは,視覚的およびテキスト的コンテキストに基づいて,対象とする質問を生成する質問モデルである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:41:21 GMT)
Reasoning in visual navigation of end-to-end trained agents: a dynamical systems approach [23.5] 本研究では,物理ロボットを用いた実環境におけるヌンペプソデスのナビゲーションエピソードに関する大規模実験を行った。
エンドツーエンドのトレーニングから生じる推論のタイプを分析します。
本稿では,エージェントが学習した値関数が長期計画に関連があることをポストホック分析で示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:24:40 GMT)
Teaching Large Language Models to Reason through Learning and Forgetting [23.4] 大規模言語モデルにおける推論時間探索の活用は、複雑な数学的および推論問題を解くための訓練されたモデルの能力をさらに強化するために有効であることが証明されている。
このアプローチは計算コストと推論時間を大幅に向上させる。
本稿では,検索機能を直接モデルに組み込むための効果的な手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:30:02 GMT)
FairACE: Achieving Degree Fairness in Graph Neural Networks via Contrastive and Adversarial Group-Balanced Training [23.4] 本稿では,Fairness-Aware Asymmetric Contrastive Ensemble (FairACE)と呼ばれる新しいGNNフレームワークを提案する。
また、異なる次数ベースのノード群間での等価性能を定量的に評価し、保証する新しい公正度尺度である、精度分布ギャップ(ADG)を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:22:16 GMT)
The Value of Information in Human-AI Decision-making [23.4] 情報の価値を特徴付けるための決定論的枠組みを提供する。
本稿では,モデル選択,人間-AI性能の実証評価,説明設計におけるフレームワークの利用について紹介する。
本稿では,意思決定における情報価値を説明するために,サリエンシに基づく説明手法であるSHAPを適用した新しい情報ベース説明手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:26:06 GMT)
MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervision [23.1] モノクラーオープンドメイン画像から3次元形状を復元する強力なモデルであるMoGeを提案する。
一つの画像が与えられた場合、アフィン不変表現でキャプチャされたシーンの3Dポイントマップを直接予測する。
本稿では,高品質な幾何学を学習する上で,モデルに有効性を与える新しいグローバルおよびローカルな幾何学監督手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 06:33:45 GMT)
A Piecewise Lyapunov Analysis of Sub-quadratic SGD: Applications to Robust and Quantile Regression [22.9] 一階微分しか持たない関数を$f$で扱える新しいLyapunov関数を導入する。
一般の減少段数と定数段数の下で有限時間モーメント境界を導出する。
我々の結果は、特にオンライン統計手法に広く応用されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:35:43 GMT)
Visual Re-Ranking with Non-Visual Side Information [21.8] 本稿では,他の種類のサイド情報を活用可能なグラフニューラルネットワークを用いたリグレード手法を提案する。
実験では、画像検索の指標だけでなく、下流の視覚的ローカライゼーションタスクにも大きな改善が見られた。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:37:16 GMT)
Diversity-Driven Learning: Tackling Spurious Correlations and Data Heterogeneity in Federated Models [21.7] フェデレートラーニング(FL)は、分散データに基づく機械学習モデルの分散トレーニングを可能にする。
現実世界のFL設定では、クライアントデータは不特定に分散され、不均衡になることが多い。
FLにおける新しいクライアント選択アルゴリズムであるFedDiverseを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:20:42 GMT)
TSAL: Few-shot Text Segmentation Based on Attribute Learning [21.4] 本稿では,CLIPの事前知識を利用してテキスト属性のセグメンテーションを学習するTSALを提案する。
データ依存性を低減し、テキスト検出精度を向上させるため、適応的なプロンプト誘導分岐は効果的な適応的なプロンプトテンプレートを使用する。
実験により, 複数テキストセグメンテーションデータセット上でのSOTA性能について, 数ショット設定で検証した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:12:42 GMT)
GaSLight: Gaussian Splats for Spatially-Varying Lighting in HDR [21.4] GaSLightは、通常の画像から空間的に変化する光を生成する方法である。
ガウススプレートを用いて3次元照明をモデル化し,空間変動照明を実現する。
提案手法は,HDR推定の最先端結果と仮想オブジェクトやシーンの照明への応用をもたらす。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:08:42 GMT)
The Obvious Invisible Threat: LLM-Powered GUI Agents' Vulnerability to Fine-Print Injections [21.3] LLM(Large Language Model)ベースのGUIエージェントは、高レベルな命令に従ってユーザの代用タスクを実行する専門的な自律システムである。
フォームや予約サービスなどの現実世界のタスクを完了させるには、GUIエージェントは機密性の高いユーザーデータを処理する必要がある。
これらの攻撃は、エージェントと人間のユーザに対する視覚的満足度の違いを悪用することが多い。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:21:09 GMT)
Bridging Technology and Humanities: Evaluating the Impact of Large Language Models on Social Sciences Research with DeepSeek-R1 [21.1] 本稿では, 大規模言語モデルであるDeepSeek-R1を, 低リソース言語翻訳, 教育質問応答, 高等教育における生徒の書き方の改善, 論理的推論, 教育計測と心理測定, 公衆衛生政策分析, 美術教育の7つの側面から分析する。
DeepSeek-R1は人文科学や社会科学でよく働き、ほとんどの質問に正しく論理的に答え、適切な分析プロセスと説明を与える。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:09:24 GMT)
Document Quality Scoring for Web Crawling [21.1] 本研究では,静的インデックスプルーニングにおけるセマンティッククオリティのニューラルネットワークを用いて,クローリング優先タスクにおけるWebページの意味的クオリティを評価する。
私たちのソフトウェアコントリビューションは、特定のWebページの効果的な品質スコアを計算するDockerコンテナで構成されています。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:32:57 GMT)
Preference-based Learning with Retrieval Augmented Generation for Conversational Question Answering [21.0] PRAISEは、ConvQAのパイプラインベースのアプローチで、3つのサブタスクごとにアダプタをトレーニングする。
PRAISEはサブタスク毎の改善を示し、人気の高いConvQAベンチマークで新しい最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:10:39 GMT)
AI Mismatches: Identifying Potential Algorithmic Harms Before AI Development [19.9] システムの実際のパフォーマンスは、安全性と共同創造性を確保するために必要なものよりも低い、重要な“AIミスマッチ”を観察します。
本稿では,リスクを早期に予測・緩和するためのAI Mismatchアプローチを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:15:40 GMT)
FHBench: Towards Efficient and Personalized Federated Learning for Multimodal Healthcare [19.6] フェデレートラーニング(FL)は,患者データを共有することなく,多施設連携のための効果的なソリューションとして登場した。
FHBench(Federated Healthcare Benchmark)は、現実の医療アプリケーションから派生したデータセットから特別に設計されたベンチマークである。
FHBenchをベースとして、パーソナライズされたFLフレームワークであるAdaptive LoRA(EPFL)による効率的なパーソナライズされたフェデレーションラーニングを導入した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:38:00 GMT)
UniRGB-IR: A Unified Framework for Visible-Infrared Semantic Tasks via Adapter Tuning [19.5] 我々は、RGB-IRセマンティックタスクのためのスケーラブルで効率的なフレームワークUniRGB-IRを提案する。
本フレームワークは,視覚変換器(ViT)基礎モデル,マルチモーダル特徴プール(SFI)モジュール,補助特徴プール(SFI)モジュールの3つの主要コンポーネントから構成される。
各種RGB-IRセマンティックタスクの実験結果から,本手法が最先端の性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:17:46 GMT)
Fundamental Limits of Deep Learning-Based Binary Classifiers Trained with Hinge Loss [18.6] ディープラーニング(DL)は多くの分野においていくつかのブレークスルーをもたらしている。
パターン分類問題を解くために用いたDLベースのアルゴリズムの試験性能を定量化する研究は行われていない。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:09:21 GMT)
Towards A Universal Graph Structural Encoder [18.6] GFSEは、様々な領域にわたる転送可能な構造パターンをキャプチャするために設計された普遍的なグラフ構造エンコーダである。
グラフ変換器上に構築されたGFSEは、グラフ誘導バイアスによって誘導される注意機構を導入し、多層および微細なトポロジ的特徴をエンコードする。
GFSEは81.6%の評価ケースで最先端のパフォーマンスを達成し、多様なグラフモデルとデータセットにまたがる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 06:57:26 GMT)
BEACON: A Benchmark for Efficient and Accurate Counting of Subgraphs [18.3] 本稿では,アルゴリズム(AL)と機械学習(ML)の両方のサブグラフカウント手法を厳格に評価するベンチマークであるBEACONを紹介する。
BEACONは、検証済みの真実、統合評価環境、公開リーダボードを備えた標準化されたデータセットを提供する。
実験の結果,AL法は,非常に大きなグラフ上の部分グラフを効率的に数えるのに優れるが,複雑なパターンに悩まされることがわかった。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:53:47 GMT)
Masculine Defaults via Gendered Discourse in Podcasts and Large Language Models [17.5] 男性的デフォルトは、(i)文化的文脈、(ii)男性的特徴または行動、(iii)男性的特徴または行動に対する報酬、または単に受け入れることの3つの重要な部分を含む。
我々は、ソーシャルメディアの人気の成長形態であるポッドキャストに焦点を合わせ、15,117のポッドキャストエピソードを分析した。
本研究では、これらのジェンダー化された言論語がドメイン固有の文脈で流行していることを調査し、ジェンダー化された言論ベースの男性デフォルトが、ビジネス、技術、政治、ビデオゲームの領域に存在することを確認する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:41:54 GMT)
LL-Gaussian: Low-Light Scene Reconstruction and Enhancement via Gaussian Splatting for Novel View Synthesis [17.5] 低照度シーンにおける新しいビュー合成(NVS)は、劣化した入力のために重要な課題である。
低照度sRGB画像からの3次元再構成と拡張のための新しいフレームワークであるLL-Gaussianを提案する。
最先端のNeRFベースの手法と比較して、LL-Gaussianは最大2000倍高速な推論を実現し、トレーニング時間を2%に短縮する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:06:33 GMT)
Self-Supervised Enhancement of Forward-Looking Sonar Images: Bridging Cross-Modal Degradation Gaps through Feature Space Transformation and Multi-Frame Fusion [17.4] 前向きのソナー画像の強調は、正確な水中目標検出に不可欠である。
本稿では,画素領域からソナー画像をロバストな特徴領域にマッピングする特徴空間変換を提案する。
提案手法は既存の手法よりも優れ,ノイズを効果的に抑制し,詳細なエッジを保ち,明るさを大幅に改善する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:34:56 GMT)
MultiLoKo: a multilingual local knowledge benchmark for LLMs spanning 31 languages [17.2] 我々は、31言語をカバーするLLMの多言語性を評価するための新しいベンチマークであるMultiLoKoを提案する。
我々はMultiLoKoのスコアを11のベースで計算し、マルチリンガルなチャットモデルを市場に出し、平均的なパフォーマンスについて研究する。
局所的データと英訳データを使用することで,最高の演奏モデルに対して20点以上の差が生じることが判明した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:02:53 GMT)
GaussVideoDreamer: 3D Scene Generation with Video Diffusion and Inconsistency-Aware Gaussian Splatting [17.2] GaussVideoDreamerは、画像、ビデオ、および3D生成のギャップを埋めることで、生成的マルチメディアアプローチを前進させる。
提案手法は,LLaVA-IQAスコアの32%,既存の手法に比べて少なくとも2倍の高速化を実現している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:01:45 GMT)
REWARD CONSISTENCY: Improving Multi-Objective Alignment from a Data-Centric Perspective [16.8] 言語モデルにおける多目的的選好アライメントは、しばしば困難なトレードオフに遭遇する。
我々は、これらの衝突を効果的に軽減できるデータのタイプを明らかにするために、新しいデータ駆動アプローチを探求する。
生成したデータは、無害率と無害率の両方で平均13.37%向上し、無害度と無害度を最適化する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:09:19 GMT)
Sub-optimality of the Separation Principle for Quadratic Control from Bilinear Observations [16.7] 最小2次コストで双線形観測から数値力学系を制御することの問題点を考察する。
この問題と標準線型二次ガウスフィルタ(LQG)との類似性にもかかわらず、どちらも二線型分離原理モデルではないことを示す。
複数の合成条件で実験を行った結果について述べる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:53:51 GMT)
Randomization Can Reduce Both Bias and Variance: A Case Study in Random Forests [16.6] 我々は、しばしば見落とされがちな現象について研究し、最初はカテブレイマン2001randomで指摘され、ランダムな森林は、バッグングに比べて偏見を減らしているように見える。
我々の観察は、様々なSNRにおけるランダム林の現実的な成功についての洞察を与え、ランダム林とバッグアンサンブルの違いの理解を深める。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:39:47 GMT)
Performant Automatic BLAS Offloading on Unified Memory Architecture with OpenMP First-Touch Style Data Movement [16.5] 本稿では,自動BLASオフロードのための新しいツールであるSCILIB-Accelを紹介する。
このツールはCPUバイナリから直接BLASシンボルをインターセプトし、コード修正や再コンパイルは不要である。
SCILIB-Accelは、最大数百のGPUノード上の複数の量子物理学符号を用いて評価され、有望なスピードアップをもたらす。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:40:25 GMT)
Cancer-Myth: Evaluating AI Chatbot on Patient Questions with False Presuppositions [16.2] 実際の患者から得られた癌関連質問に対して,大言語モデル(LLMs)を評価した。
LLMは、しばしば質問における偽の前提を認識または対処するのに失敗する。
以上の結果から,LSMの臨床的信頼性に重大なギャップがあることが示唆された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:37:32 GMT)
SEA-LION: Southeast Asian Languages in One Network [16.1] 本稿では,Llama-SEA-LION-v3-8B-ITとGemma-SEA-LION-v3-9B-ITを紹介する。
LLMのSEA-LIONファミリーは、英語、中国語、インドネシア語、ベトナム語、マレー語、タイ語、ビルマ語、ラオス語、フィリピン語、タミル語、クメール語を含む11のSEA言語をサポートしている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:51:05 GMT)
Influence Maximization in Temporal Social Networks with a Cold-Start Problem: A Supervised Approach [16.0] 時間グラフにおける影響最大化(IM)は、ネットワーク拡大の最大化に欠かせない影響のある「種子」を特定することに焦点を当てる。
インフェクトプロパゲーションパス(IPP)によるこれらの種の定義を提唱する。
我々の焦点はIPPを効率的にラベル付けし、これらの種を正確に予測することにある。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:44:30 GMT)
Block Majorization Minimization with Extrapolation and Application to $β$-NMF [16.0] マルチ最適化問題のクラスを解くために,外挿法 (BMMe) を用いたブロック行列化最小化法を提案する。
本稿では,Bregman分散を適応的に更新することにより,BMMeのブロック偏極パラメータをブロックミラー法として再構成可能であることを示す。
広範囲な実験を通じて,$beta$NMF に対する有意な加速 BM を実証的に説明する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:15:01 GMT)
Interpretable Hybrid-Rule Temporal Point Processes [14.9] 時間的ポイントプロセス(TPP)は、様々な医療領域におけるイベントシーケンスのモデル化に広く用いられている。
近年、解釈可能なTPPを導入しているが、これらの手法は数値的特徴を取り入れていない。
本稿では,時間論理ルールと数値的特徴を統合する新しいフレームワークであるHybrid-Rule Temporal Point Processes (HRTPP)を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:15:16 GMT)
Diffusion Distillation With Direct Preference Optimization For Efficient 3D LiDAR Scene Completion [14.9] 本稿では,LiDARシーン完了のための拡散蒸留フレームワークであるDistillation-DPOを提案する。
本手法は, 蒸留における嗜好学習を最善に活用し, 選好整合蒸留に関する知見を提供するための最初の試みである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:57:13 GMT)
Automatic Input Rewriting Improves Translation with Large Language Models [14.1] 機械翻訳(MT)ユーザーは、既製のMTシステムを使用すると、よく書かれたテキストが翻訳しやすいという直感に頼っている。
テキストの単純化はMTに依存しない最も効果的な書き直し戦略であることを示す。
人間による評価では、単純化された書き直しとそのMT出力が、ソースとMTの本来の意味を主に保持していることが確認されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 21:11:11 GMT)
Longitudinal Analysis of Privacy Labels in the Apple App Store [14.1] 2020年12月、Appleはアプリデベロッパーに対して、アプリのプライバシーラベルアノテーションを自己報告するよう要求し始めた。
プライバシーラベルの公開から2年近く経った今、アプリの70.1%がプライバシーラベルを持っている。
ラベルを持つアプリのうち、18.1%はユーザーを追跡するために使用されるデータを集め、38.1%はユーザーIDにリンクされたデータを収集し、42.0%はリンクされていないデータを収集している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:31:05 GMT)
VEXP: A Low-Cost RISC-V ISA Extension for Accelerated Softmax Computation in Transformers [14.0] ソフトマックスの加速は、非ポイント、非線形の性質のために困難であり、指数が最も要求されるステップである。
シュラウドルフ法に基づく新しい近似アルゴリズムを用いて, Bfloat16指数の算術ブロックを設計する。
我々は162.7$times$低レイテンシと74.3$times$低エネルギーでSoftmaxを実行する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:28:48 GMT)
TransST: Transfer Learning Embedded Spatial Factor Modeling of Spatial Transcriptomics Data [13.7] 本稿では,細胞ラベル情報を外部ソースから適応的に活用するトランスファー学習フレームワーク(TransST)を提案する。
本研究は,TransSTが細胞サブクラスタの同定と,空間転写学データにおける対応する生体マーカーの検出に有効かつ堅牢であることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 22:03:38 GMT)
Large language models could be rote learners [13.6] 大規模言語モデル(LLM)の評価には,MCQ(Multiple-choice Question)ベンチマークが広く使用されている。
本研究では,汚染を学習の本質的な側面として再編成し,表層記憶からの真の能力獲得を抑えることを目的とする。
本稿では,MCQを新たなトリニティ形式に再構成し,知識評価を維持しつつ記憶を減らし,新たな評価フレームワークであるTrinEvalを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:02:35 GMT)
Toward Intelligent and Secure Cloud: Large Language Model Empowered Proactive Defense [13.6] 大規模言語モデル(LLM)は、セキュリティインテリジェンスに対する有望なソリューションを提供する。
LLM-PDは、様々な脅威を積極的に打ち負かす新しい防御アーキテクチャである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:05:56 GMT)
Deep Learning Approaches for Medical Imaging Under Varying Degrees of Label Availability: A Comprehensive Survey [13.5] この調査は、これらの領域における進化する研究を分類し、レビューし、2018年以降に約600の著名な貢献を分析している。
画像分類、セグメンテーション、および脳、胸部、心臓イメージングに限らず、様々な医療応用領域における検出などのタスクをカバーしている。
異なる学習パラダイムの形式的定義を提供し、様々な学習メカニズムと戦略の包括的要約と解釈を提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 20:06:43 GMT)
Room-Temperature Hybrid 2D-3D Quantum Spin System for Enhanced Magnetic Sensing and Many-Body Dynamics [13.4] 光学的にアクセス可能なスピン欠陥を持つ2次元(2D)材料は、統合量子スピンシステムを構築するための有望なプラットフォームとして登場した。
2次元六方晶窒化ホウ素フレーク中のホウ素空孔 (VB) スピンと, 3次元単結晶ダイヤモンド中の窒素空孔 (NV) 中心とを結合し, 環境条件下で動作させるハイブリッドスピンシステムを提案する。
この複合システムは完全な制御性を実現し、ダイナミックレンジの改善を含むナノスケール磁気センサの性能を向上させる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:30:07 GMT)
Evaluation Under Imperfect Benchmarks and Ratings: A Case Study in Text Simplification [13.4] 様々なサイズのモデルによって生成される単純化された文を特徴付けるテキスト単純化のための合成ベンチマークを提案する。
評価の結果,評価基準はアノテータ間の高い一致を示し,予想される傾向を反映していることがわかった。
第2に, LLM審査員(LLMs-as-a-jury)による自動評価は, テキスト簡易化評価において一貫した評価を得るのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 23:18:26 GMT)
What is the Role of Small Models in the LLM Era: A Survey [13.2] 大規模言語モデル(LLM)は人工知能(AGI)の進歩に大きな進歩をもたらし、GPT-4やLLaMA-405Bのような大規模モデルの開発に繋がった。
モデルのサイズを拡大すると、計算コストとエネルギー消費が指数関数的に増加し、これらのモデルは限られたリソースを持つ学術研究者やビジネスにとって実用的ではない。
同時に、Small Models (SM) は実際的な設定で頻繁に使用されるが、その重要性は過小評価されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:38:08 GMT)
Model-free Estimation of Latent Structure via Multiscale Nonparametric Maximum Likelihood [13.2] そこで我々は,そのような潜在構造がいつでも存在すると仮定することなく,その存在を推定するためのモデルフリーな手法を提案する。
アプリケーションとして,提案手法に基づくクラスタリングアルゴリズムを設計し,広範囲の潜伏構造を捕捉する手法の有効性を実証する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:39:57 GMT)
Realizing Scalable Conditional Operations through Auxiliary Energy Levels [12.9] 遷移経路工学に基づく遷移複合ゲート方式を提案する。
制御単位系(CU)とその応用を実証する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:48:49 GMT)
Early Impacts of M365 Copilot [12.7] 我々は、AIがいかにして知識労働者の仕事の仕方を変えつつあるかについて、最も初期の証拠をいくつか提示する。
さまざまな産業や職業において、共通コアタスクの大幅な削減が期待できる。
技術が新しくなったにもかかわらず、ツールにアクセスできる労働者の40%近くが、6ヶ月にわたる研究で定期的に利用している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:55:32 GMT)
Using Time Structure to Estimate Causal Effects [12.7] 時系列設定における直接(およびライトの経路規則全体を通して)因果効果を推定するための新しいアプローチを提案する。
このアプローチは、基礎となる時系列が構造ベクトル自己回帰過程であると仮定する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:21:37 GMT)
FairPy: A Toolkit for Evaluation of Prediction Biases and their Mitigation in Large Language Models [12.6] 近年,BERT や GPT-2 のような大規模事前学習言語モデル (LLM) がトークン予測のバイアスを示すことが実証されている。
本稿では, BERT や GPT-2 など, 広く使用されている LLM に適した技術について概説する。
また、Fairpyは、これらの数学的ツールを統合するためのプラグアンドプレイインターフェースを提供するモジュラーおよびツールキットである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:08:13 GMT)
LayoutCoT: Unleashing the Deep Reasoning Potential of Large Language Models for Layout Generation [12.6] 条件付きレイアウト生成は、ユーザが定義した制約から視覚的に魅力的でセマンティックに一貫性のあるレイアウトを自動的に生成することを目的としている。
本稿では,Large Language Models (LLMs) の推論能力を活用する新しい手法として,検索型拡張生成(RAG) とChain-of-Thought (CoT) 技術の組み合わせを提案する。
我々は3つの条件付きレイアウト生成タスクにまたがる5つの公開データセットについて広範な実験を行った。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:12:01 GMT)
MuSeD: A Multimodal Spanish Dataset for Sexism Detection in Social Media Videos [12.6] 我々は、TikTokとBitChuteから抽出された11時間分のビデオを$approx$で提供する、性差別検出のための新しいマルチモーダルスペイン語データセットであるMuSeDを紹介した。
視覚情報は、人間とモデルの両方に性差別的コンテンツをラベル付けする上で重要な役割を担っている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:16:46 GMT)
Can you map it to English? The Role of Cross-Lingual Alignment in Multilingual Performance of LLMs [12.3] 大きな言語モデル (LLMs) は英語のテキストに基づいて事前訓練されており、驚くべき多言語機能を示している。
識別タスクのインスタンスレベルでのアライメントを定量化するために、言語間アライメントメトリクスを導入します。
言語間アライメントの指標は言語レベルでのタスク精度と強く相関するが,サンプルレベルのアライメントは誤予測と正しく区別できないことが多い。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:49:34 GMT)
GOAT-TTS: LLM-based Text-To-Speech Generation Optimized via A Dual-Branch Architecture [12.3] 新たな2分岐ArchiTecture(GOAT-TTS)を用いた音声合成手法を提案する。
GOAT-TTSは音声エンコーダとプロジェクタを組み合わせて連続的な音響埋め込みをキャプチャし、パラ言語的特徴(言語、音色、感情)と意味的テキスト表現の双方向の相関を可能にする。
実験の結果,GOAT-TTSは最先端のTSモデルに匹敵する性能を示した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 01:44:56 GMT)
Efficient Distributed Retrieval-Augmented Generation for Enhancing Language Model Performance [12.3] 小言語モデル(SLM)はリソース制約のあるエッジデバイスへの効率的なデプロイをサポートするが、その限られた能力は推論性能を損なう。
Retrieval-augmented Generation(RAG)は、デバイス上でのモデル再トレーニングを必要とせずに、外部データベースを統合することによってモデルパフォーマンスを向上させるための有望なソリューションである。
文書のプライバシーを漏洩させることなく、一般知識と個人知識の両方を通じてデバイス上のSLMを強化する分散RAGフレームワークであるDRAGONを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:53:08 GMT)
GUM-SAGE: A Novel Dataset and Approach for Graded Entity Salience Prediction [12.2] 格付けされたエンティティサリエンス(英語版)は、テキストにおける相対的な重要性を反映したエンティティスコアを割り当てる。
両アプローチの強みを組み合わせた,格付けされたエンティティ・サリエンスのための新しいアプローチを提案する。
提案手法は,人間の要約やアライメントに基づくスコアとの相関が強く,既存の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 01:26:14 GMT)
3D Wavelet Convolutions with Extended Receptive Fields for Hyperspectral Image Classification [12.2] ディープニューラルネットワークは、ハイパースペクトル画像分類において多くの課題に直面している。
本稿ではウェーブレット変換と統合された改良型3D-DenseNetモデルWCNetを提案する。
実験結果から,IN,UP,KSCデータセットにおいて優れた性能を示した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 01:39:42 GMT)
Are Generative AI Agents Effective Personalized Financial Advisors? [12.1] 本稿では,金融分野における大規模言語モデルに基づくエージェントの有効性について検討する。
本研究は,(1)ユーザ自身のニーズが不確実である場合のユーザ嗜好の付与,(2)多様な投資嗜好に対するパーソナライズされたガイダンスの提供,(3)アドバイザ・パーソナリティの活用による関係構築と信頼の育成,という3つの課題に焦点をあてる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 01:14:43 GMT)
LightFormer: A lightweight and efficient decoder for remote sensing image segmentation [12.0] 構造化されていないターゲットを含む時間クリティカルなタスクのための軽量デコーダであるLightFormerを紹介します。
LightFormerは、チャネル処理上に構築された機能融合および改良モジュールと、学習可能なゲーティング機構を使用して、マルチスケール、マルチレンジ情報を効率的に集約する。
ISPRS Vaihingenベンチマークでは、LightFormerはGLFFNetのmIoUの99.9%を獲得し、FLOPの14.7%とパラメータの15.9%しか必要としていない。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:25:39 GMT)
AnimeDL-2M: Million-Scale AI-Generated Anime Image Detection and Localization in Diffusion Era [11.9] 手描きアートワークとしてのAI生成画像の誤表現は、アニメコミュニティや業界に深刻な脅威をもたらす。
本稿では,アニメIMDLの包括的なアノテーションを用いた大規模ベンチマークであるAnimeDL-2Mを提案する。
また,アニメ映像の視覚的特徴に合わせた新しいモデルAniXploreを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:41:08 GMT)
Evolving Hard Maximum Cut Instances for Quantum Approximate Optimization Algorithms [11.9] Recursive Quantum Approximate Optimization Algorithm (RQAOA) などの変分量子アルゴリズムが普及している。
本研究では、ユニークなフィットネス機能を備えた進化的アルゴリズムを用いる。
このアプローチは、グラフオートエンコーダの潜在空間内のハード最大カットインスタンスをターゲットにしている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:58:25 GMT)
Acquisition of high-quality images for camera calibration in robotics applications via speech prompts [11.9] クリップオンマイクで記録された音声コマンドによって制御される新しいキャリブレーション画像取得手法を提案する。
我々は、単語ごとのタイムスタンプを正確に表現した最先端の音声テキスト書き起こしモデルを用いて、正確な時間的アライメントでトリガー語をキャプチャする。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:54:43 GMT)
Enhancing Code LLM Training with Programmer Attention [11.6] プログラマの注意グラフを拡大するための視線追跡経路拡張手法を提案する。
我々はまた、生の修正を学習可能な注意モチーフに洗練するパターン抽象化のステップも導入する。
コード要約のためのCodeXGlueベンチマークでは,CodeBLEUで+7.16が得られた。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:53:50 GMT)
GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents [11.4] nameは、高レベルな現実世界のタスクシナリオにおけるLVLMの能力を高めるために設計された最初の強化学習フレームワークである。
従来のOS-Atlasのような最先端のメソッドと比較して、データの0.02%しか使っていない。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:42:43 GMT)
CSPLADE: Learned Sparse Retrieval with Causal Language Models [11.3] 学習スパース検索(LSR)のための大規模言語モデル(LLM)の訓練における2つの課題を特定する。
本研究では,(1)トレーニング不安定を解消するための軽量適応訓練フェーズ,(2)双方向情報を実現するための2つのモデル変種を提案する。
これらの手法により,LSRモデルを8BスケールのLLMで学習し,インデックスサイズを縮小した競合検索性能を実現することができる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:31:34 GMT)
Automated Retrosynthesis Planning of Macromolecules Using Large Language Models and Knowledge Graphs [11.2] 大規模言語モデル(LLM)と知識グラフを統合するエージェントシステムを提案する。
本システムは,関係する文献の検索,反応データの抽出,データベースクエリ,逆合成経路木の構築を完全自動化する。
この研究は、LLMを動力とするマクロ分子に特化して、完全に自動化された再合成計画薬を開発する最初の試みである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:40:07 GMT)
Towards Interpretable Deep Generative Models via Causal Representation Learning [11.1] ディープラーニングや生成モデリングといった機械学習技術は、幅広い領域にわたる最先端のパフォーマンスを実現する。
ディープニューラルネットワークは、これらの表現を曖昧にするブラックボックスとして知られており、解釈や分析を困難にしている。
因果表現学習の新たな分野は、柔軟で解釈可能で、伝達可能な生成可能なAIを構築するためのベクトルとして因果性を使用している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 20:46:42 GMT)
A Large-Language Model Framework for Relative Timeline Extraction from PubMed Case Reports [10.9] 本稿では,ケースレポートを時系列化されたテキストイベントとタイムスタンプのペアに変換するシステムを提案する。
この研究は、時間分析にPMOAコーパスを活用するためのベンチマークとして機能する可能性がある。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 20:54:19 GMT)
Towards the Terminator Economy: Assessing Job Exposure to AI through LLMs [10.8] 米国の雇用の3分の1はAIに強く依存しており、主に大学院または大学院の教育を必要とする高度な職業で行われている。
高度な職業であっても、AIはタスク置換において高い多様性を示し、AIと人間は同じ職業の中で相互に補完することを示唆している。
すべての結果、モデル、コードはオンラインで公開されており、コミュニティが結果を再現し、結果を比較し、私たちの仕事をベンチマークとして使用して、時間とともにAIの進捗を監視します。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:51:16 GMT)
Towards Personalized Conversational Sales Agents : Contextual User Profiling for Strategic Action [10.6] 本稿では、嗜好の誘惑、推薦、説得を統一する新しいタスクである会話販売(CSales)を紹介する。
CSales の現実的な評価のために,実世界のデータから構築した LLM ベースのユーザシミュレータ CSUser を提案する。
また、対話型行動計画のための対話を通して文脈プロファイルを積極的に推測する対話型販売エージェントCSIを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:21:39 GMT)
Embedding Radiomics into Vision Transformers for Multimodal Medical Image Classification [10.6] ビジョントランスフォーマー(ViT)は、自己注意を通じて長距離依存をモデル化することで、畳み込みモデルの強力な代替手段を提供する。
本稿では、放射能特徴とデータ駆動型視覚埋め込みをViTバックボーン内に組み込んだRE-ViT(Radiomics-Embedded Vision Transformer)を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 06:55:58 GMT)
Proofs of Useful Work from Arbitrary Matrix Multiplication [10.6] 我々は,実世界の計算課題に基づいて,中本のPoWコンセンサスを実装するという,長年にわたるオープンな問題を再考する。
所定の硬度と無視可能な計算オーバーヘッドを有するPoW証明書を生成する。
我々のプロトコルは、悪意のある証明者が正直な証明者に対して大きな優位性を得ることができないという意味で、最適なセキュリティを持っていると推測する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:46:12 GMT)
LVLM_CSP: Accelerating Large Vision Language Models via Clustering, Scattering, and Pruning for Reasoning Segmentation [10.6] 大規模視覚言語モデル(LVLM)は、推論セグメンテーションタスクの実行において視覚基盤モデルを導くために広く採用されている。
本研究では,LVLMに基づく推論セグメンテーションタスクに特化して設計された,新しい学習自由な視覚トークンプルーニング手法であるLVLM_CSPを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:27:15 GMT)
A Quantum Advantage in Localizing Transmission Loss Change in Optical Networks [10.6] 本稿では,突然の透過性低下に遭ったリンクを迅速に検出する手法を提案する。
量子プローブはチャネルの損失の増加に伴い感度が低下するため、まずプローブ構築アルゴリズムを提案する。
これにより、CUSUMアルゴリズムを実行し、損失のあるリンクを素早くローカライズすることができる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:24:51 GMT)
Can LLMs Leverage Observational Data? Towards Data-Driven Causal Discovery with LLMs [10.6] 因果発見は伝統的に観測データに適用された統計手法に依存している。
大規模言語モデル(LLM)の最近の進歩は、因果発見の新しい可能性をもたらした。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:32:35 GMT)
Protecting Copyright of Medical Pre-trained Language Models: Training-Free Backdoor Model Watermarking [10.5] 医療用事前学習言語モデル(Med-PLMs)のためのトレーニングフリーバックドアモデル透かしを提案する。
提案手法は低周波単語をトリガーとして使用し,モデルの単語埋め込み層への埋め込みを特定の医療用語に置き換えることで透かしを埋め込む。
医用下流業務における透かし手法の優れた効果を示す実験を行った。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:07:58 GMT)
Buyer-Initiated Auction Mechanism for Data Redemption in Machine Unlearning [10.4] 人工知能(AI)の急速な成長はプライバシーの懸念を引き起こしている。
カリフォルニア州消費者プライバシ法(CCPA)のような主要な規制
データ償還のための買い手主導型オークション機構を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:43:59 GMT)
Enhancing Privacy in the Early Detection of Sexual Predators Through Federated Learning and Differential Privacy [10.4] 新型コロナウイルス(COVID-19)のパンデミックにより、オンライングルーミングのケースが大幅に急増した。
産業とアカデミアにおけるグルーミングの検出には、私的会話へのアクセスと監視が関係している。
性的捕食者の早期発見のためのプライバシ保護パイプラインを実装した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 21:43:35 GMT)
Easy3D: A Simple Yet Effective Method for 3D Interactive Segmentation [10.2] 本稿では,ドメイン内およびドメイン外両方のデータセットにおいて,従来の最先端技術を上回る3次元インタラクティブセグメンテーション手法を提案する。
我々の単純なアプローチは、Voxelベースのスパースエンコーダと、暗黙のクリック融合を実装した軽量なトランスフォーマーベースのデコーダを統合する。
提案手法は,ScanNet,ScanNet++,S3DIS,KITTI-360など,ベンチマークデータセットの大幅な改善を示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:49:51 GMT)
SC-NeRF: NeRF-based Point Cloud Reconstruction using a Stationary Camera for Agricultural Applications [10.2] 本稿では,ポイントクラウド(PCD)再構築のためのNeRFベースのフレームワークを提案する。
物体が台座上で回転するときに、静止カメラで画像をキャプチャするNeRFベースのPCD再構成法を開発した。
以上の結果から,静止カメラを用いて高品質なNeRFベースの3D再構成が可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:57:59 GMT)
Explicit and Implicit Representations in AI-based 3D Reconstruction for Radiology: A systematic literature review [10.1] 本稿では,最新のAIに基づく放射線画像の3D再構成アルゴリズムについて検討する。
明示的手法は、点ベース、体積ベース、ガウス表現を含み、暗黙的手法は暗黙的な事前埋め込みやニューラルラディアンス場を包含する。
この発展途上の分野における開発の現状と課題,今後の研究方向性について論じる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:21:47 GMT)
Collaborative Perception for Connected and Autonomous Driving: Challenges, Possible Solutions and Opportunities [10.0] コネクテッド・自動運転車(CAV)との協調的な認識は、これらの制限を克服するための有望な解決策である。
本稿では、まず、データ共有の非同期性、データボリューム、エラーの対応など、協調的な知覚の課題を識別する。
本稿では,チャネル認識型協調認識フレームワークである通信効率と遅延問題に対処する手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:19:48 GMT)
Visual Theory of Mind Enables the Invention of Proto-Writing [10.0] エビデンスによれば、一部の書記システムの初期の形態は、元々は象徴的なピクトグラフで構成されていた。
私たちのモデルは、原著の出現の背景にある認知的・文化的プロセスに光を当てています。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 20:46:47 GMT)
Automatic Item Generation for Personality Situational Judgment Tests with Large Language Models [10.0] 本研究は,人格状況判断テスト(PSJT)を中国語で自動生成する GPT-4 の可能性を探るものである。
従来のSJT開発は労働集約的でバイアスが多いが、GPT-4はスケーラブルで効率的な代替手段を提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:42:40 GMT)
Towards Spatially-Aware and Optimally Faithful Concept-Based Explanations [9.3] ポストホックで教師なしの概念に基づく説明法(U-CBEM)は、ディープニューラルネットワークにおける意思決定プロセスの意味論的説明を生成するための有望なツールである。
正確な評価を阻害する先行忠実度指標のいくつかの制限を同定する。
本研究では、空間的に認識された代理と2つの新しい忠実度指標を導入する評価手法であるSurrogate Faithfulness (SF)を用いて、これらの制限に対処する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:24:13 GMT)
DMAGaze: Gaze Estimation Based on Feature Disentanglement and Multi-Scale Attention [9.1] DMAGazeは、視線関連グローバル特徴、局所的な視線特徴、頭部ポーズ推定特徴の3つの側面で、顔画像からの情報を活用する新しい視線推定フレームワークである。
我々の提案したDMAGazeは、2つの主要な公開データセットで広く検証され、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:08:43 GMT)
F$^3$Set: Towards Analyzing Fast, Frequent, and Fine-grained Events from Videos [9.1] F$3$Setは、正確なF$3$イベント検出のためのビデオデータセットで構成されるベンチマークである。
我々は、F$3$Setで一般的な時間的行動理解手法を評価し、既存の手法の課題を明らかにした。
本稿では,F$3$イベント検出のための新しい手法F$3$EDを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:08:41 GMT)
Meta-learning For Few-Shot Time Series Crop Type Classification: A Benchmark On The EuroCropsML Dataset [9.1] 本研究では,(第1次)モデル非依存メタラーニング((FO)-MAML),ニアノ・インナーループ(ANIL),タスクインフォームドメタラーニング(TIML)など,トランスファーラーニングとメタラーニングアルゴリズムのベンチマークを行う。
エストニアやポルトガルのような地理的に異なる地域間の知識の移動は、すべての調査されたアルゴリズムに重大な課題をもたらすことが判明した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:47:57 GMT)
Tabular foundation model to detect empathy from visual cues [8.8] ビデオデータセットは、プライバシーや倫理上の懸念から、生の映像ではなく抽出された機能としてリリースされることが多い。
近年のテキスト基礎モデルの成功に触発され,共感検出における表層基盤モデルの利用について検討した。
人-ロボット相互作用ベンチマーク実験では, 物体間共感検出精度が大幅に向上した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:06:05 GMT)
CMAT: A Multi-Agent Collaboration Tuning Framework for Enhancing Small Language Models [8.8] 厳密にキュレートされた高品質データセットに基づいてトレーニングされたTinyAgentモデルを紹介する。
また,言語エージェントの能力向上を目的とした革新的システムであるCMAT(Collaborative Multi-Agent Tuning)フレームワークを提案する。
本研究では,マルチエージェントシステムと環境フィードバック機構を統合した新しいコミュニケーションエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:28:28 GMT)
FLSSM: A Federated Learning Storage Security Model with Homomorphic Encryption [8.8] 本稿では,フェデレート学習モデルのプライバシを保護するために,同型暗号化(FLSSM)を用いたフェデレーション学習ストレージセキュリティモデルを提案する。
複数の実世界のデータセットの実験により、我々のモデルは、効率とセキュリティの指標の両方でベースラインモデルよりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:33:14 GMT)
Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning [8.7] マルチモーダル大言語モデル(MLLM)のためのルールベース強化学習微調整(RFT)における思考過程について検討する。
まず,MLLM の思考を促進するために,検証可能な報酬を用いて分類のための CLS-RL を提案する。
実験の結果、CLS-RLはSFTを著しく上回り、"フリーランチ"の一般化効果が得られる(あるデータセットでトレーニングした後、目に見えないデータセットのパフォーマンスを改善する)。
この明示的思考がRFTにとって常に必要であるかどうかを問う。明示的思考はRFTにとって不可欠である、という規則に従えば、単純な等式精度の報酬による思考の最小化を図りながら、No-Thinking-RLを導入する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:31:31 GMT)
Bias Beyond English: Evaluating Social Bias and Debiasing Methods in a Low-Resource Setting [8.5] 言語モデルにおける社会的偏見は、社会的不平等を悪化させる可能性がある。
本研究では,ハイリソース言語コーパスを利用してバイアス評価を行い,低リソース言語におけるデバイアス手法の実験を行う。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:40:22 GMT)
Leveraging multimodal explanatory annotations for video interpretation with Modality Specific Dataset [8.4] 概念モダリティ特定データセット(CMSD)を紹介する。
CMSDは注釈付き概念のモダリティによって分類されたデータサブセットから構成される。
CMSDでトレーニングされたモデルは、アーリー・フュージョンとレイト・フュージョンの両方で伝統的なレガシ・トレーニングを使用したモデルよりも優れています。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:33:25 GMT)
ProtFlow: Fast Protein Sequence Design via Flow Matching on Compressed Protein Language Model Embeddings [8.1] ProtFlowは高速なフローマッチングベースのタンパク質配列設計フレームワークである。
潜在空間の圧縮と平滑化により、ProtFlowは限られた計算リソースをトレーニングしながらパフォーマンスを向上させる。
一般ペプチドや長鎖タンパク質,抗菌ペプチド,抗体など,多種多様なタンパク質設計タスクにおけるProtFlowの評価を行った。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:46:53 GMT)
Deep Learning-Based Longitudinal Prediction of Childhood Myopia Progression Using Fundus Image Sequences and Baseline Refraction Data [7.5] 小児の近視・近視リスクを定量的に予測する新しい高精度手法を提案する。
深層学習をベースとして, AUCスコアは0.944, 0.995で, 平均誤差は0.311D, 平均誤差は0.944, 平均誤差は0.995であった。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:41:09 GMT)
Using Cooperative Co-evolutionary Search to Generate Metamorphic Test Cases for Autonomous Driving Systems [7.5] 本稿では,自律運転システム(ADS)のシステムレベルの安全性評価を進めることを目的とした,新しい自動テストフレームワークCoCoMEGAを紹介する。
CoCoMEGAは、望ましくないシステム動作を示すテストシナリオの識別を強調し、最終的には、メタモルフィックリレーショナル(MR)によって取得される安全違反につながる可能性がある。
将来の研究の方向性には、さらなるシミュレーションプラットフォームへのアプローチの拡張、他の複雑なシステムに適用すること、サロゲートモデリングのようなテスト効率をさらに改善するための方法を模索することが含まれる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:12:31 GMT)
LangGas: Introducing Language in Selective Zero-Shot Background Subtraction for Semi-Transparent Gas Leak Detection with a New Dataset [7.5] ガス漏れは予防を必要とする重大な危険をもたらす。
近年の研究では、この問題に機械学習技術を適用しているが、高品質でパブリックなデータセットが不足している。
本稿では,背景の多様さ,前景オブジェクトの干渉,漏洩箇所の多様さ,正確なセグメンテーションの真理を特徴とする合成データセットSimGasを紹介する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 01:35:57 GMT)
Propaganda via AI? A Study on Semantic Backdoors in Large Language Models [7.3] セマンティックバックドアは少量の毒コーパスで埋め込むことができる。
本稿では,意味論的エントロピーとモデル間の整合性解析を組み合わせたブラックボックス検出フレームワークであるRAVENを紹介する。
未検出セマンティックバックドアの実証評価
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:43:15 GMT)
MROSS: Multi-Round Region-based Optimization for Scene Sketching [7.3] シーンのスケッチには、シーンのセマンティックな理解と、シーン内の異なる領域の考慮が必要である。
我々はスケッチをブエジエ曲線のいくつかの集合として定義する。
新たなCLIPベースのセマンティックロスとVGGベースの特徴損失を利用して,多ラウンド最適化を導出する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:44:00 GMT)
Exploring the Role of KG-Based RAG in Japanese Medical Question Answering with Small-Scale LLMs [7.2] 大規模言語モデル(LLM)は,医学的QAにおいて良好に機能するが,プライバシの制約により,日本語の文脈における有効性は制限される。
近年の取り組みは, オープンソース LLM に重点を置いているが, 検索強化世代 (RAG) と組み合わせる可能性はまだ未定である。
我々は,日本の医療用QA小規模オープンソースLLMのための知識グラフベースRAGフレームワークを初めて検討した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:46:39 GMT)
ClinicalGPT-R1: Pushing reasoning capability of generalist disease diagnosis with large language model [7.1] 臨床GPT-R1は疾患診断のための汎用的な大規模言語モデルである。
クリニカルGPT-R1は、2万件の実際の臨床記録に基づいてトレーニングされ、様々なトレーニング戦略を活用して診断の推論を強化する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:52:40 GMT)
Probe of Generic Quantum Contextuality and Nonlocality for qubits [7.0] エントロピック不確実性関係(EUR)は、本質的に一般的な量子的文脈性と非局所的絡み合いを接続可能であることを示す。
非局所的な視点から、一党の文脈性と二党の絡み合いは、EURと量子記憶との関連性を示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:40:28 GMT)
How to Enhance Downstream Adversarial Robustness (almost) without Touching the Pre-Trained Foundation Model? [6.9] 本稿では,基礎モデルにデータを送る前に,データ前処理方式として頑健な自動エンコーダを提案する。
提案手法は,ロバストなオートエンコーダのトレーニングにおいて,基礎モデルへのアクセスをゼロにする。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:17:37 GMT)
NormalCrafter: Learning Temporally Consistent Normals from Video Diffusion Priors [6.7] ビデオ拡散モデルの本質的な時間的先行性を活用するために,NormalCrafterを提案する。
シーケンス間の高忠実度正規推定を実現するために,セマンティック特徴正規化を提案する。
また,長時間の時間的文脈を維持しながら空間的精度を維持するための2段階トレーニングプロトコルも導入した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:39:07 GMT)
Weakly Supervised Lymph Nodes Segmentation Based on Partial Instance Annotations with Pre-trained Dual-branch Network and Pseudo Label Learning [6.7] そこで本研究では, 動的混合擬似ラベル(DBDMP)を用いたプレトレーニングDual-Branchネットワークを提案し, リンパ節セグメンテーションのための部分的インスタンスアノテーションから学習する。
本手法は,Dice similarity Coefficient (DSC) を11.04%から54.10%に改善し,平均対称表面距離 (ASSD) を20.83 $mm$から8.72 $mm$に低減する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:26:51 GMT)
Understanding the theoretical properties of projected Bellman equation, linear Q-learning, and approximate value iteration [6.7] 我々は、この方程式を解くために、射影ベルマン方程式(PBE)と2つのアルゴリズムの理論的性質について研究する。
PBEの解が存在するための2つの十分な条件を考える。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:56:33 GMT)
Finite-Time Analysis of Temporal Difference Learning with Experience Replay [6.7] 時間差学習(TD)は、強化学習(RL)において最も一般的なアルゴリズムの1つである。
本稿では,マルコフ雑音項の簡易分解を行い,経験的再生を伴うTD学習における有限時間誤差境界を提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:59:42 GMT)
Hashigo: A Next Generation Sketch Interactive System for Japanese Kanji [6.5] 橋郷(はしご)は、人間のインストラクターレベルの批判と視覚構造と筆記技術の両方に対するフィードバックを実現するスケッチ対話システムである。
この種の自動的批判とフィードバックにより、学生はスケッチの特定の欠陥を標的にし、修正することができる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:37:28 GMT)
MediSee: Reasoning-based Pixel-level Perception in Medical Images [6.4] MedSD(Medical Reasoning and Detection)を導入した新しい医療ビジョンタスクについて紹介する。
MedSDの目的は、医療画像に関する暗黙のクエリを理解し、対応するセグメンテーションマスクとターゲットオブジェクトのバウンディングボックスを生成することである。
医学的推論のセグメンテーションと検出のために設計された効果的なベースラインモデルであるメディセーを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:28:53 GMT)
Prototype-Guided Diffusion for Digital Pathology: Achieving Foundation Model Performance with Minimal Clinical Data [6.3] 本研究では,高忠実度合成病理データを大規模に生成するプロトタイプ誘導拡散モデルを提案する。
我々のアプローチは、生成したデータの生物学的、診断学的に有意義な変動を保証します。
我々は、大規模な実世界のデータセットでトレーニングされたモデルよりも60倍-760倍少ないデータを使用しても、我々の合成データセットでトレーニングされた自己教師機能によって競争性能が向上することを示した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 21:17:39 GMT)
Analyzing 16,193 LLM Papers for Fun and Profits [6.3] LLM(Large Language Models)は、コンピュータサイエンス研究のランドスケープを再構築している。
本研究は,過去6年間の77の上位コンピュータサイエンス会議におけるLSM関連論文の出版動向を包括的に分析した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:06:21 GMT)
MARTSIA: A Tool for Confidential Data Exchange via Public Blockchain [6.3] 相互運用アプリケーション(MARTSIA)のためのトランザクションシステムに対するマルチオーソリティアプローチ
MARTSIAは、ユーザ定義ポリシーと認証宣言属性を組み合わせることで、メッセージ部分レベルでの詳細な読み取りアクセス制御を提供する。
このアーキテクチャは、パブリックブロックチェーン固有の透明性と、機密性の高いアプリケーションに必要なプライバシとを効果的にバランスさせる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:36:24 GMT)
Mamba-Based Ensemble learning for White Blood Cell Classification [6.1] 白血球分類(WBC)は、免疫の健全性を評価し、様々な疾患を診断するのに役立つ。
近年のディープラーニングの進歩は、従来の手法よりも有望であることを示している。
本稿では,マンバモデルとアンサンブル学習を統合し,WBC分類を改善する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:53:18 GMT)
Enhancing Features in Long-tailed Data Using Large Vision Mode [5.9] 我々は,LVM(Large Vision Model)やVFM(Victorial foundation Model)を用いて,言語情報のない長期データ機能の拡張を検討する。
具体的には、LVMから特徴を抽出し、ベースラインネットワークのマップと潜在空間の機能を融合する。
我々は、拡張機能の可能性をさらに活用するために、潜伏空間におけるプロトタイプベースの損失を設計する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:21:50 GMT)
Inferring Outcome Means of Exponential Family Distributions Estimated by Deep Neural Networks [5.9] 分類的または指数関数的な家族結果に対するディープニューラルネットワーク(DNN)の推論は、まだ過小評価されていない。
一般化された非パラメトリック回帰モデル(GNRM)に基づくDNN推定器を提案し、厳密な推論フレームワークを開発する。
さらに、この手法を電子集中治療ユニット(eICU)データセットに適用し、ICUのリスクを予測し、臨床意思決定に患者中心の洞察を与える。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:55:26 GMT)
Embodied World Models Emerge from Navigational Task in Open-Ended Environments [5.8] 本研究では、ニューラルネットワークが相互作用によって空間概念を自律的に内部化できるかどうかを検討する。
エージェントは,方向,距離,障害物回避などの空間特性を符号化することができることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:35:13 GMT)
Change State Space Models for Remote Sensing Change Detection [5.8] 変化状態空間モデルは、バイテンポラル画像間の関連する変化に着目して、変化検出のために特別に設計されている。
提案したモデルは3つのベンチマークデータセットを通じて評価され、計算複雑性のごく一部で、ConvNets、ViTs、Mambaベースのモデルを上回った。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:25:10 GMT)
TD-Suite: All Batteries Included Framework for Technical Debt Classification [5.7] TD-Suiteはシームレスなエンドツーエンドパイプラインを提供し、初期データ取り込みからモデルトレーニングに至るまで、あらゆるものを管理する。
生成されたモデルが堅牢であることを保証するため、TD-Suiteは重要なトレーニング方法論を取り入れている。
このフレームワークは、計算集約的なモデルトレーニングプロセスに関連する二酸化炭素排出量の追跡と報告を統合する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:31:17 GMT)
Evaluation Report on MCP Servers [5.5] 我々は,MPPサーバの有効性と効率を評価するため,MPPBenchと呼ばれる評価フレームワークを提案する。
実験の結果,最も有効なMPPであるBing Web Searchの精度は64%であった。
この研究は、最適化されたMPPの実装に関するさらなる調査の道を開くもので、最終的にはAI駆動のアプリケーションとデータ検索ソリューションの改善につながります。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:40:12 GMT)
Measuring training variability from stochastic optimization using robust nonparametric testing [5.5] 本稿では,モデル類似度を測定するために,ロバストな仮説テストフレームワークと,新たな要約統計量である$alpha$-trimmingレベルを提案する。
仮説を$alpha$-trimmingレベルで直接適用することは、null仮説の下で分布を正確に記述できないため、難しい。
モデル変数の測定に$alpha$-trimmingレベルを使用する方法を示し、パフォーマンス指標よりも表現力が高いことを実験的に実証する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:34:06 GMT)
A Metropolis-Adjusted Langevin Algorithm for Sampling Jeffreys Prior [5.5] 推測と推定は統計学、システム同定、機械学習の基本的な側面である。
Jeffreys氏は2つの重要な利点があるので、前もって魅力ある非形式的だ。
本稿では,メトロポリス調整ランゲヴィンアルゴリズムを用いた一般的なサンプリング手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:25:02 GMT)
Frequency-Aware Attention-LSTM for PM$_{2.5}$ Time Series Forecasting [5.5] FALNetは周波数対応LSTMネットワークであり、周波数領域の分解、時間的モデリング、注意に基づく改善を統合している。
実世界の都市大気質データセットで実施された実験は、FALNetが従来のモデルより一貫して優れていることを示した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:16:00 GMT)
SDFs from Unoriented Point Clouds using Neural Variational Heat Distances [5.4] 本研究では,無向点雲からニューラルサイン付き距離場を計算するための新しい変分法を提案する。
一般的に用いられるアイコナー方程式を熱法に置き換え、ニューラルドメインに伝達する。
提案手法は,現状の表面再構成と一貫したSDF勾配を提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:13:54 GMT)
Iterative Linear Quadratic Regulator for Quantum Optimal Control [5.3] 量子システムのゲート最適化に適応させることにより、反復線形二次制御器と量子最適制御との接続を確立する。
我々は,2レベルと3レベルを模擬した1ビットおよび2ビットの固定周波数トランスモン上で,Xおよびクロス共振ゲートの高忠実度シミュレーション結果を得た。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:36:32 GMT)
Multi-output Classification Framework and Frequency Layer Normalization for Compound Fault Diagnosis in Motor [5.2] 本研究は,故障診断における領域適応のための多出力分類(MOC)フレームワークを提案する。
従来のマルチクラス分類 (MCC) 法とは異なり, 提案手法は個別に各断層の重大度を推定する。
PLデータを用いた6つの領域適応事例を対象とした評価の結果,MOCはマクロF1スコアにおいてベースラインモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:40:16 GMT)
From Misleading Queries to Accurate Answers: A Three-Stage Fine-Tuning Method for LLMs [5.2] 大規模言語モデル(LLM)は自然言語処理(NLP)において優れた性能を示す
既存の方法は出力の修正に重点を置いているが、LLMが入力自体の誤解を招くコンテンツを検出し修正する能力を改善する可能性を見落としていることが多い。
入力中のミスリード情報を検出・修正するLLMの能力を向上する新しい3段階微調整法を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:16:45 GMT)
SAR-to-RGB Translation with Latent Diffusion for Earth Observation [5.2] 本稿では,SAR入力から合成光学画像を生成するための拡散モデル(DM)に基づくSAR-to-RGB変換手法を提案する。
本研究は,陸地被覆分類や雲の除去を含む下流作業において生成した画像を評価する。
本研究は,RGB画像が欠落しているRSアプリケーションにおいて,SAR-to-RGB翻訳のためのDMの可能性を明らかにするものである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:58:30 GMT)
Never Start from Scratch: Expediting On-Device LLM Personalization via Explainable Model Selection [5.2] 大規模言語モデル(LLM)のパーソナライズは,異なるモバイルユーザのニーズを満たすために,実践的なアプリケーションにおいて重要である。
提案するXPerTは,このようなパーソナライズされたLLMの適切な選択を,どのように微調整されているかの説明可能性に基づいて保証する手法である。
実験の結果,XPerTはデバイス上でのLCMパーソナライズコストを83%削減し,データ効率を51%向上した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:38:06 GMT)
"A Good Bot Always Knows Its Limitations": Assessing Autonomous System Decision-making Competencies through Factorized Machine Self-confidence [5.2] 本稿では,アルゴリズムによる意思決定における能力向上に寄与するいくつかの要因について,一意に考察したFactized Machine Self-confidence(FaMSeC)フレームワークを提案する。
FaMSeCでは、自己自信指標はマルコフ決定過程の解法に埋め込まれた「確率問題解決統計」によって導出される。
マルコフ決定プロセスエージェントの詳細な説明と例を含み、さまざまなタスクのコンテキストにおいて、結果評価と問題解決の質要因がどのように見つかるかを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:11:56 GMT)
Co-STAR: Collaborative Curriculum Self-Training with Adaptive Regularization for Source-Free Video Domain Adaptation [5.1] Co-STARはカリキュラム学習と、ソース学習された教師と対照的な視覚言語モデル(CLIP)の協調的自己学習を統合している
カリキュラム学習アプローチでは,教師とCLIPの双方向予測アライメントを測定し,信頼性と不確実性の予測のバランスをとる信頼性に基づく重み関数を用いる。
さらに適応性を向上させるために,適応型カリキュラム正規化を提案し,その信頼性スコアと予測安定性に基づいて,確率的,適応的な方法でサンプルの学習優先度を変更する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 23:47:35 GMT)
Making Acoustic Side-Channel Attacks on Noisy Keyboards Viable with LLM-Assisted Spectrograms' "Typo" Correction [5.1] マイクロホンのデバイスへの大規模な統合はアコースティックサイドチャネルアタック(ASCA)の機会を増大させる
ASCAの現在の状態-Of-The-Art(SOTA)モデルは、現実的な雑音条件下では限られた堅牢性を示す。
本稿では,視覚変換器(VTs)と大言語モデル(LLMs)をASCAに組み込む一貫したアプローチを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 21:23:25 GMT)
Benchmarking Next-Generation Reasoning-Focused Large Language Models in Ophthalmology: A Head-to-Head Evaluation on 5,888 Items [5.1] 本研究は, 新たに開発した4つのLLMの精度と推論能力を総合的に評価し, 比較した。
O1 と DeepSeek-R1 は最高精度を達成し、O1 は Macro-F1 (0.900) もリードした。
o3-mini in ROUGE-L (0.151), o1 in METEOR (0.232), DeepSeek-R1 and o3-mini connected for BERTScore (0.673), DeepSeek-R1 (-4.105), Gemini 2.0 Flash-Thinking (-4.127) performed in BART
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:42:34 GMT)
Scalability and Maintainability Challenges and Solutions in Machine Learning: Systematic Literature Review [5.0] 本稿では,機械学習(ML)システムにおけるスケーラビリティと保守性に関する重要な課題と解決策について考察する。
MLアプリケーションがますます複雑になり、業界全体に広まっていくにつれ、システムのスケーラビリティと長期的な保守性とのバランスの必要性が大きな懸念事項となっている。
我々は124の論文を分析し、41の保守性課題と13のスケーラビリティ課題とそれに対応するソリューションを特定し、分類した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:24:43 GMT)
Morphing-based Compression for Data-centric ML Pipelines [5.0] データ中心の機械学習パイプラインは、データクリーニング、拡張、機能エンジニアリングのための外部ループによって、従来の機械学習(ML)パイプラインを拡張する。
特徴変換とエンジニアリングを通じて圧縮を推し進め、構造変換に関する情報を活用するBWAREを紹介する。
BWAREは、エンドツーエンドのランタイムを大幅に改善し、データ中心のMLパイプラインを数日から数時間でトレーニングするための実行時間を短縮する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:02:34 GMT)
SafeChat: A Framework for Building Trustworthy Collaborative Assistants and a Case Study of its Usefulness [4.9] SafeChatは、安全で信頼性の高いチャットボットを構築するための一般的なアーキテクチャです。
SafeChatの主な特徴は、 (a) 応答が承認されたソース(保証)に対して基礎付けられてトレース可能なドメインに依存しない設計による安全性、 (b) ユーザビリティ、長いレスポンスの自動抽出によるソースへのトレーサビリティ、 (c) CSV駆動ワークフロー、自動テスト、各種デバイスとの統合を含む、高速でスケーラブルな開発である。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:41:45 GMT)
Emergence of Goal-Directed Behaviors via Active Inference with Self-Prior [4.9] 幼児は、外部報酬基準が提供されていない場合でも、感覚刺激に手を伸ばすなど、目標指向の行動を示すことが多い。
我々は「自己優先」と呼ばれるエージェント自身のマルチモーダル感覚経験のための新しい密度モデルを提案する。
本研究は、エージェント自身の感覚経験によって形成される本態的に動機づけられた行動を実装し、初期発達における意図的行動の自然発生を実証する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:16:27 GMT)
E2E Parking Dataset: An Open Benchmark for End-to-End Autonomous Parking [4.9] エンドツーエンドの自律駐車のための高品質なデータセットを作成し、オープンソース化します。
元のモデルを用いて、平均位置と向きの誤差が低い85.16%の総合的な成功率を達成する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:21:09 GMT)
Multi-scale DeepOnet (Mscale-DeepOnet) for Mitigating Spectral Bias in Learning High Frequency Operators of Oscillatory Functions [4.7] Mscale-DeepOnetはDeepOnetのスペクトルバイアスを低減するために提案されている。
マッピング自体とそのイメージの様々な高周波成分をキャプチャできることが示されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:19:54 GMT)
OpenTuringBench: An Open-Model-based Benchmark and Framework for Machine-Generated Text Detection and Attribution [4.7] Open Large Language Models (OLLM) は、生成AIアプリケーションにますます活用されている。
OLLMをベースとした新しいベンチマークであるOpenTuringBenchを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:36:14 GMT)
Unveiling the Threat of Fraud Gangs to Graph Neural Networks: Multi-Target Graph Injection Attacks Against GNN-Based Fraud Detectors [4.7] 最近の発見は、詐欺がギャングや集団としてますます組織化されていることを示唆している。
本研究では,詐欺集団が不正行為を虚偽化して不正なノードを良心と誤分類することを目的とした攻撃シナリオを設計する。
これらのシナリオに基づいて,実世界の3件の詐欺事件における詐欺集団の攻撃をシミュレートすることにより,GNNベースの詐欺検知器に対する敵攻撃について検討した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:43:49 GMT)
Hessian stability and convergence rates for entropic and Sinkhorn potentials via semiconcavity [4.6] これは、一般の非有界な環境でのこの2階の定量的安定性推定に対処する最初の研究である。
我々はシンクホーンのアルゴリズムに沿ってシンクホーンの勾配とヘッセンの指数収束率を導出する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:34:09 GMT)
Uncertainty Estimation for Trust Attribution to Speed-of-Sound Reconstruction with Variational Networks [4.5] 音速(SoS)は組織の生体力学的特性であり、そのイメージングは診断に有望なバイオマーカーを提供することができる。
本稿では,SoS再建における不確実性を利用して,各獲得フレームの属性を信頼することを提案する。
良性線維腺腫と悪性癌とを鑑別し,乳腺癌鑑別のための自動フレーム選択法について検討した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:48:51 GMT)
Fine-Tuning Large Language Models on Quantum Optimization Problems for Circuit Generation [4.4] 大規模言語モデル(LLM)は複雑な問題に対処する上で大きな成果を上げている。
本稿では,LLMを利用して量子回路を大規模に自動生成する方法を示す。
我々は、量子最適化のランドスケープの大部分をカバーする14,000個の量子回路を準備した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:56:54 GMT)
Rainy: Unlocking Satellite Calibration for Deep Learning in Precipitation [4.4] 降水は地球の水循環において重要な役割を担い、生態系、農業、水資源管理に直接影響を与えている。
近年、定量的リモートセンシング(QRS)において人工知能(AI)が注目を集めている。
レーニーデータセットは,(1)衛星キャリブレーション,(2)降水イベント予測,(3)降水レベル予測,(4)時間予測,(5)降水ダウンスケーリングの5つの主要なタスクをサポートする。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 00:30:46 GMT)
A quantum algorithm for estimating the determinant [4.4] このアルゴリズムは、$n×n$正のスパース行列の行列式を精度$epsilon$ in time $cal O(log n/epsilon3)$と推定する。
量子スペクトルサンプリングアルゴリズムは、$sum_j f(lambda_j)$とすると、$lambda_j$は行列固有値である。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 10:32:36 GMT)
Recommending Clinical Trials for Online Patient Cases using Artificial Intelligence [4.3] われわれはTrialGPTを用いて,50例のオンライン患者を臨床試験に適合させ,従来のキーワード検索と比較して評価した。
以上の結果から,TrialGPTは従来の方法よりも46%優れており,各患者は平均で約7回の治験が可能であった。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 21:56:36 GMT)
Fast-Powerformer: A Memory-Efficient Transformer for Accurate Mid-Term Wind Power Forecasting [4.3] 風力発電予測は、電力グリッドのセキュリティ、安定性、経済活動を強化する上で重要な役割を担っている。
気象要因(風速など)の高度化と風力出力の大幅な変動により、中期風力予測は高い精度と計算効率を維持するという2つの課題に直面している。
本稿では,Fast-Powerformerと呼ばれる,効率的かつ軽量な風力予測モデルを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:09:54 GMT)
IAA: Inner-Adaptor Architecture Empowers Frozen Large Language Model with Multimodal Capabilities [4.3] マルチモーダル大言語モデル(MLLM)のための内適応アーキテクチャを導入する。
このアーキテクチャは、大きな言語モデル内の様々な深さで複数のマルチモーダルアダプタを組み込んで、テキスト指向のトランスフォーマー層との直接の相互作用を容易にする。
大規模な整列データを必要とする従来のフリーズ言語モデルとは異なり、提案アーキテクチャは小規模データセットにおいて優れた性能を実現することができる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:28:22 GMT)
MLPs and KANs for data-driven learning in physical problems: A performance comparison [4.3] Kolmogorov-Layer Networks(KAN)は、MLP(Multi-Arnold Perceptrons)に代表される従来のニューラルネットワークの代替品である。
将来を示す一方で、物理学に基づく問題における性能上の優位性はほとんど未解明のままである。
これはkansが有望な選択であり、物理システムを含むアプリケーションにおける効率性と精度のバランスを提供することを示唆している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:13:42 GMT)
Why am I seeing this? Towards recognizing social media recommender systems with missing recommendations [4.2] グラフニューラルネットワーク(GNN)を用いた自動レコメンダ認識手法を提案する。
提案手法は,隠されたレコメンデータの正確な検出とユーザ行動への影響を可能にする。
この研究は、レコメンダが行動をどのように形成し、偏光と誤情報を減らすための努力を支援するかについての洞察を提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:16:17 GMT)
Recurrence method in Non-Hermitian Systems [3.9] 開境界条件下での非エルミート系のエネルギースペクトルの新規かつ体系的な再帰法を提案する。
我々の定式化は、数値対角化や非ブロックバンド理論よりも、マルチバンド非エルミート系の精度と性能を示す。
我々の反復法は、開境界条件下での非エルミート系の興味深い物理学に、新しく好意的な定式化を提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:00:15 GMT)
CLASH: Evaluating Language Models on Judging High-Stakes Dilemmas from Multiple Perspectives [3.8] CLASH (Character perspective-based LLM Assessments in situations with High-Stakes) は、345のハイインパクトジレンマと3,795の個人視点からなるデータセットである。
GPT-4oやClaude-Sonnetのような最強のモデルでさえ、決定が曖昧であるべき状況を特定する上で、50%未満の精度を達成する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:54:16 GMT)
TerraMesh: A Planetary Mosaic of Multimodal Earth Observation Data [3.7] TerraMeshは、光学、レーダー、標高、土地被覆のモダリティを単一のフォーマットで組み合わせた、グローバルに多様なマルチモーダルデータセットである。
本研究では,TerraMeshで事前学習した際のモデル性能の向上を示す詳細なデータ処理手順,包括的統計,実証的証拠を提供する。
データセットはパーミッシブライセンスで公開されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:20:35 GMT)
KubeFence: Security Hardening of the Kubernetes Attack Surface [3.7] K8sは、金融、ヘルスケア、政府などの分野における重要なサービスを含む、コンテナ化されたアプリケーションのオーケストレーションに広く使用されている。
広範かつ機能豊富なAPIインターフェースは、幅広い攻撃面を公開し、K8がソフトウェアの脆弱性や設定ミスの悪用に対して脆弱になる。
本稿では,特定のクライアントワークロードに適した細粒度APIフィルタリングを実装した新しいソリューションであるKubeFenceを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:15:34 GMT)
Improving fingerprint presentation attack detection by an approach integrated into the personal verification stage [3.6] プレゼンテーション攻撃検出(PAD)システムは通常、指紋認証システムとは独立して設計される。
これは、PADがそのようなユーザのために特別に設計されるべきであるという意味ではない。
本稿では,基本PADにCloseness Binary Code (CC)モジュールと呼ばれる革新的なアドオンモジュールを装備することを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:01:06 GMT)
Lateral Phishing With Large Language Models: A Large Organization Comparative Study [3.6] 大規模言語モデル(LLM)の出現は、高度にターゲットを絞った、パーソナライズされ、自動化された攻撃を発生させることで、フィッシングメールの脅威を増大させた。
LLMが生成する横型フィッシングメールの有効性を人間によるものであるものと比較する大規模な研究は乏しい。
本研究は,教育機関におけるサイバーセキュリティ脅威の理解に寄与する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:38:22 GMT)
Balancing Forecast Accuracy and Switching Costs in Online Optimization of Energy Management Systems [3.3] 本研究では,エネルギー管理システムにおける予測と最適化の統合について検討する。
我々は,予測精度と安定性がスイッチングコストとどのように相互作用するかを,理論的かつ実証的な枠組みで検証する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:12:35 GMT)
DeepWheel: Generating a 3D Synthetic Wheel Dataset for Design and Performance Evaluation [3.3] 本研究では,生成AIを用いた合成設計・性能データセット生成フレームワークを提案する。
このフレームワークは、まず安定拡散を用いて2次元描画画像を生成し、2.5次元深さ推定により3次元形状を再構成する。
最終データセットはDeepWheelと呼ばれ、6000以上の写真リアル画像と900以上の構造解析された3Dモデルで構成されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:20:00 GMT)
Robust Reinforcement Learning from Human Feedback for Large Language Models Fine-Tuning [3.3] 人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデルの出力と人間の嗜好を整合させる重要な手法として登場した。
既存のRLHFアルゴリズムの多くはBradley-Terryモデルを使用しており、これは人間の好みに関する仮定に依存しており、現実世界の判断の複雑さや変動性を反映していない。
そこで我々は,そのような報酬モデルの不特定条件下での既存手法の性能向上のための頑健なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:29:06 GMT)
InfoClus: Informative Clustering of High-dimensional Data Embeddings [3.2] 説明付きパーティショニングという新しい概念を導入する。
この考え方は、表示されたデータをグループに分割し、それぞれにまばらな説明を与えるというものである。
InfoClus は次元還元に基づく散乱プロットの解析において,優れた出発点を自動生成できることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:34:03 GMT)
Evaluating Trust in AI, Human, and Co-produced Feedback Among Undergraduate Students [2.9] 学生は一般的にAIを好んでおり、人間のフィードバックよりも有用性や客観性という観点でフィードバックを共同生成している。
男性学生は、すべてのフィードバックタイプが女性や非バイナリーのタイプよりも価値が低いと一貫して評価した。
これらの知見は、高等教育フィードバックシステムにAIを統合するためのエビデンスベースのガイドラインを示唆する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:06:36 GMT)
Limitations of Automatic Relevance Assessments with Large Language Models for Fair and Reliable Retrieval Evaluation [2.9] 大規模言語モデル(LLM)は,自動関連性評価ツールとして注目されている。
近年の研究では、LLMに基づく評価が、人為的判断と高いシステムランキングの相関をもたらすことが示されている。
我々は,LLMによる判断が,上位評価システム間の順位差をいかに保っているか,また,人間の判断として相互に重要な評価を保っているかを検討する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:11:18 GMT)
New Key Rate Bound for High-Dimensional BB84 with Multiple Basis Measurements [2.9] 我々は高次元BB84プロトコルの秘密鍵レートに新たなバウンダリを導出する。
一般的なチャネルにおいても、より楽観的なキーレートが低信号数で実現可能であることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:55:24 GMT)
Tripartite Haar random state has no bipartite entanglement [2.8] 本研究では,EPR様二部晶の絡み合いを三部晶のハールランダム状態から蒸留することは不可能であることを示す。
EPRに類似したエンタングルメントを持つ状態のサンプリングの確率を、所定のEPR忠実度トレランスで上界に導出する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:09:57 GMT)
DRIFT open dataset: A drone-derived intelligence for traffic analysis in urban environmen [2.8] DRone由来のインテリジェンス・フォー・トラヒック・アナリティクス(DRIFT)データセットは、高度約250mのドローンビデオから体系的に収集された大規模な都市交通データセットである。
DRIFTは、方向情報を含む高解像度の車両軌道を提供し、ビデオ同期とオルトマップアライメントによって処理される。
このデータセットは,交通流解析やシミュレーション研究などの学術研究や実用化に大きく貢献することが期待されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:43:13 GMT)
REAL: Benchmarking Autonomous Agents on Deterministic Simulations of Real Websites [2.7] 実世界のWebサイトの決定論的シミュレーションにおけるマルチターンエージェント評価のためのベンチマークおよびフレームワークであるREALを紹介する。
REALは、Eコマース、旅行、コミュニケーション、プロフェッショナルネットワーキングといったドメインで広く使われている11のウェブサイトの高忠実で決定論的レプリカで構成されている。
また、日々の複雑なユーザインタラクションを反映した112の実践的なタスクからなるベンチマークもリリースしています。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:22:55 GMT)
SS4Rec: Continuous-Time Sequential Recommendation with State Space Models [2.7] 本稿では,連続的なレコメンデーションのためにSS4Recと呼ばれるハイブリッドSSMモデルを提案する。
SS4Recは、不規則な時間間隔を扱うための時間認識SSMと、コンテキスト依存をモデル化するための関係認識SSMを統合している。
これにより、不規則な時間間隔から継続的依存関係をキャプチャし、時間固有のパーソナライズされたレコメンデーションを提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 01:35:23 GMT)
Optical and spin properties of nitrogen vacancy centers formed along the tracks of high energy heavy ions [2.7] 色中心を含む欠陥は、多くの材料で遅延損傷トラックに沿って再結合または形成することができる。
ダイヤモンド中の1GeV金およびウランイオンの遅延線に沿った色中心形成について報告する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 00:21:22 GMT)
Fully smooth one shot multipartite soft covering of quantum states without pairwise independence [2.7] 我々は,量子状態に対する一発多部被覆,いわゆる凸分割,型結果の完全なスムーズな証明を行う強力な機械を提供する。
古典的量子状態に対してスムーズな多重粒子凸が分裂する重要なケースでは、これらの状態の特定の辺縁がペア独立性を満たさない場合でも、我々の機械は機能する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 10:34:51 GMT)
Learning-Based User Association for MmWave Vehicular Networks With Kernelized Contextual Bandits [2.6] 高速なmmWaveチャネルを頻繁に見積もるのはコストがかかる。
提案した分散カーネル化アッパー信頼境界(DK-UCB)アルゴリズムは,現在の即時伝送速度を推定する。
我々は,mmWave信号の伝搬特性を組み込んだRKHSにおける新しいカーネル関数を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:05:27 GMT)
Efficient and Robust Remote Sensing Image Denoising Using Randomized Approximation of Geodesics' Gramian on the Manifold Underlying the Patch Space [2.6] トレーニングサンプルの追加を必要としない頑健なリモートセンシング画像復調手法を提案する。
この手法は、各色チャネルに独自の強調を課し、3つの分極チャネルをマージして最終画像を生成する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:46:05 GMT)
Time-adaptive Video Frame Interpolation based on Residual Diffusion [2.5] ビデオフレーム(VFI)の拡散に基づく新しい手法を提案する。
本研究では,ビデオフレーム(VFI)の拡散に基づく新しい手法を提案する。
我々は、最先端のモデルに対する広範な比較を行い、このモデルがアニメーションビデオでこれらのモデルより優れていることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:25:08 GMT)
Unlocking the Wisdom of Large Language Models: An Introduction to The Path to Artificial General Intelligence [2.5] マルチLLMコラボレーティブ・インテリジェンス(英語版)の知恵を解き放つことは、The Path to Artificial General Intelligence(英語版)の全巻の紹介となる。
14のアフォリスムを通じて、マルチLLMエージェントコラボレーションインテリジェンス(英語版)のコア原則を抽出する。
本書には、各章のタイトル、要約、紹介、および最初の2章の完全な内容が含まれている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:21:22 GMT)
SynLlama: Generating Synthesizable Molecules and Their Analogs with Large Language Models [2.5] 我々はSynLlamaを作成するために,MetaのLlama3 Large Language Modelsを微調整した新しいアプローチを提案する。
SynLlamaは、一般的にアクセス可能なビルディングブロックと堅牢な有機反応テンプレートからなる完全な合成経路を生成する。
外部のビルディングブロックをトレーニングしなくても、SynLlamaが効果的に一般化され、見つからず、購入可能なビルディングブロックとなることが分かりました。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 20:08:03 GMT)
Stable and High-Precision 3D Positioning via Tunable Composite-Dimensional Hong-Ou-Mandel Interference [2.4] 香港-奥羽-マンデル干渉に基づく安定かつ高精度な3次元量子位置決め方式を提案する。
本手法は,検出光子の数が限られている場合でも,高精度で信頼性の高い3次元位置決めを実現する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:01:22 GMT)
Text-Driven 3D Lidar Place Recognition for Autonomous Driving [2.3] Des4Posは、新しい2段階のテキスト駆動型リモートセンシングローカライゼーションフレームワークである。
トップ1の精度は40%、トップ10の精度は半径5mの閾値で77%に達する。
KITTI360Poseテストセットの実験では、テキスト・ツー・ポイント・クラウドの場所認識におけるDes4Posの最先端性能が実証された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:22:14 GMT)
Shifting Work Patterns with Generative AI [2.3] 本稿では,生産型AIが知識労働者の作業パターンをどのように変えるかを示す。
6000人の労働者の半数は、電子メール、文書作成、会議にすでに使用しているアプリケーションに統合された生成AIツールにアクセスした。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:52:00 GMT)
DeNOTS: Stable Deep Neural ODEs for Time Series [2.3] ニューラルODEは、複雑な時間スタンプデータの時間的進化を捉えるために設計されたメソッドの顕著な分岐である。
適応的な負のフィードバック機構を導入することで、これらのモデルを確実に安定化する。
3つのオープンデータセットに対して,提案手法は下流品質を最大20%改善する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:49:17 GMT)
A DeepONet for inverting the Neumann-to-Dirichlet Operator in Electrical Impedance Tomography: An approximation theoretic perspective and numerical results [2.2] 本研究では,電気インピーダンストモグラフィーの非侵襲的医療画像モダリティについて考察する。
問題は、電流-電圧マップから生じる一連のデータから媒体の伝導性を回復することである。
演算子対関数写像を暗黙的に定義した演算子対関数写像の学習を目標とする演算子学習問題として,この逆問題を定式化する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:32:00 GMT)
Probing Quantum Anomalous Hall States in Twisted Bilayer WSe2 via Attractive Polaron Spectroscopy [2.2] ツイストWSe2ホモバイ層(tWSe2)における量子異常ホール(QAH)状態の最初の光学的検出を報告した。
以上の結果から,tWSe2は2次元景観におけるトポロジ的秩序と強い相関関係を調査するための,高度に汎用的で安定かつ光学的に対応可能なプラットフォームとして位置づけられた。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:00:03 GMT)
Exploring Student Behaviors and Motivations using AI TAs with Optional Guardrails [2.1] ガードレール(Guardrails)は、直接的なソリューションではなく、足場によるサポートを提供する機能である。
See Solution"機能はガードレールを無効にし、基盤となるモデルから冗長な応答を生成します。
その結果、885人の学生の50%が少なくとも1つの問題に「See Solution」機能を使用し、14%が3つの問題に利用していることがわかった。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:48:22 GMT)
Neural Control Barrier Functions from Physics Informed Neural Networks [2.1] 本稿では,物理に着想を得たニューラルネットワークフレームワークを活用した新しいニューラルネットワークCBFについて紹介する。
CBFをゼロにする代わりに相互にCBFを利用することで、フレキシブルでユーザ定義の安全な領域を指定できる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 10:13:30 GMT)
Safe-Construct: Redefining Construction Safety Violation Recognition as 3D Multi-View Engagement Task [2.1] 違反認識を3次元多視点エンゲージメントタスクとして再構成するフレームワークであるSafe-Constructを紹介する。
Safe-Constructは、4つの違反タイプにわたる最先端メソッドよりも7.6%改善されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:21:09 GMT)
A Real-time Anomaly Detection Method for Robots based on a Flexible and Sparse Latent Space [2.0] ロボット工学におけるディープラーニングベースのモデルは、限られたトレーニングデータと非常にノイズの多い信号機能のために、課題に直面している。
本稿では,これらの問題に対処するために,スパースマスク型自己回帰型フローベース適応型オートエンコーダモデルを提案する。
我々のモデルは1ミリ秒以内の推論を行い、リアルタイムな異常検出を確実にする。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:17:14 GMT)
DamageCAT: A Deep Learning Transformer Framework for Typology-Based Post-Disaster Building Damage Categorization [2.0] 本稿では,分類的分類的損傷記述を提供する新しいフレームワークであるDanceCATを紹介する。
TypoSATデータセットには、ハリケーン・アイダの衛星画像三つ子(災害前、災害後、被害マスク)が含まれている。
階層的なU-Netベースのトランスフォーマーアーキテクチャは、災害前のイメージペアを効果的に処理し、建物の損傷を特定し分類する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 21:53:59 GMT)
Inferring Communities of Interest in Collaborative Learning-based Recommender Systems [1.9] 協調学習ベースのレコメンデーションシステムは、ユーザーが好みのアイテムの履歴をデバイスに保持しながらモデルをトレーニングすることを可能にする。
最近の研究では、協調学習は様々なプライバシー攻撃に弱いことが示されている。
本稿では,コミュニティ・推論・アタック(CIA)と呼ばれる新たな攻撃手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 10:24:14 GMT)
Enhanced Small Target Detection via Multi-Modal Fusion and Attention Mechanisms: A YOLOv5 Approach [1.9] マルチモーダル画像融合とアテンション機構に基づく小さなターゲット検出手法を提案する。
この方法はYOLOv5を活用し、赤外線および可視光データと畳み込みアテンションモジュールを統合して検出性能を向上させる。
対UAVおよびVisdroneデータセットの実験結果は、我々のアプローチの有効性と実用性を示している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:02:10 GMT)
Transfer Learning for Temporal Link Prediction [1.9] 時間的リンク予測(TLP)は、時間的に進化するグラフにおける将来のリンクを予測することを指す。
メモリモジュールは、列車時に見られるノードに関する情報のみを格納する。
メモリラデンモデルのための転送効率向上手法を開発した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:12:00 GMT)
Which Optimizer Works Best for Physics-Informed Neural Networks and Kolmogorov-Arnold Networks? [1.8] 我々は,バーガーズ,アレン・カシンスキー,ギンズバーグ・ランダウ方程式を含む,重要な挑戦的線形・剛性・多スケール非線形PDEについてPINNとPIKANを比較した。
PINN や PIKAN で一般的に用いられている他の機能拡張を使わずに改善点を明らかにした。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:30:52 GMT)
Application of AI-based Models for Online Fraud Detection and Analysis [1.8] オンライン不正検出のためのAIおよびNLP技術に関する体系的文献レビューを行う。
各種オンライン詐欺カテゴリを解析するための最先端NLP技術について報告する。
データ制限の問題、トレーニングバイアスレポート、モデルパフォーマンスレポートにおけるメトリクスの選択的な表示などを特定します。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:05:24 GMT)
Robustness and sex differences in skin cancer detection: logistic regression vs CNNs [1.8] この研究は、アルツハイマー病の研究の複製であり、患者性間のロジスティック回帰(LR)と畳み込みニューラルネットワーク(CNN)の堅牢性について研究した。
性別構成の異なる複数のトレーニングデータセットにまたがって,これらのモデルを[28]と整合して評価し,ロバスト性を決定する。
以上の結果より, LRとCNNはともに性分布に強く, また, CNNは男性患者よりも有意に精度が高く, 受信者操作特性 (AUROC) も有意に高かった。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:31:46 GMT)
Data driven approach towards more efficient Newton-Raphson power flow calculation for distribution grids [1.6] 電力フロー(PF)計算は、安定かつ信頼性の高いグリッド動作を保証するために、電力系統解析の基礎となる。
The Newton-Raphson (NR) method is common used for PF analysis because its rapid convergence when appropriate。
この研究は、NRを改善するための戦略を提案し、イテレーションを最小化し、ばらつきを避ける。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 22:37:55 GMT)
Differentially Private Geodesic and Linear Regression [1.5] 統計応用では、多様体のような非線型空間上に存在するデータ構造に遭遇することがますます一般的になっている。
我々はK-Norm Gradient (KNG) 機構を介して測地回帰の微分プライベート(DP)パラメーターをリリースすることを検討する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:45:48 GMT)
Learned enclosure method for experimental EIT data [1.5] 本稿では,池畑が提案する囲い込み法とニューラルネットワークを組み合わせることで,境界測定から包含物の凸包を推定する方法を提案する。
最小二乗の整合性を持つ古典的閉包法と比較して, 学習された凸船体は, シミュレーションデータと実験データの両方において優れた性能を発揮する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:18:26 GMT)
Kozax: Flexible and Scalable Genetic Programming in JAX [1.4] Kozaxは任意の問題に対するシンボリック表現を進化させる遺伝的プログラミングフレームワークである。
高性能でスケーラブルな機械学習のためのフレームワークであるJAXを使ってKozaxを実装します。
我々は、自然法則の方程式を発見し、隠れた動的変数の方程式を復元し、制御ポリシーを進化させ、目的関数を最適化するために、Kozaxを成功させたことを実証する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:55:56 GMT)
Enhancing Commentary Strategies for Imperfect Information Card Games: A Study of Large Language Models in Guandan Commentary [1.4] 強化学習(RL)と大規模言語モデル(LLM)を組み合わせた新しい注釈手法を提案する。
本システムでは,RLを利用して複雑なカード再生シナリオを生成し,LLMを用いて対応する注釈文を生成する。
オープンソース LLM に適用した場合,提案する注釈フレームワークによって達成される性能の大幅な向上を示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:28:20 GMT)
Enhancing LLMs for Power System Simulations: A Feedback-driven Multi-agent Framework [1.4] 本稿では,電力系統のシミュレーションを管理するためのフィードバック駆動型マルチエージェントフレームワークを提案する。
改良された検索拡張生成モジュール(RAG)、改良された推論モジュール、エラーフィードバック機構を備えた動的環境作用モジュールの3つのモジュールが提案されている。
ChatGPT 4o、o1-preview、微調整されたGPT-4oは、いずれも複雑なタスクで30%未満の成功率を達成した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:33:50 GMT)
Deep-seeded Clustering for Emotion Recognition from Wearable Physiological Sensors [1.4] 本稿では,生理的信号から特徴を最小限に抽出し,分類するディープシードクラスタリングアルゴリズムを提案する。
本モデルは,感情コンピューティング研究で頻繁に使用される3つのデータセットに対して,良好な性能が得られることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:05:54 GMT)
Graph-Theoretic Measures for Interpretable Multicriteria Decision Making in Emergency Department Layout Optimization [1.4] 救急部門(ED)の過密は、人口増加、パンデミックの出現、死亡率と死亡率の増加によって悪化する永続的な問題である。
本稿では,多目的メタヒューリスティック最適化フレームワークによるEDレイアウトの評価とランク付けのためのグラフ理論手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 21:16:06 GMT)
Early Detection of Cognitive Impairment in Elderly using a Passive FPVS-EEG BCI and Machine Learning -- Extended Version [1.3] 初期の認知症診断には、構造的および機能的脳の変化の両方に敏感なバイオマーカーが必要である。
現在の認知評価は、しばしば行動反応に依存しており、努力、実践効果、教育的背景といった要因に影響を受けやすい。
この研究は、脳波(EEG)データから直接認知障害レベルを推測するために、軽量畳み込みニューラルネットワーク(CNN)を活用する、新しいアプローチを導入している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:34:13 GMT)
Compressing Hamiltonians with ab initio downfolding for simulating strongly-correlated materials on quantum computers [1.3] Ab initio のダウンフォールディングは、圧縮された多体ハミルトニアンを導出する方法として登場した。
我々は、量子アルゴリズムを用いて、下向きのハミルトンの物性を得ることができ、確実に高忠実性解が得られることを示した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:24:08 GMT)
DrivAer Transformer: A high-precision and fast prediction method for vehicle aerodynamic drag coefficient based on the DrivAerNet++ dataset [1.2] 本研究では、DrivAer Transformerと呼ばれるポイントクラウド学習フレームワークを提案する。
DAT構造はDrivAerNet++データセットを使用しており、産業標準の3D車両形状の高忠実なCFDデータを含んでいる。
この枠組みは車両設計プロセスの加速と開発効率の向上が期待されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:45:49 GMT)
Improved impedance inversion by the iterated graph Laplacian [1.2] 本稿では,古典的あるいは深層学習に基づくアプローチと反復グラフラプラシアン正規化を統合したデータ適応型逆変換手法を提案する。
本手法は,従来のインバージョン手法とニューラルネットワークに基づく手法のいずれかを用いて導出したインピーダンス推定から開始する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:53:04 GMT)
FACT: Foundation Model for Assessing Cancer Tissue Margins with Mass Spectrometry [1.0] FACTは、もともと3重項損失に基づく教師付きコントラストアプローチを用いて事前訓練されたテキスト音声アソシエーションのための基礎モデルの適応である。
結果: 提案モデルでは, AUROC が 82.4% pm 0.8$ で, 最先端性能を実現し, 分類性能を著しく向上させる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:36:03 GMT)
Improved approximation ratios for the Quantum Max-Cut problem on general, triangle-free and bipartite graphs [0.9] QMC(Quantum Max-Cut)問題は、特定の2n倍の2n$行列の最大の固有値を決定することである。
現在知られている一般グラフのQMC近似アルゴリズムについて,より精密な解析を行う。
三角形自由グラフと二部グラフ上のQMC問題に対する2つの新しい近似アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:08:07 GMT)
Reconstructing Fine-Grained Network Data using Autoencoder Architectures with Domain Knowledge Penalties [0.9] 生のネットワークトラフィックの大規模な収集と保存は、特に稀なサイバー攻撃サンプルの収集に困難をもたらす。
ネットワークデータをエンコードし再構成するための形式的手法によって導かれる機械学習手法を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:51:44 GMT)
TerrAInav Sim: An Open-Source Simulation of UAV Aerial Imaging from Satellite Data [0.9] TerrAInav Simは、UAVをシミュレートして、鳥眼ビューマップベースの画像をゼロヨーでキャプチャすることで、魅力的な代替手段を提供する。
ドローンを物理的に飛ばす必要がなければ、仮想UAVはどんな地図でも検索して画像をキャプチャする。
TerrAInav Simの能力は、基本的なアプリケーションのためにいくつかの低高度画像をキャプチャすることから、ディープラーニングのような複雑なタスクのために、都市全体の広範なデータセットを生成することまで様々である。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 20:50:26 GMT)
Accurate Machine Learning Interatomic Potentials for Polyacene Molecular Crystals: Application to Single Molecule Host-Guest Systems [0.8] 新しい機械学習原子間ポテンシャル(MLIP)は、大規模な正確な物質シミュレーションに有望なソリューションを提供する。
我々は,グラフニューラルネットワークに基づくMACEアーキテクチャとアクティブラーニング戦略を活用することで,汎用MLIPを開発する。
これらのポテンシャルは正確であり、非調和振動特性、振動寿命、振動結合の研究を可能にする。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:27:21 GMT)
SE Arena: An Interactive Platform for Evaluating Foundation Models in Software Engineering [0.8] ソフトウェアエンジニアリング活動の基盤モデル(FM)を評価するために設計されたインタラクティブなプラットフォームであるSE Arenaを紹介する。
SE Arenaは透明でオープンソースのリーダーボードを提供し、複数ラウンドの会話スコアをサポートし、エンドツーエンドのモデル比較を可能にする。
本稿では,SE Arenaの設計と機能について概説し,ソフトウェア工学におけるFMの評価と実用化を前進させる可能性を強調した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:34:27 GMT)
ResiLogic: Leveraging Composability and Diversity to Design Fault and Intrusion Resilient Chips [0.7] 本稿では, レジリエンスに対する3つの関連する攻撃(分布, 粒子, 複合攻撃)を考慮に入れた脅威モデルについて述べる。
textitDiversity by Composability を利用した textttResiLogic フレームワークを導入する。
異なる粒度レベルでのこのアプローチを用いることで,thisttResiLogicにおける回路設計のレジリエンスを5倍に向上させる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:45:43 GMT)
The path towards measuring the gravitational field of proton bunches at accelerators [0.7] LHC貯蔵環の強い超相対論的な陽子ビームは、一般相対性理論をテストする可能性がある。
本項では、この方向の理論研究の現状について概説する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:45:35 GMT)
Code Reborn AI-Driven Legacy Systems Modernization from COBOL to Java [0.5] Legacy 2024 Corpusの活用 -- パブリックおよびエンタープライズソースから5万ファイル -- Javaはコードを解析し、AIはアップグレードを提案し、Reactは向上を視覚化する。
このアプローチは、銀行や保険といった業界にとって不可欠な、システムを回復するためのスケーラブルなパスを提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:07:54 GMT)
Real-time Object and Event Detection Service through Computer Vision and Edge Computing [0.5] 都市部における致命的な道路事故は、Vulnerable Road Users (VRU) である。
本稿では,コンピュータビジョン(CV)とエッジコンピューティングに基づく,スマートシティの道路監視と安全のためのシステムの構築手法を提案する。
このアルゴリズムは、車、歩行者、自転車を正確に検知し追跡し、道路の状態、移動物体間の距離を予測し、衝突をほぼリアルタイムで防止するために衝突イベントを推定する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 23:11:42 GMT)
A Critical Analysis of Deployed Use Cases for Quantum Key Distribution and Comparison with Post-Quantum Cryptography [0.4] 量子鍵分散(QKD)は、量子コンピュータが従来の公開鍵暗号システムに侵入する未来の通信を保護する技術として議論されている。
我々は,学術文献や産業報告から得られた実世界のユースケースに着目し,QKDベースのソリューションの総合的なセキュリティ評価を行う。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:12:09 GMT)
Moving Beyond Next-Token Prediction: Transformers are Context-Sensitive Language Generators [0.4] トランスフォーマーを利用した大規模言語モデル(LLM)は、人間のような知能を実証している。
本稿では,LLMを確率的左文脈依存言語(CSL)ジェネレータとして解釈するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:06:27 GMT)
The Use of Generative Artificial Intelligence for Upper Secondary Mathematics Education Through the Lens of Technology Acceptance [0.4] 本研究では,生成人工知能(GenAI)を用いた数学教育における学生の認識について検討した。
その結果,GenAIの使用意図に対する知覚的有用性の影響が強く示された。
互換性の付与により、モデルの説明力、特に知覚された有用性を予測する能力が改善された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:20:07 GMT)
Mathematical Capabilities of Large Language Models in Finnish Matriculation Examination [0.4] 大規模言語モデル (LLM) は、教育環境においてますます有望であることが示されている。
本研究は,フィンランドの成熟度試験を用いて,様々なLSMの数学的能力を評価する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:31:54 GMT)
Towards a Universal Vibration Analysis Dataset: A Framework for Transfer Learning in Predictive Maintenance and Structural Health Monitoring [0.4] この研究には、様々な種類の機械からの幅広い振動信号が含まれる。
ビジュアルコンピューティングにおけるImageNetの成功を反映して、このデータセットは産業アプリケーションにおけるインテリジェントシステムの開発を改善する可能性がある。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:57:26 GMT)
Simulation-based inference for stochastic nonlinear mixed-effects models with applications in systems biology [0.3] 階層型混合効果モデルにおける拡張ベイズ推定のための新しい手法を提案する。
我々のフレームワークはまず、確率と後部分布の補正近似を構築し、各データセットに対して高速に精製する。
統計的精度の点で,我々のアプローチは迅速かつ競争的であった。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:18:58 GMT)
Entanglement scaling in matrix product state representation of smooth functions and their shallow quantum circuit approximations [0.3] マトリックス積状態(MPS)法は、浅い量子回路を構築する上で最も有望な手法として現れた。
入力関数の滑らかさに依存するMPS表現における結合間の絡み合いの崩壊に対する厳密な展開を導出する。
我々は、量子回路を浅く正確に符号化する改良されたMPSベースのアルゴリズムを構築した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:12:34 GMT)
A Decade of Wheat Mapping for Lebanon [0.3] 冬季のコムギ分割のための改良パイプラインを導入することにより,衛星画像から小麦畑を正確にマッピングする問題に対処する。
本手法は,コムギのセグメンテーションを精密なフィールド境界抽出と組み合わせることで,幾何的コヒーレントでセマンティックにリッチな地図を生成する。
この研究は、作物のモニタリングや収量推定など、様々な重要な研究と今後の進歩の基礎を築いた。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:31:54 GMT)
Towards Automated Safety Requirements Derivation Using Agent-based RAG [0.3] 自律走行車における安全要件の自動導出について検討し, LLMとエージェントベース検索拡張生成を併用して検討した。
既存のRAGアプローチはこの問題に対処するが、複雑なクエリを扱う場合のパフォーマンスは低下する。
本稿では,エージェントベースRAGを用いて安全性要件を導出し,検索した情報がクエリに関連があることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:43:19 GMT)
Short note on the mapping of heritage sites impacted by the 2024 floods in Valencia, Spain [0.2] 公開データを用いて,遺産座標を用いた洪水地図をオーバーレイすることで,潜在的被害の程度を評価する。
地域遺産の3.3%は、教会や神社(81件)、屋外の宗教図像(78件)、歴史的庭園(45件)などの影響を受けている可能性がある。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:47:08 GMT)
Large Language Model-Informed Feature Discovery Improves Prediction and Interpretation of Credibility Perceptions of Visual Content [0.2] 本稿では,Large Language Model (LLM) を用いた特徴発見フレームワークを導入する。
対象のプロンプトを用いて解釈可能な特徴を抽出・定量化し、それらを機械学習モデルに統合して信頼性予測を改善する。
提案手法は,R2においてゼロショットGPTに基づく予測を13%向上させ,情報具体性や画像フォーマットなどの重要な特徴を明らかにした。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:11:40 GMT)
Defending Against Frequency-Based Attacks with Diffusion Models [0.2] 拡散モデルは、画素単位の逆方向の摂動に対処するだけでなく、非逆方向のデータシフトに対処する上でも非常に有効であることが証明されている。
本研究は,低周波領域から高周波領域への多彩な歪みパターンの取り扱いの有効性を明らかにする。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:57:17 GMT)
Revealing Covert Attention by Analyzing Human and Reinforcement Learning Agent Gameplay [0.2] 本研究では,ゲームプレイデータのみを用いて,人間の隠れ注意パターンを明らかにする手法を提案する。
本研究では,アタリ環境における人間とRLエージェントのゲームプレイからアテンションマップを生成するCTRアテンションネットワークを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:07:14 GMT)
ProtoECGNet: Case-Based Interpretable Deep Learning for Multi-Label ECG Classification with Contrastive Learning [0.2] ProtoECGNetは、解釈可能な多ラベルECG分類のためのプロトタイプディープラーニングモデルである。
PTB-XLデータセットから71の診断ラベルについてProtoECGNetを評価する。
ProtoECGNetは、プロトタイプ学習を複雑で多ラベルの時系列分類に効果的にスケールできることを示した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 22:08:45 GMT)
Mutual Understanding between People and Systems via Neurosymbolic AI and Knowledge Graphs [0.2] 本稿では,知識の共有,知識の交換,知識の統制という,相互理解を特徴付ける3つの重要な側面を紹介する。
我々は、人間、人工、ロボットエージェント間の意味のある交換を支援するため、NeSy AIとKnowledge Graphsの応用を実証するいくつかのユースケースシナリオを提示する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:57:09 GMT)
FlexiContracts: A Novel and Efficient Scheme for Upgrading Smart Contracts in Ethereum Blockchain [0.2] FlexiContractsは、過去のデータを失うことなく、セキュアでインプレースなアップグレードを可能にすることによって、スマートコントラクトの進化を想像する。
その合理化された設計は、スマートコントラクト開発をシンプルにすることで、現在のデザインパターンの限界を超越している。
この進歩は、継続的な改善と新しい要求への適応の環境を育みます。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:20:42 GMT)
SuperARC: An Agnostic Test for Narrow, General, and Super Intelligence Based On the Principles of Recursive Compression and Algorithmic Probability [0.1] アルゴリズムの確率を基礎としたオープンエンドテストを導入する。
これはフロンティアモデルの定量的評価においてベンチマーク汚染を避けることができる。
圧縮はシステムの予測力と等価であり、直接的に比例することを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 22:36:24 GMT)
Establishing a Foundation for Tetun Ad-Hoc Text Retrieval: Stemming, Indexing, Retrieval, and Ranking [0.0] 本研究では,アドホック検索タスクに着目したテトゥーンのテキスト検索について検討する。
最初は、ストップワードのリスト、ストローマー、テストコレクションなど、重要な言語リソースの開発から始まります。
次に、文書タイトルとコンテンツの両方を用いて、検索の有効性を評価する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:58:52 GMT)
When big data actually are low-rank, or entrywise approximation of certain function-generated matrices [0.0] この記事は、2$m$次元変数の滑らかな関数をサンプリングすることによって生成される行列の低ランク近似に関するものである。
特定の解析関数のクラスに対して、そのような$n times n$行列は、$m$とは独立で$log(n)$として成長するランクの正確なエントリーワイド近似を認めるという主張を取り巻くいくつかの誤解を特定する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:00:37 GMT)
Wasserstein Distributionally Regret Optimization [0.0] We provide a systematic analysis of Wasserstein DRRO, paralleling known results for Wasserstein DRO。
滑らかさと規則性条件下では、ワッサーシュタインDRROは経験的リスク最小化(Empirical Risk Minimization:ERM)と1次項に一致することを示す。
2つの1次元凹関数を最大化することにより、後悔を計算できることが示される。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 01:47:11 GMT)
Visual Language Models show widespread visual deficits on neuropsychological tests [0.0] 神経心理学のツールキットを用いて3つの最先端ビジュアル言語モデル(VLM)の能力を評価する。
臨床的に有意と思われる低位・中位の視覚能力に広範な欠陥がみられた。
これらの選択的欠陥は、検証されたテストバッテリーを通してプロファイルされ、人間には明示的な訓練を必要としない基礎的な視覚概念を発達させることなく、人工知能が複雑な物体認識を達成できることを示唆している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 01:04:56 GMT)
Using LLMs as prompt modifier to avoid biases in AI image generators [0.0] LLM(Large Language Models)は、ユーザプロンプトを変更することで、テキストから画像生成システムにおけるバイアスを低減する。
安定拡散XL, 3.5, Fluxを用いた実験により, LLMを修飾したプロンプトは, 画像生成装置自体を変更することなく, 画像の多様性を著しく向上し, バイアスを低減できることが示された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:52:20 GMT)
Unchecked and Overlooked: Addressing the Checkbox Blind Spot in Large Language Models with CheckboxQA [0.0] CheckboxQAは、チェックボックス関連タスクのモデルパフォーマンスの評価と改善を目的としたデータセットである。
現行のモデルの限界を明らかにし、文書理解システムを前進させる貴重なツールとして機能する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:41:36 GMT)
Towards Predictive Communication with Brain-Computer Interfaces integrating Large Language Models [0.0] 近年の研究では、予測言語モデルとBCIの組み合わせが人間とコンピュータの相互作用を大幅に改善する可能性が示唆されている。
特に、GPTのような事前訓練された自己回帰変換器モデルは、通信のためのBCIを大幅に改善することを約束する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:38:13 GMT)
Topology-enhanced machine learning model (Top-ML) for anticancer peptide prediction [0.0] 抗がんペプチド予測のためのトポロジー強化機械学習モデル(Top-ML)を提案する。
本研究は,抗がんペプチドの同定を促進するために,新規なトポロジを基盤とした創製の可能性を強調した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:15:39 GMT)
Time-Resolved Stokes Analysis of Single Photon Emitters in Hexagonal Boron Nitride [0.0] 六方晶窒化ホウ素(hBN)における量子エミッタの偏光状態の包括的特徴付けには回転四面体プレート(RQWP)法を用いる。
以上の結果から,hBNエミッタの複雑な偏光ダイナミクスが発見され,これまでアクセス不能であった知見が得られた。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:49:14 GMT)
The thread embodiment of holographic quantum entanglement [0.0] ホログラフィック双対性の絡み合い構造を特徴付ける量子スレッド画像を開発する。
テンソルネットワークモデルと初期のビットスレッドの概念に着想を得て,ホログラムバルクにおける量子スレッドの軌跡を規定する規則を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:53:30 GMT)
The role of non-Markovian dissipation in quantum phase transitions: tricriticality, spin squeezing, and directional symmetry breaking [0.0] 量子システムにおける相転移の制御方法を理解することは、新しい量子材料や技術の開発研究の最前線にある。
本稿では, 量子系と非マルコフ環境, すなわち, 周波数依存性のスペクトル密度がメモリ効果を誘導する環境との結合が, 相転移の生成と再形成にどのように利用されるかを検討する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:58:15 GMT)
The Lifetime of the Covid Memorial Wall: Modelling with Collections Demography, Social Media Data and Citizen Science [0.0] ロンドンのナショナル・コビッド・メモリアル・ウォールには、手描きの赤いハートが2万枚以上ある。
本研究は, 高品質塗料の変遷と, 壁面の長期保存に与える影響について検討した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:51:14 GMT)
The Forward-Forward Algorithm: Characterizing Training Behavior [0.0] フォワード・フォワードアルゴリズムは、フォワードパスとバックプロパゲーションによって使用されるバックパスではなく、2つのフォワードパスからなる代替学習手法である。
この研究は、フォワード・フォワードネットワークにおけるモデルとレイヤーの精度変化のダイナミクスを探求し、トレーニングが進むにつれて、内部挙動の機械的理解を追求する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:30:18 GMT)
The Art of Audience Engagement: LLM-Based Thin-Slicing of Scientific Talks [0.0] 簡単な抜粋(薄いスライス)が全体のプレゼンテーション品質を確実に予測できることを示します。
我々は,100以上の実生活科学講演の新たなコーパスを用いて,Large Language Models (LLMs) を用いて,プレゼンテーションの完全な書き起こしを評価する。
以上の結果から,LCMによる評価は人間の評価と密接に一致し,妥当性,信頼性,効率性が証明された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 00:08:13 GMT)
Statistical complexity as a probe of mass and phase structure in compact objects [0.0] 重力質量が複雑性の挙動を決定する上で重要な役割を担っていることを示す。
恒星内部の強い相転移、例えばハイブリッド星で仮説化された恒星は、複雑性プロファイルの異なる特徴として現れることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:59:47 GMT)
Single-site and multi-site solitons of bright matter-waves in optical lattices [0.0] 光学格子における魅力的な相互作用を持つ離散明るい物質波ソリトンを実験的に観察した。
その結果,これらのソリトンの存在と特性が格子深度と間隔の幅にわたって明らかにされた。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 10:17:12 GMT)
Simulating Bell inequalities with Qibo [0.0] 本稿では,ベルの不等式に関する教育資料を量子コンピューティングの文脈で提示する。
我々は,その違反をシミュレートするソフトウェアツールと,教室での議論のガイドを提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:59:49 GMT)
Simon's Period Finding on a Quantum Annealer [0.0] シモンの周期フィニングアルゴリズムは、量子アルゴリズムの最も早く、最も脆弱なアルゴリズムの一つである。
このアルゴリズムをD-Waveハードウェア上で実装し,最大298キュービットの問題を解く。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 00:17:13 GMT)
SCOOP: A Scalable Quantum-Computing Framework to Constrained Combinatorial Optimization [0.0] 本稿では,制約付き最適化問題を解くための新しいフレームワークSCOOPを提案する。
SCOOPは制約付き問題を制約なしのものに変換し、SCOOP問題ツインを形成する。
本稿では,3つのNP-hard問題,最小支配集合,最小最大マッチング,最小集合被覆の枠組みを実証する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 06:17:23 GMT)
Robust Markov stability for community detection at a scale learned based on the structure [0.0] 本稿では、PyGenStabilityが生成する複数のパーティションから、1つのロバストなパーティションを適切なスケールで選択するための原則的手法を提案する。
提案手法は,マルコフ安定性フレームワークと事前学習された機械学習モデルを組み合わせて,スケール選択を行う。
PyGenStabilityOne (PO) は他の25のアルゴリズムよりも統計的に有意なマージンで優れていることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 21:16:14 GMT)
Rethinking Technological Readiness in the Era of AI Uncertainty [0.0] 私たちは、現在の技術準備性評価は、重要なAI固有の要因を捉えることができないと論じています。
軍事システムにおけるAIコンポーネントの成熟度と信頼性を評価するための新しいAI Readiness Frameworkを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:09:50 GMT)
Relativistic limits on the discretization and temporal resolution of a quantum clock [0.0] 量子時計における時間値の離散化と時間分解能の限界について論じる。
我々の時計の特徴は、有界かつ離散的なハミルトニアンを補完する時間観測可能であることである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 01:53:02 GMT)
Relativistic Quantum Simulation of Hydrogen Sulfide for Hydrogen Energy via Hybrid Quantum-Classical Algorithms [0.0] 本稿では,水素エネルギー応用に関連する硫化水素(H2S)分解をモデル化するための相対論的量子シミュレーションフレームワークを提案する。
このアプローチは、ディラック・クーロン相対論的量子化学と変分量子固有解法(VQE)を統合し、ハイブリッド量子古典アーキテクチャー上に実装する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:11:12 GMT)
Reinforcing Clinical Decision Support through Multi-Agent Systems and Ethical AI Governance [0.0] 実験結果, バイタルサイン, 臨床状況を分析するために, モジュラーエージェントを用いた新規エージェントシステムの設計を比較した。
我々は,eICUデータベースを用いて,実験室分析,バイタルのみのインタプリタ,文脈推論エージェントなどのエージェントシステムを実装した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:26:26 GMT)
ReZero: Enhancing LLM search ability by trying one-more-time [0.0] Retrieval-Augmented Generation (RAG) は、知識集約タスクにおけるLarge Language Model (LLM) の性能を改善するが、初期検索クエリの品質に大きく依存する。
ReZero(Retry-Zero)は,検索クエリをリトライする動作を直接報酬する新しいRLフレームワークである。
ReZeroは、25%のベースラインに比べて46.88%の精度で大幅に改善されている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:18:21 GMT)
Quantum Geometry of the Light Cone: Fock representation and Spectrum of Radiated Power [0.0] ボゾンおよびフェルミオン表現に対する量子論の結果について検討する。
フェルミオン表現では、各ヌル線上の中心電荷は正であり、ボソンでは負である。
モデルにおける重力波の放射パワーの束縛を得る。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 01:58:17 GMT)
Progressive Rock Music Classification [0.0] 本研究では,複雑な構成と多種多様な楽器を特徴とするジャンルである,プログレッシブ・ロック音楽の分類について検討する。
我々は、スペクトログラム、Mel-Frequency Cepstral Coefficients (MFCC)、クロマグラム、歌のスニペットからのビート位置などの総合的なオーディオ特徴を抽出した。
スニペットレベルの予測を最終曲分類に集約するために、すべての投票を勝者とする戦略が採用された。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:48:52 GMT)
Probing General Relativity-Induced Decoherence Using an on-chip Sagnac Interferometer [0.0] 最近の理論的提案は、相対論的固有時間が量子系におけるデコヒーレンスの原因となることを示唆している。
本稿では,時計回りと時計回りの単光子方向の適切な時間差を生じさせるチップ集積型サニャック干渉計を提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:01:16 GMT)
Probabilistic causal graphs as categorical data synthesizers: Do they do better than Gaussian Copulas and Conditional Tabular GANs? [0.0] 本研究では,因果グラフモデルを用いて,調査データなどの高品質な合成分類データの生成について検討する。
障害者サービスへのアクセシビリティ調査に基づくカテゴリーデータを用いた。
我々は、因果関係を表現し、変数間の結合分布を捉えるために、SEMモデルとBNモデルの両方を作成しました。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:41:54 GMT)
Privacy-Preserving CNN Training with Transfer Learning: Multiclass Logistic Regression [0.0] 本稿では,ただのホモモルフィック暗号化(HE)技術に基づくプライバシー保護型CNNトレーニングを実現するための実践的ソリューションを提案する。
私たちの知る限りでは、これはこのナットを突破する最初の試みであり、これまでこの目標を達成した作業はありませんでした。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:44:39 GMT)
Phase diagram of the disordered Kitaev chain with long range pairing connected to external baths [0.0] 外部リンドブラッド浴で粒子を交換する2つの金属鉛に接続した場合, 長距離ペアリングを有する不規則キタエフ鎖の相図について検討した。
本研究は, 長距離ペアリング北エフモデルにおいて, 大規模トポロジカル位相と短距離トポロジカル位相との間に障害による直接遷移が起こる可能性を示唆するものである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:39:01 GMT)
Perceptions of Agentic AI in Organizations: Implications for Responsible AI and ROI [0.0] 本稿では,エージェントAIの出現する状況の中で,組織がこのようなフレームワークをどのように認識し,適応するかを検討する。
エージェントAIシステムの本質的な複雑さと、その責任ある実装は、責任あるAI次元とテーマフレームワークの複雑な相互接続性に根ざし、組織的適応における重大な課題に寄与している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:15:06 GMT)
PatrolVision: Automated License Plate Recognition in the wild [0.0] シンガポールのナンバープレートに対して,シングルラインとダブルラインの完全なALPRシステムを提案する。
まず、RFB-Netを用いて全画像からライセンスプレートを検出し、複数の歪んだライセンスプレートを1つの画像で修正する。
16,000枚以上の画像をカバーする新しいデータセットを用いて,提案システムの性能評価を行った。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:10:43 GMT)
Particle-Hole Creation in Condensed Matter: A Conceptual Framework for Modeling Money-Debt Dynamics in Economics [0.0] 本稿では, 凝縮物質物理学における粒子ホール生成と直接類似して, 経済システムにおける金銭負債のダイナミクスをモデル化する場の理論的枠組みを提案する。
この枠組みは、量的緩和(QE)と金に支えられた金融体制、そして量子のような統一的な定式化の下で、ミクロ経済の信用創造を含むマクロ経済現象をうまく捉えている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:37:15 GMT)
Optimal control of geometric phase in pairs of interacting atoms traveling along two-dimensional closed paths [0.0] 双極子双極子ポテンシャルを介して相互作用する原子対の対において、非自明なアハロノフ・アンダン幾何相を誘導するスキームを提案する。
我々のプロトコルは、モバイル光トラップ技術に依存しており、クローズドループに沿って1つの原子を操る。
ノイズや実験的欠陥の存在下での我々のスキームの安定性について論じる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:06:40 GMT)
On-Device Watermarking: A Socio-Technical Imperative For Authenticity In The Age of Generative AI [0.0] 私たちは間違ったアプローチを採用しており、暗号署名による透かしに注力すべきだと論じています。
特に音声・視覚コンテンツについては、実際のコンテンツはすべて物理的世界に根ざし、ハードウェアセンサーを介してキャプチャされる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 20:36:52 GMT)
Nonequivalence between absolute separability and positive partial transposition in the symmetric subspace [0.0] 絶対分離状態と絶対正部分転位状態(PPT)の同値性は、一般に量子エンタングルメント理論において未解決の問題である。
絡み合った5ビットSAPPT状態の族を構築する。
より大きな奇数の量子ビットに対する同様の反例が同定される。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:24:52 GMT)
Non-stabilizerness in open XXZ spin chains: Universal scaling and dynamics [0.0] 開放型XXZスピンチェーンの魔法を境界ゲインと損失、あるいはバルクデファスリングで調べる。
我々は行列積状態の定式化の中で$M$を計算するための,新しい,高効率なアルゴリズムを開発した。
これらの発見は、オープン量子系における普遍性と力学を探索するための強力な診断ツールとしてマジックを位置づけている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:41:52 GMT)
Non-Markovian spontaneous emission in a tunable cavity formed by atomic mirrors [0.0] 導波管型量子電磁力学装置に配置した2レベル試験原子の非マルコフ自然放出ダイナミクスを解析した。
テスト原子の非マルコフ力学とフィールドの創発スペクトル密度を解析した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:03:33 GMT)
Neural Networks for on-chip Model Predictive Control: a Method to Build Optimized Training Datasets and its application to Type-1 Diabetes [0.0] ニューラルネットワーク(NN)をトレーニングしてモデル予測制御(MPC)アルゴリズムとして動作させることは、制約された組み込みデバイスでそれらを実装するための効果的な方法である。
我々は、最適サンプリングデータセット(OSD)の概念を理想的なトレーニングセットとして導入し、それらを生成するための効率的なアルゴリズムを提案する。
本研究は, ヴァージニア大学のMPCアルゴリズムを再現して, Type-1糖尿病における自動インスリンデリバリーのためのNNのトレーニングによるOSDの有効性を実証するものである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:25:06 GMT)
Neural Network Emulation of the Classical Limit in Quantum Systems via Learned Observable Mappings [0.0] ニューラルネットワークアーキテクチャを開発し,初期期待値とhbar$から位置期待値の時間進化へのマッピングを学習する。
ネットワークの予測を異なるhbarのレジームで分析することにより、量子古典遷移の性質に関する計算的な洞察を提供することを目指している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 00:48:36 GMT)
Name of Thrones: Evaluating How LLMs Rank Student Names, Race, and Gender in Status Hierarchies [0.0] 我々は5つの民族にまたがる名前のバリエーションを大規模に分析し、AIがどのように名前バイアスを示すかを調べる。
AIが白人を好んでいるという一般的な仮定とは対照的に、東アジアや一部の文脈では、南アジアの名前が上位にランクされている。
ジェンダーは偏見を緩やかにし、一部の人種集団では不公平な不公平に直面している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 01:47:39 GMT)
Multi-Agent Reinforcement Learning for Greenhouse Gas Offset Credit Markets [0.0] 政府は企業に対して排ガス制限を課し、その限界を超える排ガスを罰することができる。
排ガス過剰は、二酸化炭素削減プロジェクトに投資する企業によっても相殺される可能性がある。
オフセット信用市場における有限エージェントナッシュ均衡を特徴付ける。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:56:42 GMT)
Measuring coherent dynamics of a superconducting qubit in an open waveguide [0.0] 共振器不要条件下で超伝導トランスモン量子ビットの緩和と脱コヒーレンス率を測定した。
周波数領域の測定から抽出したパラメータと対応する推定値との整合性を示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:52:54 GMT)
Making informed decisions in cutting tool maintenance in milling: A KNN-based model agnostic approach [0.0] 本研究では、機械学習を利用して、さまざまな工具摩耗条件下で実験から収集した実時間力信号を分析する。
このモデルは、ツールの摩耗を検出するだけでなく、各決定の背後にある理由に関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:04:00 GMT)
Long-distance quantum communication using concatenated ring graph codes [0.0] 本稿では,リンググラフ符号と線形光ベル状態測定に基づく一方向量子リピータアーキテクチャを提案する。
これにより、単一量子ビット誤り率が存在する場合でも、kHZレートでの長距離量子通信が可能となる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:45:47 GMT)
Limits of Discrete Energy of Families of Increasing Sets [0.0] 集合のハウスドルフ次元はリースエネルギーを用いて検出できる。
x_n$ という点列が集合 $E の部分集合 mathbbRd$ を適切な意味で埋める状況を考える。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 15:45:14 GMT)
Leveraging Point Transformers for Detecting Anatomical Landmarks in Digital Dentistry [0.0] 我々はMICCAI 2024の3DTeethLand Grand Challengeで行った実験について紹介する。
我々は、ポイントトランスフォーマーv3インスパイアされたモジュールを設計し、ポイント間距離を予測するために軽量デコーダによって処理される有意義な幾何学的特徴と解剖学的特徴を捉えた。
有望な結果を報告し、学習した特徴解釈可能性に関する洞察について考察する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:34:56 GMT)
LOKA Protocol: A Decentralized Framework for Trustworthy and Ethical AI Agent Ecosystems [0.0] 我々は倫理的に統制された相互運用可能なAIエージェントエコシステムを構築するための統一されたシステムレベルのアーキテクチャであるLoka Protocol(Layered Orchestration for Knowledgeful Agents)を提示する。
アイデンティティ、信頼、倫理をプロトコル層自体に組み込むことで、Lokaは責任、透明性、自律的なAIエコシステムの新しい時代の基礎を確立します。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 06:51:35 GMT)
K-means Enhanced Density Gradient Analysis for Urban and Transport Metrics Using Multi-Modal Satellite Imagery [0.0] 本研究では,都市部を区分し,都市中心を同定し,密度勾配を定量化する手法を開発した。
提案手法は,密度勾配係数(alpha$)と,密度が目標閾値に達する最小有効距離(LD)の2つの重要な指標を計算する。
都市構造を明らかにすることで,これらの指標が公共交通機関の分析に有効なスクリーニングツールであることを実証した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:25:42 GMT)
Integration of a high-fidelity model of quantum sensors with a map-matching filter for quantum-enhanced navigation [0.0] 原子干渉計を用いた重力勾配計の高忠実度モデルの実現について報告する。
量子重力勾配計を用いた地図マッチングによるナビゲーション支援により,安定した軌道が導かれることを示す。
センサの傾きを3.3度以下に抑えるなど,これらの誤差を軽減するための要件を導出する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:07:21 GMT)
Improved MST3 Encryption scheme based on small Ree groups [0.0] 本稿では,小Reeグループに基づく暗号方式を提案する。
本稿では,暗号化方式のセキュリティパラメータの全体的な向上のために,小さなReeグループ構造を利用することを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 07:51:56 GMT)
Impact of the Sagnac Effect on Thermodynamic and Magnetocaloric Properties of a Rotating Two-Dimensional Electron Gas [0.0] 本研究では, 回転試料中の非接触2次元電子ガス(2DEG)の熱力学特性に及ぼすサニャック効果の影響を磁場の影響下で検討した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 23:23:22 GMT)
IgCraft: A versatile sequence generation framework for antibody discovery and engineering [0.0] IgCraftは、Bayesian Flow Networks上に構築された、ペア化されたヒト抗体配列生成のための多目的モデルである。
以前分離されたタスクを単一のスケーラブルな生成モデルに統合することで、IgCraftはヒトの抗体配列をサンプリングするための汎用的なプラットフォームを提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:24:18 GMT)
Identifying high performance spectrally-stable quantum defects in diamond [0.0] 半導体の量子欠陥は量子技術の中心になりつつある。
ダイヤモンドの最も顕著な量子欠陥は窒素空孔(NV)中心である。
我々は、中心対称性、可視範囲での放射、および好ましい電子構造と達成可能な電子構造を組み合わせた欠陥を同定する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 20:26:24 GMT)
Heating reduction as collective action: Impact on attitudes, behavior and energy consumption in a Polish field experiment [0.0] 暖房と温水利用は欧州連合における家庭のエネルギー消費の80%近くを占める。
ポーランドの大学寮の学生を対象に,暖房と給湯を対象とする心理的・技術的介入の混合について検討した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:41:37 GMT)
Ground-State-Based Model Reduction with Unitary Circuits [0.0] 我々は基底状態のユニタリ変換に基づく低エネルギー有効モデルを得る。
半充填時の1次元および2次元2次元2乗格子ハバードモデルを用いて,本手法を検証した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 00:23:13 GMT)
Greedy Restart Schedules: A Baseline for Dynamic Algorithm Selection on Numerical Black-box Optimization Problems [0.0] 本稿では,選択時の未解決学習問題の分布に最善を尽くすアルゴリズムを反復的に選択するスケジューリング手法を提案する。
我々は,BBOBテストベッド上での数値ブラックボックス最適化からよく知られた手法を実演し,従来のポートフォリオから様々な評価プロトコルにまたがって,単一と仮想のベストソルバのギャップの多くを埋める方法を示した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:54:21 GMT)
Generative AI for Brane Configurations and Coamoeba [0.0] 本研究では,複雑な構造変調を入力として選択し,対応するコアメーバを生成する条件変分オートエンコーダ(CVAE)を訓練する。
これにより、同じトーリックカラビ・ヤウ 3次元多様体に対応する 4d N=1 理論の族に対する位相空間全体の高分解能表現が得られる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:26:43 GMT)
Generating three transparency windows, Fano-resononce and slow/fast light in magnomechanical system through an auxiliary microwave cavity [0.0] ハイブリッドキャビティマグノメカニカルシステムにおいて,マグノメカニカル誘導透過(MMIT)現象,ファノ共鳴,低速光効果について検討した。
ファノ共鳴現象の背後にあるメカニズムについて解説する。
また, 原子-光子結合強度の調整により, 遅い光分布が減少することを示した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 18:09:37 GMT)
Generalized probabilistic canonical correlation analysis for multi-modal data integration with full or partial observations [0.0] Generalized Probabilistic Canonical correlation Analysis (GPCCA) はマルチモーダルデータの統合と共同次元化のための教師なし手法である。
GPCCAは、モデル内の欠落値を扱うことで、マルチモーダルデータ分析における重要な課題に対処する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 20:49:31 GMT)
Frustration graph formalism for qudit observables [0.0] 非エルミートユニタリ作用素で表される素数 d を持つ d-アウトカム量子可観測体の群を考える。
我々は、クディット安定化部分空間に対するエンタングルメントの一般化幾何測度を計算する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:03:34 GMT)
FourierNAT: A Fourier-Mixing-Based Non-Autoregressive Transformer for Parallel Sequence Generation [0.0] 本稿では、デコーダにフーリエを混合して並列に出力シーケンスを生成する非自己回帰変換器(NAT)アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 21:21:55 GMT)
Fine-Tuning Florence2 for Enhanced Object Detection in Un-constructed Environments: Vision-Language Model Approach [0.0] 非構成の複雑な環境における物体検出タスクのためのFlorence2モデルを微調整した。
最適化されたFlorence2モデルでは、オブジェクト検出精度が大幅に向上した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 09:19:42 GMT)
Figurative Archive: an open dataset and web-based application for the study of metaphor [0.0] フィギュラティブ・アーカイブ(Figurative Archive)は、イタリア語で997のメタファーの公開データベースであり、格付けとコーパスに基づく尺度が豊富である。
日常的なメタファーと文学的なメタファーの両方を含み、構造や意味の領域によって異なり、親しみと他の尺度の相関関係に基づいて検証される。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 20:10:50 GMT)
Field-effect detected magnetic resonance of NV centers in diamond based on all-carbon Schottky contacts [0.0] 窒素空孔(NV)中心はダイヤモンドの欠陥であり、スピン状態はフォトルミネッセンスや電気的に光発生率を利用して光学的に読み取ることができる。
我々は、IIa型ダイヤモンド材料に対して、NV中心のアンサンブルによって生じる電子-ホール対が、照明時にp型物質にどのように導かれるかを示す。
我々は、NVアンサンブルスピン共鳴のバイアス電圧と高周波誘起励起の関数として、照明に伴う逆電流がどう変化するかを分析する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:48:49 GMT)
Experimental Machine Learning with Classical and Quantum Data via NMR Quantum Kernels [0.0] 核磁気共鳴(NMR)プラットフォームで10ビットの星トポロジーレジスタ上に量子カーネルを実装した。
我々は、データ依存ユニタリ変換を用いて、複数の量子コヒーレンス順序の進化における古典的なデータを実験的に符号化した。
以上の結果から,このカーネルは未知のデータに対してよく一般化できることを示した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:51:53 GMT)
Ever-Improving Test Suite by Leveraging Large Language Models [0.0] ソフトウェアシステムの実際の使用を反映したテストケースによるテストスイートの拡大は、長く続くソフトウェアシステムの品質を維持する上で非常に重要である。
E-Testは、本番環境で発生しまだテストされていない動作を実行するテストケースでテストスイートを漸進的に拡張するアプローチである。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:38:25 GMT)
Evaluating the Propensity of Generative AI for Producing Harmful Disinformation During an Election Cycle [0.0] 本研究は, 選挙期間中に有害な偽情報を生成するための, 現在の生成AIモデルの妥当性について検討する。
コピロとジェミニは、予想される最低限の損害に気付き、全体的な安全性能に結びついていることが判明した。
敵対的役割の特徴が発見され 全てのモデルに より大きな害をもたらすことが判明しました
論文参考訳(メタデータ) (Tue, 15 Apr 2025 22:05:39 GMT)
Erzeugunsgrad, VC-Dimension and Neural Networks with rational activation function [0.0] 本稿では,Affine Intersection TheoryとVC-Theory of Computational Learning Theoryを結びつける上で,Erzeugungsgradが重要な要素であることを示す。
特に、VC次元とクルル次元が断続理論に基づく対数係数に線形に関係していることを証明する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:16:38 GMT)
Emotional Strain and Frustration in LLM Interactions in Software Engineering [0.0] 大規模言語モデル(LLM)は、ソフトウェア工学における日々のタスクにますます統合されています。
フラストレーションは、ストレスとバーンアウトにエスカレートした場合、エンジニアの生産性と幸福に悪影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:42:15 GMT)
Efficient and systematic calculation of arbitrary observables for the matrix product state excitation ansatz [0.0] 熱力学限界における単粒子キャラクタによる励起の期待値を計算するための一般的な方法は文献に欠けている。
本稿では行列積演算子として表される任意の可観測値を計算する再帰アルゴリズムを提案する。
本研究では,スピン-1ハイゼンベルク鎖と一次元ハバード模型の低層励起について検討し,本手法の汎用性を示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:52:31 GMT)
ELTEX: A Framework for Domain-Driven Synthetic Data Generation [0.0] LLMドメイン専門化の課題に対処するフレームワークであるELTEX(Efficient LLM Token extract)を紹介する。
暗黙の知識伝達に依存するアプローチとは異なり、ELTEXは専門知識の完全性を維持するためにドメインシグナルを明示的に活用する。
コントリビューションには,(1)ELTEXフレームワーク,(2)Google Sheetsアドオン実装,(3)ELTEXが小規模モデルと大規模モデル間のパフォーマンスギャップをいかに埋めるかを示す実証的検証,(4)ブロックチェーンサイバー攻撃検出のための11,448テキストの合成データセットなどが含まれている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 08:14:25 GMT)
Dynamical electronic correlation and chiral magnetism in van der Waals magnet Fe4GeTe2 [0.0] Fe4GeTe2は、その室温強磁性挙動と複雑な熱水相図によって大きな衝撃を印加する。
我々は,磁化方向の面内相互作用を解析し,基礎となる結晶対称性と簡単な軸方向の解析を行った。
計算されたFe原子のL端の磁気円二色度とX線吸収スペクトルに対する動的相関の影響は、既存の実験結果とよく比較できる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 19:13:52 GMT)
Dueling Deep Reinforcement Learning for Financial Time Series [0.0] 強化学習は動的環境における意思決定問題を解決するための強力なパラダイムとして登場した。
我々の焦点は、取引コストなどの現実的な制約を考慮しつつ、取引戦略を最適化できる訓練エージェントである。
この研究は、手数料のないシナリオにおけるモデルパフォーマンスを評価し、報酬力学に対するコスト感受性環境の影響を強調した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 20:30:34 GMT)
Divergence of Empirical Neural Tangent Kernel in Classification Problems [0.0] 分類問題では、完全連結ニューラルネットワーク(FCN)と残留ニューラルネットワーク(ResNet)は、ニューラルタンジェントカーネル(NTK)に基づくカーネルロジスティック回帰によって近似できない。
ネットワーク幅が大きくなるにつれて、NTKはトレーニングサンプル上で常にNTKに均一に収束しないことを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:30:21 GMT)
Deterministic Teleportation and Universal Computation Without Particle Exchange [0.0] 制御とターゲットの間に粒子を交換しない普遍的な制御相ゲートを提案する。
これにより、私には交換不要な量子計算の完全なレパートリーが可能になる。
このゲートとそれに基づくプロトコルは実験的に実現可能であることを示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:19:37 GMT)
Designing Child-Friendly AI Interfaces: Six Developmentally-Appropriate Design Insights from Analysing Disney Animation [0.0] 本稿では,子どもと子どものアニメーションの人工知能設計を橋渡しする。
子ども中心のAIインタフェース設計に移行可能な設計思想を6つ提示する。
今後の方向性としては、実証テスト、文化適応、参加型共同設計などがある。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:07:00 GMT)
Cybersecurity through Entropy Injection: A Paradigm Shift from Reactive Defense to Proactive Uncertainty [0.0] エントロピー注入は、予測不可能性を高め、システムのセキュリティを高めるために、意図的にランダム性をセキュリティメカニズムに注入する。
エントロピー注入は攻撃確率を著しく低下させる可能性を示し、一部の実装では90%以上削減され、性能への影響は最小限である。
エントロピー注入は、反応防御から積極的な不確実性管理へのパラダイムシフトを表していると結論付けている。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 23:08:57 GMT)
Can Vision-Language Models Understand and Interpret Dynamic Gestures from Pedestrians? Pilot Datasets and Exploration Towards Instructive Nonverbal Commands for Cooperative Autonomous Vehicles [0.0] 自動運転においては、交通ジェスチャー(TG)を正しく解釈することが不可欠である
本研究では,ゼロショット解釈における最先端ビジョン言語モデル(VLM)の機能について検討する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 05:04:25 GMT)
Can Large Language Models Become Policy Refinement Partners? Evidence from China's Social Security Studies [0.0] 本研究では,中国の社会保障問題に対する政策レコメンデーション作成における大規模言語モデル(LLM)の機能境界と性能特性について検討した。
LLMは、複雑な社会的ダイナミクスへの対処、利害のバランス、社会保障領域内の財政リスクの制御において、重大な制限に直面している。
DeepSeek-R1は、ポリシーレコメンデーション生成におけるすべての評価次元において、GPT-4oよりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 03:58:51 GMT)
Benchmarking Vision Language Models on German Factual Data [0.0] 本稿では,ドイツ語と英語の事実知識に基づくオープンウェイトVLMの分析を行う。
有名人や観光人にとって、VLMはドイツの画像コンテンツに対する視覚的認識が欠けているため、苦労している。
動物や植物にとって、テストされたモデルは、しばしば画像の内容を正しく識別するが、ドイツのランゲージでは失敗する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:55:24 GMT)
Bell-Mermin-Klyshko Inequalities and One-way Information Deficit of Dirac Fields in Noninertial Frames [0.0] 非慣性フレームにおけるディラック場のベル・メルミン・クリシュコ不等式と一方方向情報不足について検討する。
この研究は、相対論的量子情報におけるベル非局所性の存在と一方的情報不足の重要性を明らかにする。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 04:48:18 GMT)
Assessing how hyperparameters impact Large Language Models' sarcasm detection performance [0.0] サルカズムの検出は人間と機械の両方にとって難しい。
本研究は,OpenAIのGPTとMetaのLlama-2モデルにおいて,モデル特性が皮肉検出に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 23:10:49 GMT)
Assessing Tensor Network Quantum Emulators for Hamiltonian Simulation of Pharmaceutical Molecules: Challenges and Limitations in Drug Discovery Applications [0.0] 量子コンピューティングは、特に薬物発見において、計算化学シミュレーションの革命を約束する。
現在の量子ハードウェアはノイズとスケールによって制限されており、ブリッジ技術を必要とする。
本研究は、ハミルトンシミュレーションのためのテンソルネットワーク量子エミュレータの初期評価を提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:14:01 GMT)
An Attempt to Devise a Pairwise Ising-Type Maximum Entropy Model Integrated Cost Function for Optimizing SNN Deployment [0.0] スパイクニューラルネットワーク(SNN)は、生物学的ニューロンのスパイク動作をエミュレートし、通常、分散メモリニューロモルフィックハードウェアにデプロイされる。
We model SNN dynamics using a Ising-type pairwise interaction framework, bridging micro neuron interaction with macroscopic network behavior。
我々は、sPyNNakerニューロモルフィックプラットフォーム上に配置された2つのSNNに対するアプローチを評価した。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:31:27 GMT)
An Adaptive Dropout Approach for High-Dimensional Bayesian Optimization [0.0] 本稿では,AdaDropoutを提案する。
最先端の高次元ベイズ最適化手法と比較して優れた結果が得られる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:23:25 GMT)
Advancing the heralded photon-number-state characterization by understanding the interplay of experimental settings [0.0] 単モード双対ビームから生成される最大3個の光子を含む有理数状態の特性を理論的に探索する。
以上の結果から,高画質光子数状態を生成するための最適パラメータ領域が同定され,量子技術での利用を推し進める上で有用な知見が得られた。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 11:47:19 GMT)
Accelerating Multiscale Modeling with Hybrid Solvers: Coupling FEM and Neural Operators with Domain Decomposition [0.0] 本研究は、物理インフォームドDeepONetとFEMをドメイン分解を通じて統合する新しいハイブリッドフレームワークを紹介する。
提案するハイブリッドソルバは,サブドメインインターフェース間の解の連続性を維持し,メッシュの細かな要求を排除して計算コストを低減し,時間依存シミュレーションにおけるエラーの蓄積を軽減する。
この研究は、数値的手法とAI駆動のサロゲートのギャップを埋め、工学と科学の応用における高忠実性シミュレーションのためのスケーラブルな経路を提供する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 16:54:04 GMT)
A simple algorithm to reflect through eigenspaces of unitaries [0.0] 実装可能なユニタリの固有空間を反映する作業を考える。
同じサイズと深さのスケーリングを持つ単純なアルゴリズムを提案するが、すべての問題インスタンスに対して1つのアンシラ量子ビットしか必要としない。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:18:39 GMT)
A deep dive into the interplay of structured quantum peaked circuits and infinite temperature correlation functions [0.0] 本稿では,雑音量子デバイスに対する物理的に有意な観測機能として,無限温度相関関数 (ITCF) を提案する。
我々はGroverベースの振幅増幅または浅い構造化回路を用いて、意図的にバイアスされた量子状態を構築する。
本研究は,ランダム平均化による信号損失を軽減する,問題特異的な状態準備フレームワークについて述べる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:41:36 GMT)
A Unified Hardware Accelerator for Fast Fourier Transform and Number Theoretic Transform [0.0] Number Theoretic Transform (NTT) は、ポスト量子格子ベースの暗号において効率的な乗算を計算するのに欠かせないツールである。
512点複素FFTと256点NTTの両方をサポートする統一ハードウェアアクセラレータを実証する。
本実装は,FPGA上での最先端のML-KEM/ML-DSA NTTアクセラレータに匹敵する性能を実現する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:13:05 GMT)
A Rollout-Based Algorithm and Reward Function for Efficient Resource Allocation in Business Processes [0.0] 本稿では,ロールアウト型DRLアルゴリズムと報酬関数を提案し,その目的を直接最適化する。
提案アルゴリズムは,動作の異なる実行軌跡を評価することにより,ポリシーを反復的に改善する。
我々の報酬関数は平均サイクル時間を最小化する目的関数を直接分解する。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 14:46:58 GMT)
A Review of Design Concerns in Superconducting Quantum Circuits [0.0] 本稿では,量子情報応用のための超伝導回路デバイスの設計プロセスについて述べる。
デバイス上で望ましい実効ハミルトニアンを実装するために考慮すべき要因について論じる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 17:11:10 GMT)
A Quantum-Inspired Algorithm for Wave Simulation Using Tensor Networks [0.0] 等方性波動方程式 (IWE) を1次元, 2次元, 3次元でシミュレーションするアルゴリズムを提案する。
Networksと組み合わせたユニタリ回路の対角化により、ラップトップ上の1013ドルグリッドポイントの分解能を持つ波動方程式のシミュレーションが可能になる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 13:36:08 GMT)
A Neural Network Alternative to Tree-based Models [0.0] 我々のモデルであるSparse TABular NET や sTAB-Net がツリーベースモデルよりも効果的であることを示す。
SHAPのようなポストホックメソッドよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:28:35 GMT)
A Framework for the Private Governance of Frontier Artificial Intelligence [0.0] 本稿では,ハイブリッド・パブリック・プライベート・システムによるフロンティアAIシステムのガバナンスについて提案する。
政府によって認可され、監督される民間機関は、オプトインベースでフロンティアAIシステムの開発者に認証を提供する。
オプトインと引き換えに、フロンティアAI企業は、顧客のモデル誤用に対するトルト責任から保護を受ける。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 02:56:26 GMT)
$R$-matrix type parametrization of the Jost function for extracting the resonance parameters from scattering data [0.0] 非相対論的二分散乱データに適合し、量子共鳴のパラメータを抽出する新しい手法を提案する。
この方法は、よく知られた$R$-matrixアプローチと、Jost関数の半解析的表現に基づく解析を組み合わせる。
論文参考訳(メタデータ) (Tue, 15 Apr 2025 12:29:57 GMT)