Language Model Alignment in Multilingual Trolley Problems [138.1] Moral Machine実験に基づいて、$mathrmMultiTP$と呼ばれる100以上の言語でモラルジレンマヴィグネットの言語間コーパスを開発する。
分析では、19の異なるLSMと人間の判断を一致させ、種、性別、フィットネス、ステータス、年齢、関連する生活数という6つの道徳的側面の好みを捉える。
我々は、AIシステムにおける一様道徳的推論の仮定に挑戦し、言語間のアライメントの顕著なばらつきを発見した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:43:35 GMT)
Instrumental Variable Value Iteration for Causal Offline Reinforcement Learning [107.7] オフライン強化学習(RL)では、事前収集された観測データのみから最適なポリシーが学習される。
遷移力学が加法的非線形汎関数形式を持つようなマルコフ決定過程について検討する。
そこで本稿では,条件付きモーメント制限の原始的2次元再構成に基づく,証明可能なIVVIアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:26:38 GMT)
Moirai-MoE: Empowering Time Series Foundation Models with Sparse Mixture of Experts [103.7] 本稿では,単一入出力プロジェクション層を用いたMoirai-MoEを紹介するとともに,多種多様な時系列パターンのモデリングを専門家の疎結合に委ねる。
39のデータセットに対する大規模な実験は、既存の基盤モデルよりも、分配シナリオとゼロショットシナリオの両方において、Moirai-MoEの優位性を実証している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:01:11 GMT)
TALK-Act: Enhance Textural-Awareness for 2D Speaking Avatar Reenactment with Diffusion Model [100.4] 本研究では,SpeaKing Avatar Reenactment (TALK-Act) フレームワークのためのMotion-Enhanced Textural-Aware ModeLingを提案する。
我々のキーとなる考え方は、拡散モデルにおける明示的な動き誘導によるテクスチャ認知を高めることである。
本モデルは,30秒の個人データのみを用いて,高忠実度2次元アバター再現を実現する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:38:10 GMT)
Depth Any Video with Scalable Synthetic Data [98.4] 多様な合成環境からリアルタイムのビデオ深度データをキャプチャする,スケーラブルな合成データパイプラインを開発した。
我々は、生成的ビデオ拡散モデルの強力な先駆を生かして、実世界の動画を効果的に処理する。
我々のモデルは、空間的精度と時間的一貫性の観点から、過去のすべての生成深度モデルより優れている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:46 GMT)
AlphaPruning: Using Heavy-Tailed Self Regularization Theory for Improved Layer-wise Pruning of Large Language Models [94.8] そこで我々は,AlphaPruningを提案する。このAlphaPruningは,より理論的に原理化された方法で,水平方向の空間比を割り振る。
以上よりAlphaPruning prunes LLaMA-7B to 80% sparsity while maintain well perplexity, marking a first in the literature on LLMs。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:35:11 GMT)
GIFT-Eval: A Benchmark For General Time Series Forecasting Model Evaluation [90.5] GIFT-Evalは、多様なデータセットに対する評価を促進するための先駆的なベンチマークである。
GIFT-Evalには、144,000の時系列と17700万のデータポイントに28のデータセットが含まれている。
また、約2300億のデータポイントを含む非学習事前学習データセットも提供します。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:29:38 GMT)
Adapt-$\infty$: Scalable Lifelong Multimodal Instruction Tuning via Dynamic Data Selection [89.4] Adapt-$infty$は、Lifelong Instruction Tuningの新しいマルチウェイおよびアダプティブデータ選択アプローチである。
勾配に基づくサンプルベクトルをグループ化して擬似スキルクラスタを構築する。
セレクタエキスパートのプールから各スキルクラスタの最高のパフォーマンスデータセレクタを選択する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:48:09 GMT)
Derail Yourself: Multi-turn LLM Jailbreak Attack through Self-discovered Clues [89.0] 本研究では,マルチターンインタラクションにおけるLarge Language Models(LLM)の安全性の脆弱性を明らかにする。
本稿ではアクターネットワーク理論に触発された新しいマルチターン攻撃手法であるActorAttackを紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:41:49 GMT)
Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.3] FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:41:31 GMT)
AgentHarm: A Benchmark for Measuring Harmfulness of LLM Agents [85.0] 我々は、LDMベースのエージェントに対する攻撃と防御の評価を可能にするために、AgentHarmをリリースする。
ベンチマークには、110の明示的な悪意のあるエージェントタスクが含まれており、詐欺、サイバー犯罪、ハラスメントを含む11の有害カテゴリをカバーする。
一般的なジェイルブレイクテンプレートは、効果的にジェイルブレイクエージェントに適応することができ、これらのジェイルブレイクは一貫性があり悪意のあるマルチステップエージェントの動作を可能にし、モデル機能を保持します。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:28:08 GMT)
AgentHarm: A Benchmark for Measuring Harmfulness of LLM Agents [85.0] LLMエージェントは誤用された場合、より大きなリスクを引き起こすが、その堅牢性は未発見のままである。
我々は, LLMエージェント誤用の研究を容易にするために, AgentHarmと呼ばれる新しいベンチマークを提案する。
主要なLLMは、ジェイルブレイクなしで悪意のあるエージェント要求に驚くほど準拠している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:28:08 GMT)
Sitcom-Crafter: A Plot-Driven Human Motion Generation System in 3D Scenes [83.6] Sitcom-Crafterは3D空間における人間のモーション生成システムである。
機能生成モジュールの中心は、我々の新しい3Dシーン対応ヒューマン・ヒューマン・インタラクションモジュールである。
拡張モジュールは、コマンド生成のためのプロット理解、異なるモーションタイプのシームレスな統合のためのモーション同期を含む。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:56:19 GMT)
Twisting Lids Off with Two Hands [82.2] シミュレーションで訓練された政策を実世界へ効果的かつ効率的に移行する方法を示す。
具体的には,ボトル状物体の蓋を両手でねじる問題について考察する。
これは、バイマガル・マルチフィンガーハンドでそのような機能を実現する最初のsim-to-real RLシステムである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:02:45 GMT)
Mimetic Initialization Helps State Space Models Learn to Recall [81.4] 最近の研究で、Mambaのような状態空間モデルは、リコールベースのタスクではTransformerよりもかなり悪いことが示されている。
本研究は, 基本容量制約よりもトレーニングの難しさが原因で, コピー・リコール性能が低下する可能性について検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:17:46 GMT)
PCF-Lift: Panoptic Lifting by Probabilistic Contrastive Fusion [80.8] 我々は,PCF(Probabilis-tic Contrastive Fusion)に基づくPCF-Liftという新しいパイプラインを設計する。
私たちのPCFリフトは、ScanNetデータセットやMessy Roomデータセット(シーンレベルのPQが4.4%改善)など、広く使用されているベンチマークにおいて、最先端の手法よりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:06:59 GMT)
Physical Consistency Bridges Heterogeneous Data in Molecular Multi-Task Learning [79.8] 我々は、それらを接続する物理法則が存在する分子的タスクの専門性を生かし、整合性トレーニングアプローチを設計する。
より正確なエネルギーデータにより、構造予測の精度が向上することを示した。
また、整合性トレーニングは、構造予測を改善するために、力と非平衡構造データを直接活用できることがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:11:33 GMT)
Language Model Preference Evaluation with Multiple Weak Evaluators [78.5] GED(Preference Graph Ensemble and Denoise)は、複数のモデルベースの評価器を活用して嗜好グラフを構築する新しいアプローチである。
GEDは,モデルランキング,応答選択,モデルアライメントタスクにおいて,ベースライン手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:57:25 GMT)
Dense Video Object Captioning from Disjoint Supervision [77.5] 本稿では,高密度ビデオオブジェクトキャプションのための新しいタスクとモデルを提案する。
このタスクは、ビデオにおける空間的および時間的局所化を統一する。
我々は、この新しいタスクの強力なベースラインにおいて、我々のモデルがどのように改善されているかを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:28:11 GMT)
Extracting Training Data from Unconditional Diffusion Models [76.9] 拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。
本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。
提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:04:39 GMT)
Temperature-Centric Investigation of Speculative Decoding with Knowledge Distillation [76.6] 本稿では,復号化温度が投機的復号化効果に及ぼす影響を考察する。
我々はまず、高温での復号化の課題を強調し、一貫した温度設定でKDを実証することが治療である可能性を実証した。
これらの知見に基づいて,特に高温環境での投機的復号化の高速化を図った。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:17:45 GMT)
When Does Perceptual Alignment Benefit Vision Representations? [76.3] 視覚モデル表現と人間の知覚的判断との整合がユーザビリティに与える影響について検討する。
モデルと知覚的判断を一致させることで、多くの下流タスクで元のバックボーンを改善する表現が得られることがわかった。
その結果,人間の知覚的知識に関する帰納バイアスを視覚モデルに注入することは,より良い表現に寄与することが示唆された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:58 GMT)
A Stochastic Approach to Bi-Level Optimization for Hyperparameter Optimization and Meta Learning [74.8] 我々は,現代のディープラーニングにおいて広く普及している一般的なメタ学習問題に対処する。
これらの問題は、しばしばBi-Level Optimizations (BLO)として定式化される。
我々は,与えられたBLO問題を,内部損失関数が滑らかな分布となり,外損失が内部分布に対する期待損失となるようなii最適化に変換することにより,新たな視点を導入する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:10:06 GMT)
GlobalMamba: Global Image Serialization for Vision Mamba [73.5] 視覚マンバは、視覚トークンの数に対して線形複雑度で強い性能を示した。
既存のほとんどの方法はパッチベースの画像トークン化を採用し、因果処理のためにそれらを1Dシーケンスにフラット化する。
本稿では,グローバルな画像シリアライズ手法を提案し,その画像を因果トークンのシーケンスに変換する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:19:05 GMT)
Shadowcast: Stealthy Data Poisoning Attacks Against Vision-Language Models [73.4] この研究は、Vision-Language Modelsのデータ中毒攻撃に対する感受性を明らかにするための第一歩となる。
そこで我々はShadowcastを紹介した。これは、毒のサンプルが良心的な画像と視覚的に区別できない、ステルスなデータ中毒攻撃である。
そこで我々は,シャドウキャストが50件の毒のサンプルを用いて攻撃者の意図を効果的に達成していることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:17:34 GMT)
MMIE: Massive Multimodal Interleaved Comprehension Benchmark for Large Vision-Language Models [71.4] 我々は、LVLM(Large Vision-Language Models)において、インターリーブされたマルチモーダル理解と生成を評価するための大規模ベンチマークであるMMIEを紹介する。
MMIEは、数学、コーディング、物理学、文学、健康、芸術を含む3つのカテゴリ、12のフィールド、102のサブフィールドにまたがる20Kの厳密にキュレートされたマルチモーダルクエリで構成されている。
インターリーブされたインプットとアウトプットの両方をサポートし、多様な能力を評価するために、複数選択とオープンな質問フォーマットの混合を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:15:00 GMT)
High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity [69.3] 本稿では,拡散モデルにおける事前学習されたU-Netのポテンシャルを利用する拡散駆動セグメンテーションモデルDiffDISを提案する。
SDモデルに先立って、頑健な一般化機能とリッチで多目的な画像表現を活用することにより、高忠実で詳細な生成を保ちながら、推論時間を著しく短縮する。
DIS5Kデータセットの実験は、DiffDISの優位性を示し、合理化された推論プロセスを通じて最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:49:23 GMT)
LongMemEval: Benchmarking Chat Assistants on Long-Term Interactive Memory [69.0] 本稿では,チャットアシスタントの5つのコアメモリ能力を評価するためのベンチマークであるLongMemEvalを紹介する。
LongMemEvalは、既存の長期記憶システムにとって重要な課題である。
長期記憶設計を4つの設計選択に分割する統合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:44 GMT)
LVD-2M: A Long-take Video Dataset with Temporally Dense Captions [68.9] 高品質なロングテイクビデオを選択し、時間的に密度の高いキャプションを生成するためのパイプラインを新たに導入する。
具体的には、シーンカット、ダイナミック度、セマンティックレベルの品質を含む映像品質を定量的に評価する指標のセットを定義する。
LVD-2Mは,200万本のビデオからなり,それぞれ10秒以上をカバーし,時間的に密度の高いキャプションを付加する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:56 GMT)
V2M: Visual 2-Dimensional Mamba for Image Representation Learning [68.5] Mambaは、フレキシブルな設計と、1Dシーケンスを処理するための効率的なハードウェア性能のために、広く注目を集めている。
最近の研究では、マンバを2D画像をパッチに平らにすることで視覚領域に適用し、それらを1Dシークエンスとして扱うことが試みられている。
2次元空間における画像トークンを直接処理する完全解として,視覚的2次元マンバモデルを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:11:06 GMT)
Vision-guided and Mask-enhanced Adaptive Denoising for Prompt-based Image Editing [68.0] 視覚誘導・マスク強調適応編集法(ViMAEdit)を提案する。
まず,画像の埋め込みを明示的なガイダンスとして活用し,従来のテキストのプロンプトに基づく記述プロセスを強化することを提案する。
第2に,自己注意型反復編集領域接地戦略を考案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:41:37 GMT)
mGTE: Generalized Long-Context Text Representation and Reranking Models for Multilingual Text Retrieval [67.5] まず、RoPEとアンパディングで強化されたテキストエンコーダを導入し、ネイティブの8192-tokenコンテキストで事前トレーニングを行った。
そして、コントラスト学習によりハイブリッドTRMとクロスエンコーダ・リランカを構築する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:19:44 GMT)
Buffer of Thoughts: Thought-Augmented Reasoning with Large Language Models [65.5] Buffer of Thoughts (BoT) は、斬新で多目的な思考補足的推論手法である。
そこで我々はメタバッファーを提案し,一連の情報的高レベルの思考を記憶する。
各問題に対して、関連する思考タイミングを検索し、特定の推論構造で適応的にインスタンス化する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:12:27 GMT)
DrivingDojo Dataset: Advancing Interactive and Knowledge-Enriched Driving World Model [65.4] 私たちは、複雑な駆動ダイナミクスを備えたインタラクティブな世界モデルのトレーニング用に作られた最初のデータセットであるDrivingDojoを紹介します。
私たちのデータセットには、完全な運転操作、多様なマルチエージェント・インタープレイ、豊富なオープンワールド運転知識を備えたビデオクリップが含まれています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:19:23 GMT)
Denial-of-Service Poisoning Attacks against Large Language Models [64.8] LLMはDenial-of-Service(DoS)攻撃に対して脆弱で、スペルエラーや非意味的なプロンプトが[EOS]トークンを生成することなく、無限のアウトプットをトリガーする。
本研究では, LLM に対する毒素を用いた DoS 攻撃について提案し, 1 つの毒素を注入することで, 出力長の限界を破ることができることを示した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:39:31 GMT)
Just Say What You Want: Only-prompting Self-rewarding Online Preference Optimization [64.3] 現在の自己回帰アプローチは、差別者の判断能力に大きく依存している。
本稿では,判断能力に頼らずに嗜好データセットを生成する,新たな自己回帰型オンラインアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:43:37 GMT)
Combining Observational Data and Language for Species Range Estimation [63.7] 我々は,数百万の市民科学種の観察とウィキペディアのテキスト記述を組み合わせた新しいアプローチを提案する。
我々のフレームワークは、場所、種、テキスト記述を共通空間にマッピングし、テキスト記述からゼロショット範囲の推定を可能にする。
また,本手法は観測データと組み合わせることで,少ないデータでより正確な距離推定を行うことができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:22:55 GMT)
Deep Reinforcement Learning for Traveling Purchaser Problems [63.4] 旅行購入問題(TPP)は幅広いアプリケーションにおいて重要な最適化問題である。
本稿では,ルート構築と購入計画を個別に扱う,深層強化学習(DRL)に基づく新しいアプローチを提案する。
メタラーニング戦略を導入することで、大規模なTPPインスタンス上で安定してポリシーネットワークをトレーニングすることができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:33:42 GMT)
Bridging Local Details and Global Context in Text-Attributed Graphs [62.5] GraphBridgeは、コンテキストテキスト情報を活用することで、ローカルおよびグローバルな視点をブリッジするフレームワークである。
提案手法は最先端性能を実現し,グラフ対応トークン削減モジュールは効率を大幅に向上し,スケーラビリティの問題を解消する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:44:14 GMT)
Cavia: Camera-controllable Multi-view Video Diffusion with View-Integrated Attention [62.2] Caviaはカメラ制御可能なマルチビュービデオ生成のための新しいフレームワークである。
我々のフレームワークは、空間的および時間的注意モジュールを拡張し、視点と時間的一貫性を改善します。
Caviaは、ユーザーが物体の動きを取得しながら、異なるカメラの動きを特定できる最初の製品だ。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:46:32 GMT)
White-box Multimodal Jailbreaks Against Large Vision-Language Models [62.0] 本稿では,テキストと画像のモダリティを併用して,大規模視覚言語モデルにおけるより広範な脆弱性のスペクトルを利用する,より包括的戦略を提案する。
本手法は,テキスト入力がない場合に,逆画像プレフィックスをランダムノイズから最適化し,有害な応答を多様に生成することから始める。
様々な有害な指示に対する肯定的な反応を誘発する確率を最大化するために、対向テキスト接頭辞を、対向画像接頭辞と統合し、共最適化する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:15:23 GMT)
Agent-as-a-Judge: Evaluate Agents with Agents [61.3] 本稿ではエージェント・アズ・ア・ジャッジ(Agent-as-a-Judge)フレームワークを紹介し,エージェント・システムを用いてエージェント・システムの評価を行う。
これはLLM-as-a-Judgeフレームワークの有機的拡張であり、タスク解決プロセス全体の中間フィードバックを可能にするエージェント的特徴を取り入れている。
55のリアルな自動化AI開発タスクのベンチマークであるDevAIを紹介します。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:57:02 GMT)
Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization [60.2] 直接選好最適化(DPO)とその変種は、言語モデルと人間の選好の整合にますます利用されている。
以前の研究では、トレーニング中に好まれる反応の可能性が減少する傾向が見られた。
確率変位は破滅的になりうることを示し、確率質量を好ましくない反応から反対の意味の反応へとシフトさせる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:22:24 GMT)
Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization [60.2] 直接選好最適化(DPO)とその変種は、言語モデルと人間の選好の整合にますます利用されている。
以前の研究では、トレーニング中に好まれる反応の可能性が減少する傾向が見られた。
確率変位は破滅的になりうることを示し、確率質量を好ましくない反応から反対の意味の反応へとシフトさせる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:22:24 GMT)
Let Me Speak Freely? A Study on the Impact of Format Restrictions on Performance of Large Language Models [60.0] 本研究では,ジェネレーション空間の制約が推論やドメイン知識の理解など,LLMの能力に影響を及ぼすかどうかを検討する。
各種共通タスクにおける自由形式の応答を生成するよりも,構造化形式に順応することが制限された場合のLLMの性能を評価する。
より厳密なフォーマット制約は、一般的に推論タスクのパフォーマンス低下につながる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:57:29 GMT)
Let Me Speak Freely? A Study on the Impact of Format Restrictions on Performance of Large Language Models [60.0] 本研究では,ジェネレーション空間の制約が推論やドメイン知識の理解など,LLMの能力に影響を及ぼすかどうかを検討する。
各種共通タスクにおける自由形式の応答を生成するよりも,構造化形式に順応することが制限された場合のLLMの性能を評価する。
より厳密なフォーマット制約は、一般的に推論タスクのパフォーマンス低下につながる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:57:29 GMT)
On The Planning Abilities of OpenAI's o1 Models: Feasibility, Optimality, and Generalizability [59.7] 大規模言語モデル(LLM)は、複雑な推論タスクを実行する能力を示したが、計画におけるその有効性は未解明のままである。
本研究では,OpenAIのo1モデルの様々なベンチマークタスクにおける計画能力を評価する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:41:09 GMT)
On The Planning Abilities of OpenAI's o1 Models: Feasibility, Optimality, and Generalizability [59.7] さまざまなベンチマークタスクでOpenAIのo1モデルの計画能力を評価する。
その結果,o1-preview は GPT-4 よりもタスク制約に順応していることがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:41:09 GMT)
On The Planning Abilities of OpenAI's o1 Models: Feasibility, Optimality, and Generalizability [59.7] さまざまなベンチマークタスクでOpenAIのo1モデルの計画能力を評価する。
その結果,o1-preview は GPT-4 よりもタスク制約に順応していることがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:41:09 GMT)
On The Planning Abilities of OpenAI's o1 Models: Feasibility, Optimality, and Generalizability [59.7] さまざまなベンチマークタスクでOpenAIのo1モデルの計画能力を評価する。
その結果,o1-preview は GPT-4 よりもタスク制約に順応していることがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:41:09 GMT)
BookWorm: A Dataset for Character Description and Analysis [59.2] 本稿では,短い事実プロファイルを生成する文字記述と,詳細な解釈を提供する文字解析という2つのタスクを定義する。
本稿では,Gutenbergプロジェクトからの書籍と,人間による記述と分析のペアリングを行うBookWormデータセットを紹介する。
その結果,検索に基づくアプローチは両タスクにおいて階層的アプローチよりも優れていた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:55:58 GMT)
Character-aware audio-visual subtitling in context [59.0] 本稿では,テレビ番組における文字認識型音声視覚サブタイピングのための改良されたフレームワークを提案する。
提案手法は,音声認識,話者ダイアリゼーション,文字認識を統合し,音声と視覚の両方を活用する。
提案手法を12テレビ番組のデータセット上で検証し,既存手法と比較して話者ダイアリゼーションと文字認識精度に優れた性能を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:27:34 GMT)
Cross-Modal Few-Shot Learning: a Generative Transfer Learning Framework [58.4] 本稿では,複数モーダルからインスタンスを識別するクロスモーダルなFew-Shot Learningタスクを提案する。
本稿では,1つの段階からなる生成的転帰学習フレームワークを提案する。1つは豊富な一助データに対する学習を伴い,もう1つは新しいデータに適応するための転帰学習に焦点を当てる。
以上の結果から,GTLは4つの異なるマルチモーダルデータセット間の最先端手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:09:38 GMT)
Anomaly Detection by Context Contrasting [57.7] 異常検出は、標準から逸脱するサンプルを特定することに焦点を当てる。
近年の自己教師型学習の進歩は、この点において大きな可能性を秘めている。
我々はコンテキスト拡張を通じて学習するCon$を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:48:34 GMT)
Towards Generalist Robot Learning from Internet Video: A Survey [56.6] ディープラーニングを巨大なインターネットスクレイプデータセットにスケールすることで、自然言語処理と視覚的理解と生成において、極めて一般的な機能を実現している。
データはロボット工学で収集するには不十分で費用がかかる。これは、他の領域で観測される能力の一般性に合わせるために、ロボット学習が苦労しているのである。
Learning from Videos (LfV)メソッドは、従来のロボットデータを大規模なインターネットスクラッドビデオデータセットで拡張することで、このデータボトルネックに対処しようとしている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:41:06 GMT)
Condition-Aware Multimodal Fusion for Robust Semantic Perception of Driving Scenes [56.5] 本研究では,運転シーンのロバストな意味認識のための条件対応型マルチモーダル融合手法を提案する。
CAFuserは、RGBカメラ入力を用いて環境条件を分類し、複数のセンサの融合を誘導するコンディショントークンを生成する。
MUSESデータセットでは,マルチモーダルパノプティクスセグメンテーションの59.7 PQ,セマンティックセグメンテーションの78.2 mIoU,公開ベンチマークの1位にランクインした。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:56:20 GMT)
Thinking LLMs: General Instruction Following with Thought Generation [56.3] 本稿では,人体データの追加を使わずに,そのような思考能力を持つ既存LLMの訓練方法を提案する。
各命令に対して、思考候補は判断モデルを用いて応答のみを評価し、好みの最適化によって最適化される。
この手法がAlpacaEvalやArena-Hardに優れたパフォーマンスをもたらすことを示すとともに,マーケティング,健康,一般知識といった非合理的なカテゴリーの考え方から得られる利益を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:38:56 GMT)
GAIA: Rethinking Action Quality Assessment for AI-Generated Videos [56.0] アクション品質アセスメント(AQA)アルゴリズムは、主に実際の特定のシナリオからのアクションに焦点を当て、規範的なアクション機能で事前訓練されている。
我々は,新たな因果推論の観点から大規模主観評価を行うことにより,GAIAを構築した。
その結果、従来のAQA手法、最近のT2Vベンチマークにおけるアクション関連指標、メインストリームビデオ品質手法は、それぞれ0.454、0.191、0.519のSRCCで性能が良くないことがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:45:24 GMT)
Converging Paradigms: The Synergy of Symbolic and Connectionist AI in LLM-Empowered Autonomous Agents [55.6] コネクショニストと象徴的人工知能(AI)の収束を探求する記事
従来、コネクショナリストAIはニューラルネットワークにフォーカスし、シンボリックAIはシンボリック表現とロジックを強調していた。
大型言語モデル(LLM)の最近の進歩は、人間の言語をシンボルとして扱う際のコネクショナリストアーキテクチャの可能性を強調している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:55:26 GMT)
One Language, Many Gaps: Evaluating Dialect Fairness and Robustness of Large Language Models in Reasoning Tasks [55.4] 本稿では,大言語モデルの公平性と頑健性に関する最初の研究を標準的推論タスクにおける方言に提示する。
我々は、HumanEvalやGSM8Kといった7つの人気のあるベンチマークを書き換えるために、AAVEスピーカーを採用。
標準英語と比較して、これらの広く使われているモデルのほとんどは、AAVEのクエリに対して重大な脆さと不公平さを示している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:44:23 GMT)
Affinity-Graph-Guided Contractive Learning for Pretext-Free Medical Image Segmentation with Minimal Annotation [55.3] 本稿では,医用画像セグメンテーションのための親和性グラフ誘導半教師付きコントラスト学習フレームワーク(Semi-AGCL)を提案する。
このフレームワークは、まず、ロバストな初期特徴空間を提供する平均パッチエントロピー駆動のパッチ間サンプリング法を設計する。
完全アノテーションセットの10%に過ぎず, 完全注釈付きベースラインの精度にアプローチし, 限界偏差は2.52%に過ぎなかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:44:47 GMT)
AutoDAN-Turbo: A Lifelong Agent for Strategy Self-Exploration to Jailbreak LLMs [54.9] AutoDAN-Turboは、できるだけ多くのジェイルブレイク戦略をスクラッチから発見できるブラックボックスジェイルブレイク方式だ。
人間設計の戦略を統合することで、AutoDAN-TurboはGPT-4-1106-turboの攻撃成功率93.4を達成できる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:01:39 GMT)
AutoDAN-Turbo: A Lifelong Agent for Strategy Self-Exploration to Jailbreak LLMs [54.9] AutoDAN-Turboは、できるだけ多くのジェイルブレイク戦略をスクラッチから発見できるブラックボックスジェイルブレイク方式だ。
人間設計の戦略を統合することで、AutoDAN-TurboはGPT-4-1106-turboの攻撃成功率93.4を達成できる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:01:39 GMT)
Event3DGS: Event-Based 3D Gaussian Splatting for High-Speed Robot Egomotion [54.2] Event3DGSは高速移動下で高忠実度3D構造と外観を再構築することができる。
複数の合成および実世界のデータセットの実験は、既存のイベントベースの高密度な3Dシーン再構築フレームワークと比較して、Event3DGSの優位性を示している。
また, 構造的精度を損なうことなく, 外観の忠実度をより高められるように, フレームベースで数回の動特性測定を再構成プロセスに組み込むことも可能である。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:07:01 GMT)
Learning to Ground VLMs without Forgetting [54.0] 我々は、既存の画像や言語理解スキルを忘れずに、事前訓練されたビジュアル言語モデルに視覚的接地能力を持たせるフレームワークであるLynXを紹介する。
モデルを効果的に訓練するために、私たちはSCouTと呼ばれる高品質な合成データセットを生成します。
我々はLynXを複数のオブジェクト検出および視覚的グラウンド化データセット上で評価し、オブジェクト検出、ゼロショットローカライゼーション、グラウンドド推論において強い性能を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:35:47 GMT)
A Closer Look at Time Steps is Worthy of Triple Speed-Up for Diffusion Model Training [53.9] そこで本研究では,時間ステップの近さをベースとして,拡散モデル学習のための新しい高速化手法を提案する。
プラグアンドプレイでアーキテクチャに依存しないアプローチとして、SpeeDは、さまざまな拡散アーキテクチャ、データセット、タスクにわたる3回のアクセラレーションを一貫して達成している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:40:00 GMT)
SceneDreamer360: Text-Driven 3D-Consistent Scene Generation with Panoramic Gaussian Splatting [53.3] テキスト駆動型3D一貫性シーン生成モデルSceneDreamer360を提案する。
提案手法は,テキスト駆動パノラマ画像生成モデルを3次元シーン生成の先行モデルとして活用する。
SceneDreamer360はそのパノラマ画像生成と3DGSにより、より高品質で空間的に整合性があり、視覚的に魅力的な3Dシーンを任意のテキストプロンプトから生成できることを示した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:43:38 GMT)
ET-Former: Efficient Triplane Deformable Attention for 3D Semantic Scene Completion From Monocular Camera [53.2] 本稿では,単一単眼カメラを用いたセマンティックシーン補完のための新しいエンドツーエンドアルゴリズムET-Formerを紹介する。
本手法は,単一のRGB観測からセマンティック占有マップを生成すると同時に,セマンティック予測のための不確実性推定を行う。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:14:49 GMT)
KNN Transformer with Pyramid Prompts for Few-Shot Learning [52.7] Few-Shot Learningはラベル付きデータで新しいクラスを認識することを目的としている。
近年の研究では、視覚的特徴を調節するためのテキストプロンプトを用いたまれなサンプルの課題に対処しようと試みている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:39:30 GMT)
TACT: Advancing Complex Aggregative Reasoning with Information Extraction Tools [51.6] 大規模言語モデル(LLM)は、テキスト間の情報の集約を必要とするクエリではよく機能しないことが多い。
TACTには、1つ以上のテキストに散らばる縫合情報を要求する難しい命令が含まれている。
既存のテキストと関連するテーブルのデータセットを活用することで、このデータセットを構築します。
現代のLLMはいずれも,このデータセットでは性能が悪く,精度が38%以下であることが実証された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:19:57 GMT)
Improving Non-autoregressive Translation Quality with Pretrained Language Model, Embedding Distillation and Upsampling Strategy for CTC [51.3] 本稿では,非自己回帰翻訳(NAT)モデルの翻訳品質を向上させるための一連の革新的な技術を紹介する。
我々は,NATモデルを効果的に訓練するために,CTCの損失を抑えたPMLM(Pretrained Multilingual Language Models)を提案する。
自動回帰モデルと比較して16.35倍の速度向上を示した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:50:13 GMT)
FLARE: Faithful Logic-Aided Reasoning and Exploration [51.0] textbfFaithful textbfLogic-textbfAided textbfReasoning and textbfExploration (textbfours)を導入する。
提案手法は,生成したコードに対する推論プロセスの忠実度を計算し,外部の解法に頼らずにマルチホップ探索のステップを解析する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:39:11 GMT)
Provable Robustness of (Graph) Neural Networks Against Data Poisoning and Backdoor Attacks [50.9] グラフニューラルネットワーク(GNN)は、特定のグラフのノード特徴をターゲットとして、バックドアを含む有毒な攻撃に対して認証する。
コンボリューションベースのGNNとPageRankベースのGNNの最悪の動作におけるグラフ構造の役割とその接続性に関する基本的な知見を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:23:58 GMT)
Forecasting with Hyper-Trees [50.7] Hyper-Treesは時系列モデルのパラメータを学習するために設計されている。
対象とする時系列モデルのパラメータを特徴に関連付けることで、Hyper-Treesはパラメータ非定常性の問題にも対処する。
この新しいアプローチでは、木はまず入力特徴から情報表現を生成し、浅いネットワークはターゲットモデルパラメータにマップする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:26:22 GMT)
Is Parameter Collision Hindering Continual Learning in LLMs? [50.6] 大規模言語モデル(LLM)は、複数のタスクを逐次学習する際に破滅的な忘れに悩まされることが多い。
CL問題に対処する上で,非衝突パラメータの構築はより重要な相互依存因子であることを示す。
低衝突速度を利用してLCMのCLを向上する単純なアプローチである非衝突低ランク適応(N-LoRA)を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:54:11 GMT)
ForgeryGPT: Multimodal Large Language Model For Explainable Image Forgery Detection and Localization [50.0] ForgeryGPTはImage Forgery DetectionとLocalizationタスクを進化させる新しいフレームワークである。
多様な言語的特徴空間からの偽画像の高次相関をキャプチャする。
新たにカスタマイズされたLarge Language Model (LLM)アーキテクチャを通じて、説明可能な生成と対話を可能にする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:56:51 GMT)
MEGA-Bench: Scaling Multimodal Evaluation to over 500 Real-World Tasks [49.6] MEGA-Benchは500以上の実世界のタスクにマルチモーダル評価をスケールする評価スイートである。
我々は16のエキスパートアノテータから8000以上のサンプルを含む505のタスクを収集し、マルチモーダルタスク空間を広範囲にカバーした。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:42:12 GMT)
ConML: A Universal Meta-Learning Framework with Task-Level Contrastive Learning [49.4] ConMLは、さまざまなメタ学習アルゴリズムに適用可能な、普遍的なメタ学習フレームワークである。
我々は、ConMLが最適化ベース、メートル法ベース、およびアモータイズベースメタ学習アルゴリズムとシームレスに統合できることを実証した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:06:31 GMT)
ConML: A Universal Meta-Learning Framework with Task-Level Contrastive Learning [49.4] ConMLは、さまざまなメタ学習アルゴリズムに適用可能な、普遍的なメタ学習フレームワークである。
我々は、ConMLが最適化ベース、メートル法ベース、およびアモータイズベースメタ学習アルゴリズムとシームレスに統合できることを実証した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:06:31 GMT)
Inertial Confinement Fusion Forecasting via Large Language Models [48.8] 本研究では,従来の貯水池計算パラダイムとLarge Language Models(LLM)の新たな統合である$textbfLPI-LLM$を紹介する。
我々は、$textitLLM-anchored Reservoir$, augmented with a $textitFusion-specific Prompt$を提案する。
また、最初の$textttLPI$ベンチマークである$textbfLPI4AI$も提示します。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:47:47 GMT)
FC-KAN: Function Combinations in Kolmogorov-Arnold Networks [48.4] FC-KANはKAN(Kolmogorov-Arnold Network)の一種で、低次元データ上で一般的な数学的関数を利用する。
FC-KANとマルチ層パーセプトロンネットワーク(MLP)と,BSRBF-KAN,EfficientKAN,FastKAN,FasterKANなどの既存のKANを比較した。
B-スプラインからの出力とガウス差分(DoG)を2次関数の形で組み合わせたFC-KANの変種は、5つの独立トレーニングランの平均で他のモデルよりも優れていた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:07:40 GMT)
The Ingredients for Robotic Diffusion Transformers [47.6] 我々は,高容量拡散変圧器政策の鍵となる設計決定を同定し,研究し,改善する。
結果として得られるモデルは、複数のロボットエンボディメント上の多様なタスクを効率的に解決することができる。
当社のポリシーは,高度にマルチモーダルな言語アノテートされたALOHA実証データを用いた10時間トレーニングによるスケーリング性能の向上を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:02:54 GMT)
FedNE: Surrogate-Assisted Federated Neighbor Embedding for Dimensionality Reduction [47.3] textscFedNEは、textscFedAvgフレームワークと対照的なNEテクニックを統合する新しいアプローチである。
我々は、合成データセットと実世界のデータセットの両方について包括的な実験を行う。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:55:57 GMT)
Sharpness-Aware Minimization Efficiently Selects Flatter Minima Late in Training [47.3] Sharpness-Aware Minimization (SAM) はトレーニングの遅滞時に効率よくフラットなミニマを選択する。
SAMの訓練の終わりに応用されたいくつかのエポックでさえ、完全なSAMトレーニングとほぼ同じ一般化と解のシャープネスをもたらす。
我々は、最終解の物性を形作る上で、最終相で選択した最適化法がより重要であると推測する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:56:42 GMT)
From Crowdsourced Data to High-Quality Benchmarks: Arena-Hard and BenchBuilder Pipeline [47.2] BenchBuilderは、大規模なクラウドソースデータセットから高品質でオープンなプロンプトをキュレートする自動パイプラインである。
BenchBuilderがキュレートした500の挑戦的なプロンプトからなるベンチマークであるArena-Hard-Autoをリリースしました。
我々の研究は、広範囲なデータから自動ベンチマークをスケーラブルにキュレーションするための新しいフレームワークを定めています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:11:58 GMT)
SecCodePLT: A Unified Platform for Evaluating the Security of Code GenAI [47.1] 我々はGenAIのリスクをコードする統合的かつ包括的な評価プラットフォームSecCodePLTを開発した。
安全でないコードには、専門家と自動生成を組み合わせたデータ生成のための新しい方法論を導入する。
サイバー攻撃支援のために、我々はモデルに実際の攻撃を引き起こすよう促すサンプルと、我々の環境における動的な指標を構築した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:17:22 GMT)
Inference Scaling Laws: An Empirical Analysis of Compute-Optimal Inference for Problem-Solving with Language Models [47.0] 大規模言語モデル(LLM)学習における推論スケーリング法則と計算最適推論について検討する。
計算最適推論手法の理解と設計に向けた第一歩として,推論戦略のコストパフォーマンストレードオフについて検討した。
以上の結果から,Llemma-7Bのようなより小さなモデルでは,計算予算が同じであれば,より大きなモデルよりも優れた性能が得られることが示唆された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:41:35 GMT)
How to Build the Virtual Cell with Artificial Intelligence: Priorities and Opportunities [46.7] 仮想セル構築にAIの進歩を活用するというビジョンを提案する。
我々は、生物の普遍的な表現を含む、そのようなAI仮想セルの望ましい能力について議論する。
我々は、AI仮想細胞が新しい薬物標的を特定し、摂動に対する細胞反応を予測し、スケール仮説を探索する未来を想像する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:18:07 GMT)
Impact of Large Language Model Assistance on Patients Reading Clinical Notes: A Mixed-Methods Study [46.6] 臨床記録をより読みやすくするために,大言語モデル(LLM)を用いた患者対応ツールを開発した。
乳がんの既往歴のある患者から寄贈された臨床記録と臨床医からの合成ノートを用いて,本ツールの試験を行った。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:49:48 GMT)
Edit-Your-Motion: Space-Time Diffusion Decoupling Learning for Video Motion Editing [46.6] そこで本研究では,テキストとビデオのペアを1つだけ必要とするような編集-Your-Motionというワンショットビデオ編集手法を提案する。
具体的には、時空間拡散モデルにおける運動時間的特徴を分離するために、詳細なPromptGuided Learning Strategyを設計する。
Edit-Your-Motionを使えば、ユーザーはソースビデオの中のオブジェクトの動きを編集して、よりエキサイティングで多様なビデオを生成することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:43:09 GMT)
Human-centered NLP Fact-checking: Co-Designing with Fact-checkers using Matchmaking for AI [46.4] 我々は、ファクトチェッカー、デザイナ、NLP研究者との共同設計手法であるMatchmaking for AIを調査し、技術によってファクトチェッカーが対処すべきことを特定する。
22人のプロのファクトチェッカーによる共同設計セッションでは、"北の星"を提供する11のアイデアセットが得られました。
私たちの研究は、人間中心の事実チェック研究と実践とAIの共同設計研究の両方に、新たな洞察を与えています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:04:55 GMT)
Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care [46.2] 我々は、より信頼性の高いクリティカルケアポリシーを得るための深いQ-ラーニングアプローチを導入する。
本手法を,集中治療室のシミュレーション環境と実際の健康記録を用いて,オフライン・オフ・セッティングで評価した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:56:15 GMT)
Generative inpainting of incomplete Euclidean distance matrices of trajectories generated by a fractional Brownian motion [46.1] フラクショナルブラウン運動(fBm)はランダム性と強いスケールフリーの相関を特徴とする。
本稿では, 劣化した画像の特定のデータセット上で, 拡散に基づく塗布方法の動物園について検討する。
条件拡散生成は、異なるメモリ状態におけるfBmパスの組込み相関を容易に再現する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:11:59 GMT)
Unified Representation of Genomic and Biomedical Concepts through Multi-Task, Multi-Source Contrastive Learning [45.7] 言語モデル(genEREL)を用いたジェノミクス表現について紹介する。
GENERELは遺伝学と生物医学の知識基盤を橋渡しするために設計されたフレームワークである。
本実験は,SNPと臨床概念のニュアンス関係を効果的に把握するgenERELの能力を実証するものである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:19:52 GMT)
VideoTetris: Towards Compositional Text-to-Video Generation [45.4] VideoTetrisは、合成T2V生成を可能にするフレームワークである。
我々は, VideoTetrisがT2V生成において, 印象的な質的, 定量的な結果をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:20:01 GMT)
Bandwidth-tunable Telecom Single Photons Enabled by Low-noise Optomechanical Transduction [45.4] 単一光子源は創発的量子技術にとって基本的な重要性である。
ナノ構造を持つ光学結晶は、単一光子生成のための魅力的なプラットフォームを提供する。
これまでのところ、光吸収加熱はこれらのシステムが実用用途で広く使われるのを妨げてきた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:00:00 GMT)
TMGBench: A Systematic Game Benchmark for Evaluating Strategic Reasoning Abilities of LLMs [45.1] 我々は,ゲームタイプの包括的カバレッジ,新しいシナリオ,柔軟な組織に関するベンチマークであるTMGBenchを提案する。
具体的には、古典ゲームとして構築された2x2ゲームのロビンソン・ゴーフォース位相によって要約された144種類のゲームタイプをすべて組み込む。
トピックガイダンスやヒューマンインスペクションを通じて、多種多様な高品質なシナリオを作成するために、合成データ生成も採用しています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:15:34 GMT)
Nonlocality under Jaynes-Cummings evolution: beyond pseudospin operators [45.0] 我々は、Jaynes-Cummings Hamiltonianにより動的に決定されるハイブリッドシナリオにおける(ベル)非局所性の生成と進化を再考する。
qubit-qudit系におけるベルの最適違反に関する最近の結果は、非局所性が以前推定されたよりもはるかに大きいことを示している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:01:23 GMT)
SpeGCL: Self-supervised Graph Spectrum Contrastive Learning without Positive Samples [44.3] グラフコントラスト学習(GCL)は、入力データのノイズやゆらぎの管理に優れており、様々な分野で人気がある。
既存のGCL法は主にノードの特徴表現の時間領域(低周波情報)に焦点を当てている。
正のサンプルを持たない新しいスペクトルGCLフレームワークSpeGCLを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:39:38 GMT)
The RealHumanEval: Evaluating Large Language Models' Abilities to Support Programmers [44.3] 既存のベンチマークや、より好ましいLCM応答が、LLMでコーディングする際のプログラマの生産性に変換されるかどうかを調査する。
プログラマを支援するための LLM の能力を測定するための Web インターフェースである RealHumanEval を紹介する。
人間をループに組み込まない静的なベンチマークにもかかわらず、ベンチマークパフォーマンスの改善は、プログラマの生産性を向上させる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:06:22 GMT)
Exploiting Exogenous Structure for Sample-Efficient Reinforcement Learning [44.2] 本研究では,Exo-MDPsとして知られる構造化マルコフ決定過程(MDPs)のクラスについて検討する。
Exo-MDPは、在庫管理、金融、電力システム、ライドシェアリングなど様々な応用の自然なモデルである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:46:09 GMT)
Exploiting Exogenous Structure for Sample-Efficient Reinforcement Learning [44.2] 本研究では,Exo-MDPsとして知られる構造化マルコフ決定過程(MDPs)のクラスについて検討する。
Exo-MDPは、在庫管理、ポートフォリオ管理、電力システム、ライドシェアリングなど、様々なアプリケーションに自然なモデルを提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:46:09 GMT)
JOOCI: a Framework for Learning Comprehensive Speech Representations [43.5] 音声中の他の情報とコンテンツ情報を協調的に最適化するエンドツーエンドの音声表現学習フレームワークを提案する。
以上の結果から,JOOCIは類似サイズのSOTAモデルよりも一貫して優れていることがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:59:59 GMT)
TopoFR: A Closer Look at Topology Alignment on Face Recognition [42.9] PTSAと呼ばれるトポロジカル構造アライメント戦略とSDEという硬質試料マイニング戦略を利用する新しいFRモデルであるTopoFRを提案する。
PTSAは永続ホモロジーを用いて入力空間と潜在空間の位相構造を整列し、構造情報を効果的に保存し、FRモデルの一般化性能を向上させる。
一般的な顔のベンチマーク実験の結果は、最先端の手法よりもTopoFRの方が優れていることを示している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:58:30 GMT)
Animate-X: Universal Character Image Animation with Enhanced Motion Representation [42.7] Animate-X は LDM をベースとした汎用アニメーションフレームワークであり、人為的文字を含む様々な文字タイプに対応している。
我々は、暗黙的かつ明示的な方法で、運転映像から包括的な動きパターンをキャプチャするPose Indicatorを紹介した。
また,アニメーション画像におけるAnimate-Xの性能を評価するために,新しいアニメーション擬人化ベンチマークを導入する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:06:55 GMT)
Hi-Mamba: Hierarchical Mamba for Efficient Image Super-Resolution [42.3] 状態空間モデル(SSM)は、線形複雑性を伴う長距離依存性をモデル化する上で、強力な表現能力を示している。
画像超解像(SR)のための新しい階層型マンバネットワーク、すなわちHi-Mambaを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:15:04 GMT)
RealCompo: Balancing Realism and Compositionality Improves Text-to-Image Diffusion Models [42.2] RealCompoは、新しいトレーニングフリーで、移行フレンドリーなテキスト・ツー・イメージ生成フレームワークである。
復調過程における2つのモデルの強みのバランスをとるために,直感的で斬新なバランサを提案する。
我々のRealCompoは、幅広い空間認識画像拡散モデルとスタイル化された拡散モデルでシームレスに拡張できる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:27:37 GMT)
Semantic Image Inversion and Editing using Rectified Stochastic Differential Equations [41.9] 本稿では, (i) 逆転と (ii) 修正フローモデル(Flux など)を用いた実画像の編集という2つの重要な課題に対処する。
本手法は,ゼロショット・インバージョン・編集における最先端性能を実現し,ストローク・ツー・イメージ合成やセマンティック・イメージ編集における先行技術よりも優れていた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:56:24 GMT)
Adapting Large Multimodal Models to Distribution Shifts: The Role of In-Context Learning [41.6] 大規模マルチモーダルモデル(LMM)は汎用アシスタントとして機能し、異なる分布に対して非常に堅牢である。
それにもかかわらず、特に医療のような専門分野において、ドメイン固有の適応は依然として必要である。
本研究は,LMMの適応性向上のための効果的な代替手段として,文脈内学習(ICL)について検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:27:44 GMT)
Generalizable Humanoid Manipulation with Improved 3D Diffusion Policies [41.2] Improved 3D Diffusion Policy (iDP3)は、エゴセントリックな3D視覚表現を活用することで制約を取り除く新しい3Dビジュモータポリシーである。
iDP3は,多種多様な現実のシナリオにおいて,実物大のヒューマノイドロボットが自律的にスキルを発揮できることを実証した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:00 GMT)
RoRA-VLM: Robust Retrieval-Augmented Vision Language Models [41.1] RORA-VLMは、視覚言語モデルに特化して設計された、新規で堅牢な検索拡張フレームワークである。
提案手法の有効性とロバスト性を,広く採用されている3つのベンチマークデータセット上で検証する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:31:13 GMT)
RoRA-VLM: Robust Retrieval-Augmented Vision Language Models [41.1] RORA-VLMは、視覚言語モデルに特化して設計された、新規で堅牢な検索拡張フレームワークである。
提案手法の有効性とロバスト性を,広く採用されている3つのベンチマークデータセット上で検証する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:31:13 GMT)
Benefiting from Quantum? A Comparative Study of Q-Seg, Quantum-Inspired Techniques, and U-Net for Crack Segmentation [41.0] 本研究は, クラックセグメンテーションの古典モデルと比較して, 量子および量子に着想を得た手法の性能を評価する。
以上の結果から,量子インスパイアされた量子法と量子法は,特に複雑なクラックパターンに対して,画像セグメンテーションに有望な代替手段を提供し,近未来の応用に応用できることが示唆された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:51:59 GMT)
Multi-step Problem Solving Through a Verifier: An Empirical Analysis on Model-induced Process Supervision [41.0] データキュレーションを自動化する新しい手法であるMiPS(Model-induced Process Supervision)を導入する。
MiPSは、推論モデルを通じてこの解の完了をサンプリングし、正しい完了の比率として定義される精度を得ることによって中間段階を注釈する。
提案手法は,算数および符号化タスクにおける PaLM 2 の性能を著しく向上させる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:33:00 GMT)
MagicEraser: Erasing Any Objects via Semantics-Aware Control [40.7] オブジェクト消去タスクに適した拡散モデルに基づくフレームワークであるMagicEraserを紹介する。
MagicEraserは、望ましくないアーティファクトを緩和しながら、コンテンツ生成の微細かつ効果的な制御を実現する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:03:14 GMT)
Active Learning of Deep Neural Networks via Gradient-Free Cutting Planes [40.7] 本研究では,任意の深さのReLULUネットワークに対して,斬新な切削平面法による能動的学習手法について検討する。
非線形収束にもかかわらず、これらのアルゴリズムはディープニューラルネットワークに拡張可能であることを実証する。
提案手法は,データ実験と実データセットの分類の両方を通じて,一般的な深層学習ベースラインに対する有効性を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:37:50 GMT)
Active Learning of Deep Neural Networks via Gradient-Free Cutting Planes [40.7] 本研究では,任意の深さのReLULUネットワークに対して,斬新な切削平面法による能動的学習手法について検討する。
非線形収束にもかかわらず、これらのアルゴリズムはディープニューラルネットワークに拡張可能であることを実証する。
提案手法は,データ実験と実データセットの分類の両方を通じて,一般的な深層学習ベースラインに対する有効性を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:37:50 GMT)
Active Learning of Deep Neural Networks via Gradient-Free Cutting Planes [40.7] 本研究では,任意の深さのReLULUネットワークに対して,斬新な切削平面法による能動的学習手法について検討する。
非線形収束にもかかわらず、これらのアルゴリズムはディープニューラルネットワークに拡張可能であることを実証する。
提案手法は,データ実験と実データセットの分類の両方を通じて,一般的な深層学習ベースラインに対する有効性を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:37:50 GMT)
EMS-SD: Efficient Multi-sample Speculative Decoding for Accelerating Large Language Models [40.7] Vanillaメソッドは、サンプル間で新しいトークンの数が一貫していることを保証するために、パディングトークンを追加する。
本稿では,メモリや計算のオーバーヘッドを増大させることなく,異なるサンプルで受け入れられる不整合トークンの問題を解決する手法を提案する。
提案手法は, パディングトークンを追加することなく, 異なるサンプルの予測トークンが矛盾する状況に対処できる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:55:33 GMT)
Tighter Privacy Auditing of DP-SGD in the Hidden State Threat Model [40.5] 本研究では,攻撃者が最終モデルにのみアクセスでき,中間更新の可視性のない脅威モデルに焦点を当てる。
実験の結果,本手法は隠蔽状態モデル監査における従来の試みより一貫して優れていたことがわかった。
我々の結果は、この脅威モデル内で達成可能なプライバシー保証の理解を促進する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:45:52 GMT)
Multi-Agent Collaborative Data Selection for Efficient LLM Pretraining [40.2] 本稿では,大規模言語モデル(LLM)事前学習のための新しいマルチエージェント協調データ選択機構を提案する。
このフレームワークでは、各データ選択メソッドが独立したエージェントとして機能し、エージェントコンソールは、すべてのエージェントからの情報を動的に統合するように設計されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:22:30 GMT)
Reuse Your Rewards: Reward Model Transfer for Zero-Shot Cross-Lingual Alignment [39.9] ゼロショット・クロスランガルアライメントのための簡単なアプローチを評価する。
言語間の整列モデルは、非整列モデルよりも人間の方が好まれる。
異なる言語報酬モデルでは、同言語報酬モデルよりも優れた整列モデルが得られることがある。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:58:05 GMT)
Deep Linear Probe Generators for Weight Space Learning [39.9] プローブは、学習した入力(プローブ)のセットをモデルに渡すことでモデルを表し、対応する出力の上に予測器を訓練する。
ProbeGenは、深い線形アーキテクチャを備えた共有ジェネレータモジュールを追加し、構造化プローブに対する誘導バイアスを提供する。
ProbeGenは最先端よりも大幅にパフォーマンスが良く、非常に効率的で、他のトップアプローチの30~1000倍のFLOPを必要とする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:41 GMT)
Recurrent Action Transformer with Memory [39.6] 本稿では,情報保持を規制するリカレントメモリ機構を組み込んだ新しいモデルアーキテクチャを提案する。
メモリ集約環境(ViZDoom-Two-Colors, T-Maze, Memory Maze, Minigrid-Memory)、古典的アタリゲーム、MuJoCo制御環境について実験を行った。
その結果、メモリの使用は、古典的な環境における結果の維持や改善をしながら、メモリ集約環境におけるパフォーマンスを著しく向上させることができることがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:33:48 GMT)
Audio-based Kinship Verification Using Age Domain Conversion [39.5] このタスクの主な課題は、異なる個人からのサンプル間の年齢差から生じる。
我々は、最適化されたCycleGAN-VC3ネットワークを利用して、年齢変換を行い、ドメイン内オーディオを生成する。
生成されたオーディオデータセットを使用して、さまざまな機能を抽出し、それをメトリック学習アーキテクチャに入力し、親族性を検証する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:08:57 GMT)
Hopping Too Late: Exploring the Limitations of Large Language Models on Multi-Hop Queries [39.4] 大規模言語モデル(LLM)が複雑な多段階問題をいかに解決するかを考察する。
潜在ステップが内部でどのように計算されるかを理解することは、全体的な計算を理解する上で鍵となる。
後層からの隠れ表現を以前の層にパッチバックする「バックパッチ」解析手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:55:12 GMT)
When Attention Sink Emerges in Language Models: An Empirical View [39.4] 言語モデル(LM)は、意味的に重要でない場合でも、最初のトークンに注意を向ける。
この現象は、ストリーミング/ロングコンテキスト生成、KVキャッシュ最適化、推論アクセラレーション、モデル量子化などのアプリケーションで広く採用されている。
我々はまず、小さなモデルであっても様々な入力を持つLMにおいて、注意シンクが普遍的に存在することを実証した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:50:28 GMT)
MAIR: A Massive Benchmark for Evaluating Instructed Retrieval [39.2] 最近の情報検索(IR)モデルは、大量のデータセットとタスクに基づいて事前訓練され、命令調整される。
MAIR(Massive Instructed Retrieval Benchmark)は6つの領域にわたる126の異なるIRタスクを含む異種IRベンチマークである。
我々は、最先端の命令調整型テキスト埋め込みモデルと再分類モデルのベンチマークを行う。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:26:51 GMT)
Multi-Agent Collaborative Data Selection for Efficient LLM Pretraining [39.2] 本稿では,大規模言語モデル(LLM)事前学習のための新しいマルチエージェント協調データ選択機構を提案する。
このフレームワークでは、各データ選択メソッドが独立したエージェントとして機能し、エージェントコンソールは、すべてのエージェントからの情報を動的に統合するように設計されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:22:30 GMT)
Designing a Dashboard for Transparency and Control of Conversational AI [39.0] エンド・ツー・エンドのプロトタイプ・トゥ・エンド・プロトタイプ・コネクテッド・インタプリタビリティ技術とユーザ・エクスペリエンス・デザインを提案する。
以上の結果から,利用者は内的状態の認識に感謝し,偏りのある行動に曝露し,コントロール意識を高めたことが示唆された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:46:28 GMT)
VideoScore: Building Automatic Metrics to Simulate Fine-grained Human Feedback for Video Generation [38.8] 我々は、37.6K以上の合成ビデオで人為的なマルチアスペクトスコアを含む最初の大規模データセットであるVideoFeedbackをリリースした。
実験では、VideoScoreと人間の間のSpearman相関が、VideoFeedback-testで77.1に達することが示され、以前のベストメトリクスを約50ポイント上回った。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:08:53 GMT)
Bridging the Sim-to-Real Gap from the Information Bottleneck Perspective [38.8] ヒストリカル・インフォメーション・ボトルネック(HIB)と呼ばれる新しい特権知識蒸留法を提案する。
HIBは、変化可能な動的情報を取得することによって、歴史的軌道から特権的な知識表現を学習する。
シミュレーションと実世界の両方のタスクに関する実証実験は、HIBが従来の方法と比較して一般化性を向上させることを示した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:23:30 GMT)
Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models [38.8] ディープ圧縮オートエンコーダ (DC-AE) は高分解能拡散モデルの高速化を目的とした新しいオートエンコーダモデルである。
遅延拡散モデルへの直流-AEの適用により,精度低下のない大幅な高速化を実現した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:15:07 GMT)
CtRL-Sim: Reactive and Controllable Driving Agents with Offline Reinforcement Learning [38.6] CtRL-Simは、リターン条件付きオフライン強化学習(RL)を利用して、リアクティブで制御可能なトラフィックエージェントを効率的に生成する手法である。
CtRL-Simは,エージェントの挙動を詳細に制御しながら,現実的な安全クリティカルシナリオを生成可能であることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:13:36 GMT)
LG-CAV: Train Any Concept Activation Vector with Language Guidance [38.6] 概念アクティベーションベクター(CAV)は、特定の概念にモデル予測をエレガントにもたらすことによって、説明可能なAIに幅広い研究関心を集めている。
本研究では,言語誘導型CAV (LG-CAV) を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:08:48 GMT)
Enhancing Dense Retrievers' Robustness with Group-level Reweighting [38.5] WebDROは、Webグラフデータをクラスタリングし、グループ重み付けを最適化する効率的なアプローチである。
群分散ロバスト最適化を用いて、アンカー文書対の異なるクラスタ間で重みを補正する。
MARCO と BEIR を用いた実験により,教師なしトレーニングおよび微調整設定における検索性能を効果的に向上できることが実証された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:45:35 GMT)
Quantum-Secured Data Centre Interconnect in a field environment [38.5] 量子鍵分布(QKD)は、高い準備性レベルで確立された量子技術である。
本稿では,商用データセンター環境におけるQKDフィールドトライアルの実施について述べる。
達成された平均秘密鍵レートは2.392kbps、平均量子ビットエラーレートは2%未満であり、実世界のシナリオにおけるQKDの商業的実現可能性を示している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:05:25 GMT)
JointDreamer: Ensuring Geometry Consistency and Text Congruence in Text-to-3D Generation via Joint Score Distillation [38.3] textbfJoint textbfScore textbfDistillation (JSD) を提案する。
JSDは、スコア蒸留サンプリングにおける3次元不整合問題を著しく軽減する。
筆者らのフレームワークであるJointDreamerは,テキストから3D生成の新しいベンチマークを構築している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:33:10 GMT)
Graph Masked Autoencoder for Spatio-Temporal Graph Learning [38.1] 都市センシングの分野では,交通分析,人体移動評価,犯罪予測において,効果的な時間的予測の枠組みが重要な役割を担っている。
空間的および時間的データにデータノイズと空間性が存在することは、ロバスト表現を学習する上で、既存のニューラルネットワークモデルにとって大きな課題となる。
実効時間データ拡張のための新しい自己教師型学習パラダイムを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:33:33 GMT)
Sim-to-Real Transfer via 3D Feature Fields for Vision-and-Language Navigation [38.0] ヴィジュアル・アンド・ランゲージナビゲーション(VLN)により、エージェントは自然言語の指示に従って3D環境の遠隔地へ移動することができる。
本研究では,パノラマ的トラバーサビリティ認識とパノラマ的セマンティック理解を備えた単分子ロボットを実現するためのシミュレート・トゥ・リアル・トランスファー手法を提案する。
我々のVLNシステムはシミュレーション環境でR2R-CEとRxR-CEのベンチマークにおいて従来のSOTA単分子VLN法よりも優れており、実環境においても検証されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:48:18 GMT)
Varying Shades of Wrong: Aligning LLMs with Wrong Answers Only [37.4] 我々は,自己整合性,トークン確率,LCM-as-a-judgeに基づく手法を用いて,誤った過激な嗜好を導き出す。
実験により、LLMは様々な間違った色合いを区別する予備的な能力を持ち、ランダムな推測よりも最大20.9%高い性能を達成していることが示された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:01:52 GMT)
Dynamical freezing in the thermodynamic limit: the strongly driven ensemble [37.3] 保存法則がなければ、周期的に駆動される(フロケット)システムは、特徴のない無限の温度状態に熱する。
ここでは、クリーンで相互作用するジェネリック・スピン・チェーン(英語版)が発見されるが、これは、非駆動系に存在しない安定な保存法則の出現によって防げる。
これらの創発的保存法則によって要求される場合、無限の部分系の絡み合いエントロピー密度はゼロのままである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:57:43 GMT)
Organizing Unstructured Image Collections using Natural Language [37.2] 本稿では,大規模な画像コレクションからクラスタリング基準を自動的に検出することを目的としたタスクセマンティック・マルチクラスタリング(SMC)を紹介する。
当社のフレームワークであるText Driven Semantic Multiple Clustering (TeDeSC)は,テキストをプロキシとして使用して,大規模なイメージコレクションを同時に推論する。
偏見の発見やソーシャルメディア画像の人気分析など,さまざまな応用にTeDeSCを適用した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:47:46 GMT)
Organizing Unstructured Image Collections using Natural Language [37.2] 本稿では,大規模な画像コレクションからクラスタリング基準を自動的に検出することを目的としたタスクセマンティック・マルチクラスタリング(SMC)を紹介する。
当社のフレームワークであるText Driven Semantic Multiple Clustering (TeDeSC)は,テキストをプロキシとして使用して,大規模なイメージコレクションを同時に推論する。
偏見の発見やソーシャルメディア画像の人気分析など,さまざまな応用にTeDeSCを適用した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:47:46 GMT)
Neural Collapse Meets Differential Privacy: Curious Behaviors of NoisyGD with Near-perfect Representation Learning [37.0] 本稿では,表現学習における階層型モデルの設定について考察し,深層学習と伝達学習における学習特徴に関連する興味深い現象について考察する。
DPの微調整はDPのない微調整に比べ、特に摂動の存在下では堅牢性が低いことを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:38:55 GMT)
Automated Filtering of Human Feedback Data for Aligning Text-to-Image Diffusion Models [36.8] 人間のフィードバックによる微調整テキスト・画像拡散モデルは、モデル行動と人間の意図を整合させる効果的な方法である。
しかしながら、このアライメントプロセスは、人間のフィードバックデータセットにある大きなサイズとノイズのために、しばしば緩やかな収束に悩まされる。
本研究では,人間のフィードバックデータセットを用いた拡散モデルの微調整性向上を目的とした,新しい自動データフィルタリングアルゴリズムFiFAを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:18:07 GMT)
AFlow: Automating Agentic Workflow Generation [36.6] 大規模言語モデル(LLM)は、様々な領域にわたる複雑なタスクを解く上で、顕著な可能性を示している。
我々は、Monte Carlo Tree Searchを使って、この空間を効率的に探索する自動化フレームワークであるAFlowを紹介します。
6つのベンチマークデータセットに対する実証的な評価は、AFlowの有効性を示し、最先端のベースラインよりも平均5.7%向上している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:40:40 GMT)
The Surprising Effectiveness of Multimodal Large Language Models for Video Moment Retrieval [36.5] ビデオ言語タスクは空間的・時間的理解を必要とし、かなりの計算を必要とする。
本研究は,画像テキスト事前学習MLLMをモーメント検索に活用することの驚くべき有効性を示す。
我々は、Charades-STA、QVHighlights、ActivityNet Captionsといった広く使われているベンチマーク上で、新しい最先端のモーメント検索を実現する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:50:19 GMT)
Local and Global Decoding in Text Generation [36.4] テキスト生成は、言語モデル分布から文字列をサンプリングする復号アルゴリズムに依存する。
本稿では,これらの復号化手法のグローバル正規化版の導入による歪みの影響について検討する。
この結果から,歪みは局所復号アルゴリズムの重要な特徴であることが示唆された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:38 GMT)
Combinatorial Multi-armed Bandits: Arm Selection via Group Testing [36.2] 本稿では、半帯域フィードバックとスーパーアームサイズに対する濃度制約を備えたマルチアームバンディットの問題について考察する。
この問題を解決するための既存のアルゴリズムは、2つの重要なサブルーチンを含むのが一般的である。
本稿では, 完全オラクルに代わる新しい現実的な代替案を紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:19:57 GMT)
Navigation under uncertainty: Trajectory prediction and occlusion reasoning with switching dynamical systems [36.2] 構造的確率的生成モデルに基づく軌道予測とオクルージョン推論を統一する概念的枠組みを提案する。
次に、オープンデータセットを使用して、その能力を示すいくつかの初期実験を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:03:41 GMT)
Building a Multivariate Time Series Benchmarking Datasets Inspired by Natural Language Processing (NLP) [36.0] 時系列分析のための総合ベンチマークデータセットを作成するための新しい手法を提案する。
多様な、代表的で、挑戦的な時系列データセットをキュレートするプロセスについて議論する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:25:54 GMT)
Learning from Imperfect Human Feedback: a Tale from Corruption-Robust Dueling [35.5] 本稿では,不完全フィードバック(LIHF)からの学習について検討し,人間からのフィードバックから学習する際の不合理性や不完全知覚に対処する。
人類の不完全性が時間の経過とともに崩壊する証拠(つまり、人間が改善を学習する)に基づいて、我々はこの問題を包括的不完全性(concave-utility)と連続的な作用(concve-action dueling bandit)として論じるが、限定的な腐敗形態で論じる。
本稿では,この枠組みが,他の勾配型デュエルバンドアルゴリズムの汚損保証を得るためにどのように容易に適用できるかを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:55:11 GMT)
ReEvo: Large Language Models as Hyper-Heuristics with Reflective Evolution [35.4] 本稿では,言語ハイパーヒューリスティックス(LHHs)について紹介する。
LHHを効果的に探索するための進化探索(ReEvo)と、空間内の言語的勾配を提供する反射の新たな統合である。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:50:46 GMT)
Sign Stitching: A Novel Approach to Sign Language Production [35.4] 本稿では,辞書の例を用いて,表現力のある手話列を生成することを提案する。
サインを効果的に縫合するための7段階のアプローチを提案する。
我々はSignGANモデルを利用して、出力をフォトリアリスティックシグナにマップする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:28:14 GMT)
FasterDiT: Towards Faster Diffusion Transformers Training without Architecture Modification [35.1] 拡散変換器(DiT)は収束速度が遅い。
アーキテクチャの変更なしにDiTトレーニングを加速することを目指しています。
我々は極めてシンプルで実践可能な設計戦略であるFasterDiTを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:17:24 GMT)
Model-Based Differentially Private Knowledge Transfer for Large Language Models [34.9] プライバシ保護,ドメイン固有モデルを大規模言語モデルに統合するフレームワークである textitLlamdex を提案する。
提案手法はドメイン固有のタスクの精度を大幅に向上させ,既存手法と比較して最大26%の改善を実現した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:18:20 GMT)
Federated Data-Efficient Instruction Tuning for Large Language Models [34.4] 大規模言語モデルのためのフェデレーションデータ効率インストラクションチューニングであるFedHDSについて述べる。
これにより、クライアント内およびクライアント間レベルでのデータサンプルの冗長性が低下する。
実験により、FedHDSは微調整に必要なデータ量を著しく削減し、命令調整LDMの応答性を改善した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:05:51 GMT)
Innovative Thinking, Infinite Humor: Humor Research of Large Language Models through Structured Thought Leaps [34.4] ヒューモア(英: Humor)は、人間の言語における文化的に曖昧な側面であり、理解と生成の課題を提示する。
本稿では,ユーモアを創造する体系的な考え方を提案し,それに基づいてCreative Leap of Structured Thought frameを構築した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:50:16 GMT)
Can We Predict Performance of Large Models across Vision-Language Tasks? [34.3] 本稿では,他のLVLMやタスクの観測結果に基づいて,未知のパフォーマンススコアを予測する新しいフレームワークを提案する。
スパースなパフォーマンスマトリックス$boldsymbolR$を使用します。各エントリ$R_mn$は、$n$-thデータセット上の$m$-thモデルのパフォーマンススコアを表します。
本研究では,未知のスコアの予測におけるPMFの精度,評価の順序付けにおける不確実性推定の信頼性,スパースデータ処理における拡張の有効性を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:00:12 GMT)
Femtosecond laser written waveguides in sapphire for visible light delivery [34.1] サファイアバルク材料中の可視光を導出する曲線導波路は、トラップイオン量子プロセッサのスケーラブルな集積光学に対する有望な解である。
ここでは,サファイアにおける圧縮クラッド導波路のフェムト秒レーザーによる書き込みを実演する。
その結果、サファイア基板の体積に集積光導波路を形成するための強力な技術としてフェムト秒レーザー書き込みの可能性が示された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:40:05 GMT)
AdaPose: Towards Cross-Site Device-Free Human Pose Estimation with Commodity WiFi [34.1] WiFiベースのポーズ推定は、スマートホームとメタバースアバター生成の発展に大きな可能性を持つ技術である。
本稿では,Wi-Fi ベースのポーズ推定に特化して設計されたドメイン適応アルゴリズム AdaPose を提案する。
我々は,自作ポーズ推定データセットを用いて,2つの異なるシーンにおけるドメイン適応に関する広範な実験を行った。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:17:30 GMT)
big.LITTLE Vision Transformer for Efficient Visual Recognition [34.0] big.LITTLE Vision Transformerは、効率的な視覚認識を実現するための革新的なアーキテクチャである。
システムは、大きなパフォーマンスブロックとLITTLE効率ブロックの2つの異なるブロックで構成されている。
画像処理では,各トークンの重要度を判定し,それに応じて割り当てる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:21:00 GMT)
UniGEM: A Unified Approach to Generation and Property Prediction for Molecules [33.9] 分子生成と特性予測をうまく統合する最初の統一モデルUniGEMを提案する。
我々の重要な革新は、分子足場が形成された後、後段で予測タスクが活性化される新しい2相生成プロセスにある。
UniGEMの背景にある原則は、自然言語処理やコンピュータビジョンなど幅広い応用を約束している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:58:13 GMT)
Locking Down the Finetuned LLMs Safety [33.6] 特定の下流タスクのために最適化するためには、追加のデータセット上での微調整大型言語モデル(LLM)が必要であることが多い。
既存の安全アライメント対策は、推論中の有害な行動を制限するものであり、微調整時の安全性リスクを軽減するには不十分である。
そこで,本研究では,手直し後の堅牢な安全性を維持する新しいアライメント介入手法であるSafetyLockを紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:58:29 GMT)
DecKG: Decentralized Collaborative Learning with Knowledge Graph Enhancement for POI Recommendation [33.4] POI(Point-of-Interest)レコメンデーションのための分散協調学習が研究の関心を集めている。
我々は,POIレコメンデーション(DecKG)のための知識グラフ強化フレームワークを用いた分散協調学習を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:37:47 GMT)
Scaling Manipulation Learning with Visual Kinematic Chain Prediction [33.0] 本研究では,多様な環境下でのロボット学習における準静的動作の高精度かつ普遍的な表現として,視覚キネマティクス連鎖を提案する。
我々は,Calvin,RLBench,Open-X,および実際のロボット操作タスクにおいて,BC変換器に対するVKTの優れた性能を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:17:14 GMT)
Large Language Model Inference Acceleration: A Comprehensive Hardware Perspective [32.8] 大規模言語モデル(LLM)は、自然言語理解からテキスト生成に至るまで、様々な分野において顕著な能力を示している。
生成LDMの進歩は、ハードウェア機能の開発と密接に絡み合っている。
本稿では,異なるハードウェアプラットフォーム上での効率的なLLM推論を包括的に調査する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:53:29 GMT)
PRACTIQ: A Practical Conversational Text-to-SQL dataset with Ambiguous and Unanswerable Queries [32.4] 実際のユーザ質問は、複数の解釈で曖昧である場合もあれば、関連するデータが不足しているため、解決不可能である場合もあります。
本研究では,実際の対話型テキスト・テキスト・データセットを構築する。
我々は,最初のユーザ質問,明確化を求めるアシスタント応答,ユーザの明確化,およびアシスタントの明確化の4つのターンで会話を生成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:36:35 GMT)
Optimization of Complex Process, Based on Design Of Experiments, a Generic Methodology [32.4] Pollen Metrology、Aledia、Universite Clermont-Auvergneが行った共通の作業は、一般的なプロセス最適化ワークフローに繋がった。
本稿では,実験とプロセス専門家が検証した方法論の要点について述べる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:05:56 GMT)
On Feature Decorrelation in Cloth-Changing Person Re-identification [32.3] 衣服交換者再識別(CC-ReID)はコンピュータビジョンにおいて重要な課題である。
従来の方法では、複数のモダリティデータを統合するか、手動でアノテートされた衣料ラベルを使用する。
本稿では,密度比推定に基づく新しい正規化手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:20:26 GMT)
On Feature Decorrelation in Cloth-Changing Person Re-identification [32.3] 衣服交換者再識別(CC-ReID)はコンピュータビジョンにおいて重要な課題である。
従来の方法では、複数のモダリティデータを統合するか、手動でアノテートされた衣料ラベルを使用する。
本稿では,密度比推定に基づく新しい正規化手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:20:26 GMT)
Both Ears Wide Open: Towards Language-Driven Spatial Audio Generation [32.2] ステレオオーディオを空間的コンテキストで制御することは、高いデータコストと不安定な生成モデルのために依然として困難である。
まず, 大規模・シミュレーションベース・GPT支援型データセットBEWO-1Mを構築し, 移動・複数音源を含む豊富な音環境と記述を行った。
空間誘導を利用して,テキストや画像から没入型かつ制御可能な空間オーディオを生成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:18:29 GMT)
Vocabulary-Defined Semantics: Latent Space Clustering for Improving In-Context Learning [32.2] コンテキスト内学習により、言語モデルは下流のデータに適応したり、プロンプト内のデモとして少数のサンプルでタスクを組み込むことができる。
しかし、文脈内学習のパフォーマンスは、実演の質、形式、順序によって不安定である可能性がある。
語彙定義意味論(vocabulary-defined semantics)を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:19:06 GMT)
Active Learning for Robust and Representative LLM Generation in Safety-Critical Scenarios [32.2] 大きな言語モデル(LLM)は、安全対策のための貴重なデータを生成することができるが、しばしば分布バイアスを示す。
LLM生成を導くために,アクティブラーニングとクラスタリングを統合した新しいフレームワークを提案する。
この結果から,提案フレームワークは,基礎となるデータ分布の事前知識を必要とせずに,より代表的な安全シナリオを生成できることが示唆された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:48:14 GMT)
Large Language Model Inference Acceleration: A Comprehensive Hardware Perspective [32.1] 大規模言語モデル(LLM)は、自然言語理解からテキスト生成に至るまで、様々な分野において顕著な能力を示している。
生成LDMの進歩は、ハードウェア機能の開発と密接に絡み合っている。
本稿では,異なるハードウェアプラットフォーム上での効率的なLLM推論を包括的に調査する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:53:29 GMT)
Individual solid-state nuclear spin qubits with coherence exceeding seconds [32.1] 本稿ではEr$3+の結晶に隣接する183$Wの核スピン量子ビットからなる量子情報処理のための新しいプラットフォームを提案する。
我々は、Er$3+$スピンをアンシラとして使用して、各核スピン量子ビットの量子非退化読み出しを実演する。
我々は、電子-核スピン系のラマン駆動を刺激した全マイクロ波単量子ゲートと2量子ゲートの新たなスキームを導入する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:25:39 GMT)
Benchmarking Vision Language Models for Cultural Understanding [31.9] 本稿では,視覚言語モデル(VLM)の評価を目的とした視覚的質問応答ベンチマークであるCulturalVQAを紹介する。
我々は,5大陸11カ国の文化を表わす質問毎の回答が1~5である2,378枚の画像検索ペアのコレクションをキュレートした。
質問は、衣服、食べ物、飲み物、儀式、伝統など、様々な文化の側面の理解を調査する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:08:01 GMT)
AlphaLoRA: Assigning LoRA Experts Based on Layer Training Quality [31.8] Low-Rank Adaptation (LoRA)は、Large Language Models (LLM)におけるトレーニング効率を向上させることで知られている。
近年の研究では、LoRAとMixture-of-Experts(MoE)を組み合わせることで、さまざまなタスクのパフォーマンス向上を目指している。
AlphaLoRAは理論上は原則的かつトレーニング不要な手法で、LoRAの専門家をさらなる冗長性に割り当てる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:43:02 GMT)
Learning Quadruped Locomotion Using Differentiable Simulation [31.8] 微分可能シミュレーションは、高速収束と安定した訓練を約束する。
本研究はこれらの課題を克服するための新しい微分可能シミュレーションフレームワークを提案する。
我々のフレームワークは並列化なしで数分で四足歩行を学習できる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:57:56 GMT)
MentalGLM Series: Explainable Large Language Models for Mental Health Analysis on Chinese Social Media [31.8] ブラックボックスモデルはタスクを切り替えるときに柔軟性がなく、その結果は説明に欠ける。
大きな言語モデル(LLM)の台頭とともに、その柔軟性はこの分野に新しいアプローチを導入した。
本稿では,9Kサンプルからなる中国初のマルチタスク・ソーシャル・メディア解釈型メンタルヘルス・インストラクション・データセットを提案する。
また,中国ソーシャルメディアをターゲットとしたメンタルヘルス分析を目的とした,初のオープンソースLCMであるMentalGLMシリーズモデルを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:29:27 GMT)
Hallo2: Long-Duration and High-Resolution Audio-Driven Portrait Image Animation [31.8] 長編ビデオを作成するために,ハロにデザインの強化を導入する。
我々は4K解像度のポートレートビデオ生成を実現する。
ポートレート表現のための調整可能なセマンティックテキストラベルを条件入力として組み込んだ。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:35:17 GMT)
Hallo2: Long-Duration and High-Resolution Audio-Driven Portrait Image Animation [31.8] 長編ビデオを作成するために,ハロにデザインの強化を導入する。
我々は4K解像度のポートレートビデオ生成を実現する。
ポートレート表現のための調整可能なセマンティックテキストラベルを条件入力として組み込んだ。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:35:17 GMT)
Optimistic Safety for Online Convex Optimization with Unknown Linear Constraints [31.5] 我々はOCO(Optimistically Safe OCO)と呼ぶアルゴリズムを導入し、そのアルゴリズムが$tildeO(sqrtT)$ regretと制約違反がないことを示す。
静的線形制約の場合、これは同じ仮定の下で、以前の最もよく知られた $tildeO(T2/3)$ regret よりも改善される。
時間的制約の場合、当社の作業は、$O(sqrtT)$ regretと$O(sqrtT)$ cumulative violationを示す既存の結果を補完します。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:10:38 GMT)
Tracing Human Stress from Physiological Signals using UWB Radar [31.2] 本稿では,人間のストレス状態の連続検出を重視したストレス追跡問題を正式に定義する。
DSTと呼ばれる新しい応力追跡法が提案されている。
実験の結果,提案手法は人間のストレス状態の追跡において,すべてのベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:47:16 GMT)
Action Gaps and Advantages in Continuous-Time Distributional Reinforcement Learning [30.6] 行動条件付き回帰分布は、決定頻度が増加するにつれて、基本方針の戻り分布に崩壊することを示す。
また、優位性の確率的一般化として優越性を導入する。
オプショントレーディング領域におけるシミュレーションにより、優良性分布の適切なモデリングにより、高い決定周波数での制御性能が向上することが検証された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:18:38 GMT)
Process-Driven Autoformalization in Lean 4 [30.1] 大規模言語モデルの自己形式化能力を評価するためのベンチマークを開発する。
また、Lean 4コンパイラからの正確なフィードバックを利用して自動形式化を強化するモデルも導入しています。
実験の結果,PSV法ではオートフォーマライゼーションが向上し,フィルタの少ないトレーニングデータによる精度が向上した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:46:00 GMT)
Will the Inclusion of Generated Data Amplify Bias Across Generations in Future Image Classification Models? [29.7] 画像分類タスクにおける生成データの影響について,特にバイアスに着目して検討する。
数百の実験がColorized MNIST、CIFAR-20/100、Hard ImageNetデータセットで実施されている。
本研究は, 実世界の応用において, 合成データの公平性に関する議論が進行中であることを示すものである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:07:06 GMT)
Learning Video Temporal Dynamics with Cross-Modal Attention for Robust Audio-Visual Speech Recognition [29.4] 音声-視覚音声認識は、音声とビデオの両方のモダリティを用いて人間の音声を転写することを目的としている。
本研究では,映像データ中の3つの時間的ダイナミクスを学習することにより,映像特徴の強化を図る。
LRS2 と LRS3 の AVSR ベンチマークにおいて,ノイズ優越性設定のための最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:22:29 GMT)
Efficiently Democratizing Medical LLMs for 50 Languages via a Mixture of Language Family Experts [29.1] 医療用大規模言語モデルをローカル言語に適応させることで、医療サービスへのアクセス障壁を減らすことができる。
まず、高品質な医療データセットを構築し、その品質を確保するために分析を行う。
言語固有の専門家と言語間ルーティングを用いた新しいMoEルーティング手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:31:54 GMT)
Group Preference Optimization: Few-Shot Alignment of Large Language Models [28.5] グループ優先最適化(Group Preference Optimization)は、言語モデルを数ショットで個々のグループを選好する。
大規模言語モデルを用いた厳密な評価により, GPOの有効性を実証的に検証した。
以上の結果から,GPOはモデルをより正確に整合させるだけでなく,グループ固有の嗜好を少なくし,トレーニングや推論のリソースを少なくする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:02:11 GMT)
Uplifting Lower-Income Data: Strategies for Socioeconomic Perspective Shifts in Large Multi-modal Models [28.4] 非英語・地理的・社会経済的属性を用いたいくつかのプロンプト戦略を提案し,評価する。
これらの地理的・社会経済的統合的なプロンプトは、各国の低所得世帯のデータからよく見られる話題の出現を回収することを好んでいる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:11:42 GMT)
Revisiting and Benchmarking Graph Autoencoders: A Contrastive Learning Perspective [28.2] グラフオートエンコーダ(GAE)は、グラフ構造化データの意味のある表現を学習できる自己教師型学習モデルである。
コントラスト学習の原則を利用して意味のある表現を学習する汎用的で強力なGAEフレームワークであるlrGAEを紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:59:30 GMT)
Learning to Balance: Diverse Normalization for Cloth-Changing Person Re-Identification [28.1] 本研究は, 衣服の特徴を完全に取り除いたり, 完全に保持していたりすることが, 作業に有害であることを実験的に実証した。
既存の作業は、衣料品のラベルやシルエット、その他の補助的なデータに依存しており、基本的には衣服の学習とアイデンティティーの特徴のバランスをとることを目的としている。
ディバースノーム(Diverse Norm)と呼ばれる新しいモジュールを導入し、個人的特徴を空間に拡張し、異なる衣服やアイデンティティ機能にチャンネルの注意を向ける。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:14:14 GMT)
Learning to Balance: Diverse Normalization for Cloth-Changing Person Re-Identification [28.1] 本研究は, 衣服の特徴を完全に取り除いたり, 完全に保持していたりすることが, 作業に有害であることを実験的に実証した。
既存の作業は、衣料品のラベルやシルエット、その他の補助的なデータに依存しており、基本的には衣服の学習とアイデンティティーの特徴のバランスをとることを目的としている。
ディバースノーム(Diverse Norm)と呼ばれる新しいモジュールを導入し、個人的特徴を空間に拡張し、異なる衣服やアイデンティティ機能にチャンネルの注意を向ける。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:14:14 GMT)
Watching the Watchers: Exposing Gender Disparities in Machine Translation Quality Estimation [28.0] 本稿では,QE(QE)指標における性別バイアスと機械翻訳(MT)に対する下流の影響について,初めて考察する。
男性求心性翻訳は女性求心性翻訳よりも高く、性中立性翻訳はペナル化される。
品質認識復号に使用する場合,QE測定値がMTシステムの性別バイアスを持続できることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:24:52 GMT)
FlipGuard: Defending Preference Alignment against Update Regression with Constrained Optimization [28.0] 焦点を絞った回帰を検知・更新するための制約付き最適化手法であるFlipGuardを提案する。
実験によると、FlipGuardは更新の回帰を効果的に軽減し、全体的なパフォーマンスが優れている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:34:32 GMT)
FlipGuard: Defending Preference Alignment against Update Regression with Constrained Optimization [28.0] 焦点を絞った回帰を検知・更新するための制約付き最適化手法であるFlipGuardを提案する。
実験によると、FlipGuardは更新の回帰を効果的に軽減し、全体的なパフォーマンスが優れている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:34:32 GMT)
HAMMR: HierArchical MultiModal React agents for generic VQA [27.8] 計数,空間的推論,OCRに基づく推論,視覚的ポインティング,外部知識など,様々なVQAタスクスイート上でシステムを評価する。
マルチモーダルなReActベースのシステムから始まり、HAMMRエージェントが他の特殊なエージェントを呼び出せるようにすることで、階層的にします。
具体的には、我々の一般的なVQAスイートでは、HAMMRは単純LLM+ツールのアプローチを19.5%上回っている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:11:55 GMT)
On Calibration of LLM-based Guard Models for Reliable Content Moderation [27.6] 大規模言語モデル(LLM)は、有害なコンテンツを生成する可能性や、ガードレールを避けようとするユーザによって、重大なリスクを負う。
既存の研究では、脅威LSMの入力と出力を適度にするためのLLMベースのガードモデルが開発されている。
しかし、これらのガードモデルの信頼性と校正には限定的な注意が払われている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:04:06 GMT)
LKASeg:Remote-Sensing Image Semantic Segmentation with Large Kernel Attention and Full-Scale Skip Connections [27.5] LKASegというリモートセンシング画像セマンティックセマンティックネットワークを提案する。
LKASegはLarge Kernel Attention(LSKA)とFull-Scale Skip Connection(FSC)を組み合わせる
ISPRSのベイヒンゲンデータセットでは、mF1とmIoUのスコアは90.33%と82.77%に達した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:25:48 GMT)
Towards Better Multi-head Attention via Channel-wise Sample Permutation [27.4] トランスフォーマーは、コンピュータビジョンにおけるViTや自然言語処理におけるBERTやGPTなど、多くの基本的なディープラーニングモデルにおいて中心的な役割を果たす。
本稿では,より少ないパラメータと少ない複雑性を持つ新しい構造化MHAを実現するための,単純で斬新なチャネルワイドサンプル置換(CSP)演算子を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:28:40 GMT)
On the Tradeoff between Privacy Preservation and Byzantine-Robustness in Decentralized Learning [27.1] 分散化されたネットワークでは、誠実だが信頼できるエージェントが所定のアルゴリズムを忠実に従うが、学習プロセス中に受信したメッセージから隣人のプライベートデータを推測することを期待している。
分散化されたネットワークでは、不正かつビザンチンなエージェントは所定のアルゴリズムに反し、学習プロセスに偏りがあるように、隣人に意図的に誤ったメッセージを広める。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:20:24 GMT)
SimpleStrat: Diversifying Language Model Generation with Stratification [26.9] それまでのアプローチは、多様性を高めるために温度の上昇に依存していた。
温度が上昇するにつれて、このアプローチは低い品質の個々の世代を生み出すことを示す。
言語モデル自体を使って空間を成層体に分割する代替手法であるSimpleStratを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:32:26 GMT)
SimpleStrat: Diversifying Language Model Generation with Stratification [26.9] それまでのアプローチは、多様性を高めるために温度の上昇に依存していた。
このアプローチは温度が上昇するにつれて低い品質の個々の世代を生成するだけでなく、答えの真の分布と類似したモデルの次の確率にも依存する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:32:26 GMT)
UniMatch V2: Pushing the Limit of Semi-Supervised Semantic Segmentation [26.9] 半教師付きセマンティックセグメンテーション(SSS)は、安価な未ラベル画像から豊富な視覚知識を学習することを目的としている。
アップグレードされ、単純化されたUniMatch V2を示し、V1から弱い一貫性のコアスピリットを継承する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:49:27 GMT)
NT-LLM: A Novel Node Tokenizer for Integrating Graph Structure into Large Language Models [26.7] グラフは、現実世界のシナリオにおける関係を表現するための基本的なデータ構造である。
グラフ関連のタスクにLLM(Large Language Models)を適用することは、大きな課題となる。
我々は,グラフ構造を効率的にエンコードする新しいフレームワークNT-LLM(Node Tokenizer for Large Language Models)を紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:21:57 GMT)
ScaleFlow++: Robust and Accurate Estimation of 3D Motion from Video [26.0] 本稿では,3次元モーション認識手法であるScaleFlow++を提案する。
たった1対のRGBイメージで、ScaleFlow++は光学フローとモーションインディープス(MID)をしっかりと推定できる。
KITTIでは、ScaleFlow++は、SF-allを6.21から5.79に削減し、最高のモノクロシーンフロー推定性能を達成した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:35:44 GMT)
ScaleFlow++: Robust and Accurate Estimation of 3D Motion from Video [26.0] 本稿では,3次元モーション認識手法であるScaleFlow++を提案する。
たった1対のRGBイメージで、ScaleFlow++は光学フローとモーションインディープス(MID)をしっかりと推定できる。
KITTIでは、ScaleFlow++は、SF-allを6.21から5.79に削減し、最高のモノクロシーンフロー推定性能を達成した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:35:44 GMT)
SpikeGS: Learning 3D Gaussian Fields from Continuous Spike Stream [26.0] スパイクカメラは、高時間分解能と高ダイナミックレンジなどの利点を提供する特殊な高速視覚センサである。
スパイクストリームのみから3次元ガウス場を学習する最初の方法であるSpikeGSを紹介する。
本手法は,移動型スパイクカメラで捉えた連続スパイクストリームから,微妙なテクスチャでビュー合成結果を再構成することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:42:18 GMT)
DD-RobustBench: An Adversarial Robustness Benchmark for Dataset Distillation [25.8] 我々は,蒸留したデータセットの対角的堅牢性を統一的に評価する上で,これまでで最も広範囲なベンチマークを導入する。
TESLAやSRe2Lといった最新の進歩を取り入れることで,これまでの取り組みを大きく拡張する。
また, 蒸留したデータを元のデータセットのトレーニングバッチに組み込むことで, 堅牢性の向上が期待できることがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:44:48 GMT)
EmphAssess : a Prosodic Benchmark on Assessing Emphasis Transfer in Speech-to-Speech Models [25.7] EmphAssessは,音声合成モデルの韻律強調を符号化し再現する能力を評価するためのベンチマークである。
音声合成と音声合成の2つの課題に適用する。
どちらの場合も、ベンチマークは、モデルが音声入力の強調を符号化し、出力で正確に再現する能力を評価する。
評価パイプラインの一部として、フレームや単語レベルで強調を分類する新しいモデルであるEmphaClassを紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:57:06 GMT)
TRANSIC: Sim-to-Real Policy Transfer by Learning from Online Correction [25.4] シミュレーションの学習と実世界への学習は、ジェネラリストロボットを可能にする可能性がある。
そこで本研究では,Human-in-the-loopフレームワークをベースとしたSIM-to-real転送を実現するためのデータ駆動型手法を提案する。
本手法は,家具組立などの複雑かつ接触に富んだ操作作業において,シミュレートから現実への伝達を成功させることができることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:03:55 GMT)
An Annotated Dataset of Errors in Premodern Greek and Baselines for Detecting Them [25.2] 我々は、前近代ギリシア語で実際の誤りの最初のデータセットを紹介した。
このデータセットを作成するために、BERT条件から派生したメトリクスを使用して、エラーを含む可能性が高い単語1000語をサンプリングする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:30:54 GMT)
Optimizing Instruction Synthesis: Effective Exploration of Evolutionary Space with Tree Search [25.1] 命令を効率的に合成するスケーラブルなフレームワークであるIDEA-MCTS (Instruction Data Enhancement using Monte Carlo Tree Search)を紹介した。
木探索と評価モデルにより、各命令を効率よくガイドして高品質な形式に進化させ、命令の微調整を支援することができる。
実験の結果、IDEA-MCTSはシードインストラクションデータを大幅に向上させ、品質、多様性、複雑さの平均評価スコアを2.19から3.81に引き上げた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:28:30 GMT)
Pure Message Passing Can Estimate Common Neighbor for Link Prediction [25.0] CN(Common Neighbor)の近似におけるMPNNの習熟度について検討する。
本稿では,新しいリンク予測モデルであるMPLP(Message Passing Link Predictor)を紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:11:22 GMT)
Feedback Favors the Generalization of Neural ODEs [24.3] 本稿では、フィードバックループがニューラル常微分方程式(ニューラルODE)の学習潜時ダイナミクスを柔軟に補正可能であることを示す。
フィードバックニューラルネットワークは、新しい2自由度ニューラルネットワークであり、前のタスクで精度が失われることなく、目に見えないシナリオで堅牢なパフォーマンスを持つ。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:09:45 GMT)
A Randomized Method for Simulating Lindblad Equations and Thermal State Preparation [24.3] 我々は、Lindbladiansのアンサンブルにジェネレータを分解することで、Lindbladの力学をシミュレートするqDRIFT型ランダム化法について検討した。
我々はクリフォードランダム回路からサンプリングされたジャンプ演算子を利用する新しい量子ギブスサンプリングアルゴリズムを導出する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:56:38 GMT)
Self-Assessed Generation: Trustworthy Label Generation for Optical Flow and Stereo Matching in Real-world [24.3] 本稿では、光学フローとステレオタスクのための統合された自己教師付き一般化フレームワークである自己評価生成(SAG)を提案する。
従来の自己教師型手法とは異なり、SAGはデータ駆動であり、高度な再構成技術を用いてRGB画像から再構成フィールドを構築し、それに基づいてデータセットを生成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:46:17 GMT)
FedCache 2.0: Federated Edge Learning with Knowledge Caching and Dataset Distillation [24.2] Federated Edge Learning (FEL)は、エッジデバイスが機械学習モデルを協調的にトレーニングできるようにするための、有望なアプローチとして登場した。
その利点にもかかわらず、実用的なFELデプロイメントは、デバイス制約やデバイスサーバ間のインタラクションに関連する重大な課題に直面している。
FedCache 2.0は、これらの課題に同時に対処する、新しいパーソナライズされたFELアーキテクチャである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:58:39 GMT)
Principled Bayesian Optimisation in Collaboration with Human Experts [24.0] 専門家がバイナリ・アセプション/リジェクト・レコメンデーション(ラベル)を通じてアドバイスを提供するセットアップを検討する。
専門家のラベルは費用がかかることが多く、その努力を効率的に利用する必要がある。
2つの重要な保証を提供する、最初の原則付きアプローチを導入します。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:46:02 GMT)
Using AI Assistants in Software Development: A Qualitative Study on Security Practices and Concerns [23.9] 最近の研究は、AI生成コードがセキュリティ問題を含むことを実証している。
ソフトウェア専門家がAIアシスタントの使用とセキュリティのバランスをとる方法はまだ不明だ。
本稿では,ソフトウェアプロフェッショナルがセキュアなソフトウェア開発にAIアシスタントをどのように利用するかを検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:54:27 GMT)
REVEAL-IT: REinforcement learning with Visibility of Evolving Agent poLicy for InTerpretability [23.8] REVEAL-ITは複雑な環境下でのエージェントの学習過程を説明するための新しいフレームワークである。
各種学習課題における政策構造とエージェントの学習過程を可視化する。
GNNベースの説明者は、ポリシーの最も重要な部分を強調することを学び、エージェントの学習プロセスについてより明確で堅牢な説明を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:08:29 GMT)
Learning Representations of Instruments for Partial Identification of Treatment Effects [23.8] 我々は任意の(潜在的に高次元の)機器を用いて条件平均処理効果(CATE)の限界を推定する。
本稿では,楽器を離散表現空間にマッピングする手法を提案する。
我々は、潜在楽器空間のニューラルネットワーク分割を調整し、厳密な境界を学習する2段階の手順を導出する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:04:01 GMT)
Learning Representations of Instruments for Partial Identification of Treatment Effects [23.8] 我々は任意の(潜在的に高次元の)機器を用いて条件平均処理効果(CATE)の限界を推定する。
本稿では,楽器を離散表現空間にマッピングする手法を提案する。
我々は、潜在楽器空間のニューラルネットワーク分割を調整し、厳密な境界を学習する2段階の手順を導出する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:04:01 GMT)
Probing the Meissner effect in pressurized bilayer nickelate superconductors using diamond quantum sensors [23.7] 加圧された$mathrmLa_3Ni_2O_7-delta$の超伝導反磁性の明確な証拠はない。
ラマンスペクトルとNVイメージングは、非超伝導領域で生じる酸素イオンの変位に関連する不完全な構造変化を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:23:33 GMT)
On Giant's Shoulders: Effortless Weak to Strong by Dynamic Logits Fusion [23.6] 既存の弱強法では、静的な知識伝達比と、複雑な知識を伝達するための単一の小さなモデルを用いることが多い。
本稿では,複数のタスク固有小モデルに対して,それぞれ異なるタスクに特化して動作する動的ロジット融合手法を提案する。
本手法では,シングルタスクシナリオでは96.4%,マルチタスクシナリオでは86.3%のパフォーマンスギャップを埋める。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:31:06 GMT)
DiRW: Path-Aware Digraph Learning for Heterophily [23.5] グラフニューラルネットワーク(GNN)は、グラフ構造化データのための強力な表現学習ツールとして登場した。
我々は,プラグイン・アンド・プレイ戦略や革新的なニューラルアーキテクチャとみなすことができるDirected Random Walk (DiRW)を提案する。
DiRWには、歩行確率、長さ、および数の観点から最適化された方向対応パスサンプリング器が組み込まれている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:26:56 GMT)
Packing Analysis: Packing Is More Appropriate for Large Models or Datasets in Supervised Fine-tuning [23.3] Packingは、異なるトレーニングシーケンスを組み合わせて、モデルの最大入力長に適合させることで、ハードウェアリソース効率を最大化する最適化技術である。
本稿では,69Kから1.2Mのデータセットと8Bから70Bのモデルを対象として,パディングとパッキングを用いたSFT法の比較を行った。
これは、パッキング対パディングの利点と制限に関する最初の包括的な分析と、さまざまなトレーニングシナリオでパッキングを実装するための実践的な考慮を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:39:09 GMT)
Packing Analysis: Packing Is More Appropriate for Large Models or Datasets in Supervised Fine-tuning [23.3] Packingは、異なるトレーニングシーケンスを組み合わせて、モデルの最大入力長に適合させることで、ハードウェアリソース効率を最大化する最適化技術である。
本稿では,69Kから1.2Mのデータセットと8Bから70Bのモデルを対象として,パディングとパッキングを用いたSFT法の比較を行った。
これは、パッキング対パディングの利点と制限に関する最初の包括的な分析と、さまざまなトレーニングシナリオでパッキングを実装するための実践的な考慮を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:39:09 GMT)
Learning to Customize Text-to-Image Diffusion In Diverse Context [23.2] 殆どのテキスト・ツー・イメージのカスタマイズ技術は、最小限のコンテキストでキャプチャされた少数の人物のコンセプトイメージを微調整する。
我々は、文脈的にリッチなテキストプロンプトを単に作成することで、これらの個人概念のコンテキストを多様化する。
驚くべきことに、この単純で費用対効果の高い手法は、テキスト空間における意味的アライメントを大幅に改善する。
当社のアプローチではアーキテクチャの変更は一切必要とせず、既存のテキスト・ツー・イメージのカスタマイズ手法と互換性が高い。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:53:59 GMT)
Towards Reliable Verification of Unauthorized Data Usage in Personalized Text-to-Image Diffusion Models [23.1] 新しいパーソナライズ技術は、特定のテーマやスタイルのイメージを作成するために、事前訓練されたベースモデルをカスタマイズするために提案されている。
このような軽量なソリューションは、パーソナライズされたモデルが不正なデータからトレーニングされているかどうかに関して、新たな懸念を生じさせる。
我々は、ブラックボックスパーソナライズされたテキスト・ツー・イメージ拡散モデルにおいて、不正なデータ使用を積極的に追跡する新しい手法であるSIRENを紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:29:23 GMT)
Neural networks that overcome classic challenges through practice [22.7] メタラーニングを使ってこれらの課題を克服した最近の研究をレビューする。
我々は,この原則の応用を,体系性,破滅的忘れ,数発の学習,多段階の推論という4つの古典的課題にレビューする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:07:37 GMT)
A Scalable Communication Protocol for Networks of Large Language Models [22.7] AgoraはAIを利用したエージェントが複雑な問題を効率的に解決するためのメタプロトコルである。
これはAgent Communication Trilemmaを横取りし、インターフェイスやメンバーの変更をしっかりと処理します。
大規模なAgoraネットワーク上では、人間の介入なしに複雑な目標を達成する、自己組織化された完全に自動化されたプロトコルの出現を観察する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:25:13 GMT)
REHRSeg: Unleashing the Power of Self-Supervised Super-Resolution for Resource-Efficient 3D MRI Segmentation [22.5] 高分解能(HR)3次元磁気共鳴イメージング(MRI)は、詳細な解剖学的構造情報を提供することができる。
取得装置の要求が高いため、アノテーションによるHR画像の収集は常に臨床シナリオでは現実的ではない。
本稿では,実世界のアプリケーションにおける課題に対処する新しい資源効率の高い高分解能フレームワーク(REHRSeg)を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:28:18 GMT)
FunnelRAG: A Coarse-to-Fine Progressive Retrieval Paradigm for RAG [22.5] Retrieval-Augmented Generation (RAG) は、大規模言語モデルにおいて一般的である。
本稿では,RAGの粒度が粗いプログレッシブ検索パラダイムを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:47:21 GMT)
DuoAttention: Efficient Long-Context LLM Inference with Retrieval and Streaming Heads [22.5] すべての注目ヘッドにキーとバリューの状態をキャッシュすると、かなりのメモリが消費される。
我々は,ストリーミングヘッドに軽量で一定長のKVキャッシュを使用しながら,全KVキャッシュのみを検索ヘッドに適用するフレームワークであるDuoAttentionを紹介する。
GQAモデルでは,MHAでは2.55倍,GQAでは1.67倍の長文推論メモリが大幅に削減される。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:58 GMT)
StatioCL: Contrastive Learning for Time Series via Non-Stationary and Temporal Contrast [22.2] 時系列データの表現学習において,コントラスト学習(CL)が有望なアプローチとして登場した。
既存のCL法は、固有の特性を無視して偽陰対(FNP)を導入することが多い。
両FNPを緩和するために非定常性および時間依存性を捕捉する新しいCLフレームワークであるStatioCLを紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:02:37 GMT)
Twin-Merging: Dynamic Integration of Modular Expertise in Model Merging [21.9] モデルマージは、複数のタスク固有のモデルを、余分なトレーニングなしで単一のマルチタスクモデルに結合する、有望な方法である。
従来のモデルマージ手法は、微調整されたモデルに比べて大きな性能差を示すことが多い。
共有されたタスク固有の知識と排他的なタスク固有の知識の両方が、パフォーマンスのマージには不可欠であるが、排他的な知識を直接マージすることは、全体的なパフォーマンスを妨げていることを示す。
本稿では,1)知識を共有コンポーネントと排他コンポーネントにモジュール化し,冗長性を低減し効率を向上する圧縮,(2)共有およびタスク固有の知識を動的にマージする,という2つの主要な段階を包含する手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:14:26 GMT)
RICASSO: Reinforced Imbalance Learning with Class-Aware Self-Supervised Outliers Exposure [21.8] ディープラーニングモデルは、不均衡(ロングテール)とアウト・オブ・ディストリビューション(OOD)の両方のデータから、しばしば課題に直面します。
本研究は、データ混合により、IDデータとOODデータの両方の特徴を示す擬似OODデータを生成することができることを示す。
RICASSO(Reinforced Im Balance Learning)と呼ばれる統合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:29:32 GMT)
Beyond Human-Only: Evaluating Human-Machine Collaboration for Collecting High-Quality Translation Data [21.7] 人間と機械のコラボレーションは、人間のみの翻訳の質にマッチしたり、超えたりすることができる。
いくつかのアプローチは、従来の手法のコストの約60%でトップレベルの品質を達成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:02:12 GMT)
Medico: Towards Hallucination Detection and Correction with Multi-source Evidence Fusion [21.6] 幻覚はLarge Language Models (LLMs) で広まり、生成されたコンテンツは一貫性があるが、実際には正しくない。
マルチソースエビデンス融合による幻覚検出と修正の枠組みであるメディコについて述べる。
複数の情報源から様々な証拠を抽出し、生成されたコンテンツが事実的誤りを含むかどうかを検知し、判断の背後にある根拠を与え、幻覚されたコンテンツを反復的に修正する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:00:58 GMT)
Towards Foundation Models for 3D Vision: How Close Are We? [21.5] 3Dビジョンのための基礎モデルを構築することは、未解決の複雑な課題である。
我々は,視覚質問回答形式の基本的な3次元視覚タスクを網羅する新しい3次元視覚理解ベンチマークを構築した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:57:23 GMT)
Boosting Camera Motion Control for Video Diffusion Transformers [21.2] 本研究では, トランスフォーマーベース拡散モデル (DiT) がカメラモーションの精度を著しく低下させることを示した。
DiTの持続的な動き劣化に対処するため、カメラモーションガイダンス(CMG)を導入し、カメラ制御を400%以上向上させる。
提案手法はU-NetモデルとDiTモデルの両方に適用され,ビデオ生成タスクに改良されたカメラ制御を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:58:07 GMT)
Can LLMs Understand Time Series Anomalies? [20.8] 大規模言語モデル (LLM) は時系列予測で人気を博しているが, 異常検出の可能性はほとんど未解明である。
本研究では,ゼロショットと少数ショットのシナリオに着目し,時系列データ中の異常をLLMが理解し,検出できるかどうかを検討する。
この結果から,LLMは時系列異常を理解できるが,その推論能力に基づく多くの共通予想は成り立たないことが示唆された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:32:50 GMT)
Can LLMs Understand Time Series Anomalies? [20.8] 大規模言語モデル (LLM) は時系列予測で人気を博しているが, 異常検出の可能性はほとんど未解明である。
本研究では,ゼロショットと少数ショットのシナリオに着目し,時系列データ中の異常をLLMが理解し,検出できるかどうかを検討する。
この結果から,LLMは時系列異常を理解できるが,その推論能力に基づく多くの共通予想は成り立たないことが示唆された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:32:50 GMT)
Manifold-Aware Local Feature Modeling for Semi-Supervised Medical Image Segmentation [20.7] マニフォールド対応局所特徴モデリングネットワーク (MANet) を導入し, 多様体監視信号を組み込むことでU-Netアーキテクチャを向上する。
ACDC、LA、Pancreas-NIHといったデータセットに関する我々の実験は、MANetがパフォーマンス指標における最先端の手法を一貫して超越していることを示しています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:40:35 GMT)
Connecting the Dots: Evaluating Abstract Reasoning Capabilities of LLMs Using the New York Times Connections Word Game [20.6] 我々は,最先端の大規模言語モデル(LLM)の性能を,専門家や初心者に対して評価する。
この結果から,最高のLLMであるClaude 3.5 Sonnetでもゲーム全体の18%しか解けないことがわかった。
本研究では,コネクティクスゲームにおける単語のクラスタ化と分類に要する知識の種類を分類する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:41:26 GMT)
Modeling News Interactions and Influence for Financial Market Prediction [20.6] 本稿では,ニュースと価格の関係を捉える新しい市場予測モデルであるFININを紹介する。
S&P 500とNASDAQ 100の指標を含む2つのデータセットを15年間にわたって広範な実験を行った。
その結果、ニュースの市場価格の遅れ、ニュースの長期記憶効果、財務感情分析の限界など、金融ニュースに関する知見が明らかになった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:19:49 GMT)
SpikeGS: Learning 3D Gaussian Fields from Continuous Spike Stream [20.6] スパイクカメラは、高時間分解能と高ダイナミックレンジなどの利点を提供する特殊な高速視覚センサである。
スパイクストリームのみから3次元ガウス場を学習する手法であるSpikeGSを紹介する。
本手法は,移動型スパイクカメラで捉えた連続スパイクストリームから,微妙なテクスチャでビュー合成結果を再構成することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:42:18 GMT)
SpikeGS: Learning 3D Gaussian Fields from Continuous Spike Stream [20.6] スパイクカメラは、高時間分解能と高ダイナミックレンジなどの利点を提供する特殊な高速視覚センサである。
スパイクストリームのみから3次元ガウス場を学習する手法であるSpikeGSを紹介する。
本手法は,移動型スパイクカメラで捉えた連続スパイクストリームから,微妙なテクスチャでビュー合成結果を再構成することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:42:18 GMT)
SpikeGS: Learning 3D Gaussian Fields from Continuous Spike Stream [20.6] スパイクカメラは、高時間分解能と高ダイナミックレンジなどの利点を提供する特殊な高速視覚センサである。
スパイクストリームのみから3次元ガウス場を学習する手法であるSpikeGSを紹介する。
本手法は,移動型スパイクカメラで捉えた連続スパイクストリームから,微妙なテクスチャでビュー合成結果を再構成することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:42:18 GMT)
Matrix Sketching in Bandits: Current Pitfalls and New Framework [20.5] 線形バンディット設定では、スケッチベースのアプローチがマトリックススケッチを活用して、時間単位の複雑さを低減する。
共分散行列のスペクトル尾が急速に減少しない場合、線形後悔につながる。
Dyadic Block Sketchingを提案する。Dyadic Block Sketchingは,大域的なスペクトル損失を抑えるために,スケッチサイズを適応的に管理する,革新的なストリーミング行列スケッチ手法である。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:13:28 GMT)
A First Look at Package-to-Group Mechanism: An Empirical Study of the Linux Distributions [20.5] パッケージ・ツー・グループ・メカニズム(P2G)は、インストール、アンインストール、複数パッケージの同時更新を可能にするために使用される。
本稿では,Linuxディストリビューションを事例として,その応用動向,進化パターン,グループ品質,開発者の傾向に着目した実証的研究を行う。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:48:20 GMT)
Learning to Optimize for Mixed-Integer Non-linear Programming [20.5] 混合整数非NLPプログラム(MINLP)はエネルギーシステムや輸送など様々な領域で発生するが、解決は困難である。
機械学習の最近の進歩は、最適化のための学習として知られる領域において、顕著な成功をもたらしている。
勾配を保ちながら整数出力を生成する2つの異なる補正層を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:14:39 GMT)
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts) [20.5] この第2回説明可能なAI for the Arts(XAIxArts)に関する国際ワークショップは、HCI、インタラクションデザイン、AI、説明可能なAI(XAI)、デジタルアートの研究者のコミュニティを集めて、XAI for the Artsの役割を探求した。
第16回 ACM Conference on Creativity and Cognition (C&C 2024) でワークショップを開催した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:26:04 GMT)
LLM Unlearning via Loss Adjustment with Only Forget Data [20.3] これらの問題に対処する"フラットな"損失調整アプローチであるLos AjustmenT (FLAT) のみを導入する。
実験結果から,本手法は既存手法と比較して,非学習性能が優れていることが示された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:43:33 GMT)
DR-MPC: Deep Residual Model Predictive Control for Real-world Social Navigation [20.3] Deep Residual Model Predictive Control (DR-MPC)は、ロボットが現実世界の群衆のナビゲーションデータからDRLを安全に実行できるようにする方法である。
DR-MPCは、MPCベースの経路追跡を持ち、徐々に人間とより効果的に対話することを学ぶ。
シミュレーションでは,DR-MPCは従来のDRLモデルや残留DRLモデルなど,従来よりも大幅に優れていた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:56:43 GMT)
MoTE: Reconciling Generalization with Specialization for Visual-Language to Video Knowledge Transfer [20.3] 一般化と特殊化を一つの統一モデルでバランスよく行える新しいフレームワークであるMoTEを提案する。
提案手法は,複数のタスクビューをさまざまなデータ適合度で学習するために,時間的専門家の混在をチューニングする。
我々は、ゼロショットとクローズセットのビデオ認識タスクの健全なバランスを達成し、様々なデータセットで最先端または競合的な結果を得る。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:00:55 GMT)
HSR-Enhanced Sparse Attention Acceleration [19.8] 本稿では,Large Language Models (LLM) における注意計算を高速化する新しい手法を提案する。
我々は,従来のSoftmaxアテンションとReLUアテンションの両方において,アテンションメカニズム内の固有空間を利用する。
提案手法では,ReLUの注意には誤りがなく,Softmaxの注意には誤りがない。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:18:02 GMT)
SGLP: A Similarity Guided Fast Layer Partition Pruning for Compressing Large Deep Models [19.5] レイヤプルーニングは、ネットワークサイズを削減し、計算効率を向上させるための強力なアプローチである。
大規模深層モデル圧縮のための類似性誘導高速層分割プルーニングを提案する。
本手法は精度と計算効率の両面で最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:01:08 GMT)
Divide, Reweight, and Conquer: A Logit Arithmetic Approach for In-Context Learning [19.2] 大規模言語モデル(LLM)の重要な機能として、インコンテキスト学習(ICL)が登場
複数の実演のロジットベースアンサンブルを用いてICLを強化する新しいフレームワークであるLogit Arithmetic Reweighting Approach (LARA)を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:34:16 GMT)
Accelerating Diffusion Transformers with Token-wise Feature Caching [19.1] 拡散変換器は、膨大な計算コストを犠牲にして、画像合成とビデオ合成の両方において有意な効果を示した。
トークンワイズ機能キャッシングを導入し、キャッシングに最も適したトークンを適応的に選択できるようにします。
PixArt-$alpha$、OpenSora、DiTの実験では、トレーニングの必要なく、画像生成とビデオ生成の両方の有効性を実証しています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:35:35 GMT)
Accelerating Diffusion Transformers with Token-wise Feature Caching [19.1] 拡散変換器は、膨大な計算コストを犠牲にして、画像合成とビデオ合成の両方において有意な効果を示した。
トークンワイズ機能キャッシングを導入し、キャッシングに最も適したトークンを適応的に選択できるようにします。
PixArt-$alpha$、OpenSora、DiTの実験では、トレーニングの必要なく、画像生成とビデオ生成の両方の有効性を実証しています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:35:35 GMT)
Multi-scale direction-aware SAR object detection network via global information fusion [19.0] 本稿では,SARオブジェクト検出における方向認識情報のグローバルな融合を目的とした新しいフレームワークであるSAR-Netを提案する。
UCMとDAMは効率的なグローバル情報融合と伝送を可能にする。
実験は、SAR-Netの有効性を示し、航空機や船舶のデータセットに対して最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:57:20 GMT)
Bayesian Optimisation with Unknown Hyperparameters: Regret Bounds Logarithmically Closer to Optimal [18.9] 本稿では,Longth Scale Balancing (LB)について紹介する。
LBは、長いスケールを維持しながら、長いスケールの候補値を追加し、探索とエクスプロイトのバランスをとる。
LB はオラクルの後悔からわずか$log g(T) 離れている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:17:00 GMT)
Improving the Language Understanding Capabilities of Large Language Models Using Reinforcement Learning [18.8] 大規模言語モデル(LLM)はゼロショットプロンプトと少数ショットプロンプトを使用して自然言語生成に優れる。
BERTベースのようなエンコーダのみのモデルは、GLUEやSuperGLUEのようなベンチマークでLLMより優れている。
本稿では,LLMのNLU能力を高めるために,SFTとPPOの2つのアプローチについて検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:16:56 GMT)
Data-Driven Uncertainty-Aware Forecasting of Sea Ice Conditions in the Gulf of Ob Based on Satellite Radar Imagery [18.4] 本稿では,オビ湾における海水環境予測のための新しいデータ駆動手法を提案する。
我々のアプローチは、北極海氷力学のユニークな課題に合わせて、ドメイン固有のデータ前処理と拡張技術を用いて、高度なビデオ予測モデルを統合する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:52:36 GMT)
Graph Classification Gaussian Processes via Hodgelet Spectral Features [18.4] 本稿では,グラフの分類のためのプロセスベース分類アルゴリズムを提案する。
私たちはHodge分解を利用してモデルの柔軟性を高めます。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:26:46 GMT)
Unraveling the Smoothness Properties of Diffusion Models: A Gaussian Mixture Perspective [18.3] 拡散過程のリプシッツ連続性と第二運動量特性の理論的理解を提供する。
この結果から, 共通データ分布下での拡散過程のダイナミクスについて, より深い理論的知見が得られた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:59:47 GMT)
Tensor Attention Training: Provably Efficient Learning of Higher-order Transformers [18.3] テンソルアテンションの時間的複雑さは、変圧器におけるその利用にとって重要な障害である。
注意訓練の後方勾配をほぼ線形時間で計算できることを実証する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:10:19 GMT)
Enhancing Attributed Graph Networks with Alignment and Uniformity Constraints for Session-based Recommendation [18.3] セッションベースの勧告(SBR)は、匿名セッションに基づいてユーザの次のアクションを予測する。
ほとんどのSBRモデルは、アイテム表現を学ぶために短いセッションでコンテキスト遷移に依存する。
本稿では,AttrGAUというモデルに依存しないフレームワークを提案し,既存の属性に依存しないモデルにアイテム属性のモデリングの優位性をもたらす。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:49:11 GMT)
Out-of-Bounding-Box Triggers: A Stealthy Approach to Cheat Object Detectors [18.2] 本稿では,境界ボックスの外側で動作し,モデルに検出不能なオブジェクトを描画する不明瞭な対向トリガを提案する。
高品質トリガ作成のためのFG技術とUAPGD(Universal Auto-PGD)最適化戦略を提案することにより、このアプローチをさらに強化する。
本手法の有効性を実験により検証し,デジタル環境と物理環境の両方で高い性能を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:15:48 GMT)
How to Leverage Demonstration Data in Alignment for Large Language Model? A Self-Imitation Learning Perspective [18.0] 本稿では,新しい自己アニメーション学習フレームワーク(textbfGSIL$)を紹介する。
大規模な言語モデルとオフラインのデモデータとを効果的に効率的に整列する。
$textbfGSIL$一貫性があり、多くの挑戦的なベンチマークでベースラインをはるかに上回っている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:21:29 GMT)
ICU-Sepsis: A Benchmark MDP Built from Real Medical Data [17.9] 本稿では、強化学習(RL)アルゴリズムを評価するためのベンチマークで使用できるICU-Sepsisについて述べる。
近年, セプシス管理は応用RL研究において重要な課題となっている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:57:38 GMT)
Complexity enriched dynamical phases for fermions on graphs [17.7] 正規グラフ上のフェルミオンに対する絡み合いとクリロフ複雑性について検討する。
我々の研究によると、絡み合いは次数$d = 2$と$d = 3$の正則グラフの両種類の体積法則に従うが、クリロフ複雑性は特異な振る舞いを示す。
相互作用するフェルミオンに対して、我々の理論解析は次元スケールを$Dsim 4Nalpha$として、通常のグラフは$d = 2$で$0.38leqalphaleq0.59$で、一方、$Dsim 4N$で$d = 3$でスケールする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:12:15 GMT)
A Practical Approach to Causal Inference over Time [17.7] 我々は因果介入とその時間的影響を離散時間プロセス(DSP)に定義する。
因果介入前後のDSPの平衡状態が構造因果モデル(SCM)によって把握できる条件を示す。
得られた因果VARフレームワークにより、観測時系列データから経時的に因果推論を行うことができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:45:20 GMT)
CoMAT: Chain of Mathematically Annotated Thought Improves Mathematical Reasoning [17.5] CoMAT (Chain of Mathematically Annotated Thought) は2つの段階(Conversion and Reasoning Execution)を通して推論を強化する。
CoMATは単一の言語モデルで完全に動作し、外部のソルバを持たない。
性能の改善に加えて、CoMATは忠実さと検証可能性を確保し、複雑な数学的タスクに対する透過的な推論プロセスを提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:48:41 GMT)
MedSegMamba: 3D CNN-Mamba Hybrid Architecture for Brain Segmentation [17.4] 我々は皮質下脳分割のための3DパッチベースのハイブリッドCNN-Mambaモデルを開発した。
モデルの性能をいくつかのベンチマークで検証した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:26:59 GMT)
Mastering AI: Big Data, Deep Learning, and the Evolution of Large Language Models -- Blockchain and Applications [17.3] この記事は暗号の基礎の紹介から始まる。
作業の証明、理解の証明、スマートコントラクトといったトピックをカバーしています。
この記事は、ブロックチェーンに関する学術研究の現状に対処することで締めくくっている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:56:36 GMT)
Effective Self-Mining of In-Context Examples for Unsupervised Machine Translation with LLMs [17.0] 機械翻訳(MT)における文脈内例の教師なし手法を提案する。
教師なし並列文のプールから最適なテキスト内例を選択するためのフィルタリング基準を導入する。
本研究は,MTの文脈内マイニングにおける教師なしアプローチの有効性を実証するものである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:47:04 GMT)
Ferrari: Federated Feature Unlearning via Optimizing Feature Sensitivity [16.8] 連邦学習(FL)の出現は、すべての顧客にとって「忘れられる権利」の実践的な必要性を強調している。
未学習のセンシティブな機能、バックドア機能、バイアス機能などに応用されているため、フィーチャーアンラーニングは大きな注目を集めている。
既存の手法では、非学習プロセスにおいて他のクライアントの参加を必要とするため、FLでは現実的ではない機能非学習を実現するために影響関数を採用している。
本稿では,フェラーリと呼ばれる機能非学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:44:42 GMT)
A few-shot Label Unlearning in Vertical Federated Learning [16.8] 本稿では,垂直的フェデレート学習(VFL)におけるアンラーニングの課題について述べる。
本稿では,ラベルリークのリスクを軽減することを目的とした,VFLにおけるラベルアンラーニングに特化して設計された最初のアプローチを紹介する。
本手法では, ラベル付きデータの限られた量を活用し, 多様体ミックスアップを利用して, 不十分なデータの前方埋め込みを増強し, 拡張埋め込みに勾配を増し, モデルからラベル情報を消去する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:08:12 GMT)
A Systematic Review on Prompt Engineering in Large Language Models for K-12 STEM Education [16.8] 大規模言語モデル(LLM)は、教育と学習プロセスの両方を改善することで、K-12 STEM教育を強化する可能性がある。
本研究は,K-12 STEM教育におけるLLMと即時工学の併用について検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:22:34 GMT)
Should We Respect LLMs? A Cross-Lingual Study on the Influence of Prompt Politeness on LLM Performance [16.7] 本研究は,英語,中国語,日本語タスクの多言語モデル(LLM)に対するプロンプトの丁寧さの影響を評価する。
不規則なプロンプトがしばしばパフォーマンスを低下させるが、過度に丁寧な言語はより良い結果を保証しない。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:34:55 GMT)
A New World in the Depths of Microcrypt: Separating OWSGs and Quantum Money from QEFID [16.5] EFI対が存在する量子ユニタリオラクルが存在することを示すが、OWSGは存在しない。
私たちは、オラクル、QEFID、片道パズルを通じて、OWSGや他のMicrocryptプリミティブから切り離しています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:18:39 GMT)
A New World in the Depths of Microcrypt: Separating OWSGs and Quantum Money from QEFID [16.5] EFI対が存在する量子ユニタリオラクルが存在することを示すが、OWSGは存在しない。
私たちは、オラクル、QEFID、片道パズルを通じて、OWSGや他のMicrocryptプリミティブから切り離しています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:18:39 GMT)
DragEntity: Trajectory Guided Video Generation using Entity and Positional Relationships [16.5] DragEntityは、複数のオブジェクトの動きを制御するためにエンティティ表現を利用するビデオ生成モデルである。
我々はDragEntityの有効性を検証し、ビデオ生成におけるきめ細かい制御の優れた性能を実証した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:24:35 GMT)
Floquet Engineering of Anisotropic Transverse Interactions in Superconducting Qubits [16.4] Floquet Engineering によるトランスモン量子ビット間のペアリング(XX-YY)とホッピング(XX+YY)の同時実現について述べる。
これらの相互作用のコヒーレントな重ね合わせは、XX 項と YY 項の独立な制御を可能にし、異方的逆相互作用をもたらす。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:04:06 GMT)
TrajDiffuse: A Conditional Diffusion Model for Environment-Aware Trajectory Prediction [16.2] 本稿では,新しい条件付き拡散モデルを用いた計画に基づく軌道予測手法であるTrajDiffuseを提案する。
本研究では, 軌道予測問題を不特定課題として定式化し, 拡散過程の地図に基づくガイダンス項を設計する。
TrajDiffuseは、環境制約にほぼ完全に準拠しながら、SOTAの正確さと多様性を一致または超過する軌道予測を生成することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:03 GMT)
PSST: A Benchmark for Evaluation-driven Text Public-Speaking Style Transfer [16.1] 公的なテキストを公用語に変換することを目的とした,PSST(Public-Speaking Style Transfer)という新しいタスクを導入する。
言語学的観点からの実世界のデータ分析に基礎を置き、公用語のスタイルを重要なサブスタイルに分解する。
そこで本研究では,その特徴を分析し,スタイリングされたテキストの問題点を特定するための,きめ細かい評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:00:10 GMT)
Improving Consistency Models with Generator-Induced Flows [16.0] 一貫性モデルは、ニューラルネットワークの単一前方通過におけるスコアベース拡散の多段階サンプリングを模倣する。
それらは、一貫性の蒸留と一貫性のトレーニングの2つの方法を学ぶことができる。
本稿では,現在訓練されているモデルから得られた雑音データを対応する出力へ転送する新しい流れを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:21:15 GMT)
Distributional Reinforcement Learning with Regularized Wasserstein Loss [16.0] 本稿では,スキンホルン分布RL(SinkhornDRL)を提案する。スキンホルン分散(Sinkhorn divergence,正規化ワッサースタイン損失)を利用して,電流とベルマン帰還分布の差を最小限に抑える。
経験的に、SinkhornDRLはAtariゲームスイートの既存のアルゴリズムより一貫して優れており、特に多次元報酬設定において際立っている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:09:20 GMT)
AutoTurb: Using Large Language Models for Automatic Algebraic Model Discovery of Turbulence Closure [15.9] 本研究では,LLMを用いてレイノルズ応力モデルを修正するための表現を自動的に検出する新しいフレームワークを提案する。
提案手法は,Re = 10,595 で周期的な丘を横断する流れを分離するためのものである。
The corrective RANS can improve the prediction for the Reynolds stress and mean velocity field。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:06:35 GMT)
Achieving Optimal Breakdown for Byzantine Robust Gossip [15.7] 本稿では,デバイス同士が直接通信する分散環境でのビザンチン耐性アルゴリズムについて検討する。
我々は,$mathrmClippedGossip$と$mathrmNNA$の交差点におけるアルゴリズムである$mathrmCG+$を紹介した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:10:52 GMT)
Gender Bias in Decision-Making with Large Language Models: A Study of Relationship Conflicts [15.7] 大規模言語モデル(LLM)におけるジェンダーエクイティを意思決定レンズを用いて検討する。
我々は3つの名前リスト(男性、女性、中立)にまたがる名前ペアを通して9つの関係構成を探索する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:50:11 GMT)
CompAct: Compressing Retrieved Documents Actively for Question Answering [15.6] CompActは、キー情報を失うことなく、広範囲のドキュメントを格納するためのアクティブな戦略を採用した、新しいフレームワークである。
実験により,マルチホップ質問応答ベンチマークにおいて,CompActは性能と圧縮率に大きな改善をもたらすことが示された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:42:54 GMT)
MedSegMamba: 3D CNN-Mamba Hybrid Architecture for Brain Segmentation [15.5] 我々は皮質下脳分割のための3DパッチベースのハイブリッドCNN-Mambaモデルを開発した。
モデルの性能をいくつかのベンチマークで検証した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:26:59 GMT)
4DStyleGaussian: Zero-shot 4D Style Transfer with Gaussian Splatting [15.5] 任意のスタイル参照のリアルタイムスタイリングを実現するための新しい4Dスタイル転送フレームワークである4DStyleGaussianを紹介する。
提案手法は,高効率・時空間整合性を有する4次元シナリオの高品質・ゼロショットスタイリングを実現する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:03:00 GMT)
Finite-difference-informed graph network for solving steady-state incompressible flows on block-structured grids [15.4] blueTextA graph convolution-based FD method (GC-FDM) は、ラベルのない物理制約でグラフネットワークを訓練するために提案されている。
様々な境界条件下でのCFDソルバと比較した場合,提案手法は速度場予測における相対誤差を10~3ドルの順序で達成する。
提案手法は,物理インフォームドニューラルネットワークと比較してトレーニングコストを約20%削減する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:06:27 GMT)
Evaluating of Machine Unlearning: Robustness Verification Without Prior Modifications [15.3] Unlearningは、事前トレーニングされたモデルが特定のトレーニングサンプルの影響を取り除くことができるプロセスである。
既存の検証方法は、メンバシップ推論攻撃(MIA)やバックドア攻撃のような機械学習攻撃技術に依存している。
本稿では,事前の修正を伴わない新しい検証手法を提案し,より大規模な検証を支援する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:19:14 GMT)
FlexGen: Flexible Multi-View Generation from Text and Image Inputs [15.2] 制御可能で一貫したマルチビュー画像を生成するために設計されたフレキシブルなフレームワークであるFlexGenを紹介します。
我々は、GPT-4Vの強い推論能力を利用して、3D対応のテキストアノテーションを生成する。
この研究は、ゲーム開発、アニメーション、バーチャルリアリティーを含む、迅速で柔軟な3Dコンテンツ作成を必要とする分野に重大な影響を及ぼす。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:23:13 GMT)
The Future of Large Language Model Pre-training is Federated [15.2] 我々は,LLM事前学習のための新しいトレーニングパラダイムの調査と開発を可能にする,Photonと呼ばれるスケーラブルなデプロイメントシステムを提案する。
数十億のパラメータを持つLCMを事前学習するために、プライベートデータソースと計算資源とのコラボレーションに関心のある組織がPhotonを利用できることを示す。
さらに,モデルサイズによるフェデレーショントレーニング尺度の有効性を示すとともに,限られた資源を用いて数十億規模のフェデレーションLLMをトレーニングするためのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:37:29 GMT)
QUITE: Quantifying Uncertainty in Natural Language Text in Bayesian Reasoning Scenarios [15.2] 本稿では,カテゴリー的確率変数と複雑な関係を持つ実世界のベイズ推論シナリオのデータセットであるQUITEを提案する。
我々は幅広い実験を行い、論理ベースのモデルが全ての推論型において、アウト・オブ・ボックスの大規模言語モデルより優れていることを発見した。
以上の結果から,ニューロシンボリックモデルが複雑な推論を改善する上で有望な方向であることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:44:59 GMT)
Customize Your Visual Autoregressive Recipe with Set Autoregressive Modeling [15.0] 我々は,SAR(Set AutoRegressive Modeling)と呼ばれる,自動回帰(AR)画像生成のための新しいパラダイムを導入する。
SARは従来のARを次のセット設定、すなわち複数のトークンを含む任意の集合に分割するように一般化する。
シーケンス順序と出力間隔が性能に与える影響を解析し,SARの特性について検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:49:06 GMT)
DOME: Taming Diffusion Model into High-Fidelity Controllable Occupancy World Model [15.0] DOMEは拡散に基づく世界モデルであり、過去の占有観察に基づいて将来の占有枠を予測する。
この世界のモデルが環境の進化を捉える能力は、自動運転の計画に不可欠である。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:24:32 GMT)
AdaMoE: Token-Adaptive Routing with Null Experts for Mixture-of-Experts Language Models [14.6] 我々はAdaMoEを導入し、MoEのトークン適応ルーティングを実現する。
AdaMoEは各トークンに一定数のnullエキスパートを占有させません。
パフォーマンスを向上しながら、平均的な専門家負荷(FLOP)を削減できます。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:20:02 GMT)
Putting Gale & Shapley to Work: Guaranteeing Stability Through Learning [14.4] 両面のマッチング市場は、市場の片側からの参加者が好みに応じて反対側からの参加者と一致しなければならない、一連の問題を記述している。
我々は安定解の構造を利用して、安定解を見つける可能性を改善するアルゴリズムを考案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:37:37 GMT)
Putting Gale & Shapley to Work: Guaranteeing Stability Through Learning [14.4] 両面のマッチング市場は、市場の片側からの参加者が好みに応じて反対側からの参加者と一致しなければならない、一連の問題を記述している。
我々は安定解の構造を利用して、安定解を見つける可能性を改善するアルゴリズムを考案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:37:37 GMT)
Fast Convergence of $Φ$-Divergence Along the Unadjusted Langevin Algorithm and Proximal Sampler [14.3] 連続空間における2つの一般的な離散時間マルコフ連鎖の混合時間について検討する。
二つの微分可能な厳密凸函数から生じる任意の$Phi$-divergenceが、これらのマルコフ連鎖に沿って指数的に0$に収束することを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:41:45 GMT)
ROA-BEV: 2D Region-Oriented Attention for BEV-based 3D Object [14.2] BEVに基づく3Dオブジェクト検出ネットワーク(ROA-BEV)のための2次元領域指向アテンションを提案する。
本手法は,マルチスケール構造を用いてROAの情報量を増加させる。
nuScenesの実験では、ROA-BEVはBEVDetとBEVDepthに基づいて性能を改善している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:51:56 GMT)
Simulation-based, Finite-sample Inference for Privatized Data [14.2] 本稿では,統計的に有効な信頼区間と仮説テストを生成するためのシミュレーションベースの"repro sample"手法を提案する。
本手法は様々な個人推論問題に適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:44:32 GMT)
LIME-Eval: Rethinking Low-light Image Enhancement Evaluation via Object Detection [14.1] 広範に使われている方法は、低照度画像に基づいて訓練されたオブジェクト検出器が、注釈付きセマンティックラベルに対してどれだけ正確に実行できるかを確認することである。
LIME-Benchは、低照度向上のための人間の嗜好の収集を目的とした、最初のオンラインベンチマークプラットフォームである。
LIME-Evalは、オブジェクトアノテーションなしで標準照明データセット上で事前訓練された検出器を利用する新しい評価フレームワークである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:43:05 GMT)
LIME-Eval: Rethinking Low-light Image Enhancement Evaluation via Object Detection [14.1] 広範に使われている方法は、低照度画像に基づいて訓練されたオブジェクト検出器が、注釈付きセマンティックラベルに対してどれだけ正確に実行できるかを確認することである。
LIME-Benchは、低照度向上のための人間の嗜好の収集を目的とした、最初のオンラインベンチマークプラットフォームである。
LIME-Evalは、オブジェクトアノテーションなしで標準照明データセット上で事前訓練された検出器を利用する新しい評価フレームワークである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:43:05 GMT)
Mix Data or Merge Models? Optimizing for Diverse Multi-Task Learning [14.0] 大きな言語モデル(LLM)は、様々なアプリケーションのために世界中で採用され、デプロイされている。
我々は,多言語コンテキストにおける安全性と汎用タスクを組み合わせた多タスク環境におけるモデルマージについて検討する。
客観的なマージはデータ混合よりも有効であり, 全般的な性能と安全性は最大8%, 10%向上した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:58:01 GMT)
Weakly Supervised Learning for Facial Behavior Analysis : A Review [14.0] 本稿では,分類的・次元的ラベルを用いた顔行動分析のための弱教師付き学習手法の総合的なレビューを行う。
そして、既存の最先端のアプローチを体系的にレビューし、これらのアプローチの分類と洞察と限界を提供します。
現実の状況において、弱いラベルで顔の行動分析を適用するために、今後の研究の方向性とともに課題と機会について論じる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:11:30 GMT)
Feature Averaging: An Implicit Bias of Gradient Descent Leading to Non-Robustness in Neural Networks [14.0] 我々は「機能平均化」がディープニューラルネットワークの非ロバスト性に寄与する主要な要因の1つであると論じる。
二層分類タスクのための2層ReLUネットワークにおいて、勾配降下のトレーニング力学を詳細に理論的に解析する。
よりきめ細かい教師付き情報を提供することで、2層多層ニューラルネットワークが個々の特徴を学習できることを実証する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:28:32 GMT)
Robust Gradient Descent for Phase Retrieval [14.0] 入力(cos)と入力(cos)の両方において、第4モーメント境界雑音に対処する能力について検討する。
従来のシナリオに適合しない新しいステップフォーマットを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:29:11 GMT)
Data-Aware Training Quality Monitoring and Certification for Reliable Deep Learning [13.8] 我々は、ニューラルネットワークトレーニングのリアルタイム、データ認識認証、監視のための新しいフレームワークであるYESトレーニングバウンドを紹介する。
我々は,YESバウンダリが,最適地域におけるトレーニング損失高原の特定など,従来の局所最適化の視点を超えた洞察を提供することを示した。
私たちはリアルタイム評価のための強力なツールを提供し、ディープラーニングにおける品質保証をトレーニングするための新しい標準を設定しています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:13:22 GMT)
Composability in Watermarking Schemes [13.8] ソフトウェア透かしは、マークをコード片に埋め込むことができ、マークを取り除こうとすると、コードは役に立たない。
本稿では,透かし方式を構成するための一連の要件を提案する。
私たちの定式化は、多くのアプリケーションを引き出すのに役立ちます。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:50:14 GMT)
BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Models [13.7] この研究は、バイアス継承に対抗するために設計された新しいPEFT法であるBias-Alleviating Low-Rank Adaptation (BA-LoRA)を導入している。
BA-LoRAは、(1)整合正則化器、(2)多様性正則化器、(3)特異値分解正則化器の3つの異なる正則化項を含む。
その結果、BA-LoRAはLoRAとその最先端の変種よりも優れていた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:27:04 GMT)
CleanUMamba: A Compact Mamba Network for Speech Denoising using Channel Pruning [13.6] CleanUMambaは、生の波形に直接適応する因果音声を識別するために設計された時間領域ニューラルネットワークアーキテクチャである。
CleanUMamba は PESQ スコア 2.42 と STOI の 95.1% を 442K パラメータと 468M MAC で達成している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:18:03 GMT)
Learning via Surrogate PAC-Bayes [13.4] PAC-Bayes学習は、学習アルゴリズムの一般化能力を研究するための包括的な設定である。
本稿では,一連の代理学習目標を最適化することで,反復学習アルゴリズムを構築するための新しい原則的戦略を提案する。
PAC-Bayes境界による学習の一般的なレシピを提供するのに加えて、(i)サロゲートの反復最適化が元の一般化境界の最適化を意味することを示す理論的結果を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:45:50 GMT)
Generative Human Video Compression with Multi-granularity Temporal Trajectory Factorization [13.3] 本稿では,人為的ビデオ圧縮のための多粒度時間軌道因子化フレームワークを提案する。
実験結果から,提案手法は最新の生成モデルと最先端のビデオ符号化標準であるVersatile Video Codingより優れていた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:34:32 GMT)
High-Dimensional Differential Parameter Inference in Exponential Family using Time Score Matching [13.3] 各時間に高次元モデルを推定する代わりに、微分パラメータ、すなわちパラメータの時間微分を学習する。
本手法は,シミュレーションおよび実世界のデータセット上で検証された高次元グラフィカルモデルにおける微分構造を効果的に推定する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:49:27 GMT)
Multimodal MRI Accurately Identifies Amyloid Status in Unbalanced Cohorts in Alzheimer's Disease Continuum [13.2] Amyloid-$beta$ plaques と hyperated Tau protein はアルツハイマー病の神経病理学的特徴である。
異なる疾患段階の被験者を囲む非バランスコホートにおけるA$beta$陽性状態の把握を目指す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:14:58 GMT)
Real-Time Localization and Bimodal Point Pattern Analysis of Palms Using UAV Imagery [13.1] リアルタイム検出,セグメンテーション,およびカノピーヤシのカウントのためのディープラーニングフレームワークであるPalmDSNetを紹介する。
エクアドル西部の熱帯林21ヶ所からUAVキャプチャー画像を用いてオルソモザイクを作成する。
画像パッチ上の7,356のバウンディングボックスと5つの整形外科領域にわたる7,603のヤシセンターを含む、包括的なデータセットを作成するために専門家アノテーションが使用された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:23:10 GMT)
Embedding Self-Correction as an Inherent Ability in Large Language Models for Enhanced Mathematical Reasoning [13.1] 自己補正の連鎖は大規模言語モデル(LLM)に固有の能力として自己補正を組み込む
CoSCは、一連の自己補正段階を通して動作する。各段階において、LLMは、与えられた問題に対処するプログラムを生成し、プログラムベースのツールを使用してこのプログラムを実行し、出力を取得し、その後、その出力を検証する。
第1段階では、LCMは、GPT-4から生成される比較的少量のシードデータで訓練され、初期CoSC能力が確立される。
第2段階では、CoSC能力は、より大きな自己生成データを用いたトレーニングによりさらに強化される。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:16:44 GMT)
Beyond Fixed Topologies: Unregistered Training and Comprehensive Evaluation Metrics for 3D Talking Heads [13.0] 実スキャンデータを含む任意のトポロジで3次元顔をアニメーションできるフレームワークを提案する。
我々のアプローチは、メッシュ上の熱拡散を利用して、固定されたトポロジー制約を克服するモデルに依存している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:42:09 GMT)
Induction Heads as an Essential Mechanism for Pattern Matching in In-context Learning [12.9] 誘導ヘッドの最小アブレーションでもICL性能は抽象的パターン認識タスクで最大32%低下することを示す。
NLPタスクの場合、このアブレーションはモデルがサンプルから恩恵を受ける能力を大幅に低下させ、ゼロショットプロンプトに近い数ショットのICLパフォーマンスをもたらす。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:33:02 GMT)
Graph of Records: Boosting Retrieval Augmented Generation for Long-context Summarization with Graphs [12.9] 長文大域要約のためのRAGを強化するために,レコードのテキストグラフ(textbfGoR)を提案する。
RAG のtextitretrieve-then-generate パラダイムに着想を得て,検索したテキストチャンクと対応する LLM 生成応答のエッジを確立することでグラフを構築する。
それら間の複雑な相関関係を明らかにするために、GoRは、テキストトグラフニューラルネットワークと、自己教師型モデルトレーニングのための、精巧に設計されたTextitBERTScoreベースの目的を特徴としている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:34:29 GMT)
FormalAlign: Automated Alignment Evaluation for Autoformalization [12.7] textscFormalAlignは、自動形式化シーケンス生成タスクと、入力と出力の間の表現アライメントの両方をトレーニングする。
textscFormalAlignは4つのベンチマークで評価され、優れたパフォーマンスを示している。
この効果的なアライメント評価は、手動検証の必要性を大幅に低減する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:58:35 GMT)
Large Language Model-Enhanced Reinforcement Learning for Generic Bus Holding Control Strategies [12.6] 本研究では,Large Language Models(LLMs)の文脈内学習と推論機能を活用した自動報酬生成パラダイムを提案する。
提案するLLM拡張RLパラダイムの実現可能性を評価するため,合成単線システムや実世界の多線システムなど,様々なバス保持制御シナリオに適用した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:10:16 GMT)
Translating Across Cultures: LLMs for Intralingual Cultural Adaptation [12.6] 文化適応の課題を定義し,現代LLMの性能を評価するための評価枠組みを構築した。
我々は、自動適応で起こりうる問題を解析する。
本稿は, LLMの文化的理解と, 異文化のシナリオにおける創造性について, より深い知見を提供していくことを願っている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:39:36 GMT)
3D-Prover: Diversity Driven Theorem Proving With Determinantal Point Processes [12.5] 自動形式推論における重要な課題は、証明の深さとともに指数関数的に成長する、難解な探索空間である。
セマンティックな多様性と高品質な戦術を活用する新しいフィルタリング機構を提案する。
提案手法は, 総合的な証明率の向上と, 戦術的成功率, 実行時間, 多様性の大幅な向上につながることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:13:53 GMT)
Towards Better Comprehension of Breaking Changes in the NPM Ecosystem [12.4] 我々は,NPM生態系の破壊的変化を調査するため,大規模な実証的研究を行っている。
我々は381のNPMプロジェクトから明示的に文書化された破壊的変更のデータセットを構築した。
我々は、JavaScriptとTypeScript固有の構文的破壊変化の分類と、主要な行動的破壊変化の分類を生成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:28:59 GMT)
TABCF: Counterfactual Explanations for Tabular Data Using a Transformer-Based VAE [12.4] 本稿では,表データのモデリングに適した変分自動エンコーダ(VAE)を利用するCF説明手法であるABCFを紹介する。
提案手法では,変圧器を用いて連続的な潜伏空間と,高精度な分類的再構成を実現するGumbel-Softmaxデトケナイザを学習する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:55:41 GMT)
DMDSpeech: Distilled Diffusion Model Surpassing The Teacher in Zero-shot Speech Synthesis via Direct Metric Optimization [12.3] そこで本研究では, 直接的エンドツーエンド評価を用いたTS拡散モデルの蒸留法を提案する。
DMDSpeechは、自然性と話者類似性の両方において、従来の最先端モデルより一貫して上回っていることを示す。
この研究は、音声合成における直接メートル法最適化の可能性を強調し、モデルが人間の聴覚的嗜好とよりよく一致できるようにする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:17:58 GMT)
UAV3D: A Large-scale 3D Perception Benchmark for Unmanned Aerial Vehicles [12.3] 無人航空機(UAV)は、航空写真、監視、農業など多くの用途で使用されている。
UAVアプリケーションの既存のベンチマークは、主に従来の2D認識タスクのために設計されている。
UAV3Dは1000のシーンで構成され、それぞれに20のフレームと完全な注釈付き3Dバウンディングボックスがある。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:24:11 GMT)
Can we hop in general? A discussion of benchmark selection and design using the Hopper environment [12.2] 我々は、強化学習におけるベンチマークは科学の分野として扱う必要があると論じている。
ケーススタディでは、標準的なベンチマークスイートの選択が、アルゴリズムのパフォーマンスの判断方法を大きく変える可能性があることを示しています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:28:20 GMT)
ATLAS: Adapter-Based Multi-Modal Continual Learning with a Two-Stage Learning Strategy [12.2] 本稿では,経験ベース学習と新規知識拡張からなるマルチモーダル連続学習手法を提案する。
提案手法は,従来のタスクを忘れることによる負の影響を最小限に抑えつつ,上流での表現の分布を拡大する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:29:42 GMT)
SAGED: A Holistic Bias-Benchmarking Pipeline for Language Models with Customisable Fairness Calibration [12.1] SAGED(-Bias)はこれらの問題に対処する最初の総合的なベンチマークパイプラインである。
私たちは、Gemma2、Llama3.1、Mistral、Qwen2など、人気のある8bレベルのモデルでG20諸国でSAGEDを使用しています。
感情分析により、MistralとQwen2はGemma2やLlama3.1よりも最大差とバイアス濃度が低いが、すべてのモデルがロシアや(Qwen2を除く)中国に偏っていることが判明した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:17:53 GMT)
DINTR: Tracking via Diffusion-based Interpolation [12.1] 本研究は,トラッキングタスクを定式化するための拡散に基づく新しい手法を提案する。
我々のInterpolation TrackeR(DINTR)は、将来性のある新しいパラダイムを示し、5つの指標表現にまたがる7つのベンチマークにおいて優れた乗法を実現する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:41:58 GMT)
Large Language Model Evaluation via Matrix Nuclear-Norm [11.9] 本稿では,大規模言語モデル(LLM)のデータ圧縮精度を定量化するための指標として,マトリックス核ノルムを紹介する。
さらに、(L_1,2text-norm )を用いて核ノルムを近似することにより、モデルの情報圧縮能力を効果的に評価できる。
マトリックス核ノームは、CEREBRAS-GPTモデルにおいて、サイズが111Mから6.7Bに増加するにつれて、マトリックスエントロピーの8倍から24倍の速度を達成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:15:57 GMT)
An Adaptive Placement and Parallelism Framework for Accelerating RLHF Training [11.7] 2つの一般的なアジャイルモデル配置戦略を提供するフレキシブルなモデル配置フレームワークを提案する。
私たちのフレームワークは、さまざまなトレーニングシナリオにおいて、これらの戦略を簡単にかつ柔軟に設定するための、シンプルなユーザインターフェースとガイドラインを提供します。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:57:00 GMT)
GraFPrint: A GNN-Based Approach for Audio Identification [11.7] GraFPrintは、グラフニューラルネットワーク(GNN)の構造学習機能を活用して、堅牢なオーディオ指紋を作成するオーディオ識別フレームワークである。
GraFPrintは、さまざまなレベルの粒度の大規模データセット上での優れたパフォーマンスを示し、軽量かつスケーラブルであることを証明している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:20:09 GMT)
PromptGCN: Bridging Subgraph Gaps in Lightweight GCNs [11.7] グラフ畳み込みネットワーク(GCN)は、ソーシャルネットワークやレコメンデーションシステムなどのグラフベースのアプリケーションで広く使われている。
フルバッチGCNの大規模グラフやディープアグリゲーション層は、大きなGPUメモリを消費する。
本稿では,サブグラフ間のギャップを埋める新しいプロンプトベース軽量GCNモデルであるPromptGCNを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:07:02 GMT)
Detecting Audio-Visual Deepfakes with Fine-Grained Inconsistencies [11.7] 空間領域と時間領域の両方において微妙なアーティファクトを検出するためのきめ細かいメカニズムを提案する。
まず,音声との不整合が生じやすい小さな空間領域を撮影できる局所視覚モデルを提案する。
第2に、トレーニングセットに微妙な時間的不整合を取り入れたサンプルを含む、時間的に局所的な擬似フェイク増強を導入する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:06:54 GMT)
BrainMVP: Multi-modal Vision Pre-training for Brain Image Analysis using Multi-parametric MRI [11.6] BrainMVPは、マルチパラメトリックMRIスキャンを用いた脳画像解析のためのマルチモーダルビジョン事前トレーニングフレームワークである。
クロスモーダル・コンストラクション(英語版)は、特徴ある脳画像の埋め込みと効率的なモーダル融合能力を学習するために研究されている。
ダウンストリームタスクの実験は、医学領域における最先端の事前訓練方法よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:12:16 GMT)
Towards Bridging Generalization and Expressivity of Graph Neural Networks [11.6] グラフニューラルネットワーク(GNN)における表現性と一般化の関係について検討する。
本稿では,GNNの一般化と,それらが捉えることのできるグラフ構造の分散を結合する新しいフレームワークを提案する。
我々は,クラス内濃度とクラス間分離のトレードオフを明らかにする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:31:16 GMT)
Test smells in LLM-Generated Unit Tests [11.5] 本研究では,大規模言語モデルの生成した単体テストスイートにおけるテストの匂いの拡散について検討する。
5つのプロンプトエンジニアリング技術で4つのモデルで生成された20,500 LLM生成テストスイートのベンチマークを解析した。
我々は,LLM生成テストスイートと筆記テストスイートの両方において,種々のテスト匂いの出現頻度と発生頻度を同定し,解析する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:35:44 GMT)
Regularized Robustly Reliable Learners and Instance Targeted Attacks [11.4] Balcan et al (2022) は、堅牢で信頼性の高い学習者の概念を定義することによって、この問題に対処するアプローチを提案した。
少なくともある興味深いケースでは、トレーニング時間内にサブリニアで出力を生成できるアルゴリズムを設計できることが示されています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:49:32 GMT)
Continual Deep Reinforcement Learning to Prevent Catastrophic Forgetting in Jamming Mitigation [11.4] 本稿では, 妨害防止システムについて考察し, 妨害検知および緩和作業に応用したDRLにおける破滅的忘れ込みの課題について考察する。
本稿では,ネットワークが古いジャマパターンの知識を維持しつつ,新しいジャマパターンの処理を学習することを可能にする手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:00:32 GMT)
Gate Recurrent Unit for Efficient Industrial Gas Identification [11.2] 深層学習に基づくガス認識モデルGRUを提案する。
他のモデルと比較して、GRUはより高い識別精度が得られる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:56:47 GMT)
Fed-piLot: Optimizing LoRA Assignment for Efficient Federated Foundation Model Fine-Tuning [11.1] ヘテロジニアスクライアントのためのローカルLoRA割り当てを最適化したFedFMファインチューニングフレームワークであるFed-piLotを紹介する。
我々は、クライアントのメモリ制約下でのLoRA割り当てを最適化するために、IGスコア(Local-Global Information Gain Score)ベースの値関数を設計する。
IIDおよび非IID条件下での3つのデータセットの実験結果は、Fed-piLotの有効性と効率を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:36:41 GMT)
Compressed Federated Reinforcement Learning with a Generative Model [11.1] 強化学習は近年、前例のない人気を得たが、それでもサンプルの非効率さに悩まされている。
この課題に対処するため、フェデレーション強化学習(FedRL)が出現し、エージェントは局所的な推定を集約することで単一のポリシーを協調的に学習する。
通信効率のよいFedRL手法であるCompFedRLを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:11:57 GMT)
AdaGrad under Anisotropic Smoothness [11.0] 本稿では,新しい異方性一般化された滑らか性仮定を提案し,これに対応するアダグラードの解析を行う。
異方的滑らかさと雑音条件下では、AdaGradはより良い次元依存度でより高速な収束を保証することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:44:54 GMT)
Queueing Matching Bandits with Preference Feedback [11.0] 我々は、一方のN$キューと他方のK$サーバからなるマルチクラス非対称キューシステムについて検討する。
各ジョブサーバ割り当てのサービスレートは未知であり、機能ベースのMNL(Multi-nomial Logit)関数によってモデル化される。
我々は,UCBとトンプソンサンプリングに基づくアルゴリズムを提案する。このアルゴリズムは,待ち時間の平均値が$O(minN,K/epsilon)$に制限されたシステム安定性を実現する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:29:06 GMT)
How to Backdoor Consistency Models? [11.0] バックドア攻撃に対する一貫性モデルの脆弱性に関する最初の研究を行う。
我々のフレームワークは、高い実用性と特異性を維持しながら、一貫性モデルの妥協に成功した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:25:06 GMT)
Dreaming to Assist: Learning to Align with Human Objectives for Shared Control in High-Speed Racing [10.9] 高速なダイナミクスと戦術的な決定を含むドメインにおける効果的な人間ロボットチームのために、タイトな調整が求められます。
人間の目的や価値関数を推測できる豊かな世界モデルを組み合わせたフレームワークであるDream2Assistを提案する。
人間の行動と人間の行動とを混ぜ合わせると、人工人間単独よりも優れた結果が得られます。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:00:46 GMT)
Sudden change in entanglement Hamiltonian: Phase diagram of an Ising entanglement Hamiltonian [10.7] 一次元イジング交絡ハミルトニアンの位相図を例に研究し、ハミルトニアンと原ハミルトニアンの間の一般関係の論争を明らかにする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:13:34 GMT)
Diff-eRank: A Novel Rank-Based Metric for Evaluating Large Language Models [10.7] 情報理論と幾何原理を基礎としたランクベースの計量 Diff-eRank を導入する。
言語モデルでは,Diff-eRankはモデルサイズとともに増加し,損失や精度といった従来の指標と相関することを示す。
本手法では,eRankに基づくアライメント評価手法を提案し,同時代のマルチモーダルLLMがアライメント性能が高いことを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:36:09 GMT)
Convergence Analysis of Split Federated Learning on Heterogeneous Data [10.6] Split Learning(SFL)は、複数のクライアント間で協調的なモデルトレーニングを行うための、最近の分散アプローチである。
SFLでは、グローバルモデルは通常2つの部分に分割され、クライアントは1つの部分を並行的に訓練し、もう一方は他方を訓練する。
本研究では,SFLの収束解析を行い,不均一なデータに対する凸性および汎用性について述べる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:30:28 GMT)
Embedded Named Entity Recognition using Probing Classifiers [10.6] EMBERはデコーダのみの言語モデルで名前付きエンティティ認識を微調整することなくストリーミングできる。
EMBERは高いトークン生成率を維持しており, 約1%の速度低下しか認められていない。
トレーニング、テスト、効率的なトークン分類モデルをデプロイするためのツールキットを含む、コードとデータをオンラインで公開しています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:56:19 GMT)
Improve Meta-learning for Few-Shot Text Classification with All You Can Acquire from the Tasks [10.6] 既存の手法は、しばしばサポートセットのサンプルから正確なクラスプロトタイプを描くのに困難に遭遇する。
近年のアプローチでは、外部知識や事前訓練された言語モデルを組み込んでデータを拡張しようとするが、追加のリソースが必要になる。
本稿では,タスク自体の情報を適切に活用した新しいソリューションを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:47:11 GMT)
Spatial-Aware Efficient Projector for MLLMs via Multi-Layer Feature Aggregation [10.5] マルチモーダル言語モデル(MLLM)におけるプロジェクタの役割
プロジェクタに関する現在の調査では、効率を改善するために視覚トークンの数を減らすことに重点を置いている。
この問題に対処するために空間認識効率プロジェクタ(SAEP)を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:25:09 GMT)
Assessing the Human Likeness of AI-Generated Counterspeech [10.4] Counterspeechは、悪質なコンテンツやヘイトフルコンテンツに対する反則と挑戦に対するターゲット的反応である。
従来の研究では、自動生成音声に対する様々な戦略が提案されている。
本稿では,AI生成音声の人間的類似性,有効性に影響を与える重要な要因について検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:48:47 GMT)
MCTrack: A Unified 3D Multi-Object Tracking Framework for Autonomous Driving [10.4] 本稿では,KITTI, nuScenes, データセット間でのSOTA(State-of-the-art)性能を実現する3Dマルチオブジェクトトラッキング手法であるMCTrackを紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:00:23 GMT)
Get Rid of Task Isolation: A Continuous Multi-task Spatio-Temporal Learning Framework [10.3] 我々は,都市の総合的知能を高めるために,連続マルチタスク時空間学習フレームワーク(CMuST)を提案することが不可欠であると主張する。
CMuSTは、都市時間学習を単一ドメインから協調マルチタスク学習に改革する。
マルチタスク時間学習のための3つの都市のベンチマークを作成し,CMuSTの優位性を実証的に実証した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:04:36 GMT)
Building Knowledge-Guided Lexica to Model Cultural Variation [10.2] 地域文化の変化を測定することは、人々がどう考え、どのように振る舞うかを照らすことができる。
NLPコミュニティに新たな研究課題を導入する: 言語を用いた地域ごとの文化的構成の変化をどう測定するか?
私たちは、文化的変動をモデル化するための知識誘導レキシカを構築するという、スケーラブルなソリューションを提供しています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:13:37 GMT)
Motion-guided small MAV detection in complex and non-planar scenes [10.2] 複雑なシーンや非平面シーンで小さなMAVを正確に識別できる動き誘導型MAV検出器を提案する。
提案手法は, 動的, 複雑な背景から, 極めて小さなMAVを効果的に, 効率的に検出することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:06:41 GMT)
3DArticCyclists: Generating Simulated Dynamic 3D Cyclists for Human-Object Interaction (HOI) and Autonomous Driving Applications [10.0] 我々は、NeRFおよび3DGSに基づく3D再構成法をトレーニングするために使用できる、新しいパートベース多視点合成3D自転車データセットを作成する。
次に,8-DoFのポーズ制御可能な3D自転車を組み立てるための3DGSに基づくパラメトリック自転車合成モデルを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:50:47 GMT)
Temporal Action Localization for Inertial-based Human Activity Recognition [9.9] ビデオベースのヒューマンアクティビティ認識(TAL)は、任意の長さのタイムラインでアクティビティセグメントをローカライズするセグメントベースの予測アプローチに従っている。
本論文は、オフラインとニアオンラインのHAR(Human Activity Recognition)における最先端のTALモデルの適用性を体系的に示す最初のものである。
時系列全体を解析することにより、TALモデルはよりコヒーレントなセグメントを生成し、全てのデータセットに対して高いNULLクラス精度を実現することができることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:33:40 GMT)
Large Language Models Are Active Critics in NLG Evaluation [9.9] 自然言語生成(NLG)システムを評価する新しい手法であるActive-Criticを紹介する。
このプロトコルにより、大きな言語モデル(LLM)が'アクティブな批評家'として機能できる。
実験により,本手法は現状評価法よりも人的判断との整合性が高いことが示された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:04:41 GMT)
Eliminating the Language Bias for Visual Question Answering with fine-grained Causal Intervention [9.9] よりきめ細かい視点から言語バイアスを排除するために,CIBiという新たな因果介入訓練手法を提案する。
我々は、文脈バイアスを排除し、マルチモーダル表現を改善するために因果介入とコントラスト学習を用いる。
我々は,キーワードバイアスを抽出・排除するために,対実生成に基づく質問専用ブランチを新たに設計する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:09:16 GMT)
STACKFEED: Structured Textual Actor-Critic Knowledge Base Editing with FeedBack [9.8] 本稿では, FEEDback を用いた構造化テキストアクタ・クリティカルな知識ベース編集手法である FEED を紹介する。
FEEDは、多要素集中型批判強化学習フレームワークを用いて、専門家のフィードバックに基づいてKBを反復的に洗練する。
実験の結果,FEEDは品質とRAGシステム性能を著しく向上し,ベースラインよりも最大8%精度が向上した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:56:01 GMT)
CYCLO: Cyclic Graph Transformer Approach to Multi-Object Relationship Modeling in Aerial Videos [9.8] 本研究では,空中ビデオにおける多目的関係モデリングに焦点を当てた新しいAeroEyeデータセットを提案する。
本稿では,Cyclic Graph Transformer (CYCLO) アプローチを提案する。
また、提案手法により、固有巡回パターンでシーケンスを処理し、オブジェクト関係を正しい順序で処理することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:18:03 GMT)
TV-SAM: Increasing Zero-Shot Segmentation Performance on Multimodal Medical Images Using GPT-4 Generated Descriptive Prompts Without Human Annotation [9.8] 本研究は,手動のアノテーションを使わずに,テキスト・ビジュアル・プロンプト・セグメンテーション・モデル (TV-SAM) と呼ばれる,新しいマルチモーダルな医用画像ゼロショット・セグメンテーションアルゴリズムを提案する。
TV-SAMは、大規模言語モデルGPT-4、ビジョン言語モデルGLIP、SAMを統合して、医療画像から記述テキストプロンプトと視覚的バウンディングボックスプロンプトを自律的に生成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:41:52 GMT)
A Synthesis of Green Architectural Tactics for ML-Enabled Systems [9.7] ML対応システムのための30のグリーンアーキテクチャ戦略のカタログを提供する。
アーキテクチャ戦術は、ソフトウェア品質を改善するための高度な設計手法である。
透明性を高め、その普及を促進するため、我々はオンラインで簡単に消費可能なフォーマットで戦術を利用できるようにした。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:25:23 GMT)
Synthetic Potential Outcomes and Causal Mixture Identifiability [9.6] 混合モデルは、観測されたデータに対して離散的な信号を実行する潜在クラスから構成される。
MTEが因果識別可能性の階層にどのように適合するかを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:54:18 GMT)
A Consistency-Aware Spot-Guided Transformer for Versatile and Hierarchical Point Cloud Registration [9.6] 我々は整合性を考慮したスポット誘導変換器(CAST)を開発した。
CASTは、無関係な領域への干渉を避けるために、スポット誘導のクロスアテンションモジュールを組み込んでいる。
スパースキーポイントと高密度特徴の両方のための軽量な微細マッチングモジュールは、変換を正確に推定することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:48:25 GMT)
EEGPT: Unleashing the Potential of EEG Generalist Foundation Model by Autoregressive Pre-training [9.6] EEGPTはこれらの課題に対処するために設計された最初の一般のEEG基盤モデルである。
まず,各電極を基本単位として扱う電極ワイド・モデリング手法を提案する。
第2に、最初の自己回帰型脳波事前学習モデルを開発する。
第3に,学習可能な電極グラフネットワークを用いたマルチタスク転送学習パラダイムを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:17:54 GMT)
eXponential FAmily Dynamical Systems (XFADS): Large-scale nonlinear Gaussian state-space modeling [9.5] 非線形状態空間グラフィカルモデルのための低ランク構造化変分オートエンコーダフレームワークを提案する。
我々のアプローチは、より予測的な生成モデルを学ぶ能力を一貫して示している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:10:40 GMT)
Enhancing Indonesian Automatic Speech Recognition: Evaluating Multilingual Models with Diverse Speech Variabilities [9.5] 本稿では,MMS(Massively Multilingual Speech)とWhisper(Whisper)という,最先端の音声認識モデルについて述べる。
インドネシア語音声データを様々な変動群で書き起こすモデルの予測能力について検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:44:33 GMT)
Enhancing Indonesian Automatic Speech Recognition: Evaluating Multilingual Models with Diverse Speech Variabilities [9.5] 本稿では,MMS(Massively Multilingual Speech)とWhisper(Whisper)という,最先端の音声認識モデルについて述べる。
インドネシア語音声データを様々な変動群で書き起こすモデルの予測能力について検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:44:33 GMT)
Fair-OBNC: Correcting Label Noise for Fairer Datasets [9.4] トレーニングデータのバイアスは ラベルノイズと関連しています
このようなバイアスデータに基づいてトレーニングされたモデルは、センシティブな情報に関してバイアスを永続的に、あるいは悪化させる可能性がある。
公平性を考慮したラベルノイズ補正法であるFair-OBNCを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:45:12 GMT)
Fair-OBNC: Correcting Label Noise for Fairer Datasets [9.4] トレーニングデータのバイアスは ラベルノイズと関連しています
このようなバイアスデータに基づいてトレーニングされたモデルは、センシティブな情報に関してバイアスを永続的に、あるいは悪化させる可能性がある。
公平性を考慮したラベルノイズ補正法であるFair-OBNCを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:45:12 GMT)
Saliency Guided Optimization of Diffusion Latents [9.2] テキスト・ツー・イメージ生成の鍵となるのは、テキスト・ツー・イメージ生成モデルの結果を最適化して、人間の意図やプロンプトに適合するようにする方法である。
これらの手法は、画像を見るとき、人間の視覚系が自然に正常な領域への注意を優先し、少ない領域や非塩分領域を無視するという事実を見落としている。
本稿では、このアライメント課題を効果的かつ効率的に解決するために、潜伏者の衛生指導最適化(SGOOL)を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:12:42 GMT)
EchoApex: A General-Purpose Vision Foundation Model for Echocardiography [9.2] 本稿では,初の汎用視覚基礎モデルであるEchoApexを紹介し,様々な臨床応用について紹介する。
自己教師付き学習を活用して、EchoApexは11の臨床センターから2000万以上のエコー画像に事前訓練されている。
最先端のタスク固有のモデルと比較すると、EchoApexは統一されたイメージエンコーディングアーキテクチャでパフォーマンスが改善されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:10:56 GMT)
Differential Privacy with Higher Utility by Exploiting Coordinate-wise Disparity: Laplace Mechanism Can Beat Gaussian in High Dimensions [9.2] 我々は、i.n.d. Gaussian と Laplace のメカニズムを研究し、これらのメカニズムがプライバシーを保証する条件を得る。
i.n.d.ノイズは, (a) 座標降下, (b) 主成分分析, (c) グループクリッピングによる深層学習における性能を向上することを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:59:02 GMT)
Which Demographics do LLMs Default to During Annotation? [9.2] データアノテーションに大規模言語モデル(LLM)を用いることで、2つの研究方向が開発された。
我々は,ヒトアノテータLLMのどの属性が本質的に模倣されているかを評価する。
性別、人種、年齢に関連する顕著な影響を、人口動態の促進において観察する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:22:40 GMT)
Which Demographics do LLMs Default to During Annotation? [9.2] データアノテーションに大規模言語モデル(LLM)を用いることで、2つの研究方向が開発された。
我々は,ヒトアノテータLLMのどの属性が本質的に模倣されているかを評価する。
性別、人種、年齢に関連する顕著な影響を、人口動態の促進において観察する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:22:40 GMT)
SensorLLM: Aligning Large Language Models with Motion Sensors for Human Activity Recognition [9.1] 我々は、Large Language Models(LLM)が人間の活動認識(HAR)のような時系列タスクを理解できるようにすることで、ウェアラブルセンサー技術とパーソナライズされたAIアシスタントのギャップを埋める。
センサデータタスクに対するLLMのポテンシャルを解放する2段階フレームワークであるSensorLLMを紹介する。
我々は,SensorLLMが効果的なセンサ学習者,推論者,学習者へと進化し,HARタスクのための多様なデータセットをまたいで一般化できることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:30:41 GMT)
A Personalized MOOC Learning Group and Course Recommendation Method Based on Graph Neural Network and Social Network Analysis [9.1] このモデルは、様々な高等教育MOOCプラットフォームから4万人近いユーザーと数万のコースに関するデータを利用している。
収集したデータを利用して、学生のためのコースや学習グループに関するパーソナライズされたレコメンデーションを提供するAIベースのアシスタントが開発された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:06:56 GMT)
Identity-Focused Inference and Extraction Attacks on Diffusion Models [9.0] トレーニングデータに個人のアイデンティティを含むことをモデル所有者に説明できる新しいアイデンティティ推論フレームワークを導入する。
我々のアプローチは、アイデンティティレベルの推論に焦点をあてることで、従来のメンバーシップ推論攻撃を超えています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:50:25 GMT)
Offline Inverse Constrained Reinforcement Learning for Safe-Critical Decision Making in Healthcare [8.9] 医療に応用された強化学習(RL)は、過度の服用や急激な変化など、安全でない医療判断や治療につながる可能性がある。
最近の逆制約強化学習(ICRL)は、専門家による実証から制約を推測する有望なアプローチである。
これらの設定は、オフラインデータセットに記録された歴史的な処理に依存する医療における意思決定システムの実践的な要件とは一致しない。
具体的には,1)制約の重み付けに非マルコフ層を用いながら,歴史的決定と観察を制約モデルに組み込む因果的注意機構を利用する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:25:45 GMT)
Offline Inverse Constrained Reinforcement Learning for Safe-Critical Decision Making in Healthcare [8.9] 医療に応用された強化学習(RL)は、過度の服用や急激な変化など、安全でない医療判断や治療につながる可能性がある。
最近の逆制約強化学習(ICRL)は、専門家による実証から制約を推測する有望なアプローチである。
これらの設定は、オフラインデータセットに記録された歴史的な処理に依存する医療における意思決定システムの実践的な要件とは一致しない。
具体的には,1)制約の重み付けに非マルコフ層を用いながら,歴史的決定と観察を制約モデルに組み込む因果的注意機構を利用する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:25:45 GMT)
A Multi-Task Text Classification Pipeline with Natural Language Explanations: A User-Centric Evaluation in Sentiment Analysis and Offensive Language Identification in Greek Tweets [8.8] この研究は、テキスト分類タスクで使用できる新しいパイプラインの初期の概念を紹介している。
テキストをラベル付けする分類器と、説明を提供する説明生成器の2つのモデルから構成される。
ギリシャのツイートにおける感情分析と攻撃的な言語識別のタスクを中心に実験が行われている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:41:31 GMT)
Generating Model Parameters for Controlling: Parameter Diffusion for Controllable Multi-Task Recommendation [8.8] PaDiRecは、リトレーニングなしで、リコメンデーションモデルパラメータを新しいタスク要求にカスタマイズおよび適応することを可能にする。
パラメータ生成として拡散モデルを用い、条件付きトレーニングにおいてアダプタフリーガイダンスを用いて最適化されたモデルパラメータの分布を学習する。
モデルに依存しないアプローチとして、PaDiRecは既存のレコメンデーションモデルをバックボーンとして利用して、コントロール性を高めることができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:50:35 GMT)
The Epochal Sawtooth Effect: Unveiling Training Loss Oscillations in Adam and Other Optimizers [8.8] テキストEpochal Sawtooth Effect (ESE) と呼ばれる繰り返し学習損失パターンを特定し解析する。
このパターンは、各エポックの始めに急激な損失が減少し、その後徐々に増加し、ソートゥース状の損失曲線が生じる。
Epochal Sawtooth 効果に繋がるメカニズムの詳細な説明を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:51:21 GMT)
Neuro-Vision to Language: Enhancing Brain Recording-based Visual Reconstruction and Language Interaction [8.6] 非侵襲的な脳記録の復号化は、人間の認知の理解を深める鍵となる。
本研究では,視覚変換器を用いた3次元脳構造と視覚的意味論を統合した。
マルチモーダル大モデル開発を支援するために,fMRI画像関連テキストデータを用いたfMRIデータセットを改良した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:23:48 GMT)
ProDAG: Projection-Induced Variational Inference for Directed Acyclic Graphs [8.6] 直接非巡回グラフ(DAG)学習は急速に研究の領域を広げている。
データから単一の(点推定)DAGを学習することは統計的かつ計算的に困難であり、もちろん不確実な定量化を提供する。
本稿では,DAGの空間を直接支援する新しい分布に基づくベイズ変分推論フレームワークを開発することで,グラフの不確かさを定量化する難しい課題について論じる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:35:34 GMT)
KBLaM: Knowledge Base augmented Language Model [8.2] 外部知識を用いた大規模言語モデル拡張のための知識ベース拡張言語モデル(KBLaM)を提案する。
KBLaMは文書のコーパスから構築された知識ベースで動作し、KB内の各知識を連続キー値ベクトル対に変換する。
KBLaMの様々なタスクにおける有効性を示す実験は、質問応答やオープンエンド推論などである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:45:10 GMT)
From Artificial Needles to Real Haystacks: Improving Retrieval Capabilities in LLMs by Finetuning on Synthetic Data [8.2] 長文処理のための微調整モデルは、情報検索と推論能力を改善する。
提案手法は,合成から実タスク評価へのスキルの移転を図った微調整モデルの解析である。
本研究は,LLMの性能向上のための合成データへの微調整の可能性を明らかにする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:58:42 GMT)
Online waveform selection for cognitive radar [8.2] オンライン方式で波形パラメータを選択する適応アルゴリズムを提案する。
本稿では,帯域幅のスケーリング,Qラーニング,Qラーニングのルックアヘッドという3つの強化学習アルゴリズムを提案する。
提案アルゴリズムは、目標を失わずにレンジ誤差を最小化し、連続的な追跡を維持するという2つの目的を達成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:01:41 GMT)
Limit Distribution Theory for Quantum Divergences [8.1] 推定誤差の変動を特徴付ける極限分布理論はまだ未熟であることを示す。
この結果の適用例として、量子状態のパウリトモグラフィーに基づく量子相対エントロピーの推定器を検討し、その結果の分布が正規であり、パウリ作用素と状態の項で特徴づけられることを示す。
上記の限界分布の知識を利用して、多仮説テスト問題の性能保証を得る。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:23:34 GMT)
What Does It Mean to Be a Transformer? Insights from a Theoretical Hessian Analysis [8.0] Transformerアーキテクチャは、間違いなくディープラーニングに革命をもたらした。
中心となる注意ブロックは、ディープラーニングにおける他のほとんどのアーキテクチャコンポーネントと形式と機能の違いです。
これらの外向きの表現の背後にある根本原因と、それらを管理する正確なメカニズムは、まだ理解されていないままである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:15:02 GMT)
Slide-based Graph Collaborative Training for Histopathology Whole Slide Image Analysis [7.8] 我々は既存のMIL(Multiple Instance Learning)フレームワークに適応できる汎用的なWSI分析パイプラインSlideGCDを提案する。
新しいパラダイムでは、がん開発に関する事前知識がエンドツーエンドのワークフローに参加することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:14:40 GMT)
Detecting Unforeseen Data Properties with Diffusion Autoencoder Embeddings using Spine MRI data [7.8] 深層学習は、診断と予後を改善するために大規模なデータセットを利用することによって、医療画像に大きく貢献してきた。
大規模なデータセットには、主題の選択と取得による固有のエラーが伴うことが多い。
拡散オートエンコーダの埋め込みによるデータ特性とバイアスの解明と理解について検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:24:26 GMT)
MTLLM: LLMs are Meaning-Typed Code Constructs [7.7] 本稿では,大規模言語モデル(LLM)をプログラミングに統合するための簡易なアプローチを提案する。
提案手法は,従来のプログラミング言語と自然言語を自動的に翻訳するために,既存のプログラムのセマンティック・リッチネスを利用する。
そこで本研究では,SOTA LLMソフトウェア開発ツールと比較し,本手法の完全機能および実運用レベルの実装について述べる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:20:40 GMT)
NAR-*ICP: Neural Execution of Classical ICP-based Pointcloud Registration Algorithms [7.5] 本研究ではニューラルネットワークと古典ロボットアルゴリズムの交点をニューラルネットワーク推論フレームワークを用いて検討する。
我々は従来のICPベースのポイントクラウド登録アルゴリズムの中間アルゴリズムステップを学習するグラフニューラルネットワーク(GNN)ベースの学習フレームワークであるNAR-*ICPを提案する。
我々は、実世界から合成まで多様なデータセットにまたがってアプローチを評価し、複雑でノイズの多い入力を扱う際の柔軟性を実証した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:33:46 GMT)
Comparison of deep learning and conventional methods for disease onset prediction [7.5] 深層学習法は臨床データから複雑なパターンを抽出することにより予測性能の向上を約束する。
本研究は, 肺がん, 認知症, 双極性障害を予測するための従来の学習手法と深層学習法を比較した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:46:59 GMT)
Performance Evaluation of Deep Learning and Transformer Models Using Multimodal Data for Breast Cancer Classification [7.4] 乳がんの発生率と死亡率の上昇は、女性にとって大きな国際的懸念である。
深層学習(DL)は,BC分類において,ヒトの専門読者と比較して優れた診断性能を示した。
本研究では,BC分類のための多モードDLアーキテクチャを提案し,画像(マンモグラム,4ビュー)とテキストデータ(放射線学的レポート)を新しい社内データセットから利用した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:22:24 GMT)
A duality framework for analyzing random feature and two-layer neural networks [7.4] 我々は$mathcalF_p,pi$およびBarron空間内の関数の学習問題を考察する。
近似と推定の二重同値を確立し、それを用いて先行する関数空間の学習を研究する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:08:16 GMT)
TotalVibeSegmentator: Full Torso Segmentation for the NAKO and UK Biobank in Volumetric Interpolated Breath-hold Examination Body Images [7.4] 本稿では, 容積補間呼吸保持検査(VIBE)画像に基づいて, 大規模な疫学データセットのためのトルソセグメンテーションネットワークを提案する。
NAKO(85名)とUK Biobank(16名)のサブセットを用いて, ホールドアウトセット(12名)におけるDice-scoreの評価を行った。
腹部のDiceスコアは0.90点,膵は0.70点であった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:31:45 GMT)
GraphMaker: Can Diffusion Models Generate Large Attributed Graphs? [7.3] ノード属性を持つ大規模グラフは、様々な現実世界のアプリケーションでますます一般的になっている。
従来のグラフ生成法は、これらの複雑な構造を扱う能力に制限がある。
本稿では,大きな属性グラフを生成するために特別に設計された新しい拡散モデルであるGraphMakerを紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:09:21 GMT)
ADFQ-ViT: Activation-Distribution-Friendly Post-Training Quantization for Vision Transformers [7.2] ビジョントランスフォーマー(ViT)の量子化は、これらの課題を緩和するための有望なソリューションとして現れている。
既存の手法は依然として低ビットでの精度の低下に悩まされている。
ADFQ-ViTは、画像分類、オブジェクト検出、および4ビットでのインスタンスセグメンテーションタスクにおいて、様々なベースラインを大幅に改善する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:22:21 GMT)
Explain Like I'm Five: Using LLMs to Improve PDE Surrogate Models with Text [7.1] 事前訓練されたLarge Language Models (LLM) を用いて、PDE学習に様々な既知のシステム情報を統合する。
我々のアプローチは、次のステップ予測と自動ロールアウトパフォーマンスの両方において、ベースラインモデルであるFactFormerよりも大幅に優れています。
さらなる分析により、事前学習されたLLMは、テキストを通して提供されるシステム情報量と一致した高度に構造化された潜在空間を提供することが示された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:53:07 GMT)
Explain Like I'm Five: Using LLMs to Improve PDE Surrogate Models with Text [7.1] 事前訓練されたLarge Language Models (LLM) を用いて、PDE学習に様々な既知のシステム情報を統合する。
我々のアプローチは、次のステップ予測と自動ロールアウトパフォーマンスの両方において、ベースラインモデルであるFactFormerよりも大幅に優れています。
さらなる分析により、事前学習されたLLMは、テキストを通して提供されるシステム情報量と一致した高度に構造化された潜在空間を提供することが示された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:53:07 GMT)
Explain Like I'm Five: Using LLMs to Improve PDE Surrogate Models with Text [7.1] 事前訓練されたLarge Language Models (LLM) を用いて、PDE学習に様々な既知のシステム情報を統合する。
我々のアプローチは、次のステップ予測と自動ロールアウトパフォーマンスの両方において、ベースラインモデルであるFactFormerよりも大幅に優れています。
さらなる分析により、事前学習されたLLMは、テキストを通して提供されるシステム情報量と一致した高度に構造化された潜在空間を提供することが示された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:53:07 GMT)
Augmenting In-Context-Learning in LLMs via Automatic Data Labeling and Refinement [7.1] 本稿では,デモの自動生成とフィルタを行うADLR(Automatic Data Labeling and Refinement)を提案する。
コードベースのテーブルQAと数学的推論におけるADLRの利点を実証し、最大5.5%のゲインを達成した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:06:58 GMT)
Signature Kernel Conditional Independence Tests in Causal Discovery for Stochastic Processes [7.1] 条件付き独立性(CI)の制約を、選択した間隔で調整する。
我々は,完全かつ完全な因果探索アルゴリズムを提案し,完全な観測データと部分的な観測データの両方を扱えるようにした。
また、これらの制約をデータから推測するために、フレキシブルで一貫したカーネルベースのCIテストを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:23:00 GMT)
SGUQ: Staged Graph Convolution Neural Network for Alzheimer's Disease Diagnosis using Multi-Omics Data [7.1] アルツハイマー病(英語: Alzheimer's disease、AD)は、慢性神経変性疾患であり、認知症の主要な原因である。
従来のアプローチでは、通常、最適なAD診断を達成するために、すべてのオミクスデータを最初から完了する必要がある。
我々は不確実性定量化(SGUQ)を用いたグラフ畳み込みネットワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:51:32 GMT)
Enhancing JEPAs with Spatial Conditioning: Robust and Efficient Representation Learning [7.1] Image-based Joint-Embedding Predictive Architecture (IJEPA)は、Masked Autoencoder (MAE)に代わる魅力的な代替手段を提供する。
IJEPAは表現を駆動し、入力空間ではなく潜在領域で予測することで有用な意味情報をキャプチャする。
我々の"条件付き"エンコーダは、いくつかの画像分類ベンチマークデータセットのパフォーマンス向上を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:46:24 GMT)
Detecting Out-of-Distribution Through the Lens of Neural Collapse [7.0] 安全なデプロイメントには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
既存の検出器は、一般化の相違とコストの懸念を示す。
我々はニューラル崩壊の傾向にインスパイアされた、高度に多用途で効率的なOOD検出器を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:26:21 GMT)
Geometry-aware training of factorized layers in tensor Tucker format [6.7] 重みテンソルのタッカー分解の要因を学習するための新しい手法を提案する。
トレーニングの提案は, 元の非リファクタリング力学を局所的に近似する上で最適であることが証明された。
本稿では,アルゴリズムの理論解析を行い,収束,近似,局所降下保証を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:17:52 GMT)
A policy gradient approach for Finite Horizon Constrained Markov Decision Processes [6.7] 固定時間(有限時間)後に地平線が終了する有限水平設定における制約付きRLのアルゴリズムを提案する。
我々の知る限り、制約付き有限地平線設定のための最初のポリシー勾配アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:18:54 GMT)
Reverse Refinement Network for Narrow Rural Road Detection in High-Resolution Satellite Imagery [6.6] R2-Netは、狭い農村道路を抽出し、背景からの接続性や特徴性を向上する。
実験では、R2-NetとDeepGlobeロード抽出データセットとWHU-RuR+グローバル大規模農村道路データセットを用いた最先端手法を比較した。
その結果,提案するR2-Netは大規模道路地図アプリケーションにおいて大きな性能上の利点があることがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:23:47 GMT)
QueST: Querying Functional and Structural Niches on Spatial Transcriptomics Data via Contrastive Subgraph Embedding [6.6] QueSTは、複数のサンプル間で空間ニッチを問合せするために設計された、新しいニッチ表現学習モデルである。
確立されたベンチマーク上で、人間とマウスのデータセットを用いてQueSTを評価する。
QueSTは空間的ニッチなクエリのための特殊なモデルを提供し、組織全体にわたる細胞空間構造のパターンとメカニズムについて深い洞察を得るための道を開く。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:01:27 GMT)
A Unified Linear Programming Framework for Offline Reward Learning from Human Demonstrations and Feedback [6.6] Inverse Reinforcement Learning (IRL) と Reinforcement Learning from Human Feedback (RLHF) は報酬学習における重要な方法論である。
本稿では,オフライン報酬学習に適した新しい線形プログラミング(LP)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:39:03 GMT)
CSGDN: Contrastive Signed Graph Diffusion Network for Predicting Crop Gene-phenotype Associations [6.6] 我々は、より少ないトレーニングサンプルでロバストなノード表現を学習し、より高いリンク予測精度を実現するために、コントラスト符号付きグラフ拡散ネットワーク(CSGDN)を提案する。
Gossypium hirsutum, Brassica napus, Triticum turgidumの3つの作物データセット上でCSGDNの有効性を検証する実験を行った。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:50:55 GMT)
CSGDN: Contrastive Signed Graph Diffusion Network for Predicting Crop Gene-Trait Associations [6.6] 我々は、より少ないトレーニングサンプルでロバストなノード表現を学習し、より高いリンク予測精度を実現するために、コントラスト符号付きグラフ拡散ネットワーク(CSGDN)を提案する。
Gossypium hirsutum, Brassica napus, Triticum turgidumの3つの作物データセット上でCSGDNの有効性を検証する実験を行った。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:50:55 GMT)
LCD-Net: A Lightweight Remote Sensing Change Detection Network Combining Feature Fusion and Gating Mechanism [6.6] リモートセンシング画像変化検出(RSCD)は動的表面変化の監視に不可欠である。
従来のCNNベースの手法は、高い計算複雑性と大きなパラメータ数に悩まされている。
本稿では,高検出性能を維持しつつ,モデルサイズと計算コストを低減する軽量な変更検出ネットワーク(LCD-Net)を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:33:30 GMT)
LARA: Linguistic-Adaptive Retrieval-Augmentation for Multi-Turn Intent Classification [6.5] LARAは言語適応型検索・拡張フレームワークで、6言語にわたるマルチターン分類タスクの精度を高める。
実験により,LARAは多ターン目的分類タスクにおける最先端性能を実現することが示された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:26:10 GMT)
Random non-Hermitian action theory for stochastic quantum dynamics: from canonical to path integral quantization [6.4] ヒルベルト空間における量子状態の非線形ダイナミクスを記述するランダム非エルミート作用の理論を開発する。
非ハーミティー性およびランダム性の影響を受け, 単一粒子ガウス波パケットの進化について検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:15:18 GMT)
StegaINR4MIH: steganography by implicit neural representation for multi-image hiding [6.3] 複数の秘密画像を隠蔽画像に埋め込んだマルチ画像隠蔽は、画像ステガノグラフィー分野における研究ホットスポットになりつつある。
本稿では,1つの暗黙的表現関数内に複数の画像を隠蔽できる新しい暗黙的表現ステガノグラフィーフレームワークであるStegaINR4MIHを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:09:41 GMT)
Use Random Selection for Now: Investigation of Few-Shot Selection Strategies in LLM-based Text Augmentation for Classification [6.3] 生成型大規模言語モデル(LLM)は、データ拡張タスクにますます使われています。
数ショットの学習文献に存在するサンプル選択戦略を比較し,LLMに基づくテキスト拡張におけるそれらの効果について検討する。
結果から,一部の情報化戦略ではモデルの性能が向上する一方,限界性能が向上してもほとんど発生しないことがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:30:08 GMT)
Jailbreak Instruction-Tuned LLMs via end-of-sentence MLP Re-weighting [6.3] 命令微調整言語モデル(LLM)の安全性機構について検討する。
我々は,新しいホワイトボックス・ジェイルブレイク法(プロンプト固有法とプロンプト一般法)を開発した。
提案手法は,2Bから72Bまでの7種類のオープンソースLLMに対して,堅牢な性能を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:32:22 GMT)
SynCo: Synthetic Hard Negatives in Contrastive Learning for Better Unsupervised Visual Representations [6.2] 表現空間上で合成ハードネガティブを生成することによってモデル性能を向上させる新しい手法であるSynCoを導入する。
MoCoフレームワーク上に構築されたSynCoは,計算オーバーヘッドを最小限に抑えた,さまざまな合成ハードネガをオンザフライで生成するための6つの戦略を導入している。
我々の合成ハード・ネガティブ・ジェネレーション・アプローチは、自己教師付きコントラスト学習を通じて学習した視覚的表現を著しく向上させる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:48:25 GMT)
SynCo: Synthetic Hard Negatives in Contrastive Learning for Better Unsupervised Visual Representations [6.2] 表現空間上で合成ハードネガティブを生成することによってモデル性能を向上させる新しい手法であるSynCoを導入する。
MoCoフレームワーク上に構築されたSynCoは,計算オーバーヘッドを最小限に抑えた,さまざまな合成ハードネガをオンザフライで生成するための6つの戦略を導入している。
我々の合成ハード・ネガティブ・ジェネレーション・アプローチは、自己教師付きコントラスト学習を通じて学習した視覚的表現を著しく向上させる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:48:25 GMT)
SynCo: Synthetic Hard Negatives in Contrastive Learning for Better Unsupervised Visual Representations [6.2] 合成強陰性を生成することによってモデル性能を向上させる新しいコントラスト学習手法であるSynCoを導入する。
MoCoフレームワーク上に構築されたSynCoは、多様な合成ハードネガティブを作成するための6つの新しい戦略を導入している。
より高速なトレーニングと表現学習を実現し、ImageNet線形評価において、トップ1の精度68.1%を達成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:48:25 GMT)
BanglaQuAD: A Bengali Open-domain Question Answering Dataset [6.2] ベンガル語は地球上で7番目に話される言語であるが、自然言語処理(NLP)の分野では低リソース言語と考えられている。
本稿では,ベンガル語ウィキペディアの記事から構築した30,808組の質問応答ペアを母語話者によって構成したベンガル語質問応答データセットであるBanglaQuADを紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:39:59 GMT)
Enhancing AI Assisted Writing with One-Shot Implicit Negative Feedback [6.2] Niftyは、テキスト生成プロセスに暗黙のフィードバックを制御的に統合するために、分類器のガイダンスを使用するアプローチである。
また,ルージュ-Lでは最大で34%,正しい意図の生成では89%,人間評価では86%の勝利率を示した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:50:28 GMT)
BinSimDB: Benchmark Dataset Construction for Fine-Grained Binary Code Similarity Analysis [6.1] 我々は、BinSimDBと呼ばれる細粒度のバイナリコード類似性解析のためのベンチマークデータセットを構築した。
具体的には,2つのバイナリコードスニペット間の相違を補うためのBMergeアルゴリズムとBPairアルゴリズムを提案する。
実験の結果、BinSimDBはバイナリコード類似性比較の性能を大幅に改善することが示された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:13:48 GMT)
Adaptive Probabilistic ODE Solvers Without Adaptive Memory Requirements [6.1] メモリ要求を固定した適応確率的解法を開発した。
本手法に切り替えることにより,長期連続におけるメモリの問題が解消される。
また、ジャスト・イン・タイムのコンパイルをアンロックすることで、桁違いのシミュレーションを高速化する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:10:47 GMT)
Defining Boundaries: A Spectrum of Task Feasibility for Large Language Models [6.0] 大規模言語モデル(LLM)は、様々なタスクにおいて顕著なパフォーマンスを示しているが、多くの場合、その知識や能力を超えるクエリを処理できない。
本稿では,LLMが能力を超えるために必要なスキルのために,実用不可能なタスクを認識し,拒否する必要性に対処する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:31:45 GMT)
Enhancing Performance of Point Cloud Completion Networks with Consistency Loss [5.9] 本稿では,1対1のマッピング問題を緩和するために,新しい完了整合性損失を用いて従来の学習目標を強化することを提案する。
提案した整合性損失は,既存ネットワークの補完性能を向上させるのに優れる。
特に、提案された一貫性損失でトレーニングされた最先端のポイントコンプリートネットワークは、挑戦的な新しいMVPデータセットで最先端の精度を達成することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:36:49 GMT)
Enhancing Performance of Point Cloud Completion Networks with Consistency Loss [5.9] 本稿では,1対1のマッピング問題を緩和するために,新しい完了整合性損失を用いて従来の学習目標を強化することを提案する。
提案した整合性損失は,既存ネットワークの補完性能を向上させるのに優れる。
特に、提案された一貫性損失でトレーニングされた最先端のポイントコンプリートネットワークは、挑戦的な新しいMVPデータセットで最先端の精度を達成することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:36:49 GMT)
Liger Kernel: Efficient Triton Kernels for LLM Training [5.9] 大規模言語モデル(LLM)を大規模に効果的に訓練することは、ますます増大する計算要求によって引き起こされる、恐ろしい挑戦となる。
LLMトレーニング用に開発されたTritonカーネルのオープンソースセットであるLiger- Kernelを紹介する。
カーネル操作の融合や入力チャンキングといったカーネル最適化技術により、カーネルはトレーニングのスループットが平均20%向上し、GPUメモリ使用量が60%削減された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:17:01 GMT)
Gaussian Mixture Vector Quantization with Aggregated Categorical Posterior [5.9] ベクトル量子化変分オートエンコーダ(VQ-VAE)を導入する。
VQ-VAEは、離散埋め込みを潜時として使用する変分オートエンコーダの一種である。
GM-VQは,手工芸品に頼らずに,コードブックの利用率を向上し,情報損失を低減する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:58:11 GMT)
Everyday Speech in the Indian Subcontinent [5.8] 共通ラベルセットは、多言語合成のためのEnd to End (E2E)フレームワークで必要とされる大きな語彙単位の問題に対処するために開発された。
本稿では,音声合成における新たな知見を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:48:36 GMT)
On Information-Theoretic Measures of Predictive Uncertainty [5.8] その重要性にも拘わらず、予測の不確実性の正しい測定に関するコンセンサスはいまだに解明されていない。
提案手法は, 予測の不確かさを, (I) 予測モデル (II) 真の予測分布の近似の2つの要因により分類する。
本研究では, 誤分類検出, 選択的予測, アウト・オブ・ディストリビューション検出など, 典型的な不確実性推定設定において, これらの指標を実証的に評価する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:52:18 GMT)
Enhancing High-Level Synthesis with Automated Pragma Insertion and Code Transformation Framework [5.7] 高レベルの合成、ソース・ソース・コンパイラ、およびプラグマ挿入のための様々な設計空間探索技術により、生成された設計結果の品質が大幅に向上した。
これらのツールは、開発時間を短縮し、パフォーマンスを向上するといった利点を提供する。
しかしながら、高品質な結果を達成するには、通常、個別または前処理ステップとして実行される、追加の手動コード変換とタイリング選択が必要になることが多い。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:12:48 GMT)
Polyrating: A Cost-Effective and Bias-Aware Rating System for LLM Evaluation [5.7] ポリーティング(Polyrating)は、最大後方推定に基づく表現的かつ柔軟な評価システムである。
人間の嗜好に影響を与えるバイアスを検出し定量化し、より公平なモデル比較を保証する。
人的評価のコストを、新しいモデルで最大41%、新しいタスクで最大77%削減することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:01:33 GMT)
A Unified Approach to Routing and Cascading for LLMs [5.7] 効果的な戦略は、全体的なパフォーマンスを大幅に向上させ、単一の大きなモノリシックモデルよりも改善を提供する。
既存のアプローチは、ルーティング(ルーティング)、クエリ毎に1つのモデルが選択される、カスケード(キャスケード)という2つのカテゴリに分類される。
本稿では,カスケードルーティングという新しい手法を提案する。この手法は,ルーティングの適応性とカスケードのコスト効率を併用する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:00:49 GMT)
Exponents for classical-quantum channel simulation in purified distance [5.6] エンタングルメント支援古典量子チャネルシミュレーションにおける正確な誤差と強い逆指数を決定する。
我々は、量子忠実度、追加補助チャネル技術、チェビシェフの不等式による近似、エントロピー連続性境界の様々な特性を批判的に利用する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:45:41 GMT)
Focused ReAct: Improving ReAct through Reiterate and Early Stop [5.6] 再試行と早期停止機構を組み込んだReActパラダイムの拡張版であるFocused ReActを紹介した。
その結果,元のReAct法と比較して18%から530%の精度向上と34%のランタイム削減が得られた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:49:54 GMT)
Bridging the Gap between Text, Audio, Image, and Any Sequence: A Novel Approach using Gloss-based Annotation [5.5] 本稿では,光沢に基づくアノテーションを利用してマルチモーダル理解を簡素化する,BGTAIと呼ばれる革新的な手法を提案する。
テキストと音声を、複雑な意味的ニュアンスを省略するグロス表記として表現することで、画像との整合性が向上する可能性がある。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:06:37 GMT)
Bridging the Gap between Text, Audio, Image, and Any Sequence: A Novel Approach using Gloss-based Annotation [5.5] 本稿では,光沢に基づくアノテーションを利用してマルチモーダル理解を簡素化する,BGTAIと呼ばれる革新的な手法を提案する。
テキストと音声を、複雑な意味的ニュアンスを省略するグロス表記として表現することで、画像との整合性が向上する可能性がある。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:06:37 GMT)
C-Learner: Constrained Learning for Causal Inference and Semiparametric Statistics [5.4] そこで本研究では,安定なプラグイン推定を望ましい特性で実現する新しいデバイアス推定器を提案する。
我々の制約学習フレームワークは、プラグイン量に対する一階誤差がゼロであるという制約の下で、最高のプラグイン推定器を解く。
我々の推定器は、処理と制御の重複が限定された挑戦的な環境での一段階推定と目標を上回り、それ以外は比較可能である。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:34:30 GMT)
The Boomerang protocol: A Decentralised Privacy-Preserving Verifiable Incentive Protocol [5.4] プライバシー保護インセンティブシステムのためのBOOMERANGプロトコルを提案する。
暗号化ブラックボックスアキュムレータを使用して、ユーザのインタラクションをプライベートに保存する。
また、ユーザーへの報酬を透過的に計算するためにゼロ知識証明も採用している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:32:42 GMT)
TextCtrl: Diffusion-based Scene Text Editing with Prior Guidance Control [5.4] テキストを事前の誘導制御で編集する拡散法であるTextCtrlを提案する。
i) きめ細かなテキストスタイルの不整合と頑健なテキスト構造表現を構築することにより、TextCtrlはモデル設計とネットワークトレーニングにスタイル構造ガイダンスを明示的に組み込んで、テキストスタイルの一貫性とレンダリング精度を大幅に向上させる。
実世界のSTE評価ベンチマークの空白を埋めるために、フェアな比較のためにScenePairと呼ばれる最初の実世界の画像ペアデータセットを作成します。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:50:39 GMT)
First Creating Backgrounds Then Rendering Texts: A New Paradigm for Visual Text Blending [5.4] 背景作成とテキストのレンダリングの両方を含む新しいビジュアルテキストブレンディングパラダイムを提案する。
具体的には、背景生成装置を開発し、高忠実でテキストフリーな自然画像を生成する。
また,シーンテキスト検出のためのシーンテキストデータセット合成など,本手法に基づくダウンストリームアプリケーションについても検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:23:43 GMT)
Hard-Constrained Neural Networks with Universal Approximation Guarantees [5.4] HardNetは、モデルキャパシティを犠牲にすることなく、本質的に厳しい制約を満たすニューラルネットワークを構築するためのフレームワークである。
ニューラルネットワークの普遍近似能力はHardNetが保持していることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:24 GMT)
Language Model Powered Digital Biology [5.3] 本稿では,バイオインフォマティクス検索データ(BRAD)デジタルアシスタントのプロトタイプについて述べる。
BRADは、コード実行からオンライン検索まで、バイオインフォマティクスタスクを処理する一連のツールを統合するロボットとエージェントシステムである。
我々は,(1)検索拡張生成(RAG)による質問・回答の改善,(2)複雑なソフトウェアパイプラインの実行能力,(3)エージェントパイプラインにおけるタスクの整理・配布能力を通じて,その能力を実証する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:07:54 GMT)
Bayesian quantum phase estimation with fixed photon states [5.3] 我々は、上モードと下モードがそれぞれ位相$phi$と$-phi$を拾うmathbbN$に固定光子数$nの2モードボソニック状態を考える。
入力状態の最適Fock係数を計算し、$phi$を推定する平均二乗誤差(MSE)を最小化する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:30:49 GMT)
Browsing without Third-Party Cookies: What Do You See? [5.2] サードパーティのWebクッキーは、プライバシーを侵害する行動追跡によく使用される。
サードパーティのクッキーレスブラウジングの効果を理解するために、私たちはTrancoのトップ1万のウェブサイトをクロールして測定しました。
我々は,サードパーティ製クッキーを除去するフレームワークを開発し,これらのクッキーを使用せずにWebページの外観の違いを分析する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:47:43 GMT)
Inadequacies of Large Language Model Benchmarks in the Era of Generative Artificial Intelligence [5.1] 我々は、23の最先端のLarge Language Models (LLMs)ベンチマークを批判的に評価する。
私たちの研究は、バイアス、真の推論、適応性、実装の不整合、エンジニアリングの複雑さ、多様性、文化的およびイデオロギー規範の見落としなど、重大な制限を明らかにしました。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:11:29 GMT)
QE-EBM: Using Quality Estimators as Energy Loss for Machine Translation [5.1] トレーニング可能な損失ネットワークとして品質推定器を用いるQE-EBMを提案する。
本稿では,ソース言語として英語を用いた低リソース・高リソースターゲット言語について検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:39:33 GMT)
Mitigating the Risk of Health Inequity Exacerbated by Large Language Models [5.0] 大規模言語モデルの入力に非決定的な社会デマトグラフィー要素を組み込むことは、誤った有害な出力につながる可能性があることを示す。
LLMベースの医療応用における健康不平等のリスクを検知・緩和する新しいフレームワークであるEquityGuardを紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:27:34 GMT)
Enhancing Equity in Large Language Models for Medical Applications [5.0] LLMベースの医療応用におけるバイアスの検出と緩和を目的とした新しいフレームワークであるEquityGuardを提案し,評価する。
EquityGuardは不公平な予測を識別し修正できるバイアス検出メカニズムを導入し、その結果を高め、多様な集団間での株式の共有を促進する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:27:34 GMT)
Variational Inference in Location-Scale Families: Exact Recovery of the Mean and Correlation Matrix [5.0] 抽出可能なターゲット密度$p$が与えられたとき、変動推論(VI)は、抽出可能なファミリー$Q$から最高の近似$q$を見つけようとする。
実際、$Q$ は$p$ を含ませるほど豊かではないし、その近似は $textKL(q||p)$ のユニークな大域最小化器である場合でも誤特定される。
軽度な規則性条件だけでなく,過度な不特定に直面した場合にも,VIの強い保証が証明される。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:25:49 GMT)
Causal Modeling of Climate Activism on Reddit [5.0] 我々は、Redditユーザーが大規模な気候抗議を推進している活動家コミュニティとどのように、なぜ関わりを持つのかについて、包括的な因果関係モデルを構築している。
気候変動に関心のあるユーザーの間では、オンライン活動家コミュニティへの参加は、実際に活動家と直接の交流に影響されている。
気候変動を自覚する人々の中で、社会経済的背景の低い左派は特にオンライン活動家グループに代表される。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:41:09 GMT)
ChuLo: Chunk-Level Key Information Representation for Long Document Processing [5.0] ChuLoは長い文書分類のための新しいチャンク表現法である。
提案手法は,情報損失を最小限に抑え,トランスフォーマーモデルの有効性を向上させる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:06:54 GMT)
Recipe for Zero-shot POS Tagging: Is It Useful in Realistic Scenarios? [5.0] 本稿では、限られたデータを持つ言語に対するPOSタグ付けに焦点を当てる。
対象言語からのラベル付きトレーニングデータを用いることなく,POSタグ付けモデルのトレーニングに好適なデータセットの特徴を特定する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:51:13 GMT)
Generalized Adversarial Code-Suggestions: Exploiting Contexts of LLM-based Code-Completion [4.9] 逆のコード提案は、データ中毒によって導入することができ、したがって、モデル作成者が無意識に行うことができる。
本稿では、このような攻撃を一般化した定式化を行い、この領域における関連する研究を創出し、拡張する。
後者は新規でフレキシブルな攻撃戦略を生み出し、敵は特定のユーザーグループに対して最適なトリガーパターンを任意に選択できる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:06:05 GMT)
Weakly Supervised Veracity Classification with LLM-Predicted Credibility Signals [4.9] Pastelは、Webコンテンツから信頼性信号を取り出すために、大きな言語モデルを活用する弱い教師付きアプローチである。
信頼性信号と信頼性の関係について検討し,各信号がモデル性能に与える影響について検討した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:58:15 GMT)
Computability Theory of Closed Timelike Curves [4.8] 本研究では,過去へのタイムトラベルを備えたチューリングマシンで計算可能な問題について検討する。
別の見方として、計算可能なマルコフ鎖と数え切れないほど無限次元の量子チャネルの近似的な固定点を見つける複雑さについて研究する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:20:42 GMT)
Generating Global and Local Explanations for Tree-Ensemble Learning Methods by Answer Set Programming [4.8] 本稿では,ツリーアンサンブル学習手法のグローバルおよびローカルな説明としてルールセットを生成する手法を提案する。
グローバルな説明のために、候補ルールは訓練されたツリーアンサンブルモデル全体から選択される。
局所的な説明では、候補ルールは特定の予測されたインスタンスに関連するルールのみを考慮して選択される。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:32:29 GMT)
Characterizing the MrDeepFakes Sexual Deepfake Marketplace [4.8] 性的なディープフェイク素材の流行は、ここ数年で爆発した。
セクシュアルディープフェイク素材の売買を支援するために、いくつかの市場が出現している。
我々は、市場経済、創造されたメディアのターゲット、そしてディープフェイクの作り方に関するユーザーディスカッションを分析します。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:25:42 GMT)
Fairness in KI-Systemen [4.8] AIが支援する決定が人々の生活に影響を及ぼすほど、そのような決定の公平性がより重要になる。
本章では,機械学習における公正性の研究について紹介する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:01:07 GMT)
Automated Discovery of Continuous Dynamics from Videos [4.7] システム力学の滑らかさを保った状態変数の集合を探索する手法を提案する。
物理知識のないビデオストリームから自動的に,システムの動的方程式を表すベクトル場を構築する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:37:02 GMT)
Flexible Heteroscedastic Count Regression with Deep Double Poisson Networks [4.6] 本稿ではDDPN(Deep Double Poisson Network)を提案する。
DDPNは既存の離散モデルを大幅に上回っている。
これは様々なカウント回帰データセットに適用できる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:10:49 GMT)
Welfare Analysis in Dynamic Models [4.5] 動的選択の期待値の関数に対する推定法と推定法を提案する。
利子パラメータに対する動的リース表現器の最小二乗推定器が与えられる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:37:43 GMT)
Disentangling Hate Across Target Identities [4.5] 異なる因子がHS予測に与える影響を定量的に分析する。
一般的な産業モデルや学術モデルの実験では、HS検出器は特定のターゲットのアイデンティティの言及に基づいて、より高いヘイトフルネススコアを割り当てている。
また, ヘイトフルネス予測の精度がステレオタイプ強度と強く相関していることを明らかにする社会心理学理論に触発された研究を行った。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:43:08 GMT)
TRESTLE: A Model of Concept Formation in Structured Domains [4.4] 本稿では、構造化ドメインにおける確率論的概念形成の漸進的な説明であるTRESTLEを提案する。
教師なし学習タスクと教師なしクラスタリングタスクにおいて,TRESTLEの性能を評価する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:00:43 GMT)
Advancing Supervised Local Learning Beyond Classification with Long-term Feature Bank [4.4] ローカル学習は、ディープニューラルネットワークにおける従来のエンドツーエンドのバックエンドの代替手段を提供する。
Memory-augmented Auxiliary Network (MAN)は、シンプルな設計原則を導入し、マルチタスク適応性とコミュニケーションを強化する機能バンクを組み込んでいる。
MANはGPUメモリを保存するだけでなく、さまざまなビジュアルタスクのために複数のデータセットにまたがるエンドツーエンドのアプローチと同等のパフォーマンスを達成している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:51:29 GMT)
Revisiting Pure State Transformations with Zero Communication [4.4] 両部交絡状態の一般変換性は、古典的なコミュニケーションがなくても任意の誤りを犯すことはできないことが知られている。
特に、ゼロコミュニケーションプロトコルを用いて許容誤差を達成できるケースが多数存在する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:48:56 GMT)
Cone-Restricted Information Theory [4.4] 量子情報理論のどの結果が正の半定円錐に依存し、一般化できるかを示す。
拡張条件のmin-entropyについて並列解析を行った。
これにより、k-超陽性チャネルの概念を超陽性チャネルに拡張する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:57:40 GMT)
Equivalence Checking of Quantum Circuits via Intermediary Matrix Product Operator [4.3] 等価チェックは、量子回路のコンパイルと最適化中に発生するエラーを特定する上で重要な役割を果たす。
本稿では,量子回路の等価性を決定するために,行列積演算子(MPO)に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:00:00 GMT)
Which Spaces can be Embedded in $\mathcal{L}_p$-type Reproducing Kernel Banach Space? A Characterization via Metric Entropy [4.3] 我々は、計量エントロピー成長と函数空間の再生核ヒルベルト/バナッハ空間への埋め込み性の間に新しい接続を確立する。
その結果、複雑な関数空間を学習するためのカーネル手法のパワーと限界に新たな光を当てた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:53:19 GMT)
Vehicle-to-Vehicle Charging: Model, Complexity, and Heuristics [4.2] 車両間充電(V2VC)は、最近人気EVに採用されている。
本稿では,EV運転を最適化する際,意思決定者がV2VCを考慮に入れられる新しいV2VCモデルを提案する。
R-V2VCは、実世界の運用や、V2VCのコストと利益を評価する際のシナリオの研究に使用できる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:05:22 GMT)
Intelligent prospector v2.0: exploration drill planning under epistemic model uncertainty [4.1] 鉱物探査において、人間は複数の仮説を定義するために概念モデルに依存するかもしれない。
本稿では,部分的に観測可能なマルコフ決定プロセスに基づく知的エージェントを開発する。
提案手法は,2023年のザンビアにおける超高品位鉱床のキャラクタリゼーションに有効である。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:17:29 GMT)
Robustness of near-thermal dynamics on digital quantum computers [4.1] トロッター化量子回路は、広く想定されるよりも、量子ゲート誤差とトロッター(離散化)誤差の両方に対してより堅牢であることを示す。
我々は、熱状態に近いランダムな生成状態の統計的アンサンブルである新しい理論ツールを使用する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:57:03 GMT)
Composite Convolution: a Flexible Operator for Deep Learning on 3D Point Clouds [4.1] 本稿では,3次元点雲を処理する既存の畳み込み演算子に代わる,柔軟で汎用的な複合層について紹介する。
ConvPointやKPConvのような主流のポイント・コンボリューション・レイヤと比較して、我々のコンポジット・レイヤはネットワーク設計の柔軟性を保証し、さらなる正規化の形式を提供します。
合成および実世界のデータセットを用いた実験により,分類,セグメンテーション,異常検出の両面で,当社のCompositeNetsは,同じシーケンシャルアーキテクチャを用いたConvPointより優れており,より深い残差アーキテクチャを持つKPConvと同じような結果が得られることがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:41:03 GMT)
Resource Management and Circuit Scheduling for Distributed Quantum Computing Interconnect Networks [4.1] 分散量子コンピューティング(DQC)は、モノリシック量子プロセッサのスケーラビリティ制限を克服するための有望なアプローチとして登場した。
本稿では,このようなネットワークにおける資源割り当ての問題に対処し,量子ファーム環境における資源管理に焦点をあてる。
本稿では,QPU間通信遅延による劣化の最小化を目的とした,QPU割り当てのための多目的最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:48:45 GMT)
Resource Allocation in Distributed Quantum Computing Interconnect Networks [4.1] 分散量子コンピューティング(DQC)は、モノリシック量子プロセッサのスケーラビリティ制限を克服するための有望なアプローチとして登場した。
本稿では,このようなネットワークにおける資源割り当ての問題に対処し,量子ファーム環境における資源管理に焦点をあてる。
本稿では,QPU間通信遅延による劣化の最小化を目的とした,QPU割り当てのための多目的最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:48:45 GMT)
Balancing Continuous Pre-Training and Instruction Fine-Tuning: Optimizing Instruction-Following in LLMs [4.1] パブリック使用のための大規模言語モデル(LLM)は、最新のデータと最新の状態を維持するために、継続的な事前トレーニングを必要とする。
本研究では、命令データや微調整を必要とせず、最新の知識と命令追従能力を得るための最も計算効率の良い戦略を見つけることを目的とする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:20:30 GMT)
Exploiting Local Features and Range Images for Small Data Real-Time Point Cloud Semantic Segmentation [4.0] 本稿では,3次元表現から得られる情報を利用して局所的な特徴を巧みにとらえる。
GPUベースのKDTreeは、素早いビルド、クエリ、プロジェクションの強化を、簡単な操作で実現している。
我々は,本モデルの縮小バージョンが,本格的な最先端モデルに対して強い競争力を示すだけでなく,リアルタイムに動作することを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:49:05 GMT)
Hybrid Spatial Representations for Species Distribution Modeling [4.0] 種分布モデリング(SDM)は、ある種が地球上の特定の位置に存在するかどうかを予測することを目的としている。
これまでの研究では、有望な結果を達成するモデルを構築するために、ニューラルな暗黙表現を使用してきた。
暗黙の埋め込みと明示的な埋め込みを組み合わせたハイブリッドな埋め込み方式を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:58 GMT)
Assessing Bias in Metric Models for LLM Open-Ended Generation Bias Benchmarks [4.0] 本研究では,BOLDやSAGEDといったオープンソースのベンチマークにおいて,そのようなバイアスについて検討する。
結果は、より堅牢なバイアスメトリックモデルを要求する、人口統計記述子の不平等な扱いを明らかにしている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:08:40 GMT)
Self-Organizing Recurrent Stochastic Configuration Networks for Nonstationary Data Modelling [3.9] リカレント・コンフィグレーション・ネットワーク(Recurrent configuration network、RSCN)は、非線形力学のモデリングにおいて有望であることを示すランダム化モデルのクラスである。
本稿では,非定常データモデリングのためのネットワークの連続学習能力を高めるために,SORSCNと呼ばれる自己組織型RCCNを開発することを目的とする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:28:25 GMT)
On the Distribution of Probe Traffic Volume Estimated without Trajectory Reconstruction [3.9] 軌道再構成を伴わないプローブ点位置データに基づいて,道路セグメント内における推定プローブトラフィック量の正確な分布を示す。
分布の整合性は数値シミュレーションにより可視化された。
推定されたプローブトラフィック量の理論的分散は、トラフィックボリューム推定のモデル化におけるヘテロセシスティック性に対処することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:08:28 GMT)
Tunable Einstein-Bohr recoiling-slit gedankenexperiment at the quantum limit [3.8] 光学式ツイーザにおける単一原子を用いたアインシュタイン・ボーア干渉計の忠実な実現を報告する。
原子は単一の光子に匹敵する固有の運動量を持ち、可動スリットとして機能する。
原子の加熱と沈み込みによる古典的なノイズを同定し、量子-古典的遷移を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:09:53 GMT)
NoiseBench: Benchmarking the Impact of Real Label Noise on Named Entity Recognition [3.7] そこで本研究では,実雑音がシミュレーションノイズよりもはるかに難易度が高いことを示す。
ノイズロスト学習の最先端モデルが理論的に達成可能な上限よりもはるかに低くなることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:19:37 GMT)
Non-convergence to global minimizers in data driven supervised deep learning: Adam and stochastic gradient descent optimization provably fail to converge to global minimizers in the training of deep neural networks with ReLU activation [3.6] 厳密な理論用語でSGD法の成功と限界を説明することは、研究のオープンな問題である。
本研究では,最適化問題の大域的最小化に収束しない確率の高いSGD手法の大規模なクラスについて検証する。
この研究の一般的な非収束結果は、通常のバニラ標準SGD法だけでなく、多くの加速および適応SGD法にも適用される。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:11:37 GMT)
Rethinking Legal Judgement Prediction in a Realistic Scenario in the Era of Large Language Models [3.6] 本研究ではインドにおける判断の文脈における現実的なシナリオにおける判断予測について検討する。
我々は,Llama-2 や GPT-3.5 Turbo などの LLM とともに,InLegalBERT,BERT,XLNet などのトランスフォーマーベースモデルを用いている。
LLMを用いた実験により, GPT-3.5 Turboは現実的なシナリオで優れており, 判定精度は高いことがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:22:12 GMT)
CroCoDai: A Stablecoin for Cross-Chain Commerce [3.6] 分散金融(DeFi)は近年急速に成長している。
グローバルなDeFiエコシステムは、複数のブロックチェーンに分断され、クロスチェーンコマースの需要を加速している。
既存のクロスチェーントランザクション(例えばブリッジやクロスチェーントランザクション)のアプローチは、エスクローの資産をロックすることで原子性を達成する。
これらの課題に対処するために、CroCoDaiを紹介します。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:57:36 GMT)
LLM-based Code-Switched Text Generation for Grammatical Error Correction [3.4] 本研究では,文法的誤り訂正システムをコードスイッチング(CSW)テキストに適用する複雑性について検討する。
我々は、第二言語学習者として、英語のCSWデータセットから最先端のECCシステムを評価する。
単言語テキストとCSWテキストの文法的誤りを補正できるモデルを開発する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:07:29 GMT)
Coupled autoregressive active inference agents for control of multi-joint dynamical systems [3.4] 関節によって接続された複数の体を持つ機械系を同定・制御するための能動的推論エージェントを提案する。
本研究は, 複合エージェントが, ダブル・マス・スプリング・ダンパーシステムの力学を学習し, 爆発的, 搾取的行動のバランスによって, 所望の位置に移動できることを実証する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:04:42 GMT)
Sharing without Showing: Secure Cloud Analytics with Trusted Execution Environments [3.4] 多くのアプリケーションは、機密性を保持しながら、複数のユーザのデータに対する計算の恩恵を受ける。
本稿では,複数のユーザのデータを相互に信頼できない方法で集約する手法を提案する。
我々のソリューションは、秘密データをデータ所有者のキーで暗号化し、どこでも保存できるTrusted Execution Environment(Intel SGX)を使用することです。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:50:37 GMT)
Multilingual Controlled Generation And Gold-Standard-Agnostic Evaluation of Code-Mixed Sentences [3.4] GAME: A Gold-Standard Agnostic Measure for Evaluation of Code-Mixed文を紹介する。
ゲームは、評価のためにゴールドスタンダードのコード混合文を必要としないため、人間のアノテータは不要である。
4つの言語対にまたがるゴールドスタンダードのコード混合文を含むデータセットをリリースする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:54:05 GMT)
Code-Mixer Ya Nahi: Novel Approaches to Measuring Multilingual LLMs' Code-Mixing Capabilities [3.4] Rule-Based Promptingは、コードミックス文を生成する新しいプロンプト技術である。
3つの多言語LLMの符号混合MT能力の測定と比較を行った。
また、$k$-shotプロンプトを使用して、多言語LLMの英語翻訳能力に混在するコードを測定する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:40:36 GMT)
Infinite-Horizon Reinforcement Learning with Multinomial Logistic Function Approximation [3.3] 非線型関数近似を用いたモデルに基づく強化学習について検討する。
本研究では,無限水平平均逆法と割引逆法の両方に有効である確率効率のよい値反復型アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:37:51 GMT)
Infinite-Horizon Reinforcement Learning with Multinomial Logistic Function Approximation [3.3] 非線型関数近似を用いたモデルに基づく強化学習について検討する。
本研究では,無限水平平均逆法と割引逆法の両方に有効である確率効率のよい値反復型アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:37:51 GMT)
Towards Calibrated Losses for Adversarial Robust Reject Option Classification [3.3] 本稿では,"Adrial Robust Reject Option"設定でキャリブレーションされたサロゲートのキャラクタリゼーションと設計を目的とした。
任意のサロゲートが$(ell_dgamma,mathcalH_textrmlin)$-キャリブレーションされるような完全なキャラクタリゼーション結果を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:17:04 GMT)
A Benchmark Suite for Evaluating Neural Mutual Information Estimators on Unstructured Datasets [3.2] 相互情報(MI)は、2つの確率変数間の依存性を定量化するための基本的な指標である。
本研究では、非構造化データセット上でのニューラルMI推定値を評価するための総合ベンチマークスイートを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:22:38 GMT)
NeRF-enabled Analysis-Through-Synthesis for ISAR Imaging of Small Everyday Objects with Sparse and Noisy UWB Radar Data [3.2] Inverse Synthetic Aperture Radar (ISAR)イメージングは、小さな日常の物体に関しては、非常に難しい課題である。
バックプロジェクション(BP)を含む既存のISAR再構築手法は、複雑なセットアップと制御された環境を必要とすることが多い。
小型物体の高分解能コヒーレントISARイメージングのための解析スルー合成(ATS)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:57:49 GMT)
Harnessing the power of LLMs for normative reasoning in MASs [3.2] 大きな言語モデル(LLM)は、標準に対してリッチで表現力豊かな語彙を提供する。
LLMはノルム発見、規範的推論、意思決定といった様々なタスクを実行できる。
本研究の目的は,MAS,NLP,LLM研究者の協力を得て,規範的エージェントの分野を推し進めることである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:20:10 GMT)
Improving Multimodal Learning with Multi-Loss Gradient Modulation [3.1] 我々は,マルチロス目標を導入し,バランスプロセスをさらに洗練することにより,従来の作業を改善する。
CREMA-Dでは、ResNetエンコーダのバックボーンを持つモデルが、以前の最高値を1.9%から12.4%上回っている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:19:13 GMT)
Lambda-Skip Connections: the architectural component that prevents Rank Collapse [3.0] 本稿では、変圧器から状態空間モデル(SSM)へのランク崩壊の理論を拡張する。
本研究では,emphlambda-skip接続と呼ばれる古典的スキップ接続コンポーネントのパラメータ化バージョンが,ランク崩壊防止の保証を提供する方法について検討する。
我々の知る限り、これはランク崩壊防止の一般的な保証を提供する最初の研究であり、SSMの文脈でランク崩壊を調査するものである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:16:33 GMT)
Is Structure Dependence Shaped for Efficient Communication?: A Case Study on Coordination [3.0] 構造依存が効率的なコミュニケーションを実現するかどうかを,座標構造に着目して検討する。
我々は, 構造依存型還元演算を用いた人工言語, (i) 自然言語に類似した構造依存型還元演算を用いた人工言語, (ii) 縮小演算を伴わない人工言語, (iii) 線形(構造依存型還元演算ではない) の3種類の人工言語を設計する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:35:21 GMT)
Transformer Block Coupling and its Correlation with Generalization in LLMs [3.0] 大規模言語モデル(LLM)は自然言語処理において大きな進歩を遂げている。
変換器ブロックを通過する個々のトークンの軌跡を辿り、ジャコビアン行列を通してこれらの軌跡に沿って系を線形化する。
トークンと深さをまたいだ頂点特異ベクトルのカップリングを特徴とする,様々な LLM における $textbftransformer block coupling$ 現象を明らかにする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:29:05 GMT)
fastHDMI: Fast Mutual Information Estimation for High-Dimensional Data [3.0] 我々は高次元データセットにおける効率的な変数スクリーニングのために設計されたPythonパッケージであるfastHDMIを紹介した。
この研究は3つの相互情報推定手法のニューロイメージング変数選択への応用を開拓した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:49:53 GMT)
DepsRAG: Towards Agentic Reasoning and Planning for Software Dependency Management [3.0] DepsRAGは、ソフトウェア依存関係の推論を支援するために設計されたマルチエージェントフレームワークである。
開発者は会話インターフェースを通じてDepsRAGと対話し、依存関係に関するクエリをポーズすることができる。
GPT-4-Turbo と Llama-3 を多段階推論タスクで用いた DepsRAG の評価を行い,Critic-Agent 機構の統合による3倍の精度向上を観察した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:02:11 GMT)
Designing Extremely Memory-Efficient CNNs for On-device Vision Tasks [3.0] デバイス上での視覚タスクにメモリ効率の良いCNN(畳み込みニューラルネットワーク)を導入する。
提案したネットワークは、競合するトップ1の精度(61.58%)を達成しつつ、非常に低いメモリ(63KB)でImageNetを分類する。
我々の知る限り、提案するネットワークのメモリ使用量は最先端のメモリ効率ネットワークよりもはるかに少ない。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:47:45 GMT)
Fast and Accurate Neural Rendering Using Semi-Gradients [3.0] 我々は,グローバル照明レンダリングのためのニューラルネットワークベースのフレームワークを提案する。
これらの問題の原因を,残差に基づく目的関数の勾配推定における偏りと高分散として同定する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:30:38 GMT)
DCNet: A Data-Driven Framework for DVL Calibration [2.9] 本稿では,2次元畳み込みカーネルを革新的な方法で利用するデータ駆動型フレームワークDCNetを紹介する。
平均精度は70%,キャリブレーション時間は80%向上した。
また, 低コストで高精度なDVLを用いた海洋ロボット工学の新たな応用を開拓した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:47:10 GMT)
DCNet: A Data-Driven Framework for DVL [2.9] 本稿では,2次元畳み込みカーネルを革新的な方法で利用するデータ駆動型フレームワークDCNetを紹介する。
平均精度は70%,キャリブレーション時間は80%向上した。
また, 低コストで高精度なDVLを用いた海洋ロボット工学の新たな応用を開拓した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:47:10 GMT)
Tighter Risk Bounds for Mixtures of Experts [2.9] 筆者らは,それぞれのゲーティング機構に局所微分プライバシー(LDP)を付与することにより,専門家の混在リスクの上限を与える。
これらの理論的な保証は、1-out-of-n$ゲーティングメカニズムを利用する専門家の混合に適合する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:37:36 GMT)
How to Construct Random Unitaries [2.8] 量子セキュアな片方向関数が存在すると仮定して、PRUが存在することを証明する。
本研究では,Haar-randomユニタリに対するクエリを量子コンピュータ上で効率的にシミュレートできることを証明した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:07:36 GMT)
A Review of Electromagnetic Elimination Methods for low-field portable MRI scanner [2.8] 従来の分析手法と適応手法を高度なディープラーニング手法と比較する。
ディープラーニングは、MRIデータに基づいてトレーニングされたニューラルネットワークを活用することにより、優れたEMI抑制を示す。
MRIシステムにおいて、より効果的なEMI抑制のためのバランスの取れたアプローチが提案されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:09:16 GMT)
ChakmaNMT: A Low-resource Machine Translation On Chakma Language [2.8] 先住民のチャクマ族とメインストリームのバングラデシュの地政学的区分は、文化的・言語的なギャップを生じさせている。
15,021個の並列サンプルと42,783個の単言語サンプルを新たに導入した。
トレーニングセットでは,従来型および最先端のモデルをNLPで実行し,Chakmaの文字化によるバックトランスレーションを微調整したBanglaT5をBLEUスコアで最高に達成した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:21:31 GMT)
QIANets: Quantum-Integrated Adaptive Networks for Reduced Latency and Improved Inference Times in CNN Models [2.7] 畳み込みニューラルネットワーク(CNN)はコンピュータビジョンタスクにおいて大きな進歩を遂げているが、その高い推論時間とレイテンシは現実の応用性を制限している。
従来のGoogLeNet、DenseNet、ResNet-18モデルアーキテクチャを再設計する新しいアプローチであるQIANetを紹介します。
実験の限界にもかかわらず, 提案手法を検証, 評価し, 推論時間の短縮を実証し, 有効精度の保存を行った。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:24:48 GMT)
Hybrid Transformer for Early Alzheimer's Detection: Integration of Handwriting-Based 2D Images and 1D Signal Features [2.6] アルツハイマー病(英語: Alzheimer's Disease、AD)は、早期発見が不可欠である神経変性疾患である。
ADの初期にしばしば影響を受ける手書き文字は、微妙な運動の変化を捉える非侵襲的でコスト効率のよい方法を提供する。
2次元手書き画像と1次元動的手書き信号を同時に統合した学習可能なマルチモーダルハイブリッドアテンションモデルを提案する。
F1スコア90.32%、タスク8では90.91%の精度でDARWINデータセット上での最先端性能を実現した('L'書き込み)。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:26:52 GMT)
Neural Quasiprobabilistic Likelihood Ratio Estimation with Negatively Weighted Data [2.6] 確率密度が負の準確率的設定に対する確率比推定タスクの一般化を考察する。
負の密度と負の重みの存在は、従来のニューラルチャンス比推定法に様々な課題をもたらす。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:15:49 GMT)
GROD: Enhancing Generalization of Transformer with Out-of-Distribution Detection [2.6] トランスフォーマーネットワークは自然言語処理(NLP)とコンピュータビジョン(CV)タスクに優れている。
彼らは、out-of-Distribution(OOD)データセットを一般化する上で、課題に直面している。
本稿では,OOD検出に基づく新しい手法を提案し,このアルゴリズムをGROD(Generate Rounded OOD Data)アルゴリズムと呼ぶ。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:41:57 GMT)
Quantum feedback control of a two-atom network closed by a semi-infinite waveguide [2.5] フィードバックループを半無限導波路で閉じた2原子量子ネットワークについて検討する。
このセットアップでは、初期励起された2レベル原子が導波路に光子を放出し、伝播光子が導波路の終端ミラーによって反射されるか、他の原子に吸収される。
導波路には2光子、1光子または0光子状態があり、フィードバックループ長と原子と導波路の結合強度によって制御できることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:47:47 GMT)
Five-fold precision enhancement in a cold atom experiment via adaptive symmetry-informed Bayesian strategies [2.5] 量子技術実験において,原子数推定のための適応ベイズ測定戦略を実証する。
提案手法は, 標準的な非最適化戦略と比較して, 原子数推定の分数分散を5倍に削減する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:20:13 GMT)
Deterministic Apple Tasting [2.5] 我々は、初めて広く適用可能な決定論的リンゴテイスティング学習者を提供する。
すべてのクラス $mathcalH$ は簡単、困難、あるいは学習不能でなければならない、という三分法を証明します。
我々の上限は、リンゴの味付けフィードバックに関する専門家のアドバイスから学ぶための決定論的アルゴリズムに基づいている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:54:46 GMT)
Inverse Problems and Data Assimilation: A Machine Learning Approach [2.4] これらのノートの目的は、機械学習におけるアイデアが逆問題やデータ同化の分野に影響を与える可能性を実証することである。
副産物として、機械学習における様々なトピックの簡潔な数学的処理を含める。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:01:35 GMT)
Echo State Networks for Spatio-Temporal Area-Level Data [2.4] 空間時間領域レベルのデータセットは、公式統計において重要な役割を担い、政策決定と地域計画に関する貴重な洞察を提供する。
これらのデータセットの正確なモデリングと予測は、政策立案者が将来の計画のための情報戦略を開発するのに極めて有用である。
本稿では,Echo State Networks (ESNs) の入力段階で近似グラフスペクトルフィルタを組み込む。
政策や計画の文脈において、より情報のある意思決定を支援する方法について説明する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:51:06 GMT)
Exploring Older Adults' Perceptions and Experiences with Online Dating [2.4] 本研究は,高齢者のセキュリティとプライバシの懸念,デザイン要素とアクセシビリティの重要性,改善が必要な地域を特定することを目的とする。
本研究は, 詐欺行為, 機密情報の開示に対する懸念, マッチング要求のより情報的な可視化の必要性などの課題を明らかにする。
我々は、身元確認の強化、アプリ開発者による包括的プライバシー管理、高齢者がこれらのプラットフォームを安全かつ確実にナビゲートできるようにデジタルリテラシーを強化するための推奨事項を提供している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:41:04 GMT)
High sensitivity pressure and temperature quantum sensing in organic crystals [2.4] ペンタセンをドープしたパラテルフェニル結晶を用いた圧力(P)および温度(T)センシングのための分子プラットフォームを提案する。
我々は,光励起三重電子の光検出磁気共鳴(ODMR)を利用する。
ダイアモンド中の窒素空孔中心より1200倍以上3倍大きいdf/dP=1.8MHz/barとdf/dT=247kHz/Kの最大ODMR周波数変化を観測した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:44:51 GMT)
Quantum Bayes' rule and Petz transpose map from the minimal change principle [2.4] ベイズの規則は、新しい証拠に基づく信念の更新に日常的に使用されている。
本稿では,最小変化原理の量子アナログを紹介する。
変化が忠実度によって定量化されると、最小限の変化原理はユニークな解を持つ。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:11:13 GMT)
Quantum Bayes' rule and Petz transpose map from the minimal change principle [2.4] ベイズの規則は、新しい証拠に基づく信念の更新に日常的に使用されている。
この原則は、更新された信念は、以前の信念から最小限に逸脱しながら、新しいデータと一貫性を持たなければならないことを述べている。
最小限の変化原理の量子アナログを導入し、量子ベイズ則を導出する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:11:13 GMT)
Diversity-Aware Reinforcement Learning for de novo Drug Design [2.4] 事前訓練された生成モデルの微調整は、有望な薬物分子の生成に優れた性能を示した。
報酬関数の適応的更新機構が生成分子の多様性にどのように影響するかは研究されていない。
我々の実験は、構造と予測に基づく手法を組み合わせることで、一般的に分子多様性の点でより良い結果が得られることを示した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:25:23 GMT)
On Generating Explanations for Reinforcement Learning Policies: An Empirical Study [2.3] 本稿では、ポリシーの説明を提供するために設計されたテキストリニア時間論理式について紹介する。
我々の焦点は、政策によって達成される最終的な目的と、実行を通じて維持される前提条件の両方を解明する説明である。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:44:36 GMT)
Fusion-Driven Tree Reconstruction and Fruit Localization: Advancing Precision in Agriculture [2.3] 本研究では,RGB画像,LiDAR,IMUデータの相乗効果を利用して複雑な木復元を行う手法を提案する。
制御された環境と実際の桃果樹園の両方で実験が行われた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:37:49 GMT)
Summarizing long regulatory documents with a multi-step pipeline [2.3] 長い規則文を要約するための2段階アーキテクチャの有効性は、使用するモデルによって異なることを示す。
コンテクスト長の短い抽象エンコーダ・デコーダモデルでは抽出ステップの有効性が異なるが、長文エンコーダ・デコーダモデルでは抽出ステップが性能を悪化させる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:12:19 GMT)
Beyond Calibration: Assessing the Probabilistic Fit of Neural Regressors via Conditional Congruence [2.2] ディープネットワークは、しばしば過剰な自信と不一致な予測分布に悩まされる。
本稿では,条件付きカーネルの平均埋め込みを用いて,学習した予測分布とデータセットにおける経験的条件分布との距離を推定する,条件付きコングルーエンス誤差(CCE)について紹介する。
本研究では,1)データ生成プロセスが知られている場合の分布間の不一致を正確に定量化し,2)実世界の高次元画像回帰タスクに効果的にスケールし,3)未知のインスタンス上でのモデルの信頼性を評価することができることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:12:59 GMT)
ShieldNN: A Provably Safe NN Filter for Unsafe NN Controllers [2.2] 我々は、KBM(Kinematic Bicycle Model)のための新しいクローズドフォーム制御バリア関数(CBF)と関連するコントローラシールドを開発する。
ShieldNNは、非アフィンKBMダイナミクスと直接、ステアリングとベロシティの制約について検討している。
実験により,ShieldNNは複数の障害物が存在する場合のRLトレーニングエピソードの完了率を劇的に向上させることを示した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:35:07 GMT)
Non-Hermitian ultra-strong bosonic condensation through interaction-induced caging [2.2] 我々は,非エルミタンポンピング,ボソニック相互作用,非自明なバンドトポロジーの3つの相互作用が,超強ボソニック凝縮に繋がる新しいメカニズムを明らかにする。
凝縮の程度は、非エルミート励起状態の相互作用によって引き起こされるトラップによって、自然に期待される範囲を超えている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:19:28 GMT)
Non-Hermitian ultra-strong bosonic condensation through interaction-induced caging [2.2] 我々は,非エルミタンポンピング,ボソニック相互作用,非自明なバンドトポロジーの3つの相互作用が,超強ボソニック凝縮に繋がる新しいメカニズムを明らかにする。
凝縮の程度は、非エルミート励起状態の相互作用によって引き起こされるトラップによって、自然に期待される範囲を超えている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:19:28 GMT)
Private Electronic Payments with Self-Custody and Zero-Knowledge Verified Reissuance [2.2] われわれはGoodell、Toliver、Nakibによって記述されたデジタルトランスファーのプロトコルを構築している。
プロトコルを拡張して、再発行された資産の検証を可能にします。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:06:12 GMT)
Microwave photon detection at parametric criticality [2.2] マイクロ波光子検出の簡易かつ強力な臨界法を実証する。
我々は、73%の効率と167kHzの暗算率を得るが、これは1.3倍の1017mathrmW-1$の応答性に対応する。
我々は、コヒーレントプローブ信号のポアソン統計を抽出し、単光子演算を検証する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:11:52 GMT)
Learning Temporally Equivariance for Degenerative Disease Progression in OCT by Predicting Future Representations [2.2] 時間変化を考慮したコントラスト学習(TC)手法を提案する。
本モデルでは,中間年齢関連黄斑変性 (AMD) から進行湿潤AMDへの進行予測において, 既存の異種コントラスト法より明らかに優れていた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:17:24 GMT)
Will LLMs Replace the Encoder-Only Models in Temporal Relation Classification? [2.2] 大規模言語モデル(LLM)は、最近、時間的推論タスクで有望なパフォーマンスを示した。
最近の研究は、閉ソースモデルのみの時間的関係を検出するためにLLMの性能を検証している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:10:45 GMT)
Keep Me Updated: An Empirical Study of Proprietary Vendor Blobs in Android Firmware [2.1] 2018年1月から2024年4月までに13,000以上のAndroidファームウェアのリリースを調査した。
ファームウェアリリースの約82%は、古いGPUブロブ(最大1,281日)を含んでいる。
15年以上前にリリースされた古いLLVMコアライブラリにも、かなりの数のブロブが依存している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:36:12 GMT)
From x*y=k to Uniswap Hooks; A Comparative Review of Decentralized Exchanges (DEX) [2.1] 本稿では、Uniswap, Curve, Balancerという有名なDEXプロトコルの包括的分類と比較分析を行う。
目標は、異なるAMMモデルの強みと制限を解明し、DEX開発における新たな概念を強調し、現在の課題を概説し、特定のアプリケーションに対して最適なモデルを区別することである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:10:56 GMT)
Towards LLM-guided Efficient and Interpretable Multi-linear Tensor Network Rank Selection [2.1] 本稿では,高次データ解析のためのテンソルネットワークモデルにおけるランク選択を導く新しいフレームワークを提案する。
LLMの本質的な推論能力とドメイン知識を利用することで、ランク選択の解釈可能性を高めることができる。
この研究は、大規模言語モデルと高次データ分析の交差点に置かれている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:09:14 GMT)
Transparent Networks for Multivariate Time Series [2.0] 我々は,GATSM(Generalized Additive Time Series Model)と呼ばれる,時系列のための新しい透明ニューラルネットワークモデルを提案する。
GATSMは,1)特徴表現を学習する独立した特徴ネットワーク,2)時間ステップの異なる時間パターンを学習する透明な時間モジュールの2つの部分から構成される。
実証実験により、GATSMは既存の一般化加法モデルよりも大幅に優れ、ブラックボックスの時系列モデルに匹敵する性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:14:23 GMT)
Personality Differences Drive Conversational Dynamics: A High-Dimensional NLP Approach [1.9] 我々は、見知らぬ人との対話の軌跡を高次元空間にマッピングする。
本研究は,オープンネスの個性次元の差が大きいインターロケータが相互に影響し,幅広い話題を議論するのにより多くの時間を費やすことを示唆している。
また、参加者の感情(感情)が会話の前から後までどのように変化するかを調べ、外転の差が大きいと影響の差が大きくなることを予測している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:48:31 GMT)
PointNet with KAN versus PointNet with MLP for 3D Classification and Segmentation of Point Sets [1.9] 我々は3Dポイントクラウド分類とセグメンテーションタスクのためのニューラルネットワークであるPointNet-KANを紹介する。
従来のマルチレイヤーパーセプトロン(MLP)の代わりにKAN(Kolmogorov-Arnold Networks)を採用している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:57:06 GMT)
Online Learning Quantum States with the Logarithmic Loss via VB-FTRL [1.9] 対数損失を伴う量子状態のオンライン学習(LL-OLQS)は、30年以上にわたってオンライン学習において古典的なオープンな問題である。
本稿では,LL-OLQS に対する VB-FTRL を適度な計算量で一般化する。
それぞれのアルゴリズムは半定値プログラムで構成されており、例えば、切断平面法によって時間内に実装することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:44:47 GMT)
Instruction Fine-Tuning: Does Prompt Loss Matter? [1.8] 教師あり指導微調整(SIFT)におけるPLWの効果について検討する。
PLWの小さな値(0.01 - 0.5)を使用することで、複数選択および短世代ベンチマークにおいてより良い結果が得られた。
この研究は、SIFTにPLWパラメータを提供することの重要性について、APIプロバイダに警告する役割を果たしている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:16:38 GMT)
Yuan: Research on the Concept of Digital World Analogue Scientific Infrastructure and Science Popularization Communication Based on Suzhou Gardens Pattern [1.8] 我々はユネスコの世界遺産である蘇州庭園の設計原則からインスピレーションを得ている。
我々は「スペーススパイダー」の予備構築を容易にするための3つの指針原則を提案する。
Yuanの最初のパイロットは、様々な超大規模科学インフラシナリオを一般化することが期待されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:06:25 GMT)
Feasibility Analysis of Federated Neural Networks for Explainable Detection of Atrial Fibrillation [1.6] 心房細動 (AFib) の早期発見は, 無症候性, 発作性に困難である。
本研究は、生のECGデータを用いてAFibを検出するために、フェデレートラーニング(FL)プラットフォーム上でニューラルネットワークをトレーニングする可能性を評価する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:06:10 GMT)
ABBA-VSM: Time Series Classification using Symbolic Representation on the Edge [1.6] 時系列分類のための適応的ブラウンブリッジを用いたアグリゲーションベクトル空間モデル(ABBA-VSM)を提案する。
ABBA-VSMは、Edge上のリソース効率の良いTSCサービスの開発において、IoTとEdgeデバイス間の通信データとシンボリックサイクルを削減する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:37:40 GMT)
TL-PCA: Transfer Learning of Principal Component Analysis [1.6] 主成分分析は、対象とするデータのサンプルが多すぎると著しく制限される可能性がある。
そこで本研究では,対象タスクの少ないデータに加えて,関連するソースタスクからの知識が使用されるPCA(TL-PCA)への転送学習手法を提案する。
画像データセットの結果から, 次元削減のためのTL-PCAにより, テストデータの表現が向上することが示された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:18 GMT)
Two-Stage Approach for Brain MR Image Synthesis: 2D Image Synthesis and 3D Refinement [1.6] 腫瘍像を正確に表現することで,欠失モードの特異な特徴を反映したMRI画像の合成が重要である。
本稿では,2次元スライスからMR画像を合成する2段階の手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:21:08 GMT)
A Comparative Study of Translation Bias and Accuracy in Multilingual Large Language Models for Cross-Language Claim Verification [1.6] 本研究は,言語間クレーム検証における翻訳バイアスと大規模言語モデルの有効性を体系的に評価する。
本稿では,事前翻訳と自己翻訳の2つの異なる翻訳手法について検討する。
その結果,低リソース言語では表現不足による直接推論の精度が著しく低いことが明らかとなった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:02:42 GMT)
Data-Driven Approaches for Modelling Target Behaviour [1.5] 追跡アルゴリズムの性能は、対象の力学に関する選択されたモデル仮定に依存する。
本稿では,物体の動きを記述するために機械学習を利用する3つの異なる手法の比較研究を行う。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:18:27 GMT)
Enhancing Robustness in Deep Reinforcement Learning: A Lyapunov Exponent Approach [1.5] 本稿では,決定論的連続制御タスクにおいて,深部RLポリシーの単一状態への摂動について検討する。
システム状態に対する小さな摂動がその後の状態と報酬軌道に大きな影響を与えるため、RLポリシーは決定論的に混同される可能性があることを示す。
本稿では,最大リアプノフ指数正規化を実装したDreamer V3アーキテクチャの改良を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:16:43 GMT)
Improved Regret Bound for Safe Reinforcement Learning via Tighter Cost Pessimism and Reward Optimism [1.5] 本稿では,新しいコストと報酬関数推定器に基づくモデルベースアルゴリズムを提案する。
我々のアルゴリズムは、$widetildemathcalO((bar C - bar C_b)-1H2.5 SsqrtAK)$の残念な上限を達成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:51:06 GMT)
AR-TTA: A Simple Method for Real-World Continual Test-Time Adaptation [1.5] 本稿では,自律運転のためのデータセット,すなわちCLAD-CとShiFTを用いたテスト時間適応手法の検証を提案する。
現在のテスト時間適応手法は、ドメインシフトの様々な程度を効果的に扱うのに苦労している。
モデル安定性を高めるために、小さなメモリバッファを組み込むことで、確立された自己学習フレームワークを強化する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:32:43 GMT)
Developing Gridded Emission Inventory from High-Resolution Satellite Object Detection for Improved Air Quality Forecasts [1.4] 本研究では, 気象研究・予測モデルと化学(WRF Chem)を併用した, ダイナミックなAIベースの排出在庫システム構築のための革新的なアプローチを提案する。
このシステムは、エミッション推定において前例のない時間的および空間的な解決を提供し、より正確な短期的な空気質予測と都市エミッションのダイナミクスに関する深い洞察を促進する。
今後の研究は、システムの能力を非車両に拡張し、環境条件に挑戦する際の検出精度をさらに向上することに焦点を当てる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:32:45 GMT)
Stationary Velocity Fields on Matrix Groups for Deformable Image Registration [1.4] 定常速度場(SVF)アプローチは、可逆変形場のパラメトリゼーションを構築することができる。
SVF のアプローチを行列群、特に $SE(3)$ に拡張する。
我々は,ヒト脳の3次元MRI画像の患者間登録に対するアプローチを数値的に検証した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:27:56 GMT)
Future Trends in the Design of Memetic Algorithms: the Case of the Linear Ordering Problem [1.4] 本稿では,計算能力の増大に伴い,LOPの設計が今後どのように変化するかを理解することに焦点を当てる。
計算資源の能力が増大するにつれて、人口の停滞を防ぐために、メメティックアルゴリズムで適用された手法の能力を高める必要がある。
このベンチマークに新たなバウンダリが確立され、将来の研究に新たな参照フレームが提供される。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:13:50 GMT)
AI-based particle track identification in scintillating fibres read out with imaging sensors [1.3] 本研究では,SPADアレイセンサによって生成された実データから,信号を含むフレームを効率よくフィルタリングし,識別する可変オートエンコーダ(VAE)を提案する。
我々のVAEモデルは、背景雑音から粒子トラックを含むフレームを識別する能力を示した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:59:30 GMT)
Optimal lower bounds for logistic log-likelihoods [1.3] ロジット変換は、おそらく線形設定を超えて最も広く採用されているリンク関数である。
2次よりも鋭い接する下界が、結果として生じるマイノライザーのトラクタビリティを損なうことなく導出できるかどうかはまだ分かっていない。
本稿は、新しい2次下界の設計と研究を通じて、このような挑戦的な問題に対処する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:09:33 GMT)
Classical simulation and quantum resource theory of non-Gaussian optics [1.3] 非ガウス初期状態に適用されたガウスユニタリと測定をシミュレーションするための効率的なアルゴリズムを提案する。
量子資源理論の観点から、このタイプの非ガウス性測度の性質を考察し、連続変数量子コンピューティングに関連する状態の最適分解を計算する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:18:36 GMT)
A polynomial-time classical algorithm for noisy quantum circuits [1.3] 雑音量子回路のための時空古典的アルゴリズムを提供する。
我々のアプローチは、雑音が非局所的相関を指数的に減衰させるという直感に基づいている。
定音率の場合、ほとんどの入力状態において誤差緩和が効率的である任意の量子回路は、古典的にはほとんどの入力状態においてシミュレート可能である。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:55:22 GMT)
Exploring Semi-Supervised Learning for Online Mapping [1.2] 本稿では,他の領域における半教師あり学習技術からインスピレーションを得て,オンラインマッピングへの適用性を実証する。
複数のサンプルから教師の擬似ラベルを抽出し,オンラインマッピングの特質を生かした簡易かつ効果的な手法を提案する。
全てのラベルを使用するパフォーマンスギャップはArgoverseでは29.6mIoUから3.4mIoUに、NuScenesでは12mIoUから3.4mIoUに削減され、ラベル付きデータの10%しか利用できない。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:31:08 GMT)
GleanVec: Accelerating vector search with minimalist nonlinear dimensionality reduction [1.2] クロスモーダル検索(例えば、画像を見つけるためにテキストクエリを使用する)は急速に勢いを増している。
クエリはデータベースベクトルとは異なる統計分布を持つことが多いため、高い精度を達成することは困難である。
本稿では,高次元ベクトル探索を高速化するために,次元削減のための線形非線形手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:14:27 GMT)
XAI-based Feature Selection for Improved Network Intrusion Detection Systems [1.2] 本稿では,この問題にeXplainable AI(XAI)メソッドを適用する新しい方法を提案することにより,侵入検知システム(IDS)の特徴選択問題に取り組む。
我々は、新しい5つの属性選択法と組み合わせて、異なるAI手法に由来する重要な属性を同定する。
我々は、現在最先端の機能選択戦略をXAIベースの機能選択手法と比較し、この研究で提案されたXAIベースのアプローチを使用することで、ほとんどのAIモデルの性能が向上することを示した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:24:59 GMT)
Words in Motion: Extracting Interpretable Control Vectors for Motion Transformers [1.2] トランスフォーマーベースのモデルは、解釈が難しい隠された状態を生成する。
我々は,ニューラルネットワークの崩壊現象を活用し,線形プローブを用いて隠れ状態の解釈可能な特徴を測定する。
本手法では,解釈可能な特徴を持つ変圧器を用いた動き予測モデルを制御することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:39:55 GMT)
Class Balancing Diversity Multimodal Ensemble for Alzheimer's Disease Diagnosis and Early Detection [1.1] アルツハイマー病は、その流行の増加と関連する社会的コストにより、世界的な健康上の問題を引き起こす。
従来の診断法と単一モダリティデータは、早期ADの同定に不足することが多い。
本研究は,iMbalancEd Data(IMBALMED)におけるクラスBALancingの多様性を利用したマルチモーダルenseMbleの新たなアプローチを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:56:43 GMT)
Compositional Shielding and Reinforcement Learning for Multi-Agent Systems [1.1] 高度な強化学習は、高性能なポリシーを得るための強力なツールとして登場した。
安全を保証するための有望なパラダイムの1つは、安全でない行動からポリシーを守るシールドである。
本研究では,マルチエージェント遮蔽のための新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:52:48 GMT)
Advancing Newborn Care: Precise Birth Time Detection Using AI-Driven Thermal Imaging with Adaptive Normalization [1.1] 本稿では,人工知能(AI)とサーマルイメージングの融合について検討し,第1次AI駆動型バース検出器の開発について述べる。
まず,ガウス混合モデル(GMM)に基づく適応正規化手法を提案し,温度変動に関する問題を緩和する。
熱フレーム内での新生児の検出において、88.1%の精度と89.3%のリコールが報告されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:20:51 GMT)
Gait Sequence Upsampling using Diffusion Models for single LiDAR sensors [1.0] LidarGSUは、既存の識別モデルの一般化能力を改善するように設計されている。
本研究は,ビデオ間翻訳手法における条件付きマスクとして,細かな歩行者点雲上のDPMを利用する。
提案手法では,SUSTeck1Kデータセットを用いて,生成品質と認識性能を評価する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:38:12 GMT)
Gait Sequence Upsampling using Diffusion Models for Single LiDAR Sensors [1.0] LidarGSUは、既存の識別モデルの一般化能力を改善するように設計されている。
本研究は,ビデオ間翻訳手法における条件付きマスクとして,細かな歩行者点雲上のDPMを利用する。
提案手法では,SUSTeck1Kデータセットを用いて,生成品質と認識性能を評価する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:38:12 GMT)
Adversarially Robust Out-of-Distribution Detection Using Lyapunov-Stabilized Embeddings [1.0] AROSは、ニューラル常微分方程式(NODE)とリャプノフ安定性定理を利用する新しいアプローチである。
調整された損失関数により、リアプノフ安定性理論を適用し、分布内(ID)とOODデータが安定平衡点に収束することを保証する。
このアプローチは任意の摂動入力を安定平衡に戻すことを奨励し、それによってモデルの対向摂動に対する堅牢性を高める。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:22:12 GMT)
Gender Bias of LLM in Economics: An Existentialism Perspective [1.0] 本稿では,大言語モデル(LLM)における性別バイアスについて検討する。
LLMは、明示的なジェンダーマーカーなしでもジェンダーステレオタイプを補強する。
LLMのバイアスは意図しない欠陥ではなく、合理的な処理の体系的な結果であると主張する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:42:01 GMT)
Can we hop in general? A discussion of benchmark selection and design using the Hopper environment [1.0] 我々は、強化学習におけるベンチマークは科学の分野として扱う必要があると論じている。
ケーススタディでは、標準的なベンチマークスイートの選択が、アルゴリズムのパフォーマンスの判断方法を大きく変える可能性があることを示しています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:28:20 GMT)
Dynamical loss functions shape landscape topography and improve learning in artificial neural networks [0.9] クロスエントロピーと平均二乗誤差を動的損失関数に変換する方法を示す。
異なるサイズのネットワークに対する検証精度を大幅に向上させる方法を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:27:03 GMT)
WILT: A Multi-Turn, Memorization-Robust Inductive Logic Benchmark for LLMs [0.9] メモリ化に抵抗するように設計された,シンプルなマルチターン推論ベンチマークである Wason Inductive Logic Test (WILT) を紹介する。
以上の結果から,LSMはこの課題に苦しむことが明らかとなった。
これらの変動にもかかわらず、最高の性能モデルは28%の精度しか達成せず、複雑なマルチターン推論タスクにおけるLLM性能の重大なギャップを浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:29:13 GMT)
Artificial Intelligence-Based Triaging of Cutaneous Melanocytic Lesions [0.9] 患者数の増加とより包括的な診断の必要性により、病理学者は作業負荷の増大に直面している。
われわれは,全スライド画像に基づいて皮膚メラノサイト性病変をトリアージする人工知能(AI)モデルを開発した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:49:04 GMT)
Sampling from Bayesian Neural Network Posteriors with Symmetric Minibatch Splitting Langevin Dynamics [0.9] 本稿では,ビッグデータおよびAIアプリケーションのパラメータ空間をサンプリングするためのスケーラブルな動的ランゲヴィン動的アルゴリズムを提案する。
その結果,Symmetric Minibatch Splitting-UBU (SMS-UBU) インテグレータのバイアスは$O(h2 d1/2)$ in dimension $d>0$ with stepsize $h>0$であることがわかった。
このアルゴリズムを用いて, 畳み込みニューラルネットワークアーキテクチャを用いたニューラルネットワークにおいて, ベイズニューラルネットワーク(BNN)の後部分布の局所的モードを探索し, 後部予測確率の校正性能を評価する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:47:02 GMT)
Wave packet dynamics in parabolic optical lattices: From Bloch oscillations to long-range dynamical tunneling [0.9] 量子状態はセパラトリクスにまたがって混合力学を示すことができることを示す。
ほぼ退化状態間のわずかなエネルギーミスマッチは、制御された長距離力学トンネルをもたらす。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:08:05 GMT)
Global calibration of large-scale photonic integrated circuits [0.7] 大規模フォトニック集積回路(PIC)のグローバルキャリブレーション手法を提案する。
本手法は、PIC上の全熱光学位相シフト器の非線形位相電流関係を同時に学習するために、カスタムネットワークを利用する。
結果は、フォトニック量子情報処理における大規模PICの応用に大きな恩恵をもたらすだろう。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:11:09 GMT)
Illustrating the benefits of efficient creation and adaption of behavior models in intelligent Digital Twins over the machine life cycle [0.7] 本稿では,デジタルツインと行動モデルの基礎,課題,関連研究について述べる。
マシンライフサイクル全体を通しての行動モデルの作成、適応、使用は、非常に時間がかかります。
アプリケーションを説明する特定のユースケースが不足し、マシンライフサイクル上での振る舞いモデルの利点が追加されています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:40:45 GMT)
Persistent Topological Features in Large Language Models [0.7] トポロジ的特徴の持続性と変換を定量化する新しい指標である永続化類似性を導入する。
従来の類似度測定とは異なり、我々の手法はこれらの特徴の進化軌道全体を捉えている。
実用的なアプリケーションとして、永続化の類似性を活用して冗長なレイヤを特定し、実行します。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:46:23 GMT)
Cultural Heritage 3D Reconstruction with Diffusion Networks [0.6] 文化遺産の修復における最近の生成AIアルゴリズムの利用について検討する。
3次元点雲を効率的に再構成するために設計された条件拡散モデル。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:43:40 GMT)
Separation of Neural Drives to Muscles from Transferred Polyfunctional Nerves using Implanted Micro-electrode Arrays [0.6] 標的筋リニューロベーション(TMR)は、これらの信号を予備筋にリダイレクトし、筋電図(EMG)を介して神経情報を回復させる
EMG記録からの重なり合う信号を識別することは、手足の機能解釈を複雑にする混合神経情報を含むことができるため、依然として複雑である。
多価神経のTMR手術と高密度マイクロ電極アレイを併用した新しいバイオインタフェースを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:32:49 GMT)
Hamiltonian Neural Networks for Robust Out-of-Time Credit Scoring [0.5] 我々は、信用リスク進化の複雑なダイナミクスを捉えるためのシンプレクティックと新たな金融損失関数を開発する。
本手法は,AUC(Area Under the Curve)により測定されたOOTシナリオにおいて,優れた識別力を示す。
ハミルトニアンにインスパイアされたアプローチは、インサンプルとOOTテストセット間の一貫した性能を維持する上で、特に強みを示している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:08:26 GMT)
Emulators for stellar profiles in binary population modeling [0.5] 本稿では,放射軸に沿った内部恒星構造を機械学習技術を用いて予測するための新しいエミュレーション手法を提案する。
メモリとストレージの効率の面では, 近接近似に匹敵する精度が期待できる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:33:10 GMT)
Copula-Linked Parallel ICA: A Method for Coupling Structural and Functional MRI brain Networks [0.5] 機能的MRI(fMRI)と構造的MRI(sMRI)を融合させる以前の研究では、このアプローチの利点が示されている。
我々は、深層学習フレームワーク、コプラと独立成分分析(ICA)を組み合わせた新しい融合法、コプラリンク並列ICA(CLiP-ICA)を開発した。
CLiP-ICAは、脳、感覚運動、視覚、認知制御、デフォルトモードネットワークなど、強い結合と弱い結合sMRIとfMRIネットワークの両方を効果的にキャプチャする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:35:41 GMT)
When Precedents Clash [0.5] 法的慣行では、ケースベースに対する一貫性要件は満たされないかもしれない。
先例的な制約のモデルは、検討中の法体系の階層構造を考慮する必要がある。
本稿では,階層構造と時間次元に基づく条件原理が,新たな事例に対する明確な意思決定プロセスを提供することを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:45:47 GMT)
A Human-Centered Approach for Improving Supervised Learning [0.4] 本稿では、パフォーマンス、時間、リソースの制約のバランスをとる方法を示す。
この研究のもう1つの目標は、人間中心のアプローチを用いて、エンサンブルスをより説明しやすく、理解しやすくすることである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:27:14 GMT)
Deep Learning-driven Mobile Traffic Measurement Collection and Analysis [0.4] 本稿では,空間的・時間的領域において,深層学習(DL)技術の強力な階層的特徴学習能力を利用する。
そこで我々は,都市規模の交通分析と予測のためのソリューションを開発した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:53:45 GMT)
MMCFND: Multimodal Multilingual Caption-aware Fake News Detection for Low-resource Indic Languages [0.4] Indic Fake News Detection (MMIFND) のためのマルチモーダル多言語データセットを提案する。
この厳密にキュレートされたデータセットは、ヒンディー語、ベンガル語、マラタイ語、マラヤラム語、タミル語、グジャラート語、パンジャービ語にまたがる28,085のインスタンスで構成されている。
フェイクニュース検出(MMCFND)のためのマルチモーダルキャプション対応フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:59:33 GMT)
Automatic Counting and Classification of Mosquito Eggs in Field Traps [0.4] 昆虫害虫の防除は、公衆衛生、食品の安全性、環境に影響を及ぼす世界的な課題となっている。
SIT(Sterile Insect Technique)は、化学農薬のエコフレンドリーな代替品として出現する。
本研究は,スペイン・バレンシア州バレンシア地域の蚊Aedes albopictusのSITプログラムの追跡に使用されるフィールドオビタラップの解析に焦点をあてる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:39:13 GMT)
ROSAR: An Adversarial Re-Training Framework for Robust Side-Scan Sonar Object Detection [0.4] 本稿では、サイドスキャンソナー(SSS)画像に適したオブジェクト検出モデルの堅牢性を高めるフレームワークであるROSARを紹介する。
我々は3つの新しい公開SSSデータセットを導入し、異なるソナー設定とノイズ条件をキャプチャする。
ROSARはSSS固有の条件下でのモデルロバスト性および検出精度を大幅に改善し、モデルのロバスト性は最大1.85%向上した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:33:14 GMT)
Spectrum-preserving deformations of integrable spin chains with open boundaries [0.4] 我々は、強い相互作用を持つ量子多体系に対してスペクトルの一部を無傷に残す局所的な変形の族を見つける。
この変形はベーテ・アンザッツ方程式(BAE)を保存するため、アイソ・ベーエ流と呼ばれる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:47:57 GMT)
A Hybrid Filtering for Micro-video Hashtag Recommendation using Graph-based Deep Neural Network [0.4] マイクロビデオのハッシュタグを推奨するMIcro- video hashtag recommendation MISHON手法を提案する。
ハッシュタグはユーザのトピック的関心を反映しているため,過去のタグ付け行動に基づいてユーザ関連性をモデル化する。
また,冷戦開始ユーザと影響力のあるユーザとの関係をモデル化するための,コンテンツと社会的影響に基づく手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:46:32 GMT)
Reducing the Barriers to Entry for Foundation Model Training [0.3] 最近、世界は機械学習と人工知能のアプリケーションに対する需要が前例のない加速を目撃した。
この需要の急増は、サプライチェーンの基盤技術スタックに多大な負担を課している。
技術エコシステム全体にわたるAIトレーニング基盤の根本的な変更を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:03:06 GMT)
Real-Time Stress Detection via Photoplethysmogram Signals: Implementation of a Combined Continuous Wavelet Transform and Convolutional Neural Network on Resource-Constrained Microcontrollers [0.2] 本稿では,フォトプレソグラム(SAD)信号の解析のために設計された畳み込みニューラルネットワーク(CNN)を用いた頑健なストレス検出システムを提案する。
本研究では、連続ウェーブレット変換(CWT)を用いて、手首PPG信号から情報的特徴を抽出し、ストレス検出と学習の強化を図った。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:43:51 GMT)
Beyond Right and Wrong: Mitigating Cold Start in Knowledge Tracing Using Large Language Model and Option Weight [0.1] 知識追跡(KT)は教育データマイニングにおいて不可欠であり、パーソナライズされた学習を可能にする。
本研究では,LOKT(Large Language Model Option-weighted Knowledge Tracing)モデルを導入し,コールドスタート問題に対処する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:25:48 GMT)
IsoChronoMeter: A simple and effective isochronic translation evaluation metric [0.1] 機械翻訳(MT)は長い道のりをたどっており、毎日数百万のユーザにサービスを提供するために、プロダクションシステムですぐに採用されています。
ジェネレーティブAIの最近の進歩により、ビデオダビングという新しいタイプの翻訳が可能になった。
この研究は、特に自動ダビングの文脈において、等時翻訳の重要性を動機付けている。
IsoChronoMeter(ICM)を導入し、スケーラブルでリソース効率のよい翻訳の等時性を測定する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:43:30 GMT)
Can LLMs be Scammed? A Baseline Measurement Study [0.1] 様々な詐欺戦術に対するLarge Language Models(LLMs)の脆弱性を体系的に評価する。
まず、FINRA分類で同定された多様な詐欺カテゴリーを反映した37の明確に定義されたベース詐欺シナリオを組み込んだ。
第2に、汎用プロプライエタリ(GPT-3.5, GPT-4)とオープンソース(Llama)モデルを用いて、スカム検出における性能を解析する。
第三に、我々の研究は、詐欺戦術がLSMに対して最も効果的であるか、そして様々なペルソナの特徴や説得技術がこれらの脆弱性にどのように影響するかについての批判的な洞察を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:22:27 GMT)
Application of zero-noise extrapolation-based quantum error mitigation to a silicon spin qubit [0.1] シリコンスピン量子ビットプラットフォーム上でのゼロノイズ外挿による誤差低減手法の実装について報告する。
この技術は超伝導量子ビット、トラップイオン量子ビット、フォトニックプロセッサなどの他のプラットフォームで実証されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:51:21 GMT)
Variational quantum computation with discrete variable representation for ro-vibrational calculations [0.0] DVRハミルトニアンの構造は、2次量子化を伴わない指数関数から効率的なVQEへの量子測定スケーリングの複雑さを減少させる。
次に、DVRハミルトニアンが量子コンピュータの状態によって分子の回転振動状態を表現するのに非常に効率的な量子アンサターゼをもたらすことを示した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:22:57 GMT)
Universal Characterization of Quantum Many-Body States through Local Information [0.0] 本稿では,量子状態のスケール-解決相関構造に基づいて,量子状態の普遍的な分類手法を提案する。
最近導入された情報格子を用いて、各スケールでの相関の総量を演算的に定義し、量子状態の固有特性長スケールを定義する。
我々は, 乱れた相互作用するキタエフ鎖の基底および中間スペクトル固有状態の解析を行い, この枠組みが量子物質に対する新しい非バイアスなアプローチを提供することを示した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:00:56 GMT)
Ukrainian-to-English folktale corpus: Parallel corpus creation and augmentation for machine translation in low-resource languages [0.0] 我々は、利用可能な英語の翻訳に基づいて、ウクライナ語と英語の類似したウクライナの民俗の新たなコーパスを作成しました。
私たちのコーパスは単語と文の一致であり、特に機械翻訳モデルのトレーニングデータとしての使用に適した意味の最良のキュレーションを可能にします。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:00:53 GMT)
Tübingen-CL at SemEval-2024 Task 1:Ensemble Learning for Semantic Relatedness Estimation [0.0] 本稿では,文対の関連性を予測することを目的としたSemEval-2024 Task 1を提案する。
我々は,関係性の予測のために,統計テキストの特徴や深層学習モデルの出力など,様々なシステムを統合するアンサンブルアプローチを採用する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:56:51 GMT)
Transparent boundary conditions for the stationary Schroedinger equation via Weyl-Titchmarsh theory [0.0] 透明境界条件はワイル・ティッチマーシュ係数で記述できることが証明されている。
提案手法の適用例として、調和ポテンシャルとPoeschl-Tellerポテンシャルを持つ定常シュレーディンガー方程式の2つの特別な場合を考える。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:47:48 GMT)
Transition of $α$-mixing in Random Iterations with Applications in Queuing Theory [0.0] 本稿では, 回帰器の混合特性と応答とのカップリング論による遷移を証明した。
また、関数中心極限定理と新しい統計的推定理論のアプローチも確立する。
全体として、これらの結果は、大規模なランダム反復モデルの統計的解析への扉を開く。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:53:16 GMT)
Transition of $α$-mixing in Random Iterations with Applications in Queuing Theory [0.0] 本研究では, 混合特性を外因性回帰器から結合論による応答へ伝達することを示す。
また,非定常環境下においても,ドリフトおよびマイノライズ条件のランダム環境におけるマルコフ連鎖について検討した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:53:16 GMT)
Transforming Game Play: A Comparative Study of DCQN and DTQN Architectures in Reinforcement Learning [0.0] 本稿では,3つの異なるゲーム間での畳み込みニューラルネットワーク(CNN)とトランスフォーマーアーキテクチャを用いたディープQ-Networksの性能について検討する。
本研究の目的は、AtariゲームAsteroids, Space Invaders, CentipedeでDCQNとDTQNのパフォーマンスをベンチマークすることで、このギャップを埋めることである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:08:15 GMT)
Towards the methodology for solving the minimum enclosing ball and related problems [0.0] この論文は、d-次元ユークリッド空間に与えられた有界集合を囲む最小半径の球面の唯一の決定に対処する。
また,本論文では, この問題に関連する領域, すなわち, (a) 公約問題と特性試験, (b) 集合の分割と包含に関する定理, (c) 集合の直径の直径について論じる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:20:04 GMT)
Towards a Psychology of Machines: Large Language Models Predict Human Memory [0.0] 大規模言語モデル(LLM)は、人間の認知に基づいていないにもかかわらず、様々なタスクで優れています。
本研究では,ChatGPTが言語ベースのメモリタスクにおいて,人間のパフォーマンスを予測する能力について検討する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:24:08 GMT)
Towards a More Complete Theory of Function Preserving Transforms [0.0] 我々は、ニューラルネットワークのアーキテクチャを変更できる技術を開発し、表現する機能を維持します。
我々の方法では、残余接続を関数保存変換に統合することができるので、それらを R2R と呼ぶ。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:37:45 GMT)
Towards a Categorical Foundation of Deep Learning: A Survey [0.0] この論文は、機械学習を分類的に研究しようとする最近の研究をカバーしている。
数学と科学の言語フランスとして働く カテゴリー理論は 機械学習の分野に 統一的な構造を与えるかもしれない
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:35:08 GMT)
Towards a Categorical Foundation of Deep Learning: A Survey [0.0] この論文は、機械学習を分類的に研究しようとする最近の研究をカバーしている。
数学と科学の言語フランスとして働く カテゴリー理論は 機械学習の分野に 統一的な構造を与えるかもしれない
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:35:08 GMT)
Topological dynamics of adiabatic cat states [0.0] 量子トポロジカル周波数変換器は、量子ビットを2つの遅い調和モードに結合することで実現される。
我々の量子力学的記述は、初期状態が2つの断熱状態の重ね合わせへと総称的に進化することを示している。
トポロジカルカップリングは、量子ビットとモードの絡み合いを高め、この絡み合いのキャラクタリゼーションにおける量子またはフビニ・スタディ計量の役割を明らかにする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:43:20 GMT)
Time Series Viewmakers for Robust Disruption Prediction [0.0] 本稿では,新たな時系列ビューメーカネットワークを用いて,トレーニングデータの多種多様な拡張や“ビュー”を生成する方法について検討する。
以上の結果から,AUC と F2 の得点は,AUC と F2 のスコアが標準的あるいは非拡張よりも向上していることがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:23:43 GMT)
Thermodynamic Approach to Quantifying Incompatible Instruments [0.0] 不整合性のシグネチャを消し去るのに必要な最小熱化時間を使い、不整合性を測定する。
非マルコフ熱化において、非可逆性シグネチャは消滅しなければならないことを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:44:01 GMT)
The exact quantum chromatic number of Hadamard graphs [0.0] 我々は、位数$n=2N$ for $N$ a multiple of $4$のアダマールグラフの量子色数を計算する。
また、アダマールグラフのカテゴリー積の正確な量子色数を計算する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:56:04 GMT)
The exact quantum chromatic number of Hadamard graphs [0.0] 我々は、アビス、長谷川、菊池、佐々木から導かれた上限を用いて、位数$n=2N$ for $N$のアダマールグラフの量子色数の正確な値を計算する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:56:04 GMT)
The Trap of Presumed Equivalence: Artificial General Intelligence Should Not Be Assessed on the Scale of Human Intelligence [0.0] 知的システム理論における新しい知性を評価するための伝統的なアプローチは、人間のような行動や行動の類似性、「模倣」に基づいている。
いくつかの自然な仮定の下では、インテリジェントなシステムを開発することは、独自のインテントと目的を形成することができる、と我々は主張する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:39:58 GMT)
The State of Julia for Scientific Machine Learning [0.0] Juliaの機能とエコシステムを現代的に見て、言語の現状を評価し、その生存可能性と落とし穴について論じます。
私たちはコミュニティに、さらなる採用を妨げているJuliaの言語レベルの問題に対処するよう呼びかけています。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:43:23 GMT)
The Representation of Meaningful Precision, and Accuracy [0.0] 精度の概念と精度は、領域依存と問題依存である。
統計学習の分野、多くの種類の機械学習、二進的・多進的分類問題において用いられる単純化された数値的ハードとソフトな尺度は、モデルの有意義性やそれらの関連性を理解するのに限られていることが知られている。
本研究では,重要な課題を考察し,問題文脈に対して,最小主義的全般的粗悪な枠組みにおける構成的知識表現アプローチを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:33:38 GMT)
The Minimax Rate of HSIC Estimation for Translation-Invariant Kernels [0.0] 連続有界変換不変特性核を持つガウス環を含むボレル測度に対する$mathbb Rd$のHSIC推定の最小値が$mathcal O!left(n-1/2right)$であることを証明する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:18:27 GMT)
The Importance of Justified Patient Trust in unlocking AI's potential in mental healthcare [0.0] 信頼がなければ、患者はAIシステムに関わることをためらうかもしれない。
本稿では,AIシステムにおいて,直接的ユーザであるメンタルヘルス患者が持つべき信頼に焦点をあてる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:50:10 GMT)
The Impact of Mutability on Cyclomatic Complexity in Java [0.0] Javaでは、いくつかのオブジェクト属性は変更可能であり、他の属性は不変である。
可変オブジェクトは不変オブジェクトよりもマケイブの循環複雑度(CC)が高い。
より不変なクラスを使用することで、コードベースの全体的な複雑さと保守性を減らすことができると仮定できる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:21:05 GMT)
Tachyonic and parametric instabilities in an extended bosonic Josephson Junction [0.0] トンネル結合型量子ワイヤにおけるボース・アインシュタイン凝縮体の量子相コヒーレンスのダイナミクスと崩壊について検討する。
両凝縮体の相対的集団不均衡における自己トラッピング現象について検討した。
超低温原子配置における$pi$モードの実験的実現のための現実的パラメータについて論じる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:22:49 GMT)
Symmetries from outer automorphisms and unorthodox group extensions [0.0] 量子場理論(QFT)の構成と現象学において、対称性は重要な役割を果たす
種を部分群として含む大群に最小の「種」対称性群を拡張してQFTの対称性を構築する方法について論じる。
CP と連続対称性群の異なるクラスを含むすべての対称性群は、連続的な外部自己同型により最小の対称性 CP1 の拡張から得られることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:59:22 GMT)
Study on the Helpfulness of Explainable Artificial Intelligence [0.0] 法律、ビジネス、倫理的要件は、効果的なXAIの使用を動機付けている。
本稿では,ユーザがプロキシタスクをうまく実行する能力を通じて,XAI手法を評価することを提案する。
言い換えれば、人間の意思決定におけるXAIの有用性について論じる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:03:52 GMT)
Statistics of systemwide correlations in the random-field XXZ chain: Importance of rare events in the many-body localized phase [0.0] ランダムフィールドXXZモデルの位相図において,長距離スピンスピン相関について検討した。
縦方向の相関は明らかに異なる挙動を示し, 異なる物理状態を示す。
本研究は,MBL相の安定性に対する,このような稀ながら大きな長距離相関の影響について,システム全体の不安定性に光を当て,重要な疑問を提起した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:37:44 GMT)
Statistical Properties of Deep Neural Networks with Dependent Data [0.0] 本稿では, ディープニューラルネットワーク (DNN) 推定器の統計特性について, 従属データに基づく検討を行った。
結果は、部分的に線形回帰モデルの有限次元パラメータ上でどのように推論を行うことができるかを示すために用いられる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:46:57 GMT)
Squeezing via self-induced transparency in mercury-filled photonic crystal fibers [0.0] 水銀充填中空コアフォトニック結晶ファイバにおける自己誘起透過性を用いた超短パルスのスクイーズ化について検討した。
フェミオンおよびボゾン水銀同位体の両方を考慮すると, 室温でスクイーズを行うには極短フェムト秒パルスが必要である。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:41:17 GMT)
Solving the Transient Dyson Equation with Quasilinear Complexity via Matrix Compression [0.0] 過渡状態における非平衡ダイソン方程式を効率的に解くための数値戦略を導入する。
計算効率の大幅な向上を実現し、時間と空間の複雑さと伝播時間の両方を準線形にスケーリングする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:05:05 GMT)
Solving the Lindblad equation with methods from computational fluid dynamics [0.0] リウヴィリア力学は閉量子系における密度作用素の進化を記述する。
開量子系への1つの拡張はリンドブラッド方程式によって与えられる。
主な課題は、リンドブラッド方程式の分析解は調和系ポテンシャルや2レベル系に対してのみ得られることである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:24:23 GMT)
Solving Offline Reinforcement Learning with Decision Tree Regression [0.0] 本研究は, オフライン強化学習問題に対して, 回帰タスクとして再検討することで, 新たなアプローチを提案する。
我々は、リターン条件付きとリターン重み付き決定ツリーポリシーの2つの異なるフレームワークを紹介します。
オフラインRLに対するこの改定されたアプローチに固有の単純化にもかかわらず、我々のエージェントは、少なくとも確立された手法と同等の性能を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:13:31 GMT)
Skill Learning Using Process Mining for Large Language Model Plan Generation [0.0] 大規模言語モデル(LLM)は複雑なタスクの計画を生成することを約束する。
それらの効果は、逐次実行、制御フローモデルの欠如、スキル検索の難しさによって制限される。
プロセスマイニング技術を統合することで,LLMにおけるスキル学習に新たなアプローチを導入する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:48:42 GMT)
Single-shot Distinguishability and Anti-distinguishability of Quantum Measurements [0.0] 任意の測定セットに対して、シナリオ(i)における識別可能性(および非識別性)は、常に他のシナリオ(ii)と同等以下であることを示す。
シナリオ(4)においてのみ、完全な識別可能性(および非識別性)を達成する量子ビットの測定を同定する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:42:45 GMT)
Simultaneous inference for generalized linear models with unmeasured confounders [0.0] 本稿では,構造を利用して線形射影を3つの重要な段階に統合する,統一的な統計的推定と推測の枠組みを提案する。
サンプルおよび応答サイズとして$z$-testsの効果的なType-Iエラー制御が無限大に近づくことを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:26:52 GMT)
Scaled quantum theory. The bouncing ball problem [0.0] 標準バウンスボール問題は、重力場と高調波ポテンシャルの存在下で解析される。
密度行列の量子-古典的遷移は混合状態に対する線形スケールフォン・ノイマン方程式によって記述される。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:09:48 GMT)
Robustness and classical proxy of entanglement in variants of quantum walk [0.0] 絡み合いは時間的および空間的依存的ランダム性の両方に対して頑健であることを示す。
本稿では、内部状態の確率分布の重なりを文字通り測定する古典的な量呼び出し重なりについて述べる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:53:16 GMT)
Review: Quantum Metrology and Sensing with Many-Body Systems [0.0] 量子センシングのための別のフレームワークが、量子多体システムを利用して開発されている。
多体プローブは平衡と非平衡の両方のシナリオで用いられている。
非平衡のシナリオでは、Floquet、散逸性、および時間結晶相転移に対する量子増強感度が発見された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:46:05 GMT)
Response theory for locally gapped systems [0.0] 我々は,多体量子格子系を相互作用するための局所的ギャップの概念を導入する。
このような環境下での局所摂動に対する応答理論と久保の公式の有効性を実証する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:59:29 GMT)
Representation Learning for Regime detection in Block Hierarchical Financial Markets [0.0] 我々は、取引資産システムを支える因果情報幾何の深層表現学習の観点から、金融市場体制の検出を考察する。
深層学習モデルが学習時間相関のダイナミクスに過度に適合する金融市場投資のユースケースでは、特異なパフォーマンス指標の使用が誤解を招くことが示される。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:23:00 GMT)
Quantum state estimation of multi-partite single photon path entanglement via local measurements [0.0] マルチパーティの絡み合いは、量子インターネットの様々な応用において重要な役割を果たしている。
局所的な測定のみにより,任意の光子経路の絡み合った状態を測定する手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 06:09:18 GMT)
Quantum enhanced electric field mapping within semiconductor devices [0.0] 動作半導体デバイスにおける移動電荷と電界の相互作用をナノメートル精度で3次元マッピングする手法を提案する。
この方法は、ナノメートル精度で動作する半導体装置において、移動電荷と電場との相互作用をマッピングできる新しい量子強化電子デバイス技術の道を開く。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:24:07 GMT)
Quantum emitter interacting with a dispersive dielectric object: a model based on the modified Langevin noise formalism [0.0] スペクトル密度が中距離及び散乱支援スペクトル密度の和に等しい単一ボソニック浴は、元の電磁環境と等価であることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:11:36 GMT)
Quantum Internet: Resource Estimation for Entanglement Routing [0.0] 量子ネットワークにおける絡み合いのルーティングに必要な物理資源を推定する問題を考察する。
精製プロセスにおける実験誤差を考慮に入れた新しい方法を提案する。
この近似は広い範囲の誤差に対して合理的に有効であることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:50:39 GMT)
QeMFi: A Multifidelity Dataset of Quantum Chemical Properties of Diverse Molecules [0.0] 本稿では,TD-DFT形式を用いて計算した5つの忠実度からなる量子化学マルチフィデリティ(QeMFi)データセットについて述べる。
STO-3G, 3-21G, 6-31G, def2-SVP, def2-TZVP。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:46:52 GMT)
Proposal for simulating quantum spin models with the Dzyaloshinskii-Moriya interaction using Rydberg atoms and the construction of asymptotic quantum many-body scar states [0.0] 我々は、Rydberg原子量子シミュレータを用いて、Dzyaloshinskii-Moriya相互作用(DMI)を用いて量子スピンモデルをシミュレートする手法を開発した。
我々のアプローチは、2光子ラマン転移とスピン回転フレームへの変換を含む。
我々の設定ではシミュレートできるが固体系ではできないモデルとして、ゼーマンエネルギーからなるハミルトニアンを持つS=frac12$スピン鎖を考える。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:29:34 GMT)
Propagation of two-particle correlations across the chaotic phase for interacting bosons [0.0] 我々は,多体カオスが完全コヒーレント相関ダイナミクスの効果的な拡散機構を誘導することを示した。
この結果は、非可積分な複素多体系の動的挙動の効率的な記述への道を開いた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:48:45 GMT)
Predicting Chess Puzzle Difficulty with Transformers [0.0] GlickFormerは,Glicko-2レーティングシステムを用いて,チェスパズルの難易度を予測するトランスフォーマーアーキテクチャである。
提案モデルでは,空間的特徴抽出にChessFormerのバックボーンを改良し,分解変換技術を用いて時間情報を組み込んだ。
結果は、GlickFormerのパフォーマンスが、最先端のChessFormerベースラインと比較して、複数のメトリクスにわたって優れていることを示している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:39:02 GMT)
Petz map recovery for long-range entangled quantum many-body states [0.0] いくつかの物理的に関連する長距離量子状態におけるペッツ写像の不完全性について検討する。
その結果,ペッツ写像の回復忠実度は物質の量子位相の有用な診断法であることが示唆された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:09:27 GMT)
Perturbative Framework for Engineering Arbitrary Floquet Hamiltonian [0.0] フロケット位相空間における任意の対象ハミルトニアンを設計するための体系的摂動フレームワークを開発する。
工学的なフロケ・ハミルトンの高次誤差は、高次駆動電位を摂動的に付加することによって緩和される。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:58:55 GMT)
Personalised Feedback Framework for Online Education Programmes Using Generative AI [0.0] 本稿では,埋め込みを組み込むことでChatGPTの機能を拡張したフィードバックフレームワークを提案する。
本研究の一環として,オープンエンドおよび複数選択質問に対する有効率90%と100%を達成できる概念解の証明を提案し,開発した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 22:35:40 GMT)
Performance in a dialectal profiling task of LLMs for varieties of Brazilian Portuguese [0.0] 異なるバイアスは、方言バイアスを含むLDM生成応答で再現される。
結果は、社会言語学的な貢献により、自己資本に富むNLP技術に貢献する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:19:25 GMT)
ParCon: Noise-Robust Collaborative Perception via Multi-module Parallel Connection [0.0] 本稿では,複数のモジュールを並列に接続するParConという新しい協調認識アーキテクチャを提案する。
ParConは、並列アーキテクチャによって各モジュールが独立してノイズを管理することができるため、ノイズに対して堅牢である。
その結果、ParConは特にノイズの多い環境で最先端の精度を達成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:42:34 GMT)
Optimizing QKD efficiency by addressing chromatic dispersion and time measurement uncertainty [0.0] 本稿では,QKD(Quantum Key Distribution)プロトコルを提案する。
我々の分析は、これらの物理現象がQKD効率に与える影響を理解するための包括的な枠組みを提供する。
特に、単一光子波パケットのチャープパラメータを演算することにより、鍵発生率と広範囲のセキュア通信の大幅な改善を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:00:02 GMT)
Optical quantum memory for noble-gas spins based on spin-exchange collisions [0.0] 我々は、光子の状態を高貴ガススピンの長寿命だが光学的にアクセスできない集合状態にマッピングするためのスキームの概要と特徴付けを行う。
このマッピングは、アルカリ蒸気とのランダムな衝突に起因するコヒーレントなスピン交換相互作用を用いる。
本稿では,2つのオペレーティングシステムにおける効率的なストレージ戦略を提案し,その性能をいくつかの実験的な構成で解析する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:58:14 GMT)
On Debiasing Text Embeddings Through Context Injection [0.0] 高いパフォーマンスの埋め込みモデルは、共通のバイアスを捉えやすいが、コンテキストを組み込むことができることも示している。
検索タスクでは,埋め込みのバイアスが望ましくない結果をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:11:53 GMT)
Numerical Simulation of the Time-Dependent Schrodinger Equation Using the Crank-Nicolson Method [0.0] 本研究では10nmのポテンシャル井戸に閉じ込められた量子電子の数値シミュレーションを提案する。
結果は2000番目の段階での電子の波動関数の進化を捉えている。
2Dと3Dの両方のシミュレーションは、井戸内の量子重ね合わせと干渉の動的性質を明らかにしている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:59:01 GMT)
News-Driven Stock Price Forecasting in Indian Markets: A Comparative Study of Advanced Deep Learning Models [0.0] 人工知能(AI)と自然言語処理(NLP)の最近の進歩は、株価予測能力を著しく強化している。
インド国定銀行の30年間の歴史的データを利用して株価を予測している」と述べた。
このアプローチでは,多段長短期記憶(LSTM),Optunaで最適化されたLightGBMを用いたFacebook Prophet,季節自動回帰統合型移動平均(SARIMA)など,最先端のディープラーニングモデルを活用する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:30:06 GMT)
New Metrics for Assessing Projection Pursuit Indexes, and Guiding Optimisation Choices [0.0] プロジェクション追跡(PP)ガイド付きツアーは、PPインデックスとして知られる基準関数をインタラクティブに最適化し、興味深いプロジェクションを明らかにすることで高次元データを探索する。
PP指数の最適化は非滑らかな関数であれば非自明でもよいし、最適関数は近接してのみ検出できる小さな「スキント角」を持つ。
本研究では,最近導入されたSwarmベースのアルゴリズムであるJellyfish Search Optimiser (JSO)の性能について検討した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:22:51 GMT)
Neural Projected Quantum Dynamics: a systematic study [0.0] ニューラル量子状態を用いた大規模システムにおけるユニタリ量子力学のシミュレーションの課題に対処する。
この研究は、予測時間依存変分モンテカルロ法(p-tVMC)の包括的な形式化を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:01:33 GMT)
Measurability in the Fundamental Theorem of Statistical Learning [0.0] 統計的学習の基本定理は、仮説空間がPAC学習可能であることと、そのVC次元が有限であることは同値である。
本稿では、実数 O-極小展開上で定義された仮説空間のPAC学習可能性について十分な条件を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:03:06 GMT)
Many-Body Open Quantum Systems [0.0] 我々は、散逸性およびコヒーレントなプロセスの両方を高度に調整・制御できるプラットフォームにおけるオープン量子多体物理学の理解における最近の理論的進歩について論じる。
熱や多体損失などの相関した多体散逸過程の存在下でのオープン量子多体系のダイナミクスを概観する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:17:38 GMT)
Machine Translation Evaluation Benchmark for Wu Chinese: Workflow and Analysis [0.0] 現代武漢機械翻訳モデルの評価ベンチマークとしてFLORES+データセットを導入する。
我々は、Wu Chineseをテキスト的に低リソース言語として認識し、その機械翻訳モデルの課題に対処する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:30:19 GMT)
Machine Learning Driven Global Optimisation Framework for Analog Circuit Design [0.0] アナログ回路設計のための機械学習駆動最適化フレームワークを提案する。
最適化アルゴリズムを指向するために,機械学習モデルとスパイスシミュレーションを用いる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:44:11 GMT)
MLP, XGBoost, KAN, TDNN, and LSTM-GRU Hybrid RNN with Attention for SPX and NDX European Call Option Pricing [0.0] 各種ニューラルネットワークアーキテクチャの性能について検討する。
S&P 500 (SPX) とNASDAQ 100 (NDX) の指数オプションは2015-2023年に取引され、成熟期間は15日から4年以上である。
Black & Scholes (BS) の PDE citeBlack1973 モデルでは、実際のデータと同等の価格設定がベンチマークとして使用される。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:46:45 GMT)
MARS: A neurosymbolic approach for interpretable drug discovery [0.0] ニューロシンボリック(NeSy)人工知能(Neurosymbolic、NeSy)は、論理やルールに基づく技術とニューラルネットワークの組み合わせを記述する。
MARSは、学習された規則重みで論理的ルールを活用する、薬物発見のためのNeSyアプローチである。
MARSは、既知のMoAsと整合したモデル解釈を生成しながら、現在の最先端モデルと同等のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:28:25 GMT)
MARS: A neurosymbolic approach for interpretable drug discovery [0.0] ニューロシンボリック(NeSy)人工知能(Neurosymbolic、NeSy)は、論理やルールに基づく技術とニューラルネットワークの組み合わせを記述する。
MARSは、学習された規則重みで論理的ルールを活用する、薬物発見のためのNeSyアプローチである。
MARSは、既知のMoAsと整合したモデル解釈を生成しながら、現在の最先端モデルと同等のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:28:25 GMT)
Latent diffusion models for parameterization and data assimilation of facies-based geomodels [0.0] 拡散モデルは、ランダムノイズを特徴とする入力場から新しい地質学的実現を生成するために訓練される。
遅延拡散モデルは、ジオモデリングソフトウェアからのサンプルと視覚的に整合した実現を提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:14:56 GMT)
LADMIM: Logical Anomaly Detection with Masked Image Modeling in Discrete Latent Space [0.0] マスク付き画像モデリングは、画像中のマスキング領域の特徴表現を予測する自己教師付き学習技術である。
本稿では,MIMの特性を利用して論理異常を効果的に検出する手法を提案する。
提案手法をMVTecLOCOデータセット上で評価し,平均AUC 0.867。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 07:50:56 GMT)
JurEE not Judges: safeguarding llm interactions with small, specialised Encoder Ensembles [0.0] JurEEは、効率的なエンコーダのみのトランスフォーマーモデルのアンサンブルである。
様々な主要なリスクに対する確率的リスク推定を提供する。
特に、厳格なコンテンツモデレーションを必要とするアプリケーションに適している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:58:31 GMT)
JurEE not Judges: safeguarding llm interactions with small, specialised Encoder Ensembles [0.0] JurEEは、効率的なエンコーダのみのトランスフォーマーモデルのアンサンブルである。
様々な主要なリスクに対する確率的リスク推定を提供する。
特に、厳格なコンテンツモデレーションを必要とするアプリケーションに適している。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:58:31 GMT)
Interpolation, Extrapolation, Hyperpolation: Generalising into new dimensions [0.0] ハイパーポーリング(Hyperpolation)は、限られたデータポイントから一般化する手法である。
ハイパーポーレーションは可能であり、芸術や科学における創造性との関係を探ることになるでしょう。
また、機械学習におけるハイパーポーラレーションの役割についても検討し、現在のAIシステムにおける基本的な創造性の欠如が、ハイパーポーラレーションの限られた能力と深く結びついていることを示唆する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:52:17 GMT)
Instability of quadratic band degeneracies and the emergence of Dirac points [0.0] 高対称性準同相体$boldsymbolM$上の二次バンド縮退点はディラック点である。
ウェーブパペットは、$boldsymbolD+$ または $boldsymbolD-$ のいずれかの近傍でスペクトル局在化され、対流項を持つディラック方程式の系によって支配される。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:04:42 GMT)
Innovative Deep Learning Techniques for Obstacle Recognition: A Comparative Study of Modern Detection Algorithms [0.0] 本研究では,高度なYOLOモデル,特にYOLOv8,YOLOv7,YOLOv6,YOLOv5を用いた障害物検出の包括的アプローチについて検討する。
その結果, YOLOv8は精度が向上し, 精度が向上した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:28:03 GMT)
How to realize compact and Anderson-like localized states in disorder-free hypercube bosonic networks [0.0] 障害のないハイパーキューブグラフ上で、様々なゼロエネルギー局所化状態を設計する手法を提案する。
我々は、コンパクトかつ非コンパクトな(すなわちアンダーソン様の)局在状態が、障害のないハイパーキューブ上で観察可能であることを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:41:32 GMT)
High-Coherence Quantum Acoustics with Planar Superconducting Qubits [0.0] 高オーバトンバルク音響共振器(HBAR)は量子音響の魅力的な機械的実装である。
本研究では、平面超伝導量子ビットアーキテクチャと統合された高コヒーレンスHBAR量子音響の実装を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:22:18 GMT)
Groningen: Spatial Prediction of Rock Gas Saturation by Leveraging Selected and Augmented Well and Seismic Data with Classifier Ensembles [0.0] 本稿では,巨大グローニンゲンガス田の例における分類器アンサンブル法を用いて,岩盤飽和確率の空間的予測に関する概念を実証する。
提案手法の有効性を示し, トレーニングサンプルを9倍に増やした。
フィールド内および隣接領域におけるガス貯留層の厚さの予測を行う。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:53:05 GMT)
Good binary quantum codes with transversal CCZ gate [0.0] 我々は、CCZゲートを持つ量子CSS符号を量子ビット上に生成する。
概要として、構築されたコードファミリーは、一定の空間オーバーヘッドを持つマジック状態蒸留スキームを提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 03:39:53 GMT)
Generative AI and Its Impact on Personalized Intelligent Tutoring Systems [0.0] 生成AIは、動的コンテンツ生成、リアルタイムフィードバック、適応学習経路を通じてパーソナライズされた教育を可能にする。
報告では、自動質問生成、カスタマイズされたフィードバック機構、対話システムなどの重要な応用について検討する。
今後の方向性は、マルチモーダルAI統合の潜在的な進歩、学習システムにおける感情的知性、そしてAI駆動型教育の倫理的意味を強調する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:01:01 GMT)
Generating multipartite nonlocality to benchmark quantum computers [0.0] 量子コンピュータは大規模に$n$の非局所性を生み出すのに利用できることを示す。
これにより、量子ビットの数や接続性に関わらず、古典的でない相関をベンチマークすることができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:11:48 GMT)
Generalized measurements on qubits in quantum randomness certification and expansion [0.0] 一般化された測定によって複数の証明されたランダム性が得られるシナリオについて検討する。
いくつかのプロトコルのロバスト性を比較し、一般化された測定の利点を示す。
我々の探索は、ランダム性の量子源の認証を改善するために一般化された測定の可能性を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:47:57 GMT)
Fuzzy Convolution Neural Networks for Tabular Data Classification [0.0] 畳み込みニューラルネットワーク(CNN)は、様々な領域における顕著な性能のために、多くの注目を集めている。
本稿では,表データに適したファジィ畳み込みニューラルネットワーク(FCNN)を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:21:31 GMT)
From Uncertainty Relations to Quantum Acceleration Limits [0.0] 任意の有限次元射影ヒルベルト空間で定義される量子系に対する2つの代替微分の比較解析を行う。
量子進化の加速の最大上限を達成するのに必要な最も一般的な条件を見つける。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:30:01 GMT)
Finetuning YOLOv9 for Vehicle Detection: Deep Learning for Intelligent Transportation Systems in Dhaka, Bangladesh [0.0] バングラデシュ政府は、スマートモビリティを「スマートバングラデシュビジョン2041」に向けた重要なステップとして、ITSの統合を認めている。
本稿では,バングラデシュのデータセット上で訓練されたネイティブ車両を検出するための細調整対象検出器 YOLOv9 モデルを提案する。
その結果, 平均精度(mAP)は平均値0.934で, IoU(Intersection over Union)は0.5。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 00:19:18 GMT)
Few-shot Novel View Synthesis using Depth Aware 3D Gaussian Splatting [0.0] 3次元ガウススプラッティングは、新しいビュー合成における神経放射場法を超越している。
多数のインプットビューを備えた高品質なレンダリングを生成するが、ほんの数ビューしか利用できない場合、パフォーマンスは大幅に低下する。
数発の新規ビュー合成のための奥行き認識型ガウススプラッティング法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:42:30 GMT)
F2A: An Innovative Approach for Prompt Injection by Utilizing Feign Security Detection Agents [0.0] 大規模言語モデルは、安全検出剤に対する盲目的な信頼を示す。
本論文は、F2A(Feign Agent Attack)と名づけられた攻撃を提案する。
実験には、偽の安全検出結果がプロンプトに注入される様々なシナリオが含まれていた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:04:51 GMT)
F2A: An Innovative Approach for Prompt Injection by Utilizing Feign Security Detection Agents [0.0] LLM(Large Language Models)は、安全性検出剤に対する盲目的の信頼を示す。
本論文は、F2A(Feign Agent Attack)と名づけられた攻撃を提案する。
実験には、偽の安全検出結果がプロンプトに注入される様々なシナリオが含まれていた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:04:51 GMT)
Exploring the Potential of Polynomial Basis Functions in Kolmogorov-Arnold Networks: A Comparative Study of Different Groups of Polynomials [0.0] 本稿では,ゴットリーブモゴロフネットワーク(KAN)モデルにおける18の異なる特徴とその潜在的な応用について述べる。
本研究は,手書き桁分類などの複雑なタスクに対するkanモデルにおける基本関数としての theseDistincts の適合性を検討することを目的とする。
総合的精度,Kappa,F1スコアを含むkanモデルの性能指標を評価し,比較した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 01:58:57 GMT)
Exploring the Dynamics of Lotka-Volterra Systems: Efficiency, Extinction Order, and Predictive Machine Learning [0.0] 破壊効率が持続的でないシステムをいかに生み出すかを示す。
我々は、出生、死、自己規制、相互作用の強さの合計値の不平等が、食物網の持続性や安定性に関する洞察をいかにもたらすかを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 18:29:55 GMT)
Exploring Wavelet Transformations for Deep Learning-based Machine Condition Diagnosis [0.0] 本研究では、時系列電流信号をウェーブレット変換により時間周波数2D表現に変換する。
この研究はWT-Amor、WT-Bump、WT-Morse、WSST-Amor、WSST-Bumpの5つの技術を用いている。
WT-Amor、WT-Bump、WT-MorseのDLモデルは、それぞれ90.93、89.20、93.73%のピークモデル精度で顕著な効果を示した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:08:09 GMT)
Error-Detected Quantum Operations with Neutral Atoms Mediated by an Optical Cavity [0.0] 本稿では,光ツイーザの単一原子をファブリペロファイバキャビティに結合するプラットフォームを提案する。
99.960$+14_-24%の忠実度を持つ高速な量子ビット状態読み出しと、共振器を介するエンタングルメント生成のための2つの手法を統合誤差検出で示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:53:48 GMT)
Entanglement witness and nonlocality in confidence of measurement from multipartite quantum state discrimination [0.0] 局所的な操作や古典的コミュニケーションでは達成できない世界的最大信頼度は、絡み合いの証人の存在に強く依存していることを示す。
我々は、非局所的な最大信頼度を持つ量子状態アンサンブルを構築するために、絡み合いの証人の観点から方法を確立する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 02:40:03 GMT)
Enhancing Apple's Defect Classification: Insights from Visible Spectrum and Narrow Spectral Band Imaging [0.0] 本研究は, リンゴの欠陥の分類を, 経済的損失を軽減し, 食品サプライチェーンを最適化するための重要な手段として扱う。
可視光と660nmの波長の画像を統合して、欠陥分類の精度と効率を高める革新的なアプローチが採用されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:37:26 GMT)
Energetic Analysis of Emerging Quantum Communication Protocols [0.0] 本稿では,短期量子ネットワークに適用される様々な量子技術とプロトコルのエネルギー要求をモデル化する枠組みの基礎を述べる。
両部ネットワークプロトコルと多部ネットワークプロトコルのエネルギー消費に関するベンチマークを示す。
フォトニックセットアップのエネルギー消費を推定するオープンソースソフトウェアも提供する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:09:03 GMT)
Efficient quantum algorithm to simulate open systems through a single environmental qubit [0.0] 量子コンピュータ上でのリンドブラッドマスター方程式により記述された開量子系の力学をシミュレーションする効率的なアルゴリズムを提案する。
固定精度条件下では,他の手法と比較してトロッター数を減らすことができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:06:48 GMT)
Efficient Simulation of Open Quantum Systems on NISQ Devices [0.0] NISQハードウェア上でのオープン量子システムをシミュレーションするための効率的なフレームワークを提案する。
提案手法は計算コストのかかるトロッタライズ法を回避し,リンドブラッドマスター方程式を利用する。
実量子ハードウェア上でのシミュレーションと正確な解との強い一致を示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:13:47 GMT)
Early Diagnoses of Acute Lymphoblastic Leukemia Using YOLOv8 and YOLOv11 Deep Learning Models [0.0] 本研究は,急性リンパ芽球性白血病(ALL)に対する画像処理および深層学習技術の応用について検討する。
この研究は、特に最新のYOLOシリーズモデルを用いたALL検出の最近の発展に焦点を当てている。
YOLOv8やYOLOv11のような高度なディープラーニングモデルを利用することで、高い精度で98.8%に達することができる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:42:07 GMT)
Dual-Mode Calorimetric Superconducting Nanowire Single Photon Detectors [0.0] 従来のGeiger SNSPDモードでは、センサーは臨界温度Tcよりかなり低い温度で作動する。
カロリー測定モードでは、検出器はTcの直下温度で動作し、光スペクトルの波長に対する光数感度を表示する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:31:44 GMT)
Double Jeopardy and Climate Impact in the Use of Large Language Models: Socio-economic Disparities and Reduced Utility for Non-English Speakers [0.0] 私たちは,OpenAIのGPTモデルをAPI経由で使用する場合,入力の処理方法であるトークン化によって,英語話者のコストが高くなることを示した。
約15億人は、主に低所得国の言語を話し、英語話者が直面しているものよりも4倍から6倍のコストがかかる可能性がある。
このことは、全ての言語グループに利益をもたらすためのより公平なアルゴリズム開発の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:11:04 GMT)
Do we need more complex representations for structure? A comparison of note duration representation for Music Transformers [0.0] そこで本研究では,既成のMusic Transformerモデルが,注釈のないMIDI情報のみを用いて,構造的類似度の測定を行うかどうかを問う。
最も一般的な表現の微妙な微調整が、小さなが重要な改善をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:53:11 GMT)
Dissecting embedding method: learning higher-order structures from data [0.0] データ学習のための幾何学的深層学習法は、しばしば特徴空間の幾何学に関する仮定のセットを含む。
これらの仮定と、データが離散的で有限であるという仮定は、いくつかの一般化を引き起こし、データとモデルの出力の間違った解釈を生み出す可能性がある。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:19:39 GMT)
Discrete-Time Open Quantum Walks for Vertex Ranking in Graphs [0.0] 本稿では離散時間オープンな量子ウォークを用いたグラフ上の新しい量子PageRankアルゴリズムを提案する。
GoogleのPageRankは、古典的な計算でWorld Wide Web上のWebページをアレンジするための重要なアルゴリズムである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 05:56:59 GMT)
Dimension-free uniform concentration bound for logistic regression [0.0] 制約付きロジスティック回帰の次元リスク関数に束縛された新規な一様濃度を与える。
我々の境界は、ラデマッハ複雑性論とマクダイアルメイドの不等式によって導かれる条件よりも大きな数の一様法則に対して、より穏やかな条件をもたらす。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:40:26 GMT)
Diagnosing Hate Speech Classification: Where Do Humans and Machines Disagree, and Why? [0.0] 我々は、ヘイトスピーチ分類の診断にコサイン類似度比、埋め込み回帰、手動再注釈を用いる。
女性アノテーターは黒人を標的とする人種的なスラリーに敏感である。
機械が人間のアノテータと矛盾するところの診断において、機械は人間よりもミスが少ないことがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:39:45 GMT)
Demonstration Organization via Logit Separability: Advancing In-Context Learning through Multiple Class-Related Words [0.0] 本稿では,ロジットレベルのサンプルとクラス関連単語の明瞭度を評価するための基準であるロジット分離性を導入する。
各サンプルに複数のクラス関連語を組み込むことで,より広い範囲のラベル情報を提供することで,性能の向上が期待できる。
サンプルを共同で整理し,複数のクラス関連単語を各サンプルラベルペアに統合する,ロジット分離性に基づくlicLを提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:01:10 GMT)
Deep Learning-based Machine Condition Diagnosis using Short-time Fourier Transformation Variants [0.0] 本研究では,短時間フーリエ変換(STFT)法を用いた時系列モータ電流信号を時間周波数2Dプロットに変換する。
従来の畳み込みニューラルネットワーク(CNN)アーキテクチャに基づくディープラーニング(DL)モデルをトレーニングし、検証する。
4つの手法が93.20%の精度で過去の最高のML法を上回り、5つの手法はそれぞれ80.25、74.80、82.80%の精度で以前の2Dプロット法を上回りました。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 10:05:49 GMT)
Deep Learning Based XIoT Malware Analysis: A Comprehensive Survey, Taxonomy, and Research Challenges [0.0] IoT(Internet of Things)は,急速に成長するコンピューティング産業のひとつだ。
従来のマルウェア検出手法は、これらの新しい種類のマルウェアに対して効果が低い。
機械学習(ML)とディープラーニング(DL)アプローチは、これらの新しいIoTマルウェアの亜種を扱うのに有効であることが証明されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:04:43 GMT)
Cultural Fidelity in Large-Language Models: An Evaluation of Online Language Resources as a Driver of Model Performance in Value Representation [0.0] GPT-4oが国の社会的価値を反映する能力は、その言語でデジタルリソースが利用可能であることと相関していることを示す。
低リソース言語、特にグローバル・サウスで顕著なWeakerのパフォーマンスは、デジタル・ディビジョンを悪化させる可能性がある。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:33:00 GMT)
Complementing the transmon by integrating a geometric shunt inductor [0.0] 2つの量子ビット間のZZ相互作用は、フラックスバイアスが反対符号アンハーモニック性を持つ場合、完全に抑制されることを示す。
この2-qubit-species回路の単純さは、コヒーレントな誤差とリッチゲートセットの少ない超伝導量子ビットの大きな格子を構築することを約束する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:06:57 GMT)
Collaborative filtering based on nonnegative/binary matrix factorization [0.0] データを疎結合とする協調フィルタリングに適用可能な改良型NBMFアルゴリズムを提案する。
修正手法では、評価行列の未定格要素をマスキングし、協調フィルタリング性能を向上させる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:10:15 GMT)
Classifying Healthy and Defective Fruits with a Multi-Input Architecture and CNN Models [0.0] 主な目的は、CNNモデルの精度を高めることである。
その結果,Multi-Input アーキテクチャにシルエット画像を含めることで,優れた性能のモデルが得られることがわかった。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 21:37:12 GMT)
Classification of 4 types of White blood cell images [0.0] ヒト免疫系には、細菌感染症、エイズ、がん、脾臓など多くの疾患の指標となる白血球(WBC)が含まれる。
伝統的に、実験室では、病理学者や血液学者が顕微鏡で血液細胞を分析し、手動で分類する。
本稿ではまず,ResNet-50,InceptionV3,VGG16,MobileNetV2などのCNNプレトレインモデルを用いて,白血球の自動分類を行った。
これらのアーキテクチャに触発されて、4種類の白血球を精度良く自動的に分類する枠組みが提案されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:38:45 GMT)
Characterization of Polariton Dynamics in a Multimode Cavity: Noise-enhanced Ballistic Expansion [0.0] マルチモードマイクロキャビティに埋め込まれたノイズエミッタ格子におけるパケットダイナミクスの理論解析を行う。
雑音のないケースとノイズのないケースの両方で、一連の動的現象を明らかにする。
この研究は、複雑なシステムにおける光-物質相互作用に焦点をあてた将来の実験の道を開くものである。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:58:00 GMT)
Characterization of Noninteracting Bosons, with Applications [0.0] JILAにおけるボソンサンプリング実験の結果を解析するために開発された評価ツールについて論じる。
原子の識別不可能性は、多粒子群の特徴のよい予測因子であることを示した。
本稿では,Fock ベース測定から単一粒子のユニタリを推定するための実験設計の最適化について論じる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:04:02 GMT)
Can Structured Data Reduce Epistemic Uncertainty? [0.0] モデルでは、逐次分類タスクにおいて、より優れた性能で下流タスクをより高い速度で学習できることが示される。
オントロジーアライメントの過程においてサブエミッションマッピングがどのようにして取得されたかを示すために、我々の研究を拡張し、大規模言語モデルにおける検索・拡張生成を強化するのに役立ちます。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 23:38:51 GMT)
Building Trust in Data for IoT Systems [0.0] 本稿では,Trust in Dataを提供する適切なプロトコルを用いた新しいソリューションを提案する。
IOTA Distributed Ledger TechnologyとTrusted Platform Moduleが使用されている。
本稿では,その実現可能性を確認し,達成可能な性能を評価するために,Proof-of-Conceptの実装と実験的評価を行う。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:20:33 GMT)
Beyond-RAG: Question Identification and Answer Generation in Real-Time Conversations [0.0] カスタマーコンタクトセンターでは、人間エージェントは長い平均処理時間(AHT)に苦しむことが多い。
本稿では,顧客質問をリアルタイムに識別し,RAGを超越した意思決定を支援するシステムを提案する。
クエリがFAQと一致した場合、システムはFAQデータベースから直接回答を検索する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:06:22 GMT)
Barlow Twins Deep Neural Network for Advanced 1D Drug-Target Interaction Prediction [0.0] BarlowDTIは機能抽出に強力なBarlow Twinsアーキテクチャを使用している。
複数の確立されたベンチマークに対して最先端の予測性能を達成する。
共結晶構造を比較することで、BarlowDTIは触媒活性および安定化残基を効果的に利用していることが分かる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:13:05 GMT)
Balancing Pareto Front exploration of Non-dominated Tournament Genetic Algorithm (B-NTGA) in solving multi-objective NP-hard problems with constraints [0.0] 提案手法をB-NTGA(B-NTGA)に適用した新しい平衡選択演算子を提案する。
提案したB-NTGAは,Thief Traveling ProblemやMulti-Skill Resource-Constrained Project Scheduling Problemのような,多目的および多目的の現実世界の2つのベンチマークで検討した。
実験の結果,B-NTGAは最先端手法よりも効率が高く,性能も優れていた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:01:59 GMT)
Balancing Pareto Front exploration of Non-dominated Tournament Genetic Algorithm (B-NTGA) in solving multi-objective NP-hard problems with constraints [0.0] 提案手法をB-NTGA(B-NTGA)に適用した新しい平衡選択演算子を提案する。
提案したB-NTGAは,Thief Traveling ProblemやMulti-Skill Resource-Constrained Project Scheduling Problemのような,多目的および多目的の現実世界の2つのベンチマークで検討した。
実験の結果,B-NTGAは最先端手法よりも効率が高く,性能も優れていた。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:01:59 GMT)
Back-of-the-Book Index Automation for Arabic Documents [0.0] 書籍のバック・オブ・ザ・ブックのインデックスが与えられた場合、関連するページに対するインデックス項の正確な発生を確認し、識別することを目的としている。
正確な一致、語彙的類似性、意味的類似性など、いくつかの指標を使用して、最も適切な事象を決定する。
我々の手法はF1スコア.966(精度=.966,リコール=.966)を達成する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:38:29 GMT)
Automatic Classification of White Blood Cell Images using Convolutional Neural Network [0.0] ヒト免疫系には、細菌感染症、エイズ、がん、脾臓など多くの疾患の指標となる白血球(WBC)が含まれる。
伝統的に、実験室では、病理学者や血液学者が顕微鏡で血液細胞を分析し、手動で分類する。
本稿ではまず,ResNet-50,InceptionV3,VGG16,MobileNetV2などのCNNプレトレインモデルを用いて,白血球の自動分類を行った。
これらのアーキテクチャに触発されて、4種類の白血球を精度良く自動的に分類する枠組みが提案されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:38:45 GMT)
Automatic Classification of White Blood Cell Images using Convolutional Neural Network [0.0] ヒト免疫系には、細菌感染症、エイズ、がん、脾臓など多くの疾患の指標となる白血球(WBC)が含まれる。
伝統的に、実験室では、病理学者や血液学者が顕微鏡で血液細胞を分析し、手動で分類する。
本稿ではまず,ResNet-50,InceptionV3,VGG16,MobileNetV2などのCNNプレトレインモデルを用いて,白血球の自動分類を行った。
これらのアーキテクチャに触発されて、4種類の白血球を精度良く自動的に分類する枠組みが提案されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:38:45 GMT)
Automatic Classification of White Blood Cell Images using Convolutional Neural Network (CNN) [0.0] ヒト免疫系には、細菌感染症、エイズ、がん、脾臓など多くの疾患の指標となる白血球(WBC)が含まれる。
伝統的に、実験室では、病理学者や血液学者が顕微鏡で血液細胞を分析し、手動で分類する。
本稿ではまず,ResNet-50,InceptionV3,VGG16,MobileNetV2などのCNNプレトレインモデルを用いて,白血球の自動分類を行った。
これらのアーキテクチャに触発されて、4種類の白血球を精度良く自動的に分類する枠組みが提案されている。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 11:38:45 GMT)
Automated extraction of 4D aircraft trajectories from video recordings [0.0] d'Enquetes et d'Analyses pour la S'ecurit'e de l'Aviation Civile (BEA)は、あらゆる種類の航空機を含む機内または地上カメラの事故映像を分析しなければならない。
本研究は,これらのビデオから4次元トラジェクトリの抽出を自動化し,フォトグラム法の適用性を明らかにすることを目的とする。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 08:06:41 GMT)
Autoencoded Image Compression for Secure and Fast Transmission [0.0] 本稿では,画像圧縮のためのオートエンコーダアーキテクチャを提案する。
提案アーキテクチャは、再生した画像に対して97.5%のSSIMを実現し、平均遅延時間を87.5%削減する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:12:06 GMT)
Audio Captioning via Generative Pair-to-Pair Retrieval with Refined Knowledge Base [0.0] Retrieval-Augmented Generation (RAG)は、知識ベースから音声テキストペアを検索し、クエリオーディオで拡張し、正確なテキスト応答を生成する。
生成したキャプションをテキストクエリとして使用して,関連する音声テキストペアを正確に検索する生成ペア対検索を提案する。
提案手法は,AudioCaps,Clotho,Auto-ACDといったベンチマークの最先端結果を実現する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 04:57:32 GMT)
Arrhythmia Classification Using Graph Neural Networks Based on Correlation Matrix [0.0] 抽出した特徴の相関行列を用いて隣接行列を生成し,不整脈の分類にグラフニューラルネットワークを適用した。
その結果,不整脈分類の精度は50%以上であり,不整脈分類のアプローチである可能性が示唆された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:38:37 GMT)
Are intrinsic decoherence models physical theories? [0.0] 量子力学における測定問題を解くために,固有デコヒーレンスモデル (IDMs) が提案されている。
本研究では,これらのモデルのうち2つの状態を物理理論として評価し,パラメータの推定可能性の究極的境界を確立する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:34:53 GMT)
Are intrinsic decoherence models physical theories? [0.0] 量子力学における測定問題を解くために,固有デコヒーレンスモデル (IDMs) が提案されている。
本研究では,これらのモデルのうち2つの状態を物理理論として評価し,パラメータの推定可能性の究極的境界を確立する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 09:34:53 GMT)
Analysis and Optimization of Seismic Monitoring Networks with Bayesian Optimal Experiment Design [0.0] ベイズ最適実験設計(OED)は、不確実性を最適に低減できるデータ、センサーの構成、実験を特定することを目指している。
情報理論は、最適化問題として実験やセンサ配置の選択を定式化し、OEDを導出する。
本研究では,ベイジアンOEDをセンサネットワークの地震イベント検出能力の最適化に用いるために必要なフレームワークを開発する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:47:12 GMT)
Analysis and Optimization of Seismic Monitoring Networks with Bayesian Optimal Experiment Design [0.0] ベイズ最適実験設計(OED)は、不確実性を最適に低減できるデータ、センサーの構成、実験を特定することを目指している。
情報理論は、最適化問題として実験やセンサ配置の選択を定式化し、OEDを導出する。
本研究では,ベイジアンOEDをセンサネットワークの地震イベント検出能力の最適化に用いるために必要なフレームワークを開発する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 19:47:12 GMT)
ASTM :Autonomous Smart Traffic Management System Using Artificial Intelligence CNN and LSTM [0.0] 本稿では,AIを用いて交通流量を改善する自律型スマートトラヒック管理システムを提案する。
このシステムは、交通管理画像中の車両を検出するために、YOLO V5 Convolutional Neural Networkを使用している。
また、長い短期記憶を備えたリカレントニューラルネットワークを使用して、次の12時間の車両数を予測する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 16:35:27 GMT)
AI-Driven Autonomous Control of Proton-Boron Fusion Reactors Using Backpropagation Neural Networks [0.0] 陽子ホウ素(p-11B)核融合は、持続可能で中性子のないエネルギー生成への有望な道を示す。
従来の制御系は、プラズマの高度に動的で非線形な挙動を管理する上で困難に直面している。
本稿では,バックプロパゲーションに基づくニューラルネットワークを用いて,陽子-ホウ素核融合炉のキーパラメータを自律的に制御する手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:58:43 GMT)
A short trajectory is all you need: A transformer-based model for long-time dissipative quantum dynamics [0.0] 深層人工知能ニューラルネットワークは、散逸環境に結合した量子システムの長時間の人口動態を予測することができることを示す。
我々のモデルは、リカレントニューラルネットワークのような古典的な予測モデルよりも正確です。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 20:44:10 GMT)
A phase microscope for quantum gases [0.0] コヒーレンス特性は量子系の中心であり、超伝導のような現象の中心にある。
熱相転移を横切る2次元光学格子における超低温ボースガスのコヒーレンス特性について検討した。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 15:17:45 GMT)
A new economic and financial theory of money [0.0] 電子通貨の評価はマクロ経済学理論と金融政策の基本方程式に基づく。
電子通貨を、サブエコノミーの有形資産に関連付けられた取引株式として捉えていく。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:24:17 GMT)
A general machine learning model of aluminosilicate melt viscosity and its application to the surface properties of dry lava planets [0.0] 我々は溶存マグマの粘度を予測する新しいモデルを提案し、溶存マグマの海を含む様々なシナリオに適用する。
ホスホアルミノケイ酸塩融液の粘度を28,898のデータベースを用いて,ガウス法で精製したグレーボックス人工ニューラルネットワークを訓練した。
このモデルは高い予測精度(RMSE $log_10$ Pa$cdot$s)を達成し、SiO$$から多成分マグマおよび工業用ガラスの合成を処理できる。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 12:51:23 GMT)
A Structural Text-Based Scaling Model for Analyzing Political Discourse [0.0] 本稿では,テキストデータから潜在トピックに対する話者のイデオロギー的位置を推定する構造的テキストベーススケーリングモデルを提案する。
STBSを上院の演説に適用し、移民と銃暴力を議会における2大政党間の最も分極的な話題とみなす。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 14:05:35 GMT)
A Novel No-Reference Image Quality Metric For Assessing Sharpness In Satellite Imagery [0.0] 本研究では,画像のシャープネスを評価することを目的とした,新しい非参照画像品質指標を提案する。
ノイズ、露光、コントラスト、画像内容の変動に対して頑健なように設計されており、明瞭なエッジに沿った勾配の正規化減衰率を測定する。
この指標は主に、シャープネスの人間の視覚的知覚と一致するように衛星画像のために開発された。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 13:30:18 GMT)
A Counterexample in Image Registration [0.0] 画像登録は、画像変換や画像類似性に関するモデルを適用して、同じシーンの離散的な画像をアライメントする一般的な問題である。
本研究では、2つ以上のノイズレスサンプリングパターンから空間的に制限されたピースワイド定値信号を推定する。
その結果、信号の推定精度はその信号の基準点に依存する。
論文参考訳(メタデータ) (Mon, 14 Oct 2024 17:05:03 GMT)