On Prompt-Driven Safeguarding for Large Language Models [172.1] 表現空間では、入力クエリは通常、安全プロンプトによって「より高い拒絶」方向に移動される。
これらの知見に触発されて,安全性向上,すなわちDROの最適化手法を提案する。
安全性プロンプトを継続的かつトレーニング可能な埋め込みとして扱うことで、DROは、その有害性に応じて、クエリの表現を拒否方向に沿ってあるいは反対に移動させることを学ぶ。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:52:58 GMT)
Connecting the Dots: Collaborative Fine-tuning for Black-Box Vision-Language Models [121.1] 本稿では,下流タスクに対するブラックボックス視覚言語モデルの微調整のための textbfCraFT' アプローチを提案する。
CraFTは、2つのモジュールと、テキストプロンプトを学習するプロンプト生成モジュールと、残差スタイルの出力予測を強化する予測改善モジュールとから構成される。
15以上のデータセットに対する数ショットの分類実験は、CraFTの優位性を示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:22:12 GMT)
A Survey on Self-Evolution of Large Language Models [116.5] 大規模言語モデル(LLM)は、様々な分野やインテリジェントエージェントアプリケーションにおいて大きく進歩している。
この問題に対処するために、LLMが自律的に獲得し、洗練し、モデル自身によって生成された経験から学ぶことができる自己進化的アプローチが急速に成長している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:47:30 GMT)
ZeroNLG: Aligning and Autoencoding Domains for Zero-Shot Multimodal and Multilingual Natural Language Generation [114.8] 自然言語生成(NLG)は、画像、ビデオ、テキストの形式で入力データを受け付け、対応する自然言語テキストを出力として生成する。
既存のNLGメソッドは、主に教師付きアプローチを採用し、結合されたデータとテキストのペアに大きく依存している。
我々はZeroNLGを提案する。ZeroNLGは、画像からテキストへ(画像キャプション)、ビデオからテキストへ(動画キャプション)、テキストからテキストへ(音声機械翻訳)を英語、中国語、ドイツ語、フランス語で処理できる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:47:12 GMT)
Physically Compatible 3D Object Modeling from a Single Image [110.0] 単一画像を3次元物理オブジェクトに変換するフレームワークを提案する。
我々のフレームワークは、リコンストラクションプロセスに物理的な互換性を組み込む。
既存の手法よりも3Dモデルの物理的リアリズムを一貫して強化する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:34:58 GMT)
Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression [109.2] 本研究は,Large Language Models (LLM) の最初の完全評価を行う。
量子化は現在、効率性と信頼性を同時に達成する上で、プルーニングよりも効果的なアプローチであることが分かっています。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:49:00 GMT)
One-Shot Learning as Instruction Data Prospector for Large Language Models [108.8] textscNuggetsはワンショット学習を使用して、広範なデータセットから高品質な命令データを選択する。
我々は,textscNuggets がキュレートした例の上位1%による命令チューニングが,データセット全体を用いた従来の手法よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:46:16 GMT)
TextBind: Multi-turn Interleaved Multimodal Instruction-following in the Wild [102.9] マルチターンインターリーブ型インストラクションフォロー機能を備えた,より大規模な言語モデルを実現するための,ほとんどアノテーションのないフレームワークであるTextBindを紹介する。
提案手法では,画像キャプチャペアのみが必要であり,言語モデルからマルチターンマルチモーダル・インストラクション・レスポンス・会話を生成する。
そこで我々は,画像エンコーダとデコーダモデルをシームレスに統合する言語モデル中心アーキテクチャであるMIMを考案した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:39:40 GMT)
Reflection-Reinforced Self-Training for Language Agents [101.2] 自己学習は、人間やより強力なモデルに頼ることなく、言語エージェントのパフォーマンスを向上させることができる。
低品質試料の精製に反射モデルを利用する反射強化自己訓練(Re-ReST)を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:21:38 GMT)
Scalable Diffusion for Materials Generation [99.7] 我々は任意の結晶構造(ユニマット)を表現できる統一された結晶表現を開発する。
UniMatはより大型で複雑な化学系から高忠実度結晶構造を生成することができる。
材料の生成モデルを評価するための追加指標を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:07:00 GMT)
Balanced Data Sampling for Language Model Training with Clustering [96.5] 本稿では,学習データのテキスト分布のバランスをとるためにClusterClip Smplingを提案する。
大規模な実験は、ClusterClip Smplingの有効性を検証する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:48:34 GMT)
Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex Scenarios [93.7] UltraToolは、ツール利用におけるLarge Language Modelsの能力を改善し評価するために設計された、新しいベンチマークである。
現実の複雑さを強調し、効果的な問題解決のために正確で多段階の計画を必要とする。
UltraToolの重要な特徴は、ツールの使用前に発生する自然言語による計画の独立した評価である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:28:29 GMT)
A Space Group Symmetry Informed Network for O(3) Equivariant Crystal Tensor Prediction [89.4] 結晶材料の一般的な引張特性の予測について考察する。
本稿では,必要な対称性を満たすために慎重に設計された汎用材料ネットワーク(GMTNet)を提案する。
実験の結果, GMTNetは様々な順序の結晶テンソル上で有望な性能を達成できた。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:26:16 GMT)
Adaptive Hierarchical Certification for Segmentation using Randomized Smoothing [87.5] 機械学習の認証は、特定の条件下では、敵対的なサンプルが特定の範囲内でモデルを回避できないことを証明している。
セグメンテーションの一般的な認証方法は、平らな粒度のクラスを使い、モデルの不確実性による高い断続率をもたらす。
本稿では,複数レベルの階層内で画素を認証し,不安定なコンポーネントに対して粗いレベルに適応的に認証を緩和する,新しい,より実用的な設定を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:02:26 GMT)
Spurious Feature Eraser: Stabilizing Test-Time Adaptation for Vision-Language Foundation Model [87.0] 視覚言語基礎モデルは、画像とテキストのペアデータに拡張性があるため、多数の下流タスクで顕著な成功を収めている。
しかし、これらのモデルは、決定ショートカットの結果、きめ細かな画像分類などの下流タスクに適用した場合に重大な制限を呈する」。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:09:39 GMT)
MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies [85.6] SLM(Small Language Models)は、LLM(Large Language Models)に代わるリソース効率の高いモデルである。
我々はMiniCPM、特に1.2Bと2.4Bの非埋め込みパラメータの変種を紹介する。
また、MiniCPM-DPO、MiniCPM-MoE、MiniCPM-128Kを含むMiniCPMファミリーについても紹介する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:54:38 GMT)
ZeroSmooth: Training-free Diffuser Adaptation for High Frame Rate Video Generation [81.9] 本稿では,プラグイン・アンド・プレイ方式で生成ビデオモデルを作成するためのトレーニング不要なビデオ手法を提案する。
我々は,映像モデルを隠れ状態補正モジュールを備えた自己カスケード映像拡散モデルに変換する。
私たちのトレーニングフリーの手法は、巨大な計算リソースと大規模データセットによってサポートされているトレーニングモデルにさえ匹敵するものです。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 00:31:13 GMT)
PhyRecon: Physically Plausible Neural Scene Reconstruction [81.7] 我々は、微分可能レンダリングと微分可能物理シミュレーションの両方を活用する最初のアプローチであるPhyReconを導入し、暗黙的な表面表現を学習する。
PhyReconは、ニューラルな暗黙の表現に基づいて構築された、新しい微分可能な粒子ベースの物理シミュレータを備えている。
また,物理シミュレータの安定性も向上し,全データセットに対して少なくとも40%の改善が得られた。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:07:14 GMT)
DiffUHaul: A Training-Free Method for Object Dragging in Images [78.9] DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。
まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。
初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:59:53 GMT)
PRICE: A Pretrained Model for Cross-Database Cardinality Estimation [78.3] クエリ実行計画の最適化には,カーディナリティ推定(CardEst)が不可欠である。
近年のMLベースのCardEst法は, 製造コストが高いため, 高い精度で展開が困難である。
PRetrained MultI-table CardEstモデルであるPRICEを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:21:53 GMT)
DreamPhysics: Learning Physical Properties of Dynamic 3D Gaussians with Video Diffusion Priors [77.3] 本稿では,3次元ガウス散乱の物理特性をビデオ拡散先行値で推定するDreamPhysicsを提案する。
本手法は,適切な物理パラメータを持つ物質点法シミュレータに基づいて,現実的な動きを持つ4次元コンテンツを生成する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:05:25 GMT)
Unveil the Duality of Retrieval-Augmented Generation: Theoretical Analysis and Practical Solution [76.8] Retrieval-augmented Generation (RAG)は、検索したテキストを利用して大規模言語モデル(LLM)を強化する。
本稿では,RAGの利益と有害性について理論的に説明するための第一歩を踏み出した。
提案手法は,トークンレベルでのLLMとRAGの協調生成を実現するための実用的手法であるX-RAGを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:56:14 GMT)
VIP: Versatile Image Outpainting Empowered by Multimodal Large Language Model [76.0] 本研究は,ユーザの要求に応じて結果のカスタマイズが可能な,新たな画像出力フレームワークを提案する。
画像のマスキング部分とマスキング部分のテキスト記述を自動的に抽出し整理するマルチモーダル大言語モデル(MLLM)を利用する。
さらに、画像の特定の空間領域とテキストプロンプトの対応する部分との相互作用を強化するために、特別にCentral-Total-Surrounding (CTS) と呼ばれるCentral-Attentionモジュールが精巧に設計されている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:14:19 GMT)
Neural network learns low-dimensional polynomials with SGD near the information-theoretic limit [75.5] 単一インデックス対象関数 $f_*(boldsymbolx) = textstylesigma_*left(langleboldsymbolx,boldsymbolthetarangleright)$ の等方的ガウスデータの下で勾配降下学習の問題を考察する。
SGDアルゴリズムで最適化された2層ニューラルネットワークは、サンプル付き任意のリンク関数の$f_*$を学習し、実行時の複雑さは$n asymp T asymp C(q) cdot dであることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:56:58 GMT)
Continual Learning: Forget-free Winning Subnetworks for Video Representations [75.4] タスク性能の面でのサブネットワーク(WSN)の勝利は、様々な連続学習タスクに対して考慮される。
タスクインクリメンタルラーニング(TIL)とタスク非依存インクリメンタルラーニング(TaIL)のシナリオにおいて,既存のネットワークからの重み付けを活用して,効率的な学習を実現する。
ビデオインクリメンタルラーニング(VIL)におけるWSN内のフーリエサブニューラル演算子(FSO)の利用
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:51:38 GMT)
Towards Flexible Interactive Reflection Removal with Human Guidance [75.4] 単一の画像反射除去は本質的に不明瞭であり、分離を必要とする反射成分と透過成分の両方が自然な画像統計に従う可能性がある。
既存の手法では、様々な種類の低レベルおよび物理ベースのキューを反射信号の源として利用することでこの問題に対処しようとする。
本稿では,様々な形態のスパース・ヒューマン・ガイダンスを活用するフレキシブル・インタラクティブ・リフレクション・リフレクション・リフレクション・リフレクション・リジェクション・リジェクション・アプローチを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:34:37 GMT)
Position: Considerations for Differentially Private Learning with Large-Scale Public Pretraining [75.3] 大規模なWebスクレイプデータセットの使用は、差分プライバシ保存と見なすべきかどうかを疑問視する。
Webデータ上で事前訓練されたこれらのモデルを“プライベート”として公開することで、市民のプライバシーに対する信頼を意味のあるプライバシの定義として損なう可能性があることを警告します。
公的な事前学習がより普及し、強力になるにつれて、私的な学習分野への道のりを議論することで、我々は結論づける。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:03:49 GMT)
RL in Latent MDPs is Tractable: Online Guarantees via Off-Policy Evaluation [73.2] 遅延マルコフ決定過程 (LMDP) について検討し, 対話開始時に潜時変数が選択され, エージェントに開示されない。
付加的な構造仮定を伴わずにLMDPのサンプル効率アルゴリズムを初めて導入する。
楽観的な探索アルゴリズムのほぼ最適保証を導出するためにどのように使用できるかを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:51:27 GMT)
Representation Surgery: Theory and Practice of Affine Steering [72.6] 言語モデルは、しばしば好ましくない振る舞いを示す。
モデルが望ましくない振る舞いを示すのを防ぐための自然な(そして一般的な)アプローチの1つは、モデルの表現を操ることである。
本稿では, ステアリング機能の形式的および経験的特性について検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:24:22 GMT)
Reasons to Reject? Aligning Language Models with Judgments [72.4] 言語フィードバックを用いた大規模言語モデル(LLM)の整合性について検討する。
本稿では,不適切なコンテンツ検出と判断に基づく修正が可能なコントラスト型異種訓練(Contrastive Unlikelihood Training, CUT)を提案する。
以上の結果から,CUTは175BのDaVinci003を破り,AlpacaEvalの50.84ポイントを達成できた。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:24:38 GMT)
Learning Partially Aligned Item Representation for Cross-Domain Sequential Recommendation [72.0] クロスドメインシーケンシャルレコメンデーションは、ドメイン間でのユーザのシーケンシャルな好みを明らかにすることを目的としている。
ミスアライメントアイテム表現は、サブ最適シーケンシャルモデリングとユーザ表現アライメントにつながる可能性がある。
textbfCross- domain item representation textbfAlignment for textbfCross-textbfDomain textbfSequential textbfRecommendationを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:05:57 GMT)
Conservative Prediction via Data-Driven Confidence Minimization [70.9] 機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。
本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:30:28 GMT)
E$^{2}$GAN: Efficient Training of Efficient GANs for Image-to-Image Translation [69.7] 拡散モデルからGANを蒸留するプロセスは、より効率的にできるのか?
まず、一般化された特徴を持つベースGANモデルを構築し、微調整により異なる概念に適応し、スクラッチからトレーニングの必要性を排除した。
第2に,ベースモデル全体の微調整を行うのではなく,低ランク適応(LoRA)を簡易かつ効果的なランク探索プロセスで行う。
第3に、微調整に必要な最小限のデータ量を調査し、トレーニング時間を短縮する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:09:38 GMT)
Provable Multi-Task Representation Learning by Two-Layer ReLU Neural Networks [69.4] 本稿では,複数タスクにおける非線形モデルを用いたトレーニング中に特徴学習が発生することを示す最初の結果を示す。
私たちのキーとなる洞察は、マルチタスク事前トレーニングは、通常タスク間で同じラベルを持つポイントを整列する表現を好む擬似コントラスト的損失を誘導するということです。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:24:24 GMT)
Cross-Dimensional Medical Self-Supervised Representation Learning Based on a Pseudo-3D Transformation [68.6] 擬似3D変換(CDSSL-P3D)に基づく新しい三次元SSLフレームワークを提案する。
具体的には、2D画像を3Dデータに整合したフォーマットに変換するim2colアルゴリズムに基づく画像変換を提案する。
この変換は2次元および3次元データのシームレスな統合を可能にし、3次元医用画像解析のための相互教師あり学習を容易にする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:57:25 GMT)
SciMON: Scientific Inspiration Machines Optimized for Novelty [68.5] 文献に基づく新たな科学的方向を生成するために,ニューラルランゲージモデルを探索し,拡張する。
モデルが入力背景コンテキストとして使用される新しい設定で、劇的な出発をとっています。
本稿では,過去の科学的論文から「吸入」を抽出するモデリングフレームワークであるSciMONを紹介する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:15:28 GMT)
SpatialRGPT: Grounded Spatial Reasoning in Vision Language Model [68.1] VLMの空間知覚と推論能力を高めるために空間領域GPT(SpatialRGPT)を導入する。
推測中、ユーザが指定した領域の提案が提供されると、SpatialRGPTは相対的な方向と距離を正確に知覚できる。
本研究では,空間的推論タスクにおける局所的プロンプトと非局所的プロンプトの双方において,空間的RGPTにより性能が著しく向上することを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:59:06 GMT)
StrucTexTv3: An Efficient Vision-Language Model for Text-rich Image Perception, Comprehension, and Beyond [68.0] 我々は、テキストリッチな画像のための様々なインテリジェントなタスクに取り組むために、効率的な視覚言語モデルStrucTexTv3を開発した。
学習を通してStrucTexTv3の知覚と理解能力を高める。
提案手法は,テキストに富んだ画像認識タスクでSOTAを達成し,理解タスクの性能を大幅に向上させた。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:43:16 GMT)
KTO: Model Alignment as Prospect Theoretic Optimization [67.4] Kahneman & Tversky の $textitprospect theory$ は、人間が偏見はあるが明確に定義された方法でランダム変数を知覚することを示している。
人間のフィードバックとLLMを協調させる目的には,これらのバイアスが暗黙的に組み込まれていることを示す。
そこで本稿では,嗜好のログ類似度を最大化する代わりに,世代別利用率を直接最大化するHALOを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:36:09 GMT)
Augmented Commonsense Knowledge for Remote Object Grounding [67.3] エージェントナビゲーションを改善するための時間的知識グラフとして,コモンセンス情報を活用するための拡張コモンセンス知識モデル(ACK)を提案する。
ACKは知識グラフ対応のクロスモーダルとコンセプトアグリゲーションモジュールで構成され、視覚的表現と視覚的テキストデータアライメントを強化する。
我々は、より正確な局所的な行動予測につながるコモンセンスに基づく意思決定プロセスのための新しいパイプラインを追加します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:12:33 GMT)
LexMatcher: Dictionary-centric Data Collection for LLM-based Machine Translation [67.2] 本稿では、バイリンガル辞書を利用してデータセットを生成するデータ収集手法であるLexMatcherを提案する。
我々の手法は、WMT2022テストセットの確立されたベースラインよりも優れています。
これらの結果は、LxMatcherがLLMベースの機械翻訳の強化に有効であることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:30:36 GMT)
SAM as the Guide: Mastering Pseudo-Label Refinement in Semi-Supervised Referring Expression Segmentation [66.9] SemiRESは、RESを実行するためにラベル付きデータとラベルなしデータの組み合わせを効果的に活用する半教師付きフレームワークである。
SemiRESはSegment Anything Model (SAM) を組み込んでいる。
利用可能な候補と正確なマスクが一致しない場合、Pixel-Wise Adjustment(PWA)戦略を開発する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:42:30 GMT)
Boosting Continual Learning of Vision-Language Models via Mixture-of-Experts Adapters [65.2] 本稿では,視覚言語モデルを用いた漸進的学習における長期的忘れを緩和するパラメータ効率の連続学習フレームワークを提案する。
提案手法では,Mixture-of-Experts (MoE)アダプタの統合により,事前学習したCLIPモデルの動的拡張を行う。
視覚言語モデルのゼロショット認識能力を維持するために,分布判別オートセレクタを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:45:33 GMT)
Federated Learning under Partially Class-Disjoint Data via Manifold Reshaping [64.6] 我々はFedMRと呼ばれる多様体再構成手法を提案し、局所訓練の特徴空間を校正する。
我々は、FedMRがはるかに高い精度と通信効率を達成することを示すために、さまざまなデータセットに関する広範な実験を行います。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:16:55 GMT)
How to Understand Whole Software Repository? [64.2] リポジトリ全体に対する優れた理解は、自動ソフトウェアエンジニアリング(ASE)への重要な道になるでしょう。
本研究では,リポジトリ全体を包括的に理解するためのエージェントによるRepoUnderstanderという新しい手法を開発した。
リポジトリレベルの知識をより活用するために、エージェントをまとめ、分析し、計画する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:20:06 GMT)
Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.6] 建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:23:05 GMT)
Long and Short Guidance in Score identity Distillation for One-Step Text-to-Image Generation [62.3] 我々は,学習データを用いずに,事前学習した安定拡散モデルを効率よく抽出するための長小分類器フリーガイダンス(LSG)を開発した。
我々は、そのワンステップジェネレータで合成された偽画像のみを訓練し、最先端のFID性能を実現する。
具体的には, 安定拡散 1.5 のデータフリー蒸留は COCO-2014 検証セットで8.15 の低い FID を達成する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:44:11 GMT)
Edit As You Wish: Video Caption Editing with Multi-grained User Control [61.8] マルチグラデーションなユーザリクエストでガイドされた既存のビデオ記述を自動的に修正する新しい textbfVideo textbfCaption textbfEditing textbf(VCE) タスクを提案する。
人間の書き直し習慣にインスパイアされたユーザコマンドは、粗い粒度からきめ細かな粒度まで多様なユーザニーズをカバーするために、重要な3重テキスト操作、位置、属性として設計される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:47:36 GMT)
SLANT: Spurious Logo ANalysis Toolkit [61.6] SLANT: Spurious Logo Analysis Toolkitを開発した。
というロゴをマイニングするためのセミオートマチックなメカニズムが組み込まれている。
我々は、VLモデルが負の人形容詞と相関する様々な無害なロゴを発見した。
攻撃者は有害なコンテンツに急激なロゴを配置することができ、モデルがそれを無害と誤分類する原因となった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:41:31 GMT)
LLMs Beyond English: Scaling the Multilingual Capability of LLMs with Cross-Lingual Feedback [61.2] 我々はLLaMAとBLOOMの多言語機能を100言語に拡張するxLLMs-100を紹介する。
5つの多言語ベンチマークでxLLMs-100の多言語理解と生成能力を評価する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:25:12 GMT)
LoFiT: Localized Fine-tuning on LLM Representations [61.0] LoFiT(Localized Fine-Tuning on LLM Representations)というフレームワークを導入する。
LoFiTは、特定のタスクを学習する上で最も重要なアテンションヘッドのサブセットを特定し、それからオフセットベクトルをトレーニングして、選択したヘッドでモデルの隠れ表現に追加する。
真理性や推論タスクにおいて,LoFiTの介入ベクトルは推論時間干渉などの表現介入手法のベクトルよりもLLM適応に有効であることがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:45:41 GMT)
Towards Calibrated Deep Clustering Network [60.7] ディープクラスタリングでは、特定のクラスタに属するサンプルに対する推定信頼度はその実際の予測精度を大きく上回る。
推定された信頼度と実際の精度を効果的にキャリブレーションできる新しいデュアルヘッド(キャリブレーションヘッドとクラスタリングヘッド)深層クラスタリングモデルを提案する。
大規模実験により, 提案手法は, 最先端の深層クラスタリング手法を10倍に越えるだけでなく, クラスタリング精度も大幅に向上した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:04:42 GMT)
Can LLMs Separate Instructions From Data? And What Do We Even Mean By That? [60.5] 大規模言語モデル(LLM)は、多くの実用的なアプリケーションにおいて印象的な結果を示すが、基本的な安全性機能は欠如している。
これにより、間接的なプロンプトインジェクションのような操作に脆弱になり、一般に安全クリティカルなタスクには適さない。
モデル出力から計算可能な命令データ分離の形式的尺度と経験的変量を導入する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:04:50 GMT)
Combinatorial Multivariant Multi-Armed Bandits with Applications to Episodic Reinforcement Learning and Beyond [58.4] CMAB(Multi-armed bandits)の多変量および確率的トリガーアーム(CMAB-MT)を用いた新しい枠組みを導入する。
CMAB-MTは既存のCMABと比べ、モデリング能力を高めるだけでなく、多変量確率変数の異なる統計特性を活用することで結果を改善することができる。
本フレームワークは, エピソード強化学習(RL)や商品分布の確率的最大カバレッジなど, 応用として多くの重要な問題を含むことができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:48:53 GMT)
FNP: Fourier Neural Processes for Arbitrary-Resolution Data Assimilation [58.1] 本稿では, テクティット・テキストbfFourier Neural Processs (FNP) を用いて, テクティット・arbitrary- resolution データ同化法を提案する。
固定解像度でトレーニングしたFNPは, 微調整を伴わずに, 分布外分解能と観測情報再構成タスクとの同化を直接処理できる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:24:24 GMT)
MixEval: Deriving Wisdom of the Crowd from LLM Benchmark Mixtures [57.9] 市販のベンチマークを戦略的に混合することにより,効率的な金標準評価を実現するための新しいパラダイムであるMixEvalを提案する。
提案手法は,(1)包括的でよく分散された実世界のユーザクエリと(2)Webから抽出したクエリと,既存のベンチマークからの類似したクエリとをマッチングすることによって,効率よく,かつ,かなり改善された基盤トラスベースのベンチマークを橋渡しする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:47:05 GMT)
Model-Based RL for Mean-Field Games is not Statistically Harder than Single-Agent RL [57.7] モデルに基づく関数近似を用いた平均フィールドゲーム(MFG)における強化学習のサンプル複雑性について検討した。
本稿では、モデルクラスの複雑性を特徴付けるためのより効果的な概念である部分モデルベースエルダー次元(P-MBED)を紹介する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:29:09 GMT)
Skywork-MoE: A Deep Dive into Training Techniques for Mixture-of-Experts Language Models [57.6] 提案手法は,146億のパラメータと16名のエキスパートを伴い,高性能な多言語モデル(LLM)であるSkywork-MoEの開発において実現された訓練手法を紹介する。
これは、Skywork-13Bモデルの既存の密度の高いチェックポイントに基づいています。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:58:41 GMT)
Benchmarking and Improving Compositional Generalization of Multi-aspect Controllable Text Generation [56.9] CompMCTGは多様なマルチアスペクトラベル付きデータセットを含むベンチマークである。
本稿ではメタラーニングを取り入れたトレーニングフレームワークであるMeta-MCTGを紹介する。
94.4%の症例において,Meta-MCTGの有効性を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:08:20 GMT)
ControlSpeech: Towards Simultaneous Zero-shot Speaker Cloning and Zero-shot Language Style Control With Decoupled Codec [56.9] 話者の声を完全に模倣し,任意の発話スタイルの制御と調整を可能にするTTSシステムであるControlSpeechを提案する。
以前のゼロショットTSモデルとコントロール可能なTSモデルは、さらなる制御と調整機能なしでスピーカーの声を模倣することしかできず、スピーカー固有の音声生成とは無関係であった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:15:16 GMT)
Diffusion Boosted Trees [56.5] 拡散ブーストツリー(DBT)は、決定木によってパラメータ化される新しい拡散生成モデルであると見なすことができる。
DBT は弱を条件分布の強い勾配に結合し、それらの密度形式について明示的な仮定をしない。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:11:38 GMT)
Learning-to-Cache: Accelerating Diffusion Transformer via Layer Caching [56.3] 拡散変圧器内の多数の層をキャッシュ機構で計算することで、モデルパラメータを更新しなくても容易に除去できる。
本稿では,拡散変圧器の動的手法でキャッシングを学習するL2C(Learningto-Cache)を提案する。
実験の結果,L2C は DDIM や DPM-r など,キャッシュベースの従来の手法と同等の推論速度で性能を向上することがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:49:57 GMT)
Free Fermion Distributions Are Hard to Learn [55.2] 我々は、粒子数非保存の場合において、このタスクの硬さを確立する。
期待値から学習する一般的なタスクに対して,情報理論的難易度結果を与える。
特に,確率密度関数の学習を想定した計算硬度結果を与える。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:28:19 GMT)
Targeted Reduction of Causal Models [55.1] 因果表現学習(Causal Representation Learning)は、シミュレーションで解釈可能な因果パターンを明らかにするための有望な道を提供する。
本稿では、複雑な相互作用可能なモデルを因果因子の簡潔な集合に凝縮する方法であるTCR(Targeted Causal Reduction)を紹介する。
複雑なモデルから解釈可能な高レベルな説明を生成する能力は、玩具や機械システムで実証されている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:45:44 GMT)
The Wolf Within: Covert Injection of Malice into MLLM Societies via an MLLM Operative [55.1] MLLM(Multimodal Large Language Models)は、AGI(Artificial General Intelligence)の新たな境界を常に定義している。
本稿では,MLLM社会において,悪意のあるコンテンツの間接的伝播という新たな脆弱性について検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:29:07 GMT)
REST: Efficient and Accelerated EEG Seizure Analysis through Residual State Updates [55.0] 本稿では,リアルタイム脳波信号解析のための新しいグラフベース残状態更新機構(REST)を提案する。
グラフニューラルネットワークとリカレント構造の組み合わせを活用することで、RESTは、非ユークリッド幾何学とEEGデータ内の時間的依存関係の両方を効率的にキャプチャする。
本モデルは,発作検出と分類作業において高い精度を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:30:19 GMT)
Towards Scalable Automated Alignment of LLMs: A Survey [54.8] 本稿では,最近登場した自動アライメントの手法を体系的にレビューする。
既存の自動アライメント手法をアライメント信号のソースに基づいて4つの主要なカテゴリに分類する。
本稿では,アライメントの基本的役割から,自動アライメント技術の実現を可能にする重要な要因について論じる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:10:26 GMT)
DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [54.1] 拡散先行型IQA(DP-IQA)と呼ばれる新しいIQA法を提案する。
トレーニング済みの安定拡散をバックボーンとして使用し、復調するU-Netから多レベル特徴を抽出し、それらをデコードして画質スコアを推定する。
上記のモデルの知識をCNNベースの学生モデルに抽出し、適用性を高めるためにパラメータを大幅に削減する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:32:40 GMT)
KIEval: A Knowledge-grounded Interactive Evaluation Framework for Large Language Models [53.8] KIEvalは、大規模言語モデルのための知識ベースでインタラクティブな評価フレームワークである。
動的汚染耐性評価を達成するために、LSMを動力とする"インターアクター"の役割を初めて取り入れている。
5つのデータセットにわたる7つのLLMの大規模な実験により、KIEvalの有効性と一般化が検証された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:02:39 GMT)
D-CPT Law: Domain-specific Continual Pre-Training Scaling Law for Large Language Models [53.6] 本稿では,ドメイン固有の連続事前学習法(D-CPT法)のスケーリング法を提案し,最適混合比と許容するトレーニングコストを決定する。
具体的には、D-CPT法則を適合させることで、任意の混合比の一般および下流性能を容易に予測できる。
また、クロスドメイン設定に関する標準D-CPT法を拡張し、クロスドメインD-CPT法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:40:31 GMT)
Repeat After Me: Transformers are Better than State Space Models at Copying [53.5] 一般化された状態空間モデルは、推論時間効率の観点からは有望であるが、入力コンテキストからのコピーを必要とするタスクのトランスフォーマーモデルと比較して限定的であることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:22:15 GMT)
Decomposing and Interpreting Image Representations via Text in ViTs Beyond CLIP [53.2] 任意の視覚変換器(ViT)における様々なコンポーネントの役割を識別するフレームワークを提案する。
具体的には、最終的な表現の分解を、異なるモデルコンポーネントからのコントリビューションに自動化する。
また,特定の特徴について重要な要素をランク付けするための新しいスコアリング機能も導入する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:58:43 GMT)
UniAnimate: Taming Unified Video Diffusion Models for Consistent Human Image Animation [53.2] We present a UniAnimate framework to enable efficient and long-term human video generation。
我々は、姿勢案内やノイズビデオとともに参照画像を共通の特徴空間にマッピングする。
また、ランダムノイズ入力と第1フレーム条件入力をサポートする統一ノイズ入力を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:51:10 GMT)
Policy Dispersion in Non-Markovian Environment [53.1] 本稿では,非マルコフ環境下での国家行動ペアの歴史から,多様な政策の学習を試みる。
まず、ポリシー埋め込みを学習するために、トランスフォーマーベースの手法を採用する。
次に,政策埋め込みを積み重ねて分散行列を構築し,多様な政策の集合を誘導する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:18:44 GMT)
SPAFormer: Sequential 3D Part Assembly with Transformers [53.0] SPAFormerは,3次元部品組み立て作業における爆発的課題を克服する革新的なモデルである。
アセンブリシーケンスからの制約を活用することでこの問題に対処し、ソリューション空間の複雑さを効果的に軽減する。
さらに、部品の属性とそのシーケンス情報を利用する知識強化戦略を通じて組み立てを強化する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:37:23 GMT)
Video-LaVIT: Unified Video-Language Pre-training with Decoupled Visual-Motional Tokenization [52.6] ダイナミックスビデオのモデリングのため、ビデオ事前トレーニングは難しい。
本稿では,ビデオ事前学習におけるこのような制限を,効率的なビデオ分解によって解決する。
筆者らのフレームワークは,13のマルチモーダルベンチマークにおいて,画像と映像のコンテントの理解と生成が可能であることを実証した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:09:09 GMT)
Mobile-Agent-v2: Mobile Device Operation Assistant with Effective Navigation via Multi-Agent Collaboration [52.3] モバイルデバイス操作支援のためのマルチエージェントアーキテクチャであるMobile-Agent-v2を提案する。
アーキテクチャは、計画エージェント、決定エージェント、反射エージェントの3つのエージェントから構成される。
単一エージェントアーキテクチャと比較して,Mobile-Agent-v2ではタスク完了率が30%以上向上していることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:50:00 GMT)
Improving Segment Anything on the Fly: Auxiliary Online Learning and Adaptive Fusion for Medical Image Segmentation [52.2] 医療画像の文脈では、SAMがそのセグメンテーション予測を生成した後、人間の専門家が特定のテストサンプルのセグメンテーションを修正することは珍しくない。
我々は、オンライン機械学習の利点を活用して、テスト期間中にSegment Anything(SA)を強化する新しいアプローチを導入する。
医用画像におけるSAのセグメンテーション品質を改善することを目的として,オンライン学習のための修正アノテーションを用いた。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:16:25 GMT)
Bayesian learning of Causal Structure and Mechanisms with GFlowNets and Variational Bayes [51.8] 本研究では,変分ベイズ-DAG-GFlowNetを用いて因果モデルの構造と機構を学習する手法を提案する。
我々は,GFlowNetを用いたベイズ因果構造学習の手法を拡張し,線形ガウスモデルのパラメータを学習する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:09:12 GMT)
Cohort Squeeze: Beyond a Single Communication Round per Cohort in Cross-Device Federated Learning [51.6] 各コホートから「より多くのジュースを抽出できるかどうか」を単一の通信ラウンドでできることよりも検討する。
本手法は,デバイス間通信におけるFLモデルのトレーニングに必要な通信コストを最大74%削減する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:48:49 GMT)
TabPedia: Towards Comprehensive Visual Table Understanding with Concept Synergy [51.2] 本稿では,概念相乗効果機構を備えた新しい大型視触覚モデルTabPediaを提案する。
この統合されたフレームワークにより、TabPediaはテーブル検出、テーブル構造認識、テーブルクエリ、テーブル質問応答などのVTUタスクをシームレスに統合できる。
我々は、約9000のQAペアを備えた新しい総合的なテーブルVQAベンチマークComTQAを構築した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:54:05 GMT)
EMOE: Expansive Matching of Experts for Robust Uncertainty Based Rejection [51.2] Expansive Matching of Experts (EMOE) は, アウト・オブ・ディストリビューションポイントによる予測と不確実性に基づく拒絶を改善するために, サポート拡張, 補間的擬似ラベルを用いた新しい手法である。
本稿では,潜在空間におけるOODインスタンスを生成する拡張データ拡張手法と,擬似ラベル処理のための拡張拡張点をフィルタリングするための実証実験に基づくアプローチを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:37:45 GMT)
Optimizing the Optimal Weighted Average: Efficient Distributed Sparse Classification [50.4] ACOWAは、小さなランタイムの増加とともに、顕著に優れた近似品質を達成するための追加の通信を可能にする。
その結果、ACOWAは経験的リスク最小化に忠実で、他の分散アルゴリズムよりもかなり高い精度で解が得られることがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:43:06 GMT)
Understanding the differences in Foundation Models: Attention, State Space Models, and Recurrent Neural Networks [50.3] 本稿では,これらすべてのアーキテクチャの共通表現に関する原則的な調査を可能にする動的システムフレームワーク(DSF)について紹介する。
ソフトマックスアテンションと他のモデルクラスとの原理的比較を行い、ソフトマックスアテンションを近似できる理論条件について議論する。
このことは、DSFが将来のより効率的でスケーラブルな基盤モデルの体系的な開発を導く可能性を示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:18:33 GMT)
Contrastive Preference Optimization: Pushing the Boundaries of LLM Performance in Machine Translation [50.0] 我々は22Kパラレル文と12Mパラメータしか持たないALMAモデルを訓練する。
ALMA-Rと呼ばれる結果のモデルは、WMTコンテストの勝者とGPT-4のパフォーマンスと一致または上回ることができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:28:06 GMT)
Decoupling of External and Internal Dynamics in Driven Two-level Systems [50.0] レーザー駆動の2レベル系を、各状態の外部自由度にのみ作用する方程式の集合に分解する方法を示す。
我々は、時間依存減衰を持つ古典振動子に訴えることにより、この問題の解法を特徴づける方法を提供する。
運動場位相のチャープは、デチューニング演算子の力学のエレンフェスト/平均値部分を補償する手段として自然に現れることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:42:28 GMT)
DITTO: Diffusion Inference-Time T-Optimization for Music Generation [49.9] Diffusion Inference-Time T-Optimization (DITTO) は、事前訓練されたテキストから音楽への拡散モデルを推論時に制御するためのフレームワークである。
我々は、インペイント、アウトペイント、ループ化、強度、メロディ、音楽構造制御など、驚くほど幅広い音楽生成応用を実証する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:37:53 GMT)
Correcting Underrepresentation and Intersectional Bias for Classification [49.2] 我々は、表現不足のバイアスによって破損したデータから学習する問題を考察する。
偏りのないデータの少ない場合、グループワイドのドロップアウト率を効率的に推定できることが示される。
本アルゴリズムは,有限VC次元のモデルクラスに対して,効率的な学習を可能にする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:57:56 GMT)
Sparser, Better, Deeper, Stronger: Improving Sparse Training with Exact Orthogonal Initialization [49.1] 静的スパーストレーニングは、スパースモデルをスクラッチからトレーニングすることを目的としており、近年顕著な成果を上げている。
ランダムなアジェンダ回転に基づく新しいスパースな直交初期化スキームであるExact Orthogonal Initialization (EOI)を提案する。
本手法は,残差接続や正規化を伴わずに,1000層ネットワークとCNNネットワークを疎結合に訓練することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:44:47 GMT)
EgoNCE++: Do Egocentric Video-Language Models Really Understand Hand-Object Interactions? [48.7] 我々は、EgoNCE++という新しい非対称なコントラスト対象をEgoHOIに導入する。
実験の結果,EgoNCE++はオープン語彙HOI認識,マルチインスタンス検索,アクション認識タスクを著しく向上させることがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:29:18 GMT)
Conditional Gumbel-Softmax for constrained feature selection with application to node selection in wireless sensor networks [48.5] 本研究では,与えられたタスクに対して最適なサブセットをエンドツーエンドに学習する手法として,Conditional Gumbel-Softmaxを導入する。
本稿では,無線センサネットワークを構成するタスク最適ノードの選択に,このアプローチをどのように利用できるかを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:55:56 GMT)
Text-guided Controllable Mesh Refinement for Interactive 3D Modeling [48.2] テキストプロンプトによって案内される入力粗い3Dメッシュに幾何学的詳細を加える新しい手法を提案する。
まず、入力粗い幾何学と入力テキストプロンプトに基づいて、単一のビューRGB画像を生成する。
第2に、新しいマルチビュー正規生成アーキテクチャを用いて、正常画像の6つの異なるビューを共同で生成する。
第3に、すべてのビューに対してメッシュを最適化し、出力として微細で詳細な幾何学を生成する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:59:43 GMT)
CoMat: Aligning Text-to-Image Diffusion Model with Image-to-Text Concept Matching [48.0] 本稿では,画像からテキストまでの概念マッチング機構を備えた,エンドツーエンド拡散モデルの微調整戦略であるCoMatを提案する。
画像キャプションモデルを利用して画像とテキストのアライメントを測定し、拡散モデルを導いて無視トークンを再検討する。
画像や人間の嗜好データがない場合は、20KテキストプロンプトだけでSDXLを微調整し、CoMat-SDXLを得る。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:02:34 GMT)
CF-OPT: Counterfactual Explanations for Structured Prediction [47.4] ディープニューラルネットワークの最適化レイヤは構造化学習で人気を博し、さまざまなアプリケーションにおける最先端技術の改善に寄与している。
しかし、これらのパイプラインは2つの不透明な層(ディープニューラルネットワークのような非常に非線形な予測モデル)と、通常複雑なブラックボックス解決器である最適化層)で構成されているため、解釈性に欠ける。
我々のゴールは、このような手法の透明性を向上させることであり、対実的な説明を提供することである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:07:01 GMT)
Large Language Models as Recommender Systems: A Study of Popularity Bias [46.2] 人気アイテムは不釣り合いに推奨され、あまり人気がないが、潜在的に関連のあるアイテムを誇張している。
近年,汎用大規模言語モデルのレコメンデーションシステムへの統合が進んでいる。
本研究は,LLMがレコメンデーションシステムにおける人気バイアスに寄与するか否かを検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:53:37 GMT)
Decompose, Enrich, and Extract! Schema-aware Event Extraction using LLMs [45.8] この作業は、イベント抽出を自動化するために、大規模言語モデルを活用することに焦点を当てている。
タスクをイベント検出とイベント引数抽出に分解することで、幻覚に対処する新しい方法が導入された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:55:10 GMT)
FIFO-Diffusion: Generating Infinite Videos from Text without Training [44.7] テキスト条件付きビデオ生成のための事前学習拡散モデルに基づく新しい推論手法を提案する。
FIFO拡散(FIFO-Diffusion)と呼ばれる我々の手法は、無限に長い動画を、追加の訓練なしで生成することができる。
提案手法が既存のテキスト・ビデオ生成ベースラインに対して有望な結果と有効性を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:04:12 GMT)
Brain Imaging-to-Graph Generation using Adversarial Hierarchical Diffusion Models for MCI Causality Analysis [44.5] 機能的磁気共鳴画像(fMRI)を軽度認知障害解析のための効果的な接続性にマッピングするために,脳画像から画像へのBIGG(Brain Imaging-to-graph generation)フレームワークを提案する。
発電機の階層変換器は、複数のスケールでノイズを推定するように設計されている。
ADNIデータセットの評価は,提案モデルの有効性と有効性を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:35:11 GMT)
DEFT: Efficient Finetuning of Conditional Diffusion Models by Learning the Generalised $h$-transform [44.3] DFT(Doob's h-transform Efficient FineTuning)は、非常に小さなネットワークを微調整して条件付き$h$-transformを高速に学習する条件生成手法である。
画像再構成作業では, 自然画像の知覚品質と医用画像の再現性能を最良に保ちながら, 最大1.6$times$の高速化を実現している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:52:34 GMT)
DFA-RAG: Conversational Semantic Router for Large Language Model with Definite Finite Automaton [44.3] 本稿では,Definite Finite Automaton (DFA-RAG)を用いた検索強化大言語モデルを提案する。
DFA-RAGは,大規模言語モデル(LLM)を用いた対話エージェントの機能向上を目的としたフレームワークである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:40:46 GMT)
Segmentation-Free Guidance for Text-to-Image Diffusion Models [44.2] 安定拡散のようなテキストと画像の拡散モデルのための新しい手法であるセグメンテーションフリーガイダンスを導入する。
追加の計算コストなしでは、拡散モデル自体をインプリッドセグメンテーションネットワークとして使用し、したがってセグメンテーションフリー誘導と呼ばれる。
FID,CLIP,IS,PickScoreを主観的,主観的に評価する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:51:00 GMT)
CLAQ: Pushing the Limits of Low-Bit Post-Training Quantization for LLMs [44.0] カラムレベル適応量量子化(CLAQ)は、LLM(Large Language Models)量子化のための新しく効果的なフレームワークである。
本稿では,LLM量子化のための3種類の適応戦略を導入することで,新しい効果的なCLAQフレームワークを提案する。
LLaMA-1, LLaMA-2, Yi など,様々な主要なオープンソース LLM に関する実験により, 提案手法が様々なビット設定における最先端結果を達成することを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:46:53 GMT)
BELLS: A Framework Towards Future Proof Benchmarks for the Evaluation of LLM Safeguards [43.9] LLMセーフガード評価ベンチマーク(BELLS)について紹介する。
BELLSは構造化されたテストのコレクションで、確立された障害テスト、新しい障害テスト、次世代アーキテクチャテストの3つのカテゴリに分けられる。
私たちは、データセットのインタラクティブな可視化とともに、MACHIAVELLI環境を使用して、最初の次世代アーキテクチャテストを実装し、共有します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:32:30 GMT)
LangBridge: Multilingual Reasoning Without Multilingual Supervision [43.7] LangBridgeは多言語推論タスクに言語モデルを適応するためのゼロショットアプローチである。
LangBridgeは、トレーニング可能な最小限のパラメータを導入して、2つのモデルを接続する。
解析の結果,LangBridgeの有効性は多言語表現の言語に依存しない特徴に起因していることが示唆された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:32:45 GMT)
FacAID: A Transformer Model for Neuro-Symbolic Facade Reconstruction [43.6] 本稿では, 平面的, セグメント化されたファサード構造を手続き的定義に変換するニューロシンボリックトランスフォーマーモデルを提案する。
本手法は、手続き生成の精度とニューロシンボリック学習の適応性を組み合わせることで、ファサード設計の新たな標準を定めている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:56:40 GMT)
Domain Transfer Through Image-to-Image Translation for Uncertainty-Aware Prostate Cancer Classification [42.8] 前立腺MRIの非対位画像翻訳のための新しいアプローチと臨床的に重要なPCaを分類するための不確実性認識トレーニングアプローチを提案する。
提案手法では,無ペアの3.0T多パラメータ前立腺MRIを1.5Tに翻訳し,利用可能なトレーニングデータを増強する。
実験の結果,提案手法は,従来の研究に比べてAUC(Area Under ROC Curve)を20%以上改善することがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:55:06 GMT)
SceneTextGen: Layout-Agnostic Scene Text Image Synthesis with Diffusion Models [42.4] SceneTextGenは、事前に定義されたレイアウトステージの必要性を回避するために特別に設計された、拡散ベースの新しいモデルである。
SceneTextGenの斬新さは、3つの重要なコンポーネントの統合にある: 詳細なタイポグラフィ特性をキャプチャする文字レベルエンコーダと、文字レベルのインスタンスセグメンテーションモデルと、不要なテキスト生成とマイナーな文字不正確な問題に対処するワードレベルスポッティングモデルである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:20:34 GMT)
Rotation and Permutation for Advanced Outlier Management and Efficient Quantization of LLMs [40.5] 大規模言語モデル(LLM)の量子化は、主に外れ値のアクティベーションが原因で大きな課題となる。
回転変換と置換変換を併用した革新的な量子化戦略であるDuQuantを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:27:44 GMT)
Distributed Quantum Computing in Silicon [40.2] アイソトピー強化シリコンにおけるシリコンT中心上での分散量子コンピューティングプロトコルの実証実験について述べる。
モジュール間の絡み合いの分布を実演し、それを消費して伝送ゲートシーケンスを適用する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:02:49 GMT)
Quantum Generative Diffusion Model: A Fully Quantum-Mechanical Model for Generating Quantum State Ensemble [40.1] 古典拡散モデルの単純かつエレガントな量子対向体である量子生成拡散モデル(QGDM)を紹介する。
我々のモデルは勾配勾配勾配を用いた凸距離関数を最適化するため、量子生成逆数ネットワーク(QGAN)よりも収束性能がよい。
特に, 混合状態生成タスクにおいてQGANよりも53.03%高い忠実度が得られる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:37:50 GMT)
Cleaner Pretraining Corpus Curation with Neural Web Scraping [40.0] 本稿では,Webページから一次的かつクリーンなテキストコンテンツを抽出するための,シンプルで高速かつ効果的なNeuScraper(NeuScraper)を提案する。
実験結果から,NeuScraperは20%以上の改善を達成し,ベースラインスクラップラーを上回ることがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:34:05 GMT)
Generative Pre-trained Speech Language Model with Efficient Hierarchical Transformer [39.3] textbfGenerative textbfPre-trained textbfSpeech textbfTransformer (GPST)を紹介する。
GPSTは、音声波形を2種類の独立した音声表現に量子化し、階層的なトランスフォーマーアーキテクチャに統合する。
短時間の3秒のプロンプトによって、GPSTは自然で一貫性のあるパーソナライズされた音声を生成し、コンテキスト内学習能力を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:16:30 GMT)
TATTOOED: A Robust Deep Neural Network Watermarking Scheme based on Spread-Spectrum Channel Coding [39.3] TATTOOEDは、既存の脅威に対して堅牢な新しいDNN透かし技術である。
TATTOOEDはトレーニングパイプラインで簡単に使用でき、モデルパフォーマンスに無視できる影響があることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:59:35 GMT)
Tetrahedron Splatting for 3D Generation [39.2] Tetrahedron Splatting (TeT-Splatting) は最適化時の容易な収束、正確なメッシュ抽出、リアルタイムレンダリングをサポートする。
メッシュ抽出なしで表現をトレーニングできるため、最適化プロセスの収束が容易になります。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:56:36 GMT)
DANCE: Dual-View Distribution Alignment for Dataset Condensation [39.1] 我々は、データセットのコンディエンテーション(DANCE)のためのDMベースの新しいDual-view Distribution AligNmentを提案する。
具体的には、内部クラスの観点から複数の「中間エンコーダ」を構築し、擬似的な長期分布アライメントを行う。
クラス間の観点からは,分布キャリブレーションを行うために専門家モデルを用いる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:22:17 GMT)
Unsupervised Mutual Learning of Dialogue Discourse Parsing and Topic Segmentation [39.0] 修辞構造とトピック構造は、主に別々にモデル化されるか、または以前の作業で他方を補助する。
本稿では,グローバル・ローカル・コネクティビティを活用した2つの構造物の教師なし相互学習フレームワークを提案する。
また、局所コヒーレンス整合性を確保するために、グラフニューラルネットワークモデルを用いて、レトリック構造をトピック構造に組み込む。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:13:10 GMT)
HHMR: Holistic Hand Mesh Recovery by Enhancing the Multimodal Controllability of Graph Diffusion Models [38.9] 本稿では,より包括的手メッシュ回復作業において,制御可能な生成モデルを拡張した。
我々のキーとなる観察は、強力なマルチモーダル制御性を持つ単一の生成モデルにより、様々な種類のハンドメッシュ回復タスクが達成できるということである。
グラフ畳み込みとアテンション機構に基づくオールインワン拡散フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:59:46 GMT)
A Practical Approach to Novel Class Discovery in Tabular Data [38.4] 新規クラスディスカバリー(英: Novel Class Discovery, NCD)は、未知のクラスを正確に分割するために、ラベル付けされた既知のクラスの集合から知識を抽出する問題である。
本研究では、$k$-foldのクロスバリデーションプロセスを適用し、既知のクラスの一部を各フォルダに隠すことで、NCDメソッドのハイパーパラメータを調整することを提案する。
この手法の潜在空間は,新規クラスの数を確実に推定するために有効であることがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:49:54 GMT)
Physics-Informed Neural Networks for Dynamic Process Operations with Limited Physical Knowledge and Data [38.4] 化学工学では、プロセスデータは取得するのにコストがかかり、完全にデータ駆動と純粋にメカニスティックなモデリングアプローチの両方を非現実的にレンダリングする。
微分代数方程式系によって制御される動的過程のモデリングに物理インフォームドニューラルネットワーク(PINN)を用いて検討する。
PINNは、測定されていない状態を妥当な精度で推測でき、純粋にデータ駆動モデルよりも低データシナリオでよりよく一般化できる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:58:17 GMT)
Explore then Determine: A GNN-LLM Synergy Framework for Reasoning over Knowledge Graph [38.3] 本稿では,知識グラフ(KGQA)に関する質問応答について述べる。
グラフニューラルネットワーク(GNN)とLarge Language Modelsを相乗化してKGを推論するExplore-then-Determine(EtD)フレームワークを提案する。
EtDは最先端のパフォーマンスを達成し、忠実な推論結果を生成する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:38:28 GMT)
Prototypical Transformer as Unified Motion Learners [38.3] Prototypeal Transformer(ProtoFormer)は、プロトタイプの観点から様々な動作タスクにアプローチするフレームワークである。
ProtoFormerは、モーションダイナミクスを慎重に検討することで、Transformerとプロトタイプ学習をシームレスに統合する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:41:28 GMT)
Scaling White-Box Transformers for Vision [38.2] CRATEは、圧縮およびスパース表現を学習するために設計されたホワイトボックストランスフォーマーアーキテクチャである。
我々はCRATE-$alpha$を提案し、CRATEアーキテクチャ設計におけるスパースコーディングブロックの戦略的かつ最小限の修正を特徴としている。
CRATE-$alpha$は、より大きなモデルサイズとデータセットで効果的にスケールできることを示します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:36:22 GMT)
Agent Smith: A Single Image Can Jailbreak One Million Multimodal LLM Agents Exponentially Fast [37.8] マルチモーダル大言語モデル(MLLM)エージェントは、命令を受け取り、画像をキャプチャし、メモリから履歴を検索し、使用するツールを決定することができる。
Red-teamingの取り組みは、敵のイメージ/プロンプトがMLLMをジェイルブレイクし、不整合行動を引き起こすことを明らかにしている。
感染性ジェイルブレイクと呼ばれるマルチエージェント環境において,さらに深刻な安全性の問題が報告されている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:15:03 GMT)
Contextualized Sequence Likelihood: Enhanced Confidence Scores for Natural Language Generation [37.6] 種々のトークンに異なる重みを割り当てることで予測シーケンス確率を向上させることを提案する。
我々はこの新しいスコアを文脈化シーケンス類似度(CSL)と呼ぶ。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:55:07 GMT)
Improved Few-Shot Jailbreaking Can Circumvent Aligned Language Models and Their Defenses [37.6] 多数のデモ(最大数百)は、その長いコンテキスト能力を活用することで、最先端のLDMをジェイルブレイクすることができる。
本稿では,[/INST]のような特別なシステムトークンの注入や,収集したデモプールからのデモレベルのランダム検索などの改良手法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:59:17 GMT)
An Advanced Reinforcement Learning Framework for Online Scheduling of Deferrable Workloads in Cloud Computing [37.5] クラウド上でのdeferrableジョブのためのtextitOnline Scheduling(OSDEC)と呼ばれるオンラインのdeferrableジョブスケジューリング手法を提案する。
提案手法は,高資源利用率を維持しつつ,デプロイメントスケジュールを適切に計画し,ユーザの待ち時間を短縮することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:55:26 GMT)
Exploring and Exploiting the Asymmetric Valley of Deep Neural Networks [37.0] 最近の研究は、平らな谷と鋭い谷の向こう側に追加の非対称性があることを示唆している。
本研究では,谷の対称性に影響を及ぼす要因を定量的に検討する。
主要観測では,ノイズと収束点との間の信号の整合度が谷対称性の臨界指標であることが示された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:26:59 GMT)
Confidence-Based Task Prediction in Continual Disease Classification Using Probability Distribution [36.8] 深層学習モデルは、疾患分類における医療画像の発見に有効であることが広く認識されている。
継続的な学習の必要性は、進化する医療シナリオに適応するだけでなく、医療データのプライバシーを確保するためにも特に重要になる。
本稿では,信頼スコアを利用して,分類器の確率分布(ログ)を利用して,推定時のタスクIDを正確に判定するタスクID予測器を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:08:27 GMT)
Adaptive Horizon Actor-Critic for Policy Learning in Contact-Rich Differentiable Simulation [36.3] 本稿では, FO-MBRLアルゴリズムであるAdaptive Horizon Actor-Critic (AHAC)を提案する。
実験結果から,AHACはMFRLベースラインより優れており,ローコモーションタスク全体で40%以上の報酬が得られ,壁面時間効率が向上した高次元制御環境への効率なスケーリングが可能であった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:23:49 GMT)
TempCompass: Do Video LLMs Really Understand Videos? [36.3] 既存のベンチマークでは、ビデオLLMの時間知覚能力に関する包括的なフィードバックが得られていない。
質の高い時間的側面とタスク形式を多様に導入した textbfTemp ベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:13:39 GMT)
Functional Bilevel Optimization for Machine Learning [36.1] 本稿では,関数空間上での内的目的を最小化する機械学習における二段階最適化問題に対する新たな機能的視点を提案する。
機能的二段階最適化問題に対して,スケーラブルで効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:16:26 GMT)
Feature-Adaptive and Data-Scalable In-Context Learning [36.0] FADS-ICLは、機能適応型でデータスケーリング可能なコンテキスト内学習フレームワークである。
タスク適応機能を活用して、下流タスクの推論を促進することができる。
FADS-ICLは従来の最先端の手法を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:42:32 GMT)
An Information Bottleneck Perspective for Effective Noise Filtering on Retrieval-Augmented Generation [35.8] 情報ボトルネック理論を検索強化世代に導入する。
提案手法では,圧縮と地盤出力の相互情報を同時に最大化することにより,ノイズのフィルタリングを行う。
我々は,情報ボトルネックの定式化を導出し,新たな包括的評価を行う。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:31:06 GMT)
Reliable Quantum Communications based on Asymmetry in Distillation and Coding [35.7] 量子コンピューティングにおける絡み合った量子ビットの信頼性確保の問題に対処する。
テレポーテーションと蒸留に基づく間接送信を組み合わせ,(2)量子誤り訂正(QEC)に基づく直接送信
その結果、アドホックな非対称符号は、従来のQECと比較して、単一リンクと量子ネットワークのシナリオの両方において、性能向上とコードワードサイズ削減をもたらすことがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:13:43 GMT)
Controlled Decoding from Language Models [35.2] KL正規化強化学習(KL-regularized reinforcement learning、RL)は、高い報奨結果に対する言語モデル応答を制御するための一般的なアライメントフレームワークである。
制御復号法(CD)と呼ばれるモジュラー解法を提案する。
CDは個別のプレフィックススコアリングモジュールを通じて制御を行い、報酬の値関数を学習するように訓練される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:50:26 GMT)
Hybrid-Learning Video Moment Retrieval across Multi-Domain Labels [34.9] ビデオモーメント検索(VMR)とは、与えられたテキストクエリ記述(文)により、未編集の生ビデオ中の視覚的時間モーメントを検索することである。
本稿では,知識伝達による問題解決のために,ハイブリッド学習ビデオモーメント検索という新しい手法を提案する。
本研究の目的は,弱層対象領域におけるモデル学習を改善するために,両領域間の共通知識を探索することである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:14:53 GMT)
Poisoning Attacks and Defenses in Recommender Systems: A Survey [34.7] 現代のレコメンデーターシステム(RS)は、デジタルプラットフォーム全体のユーザエクスペリエンスを著しく向上させたが、毒殺攻撃による重大な脅威に直面している。
この調査は、攻撃者のレンズを通してこれらの脅威を調べることによって、ユニークな視点を示す。
攻撃目標の設定、攻撃能力の評価、犠牲者のアーキテクチャの分析、毒殺戦略の実行の4段階を含む系統的なパイプラインについて詳述する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:08:02 GMT)
Efficient Masked Autoencoders with Self-Consistency [34.7] マスク付き画像モデリング(MIM)はコンピュータビジョンにおける強力な自己教師付き事前学習手法として認識されている。
本研究では,自己整合性(EMAE)を有する効率的なマスク付きオートエンコーダを提案し,事前学習効率を向上させる。
EMAEは、画像分類、オブジェクト検出、セマンティックセグメンテーションなど、さまざまな下流タスクにおける最先端の転送能力を一貫して取得する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:06:53 GMT)
Distilling Morphology-Conditioned Hypernetworks for Efficient Universal Morphology Control [34.4] 異なるロボット形態の普遍的なポリシーを学ぶことは、学習効率を著しく向上させ、ゼロショットの一般化を目に見えない形態の一般化を可能にする。
TFのような優れた性能と推論時の高効率を実現するために,HyperDistillを提案する。
何百もの多様な形態のベンチマークであるUNIMALにおいて、HyperDistillはトレーニングと未確認テストロボットの共通TF教師ポリシーと同様に、異なる環境でモデルサイズを6~14倍、計算コストを67~160倍削減することを示した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:02:33 GMT)
PsyEval: A Suite of Mental Health Related Tasks for Evaluating Large Language Models [34.1] 本稿では,大規模言語モデル(LLM)を評価するためのメンタルヘルス関連タスクの包括的スイートであるPsyEvalについて述べる。
この包括的枠組みは、メンタルヘルス関連のタスクの独特な課題と複雑さを徹底的に評価するために設計されている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:37:10 GMT)
Rotational Equilibrium: How Weight Decay Balances Learning Across Neural Networks [33.9] 本研究は,ディープニューラルネットワークにおける個々のニューロンの更新挙動に重み劣化が及ぼす影響について検討する。
本研究では, 回転を明示的に制御することで, 重量減衰の利点が得られ, 学習率のウォームアップを著しく低減できることを示した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:57:47 GMT)
Enhancing Fairness in Unsupervised Graph Anomaly Detection through Disentanglement [33.6] グラフ異常検出(GAD)は、金融詐欺検出から偽ニュース検出まで、さまざまなアプリケーションにおいてますます重要になっている。
現在のGAD法は主に公平性の問題を見落としており、特定の人口集団に対して差別的な決定が下される可能性がある。
DeFENDという属性グラフ上に,DisEntangle-based FairnEss-aware aNomaly Detectionフレームワークを考案した。
実世界のデータセットに対する実証的な評価から、DEFENDはGADにおいて効果的に機能し、最先端のベースラインと比較して公正性を著しく向上することが明らかとなった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:48:45 GMT)
Learning Analysis of Kernel Ridgeless Regression with Asymmetric Kernel Learning [33.3] 本稿では,局所適応バンド幅(LAB)RBFカーネルを用いたカーネルリッジレスレグレッションを強化する。
初めて、LAB RBFカーネルから学習した関数は、Reproducible Kernel Hilbert Spaces (RKHSs) の積分空間に属することを示した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:28:12 GMT)
SpeechAct: Towards Generating Whole-body Motion from Speech [33.1] 本稿では,音声から全身の動きを生成する問題に対処する。
本稿では,高精度かつ連続的な動き生成を実現するために,新しいハイブリッド・ポイント表現を提案する。
また,モデルがより独特な表現を生成することを奨励するコントラッシブ・モーション・ラーニング手法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:58:25 GMT)
Symbolic Music Generation with Non-Differentiable Rule Guided Diffusion [33.0] 本研究では,非微分不可能なルールガイダンスに焦点をあてて,記号的音楽生成(例えばピアノロール生成)の問題について検討する。
本稿では,ルール関数の事前評価のみを必要とする新しいガイダンス手法である Oursfull (ours) を提案する。
我々は,SCGをプラグ・アンド・プレイ方式で構成できる,高解像度のシンボリック・ミュージック・ジェネレーションのための潜時拡散アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:47:27 GMT)
MultiPly: Reconstruction of Multiple People from Monocular Video in the Wild [32.7] モノクラーインザワイルドビデオから3Dで複数の人物を再構成する新しいフレームワークであるMultiPlyを提案する。
まず、シーン全体の階層化されたニューラル表現を定義し、個々の人間と背景モデルで合成する。
階層化可能なボリュームレンダリングを通じて,ビデオから階層化ニューラル表現を学習する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:59:57 GMT)
Pulmonary Embolism Mortality Prediction Using Multimodal Learning Based on Computed Tomography Angiography and Clinical Data [32.5] 本研究の目的は,CTPA(CTPA),臨床データ,肺重症度指数(PESI)スコアを用いて深層学習モデルを構築し,PE死亡率を予測することである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:10:13 GMT)
DeCoF: Generated Video Detection via Frame Consistency: The First Benchmark Dataset [32.2] 生成したビデオのオープンソースデータセットと検出手法を初めて提案する。
まず,964のプロンプトからなるスケーラブルなデータセットを提案する。
第二に、空間的人工物に基づく検出器が一般化性に欠けていることの探索実験により明らかになった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:00:25 GMT)
ED-SAM: An Efficient Diffusion Sampling Approach to Domain Generalization in Vision-Language Foundation Models [32.2] 本稿では,視覚言語基盤モデルの一般化性を改善するために,ドメイン一般化(ED-SAM)に対する簡易かつ効率的な拡散サンプリング手法を提案する。
CC3M, CC12M, LAION400Mなど, 視覚言語による事前学習データセットのスケールに関する実験結果は, 常に最先端のパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:27:28 GMT)
Online Control in Population Dynamics [32.1] オンライン制御のパラダイムに基づく新しいフレームワークを提案する。
まず、進化する個体群を自然にモデル化できる線形力学系の集合を特徴づける。
次に、これらのシステムに対して、ほぼ最適の後悔境界を持つ効率的な勾配ベースの制御を与える。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:40:59 GMT)
Adversarial Preference Optimization: Enhancing Your Alignment via RM-LLM Game [31.7] そこで本稿では,より効率的な人選好最適化を目的としたAPO(Adversarial Preference Optimization)フレームワークを提案する。
提案手法は,LLMの有効性と無害性の観点から,既存のアライメントベースラインをさらに強化する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:34:05 GMT)
Effective Subset Selection Through The Lens of Neural Network Pruning [31.4] 注釈付きデータを賢明に選択することが重要であり、これは部分集合選択問題として知られている。
より広範に研究されているサブセット選択とニューラルネットワークプルーニングの関係について検討する。
ニューラルネットワークの特徴のノルム基準を利用して、サブセット選択法を改善することを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:12:32 GMT)
Advancing Weakly-Supervised Audio-Visual Video Parsing via Segment-wise Pseudo Labeling [31.2] オーディオ・ビジュアル・ビデオ・パーシング(Audio-Visual Video Parsing)タスクは、可聴ビデオの音声ストリームと視覚ストリームの両方で発生する事象を特定し、時間的にローカライズすることを目的としている。
高度に注釈付けされたラベルがないため、最近の研究は偽のラベルを活用して監督を強化しようとしている。
本稿では,各ビデオセグメントにラベルを明示的に割り当てる擬似ラベル生成戦略を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:09:15 GMT)
MultiEdits: Simultaneous Multi-Aspect Editing with Text-to-Image Diffusion Models [31.0] MultiEditsは、複数の属性をまたいだ同時編集をシームレスに管理するメソッドである。
PIE-Bench++データセットは、多面的シナリオにおけるテキスト駆動の画像編集方法を評価するためのベンチマークである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:43:56 GMT)
RoSA: Accurate Parameter-Efficient Fine-Tuning via Robust Adaptation [30.8] 本稿ではロバスト適応法 (RoSA) と呼ばれる新しいPEFT法を提案する。
RoSAは、固定された事前トレーニングされた重みのセットの上に、$textitlow-rank$と$textithighly-sparse$コンポーネントをトレーニングする。
また,RoSAがLoRA,純スパース微調整,代替ハイブリット法を同じパラメータ予算で上回ることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:59:31 GMT)
State Space Models on Temporal Graphs: A First-Principles Study [30.5] 深層グラフ学習の研究は、動的挙動を示す実世界の複雑なシステムに応答して、静的グラフから時間グラフへ移行した。
RNNやTransformerのようなシーケンスモデルは、このような時間グラフをモデル化するための主要なバックボーンネットワークである。
時間グラフのダイナミクスをモデル化するためのグラフ状態空間モデルであるGraphSSMを開発した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:56:11 GMT)
API Pack: A Massive Multi-Programming Language Dataset for API Call Generation [30.5] API Packは、100万以上の命令APIコールペアを含む、大規模なマルチプログラミング言語データセットである。
API Packから2万のPythonインスタンス上でCodeLlama-13Bを微調整することで、未確認のAPI呼び出しを生成する際に、GPT-3.5とGPT-4を上回ります。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:38:04 GMT)
SOUL: Unlocking the Power of Second-Order Optimization for LLM Unlearning [30.3] 大規模言語モデル(LLM)は、データ規則や倫理的AIプラクティスに従うための効果的な非学習メカニズムの必要性を強調している。
LLMs unlearningは、望ましくないデータの影響と関連するモデル機能を取り除くことを目的としている。
SOULは、さまざまな未学習タスク、モデル、メトリクスにわたって、従来の一階法よりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:10:53 GMT)
How Video Meetings Change Your Expression [29.9] 人のビデオが2つあるとすると、各セットに特有の時間的パターンを自動的に見つけ出そうとする。
我々は、生成ドメイン翻訳のレンズを通してこの問題に取り組む。
本稿では,F2F(F2F)とVC(Voice-calls)の対話行動の違いを,本手法が検出できることを実証する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:15:02 GMT)
Exposing Lip-syncing Deepfakes from Mouth Inconsistencies [29.8] リップシンクのディープフェイク(英: Lip-syncing Deepfake)は、人の唇の動きをAIモデルを使って説得力のある方法で生成し、修正された音声や全く新しい音声にマッチさせるデジタル操作されたビデオである。
本稿では,口内持続性(LIPINC)に基づくリップシンクディープフェイク検出のための新しいLIP同期検出法について述べる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:29:28 GMT)
The Intelligible and Effective Graph Neural Additive Networks [29.7] Graph Neural Additive Network (GNAN) は、一般化加法モデルの解釈可能なクラスの拡張である。
GNANは完全に解釈可能で、機能レベルとグラフレベルでのグローバルな説明とローカルな説明が可能である。
我々は、さまざまなタスクやデータセットの一連の例において、GNANの知性を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:29:36 GMT)
DHA: Learning Decoupled-Head Attention from Transformer Checkpoints via Adaptive Heads Fusion [29.5] 大規模言語モデル(LLM)のためのDHA(Decoupled-Head Attention)機構を提案する。
DHAは、様々なレイヤにわたるキーヘッドとバリューヘッドのグループ共有を適応的に構成し、パフォーマンスと効率のバランスを改善する。
我々の実験によると、DHAは97.6%の性能を達成するために、オリジナルのモデルの事前訓練予算のわずか0.25%しか必要としていない。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:28:43 GMT)
Can Large Multimodal Models Uncover Deep Semantics Behind Images? [29.4] 本稿では,大規模マルチモーダルモデルの視覚的深層セマンティクス能力を評価するための総合ベンチマークであるDEEPEVALを紹介する。
9つのオープンソースLMMとGPT-4V(ision)の評価
例えば、GPT-4Vは、画像記述において人間に比較可能な性能を達成するにもかかわらず、深い意味論を理解する上で、人間よりも30%遅れている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:53:00 GMT)
When Can LLMs Actually Correct Their Own Mistakes? A Critical Survey of Self-Correction of LLMs [29.3] 自己補正(Self-correction)は、LLMを用いて推論中に応答を精製することで、大きな言語モデル(LLM)からの応答を改善するアプローチである。
これまでの作業では,自己評価や外部からのフィードバックなど,さまざまなフィードバック源を用いたさまざまな自己補正フレームワークが提案されていた。
我々は幅広い論文を批判的に調査し、自己補正を成功させるために必要な条件について議論する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:05:46 GMT)
Compositional Generative Modeling: A Single Model is Not All You Need [29.1] 我々は、より小さな生成モデルを構成することによって、より大規模な生成システムを構築するべきであると論じる。
このような構成的生成アプローチによって、よりデータ効率の良い方法で分布を学習できることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:30:33 GMT)
U-DiTs: Downsample Tokens in U-Shaped Diffusion Transformers [28.9] 本論文では,U-DiTモデルの性能を示すために,一連のU-DiT(U-DiTs)を提案する。
提案されたU-DiTはコスト計算の1/6でDiT-XL/2を上回った。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:14:56 GMT)
Privacy in LLM-based Recommendation: Recent Advances and Future Directions [28.7] 大規模言語モデル(LLM)は従来のレコメンデーションモデルと統合され、レコメンデーション性能が向上した。
本稿では,LLMに基づくレコメンデーションにおけるプライバシの最近の進歩を概観し,プライバシ攻撃と保護機構に分類する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:31:47 GMT)
Communication-Efficient Gradient Descent-Accent Methods for Distributed Variational Inequalities: Unified Analysis and Local Updates [28.7] 分散変分不等式問題(VIP)に対する通信効率の良い局所訓練手法の統一収束解析を提供する。
提案手法は,いくつかの新しい局所学習アルゴリズムの提案と解析を可能にする推定値に関する一般的な鍵となる仮定に基づいている。
異種データにおける分散変分不等式を解くために,通信複雑性の向上を図った最初の局所降下偏差アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 00:32:53 GMT)
Take a Step Further: Understanding Page Spray in Linux Kernel Exploitation [28.4] Page Sprayと呼ばれる新しい手法が登場し、カーネルの脆弱性に対するページレベルのエクスプロイトに焦点を当てている。
その根本原因、搾取モデル、他の搾取技術に対する比較利益、および潜在的緩和戦略に関する質問は、ほとんど答えられていない。
この研究は、セキュリティ研究者や開発者がPage Sprayに関する洞察を得るのを支援することを目的としている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:59:36 GMT)
Towards Efficient Replay in Federated Incremental Learning [28.2] フェデレートラーニング(FL)では、各クライアントのデータは通常、固定または静的であると仮定される。
本研究では,FIL(Federated Incremental Learning)シナリオにおけるデータ不均一性による破滅的忘れについて検討する。
本稿では,FIL 用のシンプルな汎用フレームワーク Re-Fed を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:14:56 GMT)
SEvenLLM: Benchmarking, Eliciting, and Enhancing Abilities of Large Language Models in Cyber Threat Intelligence [27.6] 本稿では,サイバーセキュリティのインシデント分析と応答能力をベンチマークし,評価し,改善するためのフレームワークを提案する。
サイバーセキュリティのWebサイトから、サイバーセキュリティの生テキストをクロールすることによって、高品質なバイリンガル命令コーパスを作成します。
命令データセットSEvenLLM-Instructは、マルチタスク学習目的のサイバーセキュリティLLMのトレーニングに使用される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:04:52 GMT)
Outliers and Calibration Sets have Diminishing Effect on Quantization of Modern LLMs [27.4] 学習後量子化(PTQ)は大規模言語モデル(LLM)の効率を向上させる
PTQにおける校正セットの役割,特に隠れ活性化に対する効果について検討する。
我々の分析では、利用可能なモデル間で量子化の有効性に顕著なコントラストが示される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:35:36 GMT)
Automatic Essay Multi-dimensional Scoring with Fine-tuning and Multiple Regression [27.2] 我々は、複数の次元にまたがる英語エッセイを自動的にスコアする2つのモデルを開発する。
本システムでは, 精度, F1スコア, 四重重みカッパの3つの基準を用いて, 評価性能を高く評価する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:59:50 GMT)
Portrait4D: Learning One-Shot 4D Head Avatar Synthesis using Synthetic Data [27.1] 大規模合成データを用いてワンショット4Dヘッド合成を学習する手法を提案する。
3次元再構成と再現の学習プロセスを切り離して、実画像への一般化性を高めるために、新しい学習戦略が実施される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:16:22 GMT)
LLM and GNN are Complementary: Distilling LLM for Multimodal Graph Learning [27.0] マルチモーダル分子データを用いた大規模言語モデル(LLM)からの洞察を抽出する革新的なフレームワークを提案する。
マルチモーダル知識をMLP(Multilayer Perceptron)に蒸留することにより,LLMとグラフニューラルネットワーク(GNN)の機能を相乗化するフレームワークであるGALLONを紹介する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:33:51 GMT)
Planning with a Learned Policy Basis to Optimally Solve Complex Tasks [26.6] 本稿では,後継機能を用いて政策ベースを学習し,その中の各(サブ)政治が明確に定義されたサブプロブレムを解決することを提案する。
同じサブプロブレムの集合を含む有限状態オートマトン(FSA)によって記述されるタスクでは、これらの(サブ)ポリケーションの組み合わせを使用して、追加の学習なしに最適な解を生成することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:56:28 GMT)
FedAdOb: Privacy-Preserving Federated Deep Learning with Adaptive Obfuscation [26.6] フェデレーテッド・ラーニング(FL)は、複数のクライアントがプライベートデータを共有せずに、共同で機械学習モデルを学習できるコラボレーティブ・アプローチとして登場した。
本稿では,FedAdObと呼ばれる新しい適応難読化機構を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:12:09 GMT)
Editing the Mind of Giants: An In-Depth Exploration of Pitfalls of Knowledge Editing in Large Language Models [26.5] 近年の研究では、知識の歪みや一般的な能力の劣化など、編集後に現れた副作用が特定されている。
本調査では,これらの側面を包括的に研究し,大規模言語モデルにおける知識編集に関わる課題を統一的に考察する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:28:21 GMT)
Mixup Augmentation with Multiple Interpolations [26.5] サンプルペアから複数の勾配を生成するマルチミックス(multi-mix)という単純な拡張を提案する。
生成されたサンプルの順序を順序付けすることで、マルチミックスは、標準的なミックスアップよりもトレーニングプロセスのガイドに役立てることができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:16:09 GMT)
Using RL to Identify Divisive Perspectives Improves LLMs Abilities to Identify Communities on Social Media [26.4] 本稿では,Large Language Models (LLMs) を利用してユーザコミュニティの同定を行う。
また,ChatGPT など多くの LLM が固定されており,ブラックボックスとして扱わなければならないため,より優れたプロンプト手法を提案する。
我々は、この小さなモデルをトレーニングするための戦略を考案し、コミュニティを検出するLLMのより大きな能力をどのように改善するかを示した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:45:31 GMT)
Reconstructing and Simulating Dynamic 3D Objects with Mesh-adsorbed Gaussian Splatting [26.4] 本稿では,このようなジレンマを解決するために,メッシュ吸着型ガウス平滑化法(MaGS)を提案する。
MaGSは3Dガウスをメッシュ表面にホバリングすることを制約し、相互に吸着したメッシュ-ガウスの3D表現を生成する。
メッシュ、3Dガウス、RDFを共同最適化することで、MaGSは高いレンダリング精度とリアルな変形を実現する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:59:51 GMT)
HemoSet: The First Blood Segmentation Dataset for Automation of Hemostasis Management [26.3] HemoSetは、生きた動物のロボット手術中の出血に基づく最初の血液セグメンテーションデータセットである。
我々は、最先端のセグメンテーションモデルをいくつかベンチマークし、血液検出に特有の困難について考察する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:43:08 GMT)
EAGLE: Efficient Adaptive Geometry-based Learning in Cross-view Understanding [26.2] セマンティックシーン理解におけるビュー間の幾何学的構造変化をモデル化するための,教師なしクロスビュー適応学習手法を提案する。
まず,カメラ間における画像やセグメンテーションマスクの構造変化をモデル化するための,非ペアデータに関するクロスビュー幾何学的制約を提案する。
第2に、カメラビュー間の幾何学的構造変化を効率的に測定するための、新しい測地流に基づく相関指標を提案する。
第3に、クロスビュー適応学習において、オープン語彙セグメンテーションネットワークのビュー情報モデリングを強化するために、新しいビュー条件プロンプト機構を導入する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:26:33 GMT)
Benchmarking Micro-action Recognition: Dataset, Methods, and Applications [26.1] マイクロアクションは、低強度運動によって特徴づけられる非言語行動である。
本研究では,マイクロアクション52(MA-52)と呼ばれる新しいマイクロアクションデータセットを革新的に収集する。
MA-52は、ジェスチャー、上肢、下肢の動きを含む全身的な視点を提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:39:51 GMT)
Understanding Preference Fine-Tuning Through the Lens of Coverage [25.8] 選好微調整におけるオンライン手法とオフライン手法の類似点と相違点について検討した。
グローバルなカバレッジ条件は、オフラインのコントラスト手法が最適ポリシーに収束するのに必要かつ十分であることを示す。
KL正規化のためのオンラインデータとコントラストベースの選好最適化にオフラインデータを利用するハイブリッド選好最適化アルゴリズムを導出する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:51:04 GMT)
Comparing Inferential Strategies of Humans and Large Language Models in Deductive Reasoning [25.7] 大規模言語モデル(LLM)では,人間の観察と類似した推論パターンが示される。
我々の研究は、モデルの構造と規模が、その好む推論方法に大きく影響していることを示します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:53:01 GMT)
The Power of Sampling: Dimension-free Risk Bounds in Private ERM [25.7] 本アルゴリズムは,ゼロ次オラクルのみを用いて,非平滑凸対象に対するランク依存的リスクバウンダリを実現することができることを示す。
これは、差分プライバシーにおけるサンプリングのパワーを強調します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:31:18 GMT)
Robust Classification by Coupling Data Mollification with Label Smoothing [25.7] 本稿では,ラベルのスムース化によりラベルの信頼度を画像劣化と整合させる手法を提案する。
CIFARおよびTinyImageNetデータセットの劣化画像ベンチマークにおいて、ロバスト性および不確実性の定量化が向上したことを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:21:29 GMT)
Balancing Speciality and Versatility: a Coarse to Fine Framework for Supervised Fine-tuning Large Language Model [25.5] Aligned Large Language Models (LLMs) は、様々な現実世界のタスクを処理できる優れた汎用性を示す。
専門性を得るための一般的な慣行である余分なデータによる微調整は、しばしば、以前に獲得した多目的性を破滅的な忘れてしまう。
専門性と汎用性のバランスを崩そうとする,粗いフレームワークであるCoFiTuneを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:42:36 GMT)
Unraveling and Mitigating Retriever Inconsistencies in Retrieval-Augmented Large Language Models [25.3] Retrieval-augmented Large Language Models (RALMs) は、元の検索自由言語モデル (LMs) を一貫して上回るものではない。
提案実験により, この例レベルの性能不整合性は, 検索強化と検索不要のLMの間だけでなく, 異なる検索者の間にも存在することが明らかとなった。
本稿では,異なる知識ソースから適応的に検索し,予測不能な読み出し誤りを効果的に低減できるトレーニング可能なフレームワークであるEnsemble of Retrievers(EoR)を紹介する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:20:18 GMT)
Unlock the Power of Algorithm Features: A Generalization Analysis for Algorithm Selection [25.3] 本稿では,アルゴリズムの特徴に基づくアルゴリズム選択の証明可能な最初の保証を提案する。
アルゴリズムの特徴に関連する利点とコストを分析し、一般化誤差が様々な要因にどのように影響するかを考察する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:55:58 GMT)
SemCoder: Training Code Language Models with Comprehensive Semantics [24.9] 包括的セマンティクスでコードLLMを訓練するための新しい戦略を導入する。
我々は、自然言語を用いてコードを書き、実行動作を表現し、推論するためのCode LLMのトレーニングを提案する。
提案手法は,複数の次元のセマンティクスをよりスムーズに統合することを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:36:57 GMT)
Addressing Diverging Training Costs using Local Restoration for Precise Bird's Eye View Map Construction [24.9] 本稿では,新しいTrumpet Neural Network(TNN)機構について紹介する。
TNNは、プラグアンドプレイのメモリ効率のパイプラインを提供しており、実際のサイズの(あるいは正確な)セマンティックラベルを効果的に推定することができる。
実験の結果,TNN機構は,実サイズ(あるいは正確な)セマンティックラベルを効果的に推定できる,プラグアンドプレイのメモリ効率の高いパイプラインを提供することがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:36:47 GMT)
Two Tales of Persona in LLMs: A Survey of Role-Playing and Personalization [24.7] 大規模言語モデル(LLM)を特定のシナリオに適用する方法が注目されている。
もともと対話文学で採用されたテクティトペルソナの概念は、有望な道として復活してきた。
ギャップを埋めるために、フィールドの現状を分類するための総合的な調査を提示する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:08:23 GMT)
SUBLLM: A Novel Efficient Architecture with Token Sequence Subsampling for LLM [24.7] SUBLLMは、サブサンプリング、アップサンプリング、バイパスモジュールを組み込むことで、コアデコーダのみのフレームワークを拡張する革新的なアーキテクチャである。
トレーニング中、SUBLLMはスピードを26%向上し、GPU毎にメモリを10GB削減する。
推論では、スピードを最大37%向上し、1GPUあたりのメモリを1GB削減する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:43:04 GMT)
Scalable Ensembling For Mitigating Reward Overoptimisation [24.6] ヒューマンフィードバックからの強化学習は、強力な命令追従モデルのための言語モデリングにおける大幅な進歩を可能にした。
ポリシーが学習したプロキシ"報酬モデルに過度に適合する傾向にあるため、これらのモデルの整合性は依然として急進的な課題である。
共有エンコーダを用いるが、線形ヘッドを分離する。この目的のために、共有エンコーダを用いるが、線形ヘッドを分離する方式を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:46:53 GMT)
Topology-Aware Dynamic Reweighting for Distribution Shifts on Graph [24.4] グラフニューラルネットワーク(GNN)は、ノード分類タスクに広く使用されているが、トレーニングやテストノードが異なるディストリビューションから来ると、一般化に失敗することが多い。
トレーニング中にWasserstein空間の勾配流を通じて標本重量を動的に調整するTopology-Aware Dynamic Reweighting (TAR) フレームワークを導入する。
フレームワークの優位性は、4つのグラフOODデータセットと3つのクラス不均衡ノード分類データセットの標準テストによって実証される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:32:05 GMT)
Graph-based Forecasting with Missing Data through Spatiotemporal Downsampling [24.4] 時系列間の関係をグラフとして表現することで、時空間グラフニューラルネットワークは印象的な結果を得る。
既存のほとんどのメソッドは、入力が常に利用可能であり、データの一部が欠落しているときに隠れたダイナミクスをキャプチャできないという、しばしば非現実的な仮定に依存しています。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:26:05 GMT)
A Game-Theoretic Approach to Privacy-Utility Tradeoff in Sharing Genomic Summary Statistics [24.3] 本稿では,ゲノムサマリー統計の共有において,最適なプライバシ・ユーティリティ・トレードオフのためのゲーム理論フレームワークを提案する。
実験により,提案手法は,技術状況よりも強力な攻撃と強力な防衛戦略をもたらすことが示された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:09:47 GMT)
MedFuzz: Exploring the Robustness of Large Language Models in Medical Question Answering [24.3] 大規模言語モデル (LLM) は、医学的質問応答ベンチマークにおいて優れたパフォーマンスを達成している。
我々は、"MedFuzzed"ベンチマークでのパフォーマンスの使用方法と、個々の攻撃の成功例を示します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:15:56 GMT)
A survey on multi-player bandits [24.2] この調査は、リッチなマルチプレイヤーバンディット文学を文脈化し、整理する。
これらの異なる方向のさらなる研究は、現実の状況に適応した理論的アルゴリズムに繋がる可能性があると我々は信じている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:53:22 GMT)
Earthfarseer: Versatile Spatio-Temporal Dynamical Systems Modeling in One Model [23.9] EarthFarseerは、並列ローカル畳み込みとグローバルなフーリエベースのトランスフォーマーアーキテクチャを組み合わせたフレームワークである。
提案手法は, 様々な収束, データセットに強い適応性を示し, 長期間の予測において, 高速で良好な局所忠実性を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:46:47 GMT)
Iterative Motion Editing with Natural Language [23.8] テキスト間拡散モデルはテキストプロンプトからリアルなアニメーションを生成することができるが、微粒なモーション編集制御はサポートしていない。
本稿では,既存の文字アニメーションに局所的な編集を反復的に指定するために自然言語を用いる手法を提案する。
本システムは,アニメーターの編集意図を尊重する動作編集を行い,オリジナルアニメーションに忠実であり,リアルなキャラクターアニメーション結果が得られる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:42:35 GMT)
Dragonfly: Multi-Resolution Zoom Supercharges Large Visual-Language Model [23.7] 画像の高解像度化は、言語モデルに2つの大きな課題をもたらす。
これは言語モデルに必要なコンテキスト長を拡張し、非効率になり、モデルのコンテキスト制限に達する。
我々はDragonflyを紹介した。Dragonflyは、画像領域に関するきめ細かい視覚的理解と推論を強化する新しいLMMアーキテクチャである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:17:12 GMT)
Take its Essence, Discard its Dross! Debiasing for Toxic Language Detection via Counterfactual Causal Effect [23.6] 有害言語検出(TLD)における語彙バイアスを軽減するために, CCDF(Counterfactal Causal Debiasing Framework)を提案する。
CCDFは語彙バイアスの「無駄な影響」を保ち、「誤解を招く影響」を排除している
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:34:30 GMT)
Heracles: A Hybrid SSM-Transformer Model for High-Resolution Image and Time-Series Analysis [23.5] Heraclesは、ローカルSSM、グローバルSSM、アテンションベースのトークンインタラクションモジュールを統合した、新しいSSMである。
Heraclesは、ImageNetデータセット上で84.5%のトップ1精度で最先端のパフォーマンスを達成する。
ヘラクレスは、CIFAR-10、CIFAR-100、オックスフォード・フラワーズ、スタンフォード・カーズといったデータセットのトランスファー学習タスクを卓越している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:22:30 GMT)
UniQA: Unified Vision-Language Pre-training for Image Quality and Aesthetic Assessment [23.5] 画像品質評価(IQA)と画像審美評価(IAA)は、人間の視覚的品質と美的魅力に対する主観的知覚をシミュレートすることを目的としている。
既存の手法は、異なる学習目的のために、これらのタスクを独立して扱うのが一般的である。
本研究では,2つのタスクの一般的な認識を学習するために,視覚言語による品質と美学の事前学習(UniQA)を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:40:10 GMT)
TabMDA: Tabular Manifold Data Augmentation for Any Classifier using Transformers with In-context Subsetting [23.5] TabMDAは、表データの多様体データ拡張のための新しい方法である。
これは、TabPFNのような事前訓練されたインコンテキストモデルを使用して、データを多様体空間にマッピングする。
本研究では,TabMDAが事前学習したテキスト内モデルの情報を有効活用し,下流の分類器の性能を向上させる方法を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:51:13 GMT)
Zero-Shot Out-of-Distribution Detection with Outlier Label Exposure [23.3] Outlier Label Exposure (OLE)は、補助的なoutlierクラスラベルを用いたゼロショットOOD検出を強化するアプローチである。
OLE は検出性能を大幅に改善し,大規模 OOD およびハード OOD 検出ベンチマークの最先端性能を向上する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:07:21 GMT)
MAWSEO: Adversarial Wiki Search Poisoning for Illicit Online Promotion [23.2] 本稿では,Wiki上のステルスブラックハットSEOが自動化可能であることを示す研究を報告する。
我々の技術はMAWSEOと呼ばれ、現実のサイバー犯罪の目的を達成するために敵のリビジョンを用いています。
評価とユーザスタディにより,MAWSEOは敵の破壊的編集を効果的かつ効率的に生成できることが示された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:35:25 GMT)
Learning the Target Network in Function Space [23.1] Lookahead-Replicate (LR) は新しい値関数近似アルゴリズムである。
LRは値関数の学習において収束挙動をもたらすことを示す。
また、LRベースのターゲットネットワーク更新により、Atariベンチマークの深いRLが大幅に改善されることを示す実験結果を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:10:35 GMT)
Player-Driven Emergence in LLM-Driven Game Narrative [23.0] 大規模言語モデル(LLM)との相互作用が創発的行動を引き起こすかを検討する。
我々のテストベッドはテキストアドベンチャーゲームであり、プレイヤーは固定された物語の前提の下でミステリーを解こうとする。
ゲームプレイのために28人のゲーマーを募集し、GPT-4を使用してゲームログを自動的にゲームプレイの物語を表すノードグラフに変換する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:27:14 GMT)
Agnostic Learning of Mixed Linear Regressions with EM and AM Algorithms [22.8] 混合線形回帰は統計学と機械学習においてよく研究されている問題である。
本稿では、サンプルから混合線形回帰を学習する際のより一般的な問題について考察する。
AMアルゴリズムとEMアルゴリズムは, 集団損失最小化器に収束することにより, 混合線形回帰学習につながることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:43:24 GMT)
Hierarchical Open-Vocabulary 3D Scene Graphs for Language-Grounded Robot Navigation [22.8] 本稿では,言語を基盤としたロボットナビゲーションのための3次元シーングラフマッピング手法HOV-SGを提案する。
HOV-SGは3つの異なるデータセットで評価され、オブジェクト、部屋、フロアレベルでのオープン語彙のセマンティック精度において、以前のベースラインを超える。
HOV-SGの有効性と一般化性を証明するため,実世界のマルチストレージ環境における言語条件ロボットナビゲーションの成功例を示した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:12:25 GMT)
FusionDTI: Fine-grained Binding Discovery with Token-level Fusion for Drug-Target Interaction [22.5] 本稿では,トークンレベルのFusionモジュールを用いてドラッグ・ターゲットインタラクションの詳細な情報を学習するFusionDTIという新しいモデルを提案する。
特に、FusionDTIモデルでは、医薬品のSELFIES表現を使用して、配列フラグメントの無効化を軽減しています。
提案したFusionDTIモデルは,既存の7つの最先端ベースラインと比較して,DTI予測において最高の性能が得られることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:48:54 GMT)
Differentially Private Fine-Tuning of Diffusion Models [22.5] 微分プライバシーと拡散モデル(DM)の統合は、有望だが挑戦的なフロンティアを示している。
この分野での最近の進歩は、公開データによる事前学習によって高品質な合成データを生成する可能性を強調している。
本稿では,プライバシとユーティリティのトレードオフを高めるために,トレーニング可能なパラメータの数を最小限に抑える,プライベート拡散モデルに最適化された戦略を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:18:04 GMT)
ELSA: Evaluating Localization of Social Activities in Urban Streets [22.4] なぜ街路は、他の街路よりも多くの社会活動を惹きつけるのか?
ELSAには、個人およびグループアクティビティのための4300以上のマルチラベル境界ボックスを備えた、手動でアノテートされた937イメージが含まれている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:32:23 GMT)
PediatricsGPT: Large Language Models as Chinese Medical Assistants for Pediatric Applications [22.2] PedCorpusは、小児科の教科書、ガイドライン、知識グラフリソースから30万以上のマルチタスク・インストラクションを収集し、多様な診断要求を満たすための高品質なデータセットである。
PedCorpusを十分に設計した上で,系統的かつ堅牢なトレーニングパイプライン上に構築された,中国初の小児 LLM アシスタントであるPediatricsGPT を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:27:10 GMT)
TimeCMA: Towards LLM-Empowered Time Series Forecasting via Cross-Modality Alignment [21.7] TimeCMAは、モーダリティ間のアライメントを伴う時系列予測のフレームワークである。
実データに関する大規模な実験は、提案したフレームワークの精度と効率に関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 00:27:29 GMT)
CodeR: Issue Resolving with Multi-Agent and Task Graphs [21.5] SWEベンチは問題解決における性能を測定するために提案されている。
マルチエージェントフレームワークと事前に定義されたタスクグラフを採用して,報告されたバグの修復と解決を行い,コードリポジトリに新機能を追加するCodeRを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:13:35 GMT)
Guaranteeing Data Privacy in Federated Unlearning with Dynamic User Participation [21.1] フェデレート・アンラーニング(FU)は、訓練されたグローバルなFLモデルから、フェデレート・ラーニング(FL)ユーザーのデータの影響を排除できる。
単純なFUメソッドでは、未学習のユーザを削除し、その後、残りのすべてのユーザとスクラッチから新しいグローバルFLモデルを再トレーニングする。
非学習効率を高めるため、広く採用されている戦略では、FLユーザをクラスタに分割するクラスタリングを採用している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:39:07 GMT)
Mitigating Motion Blur in Neural Radiance Fields with Events and Frames [21.1] 本研究では,フレームやイベントを融合させることにより,カメラ動作下でのNeRF再構成を改善する新しい手法を提案する。
我々は、イベント二重積分を追加のモデルベースとして利用して、ぼやけた生成プロセスを明示的にモデル化する。
合成および実データから,提案手法は,フレームのみを使用する既存の劣化型NeRFよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:56:14 GMT)
Spectral Prompt Tuning:Unveiling Unseen Classes for Zero-Shot Semantic Segmentation [20.9] 画像からピクセルへのCLIPの適応性を改善する一段階アプローチであるSPT-SEGを提案する。
具体的には、スペクトルプロンプトチューニング(SPT)を導入し、CLIP視覚エンコーダの浅い層にスペクトルプロンプトを組み込む。
我々は、最先端のアプローチよりもメソッドが優れていることを実証し、すべてのクラスでうまく機能し、特に目に見えないクラスを扱うのに優れています。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:17:01 GMT)
Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation [20.9] 空間的整合性を高めるために,多視点にわたって共有ノイズモデリング機構を備えた拡散型長ビデオ生成手法を提案する。
本手法は,最先端の手法に比べて約5倍長くなる一貫性を損なうことなく,最大40フレームの映像を生成することができる。
我々のフレームワークは、認識と予測タスクを超えて、エンド・ツー・エンドの自動運転モデルの計画性能を25%向上させることができます。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:13:13 GMT)
Sparsity-Accelerated Training for Large Language Models [20.9] 大規模言語モデル (LLM) は様々な自然言語処理 (NLP) タスクの習熟度を示した。
LLMは、連続的な事前訓練や教師付き微調整など、追加の訓練を必要とすることが多い。
本稿では,この学習プロセスの迅速化のために,事前学習したLLMのエンハンスパシティを活用することを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:56:09 GMT)
Safeguarding Large Language Models: A Survey [20.9] 大規模言語モデル(LLM)の倫理的使用を所定の範囲内で確実にするための「保護」や「ガードレール」が義務付けられている。
本稿は、この重要なメカニズムの現状について、体系的な文献レビューを提供する。
その主な課題と、様々な文脈における倫理的問題を扱う包括的なメカニズムにどのように拡張できるかを論じる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:27:46 GMT)
Fearless Stochasticity in Expectation Propagation [20.8] 我々は期待伝播(EP)のモーメントマッチング更新に関する新しい視点を提供する。
この洞察を用いて、2つの新しいEP変種を動機付け、特にモンテカルロ(MC)推定に適した更新を行う。
これらの新しいバリエーションは、前者の利点と重要な弱点に対処するものである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:42:06 GMT)
Representing Molecules as Random Walks Over Interpretable Grammars [20.7] 複素分子を表現・推論するためのデータ効率・解釈可能なモデルを提案する。
設計空間上のランダムウォークという形で,新しい表現を提示する。
予測分子の性能, 効率, 合成性の観点から, 既存の手法に対する明確な優位性を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:43:24 GMT)
Learning Adaptive Fusion Bank for Multi-modal Salient Object Detection [19.9] マルチモーダル・サリエント物体検出(MSOD)は、可視光源を深度や熱赤外と統合することにより、塩分検出性能を向上させることを目的としている。
既存の方法は通常、特定の問題や課題を扱うために異なる融合スキームを設計する。
本稿では,異なる課題を同時に扱うための基本核融合スキームの集合から,相補的な利点をフル活用する新しい適応核融合銀行を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:11:34 GMT)
1-Lipschitz Neural Networks are more expressive with N-Activations [19.9] システムの入力に対する小さな変更は、出力に大きな変更をもたらすべきではない。
MaxMinのようなよく使われるアクティベーション関数は、不必要に表現可能な関数のクラスを制限する。
現在普及しているアクティベーション関数よりも明らかに表現力が高い新しいN-アクティベーション関数を導入する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:20:13 GMT)
DeepUniUSTransformer: Towards A Universal UltraSound Model with Prompted Guidance [19.9] 本稿では,DeepUniUSTransformerという,超音波のための新しいユニバーサルフレームワークを提案する。
このモデルの普遍性は、様々な側面にわたる汎用性から導かれる。
我々は、この情報をプロンプトとして組み込んだ新しいモジュールを導入し、モデルの学習プロセスにシームレスに組み込む。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:49:54 GMT)
Sparsity-Agnostic Linear Bandits with Adaptive Adversaries [19.8] 本研究では,各ラウンドにおいて,学習者が要素を選択して報酬を得る一連の行動(特徴ベクトル)を受信する線形帯域について検討する。
期待される報酬は、選択されたアクションの固定だが未知の線形関数である。
線形報酬関数の非ゼロ係数数$S$に依存するスパース後悔境界について検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:54:58 GMT)
TCMBench: A Comprehensive Benchmark for Evaluating Large Language Models in Traditional Chinese Medicine [19.7] 大規模言語モデル(LLM)の専門的評価ベンチマークは、伝統的な中国医学(TCM)領域ではまだカバーされていない。
そこで本研究では,TCMにおけるLLM性能を評価するための総合的なベンチマークであるTCM-Benchを紹介する。
TCM-EDデータセットは、TCM Licensing Exam (TCMLE)から得られた5,473の質問から成り、権威分析を伴う1,300の質問を含む。
質問応答の精度を超えてLLMを評価するために,TCM関連質問に対してLLMが生成する回答の質を評価するための指標であるTCMScoreを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:11:13 GMT)
Achieving Tractable Minimax Optimal Regret in Average Reward MDPs [19.7] 我々は,$widetildemathrmO(sqrtmathrmsp(h*) S A T)$のミニマックス最適後悔を伴う最初の抽出可能なアルゴリズムを提案する。
注目すべきは、我々のアルゴリズムは$mathrmsp(h*)$に関する事前情報を必要としないことである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:53:44 GMT)
Mixture of Rationale: Multi-Modal Reasoning Mixture for Visual Question Answering [19.4] EmphMixture of Rationales (MoR) は、ゼロショット視覚的質問応答のための複数の論理を混合する新しいマルチモーダル推論手法である。
MoRはNLVR2では12.43%の精度向上、OKVQA-Sでは2.45%の精度向上を実現している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:04:47 GMT)
A New View on Planning in Online Reinforcement Learning [19.4] 本稿では,背景計画を用いたモデルに基づく強化学習への新たなアプローチについて検討する。
GSPアルゴリズムは抽象空間から様々な基礎学習者が異なる領域でより高速に学習できるような方法で価値を伝播することができることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:45:19 GMT)
PLUG: Revisiting Amodal Segmentation with Foundation Model and Hierarchical Focus [19.3] SAMに基づく最初のアモーダルセグメンテーション手法であるPLUGを提案する。
地域レベルでは、可視・隠蔽領域の関連と区分により、相互の混乱を避けるために、異なる枝の焦点として、イモダル領域とアモーダル領域が割り当てられる。
ポイントレベルでは、不確実性の概念を導入し、曖昧な点を特定し、焦点を合わせる際にモデルを明確に支援する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:27:09 GMT)
Graph Neural Network Enhanced Retrieval for Question Answering of LLMs [19.2] 本稿では,経路間の関連性を考慮し,GNN-Retと呼ばれる新しい検索手法を提案する。
グラフニューラルネットワーク(GNN)を使用して、パス間の関係を利用して、サポートパスの検索を改善する。
我々は,RGNN-Retと呼ばれるリカレントグラフニューラルネットワーク(RGNN)を用いて,マルチホップ推論問題に対処する手法を拡張した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:07:46 GMT)
How Vocabulary Sharing Facilitates Multilingualism in LLaMA? [19.1] 大きな言語モデル(LLM)は英語のタスクに強いパフォーマンスを示すが、他の言語には制限がある。
本研究では,語彙共有の観点からLLMの多言語的能力について検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:11:06 GMT)
Evolutionary Computation for the Design and Enrichment of General-Purpose Artificial Intelligence Systems: Survey and Prospects [19.0] 汎用人工知能システム(GPAIS)は、モデル構成と適応性の課題を提起する。
Evolutionary Computation (EC)は機械学習モデルの設計と最適化の両方に有用なツールである。
本稿では,GPAISの分野におけるECの役割を解析し,その設計や富化におけるECの利用について検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:47:17 GMT)
Flood and Echo Net: Algorithmically Aligned GNNs that Generalize [19.0] 我々は新しいタイプのグラフニューラルネットワークとしてFloodとEcho Netを提案する。
様々な大きさのグラフをまたいで一般化するメカニズムの本質的な能力は、アルゴリズム学習のタスクの実践的なアーキテクチャとして位置づけられる。
我々は,Flood と Echo Net を様々な合成タスクと SALSA-CLRS ベンチマークでテストし,アルゴリズムによる実行のアライメントにより,より大きなグラフサイズへの一般化が向上することを確認した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:50:08 GMT)
GraphAny: A Foundation Model for Node Classification on Any Graph [18.9] 特定のトレーニングを必要とせずに新しいタスクで推論を実行できるファンデーションモデルは、視覚と言語アプリケーションにおける機械学習に革命をもたらした。
本研究では,GraphAnyと呼ばれる帰納的ノード分類のための新しい基盤アーキテクチャを用いて,2つの課題に取り組む。
具体的には、各ノードの注意スコアを学習し、複数のLinearGNNの予測を融合させ、新しいグラフの一般化を保証する。
実証的には、わずか120のラベル付きノードを持つウィスコンシンデータセットでトレーニングされたGraphAnyは、インダクティブな方法で平均67.26%の精度で30の新しいグラフを効果的に一般化することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:08:54 GMT)
Towards Arbitrary-Scale Histopathology Image Super-resolution: An Efficient Dual-branch Framework via Implicit Self-texture Enhancement [18.9] Inlicit Self-Texture Enhancement-based dual-branch framework (ISTE) を提案する。
ISTEには、まずピクセルの特徴とテクスチャの特徴を学習するテクスチャ学習ブランチと、画素学習ブランチが含まれている。
我々はISTEが既存の固定スケールおよび任意のスケールのアルゴリズムを複数の倍率で上回ることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:09:28 GMT)
How Does Gradient Descent Learn Features -- A Local Analysis for Regularized Two-Layer Neural Networks [18.8] 有用な特徴を学習する能力は、ニューラルネットワークの大きな利点の1つだ。
最近の研究は、ニューラルネットワークが機能学習を許さないニューラルネットワークカーネル(NTK)で動作可能であることを示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:15:28 GMT)
Non-Asymptotic Analysis for Single-Loop (Natural) Actor-Critic with Compatible Function Approximation [18.8] アクタークリティカル (AC) は、強化学習において最適な政策を学ぶための強力な方法である。
AC は $epsilon +varepsilon_textcritic$ 定常点の近傍に収束する。
本稿では,ACアルゴリズムとNACアルゴリズムのコンバージェンスを,相反する関数近似を用いて解析する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:05:04 GMT)
Graph Language Models [18.8] 両アプローチの長所を統合し,その短所を緩和する新しいLM型であるグラフ言語モデル(GLM)を導入する。
我々はGLMのアーキテクチャを設計し、グラフバイアスを取り入れ、グラフ内の効果的な知識分布を促進する。
関係分類タスクに関する実証的な評価は、GLM埋め込みが、教師付きおよびゼロショット設定におけるLMベースラインとGNNベースベースラインの両方を上回っていることを示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:14:34 GMT)
PrivacyRestore: Privacy-Preserving Inference in Large Language Models via Privacy Removal and Restoration [18.7] 本稿では,大規模言語モデル推論におけるユーザ入力のプライバシ保護のためのプライバシストアを提案する。
PrivacyRestoreは、ユーザ入力のプライバシスパンを直接削除し、推論中のアクティベーションステアリングを通じてプライバシ情報を復元する。
実験によると、PrivacyRestoreは、許容レベルのパフォーマンスと推論効率を維持しながら、プライベート情報を保護することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:57:39 GMT)
Convex and Bilevel Optimization for Neuro-Symbolic Inference and Learning [18.7] 我々は凸と双レベル最適化の手法を活用し、ニューラルシンボリック(NeSy)システムのための一般的なパラメータ学習フレームワークを開発する。
我々は、最先端のNeSyアーキテクチャであるNeuPSLを使って、我々のフレームワークを実演する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:15:37 GMT)
Reproducibility Study on Adversarial Attacks Against Robust Transformer Trackers [18.6] 新しいトランスフォーマーネットワークはオブジェクトトラッキングパイプラインに統合され、最新のベンチマークで強いパフォーマンスを示している。
本稿では, 逆攻撃におけるトランスフォーマートラッカーの挙動と, パラメータの変化に伴うデータセットの追跡において, 異なる攻撃がどう作用するかを理解することに焦点を当てる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:13:38 GMT)
CheXpert Plus: Augmenting a Large Chest X-ray Dataset with Text Radiology Reports, Patient Demographics and Additional Image Formats [18.5] CheXpert Plusは、放射線学で公開された最大のテキストデータセットである。
これは放射線学における最大のテキスト識別の取り組みである。
全てのレポートはDICOMフォーマットで高品質な画像とペアリングされる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:14:12 GMT)
Feature Attribution with Necessity and Sufficiency via Dual-stage Perturbation Test for Causal Explanation [18.5] FANS(Feature Attribution with Necessity and Sufficiency)を紹介する。
FANSは、この地区内の摂動サンプルが必要かつ十分(PNS)である確率が高く、予測の変化を引き起こすような入力の近傍を見つける。
FANSは6つのベンチマークで既存の属性法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:29:05 GMT)
Stochastic Newton Proximal Extragradient Method [18.5] そこで本稿では,これらの境界を改良するNewton Extragradient法を提案する。
我々はHybrid Proximal Extragradient(HPE)フレームワークを拡張してこれを実現する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:06:23 GMT)
Continuous Geometry-Aware Graph Diffusion via Hyperbolic Neural PDE [18.4] 我々は、HPDE積分のための非ユークリッド多様体に対して、電場と流れ、勾配、発散、および拡散率の理論的原理を導入する。
本稿では,ハイパーボリックグラフ拡散方程式 (HGDE) を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:50:58 GMT)
Graph-enhanced Large Language Models in Asynchronous Plan Reasoning [18.4] 大規模な言語モデル(LLM)は、ベンチマークAsyncHowのタスク解決プロセスに関するイラストが提供されないと、動作が悪くなります。
そこで我々は,グラフと自然言語のプロンプトを組み合わせ,最先端の結果を得るPlan Like a Graph (PLaG) という新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:07:06 GMT)
Boosting Language Models Reasoning with Chain-of-Knowledge Prompting [18.3] CoK(Chain-of-Knowledge)は、構造三重の形で明確な知識証拠を引き出すことを目的としている。
さらに, 推論チェーンの信頼性を推定するF2-Verification法を導入する。
広汎な実験により,本手法はコモンセンス,事実,記号,算術的推論タスクの性能をさらに向上させることができることが示された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:59:11 GMT)
Adaptive Layer Splitting for Wireless LLM Inference in Edge Computing: A Model-Based Reinforcement Learning Approach [18.2] 本研究では、モデルベース強化学習(MBRL)からインスピレーションを得て、エッジとユーザ機器(UE)間の最適分割点を決定するフレームワークを提案する。
報酬代理モデルを導入することで、頻繁な性能評価の計算コストを大幅に削減できる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:41:42 GMT)
Finding Optimally Robust Data Mixtures via Concave Maximization [18.1] グループ分散最適化(グループDRO)は、非所得モデルの性能の変動を学習する一般的な方法の一つである。
我々は、MixMaxと呼ぶ手法が、エントロピー上昇を伴う特定の混合物を選択し、重要なことに、この分布を有界重みの集合に最適に適合させることで、グループDRO最適モデルを返すことを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:06:12 GMT)
No Vandalism: Privacy-Preserving and Byzantine-Robust Federated Learning [18.1] フェデレートされた学習により、複数のクライアントがプライベートデータを共有せずに1つの機械学習モデルを共同でトレーニングし、プライバシ保護を提供する。
従来の連合学習は、毒性攻撃に弱いため、モデルの性能を低下させるだけでなく、悪意のあるバックドアを埋め込むこともできる。
本稿では,悪意ある参加者からの攻撃に対して,有害行為(NoV)のない環境を提供するために,プライバシ保護とビザンチン損なうフェデレーション・ラーニング・スキームを構築することを目的とする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:59:10 GMT)
BadRAG: Identifying Vulnerabilities in Retrieval Augmented Generation of Large Language Models [18.1] 大規模言語モデル(LLM)は時代遅れの情報と誤ったデータを生成する傾向によって制約される。
Retrieval-Augmented Generation (RAG) は、検索手法の強みと生成モデルを組み合わせることで、これらの制限に対処する。
RAG は LLM に対する新たな攻撃面を導入している。特に RAG データベースは Web などの公開データからしばしば引き出されるためである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:25:33 GMT)
Towards Causal Foundation Model: on Duality between Causal Inference and Attention [18.0] 治療効果推定のための因果認識基盤モデルの構築に向けて第一歩を踏み出す。
我々はCInA(Causal Inference with Attention)と呼ばれる新しい理論的に正当化された手法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:32:38 GMT)
Learn To be Efficient: Build Structured Sparsity in Large Language Models [17.9] 大きな言語モデル(LLM)は、その10億レベルのパラメータで驚くべき成功を収めていますが、高い推論オーバーヘッドを引き起こします。
既存の方法は、訓練後の環境で自然に形成された活性化空間の利用にのみ焦点をあてる。
本稿では,Learning-To-Efficient (LTE) という学習学習アルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:28:58 GMT)
Towards Effective Detection of Ponzi schemes on Ethereum with Contract Runtime Behavior Graph [17.8] 詐欺の一種であるポンツィスキームは、近年スマートコントラクトで発見され、巨額の損失をもたらした。
既存の検出手法は主にルールベースのアプローチと機械学習技術に焦点を当てている。
PonziGuardは,契約実行時の動作に基づく効率的なPonzi検出手法である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:17:48 GMT)
On the Inherent Privacy Properties of Discrete Denoising Diffusion Models [17.8] 本稿では、離散拡散モデルに固有のプライバシー保護の先駆的な理論的探索について述べる。
我々のフレームワークは、トレーニングデータセット内の各データポイントの潜在的なプライバシー漏洩を解明する。
当社のバウンダリは、$$$サイズのデータポイントによるトレーニングが、プライバシー漏洩の急増につながっていることも示しています。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:02:54 GMT)
Data Contamination Calibration for Black-box LLMs [17.7] 本稿では, 汚染データを検出するために, ポーラライズ・オーグメント (PAC) という総合的手法と, 新たにリリースされたデータセットを提案する。
広範な実験により、PACはデータ汚染検出に向けて、既存の手法を少なくとも4.5%上回っている。
実世界のシナリオにおける我々の応用は、汚染と関連する問題の顕著な存在を強調している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:21:54 GMT)
Towards Efficient Deep Spiking Neural Networks Construction with Spiking Activity based Pruning [17.5] 本稿では,Spking Channel Activity-based (SCA) network pruning frameworkという,畳み込みカーネルの動作レベルに基づく構造化プルーニング手法を提案する。
本手法は, 学習中の畳み込みカーネルの切断・再生によりネットワーク構造を動的に調整し, 現在の目標タスクへの適応性を高める。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:44:37 GMT)
KS-Lottery: Finding Certified Lottery Tickets for Multilingual Language Models [17.4] 宝くじ仮説は、ランダムなニューラルネットワーク内での「当選チケット」の存在を仮定する。
KS-Lottery は多言語微調整に非常に有効な LLM パラメータの小さなサブセットを同定する手法である。
微調整された18個のトークンのLLaMA埋め込みは、微調整された翻訳性能に到達するのに十分であることがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:35:25 GMT)
Locally purified density operators for noisy quantum circuits [17.4] 雑音量子回路から発生する混合状態は、局所精製密度演算子(LPDO)によって効率的に表現できることを示す。
N$ qubits の LPDO から 2 時間 N$ の大きさの凸対状態への写像を示し、仮想およびクラウス結合を管理する統一的な方法を導入する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:38:12 GMT)
Convolutional Unscented Kalman Filter for Multi-Object Tracking with Outliers [17.4] マルチオブジェクトトラッキング(MOT)は、自律運転におけるナビゲーションに不可欠な技術である。
近年, トラッキング手法は, 外乱を観測するフィルタリングアルゴリズムに基づいており, トラッキング精度の低下や, オブジェクトの軌跡の喪失さえも生じている。
我々は,ConvUKFが外れ値の存在下で有界な追跡誤差を持つことを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:42:38 GMT)
Here's a Free Lunch: Sanitizing Backdoored Models with Model Merge [17.3] オープンソースイニシアチブによる事前訓練された言語モデルの民主化は、急速に革新と最先端技術へのアクセスを拡大している。
特定の入力によって隠れた悪意のある振る舞いが引き起こされ、自然言語処理(NLP)システムの完全性と信頼性を損なうバックドア攻撃。
本稿では,バックドアモデルと他の同質モデルとを組み合わせることで,バックドアの脆弱性を著しく改善することができることを示唆する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:19:03 GMT)
Few-Shot Classification of Interactive Activities of Daily Living (InteractADL) [17.2] 我々は、人間(と物体)間の相互作用を含む複雑なADLを理解するための新しいデータセットとベンチマーク、InteractADLを提案する。
そこで本研究では,クラス名ベクトルを学習することにより,よりセマンティックなセマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマン
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:59:55 GMT)
OpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning Capabilities of Large Language Models [17.0] N-ToM(Neural Theory-of-Mind)は、他者の精神状態を理解し、追跡する能力を持つ機械である。
OpenToMは、より長く明確な物語、明示的な性格特性、キャラクタの意図によって引き起こされる行動でN-ToMを評価するための新しいベンチマークである。
身体世界における精神状態の特定の側面をモデル化する上では最先端のLSMが活躍するが、心理学世界におけるキャラクターの精神状態を追跡する際には不足することが明らかとなった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:48:16 GMT)
S4Fusion: Saliency-aware Selective State Space Model for Infrared Visible Image Fusion [17.0] 画像融合のためのS4Fusion(Saliency-aware Selective State Space Fusion Model)を提案する。
S4Fusionは、両方のモダリティからのグローバルな空間情報に焦点を合わせながら、それらの相互作用を促進する。
両方の画像から適切なターゲットを適応的に強調する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:38:42 GMT)
SparseTSF: Modeling Long-term Time Series Forecasting with 1k Parameters [17.0] 本稿では,長期時系列予測(LTSF)のための新しい,極めて軽量なモデルであるSparseTSFを紹介する。
SparseTSFの中心にはCross-Period Sparse Forecasting技術があり、時系列データの周期性と傾向を分離することで予測タスクを単純化する。
SparseTSFは目覚ましい一般化機能を示しており、限られた計算資源、小さなサンプル、低品質のデータを扱うシナリオに適している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:13:37 GMT)
Proof-of-Learning with Incentive Security [16.9] ほとんどの並行ブロックチェーンシステムは、分散コンセンサスとセキュリティ保証のためのProof-of-Work(PoW)あるいはProof-of-Stake(PoS)メカニズムに大きく依存しています。
計算効率,証明可能なインセンティブ-セキュリティ保証,制御容易な難易度を備えたPoL機構を設計する上で,既成の難しさを回避し,合理的なプローバーに率直に行動を促すインセンティブ-セキュリティの概念を導入する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:51:46 GMT)
Challenges in Training PINNs: A Loss Landscape Perspective [16.9] 本稿では,物理インフォームドニューラルネットワーク(PINN)の学習における課題について考察する。
本稿では, PINN損失関数の最小化の難しさについて検討する。
NysNewton-CG(NysNewton-CG)を新たに導入し,PINNの性能を大幅に改善した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:35:42 GMT)
MIM-Refiner: A Contrastive Learning Boost from Intermediate Pre-Trained Representations [16.9] MIM-Refinerは、事前訓練されたMIMモデルの対照的な学習促進である。
我々はMIMモデルの特徴を、サブパーから最先端のオフ・ザ・シェルフ機能まで洗練する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:51:58 GMT)
BioFusionNet: Deep Learning-Based Survival Risk Stratification in ER+ Breast Cancer Through Multifeature and Multimodal Data Fusion [16.8] 画像から得られる特徴を遺伝的・臨床的データと融合して全体像を得る深層学習フレームワークであるBioFusionNetを提案する。
本モデルでは, 平均一致率0.77, 曲線0.84の時間依存領域を達成し, 最先端の手法より優れていた。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:14:12 GMT)
XAI4LLM. Let Machine Learning Models and LLMs Collaborate for Enhanced In-Context Learning in Healthcare [16.8] 多層構造プロンプトを用いたゼロショット/ファウショットインコンテキスト学習(ICL)のための新しい手法を開発した。
また、ユーザと大規模言語モデル(LLM)間の2つのコミュニケーションスタイルの有効性についても検討する。
本研究は,性別バイアスや偽陰性率などの診断精度とリスク要因を系統的に評価する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:23:28 GMT)
Exploring Multi-Timestep Multi-Stage Diffusion Features for Hyperspectral Image Classification [16.7] 拡散に基づくHSI分類法は,手動で選択した単一段階の特徴のみを利用する。
MTMSDと呼ばれる,HSI分類のための多段階多段階拡散機能を初めて検討した,拡散に基づく新しい特徴学習フレームワークを提案する。
提案手法は,HSI分類の最先端手法,特にヒューストン2018データセットより優れている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:50:18 GMT)
ACCO: Accumulate while you Communicate, Hiding Communications in Distributed LLM Training [16.6] 大規模言語モデルの分散学習に適したメモリ効率最適化アルゴリズムを提案する。
本手法は、勾配計算と通信の並列実行に固有の1ステップ遅れを軽減する新しい手法に依存する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:23:45 GMT)
Adapting Conformal Prediction to Distribution Shifts Without Labels [16.5] コンフォーマル予測(CP)により、機械学習モデルは、保証されたカバレッジ率で予測セットを出力できる。
我々の目標は、テストドメインからのラベルなしデータのみを使用して、CP生成予測セットの品質を改善することです。
これは、未ラベルテストデータに対するベースモデルの不確実性に応じてCPのスコア関数を調整する、ECP と EACP と呼ばれる2つの新しい手法によって達成される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:16:02 GMT)
Fundamental Limitations of Alignment in Large Language Models [16.4] 人間と対話する言語モデルを開発する上で重要な側面は、その行動が有用で有害であるように整列することである。
これは通常、望ましい振る舞いを高め、望ましくない振る舞いを抑制する方法でモデルをチューニングすることで達成される。
本研究では,行動予測境界 (BEB) と呼ばれる理論的手法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:19:16 GMT)
ManiCM: Real-time 3D Diffusion Policy via Consistency Model for Robotic Manipulation [16.3] 拡散モデルは自然画像から運動軌道への複雑な分布を生成するのに有効であることが確認されている。
近年の手法では3次元ロボット操作作業において顕著な性能を示すが、複数のデノナイジングステップにより実行時の非効率が悪化している。
拡散過程に一貫性の制約を課すリアルタイムロボット操作モデルManiCMを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:59:23 GMT)
Advancing DRL Agents in Commercial Fighting Games: Training, Integration, and Agent-Human Alignment [16.3] 本稿では,Sh=ukaiという対戦ゲームのための実践的深層強化学習(DRL)エージェントシステムを提案する。
Sh=ukaiは、バランスの取れた能力、一般化可能性、訓練効率を達成するためにヘテロジニアスリーグトレーニング(HELT)を導入することで、一般化性を高めるための状態を定量化する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:39:15 GMT)
Robotic Imitation of Human Actions [16.3] 本研究では,人間を模倣するロボットの課題に対処する,模倣学習の新しいアプローチを提案する。
提案手法では, 実証されたタスクに関する情報を抽象化し, その情報を一般化し, 再現するために利用する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:40:44 GMT)
A Lean Simulation Framework for Stress Testing IoT Cloud Systems [16.0] モノのインターネット(Internet of Things)は、スマートシティ、自動運転車、健康モニタリングなど、さまざまな分野のスマートデバイスを世界中に接続する。
シミュレーションはIoTシステムのテストにおいて重要な役割を果たす。
既存のIoT用のストレステストソリューションは、かなりの計算リソースを必要とするため、不適合でコストがかかる。
クラウドと通信する多数のIoTデバイスとエッジデバイスの効率的なシミュレーションを可能にする,IoTクラウドストレステスト用に設計されたリーンシミュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:20:13 GMT)
MoFormer: Multi-objective Antimicrobial Peptide Generation Based on Conditional Transformer Joint Multi-modal Fusion Descriptor [16.0] AMPの多属性同時最適化のための多目的AMP合成パイプライン(MoFormer)を構築した。
MoFormerは、条件付き制約ときめ細かいマルチディスクリプタによってガイドされる、高度に構造化された潜在空間におけるAMPシーケンスの望ましい属性を改善している。
抗微生物活性の増強と溶血の最小化により,MoFormerは既存の方法よりも優れていた。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:17:18 GMT)
Uni-ISP: Unifying the Learning of ISPs from Multiple Cameras [15.9] 複数のカメラからISPを学習するための新しいパイプラインUni-ISPを提案する。
Uni-ISPは、複数のカメラモデルに正確で汎用的なプロセッサを提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:25:50 GMT)
Causal Discovery with Fewer Conditional Independence Tests [15.9] 我々の研究は、条件付き独立テストの数を減らすことで、基礎となる因果グラフについて何が学べるかを特徴づけることに重点を置いている。
隠れ因果グラフの粗い表現を多数のテストで学習できることを示す。
その結果,本研究では,多数のテストで真の因果グラフを復元するアルゴリズムを初めて提案した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:27:09 GMT)
Estimating Canopy Height at Scale [15.7] 衛星データに基づく世界規模キャノピー高さ推定のためのフレームワークを提案する。
予測と地味ラベルを比較すると、MAE / RMSEは総計2.43/4.73(メートル)、樹高は4.45/6.72(メートル)となる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:53:38 GMT)
II-MMR: Identifying and Improving Multi-modal Multi-hop Reasoning in Visual Question Answering [15.7] VQA(Visual Question Answering)におけるマルチモーダルマルチホップ推論の同定と改善のための新しいアイデアであるII-MMRを提案する。
II-MMRは、画像でVQA質問を受け取り、2つの新しい言語プロンプトを使用して答えに到達するための推論経路を見つける。
II-MMRは、ゼロショット設定と微調整設定の両方において、すべての推論ケースで有効性を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:09:38 GMT)
INSIGHT: End-to-End Neuro-Symbolic Visual Reinforcement Learning with Language Explanations [15.5] 構造化状態と象徴的政策を共同で学習するための枠組みを提案する。
鍵となるアイデアは、ビジョン基礎モデルをスケーラブルな知覚モジュールに蒸留し、ポリシー学習中にそれを洗練することだ。
我々はまた、大きな言語モデルを用いてポリシーや決定のための言語説明を生成するパイプラインを設計する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:50:51 GMT)
GENEVA: GENErating and Visualizing branching narratives using LLMs [15.4] textbfGENEVAはプロトタイプツールで、ストーリーラインの分岐と再収束を伴うリッチな物語グラフを生成する。
textbfGENEVAはゲーム開発、シミュレーション、その他のゲームライクな特性を持つアプリケーションを支援する可能性がある。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:01:51 GMT)
CacheBlend: Fast Large Language Model Serving for RAG with Cached Knowledge Fusion [15.3] 大規模な言語モデル(LLM)は、必要なコンテキストを提供するために、入力に複数のテキストチャンクを組み込むことが多い。
プリフィルを高速化するために、テキストのKVキャッシュをプリコンプリートし、コンテキストが別のLCM入力のプレフィックスとして再利用されるときにKVキャッシュを再使用することができる。
我々は,プリコンパイルされたKVキャッシュをプレフィックスの有無にかかわらず再利用し,トークンの小さなサブセットのKV値を選択的に再計算し,再利用されたKVキャッシュを部分的に更新する方式であるCacheBlendを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:57:57 GMT)
Improving Pseudo Labels with Global-Local Denoising Framework for Cross-lingual Named Entity Recognition [15.3] NERは、ターゲット言語のためのNERモデルをトレーニングすることを目的としている。
言語間NERのためのGlobal-Local Denoising framework(GLoDe)を提案する。
6つのターゲット言語を持つ2つのベンチマークデータセットの実験結果から,提案したGLoDeは最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:29:19 GMT)
The Geometry of Categorical and Hierarchical Concepts in Large Language Models [15.1] この分野の2つの基礎的問題について研究する。
哺乳類」や「鳥」、「レプティル」、「魚」といった分類概念はどのように表現されるのか。
例えば、"dog"が"mammal"エンコードされているという事実は、どのようなものなのでしょう?
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:34:01 GMT)
MOSEAC: Streamlined Variable Time Step Reinforcement Learning [14.8] マルチ目的ソフト・エクササイズ・アクタ・クライブ法(MOSEAC)を提案する。
MOSEACは、トレーニング中のタスク報酬の観測傾向に基づく適応型報酬スキームを特徴とする。
ニュートンのキネマティクス環境におけるシミュレーションによりMOSEAC法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:51:57 GMT)
Finding Lottery Tickets in Vision Models via Data-driven Spectral Foresight Pruning [14.8] 本稿では,スパースネットワークのトレーニングダイナミクスと高密度ネットワークのトレーニングダイナミクスを一致させるアルゴリズムを提案する。
NTKスペクトルにおける通常無視されるデータ依存成分がどのように考慮されるかを示す。
パスeXclusion(PX)は、高頻度でも宝くじを見つけることができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:19:42 GMT)
Cold-start Recommendation by Personalized Embedding Region Elicitation [14.8] 既存のelicitationメソッドは、ユーザの好みを学習するために、固定されたアイテムセットを使用する。
本稿では、この課題を2段階のパーソナライズド・エイコレーション・スキームを用いて解決する。
提案手法では,各サブプロブレムを効率よく実装可能であることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:03:24 GMT)
Self-Calibrating 4D Novel View Synthesis from Monocular Videos Using Gaussian Splatting [14.8] 本稿では,カメラパラメータの自己校正による高忠実度 4D GS シーン表現の学習手法を提案する。
3次元構造を頑健に表現する2次元点特徴の抽出を含む。
その結果,4次元新規ビュー合成における最先端手法の大幅な改善が示された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:52:35 GMT)
AFF-ttention! Affordances and Attention models for Short-Term Object Interaction Anticipation [14.7] 短期的オブジェクトインタラクション予測は、ユーザの目標を理解するためにウェアラブルアシスタントやヒューマンロボットのインタラクションに不可欠である。
我々は2つのコントリビューションでSTA予測の性能を改善した。
まず、フレーム誘導時間プーリング、デュアルイメージ・ビデオアテンション、マルチスケール機能融合を統合した新しいアテンションベースアーキテクチャであるSTAformerを提案する。
第2に、手と物体の軌跡の観測から相互作用ホットスポットを予測し、ホットスポット周辺に局在したSTA予測に対する信頼性を高める。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:57:18 GMT)
SAMformer: Unlocking the Potential of Transformers in Time Series Forecasting with Sharpness-Aware Minimization and Channel-Wise Attention [14.7] 高い表現力にもかかわらず,変換器は真の解に収束することができないことを示す。
シャープネス・アウェア・最適化に最適化された場合, ローカル・ミニマの悪さを回避できる浅層軽量変圧器モデルを提案する。
特にSAMformerは現在の最先端メソッドを超え、最大の基盤モデルであるMOIRAIと同等であり、パラメータは大幅に少ない。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:34:37 GMT)
OASIS: Offsetting Active Reconstruction Attacks in Federated Learning [14.6] Federated Learning(FL)は、ユーザプライバシ保護の可能性に関して、大きな注目を集めている。
近年の研究では、FLプロトコルがアクティブリコンストラクションアタックによって容易に損なわれることが示されている。
本稿では,画像拡張に基づく防御機構を提案し,能動的再建攻撃を効果的に防止する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:02:08 GMT)
PRE: A Peer Review Based Large Language Model Evaluator [14.6] 既存のパラダイムは、LLMの性能を評価するために、人間アノテーションまたはモデルベースの評価器のいずれかに依存している。
ピアレビュープロセスを通じてLLMを自動的に評価できる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:11:13 GMT)
Confidence Under the Hood: An Investigation into the Confidence-Probability Alignment in Large Language Models [14.5] 信頼性・確率アライメントの概念を紹介します。
モデルの内部と信頼感の一致を調査する。
分析したモデルのうち、OpenAIのGPT-4は信頼性と信頼性のアライメントが最強であった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:41:53 GMT)
CFT-Forensics: High-Performance Byzantine Accountability for Crash Fault Tolerant Protocols [14.5] クラッシュフォールトトレラント(CFT)コンセンサスアルゴリズムは、システムコンポーネントが信頼されるシナリオで一般的に使用される。
CFTプロトコルのアカウンタビリティフレームワークであるCFT-Forensicsを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:20:12 GMT)
Position: Cracking the Code of Cascading Disparity Towards Marginalized Communities [14.5] 余分な地域社会への格差は、孤立した関心事ではなく、カスケードされた格差現象の相互接続要素である。
我々は,相互接続の相違が長期的負の結果を引き起こす基礎モデルにおいて,カスケードの影響の独特な脅威を強調した。
我々は、そのソースにおける格差を軽減するために行動を起こす一連の呼び出しで締めくくります。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:52:41 GMT)
Calo-VQ: Vector-Quantized Two-Stage Generative Model in Calorimeter Simulation [14.4] 本稿では,ベクトル量子化変分オートエンコーダ(VQ-VAE)を応用した,カロリー検出器応答の高速シミュレーションのための新しい機械学習手法を提案する。
我々のモデルは2段階生成戦略を採用している: 幾何対応のカロリーメータデータを離散潜在空間に圧縮し、次に列モデルを用いて潜在トークンを学習・生成する。
顕著なことに、我々のモデルはミリ秒以内のカロリーメータシャワーを発生させる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:38:35 GMT)
Accented Text-to-Speech Synthesis with a Conditional Variational Autoencoder [14.3] 本稿では,変分オートエンコーダに基づくアクセント付きテキスト音声合成のための新しいフレームワークを提案する。
選択された話者の声を合成する機能があり、任意のターゲットアクセントに変換される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:01:54 GMT)
Accent Conversion in Text-To-Speech Using Multi-Level VAE and Adversarial Training [14.3] 包括的音声技術は、特定のアクセントを持つ人々のような特定のグループに対する偏見を消すことを目的としている。
本稿では,アクセント付き音声合成と変換に逆学習を用いたマルチレベル変分オートエンコーダを用いたTSモデルを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:56:02 GMT)
Differentiable Task Graph Learning: Procedural Activity Representation and Online Mistake Detection from Egocentric Videos [14.0] 手続き的活動は、特定の目標を達成するための重要なステップのシーケンスである。
タスクグラフは、手続き的活動の人間的に理解可能な表現として現れてきた。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:11:39 GMT)
SAVA: Scalable Learning-Agnostic Data Valuation [13.7] 大規模でWebスクラッドな実際のデータセットには、個々のデータポイントの品質と関連性に影響を与えるノイズの多いアーティファクトが含まれている。
我々は、この問題をデータ評価タスクとして定式化し、クリーンでキュレートされた検証セットの類似性や相似性に応じて、トレーニングセット内のデータポイントに値を割り当てる。
LAVAの変種であるSAVAを提案し,その計算をデータポイントのバッチ上で行う。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:17:35 GMT)
On the Expressivity of Persistent Homology in Graph Learning [13.6] 計算トポロジのテクニックである永続化ホモロジーは、最近、グラフ分類の文脈において、強い経験的性能を示した。
本稿では、グラフの文脈における永続的ホモロジーの簡単な紹介と、グラフ学習タスクにおけるその表現性に関する理論的議論と実証分析について述べる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:20:31 GMT)
Stochastic Optimal Control for Diffusion Bridges in Function Spaces [13.5] 無限次元空間に合わせた最適制御の理論を提案する。
我々は、Doob の $h$-transform が SOC の観点から導出され、無限次元に拡張されることを示す。
2つの無限次元分布間のブリッジの学習と、無限次元分布からの標本化のための生成モデルを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:11:45 GMT)
Less is More: Pseudo-Label Filtering for Continual Test-Time Adaptation [13.5] 連続的テスト時間適応(CTTA)は、ソースデータにアクセスすることなく、テストフェーズ中に対象ドメインのシーケンスに事前訓練されたモデルを適用することを目的としている。
既存の方法は、すべてのサンプルに対して擬似ラベルを構築し、自己学習を通じてモデルを更新することに依存している。
擬似ラベルの品質を向上させるために擬似ラベルフィルタ(PLF)を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:09:36 GMT)
$Δ$-DiT: A Training-Free Acceleration Method Tailored for Diffusion Transformers [13.4] トレーニング不要な推論アクセラレーションフレームワークであるDelta$-DiTを提案する。
$Delta$-DiTは、設計されたキャッシュ機構を使用して、初期サンプリングステージの後方DiTブロックと後期ステージの前方DiTブロックを高速化する。
PIXART-$alpha$とDiT-XLの実験は、$Delta$-DiTが20ステップ世代で1.6倍のスピードアップを達成できることを示した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:10:44 GMT)
Unsupervised Distractor Generation via Large Language Model Distilling and Counterfactual Contrastive Decoding [13.3] Distractor Generation (DG) は、読者を混乱させるいくつかの誤ったオプションを生成することを目的としている。
従来のDGの監督手法は、高価な人間の注釈付きイントラクタラベルに大きく依存している。
本稿では,大規模言語モデル(LLM)を費用対効果アノテータとして活用する,教師なしのDGフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:20:05 GMT)
The Topology and Geometry of Neural Representations [13.1] 神経科学における中心的な問題は、知覚的および認知的内容の脳表現をどう特徴付けるかである。
従来の研究は、その表現幾何学によって脳の表現を特徴づけてきた。
本稿では,表現類似性分析の拡張であるトポロジカル表現類似性解析(tRSA)を提案する。
シミュレーションとfMRIデータの両方を用いて、モデル選択の感度と特異性の観点から、この新しい統計群を評価する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:22:24 GMT)
Beyond prompt brittleness: Evaluating the reliability and consistency of political worldviews in LLMs [13.0] 政治声明に対する大規模言語モデルの姿勢の信頼性と整合性を評価するための一連のテストを提案する。
本研究では, 7B から 70B までの大きさの LLM について検討し, パラメータ数によって信頼性が向上することを確認した。
より大きなモデルは、左派政党との全体的な整合性を示すが、政策プログラムによって異なる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:25:08 GMT)
Demystifying SGD with Doubly Stochastic Gradients [13.0] 一般条件下では、独立なミニバッチとランダムリシャッフルを併用した2重SGDの収束特性を確立する。
ランダムリシャッフルによりサブサンプリングノイズの複雑性依存性が向上することが証明された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:13:19 GMT)
Helix: Distributed Serving of Large Language Models via Max-Flow on Heterogeneous GPUs [12.8] 本稿では,異種GPUクラスタ上で動作する高レイテンシ,低スループット大言語モデル(LLM)の分散システムであるHelixを紹介する。
We showed that Helix improves service throughput to up 2.7$times$ and reduces prompting and decoding latency to up 2.8$times$ and 1.3$times$。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:47:53 GMT)
Equivariant Machine Learning on Graphs with Nonlinear Spectral Filters [12.7] グラフ汎函数シフトを対称性群、つまりグラフシフト作用素と可換なユニタリ作用素と考える。
グラフ関数シフトに完全同値な非線形スペクトルフィルタ(NLSF)を提案する。
ノードおよびグラフ分類ベンチマークにおいて、既存のスペクトルGNNよりもNLSFの方が優れた性能を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:07:01 GMT)
It Takes Two: A Peer-Prediction Solution for Blockchain Verifier's Dilemma [12.7] 不正行為の少ない、あるいはまったくないセキュアなブロックチェーンシステムでは、検証担当者がコストのかかる検証を正直に実行する十分なインセンティブが得られなかった。
ブロックチェーンおよび潜在的に分散化されたシステムのセキュリティと堅牢性を向上する検証メカニズムのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:21:17 GMT)
Are Language Models More Like Libraries or Like Librarians? Bibliotechnism, the Novel Reference Problem, and the Attitudes of LLMs [12.6] ビブリオテクニズムは, LLMが新たな参照を生み出す事例から, 独立した課題に直面している。
心の哲学における解釈主義によれば、システムがそのような態度を持つのは、その振る舞いがそれが可能であるという仮説によって十分に説明されている場合に限る。
しかし、我々は、解釈主義は態度を持つ非常に単純な生き物と互換性があり、これらの態度を前提とする見解には意識、知覚、知性が必要であると強調する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:01:06 GMT)
CLEAN-EVAL: Clean Evaluation on Contaminated Large Language Models [12.4] clean-Evalは、データ汚染の問題を緩和し、よりクリーンな方法でモデルを評価する。
clean-Eval は LLM を使用して、汚染されたデータを候補セットに逆変換する。
次にセマンティック検出器を使用して、生成された低品質サンプルをフィルタリングする。
ベスト候補は最終的にBLEURTスコアに基づいてこのセットから選択される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:06:55 GMT)
Boosting Vision-Language Models with Transduction [12.3] 本稿では,視覚言語モデルのための新しい,計算効率の良いトランスダクティブアプローチであるTransCLIPを提案する。
TransCLIPは、一般的なinductive zero- and few-shotモデルの上に、プラグイン・アンド・プレイモジュールとして適用することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:09:30 GMT)
Conditional Denoising Diffusion Probabilistic Models for Data Reconstruction Enhancement in Wireless Communications [12.2] 無線チャネル上でのデータ伝送と再構成を強化するために,条件付き拡散確率モデル(DDPM)を提案する。
これに触発された鍵となる考え方は、情報信号の「ノイズからクリーン」変換を学ぶ際に、拡散モデルの生成的先行性を活用することである。
提案手法は,情報内容の事前知識が利用可能な通信シナリオに有効である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:17:01 GMT)
SyntaxShap: Syntax-aware Explainability Method for Text Generation [12.1] 本稿では,テキスト生成のためのモデルに依存しない説明可能性手法であるSyntaxShapを紹介する。
本手法は,自己回帰モデルによる予測に対するより忠実で一貫性のある説明を構築する上で有効であることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:30:00 GMT)
Generalized Jersey Number Recognition Using Multi-task Learning With Orientation-guided Weight Refinement [12.1] ジャージー番号認識(JNR)はスポーツ分析において常に重要な課題である。
近年の研究では、数値ローカライゼーションと光学的文字認識を用いてこの問題に対処している。
本稿では,人体方向の角度と数字の手がかりを組み合わせた多タスク学習手法であるアングル・ディジット・スキーム(ADRS)を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:35:11 GMT)
Not Just Pretty Pictures: Toward Interventional Data Augmentation Using Text-to-Image Generators [12.1] このような環境要因に対する任意の介入をシミュレートするために、現代のT2Iジェネレータがどのように使用できるかを示す。
我々の経験的発見は、安定拡散のような現代のT2Iジェネレータが、強力な介入データ拡張メカニズムとして実際に使用できることを示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:26:07 GMT)
Online Algorithms with Uncertainty-Quantified Predictions [12.0] オンラインアルゴリズムの設計における不確実性定量化予測を最適に活用する問題について検討する。
特に,スキーレンタルとオンライン検索の2つの古典的オンライン問題について検討した。
我々は、UQ予測を完全に活用するために、アルゴリズム設計への非自明な修正が必要であることを実証する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:55:09 GMT)
Nuclear Medicine Artificial Intelligence in Action: The Bethesda Report (AI Summit 2024) [11.9] 第2回SNMMI人工知能サミット(第2回SNMMI AI Summit)は2024年2月29日から3月1日にかけて、MDのベセスダで開催された。
さまざまなコミュニティメンバとステークホルダーをまとめて、サミットのテーマは「AI in Action」だった。
i)AIタスクフォースの事前及び進行中の取り組みの概要、(ii)計算核腫瘍学の新たなニーズとツール、(iii)大規模言語と生成モデルにおける新たなフロンティア、(iv)核医学におけるAIの利用価値提案の定義、(v)データとモデルリポジトリの取り組みを含むオープンサイエンス、(vi)問題。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:54:38 GMT)
Balanced Data, Imbalanced Spectra: Unveiling Class Disparities with Spectral Imbalance [11.9] クラス格差の潜在的な源として,特徴量におけるスペクトル不均衡の概念を導入する。
高次元混合モデル設定におけるクラスごとの誤差の正確な式を導出する。
我々はこの現象を11種類の最先端事前訓練エンコーダで研究した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:09:10 GMT)
Ferromagnetic semimetal and charge-density wave phases of interacting electrons in a honeycomb moiré potential [11.9] 準充填時のハニカムモワール格子上の二次元電子ガスについて検討した。
モワールポテンシャルの増大に伴い、系は常磁性金属から遍歴強磁性半金属へと遷移する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:19:38 GMT)
VQPy: An Object-Oriented Approach to Modern Video Analytics [11.8] ビデオ分析は、現代のビデオシステムやサービスで広く使われている。
ビデオ分析のためのオブジェクト指向Pythonアプローチを開発した。
ビデオオブジェクトは従来のオブジェクト指向言語によってモデル化されている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:36:36 GMT)
SPEAR:Exact Gradient Inversion of Batches in Federated Learning [11.8] フェデレーション・ラーニング(Federated Learning)は、クライアントがサーバとプライベートデータを共有するのではなく、勾配更新のみを共有する機械学習のフレームワークである。
本研究では,バッチ全体を正確に$b > 1$で再構築する最初のアルゴリズムであるSPEARを提案する。
我々は,大規模ネットワークへのスケーリング中に,最大$b以下の25ドルのバッチで高次元イメージネット入力を復元することを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:55:44 GMT)
A Pixel Is Worth More Than One 3D Gaussians in Single-View 3D Reconstruction [11.7] シングルビュー画像から3Dシーン表現を学習することは、コンピュータビジョンにおける長年の根本的な問題である。
本稿では,1つの画素が1つ以上の3次元ガウス値を持つ階層型スプラッター画像法を提案する。
提案手法は,ShapeNet-SRNおよびCO3Dデータセットを用いて,最先端の性能を検証した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:13:55 GMT)
Annotation Guidelines-Based Knowledge Augmentation: Towards Enhancing Large Language Models for Educational Text Classification [11.7] 大規模言語モデル(LLM)を改善するためのガイドラインベース知識拡張(AGKA)アプローチを提案する。
AGKAはGPT 4.0を使用して、アノテーションガイドラインからラベル定義の知識を取得し、ランダムアンダーサンプラーを適用していくつかの典型的な例を選択する。
実験の結果、AGKAは非微調整LDM(特にGPT 4.0とLlama 3 70B)を増強できることが示された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:09:01 GMT)
Seeing the Forest through the Trees: Data Leakage from Partial Transformer Gradients [11.7] 1つのTransformer層からの勾配、あるいは0.54%のパラメータを持つ1つの線形コンポーネントでさえ、データの漏洩のトレーニングに影響を受けやすい。
トレーニング中の勾配に対する差分プライバシーの適用は、データ開示の新たな脆弱性に対する限定的な保護を提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:15:04 GMT)
Tiny Time Mixers (TTMs): Fast Pre-trained Models for Enhanced Zero/Few-Shot Forecasting of Multivariate Time Series [11.6] 本稿では,効率的な伝達学習機能を備えたコンパクトモデルであるTiny Time Mixers (TTM)を紹介する。
TTMは軽量なTSMixerアーキテクチャに基づいて、適応パッチ、多様な解像度サンプリング、解像度プレフィックスチューニングなどのイノベーションを取り入れている。
TTMは、ゼロ/フェーショット予測(4-40%)で既存のベンチマークより優れており、計算要求を大幅に削減している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:57:22 GMT)
CUT: A Controllable, Universal, and Training-Free Visual Anomaly Generation Framework [11.6] 我々は、制御可能、ユニバーサル、およびトレーニング不要な視覚異常生成フレームワークであるCUTを提案する。
不可視データと新規な異常型の両方にわたって,制御可能かつ現実的な異常生成を実現する。
生成した異常サンプルを用いてVLADモデルをトレーニングすることにより、複数のベンチマーク異常検出タスクで最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:58:09 GMT)
Hierarchical Tree-structured Knowledge Graph For Academic Insight Survey [11.6] 調査は、研究トレーニングを欠いている初心者研究者にとって、常に課題となっている。
本研究は,階層的な木構造知識グラフを確立することにより,初心者研究者を対象とした研究インサイトサーベイを支援することを目的とする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:48:19 GMT)
OpenRLHF: An Easy-to-use, Scalable and High-performance RLHF Framework [11.6] 提案するOpenRLHFは,効率的なRLHFスケーリングを実現するオープンソースフレームワークである。
OpenRLHFは、Ray、vLLM、DeepSpeedを使用して70Bパラメータを超えるモデルのスケジューリングを再設計する。
Hugging Faceとシームレスに統合されたOpenRLHFは、最適化されたアルゴリズムとローンチスクリプトを備えたアウトオブボックスソリューションを提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:19:18 GMT)
Uplift Modeling Under Limited Supervision [11.5] 電子商取引における因果効果の推定には、大規模な環境では実用的でないような費用がかかる傾向がある。
電子商取引データに共通するグラフに依存して,必要なトレーニングセットのサイズを小さくするグラフニューラルネットワークを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:49:20 GMT)
Strengthened Symbol Binding Makes Large Language Models Reliable Multiple-Choice Selectors [11.5] 大規模言語モデル(LLM)研究における重要な研究領域として,MCQ(Multiple-Choice Questions)があげられる。
我々は、ポイントワイド・インテリジェント・フィードバック(PIF)と呼ばれるMCQのための効率的なスーパーバイザード・ファインチューニングアルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:20:12 GMT)
Learning Decision Trees and Forests with Algorithmic Recourse [11.4] Algorithmic Recourse(AR)は、モデルによって与えられる望ましくない予測結果を変更するためのリコースアクションを提供することを目的としている。
我々は、できるだけ多くの事例に対して合理的な行動の存在を保証するという制約の下で、正確な分類木を学習するタスクを定式化する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:33:42 GMT)
Rethinking Efficient and Effective Point-based Networks for Event Camera Classification and Regression: EventMamba [11.4] イベントカメラは、最小限の電力を消費しながら、低レイテンシで高ダイナミックレンジで環境光の変化を効率的に検出する。
イベントデータを処理する現在のアプローチでは、フレームベースの表現に変換することが多い。
Point Cloudは3D処理の一般的な表現であり、イベントカメラのスパースと非同期性に適合するのに適している。
提案するEventMambaは,最先端(SOTA)のフレームベース手法と比較しても,競合的な結果が得られる,効率的かつ効果的なPoint Cloudフレームワークである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:59:51 GMT)
Probing Language Models for Pre-training Data Detection [11.4] 本稿では,モデルの内部アクティベーションを調べることで,事前学習データ検出のための探索手法を提案する。
我々の手法はシンプルで効果的であり、より信頼性の高い事前学習データ検出につながる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:58:04 GMT)
EffiQA: Efficient Question-Answering with Strategic Multi-Model Collaboration on Knowledge Graphs [11.3] EffiQAは、グローバルプランニング、効率的なKG探査、自己回帰という3つの段階で構成されている。
複数のKBQAベンチマークに関する実証的な証拠は、EffiQAの有効性を示している。
提案された新しいフレームワークが、効率的で知識集約的なクエリの道を開くことを期待しています。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:56:07 GMT)
Overcoming Saturation in Density Ratio Estimation by Iterated Regularization [11.2] 密度比推定のためのカーネル手法のクラスが誤差飽和に悩まされていることを示す。
高速な誤差率を達成するために, 密度比推定における繰り返し正規化を導入する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:40:32 GMT)
UP4LS: User Profile Constructed by Multiple Attributes for Enhancing Linguistic Steganalysis [11.1] 既存のLSメソッドは、ユニークなユーザ特性を見落とし、ソーシャルネットワークのパフォーマンスが低下する。
本稿では,現実的なシナリオでLSを拡張するためのユーザプロファイルを備えたフレームワークであるUP4LSを提案する。
実験により、UP4LSは現実シナリオにおけるLSタスクベースラインの性能を大幅に向上させることができることが示された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:42:15 GMT)
From Feature Visualization to Visual Circuits: Effect of Adversarial Model Manipulation [11.1] 本稿では,ProxPulseをベースとした新たな攻撃手法を提案する。
これらの攻撃の有効性は、ImageNet上でトレーニング済みのAlexNetとResNet-50モデルを使用して検証される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:32:39 GMT)
Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles [11.0] ゼロサムゲームを解決するための一般的なアプローチは、Nash Equilibrium (NE) を近似するポリシーの集団を維持することである。
政策空間対応 Oracleは、そのようなゲームを解くための効果的なマルチエージェント強化学習フレームワークである。
BRの近似を改善するためにポリシーを初期化するためにポリシー融合を利用するFusion-PSROを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:43:51 GMT)
The Effectiveness of a Simplified Model Structure for Crowd Counting [11.0] 本稿では,単純な構造のみを用いて,高性能なクラウドカウントモデルを構築する方法について論じる。
本稿では,バックボーンネットワークとマルチスケール機能融合構造のみからなる,そのシンプルで効率的な構造を特徴とするFuss-Free Network(FFNet)を提案する。
提案するクラウドカウントモデルは,広く使用されている4つの公開データセットに対してトレーニングおよび評価を行い,既存の複雑なモデルに匹敵する精度を実現する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:02:52 GMT)
ProtoGate: Prototype-based Neural Networks with Global-to-local Feature Selection for Tabular Biomedical Data [10.9] 本稿では,HDLSSデータの特徴選択のためのプロトタイプベースニューラルモデルProtoGateを提案する。
ProtoGateはグローバルとローカルの機能選択を適応的にバランスすることで、インスタンスワイズ機能を選択する。
ProtoGateは、非パラメトリックなプロトタイプベースの予測メカニズムを使用して、協調適応問題に対処する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:09:10 GMT)
Faster Diffusion-based Sampling with Randomized Midpoints: Sequential and Parallel [10.8] シェンとリーに触発された拡散モデルに対する新しい離散化手法を提案する。
我々のアルゴリズムは、$widetilde O(log2 d)$ parallel roundsでのみ実行できるように並列化可能であることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:34:34 GMT)
An Equivalence Between Static and Dynamic Regret Minimization [10.8] 本研究では, 動的後悔最小化は, 拡張決定空間における静的後悔最小化と等価であることを示す。
R_T(u_1,dots,u_T)le tilde Oという形の動的後悔を保証するアルゴリズムを提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:54:58 GMT)
Favi-Score: A Measure for Favoritism in Automated Preference Ratings for Generative AI Evaluation [10.8] 選好指標に好意の形式的定義を導入する。
最終システムランキングの誤差に好意が強く関係していることが示される。
そこで本稿では,手話の精度と好ましさの両面から,嗜好に基づく指標を評価することを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:20:46 GMT)
Subtle Biases Need Subtler Measures: Dual Metrics for Evaluating Representative and Affinity Bias in Large Language Models [10.7] 本研究は,Large Language Models (LLMs) における2つのバイアス,代表バイアスと親和性バイアスに対処する。
我々は,これらのバイアスを測定するために,代表バイアススコア(RBS)と親和性バイアススコア(ABS)の2つの新しい指標を導入する。
我々の分析では、白人、ストレート、男性と関連する身元を選好する著名なLSMにおいて、顕著な偏見が明らかとなった。
親和性バイアスによる各モデルにおける特徴的評価パターンの解明
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:43:16 GMT)
Towards Faithful and Robust LLM Specialists for Evidence-Based Question-Answering [10.6] 我々は、ソースの品質向上と属性応答性向上のために、LLM(Large Language Models)を頑健に微調整する方法について検討する。
具体的には、自動データ品質フィルタを備えたデータ生成パイプラインを導入し、多様な高品質なトレーニングおよびテストデータを大規模に合成する。
総合評価の結果, 合成データの微調整により, 内分布と外分布の両方の性能が向上することがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:48:59 GMT)
Stratified Avatar Generation from Sparse Observations [10.3] AR/VRデバイスから3Dフルボディアバターを推定することは、没入感のある体験を生み出す上で不可欠である。
本稿では,Skinned Multi-Person Linear (SMPL)モデルで定義されたキネマティックツリーの性質に着想を得た。
本研究では,従来のフルボディアバター再建パイプラインを2段階に分離する階層化手法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:36:47 GMT)
Constrained Exploration via Reflected Replica Exchange Stochastic Gradient Langevin Dynamics [10.3] ReSGLDは、大規模データセットの非二乗学習タスクに有効なツールである。
制約付きマルチモーダル分布と画像分類におけるシミュレーション効率の役割について検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:48:52 GMT)
PAC-Bayesian Generalization Bounds for Knowledge Graph Representation Learning [10.2] 知識グラフ表現学習法における最初のPAC-Bayesian一般化境界について述べる。
一般化境界における重要な要素は、3つの実世界の知識グラフ上での実際の一般化誤差を説明することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:27:59 GMT)
Transductive Sample Complexities Are Compact [10.2] 一般の損失関数を用いた教師あり学習において, 広範に保持されるコンパクト性結果を示す。
不適切な計量損失を伴う実現可能な学習のために、サンプルの複雑さの正確なコンパクトさは失敗する可能性があることを示す。
我々は、無知の場合においてより大きなギャップが可能であると推測する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:23:32 GMT)
Beyond Ensemble Averages: Leveraging Climate Model Ensembles for Subseasonal Forecasting [10.1] 本研究では,機械学習モデル(ML)を時系列予測のための後処理ツールとして応用することを検討した。
相対湿度, 海面圧力, 地電位高さなど, タグ付き数値アンサンブル予測および観測データをML法に取り入れた。
回帰、量子レグレッション、tercile 分類タスクでは、線形モデル、ランダムフォレスト、畳み込みニューラルネットワーク、および積み重ねモデルを用いて検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:19:45 GMT)
Aligner: Efficient Alignment by Learning to Correct [10.1] Alignerはモデルに依存しないプラグイン・アンド・プレイモジュールで、小さなモデルを用いて好ましくない解と好ましくない解の補正残差を学習する。
トレーニングはワンオフで、さまざまなオープンソースおよびAPIベースのモデルに適用できるため、迅速なイテレーションに適している。
実験では、11の異なる言語モデルに同じAlignerモデルをデプロイすることで、パフォーマンスの向上を実証した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:33:45 GMT)
LLEMamba: Low-Light Enhancement via Relighting-Guided Mamba with Deep Unfolding Network [10.0] 深部展開ネットワーク(LLEMamba)を用いた照明誘導型マンバによる新しい低照度化手法を提案する。
我々のLLEMambaは、まず、深く展開するネットワークに乗算器の交互方向法(ADMM)に基づく反復最適化過程を組み込んだ、深い事前を持つRetinexモデルを構築した。
Transformerとは異なり、複数のイテレーションで深層展開フレームワークを支援するため、LLEMambaは計算複雑性の低い新しいMambaアーキテクチャを導入した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:23:28 GMT)
Participatory Approaches in AI Development and Governance: Case Studies [9.8] 本稿では、AI開発と展開への参加的アプローチの価値に関する2部シリーズの第2部を構成する。
最初の論文は、この2つの演習で参加的手法を展開するための、原則と実践的な正当化を考案した。
本稿では、これらの予備的な結論を、法と秩序の覚醒における顔認識技術の使用と、医療分野における大規模言語モデルの使用の2つの分野で検証する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:10:23 GMT)
Logical Reasoning with Relation Network for Inductive Knowledge Graph Completion [9.8] 帰納的KG完了のための新しいiNfOmax RelAtion Network(NORAN)を提案する。
我々のフレームワークは最先端のKGC手法よりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:30:43 GMT)
CYCLO: Cyclic Graph Transformer Approach to Multi-Object Relationship Modeling in Aerial Videos [9.8] 本研究では,空中ビデオにおける多目的関係モデリングに焦点を当てた新しいAeroEyeデータセットを提案する。
本稿では,Cyclic Graph Transformer (CYCLO) アプローチを提案する。
また、提案手法により、固有巡回パターンでシーケンスを処理し、オブジェクト関係を正しい順序で処理することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:24:55 GMT)
L-MAGIC: Language Model Assisted Generation of Images with Coherence [9.7] 単一入力画像からパノラマシーンを生成する新しい手法であるL-MAGICを提案する。
L-MAGICは、微調整なしで事前訓練された拡散と言語モデルを利用し、ゼロショット性能を保証する。
結果として得られたパノラマシーンは、人間の評価において70%以上の選好で、関連する作品と比較して、シーンレイアウトと視点表示の質が向上している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:28:57 GMT)
Distributionally Robust Variational Quantum Algorithms with Shifted Noise [9.7] 本稿では、変分量子アルゴリズム(VQA)を未知のシフトノイズに対して頑健に最適化する方法を示す。
この研究は、シフトノイズの影響を受け、VQAの信頼性を向上させるための最初のステップである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:34:17 GMT)
Machine Learning with Confidential Computing: A Systematization of Knowledge [9.6] 機械学習(ML)におけるプライバシとセキュリティの課題は、MLの広範な開発と、最近の大規模な攻撃面のデモとともに、ますます深刻になっている。
成熟したシステム指向のアプローチとして、Confidential Computingは、さまざまなMLシナリオにおけるプライバシとセキュリティの問題を軽減するために、学術と産業の両方で使用されている。
機密性保証とii)整合性保証を提供する機密コンピューティング支援ML技術に関する先行研究を体系化し、それらの高度な特徴と欠点について論じる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:48:59 GMT)
Enhancing Inertial Hand based HAR through Joint Representation of Language, Pose and Synthetic IMUs [9.6] 我々は,制限データの問題に対処するために,新しいマルチモーダル,マルチタスク,コントラストベースのフレームワークアプローチであるMulti$3$Netを提案する。
本手法はウェアラブルHAR性能の向上,特に微妙な活動の認識を目的としている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:28:42 GMT)
Deep Optimal Transport for Domain Adaptation on SPD Manifolds [9.6] ニューロイメージングデータは、対称性と正の定性という数学的性質を持っている。
従来の領域適応法の適用は、これらの数学的性質が破壊される可能性があるため、困難である。
本稿では,境界分布と条件分布の差分を管理するための幾何学的深層学習に基づく新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:51:23 GMT)
BMRS: Bayesian Model Reduction for Structured Pruning [9.5] 構造化プルーニングの完全エンドツーエンドベイズ手法を提案する。
BMRSは、ニューラルネットワークの構造的プルーニングに対する理論的に基礎的なアプローチを提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:08:04 GMT)
Model Editing by Standard Fine-Tuning [9.3] 標準的な微調整だけで2つの小さな修正を加えて、競合するモデル編集性能が得られることを示す。
まず、全確率ではなく条件付き確率を最適化する。
第二に、ランダムに言い換えられた編集プロンプトの訓練が一般化を促進するのに加え、ランダムまたは類似の未編集事実を訓練して局所性を奨励する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:39:10 GMT)
Constraint-Aware Diffusion Models for Trajectory Optimization [9.3] 本稿では,軌道最適化のための制約対応拡散モデルを提案する。
拡散サンプルの制約違反を最小限に抑える訓練用ハイブリッド損失関数を提案する。
本モデルでは, テーブルトップ操作と2台のリーチ回避問題について検討した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:53:20 GMT)
Participatory Approaches in AI Development and Governance: A Principled Approach [9.3] 本稿は、AIにおける参加型ガバナンスに関する2部構成のシリーズの第1部を構成する。
より責任があり、安全で、人間中心のAIシステムを構築し、使用するために、参加型アプローチが有益である、という前提を推し進めている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:49:42 GMT)
Achieving Sparse Activation in Small Language Models [9.1] スパースアクティベーション(sparse activation)は、再訓練や適応をすることなく、LLM(Large Language Models)の計算コストを削減できる手法である。
本稿では,小言語モデル(SLM)におけるスパースアクティベーションの実現を目指す。
まず, ニューロンの出力大小をベースとしたLLMのスパース活性化スキームはSLMには適用できないことを示し, その属性スコアに基づいてニューロンを活性化することがよりよい選択肢であることを示した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:21:49 GMT)
Accelerating Graph Neural Networks via Edge Pruning for Power Allocation in Wireless Networks [9.0] グラフニューラルネットワーク(GNN)は、無線ネットワークにおける電力割り当て問題に対処するための有望なアプローチとして登場した。
我々は,GNNの時間的複雑さを低減するために,近隣のしきい値を用いたアプローチを導入する。
以上の結果から,提案したN-GNNは,高い性能と一般化能力を維持しつつ,時間的複雑性を低減できるという利点があることがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:06:52 GMT)
Semi-supervised Contrastive Learning Using Partial Label Information [9.0] 半教師付き学習では、ラベルなし例からの情報はラベル付き例から学習したモデルを改善するために使用される。
いくつかの学習問題では、ラベルの情報をラベルのない例から推測し、モデルをさらに改善するために使用することができる。
最新かつ最先端のMixMatchメソッドにNullspace Tuningを追加することで,テストエラーを最大1.8倍に削減できることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:59:41 GMT)
Are AI-Generated Text Detectors Robust to Adversarial Perturbations? [9.0] AI生成テキスト(AIGT)の現在の検出器は、敵の摂動に対する堅牢性を欠いている。
本稿では,既存のAIGT検出手法の堅牢性について検討し,新しい検出器であるシームズキャリブレーション・リコンストラクション・ネットワーク(SCRN)を導入する。
SCRNは、テキストからのノイズの追加と除去に再構成ネットワークを使用し、局所的な摂動に対して堅牢な意味表現を抽出する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:21:48 GMT)
The Role of Learning Algorithms in Collective Action [9.0] 本研究では,学習アルゴリズムの特性に大きく依存していることを示す。
このことは、機械学習における集団行動の影響を研究する際に、学習アルゴリズムを考慮に入れる必要性を強調している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:27:03 GMT)
Scalable Wasserstein Gradient Flow for Generative Modeling through Unbalanced Optimal Transport [8.9] 半二重JKO(S-JKO)と呼ばれるスケーラブルなWGFベースの生成モデルを導入する。
我々のモデルは、JKOステップと不均衡最適輸送の等価性から導かれるJKOステップの半二重形式に基づいている。
我々のモデルは既存のWGFベースの生成モデルよりも大幅に優れていることを実証する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:12:13 GMT)
Efficient and Generalizable Certified Unlearning: A Hessian-free Recollection Approach [8.9] 機械学習は、特定のデータを選択的に忘れることを可能にして、データ所有者の権利を忘れないように努力する。
我々は,ベクトル加算操作のみを必要とするため,ほぼ瞬時に未学習を実現するアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:35:12 GMT)
Iterated INLA for State and Parameter Estimation in Nonlinear Dynamical Systems [8.8] 本稿では,動的モデルの反復線形化に基づくDAの代替手法を提案する。
これにより、各イテレーションでガウスマルコフランダムフィールドを生成し、INLAを使って状態とパラメータを推測することができる。
本手法は,解釈可能性を維持しながら任意の非線形システムに利用することができ,さらにDAタスクにおける既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:08:30 GMT)
Illicit Promotion on Twitter [8.8] Twitterプラットフォーム上では、不正プロモーション(PIP)の投稿が1200万件報告されている。
また、PIPを発行する580万のTwitterアカウントと、PIPに埋め込まれた37万の異なるインスタントメッセージング(IM)アカウントも観察されている。
一方、Twitterはコンテンツモデレーションを継続的に行うことが観察されており、投稿後6ヶ月でほぼ80%のPIPが徐々に公開されなくなる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:24:40 GMT)
Online Optimization Perspective on First-Order and Zero-Order Decentralized Nonsmooth Nonconvex Stochastic Optimization [8.7] 分散環境下での非平滑な非平滑な目的に対する(delta,,ilon$)-定常点の有限時間解析について検討する。
$Oは分散非滑らかな最適化のための最初の有限時間保証である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:09:34 GMT)
Multi-Agent Transfer Learning via Temporal Contrastive Learning [8.5] 本稿では,深層多エージェント強化学習のための新しい伝達学習フレームワークを提案する。
このアプローチは、ゴール条件付きポリシーと時間的コントラスト学習を自動的に組み合わせて、意味のあるサブゴールを発見する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:42:14 GMT)
Loss Symmetry and Noise Equilibrium of Stochastic Gradient Descent [8.3] 連続対称性の幅広いサブクラスである指数対称性が損失関数に存在するとき、勾配降下(SGD)の学習力学を特徴付ける。
損失関数の定数方向における特別な固定点は、SGDの解の候補として現れる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:49:41 GMT)
Tilting the Odds at the Lottery: the Interplay of Overparameterisation and Curricula in Neural Networks [8.3] カリキュラム学習が深層学習にはほとんど役に立たないことを示す。
特に,XOR-like Gaussian Mixture 問題における2層ネットワークのオンライン学習環境における相互作用について検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:59:33 GMT)
CE-NAS: An End-to-End Carbon-Efficient Neural Architecture Search Framework [8.3] 本研究は,モデル設計プロセスにおける炭素効率の向上を目的とした,ニューラルアーキテクチャ探索(NAS)に対する新しいアプローチを提案する。
提案したフレームワークCE-NASは、NASアルゴリズムのエネルギーの炭素放出変化とエネルギー差を探索することにより、NASに関連する高炭素コストの鍵となる課題に対処する。
NASタスクとオープンドメインNASタスクのSOTA結果を達成しつつ, CE-NASの炭素排出量低減効果を実証した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:13:21 GMT)
DDA: Dimensionality Driven Augmentation Search for Contrastive Learning in Laparoscopic Surgery [8.2] DDA(Diality Driven Augmentation Search)と呼ばれる新しい手法により,適切な拡張ポリシーの検索を自動化する。
腹腔鏡下手術におけるDDAの有用性と有効性を示すとともに,適切なデータ拡張ポリシーの確立に成功している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 00:30:23 GMT)
What Is Fairness? On the Role of Protected Attributes and Fictitious Worlds [8.2] フェアネス対応機械学習(fairML)における文献の増大は、自動意思決定(ADM)における機械学習(ML)に関連する不公平性を緩和することを目的としている。
しかしながら、フェアネスの概念の根底にある概念は、何世紀にもわたって哲学的な議論と、MLコミュニティにおけるこの概念の最近の採用との間に大きなギャップを残している、ほとんど議論されない。
公平性という一貫した概念を定式化し、哲学的考察をADMシステムにおけるMLモデルのトレーニングと評価のための形式的枠組みに変換することにより、このギャップを埋めようとしている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:02:04 GMT)
A New Robust Partial $p$-Wasserstein-Based Metric for Comparing Distributions [8.2] 我々は,部分的な2ドルワッサーシュタイン距離の計算に基づく$k$-RPWと呼ばれる,$k ge 0$でパラメータ化された新しい距離の族を導入する。
我々の距離関数は、1ドルのWasserstein、2ドルのWasserstein、およびノイズの多い実世界のデータセット上の画像検索タスクのTV距離と比較して精度が高い。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:50:35 GMT)
Mixing Classifiers to Alleviate the Accuracy-Robustness Trade-Off [8.2] 本稿では、標準ニューラルネットワークとロバストニューラルネットワークの出力確率を混合した理論的動機付け型定式化を提案する。
数値実験により,混合分類器は精度・損耗トレードオフを著しく改善することを確認した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:18:44 GMT)
Capsule Enhanced Variational AutoEncoder for Underwater Image Reconstruction [8.2] 我々は、ベクトル量子化変分オートエンコーダ(myVQVAE)の離散的特徴量化アプローチからインスピレーションを得て、両問題に共同で取り組む新しいアーキテクチャを導入する。
我々のモデルは、入力を潜在表現に圧縮する符号化ネットワークと、2つの独立デコードネットワークを組み合わせることで、潜在表現のみを使用して画像の強調と再構成を行う。
カプセル層の利用により、myVQVAEの差別化の問題を克服し、特定の最適化トリックを必要とせずに、エンドツーエンドでソリューションをトレーニングできるようにします。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:04:42 GMT)
Knockout: A simple way to handle missing inputs [8.1] リッチなインプットを利用するモデルは、推論時にいくつかのインプットが欠落している可能性があるため、広くデプロイすることは困難である。
この問題に対する現在の一般的な解決策には、余剰化、計算、複数のモデルのトレーニングがある。
完全入力と限界分布を用いて条件分布を効率よく学習する方法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:40:28 GMT)
A New Branch-and-Bound Pruning Framework for $\ell_0$-Regularized Problems [8.0] 我々は $ell_$-regularized problem のジェネリックファミリーに対してプルーニングテストを実装する代替案を提案する。
提案手法により,複数の領域の同時評価が可能となった。
数値シミュレーションにより,BnBプロシージャの解法時間を桁違いに改善できることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:40:06 GMT)
Towards the Transferability of Rewards Recovered via Regularized Inverse Reinforcement Learning [8.0] 逆強化学習は、政策よりも報酬がタスクの最も簡潔で伝達可能な記述であるという考えに動機づけられた、専門家によるデモンストレーションから報酬を推測することを目的としている。
過去の研究は、専門家の方針に完全にアクセスできるという前提の下でのみこの問題に対処してきた。
専門家の方針に完全にアクセスして開発された条件は、専門家のデモンストレーションにのみアクセス可能なより実践的なシナリオにおいて、転送可能性を保証することはできない。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:18:08 GMT)
Functional Programming Paradigm of Python for Scientific Computation Pipeline Integration [7.9] 本稿では,Pythonアーキテクチャとプログラミング実践における関連スイートに基づく,新しい関数型プログラミングパラダイムを提案する。
このソリューションは、科学計算フローの統合を目的としている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:42:50 GMT)
Rewriting the Code: A Simple Method for Large Language Model Augmented Code Search [7.8] Generation-Augmented Retrieval (GAR)フレームワークは、クエリを拡張するための例のコードスニペットを生成する。
本稿では、forスタイルの正規化内でコード(ReCo)を書き換える、シンプルで効果的な方法を提案する。
コードスタイル類似度(Code Style similarity)は、コード内のスタイリスティック類似度を定量化するための最初のメートル法である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:50:26 GMT)
Recover as It is Designed to Be: Recovering from Compatibility Mobile App Crashes by Reusing User Flows [7.8] RecoFlowは、APIとビジュアルツールを使ってユーザフローをプログラムすることで、アプリの開発者がクラッシュから自動的にアプリを復元することを可能にするフレームワークです。
RecoFlowは、ユーザデバイス上のユーザフローによるアプリの機能使用を追跡し、クラッシュによって中断されたアプリの機能のUIアクションを再生することで、クラッシュからアプリを回復する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:03:04 GMT)
LLark: A Multimodal Instruction-Following Language Model for Music [7.7] 音楽にはユニークで複雑な構造があり、専門家と既存のAIシステムの両方が理解することが難しい。
音韻理解のための命令調整型マルチモーダルモデルであるLLarkを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:35:01 GMT)
Asset-centric Threat Modeling for AI-based Systems [7.7] 本稿では、AI関連資産、脅威、対策、残留リスクの定量化のためのアプローチおよびツールであるThreatFinderAIを提案する。
このアプローチの実用性を評価するため、参加者はAIベースのヘルスケアプラットフォームのサイバーセキュリティ専門家によって開発された脅威モデルを再現するよう命じられた。
全体として、ソリューションのユーザビリティはよく認識され、脅威の識別とリスクの議論を効果的にサポートする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:30:24 GMT)
Quality-Diversity Actor-Critic: Learning High-Performing and Diverse Behaviors via Value and Successor Features Critics [7.6] QDAC(Quality-Diversity Actor-Critic)は、アクターに批判的な深層強化学習アルゴリズムである。
他の品質多様性手法と比較すると、QDACは性能が著しく高く、振る舞いも多様である。
また、学習したスキルを活用して、他のベースラインよりも5つの摂動環境に適応できることも示しています。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:46:32 GMT)
PowerGraph: A power grid benchmark dataset for graph neural networks [7.5] 本稿では、電力フロー、最適電力フロー、カスケード故障解析のためのGNN調整データセットを含むPowerGraphを提案する。
PowerGraphは、さまざまなタスクのための多面的なGNNデータセットで、実世界の説明を含む電力フローと障害シナリオを含んでいる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:51:16 GMT)
Frequency Enhanced Pre-training for Cross-city Few-shot Traffic Forecasting [7.5] 都市間数発の予測という概念が現実的なアプローチとして現れている。
FEPCrossは事前訓練段階と微調整段階を有する。
実世界の交通データセット上で実施された実証的な評価は、FEPCrossの異常な有効性を検証する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:42:00 GMT)
A Diffusion Model Framework for Unsupervised Neural Combinatorial Optimization [7.4] 現在のディープラーニングアプローチは、正確なサンプル確率を生み出す生成モデルに依存している。
この研究は、この制限を解除し、高度に表現力のある潜在変数モデルを採用する可能性を開放する手法を導入する。
我々は,データフリーなコンビネーション最適化におけるアプローチを実験的に検証し,幅広いベンチマーク問題に対して新しい最先端の手法を実現することを実証した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:55:02 GMT)
Demystifying Platform Requirements for Diverse LLM Inference Use Cases [7.2] 本稿では,大規模言語モデル推論性能とプラットフォーム設計パラメータの関係を明らかにするための分析ツールGenZを提案する。
LLaMA や GPT-4 のような SOTA LLM モデルをサポートするためのプラットフォーム要件を,多様なサービス設定下で定量化する。
結局のところ、この研究は、幅広いアプリケーションにまたがる大きな言語モデルの潜在能力を最大限に活用するためのプラットフォーム設計の考察に光を当てている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:00:50 GMT)
Expected Grad-CAM: Towards gradient faithfulness [7.2] 勾配重み付きCAMアプローチは依然としてバニラ勾配に依存している。
本研究は飽和度と感度問題に対処する勾配重み付きCAM増強法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:40:30 GMT)
An expert-driven data generation pipeline for histological images [7.2] 本稿では,セルセグメンテーションのための合成データセットを生成する新しいパイプラインを提案する。
注釈付き画像のほんの一握りしか持たないため,本手法では,DLインスタンス分割モデルのトレーニングに使用できる大規模なデータセットを生成する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:05:08 GMT)
FreeTumor: Advance Tumor Segmentation via Large-Scale Tumor Synthesis [7.1] FreeTumorは、堅牢な腫瘍合成とセグメンテーションのための堅牢なソリューションである。
合成トレーニングでは、敵のトレーニング戦略を使用して、大規模で多種多様なラベル付きデータを活用している。
FreeTumorでは,腫瘍セグメント化におけるデータスケーリングの法則について,データセットを1万1千件までスケールアップすることで検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:27:29 GMT)
Conformalized Survival Distributions: A Generic Post-Process to Increase Calibration [6.9] 判別と校正は生存分析の2つの重要な特性を表す。
異なる性質を持つため、生存モデルの両方を同時に最適化することは困難である。
本稿では, モデルキャリブレーションを劣化させることなく, モデルキャリブレーションを改善するためのコンフォメーションレグレッションを利用した新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:32:56 GMT)
How Flawed Is ECE? An Analysis via Logit Smoothing [6.8] キャリブレーション測定の最も一般的な方法は、期待キャリブレーション誤差(ECE)である。
近年の研究では、予測器の空間において不連続であるという事実など、ECEの欠点が指摘されている。
我々はこれらの不連続性の性質を用いて、ロジット・スムースドECE(LS-ECE)と呼ばれる新しい連続的、容易に推定される誤校正指標を動機づける。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:14:51 GMT)
Improving Open-Ended Text Generation via Adaptive Decoding [6.7] 本研究では、動的に言語モデルに適応的復号化を導入し、生成時に意味のある候補集合を同定する機構を提案する。
実験結果から,本手法は多様性と一貫性のバランスが良好であることが明らかとなった。
我々の手法は言語モデルの推論能力を向上させる可能性がある。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:02:44 GMT)
Focus on the Core: Efficient Attention via Pruned Token Compression for Document Classification [6.7] BERTのような事前訓練されたトランスフォーマーは計算コストのかかる自己保持機構に悩まされる。
トークンプルーニングとトークンの組み合わせという2つの戦略を統合することを提案する。
さまざまなデータセットによる実験は、ベースラインモデルよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:51:52 GMT)
Differentially Private Tabular Data Synthesis using Large Language Models [6.6] 本稿ではDP-LLMTGenについて紹介する。
DP-LLMTGenは、2段階の微調整手順を用いて、センシティブなデータセットをモデル化する。
微調整LDMをサンプリングすることで合成データを生成する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:43:57 GMT)
Synthetic Data Generation for 3D Myocardium Deformation Analysis [6.6] 心血管画像データセットを充実させるための合成データ生成手法を提案する。
心臓の4次元CTスキャン,パラメータの選択,およびその後のトレーニング用合成データ作成から得られたデータ準備について概説した。
本研究は,高精度な注釈付き高解像度CTデータセットの不足による限界を克服するために貢献する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:40:53 GMT)
Stein Boltzmann Sampling: A Variational Approach for Global Optimization [6.6] 本稿では,Stein Boltzmann Sampling (SBS) と呼ばれる連続ソボレフ関数を大域的に最適化するフローベース手法を提案する。
ベンチマーク関数の最先端手法との詳細な比較は、SBSとその変種が競争力が高いことを示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:51:04 GMT)
A Unified Linear Programming Framework for Offline Reward Learning from Human Demonstrations and Feedback [6.6] Inverse Reinforcement Learning (IRL) と Reinforcement Learning from Human Feedback (RLHF) は報酬学習における重要な方法論である。
本稿では,オフライン報酬学習に適した新しい線形プログラミング(LP)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:23:54 GMT)
REvolve: Reward Evolution with Large Language Models for Autonomous Driving [6.5] 大規模言語モデル(LLM)は、自然言語のタスク記述から報酬を生成するために使われてきた。
本稿では、自律運転における報酬設計にLLMを使用する進化的フレームワークであるRevolveを紹介する。
我々は、Revolve-Designed rewardsで訓練されたエージェントが人間の運転基準と密接に一致していることを示し、その結果、他の最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:23:27 GMT)
DepsRAG: Towards Managing Software Dependencies using Large Language Models [6.5] ソフトウェア依存関係の管理は、ソフトウェア開発における重要なメンテナンスタスクである。
近年のLarge Language Models (LLM) の進歩により、様々なデータソースから情報を取得することができる。
提案手法は,概念検索拡張生成(RAG)手法の実証である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:56:19 GMT)
Robust and Conjugate Gaussian Process Regression [6.4] 一般化されたベイズ推定を用いて,ガウス過程 (RCGP) の回帰をほぼ何のコストもかからず,頑健かつ共役的に行う方法を示す。
RCGPは、標準GPがそれを認めるすべての設定において、正確な共役クローズドフォーム更新を可能にするため、特に汎用性がある。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:07:13 GMT)
Using EEG to investigate the effectiveness of applying ChatGPT [6.3] 大規模言語モデル(LLM)には、知識を解釈し、質問に答え、文脈を考える能力がある。
この研究は、34人の大学生を参加者として募集し、ランダムに2つのグループに分けられた。
実験群はChatGPTを用いて対話型指導を行い,コントロール群は人間教師と対話した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:37:42 GMT)
A Synergistic Approach In Network Intrusion Detection By Neurosymbolic AI [6.3] 本稿では,ニューロシンボリック人工知能(NSAI)をネットワーク侵入検知システム(NIDS)に組み込む可能性について検討する。
NSAIは、ディープラーニングのデータ駆動の強みと、象徴的なAIの論理的推論を組み合わせて、サイバーセキュリティにおける動的な課題に取り組む。
NIDSにNSAIを組み込むことは、複雑なネットワーク脅威の検出と解釈の両方において、潜在的な進歩を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:24:01 GMT)
MOT: A Mixture of Actors Reinforcement Learning Method by Optimal Transport for Algorithmic Trading [6.3] マーケットの異なるパターンをモデル化するために,複数のアクターを非交叉表現学習で設計するMOTを提案する。
将来の市場データによる実験結果から,MOTはリスクのバランスを保ちながら優れた収益性を示すことが示された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:42:52 GMT)
Scaling Down Deep Learning with MNIST-1D [6.2] MNIST-1Dは、古典的なディープラーニングベンチマークに代わる最小限のプロシージャ生成、低メモリ、低計算量である。
異なる深層建築の帰納バイアスの研究、宝くじの発見、深層二重降下観察、活性化関数のメタアーン化、および自己教師付き学習におけるギロチン正則化の実証に使用できる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:41:04 GMT)
Genshin: General Shield for Natural Language Processing with Large Language Models [6.2] 大規模言語モデル(LLM)が最近流行し、無数のドメインでかなりの進歩と一般化能力を示している。
LLMは不透明度を悪化させるさらに大きなブラックボックスを作り、解釈可能性はほとんどない。
本稿では, LLMの一般化可能性, 中央モデルの識別, 単純モデルの解釈可能性を組み合わせた, ゲンシンと呼ばれる新しいカスケーディングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:35:07 GMT)
Single Trajectory Conformal Prediction [6.2] リスク制御予測セット(RCPS)の性能について検討する。
我々は,このブロッキング手法を用いて,RCPS が iid 設定で楽しむような性能保証を実現することを示す。
オンラインおよびオフラインの共形予測アルゴリズムを統一的に分析するために、これらのツールをどのように使用できるのかを議論することで締めくくった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:51:33 GMT)
Significance of Chain of Thought in Gender Bias Mitigation for English-Dravidian Machine Translation [6.2] 本稿では,Dravidian family の Telugu や Kan-nada などの言語に対する機械翻訳システムにおける性別バイアスについて検討する。
複数の形式はバイアスを減らすことができるが、個人中心の文は多くの場合、歴史的ステレオタイプによるバイアスを主とする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:59:34 GMT)
MC-GTA: Metric-Constrained Model-Based Clustering using Goodness-of-fit Tests with Autocorrelations [6.2] 既存のクラスタリングアルゴリズムは、特徴類似性と距離距離とのリッチな相関を見落としている。
MC-GTAは, 自己相関測定に有効であることを示す。
強いベースラインを大きなマージンで上回る。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:53:16 GMT)
Revisiting Code Similarity Evaluation with Abstract Syntax Tree Edit Distance [6.2] 我々は、最近のコード類似度評価指標を再考し、特に抽象構文木(AST)編集距離の適用に焦点を当てた。
実験では、複雑なコード構造をキャプチャする際のAST編集距離の有効性を示し、既存のメトリクスと高い相関関係を示した。
すべてのテスト言語で有効性を示すメトリクスを提案し,最適化し,公開する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:56:38 GMT)
GeoReasoner: Geo-localization with Reasoning in Street Views using a Large Vision-Language Model [6.1] 本研究は,大規模視覚言語モデル(LVLM)を用いた新しいパラダイムによる地理的局在化の課題に取り組む。
既存のストリートビューデータセットには、視覚的な手がかりがなく、推論に理由がない多くの低品質画像が含まれていることが多い。
データ品質の問題に対処するため、我々はCLIPベースのネットワークを考案し、街路ビュー画像がどこにあるかを定量化する。
推論の精度を高めるために,実地局所化ゲームから得られた外部知識を統合し,価値ある人間の推論能力を活用する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:08:56 GMT)
PAT-Questions: A Self-Updating Benchmark for Present-Anchored Temporal Question-Answering [6.1] PAT-Questionsベンチマークを導入する。
PAT-Questionsの回答は、もし利用可能であれば、ナレッジグラフ上でSPARQLクエリを再実行することで、自動的に更新できる。
我々は、直接的プロンプトと検索強化生成(RAG)を用いて、PAT-Questionsにおける最先端のLLMとSOTA時間的推論モデル(TEMPREASON-T5)を評価した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:36:59 GMT)
CAFO: Feature-Centric Explanation on Time Series Classification [6.1] MTSの現在の説明法は、主に時間中心の説明に焦点を当てており、重要な期間を特定できるが、重要な特徴を特定するのにはあまり効果がない。
本研究は,MCSのための新しい特徴中心的説明・評価フレームワークであるCAFOについて紹介する。
フレームワークの有効性は、2つの主要な公開ベンチマークと実世界のデータセットに関する広範な実証分析を通じて検証される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:06:45 GMT)
A Large Deviations Perspective on Policy Gradient Algorithms [6.1] 政策勾配法により動機付け,勾配法によって生成されるレート反復に対する大きな偏差関数を同定する。
我々は、この現象を他の政策パラメトリゼーションの幅広い範囲に自然に拡張できることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:57:50 GMT)
Problematizing AI Omnipresence in Landscape Architecture [6.0] このポジションペーパーは、ランドスケープアーキテクチャの専門職における現在のAIの狂気を調べるための、重要なレンズを論じ、提供します。
著者らは、ランドスケープアーキテクトがAIを考える際に住むことができる5つのアーキタイプやメンタルモードを提案している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:20:05 GMT)
EGTR: Extracting Graph from Transformer for Scene Graph Generation [5.9] SGG(Scene Graph Generation)は、オブジェクトを検出し、オブジェクト間の関係を予測するための課題である。
本稿では,DETRデコーダのマルチヘッド自己アテンション層で学習した様々な関係から関係グラフを抽出する軽量一段SGGモデルを提案する。
本稿では,Visual Genome と Open Image V6 データセットに対する提案手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:15:03 GMT)
iKAN: Global Incremental Learning with KAN for Human Activity Recognition Across Heterogeneous Datasets [5.8] 本研究では,ウェアラブルセンサを用いたヒューマンアクティビティ認識(HAR)のためのインクリメンタル学習フレームワークを提案する。
スケーラブルなフレームワーク iKAN は Kolmogorov-Arnold Networks (KAN) による IL のパイオニアである。
6つの公開HARデータセットにわたる継続的な学習は、iKANフレームワークの漸進的な学習性能を実証した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:33:27 GMT)
ReShader: View-Dependent Highlights for Single Image View-Synthesis [5.7] 本稿では,ビュー合成過程を画素再構成と再配置の2つの独立したタスクに分割することを提案する。
再構成の過程では,1枚の画像を入力とし,新しいカメラに基づいてシェーディングを調整する。
そして、この再構成画像を既存のビュー合成法の入力として使用し、画素を移動させ、最終的な新規なビュー画像を生成する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:50:58 GMT)
It's a Feature, Not a Bug: Measuring Creative Fluidity in Image Generators [5.6] 本稿は,AIにおける創造的行動の一面を定義し,実証的に測定することを目的として,「素早い解釈の流動性」あるいは単に「流動性」を定量化する実験を行った。
流動性を研究するために,(2)初期「地中真実:イメージ」でシードされた自動生成プロンプトと画像のチェーンを作成すること,(3)既存の視覚的および意味的指標を用いてこれらのチェーンの破壊点を測定すること,(4)統計的検査と視覚的説明の両方を用いてこれらのチェーンを解析し,生成に使用する画像生成装置が顕著な流動性を示すかどうかを判断すること,といった明確な定義を導入する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:31:29 GMT)
Value Improved Actor Critic Algorithms [5.6] 本稿では,2つの改良演算子を用いたACフレームワークの汎用拡張を提案する。
本稿では,オンラインオフラインACアルゴリズムTD3とDDPGの2つの実用的なVI-ACアルゴリズムを設計する。
我々は,MujocoベンチマークのVI-TD3とVI-DDPGを評価し,テスト対象のすべての環境において,それぞれのベースラインの性能を改善したり適合させたりすることを発見した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:24:15 GMT)
Do we need rebalancing strategies? A theoretical and empirical study around SMOTE and its variants [5.6] 本稿では、SMOTEが元のマイノリティのサンプルを単純にコピーすることを証明する。
また,SMOTEが境界アーティファクトを示すことを証明し,既存のSMOTEの変形を正当化する。
我々は2つの新しいSMOTE関連戦略を導入し、それらを最先端のリバランシング手順と比較する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:53:06 GMT)
Learning equivariant tensor functions with applications to sparse vector recovery [5.6] ローレンツ群とシンプレクティック群の対角作用に関して同変函数に着目する。
これらの特徴付けの背景にある私たちのゴールは、同変機械学習モデルを定義することです。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:32:43 GMT)
Improving out-of-distribution generalization in graphs via hierarchical semantic environments [5.5] グラフ毎に階層的な環境を生成する新しい手法を提案する。
我々は、同じ階層内の環境の多様性を学ぶために、我々のモデルを導く新しい学習目標を導入する。
我々のフレームワークは、それぞれIC50とEC50予測タスクの最高のベースラインに対して、1.29%と2.83%の改善を実現しています。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:05:24 GMT)
Navigating Conflicting Views: Harnessing Trust for Learning [5.4] 既存の信頼性フレームワークを強化するために,計算信頼に基づく割引手法を開発した。
提案手法は,Top-1精度,AUC-ROC for Uncertainty-Aware Prediction,Fleiss' Kappa,Multi-View Agreement with Ground Truthの6つの実世界のデータセットを用いて評価した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:22:18 GMT)
Physics-informed deep learning and compressive collocation for high-dimensional diffusion-reaction equations: practical existence theory and numerics [5.4] ディープラーニング(DL)に基づく高次元偏微分方程式の効率的な解法の開発と解析
理論的にも数値的にも,新しい安定かつ高精度なスペクトルコロケーション法と競合できることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:16:11 GMT)
Advancing Semi-Supervised Learning for Automatic Post-Editing: Data-Synthesis by Mask-Infilling with Erroneous Terms [5.4] 高品質な合成データを作成するためのデータ合成手法に着目する。
本稿では,結果の合成データが実際のデータにある翻訳誤りを模倣するデータ合成手法を提案する。
実験結果から, 提案手法により生成した合成データを用いることで, 既存の合成データよりもAPEの性能が有意に向上することがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:09:05 GMT)
Statistics-Informed Parameterized Quantum Circuit via Maximum Entropy Principle for Data Science and Finance [5.4] 統計インフォームドパラメタライズド量子回路 (SI-PQC) は、量子計算統計モデルを効率的に準備し、訓練するために設計されている。
SI-PQCはトレーニング可能なパラメータを持つ静的構造を備えており、奥行き最適化回路のコンパイルを可能にする。
SI-PQCは、様々な量子アルゴリズムで準備および学習するための効率的なサブルーチンとして、入力ボトルネックに対処し、事前知識の注入を容易にする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:00:38 GMT)
Picturing Ambiguity: A Visual Twist on the Winograd Schema Challenge [5.3] WinoVisは、マルチモーダルコンテキストにおける代名詞の曖昧さに関するテキスト・ツー・イメージ・モデルに特化して設計されたデータセットである。
連続したモデルバージョンの評価によると、段階的な進歩にもかかわらず、Stable Diffusion 2.0はWinoVisで56.7%の精度を達成した。
さらなるエラー分析は、複雑な視覚の世界を解釈し、相互作用する能力において、テキスト・ツー・イメージ・モデルを進めることを目的とした将来の研究にとって重要な領域を特定する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:42:55 GMT)
Extending Structural Causal Models for Use in Autonomous Embodied Systems [5.3] 本稿では,構造因果モデル(SCM)で構成されるモジュールベース自律運転システムについて述べる。
ひとつはSCMのコンテキストで、残りは3つの新しい変数カテゴリで、そのうち2つは関数型プログラミングモナドに基づいています。
本稿では,自律運転システムの因果的能力の応用例を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:47:05 GMT)
Realization of permutation groups by quantum circuit [5.3] 我々は、CNOTゲートを2つ以上の要素によって生成される置換群の実装にのみ活用する。
正確に6つのCNOTゲートを含む回路図を探索し、スワップゲートの動作を成功させる(123)。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:14:31 GMT)
Improved Digital Therapy for Developmental Pediatrics Using Domain-Specific Artificial Intelligence: Machine Learning Study [5.3] 自動的な感情分類は、自閉症のような発達的な行動状態の子供を含む感情を認識するのに苦労する人々を助けることができる。
ほとんどのコンピュータビジョンの感情認識モデルは成人の感情に基づいて訓練されているため、子供の顔に適用された場合、性能は低下する。
本研究では,児童感情認識モデルの性能を高めるために,児童感情強調画像の収集とラベル付けをゲーミフィケーションする戦略を考案した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:06:25 GMT)
Joint Learning of Linear Dynamical Systems under Smoothness Constraints [5.2] 複数の線形力学系の連立学習の問題点を考察する。
特に,平均二乗誤差が平均二乗誤差(MSE)に収束する条件を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:29:42 GMT)
Sequential Neural Score Estimation: Likelihood-Free Inference with Conditional Score Based Diffusion Models [5.2] シミュレーターベースモデルにおけるベイズ推定のためのスコアベース手法である逐次ニューラル後スコア推定を導入する。
このモデルを逐次訓練手順に組み込み、関心の観測における後部の現在の近似を用いてシミュレーションを導出する。
提案手法は, 既存の最先端手法に匹敵する, 優れた性能を示す数値例で, 非逐次的, 非逐次的, 変種性を検証した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:07:57 GMT)
EvGGS: A Collaborative Learning Framework for Event-based Generalizable Gaussian Splatting [5.2] 本稿では,EvGGSと呼ばれるイベントベース汎用3D再構成フレームワークを提案する。
フィードフォワード方式でイベント入力のみから3Dガウスとしてシーンを再構築する。
提案手法は, 再現性, 深度・強度予測において, 良好な速度で全てのベースラインより優れた性能を発揮する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:51:49 GMT)
An Analysis under a Unified Fomulation of Learning Algorithms with Output Constraints [5.1] ニューラルネットワーク(NN)は様々なタスクでよく機能するが、時には人間に非意味な結果をもたらす。
トレーニング中に出力制約を減らして人間の知識を注入することで、モデルの性能を改善し、制約違反を減らすことができる。
メインタスクの情報と制約注入を統合化するための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:58:29 GMT)
Efficient Data Distribution Estimation for Accelerated Federated Learning [5.1] Federated Learning(FL)は、多数の分散エッジデバイスでグローバルモデルをその場でトレーニングする、プライバシ保護機械学習パラダイムである。
デバイスはシステムリソースとトレーニングデータの両方において非常に異質である。
様々なクライアント選択アルゴリズムが開発され、モデルカバレッジと精度の点で有望な性能向上を示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:33:17 GMT)
On the Nonlinearity of Layer Normalization [5.0] 本稿では,LN-Netと呼ばれる線形およびLN変換を階層的に構成したネットワークの表現能力について検討する。
各層に3つのニューロンしか持たないLN-Netと$O(m)$ LN層が正しく分類できることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:11:34 GMT)
Private Edge Density Estimation for Random Graphs: Optimal, Efficient and Robust [5.0] 本稿では,ErdHos-R'enyiランダムグラフのエッジ密度を推定するアルゴリズムについて述べる。
我々は,アルゴリズムの誤り率を対数的因子まで最適とする情報理論的下界を証明した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:36:15 GMT)
VerilogReader: LLM-Aided Hardware Test Generation [5.0] 高度な理解と推論機能を備えた大規模言語モデル(LLM)は、新しいアプローチを導入している。
本研究では,LCMをCDG(Coverage Directed Test Generation)プロセスに統合する方法について検討する。
私たちは、自設計のVerilogベンチマークスイートを使用して、ランダムなテストとフレームワークを比較します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:20:51 GMT)
FAdam: Adam is a natural gradient optimizer using diagonal empirical Fisher information [5.0] 我々はアダムの対角的経験的フィッシャー情報行列(FIM)を厳密に分析した。
我々の分析は、元のAdamアルゴリズムの欠陥を明らかにし、提案された修正に繋がる。
修正アルゴリズムであるFisher Adam (FAdam) は、様々な領域で優れた性能を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:55:11 GMT)
Model for Peanuts: Hijacking ML Models without Training Access is Possible [5.0] モデルハイジャック(英: Model hijacking)とは、被害者のモデルをハイジャックして元のモデルとは異なるタスクを実行する攻撃である。
本研究では、未知の入力サンプルを分類するために、SnatchMLと呼ばれる推論時にモデルハイジャックを行うための簡単なアプローチを提案する。
最初にメタ学習と呼ぶ新しいアプローチを提案し、モデルが元のデータセットをトレーニングしながら潜在的に悪意のあるタスクを解放するのに役立つように設計した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:04:37 GMT)
Tackling the Unlimited Staleness in Federated Learning with Intertwined Data and Device Heterogeneities [5.0] フェデレートラーニング(FL)は、データとデバイスの不均一性の両方に影響されることが多い。
本稿では,この変換に勾配インバージョン手法を応用した新しいFLフレームワークを提案する。
提案手法により,トレーニングモデルの精度を最大20%向上し,FLトレーニングの進捗を最大35%向上させることができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:13:35 GMT)
MP-PolarMask: A Faster and Finer Instance Segmentation for Concave Images [5.0] PolarMaskは、極座標系によって物体を表すユニークなモデルである。
PolarMaskには2つの欠陥がある: (i)凹凸オブジェクトを表現できないことと (ii) レイレグレッションを使用する際の非効率性である。
複数の極系を利用するMP-PolarMask(Multi-Point PolarMask)を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:20:34 GMT)
ACEGEN: Reinforcement learning of generative chemical agents for drug discovery [5.0] ACEGENは、創薬設計のための包括的で合理化されたツールキットである。
TorchRLは、完全にテストされた再利用可能なコンポーネントを提供する、現代的なRLライブラリである。
複数の薬物発見症例に応用されたACEGENの例を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:50:31 GMT)
Towards Integrating Emerging AI Applications in SE Education [5.0] 本稿では,AI分野における現在のトレンドの体系的分析の予備的結果を示す。
我々は、AIアプリケーションとさらなる研究分野の一連の機会について論じる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:35:08 GMT)
Patch-Wise Self-Supervised Visual Representation Learning: A Fine-Grained Approach [4.9] 本研究は、パッチレベルの識別を自己教師付き視覚表現学習に組み込むことにより、革新的できめ細かな次元を導入する。
それぞれのパッチは個別に拡張され、同じビュー内の他のパッチとは独立している。
我々は、拡張ビュー全体にわたって対応するパッチを見つけるための、単純で効果的なパッチマッチングアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:02:54 GMT)
Investigating a Device Independence Quantum Random Number Generation [4.9] デバイス独立環境における量子絡み合いの助けを借りてランダム性を認証する。
CHSH不等式違反と量子状態トモグラフィーは、測定装置の独立チェックとして使用される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:23:24 GMT)
Learning to Play Atari in a World of Tokens [4.9] 変換器に基づく学習(DART)のための離散抽象表現を導入する。
本研究では,自己回帰的世界モデリングのためのトランスフォーマー・デコーダと,世界モデルの離散表現におけるタスク関連キューへの参加による学習行動のためのトランスフォーマー・デコーダを組み込んだ。
DARTは、Atari 100kサンプル効率ベンチマークでルックアヘッド検索を使用しない従来の最先端の手法よりも、平均的な人間正規化スコアが0.790で、26試合中9試合で人間に勝っている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:25:29 GMT)
FLOW: Fusing and Shuffling Global and Local Views for Cross-User Human Activity Recognition with IMUs [4.8] 慣性計測ユニット(IMU)センサーはヒト活動認識(HAR)に広く利用されている
この分布の相違の主な理由は、局所座標系におけるIMUセンサデータの表現にある。
IMUデータの特徴に基づいてグローバルなビュー表現を抽出する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:52:18 GMT)
Mechanical dynamics around higher-order exceptional point in magno-optomechanics [4.7] 実験的に実現可能なマグノオプトメカニクスにおける多種多様な例外点 (EP) を, 物理的に直接接触することで, 最適サブシステムとマグノメカニクスサブシステムからなる実験により検討した。
散逸性とパリティ時間対称な例外点が観察できる。
提案手法は多種多様なEPを設計し,非エルミート相転移をマグノ・オプトメカニクスにおける異常な動的挙動で定量化するための有望な方法である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:15:57 GMT)
The Empirical Impact of Forgetting and Transfer in Continual Visual Odometry [4.7] 本研究は, ニューラルネットワークにおける破滅的記憶の影響と知識伝達の有効性を, 具体的環境下で連続的に学習したニューラルネットワークを用いて検討した。
環境間の高い伝達性を有する初期満足度性能を観察し,その後に特殊化相を呈する。
これらの知見は、生涯のロボット工学における適応と記憶保持のバランスをとることのオープンな課題を強調している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:32:50 GMT)
Achieving $\tilde{O}(1/ε)$ Sample Complexity for Constrained Markov Decision Process [4.7] マルコフ決定過程(CMDP)の強化学習問題について考察する。
これは$O(frac1Deltacdotepscdotlog2(1/eps))$ sample complexity boundとなる。
本アルゴリズムは一次空間で動作し,CMDP問題に対する一次LPを各期間にオンライン的に解決する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 02:37:28 GMT)
Asynchronous Multi-Server Federated Learning for Geo-Distributed Clients [4.7] フェデレートラーニング(FL)システムは、複数のクライアントが単一のサーバで中間モデルの重みを同期的に交換することで、機械学習モデルを反復的にトレーニングすることができる。
このようなFLシステムのスケーラビリティは、同期通信によるサーバアイドル時間と、ひとつのサーバがボトルネックになるリスクの2つの要因によって制限することができる。
本稿では,完全に非同期な新しいFLアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:29:46 GMT)
Partial Search in a Frozen Network is Enough to Find a Strong Lottery Ticket [4.7] ランダムに密集したネットワークは、ウェイトラーニングなしで高い精度を達成する--強い宝くじ(SLT)
本稿では,所望のSLT間隔に依存しない任意の比でSLT探索空間を縮小する手法を提案する。
実験により,提案手法は高密度あるいはランダムに切断されたソースネットワークから得られたSLTよりも精度・モデル間サイズトレードオフのよいSLTを見出した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:12:18 GMT)
Interpreting and Improving Diffusion Models from an Optimization Perspective [4.6] 我々はこの観測を用いて、ユークリッド距離関数に適用された近似勾配勾配勾配として拡散モデルを解釈する。
本稿では,理論結果からの洞察を用いてDDIMを一般化した新しい勾配推定サンプリング手法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:18:29 GMT)
MACT: Model-Agnostic Cross-Lingual Training for Discourse Representation Structure Parsing [4.5] 意味表現解析モデルのための言語間学習戦略を導入する。
事前訓練された言語モデルにエンコードされた言語間のアライメントを利用する。
実験では、英語、ドイツ語、イタリア語、オランダ語におけるDRS節とグラフ解析の大幅な改善が示されている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:02:57 GMT)
Position Paper: An Inner Interpretability Framework for AI Inspired by Lessons from Cognitive Neuroscience [4.5] 内解釈可能性(Inner Interpretability)は、AIシステムの内部メカニズムを明らかにするための、有望な分野である。
近年の批判は、AIの幅広い目標を前進させるための有用性に疑問を呈する問題を提起している。
ここでは、関係する関係を描き、フィールド間で生産的に伝達できる教訓を強調します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:16:56 GMT)
Large Language Models are Zero-Shot Next Location Predictors [4.3] 大規模言語モデル(LLM)は、ゼロショットの次位置予測器として機能する。
LLMの精度は32.4%までで、洗練されたDLモデルに比べて600%以上向上している。
本稿では,データ汚染を検査する他の研究に触発された枠組みを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:10:53 GMT)
Assessment of cryptographic approaches for a quantum-resistant Galileo OSNMA [4.3] これらの新たな脅威を克服するために、Galileo Open Service Navigation Message Authentication(OSNMA)の現状を分析します。
PQCアプローチを採用する上で大きな障壁は、署名とキーの両方のサイズである。
この研究は、システムの整合性を短期的に維持するために実施可能な、異なる時間的対策を評価することで締めくくられる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:26:29 GMT)
ParisLuco3D: A high-quality target dataset for domain generalization of LiDAR perception [4.3] 本稿では,クロスドメイン評価に特化して設計された新しいデータセットParisLuco3Dを提案する。
LiDARセマンティックセグメンテーション、LiDARオブジェクト検出、LiDARトラッキングのためのオンラインベンチマークが提供されている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:08:16 GMT)
Deep asymmetric mixture model for unsupervised cell segmentation [4.2] 本稿では,教師なし細胞分割のための新しい非対称混合モデルを提案する。
これは、ある多変量ガウス混合モデルをログライクリフと自己教師付き最適化関数で集約することによって構築される。
提案した非対称混合モデルは,そのセグメントを含むセルセグメンテーションにおいて,既存の最先端の教師なしモデルよりも優れている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:12:22 GMT)
Globally Interpretable Classifiers via Boolean Formulas with Dynamic Propositions [4.2] 提案手法はAnswer Set Programmingを用いて実装する。
本研究では、7つのデータセットを調査し、その結果を最先端の分類器で取得可能なデータセットと比較する。
すべてのケースにおいて、分類器の利点は、参照メソッドのブラックボックスの性質とは対照的に、非常に短く、すぐに人間の知性があることです。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:46:17 GMT)
Multi-Agent Reinforcement Learning Meets Leaf Sequencing in Radiotherapy [4.1] 本稿では,リーフシークエンシングのための多エージェントフレームワークにおいて,強化リーフシークエンサー(RLS)と呼ばれる新しい強化学習モデルを提案する。
RLSモデルは、大規模なトレーニングを通じて、時間を要する反復最適化ステップを改善し、報酬機構の設計を通じて運動パターンを制御することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:55:20 GMT)
Decomposable Submodular Maximization in Federated Setting [4.1] 本稿では,デコンポザブルな部分モジュラ最適化のためのエミュレートされた最適化設定を提案する。
この設定では、クライアントは独自の好み関数を持ち、これらの好みの重み付けを最大化する必要がある。
このアルゴリズムは, 上述の手法が存在する場合でも, 近似解が得られることが保証されていることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:05:29 GMT)
Spectroscopy and modeling of $^{171}$Yb Rydberg states for high-fidelity two-qubit gates [4.1] 我々は、非常に興奮的な174ドルYbと171ドルYbのRydberg状態の量子欠陥(MQDT)モデルを、$L leq 2$で提示する。
これらのモデルは、既存の文献データと、原子ビームにおける新しい高精度レーザーとマイクロ波分光法を組み合わせて開発されている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:08:33 GMT)
Craftax: A Lightning-Fast Benchmark for Open-Ended Reinforcement Learning [4.1] Craftaxは、JAXでCrafterをベースとして書き直したもので、Pythonネイティブのオリジナルよりも最大250倍高速である。
10億の環境相互作用を使ったPPOの実行は、1つのGPUだけで1時間以内で終了する。
本研究では,グローバル・エピソード探索を含む既存の手法と,教師なし環境設計がベンチマークで実質的な進歩を損なうことを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:12:27 GMT)
An Open Multilingual System for Scoring Readability of Wikipedia [4.0] ウィキペディア記事の読みやすさを評価するための多言語モデルを開発した。
ウィキペディアから簡略化されたウィキペディアやオンラインの子供まで、14言語にまたがる新しい多言語データセットを作成します。
我々のモデルはゼロショットシナリオでよく機能し、14言語で80%以上のランキング精度が得られることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:07:18 GMT)
Is Data Valuation Learnable and Interpretable? [3.9] 現在のデータ評価手法は、出力値の解釈可能性を無視している。
この研究は、データバリュエーションは学習可能か、解釈可能か、という重要な疑問に答えることを目的としている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:13:47 GMT)
A Robot Walks into a Bar: Can Language Models Serve as Creativity Support Tools for Comedy? An Evaluation of LLMs' Humour Alignment with Comedians [3.9] オーディエンスの前でライブショーを行う20人のプロコメディアンに,人工知能を芸術的プロセスで使用するインタビューを行った。
「我が研究は、片手、有害な言論、他方、抵抗、風刺、パンチアップの実践としての「攻撃」の言葉の微妙な相違に関する学問を拡げている。」
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:01:50 GMT)
Non-uniformity is All You Need: Efficient and Timely Encrypted Traffic Classification With ECHO [3.9] 本稿では,ML/DLベースの暗号化トラフィック分類のための新しい最適化プロセスであるECHOを紹介する。
ECHOは、分類時間とメモリ利用の両方を目標とし、2つの革新的なテクニックを取り入れている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:54:48 GMT)
Requirements Quality Research Artifacts: Recovery, Analysis, and Management Guideline [3.9] 我々は,要求品質研究における研究成果物の利用性の向上を目指している。
アーティファクト・リカバリ・イニシアチブを拡張し、アーティファクト・アベイラビリティーの理由を実証的に評価する。
オープンサイエンスアーティファクト開示のための簡潔なガイドラインをコンパイルする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:09:15 GMT)
The Life Cycle of Large Language Models: A Review of Biases in Education [3.9] 大規模言語モデル(LLM)は、学生や教師にパーソナライズされたサポートを提供するために、教育の文脈でますます採用されている。
教育技術におけるLLMの統合は、教育的不平等を悪化させる可能性のあるアルゴリズムバイアスに対して、新たな懸念を抱いている。
本論は,LLMアプリケーションにおける偏見の複雑な性質を明らかにすることを目的として,その評価のための実践的ガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:00:28 GMT)
Provably Stable Feature Rankings with SHAP and LIME [3.9] 最も重要な特徴を高い確率で正しくランク付けする属性法を考案する。
SHAP と LIME の効率的なサンプリングアルゴリズムを導入し,K$ の高階特徴が適切に順序付け可能であることを保証した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 00:49:43 GMT)
Inference of Utilities and Time Preference in Sequential Decision-Making [3.8] 本稿では,自動投資マネージャやロボアドバイザの能力を高めるための新しい制御フレームワークを提案する。
本稿では,各クライアントのリスク許容度,日々の消費評価,重要な生活目標に合わせた,実用機能と時間変化率の一般的な割引スキームを組み込んだ連続時間モデルを提案する。
提案する枠組みは、個別の投資アドバイスを改善することで金融技術の進歩だけでなく、医療、経済学、人工知能など他の分野にも広く貢献する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:40:20 GMT)
Verification of entangled states under noisy measurements [3.8] 絡み合いは多くの量子情報や量子計算タスクにおいて不可欠である。
近年、量子状態検証が注目されているが、このアプローチを実装する際のノイズ効果に対処する上での課題は未解決のままである。
本稿では,測定ノイズの存在下での量子状態検証プロトコルの性能を系統的に評価する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:59:02 GMT)
SNPGuard: Remote Attestation of SEV-SNP VMs Using Open Source Tools [3.8] クラウドコンピューティングは、今日の複雑なコンピューティング要求に対処するための、ユビキタスなソリューションである。
VMベースのTrusted Execution Environments(TEEs)は、この問題を解決するための有望なソリューションです。
クラウドサービスプロバイダをロックアウトするための強力なアイソレーション保証を提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:48:30 GMT)
Do Large Language Models Perform the Way People Expect? Measuring the Human Generalization Function [3.7] 大規模言語モデル(LLM)を多種多様な用途で評価する。
私たちは、これらのデプロイメント決定が人々によってなされる状況を考えます。
MMLUとBIG-Benchベンチマークから、79のタスクにまたがる一般化の例を19Kのデータセットで収集する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:45:21 GMT)
Space-time deep neural network approximations for high-dimensional partial differential equations [3.6] 深層学習近似は次元性の呪いを克服する能力を持っているかもしれない。
この記事では、任意の$ainmathbbR$, $ bin (a,infty)$に対して、あるコルモゴロフ PDE の解が次元性の呪いなしで DNN によって近似できることを証明する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:54:30 GMT)
A solid-state platform for cooperative quantum dynamics driven by correlated emission [3.6] 我々は,ハイブリッド固体プラットフォームにおける類似の協調現象の探索の段階を設定した。
我々は、共有固体貯水池と散逸的に相互作用する固体スピン欠陥の集合の量子多体力学の包括的定式化を開発する。
我々の研究は、固体系の量子センシングとスピン欠陥アンサンブルにおける多体絡みの直接発生に対するマルチキュービットアプローチの基礎を築いた。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:03:29 GMT)
Arrows of Time for Large Language Models [3.6] 自己回帰大言語モデル(LLM)による確率的モデリングを時間方向の角度から検討する。
十分に大きなモデルでは、自然言語を学習する能力において、次のトークンを予測しようとする場合と、前のトークンを予測しようとする場合との平均ログパープレキシティの違いという、タイム非対称性が経験的に見つかる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:35:04 GMT)
Linear and nonlinear propagation of cylindrical vector beam through a non-degenerate four level atomic system [3.6] 媒体の線形感受性は制御フィールドとPVBの位相シフトに依存し,損失や利得を特徴づけることを示す。
自己焦点および脱離現象は、半径、方位、渦巻VBに対して観察される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:38:44 GMT)
Towards Measuring the Impact of Technical Debt on Lead Time: An Industrial Case Study [3.5] 技術的負債はソフトウェアシステムが進化するにつれて増加する傾向にある。
私たちの目標は、技術的負債によってリードタイムのばらつきが説明できる範囲を測定することです。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:55:13 GMT)
Scale-Free Image Keypoints Using Differentiable Persistent Homology [3.5] コンピュータビジョンでは、キーポイント検出は、ロボット工学から画像検索に至るまでの応用において、基本的な課題である。
本稿では、モース理論と永続ホモロジー、代数トポロジーに根ざした強力なツールを活用する新しいアプローチを紹介する。
本稿では,近年の永続的ホモロジーにおける下位段階の概念を導入し,トポロジカルラーニングへの道を開いた新しい損失関数を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:27:51 GMT)
Visual Car Brand Classification by Implementing a Synthetic Image Dataset Creation Pipeline [3.5] 安定拡散を用いた合成画像データセットの自動生成パイプラインを提案する。
YOLOv8を用いて自動境界ボックス検出と合成画像の品質評価を行う。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:44:08 GMT)
Multi-agent assignment via state augmented reinforcement learning [3.5] 本稿では,制約付き強化学習を通じて,マルチエージェント配置問題の矛盾する要件に対処する。
我々は,2変数の振動をエージェントに利用してタスク間の交互化を行う状態拡張アプローチを再帰する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:56:12 GMT)
Toward Efficient Deep Spiking Neuron Networks:A Survey On Compression [3.4] Deep Spiking Neural Networks (DSNN) は、Deep Artificial Neural Networks (DANN) よりも大きなパワーアドバンテージを提供する。
DSNNは時間情報の処理に優れており、DANNと比較して時間データの処理に優れている可能性がある。
しかし、その深いネットワーク構造と多くのパラメータは計算コストとエネルギー消費を増大させ、実際の展開を制限する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:11:54 GMT)
How to Count Coughs: An Event-Based Framework for Evaluating Automatic Cough Detection Algorithm Performance [3.4] 慢性うっ血性疾患は、その頻度に関する主観的な患者アンケートに頼っているため、評価が難しい。
コーカウンティングアルゴリズムの最先端メトリクスと臨床医に関連する情報との間にはミスマッチがある。
本稿では,臨床ガイドラインと整合したイベントベース評価指標を用いて,有意なコーカウンティングエンドポイントについて検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:59:48 GMT)
Hardness of Learning Neural Networks under the Manifold Hypothesis [3.3] 多様体仮説は、高次元データが低次元多様体上または近辺にあると仮定する。
多様体仮説に基づく学習の難しさについて検討する。
データ多様体の体積に関する追加の仮定は、これらの基本的な制限を緩和することを示します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:50:32 GMT)
Learning from Streaming Data when Users Choose [3.2] 多くの競合するサービスからなるデジタルマーケットでは、ユーザーは好みに応じて複数のサービスプロバイダを選択し、選択したサービスはユーザーデータを使用してモデルを漸進的に改善する。
サービス提供者のモデルが次のステップでどのサービスを選択するかに影響し、その代わりにユーザの選択がモデルの更新に影響を与え、フィードバックループにつながる。
我々は,ユーザ全体の損失を最小限に抑える,シンプルで効率的な分散アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:07:52 GMT)
What makes unlearning hard and what to do about it [3.2] 未学習の難易度と未学習アルゴリズムの性能に影響を及ぼす2つの要因を同定する。
筆者らは,Refined-Unlearning Meta-algorithm (RUM) というフレームワークを開発した。そのフレームワークは, (i) 異なる特徴により, 忘れセットを均質化されたサブセットに精製し, (ii) 既存のアルゴリズムを用いて各サブセットを学習し,最後に、全体的な忘れセットを学習したモデルを提供するメタアルゴリズムである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:14:47 GMT)
DeNVeR: Deformable Neural Vessel Representations for Unsupervised Video Vessel Segmentation [3.2] Deformable Neural Vessel Representations (DeNVeR)は、X線ビデオにおける血管のセグメンテーションの教師なしアプローチである。
DeNVeRは光フローと層分離を使用し、テストタイムトレーニングを通じてセグメンテーション精度と適応性を向上する。
本稿では,画像診断と治療計画のための堅牢でデータ効率のよいツールとして,医用画像の進歩を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:59:34 GMT)
Lifting Factor Graphs with Some Unknown Factors [3.1] liftingは、確率的グラフィカルモデルにおける対称性を、識別不能なオブジェクトの代用として利用する。
本稿では,未知の因子を含む因子グラフの対称部分グラフを識別するLIFAGUアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:44:55 GMT)
Understanding the Cross-Domain Capabilities of Video-Based Few-Shot Action Recognition Models [3.1] Few-shot Action Recognition (FSAR) は、ビデオ中の新しいアクションをわずかに例を使って識別できるモデルを学ぶことを目的としている。
メタトレーニング中に見られるベースデータセットと評価に使用される新しいデータセットは、異なるドメインから得ることができると仮定すると、クロスドメインの少数ショット学習によってデータ収集とアノテーションコストが軽減される。
我々は、新しいクロスドメインタスクに対して、既存の最先端の単一ドメイン、転送ベース、およびクロスドメインFSARメソッドを体系的に評価する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:48:18 GMT)
The Socface Project: Large-Scale Collection, Processing, and Analysis of a Century of French Censuses [3.1] 本稿では1836年から1936年までのフランスの国勢調査リストから情報を抽出するための完全な処理ワークフローを提案する。
自動手書き表認識を用いて,これらの表に含まれる全ての情報を抽出することを目的としている。
抽出されたデータは、デモグラファーによって、時間とともに社会の変化を分析し、フランスの経済と社会構造に対する理解を著しく改善するために使用される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:19:35 GMT)
Particle identification with machine learning from incomplete data in the ALICE experiment [3.0] ALICEは、約100MeV/cから20GeV/cまでの運動量を持つ粒子の複数の検出器を介してPID情報を提供する。
機械学習(ML)メソッドで、はるかに優れたパフォーマンスを実現することができる。
本稿では,MLプロジェクトとALICE分析ソフトウェアの統合について紹介し,ドメイン適応について論じる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:12:25 GMT)
Transferring Domain Knowledge with (X)AI-Based Learning Systems [3.0] 説明可能な人工知能(XAI)は、従来、ブラックボックス人工知能システムを解釈するために用いられてきた。
X)AIシステムは、専門家の過去の判断に基づいて訓練され、実例と説明を提供することで初心者を教えるために使用される。
我々は,(X)AIに基づく学習システムが初心者の学習を誘導し,その認知スタイルが中等学習であることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:56:30 GMT)
Joint Constellation Shaping Using Gradient Descent Approach for MU-MIMO Broadcast Channel [2.9] 完全チャネル知識を持つ放送チャンネルの連星座を最適化するための学習に基づくアプローチを提案する。
提案手法の目的は、送信機と受信機間の最小の相互情報を最大化することである。
本手法により得られたレートは,線形プリコーダで得られたレートと比較される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:20:06 GMT)
Optical heterodyne microscopy of operating spin Hall nano-oscillator arrays [2.8] 我々は2種類の光ヘテロダイン検出技術を用いて、ナノ収縮スピンホールナノオシレータ(SHNO)を特徴付ける。
この技術の有効性を実証するために,NiFe/PtとW/CoFeB/MgOの2つの異なる材料スタックからなるSHNOについて検討した。
SHNO磁気力学の直接的,非侵襲的,サブミクロン的,空間的,位相分解的特徴を示すために,Ising Machinesで使用される2種類のSHNOの自己振動の大きさと位相を図示する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:50:58 GMT)
Jaynes-Cummings atoms coupled to a structured environment: Leakage elimination operators and the Petz recovery maps [2.8] 構造化環境に埋め込まれたJaynes-Cummings(JC)モデルを考える。
本稿では、JC原子の量子コヒーレンスを保護するために、デコヒーレンス効果の制御と抑制に有効ないくつかの戦略を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:45:46 GMT)
Detecting Errors in a Quantum Network with Pauli Checks [2.7] 量子エラー検出方式であるPauli check sandwiching (PCS) を分散マルチパーティプロトコルにすることで量子ネットワークに適用する。
PCSは距離1の符号であり、標準的な量子誤り訂正と検出方法よりも少ないリソースを必要とする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:29:29 GMT)
From Latent to Lucid: Transforming Knowledge Graph Embeddings into Interpretable Structures [2.6] 本稿では,知識グラフ埋め込みモデルに適したポストホックな説明可能なAI手法を提案する。
本手法は,知識グラフ埋め込みモデルによって符号化された潜在表現を直接デコードする。
類似した埋め込みエンティティのサブグラフ近傍の異なる構造を識別することにより、これらの知見を人間の理解可能な象徴的ルールや事実に変換する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:54:11 GMT)
VREM-FL: Mobility-Aware Computation-Scheduling Co-Design for Vehicular Federated Learning [2.6] 車両用無線環境マップフェデレートラーニング(VREM-FL)を提案する。
車両の移動性と5G無線環境マップを組み合わせる。
VREM-FLは無線リソース使用のためのトレーニング時間に調整することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:15:29 GMT)
Optimising Random Forest Machine Learning Algorithms for User VR Experience Prediction Based on Iterative Local Search-Sparrow Search Algorithm [2.6] 繰り返し局所探索最適化されたスパロー探索アルゴリズムによって改良されたスパロー探索アルゴリズムとランダムフォレストアルゴリズムを導入することにより,VRユーザエクスペリエンス予測の改善手法を検討した。
反復的局所探索-スパロー探索アルゴリズムに基づく改良されたモデルでは,トレーニングセットとテストセットの両方において100%の精度が達成される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:58:26 GMT)
Iteration over event space in time-to-first-spike spiking neural networks for Twitter bot classification [2.6] 本研究では,既存のスパイクスパイクニューラルネットワーク(SNN)モデルを拡張したフレームワークを提案する。
本稿では、各ニューロンにおける複数の入力と出力のスパイクを持つモデルによるスパイク伝播と、エンドツーエンドのバックプロパゲーションのためのトレーニングルールの設計について説明する。
モデルは、イベントの時間(ツイートとリツイート)が情報の主要キャリアであるTwitterボット検出タスクでトレーニングされ、評価される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:03:14 GMT)
Identifiability of total effects from abstractions of time series causal graphs [2.6] 本研究では,観測時系列からの介入による全効果の同定可能性の問題について検討する。
我々は、拡張された要約因果グラフと要約因果グラフの2つの抽象概念を考察する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:55:20 GMT)
Split and Rephrase with Large Language Models [2.5] Split and Rephrase (SPRP) タスクは、複雑な文を短い文法文の列に分割する。
タスク上の大きな言語モデルを評価し、主要なメトリクスに基づいて、技術の現状を大幅に改善できることを示します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:00:13 GMT)
Learning from Mistakes: a Weakly-supervised Method for Mitigating the Distribution Shift in Autonomous Vehicle Planning [2.5] 本稿では,自動運転車の学習方法としてLearning from Mistakes (LfM)を提案する。
LfMは、事前訓練されたプランナーがその直接的な目的から逸脱したインスタンスを特定する。
本稿では,有効な軌跡を識別することを目的とした,弱教師付き手法である妥当性学習を紹介する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:25:18 GMT)
3D WholeBody Pose Estimation based on Semantic Graph Attention Network and Distance Information [2.5] 新たなセマンティックグラフアテンションネットワークは、グローバルコンテキストをキャプチャする自己アテンションの能力の恩恵を受けることができる。
本体部分デコーダは、身体の特定のセグメントに関連する情報を抽出し、精製するのを支援する。
幾何学的損失(Geometry Loss)は身体の構造的骨格に批判的な制約を与え、モデルの予測が人間の姿勢の自然な限界に合致することを確実にする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:59:00 GMT)
DumpKV: Learning based lifetime aware garbage collection for key value separation in LSM-tree [2.4] LSMツリーではキー値の分離が使われ、書き込み増幅を減らすためにログファイルに大きな値が格納される。
LSMツリーの既存のガベージコレクション技術は、通常、静的パラメータベースのガベージコレクションを採用して、低書き込み増幅を達成するのに苦労する古い値をガベージコレクションする。
DumpKVは、動的ライフタイム調整による学習に基づくライフタイムアウェアメントガベージコレクションを導入し、効率の良いガベージコレクションを実現し、ライトアンプリフィケーションを低くする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:07:22 GMT)
Ground-based image deconvolution with Swin Transformer UNet [2.4] Swin Transformerアーキテクチャを用いた2段階のデコンボリューションフレームワークを提案する。
我々の研究は、ディープラーニングベースのソリューションが、科学的分析の範囲を制限してバイアスをもたらすことを明らかにした。
本稿では,スポーシティウェーブレットフレームワークの活性係数に依存する新しい第3ステップを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:51:32 GMT)
Ask-EDA: A Design Assistant Empowered by LLM, Hybrid RAG and Abbreviation De-hallucination [2.4] 大規模言語モデル(LLM)は、主語の専門家として効果的に機能する会話エージェントとして機能することで生産性を向上させる可能性がある。
Ask-EDAは24x7のエキスパートとして設計エンジニアにガイダンスを提供するように設計されたチャットエージェントである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:40:28 GMT)
TinySV: Speaker Verification in TinyML with On-device Learning [2.4] 本稿では,提案した TextitTiny Speaker Verification (TinySV) などのタスクで使用可能な,新しいタイプの適応型TinyMLソリューションを提案する。
提案したTinySVソリューションは、キーワードスポッティングと適応話者検証モジュールで構成される2層階層のTinyMLソリューションに依存している。
我々は,提案したTinySVソリューションの有効性と有効性を評価し,提案したソリューションを実世界のIoTデバイス上でテストした。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:27:40 GMT)
Understanding Token Probability Encoding in Output Embeddings [2.3] 出力埋め込みベクトル内の出力トークン確率を近似共通対数線形符号化する。
出力埋め込みにおける符号化を編集し、出力確率分布を正確に修正する。
トレーニング力学では、プローブのようなエンコーディングを使用し、出力埋め込みが初期ステップでトークンの周波数情報をキャプチャする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:57:29 GMT)
Consistency of semi-supervised learning, stochastic tug-of-war games, and the p-Laplacian [2.3] 偏微分方程式(PDE)とグラフに基づく半教師付き学習の交叉について概観する。
グラフに基づく半教師付き学習の一貫性に関する興味深い研究の方向性を強調した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:55:52 GMT)
Feature Map for Quantum Data in Classification [2.3] 量子特徴写像は、量子資源を機械学習アルゴリズムに燃やすことにより、量子状態のヒルベルト空間を持つインスタンスに対応する。
本稿では,教師付き学習アルゴリズムを改善するために,量子状態の確率論的操作として,量子データの特徴マップを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:56:32 GMT)
SCALLER: Standard Cell Assembled and Local Layout Effect-based Ring Oscillators [2.2] リングビリティ(RO)の周波数の非常に微細なマグロを可能にする技術を示す。
可変素子の数が異なる複数のROは65nmのCMOS技術で設計・製造された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:14:51 GMT)
Feature Importance Disparities for Data Bias Investigations [2.2] 分類器における下流バイアスの1つの原因は、トレーニングデータに存在するバイアスであると広く考えられている。
保護された機能と保護されていない機能からなるデータセットの$X$、結果の$y$、および$X$の$y$を予測するregressor $h$を示す。
機械学習コミュニティは、指数関数的に大きなサブグループクラスでさえ、大きなFID値を持つサブグループを効率的に見つけることができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:03:48 GMT)
Review of Computational Epigraphy [2.2] 計算エピノグラフィー(Computational Epigraphy)とは、石碑文、訳文、解釈、帰属からテキストを抽出する過程のこと。
伝統的なエピノグラフィー法は時間がかかり、テキストを抽出しながら碑文を損傷させる傾向がある。
現代の手法を使えば、テキストを抽出するだけでなく、頑健な方法でテキストを解釈し、属性付けすることが可能になる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:55:24 GMT)
Patch-Based Encoder-Decoder Architecture for Automatic Transmitted Light to Fluorescence Imaging Transition: Contribution to the LightMyCells Challenge [2.2] ラベルなし光入力画像から蛍光ラベル付きオルガネラの自動予測は重要な課題であるが難しい課題である。
本稿では, 蛍光標識された核, ミトコンドリア, チューリン, アクチンを自動的に予測するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:49:34 GMT)
Quantum Theory and Application of Contextual Optimal Transport [2.2] 本稿では、文脈化された輸送計画の記憶的最適化のための、第一種量子コンピューティングの定式化を提案する。
従来のニューラルOTアプローチと一致しない性能を報告する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:42:55 GMT)
Reciprocal Reward Influence Encourages Cooperation From Self-Interested Agents [2.1] 本稿では,リシプロエータ,強化学習エージェントを導入し,相手の行動がリターンに与える影響を再現する。
共用者は同時学習中に時間的に拡張された社会ジレンマの協力を促進するために使用できることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:07:27 GMT)
animal2vec and MeerKAT: A self-supervised transformer for rare-event raw audio input and a large-scale reference dataset for bioacoustics [2.1] 本稿では, スパースおよびアンバランスな生体音響データに適した, 完全に解釈可能なトランスフォーマーモデルと自己教師型トレーニングスキームである animal2vec フレームワークを提案する。
MeerKAT: Meerkat Kalahari Audio Transcriptsは、バイオブロガーが収集したオーディオを含む大規模なデータセットで、1068hを超える自由配置ミーアカートを公開しています。
両データセットの最新の結果について報告し,ラベル付きトレーニングデータのAnimal2vecの少数ショット機能の評価を行った。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:11:01 GMT)
CyberMetric: A Benchmark Dataset based on Retrieval-Augmented Generation for Evaluating LLMs in Cybersecurity Knowledge [2.1] 大規模言語モデル(LLM)は、ソフトウェア開発からサイバー脅威インテリジェンスまで、さまざまな領域でますます利用されている。
サイバーセキュリティにおけるLLMの一般的な知識を正確にテストするためには、研究コミュニティは多様で正確で最新のデータセットが必要である。
我々はCyberMetric-80,CyberMetric-500,CyberMetric-2000,CyberMetric-10000を紹介する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:14:45 GMT)
Predicting Drug-Gene Relations via Analogy Tasks with Word Embeddings [2.1] BioConceptVecは、生物学に適した埋め込みの具体例である。
そこで本研究では,BioConceptVecの埋め込みには薬物遺伝子関係に関する情報が含まれており,類似の計算によって薬剤の標的遺伝子を予測することができることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:36:38 GMT)
S-CycleGAN: Semantic Segmentation Enhanced CT-Ultrasound Image-to-Image Translation for Robotic Ultrasonography [2.1] 我々はS-CycleGANと呼ばれる高度なディープラーニングモデルを導入し,CTデータから高品質な合成超音波画像を生成する。
合成画像は、セマンティックセグメンテーションモデルとロボット支援超音波スキャンシステムの開発のためのトレーニングデータセットを強化するために使用される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:53:45 GMT)
Embedding Privacy in Computational Social Science and Artificial Intelligence Research [2.0] プライバシーの保護は研究の重要な要素として浮上している。
高度な計算モデルの利用の増加は、プライバシーの懸念を悪化させる。
この記事では、プライバシの役割と、CSS、AI、データサイエンス、および関連するドメインで働く研究者が直面する問題について議論することによって、この分野に貢献する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:32:04 GMT)
Luna: An Evaluation Foundation Model to Catch Language Model Hallucinations with High Accuracy and Low Cost [1.9] Retriever Augmented Generation (RAG) システムは,言語モデルの能力向上に重要な役割を担っている。
現在の幻覚検出技術は、精度、低レイテンシ、低コストを同時に提供できない。
本稿では,RAG設定における幻覚検出のためのLuna: a DeBERTA-large (440M)エンコーダについて紹介する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:14:21 GMT)
Assessing the Adversarial Security of Perceptual Hashing Algorithms [1.9] 知覚ハッシュアルゴリズム(PHA)は、違法なオンラインコンテンツを識別するために広く利用されている。
本稿では,PhotoDNA,PDQ,NeuralHashの3つの主要なPHAを比較した。
これらのPHAは、歪みやクエリ予算に関する現実的な制約を適用した場合、ブラックボックスの敵攻撃に対してレジリエンスを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:04:50 GMT)
Federated Learning-based Collaborative Wideband Spectrum Sensing and Scheduling for UAVs in UTM Systems [1.9] 無人航空機における広帯域スペクトルの協調検出とスケジューリングのためのデータ駆動型フレームワークを提案する。
モデルトレーニングの段階では,マルチセル環境におけるデータセット生成について検討する。
第2に、協調スペクトル融合段階において、協調スペクトル融合戦略を提案する。
最後に、スペクトルスケジューリング段階において、検出されたスペクトル孔を二次ユーザへ動的に割り当てるために強化学習ソリューションを利用する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:39:27 GMT)
REBUS: A Robust Evaluation Benchmark of Understanding Symbols [1.9] GPT-4oは他の全てのモデルよりも大幅に優れ、続いてプロプライエタリなモデルも他の評価モデルよりも優れていた。
最高のモデルでさえ、最終的な精度はわずか42%で、ハードパズルでは7%に低下する。
したがって、我々のベンチマークは、マルチモーダルな大言語モデルの知識と推論における大きな欠点を特定するのに利用できる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:49:45 GMT)
nn2poly: An R Package for Converting Neural Networks into Interpretable Polynomials [1.9] nn2polyパッケージは、ニューラルネットワークの説明と解釈を行うNN2メソッドのRの実装を提供する。
このパッケージは、Rの主要なディープラーニングフレームワークパッケージとの統合を提供する。
他のニューラルネットワークパッケージも、その重みをリスト形式に含めることで使用できる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:59:30 GMT)
In-Context Learning of Physical Properties: Few-Shot Adaptation to Out-of-Distribution Molecular Graphs [1.9] コンテキスト内学習は推論中のみに非自明な機械学習タスクを実行することができる。
この研究で、我々は、イン・コンテクスト・ラーニングを利用して、配布外物質特性を予測できるだろうか?
我々は、GPT-2が幾何認識グラフニューラルネットワークの出力に作用し、コンテキスト内情報に適応する複合モデルを用いる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:59:21 GMT)
Understanding Domain-Size Generalization in Markov Logic Networks [1.8] マルコフ論理ネットワーク(MLN)の一般化挙動を,大きさの異なる関係構造にまたがって検討する。
我々は、この矛盾を定量化し、MLNパラメータの分散の観点から境界付ける。
我々は、正規化やドメインサイズ認識MLNなどのMLNパラメータの分散を減少させることで知られている解が、MLNの内部整合性を高めることを観察する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:30:52 GMT)
Towards Harnessing Large Language Models for Comprehension of Conversational Grounding [1.8] 本研究では,対話を分類する際の大規模言語モデルの能力について,明示的あるいは暗黙的な接地と,接地された知識要素の予測に関する考察を行った。
実験の結果,2つの課題において大きな言語モデルが直面する課題が明らかになった。
これらのイニシアチブは、会話における基礎知識の複雑さを扱うために、より効果的な対話システムを開発することを目的としている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:34:39 GMT)
Generalization Bounds for Heavy-Tailed SDEs through the Fractional Fokker-Planck Equation [1.8] 重み付きSDEに対して、非自明な情報理論項を伴わない高確率境界一般化を証明した。
以上の結果から,重尾は問題構造によって有益か有害かのどちらかである可能性が示唆された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:20:34 GMT)
What Are Large Language Models Mapping to in the Brain? A Case Against Over-Reliance on Brain Scores [1.8] 大規模言語モデル(LLM)の内部表現は最先端の脳スコアを達成し、人間の言語処理と計算原理を共有するという憶測に繋がる。
本稿では、LLM-to-Brainマッピングに関する衝撃的な研究で使用される3つのニューラルデータセットを分析し、参加者が短いパスを読み取るfMRIデータセットに特に焦点をあてる。
このデータセット上で訓練されたLLMの脳のスコアは、文の長さ、位置、代名詞による単語の埋め込みによって大きく説明できる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:13:27 GMT)
Resampling methods for private statistical inference [1.8] 我々は、信頼区間を異なるプライバシーで構築する作業について検討する。
データのパーティション上で実行される複数の"小さな"ブートストラップの結果の中央値をプライベートに計算する,非パラメトリックブートストラップの2つのプライベート変種を提案する。
固定された差分プライバシーパラメータ$epsilon$に対して、我々のメソッドは、サンプルサイズ$n$の対数係数内の非プライベートブートストラップと同じエラー率を享受します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:47:44 GMT)
NU-Class Net: A Novel Approach for Video Quality Enhancement [1.8] 本稿では,圧縮コーデックによる圧縮アーチファクトの軽減を目的とした,革新的な深層学習モデルであるNU-Class Netを紹介する。
NU-Class Netを利用することで、ビデオキャプチャノード内のビデオエンコーダは出力品質を低下させ、低ビットレートのビデオを生成することができる。
実験により,低ビットレートでストリーミングされたビデオの知覚品質を高めるためのモデルの有効性が確認された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:09:55 GMT)
Unlocking Guidance for Discrete State-Space Diffusion and Flow Models [1.8] 本稿では、離散状態空間モデルにガイダンスを適用するための汎用的および原則的手法を提案する。
提案手法は, 画像のガイド生成, 小分子, DNA配列, タンパク質配列など, 様々な用途に応用できることを実証する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:51:54 GMT)
Wasserstein gradient flow for optimal probability measure decomposition [1.7] 最適サブ尺度の支持構造を解析的に検討し、ワッサーシュタイン勾配流に基づくアルゴリズムを導入する。
数値的な結果は、我々のアルゴリズムの実装可能性を示し、さらなる洞察を提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 00:47:32 GMT)
CompanyKG: A Large-Scale Heterogeneous Graph for Company Similarity Quantification [1.7] 我々は,企業の特徴や関係を多様に表現し,学習するための知識グラフである企業KGを提案し,公開する。
具体的には、131万の企業が、企業記述の埋め込みに富んだノードとして表現されている。
15の異なる企業間関係は、51.06万の重み付きエッジをもたらす。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:19:01 GMT)
Compute-Efficient Medical Image Classification with Softmax-Free Transformers and Sequence Normalization [1.6] Transformerモデルは、自然言語処理、音声認識、コンピュータビジョンなどの進歩する分野において重要な役割を担っている。
このモデルの重要な制限は、シーケンス長に対して2次計算とメモリの複雑さである。
これは、高解像度画像がギガピクセルスケールに達する医療画像において特に重要である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:27:08 GMT)
Coined Quantum Walk on a Quantum Network [1.6] 量子ネットワークにおけるウォーカーコインとクビット自由度とのユニタリ相互作用から、ウォーカームーブメントのコヒーレントな重ね合わせが生じる量子ネットワーク上で、離散時間で造られた量子ウォークを探索する。
歩行力学は、歩行者とネットワークの間の絡み合いが増大し、他方では、ネットワーク量子ビット間の絡み合いが増大する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:40:22 GMT)
The Heterogeneous Productivity Effects of Generative AI [1.6] イタリアのChatGPT禁止による個人の生産性への影響を分析します。
イタリアおよび他のヨーロッパ諸国の36,000以上のGitHubユーザの毎日のコーディングアウトプット量と品質に関するデータをコンパイルする。
経験者の少ないユーザでは生産量と品質が短期的に増加し,経験者の日常的なタスクでは生産性が低下することがわかった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:21:01 GMT)
Human vs. Machine: Behavioral Differences Between Expert Humans and Language Models in Wargame Simulations [1.6] 大規模言語モデル(LLM)は、高い軍事的意思決定シナリオにおいて、人間と異なる振る舞いを示す。
当社の結果は、自律性を認める前に政策立案者が慎重であること、あるいはAIベースの戦略レコメンデーションに従うことを動機付けています。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:00:47 GMT)
A Robust Filter for Marker-less Multi-person Tracking in Human-Robot Interaction Scenarios [1.4] マーカーレス人間ロボットインタラクション(HRI)は、長年にわたってロボット工学の研究に重点を置いてきた。
人間のポーズ推定(HPE)と深度カメラにおける本質的な誤りによって引き起こされる課題に対して、最先端の課題が解決される。
これらの課題に対処するために,不完全な3Dポーズと1台のRGB-Dカメラを改良するフィルタリングパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:59:53 GMT)
Revisiting Step-Size Assumptions in Stochastic Approximation [1.4] この論文は、一般的なマルコフ的な設定でステップサイズの選択を再考する。
大きな結論は、$rho =0$ または $rho1/2$ の選択は、選択した設定でのみ正当化されるということである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:05:52 GMT)
RSMM: A Framework to Assess Maturity of Research Software Project [1.3] 本稿では,研究ソフトウェア管理の評価と改善のためのフレームワークであるRSMMを紹介する。
RSMMは79のベストプラクティスを分類することで、研究ソフトウェア管理の評価と精錬のための構造化された経路を提供する。
リサーチソフトウェア開発に関わる個人や組織は、さまざまなリサーチソフトウェアエンジニアリング課題に取り組むための体系的なアプローチを得る。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:10:05 GMT)
SST-GCN: The Sequential based Spatio-Temporal Graph Convolutional networks for Minute-level and Road-level Traffic Accident Risk Prediction [1.3] 本稿では,SST-GCN(Sequential based Spatio-Temporal Graph Convolutional Networks)を提案する。
実験により、SST-GCNは他の最先端モデルよりも小さなレベル予測の方が優れていることが示された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:44:05 GMT)
Constraint-based Adversarial Example Synthesis [1.3] この研究は、ニューラルネットワークを実装するPythonプログラムをテストするための特殊なテクニックであるConcolic Testingの強化に焦点を当てている。
拡張ツールであるPyCTは、浮動小数点演算やアクティベーション関数計算など、幅広いニューラルネットワーク操作に対応している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:35:26 GMT)
Automatic Fused Multimodal Deep Learning for Plant Identification [1.2] 自動モーダル融合を用いた植物分類のための先駆的な多モードDLベースのアプローチを提案する。
PlantCLEF2015データセットの956クラスに対して,83.48%の精度を達成した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:43:29 GMT)
Unelicitable Backdoors in Language Models via Cryptographic Transformer Circuits [1.1] 自己回帰型トランスフォーマーモデルに新しいバックドアのクラスを導入する。
無効性により、ディフェンダーがバックドアを起動するのを防ぎ、デプロイ前に評価や検出が不可能になる。
我々は, 暗号技術を用いることで, 新規な構築が不必要であるだけでなく, 良好な堅牢性を有することを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:55:41 GMT)
A Perspective on Crowdsourcing and Human-in-the-Loop Workflows in Precision Health [1.1] この視点では、この新興分野における既存の研究について述べ、クラウドを利用した診断システムにおける現在進行中の課題と機会について論じる。
群衆労働者は、金銭的補償やゲーミフィケーション体験の見返りに、複雑な行動特徴に注釈を付けるために支払われる。
これらのラベルは、直接または診断機械学習モデルへの入力としてラベルを使用することによって、診断を導出するために使用することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:56:08 GMT)
Provable Optimality of the Square-Tooth Atomic Frequency Comb Quantum Memory [1.1] 原子周波数コム(AFC)量子メモリは、量子リピータネットワークにとって有望な技術である。
最適化された2乗歯形 AFC は, 上顎骨歯形の中で最も高い検索効率が得られることを示す。
我々の証明は、現実的な実験条件下で最適なAFCを作成する方法について、厳密な議論を実験者に提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:23:38 GMT)
TE-NeXt: A LiDAR-Based 3D Sparse Convolutional Network for Traversability Estimation [1.1] 本稿では,疎LiDAR点雲からのトラバーサビリティ推定(TE)のための新規かつ効率的なアーキテクチャであるTE-NeXtを提案する。
TE-NeXtブロックは、注意機構や3次元スパース畳み込みといった現在のトレンドの概念を融合させる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:58:49 GMT)
Partial Degeneration of Tensors [1.0] 局所線型写像の一方が定数である一方、他方は曲線に沿って変化する部分退化について検討する。
部分退化の存在は、テンソルの助けられたランクに強い上限を与えるので、退化を制約にすることができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:29:48 GMT)
Model Assessment and Selection under Temporal Distribution Shift [1.0] 我々は,与えられたモデルの一般化誤差を推定する適応型ローリングウインドウ手法を開発した。
また、ペアワイズ比較を単一消去トーナメントに統合し、候補の集合から最適に近いモデル選択を行う。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:30:38 GMT)
Scaling Up Deep Clustering Methods Beyond ImageNet-1K [0.9] 本研究では,大規模ベンチマークにおける機能ベースのディープクラスタリング手法の性能について検討する。
我々の実験分析によると、機能ベースの$k$-meansはバランスの取れたデータセットで不公平に評価されることが多い。
ディープクラスタリングメソッドは、ほとんどの大規模ベンチマークで$k$-meansを上回っている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:13:27 GMT)
Automatic Input Feature Relevance via Spectral Neural Networks [0.9] 本稿では,ディープニューラルネットワークにおける入力成分の相対的重要性を推定する新しい手法を提案する。
これは最適化プロセスのスペクトル再パラメータ化を活用することで達成される。
この手法は、合成データと実データの両方に対してうまく挑戦されている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:39:12 GMT)
ValiTex -- a unified validation framework for computational text-based measures of social constructs [0.9] 本稿では,テキストデータ中の社会的構造を有効に測定する上で,研究者を支援するための新たな検証フレームワークであるValiTextを紹介する。
この枠組みは、社会科学における妥当性の概念的基礎の上に構築され、社会科学における検証実践の実証的なレビューによって強化されている。
最終的にValiTextは、研究者に3種類の検証証拠を処方する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:32:02 GMT)
Efficient Inverse Design Optimization through Multi-fidelity Simulations, Machine Learning, and Search Space Reduction Strategies [0.9] 本稿では,限られた計算量で制約されたシナリオにおける逆設計最適化プロセスの拡張を目的とした手法を提案する。
提案手法はエアフォイル逆設計とスカラーフィールド再構成の2つの異なる工学的逆設計問題について解析する。
特に、この方法は、任意の逆設計アプリケーションに適用可能であり、代表的低忠実MLモデルと高忠実度シミュレーションの相乗効果を容易にし、様々な集団ベース最適化アルゴリズムにシームレスに適用することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:42:45 GMT)
Generative AI as a Learning Buddy and Teaching Assistant: Pre-service Teachers' Uses and Attitudes [0.9] 我々は、Ghana PSTsが生成人工知能(GenAI)の応用に用いている167点を調査した。
我々は、PSTのGenAIに対する態度を形作る3つの重要な要因、教育、学習、倫理的・擁護的要因を特定した。
PSTは、GenAIアプリケーションが提供する情報の正確性と信頼性に関する懸念を表明している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:38:29 GMT)
Latency Adjustable Transformer Encoder for Language Understanding [0.8] 本稿では,提案する推論遅延の高速化により,推論コストを適応的に調整する効率的なトランスフォーマーアーキテクチャを提案する。
提案手法は,重要でないシークエンス要素(ワードベクター)を検出し,Actent Context Contribution (ACC) メトリックを用いて,各エンコーダ層でそれらを除去する。
提案手法は,BERT_base と GPT-2 の推論遅延を最大4.8倍,3.72倍に改善し,0.75% の精度低下と平均パープレキシティが可能である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:12:10 GMT)
Distributional Refinement Network: Distributional Forecasting via Deep Learning [0.8] アクチュエータモデリングにおける重要なタスクは、損失の分布特性をモデル化することである。
本稿では,本質的に解釈可能なベースラインモデルとフレキシブルニューラルネットワークを組み合わせた分散リファインメントネットワーク(DRN)を提案する。
DRNは、全ての量子化の様々な効果を捉え、適切な解釈性を維持しながら予測性能を向上させる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:14:32 GMT)
BaboonLand Dataset: Tracking Primates in the Wild and Automating Behaviour Recognition from Drone Videos [0.8] 本研究では,バブーン検出,追跡,行動認識のための,ドローンビデオからの新たなデータセットを提案する。
Baboon検出データセットは、ドローンビデオにすべてのbaboonをバウンディングボックスで手動でアノテートすることで作成されている。
行動認識データセットは、各動物を中心としたビデオサブリージョンであるミニシーンにトラックを変換することで生成される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 23:24:39 GMT)
Fast photon-mediated entanglement of continuously-cooled trapped ions for quantum networking [0.8] 我々は、各イオンから1つの可視光子を真空0.8NAの目的によって集めることで、2つのコトラップされた原子バリウムイオン量子ビットを絡み合わせる。
これにより、クォービットは、観測された忠実度が F > 94% 以下の絡み合ったベル状態に投影される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:57:21 GMT)
FissionFusion: Fast Geometric Generation and Hierarchical Souping for Medical Image Analysis [0.8] 十分に注釈付けされた医療データセットの不足は、ImageNetのような広範なデータセットやCLIPのような事前訓練されたモデルからの移行学習を活用する必要がある。
モデルスープは、In-Domain(ID)タスクのパフォーマンスを改善し、out-of-Distribution(OOD)データセットに対する堅牢性を高めることを目的とした、複数の微調整されたモデルの平均である。
本稿では,様々なレベルのモデルの局所的および大域的集約を伴う階層的統合手法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:11:52 GMT)
Null Compliance: NYC Local Law 144 and the Challenges of Algorithm Accountability [0.8] 2023年7月、ニューヨーク市は、商用のアルゴリズムシステムのバイアス監査を義務付ける世界で最初の司法管轄区域となった。
LL 144は、AEDTをレースとジェンダーの偏見のために毎年個別に監査することを要求している。
本研究では,学生調査員155人がLL 144に対する雇用主のコンプライアンスと求職希望者のユーザ体験を391名記録した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:01:20 GMT)
Incorporating Memory into Propagation of 1-Electron Reduced Density Matrices [0.7] 本稿では,時間依存構成相互作用における1ドル電子還元密度行列のメモリ依存性を理解するために,本手法を適用した。
我々の導出は、基底集合、電子の数、波動関数におけるスレーター行列式の選択に関係なく、任意のTDCI系に適用される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:47:37 GMT)
Microwave-multiplexed qubit controller using adiabatic superconductor logic [0.7] 低温量子ビットコントローラ(QC)は、大規模超伝導量子プロセッサを構築する鍵である。
超低消費電力超伝導体論理系,すなわち断熱量子流-パラメタトロン論理系を用いたスケーラブルQCについて報告する。
AQFP-mux QCは、キュービット当たり81.8pWの極小消費電力で、キュービット制御のためのマルチトンマイクロ波信号を生成する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:21:09 GMT)
Sample Efficient Reinforcement Learning with Partial Dynamics Knowledge [0.7] オンラインQ-ラーニング手法のサンプル複雑性について,動的知識が利用可能であったり,効率的に学習できたりした場合に検討する。
我々は,$f$の完全知識の下で,$tildemathcalO(textPoly(H)sqrtSAT)$ regretを達成する楽観的なQ-ラーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:17:33 GMT)
The Origin of Information Handling [0.7] ケミカルオートマトンによる情報処理の起源と進化について説明する。
化学計算における主観的遷移を正確に記述することにより、この比喩は上記のギャップを説明することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:30:54 GMT)
Entanglement-swapping in generalised probabilistic theories, and iterated CHSH games [0.7] 一般化確率論(GPT)における絡み合い交換の研究
我々は,GPTのパワーを計測し,非古典的相関を保ちながら繰り返しCHSHゲームを導入する。
このことは、最近文献で提起されたそのようなゲームに対する量子論の最適性に関する問題に対処する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:07:53 GMT)
Poisson Geometric Formulation of Quantum Mechanics [0.7] 有限次元混合状態と純粋状態に対する量子力学の幾何学的定式化について検討する。
量子力学は古典力学の言語で理解可能であることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:48:33 GMT)
Neutral-atom qubits in atom-molecular BEC [0.7] 原子-分子ボース-アインシュタイン凝縮体における原子量子ビットの実現を3つの異なるクラスに分けて示す。
エネルギーレベルの分離、ヒーリング長、原子番号などの関連するパラメータは、光結合の非線形性と強度に影響される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:17:59 GMT)
Enabling ASR for Low-Resource Languages: A Comprehensive Dataset Creation Approach [0.6] 本研究では,オーディオブックからASRトレーニングデータセットを生成するための新しいパイプラインを提案する。
これらのオーディオブックの共通構造は、音声セグメントの幅が広いため、ユニークな課題である。
本稿では,音声を対応するテキストと効果的に整合させ,それをASR訓練に適した長さに分割する手法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:38:40 GMT)
Estimating the normal-inverse-Wishart distribution [0.6] NIWファミリーにおける平均パラメータから自然パラメータへ変換する収束手順について述べる。
これは、期待伝搬にNIWベースファミリを使用する場合に必要である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:26:10 GMT)
Inverse design of photonic surfaces on Inconel via multi-fidelity machine learning ensemble framework and high throughput femtosecond laser processing [0.6] フォトニック表面の逆設計のためのMF(Multi-fidelity)機械学習アンサンブルフレームワークを実証する。
MFアンサンブルは、設計ソリューションを生成するための初期低忠実度モデルと、これらのソリューションを局所最適化によって洗練する高忠実度モデルを組み合わせる。
本手法は, エネルギー収穫への応用において, フォトニック表面の逆設計を推し進めるための強力なツールを提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:59:19 GMT)
Adapting coherent-state superpositions in noisy channels [0.6] 量子非ガウス状態は非線形ボゾン系の基本的な理解に不可欠である。
本研究では,不斉熱損失チャネルの列に対するコヒーレント状態の重ね合わせを適切なスキューズ操作により最適に保護することを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:00:18 GMT)
Cardinality Estimation over Knowledge Graphs with Embeddings and Graph Neural Networks [0.6] KG(Cardinality Estimation over Knowledge Graphs)は、クエリ最適化において重要である。
本稿では,知識グラフ埋め込みとグラフニューラルネットワーク(GNN)を活用して,結合クエリの濃度を正確に予測する新しい手法であるGNCEを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:51:54 GMT)
Generate and Pray: Using SALLMS to Evaluate the Security of LLM Generated Code [0.5] 本稿では,セキュアなコードを体系的に生成する大規模言語モデルの能力をベンチマークするフレームワークであるSALLMについて述べる。
フレームワークには3つの主要なコンポーネントがある。セキュリティ中心のPythonプロンプトの新たなデータセット、生成されたコードを評価するための評価テクニック、セキュアなコード生成の観点からモデルのパフォーマンスを評価するための新しいメトリクスである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:50:23 GMT)
Two-dimensional coherent spectrum of high-spin models via a quantum computing approach [0.5] 我々は、高スピンモデルの2次元コヒーレントスペクトル(2DCS)を計算するために量子コンピューティングアプローチをベンチマークする。
1次元コヒーレントスペクトルを2DCSと比較することにより、2DCSがエネルギースペクトルの高分解能を提供することを示す。
サイト数が増加するスピンモデルの数値シミュレーションは、量子資源のシステムサイズスケーリングを示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:35:47 GMT)
Learning to optimize with convergence guarantees using nonlinear system theory [0.4] 本研究では,スムーズな目的関数に対するアルゴリズムの非制約パラメトリゼーションを提案する。
特に、私たちのフレームワークは自動微分ツールと直接互換性があります。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:10:27 GMT)
An approximation-based approach versus an AI one for the study of CT images of abdominal aorta aneurysms [0.3] 腹部大動脈瘤のCT像に対する2つのアプローチについて検討した。
決定論的アプローチは関東ロビッチ作用素のサンプリングと背景理論を採用し、これらの演算子の画像への再構成と拡張能力を活用している。
人工知能ベースのアプローチは、U-netニューラルネットワークに基づいている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:11:27 GMT)
Deep reinforcement learning for weakly coupled MDP's with continuous actions [0.3] 本稿では,連続行動空間と弱結合なMDP問題を対象とした強化学習アルゴリズムであるLagrange Policy for Continuous Actions (LPCA)を紹介する。
LPCAは、Q値計算のためのニューラルネットワークフレームワークにおいて、弱い結合のMDP問題のラグランジュ緩和を導入することで、継続的な行動に依存するリソース制約の課題に対処する。
グローバル最適化に差分進化を利用するLPCA-DEと,Q値勾配に基づく行動の漸進的かつ段階的に選択するLPCA-Greedyの2つのバリエーションを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:34:32 GMT)
Eye-tracking in Mixed Reality for Diagnosis of Neurodegenerative Diseases [0.3] パーキンソン病は世界で2番目に多い神経変性疾患である。
本研究の目的は、眼球運動の追跡・評価にMixed Reality機能を活用するシステムを開発することである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:45:42 GMT)
The Danger Within: Insider Threat Modeling Using Business Process Models [0.3] 本稿では、BPMN(Business Process Modeling and Notation)を利用した新たなインサイダー脅威知識ベースと脅威モデリングアプリケーションを開発する。
その結果は、アノテーションなしでもBPMNダイアグラムを利用して組織内の脅威を自動的に識別できることを示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:26:53 GMT)
Q-BiC: A biocompatible integrated chip for in vitro and in vivo spin-based quantum sensing [0.2] 光処理可能なスピンベースの量子センサーは、システムの温度、磁場、pH、その他の物理的特性のナノスケールの測定を可能にする。
マイクロ流体に適合したマイクロ波の伝送を容易にする量子バイオセンシングチップ(Q-BiC)について述べる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:26:15 GMT)
Symmetry Resolution in non-Lorentzian Field Theories [0.2] 特に、先行順序項、対数項、$mathcalO(1)$項を計算する。
キャロル極限に対するSREEのホログラフィック原点を念頭に置いて、BMS$_3$-Kac-Moody に対するSREEをさらに計算する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:41:22 GMT)
Emergence of a second law of thermodynamics in isolated quantum systems [0.2] 熱力学の第2法則は、孤立系のエントロピーは時間とともにしか増加しないと述べている。
これは、Schr"odinger方程式の下で孤立量子系の可逆進化と矛盾しているように見える。
与えられた可観測性に関するエントロピーは、系のユニタリ進化の過程でその平衡値に傾向を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:00:01 GMT)
RAG Enabled Conversations about Household Electricity Monitoring [0.2] 本稿では,大規模言語モデル(LLM)と検索拡張生成の統合について検討し,電気データセットに関する複雑な質問に対する応答の精度と特異性を高める。
本稿では、我々の方法論を詳述し、RAGを用いた応答と非応答の比較分析を行い、エネルギーデータ分析のような専門分野におけるAIの今後の応用について考察する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:44:32 GMT)
Crisis Communication in the Face of Data Breaches [0.2] 本稿では,データ漏洩危機コミュニケーション戦略とその実践的実行について検討する。
本論文は,データ漏洩の危機,その特異性,管理に特化して研究領域に貢献する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:21:04 GMT)
Multi-Object Tracking based on Imaging Radar 3D Object Detection [0.1] 本稿では,古典的追跡アルゴリズムを用いて,周囲の交通参加者を追跡する手法を提案する。
学習に基づく物体検出器はライダーとカメラのデータに適切に対応し、学習に基づく物体検出器は標準のレーダーデータ入力により劣っていることが示されている。
レーダセンサ技術の改良により、レーダの物体検出性能は大幅に改善されたが、レーダ点雲の広さによりライダーセンサに制限されている。
追跡アルゴリズムは、一貫したトラックを生成しながら、限られた検出品質を克服しなければならない。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:46:23 GMT)
Automatic Cranial Defect Reconstruction with Self-Supervised Deep Deformable Masked Autoencoders [0.1] 毎年何千人もの人が頭蓋骨の損傷を負っています。再建手術の前にデザインと製造が必要なパーソナライズされたインプラントが必要です。
この問題は容積形状の完備化として定式化することができ、教師付きイメージセグメンテーション専用のディープニューラルネットワークによって解決される。
本研究では,この問題を解決するために自己教師付きマスク付きオートエンコーダを用いる方法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:44:26 GMT)
A Theory of Learnability for Offline Decision Making [0.1] 本稿では,学習目標に部分的に相関したデータセットから決定を学習することに焦点を当てたオフライン意思決定の問題について検討する。
オフラインフィードバックを用いた意思決定(Decision Making with Offline Feedback, DMOF)と呼ばれる統合フレームワークを導入する。
我々はまた、インスタンス依存上界とミニマックス上界の両方を確立する、EDD(Empirical Decision with Divergence)と呼ばれるアルゴリズムも導入した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:42:31 GMT)
BISON: Blind Identification through Stateless scOpe-specific derivatioN [0.1] GoogleやFacebookのような認証プロバイダに認証を委譲することは便利だが、ユーザーのプライバシーを侵害する。
我々は、BISONの仮称派生プロトコルを提示することで、どちらも必要悪ではないことを示す。
サービスプロバイダのIDをIDプロバイダから隠しますが、信頼され、スコープ化され、不変の偽名を生成します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:48:47 GMT)
Tracing quantum correlations back to collective interferences [0.0] 本研究では、2つの量子系間の非古典的相関を、2つの系の集合状態間の量子干渉の観点から検討する。
本研究では, 確率電流と相関の関係を, 干渉計による連続条件(準)確率電流で表すことができることを示す。
この結果は、量子力学における非局所相関の意味を説明し、干渉が全ての量子現象の起源であるというファインマンの主張を支持するのに役立つ。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:04:10 GMT)
fruit-SALAD: A Style Aligned Artwork Dataset to reveal similarity perception in image embeddings [0.0] スタイルアラインドアートワークデータセット(SALAD)を紹介する。
このセマンティックなカテゴリとスタイルのベンチマークは、10の区別容易なスタイルに対して、10の認識容易なフルーツカテゴリのそれぞれ100のインスタンスで構成されている。
SALADフレームワークは、これらのモデルがどのようにセマンティックなカテゴリとスタイル認識タスクを実行するかの比較を可能にする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:47:48 GMT)
Virtual avatar generation models as world navigators [0.0] 本稿では,仮想アバターを用いたロッククライミング環境における人間の動きをシミュレーションする新しいビデオモデルSABR-CLIMBを紹介する。
拡散変換器は、各拡散ステップのノイズの代わりにサンプルを予測し、全動画を取り込み、完全なモーションシーケンスを出力する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:10:15 GMT)
Using Constraints to Discover Sparse and Alternative Subgroup Descriptions [0.0] サブグループ発見法により、ユーザはデータセットで興味深い領域の簡単な記述を取得できる。
まず、サブグループ記述で使用される機能の数を制限し、後者はスパース化します。
第二に、与えられたサブグループと類似したデータオブジェクトの集合をカバーするが、異なる特徴を持つ代替サブグループ記述を見つけるための新しい最適化問題を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:10:01 GMT)
Using Artificial Intelligence to Accelerate Collective Intelligence: Policy Synth and Smarter Crowdsourcing [0.0] 我々は、人工知能を用いて、緊急問題の効果的な解決策をより効率的に作成するための革新的で効果的なモデルを提案する。
クラウドソーシングを通じて、問題に関する専門知識を持つ人々の集合的インテリジェンスを行動可能なソリューションに変換するために設計された、Smarter Crowdsourcingと呼ばれる、実証済みの集合的インテリジェンス手法について説明する。
AIを活用して、よりスケーラブルで、より効果的で、より効率的な、スマートなクラウドソーシングの問題解決アプローチを実現する革新的なツールキットであるPolicy Synthを紹介します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:27:23 GMT)
Unitary Dynamics for Open Quantum Systems with Density-Matrix Purification [0.0] 我々は密度行列精製を用いたオープン量子システム(OQS)理論を強化する。
浄化は、システムと等次元の環境を絡み合わせることで、力学の統一的な記述を可能にする。
我々は、量子シミュレータに密度行列の精製を実装し、量子コンピュータに適したユニタリフレームワークに非ユニタリなOQSダイナミクスをマッピングする能力を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:00:24 GMT)
Understanding Sample Generation Strategies for Learning Heuristic Functions in Classical Planning [0.0] 本研究では,従来の計画課題において,コスト・ツー・ゴールの推定値で表されるサンプルに基づいて,従来の計画課題のよい関数を学習する問題について検討する。
我々の主なゴールは、学習機能によって誘導される欲求最優先ニューラルサーチ(GBFS)の性能に対するサンプル生成戦略の影響をよりよく理解することである。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:24:38 GMT)
UltraCortex: Submillimeter Ultra-High Field 9.4 T1 Brain MR Image Collection and Manual Cortical Segmentations [0.0] UltraCortexリポジトリには、超高磁場強度9.4Tで得られたヒト脳の磁気共鳴画像データが格納されている。
86枚の構造MR画像を含み、空間解像度は0.6mmから0.8mmである。
このレポジトリは、12の脳をグレーとホワイトの物質区画に分割する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:48:17 GMT)
Towards Transparency: Exploring LLM Trainings Datasets through Visual Topic Modeling and Semantic Frame [0.0] 我々は、AIと認知科学を活用してテキストデータセットの洗練を改善するソフトウェアであるBunkaを紹介する。
トピックモデリングと2次元カルトグラフィーを組み合わせることで、データセットの透明性が向上することを示す。
最後に、フレーム分析を用いることで、トレーニングコーパス内の既存のバイアスに対する洞察が得られることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:44:13 GMT)
Towards Automating the Retrospective Generation of BIM Models: A Unified Framework for 3D Semantic Reconstruction of the Built Environment [0.0] 情報モデリングの構築は建設プロジェクトで有益である。
しかし、3Dモデルの詳細をBIMに変換する統一的でスケーラブルなフレームワークがないため、課題に直面している。
本稿では,BIM生成のための統合意味再構築アーキテクチャであるSR BIMを紹介する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:07:41 GMT)
Tomographic Reconstruction and Regularisation with Search Space Expansion and Total Variation [0.0] 不完全なデータの処理は、患者が潜在的に放射線を損傷したり、長いスキャン時間に対処できない場合に重要である。
本稿では,画像空間内を粒子が移動し,再構成誤差を最小限に抑えるために,Swarmをベースとした再構成手法を提案する。
提案手法は, 標準的なトモグラフィ再構成ツールボックスアルゴリズムと比較して, 再現誤差が低いことを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:57:43 GMT)
Toffoli gate based on a three-body fine-structure-state-changing Förster resonance in Rydberg atoms [0.0] 我々は,3体リングバーグ相互作用を変化させる微細構造状態に基づく3量子トフォリゲートの改良手法を開発した。
計算の結果, ゲート忠実度は99%であった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:45:15 GMT)
Theory of Eigenstate Thermalisation [0.0] Deutsch と Srednicki の固有状態熱化仮説 (ETH) は、完全な量子系の固有状態がそのサブシステムへの熱浴として作用するため、これが可能であることを示唆している。
我々の分析は、エルゴード性や典型性の概念もエントロピーの概念も必要としない統計力学の導出を提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:41:16 GMT)
The hop-like problem nature -- unveiling and modelling new features of real-world problems [0.0] 最適化プロセスのホップに基づく解析を提案する。
その結果、有名なLeading Ones問題の特徴のいくつかの存在が示唆された。
実験では、GAの有効性を改善するためにどのようなメカニズムを提案する必要があるかを明らかにする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:30:04 GMT)
The Model Openness Framework: Promoting Completeness and Openness for Reproducibility, Transparency, and Usability in Artificial Intelligence [0.0] モデルオープンネスフレームワーク(MOF)は,その完全性とオープン性に基づいて機械学習モデルを評価する分類システムである。
このフレームワークは、オープンであると主張するモデルの誤った表現を防止し、研究者や開発者が許容ライセンスの下ですべてのモデルコンポーネントを提供することを誘導し、個人や組織が制約なく安全に採用できるモデルを識別するのを助けることを目的としている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:44:31 GMT)
Synergizing Unsupervised and Supervised Learning: A Hybrid Approach for Accurate Natural Language Task Modeling [0.0] 本稿では,NLPタスクモデリングの精度を向上させるために,教師なし学習と教師なし学習を相乗化する新しいハイブリッド手法を提案する。
提案手法は,未ラベルコーパスから表現を学習する教師なしモジュールと,これらの表現を活用してタスク固有モデルを強化する教師付きモジュールを統合する。
手法の相乗化により、我々のハイブリッドアプローチはベンチマークデータセット上でSOTAの結果を達成し、よりデータ効率が高くロバストなNLPシステムを実現する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:31:35 GMT)
Structural Interventions and the Dynamics of Inequality [0.0] 技術的ソリューションは、社会的変化を起こすために、外部のコンテキスト対応の介入と組み合わせなければならないことを示す。
この研究は、構造的不等式が、一見バイアスのない決定機構によって永続することができる方法を強調している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:44:38 GMT)
Spread and Spectral Complexity in Quantum Spin Chains: from Integrability to Chaos [0.0] 積分可能性からカオスへの遷移を示す量子系における拡散とスペクトルの複雑さについて検討する。
拡散複雑性の飽和値は、ハミルトニアンのスペクトル統計だけでなく、特定の状態にも依存する。
熱場二重状態(TFD)は、量子多体系におけるカオスのシグネチャの探索に適していると推測する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:41:18 GMT)
Spinor Bose-Einstein condensates subject to current-density interactions [0.0] 最近達成されたキラル凝縮物は、電流-密度相互作用によって誘導されるキラル特性の研究に興味深い道を開いた。
これらの特徴をスピノル系に含めようとする試みが提示され、非線形で効果的なスピン軌道結合が生じる。
結果は偏光とジョセフソン電流の不安定化の役割を明らかにし、平面波の線形重ね合わせで構築された安定な非線形状態の存在を支持する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:22:01 GMT)
Snowflake: A Distributed Streaming Decoder [0.0] 我々は、ストリーミング形式で動作し、シンプルでローカルな実装が可能な量子エラー補正デコーダであるSnowflakeを設計する。
本研究では,Snowflakeを2次元チップ上に実装し,量子メモリだけでなく格子演算に基づく計算をデコードする方法について論じる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:01:43 GMT)
Slowing Down a Coherent Superposition of Circular Rydberg States of Strontium [0.0] 円形ストロンチウム原子の熱原子ビームのレーザー減速を実証した。
また, 循環状態の重ね合わせは, 冷却過程において非常に弱い脱コヒーレンスを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:59:23 GMT)
Simple loss-tolerant protocol for GHZ-state distribution in a quantum network [0.0] グリーンバーガー・ホーネ・ザイリンガー状態分布に対する簡易な損失耐性プロトコルを提案する。
我々のプロトコルは量子リピータを使用しず、現在の量子光学技術で実現可能である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:13:46 GMT)
Revolutionizing Large Language Model Training through Dynamic Parameter Adjustment [0.0] 本稿では、パラメータのトレーニング可能な部分を頻繁に変更し、効果的な事前学習を容易にする新しいパラメータ効率トレーニング手法を提案する。
本手法は,事前学習期間中に,現在のパラメータ効率アルゴリズムに匹敵するメモリ削減と計算オーバーヘッドを実現する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:40:34 GMT)
Relations between Markovian and non-Markovian correlations in multitime quantum processes [0.0] 我々は、高度に非マルコフ過程でさえ、十分な数のステップがある場合、最大で完全な相関を持つように任意に近づくことを発見した。
これは、高度に非マルコフ過程でさえ、十分に多くのステップがある場合、最大で完全な相関を持つような任意に近いかもしれないことを意味する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:59:04 GMT)
Recent Advances in Data-Driven Business Process Management [0.0] 最先端技術の急速な発展は、データベースの管理と意思決定のパラダイムシフトにつながった。
データ駆動型ビジネスプロセス管理は、関連性があり活気ある研究領域になっている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:05:59 GMT)
Quantum speed limit of open quantum system models using the Wigner function [0.0] 開系モデルの量子速度制限時間は、ワッサーシュタイン-1-距離とウィグナー関数を用いて検討する。
非マルコフ的挙動、量子性、および量子速度制限時間の間の興味深い相互作用が観察される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:03:26 GMT)
Quantum simulations of quantum electrodynamics in Coulomb gauge [0.0] 我々は,モンテカルロ格子ゲージ理論(LGT)の量子シミュレーションにおいてクーロンゲージ(CG)を用いることを提案する。
CGのハミルトニアンはゲージインする必要はないので、ゲージ場をネーティブに微分することができる。
このスキームの下では、CG条件とガウスの法則は偏極ベクトルの方程式を解くことで便利に保存できる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:13:35 GMT)
Quantum signal processing and nonlinear Fourier analysis [0.0] 我々は、量子信号処理においてよく知られたアルゴリズムを拡張して、平方和数列で測定可能な信号を表現する。
シーケンスの各係数は、信号の関数としてリプシッツ連続である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:33:54 GMT)
Quantum optimization using a 127-qubit gate-model IBM quantum computer can outperform quantum annealers for nontrivial binary optimization problems [0.0] ゲートモデル量子コンピュータにおける二項最適化問題に対する量子解法を提案する。
最大127キュービットの問題の正しい解を一貫して提供する。
我々はこの解法をIBM量子コンピュータ上でベンチマークする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 19:08:01 GMT)
Quantum machines based on $\mathrm{Cu}_{3}$-like compounds using the Heisenberg antiferromagnetic model in a triangular ring [0.0] 反強磁性結合スピン系、特に$textCu_3-textX(textX=As, Sb)$について理論的研究を行う。
このシステムは、三角構造内のハイゼンベルクモデルを用いてモデル化され、交換相互作用、ジアロシンスキー-モリヤ相互作用、g因子、および外部磁場が組み込まれている。
我々は、$textCu_3$-like反強磁性結合スピン系に基づく3つの量子マシンを探索する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:04:01 GMT)
Quantum consistent neural/tensor networks for photonic circuits with strongly/weakly entangled states [0.0] 本稿では,閉じた絡み合ったシステムの正確なユニタリ進化を,高精度で効率的な量子一貫した方法で近似する手法を提案する。
量子力学の少数の例でネットワークを訓練することにより、より大きなヒルベルト空間における効率的なパラメータ推定を可能にする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:51:25 GMT)
Quantum advantage in batteries for Sachdev-Ye-Kitaev interactions [0.0] セルが相互作用している場合、量子電池のユニタリ充電において量子アドバンテージが達成される。
単純なモデル化を行うことで、$q$-point rescaled sparse SYK 相互作用に対して、量子優位性は $Gammasim Nfracalpha-q2+frac12$ となる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:10:58 GMT)
Quantum Phase Transitions in periodically quenched systems [0.0] 量子相転移は、いくつかの可能な対称性を示す量子系で起こる現象である。
伝統的に、これらの遷移は、2つの異なる対称性構成を接続する制御パラメータを連続的に変化させることによって探索される。
本稿では,制御パラメータの急激な変化と2つの値間の時間周期的なジャンプを行う方法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:49:17 GMT)
Quantifying nonclassicality of mixed Fock states [0.0] ボソニックモードの非古典的状態は、量子化技術にとって重要な資源である。
操作資源理論 (ORT) 測定により, 混合フォック状態におけるボソニックモードの非古典性を定量化する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:25:30 GMT)
Prethermalization in the PXP Model under Continuous Quasiperiodic Driving [0.0] 強リドベルク閉塞系における準周期的に駆動されるリドベルク原子鎖のダイナミクスについて検討する。
運転なしでも、PXPモデルは多くのボディの傷がつき、結果として持続的な振動が生じる。
以上の結果から, 連続半周期駆動プロトコルは, 物質の予熱相を実現するための有望な経路となることが示唆された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:30:02 GMT)
Predicting the fatigue life of asphalt concrete using neural networks [0.0] アスファルトコンクリート(AC)の耐久性と維持要求は, その疲労寿命に強く影響される。
本研究では, ニューラルネットワークを用いて交流疲労寿命を予測し, ひずみレベル, バインダー含量, 空気ボイド含量の影響に着目した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:53:07 GMT)
Photon-Gravity Coupling in Schwarzschild Spacetime [0.0] 曲面時空における量子電磁力学の正準形式性を開発した。
重力赤方偏移は全てのスペクトルに対する光子の鋭い周波数の変化である」という主張が証明されている。
重力デコヒーレンスは、曲がった時空現象における光子-重力結合と観測者依存の量子電磁力学に起因することが示されている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:16:50 GMT)
PPINtonus: Early Detection of Parkinson's Disease Using Deep-Learning Tonal Analysis [0.0] PPINtonusはパーキンソン病の早期発見システムである。
深層学習音素解析を用いて、神経学的検査の代替手段を提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 01:07:42 GMT)
OpenAPI Specification Extended Security Scheme: A method to reduce the prevalence of Broken Object Level Authorization [0.0] API Securityは、OpenAPI標準の標準化された承認が欠如していることを考えると、懸念すべきトピックである。
本稿では,APIセキュリティにおける第1の脆弱性として,Broken Object Level Authorization(BOLA)について検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:36:18 GMT)
OLoRA: Orthonormal Low-Rank Adaptation of Large Language Models [0.0] Low-Rank Adaptation (LoRA)はこれらの問題を緩和するための有望な方法として登場した。
OLoRAはLLMトレーニングの収束を著しく加速する。
OLoRAは、様々な言語モデリングタスクで標準のLoRAよりもパフォーマンスが向上している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:37:27 GMT)
Neural Quantum States in Variational Monte Carlo Method: A Brief Summary [0.0] スピン系に対するニューラル量子状態に基づく変分モンテカルロ法について概説する。
ニューラルネットワークは、比較的小さな計算資源を持つ比較的複雑な波動関数を表現できる。
量子状態トモグラフィでは、神経量子状態の表現法はすでに大きな成果を上げている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:55:55 GMT)
NUBO: A Transparent Python Package for Bayesian Optimization [0.0] NUBOは物理実験やコンピュータシミュレータなどのブラックボックス機能を最適化するためのフレームワークである。
透明性とユーザエクスペリエンスを重視し、ベイズ最適化をあらゆる分野の研究者が利用できるようにする。
NUBOはPythonで書かれているが、シミュレータや実験を最適化するためにPythonの専門知識は必要ない。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:52:21 GMT)
Multi-word Term Embeddings Improve Lexical Product Retrieval [0.0] 本研究は,eコマースプラットフォームにおける製品記述のオフラインインデックス化を目的としたH1埋め込みモデルについて述べる。
このモデルは、ハイブリッド製品検索システムのフレームワーク内の他の最先端(SoTA)埋め込みモデルと比較される。
検索インデックスのための意味的にリッチな用語語彙を構築するためのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:52:52 GMT)
MiniGPT-Reverse-Designing: Predicting Image Adjustments Utilizing MiniGPT-4 [0.0] VLM(Vision-Language Models)は近年,LLM(Large Language Models)との統合によって,大幅な進歩を遂げている。
本稿では,逆設計タスクのためにMiniGPT-4を拡張し,微調整する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:59:29 GMT)
Memory Capacity Analysis of Time-delay Reservoir Computing Based on Silicon Microring Resonator Nonlinearities [0.0] シリコンマイクロリング共振器(MRR)はフォトニック貯水池計算(RC)方式の非線形ノードとして機能する可能性が強い。
シリコンMRR内の非線形性を利用することで、RCの入力データを高次元空間にマッピングすることができる。
MRRのスルーとポートの間に外部導波路を追加することで、拡張メモリを備えたTDRC(Time-delay RC)を実装することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:10:25 GMT)
Manipulating fermionic mode entanglement in the presence of superselection rules [0.0] スーパーセレクションルール(SSR)はフェルミオン系における許容可能な物理的操作に制約を課す。
両部モードの絡み合いの混合状態変換のための偏化に基づくアルゴリズムを提案する。
本稿では, 局所パリティ変化を触媒するアシラリーモードシステムについて述べる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:03:22 GMT)
Long-term foehn reconstruction combining unsupervised and supervised learning [0.0] 急激な気温上昇と風速変化を特徴とするフォーン風は、山脈のリーワード側の地域に大きな影響を与えている。
本稿では,教師なしと教師なしの確率的学習法の組み合わせを用いて,歴史的フォアーン発生を再現する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:15:57 GMT)
Khayyam Offline Persian Handwriting Dataset [0.0] Khayyamデータセットは、ペルシア語の要素(単語、文、文字、数字)について、制約のない別の大きな手書きデータセットとして提示する。
カヤムのデータセットには44000語、60000文字、6000桁が含まれている。
データセットの適用性を示すために、数字、文字、単語データに基づいて機械学習アルゴリズムを訓練し、結果を報告する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:17:21 GMT)
Is computational creativity flourishing on the dead internet? [0.0] 死んだインターネット理論は、ソーシャルメディア上のすべてのインタラクションやポストは、もはや現実の人間ではなく、自律的なボットによって作られている、と述べている。
本稿では、これらのボットの最近の現象を考察し、計算創造性のレンズを通してその振る舞いを分析する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:15:06 GMT)
Informationally overcomplete measurements from generalized equiangular tight frames [0.0] 任意のランクの等角的タイトフレームによって生成される情報的にオーバーコンプリートなPOVMのクラスを導入する。
以上の結果から,POVM の情報完全コレクションに対して,情報の過剰な測定を単一で行うことのメリットが示唆された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:18:20 GMT)
Immunocto: a massive immune cell database auto-generated for histopathology [0.0] 我々は,6,848,454個のヒト細胞を自動生成する大量のデータベースであるImmuctoを紹介した。
我々は64$times$64ピクセルのH&E画像を$mathbf40times$imagcationで提供し、核とラベルのバイナリマスクも提供します。
それぞれのセルに対して、64$times$64ピクセルのH&E画像を$mathbf40times$倍率で提供し、核とラベルのバイナリマスクを提供します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:03:58 GMT)
How to select an objective function using information theory [0.0] 機械学習や科学計算では、モデル性能は客観的関数で測定される。
情報理論のパラダイムの下では、最終的な目的は、特定のユーティリティとは対照的に、情報の最大化(および不確実性の最小化)である。
このパラダイムは、気候変動の影響を理解するために使用される大規模な地球システムモデルのように、多くの用途を持ち、明確な実用性を持たないモデルに適している、と我々は主張する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:28:06 GMT)
How disinformation and fake news impact public policies?: A review of international literature [0.0] 本研究では,偽情報が公共政策に与える影響について検討する。
その結果, 偽情報が公共の意思決定, 政策の遵守, 機関の威信, 現実の認識, 消費, 公衆衛生などの側面に影響を及ぼすことが明らかとなった。
本研究は、偽情報を公的な問題として扱い、公共政策研究課題に組み込むべきであることを示唆している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 03:08:05 GMT)
How Ethical Should AI Be? How AI Alignment Shapes the Risk Preferences of LLMs [0.0] 本研究では,大規模言語モデル(LLM)のリスク嗜好について検討する。
30個のLSMを解析することにより、リスク逆からリスク探索まで、幅広い固有のリスクプロファイルを明らかにした。
次に、モデルが人間の価値観に従って行動することを保証するプロセスであるAIアライメントのさまざまなタイプについて検討します。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:05:25 GMT)
High-fidelity remote entanglement of trapped atoms mediated by time-bin photons [0.0] 量子処理ノード間のフォトニック相互接続は、大規模量子コンピュータやネットワークを実現する唯一の方法である。
パルスのタイミングに蓄積されたフォトニック量子ビットを介し、遠隔分離された原子量子ビットメモリ間の高忠実な絡み合いを確立する。
このような時間ビン符号化感度は偏極誤差を除去し、長距離量子通信を可能にし、2つ以上の状態の量子メモリに対する再コイルを抑制する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 20:02:10 GMT)
High-fidelity $CCΦ$ gates via radio-frequency-induced Förster resonances [0.0] 高周波誘起F"オースター共鳴相互作用に基づく新しいCCPhi$量子位相ゲートプロトコルを提案する。
極低温環境下では99.7 %の理論的ゲート特性を達成し、現代の量子誤り訂正技術とのプロトコル互換性を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:32:32 GMT)
Good Vibes! Towards Phone-to-User Authentication Through Wristwatch Vibrations [0.0] 本稿では,モバイル端末間認証の変種であるGoodVibes認証について述べる。ユーザのスマートフォンは,事前に選択した認証振動パターンで振動する腕時計を通じてユーザに対して認証を行う。
我々はAndroidのプロトタイプとしてGoodVibes認証を実装し、30人の参加者で異なる認証シナリオを評価し、認証振動パターンを異なるパッターから、無関係な振動から、そして欠落しているパターンから、適切に認識し識別できるユーザを見つける。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:59:52 GMT)
Generating Reservoir State Descriptions with Random Matrices [0.0] ランダム行列を用いた計算機計測のための新しい手法を示す。
私たちは、原子スケールのデバイスが現実世界のコンピューティングアプリケーションにどのように使われるのかを動機付けています。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:13:16 GMT)
Generalized phase estimation in noisy quantum gates [0.0] 我々は、キュービットゲートに焦点をあて、ゲートの連続的な応用の可能性を検討する。
我々は、Von Mises-Fisher分布に支配される古典的ゆらぎとして、キュービット回転に影響を与える劣化雑音と傾き雑音をモデル化する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:59:33 GMT)
Generalized "Square roots of Not" matrices, their application to the unveiling of hidden logical operators and to the definition of fully matrix circular Euler functions [0.0] Notの平方根は量子コンピューティング理論において重要な論理演算子である。
物理学では、次元 2 の平方複素行列である。
演算子の2つの平方根に対する一般表現がどのように得られるかを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 12:57:33 GMT)
Floquet engineering nearly flat bands through quantum-geometric light-matter coupling with surface polaritons [0.0] 平面バンドへの光物質結合は量子幾何学によって可能であることを示す。
平板モワールや原型かごめ材料における光駆動現象の可能性について論じる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:06:03 GMT)
Few-Photon SUPER: Quantum emitter inversion via two off-resonant photon modes [0.0] 本研究では、2つの光子モードを量子エミッタに非共鳴的に結合する拡張Jaynes-Cummingsモデルについて検討する。
我々は、共振子外光子を1つのモードから別のモードに移動させながら、エミッタの完全な反転につながる少数の光子散乱機構を同定する。
我々の結果は、最近開発された量子EmitteRのSwing-UPとして知られる非共鳴量子制御スキームの量子化アナログとして理解することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:19:00 GMT)
Faster entanglement driven by quantum resonance in many-body kicked rotors [0.0] 量子共鳴は、古典的カオスの根底にある状態を無視する純粋に量子効果である。
この研究では、量子共鳴が超線型絡み合いの生成につながることが示されている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:15:48 GMT)
FactGenius: Combining Zero-Shot Prompting and Fuzzy Relation Mining to Improve Fact Verification with Knowledge Graphs [0.0] FactGeniusは,大規模言語モデルのゼロショットプロンプトと知識グラフ上のファジィテキストマッチングを組み合わせることで,ファクトチェックを強化する新しい手法である。
事実検証のベンチマークデータセットであるFactKG上でのFactGeniusの評価は、既存のベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:24:37 GMT)
Examining properness in the external validation of survival models with squared and logarithmic losses [0.0] 我々は、適切に主張される一般的な採点規則が、例えばISBS(Integrated Survival Brier Score)のような実際不適切なものであることを証明している。
適正性の違いにもかかわらず、シミュレーションと実世界のデータセットの実験では、ISBSの不適切なバージョンと適切なバージョンの間に大きな違いは見られない。
損失の微妙な違いでさえ、モデルチューニングのような自動化プロセスにおいて重要な意味を持つ可能性があるため、適切なスコアリングルールの使用を引き続き主張する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:16:12 GMT)
Exact quantization conditions and full transseries structures for ${\cal PT}$ symmetric anharmonic oscillators [0.0] We study exact Wentzel-Kramers-Brillouin analysis (EWKB) for a $cal PT$ symmetric quantumchanics (QM)。
摂動・非摂動補正を含む任意の$(K,varepsilon)$に対する正確な量子化条件(QCs)を導出する。
ヘルミタンのQMと復活の類似性も追加の発言として議論されている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:50:51 GMT)
Equality of magnetization and edge current for interacting lattice fermions at positive temperature [0.0] 格子フェルミオンの大規模なモデルに対して,バルク磁化は熱力学的限界におけるエッジ電流と等しいことを証明した。
このようなバルクエッジ対応は、本質的にはギブス状態のバルクおよび局所性における均質性の結果であることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:04:57 GMT)
Enhancing the efficiency of quantum measurement-based engines with entangling measurements [0.0] 多数のサブシステムからなるエンジンでは,エンタングリング測定を行うことで効率を向上させることができることを示す。
2段階のシステムでは、これらのエンジンは、有限の作業量を確保しながら、完全な効率で動作することができる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:45:06 GMT)
Enhancing entangled two-photon absorption of Nile Red via temperature-controlled SPDC [0.0] 絡み合った2光子吸収は、励起パワーによる蛍光発光の線形スケーリングを可能にする。
既存の理論モデルは、化学的に複雑な染料の絡み合った2光子吸収挙動を正確に予測するのに苦労している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:49:37 GMT)
Enhancing Dynamic CT Image Reconstruction with Neural Fields Through Explicit Motion Regularizers [0.0] 2次元以上の時間計算トモグラフィーにおけるPDEに基づく運動正規化器の導入によるニューラルネットワークの最適化の利点を示す。
また、ニューラルネットワークをグリッドベースの解法と比較し、前者が後者より優れていることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:07:29 GMT)
Encoding lattice structures in Quantum Computational Basis States [0.0] 量子ビットの計算基底状態における格子構造の符号化手法について議論する。
タンパク質構造予測における格子モデルの具体的な利用例を示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:29:15 GMT)
Efficient Computation Using Spatial-Photonic Ising Machines: Utilizing Low-Rank and Circulant Matrix Constraints [0.0] 空間フォトニックイジングマシン(SPIM)は、低ランクおよび循環結合行列を用いる計算集約型イジング問題に対処する。
以上の結果から,SPIMの性能は結合行列のランクと精度に大きく影響していることが明らかとなった。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 15:03:31 GMT)
Dreaming of Electrical Waves: Generative Modeling of Cardiac Excitation Waves using Diffusion Models [0.0] 心臓の電気波は、心房細動や心室細動などの不整脈が持続する間、回転する渦巻波またはスクロール波を形成する。
我々は、非条件および条件付き生成タスクにおいて、そのような波動パターンを生成できるように、模擬波動パターンを用いた拡散モデルを訓練した。
拡散モデルはスパイラル波やスクロール波のダイナミクスを再現し、心臓組織の波動のデータ駆動モデリングに利用できるように学習することを発見した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:59:54 GMT)
Doubly minimized Petz Renyi mutual information: Properties and operational interpretation from direct exponent [0.0] 2倍に最小化された$alphain (1/2,1)$のPetz Renyi相互情報は、固定二部量子状態の$alpha$のペッツ発散の最小化として定義される。
二つの量子状態判別問題の直接指数は、位数$alphain (1/2,1)$の2倍に最小化されたペッツ・レニイ相互情報によって決定されることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:01:00 GMT)
Deep Reinforcement Learning Behavioral Mode Switching Using Optimal Control Based on a Latent Space Objective [0.0] 我々は,政策の潜伏空間で直接最適化することで,深層強化学習政策の行動を変えるために最適制御を用いる。
提案手法は,失敗エピソードをいかに成功させるかを示すことによって,望ましい行動モードをポリシーに課すことができることを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 10:21:00 GMT)
Deep Learning Calabi-Yau four folds with hybrid and recurrent neural network architectures [0.0] 本稿では,Calabi-Yau 4-folds(CICY4)の約100万の完全交点のデータセットに対して,ハイブリッド畳み込み再帰と純粋に反復するニューラルネットワークアーキテクチャに基づくディープラーニングを適用した結果について報告する。
h1,1,h2,1,h3,1,h2,2$の予測精度は72%のトレーニング率で,CNN-LSTM-400が最適である。
LSTM-448とLSTM-424の上位2つはLSTMベースで、サイズは448である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:32:11 GMT)
Convolutional L2LFlows: Generating Accurate Showers in Highly Granular Calorimeters Using Convolutional Normalizing Flows [0.0] 我々はL2LFlowsを拡張して、横方向の9倍のプロファイルでシャワーをシミュレートする。
畳み込み層とU-Net型接続を導入し,マスク付き自己回帰フローから結合層へ移行する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:11:03 GMT)
Convergence of the denoising diffusion probabilistic models [0.0] 我々は,Ho,J.,Jain,A.,Abbeelで提示された拡散確率モデル(DDPM)の原版を理論的に解析した。
我々の主定理は、元のDDPMサンプリングアルゴリズムによって構築されたシーケンスは、時間ステップの回数が無限大になるにつれて、与えられたデータ分布に弱収束することを示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:38:18 GMT)
Consciousness defined: requirements for biological and artificial general intelligence [0.0] 批判的に言えば、意識は決定を行う能力を提供する装置であるが、決定そのものによって定義されていない。
意識の要求には、少なくとも知覚の能力、知覚情報の記憶のための記憶、が含まれる。
我々は、人間以外の動物や人工的な知能システムのような、知覚可能なエージェントの意識を客観的に決定できる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:20:56 GMT)
Comparison of Point Process Learning and its special case Takacs-Fiksel estimation [0.0] 本稿では,Takacs-Fiksel推定におけるポイントプロセス学習(PPL)について検討する。
クロスバリデーション体制を離脱する傾向にある場合,特定の損失を有するPLは,タカカス・フィッシャー推定に機能的に低下することを示した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 07:54:53 GMT)
Comment on "Floquet non-Abelian topological insulator and multifold bulk-edge correspondence" [0.0] 著者はFloquetシステムで初めてマルチギャップトポロジーを研究することを不当に示唆している。
シャープ・マルチフォールド・バルクエッジ対応の主張は、与えられた議論から結論付けることはできない。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:08:17 GMT)
Combining Qualitative and Computational Approaches for Literary Analysis of Finnish Novels [0.0] フィンランドの文体に適応した感情辞書を用いた感情分析の計算手法を提案し,開発する。
本研究は, 近読分析支援ツールとして, 従来の文献に影響を及ぼす研究の場があることを実証する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 06:07:44 GMT)
Classical circuits can simulate quantum aspects [0.0] 本研究では,電気ネットワークを用いた量子システムのシミュレーション手法を提案する。
相互作用ネットワークを合成することにより、2-$state から$n-$state まで、様々な複雑さの量子システムを正確にシミュレートする。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:16:06 GMT)
Characterization and thermometry of dissapatively stabilized steady states [0.0] 雑音量子アルゴリズムにおける散逸安定化定常状態の特性について検討する。
熱分布としてよく近似できる範囲について検討する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 00:41:37 GMT)
Characteristic Guidance: Non-linear Correction for Diffusion Model at Large Guidance Scale [0.0] そこで本研究では,一元的非線形補正法である特徴ガイダンスを提案する。
実験により,特徴誘導は画像生成におけるプロンプトのセマンティックな特徴と不規則性を高めることが示された。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:17:49 GMT)
Categories of quantum cpos [0.0] 量子cposと呼ばれる$omega$-complete partial order (cpos)の非可換一般化が見つかる。
量子cposは将来の量子領域理論の バックボーンを形成します
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:13:32 GMT)
Carleman-Grad approach to the quantum simulation of fluids [0.0] カールマン・グラッド法は両者の中間的性質を示す。
すなわち、カールマン反復の数十の時間ステップへの収束と、量子線型代数解法を用いた潜在的に実行可能な量子回路の実装である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:58:40 GMT)
Bit by Bit: Gravity Through the Lens of Quantum Information [0.0] 論文レビュー 量子情報とホログラフィーの 交差点における最近の進歩
ホログラフィーにおいて、量子系の特性はAdS/CFT対応による重力解釈を許容する。
AdS/CFTにおける創発現象を記述する際、マジックと絡み合いは相補的な役割を果たす。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:00:17 GMT)
Bias-preserving computation with the bit-flip code [0.0] 本稿では,ビットフリップの繰り返し符号を用いたフォールトトレラント量子計算の実現可能性について検討する。
このようなチャネルでも、いくつかの論理ゲートが位相フリップエラーを発生させる可能性があるが、我々は、$S$、$H$、$mathrmCZ$、$R_z$のバイアス保存実装を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 05:48:20 GMT)
Beyond symmetrization: effective adjacency matrices and renormalization for (un)singed directed graphs [0.0] 変形ラプラシア作用素の定義から生じる効果的な隣接行列の概念を定義する。
これらの効果的な行列は、ジェネリックグラフを符号のない無向グラフの族にマッピングすることを可能にする。
ホッジ・ヘルムホルツ分解がこの複雑さをナビゲートするのにどのように役立つかを示す。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:48:25 GMT)
An efficient solution to Hidden Markov Models on trees with coupled branches [0.0] 木上の隠れモデル(HMM)のフレームワークを拡張して、データのツリーのような構造が結合されたブランチを含むシナリオに対処する。
本研究では,木系HMMと分岐した分岐木に対する確率,復号化,パラメータ学習問題を効率的に解くプログラミングアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 18:00:00 GMT)
An efficient Wasserstein-distance approach for reconstructing jump-diffusion processes using parameterized neural networks [0.0] 2つの多次元ジャンプ拡散過程に関連する2つの確率分布間のワッサーシュタイン距離(W$-distance)を解析する。
本稿では,パラメータ化ニューラルネットワークを用いたデータから未知のジャンプ拡散過程を効率的に再構築するための,時間的に分離された2乗法W$-distance法を提案する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:26:24 GMT)
ARCH2S: Dataset, Benchmark and Challenges for Learning Exterior Architectural Structures from Point Clouds [0.0] 本稿では,セマンティックセグメンテーションのためのセマンティックモデルデータセットとベンチマークを提案する。
現実世界の建物の4つの異なる建築目的と、香港のオープンな建築景観を特徴としている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 14:02:23 GMT)
AI-based Classification of Customer Support Tickets: State of the Art and Implementation with AutoML [0.0] 本研究の目的は,自動機械学習(AutoML)の適用性を,サポートチケットを分類可能な機械学習モデル(MLモデル)をトレーニングする技術としてテストすることである。
本研究で行ったモデル評価は,AutoMLが機械学習モデルを優れた分類性能で訓練するのに利用できることを示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:13:02 GMT)
AGALE: A Graph-Aware Continual Learning Evaluation Framework [0.0] シングルラベルノードとマルチラベルノードの両方に対応可能なグラフ認識評価フレームワークを開発した。
特に、新しいインクリメンタル設定を定義し、データセットに適したアルゴリズムを考案する。
理論的にアガレを解析し、比較手法の性能におけるホモフィリーの役割について新たな知見を提供する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 11:50:47 GMT)
A time-to-digital converter with steady calibration through single-photon detection [0.0] タイム・トゥ・デジタル・コンバータ(TDC)は幅広い分野、特に量子通信において重要なツールである。
ここではFPGAベースで27psの残留ジッタを示すTDCの設計と実演について述べる。
量子鍵分布(Quantum Key Distribution, QKD)の応用は、データ取得を止めたり、いかなる方法を使う必要もない単一光子検出の活用に基づく一意の校正法で議論される。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 13:03:59 GMT)
A single-photon large-momentum-transfer atom interferometry scheme for Sr or Yb atoms with application to determining the fine-structure constant [0.0] 我々は、中性原子種の光子反動を1光子光時計遷移で測定する中間スケール原子干渉計を提案する。
Sr と Yb の場合,3m の高さの原子干渉計は現在の技術で最大質量測定精度が$Delta m / m sim 1times 10-11$ であるのに十分である。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 16:58:27 GMT)
A quantum spectrometer using a pair of phase-controlled spatial light modulators for superresolution in quantum sensing [0.0] 超解像は、マッハ・ツェンダー干渉計(MZI)の射影測定によってN00N状態または位相制御コヒーレント光子によって生成されるユニークな量子特徴である。
超解像は量子センシングにおける超感度と直接関係がなく、未知の信号周波数の精度測定に応用できる可能性がある。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 04:43:51 GMT)
A hybrid numerical methodology coupling Reduced Order Modeling and Graph Neural Networks for non-parametric geometries: applications to structural dynamics problems [0.0] 本研究は、複雑な物理系を管理する時間領域偏微分方程式(PDE)の数値解析を高速化するための新しいアプローチを導入する。
この手法は、古典的低次モデリング(ROM)フレームワークと最近のパラメトリックグラフニューラルネットワーク(GNN)の組み合わせに基づいている。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 08:51:25 GMT)
A finite operator learning technique for mapping the elastic properties of microstructures to their mechanical deformations [0.0] 本稿では,有限要素法の中核となる概念を物理インフォームドニューラルネットワークと統合し,ニューラル演算子の概念を提案する。
このアプローチは各手法を一般化し、他のリソースのデータに頼ることなく、機械的問題に対するパラメトリック解を学習する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 09:03:10 GMT)
A Stochastic-Geometrical Framework for Object Pose Estimation based on Mixture Models Avoiding the Correspondence Problem [0.0] 本稿では,複数特徴点の観測に基づくオブジェクトポーズ推定のための新しい幾何学的モデリングフレームワークを提案する。
混合モデルを用いた確率論的モデリングは、正確でロバストなポーズ推定の可能性を示している。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 17:46:49 GMT)
A SARS-CoV-2 Interaction Dataset and VHH Sequence Corpus for Antibody Language Models [0.0] AVIDa-SARS-CoV-2は重鎖抗体(VHH)相互作用の抗原可変ドメインを特徴とするデータセットである。
抗体言語モデルの事前学習データセットであるVHHCorpus-2Mには200万以上のVHH配列が含まれている。
VHHCorpus-2Mおよび既存の一般タンパク質および抗体特異的言語モデルを用いたVHHBERTを用いたSARS-CoV-2-VHH結合予測のためのベンチマーク結果を報告する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 00:17:05 GMT)
A Brief Overview of Optimization-Based Algorithms for MRI Reconstruction Using Deep Learning [0.0] ディープラーニングアルゴリズムの統合は、MRI再構成プロセスを最適化する大きな可能性を秘めている。
この領域における研究の活発化にもかかわらず、MRI再構成に適した最適化に基づくディープラーニングモデルに関する総合的な調査はまだ行われていない。
本稿では,MRI再構成に特化して設計されたディープラーニングにおいて,最新の最適化アルゴリズムを徹底的に検討することにより,このギャップに対処する。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 21:52:50 GMT)
A 4-8 GHz Kinetic Inductance Travelling-Wave Parametric Amplifier Using Four-Wave Mixing with Near Quantum-Limit Noise Performance [0.0] 動インダクタンス進行波パラメトリック増幅器(KI-TWPA)は、量子限界に近い性能と比較的高いダイナミックレンジを持つ広い瞬時帯域を有する。
本研究では,NbTiNマイクロストリップ伝送線路における4波長混合に基づくKI-TWPAの設計,製造,性能について述べる。
論文参考訳(メタデータ) (Mon, 3 Jun 2024 22:52:06 GMT)