Text as Images: Can Multimodal Large Language Models Follow Printed Instructions in Pixels? [159.0] マルチモーダルな大規模言語モデル (MLLM) は、視覚言語タスクにおいて有望な命令に従う能力を示している。
我々は,事前学習や微調整において,そのようなデータに対して明示的に訓練されていないにもかかわらず,画素内のテキスト命令をマルチモーダルモデルでどの程度理解できるかを検討する。
我々は、テキストモダリティと視覚モダリティの両方で、堅牢な指示を実行できる一般化可能なモデルであるv-MLLMを訓練する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 23:39:24 GMT)
MVGamba: Unify 3D Content Generation as State Space Sequence Modeling [150.8] 本稿では,多視点ガウス再構成器を備えた一般軽量ガウス再構成モデルMVGambaを紹介する。
MVGambaは、単一のイメージ、スパースイメージ、テキストプロンプトから3D生成タスクを統合する。
実験により、MVGambaは、すべての3Dコンテンツ生成シナリオで最先端のベースラインを約0.1タイムのモデルサイズで上回ります。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:26:48 GMT)
Deep Reinforcement Learning from Hierarchical Preference Design [99.5] 本稿では,特定の構造を利用することにより,報酬設計プロセスの容易性を示す。
シナリオのための階層的な報酬モデリングフレームワーク -- HERONを提案する。 (I) フィードバック信号は自然に階層構造を呈し、 (II) 報酬は希少であるが、政策学習を支援するためにあまり重要でないサロゲートフィードバックを持つ。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:22:42 GMT)
EAVE: Efficient Product Attribute Value Extraction via Lightweight Sparse-layer Interaction [94.2] 本稿では,軽量なスパース層間相互作用による効率的な製品属性値抽出(EAVE)手法を提案する。
我々は、製品コンテキストと属性を別々にエンコードするために重いエンコーダを使用します。その結果、コンテキストの非相互作用的なヘビー表現は、すべての属性に対してキャッシュされ、再利用されます。
提案手法は, コンテキストが長く, 属性数が大きい場合, 性能が中立的あるいは限界的に低下した場合に, 顕著な効率向上を実現する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 23:06:38 GMT)
CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models [92.0] 我々はCARESを紹介し,医療領域全体での医療LVLMの信頼性を評価することを目的とする。
我々は,Med-LVLMの信頼性を,信頼性,公正性,安全性,プライバシ,堅牢性,5次元にわたって評価する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:07:09 GMT)
AID: Adapting Image2Video Diffusion Models for Instruction-guided Video Prediction [88.7] テキスト誘導ビデオ予測(TVP)は、命令に従って、初期フレームから将来のフレームの動きを予測する。
従来のTVP方式では, 安定拡散法を応用して大きなブレークスルーを達成している。
我々は、初期フレームとテキスト命令に基づいて、将来のビデオ状態を予測するためのMLLM(Multi-Modal Large Language Model)を導入する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:02:08 GMT)
GTBench: Uncovering the Strategic Reasoning Limitations of LLMs via Game-Theoretic Evaluations [88.0] 大規模言語モデル(LLM)は、重要な現実世界のアプリケーションに統合される。
本稿では,LLMの競合環境における推論能力について検討する。
まず,広く認識されている10のタスクを構成する言語駆動型環境であるGTBenchを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:14:09 GMT)
A General Protocol to Probe Large Vision Models for 3D Physical Understanding [84.5] 市販の大型視覚モデルの特徴が3Dシーンの物理的な「プロパティ」をエンコードするかどうかを評価するための一般的なプロトコルを提案する。
このプロトコルは、シーン幾何学、シーン素材、サポート関係、照明、ビュー依存尺度を含むプロパティに適用する。
安定拡散とDINOv2の特徴は,多くの特性の識別学習に有効であることがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:10:07 GMT)
EARS: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation [83.3] EARSデータセットは、さまざまなバックグラウンドから107人の話者で構成され、100時間のクリーンで無響な音声データである。
データセットには、感情的なスピーチ、異なる読み方、非言語音、会話の自由なスピーチなど、幅広い種類の話し方が含まれている。
提案手法は,データセット上での音声強調とデバーベレーションのための様々な手法をベンチマークし,その性能を測定値を用いて評価する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:28:29 GMT)
2DQuant: Low-bit Post-Training Quantization for Image Super-Resolution [83.1] 低ビット量子化は、エッジ展開のための画像超解像(SR)モデルを圧縮するために広く普及している。
低ビット量子化は、フル精度(FP)と比較してSRモデルの精度を低下させることが知られている。
本稿では2DQuantという画像超解像のための2段階の低ビット後量子化(PTQ)法を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:06:11 GMT)
SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [80.5] SciRIFF(Scientific Resource for Instruction-Following and Finetuning, SciRIFF)は、54のタスクに対して137Kの命令追従デモのデータセットである。
SciRIFFは、幅広い科学分野の研究文献から情報を抽出し、合成することに焦点を当てた最初のデータセットである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:22:08 GMT)
What Languages are Easy to Language-Model? A Perspective from Learning Probabilistic Regular Languages [78.2] 大規模言語モデル (LM) は文字列上の分布である。
RNNとTransformer LMによる規則的LM(RLM)の学習性について検討する。
RNNとトランスフォーマーの双方において,RLMランクの複雑さは強く,学習可能性の有意な予測因子であることが判明した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:53:32 GMT)
Compute Better Spent: Replacing Dense Layers with Structured Matrices [77.6] 画像領域における畳み込みネットワークの成功が示すように、高密度行列に対するより効率的な代替手段を同定する。
異なる構造は、しばしばパフォーマンスに不可欠な、非常に異なる初期化尺度と学習率を必要とする。
本稿では,モナール行列を含む新しい行列族Block-Trainを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:25:43 GMT)
Open-Domain Text Evaluation via Contrastive Distribution Methods [75.6] 本稿では,Contrastive Distribution Methodsと呼ばれるオープンドメインテキスト生成手法を提案する。
マルチターン対話におけるコヒーレンス評価と制御可能な生成におけるコヒーレンス評価の実験により,CDMの優位性は人間の判断と相関していることが示された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 00:44:32 GMT)
GraphStorm: all-in-one graph machine learning framework for industry applications [75.2] GraphStormはスケーラブルなグラフ構築、グラフモデルのトレーニング、推論のためのエンドツーエンドソリューションである。
GraphStormのすべてのコンポーネントは数十億のノードを持つグラフ上で動作でき、コードを変更することなく、モデルのトレーニングと推論を異なるハードウェアにスケールすることができる。
GraphStormは、2023年5月にリリースされて以来、数十億以上の業界アプリケーションで使われ、デプロイされてきた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:56:16 GMT)
GraphDreamer: Compositional 3D Scene Synthesis from Scene Graphs [75.0] シーングラフから合成3Dシーンを生成するための新しいフレームワークを提案する。
シーングラフにおけるノード情報とエッジ情報を活用することにより,事前学習したテキスト・画像拡散モデルをよりよく活用する。
GraphDreamerの有効性を検証するために,定性的および定量的な実験を行った。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:08:03 GMT)
Compositional Video Generation as Flow Equalization [72.9] 大規模テキスト・トゥ・ビデオ拡散モデル(T2V)は、最近、自然言語記述を驚くべき、フォトリアリスティックなビデオに変換する前例のない能力を示した。
有望な結果にもかかわらず、これらのモデルは複数の概念と行動の間の複雑な構成的相互作用を完全に把握するのに苦労する。
我々は、すべての概念が適切に表現されることを明確に保証する合成ビデオ生成のための一般的なフレームワークであるbftextVicoを紹介する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:27:47 GMT)
Rate-Preserving Reductions for Blackwell Approachability [72.0] Abernethy et al. (2011) はブラックウェルのアプローチ可能性と非回帰学習が等価であることを示した。
一般化された後悔最小化の例に対して、いかなるアプローチ可能性のインスタンスも厳格に削減できることが示される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 23:23:52 GMT)
Decomposing Uncertainty for Large Language Models through Input Clarification Ensembling [69.8] 大規模言語モデル(LLM)では、不確実性の原因を特定することが、信頼性、信頼性、解釈可能性を改善するための重要なステップである。
本稿では,LLMのための不確実性分解フレームワークについて述べる。
提案手法は,入力に対する一連の明確化を生成し,それらをLLMに入力し,対応する予測をアンサンブルする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:17:24 GMT)
Enhancing EEG-to-Text Decoding through Transferable Representations from Pre-trained Contrastive EEG-Text Masked Autoencoder [69.8] コントラスト型脳波テキストマスケード自動エンコーダ(CET-MAE)を提案する。
また、E2T-PTR(Pretrained Transferable Representationsを用いたEEG-to-Text decoding)と呼ばれるフレームワークを開発し、EEGシーケンスからテキストをデコードする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:51:50 GMT)
Explainable Graph Neural Networks Under Fire [69.2] グラフニューラルネットワーク(GNN)は通常、複雑な計算挙動とグラフの抽象的性質のために解釈性に欠ける。
ほとんどのGNN説明法は、ポストホックな方法で動作し、重要なエッジと/またはノードの小さなサブセットの形で説明を提供する。
本稿では,これらの説明が信頼できないことを実証する。GNNの一般的な説明手法は,敵対的摂動に強い影響を受けやすいことが判明した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:09:16 GMT)
Husky: A Unified, Open-Source Language Agent for Multi-Step Reasoning [67.3] 我々はHuskyを紹介した。Huskyは総合的でオープンソースの言語エージェントで、統一されたアクション空間について推論することを学ぶ。
ハスキーは、(1)与えられたタスクを解決するために次のアクションを生成すること、2)エキスパートモデルを使用してアクションを実行すること、の2つの段階を繰り返す。
実験の結果,Huskyは14の評価データセットで先行言語エージェントよりも優れていた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:07:25 GMT)
Self-Tuning: Instructing LLMs to Effectively Acquire New Knowledge through Self-Teaching [67.1] 大規模言語モデル(LLM)は最新の情報の提供に苦慮することが多い。
既存のアプローチは、通常、新しいドキュメントのトレーニングを継続する。
効率的なヒューマンラーニングにおけるFeynman Techniqueの成功に感銘を受けて、セルフチューニングを紹介した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:42:20 GMT)
Unveiling the Safety of GPT-4o: An Empirical Study using Jailbreak Attacks [65.8] 本稿では,GPT-4oのジェイルブレイク攻撃に対する厳密な評価を行う。
新たに導入されたオーディオモダリティは、GPT-4oに対するジェイルブレイク攻撃のための新しい攻撃ベクトルを開く。
既存のブラックボックスマルチモーダル・ジェイルブレイク攻撃は、GPT-4oとGPT-4Vに対してほとんど効果がない。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:18:56 GMT)
Decision-focused Graph Neural Networks for Combinatorial Optimization [62.3] 最適化問題に取り組むための新たな戦略は、従来のアルゴリズムに代わるグラフニューラルネットワーク(GNN)の採用である。
GNNや従来のアルゴリズムソルバがCOの領域で人気が高まっているにもかかわらず、それらの統合利用とエンドツーエンドフレームワークにおけるそれらの相関について限定的な研究がなされている。
我々は、GNNを利用してCO問題に補助的なサポートで対処する決定に焦点を当てたフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 00:53:40 GMT)
TRINS: Towards Multimodal Language Models that Can Read [61.2] TRINSはText-RichイメージINStructionデータセットである。
39,153の画像、キャプション、102,437の質問が含まれている。
本稿では,画像中のテキスト内容の理解に長けたLanguage-vision Reading Assistant(LaRA)を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:52:37 GMT)
ExtraNeRF: Visibility-Aware View Extrapolation of Neural Radiance Fields with Diffusion Models [60.5] ExtraNeRFはニューラル・ラジアンス・フィールド(NeRF)によって処理される視野を外挿する新しい方法である
主な考え方は、NeRFをシーン固有の細部までモデル化し、拡散モデルを利用して観測データを超えて外挿することです。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:44:06 GMT)
Diving into Underwater: Segment Anything Model Guided Underwater Salient Instance Segmentation and A Large-scale Dataset [60.1] 水中視覚タスクは複雑な水中状況のため、しばしばセグメンテーションの精度が低い。
第1次大規模水中塩分分節データセット(USIS10K)を構築した。
本研究では,水中ドメインに特化してセグメンツ・ア・シング・モデル(USIS-SAM)に基づく水中塩分・インスタンス・アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:17:33 GMT)
Video-ChatGPT: Towards Detailed Video Understanding via Large Vision and Language Models [59.5] Video-ChatGPTは、ビデオ適応型ビジュアルエンコーダとLLMをマージするマルチモーダルモデルである。
ビデオに関する詳細な会話を理解し、生成することができる。
我々は,ビデオチャットGPTのトレーニングに使用される10,000対のビデオ命令ペアの新しいデータセットを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:36:53 GMT)
MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.6] 我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。
MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。
我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:19:09 GMT)
Acquiring Diverse Skills using Curriculum Reinforcement Learning with Mixture of Experts [58.2] 強化学習(Reinforcement Learning, RL)は, 優れた政策獲得のための強力なアプローチである。
多様なスキルを学習するための textbfDiverse textbfSkill textbfLearning (Di-SkilL) を提案する。
本稿では,Di-SkilLが多種多様なパフォーマンススキルを学習できるロボットシミュレーションタスクについて述べる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:56:21 GMT)
A Universal Class of Sharpness-Aware Minimization Algorithms [57.3] 我々は、新しいシャープネス尺度を導入し、新しいシャープネス対応目標関数を導出する。
これらの測度がテキスト的に表現可能であることを証明し、トレーニング損失ヘッセン行列の任意の関数を適切なハイパーおよび行列式で表すことを可能にする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:40:59 GMT)
GAIA: Rethinking Action Quality Assessment for AI-Generated Videos [56.0] アクション品質アセスメント(AQA)アルゴリズムは、主に実際の特定のシナリオからのアクションに焦点を当て、規範的なアクション機能で事前訓練されている。
我々は,新たな因果推論の観点から大規模主観評価を行うことにより,GAIAを構築した。
GAIAに基づいて、視覚的に合理的なアクションを生成する能力に基づいて、人気のテキスト・ツー・ビデオ(T2V)モデル群を評価する。
その結果、従来のAQA手法、最近のT2Vベンチマークにおける行動関連指標、主流のビデオ品質手法は人間の意見と相関が低いことがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:18:07 GMT)
Are you still on track!? Catching LLM Task Drift with Activations [55.8] 大規模言語モデル(LLM)は、ユーザや他のソースからの入力を処理したり、タスクを編成したりするための検索拡張されたアプリケーションで日常的に使用される。
これにより、LDMがデータのみのソースからの命令を受け取り、作用するインジェクション攻撃を誘導する扉が開き、ユーザーの元の命令から逸脱する。
我々はこれをタスクドリフトと定義し、LCMのアクティベーションをスキャンして解析することでこれをキャッチすることを提案する。
このアプローチは、これらの攻撃に対してトレーニングを受けることなく、インジェクションやジェイルブレイク、悪意のある指示など、目に見えないタスクドメインに対して驚くほどうまく一般化することを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:39:56 GMT)
Monkey See, Monkey Do: Harnessing Self-attention in Motion Diffusion for Zero-shot Motion Transfer [55.1] 既存の拡散に基づく運動編集法は、事前訓練されたモデルの重みに埋め込まれた前者の深いポテンシャルを見落としている。
動きパターンのキャプチャーと表現における注目要素の役割と相互作用を明らかにする。
我々はこれらの要素を統合して、従者のニュアンス特性を維持しつつ、従者へのリーダ動作の転送を行い、結果としてゼロショット動作の転送を実現した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:47:14 GMT)
IReNe: Instant Recoloring of Neural Radiance Fields [54.9] 我々は、NeRFにおける高速、ほぼリアルタイムな色編集を可能にするIReNeを紹介する。
トレーニング済みのNeRFモデルとユーザ対応カラー編集によるトレーニングイメージを併用する。
この調整により、モデルはトレーニング画像からの色変化を正確に表現して、新しいシーンビューを生成することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:12:38 GMT)
Vript: A Video Is Worth Thousands of Words [54.8] Vriptは12Kの高解像度ビデオの注釈付きコーパスで、詳細で密度が高く、スクリプト風のキャプションがある。
各クリップには145ワードのキャプションがあり、ほとんどのビデオテキストデータセットの10倍以上の長さである。
Vriptは、長いビデオのための高密度で詳細なキャプションをエンドツーエンドに生成できる強力なモデルである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:17:55 GMT)
Generalizable Human Gaussians from Single-View Image [54.7] 単一画像からの3次元人体モデリングのための拡散誘導フレームワークであるHGM(Single-view Generalizable Human Gaussian Model)を提案する。
観察されていない視点を幻覚させる効果はあるが、このアプローチは監督の欠如により非現実的な人間のポーズや形を生み出す可能性がある。
公開データセットに対する我々のアプローチを検証し、PSNRとSSIMの点で最先端の手法を大幅に上回っていることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:38:11 GMT)
Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality [54.2] マルチタスク線形回帰の文脈内学習のためのマルチヘッドソフトマックスアテンションモデルを訓練するための勾配流のダイナミクスについて検討する。
我々は,勾配流のダイナミックス中に,興味深い「タスク割り当て」現象が現れることを証明した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:18:07 GMT)
Event3DGS: Event-Based 3D Gaussian Splatting for High-Speed Robot Egomotion [54.2] Event3DGSは高速移動下で高忠実度3D構造と外観を再構築することができる。
複数の合成および実世界のデータセットの実験は、既存のイベントベースの高密度な3Dシーン再構築フレームワークと比較して、Event3DGSの優位性を示している。
また, 構造的精度を損なうことなく, 外観の忠実度をより高められるように, フレームベースで数回の動特性測定を再構成プロセスに組み込むことも可能である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:43:43 GMT)
Unified Mechanism-Specific Amplification by Subsampling and Group Privacy Amplification [54.1] サブサンプリングによる増幅は、差分プライバシーを持つ機械学習の主要なプリミティブの1つである。
本稿では、メカニズム固有の保証を導出するための最初の一般的なフレームワークを提案する。
サブサンプリングが複数のユーザのプライバシに与える影響を分析する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:44:02 GMT)
MaskLID: Code-Switching Language Identification through Iterative Masking [53.6] MaskLID (MaskLID) は、単純だが効果的なコードスイッチング(英語版) (CS) 言語識別 (LID) 方式である。
MaskLIDはいかなる訓練も必要とせず、現在の高性能の文レベルLIDを補完するように設計されている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:44:29 GMT)
When Authentication Is Not Enough: On the Security of Behavioral-Based Driver Authentication Systems [53.2] 我々はランダムフォレストとリカレントニューラルネットワークアーキテクチャに基づく2つの軽量ドライバ認証システムを開発した。
我々は,SMARTCANとGANCANという2つの新しいエスケープアタックを開発することで,これらのシステムに対する攻撃を最初に提案する。
コントリビューションを通じて、これらのシステムを安全に採用する実践者を支援し、車の盗難を軽減し、ドライバーのセキュリティを高める。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:09:27 GMT)
Loopy-SLAM: Dense Neural SLAM with Loop Closures [53.1] ポーズをグローバルに最適化するLoopy-SLAMと高密度3Dモデルを導入する。
我々は,データ駆動のポイントベースサブマップ生成手法を用いてフレーム・ツー・モデル追跡を行い,グローバルな位置認識を行うことで,オンラインのループクロージャをトリガーする。
合成Replicaおよび実世界のTUM-RGBDおよびScanNetデータセットの評価は、既存の高密度ニューラルネットワークRGBD SLAM法と比較して、追跡、マッピング、レンダリングの精度の競争力または優れた性能を示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:28:53 GMT)
Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation [52.9] 我々は,大言語モデル(LLM)を評価するためにスコーラブルネゴシエーション(scorable negotiations)を提案する。
合意に達するには、エージェントは強力な算術、推論、探索、計画能力を持つ必要がある。
我々は、新しいゲームを作成し、進化するベンチマークを持つことの難しさを増大させる手順を提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:43:34 GMT)
Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation [52.5] 我々はLlamaGenを紹介した。LlamaGenは画像生成モデルの新しいファミリーで、視覚生成ドメインに対して、大規模言語モデルのオリジナルの次世代予測のパラダイムを適用している。
これは、例えば、視覚信号に誘導バイアスのないバニラ自己回帰モデルが、適切にスケーリングすれば最先端の画像生成性能を達成できるかどうか、肯定的な答えである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:59:52 GMT)
Synthesizing Efficient Data with Diffusion Models for Person Re-Identification Pre-Training [51.9] 本稿では,既知の同一性に基づく多様な画像の効率向上と生成を行う新しいパラダイムDiffusion-ReIDを提案する。
提案したパラダイムに適合して,まず,5,183個のIDから777K以上の画像で構成された,大規模なRe-IDデータセットDiff-Personを新たに作成する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:26:03 GMT)
Automating Food Drop: The Power of Two Choices for Dynamic and Fair Food Allocation [51.7] 私たちはインディアナ州の非営利組織とパートナーし、EmphFood Dropというプログラムを率いています。
このパートナーシップの目標は、Food Dropを完全に自動化することにあります。
そのためには、食品を受け取った食品銀行の公正性の確保と、トラック運転手の効率の最適化を両立させるために、リアルタイムな意思決定を行うためのマッチングアルゴリズムが必要である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:22:41 GMT)
Graph Contrastive Learning under Heterophily via Graph Filters [51.5] グラフコントラスト学習(CL)法は,GNNエンコーダを用いて得られる拡張ノード表現の類似性を最大化することにより,ノード表現を自己指導的に学習する。
本研究では,ヘテロフィリー下でのグラフ表現学習に有効なグラフCL法であるHLCLを提案する。
我々の広範な実験により、HLCLはヘテロフィリーのベンチマークデータセットや大規模実世界のグラフで最先端のグラフCL法を最大7%上回り、ヘテロフィリーのデータセットでグラフ教師あり学習法を最大10%上回ります。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:31:20 GMT)
UMBRELA: UMbrela is the (Open-Source Reproduction of the) Bing RELevance Assessor [51.2] UMBRELAはオープンソースツールキットで、OpenAIのGPT-4oモデルを使ってThomasらの結果を再現する。
我々のツールキットは、容易に研究できるように設計されており、既存の多段階検索および評価パイプラインに統合することができる。
UMBRELAはTREC 2024RAGトラックで、関連性評価を支援するために使用される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:58:29 GMT)
Discovering Multiple Solutions from a Single Task in Offline Reinforcement Learning [51.0] オフライン強化学習において,一つのタスクから複数の解を学習するアルゴリズムを提案する。
実験の結果,提案アルゴリズムはオフラインRLにおいて,定性的,定量的に複数の解を学習することがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:25:49 GMT)
Quantum algorithms for spectral sums [50.0] 正半定値行列(PSD)のスペクトル和を推定するための新しい量子アルゴリズムを提案する。
本稿では, スペクトルグラフ理論における3つの問題に対して, アルゴリズムと手法が適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:21:41 GMT)
Beyond Trend Following: Deep Learning for Market Trend Prediction [49.9] 我々は、将来の市場動向を予測するために人工知能と機械学習技術を使うことを提唱する。
これらの予測は、適切に実行されれば、リターンを増やし、損失を減らすことで資産運用者のパフォーマンスを向上させることができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:42:30 GMT)
Parallelizing Linear Transformers with the Delta Rule over Sequence Length [49.9] この研究は、デルタ則で線形変圧器を訓練するためのハードウェア効率の良いアルゴリズムについて述べる。
我々は100Bトークンに対して1.3Bモデルをトレーニングし、最近の線形時間ベースラインよりも優れていることを発見した。
また、DeltaNet層を他の層または2つのグローバルアテンション層すべてにスライドウインドウアテンション層と組み合わせた2つのハイブリッドモデルの実験を行った。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:24:42 GMT)
Efficient k-Nearest-Neighbor Machine Translation with Dynamic Retrieval [49.8] $k$NN-MTはドメイン固有の翻訳知識を保持するために外部データストアを構築する。
適応検索(k$NN-MT-AR)は、$lambda$を動的に推定し、$lambda$が固定しきい値以下であれば$k$NN検索をスキップする。
本稿では,バニラ$k$NN-MTを大幅に拡張した動的検索(k$NN-MT-DR)を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:36:55 GMT)
DISCOVERYWORLD: A Virtual Environment for Developing and Evaluating Automated Scientific Discovery Agents [49.7] 本研究では,新しい科学的発見の完全なサイクルを実行するエージェントの能力を開発し,ベンチマークする最初の仮想環境であるDiscoVERYWORLDを紹介する。
8つのトピックにまたがる120の異なる課題タスクが含まれており、3レベルの難易度といくつかのパラメトリックなバリエーションがある。
従来の環境においてよく機能する強力なベースラインエージェントが、ほとんどのdiscoVERYWORLDタスクに苦労していることがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:08:44 GMT)
Coverage Axis++: Efficient Inner Point Selection for 3D Shape Skeletonization [49.5] Coverage Axis++は、3D形状のスケルトン化に対する、新しくて効率的なアプローチである。
メディア軸変換(MAT)の高精度近似を提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:10:49 GMT)
Learning Continually by Spectral Regularization [49.4] 可塑性の喪失は、ニューラルネットワークが学習中にトレーニングが困難になる現象である。
連続学習アルゴリズムは、ネットワークのトレーニング性を維持しながら、予測性能を良好に保ちながら、この効果を軽減しようとしている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:34:43 GMT)
Inter-slice Super-resolution of Magnetic Resonance Images by Pre-training and Self-supervised Fine-tuning [49.2] 臨床実践では、2次元磁気共鳴(MR)シーケンスが広く採用されている。個々の2次元スライスを積み重ねて3次元ボリュームを形成できるが、比較的大きなスライスススペーシングは可視化とその後の解析タスクに課題をもたらす可能性がある。
スライス間隔を低減するため,ディープラーニングに基づく超解像技術が広く研究されている。
現在のほとんどのソリューションは、教師付きトレーニングのために、かなりの数の高解像度と低解像度の画像を必要とするが、通常は現実のシナリオでは利用できない。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:20:26 GMT)
Safety Alignment Should Be Made More Than Just a Few Tokens Deep [48.8] 現在のLarge Language Models(LLM)の安全性アライメントは脆弱である。
比較的単純な攻撃、あるいは微調整さえも、ジェイルブレイク対応のモデルを作ることができる。
最初の数個のトークン以上の安全性アライメントの強化は、一般的なエクスプロイトに対するロバスト性を大幅に向上させる可能性があることを、私たちは示しています。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 00:35:23 GMT)
Fast White-Box Adversarial Streaming Without a Random Oracle [48.5] 我々は,従来の無作為なコインとストリーミングアルゴリズムが使用するパラメータに,敵対者がアクセス可能な強力なホワイトボックス逆数モデルを考える。
我々はスパースリカバリ問題に焦点を合わせ、その結果を異なる要素推定などのタスクに拡張する。
ホワイトボックス逆数ストリームにおけるスパースリカバリ問題に対する準最適解を構築し, 誤りを仮定した学習に基づく。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:23:19 GMT)
MAGNOLIA: Matching Algorithms via GNNs for Online Value-to-go Approximation [48.3] 問題に複雑な最適オンラインアルゴリズムをエミュレートするグラフニューラルネットワーク(GNN)を導入する。
我々は、このGNNが様々なタスクにまたがってハイウェイトマッチングを返すことを実証的に示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:39:04 GMT)
PlanDQ: Hierarchical Plan Orchestration via D-Conductor and Q-Performer [47.9] 我々はPlanDQと呼ばれるオフラインRL用に設計された階層型プランナを提案する。
PlanDQはD-Conductorという名前の拡散型プランナーを高レベルに組み込んでおり、サブゴールを通じて低レベル政策を導く。
低レベルでは、これらのサブゴールを達成するためにQ-Performerと呼ばれるQ-ラーニングベースのアプローチを使用しました。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:59:53 GMT)
Large Stepsize Gradient Descent for Logistic Loss: Non-Monotonicity of the Loss Improves Optimization Efficiency [47.9] 線形分離可能なデータを用いたロジスティック回帰に一定の段差を持つ勾配降下(GD)を考える。
GD はこの初期振動位相を急速に終了し、$mathcalO(eta)$ steps となり、その後$tildemathcalO (1 / (eta t) )$ convergence rate が得られることを示す。
我々の結果は、予算が$T$ ステップであれば、GD は攻撃的なステップサイズで $tildemathcalO (1/T2)$ の加速損失を達成できることを示している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:32:05 GMT)
Silent Signals, Loud Impact: LLMs for Word-Sense Disambiguation of Coded Dog Whistles [47.6] 犬の笛は、特定の聴衆に二次的な意味を持ち、しばしば人種的・社会経済的差別のために武器化された符号化通信の一種である。
本稿では,Large Language Models (LLMs) を用いた標準音声からの犬笛の単語センスの曖昧化手法を提案する。
我々はこの手法を利用して、フォーマルで非公式なコミュニケーションに使用される犬の口笛の16,550個の高信頼符号化されたサンプルのデータセットを作成する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 23:09:19 GMT)
Towards Signal Processing In Large Language Models [46.8] 本稿では,Large Language Model (LLM) 内で信号処理を適用するという考え方を紹介する。
古典的なフーリエ変換とフーリエ変換のような学習可能な時間周波数表現の並列性を描く。
GPTのようなアーキテクチャでは、より高速な収束を実現し、性能を大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:51:52 GMT)
Better Safe than Sorry: Pre-training CLIP against Targeted Data Poisoning and Backdoor Attacks [46.5] 大規模な画像キャプチャデータセット上でのCLIP(Contrastive Language- Image Pre-training)は、ゼロショット分類において顕著な成功を収めた。
CLIPは、教師付き学習と比較して、ターゲットデータ中毒やバックドア攻撃に対してより脆弱である。
我々は、ターゲットデータ中毒やバックドア攻撃に対して、CLIPを安全に事前訓練するための強力な防御策SAFECLIPを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:01:11 GMT)
Latent Directions: A Simple Pathway to Bias Mitigation in Generative AI [45.5] 生成的AIにおけるバイアスの緩和、特にテキスト・ツー・イメージのモデルは、社会にその影響が拡大していることを考えると、非常に重要である。
本研究は,潜在空間の方向を学習することで,多種多様な包摂的合成画像を実現するための新しいアプローチを提案する。
これらの学習された遅延方向を線形に組み合わせて、新しい緩和を導入し、望めばテキスト埋め込み調整と統合することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:13:51 GMT)
Harnessing AI for efficient analysis of complex policy documents: a case study of Executive Order 14110 [45.0] 法律、規制、執行命令などの政策文書は、社会の形成に不可欠である。
本研究の目的は、政策分析の合理化におけるAIの可能性を評価し、現在のAIアプローチの強みと限界を特定することである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:19:28 GMT)
Set Features for Anomaly Detection [44.8] 本稿では,各サンプルの要素分布をモデル化する集合の特徴について述べる。
簡単な密度推定法を用いて各試料の異常スコアを算出する。
本手法は,画像レベルの論理異常検出とシーケンスレベルの時系列異常検出において,従来の最先端技術よりも優れていた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:06:49 GMT)
Estimating Heterogeneous Treatment Effects by Combining Weak Instruments and Observational Data [44.3] 病状平均治療効果(CATE)の正確な予測は、パーソナライズされた医療とデジタルプラットフォーム分析において重要である。
我々は,信頼性の高いCATE推定を実現するために,IVと観測データを組み合わせた新しい手法を開発した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:40:55 GMT)
GaussianCity: Generative Gaussian Splatting for Unbounded 3D City Generation [44.2] 3D Gaussian Splatting (3D-GS)は、オブジェクトレベルの3D生成に対して、非常に効率的な代替手段として登場した。
しかし、有限スケールの3Dオブジェクトや人間から無限スケールの3D都市への3D-GSの適応は簡単ではない。
本稿では,1つのフィードフォワードパスで効率よく3D都市を合成するためのガウススティングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:59:55 GMT)
A Construct-Optimize Approach to Sparse View Synthesis without Camera Pose [44.1] カメラポーズを伴わないスパースビュー合成のための新しい構成と最適化手法を開発した。
具体的には、単分子深度と画素を3次元の世界に投影することで、解を構築する。
タンク・アンド・テンプル・アンド・スタティック・ハイクスのデータセットに3つの広い範囲のビューで結果を示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:51:42 GMT)
XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX [44.1] メタ強化学習研究のためのツールとグリッドワールド環境のスイートであるXLand-MiniGridを紹介する。
JAXで書かれたXLand-MiniGridは高度にスケーラブルに設計されており、GPUやTPUアクセラレータ上で実行することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:13:06 GMT)
American Sign Language Handshapes Reflect Pressures for Communicative Efficiency [43.6] コミュニケーション効率は言語学や認知心理学において重要なトピックである。
本稿では,アメリカ手話(ASL)におけるハンプチが,これらの効率をいかに反映しているかを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:45:36 GMT)
Steady-state dynamics and non-local correlations in thermoelectric Cooper pair splitters [43.6] 超伝導体-量子ドットハイブリッドを用いたクーパー対分割器の最近の実験は, 固体中での絡み合いの発生に乗じている。
我々は, 観測された輸送信号の詳細な解析を行い, 運用体制に重要な洞察をもたらす。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:46:10 GMT)
RAID: A Shared Benchmark for Robust Evaluation of Machine-Generated Text Detectors [43.5] 我々は,機械生成テキスト検出のための最大かつ最も困難なベンチマークデータセットであるRAIDを提案する。
RAIDには、11モデルにまたがる600万世代、ドメイン8、敵攻撃11、デコード戦略4がある。
現在の検出器は、敵攻撃、サンプリング戦略のバリエーション、繰り返し罰則、目に見えない生成モデルによって容易に騙される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:51:16 GMT)
Learning Fine-Grained Controllability on Speech Generation via Efficient Fine-Tuning [43.4] Voicebox Adapterは、微粒な条件を事前訓練されたVoicebox音声生成モデルに統合する新しいアプローチである。
実験の結果, バイアス調整構成の LoRA が最高の性能を示すことがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:31:18 GMT)
LLM Dataset Inference: Did you train on my dataset? [43.0] 本研究では,大規模言語モデルの学習に使用されるデータセットを正確に識別する新しいデータセット推論手法を提案する。
提案手法は, 統計的に有意なp値0.1を持つパイルの異なる部分集合の列車と試験セットを, 偽陽性を伴わずに識別する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:34:43 GMT)
PRISM-TopoMap: Online Topological Mapping with Place Recognition and Scan Matching [42.7] 本稿では,局所的な位置のグラフを保持するトポロジカルマッピング手法であるPRISM-TopoMapを紹介する。
提案手法は,ローカライゼーションとループ閉鎖のためのスキャンマッチングパイプラインと組み合わせた学習可能なマルチモーダル位置認識を含む。
提案手法の広範な実験的評価を,写真実写環境および実ロボット上で行った。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:51:10 GMT)
Using Deep Learning to Find the Next Unicorn: A Practical Synthesis [42.7] Venture Capital(VC)は、ユニコーンスタートアップを早期に特定し、投資し、高いリターンを得ることを期待している。
過去20年間、業界は従来の統計的アプローチから機械学習ベースのものへと移行してきた。
本研究は,DLのライフサイクル全体をカバーする,DLベースのアプローチに関する文献レビューと合成を行う。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:56:11 GMT)
Combining Embeddings and Domain Knowledge for Job Posting Duplicate Detection [42.5] 求人説明は、企業ウェブサイト、求人掲示板、ソーシャルメディアプラットフォームなど、多くのオンラインチャンネルに掲載されている。
プラットフォーム間でジョブの投稿を集約し、同じジョブを参照する重複記述を検出するのに役立つ。
重みに基づく文字類似性とテキスト埋め込みとキーワードマッチング法を組み合わせることで、説得力のある結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:38:15 GMT)
A Survey on Machine Unlearning: Techniques and New Emerged Privacy Risks [42.3] 機械学習は、プライバシー保護分野における研究ホットスポットである。
最近の研究者は、さまざまな機械学習アプローチの潜在的なプライバシー漏洩を発見した。
我々は、定義、実装方法、現実世界のアプリケーションなど、さまざまな面でプライバシーリスクを分析します。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:31:04 GMT)
PatchRefiner: Leveraging Synthetic Data for Real-Domain High-Resolution Monocular Metric Depth Estimation [42.3] PatchRefinerは、高分解能な実領域入力を目的としたメートル法単一画像深度推定のための高度なフレームワークである。
PatchRefinerはタイルベースの手法を採用し、高分解能深度推定を精錬プロセスとして再認識する。
我々の評価は、PatchRefinerの優れたパフォーマンスを示し、Unreal4KStereoデータセットの既存のベンチマークを著しく上回っている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:00:03 GMT)
Guided Diffusion for Fast Inverse Design of Density-based Mechanical Metamaterials [42.0] 本稿では, ボクセルをベースとしたメカニカルメタマテリアルを生成するために, コアが高度な深層生成AIアルゴリズムである高速逆設計法を提案する。
具体的には, 1283ドルの分解能を持つマイクロ構造を生成できる自己条件拡散モデルを用いて, 特定の均質化行列にわずか3秒でアプローチする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:26:14 GMT)
On-line conformalized neural networks ensembles for probabilistic forecasting of day-ahead electricity prices [41.9] 我々はPEPFに対する新しいアプローチを提案し、同型推論に基づく手法を用いて、アートニューラルネットワークのアンサンブルの手法を拡張した。
複数の市場地域で実験が行われ、昼の予測が達成され、時間帯のカバレッジが向上し、安定した確率的スコアが得られた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:13:29 GMT)
AnyV2V: A Tuning-Free Framework For Any Video-to-Video Editing Tasks [41.6] 我々はビデオ編集を簡単にするための新しいチューニング不要のパラダイムであるAnyV2Vを紹介する。
AnyV2Vは、既存の画像編集ツールを利用して、幅広いビデオ編集タスクをサポートすることができる。
評価の結果,AnyV2Vは自動評価や人的評価において,他のベースライン法よりも有意に優れていた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:38:00 GMT)
Investigating Pre-Training Objectives for Generalization in Vision-Based Reinforcement Learning [41.2] Atari-PB(Atari-PB)は,50ゲームから1000万の移行に対して,ResNet-50モデルを事前トレーニングするベンチマークである。
本実験は,タスク非依存の特徴を学習することに焦点を当てた事前学習目標が,様々な環境における一般化を促進することを示す。
対照的に、タスク固有の知識の学習に焦点を当てた目的は、事前学習データセットと同様の環境におけるパフォーマンスを改善するが、様々なものではない。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:06:38 GMT)
Relevant information in TDD experiment reporting [40.7] この記事では、外部品質を研究するTDD実験において、応答変数の操作コンポーネントを特定することを目的としています。
テストスイート、介入タイプ、測定器は、システムマッピング研究(SMS)の測定と結果に影響を及ぼす。
SMSの結果は、TDD実験がテストスイート、テストケース生成方法、あるいは外部品質の測定方法の詳細を報告していないことを確認しています。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:57:56 GMT)
UniHead: Unifying Multi-Perception for Detection Heads [40.5] 我々は、3つの知覚能力を同時に統合するために、UniHeadと呼ばれる革新的な検出ヘッドを開発する。
プラグアンドプレイ法として、提案したUniHeadは既存の検出器と便利な統合が可能である。
例えば、UniHeadはRetinaNetで+2.7APゲイン、FreeAnchorで+2.9APゲイン、GFLで+2.1APゲインを得ることができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:17:16 GMT)
Improving Alignment and Robustness with Circuit Breakers [40.5] 本稿では,「サーキットブレーカー」による有害な出力に応答するモデルを中断する手法を提案する。
トレーニングの拒絶と敵のトレーニングの代替として、サーキットブレーキングは有害なアウトプットの原因となる表現を直接制御する。
我々は、我々のアプローチをAIエージェントに拡張し、攻撃されているときの有害な行動の率を大幅に低下させることを実証する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:40:19 GMT)
SAM-CLIP: Merging Vision Foundation Models towards Semantic and Spatial Understanding [40.4] 一般公開されたビジョンファウンデーションモデル(VFM)の展望は急速に拡大している。
我々は,VFMを効率よく統合したモデルにマージする簡単なレシピを導入し,その専門知識を吸収する。
本手法をSAMおよびCLIPに適用することにより,SAMとCLIPの機能を組み合わせた一元モデルであるSAM-CLIPを単一視覚変換器に適用する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:19:16 GMT)
Comparing Hyper-optimized Machine Learning Models for Predicting Efficiency Degradation in Organic Solar Cells [39.8] 本研究は,有機太陽電池 (OSC) の電力変換効率 (PCE) に苦しむ時間的劣化を表現するための機械学習モデルを提案する。
製造プロセスと環境条件の両方に関して最大7変数を含む996項目のデータベースを180日間以上作成しました。
一方、根平均二乗誤差(RMSE)、二乗誤差(SSE)の和、および平均絶対誤差(MAE)>1%の目標値であるPCEは、係数決定(R2)の値に達した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:46:22 GMT)
Quantum enhancements and entropic constraints to Boundary Time Crystals as sensors of AC fields [39.6] 印加された交流場にスピンが共鳴するとBTCの感度が向上する。
長いコヒーレンス時間と多部相関にもかかわらず、BTCのエントロピーコストはACフィールド情報の最適な復号を妨げている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:53:31 GMT)
Fermionic anyons: entanglement and quantum computation from a resource-theoretic perspective [39.6] フェミオン異性体として知られる特定の1次元準粒子の分離性を特徴付ける枠組みを開発する。
我々はこのフェルミオンアニオン分離性の概念をマッチゲート回路の自由資源にマップする。
また,2つの量子ビット間のエンタングルメントが,フェルミオン異方体間のエンタングルメントの概念に対応していることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:01:46 GMT)
Social Environment Design [39.3] ソーシャル環境デザイン(Social Environment Design)は、AIを自動ポリシー作成に使用する一般的なフレームワークである。
このフレームワークは、一般的な経済環境を捉え、政策目標に関する投票を含め、AIシミュレーションを通じて政府と経済政策を体系的に分析するための方向性を提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:25:45 GMT)
How Efficient is LLM-Generated Code? A Rigorous & High-Standard Benchmark [39.1] 大規模言語モデル(LLM)の開発は、プログラム合成のフロンティアを著しく押し上げている。
ほとんどの評価フレームワークは生成したコードの(機能的な)正しさに重点を置いています。
我々は,LLMの効率的なコード生成能力を評価するための厳格で高水準なベンチマークENAMELを開発した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:19:20 GMT)
Aligning Large Language Models with Representation Editing: A Control Perspective [38.7] 人間の目的に合わせて微調整された大規模言語モデル(LLM)は、現実世界のアプリケーションには不可欠である。
プロンプトやガイドデコードといったテスト時のアライメント技術は、基礎となるモデルを変更しない。
表現編集によるLLMの整合性を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:21:31 GMT)
Human Simulacra: Benchmarking the Personification of Large Language Models [38.2] 大規模言語モデル(LLM)は、人間の知性の側面を忠実に模倣するシステムとして認識されている。
本稿では,仮想キャラクタのライフストーリーをゼロから構築するためのフレームワークを提案する。
実験により, 構築したシミュラクラは, 対象キャラクタと一致した擬人化応答を生成できることが実証された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:56:59 GMT)
Generative AI meets 3D: A Survey on Text-to-3D in AIGC Era [38.0] 生成AI(AIGC、別名AI生成コンテンツ)は近年大きく進歩している。
テキスト・ツー・イメージ・モデリング技術や3Dモデリング技術の進歩により、テキスト・ツー・3Dは生まれながらに非常に活発な研究分野として現れてきた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:13:18 GMT)
Resonance RoPE: Improving Context Length Generalization of Large Language Models [37.7] 本稿では,ロータリー位置埋め込み(RoPE)を備えた大規模言語モデル(LLM)におけるTSTLシナリオの課題について述べる。
本稿では,TSTLシナリオの一般化ギャップを狭めるための新しい手法であるResonance RoPEを紹介する。
本稿では,TSTLシナリオの微粒化挙動解析に特化して設計された,新しい合成ベンチマークPosGenを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:30:34 GMT)
PGSR: Planar-based Gaussian Splatting for Efficient and High-Fidelity Surface Reconstruction [37.1] 高忠実表面再構成を実現するために,高速平面型ガウススプラッティング再構成表現(PGSR)を提案する。
次に、大域的幾何精度を維持するために、一視点幾何、多視点測光、幾何正則化を導入する。
提案手法は3DGS法およびNeRF法よりも優れた高忠実度レンダリングと幾何再構成を維持しつつ,高速なトレーニングとレンダリングを実現する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:59:01 GMT)
Can Language Models Serve as Text-Based World Simulators? [36.7] 仮想環境は複雑な計画や意思決定タスクのベンチマークにおいて重要な役割を担います。
現在の言語モデル自体が世界シミュレータとして機能し、アクションがどのように異なる世界状態を変えるかを正確に予測できるだろうか?
私たちのゴールは、テキストベースのシミュレーターの文脈でこの質問に答えることです。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:24:44 GMT)
Lighting Every Darkness with 3DGS: Fast Training and Real-Time Rendering for HDR View Synthesis [35.8] ボリュームレンダリングに基づく手法は、特に夜間シーンにおいてRAWimagesからのHDRビュー合成に優れる。
長いトレーニング時間に悩まされており、サンプリング要求が密集しているためリアルタイムレンダリングを行うことができない。
3D Gaussian Splatting(3DGS)の登場により、リアルタイムレンダリングと高速なトレーニングが可能になる。
これらの設計により、LE3Dはリアルタイムのノベルビュー合成、HDRレンダリング、リフォーカス、トーンマッピングなどを行うことができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:33:08 GMT)
Chain-of-Scrutiny: Detecting Backdoor Attacks for Large Language Models [35.8] バックドア攻撃は大規模言語モデル(LLM)に重大な脅威をもたらす
これらの課題に対処するための新しいソリューションとして、CoS(Chain-of-Scrutiny)を提案する。
CoS は LLM を誘導して入力の詳細な推論ステップを生成し、最後に答えの整合性を確保するために推論プロセスを精査する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 00:53:25 GMT)
Optimization-based Causal Estimation from Heterogenous Environments [35.7] CoCoは、純粋な予測と因果推論のギャップを埋める最適化アルゴリズムである。
本稿では,本手法の理論的基礎を説明し,シミュレーションおよび実データに対する有効性を示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:32:38 GMT)
Knowledgeable Preference Alignment for LLMs in Domain-specific Question Answering [35.3] 大規模言語モデル(LLM)は、ドメイン固有の質問応答(QA)の実際のシナリオにデプロイされる。
本稿では,2つの課題に対処するための2種類の選好セットを構築するKnowPAT(KnowPAT)を紹介する。
また,LLM選好と人間の選好を均一に一致させる新たなアライメント目標を設計する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:06:10 GMT)
Modeling User Retention through Generative Flow Networks [34.7] フローベースのモデリング技術は、ユーザセッションで推奨される各項目に対する保持報酬をバックプロパガントすることができる。
従来の学習目標と組み合わされたフローは、最終的には、即時フィードバックとユーザ保持の両方に対して、非カウントの累積報酬を最適化した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:22:18 GMT)
CounterCurate: Enhancing Physical and Semantic Visio-Linguistic Compositional Reasoning via Counterfactual Examples [34.7] 視覚言語合成推論を改善するためのフレームワークであるCounterCurateを提案する。
特に、物理的根拠に基づく推論の無視という、2つの重要な未探索問題を特定する。
私たちはまず,CLIPやLLaVAといったマルチモーダルモデルの物理基底合成推論における近距離性能に注目した。
次に、グラウンドド画像生成モデルGLIGENを用いて単純なデータ拡張を適用し、微調整データを生成する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:59:55 GMT)
MolX: Enhancing Large Language Models for Molecular Learning with A Multi-Modal Extension [34.6] タスクハンドリング能力の強い大規模言語モデル(LLM)は、様々な分野において顕著な進歩を見せている。
本研究は, 分子を多モード外部モジュール, MolX で設計し, 実装することで, LLM の分子理解能力を高めることを目的とする。
特に,分子の表現にSMILES文字列を直接使用する代わりに,特定のエンコーダを用いて,SMILES文字列と2次元分子グラフ表現の両方から微細な特徴を抽出する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:25:18 GMT)
Quantifying fault tolerant simulation of strongly correlated systems using the Fermi-Hubbard model [34.5] 強い相関のある物質の全体的理解を構築することが重要である。
フォールトトレラントな量子コンピュータは、これらの困難を克服するための道として提案されている。
我々は, 耐故障性量子コンピュータを用いて, 実験量を得るために必要な資源コストを見積もる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:50:56 GMT)
Towards Transferable Targeted 3D Adversarial Attack in the Physical World [34.4] 移動可能な敵攻撃は、セキュリティクリティカルなタスクにより大きな脅威をもたらす可能性がある。
我々は、少数のマルチビュー画像からTransferable Targeted 3Dのテクスチャメッシュに迅速に再構成できるTT3Dという新しいフレームワークを開発した。
実験結果から,TT3Dは優れたクロスモデル転送性を示すだけでなく,異なるレンダリングやビジョンタスクにも適応性を維持することが示唆された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:10:41 GMT)
Semantica: An Adaptable Image-Conditioned Diffusion Model [32.9] 本稿では,条件付き画像のセマンティクスに基づいて画像を生成することができる画像条件拡散モデルであるSemanticaを紹介する。
ImageNet, LSUN Churches, LSUN Bedroom, SUN397におけるSemanticaの転写特性について検討した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:23:03 GMT)
Generalizing to Unseen Domains in Diabetic Retinopathy with Disentangled Representations [32.8] 既存のモデルは、ドメインシフトのため、目に見えないドメインで顕著なパフォーマンス劣化を経験します。
本稿では,異なるドメインのペアデータの表現をセマンティックな特徴とドメインノイズに分離する新しいフレームワークを提案する。
結果として得られる拡張表現は、他のドメインからの独自の網膜意味論とドメインノイズを含み、実際の臨床ニーズに合わせて拡張表現を生成することを目的としている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:43:56 GMT)
From Alexnet to Transformers: Measuring the Non-linearity of Deep Neural Networks with Affine Optimal Transport [32.4] 本稿では,DNNの非線形性シグネチャの概念を紹介する。これはディープニューラルネットワークの非線形性を測定するための,理論上初めての音響解である。
提案した非線形署名の実用性を明らかにするための実験結果について述べる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:29:21 GMT)
How Useful is Intermittent, Asynchronous Expert Feedback for Bayesian Optimization? [32.3] 非ブロック方式で組み込まれている少数の専門家のフィードバックがBOキャンペーンを改善できるかを検討する。
おもちゃと化学データセットの実験は、少数の間欠的な非同期専門家のフィードバックでさえ、BOを改善したり制約したりするのに役立つことを示唆している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:53:58 GMT)
FreeVA: Offline MLLM as Training-Free Video Assistant [32.1] FreeVAは、既存のイメージベースのMLLMをトレーニング不要の方法でビデオドメインに拡張することを目指している。
ゼロショットビデオの質問応答に優れており、ビデオのインストラクションチューニングを含む最先端の手法を超越している。
既存の作業で一般的に使用される評価指標は、時間とともにGPT APIのバージョンの変更によって大きく影響を受ける。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:55:21 GMT)
The Hidden Space of Transformer Language Adapters [31.9] トランスフォーマー言語アダプタは、新しいターゲット言語に予測を適用するために、凍結言語モデル上でトレーニングされた小さなモジュールである。
適応された予測は、モデルがトレーニングしたソース言語で主に進化し、ターゲット言語はモデルの最後の層でのみ発音される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:53:58 GMT)
Can I understand what I create? Self-Knowledge Evaluation of Large Language Models [31.9] 大規模言語モデル(LLM)は言語タスクにおいて顕著な進歩を遂げた。
フェインマンの創造を通して理解する原理に触発され、自己知識評価フレームワークを導入する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:53:54 GMT)
Lurking in the shadows: Unveiling Stealthy Backdoor Attacks against Personalized Federated Learning [31.4] PFLシステムに適用可能なステルスで効果的なバックドア攻撃戦略である textitPFedBA を提案する。
我々の研究は、PFLシステムに対する微妙ながら強力なバックドアの脅威に光を当て、新たなバックドアの課題に対する防衛を強化するようコミュニティに促している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:14:05 GMT)
Making Them Ask and Answer: Jailbreaking Large Language Models in Few Queries via Disguise and Reconstruction [31.2] 安全微調整におけるバイアスの脆弱性を特定することによって,LLMのセキュリティに関する理論的基盤を開拓した。
我々は、偽装による有害な指示を隠蔽するDRAというブラックボックスジェイルブレイク法を設計する。
我々は、さまざまなオープンソースおよびクローズドソースモデルでDRAを評価し、最先端のジェイルブレイク成功率と攻撃効率を示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:20:43 GMT)
BRAIn: Bayesian Reward-conditioned Amortized Inference for natural language generation from feedback [30.9] 勾配推定の高分散が、これらの手法の成功の欠如の主な原因である。
我々はベイズの規則を用いて DPG, GDC, DPO の目標分布を一般化し、報酬条件後部を定義する。
結果として得られたアプローチは、BRAInと呼ばれ、要約やアントロピー的HHタスクにおいて、先行技術よりも大幅に優れている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:18:46 GMT)
Defending Against Physical Adversarial Patch Attacks on Infrared Human Detection [30.4] 我々は,赤外線検出,特にヒト検出に対する敵パッチ攻撃に対する防衛戦略を最初に検討した。
本稿では,サンプルをランダムなパッチで効率的に拡張し,その後に検出する,単純な防御戦略であるパッチベースオクルージョン認識検出(POD)を提案する。
PODは、人を堅牢に検出するだけでなく、敵のパッチ位置も特定する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:47:57 GMT)
HALC: Object Hallucination Reduction via Adaptive Focal-Contrast Decoding [30.3] HALCは、大規模視覚言語モデル(LVLM)における物体幻覚(OH)を軽減するために設計された新しい復号アルゴリズムである。
HALCは、ハエの幻覚トークンを補正するために(局所的に)堅牢なオートフォーカスグラウンド機構と、OHを著しく低減するために(球面的に)特殊なビームサーチアルゴリズムを統合している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:21:41 GMT)
Adapting Pretrained ViTs with Convolution Injector for Visuo-Motor Control [30.0] 本研究では, 局所性に富んだ畳み込みと等分散バイアスを事前学習したViTに注入し, ビジュオモータ制御に有効適応するアドオンモジュールであるConvolutionを紹介する。
我々はCoInを3つの異なるドメイン内の12種類の制御タスクに対して、CLIP、MVP、VC-1の3つの異なる種類の事前訓練されたViTを用いて評価した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:36:24 GMT)
Conformal Prediction for Class-wise Coverage via Augmented Label Rank Calibration [30.0] 本稿では,クラス条件カバレッジを実現するための予測セットサイズを削減するために,ランク校正型クラス条件CP(RC3P)アルゴリズムを提案する。
複数の実世界のデータセットの実験により、RC3Pは平均的な予測セットサイズを26.25%削減した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:01:34 GMT)
Simpson's Paradox and the Accuracy-Fluency Tradeoff in Translation [30.0] 優れた翻訳は、ソースに忠実であり、対象言語の規範を尊重するべきである。
精度と流布度はコーパスのレベルで正の相関を示すが,個々のソースセグメントのレベルではトレードオフを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:59:26 GMT)
Fault-tolerant resource estimation using graph-state compilation on a modular superconducting architecture [30.0] フォールトトレラント量子コンピュータ(FTQC)の開発は、量子コンピューティングコミュニティ内で注目を集めている。
本稿では、特定の量子アルゴリズムの実行に必要な物理リソースを推定するリソース推定フレームワークとソフトウェアツールを提案する。
このツールは、ユーティリティスケールに近づくと、これらのアルゴリズムのサイズ、消費電力、実行時間を予測できる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:30:48 GMT)
Stable Minima Cannot Overfit in Univariate ReLU Networks: Generalization by Large Step Sizes [29.5] 固定学習率$eta$の勾配降下はスムーズな関数を表す局所最小値しか見つからないことを示す。
また、$n$のデータポイントのサポートの厳密な内部で、$widetildeO(n-4/5)$のほぼ最適MSE境界を証明します。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:57:27 GMT)
A Survey on Incomplete Multi-label Learning: Recent Advances and Future Trends [29.3] InMLLは不完全なラベル付きデータから学習することを目指している。
我々は、データ指向およびアルゴリズム指向の観点から、InMLLの分類を作成する。
各種領域におけるInMLLの実応用について述べる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:11:30 GMT)
Feasibility of accelerating homogeneous catalyst discovery with fault-tolerant quantum computers [29.3] 新規触媒の開発は化学製造の効率を大幅に向上させることができた。
本研究では, フォールトトレラント量子コンピュータを用いて均一触媒の発見を加速する可能性について検討した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:52:20 GMT)
Progressive Distillation Based on Masked Generation Feature Method for Knowledge Graph Completion [29.3] そこで本稿では,KGCタスクのためのマスク生成機能に基づくプログレッシブ蒸留法を提案する。
具体的には、PLMの予蒸留を行い、高品質の教師モデルを取得し、PLMネットワークを圧縮し、マルチグレードの学生モデルを得る。
実験により, 予蒸留段階のモデルが, 既存の最先端手法を超越していることが実証された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:50:54 GMT)
Meta Learning Text-to-Speech Synthesis in over 7000 Languages [29.2] 本研究では,7000以上の言語で音声を生成できる1つの音声合成システムを構築する上で,課題に取り組む。
本手法は,多言語事前学習とメタラーニングの新たな統合を活用することで,ゼロショット音声合成を利用可能なデータを持たない言語で実現する。
我々は,限られた言語資源を持つコミュニティの活性化と,音声技術分野におけるさらなるイノベーションの育成を目指している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:56:52 GMT)
Controlling Emotion in Text-to-Speech with Natural Language Prompts [29.0] 本稿では,感情に富んだテキストの繰り返しから派生した埋め込みを前提としたシステムを提案する。
話者とプロンプト埋め込みの合同表現は、トランスフォーマーベースアーキテクチャ内のいくつかの点で統合される。
本手法は感情音声とテキストデータセットを融合して学習し,モデルの一般化能力を高めるため,各訓練におけるプロンプトを変化させる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:58:42 GMT)
MolTC: Towards Molecular Relational Modeling In Language Models [29.0] 分子間相互作用予測のための新しい枠組みとして,分子間相互作用予測法(分子間相互作用予測法)を提案する。
我々の実験は4000,000以上の分子対を含む様々なデータセットで実施され、現在のGNNおよびLLMベースラインよりも優れていることを示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:45:51 GMT)
Personalized Binomial DAGs Learning with Network Structured Covariates [28.7] 因果発見は、観測データを用いて方向付非巡回図形構造を復元することを目的としている。
実際のWeb訪問データに動機付けられ、複数のWebサイトへの個々のユーザ訪問を記録します。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:33:24 GMT)
Online Newton Method for Bandit Convex Optimisation [28.7] ゼロ階帯域幅の最適化のための計算効率の良いアルゴリズムを提案する。
逆条件では、その後悔は少なくとも$d3.5 sqrtn Mathrmpolylog(n, d)$であり、d$が時間的地平線である確率が高いことを証明している。
設定において、バウンダリは$M d2 sqrtn Mathrmpolylog(n, d)$に改善され、[d-1/2, d-1 / 4]$は$Mとなる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:44:11 GMT)
Open Ad Hoc Teamwork with Cooperative Game Theory [28.6] アドホックなチームワークは、事前の調整や共同トレーニングなしに、チームメイトと協力するエージェントの設計を必要とする、困難な問題を引き起こします。
有望な解決策の1つは、制限のない数のエージェントを扱うためにグラフニューラルネットワークの一般化性を活用することである。
本稿では,ゲームフレームワークをベースとしたCIAOという新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:01:50 GMT)
Fed-Sophia: A Communication-Efficient Second-Order Federated Learning Algorithm [28.5] フェデレーション学習(Federated Learning)は、複数のデバイスが、ローカル更新のみを共有することで、パラメータサーバの助けを借りて協調的に学習する、機械学習アプローチである。
この領域では勾配に基づく最適化手法が広く採用されているが、二階法が示す曲率情報は収束のガイドと高速化に不可欠である。
本稿では,フェデレートされた大規模モデルにおける曲率情報の導入を可能にする,スケーラブルな2次法を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:57:30 GMT)
The Curse of Popularity: Popular Entities have Catastrophic Side Effects when Deleting Knowledge from Language Models [28.3] 言語モデル(LM)は、トレーニングを通じて世界的知識を内部パラメータにエンコードする。
本研究は, LMに格納されている知識に着目し, 知識削除の副作用と知識に関連するエンティティとの関係を解析する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:50:23 GMT)
Space-Time Continuous PDE Forecasting using Equivariant Neural Fields [28.2] 条件付きニューラルネットワーク(NeF)はPDEの強力なモデリングパラダイムとして登場した。
PDEの既知の対称性を尊重する時空連続NeFに基づく問題解決フレームワークを提案する。
利息グループに対するポイントクラウドのフローとしてのソリューションをモデル化することで、一般化とデータ効率が向上することを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:49:11 GMT)
Combinatorial Optimization with Automated Graph Neural Networks [28.2] NP-hard CO 問題,すなわち textbfAutoGNP を解決するために,textbfAUTOmated textbfGNN のクラスを新たに提案する。
AutoGNPの考え方は、グラフニューラルアーキテクチャ検索アルゴリズムを使用して、与えられたNPハード最適化問題に対して最適なGNNを自動的に見つけることである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:45:41 GMT)
ProcessPainter: Learn Painting Process from Sequence Data [28.0] 画家の絵画の過程は本質的に段階的に変化しており、異なる画家や様式によって大きく異なる。
従来のストロークベースのレンダリング手法は、画像をブラシストロークのシーケンスに分解するが、アーティストの真正なプロセスの複製には不十分である。
ProcessPainterは、最初は合成データに基づいて事前訓練され、その後、特定のアーティストの絵のシーケンスで微調整されるテキスト・ビデオ・モデルである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:18:41 GMT)
TinyTrain: Resource-Aware Task-Adaptive Sparse Training of DNNs at the Data-Scarce Edge [27.5] TinyTrainは、モデルの一部を選択的に更新することで、トレーニング時間を劇的に短縮するオンデバイストレーニングアプローチである。
TinyTrainはネットワーク全体のバニラ微調整を3.6-5.0%精度で上回る。
9.5倍の高速化と3.5倍のエネルギー効率のトレーニングを実現している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:57:14 GMT)
Scalable Private Search with Wally [27.4] Wallyは、大規模なデータベースに対する効率的なセマンティック検索とキーワード検索クエリをサポートするプライベート検索システムである。
従来のプライベート検索システムでは、各クライアントクエリに対して、サーバはデータベースのエントリごとに少なくとも1つの高価な暗号処理を実行する必要がある。
我々は,各クライアントにいくつかの偽のクエリを追加することを要求し,独立に選択されたランダムな瞬間に,匿名ネットワークを介して各クエリをサーバに送信することで,これらの結果を達成する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:41:25 GMT)
Computational and Statistical Guarantees for Tensor-on-Tensor Regression with Tensor Train Decomposition [27.3] TTに基づくToT回帰モデルの理論的およびアルゴリズム的側面について検討する。
制約付き誤差境界に対する解を効率的に見つけるための2つのアルゴリズムを提案する。
我々はIHTとRGDの両方の線形収束速度を確立する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:51:38 GMT)
2DP-2MRC: 2-Dimensional Pointer-based Machine Reading Comprehension Method for Multimodal Moment Retrieval [27.2] モーメント検索は、与えられた自然言語クエリに基づいて、トリミングされていないビデオの中で最も関連性の高い瞬間を見つけることを目的としている。
既存のソリューションは、モーメントベースの方法とクリップベースの方法に大まかに分類することができる。
本稿では,クリップベース手法における不正確なローカライゼーションの問題に対処するため,新しい2次元ポインターベース2DP-2MRCモデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:53:29 GMT)
Theoretical Guarantees for Variational Inference with Fixed-Variance Mixture of Gaussians [27.2] 変分推論(VI)はベイズ推定において一般的なアプローチである。
この研究は、非ガウスの場合のVIの理論研究に寄与することを目的としている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:32:49 GMT)
CPsyCoun: A Report-based Multi-turn Dialogue Reconstruction and Evaluation Framework for Chinese Psychological Counseling [27.2] 中国における心理カウンセリングのための多面的対話再構築・評価フレームワークCPsyCounを提案する。
心理カウンセリングレポートを完全に活用するために、高品質な対話を構築するための2段階のアプローチが考案された。
マルチターン心理相談の効果的な自動評価のための総合評価ベンチマークを開発した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:43:48 GMT)
LLIC: Large Receptive Field Transform Coding with Adaptive Weights for Learned Image Compression [27.0] 学習画像圧縮のための適応重み付き大規模受容場変換符号化を提案する。
カーネルをベースとした奥行きに関する大規模な畳み込みを導入し,複雑さを抑えながら冗長性を向上する。
我々のLLICモデルは最先端のパフォーマンスを実現し、パフォーマンスと複雑さのトレードオフを改善する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:30:38 GMT)
Triplet Interaction Improves Graph Transformers: Accurate Molecular Graph Learning with Triplet Graph Transformers [26.1] 本稿では,Triplet Graph Transformer(TGT)を提案する。
TGTは、まず2次元グラフから原子間距離を予測し、これらの距離を下流タスクに使用することにより、分子特性予測に適用する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 00:22:17 GMT)
Get rich quick: exact solutions reveal how unbalanced initializations promote rapid feature learning [26.1] 本研究では,非平衡層固有の初期化分散と学習速度が特徴学習の度合いを決定するかを検討する。
分析の結果,保存量によって学習体制に影響を及ぼすことが示唆された。
我々は、この不均衡なリッチレジームが、深い有限幅ネットワークにおける特徴学習を駆動し、CNNにおける初期層の解釈可能性を促進し、階層データの学習の複雑さを減らし、モジュラー算術の時間を短縮することを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:42:37 GMT)
A Parameter-efficient Language Extension Framework for Multilingual ASR [25.8] 本稿では,言語拡張のためのアーキテクチャベースのフレームワークを提案する。
パラメータ効率が良く、新しい言語に適応するためにアドオンモジュールを漸進的に組み込むように設計されている。
幅広い低パフォーマンスデータサイズを持つ5つの新しい言語で実験を行う。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:46:07 GMT)
Towards a Personal Health Large Language Model [25.7] 本稿では、時系列の個人健康データに対する理解と推論のために、Geminiから微調整されたPersonal Health Large Language Model (PH-LLM)を提案する。
1)睡眠パターン,身体活動,生理的反応からパーソナライズされた洞察の生成,2)専門的ドメイン知識,3)自己報告型睡眠結果の予測の3つのデータセットを作成した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:16:49 GMT)
IllumiNeRF: 3D Relighting without Inverse Rendering [25.6] 現在のライティング可能なビュー合成法は、逆レンダリングに基づいており、入力画像を説明するオブジェクトの幾何学、材料、照明を取り除こうとしている。
そこで我々はまず,照明条件付き画像拡散モデルを用いて各入力画像をリライトし,これらの信頼された画像を用いてニューラル放射場(NeRF)を再構成する手法を提案する。
この戦略は驚くほど競争力があり、複数のリライトベンチマークで最先端の結果が得られることを実証する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:59:59 GMT)
Transforming Wearable Data into Health Insights using Large Language Model Agents [25.6] 本稿では,ウェアラブルの行動保健データを分析・解釈するエージェントシステムであるPersonal Health Insights Agent(PHIA)を紹介する。
650時間の人間と専門家による評価に基づいて、PHIAは事実の数値的な質問の84%以上と、クラウドソーシングされたオープンエンドな質問の83%以上に正確に対処することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:00:54 GMT)
OntoType: Ontology-Guided and Pre-Trained Language Model Assisted Fine-Grained Entity Typing [25.5] きめ細かいエンティティタイピング(FET)は、コンテキストに敏感できめ細かいセマンティックタイプでエンティティをテキストに割り当てる。
OntoTypeは、粗いものから細いものまで、型オントロジ構造に従い、複数のPLMをアンサンブルすることで、型候補のセットを生成する。
Ontonotes、FIGER、NYTデータセットに関する我々の実験は、我々の手法が最先端のゼロショットの微細なエンティティタイピング方法よりも優れていることを示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:12:48 GMT)
Supervised Radio Frequency Interference Detection with SNNs [25.1] 電波干渉(Radio Frequency Interference、RFI)は、電波望遠鏡によって観測される観測を妨害し、地球や天体から発生する電波天文学において重要な課題である。
電波天文学観測の動的・時間的性質を考えると、スパイキングニューラルネットワーク(SNN)は有望なアプローチとして出現する。
SNN推論のための電波可視データの符号化について,レート,レイテンシ,デルタ変調,ステップフォワードアルゴリズムの3つのバリエーションを考慮した6つの符号化方式について検討した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:49:51 GMT)
Reasoning in Token Economies: Budget-Aware Evaluation of LLM Reasoning Strategies [24.9] 本稿では,計算予算を評価に組み込む枠組みを提案する。
複雑な推論戦略は、アルゴリズムの創発性のため、純粋に単純なベースラインを超えないことが多い。
自己整合性とは異なり、マルチエージェントの議論やリフレクションのような特定の戦略は、より多くの計算予算が利用されれば悪化する可能性がある。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:55:08 GMT)
Explicit Word Density Estimation for Language Modelling [24.9] ニューラルネットワークと正規化フローの連続的類似に基づく新しい言語モデル群を提案する。
本研究では,ニューラルネットワークと正規化フローの連続的類似に基づく新しい言語モデル群を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:21:33 GMT)
Ranking Large Language Models without Ground Truth [24.8] 大規模言語モデル(LLM)の評価とランキングは,これらのモデルの普及に伴って重要な問題となっている。
我々は、プロンプトのデータセットが与えられた場合、根拠となる真実や参照応答にアクセスせずにそれらをランク付けする、新しい視点を提供する。
この考え方を繰り返し適用し、LLMをランク付けする2つの方法を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:25:30 GMT)
Navigating the Metrics Maze: Reconciling Score Magnitudes and Accuracies [24.3] 10年前、単一のメトリクスBLEUが機械翻訳研究の進歩を支配した。
本稿では,現代のメトリクスの「ダイナミックレンジ」について考察する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:57:48 GMT)
Generalized W-Net: Arbitrary-style Chinese Character Synthesization [24.1] 既存のモデルは、限られた例で任意のスタイルの文字を生成するのに苦労する。
本稿では,W字型アーキテクチャの新たなクラスであるGeneralized W-Netを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 23:31:36 GMT)
StreamAtt: Direct Streaming Speech-to-Text Translation with Attention-based Audio History Selection [23.8] Streaming Speech-to-text Translation (StreamST)は、音声ストリームをインクリメンタルに受信しながら自動的に音声を翻訳するタスクである。
第1のStreamSTポリシであるStreamAttを導入し,第1のStreamSTレイテンシメトリックであるStreamLAALを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:27:58 GMT)
AlpaCare:Instruction-tuned Large Language Models for Medical Application [23.7] GPT-4 と ChatGPT を用いた多種多様な医療用 IFT データセット MedInstruct-52k の作成を提案する。
次に、データセット上のLLaMA系列モデルを微調整してAlpaCareを開発する。
ドメイン固有のデータセットが小さいにもかかわらず、AlpaCareは医療アプリケーションで優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:52:31 GMT)
ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization [23.6] ShiftAddLLMは大規模言語モデルの効率的な乗算自由モデルである。
5.6および22.7ポイントのパープレキシティ改善を同等または低いレイテンシで達成する。
5つのLLMファミリーと8つのタスクの実験は、ShiftAddLLMの有効性を一貫して検証している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:47:55 GMT)
Merlin: A Vision Language Foundation Model for 3D Computed Tomography [23.6] アメリカでは毎年8500万以上のCTスキャンが行われており、そのうち約4分の1が腹部に焦点を当てている。
複雑な画像研究の解釈の負担を軽減するために、人工知能を使うことには大きな意味がある。
我々はMerlinについて紹介する。この3D VLMは、ペアCTスキャン、EHR診断コード、放射線診断レポートを用いて訓練する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:53:01 GMT)
How Far Can Transformers Reason? The Locality Barrier and Inductive Scratchpad [23.4] 近年の研究では、トランスフォーマーは表現性の観点からチューリング完全であることが示されているが、これは学習可能性の目的に対処するものではない。
本稿では,弱い学習が正規変換器で効率的に達成可能な場合の「分布局所性」の概念を提唱する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:05:12 GMT)
mHuBERT-147: A Compact Multilingual HuBERT Model [23.2] mHuBERT-147は90K時間のクリーンでオープンなデータに基づいて訓練された最初の汎用多言語HuBERT音声表現モデルである。
マルチイテレーションの HuBERT アプローチをスケールアップするために,ファイスベースのクラスタリングを用い,元の手法よりも5.2倍高速なラベル割り当てを実現した。
以上の結果から,mHuBERT147は多言語音声処理タスクの有望なモデルであり,高い性能と効率のバランスを保っていることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:32:42 GMT)
A High Dimensional Statistical Model for Adversarial Training: Geometry and Trade-Offs [23.1] 本稿では,データと敵の攻撃的ジオメトリ間の相互作用を研究することのできる,引き込み可能な数学的モデルを提案する。
我々の主な理論的貢献は、敵の経験的リスク最小化のための十分な統計の正確な記述である。
トレーニング中に非破壊的特徴を防御する利点を示し、一様保護を本質的に効果的な防御機構として同定する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:24:37 GMT)
PRewrite: Prompt Rewriting with Reinforcement Learning [23.1] より効率的なプロンプトに最適化されていないプロンプトを書き換える自動化手法であるPRewriteを提案する。
我々は、PRewriteの有効性を示す様々なベンチマークデータセットの実験を行う。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:46:22 GMT)
An Effective-Efficient Approach for Dense Multi-Label Action Detection [23.1] i)時間的依存関係と(ii)共起行動関係を同時に学習する必要がある。
近年のアプローチは階層型トランスフォーマーネットワークによるマルチスケール特徴抽出による時間情報のモデル化である。
我々はこれを階層設計における複数のサブサンプリングプロセスと組み合わせることで、位置情報のさらなる喪失につながると論じている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:33:34 GMT)
Active Neural 3D Reconstruction with Colorized Surface Voxel-based View Selection [23.1] そこで我々は,新しい次世代ビュー (NBV) 選択法であるColorized Surface Voxel (CSV) ベースのビュー選択を導入する。
CSVは、推定シーンの外観と推定幾何情報の不確かさをカプセル化する。
我々の手法は、一般的なデータセットであるDTUとBlenderにおいて、過去の研究よりも優れています。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:05:28 GMT)
Multi-Prompting Decoder Helps Better Language Understanding [23.1] 本稿では,MaaS適応のためのMPD(Multi-Prompting Decoder)フレームワークを提案する。
提案手法は,複数の自然言語理解データセットに対して,数ショット設定で新たな最先端結果を実現する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:58:46 GMT)
Can AI Beat Undergraduates in Entry-level Java Assignments? Benchmarking Large Language Models on JavaBench [23.0] OOP機能を実行するプロジェクトレベルのJavaベンチマークであるJavaBenchを提案する。
106のJavaクラスに389のメソッドを持つ4つのJavaプロジェクトで構成されている。
282人の大学生が合格し、平均スコアは90.93/100である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:43:25 GMT)
ClashEval: Quantifying the tug-of-war between an LLM's internal prior and external evidence [22.9] 1200以上の質問のデータセット上で,上位6つの大規模言語モデル (LLM) をベンチマークした。
LLMは不正検索されたコンテンツの60%以上を利用できないことが判明した。
この発見を利用して、検索されたコンテンツに矛盾がある場合のモデル精度を向上させるための簡単な手法を実証する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:44:57 GMT)
A Survey of Backdoor Attacks and Defenses on Large Language Models: Implications for Security Measures [22.8] 大規模言語モデル(LLM)は、人間の言語理解と複雑な問題解決のギャップを埋める。
LLMはセキュリティ上の脆弱性、特にバックドア攻撃の影響を受けやすい。
本稿では, 微調整手法に着目し, LLMのバックドア攻撃に対する新たな視点について述べる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 23:54:21 GMT)
Recurrent Context Compression: Efficiently Expanding the Context Window of LLM [22.6] この研究はRecurrent Context Compression (RCC)と呼ばれる手法を導入し、Transformerベースの大規模言語モデル(LLM)のコンテキストウィンドウ長を効率的に拡張する。
我々は,複数のタスクに対するアプローチを検証し,BLEU4スコアが0.95に近いテキスト再構成タスクで最大32倍の圧縮率を実現し,シーケンス長1Mのパスキー検索タスクで約100%の精度を実現した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:50:59 GMT)
W-Net: One-Shot Arbitrary-Style Chinese Character Generation with Deep Neural Networks [22.4] 提案したW-Netモデルは、任意の文字を学習し、任意の文字を生成できる。
実験結果から, 提案手法は単発設定において有意に優れていることがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:16:27 GMT)
Do Vision & Language Decoders use Images and Text equally? How Self-consistent are their Explanations? [22.4] 視覚と言語モデル(VLM)デコーダは、マルチモーダルタスクにおける最も優れたアーキテクチャである。
予測や説明を生成する際に、視覚とテキストのモダリティがどの程度使われるかは明らかになっていない。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:43:20 GMT)
EXPIL: Explanatory Predicate Invention for Learning in Games [22.2] 強化学習(Reinforcement Learning, RL)は、様々なゲームで優れたエージェントを訓練するための強力なツールであることが証明されている。
最近の研究は、事前訓練されたニューラルネットワークエージェントのガイダンスを使ってロジックベースのポリシーをエンコードすることでこの問題に対処しようとしている。
本稿では,ゲームにおける学習のための説明述語発明(Explanatory Predicate Invention for Learning in Games,EXPIL)を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:46:49 GMT)
A Survey on Federated Unlearning: Challenges, Methods, and Future Directions [21.9] 近年、忘れられる権利(RTBF)の概念は、データプライバシーの重要な側面となっている。
マシン・アンラーニング(MU)の概念は注目されている。
FUは、フェデレートされた学習環境におけるデータ消去の課題に直面している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:03:03 GMT)
A Dual-View Approach to Classifying Radiology Reports by Co-Training [21.5] 我々は,放射線学レポートの構造が放射線学スキャンの異なる視点を提供するという新たな知見を提示する。
本研究では,FinderingsとImpressionセクション上に2つの機械学習モデルを構築する,協調学習手法を提案する。
その結果,協調学習手法は2つのビューで性能を向上し,教師付き手法や半教師付き手法に勝ることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:29:23 GMT)
UniVS: Unified and Universal Video Segmentation with Prompts as Queries [21.5] 本稿では、プロンプトをクエリとして使用することにより、新しい統合ビデオセグメンテーションアーキテクチャ、すなわちUniVSを提案する。
以前のフレームから予測されたエンティティのマスクを視覚的なプロンプトとすることで、UniVSは異なるVSタスクをプロンプト誘導されたターゲットセグメンテーションに変換する。
UniVSは、VSベンチマーク10の課題に対して、パフォーマンスと普遍性の合計バランスを示している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:52:54 GMT)
Boosting Robustness in Preference-Based Reinforcement Learning with Dynamic Sparsity [21.4] 極雑音環境設定におけるR2Nの有効性について検討し, 最大95%の状態特徴が無関係な乱れとなるRL問題設定について検討した。
シミュレーション教師による実験では、R2Nはタスク関連機能に焦点を合わせるために、ニューラルネットワークの疎結合に適応できることを示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:31:07 GMT)
Multivariate Stochastic Dominance via Optimal Transport and Applications to Models Benchmarking [21.2] 最適輸送の枠組みの下で, ほぼ優位性をスムーズなコストで評価する統計モデルを導入する。
また、Sinkhornアルゴリズムを用いた仮説テストフレームワークと効率的な実装を提案する。
複数のメトリクスで評価された大規模言語モデルの比較とベンチマークを行う方法について紹介する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:14:50 GMT)
Complexity-Aware Deep Symbolic Regression with Robust Risk-Seeking Policy Gradients [20.9] 本稿では,データ駆動型数式発見の堅牢性と解釈可能性を高めるための,新しい記号回帰手法を提案する。
DSRは最先端の手法であるDSRの成功にもかかわらず、リカレントニューラルネットワーク上に構築されており、純粋にデータ適合性によってガイドされている。
学習性能を向上させるために,トランスフォーマーとブロードスファーストサーチを併用した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:29:10 GMT)
ASTRA: Aligning Speech and Text Representations for Asr without Sampling [20.9] ASTRAはテキスト注入による音声認識(ASR)を改善する新しい手法である。
一般的な技法とは異なり、ASTRAは音声とテキストのモダリティ間のシーケンス長をサンプリングする必要がない。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:39:04 GMT)
Proving membership in LLM pretraining data via data watermarks [20.6] この研究は、ブラックボックスモデルアクセスのみで原則付き検出を可能にするために、データ透かしを使うことを提案する。
ランダムなシーケンスを挿入する2つの透かしと、Unicodeに似た文字をランダムに置換する2つの透かしについて検討する。
BLOOM-176Bのトレーニングデータから,少なくとも90回はハッシュを確実に検出できることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:39:34 GMT)
An Open and Large-Scale Dataset for Multi-Modal Climate Change-aware Crop Yield Predictions [20.4] CropNetデータセットは、気候変動を意識した収穫予測を対象とする、最初のテラバイトサイズの、公開可能な、マルチモーダルデータセットである。
CropNetデータセットは、Sentinel-2 Imagery(英語版)、WRF-HRRR(英語版)、USDA Cropd(英語版)の3つのデータからなる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:54:56 GMT)
FRAG: Frequency Adapting Group for Diffusion Video Editing [20.3] 高周波漏れは、デノナイジング過程における高周波成分に由来することが多い。
我々は、一貫性と忠実度の観点からビデオ品質を向上させる周波数適応グループ(FRAG)を考案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:24:19 GMT)
Active Learning with Simple Questions [20.2] ドメインXに属するn個のラベルのない例のプールSを学習者が提示する活発な学習環境を考える。
我々は、学習者がドメインTサブセットXとターゲットラベルyのサブセットを選択することができるような、より一般的な領域クエリについて研究する。
我々は、VC次元 d の任意の仮説クラス H が与えられたとき、VC次元 O(d) の領域クエリファミリー Q を設計でき、これは n 個の例の集合 S の部分集合 X と H のすべての h* に対して、学習者が Q から A への O(d log n) クエリを提出できることを示している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:42:50 GMT)
Towards Lifelong Learning of Large Language Models: A Survey [20.1] この調査は、生涯学習の洗練された風景を掘り下げ、戦略を2つの主要なグループ、内的知識と内的知識に分類する。
本研究では,実世界のアプリケーションにおける大規模言語モデルの適応性,信頼性,全体的な性能を向上させることを目的とする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:46:25 GMT)
Turbo Sparse: Achieving LLM SOTA Performance with Minimal Activated Parameters [20.1] 活性化間隔は活性化関数によって決定されるが、一般的に使用されるSwiGLUやGeGLUのような活性化間隔は限られている。
高品質なトレーニングデータ混合比とともに, LLMの活性化間隔を改善するために設計された新しいdReLU関数を提案する。
携帯電話では、TurboSparse-Mixtral-47Bが毎秒11トークンの推論速度を実現しています。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:21:59 GMT)
NarrativeBridge: Enhancing Video Captioning with Causal-Temporal Narrative [19.8] 既存のビデオキャプションベンチマークとモデルは、因果的時間的物語のコヒーレントな表現を欠いている。
この物語の欠如は、ビデオコンテンツに固有の因果的・時間的ダイナミクスをキャプチャするテキスト記述を生成するモデルの能力を制限する。
本研究では,(1)大規模言語モデルと少数ショットプロンプトを用いて生成された新しい因果的ナラティブ(CTN)キャプションベンチマークと,(2)原因と影響のダイナミクスを独立に捉えるための別個のエンコーダを備えた専用因果的ネットワーク(CEN)アーキテクチャからなるナラティブブリッジを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:34:24 GMT)
Survey for Landing Generative AI in Social and E-commerce Recsys -- the Industry Perspectives [19.8] ジェネレーティブAI(GAI)は、産業レコメンデーションシステム(Recsys)の強化と革新のためのユニークな機会を提示した。
これらの分野の交差点での研究努力が増えているにもかかわらず、GAIの産業レシーズへの統合は、その初期段階にある。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:16:59 GMT)
Long-Term Fairness Inquiries and Pursuits in Machine Learning: A Survey of Notions, Methods, and Challenges [19.7] 近年の研究では、市販のフェアネスアプローチは長期的なフェアネスを達成する目的には役に立たないことが示されている。
フィードバックループの存在とモデルと環境の間の相互作用は、初期公正性目標から逸脱する可能性のある追加の複雑さをもたらす。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:57:06 GMT)
Margin-aware Preference Optimization for Aligning Diffusion Models without Reference [19.4] 本稿では、SDXL(Stable Diffusion XL)のような最近のテキスト・画像拡散モデルのアライメントに焦点を当てる。
参照モデルに依存しない拡散モデルのための新しいメモリフレンドリーな選好アライメント手法を提案し,マージン・アウェア・選好最適化(MaPO)を提案する。
MaPOは、好ましくも好ましくない画像集合と好ましくも好まれる集合との近縁マージンを最大化し、同時に一般的なスタイリスティックな特徴と嗜好を学習する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:14:45 GMT)
DiffDA: a Diffusion Model for Weather-scale Data Assimilation [19.3] 本研究では,予測状態とスパース観測を用いて大気変数を同化可能な拡散モデルとしてDiffDAを提案する。
天気予報モデルと天気予報専用拡散モデルとの類似性を認識し,事前学習したGraphCastニューラルネットワークを拡散モデルのバックボーンとして適用する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:22:59 GMT)
On the Minimal Degree Bias in Generalization on the Unseen for non-Boolean Functions [19.2] ランダム特徴量(RF)モデルと変換器の領域外一般化について検討する。
まず、無見えない(GOTU)設定の一般化において、収束は極小の補間子に起こることを証明した。
次に、スパースターゲット体制を考察し、この体制が小さな特徴体制とどのように関係しているかを説明する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:14:33 GMT)
Predicting Heart Activity from Speech using Data-driven and Knowledge-based features [19.1] 自己教師型音声モデルは, 心臓活動パラメータの予測において, 音響特性よりも優れていることを示す。
これらの結果は、こうしたタスクにおけるデータ駆動型表現の価値を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:01:46 GMT)
Label-Looping: Highly Efficient Decoding for Transducers [19.1] 本稿では,Transducer推論のための高効率なグリーディ復号アルゴリズムを提案する。
本稿では,並列化仮説操作をサポートするバッチ内の部分仮説を表現するためにテンソルを用いた新しいデータ構造を提案する。
実験により、ラベルループアルゴリズムは従来のバッチデコードアルゴリズムと比較して2.0倍のスピードアップを実現することが示された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:34:38 GMT)
Adapting Open-Source Large Language Models for Cost-Effective, Expert-Level Clinical Note Generation with On-Policy Reinforcement Learning [19.1] 本研究では,オープンソースのLLaMA-213億パラメータモデルに対する包括的ドメイン・タスク特化プロセスを提案する。
教師モデルとしてGemini 1.0 Proを用いて、政治強化学習を行うための新しいアプローチであるDistillDirectを導入する。
我々のモデルであるLLaMA-Clinicは、医師が作成したものと同等の品質の臨床メモを生成することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:09:03 GMT)
From NeRFs to Gaussian Splats, and Back [18.8] 限られた数の(典型的には自我中心の)ビューが存在するロボティクスアプリケーションの場合、ニューラル放射場(NeRF)のようなパラメトリックな表現はガウススプラッティング(GS)のような非パラメトリックなものよりも一般化される。
我々はこの2つを前後に変換する手順を開発する。
提案手法は,NRF (PSNR, SSIM, LPIPS) とGS (リアルタイムレンダリング, 表現の修正能力) の双方の利点を生かし, これらの変換の計算コストは, スクラッチからトレーニングするよりも小さかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:13:41 GMT)
ReCon1M:A Large-scale Benchmark Dataset for Relation Comprehension in Remote Sensing Imagery [18.8] 本稿では,リモートセンシング画像の分野における大規模・百万レベルの関係データセットについて紹介する。
60のカテゴリにまたがる855,751のオブジェクトバウンディングボックスのアノテーションと、これらのバウンディングボックスに基づいて64のカテゴリにまたがる1,149,342のトリプルリレーションが含まれている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:40:03 GMT)
Retrieving Evidence from EHRs with LLMs: Possibilities and Challenges [18.6] 時間的制約を伴って患者に関連付けられた大量のメモは、実質的に不可能な証拠を手作業で特定する。
患者EHRにおける非構造的証拠を効率よく回収・要約するためのメカニズムとして, LLMを用いたゼロショット戦略を提案し, 評価した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:11:42 GMT)
Bayesian Active Learning in the Presence of Nuisance Parameters [18.3] 本研究では,ニュアンスパラメータの導入により,ベイズ学習者の対象パラメータの推定値に偏りが生じることを示す。
負の干渉の程度は極端に大きいことを示し、ニュアンスパラメータの正確な推定がそれを減らすために重要であることを示す。
その結果,学習環境間の負の伝達現象が明らかになった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:02:31 GMT)
Stronger, Faster, and Cheaper Log Parsing with LLMs [18.2] トレーニングプロセスやラベル付きデータを必要としない,費用対効果の高いLCMベースのログであるLogBatcherを提案する。
我々は16の公開ログデータセットの実験を行い、ログ解析にLogBatcherが有効であることを示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:39:28 GMT)
UMAD: Unsupervised Mask-Level Anomaly Detection for Autonomous Driving [18.2] 我々は,非教師なしの異常検出とUMADの提示を再考し,生成的世界モデルと教師なし画像セグメンテーションを活用する。
我々の手法は、最先端の教師なし異常検出よりも優れています。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:32:16 GMT)
Hybrid Video Anomaly Detection for Anomalous Scenarios in Autonomous Driving [18.2] 本稿では,自律運転におけるHF$2$-VAD監視ビデオ異常検出手法のバリエーションについて述べる。
車両の自我的視点から正規性の表現を学び、稀かつ臨界シナリオにおける画素ワイドな異常検出を評価する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:14:33 GMT)
Learning the Uncertainty Sets for Control Dynamics via Set Membership: A Non-Asymptotic Analysis [18.1] 本稿では,未知の線形システムに対するセットメンバシップ推定(SME)に焦点を当てる。
本稿では,中小企業の収束率境界について述べるとともに,緩和された仮定の下での中小企業の変動について論じる。
また,中小企業の実用性を示す数値的な結果も提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:05:58 GMT)
SoundCTM: Uniting Score-based and Consistency Models for Text-to-Sound Generation [18.1] 我々はSoundCTM(Sound Consistency Trajectory Models)を紹介する。
提案モデルは,高品位1段音生成と高品位1段音生成との柔軟な遷移を可能にする。
SoundCTMは、余分なオフザシェルフネットワークを使わずに、有望な1ステップと複数ステップのリアルタイムサウンド生成を実現する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:49:58 GMT)
NeuroMoCo: A Neuromorphic Momentum Contrast Learning Method for Spiking Neural Networks [18.0] 本稿では脳誘発スパイキングニューラルネットワーク(SNN)のためのニューロモルフィック・モーメント・コントラスト学習(NeuroMoCo)を紹介する。
SNNにおいて、モーメントコントラスト学習に基づく自己教師型学習(SSL)が実現されたのはこれが初めてである。
DVS-CI10、DVS128Gesture、N-Caltech101の実験は、NeuroMoCoが新しい最先端(SOTA)ベンチマークを確立することを示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:20:48 GMT)
An LLM-Assisted Easy-to-Trigger Backdoor Attack on Code Completion Models: Injecting Disguised Vulnerabilities against Strong Detection [17.9] 我々は,コード補完モデルに基づくLLM支援バックドアアタックフレームワークであるCodeBreakerを紹介した。
悪意のあるペイロードを最小限の変換でソースコードに直接統合することで、CodeBreakerは現在のセキュリティ対策に挑戦する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:10:05 GMT)
Building Bridges: A Dataset for Evaluating Gender-Fair Machine Translation into German [17.9] 英独機械翻訳(MT)におけるジェンダーフェア言語の研究
2つの商用システムと6つのニューラルMTモデルを含む最初のベンチマーク研究を行う。
以上の結果から,ほとんどのシステムでは男性型が主流であり,性別ニュートラル変種は稀である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:39:19 GMT)
FPN-IAIA-BL: A Multi-Scale Interpretable Deep Learning Model for Classification of Mass Margins in Digital Mammography [17.8] 解釈不能なディープラーニングモデルは、高度な環境には適さない。
コンピュータビジョンの解釈における最近の研究は、かつてのブラックボックスに対して透明性を提供する。
本稿では,マンモグラフィマスマージン分類のための多段階解釈型深層学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:44:41 GMT)
HeadEvolver: Text to Head Avatars via Expressive and Attribute-Preserving Mesh Deformation [17.6] 本稿では、テキストガイダンスからスタイリングされたヘッドアバターを生成する新しいフレームワークであるHeadEvolverを紹介する。
HeadEvolverはテンプレートのヘッドメッシュからローカルに学習可能なメッシュ変形を使用して、詳細な編集とアニメーションのために高品質なデジタルアセットを生成する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:50:36 GMT)
FSRT: Facial Scene Representation Transformer for Face Reenactment from Factorized Appearance, Head-pose, and Facial Expression Features [17.5] 顔再現の課題は、頭部の動きと表情を駆動ビデオからソース画像の外観に転送することである。
既存の手法の多くはCNNベースであり、ソース画像から現在の駆動フレームへの光の流れを推定する。
本稿では,ソースコードのセットラテント表現を演算するためのトランスフォーマーベースのエンコーダを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:06:49 GMT)
Are EEG-to-Text Models Working? [17.4] この研究は、オープン語彙EEG-to-Text翻訳のための既存のモデルを批判的に分析する。
本稿では,脳波信号から真に学習するモデルと,トレーニングデータを記憶するモデルとを区別する手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:01:18 GMT)
Enabling Large-Scale and High-Precision Fluid Simulations on Near-Term Quantum Computers [17.3] 量子計算流体力学(QCFD)は古典計算流体力学(CFD)に代わる有望な代替手段を提供する
本稿では,超伝導量子コンピュータ上に実装された包括的QCFD法を提案する。
Poiseuilleフローシミュレーションは0.2%以下の相対誤差を達成し、非定常音響波シミュレーションは5043次元行列を解いた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:21:23 GMT)
Robust Distribution Learning with Local and Global Adversarial Corruptions [17.2] 誤差を$sqrtvarepsilon k + rho + dO(1)tildeO(n-1/k)$で有界な有限サンプルアルゴリズムを開発する。
我々は、ワッサーシュタインの分布的ロバストな最適化において、次元性の呪いを克服する新しい方法を発見した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:48:36 GMT)
Large Language Models(LLMs) on Tabular Data: Prediction, Generation, and Understanding -- A Survey [17.2] 現在、この研究領域における主要なテクニック、メトリクス、データセット、モデル、最適化アプローチを要約し比較する包括的なレビューが欠如しています。
この調査は、これらの領域における最近の進歩を集約し、使用するデータセット、メトリクス、方法論の詳細な調査と分類を提供することによって、このギャップに対処することを目的としている。
既存の文献の強さ、限界、未探索領域、ギャップを識別し、この重要かつ急速に発展する分野における将来の研究の方向性についていくつかの洞察を提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:41:32 GMT)
Extending Segment Anything Model into Auditory and Temporal Dimensions for Audio-Visual Segmentation [17.1] 本稿では,SAMのエンコーダとマスクデコーダの中間部分に組み込まれた時空間バイビジュアルアテンション(ST-B)モジュールを提案する。
ビデオフレームとオーディオストリーム間の時間的対応を伝達するために、オーディオ視覚機能を適応的に更新する。
提案手法は, AVSベンチマークの最先端手法, 特に8.3% mIoU が, 挑戦的なマルチソースサブセットよりも優れている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:53:23 GMT)
Experimental benchmarking of quantum state overlap estimation strategies with photonic systems [17.1] トモグラフィー・トモグラフィー・プロジェクション,シュール集団計測,光スワップテストの4つの方法を比較した。
フォトニックシステムでは、各戦略に対する重なり依存的な推定精度が、一様サンプリング状態に対する平均推定ばらつきによって定量化される。
その結果、量子システムから興味のパラメータを抽出することに新たな光を当て、効率的な量子プロトコルの設計を促した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:33:10 GMT)
Multimodal Contextualized Semantic Parsing from Speech [16.8] 本研究では, 文脈環境における意味的パーシング(SPICE)について紹介する。
VG-SPICEデータセットは、音声交換から視覚的なシーングラフ構築を行うエージェントに挑戦するために開発された。
また、VG-SPICEで使用するために開発されたAViD-SP(Audio-Vision Dialogue Scene Scene)も紹介する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:31:34 GMT)
Correlation-Decoupled Knowledge Distillation for Multimodal Sentiment Analysis with Incomplete Modalities [16.7] 本稿では,Multimodal Sentiment Analysis (MSA)タスクのための相関分離型知識蒸留(CorrKD)フレームワークを提案する。
本稿では, クロスサンプル相関を含む包括的知識を伝達し, 欠落した意味論を再構築するサンプルレベルのコントラスト蒸留機構を提案する。
我々は,学生ネットワークの感情決定境界を最適化するために,応答不整合蒸留方式を設計する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:10:37 GMT)
MATES: Model-Aware Data Selection for Efficient Pretraining with Data Influence Models [16.7] データ影響モデル(MATES)を用いたモデル認識データ選択について紹介する。
事前学習モデルを局所的に探索することにより収集したオラクルデータ嗜好信号を近似するために、小さなデータの影響モデルを微調整する。
PythiaとC4データセットの実験では、MATESが広範囲な下流タスクでランダムなデータ選択を著しく上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:27:42 GMT)
Network two-sample test for block models [16.6] 2組のネットワークが同じモデルに由来するかどうかを判定することを目的とするネットワークの2サンプルテスト問題を考える。
ネットワーク分布にブロックモデル(SBM)を適用するのは,その解釈可能性と,より一般的なモデルに近似する可能性からである。
推定されたネットワークパラメータにマッチする効率的なアルゴリズムを導入し、サンプル内およびサンプル間の情報を適切に組み合わせ、コントラスト化することで、強力なテストを実現する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:28:37 GMT)
Self-Correcting Self-Consuming Loops for Generative Model Training [16.6] 機械学習モデルは、人間と機械が生成したデータの混合に基づいて、ますます訓練されている。
合成データを用いた表現学習の成功にもかかわらず、合成データを用いた生成モデルトレーニングは「自己消費ループ」を創出する
本稿では,理想化された補正関数を導入することで,自己消費生成モデルの訓練を安定化することを目的とする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:22:45 GMT)
Neural-g: A Deep Learning Framework for Mixing Density Estimation [16.5] 混合(または先行)密度推定は、機械学習と統計学において重要な問題である。
本稿では,新しいニューラルネットワークを用いたモデリング手法であるNeural-$g$を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:00:28 GMT)
Information-Theoretic Generalization Bounds for Transductive Learning and its Applications [16.4] 我々は情報理論とPAC-ベイジアン理論の文脈におけるトランスダクティブ学習アルゴリズムの一般化境界を開発する。
我々の理論結果は、合成データセットと実世界のデータセットの両方で検証される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:50:09 GMT)
HO-Cap: A Capture System and Dataset for 3D Reconstruction and Pose Tracking of Hand-Object Interaction [16.4] ビデオ中の手や物体の3D再構成とポーズ追跡に使用できるHO-Capという新しいデータセットを紹介した。
そこで本研究では,手や物体の形状やポーズのアノテーションを半自動で取得する手法を提案する。
我々のデータキャプチャのセットアップとアノテーションフレームワークは、コミュニティがオブジェクトと人間の手の3D形状を再構築し、それらのポーズをビデオで追跡するために使用することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 23:25:19 GMT)
Point-VOS: Pointing Up Video Object Segmentation [16.4] 現在の最先端のビデオオブジェクト(VOS)メソッドは、トレーニングとテストの両方において、オブジェクトごとの密集したマスクアノテーションに依存している。
本稿では,その労力を大幅に削減する疎時間的ポイントワイドアノテーションスキームを備えた新しいPoint-VOSタスクを提案する。
ビデオナラティブグラウンドディング(VNG)タスクで評価することで、視覚と言語を接続するモデルを改善するために、我々のデータが利用できることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:58:56 GMT)
Comparing Data Augmentation Methods for End-to-End Task-Oriented Dialog Systems [16.2] データ拡張(DA)は他のNLPシステムで成功しているが、ToDSでは広く研究されていない。
エンド・ツー・エンドのToDS設定におけるDA手法の有効性を実証的に評価した。
本研究では,3種類のDA手法(単語レベル,文レベル,ダイアログレベル)を,ToDSや他のNLPシステムにおいて有望な結果を示す8つのDA手法と比較する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:36:05 GMT)
Machine-Generated Text Localization [16.1] これまでの作業では、主にMGT検出を文書全体に対するバイナリ分類タスクとして定式化してきた。
本稿では,機械が生成した文書の一部をローカライズするMGTの詳細な研究について述べる。
事前の作業よりも平均精度(mAP)が4-13%向上したことは、5つの多様なデータセットに対するアプローチの有効性を示している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:20:20 GMT)
Data-Efficient Learning with Neural Programs [16.1] 我々は,ブラックボックスコンポーネントの入力出力サンプルのみに依存する,ISEDと呼ばれるニューラルプログラムの学習アルゴリズムを提案する。
評価の結果,ISEDは最先端のニューロシンボリック・フレームワークに匹敵する性能を示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:23:00 GMT)
Lessons from Generalization Error Analysis of Federated Learning: You May Communicate Less Often! [15.7] 一般化誤差の進化を、K$クライアントとパラメータサーバ間の通信ラウンド数$R$で調べる。
PAC-Bayes and rate-distortiontheoretic bounds on the generalization error that account on the effect of the numbers $R$。
FSVMの一般化限界は$R$で増加し、PSとのより頻繁な通信が一般化力を低下させることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:52:35 GMT)
Learning from Students: Applying t-Distributions to Explore Accurate and Efficient Formats for LLMs [15.7] 正規フロート(NF4)のような低精度の整数形式は、チップ面積の増加によるモデル精度の向上を実現している。
理論上最適である新たな形式である学生フロート(SF4)が提案され、現代のLLMにおいてNF4よりも改善されている。
このフォーマットを高精度な参照として使用し、モデル精度を高めるための2種類の超正規サポートを持つ拡張E2M1を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 23:41:18 GMT)
Gaussian Control with Hierarchical Semantic Graphs in 3D Human Recovery [15.6] 高忠実度3次元再構成を実現するための階層型人ガウス制御(HUGS)フレームワークを提案する。
我々のアプローチは、幾何学的トポロジーの整合性を確保するために、身体部分の明示的な意味的先行性を活用することである。
本手法は, 人体再建における優れた性能, 特に表面の細部を向上し, 体部接合部を正確に再構築する上での優れた性能を示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:15:08 GMT)
Parameter-Efficient Fine-Tuning for Medical Image Analysis: The Missed Opportunity [15.4] の応用。
医用画像解析におけるPEFT(Efficient Fine-Tuning)は, 比較的未探索である。
本研究では、画像分類とテキスト・ツー・イメージ生成タスクにおいて、17の異なるPEFTアルゴリズムを評価することにより、このギャップを埋める。
本研究はPEFTの有効性,特に医用画像に共通する低データ領域における有効性を示すものである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:11:40 GMT)
Latent Representation Matters: Human-like Sketches in One-shot Drawing Tasks [15.3] 我々は、異なる誘導バイアスが潜在拡散モデル(LDM)の潜時空間をどのように形成するかを研究する。
冗長性の低減とプロトタイプベース正規化によるLCDが, ほぼ人間に近い図形を生成することを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:52:29 GMT)
FedHCDR: Federated Cross-Domain Recommendation with Hypergraph Signal Decoupling [15.2] 我々は,ハイパーグラフ信号デカップリングを用いた新しいクロスドメイン勧告フレームワークであるFedHCDRを提案する。
本研究では,ハイパーグラフ信号デカップリング(HSD)と呼ばれる手法を導入し,ユーザ特徴をドメイン排他的・ドメイン共有的特徴に分離する。
3つの実世界のシナリオで実施された大規模な実験は、FedHCDRが既存のベースラインを著しく上回ることを示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:57:11 GMT)
UEMM-Air: A Synthetic Multi-modal Dataset for Unmanned Aerial Vehicle Object Detection [14.9] 合成多モードUAVオブジェクト検出データセットUEMM-Airを提案する。
特に、Unreal Engine (UE) を用いて、様々なUAV飛行シナリオとオブジェクトタイプをシミュレートする。
UEMM-Airは5つのモダリティと正確なアノテーションを備えた20万枚の画像で構成されています。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:00:22 GMT)
Should my Blockchain Learn to Drive? A Study of Hyperledger Fabric [14.8] 本稿では、人間の介入なしにワークロードの変化を予測し、最適なパフォーマンスのために自分自身を再構成する可能性を秘めている自動運転ブロックチェーンの概念について考察する。
私たちは、自律的な適応に適した一般的なパーミッションブロックチェーンシステムであるHyperledger Fabricの特定のパラメータとコンポーネントを特定し、関連する課題に対する潜在的なソリューションを提供します。
私たちの実験では、スループットが最大11%向上し、レイテンシが30%削減されたことが示されています。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:33:59 GMT)
Decoupled Marked Temporal Point Process using Neural Ordinary Differential Equations [14.8] MTPP(マークド・テンポラル・ポイント・プロセス)は、イベント・タイム・データの集合である。
近年の研究では、ディープニューラルネットワークを使用してイベントの複雑な時間的依存関係をキャプチャしている。
本稿では,プロセスの特性を異なる事象からの進化的影響の集合に分解する脱結合型MTPPフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:15:32 GMT)
MLLMReID: Multimodal Large Language Model-based Person Re-identification [14.7] MLLM(Multimodal large language model)は多くのタスクにおいて満足な結果を得た。
本稿では,ReIDの課題に適合させる方法について検討する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:21:19 GMT)
Leveraging Neural Radiance Fields for Pose Estimation of an Unknown Space Object during Proximity Operations [14.6] 本稿では、未知のターゲットに「オフ・ザ・シェルフ」宇宙船のポーズ推定装置を適用可能な新しい手法を提案する。
対象画像のスパースコレクションを用いてNeRFモデルをトレーニングし,視点と照明の両面で多様な大きなデータセットを生成する。
本手法は,スパース画像の集合から,市販の宇宙船のポーズ推定ネットワークの訓練に有効であることが実証された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:15:08 GMT)
Solving Inverse Problems with Model Mismatch using Untrained Neural Networks within Model-based Architectures [14.6] モデルベースアーキテクチャでは,各インスタンスの計測領域におけるデータの一貫性を一致させるために,トレーニングされていないフォワードモデル残差ブロックを導入する。
提案手法は,パラメータ感受性が低く,追加データを必要としない統一解を提供し,前方モデルの同時適用と1パスの再構成を可能にする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:43:17 GMT)
Interpretability of Language Models via Task Spaces [14.5] 本稿では,解釈言語モデル (LM) の代替手法を提案する。
我々は、LM処理の品質に焦点を合わせ、言語能力に焦点をあてる。
言語現象間の関係を照らす「言語的タスク空間」を構築した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:34:30 GMT)
Generalized Nested Latent Variable Models for Lossy Coding applied to Wind Turbine Scenarios [14.5] 学習に基づくアプローチは、圧縮率と再構成された画質の妥協を最小化する。
成功したテクニックは、2レベルネストされた潜伏変数モデル内で機能するディープハイパープライアの導入である。
本稿では,マルコフ連鎖構造を持つ一般化Lレベルネスト生成モデルを設計することによって,この概念を拡張した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:00:26 GMT)
Controlling Counterfactual Harm in Decision Support Systems Based on Prediction Sets [14.5] 予測セットに基づく意思決定支援システムでは、正確性と因果的害との間にトレードオフがある。
自然で検証不能な単調な仮定の下では、システム自体が人間による予測を用いて、どれだけの頻度で害を引き起こす可能性があるかを推定することができる。
また, 仮説が弱く, 検証可能な場合, 人間による予測のみを用いて, システムが再び危害を引き起こす頻度を制限できることも示している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:00:00 GMT)
Movement Primitive Diffusion: Learning Gentle Robotic Manipulation of Deformable Objects [14.4] 運動原始拡散(英: Movement Primitive Diffusion、MPD)は、ロボット支援手術における模倣学習(IL)の新しい手法である。
MPDは拡散型模倣学習(DIL)の汎用性と確率的動特性プリミティブ(ProDMP)の高品質な運動生成能力を組み合わせる
実世界および実世界の様々なロボット作業におけるMPDの評価を,状態観察と画像観察の両方で行う。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:11:00 GMT)
Unraveling overoptimism and publication bias in ML-driven science [14.4] 本稿では,パラメトリック学習曲線と前述のバイアスを統合することで,観測精度の新たなモデルを提案する。
次に、観測データにおけるこれらのバイアスを補正する推定器を構築する。
ML駆動科学におけるメタ分析にモデルを適用することで、過度な最適化を見いだすことができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:04:49 GMT)
MakeSinger: A Semi-Supervised Training Method for Data-Efficient Singing Voice Synthesis via Classifier-free Diffusion Guidance [14.2] MakeSingerは、音声合成のための半教師付き訓練方法である。
我々の新しい二重誘導機構は、逆拡散ステップに関するテキストとピッチのガイダンスを与える。
トレーニング中にテキスト・トゥ・スペーチ(TTS)データを追加することで,TTS話者の歌声を歌声なしで合成できることを実証した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:47:52 GMT)
FAIIR: Building Toward A Conversational AI Agent Assistant for Youth Mental Health Service Provision [14.2] FAIIR(Frontline Assistant: Issue Identification and Recommendation)は、ドメイン適応型および微調整型トランスモデルのアンサンブルである。
本研究では,FAIIRツールに活用される技術開発,性能,検証プロセスについて,キッズヘルプ電話による最前線危機対応の状況に適用する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:17:28 GMT)
AttnLRP: Attention-Aware Layer-Wise Relevance Propagation for Transformers [14.1] 大きな言語モデルは、バイアスのある予測と幻覚の傾向があります。
ブラックボックストランスモデルの完全性への忠実な貢献と計算効率の維持は未解決の課題である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:58:55 GMT)
Taxes Are All You Need: Integration of Taxonomical Hierarchy Relationships into the Contrastive Loss [14.1] 本稿では,分類学的階層情報の統合を可能にする新しい教師付きコントラスト損失を提案する。
教師付きコントラスト損失は、異なるクラスラベルを持つ画像よりも、同じクラスラベルプロジェクトを持つ画像を互いに近接させることによって行われる。
対照損失における重み付けペナルティとこれらの関係を明示的に説明することにより、監督された対照損失よりも優れることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 23:36:58 GMT)
Rényi Pufferfish Privacy: General Additive Noise Mechanisms and Privacy Amplification by Iteration [14.0] Pufferfishのプライバシは、任意の秘密とデータに関する敵の事前知識をモデル化できる、フレキシブルな微分プライバシの一般化である。
我々は,R'enyi 発散に基づく Pufferfish の変種を紹介し,それが Pufferfish フレームワークの適用性の拡張を可能にすることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:41:43 GMT)
Verifiable Generation with Subsentence-Level Fine-Grained Citations [13.9] 検証可能な生成には、出力をサポートするソースドキュメントを引用するために、大きな言語モデルが必要である。
先行研究は主に文レベルの引用の生成を目標としており、引用された情報源によって文のどの部分が裏付けられているかの特異性が欠如している。
本研究は, サブ文レベルのきめ細かな引用による生成を検証し, 引用元が支持する生成コンテンツのより正確な位置について検討する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:32:37 GMT)
Direct Preference Optimization for Suppressing Hallucinated Prior Exams in Radiology Report Generation [13.9] 本稿では, 生成視覚言語モデル(VLM)の振る舞いを, 不要な世代を抑えることで, 放射線学レポート生成を行う手法を提案する。
DPOファインチューニングは,臨床精度測定値のモデル性能を維持しつつ,前科試験を幻覚させるラインの3.2-4.8倍の縮小を実現している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:31:36 GMT)
Causality-inspired Latent Feature Augmentation for Single Domain Generalization [13.7] 単一ドメインの一般化(Single-DG)は、単一のトレーニングドメインのみを持つ一般化可能なモデルを開発し、他の未知のターゲットドメインでうまく機能させることを目的としている。
ドメイン・ハングリー構成の下で、ソース・ドメインのカバレッジを拡大し、異なる分布にまたがる固有の因果的特徴を見つける方法がモデルの一般化能力を高める鍵となる。
本稿では、因果学習と介入に基づく特徴レベルの変換のメタ知識を学習することで、単一DGの因果性に着想を得た潜在機能拡張手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:42:25 GMT)
Physics-Informed Bayesian Optimization of Variational Quantum Circuits [13.5] 本稿では,変分量子固有解法(VQEs)のベイズ最適化手法を提案する。
量子回路に関する重要な事前情報を含むVQE-カーネルを導出する。
我々はまた、信頼領域(EMICoRe)に対する最大改善(Maximum Improvement)と呼ばれるベイズ最適化のための新しい獲得関数を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:17:06 GMT)
Agent-Specific Effects: A Causal Effect Propagation Analysis in Multi-Agent MDPs [13.5] エージェント特異的効果(ASE)は、エージェントの作用が他のエージェントを介して伝播する結果に与える影響を測定する新しい因果量である。
我々は,敗血症管理環境を含むシミュレーションベースのテストベッドを用いて,cf-ASEの有用性を実験的に評価した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:01:30 GMT)
Prompting Large Language Models with Audio for General-Purpose Speech Summarization [13.4] 大規模言語モデル(LLM)の処理と推論機能を活用した音声要約フレームワークを提案する。
本稿では,LLM が解釈可能なトークン表現に変換する音声エンコーダと命令調整 LLM を組み合わせたエンドツーエンドシステムを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:04:28 GMT)
Copycats: the many lives of a publicly available medical imaging dataset [13.0] 医療画像(MI)データセットは、医療における人工知能の基本である。
MIデータセットは以前はプロプライエタリだったが、KaggleやHuggingFaceといったコミュニティに分散したプラットフォーム(CCP)など、徐々に一般向けに利用されるようになった。
オープンデータは、データの公開価値の再分配を促進するために重要であるが、現在のCCPガバナンスモデルは、データセットの共有、文書化、評価に必要な品質と推奨のプラクティスを維持できない。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:58:53 GMT)
Improving Efficiency of Diffusion Models via Multi-Stage Framework and Tailored Multi-Decoder Architectures [12.7] 拡散モデルは強力な深層生成ツールとして登場し、様々な応用に優れている。
しかし、その顕著な生成性能は、遅いトレーニングとサンプリングによって妨げられている。
これは、広範囲の前方および逆拡散軌道を追跡する必要があるためである。
本稿では,これらの課題に対処するための経験的知見から着想を得た多段階フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:37:41 GMT)
When is Multicalibration Post-Processing Necessary? [12.6] 本研究は,マルチキャリブレーション後処理の有用性を評価するための総合的研究である。
その結果,(1) 箱からキャリブレーションされたモデルは,追加の事後処理なしで比較的マルチキャリブレーションされる傾向があり,(2) マルチキャリブレーション後処理は本質的に非キャリブレーションモデルに役立つこと,(3) 従来のキャリブレーション手法が暗黙的にマルチキャリブレーションを提供することがあること,などが示唆された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:26:39 GMT)
Scaling the Vocabulary of Non-autoregressive Models for Efficient Generative Retrieval [12.5] 本稿では、生成的検索のより効率的な代替手段として、完全非自己回帰(NAR)言語モデルについて検討する。
PIXARは,NARモデルのターゲット語彙を拡張し,複数単語のエンティティや共通フレーズを含む新しいアプローチである。
PIXARはMS MARCOで31.0%,Hits@5で23.2%,MRR@10で31.0%向上した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:01:15 GMT)
Probabilistic Regular Tree Priors for Scientific Symbolic Reasoning [12.4] シンボリック回帰は、データから科学方程式を発見できる。
構文的に正しい方程式の集合を表現するのに必要な文脈自由文法と後者の木構造との間にはミスマッチがある。
我々の貢献は、(i)確率正則木表現(pRTE)と(ii)ベイズ推定によりどの方程式が予想されるかという専門家の事前の信念をコンパクトに表現し、そのような前提を有限状態機械として符号化された記号的回帰のために効率的に利用できるようにすることである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:39:52 GMT)
RepoQA: Evaluating Long Context Code Understanding [12.3] RepoQAは、Large Language Models(LLM)を長文のコード理解で評価するためのベンチマークである。
RepoQAには、5つのモダンプログラミング言語にまたがる50の人気のあるリポジトリから収集された500のコード検索タスクが含まれている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:15:30 GMT)
HeSum: a Novel Dataset for Abstractive Text Summarization in Hebrew [12.3] HeSum(ヘサム)は、現代ヘブライ語で抽象的なテキスト要約のために設計されたベンチマークである。
HeSumは、プロが書いたヘブライ語ニュースサイトから入手した1万記事と1万記事のペアで構成されている。
言語学的分析は、ヘサムの高い抽象性とユニークな形態的課題を裏付ける。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:45:25 GMT)
Dataset Condensation for Time Series Classification via Dual Domain Matching [12.3] 本研究では,textittextbfTime textittextbfSeries textittextbfClassificationをDual Domain Matching経由で生成する新しいフレームワークであるtextittextbfCondensationを提案する。
提案するフレームワークは,時間領域と周波数領域の両方のサロゲート目的にマッチする凝縮データセットを生成することを目的としている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:55:22 GMT)
Unsupervised Real-Time Hallucination Detection based on the Internal States of Large Language Models [12.3] 大型言語モデル(LLM)における幻覚は、一貫性はあるが事実的に不正確な応答を生成する。
我々は、リアルタイム幻覚検出にLLMの内部状態を活用する教師なしのトレーニングフレームワークであるMINDを提案する。
また,複数のLLMを対象とした幻覚検出のための新しいベンチマークであるHELMを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:48:30 GMT)
A WT-ResNet based fault diagnosis model for the urban rail train transmission system [12.1] 本研究では,Wavelet Transform Residual Neural Network(WT-ResNet)に基づく都市鉄道交通システムの新しい故障診断モデルを提案する。
このモデルは、特徴抽出のためのウェーブレット変換とパターン認識のためのResNetの利点を統合し、診断精度と堅牢性を向上させる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:43:55 GMT)
Deep Generative Modeling Reshapes Compression and Transmission: From Efficiency to Resiliency [12.1] 本稿では,データ圧縮を効率よく,伝送エラーを回復力に隠蔽する深層生成モデルの二重機能性を示す。
我々は,多くの大規模生成モデルのカーネルが,意味的潜伏変数間の複雑な関係を捉える強力な予測器であることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:36:02 GMT)
Compressible Dynamics in Deep Overparameterized Low-Rank Learning & Adaptation [12.1] モデルパラメータ内のデータと圧縮可能な力学の固有な低次元構造を利用することで、計算負担を伴わずにパラメータ化の利点を享受できることが示される。
提案手法は,低ランク行列と微調整言語モデルに対して有効であることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:05:26 GMT)
Fréchet Wavelet Distance: A Domain-Agnostic Metric for Image Generation [12.0] We propose the Fr'echet Wavelet Distance (FWD) as a domain-agnostic metric based on Wavelet Packet Transform ($W_p$)。
FWDは高解像度の画像の広い周波数帯を視認し、空間的側面とテクスチャ的側面の両方を保存する。
提案したFWDは,領域シフトを一般化し,改善することができるという,さまざまなデータセットにわたる多様なジェネレータの広範な評価で結論付けている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:45:32 GMT)
Graph Positional and Structural Encoder [11.6] グラフエンコーダは、任意のGNNを増大させるために、リッチなPSE表現をキャプチャするように設計されている。
GPSEは複数のPSEに対して効率的な共通潜伏表現を学習し、高い転送性を持つ。
GPSEにより強化されたモデルは、明示的に計算されたPSEを使用するモデルよりも大幅に優れており、少なくとも他のモデルではその性能に匹敵することを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:36:14 GMT)
Byzantine-Robust Federated Learning: Impact of Client Subsampling and Local Updates [11.6] 逆境(エム・ビザンティン)のクライアントは、連邦学習(FL)を任意に操作する傾向がある。
学習精度の向上は, サブサンプルクライアント数に対して著しく低下することを示す。
また、注意深いステップ選択の下では、ビザンティンのクライアントによる学習エラーは局所的なステップの数とともに減少する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:43:21 GMT)
UnSupDLA: Towards Unsupervised Document Layout Analysis [11.6] 重要ではあるがしばしば見落とされがちな問題は、レイアウト解析に必要なラベル付きデータの不足である。
ラベルを使わずにネットワークをトレーニングするために設計された文書レイアウトを,視覚に基づく手法を用いて分析する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:06:28 GMT)
POS: A Prompts Optimization Suite for Augmenting Text-to-Video Generation [11.6] 本稿では、ノイズやテキストを含む2つの入力プロンプトを改善し、拡散に基づくテキスト・ビデオ生成を改善することを目的とする。
テキスト・ツー・ビデオ・モデルを改善するためのトレーニング不要な Prompt Optimization Suite であるPOS を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:16:09 GMT)
Pose2Gaze: Eye-body Coordination during Daily Activities for Gaze Prediction from Full-body Poses [11.5] まず、様々な人・物・人・人のインタラクション活動における眼・体の協調に関する包括的分析を報告する。
次に、畳み込みニューラルネットワークを用いて、頭部と全身のポーズから特徴を抽出する眼球運動調整モデルPose2Gazeを紹介する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:38:16 GMT)
DualAD: Disentangling the Dynamic and Static World for End-to-End Driving [11.4] 自動運転のための最先端のアプローチは、全体運転タスクの複数のサブタスクを単一のパイプラインに統合する。
動的エージェントと静的シーン要素を分離する専用表現を提案する。
DualADというタイトルの手法は、独立に訓練されたシングルタスクネットワークよりも優れています。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:46:07 GMT)
Scaling ResNets in the Large-depth Regime [11.4] Deep ResNetは、機械学習タスクで最先端の結果を達成するために認識されている。
Deep ResNetsは、勾配の消滅や爆発を避けるために慎重に設計する必要があるトレーニング手順に依存している。
この問題を緩和する方法については合意が得られていないが、広く議論されている戦略は、各レイヤの出力を$alpha_L$でスケーリングすることである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:28:26 GMT)
Weighted KL-Divergence for Document Ranking Model Refinement [11.3] 本稿では,学生と教師モデルとの整合性を優先し,正と負の文書を適切に分離するKL発散項を再重み付けする。
本稿では,MS MARCO と BEIR データセットの損失関数の解析と評価を行い,その妥当性を実証する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:29:35 GMT)
Sustained Vowels for Pre- vs Post-Treatment COPD Classification [11.2] 慢性閉塞性肺疾患(慢性閉塞性肺疾患、COPD)は、世界中の何百万人もの人が発症する重度の炎症性肺疾患である。
従来,読み上げ音声の自動解析により,前処理状態と後処理状態の区別が可能であった。
読み上げ音声を用いた71%のベースラインから、79%の未重み付き平均リコールに持続母音を含ませることにより、性能が向上することを示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:17:17 GMT)
Shesha: Multi-head Microarchitectural Leakage Discovery in new-generation Intel Processors [11.1] Sheshaは、一貫した実行攻撃の自動発見のための最先端ファジィング技術よりも高速な収束率を示すフレームワークである。
我々は、Intelプロセッサの命令セット拡張(ISE)において、以前に報告されていない5つの実行パスを報告した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:56:34 GMT)
Contrastive learning of T cell receptor representations [11.1] データ効率のよい転送学習が可能なTCR言語モデルSCEPTRを導入する。
本稿では,自己コントラスト学習とマスク付き言語モデリングを組み合わせた新しい事前学習戦略を提案する。
コントラスト学習は,TCRの特異性のルールを復号化するための有用なパラダイムとして期待できる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:50:45 GMT)
A Statistical Theory of Regularization-Based Continual Learning [10.9] 線形回帰タスクの順序に基づく正規化に基づく連続学習の統計的解析を行う。
まず、全てのデータが同時に利用可能であるかのように得られたオラクル推定器の収束率を導出する。
理論解析の副産物は、早期停止と一般化された$ell$-regularizationの等価性である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:25:13 GMT)
Tuning-Free Visual Customization via View Iterative Self-Attention Control [10.7] この課題に対処するために、textitView Iterative Self-Attention Control (VisCtrl)を提案する。
VisCtrlは、ターゲット画像中の別の被写体にユーザ特定被写体の外観と構造を注入する、トレーニング不要な方法である。
提案手法は,数ステップで1つの参照画像のみを用いて一貫した,調和的な編集を行う。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:41:10 GMT)
Federated Representation Learning in the Under-Parameterized Regime [10.6] フェデレート・表現学習(FRL)は、クライアントが共通の表現をトレーニングし、パーソナライズされた頭を維持しながら連携する、パーソナライズド・フェデレーション・ラーニング(FL)フレームワークである。
本稿では、新しいFRLアルゴリズムFLUTEを提案し、線形モデルに対するサンプルの複雑さと収束率を理論的に特徴づける。
実験により、FLUTEは、合成タスクと実世界のタスクの両方において、最先端のFRLソリューションよりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:14:21 GMT)
Adapters Strike Back [10.5] 我々は、アダプタ、内部構造、および様々な実装選択について詳細に研究する。
我々は、Adapter+と呼ばれる具体的かつ改良されたアダプタアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:07:57 GMT)
Tx-LLM: A Large Language Model for Therapeutics [10.3] 本稿では,多彩な治療モダリティに関する知識を符号化した汎用大規模言語モデル(LLM)であるTx-LLMを紹介する。
Tx-LLMは、ドラッグディスカバリパイプラインのさまざまなステージにまたがる66タスクをターゲットとする709データセットのコレクションを使用して、トレーニングされている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:33:02 GMT)
Forget Sharpness: Perturbed Forgetting of Model Biases Within SAM Dynamics [10.3] シャープネス・アウェア(SAM)摂動の摂動は, 好ましくないモデルバイアスを排除し, 摂動を良くする学習信号を示す。
本結果は,損失面の平坦性を必要としない代替力学原理によってSAMの利点を説明できることを示唆している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:02:48 GMT)
The Emergence of Reproducibility and Generalizability in Diffusion Models [10.2] 同じスタートノイズ入力と決定論的サンプリングが与えられた場合、異なる拡散モデルはしばしば驚くほど類似した出力が得られる。
拡散モデルはトレーニングデータサイズの影響を受けやすい分布を学習していることを示す。
この価値ある性質は、条件付き使用、逆問題解決、モデル微調整など、拡散モデルの多くの変種に一般化される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:37:45 GMT)
Annotation alignment: Comparing LLM and human annotations of conversational safety [10.1] GPT-4は平均アノテータ評価値と平均アノテータの相関値との平均アノテータの相関値との平均アノテータの相関値よりも高い$r = 0.59$のピアソン相関値が得られることを示す。
相関群と*群との間には相当な慣用的変動があり、人種と性別がアライメントの差を完全に捉えていないことを示唆している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:30:13 GMT)
Artificial Intelligence for Neuro MRI Acquisition: A Review [10.0] 磁気共鳴イメージング(MRI)は人工知能(AI)の復活の恩恵を受けている
本稿では, 神経MRI取得におけるいくつかの重要なAIベースの手法について考察し, その技術進歩, 臨床実践への影響, 潜在的なリスクについて考察する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:50:33 GMT)
A Comparative Survey of Vision Transformers for Feature Extraction in Texture Analysis [9.7] 畳み込みニューラルネットワーク(CNN)は現在、最高のテクスチャ分析アプローチの1つである。
視覚変換器(ViT)は、物体認識などのタスクにおいてCNNの性能を上回っている。
この研究は、テクスチャに依存するタスクに移行する際に、事前訓練された様々なViTアーキテクチャを探索する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:48:13 GMT)
A Multi-module Robust Method for Transient Stability Assessment against False Label Injection Cyberattacks [9.7] 過渡安定度評価(TSA)データセットにおけるラベル情報は、偽ラベル注入(FLI)サイバー攻撃による汚染に対して脆弱である。
本稿では,FLIが誤用した指導過程を教師なしで修正するマルチモジュールロバストTSA法を提案する。
また、MMRとFLIフリー深部TSAモデルの精度と収束速度のギャップを狭めるために、MMR-HILという名前のループ内トレーニング戦略を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:05:21 GMT)
HOLMES: Hyper-Relational Knowledge Graphs for Multi-hop Question Answering using LLMs [9.6] 大規模言語モデル(LLM)は、単純な(シングルホップ)質問に答えるには適しています。
質問の複雑さが増すにつれて、LLMの性能は低下する。
最近の手法では、構造化知識三重項を原文に組み込むことで、この負担を軽減しようとしている。
本稿では,知識グラフ(KG)を用いてコンテキスト認識し,クエリ関連情報を含むように蒸留する手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:22:49 GMT)
How LLMs Aid in UML Modeling: An Exploratory Study with Novice Analysts [9.5] GPT-3, Large Language Models (LLMs) は、ソフトウェア工学の分野における研究者、実践者、教育者の目を引いている。
本稿では、LLMが初心者アナリストに対して、ユースケースモデル、クラス図、シーケンス図という3種類の典型的なモデルを作成するのにどのように役立つかを検討する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:29:16 GMT)
On the Utility of Accounting for Human Beliefs about AI Behavior in Human-AI Collaboration [9.4] 我々は、AIパートナーの行動について人間がどのように考えるかを説明する、人間の信念のモデルを開発する。
そして、人間の行動と人間の信念の両方を考慮したAIエージェントを開発し、その戦略を考案した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:39:37 GMT)
Asymptotics of Learning with Deep Structured (Random) Features [9.4] 機能マップの大規模なクラスでは、読み出しレイヤの学習に伴うテストエラーの厳密な特徴付けを提供しています。
いくつかのケースでは、勾配降下下で訓練された深部有限幅ニューラルネットワークによって学習された特徴写像をキャプチャできる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:16:19 GMT)
Data-driven Power Flow Linearization: Theory [9.2] データ駆動型電力フロー線形化(DPFL)は、その高い近似精度、広い適応性、そして最新のシステム属性を暗黙的に組み込む能力で際立っている。
本チュートリアルでは,既存のDPFLメソッドをDPFLトレーニングアルゴリズムと支援手法に分類する。
彼らの数学的モデル、解析解、能力、限界、一般化可能性は体系的に検討され、議論され、要約される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:22:41 GMT)
Improving Generalization of Neural Vehicle Routing Problem Solvers Through the Lens of Model Architecture [9.2] 本稿では,ESF(Scaling Factor)とDS(Distributed-Specific)デコーダを提案する。
ESFは、様々な大きさのVRPを解く際に、トレーニング中に発見された慣れ親しんだものに対して、モデルの注意重みパターンを調整する。
DSデコーダは、複数の補助光デコーダを通して複数のトレーニング分布パターンのVRPを明示的にモデル化し、モデル表現空間を拡大する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:03:17 GMT)
Flexible Parametric Inference for Space-Time Hawkes Processes [9.2] 本稿では,これらのデータに基づいて,時空ホークスプロセスの強度関数に関わるカーネル関数のパラメータを高速かつ柔軟なパラメトリック推論手法を開発することを目的とする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 23:40:16 GMT)
A Taxonomy of Challenges to Curating Fair Datasets [9.1] 本稿では,データセットキュレーションライフサイクルを通じて発生する課題とトレードオフを包括的に分類する。
われわれの研究結果は、データキュレーションに影響を及ぼすより広い公平な環境の中で、大きな問題を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:59:08 GMT)
Unambiguous detection of high energy vortex states via the superkick effect [8.9] 渦状態に調製された粒子は、伝播方向の非ゼロ軌道角運動量投影を有する。
低エネルギーの渦光子、電子、中性子、ヘリウム原子が実験で実証され、多くの応用が発見されている。
本稿では,位相渦の存在を明瞭に検出できる,いわゆるスーパーキック効果に基づく新しい診断法を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:02:15 GMT)
STimage-1K4M: A histopathology image-gene expression dataset for spatial transcriptomics [8.9] STimage-1K4Mは、サブタイル画像にゲノム機能を提供することでギャップを埋めるように設計された新しいデータセットである。
4,293,195対のサブタイル画像と遺伝子発現を持ち、STimage-1K4Mは前例のない粒度を持つ。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:48:07 GMT)
LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages [8.8] LingOlyベンチマークは、大規模言語モデルにおける高度な推論能力のための新しいベンチマークである。
非常に低リソースまたは絶滅した言語における言語パターンの文脈内同定と一般化の能力を評価する。
直接精度と非文脈ベースラインとの比較により,暗記を暗記する性能を評価する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:50:29 GMT)
Scalable MatMul-free Language Modeling [8.7] MatMul操作は大規模言語モデルから完全に除去可能であることを示す。
提案するMatMulフリーモデルは,最先端のトランスフォーマーと同等の性能を実現する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:55:29 GMT)
Stochastic Gradient Flow Dynamics of Test Risk and its Exact Solution for Weak Features [8.6] 純勾配の試験リスク曲線と勾配流の差を計算する式を提供する。
我々は、動的に加えた項によって引き起こされる補正を明示的に計算する。
解析結果は離散時間勾配降下のシミュレーションと比較し,良好な一致を示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:25:14 GMT)
Solution for SMART-101 Challenge of CVPR Multi-modal Algorithmic Reasoning Task 2024 [8.6] 本稿では,HYU MLLAB KT Team のマルチモーダルアルゴリズム推論タスク SMART-101 CVPR 2024 Challenge に対する解を提案する。
この課題は,6~8歳児を対象とした複雑な視覚言語パズルに取り組むことで,人間レベルのマルチモーダル理解を実現することを目的としている。
パズル分割構成では,テストセットで29.5のオプション選択精度Oacc,チャレンジセットで27.1の重み付きオプション選択精度(WOSA)を達成した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:45:55 GMT)
Low-Rank Quantization-Aware Training for LLMs [8.5] 大規模言語モデル(LLM)は、一様だが、計算とメモリの需要がますます増大しているため、その実践的な展開は困難である。
量子化対応トレーニング(QAT)メソッドは、一般的に最高の量子化パフォーマンスを生成するが、潜在的に長時間のトレーニング時間と過剰なメモリ使用のコストが伴う。
LLMのための軽量かつメモリ効率のQATアルゴリズムであるLR-QATを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:44:22 GMT)
Raccoon: Prompt Extraction Benchmark of LLM-Integrated Applications [8.5] 本稿では,抽出攻撃に対するモデルの感受性を包括的に評価するRacoonベンチマークを提案する。
本手法は,無防備シナリオと防御シナリオの両方でモデルを評価する。
本研究は,防衛の欠如を契機に,盗難を助長するための普遍的感受性を強調し,保護時に顕著なレジリエンスを示すOpenAIモデルを示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:57:22 GMT)
PointABM:Integrating Bidirectional State Space Model with Multi-Head Self-Attention for Point Cloud Analysis [8.5] 状態空間モデル(SSM)に基づくMambaは、線形複雑性と分類における大きな成功により、3Dポイントクラウド解析においてその優位性を提供する。
Transformerは、ポイントクラウド分析の最も顕著で成功したアーキテクチャの1つとして登場した。
本稿では,3Dポイントクラウド解析の性能向上のために,ローカル機能を強化するために,MambaアーキテクチャとTransformerアーキテクチャを統合したハイブリッドモデルであるPointABMを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:24:22 GMT)
Data vs. Physics: The Apparent Pareto Front of Physics-Informed Neural Networks [8.5] 物理インフォームドニューラルネットワーク(PINN)は、有望なディープラーニング手法として登場した。
PINNは訓練が困難であり、データと物理損失関数を組み合わせた場合、損失重み付けを慎重に調整する必要があることが多い。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:18:28 GMT)
Language Models Resist Alignment [8.5] 大きな言語モデル(LLM)は望ましくない振る舞いを示す。
近年の取り組みは、有害な発生を防ぐためにこれらのモデルを調整することに重点を置いている。
微調整プロセスは、事前学習と比較して、おそらくは桁違いの順序でアライメントを損なうことを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:03:16 GMT)
Cometh: A continuous-time discrete-state graph diffusion model [8.4] 我々は,連続時間離散状態グラフ拡散モデルであるCometを提案し,グラフデータを連続時間拡散モデルフレームワークに統合する。
連続時間の統合は、最先端の離散状態拡散モデルよりも様々な指標において顕著な改善をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:39:39 GMT)
Homomorphism Counts for Graph Neural Networks: All About That Basis [8.3] 我々は、よりきめ細かいアプローチを論じ、対象パターンの基底''にすべての構造の準同型数を含む。
これにより計算複雑性の面で追加のオーバーヘッドを発生させずに、より表現力のあるアーキテクチャが得られる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:14:34 GMT)
Unveiling Energy Efficiency in Deep Learning: Measurement, Prediction, and Scoring across Edge Devices [8.1] 我々はエネルギー測定、予測、効率評価を含む3倍の研究を行う。
まず、デバイス上での深層学習のエネルギー消費特性を明らかにするための、第1級の詳細な測定結果を示す。
第2に、カーネルレベルのエネルギーデータセットに基づいて、エッジデバイスのための最初のカーネルレベルのエネルギー予測器を設計、実装する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:09:24 GMT)
An interpretable imbalanced semi-supervised deep learning framework for improving differential diagnosis of skin diseases [8.1] 本稿では,多種性インテリジェント皮膚診断フレームワーク(ISDL)の解釈可能性と非バランス半教師あり学習に関する最初の研究について述べる。
ISDLは0.979の精度,0.975の感度,0.973の特異度,0.974のマクロF1スコア,およびマルチラベル皮膚疾患分類における0.999の受信操作特性曲線(AUC)以下の領域を有望な性能で達成した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:28:18 GMT)
Decoupling regularization from the action space [8.1] 正規化強化学習(RL)は最適制御および逆RLにおいて牽引力を得ている。
本稿では,正則化の一貫したレベルを維持するために,正則化器を動作空間から切り離すことの重要性を示す。
静的温度選択法と動的対向法という2つの解を導入し、この問題が発生した場合に普遍的に適用する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:20:31 GMT)
Algebraic non-Hermitian skin effect and unified non-Bloch band theory in arbitrary dimensions [8.1] 我々は、代数的非エルミート皮膚効果と呼ばれる新しいタイプの非エルミート皮膚効果を報告する。
代数的非エルミート皮膚効果を持つ2次元系では、トーラスやシリンダーのような測地線上では、従来の非エルミート皮膚効果に類似した挙動を示す。
1Dでは、この不等式は上界と下界が収束するため自明であり、GBZの次元は物理空間の次元と一致するように強制される。
2D以上では、この不平等はGBZに義務がないことを示している
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:00:04 GMT)
Detecting algorithmic bias in medical-AI models using trees [7.9] 本稿では,医療AI意思決定支援システムにおけるアルゴリズムバイアスの領域を検出するための革新的な枠組みを提案する。
本手法は,医学・AIモデルにおける潜在的なバイアスを,特に敗血症予測の文脈で効果的に同定する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:55:41 GMT)
Statistical Inference for Privatized Data with Unknown Sample Size [7.9] 非有界差分プライバシー(DP)における民生データ分析のための理論とアルゴリズムの両方を開発する。
非有界DPと有界DPのサンプリング分布間の距離は、サンプルサイズ$n$が無限に近づくにつれてゼロになることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:03:20 GMT)
JenGAN: Stacked Shifted Filters in GAN-Based Speech Synthesis [7.8] 非自己回帰的なGANベースのニューラルボコーダは、生成した結果において、音節アーティファクトのような可聴アーチファクトに悩まされることが多い。
我々は、シフト-等価性を保証するためにシフトシフトローパスフィルタを積み重ねる新しいトレーニング戦略であるJenGANを提案する。
実験評価において,JenGANはボコーダモデルの性能を一貫して向上させ,評価指標の多数で有意に優れたスコアを得た。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:51:04 GMT)
Quantum-Train: Rethinking Hybrid Quantum-Classical Machine Learning in the Model Compression Perspective [7.7] 本稿では,量子コンピューティングと機械学習アルゴリズムを統合する新しいアプローチであるQuantum-Train(QT)フレームワークを紹介する。
QTは、古典的なマッピングモデルと並んで量子ニューラルネットワークを利用することで、顕著な結果を得る。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:22:38 GMT)
Which Quantum Circuit Mutants Shall Be Used? An Empirical Evaluation of Quantum Circuit Mutations [7.6] 実世界の382個の量子回路を変異させた700K以上の故障ベンチマーク(量子回路)を用いて,大規模な実験評価を行った。
この結果に基づいて、量子突然変異解析手法を体系的に定義する上で、研究者にとって貴重な知見を提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:21:34 GMT)
Genomics-guided Representation Learning for Pathologic Pan-cancer Tumor Microenvironment Subtype Prediction [7.5] パンキャンサーTMEサブタイプ予測に全スライド画像(WSI)を用いたゲノム誘導型表現学習フレームワークPathoTMEを提案する。
我々のモデルは,TCGAデータセット上の23種類の癌に対して,最先端の手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:56:21 GMT)
Hypernetworks for Personalizing ASR to Atypical Speech [7.5] メタ学習型ハイパーネットワークを用いて,多種多様な非定型音声特性に対して,高度に個別化された発話レベル適応を生成する。
ハイパーネットは,全パラメータ予算の0.1%を用いて,WERの相対的な75.2%削減を維持しつつ,分布外話者よりも一般化されていることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 23:33:10 GMT)
Enhancing Size Generalization in Graph Neural Networks through Disentangled Representation Learning [7.4] DISGENは、グラフ表現からサイズ因子をアンタングルするために設計された、モデルに依存しないフレームワークである。
実験の結果, DISGENは実世界のデータセットにおいて, 最先端のモデルよりも最大6%優れていた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:56:40 GMT)
Synthetic Query Generation using Large Language Models for Virtual Assistants [7.4] 本稿では,テンプレートベースの手法を補完する合成クエリを生成するために,LLM(Large Language Models)の利用について検討する。
LLMはテンプレートベースのメソッドやエンティティ固有の参照アスペクトよりも冗長なクエリを生成する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:50:57 GMT)
An unsupervised approach towards promptable defect segmentation in laser-based additive manufacturing by Segment Anything [7.2] 我々は、最先端ビジョン変換器(ViT)ベースのファンデーションモデル(セグメンション・アニーシング・モデル)を用いて、画像分割のためのフレームワークを構築する。
我々は、ラベル付きデータを使わずに高精度に学習し、迅速なチューニングプロセスを導出する。
我々は、現在のレーザー添加物製造プロセスに革命をもたらす可能性のある、リアルタイムな異常検出パイプラインの構築を構想する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:35:23 GMT)
Fisher-Rao distance and pullback SPD cone distances between multivariate normal distributions [7.1] 正規多様体の準多様体への微分同相埋め込みに基づく距離のクラスを導入する。
コーン上の射影ヒルベルト距離が埋め込み正規部分多様体上の計量となることを示す。
このような距離をクラスタリングタスクでどのように使うかを示します。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:21:14 GMT)
An Improved Empirical Fisher Approximation for Natural Gradient Descent [7.0] 本稿では, EFの逆スケールプロジェクション問題について検討し, 経験的近似品質の低下の大きな原因であることを示した。
損失低減の観点から, NGD法をモチベーションとした改良型経験的フィッシャー法(iEF)を提案する。
実験により、正確な iEF をオプティマイザとして適用することは、強い収束と一般化をもたらすことが示されている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:12:32 GMT)
MAD Max Beyond Single-Node: Enabling Large Machine Learning Model Acceleration on Distributed Systems [6.9] 大規模な機械学習モデルのトレーニングとデプロイには時間がかかり、分散コンピューティングのインフラがかなり必要で、運用コストも高い。
この卓越した通信遅延を最小化するために、我々はアジャイルのパフォーマンスモデリングフレームワークMAD-Maxを導入しました。
このフレームワークは、並列化戦略を最適化し、ハードウェアとソフトウェアの共同設計の機会を促進するように設計されている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:31:07 GMT)
Multi-target stain normalization for histology slides [6.8] 我々は,複数の参照画像を活用する新しい手法を導入し,染色変化に対する堅牢性を高める。
提案手法はパラメータフリーであり,有意な変化のない既存の計算病理パイプラインに適用可能である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:49:05 GMT)
Towards Algorithmic Fairness by means of Instance-level Data Re-weighting based on Shapley Values [6.8] 本稿では,公正なアルゴリズム決定のための新しいインスタンスレベルのデータ再重み付け手法であるFairShapを提案する。
異なる性質のいくつかの最先端データセットに対して、FairShapを実証的に検証する。
ベースラインと同等の精度で、より公平なモデルを生成する方法を示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:10:55 GMT)
FlexLoc: Conditional Neural Networks for Zero-Shot Sensor Perspective Invariance in Object Localization with Distributed Multimodal Sensors [6.7] 我々は、条件付きニューラルネットワークを用いてノードの視点情報を注入し、ローカライゼーションパイプラインに適応するFlexLocを紹介した。
マルチモーダル・マルチビュー屋内追跡データセットを用いた評価では,ゼロショットの場合,FlexLoc はローカライズ精度を約50%向上することが示された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:02:53 GMT)
Quantized Approximately Orthogonal Recurrent Neural Networks [6.5] ORNNにおける重み行列の量子化を探求し、ほぼ直交RNN(QORNN)を量子化する。
本稿では,量子化学習(QAT)と計算予測を組み合わせた2つのQORNN学習手法を提案する。
最も効率的なモデルは、4ビットの量子化であっても、様々な標準ベンチマークで最先端のフル精度ORNN、LSTM、FastRNNと同様の結果が得られる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:40:40 GMT)
Dark-state solution and symmetries of the two-qubit multimode asymmetric quantum Rabi model [6.5] 2量子非対称量子ラビモデル(AQRM)について検討し,そのダークステート解を求める。
保存されたボゾン数演算子に関連する対称性が発見され、レベル交差も引き起こされる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:02:20 GMT)
FusionINN: Decomposable Image Fusion for Brain Tumor Monitoring [6.5] 本稿では,新しい分解可能な画像融合フレームワークFusionINNを紹介する。
融合画像の分解可能性について初めて検討する。
我々のアプローチは、高速で質的に優れた融合結果を提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:09:53 GMT)
Continuum Attention for Neural Operators [6.4] 関数空間設定における変換器について検討する。
実際に実施される注意機構はモンテカルロあるいはこの作用素の有限差分近似であることを示す。
そのため、コンピュータビジョンからパッチ戦略の関数空間の一般化を導入し、関連するニューラル演算子のクラスを導入する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:25:46 GMT)
Arrange, Inpaint, and Refine: Steerable Long-term Music Audio Generation and Editing via Content-based Controls [6.2] LLM(Large Language Models)は、高品質な音楽を生成する上で有望であるが、自動回帰生成に焦点をあてることで、音楽編集タスクにおける有用性を制限している。
本稿では,パラメータ効率の高いヘテロジニアスアダプタとマスキングトレーニングスキームを組み合わせた新しいアプローチを提案する。
提案手法は, フレームレベルのコンテンツベース制御を統合し, トラックコンディショニングとスコアコンディショニングによる音楽アレンジメントを容易にする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:08:17 GMT)
Pipeline Parallelism with Controllable Memory [6.1] 既存のパイプラインスケジュールのほとんどすべてが、私たちの知る限り、メモリ非効率であることを示しています。
制御可能なアクティベーションメモリを備えたメモリ効率の高いビルディングブロック群を導入し,最大アクティベーションメモリを1F1Bの1/2に削減する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:24:06 GMT)
ICSVR: Investigating Compositional and Syntactic Understanding in Video Retrieval Models [6.1] ビデオ検索は、テキストキャプションまたはリバーサが与えられたビデオデータベースから、地上の真実のビデオを取得することを含む。
我々は,MSRVTT,MSVD,DIDEMOなどの標準ベンチマークを用いて,ビデオ検索モデルの合成と構文的理解を評価する。
ビデオ理解におけるオブジェクトや属性と比較して,アクションや構文が軽微な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:02:43 GMT)
Random Features Approximation for Control-Affine Systems [6.1] 制御アフィン構造をキャプチャする非線形特徴表現の2つの新しいクラスを提案する。
提案手法はランダムな特徴(RF)近似を用いて,より少ない計算コストでカーネル手法の表現性を継承する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:54:57 GMT)
Locally Interdependent Multi-Agent MDP: Theoretical Framework for Decentralized Agents with Dynamic Dependencies [6.0] 局所的相互依存型マルチエージェントMDPと呼ばれる動的に異なる依存関係を持つ分散モデルの解析を行う。
一般に部分的に観察可能なマルチエージェントシステムの難しさにもかかわらず、3つのクローズドフォームポリシーを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:11:00 GMT)
Analysis, Identification and Prediction of Parkinson Disease Sub-Types and Progression through Machine Learning [6.0] 本稿では,パーキンソン病の研究において,新たな機械学習フレームワークを用いてPDを異なるサブタイプに分類し,その進展を予測することによって,画期的な進歩を示す。
この革新的なアプローチは、従来の方法論がしばしば見逃すPDマニフェストの微妙だが批判的なパターンを識別することを可能にする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:29:02 GMT)
Scaling Continuous Latent Variable Models as Probabilistic Integral Circuits [6.0] 確率積分回路(PIC)は連続潜伏変数(LV)を定義する記号計算グラフである
PICは、LVを解析的に積分できる場合、そうでなければ、トラクタブル確率回路(PC)によって近似できる。
本稿では、任意の可変分解からDAG形PICを構築するパイプライン、テンソル化回路アーキテクチャを用いたPICのトレーニング手順、神経機能共有技術を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:30:17 GMT)
SYM3D: Learning Symmetric Triplanes for Better 3D-Awareness of GANs [5.8] SYM3Dは,天然物や人工物に見られる主観対称性構造を活用するために設計された,新しい3D対応GANである。
我々はSYM3Dを合成(ShapeNet Chairs, Cars, Airplanes)と実世界のデータセットで評価した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:24:07 GMT)
Symmetric Dot-Product Attention for Efficient Training of BERT Language Models [5.8] 本稿では,Transformer アーキテクチャによって導入された自己注意機構の代替互換性関数を提案する。
BERTライクなモデルの事前トレーニングに適用すると、この新しい対称アテンション機構はGLUEベンチマークで79.36点に達し、従来の実装では78.74点だった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:24:15 GMT)
PowerInfer-2: Fast Large Language Model Inference on a Smartphone [5.8] PowerInfer-2は、スマートフォン上での大規模言語モデルの高速推論のために設計されたフレームワークである。
PowerInfer-2は、TurboSparse-Mixtral-47Bモデルで毎秒11.68トークンを生成する最初のシステムである。
完全にメモリに収まるモデルでは、PowerInfer-2はメモリ使用量の約40%の削減を達成できる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:01:21 GMT)
Coprocessor Actor Critic: A Model-Based Reinforcement Learning Approach For Adaptive Brain Stimulation [5.7] Coprocessor Actor Criticは、脳刺激のためのニューラルコプロセッサポリシーを学ぶための、新しいモデルベース強化学習(MBRL)アプローチである。
提案手法は,従来のMFRL手法の限界を,サンプル効率とタスク成功の観点から克服することを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:23:03 GMT)
BlendSQL: A Scalable Dialect for Unifying Hybrid Question Answering in Relational Algebra [5.7] ブレンドは構造化データと非構造化データの両方にわたる推論をオーケストレーションするための統一方言として機能する。
Blendは大規模なデータセットにスケールでき、トークンを35%減らしながらエンドツーエンドシステムの性能を向上させることができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:27:28 GMT)
DiffAudit: Auditing Privacy Practices of Online Services for Children and Adolescents [5.6] 子どもと青年のオンラインデータのプライバシーは、子どものオンラインプライバシー保護法(COPPA)などの法律によって規制されている。
子供、青年、成人向けのオンラインサービスは、これらの法律に従わなければならない。
DiffAuditは一般ユーザ向けのプラットフォームに依存しないプライバシ監査手法である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:14:53 GMT)
Self-explainable Graph Neural Network for Alzheimer's Disease And Related Dementias Risk Prediction [5.6] アルツハイマー病と認知症(ADRD)は米国で6番目に多い死因である。
機械学習とクレームデータを組み合わせることで、さまざまな医療コード間の追加のリスク要因と相互接続が明らかになる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:29:11 GMT)
Predicting the risk of early-stage breast cancer recurrence using H\&E-stained tissue images [5.5] 癌組織像の病理像を解析することにより,深層学習アルゴリズムが再発リスクを予測できるかどうかを検討した。
感度は0.857, 0.746, 0.529で, 低, 中間, 高リスク, 0.816, 0.803, 0.972。
クラス活性化マップを用いてこれらの研究を通して得られたモデルをチェックすると、異なるリスクグループを予測する際に、実際に管の形成と分裂速度を検討した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:51:59 GMT)
On the Consistency of Kernel Methods with Dependent Observations [5.5] 本稿では,カーネル法においてこのような現象を説明する経験的弱収束(EWC)の概念を提案する。
EWCはランダムなデータ分布の存在を仮定し、フィールドにおける以前の仮定を厳格に弱める。
本研究は,学習過程の新たなクラスを統計的学習に開放し,i.d.以上の学習理論と混合の基礎として機能する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:35:01 GMT)
Learning Physical Simulation with Message Passing Transformer [5.4] 本稿では,メッセージ・パッシング・フレームワークを組み込んだグラフニューラルネットワーク,メッセージ・パッシング・トランスフォーマに基づく新しいユニバーサル・アーキテクチャを提案する。
このアーキテクチャは,ラグランジアンおよびユーレリア力学系における長期ロールアウトにおいて,大幅な精度向上を実現している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:14:56 GMT)
Physics-informed deep learning and compressive collocation for high-dimensional diffusion-reaction equations: practical existence theory and numerics [5.4] ディープラーニング(DL)に基づく高次元偏微分方程式の効率的な解法の開発と解析
理論的にも数値的にも,新しい安定かつ高精度なスペクトルコロケーション法と競合できることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:22:08 GMT)
Decision-Making Behavior Evaluation Framework for LLMs under Uncertain Context [5.4] 本稿では,大規模言語モデル(LLM)の意思決定行動を評価するための行動経済学に基づく枠組みを提案する。
本稿では,ChatGPT-4.0-Turbo,Claude-3-Opus,Gemini-1.0-proの3つの商用LCMにおけるリスク嗜好,確率重み付け,損失回避の程度を推定する。
以上の結果から,LSMはリスク回避や損失回避といった人間に類似したパターンを呈し,その傾向は小さすぎることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:14:19 GMT)
Optimal Federated Learning for Nonparametric Regression with Heterogeneous Distributed Differential Privacy Constraints [5.4] 本研究では,異なるサーバにまたがる分散サンプルのコンテキストにおける非パラメトリック回帰のためのフェデレーション学習について検討した。
統計の正確さとプライバシーの保護のトレードオフに光を当てている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:34:07 GMT)
Federated Nonparametric Hypothesis Testing with Differential Privacy Constraints: Optimal Rates and Adaptive Tests [5.4] フェデレート学習は、さまざまな場所でデータが収集され分析される広範囲な設定で適用可能であることから、近年大きな注目を集めている。
分散差分プライバシー(DP)制約下でのホワイトノイズ・ウィズ・ドリフトモデルにおける非パラメトリック適合性試験について検討した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:25:19 GMT)
FLEUR: An Explainable Reference-Free Evaluation Metric for Image Captioning Using a Large Multimodal Model [5.3] 画像キャプション評価指標に説明可能性を導入するための説明自由度指標であるFLEURを提案する。
大規模なマルチモーダルモデルを利用することで、FLEURは参照キャプションを必要とせずに画像に対するキャプションを評価することができる。
FLEURは、画像キャプション評価ベンチマークにおいて、人間の判断と高い相関を達成している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:57:39 GMT)
Fast Two-Time-Scale Stochastic Gradient Method with Applications in Reinforcement Learning [5.3] 本稿では,従来の手法よりもはるかに高速な収束を実現する2段階最適化手法を提案する。
提案アルゴリズムは,様々な条件下で特徴付けられ,オンラインサンプルベース手法に特化していることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:32:12 GMT)
INTERSPEECH 2009 Emotion Challenge Revisited: Benchmarking 15 Years of Progress in Speech Emotion Recognition [5.3] 我々は、InterSPEECH 2009 Emotion Challenge -- 初めてスピーチ感情認識(SER)チャレンジを再考する。
我々は,SER研究の大きな進歩を示す一連の深層学習モデルを評価する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:55:06 GMT)
LLM-dCache: Improving Tool-Augmented LLMs with GPT-Driven Localized Data Caching [5.2] ツール拡張エージェントに公開された呼び出し可能なAPI関数としてキャッシュ操作を扱い,データアクセスを最適化するLLM-dCacheを導入する。
LLMには、既存の関数呼び出し機構とシームレスに統合することで、キャッシュ決定を管理する自律性を提供します。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:08:39 GMT)
$Classi|Q\rangle$ Towards a Translation Framework To Bridge The Classical-Quantum Programming Gap [5.2] $Classi|Qrangle$は、クラシックコンピューティングと量子コンピューティングを橋渡しするフレームワークである。
PythonやC++のようなハイレベルなプログラミング言語を低レベルな言語、例えばQuantum Assemblyに翻訳する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:50:16 GMT)
What All the PHUZZ Is About: A Coverage-guided Fuzzer for Finding Vulnerabilities in PHP Web Applications [5.2] 本稿では,PHP WebアプリケーションのためのファジングフレームワークPHUZZを紹介する。
PHUZZは、最先端関連の作業よりもクライアントサイドとサーバサイドの脆弱性クラスを検出するために、新しいアプローチを使用している。
私たちは115のWordPressプラグインの1000以上のAPIエンドポイントをファズして、20以上のセキュリティ問題と2つの新しいCVE-IDを生み出しました。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:43:07 GMT)
Conformal Prediction Sets Improve Human Decision Making [5.2] 本研究では,人間による意思決定を支援するために,共形予測セットの有用性について検討する。
その結果、人間に共形予測を与えると、その精度は、同じカバレッジ保証の固定サイズ予測セットよりも向上することがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:12:10 GMT)
AndroidWorld: A Dynamic Benchmarking Environment for Autonomous Agents [5.0] 私たちは、20の現実世界のAndroidアプリに116のプログラムタスクの報酬信号を提供する、完全に機能するAndroid環境であるAndroidWorldを紹介します。
AndroidWorldのメリットと運用モードを示すために、新しいコンピュータ制御エージェントM3Aを導入する。M3Aは、AndroidWorldのタスクの30.6%を完了し、将来の作業に十分な余地を残している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:30:49 GMT)
Satisficing Exploration in Bandit Optimization [5.0] 本稿では,LowEr Confidence bound TestingによるSatificing Explorationのための一般的なアルゴリズムテンプレートを提案する。
われわれはこの託宣を利用して、後悔の少ない潜在的な満足のいく腕を特定する。
補体として、SELECTは非実現可能な場合のオラクルと同じ(標準的な)後悔の保証を享受する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:15:28 GMT)
A Guide to Stochastic Optimisation for Large-Scale Inverse Problems [4.9] 最適化アルゴリズムは、大量のデータを持つ機械学習のデファクトスタンダードです。
我々は、逆問題の観点から、最適化における最先端の総合的な説明を提供する。
私たちは、機械学習で一般的に遭遇しない、ユニークな最適化の課題に焦点を合わせています。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:02:30 GMT)
Adaptive Control in Assistive Application -- A Study Evaluating Shared Control by Users with Limited Upper Limb Mobility [4.9] 本研究では,上肢障害者を対象とした適応的自由度制御法について検討した。
24人の被験者によるオブジェクト間の分析を採用し、3つの異なる入力デバイスに対して81のトライアルを実施し、現実的な日々のタスク設定で実施する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:36:55 GMT)
Sparsity regularization via tree-structured environments for disentangled representations [4.8] 因果表現学習は、経路活性化のような潜伏変数の推測を可能にすることによって科学的理解を促進することができる。
我々は複数の関連するデータセット(環境)とタスクから潜伏変数を推定する手法を開発した。
木に基づく規則化(TBR)は,予測誤差を最小化し,関連する環境を規則化し,類似の予測子を学習する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:06:41 GMT)
Enrolment-based personalisation for improving individual-level fairness in speech emotion recognition [4.8] 本稿では,各話者に対してSERモデルを適用するために,個人差に着目した新たな手法を提案する。
また、異なる話者間での公平性を測定するための新しい評価手法を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:01:05 GMT)
Beyond Strong labels: Weakly-supervised Learning Based on Gaussian Pseudo Labels for The Segmentation of Ellipse-like Vascular Structures in Non-contrast CTs [4.8] 本稿では,CTスキャンにおける血管構造に基づく深層学習のための弱教師付きフレームワークを提案する。
提案手法の有効性を1つのローカルデータセットと2つのパブリックデータセットで評価する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:04:43 GMT)
EpiLearn: A Python Library for Machine Learning in Epidemic Modeling [4.8] EpiLearnは、疫病データをモデリング、シミュレーション、分析するために開発されたPythonツールキットである。
EpiLearnはモジュラーデザインに従っており、柔軟で使いやすくなっている。
実世界やシミュレートされた疫病データを可視化するインタラクティブなWebアプリケーションも開発されている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:35:14 GMT)
On Learning what to Learn: heterogeneous observations of dynamics and establishing (possibly causal) relations among them [4.7] 物理過程の観測可能な2つの(集合)間の関数を学習しようと試みる。
まず、入力と所望の関数の出力が何になるかを決めます。
1つのプロセスの1つの観測セットから、そのプロセスのすべてのレベルの測定セットへのマッピングを構築する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:37:36 GMT)
Towards Computational Performance Engineering for Unsupervised Concept Drift Detection -- Complexities, Benchmarking, Performance Analysis [4.7] コンセプトドリフト検出は、システムの信頼性を確保するために、多くのAIシステムにとって不可欠である。
これらのシステムは多くの場合、大量のデータを扱うか、リアルタイムに反応する必要がある。
ドリフト検出器は 総合的な性能評価で 計算要求や制約を満たさなければならない
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:09:15 GMT)
Thunder : Unified Regression-Diffusion Speech Enhancement with a Single Reverse Step using Brownian Bridge [4.6] 拡散に基づく音声強調は有望な結果を示したが、推論時間が遅くなる可能性がある。
We propose Thunder, a unified regression-diffusion model that the model can act in both modes。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:52:25 GMT)
LLaVA-Gemma: Accelerating Multimodal Foundation Models with a Compact Language Model [4.6] 我々は、最近リリースされた大規模言語モデル(LLM)のGemmaファミリで、人気のあるLLaVAフレームワークを使用して、MMFM(Multimodal foundation model)のスイートをトレーニングする。
コネクタの事前訓練,より強力な画像バックボーンの利用,言語バックボーンのサイズ拡大という,3つの設計上の特徴を損なう効果を検証した。
LLaVA-Gemmaと呼ばれる結果のモデルは、評価の配列に対して適度な性能を示すが、現在の大容量SOTAモデルよりは改善されない。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:59:48 GMT)
The Legal Duty to Search for Less Discriminatory Algorithms [4.6] 法律はLDAを合理的に捜索する義務を負うべきだと我々は主張する。
モデル乗法とLDAの可用性は、識別アルゴリズムに対する法的な応答に重大な影響を与える。
我々は、この法律は、カバーされた公民権領域における予測モデルの開発と展開を行うエンティティに対して、適切なLDAの探索の義務を負うべきだと論じる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:56:38 GMT)
I-MPN: Inductive Message Passing Network for Effective and Efficient Human-in-the-Loop Annotation of Mobile Eye Tracking Data [4.5] 本稿では,移動眼球追跡設定における物体の自動認識のための新しい人間中心学習アルゴリズムを提案する。
提案手法は,ノードプロファイル情報や位置などのノード特徴を利用する誘導型メッセージパッシングネットワーク技術(I-MPN)とオブジェクト検出器をシームレスに統合する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:08:31 GMT)
Implementation of digital MemComputing using standard electronic components [4.4] Digital MemComputing Machine (DMM)は、堅牢でスケーラブルな非伝統的なコンピューティングアプローチであることが証明されている。
本研究は, 利用可能な電子部品を利用して, DMMのための新しいハードウェア設計を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:21:22 GMT)
AGB-DE: A Corpus for the Automated Legal Assessment of Clauses in German Consumer Contracts [4.4] AGB-DE(AGB-DE)は、ドイツの消費者契約の3,764節のコーパスであり、法律の専門家によって注釈付けされ法的に評価されている。
我々は,SVMベースラインの性能を3つの細調整されたオープン言語モデルと比較し,GPT-3.5の性能を比較した。
誤りの分析は、主な課題の1つは、複雑な節の正しい解釈であることを示している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:27:13 GMT)
Verification-Guided Shielding for Deep Reinforcement Learning [4.4] Deep Reinforcement Learning (DRL)は、現実世界の課題を解決するための効果的なアプローチとして登場した。
しかし、DRLベースのポリシーは信頼性の低下に悩まされ、安全クリティカルなドメインへのデプロイメントが制限される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:44:59 GMT)
Federated learning in food research [4.4] 本研究は,食品分野におけるフェデレートラーニングの活用について考察する。
現在の応用には、水と牛乳の品質評価のソリューション、水処理のサイバーセキュリティ、殺虫剤残留リスク分析、雑草検出、不正検出が含まれる。
見つかったギャップの1つは、垂直ないし移行型の学習と分散アーキテクチャの欠如であった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:58:11 GMT)
Towards Application-Aware Quantum Circuit Compilation [4.3] 現在のコンパイルツールは、量子回路が実現した実際の応用を考慮せずに命令のシーケンスとして扱う。
この研究では、アプリケーションが考慮されたことを明示的に取り入れ、ソリューションの品質を最適化することを目的とした、別のアプローチが検討されている。
最初の結果は、このアプローチの利点を示している: 量子生成モデルの産業にインスパイアされた応用のために、提案されたアプローチは、Qiskitの最も最適化されたコンパイル方式よりも優れていた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:58:37 GMT)
Quantumness and Randomness of Quantum Random Number Generators via Photon Statistics [4.2] 出力を観察するだけでPRNGとQRNGを区別することはできない。
単一光子を量子源として使用するQRNGは、真の量子乱数を生成する。
QRNGの2つのモデルにおいて,指数分布から乱数を生成するモデルと,一様分布から乱数を生成するモデルとが,デバイスノイズ下で本質的に類似していることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:57:01 GMT)
Evolving Assembly Code in an Adversarial Environment [4.2] CodeGuruコンペティションのアセンブリコードを進化させました。
目標は、最も長い共有メモリを実行するアセンブリプログラムである、サバイバルを作成することだ。
我々は,CodeGuruゲームにおいて,人手による勝利者に対する生存者の評価を行った。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:16:39 GMT)
Multimodal LLMs Struggle with Basic Visual Network Analysis: a VNA Benchmark [4.1] GPT-4 と LLaVa のゼロショット能力を評価し,小規模グラフ上で単純な Visual Network Analysis タスクを実行する。
GPT-4はLLaVaより一貫して優れていますが、どちらのモデルも提案するすべての視覚的ネットワーク分析タスクに苦労しています。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:28:16 GMT)
Eliciting Problem Specifications via Large Language Models [4.1] 大型言語モデル(LLM)は、問題クラスを半形式仕様にマッピングするために利用することができる。
認知システムは、問題空間仕様を使用して、問題クラスからの問題の複数のインスタンスを解決することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:05:57 GMT)
Vehicle Vectors and Traffic Patterns from Planet Imagery [4.0] 静止車と移動車の両方が高解像度のSkySat画像で確実に識別可能であることを示す。
移動物体のバンド間変位(またはレインボー効果)を利用して移動車両の速度と進路を推定できる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:35:59 GMT)
PAC-Bayes Analysis for Recalibration in Classification [4.0] 我々は,大まかに正しい(PAC)ベイズフレームワークの下でキャリブレーション誤差の一般化解析を行う。
次に,一般化理論に基づく一般化対応再校正アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:53:13 GMT)
SignBLEU: Automatic Evaluation of Multi-channel Sign Language Translation [4.0] マルチチャネル手話翻訳(MCSLT)という新しいタスクを導入する。
本稿では,複数の信号チャネルを捕捉する新しい測度であるSignBLEUを提案する。
SignBLEUは、競合する指標よりも、人間の判断と常に相関していることがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:01:26 GMT)
#EpiTwitter: Public Health Messaging During the COVID-19 Pandemic [3.9] 本研究では,パンデミックの期間中にTwitter上でPHEや疑似専門家がいかにコミュニケーションしたかを検討する。
私たちはメッセージ戦略における重要な優先順位と違いを特定しました。
否定的な感情的・道徳的な言語はエンゲージメントを促進する傾向にあるが、PHEからの肯定的な言語は世論の反応において肯定性を育む。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:33:51 GMT)
Leveraging Large Language Models for Knowledge-free Weak Supervision in Clinical Natural Language Processing [3.8] 本稿では,LLMの微調整と,ドメイン知識のほとんどない監督の弱さを活用するアプローチを提案する。
金の標準紙幣が10枚しかなく、最終BERTモデルは微調整のLlama2-13Bによって弱く管理され、F1スコアの4.7%から47.9%の精度でPubMedBERTを上回った。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:34:48 GMT)
Multi-qubit Lattice Surgery Scheduling [3.7] 量子回路は、唯一の非クリフォード多ビットゲートの列に変換できる。
本研究では, トランスパイレーションにより, テストした回路の回路長が大幅に減少することを示す。
結果として生じるマルチキュービットゲート回路は、シリアル実行よりも期待される回路実行時間を短縮する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:01:18 GMT)
NaRCan: Natural Refined Canonical Image with Integration of Diffusion Prior for Video Editing [3.6] 我々は,高品質な自然な標準画像を生成する前に,ハイブリッドな変形場と拡散を統合したビデオ編集フレームワークであるNaRCanを提案する。
提案手法は,グローバルな動きをモデル化するためにホモグラフィを使用し,局所的な残留変形を捉えるために多層パーセプトロン(MLP)を用いる。
提案手法は,様々なビデオ編集タスクにおいて既存の手法よりも優れ,一貫性と高品質な編集ビデオシーケンスを生成する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:59:46 GMT)
When predict can also explain: few-shot prediction to select better neural latents [3.6] 基礎的真理をより正確に反映した潜伏変数を求めるために考案された新しい予測指標を提案する。
基底的真理が欠如している場合には、外部ダイナミクスを定量化するためのプロキシ測度を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:30:28 GMT)
GenHeld: Generating and Editing Handheld Objects [3.6] 我々は3次元ハンドモデルや2次元画像に条件付き保持オブジェクトを合成する逆問題にGenHeldを提案する。
GenHeld 3Dは、オブジェクトコードと呼ばれるコンパクトなオブジェクト表現を使用して、大きなデータセットから可塑性保持オブジェクトを選択することができる。
GenHeld 2Dは、GenHeld 3Dの能力と拡散ベースの画像編集を組み合わせることで動作する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:23:32 GMT)
AMED: Automatic Mixed-Precision Quantization for Edge Devices [3.5] 量子ニューラルネットワークは、レイテンシ、消費電力、モデルサイズをパフォーマンスに大きな影響を与えずに減少させることでよく知られている。
混合精度量子化は、異なるビット幅での算術演算をサポートするカスタマイズされたハードウェアのより良い利用を提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:35:42 GMT)
Language Models are Alignable Decision-Makers: Dataset and Application to the Medical Triage Domain [3.5] 我々は,一組の意思決定属性(DMA)をラベル付けした医療トリアージ意思決定のための新しいデータセットを提案する。
このデータセットは62のシナリオで構成され、公正性や道徳的砂漠といった倫理的原則を含む6つの異なるDMAをカバーする。
本稿では、これらのDMAを活用して、ヒューマンアラインな意思決定のための新しいソフトウェアフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:25:23 GMT)
Neural Wave Functions for Superfluids [3.4] 超流動基底状態を持つことが知られている強い短距離二体相互作用を持つ系である一元性フェルミガスについて検討する。
我々は最近開発されたフェルミオン型ニューラルネットワーク(FermiNet)波動関数Ansatzを用いてモンテカルロの変分計算を行った。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:05:39 GMT)
Characterization of hybrid quantum eigenstates in systems with mixed classical phasespace [3.4] トンネリング,スカーリング,ローカライゼーションなどの量子効果が標準パラダイムに従わないことを示す。
我々は、エルゴディディティとローカライゼーションの反対の観点から、カオス領域と正規領域のハイブリッド化を強調した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:42:49 GMT)
Re.Dis.Cover Place with Generative AI: Exploring the Experience and Design of City Wandering with Image-to-Image AI [3.4] 我々は,アイントホーフェンセンター内をさまよって撮影し,イメージ・ツー・イメージAIと対話した4人の被験者を対象に,探索的研究を行った。
予備的な発見は、彼らの観測、場所への親しみの影響、そしてAIGTが探検家の道具や共同投機具となる方法を示している。
次に,AIGTのプレイフルネス,再想像,再開発を支援する能力について,未熟な都市景観を通して強調する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:18:14 GMT)
QuickCent: a fast and frugal heuristic for harmonic centrality estimation on scale-free networks [3.4] 本稿では,ネットワーク集中度指数を近似する簡易かつ迅速な手法を提案する。
私たちのアプローチはQuickCentと呼ばれ、いわゆる高速かつ軽快な推論にインスパイアされています。
我々はQuickCentが精度で競争力のある見積もりをすることができることを示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:47:29 GMT)
Analog information decoding of bosonic quantum LDPC codes [3.3] 本稿では,ボソニック量子ビット読み出しから得られたシンドローム情報を明示的に活用する新しい復号法を提案する。
その結果,アナログ情報を用いた一般的な復号アルゴリズムの基礎となり,フォールトトレラント量子計算の方向に有望な結果を示すことができた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:47:49 GMT)
MOSA: Music Motion with Semantic Annotation Dataset for Cross-Modal Music Processing [3.3] 高品質な3次元モーションキャプチャーデータ、アライメント音声記録、ピッチ、ビート、フレーズ、動的、調音、ハーモニーを含むMOSA(Music mOtion with Semantic )データセットを23人のプロミュージシャンによる742のプロ音楽演奏に対して提示する。
私たちの知る限り、これはこれまでのノートレベルのアノテーションを備えた、最大のクロスモーダルな音楽データセットです。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:37:46 GMT)
Synth-SBDH: A Synthetic Dataset of Social and Behavioral Determinants of Health for Clinical Text [3.3] 社会的および行動的健康決定因子(SBDH)は、健康結果において重要な役割を担い、臨床文献に頻繁に記録されている。
既存のSBDHデータセットは、可用性とカバレッジにかなりの制限がある。
詳細なSBDHアノテーションを持つ新しい合成データセットであるSynth-SBDHを紹介する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:03:36 GMT)
AI Cat Narrator: Designing an AI Tool for Exploring the Shared World and Social Connection with a Cat [3.2] 私たちの研究は、人間と猫の共有生活にユニークな視点を提供するAI Cat Narratorと呼ばれる新しいツールを紹介します。
我々は,猫の目を通して見る現実のデータをネコ文学の抜粋と融合させるために,不明瞭化戦略を用いて,エスノグラフィーの手法と架空のストーリーテリングを併用した。
本研究は,学習目的に不慣れなデータを使用することによって,より共感的かつ個性的な文字の発達に寄与することが示唆された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:44:15 GMT)
Risk Sensitivity in Markov Games and Multi-Agent Reinforcement Learning: A Systematic Review [3.2] マルコフゲーム(MG)とマルチエージェント強化学習(MARL)を用いて,マルチエージェントシステムにおける意思決定をモデル化する。
MGとMARLのリスク感度に関する文献は、近年、強化学習やゲーム理論の他の分野と並んで増えている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:19:33 GMT)
VNN: Verification-Friendly Neural Networks with Hard Robustness Guarantees [3.2] VNN(Verification-Friendly Neural Networks)を生成するための新しいフレームワークを提案する。
本稿では,予測性能と検証親和性とのバランスをとるための学習後最適化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:35:57 GMT)
Topological Analysis for Detecting Anomalies (TADA) in Time Series [3.0] 提案手法は大規模データセットを扱うのに十分なリーンであり、既存の手法よりも相関構造のグローバルな変化を検出するのに適しているという直感を裏付ける広範な数値実験である。
依存時間列に基づく量子化アルゴリズムの理論的保証も提供される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:03:40 GMT)
Foundation Inference Models for Markov Jump Processes [3.0] 境界状態空間上のマルコフジャンプ過程(MJP)のゼロショット推論手法を提案する。
1つの(事前訓練された)モデルと同一の(事前訓練された)モデルは、ゼロショットの方法で、異なる次元の状態空間で進化する隠れMJPを推論することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:12:00 GMT)
Video-based Exercise Classification and Activated Muscle Group Prediction with Hybrid X3D-SlowFast Network [2.9] 本稿では,運動分類と筋群活性化予測(MGAP)のための簡易かつ効果的な戦略を提案する。
この分野における以前の研究は、主に搭載されたセンサーへの依存と限られた運動範囲によって支配されている。
我々の研究は、幅広いエクササイズと筋群を含むビデオベースのディープラーニングフレームワークを用いている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:05:02 GMT)
Seeking Interpretability and Explainability in Binary Activated Neural Networks [2.8] 本稿では、回帰タスクの文脈において、解釈可能かつ説明可能な予測子としてバイナリ活性化ニューラルネットワークを用いることについて検討する。
本稿では,特徴量,隠れニューロン,さらには重みの相対的重要性を定量化するために,SHAP値の効率的な計算法を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:54:23 GMT)
Quantum Geometric Tensor and Critical Metrology in the Anisotropic Dicke Model [2.8] 2つの異なる古典的極限は、固有の異方性特性を示す。
異方性比、スピン長、周波数比の相互作用は、全体として臨界挙動を高めることができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:18:16 GMT)
Evaluating the Efficacy of Prompt-Engineered Large Multimodal Models Versus Fine-Tuned Vision Transformers in Image-Based Security Applications [2.8] 大規模マルチモーダルモデル(LMM)は、テキストや画像などの複数のモダリティを統合することで、複雑なデータを解釈し分析するように設計されている。
本稿では,視覚変換器(ViT)モデルと比較して,画像とテキストの両方を処理するプロンプトエンジニアリングLMMの適用性と有効性について検討する。
視覚的に明らかでないタスクでは、ViTモデルは25のマルウェアクラスの予測では97.11%、5つのマルウェアファミリーの予測では97.61%のF1スコアを達成した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:07:24 GMT)
The Impact of Quantization on Retrieval-Augmented Generation: An Analysis of Small LLMs [2.7] 学習後の量子化は、Large Language Models (LLM) の計算需要を減らすが、その能力の一部を弱める可能性がある。
本稿では、量子化がより小さなLLMの検索強化生成(RAG)能力にどのように影響するかを考察する。
この結果から, 7B LLM がそのタスクをうまく実行した場合, 量子化ではその性能や長文推論能力が損なわれないことが判明した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:23:52 GMT)
End-to-End Reinforcement Learning of Curative Curtailment with Partial Measurement Availability [2.6] 本稿では,配電系統の混雑解消のための新しいエンドツーエンドアプローチを提案する。
我々のアーキテクチャは、電力を削減し、非混雑かつ実現可能なグリッド状態を決定するために適切なリアクティブパワーを設定することを学びます。
また、渋滞のないグリッド操作に十分な品質を保証するために、実際のグリッド上で決定を行うこともできる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:04:04 GMT)
Model Editing at Scale leads to Gradual and Catastrophic Forgetting [2.6] 本稿では,ROMEとMEMITの2つの手法に焦点をあてて,現在のモデル編集手法を大規模に評価する。
モデルが複数の事実と逐次的に編集されるにつれて、以前編集された事実と下流タスクの実行能力を常に忘れていることがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:50:14 GMT)
MedExQA: Medical Question Answering Benchmark with Multiple Explanations [2.2] 本稿では,MedExQAについて紹介する。MedExQAは,医学的知識に関する大規模言語モデル (LLM) の理解を説明を通じて評価するための,医学的質問応答の新しいベンチマークである。
5つの異なる医療専門分野のデータセットを構築することで、現在の医療QAベンチマークの大きなギャップに対処する。
本研究は、医学LLMにおける説明可能性の重要性を強調し、分類精度以上のモデルを評価する効果的な方法論を提案し、特定の分野である音声言語病理学に光を当てる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:47:04 GMT)
Speedup of high-order unconstrained binary optimization using quantum Z2 lattice gauge theory [2.2] このアルゴリズムにゲージ対称性を導入することにより,量子断熱アルゴリズムを実装し,アルゴリズムの高速化を実現する。
ゲージ対称性は、状態が瞬時に基底状態になることを強制し、計算をさらに高速化する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:37:18 GMT)
Challenges in Drone Firmware Analyses of Drone Firmware and Its Solutions [2.2] ドローン部門は商業目的と軍事目的の両方で大きな注目を集めている。
IoTデバイスに対する脅威を軽減するセキュリティ研究のほとんどは、主にネットワーク、ファームウェア、モバイルアプリケーションに焦点を当てている。
本稿では,ドローンファームウェアを動的に解析することの課題について論じ,潜在的な解決策を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:30:40 GMT)
Random Time-hopping Secure Ranging Strategy Against Distance-Reduction Attacks in UWB [2.1] 本稿では,冗長な信号処理のオーバーヘッドを伴わないランダムな時間ホッピング機構に基づくセキュアな測位方式を提案する。
提案手法の有効性と妥当性は, シミュレーションと実験結果の両方を用いて実証した。
ランダムなタイムホッピング機構は、距離低減攻撃の成功率を0.01%未満に抑え、UWB範囲の安全性を著しく向上させることができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:33:06 GMT)
On the Variance of Neural Network Training with respect to Test Sets and Distributions [2.0] 標準のCIFAR-10とImageNetのトレーニングは、基礎となるテスト配信の性能にほとんどばらつきがないことを示す。
テストセットにおけるニューラルネットワークトレーニングのばらつきは,Jiangらによって発見されたクラス校正特性のダウンストリームの結果であることを示す。
本分析では, 分類ケースのばらつきを正確に予測する簡単な式を導出する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:25:33 GMT)
A Taxonomy and Comparative Analysis of IPv4 ID Selection Correctness, Security, and Performance [1.9] よりセキュアなインターネットへの戦いは、ネットワークプロトコルの最も基本的な部分を含む、多くの面で争われている。
本稿では,25年間のIPID利用履歴とそれに対応するIPID選択方法の変更を分類する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:22:17 GMT)
Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning? [1.9] 深層強化学習(RL)では、値関数はディープニューラルネットワークを用いて近似され、平均2乗誤差回帰目標を用いて訓練される。
近年の研究では、クロスエントロピー分類の目的を活かした代替手法が提案されている。
我々の研究は、オフラインのRLセットアップにおけるそのような置換の影響を実証的に調査することを目指している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:25:11 GMT)
An Empirical Study on Fault Detection and Root Cause Analysis of Indium Tin Oxide Electrodes by Processing S-parameter Patterns [1.9] 酸化インジウム(ITO)電極は、ディスプレイ、センサー、太陽電池などの光エレクトロニクスにおいて重要な役割を担っている。
従来の視覚検査は透明ITO電極では困難である。
次に、多層パーセプトロン(MLP)、畳み込みニューラルネットワーク(CNN)、トランスフォーマーなどのディープラーニングアプローチを使用して、欠陥の原因と重症度を同時に解析する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:29:37 GMT)
Should We Fine-Tune or RAG? Evaluating Different Techniques to Adapt LLMs for Dialogue [1.9] 本研究では,人間と機械の対話における応答生成作業におけるLarge Language Models (LLMs) の限界について検討する。
我々は,異なる対話型に適用する場合に,異なるLLM適応手法を広範囲に分析する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:52:49 GMT)
fSEAD: a Composable FPGA-based Streaming Ensemble Anomaly Detection Library [1.9] 機械学習のアンサンブルは、複数のベースモデルを組み合わせてより正確な出力を生成する。
本稿では,複数の部分再構成可能な領域,pblockからなるフレキシブルコンピューティングアーキテクチャを提案し,それぞれが異常検出を実装している。
概念実証設計では,ロダ,RS-Hash,xStreamの3つの最先端異常検出アルゴリズムがサポートされている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:38:35 GMT)
How to Benchmark Vision Foundation Models for Semantic Segmentation? [1.9] 本稿では,視覚基盤モデル(VFM)をセマンティックセグメンテーションのためにベンチマークする方法について検討する。
様々なVFMを様々な設定で微調整し、個々の設定がパフォーマンスランキングとトレーニング時間に与える影響を評価する。
データセットとドメインシフト間でのパフォーマンスランキングが異なるため、トレーニングと評価に複数のデータセットを使用することも推奨されている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:05:01 GMT)
Proximity Matters: Analyzing the Role of Geographical Proximity in Shaping AI Research Collaborations [1.8] 地理的近接が今後の科学的コラボレーション形成の可能性に及ぼす影響について検討した。
その結果,地理的距離は個々のレベルでの科学的コラボレーションを妨げることが示唆された。
その結果,ネットワーク近接が科学的コラボレーションの可能性に及ぼす影響は,地理的距離によって増加することがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:37:47 GMT)
Increasing Trust in Language Models through the Reuse of Verified Circuits [1.8] 言語モデル(LM)は、幅広い予測タスクにますます使われていますが、それらのトレーニングは稀なエッジケースを無視します。
数学的および論理的に規定されたフレームワークを使用して構築すれば,トランスフォーマーモデルをこの標準を満たすように訓練できることが示される。
両タスクの加算回路を広範囲に再利用し,より複雑な減算器モデルの検証を容易にする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:32:09 GMT)
Channel Reciprocity Based Attack Detection for Securing UWB Ranging by Autoencoder [1.8] ゴーストピーク攻撃に代表される様々な脅威がウルトラワイドバンド(UWB)システムのセキュリティ性能に関する懸念を引き起こしている。
本稿では,両方向のチャネルインパルス応答(CIR)特性をオートエンコーダを用いて比較する,低複雑性攻撃検出方式を提案する。
提案手法は,99%以上の攻撃検出成功率を実現し,低コストで現行システムに実装可能である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:47:03 GMT)
Feasibility of accelerating incompressible computational fluid dynamics simulations with fault-tolerant quantum computers [1.8] 本研究では, CFDシミュレーションの高速化と精度向上のため, フォールトトレラント量子コンピュータの適用可能性について検討した。
シュミレーション駆動型船舶設計の例として,定常流れの抗力を計算するシミュレーションについて考察する。
球面上のドラッグ力の単純な場合に必要な量子資源を推定する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:38:46 GMT)
Large language models for generating rules, yay or nay? [1.8] 本稿では,Large Language Models (LLM) を潜在的な世界モデルとして活用し,ソフトウェアシステムのエンジニアリングを加速する新しい手法を提案する。
このアプローチでは、LLMを使用してロジックルールを生成し、デプロイ前に中小企業によってレビューされ、通知される。
実験の結果, 1) LLMは実装をブートストラップする世界モデルを持ち, 2) LLMは専門家に比べてルールの数が少なく, 3) LLMはルールごとにしきい値を生成する能力を持っていないことがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:44:25 GMT)
Remote Implementation of Hidden or Partially Unknown Quantum Operators using Optimal Resources: A Generalized View [1.7] 2つのプロトコルは、特定の形式の量子作用素のリモート実装の2つの密接なリンクを持つ異なる変種に対して提案される。
どちらの場合も、空間的自由度で絡み合う2ビットの最大絡み合い状態が用いられる。
ここで使われる量子資源は、初期の研究で使われたマルチパーティまたはマルチモードの絡み合った状態と比較して、最適で容易に実現および維持することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:37:21 GMT)
Deep Multi-Objective Reinforcement Learning for Utility-Based Infrastructural Maintenance Optimization [1.7] Multi-Objective Deep Multi-Agent Actor-Critic (MO-DCMAC) は、インフラ整備最適化のための多目的強化学習(MORL)手法である。
従来の単目的RL法は、崩壊確率やコストなどの複数の目的を特異な報酬信号に組み合わせている。
ユーティリティ関数が非線形であっても,MO-DCMACは複数の目的に対して直接的にポリシーを最適化できることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:28:25 GMT)
Link Prediction in Bipartite Networks [1.7] 両部グラフを扱える19種類のリンク予測手法を比較した。
本稿では,新しいリンク予測手法として,グラフ畳み込みネットワーク(GCN)に基づくレコメンデーションシステムを提案する。
近年注目されているGCNベースのパーソナライズドレコメンデーションシステムは,バイパーティイトネットワークにおけるリンク予測に有効であることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:23:30 GMT)
Evaluating the Retrieval Component in LLM-Based Question Answering Systems [1.7] 本研究では,Retrieval-Augmented Generation (RAG)ベースのチャットボットにおける検索者評価のためのベースラインを提案する。
以上の結果から, この評価フレームワークは, 検索者の動作状況をよりよく把握できることを示した。
本手法では,無関係な文脈を無視するLLMの強みと,その応答における潜在的な誤りや幻覚を考察する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:46:22 GMT)
Identifying Peer Influence in Therapeutic Communities Adjusting for Latent Homophily [1.6] 薬物乱用や犯罪行為に対する対人的役割モデルの影響について検討した。
観測データに観測されていないホモフィリーが存在する場合のピアの影響を同定するために,潜時変動モデルを用いてネットワークをモデル化する。
以上の結果から,友人の卒業が住民の卒業に与える影響は,性別,人種,役割モデルの効果の定義によって異なることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:41:43 GMT)
Faster Convergence of Local SGD for Over-Parameterized Models [1.6] 現代の機械学習アーキテクチャは、しばしば非常に表現力が高い。
不均一なデータ設定における過パラメータ化関数に対する局所SGD(またはFedAvg)の収束を解析する。
一般凸損失関数に対しては、$O(K/T)$の誤差が成立する。
非剰余関数に対しては、どちらの場合も$O(K/T)$の誤差が証明される。
確立された収束率を、合理的に小さなステップサイズで一定の要因に密着した問題インスタンスを提供することで、結果を完成させる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:04:22 GMT)
The computational power of random quantum circuits in arbitrary geometries [1.5] 近年のQuantinuumのH2量子コンピュータのアップグレードにより、任意の接続性を持つ最大56ドルの量子ビットと99.843(5)%の2ビットゲートフィデリティで動作できるようになった。
我々は、高度に連結されたジオメトリーにおけるランダム回路サンプリングのデータを示し、前代未聞の忠実さと、最先端の古典的アルゴリズムの能力を超えるスケールを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:59:28 GMT)
Data Augmentation for Multivariate Time Series Classification: An Experimental Study [1.5] これらのデータセットのサイズは限られていますが、RocketとInceptionTimeモデルを使用して、13のデータセットのうち10の分類精度を向上しました。
これは、コンピュータビジョンで見られる進歩と並行して、効果的なモデルを訓練する上で、十分なデータの重要性を強調している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:58:02 GMT)
DISCO: An End-to-End Bandit Framework for Personalised Discount Allocation [1.5] DISCO(ディスコ)は、ASOS.comのパーソナライズされたディスカウントコードアロケーションのためのエンド・ツー・エンドのコンテキスト・バンディット・フレームワークである。
従来のトンプソンサンプリングアルゴリズムを整数プログラムに統合することで適応する。
レガシーシステムと比較して、平均バスケット値が 1% まで大幅に改善されている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:24:35 GMT)
Breast Histopathology Image Retrieval by Attention-based Adversarially Regularized Variational Graph Autoencoder with Contrastive Learning-Based Feature Extraction [1.5] 本研究は,乳房組織像検索のための新しいアテンションベース逆正則変分グラフオートエンコーダモデルを提案する。
乳がん組織像の2つの公開データセットを用いて,提案モデルの性能評価を行った。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:52:58 GMT)
Enhancing Long-Term Memory using Hierarchical Aggregate Tree for Retrieval Augmented Generation [1.5] HATは子どものノードから情報をカプセル化し、奥行き制御で広い範囲をカバーできる。
実験では、HATはベースラインコンテキストよりもダイアログコヒーレンスと要約品質を改善している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:29:08 GMT)
Hawking-Page and entanglement phase transition in 2d CFT on curved backgrounds [1.4] 曲面背景上の2次元共形場理論(2$d CFTs)について検討した。
共形写像により、変形ハミルトニアンによって支配される平坦空間上の同値系を研究する。
熱とエンタングルメントのエントロピーの相転移は,背景距離が変化するにつれて観測される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:16:21 GMT)
A Multidimensional Framework for Evaluating Lexical Semantic Change with Social Science Applications [1.4] 歴史的言語学者は語彙的意味変化の複数の形態を特定してきた。
この枠組みにより、語彙的意味変化を経済的、体系的にマッピングできる。
本研究では,2つのコーパスにおける精神保健と精神疾患の意味変化の図解的分析について述べる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:46:09 GMT)
Multicam-SLAM: Non-overlapping Multi-camera SLAM for Indirect Visual Localization and Navigation [1.4] 本稿では,複数のRGB-Dカメラを用いた視覚的同時ローカライゼーションとマッピング(SLAM)の新たなアプローチを提案する。
提案手法であるMulticam-SLAMはSLAMシステムの堅牢性と精度を大幅に向上させる。
従来の単一カメラSLAMシステムと比較して, 提案手法の精度とロバスト性は良好であった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:36:23 GMT)
Graph-Based Bidirectional Transformer Decision Threshold Adjustment Algorithm for Class-Imbalanced Molecular Data [1.3] 本稿では,Merriman-Bence-Osher(MBO)手法と双方向変換器を組み合わせたBTDT-MBOアルゴリズムを提案する。
提案手法は,クラス不均衡比が非常に高い場合にも,競合アルゴリズムよりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:20:13 GMT)
Model Predictive Control and Reinforcement Learning: A Unified Framework Based on Dynamic Programming [1.2] 近似動的プログラミング(DP)、モデル予測制御(MPC)、強化学習(RL)を結合する新しい概念的枠組みについて述べる。
このフレームワークは2つのアルゴリズムを中心に設計されており、ニュートンの手法の強力なメカニズムを通じて互いに独立に設計され、シナジーで動作している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:14:38 GMT)
Internal causality breaking and emergence of entanglement in the quantum realm [1.2] ビーム分割による2つのフォトニックモードの量子力学について検討した。
我々は,1モードの初期波動関数が,ハイゼンベルクの最小不確実性に従うウェーブパケットと異なる場合,各モードの時間進化の因果性は内部的に破壊されることを示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:31:52 GMT)
Shoulders of Giants: A Look at the Degree and Utility of Openness in NLP Research [1.2] 異なるNLP会場で公開された論文は, 人工物再利用に関する異なるパターンを示す。
分析した論文の30%以上は、その成果を公表していない。
我々は,NLP関連アーティファクトの言語的格差を広く観察する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:47:27 GMT)
Multifidelity digital twin for real-time monitoring of structural dynamics in aquaculture net cages [1.1] デジタルツイン技術は水産産業を前進させることができるが、その採用は限られている。
フレキシブルな浮体構造である魚網ケージは、養殖農場の重要かつ脆弱な構成要素である。
本研究では,水生生物網の構造動態をリアルタイムにモニタリングするデジタルツインへの統合のための多要素代理モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:52:32 GMT)
Network-Based Transfer Learning Helps Improve Short-Term Crime Prediction Accuracy [1.1] 本稿では,短期犯罪予測モデルのための新しいトランスファー学習フレームワークを提案する。
提案手法は,移動データ不足のある対象都市を対象としたF1スコアを改善する。
また、F1スコアの改善は、米国の様々な種類の犯罪や多様な都市に広く浸透していることも示している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 00:51:20 GMT)
Adaptive Opponent Policy Detection in Multi-Agent MDPs: Real-Time Strategy Switch Identification Using Running Error Estimation [1.1] OPS-DeMoは、動的エラー減衰を利用して相手のポリシーの変更を検出するオンラインアルゴリズムである。
提案手法は,プレデター・プレイ設定のような動的シナリオにおいて,PPO学習モデルよりも優れている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:34:44 GMT)
Training and Validating a Treatment Recommender with Partial Verification Evidence [1.1] 現在の臨床意思決定支援システム(DSS)は,対象クリニックの観察データに基づいて訓練され,検証されている。
ランダム化臨床試験(RCT)で検証されるが、どの診療所にも導入されていない。
主な課題は、治療の割り当てに対する根拠の欠如(割り当てはランダムである)、証拠の欠如である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:23:00 GMT)
Quantum Sparse Coding and Decoding Based on Quantum Network [1.1] スパース符号化と復号化アルゴリズムを実現するための対称量子ニューラルネットワークを提案する。
我々のネットワークは、光回路に自然に適合する多層2レベルユニタリ変換で構成されている。
我々は、古典的問題におけるバイナリとグレースケールの画像の疎符号化と復号化を実現し、量子問題における複雑な量子状態の復号化を実現した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:21:27 GMT)
Synthetic Face Ageing: Evaluation, Analysis and Facilitation of Age-Robust Facial Recognition Algorithms [1.0] 顔認識モデルのロバスト性を向上させるため,合成年齢データの利用の可能性を検討する。
合成老化画像を用いた画像の認識率は, 年齢差40歳以上の画像において, ベースラインモデルの結果よりも3.33%高い値を示した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:27:36 GMT)
Distribution-Free Predictive Inference under Unknown Temporal Drift [1.0] 本稿では、適応ウィンドウを選択して、そのデータを用いて予測セットを構築する戦略を提案する。
提案手法は時間的ドリフトに対する適応性を示すため,鋭いカバレッジ保証を提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:55:43 GMT)
Towards AI-Assisted Synthesis of Verified Dafny Methods [1.0] 既存の大規模言語モデルでは、検証プログラムの習熟度が著しく低下している。
Dafny検証対応言語における2つの事前学習モデルの習熟度を改善する方法を示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:14:41 GMT)
Insights from Social Shaping Theory: The Appropriation of Large Language Models in an Undergraduate Programming Course [1.0] 大規模言語モデル(LLM)は、コードを生成、デバッグ、説明することができる。
本研究は,学生の社会的知覚が自身のLLM利用にどのように影響するかを考察する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:40:14 GMT)
Error Analysis and Numerical Algorithm for PDE Approximation with Hidden-Layer Concatenated Physics Informed Neural Networks [1.0] 本稿では,隠れた物理情報ニューラルネットワーク(HLConcPINN)を提案する。
隠れたフィードフォワードニューラルネットワーク、修正されたブロックタイムマーチング戦略、偏微分方程式(PDE)を近似するための物理情報アプローチを組み合わせる。
本手法の近似誤差は, 長期間の地平線を有する動的シミュレーションのトレーニング損失によって効果的に制御できることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:12:53 GMT)
Higher-Order Spatial Information for Self-Supervised Place Cell Learning [0.9] 哺乳類は、空間内の位置を符号化する場所と格子細胞を介して、新しい環境をナビゲートする。
我々は高次空間情報尺度を導出し,実装し,複数の位置セルの出現について検討する。
創発性場所細胞には、高精度な空間デコードを含む多くの望ましい特徴があることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:03:54 GMT)
Parallel Quantum Local Search via Evolutionary Mechanism [0.9] 小型量子コンピュータの能力を活用した並列量子局所探索(PQLS)手法を提案する。
我々のアプローチは、複数のQLS経路を同時に実行し、ある間隔で最も効果的な結果を集約して世代を確立することで、この制約を超越する」。
本研究は,Ising問題の解決における並列量子コンピューティングの深い影響を示すものである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:35:52 GMT)
ValiText -- a unified validation framework for computational text-based measures of social constructs [0.9] 本稿では,テキストデータ中の社会的構造を有効に測定する上で,研究者を支援するための新たな検証フレームワークであるValiTextを紹介する。
この枠組みは、社会科学における妥当性の概念的基礎の上に構築され、社会科学における検証実践の実証的なレビューによって強化されている。
最終的にValiTextは、研究者に3種類の検証証拠を処方する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:51:50 GMT)
Geometric sparsification in recurrent neural networks [0.9] 本稿では,リカレントニューラルネット(RNN)のスペーサー化手法を提案する。
変調正則化は、様々な変調正則化器を持つより安定したRNNを誘導し、98%の間隔で高忠実度モデルを達成することを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:12:33 GMT)
Optimisation of federated learning settings under statistical heterogeneity variations [0.8] フェデレートラーニング(FL)は、中央アグリゲータと定期的にモデルパラメータを共有することで、ローカルデバイスが共有予測モデルを協調的に学習することを可能にする。
本稿では,3つのデータセット上での様々な統計的不均一性について,異なるFLトレーニングパラメータとアグリゲータの実証分析を行った。
異なる特徴を持つデータセットに対する最良のFLモデルと鍵パラメータを実証的に同定する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:01:03 GMT)
Explainable AI for Mental Disorder Detection via Social Media: A survey and outlook [0.8] データサイエンス、人工知能、メンタルヘルスケアの交差点を徹底的に調査する。
人口の大部分がオンラインソーシャルメディアプラットフォームに積極的に関与し、膨大な個人情報を保管している。
この論文は、従来の診断方法、最先端のデータおよびAI駆動型研究研究、および精神医療のための説明可能なAIモデル(XAI)の出現をナビゲートする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:51:16 GMT)
WarCov -- Large multilabel and multimodal dataset from social platform [0.7] この研究は、ポーランドにおけるパンデミックとウクライナでの戦争に関する3187105の投稿を2022年に人気のあるソーシャルメディアプラットフォームで発表している。
このコレクションは、事前処理されたテキストだけでなく、画像も含まれており、マルチモーダル認識タスクにも使用できる。
ラベルは投稿のトピックを定義し、投稿に付随するハッシュタグを使用して作成された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:36:44 GMT)
Causal Discovery over High-Dimensional Structured Hypothesis Spaces with Causal Graph Partitioning [0.7] 因果発見により、一般化された方法で因果関係と効果関係の集合として機構を推測することができる。
提案アルゴリズムは,生物学的に調整された合成ネットワークやネットワークに対して,最大104ドルの変数に対して,同等の精度と解法を実現できることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:08:14 GMT)
Thermodynamic Linear Algebra [0.7] 線形代数を加速するために,古典的熱力学に基づく別の物理計算パラダイムを考える。
本稿では、方程式の線形系、行列逆数、(3)行列行列行列式、(4)リアプノフ方程式を解くための単純な熱力学アルゴリズムを提案する。
我々のアルゴリズムはエルゴディディティ、エントロピー、平衡といった熱力学の原理を利用しており、これら2つの明らかに異なる分野間の深い関係を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:49:10 GMT)
Cascading Unknown Detection with Known Classification for Open Set Recognition [0.7] 未知分類を用いたカスケーディング未知検出(Cas-DC)について紹介する。
我々は、既知の/未知の検知と、既知の世界のクラス分類の両方のために、カスケード方式で特殊関数を学習する。
実験と解析により、Cas-DCはオープンセット認識においてモダンな手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:13:07 GMT)
The Synchronic Web [0.7] Synchronic WebはWorld Wide Web上のデータをセキュアにするための分散ネットワークである。
Synchronic Webインフラストラクチャのバックボーンは、シンプルで、小さく、セマンティックフリーなブロックチェーンである。
Synchronic Webは、世界のデータを離散時間とデジタル空間でユニークなポイントにロックするためのユビキタスなメカニズムを提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:58:01 GMT)
Neuro-TransUNet: Segmentation of stroke lesion in MRI using transformers [0.7] 本研究では,U-Netの空間的特徴抽出をSwinUNETRのグローバルな文脈処理能力と併用するNeuro-TransUNetフレームワークを提案する。
提案したNeuro-TransUNetモデルは、ATLAS v2.0のアントレーニングデータセットでトレーニングされ、既存のディープラーニングアルゴリズムを上回っ、脳卒中病変セグメンテーションの新しいベンチマークを確立する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:36:21 GMT)
The Impact of AI on Academic Research and Publishing [0.6] ChatGPTのような生成人工知能(AI)技術は学術的な執筆や出版に大きな影響を与えている。
本稿では,AIの学界への統合に関する倫理的考察を考察し,この技術が学術的不正行為に利用される可能性に注目した。
この発見は、この技術が倫理的かつ生産的に使用されることを保証するために、出版者、編集者、レビュアー、著者の間でAI利用への協力的アプローチの必要性を強調している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:10:18 GMT)
Variational Quantum Framework for Partial Differential Equation Constrained Optimization [0.6] PDE制約最適化問題に対する新しい変分量子フレームワークを提案する。
提案フレームワークは,変分量子リニア(VQLS)アルゴリズムとブラックボックスを主構成ブロックとして利用する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:15:11 GMT)
Multi-Objective Neural Architecture Search for In-Memory Computing [0.6] 我々は、インメモリコンピューティングアーキテクチャに多様な機械学習(ML)タスクをデプロイする効率を高めるために、ニューラルネットワークサーチ(NAS)を採用している。
IMCアーキテクチャ展開のためのNASアプローチの評価は、3つの異なる画像分類データセットにまたがる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:17:09 GMT)
Learning Zero-Shot Material States Segmentation, by Implanting Natural Image Patterns in Synthetic Data [0.6] この研究は、現実世界の画像から抽出されたパターンを合成データに注入することで、ギャップを埋めることを目的としている。
ゼロショット材料状態セグメンテーションのための総合ベンチマークを初めて提示する。
また,30,000の抽出テクスチャとSVBRDF/PBR材料を共有し,将来の生成を容易にする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 01:13:22 GMT)
Challenges with Differentiable Quantum Dynamics [0.5] 微分可能な量子力学は、複素数値初期値問題の自動微分を必要とする。
我々は,科学計算ライブラリにおける複雑で微分可能な数値積分の広範なサポートの必要性を実証する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:21:30 GMT)
Gameful Introduction to Cryptography for Dyslexic Students [0.5] 複雑な性質にもかかわらず、失読症は暗号化を理解する能力を妨げるものではない。
われわれは14人の高校生を対象にゲーム中心のワークショップを行い,基本暗号法を教えた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:30:43 GMT)
Short-Term Electricity Demand Forecasting of Dhaka City Using CNN with Stacked BiLSTM [0.5] 本稿では,ダッカ市の電力需要を短時間で正確に予測するために,畳み込みニューラルネットワーク(CNN)と積み重ねた双方向長短項メモリ(BiLSTM)アーキテクチャのハイブリッドモデルを提案する。
提案手法は,MAPE 1.64%,MSE 0.015,RMSE 0.122,MAE 0.092の他のベンチマークモデルと比較して,最高の予測結果を得た。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:02:07 GMT)
ProAct: Progressive Training for Hybrid Clipped Activation Function to Enhance Resilience of DNNs [0.5] State-of-the-artメソッドは、ニューロンワイドまたは層ワイドクリッピングアクティベーション機能を提供する。
層単位で切断されたアクティベーション関数はDNNのレジリエンスを高いビット誤り率で保持することはできない。
本稿では,ニューロンワイド法とレイヤバイ層法を統合したハイブリッドクリップ型アクティベーション関数を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:31:38 GMT)
MinBackProp -- Backpropagating through Minimal Solvers [0.5] インプリシット関数定理(IFT)を用いて微分を計算し、最小問題解法の解をバックプロパゲートすることは単純で高速で安定であることを示す。
本稿では,3次元点登録のための外乱除去重量をトレーニングするおもちゃの例と,画像マッチングにおける外乱除去とRANSACサンプリングネットワークの実際の応用について述べる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:15:30 GMT)
MHS-VM: Multi-Head Scanning in Parallel Subspaces for Vision Mamba [0.4] Mambaとのステートスペースモデル(SSM)は、線形複雑性を伴う長距離依存性モデリングを大いに約束している。
1次元選択的スキャンにより2次元画像空間内の視覚的特徴を効果的に整理・構築するために,新しいマルチヘッドスキャン(MHS)モジュールを提案する。
その結果、マルチヘッドスキャンプロセスから得られたサブ埋め込みは統合され、最終的に高次元空間に投影される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:24:43 GMT)
Entangled Probability Distributions for Center-of-Mass Tomography [0.4] 我々は、確率分布関数の観点から量子状態を記述することができる中心質量トモグラムの定式化についてレビューする。
本稿では,中心質量トモグラフィーにおける分離および絡み合った確率分布の概念を紹介する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:27:30 GMT)
Central Limit Theorem for Bayesian Neural Network trained with Variational Inference [0.3] 我々は,無限幅のベイズ型2層ニューラルネットワークに対する中央極限定理(CLT)を導出し,回帰タスクの変分推論により学習する。
CLT を導出することにより、理想化されたベイズ・バイ・バックプロップスキームは、ミニマル VI と異なる、同様のゆらぎ挙動を持つことを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:05:48 GMT)
Generalised linear response theory for the full quantum work statistics [0.3] 我々は、小さなハミルトニアン摂動を通して平衡から引き出された量子系を研究する。
分布に関するすべての情報を1つの量でエンコードできることがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:27:12 GMT)
An Empirical Design Justice Approach to Identifying Ethical Considerations in the Intersection of Large Language Models and Social Robotics [0.3] 大規模言語モデル(LLM)の社会ロボティクスへの統合は、ユニークな倫理的課題と社会的影響を示す。
本研究は、これらの2つの技術の設計と開発に生じる倫理的考察を特定することを目的としている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:53:50 GMT)
Improving Deep Learning-based Automatic Cranial Defect Reconstruction by Heavy Data Augmentation: From Image Registration to Latent Diffusion Models [0.3] この研究は、パーソナライズされた頭蓋インプラントの自動モデリングにおける人工知能の分野に多大な貢献をしている。
重データの増大が定量的および定性的な結果の両方を著しく増加させることを示す。
また, 人工的に拡張したネットワークは, 実際の臨床的欠陥を再構築することに成功した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:34:23 GMT)
Implications for Governance in Public Perceptions of Societal-scale AI Risks [0.3] 投票者は、AIのリスクは専門家よりも可能性が高く影響も大きいと認識し、AI開発を遅くすることを主張する。
政策介入は、社会規模リスクの全てのクラスにまたがる緩和努力をより慎重にバランスを取ろうとすれば、集団の懸念を和らげるのがよい。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:52:25 GMT)
Spin-photon entanglement of a single Er$^{3+}$ ion in the telecom band [0.3] 量子中継器を用いた長距離量子通信はセキュアな通信を可能にする技術である。
量子リピータの構成要素として、スピン光子絡み合いは原子と固体の量子ビットの両方で実証されている。
ここでは, シリコンナノフォトニック回路に集積された固体結晶中の1つのEr$3+$イオンを用いたスピン光子エンタングルメントを実演する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:55:25 GMT)
AI-Driven Predictive Analytics Approach for Early Prognosis of Chronic Kidney Disease Using Ensemble Learning and Explainable AI [0.3] 慢性腎臓病(英: chronic Kidney Disease、CKD)は、腎臓の構造と機能に大きな影響を及ぼし、最終的に腎不全を引き起こす異種性疾患である。
本研究の目的は、アンサンブル学習と説明可能なAIを用いて、早期予後とCKDの検出のための支配的特徴、特徴スコア、および値の可視化である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:46:14 GMT)
Hamiltonians whose low-energy states require $Ω(n)$ T gates [0.2] 我々は、状態を作成するTゲートの数と、状態が擬安定化器である項数との関係を証明した。
この結果は,[CCNN23]よりも大幅に向上したことを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:37:16 GMT)
Quasiprobability distributions with weak measurements [0.2] 量子コヒーレンスが結果対の準確率統計をどのように支配するかを示す。
結果は、タスクの実装や安定化を目的とした量子モニタリングへの応用を見出す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:22:53 GMT)
Situated Ground Truths: Enhancing Bias-Aware AI by Situating Data Labels with SituAnnotate [0.2] SituAnnotateは構造化およびコンテキスト対応データアノテーションに対する新しいオントロジーベースのアプローチである。
コンテキストや文化的な状況において、AIシステムのトレーニングに使用される真理データを固定することを目的としている。
ラベルベースのデータセットを作成し、クエリし、比較する方法として、SituAnnotateは、ダウンストリームAIシステムに、コンテキストと文化バイアスを明確に考慮したトレーニングを実施する権限を与える。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:33:13 GMT)
Efficiently Deciding Algebraic Equivalence of Bow-Free Acyclic Path Diagrams [0.2] 潜伏した共同設立者の存在による因果関係の発見には、条件付き独立性を超えた制約が存在する。
2つのグラフが同じ代数的制約を課すか、あるいは1つのグラフが課す制約が他のグラフが課す制約のサブセットであるかどうかを決定する効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:01:07 GMT)
Time to Separate from StackOverflow and Match with ChatGPT for Encryption [0.1] セキュリティは開発者にとって最大の関心事ですが、セキュリティ問題はコードスニペットに広まっています。
ChatGPTは、開発者が適切に関わったときに効果的に助けることができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:56:59 GMT)
Learning effective Hamiltonians for adaptive time-evolution quantum algorithms [0.1] 多体ダイナミクスのディジタル量子シミュレーションは、ターゲットの時間進化を基本量子ゲートに分解するためにトロッター化に依存する。
近年の進歩は、より効率的な適応的なトロッタープロトコルを実現するためのプロトコルを概説している。
本稿では,量子ハミルトニアン学習を用いて実効ハミルトニアンを数値的に取得し,最近導入されたADA-Trotterアルゴリズムに適用することを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:50:38 GMT)
SeeFar: Satellite Agnostic Multi-Resolution Dataset for Geospatial Foundation Models [0.1] SeeFar(シーファー)は、公共の衛星と商用衛星の多解像度衛星画像集である。
衛星タイプに縛られずに地理空間基盤モデルのトレーニングのために,このデータセットをキュレートした。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:24:14 GMT)
Quantum simulation of one-dimensional fermionic systems with Ising Hamiltonians [0.1] 本研究では, 局所的横場を持つ単純イジング型ハミルトニアンを用いて, 1次元におけるスピンレスフェルミオン系の時間進化をシミュレートする手法を提案する。
シミュレーションの時間複雑性は逆誤差の平方根でスケールし、従って1次積公式の最悪のケースエラーと比較することが好ましい。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:39:55 GMT)
Evolutionary Algorithms Simulating Molecular Evolution: A New Field Proposal [0.1] 近年のゲノムシークエンシングの進歩により、タンパク質ファミリーの多様性が明らかにされているが、全てのアミノ酸配列の膨大な検索空間と比較して、既知の機能ファミリーのセットは最小限である。
自然には限定的なタンパク質「語彙」があると言えるかもしれない
進化的アルゴリズム、機械学習(ML)、バイオインフォマティクスを組み合わせることで、これまで存在しなかった全く新しいタンパク質の開発を促進することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:49:16 GMT)
Probing de Sitter Space Using CFT States [0.0] 三次元ド・ジッター空間における局所励起に双対な CFT 状態を構築する。
バルク座標値の量子推定のための情報計量は、ド・ジッター空間計量を再現することを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:33:19 GMT)
The Structure and Dynamics of Knowledge Graphs, with Superficiality [0.0] 本稿では,事実を独立に生成する関係の重なり合いを制御する,超現実性の概念を紹介する。
これは知識グラフの構造と力学の最初のモデルである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:02:44 GMT)
uSF: Learning Neural Semantic Field with Uncertainty [0.0] USFと呼ばれる拡張ベクトル表現の生成のための新しいニューラルネットワークモデルを提案する。
トレーニング用画像の少ない場合、不確実性を定量化するモデルは、そのような機能を持たないモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 00:22:46 GMT)
Vacuum polarization and Wichmann-Kroll correction in the finite basis set approximation [0.0] 基底集合の型とサイズが異なる有限基底集合法の収束性について検討する。
重水素様イオンをいくつか考慮し、真空偏光補正を$S$と$P$電子軌道で評価する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:36:11 GMT)
VS-PINN: A Fast and efficient training of physics-informed neural networks using variable-scaling methods for solving PDEs with stiff behavior [0.0] 本稿では,変数スケーリング手法を用いたPINNのトレーニング手法を提案する。
提案手法の有効性を実証し,PINNのトレーニング効率と性能を大幅に向上させることができることを確認した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:11:15 GMT)
Ultra-Short Pulse Biphoton Source in Lithium Niobate Nanophotonics at 2$\textμ$m [0.0] Photonicsは量子情報処理(QIP)にユニークな機能を提供する
ナノフォトニクスにおける量子状態の超短秒パルス源は、スケーラブルな超高速QIPを実現するための重要な構成要素である。
ここでは, 分散法で周期的に偏極したニオブ酸リチウムナノフォトニクスにおいて, フェムト二光子源を示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 02:48:19 GMT)
Towards a real-time distributed feedback system for the transportation assistance of PwD [0.0] 提案した設計では、移動問題のある個人の支援に関するさらなる拡張が可能である。
提案アーキテクチャの主な構成要素は, アクセス不能シティポイントシステム, ライブデータ分析・応答システム, 障害物検出・防止システムである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:31:39 GMT)
Towards Real-World Efficiency: Domain Randomization in Reinforcement Learning for Pre-Capture of Free-Floating Moving Targets by Autonomous Robots [0.0] 本研究では,微小重力環境下でのロボットプレグラスピングの複雑な課題に対処するために,深層強化学習に基づく制御手法を提案する。
本手法は,ソフトアクター・クリティックな手法を用いて,自由な移動物体にグリッパーが十分に接近できるように,非政治強化学習の枠組みを取り入れたものである。
プレグラスピングのアプローチタスクを効果的に学習するために,エージェントに明確で洞察に富んだフィードバックを提供する報酬関数を開発した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:54:51 GMT)
Toward Constraint Compliant Goal Formulation and Planning [0.0] 異なる倫理的枠組みにおける知識の符号化がエージェントの目的の定式化と計画処理にどのように影響するかを示す。
倫理的規範に従うための非オントロジ的フレーミングと実用的フレーミングのトレードオフについて検討する。
本研究は,目標定式化・計画中の倫理的対立を解決する上で,メタ認知的判断に重要な役割を担っていることを示唆する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:26:05 GMT)
Topological Expressivity of ReLU Neural Networks [0.0] 本稿では,2値分類問題の設定におけるReLUニューラルネットワークの表現性について,トポロジ的観点から検討する。
その結果、深部ReLUニューラルネットワークは、トポロジカル単純化の観点から、浅部よりも指数関数的に強力であることがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:58:42 GMT)
Time-tronics: from temporal printed circuit board to quantum computer [0.0] 時間結晶構造は、異なる凝縮物質の挙動を明らかにすることができる。
時間格子がプリント基板のような時間中性子の道を開く。
我々のアプローチは量子コンピュータの構築を可能にし、可能な全ての量子ビット対に対する量子ゲート演算を可能にする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:44:49 GMT)
Time Series Analysis: yesterday, today, tomorrow [0.0] 様々なプロセスの予測は常に統計学とデータ科学の高度な問題である。
過去数十年にわたって、ソリューションの手順はディープラーニングとカーネルメソッドによって更新された。
ここでは、この視点がいかに真であるかを考察する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:42:44 GMT)
The wave function of stabilizer states and the Wehrl conjecture [0.0] 我々はヒルベルト空間$L(A)$で表される量子系に焦点を当て、$A$はコンパクトな開部分群を含む局所コンパクトなアベリア群である。
量子情報理論において生じる問題である波動関数の観点から安定化状態を記述する問題に対する完全かつエレガントな解を提供する。
安定化状態がWehrlエントロピー汎函数の極小値であることを示し、したがってそのような群に対するWehrl予想の類似を解消する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:13:42 GMT)
The fast committor machine: Interpretable prediction with kernels [0.0] 本稿では,高速コミッタマシン(FCM)と呼ばれる,コミッタの効率的な近似アルゴリズムを提案する。
カーネル関数は、$A$から$B$遷移を最適に記述する低次元部分空間を強調するように構成される。
FCMは精度が高く、同じ数のパラメータを持つニューラルネットワークよりも速くトレーニングする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:13:52 GMT)
The entanglement membrane in exactly solvable lattice models [0.0] 絡み合い膜理論はカオス量子多体系における絡み合いダイナミクスを記述する。
我々は、正確に解けるがカオス的なユニタリ回路のクラスにおける絡み線張力を計算する。
この結果は, マイクロフローケット格子モデルにおけるエンタングルメント膜理論に光を当てた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:12:21 GMT)
The elision of the subject and the manifestation of the world [0.0] 量子オブジェクトも測定器も、意識的な対象とは無関係に、特性担体とみなすことはできない。
古典的領域と量子領域の差が本質的に、表象された世界とその表象に欠かせないものの違いであると理解されれば、被写体の除去は再び達成される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:26:12 GMT)
Thanking the World: Exploring Gender-Based Differences in Acknowledgment Patterns and Support Systems in Theses [0.0] 本稿は, 男女研究者が修士課程や博士課程を修了する際の支援源について検討する。
提案手法は,RoBERTaモデルを用いて1252 ETDで認識される各種支援システムを抽出する手法である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 04:06:55 GMT)
Surface criticality in the mixed-field Ising model with sign-inverted next-nearest-neighbor interaction [0.0] 光ツイーザーアレイのリドバーグ原子はスピン=1/2$反強磁性イジングモデルの量子シミュレータとして使われている。
反強磁性相と常磁性相の1次量子相転移に伴う表面臨界性について検討する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:27:01 GMT)
Strokes2Surface: Recovering Curve Networks From 4D Architectural Design Sketches [0.0] Strokes2Surfaceはオフラインの再構築パイプラインで、不正確な4Dスケッチから十分に接続された曲線ネットワークを復元する。
アーキテクチャスケッチのプラクティスに触発されて、私たちのパイプラインは、その目標を達成するために、分類器と2つのクラスタリングモデルを組み合わせています。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:04:11 GMT)
Spoken Humanoid Embodied Conversational Agents in Mobile Serious Games: A Usability Assessment [0.0] この研究の目的は、複数のエージェントの影響と人間の錯覚が相互作用の質に与える影響を評価することである。
実験では,ハイヒューマンライクネス(HECA)エージェントと低ヒューマンライクネス(テキスト)エージェントの2種類のエージェント提示について検討した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:08:27 GMT)
Siren -- Advancing Cybersecurity through Deception and Adaptive Analysis [0.0] このプロジェクトは、制御された環境に潜在的な脅威を引き出すための洗練された手法を採用している。
アーキテクチャフレームワークには、リンク監視プロキシ、動的リンク分析のための機械学習モデルが含まれている。
シミュレーションされたユーザアクティビティの組み入れは、潜在的攻撃者からの攻撃を捕捉し、学習するシステムの能力を拡張する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:47:49 GMT)
Simulation of a feedback-based algorithm for quantum optimization for a realistic neutral atom system with an optimized small-angle controlled-phase gate [0.0] 最適に調整された小角制御相ゲートを実装する手法を提案する。
我々は,小角制御相ゲートを用いたFALQONの性能が,CZゲートを利用したFALQONの性能より優れていることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:47:53 GMT)
Sequential Binary Classification for Intrusion Detection in Software Defined Networks [0.0] 侵入検知システム (IDS) は Software-Defined Networks (SDN) の重要な部分である
IDSデータセットは、標準機械学習(ML)モデルのパフォーマンスに影響を及ぼす、高いクラス不均衡に悩まされる。
この問題に対処する多クラス分類アルゴリズムとして,SBC(Sequential Binary Classification)を提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:34:13 GMT)
Self-supervised network distillation: an effective approach to exploration in sparse reward environments [0.0] 強化学習は、事前に設計された報酬関数に従って、エージェントが環境の中で振る舞うように訓練することができる。
そのような問題の解決策は、エージェントに情報的な探索を提供する本質的な動機を与えることであるかもしれない。
本稿では, 蒸留誤差に基づく本質的な動機づけアルゴリズムである自己教師ネットワーク蒸留(SND)を新規性指標として提示する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:00:08 GMT)
SecureNet: A Comparative Study of DeBERTa and Large Language Models for Phishing Detection [0.0] フィッシングは、ソーシャルエンジニアリングを使ってユーザーを騙して機密情報を明らかにすることで、組織にとって大きな脅威となる。
本稿では,Large Language Models (LLMs) の顕著な性能を,テキスト分類のような特定のタスクに活用できるかどうかを検討する。
LLMがいかにして説得力のあるフィッシングメールを生成するかを示し、詐欺を見つけるのを難しくする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:13:39 GMT)
SETC: A Vulnerability Telemetry Collection Framework [0.0] 本稿では,SETC(Security Exploit Telemetry Collection)フレームワークを紹介する。
SETCは、堅牢な防御セキュリティ研究のために、再現可能な脆弱性エクスプロイトデータを大規模に生成する。
この研究は、スケーラブルなエクスプロイトデータ生成を可能にし、脅威モデリング、検出方法、分析技術、戦略の革新を促進する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 00:13:35 GMT)
Rényi entanglement entropy of spin chain with Generative Neural Networks [0.0] スピン系のR'enyiエンタングルメントエントロピーを推定する手法について述べる。
これは、レプリカのトリックと、明確な確率推定を伴う生成ニューラルネットワークに基づいている。
一次元量子イジングスピン鎖上での本手法の実証を行う。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:44:54 GMT)
Rigorous lower bound of dynamic critical exponents in critical frustration-free systems [0.0] 任意の空間次元の格子上でフラストレーションのないハミルトン多様体に対して、厳密な下界$z geq 2$を証明する。
この境界はフラストレーションフリーハミルトニアンの代表類に適用できる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:08:33 GMT)
Ricci flow-guided autoencoders in learning time-dependent dynamics [0.0] 本稿では、時間、特に偏微分方程式(PDE)を学習するための多様体ベースのオートエンコーダ法を提案する。
これは、物理学的インフォームドな設定でリッチフローをシミュレートすることで実現でき、また、リッチフローが経験的に達成されるように、多様体の量と一致させることができる。
本稿では,周期性やランダム性などの望ましい特徴を含むPDEデータからなる実験について述べる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:33:25 GMT)
Resonator-mediated quantum gate between distant charge qubits [0.0] 光子は、$i$SWAPゲートと$sqrtimathrmSWAP$ゲートの両方を、2つの遠い電荷量子ビット間で仲介することができる。
電荷量子ビットの退化速度の1桁の増大は、ゲートの忠実度が95%を超えると推測する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:34:42 GMT)
Reproducibility study of FairAC [0.0] 本研究は,Guo, Chu, Li arXiv:2302.12977 の論文 "Fair Attribute Completion on Graph with Missing Attributes" の成果を再現することを目的としている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:09:03 GMT)
Rephasing spectral diffusion in time-bin spin-spin entanglement protocols [0.0] 絡み合った状態が生成されると、準定常周波数変動から位相誤差を補正する手法を提案する。
準定常周波数変動に対して、その忠実度はシェルビングに用いる励起状態の寿命によってのみ決定される。
このプロトコルは、絡み合いの発生率を低下させることなく、高忠実な絡み合いのスピンペアを生成するために使用できる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:33:27 GMT)
Relative descriptors for quantum agents [0.0] 我々は、エベレット量子力学のハイゼンベルク図を用いて、フラウチャー=レンナーの思考実験の相対的な記述子を探索する。
エベレット力学は思考実験においてパラドックスを示さないが、デコヒーレンスのないセットアップは指示的分岐木を提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:29:46 GMT)
Real-Time Automated donning and doffing detection of PPE based on Yolov4-tiny [0.0] リアルタイムオブジェクト検出とユニークなシークエンシングアルゴリズムを用いて、ドッキングとドッフィングのプロセスをリアルタイムで識別し、決定する。
組み込みシステムアーキテクチャにおける小さな機械学習(yolov4-tiny)は、異なるヘルスケア環境でのデプロイが実現可能で費用対効果がある。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:38:03 GMT)
Random Function Descent [0.0] 我々は勾配降下を再発見するために'stochastic Taylor approximation' を用いる。
この再検討によって、Random Descent(RFD)と呼ばれるステップサイズスケジュールが得られます。
RFDのステップサイズスケジュールを推定する統計的手法を提案し,この理論をMNISTデータセットのケーススタディで検証する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:57:24 GMT)
Quantum thermodynamics with coherence: Covariant Gibbs-preserving operation is characterized by the free energy [0.0] 我々は、任意のコヒーレント状態に対する状態変換性は、量子相対エントロピーで定義される自由エネルギーによって完全に特徴づけられることを証明した。
この結果を一般資源理論に拡張することは、共変条件を一般資源理論に付与しても状態変換性は変わらないという形で行うことができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:06:09 GMT)
Quantum robustness of the toric code in a parallel field on the honeycomb and triangular lattice [0.0] 本研究では,一様平行場の存在下でのハニカム格子上のトーリック符号における位相秩序の量子ロバスト性について検討する。
z$-direction の体に対して、低エネルギー物理学はフラックスフリーセクターにあり、ハニカム格子上の横フィールドイジングモデルに写像することができる。
負の$x$-フィールドの場合、電荷自由セクターは三角格子上の強フラストレーションの反強磁性逆場イジングモデルにマッピングされる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:34:14 GMT)
Quantum Speed Limits for Implementation of Unitary Transformations [0.0] 任意の次元におけるユニタリ作用素による量子進化の速度限界に関する境界を与える。
量子情報処理に関心のある変換のいくつかのクラスにおけるこれらの境界の適用について論じる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:17:22 GMT)
Quantum Machine Learning With Canonical Variables [0.0] 荷電粒子上での動的電磁界制御の利用は、状態を直接ではなく観測可能上で動く量子機械学習プラットフォームの基礎となる。
このプラットフォームは、電磁場を制御源として利用するイオントラップや粒子閉じ込め装置で物理的に実現することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:10:42 GMT)
Quantum Isotropic Universe in RQM Analogy: the Cosmological Horizon [0.0] 自由質量スカラー場の存在下での等方宇宙の量子力学について検討する。
宇宙の進化における「転回点」の導入によって、宇宙の膨張と崩壊を表す本質的な曖昧さが克服されることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:52:20 GMT)
Quantum Equilibrium Propagation for efficient training of quantum systems based on Onsager reciprocity [0.0] 平衡伝播(Equilibrium propagation、EP)は、平衡に緩和する古典的なエネルギーモデルに導入され応用された手順である。
ここでは、EPとOnsagerの相互性を直接接続し、これを利用してEPの量子バージョンを導出する。
これは任意の量子系の可観測物の期待値に依存する損失関数の最適化に使うことができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:22:09 GMT)
Quantum Architecture Search: A Survey [0.0] 現実の問題を解決するための量子コンピューティングの応用は、ハードウェアの制限と、量子アルゴリズムの比較的未探索の状況によって、いまだに妨げられている。
量子回路(PQC)の自動生成に関する研究は注目されている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:17:46 GMT)
Quadratic dispersion relations in gapless frustration-free systems [0.0] 隙間のないフラストレーションのないハミルトン多様体における低エネルギー励起の分散は、実際にはそのような系の一般的な性質である。
これは、フラストレーションフリーハミルトニアンにおいて線形に分散的な励起を持つギャップレス位相を実現するノーゴー定理として理解することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:08:31 GMT)
Pointwise bounds on eigenstates in non-relativistic QED [0.0] パウリ・フィエルツ・ハミルトニアンの固有状態がサブソリューション推定を満たすことを示す。
同様の点境界は、固有状態ではない状態の1粒子密度にも成立する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:14:38 GMT)
Physical coherent cancellation of optical addressing crosstalk in a trapped-ion experiment [0.0] 線形イオン鎖低温量子レジスタに供給される光のコヒーレントなクロストークキャンセル法について実験的に検討する。
イオンを結晶軸に直交する集束レーザビームを用いて個別に処理し、多芯フォトニック結晶導波路アレイの各出力を単一イオンに撮像して生成する。
5$mu$mのイオンに対して、この装置の隣り合うネイティブクロストーク強度を測定したところ、sim 10-2$であることがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:23:21 GMT)
Phonon Pumping by Modulating the Ultrastrong Vacuum [0.0] 仮想光子によって実現されたミラーの実際の機械的励起を誘導し観測するためのプロトコルを提案する。
このハイブリッド効果は、基底状態における仮想光子集団の直接的な帰結であることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:36:20 GMT)
Outlier detection by ensembling uncertainty with negative objectness [0.0] 外乱検出は、教師付き視覚認識の安全クリティカルな応用に欠かせない能力である。
我々は、K の基底クラスと1つの外れ値クラスに対応する K+1 ロジットの直接予測を再考する。
K+2クラスにマスクレベルの認識を組み込んだ高密度予測アーキテクチャに本手法を組み込む。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:10:38 GMT)
Optimizing Large Language Models for OpenAPI Code Completion [0.0] 本研究では,GitHub CopilotのOpenAPI補完性能を評価する。
MetaのオープンソースモデルであるCode Llamaを利用したタスク固有の最適化セットを提案する。
微調整されたCode Llamaモデルは、GitHub Copilot上で55.2%のピーク精度向上を達成した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:58:24 GMT)
On Locality of Quantum Information in the Heisenberg Picture for Arbitrary States [0.0] 量子力学の局所性問題は、量子物理学などに対する適切な理解の鍵となる問題である。
一般に量子非局所性(quantum nonlocality)として強調されているものは、量子情報のハイゼンベルク図(Heisenberg picture of quantum information)の概念を通じて、刺激的な検査を受けている。
DeutschとHaydenは量子ビット系の量子情報フローの設定において量子情報の局所的な記述を確立した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 08:57:11 GMT)
Noisy Qudit vs Multiple Qubits : Conditions on Gate Efficiency for enchancing Fidelity [0.0] 我々は、qudit と $n$-qubit 系の不忠実性スケーリングの比較研究を示す。
リンドブラッド形式における雑音に対する平均ゲート不整合(AGI)の1次応答を計算した。
特定のキューディットプラットフォームは、最先端のキュービットプラットフォームと競合するゲート効率を持つことがわかった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:36:16 GMT)
New method for the solution of the two-body Dirac equation for the positronium bound states [0.0] ポジトロニウムの2体境界状態ディラック方程式を解くための新しい理論法を開発した。
二つの体 Dirac Hamiltonian は 4$times$4 のエルミート行列形式で書くことができ、運動量状態の表現で対角化することができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:12:40 GMT)
Modular Growth of Hierarchical Networks: Efficient, General, and Robust Curriculum Learning [0.0] 与えられた古典的、非モジュラーリカレントニューラルネットワーク(RNN)に対して、等価なモジュラーネットワークが複数のメトリクスにわたってより良い性能を発揮することを示す。
モジュラートポロジによって導入された帰納バイアスは,モジュール内の接続が固定された場合でもネットワークが良好に動作可能であることを示す。
以上の結果から,RNNの段階的モジュラー成長は,進化の時間スケールで複雑なタスクを学習する上でのメリットをもたらす可能性が示唆された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:44:07 GMT)
Moderate Adaptive Linear Units (MoLU) [0.0] 深層ニューラルネットワークのための新しい高性能アクティベーション関数であるModrate Adaptive Linear Unit (MoLU)を提案する。
MoLUはシンプルで美しく強力なアクティベーション関数であり、数百のアクティベーション関数の中で優れたメインアクティベーション関数となる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:32:24 GMT)
Mining for sustainability in cloud architecture among the discussions of software practitioners: building a dataset [0.0] 我々は,StackExchangeプラットフォームのソフトウェアエンジニアリングフォーラムにおいて,ソフトウェアリポジトリマイニング技術を用いて,192人の実践者間の議論を調査した。
評価やメンテナンスといった複雑な作業は避けつつ,設計面に重点を置く実践者も多かった。
技術的持続性は強調され、経済的な側面は、それにのみ焦点を絞った議論が最多である。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:54:27 GMT)
MedMamba: Vision Mamba for Medical Image Classification [0.0] SS-Conv-SSMは,局所的な特徴を抽出するための畳み込み層と,長距離依存関係をキャプチャするSSMの機能を統合する。
グループ化された畳み込み戦略とチャネルシャッフル演算を用いることで、MedMambaはより少ないモデルパラメータと少ない計算負担を提供することに成功した。
我々の研究は、医用画像分類の新しいベースラインを確立することを目的としており、より強力なSSMベースの人工知能アルゴリズムを開発する上で貴重な洞察を提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:06:05 GMT)
Magnetization without spin: effective Lagrangian of itinerant electrons [0.0] 有効ラグランジアンの有限$B$は、Bneq 0$の物理効果を適切に表す。
スレーター・ポーリング曲線と呼ばれる磁場の普遍的なシフトは、有効ラグランジアンから導かれる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:11:45 GMT)
Macroscopic quantum superpositions in superconducting circuits [0.0] 固定エネルギーと調整可能な長さの試験電流パルスは、光子の場の量子真空と相互作用した後、量子特性を取得する。
パルスの長さが量子系の特性サイズに対して大きくなるにつれて、テストパルスは量子-古典遷移を行う。
このモデルは、その単純さと、量子ベース技術に適した相関システムを作成する新しい方法に向けた点から、以前のモデルとは異なる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:29:08 GMT)
Long-Range Quantum Tunneling via Matter Wave [0.0] 状態選択型光学格子におけるN$極分離トラップ電位の超低温原子のトンネル化について検討した。
励起状態原子から放出される伝播物質波の媒介の役割により、密閉された原子の遠隔トラップ電位へのコヒーレントトンネルが生じることが判明した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:53:18 GMT)
Leveraging modular values in quantum algorithms: the Deutsch-Jozsa [0.0] モジュラー値を利用する量子アルゴリズムに新しいアプローチを提案する。
一組のバイナリ値に作用する関数が定数であるかどうかを確認する問題に焦点をあてる。
提案手法はモジュラー値の利用に依存して,新しいアルゴリズムを最適化するための自由度を多数提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:17:07 GMT)
Learning a Reward Function for User-Preferred Appliance Scheduling [0.0] エンドユーザーの日次アプライアンススケジュール作成を支援する逆強化学習モデルを提案する。
過去の消費データを使用することで、エンドユーザーはこれらの決定の作成に暗黙的に参加する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:43:30 GMT)
Isotope shift measurement of the 423-nm transition in neutral Ca [0.0] 本研究では,Caイオン中の729nm遷移の飽和吸収分光測定について報告する。
フィールドと質量シフトパラメータは他の遷移を持つキングプロットから決定される。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 21:20:36 GMT)
Ising Meson Spectroscopy on a Noisy Digital Quantum Simulator [0.0] 本稿では,既存の雑音量子マシンを用いて1+1DQFTのエネルギースペクトルを解析できることを示す。
1+1D量子イジングモデルのエネルギースペクトルを計算するため,IBMのibmq_mumbai量子シミュレータ上でクエンチ実験を行った。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:27:48 GMT)
In-Context Learning and Fine-Tuning GPT for Argument Mining [0.0] 大規模言語モデル(LLM)は、NLPやディープラーニングにおいて広く普及している。
本稿では,kNN を用いたサンプル選択と多数決の組立を組み合わせた ATC のための ICL 戦略を提案する。
In the training-free ICL setting, we show that GPT-4 can able to leverage relevant information from only few demonstration example。
この設定では、GPT-3.5はATCの最先端性能を達成する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:01:55 GMT)
Identifying Bottlenecks of NISQ-friendly HHL algorithms [0.0] NISQ適応反復QPEとそのHHLアルゴリズムの雑音耐性について検討する。
その結果,Qiskit readout や M Three readout package のようなノイズ低減技術は,ここでテストした小さなインスタンスにおいても,結果の回復には不十分であることが示唆された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:11:27 GMT)
Higher-order Poincaré Spheres and Spatio-Spectral Poincaré Beams [0.0] 我々は、その横空間、周波数、偏光で構築された光の視覚的表現を、高次ポアンカー球の形で導入する。
さらに、この接続を利用して、可分極状態を持つ光をそのスペクトル形状にわたって議論し、実験的に生成する。
我々の研究は、光学における強力なツールとして構造化光のより深い理解と有益な応用の道を開くことができる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:27:54 GMT)
Guidable Local Hamiltonian Problems with Implications to Heuristic Ansätze State Preparation and the Quantum PCP Conjecture [0.0] 我々は最近定義されたガイドド局所ハミルトン問題における「マーリン化」バージョンについて検討する。
これらの問題には、入力の一部として提供される指針状態はなく、単に存在するという約束が伴うだけである。
誘導状態の両クラスに対する誘導可能な局所ハミルトン問題は、逆多項式の精度設定において$mathsfQCMA$-completeであることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:47:53 GMT)
Greedy SLIM: A SLIM-Based Approach For Preference Elicitation [0.0] 新しいユーザは、適切なレコメンデーションを計算するために、慎重に選択された項目を評価するように求められます。
SLIMに基づく嗜好評価手法を提案する。
Greedy SLIMと呼ぶSLIMの新しいトレーニング手法では,SLIMの損失を最小限に抑えるため,反復的にトレーニング項目を選択する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 07:18:24 GMT)
Global Geolocated Realtime Data of Interfleet Urban Transit Bus Idling [0.0] GRD-TRT-BUF-4Iは、都市交通バスの走行時間と走行時間を記録するリアルタイム検知システムである。
このシステムは、北米、ヨーロッパ、オセアニア、アジアにまたがる50都市から、毎日20万件のアイドリングイベントを検知する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 03:51:09 GMT)
Generalized "Square roots of Not" matrices, their application to the unveiling of hidden logical operators and to the definition of fully matrix circular Euler functions [0.0] Notの平方根は量子コンピューティング理論において重要な論理演算子である。
物理学では、次元 2 の平方複素行列である。
演算子の2つの平方根に対する一般表現がどのように得られるかを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:37:31 GMT)
Explainable Artificial Intelligence Techniques for Accurate Fault Detection and Diagnosis: A Review [0.0] この文脈でeXplainable AI(XAI)ツールとテクニックをレビューする。
私たちは、AI決定を透明にする彼らの役割、特に人間が関与する重要なシナリオに重点を置いています。
モデル性能と説明可能性のバランスをとることを目的とした,現在の限界と今後の研究について論じる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:04:10 GMT)
Entanglement and steering in quantum batteries [0.0] 電池に新しい量子リソースとして量子ステアリングを導入する。
我々は、量子ステアリング、量子絡み合い、エネルギー貯蔵、抽出可能な仕事の関係を分析する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:35:36 GMT)
Enhancing Food Safety in Supply Chains: The Potential Role of Large Language Models in Preventing Campylobacter Contamination [0.0] 食中毒は、主に細菌感染によって引き起こされる、世界的な公衆衛生上の課題となる。
HACCPは、食品の安全性リスクを体系的に管理するための最も効果的なアプローチと考えられている。
本研究では,Campylobacter 汚染を緩和するために,大規模言語モデル (LLM) ,特にGPT (Generative Pre-trained Transformer) の可能性について検討する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 06:30:45 GMT)
Efficient Neural Compression with Inference-time Decoding [0.0] 本稿では,Resnetsの圧縮境界を1ビットフロンティアを超えて押し上げるために,混合精度,ゼロ点量子化,エントロピー符号化を組み合わせたアプローチを提案する。
実装の観点からは、コンパクトデコーダアーキテクチャは遅延を低減し、推論互換のデコードを可能にする。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:07:13 GMT)
Efficient Large-Scale Many-Body Quantum Dynamics via Local-Information Time Evolution [0.0] 我々は最近導入された情報格子を用いて、異なるスケールに量子情報を整理する。
我々は、長距離量子相関を体系的に捨てるために使用する局所情報と情報電流を定義する。
混合フィールドIsingモデルにおけるエネルギー輸送と、オープンXXスピンチェーンにおける磁化輸送について述べる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:37:46 GMT)
EchoMamba4Rec: Harmonizing Bidirectional State Space Models with Spectral Filtering for Advanced Sequential Recommendation [0.0] 制御理論は、長期依存の管理に状態空間モデル(SSM)を使うことを強調している。
本研究では,EchoMamba4Recを紹介した。
EchoMambaは既存のモデルよりも優れており、より正確でパーソナライズされたレコメンデーションを提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 17:22:33 GMT)
Développement automatique de lexiques pour les concepts émergents : une exploration méthodologique [0.0] 本稿では,非技術革新を中心に,新しい概念を中心としたレキシコンの開発について述べる。
人間の専門知識、統計分析、機械学習技術を組み合わせた4段階の方法論を導入し、複数のドメインにまたがって一般化可能なモデルを確立する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:58:56 GMT)
Duality transformations and the entanglement entropy of gauge theories [0.0] スピンモデルの観点から二重記述を持つ格子ゲージ理論について検討する。
第一部では、ゲージ理論のレプリカ空間の構造を導出し、レプリカ幾何学における双対変換を行う。
第2部では、3次元の時空次元におけるZ$ゲージ理論のエントロピーc-函数であるモンテカルロシミュレーションを用いて計算する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:51:08 GMT)
Dispersive Qubit Readout with Intrinsic Resonator Reset [0.0] 本研究では、量子ビットを同時に測定し、読み出し共振器を初期状態に戻す超伝導量子ビットの分散測定法を実験的に示す。
また,四重項読み出しのための普遍パルス形状と実験結果も提示する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:23:54 GMT)
Digital assistant in a point of sales [0.0] 本稿では,VUI(Voice User Interface)を利用したディジタルアシスタントの小売環境での展開について検討する。
デジタルアシスタントを高トラフィックの小売環境に統合することにより、顧客サービスの質を向上させる効果を評価する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 13:20:33 GMT)
Differentiable Iterated Function Systems [0.0] 本稿では、微分可能なレンダリングパイプラインを用いたIFSフラクタルのレンダリングにおける初期探索について述べる。
IFSフラクタルを所定のターゲット画像に類似した固定点で生成することで、このパイプラインを実証する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:49:45 GMT)
Data Augmentation in Earth Observation: A Diffusion Model Approach [0.0] 高品質な地球観測(EO)画像の不足は重要な課題である。
AIで広く使われているデータ拡張は、データの量と多様性を高めるために採用されている。
本研究では,拡散モデルの統合による拡張データの多様性向上を目的とした,新しい4段階のアプローチを提案する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:33:47 GMT)
DKDL-Net: A Lightweight Bearing Fault Detection Model via Decoupled Knowledge Distillation and Low-Rank Adaptation Fine-tuning [0.0] 本稿では,これらの課題を解決するための軽量軸受故障診断モデルDKDL-Netを提案する。
このモデルは、知識蒸留と低階適応微調整を分離することにより、CWRUデータセットに基づいて訓練される。
実験により、DKDL-Netは、モデル性能を維持しながら、テストセットにおける計算複雑性の99.48%の精度を達成することが示された。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:09:08 GMT)
CountCLIP -- [Re] Teaching CLIP to Count to Ten [0.0] 本稿では,「10人へのCLIP教育」について検討する。
画像中のゼロショットカウント精度を向上させるために、CLIPモデルを微調整する方法を提供する。
より少ない計算資源でトレーニングデータの小さなサブセットでモデルの性能を向上させる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:09:37 GMT)
Compass: A Comprehensive Tool for Accurate and Efficient Molecular Docking in Inference and Fine-Tuning [0.0] PDBBindのようなドッキングデータセットにおけるノイズレベルに対する新しいアプローチを提案する。
ドッキング分子の実現可能性を評価するため,PoseCheckモジュールとAA-Scoreモジュールを統合した。
また,最新の分子ドッキング手法であるDiffDockを推論モードに組み込んで,効率的かつ正確な評価を行う。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 23:23:36 GMT)
Comparative Study of Quantum Transpilers: Evaluating the Performance of qiskit-braket-provider, qBraid-SDK, and Pytket Extensions [0.0] キースキット・ブラケット・プロジェクタは優れた性能を示し、破壊率は0.2%と極めて低い。
qBraid-SDKはより一般化されたアプローチを提供し、複数のSDK間でのトランスパイルに適している。
ピケット拡張は高速ではあるが、1対1のトランスパイル方式のために複雑な回路を扱う際の制限を示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:54:15 GMT)
Coherent States for infinite homogeneous waveguide arrays: Cauchy coherent states for $E(2)$ [0.0] ユークリッドE(2)対称性を持つ無限同質導波路アレイに対するペロモフコヒーレント状態が定義される。
ユークリアン E(2) 群のペレロモフコヒーレント状態は単純で自然な物理的実現を持つ。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 09:37:22 GMT)
Building Continuous Quantum-Classical Bayesian Neural Networks for a Classical Clinical Dataset [0.0] 本稿では,医学データセットの不確実性を考慮した分類を行う量子古典ベイズニューラルネットワーク(QCBNN)を提案する。
予測性能とモデルの不確実性の両方を捉える複数の行動メトリクスを追跡します。
より不確実な方法でサンプルを分類できるハイブリッドモデルを作ることは、私たちの野望です。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:23:25 GMT)
Bridging magic and non-Gaussian resources via Gottesman-Kitaev-Preskill encoding [0.0] 連続変数系における非安定化状態と非ガウス状態の基本的な関係を確立する。
符号化されたGKP状態に対する連続変数ウィグナー関数の負性は、マジック測度と一致することを示す。
また、安定化器 R'enyi エントロピーの連続変数表現も提供する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:09:45 GMT)
BrainChat: Decoding Semantic Information from fMRI using Vision-language Pretrained Models [0.0] 本稿では,脳活動からのセマンティック情報デコーディングタスクの高速化を目的とした生成フレームワークであるBrainChatを提案する。
BrainChatはfMRI質問応答とfMRIキャプションを実装している。
BrainChatは非常にフレキシブルで、画像データなしで高いパフォーマンスを実現できます。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:06:15 GMT)
Black carbon plumes from gas flaring in North Africa identified from multi-spectral imagery with deep learning [0.0] ブラックカーボン (BC) は、ガスフレアを含む多くの人間の活動によって放出される重要な汚染物質エアロゾルである。
以前の研究は、衛星画像から推定されるフレア体積に放射係数を適用することで、BCの排出量を間接的に定量化した。
そこで我々は,2022年に北アフリカ上空のSentinel-2画像に深層学習フレームワークを適用し,ガス火花からのBC排出を検出し定量化する。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 11:27:46 GMT)
Background resilient quantitative phase microscopy using entangled photons [0.0] 本稿では, 位相勾配を用いた量子ベースの定量的位相顕微鏡法を提案する。
画像分解能は2.76,mu$mで、位相精度は少なくともラムダ/30$で、位相感度は810,nmの波長でラムダ/100$であることを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:39:32 GMT)
BTS: Bridging Text and Sound Modalities for Metadata-Aided Respiratory Sound Classification [0.0] 音声サンプルのメタデータから派生した自由テキスト記述を用いて,事前学習したテキスト・オーディオ・マルチモーダルモデルを微調整する。
提案手法は,ICBHIデータセットの最先端性能を達成し,先行した最良値の1.17%を突破した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 20:49:54 GMT)
Applications and resource estimates for open system simulation on a quantum computer [0.0] 完全制御可能なオープンシステム量子シミュレータの応用について検討する。
具体的な計算問題を2つ紹介する。
安価な量子コンピュータシミュレーションを使用すれば、材料1つあたり200万ドルを節約できる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 14:00:53 GMT)
An Elliptic Kernel Unsupervised Autoencoder-Graph Convolutional Network Ensemble Model for Hyperspectral Unmixing [0.0] 本稿では,エンサンブルモデルワークフローであるAutoencoder Graph Ensemble Model (AEGEM)について述べる。
提案されたAEGEMは、Samson、Jasper、Urbanといったベンチマークデータセットで評価されている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:04:39 GMT)
Alignment and Optimisation of Optical Tweezers on Trapped Ions [0.0] 我々は、2.3(2),mu$mの最小のツイーザー腰を見つけるが、これは理論上の最小到達可能な腰の2.5(2),mu$mと一致する。
イオンに対する光力とコヒーレント集団トラップの効果について検討した。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 18:32:43 GMT)
Adaptive Interface-PINNs (AdaI-PINNs): An Efficient Physics-informed Neural Networks Framework for Interface Problems [0.0] AdaI-PINN(Adaptive Interface-PINN)と呼ばれる,効率的な物理情報ニューラルネットワーク(PINN)フレームワークを提案する。
このフレームワークは、前身であるInterface PINNまたはI-PINNの強化版である。
AdaI-PINNでは、アクティベーション機能は、ニューラルネットワークの他のパラメータとともにトレーニングされる斜面でのみ異なる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:28:15 GMT)
Accelerating Scientific Discovery with Generative Knowledge Extraction, Graph-Based Representation, and Multimodal Intelligent Graph Reasoning [0.0] 我々は1000の科学論文からなるデータセットを、オントロジ知識グラフに変換した。
我々はノード度を計算し、コミュニティと接続性を同定し、クラスタリング係数とピボットノード間の重心性を評価した。
グラフは本質的に無スケールの性質を持ち、高連結であり、グラフ推論に使用できる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 19:06:26 GMT)
Absence of a dissipative quantum phase transition in Josephson junctions: Theory [0.0] 比抵抗型ジョセフソン接合(RSJ)について検討する。
ジャンクションを絞ると超伝導が増すことがわかりました。
これらのシステムでは、紫外線抵抗の遮断が予期せぬ重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 15:26:46 GMT)
AI Consciousness is Inevitable: A Theoretical Computer Science Perspective [0.0] 我々は意識のための正式な機械モデルを開発する。
このモデルはアラン・チューリングの単純だが強力な計算モデルとバーナード・ベアーズの意識の劇場モデルにインスパイアされている。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:29:49 GMT)
A unified diagrammatic approach to quantum transport in few-level junctions for bosonic and fermionic reservoirs: Application to the quantum Rabi model [0.0] 本研究では, ボーソニック, フェルミオン系貯留層に結合した汎用多層接合部における定常輸送について検討した。
非自明な輸送特徴は、クビットオシレータの変形と結合強度の相互作用の結果現れる。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 10:18:08 GMT)
A local squared Wasserstein-2 method for efficient reconstruction of models with uncertainty [0.0] 本稿では,不確定な潜伏変数やパラメータを持つモデル再構成の逆問題を解決するために,局所二乗ワッサースタイン-2(W_2)法を提案する。
このアプローチの重要な利点は、下位モデルにおける潜伏変数やパラメータの分布に関する事前情報を必要としないことである。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 22:15:55 GMT)
A Note on Vectorial Boolean Functions as Embeddings [0.0] 我々は、$F$の少なくとも2M~2M-n$のコンポーネントはバランスが取れており、この最大値は、$F$が埋め込みであるときに正確に達成されることを示す。
二次埋め込みでは、$n$が偶数であるとき、少なくとも2n − 1$のバランス成分が、$n$が奇数であるとき、$m-1 + 2n-1 - 1$のバランス成分が常に存在することを示す。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:23:04 GMT)
A Large-Scale Exploration of $μ$-Transfer [0.0] この$mu$-ization(mu$P)は、ニューラルネットワークモデルをスケールする際の課題に対する潜在的な解決策を提供する。
明らかな約束にもかかわらず、$mu$P メソッドはまだ広く採用されていない。
この研究は、$mu$Pを実証的に調査し、単純な質問に答えることを目的としている:$mu$-Transferは、実際に最適な学習率を得られるか?
論文参考訳(メタデータ) (Mon, 10 Jun 2024 05:19:55 GMT)
A Large Language Model Pipeline for Breast Cancer Oncology [0.0] 最先端のOpenAIモデルは、2つの重要ながん治療因子に対する臨床データセットと臨床ガイドラインテキストコーパスに基づいて微調整された。
乳癌に対するアジュバント放射線療法と化学療法の分類において高い精度(0.85+)が得られた。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 16:44:48 GMT)
"I'd Like to Have an Argument, Please": Argumentative Reasoning in Large Language Models [0.0] 議論的推論を行う2つの大規模言語モデル(LLM)の性能を評価する。
AM と APE では LLM のスコアが SOTA に匹敵するか上回っていることがわかった。
しかしながら、LLMの統計的解析は、小さいが、まだ可読である場合、I/O表現の変化は、モデルが推論を実行していないことを示している。
論文参考訳(メタデータ) (Mon, 10 Jun 2024 12:39:29 GMT)