MMWorld: Towards Multi-discipline Multi-faceted World Model Evaluation in Videos [155.5] MMWorldは,複数分野のマルチモードビデオ理解のための新しいベンチマークである。
MMWorldは、ビデオ全体に関する質問を伴うMLLMを評価する人間アノテーション付きデータセットと、知覚の単一モード内でMLLMを分析する合成データセットで構成されている。
この評価には2つのプロプライエタリなMLLMと10のオープンソースMLLMが含まれており、MMWorldと競合している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:54:54 GMT)
ConceptHash: Interpretable Fine-Grained Hashing via Concept Discovery [128.3] ConceptHashは、サブコードレベルの解釈性を実現する新しい方法である。
ConceptHashでは、各サブコードは、オブジェクト部分のような人間の理解可能な概念に対応する。
学習したハッシュコードが、きめ細かいオブジェクトクラス内で識別可能であることを保証するために、言語ガイダンスを組み込んだ。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:49:26 GMT)
Unsupervised Information Refinement Training of Large Language Models for Retrieval-Augmented Generation [128.0] InFO-RAG という情報改質訓練手法を提案する。
InFO-RAGは低コストで、様々なタスクにまたがっている。
LLaMA2の性能を平均9.39%向上させる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:21:15 GMT)
OmniCorpus: An Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text [114.0] 我々は100億規模の画像テキストインターリーブデータセットであるOmniCorpusを紹介する。
私たちのデータセットは、優れたデータ品質を維持しながら、15倍のスケールを持っています。
これが将来のマルチモーダルモデル研究に確かなデータ基盤を提供することを期待しています。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:01:04 GMT)
ML-SUPERB 2.0: Benchmarking Multilingual Speech Models Across Modeling Constraints, Languages, and Datasets [106.8] 本稿では、事前訓練されたSSLと教師付き音声モデルを評価するための新しいベンチマークであるML-SUPERB2.0を提案する。
ML-SUPERBのセットアップよりも性能が向上するが、性能は下流モデル設計に依存している。
また、言語とデータセットのパフォーマンスに大きな違いがあることから、よりターゲットを絞ったアプローチの必要性も示唆されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:01:26 GMT)
Semi-Supervised Spoken Language Glossification [101.3] Spoken Language glossification (SLG) は、音声言語のテキストを手話のグロスに変換することを目的としている。
我々はSLGに$S$emi-$S$upervised$S$poken$L$anguage$G$lossification$S3$LGというフレームワークを提示する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:05:27 GMT)
VALL-E R: Robust and Efficient Zero-Shot Text-to-Speech Synthesis via Monotonic Alignment [101.2] VALL-E Rは、堅牢で効率的なゼロショットテキスト音声合成システムである。
この研究は、失語症に罹患した人々のためのスピーチの作成を含む有意義なプロジェクトに適用される可能性がある。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:09:44 GMT)
Defending Large Language Models Against Jailbreaking Attacks Through Goal Prioritization [98.2] 本研究は,学習段階と推論段階の両方において,目標の優先順位付けを統合することで,支援と安全性の確保という目標との本質的な対立に対処することを提案する。
我々の研究は、脱獄攻撃と防衛の理解に寄与し、LLMの能力と安全性の関係に光を当てている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:28:15 GMT)
TC-Bench: Benchmarking Temporal Compositionality in Text-to-Video and Image-to-Video Generation [98.0] 生成したビデオは、新しい概念の出現と、時間経過とともに現実の動画のようにそれらの関係の遷移を取り入れるべきである、と我々は主張する。
ビデオ生成モデルの時間構成性を評価するため,細部まで作り上げたテキストプロンプトのベンチマークであるTC-Benchと,それに対応する地上の真理ビデオ,ロバストな評価指標を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:41:32 GMT)
Large Language Models Must Be Taught to Know What They Don't Know [97.9] 正解と誤解の小さなデータセットを微調整すると、高い一般化と計算オーバーヘッドの少ない不確実性推定が得られることを示す。
また,確実な不確実性推定を可能にする機構についても検討し,多くのモデルを汎用的不確実性推定器として利用することができることを示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:41:31 GMT)
Valeo4Cast: A Modular Approach to End-to-End Forecasting [93.9] 検出、追跡、予測モジュールを個別に構築し、トレーニングします。
その後、モジュールをよりよく統合し、複雑なエラーを軽減するために、連続的な微調整ステップのみを使用します。
私たちのソリューションは、CVPR 2024 Workshop on Autonomous Drivingで開催されるArgoverse 2 end-to-end Forecasting Challengeで第1位です。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:50:51 GMT)
Diffusion Soup: Model Merging for Text-to-Image Diffusion Models [90.0] シャードデータに基づいてトレーニングされた拡散モデルの重みを平均化する,テキスト・ツー・イメージ・ジェネレーションの複合化手法であるDiffusion Soupを提案する。
提案手法は,構築により,追加記憶や推論コストを伴わずに,無学習の連続学習とアンラーニングを可能にする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:16:16 GMT)
VisionLLM v2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks [89.2] VisionLLM v2は、エンドツーエンドの汎用マルチモーダル大モデル(MLLM)である。
単一のフレームワーク内で視覚的知覚、理解、生成を統一する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:44:50 GMT)
Scaling Laws in Linear Regression: Compute, Parameters, and Data [86.5] 無限次元線形回帰セットアップにおけるスケーリング法則の理論について検討する。
テストエラーの再現可能な部分は$Theta(-(a-1) + N-(a-1)/a)$であることを示す。
我々の理論は経験的ニューラルスケーリング法則と一致し、数値シミュレーションによって検証される。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:53:29 GMT)
TasTe: Teaching Large Language Models to Translate through Self-Reflection [82.8] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な性能を示した。
本稿では,自己回帰を通した翻訳を行うTasTeフレームワークを提案する。
WMT22ベンチマークにおける4つの言語方向の評価結果から,既存の手法と比較して,提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:21:21 GMT)
MobileAIBench: Benchmarking LLMs and LMMs for On-Device Use Cases [81.7] モバイル端末上でのLarge Language Models(LLM)とLarge Multimodal Models(LMM)を評価するためのベンチマークフレームワークであるMobileAIBenchを紹介する。
MobileAIBenchは、さまざまなサイズ、量子化レベル、タスクにわたるモデルを評価し、実際のデバイス上でのレイテンシとリソース消費を測定する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 22:58:12 GMT)
Decoupling the Class Label and the Target Concept in Machine Unlearning [81.7] 機械学習の目的は、トレーニングデータの一部を除外した再トレーニングされたモデルを近似するために、トレーニングされたモデルを調整することだ。
過去の研究では、クラスワイド・アンラーニングが対象クラスの知識を忘れることに成功していることが示された。
我々は、TARget-aware Forgetting (TARF) という一般的なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:53:30 GMT)
RLHF Workflow: From Reward Modeling to Online RLHF [79.8] 本稿では,RLHF(Online Iterative Reinforcement Learning from Human Feedback)のワークフローについて報告する。
RLHFは、最近の大規模言語モデル(LLM)文学において、オフライン言語よりもはるかに優れていると広く報告されている。
教師付き微調整(SFT)と反復RLHFは,完全なオープンソースデータセットを用いて最先端の性能を得ることができることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:40:53 GMT)
Towards Realistic Data Generation for Real-World Super-Resolution [79.2] RealDGenは、現実世界の超解像のために設計された教師なし学習データ生成フレームワークである。
我々は,コンテンツ分解脱結合拡散モデルに統合されたコンテンツと劣化抽出戦略を開発する。
実験により、RealDGenは、現実世界の劣化を反映する大規模で高品質なペアデータを生成するのに優れていることが示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:04:20 GMT)
Language Models As Semantic Indexers [78.8] 本稿では,ジェネレーティブ言語モデルを用いてセマンティックIDを学習するための自己教師型フレームワークLMIndexerを紹介する。
学習したIDの質を検証し,推奨,製品検索,文書検索の3つの課題において有効性を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:36:22 GMT)
Flash-VStream: Memory-Based Real-Time Understanding for Long Video Streams [78.7] 人間の記憶機構をシミュレートしたビデオ言語モデルFlash-VStreamを提案する。
既存のモデルと比較して、Flash-VStreamは遅延推論とVRAM消費の大幅な削減を実現している。
本稿では,オンライン動画ストリーミング理解に特化して設計された質問応答ベンチマークであるVStream-QAを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:07:55 GMT)
Get More with LESS: Synthesizing Recurrence with KV Cache Compression for Efficient LLM Inference [78.7] 我々はキー値(KV)キャッシュによって課されるメモリボトルネックに焦点を当てる。
既存のKVキャッシュ手法は、比較的重要でないKVペアの大きなスワストを刈り取ったり、取り除いたりすることでこの問題に対処する。
本稿では,固定サイズキャッシュと退避型キャッシュを簡易に統合したLESSを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:08:58 GMT)
Enhancing End-to-End Autonomous Driving with Latent World Model [78.2] コストのかかるラベルを必要とせずにエンドツーエンドの運転を改善するための,新しい自己管理手法を提案する。
フレームワーク textbfLAW は LAtent World モデルを用いて,予測エゴアクションと現在のフレームの潜在機能に基づいて,今後の潜在機能を予測する。
その結果,オープンループベンチマークとクローズループベンチマークの両方において,コストのかかるアノテーションを使わずに最先端のパフォーマンスを実現することができた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:59:21 GMT)
Auto Arena of LLMs: Automating LLM Evaluations with Agent Peer-battles and Committee Discussions [77.8] LLM エージェントによる評価プロセス全体を自動化した LLM の自動アリーナを提案する。
最新のLLM17実験において,オートアリーナは人間の嗜好と最も高い相関関係を示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:53:49 GMT)
Follow-Your-Pose v2: Multiple-Condition Guided Character Image Animation for Stable Pose Control [77.1] Follow-Your-Pose v2は、インターネットで簡単に利用できるノイズの多いオープンソースビデオでトレーニングすることができる。
われわれの手法は、2つのデータセットと7つのメトリクスで35%以上のマージンで最先端の手法より優れています。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:38:23 GMT)
Vivid-ZOO: Multi-View Video Generation with Diffusion Model [77.0] 新しい課題は、大量のキャプション付きマルチビュービデオの欠如と、そのような多次元分布をモデル化する複雑さにある。
本稿では,テキストから動的3Dオブジェクトを中心に,高品質なマルチビュービデオを生成する拡散型パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:44:04 GMT)
ML-Bench: Evaluating Large Language Models and Agents for Machine Learning Tasks on Repository-Level Code [76.8] ML-Benchは、既存のコードリポジトリを利用してタスクを実行する現実世界のプログラミングアプリケーションに根ざしたベンチマークである。
長いコードコンテキストを解釈し、命令を正確に実行可能なスクリプトに変換するLLMの必要性に対処する。
LLMとAIエージェントの両方を評価するために、事前に定義されたデプロイメント環境でLLMのテキスト-コード変換を評価するML-LLM-Benchと、Linuxサンドボックス環境でエンドツーエンドのタスク実行で自律エージェントをテストするML-Agent-Benchの2つの設定が採用されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:31:57 GMT)
ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.9] ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:25:15 GMT)
Local Methods with Adaptivity via Scaling [71.1] 本稿では,局所的な学習手法と適応的アプローチを融合して,効率的な分散学習手法を開発することを目的とする。
従来のローカルSGD法について検討し,スケーリング機能により拡張する。
理論的解析に加えて,ニューラルネットワークのトレーニングにより,本手法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:21:23 GMT)
Outdoor Scene Extrapolation with Hierarchical Generative Cellular Automata [70.9] 我々は,自律走行車(AV)で多量に捕獲された大規模LiDARスキャンから微細な3次元形状を生成することを目指している。
本稿では,空間的にスケーラブルな3次元生成モデルである階層型生成セルオートマトン (hGCA) を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:56:56 GMT)
Near-Optimal Learning and Planning in Separated Latent MDPs [70.9] 我々は、潜在マルコフ決定過程(LMDP)の計算的および統計的側面について研究する。
このモデルでは、学習者は、未知のMDPの混合から各エポックの開始時に描画されたMDPと相互作用する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:41:47 GMT)
DemosaicFormer: Coarse-to-Fine Demosaicing Network for HybridEVS Camera [70.3] Hybrid Event-Based Vision Sensor (HybridEVS)は、従来のフレームベースとイベントベースのセンサーを統合する新しいセンサーである。
その可能性にもかかわらず、ハイブリッドEVS用に特別に設計された画像信号処理(ISP)パイプラインの欠如は大きな課題である。
粗大な復調と画素補正を含む,粗大で微細なフレームワークであるDemosaicFormerを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:20:46 GMT)
An Empirical Study of Mamba-based Language Models [69.7] Mambaのような選択的な状態空間モデル(SSM)はトランスフォーマーの欠点を克服する。
同じデータセット上で訓練された8B-context Mamba, Mamba-2, Transformer モデルを直接比較する。
8BのMamba-2-Hybridは、12の標準タスクで8BのTransformerを上回っている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:25:15 GMT)
Large Language Models Meet Text-Centric Multimodal Sentiment Analysis: A Survey [67.8] ChatGPTは、テキスト中心のマルチモーダルタスクに大規模言語モデル(LLM)を適用する大きな可能性を開く。
既存のLLMがテキスト中心のマルチモーダル感情分析タスクにどのように適応できるかは、まだ不明である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:36:27 GMT)
Selective "Selective Prediction": Reducing Unnecessary Abstention in Vision-Language Reasoning [67.8] 本稿では,選択型視覚言語システムの過剰保持を低減するための推論時アルゴリズムReCoVERRを紹介する。
ReCoVERRは、予測のための追加の証拠を提供する画像の中に、関連する手がかりを見つけようとする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:09:39 GMT)
Predicting Cascading Failures with a Hyperparametric Diffusion Model [66.9] 拡散モデルのレンズによる電力グリッドのカスケード故障について検討する。
我々のモデルは、バイラル拡散原理と物理に基づく概念を統合する。
この拡散モデルはカスケード故障の痕跡から学習可能であることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:34:24 GMT)
Grounding Multimodal Large Language Models in Actions [65.9] 我々はMLLMを異なる実施形態とその関連する行動空間にベストグラウンドする方法について研究する。
連続的な動作に対しては、学習されたトークン化が十分なモデリング精度を実現することが示される。
離散的な動作に対して、これらの動作をMLLMのネイティブな出力トークン空間と意味的に整合させることが、最も高いパフォーマンスをもたらすことを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:12:04 GMT)
Supportiveness-based Knowledge Rewriting for Retrieval-augmented Language Modeling [65.7] 支援性に基づく知識書き換え(SKR)は、LLM生成に本質的に最適化された堅牢でプラガブルな知識書き換えである。
知識支援に基づき、まず、リライターモデルのためのトレーニングデータキュレーション戦略を設計する。
次に、生成したリライトを最適な支持度に調整するために、直接選好最適化(DPO)アルゴリズムを導入する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:52:35 GMT)
Tell Me What's Next: Textual Foresight for Generic UI Representations [65.1] We propose Textual Foresight, a novel pretraining objective for learn UI screen representations。
Textual Foresightは、現在のUIとローカルアクションを考慮すれば、将来のUI状態のグローバルなテキスト記述を生成する。
新たに構築したモバイルアプリデータセットであるOpenAppでトレーニングを行い、アプリUI表現学習のための最初の公開データセットを作成しました。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:43:19 GMT)
OLMES: A Standard for Language Model Evaluations [64.9] 再現可能な言語モデル評価のための実用的でオープンな標準であるOLMESを提案する。
我々は,コミュニティが採用する評価実践において,様々な要因を特定し,検討する。
OLMESは、複数の質問の非自然な「閉じた」定式化を必要とする小さなベースモデル間の有意義な比較をサポートする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:37:09 GMT)
A Dialogue Game for Eliciting Balanced Collaboration [64.6] 本稿では、プレイヤーがゴール状態自体を交渉しなければならない2Dオブジェクト配置ゲームを提案する。
我々は,人間プレイヤーが様々な役割を担っていることを実証的に示し,バランスの取れた協調によってタスクのパフォーマンスが向上することを示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:35:10 GMT)
Dataset and Lessons Learned from the 2024 SaTML LLM Capture-the-Flag Competition [64.0] 大規模言語モデルシステムは、悪意あるメッセージから重要なセキュリティリスクに直面している。
この問題を調査するため、IEEE SaTML 2024でキャプチャー・ザ・フラッグ・コンペティションを開催した。
このレポートは、競争の主な洞察を要約している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:27:28 GMT)
GUI Odyssey: A Comprehensive Dataset for Cross-App GUI Navigation on Mobile Devices [61.5] GUI Odysseyは6つのモバイルデバイスから7,735エピソードで構成され、6種類のクロスアプリタスク、201のアプリ、1.4Kのアプリコンボで構成されている。
履歴再サンプリングモジュールを用いたQwen-VLモデルの微調整により,マルチモーダルなクロスアプリナビゲーションエージェントであるOdysseyAgentを開発した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:44:26 GMT)
Pandora: Towards General World Model with Natural Language Actions and Video States [61.3] Pandoraは、ビデオを生成して世界状態をシミュレートし、自由テキストアクションによるリアルタイム制御を可能にするハイブリッド自動回帰拡散モデルである。
Pandoraは、大規模な事前トレーニングと命令チューニングを通じて、ドメインの汎用性、ビデオの一貫性、制御性を実現する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:55:51 GMT)
ApproxED: Approximate exploitability descent via learned best responses [61.2] 連続的なアクションセットを持つゲームの近似的ナッシュ均衡を求める問題について検討する。
本稿では,戦略プロファイルに対するエクスプロイラビリティの近似を最小化する2つの新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 22:39:58 GMT)
AlphaZeroES: Direct score maximization outperforms planning loss minimization [61.2] 実行時の計画では、シングルエージェントとマルチエージェントの両方の設定でエージェントのパフォーマンスが劇的に向上することが示されている。
実行時に計画するアプローチのファミリは、AlphaZeroとその変種で、Monte Carlo Tree Searchと、状態値とアクション確率を予測することによって検索をガイドするニューラルネットワークを使用する。
複数の環境にまたがって、エピソードスコアを直接最大化し、計画損失を最小限に抑えることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 23:00:59 GMT)
CoLM-DSR: Leveraging Neural Codec Language Modeling for Multi-Modal Dysarthric Speech Reconstruction [61.1] 変形性音声再建(DSR)は、変形性音声を正常な音声に変換することを目的としている。
話者の類似度は低く、プロソディの自然度は低い。
本稿では、ニューラルネットワークモデリングを利用して再構成結果を改善するマルチモーダルDSRモデルを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:42:21 GMT)
Short-Long Convolutions Help Hardware-Efficient Linear Attention to Focus on Long Sequences [60.5] 本稿では,状態空間モデルを短時間の畳み込みに置き換えたCHELAを提案する。
提案手法の有効性を示すために,Long Range Arenaベンチマークと言語モデリングタスクについて実験を行った。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:12:38 GMT)
SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion [60.0] 時系列予測は、金融、交通管理、エネルギー、医療など様々な分野で重要な役割を果たしている。
いくつかの方法は、注意やミキサーのようなメカニズムを利用して、チャネル相関をキャプチャすることでこの問題に対処する。
本稿では,効率的なモデルであるSOFTS(Series-cOre Fused Time Series forecaster)を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:01:19 GMT)
From a Social Cognitive Perspective: Context-aware Visual Social Relationship Recognition [59.6] 我々は,textbfContextual textbfSocial textbfRelationships (textbfConSoR) を社会的認知の観点から認識する新しいアプローチを提案する。
画像ごとの社会的関係を考慮した社会認識記述言語プロンプトを構築した。
印象的なことに、ConSoRは従来の手法を上回り、Person-in-Social-Context(PISC)データセットでは12.2%、Person-in-Photo-Album(PIPA)ベンチマークでは9.8%向上している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:02:28 GMT)
On Evaluating Adversarial Robustness of Volumetric Medical Segmentation Models [59.5] 体積医学セグメンテーションモデルは、臓器および腫瘍ベースのセグメンテーションタスクにおいて大きな成功を収めた。
敵の攻撃に対するその脆弱性はほとんど解明されていない。
このことは、既存のモデルの堅牢性を調べることの重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:59:42 GMT)
Diffusion Model with Cross Attention as an Inductive Bias for Disentanglement [59.0] 遠方表現学習は、観測データ内の本質的要因を抽出する試みである。
我々は新しい視点と枠組みを導入し、クロスアテンションを持つ拡散モデルが強力な帰納バイアスとなることを示す。
これは、複雑な設計を必要とせず、クロスアテンションを持つ拡散モデルの強力な解離能力を明らかにする最初の研究である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:20:36 GMT)
Words Worth a Thousand Pictures: Measuring and Understanding Perceptual Variability in Text-to-Image Generation [58.8] 拡散モデル(diffusion model)は、テキスト・画像生成における技術の現状であるが、その知覚的多様性はまだ検討されていない。
W1KPは、既存の画像対知覚距離からブートストラップした画像の集合における可変性の人間の校正尺度である。
私たちの最高の知覚距離は、9つの基準線を最大18ポイント精度で上回り、キャリブレーションは人間の判断と78%の時間で一致します。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:59:27 GMT)
CREMA: Generalizable and Efficient Video-Language Reasoning via Multimodal Modular Fusion [58.2] CREMAは、ビデオ推論のための一般化可能、高効率、モジュラリティ融合フレームワークである。
本稿では,軽量核融合モジュールとモーダリティ・シークエンシャル・トレーニング・ストラテジーによって支援された,新しいプログレッシブ・マルチモーダル・フュージョン設計を提案する。
ビデオQA や Video-Audio/3D/Touch/Thermal QA を含む7つのビデオ言語推論タスクについて検証を行った。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:03:33 GMT)
MMIL: A novel algorithm for disease associated cell type discovery [58.0] 単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:22:56 GMT)
Leveraging Large Language Models for NLG Evaluation: Advances and Challenges [57.9] 大規模言語モデル(LLM)は、コヒーレンス、クリエイティビティ、コンテキスト関連など、生成されたコンテンツ品質を評価するための新たな道を開いた。
既存のLCMに基づく評価指標を整理し、これらの手法を理解し比較するための構造化された枠組みを提供する。
本稿では, 偏見, 堅牢性, ドメイン固有性, 統一評価などの未解決課題を議論することによって, 研究者に洞察を提供し, より公平で高度なNLG評価手法を提唱することを目的とする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:31:58 GMT)
Towards Unsupervised Speech Recognition Without Pronunciation Models [57.2] ほとんどの言語では、音声認識システムを効果的に訓練するのに十分なペア音声とテキストデータがない。
本稿では、教師なしASRシステムを開発するために、音素レキシコンへの依存を除去することを提案する。
音声合成とテキスト・テキスト・マスクによるトークン埋込から教師なし音声認識が実現可能であることを実験的に実証した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:30:58 GMT)
DPIC: Decoupling Prompt and Intrinsic Characteristics for LLM Generated Text Detection [56.5] 大規模言語モデル(LLM)は、盗作、eコマースプラットフォームへの偽レビューの設置、炎症性偽ツイートなどの誤用のリスクを引き起こすテキストを生成することができる。
既存の高品質な検出手法では、本質的な特徴を抽出するために、モデルの内部にアクセスする必要がある。
ブラックボックスモデル生成テキストの深い内在特性を抽出する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:37:35 GMT)
Interlinking User Stories and GUI Prototyping: A Semi-Automatic LLM-based Approach [55.8] グラフィカルユーザインタフェース(GUI)のプロトタイプにおいて,機能的NLベースの要求の実装を検証するための新しい言語モデル(LLM)ベースのアプローチを提案する。
提案手法は,GUIプロトタイプに実装されていない機能的ユーザストーリの検出と,要件を直接実装する適切なGUIコンポーネントのレコメンデーションを提供することを目的としている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:59:26 GMT)
ConMe: Rethinking Evaluation of Compositional Reasoning for Modern VLMs [55.3] 構成推論(CR)は属性、関係、単語の順序の重要さを把握する。
近年の視覚言語モデル (VLM) は、そのような推論タスクにおいて顕著な習熟性を示している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:54:27 GMT)
Carbon Market Simulation with Adaptive Mechanism Design [55.3] 炭素市場(英: carbon market)は、個人の利益をグローバルユーティリティーと整合させる経済エージェントにインセンティブを与える、市場ベースのツールである。
炭素市場のダイナミクスの複雑さは、正確なシミュレーションを難しくする。
階層型モデルフリーマルチエージェント強化学習を用いて市場をシミュレートする適応機構設計フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:08:51 GMT)
Arbitrary-Length Generalization for Addition in a Tiny Transformer [55.2] 本稿では,トランスフォーマーモデルを用いて,未知の桁数に対する2桁数の追加を一般化する学習手法を提案する。
提案手法では, 右から左へ処理を行う自己回帰生成手法を用いて, 多数の値を追加するための共通手動手法を模倣する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:40:35 GMT)
Let's Go Real Talk: Spoken Dialogue Model for Face-to-Face Conversation [55.0] 本稿では,新しい対面音声対話モデルを提案する。
ユーザ入力から音声視覚音声を処理し、応答として音声視覚音声を生成する。
また,最初の大規模マルチモーダル音声対話コーパスであるMultiDialogを紹介する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:48:36 GMT)
DDR: Exploiting Deep Degradation Response as Flexible Image Descriptor [54.9] 本稿では, 劣化条件の異なる画像深部特徴の変化を定量化するDDRについて述べる。
画像記述子としてのDDRの汎用性は,キー画像属性と強い相関関係がみられた。
DDRは、画像復元作業において効果的な教師なし学習目標として機能し、画像の劣化と単一画像の超解像において顕著な進歩をもたらす。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:26:56 GMT)
Babel-ImageNet: Massively Multilingual Evaluation of Vision-and-Language Representations [53.9] Babel-ImageNetは,100言語へのイメージネットラベルの部分的翻訳を提供する,多言語ベンチマークである。
我々は,11の公開多言語CLIPモデルをベンチマークで評価し,イングリッシュイメージネットの性能と高ソース言語との差を顕著に示した。
パラメータ効率のよい言語特化学習を行う低リソース言語に対して,多言語CLIPの性能を劇的に向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:33:29 GMT)
Autobidders with Budget and ROI Constraints: Efficiency, Regret, and Pacing Dynamics [53.6] オンライン広告プラットフォームで競合するオートバイディングアルゴリズムのゲームについて検討する。
本稿では,全ての制約を満たすことを保証し,個人の後悔を解消する勾配に基づく学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:18:07 GMT)
Mimicking User Data: On Mitigating Fine-Tuning Risks in Closed Large Language Models [53.5] 小さなデータセット上の微調整された大きな言語モデルは、特定の下流タスクのパフォーマンスを向上させることができる。
悪意のあるアクターは、ほぼすべてのタスク固有のデータセットの構造を微妙に操作することで、より危険なモデル行動を促進することができる。
本稿では,タスク形式を模倣した安全データとユーザデータのスタイルを混合した新しい緩和戦略を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:33:11 GMT)
Interpetable Target-Feature Aggregation for Multi-Task Learning based on Bias-Variance Analysis [53.4] マルチタスク学習(MTL)は、タスク間の共有知識を活用し、一般化とパフォーマンスを改善するために設計された強力な機械学習パラダイムである。
本稿では,タスククラスタリングと特徴変換の交点におけるMTL手法を提案する。
両段階において、鍵となる側面は減った目標と特徴の解釈可能性を維持することである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:30:16 GMT)
Optimized Feature Generation for Tabular Data via LLMs with Decision Tree Reasoning [53.2] 大規模言語モデル(LLM)と決定木推論(OCTree)に基づく新しいフレームワークを提案する。
私たちのキーとなるアイデアは、LLMの推論機能を活用して、手動で検索スペースを指定せずに優れた特徴生成ルールを見つけることです。
実験の結果、この単純なフレームワークは様々な予測モデルの性能を一貫して向上させることが示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:31:34 GMT)
A Concept-Based Explainability Framework for Large Multimodal Models [52.4] 本稿では,トークン表現に適用した辞書学習に基づくアプローチを提案する。
これらの概念は、視覚とテキストの両方に意味論的に根ざしていることを示す。
抽出したマルチモーダル概念は,テストサンプルの表現の解釈に有用であることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:48:53 GMT)
CFG++: Manifold-constrained Classifier Free Guidance for Diffusion Models [52.3] CFG++は、従来のCFG固有のオフマニフォールドな課題に取り組む新しいアプローチである。
テキスト・ツー・イメージ生成のサンプル品質の向上、可逆性、ガイダンスの縮小、モード崩壊の削減など、大幅な改善が加えられている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:40:10 GMT)
LEAP-VO: Long-term Effective Any Point Tracking for Visual Odometry [52.1] 本稿では,LEAP(Long-term Effective Any Point Tracking)モジュールについて述べる。
LEAPは、動的トラック推定のために、視覚的、トラック間、時間的キューと慎重に選択されたアンカーを革新的に組み合わせている。
これらの特徴に基づき,強靭な視力計測システムLEAP-VOを開発した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:36:12 GMT)
Self-Supervised Speech Representations are More Phonetic than Semantic [52.0] 自己教師付き音声モデル(S3Ms)は、音声応用の有効なバックボーンとなっている。
S3Msで符号化された単語レベルの言語特性のよりきめ細かい分析を求める。
本研究により,S3M表現は意味的類似性よりも連続的かつ顕著に音声的類似性を示すことが明らかとなった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:04:44 GMT)
Improving LLMs for Recommendation with Out-Of-Vocabulary Tokens [51.6] 本稿では,Large Language Models (LLMs) ベースのレコメンデータシステムにおいて,ユーザや項目を効果的にトークンする方法を示す。
語彙内トークンに加えて、語彙外トークン(OOV)の役割も強調する。
提案するフレームワークは,様々なダウンストリームレコメンデーションタスクにおいて,既存の最先端メソッドよりも優れている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:59:05 GMT)
Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning [51.5] 本稿では,HOP(Hierarchical Opponent Modeling and Planning)を提案する。
HOPは階層的に2つのモジュールから構成される: 相手の目標を推論し、対応する目標条件のポリシーを学ぶ、反対モデリングモジュール。
HOPは、さまざまな未確認エージェントと相互作用する際、優れた少数ショット適応能力を示し、セルフプレイのシナリオで優れている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:48:06 GMT)
Hierarchical Features Matter: A Deep Exploration of GAN Priors for Improved Dataset Distillation [51.4] 階層的生成潜在蒸留(H-GLaD)と呼ばれる新しいパラメータ化法を提案する。
本手法はGAN内の階層層を系統的に探索する。
さらに,合成データセット評価に伴う計算負担を軽減するために,新しいクラス関連特徴距離尺度を導入する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:11:07 GMT)
Discovering Preference Optimization Algorithms with and for Large Language Models [50.8] オフライン優先最適化は、LLM(Large Language Model)出力の品質を向上・制御するための重要な手法である。
我々は、人間の介入なしに、新しい最先端の選好最適化アルゴリズムを自動で発見する客観的発見を行う。
実験は、ロジスティックと指数的損失を適応的にブレンドする新しいアルゴリズムであるDiscoPOPの最先端性能を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:58:41 GMT)
Behind the Magic, MERLIM: Multi-modal Evaluation Benchmark for Large Image-Language Models [50.7] 本稿では,IT-LVLMの基本的なコンピュータビジョンタスクにおける能力を評価するために,スケーラブルなテストベッドを提案する。
MERLIMには300K以上の画像検索ペアが含まれており、IT-LVLMにおけるクロスモーダルな"ハロシン化"イベントの検出に重点を置いている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:59:55 GMT)
Hierarchical Patch Diffusion Models for High-Resolution Video Generation [50.4] 我々は,階層的な方法で,コンテキスト情報を低スケールから高スケールのパッチに伝播する深層文脈融合を開発する。
また,ネットワーク容量の増大と,粗い画像の細部への演算を行う適応計算を提案する。
得られたモデルは、クラス条件のビデオ生成において66.32の最先端FVDスコアと87.68のインセプションスコアを新たに設定する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:12:53 GMT)
Large Language Models for Automated Open-domain Scientific Hypotheses Discovery [50.4] 本研究は,社会科学の学術的仮説発見のための最初のデータセットを提案する。
従来のデータセットとは異なり、新しいデータセットには、(1)オープンドメインデータ(RAW Webコーパス)を観察として使用すること、(2)人間性にさらに新しい仮説を提案することが必要である。
パフォーマンス向上のための3つのフィードバック機構を含む,タスクのためのマルチモジュールフレームワークが開発されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:40:15 GMT)
Real-world Image Dehazing with Coherence-based Label Generator and Cooperative Unfolding Network [50.3] 実世界のイメージデハジングは、実世界の設定におけるヘイズによる劣化を軽減することを目的としている。
本研究では,大気散乱と画像シーンを協調的にモデル化する,協調的展開ネットワークを提案する。
また,コヒーレンスに基づくラベルジェネレータと呼ばれるRID指向の反復型平均教師フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:44:22 GMT)
Multi-Teacher Multi-Objective Meta-Learning for Zero-Shot Hyperspectral Band Selection [50.3] ゼロショットハイパースペクトル帯選択のための新しい多目的メタラーニングネットワーク(M$3$BS)を提案する。
M$3$BSでは、データセットに依存しないベースを生成するために、一般化可能なグラフ畳み込みネットワーク(GCN)を構築している。
取得したメタ知識は、トレーニングや微調整なしに、直接見えないデータセットに転送することができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:13:31 GMT)
Graph Transductive Defense: a Two-Stage Defense for Graph Membership Inference Attacks [50.2] グラフニューラルネットワーク(GNN)は、さまざまな現実世界のアプリケーションにおいて、強力なグラフ学習機能を提供する。
GNNは、メンバーシップ推論攻撃(MIA)を含む敵攻撃に対して脆弱である
本稿では,グラフトランスダクティブ学習特性に合わせて,グラフトランスダクティブ・ディフェンス(GTD)を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:36:37 GMT)
Better than Random: Reliable NLG Human Evaluation with Constrained Active Sampling [50.1] 信頼性の高い人的判断のための制約付きアクティブサンプリングフレームワーク(CASF)を提案する。
実験の結果、CASFは93.18%のシステム認識精度が得られた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:44:36 GMT)
Understanding Sounds, Missing the Questions: The Challenge of Object Hallucination in Large Audio-Language Models [49.9] 本稿では,一般公開LALMの物体幻覚の程度を評価する手法を提案する。
以上の結果から,LALMは音声コンテンツの理解において,特別な音声キャプションモデルに匹敵するものであることが明らかとなった。
差別的質問に対するLALMの性能を高めるために,迅速なエンジニアリングの可能性を探る。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:51:54 GMT)
A Mathematical Certification for Positivity Conditions in Neural Networks with Applications to Partial Monotonicity and Ethical AI [48.6] LipVorは、ANNのようなブラックボックスモデルが有限個の評価に基づいて正であるかどうかを認証するアルゴリズムである。
我々の手法は、ANNが部分的に単調であるかどうかを数学的に証明できるが、制約のあるANNのアーキテクチャや断片的な線形アクティベーション関数は不要である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:33:38 GMT)
Graph Condensation for Open-World Graph Learning [48.4] グラフ凝縮(GC)は、グラフニューラルネットワーク(GNN)を効率的に訓練するための有望な加速ソリューションとして登場した。
既存のGCメソッドは、単に観測された静的グラフ分布と凝縮グラフの整合性に制限される。
しかし、現実のシナリオでは、グラフは動的で常に進化しており、新しいノードとエッジが継続的に統合されている。
グラフパターンの進化をシミュレートするために構造対応分散シフトを統合する,堅牢なGCフレームワークであるOpenGCを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:57:58 GMT)
Magpie: Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing [48.1] 我々はMagpieという名の大規模アライメントデータを生成する自己合成法を提案する。
我々はこの手法を用いてLlama-3-Instructを誘導し、対応する応答とともに400万の命令を生成する。
以上の結果から,Magpieを微調整したモデルでは,公式のLlama-3-8B-インストラクトと同等に動作することが示唆された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:52:30 GMT)
Resource Allocation and Workload Scheduling for Large-Scale Distributed Deep Learning: A Survey [48.1] 本調査は,大規模分散DLの効率的な資源配分とワークロードスケジューリング戦略について,主に2019年から2024年までの文献を概説する。
トピックごとに重要な課題を強調し、既存の技術に関する重要な洞察について議論する。
この調査は、コンピュータ科学、人工知能、通信研究者が最近の進歩を理解することを奨励することを目的としている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:51:44 GMT)
Reinforcement Learning for High-Level Strategic Control in Tower Defense Games [47.6] 戦略ゲームにおいて、ゲームデザインの最も重要な側面の1つは、プレイヤーにとっての挑戦の感覚を維持することである。
従来のスクリプティング手法と強化学習を組み合わせた自動手法を提案する。
その結果、強化学習のような学習アプローチとスクリプトAIを組み合わせることで、AIのみを使用するよりも高性能で堅牢なエージェントが生まれることが示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:06:31 GMT)
Dynamic Stochastic Decoding Strategy for Open-Domain Dialogue Generation [47.1] オープンドメインチャットシステムとしては,チットチャットとナレッジベースの質問応答という,2つの異なる会話シナリオが存在する。
前者の状況では、対話における一対多の性質のため、応答の多様性が不可欠である。
復号戦略では誤った情報を生成するリスクが伴うため、後者ではランダム性が低い。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:38:45 GMT)
Examining Post-Training Quantization for Mixture-of-Experts: A Benchmark [46.7] Mixture-of-Experts(MoE)アプローチは,大規模言語モデル(LLM)を拡張可能な方法を提供する
MoEは大きなメモリオーバーヘッドに悩まされており、モデル圧縮技術を必要とする。
本稿では,MoEブロックから個々の線形重みまで,粗さから細粒度まで,いくつかのMoE構造を考慮した量子化について検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:44:48 GMT)
Understanding and Mitigating Compositional Issues in Text-to-Image Generative Models [46.7] CLIPテキストエンコーダによる不完全なテキストコンディショニングは、高忠実な合成シーンを生成するためのテキスト・ツー・イメージ・モデルが欠如している主な理由の1つであることを示す。
本研究の主目的は,モデルのFIDスコアを損なうことなく,最高の構成改善が達成できることである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:21:34 GMT)
Emergence of In-Context Reinforcement Learning from Noise Distillation [46.3] 雑音によるカリキュラムからコンテキスト内強化学習を可能にする新しいデータ取得手法を提案する。
本研究では,学習履歴の収集を支援する合成ノイズ注入カリキュラムの構築が可能であることを示す。
テキスト内RLは、学習データセットの最適部分ポリシーを2倍のマージンで上回り、最適ポリシーによる生成の必要性を軽減できることを実験的に実証した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:30:19 GMT)
Asynchronous Voice Anonymization Using Adversarial Perturbation On Speaker Embedding [46.3] 我々は、人間の知覚を維持しながら、音声認識に対して音声属性を変更することに重点を置いている。
話者ゆがみ機構を組み込んだ音声生成フレームワークを用いて匿名化音声を生成する。
LibriSpeechデータセットで行った実験では、話者の属性は、その人の知覚が処理された発話の60.71%で保存されていることが判明した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:33:24 GMT)
What If We Recaption Billions of Web Images with LLaMA-3? [46.2] 我々はLLaMA-3搭載のLLaVA-1.5を微調整し、DataComp-1Bデータセットから13億枚の画像を取得する。
この拡張データセットであるRecap-DataComp-1Bは、先進的な視覚言語モデルのトレーニングにおいて大きなメリットがあることを確認した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:59:07 GMT)
Diffusion-Promoted HDR Video Reconstruction [45.7] 高ダイナミックレンジ(LDR)ビデオ再構成は、低ダイナミックレンジ(LDR)フレームから交互に露出したHDRビデオを生成することを目的としている。
既存の作品の多くは回帰に基づくパラダイムにのみ依存しており、ゴーストのアーティファクトや飽和した地域での詳細の欠如といった悪影響につながっている。
本稿では,HDR-V-Diffと呼ばれるHDR映像再構成のための拡散促進手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:38:10 GMT)
LaneCPP: Continuous 3D Lane Detection using Physical Priors [45.5] レーンCPPは、車線構造と道路形状に関する物理的事前知識を活用する連続した3次元車線検出モデルを用いる。
コントリビューションのメリットを示し、3次元車線検出をより堅牢にするための事前利用の意義を実証する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:31:06 GMT)
Prompt-Based Length Controlled Generation with Multiple Control Types [45.2] そこで本稿では,異なる制御型で高精度な長さ制御生成を実現するためのプロンプトベース手法を提案する。
特に,ルールベース報酬モデルによって与えられる報酬信号を用いた強化学習(RL)とサンプルフィルタリングを採用する。
実験の結果,提案手法はCNNDMやNYTなどの一般的な要約データセットにおいて,プロンプトベース長制御の精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:49:54 GMT)
ICE-G: Image Conditional Editing of 3D Gaussian Splats [45.1] 単一の参照ビューから3Dモデルを素早く編集するための新しいアプローチを提案する。
我々の技術はまず編集画像を分割し、選択したセグメント化されたデータセットビュー間で意味的に対応する領域をマッチングする。
編集画像の特定の領域からの色やテクスチャの変化を、意味的に理解できる方法で、他のビューに自動的に適用することができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:59:52 GMT)
Refined cyclic renormalization group in Russian Doll model [45.0] 等価スペクトルの一部に対して, RDMでは環状再正規化基 (RG) と Efimov のスケーリングが認められた。
スペクトル全体を考慮すると、等距離状態が取り除かれたり、対角障害が加わったりすると、RGの周期性は持続するが、RGの周期はエネルギー依存となる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:20:49 GMT)
Using Uncertainty Quantification to Characterize and Improve Out-of-Domain Learning for PDEs [44.9] ニューラル演算子(NO)は特に有望な量子化として出現している。
本研究では,複数のNOをアンサンブルすることで,高いエラー領域を同定し,不確実性の高い推定を行うことができることを示す。
次に、ProbConservフレームワーク内でこれらのよく校正されたUQ推定を使ってモデルを更新するOperator-ProbConservを紹介します。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:27:43 GMT)
PRoDeliberation: Parallel Robust Deliberation for End-to-End Spoken Language Understanding [44.8] PRoDeliberationは、コネクショニストの時間分類に基づくデコード戦略を活用する新しい手法であり、堅牢な非自己回帰的デリベレーションモデルをトレーニングするための認知的目標である。
PRoDeliberationは,自動音声認識(ASR)の誤り書き起こしを補正する能力を維持しつつ,並列デコーディングの遅延低減(自己回帰モデルよりも2~10倍改善)を実現していることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:46:17 GMT)
FIFO-Diffusion: Generating Infinite Videos from Text without Training [44.7] テキスト条件付きビデオ生成のための事前学習拡散モデルに基づく新しい推論手法を提案する。
FIFO拡散(FIFO-Diffusion)と呼ばれる我々の手法は、無限に長い動画を、追加の訓練なしで生成することができる。
提案手法が既存のテキスト・ビデオ生成ベースラインに対して有望な結果と有効性を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:31:42 GMT)
Beyond LLaVA-HD: Diving into High-Resolution Large Multimodal Models [44.4] 我々は、高度化タスク付きLMM、局所画像圧縮、グローバルエキスパートの混合(SliME)を提案する。
我々は,異なるタスクにおいて異なるアダプタが優れているという観察に基づいて,アダプタの混合を用いてグローバルビューからコンテキスト情報を抽出する。
提案手法は,200万のトレーニングデータのみを用いて,様々なベンチマークにおいて先行的な性能を実現する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:59:49 GMT)
LASER: A Neuro-Symbolic Framework for Learning Spatial-Temporal Scene Graphs with Weak Supervision [44.1] 我々は,高レベルな論理仕様を利用して,映像データの空間的・時間的リッチな特徴を捉えるセマンティックな特性を学習する。
20BN-Something-GEN, MUGEN, OpenPVSG という, 空間表現と時間仕様の豊富な3つのデータセットについて評価を行った。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:16:39 GMT)
Quantifying the Vulnerabilities of the Online Public Square to Adversarial Manipulation Tactics [44.0] ソーシャルメディアモデルを用いて、コンテンツの品質に対するいくつかの敵の操作戦術の影響を定量化する。
ソーシャルメディアの目印である影響力のあるアカウントの存在は、操作するオンラインコミュニティの脆弱性を悪化させる。
これらの知見は、プラットフォームがソーシャルメディアユーザーによる操作のレジリエンスを高めるために使われる可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 00:43:02 GMT)
Make Your Actor Talk: Generalizable and High-Fidelity Lip Sync with Motion and Appearance Disentanglement [43.9] 本研究の目的は,個人的アイデンティティと視覚的詳細を保ちながら,音声による唇の動きの編集を行うことである。
動きに依存しない視覚的詳細をキャプチャするために、別個のエンコーダを使用して唇、非唇の外観、動きを符号化し、学習した融合モジュールと統合する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:22:03 GMT)
DocSynthv2: A Practical Autoregressive Modeling for Document Generation [43.8] 本稿では, 単純で効果的な自己回帰構造モデルの開発を通じて, Doc Synthv2と呼ばれる新しい手法を提案する。
我々のモデルは、レイアウトとテキストの両方を統合する点で際立ったものであり、既存のレイアウト生成アプローチを超える一歩を踏み出している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:00:16 GMT)
RVT-2: Learning Precise Manipulation from Few Demonstrations [43.5] RVT-2は、トレーニングで6倍、推論で2倍高速なマルチタスク3D操作モデルである。
RLBenchの新たな最先端を実現し、成功率は65%から82%に向上した。
RVT-2は実世界でも有効であり、プラグの拾い上げや挿入といった高精度なタスクを10回のデモで学べる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:00:01 GMT)
Defining and Detecting Vulnerability in Human Evaluation Guidelines: A Preliminary Study Towards Reliable NLG Evaluation [43.2] トップコンファレンスでの人間評価に関する最近の論文の29.84%のみが評価ガイドラインを公表している。
既存の論文から抽出したガイドラインのアノテーションと,大規模言語モデルを用いて作成したガイドラインのアノテーションを収集する。
8つの脆弱性の分類を導入し,評価ガイドライン作成の原則を定式化する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:59:31 GMT)
Toward a Method to Generate Capability Ontologies from Natural Language Descriptions [43.1] この貢献は、Large Language Models (LLMs) を用いた能力オントロジーモデリングを自動化する革新的な方法である。
我々のアプローチでは、能力の自然言語記述しか必要とせず、事前に定義されたプロンプトに自動的に挿入される。
提案手法は,最初の自然言語記述と最終的な人間のレビューと修正を行う必要があるため,手作業を大幅に削減する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:41:44 GMT)
CT3D++: Improving 3D Object Detection with Keypoint-induced Channel-wise Transformer [42.7] 手作りの最小限の設計で3Dオブジェクト検出を行うフレームワークを2つ導入する。
まず,本提案では,各提案において,生点ベースの埋め込み,標準トランスフォーマーエンコーダ,チャンネルワイドデコーダを順次実行するCT3Dを提案する。
次に、幾何学的および意味論的融合に基づく埋め込みを組み込んだCT3D++と呼ばれる拡張ネットワークを提案し、より価値があり包括的な提案認識情報を取り出す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:40:28 GMT)
CoopHash: Cooperative Learning of Multipurpose Descriptor and Contrastive Pair Generator via Variational MCMC Teaching for Supervised Image Hashing [42.7] GAN(Generative Adversarial Networks)のような生成モデルは、画像ハッシュモデルで合成データを生成することができる。
GANは訓練が難しいため、ハッシュアプローチが生成モデルとハッシュ関数を共同で訓練するのを防ぐことができる。
本稿では,エネルギーをベースとした協調学習に基づく新しい協調ハッシュネットワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:37:43 GMT)
Expressivity and Generalization: Fragment-Biases for Molecular GNNs [42.6] Wesfeiler & Leman テストの拡張である Fragment-WL テストを提案し,フラグメントバイアス GNN の理論的解析を可能にする。
我々は,表現性を著しく向上させる新しいGNNアーキテクチャと無限語彙の断片化を開発する。
本稿では,最新のトランスアーキテクチャと比較して,モデルが優れた一般化能力を示すことを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:41:07 GMT)
Improving In-context Learning of Multilingual Generative Language Models with Cross-lingual Alignment [42.6] 本稿では,一対の翻訳文を利用する単純な言語間アライメントフレームワークを提案する。
多言語コントラスト学習を通じて、異なる言語にまたがる内部文表現を整合させる。
実験結果から,事前学習トークンが0.1文未満であっても,アライメントフレームワークは生成言語モデルの言語間相互性を大幅に向上させることが明らかとなった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:25:51 GMT)
Hardware-based stack buffer overflow attack detection on RISC-V architectures [42.2] この研究は、RISC-Vシステムにおけるスタックバッファオーバーフロー(SBO)攻撃をハードウェアベースのアプローチがいかにうまく検出するかを評価する。
PULPプラットフォーム上でシミュレーションを行い,半教師付き異常検出技術を用いてマイクロアーキテクチャイベントについて検討した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:10:01 GMT)
Both Matter: Enhancing the Emotional Intelligence of Large Language Models without Compromising the General Intelligence [41.7] 感情インテリジェンス(EI)は、現在の大言語モデル(LLM)ベースの会話型汎用AIアシスタントのユーザインタラクションエクスペリエンスを改善する上で、重要な役割を果たす。
これまでの研究は主に、EI関連分類や回帰タスクの微調整による感情知覚能力の向上に重点を置いていた。
タスク命令付きテキスト・ツー・テキスト生成におけるEI関連タスクの大規模コレクションであるtextscEiBenchを紹介する。
UnderlinetextbfModular UnderlinetextbfEmotional Underline
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:13:17 GMT)
MotionClone: Training-Free Motion Cloning for Controllable Video Generation [41.6] MotionCloneはトレーニング不要のフレームワークで、参照ビデオからのモーションクローンによってテキスト・ツー・ビデオ生成を制御することができる。
実験により、MotionCloneは、グローバルカメラモーションとローカルオブジェクトモーションの両方に熟練度を示すことが示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:57:34 GMT)
Watermarking Language Models with Error Correcting Codes [41.2] 本稿では,誤り訂正符号を用いて統計的信号を符号化する透かしフレームワークを提案する。
提案手法は,ロバスト二元符号 (RBC) 透かしと呼ばれ,元の確率分布に比較して歪みは生じない。
私たちの経験的発見は、私たちの透かしは速く、強力で、堅牢であり、最先端のものと好意的に比較していることを示唆しています。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:13:09 GMT)
Large Stepsize Gradient Descent for Non-Homogeneous Two-Layer Networks: Margin Improvement and Fast Optimization [41.2] 第2フェーズは、経験的リスクが一定の閾値以下に落ちてから始まり、ステップサイズに依存することを示す。
また、正規化マージンは第2相においてほぼ単調に成長し、非均一予測器のトレーニングにおいてGDの暗黙の偏りを示す。
我々の分析は、よく知られたニューラルネットワークカーネルや平均場状態を超えて、あらゆる幅のネットワークに適用できる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:33:22 GMT)
Can AI Understand Human Personality? -- Comparing Human Experts and AI Systems at Predicting Personality Correlations [41.1] パーソナリティマップや GPT-4o や Claude 3 Opus といった一般的な LLM など,特殊なディープニューラルネットワークの能力をテストする。
個々の人間と比較すると、すべてのAIモデルは、普通の人々や学術専門家の大多数よりも優れた予測をします。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:03:38 GMT)
Exploring One-shot Semi-supervised Federated Learning with A Pre-trained Diffusion Model [40.8] 我々は,フェデレート拡散にインスパイアされた半教師付き協調学習法であるFedDISCを提案する。
まず、ラベル付きサーバデータのプロトタイプを抽出し、これらのプロトタイプを用いてクライアントデータの擬似ラベルを予測する。
各カテゴリについて、クラスタセントロイドとドメイン固有の表現を計算し、それらの分布のセマンティックおよびスタイリスティックな情報を表す。
これらの表現はサーバに送信され、事前にトレーニングされたデータを使用して、クライアントの分布に応じて合成データセットを生成し、その上でグローバルモデルをトレーニングする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:02:47 GMT)
Time-MMD: A New Multi-Domain Multimodal Dataset for Time Series Analysis [40.4] Time-MMDは、最初のマルチドメイン、マルチモーダル時系列データセットである。
MM-TSFlibは、最初のマルチモーダル時系列予測ライブラリである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:20:09 GMT)
The VoicePrivacy 2024 Challenge Evaluation Plan [40.3] 課題は,言語的内容や感情的状態を保護しつつ,話者の音声アイデンティティを隠蔽する音声匿名化システムを開発することである。
参加者は、開発した匿名化システムを適用し、評価スクリプトを実行し、評価結果と匿名化された音声データをオーガナイザに送信する。
結果はInterspeech 2024と共同で開かれたワークショップで発表される。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:05:43 GMT)
Codecfake: An Initial Dataset for Detecting LLM-based Deepfake Audio [40.2] 大規模言語モデル(LLM)に基づくディープフェイク音声は、効果的な検出方法の緊急必要である。
7つの代表的ニューラルネットワークによって生成されるCodecfakeを提案する。
実験結果から, ニューラルトレーニング型ADDモデルでは, ボコーダトレーニング型ADDモデルに比べて41.406%の誤差率の低下が認められた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:47:23 GMT)
It's all about PR -- Smart Benchmarking AI Accelerators using Performance Representatives [40.2] 統計性能モデルのトレーニングは、しばしば大量のデータを必要とするため、かなりの時間的投資となり、ハードウェアの可用性が制限された場合に困難になる。
本稿では,精度を保ちながらトレーニングサンプル数を著しく削減する性能モデリング手法を提案する。
その結果,単層推定では0.02%,トレーニングサンプル10000点未満では0.68%という平均絶対誤差(MAPE)が得られた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:34:28 GMT)
The Real Deal Behind the Artificial Appeal: Inferential Utility of Tabular Synthetic Data [40.2] 評価値が不偏であっても, 偽陽性の発見率(タイプ1の誤り)は不可避的に高いことが示唆された。
以前提案された補正係数が使用されているにもかかわらず、この問題は深層生成モデルに対して持続する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:21:17 GMT)
Resurrecting Label Propagation for Graphs with Heterophily and Label Noise [40.1] ラベルノイズは、ディープニューラルネットワークの一般化能力を著しく低下させるため、大規模なデータセットでは一般的な課題である。
任意のヘテロフィリーの文脈におけるグラフラベルノイズについて検討し、ノイズラベルの修正とラベルの割り当てを未ラベルノードで行うことを目的とした。
R2LP$は、3つのステップからなる反復アルゴリズムである。(1) グラフを再構成してホモフィリプロパティを復元し、(2) ラベルの伝搬を利用してノイズラベルを修正し、(3) 信頼度の高いラベルを選択して次のイテレーションに保持する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:05:02 GMT)
Soft Language Identification for Language-Agnostic Many-to-One End-to-End Speech Translation [40.0] 多くのエンドツーエンドの音声翻訳モデルは、異なるソース言語からの音声信号をターゲット言語でテキストに変換することができる。
場合によっては、入力言語を付与または推定することができる。
我々は、単純で効果的な線形入力ネットワークを導入することで、これを実現する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 00:00:39 GMT)
Long-context LLMs Struggle with Long In-context Learning [39.8] 28から174のクラスを持つ6つのデータセットと2Kから50Kトークンの入力長を用いて、極端ラベル分類における長い文脈内学習のベンチマークを導入する。
15個の長文LLMを評価した結果,ラベル空間が小さく,デモンストレーションが短い,難易度が低い分類タスクでうまく機能していることが判明した。
さらなる分析により、後述のラベルに対するバイアスと、複数の情報に対する推論の改善の必要性が明らかになった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:46:16 GMT)
Unifying flavors of fault tolerance with the ZX calculus [39.6] トポロジカルなフォールトトレランス(特に表面コード)のモデルに焦点を当てる。
これらのモデルは全て、基盤となる安定化器の耐故障構造の異なるフレーバーと見なすことができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:36:11 GMT)
Reversing the Forget-Retain Objectives: An Efficient LLM Unlearning Framework from Logit Difference [39.3] 我々は、ログ差分(ULD)からのアンラーニングと呼ばれる新しいアンラーニングフレームワークを提案する。
本手法は,LLMの全体的な能力を維持しつつ,意図した忘れを効果的に実現し,トレーニング時間を3倍以上に短縮する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:26:35 GMT)
How You Prompt Matters! Even Task-Oriented Constraints in Instructions Affect LLM-Generated Text Detection [39.3] タスク指向の制約 -- 命令に自然に含まれ、検出回避とは無関係な制約 -- でさえ、既存の強力な検出器は検出性能に大きなばらつきを持つ。
実験の結果,命令を複数回生成したり,命令を言い換えたりすることで,命令によって生成されたテキストの標準偏差(SD)が有意に大きい(SDは14.4F1スコアまで)ことがわかった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:30:39 GMT)
Designing a Dashboard for Transparency and Control of Conversational AI [39.0] エンド・ツー・エンドのプロトタイプ・トゥ・エンド・プロトタイプ・コネクテッド・インタプリタビリティ技術とユーザ・エクスペリエンス・デザインを提案する。
以上の結果から,利用者は内的状態の認識に感謝し,偏りのある行動に曝露し,コントロール意識を高めたことが示唆された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:20:16 GMT)
FontStudio: Shape-Adaptive Diffusion Model for Coherent and Consistent Font Effect Generation [38.7] 本研究の目的は,多言語フォントにおけるテキストエフェクトの生成である。
与えられた形状を解釈できる新しい形状適応拡散モデルを提案する。
また、生成した参照文字から他へテクスチャを転送するための学習不要な形状適応型エフェクト転送手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:43:47 GMT)
Agent-SiMT: Agent-assisted Simultaneous Machine Translation with Large Language Models [38.5] 同時機械翻訳(SiMT)は、原文を読みながらターゲット翻訳を生成する。
既存の SiMT メソッドは一般的に、ポリシーを同時に決定し、翻訳を生成する、従来の Transformer アーキテクチャを採用している。
本稿では,Large Language Models(LLM)と従来のSiMTメソッドの長所を組み合わせたフレームワークであるAgent-SiMTを紹介する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:05:40 GMT)
CrossIn: An Efficient Instruction Tuning Approach for Cross-Lingual Knowledge Alignment [38.4] 英語中心のモデルは、通常他の言語では準最適である。
そこで本研究では,言語間命令チューニングデータの混合合成を利用したCrossInという新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:35:48 GMT)
Neural Blind Source Separation and Diarization for Distant Speech Recognition [38.1] 我々は、弱い教師付きで神経推論モデルを導入し、訓練する。
訓練されたモデルは、補助的な情報なしで、音声の混合を共同で分離、ダイアリゼーションすることができる。
AMIコーパスを用いた実験により,本手法はオラクルダイアリゼーションの結果でGASより優れていた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:45:35 GMT)
Small Scale Data-Free Knowledge Distillation [37.7] 小型データフリーな知識蒸留SSD-KDを提案する。
SSD-KDは、適切なサンプルを選択するために、合成サンプルと優先サンプリング関数のバランスをとる。
非常に少量の合成サンプルで蒸留訓練を行うことができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:09:41 GMT)
LVBench: An Extreme Long Video Understanding Benchmark [37.2] LVBenchは長いビデオの理解に特化して設計されたベンチマークである。
我々のデータセットは、公開されているビデオからなり、長いビデオの理解と情報抽出を目的とした様々なタスクを包含する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:36:52 GMT)
Evolutionary Computation and Explainable AI: A Roadmap to Transparent Intelligent Systems [37.0] 本稿では、説明可能な人工知能(XAI)の紹介と、機械学習(ML)モデルの説明に現在使われている様々な技術についてレビューする。
次に、ECがXAIでどのように使用できるかに注目し、ECテクニックを取り入れたXAIアプローチについてレビューする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:06:24 GMT)
Spoof Diarization: "What Spoofed When" in Partially Spoofed Audio [35.5] 本稿では,部分的スポフ(PS)シナリオにおける新しいタスクとして,スポフダイアリゼーションを定義する。
異なるスプーフ手法に従って、スプーフ領域の配置とクラスタ化を含む、スプーフがいつ何になったかを決定することを目的としている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:23:57 GMT)
Are Uncertainty Quantification Capabilities of Evidential Deep Learning a Mirage? [35.2] EDL法は,特定の目的関数を最小化することにより,予測分布上のメタ分布を学習する。
近年の研究では、学習した不確実性は信頼できないと結論づける既存の方法の限界が特定されている。
本研究では,多種多様な目的関数を統一することにより,多種多様なEDL手法の挙動をより深く理解する。
我々は,EDL法が下流タスクに実証的に有効であるとしても,不確実な定量化能力に乏しいにもかかわらず,これは発生すると結論付けた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:37:40 GMT)
Interventional Causal Discovery in a Mixture of DAGs [34.8] 本稿では,複数の因果系が支配する変数間の因果相互作用の学習における介入の役割について述べる。
これは、真のエッジと呼ばれる混合物の少なくとも1つの成分DAGに存在するエッジを特定することを目的としている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 22:12:03 GMT)
Real3D: Scaling Up Large Reconstruction Models with Real-World Images [34.7] Real3Dは、シングルビューの現実世界の画像を使ってトレーニングできる最初のLRMシステムである。
我々は,LRMをピクセルレベルで,セマンティックレベルで監視できる2つの教師なし損失を提案する。
In-the-wild画像から高品質なサンプルを収集する自動データキュレーション手法を開発した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:59:08 GMT)
CounterCurate: Enhancing Physical and Semantic Visio-Linguistic Compositional Reasoning via Counterfactual Examples [34.7] 視覚言語合成推論を改善するためのフレームワークであるCounterCurateを提案する。
特に、物理的根拠に基づく推論の無視という、2つの重要な未探索問題を特定する。
私たちはまず,CLIPやLLaVAといったマルチモーダルモデルの物理基底合成推論における近距離性能に注目した。
次に、グラウンドド画像生成モデルGLIGENを用いて単純なデータ拡張を適用し、微調整データを生成する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:59:55 GMT)
How Interpretable Are Interpretable Graph Neural Networks? [34.5] グラフ構造化データを含む様々な科学的応用において、解釈可能なグラフニューラルネットワーク(XGNN)が広く採用されている。
本稿では,部分グラフ分布の多線形展開による解釈可能な部分グラフ学習を定式化する理論的枠組みを提案する。
我々は,新しいXGNNアーキテクチャである Graph Multilinear neT (GMT) を設計する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:28:28 GMT)
Toward Enhanced Reinforcement Learning-Based Resource Management via Digital Twin: Opportunities, Applications, and Challenges [34.2] 本稿では、ネットワークリソース管理の性能と信頼性を最適化することを目的とした、デジタルツイン(DT)強化強化学習(RL)フレームワークを提案する。
これらの課題に対処するため,総合的なDTベースのフレームワークが提案され,統一的なRLベースのリソース管理のための収束速度と性能が向上する。
提案するフレームワークは、安全な行動探索、長期的なリターンのより正確な推定、トレーニング収束の高速化、コンバージェンス性能の向上、様々なネットワーク条件へのリアルタイム適応を提供する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:14:24 GMT)
Design Your Own Universe: A Physics-Informed Agnostic Method for Enhancing Graph Neural Networks [34.2] グラフニューラルネットワーク(GNN)のためのモデルに依存しない拡張フレームワークを提案する。
このフレームワークは、追加ノードを導入し、負の重み付けと負の重み付けの両方で接続を切り替えることでグラフ構造を豊かにする。
提案手法によって強化されたGNNが,過度にスムースな問題を効果的に回避し,過度なスキャッシングに対する堅牢性を示すことを理論的に検証する。
好中球グラフ,ヘテロ親和性グラフ,長期グラフデータセットのベンチマークにおける実証的検証により,本手法により強化されたGNNが元のグラフよりも有意に優れていることが示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:14:26 GMT)
EmoSphere-TTS: Emotional Style and Intensity Modeling via Spherical Emotion Vector for Controllable Emotional Text-to-Speech [34.0] EmoSphere-TTSは球面感情ベクトルを用いて表現的感情音声を合成し、合成音声の感情的スタイルと強度を制御する。
マルチアスペクト特性を反映して生成した音声の品質を向上させるための2つの条件付き対向ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:40:29 GMT)
Phonetic Enhanced Language Modeling for Text-to-Speech Synthesis [33.9] TTSモデルの性能向上のための音素拡張言語モデリング手法を提案する。
我々は,自己回帰言語モデルの訓練対象として,音声的にリッチな自己教師表現を活用している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:33:56 GMT)
APSeg: Auto-Prompt Network for Cross-Domain Few-Shot Semantic Segmentatio [33.9] クロスドメイン小ショットセマンティックセマンティックセグメンテーション(CD-FSS)のための新しい自動プロンプトネットワークであるAPSegを紹介する。
提案手法は,1ショット設定と5ショット設定の平均精度をそれぞれ5.24%,3.10%向上させる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:20:58 GMT)
UnO: Unsupervised Occupancy Fields for Perception and Forecasting [33.2] 監督されたアプローチは、アノテートされたオブジェクトラベルを利用して世界のモデルを学ぶ。
我々は,LiDARデータから連続した4次元占有領域を自己監督して知覚し,予測することを学ぶ。
この教師なしの世界モデルは、タスクに簡単かつ効果的に転送できる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 23:22:23 GMT)
It Takes Two: On the Seamlessness between Reward and Policy Model in RLHF [33.2] ヒューマンフィードバックからの強化学習(Reinforcement Learning from Human Feedback)は、言語モデルと人間の好みを合わせるためのトレーニングポリシーモデル(PM)と報酬モデル(RM)を含む。
PMとRMを独立に焦点をあてるのではなく、微調整中の相互作用を調べることを提案する。
本研究は、RMとPMの連続的な改善がRLHFの進行に変換されない飽和現象を観察することから始まる。
分析の結果, RMはPM応答に適切なスコアを割り当てず, 人間の嗜好に35%のミスマッチ率を示し, PMとRMの相違が顕著であった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:52:17 GMT)
Sharp Rates in Dependent Learning Theory: Avoiding Sample Size Deflation for the Square Loss [33.2] L2$ と $Psi_p$ の位相が我々の仮説クラス $mathscrF$, $mathscrF$ に同値であるときにいつでも、$mathscrF$ は弱準ガウス類であることを示す。
以上の結果から, 混合への直接的な依存は高次項に還元されるため, この問題は実現可能か否かを判断できる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:10:04 GMT)
GraphFM: A Comprehensive Benchmark for Graph Foundation Model [33.2] ファンデーション・モデル(FM)は、人工知能システムの開発のための一般的なクラスである。
FMの基礎として自己教師型学習の研究が盛んに行われたが、いくつかの顕著な問題が続いている。
下流タスクにおける一般化能力の程度は未だ不明である。
これらのモデルが大規模なデータセットにどの程度効果的にスケールできるかは不明だ。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:10:44 GMT)
RPMixer: Shaking Up Time Series Forecasting with Random Projections for Large Spatial-Temporal Data [33.1] RPMixer と呼ばれる全MLP時系列予測アーキテクチャを提案する。
提案手法は,各ブロックがアンサンブルモデルにおいてベース学習者のように振る舞う深層ニューラルネットワークのアンサンブル的挙動に乗じる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:49:48 GMT)
Scaling Manipulation Learning with Visual Kinematic Chain Prediction [33.0] 本研究では,多様な環境下でのロボット学習における準静的動作の高精度かつ普遍的な表現として,視覚キネマティクス連鎖を提案する。
我々は,Calvin,RLBench,Open-X,および実際のロボット操作タスクにおいて,BC変換器に対するVKTの優れた性能を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:10:27 GMT)
Speech-based Clinical Depression Screening: An Empirical Study [32.8] 本研究では,AIを用いた抑うつスクリーニングにおける音声信号の有用性について検討した。
参加者には、北京大学第6病院の外来から採用されているうつ病患者が含まれる。
音声と深部音声の特徴を各参加者の分節録音から抽出した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:13:04 GMT)
Efficient Neural Common Neighbor for Temporal Graph Link Prediction [32.4] 本稿では、時間グラフにおけるリンク予測のためのNCN(Neural Common Neighbor)の時間バージョンであるTNCNを提案する。
TNCNは、各ノードの時間的隣接辞書を動的に更新し、ソースとターゲットノード間のマルチホップ共通辞書を使用して、より効果的なペアワイズ表現を学習する。
5つの大規模実世界のデータセットでモデルを検証し、それらのうち3つで新たな最先端のパフォーマンスを実現することを発見した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:45:03 GMT)
M3T: A New Benchmark Dataset for Multi-Modal Document-Level Machine Translation [32.4] 文書翻訳はニューラルマシン翻訳(NMT)システムにとって課題となる。
ほとんどの文書レベルのNMTシステムは、厳密にキュレートされた文レベルの並列データに依存している。
現実世界の文書は、これらの前提に反する複雑なテキストレイアウトを持つことが多い。
本稿では,半構造化文書を翻訳する包括的タスクにおいて,NMTシステムを評価するための新しいベンチマークデータセットであるM3Tを紹介する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:28:25 GMT)
Self-supervised Learning of Neural Implicit Feature Fields for Camera Pose Refinement [32.3] 本稿では,3次元の高密度特徴場と2次元の特徴抽出器を併用してシーン表現を共同学習することを提案する。
暗黙の場に符号化された中間的幾何情報を活用するために、ボリュームレンダリングを通してシーンの基盤となる幾何学を学習し、特徴体を設計する。
次に、画像ベースの機能とレンダリングされたボリューム機能を調整することで、視覚的なローカライゼーションを実現する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:51:53 GMT)
Exploring Frequency-Inspired Optimization in Transformer for Efficient Single Image Super-Resolution [32.3] クロスリファインメント適応型特徴変調トランス(CRAFT)
CRAFTの効率向上を目的とした周波数誘導後量子化(PTQ)手法を提案する。
実験結果から, CRAFTは, 完全精度と量子化のシナリオにおいて, 現在の最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:30:13 GMT)
Predictive Performance Comparison of Decision Policies Under Confounding [32.2] そこで本稿では, 意思決定ポリシーの予測性能を, 様々な現代的な識別手法で比較する手法を提案する。
我々の手法の鍵は、政策比較において安全に無視できる不確実性領域が存在するという洞察である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:42:10 GMT)
On Security Weaknesses and Vulnerabilities in Deep Learning Systems [32.1] 具体的には、ディープラーニング(DL)フレームワークについて検討し、DLシステムにおける脆弱性に関する最初の体系的な研究を行う。
各種データベースの脆弱性パターンを探索する2ストリームデータ分析フレームワークを提案する。
我々は,脆弱性のパターンと修正の課題をよりよく理解するために,3,049個のDL脆弱性を大規模に検討した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 23:04:13 GMT)
Continuous-Time Digital Twin with Analogue Memristive Neural Ordinary Differential Equation Solver [32.1] デジタル双生児(Digital twins)は、産業4.0の基盤であり、コンピュータモデルを通して現実世界の実体を再現する。
機械学習の最近の進歩は、デジタルツインを開発するためのデータ駆動方式を提供する。
本稿では,デジタル双生児のための経験的ニューラル常微分方程式解法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:50:35 GMT)
RedCoast: A Lightweight Tool to Automate Distributed Training of LLMs on Any GPU/TPUs [32.0] 大規模言語モデル(LLM)の分散トレーニングと推論を自動化するツールであるRedCoastを紹介する。
また,3つの関数の定義により,多様なMLパイプラインをカスタマイズする機構を提案する。
その結果、Redcoの実装は公式実装に比べてコード行数が大幅に減った。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 22:07:54 GMT)
SVSNet+: Enhancing Speaker Voice Similarity Assessment Models with Representations from Speech Foundation Models [31.8] 事前訓練された音声基礎モデル(SFM)の表現は、多くの下流タスクにおいて顕著なパフォーマンスを示している。
本研究では,事前学習したSFM表現を統合したモデルであるSVSNet+を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:37:09 GMT)
Provably Robust Score-Based Diffusion Posterior Sampling for Plug-and-Play Image Reconstruction [31.5] 科学と工学において、ゴールは、ある画像のモダリティを記述する既知のフォワードモデルから収集された少数の測定値から未知の画像を推測することである。
モチベートされたスコアベース拡散モデルはその経験的成功により、画像再構成に先立って模範の印象的な候補として現れた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:33:21 GMT)
Statement-Level Vulnerability Detection: Learning Vulnerability Patterns Through Information Theory and Contrastive Learning [31.2] 本稿では,特定の関数の脆弱性関連コード文を特定するために,エンドツーエンドのディープラーニングに基づく新しいアプローチを提案する。
実世界の脆弱なコードで観測される構造にインスパイアされ、私たちはまず、潜伏変数の集合を学習するために相互情報を活用する。
そこで我々は,表現学習をさらに改善するために,新しいクラスタ型空間コントラスト学習を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:52:41 GMT)
MaIL: Improving Imitation Learning with Mamba [31.0] Mamba Imitation Learning (MaIL)は、最先端(SoTA)トランスフォーマーポリシーに代わる計算効率の良い代替手段を提供する、新しい模倣学習アーキテクチャである。
Mambaは、Transformersに対するSSMやライバルのパフォーマンスを大幅に改善し、ILポリシーの魅力的な代替品として位置づけている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:01:12 GMT)
Simulating Chemistry on Bosonic Quantum Devices [30.9] ボソニック量子デバイスは、量子計算を実現するための新しいアプローチを提供する。
我々は、幅広い化学問題に対処するためにボソニック量子デバイスを用いた最近の進歩と将来の可能性についてレビューする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:54:12 GMT)
GPT4Rec: Graph Prompt Tuning for Streaming Recommendation [30.6] 本稿では,ストリームレコメンデーションのためのグラフプロンプトチューニング手法であるGPT4Recを提案する。
特に、GPT4Recはグラフパターンを複数のビューに分解する。
ユーザ-テムグラフ内のさまざまなインタラクションパターンにまたがってモデルをガイドする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:59:31 GMT)
Et Tu Certifications: Robustness Certificates Yield Better Adversarial Examples [30.4] 我々の新しいEmphCertification Aware Attackは、計算効率のよい規範最小化対逆例を生成するために認証を利用する。
これらの攻撃は、認証境界の厳密性を評価するために使用できるが、認定のリリースは、パラドックス的にセキュリティを低下させる可能性があることも強調している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 00:52:09 GMT)
A Simple Video Segmenter by Tracking Objects Along Axial Trajectories [30.3] ビデオセグメンテーションは、時間とともにオブジェクトのセグメンテーションと追跡を必要とする。
入力サイズに二次的な依存があるため、高解像度の入力特徴を持つビデオセグメンテーションに自己注意を直接適用することが大きな課題となる。
Axial-VSは,物体を軸方向に沿って追跡することで映像セグメンタを強化するフレームワークである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:20:59 GMT)
Flora: Low-Rank Adapters Are Secretly Gradient Compressors [30.2] 低ランク適応(LoRA)は、少ないパラメータをトレーニングすることで最適化状態を低減するために提案される。
LoRAは全体の重量更新行列を低ランクに制限し、モデル性能を制限している。
本稿では,プロジェクション行列を再サンプリングすることで高階更新を実現する Flora を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 22:17:37 GMT)
DualCross: Cross-Modality Cross-Domain Adaptation for Monocular BEV Perception [30.1] DualCrossは、より堅牢なBEV知覚モデルの学習を容易にする、クロスモダリティのクロスドメイン適応フレームワークである。
この研究は、クロスドメイン・クロスセンサーの認識と野生における単分子3Dタスクへの適応を初めてオープンに解析する結果となった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 00:35:15 GMT)
Residual Connections and Normalization Can Provably Prevent Oversmoothing in GNNs [30.0] 残差接続と正規化層を有する(線形化)グラフニューラルネットワーク(GNN)の形式的かつ正確な特徴付けを提供する。
正規化層の中心となるステップは、メッセージパッシングにおけるグラフ信号を変化させ、関連する情報を抽出しにくくすることを示す。
本稿では,グラフNormv2と呼ばれる新しい正規化レイヤを導入し,その中心となるステップを学習することで,元のグラフ信号を望ましくない方法で歪ませないようにする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:06:10 GMT)
Fewer Tokens and Fewer Videos: Extending Video Understanding Abilities in Large Vision-Language Models [29.8] 本稿では,映像と映像の視覚的共通性を活かして,映像LVLMをビデオLVLMに進化させることによる課題に対処する。
本稿では、モデルアーキテクチャを強化し、革新的なトレーニング戦略を導入し、最も効果的なタイプのビデオ命令データを特定する、費用対効果のあるビデオLVLMを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:22:45 GMT)
Human 3Diffusion: Realistic Avatar Creation via Explicit 3D Consistent Diffusion Models [29.7] 人間の3次元拡散: 明示的な3次元連続拡散による現実的なアバター創造を提案する。
我々の重要な洞察は、2次元多視点拡散と3次元再構成モデルが相互に補完情報を提供するということである。
提案するフレームワークは,最先端の手法より優れ,単一のRGB画像から現実的なアバターを作成することができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:57:25 GMT)
Judging the Judges: A Systematic Investigation of Position Bias in Pairwise Comparative Assessments by LLMs [29.7] 本研究では,反復的整合性,位置整合性,位置整合性などの指標を用いて位置バイアスを定量化する枠組みを開発した。
我々はMTBenchベンチマークとDevBenchベンチマークから22タスクにわたる9つの判断モデルと40近い回答生成モデルを用いて実験を行い、約80,000の評価インスタンスを生成する。
本研究は,位置バイアスを理解するための新しい概念を導入し,評価のための多次元フレームワークを提供することによって,この分野に大きく貢献する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:12:28 GMT)
Toward Fully-End-to-End Listened Speech Decoding from EEG Signals [29.5] 脳波信号からの完全エンドツーエンド音声デコーディングのための新しいフレームワークであるFESDEを提案する。
提案手法は,脳波モジュールと音声モジュール,およびコネクタから構成される。
音声符号化のモデル特性を明らかにするために, きめ細かい音素解析を行った。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:08:12 GMT)
Scaling Value Iteration Networks to 5000 Layers for Extreme Long-Term Planning [29.5] Value Iteration Network (VIN)は、強化学習(RL)における計画のための潜在MDPで価値イテレーションを実行するエンドツーエンドの差別化可能なアーキテクチャである。
VINは100ドル以上の迷路をナビゲートするなど、長期および大規模計画タスクへのスケールに苦慮している。
動的遷移カーネルを用いて潜伏型MDPを増大させることにより、この障害に対処する。
我々の新しい手法であるDynamic Transition VIN(DT-VIN)は,5000層まで容易にスケールでき,上述したタスクの難解なバージョンをカジュアルに解決する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:52:54 GMT)
Systematic Literature Review of AI-enabled Spectrum Management in 6G and Future Networks [29.4] AI対応のSpectrum Managementの進歩の強化にはギャップがあります。
従来のスペクトル管理手法は、ダイナミックで複雑な要求のため、6Gでは不十分である。
発見は、重要なAISMシステムにおける未探索のAI利用などの課題を明らかにする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:31:42 GMT)
Deep Learning Based Joint Multi-User MISO Power Allocation and Beamforming Design [29.3] マルチユーザ・マルチインプット・シングルアウトプット(MU-MISO)システムのための非教師なし深層学習に基づくジョイントパワーアロケーションとビームフォーミング設計を提案する。
NNBF-Pとゼロ強制ビームフォーミング(ZFBF)、最小平均二乗誤差(MMSE)ビームフォーミング、NNBFの性能を比較するための多様な設定実験を行った。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:21:11 GMT)
From Sim-to-Real: Toward General Event-based Low-light Frame Interpolation with Per-scene Optimization [29.2] 低照度条件に適したシーンごとの最適化手法を提案する。
その結果,低照度環境における最先端性能が示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:15:59 GMT)
RRLS : Robust Reinforcement Learning Suite [28.6] 本稿では,Mujoco環境をベースとしたベンチマークスイートであるRobust Reinforcement Learning Suite (RRLS)を紹介する。
RRLSはトレーニングと評価のための2種類の不確実性セットを備えた6つの連続制御タスクを提供する。
また、新しい環境に容易に拡張できるように設計されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:53:51 GMT)
Exploring Speech Foundation Models for Speaker Diarization in Child-Adult Dyadic Interactions [28.5] 模範音声基礎モデルでは, ダイアリゼーション誤差率と話者融合率を39.5%, 62.3%削減できることを示す。
本研究は, 子どもの発話理解を促進するために, 音声基盤モデルを理解し, 導入するための有望な経路を明らかにするものである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:41:01 GMT)
From Chaos to Clarity: 3DGS in the Dark [28.2] 未処理の生画像のノイズは、3次元シーン表現の精度を損なう。
3D Gaussian Splatting (3DGS)はこのノイズに特に影響を受けやすい。
ノイズの多い生画像からHDR 3DGSを再構成するための,新しい自己教師型学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:00:16 GMT)
AdaNCA: Neural Cellular Automata As Adaptors For More Robust Vision Transformer [27.9] 視覚変換器用ニューラルセルラーオートマタ (NCA) を提案する。
AdaNCAは、ImageNet1Kベンチマークに対する敵攻撃による精度の10%以上の改善に貢献している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:59:12 GMT)
On the Convergence of Multi-objective Optimization under Generalized Smoothness [27.9] 我々はより一般的で現実的な$ell$-smooth損失関数のクラスを研究し、$ell$は一般の非減少関数ノルムである。
我々は、$ell$-smooth Generalized Multi-MOO GradientGradと、その変種である Generalized Smooth Multi-MOO descentの2つの新しいアルゴリズムを開発した。
私たちのアルゴリズムは、より厳密な$mathcalO(epsilon-2)$を各イテレーションで、より多くのサンプルを使って保証します。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:34:36 GMT)
Scalable Private Search with Wally [27.4] Wallyは、大規模なデータベースに対する効率的なセマンティック検索とキーワード検索クエリをサポートするプライベート検索システムである。
従来のプライベート検索システムでは、各クライアントクエリに対して、サーバはデータベースのエントリごとに少なくとも1つの高価な暗号処理を実行する必要がある。
我々は,各クライアントにいくつかの偽のクエリを追加することを要求し,独立に選択されたランダムな瞬間に,匿名ネットワークを介して各クエリをサーバに送信することで,これらの結果を達成する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:02:43 GMT)
OphNet: A Large-Scale Video Benchmark for Ophthalmic Surgical Workflow Understanding [27.0] 我々は,眼科手術ワークフロー理解のための大規模,専門家によるビデオベンチマークであるOphNetを紹介した。
66種類の白内障、緑内障、角膜手術にまたがる2,278本の手術ビデオの多彩なコレクションがあり、102回の手術フェーズと150回の手術の詳細な注記がある。
OphNetは、時間的ローカライズされたアノテーションを提供し、外科的シナリオ内の時間的ローカライゼーションと予測タスクを容易にする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:36:19 GMT)
Batch and match: black-box variational inference with a score-based divergence [26.9] スコアに基づく発散に基づくブラックボックス変分推論(BBVI)の代替手法としてバッチ・アンド・マッチ(BaM)を提案する。
ELBO に基づく BBVI の先行実装よりもBaM の収束度が低いことを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:53:22 GMT)
CS-Bench: A Comprehensive Benchmark for Large Language Models towards Computer Science Mastery [26.4] 計算機科学における大規模言語モデルの性能評価のための最初のベンチマークであるCS-Benchを紹介する。
CS-Benchは、コンピュータ科学の4つの重要な領域にまたがる26のサブフィールドをカバーする、5Kの精巧にキュレートされたテストサンプルで構成されている。
CS性能とモデルスケールの関係を明らかにするため,30以上のLLMの総合評価を行った。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:47:28 GMT)
AWGUNET: Attention-Aided Wavelet Guided U-Net for Nuclei Segmentation in Histopathology Images [26.3] 本稿では,U-NetアーキテクチャとDenseNet-121バックボーンを組み合わせたセグメンテーション手法を提案する。
本モデルでは,ウェーブレット誘導チャネルアテンションモジュールを導入し,セル境界のデライン化を促進させる。
その結果,Mouseg と TNBC の2つの病理組織学的データセットを用いて,提案モデルの優位性を実証した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:10:27 GMT)
RMem: Restricted Memory Banks Improve Video Object Segmentation [26.1] ビデオオブジェクトセグメンテーション(VOS)ベンチマークは、挑戦的なシナリオへと進化している。
我々は、メモリバンクのサイズを制限するという、単純だが見過ごされた戦略を再考する。
メモリバンクを限られた数の必須フレームに制限することにより、VOSの精度を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:59:04 GMT)
DiTFastAttn: Attention Compression for Diffusion Transformer Models [26.1] 拡散変換器(DiT)は画像およびビデオ生成において優れるが、自己注意の2次複雑さのために計算上の課題に直面している。
本稿では,DiTの計算ボトルネックを軽減するためのポストトレーニング圧縮手法であるDiTFastAttnを提案する。
画像生成では,FLOPの最大88%を削減し,高分解能発生時の最大1.6倍の高速化を実現する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:00:08 GMT)
Heuristic Learning with Graph Neural Networks: A Unified Framework for Link Prediction [25.9] リンク予測はグラフ学習における基本的なタスクであり、本質的にグラフのトポロジーによって形作られる。
本稿では,様々な一般化を適応・一般化するための統一行列の定式化を提案する。
また,この定式化を効率的に実装するためのHuristic Learning Graph Neural Network (HL-GNN)を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:05:45 GMT)
Descriptive Image Quality Assessment in the Wild [25.5] VLMに基づく画像品質評価(IQA)は、画像品質を言語的に記述し、人間の表現に合わせることを目指している。
野生における画像品質評価(DepictQA-Wild)について紹介する。
本手法は,評価タスクと比較タスク,簡潔かつ詳細な応答,完全参照,非参照シナリオを含む多機能IQAタスクパラダイムを含む。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:42:26 GMT)
A Comprehensive Survey for Hyperspectral Image Classification: The Evolution from Conventional to Transformers [25.5] ハイパースペクトル画像分類(HSC)は、HSデータの高次元性と複雑な性質のために難しい課題である。
従来の機械学習は効率的でありながら、最適な特徴セット、人間駆動設計における主観性、バイアス、制限によって、現実世界のデータに課題に直面している。
近年,これらの課題に対処するための強力なツールとしてDL技術が登場している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:21:59 GMT)
Noise-Aware Differentially Private Regression via Meta-Learning [25.1] 差別化プライバシ(DP)は、ユーザのプライバシを保護するための金の標準であるが、標準のDPメカニズムはパフォーマンスを著しく損なう。
この問題を緩和する1つのアプローチは、DPがプライベートデータで学習する前にシミュレーションデータ上でモデルを事前訓練することである。
本研究では、シミュレーションデータを用いて、畳み込み条件ニューラルネットワーク(ConvCNP)と改良された機能DPメカニズムを組み合わせたメタ学習モデルをトレーニングする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:11:24 GMT)
Category-level Neural Field for Reconstruction of Partially Observed Objects in Indoor Environment [24.9] シーン内に存在する同じカテゴリに属するオブジェクト間で有意義な共通3D情報を学習するカテゴリレベルのニューラルフィールドを提案する。
私たちのキーとなるアイデアは、観察された形状に基づいてオブジェクトを分類し、カテゴリレベルのモデルのより良いトレーニングを行うことです。
シミュレーションと実世界のデータセットによる実験により,いくつかのカテゴリで観測されていない部分の再構成を改善することが実証された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:09:59 GMT)
GRU-Net for breast histopathology image segmentation [24.9] 本稿では病理組織像分割のためのMultiResU-Netの修正版を提案する。
複雑な機能を複数のスケールで分析し、セグメント化できるため、バックボーンとして選択される。
乳がんの病理組織像データセットの多様性について検討した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:17:17 GMT)
DiffusionPID: Interpreting Diffusion via Partial Information Decomposition [24.8] 入力テキストプロンプトを基本成分に分解するために,情報理論の原理を適用した。
個々のトークンとその相互作用が生成した画像をどのように形成するかを分析する。
PIDはテキスト・画像拡散モデルの評価と診断のための強力なツールであることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:28:13 GMT)
Dynamic Retrieval Augmented Generation of Ontologies using Artificial Intelligence (DRAGON-AI) [24.4] AI(DRAGON-AI)を用いた動的検索オントロジー生成を提案する。
DRAGON-AIは、既存のインストラクションや構造化されていないテキストソースから、テキストおよび論理的なコンポーネントを生成することができる。
DRAGON-AIの自然言語をGitHubのイシューに組み込む能力についても実証した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:15:37 GMT)
Legend: Leveraging Representation Engineering to Annotate Safety Margin for Preference Datasets [24.3] 本稿では,利幅拡大された選好データセット開発を促進するための効果的で費用効率のよいフレームワークを提案する。
我々のフレームワークであるRegend, Leverages表現エンジニアリングは、好みのデータセットに注釈を付ける。
LLMに対する報酬モデリングと無害アライメントの両面での有効性を実験的に実証した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:06:32 GMT)
Audio Editing with Non-Rigid Text Prompts [24.0] 提案した編集パイプラインは,入力音声に忠実な音声編集を作成可能であることを示す。
追加、スタイル転送、インペイントを行うテキストプロンプトを探索する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:56:25 GMT)
A Critical Look At Tokenwise Reward-Guided Text Generation [23.9] フルシーケンスでトレーニングされた報酬モデルは、スコアリング部分シーケンスと互換性がないことを示す。
本稿では,部分列上でBradley-Terry報酬モデルを明示的にトレーニングし,復号時における暗黙的なポリシから自己回帰的にサンプルする手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 00:19:40 GMT)
A Federated Online Restless Bandit Framework for Cooperative Resource Allocation [23.7] MRPの未知系力学を用いた協調資源配分問題について検討する。
我々は、このマルチエージェントオンラインRMAB問題を解決するために、フェデレートトンプソン対応Whittle Index(FedTSWI)アルゴリズムを作成した。
数値計算の結果,提案アルゴリズムは,ベースラインと比較して,$mathcalO(sqrtTlog(T))$の高速収束率と性能の向上を実現している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:34:53 GMT)
Nonconvex Federated Learning on Compact Smooth Submanifolds With Heterogeneous Data [23.7] 本稿では,クライアントの設定においてサブマニフォールド上で学習するアルゴリズムを提案する。
提案アルゴリズムは,新しい解析手法を用いて一階最適解の近傍に部分収束することを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:53:28 GMT)
WMAdapter: Adding WaterMark Control to Latent Diffusion Models [23.5] ユーザが特定した透かし情報を取得する拡散モデル透かしプラグインであるWMAdapterを提案する。
WMAdapterは効率的で堅牢であり、高品質に重点を置いている。
実験の結果、WMAdapterは強力な柔軟性、例外的な画像生成品質、競争力のある透かしの堅牢性を提供することが示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:42:52 GMT)
Robust 3D Face Alignment with Multi-Path Neural Architecture Search [23.4] 3D顔のアライメントは、コンピュータビジョンにおいて非常に困難で基本的な問題である。
既存のディープラーニングベースの手法は、異なるネットワークを手動で設計し、3次元顔モデルのパラメータや3次元顔頂点の位置を回帰する。
我々は3次元顔アライメントのための最適なアーキテクチャを自動的に発見するために、Neural Architecture Search (NAS) を用いる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:02:16 GMT)
Towards Integrating Personal Knowledge into Test-Time Predictions [23.3] 機械学習モデルは、大量のデータに基づいて決定を下すことができるが、誰が予測されたかという個人的知識を欠く可能性がある。
本研究では、ドメイン知識のないユーザからの重要な個人知識をML予測に組み込む方法として、ヒューマン機能統合の問題を紹介する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:47:17 GMT)
Defending Against Alignment-Breaking Attacks via Robustly Aligned LLM [23.2] 我々は、アライメントを破る可能性のある攻撃に対して、ロバストにアライメントされたLLM(RA-LLM)を導入する。
RA-LLMは、最先端の敵のプロンプトと、手作りのジェイルブレイクプロンプトの両方を防御できる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 00:27:06 GMT)
Real2Code: Reconstruct Articulated Objects via Code Generation [22.8] Real2Codeは、コード生成を通じて記述されたオブジェクトを再構築する新しいアプローチである。
まず,画像分割モデルと形状完備モデルを用いて部分形状を再構成する。
オブジェクト指向言語モデルに入力されたオブジェクト指向境界ボックスでオブジェクト部品を表現し、コードとして関節の調音を予測する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:57:06 GMT)
Towards Model-Agnostic Posterior Approximation for Fast and Accurate Variational Autoencoders [22.8] 我々は,真のモデルの後部の決定論的,モデルに依存しない後部近似(MAPA)を計算可能であることを示す。
我々は,(1)MAPAが真の後部傾向を捉えた低次元合成データに対する予備的な結果を示し,(2)MAPAに基づく推論は,ベースラインよりも少ない計算でより優れた密度推定を行う。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:15:38 GMT)
Language Models can Exploit Cross-Task In-context Learning for Data-Scarce Novel Tasks [22.7] LLM(Large Language Models)は、ICL(In-context Learning)機能によってNLPを変換した。
本稿では,予め定義されたタスクのラベル付き例から新しいタスクまで,LLMが一般化できるかどうかを検討する。
LLaMA-2 7Bは107%, LLaMA-2 13Bは18.6%, GPT3.5は3.2%であった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:00:19 GMT)
Know Your Needs Better: Towards Structured Understanding of Marketer Demands with Analogical Reasoning Augmented LLMs [22.6] 我々は,非専門家のマーケターが,自然言語形式の要求のみを前提としたターゲットユーザを選択できる,ユーザターゲティングの新しい方法を探究する。
本稿では,2つのモジュールからなるALALLMを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:02:45 GMT)
State Soup: In-Context Skill Learning, Retrieval and Mixing [22.5] 新しいタイプのゲート線形リカレントニューラルネットワークは、様々なシーケンスモデリング問題に対して最先端の性能に達した。
ここでは、パラメータによるモデルマージの成功に触発された、ステートフルシーケンスモデルの別の利点について検討する。
微調整学習と文脈内学習の並列性に基づいて、内部状態を記憶、検索、線形結合が可能なタスクベクトルとして扱うことができるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:06:07 GMT)
Informed Reinforcement Learning for Situation-Aware Traffic Rule Exceptions [22.3] 本稿では,構造化ルールブックを知識源として統合するインフォームド強化学習を紹介する。
我々は、トラジェクトリを学び、それらを状況に応じた報酬設計で評価し、エージェントが制御された交通規則例外を必要とする状況を学ぶことができる動的な報酬をもたらす。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:34:30 GMT)
Methods for Class-Imbalanced Learning with Support Vector Machines: A Review and an Empirical Evaluation [22.1] クラス不均衡学習に関して,SVMに基づくモデルの階層的分類を導入する。
ベンチマーク不均衡データセットを用いて,各カテゴリの各種SVMモデルの性能を比較した。
以上の結果から,データ前処理の要求がないため,アルゴリズム手法は時間がかかりにくいが,再サンプリング手法とアルゴリズム手法を併用した融合方式は,一般に最善を尽くしていることがわかった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:37:08 GMT)
3D-GRAND: A Million-Scale Dataset for 3D-LLMs with Better Grounding and Less Hallucination [22.0] 3D-GRANDは、40,087の世帯シーンと6.2百万の密集したシーン言語命令を組み合わせた、先駆的な大規模データセットである。
この結果から, 3D-GRANDによる指導指導はグラウンド化能力を大幅に向上させ, 3D-LLMの幻覚を低減させることがわかった。
コントリビューションの一環として、3D-LLMの幻覚を体系的に評価するための総合的なベンチマーク3D-POPEを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:59:58 GMT)
Updating CLIP to Prefer Descriptions Over Captions [21.9] 私たちはCLIPモデルを更新し、キャプションよりも高いスコアを記述に割り当てる。
このモデルは、移動能力を維持しながら盲人や低ビジョンの人々の判断と相関する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:24:51 GMT)
Multi-Constitutive Neural Network for Large Deformation Poromechanics Problem [21.9] 本稿では,複数の異なる法則を1つのモデルで解ける「マルチ構成型ニューラルネットワーク(MCNN)」を提案する。
MCNNは複数のPDEの解法を訓練し、PDEで訓練した個々のニューラルネットワークの解法よりも優れていた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:41:50 GMT)
Federated Incomplete Multi-View Clustering with Heterogeneous Graph Neural Networks [21.7] フェデレートされたマルチビュークラスタリングは、複数のデバイスに分散したデータを使用したグローバルクラスタリングモデルを開発する可能性を提供する。
現在の手法は、ラベル情報がないことと、データプライバシの重要性が最重要視されているため、課題に直面している。
ヘテロジニアスグラフニューラルネットワーク(FIM-GNN)を用いたフェデレーション不完全なマルチビュークラスタリングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:16:00 GMT)
OpenObj: Open-Vocabulary Object-Level Neural Radiance Fields with Fine-Grained Understanding [21.6] オープンな語彙を持つオブジェクトレベルのニューラルフィールドを構築するための革新的なアプローチであるOpenを紹介します。
本質的にOpenは、オブジェクトレベルでの効率的かつ水密なシーンモデリングと理解のための堅牢なフレームワークを確立します。
複数のデータセットの結果から、Openはゼロショットセマンティクスおよび検索タスクにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:59:33 GMT)
Learning graph geometry and topology using dynamical systems based message-passing [21.6] 本稿では,グラフ力学の表現力に基づいて構築されたGNNのメッセージパッシングパラダイムであるDYMAGを紹介する。
DYMAGは、熱と波動の方程式に基づく複雑なグラフ力学と、カオス解を持つより複雑な方程式を利用する。
我々はDYMAGがErd"os-Renyiとブロックランダムグラフの生成パラメータを復元する際の優れた性能を実証した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:28:16 GMT)
The Max-Min Formulation of Multi-Objective Reinforcement Learning: From Theory to a Model-Free Algorithm [21.4] 複数の最適化目標を持つ実世界の多くの問題に現れる多目的強化学習について考察する。
我々は、max-minフレームワークの下で、関連する理論と実用的なモデルフリーアルゴリズムを開発する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:47:54 GMT)
Classification Diffusion Models: Revitalizing Density Ratio Estimation [21.3] 画像のような複雑な高次元データの分布をDREで生成する手法を提案する。
本手法は,DREをベースとした最初の画像生成技術である。
単一のフォワードパスで任意の入力の確率を出力し、この特性を持つメソッド間で最先端の負のログ可能性(NLL)を達成する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:18:27 GMT)
Collective Constitutional AI: Aligning a Language Model with Public Input [21.0] 言語モデル(LM)開発者は、LMの振る舞いの唯一の決定者であってはならないというコンセンサスが高まっている。
我々は、公共のインプットをLMにソーシングし、統合するための多段階プロセスであるCCAI(Collective Constitutional AI)を提示する。
我々は、この手法の現実的な実践性を、我々の知識に則って、公開入力を集約した最初のLM微調整を作成することによって実証する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:20:46 GMT)
Dataset Enhancement with Instance-Level Augmentations [20.9] 本稿では,事前学習した潜伏拡散モデルの広範な分布から知識を取り入れたデータセットの拡張手法を提案する。
単純なピクセル変換を超えて、画像の一部をオブジェクトインスタンスのレベルで再描画することで、インスタンスレベルのデータ拡張の概念を導入します。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:18:07 GMT)
Light-induced fictitious magnetic fields for quantum storage in cold atomic ensembles [20.8] 我々は、低温原子アンサンブルにおける量子メモリの寿命を延ばすために、光学的に生成された架空の磁場を利用することができることを示した。
量子記憶に架空の磁場を用いることの利点は、これらの磁場を合成できる速度と空間的精度にある。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:20:20 GMT)
Improving child speech recognition with augmented child-like speech [20.7] 言語間の子子間音声変換は、子どものASR性能を著しく改善した。
最先端のASRは、子どものスピーチに最適なパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:56:46 GMT)
Self-Consuming Generative Models with Curated Data Provably Optimize Human Preferences [20.6] 本研究では,データキュレーションが生成モデルの反復的再学習に与える影響について検討する。
報奨モデルに従ってデータをキュレートすると、反復的再訓練手順の期待報酬が最大になることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:28:28 GMT)
GenDistiller: Distilling Pre-trained Language Models based on an Autoregressive Generative Model [20.6] 本稿では,より小規模な学生ネットワークによって,教師モデルの隠蔽表現を生成する新しい知識蒸留フレームワークであるGenDistillerを紹介する。
提案手法は,従来の隠蔽層を履歴とみなし,教師モデルの層間予測を自己回帰的に実施する。
実験により、自動回帰フレームワークを使わずに、GenDistillerのベースライン蒸留法に対する利点が明らかとなった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:25:00 GMT)
Adaptive Sparsity Level during Training for Efficient Time Series Forecasting with Transformers [20.2] textbfAdaptive textbfSparsity textbfPALS(textbfPALS)を提案する。
PALSはスパーストレーニングとトレーニングの方法からインスピレーションを得ている。
スパースニューラルネットワークのトレーニングにおいて、新しい"拡張"メカニズムを導入し、モデルを動的に縮小、拡張、あるいは安定して適切なスパースレベルを見つけることを可能にする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:25:39 GMT)
CoMoFusion: Fast and High-quality Fusion of Infrared and Visible Image with Consistency Model [20.0] 現在の生成モデルに基づく融合法は、しばしば不安定なトレーニングと遅い推論速度に悩まされる。
CoMoFusionは高品質な画像を生成し、高速な画像推論速度を実現する。
また、融合した画像のテクスチャや鮮やかな情報を高めるために、画素値選択に基づく新規な損失も設計する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:16:40 GMT)
DeTriever: Decoder-representation-based Retriever for Improving NL2SQL In-Context Learning [19.9] DeTrieverは、隠れた状態の重み付けを学習する新しいデモ検索フレームワークである。
提案手法は1ショットNL2タスクにおける最先端のベースラインを大幅に上回る。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:33:54 GMT)
Erasing Radio Frequency Fingerprints via Active Adversarial Perturbation [19.9] 本稿では、パイロット信号データから機械学習モデルを訓練して識別する、一般的なRFフィンガープリントシナリオについて考察する。
新たな対向攻撃ソリューションは適切な摂動を生成するように設計されており、パイロット信号はハードウェアの特徴を隠蔽し、モデルを誤分類することができる。
大規模な実験結果から,RF指紋を効果的に消去し,ユーザのプライバシーを保護できることが示されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:10:25 GMT)
To be Continuous, or to be Discrete, Those are Bits of Questions [19.9] 連続表現と離散表現の中間に位置する新しい表現としてバイナリ表現を導入する。
出力側の構造情報をラベル情報とともに保存する。
本モデルは,様々な構造化予測タスクにおける競合性能を実現する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:08:45 GMT)
Neural Thermodynamic Integration: Free Energies from Energy-based Diffusion Models [19.9] 熱力学積分(TI)は、自由エネルギー差を推定するための厳密な方法を提供する。
本稿では、トレーニング可能なニューラルネットワークで表されるアルケミカル経路に沿ってTIを実行することを提案する。
すべての中間アンサンブルをサンプリングするエネルギーベース拡散モデルの能力により、単一の参照計算からTIを実行することができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:08:29 GMT)
Boosting Multimedia Recommendation via Separate Generic and Unique Awareness [19.8] マルチメディアレコメンデーションのためのSAND(Separate Alignment aNd Distancing framework)を提案する。
まず、各モーダル機能を総称的および一意的な部分に分割し、次にアライメントモジュールにおいて、ジェネリックモーダルをアライメントするSoloSimLossを設計する。
分散モジュールでは、各モジュラリティがその固有かつ相補的な情報を保持するように、モダル・ジェネリックから特異なモジュラリティを遠ざけることを目的としている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:35:43 GMT)
PolySpeech: Exploring Unified Multitask Speech Models for Competitiveness with Single-task Models [19.7] 音声認識,音声合成,および2つの音声分類タスクをサポートするマルチタスク音声モデルであるPolySpeechを提案する。
PolySpeechは、シングルタスクモデルと比較して、さまざまなタスク間の競争力を示している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:35:46 GMT)
Regime Learning for Differentiable Particle Filters [19.4] 微分可能な粒子フィルタは、シーケンシャルモンテカルロ法とニューラルネットワークの柔軟性を組み合わせて状態空間推論を行う新しいモデルのクラスである。
個々の体制と切り替えプロセスの両方を同時に学習する事前のアプローチは存在しない。
本稿では,ニューラルネットワークを用いた微分可能粒子フィルタ(RLPF)を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:05:11 GMT)
Chinese MentalBERT: Domain-Adaptive Pre-training on Social Media for Chinese Mental Health Text Analysis [19.3] われわれは中国のソーシャルメディアプラットフォームから膨大なデータセットを収集した。
私たちは336万のテキストエントリを含むデータベースを作成するために、公開データセットでそれを強化しました。
心理学的テキスト分析へのモデルの適用性を高めるため,プレトレーニングマスキング機構に心理的レキシコンを組み込んだ。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:03:31 GMT)
GTA: Generative Trajectory Augmentation with Guidance for Offline Reinforcement Learning [19.2] Generative Trajectory Augmentation (GTA) は、トラジェクトリを高次かつ動的に検証可能なように拡張することで、オフラインデータを豊かにするように設計されている。
以上の結果から,GTAは汎用データ拡張戦略として,高密度かつ疎度な報酬設定において,広く使われているオフラインRLアルゴリズムの性能を向上させることが示唆された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:32:32 GMT)
MLCM: Multistep Consistency Distillation of Latent Diffusion Model [19.2] MLCM(Multistep Latent Consistency Models)は、低コストで高品質な画像合成のためのアプローチである。
MLCMは2~8ステップのみのサンプリングで高品質で楽しい画像を生成することができることを示す。
また、制御可能な生成、画像スタイル転送、中国画像生成を含むアプリケーションにおけるMLCMの汎用性を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:57:00 GMT)
FakeInversion: Learning to Detect Images from Unseen Text-to-Image Models by Inverting Stable Diffusion [18.8] 本稿では,オープンソース事前学習型安定拡散モデルを用いて得られた特徴を用いた新しい合成画像検出器を提案する。
これらの逆転により、検出器は高視力の未確認発電機によく一般化できることが示される。
本稿では, 逆画像探索を用いて, 検出器評価におけるスタイリスティックおよびテーマバイアスを緩和する, 新たな挑戦的評価プロトコルを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:14:58 GMT)
Mistral-C2F: Coarse to Fine Actor for Analytical and Reasoning Enhancement in RLHF and Effective-Merged LLMs [18.6] 本稿では,LLMの対話的・分析的能力に固有の制約に対処する,2段階の2段階の粗悪なアクタモデルを提案する。
この手法を一般的なMistral-C2Fモデルに適用し、11の言語タスクとMT-Benchダイアログタスクで例外的な性能を示すMistral-C2Fを作成する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:42:13 GMT)
Bioinformatics and Biomedical Informatics with ChatGPT: Year One Review [18.5] 2023年は、様々な分野にわたる大規模言語モデル(LLM)チャットボット、特にChatGPTの適用に関する調査において、大きな急上昇を見せた。
バイオインフォマティクスおよびバイオインフォマティクスにおけるChatGPTの適用状況を調査し,オミクス,遺伝学,バイオメディカルテキストマイニング,薬物発見,バイオメディカルイメージ理解,バイオインフォマティクスプログラミング,バイオインフォマティクス教育について調査した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:50:31 GMT)
Optimal Qubit Mapping Search for Encoding Classical Data into Matrix Product State Representation with Minimal Loss [18.4] Matrix Product State (MPS) は、古典的なデータを量子状態に符号化するためのフレームワークを提供する。
本研究では,MPS表現の効率性と精度を向上させる手法について検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:24:06 GMT)
A Unified Characterization of Private Learnability via Graph Theory [18.4] 純粋かつ近似微分プライベート(DP)学習性を特徴付ける統一的なフレームワークを提供する。
DP学習性の特徴を特徴づけるグラフ理論次元を同定する。
また、独立な興味を持つかもしれない矛盾グラフの性質も明らかにする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:19:23 GMT)
ProTrain: Efficient LLM Training via Memory-Aware Techniques [18.3] 本稿では,メモリ,計算,IOの調整によってメモリ使用量と性能のバランスをとる新しいトレーニングシステムであるProTrainを提案する。
ProTrainは、SOTAのトレーニングシステムと比較して、トレーニングのスループットを1.43$times$から2.71$timesに改善する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:40:06 GMT)
Stronger, Cheaper and Demonstration-Free Log Parsing with LLMs [18.2] トレーニングプロセスやラベル付きデータを必要としない,費用対効果の高いLCMベースのログであるLogBatcherを提案する。
我々は16の公開ログデータセットの実験を行い、ログ解析にLogBatcherが有効であることを示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:17:10 GMT)
Causality for Tabular Data Synthesis: A High-Order Structure Causal Benchmark Framework [18.1] 本稿では,自然の先行知識として高次構造因果情報を導入する。
合成データの質を評価するために,複数のベンチマークタスク,高次メトリクス,因果推論タスクを下流タスクとして提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:12:49 GMT)
LLMs Can't Plan, But Can Help Planning in LLM-Modulo Frameworks [18.1] 計画と推論タスクにおけるLLM(Large Language Models)の役割には、かなりの混乱がある。
自己回帰型LSMは、それ自体で計画や自己検証を行うことはできない、と我々は主張する。
本稿では,LLMの強みと外部モデルベース検証器を併用した bf LLM-Modulo Framework のビジョンを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:13:11 GMT)
Set-Based Prompting: Provably Solving the Language Model Order Dependency Problem [18.0] 本稿では,LLMの出力が指定されたサブシーケンスのセットに順序依存しないことを保証する手法であるSet-Based Promptingを提案する。
我々の入力が分布外であるにもかかわらず、期待される精度への影響は小さく、予測は、一様に選択された応答のシャッフルの順序を超える。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:59:13 GMT)
A Generic Layer Pruning Method for Signal Modulation Recognition Deep Learning Models [18.0] ディープニューラルネットワークは信号分類の方法として好まれている。
それらはしばしば高い計算複雑性と大きなモデルサイズを持つ。
本稿では,この課題に対処する新しいレイヤ・プルーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:46:37 GMT)
DPSW-Sketch: A Differentially Private Sketch Framework for Frequency Estimation over Sliding Windows (Technical Report) [18.0] textscDPSW-Sketchは、カウントミンスケッチに基づいたスライドウィンドウフレームワークである。
我々は、textscDPSW-Sketchが最先端の方法よりもはるかに優れたユーティリティプライバシトレードオフを提供することを示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:24:19 GMT)
2.5D Multi-view Averaging Diffusion Model for 3D Medical Image Translation: Application to Low-count PET Reconstruction with CT-less Attenuation Correction [17.9] ポジトロン・エミッション・トモグラフィ(PET)は重要な臨床画像診断ツールであるが、患者や医療機関に必然的に放射線障害をもたらす。
非減衰補正低線量PETを減衰補正標準線量PETに変換する3D法の開発が望ましい。
近年の拡散モデルは、従来のCNNベースの手法よりも優れた画像から画像への翻訳のための最先端のディープラーニング手法として登場した。
NACを用いた3次元画像から画像への変換のための新しい2.5次元マルチビュー平均拡散モデル(MADM)を開発した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:22:41 GMT)
Eliciting Better Multilingual Structured Reasoning from LLMs through Code [17.9] 我々は6言語にまたがる4つのタスクを網羅する,xSTREETと呼ばれる多言語構造推論と説明データセットを提案する。
xSTREETは、英語と非英語の推論タスクの基本的なLLMパフォーマンスのギャップを露呈する。
このギャップを緩和する2つの方法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:13:01 GMT)
HDNet: Physics-Inspired Neural Network for Flow Estimation based on Helmholtz Decomposition [17.8] HDNetは任意の流れ場のヘルムホルツ分解を実行する。
入力フローを分散のみのコンポーネントとカールのみのコンポーネントに分解する。
PINNとしてHDNetは完全に微分可能であり、任意のフロー推定問題に容易に統合できる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:11:32 GMT)
FSBI: Deepfakes Detection with Frequency Enhanced Self-Blended Images [17.7] 本稿では、ディープフェイク検出のための周波数強調自己ブレンド画像手法を提案する。
提案手法はFF++とCeleb-DFデータセットで評価されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:15:00 GMT)
Asymptotic Unbiased Sample Sampling to Speed Up Sharpness-Aware Minimization [17.7] シャープネス認識最小化(AUSAM)を加速する漸近的アンバイアスサンプリングを提案する。
AUSAMはモデルの一般化能力を維持しながら、計算効率を大幅に向上させる。
プラグアンドプレイでアーキテクチャに依存しない手法として、我々のアプローチはSAMを様々なタスクやネットワークで継続的に加速させる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:47:44 GMT)
Multivariate Log-based Anomaly Detection for Distributed Database [17.3] MultiLogは、分散データベースに適した、革新的な多変量ログベースの異常検出アプローチである。
我々の実験は、この新しいデータセットに基づいて、MultiLogの優位性を実証し、既存の最先端メソッドを約12%上回った。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:01:30 GMT)
Probing Implicit Bias in Semi-gradient Q-learning: Visualizing the Effective Loss Landscapes via the Fokker--Planck Equation [17.2] 本稿では,Fokker-Planck方程式を導入し,サンプリングによって得られた部分的データを用いて,効率的な損失景観の構築と可視化を行う。
ロスランドスケープにおけるグローバルなミニマは, 効果のあるロスランドスケープにおけるサドルポイントに変化し, セミグラディエント手法の暗黙の偏りを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:37:53 GMT)
Speech Emotion Recognition with ASR Transcripts: A Comprehensive Study on Word Error Rate and Fusion Techniques [17.2] 本研究では、よく知られたコーパス上で、単語誤り率(WER)の異なるASR文字を用いた音声感情認識のベンチマークを行う。
本稿では,ASRの誤り訂正とモダリティ-ゲート融合を統合し,より低WER,高SER結果を実現する統合されたASRエラーロバストフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:59:25 GMT)
Experimental benchmarking of quantum state overlap estimation strategies with photonic systems [17.1] トモグラフィー・トモグラフィー・プロジェクション,シュール集団計測,光スワップテストの4つの方法を比較した。
フォトニックシステムでは、各戦略に対する重なり依存的な推定精度が、一様サンプリング状態に対する平均推定ばらつきによって定量化される。
その結果、量子システムから興味のパラメータを抽出することに新たな光を当て、効率的な量子プロトコルの設計を促した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:10:58 GMT)
Generalizable Disaster Damage Assessment via Change Detection with Vision Foundation Model [17.0] 本稿では, DAVI(Disaster Assessment with VIsion foundation model)を提案する。
DAVIは、ソース領域でトレーニングされたモデルからイメージセグメンテーション基礎モデルにタスク固有の知識を統合し、ターゲット領域の損傷の可能性を示す擬似ラベルを生成する。
次に、ピクセルと全体像の両方をターゲットとした2段階の精細化プロセスを使用して、災害現場におけるより正確に変化を特定します。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:21:28 GMT)
Co-learning-aided Multi-modal-deep-learning Framework of Passive DOA Estimators for a Heterogeneous Hybrid Massive MIMO Receiver [16.8] 完全デジタル(FD) 大規模なマルチインプット多重出力(MIMO)アンテナアレイは、データ伝送と到着方向(DOA)測定に広く応用されている。
計算複雑性と回路コストの2つの大きな課題に直面している。
この2つの問題は、ハイブリッドアナログデジタル構造(HAD)によってうまく対処できる。
しかし、HADの位相曖昧性の問題があるため、その低効率性や高レイテンシにつながる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:16:01 GMT)
Metaverse Identity: Core Principles and Critical Challenges [16.8] メタバースアイデンティティには,emphEquivalenceとAlignmentとemphFusionとExpansivenessの2つの基本原則を提案する。
メタバースアイデンティティーの未来を形作るための積極的かつ協調的なアプローチの重要性について,本論文は結論づける。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:29:59 GMT)
A$^{2}$-MAE: A spatial-temporal-spectral unified remote sensing pre-training method based on anchor-aware masked autoencoder [16.7] リモートセンシング(RS)データは、重要な空間情報、時間情報、スペクトル情報を含む、複数の次元にわたる地球観測を提供する。
RSデータの特徴に合わせた様々な事前学習手法にもかかわらず、重要な制限は持続する: 空間、時間、スペクトル情報を単一の統一モデルに効果的に統合できないことである。
本研究では,異なる種類の画像と地理情報から固有の補完情報を活用し,事前学習期間中にマスク付きパッチを再構築するアンカー・アウェア・マスク付きオートエンコーダ手法(A$2-MAE)を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:02:15 GMT)
Dual-Pipeline with Low-Rank Adaptation for New Language Integration in Multilingual ASR [16.6] 提案手法は低ランク適応 (LoRA) を持つ双対ピペリンを用いる。
FLEURSデータセットから事前学習したWhisperモデルを19言語に拡張し,提案手法の有効性を検証する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:17:57 GMT)
Bayesian Optimization of Function Networks with Partial Evaluations [16.4] 本稿では,どのノードと対応する入力を選択して,コストを意識して評価する知識勾配獲得関数を提案する。
我々の獲得関数は、幅広い種類の関数ネットワークの費用対効果を最適化する最初の方法である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:13:55 GMT)
Languages Transferred Within the Encoder: On Representation Transfer in Zero-Shot Multilingual Translation [16.4] 多言語調査における基本尺度の欠如に対処するため,自己翻訳文であるアイデンティティペアを導入する。
エンコーダは、言語に依存しない状態ではなく、対象言語の表現部分空間にソース言語を転送することを示した。
本研究では,1)エンコーダにおける低ランク言語固有の埋め込みと,2)デコーダにおける表現の言語固有のコントラスト学習の2つの手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:16:30 GMT)
Guiding Frame-Level CTC Alignments Using Self-knowledge Distillation [16.4] 本稿では, 訓練期間中のフレームレベルのアライメントを誘導する自己知識蒸留(SKD)手法を提案する。
全体として、我々のアプローチは資源効率と性能の両方を改善するのに効果的です。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:22:52 GMT)
On Trojans in Refined Language Models [16.1] 言語モデルにおけるトロイの木馬は、製品レビューの感情を決定するなど、特定のアプリケーションのためにモデルが洗練されるときに挿入することができる。
本稿では,データ・ポゾン・脅威モデルの多様性を解明し,実証的に検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 00:01:32 GMT)
KernelWarehouse: Rethinking the Design of Dynamic Convolution [16.1] KernelWarehouseはカーネルの基本概念を再定義し、カーネルを組み立てる。
我々は、さまざまなConvNetアーキテクチャを用いて、ImageNetおよびMS-COCOデータセットにおけるKernelWarehouseの有効性を検証した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:16:26 GMT)
History, Development, and Principles of Large Language Models-An Introductory Survey [16.1] 自然言語処理(NLP)の基盤となる言語モデル
数十年にわたる広範な研究を経て、言語モデリングは、初期統計言語モデル(SLM)から、大規模言語モデル(LLM)の現代的景観へと進歩してきた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:28:12 GMT)
PE: A Poincare Explanation Method for Fast Text Hierarchy Generation [16.1] 本稿では,双曲空間との特徴的相互作用をモデル化するための新しい手法であるPoincare Explanation(PE)を提案する。
具体的には、テキスト階層の構築を、双曲空間に散在する木を見つけるものとして捉えている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:17:47 GMT)
Beyond the Mean: Differentially Private Prototypes for Private Transfer Learning [16.0] 本稿では,個人間移動学習の新たなパラダイムとして,DPPL(differially Private Prototype Learning)を提案する。
DPPLは、埋め込み空間内の各プライベートクラスを表すプロトタイプを生成し、推論のために公開することができる。
エンコーダの事前トレーニング以上の公開データを活用すれば,プライバシユーティリティのトレードオフをさらに改善できることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:41:12 GMT)
Pruning is Optimal for Learning Sparse Features in High-Dimensions [16.0] 本研究では,勾配勾配勾配で学習したプルーンドニューラルネットワークを用いて,統計モデルのクラスを最適に学習可能であることを示す。
ニューラルネットワークのプルーニングが$boldsymbolV$のスパーシリティレベルに比例すると、未切断ネットワークと比較してサンプルの複雑さが向上することを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:43:12 GMT)
Benchmarking and Boosting Radiology Report Generation for 3D High-Resolution Medical Images [15.9] 大規模言語モデル(LLM)に基づく高分解能(HR)3Dボリュームの放射線学レポートを効率的に生成する新しいフレームワークを提案する。
具体的には、低解像度(LR)視覚トークンをクエリとして使用し、HRトークンから情報をマイニングし、詳細なHR情報を保存し、計算コストを削減する。
BIMCV-RGは、5,328 HRのボリュームとペアのレポートを持つ新しいデータセットで、3D HRの医療画像からレポートを生成するための最初のベンチマークを確立します。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:00:21 GMT)
Next-Generation Database Interfaces: A Survey of LLM-based Text-to-SQL [15.8] 大規模言語モデル(LLM)は、自然言語理解において重要な能力を示している。
PLMはテキスト・ツー・タスクに利用され、有望な性能を実現している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:13:17 GMT)
IMFL-AIGC: Incentive Mechanism Design for Federated Learning Empowered by Artificial Intelligence Generated Content [15.6] フェデレートラーニング(FL)は、クライアントがローカルデータをアップロードすることなく、共有グローバルモデルを協調的にトレーニングできる、有望なパラダイムとして登場した。
顧客参加を促すため,データ品質を考慮したインセンティブ機構を提案する。
提案したメカニズムは,トレーニングの精度が高く,実世界のデータセットによるサーバコストの最大53.34%を削減できる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:47:22 GMT)
Multilingual Nonce Dependency Treebanks: Understanding how Language Models represent and process syntactic structure [15.6] SPUD (Semantically Perturbed Universal Dependencies) は、Universal Dependencies (UD) コーパスのためのナンスツリーバンクを作成するためのフレームワークである。
我々は、アラビア語、英語、フランス語、ドイツ語、ロシア語でナンスデータを作成し、SPUDツリーバンクの2つのユースケースを実証する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:41:16 GMT)
Effective, Platform-Independent GUI Testing via Image Embedding and Reinforcement Learning [15.5] アプリケーションテストに有効なプラットフォームに依存しないアプローチであるPIRLTestを提案する。
コンピュータビジョンと強化学習技術を利用して、新しいシナジスティックな方法で自動テストを行う。
PILTestは、Q-networkを使用して特定の状態-アクションペアの値を見積もる好奇心駆動型戦略のガイダンスで、アプリを探索する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:56:52 GMT)
CoXQL: A Dataset for Parsing Explanation Requests in Conversational XAI Systems [15.4] 大規模言語モデル(LLM)に基づく会話説明型人工知能(ConvXAI)システム
ConvXAIシステムは、無料チャットではなく意図認識に基づいている。
CoXQLは、ConvXAIでユーザ意図認識のための最初のデータセットである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:27:10 GMT)
LLM-assisted Concept Discovery: Automatically Identifying and Explaining Neuron Functions [15.4] 以前の研究は、概念の例や事前に定義された概念のセットに基づいて、ニューロンに関連づけられた概念を持っている。
本稿では,マルチモーダルな大規模言語モデルを用いて,自動的かつオープンな概念発見を提案する。
我々は,この新たな画像に対して,サンプルと反例を生成し,ニューロンの反応を評価することにより,それぞれの概念を検証する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:19:37 GMT)
Secure Information Embedding and Extraction in Forensic 3D Fingerprinting [15.2] 3Dプリンティングの流行は公衆の安全に重大なリスクをもたらす。
情報を識別する3Dプリントをタグ付けするために、いくつかのアプローチが取られている。
指紋として知られるこの情報は、様々なビット埋め込み技術を用いてオブジェクトに書き込まれる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:07:22 GMT)
What Variables Affect Out-Of-Distribution Generalization in Pretrained Models? [15.0] トレーニング済みのディープニューラルネットワーク(DNN)によって生成された埋め込みは広く使用されているが、下流タスクに対する効果は様々である。
トンネル効果仮説のレンズによるプレトレーニングDNN埋め込みの分布外一般化に影響を与える要因について検討した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 00:25:46 GMT)
Consistency Regularization for Domain Generalization with Logit Attribution Matching [15.0] ドメイン一般化(Domain Generalization, DG)とは、ドメインシフトの下でよく一般化されるトレーニングモデルである。
トレーニングドメインには、同じ意味情報を共有するサンプルのペアの集合が与えられています。
整合正則化がDGに導出可能であることを示す理論を提案し、ロジットマッチングと呼ばれる新しいCR法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:14:07 GMT)
Unique Security and Privacy Threats of Large Language Model: A Comprehensive Survey [14.8] プリトレーニング、微調整、RAGシステム、デプロイ、LLMベースのエージェントという5つのシナリオに基づいて、ユニークなプライバシとセキュリティの問題を強調します。
各リスクの特徴について、この調査は潜在的な脅威と対策を提供する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:55:32 GMT)
The Importance of Positional Encoding Initialization in Transformers for Relational Reasoning [14.7] トランスフォーマーにおける推論のための位置符号化(PE)を研究する。
学習可能なPEは、他の一般的なPEよりも優れています。
その結果,関係推論タスクにおいて,高い性能,堅牢なPEを学習することの重要性が浮き彫りになった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:37:29 GMT)
ALPS: Improved Optimization for Highly Sparse One-Shot Pruning for Large Language Models [14.3] ALPSは,演算子分割法と事前条件付き勾配共役型後処理法を用いて,プルーニング問題に対処する最適化ベースのフレームワークである。
提案手法はベクトル化とGPU並列性を有効利用しながら収束を加速し理論的に保証する新しい手法を取り入れている。
OPT-30Bモデルでは70%の間隔で、ALPSはWikiTextデータセットにおけるテストの難易度を13%削減し、既存の手法と比較してゼロショットベンチマークのパフォーマンスを19%改善した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:57:41 GMT)
Runtime Analysis of the SMS-EMOA for Many-Objective Optimization [14.3] 本稿ではSMSEMOAのための厳密なランタイム解析を行う。
SMS-EMOA は GSEMO と NSGA-II に匹敵する性能を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:55:13 GMT)
Intelligent Multi-View Test Time Augmentation [14.1] 本稿では、視点変動に対する画像分類モデルの堅牢性と精度を高めるために、インテリジェントなテスト時間拡張(TTA)アルゴリズムを提案する。
従来のTTA法とは違って,予測的不確実性指標に基づいて最適な拡張をインテリジェントに選択する。
本研究は,画像分類のロバスト性向上における適応的,不確実性を考慮したTTAの可能性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:59:01 GMT)
Improving Policy Optimization via $\varepsilon$-Retrain [14.1] $varepsilon$-retrainは、モノトニック改善の保証でポリシーを最適化しながら、行動の選好を促進するために設計された探索戦略である。
本手法では, 定型的再起動状態分布と再トレーニング領域を減衰係数$varepsilon$で切り換えることにより, エージェントが優先権に反する状況で再トレーニングを行うことができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:16:26 GMT)
FormulaReasoning: A Dataset for Formula-Based Numerical Reasoning [14.0] 我々は,5,420の推論に基づく質問からなるフォーミュラ推論という,式に基づく数値推論のためのデータセットを構築した。
ゼロショットおよび少数ショットチェーン・オブ・シント法を用いて, 7B から 100B 以上のパラメータで LLM の評価を行う。
また、データセットに関連付けられた外部公式データベースを備えた検索拡張LDMについても検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:19:55 GMT)
Eyes Wide Unshut: Unsupervised Mistake Detection in Egocentric Video by Detecting Unpredictable Gaze [14.0] 本稿では,人的活動のビデオにおける誤り検出のための教師なし手法を提案する。
そこで本研究では,タスク中の視線不整合を示す異常な視線パターンを解析することにより,視線完了モデルを提案する。
期待された視線経路と観測された視線経路の違いは、誤りを特定する指標として機能する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:29:45 GMT)
A Unified Search and Recommendation Framework Based on Multi-Scenario Learning for Ranking in E-commerce [14.0] 統一検索・レコメンデーション(USR)のための効果的で普遍的なフレームワークを提案する。
USRは様々なマルチシナリオモデルに適用でき、性能を大幅に改善することができる。
USRは7Fresh Appでうまくデプロイされている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:38:21 GMT)
MobileDiffusion: Instant Text-to-Image Generation on Mobile Devices [13.9] 我々は,高効率なテキスト・画像拡散モデルである textbfMobileDiffusion を提案する。
蒸留法と拡散GAN微調整法をMobileDiffusionに応用し, それぞれ8ステップと1ステップの推論を行った。
MobileDiffusionは、モバイルデバイス上で512times512$の画像を生成するために、驚くべきTextbfsub秒の推論速度を達成する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:16:21 GMT)
How to Distinguish AI-Generated Images from Authentic Photographs [13.9] ガイドでは、AI生成画像によく現れる人工物と不確実性の5つのカテゴリを明らかにしている。
拡散モデルで128枚の画像を生成し,ソーシャルメディアから9枚の画像をキュレートし,42枚の実写写真をキュレートした。
この種のアーティファクトや不確実性に注意を向けることで、私たちは、AI生成画像と実際の写真とをより適切に区別することを目指しています。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:23:27 GMT)
Are Objective Explanatory Evaluation metrics Trustworthy? An Adversarial Analysis [12.9] 本論文の目的は,Pixel Elimination を用いた SHifted Adversaries と呼ばれる新しい説明手法を考案することである。
我々は、SHAPEは、一般的な重要度に基づく視覚的XAI手法の堅牢性と信頼性を測定するために使用される因果的指標を騙す逆説であることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:39:46 GMT)
Ad Auctions for LLMs via Retrieval Augmented Generation [12.9] 本稿では,大規模言語モデル(LLM)のテキスト出力における広告アロケーションと価格設定のための新しいオークション機構を提案する。
RAGフレームワークに従って,各談話セグメントに対して広告を確率的に検索するセグメントオークションを提案する。
我々は,配分効率と公平性のバランスをとる福祉の新しい概念である対数社会福祉を最大化することを示し,関連するインセンティブに適合する価格設定を特徴付ける。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 22:05:51 GMT)
I Don't Know You, But I Can Catch You: Real-Time Defense against Diverse Adversarial Patches for Object Detectors [12.8] 我々は,高い一般化,堅牢性,効率性を備えた,敵パッチ検出の革新的なモデルである textitNutNet を提案する。
本手法は, HA と AA の既存手法よりも 2.4 倍, 4.7 倍高い平均防御性能を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:16:19 GMT)
When Do Skills Help Reinforcement Learning? A Theoretical Analysis of Temporal Abstractions [12.7] スキルは強化学習(RL)のパフォーマンスを改善するための時間的抽象化である。
状態に対する解が圧縮性に乏しい環境では,RL性能の低下が理論的,実証的に証明される。
我々の発見は、自動スキル発見の研究をガイドし、RL実践者がいつ、どのようにスキルを使うかをよりよく決めるのに役立つことを願っている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:01:42 GMT)
SEGAN: semi-supervised learning approach for missing data imputation [12.6] 本稿では,セミ教師付き学習に基づくデータ補完モデルSEGANを提案する。
SEGANモデルでは、ジェネレータは、欠落したデータ値を予測する際に、既知のデータとそのラベル情報をよりフルに利用することができる。
本稿では,SEGANモデルがナッシュ平衡に達すると,実データ分布特性を学習できることを理論的に証明する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:21:53 GMT)
Multi-group Learning for Hierarchical Groups [12.5] 我々は、多群学習の研究を、群が階層的に構造化される自然の場合にまで拡張する。
そこで我々は,ほぼ最適なサンプル量を持つ解釈可能かつ決定論的決定木予測器を出力するアルゴリズムを設計する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:23:37 GMT)
Adaptive Swarm Mesh Refinement using Deep Reinforcement Learning with Local Rewards [12.5] Adaptive Mesh Refinement (AMR) は有限要素法(FEM)を改良する
我々は、AMRを複数の新しいエージェントに反復的に分割する、協調的、均質なエージェントのシステムとして定式化する。
我々のアプローチであるAdaptive Swarm Mesh Refinement (ASMR)は、効率的な安定した最適化を提供し、推論中にユーザ定義の解像度で高度に適応的なメッシュを生成する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:26:54 GMT)
Applications of Explainable artificial intelligence in Earth system science [12.5] このレビューは、説明可能なAI(XAI)の基礎的な理解を提供することを目的としている。
XAIはモデルをより透明にする強力なツールセットを提供する。
我々は、地球系科学(ESS)において、XAIが直面する4つの重要な課題を識別する。
AIモデルは未知を探索し、XAIは説明を提供することでギャップを埋める。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:05:29 GMT)
Residual Learning and Context Encoding for Adaptive Offline-to-Online Reinforcement Learning [12.4] オフライン解の出力を補正するために動的変化を推論する残差学習手法を提案する。
提案手法は,これらの動的変化に適応し,サンプル効率のよい方法で目に見えない摂動に一般化可能であることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:04:26 GMT)
Tailoring Generative AI Chatbots for Multiethnic Communities in Disaster Preparedness Communication: Extending the CASA Paradigm [12.4] 本研究は, GPT 4を用いたジェネレーティブAI(GenAI)チャットボットのプロトタイプを開発し, 多様な住民にハリケーン予知情報を伝達する試みである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:57:28 GMT)
Bandit Sequential Posted Pricing via Half-Concavity [12.4] バンディット学習モデルにおいて,逐次ポスト価格について検討した。
各ラウンドで、売り手は$n$の買い手に対して$n$の価格を投稿する。
我々の主な成果は、単一項目のシーケンシャルなポスト価格に対して、ほぼ最適の後悔境界を得る。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:02:06 GMT)
A PDE-based Explanation of Extreme Numerical Sensitivities and Edge of Stability in Training Neural Networks [12.4] 勾配降下型深層ネットワーク(SGD)の現在の訓練実践における抑制的数値不安定性を示す。
我々は、偏微分方程式(PDE)の数値解析を用いて理論的枠組みを提示し、畳み込みニューラルネットワーク(CNN)の勾配降下PDEを分析する。
これはCNNの降下に伴う非線形PDEの結果であり、離散化のステップサイズを過度に運転すると局所線形化が変化し、安定化効果がもたらされることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:15:37 GMT)
LibriTTS-P: A Corpus with Speaking Style and Speaker Identity Prompts for Text-to-Speech and Style Captioning [12.1] 我々は、LibriTTS-Rに基づく新しいコーパスであるLibriTTS-Pを紹介し、発話スタイルの発話レベル記述(即ち、プロンプト)と話者特性の話者レベルプロンプトを含む。
スタイルキャプションタスクの結果から, LibriTTS-P を用いたモデルは, 従来のデータセットを用いたモデルよりも2.5倍正確な単語を生成することがわかった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:49:21 GMT)
Emotional Conversation: Empowering Talking Faces with Cohesive Expression, Gaze and Pose Generation [12.0] 3次元顔のランドマークを中間変数として用いた2段階の音声駆動音声顔生成フレームワークを提案する。
このフレームワークは、自己指導型学習を通じて、表現、視線、感情との協調的なアライメントを実現する。
我々のモデルは、視覚的品質と感情的アライメントの両方において、最先端のパフォーマンスを著しく向上させる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:00:00 GMT)
On (Normalised) Discounted Cumulative Gain as an Off-Policy Evaluation Metric for Top-$n$ Recommendation [12.0] 計算累積ゲイン(Discounted Cumulative Gain, NDCG)は、経験的研究において広く採用されている指標の一つである。
我々は、我々の偏見のないDCGの推定値が、指標固有の仮定に違反した場合であっても、オンライン報酬と強く相関していることを示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:01:45 GMT)
Correlation-aware Coarse-to-fine MLPs for Deformable Medical Image Registration [12.0] 変形可能な医用画像登録のための相関対応登録ネットワーク(CorrMLP)を提案する。
当社のCorrMLPでは,新しい粗大な登録アーキテクチャにおいて,相関性を考慮したマルチウィンドウブロックを導入している。
7つの公開医療データセットによる実験により、私たちのCorrMLPは最先端の変形可能な登録方法よりも優れています。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:21:52 GMT)
Open Problems in DAOs [12.0] 分散型自治組織(DAOs)は、契約によって統治される、急速に成長する新しい組織である。
スマートコンコンストラクタの新たな科学に研究者が貢献する方法を述べる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:42:54 GMT)
Document-level Claim Extraction and Decontextualisation for Fact-Checking [12.0] ファクトチェックのための文書レベルのクレーム抽出手法を提案する。
文書から中心文を識別するために,まずクレーム抽出を抽出要約として再放送する。
次に、文の非コンテクスト化を通じて、原文から必要なコンテキストを含むように書き直します。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:11:48 GMT)
SimSAM: Simple Siamese Representations Based Semantic Affinity Matrix for Unsupervised Image Segmentation [11.8] 非競合型SSLアプローチ(SimSiam)に触発されて,セマンティック親和性行列を計算するための新しいフレームワークSIMSAMを導入する。
画像が与えられた後、SIMSAMは事前に訓練されたDINO-ViTを使って特徴を抽出し、その特徴を投影し、非コントラスト的な方法で密度の高い特徴の相関を予測する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:17:06 GMT)
Orthogonalized Estimation of Difference of $Q$-functions [11.7] オフライン強化学習は、利用可能な観測データを持つ多くの環境で重要であるが、安全性、コスト、その他の懸念から、オンラインで新しいポリシーをデプロイできない。
CATEのような因果的コントラスト関数の因果的推論と機械学習目標推定の最近の進歩は、決定を最適化するのに十分であり、潜在的にスムーズな構造に適応できる。
我々は、Rラーナーの動的一般化を開発し、$Qpi$-functions, $Qpi(s,1)-Qpi(s,0)$の差を推定し、最適化する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 23:41:43 GMT)
PPG-to-ECG Signal Translation for Continuous Atrial Fibrillation Detection via Attention-based Deep State-Space Modeling [11.6] 光胸腺造影法(英: Photoplethysmography, PPG)は、光学的手法を用いて心臓生理学を計測する費用効率の高い非侵襲的手法である。
本稿では,PPG信号を対応するECG波形に変換するために,主観非依存の注目に基づく深部状態空間モデル(ADSSM)を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:41:16 GMT)
Spatial-Frequency Dual Progressive Attention Network For Medical Image Segmentation [11.6] 医用画像では、様々な種類の病変が、形状やテクスチャに顕著な違いを呈することが多い。
正確な医用画像セグメンテーションは、マルチスケールおよびバウンダリの特徴学習において堅牢な機能を持つディープラーニングモデルを必要とする。
本稿では,空間周波数デュアルドメインアテンションネットワークであるSF-UNetを紹介する。
マルチスケールプログレッシブ・チャンネル・アテンション(MPCA)ブロックは隣接するエンコーダ層にまたがるマルチスケールの特徴を徐々に抽出し、軽量な周波数空間アテンション(FSA)ブロックはわずか0.05Mのパラメータしか持たない。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:22:05 GMT)
Are LLMs classical or nonmonotonic reasoners? Lessons from generics [11.6] 本研究では,7つのLLMの非単調推論能力を1つの抽象的および1つの常識的推論タスクで研究する。
LLMは人間の非単調な推論能力に従って推論パターンを示すが、ジェネリックスの真理条件に関する安定した信念を維持できない。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:18:40 GMT)
GPU-accelerated Auxiliary-field quantum Monte Carlo with multi-Slater determinant trial states [11.5] 本稿では,グラフィック処理ユニットアクセラレーション ph-AFQMC の実装と応用について述べる。
マルチスレーター試行状態を用いて、ph-AFQMCは強い相関系を忠実に扱う可能性がある。
我々の研究はMSDAFQMC計算の効率を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:15:17 GMT)
Filter Pruning based on Information Capacity and Independence [11.4] 本稿では,フィルタを解釈可能,マルチパースペクティブ,軽量な方法で選択する新しいフィルタプルーニング手法を提案する。
各フィルタに含まれる情報量について,情報容量と呼ばれる新しい指標を提案する。
フィルタ間の相関について、情報独立と呼ばれる別の指標が設計されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:05:18 GMT)
Ents: An Efficient Three-party Training Framework for Decision Trees by Communication Optimization [11.3] セキュアなマルチパーティ計算に基づく意思決定ツリーのためのマルチパーティトレーニングフレームワークにより、複数のパーティが、プライバシ保護を備えた分散プライベートデータ上で、高性能モデルをトレーニングすることができる。
決定木のための既存のマルチパーティトレーニングフレームワークは、通信オーバーヘッドが大きいため、コミュニケーションの非効率性を実証する。
本稿では,コミュニケーション最適化による意思決定木のための効率的な3要素学習フレームワークであるEntsを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:13:11 GMT)
One-Step Effective Diffusion Network for Real-World Image Super-Resolution [11.3] 本稿では,Real-ISR問題に対する1ステップの効果的な拡散ネットワーク,すなわちOSEDiffを提案する。
我々は,KL分散正則化を行うために,潜時空間における変分点蒸留を適用した。
実験の結果,OSEDiffは,客観的指標と主観的評価の両方の観点から,同等あるいはさらに優れたリアルISR結果が得られることが示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:10:31 GMT)
Banal Deception Human-AI Ecosystems: A Study of People's Perceptions of LLM-generated Deceptive Behaviour [11.3] 大規模言語モデル(LLM)は、ユーザに誤った、不正確な、あるいは誤解を招く情報を提供する。
本研究は,ChatGPTが生成する騙し行動に対する人々の認識について検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:36:06 GMT)
A Multi-Resolution Mutual Learning Network for Multi-Label ECG Classification [11.1] 本稿では,Multi-Resolution Mutual Learning Network (MRM-Net)を提案する。
MRM-Netはデュアルレゾリューションアテンションアーキテクチャと機能補完機構を備えている。
マルチラベルのECG分類性能において、既存の手法よりも大幅に優れています。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:40:03 GMT)
Benchmarking PathCLIP for Pathology Image Analysis [11.0] 明るさ,コントラスト,ガウスのぼかし,解像度,彩度,色調,マークアップの7種類の汚職を4つの重度レベルで導入する。
PathCLIPは画像の破損に対して比較的堅牢であり,ゼロショット分類ではOpenAI-CLIPとPLIPを上回っている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:22:24 GMT)
Large Language Model Unlearning via Embedding-Corrupted Prompts [10.9] 本稿では,大規模言語モデルのための軽量なアンラーニングフレームワークであるEmbeding-Corrupted (ECO) Promptsを紹介する。
推論中に未学習の状態を識別し、忘れるプロンプトを保護するためにプロンプト分類器を用いて強制する。
その結果, 学習対象を満足させるだけでなく, 忘れることを意図したデータに基づいて訓練されたことのないモデルから得られる出力を, より正確に近似できることがわかった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:56:20 GMT)
Scalable Defect Detection via Traversal on Code Graph [10.9] グラフベースの静的解析プラットフォームであるQVoGを導入し、欠陥や脆弱性を検出する。
合理的なグラフサイズを維持するために圧縮されたCPG表現を使用し、それによって全体的なクエリ効率が向上する。
1000,000行以上のコードからなるプロジェクトでは、QVoGはコードQLで19分ではなく、およそ15分で分析を完了できる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:24:52 GMT)
OpenCOLE: Towards Reproducible Automatic Graphic Design Generation [10.8] 我々はOpenCOLEと呼ばれる自動グラフィック設計のためのオープンなフレームワークを提案する。
先駆的なCOLEの修正版を構築し、公開データセットにのみモデルをトレーニングします。
GPT4Vの評価に基づいて,本モデルでは元のCOLEに匹敵する有望な性能を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:00:07 GMT)
From Variance to Veracity: Unbundling and Mitigating Gradient Variance in Differentiable Bundle Adjustment Layers [10.8] ロボット工学における様々なポーズ推定と追跡問題は、対応推定問題と重み付き最小二乗最適化問題に分解することができる。
近年の研究では、他方の出力に条件付きを反復的に精製することで2つの問題を結合させることで、ドメイン間でSOTA結果が得られることが示されている。
これらのモデルのトレーニングは難しいことが分かり、トレーニングを安定させ、スピードアップするためには、数多くのトリックが必要になることがわかりました。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 00:41:25 GMT)
Underneath the Numbers: Quantitative and Qualitative Gender Fairness in LLMs for Depression Prediction [10.7] 本研究は、抑うつ検出のための機械学習モデルにおいて、性差の程度を調査するための最初の試みである。
定量的評価の結果,ChatGPTは様々なパフォーマンス指標で最高の性能を示した。
また,ジェンダーフェアネスを質的に評価するために,LLMが採用するテーマをいくつか挙げた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:14:19 GMT)
Labeling Comic Mischief Content in Online Videos with a Multimodal Hierarchical-Cross-Attention Model [10.7] そこで本研究では,コミック誤字検出のための新しいエンドツーエンドマルチモーダルシステムを提案する。
本稿では,ビデオ,テキスト(字幕と字幕),音声の3つのモードからなる目標タスクのための新しいデータセットをリリースする。
その結果,提案手法はロバストなベースラインよりも大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:16:45 GMT)
Label-aware Hard Negative Sampling Strategies with Momentum Contrastive Learning for Implicit Hate Speech Detection [10.4] ランダムにサンプリングされたバッチデータに基づく対照的な学習は、モデルに強い負のサンプルを学習させることを促さない。
本稿では,強陰性サンプルから詳細な特徴を学習するためのラベル認識型強陰性サンプリング戦略 (LAHN) を提案する。
LAHNは、インデータセットとクロスデータセットの両方において、暗黙のヘイトスピーチ検出のために既存のモデルより優れている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:24:58 GMT)
Are Large Language Models Good Statisticians? [10.4] StatQAは統計解析タスク用に設計された新しいベンチマークである。
GPT-4oのような最先端モデルでさえ、64.83%の最高の性能を実現していることを示す。
オープンソースのLLMは限られた能力を示すが、細調整されたものは顕著に改善されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:23:51 GMT)
Qualitative Data Analysis in Software Engineering: Techniques and Teaching Insights [10.2] ソフトウェアリポジトリは、ソースコードコメント、コミットメッセージ、イシュー記述、ドキュメントなど、質的なアーティファクトの豊富なソースである。
この章では、さまざまな定性的データ分析技術を用いて、これらのアーティファクトの解釈に焦点を移す。
データ解釈における一貫性と精度を確保するため、コーディングガイドの戦略的設計とともに様々なコーディング手法について議論する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:56:55 GMT)
Rating Multi-Modal Time-Series Forecasting Models (MM-TSFM) for Robustness Through a Causal Lens [10.1] ノイズや不正なデータによる不正確さが誤った予測につながるような,マルチモーダルな時系列予測に重点を置いている。
本稿では,マルチモーダル時系列予測モデルのロバスト性を評価するための評価手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:39:16 GMT)
Coherent Optical Modems for Full-Wavefield Lidar [10.1] 距離, 軸速度, 偏光を測定するために, 市販のコヒーレント光モデムを再利用した新しい画像モダリティであるフルウェーブフィールドライダーを導入する。
既存のライダーと比較して、フルウェーブフィールドライダーは、短時間、マイクロ秒露光時間、信頼性の高い速度測定、周囲光や他のライダー信号からの干渉に対する堅牢性からmmスケールの精度の向上を約束している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:24:41 GMT)
IRJIT: A Simple, Online, Information Retrieval Approach for Just-In-Time Software Defect Prediction [10.1] Just-in-Timeソフトウェア欠陥予測(JIT-SDP)は、コミットチェックイン時にそれらを特定することによって、ソフトウェアへの欠陥の導入を防止する。
現在のソフトウェア欠陥予測アプローチは、変更メトリクスなどの手作業による機能に依存しており、マシンラーニングやディープラーニングモデルのトレーニングにコストがかかる。
我々は,ソースコード上の情報検索を利用して,過去のバグやクリーンなコミットと類似性に基づいて,新しいコミットをバグやクリーンとしてラベル付けするIRJITという手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:40:24 GMT)
Teaching Literature Reviewing for Software Engineering Research [10.1] 本章の目標は、文学評論に大学院生を紹介した教師を支援することである。
本報告では, 文献レビュープロセス全体の概要と, 各種文献レビューの実施ガイドラインを策定する前に, 各種文献レビューの実施方法について概説する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:16:29 GMT)
SLEB: Streamlining LLMs through Redundancy Verification and Elimination of Transformer Blocks [10.0] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて非常に効果的であることが証明されている。
既存の手法はしばしば、実質的なエンドツーエンドのLLM推論スピードアップを達成するのに苦労する。
SLEBは、冗長なトランスフォーマーブロックを排除し、LCMを合理化するための新しいアプローチである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:40:12 GMT)
Taming Throughput-Latency Tradeoff in LLM Inference with Sarathi-Serve [9.9] 高スループットと低レイテンシのトレードオフに対処するため,効率的な推論スケジューラであるSarathi-Serveを導入する。
我々の手法は、テール遅延下でのモデルとハードウェア間での推論性能を大幅に改善する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:13:20 GMT)
FLUX: Fast Software-based Communication Overlap On GPUs Through Kernel Fusion [9.7] 本稿では,GPUに依存する計算で通信遅延を著しく隠蔽する新しいFlux法を提案する。
Fluxは核融合によって最大96%の通信を重複させる可能性がある。
全体としては、様々なGPU世代と相互接続を持つ128GPUのクラスタ上で、Megatron-LM上でのトレーニングのために、最大1.24倍のスピードアップを達成することができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:12:23 GMT)
LayeredDoc: Domain Adaptive Document Restoration with a Layer Separation Approach [9.6] 本稿では,文書画像復元システムにおける領域適応性を向上するテキスト・グラフィック・レイヤ分離手法を提案する。
本稿では,2つのレイヤ情報を利用するLayeredDocを提案する。第1のターゲットは粗粒のグラフィックコンポーネントであり,第2のレイヤは機械印刷されたテキストコンテンツを洗練する。
本研究では,本研究のために開発された新しい実世界のデータセットであるLayeredDocDBを用いて,定性的かつ定量的にアプローチを評価する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:41:01 GMT)
AnyRotate: Gravity-Invariant In-Hand Object Rotation with Sim-to-Real Touch [9.6] 我々は,高密度のsim-to-realタッチを用いた重力不変多軸物体回転システムであるAnyRotateを提案する。
シミュレーションにおいて高密度な触覚ポリシーを訓練することによりこの問題に対処し、ゼロショットポリシー伝達を実現するために、リッチな触覚センシングのためのsim-to-real法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:25:44 GMT)
Knowledge-Induced Medicine Prescribing Network for Medication Recommendation [9.6] 本研究は,医学を推薦する知識誘導型医薬処方ネットワーク(KindMed)を提案する。
我々は、階層的シーケンス学習を利用して、患者の歴史的入院における臨床(診断と処置)と医療の流れの時間的ダイナミクスを発見し、融合させ、パーソナライズされたレコメンデーションを育む。
実世界のEHRコホートに対するKindMedの有効性を検証し,少数のグラフ駆動ベースラインに対する推奨性能の改善を実現した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:44:44 GMT)
Attentive Merging of Hidden Embeddings from Pre-trained Speech Model for Anti-spoofing Detection [9.6] 本稿では, アンチスプーフィングタスクにおけるWavLMモデルの多層挙動について検討する。
We found that the early hidden transformer layer of the WavLM large model contribute significantly to anti-spoofing task。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:27:44 GMT)
Manipulating the Relaxation Time of Boundary-Dissipative Systems through Bond Dissipation [9.4] 本研究では, 結合散逸が境界散逸系の緩和時間に及ぼす影響について検討した。
我々の研究は、オープンシステムでは、ある種類の消散が、別の種類の消散によって生じる影響を規制するために使用できることを明らかにしている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:48:08 GMT)
On the Impact of Dataset Properties on Membership Privacy of Deep Learning [9.3] 我々は、細調整された大規模な画像分類モデルの実用的プライバシー脆弱性をテストするために、最先端の会員推論攻撃(MIA)を適用した。
データ内のクラス毎の例数とMIA脆弱性との間には強力な電力法則が依存していることがわかった。
線形モデルを用いて、データセットの特性に基づいて真の正の確率を予測し、未知のデータに対するMIA脆弱性をよく観察する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:51:40 GMT)
Wiki Entity Summarization Benchmark [9.3] エンティティの要約は知識グラフにおけるエンティティの簡潔な要約を計算することを目的としている。
既存のデータセットとベンチマークは、しばしば数百のエンティティに制限される。
我々は、エンティティ、要約、およびそれらの接続からなる包括的なベンチマークであるWikESを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:22:00 GMT)
HelpSteer2: Open-source dataset for training top-performing reward models [9.2] 我々はパーミッシブにライセンスされた選好データセットであるHelpSteer2を開発した。
HelpSteer2は1万のレスポンスペアで構成されている。
本稿では,報奨モデルによって予測される多属性スコアを効果的に活用できるモデルアライメント手法であるSteerLM 2.0を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 22:28:08 GMT)
Global Clipper: Enhancing Safety and Reliability of Transformer-based Object Detection Models [9.1] 推論中にビットフリップを引き起こすソフトエラーは、性能に大きく影響を与え、予測を変える。
本研究は,トランスフォーマーモデルに特化して設計された効果的な緩和戦略であるGlobal ClipperとGlobal Hybrid Clipperを紹介する。
ソフトエラーに対するレジリエンスを大幅に向上させ、欠陥推論を0%に削減する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:54:33 GMT)
Harder or Different? Understanding Generalization of Audio Deepfake Detection [8.9] 最近の研究は、音声のディープフェイク検出における重要な課題を強調している。
これは、テキスト音声(TTS)モデルの品質が継続的に向上していること、すなわち、より新しいDeepFakesは単に'ハード'で検出できるのか?
ドメイン内テストデータとドメイン外テストデータのパフォーマンスギャップを'ハードネス'と'ディファレンス'コンポーネントに分解することで、この問題に答える。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:54:01 GMT)
2nd Place Solution for MOSE Track in CVPR 2024 PVUW workshop: Complex Video Object Segmentation [8.9] インスタンスセグメンテーションを使用して、MOSEの有効およびテストセットから追加の事前学習データを生成する。
セグメント化されたインスタンスは、COCOから抽出されたオブジェクトと組み合わせて、トレーニングデータを増強し、ベースラインモデルのセマンティック表現を強化する。
PVUW 2024のMOSEトラックでは,$mathcalJ$が0.8007,$mathcalF$が0.8683,$mathcalJ$&$mathcalF$が0.8345であった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:21:33 GMT)
Mitigation of Channel Tampering Attacks in Continuous-Variable Quantum Key Distribution [8.8] CV-QKDでは、Denial-of-Service(DoS)攻撃を利用する潜在的な敵から通信妨害に対する脆弱性が持続する。
本稿では,DoS攻撃に触発されたCV-QKDにおいて,Channel Amplification (CA)攻撃と呼ばれる新たな脅威を導入する。
この脅威に対処するため,我々は検出・緩和戦略を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:02:55 GMT)
DLLens: Testing Deep Learning Libraries via LLM-aided Synthesis [8.8] テストは、ディープラーニング(DL)ライブラリの品質を保証するための主要なアプローチである。
既存のテスト技術では、テストオラクルの構築を緩和するために差分テストを採用するのが一般的である。
本稿では,DLライブラリテストのための新しい差分試験手法であるシーレンスを紹介する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:06:38 GMT)
A flexible empirical Bayes approach to multiple linear regression and connections with penalized regression [8.7] 大規模多重回帰に対する新しい経験的ベイズ手法を提案する。
当社のアプローチでは、フレキシブルな"適応縮小"と変分近似の2つの主要なアイデアが組み合わさっている。
提案手法では, 後進平均値がペナル化回帰問題を解く。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:54:56 GMT)
Balancing Molecular Information and Empirical Data in the Prediction of Physico-Chemical Properties [8.6] 本稿では,分子記述子と表現学習を組み合わせた一般的な手法を提案する。
提案したハイブリッドモデルは,グラフニューラルネットワークを用いた化学構造情報を利用する。
構造に基づく予測が信頼できない場合を自動的に検出し、表現学習に基づく予測によって修正する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:51:00 GMT)
SynthForge: Synthesizing High-Quality Face Dataset with Controllable 3D Generative Models [8.0] 生成モデルの最近の進歩は、フォトリアリスティックデータを制御可能な方法でレンダリングする能力を解き放った。
しかし、下流タスクのトレーニングにそのようなモデルを用いて生成されたデータの使用は、主に3D一貫性のあるアノテーションが欠如しているため、未調査のままである。
本実験は, 生成した合成データのみを用いた最先端モデルに対する競合性能を示し, 下流タスクの解決の可能性を示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:15:15 GMT)
GENIU: A Restricted Data Access Unlearning for Imbalanced Data [7.9] クラスアンラーニングでは、トレーニングされたモデルが、以前に学習した特定のクラスに属するデータを忘れることを可能にする。
GENIUは、非学習不均衡なデータ設定と制限されたデータアクセスのための最初の実践的フレームワークである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:24:53 GMT)
Geometric representations of braid and Yang-Baxter gates [7.8] ヤンバクスターゲートからなるれんがウォール回路は積分可能である。
量子コンピュータにYang-Baxterゲートを置くには、量子コンピュータのネイティブゲートに分解する必要がある。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:21:48 GMT)
Characterizing and Detecting Propaganda-Spreading Accounts on Telegram [7.8] 偽情報キャンペーンやプロパガンダなどのソーシャルメディアに対する情報ベースの攻撃は、サイバーセキュリティの脅威を生じさせている。
本稿では,適切なユーザメッセージとプロパガンダ応答の関係を活かした新しいプロパガンダ検出機構を提案する。
本手法は, より高速で安価で, 検出率(97.6%)が11.6ポイント高い。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:07:27 GMT)
Universal Scale Laws for Colors and Patterns in Imagery [7.6] 画像中の色やパターンの分布は、空間分解能とダイナミックスを調整するカスケードを通して観察される。
結果は平衡物理学とスペクトル画像から得られるニューラルネットワークに関心がある。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:38:33 GMT)
Ablation Based Counterfactuals [7.5] ABC (Ablation Based Counterfactuals) は、モデル再訓練ではなくモデルアブレーションに依存する反ファクト解析を行う手法である。
拡散モデルの集合を用いてこのようなモデルを構築する方法を示す。
次に、このモデルを用いて、完全な対物的景観を列挙することで、トレーニングデータ属性の限界を研究する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:22:51 GMT)
An insertable glucose sensor using a compact and cost-effective phosphorescence lifetime imager and machine learning [7.5] 生体適合性蛍光をベースとした挿入型バイオセンサと、カスタム設計の蛍光寿命イメージング装置(PLI)を統合した連続グルコースモニタリング(CGM)システムについて報告する。
PLIは、皮膚を通して挿入可能なセンサーの蛍光寿命を捉え、発光された蛍光信号の寿命を局所的なグルコース濃度によって調節するように設計されている。
ライフタイム画像は、グルコースレベルの不整合耐性推論のためのニューラルネットワークベースのモデルによって処理される。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 00:18:47 GMT)
BackCache: Mitigating Contention-Based Cache Timing Attacks by Hiding Cache Line Evictions [7.5] L1データキャッシュ攻撃は、重大なプライバシーと機密性の脅威を引き起こす。
BackCacheは常にキャッシュミスではなくキャッシュヒットを達成し、L1データキャッシュに対する競合ベースのキャッシュタイミング攻撃を軽減します。
BackCacheは、解放されたキャッシュラインをL1データキャッシュから完全に連想的なバックアップキャッシュに配置して、排除を隠蔽する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:07:44 GMT)
MobileAgentBench: An Efficient and User-Friendly Benchmark for Mobile LLM Agents [7.5] 大規模言語モデル(LLM)ベースのモバイルエージェントは、携帯電話のグラフィカルユーザインタフェース(GUI)と直接対話できることから、ますます人気が高まっている。
学術部門と産業部門の両方で有望な見通しにもかかわらず、既存のモバイルエージェントのパフォーマンスをベンチマークすることに注力する研究はほとんどない。
我々は、広範囲な手動テストの負担を軽減するために、効率的でユーザフレンドリなベンチマークMobileAgentBenchを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:14:50 GMT)
PixMamba: Leveraging State Space Models in a Dual-Level Architecture for Underwater Image Enhancement [7.4] 水中画像強調(UIE)は海洋調査や探査に重要であるが、複雑な色歪みと激しいぼやけによって妨げられている。
近年のディープラーニングに基づく手法は目覚ましい成果を上げているが、これらの手法は高い計算コストと不十分なグローバルモデリングに苦慮している。
我々は,ステートスペースモデル(SSM)を活用して,効率的なグローバル依存性モデリングを実現することにより,これらの課題を克服するために設計された新しいアーキテクチャであるPixMambaを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:34:38 GMT)
Model-Based Minimum Bayes Risk Decoding for Text Generation [7.4] 最小ベイズリスク(MBR)デコーディングは、ビームサーチデコーディングの強力な代替手段であることが示されている。
テキスト生成タスクにおけるモンテカルロ推定よりもモデルに基づく推定の方が有望であることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:00:09 GMT)
A Self-boosted Framework for Calibrated Ranking [7.4] キャリブレーションランキング(Calibrated Ranking)は、正確なランキング品質とキャリブレーションされた確率予測を同時に追求するスケールキャリブレーションランキングシステムである。
それまでの方法は、ランキングの損失を計算するために、単一のミニバッチ内に完全な候補リストを集約する必要があった。
校正ランク付けのための自己ブーストフレームワーク(SBCR)を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:00:49 GMT)
Asymptotically Optimal Regret for Black-Box Predict-then-Optimize [7.4] 我々は,特別な構造を欠いた新たなブラックボックス予測最適化問題と,その行動から得られる報酬のみを観察する方法について検討した。
本稿では,経験的ソフトレグレット(ESR, Empirical Soft Regret)と呼ばれる新しい損失関数を提案する。
また、私たちのアプローチは、ニュースレコメンデーションやパーソナライズされた医療における現実の意思決定問題において、最先端のアルゴリズムよりも大幅に優れています。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:46:23 GMT)
An Enhanced Prompt-Based LLM Reasoning Scheme via Knowledge Graph-Integrated Collaboration [7.4] 本研究では,知識グラフ(KG)と大規模言語モデル(LLM)の緊密な協調を含む協調学習自由推論手法を提案する。
このような協調的な手法により、より信頼性の高い知識に基づく推論を実現し、推論結果の追跡を容易にする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:03:31 GMT)
Exploring Fuzzing as Data Augmentation for Neural Test Generation [7.3] ファジィ化と大規模言語モデルの利点を組み合わせた新しいデータ拡張手法を提案する。
FuzzAugは、拡張データに有効なプログラムセマンティクスを保持し、テスト中の関数に対してより多様なインプットを提供する。
FuzzAugの利点は、ニューラルテスト生成データセットで利用して、最先端のコード生成モデルをトレーニングすることで評価する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 22:09:27 GMT)
CADS: A Systematic Literature Review on the Challenges of Abstractive Dialogue Summarization [7.2] 本稿では、英語対話におけるトランスフォーマーに基づく抽象要約に関する研究を要約する。
ダイアログ要約における主な課題(言語、構造、理解、話者、サリエンス、事実)をカバーします。
言語などいくつかの課題がかなりの進歩を遂げているのに対して、理解、事実性、サリエンスといった課題は依然として困難であり、重要な研究機会を持っている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:47:09 GMT)
Gaussian Splatting with NeRF-based Color and Opacity [7.1] 本研究では、3Dオブジェクトの形状のGS表現と、色と不透明度のNeRFに基づく符号化を利用するハイブリッドモデルであるビューングディビジョン・ガウス・スティング(VDGS)を提案する。
我々のモデルは、テクスチャや光の成分を追加することなく、影、光の反射、そして3Dオブジェクトの透明さをよりよく記述します。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:06:02 GMT)
MWIRSTD: A MWIR Small Target Detection Dataset [7.1] 本稿では、新しい中波長赤外(MWIR)小型目標検出データセット(MWIRSTD)を提案する。
約1053の画像を含む14の動画シーケンスと、3種類の小さなオブジェクトの注釈付きターゲットを含む。
このデータセットは、研究者が現実のMWIRシーンで小さな物体を検出する最先端の手法を開発し、評価するユニークな機会を提供する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:26:52 GMT)
Code Simulation Challenges for Large Language Models [7.0] この研究は、LLM(Large Language Models)がいかにコーディングやアルゴリズムのタスクをシミュレートできるかを研究する。
我々は、直線プログラムのベンチマーク、クリティカルパスを含むコード、近似命令および冗長命令を導入する。
本稿では,コンパイラのパターンを行/フォローすることで,LLMにコード実行行をシミュレートするように指示する,OFFプロンプト手法であるChain of Simulation(CoSm)を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:55:13 GMT)
RAGged Edges: The Double-Edged Sword of Retrieval-Augmented Chatbots [6.9] ChatGPTの幻覚(もっともらしいが偽の情報を生み出す)は大きな課題となる。
本稿では、外部知識をプロンプトと統合することにより、検索・拡張生成が幻覚にどのように対処できるかを考察する。
以上の結果から,RAGの精度は向上するが,事前学習されたモデル理解と直接矛盾する場合は,まだ誤解が残る可能性がある。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:00:52 GMT)
CTC-aligned Audio-Text Embedding for Streaming Open-vocabulary Keyword Spotting [6.9] 本稿では,テキストベースのキーワード入力によるオープン語彙キーワードスポッティング(KWS)のストリーミング手法を提案する。
提案手法は,各入力フレームに対して,コネクショニスト時間分類(CTC)を用いて最適なアライメント終端を求める。
次に、フレームレベルの音響埋め込み(AE)を集約して、ターゲットのキーワードテキストのテキスト埋め込み(TE)と整合する高レベル(文字、単語、フレーズ)のAEを得る。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:44:40 GMT)
LiSD: An Efficient Multi-Task Learning Framework for LiDAR Segmentation and Detection [6.8] LiSDはボクセルベースのエンコーダデコーダフレームワークで、セグメンテーションと検出の両方のタスクに対処する。
これは、ライダーのみの手法のnuScenesセグメンテーションベンチマークにおいて、83.3% mIoUの最先端性能を達成する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:26:46 GMT)
SE(3)-Equivariant and Noise-Invariant 3D Rigid Motion Tracking in Brain MRI [6.8] 動作追跡にSE(3)-equivariant CNN(E-CNN)を用いる最初の方法であるEquiTrackを提案する。
ステアブルなE-CNNは、さまざまなポーズで対応する特徴を抽出できるが、ノイズの多い医療画像でそれらをテストすると、ノイズ不変性を学ぶのに十分な学習能力がないことが分かる。
等変空間特徴の抽出から無関係強度特徴の処理を分離するために,E-CNNとデノイザをペアリングするハイブリッドアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:49:15 GMT)
Unsupervised domain adaptation by learning using privileged information [6.7] 補助変数による側情報への訓練時間アクセスは,入力変数の制約緩和に有効であることを示す。
本稿では,対象領域における予測誤差の分析から着想を得た単純な2段階学習アルゴリズムと,画像分類のための実用的エンドツーエンド変種を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:40:35 GMT)
FaithFill: Faithful Inpainting for Object Completion Using a Single Reference Image [6.7] FaithFillは、行方不明なオブジェクト部品を現実的に生成するための拡散ベースの塗装手法である。
本研究では,FithFillが1つの参照画像から,オブジェクトの欠落部分の忠実な生成と,背景・シーンの保存を両立させることを実証する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:45:33 GMT)
Enhancing Pre-Trained Generative Language Models with Question Attended Span Extraction on Machine Reading Comprehension [6.6] 学習前生成言語モデル(PLM)の微調整段階で統合されたQASEは,その性能を著しく向上させる。
QASEモジュールの有効性は、さまざまなデータセットで厳格にテストされている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:47:01 GMT)
A Comprehensive Survey on Machine Learning Driven Material Defect Detection: Challenges, Solutions, and Future Prospects [6.6] 材料欠陥(MD)は、製品性能に影響を及ぼし、関連する製品における安全性の問題を引き起こす主要な課題である。
MDの迅速かつ正確な同定と局在化は、MDに関連する現代の課題に対処する上で重要な研究課題である。
近年、機械学習(ML)技術の急速な進歩により、ディープラーニングはコア技術として急速に発展し、材料欠陥検出(MDD)の顕著な研究方向となっている。
我々はMDDに適用されたML手法を,教師なし学習,教師なし学習,半教師付き学習,強化学習,生成学習の5つのカテゴリに分類した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:19:55 GMT)
Unify the effect of anharmonicity in double-wells and anharmonic oscillators [6.5] 我々は、基底と第1励起状態の間のエネルギーギャップを計算し、量子無調波発振器における無調波効果について検討した。
我々は、量子相転移の観点から、それらの非調和性のこの接続を説明する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:15:46 GMT)
Unveiling Incomplete Modality Brain Tumor Segmentation: Leveraging Masked Predicted Auto-Encoder and Divergence Learning [6.4] 脳腫瘍のセグメンテーションは、特にマルチモーダルMRI(Multi-modal magnetic resonance imaging)における重要な課題である。
本稿では,不完全なモダリティデータから頑健な特徴学習を可能にする,マスク付き予測事前学習方式を提案する。
微調整段階において、我々は知識蒸留技術を用いて、完全なモダリティデータと欠落したモダリティデータの間に特徴を整列させ、同時にモデルロバスト性を向上する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:35:16 GMT)
Sharding SMR with Optimal-size Shards for Highly Scalable Blockchains [6.4] Areteは、サイズセキュリティのジレンマを解決するために設計された、最適にスケーラブルなブロックチェーンシャーディングアーキテクチャである。
私たちはAreteを実装し、地理的に分散したAWS環境で評価します。
以上の結果から,Areteはトランザクションスループットやクロスシャード確認遅延の観点から,最先端のシャーディングプロトコルよりも優れています。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:23:53 GMT)
PAL: Pluralistic Alignment Framework for Learning from Heterogeneous Preferences [6.4] 我々は、既存の事前学習戦略を補完する人間の嗜好をモデル化するフレームワークであるPALを提案する。
PALは,強いベースラインと比較して,競争報酬モデルの精度が向上することを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:54:54 GMT)
Floquet topological phases with time-reversal and space inversion symmetries and dynamical detection of topological charges [6.4] 強いトポロジカル絶縁体、二階トポロジカル絶縁体、ハイブリッド階トポロジカル絶縁体を単一の4バンド系で持つことが可能である。
本研究は,従来の状態を超えた交互境界状態を持つ新しいトポロジカル絶縁体の理論的基礎を提供する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:10:30 GMT)
Is Programming by Example solved by LLMs? [6.4] PBE(Programming-by-Examples)は、入力出力の例からアルゴリズムを生成することを目的としている。
我々は,Large Language Models (LLMs) が PBE の解き方について検討する。
事前訓練されたモデルはPBEでは有効ではないが、より高性能に微調整できる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:16:40 GMT)
IndirectRequests: Making Task-Oriented Dialogue Datasets More Natural by Synthetically Generating Indirect User Requests [6.3] 我々は、間接ユーザ要求(IUR)として、自然な人間の会話とは明らかに異なる発話を言う。
本研究では, あるドメインに対して, 現実的で高品質なIURを自動生成するLLMパイプラインを提案する。
その結果, GPT-3.5 や GPT-4 のような大型 LLM は高品質な IUR を生成するが, より小型のモデルで同様の品質を実現することは困難である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:18:04 GMT)
Regret Lower Bounds for Learning Linear Quadratic Gaussian Systems [6.3] 時間の地平線で等級$sqrtT$のスケーリングを示す、残念な低い境界を導出します。
私たちの境界は制御理論パラメータの役割を正確に捉えており、制御が難しいシステムも制御が難しいことを示すことができます。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:11:28 GMT)
ADBA:Approximation Decision Boundary Approach for Black-Box Adversarial Attacks [6.3] ブラックボックス攻撃はステルス性があり、機械学習モデルからハードラベルを使用して敵の例を生成する。
本稿では,近似決定境界(ADB)を用いて摂動方向を効率よく正確に比較する手法を提案する。
我々のADBアプローチ(ADBA)の有効性は、適切なADBを迅速に同定し、全ての摂動方向を確実に区別することにある。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:49:16 GMT)
Testing Quantum and Simulated Annealers on the Drone Delivery Packing Problem [6.2] ドローン配送パッキング問題(DDPP)は、人的介入を減らす必要性に加えて、配送プロセスの需要の増加に対応するロジスティクスの文脈で発生する。
本稿では,2次非制約二元最適化(QUBO)問題としてDDPPの2つの定式化を提案する。
我々は、この最適化問題に対する量子アニールの利点と限界を示す広範な実験を行う。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:16:02 GMT)
Hierarchical Reinforcement Learning for Swarm Confrontation with High Uncertainty [6.2] 未知の相手の戦略や動的な障害によって引き起こされる高い不確実性は、アクション空間をハイブリッド決定プロセスに複雑化する。
本稿では,目標配置層,経路計画層,基礎となる動的相互作用機構からなる新しい階層型強化学習手法を提案する。
ハイブリッドプロセスを離散的なアロケーション層と連続的な計画層に分離し、確率的アンサンブルモデルを用いて不確実性を定量化し、相互作用周波数を適応的に調節する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:12:10 GMT)
Shifted Interpolation for Differential Privacy [6.2] 雑音勾配降下とその変種は、微分プライベート機械学習の主要なアルゴリズムである。
本稿では、$f$差分プライバシの統一化フレームワークにおいて、"corollary によるプライバシ増幅" 現象を確立する。
これは、強力な凸最適化の基礎的な設定において、最初の正確なプライバシー分析につながる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:08:27 GMT)
Text Sentiment Analysis and Classification Based on Bidirectional Gated Recurrent Units (GRUs) Model [6.1] 本稿では,自然言語処理分野におけるテキスト感情分析と分類の重要性について考察する。
双方向ゲート再帰単位(GRU)モデルに基づく感情分析と分類の新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:12:17 GMT)
CAFO: Feature-Centric Explanation on Time Series Classification [6.1] MTSの現在の説明法は、主に時間中心の説明に焦点を当てており、重要な期間を特定できるが、重要な特徴を特定するのにはあまり効果がない。
本研究は,MCSのための新しい特徴中心的説明・評価フレームワークであるCAFOについて紹介する。
フレームワークの有効性は、2つの主要な公開ベンチマークと実世界のデータセットに関する広範な実証分析を通じて検証される。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:27:51 GMT)
GAME-ON: Graph Attention Network based Multimodal Fusion for Fake News Detection [6.0] 我々は,マルチモーダルフェイクニュース検出のためのより堅牢なデータ表現を学習するための,グラフニューラルネットワークに基づくエンドツーエンドトレーニング可能なフレームワークであるGAME-ONを提案する。
当社のモデルはTwitter上で平均11%向上し、Weiboでは2.6%のマージンで競争力を維持する一方で、最も優れた最先端ベースラインよりも65%少ないパラメータを使用する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:54:19 GMT)
Adaptive Teaching with a Shared Classifier for Knowledge Distillation [6.0] 知識蒸留(KD)は、教師ネットワークから学生ネットワークへ知識を伝達する技術である。
共有分類器(ATSC)を用いた適応型授業を提案する。
提案手法は,CIFAR-100とImageNetのデータセットに対して,単教師と多教師の両方のシナリオで最新の結果が得られる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:51:08 GMT)
Actor-Critic or Critic-Actor? A Tale of Two Time Scales [5.9] 収束の証明を提供し、この2つを関数近似および無関数近似と経験的に比較する。
提案アルゴリズムは,精度と計算労力の両面で,アクタ・アクタに匹敵する性能を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:14:21 GMT)
Uniform Memory Retrieval with Larger Capacity for Modern Hopfield Models [5.9] 本稿では,現代のホップフィールドモデルに対する2段階のメモリ検索ダイナミクスを提案する。
主な貢献は学習可能な特徴写像 $Phi$ であり、ホップフィールドエネルギー関数をカーネル空間に変換する。
記憶されたメモリパターンを学習データとして利用し、現代のホップフィールドモデル全体のメモリ容量を向上させる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:57:21 GMT)
Visual-RolePlay: Universal Jailbreak Attack on MultiModal Large Language Models via Role-playing Image Character [5.9] 本稿では,MLLMジェイルブレイク攻撃に対する視覚ロールプレイ(VRP)と呼ばれる新しい効果的手法を提案する。
VRPは、リスクの高い文字の詳細な記述を生成し、その記述に基づいて対応する画像を生成する。
良質なロールプレイインストラクションテキストと組み合わせると、これらのハイリスクなキャラクターイメージはMLLMを効果的に誤解して悪意ある応答を発生させる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:13:48 GMT)
Strategies for Pretraining Neural Operators [5.8] 偏微分方程式(PDE)モデリングの事前トレーニングは、一般化性と性能を改善するために、データセットをまたいだニューラルネットワークのスケーリングを約束している。
我々は,事前学習のダイナミクスを特徴付けるために,アーキテクチャ選択を最適化することなく,事前学習手法を比較した。
プレトレーニングはモデルとデータセットの選択に大きく依存するが、一般的な転送学習や物理ベースのプレトレーニング戦略が最も有効である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:56:46 GMT)
Subsampling is not Magic: Why Large Batch Sizes Work for Differentially Private Stochastic Optimisation [5.8] 差分プライベート勾配降下(DP-SGD)におけるバッチサイズが全勾配変動に与える影響について検討する。
DP-SGDは現代のDP深層学習の基礎であり、その特性は広く研究されており、近年の研究では大規模なバッチサイズが有用であることが実証されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:23:38 GMT)
PowerInfer-2: Fast Large Language Model Inference on a Smartphone [5.8] PowerInfer-2は、スマートフォン上での大規模言語モデルの高速推論のために設計されたフレームワークである。
PowerInfer-2は、TurboSparse-Mixtral-47Bモデルで毎秒11.68トークンを生成する最初のシステムである。
完全にメモリに収まるモデルでは、PowerInfer-2はメモリ使用量の約40%の削減を達成できる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:39:41 GMT)
Flexible, Model-Agnostic Method for Materials Data Extraction from Text Using General Purpose Language Models [5.7] 大規模言語モデル(LLM)は、人間がテキストと対話する方法を変えつつある。
本研究では,全文研究論文から資料データを抽出する簡便かつ効率的な手法を実証する。
このアプローチでは、抽出されたプロパティに関するコーディングや事前の知識は最小限から不要である。
結果のデータベースにおいて、高いリコールとほぼ完璧な精度を提供する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:25:15 GMT)
Towards Reliable Empirical Machine Unlearning Evaluation: A Game-Theoretic View [5.7] 本研究では,非学習アルゴリズムとMIA敵とのゲームとして評価プロセスを形式化するゲーム理論フレームワークを提案する。
ゲームから誘導される評価基準は,既存の評価基準が満たせないという証明可能な保証を享受していることを示す。
この研究は、非学習アルゴリズムを実証的に評価するための、新しく信頼性の高いアプローチを示し、より効果的な非学習技術を開発するための道を開いた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:04:58 GMT)
Hyperparameter-Free Approach for Faster Minimum Bayes Risk Decoding [5.6] 最小ベイズリスクデコーディング(MBR)は、幅広いテキスト生成タスクに対するビームサーチデコーディングの強力な代替手段である。
MBRは、目的を計算するのに膨大な時間を必要とする。
CBP(Confidence-based pruning)は、最近機械翻訳タスクにおける推論時間を削減するために提案されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:14:45 GMT)
Learning Job Title Representation from Job Description Aggregation Network [5.6] 既存の手法は主に、職務記述から抽出されたスキルを通してタイトル表現を学ぶことに依存している。
ジョブ記述(JD)を通じて職名を学ぶための代替フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:12:52 GMT)
Inductive Global and Local Manifold Approximation and Projection [5.6] まず,次元縮小と高次元データ可視化のための新しい多様体学習法であるGLoMAPを提案する。
我々はGLoMAPをインダクティブ版iGLoMAPに拡張し、ディープニューラルネットワークを用いてデータを低次元表現にマッピングする。
我々は,GLoMAPとiGLoMAPの両方をシミュレーションおよび実データ設定に適用し,最先端手法に対する競合実験を行った。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:22:27 GMT)
Explore-Go: Leveraging Exploration for Generalisation in Deep Reinforcement Learning [5.6] エージェントの一般化性能を高めるために,訓練中の探索量の増加を活用できることが示される。
本研究では,エージェントが訓練する状態の数を増やすことで,この直感を活用する新しい手法であるExplore-Goを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:39:31 GMT)
AustroTox: A Dataset for Target-Based Austrian German Offensive Language Detection [5.6] 我々は,オーストリアドイツ語方言の組み入れで有名なニュースフォーラムから得られた攻撃的言語検出のためのデータセットを紹介した。
我々は、下品な言語を構成する各コメント内のスパンを識別し、攻撃的発言のターゲットを表す。
ゼロショットおよび少数ショット方式で、微調整言語モデルだけでなく、大規模言語モデルも評価する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:04:11 GMT)
Measuring model variability using robust non-parametric testing [5.5] この研究は、異なるランダムシードで訓練されたディープネットモデルと、予測されたモデルの振る舞いとの関係を記述しようとするものである。
本稿では,$alpha$-trimming($alpha$-trimming)レベルと呼ばれる,ネットワーク類似性に関する新しい要約統計法を提案する。
我々は、$alpha$-trimmingレベルが、バリデーションの正確性、チャーン、または単独でのキャリブレーションエラーなど、さまざまなパフォーマンス指標よりも表現力が高いことを示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:08:15 GMT)
Security of AI Agents [5.5] AIエージェントの研究と開発は、大規模言語モデルによって促進されている。
本稿では,システムセキュリティの観点から,これらの脆弱性を詳細に識別し,記述する。
本報告では, 各脆弱性に対応する防御機構について, 厳密な設計と実験を行い, その生存性を評価する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 23:16:45 GMT)
An Industry Interview Study of Software Signing for Supply Chain Security [5.4] 多くのサイバーセキュリティフレームワーク、標準、規制は、ソフトウェア署名の使用を推奨している。
最近の調査によると、ソフトウェアシグネチャの採用率と品質は低い。
13の組織にまたがる18の業界実践者に対してインタビューを行った。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:30:53 GMT)
Scalable Training of Graph Foundation Models for Atomistic Materials Modeling: A Case Study with HydraGNN [5.4] 我々はHydraGNNを用いたスケーラブルグラフ基盤モデル(GFM)の開発と訓練について述べる。
HydraGNNは、トレーニングスケールとデータの多様性の両方において、グラフニューラルネットワーク(GNN)の境界を広げている。
GFMはマルチタスク学習(MTL)を用いて、原子構造体のグラフレベルとノードレベルの特性を同時に学習する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:21:42 GMT)
Accurate Explanation Model for Image Classifiers using Class Association Embedding [5.4] 本稿では,グローバルな知識とローカルな知識の利点を組み合わせた生成的説明モデルを提案する。
クラスアソシエーション埋め込み(CAE)は、各サンプルを1組のクラス関連コードと個別コードにエンコードする。
クラス関連特徴を個々の特徴から効率的に分離するビルディングブロック・コヒーレンシー特徴抽出アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:41:00 GMT)
DafnyBench: A Benchmark for Formal Software Verification [5.4] DafnyBenchは、正式なソフトウェア検証のための機械学習システムのトレーニングと評価のための、同社のタイプの最大のベンチマークである。
我々は,GPT-4 や Claude 3 などの LLM を用いて,約 53,000 行のコードで 750 以上のプログラムを検証できるように,Dafny 形式検証エンジンに十分なヒントを自動生成する機能をテストする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:53:31 GMT)
Research Trends for the Interplay between Large Language Models and Knowledge Graphs [5.4] 本稿では,大規模言語モデル(LLM)と知識グラフ(KG)の相乗関係について検討する。
本研究の目的は、KG質問回答、オントロジー生成、KG検証、およびLCMによるKG精度と一貫性の向上など、現在の研究におけるギャップに対処することである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:52:38 GMT)
General Distribution Learning: A theoretical framework for Deep Learning [5.3] 本稿では,機械学習と統計的タスクに対処する新しい理論フレームワークを提案する。
従来の統計機械学習とは別に、GD Learningは真の分布に焦点を当てている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:49:50 GMT)
$Classi|Q\rangle$ Towards a Translation Framework To Bridge The Classical-Quantum Programming Gap [5.2] $Classi|Qrangle$は、クラシックコンピューティングと量子コンピューティングを橋渡しするフレームワークである。
PythonやC++のようなハイレベルなプログラミング言語を低レベルな言語、例えばQuantum Assemblyに翻訳する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:31:16 GMT)
Multiple-Choice Questions are Efficient and Robust LLM Evaluators [5.2] GSM8KとMATH-MCの回答と誤予測を収集して構築した2つのデータセットを提案する。
これら2つのベンチマークのMCバージョンにおけるLCMの性能は、元のバージョンにおける性能と強く相関していることを示す。
同様の手順に従い、新しいプログラム出力予測MCデータセットであるPythonIOを紹介する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:05:40 GMT)
Runtime Freezing: Dynamic Class Loss for Multi-Organ 3D Segmentation [5.1] 本研究では,高度不均衡なトレーニングデータの効果を軽減するために,クラスベースの動的損失戦略を提案する。
提案手法は, 課題のあるマルチクラス3次元腹部臓器データセットにおいて, セグメンテーション性能をいかに向上させるかを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:45:47 GMT)
cPAPERS: A Dataset of Situated and Multimodal Interactive Conversations in Scientific Papers [5.1] 本研究は,学術論文のレビューから,対話型質問応答ペアのデータセットである会話型論文(cPAPERS)を紹介する。
本稿では,OpenReviewからこれらの質問応答ペアを収集し,ソースファイルからコンテキスト情報に関連付けるためのデータ収集戦略を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:46:12 GMT)
Nonlocal growth of quantum conditional mutual information under decoherence [5.1] 局所的な測定は絡み合いを引き起こすことはできないが、短距離の絡み合いを長距離の絡み合いに変換することができる。
我々は,長距離条件付き相互情報(CMI)のデコヒーレンス下での成長というより広い文脈において,測定誘起絡み合い(MIE)を定めている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:05:50 GMT)
Predictive Linear Online Tracking for Unknown Targets [5.0] 線形制御システムにおけるオンライントラッキングの問題について検討し,移動目標を追従することを目的とした。
予測線形オンライントラッキング(PLOT)と呼ばれる新しいアルゴリズムを提案する。
PLOTを実機に実装し,オープンソースソフトウェアを提供することにより,実機上でのオンライン制御手法の最初の成功例の1つを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:27:20 GMT)
Transformer-based Model for ASR N-Best Rescoring and Rewriting [4.9] 本研究では,N-best仮説の完全コンテキストを並列に探索することにより,書き換えと書き換えが可能なトランスフォーマーモデルを提案する。
我々のRescore+RewriteモデルはRescoreのみのベースラインよりも優れており、平均8.6%の単語誤り率(WER)がASRシステムに対して単独で減少することを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:39:44 GMT)
Political Leaning Inference through Plurinational Scenarios [4.9] この研究は、スペインにおける3つの多様な地域(バスク州、カタルーニャ州、ガリシア州)に焦点を当て、多党の分類の様々な方法を探究する。
我々は、リツイートから得られた教師なしユーザ表現と、その後の政治的傾き検出に使用される2段階の手法を用いる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:42:12 GMT)
The Surprising Effectiveness of Rankers Trained on Expanded Queries [4.9] 我々は,他のクエリのパフォーマンスを損なうことなく,難しいクエリや難しいクエリのランク付け性能を向上させる。
我々は,クエリ毎に推定されるクエリ性能スコアとともに,特殊ランク付け器と基本ランク付け器の関連性スコアを組み合わせる。
DL-Hardデータセットを用いた実験では,クエリ性能に基づくスコアリング手法が,パスランキングタスクにおいて最大25%の大幅な改善を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:34:43 GMT)
IFTD: Image Feature Triangle Descriptor for Loop Detection in Driving Scenes [4.9] STD法に基づく高速で堅牢な画像特徴三角形記述子(IFTD)を提案する。
3つの公開データセットによる実験結果から、我々のIFTDは最先端の手法よりもロバスト性や精度を向上できることが示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:59:58 GMT)
Strong and Weak Random Walks on Signed Networks [4.7] 本稿では,2つ以上のコミュニティを持つネットワークの構造を捉えることのできる,署名付きネットワークランダムウォークを提案する。
このウォークによって類似性行列が生成され、ノードを対角的なコミュニティにクラスタリングすることができる。
弱い歩行に基づく類似性行列は、教師なしおよび半自明なクラスタリングの両方に利用できることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:36:20 GMT)
BookSQL: A Large Scale Text-to-SQL Dataset for Accounting Domain [4.7] 会計・金融分野を対象とした大規模テキスト・ツー・データセットを提案する。
データセットは1万の自然言語クエリーペアで構成され、100万レコードのデータベースを会計する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:22:27 GMT)
Classical and quantum cyclic redundancy check codes [4.6] 古典的環状冗長チェック符号を量子環状冗長チェック符号に拡張する。
これにより、バースト長が量子レイガー境界に達した場合のバースト誤差を補正できる量子安定化器符号を構築することができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:31:52 GMT)
Nyström Kernel Stein Discrepancy [4.6] 我々は Nystr を用いた KSD アクセラレーションを提案し、ランタイム $mathcal O!left(mn+m3right)$ for $n$ sample and $mll n$ Nystr"om points を提案する。
従来のガウスの仮定でnullの下で$sqrtn$-consistencyを示し、一連のベンチマークで適合性テストの適用性を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:50:12 GMT)
Advancing High Resolution Vision-Language Models in Biomedicine [4.5] 本稿では,Claude3-Opus と LLaMA3 70B の医用画像テキストペアを用いた新しいインストラクションデータセットを提案する。
Llama3-Medモデルは,バイオメディカルな視覚的質問応答ベンチマークにおいて,最先端のゼロショット性能を実現する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:29:26 GMT)
M2SA: Multimodal and Multilingual Model for Sentiment Analysis of Tweets [4.5] 本稿では,既存のテキスト型Twitter感情データセットを,簡単なキュレーションプロセスを通じてマルチモーダルフォーマットに変換する。
本研究は,研究コミュニティにおける感情関連研究の新たな道を開くものである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:12:36 GMT)
Neural Dynamic Data Valuation [4.3] ニューラルダイナミックデータ評価(NDDV)という最適制御の観点から,新しいデータ評価手法を提案する。
本手法は,データ最適制御状態の感度を用いて,データ評価を正確に識別する理論的解釈を持つ。
さらに,データポイントのユニークな特徴を捉え,データポイントと平均場状態の相互作用による公平性を確保するために,データ再重み付け戦略を実装した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:38:48 GMT)
Unconditionally decoherence-free quantum error mitigation by density matrix vectorization [4.3] 密度行列のベクトル化に基づく量子誤差緩和の新しいパラダイムを提案する。
提案手法は,情報符号化の方法を直接変更し,ノイズのない純状態に雑音の多い量子状態の密度行列をマッピングする。
我々のプロトコルは、ノイズモデルに関する知識、ノイズ強度を調整する能力、複雑な制御ユニタリのためのアンシラキュービットを必要としない。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:04:24 GMT)
Is One GPU Enough? Pushing Image Generation at Higher-Resolutions with Foundation Models [4.3] 我々はPixelsmithを紹介した。これはゼロショットのテキスト・ツー・イメージ生成フレームワークで、1つのGPUで高解像度の画像をサンプリングする。
我々は,事前学習した拡散モデルの出力を1000倍に拡大できることを初めて示し,ギガピクセル画像生成への道を開いた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:08:59 GMT)
What Drives Online Popularity: Author, Content or Sharers? Estimating Spread Dynamics with Bayesian Mixture Hawkes [4.2] 本研究では,ソース,コンテンツ,拡散の影響を共同学習するために,ベイズ混合ホークス(BMH)モデルを提案する。
2つの学習課題(コールドスタート人気予測と時間プロファイル性能)でBMHモデルをテストし、2つの実世界のリツイートカスケードデータセットに適用した。
BMHモデルでは、議論を呼んでいるパブリッシャーと信頼できるパブリッシャーの間で、スタイルの有効性の違いが明らかになっている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:52:42 GMT)
Generating Diverse and High-Quality Texts by Minimum Bayes Risk Decoding [4.2] 多様性目標を最小ベイズ・リスク復号化に適用することにより,多様性向上のための復号化アルゴリズムを開発した。
我々は、エンコーダデコーダモデルとプロンプト付き大規模言語モデルを用いて、様々な有向テキスト生成タスクにおいてDMBRとKMBRを評価する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:27:32 GMT)
Do Pre-Trained Language Models Detect and Understand Semantic Underspecification? Ask the DUST! [4.2] 本研究では,事前訓練された言語モデル(LM)が不特定文を正しく識別し,解釈するかどうかを検討する。
実験の結果,不特定文の解釈においては,不特定文の理論的説明が予測する内容とは対照的に,不確実性はほとんど認められなかった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:09:47 GMT)
Sound Event Detection and Localization with Distance Estimation [4.1] 3D SELDは、音事象とその対応方向(DOA)を識別する複合作業である
本研究では,SELDコア内に距離推定を統合する2つの方法について検討する。
以上の結果から,音事象検出やDOA推定における性能劣化を伴わずに3D SELDを行うことが可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:54:11 GMT)
Transferable Embedding Inversion Attack: Uncovering Privacy Risks in Text Embeddings without Model Queries [4.1] 本研究では,テキスト埋め込みに伴うプライバシーリスクについて検討し,攻撃者が元の埋め込みモデルにアクセスできないシナリオに着目した。
直接モデルアクセスを必要とする以前の研究とは対照的に、転送攻撃法を開発することにより、より現実的な脅威モデルを探究する。
このアプローチでは、サロゲートモデルを使用して被害者モデルの振る舞いを模倣し、攻撃者は直接アクセスすることなくテキスト埋め込みから機密情報を推測することができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:09:58 GMT)
Smartphone region-wise image indoor localization using deep learning for indoor tourist attraction [4.1] スマートフォンのGlobal Positional Systemsは、コンクリートや金属ブロックのような密度の高い物質がGPS信号を弱めるシナリオには適さない。
深層学習により、スマートフォン画像を用いて、地域的屋内ローカライゼーションを行うことができる。
本稿では,屋内観光地におけるスマートフォンカメラ画像を用いた深層学習アルゴリズムによる位置の分類を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:45:45 GMT)
KGLiDS: A Platform for Semantic Abstraction, Linking, and Automation of Data Science [4.1] 本稿では、機械学習と知識グラフ技術を用いて、データサイエンスアーティファクトのセマンティクスとその接続を抽象化し、キャプチャするスケーラブルなプラットフォームKGLiDSを提案する。
この情報に基づいて、KGLiDSはデータディスカバリやパイプライン自動化など、さまざまなダウンストリームアプリケーションを可能にする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:26:35 GMT)
Enhancing Wearable based Real-Time Glucose Monitoring via Phasic Image Representation Learning based Deep Learning [4.1] 米国では、成人の3分の1以上がプレ糖尿病であり、80%は彼らの状態に気づいていない。
既存のウェアラブルグルコースモニターは、小さなデータセットでトレーニングされたモデルの不足によって制限されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:05:53 GMT)
Unraveling Code-Mixing Patterns in Migration Discourse: Automated Detection and Analysis of Online Conversations on Reddit [4.0] 本稿では,Reddit などのソーシャルメディアプラットフォームにおける移動関連談話における多言語話者間のコミュニケーション戦略である Code-mixing の利用について検討する。
本稿では,移動に関する議論において,コード混合メッセージを自動的に検出する新しいアプローチであるELMICT(Ensemble Learning for Identification of Code-mixed Texts)を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:30:34 GMT)
Multi-agent Reinforcement Learning with Deep Networks for Diverse Q-Vectors [4.0] 本稿では,Max,Nash,Maximinの戦略を用いて,様々なQベクトルを学習できるディープQ-networks(DQN)アルゴリズムを提案する。
このアプローチの有効性は、デュアルロボットアームが協力して鍋を持ち上げる環境で実証される。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:30:10 GMT)
Using Quality Attribute Scenarios for ML Model Test Case Generation [3.9] 機械学習(ML)モデルテストの現在のプラクティスは、モデルパフォーマンスのテストの優先順位付けである。
本稿では,品質属性(QA)のシナリオに基づいて,システムおよびモデル関連テストケースを抽出,定義する手法を提案する。
QAベースのアプローチはMLモデルテストと評価をサポートするプロセスとツールであるMLTEに統合されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:26:42 GMT)
Language Model Council: Benchmarking Foundation Models on Highly Subjective Tasks by Consensus [3.8] Arenaのようなリーダーボードは、反応が人間の好みとどのように一致しているかに基づいて、Large Language Models (LLM)をランク付けする。
新たなベンチマークフレームワークであるLanguage Model Council(LMC)を提案する。
LMCは、1)平等な参加を通じてテストセットを定式化し、2)委員会メンバー間でテストを管理し、3)集団審査員として反応を評価するという民主的なプロセスを通して運営されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:05:43 GMT)
Quantum Circuit Ansatz: Patterns of Abstraction and Reuse of Quantum Algorithm Design [3.8] 本稿では,量子回路のアンサーゼを分類したカタログを提案する。
各アンザッツは、意図、モチベーション、適用性、回路図、実装、例などの詳細とともに記述される。
量子アルゴリズム設計におけるそれらの応用を説明するための実例が提供されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:38:54 GMT)
Hierarchical Correlation Clustering and Tree Preserving Embedding [3.8] 本稿では,よく知られた相関クラスタリングを拡張する階層的相関クラスタリング手法を提案する。
本稿では,このような階層的相関クラスタリングを用いた教師なし表現学習について検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:43:44 GMT)
LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments [3.8] 本研究は,大規模言語モデルを交通信号制御システムに統合する革新的なアプローチを導入する。
LLMを知覚と意思決定ツールのスイートで強化するハイブリッドフレームワークが提案されている。
シミュレーションの結果から,交通環境の多種性に適応するシステムの有効性が示された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:53:58 GMT)
Self-Distillation Learning Based on Temporal-Spatial Consistency for Spiking Neural Networks [3.8] スパイキングニューラルネットワーク(SNN)は、その事象駆動性、低消費電力特性、高い生物学的解釈性によって大きな注目を集めている。
近年,教員モデルによるSNNモデルの性能向上が報告されている。
本稿では,これらの問題を回避するために,コスト効率の高いSNNの自己蒸留学習について検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:30:40 GMT)
Guarding Multiple Secrets: Enhanced Summary Statistic Privacy for Data Sharing [3.7] 本稿では,データ共有における多極的サマリ統計量の定義,分析,保護を行う新しいフレームワークを提案する。
我々は,攻撃者がデータ公開機構のプライバシーリスクを,サマリ統計シークレットの推測に成功している最悪の確率で測定する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 23:41:39 GMT)
Efficient Arbitrated Quantum Digital Signature with Multi-Receiver Verification [3.7] 量子デジタル署名は、署名者の身元を理論上のセキュリティで認証するために用いられる。
仲裁のない従来のマルチ受信型量子デジタルシグネチャスキームでは、1対1シグネチャの転送可能性は常に偽造性を達成するために必要である。
本稿では,複数の受信機で同時にシグネチャを検証可能な調停型量子デジタルシグネチャ方式を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:46:54 GMT)
What do we know about Hugging Face? A systematic literature review and quantitative validation of qualitative claims [3.7] コラボレーションソフトウェアパッケージレジストリ(SPR)は、ソフトウェアサプライチェーンの不可欠な部分である。
事前訓練モデル(PTM)登録は、重要度が増大するSPRの新たなクラスである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:38:48 GMT)
Symmetry enforced entanglement in maximally mixed states [3.6] 量子多体系の絡み合いは通常、環境との相互作用に脆弱である。
不変セクターにおける最大混合状態の絡み合いと相関を解析する。
すべてのアベリア対称性に対して、MMISは分離可能であり、全ての非アベリア対称性に対して、MMISは絡み合っている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:00:00 GMT)
Variational Quantum Algorithms for Semidefinite Programming [3.5] 半定値プログラム(SDP)は、操作研究、最適化、量子情報科学などにおける凸最適化問題である。
本稿では,SDPを近似的に解くための変分量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:26:50 GMT)
Defining a Reference Architecture for Edge Systems in Highly-Uncertain Environments [3.3] エッジシステムに対する異なるアーキテクチャアプローチが優先品質の懸念にどのように影響するかを示す。
本稿では,エッジシステムの参照アーキテクチャを高度に不確実な環境で定義する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:39:43 GMT)
Quantum harvester enables energy transfer without randomness transfer or dissipation [3.1] 部分的にランダムなエネルギー源が与えられた場合、ランダム性を伝達したり、別の熱力学的コストを受け入れることなくエネルギーを抽出することは可能か?
ランダム性のある場から原理的エネルギーを抽出するが、ランダム性を持たず、エネルギー散逸を伴わないシナリオやプロトコルを述べる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:12:38 GMT)
A Broad Comparative Evaluation of Software Debloating Tools [3.1] ソフトウェアデ肥大化ツールは、bloatと呼ばれる不要なコードを削除することで、プログラムのセキュリティとパフォーマンスを改善しようとしている。
筆者らは,10年間のデブロ化文学と,デブロ化生態系に関する知識を分類するために現在,商業開発中のいくつかのツールを調査した。
評価は、20のベンチマークプログラム、12のパフォーマンス、セキュリティ、正当性の測定ツールに基づいて行われた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:23:22 GMT)
Security Decisions for Cyber-Physical Systems based on Solving Critical Node Problems with Vulnerable Nodes [3.1] この研究は、CNP-V(Critical Node Cut Problem with Vulnerable Vertices)というNPハードな計算問題の解決に基づいている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:31:46 GMT)
MEMO-QCD: Quantum Density Estimation through Memetic Optimisation for Quantum Circuit Design [3.0] 本稿では,密度推定のための効率的な量子回路設計手法を提案する。
この戦略は、密度推定のための量子インスパイアされたアルゴリズムと、メメティックアルゴリズムに基づく回路最適化ルーチンに基づいている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:54:22 GMT)
Penetrative AI: Making LLMs Comprehend the Physical World [3.0] 大きな言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示しています。
本稿は,IoTセンサとアクチュエータを用いて,LLMを物理的世界と相互作用し,推論するために拡張する方法について検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:52:36 GMT)
Accurate Knowledge Distillation with n-best Reranking [3.0] 我々は,n-best re rankを利用してシーケンスレベル知識蒸留を強化することを提案する(Kim and Rush, 2016)。
我々は、様々な帰納バイアス、客観的関数またはアーキテクチャを持つ多種多様なモデルの集合を活用し、公開可能ないくつかの大きな言語モデルを含む、ラベルとして最高の仮説を選択する。
その結果,n-bestリランカが生成した擬似ラベルを用いることで,より正確な学生モデルが得られた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:28:01 GMT)
Memory Is All You Need: An Overview of Compute-in-Memory Architectures for Accelerating Large Language Model Inference [2.9] 大規模言語モデル(LLM)は自然言語処理を変換し、機械が人間のようなテキストを生成し、意味のある会話を行うことを可能にする。
計算と記憶能力の発達はムーアの法則の廃止によってさらに悪化している。
コンピュート・イン・メモリ(CIM)技術は、メモリ内でアナログ計算を直接実行することにより、AI推論を加速するための有望なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:57:58 GMT)
Predicting Consultation Success in Online Health Platforms Using Dynamic Knowledge Networks and Multimodal Data Fusion [2.9] オンライン相談の成功を予測することは、患者の全医療ジャーニーにおける仮想相談の役割の一部が原因で困難である。
オンライン相談における患者データは、しばしばスパースで不完全であり、重要な技術的課題と研究のギャップを提示する。
本稿では,オンライン医療相談の予測能力を高める動的知識ネットワークとマルチモーダルデータフュージョンフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:59:56 GMT)
Reinforcement Learning from Multi-role Debates as Feedback for Bias Mitigation in LLMs [2.8] 現在のバイアス軽減手法は、コストのかかる人的フィードバック、他のトピックへの転送可能性の欠如、パフォーマンスの低下に頼っている。
RLDF(Reinforcement Learning from Multi-role Debates as Feedback)を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:42:28 GMT)
A Software Engineering Perspective on Testing Large Language Models: Research, Practice, Tools and Benchmarks [2.8] 大規模言語モデル(LLM)は、スタンドアロンツールとしても、現在および将来のソフトウェアシステムのコンポーネントとしても、急速に普及しています。
LLMを2030年のハイテイクシステムや安全クリティカルシステムで使用するためには、厳格なテストを実施する必要がある。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:45:45 GMT)
UADA3D: Unsupervised Adversarial Domain Adaptation for 3D Object Detection with Sparse LiDAR and Large Domain Gaps [2.8] 3次元物体検出(UADA3D)のための教師なし反転領域適応法について紹介する。
様々な適応シナリオにおいて有効性を示し、自動運転車と移動ロボットの両方の領域で顕著に改善されていることを示す。
私たちのコードはオープンソースで、まもなく利用可能になります。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:21:23 GMT)
Incremental Learning and Self-Attention Mechanisms Improve Neural System Identification [2.8] 一次視覚野の皮質ニューロンは、水平およびフィードバック接続によって媒介される文脈情報に敏感である。
標準的なCNNは、このような文脈変調をモデル化するために、グローバルな空間画像情報を統合することができる。
理論的には文脈依存型フレキシブルゲーティング機構と関係のある非局所ネットワークや自己注意機構が,神経応答予測を改善することを発見した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:21:06 GMT)
Can Large Language Models Analyze Software Failures in the News? An End-to-End Automated Pipeline with FAIL [2.7] このギャップを埋めるために, LLM (FAIL) システムを用いた故障解析手法を提案する。
FAILは、ニュースで報告されているように、ソフトウェア障害を収集し、分析し、要約する。
FAILは4,184項目で報告された2457の障害を特定し分析した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:51:51 GMT)
Conformal Convolution and Monte Carlo Meta-learners for Predictive Inference of Individual Treatment Effects [2.7] コンフォーマル畳み込みTラーナー(CCT-learner)とコンフォーマルモンテカルロメタラーナー(CMC)を紹介する。
これらの手法は、重み付き共形予測システム(WCPS)、モンテカルロサンプリング、CATEメタラーナーを利用する。
個々の治療効果(ITE)の予測分布を生成し、個別の意思決定を強化する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:35:14 GMT)
Improving Noise Robustness through Abstractions and its Impact on Machine Learning [2.7] ノイズは機械学習(ML)手法の適用に大きな影響を与える学習理論の基本的な問題である。
本稿では,データ抽象化を用いてノイズを緩和する手法を提案する。
目標は、抽象化によって生成された情報の損失を通じて、モデルの性能に対するノイズの影響を減らすことである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:14:44 GMT)
Field Test of Quantum Key Distribution with High Key Creation Efficiency [2.6] 我々は50時間ビンで狭帯域単一光子を生成する小型の1550nm単一光子源を開発した。
これらの単一光子をフィールド試験で利用することにより, 鍵生成効率97%の差相シフトQKDを実証した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 00:42:43 GMT)
The Ludii Game Description Language is Universal [2.6] ルディイ一般ゲームシステムで使用される言語は任意の、有限で決定論的で、完全に観察可能な広義のゲームに対して同等のゲームを表現することができることを示す。
本稿では,これを有限個の非決定的かつ不完全情報ゲームに拡張することで,その普遍性を証明する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:45:11 GMT)
Reconciling Kaplan and Chinchilla Scaling Laws [2.6] カプランとホフマンは、次の言語予測に基づいて訓練されたトランスフォーマーのスケーリング挙動を研究した。
このノートは、これらの不一致の多くは、総パラメータではなく非埋め込みを数えているKaplanに起因している。
カプランの当初の過大評価の原因を説明することで、チンチラのスケーリング係数を再確認した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:30:48 GMT)
Continuous fake media detection: adapting deepfake detectors to new generative techniques [2.5] 生成技術は、これらの技術の誇大宣伝によって、驚くほど高い速度で進化し続けています。
本稿では,2つの連続学習手法を疑似メディアのショートシーケンスとロングシーケンスで解析する。
いくつかの制限はあるものの、連続的な学習手法はトレーニングシーケンス全体にわたって優れたパフォーマンスを維持するのに役立ちます。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:04:06 GMT)
Analyzing Multi-Head Attention on Trojan BERT Models [2.5] 本稿では,トランスフォーマーモデルにおけるマルチヘッドアテンションの挙動について検討し,特に感情分析の文脈における良性モデルとトロイの木馬モデルの違いに着目した。
本研究では,トロイの木馬とベニグニグニグニグニグニグナグニグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグ
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:43:59 GMT)
PanoTree: Autonomous Photo-Spot Explorer in Virtual Reality Scenes [2.4] ソーシャルVRでは、VRシーン内の写真は訪問者の活動を示す重要な指標である。
我々は、VRシーンにおける自動写真スポットエクスプローラーであるPanoTreeを提案する。
ディープスコアリングネットワークは、ソーシャルVRプラットフォームが収集した大量の写真をトレーニングし、人間が同様の写真を撮るかどうかを判断する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:13:10 GMT)
Characterizing Unsafe Code Encapsulation In Real-world Rust Systems [2.3] 内部アンセーフは、システムソフトウェア開発においてRustコミュニティによって提唱される重要な設計パラダイムである。
Rustコンパイラは、安全でないコードを含む安全な関数の健全性を検証することができない。
安全でないコードの本質的な使用法とカプセル化をモデル化するための,新しいアンセーフティアイソレーショングラフを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:59:51 GMT)
DR-RAG: Applying Dynamic Document Relevance to Retrieval-Augmented Generation for Question-Answering [2.3] 文書検索のリコールと回答の精度を向上させるために,DR-RAG(Dynamic-Relevant Retrieval-Augmented Generation)を提案する。
DR-RAGは回答の精度を大幅に向上させ,質問応答システム(QA)の新たな進歩を実現する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:06:59 GMT)
Interpretable Representation Learning of Cardiac MRI via Attribute Regularization [2.2] 臨床医が人工知能モデルの理解と信頼を確実にするためには、医療画像の解釈可能性が不可欠である。
本稿では,逆向きに訓練された変分オートエンコーダのフレームワーク内で,潜在空間の属性正規化を組み合わせた分散正規化ソフトイントロスペクティブ変分オートエンコーダを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:47:51 GMT)
Forward-Euler time-discretization for Wasserstein gradient flows can be wrong [2.2] ワッサーシュタイン勾配流のフォワード・オイラー離散化シミュレーションについて検討する。
この離散化の失敗を示す2つの反例を提供する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:40:47 GMT)
3D CBCT Challenge 2024: Improved Cone Beam CT Reconstruction using SwinIR-Based Sinogram and Image Enhancement [2.1] コーンビームCT(CBCT)の再構成は,スウィン画像復元(SwinIR)と画像強調モジュールを統合して実現されている。
提案手法は、Nesterov Accelerated Gradient Descent (NAG) を用いて、CT画像再構成における最小二乗問題(NAG-LS)を解決する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:01:00 GMT)
Deep Learning for Slum Mapping in Remote Sensing Images: A Meta-analysis and Review [2.1] 何百万人もの人々が、世界中の多くの主要都市で生活状態の悪いスラムや非公式の集落に住んでいる。
リモートセンシングによるスラムのマッピングが顕著な研究領域として浮上している。
ディープ・ラーニング(Deep Learning)は、衛星画像の自動解析によってスラムに関連する複雑な空間パターンを識別できるようにするため、この分野に新たな次元を追加した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:31:52 GMT)
We Have a Package for You! A Comprehensive Analysis of Package Hallucinations by Code Generating LLMs [2.1] 大規模言語モデル(LLM)を用いたコード生成におけるファクトコンプレッションエラーによるパッケージ幻覚
本稿では,プログラム言語間のパッケージ幻覚を厳密かつ包括的に評価し,データセットのプロンプトを行う。
その結果,全LLMの19.7%が幻覚的であり,205,474種類の幻覚的パッケージ名が含まれていることがわかった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:29:06 GMT)
Ergodic and mixing quantum channels: From two-qubit to many-body quantum systems [2.0] 本稿では,量子チャネルのエルゴード理論について,積分可能から混合可能なエルゴード階層の異なるレベルを特徴付けることによって検討する。
また、有名なSachdev-Ye-Kitaev(SYK)モデルを含む多体量子系の相互作用についても検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:36:41 GMT)
Large Language Models for Document-Level Event-Argument Data Augmentation for Challenging Role Types [1.9] イベント引数抽出(EAE)は非常に難しい情報抽出問題である。
既存の拡張手法は、様々な現実世界のEAEコンテキストに適していない。
文書レベルのAEサンプルを合成するための2つの新しいLCMベースのデータ拡張フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:21:33 GMT)
Quantum Hardware-Enabled Molecular Dynamics via Transfer Learning [1.9] 量子ハードウェア上での分子動力学シミュレーションのための新しい経路を提案する。
移動学習と機械学習によるポテンシャルエネルギー表面構築技術を組み合わせることにより,新しい経路が提案される。
このアプローチは、機械学習モデルをトレーニングして、Behler-Parrinelloニューラルネットワークを用いて分子のポテンシャルエネルギーを予測することによって実証される。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:00:09 GMT)
Confidence Interval Estimation of Predictive Performance in the Context of AutoML [1.9] AutoML設定では、信頼区間(CI)の推定は、推定のバイアスのため困難である。
本研究では,CI推定における9つの最先端手法と変種の比較評価を行う。
評価は、すべてではないにせよ、ほとんどのメソッドをカバーし、以前の作業を不均衡で小さなサンプルタスクにまで拡張した最初のものである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:26:29 GMT)
Quantum chi-squared tomography and mutual information testing [1.8] ランク-$r$次元-$d$状態の量子状態トモグラフィーでは、$widetildeO(r.5d1.5/epsilon) leq widetildeO(d3/epsilon)$ copy suffice for accuracy$epsilon$ to the (Bures) $chi2$-divergence を示す。
我々はまた、相互情報テストの古典版における最もよく知られたサンプルの複雑さを$widetildeO(d)に改善する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:45:27 GMT)
Feature Learning and Generalization in Deep Networks with Orthogonal Weights [1.8] 独立なガウス分布からの数値的な重みを持つディープニューラルネットワークは臨界に調整することができる。
これらのネットワークは、ネットワークの深さとともに線形に成長する変動を示す。
行列のアンサンブルから得られるタン・アクティベーションと重みを持つ長方形のネットワークが、それに対応する事前アクティベーション・揺らぎを持つことを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:57:56 GMT)
Informed POMDP: Leveraging Additional Information in Model-Based RL [1.8] 我々は,POMDPにおけるインタラクションを通じて学習する問題を,トレーニング時に利用できる付加的な情報を考慮することで一般化する。
まず,新しい学習パラダイムである情報PMDPを紹介し,学習時の情報と実行時の観察とを明確に区別する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:58:19 GMT)
A Robust Pipeline for Classification and Detection of Bleeding Frames in Wireless Capsule Endoscopy using Swin Transformer and RT-DETR [1.7] Swin Transformerは、出血フレームの初期分類と、出血のさらなる検出のためのRT-DETRを組み合わせたソリューションである。
検証セットでは、前処理なしで98.5%の分類精度を91.7%と比較する。
テストセットでは、それぞれ87.0%と89.0%の分類精度とF1スコアを達成する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:58:42 GMT)
Bridging Resource Theory and Quantum Key Distribution: Geometric Analysis and Statistical Testing [1.7] 量子的相関と古典的相関の区別は非常に重要である。
ベルポリトープは基本的な道具として確立されている。
ネットワークシナリオの文脈における資源理論を量子鍵分布(QKD)に適用する。
ポリトープ内の2つの動作間の距離を評価するためのテストフレームワークを考案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:48:24 GMT)
The impact of deep learning aid on the workload and interpretation accuracy of radiologists on chest computed tomography: a cross-over reader study [1.7] 放射線科医の読影時間と精度に対するDLAの併用効果について検討した。
実験室の放射線技師20名のうち16名は読解時間と感度を向上し、2名は限界感度を低下させ、さらに2人は時間を増加させて感度を向上した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:26:26 GMT)
WannaLaugh: A Configurable Ransomware Emulator -- Learning to Mimic Malicious Storage Traces [1.6] ランサムウェアは恐ろしく、急速に進化するサイバーセキュリティの脅威だ。
静的シグネチャとアプリケーション動作パターンに依存した従来の検出方法は、これらの脅威の動的性質によって問題視される。
本稿では,この課題に対処するための主な貢献を3つ紹介する。
まず、ランサムウェアエミュレータを導入する。本ツールは、実際の被害やマルウェアの拡散を発生させることなく、ランサムウェア攻撃を安全に模倣するように設計されている。
次に、このエミュレータを使ってストレージI/Oトレースを作成する方法を示す。これらのトレースは機械学習モデルのトレーニングに使用される。
第3に,我々のエミュレータが既存のランサムウェアのI/O動作を模倣して安全を実現する方法を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:52:51 GMT)
Figuratively Speaking: Authorship Attribution via Multi-Task Figurative Language Modeling [1.6] テキスト中の複数のFL特徴を同時に検出するマルチタスク言語モデル(MFLM)を提案する。
我々は、複数のテストセットにわたる詳細な評価を通して、FL検出において、我々のモデルは、等しく、または、より優れた特別なバイナリモデルを実行する傾向があることを実証する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:49:38 GMT)
Exploring Self-Supervised Multi-view Contrastive Learning for Speech Emotion Recognition with Limited Annotations [1.6] 本稿では,大規模な音声モデルから生成されるものを含む,さまざまな音声表現に適用可能なマルチビューSSL事前学習手法を提案する。
我々の実験は、wav2vec 2.0に基づくスペクトルおよびパラ言語の特徴に基づいて、提案したフレームワークが、Unweighted Average Recallにおいて最大10%SER性能を向上することを示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:06:55 GMT)
Manifold Learning by Mixture Models of VAEs for Inverse Problems [1.6] 任意の位相の多様体を表現するために,変分オートエンコーダの混合モデルを学習する。
学習多様体に制限されたデータ忠実度項を最小化することにより、逆問題の解法に使用する。
本手法を低次元トイの例に応用し, 脱臭・電気インピーダンストモグラフィーにも応用した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:09:47 GMT)
Conformal Load Prediction with Transductive Graph Autoencoders [1.6] 本稿では,エッジウェイト予測のためのグラフニューラルネットワーク(GNN)アプローチについて述べる。
我々は、共形予測を利用してGNN出力を校正し、有効な予測間隔を生成する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:47:27 GMT)
Field-sensitive dislocation bound states in two-dimensional $d$-wave altermagnets [1.5] 我々は、C_4zmathcalT$対称性によって強制される帯域縮退を伴う結節バンド構造について検討した。
基板が$s$の超伝導体である場合、交換場におけるバンドトポロジの類似した依存がマヨラナゼロモードの場依存性を生じさせる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:04:59 GMT)
DISCO: An End-to-End Bandit Framework for Personalised Discount Allocation [1.5] DISCOは、ASOSのパーソナライズされたディスカウントコードアロケーションのためのエンドツーエンドのコンテキストラジットフレームワークである。
従来のトンプソンサンプリングアルゴリズムを整数プログラムに統合することで適応する。
グローバルな制約にもかかわらず、探索を効果的に実施し、時間とともにパフォーマンスを向上させることができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:51:22 GMT)
A Survey of Pipeline Tools for Data Engineering [1.5] さまざまなパイプラインツールがデータエンジニアリングで使用することができる。
この調査では、パイプラインツールの設計とデータエンジニアリングの意図に基づいて、幅広いカテゴリと例を調査した。
ケーススタディでは、データエンジニアリングにパイプラインツールを使用することを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:41:06 GMT)
Generator-Based Fuzzers with Type-Based Targeted Mutation [1.5] 以前の研究では、カバレッジ誘導型ファジィザは静的解析、テイント解析、制約解法を混合してこの問題に対処していた。
本稿では,Java GBFの文字列検索とともに,型ベースの突然変異を導入する。
ベースラインのGBFツールと比較すると、アプリケーションカバレッジは平均20%改善しており、サードパーティのコードを含めると、より大きく改善されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:32:41 GMT)
MELEP: A Novel Predictive Measure of Transferability in Multi-Label ECG Diagnosis [1.4] 本稿では,事前学習したモデルから下流のECG診断タスクへの知識伝達の有効性を推定する手段であるMELEPを紹介する。
実験により、MELEPは、小・不均衡のECGデータに基づいて、事前学習した畳み込みと繰り返しの深部ニューラルネットワークの性能を予測できることを示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:27:40 GMT)
Vessel Re-identification and Activity Detection in Thermal Domain for Maritime Surveillance [1.4] 視界に基づく海上監視は、夜間の視界の問題により困難である。
本研究では, 物体追跡, 容器再同定, 不審な活動検出機能を備えた海洋監視のための熱的, 視覚的アプローチを提案する。
このデータセットは、熱海洋監視のための最初の公開ベンチマークデータセットである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:57:37 GMT)
On Creativity and Open-Endedness [1.3] 本研究の目的は,コンピュータ・クリエイティビティ(CC)分野とALife分野の潜在的なつながりに関する議論を活性化することである。
CCの主な目標は、人工システムに創造性を付与することであり、ALifeはOEと人工イノベーションの研究と合成に多くの研究努力を注いでいる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:39:39 GMT)
Optimizing Deep Reinforcement Learning for Adaptive Robotic Arm Control [1.2] TPE(Tree-structured Parzen Estimator)は、SACの成功率を10.48ポイント、PPOを34.28ポイント改善する。
TPEは、PPOが最大報酬の95%以内の報酬に収束することを可能にする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:06:54 GMT)
A self-supervised text-vision framework for automated brain abnormality detection [1.2] 脳MRI画像における臨床的に関連のある異常を検出するためのテキストビジョンフレームワークを提案する。
当フレームワークは,臨床診断支援ツールとしても機能する可能性がある。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:01:51 GMT)
Automated Information Extraction from Thyroid Operation Narrative: A Comparative Study of GPT-4 and Fine-tuned KoELECTRA [1.1] 本研究は, GPT-4モデルと比較し, 微調整KoELECTRAモデルの変形特性に着目した。
この研究は、高度な自然言語処理(NLP)技術を活用し、より高度なデータ処理システムへのパラダイムシフトを促進する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:44:05 GMT)
Finite Time Analysis of Temporal Difference Learning for Mean-Variance in a Discounted MDP [1.1] 割引報酬マルコフ決定プロセスにおける分散政策評価の問題点を考察する。
本稿では,線形関数近似(LFA)を用いた時間差分型学習アルゴリズムについて述べる。
平均二乗の意味で(i) を保持する有限標本境界と、(ii) テールイテレート平均化を用いる場合の高い確率を導出する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:49:53 GMT)
AI Sandbagging: Language Models can Strategically Underperform on Evaluations [1.0] トラストロックされたAIシステムは、AIシステムの安全性を保証するために不可欠である。
AIシステムの開発者は、サンドバッグ評価のためのインセンティブを持つかもしれない。
性能評価がサンドバッグに弱いことを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:06:13 GMT)
Simulation of the Dissipative Dynamics of Strongly Interacting NV Centers with Tensor Networks [1.0] ダイヤモンド中のNV中心は、磁場やその他の物理量に対する高感度量子センサーのための有望なプラットフォームである。
我々は多体混合状態を表現し,NVのアンサンブルのダイナミクスをシミュレートするために,マトリックス製品密度演算子(MPDO)法を用いる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:40:14 GMT)
From Brussels Effect to Gravity Assists: Understanding the Evolution of the GDPR-Inspired Personal Information Protection Law in China [1.0] 中国の個人情報保護法はブリュッセル効果の適用性に疑問を投げかけている。
本論では,中国が独自のデータ保護環境を形成するためのテンプレートとして,補体系の戦略的具体化を図った「重力支援」理論を紹介する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:40:34 GMT)
Blind Image Deblurring using FFT-ReLU with Deep Learning Pipeline Integration [0.9] ブラインド画像デブロアリング(Blind image deblurring)は、ぼやけた画像からシャープ画像とぼやけたカーネルを導出する過程である。
既存のアプローチは主に、サリアントエッジ、ダークチャネル、ライトストリークといった、画像のドメイン固有の特徴に焦点を当てている。
本稿では,画像のすべての分布において,ボケカーネルを効果的に推定する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:51:39 GMT)
Sources of Gain: Decomposing Performance in Conditional Average Dose Response Estimation [0.9] 条件付き平均線量応答(CADR)の推定は重要であるが難しい問題である。
本稿では,この手法を解析し,さらなる分析を行わない一般的なベンチマークデータセットを用いることで,モデル性能を判断するには不十分であることを示す。
本稿では,CADR推定器の性能に寄与する5つの異なる成分の影響を評価できる新しい分解手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:39:32 GMT)
Complex Quantum Networks: a Topical Review [0.9] 複雑量子ネットワークの進展分野の概観
重要なネットワーク特性を推測する新しい世代の量子アルゴリズム。
主な研究線は、ネットワーク一般化、量子応用、量子一般化、量子強化である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:22:04 GMT)
Highly-entangled stationary states from strong symmetries [0.9] 強い非アベリア保存量は、ユニタリ量子チャネルにおいても高い絡み合った定常状態をもたらす可能性がある。
これらは、すべての強保存量を特徴づける可換体がリー代数の普遍包絡代数またはリード=セール可換環に対応するような開量子進化に適用されることを証明している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:10:41 GMT)
A Sociotechnical Lens for Evaluating Computer Vision Models: A Case Study on Detecting and Reasoning about Gender and Emotion [0.9] 本稿では,コンピュータビジョン(CV)モデルにおける社会的バイアスについて検討し,従来の評価指標の限界を強調した。
予防接種と気候変動に関連する5,570枚の画像のデータセットを用いて,各種CVモデルの性能を実証的に比較した。
以上の結果より, GPT-4 Visionは, トランスジェンダーや非バイナリペルソナに対して, 差別バイアスを呈することが明らかとなった。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:52:30 GMT)
Deep Latent Variable Modeling of Physiological Signals [0.9] 潜時変動モデルを用いた生理モニタリングに関する高次元問題について検討する。
まず、光学的に得られた信号を入力として、心の電気波形を生成するための新しい状態空間モデルを提案する。
次に,確率的グラフィカルモデルの強みと深い敵対学習を組み合わせた脳信号モデリング手法を提案する。
第3に,生理的尺度と行動の合同モデリングのための枠組みを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:24:00 GMT)
PRIBOOT: A New Data-Driven Expert for Improved Driving Simulations [0.9] PRIBOOT(PRIBOOT)は、限られた人間ログと特権情報を利用する専門家エージェントである。
我々は、よりバランスよく運転性能を評価するために設計された新しい評価指標である赤外線レートスコア(IRS)を提案する。
PRIBOOTは、Leadboard 2.0で75%のルート完了(RC)を達成する最初のモデルであり、ドライビングスコア(DS)とIRSはそれぞれ20%と45%である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:05:08 GMT)
Guiding In-Context Learning of LLMs through Quality Estimation for Machine Translation [0.8] 本稿では、ドメイン固有品質推定(QE)によって導かれる探索アルゴリズムに依存する、文脈内学習(ICL)の新しい手法を提案する。
予備学習言語モデル(PLM)の微調整と比較すると,既存のICL法と翻訳性能は大幅に向上した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:49:36 GMT)
Regularizing and Aggregating Clients with Class Distribution for Personalized Federated Learning [0.8] クラスワイドフェデレーション(cwFedAVG) クラスワイドで、サーバ上のクラスごとに複数のグローバルモデルを作成する。
各局所モデルは、その推定された局所クラス分布によって重み付けされたこれらの大域的モデルを統合し、深いネットワーク重みのL2ノルムから導かれる。
また,局所分布推定の精度を高めるために,新たにWDR (Weight Distribution Regularizer) を設計した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:32:24 GMT)
End-to-End Argument Mining as Augmented Natural Language Generation [0.8] 本研究は,議論構造をラベル付きテキストにフレーム化した生成パラダイムに基づく,統一的なエンドツーエンドフレームワークを提案する。
マーカーに基づく微調整戦略を多用し、マーカー知識を生成モデルに組み込むことにより、広範囲にわたる研究を行う。
提案するフレームワークは,最先端(SoTA)モデルに対する競合的な結果を達成し,いくつかのベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:22:29 GMT)
Analyzing Large Language Models for Classroom Discussion Assessment [0.8] 本研究では,2つの大規模言語モデル(LLM)の評価性能が,タスクの定式化,文脈長,少数例の3つの要因とどのように相互作用するかを検討する。
その結果, 上記の3つの要因がLLMの性能に影響を与え, 一貫性と性能に相関があることが示唆された。
予測性能, 計算効率, 整合性の観点から, バランスのよいLCMベースの評価手法を推奨する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 22:43:38 GMT)
Improving social welfare in non-cooperative games with different types of quantum resources [0.8] 我々は、異なる種類の量子資源が、非協調ゲームにおいて新しいナッシュ均衡をもたらすかを研究する。
我々は、これらの量子資源が社会福祉をどのように改善するかを研究するために、SDP最適化技術を活用している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:05:59 GMT)
Higher-Order Newton Methods with Polynomial Work per Iteration [0.8] 任意の$d$の微分を包含するオラクル法を一般化するが、その反復次元における盆地への依存は維持する。
数値的な例では、$d$ の局所的なアトラクションは、追加の仮定がなされると局所的に大きくなる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:30:24 GMT)
Optimizing Container Loading and Unloading through Dual-Cycling and Dockyard Rehandle Reduction Using a Hybrid Genetic Algorithm [0.7] クレーンによる船のコンテナの降ろしと積載の両操作を包含する統一モデルを提案する。
本稿では,1次元と2次元のGA成分からなるハイブリッド遺伝的アルゴリズム (GA) QCDC-DR-GAを提案する。
我々のモデルは2サイクルの最大化と造船所再処理の最小化の4つの最先端手法を一貫して上回っている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:47:45 GMT)
Illustrating the benefits of efficient creation and adaption of behavior models in intelligent Digital Twins over the machine life cycle [0.7] 本稿では,デジタルツインと行動モデルの基礎,課題,関連研究について述べる。
マシンライフサイクル全体を通しての行動モデルの作成、適応、使用は、非常に時間がかかります。
アプリケーションを説明する特定のユースケースが不足し、マシンライフサイクル上での振る舞いモデルの利点が追加されています。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:23:50 GMT)
Feedback-Based Quantum Algorithm for Constrained Optimization Problems [0.7] 問題の解を基底状態としてエンコードする新しい演算子を導入する。
提案アルゴリズムは,量子回路の深さを小さくすることで,計算資源を節約できることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:58:43 GMT)
Sense Less, Generate More: Pre-training LiDAR Perception with Masked Autoencoders for Ultra-Efficient 3D Sensing [0.6] 本稿では,環境の広範囲なトレーニングに基づいて予測可能か,あるいは全体的な予測精度に限界がある環境の一部ではなく,環境の一部を生成する,破壊的かつフラグアルなLiDAR知覚データフローを提案する。
この目的のために提案した生成前訓練戦略であるR-MAE(Radially masked autoencoding)は、オンフィールド操作中にランダムに生成された角状領域のレーザパワーを選択的に活性化制御することにより、典型的なLiDARシステムでも容易に実装できる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:02:54 GMT)
Coupled Ocean-Atmosphere Dynamics in a Machine Learning Earth System Model [0.6] 我々は,高分解能(0.25deg)人工知能/機械学習(AI/ML)結合土系モデルであるオーシャンリンク大気(Ola)モデルを提案する。
その結果,Olaは適切な位相速度を持つ熱帯海洋波を含む海洋-大気結合力学の学習特性を示すことがわかった。
本研究では,地球物理流体力学研究所のSPEARモデルと比較し,エルニーニョ/南方振動(ENSO)の予測能力を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:29:14 GMT)
Uses of Active and Passive Learning in Stateful Fuzzing [0.6] 本稿では,システムの状態マシンモデルの推定に能動的および受動的手法を用いたファジングについて検討する。
ファジィングは、過去10年間でソフトウェアの堅牢性を改善するための非常に人気があり、成功している技術になっていますが、ステートフルなシステムはいまだにファジィズが難しいです。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:55:47 GMT)
High-purity single-photon generation based on cavity QED [0.6] キャビティ量子電磁力学(QED)に基づく高純度単一光子生成手法を提案する。
この構造は、原子崩壊による再励起過程の抑制を可能にする。
提案手法は,分散量子計算や量子通信の高精度化に寄与することができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:43:48 GMT)
Surprise! Using Physiological Stress for Allostatic Regulation Under the Active Inference Framework [Pre-Print] [0.6] 本研究では, 生理的ストレスホルモン(コルチゾール)の分泌に予測誤差を基礎づけるモデルを構築した。
以上の結果から,コルチゾール (ストレス) の静電気的作用は, 長期間の生理的調節に適応的に有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:56:15 GMT)
Non-invertible symmetry-protected topological order in a group-based cluster state [0.5] 基底状態が$Gtimes textRep(G)$-symmetric状態である群ベースのパウリ作用素からなる一次元安定化器ハミルトニアンを導入する。
この状態は、$Gtimes textRep(G)$対称性によって保護される対称性保護位相(SPT)相にあり、双対性引数によって対称積状態と異なることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:35:31 GMT)
Approximation properties relative to continuous scale space for hybrid discretizations of Gaussian derivative operators [0.5] 本稿ではガウス微分に対する2つのハイブリッド離散化法の特性について解析する。
これらの離散化手法を研究する動機は、異なる順序の複数の空間微分が同じスケールレベルで必要である場合、より効率的に計算できることである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:16:32 GMT)
PTHelper: An open source tool to support the Penetration Testing process [0.5] 侵入テストは、脆弱性を発見し、評価し、悪用するために設計された攻撃的なセキュリティのブランチである。
このプロジェクトは、ペンテストの自動化を解決するための実践的なアプローチを採用し、PTHelperと呼ばれる便利なツールを提案する。
このオープンソースツールは、ペンテスティングコミュニティが容易にアップグレードできるように、モジュラーな方法で設計されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:08:52 GMT)
Conditional Similarity Triplets Enable Covariate-Informed Representations of Single-Cell Data [0.5] 機械学習アプローチは、サンプルごとの免疫学的要約を計算するために使用される。
本稿では,新たに三重項ペナライズ法を用いて損失関数を定式化する,集合ベースの符号化法であるCytoCoSetを紹介する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:53:07 GMT)
SHACL2FOL: An FOL Toolkit for SHACL Decision Problems [0.5] 我々は、SHACL文書をFOL文に変換する最初の自動ツールであるSHACL2FOLを紹介する。
このツールは、満足度と包含性の2つの静的解析問題に対する解を計算する。
また、一連の制約に関してグラフの有効性をテストすることもできる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:20:25 GMT)
AI in Lung Health: Benchmarking Detection and Diagnostic Models Across Multiple CT Scan Datasets [0.3] 肺がんの死亡率の高さは早期発見によって緩和され、画像診断のAIにますます依存している。
本研究は、結節検出と癌分類タスクの両方において、AIモデルを開発し、検証する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 22:18:41 GMT)
Counterfactual-based Root Cause Analysis for Dynamical Systems [0.3] 本稿では,残留ニューラルネットワークを用いた根本原因同定手法を提案する。
構造方程式と外的影響に介入した場合に、より多くの根本原因が同定されることを示す。
本稿では,提案手法が実世界の河川データセットだけでなく,ベンチマーク・ダイナミック・システムにも有効であることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:38:13 GMT)
An Empirical Design Justice Approach to Identifying Ethical Considerations in the Intersection of Large Language Models and Social Robotics [0.3] 大規模言語モデル(LLM)の社会ロボティクスへの統合は、ユニークな倫理的課題と社会的影響を示す。
本研究は、これらの2つの技術の設計と開発に生じる倫理的考察を特定することを目的としている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:25:36 GMT)
Deep reinforcement learning for weakly coupled MDP's with continuous actions [0.3] 本稿では,連続行動空間と弱結合なMDP問題を対象とした強化学習アルゴリズムであるLagrange Policy for Continuous Actions (LPCA)を紹介する。
LPCAは、Q値計算のためのニューラルネットワークフレームワークにおいて、弱い結合のMDP問題のラグランジュ緩和を導入することで、継続的な行動に依存するリソース制約の課題に対処する。
グローバル最適化に差分進化を利用するLPCA-DEと,Q値勾配に基づく行動の漸進的かつ段階的に選択するLPCA-Greedyの2つのバリエーションを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:51:00 GMT)
MOTI$\mathcal{VE}$: A Drug-Target Interaction Graph For Inductive Link Prediction [0.3] 本稿では,MOTI$mathcalVE$について紹介する。MOTI$mathcalVE$はMorphological cOmpound Target Interaction Graphで,11,000ドルの遺伝子と3600ドルの化合物に対してセルペイント機能を備えている。
ベンチマークの結果,Cell Painting機能を用いたグラフニューラルネットワークは,グラフ構造のみから学習したニューラルネットワークよりも一貫して優れていた。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:18:14 GMT)
Technological Perspective on Digital Sovereignty [0.3] この報告書は、技術的観点からのデジタル主権の意味と、スイスや海外で現在どのような活動が行われているかを示している。
また、今後の「スマート・デジタル・ソブリンティ・ストラテジー」の戦略的方向性や具体的な勧告も提供する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:33:02 GMT)
Hawking-Page transition on a spin chain [0.3] 1dハイゼンベルクスピン鎖を介してAdS$_5$におけるホーキング・ページ転移のアクセシビリティが示される。
熱的ロシミットエコーは平均するとホーキング・ページ遷移のエントロピーの増加が予測される。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:43:34 GMT)
Perils of current DAO governance [0.2] 投票、投票、強制は簡単だ。
富裕な支配、分散化は神話である。敵対的な乗っ取りは動機づけられている。
投票の秘密は、人間の権利であるにもかかわらず、存在しないか、短命である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:21:23 GMT)
Suppressing Counter-Rotating Errors for Fast Single-Qubit Gates with Fluxonium [0.2] クビットデコヒーレンスは必然的に量子論理ゲートの忠実度を低下させる。
そのようなエラーチャネルの1つは、強い線形偏光駆動の反回転成分から生じる。
このエラーチャンネルを緩和するための2つの補完プロトコルを開発し、実証する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:58:08 GMT)
A new approach for predicting the Quality of Experience in multimedia services using machine learning [0.2] サービス品質(QoS)は、競争力のある市場でサービス提供者にとって基本的な必要性となっている。
QoE(Quality of Experience)の概念は、テレフォニーネットワークの発展とともに生まれた。
近年の研究では、機械学習とディープラーニング技術を利用してQoEを予測する傾向が示されている。
本研究は,ITU-T P.1203標準に準拠したマルチメディアサービスにおけるQoE評価のための包括的フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:07:06 GMT)
Optimizing Multi-Stuttered Speech Classification: Leveraging Whisper's Encoder for Efficient Parameter Reduction in Automated Assessment [0.2] 本研究は, 発声音声における不一致の同定における最後のエンコーダ層の役割を明らかにするものである。
これは、様々な方言や言語に適応できるモデルに、計算的に効率的なアプローチをもたらした。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:13:36 GMT)
Deep Generative Data Assimilation in Multimodal Setting [0.1] 本研究では,マルチモーダル・セッティングにおけるスコアベースラテント・アシミレーション(SLAMS)を提案する。
気象観測所のデータと衛星画像とを同化して、垂直温度分布を世界規模で校正する。
私たちの研究は、実世界のデータセットを用いたマルチモーダルデータ同化に、初めて深層生成フレームワークを適用しました。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 23:30:05 GMT)
Using Deep Convolutional Neural Networks to Detect Rendered Glitches in Video Games [0.1] 本研究は,86.8%の精度で高い性能を達成できるテクスチャ・グラフィカルな異常を検出することに焦点を当てている。
本研究は, 偽陽性問題に対処するための信頼度測定と, 画像のアグリゲーションを効果的に行い, 製造時の検出精度の向上を図ることを目的とする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:59:45 GMT)
Pauli Manipulation Detection codes and Applications to Quantum Communication over Adversarial Channels [0.1] 我々は、高い確率で全てのパウリエラーを検出する「パウリマニピュレーション検出」コード(PMD)を作成した量子コードを導入し、明示的に構築する。
逆チャネル上での量子通信において,2つのタスクに対して,第1次準最適符号を構築する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:00:12 GMT)
Exploring Multilingual Large Language Models for Enhanced TNM classification of Radiology Report in lung cancer staging [0.1] 大型言語モデル(LLM)は、自然言語による放射線学レポートの構造化を自動化することを約束する。
本研究の目的は,GPT3.5-turbo (GPT3.5) を用いた放射線学報告に基づくTNM分類の精度と日本語と英語の多言語LPMの有用性を検討することである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:19:46 GMT)
Balanced Coupling in Electromagnetic Circuits [0.1] 共振器駆動または共振器-共振器結合の電気的および磁気的成分のバランスをとることにより、RWAを正確に行うことができる。
RWAが正確であるこの種のバランスは、超伝導量子ビットに応用され、通常は強いラビの運転に結びつく栄養を抑える。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:01:58 GMT)
Wigner function properties for electromagnetic systems [0.0] 電磁場におけるスカラー粒子に対するシュリンガー方程式の正確な3次元解を構築した。
2種類のウィグナー関数の探索を行う。
ウィグナー函数を知ることで、平均運動量ベクトル場と量子系のエネルギースペクトルの分布を見つけることができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:07:32 GMT)
What's in an embedding? Would a rose by any embedding smell as sweet? [0.0] 大規模言語モデル(LLM)は、真の「理解」と知識を「理解」する能力に欠けるとしてしばしば批判される。
我々は LLM が「幾何学的」な経験的な「下地」を開発しており, NLP の応用には十分と思われることを示唆する。
これらの制限を克服するために、私たちはLLMをエキスパートシステムで使用されるシンボリックAI要素を含む知識の「代数的」表現に統合すべきだと提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:38:13 GMT)
W as the Edge of a Wedge: Bell Correlations via Constrained Colliders [0.0] この記事は提案に対する新たな議論の概要である。
これは、遅延チョイスエンタングルメントスワップを含む特別な(W字型)ベルの実験に対してどのように有効かを説明し、一般的な(V字型)ケースに拡張できると主張している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:51:09 GMT)
UzMorphAnalyser: A Morphological Analysis Model for the Uzbek Language Using Inflectional Endings [0.0] 接尾辞は、単語に付加的な意味と文法的機能を加えることによって、単語の形態解析において重要な役割を果たす。
本稿では,ユーズベク語の形態解析のモデル化について述べる。
提案されたモデルに基づく開発ツールは、WebベースのアプリケーションとオープンソースのPythonライブラリとして利用できる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:16:46 GMT)
Unveiling the Power of Wavelets: A Wavelet-based Kolmogorov-Arnold Network for Hyperspectral Image Classification [0.0] 本稿では,ウェーブレットをベースとしたKolmogorov-Arnold Network(wav-kan)アーキテクチャを用いて,複雑な依存関係の効率的なモデリングを行う。
ウェーブレットベースのアクティベーションにより、Wav-KANはマルチスケールの空間およびスペクトルパターンを効果的にキャプチャできる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 04:52:40 GMT)
Ultrasensitive single-ion electrometry in a magnetic field gradient [0.0] 静磁場勾配を用いて電場摂動とスピン状態の結合を増幅する。
印加された外部電場摂動によって生じる力による捕捉されたイオンの変位は、内部スピン状態のエネルギー準位分裂の瞬間的な変化にマッピングされる。
我々は、サブHzから$simmathrm500kHz$の周波数範囲にわたって、直流信号と交流信号の両方を測定するための前例のない電界感度を実証した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:07:45 GMT)
US College Net Price Prediction Comparing ML Regression Models [0.0] 本稿では,政府のウェブサイトに公開されているデータからUS College Scorecardのデータを分析することに焦点を当てる。
我々の目標は、4つの機械学習回帰モデルを用いて予測モデルを構築し、各大学における等価ネットコストを予測することである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:41:14 GMT)
Two-tone spectroscopy of high-frequency quantum circuits with a Josephson emitter [0.0] 我々は、電圧バイアスの超伝導体-常温超伝導体-ジョセフソン接合によって高周波放射が発生する量子回路上で2トーン分光を行う。
この2トーンジョセフソン分光法はミリ波帯内でよく動作し、80GHz以上の周波数に達することを実証する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:33:53 GMT)
Towards minimal self-testing of qubit states and measurements in prepare-and-measure scenarios [0.0] 自己検査は、量子状態や測定を認証するための有望なアプローチである。
線形目撃者を用いて、4(3-)結果の極端正の演算子評価尺度を自己検査する方法を示す。
我々の構成の1つは、射影測定の助けを借りて、任意の数の状態の自己検査を達成する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:47:19 GMT)
Towards determining the (2+1)-dimensional Quantum Electrodynamics running coupling with Monte Carlo and quantum computing methods [0.0] 本稿では,実行結合を解析し,非摂動的な$Lambda$-パラメータを抽出する戦略を提案する。
我々はモンテカルロシミュレーションと量子コンピューティングを用いて、小さな格子間隔から大規模格子計算への結果をブリッジする。
この研究で概説された手順は、物質場を持つアベリアおよび非アベリア格子ゲージ理論にまで拡張することができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:47:32 GMT)
Topological linear response of hyperbolic Chern insulators [0.0] ホールの導電率は$e2C_ij/h$に量子化され、$C_ij$が最初のチャーン数であることを示す。
我々は、アベリア州と非アベリア・ブロッホ州から寄付を受けているが、チャーン数はアベリア州からのみ計算できることを示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:38:43 GMT)
The observer effect in quantum: the case of classification [0.0] 感覚情報は観測状態と複雑に絡み合っていることを示す。
この枠組みは、観測者効果の量子確率に基づく理解の基礎となる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:23:53 GMT)
The magic of entangled top quarks [0.0] 我々は、古典的状態に対して真の計算上の優位性を持つこれらの量子状態を区別する魔法の性質を考える。
LHCにおけるトップアンチトップペア生産について検討し、自然がマジックトップを生産することを選択することを示す。
個々のパートニックチャネルとプロトンレベルでの結果を比較して、最終状態平均化がマジックを増大させることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:26:04 GMT)
Tell Me a Story! Narrative-Driven XAI with Large Language Models [0.0] 今日の多くのAIアプリケーションにおいて、ブラックボックス機械学習モデルの優位性は、説明可能なAI(XAI)の必要性を増幅している。
既存のXAIアプローチ、例えば広く使われているSHAP値や反ファクトリアル(CF)説明は、ユーザが理解し、実行するのに技術的すぎることは間違いありません。
我々は、XAIstoriesを導入し、大規模言語モデルを活用し、AI予測の作り方について物語を提供する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:18:37 GMT)
Suppressing unknown disturbances to dynamical systems using machine learning [0.0] 本研究では,未知のシステムに対して未知の障害を特定し,抑制するためのモデルフリーな手法を提案する。
トレーニング関数の極めて穏やかな制限の下で,本手法は未知の乱れを強く識別し,抑制することができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:47:38 GMT)
Spectral continuum in the Rabi-Stark model [0.0] スペクトルがしきい値から無限大まで連続的に広がることを示す。
一連の正規化可能な状態が連続体に埋め込まれ、原子のスターク効果と予期せぬ類似性を持つ。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:31:37 GMT)
Sparse Bayesian Multidimensional Item Response Theory [0.0] 我々は,大規模なデータセットに対して最小限のチューニングとスケールを必要とする二項および順序項目MIRTのためのベイズプラットフォームを開発する。
ベイズ非パラメトリックスによるツールによる未知の潜在因子次元の問題に対処する。
本手法は, 微小サンプルにおいても高次元合成データの因子次元と潜時構造の両方を確実に回収する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:35:15 GMT)
Simple yet Sharp Sensitivity Analysis for Any Contrast Under Unmeasured Confounding [0.0] 生成した境界が依然として任意にシャープであること、すなわち実際に達成可能であることを証明します。
実データによる境界のユーザビリティについて説明する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 07:02:59 GMT)
Sequential composition of answer set programs [0.0] 本稿では,解集合プログラムの逐次構成を導入,研究することにより,論理プログラミングの数学的基礎に寄与する。
より広い意味では、本論文は、解集合プログラムの代数への第一歩であり、将来的には、この論文の手法をプログラムのより広範なクラスに引き上げる計画である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:51:34 GMT)
Reservoir-Free Decoherence in Flying Qubits [0.0] 空間展開の小さい弾道粒子の力学, 忠実度, エントロピーの変化に対して, 常に有効な式を提供する。
この非マルコフ的デコヒーレンスは、弾道的な飛行量子ビットには有益であるが、通常、移動ポテンシャル井戸によって運ばれる飛行量子ビットには有益である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:21:08 GMT)
Reliability and Interpretability in Science and Deep Learning [0.0] この記事では、従来の科学的モデルとDeep Neural Network(DNN)モデルの比較に焦点を当てる。
DNNモデルの複雑さは、その信頼性と長期的進歩の予測を妨げていると論じている。
また、解釈可能性が、統計分析だけでは理解できないあらゆるモデルの信頼性を評価するための前提条件であることも明らかにした。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:18:04 GMT)
Reinforcement Learning to Disentangle Multiqubit Quantum States from Partial Observations [0.0] 任意の 4-, 5-, 6-qubit 状態に対して短絡回路を構築するための深層強化学習手法を提案する。
マルチキュービット状態の絡み合い構造を識別・活用するエージェントの能力を実証する。
我々は,少なくとも5つの2ビット (10 CNOT) ゲートを用いて,任意の4ビット状態を作成するための汎用回路を報告する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:23:08 GMT)
Realization of topological Thouless pumping in a synthetic Rydberg dimension [0.0] セシウム原子のリドベルク状態から1次元ライス・ミール鎖を工学的に構築することにより,合成次元におけるトポロジカル量子ポンピングの実現を実証する。
我々は、トポロジカルポンピングのためのThoulessプロトコルを実装し、ポンピングの期間と他のパラメータの関数として有効な量子粒子をポンピングする効率について検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:00:06 GMT)
Quantum-fluctuation asymmetry in multiphoton Jaynes-Cummings resonances [0.0] 多光子遮断状態下で作動するJynes-Cummings(JC)発振器から発する光の統計的挙動について検討する。
「条件付きホモダイン検出におけるキャビティ場の異なる四分音のモニタリングは、連続した光子カウンタクリックの待ち時間に影響を与える。」
定常的なキャビティ占有が光子の順序であるにもかかわらず、2つのデコヒーレンスチャネルに沿って向き付けられたエミッションの比率にも影響する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:55:09 GMT)
Quantum metrology with linear Lie algebra parameterisations [0.0] 我々は、線形微分方程式をもたらす量子フィッシャー情報に対する新しいリー代数展開を提供する。
これにより、多くの気象問題に関わる計算が大幅に削減される。
量子光学および非線形光学における問題に適用されたこれらの手法の詳細な例を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:08:38 GMT)
Quantum Reductive Perturbation Method for Photon Propagations in a Cold Atomic Gas [0.0] 量子還元法 (quantum reductive method, RPM) は、非線形波動理論において広く用いられる古典的RPMの一般化である。
RPMは、コヒーレントな低温原子ガス中の2光子結合状態と光ソリトンについて議論するために用いられる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:57:45 GMT)
Quantum Hamilton-Jacobi Theory, Spectral Path Integrals and Exact-WKB [0.0] ハミルトン・ヤコビ理論は強力な形式主義であるが、その効用は対応原理を超えた量子論では研究されていない。
我々は、ハミルトン・ヤコビ理論の量子バージョンを用いて、量子力学において経路積分を実行する新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:50:43 GMT)
Quantum Computation by Cooling [0.0] 本稿では,断熱進化に基づく量子計算のための特定のハミルトンモデルを提案する。
この冷却法に基づく量子計算は、その計算能力において量子回路に基づく計算と等価であることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:17:50 GMT)
Prediction of the Realisation of an Information Need: An EEG Study [0.0] 本研究は,質問応答(Q/A)タスクにおいて,14項目にわたる脳波データ内のINの実現を予測できる能力について検討した。
脳波データは、73.5%(SD 2.6%)の精度と90.1%(SD 22.1%)の精度で、すべての被験者のINの実現をリアルタイムで予測するのに十分である。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:34:19 GMT)
Points2NeRF: Generating Neural Radiance Fields from 3D point cloud [0.0] ニューラルラジアンス場(NeRF)として3次元物体を表現することを提案する。
ハイパーネットワークのパラダイムを活用して、モデルをトレーニングして、関連するカラー値を持つ3Dポイントクラウドを取ります。
提案手法は効率的な3次元オブジェクト表現を提供し,既存手法に対するいくつかの利点を提供する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:22:48 GMT)
Phase and amplitude modes in the anisotropic Dicke model with matter interactions [0.0] 位相モードと振幅モードは、様々な物理系にまたがる創発的な現象である。
物質相互作用を含む異方性ディックモデルでそれらの挙動を研究する。
異方性相互作用と物質相互作用の相互作用によって生じる特異な臨界特性により,我々は新たな現象を明らかにする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:29:25 GMT)
Parameter Estimation in Quantum Metrology Technique for Time Series Prediction [0.0] 本稿では,気象予測における量子計算の手法について検討する。
変動パラメータ推定による予測ポテンシャルの向上に焦点を当てる。
パラメータ分布と学習速度が予測精度に与える影響について検討した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:55:45 GMT)
Parallel trusted node approach for satellite quantum key distribution [0.0] 衛星リンクによる量子鍵分布は、量子バックアップされたセキュアな通信を作成するための唯一の解決方法である。
本稿では,複数の衛星が並列に鍵分布を媒介する並列信頼ノード手法を提案する。
これは、信頼を分散し、単一障害点を取り除き、必要な仮定を減らす効果がある。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:02:29 GMT)
Overcoming noise in quantum teleportation with multipartite hybrid entanglement [0.0] 純粋デコヒーレンスの存在下での効率的な量子テレポーテーションプロトコルを提案する。
我々は全光学実験でプロトコルを実証した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:01:09 GMT)
Optical Investigations of Coherence and Relaxation Dynamics of a Thulium-doped Yttrium Gallium Garnet Crystal at sub-Kelvin Temperatures for Optical Quantum Memory [0.0] 我々はイットリウムガーネット(Tm:YGG)の光コヒーレンスとエネルギーレベル寿命の測定を報告した。
この結果から、Tm:YGGは量子リピータのための多重フォトニック量子メモリとして有望であることが示唆された。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:56:19 GMT)
Opportunities in deep learning methods development for computational biology [0.0] 分子技術は、生物学や生物医学に関連するデータセットのサイズを大きく成長させる。
これらの進歩は、機械学習の深層学習サブフィールドにおけるそれと平行している。
これらのツールの多くは、計算生物学やバイオインフォマティクスの分野で完全には普及していない。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 22:58:45 GMT)
Operational Interpretation of the Choi Rank Through k-State Exclusion [0.0] 勅位官の位階は重んじられている。
チョイランクは、アリスとボブの2人のエージェントがいかにして絡み合いの支援された排除タスクを実行できるかという普遍的な境界を提供する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:05:01 GMT)
One-shot and asymptotic classical capacity in general physical theories [0.0] 仮説テストでは、相対エントロピーと1ショットの古典的容量、すなわち、伝達される古典的情報の最適な速度を考える。
上記の2つの境界を適用して、任意の一般物理理論においても古典的キャパシティと仮説テストの相対エントロピーの同値性を証明する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:12:35 GMT)
On the Relative Nature of Quantum Individuals [0.0] 我々は、量子力学(SQM)の「スタンダード」の説明の根底にある解釈に反対する。
我々は、特定の複雑性の度合いにおける関係の最小セットとして定義される量子個人の新しい理解を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:54:02 GMT)
Near-unity indistinguishability of single photons emitted from dissimilar and independent atomic quantum nodes [0.0] 2つの異なる原子量子ノードから非常に区別できない単一光子を生成することを実証する。
1つのノードは、完全にブロックされたコールドRydbergアンサンブルに基づいており、オンデマンドの単一光子を生成する。
時間窓に9,4.6 pm 5.2 % の光子を90% の光子を含む不明瞭性を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:38:28 GMT)
Multi-objective Reinforcement learning from AI Feedback [0.0] 本稿では、AIフィードバック(RLAIF)からの強化学習を用いて訓練された言語モデルのアライメントと性能を改善するための新しいアプローチを提案する。
すべての人間の嗜好を表現するために、単一の嗜好モデルを訓練する標準的なアプローチとは対照的に、MORLAIFは、このタスクを毒性、事実性、梅毒といったより単純な原則に分解する。
我々の実験は、MORLAIFが標準のRLAIFベースラインより優れており、MORLAIFはより小さな言語モデルを用いて、より大きな言語モデルを調整するために使用できることを示している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:55:30 GMT)
Mental intervention in quantum scattering of ions without violating conservation laws [0.0] 神経細胞の軸索丘におけるイオンの量子力学的散乱方向の心的選択は、拡散に影響を与え、作用電位を開始する。
熱力学の第2法則の同時違反を推定する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 19:10:05 GMT)
Malicious URL Detection using optimized Hist Gradient Boosting Classifier based on grid search method [0.0] 悪意のあるウェブサイトが不正な理由で情報を収集する可能性があるため、オンラインプラットフォームで入力されたデータの正確さを信頼することは困難である。
悪意のあるWebサイトが引き起こすリスクを検出するために,機械学習(ML)ベースの手法を用いることを提案する。
使用されるデータセットには、悪意のあるWebサイトデータの1781のレコードと13の機能が含まれている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:16:30 GMT)
Making AI Intelligible: Philosophical Foundations [0.0] 「AI知能の育成」は、意味のメタ物理に関する哲学的な研究がこれらの疑問に答えるのに役立つことを示している。
著者: 本書で取り上げられた質問は理論的に興味深いだけでなく、答えは実際的な意味を迫っている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:25:04 GMT)
Machine-learned models for magnetic materials [0.0] 多次元特性(測定を模倣する)で表される磁性物質は、神経オートエンコーダモデルを訓練するために使用される。
ニューラルモデルは、幅広い物質的挙動をカバーすることができる、合成的に生成された特徴の集合を捉えるように訓練されている。
周波数領域と電流領域(線外領域)領域の磁性物質を同時にモデル化する複雑な問題において,その有用性を証明する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:52:07 GMT)
Leveraging advances in machine learning for the robust classification and interpretation of networks [0.0] シミュレーションアプローチでは、Erd"os-R'enyiやSmall-worldのような適切なネットワーク生成モデルを選択する。
我々は、解釈可能な機械学習の進歩を利用して、様々なネットワーク属性に基づいて、生成モデルによってシミュレーションされたネットワークを分類する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:27:04 GMT)
Leveraging Large Language Models for Web Scraping [0.0] 本研究では,言語生成用に設計したRAGモデルに対して,汎用的な高精度なデータスクレイピング手法について検討する。
よりモジュール的で解釈可能な方法で知識をキャプチャするために、私たちは、潜在的な知識検索機能を備えた事前訓練された言語モデルを使用します。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:15:15 GMT)
Learning Outcomes, Assessment, and Evaluation in Educational Recommender Systems: A Systematic Review [0.0] 教育レコメンダシステム(ERS)における学習の測定と最適化について分析する。
レーティングベースの関連性は最も人気のあるターゲットメトリックであり、半数未満の論文が学習ベースのメトリクスを最適化している。
論文の3分の1は結果に基づく評価を使用してレコメンデーションの教育効果を測定した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:53:46 GMT)
Learnable & Interpretable Model Combination in Dynamic Systems Modeling [0.0] 我々は、通常、どのモデルが組み合わされるかについて議論し、様々な混合方程式に基づくモデルを表現することができるモデルインターフェースを提案する。
本稿では,2つの組み合わせモデル間の汎用的な接続を,容易に解釈可能な方法で記述できる新しいワイルドカードトポロジーを提案する。
本稿では、2つのモデル間の異なる接続トポロジを学習し、解釈し、比較する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:17:11 GMT)
Large-scale spin-orbit photonic circuits in two dimensions [0.0] 特定のマップに従って入力モードと出力モードを接続するフォトニック回路は、光の古典状態と量子状態の両方に有効な光学プロセッサとして機能する。
本稿では,大規模ユニタリマップを実装したフォトニック回路技術について述べる。
この地図は3つの液体-結晶準曲面における光の伝播を通じて実験的に実現された構造化光子の量子ウォークの結果に対応する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:29:10 GMT)
Is Stateful Fuzzing Really Challenging? [0.0] 我々は、ステートフルなファジィザを考案し、ベンチマークすることが難しい理由について論じる。
ファジィングはソフトウェアの脆弱性を見つけるのに非常に効果的であることが証明されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:01:47 GMT)
Invariant multiscale neural networks for data-scarce scientific applications [0.0] 対称性を意識した不変アーキテクチャと拡張畳み込みのスタックを組み合わせることは、非常に効果的で容易にレシートを実装することができる。
本稿では,フォトニック結晶のバンドギャップの予測と磁気基底状態のネットワーク近似という,異なる領域の物理問題に応用する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:19:25 GMT)
Information scrambling and the growth of errors in noisy tomography -- a quantum signature of chaos [0.0] 連続計測量子トモグラフィーを量子カオス研究のパラダイムとして用いている。
本研究では、乱れと乱れのないシステム力学の下での2つの演算子間の時間外順序付き相関器(OTOC)であるエラーのスクランブルを捉える量を定義する。
我々の結果は、OTOCsが捉えたように、Loschmidtエコーと誤差のスクランブルの基本的なリンクを示すだけでなく、そのようなリンクが量子情報処理に作用することを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:46:39 GMT)
Improved Decoy-state and Flag-state Squashing Methods [0.0] 我々はデコイ状態法の改良した解析法を提案する。
我々の主な焦点は、現在のデコイ状態法で観察される欠点を改善することである。
我々は、信号状態に応じて強度が変化するシナリオを包含するようにデコイ状態技術を拡張した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:36:53 GMT)
Identification of Conversation Partners from Egocentric Video [0.0] エゴセントリックなビデオデータは、ユーザの会話相手を特定するために使用することができる。
近年のコンピュータビジョンにおけるデータセットとタスクの導入は、エゴセントリックな観点からの社会的相互作用の分析に向けた進歩を可能にする。
私たちのデータセットは、多様な多会話シナリオのエゴセントリックなビデオ69時間で構成されています。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:12:30 GMT)
How social reinforcement learning can lead to metastable polarisation and the voter model [0.0] エージェントが強化学習を用いて意見を形成する場合、偏光は安定であることを示す。
強化学習モデルと有権者モデルとのリンクを構築することにより、観測された分極は準安定であると主張する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:38:47 GMT)
Hiperwalk: Simulation of Quantum Walks with Heterogeneous High-Performance Computing [0.0] Hiperwalkは、異種高速コンピューティングを用いた量子ウォークのシミュレーションを容易にするように設計されている。
このパッケージは、連続時間と離散時間の両方の量子ウォークモデルのシミュレーションを可能にする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:17:05 GMT)
Hierarchical Neural Networks, p-Adic PDEs, and Applications to Image Processing [0.0] 本稿では, p-adic reaction-diffusion cellular neural network について紹介する。
これらのネットワークの安定性について検討し,その応答の数値シミュレーションを行う。
第2の目標は、p進のセルラーニューラルネットワークとその画像処理への応用について、簡単なレビューを提供することである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:10:32 GMT)
Harnessing GenAI for Higher Education: A Study of a Retrieval Augmented Generation Chatbot's Impact on Human Learning [0.0] 本研究で紹介されるLeodar教授は、カスタムメイドのSinglish- speak Retrieval Augmented Generation (RAG)である。
シンガポールの南陽工科大学で展開されたLeodar教授は、AIによる学習の未来を垣間見る。
混合手法を用いて,レオダール教授が学生の学習,エンゲージメント,試験準備に与える影響を明らかにする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:19:36 GMT)
Global AI Governance in Healthcare: A Cross-Jurisdictional Regulatory Analysis [0.0] 人工知能(AI)は世界中で採用されており、医療における新たな革命を約束している。
北米のAI対応医療機器は世界市場の42.3%を占めているが、他国でのAI対応医療機器の使用は依然として展開を待っている物語である。
私たちは、医療におけるAI利用に対するグローバルな規制アプローチを深く掘り下げることを目指しています。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 23:36:16 GMT)
Genetic Column Generation for Computing Lower Bounds for Adversarial Classification [0.0] 遺伝的カラム生成のアイデアは,マルチクラス分類における最小対角リスクの計算において,次元の呪いを克服するためにどのように使用できるかを検討する。
本稿では,遺伝的カラム生成のアイデアが,マルチクラス分類における最小対角リスクの計算における次元の呪いを克服するために利用できることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:34:42 GMT)
Generalized Rate Operator Quantum Jumps via Realization-Dependent Transformations [0.0] 我々は、レート演算子形式に基づく量子ジャンプ記述に焦点を当てる。
純粋状態実現の枠組みの中で状態依存率演算子変換を導入する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:05:18 GMT)
Gate-based counterdiabatic driving with complexity guarantees [0.0] 本稿では,反断熱駆動のためのゲートベース量子アルゴリズムを提案する。
これは断熱ゲージポテンシャルの正則化を利用して、利子の固有状態からの遷移のみを抑制する。
これは、断熱に対する一般的なショートカットとしての反断熱運転の認識に疑問を呈する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:29:21 GMT)
From Entanglement to Universality: A Multiparticle Spacetime Algebra Approach to Quantum Computational Gates Revisited [0.0] 量子コンピューティングへの2つの応用における幾何代数(GA)技術の有用性の検証に焦点をあてる。
第一に、1および2量子ビット量子状態の明示的な代数的特徴と、1および2量子ビット量子計算ゲートのMSTA記述を提供する。
この最初の応用では、絡み合った量子状態と2量子の絡み合う量子ゲートに焦点をあてて、絡み合いの概念に特別な注意を払っている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 12:16:21 GMT)
Fluorescence enhancement of single V2 centers in a 4H-SiC cavity antenna [0.0] 空洞型光アンテナにおけるV2中心の統合について報告する。
この構造は、平面キャビティとして機能する銀でコーティングされた135nmの薄膜4H-SiC膜からなる。
低温下で80MHz以下の平均幅の10V2中心を観測した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:40:07 GMT)
Fine-Tuned 'Small' LLMs (Still) Significantly Outperform Zero-Shot Generative AI Models in Text Classification [0.0] Generative AIは、テキスト分類タスク用の小さなBERTスタイルのLLMを微調整する、シンプルでプロンプトベースの代替手段を提供する。
テキスト分類において、より小さく微調整されたLLMは、より大きく、ゼロショットの引き起こされるモデルよりもはるかに優れていることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 21:46:13 GMT)
Fault detection in propulsion motors in the presence of concept drift [0.0] 機械学習と統計的手法は、海洋システムにおける監視と故障予測を強化するために使用できる。
概念ドリフトと呼ばれる基盤システムの予期せぬ変化は、これらの手法の性能に影響を及ぼす可能性がある。
本研究では, コンセプトドリフト時の運転を成功させる水力推進電動機の固定子巻線における過熱検出手法を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:31:03 GMT)
Fast Kernel Summation in High Dimensions via Slicing and Fourier Transforms [0.0] カーネルベースの手法は機械学習で多用されている。
彼らは考慮されたデータポイントの$O(N2)$複雑さに悩まされる。
近似法を提案し、この複雑さを$O(N)$に削減する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:20:38 GMT)
Family of Exact and Inexact Quantum Speed Limits for Completely Positive and Trace-Preserving Dynamics [0.0] 我々は、ユニタリを超越した力学のために、リウヴィル空間において2つの異なる量子速度制限を導出する。
第1のバウンドは時間最適CPTPダイナミクスに対して飽和し、第2のバウンドはすべての状態と全てのCPTPダイナミクスに対して正確である。
我々は、リウヴィル空間における進化の速度がスペクトル形成因子の成長と状態のクリロフ複雑性に結びつくことを示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:44:34 GMT)
Exploring Fact Memorization and Style Imitation in LLMs Using QLoRA: An Experimental Study and Quality Assessment Methods [0.0] PEFT手法の1つであるQLoRAを用いてモデルを適用する可能性を検討する。
この実験は、インタビューに基づいて人間の反応をシミュレートすることを目的としている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:38:40 GMT)
Experimental Quantum Advantage in the Odd-Cycle Game [0.0] 2m間隔で2つのイオンを絡み合わせると、プレイヤーは最適な戦略よりもかなり頻繁に奇数サイクルのゲームに勝つためにそれらを使う。
この実験は最適量子戦略を実装しており、検出の抜け穴がない。
0.54(2)の非局所コンテンツ -- 物理的に分離されたデバイスにとって最大の値で、検出の抜け穴がない。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:57:56 GMT)
Exact Correlation Functions for Dual-Unitary Quantum circuits with exceptional points [0.0] 双対ユニタリ量子回路を例外点で構築する逆手法を提案する。
固有ベクトルの結果として、相関関数は指数関数の変形を示す。
相関関数の挙動はラテンポス変換によって異なることを示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:44:29 GMT)
Evaluating the Impact of Sequence Combinations on Breast Tumor Segmentation in Multiparametric MRI [0.0] mpMRIにおける配列の組み合わせの効果は未解明のままである。
DCE配列を用いたnnU-Netモデルは機能腫瘍容積(FTV)セグメンテーションにおいて0.69$pm$0.18のDice類似係数(DSC)を達成した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:09:05 GMT)
Entropy-statistical approach to phase-locking detection of pulse oscillations: application for the analysis of biosignal synchronization [0.0] 同期の動的特性はファジィエントロピー(ファジィエントロピー)であり、位相同期間隔におけるパルス周期(サブハーモニック比、SHR)の比率からなる時系列を計算した。
同期状態のエントロピーマップを用いて、回路の同期モードを効果的に可視化する。
ラット海馬の局所野電位の位相-位相結合リズムの例を用いて、非相対性(非スパイク)型信号を解析するためのこの方法の拡張を図示した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 02:34:48 GMT)
Enhancing phase sensitivity in Mach-Zehnder interferometer with various detection schemes using SU(1,1) coherent states [0.0] マッハ・ツェンダー干渉計(Mach-Zehnder Interferometer, MZI)は、この現象を解析するための多用途ツールである。
本稿では,異なる検出手法と入力状態を用いて,MZIの位相感度を種々のシナリオで解析する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:54:17 GMT)
Emotion Manipulation Through Music -- A Deep Learning Interactive Visual Approach [0.0] 我々は,AIツールを用いて歌の感情的内容を操作する新しい方法を提案する。
私たちのゴールは、元のメロディをできるだけそのままにして、望ましい感情を達成することです。
この研究は、オンデマンドのカスタム音楽生成、既存の作品の自動リミックス、感情の進行に合わせて調整された音楽プレイリストに寄与する可能性がある。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:12:29 GMT)
Emergent spinon-holon Feshbach resonance in a doped Majumdar-Ghosh model [0.0] ドープMGモデルの単一ホール角分解光電子スペクトル(ARPES)について検討した。
本研究では, ARPESスペクトルにおけるスピン-ホロン基底状態とスピン-ホロン分子状態とポラロンの明確なシグネチャを異なる磁化で報告する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:34:26 GMT)
Efficient adaptive Bayesian estimation of a slowly fluctuating Overhauser field gradient [0.0] オーバーハウザー場の遅いゆらぎは、III-V半導体量子ドットにホストされるスピン量子ビットにおけるデコヒーレンスの重要な源である。
我々は、一連の自由帰納的崩壊実験により勾配の大きさを推定する2つの適応ベイズ的スキームを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:50:20 GMT)
ECG Classification System for Arrhythmia Detection Using Convolutional Neural Networks [0.0] 本研究では, 畳み込みニューラルネットワーク(CNN)アルゴリズムを用いた深層学習(DL)パイプライン技術を用いて, 患者の心血管性喉頭不整脈を検出する。
その結果, 提案した戦略は, 98.2%の精度で15,000の症例を分類した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:16:40 GMT)
Dynamical evolution of social network polarization and its impact on the propagation of a virus [0.0] 我々は, ワクチン接種前後のネットワーク特性だけでなく, ソーシャルネットワーク内での動的分極の解析を行った。
我々は、ワクチンを予防接種者、非予防接種者に割り当てることにより、分極社会におけるウイルスの伝播をシミュレートする。
分極ネットワークでは、ウイルスの拡散が著しく広がり、疫病予測において分極を考慮することの重要性が強調される。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:00:05 GMT)
Diffusion models for Gaussian distributions: Exact solutions and Wasserstein errors [0.0] 拡散モデルやスコアベースモデルでは画像生成の性能が向上した。
本研究では,データ分布がガウス的である場合の拡散モデルの挙動とその数値的実装について理論的に検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:26:18 GMT)
Diff-A-Riff: Musical Accompaniment Co-creation via Latent Diffusion Models [0.0] ディフ・A・リフ(Diff-A-Riff)は、あらゆる音楽的文脈に適応する高品質な楽器を生成するために設計された潜在拡散モデルである。
48kHzの擬似ステレオオーディオを生成し、推論時間とメモリ使用量を大幅に削減する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 16:34:26 GMT)
Detecting Markovianity of Quantum Processes via Recurrent Neural Networks [0.0] 本稿では、マルコフ的および非マルコフ的量子過程を分類するために、リカレントニューラルネットワーク(RNN)を利用する新しい手法を提案する。
このモデルは、様々なシナリオにまたがって95%を超える例外的な精度を示す。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:36:52 GMT)
Designing metasurface optical interfaces for solid-state qubits using many-body adjoint shape optimization [0.0] 本稿では, 基本形状からなる地表面の逆設計に関する一般的な戦略について述べる。
私たちは、ダイヤモンドの窒素空洞センターから光を集め、衝突させる構造を設計するためにそれを使用します。
このような準曲面は、固体量子ビットのためのスケーラブルな光学インターフェースを構成する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:43:01 GMT)
Deep learning from strongly mixing observations: Sparse-penalized regularization and minimax optimality [0.0] ディープニューラルネットワーク予測器のスパースペナル化正規化について検討する。
正方形と幅広い損失関数を扱う。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 15:21:51 GMT)
Deep Bayes Factors [0.0] 本稿では,2つの競合モデルのシミュレーションデータに基づいてベイズ係数のディープラーニング推定手法を提案する。
我々の推定器は要約統計を欠き、ABCモデル選択の難しさのいくつかを排除している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:21:31 GMT)
Data Petri Nets meet Probabilistic Programming (Extended version) [0.0] 本稿では,データペトリネット(DPN)をPP言語で記述されたモデルに体系的に翻訳する。
我々は,我々の翻訳が健全であることを示し,DPNをシミュレートするための統計的保証を提供する。
本稿では,提案する翻訳ツールと利用可能なPPツールに基づいて,より容易にアプローチ可能な分析シナリオについて論じる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:07:35 GMT)
Conference Proceedings of The European DAO Workshop 2024 [0.0] この完全な論文集は、分散意思決定、ビジネスモデル、人工知能、経済学、分散化のための法的課題といった分野に展開している。
この多様なコンピレーションは、分散組織が急速に成長する現象を多分野に調査する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:42:08 GMT)
Collinear three-photon excitation of a strongly forbidden optical clock transition [0.0] 弱磁場中における新しいコリニア3光子過程を用いて, ボソニック8.8$Srにおけるクロック遷移のコヒーレント励起を示す。
ボゾン同位体における核スピンの欠如は、磁場に対する感度の低下と光学格子光シフトをもたらす。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 06:10:28 GMT)
Coherence limits in lattice atom interferometry at the one-minute scale [0.0] 原子干渉法では、非古典状態は空間的重ね合わせであり、各原子は複数の場所で共存する。
原子干渉計では、利用可能な尋問時間は10mの噴水で約3秒に制限される。
ここでは,70秒間維持される空間重畳状態の原子干渉計を実現する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:14:09 GMT)
Classification Modeling with RNN-Based, Random Forest, and XGBoost for Imbalanced Data: A Case of Early Crash Detection in ASEAN-5 Stock Markets [0.0] 本研究は,市場崩壊の頻度が高いためによく見られる不均衡なデータを用いて検討した。
この調査は、ASEAN-5諸国の主要株式市場における2010年から2023年までの日次データを分析している。
様々なRNNアーキテクチャの中で、Simple RNNが最も優れていると指摘している。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 05:35:28 GMT)
Classical simulability of constant-depth linear-optical circuits with noise [0.0] ノイズは、量子計算の優位性を達成する量子デバイスを実現する上での大きな障害の1つである。
本研究では,光子損失と偏微分性の影響下での浅い深度線形光回路の複雑さについて検討する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:08:57 GMT)
Classical circuits can simulate quantum aspects [0.0] 本研究では,電気ネットワークを用いた量子システムのシミュレーション手法を提案する。
相互作用ネットワークを合成することにより、2-$state から$n-$state まで、様々な複雑さの量子システムを正確にシミュレートする。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:23:46 GMT)
Building Software Engineering Capacity through a University Open Source Program Office [0.0] この研究は、大学環境で次世代のソフトウェアエンジニアを訓練するための革新的なプログラムを導入する。
本稿では,プログラムの持続化を図るため,全体のコスト削減と持続可能な資金源の確立に向けた戦略を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 22:40:35 GMT)
Brief Theory of Multiqubit Measurement [0.0] フォン・ノイマン・プロジェクターは、可能な純粋状態上のプロジェクターに対する数学的な期待の集合として、キューディット状態の位相像のアイデアを生成する。
エンタングルメントは、条件相像の形状が、他の粒子の測定に使用される可観測物の特性に依存することにより表される。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:09:48 GMT)
Bridging the Gap: Unravelling Local Government Data Sharing Barriers in Estonia and Beyond [0.0] エストニアのデジタル政府の成功は世界的に評価されているが、Open Government Dataイニシアチブ、特に地方レベルでは、永続的な課題に直面している。
本研究の目的は,自治体がOGDをオープンに共有することを妨げる障壁を検討することである。
国家政策と地域政策のギャップを埋めるために、実践的な勧告が提案されている。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 17:51:47 GMT)
Bridging Neuroscience and AI: Environmental Enrichment as a Model for Forward Knowledge Transfer [0.0] 本研究では, 環境富化(EE)が, 転送研究の生物学的モデルとして利用できることを示唆する。
EEは、認知、社会的、運動、感覚刺激を高める動物研究を指す。
人工ニューラルネットワーク(ANN)が、豊かな経験の後の神経変化を予測するためにどのように使用できるかについて議論する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 23:59:48 GMT)
Blowfish: Topological and statistical signatures for quantifying ambiguity in semantic search [0.0] 提案手法では, プロキシのあいまいなクエリは, プロキシのクリアなクエリよりも, 0 と 1 をベースとした関数の分布が異なることを示す。
本稿では,これらの知見を意味的類似性の新たな評価戦略として活用する戦略を提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 08:26:30 GMT)
Bias-Corrected Joint Spectral Embedding for Multilayer Networks with Invariant Subspace: Entrywise Eigenvector Perturbation and Inference [0.0] 本稿では、新しいバイアス補正型共同スペクトル埋め込みアルゴリズムを用いて、異種多重ネットワーク間の不変部分空間を推定する。
提案アルゴリズムは、閉形式バイアス式を利用して、正方形ネットワーク隣接行列の和の対角偏差を校正する。
提案アルゴリズムのエントリワイドな部分空間摂動境界を含むエントリワイドな部分空間推定理論の完全なレシピを確立する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:36:55 GMT)
Attention-Based Learning for Fluid State Interpolation and Editing in a Time-Continuous Framework [0.0] 連続的なフレームワーク内での流体に対するトランスフォーマーベースのアプローチであるFluidsFormerを紹介します。
PITTと残留ニューラルネットワーク(NNR)の機能を組み合わせることで,流体状態の物理的特性を解析的に予測する。
これにより、シミュレーション時間間でサブステップフレームを補間し、アニメーションの滑らかさとシャープさを高めることができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 13:19:42 GMT)
Analyzing constrained LLM through PDFA-learning [0.0] 我々は,言語モデルの出力がテキスト生成中に何らかの方法で制約されたときに発生する,ヌル次シンボル確率に対処する合同を定義する。
本研究では,このコングルーエンスを効率的に学習するアルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:35:19 GMT)
Analytically exact solution of the Schrodinger equation for neutral helium in the ground state [0.0] 本報告では, 基底状態中の中性ヘリウムあるいはヘリウム様原子に対するシュロディンガー方程式の解析解とその対応する波動関数について述べる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 20:58:49 GMT)
Adversarial Patch for 3D Local Feature Extractor [0.0] ローカル特徴抽出器は多くのコンピュータビジョンタスクの基盤となっている。
本稿では,2つの目標を達成するために,洗練された局所特徴抽出アルゴリズムとモデルを攻撃するアプローチについて論じる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 11:31:18 GMT)
Adversarial Evasion Attack Efficiency against Large Language Models [0.0] 大規模言語モデル(LLM)はテキスト分類に有用であるが、その脆弱性は無視されるべきではない。
本研究は,5種類のLDMに対する3種類の敵攻撃の有効性,効率,実用性について分析した。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 10:02:27 GMT)
A topological analysis of the space of recipes [0.0] 本稿では、料理レシピの空間を研究するために、トポロジカルデータ分析、特に永続的ホモロジーの利用を紹介する。
特に、永続的ホモロジー分析は、既存のレシピの空間におけるマルチスケールの「穴」を取り巻く一連のレシピを提供する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 01:28:16 GMT)
A practical framework for analyzing high-dimensional QKD setups [0.0] 高次元(HD)絡み合いは、鍵レートの強化と現代の量子通信が直面する障害の克服の両方を約束する。
半定値プログラムの双対と、絡み合い-知性理論に着想を得た対角化演算子によって促進される柔軟な解析フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 18:00:01 GMT)
A novel approach to graph distinction through GENEOs and permutants [0.0] 本稿では、同型への$r$正則グラフの識別にGENEOsを用いる方法について検討する。
実験の結果, GENEOsは$r$規則グラフの比較において, 効率と計算コストとの間に良い妥協をもたらすことがわかった。
genEOsは機械学習における差別的問題に対する汎用的なアプローチである。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 09:53:14 GMT)
A deep cut into Split Federated Self-supervised Learning [0.0] 協調型自己教師型学習は、最近、高度に分散した環境で実現可能になった。
MocoSFLのような最先端の手法は、初期層のネットワーク分割に最適化されている。
MonAcoSFLを導入し、オンラインおよびモーメントクライアントモデルをトレーニング手順中に整列させる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:35:13 GMT)
A New Class Biorthogonal Spline Wavelet for Image Edge Detection [0.0] スプラインウェーブレットは、時間と周波数の両方で局在するのに好ましい特性を示した。
本稿では,Cohen-Daubechies-Feauveau ウェーブレット構築法に基づくBCSSWを提案する。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 14:50:40 GMT)
A Labeled Array Distance Metric for Measuring Image Segmentation Quality [0.0] LADとMADLADという2つの距離測度を提案し、2つのラベル付き画像間の距離を算出する。
異なる画像分割アルゴリズムの精度は、その出力を「地上真実」ラベル付けに対して測定することで評価することができる。
論文参考訳(メタデータ) (Wed, 12 Jun 2024 03:39:16 GMT)