Towards Language-Driven Video Inpainting via Multimodal Large Language Models [116.2] 言語駆動型ビデオインペインティングという,新たなタスクを紹介します。
インペイントプロセスのガイドには自然言語命令を使用する。
Instructionsデータセットによるビデオからの削除オブジェクトを提示する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 05:58:37 GMT)
OMG-LLaVA: Bridging Image-level, Object-level, Pixel-level Reasoning and Understanding [112.9] OMG-LLaVAは、強力なピクセルレベルの視覚理解と推論能力を組み合わせた新しいフレームワークである。
フレキシブルなユーザインタラクションのために、さまざまな視覚的およびテキストプロンプトを受け入れることができる。
OMG-LLaVAは1つのモデルで画像レベル、オブジェクトレベル、ピクセルレベルの推論と理解を実現する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 06:07:24 GMT)
ICL-TSVD: Bridging Theory and Practice in Continual Learning with Pre-trained Models [103.5] 連続学習(CL)は、連続的に提示される複数のタスクを解決できるモデルを訓練することを目的としている。
最近のCLアプローチは、ダウンストリームタスクをうまく一般化する大規模な事前学習モデルを活用することで、強力なパフォーマンスを実現している。
しかし、これらの手法には理論的保証がなく、予期せぬ失敗をしがちである。
私たちは、経験的に強いアプローチを原則化されたフレームワークに統合することで、このギャップを埋めます。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 12:58:37 GMT)
Mitigating Shortcut Learning with Diffusion Counterfactuals and Diverse Ensembles [95.5] 拡散確率モデル(DPM)を利用したアンサンブル多様化フレームワークDiffDivを提案する。
DPMは、相関した入力特徴を示すサンプルを用いて訓練しても、新しい特徴の組み合わせで画像を生成することができることを示す。
そこで本研究では,DPM誘導の多様化は,教師付き信号の追加を必要とせず,ショートカットキューへの依存を取り除くのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:50:57 GMT)
Grammar Induction from Visual, Speech and Text [92.0] 本研究は、新しい視覚音声テキスト文法誘導タスク(textbfVAT-GI)を導入する。
言語文法がテキストを超えて存在するという事実に触発されて、テキストは文法帰納において支配的なモダリティであってはならないと論じる。
そこで本稿では,豊富なモーダル特化機能と補完機能を有効文法解析に活用した,ビジュアル・オーディオ・テキスト・インサイド・アウトサイド・オートエンコーダ(textbfVaTiora)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:24:18 GMT)
A generative framework to bridge data-driven models and scientific theories in language neuroscience [84.8] 脳内の言語選択性の簡潔な説明を生成するためのフレームワークである生成的説明媒介バリデーションを提案する。
本研究では,説明精度が基礎となる統計モデルの予測力と安定性と密接に関連していることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:57:48 GMT)
OMG-Seg: Is One Model Good Enough For All Segmentation? [83.2] OMG-Segは、タスク固有のクエリと出力を持つトランスフォーマーベースのエンコーダデコーダアーキテクチャである。
OMG-Segは10以上の異なるセグメンテーションタスクをサポートできるが、計算とパラメータのオーバーヘッドを大幅に削減できることを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 05:56:05 GMT)
Toward General-Purpose Robots via Foundation Models: A Survey and Meta-Analysis [82.6] 汎用ロボットはどんな環境でも、どんな物体でもシームレスに動作し、様々なスキルを使って様々なタスクをこなす。
コミュニティとしては、特定のタスク用に設計し、特定のデータセットでトレーニングし、特定の環境にデプロイすることで、ほとんどのロボットシステムを制約してきました。
ウェブスケールで大規模で大容量の事前学習型モデルの優れたオープンセット性能とコンテンツ生成能力に感銘を受けて,本調査は,汎用ロボティクスに基礎モデルを適用する方法について検討した。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 08:54:53 GMT)
Measuring Orthogonality in Representations of Generative Models [81.1] 教師なしの表現学習において、モデルは高次元データから低次元の学習表現に不可欠な特徴を蒸留することを目的としている。
独立した生成過程の切り離しは、長い間、高品質な表現を生み出してきた。
我々は、IWO(Importance-Weighted Orthogonality)とIWR(Importance-Weighted Rank)の2つの新しい指標を提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 12:26:24 GMT)
FiTv2: Scalable and Improved Flexible Vision Transformer for Diffusion Model [80.7] 本稿では,非制限解像度とアスペクト比で画像を生成するためのトランスフォーマーアーキテクチャを提案する。
総合的な実験は、FiTv2の幅広い解像度での異常な性能を実証している。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:38:29 GMT)
Tell Your Model Where to Attend: Post-hoc Attention Steering for LLMs [80.5] PASTAは、大きな言語モデルでユーザーが指定した強調マークでテキストを読むことができる方法である。
LLMのユーザ命令に従う能力を大幅に強化したり、ユーザ入力から新たな知識を統合することができる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 04:10:34 GMT)
Removing Distributional Discrepancies in Captions Improves Image-Text Alignment [76.3] 画像テキストアライメントの予測を改善するためのモデルを提案する。
このアプローチでは、アライメントタスクのための高品質なトレーニングデータセットの生成に重点を置いています。
また,テキストアライメントに基づくテキスト・ツー・イメージ・モデルによる画像のランク付けにより,本モデルの適用性を示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:50:17 GMT)
Revisiting Essential and Nonessential Settings of Evidential Deep Learning [70.8] Evidential Deep Learning (EDL) は不確実性推定の新しい手法である。
本報告では,EDLの簡易かつ効果的な拡張型であるRe-EDLを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:27:07 GMT)
CoTracker: It is Better to Track Together [70.6] CoTrackerは、長いビデオシーケンスで多数の2Dポイントを追跡するトランスフォーマーベースのモデルである。
関節トラッキングはトラッキング精度とロバスト性を大幅に改善し、CoTrackerはカメラビューの外側に隠された点や点を追跡することができる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:15:53 GMT)
Inference Optimization of Foundation Models on AI Accelerators [68.2] トランスフォーマーアーキテクチャを備えた大規模言語モデル(LLM)を含む強力な基礎モデルは、ジェネレーティブAIの新たな時代を支えている。
モデルパラメータの数が数十億に達すると、実際のシナリオにおける推論コストと高いレイテンシーが排除される。
このチュートリアルでは、AIアクセラレータを用いた補完推論最適化テクニックに関する包括的な議論を行っている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:10:07 GMT)
Fine-Tuning and Deploying Large Language Models Over Edges: Issues and Approaches [64.4] 大規模言語モデル(LLM)は、特殊モデルから多目的基礎モデルへと移行してきた。
LLMは印象的なゼロショット能力を示すが、ローカルデータセットとデプロイメントのための重要なリソースを微調整する必要がある。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:48:34 GMT)
Dual Consolidation for Pre-Trained Model-Based Domain-Incremental Learning [64.2] ドメイン・インクリメンタル・ラーニング(ドメイン・インクリメンタル・ラーニング、ドメイン・インクリメンタル・ラーニング、ドメイン・インクリメンタル・ラーニング、ドメイン・インクリメンタル・ラーニング、Domain-Incremental Learning、DIL)は、異なるドメインにまたがる新しい概念へのモデルの漸進的な適応を含む。
プレトレーニングモデルの最近の進歩は、DILの確かな基盤を提供する。
しかし、新しい概念を学ぶことは、しばしば、事前訓練された知識を破滅的に忘れてしまう。
本稿では,歴史的知識の統一と統合を図るために,デュアルコンソリデータティオン(ドゥクト)を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:58:06 GMT)
MiniCheck: Efficient Fact-Checking of LLMs on Grounding Documents [62.0] GPT-4レベルの性能を持つが400倍の低コストでファクトチェックモデルを構築する方法を示す。
GPT-4を用いて合成トレーニングデータを構築することで,現実的かつ困難な事実エラーの事例を生成する。
評価のために, ファクトチェックとグラウンドグラウンド化に関する最近の研究から得られたデータセットを, 新たなベンチマーク LLM-AggreFact に統一する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:39:48 GMT)
BabelBench: An Omni Benchmark for Code-Driven Analysis of Multimodal and Multistructured Data [61.9] 大規模言語モデル(LLM)は、様々な領域でますます重要になっている。
BabelBenchは、コード実行によるマルチモーダルなマルチ構造化データ管理におけるLLMの熟練度を評価する革新的なベンチマークフレームワークである。
BabelBenchの実験結果から,ChatGPT 4のような最先端モデルでさえ,大幅な改善の余地があることが示唆された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:11:24 GMT)
Benchmarking Large Language Models for Conversational Question Answering in Multi-instructional Documents [61.4] 対話型質問応答(CQA)の文脈における大規模言語モデル(LLM)を評価するための新しいベンチマークであるInsCoQAを提案する。
InsCoQAは、百科事典スタイルの教育内容から派生したもので、複数の文書から手続き的ガイダンスを抽出し、解釈し、正確に要約する能力のモデルを評価する。
また,LLM支援型評価器であるInsEvalを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:10:00 GMT)
Learn Beyond The Answer: Training Language Models with Reflection for Mathematical Reasoning [60.0] 教師付き微調整により、様々な数学的推論タスクにおける言語モデルの問題解決能力が向上する。
本研究は,手前のトレーニング問題をより深く理解することを目的とした,新しい技術を紹介する。
本稿では,各トレーニングインスタンスに問題反映を埋め込む手法であるリフレクティブ拡張を提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:50:05 GMT)
Are LLMs Aware that Some Questions are not Open-ended? [58.9] 大規模言語モデルでは、いくつかの質問が限定的な回答を持ち、より決定論的に答える必要があることを認識しているかどうかを調査する。
LLMにおける疑問認識の欠如は,(1)非オープンな質問に答えるにはカジュアルすぎる,(2)オープンな質問に答えるには退屈すぎる,という2つの現象をもたらす。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:07:00 GMT)
ColorSense: A Study on Color Vision in Machine Visual Recognition [57.9] 視覚認識ベンチマークから,前景や背景色ラベルの非自明なアノテーション110,000点を収集する。
色識別のレベルがマシン認識モデルの性能に与える影響を実証することにより、データセットの使用を検証した。
その結果,分類や局所化などの物体認識タスクは,色覚バイアスの影響を受けやすいことが示唆された。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 21:58:46 GMT)
ChronoMagic-Bench: A Benchmark for Metamorphic Evaluation of Text-to-Time-lapse Video Generation [57.7] ChronoMagic-Benchは、テキスト・トゥ・ビデオ(T2V)生成ベンチマークである。
モデルがメタモルフィックな振幅と時間的コヒーレンスを持つタイムラプスビデオを生成する能力に焦点を当てている。
10種類の代表的なT2Vモデルの手動評価を行い、その強度と弱点を明らかにした。
大規模なChronoMagic-Proデータセットを作成し、460kの高品質な720pタイムラプスビデオを含む。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:00:27 GMT)
Learning to Build by Building Your Own Instructions [56.7] LTRONにおける最近提案されたBreak-and-Make問題に対する新しい手法を開発した。
エージェントは、単一の対話的なセッションを使用して、これまで見えなかったLEGOアセンブリを構築することを学ばなければなりません。
オンラインの模倣学習を使ってこれらのモデルをトレーニングし、モデルが自身のミスから学習できるようにする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 22:39:58 GMT)
AMR-Evol: Adaptive Modular Response Evolution Elicits Better Knowledge Distillation for Large Language Models in Code Generation [56.5] 本研究は, 反応蒸留を精製するための2段階プロセスを用いた適応型モジュール応答進化(AMR-Evol)フレームワークについて紹介する。
AMR-Evolフレームワークがベースライン応答蒸留法よりも優れていることを示すために,3つのコードベンチマークを用いた実験を行った。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 10:12:38 GMT)
Spatial Action Unit Cues for Interpretable Deep Facial Expression Recognition [56.0] 表情認識(FER)のための最先端の分類器は、エンドユーザーにとって重要な特徴である解釈可能性に欠ける。
新しい学習戦略が提案され、AU cues を分類器訓練に明示的に組み込むことで、深い解釈可能なモデルを訓練することができる。
我々の新しい戦略は汎用的であり、アーキテクチャの変更や追加のトレーニング時間を必要とすることなく、ディープCNNやトランスフォーマーベースの分類器に適用できます。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 10:42:55 GMT)
Style-Specific Neurons for Steering LLMs in Text Style Transfer [55.1] テキストスタイル転送(TST)は、本来の意味を変更することなく、テキストのスタイルを変更することを目的としている。
スタイル特異的ニューロンを用いた大規模言語モデルのステアリング手法であるsNeuron-TSTを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:25:36 GMT)
ChatVTG: Video Temporal Grounding via Chat with Video Dialogue Large Language Models [54.0] Video Temporal Groundingは、特定のセグメントを、与えられた自然言語クエリに対応する未トリミングビデオ内でグラウンドすることを目的としている。
既存のVTG手法は、主に教師付き学習と広範囲な注釈付きデータに依存しており、それは労働集約的であり、人間の偏見に起因している。
本稿では,ビデオ対話大言語モデル(LLM)をゼロショットビデオ時間グラウンドに利用する新しい手法ChatVTGを提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 08:27:56 GMT)
The Conformer Encoder May Reverse the Time Dimension [53.9] 我々はデコーダのクロスアテンション機構の初期動作を分析し、コンバータエンコーダの自己アテンションが初期フレームと他のすべての情報フレームとの接続を構築することを奨励することを発見した。
本稿では,このフリップを回避する方法とアイデアを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:39:05 GMT)
Exploiting Structure in Offline Multi-Agent RL: The Benefits of Low Interaction Rank [52.8] 相互作用ランクという構造的仮定を導入し、相互作用ランクの低い関数が一般的なものよりも分布シフトに対して著しく堅牢であることを示す。
我々は,非正規化と非正規化学習と組み合わせることで,オフラインMARLにおける分散的,計算的,統計的に効率的な学習が可能であることを実証した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 22:16:22 GMT)
See What LLMs Cannot Answer: A Self-Challenge Framework for Uncovering LLM Weaknesses [52.0] 本稿では,Human-in-the-loopを用いたセルフチェレンジ評価フレームワークを提案する。
GPT-4が答えられないシードインスタンスから始めて、GPT-4に新しいインスタンスを生成するのに使えるエラーパターンを要約するように促します。
次に,GPT-4が生成する1,835個のインスタンスと,人手によるゴールド応答を併用したベンチマーク,SC-G4を構築した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 01:40:14 GMT)
EnzymeFlow: Generating Reaction-specific Enzyme Catalytic Pockets through Flow Matching and Co-Evolutionary Dynamics [51.5] 酵素設計はバイオテクノロジーにおいて重要な領域であり、医薬品開発から合成生物学まで幅広い応用がある。
酵素機能予測やタンパク質結合ポケット設計の伝統的な手法は、しばしば酵素-基質相互作用の動的および複雑な性質を捉えるのに不足する。
本稿では, 触媒ポケットを生成するために, 階層的事前学習と酵素-反応共進化を用いたフローマッチングを用いた生成モデルであるEnzymeFlowを紹介する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:04:01 GMT)
Observational Scaling Laws and the Predictability of Language Model Performance [51.2] 本稿では、モデルトレーニングを回避し、100のパブリックモデルからスケーリング法則を構築する観察的アプローチを提案する。
いくつかの創発現象が滑らかでシグモダルな挙動を辿り、小さなモデルから予測可能であることを示す。
言語モデル機能の改善が進むにつれて、Chain-of-ThoughtやSelf-Consistencyといったポストトレーニング介入の影響を予測する方法を示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 23:38:10 GMT)
Broadening Target Distributions for Accelerated Diffusion Models via a Novel Analysis Approach [50.0] 本研究では,新しいDDPMサンプリング器が,これまで考慮されていなかった3種類の分散クラスに対して高速化性能を実現することを示す。
この結果から, DDPM型加速サンプリング器におけるデータ次元$d$への依存性が改善された。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 23:39:30 GMT)
Optimizing Token Usage on Large Language Model Conversations Using the Design Structure Matrix [49.2] 大規模言語モデルは、多くの分野やタスクにおいてユビキタスになる。
トークンの使用を減らすこと、短いコンテキストウィンドウ、限られた出力サイズ、トークンの取り込みと生成に関連するコストといった課題を克服する必要がある。
この作業は、エンジニアリング設計の分野からLLM会話最適化にデザイン構造マトリックスをもたらす。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:38:36 GMT)
Inferring Kernel $ε$-Machines: Discovering Structure in Complex Systems [49.2] 本稿では,カーネル因果状態推定を縮小次元空間における座標の集合として符号化する因果拡散成分を提案する。
それぞれのコンポーネントがデータから予測機能を抽出し,そのアプリケーションを4つの例で示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:14:06 GMT)
Concept Space Alignment in Multilingual LLMs [47.6] 一般化は類似の型付けを持つ言語や抽象概念に最適である。
いくつかのモデルでは、プロンプトベースの埋め込みは単語の埋め込みよりもよく整合するが、投影は線形ではない。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:21:00 GMT)
Robust Guided Diffusion for Offline Black-Box Optimization [47.3] オフラインのブラックボックス最適化は、デザインとその測定プロパティのオフラインデータセットを使用してブラックボックス関数を最大化することを目的としている。
入力から値へのマッピングを学習するフォワードアプローチと、値から値へのマッピングを条件生成のために学習する逆アプローチの2つの主要なアプローチが登場した。
本稿では、訓練されたプロキシからの明示的なガイダンスを利用して、サンプリング制御を強化したプロキシフリー拡散を促進させるテキストプロキシ強化サンプリングを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:14:25 GMT)
Y-CA-Net: A Convolutional Attention Based Network for Volumetric Medical Image Segmentation [47.1] 差別的なローカル機能は、注目ベースのVSメソッドのパフォーマンスの鍵となるコンポーネントである。
コンボリューションエンコーダ分岐をトランスフォーマーバックボーンに組み込んで,局所的特徴と大域的特徴を並列に抽出する。
Y-CT-Netは、複数の医療セグメンテーションタスクにおいて競合性能を達成する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:50:45 GMT)
Deep Nets with Subsampling Layers Unwittingly Discard Useful Activations at Test-Time [46.8] サブサンプリング層は、活性化マップの一部を捨て、その空間次元を小さくすることで、ディープネットにおいて重要な役割を果たす。
本研究では,テスト時に有用なアクティベーションマップを探索・集約する手法を提案する。
提案手法は,既存のテスト時間拡張手法を補完するモデルテスト時間性能を一貫して改善する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:24:43 GMT)
Recent Advances in Speech Language Models: A Survey [46.0] 音声言語モデル(SpeechLMs)は、テキストから変換することなく音声を生成するエンドツーエンドモデルである。
本稿では,近年のSpeechLM構築手法について概観する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:48:12 GMT)
Existential Unforgeability in Quantum Authentication From Quantum Physical Unclonable Functions Based on Random von Neumann Measurement [45.4] 物理的非閉包関数(PUF)は、固有の非閉包不可能な物理的ランダム性を利用して、ユニークな入出力ペアを生成する。
量子PUF(Quantum PUFs)は、量子状態を入出力ペアとして使用することによって、この概念を拡張している。
量子多項式時間に対して,ランダムな一元性QPUFは存在を許さないことを示す。
本稿では,QPUFが非単体量子チャネルとして機能する2番目のモデルを提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 14:45:24 GMT)
Are Large Language Models Consistent over Value-laden Questions? [45.4] 大きな言語モデル(LLM)は、調査回答を特定の値にバイアスしているように見える。
価値の一貫性は、パラフレーズ、ユースケース、翻訳、トピック内での回答の類似性として定義します。
従来の作業とは異なり、モデルはパラフレーズ、ユースケース、翻訳、トピック内で比較的一貫性がある。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 21:23:18 GMT)
Enhancing Sentinel-2 Image Resolution: Evaluating Advanced Techniques based on Convolutional and Generative Neural Networks [45.0] 本稿では,高分解能化技術を用いてスペクトル情報を含むセンチネル2バンドにおける空間分解能の2。
最先端CNNモデルは、品質と実現可能性の観点から強化されたGANアプローチと比較される。
GANベースのモデルは、明瞭で詳細な画像を提供するだけでなく、定量的評価の観点からも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:56:46 GMT)
Scene Graph Disentanglement and Composition for Generalizable Complex Image Generation [44.5] 我々は、複雑な画像生成に強力な構造化表現であるシーングラフを利用する。
本稿では,変分オートエンコーダと拡散モデルの生成能力を一般化可能な方法で活用する。
本手法は,テキスト,レイアウト,シーングラフに基づいて,近年の競合より優れています。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:02:46 GMT)
Physics-Informed Latent Diffusion for Multimodal Brain MRI Synthesis [43.8] 可変数の脳MRIモダリティを合成できる物理インフォームド生成モデルを提案する。
提案手法は遅延拡散モデルと2段階生成過程を利用する。
実験は、見えないMRコントラストを発生させ、身体的可視性を維持するためのこのアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:33:07 GMT)
Physics-Informed Latent Diffusion for Multimodal Brain MRI Synthesis [43.8] 可変数の脳MRIモダリティを合成できる物理インフォームド生成モデルを提案する。
提案手法は遅延拡散モデルと2段階生成過程を利用する。
実験は、見えないMRコントラストを発生させ、身体的可視性を維持するためのこのアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:33:07 GMT)
M$^{2}$M: Learning controllable Multi of experts and multi-scale operators are the Partial Differential Equations need [43.5] 本稿では,PDEを効率的にシミュレートし,学習するためのマルチスケール・マルチエキスパート(M$2$M)ニューラル演算子のフレームワークを提案する。
我々は、動的ルータポリシーのために、マルチエキスパートゲートネットワークをトレーニングするために、分断方式を採用する。
提案手法は,専門家の選択権を決定する制御可能な事前ゲーティング機構を組み込んで,モデルの効率を向上させる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:42:09 GMT)
AXIAL: Attention-based eXplainability for Interpretable Alzheimer's Localized Diagnosis using 2D CNNs on 3D MRI brain scans [43.1] 本研究では,3次元MRIを用いたアルツハイマー病診断の革新的手法を提案する。
提案手法では,2次元CNNがボリューム表現を抽出できるソフトアテンション機構を採用している。
ボクセルレベルの精度では、どの領域に注意が払われているかを同定し、これらの支配的な脳領域を同定する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 17:04:53 GMT)
Learning Confidence Bounds for Classification with Imbalanced Data [42.7] 本稿では,学習理論と集中不等式を利用して従来のソリューションの欠点を克服する新しい枠組みを提案する。
本手法は, クラスごとに異なる不均衡度に効果的に適応できるため, より堅牢で信頼性の高い分類結果が得られる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:35:15 GMT)
HUMAP: Hierarchical Uniform Manifold Approximation and Projection [42.5] HUMAPは、局所的・大域的構造の保存に柔軟であるように設計された、新しい階層的次元削減技術である。
提案手法の優位性を示す実証的証拠を現在の階層的アプローチと比較し,データセットラベリングにHUMAPを適用したケーススタディを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:22:32 GMT)
SVFAP: Self-supervised Video Facial Affect Perceiver [42.2] コンピュータビジョンにおける近年の自己教師型学習の成功に触発された本研究では,自己教師型映像表情知覚器(SVFAP)と呼ばれる自己教師型アプローチを導入する。
SVFAPは、監督された方法で直面するジレンマに対処するために、マスク付きビデオオートエンコーディングを利用して、巨大な未ラベルの顔ビデオで自己教師付き事前トレーニングを行う。
提案手法の有効性を検証するため, 動的表情認識, 次元感情認識, パーソナリティ認識を含む3つの下流タスクにまたがる9つのデータセットを用いて実験を行った。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 07:55:22 GMT)
Flux-pump induced degradation of $T_1$ for dissipative cat qubits [42.1] キャットキュービットの散逸安定化は、貯水池で駆動された2光子損失が位相フリップエラーを引き起こす他のメカニズムよりも大きいことを保証することにより、ビットフリップエラーを自律的に補正する。
我々は、時間依存シュリーファー・ヴォルフ摂動理論において駆動下での緩和過程のドレッシングを分析し、弱無調波ボゾン自由度を求める。
また, パラメトリックポンプの作用により, キャットキュービット安定化に必要な相互作用を生成することにより, 単光子崩壊速度が増大することが確認された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:02:16 GMT)
RATIONALYST: Pre-training Process-Supervision for Improving Reasoning [42.0] 本稿では,事前学習に基づく推論のプロセス・スーパービジョンのモデルであるRATIONALYSTを紹介する。
We extract 79k rationales from web-scale unlabelled dataset (the Pile) and a combination of reasoning datasets with minimal human intervention。
LLaMa-3-8Bの微調整により、RATIONALYSTは7つの代表的な推論ベンチマークで平均3.9%の推論精度を向上させる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:05:51 GMT)
Tackling the Accuracy-Interpretability Trade-off in a Hierarchy of Machine Learning Models for the Prediction of Extreme Heatwaves [41.9] ますます複雑な機械学習モデルの階層構造を用いて、フランス上空の極端熱波の確率論的予測を行う。
CNNは高い精度を提供するが、ブラックボックスの性質は解釈可能性を大幅に制限する。
ScatNetは、透明性を高めながら、CNNと同じようなパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:15:04 GMT)
Fine-Grained Gradient Restriction: A Simple Approach for Mitigating Catastrophic Forgetting [41.9] Gradient Episodic Memory (GEM) は、過去のトレーニングサンプルのサブセットを利用して、モデルのパラメータの更新方向を制限することでバランスをとる。
メモリの強度は、主にGEMの能力を一般化し、それによってより有利なトレードオフをもたらすため、有効であることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:03:56 GMT)
How Far Are We from Intelligent Visual Deductive Reasoning? [41.4] 私たちは、より洗練されているが探求の少ない領域である、視覚に基づく誘惑的推論を掘り下げる。
現在のSOTA VLMでは、未公表の盲点が発見されている。
LLMに適用した場合に有効な標準的な戦略は、視覚的推論タスクによってもたらされる課題にシームレスに対応しないことがわかった。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 04:41:53 GMT)
Reactzyme: A Benchmark for Enzyme-Reaction Prediction [41.3] 触媒反応に基づくアノテート酵素の新しいアプローチを提案する。
酵素反応データセットの解析に機械学習アルゴリズムを用いる。
本研究は,酵素反応予測を検索問題として捉え,酵素の触媒活性を比例してランク付けすることを目的とする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:12:41 GMT)
ReactZyme: A Benchmark for Enzyme-Reaction Prediction [41.3] 触媒反応に基づくアノテート酵素の新しいアプローチを提案する。
酵素反応データセットの解析に機械学習アルゴリズムを用いる。
本研究は,酵素反応予測を検索問題として捉え,酵素の触媒活性を比例してランク付けすることを目的とする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:12:41 GMT)
Shaking Up VLMs: Comparing Transformers and Structured State Space Models for Vision & Language Modeling [41.3] 私たちは、Visual Language ModelsのTransformerをMambaに置き換えます。
Mambaは、正しい出力がイメージの要約に依存するタスクで有望なパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:29:53 GMT)
Draft on the Fly: Adaptive Self-Speculative Decoding using Cosine Similarity [40.8] 本研究では,大規模言語モデルの高速な推論のためのフライ法を提案する。
他の(自己)投機的復号法とは異なり、固定されたドラフトモデルを生成するために微調整やブラックボックスの最適化は不要である。
我々の軽量アルゴリズムは、真のプラグ・アンド・プレイ方式でありながら、現在のSOTAと自己投機的復号化の競争力があることを実証的に示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:35:23 GMT)
GMT: Enhancing Generalizable Neural Rendering via Geometry-Driven Multi-Reference Texture Transfer [40.7] 新たなビュー合成(NVS)は、多視点画像を用いて任意の視点で画像を生成することを目的としており、ニューラルレイディアンス場(NeRF)からの最近の知見は、顕著な改善に寄与している。
G-NeRFはシーンごとの最適化がないため、特定のシーンの細部を表現するのに依然として苦労している。
G-NeRF用に設計されたプラグアンドプレイモジュールとして利用可能な幾何駆動型マルチ参照テクスチャ転送ネットワーク(GMT)を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:30:51 GMT)
Dual-Space Knowledge Distillation for Large Language Models [39.8] KDのための2つのモデルの出力空間を統一する二空間知識蒸留(DSKD)フレームワークを提案する。
我々のフレームワークは、現在のフレームワークのようなKDの様々な距離関数と互換性があるだけでなく、語彙に関係なく、任意の2つのLLM間のKDもサポートしています。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:45:12 GMT)
On the Implications of Verbose LLM Outputs: A Case Study in Translation Evaluation [39.8] 我々は、安全、著作権上の懸念、短い入力クエリにおけるコンテキストの不足など、冗長性の主要な引き金を特定する。
この行為を無視することは、自動評価と人的評価の両方に応じて、より冗長なLLMを罰することを示します。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:59:01 GMT)
How You Prompt Matters! Even Task-Oriented Constraints in Instructions Affect LLM-Generated Text Detection [39.3] タスク指向の制約 -- 命令に自然に含まれ、検出回避とは無関係な制約 -- でさえ、既存の強力な検出器は検出性能に大きなばらつきを持つ。
実験の結果,命令を複数回生成したり,命令を言い換えたりすることで,命令によって生成されたテキストの標準偏差(SD)が有意に大きい(SDは14.4F1スコアまで)ことがわかった。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 01:24:05 GMT)
Counterfactual Explanations for Medical Image Classification and Regression using Diffusion Autoencoder [38.8] 生成モデルの潜在空間を直接操作する新しい手法,特に拡散オートエンコーダ(DAE)を提案する。
このアプローチは、対実的説明(CE)の生成を可能にすることによって、固有の解釈可能性を提供する
これらの潜在表現は、脊椎圧迫骨折(VCF)や糖尿病網膜症(DR)などの病態の医学的分類と経時的回帰に有用であることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:34:36 GMT)
On the Generalization and Causal Explanation in Self-Supervised Learning [38.6] 自己教師付き学習(SSL)手法はラベルのないデータから学習し、下流タスクで高い一般化性能を達成する。
また、トレーニングデータに過度に適合し、新しいタスクに適応する能力を失ってしまうこともある。
本研究では,事前学習した特徴抽出器の過度適合を緩和するプラグアンドプレイ方式Undoing Memorization Mechanism (UMM)を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:07:37 GMT)
Revisiting the Role of Texture in 3D Person Re-identification [38.1] 本研究は3次元人物識別のための新しい枠組み(re-ID)を提案する。
UVTexture マッピングを取り入れた3次元人物再IDモデルのテクスチャ強調手法を提案する。
特に、可視化と説明は、アクティベーションマップと属性ベースのアテンションマップによって達成される。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:47:34 GMT)
From Text to Mask: Localizing Entities Using the Attention of Text-to-Image Diffusion Models [38.1] 本稿では,テキスト・画像拡散モデルの認知ネットワークにおける注意機構を利用する手法を提案する。
そこで我々はPascal VOC 2012 と Microsoft COCO 2014 のセマンティックセグメンテーションを弱教師付きで評価した。
本研究は,セグメンテーションの拡散モデルに隠された豊富なマルチモーダル知識を抽出する方法を明らかにする。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 10:30:07 GMT)
Quantum Advantage in Distributed Sensing with Noisy Quantum Networks [37.2] 分散センシングにおける量子優位性はノイズの多い量子ネットワークで実現できることを示す。
この量子的優位性には絡み合いが必要であるが、真の多部絡みは一般に不要である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:15:59 GMT)
Large Language Models Can Self-Improve At Web Agent Tasks [37.2] 大規模言語モデル(LLM)は、ゼロショットまたは少数ショットの方法でエージェントとして新しい環境をナビゲートする機能を最近デモした。
WebArena ベンチマークを用いて,LLM が長期タスクにおけるエージェントとしての性能を自己向上する方法について検討した。
自己改善手順により,WebArenaベンチマークのベースモデルよりもタスク完了率を31%向上させる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 21:28:29 GMT)
SS-SFR: Synthetic Scenes Spatial Frequency Response on Virtual KITTI and Degraded Automotive Simulations for Object Detection [37.1] 自動車シミュレーションにおける画像シャープネスに対するガウスのぼかしのバリエーションの適用効果について検討する。
画像のシャープネス(MTF50)は平均0.245cy/pxから0.119cy/pxに低下するが、物体検出性能は0.58%の範囲でほぼ安定であることがわかった。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:11:24 GMT)
Unleashing the Potentials of Likelihood Composition for Multi-modal Language Models [36.9] ヘテロジニアスモデルをオフザシェルで融合することを目的としたポストホックフレームワークを提案する。
基本的考え方は、多点探索探索タスクを行う場合、複数のモデルの確率分布を構成することである。
単純なtextitensemble や textitmajority-vote 法と比較して,textitmix-composition の有効性を実証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:22:52 GMT)
Watch Your Steps: Observable and Modular Chains of Thought [36.8] プログラムトレースプロンプティング(Program Trace Prompting)と呼ばれる,思考の連鎖(CoT)の変種を提案する。
CoTのパワー、一般性、柔軟性を保ちながら、より観察可能な説明をする。
Program Trace Promptingは多くのタスクに適用でき、BIG-Bench Hardベンチマークの23種類のタスクに対して強力な結果が得られる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:24:38 GMT)
TPI-LLM: Serving 70B-scale LLMs Efficiently on Low-resource Edge Devices [36.7] 本稿では,70Bスケールモデルに対する計算およびメモリ効率の高いテンソル並列推論システムであるTPI-LLMを提案する。
TPI-LLMは、ユーザのデバイスに機密データをローカルに保持し、スライディングウィンドウメモリスケジューラを導入する。
TPI-LLMは、Accelerateと比較して80%以上、タイム・ツー・ファースト・トークンのレイテンシが低いことを示した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:18:56 GMT)
Large language models should not replace human participants because they can misportray and flatten identity groups [36.4] 我々は、現在のLLMのトレーニング方法には2つの固有の制限があることを示します。
我々は、LCMが人口集団の表現を誤解し、フラットにする可能性がある理由を分析的に論じる。
また、アイデンティティープロンプトがアイデンティティーを不可欠なものにする方法について、第3の制限についても論じる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 00:30:06 GMT)
GLMHA A Guided Low-rank Multi-Head Self-Attention for Efficient Image Restoration and Spectral Reconstruction [36.2] 本稿では,チャネルワイド・セルフアテンションを置き換えるために,インスタンス誘導型低ランクマルチヘッド・セルフアテンションを提案する。
提案したGLMHAに共通するのは、短い入力シーケンスと長い入力シーケンスの両方に対して計算利得を提供する能力である。
その結果,7.7ギガFLOPsの削減が達成され,最高の性能モデルの性能を維持するために必要なパラメータが370K削減された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:07:48 GMT)
Experimental demonstration of Robust Amplitude Estimation on near-term quantum devices for chemistry applications [36.1] 本研究では,IBM量子デバイス上でのロバスト振幅推定(RAE)のハードウェア実装について検討する。
一量子および二量子ハミルトニアン系に対する量子化学への応用を実証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:42:01 GMT)
Outlier Gradient Analysis: Efficiently Improving Deep Learning Model Performance via Hessian-Free Influence Functions [36.1] 本稿では,影響関数と外乱勾配検出による有害トレーニングサンプルの同定とを橋渡しする。
まず, 合成データセットにおける外乱勾配解析手法の仮説を検証した。
次に、視覚モデルにおける誤ラベルサンプルの検出と、自然言語処理トランスフォーマーモデルの性能向上のためのデータサンプル選択の有効性を示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:07:09 GMT)
OmniHands: Towards Robust 4D Hand Mesh Recovery via A Versatile Transformer [36.0] OmniHandsは、対話型ハンドメッシュを回復するための普遍的なアプローチであり、モノクラーまたはマルチビュー入力からの相対的な動きを示す。
我々は,新しいトークン化とコンテキスト的特徴融合戦略を備えたユニバーサルアーキテクチャを開発する。
提案手法の有効性を,いくつかのベンチマークデータセットで検証した。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:04:23 GMT)
RichRAG: Crafting Rich Responses for Multi-faceted Queries in Retrieval-Augmented Generation [36.0] 本稿ではRichRAGという新しいRAGフレームワークを提案する。
これには、入力された質問の潜在的なサブアスペクトを特定するサブアスペクトエクスプローラー、これらのサブアスペクトに関連する多様な外部文書の候補プールを構築するレトリバー、および生成リストワイズローダが含まれる。
2つの公開データセットの実験結果から,我々のフレームワークがユーザに対して包括的かつ満足な応答を効果的に提供できることが証明された。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 04:42:48 GMT)
GlycanML: A Multi-Task and Multi-Structure Benchmark for Glycan Machine Learning [35.8] 我々はGlycan Machine Learning (GlycanML)のための包括的なベンチマークを構築している。
GlycanMLベンチマークは、グリカン分類学予測、グリカン免疫原性予測、グリコシル化型予測、タンパク質-グリカン相互作用予測など様々なタスクからなる。
8つのグリカン分類予測タスクを同時に実行することにより、マルチタスク学習(MTL)アルゴリズムのためのGlycanML-MTLテストベッドを導入する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 05:14:15 GMT)
GlycanML: A Multi-Task and Multi-Structure Benchmark for Glycan Machine Learning [35.8] グリカンMLベンチマークは、グリカン分類学予測、グリカン免疫原性予測、グリコシル化型予測、タンパク質-グリカン相互作用予測など様々なタスクからなる。
8つのグリカン分類予測タスクを同時に実行することにより、マルチタスク学習(MTL)アルゴリズムのためのGlycanML-MTLテストベッドを導入する。
実験結果から,マルチリレーショナルGNNを用いたグリカンのモデル化が優れており,適切なMTL法によりモデル性能が向上することが示された。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 05:14:15 GMT)
SPAMming Labels: Efficient Annotations for the Trackers of Tomorrow [35.8] SPAMは、人間の介入を最小限に抑えた高品質なラベルを提供するビデオラベルエンジンである。
我々は統合グラフの定式化を用いて、トラックの検知と同一性関連の両方のアノテーションに時間をかけて対処する。
我々はSPAMラベルでトレーニングされたトラッカーが人間のアノテーションでトレーニングされたトラッカーに匹敵する性能を発揮することを示した。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:34:30 GMT)
Gait Recognition in Large-scale Free Environment via Single LiDAR [35.7] 深度を捉えるLiDARの能力は、ロボットの知覚にとって重要な要素であり、現実世界の歩行認識の可能性を秘めている。
本稿では,頑健な歩行認識のための階層型多表現特徴相互作用ネットワーク(HMRNet)を提案する。
LiDARに基づく歩行認識研究を容易にするため,大規模かつ制約のない歩行データセットであるFreeGaitを紹介した。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 12:36:57 GMT)
Federated Instruction Tuning of LLMs with Domain Coverage Augmentation [35.5] Federated Domain-specific Instruction Tuning (FedDIT)は、サーバサイドの公開データとともに、限られたクロスクライアントなプライベートデータを使用して命令拡張を行う。
我々は,欲求のあるクライアントセンターの選択と検索に基づく拡張を通じて,ドメインカバレッジを最適化するFedDCAを提案する。
また,多量の公開データを用いたメモリ抽出攻撃に対するプライバシー保護についても検討した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 05:37:07 GMT)
Federated Instruction Tuning of LLMs with Domain Coverage Augmentation [35.5] Federated Domain-specific Instruction Tuning (FedDIT)は、クロスクライアントなプライベートデータとサーバサイドのパブリックデータを活用して、命令拡張を行う。
我々は,クライアントセンターの選択と検索に基づく拡張により,ドメインカバレッジを最大化するFedDCAを提案する。
また、各種の公開データによるメモリ抽出攻撃に対するプライバシー保護についても検討する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 05:37:07 GMT)
Transductive Active Learning: Theory and Applications [35.5] 我々は,予測対象の不確実性を最小限に抑えるために,適応的にサンプルをサンプリングする一連の決定ルールを解析する。
我々は、一般の正則性仮定の下で、そのような決定規則が可能な限り最小の不確実性に一様に収束することを初めて示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 07:45:38 GMT)
MoS: Unleashing Parameter Efficiency of Low-Rank Adaptation with Mixture of Shards [35.2] 大規模言語モデルの迅速なスケーリングには、爆発的なGPUメモリオーバーヘッドを低減するために、より軽量な微調整方法が必要である。
本研究は、純粋な共有による有害な影響を逆転させる上で、差別化が不可欠であることを示す。
本研究では,層間共有と層間共有を併用し,ほぼ費用がかからない4つの差別戦略を統合することで,Shardsの混合(MoS)を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:47:03 GMT)
Lotus: learning-based online thermal and latency variation management for two-stage detectors on edge devices [35.1] 2段階の物体検出器は、特に小さな物体を識別するために、高精度で正確な位置測定を行う。
2段階検出法に関連する計算コストは、エッジデバイスでより深刻な熱問題を引き起こす。
そこで我々は,CPUとGPUの周波数を動的にスケールアップする2段階検出器に適した新しいフレームワークであるLotusを提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 18:00:09 GMT)
Multi-RoI Human Mesh Recovery with Camera Consistency and Contrastive Losses [35.0] 本稿では2次元再投射損失を計算するためのカメラを推定するために,複数RoIに基づくHuman Mesh Recovery (HMR)法を提案する。
キーとなるアイデアは、複数のRoIを入力として、複数のローカルカメラを推定し、追加の制約を設計し適用する機会を得る、ということです。
複数RoI HMR法の有効性と最近の先行技術に対する優位性を示す実験を行った。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:49:56 GMT)
Preserving Generalization of Language models in Few-shot Continual Relation Extraction [34.7] FCRE(Few-shot Continual Relations extract)は、新たな研究分野である。
本稿では,よく捨てられる言語モデルヘッドを活用する新しい手法を提案する。
提案手法の有効性を実証し,今後の研究に有用な知見を提供する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:22:34 GMT)
SyntheOcc: Synthesize Geometric-Controlled Street View Images through 3D Semantic MPIs [34.4] SyntheOccは、2次元拡散モデルに対する条件入力として3次元幾何学情報を効率的にエンコードする方法の課題に対処する。
提案手法は,3次元意味的マルチプレーン画像(MPI)を革新的に組み込んで,包括的かつ空間的に整合した3次元シーン記述を提供する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:29:24 GMT)
OCTDL: Optical Coherence Tomography Dataset for Image-Based Deep Learning Methods [34.1] 本研究は,2000枚以上の OCT 画像からなるオープンアクセス型 OCT データセット (OCTDL) を提案する。
このデータセットは、加齢関連黄斑変性症(AMD)、糖尿病黄斑浮腫(DME)、網膜膜(ERM)、網膜動脈閉塞症(RAO)、網膜静脈閉塞症(RVO)、およびVID(Vitreomacular Interface Disease)患者のOCT記録からなる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 19:59:21 GMT)
BioFace3D: A fully automatic pipeline for facial biomarkers extraction of 3D face reconstructions segmented from MRI [33.7] 磁気共鳴画像から再構成した顔モデルを用いた顔バイオマーカーの完全自動計算ツールとしてBioFace3Dを提案する。
このツールは、磁気共鳴画像からの3次元顔モデル抽出、解剖学的3次元ランドマークの登録、幾何学的形態計測技術を用いたランドマーク座標からの顔バイオマーカーの計算の3つの自動モジュールに分けられる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:02:58 GMT)
Does Fine-Tuning LLMs on New Knowledge Encourage Hallucinations? [33.7] 既存の知識を活用するための微調整モデルの能力に及ぼす新しい知識の影響について検討する。
大規模な言語モデルは、微調整によって新しい事実知識を取得するのに苦労していることを実証する。
新たな知識のサンプルが最終的に学習されるにつれて、モデルが幻覚化する傾向がリニアに増加する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 12:08:23 GMT)
Off-Path TCP Hijacking in Wi-Fi Networks: A Packet-Size Side Channel Attack [33.7] 我々は、Wi-Fiネットワークにおける基本的なサイドチャネル、特に観測可能なフレームサイズを明らかにし、攻撃者がTCPハイジャック攻撃を行うために利用することができる。
このサイドチャネルアタックの有効性を2つのケーススタディで検証した。
実世界の80のWi-Fiネットワークで攻撃を実行し、75 (93.75%)のWi-Fiネットワークで被害者のTCP接続を乗っ取ることに成功した。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 04:22:34 GMT)
On-device Collaborative Language Modeling via a Mixture of Generalists and Specialists [33.7] 我々は、Mixture of Experts (MoE)アーキテクチャを適用することで、デバイス上での協調的なLLM(Large Language Models)の微調整を目標としている。
我々は、$textbfG$eneralists と $textbfS$pecialists (CoMiGS) による $textbfMi$xture による新しい $textbfCo$llaborative Learning アプローチを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:18:07 GMT)
On-Device Collaborative Language Modeling via a Mixture of Generalists and Specialists [33.7] 我々は、$textbfG$eneralists と $textbfS$pecialists (CoMiGS) の $textbfMi$xture を用いた新しい $textbfCo$llaborative Learning アプローチを提案する。
このアプローチは、エンドユーザー全体にわたって特定の専門家を集約し、他者がユーザー固有のデータセットに特化するようにローカライズされたままにすることで、ジェネラリストやスペシャリストを区別する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:18:07 GMT)
Cafca: High-quality Novel View Synthesis of Expressive Faces from Casual Few-shot Captures [33.5] 人間の顔に先立って,高忠実度表現型顔のモデリングが可能な新しい容積を提示する。
我々は3D Morphable Face Modelを活用して大規模なトレーニングセットを合成し、それぞれのアイデンティティを異なる表現でレンダリングする。
次に、この合成データセットに先立って条件付きニューラルレージアンスフィールドをトレーニングし、推論時に、モデルを1つの被験者の非常にスパースな実画像のセットで微調整する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 12:24:50 GMT)
Pruning then Reweighting: Towards Data-Efficient Training of Diffusion Models [33.1] データセットプルーニングの観点から,効率的な拡散訓練について検討する。
GAN(Generative Adversarial Network)のような生成モデルに対するデータ効率トレーニングの原則に着想を得て、まず、GANで使用されるデータ選択スキームをDMトレーニングに拡張する。
生成性能をさらに向上するため,クラスワイド・リウェイト方式を採用する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:40:07 GMT)
Pruning then Reweighting: Towards Data-Efficient Training of Diffusion Models [33.1] データセットプルーニングの観点から,効率的な拡散訓練について検討する。
GAN(Generative Adversarial Network)のような生成モデルに対するデータ効率トレーニングの原則に着想を得て、まず、GANで使用されるデータ選択スキームをDMトレーニングに拡張する。
生成性能をさらに向上するため,クラスワイド・リウェイト方式を採用する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:40:07 GMT)
Does Vision Accelerate Hierarchical Generalization in Neural Language Learners? [32.9] 本研究では、基底言語習得の利点、特に視覚情報がニューラル言語モデル(LM)の構文一般化に与える影響について検討する。
実験の結果,言語的要素と視覚的要素のアライメントが明確であれば,視覚データへのアクセスはLMの構文的一般化に役立つが,そうでなければ視覚的入力は役に立たないことがわかった。
これは、相互の視線のような追加のバイアスや信号の必要性を強調し、クロスモーダルアライメントを強化し、マルチモーダルLMにおける効率的な統語的一般化を可能にする。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:29:14 GMT)
Enabling Synergistic Full-Body Control in Prompt-Based Co-Speech Motion Generation [32.7] 共同音声による動作生成手法は、通常、音声内容のみによる上半身のジェスチャーに焦点をあてる。
既存の音声と動きのデータセットは、非常に限定されたフルボディの動きのみを含む。
市販のテキスト・トゥ・モーション・データセットを補助として利用するSynTalkerを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:46:05 GMT)
Almost Free: Self-concordance in Natural Exponential Families and an Application to Bandits [32.1] 一般化された線形帯域に対する楽観的なアルゴリズムは、2階とも2階とも、先行項における問題パラメータの境界への指数的依存のない後悔境界を楽しむことを示す。
我々の定理は、半指数的尾を持つ一般化線型バンドイットに対する最初の後悔であり、ポアソン、指数的およびガンマバンドイットを含む問題のクラスを広げるものである。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 22:42:19 GMT)
Reasoning about the Unseen for Efficient Outdoor Object Navigation [31.7] 本稿では,LLM(Large Language Models)のための新しいメカニズムであるOUTDOORを導入する。
シミュレーションされたドローンと屋外環境での物理的四足歩行の両方で印象的な結果が得られた。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:29:26 GMT)
HEART-felt Narratives: Tracing Empathy and Narrative Style in Personal Stories with LLMs [30.6] 共感は、社会的な行動を可能にするための基盤となり、物語の中で個人的な経験を共有することによって引き起こされる。
共感は物語の内容に影響されるが、直感的には物語の語り方にも反応する。
我々は, LLMと大規模クラウドソーシング研究を用いて, スタイルと共感の関係を実証的に検証し, 定量化する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 00:17:41 GMT)
VLMGuard: Defending VLMs against Malicious Prompts via Unlabeled Data [29.8] VLMGuardは、未ラベルのユーザプロンプトを悪質なプロンプト検出に利用する、新しい学習フレームワークである。
良性検体と悪性検体を区別するための自動悪意度推定スコアを提示する。
私たちのフレームワークは、人間のアノテーションを余分に必要とせず、現実世界のアプリケーションに強力な柔軟性と実用性を提供します。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 00:37:29 GMT)
Efficient and Private Marginal Reconstruction with Local Non-Negativity [29.0] 本稿では,限界クエリに対する応答を再構成するための基本的かつ効率的なポストプロセッシング手法ReMを提案する。
拡張GReM-LNNは、一貫性と非負性を満たすガウス雑音の下で境界を再構成する。
既存のプライベートクエリ応答機構を改善するためにReMとGReM-LNNを適用することで、ReMとGReM-LNNの有用性を実証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:39:28 GMT)
CktGen: Specification-Conditioned Analog Circuit Generation [28.8] 本稿では,特定の仕様に基づいてアナログ回路を直接生成するタスクを提案する。
具体的には、単純だが効果的な変分オートエンコーダ(VAE)モデルであるCktGenを提案する。
オープンサーキットベンチマーク(OCB)の総合的な実験を行い、モデル間の整合性を評価するための新しい評価指標を導入する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:35:44 GMT)
Large Language Models Are Unconscious of Unreasonability in Math Problems [28.5] 本研究では,不合理な数学問題に直面した大規模言語モデル(LLM)の挙動について検討する。
実験により、LLMは不合理な誤りを検出することができるが、それでも非幻覚的コンテンツを生成するのに失敗することが示された。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:28:16 GMT)
Improved Sample Complexity of Imitation Learning for Barrier Model Predictive Control [27.6] システムの汎用クラスに対して,スムーズな専門家コントローラを設計する方法を示す。
MPCの障壁は, 何らかの方向に沿って, 理論的に最適な誤差-平滑性トレードオフを達成できることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:52:23 GMT)
Transformers as Transducers [27.5] 変換器のシーケンス・ツー・シーケンスマッピング能力について有限変換器に関連付けることにより検討する。
既存のブール変種であるB-RASPをシーケンス・ツー・シーケンス関数に拡張し、一階有理関数を正確に計算することを示す。
マスク付き平均的注意変換器はS-RASPをシミュレートできることを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:05:13 GMT)
MOSEL: 950,000 Hours of Speech Data for Open-Source Speech Foundation Model Training on EU Languages [27.3] 既存の基盤モデル(FM)には、オープンソースの用語で公開されているモデルウェイト、コード、トレーニングデータがない。
欧州連合(EU)の24の公用語に注目して、このギャップを埋める第一歩を踏み出します。
我々は,CC-BYライセンスの下で,441k時間の未ラベルデータの自動書き起こしをリリースする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:54:10 GMT)
Video-LLaVA: Learning United Visual Representation by Alignment Before Projection [27.0] Video-LLaVAは、画像とビデオの混合データセットから学習し、相互に強化する。
Video-LLaVAは5つの画像問合せデータセットと4つの画像ベンチマークツールキットにまたがる9つの画像ベンチマークで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 12:07:31 GMT)
ManiSkill3: GPU Parallelized Robotics Simulation and Rendering for Generalizable Embodied AI [27.0] ManiSkill3は、汎用的な操作をターゲットとしたコンタクトリッチな物理を備えた、最先端のGPU並列化ロボットシミュレータである。
ManiSkill3は、シミュレーション+レンダリング、異種シミュレーション、ポイントクラウド/ボクセルビジュアル入力など、多くの面でGPU並列化をサポートしている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:10:39 GMT)
Answer When Needed, Forget When Not: Language Models Pretend to Forget via In-Context Knowledge Unlearning [26.9] 大規模言語モデル(LLM)は様々な領域にまたがって適用される。
文脈内知識アンラーニング」という新しい手法を提案する。
本手法は,事前学習したLLMを微調整し,文脈内における目標知識の学習を迅速に行えるようにする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:13:25 GMT)
Atomic Inference for NLI with Generated Facts as Atoms [26.3] 原子推論は解釈可能で忠実なモデル決定を提供する。
このアプローチでは、全体的な予測を導出するために解釈可能かつ決定論的ルールを使用する前に、インスタンスの異なるコンポーネント(または原子)の予測を行う。
本研究では, LLM生成した事実を原子として利用し, 自然言語推論の前提を事実のリストに分解する方法について検討する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:48:32 GMT)
Language Enhanced Model for Eye (LEME): An Open-Source Ophthalmology-Specific Large Language Model [25.4] 我々は、Language Enhanced Model for Eye (LEME)と呼ばれる、眼科専門のオープンソースLSMを導入する。
LEMEは当初、Llama2 70Bフレームワークで事前訓練され、さらに127,000個の非コピーライトの訓練インスタンスで微調整された。
GPT-3.5, GPT-4, 3台のLlama2モデル(7B, 13B, 70B), PMC-LLAMA 13B, Meditron 70B, EYE-Llamaに対してLEMEをベンチマークした。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:43:54 GMT)
Optimizing Rare Word Accuracy in Direct Speech Translation with a Retrieval-and-Demonstration Approach [25.2] 直接音声翻訳モデルにおいて,稀な単語翻訳精度を高めるための検索・復調手法を提案する。
まず,レアワード翻訳のための検索例を組み込むために,既存のSTモデルを適用した。
次に、適切な例を見つけるために、クロスモーダル(音声から音声へ、音声からテキストへ、テキストからテキストへ)検索装置を開発する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:06:20 GMT)
Differentiable Interacting Multiple Model Particle Filtering [24.3] 本研究では,パラメータ学習のための連続モンテカルロアルゴリズムを提案する。
我々は、微分可能な粒子フィルタリングの新たな枠組みを採用し、パラメータは勾配降下によって訓練される。
提案アルゴリズムの新たな理論的結果を確立し,従来の最先端アルゴリズムと比較して優れた数値性能を示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 12:05:18 GMT)
Extracting Memorized Training Data via Decomposition [24.2] 本稿では,2つのフロンティア大言語モデルからニュース記事を抽出する,簡単なクエリベースの分解手法を示す。
73項目から少なくとも1文を抽出し,6項目から20%以上の動詞文を抽出した。
大規模に複製可能であれば、このトレーニングデータ抽出手法は、新たなLLMセキュリティと安全性の脆弱性を公開する可能性がある。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:34:42 GMT)
Extracting Memorized Training Data via Decomposition [24.2] 本稿では,2つのフロンティア大言語モデルからニュース記事を抽出する,簡単なクエリベースの分解手法を示す。
73項目から少なくとも1文を抽出し,6項目から20%以上の動詞文を抽出した。
大規模に複製可能であれば、このトレーニングデータ抽出手法は、新たなLLMセキュリティと安全性の脆弱性を公開する可能性がある。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:34:42 GMT)
TestGenEval: A Real World Unit Test Generation and Test Completion Benchmark [24.1] TestGenEvalは、1,210のコードから68,647のテストと、11の保守されたPythonリポジトリにまたがるテストファイルペアで構成されている。
初期テストのオーサリング、テストスイートの補完、コードカバレッジの改善をカバーしている。
パラメータは7Bから405Bまで様々である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:47:05 GMT)
S3Net: Innovating Stereo Matching and Semantic Segmentation with a Single-Branch Semantic Stereo Network in Satellite Epipolar Imagery [24.0] この研究は、セマンティックセグメンテーションとステレオマッチングを革新的に組み合わせたS3Net(Single-branch Semantic Stereo Network)というソリューションを導入している。
提案手法は,これらの2つのタスク間の本質的なリンクを識別し,活用することにより,意味情報のより正確な理解と相違性推定を実現する。
本モデルでは,セマンティックセグメンテーションにおけるmIoUを61.38から67.39に改善し,D1エラーと平均終点誤差(EPE)をそれぞれ10.051から9.579,1.439から1.403に削減する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 05:24:20 GMT)
Best Practices for Multi-Fidelity Bayesian Optimization in Materials and Molecular Research [23.9] MFBO(Multi-fidelity Bayesian Optimization)は、物質や分子の発見を高速化するためのフレームワークである。
化学的タスクに使用される可能性があるが、MFBOで果たす多くのパラメータの体系的な評価が欠如している。
実験環境でMFBOをいつ使用するかを決めるためのガイドラインと勧告を提供する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:37:36 GMT)
nGPT: Normalized Transformer with Representation Learning on the Hypersphere [23.7] 我々は新しいニューラルネットワークアーキテクチャ、正規化トランスフォーマー(nGPT)を提案する。
nGPTはより高速に学習し、同じ精度を達成するために必要なトレーニングステップの数を4から20に削減する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 23:50:09 GMT)
Exploring the Learning Capabilities of Language Models using LEVERWORLDS [23.4] 設定のモデルを学ぶには、一般的な構造ルールとインスタンスの特定の特性の両方を学ぶ必要がある。
本稿では,様々な学習方法における一般学習と特定学習の相互作用について,サンプル効率に着目して検討する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:02:13 GMT)
Enhancing Fairness through Reweighting: A Path to Attain the Sufficiency Rule [23.3] モデルトレーニングにおける経験的リスク最小化プロセスを強化するための革新的なアプローチを導入する。
このスキームは、最適予測器が多様なサブグループ間で整合性を維持することを保証することによって、公正性における十分性規則を維持することを目的としている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:18:35 GMT)
Asynchronous Approximate Agreement with Quadratic Communication [23.3] 非同期ネットワークは$n$のメッセージ送信パーティで、そのうちの最大$t$はビザンチンです。
本研究では,入力の凸内積にほぼ等しい出力が得られるような近似一致について検討する。
これは、信頼できるブロードキャスト毎に$Theta(n2)$メッセージ、またはイテレーション毎に$Theta(n3)$メッセージを取る。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 10:36:52 GMT)
ViLA: Efficient Video-Language Alignment for Video Question Answering [23.0] 我々のViLAネットワークは、効率的なフレームサンプリングと効果的なクロスモーダルアライメントの両方に対処する。
我々のViLAネットワークは、ビデオ質問応答ベンチマークにおいて最先端の手法よりも優れています。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 10:11:14 GMT)
Evidence Is All You Need: Ordering Imaging Studies via Language Model Alignment with the ACR Appropriateness Criteria [22.9] 我々は,エビデンスに基づくガイドラインに沿う患者に対して,画像研究を推奨することで,言語モデルを活用するための枠組みを導入する。
患者の"ワンライナー"シナリオの新たなデータセットを公開し、実験をパワーアップし、最先端の言語モデルを最適化して、画像の順序付けにおいて臨床医と同等の精度を達成する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:44:52 GMT)
Evidence Is All You Need: Ordering Imaging Studies via Language Model Alignment with the ACR Appropriateness Criteria [22.9] 我々は,エビデンスに基づくガイドラインに沿う患者に対して,画像研究を推奨することで,言語モデルを活用するための枠組みを導入する。
患者の"ワンライナー"シナリオの新たなデータセットを公開し、実験をパワーアップし、最先端の言語モデルを最適化して、画像の順序付けにおいて臨床医と同等の精度を達成する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:44:52 GMT)
Approximately Aligned Decoding [22.8] 本稿では,出力分布の歪みと計算効率のバランスをとる手法を提案する。
本稿では,提案手法のタスク固有性能が,出力分布を歪ませない手法に匹敵することを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 22:22:13 GMT)
Mutatis Mutandis: Revisiting the Comparator in Discrimination Testing [22.6] 差別のための試験は、コンパレータ(compparator)として知られるプロファイルを導出する。
差別を確立するための重要な側面は証拠であり、しばしば不服従者/比較者ペアを実装する差別テストツールを介して得られる。
コンパレータを導出する因果モデリングの性質を論じ,コンパレータに2種類の分類を導入する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 08:40:17 GMT)
Decentralized Optimization in Time-Varying Networks with Arbitrary Delays [22.4] 通信遅延によるネットワークの分散最適化問題を考察する。
そのようなネットワークの例としては、協調機械学習、センサーネットワーク、マルチエージェントシステムなどがある。
通信遅延を模倣するため、ネットワークに仮想非計算ノードを追加し、有向グラフを生成する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 18:19:34 GMT)
S-QGPU: Shared Quantum Gate Processing Unit for Distributed Quantum Computing [22.2] 本稿では,個別の小型量子コンピュータを共有量子ゲート処理ユニットに接続する分散量子コンピューティングアーキテクチャを提案する。
S-QGPUは、リモートゲート操作のためのハイブリッド2ビットゲートモジュールからなる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:43:11 GMT)
AlignSum: Data Pyramid Hierarchical Fine-tuning for Aligning with Human Summarization Preference [22.1] そこで本研究では,人間の要約選好アライメントフレームワークAlignSumについて紹介する。
AlignSumでは、BART-LargeのようなPLMが自動評価と人的評価の両方で175B GPT-3を上回っている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 05:14:48 GMT)
Don't Stop Me Now: Embedding Based Scheduling for LLMs [22.1] SRPT(Shortest Remaining Process Time)のようなサイズベースのスケジューリングアルゴリズムは、平均的な要求完了時間を削減することを目的としている。
LLMシステムにおけるメモリオーバーヘッドを考慮した予測型SRPT変種を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:51:07 GMT)
Self-Updatable Large Language Models with Parameter Integration [21.7] 周囲のオブジェクトとのインタラクションのような小規模なエクスペリエンスは、大規模な言語モデルに頻繁に統合する必要があります。
現在の手法では、連続学習、モデル編集、知識蒸留技術を用いてモデルパラメータに経験を組み込む。
モデルパラメータに直接経験を組み込むSELF-PARAMを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:18:17 GMT)
Replacing Paths with Connection-Biased Attention for Knowledge Graph Completion [21.7] この研究は、経路エンコーディングを明示的に使用することなく、帰納的設定でのKG補完に焦点を当てている。
接続バイアスによる注意とサブグラフエンコーディングモジュールへのエンティティロールの埋め込みを導入し、高価で時間を要するパスエンコーディングモジュールの必要性を解消する。
標準インダクティブKGコンプリートベンチマークデータセットの評価は、私たちのConnection-Biased Link Predictionモデルがパス情報を使用しないモデルよりも優れていることを示している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:12:41 GMT)
A Survey on Testing and Analysis of Quantum Software [21.4] 量子ソフトウェアのテストと分析における技術の現状を幅広く調査する。
量子コンピューティング、ソフトウェア工学、プログラミング言語、形式的手法など、いくつかの研究コミュニティの文献について論じる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:05:54 GMT)
Hierarchical Organization Simulacra in the Investment Sector [21.1] この方法は投資会社の階層的な意思決定を模倣し、ニュース記事を使って意思決定を知らせる。
その結果、階層シミュレーションは、頻度と収益性の両方において、専門的な選択と密接に一致していることがわかった。
しかし、この研究は意思決定における偏見も明らかにしており、即発的な言い回しやエージェントの年長感の変化が結果に大きく影響している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:59:41 GMT)
Creative and Context-Aware Translation of East Asian Idioms with GPT-4 [20.8] GPT-4は東アジアのイディオムの高品質な翻訳を生成できる。
低コストで、我々のコンテキスト対応翻訳は、人間のベースラインよりも、イディオム当たりの高品質な翻訳を実現することができる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:24:43 GMT)
Uncertainty-aware Reward Model: Teaching Reward Models to Know What is Unknown [20.8] 本稿では,未確認RM(URM)と未確認RMアンサンブル(URME)を提案し,報酬モデルに不確実性を取り込んで管理する。
URMEはアンサンブルにおける不一致を通じて不確実性を定量化する一方、URMは人間の好みの中で不整合属性の分布をモデル化することができる。
実験結果から,提案したURMは,同じ大きさのモデルと比較して最先端の性能を達成できることがわかった。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:29:59 GMT)
GERA: Geometric Embedding for Efficient Point Registration Analysis [20.7] 本稿では, 純幾何学的アーキテクチャを活用し, 幾何学的情報をオフラインで構築する新たなポイントクラウド登録ネットワークを提案する。
本手法は, 3次元座標入力をオフライン構成の幾何符号化に置き換え, 一般化と安定性を改善した最初の方法である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:19:56 GMT)
A Foundation Model for Zero-shot Logical Query Reasoning [20.7] 知識グラフ(KG)における複雑な論理的問合せ応答(CLQA)は、単純なKG完備化を超えている。
提案するUltraQueryは,任意のKG上で論理的クエリをゼロショットで応答可能な,帰納的推論のための最初の基礎モデルである。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 05:52:11 GMT)
Automated Peer Reviewing in Paper SEA: Standardization, Evaluation, and Analysis [20.6] 自動レビューフレームワークSEAを導入する。
標準、評価、分析の3つのモジュールから構成される。
著者が論文を改善するための貴重な洞察を得られる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:13:38 GMT)
EZIGen: Enhancing zero-shot subject-driven image generation with precise subject encoding and decoupled guidance [20.4] ゼロショットの被写体駆動画像生成は、所定のサンプル画像から被写体を組み込んだ画像を作成することを目的としている。
課題は、被験者の身元を保存しつつ、主題の外観の特定の側面を変更する必要があるテキストプロンプトと整合させることである。
1) 画像エンコーダの設計はアイデンティティの保存品質に大きな影響を与え,(2) テキストのアライメントとアイデンティティの保存の両方において,テキストと主題のガイダンスの分離が不可欠である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:52:18 GMT)
Future You: A Conversation with an AI-Generated Future Self Reduces Anxiety, Negative Emotions, and Increases Future Self-Continuity [20.4] 将来的な自己継続性を改善するために設計された,インタラクティブで簡潔な,単一セッションのディジタルチャット介入である“Future You”を紹介する。
我々のシステムでは、ユーザーは、将来の目標と個人的品質に合わせた、相対性がありながらAIで動くバーチャルバージョンとチャットできる。
フューチャーユー」のキャラクターとの短い対話の後、ユーザーは不安を減らし、将来的な自己継続性を高めたと報告した。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 09:00:57 GMT)
Logicbreaks: A Framework for Understanding Subversion of Rule-based Inference [20.1] 本研究では,大規模言語モデル (LLM) を早急に規定された規則に従う方法について検討する。
LLMはそのような規則を忠実に従えるが、悪意のあるプロンプトは理想化された理論的なモデルさえも誤解させる可能性があることを証明している。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:42:41 GMT)
"Hiding in Plain Sight": Designing Synthetic Dialog Generation for Uncovering Socially Situated Norms [19.9] 本稿では,対話の制御のためのフレームワークを提案する。
我々はこのフレームワークを使用して、リッチな設定に整合した対話の集合であるNormHintを生成し、競合につながる規範違反を解析する。
そこで本研究では,会話の自然さについて,会話の話題を多岐にわたって捉え,人間から高い評価を得た。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:38:23 GMT)
"For Us By Us": Intentionally Designing Technology for Lived Black Experiences [19.9] 我々は、生きた黒人の体験をサポートするために、黒人技術者による半構造化されたインタビューの成果を提示する。
我々は、生き残り、結びつきを保ち、文化的意義を追求し、祝賀の楽しさを損なうための多面的アプローチを見出した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:11:44 GMT)
HOLA-Drone: Hypergraphic Open-ended Learning for Zero-Shot Multi-Drone Cooperative Pursuit [19.6] 本稿では,複数の未確認パートナーと協調して複数のエバダを捕獲できるドローンエージェントの構築方法について検討する。
学習目的を継続的に適応させる新しいハイパーグラフィックオープンエンド学習アルゴリズム(HOLA-Drone)を提案する。
実験により、HOLA-Droneは、目に見えないドローンチームメイトとの協調において、ベースラインの手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:46:42 GMT)
Generative Precipitation Downscaling using Score-based Diffusion with Wasserstein Regularization [19.3] 地域リスクと降水科学を理解するために、長期記録と高解像度の製品が発掘されることがある。
本稿では,世界規模で利用可能なゲージベース降水生成物をダウンスケールする新しい生成拡散モデルを提案する。
We show that WassDiff has better reconstruction accuracy and bias scores than conventional score-based diffusion model。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:12:40 GMT)
Zero-Shot Multi-Hop Question Answering via Monte-Carlo Tree Search with Large Language Models [19.2] 本稿ではモンテカルロ木探索(MCTS)に基づくMZQA(Zero-shot Multi-hop Question Answering)を提案する。
従来とは違って,通常はドメインの専門知識を必要とする手作りの少数ショットの例をサポートせずに,命令のみに依存するゼロショットプロンプト手法を提案する。
また,MZQA-BCは自己生成MCTS推論軌道を学習し,解析速度を10倍以上に向上させる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 10:28:32 GMT)
Zero-Shot Multi-Hop Question Answering via Monte-Carlo Tree Search with Large Language Models [19.2] 本稿ではモンテカルロ木探索(MCTS)に基づくMZQA(Zero-shot Multi-hop Question Answering)を提案する。
従来とは違って,通常はドメインの専門知識を必要とする手作りの少数ショットの例をサポートせずに,命令のみに依存するゼロショットプロンプト手法を提案する。
また,MZQA-BCは自己生成MCTS推論軌道を学習し,解析速度を10倍以上に向上させる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 10:28:32 GMT)
Camera Height Doesn't Change: Unsupervised Training for Metric Monocular Road-Scene Depth Estimation [19.2] 単分子深度ネットワークに絶対的なスケールを学習させ,道路シーン深度を推定する新たなトレーニング手法を提案する。
主要なアイデアは、道路で見つかった車をスケールの監督源として活用し、ネットワークトレーニングにしっかりと組み込むことだ。
FuMETはフレーム内の車の大きさを検出して推定し、そこから抽出したスケール情報をカメラの高さの見積に集約する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:12:51 GMT)
Towards Symbolic XAI -- Explanation Through Human Understandable Logical Relationships Between Features [19.2] 本稿では,入力特徴間の論理的関係を表すシンボリッククエリに関連性を持つ,シンボリックXAIというフレームワークを提案する。
このフレームワークは、ユーザーによるカスタマイズと人間可読性の両方に柔軟性のある、モデルの意思決定プロセスを理解する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:35:49 GMT)
UniSumEval: Towards Unified, Fine-Grained, Multi-Dimensional Summarization Evaluation for LLMs [19.1] 要約品質評価のための既存のベンチマークでは、様々な入力シナリオが欠如し、狭い範囲に集中することが多い。
We create UniSumEval benchmark, which extends the range of input context and provide fine-fine, multi-dimensional annotations。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:11:44 GMT)
UniSumEval: Towards Unified, Fine-Grained, Multi-Dimensional Summarization Evaluation for LLMs [19.1] 要約品質評価のための既存のベンチマークでは、様々な入力シナリオが欠如し、狭い範囲に集中することが多い。
We create UniSumEval benchmark, which extends the range of input context and provide fine-fine, multi-dimensional annotations。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:11:44 GMT)
BlendScape: Enabling End-User Customization of Video-Conferencing Environments through Generative AI [19.1] BlendScapeは、ビデオ会議参加者がミーティングコンテキストに合わせて環境を調整するためのレンダリングとコンポジションシステムである。
BlendScapeは、ユーザの物理的背景とデジタル背景を統合された環境にブレンドすることで、タスク空間の柔軟な表現をサポートする。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 12:07:57 GMT)
Spatial Visibility and Temporal Dynamics: Revolutionizing Field of View Prediction in Adaptive Point Cloud Video Streaming [19.1] フィールド・オブ・ビュー適応ストリーミングは没入型クラウドビデオの帯域幅を著しく削減する。
伝統的なアプローチは、しばしば軌跡に基づく6自由度(6DoF)のFoV予測に焦点を当てる。
細胞可視性の観点からPCV FoV予測問題を再構成する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:53:44 GMT)
Spatial Visibility and Temporal Dynamics: Revolutionizing Field of View Prediction in Adaptive Point Cloud Video Streaming [19.1] フィールド・オブ・ビュー適応ストリーミングは没入型クラウドビデオの帯域幅を著しく削減する。
伝統的なアプローチは、しばしば軌跡に基づく6自由度(6DoF)のFoV予測に焦点を当てる。
細胞可視性の観点からPCV FoV予測問題を再構成する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:53:44 GMT)
From Facts to Insights: A Study on the Generation and Evaluation of Analytical Reports for Deciphering Earnings Calls [18.8] 本稿では,Earnings Calls (ECs) から得られた分析レポートの生成と評価におけるLarge Language Models (LLMs) の利用について検討する。
複数の分析を通して、生成されたレポートと人間によるレポートのアライメントと、個人エージェントと集団エージェントの両方の影響について検討する。
以上の結果から, 新たな薬剤の導入により, より洞察に富んだ報告が得られたことが示唆された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:03:22 GMT)
Pre-training with Synthetic Patterns for Audio [18.8] 本稿では,実際の音声データの代わりに合成パターンを用いた音声エンコーダの事前学習を提案する。
本フレームワークは,AudioSet-2Mで事前学習したモデルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:52:35 GMT)
PclGPT: A Large Language Model for Patronizing and Condescending Language Detection [18.5] Patronizing and condescending Language(PCL)は、脆弱なグループに向けられた音声の一種である。
従来の訓練済み言語モデル(PLM)は、偽善や偽共感のような暗黙的な毒性特性のためにPCLの検出に不適である。
大規模言語モデル(LLMs)の台頭により、我々は彼らの豊かな感情的意味論を利用して暗黙の毒性を探求するパラダイムを確立することができる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:19:13 GMT)
GEMS: Generative Expert Metric System through Iterative Prompt Priming [18.0] 非専門家は、効果的な測度を作成したり、理論を文脈特異的なメトリクスに変換するのが直感的ではないと考えることができる。
この技術的レポートは、大規模ソフトウェア企業内のソフトウェアコミュニティを調べることで、この問題に対処する。
本稿では,ニューラルアクティビティにインスパイアされたプロンプトエンジニアリングフレームワークを提案し,生成モデルが理論を抽出し,要約できることを実証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:14:54 GMT)
Insight: A Multi-Modal Diagnostic Pipeline using LLMs for Ocular Surface Disease Diagnosis [18.0] 眼表面疾患の診断に大規模言語モデル(LLM)を用いた,革新的なマルチモーダル診断パイプライン(MDPipe)を導入する。
これらの課題に対処するために,眼表面疾患の診断に大規模言語モデル(LLM)を用いることで,革新的なマルチモーダル診断パイプライン(MDPipe)を導入する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 00:23:05 GMT)
Generative models of MRI-derived neuroimaging features and associated dataset of 18,000 samples [17.6] GenMINDは、構造的脳画像から派生した規範的地域容積特徴の生成モデルである。
成人の寿命(22~90歳)にまたがる18,000の合成サンプルと、無制限のデータを生成するモデルの能力を提供する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:26:18 GMT)
Noise-NeRF: Hide Information in Neural Radiance Fields using Trainable Noise [17.6] 本稿では,適応的画素選択戦略と画素摂動戦略を用いた新しいNeRFステガノグラフィ手法であるNoss-NeRFを提案する。
超高分解能画像ステガノグラフィーの有効性だけでなく、ステガノグラフィーの品質とレンダリング品質の両面において、Noss-NeRFの最先端性能を検証する実験を行った。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 05:29:49 GMT)
Federated Learning with Reduced Information Leakage and Computation [17.1] フェデレートラーニング(Federated Learning, FL)は、分散学習パラダイムであり、複数の分散クライアントが、ローカルデータを共有せずに共通のモデルを共同で学習することを可能にする。
本稿では,モデル更新毎に一階近似を適用する手法であるUpcycled-FLを紹介する。
この戦略の下では、FL更新の半分は情報漏洩を伴わず、計算と送信のコストを大幅に削減する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 04:44:29 GMT)
Exploring Empty Spaces: Human-in-the-Loop Data Augmentation [17.0] Amplioは、専門家が構造化されていないテキストデータセットで"未知の未知"をナビゲートするのを支援するインタラクティブツールである。
我々は,高品質で多様性があり,関連するモデル安全性プロンプトを生成するための拡張手法の有用性を実証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:33:10 GMT)
A Scheduling-Aware Defense Against Prefetching-Based Side-Channel Attacks [16.9] プリフェッチと呼ばれるメモリの投機的ロードは、現実世界のCPUでは一般的である。
プリフェッチは、RSA、AES、ECDH実装で使用されるキーなど、プロセス分離やリークシークレットをバイパスするために利用することができる。
我々はx86_64とARMプロセッサに対する対策を実装した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:12:23 GMT)
Think Twice: A Human-like Two-stage Conversational Agent for Emotional Response Generation [16.7] 感情対話生成のための2段階対話エージェントを提案する。
まず,感情アノテートされた対話コーパスを使わずに訓練された対話モデルを用いて,文脈意味に合致するプロトタイプ応答を生成する。
第二に、第一段階のプロトタイプは共感仮説で制御可能な感情精錬器によって修正される。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 10:36:20 GMT)
Empirical Perturbation Analysis of Linear System Solvers from a Data Poisoning Perspective [16.6] 本稿では,入力データの誤りが,敵攻撃に共通する摂動下での線形システム解法による解の適合誤差と精度に与える影響について検討する。
我々は2つの異なる知識レベルによるデータ摂動を提案し、毒素最適化を開発し、ラベル誘導摂動(LP)と無条件摂動(UP)という2つの摂動方法を研究する。
データ中毒の場合のように、データが意図的に摂動している状況下では、異なる種類の解法がこれらの摂動にどのように反応するかを理解し、異なる種類の敵攻撃によって最も影響を受けるアルゴリズムを特定する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:14:05 GMT)
TRANSAGENT: An LLM-Based Multi-Agent System for Code Translation [16.5] コード翻訳は、ソフトウェアマイグレーション、システムアブレーション、クロスプラットフォーム開発に不可欠である。
従来のルールベースのメソッドは手書きのルールに依存している。
最近では、LLM(Large Language Models)の進歩により、学習ベースのコード翻訳がさらに強化されている。
本稿では,構文誤りや意味的誤りを解消し,LLMに基づくコード翻訳を強化した新しいマルチエージェントシステムTransagENTを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:35:05 GMT)
TRANSAGENT: An LLM-Based Multi-Agent System for Code Translation [16.5] コード翻訳は、ソフトウェアマイグレーション、システムアブレーション、クロスプラットフォーム開発に不可欠である。
従来のルールベースのメソッドは手書きのルールに依存している。
最近では、LLM(Large Language Models)の進歩により、学習ベースのコード翻訳がさらに強化されている。
本稿では,構文誤りや意味的誤りを解消し,LLMに基づくコード翻訳を強化した新しいマルチエージェントシステムTransagENTを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:35:05 GMT)
Convergent Privacy Loss of Noisy-SGD without Convexity and Smoothness [16.3] 有界領域上の隠れ状態雑音-SGDアルゴリズムの差分プライバシー(DP)保証について検討する。
我々は非滑らかな非滑らかな損失に対して収束R'enyi DPを証明した。
我々はまた、滑らかな凸損失に対する最先端の結果と比較して、厳格に優れたプライバシー境界を提供する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:52:08 GMT)
Learning from Demonstration with Implicit Nonlinear Dynamics Models [16.3] 本研究では、時間的ダイナミクスをモデル化するための可変な動的特性を持つ固定非線形力学系を含むリカレントニューラルネットワーク層を開発する。
LASA Human Handwriting データセットを用いて人間の手書き動作を再現する作業において,ニューラルネットワーク層の有効性を検証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:05:35 GMT)
Duo-LLM: A Framework for Studying Adaptive Computation in Large Language Models [16.2] 大規模言語モデル(LLM)は通常、固定された計算予算を使用してトークンによって出力トークンを生成する。
LLMの各フィードフォワードネットワーク層に小さな補助モジュールを統合する新しいフレームワークを提案する。
訓練されたルータがオーラクルと異なる動作をしており、しばしば準最適解が得られることを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:10:21 GMT)
Privacy Evaluation Benchmarks for NLP Models [16.2] NLP分野におけるプライバシ攻撃と防衛評価のベンチマークを示す。
このベンチマークは、さまざまなモデル、データセット、プロトコルをサポートし、攻撃と防御戦略の包括的な評価のための標準化されたモジュールをサポートする。
プライバシ攻撃のための連鎖したフレームワークを提案する。複数の攻撃をチェーンして、より高いレベルの攻撃目標を達成する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:12:35 GMT)
Towards Practical Human Motion Prediction with LiDAR Point Clouds [15.7] 我々は,最初のシングルLiDARに基づく3次元人体動作予測手法であるtextitLiDAR-HMPを提案する。
LiDAR-HMPは、入力として生のLiDARポイントクラウドを受け取り、将来の3D人間のポーズを直接予測する。
提案手法は,2つの公開ベンチマーク上での最先端性能を実現し,実世界の展開において顕著な堅牢性と有効性を示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:55:14 GMT)
A Robust Multisource Remote Sensing Image Matching Method Utilizing Attention and Feature Enhancement Against Noise Interference [15.6] 本稿では,ノイズ干渉に対する注意と特徴強調を利用した,頑健なマルチソースリモートセンシング画像マッチング手法を提案する。
第1段階では、深い畳み込みと変圧器の注意機構を組み合わせることで、密集した特徴抽出を行う。
第2段階では、二項分類機構に基づく外乱除去ネットワークを導入する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 03:35:34 GMT)
OLAPH: Improving Factuality in Biomedical Long-form Question Answering [15.6] MedLFQAは、バイオメディカルドメインに関連する長文質問回答データセットを用いて再構成されたベンチマークデータセットである。
また,コスト効率と多面的自動評価を利用した,シンプルで斬新なフレームワークであるOLAPHを提案する。
以上の結果から,OLAPHフレームワークでトレーニングした7B LLMでは,医療専門家の回答に匹敵する回答が得られた。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:03:14 GMT)
BarraCUDA: Edge GPUs do Leak DNN Weights [15.5] BarraCUDAは汎用グラフ処理ユニット(GPU)に対する新たな攻撃である
人気の高いNvidia Jetson Nanoデバイス上で動作するニューラルネットワークのパラメータを抽出することができる。
BarraCUDAは相関電磁分析を用いて、現実世界の畳み込みニューラルネットワークのパラメータを復元する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:50:38 GMT)
Unveiling Implicit Table Knowledge with Question-Then-Pinpoint Reasoner for Insightful Table Summarization [15.5] 高品質なテーブルサマリを生成するには、暗黙の知識が重要です。
本稿では,新しいテーブル推論フレームワークであるQQ-then-Pinpointを提案する。
私たちの研究は、洞察力のある知識をセルフクエストできるプラグアンドプレイのテーブル推論器の構築に重点を置いています。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 11:26:11 GMT)
The Gradient of Health Data Privacy [15.4] 本稿では、健康データガバナンスに対する新たな「プライバシ・グラデーション」アプローチを紹介する。
我々の多次元概念は、データ感度、利害関係者の関係、使用目的、時間的側面などの要因を考察する。
このアプローチは、世界中の多様な医療環境において、重要なプライバシー問題にどのように対処できるかを実証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:35:18 GMT)
Code Interviews: Design and Evaluation of a More Authentic Assessment for Introductory Programming Assignments [15.3] 本稿では,家庭内プログラミングの課題に対する,より正確な評価手法として,コードインタビューを解説する。
コードインタビューは、学生に自分の仕事について議論するよう促し、よりニュアンスな、時には反復的な洞察を動機づけた。
我々は、学生体験、学術的整合性、作業負荷の教育など、コードインタビューの設計に関するさまざまな決定について論じる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:01:41 GMT)
Empowering Large Language Model for Continual Video Question Answering with Collaborative Prompting [15.2] 本稿では,連続学習フレームワークにおけるビデオQAの新たな課題について考察する。
我々は,特定の質問制約の促進,知識獲得の促進,視覚的時間的認識の促進を統合した協調的プロンプト(ColPro)を提案する。
NExT-QAデータセットとDramaQAデータセットの実験的結果は、ColProが既存のアプローチよりも優れたパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:07:07 GMT)
CXPMRG-Bench: Pre-training and Benchmarking for X-ray Medical Report Generation on CheXpert Plus Dataset [14.9] X線画像に基づく医療報告生成は、診断上の負担と患者待ち時間を著しく削減することができる。
我々は、CheXpert Plusデータセット上で、既存の主流X線レポート生成モデルと大規模言語モデル(LLM)の包括的なベンチマークを行う。
自己教師付き自己回帰生成やX線レポートによるコントラスト学習を含む,多段階事前学習戦略を用いたX線画像生成のための大規模モデルを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:07:01 GMT)
FairCoT: Enhancing Fairness in Diffusion Models via Chain of Thought Reasoning of Multimodal Language Models [14.6] このフレームワークは,Chain-of-Thought推論を通じて拡散モデルの公平性を高める。
FairCoTは画像の品質や関連性を損なうことなく、公平性と多様性の指標を大幅に改善することを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 22:45:20 GMT)
PITCH: AI-assisted Tagging of Deepfake Audio Calls using Challenge-Response [14.6] PITCHは対話型ディープフェイク音声通話を検出しタグ付けするための堅牢なチャレンジ応答方式である。
本研究では,人間の聴覚システム,言語学,環境要因に基づく音声課題の包括的分類法を開発した。
私たちのソリューションでは、最大制御と検出精度を84.5%に向上しました。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:54:49 GMT)
AI-assisted Tagging of Deepfake Audio Calls using Challenge-Response [14.6] PITCHは対話型ディープフェイク音声通話を検出しタグ付けするための堅牢なチャレンジ応答方式である。
本研究では,人間の聴覚システム,言語学,環境要因に基づく音声課題の包括的分類法を開発した。
私たちのソリューションでは、最大制御と検出精度を84.5%に向上しました。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:54:49 GMT)
Classifier-free graph diffusion for molecular property targeting [14.5] この研究は、プロパティターゲティング、すなわち、ターゲットの化学的性質に条件付けられた分子を生成するタスクに焦点を当てている。
本稿では,条件情報を直接学習プロセスに注入して動作する分類器フリーなDiGress(FreeGress)を提案する。
提案手法は,DieGressのプロパティターゲティングタスクに対して,平均絶対誤差を最大79%改善することを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:45:04 GMT)
Beyond Minimax Rates in Group Distributionally Robust Optimization via a Novel Notion of Sparsity [14.4] 私たちは、$(lambda, beta)$-sparsityをダブした、空白という新しい概念を示します。
また、最適な$(lambda, beta)$-sparsity条件に適応する適応アルゴリズムを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:45:55 GMT)
LaDTalk: Latent Denoising for Synthesizing Talking Head Videos with High Frequency Details [14.2] 本稿では,写真リアリスティックな音声ヘッドビデオの合成に有効なポストプロセッシング手法を提案する。
具体的には,基礎モデルとして事前訓練されたWav2Lipモデルを使用し,その堅牢なオーディオ-リップアライメント機能を活用している。
以上の結果から,本手法は,最先端の映像品質とドメイン外リップ同期性能を実現することが示唆された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:32:02 GMT)
Advancing Medical Radiograph Representation Learning: A Hybrid Pre-training Paradigm with Multilevel Semantic Granularity [14.2] 本稿では,グローバルレベルの視覚表現と印象とトークンレベルの視覚表現とを一致させるHybridMEDフレームワークを提案する。
本フレームワークでは,画像から印象を生成するための2つのプロキシタスクを,キャプションブランチを介して生成する生成デコーダと,(2)要約ブランチを介して解析を行う。
MIMIC-CXRデータセットの実験により,我々の要約部は,キャプション部に対する知識を効果的に蒸留し,パラメータ要求を大幅に増大させることなくモデル性能を向上させることを明らかにした。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:05:36 GMT)
Ruler: A Model-Agnostic Method to Control Generated Length for Large Language Models [14.2] 大きな言語モデルは、しばしば特定の長さの応答を生成するのに苦労する。
本稿では,長さ制約のある命令下での大規模言語モデルの命令追従能力を高めるために,ルールと呼ばれる新しいモデルに依存しない手法を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:20:58 GMT)
Universal Vulnerabilities in Large Language Models: Backdoor Attacks for In-context Learning [14.0] In-context Learningは、事前学習と微調整のギャップを埋めるパラダイムであり、いくつかのNLPタスクにおいて高い有効性を示している。
広く適用されているにもかかわらず、コンテキスト内学習は悪意のある攻撃に対して脆弱である。
我々は、コンテキスト内学習に基づく大規模言語モデルをターゲットに、ICLAttackという新しいバックドアアタック手法を設計する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 12:38:03 GMT)
CusConcept: Customized Visual Concept Decomposition with Diffusion Models [14.0] ベクトルを埋め込んだカスタマイズされた視覚概念を抽出する2段階のフレームワークCusConceptを提案する。
最初の段階では、CusConceptは語彙誘導概念分解機構を採用している。
第2段階では、生成した画像の忠実度と品質を高めるために、共同概念の洗練を行う。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:41:44 GMT)
Multi-Designated Detector Watermarking for Language Models [13.9] 大型言語モデル(LLM)のためのEmphmulti-Designated Detector Watermarking (MDDW)を導入する。
この技術により、モデルプロバイダは、2つの重要な特性を持つLCMから透かし出力を生成することができる: (i) 特定の、おそらく複数の指定された検出器だけが透かしを識別でき、 (ii) 一般ユーザにとって出力品質の劣化は認識できない。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:08:42 GMT)
Whale Detection Enhancement through Synthetic Satellite Images [13.8] 実際のデータのみをトレーニングに使用した場合と比較して,捕鯨の検出において15%の性能向上が達成できることが示されている。
シミュレーションプラットフォームSeaDroneSim2のコードをオープンソースとして公開しています。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:53:35 GMT)
3DGR-CAR: Coronary artery reconstruction from ultra-sparse 2D X-ray views with a 3D Gaussians representation [13.8] 3D冠動脈再建は,冠動脈疾患の診断,治療計画,手術ナビゲーションに重要である。
従来の再建技術は、しばしば多くの投射を必要とするが、スパースビューのX線投射からの再構成は、放射線線量を減らす潜在的方法である。
超スパースX線投影による冠動脈再建のための3次元ガウス表現法である3DGR-CARを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 05:00:47 GMT)
Observe Then Act: Asynchronous Active Vision-Action Model for Robotic Manipulation [13.7] 本モデルでは,カメラのNext-Best-View(NBV)ポリシーとグリップのNext-Best Pose(NBP)ポリシーを直列接続し,数発の強化学習を用いてセンサ・モーター協調フレームワークでトレーニングする。
このアプローチにより、エージェントは3人称カメラを調整し、タスクゴールに基づいて環境を積極的に観察し、その後に適切な操作行動を推測することができる。
その結果,操作タスクにおける視覚的制約処理の有効性を示すとともに,ベースラインアルゴリズムを一貫して上回る結果が得られた。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:31:23 GMT)
Rethinking Misalignment in Vision-Language Model Adaptation from a Causal Perspective [13.6] 本稿では,タスク非関連知識の干渉を軽減するために,因果性誘導セマンティックデカップリングと分類を提案する。
多様な意味論によって生成される各予測の不確実性を評価するために、Dempster-Shaferエビデンス理論を用いる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 09:33:45 GMT)
Efficient Controlled Language Generation with Low-Rank Autoregressive Reward Models [13.4] 我々は、タスク固有の報酬モデルからスコアを用いて言語モデルから生成を制御するために、報酬拡張復号(RAD)アプローチを再検討する。
RADは、報酬行列を表現する際に高い柔軟性をサポートするように設計されており、復号時の計算コストが高くなることを示す。
そこで本研究では,高速かつ効率的な誘導復号化を可能にする報奨モデルの簡易かつ効率的な低ランクパラメトリゼーションを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:23:32 GMT)
Unveiling Factual Recall Behaviors of Large Language Models through Knowledge Neurons [13.3] 本研究では,Large Language Models (LLMs) が推論タスクに直面すると,その内部知識のリポジトリを積極的にリコールするか,回収するかを検討する。
我々は,LLMが特定の状況下での批判的事実関連を活用できないことを明らかにした。
複雑な推論タスクに対処する強力な手法であるChain-of-Thought(CoT)プロンプトの効果を評価する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 01:48:58 GMT)
GE2E-AC: Generalized End-to-End Loss Training for Accent Classification [13.3] 入力音声のアクセント埋め込みやAEを抽出するためにモデルを訓練するGE2E-ACを提案する。
提案したGE2E-ACの有効性を,従来のクロスエントロピーに基づく損失をトレーニングしたベースラインモデルと比較した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 10:54:54 GMT)
Generative Expansion of Small Datasets: An Expansive Graph Approach [13.1] 最小限のサンプルから大規模で情報豊富なデータセットを生成する拡張合成モデルを提案する。
自己アテンション層と最適なトランスポートを持つオートエンコーダは、分散一貫性を洗練させる。
結果は同等のパフォーマンスを示し、モデルがトレーニングデータを効果的に増強する可能性を示している。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 17:12:57 GMT)
Adaptive Cascading Network for Continual Test-Time Adaptation [12.7] そこで本研究では,テスト時に対象ドメインの列に事前学習したソースモデルを適応させることを目標とする連続的なテスト時間適応の問題について検討する。
テストタイムトレーニングの既存の方法には、いくつかの制限がある。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:11:53 GMT)
See Detail Say Clear: Towards Brain CT Report Generation via Pathological Clue-driven Representation Learning [12.4] 本稿では,病的手がかりに基づくクロスモーダルな表現を構築するためのPCRLモデルを提案する。
具体的には,分類領域,病理実体,報告テーマの観点から,病理的手がかりを構築した。
テキスト生成タスクの表現に適応するために、統一された大言語モデルを用いて、表現学習とレポート生成のギャップを埋める。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 10:42:32 GMT)
See Detail Say Clear: Towards Brain CT Report Generation via Pathological Clue-driven Representation Learning [12.4] 本稿では,病的手がかりに基づくクロスモーダルな表現を構築するためのPCRLモデルを提案する。
具体的には,分類領域,病理実体,報告テーマの観点から,病理的手がかりを構築した。
テキスト生成タスクの表現に適応するため,タスク調整命令を統一した大言語モデル(LLM)を用いて,表現学習とレポート生成のギャップを埋める。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 10:42:32 GMT)
Emergent Liouvillian exceptional points from exact principles [12.1] リウヴィリアEPは様々なシステムで見られ、多くのエキゾチックな効果に結びついている。
系のハイゼンベルク方程式は対応するマスター方程式と同じEPを示すことを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 10:24:07 GMT)
Variational Quantum Imaginary Time Evolution for Matrix Product State Ansatz with Tests on Transcorrelated Hamiltonians [12.0] マトリックス生成物状態(MPS)アンザッツは、分子ハミルトンの基底状態を見つけるための有望なアプローチを提供する。
本稿では,変分量子想像時間進化(VarQITE)手法を用いて,QCMPSアンサッツの最適化性能を向上させる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:43:30 GMT)
MMNeuron: Discovering Neuron-Level Domain-Specific Interpretation in Multimodal Large Language Model [11.9] マルチモーダル大言語モデルにおけるドメイン固有ニューロンを同定する。
本稿では,MLLMの言語モデルモジュールに対して,投影された画像特徴を扱うための3段階の機構を提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 17:04:22 GMT)
Uncertainty-aware t-distributed Stochastic Neighbor Embedding for Single-cell RNA-seq Data [11.9] 本研究では,不確実な単一セルRNA配列データに適したノイズ防御可視化ツールであるt-SNE(Ut-SNE)を紹介する。
Ut-SNEは、各サンプルに対する確率的表現を作成することにより、転写可変性に関するノイズをシングルセルRNAシークエンシングデータの視覚的解釈に正確に組み込む。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:03:15 GMT)
RadGazeGen: Radiomics and Gaze-guided Medical Image Generation using Diffusion Models [11.9] RadGazeGenは、専門家の視線パターンと放射能特徴マップをテキストから画像への拡散モデルのコントロールとして統合するためのフレームワークである。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 01:10:07 GMT)
Explainable Diagnosis Prediction through Neuro-Symbolic Integration [11.8] 我々は、診断予測のための説明可能なモデルを開発するために、神経象徴的手法、特に論理ニューラルネットワーク(LNN)を用いている。
私たちのモデル、特に$M_textmulti-pathway$と$M_textcomprehensive$は、従来のモデルよりも優れたパフォーマンスを示します。
これらの知見は、医療AI応用における精度と説明可能性のギャップを埋める神経象徴的アプローチの可能性を強調している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 22:47:24 GMT)
DropEdge not Foolproof: Effective Augmentation Method for Signed Graph Neural Networks [11.8] 本論文では, 有意または負の符号でマークされたエッジを用いて, 親和性や敵意関係をモデル化した有意グラフについて論じる。
著者らはこれらの問題に対処するためにデータ拡張(DA)技術を提案する。
彼らはSigned Graph Augmentation (SGA)フレームワークを紹介した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 23:15:48 GMT)
DropEdge not Foolproof: Effective Augmentation Method for Signed Graph Neural Networks [11.8] 本論文では, 有意または負の符号でマークされたエッジを用いて, 親和性や敵意関係をモデル化した有意グラフについて論じる。
著者らはこれらの問題に対処するためにデータ拡張(DA)技術を提案する。
彼らはSigned Graph Augmentation (SGA)フレームワークを紹介した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 23:15:48 GMT)
Differentially Private Active Learning: Balancing Effective Data Selection and Privacy [11.7] 標準学習設定のための差分プライベートアクティブラーニング(DP-AL)を導入する。
本研究では,DP-SGDトレーニングをALに統合することで,プライバシ予算の割り当てやデータ利用において大きな課題が生じることを実証する。
視覚および自然言語処理タスクに関する実験は,DP-ALが特定のデータセットやモデルアーキテクチャの性能を向上させることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:34:06 GMT)
Self-Adapting Large Visual-Language Models to Edge Devices across Visual Modalities [11.5] 近年のVision-Language(VL)モデルの進歩は、エッジデバイスへの展開への関心を喚起している。
We introduced EdgeVL, a novel framework that seamlessly integrates dual-modality knowledge distillation and Quantization-aware contrastive learning。
私たちの研究は、エッジデプロイメントに大規模なVLモデルを適応するための最初の体系的な取り組みであり、複数のデータセットで最大15.4%の精度向上と、最大93倍のモデルサイズ削減を示している。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 14:22:15 GMT)
OccRWKV: Rethinking Efficient 3D Semantic Occupancy Prediction with Linear Complexity [11.3] 3次元セマンティック占有予測ネットワークは,3次元シーンの幾何学的および意味的構造を再構築する際,顕著な能力を示した。
我々は、RWKV(Receptance Weighted Key Value)にインスパイアされた効率的なセマンティック占有ネットワークOccRWKVを紹介する。
OccRWKVはセマンティクス、占有予測、特徴融合を分離し、それぞれSem-RWKVとGeo-RWKVブロックを組み込む。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:56:03 GMT)
OccRWKV: Rethinking Efficient 3D Semantic Occupancy Prediction with Linear Complexity [11.3] 3次元セマンティック占有予測ネットワークは,3次元シーンの幾何学的および意味的構造を再構築する際,顕著な能力を示した。
我々は、RWKV(Receptance Weighted Key Value)にインスパイアされた効率的なセマンティック占有ネットワークOccRWKVを紹介する。
OccRWKVはセマンティクス、占有予測、特徴融合を分離し、それぞれSem-RWKVとGeo-RWKVブロックを組み込む。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:56:03 GMT)
Mitigating Training Imbalance in LLM Fine-Tuning via Selective Parameter Merging [11.2] 大型言語モデル(LLM)を特定のタスクに適応させるためには、SFT(Supervised Fine-tuning)が不可欠である。
本稿では,SFTモデルとデータ順序の微調整を併用することにより,この不均衡を軽減することを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:44:31 GMT)
Robust Traffic Forecasting against Spatial Shift over Years [11.2] 新たに提案したトラフィックOODベンチマークを用いて,時空間技術モデルについて検討する。
これらのモデルのパフォーマンスが著しく低下していることが分かりました。
そこで我々は,学習中にグラフ生成器の集合を学習し,それらを組み合わせて新しいグラフを生成するMixture Expertsフレームワークを提案する。
我々の手法は相似的かつ有効であり、任意の時間モデルにシームレスに統合できる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:49:29 GMT)
LePaRD: A Large-Scale Dataset of Judges Citing Precedents [11.2] LePaRD (LePaRD) は、アメリカ合衆国連邦裁判所の判例集である。
法的な通過予測は、前例的な裁判所の決定から関連する通過を予測することを目的としている。
LePaRDデータセットのサブセットは無償で利用可能で、データセット全体が公開される。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 14:09:08 GMT)
Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning [11.1] 本稿では,多ボット情報経路計画のための新しい深層強化学習手法を提案する。
我々は、集中的な訓練と分散実行パラダイムを通じて強化学習政策を訓練する。
提案手法は,他の最先端のマルチロボット目標マッピング手法よりも33.75%向上する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:11:29 GMT)
Design as Desired: Utilizing Visual Question Answering for Multimodal Pre-training [11.1] VQA(Visual Question Answering)をマルチモーダル・プレトレーニングに利用して,対象とする病態の特徴に着目したフレームワークのガイドを行う。
また,視覚的特徴をテキスト領域に近い準テキスト空間に変換するためのモジュールである準テキスト特徴変換器を用いた新しい事前学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:36:38 GMT)
FMBench: Benchmarking Fairness in Multimodal Large Language Models on Medical Tasks [11.1] 本研究では,MLLMの性能評価を行うためのベンチマークとしてFMBenchを提案する。
一般医療を含む8つの最先端オープンソースMLLMの性能と妥当性を徹底的に評価した。
すべてのデータとコードは、受け入れられると解放される。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:38:15 GMT)
Identifying Knowledge Editing Types in Large Language Models [11.1] 知識編集技術の悪用を防ぐための効果的な対策の欠如が顕著である。
悪意のある修正は、大きな言語モデル(LLM)が有害な内容を生成する可能性がある。
KETIBenchは、5種類の悪意のあるアップデートと1種類の良心的なアップデートを含むベンチマークです。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:35:24 GMT)
Identifying Knowledge Editing Types in Large Language Models [11.1] 知識編集技術の悪用を防ぐための効果的な対策が欠如している。
本稿では,大規模言語モデル(LLM)における様々な種類の編集を識別することを目的とした知識編集型識別(KETI)を提案する。
我々はKETIBenchを開発した。KETIBenchは、最も一般的な有毒なタイプをカバーする5種類の有害な編集と、1つの良心的な事実的編集を含む。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:35:24 GMT)
Recovering Time-Varying Networks From Single-Cell Data [11.0] 時系列単細胞遺伝子発現データから動的グラフを推論するディープニューラルネットワークであるMarleneを開発した。
Marleneは、新型コロナウイルスの免疫反応、線維化、老化など、特定の生物学的反応に関連する遺伝子相互作用を同定することができる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:18:51 GMT)
Do Music Generation Models Encode Music Theory? [11.0] テンポ、時間シグネチャ、音符、インターバル、スケール、コード、コード進行の概念からなる合成MIDIおよびオーディオ音楽理論のデータセットであるSynTheoryを紹介する。
次に,音楽基盤モデルにおけるこれらの音楽理論の概念を探索し,それらの概念が内部表現の中でいかに強くエンコードされているかを評価する枠組みを提案する。
以上の結果から,音楽理論の概念は基礎モデルにおいて識別可能であり,検出できる程度はモデルのサイズや層によって異なることが示唆された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:06:30 GMT)
Stabilizing the Kumaraswamy Distribution [11.0] 大規模潜在変数モデルは効率的なサンプリングと低分散微分をサポートする表現的連続分布を必要とする。
Kumaraswamy (KS) 分布はどちらも表現的であり、単純な閉形式逆CDFで再探索のトリックをサポートする。
逆CDFとlog-pdfの数値不安定性を同定し,PyTorchやグラフニューラルネットワークなどのライブラリの問題を明らかにする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:15:43 GMT)
Embedding-based statistical inference on generative models [10.9] 生成モデルの埋め込みに基づく表現に関する結果を、古典的な統計的推論設定に拡張する。
類似」の概念の基盤として視点空間を用いることは、複数のモデルレベルの推論タスクに有効であることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 22:28:39 GMT)
Hybrid Quantum Neural Network based Indoor User Localization using Cloud Quantum Computing [10.9] 本稿では、受信信号強度インジケータ(RSSI)値を用いた屋内ユーザ定位のためのハイブリッド量子ニューラルネットワーク(HQNN)を提案する。
提案するHQNNの性能テストには,WiFi,Bluetooth,Zigbeeを使用して,屋内のローカライズにRSSIデータセットを公開している。
また、HQNNの性能と最近提案された量子フィンガープリントに基づくユーザローカライゼーション手法を比較した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:59:59 GMT)
Spherical Analysis of Learning Nonlinear Functionals [10.8] 本稿では,球面上の関数の集合上で定義される関数について考察する。
深部ReLUニューラルネットワークの近似能力をエンコーダデコーダフレームワークを用いて検討した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:10:00 GMT)
AVID: Adapting Video Diffusion Models to World Models [10.8] 我々は,事前学習されたモデルのパラメータにアクセスすることなく,事前学習された映像拡散モデルを行動条件付き世界モデルに適用することを提案する。
AVIDは学習マスクを使用して、事前訓練されたモデルの中間出力を変更し、正確なアクション条件のビデオを生成する。
AVIDをゲームや実世界のロボットデータ上で評価し,既存の拡散モデル適応法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:48:31 GMT)
Deep activity propagation via weight initialization in spiking neural networks [10.7] Spiking Neural Networks (SNN)は、スパーシリティや超低消費電力といったバイオインスパイアされた利点を提供する。
ディープSNNは、実数値膜電位をバイナリスパイクに量子化することで、情報を処理し、伝達する。
提案手法は, 従来の手法とは異なり, スパイクの損失を伴わずに, 深部SNNにおける活動の伝播を可能にすることを理論的に示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:02:34 GMT)
LLMs May Not Be Human-Level Players, But They Can Be Testers: Measuring Game Difficulty with LLM Agents [10.6] LLMエージェントを用いた一般的なゲームテストフレームワークを提案し、広くプレイされている戦略ゲームであるWordleとSlay the Spireでテストする。
LLMは平均的な人間プレイヤーほど動作しないかもしれないが、単純で汎用的なプロンプト技術によって誘導される場合、人間のプレイヤーが示す困難さと統計的に有意で強い相関関係を示す。
このことから, LLM は開発過程におけるゲーム難易度測定に有効である可能性が示唆された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:40:43 GMT)
TFCT-I2P: Three stream fusion network with color aware transformer for image-to-point cloud registration [10.6] 点雲(3次元)と画像(2次元)の特徴の次元的差異は、その発展に重大な課題をもたらし続けている。
この課題に対処するため,TFCT-I2P と呼ばれるイメージ・ツー・ポイント・クラウド手法を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:14:34 GMT)
Identifiable Shared Component Analysis of Unpaired Multimodal Mixtures [10.6] マルチモーダル学習における中核的なタスクは、複数の特徴空間(テキストや音声など)からの情報を統合することであり、モダリティに不変なデータ表現を提供することである。
近年の研究では、カノニカル相関分析(CCA)のような古典的なツールが、共有されたコンポーネントを小さなあいまいさまで確実に識別できることが示されている。
この研究はさらに一歩前進し、クロスモーダルなサンプルが不整合である多モード線形混合物の共有成分識別性について研究した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:04:04 GMT)
Identifiable Shared Component Analysis of Unpaired Multimodal Mixtures [10.6] マルチモーダル学習における中核的なタスクは、複数の特徴空間(テキストや音声など)からの情報を統合することであり、モダリティに不変なデータ表現を提供することである。
近年の研究では、カノニカル相関分析(CCA)のような古典的なツールが、共有されたコンポーネントを小さなあいまいさまで確実に識別できることが示されている。
この研究はさらに一歩前進し、クロスモーダルなサンプルが不整合である多モード線形混合物の共有成分識別性について研究した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:04:04 GMT)
PrivTuner with Homomorphic Encryption and LoRA: A P3EFT Scheme for Privacy-Preserving Parameter-Efficient Fine-Tuning of AI Foundation Models [10.6] ファインチューニング(FT)は、トレーニング済みのAIファンデーションモデルを、より小さなターゲットデータセットでトレーニングすることでカスタマイズする手法である。
完全同型暗号化(FHE)を組み込んだPrivTunerスキームをLoRAに実装し,プライバシ保護を実現する。
実験により,我々のアルゴリズムは,異なるプライバシー要件に適応しながら,エネルギー消費を大幅に削減できることが示された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:30:06 GMT)
Scalable Multi-Task Transfer Learning for Molecular Property Prediction [10.5] 提案手法は, 最適転移率を自動的に取得することにより, 分子特性予測のためのスケーラブルなマルチタスク変換学習を可能にする。
実験により,提案手法は40の分子特性の予測性能を向上し,トレーニング収束を加速した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:28:14 GMT)
Outcome-Constrained Large Language Models for Countering Hate Speech [10.4] 本研究は,会話結果に制約された反音声を生成する手法を開発することを目的とする。
我々は,大言語モデル(LLM)を用いて,テキスト生成プロセスに2つの望ましい会話結果を導入する実験を行った。
評価結果から,提案手法が望まれる結果に対して効果的に対応できることが示唆された。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 00:09:49 GMT)
Truth or Deceit? A Bayesian Decoding Game Enhances Consistency and Reliability [10.4] 大規模言語モデル(LLM)は、一貫性と信頼性に欠ける出力を生成することが多い。
LLM出力生成の復号段階における一貫性と信頼性を高めるための新しいゲーム理論手法を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:46:10 GMT)
Accelerating Communication in Deep Learning Recommendation Model Training with Dual-Level Adaptive Lossy Compression [10.2] DLRMは最先端のレコメンデーションシステムモデルであり、様々な業界アプリケーションで広く採用されている。
このプロセスの重大なボトルネックは、すべてのデバイスから埋め込みデータを集めるのに必要な全通信に時間を要することだ。
本稿では,通信データサイズを削減し,DLRMトレーニングを高速化するために,エラーバウンドの損失圧縮を利用する手法を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 05:20:59 GMT)
Generative AI Application for Building Industry [10.2] 本稿では,建築産業における生成型AI技術,特に大規模言語モデル(LLM)の変容の可能性について検討する。
この研究は、LLMがいかに労働集約的なプロセスを自動化し、建築プラクティスの効率、正確性、安全性を大幅に改善できるかを強調している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:59:08 GMT)
Realization of high-fidelity perfect entangler between remote superconducting quantum processors [10.1] 超伝導量子ビットは普遍量子コンピューティングの有望な候補である。
ここでは、30cm以上の距離で2つの遠隔超伝導量子デバイス間の高忠実度完全エンタングルを実証する。
この進歩は、普遍的な分散量子情報処理の実現可能性を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:02:05 GMT)
FedPT: Federated Proxy-Tuning of Large Language Models on Resource-Constrained Edge Devices [10.0] textbfFederated textbfProxy-textbfTuning (FedPT)は、ブラックボックス大型LMのファインチューニングのための新しいフレームワークである。
FedPTは、競合性能を維持しながら、計算、通信、メモリオーバーヘッドを大幅に削減できる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:20:39 GMT)
GAMMA-PD: Graph-based Analysis of Multi-Modal Motor Impairment Assessments in Parkinson's Disease [9.7] 本稿では,多モード臨床データ解析のための新しいヘテロジニアスハイパーグラフ融合フレームワークであるGAMA-PDを提案する。
GAMMA-PDは、高次情報を保存することにより、画像と非画像データを"ハイパーネットワーク"(患者集団グラフ)に統合する。
パーキンソン病における運動障害症状の予測に有意な改善が認められた。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:51:33 GMT)
Using Contrastive Learning with Generative Similarity to Learn Spaces that Capture Human Inductive Biases [9.6] 人間は、少数の例から学び、感覚データから有用な情報を抽象化するために、強い帰納バイアスに頼る。
本稿では, 2つのデータポイントが同一分布からサンプリングされた場合, 2つのデータポイントが類似していると考えられる生成的類似性の概念を提案する。
生成的類似性は、その正確な形が難解である場合でも、対照的な学習目標を定義するのに有効であることを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 00:14:07 GMT)
Scalable Data Assimilation with Message Passing [9.6] ベイズ推論問題としてデータ同化を定式化して,空間的推論問題の解法としてメッセージパスアルゴリズムを適用した。
高い精度と計算とメモリ要件を維持しながら、アルゴリズムを非常に大きなグリッドサイズにスケールすることができる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 11:01:37 GMT)
Learning Adaptive Hydrodynamic Models Using Neural ODEs in Complex Conditions [9.4] 強化学習に基づく四足歩行ロボットは、様々な地形を横断するが、水中で泳ぐ能力は乏しい。
本稿では,水陸両用四足歩行ロボットのためのデータ駆動型流体力学モデルの開発と評価について述べる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:18:36 GMT)
Vision Language Models See What You Want but not What You See [9.3] 他人の意図を知り、他人の視点をとることは、人間の知性の2つの中核的な構成要素である。
本稿では,視覚言語モデルにおける意図理解と視点獲得について考察する。
意外なことに、VLMは意図的理解では高いパフォーマンスを達成できるが、視点決定では低いパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 01:52:01 GMT)
Vision Language Models Know Law of Conservation without Understanding More-or-Less [9.3] 我々は、ビジョン言語モデルに保存が出現したかどうかを評価するためにConserveBenchを使用します。
VLMは一般に保存できるが、非変換タスクでは失敗する傾向がある。
これは、少なくとも具体的な領域において、保存の法則が、量の概念的な理解なしに存在することを示唆している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:15:49 GMT)
Probing Mechanical Reasoning in Large Vision Language Models [9.3] 機械的推論により、私たちはツールを設計し、橋や運河を建設し、人間の文明の基礎となる家を建てることができます。
We leverage the MechBench of CogDevelop2K to test understanding of Mechanical system stability, gears and pulley system, seeaw-like system and leverage principle, inertia and motion。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 01:33:10 GMT)
Securing Cloud File Systems with Shielded Execution [9.2] クラウドファイルシステムは敵にとって主要なターゲットとなっている。
暗号技術と信頼できる実行環境(TEE)を活用する新しい設計は、依然として組織に望ましくないトレードオフを強要している。
我々は,セキュリティ保証,高性能,透過的なPOSIXライクなインターフェースをクライアントに提供するために,新たなセキュリティプロトコルをブートストラップするクラウドファイルシステムであるBFSを紹介した。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:57:19 GMT)
ParFormer: A Vision Transformer with Parallel Mixer and Sparse Channel Attention Patch Embedding [9.1] 本稿では、並列ミキサーとスパースチャネル注意パッチ埋め込み(SCAPE)を組み込んだ視覚変換器であるParFormerを紹介する。
ParFormerは、畳み込み機構とアテンション機構を組み合わせることで、特徴抽出を改善する。
エッジデバイスのデプロイメントでは、ParFormer-Tのスループットは278.1イメージ/秒で、EdgeNeXt-Sよりも1.38ドル高い。
より大型のParFormer-Lは83.5%のTop-1精度に達し、精度と効率のバランスの取れたトレードオフを提供する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 02:48:20 GMT)
Pseudo-Non-Linear Data Augmentation via Energy Minimization [9.1] 本稿では,エネルギーに基づくモデリングと情報幾何学の原理に基づく,新しい解釈可能なデータ拡張手法を提案する。
ディープニューラルネットワークに依存するブラックボックス生成モデルとは異なり、我々のアプローチは、これらの非解釈可能な変換を明示的で理論的に基礎付けられたモデルに置き換える。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:08:22 GMT)
GSPR: Multimodal Place Recognition Using 3D Gaussian Splatting for Autonomous Driving [9.0] マルチモーダル位置認識は ユニセンサーシステムの弱点を克服する能力によって 注目を集めています
本稿では,GSPRと呼ばれる3次元ガウス型マルチモーダル位置認識ニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 00:43:45 GMT)
Is Tokenization Needed for Masked Particle Modelling? [8.8] Masked Particle Modeling (MPM) は、無順序集合の表現表現を構築するための自己教師付き学習スキームである。
実装における非効率に対処し、より強力なデコーダを組み込むことにより、MPMを改善する。
これらの新しい手法は、ジェットの基礎モデルのための新しいテストベッドにおいて、オリジナルのMPMからのトークン化学習目標よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:40:11 GMT)
Is Tokenization Needed for Masked Particle Modelling? [8.8] Masked Particle Modeling (MPM) は、無順序集合の表現表現を構築するための自己教師付き学習スキームである。
実装における非効率に対処し、より強力なデコーダを組み込むことにより、MPMを改善する。
これらの新しい手法は、ジェットの基礎モデルのための新しいテストベッドにおいて、オリジナルのMPMからのトークン化学習目標よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:40:11 GMT)
SharkTrack: an accurate, generalisable software for streamlining shark and ray underwater video analysis [8.7] エラスモブランチ(シャーク砂線)は海洋生態系の重要な構成要素である。
しかし、彼らは世界的な人口減少を経験しており、その保護には効果的な人口監視が不可欠である。
そこで我々は,半自動水中ビデオ解析ソフトウェアSharkTrackを開発した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 22:29:49 GMT)
SharkTrack: an accurate, generalisable software for streamlining shark and ray underwater video analysis [8.7] エラスモブランチ(シャーク砂線)は海洋生態系の重要な構成要素である。
しかし、彼らは世界的な人口減少を経験しており、その保護には効果的な人口監視が不可欠である。
そこで我々は,半自動水中ビデオ解析ソフトウェアSharkTrackを開発した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 22:29:49 GMT)
Conversational Complexity for Assessing Risk in Large Language Models [8.6] 大規模言語モデル(LLM)は、特に対話的相互作用を通じて、害の可能性を秘めつつ、有益なアプリケーションを可能にする。
本稿では,特定の応答を得るために使用される会話長を定量化する会話長(CL)と,その応答につながるユーザの命令シーケンスのコルモゴロフ複雑性として定義される会話複雑度(CC)の2つの尺度を提案する。
このアプローチを大規模な赤チームデータセットに適用し、有害で無害な会話の長さと複雑さの統計的分布を定量的に分析する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:21:28 GMT)
Efficient and Green Large Language Models for Software Engineering: Vision and the Road Ahead [8.5] 大規模言語モデル(LLM)は、様々なソフトウェアエンジニアリングタスクにおいて顕著な機能を示している。
本稿は,LLM4SEの効率性と緑化に向けた研究コミュニティの焦点を振り返ることを目的としている。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 05:19:17 GMT)
Contrastive Abstraction for Reinforcement Learning [8.4] 我々は抽象状態を見つけるために、対照的な抽象学習を提案する。
このような抽象状態は、基本的な場所、達成されたサブゴール、在庫、健康状態である。
本実験は,強化学習におけるコントラスト抽象学習の有効性を実証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:56:09 GMT)
MapsTP: HD Map Images Based Multimodal Trajectory Prediction for Automated Vehicles [8.2] 我々はResNet-50を利用して高精細マップデータから画像の特徴を抽出し、IMUセンサデータを用いて速度、加速度、ヨーレートを計算する。
時間確率ネットワークを用いて潜在的な軌道を計算し、最も正確で高い確率の軌道経路を選択する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:18:10 GMT)
Solving High-Dimensional Partial Integral Differential Equations: The Finite Expression Method [8.2] 我々は高次元部分積分微分方程式(PIDE)を解くための新しい有限式法(FEX)を導入する。
FEX-PGと呼ばれる新しいFEXベースの手法は、高精度かつ解釈可能な数値解を提供する。
高次元設定では、FEX-PGは強力で頑健な性能を示し、単一の精度マシンのエプシロンの順序で相対誤差を達成している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:16:42 GMT)
Neural Scaling Laws of Deep ReLU and Deep Operator Network: A Theoretical Study [8.2] 深部演算子のネットワークにおけるニューラルネットワークのスケーリング法則をChenおよびChenスタイルアーキテクチャを用いて検討する。
我々は、その近似と一般化誤差を分析して、ニューラルネットワークのスケーリング法則を定量化する。
本結果は,演算子学習における神経スケーリング法則を部分的に説明し,その応用の理論的基盤を提供する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:06:55 GMT)
Mixed-state additivity properties of magic monotones based on quantum relative entropies for single-qubit states and beyond [8.0] 安定化器の忠実度は、任意の数の単一量子状態のテンソル積に対して乗法可能であることを証明する。
また、魔法の相対エントロピーは、全ての単一量子状態が安定化器オクタヘドロンの対称性軸に属する場合、加法的であることを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 10:31:17 GMT)
Decoding Emotions: Unveiling Facial Expressions through Acoustic Sensing with Contrastive Attention [8.0] FacER+はアクティブな音声表情認識システムである。
スマートフォンの3D顔輪郭とイヤホンスピーカとの間に放射される近超音波信号のエコーを分析して、表情特徴を抽出する。
多様なユーザーに依存しない現実のシナリオにおいて、90%以上の精度で6つの一般的な表情を正確に認識することができる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 03:21:33 GMT)
Design and Identification of Keypoint Patches in Unstructured Environments [7.9] 画像内のキーポイント識別は、生画像から2D座標への直接マッピングを可能にする。
様々なスケール,回転,カメラ投影を考慮した,単純な4つの異なる設計を提案する。
様々な画像劣化条件下でのロバスト検出を確保するために,スーパーポイントネットワークをカスタマイズする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:05:50 GMT)
Can We Remove the Ground? Obstacle-aware Point Cloud Compression for Remote Object Detection [7.7] そこで本研究では,PGR(Pillar-based Ground removal)アルゴリズムを提案する。
PGRは、オブジェクト認識にコンテキストを提供しない基底点をフィルタリングする。
重いオブジェクト検出やセマンティックセグメンテーションモデルを使用しないPGRは軽量で、高度に並列化可能で、効果的である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:05:33 GMT)
EmoKnob: Enhance Voice Cloning with Fine-Grained Emotion Control [7.6] EmoKnob(エモノブ)は、任意の感情の少数の実証的なサンプルを用いて、音声合成におけるきめ細かい感情制御を可能にするフレームワークである。
我々の感情制御フレームワークは、音声に感情を効果的に埋め込んで、商用TTSサービスの感情表現性を超越していることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 01:29:54 GMT)
Low-Energy On-Device Personalization for MCUs [7.5] マイクロコントローラユニット(MCU)は、低コストとエネルギー消費のためにエッジアプリケーションに理想的なプラットフォームである。
ローカルオンデバイスパーソナライズのための既存のアプローチは、主に単純なMLアーキテクチャをサポートするか、複雑なローカル事前トレーニング/トレーニングを必要とする。
本稿では,効率よく低エネルギーなMCUパーソナライズ手法である$MicroT$を紹介する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 14:08:10 GMT)
Low-Energy On-Device Personalization for MCUs [7.5] マイクロコントローラユニット(MCU)は、低コストとエネルギー消費のためにエッジアプリケーションに理想的なプラットフォームである。
ローカルオンデバイスパーソナライズのための既存のアプローチは、主に単純なMLアーキテクチャをサポートするか、複雑なローカル事前トレーニング/トレーニングを必要とする。
本稿では,効率よく低エネルギーなMCUパーソナライズ手法である$MicroT$を紹介する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:08:10 GMT)
Cloud-based XAI Services for Assessing Open Repository Models Under Adversarial Attacks [7.5] 計算コンポーネントとアセスメントタスクをパイプラインにカプセル化するクラウドベースのサービスフレームワークを提案する。
我々は、AIモデルの5つの品質特性を評価するために、XAIサービスの応用を実証する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 03:41:26 GMT)
Automatic Quantification of Serial PET/CT Images for Pediatric Hodgkin Lymphoma Patients Using a Longitudinally-Aware Segmentation Network [7.2] 小児Hodgkinリンパ腫患者に対する経時的PET/CT画像の定量化について検討した。
LAS-Netは、PET1から関連する特徴を伝達し、PET2の分析を知らせる。
F1スコア0.606のPET2の残存リンパ腫をLAS-Netが検出した。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 00:14:32 GMT)
High-dimensional logistic regression with missing data: Imputation, regularization, and universality [7.2] 我々は高次元リッジ規則化ロジスティック回帰について検討する。
予測誤差と推定誤差の両方を正確に評価する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:41:21 GMT)
TransResNet: Integrating the Strengths of ViTs and CNNs for High Resolution Medical Image Segmentation via Feature Grafting [7.0] 医用画像領域で高解像度画像が好ましいのは、基礎となる方法の診断能力を大幅に向上させるためである。
医用画像セグメンテーションのための既存のディープラーニング技術のほとんどは、空間次元が小さい入力画像に最適化されており、高解像度画像では不十分である。
我々はTransResNetという並列処理アーキテクチャを提案し、TransformerとCNNを並列的に組み合わせ、マルチ解像度画像から特徴を独立して抽出する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:22:34 GMT)
Tight Lower Bounds under Asymmetric High-Order Hölder Smoothness and Uniform Convexity [7.0] 我々は、高次H'olderの滑らかかつ一様凸関数を最小化するオラクル複雑性に対して、厳密な下界を提供する。
解析は、一階および二階の滑らかさの下での関数の以前の下界を一様凸関数と同様に一般化する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:57:06 GMT)
Count of Monte Crypto: Accounting-based Defenses for Cross-Chain Bridges [7.0] 2021年から2023年の間、暗号資産の価値は260億ドルを超え、「ブリッジ」に対する攻撃によって盗まれた。
本稿では,この期間にキーブリッジが使用した2千万件のトランザクションを実証分析する。
クロスチェーンのインフローとアウトフローのバランスをとる単純な不変性は、正当な使用法と互換性があるが、既知のすべての攻撃を正確に識別する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 22:33:03 GMT)
Heterogeneous sound classification with the Broad Sound Taxonomy and Dataset [6.9] 本稿では,異種音の自動分類手法について検討する。
手動のアノテーションによってデータセットを構築し、精度、クラスごとの多様な表現、実世界のシナリオにおける関連性を保証する。
実験結果から,音響情報や意味情報をエンコードした音声埋め込みは,分類作業において高い精度を実現することが示された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:09:02 GMT)
Paths to Equilibrium in Games [6.8] 我々は、強化学習におけるポリシー更新に触発されたペアワイズ制約を満たす戦略の列について研究する。
我々の分析は、戦略的な更新を劣化させる報酬が、満足のいく道に沿って均衡に進むための鍵である、という直感的な洞察を明らかにした。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 17:33:13 GMT)
MDA: An Interpretable Multi-Modal Fusion with Missing Modalities and Intrinsic Noise [6.6] 本稿では,モーダル・ドメイン・アテンション(MDA)を導入して,各モーダルの重みに対する適応調整を実現する,新しいマルチモーダル融合フレームワークを提案する。
本研究の目的は、欠落したモダリティや固有のノイズを取り入れつつ、マルチモーダル情報の融合を容易にし、マルチモーダルデータの表現を向上させることである。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 06:08:00 GMT)
Stochastic Direct Search Method for Blind Resource Allocation [6.6] 線形制約付きおよび微分自由最適化のための直接探索法(パターン探索とも呼ばれる)について検討する。
直接探索法は決定論的かつ制約のない場合において有限の後悔を達成できることを示す。
そこで本研究では,T2/3$のオーダを後悔させるようなダイレクトサーチの簡単な拡張を提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 08:15:02 GMT)
Fast Multiplication and the PLWE-RLWE Equivalence for an Infinite Family of Cyclotomic Subextensions [6.5] RLWE(Ring Learning With Errors)問題とPLWE(Polynomial Learning With Errors)問題との等価性を実証する。
また、最大実部分体の環内の2つの要素の積を計算するための高速整数についても述べる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:32:02 GMT)
ScVLM: a Vision-Language Model for Driving Safety Critical Event Understanding [6.5] 教師付き学習とコントラスト学習を組み合わせたハイブリッド手法であるScVLMを提案する。
提案手法は,第2戦略ハイウェイ研究プログラム自然言語駆動学習データセットから8,600以上のSCEを用いて訓練し,評価する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:10:23 GMT)
Synthesizing beta-amyloid PET images from T1-weighted Structural MRI: A Preliminary Study [6.4] T1強調MRI画像から3次元拡散モデルを用いてA$beta$-PET画像を合成する手法を提案する。
本手法は, 軽度認知障害 (MCI) 患者に対して有効ではないものの, 認知正常症例に対して高品質なA$beta$-PET画像を生成する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:12:03 GMT)
Synthesizing beta-amyloid PET images from T1-weighted Structural MRI: A Preliminary Study [6.4] T1強調MRI画像から3次元拡散モデルを用いてA$beta$-PET画像を合成する手法を提案する。
本手法は, 軽度認知障害 (MCI) 患者に対して有効ではないものの, 認知正常症例に対して高品質なA$beta$-PET画像を生成する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:12:03 GMT)
Quantifying reliance on external information over parametric knowledge during Retrieval Augmented Generation (RAG) using mechanistic analysis [6.4] 本稿では,RAGパイプラインを機械的に検討し,LMが「ショートカット」効果を示すことを示す。
LLM(LlaMa)とSLM(Phi)にまたがる「ショートカット」の動作が真であることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:48:13 GMT)
Investigating the Synergistic Effects of Dropout and Residual Connections on Language Model Training [6.2] 本稿では,言語モデル学習における過剰適合軽減におけるドロップアウト手法の意義について考察する。
言語モデリングの文脈における個々の層と残余接続に対する変数のドロップアウト率の影響について、包括的な調査を行っている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:27:00 GMT)
Simplified priors for Object-Centric Learning [6.2] 我々は,SAMP Simplified Slot Attention with Max Pool Priorsという概念的にシンプルで,完全微分可能で,非定型でスケーラブルな手法を導入する。
提案手法では,入力画像を畳み込みニューラルネットワークで符号化し,コンボリューション層とMaxPool層を交互に分割してサブネットワークを作成し,プリミティブスロットを抽出する。
その単純さにもかかわらず、我々の手法は標準ベンチマークで従来の手法より優れているか、優れている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:16:13 GMT)
Direct writing of high temperature superconducting Josephson junctions using a thermal scanning probe [6.1] 熱走査プローブを用いてYBa2Cu3O7-x(YBCO)のマイクロストリップに直接弱いリンクを印加するジョセフソン型超伝導ナノ接合の創出を初めて実証した。
結果として生じるナノブリッジは、DCとACのジョセフソン効果の両方で示されるように、SNS型接合のジョセフソン効果の明確な証拠を示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:48:13 GMT)
Cross-lingual Back-Parsing: Utterance Synthesis from Meaning Representation for Zero-Resource Semantic Parsing [6.1] Cross-Lingual Back-Parsing(クロスリンガル・バック・パーシング)は、セマンティック・パーシングのためのクロスリンガル・トランスファーを強化するために設計された新しいデータ拡張手法である。
提案手法は,ゼロリソース設定に挑戦する上で,言語間データ拡張を効果的に行う。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:53:38 GMT)
Simulation of Graph Algorithms with Looped Transformers [6.0] 理論的観点から, グラフ上のアルゴリズムをシミュレートするトランスフォーマーネットワークの能力について検討する。
このアーキテクチャは、Dijkstraの最も短い経路のような個々のアルゴリズムをシミュレートできることを示す。
付加的なアテンションヘッドを利用する場合のチューリング完全度を一定幅で示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:30:37 GMT)
ReXplain: Translating Radiology into Patient-Friendly Video Reports [5.8] ReXplainは、患者フレンドリーな画像レポートを生成するAI駆動のシステムである。
5人の放射線学者による概念実証研究は、ReXplainが正確な放射線情報を提供できることを示唆している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:41:18 GMT)
Identifying Spurious Correlations using Counterfactual Alignment [5.8] 急激な相関によって駆動されるモデルは、しばしば一般化性能が劣る。
本稿では,突発的相関を検出・定量化するためのCFアライメント手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 04:39:14 GMT)
The Uniqueness of LLaMA3-70B Series with Per-Channel Quantization [5.8] 量子化は、大規模言語モデル(LLM)を効率的にデプロイするための重要なテクニックである。
W8A8後の量子化がモデル精度に与える影響はいまだ議論の余地がある。
我々はLLaMA3-70Bモデルシリーズが量子化に一意に弱い理由を考察する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:05:45 GMT)
UniAdapt: A Universal Adapter for Knowledge Calibration [5.7] 大きな言語モデル(LLM)は、エラーを訂正し、継続的な進化する知識とペースを維持するために頻繁な更新を必要とする。
モデル編集における最近の研究は、一般化と局所性のバランスをとる上での課題を浮き彫りにした。
知識キャリブレーションのためのユニバーサルアダプタUniAdaptを紹介する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:18:34 GMT)
A Critical Assessment of Visual Sound Source Localization Models Including Negative Audio [5.7] 本稿では,Visual Sound Source のローカライゼーションモデルの標準評価を達成すべく,新しいテストセットとメトリクスを提案する。
我々は、沈黙、騒音、オフスクリーンの3種類の否定的オーディオについて検討している。
分析の結果,多くのSOTAモデルでは,音声入力に基づいて予測を適切に調整できないことがわかった。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:28:45 GMT)
Generalized Learning of Coefficients in Spectral Graph Convolutional Networks [5.6] スペクトルグラフ畳み込みネットワーク(GCN)は、グラフ機械学習アプリケーションで人気を集めている。
G-Arnoldi-GCNは、適切な関数が採用された場合、常に最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:28:39 GMT)
Synthesizing Tight Privacy and Accuracy Bounds via Weighted Model Counting [5.6] 2つの中核的な課題は、DPアルゴリズムの分布の表現的でコンパクトで効率的な符号化を見つけることである。
プライバシーと正確性に縛られた合成法を開発することで、最初の課題に対処する。
DPアルゴリズムに固有の対称性を活用するためのフレームワークを開発する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 17:45:37 GMT)
Ask, Pose, Unite: Scaling Data Acquisition for Close Interactions with Vision Language Models [5.5] 密接な人間間相互作用における社会的ダイナミクスはヒューマンメッシュ推定(HME)に重大な課題をもたらす
本稿では,LVLM(Large Vision Language Models)を用いた新しいデータ生成手法を提案する。
この手法は、アノテーションの負担を軽減するだけでなく、HME内の密接な相互作用に適した包括的なデータセットの組み立てを可能にする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 01:14:24 GMT)
An Innovative Attention-based Ensemble System for Credit Card Fraud Detection [5.5] 本稿では,クレジットカード不正検出のためのユニークな注意に基づくアンサンブルモデルを提案する。
アンサンブルモデルの精度は 99.95% であり、曲線 (AUC) の下の面積は 1 である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:56:23 GMT)
Demystifying Trajectory Recovery From Ash: An Open-Source Evaluation and Enhancement [5.4] 本研究では, トラジェクショナルリカバリ攻撃をスクラッチから再実装し, 2つのオープンソースデータセット上で評価する。
結果は、一般的な匿名化やアグリゲーション手法にもかかわらず、プライバシリークがまだ存在することを確認した。
ベースライン攻撃に対する一連の強化を設計することで、より強力な攻撃を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 23:50:33 GMT)
Demystifying Trajectory Recovery From Ash: An Open-Source Evaluation and Enhancement [5.4] 本研究では, トラジェクショナルリカバリ攻撃をスクラッチから再実装し, 2つのオープンソースデータセット上で評価する。
結果は、一般的な匿名化やアグリゲーション手法にもかかわらず、プライバシリークがまだ存在することを確認した。
ベースライン攻撃に対する一連の強化を設計することで、より強力な攻撃を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 23:50:33 GMT)
Unlocking Korean Verbs: A User-Friendly Exploration into the Verb Lexicon [5.4] Sejong辞書データセットは、形態学、構文、意味表現を広範囲にカバーしている。
このデータセット内のラベル付き言語構造は、単語とフレーズの関係を明らかにする基盤を形成する。
本稿では,動詞関連情報の収集と統合を目的としたユーザフレンドリーなWebインターフェースを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 22:03:34 GMT)
Uncertainty Modelling and Robust Observer Synthesis using the Koopman Operator [5.3] クープマン作用素は非線形系を無限次元線型系として書き換えることを可能にする。
クープマン作用素の有限次元近似は、データから直接同定することができる。
提案手法を実験的に実証するために、数十台のモータードライブの人口を用いている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:31:18 GMT)
An Introduction to Deep Survival Analysis Models for Predicting Time-to-Event Outcomes [5.3] 生存分析の分野では、時間から時間までの成果が広く研究されている。
Monographは、サバイバル分析のための、合理的に自己完結したモダンな導入を提供することを目指している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:29:17 GMT)
Optimizing Drug Delivery in Smart Pharmacies: A Novel Framework of Multi-Stage Grasping Network Combined with Adaptive Robotics Mechanism [5.2] 本稿では,多段把握ネットワークと適応ロボット機構を組み合わせた新しい枠組みを提案する。
ロボットの把握を制御するため,時間最適のロボットアーム軌道計画アルゴリズムを開発した。
実験により、スマート薬局業務の最適化における多段階把握ネットワークの優位性を実証した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:47:25 GMT)
LAViTeR: Learning Aligned Visual and Textual Representations Assisted by Image and Caption Generation [5.1] 本稿では,視覚およびテキスト表現学習のための新しいアーキテクチャであるLAViTeRを提案する。
メインモジュールであるVisual Textual Alignment (VTA)は、GANベースの画像合成とイメージキャプションという2つの補助的なタスクによって支援される。
CUBとMS-COCOの2つの公開データセットに対する実験結果は、優れた視覚的およびテキスト的表現アライメントを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:54:57 GMT)
LAViTeR: Learning Aligned Visual and Textual Representations Assisted by Image and Caption Generation [5.1] 本稿では,視覚およびテキスト表現学習のための新しいアーキテクチャであるLAViTeRを提案する。
メインモジュールであるVisual Textual Alignment (VTA)は、GANベースの画像合成とイメージキャプションという2つの補助的なタスクによって支援される。
CUBとMS-COCOの2つの公開データセットに対する実験結果は、優れた視覚的およびテキスト的表現アライメントを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:54:57 GMT)
Leveraging generative models to characterize the failure conditions of image classifiers [5.0] 我々は、ジェネレーティブ・ディバイサル・ネットワーク(StyleGAN2)が利用できる高品質画像データの制御可能な分布を生成する能力を活用する。
フェール条件は、生成モデル潜在空間における強い性能劣化の方向として表現される。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 08:52:46 GMT)
Creative Problem Solving in Large Language and Vision Models -- What Would it Take? [5.0] 我々は、大規模言語とビジョンモデル(LLVM)の研究とコンピュータ創造性(CC)の強力な統合を提唱する。
予備的な実験は、この制限にどうCC原則を適用するかを示している。
私たちのゴールは、権威あるML会場でLLVMとCCにおける創造的な問題解決に関する議論を促進することです。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:46:04 GMT)
Beamsplitter-free, high bit-rate, quantum random number generator based on temporal and spatial correlations of heralded single-photons [4.7] 光子対の空間相関を用いた高ビットレート量子乱数生成(QRNG)について報告する。
NIST 800-22とTestU01のテストスイートをすべてパスして,ビットレート3MbpsのQRNGを実現しました。
ジェネリック・スキームはSPDCリングをより分割することでビットレートをさらに高める可能性を示している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:40:40 GMT)
Deformable Convolution Based Road Scene Semantic Segmentation of Fisheye Images in Autonomous Driving [4.7] 本研究では,近代的変形可能な畳み込みニューラルネットワーク(DCNN)のセマンティックセグメンテーションタスクへの応用について検討する。
実験では,WoodScapeの魚眼画像データセットを10種類の異なるクラスに分割し,複雑な空間関係を捉えるデフォルマブルネットワークの能力を評価する。
変形可能なCNNの統合によるmIoUスコアの大幅な改善は、魚眼画像に存在する幾何歪みを扱う上での有効性を示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:22:39 GMT)
Orbital atomic sensor for gravitational waves [4.7] 我々は、通常のLIGO装置で受信した重力波信号を位相感受性の絡み合った状態に投射するために、超低温原子格子に、p$-orbital Bose-Einstein凝縮体を用いた軌道原子センサを導入する。
この進歩により、検出体積の3次の増加が可能となり、重力波を用いて暗黒物質やブラックホールを検出できる可能性が大幅に向上した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:48:34 GMT)
Redefining Data Pairing for Motion Retargeting Leveraging a Human Body Prior [4.5] MR.HuBoは、高品質な上半身のテキストロボットのラングルをポーズデータとして収集するコスト効率が高く便利な方法である。
また、大量の人間のポーズデータに基づいて教師付き学習によってトレーニングできる2段階のモーションニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:42:29 GMT)
Redefining Data Pairing for Motion Retargeting Leveraging a Human Body Prior [4.5] MR HuBo(Motion Retargeting leverageing a HUman BOdy prior)は,高品質な上半身対ロボットを収集する費用効率の良い方法である。
また、大量のペアデータに基づいて教師付き学習によってトレーニングできる2段階の運動ニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:42:29 GMT)
Redefining Data Pairing for Motion Retargeting Leveraging a Human Body Prior [4.5] $textMR.HuBo$は、高品質な上半身対の$langle textrobot, human rungle$ poseデータを集めるための費用効率が高く便利な方法である。
また、大量のペアデータに基づいて教師付き学習によってトレーニングできる2段階の運動ニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:42:29 GMT)
Domain Aware Multi-Task Pretraining of 3D Swin Transformer for T1-weighted Brain MRI [4.5] 脳磁気共鳴画像(MRI)のための3次元スイム変換器の事前訓練のためのドメイン認識型マルチタスク学習タスクを提案する。
脳の解剖学と形態学を取り入れた脳MRIの領域知識と、対照的な学習環境での3Dイメージングに適応した標準的な前提課題を考察した。
本手法は,アルツハイマー病の分類,パーキンソン病の分類,年齢予測の3つの下流課題において,既存の指導的・自己監督的手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 05:21:02 GMT)
Stability analysis of chaotic systems in latent spaces [4.3] 潜在空間アプローチはカオス偏微分方程式の解を推測できることを示す。
また、物理系の安定性を予測できる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:09:14 GMT)
SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models [4.2] テキスト・ツー・イメージ拡散モデル(SD)は、広範な計算資源を必要とする一方で、大幅な進歩を示す。
LCM-LoRAは、様々なモデルで一度トレーニング可能で、普遍性を提供するが、アクセラレーション前後で生成されたコンテンツの一貫性を確保することはめったにない。
本稿では,革新的アクセラレーションモジュールであるSpeedUpNet(SUN)を提案し,普遍性と一貫性の課題に対処する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 08:30:05 GMT)
FedDTG:Federated Data-Free Knowledge Distillation via Three-Player Generative Adversarial Networks [4.2] データフリー相互蒸留を実現するために,分散3プレーヤ生成適応ネットワーク(GAN)を導入する。
ベンチマークデータセットの可視化実験により,本手法は一般化の観点から,他のフェデレーション蒸留アルゴリズムよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 04:34:34 GMT)
MMUTF: Multimodal Multimedia Event Argument Extraction with Unified Template Filling [4.2] テキストプロンプトを介してテキストと視覚のモダリティを接続する統合テンプレートフィリングモデルを提案する。
我々のシステムはテキストEAEのSOTAを+7%上回り、マルチメディアEAEの2番目に高いシステムよりも一般的に優れている。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:02:46 GMT)
Finding Shared Decodable Concepts and their Negations in the Brain [4.1] 我々は、自然視画像観察中に脳の反応をCLIP埋め込みにマッピングする非常に正確なコントラストモデルを訓練する。
次に、DBSCANクラスタリングアルゴリズムの新たな適応を用いて、参加者固有のコントラストモデルパラメータをクラスタリングする。
各SDCクラスタに最も多く,最も関連付けられていない画像を調べることで,各SDCのセマンティック特性についてさらなる知見が得られる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 09:43:43 GMT)
NLEBench+NorGLM: A Comprehensive Empirical Analysis and Benchmark Dataset for Generative Language Models in Norwegian [4.1] ノルウェーの人口はわずか500万人で、NLPのタスクで最も印象的なブレークスルーの中では、表現力に乏しい。
このギャップを埋めるために、既存のノルウェーデータセットをコンパイルし、4つのノルウェーオープン言語モデルを事前訓練しました。
GPT-3.5はノルウェーの文脈を理解する能力に限界があることがわかった。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 02:56:30 GMT)
YouTube Video Analytics for Patient Engagement: Evidence from Colonoscopy Preparation Videos [3.8] 本研究は,YouTubeビデオから医療情報を検索する手法を用いたデータ分析パイプラインを実証する。
まず、YouTube Data APIを使用して、検索キーワードの検索に望ましいビデオのメタデータを収集します。
次に、医療情報、ビデオの可視性、全体的なレコメンデーションについて、YouTubeのビデオ資料に注釈を付ける。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:38:46 GMT)
Investigating the Impact of Model Complexity in Large Language Models [3.8] 事前訓練された微調整パラダイムに基づく大規模言語モデル(LLM)は、自然言語処理タスクの解決において重要な役割を担っている。
本稿では,自己回帰 LLM に着目し,HMM (Hidden Markov Models) を用いたモデリングを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:53:44 GMT)
Enhancing High-order Interaction Awareness in LLM-based Recommender Model [3.8] 本稿では,LLMベースのリコメンデータ(ELMRec)について述べる。
我々は、レコメンデーションのためのグラフ構築相互作用のLLM解釈を大幅に強化するために、単語全体の埋め込みを強化する。
ELMRecは、直接およびシーケンシャルなレコメンデーションの両方において、最先端(SOTA)メソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:04:55 GMT)
Enhancing High-order Interaction Awareness in LLM-based Recommender Model [3.8] 本稿では,LLMベースのリコメンデータ(ELMRec)について述べる。
我々は、レコメンデーションのためのグラフ構築相互作用のLLM解釈を大幅に強化するために、単語全体の埋め込みを強化する。
ELMRecは、直接およびシーケンシャルなレコメンデーションの両方において、最先端(SOTA)メソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:04:55 GMT)
Augmentation through Laundering Attacks for Audio Spoof Detection [3.7] ASVspoof 5 Challengeは、様々な音響条件のクラウドソースデータベースを導入した。
本稿では,ASVSpoof 5データベース上での雷攻撃によるデータ拡張による音声音声検出の性能について検討する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 22:34:51 GMT)
Large Language Models and Games: A Survey and Roadmap [3.7] 大規模言語モデル(LLM)は、ゲームを含む幅広いアプリケーションやドメインにおいて、顕著なポテンシャルを示している。
本稿では,ゲームにおけるLLMの様々な応用状況を調査し,ゲーム内でLLMが果たす役割について検討する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 18:34:37 GMT)
"I don't trust them": Exploring Perceptions of Fact-checking Entities for Flagging Online Misinformation [3.7] 我々は、655人の米国参加者とともにオンライン調査を行い、2つの誤情報トピックにまたがる8つのファクトチェックエンティティのユーザ認識を調査した。
以上の結果から,中立と認識される事実確認エンティティのさらなる検討の必要性が示唆されるとともに,複数の評価をラベルに組み込む可能性も示唆された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:01:09 GMT)
LUMA: A Benchmark Dataset for Learning from Uncertain and Multimodal Data [3.7] マルチモーダルディープラーニングは、テキスト、画像、オーディオ、ビデオなどの多様な情報ソースを統合することで意思決定を強化する。
信頼性の高いマルチモーダルアプローチを開発するためには、これらのモデルがいかに不確実性に与える影響を理解することが不可欠である。
我々は,不確実かつマルチモーダルなデータから学習するために,50クラスの音声,画像,テキストデータを含むユニークなベンチマークデータセットLUMAを提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:07:02 GMT)
Synthetic imagery for fuzzy object detection: A comparative study [3.7] ファジィ物体検出はコンピュータビジョン(CV)研究の難しい分野である
火、煙、霧、蒸気のようなファジィな物体は、視覚的特徴の点で非常に複雑である。
完全合成火災画像の生成と自動アノテートのための代替手法を提案し,活用する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 23:22:54 GMT)
Interval Estimation of Coefficients in Penalized Regression Models of Insurance Data [3.6] ツイーディー指数分散ファミリーは、保険の損失をモデル化するために多くの人々の間で人気がある。
内在変数を記述する最も重要な特徴の信頼性(推論)を得るためには、しばしば重要である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:57:18 GMT)
An Illumination-Robust Feature Extractor Augmented by Relightable 3D Reconstruction [3.5] 本稿では,照明・損音特徴抽出器の設計手順を提案する。
キーポイントの繰り返し可能性の利点を生かした特徴抽出のための自己教師型フレームワークを提案する。
頑健な特徴抽出のための提案手法の有効性を実証するために実験を行った。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 12:22:40 GMT)
Multi-Target Cross-Lingual Summarization: a novel task and a language-neutral approach [3.5] 言語間の要約は、異なる言語の文書を要約することで言語障壁を橋渡しすることを目的としている。
文書を複数のターゲット言語に要約する作業として多目的言語間要約を導入し、生成した要約が意味論的に類似していることを保証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:33:57 GMT)
Measurement challenges in AI catastrophic risk governance and safety frameworks [3.5] 安全フレームワークは、主要なAI企業によって開発され、AIスケーリング決定に特化して開発された、公開共有の破滅的なリスク管理フレームワークの最初のタイプである。
実装における6つの重要な測定課題を特定し、妥当性と信頼性を向上させるための3つの政策勧告を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:53:45 GMT)
Compressing Recurrent Neural Networks for FPGA-accelerated Implementation in Fluorescence Lifetime Imaging [3.5] ディープラーニングモデルはリアルタイム推論を可能にするが、複雑なアーキテクチャと大規模な行列演算のために計算的に要求される。
これにより、フィールドプログラマブルゲートアレイ(FPGA)ベースのカメラハードウェアの直接実装に不適なDLモデルが得られる。
本研究では,FLI時系列データ処理に適したリカレントニューラルネットワーク(RNN)の圧縮に着目し,資源制約付きFPGAボードへの展開を実現する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:23:26 GMT)
Annotation Guidelines for Corpus Novelties: Part 2 -- Alias Resolution Version 1.0 [3.5] ノベルティ・コーパス(英: Novelties corpus)は、エイリアス・レゾリューションに注釈を付けた小説(と小説の一部)のコレクションである。
この文書は、アノテーションのプロセスで適用されるガイドラインを記述します。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:06:52 GMT)
FLeNS: Federated Learning with Enhanced Nesterov-Newton Sketch [3.5] FLeNS(Federated Learning with Enhanced Nesterov-Newton Sketch)を紹介する。
FLeNSは、正確なヘッセンに依存することなく、ニュートンの手法を近似する。
我々は、加速度、スケッチサイズ、収束速度のトレードオフを厳格に保証し、特徴付ける。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:20:53 GMT)
Fast and Reliable $N-k$ Contingency Screening with Input-Convex Neural Networks [3.5] 電力系統のオペレータは、グリッドの停止や障害の防止や信頼性の高い運用を保証するために、ディスパッチ決定が実行可能であることを保証しなければなりません。
たとえ小さな$k$グリッドコンポーネントであっても、すべての$N - k$コンセントの実現可能性を確認する。
本研究では,入力カスケード型ニューラルネットワーク(ICNN)を用いた同時スクリーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:38:09 GMT)
Unsupervised Meta-Learning via In-Context Learning [3.4] 本稿では,教師なしメタ学習における教師なしメタ学習の一般化能力を活用した新しい手法を提案する。
提案手法は,メタラーニングをシーケンスモデリング問題として再設計し,トランスフォーマーエンコーダがサポート画像からタスクコンテキストを学習できるようにする。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 06:29:08 GMT)
Thinking Outside of the Differential Privacy Box: A Case Study in Text Privatization with Language Model Prompting [3.4] 我々は、差別化プライバシ(DP)統合が課す制約について議論するとともに、そのような制限がもたらす課題を明らかにします。
以上の結果から,NLPにおけるDPのユーザビリティと非DPアプローチに対するメリットについて,さらなる議論の必要性が示唆された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:46:15 GMT)
Conversational Exploratory Search of Scholarly Publications Using Knowledge Graphs [3.4] 我々は,知識グラフを用いた学術出版物探索のための会話検索システムを開発した。
システムの有効性を評価するために,様々な評価指標を用い,40名の被験者で人的評価を行った。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:16:07 GMT)
An Empirical Study of Large Language Models for Type and Call Graph Analysis [3.4] 大規模言語モデル(LLM)は、ソフトウェア工学におけるその可能性のために、ますます研究されている。
本研究では,Python および JavaScript プログラムのコールグラフ解析と型推論を強化するため,現在の LLM の可能性について検討する。
我々は、OpenAIのGPTシリーズやLLaMAやMistralといったオープンソースモデルを含む24のLLMを実証的に評価した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:44:29 GMT)
ClimRetrieve: A Benchmarking Dataset for Information Retrieval from Corporate Climate Disclosures [3.3] 本研究は,持続可能性分析の典型的な課題を,気候に関する詳細な16の質問を含む30のサステナビリティレポートを用いてシミュレートする。
異なるレベルの関連性によってラベル付けされた8.5K以上のユニークな質問ソースと回答のペアを持つデータセットを得る。
本研究は,知識を組み込んだ情報検索における専門家の知識の統合を検討するために,データセットを用いたユースケースを開発する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 08:55:44 GMT)
Socioeconomic disparities in mobility behavior during the COVID-19 pandemic in developing countries [3.3] 新型コロナウイルス(COVID-19)パンデミックの間、携帯電話のデータは人間のモビリティの定量化に重要な役割を果たしてきた。
携帯電話利用者の位置情報データと3大陸中所得国6カ国の人口調査を利用した。
低地に住む住民は、自立、農村部への移住、通勤を控えるなど、反応が低かった。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 21:05:18 GMT)
RICAU-Net: Residual-block Inspired Coordinate Attention U-Net for Segmentation of Small and Sparse Calcium Lesions in Cardiac CT [3.3] Residual-block Inspired Coordinate U-Net (RICAU-Net) は, 病変特異的冠状動脈カルシウム (CAC) セグメンテーションにおいて, コーディネート・アテンションとコンボ・ロス機能を備えている。
実験結果とアブレーション実験により,提案手法は医療応用における他の4つのU-Net法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:27:45 GMT)
Evaluating Deep Regression Models for WSI-Based Gene-Expression Prediction [3.3] 通常の全スライディング画像から直接mRNA遺伝子の発現プロファイルを予測することは、コスト効率が高く、広くアクセス可能な分子表現型を提供する可能性がある。
本研究は、WSIに基づく遺伝子発現予測のために、どのように深部回帰モデルをトレーニングすべきかを推奨する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:00:22 GMT)
cmaes : A Simple yet Practical Python Library for CMA-ES [3.3] cmaesは共分散行列適応進化戦略(CMA-ES)のためのPythonライブラリである
cmaesはシンプルさを特徴とし、直感的な使い勝手と高いコード読みやすさを提供する。
CMA-ESの最近の進歩には、挑戦的なシナリオの学習率適応、移行学習、混合整数最適化機能などが含まれている。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 09:50:36 GMT)
Radio Foundation Models: Pre-training Transformers for 5G-based Indoor Localization [3.3] 本稿では,高価な機器を使わずに5Gチャネル計測において,一般変圧器(TF)ニューラルネットワークを事前学習する自己教師型学習フレームワークを提案する。
そこで本研究では,入力情報をランダムにマスクしてドロップして再構築する手法を提案する。
FPベースのローカライゼーションを可能にする伝搬環境の時間的パターンと情報を暗黙的に学習する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 12:03:32 GMT)
Timber! Poisoning Decision Trees [3.2] 我々は、決定木をターゲットにした最初のホワイトボックス中毒攻撃であるTimberを紹介します。
我々の攻撃は、有効性、効率性、あるいはその両方において、既存のベースラインを上回っていることを示す。
また、2つの代表的防衛が我々の攻撃の効果を軽減することができるが、効果的に阻止することができないことを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:58:54 GMT)
Distributed AI Platform for the 6G RAN [3.2] 複雑なRAN問題を解決する上で、AIは重要な有効要因として現れます。
これらの課題に対処する既存のアプローチは、真にAIネイティブな6Gネットワークのビジョンを実現するには不十分である。
このソリューションの欠如によって動機づけられた同社は、汎用的な分散AIプラットフォームアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:35:25 GMT)
Restoring Super-High Resolution GPS Mobility Data [3.2] 本稿では, トランカットや合成低分解能入力から高分解能GPSトラジェクトリデータを再構成するシステムを提案する。
提案モデルでは,平均フレッシュ距離0.198kmを実現し,地図マッチングアルゴリズムや合成軌道モデルよりも優れていた。
これらの結果から, このシステムは都市のモビリティアプリケーションに展開可能であり, 高い精度と堅牢なプライバシ保護を実現することが示唆された。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 11:54:16 GMT)
You are what you eat? Feeding foundation models a regionally diverse food dataset of World Wide Dishes [3.1] 765の料理からなる混合テキストと画像データセットであるWorld Wide Dishesを131の地方言語で収集した。
本稿では,言語モデルやテキスト・ツー・イメージ生成モデルといった基礎モデルにおいて,機能と表現バイアスを運用する新たな方法を示す。
これらのモデルは、一般的に、異なる地域固有の料理の質の高いテキストや画像の出力を生成しない。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 23:11:00 GMT)
User-Guided Verification of Security Protocols via Sound Animation [3.1] 本稿では,対話木(ITrees)に基づくCSPの変種を用いたDolev-Yao攻撃モデルを実装し,プロトコルをアニメーターにコンパイルする。
コンパイルの健全性を保証するため、定理証明器 Isabelle/HOL で我々のアプローチを機械化した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:34:35 GMT)
AARK: An Open Toolkit for Autonomous Racing Research [3.1] AARKは、より安全な道路と信頼できる自律システムの提供に不可欠な分野の研究を統一し、民主化することを目指している。
AARKはACI、ACDG、ACICの3つのパッケージを提供する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:07:48 GMT)
Human-Robot Collaborative Minimum Time Search through Sub-priors in Ant Colony Optimization [3.0] 本稿では,最小時間探索(MTS)課題を解決するため,ACOメタヒューリスティックの拡張を提案する。
提案したモデルは2つの主要ブロックから構成される。第1のモデルは畳み込みニューラルネットワーク(CNN)で、オブジェクトがセグメント化された画像からどこにあるかという事前確率を提供する。
2つ目は、サブプライアのMTS-ACOアルゴリズム(SP-MTS-ACO)である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:57:28 GMT)
ROK Defense M&S in the Age of Hyperscale AI: Concepts, Challenges, and Future Directions [3.0] 国家防衛モデリングとシミュレーション(M&S)へのハイパースケールAIの統合は、戦略的および運用能力の強化に不可欠である。
我々は、超大規模AIが、前例のない精度、速度、複雑なシナリオをシミュレートする能力を提供することで、防衛M&Sに革命をもたらす方法を探求する。
大韓民国は防衛能力を強化し、近代戦の脅威に先んじることができる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:39:12 GMT)
Cookie Monster: Efficient On-device Budgeting for Differentially-Private Ad-Measurement Systems [3.0] 本稿では、既存のプライバシー保護広告計測APIを強化する取り組みについて述べる。
Google、Apple、Meta、Mozillaのデザインを分析し、より厳格で効率的な差分プライバシー(DP)予算コンポーネントでそれらを強化します。
われわれのアプローチはCookie Monsterと呼ばれ、よく定義されたDP保証を強制し、広告主がよりプライベートな測定クエリを正確に実行できるようにする。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:06:48 GMT)
Cookie Monster: Efficient On-device Budgeting for Differentially-Private Ad-Measurement Systems [3.0] 本稿では、既存のプライバシー保護広告計測APIを強化する取り組みについて述べる。
Google、Apple、Meta、Mozillaのデザインを分析し、より厳格で効率的な差分プライバシー(DP)予算コンポーネントでそれらを強化します。
われわれのアプローチはCookie Monsterと呼ばれ、よく定義されたDP保証を強制し、広告主がよりプライベートな測定クエリを正確に実行できるようにする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:06:48 GMT)
Boosting the Capabilities of Compact Models in Low-Data Contexts with Large Language Models and Retrieval-Augmented Generation [3.0] 本稿では,形態素解析の言語タスクにおいて,より小さなモデルの出力を補正するために,大言語モデル(LLM)を基盤とした検索拡張生成(RAG)フレームワークを提案する。
データ不足や訓練可能なパラメータの不足を補うために,言語情報を活用するとともに,LLMを通して解釈・蒸留された記述文法からの入力を許容する。
コンパクトなRAG支援モデルがデータスカース設定に極めて有効であることを示し、このタスクとターゲット言語に対する新しい最先端技術を実現する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:20:14 GMT)
On the Geometry and Optimization of Polynomial Convolutional Networks [3.0] 単項活性化機能を持つ畳み込みニューラルネットワークについて検討する。
我々は、モデルの表現力を測定するニューロマニフォールドの次元と度合いを計算する。
一般的な大規模データセットに対して、回帰損失の最適化に起因した臨界点の数を定量化する明示的な公式を導出する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:13:05 GMT)
Local convergence of simultaneous min-max algorithms to differential equilibrium on Riemannian manifold [3.0] 2つの同時アルゴリズム $tau$-GDA と $tau$-SGA の局所収束をそのような平衡に解析する。
得られた知見は,簡単なベンチマークで$tau$-GDAと$tau$-SGAを用いてWasserstein GANsのトレーニングを改善することができることを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 19:32:59 GMT)
Tight Rates for Bandit Control Beyond Quadratics [3.0] 目的を達成するアルゴリズムを開発する。
tildeO(T)$ は帯域非確率な滑らかな摂動関数に対する最適制御である。
私たちの主な貢献は、目的を達成するアルゴリズムです。
tildeO(T)$はメモリなしでBandit Convex(BCO)の最適制御である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:35:08 GMT)
RuBLiMP: Russian Benchmark of Linguistic Minimal Pairs [3.0] 本稿では,RuBLiMP (Linguistic Minimal Pairs) のロシア語ベンチマークを紹介する。
RuBLiMPは文法性が異なる45k対の文を含み、形態的、構文的、意味的な現象を分離する。
ロシア語の言語モデルは, 構造的・合意的コントラストに敏感であるが, 構造的関係, 否定, 推移性, 時制の理解を必要とする現象に人間に遅れがあることが判明した。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 19:56:57 GMT)
CPL: Critical Plan Step Learning Boosts LLM Generalization in Reasoning Tasks [2.9] 後学習,特に強化学習は,大規模言語モデル(LLM)の新しい学習パラダイムとなった
モデル一般化を強化するための高レベルの抽象計画について,アクション空間内での探索を提案する。
GSM8KとMATHを専門にトレーニングした本手法は,性能を著しく向上することを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 05:42:12 GMT)
Shuttling for Scalable Trapped-Ion Quantum Computers [2.9] トラップイオン量子コンピュータの効率的なシャットリングスケジュールを提案する。
提案手法は、最小限の時間ステップでシャットリングスケジュールを生成する。
提案されたアプローチの実装は、オープンソースのミュンヘン量子ツールキットの一部として公開されている。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:30:09 GMT)
Teaching Cloud Infrastructure and Scalable Application Deployment in an Undergraduate Computer Science Program [2.9] 学生は通常、技術キャリアの初期にクラウド抽象化と対話します。
クラウドエンジニアリングの基礎をしっかり理解せずにクラウドネイティブなアプリケーションを構築することは、クラウドプラットフォームに共通するコストとセキュリティの落とし穴に敏感な学生を悩ませる可能性がある。
私たちのコースでは、学生にIaC、コンテナ化、可観測性、サーバレスコンピューティング、継続的インテグレーションとデプロイメントといった、モダンでベストプラクティスのコンセプトとツールを体験するためのハンズオンの課題を数多く紹介しました。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:49:19 GMT)
SQFT: Low-cost Model Adaptation in Low-precision Sparse Foundation Models [2.9] SQFTは、大規模事前学習モデルの低精度スパースパラメータ効率微調整のためのエンドツーエンドソリューションである。
SQFTは資源制約のある環境で効果的なモデル操作を可能にする。
SQFTはまた、異なる数値精度の量子化重みとアダプタを持つという課題にも対処している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:49:35 GMT)
Analyzing School Shootings in the US with Statistical Learning [2.8] 1999年から2024年にかけて、約43件の散弾銃乱射があり、500件以上の散弾銃乱射があった。
学校銃乱射事件を調査した結果,ほとんどの場合,教室内で行われることが判明した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:35:21 GMT)
Exploring Semantic Clustering in Deep Reinforcement Learning for Video Games [2.8] セマンティッククラスタリング(セマンティッククラスタリング)とは、セマンティックな類似性に基づいて内部的にビデオ入力をグループ化するニューラルネットワークの本質的な能力を指す。
本稿では,特徴量削減とオンラインクラスタリングを兼ね備えたセマンティッククラスタリングモジュールを統合したDRLアーキテクチャを提案する。
ビデオゲームにおけるDRLにおける提案モジュールの有効性とセマンティッククラスタリング特性を検証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:54:41 GMT)
Exploring Semantic Clustering in Deep Reinforcement Learning for Video Games [2.8] セマンティッククラスタリング(セマンティッククラスタリング)とは、セマンティックな類似性に基づいて内部的にビデオ入力をグループ化するニューラルネットワークの本質的な能力を指す。
本稿では,特徴量削減とオンラインクラスタリングを兼ね備えたセマンティッククラスタリングモジュールを統合したDRLアーキテクチャを提案する。
ビデオゲームにおけるDRLにおける提案モジュールの有効性とセマンティッククラスタリング特性を検証する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:54:41 GMT)
The Extended UCB Policies for Frequentist Multi-armed Bandit Problems [2.7] 本稿では主に,重み付き報酬分布を持つ古典的MABモデルについて考察する。
先駆的な UCB 政策の延長である, 堅牢な UCB 政策を導入する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 04:57:45 GMT)
Integrating PETs into Software Applications: A Game-Based Learning Approach [2.7] PETs-101は、開発者がPETをソフトウェアに統合する動機となる新しいゲームベースの学習フレームワークである。
開発者のプライバシ保護ソフトウェア開発行動を改善することを目的としている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:15:46 GMT)
Recursive deep learning framework for forecasting the decadal world economic outlook [2.7] 我々は、世界経済のGDP成長率を10年にわたって予測する深層学習フレームワークを開発する。
先進国,開発途上国において,優れた深層学習モデルを検証し,従来の計量モデルと比較した。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 07:10:39 GMT)
Towards an Argument Pattern for the Use of Safety Performance Indicators [2.6] 自動運転製品の安全基準であるUL 4600は、安全性能指標(SPI)の使用を義務付けている。
標準および共用文献で利用可能な具体的なSPIの例は多数あるが、安全性を達成するための貢献の根拠は暗黙的に残されていることが多い。
我々はSPIを明示的に用いて暗黙の議論を行い、これに基づいて選択したSPIの信頼性を損なう可能性のある状況を分析する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 10:49:41 GMT)
Fair Ordering in Replicated Systems via Streaming Social Choice [2.5] 先行研究は、複製された状態マシンにおける「かなり」順序付けトランザクションの問題を研究する。
我々は、この問題は社会選択論のレンズを通して最もよく見られていると論じる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 02:58:56 GMT)
Decoding Hate: Exploring Language Models' Reactions to Hate Speech [2.4] 本稿では,7つの最先端の大規模言語モデルの音声を嫌う反応について検討する。
我々は、これらのモデルが生み出す反応のスペクトルを明らかにし、ヘイトスピーチ入力を処理する能力を明らかにする。
また,LLMによるヘイトスピーチ生成を緩和するための戦略についても論じる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:16:20 GMT)
Mechanic Maker: Accessible Game Development Via Symbolic Learning Program Synthesis [2.4] メカニックメーカー(Mechanic Maker)は、プログラミングなしで幅広いゲームメカニックを作成するためのツールである。
これは、ゲーム力学を例から合成するバックエンドのシンボリック学習システムに依存している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:58:28 GMT)
Effective Intrusion Detection for UAV Communications using Autoencoder-based Feature Extraction and Machine Learning Approach [2.4] 本稿では,実際のデータセットを用いた自動エンコーダによるUAVの機械学習侵入検出手法を提案する。
実験の結果,提案手法は二分法および多クラス分類タスクのベースラインよりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:44:23 GMT)
Using PT-symmetric Qubits to Break the Tradeoff Between Fidelity and the Degree of Quantum Entanglement [2.3] 新しいアプローチでは、マルチキュービットの絡み合いを効率的に作成でき、二部構造だけでなく三部構造の絡み合いも利用できる。
この新しいアプローチは、マルチキュービットの絡み合いを効率的に作成することができ、二部構造だけでなく三部構造も利用することができる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:56:34 GMT)
Vicious Classifiers: Assessing Inference-time Data Reconstruction Risk in Edge Computing [2.3] エッジコンピューティングにおけるプライバシ保護推論は、マシンラーニングサービスのユーザがプライベート入力でモデルをローカルに実行できるようにする。
本研究では,モデル出力のみを観測することで,悪質なサーバが入力データを再構成する方法について検討する。
予測時間復元リスクを評価するための新しい尺度を提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:18:41 GMT)
LASMP: Language Aided Subset Sampling Based Motion Planner [2.2] Language Aided Subset Sampling Based Motion Planner (LASMP)は、自然言語による動作計画を支援する。
LASMPはRapidly Exploring Random Tree (RRT) メソッドの修正版を使用している。
従来のRT法と比較して、LASMPは必要なノード数を55%削減し、ランダムなサンプルクエリを80%削減し、安全で衝突のないパスを生成する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:03:15 GMT)
Adaptive Motion Generation Using Uncertainty-Driven Foresight Prediction [2.2] 環境の不確実性は、現実のロボットタスクを実行する際には、長年、扱いにくい特徴だった。
本稿では,動的内部シミュレーションを用いたフォレスト予測を用いた既存の予測学習に基づくロボット制御手法を拡張した。
その結果,提案モデルではドアとの相互作用により動作が適応的に分岐し,従来の手法では安定に分岐しなかった。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:13:27 GMT)
LTLf Synthesis on First-Order Action Theories [2.2] Gologは非決定論的演算子を含む表現力のあるハイレベルエージェント言語である。
本稿では,非決定論の一部が環境の制御下にある,より現実的な事例について考察する。
成功した実現はプログラムを実行し、可能なすべての環境アクションの時間的目標を満たす。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:15:14 GMT)
A Novel Feature Extraction Model for the Detection of Plant Disease from Leaf Images in Low Computational Devices [2.2] 提案手法は,葉のイメージから頑健で識別可能な特徴を抽出するために,様々なタイプのディープラーニング技術を統合する。
このデータセットには、10種類のトマト病と1種類の健康な葉から1万枚の葉の写真が含まれています。
AlexNetの精度スコアは87%で、高速で軽量であり、組み込みシステムでの使用に適している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:32:45 GMT)
A Prompting-Based Representation Learning Method for Recommendation with Large Language Models [2.1] 本稿では,Recommender SystemsにおけるLarge Language Models(LLM)の言語能力を高めるために,Prompting-based Representation Learning Method for Recommendation(P4R)を紹介する。
P4Rフレームワークでは、パーソナライズされたアイテムプロファイルを作成するためにLSMプロンプト戦略を利用する。
評価では、P4Rと最先端のRecommenderモデルを比較し、プロンプトベースのプロファイル生成の品質を評価する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 04:45:04 GMT)
Arges: Spatio-Temporal Transformer for Ulcerative Colitis Severity Assessment in Endoscopy Videos [2.1] 専門家のMES/UCEISアノテーションは時間を要するため、ラター間のばらつきに影響を受けやすい。
エンド・ツー・エンド(e2e)トレーニングを備えたCNNベースの弱い教師付きモデルでは、新しい疾患スコアへの一般化が欠如している。
アルジェス(Arges)は、内視鏡で病気の重症度を推定するために位置エンコーディングを組み込んだ深層学習フレームワークである。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:23:14 GMT)
Generating Seamless Virtual Immunohistochemical Whole Slide Images with Content and Color Consistency [2.1] 免疫組織化学(IHC)染色は、病理医の医療画像解析において重要な役割を担い、様々な疾患の診断に重要な情報を提供する。
ヘマトキシリンとエオシン(H&E)を染色した全スライド画像(WSI)の仮想染色により、高価な物理的染色プロセスなしで他の有用なICC染色を自動生成することができる。
タイルワイズ処理に基づく現在の仮想WSI生成法は、タイル境界における内容、テクスチャ、色の不整合に悩まされることが多い。
GANモデルを拡張した新しい一貫したWSI合成ネットワークCC-WSI-Netを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:02:16 GMT)
Interactive Explainable Anomaly Detection for Industrial Settings [2.0] 我々は,ユーザインタラクションを通じてAIを改善するNearCAIPIインタラクションフレームワークを提案する。
また、NearCAIPIが人間のフィードバックを対話的なプロセスチェーンに統合する方法について説明する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 11:06:38 GMT)
Dynamic neurons: A statistical physics approach for analyzing deep neural networks [2.0] 我々は、ニューロンを相互作用の自由度として扱い、ディープニューラルネットワークの構造を単純化する。
翻訳対称性と再正規化群変換を利用することで、臨界現象を解析できる。
このアプローチは、統計物理学を用いてディープニューラルネットワークを研究するための新しい道を開くかもしれない。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:39:04 GMT)
MCGM: Mask Conditional Text-to-Image Generative Model [1.9] 条件付きマスクテキスト・画像生成モデル(MCGM)を提案する。
本モデルでは,複数の被写体を持つ単一画像を用いた新たなシーン生成において,Break-a-scene [1]モデルの成功に基づいて構築した。
この追加的なレベルの制御を導入することで、MCGMは1つの画像から学んだ1つ以上の被験者に対する特定のポーズを生成する、柔軟で直感的なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:13:47 GMT)
Individual mapping of large polymorphic shrubs in high mountains using satellite images and deep learning [1.7] 我々は、自由に利用可能な衛星画像について、個々の低木デラインの大規模なデータセットをリリースする。
我々は、すべてのジュニパーを、全生物圏保護区のツリーライン上にマッピングするために、インスタンスセグメンテーションモデルを使用します。
我々のモデルは、PIデータで87.87%、FWデータで76.86%の低木でF1スコアを達成した。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 08:25:14 GMT)
Learning Stochastic Dynamics from Snapshots through Regularized Unbalanced Optimal Transport [1.7] 少ない時間分解スナップショットからのサンプルを使用して動的に再構築することは、自然科学と機械学習の両方において重要な問題である。
本稿では、正規化された不均衡な最適輸送(RUOT)を解き、観察されたスナップショットから連続的な不均衡なダイナミクスを推定するための新しいディープラーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:25:03 GMT)
Optimizing Synthetic Data for Enhanced Pancreatic Tumor Segmentation [1.6] 本研究は膵腫瘍分節に対する既存の生成AIフレームワークの限界を批判的に評価する。
本研究は,合成テクストサイズとテクスト境界定義精度がモデル性能に与える影響について,一連の実験を行った。
以上の結果より,(1)合成腫瘍サイズの組み合わせを戦略的に選択することが最適セグメンテーションの結果にとって重要であること,(2)正確な境界を持つ合成腫瘍の生成がモデル精度を著しく向上すること,などが示唆された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:41:44 GMT)
Improved Generation of Synthetic Imaging Data Using Feature-Aligned Diffusion [1.6] その結果,SSIMの精度は9%向上し,SSIMの多様性は0.12向上した。
我々のアプローチは既存の手法と相乗効果があり、改良のために拡散訓練パイプラインに容易に統合できる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:18:09 GMT)
Removing the need for ground truth UWB data collection: self-supervised ranging error correction using deep reinforcement learning [1.4] マルチパス効果と非視界条件は、アンカーとタグの間の範囲エラーを引き起こす。
これらの範囲の誤差を緩和するための既存のアプローチは、大きなラベル付きデータセットの収集に依存している。
本稿では,ラベル付き真実データを必要としない自己教師付き深層強化学習手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 08:05:23 GMT)
Multimodal Coherent Explanation Generation of Robot Failures [1.4] 本稿では,異なるモーダルからの説明の論理的コヒーレンスをチェックすることによって,コヒーレントなマルチモーダルな説明を生成する手法を提案する。
実験により,テキストの包含を認識するために事前訓練されたニューラルネットワークの微調整が,コヒーレンス評価に有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:15:38 GMT)
AR-Sieve Bootstrap for the Random Forest and a simulation-based comparison with rangerts time series prediction [1.4] ランダムフォレスト(RF)アルゴリズムは、時系列予測を含む幅広い問題に適用できる。
RFと残りのブートストラップ技術の組み合わせを提案する。
ARSBはDGPを自己回帰過程と仮定する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:07:58 GMT)
Self-controller: Controlling LLMs with Multi-round Step-by-step Self-awareness [1.4] 自己制御(Self-controller)は、大規模言語モデルの論理に自己認識をもたらす新しいエージェントフレームワークである。
テキストの長さに関する実験は,自己制御器の制御性と有効性を示した。
DeepSeekのContext Caching技術は、会話のクラスタがコンテキストの同じプレフィックスを共有する場合、計算トークンの消費を大幅に削減する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:14:12 GMT)
A Low-Cost, High-Speed, and Robust Bin Picking System for Factory Automation Enabled by a Non-Stop, Multi-View, and Active Vision Scheme [1.4] 工場自動化におけるビンピッキングシステムは通常、金属オブジェクトのスパースでノイズの多い3Dデータによって引き起こされる問題に直面する。
動作タスクと多視点能動視覚スキームを「手持ちセンサ」構成で緊密に結合するビンピッキングシステムを設計した。
実験の結果,CPU上では 1.682秒 (最大) 以内で全体の検知が完了し, 抽出完了率は97.75%を超えることがわかった。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:57:07 GMT)
Model-independent variable selection via the rule-based variable priority [1.3] モデルに依存しない新しいアプローチである可変優先度(VarPro)を導入する。
VarProは、人工データを生成したり、予測エラーを評価することなく、ルールを活用する。
VarProはノイズ変数に対して一貫したフィルタリング特性を持つことを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 12:42:24 GMT)
Precise Workcell Sketching from Point Clouds Using an AR Toolbox [1.2] 実世界の3D空間をポイントクラウドとしてキャプチャすることは効率的で記述的だが、センサーエラーがあり、オブジェクトのパラメトリゼーションが欠如している。
Augmented Reality インタフェースを用いて,3次元ワークセルスケッチをポイントクラウドから作成することで,生のポイントクラウドを洗練することができる。
ツールボックスとAR対応ポインティングデバイスを利用することで、ユーザーは3次元空間におけるデバイスの位置に基づいてポイントクラウドの精度を高めることができる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:07:51 GMT)
Automating Semantic Analysis of System Assurance Cases using Goal-directed ASP [1.2] 本稿では, セマンティックルールに基づく分析機能を備えた Assurance 2.0 の拡張手法を提案する。
本稿では, 論理的整合性, 妥当性, 不整合性など, 保証事例のユニークな意味的側面について考察する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:39:49 GMT)
Automating Semantic Analysis of System Assurance Cases using Goal-directed ASP [1.2] 本稿では, セマンティックルールに基づく分析機能を備えた Assurance 2.0 の拡張手法を提案する。
本稿では, 論理的整合性, 妥当性, 不整合性など, 保証事例のユニークな意味的側面について考察する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:39:49 GMT)
Gradient-Free Training of Recurrent Neural Networks using Random Perturbations [1.2] リカレントニューラルネットワーク(RNN)は、チューリング完全性とシーケンシャルな処理能力のために、計算の潜在能力を秘めている。
時間によるバックプロパゲーション(BPTT)は、時間とともにRNNをアンロールすることでバックプロパゲーションアルゴリズムを拡張する。
BPTTは、前方と後方のフェーズをインターリーブし、正確な勾配情報を格納する必要があるなど、大きな欠点に悩まされている。
BPTTと競合するRNNにおける摂動学習に対する新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:33:09 GMT)
Task Success Prediction for Open-Vocabulary Manipulation Based on Multi-Level Aligned Representations [1.2] Contrastive $lambda$-Repformerを提案する。これは、画像と命令文を整列させることで、テーブルトップ操作タスクのタスク成功を予測する。
提案手法は,以下の3つの重要な特徴を多レベルアライメント表現に統合する。
Contrastive $lambda$-Repformerを,大規模標準データセット,RT-1データセット,物理ロボットプラットフォームに基づいて評価する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:35:34 GMT)
Exponential separation in quantum query complexity of the quantum switch with respect to simulations with standard quantum circuits [1.2] 2つの$n$-qubit量子チャネル上の量子スイッチの作用は、決定論的にシミュレートできないことを証明した。
これは、標準的な量子回路と比較して、不定因数順序の量子クエリ複雑性の指数関数的分離を示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:46:25 GMT)
Exponential separation in quantum query complexity of the quantum switch with respect to simulations with standard quantum circuits [1.2] 2つの$n$-qubit量子チャネル上の量子スイッチの作用は、決定論的にシミュレートできないことを証明した。
これは、不定因数順序によって提供される量子クエリの複雑さの指数関数的増大を示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:46:25 GMT)
WALINET: A water and lipid identification convolutional Neural Network for nuisance signal removal in 1H MR Spectroscopic Imaging [1.1] 全脳1H-MRSIの長年の問題は、代謝産物ピークと頭皮からの脂質シグナルのスペクトルオーバーラップである。
我々は脳1H-MRSIにおける水と脂質の除去のための改良Y-NETネットワークに基づく深層学習手法を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:37:55 GMT)
The horocycle regulator: exact cutoff-independence in AdS/CFT [1.1] テクストホロサイクルから構築した三次元反ド・ジッター空間で定義されるホログラフィック正則化スキームについて検討する。
このような情報尺度の幅広いクラスについて記述し、また、ホロサイクルレギュレータに双対する場の理論が本質的に非局所的であることを述べる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:00:00 GMT)
From Natural Language to SQL: Review of LLM-based Text-to-SQL Systems [1.1] この調査は、LLMベースのテキスト・ツー・スカルシステムの進化に関する包括的研究を提供する。
ベンチマーク、評価方法、評価指標について議論する。
効率性、モデルプライバシ、データプライバシといった重要な課題を、その開発と潜在的な領域の改善の観点から強調する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:46:25 GMT)
LinkThief: Combining Generalized Structure Knowledge with Node Similarity for Link Stealing Attack against GNN [1.1] LinkThiefは、一般化された構造知識とノード類似性を組み合わせた改善されたリンク盗難攻撃である。
本稿ではシャドウ・ターゲット・ブリッジグラフの作成とエッジサブグラフ構造の特徴の抽出について紹介する。
大規模な実験は理論解析の正しさを検証し、LinkThiefが余分な仮定なしでリンクを効果的に盗むことを示した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 05:34:03 GMT)
Clustering Three-Way Data with Outliers [1.0] 行列変量正規データを異常値でクラスタリングする手法について論じる。
このアプローチは、サブセットのログライクな分布を使い、OCLUSTアルゴリズムを拡張し、反復的なアプローチを使ってアウトレイラを検出しトリムする。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:08:52 GMT)
An EM Gradient Algorithm for Mixture Models with Components Derived from the Manly Transformation [1.0] 彼らのEMアルゴリズムは、MステップのNelder-Mead最適化を利用してスキューパラメータを更新する。
モデルパラメータの初期推定が良好である場合には,ニュートン法の一段階を用いて,別のEMアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:31:04 GMT)
Contrastive Representation Learning for Predicting Solar Flares from Extremely Imbalanced Multivariate Time Series Data [1.0] 太陽フレアは太陽の磁束の急激な急上昇であり、技術基盤に大きなリスクをもたらす。
本稿では,多変量時系列データに対する新しいコントラクティブ表現学習手法であるConTREXを紹介する。
提案手法は, 太陽フレア (SWAN-SF) 多変量時系列ベンチマークデータセットにおいて, 有望な太陽フレア予測結果を示すものである。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 01:20:47 GMT)
Advancing Spatio-temporal Storm Surge Prediction with Hierarchical Deep Neural Networks [1.0] 北アメリカの沿岸地域は、ハリケーンや非東海岸で発生した暴風雨による大きな脅威に直面している。
従来の数値モデルは正確ではあるが計算コストが高く、リアルタイム予測の実用性に限界がある。
本研究では,階層型ディープニューラルネットワーク(HDNN)と畳み込みオートエンコーダ(CAE)を組み合わせることで,嵐発生時系列を高精度かつ効率的に予測する手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:09:40 GMT)
Low-characteristic-impedance superconducting tadpole resonators in the sub-gigahertz regime [1.0] 共平面導波路の一端に短絡し、他方端に大きな平行平板コンデンサを配置し、簡易で多目的な共振器の設計を実証する。
これらのタドポール共振器は、チップのフットプリントを小さく保ちながら、低周波数・低文字インピーダンスを必要とするアプリケーションに適していると結論付けている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:11:25 GMT)
Characterizing Online Toxicity During the 2022 Mpox Outbreak: A Computational Analysis of Topical and Network Dynamics [1.0] 2022年のムポックスの流行は、当初は「モンキーポックス」と呼ばれていたが、その後、関連するスティグマや社会的懸念を緩和するために改名された。
我々は660万以上のユニークツイートを収集し、コンテキスト、範囲、コンテンツ、話者、意図といった5つの次元から分析しました。
我々は、Twitter上での有害なオンライン談話(46.6%)、病気(46.6%)、健康政策と医療(19.3%)、ホモフォビア(23.9%)、政治など、高レベルのトピックを5つ特定した。
有毒なコンテンツのリツイートが広まっていたのに対して、影響力のあるユーザはリツイートを通じてこの有毒な行為に関わったり、反対したりすることはめったにない。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:50:31 GMT)
Switching of post quench reflection asymmetry in an embedded non-Hermitian Su-Schrieffer-Heeger system [1.0] クエンチにより生じる輸送は, 左右の輸送の反射に不均衡があるという意味で非対称であることがわかった。
局所化とエネルギーの観点から,バルク状態の部分的再組織化の基本的な現象から生じる変化について論じる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 01:56:52 GMT)
Short vs. Long-term Coordination of Drones: When Distributed Optimization Meets Deep Reinforcement Learning [0.9] 自律型対話型ドローンの群れは、交通監視などスマートシティのアプリケーションに魅力的なセンシング機能を提供する。
本稿では,ドローン群による大規模時空間センシングにおけるタスク割り当て問題に焦点をあてる。
長期DRLと短期集団学習を統合した新しい相乗的最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:11:27 GMT)
Understanding the Human-LLM Dynamic: A Literature Survey of LLM Use in Programming Tasks [0.9] 大規模言語モデル(LLM)はプログラミングプラクティスを変革し、コード生成活動に重要な機能を提供する。
本稿では,LLMがプログラミングタスクに与える影響を評価するユーザスタディから洞察を得た上で,プログラミングタスクにおけるそれらの使用に焦点を当てる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:34:46 GMT)
Local control and mixed dimensions: Exploring high-temperature superconductivity in optical lattices [0.8] 局所制御と光二重層機能と空間分解測定を組み合わせることで、汎用ツールボックスを作成する。
本研究では,コヒーレントなペアリング相関が部分的に粒子-ホール変換および回転ベースでどのようにアクセス可能であるかを示す。
最後に, 運動量分解ドパント密度を計測し, 固体実験を補完する可観測物へのアクセスを提案する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 11:01:03 GMT)
Enhancing the analysis of murine neonatal ultrasonic vocalizations: Development, evaluation, and application of different mathematical models [0.8] ネズミは、社会コミュニケーションに幅広い超音波発声(USV)を使用する。
本稿では,USV分類のための異なるタイプのニューラルネットワークを初めて体系的に評価する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:18:54 GMT)
Descriptor: Face Detection Dataset for Programmable Threshold-Based Sparse-Vision [0.8] このデータセットは、Aff-Wild2で使用されるのと同じビデオから派生した顔検出タスクのための注釈付き、時間閾値ベースの視覚データセットである。
我々は,このリソースが時間差閾値に基づいて処理できるスマートセンサに基づく堅牢な視覚システムの開発を支援することを期待する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:42:03 GMT)
Closed-Form Interpretation of Neural Network Classifiers with Symbolic Gradients [0.8] 人工ニューラルネットワークにおいて、任意の単一ニューロンのクローズドフォーム解釈を見つけるための統一的なフレームワークを紹介します。
ニューラルネットワーク分類器を解釈して、決定境界に符号化された概念のクローズドフォーム表現を明らかにする。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 00:11:48 GMT)
Continual Learning in Medical Imaging: A Survey and Practical Analysis [0.8] 連続学習は、ニューラルネットワークにおける過去の学習を忘れずに、新しい知識のシーケンシャルな獲得を可能にするという約束を提供する。
医学領域における継続的な学習に関する最近の文献を概観し、最近の傾向を概説し、実際的な問題点を指摘する。
医療画像における継続的な学習の現状を批判的に論じる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 08:04:42 GMT)
Smoothed Energy Guidance: Guiding Diffusion Models with Reduced Energy Curvature of Attention [0.8] 条件付き拡散モデルは、視覚コンテンツ生成において顕著な成功を収めている。
非条件ガイダンスを拡張しようとする最近の試みはテクニックに依存しており、その結果、最適以下の生成品質が得られる。
Smoothed Energy Guidance (SEG) を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 01:04:58 GMT)
ViDAS: Vision-based Danger Assessment and Scoring [0.8] 本稿では,映像コンテンツの危険度定量化という課題に対処して,危険分析と評価の推進を目的とした新しいデータセットを提案する。
これは、様々なイベントを含む100のYouTubeビデオのコレクションをコンパイルすることで達成される。
各ビデオは、0(人間に危険はない)から10(命の危険)までの尺度で危険評価を行った人間の参加者によって注釈付けされる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:06:46 GMT)
Developments in Sheaf-Theoretic Models of Natural Language Ambiguities [0.7] シーブは位相空間を構成する基底と、その開集合に関連するデータからなる数学的対象である。
後者のモデルは、語彙的あいまいさからアナフォラから生じる言論的あいまいさまで拡張する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 09:54:00 GMT)
Efficient error and variance estimation for randomized matrix computations [0.7] 本稿では,ランダム化された低ランク近似のための残差誤差推定器と,ランダム化された行列の出力のばらつきを推定するためのジャックニフ再サンプリング法を提案する。
どちらの診断も、ランダム化SVDやランダム化Nystr"om近似のようなランダム化低ランク近似アルゴリズムの計算が高速である。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 22:19:14 GMT)
Enhancing Web Spam Detection through a Blockchain-Enabled Crowdsourcing Mechanism [0.7] 本稿では,スパム検出システムを強化するための新しいソリューションとして,ブロックチェーンによるインセンティブ付きクラウドソーシングを提案する。
ブロックチェーンの分散された透過的なフレームワークを活用して、データ収集とラベル付けのためのインセンティブメカニズムを作成します。
インセンティブ付きクラウドソーシングによってデータ品質が向上し、スパム検出のための機械学習モデルがより効果的になることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:53:42 GMT)
MobileMEF: Fast and Efficient Method for Multi-Exposure Fusion [0.6] 本稿では,エンコーダ・デコーダ深層学習アーキテクチャに基づくマルチ露光融合手法を提案する。
我々のモデルは、中距離スマートフォンで2秒未満で4K解像度画像を処理できる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:26:16 GMT)
KOLOMVERSE: Korea open large-scale image dataset for object detection in the maritime universe [0.6] KRISO による海洋領域における物体検出のための大規模画像データセット KOLOMVERSE を提案する。
韓国の21の領海から撮影した5,845時間の動画データを収集した。
データセットには3840$times$2160ピクセルのイメージがあり、私たちの知る限り、海洋ドメインにおけるオブジェクト検出のための公開データセットとしては、これまでで最大のものである。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:20:16 GMT)
Uncovering the Viral Nature of Toxicity in Competitive Online Video Games [0.5] フリー・ツー・プレイのアクションゲーム『Call of Duty: Warzone』のプロプライエタリなデータを分析した。
選手のチームメイトが有毒なスピーチを行う確率は、平均的な選手が有毒なスピーチを行う確率の26.1倍から30.3倍になる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:07:06 GMT)
Quantum-classical tradeoffs and multi-controlled quantum gate decompositions in variational algorithms [0.5] 短期量子コンピュータの計算能力は、ゲート演算のノイズの多い実行と物理量子ビットの限られた数によって制限される。
ハイブリッド変分アルゴリズムは、問題の解決に使用される量子資源と古典的リソースの間の幅広いトレードオフを可能にするため、短期量子デバイスに適している。
本稿では,特定のケースについて検討し,アルゴリズムレベルとハードウェアレベルの両方で利用可能なトレードオフについて検討する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:51:57 GMT)
Demonstration of strong coupling of a subradiant atom array to a cavity vacuum [0.4] 強い結合が励起スペクトルの劇的な変化をもたらすことを示す。
サブラジアントアレイからの線形散乱において有意な偏光回転を示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:19:01 GMT)
On the Maximum Distance Sublattice Problem and Closest Vector Problem [0.4] MDSP(Maximum Distance Sublattice Problem)を導入する。
格子の最も近いベクトル問題(CVP)のインスタンスを解く問題は、$mathcalL$の双対格子におけるMDSPのインスタンスを解くのと同じである。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:03:59 GMT)
Exploring Utility in a Real-World Warehouse Optimization Problem: Formulation Based on Quantum Annealers and Preliminary Results [0.4] 本稿では,D-Wave の量子アニーラを用いた暖房最適化問題に対する量子初期化機構を提案する。
このモジュールは、現実世界の産業問題の最適化に特化した既存の古典的ソフトウェアに組み込むように設計されている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:02:24 GMT)
Visual Acuity Prediction on Real-Life Patient Data Using a Machine Learning Based Multistage System [0.4] 視力(VA)の予測と実生活環境下での劣化の早期検出は、不均一データや不完全データにより困難である。
本稿では,ドイツの最大医療病院の眼科領域の異なるITシステムを融合した研究対応型データコーパスを開発するためのワークフローを提案する。
マクロ平均F1スコアの最終的な予測精度は、57.8と50 +-10.7%の眼科医と同じ範囲でありながら、69 %のマクロ平均F1スコアが得られる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:19:50 GMT)
Khattat: Enhancing Readability and Concept Representation of Semantic Typography [0.4] セマンティックタイポグラフィーは、アイデアを選択し、適切なフォントを選択し、創造性と可読性のバランスをとる。
このプロセスを自動化するエンドツーエンドシステムを導入します。
鍵となる機能はOCRベースの損失関数で、読みやすさを高め、複数の文字の同時スタイリングを可能にする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:42:48 GMT)
Easydiagnos: a framework for accurate feature selection for automatic diagnosis in smart healthcare [0.4] 本研究では,適応特徴評価器 (AFE) アルゴリズムを用いた革新的なアルゴリズムを提案する。
AFEは医療データセットの機能選択を改善し、問題を克服する。
その結果、スマートヘルスケアにおけるAFEの変革の可能性を強調し、パーソナライズされた透明な患者ケアを可能にした。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:28:56 GMT)
Mixing It Up: The Cocktail Effect of Multi-Task Fine-Tuning on LLM Performance -- A Case Study in Finance [0.3] 金融を含むドメイン固有の文脈における大規模言語モデル(LLM)の適用について検討する。
ターゲットタスクのみを微調整することが、必ずしも最も効果的な戦略であるとは限らない。
代わりに、マルチタスクの微調整はパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 22:35:56 GMT)
LITE: A Paradigm Shift in Multi-Object Tracking with Efficient ReID Feature Integration [0.3] マルチオブジェクト追跡(MOT)手法として,軽量な統合的追跡機能抽出パラダイムが導入された。
推論、前処理、後処理、ReIDモデルのトレーニングコストを削減して、ReIDベースのトラッカーを強化する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:26:15 GMT)
Deployed quantum link characterization via Bayesian ancilla-assisted process tomography [0.3] 我々はアンシラ支援プロセストモグラフィーとベイズ推定を利用して1.6kmの光ファイバーリンクを探査した。
一方の建物ではアリスから別の建物ではボブに偏光に絡み合った光子を送り、対応する量子チャネルを特徴づけるために局所量子ビットをアンシラ系として利用した。
24時間にわたるモニタリングでは、95.1(1)%の定常的なプロセス忠実度が返され、0.025-4.38 THzの帯域幅で制御可能なスペクトルフィルタリングでは、最初に増加し、帯域幅で水平化される。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:31:18 GMT)
Integrating Reasoning Systems for Trustworthy AI, Proceedings of the 4th Workshop on Logic and Practice of Programming (LPOP) [0.3] ワークショップはテキサス州ダラスで開催され、2024年10月13日に第40回論理プログラミング国際会議(ICLP)と共同で開催される。
このワークショップの焦点は、信頼できるAIのための推論システムを統合することだ。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 19:36:08 GMT)
PyRIT: A Framework for Security Risk Identification and Red Teaming in Generative AI System [0.3] PyRITは、GenAIシステムにおけるレッドチーム化の取り組みを強化するために設計されたオープンソースのフレームワークである。
レッドチームでは、マルチモーダル生成AIモデルにおいて、新しい害、リスク、ジェイルブレイクを探索し、特定することができる。
本稿では,PyRITの開発と機能,および実世界のシナリオにおける実践的応用について述べる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:00:59 GMT)
Skill Issues: An Analysis of CS:GO Skill Rating Systems [0.2] Elo、Glicko2、TrueSkillは代理モデリングのレンズを通して研究されている。
我々は、全体的な性能とデータ効率を考察し、Counter-Strike: Global Offensive Matchの大規模なデータセットに基づいて感度分析を行う。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 23:19:31 GMT)
Distributed Monitoring of Timed Properties [0.2] ランタイム監視は、あるプロパティを満たすかどうかをできるだけ早く決定するために、システムの実行を観察することで構成される。
我々は、到達性タイムドオートマトンとして与えられるプロパティについて、分散環境でのモニタリングを検討する。
本稿では,時間特性のオンラインモニタリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:46:59 GMT)
Quantum Amplitude Loading for Rainbow Options Pricing [0.2] 本稿では、価格空間への遷移を遅らせることにより効率を強調し、エンドツーエンドの量子回路の実装を提案する。
IBM QASMシミュレータの実験は、我々の量子価格モデルを検証する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 14:18:17 GMT)
Extending class group action attacks via sesquilinear pairings [0.2] これらのペアリングを用いて、向き付けられた常微分楕円曲線あるいは超特異楕円曲線の集合に対するクラス群作用に基づく問題の安全性を研究する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 02:13:48 GMT)
Entropy contraction of the Gibbs sampler under log-concavity [0.2] ランダムスキャンギブスサンプリング器は相対エントロピーで収縮し、関連する収縮率を鋭く評価する。
我々の手法は多用途であり、Metropolis-within-GibbsスキームやHit-and-Runアルゴリズムにまで拡張されている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:50:36 GMT)
Semantic Segmentation of Unmanned Aerial Vehicle Remote Sensing Images using SegFormer [0.1] 本稿では,UAV画像のセマンティックセグメンテーションのためのセマンティックセグメンテーションフレームワークであるSegFormerの有効性と効率を評価する。
SegFormerの変種は、リアルタイム(B0)から高性能(B5)モデルまで、セマンティックセグメンテーションタスクに適したUAVidデータセットを使用して評価される。
実験結果は、モデルの性能をベンチマークデータセットで示し、多様なUAVシナリオにおけるオブジェクトとランドカバーの特徴を正確に記述する能力を強調した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 21:40:15 GMT)
Visual Robustness Benchmark for Visual Question Answering (VQA) [0.1] 213,000枚の画像からなる最初の大規模ベンチマークを提案する。
複数のVQAモデルの視覚的堅牢性に挑戦し、現実的な視覚的腐敗の強さを評価する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:08:27 GMT)
Deep Multimodal Fusion for Semantic Segmentation of Remote Sensing Earth Observation Data [0.1] 本稿では,セマンティックセグメンテーションのための後期融合深層学習モデル(LF-DLM)を提案する。
1つのブランチは、UNetFormerがキャプチャした空中画像の詳細なテクスチャと、ViT(Multi-Axis Vision Transformer)バックボーンを統合する。
もう一方のブランチは、U-ViNet(U-TAE)を用いてSentinel-2衛星画像Max時系列から複雑な時間ダイナミクスをキャプチャする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:50:37 GMT)
Learning Personalized Treatment Decisions in Precision Medicine: Disentangling Treatment Assignment Bias in Counterfactual Outcome Prediction and Biomarker Identification [0.1] 本研究は,相互情報を用いた多種多様な治療課題バイアスをモデル化する。
経験的生物学的メカニズムを取り入れることで、実世界のデータの複雑さを反映したより現実的なベンチマークを作成する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:47:29 GMT)
What is the Role of Large Language Models in the Evolution of Astronomy Research? [0.0] ChatGPTや他の最先端の大規模言語モデル(LLM)は、急速に複数のフィールドを変換している。
これらのモデルは、一般に広大なデータセットに基づいて訓練され、人間のようなテキスト生成能力を示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:34:13 GMT)
What is the Role of Large Language Models in the Evolution of Astronomy Research? [0.0] ChatGPTや他の最先端の大規模言語モデル(LLM)は、急速に複数のフィールドを変換している。
これらのモデルは、一般に広大なデータセットに基づいて訓練され、人間のようなテキスト生成能力を示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:34:13 GMT)
Using Steganography and Watermarking For Medical Image Integrity [0.0] 医用画像はデジタル時代に沿っている。X線のような医療用画像は、もはやフィルムやフィルムで作られたものではありません。
医療画像は、相談や遠隔医療の理由から送信され、アーカイブされている。
デジタル医療画像の非常に小さなアーティファクトは、診断の作成や変更において重要な意味を持つ。
ウォーターマーキングとステガノグラフィーは、画像の認証、特に著作権の目的で使用される。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:03:42 GMT)
Using Interleaved Ensemble Unlearning to Keep Backdoors at Bay for Finetuning Vision Transformers [0.0] ビジョントランスフォーマー(ViT)はコンピュータビジョンタスクで人気を博している。
推論中のモデルで望ましくない振る舞いを引き起こすバックドア攻撃は、ViTのパフォーマンスを脅かす。
バックドアデータセット上でクリーンなViTを微調整するInterleaved Ensemble Unlearning(IEU)を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 23:33:59 GMT)
Unsupervised Concept Drift Detection based on Parallel Activations of Neural Network [0.0] 本研究では、トレーニングされていないニューラルネットワークの出力を利用する、教師なし並列アクティベーションドリフト検出器を提案する。
重要な設計要素、処理特性に関する直観、そして最先端の手法との競争性を実証するコンピュータ実験のプールを提示する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 07:04:55 GMT)
Towards Fairness and Privacy: A Novel Data Pre-processing Optimization Framework for Non-binary Protected Attributes [0.0] この研究は、(バイナリでない)保護属性を含むデータセットをデバイアスすることで公正に対処するためのフレームワークを提示している。
このフレームワークは、特定の識別基準を最小限に抑えるデータサブセットを見つけることで、この問題に対処する。
以前の作業とは対照的に、このフレームワークはメトリックとタスクに依存しないため、高い柔軟性を示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:17:43 GMT)
TikGuard: A Deep Learning Transformer-Based Solution for Detecting Unsuitable TikTok Content for Kids [0.0] 本稿では,TikGuardについて紹介する。TikGuardは,TikTokの子供に適さないコンテンツの検出とフラグ付けを目的とした,トランスフォーマーベースのディープラーニングアプローチである。
特別にキュレートされたデータセットであるTikHarmを使用し、高度なビデオ分類技術を活用することで、TikGuardは86.7%の精度を達成した。
直接比較はTikHarmデータセットのユニークさによって制限されているが、TikGuardのパフォーマンスはコンテンツモデレーションの強化の可能性を強調している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 05:00:05 GMT)
Thermalization of a flexible microwave stripline measured by a superconducting qubit [0.0] フレキシブルなマイクロ波ストリップラインは、クライオスタットを熱的に過負荷することなく、キャベリング密度を桁違いに高めるという微妙な視点を提供する。
我々は、超伝導量子回路を用いて、様々な温度で分布する60,$dBの減衰を積分して入力フレキシブルケーブルの熱化をテストする。
クビットの有効温度は26.4,$mKであり,従来の半剛性同軸ケーブルとほぼ同じである。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:26:49 GMT)
The role of non-classicality in mediated spatial quantum correlations [0.0] 非古典性の研究は、物理系の量子-古典的遷移を理解するために不可欠である。
本研究では、プローブ間の量子相関の増大と媒質の可観測物の非可換性の度合いを定量的に関連付ける新しい不等式を提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:07:04 GMT)
The quantum trajectory sensing problem and its solution [0.0] センサ状態の基準を単純化するグループ理論フレームワークを提案する。
これらの簡易な基準は、軌道センサ状態の一般的なファミリーをもたらす。
トラジェクトリセンシングと量子誤差補正のリンクを確立し、摂動を識別する共通の動機を認識する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:31:47 GMT)
The Use of Large Language Models (LLM) for Cyber Threat Intelligence (CTI) in Cybercrime Forums [0.0] 大規模言語モデル(LLM)は、サイバー犯罪フォーラムからサイバー脅威インテリジェンス(CTI)データを分析するために使用することができる。
本研究では,OpenAI GPT-3.5-turboモデル[8]上に構築したLCMシステムの性能評価を行い,CTI情報を抽出する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:41:22 GMT)
The Influence of Quantum Correlation on the Holonomy of Spatially-Structured Bi-Photons [0.0] 絡み合いパラメータは2つの異なる方法でホロノミーに影響を与えることが示されている。
一対のモードコンバータからなる光回路は実演を行う。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:29:49 GMT)
The Influence of Quantum Correlation on the Holonomy of Spatially-Structured Bi-Photons [0.0] 絡み合いパラメータは2つの異なる方法でホロノミーに影響を与えることが示されている。
一対のモードコンバータからなる光回路は実演を行う。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:29:49 GMT)
Testing quantum master equations for complete positivity: A direct approach [0.0] 我々は任意のマルコフ QME のリウヴィリアン行列とコサコフスキー行列の直接写像を確立する。
応用として、非コヒーレント光によって駆動される3レベルV系に対する量子光学的ブロッホ・レッドフィールドQMEの完全正則性を確立する。
提案手法により, 完全正のQMEを解くことなく試すことができ, コサコフスキー行列の非負の固有値のみを保持することにより完全正の正の復元が可能である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:51:13 GMT)
Tax Policy Handbook for Crypto Assets [0.0] Bitcoinやその他の暗号通貨資産の台頭は、人々が分散化されたネットワーク上で価値を交換し、伝達する方法の根本的な変化を示している。
このことは、政府や税務当局が、この革新的で革新的で、急進的な技術に対する政策対応を理解し、提供するために、規制と税政策の盲点を生み出している。
本稿では、暗号資産が機能する原理と、その基盤技術と、このエコシステム内で生じる税問題や課税可能な事象との関連について説明する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 09:26:28 GMT)
Targeted synthetic data generation for tabular data via hardness characterization [0.0] 本稿では,高価値な学習点のみを生成する新しい拡張パイプラインを提案する。
シミュレーションデータおよび大規模信用デフォルト予測タスクにおいて、最も困難な点で訓練された合成データ生成装置が、非ターゲットデータ拡張よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:54:26 GMT)
Sub-dimensional magnetic polarons in the one-hole doped SU(3) $t$-$J$ model [0.0] より高いSU(N)スピン対称性を持つ系では、よりリッチな磁気基底状態が各部位の1つの粒子の充填に現れる。
我々はSU(3)$t$-$J$モデルの1つの穴について検討した。
本研究では, 有限ドーピングにおける複雑な基底状態の出現を, 対角線に沿った創発的, 結合したルッティンガー液体によって示唆する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 11:12:48 GMT)
Statistical signatures of abstraction in deep neural networks [0.0] 我々は、ベンチマークデータセットに基づいてトレーニングされたDeep Belief Network(DBN)において、抽象表現がどのように現れるかを研究する。
表現は最大関連性の原理によって決定される普遍モデルに近づくことを示す。
また、プラスチック度は脳のそれと同じような深さで増加することも示しています。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 12:39:15 GMT)
Spatio-Spectral Quantum State Estimation of Photon Pairs from Optical Fiber Using Stimulated Emission [0.0] 我々は、光ファイバーで生成した光子対を、横モードおよび周波数自由度で特徴付ける。
この方法は、様々な光子対ソースプラットフォームの量子状態推定と最適化に有用である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 00:42:58 GMT)
Separation and Collapse of Equilibria Inequalities on AND-OR Trees without Shape Constraints [0.0] 本稿では,AND-OR木計算の最悪の入力に対して最小のコストであるゼロエラーランダム化複雑性について検討する。
指向性アルゴリズムは、ランダム化された複雑さを達成することが知られている。
任意のAND-OR木に対して、ランダム化深度優先アルゴリズムは、方向性アルゴリズムと同じ平衡を持つことを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 09:11:53 GMT)
SDC-HSDD-NDSA: Structure Detecting Cluster by Hierarchical Secondary Directed Differential with Normalized Density and Self-Adaption [0.0] 低密度領域で分離されたクラスタを検出するだけでなく、低密度領域で分離されていない高密度領域で構造を検出することができる。
このアルゴリズムは、その有効性、堅牢性、および粒度独立性を検証するために複数のデータセット上で実行されており、その結果、以前のデータセットが持たない能力があることが示されている。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 12:45:01 GMT)
RisingBALLER: A player is a token, a match is a sentence, A path towards a foundational model for football players data analytics [0.0] RisingBALLERは、フットボールの試合データに基づいてトレーニングされたトランスフォーマーモデルを利用して、マッチ固有のプレーヤー表現を学習する最初の公開アプローチである。
単純な機械学習モデル以上の、RisingBALLERは、プレーヤーのための高度な基礎的特徴を学習することによって、フットボールデータ分析を変換するように設計された包括的なフレームワークである。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:39:22 GMT)
Review of blockchain application with Graph Neural Networks, Graph Convolutional Networks and Convolutional Neural Networks [0.0] 本稿では、ブロックチェーン技術におけるグラフニューラルネットワーク(GNN)、グラフ畳み込みニューラルネットワーク(GCN)、および畳み込みニューラルネットワーク(CNN)の適用についてレビューする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:11:22 GMT)
Residual-$ZZ$-coupling suppression and fast two-qubit gate for Kerr-cat qubits based on level-degeneracy engineering [0.0] 大規模量子コンピュータの構築には、高いオンオフ比を持つビット間カップリング方式が必要となる。
周波数可変カプラを持つ2つのKerr-cat量子ビットに対する$Z$-couplingスキームを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:26:07 GMT)
Representation of Classical Data on Quantum Computers [0.0] 量子コンピューティングシステムに使用されるデータを表現することは必須である。
本報告では,ゲート型量子コンピュータ上でのこれらのデータ型表現方法の概要について述べる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:33:28 GMT)
Quantum schoolbook multiplication with fewer Toffoli gates [0.0] 制御されたnビットの加算回路は、制御キュービットが1のときに加算し、0のときに減算する。
スクールブックの乗算は、小さなレジスタサイズに対して最も低いトフォリ数をもたらす。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:39:24 GMT)
Pulse shape optimization against Doppler shifts and delays in optical quantum communication [0.0] 量子鍵分布プロトコルの特定の場合における系統的およびドップラーシフトと遅延の影響を解析する。
量子ネットワークインフラストラクチャのレジリエンス設計において,パルス形状の最適化がビルディングブロックとなることが判明した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:39:02 GMT)
Provably Secure Commitment-based Protocols over Unauthenticated Channels [0.0] 我々は、認証された交換のための既存のモデルと必ずしも一致しない可能性のあるプロトコルをカバーするための理論的なセキュリティフレームワークを構築している。
本稿では,両当事者間の共通秘密を確立するためのコミットベースのプロトコルをいくつか提案し,その非認証チャネルに対する抵抗性について検討する。
これは、プロトコル自体のセキュリティの堅牢性、およびMan-in-the-Middle攻撃に対する堅牢性を分析することを意味する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:41:38 GMT)
Protected Fluxonium Control with Sub-harmonic Parametric Driving [0.0] 制御チャネルを通した量子ビット崩壊を除去する超伝導フラクソニウム量子ビットの新しい制御方式を示す。
フラックスラインにローパスフィルタを加えることで、フラックスバイアスが可能となり、同時にフラックスロニウム量子ビットをコヒーレントに制御することができる。
我々は、最大11光子サブハーモニックドライブによるコヒーレント制御を実証し、フラキソニウムポテンシャルの強い非線形性を強調した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:27:19 GMT)
Preparing Ground and Excited States Using Adiabatic CoVaR [0.0] CoVarince Root find with classical shadows (CoVaR) は、変分量子回路のトレーニングのための新しいパラダイムとして最近導入された。
対象ハミルトニアンの断熱モーフィングを導入し,初期温暖開始が分かっていない場合,CoVaRがターゲットハミルトニアンの固有状態の調製に成功できることを実証した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:24:55 GMT)
Pose Estimation of Buried Deep-Sea Objects using 3D Vision Deep Learning Models [0.0] 本研究では,南カリフォルニアサンペドロ盆地の海底で発見された土砂場樽のポーズと埋没率の推定手法を提案する。
本研究では,バレル点雲から埋設したバレルの6-DOFポーズと半径を入力として推定するためのバレルネットを提案する。
我々は, 合成したバレル点雲を用いてバレルネットを訓練し, 遠隔操作車(ROV)ビデオ映像を用いて, 提案手法の可能性を定性的に実証した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:43:20 GMT)
Path distributions for describing eigenstates of orbital angular momentum [0.0] 分布は、任意の固有状態への経路がどのように寄与するかの尺度を提供する。
結果として得られた記述は、軌道角運動量を記述するためによく知られた「ベクトルモデル」を置き換えるものである。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 09:50:01 GMT)
Optimizing and Evaluating Enterprise Retrieval-Augmented Generation (RAG): A Content Design Perspective [0.0] Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を使用して顧客支援の質問応答ソリューションを構築するための一般的なテクニックである。
本稿では,モジュール性とモデルに依存しないソリューション戦略に焦点を当てる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 03:54:45 GMT)
Optimizing Photoplethysmography-Based Sleep Staging Models by Leveraging Temporal Context for Wearable Devices Applications [0.0] 最先端の睡眠ステージング手法では、長期間の連続的な信号取得が必要であり、高エネルギー消費のためウェアラブルデバイスでは実用的ではない。
本研究では,トップパフォーマンスの最先端手法に基づく適応型睡眠ステージングモデルを提案し,その性能を異なるセグメントサイズで評価する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:47:42 GMT)
Optimization of Actuarial Neural Networks with Response Surface Methodology [0.0] 本研究では,CANNの性能を最適化するために因子設計および応答面法(RSM)を用いる。
統計的に重要でないハイパーパラメーターを減らし,288から188に減らした。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:45:41 GMT)
Operator system characterizations of SIC-POVMs and mutually unbiased bases [0.0] 対称情報完全正作用素値測度が与えられた次元$d$と、ある順序理論条件を満たす$d2$次元作用素系が存在する場合にのみ存在することを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 23:02:25 GMT)
On the thermodynamic limit of two-times measurement entropy production [0.0] 2回の計測でエントロピー生成のモジュラー式を熱力学的限界によって正当化する。
すべての熱貯水池が(離散的な)量子スピン系か自由フェルミ気体である開放量子系の場合を考える。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 10:08:41 GMT)
On the Interaction of Adaptive Population Control with Cumulative Step-Size Adaptation [0.0] 累積ステップサイズ適応進化戦略$(mu/mu_I, lambda)$-CSA-ESについて3つの適応型集団制御戦略について検討した。
3つのPCSがCSA-ESに沿って実装され、球面、ランダム、ラストリギン関数のテストベッドで研究される。
CSA適応特性はPCSの性能に大きく影響した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:28:39 GMT)
On the Counting of Involutory MDS Matrices [0.0] 本稿では、アダマール MDS およびインボリュートリー アダマール MDS 行列を、フィールド$mathbbF_2r$ で 4$ で列挙する。
また、アダマール-MDS (NMDS) とインボリュートリーのアダマール NMDS 行列は各行にちょうど1つの零点を持ち、それぞれ 4$$$mathbbF_2r$ である。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 06:08:45 GMT)
Nonlinearity-assisted advantage for charger-supported open quantum batteries [0.0] エネルギー貯蔵およびエネルギー抽出の観点から量子電池の性能を解析する。
本稿では,電池と充電器の結合における非線形性と,非調和振動子を含む充電器自体の2種類の非線形性について考察する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 12:04:19 GMT)
Neural Term Structure of Additive Process for Option Pricing [0.0] 加法過程は、時相増分という仮定を緩和することにより、L'evy過程を一般化する。
加法モデルの校正の課題は、時間依存のパラメータ化から生じる。
本稿では,この用語構造を表現するために,フィードフォワードニューラルネットワークを利用するニューラルネットワークモデルを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:15:31 GMT)
Mumax3-cQED: an extension of Mumax3 to simulate magnon-photon interactions in cavity QED [0.0] 現実的な磁性材料やナノ構造におけるマグノン偏光子をシミュレートするために,よく知られたマイクロ磁気パッケージ Mumax3 の拡張を提案する。
Mumax3-cQEDは、標準スピンスピン相互作用と磁気モーメントの外部空間および時間依存磁場への結合をモデル化するために、Mumax3のGPU加速機能を利用する。
ハイブリッドマグノン光状態は非平衡力学と平衡へのアプローチと同様に計算可能であることを示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:00:03 GMT)
Multipartite entanglement in a Josephson Junction Laser [0.0] モデルジョセフソンフォトニクスシステムにおいて,dc電圧バイアス結合が空洞モードの集合を結合し,電子レンジ光子で集束するエンタングルメントを解析する。
システム内のモードは、与えられたブロック内のモード間での双方向の絡み合いによって、一連のブロックに該当することがわかった。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:50:05 GMT)
Multi-site gates for state preparation in quantum simulation of the Bose Hubbard Model [0.0] 容易に構築された積状態からBose-Hubbardモデルの超流動基底状態への近似に変換する多地点ゲート列を構築した。
写像は1次元のハードコア極限において完全であり、1次元と2次元の非相互作用粒子に対しては正確である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:01:23 GMT)
More Skin, More Likes! Measuring Child Exposure and User Engagement on TikTok [0.0] 子どものTikTok曝露に関する研究
子どもをフィーチャーした115のユーザーアカウントから5,896本のビデオに対する432,178件のコメントを分析した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:12:55 GMT)
Molecular Ground State Simulation by Subspace Restriction and Hund's Rule [0.0] Hundの規則により生成され,分子的乗法に基づいて選択される新しい部分空間であるMultiplicity Subspace (MH)を導入し,検証する。
実験データと数学的証明により,MH部分空間は古典的マルチプライシティ部分空間や粒子保存部分空間に比べて量子ビット使用率を著しく低下させることが示された。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 04:37:19 GMT)
Modeling and Prediction of the UEFA EURO 2024 via Combined Statistical Learning Approaches [0.0] 基本的に異なる3つの機械学習モデルを組み合わせて、UEFA EURO 2024を予測するための新しいジョイントモデルを作成する。
この目的のために、このトーナメントは、全ての試合で予想されるゴール数に基づいて、100,000回シミュレートされる。
フランスは19.2%、イギリスは16.7%、ドイツは13.7%である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:48:16 GMT)
Measuring and Mitigating Bias for Tabular Datasets with Multiple Protected Attributes [0.0] 我々は、国籍、年齢、性別など、複数の保護された属性を含むデータセットに焦点を当てる。
新たな差別措置が導入され、研究者や実践者が基礎となるデータセットの公平性を評価するための適切な手段を選択する。
既存のバイアス緩和法であるFairDoの新たな応用について述べる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 17:39:02 GMT)
Machine Learning Classification of Peaceful Countries: A Comparative Analysis and Dataset Optimization [0.0] 本稿では,グローバルメディア記事から抽出した言語パターンを用いて,各国を平和的・非平和的に分類する機械学習手法を提案する。
我々は,平和な国を効果的に識別する教師付き分類モデルを開発するために,ベクトル埋め込みとコサイン類似性を用いている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:28:03 GMT)
Local-to-Global Self-Supervised Representation Learning for Diabetic Retinopathy Grading [0.0] 本研究では,自己指導型学習と知識蒸留を用いた新しいハイブリッド学習モデルを提案する。
我々のアルゴリズムでは、自己教師型学習および知識蒸留モデルの中で初めて、テストデータセットがトレーニングデータセットよりも50%大きい。
類似の最先端モデルと比較すると,より高精度で効率的な表現空間が得られた。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:19:16 GMT)
Kinetic magnetism and stripe order in the doped AFM bosonic ${t-J}$ model [0.0] ドープボソン量子磁石の強い結合限界、特に反強磁性(AFM)ボソン$t-J$モデルについて検討する。
その結果,低ドーピング系では,高T_c$銅酸化物で観測されるものと同様,ボソニック孔が部分的に充填されたストライプを形成する傾向にあることがわかった。
我々の発見は、強い相関の量子物質における粒子統計学の役割に光を当て、2Dフェルミ・ハッバードと$t-J$モデルの相に接続する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:50:10 GMT)
Itinerant magnetism in Hubbard models with long-range interactions [0.0] 半導体量子ドットアレイからモー材料まで、様々なプラットフォームが最近、強力な量子シミュレータとして登場した。
長次元格子を含むハバードモデルの効果について検討する。
小さな電子ドーピングでは、多種多様な磁性秩序の数値状態が発見される。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:00:00 GMT)
Iteration of Thought: Leveraging Inner Dialogue for Autonomous Large Language Model Reasoning [0.0] 反復的人間のエンゲージメントは、大規模言語モデル(LLM)の高度な言語処理能力を活用するための一般的かつ効果的な手段である。
思考の反復(IoT)フレームワークを提案する。
静的アプローチや半静的アプローチとは異なり、IoTは進化するコンテキストに基づいて推論パスを動的に適応する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:50:25 GMT)
Iteration of Thought: Leveraging Inner Dialogue for Autonomous Large Language Model Reasoning [0.0] 反復的人間のエンゲージメントは、大規模言語モデル(LLM)の高度な言語処理能力を活用するための一般的かつ効果的な手段である。
思考の反復(IoT)フレームワークを提案する。
静的アプローチや半静的アプローチとは異なり、IoTは進化するコンテキストに基づいて推論パスを動的に適応する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:50:25 GMT)
Information processing at the speed of light [0.0] 量子フォトニックチップの導入は、スケーラビリティ、安定性、費用対効果を特徴とする時代を背景としている。
本稿では、光子の情報を符号化するといった重要な側面をカバーする、フォトニック量子コンピューティングを包括的に探求する。
このレビューはさらに、スケーラブルでフォールトトレラントなフォトニック量子コンピュータの確立に向けた道筋をたどっている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:43:44 GMT)
Inclusive ASR for Disfluent Speech: Cascaded Large-Scale Self-Supervised Learning with Targeted Fine-Tuning and Data Augmentation [0.0] 進歩への重要な障壁は、大きな注釈付き不適切な音声データセットの不足である。
本稿では,標準音声における自己教師型学習を応用した包括的ASR設計手法を提案する。
結果から,比較的小さなラベル付きデータセットによる微調整wav2vec 2.0とデータ拡張による単語誤り率の低減効果が示唆された。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 21:13:39 GMT)
Hyperbolic lattices and two-dimensional Yang-Mills theory [0.0] 双曲格子は、回路量子力学と電気回路網でエミュレートされた新しいタイプの合成量子物質である。
双曲型強結合モデルの状態密度のモーメントは、量子ゲージ理論におけるウィルソンループの期待値と一致することを示す。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:36:56 GMT)
High-performance conditional-driving gate for Kerr parametric oscillator qubits [0.0] ゲート動作のフラックスパルスによるAC-Zeemanシフトがゲート性能に大きく影響を与えることを示す。
この望ましくない効果を解消する手法を提案する。
提案手法を使わずに,平均忠実度が99.9$%を超える条件付き運転ゲートを数値的に示す。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:58:52 GMT)
H-DES: a Quantum-Classical Hybrid Differential Equation Solver [0.0] 本稿では、微分方程式の系を解くための独自のハイブリッド量子古典アルゴリズムを提案する。
このアルゴリズムは、異なるパラメタライズド回路によって生成される量子状態の振幅における解関数を符号化するスペクトル法に依存している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 23:47:41 GMT)
Foregrounding Artist Opinions: A Survey Study on Transparency, Ownership, and Fairness in AI Generative Art [0.0] 生成AIツールは、アートのようなアウトプットを作成し、時には創造的なプロセスを支援するために使用される。
我々は459人のアーティストを調査し、ジェネレーティブAIアートの潜在的有用性と害に関するアーティストの意見の緊張関係を調査した。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 12:47:47 GMT)
FELRec: Efficient Handling of Item Cold-Start With Dynamic Representation Learning in Recommender Systems [0.0] 本稿では、ユーザとアイテムの既存の表現を洗練する大規模な埋め込みネットワークであるFELRecを紹介する。
類似のアプローチとは対照的に、我々のモデルはサイド情報や時間を要する微調整を伴わない新しいユーザやアイテムを表現している。
提案したモデルは、ゼロショット設定でこれまで見られなかったデータセットをうまく一般化する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 14:39:12 GMT)
FCE-YOLOv8: YOLOv8 with Feature Context Excitation Modules for Fracture Detection in Pediatric Wrist X-ray Images [0.0] この作業では4種類のFeature Contexts Excitation-YOLOv8モデルを導入し、それぞれ異なるFCEモジュールを組み込んだ。
GRAZPEDWRI-DXデータセットの実験結果から,提案したYOLOv8+GC-M3モデルにより,mAP@50値が65.78%から66.32%に向上することが示された。
提案した YOLOv8+SE-M3 モデルは,最大 mAP@50 値67.07% を実現し,SOTA 性能を上回った。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:45:01 GMT)
Extending the Q-score to an Application-level Quantum Metric Framework [0.0] 量子デバイスの性能を評価することは、量子デバイスをスケールし、最終的に実際に使用するための重要なステップである。
顕著な量子計量は、アトスのQスコア計量によって与えられる。
Qスコアは、異なる問題、ユーザ設定、ソルバを使用したベンチマークを可能にする量子メトリクスのフレームワークを定義する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 12:03:36 GMT)
Exploring the Limits of Fine-grained LLM-based Physics Inference via Premise Removal Interventions [0.0] 言語モデル(LM)は複雑な数学的推論を行う際に幻覚を与える。
物理的な文脈では、記号的な操作は複雑な意味論を満たすことが要求される。
この設定では、LMsの数学的推論は物理学的インフォームドされていない。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 06:17:52 GMT)
Exploring entanglement in finite-size quantum systems with degenerate ground state [0.0] 我々は、正確なあるいはほぼ退化した基底状態を持つスピン系における非局所量子相関を特徴づけるためのアプローチを開発する。
それらのランダムな線型結合の有限集合をハール測度と共に生成し、これらの結合が初期固有状態によって広がる空間に均一に分散されることを保証する。
多数の退化固有状態の単発計測に基づく観測値の推定問題について詳述する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:56:34 GMT)
Explainable Multi-Stakeholder Job Recommender Systems [0.0] 新しい法律は、プライバシ、公正性、レコメンダシステムとAI全体の説明可能性といった側面に焦点を当てている。
これらのシステムは、求職者、採用者、企業によって同時に使用されるため、マルチステークホルダーアプローチが必要である。
説明可能なマルチステークホルダー求人システムに関する現在の研究を要約し、今後の研究の方向性を概説する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:12:30 GMT)
Enhancing the ODMR Signal of Organic Molecular Qubits [0.0] 量子情報科学とセンシングでは、電子スピンは光学-スピン界面を通じて特定の偏光に精製されることが多い。
ダイヤモンド-NVセンターと遷移金属はどちらも、これらのいわゆるカラーセンターの優れたプラットフォームである。
このような有機性高スピンの$pi$-diradicalsを設計するための初期の試みでは、一重項として$M_S=pm1$の集団をシェルビングすることでスピン分極することを提案した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:37:49 GMT)
Enhancing the ODMR Signal of Organic Molecular Qubits [0.0] 量子情報科学とセンシングでは、電子スピンは光学-スピン界面を通じて特定の偏光に精製されることが多い。
ダイヤモンド-NVセンターと遷移金属はどちらも、これらのいわゆるカラーセンターの優れたプラットフォームである。
このような有機性高スピンの$pi$-diradicalsを設計するための初期の試みでは、一重項として$M_S=pm1$の集団をシェルビングすることでスピン分極することを提案した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 18:37:49 GMT)
Enhancing Solution Efficiency in Reinforcement Learning: Leveraging Sub-GFlowNet and Entropy Integration [0.0] GFlowNetは複雑なシステムの力学をモデル化し、多種多様な高速軌道を生成する。
本稿では,新たな損失関数を導入し,学習目標を改良することにより,GFlowNetの改良を提案する。
我々は,超グリッド実験と分子合成タスクによる実験結果により,従来の手法よりも改良されたGFlowNetの優位性を実証した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:37:10 GMT)
Enhancing Image Classification in Small and Unbalanced Datasets through Synthetic Data Augmentation [0.0] 本稿では,クラス固有変分オートエンコーダ(VAE)と潜在空間を用いた,識別能力向上のための新しい合成拡張戦略を提案する。
特徴空間ギャップを埋めるリアルで多様な合成データを生成することにより、データの不足とクラス不均衡の問題に対処する。
提案手法は,エゾファゴガストロデュオ内視鏡画像の清潔度を自動評価する方法を訓練し,検証するために作成した321枚の画像の小さなデータセットで検証した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:08:24 GMT)
Enhancing GANs with Contrastive Learning-Based Multistage Progressive Finetuning SNN and RL-Based External Optimization [0.0] がん研究、特に早期診断、症例理解、治療戦略設計における深い学習。
生成AI、特にGAN(Generative Adversarial Networks)が主要なソリューションとして登場した。
GANは、組織学的データに固有の、いくつかの課題に直面している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:14:32 GMT)
Efficient Technical Term Translation: A Knowledge Distillation Approach for Parenthetical Terminology Translation [0.0] 本稿では,専門分野におけるコミュニケーションの明確化に不可欠である専門用語を正確に翻訳することの課題に対処する。
本研究は, ペアレンテティカル・ターミノロジー・トランスフォーメーション (PTT) タスクを導入し, ペアレンテティカル・ターミノロジー・トランスフォーメーション(PTT)タスクの翻訳とともに, ペアレンテティカル・ターミノロジー・トランスフォーメーション(Parenthetical Terminology Translation, PTT)タスクを導入した。
そこで我々は,単語の全体的な翻訳精度と正しい括弧表現の両方を評価するための新しい評価指標を開発した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:40:28 GMT)
Effects of Systematic Error on Quantum-Enhanced Atom Interferometry [0.0] 本研究では,量子化原子干渉計における系統的状態準備誤差が検知性能に及ぼす影響を説明するためのフレームワークを開発する。
2軸ツイスト(TAT)、1軸ツイスト(OAT)、ツイスト・アンド・ターン(TNT)状態の準備スキームについて、スピンスキーズと非ガウス状態の両方の文脈でこれを行う。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 02:36:08 GMT)
Effect of trap imperfections on the density of a quasi-two-dimensional uniform dipolar quantum Bose gas [0.0] 準二次元双極性ボース気体の密度に及ぼす平面電位の弱い静摂動の影響について検討する。
まず, 空間周波数における正弦波電位摂動について検討した。
次に、与えられた運動量範囲の静的ホワイトノイズスペクトルによって特徴づけられるポテンシャル摂動について検討する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 21:00:14 GMT)
Early Detection of Coronary Heart Disease Using Hybrid Quantum Machine Learning Approach [0.0] 冠動脈疾患(CHD)は重症心疾患であり,早期診断が不可欠である。
量子コンピューティングと機械学習(ML)技術の主流となる開発は、CHD診断の性能に実用的な改善をもたらす可能性がある。
医療業界における量子的な飛躍は、処理能力を高め、複数のモデルを最適化する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:21:05 GMT)
ERASMO: Leveraging Large Language Models for Enhanced Clustering Segmentation [0.0] クラスタ分析は、マーケティングにおける顧客セグメンテーションなど、さまざまなドメインやアプリケーションにおいて重要な役割を果たす。
本研究では,テキストエンコードされたデータに基づいて事前学習した言語モデルを微調整するフレームワークであるERASMOを紹介する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 00:37:16 GMT)
ECORS: An Ensembled Clustering Approach to Eradicate The Local And Global Outlier In Collaborative Filtering Recommender System [0.0] 外乱検知は レコメンデーターシステムにおける 重要な研究領域です
様々なクラスタリングアルゴリズムを用いて,これらの課題に対処する手法を提案する。
実験の結果,提案手法はリコメンデータシステムにおける異常検出の精度を大幅に向上させることが示された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 05:06:07 GMT)
Divide And Conquer: Learning Chaotic Dynamical Systems With Multistep Penalty Neural Ordinary Differential Equations [0.0] 多段階ペナルティ・ヌードは, 倉本・シヴァシュ・コリンスキー方程式, 2次元コルモゴロフ流, ERA5再解析データなどのカオスシステムに適用される。
計算コストを著しく低減したカオスシステムに対してMPODEが実行可能な性能を提供することが観察された。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 15:19:42 GMT)
Distributed Quantum Computing: Applications and Challenges [0.0] 分散量子コンピューティングは、個々の量子コンピュータのリンクを通じて量子コンピュータをスケールすることを目的としている。
本研究は,本技術について,ユースケースと実装上の考察の両方を考慮して,アプリケーションレベルで概観することを目的とする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:55:04 GMT)
Dissipative phase transition: from qubits to qudits [0.0] 量子多体系における散逸相転移の運命を、個々の成分がキュービットではなくキューディットであるときに検討する。
キュービットの代わりにキュービットを考えると、オープン多体系におけるリッチ位相図へのアクセスに関する新たな視点が開かれる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 18:54:26 GMT)
Disentangling collective coupling in vibrational polaritons with double quantum coherence spectroscopy [0.0] 振動分極は、光学キャビティにおける分子振動と光子モードの強い結合によって形成される。
分子振動分極の2次元赤外スペクトルを二重量子コヒーレンス法によりシミュレートする。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:24:40 GMT)
Detección Automática de Patologías en Notas Clínicas en Español Combinando Modelos de Lenguaje y Ontologías Médicos [0.0] 当科では,患者が皮膚病理疾患を患う場合,第1の予約又はフォローアップ医療報告を予測するために,医療と組み合わせた大きな言語を用いている。
その結果, モデルに体型, 重症度, 位置を学習させることで, 精度が有意に向上することが示唆された。
本論文では,医療用テキストの精度0.84,マイクロF1スコア0.82,マクロF1スコア0.75の分類における最先端結果の実証について述べる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 12:03:04 GMT)
DeepAerialMapper: Deep Learning-based Semi-automatic HD Map Creation for Highly Automated Vehicles [0.0] 高解像度空中画像からHDマップを作成するための半自動手法を提案する。
提案手法では, ニューラルネットワークを訓練して, 空中画像をHDマップに関連するクラスに意味的に分割する。
マップをLanelet2フォーマットにエクスポートすることで、さまざまなユースケースを簡単に拡張できる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:05:05 GMT)
Deep Adversarial Learning with Activity-Based User Discrimination Task for Human Activity Recognition [0.0] 本稿では,人間行動認識問題に対する新たな逆深層学習フレームワークを提案する。
本フレームワークは,個人間の変動に対処する,行動に基づく新たな識別タスクを取り入れている。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 11:58:33 GMT)
Deceptive Risks in LLM-enhanced Robots [0.0] 本稿では,Large Language Models (LLMs) の社会ロボットへの統合における重要な欠陥について検討する。
LLMは、薬物摂取の通知の設定など、誤ってリマインダー機能を有すると主張した。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 06:33:40 GMT)
DRIM: Learning Disentangled Representations from Incomplete Multimodal Healthcare Data [0.0] 実生活の医療データは、しばしばマルチモーダルで不完全であり、高度なディープラーニングモデルの必要性を助長する。
データ疎性にもかかわらず、共有表現とユニークな表現をキャプチャする新しい方法であるDRIMを紹介する。
本手法はグリオーマ患者の生存予測タスクにおける最先端のアルゴリズムよりも優れており,モダリティの欠如に対して頑健である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 15:47:14 GMT)
Cubic power functions with optimal second-order differential uniformity [0.0] d=22k+2k+1$ と $gcd(k,n)=1$ が最適二階微分均一性を持つことを証明する。
アフィン同値性において、これらは唯一の最適な立方的パワー関数である。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 09:46:02 GMT)
Cross-Camera Data Association via GNN for Supervised Graph Clustering [0.0] クロスカメラデータアソシエーションは、マルチカメラコンピュータビジョン分野の基盤の1つである。
ノードは全カメラが捕捉するインスタンスであるアフィニティグラフの教師付きクラスタリングを提案する。
我々はGNN(Graph Neural Network)アーキテクチャの利点を活用し、ノードの関係を調べ、代表的エッジ埋め込みを生成する。
提案手法は,SGC-CCAと命名され,すべてのクラスタリング指標において,GNN-CCAという最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 12:52:54 GMT)
Constrained Hamiltonian dynamics for electrons in magnetic field and additional forces besides the Lorentz force acting on electrons [0.0] 量子力学から生じる制約や条件を含む磁場中の電子に作用する力を考察する。
ローレンツ力以外の重要な力として、電子速度場運動エネルギーの勾配、化学ポテンシャルの勾配、位相的に保護されたループ電流を生成する力などが存在することが示されている。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 04:10:52 GMT)
CompassDock: Comprehensive Accurate Assessment Approach for Deep Learning-Based Molecular Docking in Inference and Fine-Tuning [0.0] PDBBindデータセットの物理・化学的・生物活性特性を包括的に分析した。
Compassは、結合親和性エネルギーを計算するための新しい経験的スコア機能であるPoseCheckとAA-Scoreを統合している。
Compassには最先端のディープラーニングベースの分子ドッキング手法が組み込まれている。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 11:14:40 GMT)
Classifying Peace in Global Media Using RAG and Intergroup Reciprocity [0.0] 本稿では,RaGモデルとPIR/NIR(Positive and Negative Intergroup Reciprocity)の概念を用いて,グローバルメディアにおける平和の洞察を識別するための新しいアプローチを提案する。
PIRとNIRの定義を精査することにより、メディア記事に表されるグループ間関係をより正確かつ有意義に分析する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 20:29:14 GMT)
Causal Representation Learning with Generative Artificial Intelligence: Application to Texts as Treatments [0.0] テキストなどの非構造的高次元処理による因果推論の有効性を高める方法について述べる。
本稿では,大規模言語モデル(LLM)のような深層生成モデルを用いて治療を効率的に生成することを提案する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 17:46:21 GMT)
Branching States as The Emergent Structure of a Quantum Universe [0.0] システムと環境の結合状態のいわゆる分岐構造は、ゼロ不協和に適合する唯一の構造であることを示す。
我々は、この分枝状態が古典的現象学の出現と相容れない唯一のものであるという既存の証拠を補強する。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 18:10:47 GMT)
Bell's inequality and the spooky actions at a distance [0.0] 本論文は、主に大学院物理学生を対象としている。
これは、アインシュタイン・ポドルスキー・ローゼンの実験の文脈においてベルの定理の意味と範囲を明確にすることに焦点を当てている。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 16:36:26 GMT)
Beating the Optimal Verification of Entangled States via Collective Strategies [0.0] 量子情報処理では、絡み合った状態の効率的な特徴付けが圧倒的な課題となる。
本稿では,グローバルな測定で最適検証に勝るものを任意に高効率で示す,集合戦略を用いた新しい検証手法を提案する。
このアプローチでは、絡み合った状態のごくわずかのコピーしか消費せず、測定されていない状態の保存を確実にし、その後のタスクに対する忠実性を高めることさえできる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 10:01:25 GMT)
Automatic Speech Recognition for the Ika Language [0.0] IkaのNew Testament Bible Multilingualから収集した高品質な音声データセット上で、事前学習したwav2vec 2.0の大規模翻訳を行う。
この結果から,微調整による事前学習モデルでは単語誤り率(WER)が0.5377,文字誤り率(CER)が0.2651となり,学習時間は1時間を超えることがわかった。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 11:56:42 GMT)
Automated Segmentation and Analysis of Microscopy Images of Laser Powder Bed Fusion Melt Tracks [0.0] 断面画像から溶融トラック次元を自動的に識別し,計測する画像分割ニューラルネットワークを提案する。
我々は、U-Netアーキテクチャを用いて、異なる研究室、機械、材料から得られた62個の事前ラベル付き画像のデータセットと、画像拡張を併用したトレーニングを行う。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:46:36 GMT)
Automated Segmentation and Analysis of Microscopy Images of Laser Powder Bed Fusion Melt Tracks [0.0] 断面画像から溶融トラック次元を自動的に識別し,計測する画像分割ニューラルネットワークを提案する。
我々は、U-Netアーキテクチャを用いて、異なる研究室、機械、材料から得られた62個の事前ラベル付き画像のデータセットと、画像拡張を併用したトレーニングを行う。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:46:36 GMT)
Analytic Solutions of Control Mechanism in Single-Qubit Systems [0.0] 制御された量子系の進化を管理するメカニズムは、しばしば曖昧にされ、その力学を解釈しにくくする。
本稿では,単一量子ビットの進化の基盤となるメカニズムを,一方向の定数制御の下で計算するための新しい解析手法について述べる。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:23:03 GMT)
Analysing the Influence of Reorder Strategies for Cartesian Genetic Programming [0.0] CGPで定義されるグラフのジェノタイプを並べ替える3つの新しい作用素を導入する。
そこで本研究では,CGPをリオーダー法で使用することにより,解が見つかるまでの反復数や適合度が向上することを示す。
しかし、最良のリオーダー演算子は存在しない。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 08:59:01 GMT)
An Early-Stage Workflow Proposal for the Generation of Safe and Dependable AI Classifiers [0.0] 資格のある安全で信頼性の高いAIモデルの生成と実行は、透明で、完全で、適応可能で、好ましい軽量ワークフローの定義を必要とする。
この初期段階の研究は、拡張されたONNXモデル記述に基づいて、そのようなワークフローを提案する。
ユースケースは、他のサードパーティのユースケースによって拡張されると思われる、このボディの1つの基盤を提供します。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 14:00:53 GMT)
An Alternative Formulation of the Quantum Phase Estimation Using Projection-Based Tensor Decompositions [0.0] 量子位相推定の代替版が提案され、アダマールゲートは量子フーリエ変換によって置換される。
この新しい回路は、アンシラが$ket0$であるときに元の回路と一致する。
射影に基づくテンソル分解と指数関数の閉形式表現の助けを借りて、この新しい手法は対応する対象ユニタリ作用素のハミルトニアンに結合した乗数として解釈できる。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 18:46:09 GMT)
Advanced Arabic Alphabet Sign Language Recognition Using Transfer Learning and Transformer Models [0.0] 本稿では、トランスファー学習とトランスフォーマーモデルを組み合わせたディープラーニング手法を用いて、アラビア語 Alphabet Sign Language 認識手法を提案する。
本稿では,ArSL2018 と AASL の2つの公開データセット上で,異なる変種の性能について検討する。
実験の結果、提案手法は、ArSL2018とAASLでそれぞれ99.6%、99.43%の精度で高い精度を得られることが示されている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 13:39:26 GMT)
Absorbing State Phase Transitions and Stability of Long-Range Coherence in Dissipative Quantum State Preparation [0.0] 吸収状態自体が長い位相コヒーレンスを持つ純散逸性量子反応拡散モデルについて検討する。
準備プロトコルが脆弱であるか、弱い誤差量子ジャンプ率に対して頑健である場合を見つける。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 16:00:55 GMT)
About rescaling, discretisation and linearisation of $\mathtt{RNN}$ [0.0] 本稿では、リカレントニューラルネットワーク(mathtRNN$s)の数学的基礎と、時間的再スケーリング、離散化、線形化の3つの基本的な手順について考察する。
これらの技術は$mathttRNN$sの振る舞いを特徴づける重要なツールを提供し、時間力学、実用的な計算実装、解析の線形近似に関する洞察を可能にする。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 19:25:30 GMT)
ARPOV: Expanding Visualization of Object Detection in AR with Panoramic Mosaic Stitching [0.0] ARPOVは、ARヘッドセットによってキャプチャされたビデオに合わせたオブジェクト検出モデル出力を分析するための、インタラクティブなビジュアル分析ツールである。
提案ツールでは, 望ましくないフレームを自動的にフィルタリングしながら, パノラマ縫合を利用して環境の視界を拡大する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 20:29:14 GMT)
A transformer-based deep reinforcement learning approach to spatial navigation in a partially observable Morris Water Maze [0.0] この研究は、モリス水迷路の2次元バージョンをナビゲートするために、深い強化学習を用いたトランスフォーマーベースのアーキテクチャを適用した。
提案アーキテクチャにより,エージェントが空間ナビゲーション戦略を効率的に学習できることを実証する。
この研究は、生物エージェントに類似した振る舞いを持つ人工エージェントの今後の研究への道のりを示唆している。
論文参考訳(メタデータ) (Tue, 01 Oct 2024 13:22:56 GMT)
A note on the holographic time-like entanglement entropy in Lifshitz theory [0.0] 三次元リフシッツ時空の境界理論におけるホログラフィック時間的絡み合いエントロピー(TEE)について検討する。
異なるホログラフィックの提案は、LifshitzバックグラウンドのTEEに同じ結果を与える。
さらに,Lifshitz系のTEEは,異方性パラメータに依存する実部と虚部を含むことが示唆された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:15:28 GMT)
A SSM is Polymerized from Multivariate Time Series [0.0] MTS予測の新しい手法であるPoly-Mambaを開発した。
6つの実世界のデータセットの実験では、Poly-MambaがSOTA法より優れていることが示されている。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 03:32:24 GMT)
A POD-TANN approach for the multiscale modeling of materials and macroelement derivation in geomechanics [0.0] 本稿では,多角形分解(POD)と熱力学に基づくニューラルネットワーク(TANN)を組み合わせることで,複雑な非弾性系のマクロ的挙動を捉える手法を提案する。
以上の結果から,POD-TANN手法は実験結果の精度を再現するだけでなく,計算コストを低減し,不均一な非弾性地盤力学系のマルチスケールモデリングの実用的なツールとなることが示唆された。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 07:52:54 GMT)
A Generalized Mean Approach for Distributed-PCA [0.0] 本稿では,行列$beta$-meanを用いて固有値情報を用いて局所的な結果を集約するDPCA手法を提案する。
$beta$-DPCAは、$beta$値の調整可能な選択を通じて、柔軟で堅牢なアグリゲーションを提供する。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 04:39:40 GMT)
A Generalized Approach to Root-based Attacks against PLWE [0.0] ポリアルラーニング・ウィズ・エラー(Polyal Learning With Errors)問題は、2024年8月に国立標準技術研究所(National Institute of Standards and Technology)が標準化した3つの暗号システムの背景となっている。
PLWEは量子抵抗性が高いと考えられているが、この事実はまだ確立されていない。
いくつかの特定のインスタンスに対して、いくつかの脆弱性が発生している。
論文参考訳(メタデータ) (Tue, 1 Oct 2024 19:25:04 GMT)