On the Hidden Mystery of OCR in Large Multimodal Models [122.3] テキスト関連視覚タスクにおいて, GPT4V や Gemini などの大規模マルチモーダルモデルの包括的評価を行った。
OCRBenchには29のデータセットがあり、最も包括的なOCR評価ベンチマークが利用できる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:30:14 GMT)
Idea2Img: Iterative Self-Refinement with GPT-4V(ision) for Automatic Image Design and Generation [115.6] 本稿では,GPT-4V(ision)を用いたマルチモーダル反復自己修正システムであるIdean to Image'を紹介し,画像の自動設計と生成を行う。
大規模マルチモーダルモデル(LMM)に基づくシステムでは,類似のマルチモーダル自己抑止能力が得られるかを検討する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:43:25 GMT)
WavLLM: Towards Robust and Adaptive Speech Large Language Model [93.1] 本稿では,2つのエンコーダを持つ頑健で適応的な音声大言語モデルであるWavLLMと,プロンプト対応のLoRA重み付けアダプタを紹介する。
ASR, ST, SV, ERなどのタスクを含むユニバーサル音声ベンチマークにおいて提案手法の有効性を検証し, SQA用ガオカオ英語聴取理解セット, CoT 評価セットなどの特殊データセットに適用する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:42:44 GMT)
Model Merging in LLMs, MLLMs, and Beyond: Methods, Theories, Applications and Opportunities [89.4] モデルマージは、機械学習コミュニティにおける効率的なエンパワーメント技術である。
これらの手法の体系的かつ徹底的なレビューに関する文献には大きなギャップがある。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:58:48 GMT)
Training Language Models on the Knowledge Graph: Insights on Hallucinations and Their Detectability [83.1] 幻覚は多くの形式があり、普遍的に受け入れられる定義はない。
トレーニングセットにおいて、正しい回答が冗長に現れるような幻覚のみを研究することに集中する。
固定されたデータセットの場合、より大きく長く訓練されたLMは幻覚を少なくする。
固定されたLMの出力の検出器サイズが向上するのに対して、LMのスケールと幻覚の検出可能性との間には逆の関係がある。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 23:34:28 GMT)
Massive Activations in Large Language Models [77.5] 様々な大規模言語モデル(LLM)にまたがる大規模アクティベーションの存在を示す。
大量活性化は、それに対応するトークンに対する注意確率の集中と、自己注意出力における暗黙のバイアス項をもたらす。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:00:49 GMT)
Sum-of-Squares inspired Quantum Metaheuristic for Polynomial Optimization with the Hadamard Test and Approximate Amplitude Constraints [76.5] 最近提案された量子アルゴリズムarXiv:2206.14999は半定値プログラミング(SDP)に基づいている
SDPにインスパイアされた量子アルゴリズムを2乗和に一般化する。
この結果から,本アルゴリズムは大きな問題に適応し,最もよく知られた古典学に近似することが示唆された。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 19:04:13 GMT)
Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization [75.1] そこで本研究では,BMCというフレームワークを,ペアデータにおけるブリッジとモデリングの相関関係として提案する。
目的の修正によって、ペアの選好信号の一貫性と情報性が向上する。
DPOだけではこれらの相関をモデル化し、ニュアンス付き変動を捉えるには不十分である。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:29:47 GMT)
SRFormerV2: Taking a Closer Look at Permuted Self-Attention for Image Super-Resolution [74.5] SRFormerは、大きなウィンドウの自己注意の恩恵を享受できる、単純だが斬新な方法である。
我々のSRFormerはUrban100データセットで33.86dBのPSNRスコアを獲得し、SwinIRよりも0.46dB高い。
実験により, SRFormerV2と呼ばれるスケールモデルにより, 結果がさらに向上し, 最先端の達成が期待できることがわかった。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:12:36 GMT)
Problem Solving Through Human-AI Preference-Based Cooperation [74.4] 我々は,人間-AI共同構築フレームワークであるHAI-Co2を提案する。
我々は、HAI-Co2を形式化し、それが直面する困難なオープンリサーチ問題について議論する。
本稿では,HAI-Co2のケーススタディと,モノリシックな生成型AIモデルとの比較による有効性を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:06:57 GMT)
LLMI3D: Empowering LLM with 3D Perception from a Single 2D Image [72.1] 現在の3D認識手法、特に小さなモデルでは、論理的推論、質問応答、オープンシナリオカテゴリの処理に苦労している。
空間的特徴抽出のための空間的局所特徴抽出法,精密な幾何回帰のための3次元問合せ情報復号法,カメラ焦点長変動に対する幾何学投影に基づく3次元推論を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:00:16 GMT)
DynaMoN: Motion-Aware Fast and Robust Camera Localization for Dynamic Neural Radiance Fields [71.9] 動的ニューラルラジアンス場(DynaMoN)の高速かつロバストなカメラ位置推定法を提案する。
DynaMoNは、初期のカメラポーズ推定と高速で正確なノベルビュー合成のための静的集光線サンプリングのために動的コンテンツを処理している。
我々は,TUM RGB-DデータセットとBONN RGB-D Dynamicデータセットの2つの実世界の動的データセットに対するアプローチを広く評価した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:09:13 GMT)
BAPLe: Backdoor Attacks on Medical Foundational Models using Prompt Learning [71.6] 医療基盤モデルはバックドア攻撃の影響を受けやすい。
本研究は,素早い学習期間中に医療基盤モデルにバックドアを埋め込む方法を紹介する。
我々の手法であるBAPLeは、ノイズトリガを調整するために最小限のデータサブセットしか必要とせず、テキストは下流のタスクにプロンプトする。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:18:42 GMT)
V-STaR: Training Verifiers for Self-Taught Reasoners [71.5] V-STaR はモデル生成解の正しさを判断する DPO を用いて検証器を訓練する。
複数のイテレーションでV-STaRを実行すると、徐々により良い推論器と検証器が得られる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 02:41:48 GMT)
A Survey on Graph Neural Networks and Graph Transformers in Computer Vision: A Task-Oriented Perspective [71.0] グラフニューラルネットワーク(GNN)はグラフ表現学習において勢いを増している。
Graph Transformerは、グラフ構造をTransformerアーキテクチャに組み込んで、局所的な近傍集約の制限を克服します。
本稿では,タスク指向の観点から,コンピュータビジョンにおけるGNNとグラフトランスフォーマーの総合的なレビューを行う。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:05:15 GMT)
A Survey of Meta-Reinforcement Learning [69.8] 我々は,メタRLと呼ばれるプロセスにおいて,機械学習問題自体として,より優れたRLアルゴリズムを開発した。
本稿では,タスク分布の存在と各タスクに利用可能な学習予算に基づいて,高レベルでメタRL研究をクラスタ化する方法について議論する。
RL実践者のための標準ツールボックスにメタRLを組み込むことの道程について,オープンな問題を提示することによって,結論を下す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:15:57 GMT)
How Much are Large Language Models Contaminated? A Comprehensive Survey and the LLMSanitize Library [68.1] 大規模言語モデル(LLM)は、ビジネスアプリケーションやAIの資金調達でますます利用されている。
LLMの性能は、データへの以前の露出のために、少なくとも部分的には高性能である可能性があるため、もはや信頼性が低い可能性がある。
我々はLLMSanitizeというオープンソースのPythonライブラリをリリースし、主要な汚染検知アルゴリズムを実装した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 21:56:32 GMT)
HawkI: Homography & Mutual Information Guidance for 3D-free Single Image to Aerial View [67.8] 本稿では,テキストと模範画像から空中視像を合成するためのHawkeIを提案する。
HawkIは、予め訓練されたテキストから2次元の安定拡散モデルに入力画像からの視覚的特徴をブレンドする。
推測において、HawkeIは、入力画像の意味的詳細を忠実に複製するために生成されたイメージを操るために、ユニークな相互情報ガイダンスの定式化を用いる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:39:41 GMT)
DeCo: Decoupled Human-Centered Diffusion Video Editing with Motion Consistency [66.5] DeCoは、人間と背景を別々に編集可能なターゲットとして扱うように設計された、新しいビデオ編集フレームワークである。
そこで本研究では,人体を利用した非結合型動的人体表現法を提案する。
本研究は, 通常の空間と画像空間にスコア蒸留サンプリングの計算を拡張し, 最適化時の人間のテクスチャを向上する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:53:40 GMT)
Evaluating Large Language Model based Personal Information Extraction and Countermeasures [63.9] 大規模言語モデル(LLM)は、攻撃者が個人プロファイルから様々な個人情報を正確に抽出するために誤用することができる。
LLMはそのような抽出において従来の方法より優れている。
即時注射は、そのようなリスクを広範囲に軽減し、従来の対策より優れている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 04:49:30 GMT)
Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.7] オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:14:02 GMT)
One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.3] 拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。
近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。
我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:47:22 GMT)
Bridging the Gap: Sketch-Aware Interpolation Network for High-Quality Animation Sketch Inbetweening [58.1] 我々は,新しい深層学習手法であるSketch-Aware Interpolation Network (SAIN)を提案する。
このアプローチには、領域レベルの対応、ストロークレベルの対応、ピクセルレベルのダイナミクスを定式化するマルチレベルガイダンスが組み込まれている。
マルチストリームのU-Transformerは、自己/クロスアテンション機構の統合により、これらのマルチレベルガイドを使用して、スケッチ間のインテンションパターンを特徴付けるように設計されている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:48:40 GMT)
Cropper: Vision-Language Model for Image Cropping through In-Context Learning [57.7] 画像トリミングの目標は、画像内の視覚的に魅力的な作物を特定することである。
近年の大規模視覚言語モデル(VLM)のブレークスルーにより、明示的なトレーニングを伴わずに、コンテキスト内学習が可能になった。
本稿では,VLMを画像トリミングに有効活用する手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:03:03 GMT)
RL-I2IT: Image-to-Image Translation with Deep Reinforcement Learning [54.4] 画像から画像への変換(I2IT)手法は,ディープラーニング(DL)モデルの単一実行時に画像を生成する。
深部強化学習(DRL)によるステップワイド意思決定問題としてI2ITを再構成する。
RLベースのI2IT(RL-I2IT)を実現する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 01:24:34 GMT)
Large Language Models Prompting With Episodic Memory [53.9] 本稿では,POEM(PrOmpting with Episodic Memory)を提案する。
テストフェーズでは、各テストクエリのサンプルのシーケンスを最適化し、エピソードメモリにおけるトップkで最も類似したトレーニング例から最も高い合計報酬を得るシーケンスを選択する。
その結果,POEMはテキスト分類タスクにおいてTEMPERAやRLPromptといった最近の技術よりも5.3%向上していることがわかった。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:19:28 GMT)
A Semantic Space is Worth 256 Language Descriptions: Make Stronger Segmentation Models with Descriptive Properties [53.2] ProLabは、プロパティレベルのラベル空間を使用して、強力な解釈可能なセグメンテーションモデルを作成する新しいアプローチである。
セグメンテーションモデルを監督するために、常識知識に根ざした記述的特性を使用する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 04:05:23 GMT)
Watermarking Recommender Systems [52.2] 本稿では,レコメンダシステムに特化した新しい手法であるAutoregressive Out-of-Distribution Watermarking (AOW)を紹介する。
提案手法では,初期項目の選択とオラクルモデルによるクエリを行い,その後に予測スコアの小さい項目を選択する。
透かしの有効性を評価するため、このモデルでは、切り捨てられた透かしシーケンスが与えられた後続の項目を予測することを課題とする。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:52:29 GMT)
Distributional Reinforcement Learning with Dual Expectile-Quantile Regression [51.9] 分布RLに対する量子レグレッションアプローチは、任意の戻り分布を柔軟かつ効果的に学習する方法を提供する。
我々は,分布保証が消えることを示し,推定分布が急速に崩壊して平均推定値が崩壊することを実証的に観察する。
提案手法は,$L$の学習効率を生かして,返却分布の予測値と量子化値とを協調的に学習し,返却分布の完全な分布を推定し,効率的な学習を可能にするものである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:09:25 GMT)
Seeing and Understanding: Bridging Vision with Chemical Knowledge Via ChemVLM [51.8] 化学分野に特化したオープンソースのマルチモーダル大規模言語モデルであるChemVLMを提案する。
我々はChemLLM-20Bを基礎的な大規模モデルとして活用し、化学テキスト知識の理解と活用に頑健な能力を持つモデルを構築した。
分子,反応公式,化学試験データなど,化学領域からの高品質なデータを収集し,バイリンガル・マルチモーダル質問応答データセットにコンパイルした。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 01:16:40 GMT)
InternVideo2: Scaling Foundation Models for Multimodal Video Understanding [51.1] InternVideo2は、ビデオファウンデーションモデル(FM)の新たなファミリーで、ビデオ認識、ビデオ音声タスク、ビデオ中心タスクの最先端の結果を達成する。
私たちのコアデザインは、マスク付きビデオモデリング、クロスコントラスト学習、予測トークンを統合し、最大6Bビデオサイズまでスケールアップするプログレッシブトレーニングアプローチです。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:31:50 GMT)
Graph Agent Network: Empowering Nodes with Inference Capabilities for Adversarial Resilience [50.5] グラフニューラルネットワーク(GNN)の脆弱性に対処するグラフエージェントネットワーク(GAgN)を提案する。
GAgNはグラフ構造化エージェントネットワークであり、各ノードは1-hop-viewエージェントとして設計されている。
エージェントの限られたビューは、悪意のあるメッセージがGAgNでグローバルに伝播するのを防ぎ、グローバル最適化ベースのセカンダリアタックに抵抗する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 04:26:03 GMT)
Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models [50.4] 本研究では,音声大言語モデル(SLLM)における社会的バイアスの評価を目的としたデータセットであるSpken Stereosetを紹介する。
多様な人口集団の発話に対して異なるモデルがどのように反応するかを調べることで、これらのバイアスを特定することを目指している。
これらの結果から,ほとんどのモデルではバイアスが最小であるが,ステレオタイプや反ステレオタイプ傾向がわずかにみられた。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:55:06 GMT)
SentenceVAE: Enable Next-sentence Prediction for Large Language Models with Faster Speed, Higher Accuracy and Longer Context [50.0] 本稿では,文中の複数のトークンを1つのトークンに圧縮する文を含む文変分自動エンコーダ(文変分自動エンコーダ)と,それを再構成する文変分自動エンコーダ(文変分自動エンコーダ)を提案する。
提案手法は, 推定速度を204365%高速化し, パープレキシティ(PPL)を4675%まで低減し, メモリオーバーヘッドを8691%削減する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:34:44 GMT)
ComKD-CLIP: Comprehensive Knowledge Distillation for Contrastive Language-Image Pre-traning Model [49.6] コントラスト言語画像前処理モデルのための包括的知識蒸留法ComKD-CLIPを提案する。
大規模な教師CLIPモデルからより小さな学生モデルに知識を抽出し、パラメータを著しく減らして同等のパフォーマンスを確保する。
EduAttentionは教師モデルで抽出したテキスト特徴と学生モデルで抽出した画像特徴との相互関係を探索する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:43:06 GMT)
On Speeding Up Language Model Evaluation [48.5] LLM(Large Language Models)を用いたプロンプトベースの手法の開発には、多くの意思決定が必要である。
この課題に対処するための新しい手法を提案する。
典型的に必要とされるリソースの5~15%しか必要とせず,トップパフォーマンスの手法を識別できることが示される。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:31:35 GMT)
SCP: Soft Conditional Prompt Learning for Aerial Video Action Recognition [48.5] 本研究では,航空映像行動認識において,迅速な学習の強みを生かした新しい学習手法であるSoft Conditional Prompt Learning(SCP)を提案する。
本手法は,航空機/ロボットの視覚知覚のための入力ビデオにおける動作に関する記述や指示に,モデルが焦点を当てることによって,各エージェントの動作を予測するように設計されている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:05:23 GMT)
Semi-Supervised Laplace Learning on Stiefel Manifolds [48.3] グラフベースで教師付きサンプルを低ラベルレートで作成するためのフレームワークSequential Subspaceを開発した。
我々の手法は極めて低いレートで、高いラベルレートで達成できる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:57:05 GMT)
Time-inversion of spatiotemporal beam dynamics using uncertainty-aware latent evolution reversal [46.3] 本稿では,フォワードビームダイナミクスの時相を考慮したリバースラテント進化モデル(rLEM)を提案する。
この2段階の自己教師型深層学習フレームワークでは、空調オートエンコーダ(CVAE)を用いて荷電粒子ビームの6次元空間投影を低次元潜在分布に投影する。
次に,Long Short-Term Memory (LSTM) ネットワークを用いて,潜在空間における逆時間力学を自動回帰的に学習する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 23:09:01 GMT)
Hamiltonian simulation for low-energy states with optimal time dependence [45.0] 低エネルギー部分空間内のハミルトン$H$の下で時間発展をシミュレートする作業を考える。
我々は,$O(tsqrtlambdaGamma + sqrtlambda/Gammalog (1/epsilon))$クエリを,任意の$Gamma$に対するブロックエンコーディングに使用する量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 04:17:29 GMT)
Agent Instructs Large Language Models to be General Zero-Shot Reasoners [44.9] 我々は,大規模言語モデルの推論過程を指示する自律エージェントを構築した。
このアプローチにより、大規模言語モデルのゼロショット推論能力がより多くのタスクに開放されることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:39:59 GMT)
Non-Determinism and the Lawlessness of Machine Learning Code [43.7] 我々は,非決定主義の影響と,その結果法に含める影響が,MLアウトプットの分布としての推論の観点からより明確になることを示す。
我々は、非決定性による潜在的に有害な影響を抑えるためにMLができることについて、簡単な議論で結論付けた。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 00:11:30 GMT)
Fair Enough? A map of the current limitations of the requirements to have fair algorithms [43.6] 我々は、社会が自動意思決定システムから要求しているものと、この要求が現実のシナリオで実際に意味しているものとの間には、因果関係があることを論じる。
自動意思決定システムにおける公正性の増大に具体的な意味を与えるため、社会として対応しなければならない重要なオープンポイントの集合を概説する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:01:50 GMT)
R2Human: Real-Time 3D Human Appearance Rendering from a Single Image [42.7] R2Humanは、1つの画像から3D人間の外見をリアルタイムに推測およびレンダリングするための最初のアプローチである。
本稿では、可視領域の高忠実な色再現を行い、隠蔽領域に対して信頼性の高い色推定を行うエンド・ツー・エンド・ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:41:41 GMT)
Enhanced Scale-aware Depth Estimation for Monocular Endoscopic Scenes with Geometric Modeling [42.7] 本稿では,幾何学的モデリングによる深度推定のための単眼画像のみを用いた新しいスケールアウェアフレームワークを提案する。
具体的には、まず、単分子深度推定の品質を高めるための多分解能深度融合戦略を提案する。
スケール係数と相対深度推定を結合することにより、単眼内視鏡シーンのスケール認識深度を推定できる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:18:04 GMT)
Explicit Abnormality Extraction for Unsupervised Motion Artifact Reduction in Magnetic Resonance Imaging [41.6] 運動アーティファクトはMRI(MRI)の品質を損なう
モーションアーティファクトリダクション(MAR)のソリューションとしてディープラーニングアプローチが登場した
これらの手法の欠点の1つは、トレーニング目的のために2組のモーションアーティファクト崩壊(MA崩壊)とモーションアーティファクトフリー(MA無し)MR画像を取得することにある。
この問題を軽減するために,UNAEN(UN Abnormality extract Network)を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:56:02 GMT)
KIND: Knowledge Integration and Diversion in Diffusion Models [40.4] 拡散モデルにおいてtextbfKnowledge textbfINtegration と textbfDiversion を実行する textbfKIND を導入する。
KINDは、現在のタスクにおけるモデルパフォーマンスの最大化から、伝達可能な共通知識の凝縮までのトレーニング目標を調整することで、従来の事前学習手法を再定義する。
その結果,KINDは,他のPEFT法や学習遺伝子法と比較して最先端の性能を達成できることが示唆された。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:22:28 GMT)
Evolving from Single-modal to Multi-modal Facial Deepfake Detection: A Survey [40.1] AI生成メディアがより現実的になるにつれて、誤情報を拡散したり、身元確認詐欺を犯したりする危険性が高まっている。
この研究は、従来の単一モダリティ手法から、音声・視覚・テキスト・視覚シナリオを扱う高度なマルチモーダルアプローチへの進化を辿る。
私たちの知る限りでは、この種の調査はこれが初めてである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:38:49 GMT)
Re-Thinking Process Mining in the AI-Based Agents Era [39.6] 大規模言語モデル(LLM)は強力な対話インタフェースとして登場し、プロセスマイニング(PM)タスクにおけるその応用は有望な結果を示している。
本稿では,LLMにおけるPMの有効性を高めるために,AIベースのエージェント(AgWf)パラダイムを活用することを提案する。
我々はAgWfの様々な実装とAIベースのタスクの種類について検討する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:14:18 GMT)
$\texttt{COSMIC}$: Mutual Information for Task-Agnostic Summarization Evaluation [39.3] 本稿では,タスク成果を保存しつつ,下流タスクに有用な要約を生成するために,その能力に基づいて要約者を評価する新しいタスク指向評価手法を提案する。
我々は,この指標の実践的実装として$textttCOSMIC$を導入し,人間の判断に基づく指標との強い相関と下流タスク性能の予測の有効性を実証した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:06:10 GMT)
ViTime: A Visual Intelligence-Based Foundation Model for Time Series Forecasting [38.9] 本稿では,時系列予測のためのビジュアルインテリジェンスに基づく新しい基礎モデルであるViTimeを提案する。
これまで目にしなかったさまざまな予測データセットの実験は、ViTimeが最先端のゼロショットパフォーマンスを達成することを実証している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:02:39 GMT)
See It All: Contextualized Late Aggregation for 3D Dense Captioning [38.1] 3D高密度キャプションは、オブジェクトを3Dシーンでローカライズし、各オブジェクトに対して記述文を生成するタスクである。
3D高密度キャプションにおける最近のアプローチでは、オブジェクト検出から手作りの部品を使わずにエンドツーエンドのパイプラインを構築するためのトランスフォーマー・エンコーダ・デコーダ・フレームワークが採用されている。
SIA(See-It-All)は3次元高密度キャプションに係わるトランスフォーマーパイプラインであり,遅延アグリゲーションと呼ばれる新しいパラダイムを導入している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:19:18 GMT)
Enhancing Relevance of Embedding-based Retrieval at Walmart [37.6] 検索関連性の観点からEBRモデルの能力をさらに強化するためのいくつかのアプローチを提案する。
EBRの有効性は、オフラインの妥当性評価、オンラインABテスト、実運用へのデプロイメント成功を通じて実証されます。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:17:10 GMT)
Cross-Platform Video Person ReID: A New Benchmark Dataset and Adaptation Approach [37.5] 我々はG2A-VReIDという地上から地上までの映像に基づく人物再同定のための大規模ベンチマークデータセットを構築した。
G2A-VReIDデータセットには次のような特徴がある: 1) 劇的な視点の変化; 2) 注釈付きアイデンティティの多さ; 3) リッチ屋外シナリオ; 4) 解像度の大きな差。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:29:49 GMT)
CoTFormer: A Chain-of-Thought Driven Architecture with Budget-Adaptive Computation Cost at Inference [36.8] 言語モデルをより大きく、より深く拡張することで、パフォーマンスが大幅に向上した。
トークンレベルでのChain-of-Thought(CoT)を忠実に模倣する新しいアーキテクチャであるCoTFormerを提案する。
精度を下げることなく計算コストを大幅に削減できることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:41:56 GMT)
FIPO: Free-form Instruction-oriented Prompt Optimization with Preference Dataset and Modular Fine-tuning Schema [36.7] 大規模言語モデル(LLM)のタスク性能向上のためのFIPO(Free-from Instruction-oriented Prompt Optimization)を提案する。
FIPOはモジュール型のAPOテンプレートを使用して、単純で最適化されたプロンプトを生成するために、ナイーブなタスク命令、オプションの命令応答、オプションの接地真理を動的に統合する。
5つの公開ベンチマークと6つのテストモデルでFIPOフレームワークを検証する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:47:39 GMT)
On the Utility of 3D Hand Poses for Action Recognition [36.6] HandFormerは、手動オブジェクトの相互作用を効率的にモデル化する新しいマルチモーダルトランスである。
我々は手指のモデリングを分類し,その短期的軌跡によって各関節を表現した。
我々は,アセンブラ101およびH2O上での最先端性能を新たに達成し,エゴセントリックな動作認識を大幅に改善した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:22:50 GMT)
The AI Risk Repository: A Comprehensive Meta-Review, Database, and Taxonomy of Risks From Artificial Intelligence [35.8] 人工知能(AI)によって引き起こされるリスクは、学者、監査人、政策立案者、AI企業、そして一般大衆にかなり懸念されている。
AIリスクに対する共通理解の欠如は、包括的に議論し、研究し、それに反応する能力を妨げる可能性がある。
本稿では、共通の参照フレームとして機能するAIリスクリポジトリを作成することで、このギャップに対処する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:32:06 GMT)
Vulnerabilities of quantum key distribution systems in visible range [33.8] 通信網におけるハッキング攻撃に対する対策として一般的に用いられる要素の効率は、可視範囲において著しく損なわれる可能性があることを示す。
この範囲で検出された脆弱性は、波長が減少すると効率が向上する誘導光屈折攻撃のようなハッキング戦略において、ますます重要な役割を担っていることが判明した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:45:32 GMT)
DifuzCam: Replacing Camera Lens with a Mask and a Diffusion Model [31.4] フラットなレンズレスカメラのデザインは、カメラのサイズと重量を大幅に減らします。
画像は、再構成アルゴリズムを用いて生センサ計測から回収される。
本稿では,事前学習した拡散モデルと制御ネットワークと学習可能な分離変換を併用して再構成する手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:20:52 GMT)
Knowledge Distillation with Refined Logits [31.2] 本稿では,現在のロジット蒸留法の限界に対処するため,Refined Logit Distillation (RLD)を導入する。
我々のアプローチは、高性能な教師モデルでさえ誤った予測をすることができるという観察に動機づけられている。
本手法は,教師からの誤解を招く情報を,重要なクラス相関を保ちながら効果的に排除することができる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:59:32 GMT)
Counting statistics of ultra-broadband microwave photons [30.4] 未定義周波数のマイクロ波光子の計数統計,平均および分散の測定結果について報告する。
トンネル接合による量子ステアリングの観測を報告し、ブロードバンドモードのスクイーズの存在が、それが含む2つのモード間の絡み合いの存在を示唆していることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 19:28:16 GMT)
Only One Relation Possible? Modeling the Ambiguity in Event Temporal Relation Extraction [30.3] イベント時間関係抽出(ETRE)は、2つのイベント間の時間的関係を特定することを目的としている。
本稿では, ETRE (METRE) の多ラベル分類法を提案する。
本手法は,textitVagueインスタンスを有効利用して,特定の時間関係の認識を改善する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:57:51 GMT)
MathScape: Evaluating MLLMs in multimodal Math Scenarios through a Hierarchical Benchmark [30.0] 我々は,視覚情報とテキスト情報の組み合わせの理解と適用を強調する新しいベンチマークであるMathScapeを提案する。
MathScapeは、MLLMの理論的理解と応用能力を評価し、写真に基づく数学問題シナリオを評価するように設計されている。
我々は11の高度MLLMに対して多次元評価を行い、最も洗練されたモデルでさえベンチマークが困難であることを明らかにした。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:23:43 GMT)
Modality Invariant Multimodal Learning to Handle Missing Modalities: A Single-Branch Approach [29.4] そこで本研究では,モダリティの欠落の影響を受けにくい多モーダル学習手法を提案する。
性能を最大化するためにモダリティ間表現を学ぶために、複数のモダリティにまたがる重みを共有するシングルブランチネットワークで構成されている。
提案手法は,すべてのモダリティが存在する場合や,既存の最先端手法と比較して,トレーニングやテスト中にモダリティが欠落する場合に優れた性能が得られる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:32:16 GMT)
Harmonious Group Choreography with Trajectory-Controllable Diffusion [28.8] Trajectory-Controllable Diffusion (TCDiff) は、重複しない軌道を利用してコヒーレントなダンスの動きを促進する新しい手法である。
ダンサーの衝突に対処するために,音楽に基づいて複数のダンサーの軌道を生成できるダンス・ビート・ナビゲータを導入する。
フレキシブルなフットワークを実現するために,隣接するフレームからの軌道変位を利用したフットワークアダプタを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 02:38:55 GMT)
BiEquiFormer: Bi-Equivariant Representations for Global Point Cloud Registration [28.8] 本研究の目的は,グローバルポイントクラウド登録(PCR)の問題,すなわち,ポイントクラウド間の最適なアライメントを見つけることにある。
本研究では,現在最先端のディープラーニング手法が,任意の点の雲を空間に配置した場合に,大きな性能劣化に悩まされていることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 01:46:33 GMT)
Look into the Future: Deep Contextualized Sequential Recommendation [28.7] 我々は、Look into the Future(LIFT)と呼ばれる、シーケンシャルなレコメンデーションの新しいフレームワークを提案する。
LIFTはシーケンシャルなレコメンデーションのコンテキストを構築し、活用する。
本実験では,クリックスルー率予測および評価予測タスクにおいて,LIFTは大幅な性能向上を実現している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 05:33:07 GMT)
Elephants Do Not Forget: Differential Privacy with State Continuity for Privacy Budget [28.6] プライバシ予算の維持に失敗したことで、敵がリプレイ、ロールバック、フォークアタックをマウントできることを示す。
我々は,グローバルDPモデルにおいて,信頼できるキュレーターと同じ保証を提供するシステムであるElephantDPを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 02:02:28 GMT)
Evidence of P-wave Pairing in K2Cr3As3 Superconductors from Phase-sensitive Measurement [26.7] 分離したK2Cr3As3上に超伝導量子干渉素子(SQUID)を作製した。
我々はSQUIDが電流-位相関係において2階高調波成分 sin(2phi) を顕著に示すことを観察した。
π相の存在は、K2Cr3As3のp波対対称性に有利である。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:34:45 GMT)
Cascaded Multi-path Shortcut Diffusion Model for Medical Image Translation [26.7] 高品質な医用画像翻訳と不確実性推定のためのカスケードマルチパスショートカット拡散モデル(CMDM)を提案する。
実験の結果,CMDMは最先端の手法に匹敵する高品質な翻訳を実現できることがわかった。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 04:56:58 GMT)
Breaking the $T^{2/3}$ Barrier for Sequential Calibration [26.6] バイナリシーケンスのオンライン校正予測の問題について検討する。
Foster & Vohra (1998) は、$O(T2/3)$キャリブレーション誤差を$T$タイムステップ後に引き起こし、$Omega(T1/2)$の低い境界を示した。
Qiao & Valiant (2021) は、符号保存と呼ばれるゲームを導入して下限を$Omega(T0.528)$に改善した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:08:54 GMT)
BlockFUL: Enabling Unlearning in Blockchained Federated Learning [26.5] フェデレートラーニング(FL)におけるアンラーニングは、モデルが複雑な継承関係を持って成長し進化するにつれて、大きな課題を提起する。
本稿では,FL内の未学習機能を実現するために,ライブチェーンとアーカイブチェーンからなる二重鎖構造を持つ新しいフレームワークを提案する。
2つの新しいアンラーニングパラダイム、すなわち並列およびシーケンシャルパラダイムは、勾配ベースおよび再学習ベースのアンラーニング手法によって効果的に実装できる。
実験により,これらの手法がデータ依存や運用上のオーバーヘッドを効果的に低減し,BlockFUL内の未学習モデル全体の性能を向上することを確認した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:44:53 GMT)
RSEA-MVGNN: Multi-View Graph Neural Network with Reliable Structural Enhancement and Aggregation [26.4] 信頼性の高い構造強化・集約型マルチビューグラフニューラルネットワーク(RSEA-MVGNN)を提案する。
RSEA-MVGNNは、ビュー特有の信念と不確実性を意見として学習し、ビュー品質を評価する。
5つの実世界のデータセットで実施された実験の結果、RSEA-MVGNNは最先端のGNNベースの手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:13:36 GMT)
Out-of-Distribution Learning with Human Feedback [26.4] 本稿では,人的フィードバックによるOOD学習のための新しい枠組みを提案する。
当社のフレームワークは、無償で利用可能な未ラベルデータに便乗しています。
人間のフィードバックを利用して、機械学習モデルの堅牢性と信頼性を高める。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:49:27 GMT)
Ramsey Theorems for Trees and a General 'Private Learning Implies Online Learning' Theorem [26.3] この研究は、差分プライベート(DP)とオンライン学習との関係について研究を続けている。
一般分類タスクにおいては,DP学習性はオンライン学習性を意味することを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:52:09 GMT)
Model Attribution in LLM-Generated Disinformation: A Domain Generalization Approach with Supervised Contrastive Learning [26.0] 現代の大きな言語モデル(LLM)は、人間のような品質で偽情報を生成する。
偽情報を生成する方法の多様性は、正確なソース属性を複雑にする。
本稿では,モデル帰属の概念を領域一般化問題として紹介する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:10:43 GMT)
Faster Stochastic Optimization with Arbitrary Delays via Asynchronous Mini-Batching [26.0] 遅延に関する事前の知識を必要とせずに、全ての量子化に同時に適応する手法を示す。
さらに、非サイズの$O(inf_q tau_q2/(q T)2+sigma/sqrtqT)$と、凸問題に対する$O(tau_q2/(q T)2+sigma/sqrtqT)$の収束率を得る。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:30:51 GMT)
Nonlocal Attention Operator: Materializing Hidden Knowledge Towards Interpretable Physics Discovery [25.8] 非局所注意演算子(NAO)を作製するアテンション機構に基づく新しいニューラル演算子アーキテクチャを提案する。
NAOは正規化を符号化し、一般化性を達成することで、逆PDE問題における不備とランク不足に対処することができる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 05:57:56 GMT)
Progressive Radiance Distillation for Inverse Rendering with Gaussian Splatting [25.3] 本稿では,物理系レンダリングとガウス系ラディアンス場レンダリングを組み合わせた逆レンダリング法を提案する。
本手法は,新規なビュー合成とリライティングの両方において,最先端技術よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:50:08 GMT)
Self-Supervised Scalable Deep Compressed Sensing [24.9] 圧縮センシングはサンプリングコストを削減するための有望なツールである。
現在のディープニューラルネットワーク(NN)ベースのCS手法は、ラベル付き測定地上真実(GT)データ収集の課題に直面している。
本稿では,新しい$mathbfS$elf-supervised s$mathbfC$alable Deep CS法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 02:51:54 GMT)
VIRUS-NeRF -- Vision, InfraRed and UltraSonic based Neural Radiance Fields [24.2] 本稿では,超音波や赤外線による飛行時間センサなどの高効率な低分解能レンジセンサを提案する。
VIRUS-NeRFは、超音波と赤外線センサーの深さ測定を取り入れて、光線マーチングに使用される占有格子を更新する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:43:52 GMT)
GS-Pose: Generalizable Segmentation-based 6D Object Pose Estimation with 3D Gaussian Splatting [23.7] GS-Poseは、新しいオブジェクトの6Dポーズをローカライズし、推定するためのフレームワークである。
オブジェクトを入力画像に配置し、最初の6Dポーズを推定し、レンダリング・アンド・コンペア法でポーズを精算することで順次動作する。
市販のツールチェーンや携帯電話などのコモディティハードウェアを使用して、データベースに追加される新しいオブジェクトをキャプチャすることができる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:43:28 GMT)
Enhanced Detection of Conversational Mental Manipulation Through Advanced Prompting Techniques [23.7] 我々は、二元的心的操作検出タスクにゼロショットとフューショット設定を併用したChain-of-Thoughtプロンプトを実装した。
我々の主な目的は、なぜ特定のプロンプト技術が優れた性能を示すのかを解読することである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:23:12 GMT)
Panacea+: Panoramic and Controllable Video Generation for Autonomous Driving [23.6] 本研究では,運転シーンにおける映像データ生成のための強力なフレームワークであるPanacea+を提案する。
Panacea+は、マルチビューのノイズ前処理機構と、一貫性と解像度の向上のための超解像モジュールを採用している。
実験により、生成されたビデオサンプルは、異なるデータセット上の幅広いタスクに大きな恩恵をもたらすことが示された。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:10:13 GMT)
Towards Fair and Rigorous Evaluations: Hyperparameter Optimization for Top-N Recommendation Task with Implicit Feedback [23.6] 我々は,Top-Nの暗黙的推薦問題を調査し,ベンチマーク推薦アルゴリズムの最適化に焦点をあてる。
公正比較の原則に従う研究手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:56:27 GMT)
G$^2$V$^2$former: Graph Guided Video Vision Transformer for Face Anti-Spoofing [23.3] スプーフされた顔を含むビデオでは、光度またはダイナミックな異常に基づいて、スプーフの証拠を発見できるかもしれない。
本稿では,顔と顔のランドマークを組み合わせたグラフガイドビデオビジョン変換器を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:22:41 GMT)
GTree: GPU-Friendly Privacy-preserving Decision Tree Training and Inference [22.6] 決定木(Decision Tree, DT)は、その汎用性、速度、解釈性から広く使われている機械学習モデルである。
プライバシに敏感なアプリケーションでは、DTトレーニングのアウトソーシングとクラウドプラットフォームへの推論が、データのプライバシに関する懸念を提起する。
GTreeは、GPUを用いてMPCで保護されたセキュアDTトレーニングと推論を高速化する最初のスキームである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:35:12 GMT)
Improving Global Parameter-sharing in Physically Heterogeneous Multi-agent Reinforcement Learning with Unified Action Space [22.5] マルチエージェントシステムでは、アクションセマンティクスはエージェントのアクションが他のエンティティに対して異なる影響を示す。
従来のマルチエージェント強化学習(MARL)アルゴリズムは、多種多様な異種エージェントにまたがる大域的パラメータ共有を適用する。
要件を満たすために統一行動空間(UAS)を導入する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:15:11 GMT)
Dynamic and Compressive Adaptation of Transformers From Images to Videos [22.5] InTIは動的フレーム間トークン補間を用いた圧縮画像から映像への適応のための新しい手法である。
Kinetics-400 では、InTI が 87.1 の最高-1 の精度に達し、GFLOP の37.5% の顕著な減少がある。
追加の時間モジュールと組み合わせると、InTIは最高1の精度87.6で、GFLOPsは37%減少する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 01:37:17 GMT)
Multi-task Heterogeneous Graph Learning on Electronic Health Records [22.2] EHRモデリングのための新しいフレームワーク MulT-EHR (Multi-Task EHR) を提案する。
そこで本研究では,因果推論フレームワークをベースとしたデノナイジングモジュールを導入し,重度のコンバウンディング効果の調整を行う。
マルチタスク学習モジュールを設計し、タスク間知識を活用してトレーニングプロセスの正規化を行う。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:06:13 GMT)
How to Solve Contextual Goal-Oriented Problems with Offline Datasets? [22.1] 目的指向データ拡張(CODA)という新しい手法を提案する。
CODAは、コンテキスト目標指向(CGO)問題を解決するために、一般に利用可能なラベル付き軌跡とコンテキスト目標ペアを使用している。
オフラインデータ設定におけるCGO問題を解決するCODAの能力を実証するために,新しい理論的解析を行った。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:03:59 GMT)
Can LLMs Replace Economic Choice Prediction Labs? The Case of Language-based Persuasion Games [22.0] 学習したモデルは,言語に基づく説得ゲームにおいて,人間の行動を効果的に予測できることを示す。
実験の結果,LLMデータでトレーニングしたモデルは,実際の人的データでトレーニングしたモデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 19:23:43 GMT)
Robust Semi-supervised Multimodal Medical Image Segmentation via Cross Modality Collaboration [21.8] 本稿では,ラベル付きデータの不足やモダリティの不一致に頑健な,新しい半教師付きマルチモーダルセグメンテーションフレームワークを提案する。
本フレームワークでは,各モダリティに固有の,モダリティに依存しない知識を蒸留する,新たなモダリティ協調戦略を採用している。
また、対照的な一貫した学習を統合して解剖学的構造を規制し、ラベルのないデータに対する解剖学的予測アライメントを容易にする。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:34:12 GMT)
q-exponential family for policy optimization [21.7] 本稿では、より広範な政策ファミリーについて検討する:$q$-exponential family。
このポリシーのファミリはフレキシブルで、ヘビーテールのポリシー(q>1$)とライトテールのポリシー(q>1$)の両方を仕様化できる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 01:01:35 GMT)
Unsupervised Blind Joint Dereverberation and Room Acoustics Estimation with Diffusion Models [21.7] BUDDyと呼ばれるブラインド・デバーベーションと室内インパルス応答推定の教師なし手法を提案する。
室内のインパルス応答が不明な視覚的シナリオでは、BUDDyは音声の発声に成功している。
一般化に苦しむ教師付き手法とは異なり、BUDDyは異なる音響条件にシームレスに適応する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:31:32 GMT)
Learning Multi-Index Models with Neural Networks via Mean-Field Langevin Dynamics [21.6] 平均場ランゲヴィンアルゴリズムを用いて学習した2層ニューラルネットワークを用いて,高次元のマルチインデックスモデルを学習する問題について検討する。
軽度の分布仮定の下では、サンプルと計算の複雑さの両方を制御する実効次元 $d_mathrmeff$ を特徴づける。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 02:13:35 GMT)
DataVisT5: A Pre-trained Language Model for Jointly Understanding Text and Data Visualization [21.4] データビジュアライゼーション(DV)は,ビッグデータの背後にある洞察を伝える上で,効率を向上させるための基本的かつ前提的ツールである。
その可能性にもかかわらず、T5やBERTのような事前訓練された言語モデル(PLM)をDVに適用することは、クロスモーダル情報を扱う上でのコストと課題によって制限されている。
textbfDataVisT5はDV用に調整された新しいPLMで、T5アーキテクチャを多目的学習とマルチタスクファインチューニングのハイブリッド戦略によって拡張する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:20:17 GMT)
Introducing the NewsPaLM MBR and QE Dataset: LLM-Generated High-Quality Parallel Data Outperforms Traditional Web-Crawled Data [21.4] ニューラルマシン翻訳(NMT)の最近の研究により、高品質なマシン生成データに対するトレーニングは、人為的なデータに対するトレーニングよりも優れていることが示されている。
この研究は、LLM生成、MBRデコード、QE参照のデータセットを初めてリリースし、文レベルと多文の両方の例を示す。
我々の(機械生成)データセットのスクラッチからのトレーニングは、(Webcrawled) WMT'23トレーニングデータセットのトレーニングよりも優れています。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:38:11 GMT)
Reset & Distill: A Recipe for Overcoming Negative Transfer in Continual Reinforcement Learning [20.7] 本研究では, 連続強化学習アルゴリズムにおける負の伝達問題を克服するための, 単純かつ高効率な手法を開発する。
R&Dは、エージェントのオンラインアクターと批評家ネットワークをリセットして、新しいタスクとオフライン学習ステップを学ぶ戦略を組み合わせる。
本研究は,CRLの陰性移行を検討することの重要性を強調し,その有害性を軽減するためにR&Dのような堅牢な戦略の必要性を強調した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:32:11 GMT)
On-the-fly Synthesis for LTL over Finite Traces: An Efficient Approach that Counts [20.1] トップダウン決定論的オートマトン構築に基づく有限トレース(LTLf)上での線形時間論理のオンザフライフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:52:58 GMT)
Cyclic Supports in Recursive Bipolar Argumentation Frameworks: Semantics and LP Mapping [19.8] BAF(Bipolar Argumentation Framework)とRecursive BAF(Rec-BAF)の古典的意味論について述べる。
これは、各BAFベースのフレームワークに対して、敗北した要素と許容できる要素のセットのモジュラー定義を提供することによって達成される。
また、論理プログラミングや部分安定モデルのセマンティクスの観点から、一般のBAFやRec-BAFのセマンティクスをエレガントかつ均一に特徴づける。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:06:16 GMT)
OMR: Occlusion-Aware Memory-Based Refinement for Video Lane Detection [19.8] 本稿では,ビデオレーン検出のための新しいアルゴリズムを提案する。
まず、現在のフレームの特徴マップを抽出し、レーンを含む障害物に対する潜時マスクを検出する。
そこで我々は,OMR(Occlusion-aware memory-based refinement)モジュールを開発した。
実験の結果,提案アルゴリズムはビデオレーンデータセット上で既存の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:05:07 GMT)
3D Gaussian Editing with A Single Image [19.7] 本稿では,3次元ガウシアンスプラッティングをベースとしたワンイメージ駆動の3Dシーン編集手法を提案する。
提案手法は,ユーザが指定した視点から描画した画像の編集版に合わせるために,3次元ガウスを最適化することを学ぶ。
実験により, 幾何学的詳細処理, 長距離変形, 非剛性変形処理における本手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:17:42 GMT)
$χ$SPN: Characteristic Interventional Sum-Product Networks for Causal Inference in Hybrid Domains [19.4] 確率変数が存在する場合の介入分布を推定できるaCharacteristic Interventional Sum-Product Network(chi$SPN)を提案する。
$chi$SPNは、介入SPN(iSPN)の葉の特徴的な関数を使い、離散的かつ連続的な確率変数に対する統一的なビューを提供する。
ニューラルネットワークを用いて、インターバルデータを用いて学習したiSPNのパラメータを推定する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:31:32 GMT)
Knowledge in Superposition: Unveiling the Failures of Lifelong Knowledge Editing for Large Language Models [19.4] 知識編集は、大規模な言語モデルにおいて、時代遅れまたは誤った知識を更新することを目的としている。
現在の知識編集手法は生涯編集のスケーラビリティに限界がある。
本研究は,生涯編集において知識編集が失敗する根本的な理由を考察する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:43:32 GMT)
Navigating Governance Paradigms: A Cross-Regional Comparative Study of Generative AI Governance Processes & Principles [19.3] 本稿では, リスク, ルール, 結果, 原則, あるいは世界中のさまざまな地域をまたがる混合に基づく, 初期段階および多様なガバナンスアプローチのニュアンスを明らかにすることを目的とする。
本研究は、欧州連合(EU)、米国(米国)、中国(CN)、カナダ(CA)、英国(UK)、シンガポール(SG)の6つの領域の統治アプローチに基づく、調和したGenAIフレームワーク「H-GenAIGF」を紹介する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:16:44 GMT)
FOSS: A Self-Learned Doctor for Query Optimizer [19.2] FOSSと呼ばれる深層強化学習に基づくクエリ最適化のための新しいフレームワークを提案する。
Fossは従来のブートストラップによって生成された当初の計画から最適化を開始し、計画の最適下ノードを漸進的に洗練する。
結合順序ベンチマーク, TPC-DS, Stack OverflowベンチマークにおけるFOSSの性能評価を行った。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:27:05 GMT)
Contextual Distillation Model for Diversified Recommendation [19.1] 文脈蒸留モデル(CDM)は、多様化に対処する効率的なレコメンデーションモデルである。
本稿では,肯定的コンテキストと否定的コンテキストの両方をモデル化するための注意機構を用いたコントラスト型コンテキストエンコーダを提案する。
推論中は、推薦と学生モデルスコアを線形に組み合わせてランキングを行う。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 04:52:02 GMT)
Demonstration of 3 V Programmable Josephson Junction Arrays Using Non-Integer-Multiple Logic [19.0] 本稿では、プログラマブルなジョセフソン電圧標準に使用できる整数表現のための新しい種類のプログラマブル論理を実証する。
これは、ほとんどのビットにおけるジャンクションの数を、通常のバイナリ論理や三項論理とは異なる可変整数値にすることができる。
超伝導短絡による短絡の欠落は、この論理の下で許容することができる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 02:18:42 GMT)
Towards Real-time Video Compressive Sensing on Mobile Devices [19.0] Video Snapshot Compressive Imaging (SCI)は、低速2Dカメラを使用して、スナップショット圧縮計測として高速シーンをキャプチャする。
本稿では,モバイル機器上でリアルタイムに動作可能なビデオSCI再構成手法であるMobileSCIを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:03:31 GMT)
DeepFace-Attention: Multimodal Face Biometrics for Attention Estimation with Application to e-Learning [18.4] 本研究では,Webカメラビデオに適用した顔分析手法のアンサンブルを用いて,注意レベル(認知的負荷)を推定する革新的な手法を提案する。
我々のアプローチは、最先端の顔分析技術を適用し、ユーザの認知的負荷を、高い注意や低い注意の形で定量化する。
提案手法は,mEBAL2ベンチマークを用いて,既存の最先端の精度を向上する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:34:34 GMT)
UAHOI: Uncertainty-aware Robust Interaction Learning for HOI Detection [18.3] 本稿では,Human-Object Interaction(HOI)検出について述べる。
与えられた画像やビデオフレーム内の人間とオブジェクト間の相互作用を識別し、理解するという課題に対処する。
本研究では,不確実性を考慮したロバストなヒューマンオブジェクトインタラクション学習であるtextscUAHOIを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:06:39 GMT)
GRIF-DM: Generation of Rich Impression Fonts using Diffusion Models [18.2] 我々は、特定の印象を鮮明に具現化するフォントを生成するための拡散法である「usmethod」を導入する。
MyFontsデータセットを用いて,本手法が現実的で活気があり,高忠実なフォントを生成可能であることを確認した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 02:26:46 GMT)
Unraveling Instance Associations: A Closer Look for Audio-Visual Segmentation [18.0] オーディオ視覚セグメント化(AVS)は、音声視覚キューに基づいて、正確に音を分割する作業である。
我々は,難易度と比較的偏りのない高画質な視覚的セグメンテーション・ベンチマークを構築するための新たなコスト効率戦略を提案する。
既存のAVSデータセットおよび我々の新しいベンチマークで行った実験により、我々の手法は最先端(SOTA)セグメンテーションの精度を達成できた。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:21:44 GMT)
BadMerging: Backdoor Attacks Against Model Merging [17.8] 我々は、モデルマージン(MM)用に特別に設計された最初のバックドアアタックであるBadMergingを紹介する。
BadMergingは、2段階の攻撃機構と、組み込みバックドアの堅牢性を高めるための新しい特徴補間ベースの損失を含んでいる。
実験の結果,BadMergingは様々なMMアルゴリズムに対して顕著な攻撃を行うことがわかった。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:19:23 GMT)
CLIP with Generative Latent Replay: a Strong Baseline for Incremental Learning [17.6] インクリメンタル・プロンプト学習のための連続的生成学習を提案する。
変分オートエンコーダを用いてクラス条件分布を学習する。
このような生成的リプレイアプローチは、ゼロショット機能を改善しつつ、新しいタスクに適応できることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:12:07 GMT)
Amuro & Char: Analyzing the Relationship between Pre-Training and Fine-Tuning of Large Language Models [17.3] 本研究では,複数の中間学習モデルチェックポイントの微調整による事前学習と微調整の関係について検討する。
18のデータセットで得られた結果は、事前学習が微調整後に発表される潜在的な方法でモデルを改善することを示唆している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:23:38 GMT)
Practical Considerations for Differential Privacy [17.3] 差分プライバシーは統計データリリースのゴールドスタンダードである。
広範に普及する過程における現実的な障害について検討する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:28:28 GMT)
Disentangle and denoise: Tackling context misalignment for video moment retrieval [16.9] Video Moment Retrievalは、自然言語クエリに従ってコンテキスト内のビデオモーメントを見つけることを目的としている。
本稿では,正確なモーダル・モーダル・コンテクスト・デノイング・ネットワーク(CDNet)を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:00:27 GMT)
Robust Active Learning (RoAL): Countering Dynamic Adversaries in Active Learning with Elastic Weight Consolidation [16.9] 本稿ではロバスト・アクティブ・ラーニング(RoAL)を紹介する。ロバスト・アクティブ・ラーニング(RoAL)は,ロバストなアクティブ・ラーニング・フレームワークを開発する上での課題に対処するための新しいアプローチである。
本稿では,アクティブな学習フレームワークに重大な脅威をもたらす動的敵攻撃を提案する。
次に、EWCとアクティブラーニングを組み合わせることで、動的逆境攻撃による破滅的な忘れを軽減できる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:22:13 GMT)
Persona Inconstancy in Multi-Agent LLM Collaboration: Conformity, Confabulation, and Impersonation [16.8] マルチエージェントAIシステムは、科学的および実践的な応用において、集合的な意思決定をシミュレートするために使用することができる。
我々は、相互協力や議論に携わるAIエージェントのアンサンブルについて、個人の反応やチャットの書き起こしを分析して検討する。
以上の結果から,複数エージェントによる議論が,多面的な視点を反映する集合的AI決定を支援することが示唆された。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:01:13 GMT)
The Complexity of Manipulation of k-Coalitional Games on Graphs [16.2] グラフ上の$k$-coalitionalゲームにおける操作の複雑さについて検討する。
我々は,新しいタイプの操作,社会的に意識した操作を導入し,マニピュレータは社会福祉を減らさずにその効用を高めたいと考えた。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:29:30 GMT)
Towards Few-shot Self-explaining Graph Neural Networks [16.1] 数ショット設定で予測をサポートするための説明を生成する新しいフレームワークを提案する。
MSE-GNNは説明器と予測器からなる2段階の自己説明構造を採用している。
MSE-GNNは、高品質な説明を生成しながら予測タスクにおいて優れた性能が得られることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:31:11 GMT)
Gradient Alignment Improves Test-Time Adaptation for Medical Image Segmentation [15.8] 勾配アライメントに基づくテスト時間適応法(GraTa)による勾配方向と学習率の向上
GraTa法は、勾配アライメントを容易にするために、擬似的勾配に補助勾配を組み込む。
擬似勾配と補助勾配のコサイン類似性に基づく動的学習率を設計する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:37:07 GMT)
Exploring LLM Multi-Agents for ICD Coding [15.7] ICD符号化のためのマルチエージェント方式は実世界の符号化プロセスを効果的に模倣し、一般的な符号と稀な符号の両方の性能を向上させる。
提案手法は, 事前学習や微調整を必要とする最先端のICD符号化手法に匹敵する結果を得るとともに, 稀なコード精度, 説明可能性で性能を向上する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:32:25 GMT)
Cross-aware Early Fusion with Stage-divided Vision and Language Transformer Encoders for Referring Image Segmentation [15.7] セグメンテーションの参照は、自然言語表現に関連する対象オブジェクトをセグメンテーションすることを目的としている。
近年のモデルは、視覚エンコーダの中間段階における言語機能との早期融合に焦点を当てている。
本稿では,段階分割ビジョンと言語トランスフォーマーエンコーダを用いた新しいアーキテクチャであるクロスアウェアアーリーフュージョンを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:17:41 GMT)
A Nested Graph Reinforcement Learning-based Decision-making Strategy for Eco-platooning [15.5] 大規模な混合プラトンでは、車両の不均一性と予測不可能な交通条件が仮想ボトルネックを引き起こす。
ネストグラフ強化学習に基づく意思決定戦略を導入する。
この戦略は協調的な意思決定を改善し、エネルギー効率を確保し、混雑を軽減する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:18:51 GMT)
Decoder ensembling for learned latent geometries [15.5] 我々は、関連する予想多様体上の測地線を容易に計算する方法を示す。
このシンプルで信頼性が高く、簡単に使える潜在測地に一歩近づきます。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:35:41 GMT)
Rethinking the Key Factors for the Generalization of Remote Sensing Stereo Matching Networks [15.5] ステレオマッチングタスクは高価な空中LiDARデータに依存している。
本稿では,3つの視点から重要なトレーニング要因について検討する。
一般化性能のよい教師なしステレオマッチングネットワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:26:10 GMT)
SWaT: Statistical Modeling of Video Watch Time through User Behavior Analysis [15.2] 本稿では,ビデオの視聴時の様々なユーザの行動仮定を統計的視聴時間モデルに変換するホワイトボックス統計フレームワークを提案する。
当社のモデルは、2つのパブリックデータセット、大規模なオフライン産業データセット、および数億人のデイリーアクティブユーザを持つ短いビデオプラットフォーム上でオンラインA/Bテストで広範囲にテストしています。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:19:35 GMT)
Assessing the Role of Lexical Semantics in Cross-lingual Transfer through Controlled Manipulations [15.2] 我々は、英語と対象言語の違いが、英語の事前訓練された表現空間と言語を整合させる能力にどのように影響するかを分析する。
文字や単語の順序などの特性はアライメント品質に限られた影響しか与えないが、翻訳エントロピーの尺度を用いて定義する2言語間の語彙マッチングの程度は、それに大きな影響を及ぼすことを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:59:20 GMT)
Bridging Quantum Computing and Differential Privacy: Insights into Quantum Computing Privacy [15.0] 微分プライバシー(DP)は量子領域、すなわち量子微分プライバシー(QDP)に拡張されている。
QDPは、プライバシ保護量子コンピューティングに対する最も有望なアプローチの1つになるかもしれない。
本稿では,QDPの各種実装とその性能を,DP設定下でのプライバシパラメータの観点から概説する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:05:55 GMT)
Protected Test-Time Adaptation via Online Entropy Matching: A Betting Approach [15.0] オンライン自己学習によるテスト時間適応のための新しい手法を提案する。
提案手法は,マーチンガレットとオンライン学習の概念を組み合わせることで,分布変化に反応可能な検出ツールを構築する。
実験結果から, 分散シフト時のテスト時間精度は, 精度とキャリブレーションを保ちながら向上することが示された。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:40:57 GMT)
Alignment-Enhanced Decoding:Defending via Token-Level Adaptive Refining of Probability Distributions [14.9] 本稿では,アライメント・エンハンスメント・デコーディング(Alignment-Enhanced Decoding, AED)を提案する。
5つのモデルと4つの一般的なジェイルブレイク実験を行い、その結果、我々のアプローチの有効性を検証した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:51:21 GMT)
Quantum-Classical Machine learning by Hybrid Tensor Networks [14.9] 本研究では,テンソルネットワークと古典ニューラルネットワークを組み合わせた量子古典ハイブリッドネットワーク(HTN)を提案する。
量子分類や量子オートエンコーダなど,HTNの応用の可能性を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:43:55 GMT)
LoAS: Fully Temporal-Parallel Datatflow for Dual-Sparse Spiking Neural Networks [14.8] スパイキングニューラルネットワーク(SNN)は、リソースに制約のあるエッジデバイスを駆動する可能性から、過去10年間で大きな研究注目を集めている。
既存のSNNアクセラレーターはスパーススパイクを高密度で処理するが、スパースウェイトを持つSNNでは機会を探索することができない。
二重スパースSNNの加速について検討し、そのコア演算、スパース行列-スパース-マトリクス乗算(spMspM)に着目した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:25:35 GMT)
AI Coders Are Among Us: Rethinking Programming Language Grammar Towards Efficient Code Generation [14.8] 本稿では,AI指向文法の概念を提案する。
これは、AIモデルの動作メカニズムにより良い方法でコードを表現することを目的としています。
AI指向文法で書かれたコードはフォーマットを捨て、最小限のトークンを使用する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:34:18 GMT)
A Survey of Fragile Model Watermarking [14.5] モデルの脆弱な透かしは、改ざんを検出する強力なツールとして徐々に現れてきた。
本稿では, モデルフラクタブルウォーターマーキングの創業以来の課題について概説する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:02:33 GMT)
BioRAG: A RAG-LLM Framework for Biological Question Reasoning [14.1] 本稿では,Large Language Models (LLMs) フレームワークを組み込んだ新規な検索拡張生成(RAG)であるBioRAGを紹介する。
このアプローチは、基本的な知識として2200万の科学論文を解析、索引付け、セグメント化することから始まり、続いて、このドメインに適した特別な埋め込みモデルをトレーニングします。
最新の情報を必要とするクエリに対して、BioRAGは質問を分解し、検索エンジンに組み込まれた反復的な検索プロセスを用いてステップバイステップの推論を行う。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:54:24 GMT)
MagicFace: Training-free Universal-Style Human Image Customized Synthesis [13.9] MagicFaceは、ユニバーサルスタイルのヒューマンイメージパーソナライズされた合成方法である。
トレーニング不要な方法で、任意のスタイルの人間に対して、シングル/マルチコンセプトのカスタマイズを可能にする。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:08:46 GMT)
A Data-Driven Defense against Edge-case Model Poisoning Attacks on Federated Learning [13.9] 本稿では,フェデレートラーニングシステムにおけるモデル中毒に対する効果的な防御法を提案する。
DataDefenseは、防衛データセットの各例を毒または清潔とマークする有毒データ検出モデルを学ぶ。
標準的な攻撃設定では攻撃成功率を少なくとも40%、いくつかの設定では80%以上削減することができる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:37:29 GMT)
Relational Graph Convolutional Networks Do Not Learn Sound Rules [13.7] グラフニューラルネットワーク(GNN)は、知識グラフ(KG)の欠落した事実を予測するために頻繁に使用される。
最近の研究は、広く使われている論理ベースの形式主義であるDatalogを使って、それらの予測を説明することを目的としている。
我々は、KGs、R-GCNの最も人気のあるGNNアーキテクチャの1つを考察し、その予測を説明するためのルールを抽出する2つの方法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:46:42 GMT)
Value-Based Rationales Improve Social Experience: A Multiagent Simulation Study [13.6] 意思決定に価値を取り入れたエージェントを実現するためのフレームワークであるExannaを提案する。
Exannaagentは、行動に対する合理性を提供し、他者が提供する合理性を評価する際に、自分自身と他者の価値を考える。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:25:32 GMT)
Training Overhead Ratio: A Practical Reliability Metric for Large Language Model Training Systems [13.6] 大規模言語モデル(LLM)は、優れた能力でAI産業に革命をもたらしている。
これらのモデルのトレーニングには、大規模なGPUクラスタと大幅な計算時間が必要で、頻繁な障害が発生する。
本稿では, 耐故障性LLMトレーニングシステムの信頼性を評価するために, emphTraining Overhead Ratio (TOR) と呼ばれる新しい信頼性指標を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:55:28 GMT)
Research on Autonomous Robots Navigation based on Reinforcement Learning [13.6] 我々は、経路計画と意思決定プロセスを最適化するために、Deep Q Network (DQN) と Proximal Policy Optimization (PPO) モデルを使用します。
様々な複雑なシナリオにおいて,これらのモデルの有効性とロバスト性を検証した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 04:49:22 GMT)
Compact Model Training by Low-Rank Projection with Energy Transfer [13.4] 低ランクは従来の機械学習において重要な役割を果たすが、ディープラーニングではそれほど人気がない。
従来の低ランクネットワーク圧縮手法は、事前学習されたモデルと再学習を近似してネットワークを圧縮する。
我々は、低ランク圧縮ネットワークをスクラッチからトレーニングし、競争性能を向上する新しいトレーニング手法、低ランク投射とエネルギー伝達を考案した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:31:26 GMT)
MetaSeg: MetaFormer-based Global Contexts-aware Network for Efficient Semantic Segmentation [13.4] バックボーンからデコーダへのメタフォーマーアーキテクチャを活用する強力なセマンティックセグメンテーションネットワークであるMetaSegを提案する。
私たちのMetaSegは、MetaFormerアーキテクチャがデコーダやバックボーンの有用なコンテキストをキャプチャする上で重要な役割を担っていることを示しています。
これは、CNNベースのバックボーンをMetaFormerブロックを使って採用し、グローバルコンテキストをキャプチャするための新しい自己注意モジュールで構成されるMetaFormerベースのデコーダを設計する動機となります。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:16:52 GMT)
AutoCLIP: Auto-tuning Zero-Shot Classifiers for Vision-Language Models [13.0] AutoCLIPは、クラス記述子-画像類似性の統計に基づいて、推論時に各プロンプトテンプレートに画像毎の重みをチューニングする。
AutoCLIPは、幅広いビジョン言語モデル、データセットでベースラインを上回り、テンプレートを一貫して、最大3%精度でプロンプトすることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:06:00 GMT)
A Tale of Two DL Cities: When Library Tests Meet Compiler [12.8] DLライブラリのテスト入力からドメイン知識を抽出するOPERAを提案する。
OPERAはDLライブラリの様々なテストインプットから様々なテストを構築する。
多様性に基づくテストの優先順位付け戦略を取り入れて、これらのテストインプットを移行し実行します。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:25:37 GMT)
LLM-Enhanced Static Analysis for Precise Identification of Vulnerable OSS Versions [12.7] オープンソースソフトウェア(OSS)は、そのコラボレーティブな開発モデルとコスト効果の性質から、人気が高まっている。
開発プロジェクトにおける特定のソフトウェアバージョンの採用は、これらのバージョンが脆弱性をもたらす場合にセキュリティリスクをもたらす可能性がある。
脆弱性のあるバージョンを識別する現在の方法は、通常、事前に定義されたルールで静的解析を使用して、脆弱性パッチに関わるコードを分析してトレースする。
本稿では,C/C++で記述されたOSSの脆弱なバージョンを特定するために,Vercationを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:43:06 GMT)
TabularBench: Benchmarking Adversarial Robustness for Tabular Deep Learning in Real-world Use-cases [12.6] TabularBenchは、ディープラーニング分類モデルの堅牢性に関する最初の包括的なベンチマークである。
コンピュータビジョンにおける最先端の防御にインスパイアされた7つのロバスト化機構を実装した。
私たちはユースケースごとに実際のデータセットをキュレートし、何十万ものリアルな合成入力で強化しました。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:23:12 GMT)
RTAT: A Robust Two-stage Association Tracker for Multi-Object Tracking [12.4] RTATと呼ばれるロバスト2段アソシエーショントラッカーを提案する。
第1段のアソシエーションは、トラックレットと検出の間で行われ、高い純度でトラックレットを生成する。
第2段のアソシエーションはトラックレット間で行われ、完全な軌跡を形成する。
私たちのトラッカーは、主要なMOTメトリクスのほとんどでMOT17とMOT20ベンチマークのテストセットで第1位です。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:37:24 GMT)
Bottleneck Structure in Learned Features: Low-Dimension vs Regularity Tradeoff [12.4] 低次元表現の学習と特徴写像の複雑性/不規則性の最小化のバランスを定式化する。
大深度の場合、ほとんどすべての隠れ表現はおよそ$R(0)(f)$次元であり、ほとんど全ての重み行列は$W_ell$が$R(0)(f)$特異値である。
興味深いことに、大きな学習率の使用は、ほぼすべての層の表現の無限深度収束を保証する注文$O(L)$ NTKを保証するために要求される。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 19:39:16 GMT)
Quantum key distribution based on mid-infrared and telecom band two-color entanglement source [12.2] この研究は、一日中グローバルスケールの量子通信ネットワークを開発するための重要な一歩である。
長距離QKDは500km以上の自由空間と96kmの繊維ハイブリッドチャネルに同時に到達することができる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:40:51 GMT)
RepoHyper: Search-Expand-Refine on Semantic Graphs for Repository-Level Code Completion [12.2] Toolは、リポジトリレベルのコード補完に関連する複雑な問題に対処するために設計されたフレームワークである。
Em Repoレベルセマンティックグラフ(RSG)は、コードリポジトリの広大なコンテキストをカプセル化する、新しいセマンティックグラフ構造である。
評価の結果,ツールがリポジトリレベルのコード補完において,既存のテクニックを著しく上回っていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:15:31 GMT)
Implicit Causal Representation Learning via Switchable Mechanisms [11.9] 因果的メカニズムの暗黙的な学習は通常、ハードとソフトの介入という2つの介入データを含む。
本稿では,ソフト介入を用いた因果モデル学習の課題に対処し,暗黙的モデリングを継続する。
ICLR-SMは,異なる因果メカニズム間を切り替えるように設計された因果メカニズムスイッチ変数を用いて,ソフト介入の効果をモデル化する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:39:37 GMT)
Detecting Audio-Visual Deepfakes with Fine-Grained Inconsistencies [11.7] 空間領域と時間領域の両方において微妙なアーティファクトを検出するためのきめ細かいメカニズムを提案する。
まず,音声との不整合が生じやすい小さな空間領域を撮影できる局所視覚モデルを提案する。
第2に、トレーニングセットに微妙な時間的不整合を取り入れたサンプルを含む、時間的に局所的な擬似フェイク増強を導入する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:53:34 GMT)
An Offline Meta Black-box Optimization Framework for Adaptive Design of Urban Traffic Light Management Systems [11.7] 自動車の占有率が高い複雑な都市道路網は、しばしば交通渋滞に直面している。
現在の交通信号管理システムは人為的な意思決定に依存しており、多様な交通パターンに適応できない可能性がある。
オフラインのメタブラックボックス最適化を用いて,そのような設計コンポーネントの最適化を定式化するための,新規で実用的なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:57:58 GMT)
"How Big is Big Enough?" Adjusting Model Size in Continual Gaussian Processes [11.4] 多くの機械学習手法では、トレーニング前にモデルのキャパシティを制御するパラメータを設定する必要がある。
「これは、どのくらい大きいのか」という疑問に繋がる。
ここでは、データが段階的に利用可能になり、最終的なデータセットサイズがトレーニング前に分からない。
ほぼ最適性能を維持しつつ,これを自動調整する手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:40:00 GMT)
Operator Feature Neural Network for Symbolic Regression [11.3] 本稿では,演算子表現を用いた演算子特徴ニューラルネットワーク(OF-Net)を提案する。
演算子の特徴を数値損失に置き換えることで,対象表現の演算子の組み合わせを予測することができる。
提案手法を公開データセット上で評価した結果,より優れた回復率と高いR2$スコアが得られた。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:47:13 GMT)
Detecting Near-Duplicate Face Images [11.3] 我々は,関係を推定するためのグラフ理論アプローチを用いて,画像フィロジニーツリー(IPT)と呼ばれる木のような構造を構築する。
Image Phylogeny Forests (IPFs) と呼ばれるICTのアンサンブルを作成するために、我々の手法をさらに拡張する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:45:13 GMT)
Sonic: Fast and Transferable Data Poisoning on Clustering Algorithms [11.1] 本稿では,クラスタリングアルゴリズムに対する新規な遺伝的データ中毒攻撃であるSonicを提案する。
対象クラスタリングアルゴリズムに対するSonicの有効性と効率を実証的に実証した。
次に、クラスタリングアルゴリズムに対する中毒攻撃のスケーラビリティと伝達性に影響を与える要因を包括的に分析する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:43:59 GMT)
Moderator: Moderating Text-to-Image Diffusion Models through Fine-grained Context-based Policies [11.1] 我々は、管理者が細かいコンテンツモデレーションポリシーを指定できるポリシーベースのモデル管理システムであるModeratorを提案する。
モデレーターは、15回の試行で65%のユーザが適度なコンテンツを生成するのを防ぎ、残りのユーザーに対して平均8.3倍の望ましくないコンテンツを生成することを要求している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:44:46 GMT)
Constant-Overhead Magic State Distillation [11.0] マジックステート蒸留は、フォールトトレラント量子計算において重要ながリソース集約的なプロセスである。
既存のプロトコルは、多少の$gamma > 0$で、多対数的に増加するオーバーヘッドを必要とする。
我々は$mathcalO(1)$オーバーヘッド、つまり最適な$gamma = 0$を達成するプロトコルを開発する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:31:22 GMT)
A Comprehensive Survey on Synthetic Infrared Image synthesis [11.0] 合成赤外線シーンとターゲット生成は重要なコンピュータビジョン問題である。
リアルなIR画像の生成と、様々なアプリケーションのトレーニングとテストのターゲットを可能にする。
また、現実世界の赤外線データ収集に伴うコストとリスクの低減にも役立ちます。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:58:36 GMT)
Enhancing Equitable Access to AI in Housing and Homelessness System of Care through Federated Learning [10.6] 我々は、すべての機関が機密データを共有せずに予測モデルを協調的に訓練できるフェデレートラーニング(FL)アプローチを導入する。
これは、同意なしに機関間で識別情報を共有しないことによって、データ内の人々のプライバシを保ちながら達成される。
アルバータ州カルガリーの実世界のHHSCデータを用いた実験の結果、我々のFLアプローチは、データを完全に共有し、エージェンシー間でリンクした予測モデルをトレーニングする理想的なシナリオと同等のパフォーマンスを提供することを示した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 23:01:02 GMT)
Investigating Constraint Programming and Hybrid Methods for Real World Industrial Test Laboratory Scheduling [10.6] 本稿では,この問題に対する制約プログラミングモデルと探索戦略について述べる。
CPソルバとMIPソルバを用いて実世界の実験室データと異なるサイズの生成されたインスタンスのセットを用いて評価を行った。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 19:34:51 GMT)
Rethinking Open-Vocabulary Segmentation of Radiance Fields in 3D Space [10.5] 本稿では,NeRFと3DGSでモデル化されたシーンの3次元理解を向上する上での課題を再考する。
言語埋め込みフィールドをトレーニングするために、直接3Dポイントを監督します。
マルチスケールの言語埋め込みに頼ることなく、最先端の精度を実現する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:50:02 GMT)
NIGHT -- Non-Line-of-Sight Imaging from Indirect Time of Flight Data [10.5] 最近の研究は、カスタム・ダイレクト・タイム・オブ・フライト・センサーによって生成された過渡撮像データを活用する可能性を示した。
ハードウェアを必要とせずに、市販の間接飛行時センサのデータのみを用いてこの問題に対処する。
我々は、仮想ミラーとして光が反射する表面を再構成できるディープラーニングモデルを導入する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:39:06 GMT)
CAPRI-FAIR: Integration of Multi-sided Fairness in Contextual POI Recommendation Framework [10.5] 本稿では,既存モデルにおける提供者と消費者の公正性を含む手法を開発する。
実験により,再装飾項目における提供者公正度に対する線形スコアリングモデルが,性能と長期露光のバランスを最大化できることが示されている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:46:43 GMT)
Boosting Unconstrained Face Recognition with Targeted Style Adversary [10.4] ラベル付き集合とラベルなし集合のインスタンスレベルの特徴統計を補間することにより、トレーニングデータをシンプルかつ効果的に拡張する手法を提案する。
TSA(Targeted Style Adversary)と呼ばれるこの手法は,入力領域が特徴統計に反映され,(ii)顔認識モデルの性能がスタイル情報に影響されるという2つの観測結果によって動機付けられている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:13:03 GMT)
Tree Attention: Topology-aware Decoding for Long-Context Attention on GPU clusters [10.4] 自己アテンションは、シーケンス長の複雑さのため、重要な計算ボトルネックである。
本研究では、勾配が自己アテンションブロックを計算するスカラーエネルギー関数を導出する。
我々の定式化により,木伐採により,配列軸を横断する還元を効率的に並列に計算できることが判明した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:47:31 GMT)
WeKnow-RAG: An Adaptive Approach for Retrieval-Augmented Generation Integrating Web Search and Knowledge Graphs [10.4] 本稿では,Web検索と知識グラフを統合したWeKnow-RAGを提案する。
まず,知識グラフの構造化表現と高次ベクトル検索の柔軟性を組み合わせることで,LLM応答の精度と信頼性を向上させる。
提案手法は,情報検索の効率と精度を効果的にバランスさせ,全体の検索プロセスを改善する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:19:16 GMT)
Time Series Predictions in Unmonitored Sites: A Survey of Machine Learning Techniques in Water Resources [10.3] モニタリングされていない場所での動的環境変数の予測は、水資源科学の長年の課題である。
現代の機械学習手法は、水文時系列予測のためのプロセスベースおよび経験的モデルよりもますます優れている。
ストリームフロー,水質,その他の水資源予測における機械学習の最先端技術応用について概説する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:20:19 GMT)
Domain-invariant Representation Learning via Segment Anything Model for Blood Cell Classification [10.2] 血液細胞分類のためのドメイン不変表現学習(DoRL)の新たな枠組みを提案する。
DoRLの利点は、教師なしの方法で様々な血液細胞データセットからドメイン不変表現を抽出できることである。
提案したDoRLは最先端のクロスドメイン性能を実現し,既存の手法をはるかに上回っている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:24:13 GMT)
ONSEP: A Novel Online Neural-Symbolic Framework for Event Prediction Based on Large Language Model [10.1] オンラインニューラル・シンボリックイベント予測フレームワークについて紹介する。
ONSEPは動的因果ルールマイニングと二重履歴拡張生成を取り入れている。
我々のフレームワークは、多様なデータセットにわたる顕著なパフォーマンス向上を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:28:19 GMT)
Unleashed from Constrained Optimization: Quantum Computing for Quantum Chemistry Employing Generator Coordinate Method [10.0] 本稿では,ユニタリ結合クラスタ(UCC)励起ジェネレータのプールから多体基底集合を頑健に構築する適応型スキームを提案する。
このアプローチは、VQE/ADAPT-VQEエネルギーに厳密な下界を与える一般化固有値問題をもたらす。
また、励起状態と動的性質の計算をサポートし、化学におけるより高度な量子シミュレーションのステージを設定する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:40:55 GMT)
Self-augmented Gaussian Splatting with Structure-aware Masks for Sparse-view 3D Reconstruction [10.0] スパースビュー3D再構成は、コンピュータビジョンにおいて非常に難しい課題である。
本稿では,構造対応マスクにより拡張された自己拡張型粗大なガウススプラッティングパラダイムを提案する。
本手法は,知覚的品質と効率の両面において,スパース入力ビューの最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 05:20:44 GMT)
MedAugment: Universal Automatic Data Augmentation Plug-in for Medical Image Analysis [9.7] データ拡張(DA)は、データ不足を軽減するためにコンピュータビジョンで広く活用されている。
医学画像解析(MIA)におけるDAは、複数の課題に直面している。
我々はMedAugmentと呼ばれる効率的かつ効果的な自動DA手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:08:55 GMT)
Large Language Models Know What Makes Exemplary Contexts [9.7] In-context Learning (ICL) は、Large Language Model (LLM) の発展において重要な機能であることが証明されている。
本稿では,LLMのための統合フレームワークを提案する。このフレームワークにより,影響力のあるインコンテキストのサンプルを自己選択してコンテキストを構成することができる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:32:41 GMT)
Fast Training Dataset Attribution via In-Context Learning [9.5] 我々は、インコンテキスト学習とプロンプトエンジニアリングを用いて、インストラクションチューニングされた大規模言語モデル(LLM)におけるトレーニングデータの貢献度を推定する。
本研究では,(1)LLM出力のコンテクストと非コンテクストとの差を測定する類似性に基づくアプローチと,(2)コントリビューションスコアを行列因数分解タスクとして識別する問題をモデル化する混合分布モデルアプローチを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:48:45 GMT)
NL2OR: Solve Complex Operations Research Problems Using Natural Language Inputs [9.1] オペレーションリサーチ(OR)は、数学的モデルを使用して意思決定を強化するが、これらのモデルを開発するには専門家の知識が必要であり、時間を要する可能性がある。
本稿では,Large Language Model (LLM) の最近の進歩を利用して,自然言語を用いて表現された非専門的ユーザクエリからORソリューションを作成し,編集する手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:42:53 GMT)
DIffSteISR: Harnessing Diffusion Prior for Superior Real-world Stereo Image Super-Resolution [9.1] DiffSteISRは、現実世界のステレオ画像の再構築のための先駆的なフレームワークである。
DiffSteISRは、事前訓練されたテキスト-画像モデルに埋め込まれた強力な事前知識を利用して、失われたテクスチャの詳細を効率的に回収する。
DiffSteISRは低解像度ステレオ画像から自然的かつ正確なテクスチャを正確に再構成する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:49:50 GMT)
Graph Triple Attention Network: A Decoupled Perspective [9.0] グラフトランスフォーマーは、マルチビューカオスとローカルグローバルカオスの2つの主要な課題に直面している。
我々は、GTの高レベルな分離された視点を提案し、それらを3つのコンポーネントと2つの相互作用レベルに分解する。
DeGTAというグラフトリプルアテンションネットワークを設計し、多視点アテンションを別々に計算し、多視点ローカルおよびグローバル情報を適応的に統合する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:29:07 GMT)
Pauli Check Sandwiching for Quantum Characterization and Error Mitigation during Runtime [8.9] この研究は、パウリチェックサンドイッチ(PCS)を適用した新しい量子システムの特徴付けとエラー軽減フレームワークを提案する。
PCSとマルチプログラミングを組み合わせることで、量子プログラムの結果の非自明な忠実さが向上する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:24:53 GMT)
MEEG and AT-DGNN: Improving EEG Emotion Recognition with Music Introducing and Graph-based Learning [8.6] 音楽誘発脳波(EEG)記録のマルチモーダルコレクションであるMEEGデータセットについて述べる。
本稿では,脳波に基づく感情認識のための新しいフレームワークである動的グラフニューラルネットワーク(AT-DGNN)を用いた注意に基づく時間学習について紹介する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:06:32 GMT)
Simultaneous Task Allocation and Planning for Multi-Robots under Hierarchical Temporal Logic Specifications [8.5] 構文とセマンティクスの両面で,Sc-LTL仕様に階層構造を導入し,フラットな仕様よりも表現性が高いことを示した。
タスク割り当てと計画の同時実行を実現し,マルチロボットシステムの計画を合成するための検索ベースアプローチを開発する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:30:23 GMT)
BMX: Entropy-weighted Similarity and Semantic-enhanced Lexical Search [8.2] BMXは、エントロピー重み付き類似性とセマンティックエンハンスメント技術を組み込んだBM25の新規拡張である。
BMXはBM25を一貫して上回り、PLM/LLMベースの高密度検索を上回っている。
本研究は,古典的語彙探索と現代意味論的アプローチのギャップを埋めるものである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:18:03 GMT)
Graph Neural Networks in EEG-based Emotion Recognition: A Survey [8.0] 重要なトレンドは、脳波に基づく感情認識のためのグラフニューラルネットワーク(GNN)を開発することである。
情動脳波の脳領域依存性は、この領域のGNNと他の時系列領域のGNNを区別する生理的基盤を持つ。
脳波に基づく感情認識におけるGNN構築のための明確なガイダンスを提供するために,フレームワークの3段階から手法を分析し,分類する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:02:06 GMT)
Dinkel: Testing Graph Database Engines via State-Aware Query Generation [7.9] グラフデータベース管理システム(GDBMS)は、グラフデータを格納し、操作し、多くのデータ駆動アプリケーションの中核部分を形成する。
信頼性を確保するために、Cypherでクエリを生成することでGDBMSをテストするいくつかの方法が提案されている。
GDBMSのための複雑なCypherクエリを生成するための、新しい状態認識テスト手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:00:24 GMT)
Inverting estimating equations for causal inference on quantiles [7.8] 因果推論解のクラスを、潜在的な結果の平均をその量子化量に推定することから一般化する。
本研究の結果から, 平均因果推定値を用いて因果推定を行うことにより, 因果推定を容易化できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:59:46 GMT)
Why we should not (always) assume data generating distributions in Machine Learning [7.1] データ生成確率分布の概念は必ずしも良いモデルとは限りません。
抽象分布よりも有限集団に着目した代替フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:17:38 GMT)
Causal modelling without introducing counterfactuals or abstract distributions [7.1] 本稿では,すべての仮定が検証可能な有限集団に対する因果推論を治療学的予測として解釈する。
この新しい枠組みは、因果関係のモデル依存性と、統計的および科学的推論の違いを強調している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:01:52 GMT)
Adversarially robust clustering with optimality guarantees [7.1] 我々はガウス以下の混合系から得られるデータポイントをクラスタリングする問題を考察する。
ロイドアルゴリズムのような最適ラベル誤りを確実に達成する既存の手法は、通常、外れ値に対して脆弱である。
本稿では, 対数外乱が存在する場合でも, 座標中央値に基づく単純なロバストアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:53:41 GMT)
Supervised and Unsupervised Alignments for Spoofing Behavioral Biometrics [7.0] 生体認証システムはユーザ固有の特性に基づいており、通常は埋め込みと呼ばれる高次元表現に符号化される。
我々は,アライメント手法を用いて,2つの行動バイオメトリックシステムに対してスプーフィング攻撃を行う。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:46:59 GMT)
Enhancing Visual Question Answering through Ranking-Based Hybrid Training and Multimodal Fusion [7.0] Rank VQAモデルは、Faster R-CNNモデルと、事前訓練されたBERTモデルから得られたリッチセマンティックテキスト特徴を用いて抽出された高品質な視覚特徴を統合する。
回答の相対ランク付けを最適化するためにランキング学習モジュールが組み込まれ、回答精度が向上する。
我々のモデルは、標準VQAデータセットにおける既存の最先端モデルよりも大幅に優れています。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 05:18:43 GMT)
Joint Learning of Emotions in Music and Generalized Sounds [6.9] マルチドメイン学習手法として複数のデータセットを提案する。
我々のアプローチは、一般化された音と音楽の両方を特徴付ける特徴を包含する共通空間を作ることである。
異種モデルアーキテクチャを活用し,共通特徴空間で共同学習を行った。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:28:16 GMT)
Quantum criticality under imperfect teleportation [6.8] 絡み合い、測定、古典的な通信は、遠方間の量子状態のテレポーテーションを可能にする。
本研究は,プロトコルの不完全性が,それ以外は緊急に放送された臨界状態に作用する弱い測定値として効果的に現れることを示す。
その結果、エラーに対して最適化するテレポーテーションプロトコルを設計することができる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 04:51:29 GMT)
Planning with OWL-DL Ontologies (Extended Version) [6.8] フルパワー表現型DLをサポートするブラックボックスを提案する。
主要なアルゴリズムは、OWLによるPDDLへの計画仕様の書き直しに依存している。
いくつかのドメインからのベンチマークセットの実装を評価した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:27:02 GMT)
AI-guided inverse design and discovery of recyclable vitrimeric polymers [6.7] ビトリマー(Vitrimer)は、持続可能なポリマーの一種で、修復する能力を持つ。
我々は、100万の化学薬品からなる最初のビトリマーデータセットを構築し、そのうち8,424個のTgを計算する。
我々は311-317KのTgでトリマーを合成し,ヒーラビリティと流動性を実験的に実証した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:25:29 GMT)
AROID: Improving Adversarial Robustness Through Online Instance-Wise Data Augmentation [6.6] 対戦訓練(英語: Adversarial Training、AT)は、敵の例に対する効果的な防御である。
データ拡張(DA)は、AT向けに適切に設計され最適化された場合、ロバストなオーバーフィッティングの軽減に有効であることが示されている。
本研究は、ATの堅牢な一般化を改善するために、オンライン、例えばDAポリシーを自動的に学習する新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:49:55 GMT)
QirK: Question Answering via Intermediate Representation on Knowledge Graphs [6.5] 我々は、知識グラフ(KG)上の自然言語質問に答えるシステムQirKを実演する。
QirKは、新興のLarge Language Models(LLMs)の範囲を超えて、構造的に複雑な質問に答えることができます。
QirKのデモビデオはhttps://youtu.be/6c81BLmOZ0Uで公開されている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:19:25 GMT)
Safe Imitation Learning of Nonlinear Model Predictive Control for Flexible Robots [6.5] 模擬学習と予測安全フィルタを用いたモデル予測制御(NMPC)の安全な近似のためのフレームワークを提案する。
NMPCと比較して、シミュレーションにおいて3次元フレキシブルロボットアームを制御する場合、計算時間は8倍以上改善されている。
高速で安全な近似NMPCの開発は、産業における柔軟なロボットの採用を加速する可能性を秘めている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:40:17 GMT)
Optimising Dynamic Traffic Distribution for Urban Networks with Answer Set Programming [6.4] 本稿では,都市ネットワークにおける動的トラフィック分布の文脈において,ASPをうまく利用したアプリケーションを提案する。
特に、ASPはネットワーク内のすべての車両の"最適"ルートの計算に使われています。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:54:26 GMT)
Lost in Overlap: Exploring Watermark Collision in LLMs [6.4] 我々は、透かし攻撃の斬新で一般的な哲学として透かし衝突を導入する。
我々は、透かし衝突が全てのロジットベースの透かしアルゴリズムに脅威をもたらすという総合的なデモンストレーションを提供する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:15:00 GMT)
Quantifying over Optimum Answer Sets [6.4] ASP(Q)はエレガントでコンパクトな方法でモデリングを符号化する方法を欠いている。
本稿では、コンポーネントプログラムが弱い制約を含むことができるASP(Q)の拡張を提案する。
様々なアプリケーションシナリオを通して、新しいフォーマリズムのモデリング機能を紹介します。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:53:13 GMT)
Enhancing Model Interpretability with Local Attribution over Global Exploration [6.3] 現在の帰属アルゴリズムはサンプル空間を探索することで各パラメータの重要性を評価する。
探索プロセス中に多数の中間状態が導入され、それはモデルのout-of-Distribution(OOD)空間に到達する可能性がある。
これらの特性を利用する局所属性(LA)アルゴリズムを提案する。
提案手法は,最先端の属性手法と比較して平均38.21%の属性効率向上を実現している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:53:08 GMT)
MedTsLLM: Leveraging LLMs for Multimodal Medical Time Series Analysis [6.3] MedTsLLMは、時系列データとリッチな文脈情報をテキスト形式で統合し、生理的信号を解析する汎用多モーダル大規模言語モデル(LLM)フレームワークである。
本研究は,連続時間における意味的セグメンテーション,境界検出,異常検出という,臨床的関連性のある3つのタスクを実行する。
我々のモデルは、深層学習モデル、他のLSM、および複数の医療領域における臨床方法など、最先端のベースラインよりも優れています。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:57:05 GMT)
An Event Structure-aware Generative Model for Biomedical Event Extraction [6.3] GenBEEは、バイオメディカルイベント抽出のための構造対応プレフィックスで強化された生成モデルである。
大型言語モデル(LLM)から抽出した知識を活用するイベントプロンプトを構築する。
3つのベンチマークデータセットの実験では、GenBEEの有効性が示されている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:44:07 GMT)
Optical Music Recognition in Manuscripts from the Ricordi Archive [6.3] リコルディのアーカイブは、ドニゼッティ、ヴェルディ、プッチーニといった著名なオペラ作曲家の著名な音楽写本のコレクションであり、デジタル化されている。
我々は,ノート,ステーブ,クリーフ,消去,作曲家の注釈など,写本に描かれた様々な音楽要素を表すサンプルを自動的に抽出した。
我々は、識別された音楽要素を区別するために、複数のニューラルネットワークベースの分類器を訓練した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:29:11 GMT)
Hybrid entanglement and error correction in a scalable quantum network node [6.3] ダイヤモンド色中心に基づくハイブリッド量子ノードの精密かつ複雑な制御について報告する。
3つのメモリ量子ビットを3ビット繰り返し符号を用いて論理状態に符号化し、この論理量子ビットをフォトニック量子ビットで絡み合わせる。
本研究は,次世代量子リピータにおけるいくつかの重要な機能の実現可能性を示すものである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:01:49 GMT)
Deep Learning: a Heuristic Three-stage Mechanism for Grid Searches to Optimize the Future Risk Prediction of Breast Cancer Metastasis Using EHR-based Clinical Data [6.3] 我々は、ディープフィードフォワードニューラルネットワーク(DFNN)モデルを開発し、グリッドサーチにより最適化する。
我々は3段階のメカニズムとSSGS, RGS戦略を適用して, 8サイクルのグリッドサーチを行う。
その結果,5年,10年,15年の乳癌転移のリスク予測は,それぞれ18.6%,16.3%,17.3%改善した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:16:50 GMT)
Advancing Spatio-Temporal Processing in Spiking Neural Networks through Adaptation [6.2] 本稿では、適応LIFニューロンとそのネットワークの動的、計算的、および学習特性について分析する。
適応LIFニューロンのネットワークの優越性は、複雑な時系列の予測と生成にまで及んでいることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:49:58 GMT)
Perseus: Reducing Energy Bloat in Large Model Training [6.1] 多数のGPU上で大規模なAIモデルをトレーニングすることは、膨大なエネルギーを消費する。
本稿では,エネルギの肥大化とスループットの低下を緩和するトレーニングシステムPerseusを提案する。
P Perseusは、スループットの損失やハードウェアの変更なしに、大規模なモデルトレーニングのエネルギー消費を最大30%削減する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:54:57 GMT)
Building an Ethical and Trustworthy Biomedical AI Ecosystem for the Translational and Clinical Integration of Foundational Models [6.1] 基礎モデル(FM)は、バイオメディカルAIエコシステムにおいて注目を集めている。
我々は、バイオメディカルなAIコミュニティがこれらのモデルに責任を負い、効果的に活用することを目指している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 02:28:09 GMT)
CodeMirage: Hallucinations in Code Generated by Large Language Models [6.1] 大規模言語モデル(LLM)は、プログラム生成とコードの自動化において有望な可能性を示している。
LLMは幻覚を生成する傾向があり、すなわち、可塑性に聞こえるが誤りであるテキストを生成する。
コード幻覚のための最初のベンチマークであるCodeMirageデータセットを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:53:07 GMT)
Learning Optimal Signal Temporal Logic Decision Trees for Classification: A Max-Flow MILP Formulation [5.9] 本稿では,データから時間的時間的論理特性を推定するための新しい枠組みを提案する。
混合整数線形プログラミング最適化問題として推論過程を定式化する。
結果木に最大フローアルゴリズムを適用すると、この問題はグローバルな最適化問題に変換される。
我々は,2クラス,複数クラス,複雑な式分類シナリオを含む3つのケーススタディを実施している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:35:21 GMT)
Chiral-Extended Photon-Emitter Dressed States in Non-Hermitian Topological Baths [5.9] 非エルミート位相浴に結合した量子エミッタの非伝統的な量子光学挙動を予測した。
中間線間隙におけるエルミート様キラル境界状態と点間隙内のスキンモード様隠れ境界状態に加えて,特異なギャップ内キラルおよび拡張光子-エミッタ型服装状態が同定された。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:08:54 GMT)
Costal Cartilage Segmentation with Topology Guided Deformable Mamba: Method and Benchmark [5.9] 本稿では,TGDM (Topology-Guided deformable Mamba) と呼ばれる新しい深層学習手法を提案する。
本手法は, トポロジカルな事前情報を統合し, セグメンテーションプロセスの適応性と精度を向上させる変形可能なモデルを利用する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:31:19 GMT)
SYM3D: Learning Symmetric Triplanes for Better 3D-Awareness of GANs [5.8] SYM3Dは、自然と人造の物体で見られる主観対称性構造を活用するために設計された、新しい3D対応のGANである。
単視点画像のみを訓練しても, 詳細な形状やテクスチャを捉える上で, 優れた性能を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:05:45 GMT)
Advancing Interactive Explainable AI via Belief Change Theory [5.8] この種の形式化は、対話的な説明を開発するためのフレームワークと方法論を提供する、と我々は主張する。
まず,人間と機械の間で共有される説明情報を表現するために,論理に基づく新しい形式を定義した。
次に、対話型XAIの現実シナリオについて検討し、新しい知識と既存の知識の優先順位が異なり、フォーマリズムがインスタンス化される可能性がある。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:23:43 GMT)
Differentiating Policies for Non-Myopic Bayesian Optimization [5.8] 本稿では,ロールアウト関数とその勾配を効率的に推定し,サンプリングポリシを実現する方法を示す。
本稿では,ロールアウト関数とその勾配を効率的に推定し,サンプリングポリシを実現する方法について述べる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 21:00:58 GMT)
An Exploratory Case Study of Query Plan Representations [5.7] データベースシステムでは、クエリプランはクエリを実行するための一連の具体的な内部ステップである。
複数のテストアプローチでは、クエリプランを使用してバグを見つける。
統合されたクエリプラン表現により,これらの手法の実装が容易になることが期待できる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 23:56:37 GMT)
Generalization Enhancement Strategies to Enable Cross-year Cropland Mapping with Convolutional Neural Networks Trained Using Historical Samples [5.7] 大面積の農地をマッピングする精度は、高解像度衛星画像と深層学習(DL)モデルにより着実に改善されている。
しかし、効果的なDLモデルを開発するには、多くの場合、大きくて高価なラベルデータセットが必要である。
これは、農業の慣行や環境条件の変化により、年と地域の間でドメインシフトが発生するため、農業監視に不可欠な年次マップを作成する能力を制限する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 21:53:32 GMT)
Unsupervised Stereo Matching Network For VHR Remote Sensing Images Based On Error Prediction [5.7] VHRリモートセンシング画像のための新しい教師なしステレオマッチングネットワークを提案する。
予測誤差で信頼性をブリッジする軽量モジュールを導入し、コアモデルを洗練する。
US3DおよびWHU-Stereoデータセットの実験結果は、提案したネットワークが他の教師なしネットワークと比較して精度が高いことを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:59:04 GMT)
Depth Degeneracy in Neural Networks: Vanishing Angles in Fully Connected ReLU Networks on Initialization [5.7] 層数の関数としてReLUニューラルネットワークへの2つの入力間の角度の進化について検討する。
モンテカルロ実験を用いて理論的結果を検証し, 有限ネットワークの挙動を正確に近似することを示した。
また,深度縮退現象が実際のネットワークのトレーニングに悪影響を及ぼすかを実証的に検討した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:47:41 GMT)
Learning to Learn without Forgetting using Attention [5.7] 継続学習(きゅうがく、Continuous Learning, CL)とは、学習経験を維持しつつ、新たな知識を付加することで、時間とともに継続的に学習する能力である。
現在の機械学習手法は、以前に学んだパターンを上書きし、過去の経験を忘れやすい。
手作りの効果的な更新機構は難しいため,変圧器をベースとしたメタラーニングによるCLの強化を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:25:50 GMT)
Bipartite reweight-annealing algorithm to extract large-scale data of entanglement entropy and its derivative in high precision [5.7] エンタングルメントエントロピー(EE)とその誘導体の大規模データを抽出できる量子モンテカルロ法を提案する。
相転移点の発見と新しい相の探索にEEとその誘導体を用いることの可能性を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:34:06 GMT)
Kraken: Inherently Parallel Transformers For Efficient Multi-Device Inference [5.6] Krakenは、マルチデバイスシステムの効率的な推論のための標準的なTransformerアーキテクチャの進化である。
OpenWebTextでトレーニングすると、Krakenモデルは標準のTransformerと同じような難易度に達する。
SuperGLUEベンチマークでテストすると、Krakenはモデルサイズで平均35.6%のタイム・トゥ・ファースト・トークンをスピードアップする。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:24:03 GMT)
Segment Using Just One Example [5.6] 提案されたテクニックはトレーニングフェーズを含まないため、概念を理解するのに1つのサンプルイメージが必要である。
提案手法を建築と自動車の授業で評価した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:13:06 GMT)
Community Detection Guarantees Using Embeddings Learned by Node2Vec [5.5] node2vec が生成した埋め込みのクラスタリングは,ブロックモデルにおけるノードに対して,弱い一貫したコミュニティリカバリをもたらすことを示す。
また、これらの埋め込みをノードおよびリンク予測タスクに利用することについても論じる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 04:26:38 GMT)
Ranking evaluation metrics from a group-theoretic perspective [5.3] 一般的に使用される指標において、不整合評価や潜在的な不信の原因となる事例を示す。
分析では,不整合性評価を不信の原因とみなすべきではないことを強調し,評価指標のランク付けに光を当てた。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:06:58 GMT)
Fading memory and the convolution theorem [5.2] 因果フィルタと時間不変フィルタの連続性と減少メモリの位相的および解析的概念を紹介する。
主定理は、少なくとも共領域が有限次元であるとき、畳み込み表現の可用性が特徴づけられることを示している。
線形汎函数の入力空間と余領域がヒルベルト空間であるとき、最小の連続性と最小のフェードメモリ特性は、関連するカーネルヒルベルト空間の興味深い埋め込みの存在を保証する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:06:25 GMT)
Closed universes in two dimensional gravity [5.2] 閉宇宙を2次元重力の単純なモデルで研究する。
我々は、この理論の摂動的側面と非摂動的側面の間に、非常に強いコントラストといくつかの関係を見出した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 19:20:49 GMT)
A Probabilistic Approach to Learning the Degree of Equivariance in Steerable CNNs [5.1] ステアブル畳み込みニューラルネットワーク(SCNN)は、幾何学的対称性をモデル化することによってタスク性能を向上させる。
しかし、未知あるいは様々な対称性は、過剰に制約された重量と性能を低下させる可能性がある。
本稿では,SCNNの等価度を学習するための確率的手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:39:47 GMT)
A Survey of Open Source User Activity Traces with Applications to User Mobility Characterization and Modeling [4.9] ユーザモビリティ研究の最先端は、オープンソースのモビリティトレースに大きく依存している。
これらのトレースのほとんどは機能豊かで多様であり、提供される情報だけでなく、どのように利用され、活用されるかにも当てはまります。
本調査では,移動モード,データソース,収集技術を含むオープンソースモビリティトレースを分類する分類法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:58:57 GMT)
MetMamba: Regional Weather Forecasting with Spatial-Temporal Mamba Model [4.9] 本稿では,最新の状態空間モデルであるMambaをベースに構築された,ディープラーニングに基づく天気予報モデルMetMambaが,顕著な性能向上をもたらすことを示す。
また、グローバルホストモデルと組み合わせたトレーニングにより、ディープラーニングに基づく限定領域モデリングの実現可能性を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:18:38 GMT)
SAT Encoding of Partial Ordering Models for Graph Coloring Problems [4.8] グラフ着色問題と帯域幅着色問題に対する部分順序付けベースLPモデルの新たなSAT符号化を提案する。
広く研究されているGCPでは、新しいSATエンコーディングとDIMACSベンチマークセットの最先端アプローチを実験的に比較する。
理論解析により,部分順序付きSATとILPの定式化は古典的代入ベースモデルよりも大幅に小さいことがわかった。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:32:21 GMT)
Device-Independent Quantum Secure Direct Communication with User Authentication [4.8] デバイス非依存(DI)量子プロトコルは、使用するデバイスに依存しない量子通信を確保することを目的としている。
本稿では,送信側と受信側の両方の認証を確立するために,ユーザID認証を含む最初のDI-QSDCプロトコルを提案する。
このアプローチをDI量子対話(DI Quantum Dialogue, QD)プロトコルに拡張し, 双方が相互認証に基づいて秘密メッセージを送れるようにした。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:16:54 GMT)
Distilling the Knowledge in Data Pruning [4.7] 刈り込みサブセットのトレーニングにおいて,知識蒸留(KD)を取り入れたデータ刈り込みの適用について検討する。
我々は、データセット、プルーニング方法、および全てのプルーニング率において、大幅な改善を示す。
興味をそそる観察を行ない、より低いプルーニング率を使用すると、より大きな教師が精度を低下させ、驚くべきことに、学生よりも少ない能力の教師を雇うことで、結果が改善する可能性がある。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:08:45 GMT)
Infra-YOLO: Efficient Neural Network Structure with Model Compression for Real-Time Infrared Small Object Detection [4.6] InfraTinyという新しいデータセットが構築され、85%以上のバウンディングボックスは32x32ピクセル未満である(3218の画像と合計20,893バウンディングボックス)。
マルチスケールアテンション機構モジュール (MSAM) とFeature Fusion Augmentation Pyramid Module (FFAFPM) が提案され,組込みデバイスに展開された。
提案手法をInfra-YOLOと呼ばれるYOLOモデルに統合することにより、赤外線小物体検出性能が向上した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:49:14 GMT)
FedQUIT: On-Device Federated Unlearning via a Quasi-Competent Virtual Teacher [4.3] フェデレートラーニング(FL)は、機械学習モデルが協調的にトレーニングされた場合、個人のデータに対するより良いプライバシー保証を約束する。
FL参加者がその参加するFLフレームワークから離脱する権利を行使する場合、FLソリューションはすべての必要なステップを実行するべきである。
本稿では,FedQUITを提案する。FedQUITは知識蒸留を用いて,FLグローバルモデルからの忘れたデータの寄与を探索する新しいアルゴリズムである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:36:28 GMT)
Multi-graph Graph Matching for Coronary Artery Semantic Labeling [4.2] 冠状動脈意味的ラベル付けのためのマルチグラフグラフマッチング(MGM)アルゴリズムを提案する。
MGMアルゴリズムは、複数の血管木グラフにおける動脈間の類似性を評価し、各グラフ間のサイクル整合性を考慮して評価する。
718 ICAを用いた多地点データセットを用いて冠動脈セマンティックラベリングの精度0.9471の精度を実現した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 21:58:50 GMT)
Strongest nonlocal sets with minimum cardinality in multipartite systems [4.2] 量子非局所性(quantum nonlocality)は、最近多部量子システムで発表された量子非局所性の最も強い形式である。
mathbbCd_1otimes mathbbCd_2otimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCd
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:32:21 GMT)
PsyDI: Towards a Personalized and Progressively In-depth Chatbot for Psychological Measurements [4.2] PsyDIは、心理測定のための個人化された、そして、徐々に深いチャットボットである。
PsyDIは、ユーザ関連のマルチモーダル情報を使用し、カスタマイズされたマルチターンインタラクションを使用して、パーソナライズされ、容易にアクセス可能な計測を提供する。
心理学的特徴に関連するプロキシ変数のランク付けを学習する新しいトレーニングパラダイムを導入する。
スコアモデルにより、PsyDIはマルチターンインタラクションを通じて包括的で正確な測定を行うことができる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:34:18 GMT)
RECE: Reduced Cross-Entropy Loss for Large-Catalogue Sequential Recommenders [4.2] 本稿では,RECE(Reduced Cross-Entropy)の損失について紹介する。
RECEは、完全なCE損失の最先端性能を享受しながら、メモリ消費を大幅に削減する。
各種データセットによる実験結果から,RECEは既存の手法に比べて最大12倍のトレーニングピークメモリ使用量を削減できることがわかった。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:19:41 GMT)
SustainDC -- Benchmarking for Sustainable Data Center Control [4.2] データセンター(DC)のためのマルチエージェント強化学習(MARL)アルゴリズムをベンチマークするためのPython環境セットであるSustainDCを紹介する。
SustainDCは、ワークロードスケジューリング、冷却最適化、補助バッテリー管理などのカスタムDC構成とタスクをサポートする。
SustainDC上での各種MARLアルゴリズムの評価を行い, 各種DC設計, 位置, 気象条件, グリッドカーボン強度, 負荷負荷条件などを検討した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:43:52 GMT)
Crossover Designs in Software Engineering Experiments: Review of the State of Analysis [4.1] Vegasらは、ソフトウェア工学(SE)研究におけるクロスオーバー設計の実践状況についてレビューした。
本稿では,2015年から2024年にかけてのSE出版物におけるクロスオーバー設計実験の現状について概説する。
明確なガイドラインにもかかわらず、有効性に対する脅威は29.5%に過ぎなかった。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:49:25 GMT)
Eavesdropping Mobile Apps and Actions through Wireless Traffic in the Open World [4.1] 既存のトラフィック分析攻撃は主にTCP/IP層をターゲットにしているか、あるいはクローズドワールドの仮定に限定されている。
オープンワールド環境におけるWiFi MAC層トラフィックに基づいて,モバイルアプリとアプリ内アクションを推論する新しいシステムMACPrintを提案する。
実験の結果,MAC-Printはクローズドワールド設定におけるアプリや動作の認識において96%以上の精度を達成でき,オープンワールド設定では86%以上の精度が得られることがわかった。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:03:05 GMT)
How Industry Tackles Anomalies during Runtime: Approaches and Key Monitoring Parameters [4.0] 本稿では,様々な産業分野における異常や現在の異常検出手法を理解することを目的とする。
また、実行時の監視データを通じて異常を特定するのに必要なパラメータを特定することも目標としている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 21:10:15 GMT)
Out of the Loop: Structural Approximation of Optimisation Landscapes and non-Iterative Quantum Optimisation [4.0] 量子近似最適化アルゴリズム (quantum Approximate optimization algorithm, Qaoa) は、最適化のための量子古典的反復法として広く研究されている。
インスタンスに依存しないが問題固有の非定型計算に基づく新しいアルゴリズム変種を導入する。
我々のアプローチは、カオの量子非依存構造に関する長年の予想を証明することに基づいている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:04:57 GMT)
Trained Random Forests Completely Reveal your Dataset [3.9] ランダム森林のトレーニングに使用するデータセットを完全にあるいはほぼ完全に再構築できる最適化ベースの再構築攻撃を導入する。
本稿では, 最大目標条件下での復元問題を定式化する。
この問題はNPハードであり、制約プログラミングを用いて大規模に解決可能であることを実証する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:15:55 GMT)
BSRBF-KAN: A combination of B-splines and Radial Basis Functions in Kolmogorov-Arnold Networks [3.8] 本稿では,B-splines と radial basis function (RBF) を組み合わせたコルモゴロフ・アーノルドネットワーク (KAN) のBSRBF-KANを紹介する。
BSRBF-KANは、MNISTで平均97.55%、Fashion-MNISTで89.33%の精度で5回のトレーニングで安定している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:06:00 GMT)
Latent Anomaly Detection Through Density Matrices [3.8] 本稿では,密度推定に基づく異常検出手法の頑健な統計的原理と深層学習モデルの表現学習能力を組み合わせた,新しい異常検出フレームワークを提案する。
このフレームワークから派生した手法は、浅いアプローチと、データの低次元表現を学習するためにオートエンコーダを統合するディープアプローチの2つの異なるバージョンで示される。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:44:51 GMT)
Improved 3D Whole Heart Geometry from Sparse CMR Slices [3.7] 心臓磁気共鳴法(CMR)とCT法(CT)は、心臓血管疾患の患者を診断するための2つの一般的な非侵襲的画像診断法である。
CMRは通常、複数のスパース2Dスライスを取得し、スライス間には避けられない呼吸運動アーチファクトを持ち、CTは等方性密度データを取得するが、電離放射線を使用する。
スライスシフトアルゴリズム(SSA)、空間変換器ネットワーク(STN)、ラベル変換器ネットワーク(LTN)の組み合わせを検討する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:03:48 GMT)
Quantum Mpemba effects in many-body localization systems [3.6] 熱平衡に近づくことなく、多体局在相において対称性を完全に復元できることを示す。
また、多体局在の有効なモデルを用いて、対称性の復元と量子ムペンバ効果の理論解析を行う。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:00:47 GMT)
Online Uniform Allocation:Randomized Learning-Augmented Approximation Algorithms with Application to Digital Health [3.5] 本研究は,オンライン一様割当(OUA)の新たな課題として,未知の意思決定時間に均一に予算を分配することを目的とする。
この問題に対して設計された最初のランダム化アルゴリズムを提示し、その後、学習拡張を組み込むように拡張する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:02:40 GMT)
Mitigating Temporal Fragility in the XY Surface Code [3.5] 局所的量子ビットを小さなグリーンベルガー・ホルン・ザイリンガー状態に変換する論理的状態準備プロトコルを提案する。
この新たな手順では、1つの格子境界に沿った高レートエラーが論理的失敗を引き起こす可能性があることを証明している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:10:49 GMT)
Automated Retinal Image Analysis and Medical Report Generation through Deep Learning [3.4] 網膜疾患の増加は、医療システムにとって大きな課題となっている。
網膜画像から医療報告を生成する従来の方法は、手動による解釈に依存している。
この論文は、網膜画像の医療レポート生成を自動化する人工知能の可能性について考察する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:47:25 GMT)
SER Evals: In-domain and Out-of-domain Benchmarking for Speech Emotion Recognition [3.4] 音声感情認識(SER)は、強力な自己教師付き学習(SSL)モデルの出現に大きく貢献している。
本稿では,最先端SERモデルの堅牢性と適応性を評価するための大規模ベンチマークを提案する。
主に音声認識用に設計されたWhisperモデルは,言語横断SERにおいて,専用SSLモデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 23:33:10 GMT)
A Survey on Immersive Cyber Situational Awareness Systems [3.4] Immersive Cyber situational Awareness (ICSA) システムは、サイバーSAの認識、理解、投影のために、いくつかのユニークな可視化技術と相互作用機能を提供する。
本稿では,没入型可視化技術とインタラクション技術をICSAのレベルにマッピングすることで,ICSAシステムを設計・解析するための参照フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:49:39 GMT)
On Tables with Numbers, with Numbers [3.4] 我々は、その無関係、環境影響、社会的不平等の実現と悪化における役割、そして商業的応用と利益主導型研究との深い結びつきに基づいて、数字の表を論じる。
我々は,過去10年間の計算言語学研究のメタ分析から得られた経験的証拠を用いて,我々の議論を裏付ける。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:16:23 GMT)
A Multilevel Approach For Solving Large-Scale QUBO Problems With Noisy Hybrid Quantum Approximate Optimization [3.3] 既存の量子処理ユニット(QPU)がマルチレベル戦略においてサブソルバとしてどのように機能するかを実験的に検証する。
完全連結な 82$-qubit Sherrington-Kirkpatrick グラフに対して 10$ の近似解を求める。
量子最適化の結果は古典学と比較して解の質に関して競争力がある。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:06:32 GMT)
LiveFC: A System for Live Fact-Checking of Audio Streams [3.2] 我々は,リアルタイムにライブオーディオストリームの事実チェックを支援するプラットフォームを開発中である。
nameはユーザフレンドリーなインターフェースを持ち、検出されたクレームと、ライブストリームの正確性と証拠を表示する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:36:17 GMT)
Learning-based Models for Vulnerability Detection: An Extensive Study [3.1] 我々は、最先端の学習ベースアプローチの2つのタイプを広範かつ包括的に調査する。
本稿では,シーケンスベースモデルの優先度と,グラフベースモデルの限定能力について実験的に検証する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:01:30 GMT)
A General Framework for Constraint-based Causal Learning [3.0] これにより、因果学習の正確性条件を得るための一般的な枠組みが提供される。
最短マルコフ表現条件は、最大祖先グラフと有向非巡回グラフに対する最小性の概念から得られる最も弱い正当性条件であることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:16:02 GMT)
Kolmogorov-Arnold Networks (KAN) for Time Series Classification and Robust Analysis [3.0] Kolmogorov-Arnold Networks (KAN) は、MLP(Multi-Layer Perceptrons)に代わる有望な代替品として注目されている。
理論上は魅力的だが、Kaninは大規模なベンチマークデータセットの検証を必要とする。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:15:55 GMT)
A Study on Bias Detection and Classification in Natural Language Processing [2.9] 我々の研究の目的は、ヘイトスピーチの検出と分類のタスクにおいて、公開データセットをもっとうまく組み合わせてモデルを訓練する方法を決定することである。
我々は,これらの課題を実験の展開と合わせて議論し,異なるデータセットの組み合わせがモデルの性能に大きな影響を及ぼすことを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:49:24 GMT)
Interpretable Graph Neural Networks for Heterogeneous Tabular Data [2.8] IGNHは分類的特徴と数値的特徴の両方を扱い、学習プロセスを制約して正確な特徴属性を生成する。
IGNHが提供した特徴属性は,ホック後に計算されたShapley値と一致していることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:49:25 GMT)
Exact Trajectory Similarity Search With N-tree: An Efficient Metric Index for kNN and Range Queries [2.8] 類似検索は、あるクエリオブジェクトに類似したオブジェクトのコレクションを見つける問題である。
軌道は、車両、動物、公共交通機関、または人体の一部といった移動体の運動を記録している。
本稿では,距離関数DistanceAvgを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:21:28 GMT)
Efficient Retrieval with Learned Similarities [2.7] 最先端の検索アルゴリズムは、学習された類似点に移行した。
筆者らは,Mixture-of-Logits (MoL) が普遍近似であり,学習された類似度関数を全て表現できることを示した。
MoLはレコメンデーション検索タスクに新たな最先端結果を設定し、学習した類似性を持つ近似トップk検索は、最大2桁のレイテンシでベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 00:57:42 GMT)
Adaptive Behavioral AI: Reinforcement Learning to Enhance Pharmacy Services [2.7] モバイルヘルスアプリケーションを通じて個人化された行動介入を行うための強化学習運用システムを導入する。
我々は、薬剤師のためのオールインワンアプリであるSwipeRxで実行される一連の実験について論じる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:18:51 GMT)
A spectrum-based shortcut method for topological systems [2.7] 本研究では,マルチステートなLandau-Zenerアプローチを用いて,アディバチティのためのショートカットを構築するプロトコルを開発した。
提案プロトコルは理論モデルに適用可能であり,実験の難しさを増大させる必要はない。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:13:05 GMT)
Optimal Scalarizations for Sublinear Hypervolume Regret [2.7] 均一にランダムな重みを持つ超体積スカラー化は、O(T-1/k)$の最適サブボリューム超体積後悔境界が得られることを示す。
多目的線型包帯の設定のために、不必要な$textpoly(k)$依存を取り除くために$tildeO(d T-1/2 + T-1/k)$の後悔境界を得る新しい非ユークリッド解析を導出する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:42:58 GMT)
Virchow2: Scaling Self-Supervised Mixed Magnification Models in Pathology [2.7] 我々は6億2200万のパラメータ・ビジョン・トランスフォーマーであるVirchow2Gと、19億のパラメータ・ビジョン・トランスフォーマーであるVirchow2Gの2つの新しいモデルを紹介した。
上位の競合モデルと比較して,12のタイルレベルタスクにおけるアートパフォーマンスの状態を達成している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 21:18:38 GMT)
Optimizing HIV Patient Engagement with Reinforcement Learning in Resource-Limited Settings [2.6] CHARMアプリは、コミュニティヘルスワーカー(CHW)のためのAIネイティブモバイルアプリ
本稿では、CHARMの開発、統合、および今後の強化学習に基づく適応的介入について詳述する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:55:31 GMT)
Feedforward Quantum Singular Value Transformation [2.6] Feedforward QSVT (FQSVT) は、量子アルゴリズム設計の効率性と堅牢性を大幅に向上させるフレームワークである。
この結果から、FQSVTはエネルギー部分空間への量子状態の投射を指数関数的に加速させることができることがわかった。
超伝導量子ビットの文脈では、FQSVTはエネルギー部分空間を管理する強力なツールを提供する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:26:49 GMT)
SSL-SoilNet: A Hybrid Transformer-based Framework with Self-Supervised Learning for Large-scale Soil Organic Carbon Prediction [2.6] 本研究は,自己指導型コントラスト学習を通じて,マルチモーダル特徴間の地理的関連を学習することを目的とした,新しいアプローチを提案する。
提案手法は、2つの異なる大規模データセットに対して厳密なテストを行っている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:29:55 GMT)
Ranking and Combining Latent Structured Predictive Scores without Labeled Data [2.5] 本稿では,新しい教師なしアンサンブル学習モデル(SUEL)を提案する。
連続的な予測スコアを持つ予測器のセット間の依存関係を利用して、ラベル付きデータなしで予測器をランク付けし、それらをアンサンブルされたスコアに重み付けする。
提案手法の有効性は、シミュレーション研究とリスク遺伝子発見の現実的応用の両方を通じて厳密に評価されている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:14:42 GMT)
ML-Mamba: Efficient Multi-Modal Large Language Model Utilizing Mamba-2 [2.5] 本稿では,マルチモーダル言語モデルであるML-Mambaを紹介する。
トランスフォーマーベースのバックボーンを事前訓練したMamba-2モデルに置き換え、マルチモーダル学習に2次元視覚選択的走査機構を統合する方法を模索する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:42:02 GMT)
Measuring User Understanding in Dialogue-based XAI Systems [2.4] XAIの最先端は、単発、非個人化、一方通行の説明が特徴である。
本稿では,ユーザが学習しているモデルの予測をシミュレートして,3段階のユーザ理解を計測する。
我々は、高い理解率と低い理解率の集団間の相互作用のパターンを明らかにするために、データを分析した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:11:12 GMT)
Unleashing Artificial Cognition: Integrating Multiple AI Systems [2.4] 本稿では,人工知能の認知を解き明かすために,言語モデルとクエリ解析技術の革新的な融合を提案する。
我々のシステムは、Chessエンジンを言語モデルとシームレスに統合し、動きを予測し、戦略的説明を提供する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 02:28:19 GMT)
Wasserstein Gradient Flows of MMD Functionals with Distance Kernel and Cauchy Problems on Quantile Functions [2.3] Wasserstein gradient flow of maximum mean discrepancy (MMD) functionals $mathcal F_nu := textMMD_K2(cdot, nu)$ to given target measure $nu$ on the real line。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:28:21 GMT)
GRFormer: Grouped Residual Self-Attention for Lightweight Single Image Super-Resolution [2.3] Grouped Residual Self-Attention (GRSA) は2つの基本コンポーネントに特化している。
ES-RPBは、位置情報を表現する能力を改善するために、元の相対位置バイアスの代替となる。
実験では、GRFormerは、$times$2、$times$3、$times$4 SISRタスクに対して、最先端のトランスフォーマーベースのメソッドを上回っている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:56:35 GMT)
Using Explainable AI for EEG-based Reduced Montage Neonatal Seizure Detection [2.2] 新生児発作検出のゴールドスタンダードは、現在連続したビデオEEGモニタリングに依存している。
脳波モンタージュを低減した新生児発作検出プロセスを自動化するための新しい説明可能な深層学習モデルを提案する。
提案したモデルは、それぞれ曲線下面積(AUC)とリコールにおける8.31%と42.86%の絶対的な改善を達成している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:07:41 GMT)
Graph neural network surrogate for strategic transport planning [2.2] 本稿では,戦略的輸送計画のための代理モデルとして,高度なグラフニューラルネットワーク(GNN)アーキテクチャの適用について検討する。
グラフ畳み込みネットワーク(GCN: Graph Convolution Network)を基盤とした先行研究に基づいて、より表現力のあるグラフ注意ネットワーク(GAT: Graph Attention Network)と確立されたGCNの比較分析を行った。
本稿では,グラフベースモデルにおけるオーバー・スムーシング問題に対処する新しいGAT変種(GATv3)を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:18:47 GMT)
RSD-DOG : A New Image Descriptor based on Second Order Derivatives [2.2] 本稿では,2次画像統計・導出に基づく画像パッチ記述子について紹介する。
検討された3次元表面は、尾根、谷、崖などの2階目の特徴・統計が豊富である。
得られた記述子は、照明、スケール、回転、ぼかし、視点、圧縮のバリエーションを扱う際に優れた識別力を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:41:45 GMT)
Adaptive Basis Function Selection for Computationally Efficient Predictions [2.1] モデル領域のサブドメインにおける予測において,最も重要なBFを自動的に選択する手法を開発した。
これにより、予測精度を維持しながら、計算予測の計算複雑性を著しく低減できる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:53:18 GMT)
Posterior Covariance Structures in Gaussian Processes [2.1] 帯域幅パラメータと観測の空間分布が後部共分散にどのように影響するかを示す。
絶対余剰共分散場を効率的に測定するいくつかの推定器を提案する。
我々は、理論的な発見とその実践的応用を説明するために、幅広い実験を行っている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:56:45 GMT)
BiLSTM and Attention-Based Modulation Classification of Realistic Wireless Signals [2.1] 提案モデルでは,無線信号の複数の表現をネットワークへの入力として利用する。
BiLSTM層の後、重要な時間的特徴を強調するために注意層が使用される。
最近のリアルなRML22データセットの実験結果は、提案モデルの性能が99%の精度で向上したことを示している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 01:17:19 GMT)
Formally Verifying Deep Reinforcement Learning Controllers with Lyapunov Barrier Certificates [2.1] 離散時間システムのためのNLBベースの証明書をトレーニングし、検証するための新しい手法を提案する。
具体的には,高度に複雑なシステムの検証を簡略化する証明書合成手法を提案する。
DRL制御宇宙船の安全性と生存性を保証するためのケーススタディにより,本手法の利点を実証する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:45:17 GMT)
From Brazilian Portuguese to European Portuguese [2.0] ブラジル・ポルトガル語とヨーロッパ・ポルトガル語は同じ言語の2つの変種である。
2つの変種間での資源の入手にはかなりの不均衡がある。
この不平等は、ヨーロッパのポルトガル語話者が利用できる翻訳サービスの質に影響を与える可能性がある。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:58:48 GMT)
Generating Fock-state superposition from coherent state by quantum measurement [2.0] 我々は、ターゲット共振器のコヒーレント状態から任意のフォック状態と選択された重畳されたフォック状態を生成する。
このプロトコルは、共振器と補助量子ビットの連成自由進化によって効率的に構築することができる。
我々のプロトコルは、直接的にマルチ励起ベル状態の生成に拡張できる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:21:44 GMT)
Usefulness of data flow diagrams and large language models for security threat validation: a registered report [1.9] 脅威分析とリスクアセスメントは、新しいオードシステムのセキュリティ脅威を特定するために使用される。
完了の定義が欠如しているため、特定された脅威を検証する必要があるため、分析が遅くなる。
既存の文献では、脅威分析の全体的なパフォーマンスに焦点が当てられているが、これまでの研究では、アナリストが特定されたセキュリティ脅威を効果的に検証する前に、どの程度の深さを掘り下げなければならないかを調査していない。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:14:27 GMT)
Wilsonian Renormalization of Neural Network Gaussian Processes [1.9] 本稿では,ガウス過程(GP)回帰の文脈でWilsonian RGを実行するための実践的アプローチを示す。
GPカーネルの未学習モードを体系的に統合し,データをIRスケールに設定したGPのRGフローを得る。
このアプローチは、RGフローと学習可能モードと学習不可能モードとの自然な接続を提供することによって、RGとニューラルネットワークの間の構造的な類似性を越えている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:06:56 GMT)
PolyCL: Contrastive Learning for Polymer Representation Learning via Explicit and Implicit Augmentations [1.8] ラベルを使わずに高品質なポリマー表現を学習するための,自己指導型コントラスト学習パラダイムであるPolyCLを提案する。
我々のモデルは、学習性能を向上させるために、明示的かつ暗黙的な拡張戦略を組み合わせる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:43:22 GMT)
Patch-wise Auto-Encoder for Visual Anomaly Detection [1.8] 本稿では,AEのアノマリーに対する再構成能力を弱めることなく向上することを目的としたパッチワイド自動エンコーダフレームワークを提案する。
本手法は,Mvtec ADベンチマークの最先端性能を向上し,本モデルの有効性を実証する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:28:01 GMT)
Off-Policy Reinforcement Learning with High Dimensional Reward [1.7] 分布RL(DRL)は、ユークリッド空間における分布ベルマン作用素とのリターンの分布を研究する。
報酬空間が無限次元可分バナッハ空間であっても、ベルマン作用素の縮約性を証明する。
従来の強化学習手法を用いて,これまで難解であった問題に対処する新しいDRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:44:56 GMT)
Learning Decisions Offline from Censored Observations with ε-insensitive Operational Costs [1.7] 我々は、オフラインのデータ駆動方式で、保護されていない検閲に対処するために、エプシロンに敏感な運用コストを設計し、活用する。
線形回帰(LR)モデルとニューラルネットワーク(NN)を含む2つの代表的なMLモデルを訓練する。
理論結果は,LR-epsilonNVC,LR-epsilonNVC-R,NN-epsilonNVCの安定性と学習性を明らかにする。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 05:44:56 GMT)
QECO: A QoE-Oriented Computation Offloading Algorithm based on Deep Reinforcement Learning for Mobile Edge Computing [1.7] 深部強化学習(DRL)に基づく分散QoE指向計算オフロード(QECO)アルゴリズムを提案する。
シミュレーションの結果、QECOはエッジノードの計算資源を効率的に活用することを確認した。
これらの組み合わせは、既存のアルゴリズムと比較して、平均的なQoEの少なくとも37%の大幅な改善に寄与する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:19:31 GMT)
Low-latency machine learning FPGA accelerator for multi-qubit-state discrimination [1.7] 量子ビット状態を測定することは、量子コンピューティングにおいて基本的ながエラーを起こしやすい操作である。
ここでは、ニューラルネットワークをフィールドプログラマブルゲートアレイ(FPGA)上に展開するための統合的なアプローチを用いる。
マルチキュービット読み出しに完全接続型ニューラルネットワークアクセラレータを実装するのが有利であることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:00:57 GMT)
Protecting Onion Service Users Against Phishing [1.6] フィッシングサイトは、Torのタマネギサービスに共通する現象である。
フィッシングは 本物の玉ねぎのドメイン名と区別するのが 非常に難しいと フィッシングを悪用する
タマネギサービスのオペレータは、ユーザをフィッシングから守るためのいくつかの戦略を考案した。
訪問したサービスに関する痕跡を発生させることなく、ユーザーをフィッシングから守ることはできない。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 19:51:30 GMT)
Free electron topological bound state induced by light beam with a twisted wavefront [1.6] 超高速電子放出、顕微鏡、回折、コヒーレンスの最近の進歩は、光線で自由電子を操る素晴らしい能力を示している。
超高速電子-光相互作用における自由電子量子数探索の枠組みを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:40:53 GMT)
Drug Discovery SMILES-to-Pharmacokinetics Diffusion Models with Deep Molecular Understanding [1.5] ImagandはSMILES-to-Pharmacokinetic (S2PK)拡散モデルであり、SMILES入力に条件付けされたPKターゲット特性の配列を生成することができる。
Imagandは、データの重複する空間に対する有望なソリューションであり、研究者は薬物発見研究のためのリガンドPKデータを効率的に生成することができる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:01:02 GMT)
\textit{re}CSE: Portable Reshaping Features for Sentence Embedding in Self-supervised Contrastive Learning [1.5] textitreCSEは自己指導型コントラスト学習文表現フレームワークである。
textitreCSEはセマンティック類似性タスクにおいて競合性能を達成した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 05:09:42 GMT)
A System for Automated Unit Test Generation Using Large Language Models and Assessment of Generated Test Suites [1.5] 大規模言語モデル(LLM)はソフトウェア開発の様々な側面に適用されている。
textscAgoneTest: Javaプロジェクトのテストスイートを生成する自動システム。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 23:02:16 GMT)
Just Cluster It: An Approach for Exploration in High-Dimensions using Clustering and Pre-Trained Representations [1.4] 本稿では,3次元環境探索におけるクラスタリング表現の有効性について検討する。
本稿では,ランダムな表現と事前学習したDINO表現を用いて,状態をカウントするためのエピソードおよびグローバルクラスタリングを行う手法を提案する。
我々は,VizDoom と Habitat の環境に対するアプローチを評価し,この手法が他のよく知られた探索手法を上回ることを実証した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 19:08:48 GMT)
Interaction as Explanation: A User Interaction-based Method for Explaining Image Classification Models [1.4] コンピュータビジョンでは、説明可能なAI(xAI)手法は「ブラックボックス」問題を緩和しようとする。
従来のxAI手法は、モデル予測に影響を与える入力特徴の可視化に重点を置いている。
本稿では,画像分類モデルのユーザ理解を深めるインタラクションベースのxAI手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:11:33 GMT)
A Survey on Blockchain-based Supply Chain Finance with Progress and Future directions [1.3] サプライチェーンファイナンスはサプライチェーンの資本フローを活性化するための重要なツールである。
データ保護、偽造防止、暗号、コンセンサス検証、分散化は、サプライチェーンファイナンスに適しています。
サプライチェーンファイナンスにテクノロジーがもたらすものは、情報非対称性、信用解体、資金調達コストの問題を緩和するだけでなく、スマートコントラクトを通じてサプライチェーンファイナンス業務を改善することである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:08:51 GMT)
NeuroPapyri: A Deep Attention Embedding Network for Handwritten Papyri Retrieval [1.1] NeuroPapyriは、古代ギリシアのパピルスを含む画像の分析に特化して設計された革新的なディープラーニングベースのモデルである。
本稿では,NeuroPapyriモデルとそのアーキテクチャとトレーニング手法について述べる。
評価の結果, 文献検索におけるNeuroPapyriの有効性が示された。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 19:36:54 GMT)
Do GPT Language Models Suffer From Split Personality Disorder? The Advent Of Substrate-Free Psychometrics [1.1] 我々は,9言語で同一のパーソナリティ質問票を用いたアート言語モデルの現状について述べる。
本研究は,言語間不安定性と言語内不安定性の両方を示唆し,現在の言語モデルが一貫した中核的性格を発達しないことを示す。
これは、これらの基礎モデルに基づく人工知能システムの安全でない振る舞いにつながる可能性がある。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:53:00 GMT)
Quantum Advantages in (n,d)->1 Random Access Codes [1.0] まず、最適化された古典的RACを特徴付け、多数エンコーディング・アイデンティティ・デコーディングとして知られる古典的戦略が本当に最適であることを証明した。
次に、最小限の要件である2つの非互換な測度のみを利用して量子プロトコルを構築し、古典的な測度を超える利点を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:18:20 GMT)
SymbolNet: Neural Symbolic Regression with Adaptive Dynamic Pruning [1.0] モデル重み,入力特徴,数学的演算子を1つのトレーニングプロセスで動的に刈り取ることができる新しいフレームワークにおいて,記号回帰に対するニューラルネットワークアプローチを提案する。
提案手法は,計算資源制約の厳しい環境下での高次元データセットに対して,FPGA上でのナノ秒スケールレイテンシによる高速な推論を実現する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:45:37 GMT)
Hierarchical Working Memory and a New Magic Number [1.0] 本稿では,作業記憶のシナプス理論の枠組み内でチャンキングを行うための繰り返しニューラルネットワークモデルを提案する。
我々の研究は、認知に不可欠な脳内の情報のオンザフライ組織を理解するための、概念的で分析的な枠組みを提供する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:03:47 GMT)
Robust Curve Detection in Volumetric Medical Imaging via Attraction Field [0.9] 本稿では, 物体の向き, 形状, 位置に関する事前の知識を必要としない非分岐曲線の検出手法を提案する。
提案手法は,(1)サブピクセル精度を提供するアトラクション場,(2)関心領域を制限し,所望の曲線から外れたアウトリーチを本質的に排除するクローズネスマップをニューラルネットワークで予測する。
各種形態の異なるいくつかの臨床的タスクに対して曲線検出器を試験し,既存の手法を超越した印象的なサブピクセルレベルの精度を達成し,その汎用性と堅牢性を強調した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:24:25 GMT)
The Death of Schema Linking? Text-to-SQL in the Age of Well-Reasoned Language Models [0.9] より新しいモデルは、明示的なスキーマリンクを必要とせずに、生成中の関連するスキーマ要素を識別できる。
これにより、Text-to-パイプラインはスキーマのリンクを完全にバイパスし、完全なデータベースをLLMに渡すことで、必要な情報を除外するリスクを排除できる。
提案手法はBIRDベンチマークで71.83%の実行精度を達成し,提出時にランキング1位となった。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:59:04 GMT)
Analog Spiking Neuron in CMOS 28 nm Towards Large-Scale Neuromorphic Processors [0.8] 本研究では,TSMCの28nmCMOS技術を用いた低消費電力Leaky Integrate- and-Fireニューロンの設計を提案する。
製造されたニューロンは1.61 fJ/スパイクを消費し、34$mu m2$の活性領域を占有し、最大スパイク周波数は250mVで300kHzである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:51:20 GMT)
Finite-size analysis of prepare-and-measure and decoy-state QKD via entropy accumulation [0.8] 本稿では,一般化エントロピー累積定理(GEAT)を一般的な準備・測定プロトコルの有限サイズ解析に適用する手法を提案する。
本研究では,有限サイズの項をGEATの証明に組み込む手法を開発し,min-tradeoff関数を自動的に最適化する手法を実装した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:58:05 GMT)
The x+y Floquet code: A simple example for topological quantum computation in the path integral approach [0.8] 我々は,その経路積分を$x+y$方向に$(x,y,z)$立方格子上にトラバースすることで,トリック符号位相に対する新しいフォールトトレラント回路を構築する。
フォールトトレラント回路に境界とコーナーを組み込む方法と、位相的に保護された論理ゲートを実行する方法を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:15:08 GMT)
Enhanced Optimization Strategies to Design an Underactuated Hand Exoskeleton [0.8] 本研究は,不動手外骨格(U-HEx)の設計過程について述べる。
この最適化は、遺伝的アルゴリズム、ビッグバン・ビッグCrunchアルゴリズム、および多目的最適化のためのそれらのバージョンに依存している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:00:49 GMT)
Information-Theoretic Measures on Lattices for High-Order Interactions [0.7] 本稿では,格子関数と演算関数のペアを用いた高次測度を体系的に導出するフレームワークを提案する。
分割格子の亜格子上の演算子関数として発散関数を用いることで,多くの情報理論上の高次測度を導出できることを示す。
我々は、KL分散の一般化を演算関数として用いて、全分割格子上で定義されたストレイトベルク情報を導入する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:04:34 GMT)
SigmaRL: A Sample-Efficient and Generalizable Multi-Agent Reinforcement Learning Framework for Motion Planning [0.7] 本稿では,マルチエージェント強化学習(RL)のサンプル効率と一般化の両立を目的とした,SigmaRLというオープンソースの分散フレームワークを紹介する。
本稿では,ほとんどの交通シナリオに適用可能な一般的な特徴に着目し,情報深度観測を設計するための5つの戦略を提案する。
交差点上でこれらの戦略を用いてRLエージェントを訓練し、新しい交差点、オンランプ、ラウンドアバウトを含む、全く見えない交通シナリオの数値実験を通してそれらの一般化を評価する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:16:51 GMT)
Tripartite measurement uncertainty in Schwarzschild space-time [0.6] シュワルツシルト背景の3部測定の不確かさに及ぼすホーキング放射の影響を解析した。
この研究は、2つの初期量子状態(GHZとW状態)を考察している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:03:01 GMT)
An Efficient and Explanatory Image and Text Clustering System with Multimodal Autoencoder Architecture [0.6] 我々は,従来のCVAEモデルのモダリティを拡張する畳み込み・繰り返し変分自動エンコーダモデルを開発した。
本研究では,フレームキャプションアライメント,潜在空間ベクトルクラスタリング,新しいLCMクラスタインタプリタなどを含む大規模システムにモデルを組み込む。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:03:53 GMT)
Semi-Supervised Quantile Estimation: Robust and Efficient Inference in High Dimensional Settings [0.6] 2つの利用可能なデータセットを特徴とする半教師付き環境での量子推定を考察する。
本稿では,2つのデータセットに基づいて,応答量子化(s)に対する半教師付き推定器群を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:45:10 GMT)
Improving SMOTE via Fusing Conditional VAE for Data-adaptive Noise Filtering [0.6] 変分オートエンコーダ(VAE)を用いたSMOTEアルゴリズムの拡張フレームワークを提案する。
本稿では,VAEを用いて低次元潜在空間におけるデータ点密度を体系的に定量化し,クラスラベル情報と分類困難度を同時に統合する手法を提案する。
いくつかの不均衡データセットに関する実証的研究は、この単純なプロセスが、ディープラーニングモデルよりも従来のSMOTEアルゴリズムを革新的に改善することを示している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:26:27 GMT)
Efficient Edge AI: Deploying Convolutional Neural Networks on FPGA with the Gemmini Accelerator [0.6] 我々は、Gemminiアクセラレーターを用いて、FPGA(Field Programmable Gate Arrays)上にCNNを配置するためのエンドツーエンドワークフローを提示する。
Xilinx ZCU102 FPGA 上で YOLOv7 モデルを36.5 GOP/s/W のエネルギー効率で実装することにより,リアルタイムな性能を実現することができた。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:24:00 GMT)
Neural Quantum States and Peaked Molecular Wave Functions: Curse or Blessing? [0.6] 本研究では, 局所エネルギーに対する計算コストの低いサロゲートを計算する手順を置き換えることなく, 自己回帰サンプリングのための新しいアルゴリズムを提案する。
我々の計算は資源を著しく少なくし、以前の計算よりも桁違いのスピードアップを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:49:04 GMT)
Recovering complete positivity of non-Markovian quantum dynamics with Choi-proximity regularization [0.5] 開量子系の理論における関連する問題は、弱カップリング近似の後に得られる動的写像の完全正則性の欠如である。
本稿では,任意の原動力学写像のマルコフ的特徴を保ちながら,完全正則法違反を解消するための数値計算法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:14:38 GMT)
A Bayesian Classification Trees Approach to Treatment Effect Variation with Noncompliance [0.5] 非準拠のランダム化試験における様々な治療効果を推定することは本質的に困難である。
両手法の最良の特徴を組み合わせたベイズ的機械学習手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:33:55 GMT)
Dominating Set Reconfiguration with Answer Set Programming [0.5] 我々は Answer Set Programming (ASP) に基づく支配的集合再構成問題の解法を開発する。
このアプローチは、高レベルのASPエンコーディングに依存しており、基礎と解決のタスクは、ASPベースの解決器に委譲されます。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:38:12 GMT)
"Normalized Stress" is Not Normalized: How to Interpret Stress Correctly [0.5] 応力は、高次元データの次元縮小投影に対して最もよく用いられる品質指標と最適化基準の1つである。
最も一般的に用いられる指標の1つ、正規化された応力は、投影に関する意味的な変化がないにもかかわらず、射影の均一なスケーリングに敏感である。
正規化応力スケールを不変にするための簡単な手法を導入し、小さなベンチマークで予測された振る舞いを正確に捉えていることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:42:47 GMT)
An Adaptive Importance Sampling for Locally Stable Point Processes [0.5] 境界領域における局所安定点過程の統計値の期待値を求めるための適応的な重要度サンプリング手法を提案する。
提案した推定器は、ほぼ確実に目標値に収束し、その正規性を証明する。
提案手法の性能をマルコフ連鎖モンテカルロシミュレーションと完全サンプリングと比較した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:38:41 GMT)
Real-world validation of safe reinforcement learning, model predictive control and decision tree-based home energy management systems [0.4] 本稿では,機械学習に基づくエネルギー管理手法の現実的検証について述べる。
住宅の4つの再生を電気的に設置する実験を行った。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:12:15 GMT)
A distribution-guided Mapper algorithm [0.4] 本稿ではD-Mapperという分布誘導型Mapperアルゴリズムを提案する。
提案アルゴリズムは確率的モデルに基づく手法であり,非確率的手法の代替となる可能性がある。
数値実験により,D-Mapperは様々なシナリオにおいて従来のMapperアルゴリズムより優れていることが示された。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:37:37 GMT)
Fast Unconstrained Optimization via Hessian Averaging and Adaptive Gradient Sampling Methods [0.3] ヘシアン・アブラッシングに基づくサブサンプルニュートン法による有限サム予測対象関数の最小化について検討する。
これらの方法は不有効であり、ヘッセン近似の固定コストがかかる。
本稿では,新しい解析手法を提案し,その実用化に向けた課題を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:27:48 GMT)
Transformers and Large Language Models for Efficient Intrusion Detection Systems: A Comprehensive Survey [0.3] 本稿では,サイバー脅威検出システムにおけるトランスフォーマーとLCMの利用状況について,包括的分析を行った。
様々なサイバー攻撃の背景情報や、この分野でよく使われるデータセットなど、トランスフォーマーの基本について論じる。
コンピュータネットワーク、IoTデバイス、重要なインフラストラクチャ保護、クラウドコンピューティング、SDN、自動運転車など、TransformerとLLMベースのIDSが実装されているさまざまな環境とアプリケーションについて検討している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:28:11 GMT)
Global Optimisation of Black-Box Functions with Generative Models in the Wasserstein Space [0.3] ブラックボックスシミュレータの最適化はシミュレータや高次元では困難である。
我々は、パラメータ空間全体のブラックボックス応答をモデル化するために、深い生成的サロゲートアプローチを用いる。
次に、この知識を活用して、ワッサーシュタイン距離に基づいて提案された不確実性を推定する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:46:32 GMT)
Dynamical correlations and order in magic-angle twisted bilayer graphene [0.3] ツイスト二層グラフェンにおける電子相関と長距離秩序の出現について検討した。
本研究は, 走査トンネル分光法, 輸送法, 圧縮性実験の最も厄介な側面を統一的に把握するものである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:28:28 GMT)
Fast Inference for Probabilistic Answer Set Programs via the Residual Program [0.2] プログラムのいくつかの部分はクエリの確率に影響を与えず、グラウンドのサイズに影響を与えます。
本稿では,残余プログラムを利用した推論手法を提案する。
グラフデータセットの実証的な結果は、このアプローチがはるかに高速な推論につながることを示している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:58:22 GMT)
CON-FOLD -- Explainable Machine Learning with Confidence [0.2] FOLD-RMは、説明可能な機械学習分類アルゴリズムである。
FOLD-RMを拡張したCON-FOLDを提案する。
本稿では、FOLD-RMルールのユニークな構造を用いて、ルールを効率よくプーンし、過度な適合を防ぐ信頼性ベースのプルーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 23:45:21 GMT)
Evaluating Explainable AI Methods in Deep Learning Models for Early Detection of Cerebral Palsy [0.1] 脳性麻痺(CP)の早期発見は効果的な介入とモニタリングに不可欠である。
本稿では,幼児の動きのビデオ記録から抽出した骨格データを解析し,CPを予測する深層学習法を用いて,説明可能なAI(XAI)手法の信頼性と適用性を検討した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 00:27:09 GMT)
Randomized Benchmarking Protocol for Dynamic Circuits [0.1] 本稿では,データキュービットの1量子ランダム化シーケンスにおいて,動的回路演算ブロックをインターリーブした一連の動的回路ベンチマークルーチンについて紹介する。
動的回路ブロックにおけるZZクロストークの低減と位相誤差の測定における動的デカップリングの重要性を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:23:54 GMT)
Camera Perspective Transformation to Bird's Eye View via Spatial Transformer Model for Road Intersection Monitoring [0.1] 道路交差点の監視と制御の研究は、しばしば鳥の目視(BEV)シミュレータを利用する。
実際の交通状況では、シミュレーターと同様のBEVを達成するには、ドローンや特定のセンサーを配置する必要がある。
道路交差点の1台のカメラの視点をBEVに変換する新しいディープラーニングモデルを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 02:20:50 GMT)
Natural Language to Verilog: Design of a Recurrent Spiking Neural Network using Large Language Models and ChatGPT [0.1] 我々はOpenAIのChatGPT4を用いて、プログラム可能な繰り返しスパイクニューラルネットワークのRTL Verilogモジュールを合成する。
得られた設計は、排他的OR、IRIS花分類、MNIST手書き桁分類の3つのケーススタディで検証され、96.6%の精度を達成した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:42:32 GMT)
Accurately Simulating the Time Evolution of an Ising Model with Echo Verified Clifford Data Regression on a Superconducting Quantum Computer [0.1] 本稿では,Echo Verification (EV) とClifford Data Regression (CDR) を組み合わせた誤り軽減戦略を提案する。
我々は, アンシラの純度とポストセレクションの確率から, 脱分極率を推定する指標を導出した。
本稿では,超伝導量子コンピュータ上でのEcho Verified Clifford Data Regression(EVCDR)の実演を紹介する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:18:13 GMT)
Switched auxiliary loss for robust training of transformer models for histopathological image segmentation [0.1] 機能組織ユニット(英: functional tissue Units, FTUs)は、その主な機能を実行する特定の器官に近接する細胞集団である。
我々は,「HuBMAP + HPA - Hacking the Human Body」コンペティションデータセットを利用して,5臓器に複数臓器のFTUを分割するモデルを開発した。
我々のモデルは、公開データセットで0.793、プライベートデータセットで0.778のダイススコアを達成した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:54:05 GMT)
Strategies for optimizing double-bracket quantum algorithms [0.1] ダブルブラケット進化の選択を最適化するための戦略を提案する。
また,CNOTやシングルキュービット回転ゲートに直接コンパイル可能な対角展開パラメトリゼーションも提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:07:54 GMT)
Volley Revolver: A Novel Matrix-Encoding Method for Privacy-Preserving Neural Networks (Inference) [0.0] 我々は,手書き画像分類のための畳み込みニューラルネットワークを実装した。
40のvCPUを持つパブリッククラウドでは、MNISTテストデータセット上の畳み込みニューラルネットワークの実装には、$sim$287秒かかります。
データ所有者は、これらの32の画像を暗号化した暗号文を1つだけパブリッククラウドにアップロードする必要がある。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:07:13 GMT)
Voice-Driven Mortality Prediction in Hospitalized Heart Failure Patients: A Machine Learning Approach Enhanced with Diagnostic Biomarkers [0.0] 心不全患者の死亡率を予測するための、強力で効果的な機械学習モデルを示す。
音声バイオマーカーを日常的な患者のモニタリングに組み込むことで、この戦略は患者の結果を改善できる可能性がある。
本研究では,患者の5年間の死亡率を予測するために,音声を入力として機械学習システムを構築した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:55:22 GMT)
Verification of Quantum Circuits through Discrete-Time Barrier Certificates [0.0] 本稿では、量子回路の特性を検証するために、力学系の検証から概念を取り入れ、拡張する。
我々の主な貢献は、複素変数上のk帰納障壁証明書を提案し、それをHermitian Sum of Squares最適化を用いてどのように計算するかを示すことである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:42:55 GMT)
Using linear and nonlinear entanglement witnesses to generate and detect bound entangled states on an IBM quantum processor [0.0] グリーンバーガー・ホーネ・ザイリンガー基底における3量子混合状態の有界絡みについて検討する。
これらの状態の絡み合いは、絡み合いの目撃者を用いて検出され、分析は正の部分的転移(PPT)を示す状態に焦点を当てる。
我々は,IBM量子プロセッサ上での6ビット純状態を用いた3量子GHZ対角混合状態を生成するための汎用量子回路を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:41:38 GMT)
Universality of periodic points in bounded discrete time series [0.0] 力学系から導かれる任意の有界離散時系列を考える。
特に、自己回帰モデルによって生成される有界離散時系列は準周期関数と等価である。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 00:09:21 GMT)
Transmission of quantum information through quantum fields in curved spacetimes [0.0] 相対論的量子場を介する2つの局所量子ビット系間の量子通信チャネルを構築する。
本稿では、場の相関関数と波動方程式の因果プロパゲータの観点から、量子通信チャネルの量子容量を純粋に表現する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:09:22 GMT)
Topological Orders Beyond Topological Quantum Field Theories [0.0] 量子トポロジカル秩序を示すシステムは、量子コンピューティングスキームに非常に魅力的なロバストな特性を持つ。
トポロジカル場の理論は、トポロジカル秩序を示す系の四面体特性を捉えるのに強力であることが証明されている。
ここでは、任意のオン間の距離依存相互作用を持つ位相的順序を示すリッチなモデルのクラスを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:32:19 GMT)
Threshold in quantum correlated interference for a particle interacting with two scatterers [0.0] このしきい値の測定は、多体系における量子相関を検証できる。
メソスコピック散乱器のデコヒーレンスを、スリットやビームスプリッターを横切ることなく、この閾値で決定する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:34:34 GMT)
Theoretical and Practical Progress in Hyperspectral Pixel Unmixing with Large Spectral Libraries from a Sparse Perspective [0.0] ハイパースペクトルアンミキシング(Hyperspectral unmixing)は、観察されたピクセルスペクトルから個々の物質とそれぞれの存在量を決定する過程である。
正規化を用いて数値解を生成できる回帰法を多数評価する。
提案手法は,高スペクトル画像の現象学に対応する先行データから導出できる手法が,予測性能に最適な先行データよりも優れていることを結論付けている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:24:56 GMT)
The spin-one Duffin-Kemmer-Petiau equation revisited: analytical study of its structure and a careful choice of interaction [0.0] ダフィン・ケマー・ペティオー方程式は、いわゆる自然(正規)および非自然(異常)パリティ状態を持つスピン1ボソンに対して研究される。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:49:28 GMT)
The Restaurant Meal Delivery Problem with Ghost Kitchens [0.0] 「ゴーストキッチン」では、中央コンプレックスに数軒のレストランを同調した料理が提案されている。
ゴーストキッチンを効果的に運用するための運用戦略を提案する。
本研究は,料理スケジューリングと派遣車両の統合最適化と,今後の需要と意思決定の予測の両方が,事業の成功に不可欠であることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:54:03 GMT)
The Model Openness Framework: Promoting Completeness and Openness for Reproducibility, Transparency, and Usability in Artificial Intelligence [0.0] モデルオープンネスフレームワーク(MOF)は,その完全性とオープン性に基づいて機械学習モデルを評価する分類システムである。
このフレームワークは、オープンであると主張するモデルの誤った表現を防止し、研究者や開発者が許容ライセンスの下ですべてのモデルコンポーネントを提供することを誘導し、個人や組織が制約なく安全に採用できるモデルを識別するのを助けることを目的としている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:47:01 GMT)
The Hidden Ontological Variable in Quantum Harmonic Oscillators version 3 [0.0] すべての量子調和振動子は、古典論理の観点から解釈できるような存在論的変数を持つ。
この観察は、量子力学の解釈方法の理解を深める道を開くかもしれない。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:40:15 GMT)
The Einstein-Podolsky-Rosen paradox and the Bell theorem [0.0] ここでは「局所性」と「現実性」が共に量子論と矛盾することを示すベルの定理について議論する。
ベルの定理は、「局所性」と「現実性」が共に量子論と矛盾していることを示している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:07:18 GMT)
Symmetry-enforcing neural networks with applications to constitutive modeling [0.0] 本研究では,非線形および履歴依存行動を示す複雑なミクロ構造を均質化するために,最先端のマイクロメカニカルモデリングと高度な機械学習技術を組み合わせる方法について述べる。
結果として得られるホモジェナイズドモデルであるスマート法則(SCL)は、従来の並列マルチスケールアプローチで必要とされる計算コストのごく一部で、マイクロインフォメーション法を有限要素ソルバに適用することができる。
本研究では、ニューロンレベルで物質対称性を強制する新しい方法論を導入することにより、SCLの機能を拡張する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:27:46 GMT)
Steady-state entanglement of interacting masses in free space through optimal feedback control [0.0] 我々は2つの質量の位相空間力学を工学するために線形二次ガウス制御(LQG)を用いる。
本研究では,無条件の絡み合い生成を容易にするために,アインシュタイン・ポドルスキー・ローゼン型分散最小化制約を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:14:58 GMT)
Squeezed states of light after high-harmonic generation in excited atomic systems [0.0] 高調波発生(HHG)は、最近、光の古典的でない状態を生成するための有望な方法として登場した。
本研究では,原子系におけるHHGプロセスによる光の励起状態の生成について理論的に検討する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:18:10 GMT)
Spin-of-Light Gyroscope and the Spin-Rotation Coupling [0.0] 本稿では,光の内在スピンに基づく高精度ジャイロスコープの提案に関連して,光子スピンと回転とのカップリングについて論じる。
本研究では、周囲媒質の存在下で波動伝播の方向を均一に回転する物理系における電磁放射の伝搬を解析する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:19:45 GMT)
Single ion spectroscopy of four metastable state clear-out transitions in Yb II: isotope shifts and hyperfine structure [0.0] 我々はYb$+$の長寿命同位体に対して399nmから412nmの間の4つの準安定状態クリアアウト遷移のデータを示す。
2つの代替遷移は、Yb$+$を冷却し操作する赤外線光学を不要にすることで、実験的なセットアップを単純化する。
また、励起状態の崩壊分岐比を含む遷移の2ドルD$_3/2$ at399 nm、および2ドルD$_3/2$ at 410 nmのデータも提示する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:57:25 GMT)
Simulating the Transverse Field Ising Model on the Kagome Lattice using a Programmable Quantum Annealer [0.0] 我々は、反強磁性イジングモデルを、D-Waveの量子アニールの最新のアーキテクチャであるAdvantage2のプロトタイプ上に、カゴメ格子上に埋め込む。
有限長磁場下では、エントロピーが減少する古典的なスピン液体状態と整合して、3分の1の磁化台地を示す。
次に、アニール・ポーズ・クエンチプロトコルを用いて、有限横方向および長手方向でのモデルの平衡から生じる実験的な状態のアンサンブルを抽出する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:03:11 GMT)
Sign language recognition based on deep learning and low-cost handcrafted descriptors [0.0] 単語間のあいまいさを避けるため,ジェスチャ実行においてできるだけ多くの言語パラメータを考慮することが重要である。
選択した技術がリアルであることを保証することが不可欠であり、高価な、侵入的、または低運動量のセンサーを避ける。
低コストなセンサと技術を用いた手話認識システムを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 00:56:51 GMT)
SAGE-RT: Synthetic Alignment data Generation for Safety Evaluation and Red Teaming [0.0] 我々は合成アライメントとリピートデータを生成する新しいパイプラインであるSAGEを紹介する。
SAGEは詳細な分類を使用して、幅広いトピックにわたる安全アライメントと再チームのデータを生成する。
Sagejailbreakによって生成されたリピートデータは,32のサブカテゴリ中27以上,279のリーフカテゴリ中58以上において,最先端のLDMを突破する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:38:31 GMT)
Rotational covariance restricts available quantum states [0.0] 本稿では,特徴関数のパラメータ化による回転情報の解析的特徴付けについて紹介する。
本稿では,参照フレーム(回転フレーム)を欠いた変換によって達成可能な状態の集合が解析的特徴を認め,半定値最適化手法を用いて研究可能であることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:48:27 GMT)
Robust online reconstruction of continuous-time signals from a lean spike train ensemble code [0.0] 本稿では,連続時間信号をスパイク列車に決定的に符号化する信号処理フレームワークを提案する。
表現可能な信号クラスと再構成境界に関する質問に対処する。
大規模なオーディオデータセットの実験では、スパイクレートがNyquistレートの5分の1以下である場合に、優れた再構成精度を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:43:36 GMT)
Robust and Deterministic Preparation of Bosonic Logical States in a Trapped Ion [0.0] 捕捉イオンの機械的運動における非古典的ボゾン状態の高忠実性と決定論的準備を実証した。
レーザ駆動のスピンモーション相互作用の動的変調を最適化することにより,誤差抑制パルスを実装した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 19:03:07 GMT)
Risks from Language Models for Automated Mental Healthcare: Ethics and Structure for Implementation [0.0] 本稿では、自律性のレベルを規定し、倫理的要件を概説し、AIエージェントに最適なデフォルト動作を定義する構造化フレームワークを提案する。
また,16のメンタルヘルス関連質問紙を用いて,14の最先端言語モデル(既成語10種,微調整語4種)を評価した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:20:22 GMT)
Restrictions on realizable unitary operations imposed by symmetry and locality [0.0] 一般対称ユニタリは、局所対称ユニタリを用いて、概ね実装できないことを示す。
量子熱力学の文脈では、複合系上の一般エネルギー保存ユニタリ変換は局所エネルギー保存ユニタリを組み合わせるだけでは実現できない。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:29:51 GMT)
Read and Think: An Efficient Step-wise Multimodal Language Model for Document Understanding and Reasoning [0.0] 既存の文書理解モデルは、1つの単語やフレーズで直接答えを生成する傾向がある。
文書画像の段階的問合せ対を生成するためにMLLM(Multi-modal Large Language Models)を用いる。
次に、生成された高品質なデータを使用して、DocAssistantと呼ばれる、人間化された文書理解と推論モデルをトレーニングします。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:26:08 GMT)
Quantum obesity and steering ellipsoids for fermionic fields in Garfinkle-Horowitz-Strominger dilation spacetime [0.0] 本稿では,2量子ビット上の時空のGarfinkle-Horowitz-Stromingerダイアレーションを受けるギシン状態に対する量子肥満(QO),量子不協和(QD),および量子ステアリング楕円体(QSE)について検討する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 01:50:17 GMT)
Quantum entropy couples matter with geometry [0.0] 高階ネットワーク上の離散幾何学と物質場を結合する理論を提案する。
計量、物質およびゲージ場に対する結合力学方程式を導出する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:45:22 GMT)
Quantum State Behavior at Exceptional Points and Quantum Phase Transitions [0.0] 量子相転移における例外点と臨界点の量子状態は破壊されないことを示す。
例外点、量子相転移、ブラックホール事象の地平線との類似性を探求する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:48:13 GMT)
Quantum Rational Transformation Using Linear Combinations of Hamiltonian Simulations [0.0] 本稿では,量子ハードウェア上での目標演算子の有理変換を効果的に実装する。
線形コンビネーション・オブ・ユニタリ (LCU) を用いてハミルトンシミュレーションを用いて有理変換を効率的に行うことができることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:00:01 GMT)
Privacy-Preserving Logistic Regression Training on Large Datasets [0.0] 我々は,同型暗号化(HE)を用いた大規模暗号化データに対するロジスティック回帰学習のための効率的なアルゴリズムを提案する。
また、データセットがあまりに大きく、ミニバッチ方式で暗号化する必要がある場合に、それらのメソッドのフルバッチバージョンを実装する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:07:59 GMT)
Post-quantum encryption algorithms of high-degree 3-variable polynomial congruences: BS cryptosystems and BS key generation [0.0] 本稿では,3変数のBeal-Schurコングルースに基づく量子後暗号アルゴリズムを構築する。
この結果を用いて、単純でセキュアな量子後暗号アルゴリズムを生成する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:19:46 GMT)
Perspectives: Comparison of Deep Learning Segmentation Models on Biophysical and Biomedical Data [0.0] 畳み込みニューラルネットワーク、U-Net、ビジョントランスフォーマー、ビジョン状態空間モデルを比較した。
そこで我々は,各モデルが排他的である最適条件を決定するための基準を確立する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 19:49:19 GMT)
Peer-induced Fairness: A Causal Approach to Reveal Algorithmic Unfairness [0.0] 本稿では,アルゴリズムフェアネスを科学的に評価するための新しい枠組みである「ピア誘導フェアネス」を紹介する。
アルゴリズムによる差別による有害な結果と、個人の能力不足による結果の区別である。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:06:57 GMT)
Optimising MFCC parameters for the automatic detection of respiratory diseases [0.0] MFCC(Mel Frequency Cepstral Coefficients)は自動解析に広く用いられている。
MFCC抽出パラメータが呼吸器疾患の診断に与える影響について総合的な研究は行われていない。
本研究では,鍵パラメータ,すなわち,フレーム間の係数数,フレーム長,ホップ長が呼吸条件に及ぼす影響について検討した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:56:17 GMT)
Optimal number of stabilizer measurement rounds in an idling surface code patch [0.0] コードパッチに符号化された論理量子ビットに対する安定化器測定ラウンドの速度を数値的に最適化する。
我々は、ゲート誤差、読み出し誤差、振幅、位相減衰を含む回路レベルの環境騒音をモデル化する。
定性的には、安定した測定ラウンドの最適な数は、より良いキュービットのために小さくなり、より良いゲートやより大きなコードサイズのために大きくなっています。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:03:25 GMT)
On learning capacities of Sugeno integrals with systems of fuzzy relational equations [0.0] 本稿では,ファジィリレーショナル方程式系に基づくトレーニングデータに基づいて,スゲノ積分の基盤となるキャパシティを学習する手法を提案する。
ファジィリレーショナル方程式の系の不整合を扱うために, 最大近似$q$-maxitive 容量と最小近似$q$-minitive 容量を得る方法を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:40:01 GMT)
On a Scale-Invariant Approach to Bundle Recommendations in Candy Crush Saga [0.0] 本稿では,モバイルゲームシナリオにおけるアイテムレコメンデーション作成における注意モデルの利用について述べる。
この手法はその後、Candy Crush Sagaのバンドルレコメンデーションに適用される。
提案手法は,クリック率を30%,テイクレートを40%以上向上させ,ユーザのエンゲージメントを30%向上させることを示した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 05:44:37 GMT)
Novel Methods for Analyzing Cellular Interactions in Deep Learning-Based Image Cytometry: Spatial Interaction Potential and Co-Localization Index [0.0] 空間相互作用ポテンシャル(SIP)とコローカライズ指数(CLI)を紹介する。
SIPは電場と同様の細胞間相互作用の可能性を評価し、CLIは細胞間の距離を取り入れ、動的細胞の動きを考慮に入れている。
我々は,SIPとCLIをシミュレーションにより検証し,大腸癌検体に適用し,実際の生物学的データと強い相関を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:07:17 GMT)
Non-classical correlations between photons and phonons of center-of-mass motion of a mechanical oscillator [0.0] オプトメカニカルなパラメトリックダウンコンバージョンを用いたフォノンと光子の非古典的相関関係を示す。
古典的な2時間のコーシー=シュワルツ不等式は, 書記光子と記憶されたフォノンとの間の不等式が92%の信頼で破られるのを観察した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 22:01:53 GMT)
New Curriculum, New Chance -- Retrieval Augmented Generation for Lesson Planning in Ugandan Secondary Schools. Prototype Quality Evaluation [0.0] 中等学校における教育の質の低さは、21世紀のウガンダにおける主要な闘争の1つと見なされている。
我々は、政府公認の教科書に基づいて、カスタマイズされた授業プランを生成するプロトタイプを開発した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:22:14 GMT)
Many-body quantum interference route to the two-channel Kondo effect: Inverse design for molecular junctions and quantum dot devices [0.0] 逆設計は、望ましい関数を最適に実行する候補構造を見つけることを伴う。
極めて高いコンド温度を達成できることを示し,エントロピーと輸送シグネチャを実験的に利用すべきであることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:33:13 GMT)
Many learning agents interacting with an agent-based market model [0.0] 反応型エージェントベースモデルと相互作用する最適な実行取引エージェントの学習のダイナミクスを考察する。
このモデルは、最適な実行学習エージェント、最小限の知的流動性テイカー、高速な電子流動性プロバイダによって表される3つの栄養レベルを持つ市場エコロジーを表している。
学習可能な最適な実行エージェントを組み込むことで、経験的データと同じ複雑さで動的に生成できるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:37:15 GMT)
LiPCoT: Linear Predictive Coding based Tokenizer for Self-supervised Learning of Time Series Data via Language Models [0.0] 本稿では,時系列データをトークン列にエンコードする新しいトークン化器LiPCoTを提案する。
特に、LiPCoTを用いて、脳波データをトークンの小さな語彙にエンコードし、自己教師型学習にBERTを使用する。
その結果, 自己教師付き学習を用いたBERTモデルは, 既存手法の精度を7.1%向上させることができた。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 04:51:33 GMT)
Leveraging Perceptual Scores for Dataset Pruning in Computer Vision Tasks [0.0] 画像分類とセマンティックセグメンテーションタスクにおいて,コアセット選択に使用する画像のスコアを提案する。
スコアは画像のエントロピーであり、圧縮されたバージョンのビット単位のピクセルによって近似される。
この単純なスコアは、特にセマンティックセグメンテーションタスクにおいて良い結果をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 00:55:52 GMT)
LLM Voting: Human Choices and AI Collective Decision Making [0.0] 本稿では,大規模言語モデル (LLM) の投票行動,特に GPT-4 と LLaMA-2 について検討する。
投票方法の選択と提示順序がLLM投票結果に影響を及ぼすことがわかった。
さまざまな人格がこれらのバイアスの一部を減らし、人間の選択との整合性を高めることができることがわかった。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:41:02 GMT)
Kinematic analysis of multiple Compton scattering in quantum-entangled two-photon systems [0.0] Stokes-Mueller法は、2光子系における絡み合った光子対の散乱を分析するために用いられる。
本研究の目的は、量子場理論による予測のテストと検証を支援する理論的結果を提供することである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:30:34 GMT)
Iterative Improvement of an Additively Regularized Topic Model [0.0] 本稿では,トピックモデルの反復的学習法を提案する。
いくつかの自然言語テキストの収集実験により、提案したITARモデルは、他の人気のあるトピックモデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 11:07:17 GMT)
Interpolation of mountain weather forecasts by machine learning [0.0] 本稿では,山間部における将来の気象を機械学習で補間する手法を提案する。
本研究は,日本の山岳地域に着目し,主に光GBMを機械学習モデルとして,気温と降水量の予測を行う。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:53:47 GMT)
Integrating Representational Gestures into Automatically Generated Embodied Explanations and its Effects on Understanding and Interaction Quality [0.0] 本研究では,異なる種類のジェスチャーが相互作用の質や聴取者の理解にどのように影響するかを検討する。
我々のモデルは、学習した音声駆動モジュールが生成したビートジェスチャーと、手動でキャプチャした象徴的ジェスチャーを組み合わせる。
発見は、象徴的なジェスチャー単独の使用もビートジェスチャーの組み合わせも、理解の観点からはベースラインやビートのみの状態よりも優れていることを示している。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:25:53 GMT)
Insights on molecular P implantation for scalable spin-qubit arrays [0.0] 量子情報技術は大きな可能性を秘めており、量子コンピュータは問題解決能力に革命をもたらす可能性がある。
主要な競合相手には固体スピン量子ビット、特にリンドナーのスピンを利用するものがある。
本稿では, 分子性PF2イオンを注入用として使用することにより, 検出効率を維持しつつ, 配置の不確かさを低減することを目的とする。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:20:32 GMT)
Initial Correlations and Time-Retarded Noise in Dynamical Decoupling Schemes for Superconducting Qubits [0.0] 動的デカップリング (DD) は, 時間的フィードバックを伴い, 広範囲の現実的なノイズ源について検討する。
DDは超伝導量子ビット演算におけるデコヒーレンスを抑制するための最も単純かつ資源集約的な手法の1つである。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:23:49 GMT)
Influence of disordered and anisotropic interactions on relaxation dynamics and propagation of correlations in tweezer arrays of Rydberg dipoles [0.0] 本研究では,不規則な1次元および2次元のリドベルク双極子の非等方的相互作用を特徴とする非平衡ダイナミクスについて検討する。
長い時間でも短距離に留まった相関関係の非ボール的伝播を特徴とする緩やかな緩和体制を見いだす。
我々の発見は、自然に乱れた双極子相互作用を特徴とする様々な量子科学プラットフォームに関係がある。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:13:59 GMT)
Impact of Jahn-Teller distortions on persistent molecular ring current in benzene [0.0] 円偏光フェムト秒紫外レーザーパルスは、残孔がカチオンの周囲を永続的なリング電流として循環するように、ベンゼンからπ電子を除去することができる。
分子が中性体のD6h対称性からカチオンのD2h対称性へ緩和するときの電流の時間依存性強度について検討する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:37:58 GMT)
Impact of Inaccurate Contamination Ratio on Robust Unsupervised Anomaly Detection [0.0] 教師なし異常検出を目的としたトレーニングデータセットは、しばしば異常(または汚染)を含む。
ほとんどのロバストな教師なし異常検出モデルは汚染に対処するために汚染比の情報に依存している。
頑健な教師なし異常検出における不正確な汚染率情報の影響について検討する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 08:49:41 GMT)
Image-Based Leopard Seal Recognition: Approaches and Challenges in Current Automated Systems [0.0] 本稿では,従来の写真を用いた自然の生息地におけるアザラシ認識の課題と進歩について考察する。
ヒョウアザラシ EmphHydrurga leptonyx は南極の生態系において重要な種である。
機械学習の出現、特にビジョントランスフォーマーの応用は、種のモニタリングにおける効率性と精度の新しい時代を告げている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 03:35:11 GMT)
Generalized Free Cumulants for Quantum Chaotic Systems [0.0] 固有状態熱化仮説(ETH)は、孤立量子系における統計力学の出現の第一の予想である。
ETHは一般的に熱化に十分な機構であることを示す。
特に, 密度行列の減少は平衡に緩和され, システムは後期のページ曲線に従うことを示した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:07:01 GMT)
Fact or Fiction? Improving Fact Verification with Knowledge Graphs through Simplified Subgraph Retrievals [0.0] 本稿では, 証拠が構造化知識グラフの形で存在するデータセット上で, クレームを検証するための効率的な方法を提案する。
また,エビデンス検索プロセスの簡略化により,計算資源の削減とテストセット精度の向上を実現するモデルの構築が可能となる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:46:15 GMT)
Exploring Retrieval Augmented Generation in Arabic [0.0] Retrieval Augmented Generation (RAG) は自然言語処理において強力な技術である。
本稿ではアラビア文字に対するRAGの実装と評価について事例研究を行う。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:03:28 GMT)
Ensemble inequivalence in long-range quantum systems [0.0] アンサンブルの不等式は、システムを記述する統計的アンサンブルによって異なる熱力学特性を観測する可能性である。
ここでは、長距離量子強磁性体のアンサンブル非等価性の例を示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:48:13 GMT)
Ensemble architecture in polyp segmentation [0.0] 本研究では,意味的セグメンテーションのアーキテクチャを再検討し,ポリプセグメンテーションに優れたモデルを評価する。
最適な結果を得るために、異なるモデルの利点を利用する統合フレームワークを導入します。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 02:57:38 GMT)
Enhancing Autonomous Vehicle Perception in Adverse Weather through Image Augmentation during Semantic Segmentation Training [0.0] 我々は,エンコーダ・デコーダUNetモデルを訓練し,セマンティックセグメンテーション拡張を行った。
天気データに基づいてトレーニングされたモデルは、晴れた日を除いて、すべての条件でトレーニングされたデータよりも著しく損失が小さい。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 00:08:28 GMT)
Efficient driving of a spin-qubit using single-atom magnets [0.0] 近接する単一スピン量子ビットを効率的に駆動するために、単原子磁石がどのように使用できるかを示す。
また,実験パラメータの最適化に関する重要な側面についても検討する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 04:39:40 GMT)
Dots and Boxes Algorithm for Peierls Substitution: Application to Multidomain Topological Insulators [0.0] 磁場はパイエルス置換によって量子系の離散モデルに導入することができる。
強結合ハミルトニアンに対しては、置換は通常磁気ベクトルポテンシャルから計算される相の集合が生じる。
磁場が一様でない場合、便利なゲージを見つけることは困難である。
ゲージ不変磁束のみからピエルス位相を計算することによりベクトルポテンシャル決定を回避することを提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 19:10:07 GMT)
Displacement Current in Classical and Quantum Systems [0.0] 磁場のカールに対するマクスウェルの方程式は、電場の時間微分に依存する定常電流と項の両方を含む。
後者は変位電流と呼ばれ、マクスウェル自身によってもともと含まれていたと考えられている。
変位電流は、古典力学と量子力学の両方において、これらに重要な寄与である。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:25:27 GMT)
Development of a Multi-Agent Clinical Decision Support System for Korean Triage and Acuity Scale (KTAS)-Based Triage and Treatment Planning in Emergency Departments [0.0] 本研究は, 患者トリアージ, 治療計画, 救急管理全般において, LLM駆動型CDSSを用いて, ED医師や看護師を支援することを目的とするものである。
このシステムは、Triage Nuurse、救急医、薬剤師、EDコーディネーターの4つのAIエージェントで構成されている。
トリアージアセスメントにはKTAS(Korea Triage and Acuity Scale)が組み込まれ、医薬品管理にはRxNorm APIが組み込まれている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 13:03:41 GMT)
Decentralized Health Intelligence Network (DHIN) [0.0] 分散ヘルスインテリジェンスネットワーク(Decentralized Health Intelligence Network, DHIN)は、医療における健康データ主権とAI利用の課題に対処する理論フレームワークである。
医療における効果的なAIトレーニングをサポートし、患者が健康データをコントロールし、金銭的に利益を享受し、分散型でスケーラブルなエコシステムに貢献できるようにする。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 01:47:53 GMT)
Deceleration of electrons by an oscillating field [0.0] 振動する電磁場の下での電子力学に対する量子補正は、フロケ理論の中で見られる。
レーザー照射により駆動される様々な電子系について、この現象の可能性を議論する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:51:55 GMT)
Data Science for Geographic Information Systems [0.0] データサイエンスを地理情報システムに統合することで、これらのツールの完全な空間分析プラットフォームへの進化が促進された。
機械学習とビッグデータ技術の採用により、これらのプラットフォームはますます複雑なデータを扱う能力を備えてきた。
この研究は、研究分野としてのデータサイエンスとGISの歴史的・技術的進化を辿り、ドメイン間の収束の要点を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:14:33 GMT)
Data Clustering and Visualization with Recursive Goemans-Williamson MaxCut Algorithm [0.0] 本稿では,ベクトル化されたデータクラスタリングタスクの性能向上を実現するため,古典的な Goemans-Williamson MaxCut アルゴリズムを改良した。
本手法は計算効率とクラスタリング精度の両面での優位性を提供する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:30:57 GMT)
Creating two-qudit maximally entangled quantum link through bulk [0.0] Heisenberg と Bilinear-Biquadratic (BBQ) spin-s モデルは、平衡における最大絡み合いを達成するための潜在的な候補である。
ここで提示される静的および動的プロトコルは、バルクと接続のスピン量子数が等しくなくても効率的である。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:20:33 GMT)
Constructing Berry-Maxwell equations with Lorentz invariance and Gauss' law of Weyl monopoles in 4D energy-momentum space [0.0] 本稿では,Berry曲率を4次元エネルギー-モーメント空間に拡張した相互電磁場の構築について述べる。
この相互電磁場の物理的現実は、特殊相対性理論の基本原理とワイル・モノポールのガウスの法則に根ざしている。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 14:32:34 GMT)
Cognitive Networks and Performance Drive fMRI-Based State Classification Using DNN Models [0.0] 我々は、個々の認知状態を分類するために、構造的に異なる2つのDNNモデルと相補的なDNNモデルを用いる。
アーキテクチャ上の違いにもかかわらず、両者のモデルが常に予測精度と個人の認知性能との間に堅牢な関係を生んでいることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:25:51 GMT)
Classifying Density Matrices of 2 and 3 Qubit States Up To LU Equivalence [0.0] この証明の修正版として,Jing-Yang-Zhao の論文 "Local Unitary Equivalence of Quantum States" がある。
私たちはこの対応を3$-qubitsに一般化することができる。
これらの結果は、LU同値の概念を準LU同値に緩和すれば、$2と$3に拡張できる。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 16:16:40 GMT)
Characterizing Optimal-speed unitary time evolution of pure and quasi-pure quantum states [0.0] 最適時変を生成するハミルトニアンは、$SU(n)/textnormalS(textnormalU(1)times textnormalU(n-1))$の等時ベクトルによって完全に特徴づけられることを示す。
この結果は後に準純量子状態にまで拡張する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 20:10:39 GMT)
Bayesian Learning in a Nonlinear Multiscale State-Space Model [0.0] この研究は、異なる時間スケールで相互作用するシステム間の動的相互作用を探索する、新しいマルチスケール状態空間モデルを導入する。
本稿では,このマルチスケールモデルにおける未知のプロセスノイズ共分散を学習することにより,未知の状態の推定を行うためのベイズ学習フレームワークを提案する。
本研究では,提案手法の有効性をシミュレーションし,提案手法の有効性を実証するPGASアルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 12:22:04 GMT)
Battery GraphNets : Relational Learning for Lithium-ion Batteries(LiBs) Life Estimation [0.0] 本稿では、バッテリパラメータ間で独立した依存性グラフ構造を組み込むことを共同で学習するバッテリグラフネットワークフレームワークを提案する。
提案手法は,市販のバッテリデータセットにおいて,いくつかの一般的な手法よりも優れた性能を示し,SOTA性能を実現する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 15:44:56 GMT)
Automatic Feature Recognition and Dimensional Attributes Extraction From CAD Models for Hybrid Additive-Subtractive Manufacturing [0.0] 本稿では,加法および減算加工の両方に関連する特徴を含む合成CADデータセットを作成するための新しいアプローチを提案する。
階層型グラフ畳み込みニューラルネットワーク (HGCNN) モデルは, 合成加法-減算的特徴を正確に識別するために実装されている。
提案モデルでは,特徴認識精度が97%を超え,特徴抽出精度が100%以上であることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 05:16:46 GMT)
At Least Factor-of-Two Optimization for RWLE-Based Homomorphic Encryption [0.0] ホモモルフィック暗号化(HE)は、復号化を必要とせずに、暗号化データの特定の操作をサポートする。
HEスキームには、データ集約的なワークロードを妨げるような、非自明な計算オーバーヘッドが伴います。
我々は、Zincと呼ぶ暗号化方式を提案し、複数のキャッシュ処理を禁止し、単一のスカラー加算で置き換える。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 05:42:35 GMT)
Algebraic Representations for Faster Predictions in Convolutional Neural Networks [0.0] 畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンにおけるタスクのモデルとして一般的な選択肢である。
より簡単な勾配最適化問題を作成するために、スキップ接続を追加することもできる。
スキップ接続を持つ任意の複雑で訓練された線形CNNは単層モデルに単純化可能であることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 21:10:05 GMT)
Achieving Data Efficient Neural Networks with Hybrid Concept-based Models [0.0] クラスラベルと概念と呼ばれるデータセットの付加情報の両方をトレーニングする2つの新しいモデルアーキテクチャを導入する。
ハイブリッドの概念に基づくモデルは、特にスパースデータ設定において、精度に関して、標準的なコンピュータビジョンモデルよりも優れていることを示す。
また,概念ベースモデルの概念予測を変更せずに,クラス予測を変更する方法で,画像が摂動されるような,敵対的概念攻撃を行うアルゴリズムも導入する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 10:15:34 GMT)
A systematic dataset generation technique applied to data-driven automotive aerodynamics [0.0] ニューラルネットワークを用いた自動車測地におけるドラッグ予測の文脈内で、データセットを生成するための新しい戦略が開発されている。
本手法は,少数の開始点に頼り,それらの間を体系的に補間するためのレシピを提供する。
現実的な自動車形状を用いてこの戦略を検証し、畳み込みニューラルネットワークがドラッグ係数や表面圧力を予測するのに非常に優れていることを示す。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 06:37:30 GMT)
A Spitting Image: Modular Superpixel Tokenization in Vision Transformers [0.0] Vision Transformer (ViT) アーキテクチャは伝統的に、画像の意味的内容に依存しないトークン化のためのグリッドベースのアプローチを採用している。
本稿では,トークン化と特徴抽出を分離するモジュール型スーパーピクセルトークン化戦略を提案する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 17:28:58 GMT)
A Quantum-Inspired Analysis of Human Disambiguation Processes [0.0] この論文では、基礎量子力学から生じる形式主義を言語学から生じるあいまいさの研究に適用する。
その後、人間の行動予測や現在のNLP法よりも優れた結果が得られた。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 09:21:23 GMT)
A General Framework for Treatment Effect Estimation in Semi-Supervised and High Dimensional Settings [0.0] 我々は, より堅牢で, (2) 教師付きよりも効率的であるSS推定器群を開発した。
さらに、モデル内の正当性スコアが正しく指定されたときに、SS推定器のルート-n整合性と正規性を確立する。
我々の推定器は、すべてのニュアンス関数が正しく指定されている限り、半パラメトリックに効率的であることが示される。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 07:24:17 GMT)
$N$-bein formalism for the parameter space of quantum geometry [0.0] この研究は、量子幾何学テンソルを一般化する幾何学的対象を導入し、これを$N$-beinと呼ぶ。
2つの状態の量子幾何テンソルは、2つの連続するパラメータの変動の後、ある状態から別の状態へ移動する可能性を測定する。
新しいテンソルは、他の方法では利用できない量子状態間の相関を定量化する。
論文参考訳(メタデータ) (Wed, 14 Aug 2024 18:19:18 GMT)