Position: Bayesian Deep Learning is Needed in the Age of Large-Scale AI [189.1] 本稿では,ベイズ深層学習(BDL)の強みを再考し,既存の課題を認識した。
これらの障害に対処するための、エキサイティングな研究の道のりが浮かび上がっている。
今後の議論は、大規模ファンデーションモデルをBDLと組み合わせて、その潜在能力を最大限に活用する方法に焦点を当てている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:06:35 GMT)
Equivariant Graph Neural Operator for Modeling 3D Dynamics [149.0] 我々は,次のステップの予測ではなく,ダイナミックスを直接トラジェクトリとしてモデル化するために,Equivariant Graph Neural Operator (EGNO)を提案する。
EGNOは3次元力学の時間的進化を明示的に学習し、時間とともに関数として力学を定式化し、それを近似するためにニューラル演算子を学習する。
粒子シミュレーション、人間のモーションキャプチャー、分子動力学を含む複数の領域における総合的な実験は、既存の手法と比較して、EGNOの極めて優れた性能を示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 04:43:30 GMT)
GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection [133.5] LLM(Large Language Models)のトレーニングは、重み付けやGPU状態の増大によって、メモリ上の重大な問題が発生する。
本研究では,メモリ効率のトレーニング戦略としてグラディエント・ローランド・プロジェクション(GaLore)を提案する。
私たちの8ビットのGaLoreは、BF16ベースラインと比較して、メモリを82.5%、トレーニング総メモリを63.3%削減します。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 21:24:12 GMT)
State-Free Inference of State-Space Models: The Transfer Function Approach [132.8] 状態のない推論では、状態サイズが大きくなると大きなメモリや計算コストは発生しない。
提案した周波数領域転送関数のパラメトリゼーション特性を用いてこれを実現する。
長い畳み込みハイエナベースライン上での言語モデリングにおける難易度の改善を報告した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 02:48:05 GMT)
Identifiability and Asymptotics in Learning Homogeneous Linear ODE Systems from Discrete Observations [114.2] 通常の微分方程式(ODE)は、機械学習において最近多くの注目を集めている。
理論的な側面、例えば、統計的推定の識別可能性と特性は、いまだに不明である。
本稿では,1つの軌道からサンプリングされた等間隔の誤差のない観測結果から,同次線形ODE系の同定可能性について十分な条件を導出する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 11:36:13 GMT)
Momentor: Advancing Video Large Language Model with Fine-Grained Temporal Reasoning [102.5] 本稿では,微細な時間的理解作業を実現するためのビデオLLMであるMomentorを提案する。
Moment-10MでMomentorをトレーニングし、セグメントレベルの推論とローカライゼーションを可能にします。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 05:40:18 GMT)
Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data [102.2] 好みラベルからの学習は、微調整された大きな言語モデルにおいて重要な役割を果たす。
好みの微調整には、教師付き学習、オンライン強化学習(RL)、コントラスト学習など、いくつかの異なるアプローチがある。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 22:00:42 GMT)
Automatic Instruction Evolving for Large Language Models [93.5] Auto Evol-Instructは、人間の努力なしに大規模な言語モデルを使用して命令データセットを進化させるエンドツーエンドフレームワークである。
実験の結果, Auto Evol-Instruct で最適化された最良の手法は, 様々なベンチマークにおいて, 人為的に設計した手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:09:00 GMT)
MAP-Neo: Highly Capable and Transparent Bilingual Large Language Model Series [86.3] 私たちはMAP-Neoをオープンソースにしました。これは、4.5Tの高品質トークン上で、スクラッチからトレーニングされた7Bパラメータを持つバイリンガル言語モデルです。
MAP-Neo は,既存の最先端 LLM と比較して性能が劣る初の完全オープンソースバイリンガル LLM である。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:09:49 GMT)
Is Ego Status All You Need for Open-Loop End-to-End Autonomous Driving? [84.2] エンドツーエンドの自動運転は、フルスタックの観点から自律性を目標とする、有望な研究の方向性として浮上している。
比較的単純な駆動シナリオを特徴とするnuScenesデータセットは、エンド・ツー・エンド・モデルにおける知覚情報の未使用化につながる。
予測軌跡が道路に付着するかどうかを評価するための新しい指標を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:29:00 GMT)
MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model [78.1] MOFA-Videoは、様々な制御可能な信号を用いて、所定の画像から映像を生成する高度な制御可能な画像アニメーション手法である。
ビデオ生成パイプラインの動作を制御するために,複数のドメイン対応モーションフィールドアダプタを設計する。
トレーニングの後、異なるドメインのMOFA-Adaptersは、より制御可能なビデオ生成のために協力することもできる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:14:56 GMT)
Learning to Scale Logits for Temperature-Conditional GFlowNets [77.4] 温度条件付きGFlowNetのトレーニングを大幅に高速化する新しいアーキテクチャ設計である textitLogit-scaling GFlowNets (Logit-GFN) を提案する。
温度の学習関数がポリシーのロジットを直接スケールするために使用されると、課題は大幅に減少する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 05:07:36 GMT)
Envisioning Outlier Exposure by Large Language Models for Out-of-Distribution Detection [71.9] オープンワールドシナリオに機械学習モデルをデプロイする場合、アウト・オブ・ディストリビューション(OOD)サンプルは不可欠である。
本稿では,大規模言語モデル(LLM)の専門知識と推論能力を活用して,この制約に対処することを提案する。
EOEは、遠、近、きめ細かいOOD検出など、さまざまなタスクに一般化することができる。
EOEは様々なOODタスクで最先端のパフォーマンスを実現し、ImageNet-1Kデータセットに効果的にスケールできる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:09:48 GMT)
Local Methods with Adaptivity via Scaling [71.1] 本稿では,局所的な学習手法と適応的アプローチを融合して,効率的な分散学習手法を開発することを目的とする。
従来のローカルSGD法について検討し,スケーリング機能により拡張する。
理論的解析に加えて,ニューラルネットワークのトレーニングにより,本手法の有効性を検証した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:50:05 GMT)
Deciphering Oracle Bone Language with Diffusion Models [70.7] Oracle Bone Script (OBS) は約3,000年前の中国の上海王朝に由来する。
本稿では,Oracle Bone Script Decipher(OBSD)の開発を通じて,画像生成技術を採用した新しいアプローチを提案する。
OBSDは、古代の言語のAI支援分析の新しいコースをグラフ化して、解読のための重要な手がかりを生成する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:42:23 GMT)
iVideoGPT: Interactive VideoGPTs are Scalable World Models [70.0] マルチモーダル信号を統合するスケーラブルな自動回帰変換フレームワークであるInteractive VideoGPTを導入する。
iVideoGPTは、高次元の視覚的観察を効率的に識別する新しい圧縮トークン化技術を備えている。
我々の研究は、インタラクティブな汎用世界モデルの開発を進め、生成ビデオモデルと実践的なモデルベース強化学習アプリケーションとのギャップを埋める。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:44:20 GMT)
GPT4SGG: Synthesizing Scene Graphs from Holistic and Region-specific Narratives [69.4] 我々は,より正確で包括的なシーングラフ信号を得るために,textitGPT4SGという新しいフレームワークを提案する。
textitGPT4SGGは、画像キャプチャーデータに基づいて訓練されたSGGモデルの性能を大幅に向上させる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 11:32:19 GMT)
GenTron: Diffusion Transformers for Image and Video Generation [67.3] 我々は、Transformerベースの拡散を利用した生成モデルのファミリーであるGenTronを紹介する。
我々はGenTronを約900万から3B以上のパラメータに拡張し、視覚的品質の大幅な改善を観察した。
我々はGenTronをテキスト・ツー・ビデオ・ジェネレーションに拡張し、動画品質を向上させるために新しいモーションフリー・ガイダンスを取り入れた。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:30:39 GMT)
Why Tabular Foundation Models Should Be a Research Priority [65.8] タブラルデータは、多くの分野において支配的なモダリティであるが、研究の注意がほとんど与えられず、スケールとパワーの面ではかなり遅れている。
私たちは現在、表形式の基礎モデル、あるいはLTM(Large Tabular Model)と呼ばれるものの開発を始める時が来たと信じています。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:50:49 GMT)
Diff-Mosaic: Augmenting Realistic Representations in Infrared Small Target Detection via Diffusion Prior [63.6] 本稿では拡散モデルに基づくデータ拡張手法であるDiff-Mosaicを提案する。
我々は,モザイク画像を高度に調整し,リアルな画像を生成するPixel-Priorという拡張ネットワークを導入する。
第2段階では,Diff-Prior という画像強調戦略を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:23:05 GMT)
The Power of Summary-Source Alignments [62.8] 多文書要約(MDS)は難しい課題であり、しばしばサリエンスと冗長性検出のサブタスクに分解される。
参照要約とそのソース文書間の対応する文のアライメントを利用して、トレーニングデータを生成する。
本稿では,よりきめ細かな提案スパンレベルで適用することで,要約ソースアライメントフレームワークを拡張することを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:35:19 GMT)
Classical-to-Quantum Transfer Learning Facilitates Machine Learning with Variational Quantum Circuit [62.6] 本稿では,変分量子回路(VQC)を用いた古典的量子移動学習アーキテクチャにより,VQCモデルの表現と一般化(推定誤差)が向上することを証明する。
古典-量子遷移学習のアーキテクチャは、事前学習された古典的生成AIモデルを活用し、訓練段階におけるVQCの最適パラメータの発見を容易にする。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:55:08 GMT)
CoCo-Agent: A Comprehensive Cognitive MLLM Agent for Smartphone GUI Automation [61.7] MLLM(Multimodal large language model)は、人間のような自律型言語エージェントが現実世界の環境と相互作用する可能性を示している。
包括的環境認識(CEP)と条件付き行動予測(CAP)の2つの新しいアプローチを備えた包括的認知型LLMエージェントCoCo-Agentを提案する。
AITW と META-GUI ベンチマークにおいて,我々のエージェントは実シナリオで有望な性能を示す新しい最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:25:05 GMT)
Improving Accuracy-robustness Trade-off via Pixel Reweighted Adversarial Training [61.6] また,Pixel-reweighted AdveRsarial Training (PART)を提案する。
CIFAR-10、SVHN、TinyImagenet-200の堅牢性を損なうことなく、精度の顕著な向上を実現している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:43:34 GMT)
LongSkywork: A Training Recipe for Efficiently Extending Context Length in Large Language Models [61.1] LongSkyworkは、最大20万のトークンを処理できる、長いコンテキストのLarge Language Modelである。
我々は合成データを作成する2つの新しい方法を開発した。
LongSkyworkは、様々なロングコンテキストベンチマークで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:34:41 GMT)
VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.9] VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:50:46 GMT)
Covariance-Adaptive Sequential Black-box Optimization for Diffusion Targeted Generation [60.4] ユーザのブラックボックス目標スコアのみを用いた拡散モデルを用いて,ユーザ優先のターゲット生成を行う方法を示す。
数値実験問題と目標誘導型3次元分子生成タスクの両方の実験により,より優れた目標値を得る上で,本手法の優れた性能が示された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:26:27 GMT)
Distortion-free Watermarks are not Truly Distortion-free under Watermark Key Collisions [58.8] 言語モデル(LM)ウォーターマーキング技術は、統計信号をLM生成コンテンツに注入する。
歪みのない新しい透かし-β透かしを導入します。
実験結果から,β-透かしが鍵衝突時の分布バイアスを効果的に低減できることが確認された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 04:07:32 GMT)
How Can We Train Deep Learning Models Across Clouds and Continents? An Experimental Study [58.0] 代表的なCV, NLP, ASRモデルに対して, 異なるゾーン, 大陸, 雲におけるトレーニングの費用とスループットについて検討した。
スポット価格を活用することで、複数の安価なインスタンスでモデルをトレーニングし、より集中的かつ強力なハードウェアと、競争力のある価格でオンデマンドのクラウド製品の両方を台無しにする、新たなコスト効率の方法が実現されることを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:53:59 GMT)
GLaMM: Pixel Grounding Large Multimodal Model [57.9] 本研究では,対応するオブジェクトセグメンテーションマスクとシームレスに相互作用する自然言語応答を生成可能な最初のモデルであるGrounding LMM(GLaMM)を提案する。
GLaMMはテキストとオプションの視覚的プロンプト(関心領域)の両方を入力として受け入れるほど柔軟である。
提案したGCGタスクは,大規模に自然界に密着した概念を必要とする。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 00:33:53 GMT)
Graph Generation with Diffusion Mixture [57.8] グラフの生成は、非ユークリッド構造の複雑な性質を理解する必要がある実世界のタスクにとって大きな課題である。
本稿では,拡散過程の最終グラフ構造を明示的に学習することにより,グラフのトポロジーをモデル化する生成フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:00:20 GMT)
Generative Modeling on Manifolds Through Mixture of Riemannian Diffusion Processes [57.4] 一般多様体上に生成拡散過程を構築するための原理的枠組みを導入する。
従来の拡散モデルの認知的アプローチに従う代わりに、橋梁プロセスの混合を用いて拡散過程を構築する。
混合過程を幾何学的に理解し,データ点への接する方向の重み付け平均としてドリフトを導出する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:31:06 GMT)
Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption [57.1] 本稿では,制御可能な生成画像圧縮フレームワークである制御-GICを提案する。
高忠実度および一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
我々は、歴史的符号化された多粒度表現に遡ることができる条件条件付き条件付けを開発する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:22:09 GMT)
PyGOD: A Python Library for Graph Outlier Detection [56.3] PyGODは、グラフデータの外れ値を検出するオープンソースライブラリである。
外れ値検出のための主要なグラフベースのメソッドを幅広くサポートしています。
PyGODはBSD 2-Clauseライセンスの下でhttps://pygod.orgとPython Package Index (PyPI)でリリースされている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 04:38:45 GMT)
Are you still on track!? Catching LLM Task Drift with Activations [55.8] 大規模言語モデル(LLM)は、ユーザや他のソースからの入力を処理したり、タスクを編成したりするための検索拡張されたアプリケーションで日常的に使用される。
これにより、LDMがデータのみのソースからの命令を受け取り、作用するインジェクション攻撃を誘導する扉が開き、ユーザーの元の命令から逸脱する。
我々はこれをタスクドリフトと定義し、LCMのアクティベーションをスキャンして解析することでこれをキャッチすることを提案する。
このアプローチは、これらの攻撃に対してトレーニングを受けることなく、インジェクションやジェイルブレイク、悪意のある指示など、目に見えないタスクドメインに対して驚くほどうまく一般化することを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:53:21 GMT)
Beyond Sole Strength: Customized Ensembles for Generalized Vision-Language Models [55.6] ファインチューニング型視覚言語モデル (VLM) はその実用的価値から人気が高まっている。
本稿では、より弱いVLMを活用してロバストな単一モデルの一般化を促進するための協調可能性について検討する。
それぞれが特定のシナリオに合わせてカスタマイズされた3つのアンサンブル戦略を導入する。
提案したアンサンブル戦略はゼロショット,ベース・ツー・ニュー,クロスデータセットの一般化に基づいて評価され,新たな最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:00:49 GMT)
NeRF On-the-go: Exploiting Uncertainty for Distractor-free NeRFs in the Wild [55.2] 我々は,複雑なシーンにおける新規ビューのロバストな合成を可能にする,シンプルで効果的な方法であるNeRF On-the-goを紹介する。
本手法は,最先端技術よりも大幅に向上したことを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:15:27 GMT)
X-Ray: A Sequential 3D Representation For Generation [54.2] 我々は、X線スキャンにインスパイアされた新しい3Dシーケンシャル表現であるX線を紹介する。
X線は3Dオブジェクトを異なる層で一連の表面フレームに変換するため、画像から3Dモデルを生成するのに適している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:58:41 GMT)
Towards Building Multilingual Language Model for Medicine [54.1] 6つの主要言語を含む約25.5Bトークンを含む多言語医療コーパスを構築した。
MMedBench と呼ばれる有理性を持つ多言語医療用多言語質問応答ベンチマークを提案する。
我々の最終モデルであるMMed-Llama 3は、8Bパラメータしか持たないが、MMedBenchおよび英語ベンチマークの他のすべてのオープンソースモデルと比較して優れた性能が得られる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:02:00 GMT)
Show, Don't Tell: Aligning Language Models with Demonstrated Feedback [54.1] Demonstration ITerated Task Optimization (DITTO)は、言語モデルの出力とユーザの実証された振る舞いを直接調整する。
我々は,DITTOがニュース記事やメール,ブログ記事などのドメイン間できめ細かいスタイルやタスクアライメントを学習する能力を評価する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:13:56 GMT)
Improving Diffusion Models for Inverse Problems Using Optimal Posterior Covariance [52.1] 近年の拡散モデルは、特定の逆問題に対して再訓練することなく、ノイズの多い線形逆問題に対する有望なゼロショット解を提供する。
この発見に触発されて、我々は、最大推定値から決定されるより原理化された共分散を用いて、最近の手法を改善することを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:39:45 GMT)
Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models [52.0] 我々は、LVLMの科学的理解を高めるために、ArXivCapとArXivQAからなるMultimodal ArXivを紹介する。
ArXivCapは、6.4Mの画像と3.9Mキャプションからなるフィギュアキャプチャーデータセットであり、様々な科学領域にまたがる572K ArXivの論文から得られたものである。
ArXivQAは、科学的な数値に基づいてGPT-4Vを誘導することによって生成される質問応答データセットである。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:47:16 GMT)
MBQuant: A Novel Multi-Branch Topology Method for Arbitrary Bit-width Network Quantization [51.9] 任意のビット幅量子化のための新しい手法MBQuantを提案する。
本稿では,既存の任意のビット幅量子化法と比較して,MBQuantが大幅な性能向上を実現していることを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 08:30:21 GMT)
Physics of Language Models: Part 1, Learning Hierarchical Language Structures [51.7] トランスフォーマーベースの言語モデルは効率的だが複雑であり、内部動作を理解することは大きな課題である。
本稿では,長文を生成可能な階層規則を生成する合成CFGのファミリーを紹介する。
我々は、GPTのような生成モデルがこのCFG言語を正確に学習し、それに基づいて文を生成することを実証する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:16:50 GMT)
Sp2360: Sparse-view 360 Scene Reconstruction using Cascaded 2D Diffusion Priors [51.4] 潜時拡散モデル(LDM)を用いた360度3次元シーンのスパースビュー再構成に挑戦する。
SparseSplat360は,未完成の細部を埋めたり,新しいビューをクリーンにするために,インペイントとアーティファクト除去のカスケードを利用する手法である。
提案手法は,9つの入力ビューから360度映像全体を生成する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 22:05:39 GMT)
From Cluster Assumption to Graph Convolution: Graph-based Semi-Supervised Learning Revisited [51.2] グラフベースの半教師付き学習(GSSL)は、長い間ホットな研究トピックだった。
グラフ畳み込みネットワーク (GCN) は, 有望な性能を示す主要な技術となっている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:01:11 GMT)
Towards General Robustness Verification of MaxPool-based Convolutional Neural Networks via Tightening Linear Approximation [51.2] MaxLinは、線形近似が厳密なMaxPoolベースのCNNの堅牢性検証器である。
我々は、MNIST、CIFAR-10、Tiny ImageNetデータセットでトレーニングされたLeNetやネットワークを含むオープンソースのベンチマークでMaxLinを評価した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:33:04 GMT)
Hypergraph Transformer for Semi-Supervised Classification [50.9] 我々は新しいハイパーグラフ学習フレームワークHyperGraph Transformer(HyperGT)を提案する。
HyperGTはTransformerベースのニューラルネットワークアーキテクチャを使用して、すべてのノードとハイパーエッジのグローバル相関を効果的に検討する。
局所接続パターンを保ちながら、グローバルな相互作用を効果的に組み込むことで、包括的なハイパーグラフ表現学習を実現する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:59:07 GMT)
Auditing for Racial Discrimination in the Delivery of Education Ads [50.4] 本稿では,教育機会のための広告配信において,人種的偏見を評価できる新たな第三者監査手法を提案する。
メタのアルゴリズムによる教育機会の広告配信における人種差別の証拠を見つけ、法的および倫理的懸念を訴える。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 02:00:55 GMT)
Machine Learning of the Prime Distribution [49.8] 素数の可学習性に関するヤン・フイ・ヘの実験的な観察を説明する理論的論証を提供する。
我々はまた、ErdHos-Kac法が現在の機械学習技術によって発見される可能性は極めて低いと仮定している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:18:40 GMT)
An Information Compensation Framework for Zero-Shot Skeleton-based Action Recognition [49.5] ゼロショットの人間の骨格に基づく行動認識は、トレーニング中に見られるカテゴリ外の行動を認識するモデルを構築することを目的としている。
従来の研究では、シーケンスの視覚的空間分布と意味的空間分布の整合性に焦点が当てられていた。
強固で頑健な表現を得るために,新たな損失関数サンプリング手法を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:53:01 GMT)
T2LM: Long-Term 3D Human Motion Generation from Multiple Sentences [47.3] シーケンシャルデータなしでトレーニングできる連続的な長期生成フレームワークであるT2LMを紹介する。
T2LMは、潜伏ベクトルの列に動きを圧縮するように訓練された1D畳み込みVQVAEと、入力テキストが与えられた潜伏列を予測するTransformerベースのテキストの2つのコンポーネントから構成される。
推論において、文列は遅延ベクトルの連続ストリームに変換される。これはVQVAEデコーダによって復号され、局所的な時間的受容場との1D畳み込みの使用は、トレーニングと生成されたシーケンス間の時間的矛盾を避ける。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:44:35 GMT)
Correlation Matching Transformation Transformers for UHD Image Restoration [46.6] 本稿では,UHD画像復元のための汎用変換器を提案する。
UHDformerには、(a)高分解能空間での学習と(b)低分解能空間での学習の2つの学習空間がある。
実験の結果、UHDformerは最先端の手法と比較して約97%のモデルサイズを削減できることがわかった。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:10:48 GMT)
Bridging Multicalibration and Out-of-distribution Generalization Beyond Covariate Shift [44.7] マルチキャリブレーションによるアウト・オブ・ディストリビューションの一般化のための新しいモデルに依存しない最適化フレームワークを構築した。
本稿では,マルチキャリブレーションとアウト・オブ・ディストリビューションの一般化を両立させるポストプロセッシングアルゴリズムMC-Pseudolabelを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 08:11:35 GMT)
LatentMan: Generating Consistent Animated Characters using Image Diffusion Models [44.2] テキスト・ツー・イメージ(T2I)拡散モデルに基づいて,アニメキャラクターの一貫した映像を生成するゼロショット手法を提案する。
提案手法は,既存のゼロショットT2V手法より,ピクセルワイドの一貫性とユーザ嗜好の観点からアニメーションキャラクターのビデオ生成に優れる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:50:54 GMT)
Learning to Play 7 Wonders Duel Without Human Supervision [43.4] 本稿では,ボードゲーム「7 Wonders Duel」をプレイするために開発された人工知能システム「ZeusAI」を紹介する。
ZeusAIは、Monte Carlo Tree SearchとTransformer Neural Networkを組み合わせて、人間の監督なしにゲームを学ぶ。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:28:57 GMT)
PatchScaler: An Efficient Patch-Independent Diffusion Model for Super-Resolution [43.0] 拡散モデルは、その印象的なコンテンツ生成機能により、超解像の品質を著しく向上させる。
近年、サンプリングステップの数を削減すべく、合理的な推論アクセラレーションについて検討されているが、各ステップが全画像上で実行されるため、計算コストは高いままである。
本稿では,パッチ非依存拡散に基づく単一画像超解像法であるPatchScalerを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 05:27:34 GMT)
CoLLaVO: Crayon Large Language and Vision mOdel [42.2] 現在のビジョン言語モデルが本当に品質の高いオブジェクトレベルの画像理解能力を持っているかどうかは、まだ解明されていない。
その結果,現在のVLMのイメージ理解能力は,視覚言語(VL)タスクにおけるゼロショット性能と強く相関していることが判明した。
オブジェクトレベルの画像理解を強化するために,Crayon Large Language and Vision mOdel (CoLLaVO)を提案する。
本稿では,視覚的指導指導中に,オブジェクトレベルのイメージ理解を忘れずに維持するためのDual QLoRAの学習戦略を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:34:18 GMT)
Advancing Parameter Efficiency in Fine-tuning via Representation Editing [41.8] 我々はRepresentation EDiting (RED)というニューラルモデルのための新しい微調整手法を提案する。
REDは、スケーリングとバイアス処理の適用を通じて、いくつかのレイヤで生成された表現を修正します。
注目すべきは、REDは完全なパラメータの微調整と他のPEFT手法に匹敵する、あるいは優れている結果を達成することである。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:05:31 GMT)
Diffusion Tuning: Transferring Diffusion Models via Chain of Forgetting [41.8] Diff-Tuningは、忘れる傾向の連鎖を利用する、フラストレーション的にシンプルな転送手法である。
D Diff-Tuningは標準的な微調整よりも26%改善され、ControlNetの収束速度が24%向上した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:20:59 GMT)
Adaptive Robotic Arm Control with a Spiking Recurrent Neural Network on a Digital Accelerator [41.6] 本稿では,システムの概要と,Pynq ZUプラットフォーム上で使用するPythonフレームワークについて述べる。
シミュレーションされた精度は,毎秒380万イベントのピーク性能で維持されていることを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:57:00 GMT)
Hypergraph-MLP: Learning on Hypergraphs without Message Passing [41.4] 多くのハイパーグラフニューラルネットワークは、ハイパーグラフ構造上のメッセージパッシングを利用してノード表現学習を強化する。
我々は、ハイパーグラフ構造に関する情報を、明示的なメッセージパッシングを伴わずに、トレーニングの監督に組み込む方法を提案する。
具体的には,ハイパーグラフ構造化データのための新しい学習フレームワークであるHypergraph-MLPを紹介する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 22:15:18 GMT)
Transformers Learn Nonlinear Features In Context: Nonconvex Mean-field Dynamics on the Attention Landscape [40.8] Transformerアーキテクチャに基づく大規模言語モデルは、コンテキストで学習できる印象的な能力を示している。
共通非線形表現や特徴写像は、文脈内学習の力を高めるために利用できることを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:31:43 GMT)
Representing Animatable Avatar via Factorized Neural Fields [40.0] フレーム毎のレンダリング結果は、フレームの一貫性を促進するために、ポーズ非依存のコンポーネントと対応するポーズ依存のコンポーネントに分解することができる。
入力ビデオ全体の粗い体輪郭のコヒーレントな保存を実現する。
我々のネットワークは、高周波の詳細を保存し、一貫した体輪郭を確保するために、NeRF(Near Radiance Field)に基づく最先端の手法を超越している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:45:38 GMT)
Skin-in-the-Game: Decision Making via Multi-Stakeholder Alignment in LLMs [39.8] 本稿では,Large Language Models(LLMs)における道徳的推論の強化を目的としたSKIGフレームワークを紹介する。
SKIGのメカニズムは、共感のエクササイズやリスクアセスメントと並んで、行動の説明責任をシミュレートすることであり、その効果に欠かせないものである。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:48:56 GMT)
Efficient site-resolved imaging and spin-state detection in dynamic two-dimensional ion crystals [39.6] 量子コンピューティング、シミュレーション、センシングにおいて、個々の捕捉されたイオンのスピン状態を高い忠実度で解き明かすことは、幅広い分野の応用にとって重要である。
本稿では, ハードウェア検出器と人工ニューラルネットワークを組み合わせた, トラップ領域に100個以上のイオンを閉じ込めた大型2次元(2次元)結晶の高忠実度状態判別法について報告する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:15:20 GMT)
Enhancing Zero-shot Text-to-Speech Synthesis with Human Feedback [39.5] テキスト音声(TTS)最適化に適したサンプリングアノテート学習フレームワークを提案する。
MOS, 単語誤り率, 話者類似度の観点から, UNO は TTS モデルのゼロショット性能を大幅に向上することを示した。
また、感情的TTSにおいて、所望の話し方にシームレスかつ柔軟に対応できるUNOの顕著な能力を示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 07:54:33 GMT)
FOCUS: Forging Originality through Contrastive Use in Self-Plagiarism for Language Models [38.8] プレトレーニング言語モデル(PLM)は、様々な自然言語生成(NLG)タスクにおいて印象的な結果を示している。
本研究では, PLMが生成するテキストの独創性を高めることを目的とした, 独特な「自己プラギアリズム」コントラスト的復号戦略を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:17:00 GMT)
AFaCTA: Assisting the Annotation of Factual Claim Detection with Reliable LLM Annotators [38.5] AFaCTAは、事実主張のアノテーションを支援する新しいフレームワークである。
AFaCTAは、3つの事前定義された推論経路に沿って、アノテーションの信頼度を一貫性で調整する。
PoliClaimは、さまざまな政治的トピックにまたがる包括的なクレーム検出データセットである。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:35:25 GMT)
PureGen: Universal Data Purification for Train-Time Poison Defense via Generative Model Dynamics [38.5] トレインタイムのデータ中毒攻撃は、トレーニング中に敵対的な例を導入することによって機械学習モデルを脅かす。
本稿では,拡散エネルギーベースモデル (EBM) と Denoising Probabilistic Models (DDPMs) の反復的ランゲヴィンダイナミクスにより実現された変換($Psi(x)$)を用いた普遍的データ浄化手法を提案する。
これらのアプローチは、一般化に最小限の影響で有毒データを浄化する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:11:50 GMT)
Peeking with PEAK: Sequential, Nonparametric Composite Hypothesis Tests for Means of Multiple Data Streams [38.0] テストバイベッティングフレームワークの上に構築し、停止時間にまたがる非漸近的な$alpha$レベルのテストを提供します。
実験の結果,PEAKは停止前のサンプル数を最大85%削減できることがわかった。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 22:41:02 GMT)
Ultrasound Report Generation with Cross-Modality Feature Alignment via Unsupervised Guidance [37.4] 教師なしおよび教師なしの学習手法を併用した,超音波自動レポート生成のための新しいフレームワークを提案する。
本フレームワークは,超音波テキストレポートから潜在的知識を抽出するための教師なし学習手法を取り入れている。
我々は、より包括的で正確な医療報告を生成する能力を高めるために、グローバルな意味比較機構を設計する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 07:16:58 GMT)
Inverse Constitutional AI: Compressing Preferences into Principles [37.3] Inverse Constitutional AI (ICAI) の問題に目を向ける。
ICAIでは、フィードバックと微調整AIモデルを提供するために一連の原則が使用される。
初期ICAIアルゴリズムを提案し,その構成を検証した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 11:54:50 GMT)
Towards Task Sampler Learning for Meta-Learning [37.0] メタラーニングは、限られたデータから行われる多様なトレーニングタスクで一般的な知識を学び、それを新しいタスクに転送することを目的としている。
タスク多様性の増大はメタラーニングモデルの一般化能力を高めると一般的に信じられている。
本稿では、経験的および理論的分析を通して、この見解に挑戦する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 08:52:13 GMT)
Scaling Tractable Probabilistic Circuits: A Systems Perspective [36.5] PyJuiceは、いくつかの点で先行技術を改善するPCの一般的な実装設計である。
大規模PCのトレーニングでは、既存のシステムよりも1~2桁高速である。
PyJuiceは2~5倍のメモリを消費するので、より大きなモデルをトレーニングすることができます。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:57:00 GMT)
LLMs Could Autonomously Learn Without External Supervision [36.4] 大規模言語モデル(LLM)は、伝統的に人間の注釈付きデータセットと事前定義されたトレーニング目標に結び付けられてきた。
本稿では,LLMのための自律学習手法を提案する。
本手法は, LLMに対して, 文章と直接対話して自己学習を行う能力を与える。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:36:37 GMT)
DiG-IN: Diffusion Guidance for Investigating Networks -- Uncovering Classifier Differences, Neuron Visualisations, and Visual Counterfactual Explanations [35.5] ディープラーニングは、ImageNetのような複雑な画像分類タスク、予期せぬ障害モード、例えばスプリアス機能などに大きな進歩をもたらした。
安全クリティカルなタスクでは、その決定のブラックボックスの性質は問題であり、説明や少なくとも意思決定を行う方法が緊急に必要である。
本稿では,これらの問題に対して,ガイド画像生成のためのフレームワークを用いて分類器由来の目的を最適化した画像を生成する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:18:37 GMT)
Evaluating Mathematical Reasoning of Large Language Models: A Focus on Error Identification and Correction [35.0] LLM(Large Language Models)の既存の評価は、検査の観点からの問題解決に重点を置いている。
我々は、アノテーション付きエラータイプとステップを持つ新しいデータセットとともに、エラー識別と修正のための4つの評価タスクを定義した。
その結果, GPT-4は全モデルより優れており, LLaMA-2-7BはGPT-3.5やGemini Proに匹敵する性能を示した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:16:24 GMT)
Collaborative Novel Object Discovery and Box-Guided Cross-Modal Alignment for Open-Vocabulary 3D Object Detection [34.9] CoDAv2は、新しい3Dオブジェクトのローカライズと分類の両方に取り組むために設計された統一フレームワークである。
CoDAv2は、高いマージンで最高のパフォーマンスの方法より優れている。
ソースコードと事前トレーニングされたモデルはGitHubプロジェクトページで公開されている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:32:37 GMT)
Differentiation of Multi-objective Data-driven Decision Pipeline [34.6] 実世界のシナリオは、しばしば多目的データ駆動最適化問題を含む。
従来の2段階の手法では、機械学習モデルを用いて問題係数を推定し、続いて予測された最適化問題に取り組むためにソルバを呼び出す。
近年の取り組みは、下流最適化問題から導かれる意思決定損失を用いた予測モデルのエンドツーエンドトレーニングに重点を置いている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:42:03 GMT)
Meta-Reasoning: Semantics-Symbol Deconstruction for Large Language Models [34.2] 実世界の象徴的手法の適用性と適応性を広げるためのメタ推論を提案する。
この方法はLLMに対して、推論に依存しない意味情報を汎用的な記号表現に分解する権限を与える。
我々は、算術、記号、論理的推論といった従来の推論タスクを含む10以上のデータセットと、理論の推論のようなより複雑な対話的推論タスクに関する広範な実験を行う。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:48:21 GMT)
Streaming quanta sensors for online, high-performance imaging and vision [34.1] 量子画像センサ(QIS)は多くの困難なシナリオにおいて顕著な撮像能力を示した。
その可能性にもかかわらず、これらのセンサーの採用は、(a)高いデータレートと(b)非伝統的な生データを扱うための新しい計算パイプラインの必要性により、著しく妨げられている。
これらの課題に対処するために、単純で低帯域幅の計算パイプラインを導入する。
提案手法は,100倍の帯域幅削減とリアルタイム画像再構成とコンピュータビジョンを実現する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:30:49 GMT)
PruNeRF: Segment-Centric Dataset Pruning via 3D Spatial Consistency [33.7] PruNeRFは3次元空間整合性によるセグメント中心のデータセットプルーニングフレームワークである。
ベンチマークデータセットを用いた実験により、PruNeRFは邪魔者に対するロバスト性において、最先端の手法よりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:49:05 GMT)
Tackling Non-Stationarity in Reinforcement Learning via Causal-Origin Representation [33.6] 実世界のシナリオでは、強化学習の応用は複雑な非定常性によって著しく困難である。
既存のほとんどの手法は環境の変化を明示的にモデル化しようと試み、しばしば環境の非現実的な事前知識を必要とする。
我々は、非定常性は状態遷移の間、複雑な因果関係を通じて伝播し蓄積できるという新しい視点を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:32:12 GMT)
Unifying Bayesian Flow Networks and Diffusion Models through Stochastic Differential Equations [33.2] 拡散モデル(DM)のサンプルの代わりに、ベイズ流ネットワーク(BFN)がパラメータを反復的に洗練する。
本稿では,BFNを微分方程式(SDE)を介してDMと接続することで理解し,拡張することを目的とする。
そこで本研究では,BFNのサンプル品質を著しく上回るBFNの特殊解法を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:55:21 GMT)
Diffusion Actor-Critic with Entropy Regulator [32.8] エントロピーレギュレータ(DACER)を用いたオンラインRLアルゴリズムについて提案する。
このアルゴリズムは拡散モデルの逆過程を新しい政策関数として概念化する。
MuJoCoベンチマークとマルチモーダルタスクの実験は、DACERアルゴリズムが最先端(SOTA)性能を達成することを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 07:14:56 GMT)
Global Rewards in Restless Multi-Armed Bandits [32.6] レストレス・マルチアーム・バンディット(RMAB)はマルチアーム・バンディットを拡張し、腕を引っ張って将来の状態に影響を及ぼす。
RMABの成功にもかかわらず、重要な制限の前提は、報酬を武器の合計に分離できることである。
我々は、RMABのグローバル非分離報酬への一般化である、グローバル報酬(RMAB-G)を用いたレスレスマルチアームバンディットを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:13:46 GMT)
Unsupervised Domain Adaptation for Low-dose CT Reconstruction via Bayesian Uncertainty Alignment [32.6] 低線量CT(LDCT)画像再構成技術は、許容画質を維持しつつ、患者の放射線被曝を減らすことができる。
この問題ではディープラーニングが広く用いられているが、臨床シナリオではデータテストのパフォーマンスが劣化することが多い。
LDCT再構成の教師なし領域適応(UDA)は分布アライメントによってこの問題を解決するために提案されている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 08:42:11 GMT)
Full-Atom Peptide Design based on Multi-modal Flow Matching [32.6] フル原子ペプチドの設計のためのフローマッチングフレームワークを基盤とした,最初のマルチモーダル深層生成モデルであるPepFlowについて述べる。
高次元トーラス上で,$mathrmSE(3)$多様体内の剛性バックボーンフレームと側鎖角を用いてペプチド構造を特徴付ける。
提案手法は,固定バックボーンシーケンス設計や部分サンプリングによるサイドチェーンパッキングなど,様々なタスクに順応的に取り組む。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 12:59:54 GMT)
Differentially Private Low-Rank Adaptation of Large Language Model Using Federated Learning [32.5] 本稿では,大規模言語モデル(LLM)に適した新しいフェデレーション学習アルゴリズムDP-LoRAを紹介する。
DP-LoRAは、重み付け更新のノイズを追加し、データプライバシを個別に維持しつつ、協調的なモデルトレーニングを容易にするガウス機構を使用することで、データのプライバシを保存する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:31:21 GMT)
From Effectiveness to Efficiency: Comparative Evaluation of Code Generated by LCGMs for Bilingual Programming Questions [32.5] 大規模コード生成モデル(LCGM)は、様々なプログラミングタスクにおいて大きな注目を集め、有望な結果を得た。
既存のベンチマークは、LCGMが生成したコードの品質を不十分に評価する、英語のプログラミング問題と限定的なユニットテストケースに依存していることが多い。
本稿では,異なる自然言語を入力として使用する場合のコード品質の違い,特に有効性と効率について検討する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:22:30 GMT)
Phonetic Error Analysis of Raw Waveform Acoustic Models with Parametric and Non-Parametric CNNs [31.8] TIMITの音声認識タスクにおける生波形音響モデルの誤りパターンを解析する。
Affricate, diphthong, fricative, nasal, plosive, semi-vowel, vowel, quietの3つのグループに分類する。
置換誤差を用いて各カテゴリの混乱行列を構築し,その混乱パターンをフィルタバンクとWav2vec 2.0システムと比較する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:39:15 GMT)
Robust Fair Clustering with Group Membership Uncertainty Sets [31.3] 本研究では,各集団の集団レベルでの表現に近づき,各集団が制約される正準公正クラスタリング問題について検討する。
意思決定者によって与えられる少数のパラメータを必要とする、単純で解釈可能なエラーモデルのファミリーを導入する。
次に、証明可能なロバスト性保証を伴う公正クラスタリングのアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:11:31 GMT)
VeriSplit: Secure and Practical Offloading of Machine Learning Inferences across IoT Devices [31.2] 多くのIoT(Internet-of-Things)デバイスは、機械学習推論を実行するためにクラウド計算リソースに依存している。
これは高価で、ユーザーのプライバシーを心配する可能性がある。
ローカルで利用可能なデバイスに機械学習推論をオフロードするフレームワークであるVeriSplitを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:28:38 GMT)
MEMoE: Enhancing Model Editing with Mixture of Experts Adaptors [30.8] MEMoEは、Mixture of Experts (MoE)アーキテクチャと知識アンカールーティング戦略を利用したモデル編集アダプタである。
バッチ編集とシーケンシャルなバッチ編集の両方よりも,我々のアプローチの方が優れていることを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 02:32:31 GMT)
Open-Set Graph Anomaly Detection via Normal Structure Regularisation [30.6] 本稿では,重要なグラフ異常検出(GAD)タスク,すなわちオープンセットGADについて考察する。
現行の手法では、目に見えない異常を過剰に強調する傾向にあり、目に見えない異常を検知する弱い一般化能力に繋がる。
本稿では,新しいオープンセットGAD手法,すなわち正規構造正規化(NSReg)を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:18:26 GMT)
NewsBench: A Systematic Evaluation Framework for Assessing Editorial Capabilities of Large Language Models in Chinese Journalism [28.4] 我々は,中国語ジャーナリズムにおける編集能力のための大規模言語モデル(LLM)の能力を体系的に評価する新しい評価フレームワークであるNewsBenchを提案する。
構築したベンチマークデータセットは、筆記能力の4つの面と安全性の6つの面に焦点を当てている。
本稿では,GPT-4をベースとした自動評価プロトコルを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:38:01 GMT)
On the Convergence of Policy in Unregularized Policy Mirror Descent [28.3] 最近の有名な政策ミラー降下(PMD)における政策の収束分析を行う。
ブレグマン多元環の大きな体は、古典的ユークリッド距離のような最適ポリシーに有限段階収束を与えることができる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:38:20 GMT)
Machine Mindset: An MBTI Exploration of Large Language Models [28.2] 我々は,Mers-Briggs Type Indicator (MBTI)パーソナリティ特性を大規模言語モデル (LLM) に統合するための新しいアプローチを提案する。
提案手法は,MBTI特性をLLMに埋め込むための2相微調整と直接選好最適化(DPO)を含む。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:57:06 GMT)
Efficient Monte Carlo Tree Search via On-the-Fly State-Conditioned Action Abstraction [27.5] 状態とサブアクション間の構成構造に基づくアクション抽象化を提案する。
提案手法は,現在状態の遷移に関連するサブアクションをキャプチャする補助ネットワークを用いて,潜時ダイナミクスモデルを学習する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 04:31:30 GMT)
Learning Multimodal Behaviors from Scratch with Diffusion Policy Gradient [26.7] Deep Diffusion Policy Gradient (DDiffPG)は、マルチモーダルポリシーから学習する新しいアクター批判アルゴリズムである。
DDiffPGはマルチモーダルトレーニングバッチを形成し、モード固有のQ-ラーニングを使用して、RL目的の固有の欲求を緩和する。
さらに,本手法では,学習モードを明示的に制御するために,モード固有の埋め込みにポリシーを条件付けることができる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:32:28 GMT)
Early-Exit Neural Networks with Nested Prediction Sets [26.6] アーリーエグジットニューラルネットワーク(EENN)は、フォワードパス中に複数のステージで予測を提供することで、適応的で効率的な推論を可能にする。
共形予測や信頼できる集合といった標準的なベイズ的手法はEENNには適さない。
時効性信頼シーケンス(AVCS)について検討する。
これらのシーケンスは本質的にネストされており、EENNのシーケンシャルな予測に適している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:17:54 GMT)
M$^3$AV: A Multimodal, Multigenre, and Multipurpose Audio-Visual Academic Lecture Dataset [26.3] マルチモーダル・マルチジャンル・多目的音声視覚学術講義データセット(M$3$AV)を提案する。
M$3$AVには、コンピュータ科学、数学、医学、生物学に関する5つの情報源から367時間分のビデオがある。
スライドテキストと音声単語の高品質な人間のアノテーションにより、データセットは複数の音声視覚認識および理解タスクに使用することができる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 02:44:32 GMT)
Alirector: Alignment-Enhanced Chinese Grammatical Error Corrector [25.5] 中国の文法的誤り訂正(CGEC)は、自己回帰生成モデルを採用する際に深刻な過度な過度な問題に直面している。
過補正問題に対するアライメント強化補正器を提案する。
3つのCGECデータセットの実験結果から,本手法の有効性が示された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:50:40 GMT)
GLADformer: A Mixed Perspective for Graph-level Anomaly Detection [25.0] マルチパースペクティブなグラフレベルの異常検出器であるGLADformerを提案する。
具体的には、まず、グローバルスペクトル拡張を用いたグラフトランスフォーマーモジュールを設計する。
局所的な異常特性を明らかにするため、帯域通過スペクトルGNNメッセージパッシングモジュールをカスタマイズする。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 12:51:48 GMT)
Stealing Image-to-Image Translation Models With a Single Query [24.8] 画像と画像のモデルを盗む可能性について検討する。
このようなモデルの多くは、1つの小さなクエリイメージで盗むことができる。
注目すべきは、攻撃を盗む脆弱性は、CNNや注意機構を持つモデルによって共有されていることだ。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:30:41 GMT)
A Novel Defense Against Poisoning Attacks on Federated Learning: LayerCAM Augmented with Autoencoder [24.2] 連邦学習(FL)に対する最近の攻撃は、ユークリッド距離に基づく検出方法を回避する悪質なモデル更新をもたらす可能性がある。
本稿では,FLにおけるモデル中毒対策として,LayerCAM-AEと呼ばれる新しい防御戦略を提案する。
実験の結果,LayerCAM-AEは検出率(recall: 1.0, Precision: 1.0, FPR: 0.0, Accuracy: 1.0, F1 score: 1.0, AUC: 1.0)とFLにおけるテスト精度を向上し,ResNet-50とREGNETY-800MFの性能を上回った。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 12:37:12 GMT)
Biased Stochastic First-Order Methods for Conditional Stochastic Optimization and Applications in Meta Learning [24.1] 条件最適化問題に対するバイアス勾配勾配勾配(BSGD)を提案する。
下界解析により,BSGDは一般凸対象の非目的に対して改善できないことが示された。
この特別な設定のために、下界にマッチするバイアスドスパイダーブースト (BSpiderBoost) と呼ばれる加速アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 12:38:17 GMT)
Shared-unique Features and Task-aware Prioritized Sampling on Multi-task Reinforcement Learning [23.7] 現在のSOTA(State-of-the-art)手法は、強化学習タスクの実行時の性能不均衡の問題に悩まされている。
本稿では,2つの新しい戦略からなるSTARSという手法を提案する。
まず、共有共通機能抽出器は、共有機能とタスク固有の機能の両方を学び、異なるタスク間の知識の相乗効果を向上させる。
第2に、タスク対応サンプリング戦略と優先された体験リプレイを組み合わせることで、パフォーマンスの悪いタスクを効率的に学習する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:33:49 GMT)
Compositional 4D Dynamic Scenes Understanding with Physics Priors for Video Question Answering [23.0] 視覚言語モデル(VLM)では、映像からオブジェクトとその相互作用の動的特性を理解することが効果的な推論に不可欠である。
本稿では,オブジェクトの動的特性に着目したビデオ質問応答データセットSuperCLEVR-Physicsを紹介する。
ビデオからのシーン表現に基づく4次元ダイナミクス特性の推論のためのニューラル・シンボリックモデルNS-4Dynamicsを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 05:51:15 GMT)
An Iterative Associative Memory Model for Empathetic Response Generation [22.7] 共感的応答生成は、対話発話における認知的状態と感情的状態を理解することを目的としている。
共感応答生成のための反復連想記憶モデル(IAMM)を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:46:13 GMT)
Invisible Backdoor Attacks on Diffusion Models [22.1] 近年の研究では、バックドア攻撃に対する拡散モデルの脆弱性が明らかにされている。
本稿では,目に見えないトリガーの獲得と,挿入されたバックドアのステルスネスとレジリエンスの向上を目的とした,革新的なフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:43:19 GMT)
Exploiting Frequency Correlation for Hyperspectral Image Reconstruction [21.7] ハイパースペクトル画像 (HSI) 再構成における強力な手法として, 深層前駆体が出現している。
本稿では,既存のHSIデータセットの詳細な統計周波数解析に先立って,HFC(Hyperspectral Frequency correlation)を提案する。
次に、周波数のスペクトル的自己注意(SAF)と周波数のスペクトル的空間的相互作用(SIF)からなる周波数領域学習を確立する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:36:37 GMT)
Operationalizing content moderation "accuracy" in the Digital Services Act [21.7] EUが採択したデジタルサービス法(Digital Services Act)では、ソーシャルメディアプラットフォームが自動コンテンツモデレーションシステムの「正確性」を報告する必要がある。
さらなる仕様がなければ、規制要件は不十分な報告を可能にする。
我々は、法的概念を精査し、技術的実装に関連する「正確さ」レポートを運用する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:56:24 GMT)
DISCRET: Synthesizing Faithful Explanations For Treatment Effect Estimation [21.2] 我々は,各サンプルに対して忠実で規則に基づく説明を合成する自己解釈型ITTフレームワークdisCRETを提案する。
DISCRETの背景にある重要な洞察は、説明が2つのデータベースクエリとして機能し、類似したサンプルのサブグループを識別できるということである。
大規模な探索空間からこれらの説明を効率的に合成する新しいRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 04:01:08 GMT)
IBD-PSC: Input-level Backdoor Detection via Parameter-oriented Scaling Consistency [20.6] ディープニューラルネットワーク(DNN)は、バックドア攻撃に対して脆弱である。
本稿では、悪意のあるテスト画像のフィルタリングを行うための、シンプルで効果的な入力レベルのバックドア検出(IBD-PSCと呼ばれる)を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:06:02 GMT)
PentestGPT: An LLM-empowered Automatic Penetration Testing Tool [20.4] 大規模言語モデル(LLM)は、様々な領域において大きな進歩を見せている。
実世界の浸透試験におけるLLMの性能を,プラットフォームを用いたテストマシンから作成した頑健なベンチマークを用いて評価した。
LLMを利用した自動浸透試験ツールであるPentestGPTを紹介する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:16:49 GMT)
Timeline-based Sentence Decomposition with In-Context Learning for Temporal Fact Extraction [20.0] 本稿では,自然言語テキストから時間的事実を抽出する方法について述べる。
本稿では,大規模言語モデル(LLM)と文脈内学習を用いたタイムラインに基づく文分解手法を提案する。
実験の結果, TSDRE は HyperRED-Temporal データセットと ComplexTRED データセットの両方で最先端の結果が得られることがわかった。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 08:04:26 GMT)
Statistical Test for Anomaly Detections by Variational Auto-Encoders [19.9] 変分オートエンコーダ(VAE)を用いた異常検出の信頼性評価について検討する。
VAE-ADテストを用いて、VAEによって検出された異常領域の信頼性をp値の形で定量することができる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 07:11:28 GMT)
Global High Categorical Resolution Land Cover Mapping via Weak Supervision [19.5] 我々は、弱教師付きドメイン適応(WSDA)のために、完全ラベル付きソースドメインと弱ラベル付きターゲットドメインを組み合わせることを提案する。
粗いラベルと粗いラベルを使用することで、精密かつ詳細な土地被覆アノテーションに必要な労力を大幅に軽減できるため、これは有益である。
我々は,PlanetScope,Gaofen-1,Sentinel-2の衛星画像を用いて,世界中の10都市を対象とした高分類分解能土地被覆マッピングを行った。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:18:12 GMT)
SpyHammer: Understanding and Exploiting RowHammer under Fine-Grained Temperature Variations [19.5] 我々はRowHammerが温度変化に非常に敏感であることを示した。
クリティカルシステム上でDRAMの温度をスパイする新しいRowHammer攻撃(SpyHammer)を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:16:00 GMT)
Regime Learning for Differentiable Particle Filters [19.4] 微分可能な粒子フィルタは、シーケンシャルモンテカルロ法とニューラルネットワークの柔軟性を組み合わせて状態空間推論を行う新しいモデルのクラスである。
個々の体制と切り替えプロセスの両方を同時に学習する事前のアプローチは存在しない。
本稿では,ニューラルネットワークを用いた微分可能粒子フィルタ(RLPF)を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:59:04 GMT)
Hardware-Aware Parallel Prompt Decoding for Memory-Efficient Acceleration of LLM Inference [19.2] LLM(Large Language Models)の自動回帰デコーディングは、ハードウェアの性能に大きなオーバーヘッドをもたらす。
トレーニング可能なパラメータを0.0002$%しか必要とせず,A100-40GBのGPUをたった16時間で効率的にトレーニングできる並列プロンプトデコーディングを提案する。
我々のアプローチでは、最大2.49$times$ スピードアップを示し、最小のメモリオーバーヘッドは0.0004$%である。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:58:48 GMT)
When Only Time Will Tell: Interpreting How Transformers Process Local Ambiguities Through the Lens of Restart-Incrementality [19.1] 因果的モデルは1つの解釈を出力して継続せざるを得ないが、修正可能なモデルはあいまいさが解決されるにつれて、以前の出力を編集することができる。
本研究では、再起動・インクリメンタルトランスフォーマーが内部状態を構築・更新する方法について検討し、自動回帰モデルではリビジョンが不可能なプロセスが何を引き起こすかを明らかにする。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:48:13 GMT)
PET-SQL: A Prompt-Enhanced Two-Round Refinement of Text-to-SQL with Cross-consistency [19.1] スパイダーベンチマークで新しいSOTA結果が得られ、実行精度は87.6%である。
提案手法は, 87.6%の精度で, スパイダーベンチマークで新しいSOTA結果が得られる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 02:58:53 GMT)
Applying Intrinsic Debiasing on Downstream Tasks: Challenges and Considerations for Machine Translation [19.1] 内在的デバイアスの手法がニューラルマシン翻訳モデルにどのように影響するかを系統的に検証する。
私たちは、デバイアスングテクニックとエンドゴール使用の3つの課題とミスマッチを強調します。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:57:29 GMT)
The Embodied World Model Based on LLM with Visual Information and Prediction-Oriented Prompts [19.0] VOYAGERは、マインクラフトの世界における自律的な探索を可能にするLLMベースの組み込みAIとしてよく知られている。
視覚データの未使用化や世界モデルとしての機能不足といった問題がある。
考案されたプロンプトが世界モデルとしてのLLMの機能を引き出す可能性があることが示唆された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:50:01 GMT)
A Kernel Test for Causal Association via Noise Contrastive Backdoor Adjustment [18.8] 我々は、textitdo-null仮説である$H_0:; p(y|textit do(X=x))=p(y)$をテストする非パラメトリックな方法を開発した。
我々は,バックドアHSIC (bd-HSIC) が校正され,多数の共同設立者の下でバイナリと継続的治療を行う能力を持っていることを実証した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:48:34 GMT)
FuRL: Visual-Language Models as Fuzzy Rewards for Reinforcement Learning [18.6] オンライン強化学習(RL)における事前学習型視覚言語モデル(VLM)の活用について検討する。
本稿ではまず,VLMをRLタスクの報酬として適用する際の報酬ミスアライメントの問題を同定する。
ファジィVLM報酬支援RL(FuRL)という軽量微調整法を導入する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 07:20:08 GMT)
A Primal-Dual Algorithm for Offline Constrained Reinforcement Learning with Linear MDPs [18.4] 無限水平割引設定における線形 MDP を用いたオフライン RL の原始双対アルゴリズムを提案する。
本アルゴリズムは, 部分的データカバレッジを仮定した$O(epsilon-2)$のサンプル複雑性を実現するアルゴリズムとして, この設定において, 計算効率のよい最初のアルゴリズムである。
我々はアルゴリズムをオフラインの制約付きRL設定で動作させ、追加の報酬信号に制約を課すように拡張する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 21:38:47 GMT)
Topic Modeling for Short Texts with Large Language Models [18.3] 本稿では,並列プロンプトと逐次プロンプトの2つのアプローチについて,トピックモデリングにLarge Language Modelsを使用する。
実験の結果,提案手法は既存の手法よりも一貫性のあるトピックを識別できることがわかった。
その結果, 推測されたトピックが入力テキストを適切にカバーしているのに対して, 幻覚的トピックはほとんど生成されていないことがわかった。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:25:02 GMT)
End-to-End Hybrid Refractive-Diffractive Lens Design with Differentiable Ray-Wave Model [18.2] 本稿では,光収差と拡散位相変調の両方を正確にシミュレーションするためのハイブリッド光線トレーシングと波動伝搬(光波)モデルを提案する。
提案したレイウェーブモデルは完全に微分可能であり、屈折回折レンズ最適化と画像再構成ネットワークのエンドツーエンド共設計のための勾配バックプロパゲーションを可能にする。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:48:22 GMT)
A Blueprint Architecture of Compound AI Systems for Enterprise [18.1] 我々は、企業環境で運用する複合AIシステムのための青写真アーキテクチャを、費用対効果と実用性で導入する。
提案したアーキテクチャは,既存の計算とデータインフラストラクチャとのシームレスな統合を目標としています。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:16:32 GMT)
Investigating Multi-Hop Factual Shortcuts in Knowledge Editing of Large Language Models [18.0] 我々はまず,知識ニューロンによる事実的ショートカットの存在を探求する。
我々は,マルチホップ知識編集の観点から,事実的ショートカットによって引き起こされるリスクを分析する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:17:37 GMT)
Acquiring Clean Language Models from Backdoor Poisoned Datasets by Downscaling Frequency Space [18.0] 周波数空間におけるバックドアLMの学習機構をフーリエ解析により検討した。
本稿では,マルチスケール低ランク適応 (MuScleLoRA) を提案する。
MuScleLoRAは、さまざまなバックドア攻撃の平均成功率を、複数のデータセットで15%以下に削減する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:28:13 GMT)
Maximum-Entropy Regularized Decision Transformer with Reward Relabelling for Dynamic Recommendation [17.8] オフラインRLRS (EDT4Rec) のためのリワードラベル付き最大エントロピー拡張決定変換器 (Max-Entropy enhanced Decision Transformer) という新しい手法を提案する。
我々のアプローチは、最大エントロピー視点から始まり、最大エントロピー強化探査戦略の開発に繋がる。
モデルが準最適軌道を縫合する能力を増大させるため,一意の報酬緩和手法を取り入れた。
論文参考訳(メタデータ) (Sun, 02 Jun 2024 12:21:10 GMT)
LLM-SR: Scientific Equation Discovery via Programming with Large Language Models [17.6] 記号回帰として知られる伝統的な方程式発見法は、主にデータのみから方程式を抽出することに焦点を当てている。
LLM-SRは,大規模言語モデルの科学的知識とロバストなコード生成能力を活用する新しいアプローチである。
LLM-SRは3つの科学的領域にまたがって有効性を示し、物理的に正確な方程式を発見する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:17:59 GMT)
SAM-LAD: Segment Anything Model Meets Zero-Shot Logic Anomaly Detection [17.3] 視覚異常検出は、産業的欠陥検出や診断など、現実世界の応用において不可欠である。
我々は,任意のシーンにおける論理的異常検出のためのゼロショット・プラグイン・アンド・プレイフレームワークSAM-LADを提案する。
産業用データセットを含む様々なベンチマークを用いて,提案するSAM-LADを検証する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:08:26 GMT)
Brainstorming Brings Power to Large Language Models of Knowledge Reasoning [17.1] 大規模言語モデル(LLM)は、言語生成、テキスト理解、知識推論において驚くべき能力を示した。
近年の研究では、多モデルコラボレーションの導入により、幅広いタスクにおけるモデルの推論能力が向上している。
本稿では,インプットに基づくマルチモデルブレインストーミングを提案する。ブレインストーミングのためのグループに,複数の推論と再推論のラウンドを組み込んだ結果,コンセンサスな回答が得られた。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:47:14 GMT)
Algorithm of Thoughts: Enhancing Exploration of Ideas in Large Language Models [17.1] 本稿では,アルゴリズム的推論経路を通じて大規模言語モデルを促進する新しい手法を提案する。
この結果から,LLMをアルゴリズムを用いて指導すると,アルゴリズム自体よりも性能が向上する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:01:35 GMT)
Q-Probe: A Lightweight Approach to Reward Maximization for Language Models [16.8] 本稿では,タスク固有報酬関数を最大化するために,事前学習言語モデルを適用するQ-probingという手法を提案する。
高いレベルでは、Q-probingは、微調整のようなより重いアプローチと、少ないショットプロンプトのようなより軽いアプローチの間に位置する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:05:59 GMT)
BoNBoN Alignment for Large Language Models and the Sweetness of Best-of-n Sampling [16.4] 本稿では,大言語モデルからのサンプルを,ベスト・オブ・nドルサンプリングを用いてヒトの嗜好に合わせることの問題点について述べる。
基本モデルからKL距離に対する勝利率とのトレードオフの観点から,n$の最高値が本質的に最適であることを示す。
実験により,BoNBoNアライメントは基本方針に好適なモデルの生成において,大幅な改善をもたらすことが示された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:42:57 GMT)
MGI: Multimodal Contrastive pre-training of Genomic and Medical Imaging [16.3] 本稿では,下流タスクにゲノムと医用画像を併用したマルチモーダル事前学習フレームワークを提案する。
我々は,マンバを遺伝子エンコーダとして,ビジョントランスフォーマー(ViT)を医用画像エンコーダとして組み合わせた,自己指導型コントラスト学習アプローチを用いて医用画像と遺伝子を調整した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:20:45 GMT)
Towards a General Time Series Anomaly Detector with Adaptive Bottlenecks and Dual Adversarial Decoders [16.3] 時系列異常検出は幅広い応用において重要な役割を果たす。
既存のメソッドでは、データセットごとに1つの特定のモデルをトレーニングする必要があります。
本稿では,広範囲なマルチドメインデータセット上で事前学習した時系列異常検出モデルを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:09:19 GMT)
ProLex: A Benchmark for Language Proficiency-oriented Lexical Substitution [16.2] 我々は,新しいタスク,言語習熟度指向の語彙置換を提案する。
また、適切な代替品を生成するシステムの能力を評価するために設計された新しいベンチマークであるProLexを紹介する。
我々の最良モデルであるLlama2-13Bモデルは、タスク固有の合成データを微調整し、平均3.2%のFスコアでChatGPTを上回ります。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 21:05:36 GMT)
How accurate are existing land cover maps for agriculture in Sub-Saharan Africa? [15.2] EOをベースとしたモニタリングシステムでは、作物に関する情報を提供するために正確な作物地図が必要である。
アフリカ諸国の耕作地を最も正確に識別する多くの土地被覆地図のどれかを決定するためのデータが不足している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 11:42:03 GMT)
Generalization Bound and New Algorithm for Clean-Label Backdoor Attack [14.8] バックドア攻撃は 訓練セットとテストセットの両方に 毒を盛ったトリガーが 含まれているという特別な性質がある
本稿では,クリーンラベルバックドア攻撃シナリオにおいて,アルゴリズムに依存しない一般化境界を導出することにより,このギャップを埋める。
そこで我々は, 敵の騒音と無差別の毒を併用して, 毒を誘発する新しいクリーンラベルバックドア攻撃を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:46:58 GMT)
D-FaST: Cognitive Signal Decoding with Disentangled Frequency-Spatial-Temporal Attention [14.8] 我々は、D-FaST(Disentangled Frequency-Spatial-Temporal Attention)と呼ばれるCLPのための新しいパラダイムを導入する。
本稿では,周波数空間領域の非絡み合いに着目した新しい認知信号デコーダを提案する。
実験の結果、D-FaSTは既存の手法よりも、我々のデータセットと従来のCDDデータセットの両方で優れていることが示された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 02:33:14 GMT)
InversionView: A General-Purpose Method for Reading Information from Neural Activations [14.6] この情報は、同様のアクティベーションを引き起こす入力のサブセットによって具現化されていると我々は主張する。
InversionViewを提案し、アクティベーションに条件付きトレーニングされたデコーダモデルからサンプリングすることで、このサブセットを実際に検査することができる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 08:50:02 GMT)
Attribute Based Interpretable Evaluation Metrics for Generative Models [14.4] 属性強度の分布に関するトレーニングセットから生成された画像の集合のばらつきを計測する新しい評価プロトコルを提案する。
我々のメトリクスは、生成モデルの説明可能な評価の基礎を築いた。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 05:20:57 GMT)
Let's Fuse Step by Step: A Generative Fusion Decoding Algorithm with LLMs for Multi-modal Text Recognition [13.8] GFD(Generative Fusion Decoding)は,Large Language Models(LLM)をマルチモーダルテキスト認識システムに統合するために使用される,新しい浅層融合フレームワークである。
GFDが異なるモデルの不一致トークン空間をまたいで動作できるようにするのに必要な公式を導出する。
GFD は ASR および OCR タスクのパフォーマンスを大幅に改善し、NTUML 2021 ベンチマークで ASR が最先端に到達した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:30:00 GMT)
Dual Policy Reinforcement Learning for Real-time Rebalancing in Bike-sharing Systems [13.1] 自転車シェアリングシステムは、交通渋滞を緩和し、より健康的なライフスタイルを促進する上で重要な役割を担っている。
本研究では,車両群によるリアルタイムリバランス問題に対処するための新しいアプローチを提案する。
在庫とルーティングの決定を分離する、二重ポリシー強化学習アルゴリズムを採用している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 21:05:23 GMT)
Generalized Exponentiated Gradient Algorithms and Their Application to On-Line Portfolio Selection [13.1] 本稿では,Alpha-Beta分散正規化関数から得られた一般化指数勾配(EG)更新の新たなファミリーを紹介する。
適用可能性の図示として、勾配法を用いてオンラインポートフォリオ選択問題(OLPS)に対処する際の提案された更新について評価する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 07:56:30 GMT)
RFWave: Multi-band Rectified Flow for Audio Waveform Reconstruction [12.6] 本稿では,メルスペクトルや離散トークンから高忠実度音声波形を再構成する,最先端マルチバンド整流流法RFWaveを紹介する。
RFWaveは複雑なスペクトログラムを独自に生成し、フレームレベルで動作し、全てのサブバンドを同時に処理して効率を向上する。
実験により、RFWaveは優れた再構成品質を提供するだけでなく、計算効率も非常に優れており、GPU上でのオーディオ生成は、リアルタイムよりも97倍高速であることがわかった。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:11:50 GMT)
Constrained Adaptive Attack: Effective Adversarial Attack Against Deep Neural Networks for Tabular Data [12.6] そこで本研究では,適応機構による既存の勾配攻撃の障害を克服する勾配攻撃を提案する。
また、CAPGD攻撃と最高の検索ベース攻撃であるMOEVAを組み合わせた効率的な回避攻撃であるCAAを設計する。
私たちの実証研究は、CAAが既存の攻撃を20以上の設定で17で上回っていることを実証しています。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:26:52 GMT)
Towards Point Cloud Compression for Machine Perception: A Simple and Strong Baseline by Learning the Octree Depth Level Predictor [12.5] 本稿では,人間と機械の両方の視覚タスクを同時に処理するポイントクラウド圧縮フレームワークを提案する。
我々のフレームワークは、異なるマシンビジョンタスクのサブセットのみを使用して、スケーラブルなビットストリームを学習し、ビットレートを節約します。
新しいオクツリー深さレベルの予測器は、点雲から構築された各オクツリーの最適深さレベルを適応的に決定する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:13:57 GMT)
Robust Emotion Recognition in Context Debiasing [12.5] 文脈認識型感情認識(CAER)は、近年、制約のない環境における感情コンピューティング技術の実践的応用を高めている。
進歩にもかかわらず、最大の課題は、コンテキストバイアスの干渉によるものである。
本稿では,このような問題に対処する対実的感情推定(CLEF)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:35:28 GMT)
Towards Safe and Reliable Autonomous Driving: Dynamic Occupancy Set Prediction [12.3] 本研究は,高度軌跡予測ネットワークとDOS予測モジュールを効果的に組み合わせた,DOS予測のための新しい手法を提案する。
本研究の革新的な貢献は、複雑なシナリオをナビゲートするための新しいDOS予測モデルの開発である。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 04:45:00 GMT)
Semi-supervised Video Semantic Segmentation Using Unreliable Pseudo Labels for PVUW2024 [12.3] 信頼できない擬似ラベルに基づく半教師付きビデオセマンティックセグメンテーション手法を採用する。
本手法では,mIoUが63.71%,67.83%,最終試験が67.83%であった。
CVPR 2024におけるワイルドチャレンジにおけるビデオ・シーン・パーシングの第1位を獲得した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:37:26 GMT)
Causal Contextual Bandits with Adaptive Context [12.2] 本研究では,学習者が選択した初期介入に基づいて,文脈が選択される因果的文脈包帯の変種について検討する。
私たちは、私たちの単純な後悔が、多くのインスタンスに対して本質的にきついことを証明しています。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:54:06 GMT)
Improved Bandits in Many-to-one Matching Markets with Incentive Compatibility [12.1] 両面のマッチング市場は、そのリッチな応用のために、文献で広く研究されている。
まず,1対1設定のための既存のアルゴリズムをこのより一般的な設定に拡張し,プレイヤー最適後悔に対するほぼ最適境界を実現することを示す。
本稿では,アダプティブ・サーベイ・then-deferred (AETDA) アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:26:45 GMT)
ODFormer: Semantic Fundus Image Segmentation Using Transformer for Optic Nerve Head Detection [11.9] 眼科領域における視神経頭(ONH)検出は,長年にわたり重要な研究領域である。
本稿では,ネットワーク設計,データセットの公開,包括的なベンチマークの確立という,3つの重要な側面からコントリビューションを行う。
新しく開発されたONH検出ネットワークはODFormerと呼ばれ、Swin Transformerアーキテクチャに基づいており、2つの新しいコンポーネントが組み込まれている。
われわれは、TongjiU-DRODと呼ばれる大規模なデータセットを公開し、2種類のカメラで撮影した、参加者ごとに多解像度のファンドイメージを提供する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:49:47 GMT)
Evidence of Learned Look-Ahead in a Chess-Playing Neural Network [11.7] 我々はChess Leela Zeroの政策ネットワークにおいて、学習したルックアヘッドの証拠を示す。
我々は、Leelaが将来の最適動作を内部的に表現し、これらの表現が、特定のボード状態における最終的な出力に不可欠であることを見出した。
これらの発見は、ニューラルネットワークにおける学習されたルックアヘッドの存在証明であり、その能力をよりよく理解するための一歩かもしれない。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 21:57:32 GMT)
Jailbreaking Prompt Attack: A Controllable Adversarial Attack against Diffusion Models [11.2] 自動攻撃フレームワークであるJPA(Jailbreak Prompt Attack)を提案する。
我々は、元の画像のセマンティクスを保ちながら、安全チェックをバイパスするプロンプトを維持することを目的としている。
評価の結果,JPA はオンライン・サービスとオフライン・ディフェンス・セーフティ・チェッカーの両方をバイパスして NSFW 画像の生成に成功した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 12:36:39 GMT)
Harnessing Business and Media Insights with Large Language Models [11.1] 本稿では,Fortune Analytics Language Model (FALM)を紹介する。
FALMは、ユーザーが包括的なビジネス分析に直接アクセスできるようにする。
一般的なLLMとは異なり、FALMはプロのジャーナリズムから構築された知識ベースを活用している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:24:38 GMT)
Satellite Data Shows Resilience of Tigrayan Farmers in Crop Cultivation During Civil War [10.9] ティグレイ戦争(ティグレイせんせん、英語: Tigray War)は、2020年11月3日から2022年11月2日までエチオピア北部のティグレイ地方で起きた戦闘である。
ティグレイの農業が生活と食料安全保障にとって重要であることを考えると、戦争が耕作地に与える影響を判断することが重要である。
衛星画像と統計地域推定技術を用いて,戦前および戦時中におけるティグレイの作物栽培地域の変化を評価した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 11:06:55 GMT)
Pretrained Hybrids with MAD Skills [10.8] 我々は、ハイブリッド設計の課題に対処するフレームワークである$textbfManticore$を提案する。
我々のアプローチは、異なるアーキテクチャから事前訓練されたブロック間で機能を変換する単純なプロジェクタを組み込むことで、差別化可能なニューラルアーキテクチャサーチ(NAS)のアイデアを強化する。
Manticoreハイブリッドは、既存の手動設計のハイブリッドよりも優れており、Long Range Arena(LRA)タスクで高いパフォーマンスを実現し、事前訓練されたトランスフォーマーや状態空間モデルを改善することができる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:24:30 GMT)
CMDBench: A Benchmark for Coarse-to-fine Multimodal Data Discovery in Compound AI Systems [10.7] 知識集約的なタスクを達成するエージェントとしてLLMを使用する複合AIシステム(CAS)は、データベースやAIコミュニティにおいて大きな関心を集めている。
マルチモーダルデータソースのサイロは、そのタスクを達成するための適切なデータソースを特定するのを困難にしている。
我々はエンタープライズデータプラットフォームの複雑さをモデル化したベンチマークであるCMDBenchを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:10:41 GMT)
On Non-asymptotic Theory of Recurrent Neural Networks in Temporal Point Processes [10.4] 時間的ポイントプロセス(TPP)は、様々な領域にわたる不規則な時間的イベントをモデル化し、予測するための重要なツールである。
最近のニューラルネットワーク(RNN)ベースのTPPは、従来のパラメトリックTPPモデルよりも実用的な優位性を示している。
本稿では,よく知られたTPP設定の下で,RNN-TPPの過剰なリスク境界を確立する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:19:25 GMT)
Lasso Bandit with Compatibility Condition on Optimal Arm [10.2] 文脈特徴のスパース部分のみが期待される報酬関数に影響を及ぼすような疎線型バンドイット問題を考える。
本稿では,強制サンプリング手法を適用したアルゴリズムを提案し,提案アルゴリズムが$O(textpolylog dT)$ regretを達成したことを証明した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:11:47 GMT)
IENE: Identifying and Extrapolating the Node Environment for Out-of-Distribution Generalization on Graphs [10.1] ノードレベルの環境識別と外挿技術に基づくグラフのOOD一般化手法であるIENEを提案する。
モデルが2つの粒度から不変性を同時に抽出する能力を強化し、一般化が向上する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:43:56 GMT)
Diffusion-Inspired Quantum Noise Mitigation in Parameterized Quantum Circuits [10.1] 量子ノイズと拡散モデルの関係について検討する。
本稿では,PQCにおける量子ノイズを軽減するために,拡散に着想を得た新しい学習手法を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:35:38 GMT)
Analysis of Asynchronous Protocols for Entanglement Distribution in Quantum Networks [10.0] 量子ネットワークにおける絡み合いに対する2つの最小限の非同期プロトコルについて検討する。
リンクレベルで独立に絡み合いを発生させる並列スキームと、一方から他方への絡み合いを反復的に延長するシーケンシャルスキームとを具備する。
並列方式と並列方式を比較検討した結果, 逐次方式の優位性が示唆された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 02:08:02 GMT)
A Survey of Deep Learning Based Radar and Vision Fusion for 3D Object Detection in Autonomous Driving [10.0] 本稿では,自律運転における3次元物体検出のためのディープラーニング手法に基づくレーダビジョン(RV)融合の包括的調査に着目する。
現在最も有望な融合戦略として、これらの3次元境界ボックス予測とBEVベースのアプローチを含む、エンドツーエンドの融合手法のより深い分類を提供する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 11:37:50 GMT)
TAME: Task Agnostic Continual Learning using Multiple Experts [9.9] 本稿では,タスクの同一性が分かっておらず,学習機械が観察からそれらを推測する必要がある,いわゆるタスク非依存の設定に焦点を当てる。
我々はTAME(Task-Agnostic continual learning using Multiple Experts)と呼ぶアルゴリズムを用いて,タスクエキスパートネットワーク間のデータ分散と切り替えを自動的にオンラインに検出する。
実験の結果,提案手法が連続学習データセットのベンチマークに有効であること,従来のタスク非依存手法よりも優れていること,さらにはトレーニングとテストの両方においてタスクの同一性を認める技術が示された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:17:58 GMT)
Applying Fine-Tuned LLMs for Reducing Data Needs in Load Profile Analysis [9.7] 本稿では、負荷プロファイル解析におけるデータ要求を最小限に抑えるために、LLM(en: Fine-tuned Large Language Models)を利用する新しい手法を提案する。
2段階の微調整戦略が提案され、データ復元作業の欠如に対して事前訓練されたLLMを適用する。
BERT-PIN などの最先端モデルに匹敵する性能を達成し,その精度向上のための微調整モデルの有効性を実証する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:18:11 GMT)
An Optimized Toolbox for Advanced Image Processing with Tsetlin Machine Composites [9.7] 我々は最近提案されたTMコンポジットアーキテクチャを活用し、様々なTMスペシャリストを紹介した。
カニーエッジ検出、配向勾配のヒストグラム、適応平均しきい値、適応ガウスしきい値、大津しきい値、色温度計、適応色温度計などである。
その結果、TMのCIFAR-10で82.8%の精度で最新の結果を提供するツールボックスが作られた。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:52:48 GMT)
Discovering an interpretable mathematical expression for a full wind-turbine wake with artificial intelligence enhanced symbolic regression [9.6] 本稿では,平均速度損失に対する解釈可能な数学的表現を発見するために,遺伝的記号回帰(SR)アルゴリズムを提案する。
提案した数式(方程式)は、高精度で安定なフルウェイク領域の任意の位置における覚醒速度の欠陥を予測できる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:17:54 GMT)
Enhanced Classification of Heart Sounds Using Mel Frequency Cepstral Coefficients: A Comparative Study of Single and Ensemble Classifier Strategies [9.3] 本稿では,Mel Frequency Cepstral Coefficients (MFCCs) の有用性について検討した。
単一分類法とアンサンブル分類法という2つの分類法が用いられた。
その結果,アンサンブル分類法は単一分類法に比べて精度が高かった。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:45:30 GMT)
LncRNA-disease association prediction method based on heterogeneous information completion and convolutional neural network [9.2] lncRNA-disease associations (LDAs) の精度は、疾患の警告と治療に非常に重要である。
本稿では, HCNNLDA と命名されたlncRNA-解離関連予測に対して, 異種ネットワークと畳み込みニューラルネットワーク(CNN)に基づくディープラーニングモデルを提案する。
実験結果から,提案モデルがいくつかの最新の予測モデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:11:27 GMT)
Evidence of Scaling Advantage for the Quantum Approximate Optimization Algorithm on a Classically Intractable Problem [8.7] 量子近似最適化アルゴリズム(QAOA)は、量子コンピュータにおける最適化問題を解くための主要な候補アルゴリズムである。
本稿では,低自己相関二項列(LABS)問題に対するQAOAの広範な数値的な検討を行う。
パラメータが固定されたQAOAのランタイムは、分岐とバウンドの解法よりも良くスケールする。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:49:44 GMT)
SimSAM: Zero-shot Medical Image Segmentation via Simulated Interaction [8.5] textbfSimulated Interaction for textbfSegment textbfAnything textbfModel (textsctextbfSimSAM) を導入する。
提案手法は,ゼロショットSAMと比較して,輪郭セグメンテーション精度が最大15.5%向上することがわかった。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 08:13:12 GMT)
Provably Scalable Black-Box Variational Inference with Structured Variational Families [8.3] 特定のスケールの行列構造は平均場ファミリーよりもイテレーションの複雑さが良いことを示す。
大規模階層モデルの理論的結果を実証的に検証する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:36:07 GMT)
Scalable Multi-modal Model Predictive Control via Duality-based Interaction Predictions [8.3] RAID-Netは、モデル予測制御(MPC)予測地平線に沿って関連する相互作用を予測する、注目に基づく新しいリカレントニューラルネットワークである。
本手法は, 移動計画問題の解法において, 12倍のスピードアップを示した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:01:08 GMT)
Token-level Direct Preference Optimization [8.2] 微調整された事前訓練された大規模言語モデルは、それらを人間の価値観や意図と整合させるのに不可欠である。
トークンレベルでポリシーを最適化することにより,LLMと人間の嗜好を一致させる新しいアプローチである,トークンレベルの直接選好最適化(TDPO)を導入する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:21:59 GMT)
LP-OVOD: Open-Vocabulary Object Detection by Linear Probing [8.2] オブジェクト検出器は、トレーニングにおいて見知らぬクラスの例をラベル付けせずに、テストイメージ内の見えないクラスと見えないクラスの両方を識別する必要がある。
OVODの典型的なアプローチは、CLIPの合同テキストイメージ埋め込みを使用して、ボックスの提案を最も近いテキストラベルに割り当てることである。
オーバー・アンド・アンダー・カバーされたオブジェクト・ボックスのような多くの低品質なボックスは、CLIPが正確なオブジェクト位置情報に基づいて訓練されていないため、高品質なボックスと同等のスコアを持つ。
そこで我々は,低品質なボックスをトレーニングによって破棄するLP-OVODを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 12:38:47 GMT)
W-Net: A Facial Feature-Guided Face Super-Resolution Network [8.0] Face Super-Resolutionは、高解像度 (HR) の顔画像を低解像度 (LR) の顔画像から復元することを目的としている。
既存手法は, 再建効率が低く, 事前情報の利用が不十分であるため, 理想的ではない。
本稿では,この課題に対処するため,W-Netと呼ばれる新しいネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:05:40 GMT)
Learning-Based Verification of Stochastic Dynamical Systems with Neural Network Policies [8.0] 我々は、他のニューラルネットワークをトレーニングする検証手順を使用し、ポリシーがタスクを満足することを示す証明書として機能する。
リーチ回避タスクでは、この証明ネットワークがリーチ回避スーパーマーチンゲール(RASM)であることを示すのに十分である。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:19:19 GMT)
CCF: Cross Correcting Framework for Pedestrian Trajectory Prediction [7.9] 歩行者軌道の表現をより良く学習するためのクロスコレクション・フレームワーク(CCF)を提案する。
CCFは、時間的損失と軌道的予測損失の両方で訓練された2つの予測モデルで構成されている。
トランスをベースとしたエンコーダ・デコーダ・アーキテクチャを用いて歩行者間の動きや社会的相互作用を捉える。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:07:13 GMT)
Explore Internal and External Similarity for Single Image Deraining with Graph Neural Networks [7.9] 雨天画像のパッチ再帰特性は, 同一のパッチが1つの画像に何回も再帰する傾向にあり, マルチスケール画像や外部画像が複数存在することが判明した。
雨天図と模範図の両方からk-アネレスト近傍のパッチを探索し,グラフモデルを構築した。
提案したグラフをディープニューラルネットワークに埋め込んで、エンドツーエンドでトレーニングします。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 12:08:16 GMT)
InteRACT: Transformer Models for Human Intent Prediction Conditioned on Robot Actions [7.6] InteRACTアーキテクチャは、大規模な人間と人間のデータセットと小さな人間とロボットのデータセットの微細構造に関する条件付き意図予測モデルを事前訓練する。
実世界の協調的なロボット操作タスクについて評価し、条件付きモデルが様々な限界ベースラインよりも改善されていることを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:47:41 GMT)
Understanding Unimodal Bias in Multimodal Deep Linear Networks [7.2] ネットワークがひとつのモダリティを過度に依存し、共同トレーニング中に他を無視してしまうという、一元的バイアスが鍵となる課題だ。
アーキテクチャとデータ統計がこのバイアスにどのように影響するかを理解するために,マルチモーダル深層線形ネットワークを用いた一様偏差理論を開発した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:51:26 GMT)
Least Squares Regression Can Exhibit Under-Parameterized Double Descent [6.6] 本研究では,学習データ点数,パラメータ数,一般化能力の関係について検討する。
これまでの研究では、過剰なパラメータ化された状態において二重降下が起こることが示されている。
ピークの位置は、スペクトルとサンプル共分散の固有ベクトルの両方の技術的性質に依存すると仮定する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 22:26:44 GMT)
Presence or Absence: Are Unknown Word Usages in Dictionaries? [6.2] フィンランド語,ロシア語,ドイツ語の共用課題であるAXOLOTL-24に提出したシステムの構成と結果について概説する。
私たちのシステムは完全に教師なしです。
グラフベースのクラスタリングアプローチを活用して、未知の単語使用量とSubtask 1.1の辞書エントリ間のマッピングを予測する。
Subtask 2 用の GPT-4 や LLaMA-3 のような最先端の大規模言語モデルを通じて、これらの新しい単語使用法に対する辞書のような定義を生成する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 07:57:45 GMT)
Quantile-based Maximum Likelihood Training for Outlier Detection [5.9] 我々は,推定時の外乱分離を改善するために,不整合分布を学習するための量子化に基づく最大極大目標を提案する。
本手法は, 事前学習した識別特徴に正規化フローを適合させ, 評価されたログ類似度に応じて異常値を検出する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:12:11 GMT)
EchoNet-Synthetic: Privacy-preserving Video Generation for Safe Medical Data Sharing [5.9] 本稿では,高忠実度,長大かつアクセス可能な完全データサンプルをほぼリアルタイムに生成するモデルを提案する。
本研究では,拡散モデルに基づく生成手法を開発し,医用ビデオデータセットの匿名化のためのプロトコルを提案する。
完全合成でプライバシに適合したエコー心電図データセットであるEchoNet-Syntheticについて述べる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:18:06 GMT)
Network Formation and Dynamics Among Multi-LLMs [5.8] 大規模言語モデル (LLM) は, ネットワーク形成における好みを問うと, 重要なソーシャルネットワークの原則を示す。
また、実世界のネットワークに基づくLCMの意思決定について検討し、三進的閉鎖とホモフィリーが優先的なアタッチメントよりも強い影響があることを明らかにした。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:50:14 GMT)
Group Sparse Matrix Optimization for Efficient Quantum State Transformation [5.5] スパース行列法を量子状態変換問題に適用する。
量子状態変換のためのユニタリ行列を探索するための新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:28:39 GMT)
Appendix for Linear Dynamics-embedded Neural Network for Long-Sequence Modeling [5.3] この付録は「Linear Dynamics-embedded Neural Network for Long-Sequence Modeling」紙に必要なすべての材料を提供する。
モデルの詳細、実験的な設定、PyTorchの実装が含まれている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 05:59:38 GMT)
Review of deep learning models for crypto price prediction: implementation and evaluation [5.2] 本稿では、暗号通貨価格予測のためのディープラーニングに関する文献をレビューし、暗号通貨価格予測のための新しいディープラーニングモデルを評価する。
我々のディープラーニングモデルには、長い短期記憶(LSTM)リカレントニューラルネットワークの変種、畳み込みニューラルネットワーク(CNN)の変種、トランスフォーマーモデルが含まれています。
また、新型コロナウイルスのパンデミックを通じて価格の大幅な変動を示す4つの暗号通貨のボラティリティ分析を実施している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 07:20:29 GMT)
Large-scale DSM registration via motion averaging [5.1] 動き平均化問題としてDSM登録タスクを構築する新しいソリューションを提案する。
大規模DSMのグリッド構造に基づいて、新しい近接探索法を用いてペアワイズ登録を行う。
シーングラフは,O(N)複雑性の極めて高速な動き平均アルゴリズムを用いて最適化可能であることを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 04:16:01 GMT)
Graph Neural Preconditioners for Iterative Solutions of Sparse Linear Systems [5.1] 機械学習のアプローチを採用し,汎用プリコンディショナとしてグラフニューラルネットワークを提案する。
条件の悪い問題に対して魅力的な性能を示すが、その理由のひとつは、適切に生成されたトレーニングデータから行列逆を近似する方がよいからである。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:18:41 GMT)
Making Recommender Systems More Knowledgeable: A Framework to Incorporate Side Information [5.0] 本稿では,商品別サイド情報をレコメンダシステムに組み込んでパフォーマンスを高めるための汎用フレームワークを提案する。
副次的な情報により、我々の推薦システムは最先端のモデルよりもかなりのマージンで優れていることを示す。
また、リコメンデータシステムで使用される注意機構を標準化し、モデル性能への影響を評価するために、新しいタイプの損失を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 04:33:52 GMT)
FLuRKA: Fast and accurate unified Low-Rank & Kernel Attention [5.0] 自己保持技法の2つの一般的なクラスは低ランク法とカーネル法である。
我々はこれらの長所を利用して低ランクとカーネルの手法を融合し、新しい変圧器であるFLuRKAを生み出した。
FLuRKAの速度と品質を理論的・実験的に評価した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:49:32 GMT)
Robust Visual Tracking via Iterative Gradient Descent and Threshold Selection [5.0] 本稿では, 誤差ベクトルがガウス-ラプラシアン分布に従えば, 良好な性能が得られる新しい線形回帰推定器を提案する。
さらに、IGDTSを生成トラッカーに拡張し、IGDTS距離を適用してサンプルとモデル間のずれを測定する。
いくつかの難解な画像列の実験結果から,提案したトラッカーは既存のトラッカーより優れていた。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:51:09 GMT)
Improving Prototypical Part Networks with Reward Reweighing, Reselection, and Retraining [5.0] ProtoPNetは、入力の有意義な部分に基づいて画像の分類を試みる。
このアーキテクチャは視覚的に解釈可能な分類を生成することができるが、意味論的に意味を持たない画像の部分に基づいて分類することを学ぶことが多い。
Reward Reweighing, Reselecting, and Retraining (R3)後処理フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 21:30:13 GMT)
MIDGARD: Self-Consistency Using Minimum Description Length for Structured Commonsense Reasoning [4.9] 大規模言語モデル(LLM)を用いた自然言語入力から推論グラフを生成するための構造化推論の課題について検討する。
従来のアプローチでは様々なプロンプト方式が検討されてきたが、自己回帰性やシングルパスベースの復号化によるエラー伝播に悩まされている。
我々は,多種多様な推論連鎖をサンプリングし,多数決を最終回答とする自己整合性(SC)から着想を得た。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:47:44 GMT)
Kolmogorov-Arnold Network for Satellite Image Classification in Remote Sensing [4.9] 本稿では,コンボリューションニューラルネットワーク(CNN)モデルとKAN(Kolmogorov-Arnold Network)を統合したリモートセンシングシーン分類タスクを提案する。
KCNと呼ばれる新しい手法は、従来のマルチ層パーセプトロン(MLP)をKANに置き換えて、分類性能を向上させることを目的としている。
我々はVGG16, MobileNetV2, EfficientNet, ConvNeXt, ResNet101, Vision Transformer (ViT) など,複数のCNNベースのモデルを用いて, Kanと組み合わせて性能評価を行った。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:11:37 GMT)
A Monte Carlo Language Model Pipeline for Zero-Shot Sociopolitical Event Extraction [4.8] イベント抽出は、研究者が新しい研究課題に対する任意のイベントクラスを柔軟に指定することを可能にする。
現在のゼロショットEE法は、単純な生成言語モデル(LM)の単純なゼロショットアプローチと同様に、ダイアドイベント抽出では不十分である。
我々はこれらの課題に,多段階の命令追従型LMパイプラインを新たに導入して対処する。
我々はパイプラインの国際関係解析への応用を実演する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:17:34 GMT)
DeepNcode: Encoding-Based Protection against Bit-Flip Attacks on Neural Networks [4.7] ニューラルネットワークに対するビットフリップ攻撃に対する符号化に基づく保護手法について,DeepNcodeと題して紹介する。
この結果、保護マージンが最大で$4-$bitが$7.6times、$2.4timesが$8-$bitの量子化ネットワークで$12.4timesになることが示された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 08:23:56 GMT)
Relation Modeling and Distillation for Learning with Noisy Labels [4.6] 本稿では,自己教師型学習を通して,サンプル間の関係をモデル化する関係モデリングと蒸留の枠組みを提案する。
提案手法は,ノイズの多いデータに対する識別表現を学習し,既存の手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:59:09 GMT)
Position: Do Not Explain Vision Models Without Context [4.5] 我々は、コンピュータビジョンモデルを説明する最も一般的な方法について、文脈情報を考慮していないことを指摘してレビューする。
我々は,コンピュータビジョンモデルを説明する上で,文脈情報の利用の促進につながる可能性のある新たな研究方向を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:57:53 GMT)
Enhancing Super-Resolution Networks through Realistic Thick-Slice CT Simulation [4.4] 深層学習に基づく生成モデルでは、低分解能CT画像を長い取得時間なしで高分解能CT画像に変換する可能性があり、薄スライスCT画像では放射線暴露が増大する。
これらの超解法(SR)モデルの適切なトレーニングデータを取得することは困難である。
これまでのSR研究では、薄いスライスCT画像から厚いスライスCT画像をシミュレートして、トレーニングペアを作成していた。
我々は,薄スライスCT画像から厚いCT画像を生成するための単純かつ現実的な手法を導入し,SRアルゴリズムのトレーニングペアの作成を容易にする。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:47:23 GMT)
Is In-Context Learning in Large Language Models Bayesian? A Martingale Perspective [4.4] 大規模言語モデル(LLM)の顕著な特徴として、インコンテキスト学習(ICL)が登場している。
このようなシナリオにおける不明瞭な予測には,マーチンゲール特性が必須条件であることを示す。
我々は、マーチンゲールの性質が満たされれば保持しなければならない、対応する理論とテスト統計を伴う実行可能なチェックを導出する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:20:30 GMT)
Learning to Defer in Content Moderation: The Human-AI Interplay [4.3] オンラインプラットフォームにおけるコンテンツモデレーションの成功は、人間とAIのコラボレーションアプローチに依存している。
本稿では,コンテンツモデレーションにおける人間とAIの相互作用を捉えるモデルを提案する。
本稿では,選択されたサンプルデータからの分類損失を注意深くバランスする,準最適学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:02:24 GMT)
Markov flow policy -- deep MC [4.3] 分散アルゴリズムは、短期的な推定に依存するため、しばしば評価誤差に遭遇する。
我々は、非負のニューラルネットワークフローを利用して総合的な前方視予測を可能にするマルコフフローポリシーを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:41:04 GMT)
BC-MRI-SEG: A Breast Cancer MRI Tumor Segmentation Benchmark [4.3] 本稿では,MRI データセットをベースとした二成分性乳癌腫瘍分類のためのベンチマークを提案する。
ベンチマークは合計4つのデータセットで構成され、教師付きトレーニングと評価に2つのデータセット、ゼロショット評価に2つのデータセットが使用される。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:29:39 GMT)
MV-MR: multi-views and multi-representations for self-supervised learning and knowledge distillation [4.2] マルチビューと多表現(MV-MR)に基づく自己教師型学習と知識蒸留の新しい手法を提案する。
MV-MRは、拡張ビューと非拡張ビューからの学習可能な埋め込み間の依存に基づいている。
提案手法は,効率的な自己監督型分類とモデル非依存型知識蒸留に利用できることを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:50:37 GMT)
Multi-State TD Target for Model-Free Reinforcement Learning [4.0] 時間差(TD)学習は、状態または状態-作用ペアの値推定を更新する強化学習の基本的な技術である。
本稿では、その後の複数の状態の推定値を利用する拡張多状態TD(MSTD)ターゲットを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:53:05 GMT)
Robust Multi-Modal Speech In-Painting: A Sequence-to-Sequence Approach [3.9] AV特徴を組み込んだシーケンス・ツー・シーケンス(seq2seq)音声イン・ペイントモデルを導入,研究する。
提案手法は,AV音声のインペイント手法を,音声データと視覚データの両方が混在するシナリオに拡張する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:51:43 GMT)
Multimodal Multi-loss Fusion Network for Sentiment Analysis [3.9] 本稿では,複数のモードにまたがる特徴エンコーダの最適選択と融合について検討し,感情検出を改善する。
我々は、異なる融合法を比較し、マルチモダリティ融合ネットワークにおけるマルチロストレーニングの影響について検討する。
コンテキストの統合はモデルの性能を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:12:57 GMT)
Bilinear-Convolutional Neural Network Using a Matrix Similarity-based Joint Loss Function for Skin Disease Classification [3.7] 拘束型トリプルトネットワーク(CTN)を用いたBCNNを用いた皮膚疾患分類モデルを提案する。
BCNNは画像データの特徴間の豊富な空間的相互作用をキャプチャできる。
提案モデルは,ディープネットワークからクラス内特徴を抽出するために訓練される。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:19:02 GMT)
Structure-preserving neural networks for the regularized entropy-based closure of the Boltzmann moment system [3.4] 放射線輸送の大規模数値シミュレーションの主な課題は、高いメモリと計算時間要件である。
本研究では,エントロピー閉包法に対するニューラルネットワークに基づく近似を導出し,検討する。
本手法のメモリフットプリントは,競合時間とシミュレーション精度で従来の手法よりもはるかに少ないことを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 00:20:16 GMT)
How well do distributed representations convey contextual lexical semantics: a Thesis Proposal [3.4] 本稿では,現代ニューラルネットワークによる語彙意味の符号化における分散表現の有効性について検討する。
文脈に影響された意味の関連性と類似性に基づいて,曖昧さの4つの源を同定する。
次に、多言語データセットの収集や構築、様々な言語モデルの利用、言語解析ツールの利用により、これらの情報源を評価することを目的とする。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:08:51 GMT)
Teams of LLM Agents can Exploit Zero-Day Vulnerabilities [3.3] LLMエージェントのチームが実世界のゼロデイ脆弱性を悪用できることを示します。
我々は,サブエージェントを起動可能な計画エージェントを備えたエージェントシステムHPTSAを紹介する。
我々は15の現実世界の脆弱性のベンチマークを構築し、エージェントのチームが以前の作業よりも4.5$times$で改善できることを示します。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:25:26 GMT)
Prompt Framework for Role-playing: Generation and Evaluation [3.3] 大規模言語モデル(LLM)は、自然言語の生成、ユーザ・インストラクションの理解、人間の言語使用の模倣において顕著な能力を示した。
本稿では,SOTA(State-of-the-art LLM)を利用して,ロールプレイング対話データセットを構築し,ロールプレイング性能を評価するフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:09:56 GMT)
Multimodal Deep Learning for Low-Resource Settings: A Vector Embedding Alignment Approach for Healthcare Applications [3.3] ベクトル埋め込みを利用して、柔軟で効率的な計算手法を実現することを提唱する。
本稿では,単一モード基礎モデルと多モード視覚言語モデルを用いたベクトル埋め込みの有効性について検討する。
画像テキストの埋め込みを整列させることにより性能を向上させるための,単純かつ効果的な推論時間法を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:13:01 GMT)
DF-DM: A foundational process model for multimodal data fusion in the artificial intelligence era [3.3] 本稿では,データマイニングのためのマルチモーダルデータフュージョンの新しいプロセスモデルを提案する。
我々のモデルは、効率と信頼性を改善しつつ、計算コスト、複雑さ、バイアスを減らすことを目的としている。
本研究は,糖尿病網膜症における網膜画像と患者のメタデータを用いた予測,衛星画像を用いた家庭内暴力予測,インターネット,国勢調査データ,放射線画像と臨床ノートによる臨床像と人口動態の同定という3つのユースケースを通じて有効性を示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:51:46 GMT)
Visual place recognition for aerial imagery: A survey [3.1] 航空画像とその視覚的ローカライゼーションへの直接的応用は、多くのロボティクスおよびコンピュータビジョンタスクにとって重要な問題である。
グローバル・ナビゲーション・サテライト・システムズ(GNSS、Global Navigation Satellite Systems)は、航空の局地化問題を解決するための標準標準のソリューションである。
視覚的なジオローカライゼーションは、実現可能な代替手段として浮上している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 22:40:05 GMT)
Weisfeiler Leman for Euclidean Equivariant Machine Learning [3.0] PPGNは, 複雑度が低い全点クラウド上で, 均一に2$-WLをシミュレートできることを示す。
第二に、2ドルのWLテストは、位置と速度の両方を含む点雲まで拡張可能であることを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 05:51:49 GMT)
Model-based Analysis of Mining Fairness in a Blockchain [2.9] ブロックチェーンにおけるマイニングフェアネスは、マイニングに投資した計算リソースと、受け取ったブロック報酬の平等を指す。
簡単な数学的モデルを用いてマイニングフェアネスを計算する手法を提案する。
本手法は,少数のマイニング業者のネットワークにおけるマイニングフェアネスを精度良く計算できることを確認した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 02:27:28 GMT)
DistilDIRE: A Small, Fast, Cheap and Lightweight Diffusion Synthesized Deepfake Detection [2.9] 拡散生成画像は、現在の検出技術に固有の課題をもたらす。
本研究では,拡散モデルに埋め込まれた知識を蒸留して,高速深度検出モデルを構築することを提案する。
実験の結果,既存のDIREフレームワークよりも3.2倍高速な推論速度が得られた。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:22:38 GMT)
Diffusion Features to Bridge Domain Gap for Semantic Segmentation [2.9] 本稿では, 拡散モデルの特徴を効率的に活用するために, サンプリングおよび融合技術を活用するアプローチについて検討する。
テキスト・画像生成能力の強みを生かして、暗黙的に後部知識を学習する新しいトレーニングフレームワークを導入する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:33:46 GMT)
The Future of Aerial Communications: A Survey of IRS-Enhanced UAV Communication Technologies [2.8] Intelligent Reflecting Surfaces (IRS) と Unmanned Aerial Vehicles (UAVs) の出現は、無線通信分野における新たなベンチマークを設定している。
IRSは電磁波を操作するための画期的な能力を備えており、信号品質、ネットワーク効率、スペクトル利用の大幅な向上のための道を開いた。
UAVは、通信ネットワーク内の動的で汎用的な要素として出現し、従来の固定インフラが不足している地域では、高いモビリティとアクセスとカバー範囲の強化を実現している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:58:53 GMT)
Semantically-correlated memories in a dense associative model [2.7] 私はCorrelated Associative Memory(CDAM)という新しい連想記憶モデルを紹介します。
CDAMは、自動連想とヘテロ連想の両方を、連続的に評価されたメモリパターンのための統一されたフレームワークに統合する。
理論的、数値的に解析され、4つの異なる力学モードが明らかにされている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 08:29:45 GMT)
Expanding the Attack Scenarios of SAE J1939: A Comprehensive Analysis of Established and Novel Vulnerabilities in Transport Protocol [2.7] 我々は,SAE J 1939通信プロトコルに特有の攻撃手法を探索し,実証する。
私たちのテストでは、商業車両運用に対する差し迫った脅威を裏付ける11のシナリオの実行が成功していることを確認しています。
これらの結果は、SAE J 1939プロトコル内のユニークな脆弱性を強調しており、自動車のサイバーセキュリティコミュニティが特定されたリスクに対処する必要があることを示している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:24:59 GMT)
Generalizing Orthogonalization for Models with Non-Linearities [2.7] ブラックボックスアルゴリズムの複雑さは、バイアスの導入など、様々な問題を引き起こす可能性がある。
ニューラルネットワークは患者のX線スキャンからのみ人種情報を推論できることが示されている。
本稿では,ReLUアクティベーションなどの非線形性に対する補正を導入することで,談話の進行を推し進める。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:15:21 GMT)
Discrete Prompt Compression with Reinforcement Learning [2.7] Compressed prompts aid instruction-tuned language model (LM) inovercoming context window limit and reduce computational cost。
既存のメソッドは、主にトレーニングの埋め込みに基づいているが、解釈可能性、埋め込みトークンの固定数、異なるLM間の再利用性、ブラックボックスAPIとのインタラクションにおける適用性など、さまざまな課題に直面している。
本研究では,これらの問題に対処する離散的プロンプト圧縮法であるPCRLを用いた即時圧縮を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:09:01 GMT)
Optimal Locally Private Nonparametric Classification with Public Data [2.6] 本研究では,非パラメトリック分類に着目して,公共データを利用した非対話型局所微分プライベート(LDP)学習の問題点について検討する。
後方ドリフト仮定の下では, LDP制約による最小収束率を導出する。
そこで本研究では,極小最大収束率を達成できる新しい手法である局所微分プライベート分類木を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:46:32 GMT)
X-CBA: Explainability Aided CatBoosted Anomal-E for Intrusion Detection System [2.6] Intrusion Detection Systemsにおける機械学習(ML)モデルとディープラーニング(DL)モデルの使用は、不透明な意思決定による信頼の欠如につながっている。
本稿では、グラフニューラルネットワーク(GNN)の構造的利点を活用して、ネットワークトラフィックデータを効率的に処理する新しい説明可能なIDS手法であるX-CBAを提案する。
本手法は、脅威検出の99.47%で高精度に達成し、その分析結果の明確で実用的な説明を提供する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 05:00:39 GMT)
Model-Driven Security Analysis of Self-Sovereign Identity Systems [2.5] 本稿では,SSIシステムのアーキテクチャパターンをモデル化するためのモデル駆動型セキュリティ分析フレームワークを提案する。
我々のフレームワークは、時間論理におけるセキュリティ特性を持つパターンや脅威を形式化するモデリング言語を機械化する。
SecureSSIで検証された典型的な脆弱性パターンを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 05:44:32 GMT)
Classical Verification of Quantum Computations in Linear Time [2.3] 複雑度$O(poly(kappa)|C|)$という,既存のプロトコルよりもはるかに高速なCVQCプロトコルを提供する。
我々のプロトコルは、ノイズの多いトラップドアの爪のない関数の存在を前提として、量子ランダムオラクルモデル [arXiv:1008.0931] において安全である。
また、$|+thetarangle=frac1sqrt2(|0rangle+eithetapi/4|1rangle)の状態に対する新しい古典的なチャネルリモート状態準備プロトコルも提供します。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:32:29 GMT)
CuTS: Customizable Tabular Synthetic Data Generation [2.2] 最初にカスタマイズ可能な合成データ生成フレームワークであるCuTSを紹介する。
CuTSは、元のデータセットで事前トレーニングされ、提供された仕様から自動的に派生した微分可能な損失に基づいて微調整される。
我々は4つのデータセットと多数のカスタム仕様に基づいてCuTSを評価し、より汎用的でありながら、いくつかのタスクにおける最先端の専門的アプローチより優れている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 08:56:06 GMT)
Amalgam: A Framework for Obfuscated Neural Network Training on the Cloud [2.0] 独自のニューラルネットワーク(NN)モデルをクラウド上にプロプライエタリなデータセットでトレーニングすることは、モデルアーキテクチャとデータセットをクラウドサービスプロバイダに公開するリスクを伴う。
我々は,既存のクラウド環境において,NNモデルをプライバシ保護的にトレーニングするためのNN難読化フレームワークであるAmalgamを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:54:25 GMT)
MedNeXt: Transformer-driven Scaling of ConvNets for Medical Image Segmentation [1.9] 本稿では,トランスフォーマーにインスパイアされた医用画像分割のための大規模カーネルセグメントネットワークであるMedNeXtを紹介する。
小さなカーネルネットワークをアップサンプリングすることでカーネルサイズを反復的に増加させる新しい手法により、限られた医療データの性能飽和を防止する。
これにより、CTとMRIの4つのタスクにおける最先端のパフォーマンスが向上する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 07:32:59 GMT)
Increasing Trust in Language Models through the Reuse of Verified Circuits [1.8] 言語モデル(LM)は、幅広い予測タスクにますます使われていますが、それらのトレーニングは稀なエッジケースを無視します。
数学的および論理的に規定されたフレームワークを使用して構築すれば,トランスフォーマーモデルをこの標準を満たすように訓練できることが示される。
両タスクの加算回路を広範囲に再利用し,より複雑な減算器モデルの検証を容易にする。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 05:56:31 GMT)
Towards a Better Evaluation of Out-of-Domain Generalization [1.8] ドメイン・ジェネリゼーション(Domain Generalization, DG)とは、未確認のテスト分布において高い性能を達成するアルゴリズムとモデルを考案することである。
平均測度は、モデルを評価し、アルゴリズムを比較するための代表的な尺度として使われてきた。
我々は,平均値に対するロバストな代替手段として,最悪の+ギャップ測度を提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:24:49 GMT)
Solving the bongard-logo problem by modeling a probabilistic model [1.8] 抽象推論問題は、AIアルゴリズムの認識と認識能力に課題をもたらす。
ボナード・ローゴ問題に適した確率モデルであるPMoCを導入し,高い推論精度を実現する。
我々は、複雑な抽象的推論タスクのために特別に設計された拡張トランスフォーマーであるPose-Transformerを設計した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:35:23 GMT)
Kernel Debiased Plug-in Estimation: Simultaneous, Automated Debiasing without Influence Functions for Many Target Parameters [1.6] 本稿では,Emph kernel plug-in Estimation (KDPE) という新しい手法を提案する。
KDPEは、我々の規則性条件を満たす経路的に異なるターゲットパラメータを同時に除くことを示す。
我々は、KDPEの使用法を数値的に説明し、理論結果を検証した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 22:34:38 GMT)
DiagSet: a dataset for prostate cancer histopathological image classification [1.6] 提案したデータセットは、430の完全な注釈付きスキャンから抽出された260万以上の組織パッチで構成されている。
がん組織領域の検出とスキャンレベルの診断の予測のための機械学習フレームワークを提案する。
提案手法はパッチレベルの認識において94.6%の精度を達成し,9人の病理組織学者とスキャンレベルの診断で比較した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:45:26 GMT)
Early Detection of Misinformation for Infodemic Management: A Domain Adaptation Approach [1.5] インフォデミック(インフォデミック、英: infodemic)とは、病気の発生時に拡散する膨大な量の真の情報と誤報を指す。
インフォデミックの初期段階における誤情報の検出は、その管理と公衆衛生への害を軽減する鍵となる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:27:56 GMT)
Online Resource Allocation with Non-Stationary Customers [1.3] 非定常的な顧客到着率と未知のクリックスルー率を持つオンラインリソースアロケーションのための新しいアルゴリズムを提案する。
さまざまな顧客シナリオに対して,アプローチが最適に近い収益を生み出すことを示すため,広範な数値実験を実施している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:39:31 GMT)
Boosting Few-Pixel Robustness Verification via Covering Verification Designs [1.3] ニューラルネットワークの信頼性を高めるためには、局所的な堅牢性を証明することが不可欠である。
多くの検証者は$L_infty$$epsilon$-ballsでロバスト性を証明するが、$L_infty$$epsilon$-ballsでロバスト性を検証する作業はほとんどない。
提案するCoVerDは,ブロックサイズ分布を予測せずに,異なる候補被覆を選択する,$L_$ロバスト性検証器である。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:54:51 GMT)
Pre-Training Protein Bi-level Representation Through Span Mask Strategy On 3D Protein Chains [1.3] 本研究では, 3次元タンパク質鎖上でのスパンマスク事前学習戦略を導入し, 残基および原子の有意義な表現を学習する。
これにより、多様な下流タスクに適したタンパク質表現を学習するための、シンプルで効果的なアプローチが導かれる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:17:38 GMT)
Model Predictive Control and Reinforcement Learning: A Unified Framework Based on Dynamic Programming [1.2] 近似動的プログラミング(DP)、モデル予測制御(MPC)、強化学習(RL)を結合する新しい概念的枠組みについて述べる。
このフレームワークは2つのアルゴリズムを中心に設計されており、ニュートンの手法の強力なメカニズムを通じて互いに独立に設計され、シナジーで動作している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 02:01:03 GMT)
A lexicon obtained and validated by a data-driven approach for organic residues valorization in emerging and developing countries [1.1] 低所得国と中所得国における農業における有機残基の生物変換と変質に関する用語のアノテーションとして用いられた。
専門辞書は, 用語のコーパスと抽出, 抽出用語の注釈, 関連用語の選択など, 様々な段階から得られた。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:36:33 GMT)
Research on Image Processing and Vectorization Storage Based on Garage Electronic Maps [1.1] 室内2次元地図データのベクトル化分類格納法を提案する。
この方法は、データをベクトルデータに変換し、駐車スペース、経路、障害物などの要素を分類する。
地図モデルの精度と信頼性を検証するため,ナビゲーション試験を行った。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 07:23:46 GMT)
Formality Style Transfer in Persian [1.0] 本稿では,Fa-BERTアーキテクチャに基づく新しいモデルFa-BERT2BERTを紹介し,一貫性学習と勾配に基づく動的重み付けを取り入れた。
その結果, BLEU, BERTスコア, Rouge-lなど, さまざまな指標において, 従来の手法よりも優れた性能を示し, ペルシャ語スタイル転送の複雑さを十分にナビゲートできることを示す指標が提案された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:57:27 GMT)
The Expressive Capacity of State Space Models: A Formal Language Perspective [0.9] 線形状態空間モデル(SSM)に基づくリカレントモデルは、言語モデリング(LM)において有望な性能を示した。
本稿では,変換器や従来のRNNと比較して,そのようなSSMの容量に関する包括的理論的研究を行う。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:43:55 GMT)
PureEBM: Universal Poison Purification via Mid-Run Dynamics of Energy-Based Models [0.9] データ中毒攻撃は、機械学習モデルの完全性に重大な脅威をもたらす。
有害な白・灰色・黒色画像毒から自然に訓練された一般化を守る普遍的なデータ浄化法を提案する。
EBM は, 有毒な EBM トレーニングデータの存在下においても, 普遍的な浄化剤であり, 誘導性および無誘導性中毒に対する SoTA 防御が達成されている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:21:45 GMT)
Gemini & Physical World: Large Language Models Can Estimate the Intensity of Earthquake Shaking from Multi-Modal Social Media Posts [0.8] 本稿では,ソーシャルメディアデータとCCTV映像を用いた地盤揺らぎ強度の推定手法を提案する。
生成AIと自然言語処理を利用した非構造化データから関連情報を抽出できることを実証する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 21:21:34 GMT)
Multi-variable Adversarial Time-Series Forecast Model [0.8] 短期的な産業用電力システムの予測は、負荷制御と機械保護の両方において重要な問題である。
本稿では,Long Short-Term Memory(LSTM)モデルを逆処理により正規化する,多変数の逆時系列予測モデルを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 02:30:10 GMT)
Reinforcement of Explainability of ChatGPT Prompts by Embedding Breast Cancer Self-Screening Rules into AI Responses [0.8] この研究は、ChatGPTの推論能力を評価し、ルールを処理する可能性を強調し、レコメンデーションをスクリーニングするための説明を提供することを目的としている。
この方法論では、ChatGPTの推奨事項の詳細な説明を強制するために、教師付きプロンプトエンジニアリングアプローチを採用している。
発見は、エキスパートシステムシェルに匹敵する処理ルールにおけるChatGPTの有望な能力を強調している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 22:42:00 GMT)
Know Your Neighborhood: General and Zero-Shot Capable Binary Function Search Powered by Call Graphlets [0.8] 本稿では,コールグラフレットと呼ばれる新しいグラフデータ表現を組み合わせた,新しいグラフニューラルネットワークアーキテクチャを提案する。
特殊なグラフニューラルネットワークモデルは、このグラフ表現で操作するように設計され、セマンティックコードの類似性を符号化する特徴ベクトルにマッピングすることを学ぶ。
実験により,コールグラフレットと新しいグラフニューラルネットワークアーキテクチャの組み合わせにより,最先端の性能が達成された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:26:50 GMT)
Towards commands recommender system in BIM authoring tool using transformers [0.7] 本研究では,BIMモデリングプロセスの高速化を目的としたシーケンシャルレコメンデーションシステムの可能性について検討する。
本稿では,BIMソフトウェアコマンドを推奨項目として扱うことにより,ユーザの履歴的インタラクションに基づいて次の最良コマンドを予測する,新たなエンドツーエンドアプローチを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:47:06 GMT)
The Map Equation Goes Neural: Mapping Network Flows with Graph Neural Networks [0.7] コミュニティ検出は、教師なしのデータ探索と、ネットワーク化されたシステムの組織構造を明らかにするために不可欠なツールである。
本研究では,非教師付きコミュニティ検出のための一般的な情報理論的目的関数であるマップ方程式を考察し,下降による勾配の微分可能なテンソル形式で表現する。
我々の定式化は、任意のニューラルネットワークアーキテクチャと互換性のあるマップ方程式を変換し、エンドツーエンドの学習を可能にし、ノード機能を導入し、クラスタの最適な数を自動的に選択します。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:05:31 GMT)
Facilitating Practical Fault-tolerant Quantum Computing Based on Color Codes [0.7] 本研究では,カラーコードに基づく実用的なフォールトトレラント量子コンピューティングを実現するために,いくつかの重要な課題に対処する。
まず, 誤り率関連重み付き復号グラフを導入することにより, 三角色符号の0.57%の閾値を得た。
第2に,カラーコード格子手術の回路レベルの復号化について検討し,効率的な復号化アルゴリズムを提案する。
第3に, 三角カラーコードの新しい状態注入プロトコルを提案し, 従来の粗いプロトコルに比べて1ラウンド15~1の蒸留における出力マジック状態エラー率を2桁減らした。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 05:00:12 GMT)
SMC Is All You Need: Parallel Strong Scaling [0.7] 並列高強度スケーリングを実現するための完全並列シーケンシャルモンテカルロ法(pSMC)を開発した。
pSMC は無限小精度 MSE$=O(varepsilon2)$ に収束し、固定された有限時間複素度コスト=O(1)$ であり、効率リークがない。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:19:23 GMT)
Quantum Equilibrium Propagation: Gradient-Descent Training of Quantum Systems [0.7] 平衡伝播はエネルギーベースのシステムのトレーニングフレームワークである。
EPはシステム物理を用いてコスト関数の勾配勾配を求める。
EPを量子系に拡張し、最小化されるエネルギー関数は平均エネルギー関数である。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 21:58:54 GMT)
Ensemble Deep Random Vector Functional Link Neural Network Based on Fuzzy Inference System [0.6] アンサンブルディープランダムベクトル汎関数リンク(edRVFL)ニューラルネットワークは、従来の人工ニューラルネットワークの限界に対処する能力を示した。
本稿では,ファジィ推論システム(edRVFL-FIS)に基づく新しいEDRVFLを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:01:44 GMT)
A Multi-Graph Convolutional Neural Network Model for Short-Term Prediction of Turning Movements at Signalized Intersections [0.6] 本研究では,交差点での移動予測を回転させる多グラフ畳み込みニューラルネットワーク(MGCNN)と呼ばれる新しいディープラーニングアーキテクチャを提案する。
提案アーキテクチャは,トラフィックデータの時間変動をモデル化する多グラフ構造と,グラフ上のトラフィックデータの空間変動をモデル化するためのスペクトル畳み込み演算を組み合わせた。
モデルが1, 2, 3, 4, 5分後に短期予測を行う能力は,4つのベースライン・オブ・ザ・アーティファクトモデルに対して評価された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 05:41:25 GMT)
LinkLogic: A New Method and Benchmark for Explainable Knowledge Graph Predictions [0.6] 本稿では、LinkLogicと呼ばれる単純なリンク予測説明法について詳細に検討する。
FB13データセットに存在する家族構造に基づいて,最初のリンク予測説明ベンチマークを構築した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:22:22 GMT)
DynaSeg: A Deep Dynamic Fusion Method for Unsupervised Image Segmentation Incorporating Feature Similarity and Spatial Continuity [0.6] 我々は、革新的な教師なしイメージセグメンテーションアプローチであるDynaSegを紹介する。
従来の方法とは異なり、DynaSegは画像の特徴に柔軟に対応する動的重み付け方式を採用している。
シルエットスコア位相を組み込むことで、ダイナセグは予測されたクラスターの数が1つに収束する過小評価の失敗を防ぐ。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 00:00:13 GMT)
Chiral photon blockade in the spinning Kerr resonator [0.4] このようなデバイスを一定の方向に駆動することで、対向伝搬光学モードに対して全く異なる量子効果が現れることを示す。
我々の研究は、キラル量子ネットワークやノイズ耐性量子センサーなど、様々なキラル量子効果の作成と利用へのさらなる取り組みを刺激することができる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:52:50 GMT)
Towards a copilot in BIM authoring tool using a large language model-based agent for intelligent human-machine interaction [0.4] デザイナーは、しばしばよりインテリジェントで軽量な方法でソフトウェアと対話しようとします。
本稿では,BIMオーサリングツールにおいて,協調動作として機能する自律エージェントフレームワークを提案する。
BIMオーサリングソフトウェアであるVectorworksのケーススタディでは,提案したフレームワークをシームレスに統合するソフトウェアプロトタイプを実装した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:47:57 GMT)
Reservoir History Matching of the Norne field with generative exotic priors and a coupled Mixture of Experts -- Physics Informed Neural Operator Forward Model [0.4] 逆モデリングは適応正規化アンサンブルカルマンインバージョン(aREKI)法によって実現される。
非ガウス測度に対する未知の透水性および多孔性場をパラメトリズする。
CCRは、非線型ピースマン井戸方程式を再現するために、PINOサロゲートで教師付きモデルとして機能する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:16:00 GMT)
Weight Equalization Algorithm for Tree Parity Machines [0.4] ツリーパリティマシンは潜在的な解決策として提案されている。
ツリーパリティマシンには固有の欠点があり、その1つは保護キー内の値の不均一な分布である。
本稿では,この問題に対処する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:02:32 GMT)
An Early Investigation into the Utility of Multimodal Large Language Models in Medical Imaging [0.3] 医用画像解析のためのGemini(textitgemini-1.0-pro-vision-latst)モデルとGPT-4Vモデルの可能性を探る。
Gemini AIとGPT-4Vはどちらも、まず実画像と合成画像の分類に使用され、次に入力画像の解釈と解析を行う。
本研究で紹介した早期研究は,網膜眼底鏡および肺X線像の分類と解釈を支援するMLLMの可能性についての知見を提供するものである。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 08:29:23 GMT)
COVID-19: post infection implications in different age groups, mechanism, diagnosis, effective prevention, treatment, and recommendations [0.3] SARS-CoV-2は、初期感染から4週間後に始まり、未決定期間が続く持続的な効果を持つ。
本総説では, 肺, 循環器, 神経系, 生殖系, 消化管, 筋骨格, 内分泌, リンパ系など, 様々な臓器に対するウイルスの長期的影響について検討する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:07:49 GMT)
DUDF: Differentiable Unsigned Distance Fields with Hyperbolic Scaling [0.2] 我々は符号のない距離場の双曲的スケーリングを学習し、異なる境界条件を持つ新しいアイコン問題を定義する。
提案手法は,オープンサーフェス表現の課題に対処するだけでなく,再構築品質とトレーニング性能の大幅な向上を示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:50:33 GMT)
Extrapolability Improvement of Machine Learning-Based Evapotranspiration Models via Domain-Adversarial Neural Networks [0.2] 本研究では,ドメイン逆ニューラルネットワーク(DANN)を統合して,蒸発散(ET)モデルの地理的適応性を向上させる。
DANN は従来のLeave-One-Out (LOO) 法と比較して Kling-Gupta 効率 (KGE) を 0.2 から 0.3 に向上させ,ET 予測精度を向上させる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:08:56 GMT)
Loss shaping enhances exact gradient learning with EventProp in Spiking Neural Networks [0.1] Eventpropは、スパイキングニューラルネットワークの正確な勾配の勾配勾配のアルゴリズムである。
我々は、GPU強化ニューラルネットワークフレームワークにEventpropを実装した。
ネットワークはスパイキングハイデルベルク・ディジットの最先端性能とスパイキング音声コマンドの精度を達成する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:10:45 GMT)
XSTEM: An exemplar-based stemming algorithm [0.0] ステミング(英: Stemming)とは、接尾辞を除去することで、関連語を標準語に還元する過程である。
本稿では,単語ベースのルックアップテーブルの単純さと性能を,規則に基づく手法の強い一般化性と組み合わせて,語彙外単語による問題を回避する,高速,シンプル,高精度,高速なスリーミングアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:40:26 GMT)
W-kernel and essential subspace for frequentist evaluation of Bayesian estimators [0.0] この研究は行列 W とその主空間に焦点をあて、後者を必須部分空間と呼ぶ。
基本部分空間への射影は、感度解析と頻繁な評価において次元的還元を実現する。
フィッシャー核とニューラル・タンジェント核の関係が確立され、古典理論との関係が解明される。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 09:05:54 GMT)
Volichenko-type metasymmetry of braided Majorana qubits [0.0] 本稿では, ブレイドマヨラナ量子ビットのパラ統計学に関連付けられた異なる数学的構造を示す。
混合ブラケットハイゼンベルク-リー代数が導入された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 21:50:29 GMT)
Universal scaling laws for correlated decay of many-body quantum systems [0.0] 量子システムはオープンであり、周囲の環境とエネルギーと情報を継続的に交換している。
巨大量子系の最大崩壊速度はどのくらいで、その大きさはどのようにスケールするか?
ハミルトンの複雑性理論における最近の研究に触発され、最大崩壊速度の厳密で一般的な上と下の境界を定めている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 12:11:33 GMT)
Tuneable entangled photon pair generation in a liquid crystal [0.0] 液晶は光線操作の鍵となる材料である。
強誘電性ネマティック液晶の最近の発見は、非線形光学の視点材料となっている。
量子光の源としての使用は、フォトニック量子技術の境界を大幅に広げる可能性がある。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:26:25 GMT)
Truncated quantum observables and their semiclassical limit [0.0] 位相空間における対応するワイル記号をプランク定数 $hbarto0$ の半古典的極限で研究する。
位相空間の古典的に許容される領域でトランケートされた記号に対するワイル記号の$L2$-収束を証明する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 22:16:00 GMT)
Transforming Computer Security and Public Trust Through the Exploration of Fine-Tuning Large Language Models [0.0] Mallasは、大きな言語モデル(LLM)を悪用する悪意のあるサービスである。
本稿では,様々な事前学習言語モデルとその効率と脆弱性を検証し,Mallasの増殖について考察する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:10:31 GMT)
Trackable Agent-based Evolution Models at Wafer Scale [0.0] 我々は,85万プロセッサCerebras Wafer Scale Engine(WSE)のエージェントベース進化から系統情報を抽出する問題に焦点をあてる。
We present a asynchronous island-based genetic algorithm (GA) framework for WSE hardware。
本研究は,これらの治験の系統的再構成を検証し,根底にある進化状態の推測に適合することを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 02:22:43 GMT)
The Political Preferences of LLMs [0.0] 私は、テストテイカーの政治的嗜好を特定するために、11の政治的指向テストを実行し、24の最先端の会話型LLMを実行します。
ほとんどの会話型LLMは、ほとんどの政治的テスト機器によって、中心の視点の好みを示すものとして認識される応答を生成する。
LLMは、スーパービジョンファインチューニングを通じて、政治スペクトルの特定の場所に向けて操れることを実証します。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 04:48:36 GMT)
Symmetry Protected Topological Phases of Mixed States in the Doubled Space [0.0] 量子多体混合状態における対称性と位相の相互作用を研究する。
純粋な状態には見られない現象では、混合状態は平均対称性を示すことができる。
混合状態の自発的対称性破壊(SSB)のパターンについて検討した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:59:08 GMT)
Solving Collaborative Dec-POMDPs with Deep Reinforcement Learning Heuristics [0.0] このような問題を解決するアルゴリズムを提供する。
最初の段階では、単一エージェントの問題を解決し、ポリシーを得る。
第2段階では、単一エージェントポリシーを用いてマルチエージェント問題を解く。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:41:40 GMT)
Solar Panel Segmentation :Self-Supervised Learning Solutions for Imperfect Datasets [0.0] 本稿では,パネルセグメンテーションの課題,特に注釈付きデータの不足,および教師あり学習のための手動アノテーションの労働集約性について論じる。
これらの課題を解決するために、自己監視学習(SSL)を探求し、適用します。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:08:19 GMT)
Sample Observed Effects: Enumeration, Randomization and Generalization [0.0] まずは効果観察の背景概念を定式化する。
次に、サンプルの(観測および観測されていない)背景の集合に基づいて効果一般化の条件を定式化する。
提案手法は,非I.D.サンプルにおける教師付きおよび説明手法の使用を可能にすることを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 12:32:37 GMT)
Resource-theoretic hierarchy of contextuality for general probabilistic theories [0.0] 一般化された文脈性の階層を示す。
これは文脈理論と非文脈理論の伝統的な二分法を洗練させる。
提案手法は,準備・対策シナリオの文脈性に焦点をあてる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 11:52:44 GMT)
RNNs, CNNs and Transformers in Human Action Recognition: A Survey and A Hybrid Model [0.0] HAR(Human Action Recognition)は、さまざまな領域にわたる人間の活動を監視するタスクである。
過去10年間で、HARの分野は、畳み込みニューラルネットワーク(CNN)を活用することで、かなりの進歩をみせた。
近年、コンピュータビジョンの領域は、視覚変換器(ViT)が強力なソリューションとして出現するのを目撃している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:09:59 GMT)
Qudit inspired optimization for graph coloring [0.0] グラフ色問題(GCP)のための量子インスパイアされたアルゴリズムを提案する。
我々は、グラフ内のノードを表現し、d次元球面座標でパラメータ化した各キューディットを積状態に使用する。
我々は、QdGD(qudit gradient descent)、ランダムな状態におけるクォーディットの開始、コスト関数の最小化のために勾配降下を利用する2つの最適化戦略をベンチマークする。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:19:55 GMT)
Privacy-Preserving 3-Layer Neural Network Training [0.0] ニューラルネットワークのプライバシ保護トレーニングの問題点を,ただの同型暗号設定で検討する。
利用可能ないくつかの拡張テクニックを組み合わせて、いくつかの拡張を行い、最終的に回帰と分類の両問題に対する3層ニューラルネットワークのトレーニングを可能にします。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 01:24:20 GMT)
Portfolio Optimization with Robust Covariance and Conditional Value-at-Risk Constraints [0.0] 各種のLedoit Shrinkage CovarianceおよびRobust Gerber CovarianceMatrixを用いた大容量ポートフォリオの性能評価を行った。
堅牢性評価は、特に強気相場で、市場資本化の重み付けされたベンチマークポートフォリオを上回る可能性がある。
我々は最適化アルゴリズムに教師なしクラスタリングアルゴリズムK平均を組み込んだ。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:50:20 GMT)
Physics and geometry informed neural operator network with application to acoustic scattering [0.0] 任意の形状の散乱体に対する散乱圧力場を予測できる物理インフォームド・ディープ・オペレーター・ネットワーク(DeepONet)を提案する。
我々の訓練されたモデルは、物理的に一貫性のある散らばった圧力場を数秒で近似できる解演算子を学習することができる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 03:41:52 GMT)
Partially Stochastic Infinitely Deep Bayesian Neural Networks [0.0] 無限深層ニューラルネットワークの枠組みに部分性を統合する新しいアーキテクチャ群を提案する。
完全性の利点を含む無限深度極限における部分性の利点を利用する。
ネットワーク設計における柔軟性を提供する、さまざまなアーキテクチャ構成を提示します。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:37:00 GMT)
Optimizing Agent Collaboration through Heuristic Multi-Agent Planning [0.0] QDec-POMDP問題に対処するSOTAアルゴリズム、QDec-FPおよびQDec-FPSは、異なるタイプの検知エージェントを含む問題に効果的に対処できない。
本稿では,あるエージェントが検知アクションを取らなかった場合,エージェントが同じ計画を採用するように要求することで,この問題に対処する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:41:29 GMT)
One-dimensional quantum scattering from multiple Dirac delta potentials: A Python-based solution [0.0] 複数の Dirac $delta -$% のポテンシャルを組み込んだ 1 次元量子システムをシミュレートするために設計された Python ベースのソリューションを提案する。
本研究の主な目的は,そのようなシステム内の散乱問題を調べることである。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:59:35 GMT)
Numerical linked-cluster expansions for two-dimensional spin models with continuous disorder distributions [0.0] 数値連成クラスタ展開 (NLCE) により, 連続的な障害分布を持つスピン格子モデルに対して, 高精度な低温結果が得られることを示す。
我々は古典的(Ising)と量子的(Heisenberg)のスピン-$frac12$モデルの両方を検討し、収束は関連するエネルギースケールよりも2桁低い温度まで達成可能であることを示した。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:38:26 GMT)
Measurement-only dynamical phase transition of topological and boundary order in toric code and gauge-Higgs models [0.0] トリック符号モデルにおける時間的ダイナミクスとトポロジカル秩序状態の運命について,プロジェクティブな計測専用回路を用いて検討する。
この回路は、磁場の摂動を伴うトーリック符号ハミルトニアンの各項に対応するいくつかの測定演算子で構成されている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:55:55 GMT)
Majorana fermions and quantum information with fractional topology and disorder [0.0] ブロッホ球面上の2つのスピン-1/2$のモデルにおいて、2つの非局在零エネルギーマヨラナフェルミオンの発生から量子ビットを導入する。
我々は、障害が一重項-三重項遷移を許容し、また、分数相に対する追加の伸長領域を生じさせる、ポジティブかつ重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:57:25 GMT)
LLaMP: Large Language Model Made Powerful for High-fidelity Materials Knowledge Retrieval and Distillation [0.0] 大規模言語モデル(LLM)は本質的に長期記憶を欠いているため、ドメイン固有の文献やデータに基づいてそれらを微調整する非自明でアドホックで必然的にバイアスのあるタスクである。
本稿では、階層的推論・実行(RAG)エージェントのフレームワークであるLLaMPを紹介し、計算および実験データと相互作用できる。
微調整なしでは、LLaMPは材料科学の概念の様々なモダリティを理解し統合する強力なツール利用能力を示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 07:50:21 GMT)
Is Intersubjectivity Proven? A Reply to Khrennikov and to QBists [0.0] 最近の2つの論文において、クレンニコフは、彼がオザワ間射影定理(英語版)と呼ぶものを用いて、相互射影性は量子力学において必ず検証されると主張する。
Khrennikov の証明が有効でない理由をここで説明するが、これらの論文の1つとは対照的に、QBism におけるintersubjectivity の扱い方を批判する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 10:26:56 GMT)
Influence of joint measurement bases on sharing network nonlocality [0.0] 連続測定によるネットワーク非局所性共有におけるElegant Joint Measurements(略してEJM)ベースの影響について検討した。
この研究は、ネットワークシナリオにおける量子相関の実現をさらに進める。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:16:37 GMT)
Implicit regularization of multi-task learning and finetuning: multiple regimes of feature reuse [0.0] 複数タスクの同時学習から生じる帰納的バイアス(マルチタスク学習, MTL)と逐次学習(事前学習, その後の微調整, PT+FT)について検討する。
対角線ネットワークおよび単層ReLUネットワークにおけるMTLおよびPT+FTに付随する新しい暗黙正則化法則について述べる。
これらの罰則は、MTLとPT+FTが異なる方法で機能を再利用するためにネットワークを誘導することを示している。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 11:30:07 GMT)
Harvard Undergraduate Survey on Generative AI [0.0] ハーバード大学の大学院生の学習習慣,クラス選択,キャリアの見通しに及ぼすAIの影響について検討した。
約25%の学生のために、AIはオフィスの時間と必要な読み上げを代用し始めている。
学生の半数はAIが仕事の見通しに悪影響を及ぼすのではないかと心配しており、半数以上がハーバード大学にAIの将来的な影響についてもっと多くのクラスがあることを望んでいる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 18:47:08 GMT)
Gated recurrent neural network with TPE Bayesian optimization for enhancing stock index prediction accuracy [0.0] インドの著名な株式市場指標であるNIFTY50指数の翌日の終値の予測精度を改善することを目的とする。
8つの影響要因の組み合わせは、基本株価データ、技術指標、原油価格、マクロ経済データから慎重に選択される。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:39:01 GMT)
Fairness in AI-Driven Recruitment: Challenges, Metrics, Methods, and Future Directions [0.0] ビッグデータと機械学習は、従来の採用プロセスに急激な変革をもたらした。
AIベースの採用の頻度を考えると、人間の偏見がこれらのシステムによって決定される可能性があるという懸念が高まっている。
本稿では、AIによる採用におけるバイアスの種類を議論することで、この新興分野の包括的概要を提供する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 22:11:32 GMT)
Expected Possession Value of Control and Duel Actions for Soccer Player's Skills Estimation [0.0] 本稿では、広く使われているモデル、期待所有値(EPV)に複数の拡張を導入する。
撮影直前に発生する事象に、先行する出来事よりも重みを割り当てる(デカイ効果)。
本モデルでは, 減衰効果と有効演奏時間を考慮することにより, 保持リスクをより正確に評価する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 17:29:42 GMT)
Efficient Neural Light Fields (ENeLF) for Mobile Devices [0.0] この研究はMobileR2Lによって導入された新しいネットワークアーキテクチャに基づいており、レイテンシが低く、サイズが小さいモバイルデバイス上で効率的に動作するモデルを生成する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 02:55:52 GMT)
Eating Smart: Advancing Health Informatics with the Grounding DINO based Dietary Assistant App [0.0] Smart Dietary Assistantは機械学習を利用して、パーソナライズされた食事アドバイスを提供する。
アプリは複数のプラットフォームでシームレスに動作し、自己ホスト型データベースを統合する。
主な機能としては、パーソナライズされた栄養プロファイル、リアルタイム食品スキャン、健康情報などがある。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 19:59:07 GMT)
Dynamical quantum phase transitions following a noisy quench [0.0] 本研究では, 時間依存性エネルギー変動が量子イジング鎖の逆磁場のノイズクエンチにともなう量子相転移に与える影響について検討する。
我々は,この現象を,クエンチ中に蓄積する雑音誘起励起と,系の近赤外力学との相互作用に追従する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:06:00 GMT)
Developing an efficient corpus using Ensemble Data cleaning approach [0.0] 本研究の目的は、アンサンブル技術を用いて医療データセットをクリーン化し、コーパスを開発することである。
本研究におけるデータクリーニング手法は,アンサンブル法が単一プロセスと比較して高い精度(94%)を提供することを示している。
医療分野におけるNLPの重要性を浮き彫りにしており、正確でタイムリーな情報抽出が命と死の問題となる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:03:31 GMT)
Decision Machines: An Extension of Decision Trees [0.0] 予測と二分テストの依存関係を決定木に描きます。
決定木と誤り訂正出力コードとの接続を提供する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 06:55:33 GMT)
Correctness Comparison of ChatGPT-4, Gemini, Claude-3, and Copilot for Spatial Tasks [0.0] 本研究では、4つのチャットボットに割り当てられた7つのタスクカテゴリの76個の空間的タスクに対してゼロショットの正当性評価を行う。
チャットボットは、空間リテラシー、GIS理論、プログラミングコードと関数の解釈に関連するタスクでうまく機能したが、マッピング、コード記述、空間推論の弱点が明らかになった。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 00:00:28 GMT)
Comparative Analysis of Hyperspectral Image Reconstruction Using Deep Learning for Agricultural and Biological Applications [0.0] 本研究では,RGB(赤,緑,青)画像からの深層学習に基づくハイパースペクトル画像再構成について検討した。
その結果, 農業・生物応用のための費用対効果・効率の高い品質評価ツールとして, 深層学習に基づくハイパースペクトル画像再構成が期待できることが明らかになった。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 16:08:17 GMT)
Cephalo: Multi-Modal Vision-Language Models for Bio-Inspired Materials Analysis and Design [0.0] セファロ (Cephalo) は、材料科学応用のために設計された多モード視覚大言語モデル(V-LLM)のシリーズである。
視覚的および言語的データを統合して、人間-AIおよびマルチエージェントAIフレームワーク内での理解と相互作用を強化する。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 15:03:24 GMT)
COS-Mix: Cosine Similarity and Distance Fusion for Improved Information Retrieval [0.0] 本研究では,レトリーバル拡張生成(RAG)のための新しいハイブリッド検索手法を提案する。
伝統的なコサイン類似度尺度は、高次元空間におけるベクトル間の類似度を捉えるために広く用いられている。
ベクトル間の相似性を定量化することにより、相補的な視点を提供するためにコサイン距離測度を組み込む。
論文参考訳(メタデータ) (Sun, 02 Jun 2024 06:48:43 GMT)
Bringing active learning, experimentation, and student-created videos in engineering: A study about teaching electronics and physical computing integrating online and mobile learning [0.0] 本研究の主な目的は、電子工学、物理コンピューティング(PhyC)、プログラミング、工学における基礎ロボティクスを学ぶためのAL方法論を作成することであった。
この方法論は、ICDM(Integrated Course Design Model)のガイドラインと、モバイルとオンラインの学習をAndroidアプリと組み合わせたコースを用いて考案された。
その結果, 学生のPhyCとプログラミング活動の認知度は良好であり, 動機づけ, 自己効力感, 不安の軽減, 学業成績の向上に影響を及ぼす可能性が示唆された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 23:26:27 GMT)
Augmenting the FedProx Algorithm by Minimizing Convergence [0.0] 我々はGフェデレーション・プロクシミティ(G Federated Proximity)と呼ばれる新しいアプローチを提案する。
以上の結果から,既存のモデル性能と比較して,スループットが約90%向上していることが示唆された。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 14:01:55 GMT)
AI with Alien Content and Alien Metasemantics [0.0] この章では、セマンティックとメタセマンティックの観点から、AIにおける異星のコンテンツに関する疑問を探求する。
意味論とメタセマンティックな質問に対する可能な応答の論理空間をレイアウトする。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 22:27:50 GMT)
AI Safety: A Climb To Armageddon? [0.0] 本稿では,最適化,緩和,ホロリズムの3つの対応戦略について検討する。
この議論の驚くべき堅牢性は、AIの安全性に関するコア前提の再検討を迫られる。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 22:32:46 GMT)
A complete scheme for atom-mediated deterministic photonic graph state generation [0.0] 高絡み合い多光子グラフ状態は、フォトニック量子計算と通信において重要な資源である。
単一原子をベースとしたフォトニック操作を利用すれば、フォトニックグラフ状態の決定論的生成が可能になることを示す。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:33:40 GMT)
A Tutorial on Doubly Robust Learning for Causal Inference [0.0] 二重に堅牢な学習は、観測データから因果推論を行うための堅牢なフレームワークを提供する。
このチュートリアルは、二重に堅牢なメソッドをデミスティフィケートし、EconMLパッケージを使ってアプリケーションをデモすることを目的としている。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 20:18:40 GMT)
A Diagnostic Model for Acute Lymphoblastic Leukemia Using Metaheuristics and Deep Learning Methods [0.0] 急性リンパ性白血病(ALL)重症度は、爆発細胞の存在と比率によって決定される。
本稿では,ResNetをベースとした特徴抽出器を用いて,さまざまな特徴抽出器や分類器とともにALLを検出する。
この手法は90.71%の精度と95.76%の感度を達成し、このデータセットの指標は他よりも優れていた。
論文参考訳(メタデータ) (Sun, 2 Jun 2024 13:25:44 GMT)