OLMo: Accelerating the Science of Language Models [165.2] 言語モデル(LM)は、NLP研究と商用製品製品の両方で広く普及している。
商業的重要性が増すにつれ、最も強力なモデルは閉鎖され、プロプライエタリなインターフェースに遅れを取っている。
我々は、研究コミュニティが強力で真にオープンなLMにアクセスできることが不可欠であると信じている。
私たちは、言語モデルの科学的研究を可能にするために、競争力のある真にオープンな言語モデルであるOLMoを構築しました。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:59:52 GMT)
Towards Semantic Equivalence of Tokenization in Multimodal LLM [149.1] 視覚トークン化は、視覚と言語間のセマンティックアライメントに不可欠である。
本稿では,新しい動的セマンティック等価ビジョントケナイザ(SeTok)を提案する。
SeTokは動的クラスタリングアルゴリズムを通じて、視覚的特徴をセマンティックユニットにグループ化する。
結果として得られる視覚トークンは意味的整合性を効果的に保持し、低周波と高周波の両方の視覚特徴をキャプチャする。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:55:43 GMT)
Branch-Solve-Merge Improves Large Language Model Evaluation and Generation [136.8] 大規模言語モデル(LLM)は多面的言語生成や評価タスクに頻繁に使用される。
本稿では,これらの課題に対処するための大規模言語モデルプログラムであるブランチ・マージ(BSM)を提案する。
BSMは、人間とLLMの合意を最大26%向上させることにより、各LLMの評価正当性と整合性を向上させる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:08:49 GMT)
Doodle Your 3D: From Abstract Freehand Sketches to Precise 3D Shapes [118.4] 本稿では,抽象モデリングとクロスモーダル対応を容易にする,新しい部分レベルモデリング・アライメントフレームワークを提案する。
提案手法は,CLIPassoエッジマップと投影された3次元部分領域との対応性を確立することで,スケッチモデリングにシームレスに拡張する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:18:16 GMT)
CLOMO: Counterfactual Logical Modification with Large Language Models [109.6] 本稿では,新しいタスク,CLOMO(Counterfactual Logical Modification)と高品質な人間アノテーションベンチマークを紹介する。
このタスクでは、LLMは所定の論理的関係を維持するために、与えられた議論的テキストを順応的に変更しなければなりません。
LLMの自然言語出力を直接評価する革新的な評価指標である自己評価スコア(SES)を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:27:54 GMT)
SALAD-Bench: A Hierarchical and Comprehensive Safety Benchmark for Large Language Models [107.8] SALAD-Benchは、大規模言語モデル(LLM)を評価するために特別に設計された安全ベンチマークである。
それは、その大規模な、豊富な多様性、三つのレベルにまたがる複雑な分類、多目的機能を通じて、従来のベンチマークを超越している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:05:46 GMT)
Context-aware Difference Distilling for Multi-change Captioning [106.7] マルチチェンジキャプションは、自然言語でイメージペア内の複雑で結合的な変化を記述することを目的としている。
そこで本稿では, 文収量に対する真の変化をすべて捉えるための, 文脈認識型差分蒸留ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:27:30 GMT)
Matryoshka Query Transformer for Large Vision-Language Models [103.8] 我々は,Materyoshka Query Transformer (MQT)を導入し,推論中に画像をmビジュアルトークンにエンコードする。
単一のモデルを一度トレーニングし、フレキシブルかつ劇的に、推論時の視覚トークンの数を削減します。
MQT-LLAVAは,LLaVAの固定576の代わりに最大256トークンを用いて,11ベンチマークでLLaVA-1.5のパフォーマンスと一致した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:39:04 GMT)
Enhancing Visual-Language Modality Alignment in Large Vision Language Models via Self-Improvement [102.2] SIMAは、自己改善を通じて視覚的および言語的モダリティアライメントを強化するフレームワークである。
コンテキスト内自己批判機構を使用して、プライオリティチューニングのためのレスポンスペアを選択する。
SIMAは従来の手法よりも優れたモダリティアライメントを実現することを実証する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:15:24 GMT)
CorDA: Context-Oriented Decomposition Adaptation of Large Language Models [101.8] 現在のパラメータ効率の高い微調整手法は、学習すべき下流タスクのコンテキストや維持すべき重要な知識のコンテキストを考慮せずに、アダプタを構築する。
我々は、下流タスクや世界知識のコンテキストを指向した重み分解から学習可能なアダプタを構築するコンテキスト指向の分解適応手法であるCorDAを提案する。
我々の知識保存適応は、微調整作業においてLoRAよりも優れた性能を達成するだけでなく、世界の知識の分解を軽減します。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:10:35 GMT)
UniTST: Effectively Modeling Inter-Series and Intra-Series Dependencies for Multivariate Time Series Forecasting [98.1] フラット化されたパッチトークンに統一された注意機構を含む変圧器ベースモデルUniTSTを提案する。
提案モデルでは単純なアーキテクチャを採用しているが,時系列予測のためのいくつかのデータセットの実験で示されたような,魅力的な性能を提供する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:39:28 GMT)
Uncertainty Aware Learning for Language Model Alignment [97.4] 異なるタスクシナリオのモデルアライメントを改善するために,不確実性認識学習(UAL)を提案する。
トレーニングのラベルの平滑化値を個々のサンプルの不確実性に応じて適応的に設定する。
広く使われているベンチマーク実験では、我々のUALは標準教師あり微調整よりも著しく優れています。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:37:45 GMT)
OVMR: Open-Vocabulary Recognition with Multi-Modal References [96.2] 既存の研究では、モデルにカテゴリキューを埋め込む方法がいくつか提案されている。
本稿では,テキスト記述と模範画像からなるマルチモーダル手がかりを参考に,異なる視点からオープン語彙認識に取り組む。
提案したOVMRはプラグイン・アンド・プレイモジュールであり、インターネットからランダムにクロールされた典型的な画像とうまく機能する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:45:28 GMT)
Learning Task Decomposition to Assist Humans in Competitive Programming [90.5] タスク分解学習のための新しい目的,いわゆる値(AssistV)を導入する。
我々は、さまざまな分解されたソリューションに対して、人間の修理経験のデータセットを収集する。
人間の177時間以内の研究では、非専門家が33.3%の問題を解き、それらを3.3倍スピードアップさせ、無支援の専門家にマッチさせる権限を与える。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:27:51 GMT)
ACDC: The Adverse Conditions Dataset with Correspondences for Robust Semantic Driving Scene Perception [86.0] レベル5の運転自動化には、任意の条件下で入力画像を解析できる堅牢な視覚認識システムが必要である。
本稿では,視覚条件に対する多種多様な意味認識タスクの訓練と試験のための逆条件データセットであるACDCを紹介する。
詳細な実証研究は、ACDCの有害領域が最先端の監督と教師なしのアプローチにもたらす課題を実証している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:56:09 GMT)
A Manifold Perspective on the Statistical Generalization of Graph Neural Networks [84.0] グラフニューラルネットワーク(GNN)は、グラフ畳み込みの連続的な応用により、隣接ノードからの情報を結合する。
ノードレベルとグラフレベルの両方のタスクにおけるGNNの一般化ギャップについて検討する。
トレーニンググラフのノード数によって一般化ギャップが減少することを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:25:02 GMT)
The No Free Lunch Theorem, Kolmogorov Complexity, and the Role of Inductive Biases in Machine Learning [80.1] ニューラルネットワークモデルは、Kolmogorov複雑性を使って形式化された、同じ好みを共有している、と我々は主張する。
実験の結果、事前訓練された言語モデルでも、低複雑さのシーケンスを生成するのが好まれることがわかった。
これらの観察は、ますます小さな機械学習モデルで異なるように見える問題を統一する深層学習の傾向を正当化する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:56:33 GMT)
Revisiting Catastrophic Forgetting in Large Language Model Tuning [79.7] Catastrophic Forgetting (CF) は、新しいデータを学ぶ際に獲得した知識を忘れるモデルを意味する。
本稿では,モデル損失景観の平坦度と大規模言語モデルの分野におけるCFの広さとの直接的な関係を明らかにするための第一歩を踏み出した。
様々なモデルスケールにまたがる3つの大規模微調整データセットの実験により,CFを緩和する手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:09:13 GMT)
What Languages are Easy to Language-Model? A Perspective from Learning Probabilistic Regular Languages [78.2] 大規模言語モデル (LM) は文字列上の分布である。
RNNとTransformer LMによる規則的LM(RLM)の学習性について検討する。
RNNとトランスフォーマーの双方において,RLMランクの複雑さは強く,学習可能性の有意な予測因子であることが判明した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:30:02 GMT)
Executable Code Actions Elicit Better LLM Agents [77.0] この研究は、Pythonコードを使用して、Large Language Model(LLM)エージェントのアクションを統一されたアクション空間(CodeAct)に統合することを提案する。
Pythonインタプリタと統合されたCodeActは、コードアクションを実行し、事前アクションを動的に修正したり、マルチターンインタラクションを通じて新しい観察に新しいアクションを発行することができる。
CodeActのパフォーマンス向上は、解釈可能なコードを実行し、自然言語を使ってユーザとコラボレーションすることで、環境と対話するオープンソースのLLMエージェントを構築する動機となります。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:53:07 GMT)
Large Generative Graph Models [74.6] 大規模グラフ生成モデル(LGGM)と呼ばれる新しいグラフ生成モデルを提案する。
事前訓練されたLGGMは、既存のグラフ生成モデルよりもゼロショット生成能力が優れている。
LGGMは、ターゲットドメインからのグラフで簡単に微調整でき、スクラッチから直接トレーニングされたグラフよりも、さらに優れたパフォーマンスを示すことができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:41:47 GMT)
Perturb-and-Project: Differentially Private Similarities and Marginals [74.0] 差分プライバシーのための入力摂動フレームワークを再検討し、入力にノイズを付加する。
まず、ペアワイズ・コサイン類似性をプライベートにリリースするための新しい効率的なアルゴリズムを設計する。
我々は,$k$の辺縁クエリを$n$の機能に対して計算する新しいアルゴリズムを導出する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:07:16 GMT)
The Good, The Bad, and Why: Unveiling Emotions in Generative AI [73.9] EmotionPromptはAIモデルの性能を向上し、EmotionAttackはそれを妨げうることを示す。
EmotionDecodeによると、AIモデルは人間の脳内のドーパミンのメカニズムに似た感情的な刺激を理解することができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:25:31 GMT)
EmoBench: Evaluating the Emotional Intelligence of Large Language Models [73.6] EmoBenchは、確立された心理学理論に基づいて、マシン感情知能(EI)の包括的な定義を提案するベンチマークである。
EmoBenchには、英語と中国語で400の手作りの質問が含まれている。
以上の結果から,既存の大規模言語モデルのEIと平均的な人間の間には,かなりのギャップがみられ,今後の研究に向けての有望な方向性が浮かび上がっている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:43:45 GMT)
Learning Divergence Fields for Shift-Robust Graph Representations [73.1] 本研究では,相互依存データに対する問題に対して,学習可能な分散場を持つ幾何学的拡散モデルを提案する。
因果推論によって新たな学習目標が導出され、ドメイン間で無神経な相互依存の一般化可能なパターンを学習するためのモデルが導出される。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:29:21 GMT)
1st Place Solution for MOSE Track in CVPR 2024 PVUW Workshop: Complex Video Object Segmentation [72.5] 本稿では,ビデオオブジェクトのセグメンテーションモデルを提案する。
我々は大規模ビデオオブジェクトセグメンテーションデータセットを用いてモデルを訓練した。
我々のモデルは、複雑なビデオオブジェクトチャレンジのテストセットで1位(textbf84.45%)を達成した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:13:46 GMT)
Towards Interpretable Deep Local Learning with Successive Gradient Reconciliation [70.4] グローバルバックプロパゲーション(BP)に対するニューラルネットワークトレーニングの信頼性の回復が、注目すべき研究トピックとして浮上している。
本稿では,隣接モジュール間の勾配調整を連続的に調整する局所的学習戦略を提案する。
提案手法はローカルBPとBPフリー設定の両方に統合できる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:10:31 GMT)
SpaRC and SpaRP: Spatial Reasoning Characterization and Path Generation for Understanding Spatial Reasoning Capability of Large Language Models [70.0] 空間推論は 生物学的と人工知能の両方において 重要な要素です
本稿では,現在最先端の大規模言語モデル (LLM) の空間的推論能力について包括的に検討する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:06:34 GMT)
Provable Multi-Task Representation Learning by Two-Layer ReLU Neural Networks [69.4] 本稿では,複数タスクにおける非線形モデルを用いたトレーニング中に特徴学習が発生することを示す最初の結果を示す。
私たちのキーとなる洞察は、マルチタスク事前トレーニングは、通常タスク間で同じラベルを持つポイントを整列する表現を好む擬似コントラスト的損失を誘導するということです。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:12:08 GMT)
Diversified Batch Selection for Training Acceleration [68.7] オンラインバッチ選択として知られる一般的な研究ラインでは、トレーニングプロセス中の情報サブセットの選択について検討している。
バニラ参照モデルフリーメソッドは、独立してデータをサンプリング的にスコア付けし、選択する。
DivBS(Diversified Batch Selection)を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:12:20 GMT)
WAVES: Benchmarking the Robustness of Image Watermarks [68.0] WAVES(Watermark Analysis Via Enhanced Stress-testing)は、画像透かしの堅牢性を評価するためのベンチマークである。
我々は,検出タスクと識別タスクを統合し,多様なストレステストからなる標準化された評価プロトコルを確立する。
我々はWAVESを,ロバストな透かしの将来の開発のためのツールキットとして想定する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:38:35 GMT)
CHIQ: Contextual History Enhancement for Improving Query Rewriting in Conversational Search [67.6] 我々は,オープンソースの大規模言語モデル(LLM)の機能を活用して,クエリ書き換え前の会話履歴の曖昧さを解消する2段階の手法であるCHIQを紹介する。
我々は、CHIQがほとんどの設定で最先端の結果をもたらす、よく確立された5つのベンチマークを実証する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:23:53 GMT)
TimeSiam: A Pre-Training Framework for Siamese Time-Series Modeling [67.0] 時系列事前トレーニングは、最近、ラベルのコストを削減し、下流の様々なタスクに利益をもたらす可能性があるとして、広く注目を集めている。
本稿では,シームズネットワークに基づく時系列の簡易かつ効果的な自己教師型事前学習フレームワークとしてTimeSiamを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:46:26 GMT)
HelmFluid: Learning Helmholtz Dynamics for Interpretable Fluid Prediction [66.4] HelmFluidは流体の正確かつ解釈可能な予測器である。
ヘルムホルツの定理に触発され、ヘルムホルツの力学を学ぶためにヘルム力学ブロックを設計する。
HelmDynamicsブロックをマルチスケールのマルチヘッド積分アーキテクチャに埋め込むことで、HelmFluidは学習したHelmholtzダイナミクスを複数の空間スケールで時間次元に沿って統合することができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:38:15 GMT)
R-Tuning: Instructing Large Language Models to Say `I Don't Know' [66.1] 大きな言語モデル(LLM)は、優れたパフォーマンスで多くのドメインに革命をもたらしたが、それでもその課題に直面している。
事前の指導チューニング方法は、モデルが知識を知っているかどうかに関わらず、モデルに文章を完成させるよう強制する。
我々はRefusal-Aware Instruction Tuning (R-Tuning)と呼ばれる新しいアプローチを提案する。
実験の結果、R-Tuningは、既知の質問に答えたり、未知の質問に答えるのを控えるモデルの能力を効果的に改善することを示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:46:36 GMT)
I2EDL: Interactive Instruction Error Detection and Localization [65.3] 連続環境(IVLN-CE)における対話型VLNの新たな課題を提案する。
これにより、VLN-CEナビゲーション中にエージェントがユーザと対話し、命令エラーに関する疑念を検証できる。
我々は、事前学習したモジュールを利用して命令エラーを検出し、テキスト入力と過去の観察を相互参照することで、命令中のそれらをピンポイントする。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:52:57 GMT)
Merging Multi-Task Models via Weight-Ensembling Mixture of Experts [64.9] 異なるタスクでトレーニングされたTransformerベースのモデルを単一の統一モデルにマージすることで、すべてのタスクを同時に実行できる。
従来の手法は、タスク演算によって例示され、効率的かつスケーラブルであることが証明されている。
本稿では,Transformer層をMoEモジュールにアップスケーリングしながら,ほとんどのパラメータをマージすることを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:06:52 GMT)
How Abilities in Large Language Models are Affected by Supervised Fine-tuning Data Composition [64.9] 本研究は, 教師付き微調整における数学的推論, コード生成, 一般人適応能力間のデータ合成の相互作用に着目した。
我々の実験では、異なる能力のスケールが異なり、より大きなモデルでは、通常、同じ量のデータで優れたパフォーマンスを示す。
その結果, 合成データの量は, 合成比よりも性能に影響を及ぼすことが示唆された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:51:08 GMT)
Vision+X: A Survey on Multimodal Learning in the Light of Data [64.0] 様々なソースからのデータを組み込んだマルチモーダル機械学習が,ますます普及している研究分野となっている。
我々は、視覚、音声、テキスト、動きなど、各データフォーマットの共通点と特異点を分析する。
本稿では,表現学習と下流アプリケーションレベルの両方から,マルチモーダル学習に関する既存の文献を考察する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:32:39 GMT)
Merging Facts, Crafting Fallacies: Evaluating the Contradictory Nature of Aggregated Factual Claims in Long-Form Generations [63.9] 大型言語モデル(LLM)からの長文生成には、事実と非事実のクレームが混在している。
Llama-chatのような強力なオープンソースモデルは、検証可能な事実を含む段落を生成することができるが、事実はエンティティの曖昧さのため、非現実的な段落にまとめられる。
我々は、曖昧なエンティティを持つコンテンツに特化して設計された拡張メトリックD-FActScoreを導入する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:28:40 GMT)
GTA: A Geometry-Aware Attention Mechanism for Multi-View Transformers [63.4] 既存の位置符号化方式は3次元視覚タスクに最適であると主張する。
トークンの幾何学的構造を相対変換として符号化する幾何学的注意機構を提案する。
我々は、Geometric Transform Attention (GTA) と呼ばれる、最先端のトランスフォーマーベースNVSモデルの学習効率と性能を向上させることに留意している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:47:50 GMT)
A Deep Dive into the Trade-Offs of Parameter-Efficient Preference Alignment Techniques [63.1] 大規模言語モデルは最初、数兆のトークンで事前訓練され、その後、特定の好みに合わせて命令調整または調整される。
我々は,3つの重要な軸に対する人気選択の影響を詳細に調査する。
300以上の実験にまたがるセットアップでは、一貫した傾向と予期せぬ結果が明らかになる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:25:51 GMT)
Hierarchical Augmentation and Distillation for Class Incremental Audio-Visual Video Recognition [62.9] 本稿では,CIAVVR(Class Incremental Audio-Visual Video Recognition)の探索に焦点をあてる。
記憶されたデータと過去のクラスの学習モデルの両方が歴史的知識を含んでいるため、過去のデータ知識と過去のモデル知識をキャプチャして破滅的な忘れを防げるかが課題である。
本稿では,階層拡張モジュール (HAM) と階層拡張モジュール (HDM) を組み合わせた階層拡張蒸留 (HAD) を導入し,データとモデルの階層構造を効率的に活用する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:50:18 GMT)
Regularizing with Pseudo-Negatives for Continual Self-Supervised Learning [62.4] 効果的な継続型自己教師型学習(CSSL)のためのPNR(Pseudo-Negative Regularization)フレームワークを提案する。
我々のPNRは,新たに学習した表現が過去の学習と矛盾しないように,モデルに基づく拡張によって得られた擬陰性情報を活用する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:06:48 GMT)
Byzantine Robustness and Partial Participation Can Be Achieved at Once: Just Clip Gradient Differences [61.7] 分散学習は、大規模な機械学習モデルをトレーニングするための主要なパラダイムとして登場した。
現実のシナリオでは、参加者は信頼できないか悪意があるかもしれない。
本稿では,クライアントサンプリングとビザンチン労働者への許容性を備えた最初の分散手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:31:13 GMT)
MAGDi: Structured Distillation of Multi-Agent Interaction Graphs Improves Reasoning in Smaller Language Models [61.5] 我々は,複数言語モデル (LLM) エージェント間の推論相互作用をより小さなLMに構造化した新しい蒸留法であるMAGDiを紹介する。
7つの広く使われているコモンセンスおよび数学推論ベンチマークの実験は、MAGDiがより小さなモデルの推論能力を改善することを示している。
我々は、MAGDiが領域外タスクの一般化性を高め、基礎となる学生モデルのサイズと強度に正にスケールし、自己整合性を適用する際により大きな改善をもたらすことを示すため、広範囲な分析を行った。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:13:16 GMT)
What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8] 我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:05:01 GMT)
CRAG -- Comprehensive RAG Benchmark [58.2] Retrieval-Augmented Generation (RAG) は、Large Language Model (LLM) の知識不足を緩和するための有望なソリューションとして最近登場した。
既存のRAGデータセットは、現実世界の質問回答(QA)タスクの多様性と動的な性質を適切に表現していない。
我々は,Webと知識グラフ(KG)検索をシミュレートする4,409組の質問応答ペアとモックAPIの実際の質問応答ベンチマークである包括的RAGベンチマーク(CRAG)を紹介した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:43:07 GMT)
MoE Jetpack: From Dense Checkpoints to Adaptive Mixture of Experts for Vision Tasks [58.1] MoEモデルをスクラッチからトレーニングするには、広範なデータと計算資源が必要である。
我々は,MoEモデルに高密度チェックポイントを微調整する有効な方法であるMoE Jetpackを紹介する。
本実験は,MoE Jetpackが収束速度と精度を大幅に向上することを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:05:42 GMT)
FusionBench: A Comprehensive Benchmark of Deep Model Fusion [58.0] ディープモデル融合(Deep Model fusion)とは、複数のディープニューラルネットワークの予測やパラメータを単一のモデルに統合する手法である。
FusionBenchは、ディープモデル融合に特化した最初の包括的なベンチマークである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:59:13 GMT)
Think out Loud: Emotion Deducing Explanation in Dialogues [57.9] 対話における感情推論(Emotion Deducing Explanation in Dialogues)を提案する。
EDENは感情と原因を明確な考え方で認識する。
大規模言語モデル(LLM)が感情や原因をよりよく認識するのに役立ちます。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:58:29 GMT)
MeLFusion: Synthesizing Music from Image and Language Cues using Diffusion Models [57.5] 私たちは、ミュージシャンが映画の脚本だけでなく、視覚化を通して音楽を作る方法にインスピレーションを受けています。
本稿では,テキスト記述と対応する画像からの手がかりを効果的に利用して音楽を合成するモデルであるMeLFusionを提案する。
音楽合成パイプラインに視覚情報を加えることで、生成した音楽の質が大幅に向上することを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:38:59 GMT)
WildBench: Benchmarking LLMs with Challenging Tasks from Real Users in the Wild [57.3] WildBenchは、大規模言語モデル(LLM)のベンチマーク用に設計された自動評価フレームワークである。
WildBenchは、100万以上の人間チャットボットの会話ログから慎重に選択された1,024のタスクで構成されている。
We have developed two metrics, WB-Reward and WB-Score which are computeable using Advanced LLMs。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:15:44 GMT)
InCharacter: Evaluating Personality Fidelity in Role-Playing Agents through Psychological Interviews [57.0] 本稿では, RPAの性格的忠実度を心理的尺度で評価するための新しい視点を紹介する。
実験には様々な種類の RPA と LLM が含まれ、14の広く使用されている心理学的尺度で32の異なる文字をカバーしている。
InCharacterでは、現在最先端のRPAが人物の人格と高度に一致した個性を示し、80.7%の精度を達成している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:24:53 GMT)
Language Guided Skill Discovery [56.8] 言語ガイドスキル発見(LGSD)を導入し,スキル間の意味的多様性を最大化する。
LGSDはユーザープロンプトを入力として取り、セマンティックなスキルのセットを出力する。
本研究は,LGSDにより,単にプロンプトを変更するだけで,手足のロボットが平面上の異なるユーザ意図のエリアを訪問できることを実証する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:25:38 GMT)
Towards Generalist Robot Learning from Internet Video: A Survey [56.6] 本稿では,強化学習(RL)とロボット工学の文脈におけるビデオ(LfV)からの学習方法の概要について述べる。
我々は、大規模なインターネットビデオデータセットにスケール可能な方法に焦点を当てる。
我々は、インターネットビデオの全範囲を活用できるスケーラブルな基盤モデルアプローチを提唱する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:25:42 GMT)
Improving Logits-based Detector without Logits from Black-box LLMs [56.2] 大規模言語モデル(LLM)はテキスト生成に革命をもたらし、人間の文章を忠実に模倣する出力を生成する。
我々は、ブラックボックステキスト検出における最先端性能を再定義する革新的なフレームワークであるDLD(Dis Distribution-Aligned LLMs Detection)を提案する。
DALDは、サロゲートモデルの分布を未知の目標LLMの分布と整合させ、高速モデルの反復に対する検出能力とレジリエンスを向上するように設計されている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:38:05 GMT)
Countrywide natural experiment reveals impact of built environment on physical activity [55.9] より歩行可能な建築環境は、人口全体の活動を増加させる可能性を秘めている。
歩行性の増加は、移動後の身体活動の著しい増加と関連している。
MVPA(Modrate-to-vigorous physical activity)は、様々な健康上の利益と結びついている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:11:17 GMT)
SMC++: Masked Learning of Unsupervised Video Semantic Compression [54.6] ビデオセマンティクスを特に保持するMasked Video Modeling (MVM) を利用した圧縮フレームワークを提案する。
MVMは、マスクされたパッチ予測タスクを通じて一般化可能なセマンティクスを学ぶのに熟練している。
また、簡単なテクスチャの詳細やビットコストの浪費、セマンティックノイズなど、意味のない情報をエンコードすることもできる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:06:40 GMT)
A Novel Cross-Perturbation for Single Domain Generalization [54.6] 単一ドメインの一般化は、モデルが単一のソースドメインでトレーニングされたときに未知のドメインに一般化する能力を高めることを目的としている。
トレーニングデータの限られた多様性は、ドメイン不変の特徴の学習を妨げ、結果として一般化性能を損なう。
トレーニングデータの多様性を高めるために,CPerbを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:22:54 GMT)
Dissecting Multimodality in VideoQA Transformer Models by Impairing Modality Fusion [54.3] VideoQA Transformerモデルは標準ベンチマークで競合性能を示す。
これらのモデルはビデオとテキストからリッチなマルチモーダル構造とダイナミックスを一緒に捉えていますか?
彼らはバイアスと刺激的な特徴を利用して高いスコアを達成していますか?
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:45:02 GMT)
Evaluating and Mitigating IP Infringement in Visual Generative AI [54.2] 最先端のビジュアル生成モデルは、知的財産権によって保護されたキャラクターと著しく類似したコンテンツを生成することができる。
これは、入力プロンプトが文字の名前を含む場合や、その特性に関する記述的な詳細を含む場合に発生する。
我々は、潜在的に侵害される可能性のあるコンテンツを特定し、IP侵害を防止するための修正された生成パラダイムを開発する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:14:18 GMT)
Follow-Your-Emoji: Fine-Controllable and Expressive Freestyle Portrait Animation [53.8] Follow-Your-Emojiは、ポートレートアニメーションのための拡散ベースのフレームワークである。
参照ポートレートとターゲットランドマークシーケンスを識別する。
本手法は,フリースタイルの肖像画の表現を制御できることを実証する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:57:36 GMT)
VITON-DiT: Learning In-the-Wild Video Try-On from Human Dance Videos via Diffusion Transformers [53.5] そこで本研究では,VITON-DiT という,Diton-DiT ベースのビデオトライオンフレームワークを提案する。
具体的には、VITON-DiTは、衣服抽出器、空間-テンポラル denoising DiT、アイデンティティ保存制御ネットから構成される。
また、トレーニング中のランダム選択戦略や、長いビデオ生成を容易にするために、推論時に補間自己回帰(IAR)技術を導入する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:02:10 GMT)
OFDM-Standard Compatible SC-NOFS Waveforms for Low-Latency and Jitter-Tolerance Industrial IoT Communications [53.4] この研究は、スペクトル的に効率的な不規則なSinc (irSinc) 整形法を提案し、1924年に従来のSincを再考した。
irSincは、誤差性能を犠牲にすることなくスペクトル効率が向上した信号を生成する。
我々の信号は、5G標準信号構成により、同じスペクトル帯域内で高速なデータ伝送を実現する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:20:30 GMT)
Diffusion posterior sampling for simulation-based inference in tall data settings [53.2] シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:07:50 GMT)
Grounding and Enhancing Grid-based Models for Neural Fields [52.6] 本稿では,グリッドモデルに関する理論的枠組みを紹介する。
このフレームワークは、これらのモデルの近似と一般化の挙動がグリッド接カーネル(GTK)によって決定されることを指摘している。
導入されたフレームワークは、Multiplicative Fourier Adaptive Grid(MulFAGrid)と呼ばれる新しいグリッドベースモデルの開発を動機付けている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:49:43 GMT)
Efficient Continual Finite-Sum Minimization [52.5] 連続有限サム最小化(continuous finite-sum minimization)と呼ばれる有限サム最小化の鍵となるツイストを提案する。
我々のアプローチは$mathcalO(n/epsilon)$ FOs that $mathrmStochasticGradientDescent$で大幅に改善されます。
また、$mathcalOleft(n/epsilonalpharight)$ complexity gradient for $alpha 1/4$という自然な一階法は存在しないことを証明し、この方法の第一階法がほぼ密であることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:26:31 GMT)
LocLLM: Exploiting Generalizable Human Keypoint Localization via Large Language Model [52.4] LocLLMはLarge-Language Modelベースのキーポイントローカライゼーションモデルである。
入力として画像とテキストの命令を受け取り、所望のキーポイント座標を出力する。
標準的な2D/3Dキーポイントローカライゼーションベンチマークでは顕著なパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:58:35 GMT)
Ring-A-Bell! How Reliable are Concept Removal Methods for Diffusion Models? [52.2] Ring-A-Bellは、T2I拡散モデルのためのモデルに依存しないレッドチームツールである。
これは、不適切なコンテンツの生成に対応する拡散モデルに対する問題的プロンプトを特定する。
この結果から,安全プロンプトベンチマークの操作により,既存の安全メカニズムを回避できると考えられるプロンプトを変換できることが示唆された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:48:59 GMT)
The Decisive Power of Indecision: Low-Variance Risk-Limiting Audits and Election Contestation via Marginal Mark Recording [51.8] リスクリミット監査(リスクリミット監査、RLA)は、大規模な選挙の結果を検証する技術である。
我々は、効率を改善し、統計力の進歩を提供する監査の新たなファミリーを定めている。
新しい監査は、複数の可能なマーク解釈を宣言できるように、キャストボイトレコードの標準概念を再考することで実現される。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:32:23 GMT)
Zero-Shot Video Editing through Adaptive Sliding Score Distillation [51.6] テキストベースのビデオ生成(T2V)は、制御可能なビデオ編集の研究に再び関心を寄せている。
本研究の目的は、スコアの蒸留に基づくロバストなビデオベースの編集パラダイムを探求することである。
具体的には、T2V監視の安定性を高めるだけでなく、グローバルおよびローカルなビデオガイダンスも取り入れた適応スライディングスコア蒸留戦略を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:33:59 GMT)
Stabilizing Extreme Q-learning by Maclaurin Expansion [51.0] エクストリームQ学習(XQL)では、Gumbel回帰を仮定したGumbel分布を用いて誤差分布を行う。
安定度を高めるため,Maclaurin Expanded Extreme Q-learningを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:43:17 GMT)
Split-and-Fit: Learning B-Reps via Structure-Aware Voronoi Partitioning [50.7] 本稿では,3次元CADモデルのバウンダリ表現(B-Reps)を取得する新しい手法を提案する。
各パーティション内に1つのプリミティブを導出するために空間分割を適用する。
我々のネットワークはニューラルなボロノイ図でNVD-Netと呼ばれ、訓練データからCADモデルのボロノイ分割を効果的に学習できることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:07:49 GMT)
Lean Workbook: A large-scale Lean problem set formalized from natural language math problems [50.2] 大規模な言語モデルは、リーンのような形式言語を使って証明する数学の定理が得意ではありません。
この領域で重要な課題は、これらの形式言語で利用可能なトレーニングデータの不足である。
本稿では,自然言語の数学的問題をリーン4文に変換するために,合成データを反復的に生成・フィルタリングするパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:12:21 GMT)
DIRECT-3D: Learning Direct Text-to-3D Generation on Massive Noisy 3D Data [50.2] テキストプロンプトから高品質な3Dアセットを作成するための拡散型3D生成モデルであるDIRECT-3Dを提案する。
我々のモデルは、広範に騒々しく不整合な3D資産で直接訓練されている。
単一クラス生成とテキスト・ツー・3D生成の両方で最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:44:43 GMT)
On the Identification of Temporally Causal Representation with Instantaneous Dependence [50.1] 時間的因果表現学習は時系列観測から潜在因果過程を特定することを目的としている。
ほとんどの方法は、潜在因果過程が即時関係を持たないという仮定を必要とする。
我々は,インスタントtextbfOus textbfLatent dynamics のための textbfIDentification フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:02:49 GMT)
"Here's Your Evidence": False Consensus in Public Twitter Discussions of COVID-19 Science [50.1] プリプリントサーバからの抽象化のサンプルに基づいて,科学的コンセンサスを推定する。
アンチ・コンセンサス(反合意)の投稿や利用者は、概してプロ・コンセンサス(反合意)の投稿ほど多くはないが、Twitter上では圧倒的に過剰に表現されている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:51:45 GMT)
GNNavi: Navigating the Information Flow in Large Language Models by Graph Neural Network [49.9] 大規模な言語モデル(LLM)は、デモによるプロンプトを使用すると、強いコンテキスト学習能力を示す。
プロンプトベースの微調整は、低データシナリオにおいて効果的な微調整法であることが証明されているが、計算資源に対する高い要求は、その実用性を制限する。
GNNaviはグラフニューラルネットワークレイヤを使用して、プロンプト処理中に情報フローの集約と分布を正確にガイドする。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:36:33 GMT)
Neural Plasticity-Inspired Multimodal Foundation Model for Earth Observation [48.7] 我々の新しいアプローチは、脳科学における神経可塑性の概念を活用する、ダイナミックワンフォーオール(DOFA)モデルを導入している。
このダイナミックなハイパーネットワークは、異なる波長に調整され、5つのセンサーのデータに基づいて1つの多目的トランスフォーマーを共同で訓練し、12の異なる地球観測タスクを遂行することを可能にする。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:30:51 GMT)
FRAPPE: A Group Fairness Framework for Post-Processing Everything [48.6] 本稿では,任意の正規化インプロセッシング手法をポストプロセッシング手法に変換するフレームワークを提案する。
理論的および実験を通して、我々のフレームワークは、内部処理で達成された優れた公正なエラートレードオフを保っていることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:24:03 GMT)
FedLLM-Bench: Realistic Benchmarks for Federated Learning of Large Language Models [48.5] フェデレートラーニングにより、複数のパーティがデータを直接共有することなく、協力的に大きな言語モデルをトレーニングできるようになった(FedLLM)。
現在、FedLLMの現実的なデータセットやベンチマークは存在しない。
我々は,8つのトレーニング手法,4つのトレーニングデータセット,6つの評価指標を含むFedLLM-Benchを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:19:30 GMT)
Robustness Assessment of Mathematical Reasoning in the Presence of Missing and Contradictory Conditions [48.3] 我々は、ミス・コントラクタリー条件(PMC)に関する問題というベンチマークを開発する。
本稿では,これらのシナリオにおける数ショットプロンプト手法の性能を評価するための2つの新しい指標を提案する。
SMT-LIB Prompting (SLP) と呼ばれる,SMT-LIB言語を用いて直接解決する代わりに,この問題をモデル化する手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:24:12 GMT)
Correlation Does Not Imply Compensation: Complexity and Irregularity in the Lexicon [48.0] 形態的不規則性と音韻的複雑性との間に正の相関が認められた。
また,単語長と形態的不規則性の負の関係の弱い証拠も見出した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:09:21 GMT)
CRiskEval: A Chinese Multi-Level Risk Evaluation Benchmark Dataset for Large Language Models [46.9] CRiskEvalは、大規模言語モデル(LLM)に固有のリスク確率を正確に計測するために設計された中国のデータセットである。
7種類のフロンティアリスクと4つの安全性レベルを持つ新たなリスク分類を定義する。
データセットは、事前に定義された7種類のフロンティアリスクに関連するシナリオをシミュレートする14,888の質問で構成されている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:52:24 GMT)
A Recover-then-Discriminate Framework for Robust Anomaly Detection [46.3] 異常検出(AD)は近年,幅広いシナリオで広く研究され,応用されている。
実用的なアプリケーションのためにADを作成するために、達成されたものと望ましいレベルの認識精度の間にはまだギャップがある。
本稿では,ADのための新しいRecover-then-Discriminate(ReDi)フレームワークを提案する。
ReDiは、自己生成された特徴マップと選択されたインプットイメージを明示的な入力情報として取り込んで、ケース1の問題を解決する。
同時に,検索した表現と入力表現の異常な差異を高めるために,特徴レベルの識別ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:34:16 GMT)
Towards Generating Executable Metamorphic Relations Using Large Language Models [46.3] 大規模言語モデル(LLM)を用いた要件から実行可能なMRを自動的に抽出する手法を提案する。
提案手法の有効性を評価するため,シーメンス・インダストリー・ソフトウェアと共同で質問紙調査を行った。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:10:22 GMT)
ProMotion: Prototypes As Motion Learners [46.1] 本稿では,基本動作タスクをモデル化するための統一プロトタイプフレームワークであるProMotionを紹介する。
ProMotionは、現在のタスク固有のパラダイムとは別の、魅力的な属性を提供する。
我々は,特徴記述器と原型学習器を併用して,動作の複雑さを解読する2つのメカニズムを生かした。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:10:33 GMT)
On the social bias of speech self-supervised models [45.8] SSLモデルの社会的バイアスは、差別的パターンを自動化し、不平等なシステムを補強することによって、不公平を永続することができる。
モデルアーキテクチャやサイズ,トレーニング方法論といったさまざまな要因が,これらのモデル内の社会的バイアスの伝播にどのように影響するかを考察する。
以上の結果から,行プルーニングやトレーニングなどの手法を用いることで,SSLモデル内の社会的バイアスを効果的に軽減できることがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:07:07 GMT)
Extroversion or Introversion? Controlling The Personality of Your Large Language Models [45.4] 大規模言語モデル(LLM)は、テキスト生成と理解において堅牢な能力を示し、人間の振る舞いを模倣し、合成された個性を示す。
現存する文献は、LLMの個性の起源と進化、および効果的な個性制御を無視している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:11:49 GMT)
SelfGoal: Your Language Agents Already Know How to Achieve High-level Goals [45.3] SelfGoalは、ハイレベルな目標を達成するための言語エージェントの能力を高めるために設計された、新しい自動アプローチである。
SelfGoalの中核的な概念は、高レベルの目標を適応的に、より実用的なサブゴールのツリー構造に分解することである。
実験の結果,SelfGoalは様々なタスクにおける言語エージェントの性能を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:32:03 GMT)
Accommodating Fabrication Defects on Floquet Codes with Minimal Hardware Requirements [45.0] フロケット符号は、ハードウェアの接続要件を減らし、優れたフォールトトレラント特性を提供する。
これは、現実的なハードウェア上でこのようなコードを実行する上で重要な、未調査の課題である。
広帯域な2次元フロケ符号に欠陥量子ビットを収容する新しい方法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:44:18 GMT)
LawGPT: A Chinese Legal Knowledge-Enhanced Large Language Model [44.7] 我々は,中国における法律の応用に特化して設計された,最初のオープンソースモデルであるLawGPTを紹介する。
LawGPTは2つの重要なコンポーネントで構成されている。
実験の結果,LawGPTはオープンソースのLLaMA 7Bモデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:52:56 GMT)
Dynamic Evaluation of Large Language Models by Meta Probing Agents [44.2] 大規模言語モデル(LLM)を評価するためのメタ・プロブリング・エージェント(MPA)を提案する。
MPAはDyVal 2の重要なコンポーネントであり、DyValcitepzhu2023dyvalを自然に拡張している。
MPAは、探索および判定エージェントを設計し、元の評価問題を心理測定理論に従って新しいものに自動的に変換する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:19:45 GMT)
MGIMM: Multi-Granularity Instruction Multimodal Model for Attribute-Guided Remote Sensing Image Detailed Description [44.0] 本稿では,リモートセンシング画像記述のための属性誘導型textbfMulti-Granularity Instruction Multimodal Model (MGIMM)を提案する。
MGIMMはマルチモーダルモデルで視覚領域と対応するテキスト属性の一貫性を学習する。
我々は,38,320個の領域属性対と23,463個の画像詳細記述対からなるデータセットを構築した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:53:14 GMT)
Seeing the Unseen: Visual Metaphor Captioning for Videos [43.5] 本稿では,VL(Vision-Language)タスクについて紹介する。
この作業を容易にするために,705の動画と2115の人書きキャプションでデータセットを構築し,リリースする。
また,提案課題における SoTA ビデオ言語モデルに匹敵する性能を持つ低リソースなビデオメタファキャプションシステム GIT-LLaVA を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:32:44 GMT)
CompeteAI: Understanding the Competition Dynamics in Large Language Model-based Agents [43.5] 大規模言語モデル(LLM)は、様々なタスクを完了させるエージェントとして広く使われている。
本稿ではエージェント間の競合を研究するための一般的な枠組みを提案する。
そして、GPT-4を用いて仮想街をシミュレートする現実的な競争環境を構築する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:13:27 GMT)
An Efficient Implicit Neural Representation Image Codec Based on Mixed Autoregressive Model for Low-Complexity Decoding [43.4] 画像圧縮のためのインプシットニューラル表現(INR)は、最先端のオートエンコーダモデルと比較して2つの重要な利点を提供する新興技術である。
我々は、現在のINRの復号時間を大幅に削減するために、新しいMixed AutoRegressive Model (MARM)を導入する。
MARMには提案したAutoRegressive Upsampler(ARU)ブロックが含まれている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:13:42 GMT)
ASPIRE: Language-Guided Data Augmentation for Improving Robustness Against Spurious Correlations [43.3] ASPIRE (Language-guided Data Augmentation for SPurious correlation Removal) は、スプリアスな特徴のない画像でトレーニングデータセットを補完するソリューションである。
トレーニングセットにグループラベルや既存の非スパースイメージを必要とせずに、非スパース画像を生成することができる。
先行手法の最悪のグループ分類精度を1%から38%向上させる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:47:40 GMT)
Superfiltering: Weak-to-Strong Data Filtering for Fast Instruction-Tuning [43.1] より小さく弱いモデルを使って、より大きくより強いモデルを微調整できるだろうか?
これにより、より小さく、より効率的なモデルを使用して、より大きな言語モデルをトレーニングするために使用される命令データをフィルタリングすることができる。
主にデータフィルタリングを高速化するだけでなく、フィルタリングされたデータ精細のLLMは、標準ベンチマークでさらにパフォーマンスが向上する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:28:36 GMT)
Enhancing Indoor Temperature Forecasting through Synthetic Data in Low-Data Environments [42.9] 合成データ生成のためのSoTA AI を用いたデータ拡張手法の有効性について検討する。
そこで本研究では,実データと合成データの融合戦略を探求し,予測モデルの改善を図る。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:36:31 GMT)
SpatialPIN: Enhancing Spatial Reasoning Capabilities of Vision-Language Models through Prompting and Interacting 3D Priors [42.9] 空間的視覚的質問応答(VQA)において、最先端の空間的推論強化VLMを訓練する
本研究では,VLMの空間的推論能力を高めるためのフレームワークであるSpatialPINを提案する。
我々の空間推論型VLMは、空間的VQAの様々な形態でうまく機能し、ピックやスタック、軌道計画といった下流ロボット作業に役立てることができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:03:53 GMT)
ConDiff: A Challenging Dataset for Neural Solvers of Partial Differential Equations [42.7] 本稿では,科学的機械学習のための新しいデータセットであるConDiffを紹介する。
ConDiffは、パラメトリック偏微分方程式(PDE)の多くの応用における基本的な問題である、様々な係数を持つ拡散方程式に焦点を当てている。
この種の問題は、学術的な関心事だけでなく、様々な環境・産業問題の記述の基礎にもなっている。
このようにして、ConDiffは、完全な合成と使いやすさを維持しながら、現実世界の問題とのギャップを短くする。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:35:14 GMT)
Generating Piano Practice Policy with a Gaussian Process [42.4] 本稿では,政策モデルが生み出す実践モードを選択することにより,学習プロセスを通じて学習者の指導を行うためのモデリングフレームワークを提案する。
提案したポリシーモデルは,実践セッション中に専門家と研究者のインタラクションを近似するために訓練される。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:27:07 GMT)
Variational Flow Matching for Graph Generation [42.4] 分類データのフローマッチング手法であるCatFlowを開発した。
CatFlowは実装が容易で、計算効率が良く、グラフ生成タスクで強い結果が得られる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:16:17 GMT)
Unbalanced penalization: A new approach to encode inequality constraints of combinatorial problems for quantum optimization algorithms [42.3] 余分なスラック変数を必要としない代替手法を提案する。
我々は,旅行セールスマン問題,ビン包装問題,ナプサック問題に対するアプローチを評価した。
この新しいアプローチは、リソースの少ない不等式制約の問題を解決するために使用できる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:52:05 GMT)
MA-AVT: Modality Alignment for Parameter-Efficient Audio-Visual Transformers [41.5] マルチモーダルなセマンティックな特徴に対して,深いモーダルアライメントを用いたパラメータ効率の高いオーディオ視覚変換器MA-AVTを提案する。
具体的には,2つのモダリティを凍結したモダリティシェード変圧器で整列するための共同一様・多モードトークン学習を導入する。
ユニモーダルエンコーダの出力から得られた粗い特徴のみを整列する以前の作業とは異なり、粗大から細小の階層的特徴を整列するブロックワイドコントラスト学習を導入する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:35:44 GMT)
CPLIP: Zero-Shot Learning for Histopathology with Comprehensive Vision-Language Alignment [40.8] CPLIPは、病理組織学における画像とテキストのアライメントを強化する新しい教師なし技術である。
複数の病理組織学的タスクで評価され、CPLIPはゼロショット学習シナリオにおいて顕著な改善を示した。
さらなる研究とレプリケーションを促進するため、CPLIPのコードはGitHubで入手できる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:39:58 GMT)
MEFT: Memory-Efficient Fine-Tuning through Sparse Adapter [40.6] 本稿では,大規模言語モデル (LLM) を大容量かつメモリ効率のよいアダプタで微調整する機構を提案する。
これは、LLMのFeed-Forward Networks(FFN)における固有のアクティベーション間隔を活用することで実現される。
我々は、不必要なCPU計算を緩和し、GPUとCPU間の通信量を削減するために、Mixture of Experts(MoE)のようなアーキテクチャを採用している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:49:22 GMT)
Multi-Label Requirements Classification with Large Taxonomies [40.6] 大規模ラベルによる多ラベル要求分類は、要求のトレーサビリティを補助するが、教師付きトレーニングでは違法にコストがかかる。
私たちは129の要件を,250から1183のクラスから769のラベルに関連付けました。
文ベース分類は単語ベース分類と比較して有意に高いリコール率を示した。
階層的な分類戦略は要求分類の性能を必ずしも改善しなかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:53:55 GMT)
Chat Vector: A Simple Approach to Equip LLMs with Instruction Following and Model Alignment in New Languages [40.4] 我々は、事前訓練された言語モデルに指示追従と人間の値アライメントを持たせるために、$textitchat vector$という概念を導入する。
連続的な事前訓練されたモデルの重み付けにチャットベクトルを追加するだけで、言語を必要とせずに、チャット機能をモデルに組み込むことができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:28:05 GMT)
POND: Multi-Source Time Series Domain Adaptation with Information-Aware Prompt Tuning [40.2] 時系列ドメイン適応は、多様なアプリケーションにおいて、重要かつ複雑な課題である。
POND(PrOmpt-based domaiN Discrimination)は,時系列ドメイン適応にプロンプトを利用する最初のフレームワークである。
提案するPONDモデルは,F1スコア上での最先端比較手法を最大66%向上させる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:42:45 GMT)
On Designing Multi-UAV aided Wireless Powered Dynamic Communication via Hierarchical Deep Reinforcement Learning [40.0] 複数の無人航空機(UAV)による無線電力通信網(WPCN)の新規設計を提案する。
従来の研究とは異なり、低電力無線ノード(WN)はコヒーレントな収穫-送信プロトコルによく準拠するが、提案したダブルベースWNタイプ更新ルールでは、各WNはEノードとしてWNタイプを動的かつ繰り返し更新することができる。
Tスロット上の全WNの送信データサイズを最大化するために、各UAVは、その軌跡とバイナリ無線エネルギー伝送(WET)決定を個別に決定する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:40:37 GMT)
Offline Training of Language Model Agents with Functions as Learnable Weights [39.9] LLM重みを変更することなくLLM(Large Language Models)エージェントを訓練する新しいパラダイムを提案する。
LLMを利用してエージェントの機能を更新し、ロールバックとアーリーストップという2つの戦略でエージェントトレーニングアルゴリズムを考案するエージェントを開発する。
広範囲な実験により、エージェント訓練パラダイムが代表的LLMエージェントの性能を大幅に改善できることが示される。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:49:18 GMT)
A Robust Mixed-Effects Bandit Algorithm for Assessing Mobile Health Interventions [39.8] DML-TS-NNR(DML-TS-NNR)は、モバイルヘルス介入のためのコンテキスト的帯域幅アルゴリズムである。
参加者の不均一性、非定常性、報酬の非線形性といった問題に対処する。
そこで本研究では,DML-TS-NNRアルゴリズムのシミュレーションおよび2つのオフ政治評価研究において,優れた性能を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:18:16 GMT)
Spectrum: Targeted Training on Signal to Noise Ratio [39.7] 本稿では,SNR(Signal-to-Noise ratio)に基づいた層モジュールを選択的に標的としたLCM学習を高速化するSpectrumを提案する。
トレーニング前のモジュールSNRの計算にアルゴリズムを用いる本手法では,GPUメモリ使用量を削減するとともに,フル微調整の性能を効果的に向上することを示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:20:57 GMT)
Selective Reflection-Tuning: Student-Selected Data Recycling for LLM Instruction-Tuning [39.7] 最近の多くの手法はデータ品質の改善に重点を置いているが、学生モデルとの互換性を見落としていることが多い。
本稿では,教師のLLMのリフレクションとイントロスペクションを相乗化して既存のデータ品質を改善する新パラダイムであるSelective Reflection-Tuningを紹介する。
この教師と学生の協調作業により、高品質で生徒互換の授業応答ペアが作成され、結果としてサンプル効率のよい指導チューニングがもたらされる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:23:21 GMT)
Adversarial Attacks and Defenses in Fault Detection and Diagnosis: A Comprehensive Benchmark on the Tennessee Eastman Process [39.7] 機械学習をACS(Automated Control Systems)に統合することで、産業プロセス管理における意思決定が促進される。
これらの技術を広く採用する際の制限の1つは、敵の攻撃に対するニューラルネットワークの脆弱性である。
本研究では、テネシー・イーストマン・プロセス・データセットを用いて、ACSにおける障害診断のためのディープラーニングモデルをデプロイする際の脅威について検討する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:36:17 GMT)
The Unmet Promise of Synthetic Training Images: Using Retrieved Real Images Performs Better [39.6] すべての合成画像は、最終的にジェネレータを訓練するために使用される上流データに由来する。
我々は, LAION-2Bから直接取得した目標実画像に対して, 安定拡散によって生成されたタスク関連ターゲット合成データを微調整と比較した。
解析の結果,このアンダーパフォーマンスは生成物と,合成画像中のタスク関連視覚的詳細が不正確なためであることが示唆された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:04:21 GMT)
Gull: A Generative Multifunctional Audio Codec [39.4] Gullは汎用的なニューラルオーディオ圧縮および圧縮モデルである。
鍵となるコンポーネントは、ユニバーサルサンプルレートモデリング、ゲインシェイプ表現、残留ベクトル量子化モジュール、弾性デコーダネットワークである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:03:30 GMT)
Boundary Discretization and Reliable Classification Network for Temporal Action Detection [39.2] 時間的アクション検出は、アクションカテゴリを認識し、各アクションインスタンスの開始と終了の時間を未トリミングビデオで決定することを目的としている。
混合手法は、アンカーベースとアンカーフリーのアプローチをシームレスにマージすることで、優れたパフォーマンスを実現している。
本稿では,境界離散化と信頼性のある分類モジュールを導入することで,上記の問題に対処する新しい境界離散化・信頼性分類ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:19:33 GMT)
Helpful or Harmful Data? Fine-tuning-free Shapley Attribution for Explaining Language Model Predictions [38.9] 実例スコアの符号にロバスト性の概念を提案する。
本稿では,例えば,Shapley値の高精度な微調整自由近似を導入する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:29:57 GMT)
Never-Ending Behavior-Cloning Agent for Robotic Manipulation [38.8] NBAgentは言語条件のNever-ending Behavior-cloning Agentである。
新しい3Dシーンセマンティクスとロボット操作スキルの観察知識を、スキル共有とスキル固有属性から学習する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:10:11 GMT)
Gradient Descent on Logistic Regression with Non-Separable Data and Large Step Sizes [38.6] 我々は,大きく,一定のステップサイズを持つロジスティック回帰問題における降下ダイナミクスについて検討した。
局所収束は臨界ステップサイズより小さい全てのステップサイズに対して保証されるが、大域収束は保証されない。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:53:06 GMT)
Transformers are Expressive, But Are They Expressive Enough for Regression? [38.4] この結果から,トランスフォーマーはスムーズな関数を確実に近似するのに苦労し,分割的に一定間隔の近似に頼っていることがわかった。
これらの課題に光を当てることで、トランスフォーマーの能力に関する洗練された理解を提唱する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:06:56 GMT)
Multiplane Prior Guided Few-Shot Aerial Scene Rendering [38.3] 低空域における多面体先導NeRF(MPNeRF)について紹介する。
MPNeRFは、非航空的文脈で適用された既存の最先端手法より優れている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:25:53 GMT)
Learning Optimal Contracts: How to Exploit Small Action Spaces [37.9] 本稿では、主目的が結果依存の支払い方式にコミットする主目的問題について検討する。
約最適契約を高い確率で学習するアルゴリズムを設計する。
また、関連するオンライン学習環境において、$tildemathcalO(T4/5)$ regret を提供するためにも使用できる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:08:10 GMT)
Global Rewards in Restless Multi-Armed Bandits [37.9] レストレス・マルチアーム・バンディット(RMAB)はマルチアーム・バンディットを拡張し、腕を引っ張って将来の状態に影響を及ぼす。
RMABの成功にもかかわらず、重要な制限の前提は、報酬を武器の合計に分離できることである。
我々は、RMABのグローバル非分離報酬への一般化である、グローバル報酬(RMAB-G)を用いたレスレスマルチアームバンディットを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:38:51 GMT)
You Only Look at Screens: Multimodal Chain-of-Action Agents [37.1] Auto-GUIは、インターフェースと直接対話するマルチモーダルソリューションである。
そこで本研究では,エージェントが実行すべきアクションを決定するためのチェーン・オブ・アクション手法を提案する。
我々は,30$Kのユニークな命令を持つ新しいデバイス制御ベンチマークAITWに対するアプローチを評価した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:52:29 GMT)
ChemReasoner: Heuristic Search over a Large Language Model's Knowledge Space using Quantum-Chemical Feedback [37.1] 新しい触媒の発見は、新しいより効率的な化学プロセスの設計に不可欠である。
量子化学に基づく3次元原子論表現からのフィードバックで言語推論を統一するAI誘導型計算スクリーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:33:21 GMT)
Continuous Geometry-Aware Graph Diffusion via Hyperbolic Neural PDE [36.5] 我々は、HPDE積分のための非ユークリッド多様体に対して、電場と流れ、勾配、発散、および拡散率の理論的原理を導入する。
本稿では,ハイパーボリックグラフ拡散方程式 (HGDE) を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:53:43 GMT)
Efficient multi-prompt evaluation of LLMs [36.5] PromptEvalは,多数のプロンプトに対して性能を推定する手法である。
PromptEvalは一貫して性能分布を推定し,その有効性を実証的に証明する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:24:13 GMT)
Provably Better Explanations with Optimized Aggregation of Feature Attributions [36.2] ポストホックな説明に特徴属性を使用することは、不透明な機械学習モデルの予測を理解し検証する一般的なプラクティスである。
本稿では,特徴属性の最適凸結合を導出する新たな手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:03:43 GMT)
Denoising-Aware Contrastive Learning for Noisy Time Series [36.0] 時系列自己教師型学習(SSL)は、ラベルへの依存を軽減するために事前トレーニングのためにラベル付きデータを活用することを目的としている。
本稿では,表現中の雑音を軽減し,各サンプルに対して適切な復調法を自動選択するDenoising-Aware contrastive Learning (DECL)を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:27:32 GMT)
SafeDecoding: Defending against Jailbreak Attacks via Safety-Aware Decoding [35.8] 我々は,大規模言語モデル(LLM)の安全性を意識したデコーディング戦略であるSafeDecodingを導入し,ユーザクエリに対する有用かつ無害な応答を生成する。
この結果から,SafeDecodingは,ユーザクエリに対する応答の利便性を損なうことなく,攻撃成功率やジェイルブレイク攻撃の有害性を著しく低下させることがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:25:04 GMT)
In-Context Freeze-Thaw Bayesian Optimization for Hyperparameter Optimization [35.7] フリーズソー型BOの新しいサロゲートであるFT-PFNを提案する。
FT-PFN(FT-PFN)は、トランスフォーマーのテキスト内学習能力を活用する事前データ対応ネットワーク(PFN)である。
新たな取得機構 (I-random) と組み合わせることで,ifBO法により新しい最先端性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:39:25 GMT)
Physics3D: Learning Physical Properties of 3D Gaussians via Video Diffusion [35.7] ビデオ拡散モデルを用いて3Dオブジェクトの様々な物理的特性を学習する新しい手法である textbfPhysics3D を提案する。
本手法では,粘弾性材料モデルに基づく高一般化物理シミュレーションシステムを設計する。
弾性材料とプラスチック材料の両方を用いて, 本手法の有効性を実証した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:30:11 GMT)
LinguAlchemy: Fusing Typological and Geographical Elements for Unseen Language Generalization [35.1] LinguAlchemyは,類型的,地理的,系統的特徴を網羅する様々な言語情報を組み込んだ正規化手法である。
我々のLinguAlchemyは低リソース言語におけるmBERTとXLM-Rの性能を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:22:27 GMT)
Mixture-of-Agents Enhances Large Language Model Capabilities [34.7] 我々は,Mixture-of-Agents(MoA)手法を用いて,多言語モデル(LLM)の総合的知識を活用する新しい手法を提案する。
提案手法では, 各層が複数のLLMエージェントから構成される層状MoAアーキテクチャを構築する。
MoAモデルは、AlpacaEval 2.0、MT-Bench、FLASKで、GPT-4 Omniを上回っている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:04:10 GMT)
ESR-NeRF: Emissive Source Reconstruction Using LDR Multi-view Images [34.6] 本稿では,ニューラルネットワークを学習可能な関数として活用し,レイトレーシング場を表現する新しいアプローチであるESR-NeRFを提案する。
提案手法は,DTUデータセット上の低CD測定値を達成するため,送信源のないシーンに適用性も拡張する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:20:00 GMT)
Quantum state preparation for a velocity field based on the spherical Clebsch wave function [34.5] 球状クレブシュ波動関数(SCWF)による与えられた速度場に対する量子状態の生成法を提案する。
変動量子アルゴリズムを用いて目標速度場をSCWFとその対応する離散量子状態に変換する。
我々の手法は、ソース、シンク、サドルポイントなどの重要な流れの特徴を捉えることができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:41:17 GMT)
Can LLMs Learn from Previous Mistakes? Investigating LLMs' Errors to Boost for Reasoning [34.3] textscCoTErrorSetは609,432の質問を持つ新しいベンチマークで、それぞれが正しい参照とエラー参照の両方で設計されている。
textbfSelf-rethinking guideing LLMsは、彼らが同じような間違いを犯したかどうかを再考するよう促している。
textbfMistakeチューニングは、正しい推論ドメインと間違った推論ドメインの両方でモデルを微調整する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:27:50 GMT)
Adaptively Learning to Select-Rank in Online Platforms [34.3] 本研究は、異種ユーザの候補プールからアイテムを適応的にランク付けすることの課題に対処する。
本研究では,多様なユーザの好みや項目位置の影響を考慮に入れたユーザ応答モデルを構築した。
シミュレーションと実世界の両方のデータセットで実施された実験は、アルゴリズムがベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:33:48 GMT)
Progressive Entropic Optimal Transport Solvers [33.8] 本稿では,計画図と輸送地図の両方を推定できる新しいEOT解法(ProgOT)を提案する。
我々は,ProgOTが標準解法よりも高速で堅牢な代替手段であることを示す実験的な証拠を提供する。
また、最適な輸送地図を推定するためのアプローチの統計的整合性も証明する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:33:08 GMT)
How to Strategize Human Content Creation in the Era of GenAI? [33.1] 我々は、GenAIと人間コントリビュータの動的競争について研究する。
人間とは異なり、GenAIのコンテンツは、時間とともに人間によってより多くのコンテンツが生成される場合にのみ改善される。
人間の最適な戦略を見つけるための時間的アルゴリズムが存在しないことを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:12:04 GMT)
Chain-of-History Reasoning for Temporal Knowledge Graph Forecasting [32.7] 時間的知識グラフ(TKG)予測は、与えられた履歴に基づいて将来の事実を予測することを目的としている。
最近のグラフベースのモデルでは、TKG内の構造情報の取得が優れているが、意味的理解能力は欠如している。
本稿では,高次歴史を段階的に探求する『歴史の連鎖』(CoH)推論を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:15:18 GMT)
Real-time Monocular Depth Estimation on Embedded Systems [32.4] 2つの効率的なRT-MonoDepthアーキテクチャとRT-MonoDepth-Sアーキテクチャを提案する。
RT-MonoDepthとRT-MonoDepth-SはNVIDIA Jetson Nanoで18.4&30.5 FPS、Jetson AGX Orinで253.0&364.1 FPSを達成した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:09:41 GMT)
Time-Series JEPA for Predictive Remote Control under Capacity-Limited Networks [31.4] 時系列共同埋め込み予測アーキテクチャ(TSEPA)とセマンティックアクターは、自己指導型学習を通じて訓練された。
本稿では,TSEPA(Time-Series Joint Embedding Predictive Architecture)と,自己指導型学習を通じて訓練された意味的アクターを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:35:15 GMT)
Can LLMs Speak For Diverse People? Tuning LLMs via Debate to Generate Controllable Controversial Statements [31.0] 我々は,ユーザがプロンプトで定義した引数をサポートする文を生成する際のLCMの制御性を向上させる。
我々は,LLMを微調整する新しい議論・チューニングパイプラインを開発し,議論を通じて得られた文を生成する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:19:09 GMT)
Emergent Word Order Universals from Cognitively-Motivated Language Models [30.7] 言語モデル(LM)を用いた計算シミュレーションによる語順普遍性の研究
実験の結果, タイプ的単語順序は, 認知学的に有意な偏見を持つLMによって推定される難易度が低い傾向を示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:21:47 GMT)
Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation [30.2] 本稿では,テキストからの映像生成の進化について論じる。まずMNISTの数値をアニメーション化し,ソラで物理世界をシミュレートする。
Soraが生成するビデオの欠点に関するレビューでは、ビデオ生成の様々な実現可能な側面において、より深い研究を求める声が浮き彫りになっている。
テキスト・ビデオ・ジェネレーションの研究は、まだ初期段階であり、学際的な研究コミュニティからの貢献が必要であると結論付けている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:40:07 GMT)
DiNeR: a Large Realistic Dataset for Evaluating Compositional Generalization [30.1] 本稿では,DiNeR(Dish NamE Recognition)タスクを提案する。
レシピの指導を受けると、モデルは料理、行動、フレーバーの様々な組み合わせからなる料理名を認識する必要がある。
我々のデータセットは3,811の料理と228,114のレシピで構成されており、アナフォラ、省略、曖昧さといった多くの言語現象を伴っている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:35:21 GMT)
Generative Explore-Exploit: Training-free Optimization of Generative Recommender Systems using LLM Optimizers [29.7] 生成レコメンデーションを最適化するためのトレーニング不要なアプローチを提案する。
本研究では,高いエンゲージメントを持つ生成アイテムを活用できるだけでなく,隠された集団の嗜好を積極的に探索し,発見できるジェネレーティブな探索・探索手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:41:59 GMT)
CLoG: Benchmarking Continual Learning of Image Generation Models [29.3] 本稿では,分類に基づくCLからCLoGへの移行を提唱する。
我々は,既存のCL手法,リプレイベース,正規化ベース,パラメータアイソレーションベースの3種類の手法を生成タスクに適用する。
我々のベンチマークと結果から、将来のCLoG手法の開発に有用な興味深い洞察が得られる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:12:29 GMT)
Boosting Large-scale Parallel Training Efficiency with C4: A Communication-Driven Approach [28.9] 本稿では,通信駆動型ソリューションであるC4を紹介する。
この機能を利用することで、C4は欠陥のあるコンポーネントを迅速に識別し、異常を迅速に分離し、タスクを再起動することができる。
C4は運用システム全体に広く実装されており、エラーによるオーバーヘッドを約30%削減し、実行時のパフォーマンスを約15%向上しています。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:58:35 GMT)
Sales Whisperer: A Human-Inconspicuous Attack on LLM Brand Recommendations [28.5] 大規模言語モデル(LLM)のユーザは、プロンプトを書くのに他人に依存しているかもしれない。
本稿では,ブランドレコメンデーションタスクにおいて,このようなプロンプトを使用するリスクを評価する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:54:55 GMT)
STAR: Skeleton-aware Text-based 4D Avatar Generation with In-Network Motion Retargeting [28.5] インネットワーク・モーション・リターゲティング(STAR)を用いたスケルトン対応テキストベース4次元アバター生成
提案したSTARは,テキスト記述とよく一致した鮮やかなアニメーションで高品質な4Dアバターを合成することができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:29:22 GMT)
Joint Spatial-Temporal Modeling and Contrastive Learning for Self-supervised Heart Rate Measurement [28.4] 本稿では,我々のチームであるHFUT-VUT(HFUT-VUT)による,自己監督型心拍数測定トラック1のソリューションについて紹介する。
目標は、ラベルなしの顔ビデオを用いた自己監督型心拍数生理学(HR)を開発することである。
提案手法は,テストデータセットのRMSEスコア8.85277を達成し,この課題のトラック1のbftext2位を確保した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:53:02 GMT)
More Victories, Less Cooperation: Assessing Cicero's Diplomacy Play [28.0] この研究は、シケロがコミュニケーションで成功する程度を理解することを目的としている。
我々は、人間とCiceroで2ダースものゲームを実行し、200時間以上の人間プレイヤーの競争を繰り広げた。
AIは人間のプレイヤーを常に上回ることができるが、AIとヒューマンのコミュニケーションは、騙しや説得が難しいため、依然として制限されている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:03:44 GMT)
The Factorization Curse: Which Tokens You Predict Underlie the Reversal Curse and More [27.7] 本研究では,学習中に遭遇した情報と異なる順序で探索した場合に,モデルが情報を思い出すことができない逆の呪文について検討する。
因子化の呪いは、一般的な大言語モデルで使われる次のトーケン予測目標の固有の失敗であることがわかった。
因子化に依存しない目的は、逆の呪いを著しく軽減し、知識記憶と計画能力の向上を示唆する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:00:37 GMT)
Semantic-Enhanced Relational Metric Learning for Recommender Systems [27.3] 近年,知識グラフの翻訳機構に触発された推薦コミュニティにおいて,計量学習手法が注目されている。
本稿では,推薦システムにおける問題に対処するためのセマンティック拡張メトリックラーニングフレームワークを提案する。
具体的には、まず、豊富な特徴とパーソナライズされたユーザー嗜好を含む対象レビューから意味信号を抽出する。
次に、抽出した意味信号を利用して、新しい回帰モデルを設計し、元の関係に基づくトレーニングプロセスの識別能力を向上させる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:54:50 GMT)
Winner-takes-all learners are geometry-aware conditional density estimators [27.2] 条件密度推定において,各学習者の魅力ある幾何学的特性を活用する方法を示す。
我々は、量子化と密度推定の両面から、新しい推定器の利点を理論的に確立する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:28:22 GMT)
Simplify Implant Depth Prediction as Video Grounding: A Texture Perceive Implant Depth Prediction Network [26.7] テクスチャ知覚インプラント深さ予測ネットワーク(TPNet)を開発した。
TPNetは、インプラント領域検出器(IRD)とインプラント深さ予測ネットワーク(IDPNet)から構成される。
大規模な歯科インプラントデータセットを用いた実験により,提案したTPNetは既存の方法よりも優れた性能を示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:24:04 GMT)
Balance Reward and Safety Optimization for Safe Reinforcement Learning: A Perspective of Gradient Manipulation [26.2] 探索中の報酬と安全の間のトレードオフを管理することは、大きな課題である。
本研究では,勾配操作の理論を活用することによって,この矛盾する関係に対処することを目的とする。
実験の結果,提案アルゴリズムは報酬のバランスと安全性の最適化の観点から,最先端のベースラインよりも優れていた。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:18:04 GMT)
LLavaGuard: VLM-based Safeguards for Vision Dataset Curation and Safety Assessment [26.1] VLMベースのセーフガードモデルのファミリーであるLlavaGuardを紹介します。
LlavaGuardは、ビジュアルコンテンツの安全性コンプライアンスを評価するための汎用的なフレームワークを提供する。
我々の実験は、複雑な実世界のアプリケーションにおけるLlavaGuardの機能を強調した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:44:32 GMT)
Higher-order Structure Based Anomaly Detection on Attributed Networks [25.9] 本稿では,高次構造に基づく異常検出(GUIDE)手法を提案する。
我々は属性オートエンコーダと構造オートエンコーダを利用してノード属性と高階構造を再構成する。
また、隣接ノードの重要性を評価するために、グラフ注意層を設計する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:02:50 GMT)
The Price of Implicit Bias in Adversarially Robust Generalization [25.9] 頑健な経験的リスク最小化(robust ERM)における最適化の暗黙バイアスについて検討する。
本研究では,ロバストEMMにおける最適化の暗黙バイアスがモデルのロバスト性に大きな影響を与えることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:44:37 GMT)
TimeSieve: Extracting Temporal Dynamics through Information Bottlenecks [25.9] 本稿では,時系列予測における課題に対処するため,革新的な時系列予測モデルであるTimeSieveを提案する。
提案手法では,ウェーブレット変換を用いて時系列データを前処理し,パラメータの追加を必要とせずにマルチスケール機能を効果的にキャプチャする。
本研究は,時系列予測における課題に対処するためのアプローチの有効性を検証した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:58:12 GMT)
CityCraft: A Real Crafter for 3D City Generation [25.8] CityCraftは、都市シーン生成の多様性と品質の両方を強化するために設計された革新的なフレームワークである。
提案手法は,まず拡散変圧器(DiT)モデルを用いて,多種かつ制御可能な2次元都市レイアウトを生成する。
生成したレイアウトと都市計画に基づいて,Blenderとアセット検索モジュールを用いて,正確なアセット配置とシーン構築を行う。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:49:00 GMT)
Varying Manifolds in Diffusion: From Time-varying Geometries to Visual Saliency [25.6] 前方拡散過程と逆生成過程が多様体上の一連の分布を構成する拡散モデルの幾何学的性質について検討する。
生成速度は画像成分の視覚的明瞭度などの直感的な視覚特性と高い相関性を示す。
本稿では,画像成分の生成速度を時間とともに推定し,生成曲線を導出する効率的かつ微分可能な手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:32:41 GMT)
DualTime: A Dual-Adapter Multimodal Language Model for Time Series Representation [25.5] 時系列表現のためのデュアル適応型マルチモーダル言語モデルであるDualTimeを提案する。
本手法は,教師なし設定と教師なし設定の両方において,最先端モデルよりも優れる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:34:28 GMT)
Active Prompting with Chain-of-Thought for Large Language Models [25.4] 本稿では,大規模言語モデルを異なるタスクに適応させる新しい手法であるActive-Promptを提案する。
不確実性に基づくアクティブラーニングの関連問題からアイデアを借用することにより、不確実性を特徴づける指標をいくつか導入する。
実験により,提案手法の優位性を実証し,8つの複雑な推論タスクの最先端化を図った。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:51:25 GMT)
Contrastive explainable clustering with differential privacy [25.2] 本稿では,クラスタリング手法における差分プライバシーと対照的な説明を統合することを目的とした,説明可能なAI(XAI)の新たなアプローチを提案する。
例えば$k$-medianや$k$-meansなど、いくつかの基本的なクラスタリング問題に対して、効率的な差分的対照的な説明を与える。
各対照的なシナリオでは、特定のデータポイントを固定されたセントロイド位置として指定し、この制約が差分プライバシー下でのクラスタリングユーティリティに与える影響を測定する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:37:36 GMT)
Unveiling the Tapestry of Consistency in Large Vision-Language Models [25.1] 本研究では,プロンプトの解空間が知識点を中心に回転する際に,大規模視覚言語モデル(LVLM)がどのように機能するかを検討する。
ConBenchツールに基づいて、タペストリーを最初に公開し、以下の結果を得た。
我々は,本論文が研究コミュニティのモデル評価を加速し,一貫性領域の今後の進歩を促進することを願っている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:21:57 GMT)
Robust Reward Design for Markov Decision Processes [25.1] 報酬設計に対する現在のアプローチは、フォロワーが報酬修正にどう反応するかの正確なモデルに依存しています。
従者モデリングにおける不確実性に対する堅牢性を提供するソリューションを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:01:45 GMT)
Predicting Polymer Properties Based on Multimodal Multitask Pretraining [25.0] MMPolymerは、ポリマー1Dシーケンシャル情報と3D構造情報の両方を組み込んだ新しいマルチタスク事前学習フレームワークである。
MMPolymerは様々なポリマー特性予測タスクにおいて最先端の性能を達成する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:19:59 GMT)
DiffusionPID: Interpreting Diffusion via Partial Information Decomposition [24.8] 入力テキストプロンプトを基本成分に分解するために,情報理論の原理を適用した。
個々のトークンとその相互作用が生成した画像をどのように形成するかを分析する。
PIDはテキスト・画像拡散モデルの評価と診断のための強力なツールであることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:17:17 GMT)
3DRealCar: An In-the-wild RGB-D Car Dataset with 360-degree Views [24.4] 3D車は一般的に、自動運転システム、バーチャル/拡張現実、ゲームで使われている。
既存の3Dカーデータセットは、合成または低品質のどちらかであり、高品質の現実世界の3Dカーデータセットに対する大きなギャップを示している。
3DRealCarと呼ばれる,3つの特徴を備えた,最初の大規模3D実車データセットを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:14:27 GMT)
The Probabilities Also Matter: A More Faithful Metric for Faithfulness of Free-Text Explanations in Large Language Models [24.1] 本稿では,インプット介入に基づく信頼度テストに使用できる指標である相関説明忠実度(CEF)について紹介する。
我々の測定基準は、モデルが予測するラベル分布の総シフトを考慮に入れている。
次に, 相関対実テスト(CCT)を導入し, 相関対実テスト(CEF)をインスタンス化する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:54:44 GMT)
ComplexTempQA: A Large-Scale Dataset for Complex Temporal Question Answering [24.0] ComplexTempQAは、1億以上の質問応答ペアからなる大規模なデータセットである。
このデータセットは、20年以上にわたる質問をカバーし、未一致のトピックを提供している。
質問を属性、比較、カウントする質問に分類するユニークな分類法を導入する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:01:59 GMT)
REP: Resource-Efficient Prompting for On-device Continual Learning [23.9] オンデバイス連続学習(CL)は、モデル精度と資源効率の協調最適化を実践するために必要である。
CNNベースのCLは資源効率に優れており、ViTベースのCLはモデル性能に優れていると一般的に信じられている。
本稿では,プロンプトベースのリハーサルフリー手法を特化して資源効率を向上させるREPを紹介する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:17:33 GMT)
Towards a theory of out-of-distribution learning [23.9] 本稿では,PAC学習フレームワークを用いて,異なる学習課題を定義するための時系列的アプローチを提案する。
まずは流通学習から始め、最近提案された生涯学習や継続学習へと進む。
この研究によって、さまざまなタイプの学習を定量化する、普遍的に合意されたアプローチがもたらされることを期待しています。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:24:36 GMT)
Linearization Turns Neural Operators into Function-Valued Gaussian Processes [23.9] ニューラル作用素におけるベイズの不確かさを近似する新しい枠組みを導入する。
我々の手法は関数型プログラミングからカリー化の概念の確率論的類似体と解釈できる。
我々は、異なるタイプの偏微分方程式への応用を通して、我々のアプローチの有効性を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:43:54 GMT)
The Impact of Demonstrations on Multilingual In-Context Learning: A Multidimensional Analysis [23.8] インコンテキスト学習(In-context learning)は、大規模言語モデルがいくつかのラベル付きデモを使用してタスクを解く一般的な推論戦略である。
実演の有効性は, モデル, タスク, 言語によって大きく異なることを示す。
また,Llama 2-Chat,GPT-3.5,GPT-4といった強力な命令追従モデルは,実演の質にはほとんど敏感でないことがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:44:07 GMT)
Large Language Model-guided Document Selection [23.7] 大規模言語モデル(LLM)の事前学習は、ますます増加する計算予算を消費する。
近年の研究では、ドキュメントの選択がFLOPのごく一部で同等のモデル品質を実現することが実証されている。
拡張性のある汎用ドメイン文書選択のための有望な方向を探究する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:52:46 GMT)
Scaling up Probabilistic PDE Simulators with Structured Volumetric Information [23.7] 本稿では,一般的な有限体積法と相補的数値線形代数法を組み合わせた離散化手法を提案する。
時相津波シミュレーションを含む実験では、従来のコロケーションに基づく手法よりも、このアプローチのスケーリング挙動が大幅に改善された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:38:27 GMT)
Augmentation-based Unsupervised Cross-Domain Functional MRI Adaptation for Major Depressive Disorder Identification [23.6] メジャー・うつ病(Major depressive disorder、MDD)は、一般的に人の気分、認知、行動、身体的健康に影響を及ぼす一般的な精神障害である。
本研究では,MDDの自動診断のための拡張型非教師付きクロスドメインfMRI適応フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:03:00 GMT)
LinkGPT: Teaching Large Language Models To Predict Missing Links [23.6] 大規模言語モデル(LLM)は、様々な言語やビジョンタスクにおいて有望な結果を示している。
近年、グラフベースのタスク、特にテキスト分散グラフ(TAG)にLLMを適用することへの関心が高まっている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:54:36 GMT)
LLMs as Narcissistic Evaluators: When Ego Inflates Evaluation Scores [23.6] 本研究は,LMに基づく評価指標が,要約タスクの文脈において,それぞれの基盤となるLMに対して有利なバイアスを示すかどうかを考察する。
以上の結果から, 金のサマリーを活用せずに, 基準のない手法で評価指標を用いた場合, 特に有意なバイアスがみられた。
これらの結果は、生成的評価モデルによって提供される評価は、本質的なテキスト品質を超える要因に影響される可能性があることを裏付けている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:41:36 GMT)
ChaosBench: A Multi-Channel, Physics-Based Benchmark for Subseasonal-to-Seasonal Climate Prediction [23.1] 本稿では,データ駆動型気象エミュレータの予測可能性範囲をS2Sタイムスケールに拡張するChaosBenchを提案する。
ChaosBench は、海、氷、土地の再分析生成物を含む、典型的な大気圏 ERA5 以外の変数で構成されている。
我々は、4つの国家気象機関による物理ベースの予測を、我々のデータ駆動の予測のベースラインとして評価した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:42:47 GMT)
Epistemic Exploration for Generalizable Planning and Learning in Non-Stationary Settings [23.0] 本稿では,非定常環境における継続計画とモデル学習のための新しいアプローチを提案する。
提案したフレームワークは、エージェントの現在の知識状態のギャップをモデル化し、焦点を絞った調査を行うためにそれらを使用する。
いくつかの非定常ベンチマーク領域での実証的な評価は、このアプローチがサンプルの複雑さの観点からプランニングとRLベースラインを著しく上回っていることを示している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:21:18 GMT)
When and How: Learning Identifiable Latent States for Nonstationary Time Series Forecasting [22.9] 識別可能なlatEnt stAtes (IDEA) を学習し、分布シフトの発生を検知する。
さらに、定常状態と非定常状態とを十分な観測仮定で切り離して、潜在状態がどのように変化するかを学ぶ。
これらの理論に基づいて,自己回帰型隠れマルコフモデルを用いて潜伏環境を推定するIDEAモデルを考案した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:11:31 GMT)
TCMD: A Traditional Chinese Medicine QA Dataset for Evaluating Large Language Models [22.8] 従来の中国医学検査課題を解くための大規模な手動指導を含む,新しいQAデータセットを提案する。
TCMDは、注釈付き医療科目で、さまざまな領域にまたがって大量の質問を集めています。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:48:15 GMT)
Hints-In-Browser: Benchmarking Language Models for Programming Feedback Generation [22.5] 品質、コスト、時間、データのプライバシなど、いくつかのパフォーマンス基準で、プログラミングフィードバック生成のための言語モデルをベンチマークします。
我々は,GPT-4生成合成データに基づく微調整パイプラインを開発した。
WebLLMのブラウザ内推論エンジンを用いた微調整Llama3-8BとPhi3-3.8B 4ビット量子化モデルの有効性を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:22:51 GMT)
WaveCoder: Widespread And Versatile Enhancement For Code Large Language Models By Instruction Tuning [22.4] We present WaveCoder, a series of Code LLMs training with Widespread And Versatile Enhanced instruction data。
複雑なコード関連タスクに対処するために,オープンソースのコードデータセットから多種多様な高品質の命令データを安定して生成する手法を提案する。
実験により、WaveCoderモデルは、異なるコード関連タスク間の一般化能力において、他のオープンソースモデルよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:46:28 GMT)
EGOR: Efficient Generated Objects Replay for incremental object detection [22.4] インクリメンタルオブジェクト検出は、古いクラスの精度を同時に維持し、インクリメンタルデータで新しいクラスのオブジェクトを検出することを目的としている。
既存の蒸留法では、未ラベルの古いオブジェクトがインクリメンタルデータセットに存在しない場合、性能が低下する。
本稿では,この問題を解決するために,効率的な生成オブジェクト再生(EGOR)を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:54:40 GMT)
Labeled Data Selection for Category Discovery [22.2] カテゴリー発見手法は、ラベルのない視覚データに新しいカテゴリを見つけることを目的としている。
ラベル付けされた集合に存在するカテゴリを変更することは、ラベル付けされていない集合で最終的に発見されるものに大きな影響を与える。
本稿では,ラベル付きデータとラベルなしデータとの類似性に基づいて,最適なラベル付きデータを自動的に選択する2つの新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:45:30 GMT)
GeoGen: Geometry-Aware Generative Modeling via Signed Distance Functions [22.1] 単一ビューコレクションから3次元形状と画像を合成するための新しい生成手法を提案する。
ニューラルラディアンス場を用いたボリュームレンダリングを用いることで、生成した幾何学はノイズが多く、制約がないという重要な制限を継承する。
エンド・ツー・エンドで訓練された新しいSDFベースの3D生成モデルであるGeoGenを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:28:15 GMT)
3D-GRAND: Towards Better Grounding and Less Hallucination for 3D-LLMs [22.0] 3D-GRANDは、40,087の世帯シーンと6.2百万の密集したシーン言語命令を組み合わせた、先駆的な大規模データセットである。
この結果から, 3D-GRANDによる指導指導はグラウンド化能力を大幅に向上させ, 3D-LLMの幻覚を低減させることがわかった。
コントリビューションの一環として、3D-LLMの幻覚を体系的に評価するための総合的なベンチマーク3D-POPEを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:59:59 GMT)
Layerwise Proximal Replay: A Proximal Point Method for Online Continual Learning [22.0] オンライン連続学習では、ニューラルネットワークは非i.d.データストリームから漸進的に学習する。
経験的なリプレイでトレーニングされたニューラルネットワークは、不安定な最適化軌道を持つ傾向があります。
本稿では、新しいデータと再生データからの学習のバランスを保ちながら、過去のデータの隠れたアクティベーションの段階的変化を許容するLayerwise Proximal Replay(LPR)を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:51:12 GMT)
A Simple Approach to Differentiable Rendering of SDFs [22.0] SDF(Signed Distance Fields)で表される表面の微分可能レンダリングのための簡単なアルゴリズムを提案する。
本手法は,下面がSDFで表される場合のサンプリングが容易な細い帯域に低次元境界積分を拡大する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:31:20 GMT)
OCDB: Revisiting Causal Discovery with a Comprehensive Benchmark and Evaluation Framework [21.9] 因果発見は透明性と信頼性を改善するための有望なアプローチを提供する。
本稿では,因果構造と因果効果の違いを評価するための指標を用いたフレキシブルな評価フレームワークを提案する。
実データに基づくOpen Causal Discovery Benchmark (OCDB)を導入し、公正な比較を促進し、アルゴリズムの最適化を促進する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:09:22 GMT)
Rethinking the Starting Point: Collaborative Pre-Training for Federated Downstream Tasks [21.8] CoPreFLはモデルに依存しないメタラーニング(MAML)プロシージャで、異種および目に見えないFLシナリオを忠実に模倣するようにグローバルモデルを調整する。
当社のMAML手順では,パフォーマンスの分散をメタオブジェクト関数に組み込んで,クライアント間でパフォーマンスのバランスをとる。
我々は,任意の下流FLタスク間の平均精度と分散の両面で,CoPreFLが大幅に改善されることを実証した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:58:10 GMT)
Rich Semantic Knowledge Enhanced Large Language Models for Few-shot Chinese Spell Checking [21.8] 本稿では,RS-LLM (Rich Semantic based LLMs) というコンテキスト内学習手法を用いて,大規模言語モデル (LLM) を基礎モデルとして導入する。
少数の中国固有のリッチなセマンティック構造を導入することで、LCMは、数ショットのCSCタスクにおいてBERTベースのモデルよりも優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:41:58 GMT)
Interpretable Multimodal Out-of-context Detection with Soft Logic Regularization [21.8] LOGRANと呼ばれるコンテキスト外検出のための論理正規化手法を提案する。
LOGRANの主な目的は、フレーズレベルでのアウト・オブ・コンテクスト検出を分解することである。
我々は、NewsCLIPpingsデータセット上でのLOGRANの性能を評価し、競合する総合的な結果を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:57:25 GMT)
SC2: Towards Enhancing Content Preservation and Style Consistency in Long Text Style Transfer [21.7] テキストスタイル転送(TST)は、セマンティックコンテンツを保存しながら、テキストのスタイルの極性を変えることを目的としている。
Joint Style-Content Weighed (JSCW)モジュールとStyle Consistency Losは、この2つの問題に対処するために設計されている。
本研究は多種多様な実験を行い, 競争ベースラインよりもSC2が有意に向上したことを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:43:07 GMT)
NoisyGL: A Comprehensive Benchmark for Graph Neural Networks under Label Noise [21.7] グラフニューラルネットワーク(GNN)は、メッセージパッシング機構を通じてノード分類タスクにおいて強力なポテンシャルを示す。
ラベルノイズは実世界のグラフデータによく見られ、トレーニング中に誤った情報を伝播することでGNNに悪影響を及ぼす。
ラベルノイズ下でのグラフニューラルネットワークの総合ベンチマークであるNoisyGLを紹介する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:09:35 GMT)
PQPP: A Joint Benchmark for Text-to-Image Prompt and Query Performance Prediction [21.6] 10Kクエリからなる共同テキスト・画像プロンプトとクエリ性能予測のための最初のベンチマークを提案する。
本稿では, 先進・後進・後進・後進の予測器を用いて, 今後の研究の競争基盤となる性能予測器について述べる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:46:19 GMT)
CodeR: Issue Resolving with Multi-Agent and Task Graphs [21.5] GitHubの問題解決は、アカデミックや業界から大きな注目を集めている。
SWEベンチは問題解決における性能を測定するために提案されている。
マルチエージェントフレームワークと事前に定義されたタスクグラフを採用して,報告されたバグの修復と解決を行い,コードリポジトリに新機能を追加するCodeRを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:52:24 GMT)
Probabilistic Graph Rewiring via Virtual Nodes [21.3] メッセージパッシンググラフニューラルネットワーク(MPNN)は、グラフベースの機械学習の強力なパラダイムとして登場した。
MPNNは、受信フィールドの制限や構造的ボトルネックが、グラフ内の情報フローを妨げている、アンダーリーチ(low-reaching)やオーバースキャッシング(over-squashing)といった課題に直面している。
本稿では,暗黙的にメッセージパッシングニューラルネットワーク(IPR-MPNN)を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:40:44 GMT)
PatchSVD: A Non-uniform SVD-based Image Compression Algorithm [20.9] そこで本研究では,Singular Value Decomposition (SVD) アルゴリズムに基づいて,PatchSVDと呼ばれる領域ベースの損失画像圧縮手法を提案する。
PatchSVDは,3つの画像圧縮指標に対して,SVDに基づく画像圧縮よりも優れることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:57:40 GMT)
Resisting Stochastic Risks in Diffusion Planners with the Trajectory Aggregation Tree [20.9] トラジェクトリー・アグリゲーション・ツリー(TAT)は、歴史的および現在のトラジェクトリーに基づく動的ツリーのような構造である。
TATは、拡散プランナーの元々のトレーニングやサンプリングパイプラインを変更することなく、デプロイできる。
以上の結果から,信頼できない軌道からのリスクに抵抗し,100ドル以上の作業で拡散プランナーの性能向上を保証し,試料品質に対する許容許容限界を示し,3倍以上の加速で計画が可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:27:03 GMT)
Logic Synthesis with Generative Deep Neural Networks [20.8] 我々は、Circuit Transformerモデルに基づく論理合成書き換え演算子「ctrw」(Circuit Transformer Rewriting)を導入する。
本稿では,論理学に適した回路変換器の2段階学習方式を提案する。
我々はまた、Circuit Transformerと最先端の書き直し技術を統合してスケーラビリティの問題に対処し、DAG対応の書き直しをガイドできるようにする。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:16:40 GMT)
Confidence-aware Contrastive Learning for Selective Classification [20.6] この研究は、選択分類のための一般化を提供し、特徴層を最適化することで選択分類の性能を向上させることを開示する。
この理論に触発されて、我々は初めて特徴レベルで選択的分類モデルを明確に改善することを提案し、新たに選択的分類のための信頼を意識したコントラスト学習手法であるCCL-SCを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:43:53 GMT)
Online Continual Learning of Video Diffusion Models From a Single Video Stream [20.5] 拡散モデルは、現実的なビデオを生成するのに例外的な能力を示している。
本研究は,セマンティックな連続ビデオストリームから拡散モデルのトレーニングの実現可能性について検討する。
拡散モデルは、経験的リプレイを用いてオンラインで効果的にトレーニングできることを示し、i.d.サンプルを用いて訓練されたモデルに匹敵する性能を達成する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:32:23 GMT)
Parameter Efficient Quasi-Orthogonal Fine-Tuning via Givens Rotation [20.5] 微調整法の代表行は直交微調整(OFT)である。
OFTはパラメータ空間内の角距離を厳格に保存し、事前訓練された知識を保存する。
この問題に対処するため、準ギヴンズ直交微調整(qGOFT)を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:54:01 GMT)
Prototype Correlation Matching and Class-Relation Reasoning for Few-Shot Medical Image Segmentation [20.2] 本稿では,アンダーラインテキストbfPrototype相関とアンダーラインテキストbfClass-relationアンダーラインテキストbfReasoning(textbfPMCR)モデルを提案する。
提案モデルは,大規模なクラス内変動に起因する偽画素相関マッチングを効果的に緩和することができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:23:36 GMT)
CoMoFusion: Fast and High-quality Fusion of Infrared and Visible Image with Consistency Model [20.0] 現在の生成モデルに基づく融合法は、しばしば不安定なトレーニングと遅い推論速度に悩まされる。
CoMoFusionは高品質な画像を生成し、高速な画像推論速度を実現する。
また、融合した画像のテクスチャや鮮やかな情報を高めるために、画素値選択に基づく新規な損失も設計する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:58:18 GMT)
Semantic Segmentation on VSPW Dataset through Masked Video Consistency [19.9] PVUWコンペティションのソリューションとして,既存のモデルに基づくマスク付きビデオ(MVC)を紹介する。
MVCは、パッチが保持されないマスキングランダムフレームの予測間の一貫性を強制する。
VSPWデータセットでは,PVUW2024 VSSトラックの2位で67% mIoU性能を達成した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:41:24 GMT)
Diffusion Models for Accurate Channel Distribution Generation [19.8] 強力な生成モデルはチャネル分布を正確に学習することができる。
これにより、チャネルの物理的測定の繰り返しコストを削減できる。
結果として得られる差別化チャネルモデルは、勾配ベースの最適化を可能にすることにより、ニューラルエンコーダのトレーニングをサポートする。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:30:35 GMT)
S$^2$GSL: Incorporating Segment to Syntactic Enhanced Graph Structure Learning for Aspect-based Sentiment Analysis [19.7] ABSAのための構文強化グラフ構造学習にセグメンテーションを取り入れた2$GSLを提案する。
S$2$GSLはセグメント対応セマンティックグラフ学習と構文ベースの潜在グラフ学習を備えている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:32:50 GMT)
Enhanced Language Model Truthfulness with Learnable Intervention and Uncertainty Expression [19.7] 大きな言語モデル(LLM)は長文で一貫性のあるテキストを生成することができるが、事実を幻覚させることが多い。
真性最適化のための学習可能なインターベンション手法であるLITOを提案する。
複数のLLMと質問応答データセットの実験は、LITOがタスク精度を維持しながら真理性を改善することを示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:41:15 GMT)
MDViT: Multi-domain Vision Transformer for Small Medical Image Segmentation Datasets [19.4] 医用画像セグメンテーション(MIS)を改善するための有望なソリューションとして、ビジョントランスフォーマー(ViT)が登場した。
ViTは通常、単一のデータソースを使用してトレーニングされ、他の利用可能なデータセットから活用できる貴重な知識を見落としている。
本稿では,データハンガーを緩和し,NKTと戦うドメインアダプタを含む,最初のマルチドメイン ViT である MDViT を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:44:54 GMT)
IAPT: Instruction-Aware Prompt Tuning for Large Language Models [19.4] ソフトトークンを4つしか必要としない新しいプロンプトチューニング手法である命令認識型プロンプトチューニング(IAPT)を提案する。
まず,各トランスフォーマー層にパラメータ効率の良いソフトプロンプト生成器を設置し,各入力命令に対して慣用的なソフトプロンプトを生成する。
第2に、ソフトプロンプトジェネレータは、自己アテンションプーリング操作、2つのリニアプロジェクション、およびアクティベーション関数からなるボトルネックアーキテクチャを持つモジュールである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:41:18 GMT)
XL-HeadTags: Leveraging Multimodal Retrieval Augmentation for the Multilingual Generation of News Headlines and Tags [19.1] 見出しとエンティティ(トピック)タグは、読者にコンテンツが彼らの時間に値するかどうかを判断するために不可欠である。
記事に埋め込まれた画像やキャプションなどの補助情報を利用して関連文の検索を行う。
我々はXL-HeadTagsというデータセットをコンパイルした。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:58:45 GMT)
Scaling Automatic Extraction of Pseudocode [19.1] 学術論文の擬似コードは、そこで実装されたアルゴリズムを簡潔に表現する方法を提供する。
我々はarXiv論文から約32万の擬似コード例を抽出し,大規模な擬似コードコレクションを作成している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:39:17 GMT)
Adapting Open-Source Large Language Models for Cost-Effective, Expert-Level Clinical Note Generation with On-Policy Reinforcement Learning [19.1] 本研究では,オープンソースのLLaMA-213億パラメータモデルに対する包括的ドメイン・タスク特化プロセスを提案する。
教師モデルとしてGemini 1.0 Proを用いて、政治強化学習を行うための新しいアプローチであるDistillDirectを導入する。
我々のモデルであるLLaMA-Clinicは、医師が作成したものと同等の品質の臨床メモを生成することができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:59:52 GMT)
3rd Place Solution for PVUW Challenge 2024: Video Panoptic Segmentation [19.1] 追加の手法によって補足されたクエリワイドアンサンブルを中心にした包括的アプローチを導入する。
提案手法はVIPSegテストセットのVPQスコア57.01を達成し,第3回Pixelレベルビデオ理解チャレンジのVPSトラックで3位にランクインした。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:50:38 GMT)
Decomposition for Enhancing Attention: Improving LLM-based Text-to-SQL through Workflow Paradigm [19.1] 大規模言語モデル(LLM)の文脈内学習は自然言語処理の分野で大きな成功を収めている。
ケーススタディでは、一段階のチェーン・オブ・シントアプローチが、テキスト・トゥ・コレクションのような複雑なタスクにおける注意拡散や不適切なパフォーマンスといった課題に直面していることが明らかになった。
分解によりLLMの注目度と問題解決範囲を高めることを目的としたワークフローパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:45:21 GMT)
FunBO: Discovering Acquisition Functions for Bayesian Optimization with FunSearch [18.9] 本稿では、FunBOを用いて、コンピュータコードで書かれた新しい取得関数を学習する方法を示す。
本稿では,FunBOが関数のトレーニング分布の内外をよく一般化するAFを特定する方法を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:49:59 GMT)
Are We Done with MMLU? [18.7] 我々は、人気のあるMassive Multitask Language Understandingベンチマークでエラーを特定し、分析する。
例えば、Virologyサブセットで分析された質問の57%にエラーが含まれていることがわかった。
MMLU-Reduxは,30名のMMLU被験者を対象に,手動で書き直した3000の質問のサブセットである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:19:06 GMT)
Task Specific Pretraining with Noisy Labels for Remote Sensing Image Segmentation [18.6] 自己監督(Self-supervision)は、人造地理空間アノテーションの正確な量を減らすためのリモートセンシングツールを提供する。
本研究では,モデル事前学習のためのノイズの多いセマンティックセグメンテーションマップを提案する。
2つのデータセットから,ノイズラベルを用いたタスク固有教師付き事前学習の有効性が示唆された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:52:08 GMT)
Clarifying Myths About the Relationship Between Shape Bias, Accuracy, and Robustness [18.6] ディープラーニングモデルは、トレーニングセットと同じ分布のイメージに対して評価すると、うまく機能する。
ディープラーニングモデルは、トレーニングセットと同じ分布のイメージに対して評価すると、うまく機能する。
モデルの入力画像に小さなぼかしを適用して、アウト・オブ・ディストリビューション(OOD)データでモデルに供給することで、モデルの精度を著しく低下させることができる。
データ拡張は、OODデータに対するモデルロバスト性を改善するための、十分に実践された方法の1つである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:21:00 GMT)
Convergence Analysis of Adaptive Gradient Methods under Refined Smoothness and Noise Assumptions [18.5] 適応勾配法は間違いなくニューラルネットワークの最も成功した最適化アルゴリズムである。
適応的勾配法は、アダッド・エル・エル・アンド・ジオメトリ(Adad-ell/ell$ geometry)を形作る可能性があることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:55:57 GMT)
CodeScope: An Execution-based Multilingual Multitask Multidimensional Benchmark for Evaluating LLMs on Code Understanding and Generation [18.4] LLM(Large Language Models)は、人間のプログラミング支援に優れた性能を発揮している。
LLMのコード理解と生成能力を評価するための既存のベンチマークは、厳しい制限に悩まされている。
実行ベース,多言語,マルチタスク,多次元評価ベンチマークであるCodeScopeを紹介する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:34:16 GMT)
A Definition of Open-Ended Learning Problems for Goal-Conditioned Agents [18.3] オープンエンドラーニングは、一般的に、多様な性質の集合を含む複合概念として考えられている。
我々は、エージェントがゴール駆動スキルのレパートリーを増大させることが可能な、オープンエンドの目標条件強化学習問題のサブセットに焦点を当てる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:52:13 GMT)
A Near-Linear Time Approximation Algorithm for Beyond-Worst-Case Graph Clustering [18.3] 我々は[Makarychev, Makarychev and Vijayaraghavan, STOC'12] の半ランダムグラフモデルを考える。
時間アルゴリズムは、カットされた$(A, B)$がサイズ$Omega(alpha)$である限り、alphad Cutの問題を最大$O(alpha)$ [MMV'12]に近似することが知られている。
この問題の微細な複雑さについて検討し,[MMV'12]と同じような性能を示す最初のニア線形時間サブルーチンを提示する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:40:54 GMT)
VISTA3D: Versatile Imaging SegmenTation and Annotation model for 3D Computed Tomography [18.1] VISTA3D, Versatile Imaging SegmenTation などの3次元CTセグメンテーションモデルが持つべき特徴について論じる。
このモデルは、1454巻に117種類のヒト解剖学的構造と様々な病変を含む体系的に訓練されている。
モデルの設計は、最先端のゼロショットインタラクティブセグメンテーションを3Dで実現している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 22:41:39 GMT)
Probabilistic Perspectives on Error Minimization in Adversarial Reinforcement Learning [18.0] 深層強化学習(Dep Reinforcement Learning, DRL)政策は、観測における敵の騒音に対して極めて脆弱であり、安全クリティカルなシナリオにおいて重大なリスクを生じさせる。
既存のRLアルゴリズムを敵の摂動に対して強化する戦略は、一般的に2つのカテゴリに分類される。
本稿では,ACoE(Adrial Counterfactual Error)と呼ばれる新たな目標を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:14:24 GMT)
Scenarios and Approaches for Situated Natural Language Explanations [18.0] ベンチマークデータセットである条件ベース説明を収集します。
このデータセットには100の説明書が含まれている。
オーディエンスと組み合わせたエクスラナンダム(explanandum paired with a audience)"の各状況について、人間による説明を含める。
本稿では,ルールベースのプロンプト,メタプロンプト,コンテキスト内学習プロンプトの3つのカテゴリについて検討する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:56:32 GMT)
Instance Tracking in 3D Scenes from Egocentric Videos [18.0] AR/VRデバイスのようなエゴセントリックなセンサーは、人間とオブジェクトのインタラクションをキャプチャし、タスクアシストを提供する。
この機能は、エゴセントリックビデオ(IT3DEgo)の現実世界の3Dシーンのインスタンス追跡を必要とする
RGBと深度ビデオ、フレームごとのカメラポーズ、および2Dカメラと3Dワールド座標の両方におけるインスタンスレベルのアノテーションからなる新しいベンチマークデータセットを導入する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:18:49 GMT)
Promotional Language and the Adoption of Innovative Ideas in Science [17.8] 我々は、科学振興言語に焦点をあてて、承認申請の成功のセマンティック分析を行う。
我々は、プロモーション言語と、資金提供者と他の科学者による革新的なアイデアの支持と採用との間に、堅牢な関連性を見出した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:56:35 GMT)
Learning Coverage Paths in Unknown Environments with Deep Reinforcement Learning [17.7] 被覆経路計画 (CPP) は、制限された領域の自由空間全体をカバーする経路を見つける問題である。
この課題に対する強化学習の適性について検討する。
本稿では,フロンティアに基づく計算可能なエゴセントリックマップ表現と,全変動に基づく新たな報酬項を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:39:38 GMT)
Probabilistic Weather Forecasting with Hierarchical Graph Neural Networks [17.6] 本稿では,Graph-EFMと呼ばれる確率的天気予報モデルを提案する。
このモデルは、柔軟な潜在変数の定式化とグラフベースの予測フレームワークを結合する。
Graph-EFMのアンサンブル予測は、同等の決定論的モデルよりも同等または低いエラーを達成する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:01:25 GMT)
The ODE Method for Stochastic Approximation and Reinforcement Learning with Markovian Noise [17.5] 近似アルゴリズムを解析する根本的な課題は、その安定性を確立することである。
本稿では,マルティンゲール差分雑音設定からマルコフ雑音設定へ有界な安定に対するボルカー・メイン定理を拡張する。
我々の分析の中心は、少数の関数の変化の減少率であり、これは多量の強い法則の形式とよく用いられるV4 Lynovドリフト条件の両方によって示唆される。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:10:47 GMT)
AttnDreamBooth: Towards Text-Aligned Personalized Text-to-Image Generation [17.4] テキスト・ツー・イメージ・パーソナライズにおける2つの主要なテクニックであるテキスト・インバージョンとドリームブースの限界を分析する。
AttnDreamBoothは、埋め込みアライメント、アテンションマップ、主題のアイデンティティを個別に学習することで、これらの問題に対処する新しいアプローチである。
本手法は,基本手法と比較して,アイデンティティの保存とテキストアライメントの大幅な改善を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:12:26 GMT)
Optimizing Time Series Forecasting Architectures: A Hierarchical Neural Architecture Search Approach [17.4] 本稿では,時系列予測タスクのための階層型ニューラルネットワーク探索手法を提案する。
階層型検索空間の設計により,タスク予測用に設計された多くのアーキテクチャタイプを組み込んだ。
長期予測タスクの結果から,本手法が軽量な高性能予測アーキテクチャを探索できることが示唆された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:02:37 GMT)
Crafting Heavy-Tails in Weight Matrix Spectrum without Gradient Noise [17.0] ディープニューラルネットワークのトレーニング戦略は、層重みの重み付きスペクトルを誘導する。
HT重量スペクトルを生成するために勾配雑音は不要であることを示す。
HT重量スペクトルは特徴学習から生じるスパイク'から生じる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:51:57 GMT)
Cyclic Sparse Training: Is it Enough? [17.0] そこで本研究では,任意のスパースマスクの繰り返しサイクルトレーニングと,パラメータとマスクをペアリングする単一プルーニングステップを提案する。
これは、計算コストの削減により、高疎性状態における最先端の反復的プルーニング手法の性能に匹敵する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:10:04 GMT)
Gauge Invariant and Anyonic Symmetric Transformer and RNN Quantum States for Quantum Lattice Models [17.0] 我々はゲージ不変あるいは正準対称自己回帰型ニューラルネットワーク量子状態を構築するための一般的なアプローチを開発する。
提案手法は,2次元および3次元のトーリック符号の基底および励起状態の正確な表現が可能であることを証明している。
我々は、様々なモデルのためのリアルタイム力学と同様に、基底状態のための自己回帰ニューラルネットワークの対称性を変動的に最適化する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:20:36 GMT)
LLMs for User Interest Exploration in Large-scale Recommendation Systems [17.0] 従来のレコメンデーションシステムは、過去のユーザとイテムのインタラクションから学び、強化することで、強いフィードバックループを受ける。
本稿では,Large Language Models(LLM)と古典的レコメンデーションモデルを組み合わせたハイブリッド階層型フレームワークを提案する。
数十億のユーザを対象とする産業規模の商用プラットフォーム上で,このアプローチの有効性を実証する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:06:20 GMT)
AAdaM at SemEval-2024 Task 1: Augmentation and Adaptation for Multilingual Semantic Textual Relatedness [16.9] 本稿では,アフリカとアジアの言語に対するセマンティックテキスト関連性(SemEval-2024 Task 1: Semantic Textual Relatedness)について述べる。
本稿では,限られたトレーニングデータの低リソース化問題に対処するために,機械翻訳によるデータ拡張を提案する。
我々のシステムは、サブタスクA(教師付き学習)とサブタスクC(言語間の移動)の両方において、すべてのチームの中で最善を尽くします。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:02:55 GMT)
Optimal Eye Surgeon: Finding Image Priors through Sparse Generators at Initialization [16.9] 我々は,深部画像生成ネットワークのプルーニングとトレーニングのためのフレームワークであるOptimal Eye Surgeon (OES)を紹介した。
OESは適応的にネットワークをランダムにプルーニングすることでこの問題に対処する。
システムは、単にマスクすることで、トレーニングなしでも、低周波画像成分を効果的にキャプチャする。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:04:53 GMT)
LoRA-Whisper: Parameter-Efficient and Extensible Multilingual ASR [16.9] 本稿では,多言語ASRのためのWhisperにLoRA行列を組み込んだLoRA-Whisperを提案する。
8言語にまたがる実世界のタスクの実験により,提案したLoRA-Whisperは,多言語ASRおよび言語拡張のためのベースラインシステムに対して,それぞれ18.5%と23.0%の相対的な利得が得られることが示された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:01:51 GMT)
Advances in Embodied Navigation Using Large Language Models: A Survey [16.8] この記事では、Large Language ModelsとEmbodied Intelligenceの共生について概説する。
最先端のモデル、研究方法論をレビューし、既存の埋め込みナビゲーションモデルとデータセットの利点とデメリットを評価する。
最後に, 本論文は, インテリジェンスにおけるLLMの役割を解明し, 今後の方向性を予測している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:13:41 GMT)
FlowMM: Generating Materials with Riemannian Flow Matching [16.7] 両タスクの最先端性能を実現するための生成モデルであるFlowMMを提案する。
われわれのフレームワークは,フローベース分布の選択の自由を可能とし,結晶構造学習の問題を劇的に単純化する。
標準ベンチマークに加えて, 量子化学計算によるFlowMMの生成構造を検証した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:46:23 GMT)
Retrieval & Fine-Tuning for In-Context Tabular Models [16.7] トランスフォーマーベースのインコンテキスト学習を用いた最近の進歩は、より小さく、より複雑でないデータセットを約束しているが、より大きく、より複雑なデータセットにスケールするのに苦労している。
検索と微調整の組み合わせを提案する: 近接する近隣住民を収集することで、変換器をデータの局所的なサブセットに適応させ、その周辺住民の状況に応じてタスク固有の微調整を行うことができる。
テキスト内モデルと比較すると,性能が大幅に向上した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:43:33 GMT)
It's Not Easy Being Wrong: Large Language Models Struggle with Process of Elimination Reasoning [16.6] 思考の連鎖(COT)は、大きな言語モデル(LLM)が正しい答えを推論するのに役立つが、誤った答えを推論する効果は未解明である。
我々はCOTを用いたPoEを提案するが、ここではLLMは複数の質問に対して誤った選択をしなくてはならない。
PoEの戦略は常に正しい回答を選択する戦略を過小評価している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:01:20 GMT)
SMART: Scene-motion-aware human action recognition framework for mental disorder group [16.6] 本稿では、精神障害グループで頻繁に発生する異常行動を含む視覚に基づくヒューマンアクション認識データセットを構築することを提案する。
次に,Scene-Motion-Aware Action RecognitionフレームワークであるSMARTを紹介した。
提案手法の有効性を自己収集したHARデータセット(HAD)で検証し,未確認の被写体とシーンにおいて94.9%,93.1%の精度を達成し,最先端のアプローチを6.5%,13.2%向上させた。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:29:42 GMT)
COLD-Attack: Jailbreaking LLMs with Stealthiness and Controllability [16.4] 大規模言語モデル(LLM)における制御可能なジェイルブレイクの研究
本稿では,制御可能な攻撃生成問題と制御可能なテキスト生成との間に新たな接続を構築する。
この接続に基づいて、制御可能なテキスト生成における最先端かつ高効率なアルゴリズムであるLangevin Dynamics (COLD) を用いて、エネルギーベースの制約付きデコーディングを適用する。
COLD-Attackによって実現された制御可能性により、さまざまな新しいジェイルブレイクシナリオが生まれます。これは、連続的な制約で流動性(接尾辞)攻撃を発生させる標準的な設定をカバーするだけでなく、新しい制御可能な攻撃設定に対処することもできます。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:13:08 GMT)
On PI Controllers for Updating Lagrange Multipliers in Constrained Optimization [16.4] 本稿では、$nu$PIアルゴリズムを提案し、PIコントローラに基づくラグランジュ乗算器更新の最適化に寄与する。
本研究では,勾配降下勾配の欠点に対処する運動量法が不可能であることを示す理論的,実証的な知見を提供する。
我々は、$nu$PIが単目的最小化の一般的な運動量法を一般化することを証明した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:13:31 GMT)
Synth$^2$: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings [16.3] 効率的な視覚言語モデル(VLM)トレーニングのための合成画像テキストペアを作成する。
本手法では,LLMが生成したキャプションから画像埋め込みを合成するために,事前訓練されたテキスト・ツー・イメージモデルを用いる。
我々のVLMは、人工的なデータに基づいて微調整され、人間に注釈付けされたデータにのみ訓練されたモデルに匹敵する性能を達成する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:10:47 GMT)
Audio Mamba: Selective State Spaces for Self-Supervised Audio Representations [16.3] 本研究は,汎用音声表現学習のための選択状態空間モデルであるAudio Mambaを提案する。
10種類の多様なオーディオ認識ダウンストリームタスクに対する実験結果から、提案したモデルは、同等の自己教師型オーディオスペクトログラム変換器のベースラインを一貫して上回っていることが示された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:41:28 GMT)
EffiBench: Benchmarking the Efficiency of Automatically Generated Code [16.2] EffiBenchは1,000の効率クリティカルコーディング問題のあるベンチマークである。
それぞれの問題は、実行可能な人間記述の標準解とペアリングされる。
我々は42の大規模言語モデルによる効率的なコード生成能力を実証的に検証した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:21:21 GMT)
Efficient 3D Shape Generation via Diffusion Mamba with Bidirectional SSMs [16.1] 3次元点雲生成に適した新しい拡散アーキテクチャーDiffusion Mamba (DiM-3D)を提案する。
DiM-3Dは従来の注意機構を捨て、代わりにMambaアーキテクチャの本質的な効率を利用して、シーケンス長に関する線形複雑性を維持する。
ShapeNetベンチマークによる実験結果から、DEM-3Dは高忠実で多様な3D形状を生成する上で、最先端の性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:02:07 GMT)
Annotating FrameNet via Structure-Conditioned Language Generation [15.9] 本稿では、過剰な生成とフィルタのアプローチに従って、新しいフレーム文の注釈付き文を生成するフレームワークを提案する。
以上の結果から,リッチで明示的な意味情報に対する条件付けは,人間の受容度が高い世代を生み出す傾向が示唆された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:01:15 GMT)
Sim-to-real Transfer of Deep Reinforcement Learning Agents for Online Coverage Path Planning [15.8] 我々は、カバーパス計画(CPP)のための強化学習エージェント(RL)のSim-to-real転送の課題に取り組む。
実際のロボット運動学やリアルタイムの側面を含む、シミュレーションされたセンサーと障害物で、半仮想環境を通して、シミュレーションと現実のギャップを橋渡しする。
高速モデル推論周波数はsim-to-realギャップを減らすのに十分であり、微調整は最初は性能を劣化させる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:24:19 GMT)
Efficient Differentially Private Fine-Tuning of Diffusion Models [15.7] DP-SGDによる微調整された大規模な拡散モデルは、メモリ使用量や計算量の観点から非常にリソース需要が高い。
本研究では,低次元適応(LoDA)と微分プライバシーを用いた拡散モデルの高効率微調整(PEFT)について検討する。
ソースコードはGitHubで公開されます。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:00:20 GMT)
CheckEmbed: Effective Verification of LLM Solutions to Open-Ended Tasks [15.6] 大きな言語モデル(LLM)は様々なドメインに革命をもたらしていますが、その答えを検証することは大きな課題です。
本研究では,精度が高く,スケーラブルで,シンプルなLCM検証手法であるCheckEmbedを提案する。
CheckEmbedは、GPT Text Embedding Largeのようなモデルで得られた回答レベルの埋め込みを比較。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:58:22 GMT)
Saliency strikes back: How filtering out high frequencies improves white-box explanations [15.3] ホワイトボックス」法は、高周波アーティファクトによってしばしば汚染される勾配信号に依存する。
この制限を克服するために、"FORGrad"と呼ばれる新しいアプローチを導入します。
以上の結果から,ForceGradは既存のホワイトボックスメソッドの性能を継続的に向上させることがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:39:49 GMT)
Artifacts or Abduction: How Do LLMs Answer Multiple-Choice Questions Without the Question? [15.3] 大規模言語モデル(LLM)が選択のみのプロンプトで複数選択質問応答(MCQA)を実行できるかどうかを探索する。
このプロンプトは11/12ケースで過半数のベースラインを上回り、精度は0.33まで向上する。
我々は、暗記、選択力学、質問推論について、深いブラックボックス分析を行う。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:11:14 GMT)
TimewarpVAE: Simultaneous Time-Warping and Representation Learning of Trajectories [15.3] TimewarpVAEは、空間変動の時間変化と潜時要因を同時に学習する多様体学習アルゴリズムである。
本稿では,手書きおよびフォーク操作データセットにおける空間変動の適切な時間アライメントと有意義な表現をアルゴリズムがどのように学習するかを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:47:21 GMT)
Espresso: Robust Concept Filtering in Text-to-Image Models [15.1] 拡散ベースのテキスト・トゥ・イメージ(T2I)モデルは、与えられたテキスト・プロンプトに対して高忠実な画像を生成する。
トレーニングデータにおける受け入れ難い概念をフィルタリングした後のT2Iモデルのリトレーニングは非効率であり、実用性は低下する。
EspressoはContrastive Language-Image Pre-Trainingに基づく最初の堅牢な概念フィルタである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:28:24 GMT)
CoNo: Consistency Noise Injection for Tuning-free Long Video Diffusion [15.0] ルークバック機構は、異なるビデオクリップ間の微粒なシーン遷移を促進する。
長期の整合性正規化は、拡張ビデオクリップの予測ノイズと元のノイズとの画素幅距離を明示的に最小化することに焦点を当てる。
単文および複数文のプロンプト条件下で長ビデオ生成を行うことによる戦略の有効性を示す実験を行った。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:56:42 GMT)
Sexism Detection on a Data Diet [14.9] モデルのトレーニング中に、インフルエンススコアを利用してデータポイントの重要性を推定する方法を示します。
ドメイン外の3つのデータセット上で異なるプルーニング戦略を用いて、データプルーニングに基づいてトレーニングされたモデル性能を評価する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:39:54 GMT)
Integrating Multi-scale Contextualized Information for Byte-based Neural Machine Translation [14.8] サブワードトークン化はニューラル機械翻訳(NMT)モデルにおける語彙構築の一般的な方法である。
隠れ状態次元の異なる様々なスケールの文脈情報を学習するマルチスケールコンテキスト化(MSC)手法を提案する。
実験により、MSCはサブワードベースおよび他のバイトベースの手法を多言語およびドメイン外のシナリオで大幅に上回っていることが示された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:34:57 GMT)
SpanGNN: Towards Memory-Efficient Graph Neural Networks via Spanning Subgraph Training [14.6] グラフニューラルネットワーク(GNN)は、グラフデータを学習する能力に優れています。
フルグラフGNNトレーニングは一般的に精度が高いが、ピークメモリ使用量が多い。
本研究では,SpanGNNと呼ばれるスパンニングサブグラフを用いたメモリ効率のよいGNNトレーニング手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:46:23 GMT)
Skill-aware Mutual Information Optimisation for Generalisation in Reinforcement Learning [14.6] Skill-aware Mutual Information (SaMI) は,スキルに応じたコンテキスト埋め込みの識別を支援する最適化目的である。
そこで我々は,SaMIの目的を最適化するための$K$sample推定器であるSkill-aware Noise Contrastive Estimation (SaNCE)を提案する。
SMIを最大化することで学習するRLエージェントが、目に見えないタスクに対して、ゼロショットの一般化を大幅に改善できることを実証的に見出した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:35:29 GMT)
Confidence Under the Hood: An Investigation into the Confidence-Probability Alignment in Large Language Models [14.5] 信頼性・確率アライメントの概念を紹介します。
モデルの内部と信頼感の一致を調査する。
分析したモデルのうち、OpenAIのGPT-4は信頼性と信頼性のアライメントが最強であった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 22:48:31 GMT)
Fragile Model Watermarking: A Comprehensive Survey of Evolution, Characteristics, and Classification [14.5] モデルの脆弱な透かしは、改ざんを検出する強力なツールとして徐々に現れてきた。
本稿では, モデルフラクタブルウォーターマーキングの創業以来の課題について概説する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:23:25 GMT)
On the Independence Assumption in Neurosymbolic Learning [14.4] 最先端のニューロシンボリック学習システムは確率論的推論を用いて、ニューラルネットワークを記号に対する論理的制約に従う予測へと導く。
このようなシステムの多くは、学習と推論を簡略化するために入力が与えられた場合、考慮されたシンボルの確率は条件的に独立であると仮定している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:10:50 GMT)
Magicoder: Empowering Code Generation with OSS-Instruct [14.4] Magicoderは、コードのためのLarge Language Models(LLM)シリーズの完全なオープンソース(コード、重み、データ)を紹介します。
MagicoderモデルはOSS-Instructを使って75Kの合成命令データに基づいて訓練される。
MagicoderとMagicoderSはどちらも、幅広いコーディングベンチマークにおいて、類似またはそれ以上の大きさの最先端のコードモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:50:56 GMT)
UCDNet: Multi-UAV Collaborative 3D Object Detection Network by Reliable Feature Mapping [14.4] マルチUAVコラボレーティブな3Dオブジェクト検出は複雑な環境を知覚し理解することができる。
カメラによる複数UAV協調3Dオブジェクト検出のパラダイムであるUCDNetを提案する。
本手法は, ベースラインに比べて4.7%, 10%mAPの増加を示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:27:32 GMT)
The Expanding Scope of the Stability Gap: Unveiling its Presence in Joint Incremental Learning of Homogeneous Tasks [14.3] 最近の研究では、新しいタスクに移行する際に、以前に学習したタスクに対する一時的なパフォーマンス低下が確認されている。
また,同種タスクの漸進的連立トレーニングを行う際にも,安定性のギャップが生じることを示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:44:48 GMT)
EAIA: An Efficient and Anonymous Identity Authentication Scheme in 5G-V2V [14.3] 本稿では,ロードサイドユニット(RSU)をサポートしていないシナリオに適した,効率的な匿名V2V認証プロトコルを提案する。
提案されたプロトコルは、Scytherツールを使用して公式に評価され、主要な一般的な悪意のある攻撃に耐える能力を示している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:26:09 GMT)
HateDebias: On the Diversity and Variability of Hate Speech Debiasing [14.2] 我々はHateDebiasという名のベンチマークを提案し、連続的かつ変化する環境下でのヘイトスピーチ検出のモデル能力を分析する。
具体的には、バイアスの多様性を満たすために、さまざまな種類のバイアスを持つ既存のヘイトスピーチ検出データセットを収集します。
我々は,HateDebiasの性能を1種類のバイアスで学習したモデルの検出精度を評価する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:18:02 GMT)
An Empirical Study on Parameter-Efficient Fine-Tuning for MultiModal Large Language Models [14.2] マルチモーダル大規模言語モデル (MLLM) はマルチモーダルタスクにおいて顕著な機能を示した。
しかし、MLLMの全てのパラメータを微調整することは、通常数十億のパラメータを含むため困難になっている。
本稿では,オープンソースMLLMのLPMコンポーネントを微調整するために,4つのPEFT手法を用いた実験的検討を行った。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:58:11 GMT)
Are Large Language Models More Empathetic than Humans? [14.2] GPT-4は最も共感的な反応として現れ、人間のベンチマークに比べて約31%の反応が「Good」と評価された。
一部のLSMは、特定の感情に反応するのが他よりもはるかに優れている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:33:43 GMT)
Disentangling Quantum Classifiers: Simplex Edge Mapping for Few-Sample Confidence [14.2] 回路出力をn次元の単純集合のエッジとして扱い、各クラス間の独立な決定を表現する多クラスバイナリ分類手法を提案する。
本研究では,本手法が有線出力をアンタングし,不確実な出力を避けるためにVQCを説得することにより,少ないサンプル精度を2倍に向上することを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:57:22 GMT)
LLM-Enhanced Bayesian Optimization for Efficient Analog Layout Constraint Generation [13.9] 本稿では,アナログレイアウト合成のためのtexttLLANA フレームワークを提案する。
アナログ設計に依存したパラメータ制約をより効率的に生成するために、LLM(Large Language Models)の少数ショット学習能力を利用する。
その結果,textttLLANAは最先端(SOTA)BO法に匹敵する性能を達成できるだけでなく,アナログ回路設計空間のより効率的な探索を可能にすることがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:22:36 GMT)
Multi-Head RAG: Solving Multi-Aspect Problems with LLMs [13.6] 検索拡張生成(RAG)は大規模言語モデル(LLM)の能力を向上させる
既存のRAGソリューションは、実質的に異なる内容の複数のドキュメントを取得する必要がある可能性のあるクエリに焦点を当てていない。
本稿では,このギャップをシンプルかつ強力なアイデアで解決する新しい手法として,MRAG(Multi-Head RAG)を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:59:38 GMT)
3rd Place Solution for MeViS Track in CVPR 2024 PVUW workshop: Motion Expression guided Video Segmentation [13.6] 本稿では,凍結事前学習型視覚言語モデル(VLM)をバックボーンとして用いることを提案する。
まず、フリーズした畳み込みCLIPバックボーンを使用して、機能に整合したビジョンとテキスト機能を生成し、ドメインギャップの問題を軽減する。
第二に、マルチモーダル情報の利用を高めるために、パイプラインによりクロスモーダルな特徴融合を追加します。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:15:03 GMT)
Ada-VE: Training-Free Consistent Video Editing Using Adaptive Motion Prior [13.6] ビデオ間合成モデルは、フレーム間の一貫したキャラクタ生成の確保、スムーズな時間遷移の維持、高速動作時の品質維持といった課題に直面している。
完全クロスフレームの自己保持機構の導入により、文字の一貫性が向上したが、これは計算複雑性の増大によるものである。
本稿では,意味的詳細と時間的一貫性を保ちながら,複雑度を大幅に低減する適応型動き誘導型クロスフレームアテンション機構を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:12:25 GMT)
Neural Networks with (Low-Precision) Polynomial Approximations: New Insights and Techniques for Accuracy Improvement [13.4] 非ポリノミカル関数を近似に置き換えることは、プライバシ保護機械学習の標準的なプラクティスである。
ニューラルネットワーク(PANN)の近似と呼ばれる結果のニューラルネットワークは、高度な暗号システムと互換性がある。
PANNにおける近似誤差の効果について説明する。
PANNの推測精度を向上させるための手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:34:32 GMT)
Reconciling Shared versus Context-Specific Information in a Neural Network Model of Latent Causes [13.4] LCNet(Latent Cause Network)は、LC推論のニューラルネットワークモデルである。
ネットワーク重みの中でタスク間で共有される構造を格納する。
これはコンテキストモジュールを使用してコンテキスト固有の構造を表現する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:59:28 GMT)
M2NO: Multiresolution Operator Learning with Multiwavelet-based Algebraic Multigrid Method [13.4] 本稿では,新しいディープラーニングフレームワークであるMultiwaveletベースの代数的マルチグリッドニューラル演算子(M2NO)を紹介する。
これら2つのアプローチの固有の類似性を利用して、M2NOは様々なPDEベンチマークの精度と柔軟性を向上させる。
M2NOは高分解能および超高分解能タスクの処理に優れ、競合するモデルよりも一貫して優れている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:47:40 GMT)
Adversarial Tuning: Defending Against Jailbreak Attacks for LLMs [13.3] 本稿では,大規模言語モデルの汎用防衛能力を高めるための2段階の逆調整フレームワークを提案する。
第1段階では,トークンレベルの逆数生成を効率的に行うために,階層型メタユニバーサル逆数学習を導入する。
第2段階では,自動対向プロンプト学習により,意味レベルの対向プロンプトを反復的に洗練する手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:37:15 GMT)
$C^*$-Algebraic Machine Learning: Moving in a New Direction [13.2] 我々は機械学習研究の新しい方向性を提案する:$C*$-algebraic ML $-$$C*$-algebraと機械学習のクロスファーティライズ。
機械学習に$C*$-algebrasを使用する理由と方法を説明し、技術的な考察を提供する。
C*$-algebraic MLのオープンな質問や課題について議論し、今後の開発やアプリケーションについて考えます。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:59:22 GMT)
Root Cause Analysis of Outliers with Missing Structural Knowledge [13.2] 本研究では,定量的寄与分析ではなく,一意の根本原因を同定する作業において,簡易かつ効率的な根本原因解析法を提案する。
提案手法は,SCMノードの線形順序で動作し,因果DAGのみを必要とする。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:24:38 GMT)
Federated LoRA with Sparse Communication [13.0] ローランク適応(ローランク適応、LoRA)は、コミュニケーションに制約のある機械学習設定において微調整を行う自然な方法である。
本研究では,フェデレートされたLoRAにおける通信効率をさらに向上する手法を検討する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:42:05 GMT)
MATTER: Memory-Augmented Transformer Using Heterogeneous Knowledge Sources [12.8] 我々は、MATTERと呼ばれる効率的なメモリ拡張変換器を導入する。
MATTERは、固定長のニューラルメモリの形で、非構造化ソース(パラグラフ)と半構造化ソース(QAペア)の両方から読み取る。
提案モデルでは,従来のQAベンチマークにおいて,精度と速度の両面で,既存の効率的な検索強化モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:35:37 GMT)
Group-wise oracle-efficient algorithms for online multi-group learning [12.7] 本研究では,オンライン学習者が,集団の系列に対応するサブシーケンスの集合に対して,小さな予測後悔を同時に達成しなければならない学習モデルである,オンライン多群学習の課題について検討する。
本稿では, 逆数および逆数変換の設定を含む, 種々の条件下で, サブ線形後悔を伴うオラクル効率のアルゴリズムを設計する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:00:02 GMT)
Pretraining Decision Transformers with Reward Prediction for In-Context Multi-task Structured Bandit Learning [12.6] 本研究では,累積的後悔を最小限に抑える近似アルゴリズムの学習を目標とするマルチタスク構造化バンディット問題について検討する。
我々は、この共有構造を学習するために、トランスフォーマーを意思決定アルゴリズムとして使用し、テストタスクに一般化する。
提案アルゴリズムは,問題の根底にある構造を知ることなく,コンテキスト内でほぼ最適のポリシーを学習可能であることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:34:31 GMT)
Beyond Implicit Bias: The Insignificance of SGD Noise in Online Learning [12.3] 小さなバッチサイズは、オンライン学習における暗黙のバイアスの利点を示さない。
オフライン学習とは対照的に、オンライン学習におけるSGDノイズの利点は厳密な計算である。
これは、オンラインシステムにおけるSGDは、ノイズレス勾配降下アルゴリズムの「ゴールドパス」に沿ってノイズのあるステップを取ることができることを示唆している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:00:20 GMT)
A survey and benchmark of high-dimensional Bayesian optimization of discrete sequences [12.2] 個々のブラックボックス機能を最適化することは、タンパク質工学や薬物設計など、いくつかの領域において重要である。
我々は,高次元ベイズ最適化手法と標準化されたブラックボックス関数の集合を幅広くテストするための統一的なフレームワークを開発する。
これらのベンチマークの2つのコンポーネントはそれぞれ、柔軟でスケーラブルで容易に拡張可能なソフトウェアライブラリによってサポートされています。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:39:40 GMT)
Diving Deep into the Motion Representation of Video-Text Models [12.2] GPT-4の生成した動作記述は、アクティビティのきめ細かい動作記述をキャプチャする。
動作記述の検索作業におけるビデオテキストモデルの評価を行った。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:46:10 GMT)
Key-Element-Informed sLLM Tuning for Document Summarization [12.1] 文書中のキー要素を識別し,これらのキー要素をキャプチャする要約を生成するためのsLLMを指示する,KEITSumと呼ばれるキー要素インフォームド命令チューニングを提案する。
対話とニュースデータセットの実験結果から,KEITSumを用いたsLLMは高い関連性と幻覚の少ない高品質な要約を実現し,プロプライエタリなLLMと競合することを示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:19:01 GMT)
DORY: Deliberative Prompt Recovery for LLM [12.0] Deliberative PrOmpt Recovery (DORY)は、不確実性を利用してプロンプトを正確に回収する新しいアプローチである。
DORYは出力からのドラフトを再構築し、ヒントでそれらを精製し、不確実性に基づいてノイズを除去する。
評価の結果,DORYは既存のベースラインを上回る性能を示し,約10.82%の性能向上を実現している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:00:00 GMT)
UVCPNet: A UAV-Vehicle Collaborative Perception Network for 3D Object Detection [11.6] 地上共同作業に特化して設計された枠組みを提案する。
研究のためにV2U-COOという仮想データセットを開発した。
第2に、ターゲット情報を調整するために、クロスドメイン・クロスアダプティブ(CDCA)モジュールを設計する。
第3に,より正確な深度推定結果を得るために,協調深度最適化(CDO)モジュールを導入する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:25:45 GMT)
Uplift Modeling Under Limited Supervision [11.5] 電子商取引における因果効果の推定には、大規模な環境では実用的でないような費用がかかる傾向がある。
電子商取引データに共通するグラフに依存して,必要なトレーニングセットのサイズを小さくするグラフニューラルネットワークを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:00:30 GMT)
Pose2Gaze: Eye-body Coordination during Daily Activities for Gaze Prediction from Full-body Poses [11.5] まず、様々な人・物・人・人のインタラクション活動における眼・体の協調に関する包括的分析を報告する。
次に、畳み込みニューラルネットワークを用いて、頭部と全身のポーズから特徴を抽出する眼球運動調整モデルPose2Gazeを紹介する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:41:53 GMT)
Marking the Pace: A Blockchain-Enhanced Privacy-Traceable Strategy for Federated Recommender Systems [11.5] フェデレートされたレコメンデータシステムは、データ共有と継続的モデル更新によって強化されている。
IoTデータの感度を考えると、データ共有とモデル更新における透過的なデータ処理が最重要である。
既存の方法は、共有データのフローとモデル更新の進化をトレースするのに不足している。
プライバシ追跡可能なフェデレーションレコメンデータシステムであるLIBERATEを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:21:21 GMT)
Revisiting Attention Weights as Interpretations of Message-Passing Neural Networks [11.5] いくつかの広く使われているメッセージパッシングニューラルネットワーク(MPNN)では自己注意機構が採用されている
この注意の活用により、そのようなモデルは説明可能なAI(XAI)の研究のベースラインとなった。
本研究の目的は,注目機能付きMPNNの広汎な利用と,大半が未探索な説明可能性におけるその可能性とのギャップを埋めることである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:40:15 GMT)
Sliding Window 3-Objective Pareto Optimization for Problems with Chance Constraints [11.3] 我々は、スライディングウィンドウのアプローチを、確率制約問題に対処するための3ドルオブジェクトの定式化に拡張する。
私たちの新しいスライディングウインドウアプローチは、3つのオブジェクトのアプローチよりもはるかに効率的な方法で、はるかに大きなインスタンスを解決できます。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:45:32 GMT)
RU-AI: A Large Multimodal Dataset for Machine Generated Content Detection [11.3] 本稿では,テキスト,画像,音声中の機械生成コンテンツを検出するための大規模マルチモーダルデータセットであるRU-AIを紹介する。
私たちのデータセットは、Flickr8K、COCO、Places205の3つの大きな公開データセットから構築されています。
マルチモーダル埋め込みモジュールを多層パーセプトロンネットワークに組み込んだ統一モデルにより,データの起源を効果的に決定できる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:58:14 GMT)
WinNet: Make Only One Convolutional Layer Effective for Time Series Forecasting [11.2] 我々は、WinNetと呼ばれる1つの畳み込み層しか持たない非常に正確で単純なCNNベースのモデルを提案する。
その結果、WinNetは、CNNベースのメソッドよりもSOTA性能と複雑さが低いことを実証した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:26:02 GMT)
A Combination Model Based on Sequential General Variational Mode Decomposition Method for Time Series Prediction [11.1] 我々は、金融時系列を予測する非線形な方法で、新しいSGVMD-ARIMA組合せモデルを構築した。
予測区間内では,従来の分解予測群モデルよりも利点が向上した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:43:24 GMT)
Text-Guided Alternative Image Clustering [11.1] この研究は、代替画像クラスタリングを容易にするために、大きな視覚言語モデルの可能性を探るものである。
本稿では,ユーザの興味をプロンプトを通じて活用する新たなアプローチとして,テキストガイドによる代替イメージコンセンサスクラスタリング(TGAICC)を提案する。
TGAICCは、4つの代替イメージクラスタリングベンチマークデータセットで画像とテキストベースのベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:37:57 GMT)
Leveraging Pedagogical Theories to Understand Student Learning Process with Graph-based Reasonable Knowledge Tracing [11.1] 本稿では,これらの問題に対処するためのグラフベースの合理的知識追跡手法GRKTを紹介する。
本稿では,知識検索,記憶強化,知識学習・鍛造の3段階モデリングプロセスを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:14:30 GMT)
Navigating Efficiency in MobileViT through Gaussian Process on Global Architecture Factors [11.0] 我々はガウス過程を利用して、MobileViTの性能とグローバルアーキテクチャ要素の関係を探求する。
本稿では, モデルサイズと計算コストを最小化し, モデル精度を向上する大域的アーキテクチャ因子のマジック4D立方体をツイストする設計原理を提案する。
実験結果から,CNN や移動型 ViT を多種多様なデータセットで大幅に上回る結果が得られた。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:41:24 GMT)
Evading Community Detection via Counterfactual Neighborhood Search [11.0] コミュニティ検出は、ソーシャルメディアプラットフォームが共通の関心を共有しているユーザーの密接な結び付きのあるグループを見つけるのに有用である。
一部のユーザーは、プラットフォームを離れることなく、政治的、宗教的な組織との連携など、様々な理由で匿名性を維持し、コミュニティ検出をオプトアウトしたいと考えるかもしれない。
本研究では,ネットワークグラフの構造的特性を戦略的に変更して,与えられたコミュニティ検出アルゴリズムによって1つ以上のノードが識別されるのを防ぐ,コミュニティメンバシップ隠蔽の課題に対処する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:34:53 GMT)
Collaborative Team Recognition: A Core Plus Extension Structure [10.8] 本研究では,学術的なグラフデータを用いた共同チーム認識と内部パターンの探索に焦点をあてる。
大規模ネットワークにおける協調型チーム認識のための「コア+拡張型」チーム構造を用いた協調型チーム認識モデルを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:12:35 GMT)
Federated Representation Learning in the Under-Parameterized Regime [10.6] フェデレート・表現学習(FRL)は、クライアントが共通の表現をトレーニングし、パーソナライズされた頭を維持しながら連携する、パーソナライズド・フェデレーション・ラーニング(FL)フレームワークである。
本稿では、新しいFRLアルゴリズムFLUTEを提案し、線形モデルに対するサンプルの複雑さと収束率を理論的に特徴づける。
実験により、FLUTEは、合成タスクと実世界のタスクの両方において、最先端のFRLソリューションよりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:00:07 GMT)
Meta-Control: Automatic Model-based Control Synthesis for Heterogeneous Robot Skills [10.4] 本稿では,特定のタスクに合わせて,カスタマイズされた状態表現と制御戦略を作成するメタコントロルを提案する。
私たちの中核的な洞察は、人間の専門家が制御システムの設計に使用する思考プロセスを自動化するために、メタ制御システムを構築することができるということです。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:22:41 GMT)
Diffusion-based Generative Image Outpainting for Recovery of FOV-Truncated CT Images [10.4] truncated chest CT のフィールド・オブ・ビュー (FOV) 回復は, 正確な体組成解析に不可欠である。
生成画像のアウトペイントを用いて, 切り抜きCTスライスを復元する手法を提案する。
我々のモデルは,87%の少ないデータでトレーニングされているにもかかわらず,切り離された解剖学を確実に回復し,過去の最先端を上回ります。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:15:29 GMT)
3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos [10.3] 3DGStreamは実世界のダイナミックシーンの効率的なFVVストリーミングのために設計された手法である。
提案手法は,12秒以内のフレーム毎の高速な再構築と,200FPSでのリアルタイムレンダリングを実現する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:39:50 GMT)
When Swarm Learning meets energy series data: A decentralized collaborative learning design based on blockchain [10.1] 機械学習モデルは、将来のエネルギー生産または消費を予測する機能を提供する。
しかし、特定のエネルギーセクター内の法と政策の制約は、様々な情報源のデータを利用する際に技術的ハードルをもたらす。
本稿では,集中型サーバをブロックチェーンベースの分散ネットワークに置き換えるSwarm Learningスキームを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:42:26 GMT)
Variational Inference for Uncertainty Quantification: an Analysis of Trade-offs [10.1] p$ が分解されない場合、任意の分解された近似 $qin Q$ は以下の3つの不確実性尺度のうちの1つを正確に推定できることを示す。
古典的なKulback-Leiblerの発散、より一般的なR'enyiの発散、および$nabla log p$ と $nabla log q$ を比較するスコアベースの発散を考える。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:43:56 GMT)
AICoderEval: Improving AI Domain Code Generation of Large Language Models [10.1] この分野の研究を促進するために,AICoderEvalデータセットをオープンソースとして公開しています。
我々は,LLMが現実世界のタスクに関連するコードを生成するのを支援するために,エージェントベースのフレームワークであるCoderGenを提案する。
AICoderEvalをベースとしたllama-3を改良したAICoderという,より強力なタスク固有コード生成モデルをトレーニングしています。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:45:38 GMT)
A model of early word acquisition based on realistic-scale audiovisual naming events [10.0] 音声知覚入力における正規性からの統計的学習により,早期語が獲得できる範囲について検討した。
生音声の統計的規則性や画素レベルの視覚入力から学習するモデルを用いて,12ヵ月までの幼児の語学学習を現実的な環境でシミュレーションした。
以上の結果から, 幼児期と同等の語彙成長速度で, 単語の認識とそれに対応する視覚オブジェクトの関連付けを効果的に学習できることが示唆された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:05:59 GMT)
Dealing with unbounded gradients in stochastic saddle-point optimization [10.0] 本研究では,凸凹関数のサドル点を求める一階法の性能について検討する。
悪名高い課題は、最適化中に勾配が任意に大きくなることだ。
本稿では,反復を安定化し,有意義な性能保証を与える,シンプルで効果的な正則化手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:31:14 GMT)
Compositional Generalization with Grounded Language Models [10.0] 基底言語モデルは、知識グラフのような外部情報ソースを使用して、事前学習に関連する一般的な課題を満たす。
本研究では,構成性の異なる側面を対象とする知識グラフと組み合わせた自然言語質問を生成する手法を開発した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:56:51 GMT)
Contextual Feature Selection with Conditional Stochastic Gates [9.8] 条件ゲート(c-STG)は、文脈変数に基づいてパラメータが予測される条件変数を用いて、特徴の重要性をモデル化する。
我々は,c-STGは,予測精度と解釈可能性を高めつつ,特徴選択能力の向上につながることを示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:01:08 GMT)
CTSyn: A Foundational Model for Cross Tabular Data Generation [9.6] Cross-Table Synthesizer (CTSyn) は、表データ生成に適した拡散ベースの基礎モデルである。
CTSynは、実用性と多様性において既存のテーブルシンセサイザーを著しく上回っている。
また、実際のデータで達成可能なものを超えて、下流機械学習のパフォーマンスを独自に向上させる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:04:21 GMT)
Markov chain Monte Carlo without evaluating the target: an auxiliary variable approach [9.4] サンプリングタスクでは、ターゲット分布を正規化定数まで知ることが一般的である。
正規化されていない分布を評価するのは 費用がかかるか 不可能だ
提案と受入拒否の両方で補助変数を使用できる新しいフレームワークを開発する。
このフレームワークからいくつかの新しいアルゴリズムが登場し、合成データセットと実データセットの両方でパフォーマンスが改善された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:06:23 GMT)
RLStop: A Reinforcement Learning Stopping Method for TAR [9.3] 本稿では、強化学習に基づく新しい技術支援レビュー(TAR)の停止ルールであるLStopを紹介する。
RLStopは、文書の検査を停止する最適な点を特定するために報酬関数を使用して、サンプルランキングに基づいて訓練される。
論文参考訳(メタデータ) (Fri, 07 Jun 2024 11:50:16 GMT)
FlamePINN-1D: Physics-informed neural networks to solve forward and inverse problems of 1D laminar flames [9.3] The FlamePINN-1D framework is proposed to solve the forward and inverse problem of 1D laminar flames based on Physics-informed neural network。
従来の手法と比較して、FlamePINN-1Dは微分可能でメッシュフリーであり、離散化エラーがなく、逆問題に対して実装が容易である。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:57:34 GMT)
BEADs: Bias Evaluation Across Domains [9.2] 大規模言語モデル(LLM)は、トレーニングデータからバイアスを継承し、永続することができる。
我々は、幅広いNLPタスクをサポートするために、BEAD(Bias Evaluations Across Domains)データセットを紹介します。
我々の経験的分析は、BEADが異なる言語モデル間でのバイアスの検出と低減に有効であることを示している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:29:48 GMT)
Characterizing Biphoton Spatial Wave Function Dynamics with Quantum Wavefront Sensing [9.1] 量子シャック・ハートマン波面センサを導入し、双光子空間波動関数の効率的かつ参照不要な計測を行う。
我々の研究は、量子物理および適応光学における決定的なステップであり、高次相関やトポロジカルパターンで量子光学場を特徴づける道を開く。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:37:45 GMT)
CarbonSense: A Multimodal Dataset and Baseline for Carbon Flux Modelling [9.1] データ駆動型カーボンフラックスモデリングのための、最初の機械学習対応データセットであるCarbonSenseを紹介する。
我々の実験は、マルチモーダルなディープラーニング技術がこの領域にもたらす可能性を示している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:47:40 GMT)
Constrained Decoding for Secure Code Generation [9.0] 本稿では、コードLLMがセキュアかつ正しいコードを生成する能力を測定するための新しいベンチマークであるCodeGuard+を紹介する。
我々は,現在最先端の防御技術であるプレフィックスチューニングが,セキュアなコードを生成するが機能的正当性を犠牲にしているため,従来考えられていたほど強力ではないことを示す。
セキュアなコードを生成するための制約付き復号法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:47:15 GMT)
A Manifold Representation of the Key in Vision Transformers [8.9] 本稿では、キーをクエリと値から切り離し、キーの多様体表現を採用するという概念について検討する。
実験の結果,鍵を多様体構造で切り離して付与することで,モデルの性能が向上することがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:41:05 GMT)
Measuring Fairness in Large-Scale Recommendation Systems with Missing Labels [8.9] 大規模レコメンデーションシステムでは、多数のアイテムが製品ごとに正確なユーザの好みを把握できないため、ラベルの欠落がよくある問題となる。
それまでの手法では、これらのサンプルが欠落したラベルを負として扱うことが多かったが、これは真理の公平さの基準から大きく逸脱する可能性がある。
そこで本研究では,最小のランダム化トラフィックを用いてフェアネスの指標を正確に推定する手法を提案する。
論文参考訳(メタデータ) (Fri, 07 Jun 2024 20:14:13 GMT)
LLMs Are Not Intelligent Thinkers: Introducing Mathematical Topic Tree Benchmark for Comprehensive Evaluation of LLMs [8.9] 大規模言語モデル(LLM)は、数学的推論において印象的な能力を示す。
我々はMathematical Topics Tree (MaTT)ベンチマークを提示する。
最上級モデルであるGPT-4は,複数選択シナリオにおいて,わずか54%の精度を達成した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:21:26 GMT)
Harder or Different? Understanding Generalization of Audio Deepfake Detection [8.9] 最近の研究は、音声のディープフェイク検出における重要な課題を強調している。
これは、テキスト音声(TTS)モデルの品質が継続的に向上していること、すなわち、より新しいDeepFakesは単に'ハード'で検出できるのか?
ドメイン内テストデータとドメイン外テストデータのパフォーマンスギャップを'ハードネス'と'ディファレンス'コンポーネントに分解することで、この問題に答える。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:53:07 GMT)
Diverse Intra- and Inter-Domain Activity Style Fusion for Cross-Person Generalization in Activity Recognition [8.9] 既存のドメイン一般化(DG)手法は、ドメイン内およびドメイン間スタイルの多様性を捉える際の課題に直面することが多い。
本研究では,ドメインパディングとして概念化されたプロセスである,この問題に対処するための新しい視点を探求する。
条件付き拡散モデルを用いてこの概念をインスタンス化し、データ生成の多様性を高めるためのスタイル融合サンプリング戦略を導入する。
従来の条件誘導サンプリングとは対照的に、我々のスタイル融合サンプリング戦略は、1つ以上のランダムなスタイルを柔軟に利用してデータ合成をガイドすることができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:37:30 GMT)
MTS-Net: Dual-Enhanced Positional Multi-Head Self-Attention for 3D CT Diagnosis of May-Thurner Syndrome [8.8] May-Thurner syndrome (MTS) は、人口の20%以上に影響を与える可能性があり、腸大腿深部静脈血栓症のリスクが高まる。
CT スキャンによるMay-Thurner 症候群の診断のために,MTS-Net という3次元深層学習手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:51:09 GMT)
Evaluating SZZ Implementations: An Empirical Study on the Linux Kernel [8.7] ゴーストコミットがSZZアルゴリズムに与える影響の評価は依然として限られている。
Linuxカーネル開発者は、標準のプラクティスとして、対応するバグ誘発コミット(s)のコミット識別子でバグ修正パッチのラベル付けを始めた。
本稿では6つのSZZアルゴリズムを76,046対のバグ修正パッチとLinuxカーネルからのバグ発生コミットに適用する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:22:24 GMT)
CONFIDE: Contextual Finite Differences Modelling of PDEs [8.5] 本稿では、以前に見つからなかったダイナミクスによって生成されたデータサンプルから明示的なPDEを推測する手法を提案する。
本研究は,SOTA法とSOTA法との比較,および溶液の異なるフレーバーを調べたアブレーション研究の広範な実験結果を含む。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:40:16 GMT)
Uncovering Bias in Large Vision-Language Models with Counterfactuals [8.4] 大規模視覚言語モデル(LVLM)によるテキストに含まれる社会的バイアスについて検討する。
異なる対物集合の画像を条件付けしながら、同一のオープンエンドテキストプロンプトを持つLVLMを提案する。
入力画像に表現される人種,性別,身体的特徴などの社会的特性は,有毒度や有能な関連語の発生に大きく影響することがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:29:19 GMT)
Out-of-Domain Generalization in Dynamical Systems Reconstruction [8.4] DSRの一般化に対処する形式的なフレームワークを提供する。
ブラックボックス DL 技術は,十分な構造的先行性を持たず,一般に一般化された DSR モデルを学ぶことができないことを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:38:25 GMT)
Jacobi Set Simplification for Tracking Topological Features in Time-Varying Scalar Fields [8.3] ヤコビ集合は、2つの成分スカラー場の勾配が互いに整合する点の集合である。
ヤコビ集合は臨界点の時間トラックに対応し、特徴追跡グラフとして機能する。
本稿では,時間変化場に対する還元ジャコビ集合を計算する手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:31:29 GMT)
RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for Program Repair [8.3] そこで我々は,APRの最適なコード表現を微調整モデルで識別する新しいプログラム修復手法であるRe repairLLaMAを提案する。
これにより、AIでバグを修正するのに非常に効果的なプログラム修復アダプタが提供される。
全体として、Re repairLLaMAは144のDefects4J v2と109のHumanEval-Javaバグを正しく修正し、すべてのベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:21:26 GMT)
Causal Representation Learning Made Identifiable by Grouping of Observational Variables [8.2] 因果表現学習(Causal Representation Learning)は、データ駆動型で隠れた機能の因果モデルを学ぶことを目的としている。
ここでは、新規で弱い制約に基づく識別可能性を示す。
また,モデルに整合した新たな自己教師付き推定フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:11:08 GMT)
AGALE: A Graph-Aware Continual Learning Evaluation Framework [7.9] シングルラベルノードとマルチラベルノードの両方に対応可能なグラフ認識評価フレームワークを開発した。
特に、新しいインクリメンタル設定を定義し、データセットに適したアルゴリズムを考案する。
理論的にアガレを解析し、比較手法の性能におけるホモフィリーの役割について新たな知見を提供する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:50:36 GMT)
On Provable Length and Compositional Generalization [7.9] 一般的なシーケンス・ツー・シーケンスモデルに対して、長さと合成の一般化に関する最初の証明可能な保証を提供する。
異なるアーキテクチャの限られた容量バージョンは、長さと構成の一般化の両方を達成することを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:25:05 GMT)
Deep Discriminative to Kernel Density Graph for In- and Out-of-distribution Calibrated Inference [7.8] ランダムフォレストやディープニューラルネットワークのような深い差別的アプローチは、最近、多くの重要な現実世界のシナリオで応用を見出した。
しかし、これらの学習アルゴリズムを安全クリティカルなアプリケーションにデプロイすることは、特に、配布内および配布外の両方のデータポイントの信頼性校正を確実にする際の懸念を提起する。
本稿では,IDとOODの校正問題を共同で解決する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:10:00 GMT)
TDT Loss Takes It All: Integrating Temporal Dependencies among Targets into Non-Autoregressive Time Series Forecasting [7.8] ターゲット間の時間的依存関係(TDT)の学習は、予測シーケンスを参照する時系列予測の改善に寄与する。
我々は,TDT学習を非自己回帰的手法に統合することは,効率的な時系列予測の追求に不可欠であると主張している。
本稿では,パラメータフリーかつプラグアンドプレイの最適化,すなわち TDT Loss を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:21:06 GMT)
Towards objective and interpretable speech disorder assessment: a comparative analysis of CNN and transformer-based models [7.8] 頭頸部癌(HNC)は、患者の発話能力に大きな影響を与え、生活の質に影響を及ぼす。
本研究では,HNC患者を対象とした音声分類のための自己教師型Wav2Vec2モデルを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:51:52 GMT)
InterpreTabNet: Distilling Predictive Signals from Tabular Data by Salient Feature Interpretation [7.7] 本稿では,注意機構をGumbel-Softmax分布からサンプリングした潜在変数としてモデル化するTabNetモデルの変種を提案する。
これにより、KLディバージェンス正規化器を用いて、注意マスクの異なる概念を学習できるようにモデルを正規化することができる。
モデルの有効性を最大化し、解釈可能性を向上させるようなスパーシティを促進することで、重複した特徴選択を防止する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:35:25 GMT)
Potential Applications of Quantum Computing at Los Alamos National Laboratory [7.6] 過去10年間の量子コンピューティング技術の出現は、量子力学システムの研究における変革的な影響の可能性を示している。
本稿では,ロスアラモス国立研究所の様々な量子物理学研究活動を強化するために,量子コンピューティング技術をどのように活用できるかを詳細に検討する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:49:01 GMT)
REPLAY: Modeling Time-Varying Temporal Regularities of Human Mobility for Location Prediction over Sparse Trajectories [7.5] 位置予測のための時間変化の時間的規則性を把握するための一般RNNアーキテクチャ学習であるREPLAYを提案する。
特に、REPLAYは、情報の隠された過去の状態を探すために、スパース軌跡の距離を利用するだけでなく、時間変化の時間的規則性も許容する。
その結果、REPLAYは位置予測タスクにおいて、最先端の手法を7.7%から10.9%向上させることができた。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:14:26 GMT)
Graph Data Condensation via Self-expressive Graph Structure Reconstruction [7.5] 我々は textbfSelf-presentive Graph Structure textbfReconstruction による textbfGraph Data textbfCondensation という新しいフレームワークを紹介した。
提案手法は,元のグラフ構造を凝縮過程に明示的に組み込んで,凝縮ノード間の不規則な相互依存性を捕捉する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:36:34 GMT)
Enhancing Size Generalization in Graph Neural Networks through Disentangled Representation Learning [7.4] DISGENは、グラフ表現からサイズ因子をアンタングルするために設計された、モデルに依存しないフレームワークである。
実験の結果, DISGENは実世界のデータセットにおいて, 最先端のモデルよりも最大6%優れていた。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:19:24 GMT)
Accelerating evolutionary exploration through language model-based transfer learning [7.4] 本稿では,伝達学習と遺伝子発現プログラミングを統合する手法を提案する。
このフレームワークは自然言語処理技術を統合し、過去の最適化で探索された方程式から相関や繰り返しパターンを識別する。
本結果は,移動学習機構によって導出された初期解が,改良された解に対するアルゴリズムの収束率を高めることを裏付けるものである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:05:52 GMT)
Submodular Framework for Structured-Sparse Optimal Transport [7.0] 非平衡最適輸送(UOT)は、非正規化対策の柔軟な枠組みとロバスト性により、近年注目を集めている。
本研究では,UOT設定における疎輸送計画の学習(構造化)について検討する。
本稿では,最近検討された平均誤差に基づく UOT を用いた新しい空間制約付き UOT の定式化を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:11:04 GMT)
ACE Metric: Advection and Convection Evaluation for Accurate Weather Forecasting [7.0] 本研究では, モデルによる対流・対流予測の精度を評価するために, 対流・対流誤差(ACE)測定値を提案する。
We have confirmeded the ACE evaluation metric on the WeatherBench2 and movingMNIST datasets。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:49:59 GMT)
CDeFuse: Continuous Decomposition for Infrared and Visible Image Fusion [7.0] 新たな分解機構である連続分解核融合(CDeFuse)を提案する。
CDeFuseは元の3部分解を各スケールでより一般的なK部分解に拡張する。
K部分分解を支援するために連続分解モジュール(CDM)を導入する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:01:47 GMT)
PANDORA: Deep graph learning based COVID-19 infection risk level forecasting [7.0] 新型コロナウイルスの感染リスクの早期のシグナルを提供するためには、適切な予測システムが不可欠である。
COVID-19の感染リスクを予測するため,PANDORAと呼ばれる深層グラフ学習モデルを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:27:22 GMT)
Quantum Computing for nonlinear differential equations and turbulence [7.0] 非線形方程式と量子ハードウェアのための量子アルゴリズムの開発の進展について論じる。
非線形方程式の量子アルゴリズムと量子ハードウェアの概念のペアリングを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:52:08 GMT)
Nacala-Roof-Material: Drone Imagery for Roof Detection, Classification, and Segmentation to Support Mosquito-borne Disease Risk Assessment [6.9] モザンビークの高解像度ドローン画像を含むNacala-Roof-Materialデータセットをリリースする。
このデータセットは、オブジェクトの検出、分類、セグメンテーションを含むマルチタスクコンピュータビジョン問題を定義する。
それぞれの手法には利点があるが、全てのタスクに勝るものはなく、マルチタスク学習における将来の研究のためのデータセットの可能性を強調している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:07:23 GMT)
Integrating Multimodal Data for Joint Generative Modeling of Complex Dynamics [6.8] 最適復元のための様々な情報ソースを組み合わせるための効率的なフレームワークを提供する。
我々のフレームワークは完全にテキスト生成され、訓練後に、基底真理系と同じ幾何学的、時間的構造を持つ軌道を生成します。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:12:00 GMT)
FUSU: A Multi-temporal-source Land Use Change Segmentation Dataset for Fine-grained Urban Semantic Understanding [6.8] 都市セマンティック理解のための土地利用変化セグメンテーションデータセットであるFUSUを紹介した。
FUSUは、これまでで最も詳細な土地利用分類システムであり、17のクラスと300億ピクセルのアノテーションがある。
中国南部と北部の5つの都市部で847km2をカバーし、0.2-0.5mの地中サンプルと月毎の光学・レーダー衛星時系列の両時間高解像度衛星画像を含んでいる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:03:41 GMT)
Multi-target stain normalization for histology slides [6.8] 我々は,複数の参照画像を活用する新しい手法を導入し,染色変化に対する堅牢性を高める。
提案手法はパラメータフリーであり,有意な変化のない既存の計算病理パイプラインに適用可能である。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:09:41 GMT)
A Unified View of Group Fairness Tradeoffs Using Partial Information Decomposition [6.7] 本稿では,機械学習における顕著なグループフェアネス概念の関係について,新しい情報理論的視点を紹介する。
我々の主な貢献は、部分情報分解(PID)と呼ばれる情報理論における作業の本体を活用することにより、これらの3つの不公平性の正確な関係を解明することである。
本研究では,これら3つの不公平度尺度が重複し,相互に相反し,潜在的なトレードオフにつながるような粒状領域を特定するためにPIDを利用する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:38:51 GMT)
OST: Efficient One-stream Network for 3D Single Object Tracking in Point Clouds [6.7] 本稿では,従来のシームズネットワークで発生した相関操作を回避するために,インスタンスレベルのエンコーディングの強みを活かした新しい一ストリームネットワークを提案する。
提案手法は,クラス固有のトラッキングだけでなく,より少ない計算と高い効率でクラスに依存しないトラッキングを実現する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:49:55 GMT)
Cooperative Meta-Learning with Gradient Augmentation [6.5] 本稿では,CMLと呼ばれる新しいメタラーニングフレームワークを提案する。
本研究では,CMLと呼ばれる新しいメタラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:54:00 GMT)
DepsRAG: Towards Managing Software Dependencies using Large Language Models [6.5] ソフトウェア依存関係の管理は、ソフトウェア開発における重要なメンテナンスタスクである。
近年のLarge Language Models (LLM) の進歩により、様々なデータソースから情報を取得することができる。
提案手法は,概念検索拡張生成(RAG)手法の実証である。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:07:11 GMT)
Normal-guided Detail-Preserving Neural Implicit Functions for High-Fidelity 3D Surface Reconstruction [6.4] RGBまたはRGBD画像からニューラル暗黙表現を学習する現在の方法は、欠落した部分と詳細を持つ3D曲面を生成する。
本稿では,1次微分特性を持つニューラル表現のトレーニング,すなわち表面正規化が,高精度な3次元表面再構成をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:48:47 GMT)
Stealing Trust: Unveiling Vulnerabilities in Web3 Authentication [6.3] 本稿では,Web3認証プロセスの脆弱性を調査し,新たな攻撃方法を提案する。
攻撃では、攻撃者はユーザーがメッセージのソースを検証できないことを悪用して、ターゲットアプリケーションから盲目的にメッセージに署名するようユーザを騙す。
我々は,Web3認証関連APIと対話して脆弱性を特定する動的検出ツールであるWeb3AuthCheckerを開発した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:54:45 GMT)
What do MLLMs hear? Examining reasoning with text and sound components in Multimodal Large Language Models [6.3] 音声キャプション/分類実験を通じて、音声MLLMは、音声キャプションを生成する際に、LLMのテキストベースの推論を完全に活用できないことを示す。
また,LLMからオーディオエンコーダへの推論経路を分離するなど,聴覚情報とテキスト情報を別々に表現するMLLMが原因である可能性についても検討する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:55:00 GMT)
A Bregman Proximal Perspective on Classical and Quantum Blahut-Arimoto Algorithms [6.3] Blahut-Arimotoアルゴリズムは、古典的なチャネル容量とレート歪み関数を計算するためのよく知られた方法である。
近年の研究では、様々な量子アナログを計算するためにこのアルゴリズムを拡張している。
このBlahut-Arimotoアルゴリズムがミラー降下の特別な例であることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:46:28 GMT)
ADBA:Approximation Decision Boundary Approach for Black-Box Adversarial Attacks [6.3] ブラックボックス攻撃はステルス性があり、機械学習モデルからハードラベルを使用して敵の例を生成する。
本稿では,近似決定境界(ADB)を用いて摂動方向を効率よく正確に比較する手法を提案する。
我々のADBアプローチ(ADBA)の有効性は、適切なADBを迅速に同定し、全ての摂動方向を確実に区別することにある。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:09:25 GMT)
Graph Mining under Data scarcity [6.2] 汎用グラフニューラルネットワーク(GNN)上に適用可能な不確実性推定フレームワークを提案する。
エンド・ツー・エンドの設定で、$n$-way、$k$-shotという古典的なエピソード学習パラダイムの下でこれらのモデルをトレーニングします。
提案手法は,GNNを用いたグラフ上のFew-shotノード分類における不確実性推定器の有効性を示すベースラインよりも優れる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:50:03 GMT)
SUMIE: A Synthetic Benchmark for Incremental Entity Summarization [6.1] 既存のデータセットは、言語モデルがエンティティの要約を段階的に更新できるかどうかを適切にテストしていません。
我々は、実世界のIES課題を明らかにするために設計された、完全に合成されたデータセットであるSUMIEを紹介する。
このデータセットは、誤ったエンティティアソシエーションや不完全な情報提示といった問題を効果的に強調する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:49:21 GMT)
DVOS: Self-Supervised Dense-Pattern Video Object Segmentation [6.1] Dense Video Object (DVOS) のシナリオでは、各ビデオフレームは数百もの小さな、密度が高く、部分的に隠されたオブジェクトを含んでいる。
マルチタスク学習による拡散に基づくDVOSの半時間的アプローチを提案する。
提案手法の有用性と有効性を示すために, ハンドヘルドビデオとドローンキャプチャビデオの小麦頭部分割のためのDVOSモデルを開発した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:58:36 GMT)
Robust Survival Analysis with Adversarial Regularization [6.0] サバイバル分析(Survival Analysis、SA)とは、関心事が起こるまでの時間をモデル化することである。
最近の研究は、SAの複雑な関係を捉えるためにニューラルネットワーク(NN)を使用することの利点を実証している。
これらのモデルをトレーニングするために使用されるデータセットは、しばしば不確実性にさらされることを示している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:07:16 GMT)
LogiCode: an LLM-Driven Framework for Logical Anomaly Detection [6.0] LogiCodeは、大規模言語モデル(LLM)を利用して、産業環境における論理的異常を識別する新しいフレームワークである。
論理的推論にLLMを利用することで、LogiCodeはPythonコードを自動生成し、不正な量や欠落要素などの異常を特定できる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:01:06 GMT)
Online Frequency Scheduling by Learning Parallel Actions [6.0] 周波数リソースは、同じサブバンド内の同時送信を許可しながら、ユーザのセットに割り当てられる必要がある。
従来の手法は、関連するすべての制約や不確実性に対処するには不十分である。
本稿では,並列決定機能を備えたQラーニングアーキテクチャであるサブバンド上でのアクションブランチに基づくスケジューラを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:14:51 GMT)
Compilation Quotient (CQ): A Metric for the Compilation Hardness of Programming Languages [6.0] プログラミング言語の複雑さの重要な側面は、プログラムのコンパイルがいかに難しいかである。
コンパイルの難易度を定量化する指標であるコンパイル商(CQ)を導入する。
Cは48.11、C++は0.60、Javaは0.27、Haskellは0.13である。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:28:05 GMT)
A Tensor Decomposition Perspective on Second-order RNNs [5.9] CPRNNと呼ばれるCP分解を用いた2RNNのパラメータ化モデルについて検討する。
ランクと隠れサイズがモデルキャパシティに与える影響を分析し、これらのパラメータに基づいてRNN, 2RNN, MIRNN, CPRNN間の関係を示す。
これらの結果はPenn Treebankデータセットの実験によって実証的に支援され、固定パラメータ予算により、CPRNNは、RNN、2RNN、MIRNNよりも、適切なランクと隠されたサイズで優れていることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:18:32 GMT)
Querying and Repairing Inconsistent Prioritized Knowledge Bases: Complexity Analysis and Links with Abstract Argumentation [5.9] 優先知識ベース(KB)に対する不整合の問題について検討する。
本稿では, 接地拡張に着想を得た優先順位付きKBのセマンティクスを提案し, 良好な特性を享受する。
本研究は、嗜好に基づく議論フレームワークに関する独立した関心の結果ももたらした。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:42:55 GMT)
Rene: A Pre-trained Multi-modal Architecture for Auscultation of Respiratory Diseases [5.8] 本稿では,呼吸音の認識に適した大規模モデルであるReneを紹介する。
我々の革新的なアプローチは、事前訓練された音声認識モデルを用いて呼吸音を処理している。
我々は,Reneアーキテクチャを用いた実時間呼吸音識別システムを開発した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:01:23 GMT)
An inexact LPA for DC composite optimization and application to matrix completions with outliers [5.7] 本稿では,複合最適化問題のクラスについて述べる。
合成構造を利用することで、ポテンシャル関数が反復列において1/2$のKL特性を持つ条件を与える。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:12:12 GMT)
Autoregressive Transformer Neural Network for Simulating Open Quantum Systems via a Probabilistic Formulation [5.7] オープン量子システムのダイナミクスに対処するためのアプローチを提案する。
自己回帰変換ニューラルネットワークを用いて量子状態をコンパクトに表現する。
効率的なアルゴリズムは、リウヴィリア超作用素の力学をシミュレートするために開発された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:36:11 GMT)
From Stream to Pool: Pricing Under the Law of Diminishing Marginal Utility [5.6] 我々は、独占販売業者と繰り返しやりとりする顧客に対して、textbfpool$を調査する。
特に,ディスカウント関数が一定であれば,プールモデルによりストリームモデルが復元される。
我々は、非適応的で詳細のない(すなわち、バリュエーションを「知る」)政策を提示し、競争比1/kで達成する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:09:06 GMT)
Cross-Domain Synthetic-to-Real In-the-Wild Depth and Normal Estimation for 3D Scene Understanding [5.6] クロスドメイン推論技術は合成データから学習し、地中一方向の3Dシーンの深さと正常度を推定する。
UBotNetは、UNetとBottleneck Transformer要素を組み合わせて、一貫したシーンの正規性と深さを予測するアーキテクチャである。
我々は,我々の合成OmniHorizonデータセットのみをトレーニングしたUBotNetを用いて,実際の屋外画像に対するドメイン間合成-実深度と正規推定の有効性を検証した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:26:05 GMT)
Optimal Recurrent Network Topologies for Dynamical Systems Reconstruction [5.5] 時系列測定から基礎となる動的過程の生成モデルを推定することを模索する。
ここでの一般的な戦略はパラメータのプルーニングであり、すべてのパラメータを小さな重みで除去する。
幾何プルーニングとは対照的に,アトラクタの幾何構造への寄与度の低いプルーニング重みを除去し,パラメータの負荷を大幅に低減できることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:41:17 GMT)
Zero, Finite, and Infinite Belief History of Theory of Mind Reasoning in Large Language Models [5.5] 大規模言語モデル(LLM)は、最近、心の理論(ToM)能力の約束と出現を見せている。
我々は、ゼロ、有限、無限信仰史によるToM推論という新しい概念、分類学、枠組みを提案する。
我々はこのゲームで6つのLDMを評価し、Zero Belief HistoryでのパフォーマンスはFinite Belief Historyより一貫して優れていることがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:04:39 GMT)
Data-Driven Observability Analysis for Nonlinear Stochastic Systems [5.5] 区別可能性と可観測性は力学系の鍵となる性質である。
両概念は線形システムを含むシステムのクラスに等価であることを示す。
2つの状態が高信頼で識別可能なしきい値を決定するための統計的テストを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:54:54 GMT)
InstructNav: Zero-shot System for Generic Instruction Navigation in Unexplored Environment [5.4] 本研究では,汎用的な命令ナビゲーションシステムであるInstructNavを提案する。
InstructNavは、ナビゲーショントレーニングやビルド済みのマップを使わずに、さまざまな命令ナビゲーションタスクを最初に処理する。
InstructNavでは、R2R-CEタスクを初めてゼロショットで完了し、多くのタスク学習方法より優れています。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:26:34 GMT)
Underwater Image Enhancement by Diffusion Model with Customized CLIP-Classifier [5.4] 水中画像強調(UIE)は、低品質の入力から視覚的品質を改善することを目的としている。
UIE タスクに Contrastive Language- Image Pretraining (CLIP) の可能性を生かした新しいフレームワークである CLIP-UIE を提案する。
具体的には,大気中の自然画像から実際の水中領域に誘導される対応する水中画像に分解することで,合成画像の合成に色移動を用いることを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:07:18 GMT)
Error Bounds of Supervised Classification from Information-Theoretic Perspective [5.3] 誤差は, 分布の滑らかさとサンプルサイズの影響を受け, 予測されるリスクの上限となる。
実験による検証により, 導出理論境界と実用的予測リスクとの間に有意な正の相関が認められた。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:07:35 GMT)
Hyper-CL: Conditioning Sentence Representations with Hypernetworks [5.2] 我々は、ハイパーネットワークとコントラスト学習を統合し、条件付き文表現を計算する効率的な手法であるHyper-CLを紹介する。
提案手法では,計算済み条件埋め込みを対応する射影層に変換する。
条件付きセマンティックテキスト類似性と知識グラフ補完という2つの代表的な条件付けベンチマークの評価は,Hyper-CLが文表現の柔軟条件付けに有効であることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:24:05 GMT)
Optimizing Fictitious States for Bell Inequality Violation in Bipartite Qubit Systems [5.2] ベルの不等式違反が架空の状態で観測された場合、量子準状態についても同じことが示される。
さらに、スピンスピン相関を対角化する基底が架空の状態を構成するのに最適であることを解析的に示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:26:21 GMT)
GENIE: Watermarking Graph Neural Networks for Link Prediction [5.1] グラフニューラルネットワーク(GNN)は、グラフ構造化データを利用して機械学習の分野を進歩させた。
近年の研究では、GNNはモデルスティーリング攻撃に弱いことが示されている。
透かしはGNNモデルのIPを保護するのに有効であることが示されている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:12:01 GMT)
BERTs are Generative In-Context Learners [5.1] 本稿では,DeBERTaを付加訓練なしで生成モデルとして動作させることができる,恥ずかしいほど単純な推論手法を提案する。
本研究は,テキスト内学習のパラダイムを現代に導入したGPT-3を,DeBERTaが適合し,さらに超えることを示すものである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:48:45 GMT)
Assessing News Thumbnail Representativeness: Counterfactual text can enhance the cross-modal matching ability [5.1] ニュース画像がニューステキストで議論されているアクターを表すかどうかに焦点をあてる。
我々は,1000個のニュースサムネイル画像とテキストペアのデータセットであるNewsTTを紹介する。
仮説に従って視覚と言語バイエンコーダを更新するコントラスト学習フレームワークであるCFT-CLIPを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:56:09 GMT)
A Language Model-Guided Framework for Mining Time Series with Distributional Shifts [5.1] 本稿では,大規模言語モデルとデータソースインタフェースを用いて時系列データセットを探索・収集する手法を提案する。
収集したデータは外部ソースから得られるが、一次時系列データセットと重要な統計特性を共有できる。
収集されたデータセットは、既存のデータセット、特にデータ分散の変化を効果的に補うことができることを示唆している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:21:07 GMT)
Hypernetworks for Personalizing ASR to Atypical Speech [5.0] メタ学習型ハイパーネットワークを用いて,多種多様な非定型音声特性に対して,高度に個別化された発話レベル適応を生成する。
ハイパーネットは,全パラメータ予算の0.1%を用いて,WERの相対的な75.2%削減を維持しつつ,分布外話者よりも一般化されていることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:14:50 GMT)
FAdam: Adam is a natural gradient optimizer using diagonal empirical Fisher information [5.0] 我々はアダムの対角的経験的フィッシャー情報行列(FIM)を厳密に分析した。
我々の分析は、元のAdamアルゴリズムの欠陥を明らかにし、提案された修正に繋がる。
修正アルゴリズムであるFisher Adam (FAdam) は、様々な領域で優れた性能を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:11:11 GMT)
Low-Resource Cross-Lingual Summarization through Few-Shot Learning with Large Language Models [4.9] 言語間要約(XLS)は、ソース言語文書とは異なる対象言語で要約を生成することを目的としている。
大規模言語モデル(LLM)では、ゼロショットXLSのパフォーマンスが期待できるが、このタスクの少数ショット機能はまだ探索されていない。
Mistral-7B-Instruct-v0.2, GPT-3.5, GPT-4など, 各種モデルのXLS性能について検討した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:31:41 GMT)
TabPFGen -- Tabular Data Generation with TabPFN [4.7] 高性能トランスであるTabPFNをエネルギーベース生成モデルに変換し、TabPFGenをダブする。
本稿では,データ拡張,クラスバランス,計算処理など,標準的な生成モデルタスクに関する強力な結果を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:59:37 GMT)
Exploiting Activation Sparsity with Dense to Dynamic-k Mixture-of-Experts Conversion [4.7] トランスフォーマーモデルは大きなアクティベーション間隔を示し、推論コストを削減するために利用することができる。
本研究では,基本モデルの活性化間隔を適切に正規化することにより,変換効率を大幅に向上できることを示す。
また、より効果的な動的k専門家選択ルールを導入し、実行された専門家の数をトーケンベースで調整する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:03:34 GMT)
Attention Fusion Reverse Distillation for Multi-Lighting Image Anomaly Detection [4.7] 本研究は,MLIADにおける複数入力を処理するための注意融合逆蒸留法を提案する。
Eyecandiesの実験は、AFRDが他のMLIAD代替品よりも優れたMLIAD性能を達成することを示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:26:37 GMT)
Pitch-Aware RNN-T for Mandarin Chinese Mispronunciation Detection and Diagnosis [4.6] We introduced a stateless RNN-T model for Mandarin MDD, using HuBERT features with pitch embedded through a Pitch Fusion Block。
我々のモデルは、ネイティブ話者データのみに基づいて訓練されており、電話誤り率を3%改善し、非ネイティブシナリオにおける最先端のベースラインよりもFalse Acceptance Rateを7%向上させた。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:59:58 GMT)
ON-OFF Neuromorphic ISING Machines using Fowler-Nordheim Annealers [4.6] 本稿では,Ising問題の基底状態への収束を確保するために設計されたニューロモルフィックアーキテクチャであるNeuroSAを紹介する。
我々は,NeuroSAをSpiNNaker2プラットフォーム上で実装し,提案したアーキテクチャを標準的なニューロモルフィック・アクセラレーションプラットフォームにマッピングする可能性を強調した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:18:09 GMT)
Deep learning for precipitation nowcasting: A survey from the perspective of time series forecasting [4.5] 本稿では,ディープラーニングを用いた時系列降水予測モデルの最近の進歩を概観する。
予測モデルを,将来のフレームを予測するためのアプローチに基づいて,テキスト再帰戦略とテキスト多重戦略に分類する。
筆者らは,現在,降水予測のための深層学習モデルの評価を行い,その限界と課題について議論し,いくつかの有望な研究方向性を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:07:09 GMT)
Decoherence rate in random Lindblad dynamics [4.5] ランダムリンドブラッド作用素が支配する開カオス量子系の力学について検討する。
我々の研究は、散逸的量子カオスにおけるデコヒーレンスの主要な特徴を特定する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:05:06 GMT)
Experiences from Integrating Large Language Model Chatbots into the Classroom [4.4] 学生に最先端の大規模言語モデル(LLM)チャットボットへの未フィルタリングアクセスを提供する。
あらゆるコースにおいて、LLMの使用の大部分は少数のスーパーユーザーから来ていた。
低使用率の潜在的な理由について議論し、よりカスタマイズされた足場付きLLM体験の必要性を示唆する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:37:14 GMT)
GameBench: Evaluating Strategic Reasoning Abilities of LLM Agents [4.4] 大規模言語モデルの戦略的推論能力を評価するためのクロスドメインベンチマークであるGameBenchを紹介する。
我々は9つの異なるゲーム環境に焦点を当て、戦略ゲームで特定される重要な推論スキルの少なくとも1つの軸をカバーする。
戦略的推論能力の向上を目的とした2つの足場フレームワークとともに,GPT-3とGPT-4をベースとして評価を行った。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:28:43 GMT)
Relational Self-supervised Distillation with Compact Descriptors for Image Copy Detection [4.3] 本稿では,著作権保護のためのオンライン共有プラットフォームにおける課題である画像コピー検出について述べる。
本稿では,軽量ネットワークとコンパクトディスクリプタを用いて,競争力のある性能を実現する手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:51:41 GMT)
XctDiff: Reconstruction of CT Images with Consistent Anatomical Structures from a Single Radiographic Projection Image [4.2] XctDiffは、単一のラジオグラフからCTを再構成するためのアルゴリズムフレームワークである。
まず,ロバストな3D先行情報を抽出できるプログレッシブな特徴抽出戦略を設計する。
次に,抽出した先行情報を用いて,潜伏空間におけるCT再構成を誘導する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:50:19 GMT)
Software Engineering for Collective Cyber-Physical Ecosystems [4.1] 今日の分散コンピューティングは、大規模なサイバー物理エコシステムに対処している。
自己組織化システムやロボティクススワムなどの分野における最近の進歩は、補完的な視点を築き上げている。
この記事では、ソフトウェア工学におけるこの「コレクティブ・コンピューティング・パラダイム」のモチベーション、技術の現状、そしてその意味について論じる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:28:22 GMT)
Subsystem symmetries, critical Bose surface, and immobile excitations in an extended compass model [4.1] サブシステム対称性は スピン励起の移動性を強く制限する
強四極子相では、1つの励起は個別に「フラクトン」に類似している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:22:13 GMT)
Creating an AI Observer: Generative Semantic Workspaces [4.0] 我々は、$textbf[G]$enerative $textbf[S]$emantic $textbf[W]$orkspace (GSW)を紹介します。
GSWは、伝統的に定義されたレキシコンラベルのセットとは対照的に、生成的なスタイルのセマンティックフレームワークを作成する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 00:09:13 GMT)
NeuralThink: Learning Algorithms For Consistent and Efficient Extrapolation Across General Tasks [3.9] そこで我々は,より小さな問題からアルゴリズムを学習できる新しい深層思考アーキテクチャを提案する。
我々は、NeuralThinkが、より大きな問題への外挿において、最先端の深層思考アプローチを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:10:09 GMT)
Experimental Evaluation of ROS-Causal in Real-World Human-Robot Spatial Interaction Scenarios [3.9] ロボット空間相互作用における因果発見のためのROSベースのフレームワークであるROS-Causalの実験的検討を行った。
データ収集中にロボットが因果モデルを直接抽出する方法を示す。
シミュレーションから生成されたオンライン因果関係モデルは、実験結果と一致している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:20:30 GMT)
Black Box Differential Privacy Auditing Using Total Variation Distance [3.8] 本稿では,機械学習モデルにおける差分プライバシ保証を,小さなホールドアウトデータセットを用いて評価する実践的手法を提案する。
本手法は,トレーニングデータのサブセットとホールドアウトデータセットを用いて得られたスコア間の総変動(TV)距離を推定する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:52:15 GMT)
Schrödinger Bridge with Quadratic State Cost is Exactly Solvable [3.8] 本稿では,2次状態のコスト・ツー・ゴーを有するSchr"odinger橋の正規化変種を提案する。
従来のシュル・オーディンガー橋とは異なり、正規化は状態依存的な確率質量の殺害と生成の速度を誘導する。
この結果から,2次状態のSchr"odingerブリッジの計算に動的シンクホーン再帰を用いることが可能である。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:17:59 GMT)
Unveiling Competition Dynamics in Mobile App Markets through User Reviews [3.7] モバイルアプリ市場分析を支援するための,新しい自動手法を提案する。
提案手法は,新たに公開されたユーザレビューに基づいて,定量的なメトリクスとイベント検出技術を活用する。
本研究の結果から,選択された市場セグメント内の関連事象の検出に関する実証的証拠が得られた。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:39:51 GMT)
Partial Information Decomposition for Data Interpretability and Feature Selection [3.7] PIDF(Partial Information Decomposition of Features)は、データの同時解釈と特徴選択のための新しいパラダイムである。
合成データと実世界のデータの両方を用いてPIDFを広範囲に評価し,その可能性と有効性を示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:04:47 GMT)
Guarding Multiple Secrets: Enhanced Summary Statistic Privacy for Data Sharing [3.7] 本稿では,データ共有における多極的サマリ統計量の定義,分析,保護を行う新しいフレームワークを提案する。
我々は,攻撃者がデータ公開機構のプライバシーリスクを,サマリ統計シークレットの推測に成功している最悪の確率で測定する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:21:16 GMT)
LangCell: Language-Cell Pre-training for Cell Identity Understanding [3.7] 我々は,最初のLanguage-Cell事前学習フレームワークであるLangCellを紹介した。LangCellは,セルアイデンティティ情報に富んだテキストを利用して,クロスモーダル知識の深い理解を得る。
異なるベンチマークで実施された実験の結果、LangCellはゼロショットセルアイデンティティ理解のシナリオで効果的に機能する唯一のシングルセルPLMであることがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:22:54 GMT)
GenHeld: Generating and Editing Handheld Objects [3.6] 我々は3次元ハンドモデルや2次元画像に条件付き保持オブジェクトを合成する逆問題にGenHeldを提案する。
GenHeld 3Dは、オブジェクトコードと呼ばれるコンパクトなオブジェクト表現を使用して、大きなデータセットから可塑性保持オブジェクトを選択することができる。
GenHeld 2Dは、GenHeld 3Dの能力と拡散ベースの画像編集を組み合わせることで動作する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:31:41 GMT)
Contextual fusion enhances robustness to image blurring [3.6] 哺乳類の脳は、特定の感覚のモダリティに特化した脳領域に情報を統合することで複雑な推論を処理する。
我々は、ImagenetとPlaces365で訓練されたCNNの背景特徴と前景特徴を組み合わせた融合モデルを開発した。
我々は,MS COCOにおける人間の知覚可能な摂動に対する頑健さを検証した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:50:18 GMT)
Probabilistic and Causal Satisfiability: the Impact of Marginalization [3.4] 確率的・因果的言語で表される満足度問題に焦点をあてる。
線形言語はNPPP-, PSPACE-, NEXP完全満足度問題をもたらすことを示す。
また、与えられたベイズネットワーク、有向非巡回グラフ構造、あるいは小さなサイズに制限された制約付きモデルについても検討する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:35:11 GMT)
Do Language Models Exhibit Human-like Structural Priming Effects? [3.4] 本稿では,言語モデル予測に影響を与える言語要因について検討する。
我々は、構造的プライミングのパラダイムを利用し、最近の構造への露出は、同じ構造の処理を容易にする。
これらの効果は、人間のプライミングで知られている逆周波数効果によって説明でき、プライミング効果はプライミング効果を増大させる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:21:52 GMT)
Individual Packet Features are a Risk to Model Generalisation in ML-Based Intrusion Detection [3.4] 個々のパケット特徴(IPF)は、タイミング、サイズ、およびソース決定情報などの単一のネットワークパケットから抽出された属性である。
我々はIPFの限界を特定し、誤って高い検出率が得られることを示す。
本研究は,堅牢な侵入検知のためのパケット相互作用を考慮したアプローチの必要性を強調した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:05:33 GMT)
Automated Trustworthiness Testing for Machine Learning Classifiers [3.3] 本稿では,テキスト分類器が信頼に値するかどうかを判断する信頼度オラクルを自動生成するTOWERを提案する。
我々の仮説は、その説明中の単語が予測されたクラスと意味的に関連している場合、予測は信頼に値するというものである。
その結果,TOWERはノイズの増加に伴って信頼性の低下を検出することができるが,人為的ラベル付きデータセットに対して評価しても有効ではないことがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:25:05 GMT)
ChatPCG: Large Language Model-Driven Reward Design for Procedural Content Generation [3.3] 本稿では,大規模言語モデル(LLM)による報酬設計フレームワークChatPCGを提案する。
ゲーム専門知識と組み合わさった人間レベルの洞察を活用して、特定のゲーム機能に合わせた報酬を自動的に生成する。
ChatPCGは深層強化学習と統合されており、マルチプレイヤーゲームコンテンツ生成タスクの可能性を示している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:18:42 GMT)
Causal Inference with Cocycles [3.3] このような介入の下で,大規模な因果モデルによって満たされる局所対称性特性を示す。
現時点において、この対称性はコサイクルと呼ばれるある種の写像によって特徴づけられる。
因果推定のためのコサイクルに基づく推定器を導出し, 典型的な条件下で半パラメトリックな効率が得られることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:13:58 GMT)
VTrans: Accelerating Transformer Compression with Variational Information Bottleneck based Pruning [3.3] 本稿では,変分情報ボトルネック (VIB) の原理によって導かれる反復的刈り取りフレームワーク VTrans を提案する。
提案手法は,VIBトレーニングマスクを用いた埋め込み,アテンションヘッド,層など,すべての構造成分を圧縮する。
特に,本手法は従来の最先端手法よりも最大70%圧縮を実現する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 22:07:46 GMT)
Determination of All Unknown Pure Quantum States with Two Observables [3.2] 主系上の極小観測値を用いて純粋量子状態から情報を効率的に抽出することは、量子情報理論における長年の根本的問題である。
2つの直交基底は測度ゼロ集合を無視して2d-1$の有限候補を効果的にフィルタリングできることを示す。
また、ほとんどの純粋なキューディットは、中央にPOVMを適応的に組み込んだ上で、補完的な可観測性を測定することで、一意に決定できることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:21:24 GMT)
Leveraging Generative AI for Extracting Process Models from Multimodal Documents [3.2] Generative Pre-trained Transformer (GPT) は、マルチモーダル(テキストおよびイメージベース)入力からグラフィカルなプロセスモデルを自動的に生成することができる。
以上の結果から,GPTはマルチモーダル入力に基づく半自動プロセスモデリングに有用であることが示唆された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:24:05 GMT)
TLEX: An Efficient Method for Extracting Exact Timelines from TimeML Temporal Graphs [3.1] 我々は、TimeMLアノテートテキストからタイムラインを抽出するTLEX(TimeLine Extraction)と呼ばれる、正確なエンドツーエンドソリューションを開発した。
TLEXはTimeMLアノテーションをトランクとブランチ構造に配置されたタイムラインのコレクションに変換する。
123のテキストが矛盾しており、181のテキストには1つ以上の実世界またはメインタイムラインがあり、4つのコーパスに2,541の未決定セクションがある。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:20:32 GMT)
Generative modeling of density regression through tree flows [3.0] 本稿では,表データの密度回帰タスクに適したフローベース生成モデルを提案する。
本稿では,木質変換を分割・対数戦略を用いて適合させる学習アルゴリズムを提案する。
本手法は, トレーニングおよびサンプリング予算のごく一部において, 同等あるいは優れた性能を継続的に達成する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:07:35 GMT)
An explainable three dimension framework to uncover learning patterns: A unified look in variable sulci recognition [3.0] 我々は、堅牢で忠実で、複雑でないグローバルな説明を提供する、説明可能な人工知能(XAI)の3Dフレームワークを開発した。
そこで本研究では,TOP-OSLOによる596名の被験者を対象に,各種3次元深層学習ネットワークを訓練し,評価し,評価した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:12:16 GMT)
Tie-Breaking Rule Based on Partial Proof of Work in a Blockchain [2.9] 既存のブロックチェーンシステムの実証に容易に適用可能な別の対策を提案する。
提案手法は, 部分的証明の特性を用いて, チェインタイにおける最終生成ブロックをマイナーが選択できるようにする。
Bitcoinのような既存のシステムですでに満たされている弱い同期のみが効果的な機能のために必要である。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:56:31 GMT)
Leveraging Activations for Superpixel Explanations [2.9] ディープニューラルネットワークの説明ツールキットでは、サリエンシ手法が標準となっている。
本稿では,ディープニューラルネットワーク画像分類器の活性化からセグメンテーションを抽出することで,セグメンタへの依存を避けることを目的とする。
我々のいわゆるNuro-Activated Superpixels(NAS)は、モデルの予測に関連する入力に対する関心領域を分離することができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:37:45 GMT)
Advancing Histopathology-Based Breast Cancer Diagnosis: Insights into Multi-Modality and Explainability [2.8] マルチモーダル技術を用いて、画像データと非画像データを統合することで、乳癌の診断における変革的な進歩を示す。
本稿では,マルチモーダルデータを用いて診断精度,臨床信頼度,患者のエンゲージメントを高めるための説明性を強調する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:23:22 GMT)
XTTS: a Massively Multilingual Zero-Shot Text-to-Speech Model [2.7] Zero-shot Multi-Speaker TTS (ZS-TTS) システムは単一の言語しかサポートしていない。
XTTSは16の言語で訓練され、その大半で最先端のSOTA(State-of-the-art)を達成した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:56:11 GMT)
Enhanced Semantic Segmentation Pipeline for WeatherProof Dataset Challenge [2.7] 本報告では、WeatherProofデータセットチャレンジの勝利ソリューションについて述べる。
本稿では,この課題に対するセマンティックセグメンテーションパイプラインの強化を提案する。
我々は、より広い視角を持つ新しいデータセットであるWeatherProofExtraを導入し、データ拡張手法を採用した。
私たちのソリューションは、最終リーダーボードで1位にランクされています。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:18:56 GMT)
Analysis and Evaluation of Kinect-based Action Recognition Algorithms [2.7] 我々は,HDGアルゴリズムの実装と改良を行い,UWA3D Multiview Activity データセットを用いたクロスビュー動作認識に適用した。
実験の結果,HDGの精度は,他の3つの最先端アルゴリズムよりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:07:32 GMT)
Models That Prove Their Own Correctness [2.7] 我々は,その出力の正しさを証明する自己証明モデルを,対話的証明を通じて検証アルゴリズムとして$V$で訓練する。
ランダムな入力に対して高い確率で、モデルは正しい出力 *and* を生成し、その正しさを$V!$に証明する。
学習方法は,GCDを演算する自己証明変換器を訓練するために用いられ,その解答の正しさが証明される。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:00:05 GMT)
Robust Inference of Dynamic Covariance Using Wishart Processes and Sequential Monte Carlo [2.6] 本稿では,WishartプロセスのためのSMCサンプルについて紹介する。
SMCサンプリングは, 動的共分散の最も頑健な推定と外乱予測をもたらすことを示す。
提案手法が臨床うつ病のデータセットに有効であることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:48:11 GMT)
On Subjective Uncertainty Quantification and Calibration in Natural Language Generation [2.6] 大規模言語モデルは多くの場合、不確実な定量化が困難になるような自由形式の応答を生成する。
この研究はベイズ決定論の観点から、我々の効用は類似度尺度によって特徴づけられるという前提から、これらの課題に対処する。
本稿では,質問応答と機械翻訳タスクに関する提案手法について述べる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:54:40 GMT)
Solving the Zeh problem about the density operator with higher-order statistics [2.6] ゼアが想像した2つの混合物と同じローの混合物は区別されるべきである。
この結果は, 統計的混合物に不規則に設置した制約を抑えるが, ローの一般利用には影響しないことを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:19:23 GMT)
Proposal of ensemble qubits with two-atom decay [2.6] 本研究では,アンサンブル量子ビットの実装のための新しい手法を提案し,解析する。
要求される不調和性は、2つの原子の同時崩壊によって与えられる。
原子アンサンブルでは、2-原子崩壊は2次元量子多様体を生成、安定化する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:52:45 GMT)
An optimization-based equilibrium measure describes non-equilibrium steady state dynamics: application to edge of chaos [2.6] 神経力学を理解することは、機械学習、非線形物理学、神経科学において中心的なトピックである。
力学は非線形であり、特に非勾配、すなわち駆動力はポテンシャルの勾配として書けない。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:29:08 GMT)
Morescient GAI for Software Engineering [2.5] ソフトウェアエンジニアリングタスクにジェネレーティブAI(GAI)を使用することは、ソフトウェアエンジニアリング研究の最も急速に拡大している分野の1つである。
我々は,オープンサイエンスの原則に従って,そのような「科学的」なGAIモデルをいかに設計し,発展し,普及させるか,というビジョンを提示する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:38:33 GMT)
CTBENCH: A Library and Benchmark for Certified Training [2.5] 認定トレーニングのための高品質なベンチマークであるCTBENCHを紹介する。
CTBENCHのほぼ全てのアルゴリズムが、文学における報告された性能を上回っていることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:27:18 GMT)
Single-Atom Verification of the Optimal Trade-Off between Speed and Cost in Shortcuts to Adiabaticity [2.5] adiabaticityへのショートカットは、量子情報処理におけるadiabatic dynamicsの効果的な実行を可能にする。
我々の研究は、断熱性に対するショートカットの基本的な制約を理解し、未利用位相空間のポテンシャルを照らすのに役立ちます。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:32:05 GMT)
Bayesian Structural Model Updating with Multimodal Variational Autoencoder [2.4] 提案手法は, 加速度および動的ひずみ測定を併用した単層建築物の数値モデルを用いてベンチマークを行った。
様々な動的解析モデルに適用可能な高次元相関同時観測に特に適している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:12:51 GMT)
Orchestrating time and color: a programmable source of high-dimensional entanglement [2.3] 高次元量子状態は、高度に汎用的で効率的な量子情報科学(QIS)フレームワークの基礎を提供する。
ここでは、パラメトリックフォトニック最大絡み合ったTM状態に基づいて、任意のQISアプリケーションに対して重要なビルディングブロックを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:00:49 GMT)
player2vec: A Language Modeling Approach to Understand Player Behavior in Games [2.2] 過去の行動ログから潜在ユーザ表現を学習する手法は、eコマース、コンテンツストリーミング、その他の設定におけるレコメンデーションタスクの注目を集めている。
本稿では,長距離トランスフォーマーモデルをプレイヤーの行動データに拡張することで,この制限を克服する新しい手法を提案する。
ゲームにおける行動追跡の具体性について議論し,文中の単語に類似した方法でゲーム内イベントを視聴することで,前処理とトークン化のアプローチを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 22:01:05 GMT)
Quantum amplification and simulation of strong and ultrastrong coupling of light and matter [2.2] 単一光子レベルでの光と物質の相互作用は、物理学の様々な分野において中心的な重要性を持つ。
量子光-マター相互作用の増幅と超強光-マター相互作用のシミュレーションの進歩は、過去10年間に行われた。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:18:55 GMT)
Contour-weighted loss for class-imbalanced image segmentation [2.2] 画像のセグメンテーションは、ほとんど全ての医療画像解析において、自動解釈と処理において極めて重要である。
クラス内とクラス間のデータ不均衡のため、イメージセグメンテーションを実行することはしばしば困難である。
本稿では,コンパクトで効果的な輪郭重み付き損失関数を用いた新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:43:52 GMT)
StackSight: Unveiling WebAssembly through Large Language Models and Neurosymbolic Chain-of-Thought Decompilation [2.1] StackSightは静的解析アルゴリズムを通じて仮想スタックの変更を視覚化し、追跡し、チェーン・オブ・シークレット・プロンプトを適用する。
評価結果は、StackSightがWebAssemblyの逆コンパイルを大幅に改善していることを示している。
またユーザ調査では、StackSightが生成したコードスニペットの勝利率が大幅に高く、コードのセマンティクスをよりよく把握できることを示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:08:17 GMT)
Composition Vision-Language Understanding via Segment and Depth Anything Model [2.1] このライブラリは、DAM(Depth Anything Model)、SAM(Segment Anything Model)、GPT-4V(GPT-4V)の機能を相乗化する。
シンボリック・インスタンスレベルでのセグメンテーションと深度解析の融合により、我々のライブラリは言語モデルに対するニュアンスな入力を提供する。
本研究は,ニューラルシンボリック統合による視覚言語モデルの進展を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:28:06 GMT)
A Grassroots Architecture to Supplant Global Digital Platforms by a Global Digital Democracy [2.1] Grassrootsプラットフォームは、地域コミュニティにグローバルデジタルプラットフォームに代わるものを提供し、メンバーのスマートフォンでのみ動作する。
このような共同体は、初期資本や外部クレジットなしでデジタル経済を形成し、主権的な統治と連邦を行使することができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:37:02 GMT)
Protein pathways as a catalyst to directed evolution of the topology of artificial neural networks [2.0] 我々は,タンパク質ネットワーク(PN)の構造的特性,相互作用,ダイナミクスを基盤とした,新しいバイオインスパイアされた設計に向けて,ANN(Artificial Neural Networks)の進化に向けたパラダイムシフトを提案する。
1) 何百万年もの進化のおかげで、DNA内のタンパク質の相互作用を効率的にコードし、APNをシリコンDNAに変換する方法、(2) 自然が私たちの遺伝子にネットワークを構築する方法から学び、EA進化を通じて新しい、よりスマートなネットワークを設計できるようにする方法、そして
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:35:08 GMT)
Do Internal Software Metrics Have Relationship with Fault-proneness and Change-proneness? [2.0] 私たちは、ApacheとEclipseのエコシステムにおける変更の発端と欠陥の発端の計測とともに、25の社内ソフトウェアメトリクスを特定しました。
ほとんどのメトリクスは、障害発生率とほとんど、あるいは全く相関を持っていません。
継承、結合、コメントに関連するメトリクスは、変更の傾向と中程度から高い相関を示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:19:56 GMT)
Language models emulate certain cognitive profiles: An investigation of how predictability measures interact with individual differences [1.9] 本研究では,人間の読取時間データに基づく言語モデル (LM) から推定した,主観的・エントロピー的測度の予測力を再考する。
本研究は,認知的スコアに対する主観的・エントロピーの調整が,読解時間の予測精度を向上させるかどうかを考察する。
本研究は,ほとんどのケースにおいて,認知能力の付加は,読書時間における主観的・エントロピーの予測能力を増加させることを示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:54:56 GMT)
A novel reliability attack of Physical Unclonable Functions [1.9] Physical Unclonable Functions(PUF)は、IoTデバイスのための有望なセキュリティプリミティブとして登場している。
その強みにもかかわらず、PUFは従来のおよび信頼性ベースの攻撃を含む機械学習(ML)攻撃に対して脆弱である。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:56:12 GMT)
Optimization of geological carbon storage operations with multimodal latent dynamic model and deep reinforcement learning [1.9] 本稿では,高速フロー予測とGCSの制御最適化のためのディープラーニングフレームワークであるMLDモデルを紹介する。
既存のモデルとは異なり、MDDは多様な入力モダリティをサポートし、包括的なデータインタラクションを可能にする。
この手法は従来の手法よりも優れており、計算資源を60%以上削減し、最も高いNPVを達成する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:30:21 GMT)
Algorithms for learning value-aligned policies considering admissibility relaxation [1.8] 価値認識工学の新たな分野は、ソフトウェアエージェントとシステムは価値を意識すべきである、と主張している。
本稿では,局所的なアライメントに基づく戦略のための$epsilontext-ADQL$と,一連の決定のための$epsilontext-CADQL$という2つのアルゴリズムを提案する。
干ばつシナリオにおいて,水分散問題における効率性を検証した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:10:07 GMT)
Quantum Algorithms and Applications for Open Quantum Systems [1.8] オープン量子系の基本理論の簡潔な要約を提供する。
次に、最近の量子アルゴリズムに関する議論を掘り下げる。
我々は,本分野の現実的な化学,生物,物質システムへの適用性を実証し,関連する応用の議論を締めくくった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:02:22 GMT)
An algorithm for forensic toolmark comparisons [1.7] 我々は、連続的に製造されたスロットド・ドライバーを用いて、様々な角度と方向から3Dツールマークのデータセットを生成する。
PAMクラスタリングにより、角度や方向ではなく、ツールによるクラスタリングがあることが分かる。
他のツールやファクタのデータ収集では、他のタイプのツールマークを比較するために使用することができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:37:59 GMT)
Quantum Simulation of Spin-Boson Models with Structured Bath [1.7] トラップされたイオンは、オープン量子系の量子力学をシミュレートするための自然なプラットフォームを提供する。
完全プログラム可能な制御パラメータにランダム性を加えることにより,浴槽温度と連続スペクトル密度を調整する能力を示す。
実験結果は理論的な予測と密接に一致し、トラップイオン系を用いたオープン量子系のシミュレーションが成功したことを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:11:37 GMT)
The two-spin enigma: from the helium atom to quantum ontology [1.7] 物理的事実を分析し、仮に説明するために、実験に基づく証拠から始めます。
その結論は、古典物理学と量子物理学は、もう片方なしでは機能しないし、考えもしないということだ。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:43:30 GMT)
Accessible Adventures: Teaching Accessibility to High School Students Through Games [1.7] 中西部高校の生徒に共感型ゲームでアクセシビリティを教えた。
学生は、ゲーム後に障害者に対するアクセシビリティと共感に関する知識と意識を高めた。
ゲームを活用することで、次世代のソフトウェアデザイナーにアクセシビリティを教えるための洞察を提供することを目指している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:44:24 GMT)
Verifying the Generalization of Deep Learning to Out-of-Distribution Domains [1.6] ディープニューラルネットワーク(DNN)は、機械学習の分野において重要な役割を果たす。
DNNは時折、一般化に伴う課題、すなわち訓練中に遭遇しなかった入力を処理できなくなることがある。
この制限は、セーフティクリティカルなタスクにディープラーニングをデプロイする上で、重要な課題である。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:01:51 GMT)
Analyzing the factors that are involved in length of inpatient stay at the hospital for diabetes patients [1.5] 新型コロナウイルスの感染拡大に伴う糖尿病患者の急増に伴う懸念について検討した。
本研究の目的は,糖尿病患者の入院期間に影響を与える因子を定量化する予測モデルを構築することである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:13:21 GMT)
LinkQ: An LLM-Assisted Visual Interface for Knowledge Graph Question-Answering [1.5] LinkQは,大規模言語モデル(LLM)を活用して,自然言語質問応答による知識グラフ(KG)クエリ構築を容易にするシステムである。
以上の結果から,KG質問応答にLinkQが有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:28:31 GMT)
Research on Tumors Segmentation based on Image Enhancement Method [1.5] 従来の肝小葉分割法は、肝小葉分割を行う際のいくつかの課題に直面することが多い。
新しいモデルは、画像のコントラストと明るさを適応的に調整することで、画像の重要な特徴を強化する新しい画像強調アルゴリズムを詳細に記述する。
深層学習に基づくセグメンテーションネットワークを導入し,腫瘍領域の検出精度を最適化するために,強調画像に特化して訓練を行った。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:25:04 GMT)
From Worst to Average Case to Incremental Search Bounds of the Strong Lucas Test [1.5] 強力なルーカステストは暗号ライブラリで広く使われている確率的原始性テストである。
素数検定では、最悪の場合の誤差確率は、合成物を素数として誤って特定する可能性の上限として機能する。
本稿では, 整数が$t$連続試験ラウンドをパスし, 計算コストの低い追加の標準テストとともに, 実際に素数であることを示すことによって, ギャップを解消する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:58:13 GMT)
Trapping polar molecules by surface acoustic waves [1.5] 圧電材料の表面音響波(SAW)によって誘導される電気力で極性分子を捕捉する手法を提案する。
外部の電気力により、SAWによって誘導される電場は極性分子を単層または多層格子にトラップすることができる。
極性分子BHモデルに基づく超流動絶縁体とモットの相転移は,SAW誘起電位によって変調できることがわかった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:31:00 GMT)
Spiking Neural Networks for event-based action recognition: A new task to understand their advantage [1.4] スパイキングニューラルネットワーク(SNN)は、そのユニークな時間的ダイナミクスによって特徴づけられる。
フィードフォワードニューラルネットワークにおいて、スパイキングニューロンが時間的特徴抽出を可能にする方法を示す。
また、繰り返しSNNがLSTMに匹敵する結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:51:14 GMT)
Generative AI Models: Opportunities and Risks for Industry and Authorities [1.4] 生成AIモデルは、伝統的に創造性と人間の理解を必要とする幅広いタスクを実行することができる。
トレーニング中に既存のデータからパターンを学び、その後、新しいコンテンツを生成することができる。
生成AIモデルを使用することで、考慮すべき新たなITセキュリティリスクがもたらされる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:34:30 GMT)
Evaluating the Effectiveness of Data Augmentation for Emotion Classification in Low-Resource Settings [1.4] 低リソースデータセットを用いたマルチラベル感情分類タスクにおける異なるデータ拡張手法の有効性を評価した。
Back Translationはオートエンコーダベースのアプローチよりも優れており、トレーニングインスタンス毎に複数の例を生成することで、さらなるパフォーマンス向上につながった。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:13:27 GMT)
CHSH Bell Tests For Optical Hybrid Entanglement [1.3] ハイブリッドエンタングルメントは2つの量子ビットの間に生成され、1つは1つの光子に符号化され、もう1つは反対の位相でコヒーレントな状態にある。
異種量子ネットワークのような様々な量子技術への道を開き、連続的および離散的な可変符号化をマージし、情報の転送と相互変換を可能にする。
本稿では,Cluser-Horne-Shimony-Holt (CHSH) Bellの不等式試験の徹底的な研究を行い,光ハイブリッド絡み合わせのための量子相関の実用的検証を可能にする。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:36:17 GMT)
Research on an Autonomous UAV Search and Rescue System Based on the Improved [1.3] 本稿では,EGO-Plannerアルゴリズムに基づく自律検索・救助UAVシステムを提案する。
逆モータバックステッピングの手法を用いて、UAVの全体的な飛行効率を高め、マシン全体の小型化を図る。
同時に、双方向A*アルゴリズムとオブジェクト検出アルゴリズムによって最適化されたEGO-Planner計画ツールも導入した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:00:52 GMT)
Massively Multiagent Minigames for Training Generalist Agents [1.3] 本稿では,強化学習ベンチマークとして使用する多エージェントミニゲームの集合であるMeta MMOを紹介する。
Meta MMOは、NeurIPSの2つのコンペティションの対象となった、非常にマルチエージェントな環境であるNeural MMO上に構築されている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:41:05 GMT)
AHA! Strategies for Gaining Insights into Software Design [1.3] これらのパターンは、私がソフトウェア設計と研究の領域において、新しい、または非正統な洞察を見つけるために使う戦略を記述しています。
パターンは、私たちが何を言っているのかと何をしているのかの矛盾によって駆動され、これらの矛盾に対処するための実用的な洞察を見つけるための技術を提供します。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:50:01 GMT)
AudioSetMix: Enhancing Audio-Language Datasets with LLM-Assisted Augmentations [1.2] 近年,音声言語領域におけるマルチモーダル学習は大きな進歩を遂げている。
しかし、音声学習は、画像言語タスクと比較して、限られたデータや低品質のデータによって困難に直面している。
本手法は,音声クリップを自然言語ラベルと対応する音声信号処理操作で拡張することにより,音声キャプチャペアを体系的に生成する。
このスケーラブルな方法は、テキストおよびオーディオ関連モデルの高品質なトレーニングデータセットであるAudioSetMixを生成する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:15:26 GMT)
Slow and Stored Light via Electromagnetically Induced Transparency Using A $Λ$-type Superconducting Artificial Atom [1.2] 所望の$da$型人工原子を実現する単一の超伝導クビット共振器系
グループ速度3.6km/sのスローライトと、数百ナノ秒までのメモリ時間を持つマイクロ波ストレージ。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:21:32 GMT)
Instability in the quantum restart problem [1.2] 古典的ランダムウォーキングプロセスでは,最適平均打点時間の不安定性は認められない。
最適再起動時間と$tau$は、制御パラメータとして階段と急降下のセットを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:47:51 GMT)
The Influencer Next Door: How Misinformation Creators Use GenAI [1.2] 我々は、非専門家がGenAIをリミックス、再パッケージ、そして(再)コンテンツの制作に利用し、彼らの個人的ニーズや欲求に応えていることに気付きました。
我々は、これらの突発的GenAIの使用が、新しいまたは加速された誤情報障害をいかに生み出すかを分析する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:47:50 GMT)
Universal Critical Holography and Domain Wall Formation [1.1] 本研究では,領域壁面長のクエンチ速度に対する普遍的依存性について検討する。
粗い力学はキブル・ズールクのスケーリングを抑え、特性長の普遍的動的スケーリングとシステムの断熱的成長を推し進める。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:56:59 GMT)
fastMRI Breast: A publicly available radial k-space dataset of breast dynamic contrast-enhanced MRI [1.1] このデータキュレーション作業は、乳房MRI検査で取得した乳房DCE-MRIのための放射状k空間とDICOMデータの大規模なデータセットを初めて導入する。
本データセットは, 患者年齢, 更年期状態, 病変(陰性, 良性, 悪性) および各症例の病変タイプを示す症例レベルラベルを含む。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:37:48 GMT)
Local vs. Global Interpretability: A Computational Complexity Perspective [1.0] 計算複雑性理論を用いて、MLモデルの局所的および大域的視点を評価する。
これらのモデルの局所的およびグローバル的解釈可能性に関する知見を提供する。
我々は,計算複雑性レンズによる説明可能性の検証が,MLモデル固有の解釈可能性をより厳密に把握する上で有効であることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:44:52 GMT)
Optimizing Automatic Differentiation with Deep Reinforcement Learning [0.9] 深部強化学習(RL)を利用したヤコビ計算に必要な乗算数を最適化する新しい手法を提案する。
本手法は,様々な領域から取得した複数のタスクに対して,最先端の手法よりも最大33%改善できることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:44:33 GMT)
Is My Data in Your Retrieval Database? Membership Inference Attacks Against Retrieval Augmented Generation [0.9] 本稿では,RAGシステムに対して,メンバーシップ推論攻撃(MIA)を行うための効率的かつ使いやすい手法を提案する。
2つのベンチマークデータセットと複数の生成モデルを用いて攻撃の有効性を示す。
本研究は,RAGシステムにおけるセキュリティ対策の実施の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:39:39 GMT)
ISAACS: Iterative Soft Adversarial Actor-Critic for Safety [0.9] この研究は、ロボットシステムのための堅牢な安全維持コントローラのスケーラブルな合成を可能にする新しいアプローチを導入する。
安全を追求するフォールバックポリシーは、モデルエラーの最悪のケースの実現を促進するために、敵の「混乱」エージェントと共同で訓練される。
学習した制御ポリシーは本質的に安全性を保証するものではないが、リアルタイムの安全フィルタを構築するために使用される。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:05:35 GMT)
A Subexponential Quantum Algorithm for the Semidirect Discrete Logarithm Problem [0.9] グループベースの暗号は、量子後暗号における比較的未発見の家系である。
いわゆる半間接離散対数問題(Semidirect Discrete Logarithm Problem, SDLP)は、その最も中心的な問題の一つである。
SDLPのセキュリティ分析を初めて行った。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:39:10 GMT)
Lookahead Pathology in Monte-Carlo Tree Search [0.8] 数学解析に適したまま、リッチなモデリング可能性を提供する新しい種類の合成ゲームを紹介した。
理論および実験結果から,UCTは,本科から引き出されたゲームにおいて,病的行動に感受性があることが示唆された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:56:48 GMT)
Data-Free Generative Replay for Class-Incremental Learning on Imbalanced Data [0.7] 連続的な学習は、特に不均衡なデータセットを持つ画像分類タスクにおいて、機械学習において難しい問題である。
本稿では、実データにアクセスせずに生成者を訓練するクラスインクリメンタルラーニングのためのData-Free Generative Replay(DFGR)を提案する。
DFGRはMNISTデータセットとFashionMNISTデータセットでそれぞれ88.5%と46.6%の精度を達成している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:51:27 GMT)
SuperPos-Prompt: Enhancing Soft Prompt Tuning of Language Models with Superposition of Multi Token Embeddings [0.7] 事前訓練された言語モデルのパラメータ効率チューニングに有効な手法として,ソフトプロンプトチューニング技術が注目を集めている。
ソフトプロンプトの学習を改善するために,複数の事前学習語彙の埋め込みを重畳した新しい再パラメータ化手法であるSuperPos-Promptを導入する。
我々の実験は、Residual Promptチューニングに対するSuperPos-Promptの優位性を常に強調しており、平均スコアはT5-Smallで$6.4$、T5-Baseで$5.0$である。
驚くべきことに、SuperPos-Promptは時々、完全な微調整方法よりも優れています。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 22:18:49 GMT)
From Link Prediction to Forecasting: Information Loss in Batch-based Temporal Graph Learning [0.7] バッチ指向評価の適合性はデータセットの特性に依存することを示す。
我々は、動的リンク予測をリンク予測タスクとして再構成し、データに存在する時間情報のより良い説明を行う。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:45:12 GMT)
Vulnerable Road User Detection and Safety Enhancement: A Comprehensive Survey [0.7] 脆弱な道路利用者(VRU)を含む交通事故は、世界的な道路事故のかなりの割合を占める。
高度な信号処理と機械学習技術を組み合わせた交通通信エコシステムの進歩は、多様なセンサーからのデータの活用を促進している。
本稿では,VRUの安全性を高めるための最先端技術と方法論を包括的に調査する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:26:41 GMT)
Mixed-Curvature Decision Trees and Random Forests [0.7] 決定木とランダム森林アルゴリズムを混合曲率積空間に拡張する。
環境空間で動作するユークリッド法と比較して,ツールの精度が優れていることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:29:55 GMT)
Development and Validation of a Deep-Learning Model for Differential Treatment Benefit Prediction for Adults with Major Depressive Disorder Deployed in the Artificial Intelligence in Depression Medication Enhancement (AIDME) Study [0.6] 大うつ病(MDD)の薬理学的治療は、試行錯誤のアプローチに依存している。
治療結果のパーソナライズを目的とした人工知能(AI)モデルを導入する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:04:59 GMT)
Residue Number System (RNS) based Distributed Quantum Addition [0.5] 本稿では,Residue Number System (RNS) をベースとした量子変調6%加算器を用いた高深さ量子加算回路を提案する。
RNSベースの分散量子加算回路は、深さが低く、複数の量子コンピュータ/ジョブに分散している。
RNSベースの分散量子加算は、6ビットから10ビットの非分散量子完全加算器よりも出力確率が11.3から133.15%高いことを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:39:14 GMT)
A short review on graphonometric evaluation tools in children [0.5] このレビューは、手書きは認知問題や早期介入を早期に評価するための基本的なツールである、と結論付けている。
記事は、評価方法論に同意し、データベースを組み合わせる必要性を強調して締めくくっている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:38:32 GMT)
Towards a universal QAOA protocol: Evidence of a scaling advantage in solving some combinatorial optimization problems [0.5] 量子近似最適化アルゴリズム(QAOA)は最適化問題を解くための有望なアルゴリズムである。
固定線形ランプスケジュールがQAOAパラメータの普遍的な集合であることを示す。
LR-QAOAは多種多様なCOPの高品質な解を効果的に見つけることができることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:36:23 GMT)
A majorized PAM method with subspace correction for low-rank composite factorization model [0.4] 本稿では,行列補完から生じる低ランク複合因子化モデルについて述べる。
本稿では,部分空間補正を施した近似最小化交互アルゴリズム(AMA)を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:33:22 GMT)
Mobile Network Configuration Recommendation using Deep Generative Graph Neural Network [0.4] GNN(Deep Generative Graph Neural Network)を用いたフレームワークを提案する。
ネットワークをグラフにエンコードし、RANノードごとにサブグラフを抽出し、シームズGNNを使用して埋め込みを学習する。
このフレームワークは、複数のパラメータの設定パラメータを推奨し、誤設定を検出し、ネットワーク拡張と既存のセル再構成の両方を扱う。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:28:18 GMT)
Quantum hardware demonstrations of relativistic calculations of molecular electric dipole moments: from light to heavy systems using Variational Quantum Eigensolver [0.4] 本研究では、変分量子固有解法(VQE)アルゴリズムを相対論的状態に拡張する。
我々は18量子ビットの量子シミュレーションを行い、基底状態エネルギーと単価二原子分子のPDMを得る。
我々は、最適化された一元結合クラスタ状態上で、中程度の重みを持つSrHおよびSrF分子のPDMを測定する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:04:28 GMT)
Visual Acuity Prediction on Real-Life Patient Data Using a Machine Learning Based Multistage System [0.4] 視力(VA)の予測と実生活環境下での劣化の早期検出は、不均一データや不完全データにより困難である。
本稿では,ドイツの最大医療病院の眼科領域の異なるITシステムを融合した研究対応型データコーパスを開発するためのワークフローを提案する。
マクロ平均F1スコアの最終的な予測精度は、57.8と50 +-10.7%の眼科医と同じ範囲でありながら、69 %のマクロ平均F1スコアが得られる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:33:16 GMT)
Fidelity decay and error accumulation in quantum volume circuits [0.4] 忠実度は、回路深さとアーキテクチャ依存のパワーに上昇する量子ビットの数の両方で指数関数的に減衰する。
量子ボリュームテストにおいて量子プロセッサをベンチマークするために用いられる重出力周波数と忠実度との間には、堅牢な線形関係が確立される。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:06:56 GMT)
Multiple-input, multiple-output modal testing of a Hawk T1A aircraft: A new full-scale dataset for structural health monitoring [0.3] 本稿では, 解体されたBAEシステムホークT1Aの動的応答を計測する新しいベンチマークデータセットを提案する。
単純な実験室の試験構造とサービス内構造の間に重要な足場を提供する。
このデータセットを用いて、構造中の非線形性や、異なるタイプの損傷に対する構造物の感度を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:53:24 GMT)
Hexagonal Image Processing in the Context of Machine Learning: Conception of a Biologically Inspired Hexagonal Deep Learning Framework [0.3] 機械学習の文脈における六角形画像処理は、生物学的モデルに基づく進化的動機付け構造の利点を組み合わせた画像処理システムの開発を扱う。
この貢献は、ヘキサゴナル画像処理フレームワークであるヘキサゴナル画像処理フレームワークを合成する一般的なアプリケーション指向のアプローチとして機能する。
生成したテスト環境の結果から,実現されたフレームワークが六角形画像処理システムの現在のアプローチを超越していることが分かる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:31:31 GMT)
Biologically Inspired Hexagonal Deep Learning for Hexagonal Image Generation [0.3] ヘキサゴナルディープ・ラーニング・フレームワークであるヘキサゴナルディープ・ニューラルネットワーク(H-DNN)を利用したヘキサゴナルイメージの生成に役立つ。
生成したテスト環境の結果から,提案したモデルが従来の画像生成のアプローチを超越する可能性が示唆された。
その結果、トレーニング可能なパラメータの形でモデルの複雑さが減少する一方で、正方形のパラメータと比較してテストレートが増加することがより許される。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:32:12 GMT)
A Novel Visual Fault Detection and Classification System for Semiconductor Manufacturing Using Stacked Hybrid Convolutional Neural Networks [0.2] 半導体産業における自動視覚検査は、製造欠陥を検出し分類することを目的としている。
この貢献により、新しいディープニューラルネットワークベースのハイブリッドアプローチが導入される。
階層化されたハイブリッド畳み込みニューラルネットワーク(SH-CNN)を構成し、視覚的注意の現在のアプローチにインスパイアされたシステムは、その構造から詳細レベルに焦点をあてる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 20:30:37 GMT)
Classification Metrics for Image Explanations: Towards Building Reliable XAI-Evaluations [0.2] 解像度法は、入力画像に対して(超)画素単位の特徴属性スコアを提供する。
新たな評価指標を開発し,イメージネット上で一般的な評価手法をベンチマークした。
心理測定テストの概念に基づく,そのような指標の信頼性評価手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:37:50 GMT)
TEDi Policy: Temporally Entangled Diffusion for Robotic Control [0.2] 拡散モデルは、複雑な分布をモデル化する課題を習得することで、ロボット模倣学習において優れている。
近年,拡散型ロボット政策のサンプリング速度は向上しているが,画像生成領域の技法に制限されている。
我々は、軌道生成に特化したフレームワークであるTemporally Entangled Diffusion (TEDi) を適用し、模倣学習のための拡散ベースのポリシーを高速化する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:13:44 GMT)
Performance Analysis of Superconductor-constriction-Superconductor Transmon Qubits [0.2] 超伝導体-絶縁体-超伝導体(SIS)ジョセフソン接合は、共平面超伝導体-超伝導超伝導体(ScS)ナノブリッジ接合に置き換えられる。
ギンズバーグ・ランダウ理論の範囲内では、ナノブリッジScSトランスモンはSISトランスモンよりも電荷分散が良く、非調和性のトレードオフが小さいことが分かる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:20:51 GMT)
Transforming Dental Diagnostics with Artificial Intelligence: Advanced Integration of ChatGPT and Large Language Models for Patient Care [0.2] 本研究は,最先端の大規模言語モデル(LLM)が歯科治療に与える影響を考察し,歯科領域に焦点をあてた。
ChatGPT-4の出現は、特に口腔外科の領域において、歯科診療にかなりの進展をもたらす可能性がある。
学術や医療など、様々な分野における幅広い意味と課題を批判的に評価する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:44:09 GMT)
Information Geometry of Evolution of Neural Network Parameters While Training [0.2] 本稿では,ANNの訓練における位相遷移様の挙動を調べるための情報幾何学的枠組みの応用について紹介する。
トレーニング中のANNの進化は、そのパラメータの確率分布を調べることによって研究される。
ANNのトレーニング中に多様体上の運動の遷移を観察し、この遷移をANNモデルにおける過度な適合と同定する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:42:54 GMT)
Extremization to Fine Tune Physics Informed Neural Networks for Solving Boundary Value Problems [0.2] 関数接続理論(TFC)は、(I)BVPの初期および境界条件(IBC)をPINNに正確に課すために用いられる。
本稿では,TFCフレームワークであるReduceed TFCを改良し,PINNのトレーニングおよび推論時間を大幅に改善することを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:25:13 GMT)
Optimizing Off-Axis Fields for Two-Axis Magnetometry with Point Defects [0.1] 静的バイアス場を慎重に最適化することで、複数の磁場成分を同時に測定できることを実証する。
この研究は、2次ゼーマン効果からの周波数シフトの増加と、オフ軸磁場成分の増加に伴うコントラストの減少の間のトレードオフを定量化する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:16:59 GMT)
Reinforcement Learning and Regret Bounds for Admission Control [0.1] 強化学習アルゴリズムの期待された後悔は、未計算の戻り値に対して$Omegaleft(sqrtDXATright)$で制限される。
UCRL2にインスパイアされたアルゴリズムを提案し、その問題の構造を用いて、有限サーバの場合、$O(Slog T + sqrtmT log T)$で期待される全後悔を上位に制限する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:09:14 GMT)
Quantifying Geospatial in the Common Crawl Corpus [0.1] 本稿では,強力な言語モデルであるGeminiを用いて,Common Crawlリリースにおける地理空間データの有効性について検討する。
5分の1から6分の1の文書には座標や道路アドレスなどの地理空間情報が含まれていると推定する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:16:37 GMT)
BAMO at SemEval-2024 Task 9: BRAINTEASER: A Novel Task Defying Common Sense [0.0] 本稿では,SemEval 2024 Task 9, BRAINTEASER: A Novel Task Defying Common Senseについて概説する。
データセットには、モデルに「ボックスの外」を考えるよう挑戦する、複数選択の質問が含まれている。
提案手法は,文パズルのサブタスクにおいて,全体の85%の精度を実現する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:01:56 GMT)
Adapting Physics-Informed Neural Networks To Optimize ODEs in Mosquito Population Dynamics [0.0] 本稿では,ODE システムの前方および逆問題に対していくつかの改良を加えた PINN フレームワークを提案する。
この枠組みは、蚊の常微分方程式によって生じる勾配不均衡と硬い問題に取り組む。
予備的な結果は、物理インフォームド機械学習が生態システムの研究を前進させる大きな可能性を秘めていることを示している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:40:38 GMT)
W-kernel and essential subspace for frequentist evaluation of Bayesian estimators [0.0] この研究は行列 W とその主空間に焦点をあて、後者を必須部分空間と呼ぶ。
基本部分空間への射影は、感度解析と頻繁な評価において次元的還元を実現する。
フィッシャー核とニューラル・タンジェント核の関係が確立され、古典理論との関係が解明される。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:21:44 GMT)
VERA: Generating Visual Explanations of Two-Dimensional Embeddings via Region Annotation [0.0] Visual Explanations via Region (VERA) は2次元埋め込みの視覚的説明を生成する自動埋め込みアノテーション手法である。
VERAは、埋め込み空間内の異なる領域を特徴付ける情報的説明を生成し、ユーザがその埋め込み風景を一目で概観することができる。
実世界のデータセット上でのVERAの利用について説明するとともに,本手法の有効性を比較ユーザスタディで検証する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:23:03 GMT)
Unveiling Dynamics and Patterns: A Comprehensive Analysis of Spreading Patterns and Similarities in Low-Labelled Ransomware Families [0.0] 本研究の目的は,Bitcoinネットワークで発生したアドレス-トランザクショングラフを,ランサムウェアの低い家庭で解析することである。
我々の目標は、ランサムウェアファミリーの進化を評価するための支払い拡散パターンを特定し、同一の攻撃者によって制御される可能性のある異なる系統間の類似性を検出することである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:00:30 GMT)
Unsupervised representation learning with Hebbian synaptic and structural plasticity in brain-like feedforward neural networks [0.0] 教師なし表現学習が可能な脳様ニューラルネットワークモデルを導入,評価する。
このモデルは、一般的な機械学習ベンチマークのさまざまなセットでテストされた。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:32:30 GMT)
Unraveling-induced entanglement phase transition in diffusive trajectories of continuously monitored noninteracting fermionic systems [0.0] 領域法的な絡み合いを持つ位相から、絡み合いがシステムサイズと対数的にスケールする位相への遷移を示す。
我々の発見は、ノイズの多い量子デバイスにおける量子相関の調整に関係しているかもしれない。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:08:07 GMT)
Unlocking Telemetry Potential: Self-Supervised Learning for Continuous Clinical Electrocardiogram Monitoring [0.0] 本稿では,未標識心電図(ECG)テレメトリー信号の多量化にディープラーニングを適用した。
我々は,約147,000時間の心電図テレメトリデータに基づいて,深層ネットワークのスペクトルを事前学習するために,自己教師学習を適用した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:00:00 GMT)
Two-dimensional Planck spectroscopy for microwave photon calibration [0.0] 閉鎖型極低温システム内におけるマイクロ波損失推定のための改良手法を提案する。
当社のアプローチはプランクの法則に基づいており、低温設定の個々の部分の独立した温度上昇を利用する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:19:48 GMT)
Tightrope-walking rationality in action: Feyerabendian insights for the foundations of quantum mechanics [0.0] Feyerabendが実際に量子力学について書いたことを出発点としています。
我々は本分析を、現実主義、客観性、多元主義、物理と哲学の関係に関する一般的な見解にまで拡張する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:29:03 GMT)
Through the Thicket: A Study of Number-Oriented LLMs derived from Random Forest Models [0.0] 大規模言語モデル (LLM) はテキスト処理において例外的な性能を示した。
本稿では,ランダムフォレスト(RF)アンサンブルからの知識伝達を用いたLLMの学習手法を提案する。
我々は、細調整のためのアウトプットを生成し、その決定を分類し、説明するモデルの能力を高めます。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:31:51 GMT)
The ULS23 Challenge: a Baseline Model and Benchmark Dataset for 3D Universal Lesion Segmentation in Computed Tomography [0.0] 胸腹部・骨盤CT検査における3次元普遍的病変分割のためのULS23ベンチマークについて紹介した。
ULS23のトレーニングデータセットには、膵、結腸、骨の病変を含む、この地域全体で38,693の病変が含まれている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:37:59 GMT)
The Russian Legislative Corpus [0.0] コーパスは281,413通のテキスト(176,523,268通のトークン)とメタデータを収集する。
コーパスには、最小限の事前処理を備えた原文と、モルフォシンタクティックマークアップを用いた言語解析のためのバージョンの2つのバージョンがある。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:38:12 GMT)
The Reasonable Person Standard for AI [0.0] アメリカの法制度では、しばしば「合理的な人格基準」を用いる。
本稿では、合理的な人格基準が、モデルで開発、調査、ストレステストを行うべき行動の種類について有用なガイドラインを提供すると論じる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:35:54 GMT)
The Detection of KIC 1718360, A Rotating Variable with a Possible Companion, Using Machine Learning [0.0] 本稿では, G1.5IV-V型星KIC 1718360の光曲線における周期的なディミング現象の検出について述べる。
このデータは、恒星の自転周期が2.938日であることから、恒星の自転速度が高いことを示唆している。
二次的な、追加の周期的なディップも存在しており、太陽系外惑星の伴星の可能性を示している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:41:17 GMT)
Structured Active Inference (Extended Abstract) [0.0] 分類システム理論のツールを用いて、構造化された能動推論、大規模一般化および能動推論の形式化を導入する。
我々は、生成モデルを「インターフェイス上で」システムとして正式にキャストし、後者はマルコフ毛布の通常の概念の合成的抽象化である。
エージェントは、その生成モデルに対する'コントローラ'であり、公式にはそれらと双対である。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:22:44 GMT)
Stochastic simulation of dissipative quantum oscillators [0.0] 我々は、散逸発振器のパラダイム的ケースを用いて、オープン量子系のモデリングにペダゴニックな導入を与える。
我々は,「量子」ノイズスペクトルを用いた準古典的手法を用いて,環境がシステムに与える影響を捉える。
このような手法は、まだ計算的に計算可能でありながら、環境の量子的性質が関心のシステムの力学に与える影響についての洞察を与える可能性がある。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:49:50 GMT)
Stochastic full waveform inversion with deep generative prior for uncertainty quantification [0.0] フルウェーブフォーム・インバージョン(FWI)は非線形でしばしば不均一な逆問題を解決する。
FWIは、局所的なミニマトラップや不確実性の不十分な処理といった課題を提示している。
本研究では,ベイジアン逆転に対する物理パラメータの事前分布として,深部生成モデルを活用することを提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:44:50 GMT)
Simulation of Vibrational Circular Dichroism Spectra Using Second-Order Møller-Plesset Perturbation Theory and Configuration Interaction Doubles [0.0] 本稿では、波動関数に基づく原子軸テンソル(AAT)の1次参照計算について述べる。
分子試験では,MP2およびCIDに対するAATの偏差が49%以上であった。
AATの摂動に対する動的電子相関の包含は、結果として生じる回転強度とVCDスペクトルに大きな影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:25:24 GMT)
Self-testing in the compiled setting via tilted-CHSH inequalities [0.0] コンパイルされたベルシナリオに対する自己テストの形式化を行う。
我々は、傾きCHSH不等式族に対するコンパイルの下で、最大量子値が保存されていることを証明した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:49:40 GMT)
Selective Single and Double-Mode Quantum Limited Amplifier [0.0] 量子制限増幅器は、量子力学の原理によって予測される最小限のノイズを導入しながら、弱い信号の増幅を可能にする。
これらの増幅器は、超伝導量子ビットとスピンの高速かつ正確な読み出しを含む、量子コンピューティングにおける幅広い応用を提供している。
超伝導インダクタンスに基づく新しい量子制限増幅器を実験的に開発する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:12:23 GMT)
Schwinger-Keldysh nonequilibrium quantum field theory of open quantum systems beyond the Markovian regime: Application to the spin-boson model [0.0] 我々は、散逸環境と相互作用するオープン量子系のためのSchwinger-Keldysh場理論(T)を開発する。
本研究では, スピンボソンモデルに適用し, 環境がボゾン浴で構成されている場合の典型例とする。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 19:38:31 GMT)
Saturability of the Quantum Cramér-Rao Bound in Multiparameter Quantum Estimation at the Single-Copy Level [0.0] 量子クラム・ラオ境界(Quantum Cram'er-Rao bound, QCRB)は、量子パラメータ推定における精度の最終的な下界である。
本稿では,QCRBの単一コピー環境での飽和度について,必要かつ十分な条件を定めている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:59:06 GMT)
Quantum thermodynamics of driven-dissipative condensates [0.0] ポラリトン凝縮は、熱と粒子が貯水池と継続的に交換される開放系において熱平衡から離れて起こる。
偏光子の基底状態の個体群の形成に関わる主要な過程を捉えるための数段階のモデルを構築した。
これにより凝縮は熱機械の出力として理解でき、その発生に関する熱力学的制約を露呈する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:52:34 GMT)
Quantum nuclear dynamics on a distributed set of ion-trap quantum computing systems [0.0] 我々は、共有陽子の量子ウェーブレットダイナミクスを研究するために、IonQ 11量子ビットトラップイオン量子コンピュータ、Harmonyを使用する。
また、分散量子コンピューティングの化学力学問題への最初の応用も提供する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 18:27:50 GMT)
Quantum collision circuit, quantum invariants and quantum phase estimation procedure for fluid dynamic lattice gas automata [0.0] 量子コンピュータ上での流体力学LGCAのシミュレーションを可能にする量子アルゴリズムを開発した。
また, 細胞の再活性化を回避するため, 質量や運動量などの興味量を検出する位相推定法を開発した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:58:37 GMT)
Quantum channel correction outperforming direct transmission [0.0] 長距離光量子チャネルは必然的に損失がある。
チャネルに情報を運ぶ量子状態は、損失を補うために確率的に増幅されるが、増幅が失敗すると破壊される。
我々は, 高周波増幅による蒸留を行い, ノイズの強い絡み合いを改善する。
我々は、任意の量子情報伝送が無条件に改善されていることを示すために、絡み合わせスワッピングを用いる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:09:26 GMT)
Quantum Alternating Operator Ansatz for the Preparation and Detection of Long-Lived Singlet States in NMR [0.0] NMRの熱状態から長寿命一重項状態(LLS)を調製するためのQAOA配列とその変異体の設計について述べる。
制御パラメータの広い範囲の誤差に対するQAOA配列の効率性とロバスト性について検討する。
2量子NMRレジスタを用いてQAOA配列を他の顕著なLSS合成法と比較する実験を行った。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:29:40 GMT)
Protecting backaction-evading measurements from parametric instability [0.0] 総和と差分周波数から2つのポンプを変形させることにより,系の安定化とBAE性能の回復が可能であることを示す。
また, 弱い信号検出実験で得られた加速度は, このデチューニング技術によってのみ達成可能であることを示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:50:40 GMT)
Privacy-Preserving Logistic Regression Training with A Faster Gradient Variant [0.0] 我々は、プライバシー保護ロジスティック回帰トレーニングのために、$textttquadratic gradient$と呼ばれるより高速な勾配変種を提案する。
実験により,拡張された手法は収束速度において最先端の性能を有することが示された。
一般的な数値最適化問題に対する他の一階勾配法を強化するために、$textttquadratic gradient$が使える可能性は期待できる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:19:17 GMT)
Operator entanglement growth quantifies complexity of cellular automata [0.0] 本稿では,古典的決定論的セルオートマトンの複雑性を分類するために,量子情報理論に根ざした尺度を提案する。
我々は,MPOの特異値スペクトルのエントロピーの増大が,CAの複雑さを明らかにすることを発見した。
この尺度はCAの作用素エンタングルメントエントロピーの概念を定義し、量子情報測度が古典的決定論システムに有意義に適用可能であることを示した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:43:01 GMT)
Online Adaptation for Enhancing Imitation Learning Policies [0.0] 模倣学習は、報酬シグナルを必要とせずに、自律的なエージェントが人間の例から学ぶことを可能にする。
我々は,オンライン適応を通じて障害から回復することを提案する。
提案手法は,事前訓練された政策から得られた行動提案と専門家が記録した関連する経験を組み合わせたものである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:09:48 GMT)
On conceptualisation and an overview of learning path recommender systems in e-learning [0.0] 本研究では,レコメンデーションシステムの構築方法について検討した。
学習経路とその学習指標の共通概念を提示し、この文脈に5つの異なる推奨事項を埋め込む。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:30:43 GMT)
On Minimal Depth in Neural Networks [0.0] ニューラルネットワークの表現可能性の特徴は、人工知能における彼らの成功を理解することに関係している。
本研究では, ReLU ニューラルネットワークの表現性と, 連続的ピースワイド線形関数 (CPWL) の表現に必要な最小深度に関する予想との関係について検討した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:30:42 GMT)
On Groups in the Qubit Clifford Hierarchy [0.0] ユニタリ群は qubit Clifford Hierarchy の元を用いて構成することができる。
我々は、クリフォード階層内の一般化半クリフォード元を用いて構築できるすべての群を分類する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:03:58 GMT)
On Ambiguity and the Expressive Function of Law: The Role of Pragmatics in Smart Legal Ecosystems [0.0] 2つの部分と15のセクションに分けられる。
第一部(プラグマティクス)は、法的分野における言語的・認知的プラグマティクスの観点から曖昧さを論じる。
第2部(コンピュータ)では、人間中心の設計と人工知能の観点からこの問題を扱う。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:58:15 GMT)
Noise level of a ring laser gyroscope in the femto-rad/s range [0.0] GINGERINO 能動リングレーザー上限雑音は,2倍の10~15$ rad/s,sim 2倍の105$ sの積分時間で2倍の10~15$ rad/sとなる。
これは、これまでの理想的なリングレーザーのショットノイズによる理論予測よりも10倍良い。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:48:56 GMT)
Neural Laplace for learning Stochastic Differential Equations [0.0] Neuralplaceは多種多様な微分方程式(DE)を学習するための統一的なフレームワークである
DEの異なるクラスに対して、このフレームワークは通常の微分方程式(ODE)のクラスを学習することを目的としたニューラルネットワークに依存する他のアプローチよりも優れている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:29:30 GMT)
Neural Control System for Continuous Glucose Monitoring and Maintenance [0.0] 持続的なグルコースモニタリングと管理のための新しいニューラルコントロールシステムを提供する。
我々のアプローチは、洗練されたニューラルポリシーと微分可能なモデリングによって導かれ、常にリアルタイムでインスリン供給を調整する。
このエンドツーエンドの方法は効率を最大化し、パーソナライズされたケアを提供し、健康状態を改善する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:16:12 GMT)
Multi-style Neural Radiance Field with AdaIN [0.0] 本稿では,AdaINとNeRFを組み合わせた新しいパイプラインを提案する。
マルチスタイルタスクを処理するためのモデル機能を拡張し、強力なブラシストロークを持つスタイルでうまく機能するようにモデルアーキテクチャを変更します。
マルチスタイルモデルにスタイルを実装し、任意の2つのスタイル間のスタイルと、スタイル化されたアウトプットとオリジナルシーン間のスタイル強度を制御できるようにします。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:25:51 GMT)
Moderate Adaptive Linear Units (MoLU) [0.0] 深層ニューラルネットワークのための新しい高性能アクティベーション関数であるModrate Adaptive Linear Unit (MoLU)を提案する。
MoLUはシンプルで美しく強力なアクティベーション関数であり、数百のアクティベーション関数の中で優れたメインアクティベーション関数となる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 02:23:44 GMT)
MedYOLO: A Medical Image Object Detection Framework [0.0] YOLOモデルのワンショット検出手法を用いた3次元オブジェクト検出フレームワークであるMedYOLOについて報告する。
我々のモデルでは、心臓、肝臓、膵など、現在一般的に使われている中大の構造物で高い性能を実現している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:53:15 GMT)
MeGA: Merging Multiple Independently Trained Neural Networks Based on Genetic Algorithm [0.0] 本稿では, 遺伝的アルゴリズムであるMeGAを用いて, 複数の事前学習ニューラルネットワークの重みをマージする新しい手法を提案する。
我々のアプローチは、トーナメントの選択、クロスオーバー、突然変異による遺伝的アルゴリズムを利用して重量の組み合わせを最適化し、より効果的な融合を生み出す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 03:31:58 GMT)
LLM-based speaker diarization correction: A generalizable approach [0.0] ダイアリゼーション補正のための大規模言語モデル(LLM)を後処理のステップとして使用することを検討した。
ホールドアウトデータセットにおけるダイアリゼーション精度を向上させるためのモデルの能力を測定した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:33:22 GMT)
LLM-POET: Evolving Complex Environments using Large Language Models [0.0] LLM-POETは,Large Language Model (LLM) を用いて環境の生成と変更を行うPOETアルゴリズムの修正である。
その結果, LLMは多様な環境を生産できるだけでなく, 拡張ポエットで環境生成に使用されるCPPNと比較して, 共進化の性能向上率は34%増加した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:23:07 GMT)
Kibble-Zurek Mechanism and Beyond: Lessons from a Holographic Superfluid Disk [0.0] 超流動相転移ダイナミクスは、アインシュタイン・アベリアン・ヒッグス模型の枠組みで$AdS_4$ブラックホールで研究されている。
遅いクエンチでは、渦密度はキブル・ズーレック機構(KZM)によって予測される冷却速度の普遍的なスケーリング則を許容する。
高速クエンチの場合、密度はKZM予測を超える最終温度の関数として普遍的なスケーリング挙動を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:45:37 GMT)
Inequivalence of stochastic and Bohmian arrival times in time-of-flight experiments [0.0] 超低温原子を用いた飛行時間実験は、量子力学の異なる解釈をテストすることができる。
量子粒子は定値だが非決定論的で微分不可能な軌道を辿る。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:26:42 GMT)
Image Processing Based Forest Fire Detection [0.0] 画像処理技術を用いた森林火災検出のための新しい手法を提案する。
ファイアピクセル分類のためのルールベースのカラーモデルが使用される。
提案アルゴリズムはRGBとYCbCrの色空間を用いる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:11:45 GMT)
Image Coding for Machines with Edge Information Learning Using Segment Anything [0.0] Image Coding for Machines (ICM) は画像認識のための画像圧縮技術である。
本稿では,画像中の対象部品のエッジ情報のみを符号化・復号化することに焦点を当てたICMの手法を提案する。
これは、Segment Anythingによって生成されたエッジ情報を使用してトレーニングされた、学習された画像圧縮(lic)モデルである。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:11:34 GMT)
Human-Centered AI Product Prototyping with No-Code AutoML: Conceptual Framework, Potentials and Limitations [0.0] 本稿では,AI行動の確率的性質と,プロトタイピングツールの非専門家へのアクセシビリティの制限による課題に焦点を当てる。
デザインサイエンスリサーチ(DSR)アプローチが提示され、AIプロトタイピングプロセスの改善を目的とした概念的フレームワークが完成する。
このフレームワークは、プロトタイピング中の非専門家の入力と評価のシームレスな取り込みを記述し、アクセシビリティと解釈可能性を高めるために、ノーコードAutoMLの可能性を活用している。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:09:17 GMT)
Hibou: A Family of Foundational Vision Transformers for Pathology [0.0] コンピュータアルゴリズムによる解析のためにガラススライドを高解像度のデジタル画像に変換するデジタル病理学は、診断精度、一貫性、効率を向上させることにより、分野に革命をもたらす。
本稿では、DINOv2フレームワークを利用して、Hibou-BとHibou-Lの2つのモデル変異体を事前学習する。
我々のモデルはパッチレベルとスライドレベルの両方のベンチマークで優れた性能を示し、既存の最先端の手法を上回ります。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:45:53 GMT)
Heat currents in qubit systems [0.0] 熱力学の第2法則に則って, 熱電流に対する明示的な表現を示す。
また、定常状態におけるコヒーレンスの存在の可能性についても論じる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:43:00 GMT)
GANetic Loss for Generative Adversarial Networks with a Focus on Medical Applications [0.0] GAN(Generative Adversarial Network)は、あるデータセットの基盤となる統計構造を推定するために使用される機械学習モデルである。
生成モデルの性能と安定性を向上させるために、様々な損失関数が提案されている。
本研究では,GANの損失関数設計を遺伝的プログラミング(GP)手法を用いた最適化問題として提示する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:43:29 GMT)
Floquet engineering of binding in doped and photo-doped Mott insulators [0.0] ケミカルおよびフォトドープモット絶縁体におけるバウンド状態の出現について,スピンおよび$eta$-pairingゆらぎを介する検討を行った。
その結果, 化学および光ドープ系における結合エネルギーと局在長は同等であることがわかった。
我々はフェルミの黄金律に基づく周期運転条件下での光ドープ状態の寿命を概算した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:11:40 GMT)
Flat-band engineering of quasi-one-dimensional systems via supersymmetric transformations [0.0] 準1次元結晶モデルをスペクトル設計するための体系的手法を提案する。
この方法は、当初知られていた擬-スピン-1/2モデルに適用される超対称変換に基づいている。
結果は、Su-Schriefer-Heeger鎖が局所的に格子スタブに変換される2つの例で示される。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 10:26:16 GMT)
Faster Than Lies: Real-time Deepfake Detection using Binary Neural Networks [0.0] ディープフェイク検出は、オンラインコンテンツへの信頼を損なうディープフェイクメディアの拡散と対比することを目的としている。
本稿では,BNN(Binary Neural Networks)を用いた画像に対する新しいディープフェイク検出手法を提案する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:37:36 GMT)
Exploring the Determinants of Pedestrian Crash Severity Using an AutoML Approach [0.0] この研究は、さまざまな説明変数がクラッシュ結果に与える影響を評価するためにAutoMLを使用している。
この研究は、予測モデルにおける個々の特徴の寄与を解釈するために、SHAP(SHapley Additive exPlanations)を組み込んだ。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 22:02:36 GMT)
Expansion of situations theory for exploring shared awareness in human-intelligent autonomous systems [0.0] 知的自律システムの共有状況の欠如は、複雑なタスク環境におけるチームの有効性に悪影響を及ぼす。
共有状況認識の補完的アプローチである「状況理論」は、システム間の関係を理解するのに有用である。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 14:21:01 GMT)
Entanglement with neutral atoms in the simulation of nonequilibrium dynamics of one-dimensional spin models [0.0] スピン-1/2モデルの力学における絡み合いの生成と役割について検討する。
我々は,スピン-エチョ配列でインターリーブされた急激な断熱的Rydbergドレッシングを含む中性原子モルマー-ソレンセンゲートを導入する。
量子シミュレーションでは、逆場イジングモデルのクエンチ力学における臨界挙動を考察する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 23:29:16 GMT)
Ensemble Method for System Failure Detection Using Large-Scale Telemetry Data [0.0] 本研究では,システム故障検出のためのアンサンブル手法を提案する。
提案手法では,Long Short-Term Memory (LSTM) ネットワーク,アイソレーションフォレスト,ワンクラスサポートベクターマシン (OCSVM) ,ローカル・オブリアー因子 (LOF) など,多様なアルゴリズムを統合する。
実験により,本モデルの顕著な有効性を示し,システム障害の同定に顕著な検出率を達成した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:35:17 GMT)
Energy Propagation in Scattering Convolution Networks Can Be Arbitrarily Slow [0.0] 特徴抽出器として使用される深部畳み込みニューラルネットワークのエネルギー減衰を解析する。
ガボルフィルタに基づく時間周波数散乱変換では、任意の2乗積分入力信号に対してエネルギー減衰が指数関数的であることが確立されている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:52:23 GMT)
Efficient Fault-Tolerant Single Qubit Gate Approximation And Universal Quantum Computation Without Using The Solovay-Kitaev Theorem [0.0] 最近のソロワ=キタエフの定理の改善により、任意の単一量子ゲートを$epsilon > 0$ の精度で近似するには$textO(logc[1/epsilon)$ $c > 1.44042$ の量子ゲートが必要であることが示されている。
ここでは、この質問に対する部分的な回答として、$textO(log[/epsilon] loglog[/epsilon] cdots)$ FT gates が $ の値に依存する有限集合から選択されることを示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:21:05 GMT)
Dynamical mixture modeling with fast, automatic determination of Markov chains [0.0] 変動EMは、高価なモデル比較や後続サンプリングなしに、各チェーンのマルコフ連鎖の数と力学を効率的に同定する。
この手法は、$tt Last.fm$音楽聴取、ウルトラマラソン実行、遺伝子発現に基づくシミュレーションおよび観測データセットを含む理論的解析と数値実験によって支持されている。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 05:43:11 GMT)
Dispersive Qubit Readout with Intrinsic Resonator Reset [0.0] 本研究では、量子ビットを同時に測定し、読み出し共振器を初期状態に戻す超伝導量子ビットの分散測定法を実験的に示す。
また,四重項読み出しのための普遍パルス形状と実験結果も提示する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:38:18 GMT)
Digital assistant in a point of sales [0.0] 本稿では,VUI(Voice User Interface)を利用したディジタルアシスタントの小売環境での展開について検討する。
デジタルアシスタントを高トラフィックの小売環境に統合することにより、顧客サービスの質を向上させる効果を評価する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 11:33:21 GMT)
Diffusion models for Gaussian distributions: Exact solutions and Wasserstein errors [0.0] 拡散モデルやスコアベースモデルでは画像生成の性能が向上した。
本研究では,データ分布がガウス的である場合の拡散モデルの挙動とその数値的実装について理論的に検討する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 08:36:53 GMT)
Diffusion Models in $\textit{De Novo}$ Drug Design [0.0] 拡散モデルは、特に3次元分子構造の文脈において、分子生成の強力なツールとして登場した。
本稿では,3次元分子生成に適した拡散モデルの技術的実装について述べる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 06:34:13 GMT)
Defending Large Language Models Against Attacks With Residual Stream Activation Analysis [0.0] 大規模言語モデル(LLM)は敵の脅威に対して脆弱である。
本稿では, LLM へのホワイトボックスアクセスを前提とした, 革新的な防御戦略を提案する。
そこで本研究では,アタックプロンプト分類のための残差ストリームの固有なアクティベーションパターンを解析するための新しい手法を適用した。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 22:27:00 GMT)
DYST (Did You See That?): An Amplified Covert Channel That Points To Previously Seen Data [0.0] 歴史隠蔽チャネルと呼ばれる新しい種類の隠蔽チャネルを導入する。
履歴隠蔽チャネルは、通常のネットワークノードによって生成された、変更されていない正当なトラフィックを指し示すことで通信することができる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:00:48 GMT)
Connecting Stabilizer Formalism with Two-Qubit Bloch Spheres [0.0] 純粋2量子状態の2つのブロッホ球表現の導出における安定化器形式の適用について検討する。
我々は、与えられた安定化状態の密度行列とグラフィカル表現の両方にリンクを確立する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 16:25:03 GMT)
Concept Drift Detection using Ensemble of Integrally Private Models [0.0] Integrally Private Drift Detection (IPDD) と呼ばれるアンサンブル手法を導入し、プライベートモデルからのコンセプトドリフトを検出する。
我々のIPDD法はドリフトを検出するためにラベルを必要としないが、ドリフトを検出すると真のラベルが利用できると仮定する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 12:54:50 GMT)
Comprehensive AI Assessment Framework: Enhancing Educational Evaluation with Ethical AI Integration [0.0] 本稿では、Perkins、Furze、Roe、MacVaughによるAIA(AIAS)の進化版である包括的AIアセスメントフレームワーク(CAIAF)について述べる。
CAIAFは厳格な倫理的ガイドラインを取り入れており、教育レベルと高度なAI能力に基づいて明確に区別されている。
このフレームワークは、より良い学習結果を保証するとともに、学術的完全性を維持し、AIの責任ある利用を促進する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 07:18:42 GMT)
ComplexityMeasures.jl: scalable software to unify and accelerate entropy and complexity timeseries analysis [0.0] ComplexityMeasures.jlは簡単に拡張可能で高性能なオープンソースソフトウェアであり、様々な複雑さ対策を実装している。
このソフトウェアは3,834行のソースコードを持つ1530の測度を提供する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:22:45 GMT)
Combinatorial Complex Score-based Diffusion Modelling through Stochastic Differential Equations [0.0] この論文はグラフ生成におけるスコアベース生成モデルの可能性を探るものである。
本稿では,微分方程式を用いた統一的枠組みを提案する。
このイノベーションは、グラフ生成のみに焦点を当てた既存のフレームワークの制限を克服し、生成AIの新たな可能性を開く。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:16:10 GMT)
Benchmarking Deep Jansen-Rit Parameter Inference: An in Silico Study [0.0] 種々の雑音条件下での脳波をシミュレーションしたJansen-Ritニューラルマスモデル(JR-NMM)のパラメータ推定のためのBi-LSTMモデルの性能をベンチマークした。
以上の結果から,脳波から局所的JR-NMMパラメータを予測できることが示唆された。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 15:16:46 GMT)
Anomaly inflow for dipole symmetry and higher form foliated field theories [0.0] 我々は、$(d+1)$-dimensional BF theory with $p$-form gauge fieldを紹介する。
ゲージ不変ループは空間座標の線形関数を含む特異な形状を持つことを示す。
また、これらの理論は$p$-形式と$(d-p)$-形式の双極子対称性の間の混合した't Hooft異常を示す。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 13:22:40 GMT)
Adaptive Interface-PINNs (AdaI-PINNs): An Efficient Physics-informed Neural Networks Framework for Interface Problems [0.0] AdaI-PINN(Adaptive Interface-PINN)と呼ばれる,効率的な物理情報ニューラルネットワーク(PINN)フレームワークを提案する。
このフレームワークは、前身であるInterface PINNまたはI-PINNの強化版である。
AdaI-PINNでは、アクティベーション機能は、ニューラルネットワークの他のパラメータとともにトレーニングされる斜面でのみ異なる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 04:22:32 GMT)
A Sparse Graph Formulation for Efficient Spectral Image Segmentation [0.0] スペクトルクラスタリングは、セグメンテーション問題を解決する最も伝統的な方法の1つである。
単純なグリッドグラフに余分なノードを含めることで、スパースグラフを定式化します。
元の正規化カットアルゴリズムをこのグラフに適用すると、スペクトル画像セグメンテーションの単純でスケーラブルな方法が導かれる。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:37:16 GMT)
A Novel Time Series-to-Image Encoding Approach for Weather Phenomena Classification [0.0] 本稿では、4G/LTE携帯端末における受信信号レベル(RSL)から特定の気象現象の性質を特定することを目的とする。
時系列を画像としてエンコードし、タスクを画像分類問題としてモデル化する新しい手法を提案し、畳み込みニューラルネットワーク(CNN)を用いて最終的に対処する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 17:21:10 GMT)
A Mechanism for Entanglement? [0.0] 量子絡み合いは特別な選択アーチファクトであり、コライダーバイアスとコライダー変数の境界制約の組み合わせとして説明可能であることを示す。
この提案は光円錐の外側に直接的な因果的影響は必要とせず、したがってベル非局所性と相対性理論を整合させる手段を提供するかもしれない。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 01:22:37 GMT)
"Minus-One" Data Prediction Generates Synthetic Census Data with Good Crosstabulation Fidelity [0.0] 分類的調査結果のデータセットに関連のある統計関連を,MODPと呼ばれる手法を用いて収集する。
交叉振動がすべての交叉細胞に対して5%の正中性を有する合成応答を生成する。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 21:18:25 GMT)
$floZ$: Improved Bayesian evidence estimation from posterior samples with normalizing flows [0.0] 本研究では,非正規化後分布から抽出したサンプル集合からベイズ証拠を推定する改良手法である$floZ$を紹介する。
解析的に証拠が知られている分布において最大15個のパラメータ空間次元を検証し、2つの最先端技術と比較する。
$floZ$は、例えば変分推論、マルコフ・チェイン・モンテカルロのサンプル、あるいは非正規化後密度からサンプルを届ける他の方法から証拠を推定するために幅広い適用性を持つ。
論文参考訳(メタデータ) (Fri, 7 Jun 2024 09:16:23 GMT)