Can Large Language Models Understand Symbolic Graphics Programs? [136.6] シンボリックグラフィックスプログラムはコンピュータグラフィックスで人気がある。
シンボルグラフィックプログラムの意味的視覚的理解のためのベンチマークを作成する。
LLMの推理性能は概して優れていた。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:44:35 GMT)
Unpacking DPO and PPO: Disentangling Best Practices for Learning from Preference Feedback [110.2] 嗜好フィードバックからの学習は、現代言語モデルの生成品質と性能を改善するための重要なステップとして現れてきた。
本研究では、嗜好データ、学習アルゴリズム、報酬モデル、政策訓練プロンプトという、嗜好に基づく学習の4つの側面を特定する。
以上の結果から,すべての側面がパフォーマンス上重要であることが示唆された。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 21:24:59 GMT)
RevisEval: Improving LLM-as-a-Judge via Response-Adapted References [95.3] RevisEvalは、応答適応参照による新しいテキスト生成評価パラダイムである。
RevisEvalは、理想的な参照が評価される応答に対する必要な関連性を維持するべきであるというキーオブザーバーによって駆動される。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:50:47 GMT)
Measuring and Improving Attentiveness to Partial Inputs with Counterfactuals [91.6] 我々は,新しい評価手法であるCAT(Facterfactual Attentiveness Test)を提案する。
CATは、入力の一部を別の例から別の例に置き換えることで、予測を変更する注意深いモデルを期待することで、反事実を使用する。
実験データの精度が向上する一方, GPT3 は実演回数の増加により注意力の低下がみられた。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 19:37:52 GMT)
R-Bench: Are your Large Multimodal Model Robust to Real-world Corruptions? [86.9] R-Benchは、LMMs*の**実世界のロバストネスに焦点を当てたベンチマークである。
LMMは元の参照画像を正しく扱えるが、歪んだ画像に直面すると、その性能は安定しない。
我々は、R-BenchがLMMの堅牢性を改善し、*実験シミュレーションから*実世界のアプリケーションへ拡張することを願っている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 20:12:08 GMT)
Contrastive Learning to Improve Retrieval for Real-world Fact Checking [84.6] ファクト・チェッキング・リランカ(Contrastive Fact-Checking Reranker, CFR)を提案する。
我々はAVeriTeCデータセットを活用し、証拠文書からの人間による回答とクレームのサブクエストを注釈付けする。
データセットの精度は6%向上した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 00:09:50 GMT)
Model-GLUE: Democratized LLM Scaling for A Large Model Zoo in the Wild [84.6] 本稿では,全体論的な大規模言語モデルスケーリングガイドラインであるModel-GLUEを紹介する。
我々の研究は、既存のLCMスケーリングテクニック、特に選択的マージと混合のバリエーションのベンチマークから始まります。
我々の手法は、マージ可能なモデルのクラスタリングと最適なマージ戦略選択、モデルミックスによるクラスタの統合を含む。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:55:55 GMT)
SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation [82.6] 本稿では、視覚言語モデル(VLM)を用いて、様々な衣服カテゴリーにおけるキーポイント予測を改善する統一的なアプローチを提案する。
我々は、高度なシミュレーション技術を用いて大規模な合成データセットを作成し、大規模な実世界のデータを必要としないスケーラブルなトレーニングを可能にした。
実験結果から, VLM法はキーポイント検出精度とタスク成功率を大幅に向上させることが示された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:06:17 GMT)
Unsupervised Representation Learning from Sparse Transformation Analysis [79.9] 本稿では,潜在変数のスパース成分への変換を分解し,シーケンスデータから表現を学習することを提案する。
入力データは、まず潜伏活性化の分布として符号化され、その後確率フローモデルを用いて変換される。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 23:53:25 GMT)
Data Advisor: Dynamic Data Curation for Safety Alignment of Large Language Models [79.7] 所望のデータセットの特徴を考慮したデータ生成手法であるデータアドバイザを提案する。
Data Advisorは生成されたデータの状態を監視し、現在のデータセットの弱点を特定し、データ生成の次のイテレーションをアドバイスする。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:59:58 GMT)
Fine-Tuning Large Vision-Language Models as Decision-Making Agents via Reinforcement Learning [79.4] 強化学習(RL)を用いた視覚言語モデル(VLM)を微調整するアルゴリズムフレームワークを提案する。
我々のフレームワークはタスク記述を提供し、次にVLMにチェーン・オブ・シント(CoT)推論を生成するよう促す。
提案手法は,VLMエージェントの様々なタスクにおける意思決定能力を向上させる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 19:13:47 GMT)
WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models [78.2] 大規模言語モデル(LLM)は、成長を続ける世界の事実に適合し、幻覚的応答を修正するために知識更新を必要とする。
更新された知識が記憶にどこに存在するかは、モデル編集の基本的な問題である。
記憶のギャップを埋めるためにWISEを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:35:14 GMT)
Auto-Arena: Automating LLM Evaluations with Agent Peer Battles and Committee Discussions [77.7] Auto-ArenaはLLMエージェントを使用した評価プロセス全体を自動化した革新的なフレームワークである。
我々の実験では、Auto-Arenaは92.14%の相関関係を示し、以前の専門家が注釈付けしたベンチマークをすべて上回っている。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 02:53:44 GMT)
Attribute Controlled Fine-tuning for Large Language Models: A Case Study on Detoxification [76.1] 本稿では,属性制御付き大規模言語モデル(LLM)の制約学習スキーマを提案する。
提案手法は, ベンチマーク上での競合性能と毒性検出タスクを達成しながら, 不適切な応答を少ないLCMに導出することを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 23:38:58 GMT)
Non-Invasive Suicide Risk Prediction Through Speech Analysis [74.8] 自動自殺リスク評価のための非侵襲的音声ベースアプローチを提案する。
我々は、wav2vec、解釈可能な音声・音響特徴、深層学習に基づくスペクトル表現の3つの特徴セットを抽出する。
我々の最も効果的な音声モデルは、6.6.2,%$のバランスの取れた精度を達成する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:28:18 GMT)
Causal Context Adjustment Loss for Learned Image Compression [72.7] 近年,学習画像圧縮(lic)技術は,特にRD性能の点で従来の手法を上回りつつある。
現在の技術のほとんどは、自己回帰エントロピーモデルを備えたVAEベースで、デコードされた因果コンテキストを利用してRD性能を向上する。
本稿では,提案した因果文脈調整損失を用いて因果文脈を的確に調整する方法を初めて検討する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:08:32 GMT)
BigCodeBench: Benchmarking Code Generation with Diverse Function Calls and Complex Instructions [72.6] BigCodeBenchは、大規模言語モデル(LLM)に対して、139のライブラリと7つのドメインから1140のきめ細かいタスクに対して、複数の関数呼び出しをツールとして呼び出すためのベンチマークである。
評価の結果,LLMは機能コールを正確に使用するための複雑な指示に従うことができず,スコアは最大60%,人的性能は97%と極めて低いことがわかった。
そこで本研究では,BigCodeBench-Instructという自然言語指向の変種を提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:23:30 GMT)
Assouad, Fano, and Le Cam with Interaction: A Unifying Lower Bound Framework and Characterization for Bandit Learnability [71.8] 我々は,統計的推定と対話的意思決定において,下位境界法のための統一的なフレームワークを開発する。
対話型意思決定のための新しい下位境界の複雑さを促進する新しい尺度である決定次元を導入する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:14:58 GMT)
Preserving Multi-Modal Capabilities of Pre-trained VLMs for Improving Vision-Linguistic Compositionality [69.8] きめ細かい選択校正CLIPは局所的硬陰性損失と選択的校正正規化を統合している。
評価の結果、FSC-CLIPは、最先端モデルと同等の合成性を達成できるだけでなく、強力なマルチモーダル能力を保っていることがわかった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:16:20 GMT)
Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training [69.5] ジェネラリストの具体化エージェントを学ぶことは、主にアクションラベル付きロボットデータセットの不足に起因して、課題を提起する。
これらの課題に対処するための新しい枠組みを導入し、人間のビデオにおける生成前トレーニングと、少数のアクションラベル付きロボットビデオのポリシー微調整を組み合わせるために、統一された離散拡散を利用する。
提案手法は, 従来の最先端手法と比較して, 高忠実度な今後の計画ビデオを生成し, 細調整されたポリシーを強化する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:45:35 GMT)
Reasoning Paths Optimization: Learning to Reason and Explore From Diverse Paths [69.4] 本稿では,多様な経路から学習の推論と探索を可能にするReasoning Paths Optimization (RPO)を紹介する。
提案手法は,各推論ステップにおいて好意的な分岐を奨励し,好ましくない分岐を罰し,モデル全体の問題解決性能を高める。
我々は,数語問題や理科ベースの試験問題など,多段階の推論タスクに焦点をあてる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 06:37:25 GMT)
Expanding Scene Graph Boundaries: Fully Open-vocabulary Scene Graph Generation via Visual-Concept Alignment and Retention [69.4] SGG(Scene Graph Generation)は、多くのコンピュータビジョンアプリケーションにおいて重要な構造化された表現を提供する。
我々はOvSGTRという名前の統一フレームワークを全体的視点から完全にオープンな語彙SGGに向けて提案する。
関係付きオープン語彙SGGのより困難な設定のために、提案手法は関係対応型事前学習を統合する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 07:15:19 GMT)
SePPO: Semi-Policy Preference Optimization for Diffusion Alignment [67.9] 本稿では、報酬モデルやペアの人間注釈データに頼ることなく、DMと好みを一致させる選好最適化手法を提案する。
テキスト・ツー・イメージとテキスト・ツー・ビデオのベンチマークでSePPOを検証する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:56:53 GMT)
Timer-XL: Long-Context Transformers for Unified Time Series Forecasting [67.8] 我々は時系列の統一予測のための生成変換器Timer-XLを提案する。
Timer-XLは、統一されたアプローチにより、挑戦的な予測ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:27:39 GMT)
Progressive-Hint Prompting Improves Reasoning in Large Language Models [64.0] 本稿では,プログレッシブ・ヒント・プロンプト(PHP)と呼ばれる新しいプロンプト手法を提案する。
事前に生成された回答をヒントとして使用することで、ユーザとLLM(Large Language Models)間の自動多元的対話を可能にする。
我々は7つのベンチマークで広範囲かつ包括的な実験を行った。その結果、PHPは高い効率を保ちながら精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 04:28:04 GMT)
PostEdit: Posterior Sampling for Efficient Zero-Shot Image Editing [63.4] 拡散サンプリングプロセスを制御するために後続のスキームを組み込んだPostEditを導入する。
提案したPostEditは、未編集領域を正確に保存しながら、最先端の編集性能を実現する。
インバージョンもトレーニングも不要で、約1.5秒と18GBのGPUメモリを必要とするため、高品質な結果が得られる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:04:50 GMT)
Beyond Persuasion: Towards Conversational Recommender System with Credible Explanations [63.1] そこで我々は,PC-CRSと呼ばれるシンプルな手法を提案し,CRSの説得における説明の信頼性を高める。
実験により,PC-CRSの説得的・信頼性的説明を促進する効果が示された。
さらなる分析では、現在の手法が素晴らしい説明を生み出している理由と、推薦精度を向上させるための信頼できる説明の可能性を明らかにしている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:49:27 GMT)
Beyond Persuasion: Towards Conversational Recommender System with Credible Explanations [63.1] そこで我々は,PC-CRSと呼ばれるシンプルな手法を提案し,CRSの説得における説明の信頼性を高める。
実験により,PC-CRSの説得的・信頼性的説明を促進する効果が示された。
さらなる分析では、現在の手法が素晴らしい説明を生み出している理由と、推薦精度を向上させるための信頼できる説明の可能性を明らかにしている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:49:27 GMT)
On Bits and Bandits: Quantifying the Regret-Information Trade-off [62.6] エージェントが蓄積する情報と、それが苦しむ後悔の間のトレードオフについて検討する。
エージェントが蓄積する情報に依存する、最初のベイズ的後悔の低い境界を導入する。
また,エージェントが蓄積する情報量を用いて,後悔の上限を証明した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 13:12:20 GMT)
PhysDreamer: Physics-Based Interaction with 3D Objects via Video Generation [62.5] PhysDreamerは物理に基づくアプローチで、静的な3Dオブジェクトにインタラクティブなダイナミクスを与える。
本稿では, 弾性物体の多様な例について考察し, ユーザスタディを通じて合成された相互作用の現実性を評価する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 06:08:09 GMT)
MathHay: An Automated Benchmark for Long-Context Mathematical Reasoning in LLMs [61.7] MathHayは、LLMの長文数学的推論能力を評価するために設計された自動ベンチマークである。
我々は,8つのトップパフォーマンスモデルの長文数学的推論能力を評価するために,MathHayの広範な実験を行った。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:30:07 GMT)
Grounding Partially-Defined Events in Multimodal Data [61.0] 部分定義イベントに対するマルチモーダル定式化を導入し、これらのイベントの抽出を3段階スパン検索タスクとしてキャストする。
このタスクのベンチマークであるMultiVENT-Gを提案し,22.8Kのラベル付きイベント中心エンティティを含む,14.5時間の高密度アノテーション付き現在のイベントビデオと1,168のテキストドキュメントからなる。
結果は、イベント理解の抽象的な課題を示し、イベント中心のビデオ言語システムにおける約束を実証する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:59:48 GMT)
Tight Stability, Convergence, and Robustness Bounds for Predictive Coding Networks [60.4] 予測符号化(PC)のようなエネルギーベースの学習アルゴリズムは、機械学習コミュニティにおいて大きな注目を集めている。
動的システム理論のレンズを用いて,PCの安定性,堅牢性,収束性を厳密に解析する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:57:26 GMT)
The LLM Effect: Are Humans Truly Using LLMs, or Are They Being Influenced By Them Instead? [60.0] 大規模言語モデル(LLM)は、様々な分析タスクにおいて、人間のパフォーマンスに近い能力を示している。
本稿では,Human-LLMパートナーシップに着目した構造化ユーザスタディにより,特殊作業におけるLLMの効率と精度について検討する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:30:18 GMT)
Learning Efficient and Effective Trajectories for Differential Equation-based Image Restoration [59.7] 我々は, この手法の軌道最適化を再構築し, 復元品質と効率の両立に焦点をあてる。
本稿では,複雑な経路を適応可能なサイズで複数の管理可能なステップに合理化するためのコスト対応トラジェクトリー蒸留法を提案する。
実験では提案手法の有意な優位性を示し, 最先端手法よりも最大2.1dBのPSNR改善を実現した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:46:08 GMT)
Generalized Consistency Trajectory Models for Image Manipulation [59.6] 拡散モデル(DM)は、画像編集や復元などの応用と同様に、無条件生成において優れている。
本研究の目的は、一般化されたCTM(GCTM)を提案することによって、整合性軌道モデル(CTM)の完全なポテンシャルを解放することである。
本稿では,GCTMの設計空間について論じ,画像から画像への変換,復元,編集など,様々な画像操作タスクにおいて有効性を示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 10:31:58 GMT)
L-C4: Language-Based Video Colorization for Creative and Consistent Color [59.1] 創造的・一貫性のある色(L-C4)のための言語ベースビデオカラー化を提案する。
我々のモデルは、事前訓練された相互モダリティ生成モデルに基づいて構築される。
本研究では,フリックやカラーシフトを防止するために時間的に変形可能な注意点と,長期のカラー一貫性を維持するためにクロスクリップ融合を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:16:21 GMT)
Forgetting Curve: A Reliable Method for Evaluating Memorization Capability for Long-context Models [58.6] 長文モデルの暗記能力を測定するために,左折曲線と呼ばれる新しい手法を提案する。
テストコーパスと実験環境に頑健であることの利点を, 忘れる曲線は有益であることを示す。
本測定は,RNN/SSMモデルの有効性を疑問視しながら,トランスフォーマー拡張手法の有効性を示す実証的な証拠を提供する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:38:27 GMT)
TLDR: Token-Level Detective Reward Model for Large Vision Language Models [57.4] 既存の報酬モデルは、任意のテキストに1つのバイナリフィードバックを割り当てることによって、人間のアノテーションを模倣するだけである。
我々は、各テキストトークンにきめ細かいアノテーションを提供するために、$textbfT$oken-$textbfL$evel $textbfD$etective $textbfR$eward Modelを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 04:00:22 GMT)
Cookbook: A framework for improving LLM generative abilities via programmatic data generating templates [57.3] Cookbookはランダムトークン上の単純なパターンからなるトレーニングデータを生成するフレームワークである。
クックブック生成したデータの微調整により,対応するタスクの性能を最大52.7の精度で向上できることがわかった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:29:40 GMT)
Autonomous Evaluation and Refinement of Digital Agents [57.1] ドメイン汎用自動評価器は,Webナビゲーションやデバイス制御のためのエージェントの性能を大幅に向上させることができることを示す。
我々は、これらのモデルの性能をいくつかの一般的なデジタルエージェントのベンチマークで検証し、オラクル評価指標との74.4から92.9%の一致を見出した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:19:37 GMT)
FAC$^2$E: Better Understanding Large Language Model Capabilities by Dissociating Language and Cognition [56.8] 大規模言語モデル(LLM)は、主に様々なテキスト理解および生成タスクにおける全体的なパフォーマンスによって評価される。
FAC$2$E, FAC$2$Eについて述べる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:44:45 GMT)
Formality is Favored: Unraveling the Learning Preferences of Large Language Models on Data with Conflicting Knowledge [55.7] 大規模言語モデルは、多くの知識集約的なタスクにおいて優れたパフォーマンスを示している。
しかし、事前学習データには誤解を招く傾向があり、矛盾する情報も含まれている。
本研究では,LLMの学習嗜好を,矛盾する知識を持つデータに対して体系的に分析する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:49:41 GMT)
Activation Scaling for Steering and Interpreting Language Models [55.6] モデルにうまく介入することは、内部の動作を解釈するための前提条件である、と我々は主張する。
成功した介入は、間違ったトークンで正しいことを正し、その逆を正すべきである。
勾配に基づく最適化を用いることで、特定の種類の効率的かつ解釈可能な介入を学習(そして後で評価)することができる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:01:32 GMT)
Aligning LLMs to Be Robust Against Prompt Injection [55.1] インジェクション攻撃に対してLCMをより堅牢にするための強力なツールとしてアライメントが有効であることを示す。
私たちのメソッド -- SecAlign -- は、最初に、プロンプトインジェクション攻撃をシミュレートしてアライメントデータセットを構築します。
実験の結果,SecAlign は LLM を大幅に強化し,モデルの実用性に悪影響を及ぼすことが示された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:34:35 GMT)
Active Fine-Tuning of Generalist Policies [54.7] AMF(Active Multi-task Fine-tuning)を提案する。
我々は,AMFの性能保証を規則性仮定で導き,複雑・高次元環境における実験的有効性を示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:26:36 GMT)
LevAttention: Time, Space, and Streaming Efficient Algorithm for Heavy Attentions [54.5] 任意の$K$に対して、$n$とは独立に「普遍集合」$Uサブセット[n]$が存在し、任意の$Q$と任意の行$i$に対して、大きな注目スコアが$A_i,j$ in row $i$ of $A$は全て$jin U$を持つことを示す。
我々は、視覚変換器のスキームの利点を実証的に示し、トレーニング中に我々の普遍的なセットを使用する新しいモデルのトレーニング方法を示した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:47:13 GMT)
Mirror-Consistency: Harnessing Inconsistency in Majority Voting [54.3] 本稿では,標準的な自己整合性アプローチの強化であるミラー・一貫性について述べる。
Mirror-Consistencyは「反射鏡」を自己組織化復号プロセスに組み込む。
ミラー一貫性は自己整合性と比較して,推理精度と信頼性校正の両面において優れた性能を示すことを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 03:41:08 GMT)
ProteinBench: A Holistic Evaluation of Protein Foundation Models [53.6] 本稿では,タンパク質基盤モデルのための総合評価フレームワークであるProteinBenchを紹介する。
本研究のアプローチは, タンパク質ドメインにおける課題を包括的に包括するタスクの分類学的分類, (ii) 品質, 新規性, 多様性, 堅牢性, および (iii) 様々なユーザ目標から詳細な分析を行い, モデルパフォーマンスの全体的視点を提供する,4つの重要な側面にわたるパフォーマンスを評価するマルチメトリック評価アプローチからなる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:20:32 GMT)
Geodesic Optimization for Predictive Shift Adaptation on EEG data [53.6] ドメイン適応メソッドは、$X$と$y$で分散シフトが同時に発生したときに苦労する。
本稿では,GOPSA(Geodesic Optimization for Predictive Shift Adaptation)と呼ばれる新しい手法を提案する。
GOPSAは、脳波のバイオメディカル応用のための混合効果モデリングと機械学習を併用する可能性を持っている。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:14:54 GMT)
Breaking the Frame: Visual Place Recognition by Overlap Prediction [53.2] 本稿では,重なり合う予測に基づく新しい視覚的位置認識手法 VOP を提案する。
VOPは、Vision Transformerのバックボーンを使用してパッチレベルの埋め込みを取得することで、コビジュアブルなイメージセクションを進める。
提案手法では,データベース画像の重複点の評価に投票機構を用いる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 13:11:05 GMT)
TableRAG: Million-Token Table Understanding with Language Models [53.0] TableRAG(TableRAG)は、LMベースのテーブル理解用に特別に設計された検索拡張生成(RAG)フレームワークである。
TableRAGは、スキーマとセル検索を組み合わせたクエリ拡張を活用して、LMにそれを提供する前に重要な情報をピンポイントする。
以上の結果から,TableRAGは検索精度が向上し,大規模テーブル理解における最先端性能が向上することが示唆された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 04:15:02 GMT)
Revealing Directions for Text-guided 3D Face Editing [52.9] 3次元顔編集はマルチメディアにおいて重要な課題であり、様々な制御信号間での3次元顔モデルの操作を目的としている。
任意の属性記述に基づく3次元顔の生成と操作のためのテキスト汎用アプローチであるFace Clanを提案する。
本手法は,ユーザがテキスト記述で興味のある領域を直感的にカスタマイズできる,正確に制御可能な操作方法を提供する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:04:39 GMT)
mDPO: Conditional Preference Optimization for Multimodal Large Language Models [52.6] 直接選好最適化(DPO)は,大規模言語モデル(LLM)のアライメントに有効な手法であることが示されている。
最近の研究は、DPOをマルチモーダルシナリオに適用しようと試みているが、一貫した改善を達成することは困難である。
画像の嗜好を最適化することで、言語のみの嗜好の過度な優先順位付けを防止するマルチモーダルDPOであるmDPOを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:59:42 GMT)
AlignedCoT: Prompting Large Language Models via Native-Speaking Demonstrations [52.4] Alignedcotは、大規模言語モデルを呼び出すためのコンテキスト内学習技術である。
ゼロショットシナリオでは、一貫した正しいステップワイズプロンプトを達成する。
数学的推論とコモンセンス推論の実験を行う。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 09:11:49 GMT)
Demonstrating real-time and low-latency quantum error correction with superconducting qubits [52.1] 超伝導量子プロセッサに組み込まれたスケーラブルFPGAデコーダを用いて低遅延フィードバックを示す。
復号ラウンド数が増加するにつれて、論理誤差の抑制が観察される。
この作業でデコーダのスループットとレイテンシが発達し、デバイスの継続的な改善と相まって、次世代の実験がアンロックされた。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:07:18 GMT)
FoodPuzzle: Developing Large Language Model Agents as Flavor Scientists [52.0] 本稿では,フレーバープロファイルの抽出と理解のための仮説の創出として概念化されたフレーバーサイエンスにおける科学エージェントのための新しい問題領域を提案する。
そこで本研究では,テキスト内学習と検索技術を統合したScientific Agentアプローチを提案する。
実験結果から,フレーバープロファイル予測タスクにおいて,本モデルが従来の手法をはるかに上回っていることが示唆された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 01:26:23 GMT)
FoodPuzzle: Developing Large Language Model Agents as Flavor Scientists [52.0] 本稿では,フレーバープロファイルの抽出と理解のための仮説の創出として概念化されたフレーバーサイエンスにおける科学エージェントのための新しい問題領域を提案する。
そこで本研究では,テキスト内学習と検索技術を統合したScientific Agentアプローチを提案する。
実験結果から,フレーバープロファイル予測タスクにおいて,本モデルが従来の手法をはるかに上回っていることが示唆された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 01:26:23 GMT)
Enhanced Super-Resolution Training via Mimicked Alignment for Real-World Scenes [51.9] トレーニング中、LR入力とHR画像の整列により、誤調整問題を緩和する新しいプラグアンドプレイモジュールを提案する。
具体的には,従来のLR試料の特徴を保ちながらHRと整合する新しいLR試料を模倣する。
本手法を合成および実世界のデータセット上で総合的に評価し,SRモデルのスペクトル間での有効性を実証した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:18:54 GMT)
Towards World Simulator: Crafting Physical Commonsense-Based Benchmark for Video Generation [51.8] テキスト・ツー・ビデオ(T2V)モデルは複雑なプロンプトの可視化に大きく貢献している。
しかし、直感的な物理を正確に表現するこれらのモデルの能力はほとんど解明されていない。
本稿では,T2V生成における物理コモンセンスの正しさを評価するためにPhyGenBenchを導入する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:56:04 GMT)
On the Optimization and Generalization of Two-layer Transformers with Sign Gradient Descent [51.5] Sign Gradient Descent (SignGD) はアダムの効果的なサロゲートである。
我々はSignGDが雑音の多いデータセット上で2層トランスを最適化する方法について検討する。
SignGDの一般化が不十分なのはデータノイズによるものではなく、SignGDとAdamの両方が現実世界のタスクに高品質なデータを必要とすることを示唆している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:36:43 GMT)
SeBS-Flow: Benchmarking Serverless Cloud Function Workflows [51.4] 本稿では、最初のサーバーレスワークフローベンチマークスイートSeBS-Flowを提案する。
SeBS-Flowには6つの実世界のアプリケーションベンチマークと、異なる計算パターンを表す4つのマイクロベンチマークが含まれている。
当社では,パフォーマンス,コスト,スケーラビリティ,ランタイムの偏差など,3つの主要なクラウドプラットフォームに関する包括的な評価を実施しています。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:28:39 GMT)
SeBS-Flow: Benchmarking Serverless Cloud Function Workflows [51.4] 本稿では、最初のサーバーレスワークフローベンチマークスイートSeBS-Flowを提案する。
SeBS-Flowには6つの実世界のアプリケーションベンチマークと、異なる計算パターンを表す4つのマイクロベンチマークが含まれている。
当社では,パフォーマンス,コスト,スケーラビリティ,ランタイムの偏差など,3つの主要なクラウドプラットフォームに関する包括的な評価を実施しています。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:28:39 GMT)
LiDAR-GS:Real-time LiDAR Re-Simulation using Gaussian Splatting [50.8] LiDARシミュレーションは、自動運転におけるクローズドループシミュレーションにおいて重要な役割を果たす。
都市景観におけるLiDARセンサスキャンをリアルタイムに再現するために,最初のLiDARガウス法であるLiDAR-GSを提案する。
我々の手法は、深度、強度、レイドロップチャンネルを同時に再現することに成功し、公開可能な大規模シーンデータセットにおけるフレームレートと品質の両方のレンダリング結果を達成する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:07:56 GMT)
MFE-ETP: A Comprehensive Evaluation Benchmark for Multi-modal Foundation Models on Embodied Task Planning [50.5] 具体的タスクプランニングにおけるMFMの性能について,より深く,包括的に評価する。
我々は,その複雑で可変なタスクシナリオを特徴付けるMFE-ETPという新しいベンチマークを提案する。
ベンチマークと評価プラットフォームを用いて、いくつかの最先端のMFMを評価し、それらが人間レベルの性能に著しく遅れていることを発見した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:05:05 GMT)
Robust affine point matching via quadratic assignment on Grassmannians [50.4] Robust Affine Matching with Grassmannians (RoAM) は点雲のアフィン登録を行うアルゴリズムである。
このアルゴリズムは、グラスマンの2つの要素間のフロベニウス距離を最小化することに基づいている。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 22:02:12 GMT)
Self-MoE: Towards Compositional Large Language Models with Self-Specialized Experts [50.0] 本稿では,モノリシックLLMを,自己専門化の専門家による構成的,モジュール的なシステムに変換するアプローチであるSelf-MoEを紹介する。
提案手法は, 自己生成合成データを用いて, 専門家モジュールを構成する自己特殊化を利用する。
本研究は, モジュール性の重要性, マルチベースLCMへの適用性, 効率的でスケーラブルで適応可能なシステムの実現における自己改善の可能性を明らかにするものである。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:27:56 GMT)
DISCOVERYWORLD: A Virtual Environment for Developing and Evaluating Automated Scientific Discovery Agents [49.7] 本研究では,新しい科学的発見の完全なサイクルを実行するエージェントの能力を開発し,ベンチマークする最初の仮想環境であるDiscoVERYWORLDを紹介する。
8つのトピックにまたがる120の異なる課題タスクが含まれており、3レベルの難易度といくつかのパラメトリックなバリエーションがある。
従来の環境においてよく機能する強力なベースラインエージェントが、ほとんどのdiscoVERYWORLDタスクに苦労していることがわかった。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:19:15 GMT)
Diversity Over Size: On the Effect of Sample and Topic Sizes for Topic-Dependent Argument Mining Datasets [49.7] 本研究では,アーギュメント・マイニング・データセットの構成が,少数・ゼロショット設定における影響について検討する。
実験結果から, モデル性能の達成には微調整が必須であるが, 慎重に構成したトレーニングサンプルを用いることで, トレーニングサンプルサイズを最大90%まで下げることで, 最大性能の95%を達成できることがわかった。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:11:12 GMT)
Presto! Distilling Steps and Layers for Accelerating Music Generation [49.3] Presto!は、スコアベースの拡散変換器の推論加速度に対するアプローチである。
拡散モデルのEDM-ファミリーのための新しいスコアベース分布マッチング蒸留法(DMD)を開発した。
工程当たりのコストを削減するため,最近の層蒸留法において,単純だが強力な改良が加えられた。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:24:18 GMT)
StructLM: Towards Building Generalist Models for Structured Knowledge Grounding [49.1] 大規模言語モデル(LLM)では、最先端(SoTA)モデルの背後にある構造化データラグを平均35%処理できる。
私たちは、MistralとCodeLlamaモデルファミリに基づいたStructLMと呼ばれる一連のモデルをトレーニングします。
我々のStructLMシリーズは、評価された18のデータセットのうち16のタスク固有モデルを超え、8つのSKGタスクに新しいSoTAパフォーマンスを確立する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:44:44 GMT)
SpinQuant: LLM quantization with learned rotations [49.1] 重み、アクティベーション、KVキャッシュに適用された後トレーニング量子化(PTQ)技術は、大規模言語モデル(LLM)のメモリ使用量、レイテンシ、消費電力を大幅に削減する。
我々は、量子化精度を高めつつ、完全精度のトランスフォーマーアーキテクチャにおいて同一の出力をもたらす、適用可能な回転パラメータ化の集合を同定する。
本研究では,学習した回転行列を最適な量子化ネットワーク精度に組み込む新しい手法であるSpinQuantを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 01:27:59 GMT)
When Can Transformers Count to n? [48.3] 本研究では, 変圧器状態の次元が文脈長で線形であれば, この課題を解くことができることを示す。
サイズ制限された変圧器がこのタスクを実装することが不可能な理由を理論的に論じる。
本結果は,トランスフォーマーが簡単なタスクを解く方法を理解することの重要性を示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:19:53 GMT)
Augmenting Black-box LLMs with Medical Textbooks for Biomedical Question Answering (Published in Findings of EMNLP 2024) [48.2] LLMs Augmented with Medical Textbooks (LLM-AMT)を提案する。
LLM-AMTは、プラグイン・アンド・プレイモジュールを使用して、権威ある医学教科書をLLMのフレームワークに統合する。
検索コーパスとしての医学教科書は,医学領域におけるウィキペディアよりも効果的な知識データベースであることが確認された。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:21:45 GMT)
Magpie: Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing [48.1] 我々はMagpieという名の大規模アライメントデータを生成する自己合成法を提案する。
我々はこの手法を用いてLlama-3-Instructを誘導し、対応する応答とともに400万の命令を生成する。
以上の結果から,Magpieを微調整したモデルでは,公式のLlama-3-8B-インストラクトと同等に動作することが示唆された。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 01:45:38 GMT)
ValueScope: Unveiling Implicit Norms and Values via Return Potential Model of Social Interactions [47.9] 我々は、13のRedditコミュニティで言語的およびスタイリスティックな表現を識別し分析するためにValueScopeを使用します。
我々の分析は、近縁なコミュニティでさえ、非常に多様な規範を示すことを示す定量的基盤を提供する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 18:04:06 GMT)
Audio-Driven Emotional 3D Talking-Head Generation [47.7] 本稿では,高精度な感情表現による高忠実・音声駆動型映像像の合成システムを提案する。
本研究では,無声音声入力に応答して自然なアイドル状態(非話者)ビデオを生成するポーズサンプリング手法を提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:23:05 GMT)
Polarization-encoded quantum key distribution with a room-temperature telecom single-photon emitter [47.5] 単一光子源(SPS)は量子鍵分布(QKD)に直接適用できる
GaN欠陥に基づく室温通信SPSを用いた分極符号化QKDの観測を行った。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 05:23:47 GMT)
Geometric Signatures of Compositionality Across a Language Model's Lifetime [47.3] 構成性は表現の本質的な次元に反映されていることを示す。
また, 構成性と幾何学的複雑性の関係は, 学習した言語的特徴によってもたらされることを示した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:35:13 GMT)
Geometric Signatures of Compositionality Across a Language Model's Lifetime [47.3] 構成性は表現の本質的な次元に反映されていることを示す。
また, 構成性と幾何学的複雑性の関係は, 学習した言語的特徴によってもたらされることを示した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:35:13 GMT)
Radio Map Prediction from Aerial Images and Application to Coverage Optimization [46.9] 畳み込みニューラルネットワークを用いた経路損失無線マップの予測に着目する。
既存の無線地図データセットに対して開発された最先端モデルがこの課題に効果的に適応できることを示す。
複雑さを低減した現在の最先端技術の性能をわずかに上回る新しいモデルを導入する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 09:19:20 GMT)
Beyond Correlation: Interpretable Evaluation of Machine Translation Metrics [46.7] 本稿では,機械翻訳(MT)メトリクスの解釈可能な評価フレームワークを提案する。
このフレームワーク内では、データフィルタリングと翻訳の再ランク付けユースケースのプロキシとして機能する2つのシナリオでメトリクスを評価する。
また、DA+SQMガイドラインに従って、手動でキュレートしたデータの信頼性に関する懸念も提起する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:42:10 GMT)
WellDunn: On the Robustness and Explainability of Language Models and Large Language Models in Identifying Wellness Dimensions [46.6] 言語モデル (LMs) は, 予後不良のリスクが高まれば, 臨床実習におけるモデルの実用性に対するリトマステストにはならない可能性がある, メンタルヘルスの分野では, 言語モデル (LMs) が提案されている。
ウェルネス次元(WD)の同定におけるLMの堅牢性と説明性に着目した評価設計を提案する。
LM/LLMの4つの驚くべき結果が明らかになった。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:08:13 GMT)
Chain and Causal Attention for Efficient Entity Tracking [46.6] そこで本研究では,標準的な注意機構の効率的かつ簡素な拡張について提案する。
隣接行列として注意を向けることにより、我々のモデルは単一の層で実体状態を追跡することができる。
私たちの貢献には、理論的洞察、注意機構の改善、実証的検証が含まれる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 23:54:10 GMT)
OmniBuds: A Sensory Earable Platform for Advanced Bio-Sensing and On-Device Machine Learning [46.3] 感覚ウェアラブルは、基本的なオーディオ拡張デバイスから、臨床レベルの健康モニタリングと健康管理のための高度なプラットフォームへと進化してきた。
本稿では,複数のバイオセンサと,機械学習アクセラレーションによって駆動される車載計算を統合した,先進的な知覚可能プラットフォームであるOmniBudsを紹介する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:30:59 GMT)
Multi-LogiEval: Towards Evaluating Multi-Step Logical Reasoning Ability of Large Language Models [46.3] Multi-LogiEvalは、様々な推論規則と深さを持つ多段階論理推論を含む総合的な評価データセットである。
GPT-4, ChatGPT, Gemini-Pro, Yi, Orca, Mistralなどの大規模言語モデルの評価を行った。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 03:48:18 GMT)
Temporal Relational Reasoning of Large Language Models for Detecting Stock Portfolio Crashes [46.3] 我々はTRR(Temporal Reasoning)というアルゴリズムフレームワークを提案する。
TRRは、複雑な問題解決に使用される人間の認知能力のスペクトルをエミュレートしようとしている。
TRRは、ストックポートフォリオのクラッシュを検出する上で、最先端のソリューションよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 11:15:52 GMT)
ZEBRA: Zero-Shot Example-Based Retrieval Augmentation for Commonsense Question Answering [46.0] ZEBRAは、検索、ケースベースの推論、イントロスペクションを組み合わせたゼロショット質問応答フレームワークである。
入力質問が与えられた場合、ZEBRAは関連する質問知識ペアを知識ベースから検索し、これらのペアの関係性について推論することで新しい知識を生成する。
この生成された知識は入力された質問に答え、モデルの性能と解釈可能性を改善するために使用される。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:31:43 GMT)
Fine-Tuning CLIP's Last Visual Projector: A Few-Shot Cornucopia [45.9] 本稿では、最適化に「外部」パラメータを追加することなく、CLIP適応のための代替手法を提案する。
視覚の最後のプロジェクション行列を微調整するだけで、既存のベースラインと比較して高い性能が得られることが分かりました。
おそらく驚くべきことに、このアプローチはProLIPと呼ばれ、11のスクリーンショット分類ベンチマークの最先端よりも同等かそれ以上のパフォーマンスが得られる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:59:59 GMT)
Conditional Variational Autoencoders for Probabilistic Pose Regression [45.6] 観測画像からカメラポーズの後方分布を予測するための確率的手法を提案する。
提案したトレーニング戦略は,画像が与えられたカメラポーズの生成モデルとなり,ポーズ後部分布からサンプルを抽出することができる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:43:50 GMT)
Learning Successor Features with Distributed Hebbian Temporal Memory [45.0] 本稿では,不確実性を考慮した意思決定におけるオンライン時間記憶学習の課題に対して,新しいアプローチを提案する。
提案アルゴリズムは因子グラフ形式と多成分ニューロンモデルに基づく分散Hebbian Temporal Memory (DHTM) である。
実験の結果,非定常データセットの場合,DHTMはLSTMと生物学的にインスパイアされたHMMライクなアルゴリズムCSCGより優れていた。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:27:21 GMT)
MMLU-Pro: A More Robust and Challenging Multi-Task Language Understanding Benchmark (Published at NeurIPS 2024 Track Datasets and Benchmarks) [44.8] 本稿では、主に知識駆動型MMLUベンチマークを拡張するために設計された拡張データセットであるMMLU-Proを紹介する。
24種類のプロンプトを試験した結果,MMLUの4-5%からMMLU-Proの2%に低下した。
MMLU-Proは、この分野の進歩をよりよく追跡するための、より差別的なベンチマークであることを確認した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:46:08 GMT)
PrefixQuant: Static Quantization Beats Dynamic through Prefixed Outliers in LLMs [44.5] PrefixQuantを紹介します。これは、再トレーニングせずに、外れ値トークンをオフラインに分離する新しいテクニックです。
PrefixQuantは、高周波のoutlierトークンを特定し、それをKVキャッシュにプレフィックスすることで、推論中のoutlierトークンの生成を防止し、量子化を単純化する。
テンソルごとの静的量子化を伴うPrefixQuantは、7.43 WikiText2の難易度と5つの常識的推論タスクの平均精度を71.08%達成する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:59:35 GMT)
Progressive distillation induces an implicit curriculum [44.5] より良い教師は必ずしも良い生徒を産むとは限らない。
この原理を実証的に検証した1つの変種はプログレッシブ蒸留であり、そこで学生は教師の連続した中間チェックポイントから学習する。
スパースパリティをサンドボックスとして使用することにより、暗黙のカリキュラムをプログレッシブ蒸留によって学生の学習を加速させる1つのメカニズムとして認識する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:49:24 GMT)
TimeCNN: Refining Cross-Variable Interaction on Time Point for Time Series Forecasting [44.0] トランスフォーマーベースのモデルは、クロスタイムとクロス変数の相互作用をモデル化する上で大きなポテンシャルを示す。
本稿では,時系列予測を強化するために,異種間相互作用を洗練するためのTimeCNNモデルを提案する。
12の実世界のデータセットで実施された大規模な実験は、TimeCNNが一貫して最先端のモデルを上回っていることを示している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:16:58 GMT)
A Review of Artificial Intelligence based Biological-Tree Construction: Priorities, Methods, Applications and Trends [43.1] 生物学的ツリー分析は、生物、遺伝子、細胞間の進化的および分化的関係を明らかにする重要なツールとなる。
従来の木推論手法は、初期の研究に基礎を置いているが、大規模で複雑なデータセットを処理する際の制限が増大している。
ディープラーニングの最近の進歩は有望なソリューションを提供し、データ処理とパターン認識機能を提供する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:00:41 GMT)
Transferable Watermarking to Self-supervised Pre-trained Graph Encoders by Trigger Embeddings [43.1] Graph Self-supervised Learning (GSSL)は、基礎グラフエンコーダの事前トレーニングを可能にする。
このようなエンコーダは簡単にプルインできるので、著作権侵害に弱い。
我々はGSSL設定でグラフエンコーダを保護する新しい透かしフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 02:47:19 GMT)
Task Diversity Shortens the ICL Plateau [43.0] In-context Learning (ICL)は、一連の入力デモとその後のクエリに基づいて出力を生成する言語モデルの能力を記述する。
複数の多様なICLタスクのトレーニングが同時に損失高原を短縮し、各タスクの学習が容易になることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:28:59 GMT)
AI Delegates with a Dual Focus: Ensuring Privacy and Strategic Self-Disclosure [43.0] 我々は、さまざまな社会的関係やタスクシナリオにまたがるAIデリゲートのユーザの嗜好を調査するために、パイロットスタディを実施している。
次に、プライバシーに配慮した自己開示を可能にする新しいAIデリゲートシステムを提案する。
我々のユーザー調査は、提案されたAIデリゲートがプライバシーを戦略的に保護し、多様なダイナミックなソーシャルインタラクションにおけるその利用の先駆者であることを実証している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:29:54 GMT)
Visual Question Decomposition on Multimodal Large Language Models [42.9] 本稿では,マルチモーダル大言語モデル(MLLM)の視覚的問題分解について検討する。
分割されたサブクエストの品質を評価するために,データセットといくつかの評価基準を含む体系的評価フレームワークを導入する。
微調整MLLMはサブクエストの品質と選択的質問分解のポリシーを著しく改善した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:05:55 GMT)
Visual Question Decomposition on Multimodal Large Language Models [42.9] 本稿では,マルチモーダル大言語モデル(MLLM)の視覚的問題分解について検討する。
分割されたサブクエストの品質を評価するために,データセットといくつかの評価基準を含む体系的評価フレームワークを導入する。
微調整MLLMはサブクエストの品質と選択的質問分解のポリシーを著しく改善した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:05:55 GMT)
DYNAMICQA: Tracing Internal Knowledge Conflicts in Language Models [42.8] 本研究では,メモリ内競合がLMのコンテキスト受容能力に及ぼす影響について検討した。
我々は、2つの知識衝突対策と、本質的に矛盾するデータを含む新しいデータセットであるDynamicQAを利用する。
我々は,単一真理値の事実と比較して,LMが動的事実とメモリ内衝突の程度が大きいことを検証した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:59:37 GMT)
MOFFlow: Flow Matching for Structure Prediction of Metal-Organic Frameworks [42.6] 金属-有機フレームワーク(英: Metal-organic framework、MOF)は、炭素捕獲や薬物の放出といった多くの分野で有望な応用を持つ結晶材料のクラスである。
ab initio計算や深い生成モデルを含む既存のアプローチは、単位セル内の多くの原子のためにMOF構造が複雑になるのに苦労している。
我々はMOF構造予測に適した最初の深部生成モデルMOFFlowを紹介する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 13:51:58 GMT)
Intuitions of Compromise: Utilitarianism vs. Contractualism [42.3] 我々は、社会的な意思決定の文脈において、グループ間での嗜好を集約するためにアルゴリズムを適用するパラダイムを使用している。
現在まで、バリューアグリゲーションに対する支配的なアプローチは実用的だが、私たちは契約者アルゴリズムが推奨するアグリゲーションを強く好んでいることに気付きました。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:05:57 GMT)
Machine Learning Based Optimal Design of Fibrillar Adhesives [41.9] 甲虫、クモ、カブトムシなどの動物で観察されるフィブリル接着は、「接触分割」によって表面の接着を強化するためにナノ顕微鏡または顕微鏡的フィブリルに依存している。
近年の研究では、フィブリル物性の官能的なグレーディングは接着性を向上させることが示唆されているが、これは簡易な測地でのみ検討された複雑な設計課題である。
接着強度を最大化するためにフィブリルコンプライアンスの分布を最適化するMLベースのツールを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:37:56 GMT)
Learning How Hard to Think: Input-Adaptive Allocation of LM Computation [41.4] 計算集約的な復号処理は、コード生成、数値推論、ダイアログにまたがる問題において、言語モデル(LM)出力の品質を向上させることができる。
精度の高い計算割当手順を学習でき、応答品質を犠牲にすることなく最大50%の計算を減らしたり、固定された計算予算で最大10%品質を向上できることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:52:30 GMT)
AnyAttack: Towards Large-scale Self-supervised Generation of Targeted Adversarial Examples for Vision-Language Models [41.0] VLM(Vision-Language Models)は、画像ベースの敵攻撃に対して脆弱である。
本稿では,ラベル管理なしでVLMのターゲット画像を生成する自己教師型フレームワークであるAnyAttackを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:45:18 GMT)
A Narrative Review of Image Processing Techniques Related to Prostate Ultrasound [40.4] 前立腺癌(PCa)は男性の健康に重大な脅威となり、早期診断は予後の改善と死亡率の低下に不可欠である。
経直腸超音波(TRUS)はPCaの診断と画像誘導療法において重要な役割を担っている。
TRUSにおける多くの画像処理アルゴリズムが提案され、いくつかのタスクで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:45:55 GMT)
Jailbreaking Leading Safety-Aligned LLMs with Simple Adaptive Attacks [38.3] 近年のLLMでさえ、単純な適応型ジェイルブレイク攻撃に対して堅牢ではないことが示されている。
我々は, Vicuna-13B, Mistral-7B, Phi-3-Mini, Nemotron-4-340B, Llama-2-Chat-7B/13B/70B, Llama-3-Instruct-8B, Gemma-7B, GPT-3.5, GPT-4o, R2D2の攻撃成功率を達成する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:35:15 GMT)
Social Bias Probing: Fairness Benchmarking for Language Models [38.2] 本稿では,社会的偏見を考慮した言語モデル構築のための新しい枠組みを提案する。
既存のフェアネスコレクションの制限に対処するために設計された大規模なベンチマークであるSoFaをキュレートする。
我々は、言語モデル内のバイアスが認識されるよりもニュアンスが高いことを示し、これまで認識されていたよりもより広く符号化されたバイアスの範囲を示している。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:01:06 GMT)
HyperINF: Unleashing the HyperPower of the Schulz's Method for Data Influence Estimation [37.6] 本稿では,効率よく正確な影響関数近似法であるHyperINFを提案する。
我々は、ヘッセン行列の低ランク近似として、GFIM(Generalized Fisher Information)を組み込んだ。
LoRAでチューニングされたモデルでは、HyperINFは最小限のメモリと計算オーバーヘッドで、より優れたダウンストリーム性能を実現する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:42:45 GMT)
Haste Makes Waste: A Simple Approach for Scaling Graph Neural Networks [37.4] グラフニューラルネットワーク(GNN)はグラフ表現学習において顕著な成功を収めている。
GNNを大規模グラフのアプリケーションに拡張するための様々なサンプリング手法が提案されている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:29:02 GMT)
Typing to Listen at the Cocktail Party: Text-Guided Target Speaker Extraction [37.3] 人間は単一話者を複雑な音響環境から容易に隔離することができ、これは「カクテルパーティー効果」と呼ばれる。
従来のターゲット話者抽出アプローチはボイスプリントに依存しており、プライバシー上の懸念や、登録サンプルの品質と可用性に関する問題に直面している。
この研究は、LLM-TSEという新しいテキスト誘導型TSEパラダイムを導入している。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 06:54:30 GMT)
Jogging the Memory of Unlearned LLMs Through Targeted Relearning Attack [37.1] LLMにおける未学習に対する既存のアプローチは、単純な再学習攻撃の標的セットに驚くほど影響を受けやすいことを示す。
小さく、潜在的にゆるやかに関連付けられたデータのみにアクセスすることで、未学習モデルのメモリを“ジョグ”して、未学習の影響を反転させることができることが分かりました。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:27:30 GMT)
Item Cluster-aware Prompt Learning for Session-based Recommendation [36.9] セッションベースのレコメンデーションは、個々のセッション内のアイテムシーケンスを分析することによって、ユーザの好みをキャプチャすることを目的としている。
既存のアプローチのほとんどは、セッション内のアイテムの関係に重点を置いており、異なるセッション間でのアイテム間の接続を無視している。
このような課題に対処するために、CLIP-SBR(Cluster-aware Item Prompt Learning for Session-based Recommendation)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 05:20:21 GMT)
CTC-GMM: CTC guided modality matching for fast and accurate streaming speech translation [36.4] CTC-GMM (Connectionist Temporal Classification Guided modality matching) という手法を導入する。
この手法は、CTCを用いて、対応するテキストシーケンスと一致するコンパクトな埋め込みシーケンスに音声シーケンスを圧縮する。
FLEURS と CoVoST2 を用いて評価した結果,CTC-GMM による翻訳精度は,それぞれ 13.9% と 6.4% 向上した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:58:03 GMT)
Universal Medical Image Representation Learning with Compositional Decoders [36.4] 我々は,すべてのレベルでタスクをサポートする,分解分解型ユニバーサル医療イメージングパラダイム(UniMed)を開発した。
定義した入力キューに基づいて,画素とセマンティックという2種類の出力を予測できる分解デコーダを提案する。
入力空間と出力空間を統一した合成デコーダを導入し、異なるレベルのタスクアノテーションを離散トークン形式に標準化する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:35:44 GMT)
LeanQuant: Accurate and Scalable Large Language Model Quantization with Loss-error-aware Grid [36.3] 大規模言語モデル(LLM)は、様々な領域において大きな可能性を示している。
トレーニング後の量子化は、メモリ要求を減らし、遅延をデコードするための有望なテクニックとして登場した。
正確で汎用的でスケーラブルな新しい量子化手法であるLeanQuantを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 20:29:05 GMT)
Harnessing individual nitrogen-vacancy centers with a compact and portable confocal microscope [36.1] 量子技術の最近の進歩は、ダイヤモンドの窒素空孔(NV)中心の可能性を強調している。
単一NV中心の効率的な検出と制御を目的としたコンパクトでポータブルな共焦点装置を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:35:46 GMT)
Intrinsic Self-correction for Enhanced Morality: An Analysis of Internal Mechanisms and the Superficial Hypothesis [35.7] 大規模言語モデル(LLM)は、ステレオタイプ、識別、毒性を永続するコンテンツを生成できる。
最近提案された道徳的自己補正は、LLMの応答における有害な内容を減らすための計算学的に効率的な方法である。
自己補正は、LLMが隠れた状態に保存されている不道徳性を本当に減らすのではなく、より道徳的に正しいアウトプットのショートカットを見つけるのに役立つと我々は主張する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 23:47:55 GMT)
FacLens: Transferable Probe for Foreseeing Non-Factuality in Large Language Models [35.0] 本研究は,非実効性予測(NFP)について検討し,LLMが質問に対する非実効性応答を生成するかどうかを予測することを目的とした。
本研究では,NFPタスクの隠れ表現を効果的に探索するFacLensという軽量なNFPモデルを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 03:06:34 GMT)
When "A Helpful Assistant" Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models [34.8] 商用AIシステムは一般に、システムプロンプトにおけるLarge Language Models(LLM)の役割を定義している。
客観的タスクにおいて、異なるペルソナがモデルのパフォーマンスにどの程度影響するかは、まだ不明である。
6種類の対人関係と8つの専門領域を含む162のロールのリストをキュレートする。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:26:00 GMT)
Uncertainty-Aware Decision Transformer for Stochastic Driving Environments [34.8] 環境の運転計画のためのuncertainty-awaRESion Transformer(UNREST)を導入する。
UNRESTは、遷移と返却の間の条件付き相互情報によって不確実性を推定する。
我々は、意思決定変換器のグローバルなリターンを、実際の結果から学ぶ環境の影響を受けない、切り捨てられたリターンに置き換える。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 12:05:12 GMT)
Selective Transformer for Hyperspectral Image Classification [34.7] Transformerは、ハイパースペクトル画像(HSI)分類の分野で満足な結果を得た。
HSI分類のための新しい選択変換器(SFormer)を提案する。
SFormerは、空間情報とスペクトル情報の両方をキャプチャするための受容フィールドを動的に選択するように設計されている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:28:41 GMT)
Selective Transformer for Hyperspectral Image Classification [34.7] Transformerは、ハイパースペクトル画像(HSI)分類の分野で満足な結果を得た。
HSI分類のための新しい選択変換器(SFormer)を提案する。
SFormerは、空間情報とスペクトル情報の両方をキャプチャするための受容フィールドを動的に選択するように設計されている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:28:41 GMT)
MetaAligner: Towards Generalizable Multi-Objective Alignment of Language Models [34.5] 実験結果から,MetaAlignerは10の最先端ポリシーモデル上での多目的アライメントにおいて,有意かつバランスの取れた改善を実現していることがわかった。
このモデルはまた、目に見えない目的を効果的に整列させ、一般化可能な多目的の選好アライメントへの第一歩をマークしている。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 03:19:16 GMT)
Universal Medical Image Representation Learning with Compositional Decoders [34.3] 我々は,すべてのレベルでタスクをサポートする,分解分解型ユニバーサル医療イメージングパラダイム(UniMed)を開発した。
定義した入力キューに基づいて,画素とセマンティックという2種類の出力を予測できる分解デコーダを提案する。
入力空間と出力空間を統一した合成デコーダを導入し、異なるレベルのタスクアノテーションを離散トークン形式に標準化する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:35:44 GMT)
Frame-Voyager: Learning to Query Frames for Video Large Language Models [33.8] ビデオ大言語モデル (Video-LLMs) はビデオ理解タスクにおいて顕著な進歩を遂げている。
フレームの一様サンプリングやテキストフレーム検索のような既存のフレーム選択アプローチでは、ビデオ内の情報密度の変動を考慮できない。
タスクの与えられたテキストクエリに基づいて,情報フレームの組み合わせを問合せする Frame-Voyager を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:01:01 GMT)
Frame-Voyager: Learning to Query Frames for Video Large Language Models [33.8] ビデオ大言語モデル (Video-LLMs) はビデオ理解タスクにおいて顕著な進歩を遂げている。
フレームの一様サンプリングやテキストフレーム検索のような既存のフレーム選択アプローチでは、ビデオ内の情報密度の変動を考慮できない。
タスクの与えられたテキストクエリに基づいて,情報フレームの組み合わせを問合せする Frame-Voyager を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:01:01 GMT)
Improving Molecule Generation and Drug Discovery with a Knowledge-enhanced Generative Model [33.4] 我々はKARLと呼ばれる知識強化型生成モデルのためのフレームワークを開発する。
意味的整合性を保ちながら知識グラフの機能を拡張し、このコンテキスト情報を生成フレームワークに組み込む。
KARLは、非条件およびターゲット生成タスクの両方において、最先端の生成モデルより優れている。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 22:56:17 GMT)
TabDDPM: Modelling Tabular Data with Diffusion Models [33.2] TabDDPM -- どんなデータセットにも普遍的に適用でき、どんなタイプの機能でも扱える拡散モデルです。
我々は,TabDDPMを広範囲のベンチマークで評価し,既存のGAN/VAE代替よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 12:38:57 GMT)
Revisiting Who's Harry Potter: Towards Targeted Unlearning from a Causal Intervention Perspective [32.9] 学習対象と学習対象の未学習文書が与えられた場合,学習対象に関する情報のみを学習対象とするLLMの新たなタスクを導入する。
我々は、未学習の成功は、ジベリッシュをアウトプットしない、未学習の目標に関する事実を作らない、脱獄攻撃の事実情報を公開しない、といった基準を満たすべきだと論じている。
このフレームワークはWHPを正当化し拡張し、WHPを特殊なケースとして含む単純な未学習アルゴリズムを導出する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:41:57 GMT)
Correcting Diffusion Generation through Resampling [32.9] 本研究では, 生成画像と接地画像の分布差を低減できる粒子フィルタリングフレームワークを提案する。
提案手法は, 画像生成タスクにおいて, 欠落したオブジェクトの誤りを効果的に補正し, 画質を向上させる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 03:59:27 GMT)
Music-triggered fashion design: from songs to the metaverse [32.7] 我々は、仮想現実がミュージシャンが観客と橋渡しする機会を広げるのにどのように役立つかを分析する。
我々はメタバースの音楽体験を再定義する第一歩を提示する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:09:45 GMT)
AI-Driven Early Mental Health Screening with Limited Data: Analyzing Selfies of Pregnant Women [32.5] うつ病や不安障害は世界中で何百万もの人に影響を与え、精神疾患の重荷に大きく貢献する。
早期スクリーニングは、精神疾患のタイムリーな同定が治療成績を大幅に改善するので、効果的な介入に不可欠である。
本研究は、顔中心の自撮りを与えられたユビキタスな抑うつ不安スクリーニングのためのAIモデルの可能性について検討する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:34:25 GMT)
Patch is Enough: Naturalistic Adversarial Patch against Vision-Language Pre-training Models [32.2] 本稿では,攻撃に画像パッチを専ら使用し,オリジナルテキストの完全性を維持する新しい戦略を提案する。
本手法は,拡散モデルからの事前知識を活用し,摂動の真性や自然性を高める。
画像・テキスト・シナリオのホワイトボックス・セッティングで実施した総合実験により,提案手法は既存の手法を著しく上回り,100%の攻撃成功率を達成した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 10:06:01 GMT)
Online scalable Gaussian processes with conformal prediction for guaranteed coverage [32.2] 結果として生じる不確実な値の整合性は、学習関数がGPモデルで指定された特性に従うという前提に基づいている。
提案するGPは,分散のない後処理フレームワークである共形予測(CP)を用いて,有意なカバレッジで予測セットを生成する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:22:15 GMT)
OmniBooth: Learning Latent Control for Image Synthesis with Multi-modal Instruction [32.1] 我々は,インスタンスレベルのマルチモーダルカスタマイズによる空間制御を実現する画像生成フレームワークOmniBoothを提案する。
提案手法は,テキスト・画像生成の範囲を大きく拡大し,より汎用的で実用的な制御性に拡張する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:26:13 GMT)
Wide Neural Networks Trained with Weight Decay Provably Exhibit Neural Collapse [32.1] 収束時のディープニューラルネットワーク(DNN)は、ニューラル崩壊と呼ばれる対称的な幾何学構造を通して、最終層のトレーニングデータを一貫して表現している。
ここでは、垂直層の特徴は自由変数であり、モデルがデータに依存しないため、トレーニングをキャプチャする能力に疑問を呈する。
まず, (i) 線形層の低トレーニング誤差とバランス性, (ii) 線形部の前の特徴の有界条件付けを前提とした神経崩壊に関する一般的な保証を示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 10:16:40 GMT)
Constructing and Masking Preference Profile with LLMs for Filtering Discomforting Recommendation [31.4] DiscomfortFilterは不快なレコメンデーションをフィルタリングするツールだ。
DiscomfortFilterは、LLM(Large Language Model)ベースのツールであるDiscomfortFilterをベースにしている。
参加者24名による1週間のユーザスタディでは、DiscomfortFilterの有効性が示された。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 18:23:00 GMT)
Knowledge Graph Based Agent for Complex, Knowledge-Intensive QA in Medicine [31.1] 生物医学の科学者は推論への単一のアプローチに頼っていない。
KGARevionは、医療クエリの複雑さに対処するために設計された知識グラフベースのエージェントである。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 00:17:37 GMT)
LLMs Are In-Context Reinforcement Learners [30.2] 大規模言語モデル(LLM)は、コンテキスト内教師あり学習(ICL)を通じて新しいタスクを学習することができる。
この研究は、この能力が文脈内強化学習(ICRL)にまで拡張されるかどうかを研究する。
本稿では、テスト時間計算の増加と計算バウンド近似により、この欠陥に対処するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:45:00 GMT)
SFTMix: Elevating Language Model Instruction Tuning with Mixup Recipe [30.0] 従来のNTPパラダイムを超えて,命令チューニング性能を高める新しいレシピであるSFTMixを提案する。
トレーニング力学に基づいて、異なる信頼度を持つ例は、指導訓練過程において異なる役割を演じるべきであると論じる。
このアプローチにより、SFTMixは、幅広いインストラクションフォローとヘルスケアドメイン固有のSFTタスクにおいて、NTPを大幅に上回ることができる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:52:21 GMT)
ProtoNAM: Prototypical Neural Additive Models for Interpretable Deep Tabular Learning [29.9] Prototypeal Neural Additive Model (ProtoNAM) は,新しい深層学習法である。
ProtoNAMは、GAMのフレームワークでニューラルネットワークにプロトタイプを導入する。
実験により, ProtoNAM は既存の NN ベース GAM よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:25:46 GMT)
$\textbf{PLUM}$: Improving Code LMs with Execution-Guided On-Policy Preference Learning Driven By Synthetic Test Cases [28.8] 刑法上の$textbfP$reference $textbfL$earning framework A$textbfu$gmented with test case for code L$textbfM$ s。
PLUMは報酬モデルをトレーニングする必要性を緩和し、大規模なオンラインとオンラインの嗜好データ照合を可能にする。
PLUMの利点は、SFTで十分に訓練されていなくても、様々な広く使われているコードLM間で一貫性があることを示します。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 23:49:51 GMT)
Representation noising effectively prevents harmful fine-tuning on LLMs [28.5] オープンソースの大規模言語モデル(LLM)のリースは、悪質なアクターがこれらのモデルを有害な目的のために簡単に微調整できるため、デュアルユースリスクをもたらす。
本稿では,攻撃者が重みにアクセスできる場合でも有効である防御機構であるRepresentation Noising(RepNoise)を提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:01:49 GMT)
Stage-Wise and Prior-Aware Neural Speech Phase Prediction [28.4] 本稿では,SP-NSPP(Stage-wise and Prior-Aware Neural Speech Phase Prediction)モデルを提案する。
初期事前構成段階では、振幅スペクトルから粗い前相スペクトルを予め予測する。
その後の精細化段階は、振幅スペクトルを前相に条件付き精製された高品質の位相スペクトルに変換する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:45:20 GMT)
Double Oracle Neural Architecture Search for Game Theoretic Deep Learning Models [28.2] 本稿では,ゲーム理論の概念を用いたディープラーニングモデルの学習手法を提案する。
最良応答オラクルを用いた二重対角フレームワークをデプロイする。
主観的質的評価と定量的指標の両面で,我々の変種は有意な改善が見られた。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 05:42:01 GMT)
Extracting Heuristics from Large Language Models for Reward Shaping in Reinforcement Learning [28.1] 強化学習(Reinforcement Learning, RL)は、報酬領域におけるサンプルの非効率性に悩まされ、移行時にはさらにその問題が顕著になる。
サンプル効率を改善するために、報酬形成はRLエージェントが最適なポリシーに迅速に収束するのに役立つ本質的な報酬を導入するためのよく研究されたアプローチである。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 19:33:34 GMT)
Deep Height Decoupling for Precise Vision-based 3D Occupancy Prediction [28.1] 本稿では,DHD(Deep Height Decoupling,ディープハイトデカップリング,Deep Height Decoupling,DHD)について述べる。
一般的なOcc3D-nuScenesベンチマークでは,最小入力フレームでも最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 04:17:01 GMT)
Federated Learning Nodes Can Reconstruct Peers' Image Data [27.9] Federated Learning(FL)は、複数のノードがローカルデータ上でモデルをトレーニングできるようにする、プライバシ保護機械学習フレームワークである。
以前の研究によると、FLの勾配共有ステップは、正直だが正確な中央サーバーからのデータ再構成攻撃に弱い可能性がある。
正直なノード/クライアントは、集中型システムでピアのイメージデータを再構築する攻撃を起動し、深刻なプライバシーリスクを生じさせることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 00:18:35 GMT)
A Survey on Trustworthiness in Foundation Models for Medical Image Analysis [27.9] 医用画像における基礎モデルの新たな分類法を提案する。
本研究は, セグメンテーション, 医療報告生成, 医療質問と回答(Q&A), 疾患診断に焦点をあてる。
我々の分析は、医用画像解析において、信頼できるAIに向けて進むための必須事項である。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:03:30 GMT)
Dynamic HumTrans: Humming Transcription Using CNNs and Dynamic Programming [27.8] 本稿では,CNNに基づくアーキテクチャと動的プログラミングに基づくアルゴリズムを組み合わせることで,文字をハミングする新しい手法を提案する。
データセットが提供するオフセットのポストセットとグラウンドのオンセットで固有の問題に対処し、これらのアノテーションを改善するための真実を提供します。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:40:39 GMT)
Scalable and Accurate Graph Reasoning with LLM-based Multi-Agents [27.5] GraphAgent-Reasonerは、明示的で正確なグラフ推論のための微調整不要なフレームワークである。
分散グラフ計算理論にインスパイアされた我々のフレームワークは、グラフ問題を複数のエージェント間で分散される小さなノード中心のタスクに分解する。
本フレームワークは,Webページ重要度分析などの実世界のグラフ推論アプリケーションを扱う能力を示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:34:14 GMT)
Collaboration! Towards Robust Neural Methods for Routing Problems [27.5] 既存の車両ルーティング問題(VRP)のニューラルネットワークは、深刻な堅牢性の問題に悩まされている。
本稿では, アンサンブルをベースとした協調型ニューラルネットワーク(CNF)について, ニューラルVRP法の防衛について述べる。
ニューラルルータは、モデルのトレーニングインスタンスを十分に分散し、全体的なロードバランシングと協調的有効性を向上させるように設計されている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:12:51 GMT)
Average gradient outer product as a mechanism for deep neural collapse [26.9] Deep Neural Collapse (DNC)は、Deep Neural Networks (DNN)の最終層におけるデータ表現の驚くほど硬い構造を指す。
本研究では,平均勾配外積(AGOP)を通した特徴学習によりDNCが生成するデータ依存環境を提案する。
特徴学習体制下で訓練されたニューラルネットワークに対して,適切な特異ベクトルと重みの値が,クラス内変動の崩壊の大部分の原因となることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:55:21 GMT)
First Heuristic Then Rational: Dynamic Use of Heuristics in Language Model Reasoning [26.7] より優れた言語性能を探求するために多段階推論命令が広く採用されている。
我々は,このような多段階推論プロセスにおいて,LMが採用する体系的戦略について報告する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:01:26 GMT)
Influence-based Attributions can be Manipulated [26.6] 影響に基づく属性は、敵対者によってテクスト的に改ざんされる可能性があることを示す。
我々の研究は、敵の状況における影響に基づく属性の信頼性に関する疑問を提起する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:13:37 GMT)
Influence-based Attributions can be Manipulated [26.6] 影響に基づく属性は、敵対者によってテクスト的に改ざんされる可能性があることを示す。
我々の研究は、敵の状況における影響に基づく属性の信頼性に関する疑問を提起する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:13:37 GMT)
Odyssey: Empowering Minecraft Agents with Open-World Skills [26.5] Odysseyは、LLM(Large Language Model)ベースのエージェントにオープンワールドスキルを付与し、Minecraftの世界を探索する新しいフレームワークである。
Odysseyは,(1)40のプリミティブスキルと183の作曲スキルからなるオープンワールドスキルライブラリを備えた対話型エージェント,(2)Minecraft Wikiから派生した390k以上のインストラクションインストラクションを持つ大規模質問応答データセット上で訓練された微調整LLaMA-3モデル,(3)新しいエージェント能力ベンチマークの3つの重要な部分から構成される。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:40:07 GMT)
The Generation Gap: Exploring Age Bias in the Value Systems of Large Language Models [26.5] 特に米国人口と比較して,若年層に対するLLM(Large Language Models)値の一般的な傾向を見出した。
一般的な傾きは観察できるが、若いグループに対するこの傾きは、異なる値のカテゴリで異なることが判明した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 00:16:54 GMT)
MM-R$^3$: On (In-)Consistency of Multi-modal Large Language Models (MLLMs) [26.5] 本研究では,MLLMモデルが意味論的に類似したクエリに対して,意味論的に類似あるいは同一の応答を生成する能力について検討する。
本稿では,SoTA MLLMの一貫性と精度の観点から,MM-R$3$ベンチマークを提案する。
我々の分析では、一貫性が必ずしも精度と一致していないことを示し、高い精度のモデルが必ずしも一致しているとは限らないことを示し、その逆も示している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:36:55 GMT)
PRFusion: Toward Effective and Robust Multi-Modal Place Recognition with Image and Point Cloud Fusion [26.4] 本稿では,PRFusionとPRFusion++という2つのマルチモーダル位置認識モデルを提案する。
3つの大規模ベンチマークにおいて、両モデルの最先端性能を検証する。特に、要求されるボレアデータセットにおいて、既存のモデルに対して+3.0 AR@1のかなりのマージンで性能を向上する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:31:12 GMT)
Image Watermarks are Removable Using Controllable Regeneration from Clean Noise [26.1] 透かし技法の重要な特徴は、様々な操作に対する頑丈さである。
アート透かし技術の現状を効果的に無効化できる透かし除去手法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 20:04:29 GMT)
SELECT: A Large-Scale Benchmark of Data Curation Strategies for Image Classification [26.0] 我々は、画像分類のためのデータキュレーション戦略の大規模なベンチマークであるSELECTを紹介する。
我々のデータセットは、ImageNet-1K自体の約5つの新しいトレーニングデータシフトでImageNetを拡張しています。
これらの戦略は特定のタスクに対して非常に競争力があるものの、元のImageNet-1Kデータセットを組み立てるのに使用されるキュレーション戦略がゴールドスタンダードのままであることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:14:38 GMT)
RelUNet: Relative Channel Fusion U-Net for Multichannel Speech Enhancement [25.9] マルチチャネル音声強調モデル、特にU-Netアーキテクチャに基づくものは、有望な性能と一般化の可能性を示す。
本稿では,各チャネルが参照チャネルと協調して,スタックリングによって処理される,アウトセットからの相対情報を組み込むことにより,これらのモデルに新たな変更を加えることを提案する。
この入力戦略は、比較差を利用してチャネル間の情報を適応的に融合し、重要な空間情報を捕捉し、全体的な性能を向上させる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:19:10 GMT)
Liar, Liar, Logical Mire: A Benchmark for Suppositional Reasoning in Large Language Models [25.7] 我々は騎士とナイフパズルの原理に基づく仮定推論のベンチマークである$textitTruthQuest$を紹介した。
評価の結果、Llama 3やMixtral-8x7Bのような大規模言語モデルはこれらのタスクを解くのにかなりの困難を呈している。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 19:07:37 GMT)
Studying and Mitigating Biases in Sign Language Understanding Models [25.1] 我々は、クラウドソースのサインデータセットでトレーニングされたモデルから生じるバイアスについて研究し、文書化する。
モデルトレーニング中にいくつかのバイアス緩和手法を適用し,これらの手法が精度を低下させることなく性能格差を低減することを発見した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:09:03 GMT)
PEAR: Position-Embedding-Agnostic Attention Re-weighting Enhances Retrieval-Augmented Generation with Zero Inference Overhead [24.6] 検索拡張生成(RAG)により強化された大言語モデル(LLM)は、Web検索のための新しいパラダイムを導入した。
既存のコンテキスト認識を強化する方法は、しばしば非効率であり、推論中に時間やメモリオーバーヘッドが発生する。
そこで我々は,LLMの文脈認識をゼロ推論オーバーヘッドで向上する位置埋め込み非依存再重み付け(PEAR)を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:17:44 GMT)
PEAR: Position-Embedding-Agnostic Attention Re-weighting Enhances Retrieval-Augmented Generation with Zero Inference Overhead [24.6] 検索拡張生成(RAG)により強化された大言語モデル(LLM)は、Web検索のための新しいパラダイムを導入した。
既存のコンテキスト認識を強化する方法は、しばしば非効率であり、推論中に時間やメモリオーバーヘッドが発生する。
そこで我々は,LLMの文脈認識をゼロ推論オーバーヘッドで向上する位置埋め込み非依存再重み付け(PEAR)を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:17:44 GMT)
Adaptive Contrastive Decoding in Retrieval-Augmented Generation for Handling Noisy Contexts [24.5] 文脈の影響を効果的に活用するための適応型コントラスト復号法(ACD)を提案する。
ACDは、ベースラインよりもオープンドメインの質問応答タスクの改善を示している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:11:46 GMT)
Airport Delay Prediction with Temporal Fusion Transformers [24.3] 本研究は,米国最上位30空港において,新しい時空核融合変圧器モデルを適用し,第4四半期の空港到着遅延を予測することを提案する。
我々のモデルには、空港の需要と容量予測、歴史的な空港の運転効率情報、空港の風と可視性、さらには気象や交通条件などが含まれる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 03:36:11 GMT)
GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models [24.3] GSM8Kベンチマークは、小学校レベルの質問に対するモデルの数学的推論を評価するために広く使われている。
GSM-Symbolicは、シンボリックテンプレートから生成された改良されたベンチマークである。
以上の結果から,LLMは同一質問の異なるインスタンス化に応答する際,顕著なばらつきを示すことが明らかとなった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:36:37 GMT)
ComplexTempQA: A Large-Scale Dataset for Complex Temporal Question Answering [24.0] ComplexTempQAは、1億以上の質問応答ペアからなる大規模なデータセットである。
このデータセットは、20年以上にわたる質問をカバーし、未一致のトピックを提供している。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 12:32:24 GMT)
"I Like Sunnie More Than I Expected!": Exploring User Expectation and Perception of an Anthropomorphic LLM-based Conversational Agent for Well-Being Support [24.0] 本研究は,2つの大言語モデル(LLM)の対話後認識に対するユーザの当初の期待とを比較した。
その結果、両方のシステムでユーザエンゲージメントが高いことが示され、どちらのシステムも実用性に関するユーザの期待を上回った。
これらの結果から, 人為的対話型インタラクションデザインは, メンタルヘルス支援の文脈における温暖化促進に特に有効である可能性が示唆された。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 04:18:40 GMT)
Can AI Relate: Testing Large Language Model Response for Mental Health Support [24.0] 大型言語モデル(LLM)はすでにニューヨーク・ラングーン、ダナ・ファーバー、NHSなどの病院システムで臨床使用のために試験されている。
精神医療の自動化に向けて, LLM 反応が有効かつ倫理的な道筋であるか否かを評価するための評価枠組みを開発する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 18:34:56 GMT)
Wireless-Friendly Window Position Optimization for RIS-Aided Outdoor-to-Indoor Networks based on Multi-Modal Large Language Model [23.9] 本稿では、RIS支援屋外屋内(O2I)ネットワークにおいて、窓の位置と窓面配置された知的表面(RIS)のビーム方向を調整し、室内無線および日光性能を最適化することを目的とする。
計算結果から,提案フレームワークは,初期性能,収束速度,最終結果,時間的複雑性の観点から,優れた最適化性能を達成できることが示された。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 18:00:47 GMT)
Latent Concept-based Explanation of NLP Models [23.7] 本稿では、潜在概念に基づく予測のための説明を生成するLatent Concept Attribution法(LACOAT)を提案する。
LACOATは、有能な入力語の表現をトレーニング潜在空間にマッピングすることで、予測の潜在文脈に基づく説明を提供することによって機能する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 19:12:38 GMT)
Learning to Steer Markovian Agents under Model Uncertainty [23.6] 我々は,希望する政策に向けて,マルチエージェントシステムに付加的な報酬を課す方法について検討する。
既存の作業の制限によって動機づけられた我々は、emphMarkovian agentと呼ばれる学習力学の新しいカテゴリーを考える。
我々は、エージェントの学習力学に関する本質的なモデルの不確実性を扱うために、歴史に依存した運営戦略を学習する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:25:34 GMT)
FusionDTI: Fine-grained Binding Discovery with Token-level Fusion for Drug-Target Interaction [23.5] 本稿では,トークンレベルのFusionモジュールを用いてドラッグ・ターゲットインタラクションの詳細な情報を学習するFusionDTIという新しいモデルを提案する。
特に、FusionDTIモデルでは、医薬品のSELFIES表現を使用して、配列フラグメントの無効化を軽減しています。
提案したFusionDTIモデルは,既存の7つの最先端ベースラインと比較して,DTI予測において最高の性能が得られることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 21:22:58 GMT)
VisDiff: SDF-Guided Polygon Generation for Visibility Reconstruction and Recognition [23.5] 表現学習における活発なフロンティアは、よく知られた局所的な近傍や距離関数を含まない構造に対する理解表現である。
対象の可視グラフGからポリゴンを再構成する新しい拡散に基づくアプローチであるVisDiffを導入する。
提案手法はまず,P の符号付き距離関数 (SDF) を G から推定する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 22:17:11 GMT)
Dr. Jekyll and Mr. Hyde: Two Faces of LLMs [23.4] 本研究では,ChatGPTとGeminiを,忠実なアシスタントと一致しない人格特性を持つ複雑なペルソナに擬人化させる。
ペルソナを用いて、禁止された応答が提供され、不正、違法、有害な情報を得ることができることを示す。
同じ原則で、モデルに信頼に値する個人性を解釈させ、そのような攻撃に対してより堅牢にする2つの防衛法を導入する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:46:59 GMT)
Post-hoc Study of Climate Microtargeting on Social Media Ads with LLMs: Thematic Insights and Fairness Evaluation [23.0] 本研究では,大規模言語モデル(LLM)を活用した気候キャンペーンにおけるマイクロターゲットの実践に関するポストホック分析を行った。
性別や年齢などの対象とする人口目標を正確に予測し,全体の88.55%の精度を達成できるLCMの能力を評価する。
以上の結果から,若年者は主に行動主義や環境意識を重視したメッセージを通じて対象とされ,女性は介護の役割や社会的アドボケーションに関するテーマに携わっていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:07:56 GMT)
SARatrX: Towards Building A Foundation Model for SAR Target Recognition [22.8] 我々は、SARatrXと呼ばれるSAR ATRの基礎モデルを構築するための最初の試みを行っている。
SARatrXは、自己教師付き学習(SSL)を通じて一般化可能な表現を学び、汎用的なSARターゲット検出と分類タスクへのラベル効率のモデル適応の基礎を提供する。
具体的には、SARatrXは0.18Mの未ラベルのSARターゲットサンプルでトレーニングされており、同時代のベンチマークを組み合わせてキュレーションされ、これまでで最大の公開データセットとなっている。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 07:39:40 GMT)
Nonasymptotic Analysis of Stochastic Gradient Descent with the Richardson-Romberg Extrapolation [22.7] ステップサイズが一定となる勾配勾配(SGD)アルゴリズムを用いて, 強い凸と滑らかな問題を解く問題に対処する。
得られた推定子の平均二乗誤差を$n$の反復数に対して拡張する。
我々は、この鎖が定義された重み付きワッサーシュタイン半計量に関して幾何学的にエルゴード的であることを確証する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:02:48 GMT)
LPZero: Language Model Zero-cost Proxy Search from Zero [22.6] Zero-shot NAS は Zero- Cost (ZC) プロキシを活用するという,有望なアプローチとして登場した。
各種タスク向けにZCプロキシを自動設計する新しいフレームワークである textbfLPZero を導入する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:41:48 GMT)
Deeper Insights Without Updates: The Power of In-Context Learning Over Fine-Tuning [22.3] ファインチューニングとインコンテキスト学習(ICL)は、タスク固有の知識で大きな言語モデルを出力する2つの一般的な方法である。
暗黙的なパターンを持つタスクに対して、ICLはこれらのパターンを微調整よりもはるかによくキャプチャする。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:12:22 GMT)
Kick Bad Guys Out! Conditionally Activated Anomaly Detection in Federated Learning with Zero-Knowledge Proof Verification [22.1] フェデレーテッド・ラーニング(FL)システムは敵の攻撃を受けやすい。
現在の防衛方式は現実世界のFLシステムでは実用的ではないことが多い。
本稿では,現実のFLシステムを対象とした新しい異常検出手法を提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:22:43 GMT)
Stochastic Runge-Kutta Methods: Provable Acceleration of Diffusion Models [22.0] 我々は,KL Runge-Kutta法に基づいて,SDEスタイルの拡散サンプリングのための学習自由加速アルゴリズムを提案し,解析する。
提案したサンプルは、$widetilde O(d3/2 / varepsilon)$ score function Evaluationsを用いて、確実に$varepsilon2$エラー(ばらつきで測定)を得る。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 05:34:51 GMT)
Self-rationalization improves LLM as a fine-grained judge [21.9] 本稿では,判断モデルの合理性を改善する反復的プロセスである自己帰納化を導入する。
自己合理化は、モデルが同じ入力に対して合理性を持つ複数の判断を生成させることで機能する。
我々のモデルは、SFTで訓練されたモデルと比較して平均62%の利益率で、より高い品質の合理性を生み出すことを学習している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:05:53 GMT)
Fine-Tuning and Prompt Optimization: Two Great Steps that Work Better Together [21.8] 我々は,モジュールレベルのLM重み付けとそれに関連するプロンプトテンプレートの両方を最適化して,下流タスクメトリックを最大化するための戦略を模索する。
そこで本研究では,モジュール型LMパイプラインを最適化するための重み付けと即時最適化を両立させるため,両パイプラインを交互に組み合わせて同じLMを学習する手法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:52:48 GMT)
Human-Feedback Efficient Reinforcement Learning for Online Diffusion Model Finetuning [21.7] HEROは、人間のフィードバックを捉え、微調整のための情報学習信号を提供するオンライントレーニング手法である。
HEROは、推論、カウント、パーソナライズ、NSFWコンテンツを0.5Kのオンラインフィードバックで効果的に処理できる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:12:01 GMT)
Data-Centric Foundation Models in Computational Healthcare: A Survey [21.5] AI技術の新たなスイートとしてのファンデーションモデル(FM)は、計算医療の波を巻き起こしている。
我々は、AIセキュリティ、アセスメント、および人間の価値との整合性における重要な視点について議論する。
本報告では,患者の予後と臨床ワークフローを向上するために,FMベースの分析を期待できる展望を提供する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:20:42 GMT)
SPikE-SSM: A Sparse, Precise, and Efficient Spiking State Space Model for Long Sequences Learning [21.4] スパイキングニューラルネットワーク(SNN)は、生物学的システムのスパイクベースおよびスパースの性質を活用することにより、エネルギー効率のよいソリューションを提供する。
最近の状態空間モデル(SSM)は計算効率とモデリング能力に優れる。
本研究では,SPikE-SSMと呼ばれる,スパースで高精度かつ効率的なスパイクSSMフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 12:20:38 GMT)
Residual Stream Analysis with Multi-Layer SAEs [21.1] 各トランス層からの残ストリーム活性化ベクトルをトレーニングした単一SAEであるMLSAE(Multi-layer SAE)を導入する。
個々のラテントが特定のトークンやプロンプトの単一の層でアクティブになることが多いが、この層は異なるトークンやプロンプトに対して異なる場合がある。
より大きな基盤モデルでは、複数の層でラテントの活性度が増加するが、これは隣接する層での残留ストリーム活性化ベクトルがより類似しているという事実と一致している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:54:11 GMT)
Evaluating and Safeguarding the Adversarial Robustness of Retrieval-Based In-Context Learning [21.0] In-Context Learning (ICL) は、プロンプトでデモをエンコードするために使用される選択、順序、動詞に敏感である。
Retrieval-Augmented ICLメソッドは、レトリバーを活用して、意味論的に関連する例を例示として抽出することで、この問題に対処しようとする。
本研究は, 検索強化モデルにより, 検体攻撃に対する堅牢性が向上することを明らかにする。
そこで本研究では,攻撃したサンプルを用いてサンプルプールを充実させる,効果的な訓練自由対人防御手法であるDARDを導入する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 03:07:58 GMT)
Interactive Event Sifting using Bayesian Graph Neural Networks [21.0] この研究は、衛生を自動化するイベント中心の学習ベースのマルチモーダル分類モデルをトレーニングするためのインタラクティブなプロセスを導入する。
ベイズグラフニューラルネットワーク(BGNN)に基づく手法を提案し、アクティブラーニングと擬似ラベルの定式化を評価し、分析者が手動でアノテートしなければならないポスト数を減少させる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:28:47 GMT)
RespLLM: Unifying Audio and Text with Multimodal LLMs for Generalized Respiratory Health Prediction [21.0] RespLLMは、呼吸健康予測のためのテキストと音声の表現を統一する新しいフレームワークである。
我々の研究は、異種データの知覚、聴取、理解が可能なマルチモーダルモデルの基礎を築いた。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:06:11 GMT)
Reconstruct Your Previous Conversations! Comprehensively Investigating Privacy Leakage Risks in Conversations with GPT Models [20.9] GPTモデルはタスク最適化にますます利用されている。
本稿では,直接的かつ強力な会話再構築攻撃について紹介する。
過去の会話の再構築をめざした2つの先進的な攻撃を提示する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 12:11:58 GMT)
On subdifferential chain rule of matrix factorization and beyond [20.8] 行列分解および分解機械の等式型クラーク差分鎖則を示す。
テンソル一般化や神経拡張も議論されているが、それらはほとんど開である。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:24:59 GMT)
$\ell_1$-norm rank-one symmetric matrix factorization has no spurious second-order stationary points [20.8] この問題の2階定常点(つまり局所最小点)は、実際には大域的に最適であることを示す。
我々の手法は、様々な高度な非滑らかな学習問題の最適化状況の分析に応用できる可能性がある。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:25:37 GMT)
Principal-Agent Reinforcement Learning: Orchestrating AI Agents with Contracts [20.8] 本稿では,マルコフ決定プロセス(MDP)のエージェントを一連の契約でガイドするフレームワークを提案する。
我々は,主観とエージェントの方針を反復的に最適化するメタアルゴリズムを提示し,分析する。
次に,本アルゴリズムを深層Q-ラーニングで拡張し,近似誤差の存在下での収束度を解析する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:46:42 GMT)
A Usage-centric Take on Intent Understanding in E-Commerce [20.6] 私たちは、“顧客が製品を使う方法”として、述語的ユーザ意図に注目します。
FolkScopeの2つの弱点、SOTA E-Commerce Intent Graphを特定します。
ユーザ意図を最も望ましい特性を持つ製品と強く結びつける能力を制限する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:38:35 GMT)
Mitigating Modality Prior-Induced Hallucinations in Multimodal Large Language Models via Deciphering Attention Causality [20.4] MLLM(Multimodal Large Language Models)は、産業と学術の両方に焦点を合わせている。
MLLMは視覚や言語に先立って導入されたバイアスに悩まされ、多モード幻覚を引き起こすことがある。
MLLMに構造因果モデリングを適用した因果推論フレームワークCausalMMを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:45:22 GMT)
Leverage Knowledge Graph and Large Language Model for Law Article Recommendation: A Case Study of Chinese Criminal Law [20.4] 世界中のほとんどの国では、草の根裁判所はケースバックログに直面している。
知識グラフ(KG)とLarge Language Model(LLM)を用いた効率的な法論文推薦手法を提案する。
0.549から0.694に改善し,提案手法がベースラインアプローチを著しく上回ることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:45:04 GMT)
Spectrum Extraction and Clipping for Implicitly Linear Layers [20.3] 暗黙的に線形作用素のスペクトルを効率よく正確に計算し、制御する上で、自動微分の有効性を示す。
一般的な畳み込み層に対して正しい第1の切り抜き法を提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 12:52:19 GMT)
Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents [20.1] 環境を視覚的に完全に知覚し,GUI上でのピクセルレベルの操作を直接行う,GUIエージェントのためのヒューマンライクなエボディメントを提唱する。
これまでに10MのGUI要素と参照式を1.3Mのスクリーンショット上に収めた、GUIの視覚的接地のための最大のデータセットを収集しました。
ウェブベースの合成データとLLaVAアーキテクチャの若干の適応を含む簡単なレシピは、このような視覚的接地モデルのトレーニングに驚くほど効果的であることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:47:50 GMT)
MedThink: Explaining Medical Visual Question Answering via Multimodal Decision-Making Rationale [19.9] 我々は、データ準備を効率化し、新しいベンチマークMedVQAデータセットを構築するための半自動アノテーションプロセスを開発した。
これらのデータセットは、マルチモーダルな大言語モデルと人間のアノテーションによって生成される中間的な医学的意思決定の合理性を提供する。
我々はまた、医学的意思決定の合理性を取り入れた軽量な事前学習生成モデルを微調整する新しいフレームワーク、MedThinkを設計する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:06:13 GMT)
ResTNet: Defense against Adversarial Policies via Transformer in Computer Go [19.9] 本稿では,残余ネットワークとTransformerをインターリーブするネットワークであるResTNetを紹介する。
演奏力を高め、グローバルな情報の能力を高める。
また、意思決定プロセスの潜在的な説明も提供する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 10:17:24 GMT)
Leveraging Multimodal Diffusion Models to Accelerate Imaging with Side Information [19.8] 我々は,ブラックボックスフォワードモデルによる逆問題から単純な線形インパインティング問題へと変換し,共同モダリティ上でのマルチモーダル拡散モデルを訓練する枠組みを提案する。
数値解析により,材料画像データに対する拡散モデルのトレーニングの実現可能性を示し,提案手法が得られた側情報を活用することにより,優れた画像再構成を実現することを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:55:02 GMT)
TD-NeRF: Novel Truncated Depth Prior for Joint Camera Pose and Neural Radiance Field Optimization [19.7] 正確なカメラポーズへの依存は、3D再構成とSLAMタスクのためのNeural Radiance Fields(NeRF)モデルを広く展開する上で大きな障壁となる。
既存の手法では、カメラのポーズを協調的に最適化するために単眼深度前処理を導入し、NeRFは奥行き前処理を完全に活用できず、固有のノイズの影響を無視する。
本稿では,未知のカメラポーズからNeRFをトレーニングするための新しいアプローチであるTrncated Depth NeRF(TD-NeRF)を提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:28:43 GMT)
PhoCoLens: Photorealistic and Consistent Reconstruction in Lensless Imaging [19.5] レンズレスカメラは、従来のレンズベースのシステムと比較して、サイズ、重量、コストにおいて大きな利点がある。
現在のアルゴリズムは、不正確な前方画像モデルと、高品質な画像の再構成に不十分な事前処理に苦慮している。
我々は、一貫したフォトリアリスティックなレンズレス画像再構成のための新しい2段階のアプローチを導入する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:23:51 GMT)
GLEE: A Unified Framework and Benchmark for Language-based Economic Environments [19.4] 大規模言語モデル(LLM)は、経済的および戦略的相互作用において大きな可能性を示す。
これらの疑問は、LLMベースのエージェントを実世界のデータ駆動システムに統合することの経済的および社会的意味について重要なものとなっている。
本稿では,2プレイヤー,シーケンシャル,言語ベースのゲームの研究を標準化するためのベンチマークを紹介する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:55:35 GMT)
fPLSA: Learning Semantic Structures in Document Collections Using Foundation Models [19.1] 本稿では,基礎モデルに基づく確率的潜在意味解析(PLSA)手法であるfPLSAを紹介する。
PLSAは文書レベルのコンテキストに基づいて文書セグメントを反復的にクラスタしタグ付けする。
ストーリーライティング、数学、多段階推論データセットに関する実験は、fPLSAタグが既存のタグ付け手法よりもオリジナルテキストの再構築に役立つことを示した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 20:25:52 GMT)
ActiView: Evaluating Active Perception Ability for Multimodal Large Language Models [19.0] マルチモーダル大言語モデル(MLLM)における能動的知覚の評価
既存のMLLMでは評価が困難でありながら,評価の容易化を図るために,視覚質問応答(VQA)の特殊な形式に着目する。
複数の画像を読み、理解する能力は、アクティブな知覚を可能にする上で重要な役割を担っている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 00:16:26 GMT)
What makes your model a low-empathy or warmth person: Exploring the Origins of Personality in LLMs [18.8] 本研究では,家族環境や文化規範といった長期的背景要因が,短期的なプレッシャーとどのように相互作用するかを検討する。
これらの要因がモデル安全性に与える影響について,個性の観点から検討する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 21:02:34 GMT)
Zero-Shot Vision-and-Language Navigation with Collision Mitigation in Continuous Environment [18.8] VLN-CMは4つのモジュールから構成され、各ステップにおける次の動きの方向と距離を予測する。
方向を選択するには、注意スポット予測器(ASP)、ビューセレクタ(VS)、プログレスモニター(PM)を使用する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 11:59:01 GMT)
A Comprehensive Study on GDPR-Oriented Analysis of Privacy Policies: Taxonomy, Corpus and GDPR Concept Classifiers [18.8] 我々は、より完全な分類法を開発し、階層的な情報を持つラベル付きプライバシポリシーの最初のコーパスを作成し、プライバシポリシーのための概念分類器の最も包括的なパフォーマンス評価を行った。
本研究は, セグメントレベルでのトレーニングとテストセットの分割が適切でないこと, 階層的情報を考慮したことのメリット, 「一つのサイズがすべてに適合する」アプローチの限界, クロスコーパスの汎用性をテストすることの意義など, 新たな発見を導く。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 05:19:12 GMT)
CPFD: Confidence-aware Privileged Feature Distillation for Short Video Classification [18.7] CPFD (Confidence-aware Privileged Feature Distillation) について報告する。
CPFDは訓練中に特権的特徴を適応的に蒸留する。
ビデオ分類のF1スコアは、X-VLM (End-to-end multimodal-model) と比較して6.76%改善し、バニラ平均で2.31%向上した。
パフォーマンスギャップを84.6%削減し、教師モデルDF-X-VLMに匹敵する結果を得る。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:04:21 GMT)
CPFD: Confidence-aware Privileged Feature Distillation for Short Video Classification [18.7] CPFD (Confidence-aware Privileged Feature Distillation) について報告する。
CPFDは訓練中に特権的な高密度な特徴を適応的に蒸留する。
ビデオ分類のF1スコアは、エンドツーエンドのマルチモーダルモデル(X-VLM)と比較して6.76%改善され、バニラ平均で2.31%向上した。
パフォーマンスギャップを84.6%削減し、教師モデルDF-X-VLMに匹敵する結果を得る。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:04:21 GMT)
Measuring Feature Dependency of Neural Networks by Collapsing Feature Dimensions in the Data Manifold [18.6] ニューラルネットワークモデルの特徴依存性を測定するための新しい手法を提案する。
その動機は、人間が理解可能な機能から情報を使っているかどうかを問うことによって、モデルをよりよく理解することにある。
本手法は,合成画像データに基づいて学習した深層ニューラルネットワークモデルを用いて実験を行った。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 21:43:23 GMT)
Molecular topological deep learning for polymer property prediction [18.6] 高分子特性解析のための分子トポロジカルディープラーニング(Mol-TDL)を開発した。
Mol-TDLは高次相互作用とマルチスケール特性の両方をトポロジカルディープラーニングアーキテクチャに組み込んでいる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 05:44:02 GMT)
What the Harm? Quantifying the Tangible Impact of Gender Bias in Machine Translation with a Human-centered Study [18.5] 機械翻訳(MT)におけるジェンダーバイアスは、人や社会に害を与える問題として認識されている。
我々は、MTの偏見が具体的なコストにどの程度の損害をもたらすかを調べるために、広範囲にわたる人間中心の研究を行う。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:52:39 GMT)
What the Harm? Quantifying the Tangible Impact of Gender Bias in Machine Translation with a Human-centered Study [18.5] 機械翻訳(MT)におけるジェンダーバイアスは、人や社会に害を与える問題として認識されている。
我々は、MTの偏見が具体的なコストにどの程度の損害をもたらすかを調べるために、広範囲にわたる人間中心の研究を行う。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:52:39 GMT)
Intriguing Properties of Large Language and Vision Models [18.4] 大規模言語とビジョンモデル(LLVM)は、その顕著な一般化性能のために、大きな注目と開発努力を受けている。
高度な推論タスクの達成にもかかわらず、基本的な知覚関連タスクのパフォーマンスは驚くほど低いままである。
LLVMの最も一般的なファミリー(LLaVA)を10評価ベンチマークで評価することで、この問題を調査する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 05:07:01 GMT)
Smaller, Weaker, Yet Better: Training LLM Reasoners via Compute-Optimal Sampling [18.2] 強力な言語モデル(LM)を用いた高品質な合成データの学習は、LMの推論性能を向上させるための一般的な戦略である。
より強力なSEモデルと弱いが安価なWCモデルによる合成データ生成のトレードオフについて検討する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:37:10 GMT)
GS-Hider: Hiding Messages into 3D Gaussian Splatting [18.2] 3Dガウススプラッティング(3DGS)はすでに3Dシーンの再構築と新しいビュー合成の分野における新たな研究の焦点となっている。
このような3D資産の著作権、完全性、プライバシーを保護することが不可欠である。
本稿では,GS-Hiderと呼ばれる3DGSの立体撮影フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 12:28:43 GMT)
QMP: Q-switch Mixture of Policies for Multi-Task Behavior Sharing [18.1] マルチタスク強化学習(MTRL)は、複数のタスクを同時に学習してサンプル効率を向上させることを目的としている。
本稿では,既存のMTRLメソッドに加えて,タスク間での行動ポリシーを共有するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 10:04:28 GMT)
Initialization of Large Language Models via Reparameterization to Mitigate Loss Spikes [18.1] パラメータのノルムの非均一性は損失スパイクの原因の1つである。
ニューラルネットワークのトレーニングでは、階層全体にわたって勾配のスケールを一定に保つ必要がある。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:09:58 GMT)
Seeking Flat Minima with Mean Teacher on Semi- and Weakly-Supervised Domain Generalization for Object Detection [17.8] 半教師付きドメイン一般化オブジェクト検出(SS-DGOD)と弱い教師付きDGOD(WS-DGOD)の2つの問題設定について検討する。
複数のドメインからのラベル付きデータを必要とする従来のドメインの一般化とは対照的に、SS-DGODとWS-DGODは1つのドメインからのみラベル付きデータを必要とし、トレーニングのために複数のドメインからラベル付きまたは弱いラベル付きデータを必要とする。
オブジェクト検出器は,同じ平均教師学習フレームワークを用いて,2つの設定で効果的に学習可能であることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 13:23:08 GMT)
From Sparse Dependence to Sparse Attention: Unveiling How Chain-of-Thought Enhances Transformer Sample Efficiency [17.6] CoT(Chain-of-Thought)は大規模言語モデル(LLM)の推論性能を著しく向上させる
代表電力が十分である場合でも,CoTは試料効率を大幅に向上できることを示す。
CoTは入力トークン間のスパース依存関係を導入して学習プロセスを単純化し、スパースかつ解釈可能な注意を喚起することを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:45:09 GMT)
Predicting the Geolocation of Tweets Using transformer models on Customized Data [17.6] 本研究は、ツイート/ユーザ位置情報予測タスクを解決することを目的としている。
提案手法は、自然言語処理のためのニューラルネットワークを実装し、位置を推定する。
提案されたモデルの範囲は、Twitterデータセットで微調整されている。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 21:24:15 GMT)
Regression Conformal Prediction under Bias [17.3] コンフォーマル予測(CP)は、有効なカバレッジで予測間隔を生成する。
本研究では,CP間隔がバイアスの影響について検討する。
私たちの研究は、よりバイアスのかかる機械学習システムへの道を開くものです。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:59:09 GMT)
PSA: Private Set Alignment for Secure and Collaborative Analytics on Large-Scale Data [17.2] 2社は、データインサイトを最大化するために、共通の顧客に対して、データセットを安全に参加させることを期待している。
我々はこのシナリオに対してPSAと呼ばれるソリューションを提案し、現実のユースケースに効果的に適用した。
ネットワーク帯域500Mbpsの単一スレッド上で,それぞれ100万レコードの規模で2つのデータセットを35.5秒で結合することで,提案プロトコルを異なるネットワーク条件で実装し,ベンチマークを行った。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 04:39:14 GMT)
Unsupervised Skill Discovery for Robotic Manipulation through Automatic Task Generation [17.2] 本稿では,多数の自律的タスクを解くことで構成可能な振る舞いを発見するスキル学習手法を提案する。
本手法は,ロボットが環境内の物体と連続的かつ堅牢に対話することを可能にするスキルを学習する。
学習したスキルは、シミュレーションだけでなく、本物のロボットプラットフォーム上でも、目に見えない操作タスクのセットを解決するために使用できる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:19:13 GMT)
Real-World Cooking Robot System from Recipes Based on Food State Recognition Using Foundation Models and PDDL [17.2] 本研究では,実世界のロボット調理行動計画を統合したロボットシステムを提案する。
両腕の車輪付きロボットであるPR2が、現実の環境で配置された新しいレシピを調理する実験に成功した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 01:39:25 GMT)
Real-World Cooking Robot System from Recipes Based on Food State Recognition Using Foundation Models and PDDL [17.2] 本研究では,実世界のロボット調理行動計画を統合したロボットシステムを提案する。
両腕の車輪付きロボットであるPR2が、現実の環境で配置された新しいレシピを調理する実験に成功した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 01:39:25 GMT)
WTCL-Dehaze: Rethinking Real-world Image Dehazing via Wavelet Transform and Contrastive Learning [17.1] 自律運転や監視といったアプリケーションには、単一イメージのデハジングが不可欠だ。
コントラスト損失と離散ウェーブレット変換を統合した半教師付きデハージングネットワークを提案する。
提案アルゴリズムは,最先端の単一画像復調法と比較して,優れた性能とロバスト性を実現している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 05:36:11 GMT)
GARLIC: LLM-Guided Dynamic Progress Control with Hierarchical Weighted Graph for Long Document QA [16.9] 過去には、Retrieval-Augmented Generation (RAG)メソッドがテキストをチャンクに分割して、長いドキュメントを扱う言語モデルを実現していた。
近年のツリーベースRAG法では,グローバルなコンテキストを保ちながら詳細な情報を取得することができる。
階層重みグラフ(GARLIC)を用いた LLM-Guided Dynamic Progress Control と呼ばれる新しい検索手法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:02:09 GMT)
Fast Training of Sinusoidal Neural Fields via Scaling Initialization [16.9] sinusoidal Neural Field (SNFs) という,ニューラルネットワークの一般的なファミリーに焦点をあてる。
それぞれの重みを定数で乗算することで、SNFトレーニングを10$times$で加速できることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:38:43 GMT)
SoK: Membership Inference Attacks on LLMs are Rushing Nowhere (and How to Fix It) [16.7] LLMに対するメンバーシップ推論攻撃(MIA)を行うための10以上の新しい手法が提案されている。
固定された-しかしランダム化された-レコードやモデルに依存する従来のMIAとは対照的に、これらの手法は主にポストホックで収集されたデータセットに基づいて評価される。
このランダム化の欠如は、メンバーと非メンバー間の分散シフトの懸念を引き起こす。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:49:13 GMT)
Efficient Gradient Estimation of Variational Quantum Circuits with Lie Algebraic Symmetries [16.5] 本研究では,アダマール試験を広範囲の量子系に対する勾配推定に効率的に適用する効率的なフレームワークを開発する。
これは、既存の作業と比べて測定コストと時間的上昇の指数関数的な削減である。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:57:38 GMT)
An Effective Theory of Bias Amplification [16.4] 機械学習モデルは、データに存在するバイアスをキャプチャして増幅し、社会的グループ間で異なるテストパフォーマンスをもたらす。
本稿では、従来のニューラルネットワークを単純化した状態下でモデル化するリッジ回帰の文脈において、正確な解析理論を提案する。
我々の理論は、機械学習バイアスの統一的で厳密な説明を提供し、バイアス増幅やマイノリティグループバイアスのような現象に関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:43:22 GMT)
A Bias-Accuracy-Privacy Trilemma for Statistical Estimation [16.4] 任意の分布に対して,バイアスが低く,エラーが低く,プライバシ損失が低いアルゴリズムは存在しない。
偏りのない平均推定は、より寛容な差分プライバシーの概念の下で可能であることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:59:15 GMT)
Intelligent Computing Social Modeling and Methodological Innovations in Political Science in the Era of Large Language Models [16.3] 本稿では,これらの問題に対処するために,知能コンピューティング社会モデリング(ICSM)手法を提案する。
アメリカ合衆国大統領選挙をシミュレートすることで、この研究はICSMの運用経路と方法論上の利点を実証的に示す。
この結果は、LCMが直接置換ではなく、統合と改善を通じて、政治科学の方法論的革新を促進することを示唆している。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 06:30:59 GMT)
Robust Multimodal Learning with Missing Modalities via Parameter-Efficient Adaptation [16.2] 本稿では,事前学習型マルチモーダルネットワークに対するシンプルでパラメータ効率の良い適応手法を提案する。
このような適応は、モダリティの欠如による性能低下を部分的に補うことができることを示す。
提案手法は,様々なタスクやデータセットにまたがる汎用性を実証し,モダリティの欠如による頑健なマルチモーダル学習法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:15:36 GMT)
softmax is not enough (for sharp out-of-distribution) [16.2] ソフトマックス関数は、現代のAIシステムにおけるシャープな振る舞いのキーキャリアである。
最大キーを見つけるのと同じくらい簡単なタスクの場合、学習した回路はテスト時にアイテムの数が増加するにつれて分散しなければならない。
推定時間におけるソフトマックスのシャープネスを改善するためのアドホックな手法として適応温度を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:13:41 GMT)
softmax is not enough (for sharp out-of-distribution) [16.2] ソフトマックス関数は、現代のAIシステムにおけるシャープな振る舞いのキーキャリアである。
最大キーを見つけるのと同じくらい簡単なタスクの場合、学習した回路はテスト時にアイテムの数が増加するにつれて分散しなければならない。
推定時間におけるソフトマックスのシャープネスを改善するためのアドホックな手法として適応温度を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:13:41 GMT)
MAG-SQL: Multi-Agent Generative Approach with Soft Schema Linking and Iterative Sub-SQL Refinement for Text-to-SQL [15.8] 本稿では,ソフトリンクと反復サブリファイナを用いたマルチエージェント生成手法MAG-を提案する。
本フレームワークでは,データベース内の列の選択にテーブルの要約を含むエンティティベースの手法を用い,それらの複雑な質問を分解するために,新たな目標条件分解手法を導入する。
GPT-4 MAG-によるBIRDベンチマークで評価すると、バニラGPT-4のベースライン精度は46.35%、MAC-Contextのベースライン精度は57.56%であるのに対し、実行精度は61.08%である。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 04:17:18 GMT)
Automatic Screening for Children with Speech Disorder using Automatic Speech Recognition: Opportunities and Challenges [15.7] 音声・言語アセスメント(SLA)は、熟練言語病理医(SLP)によって行われている。
人工知能を利用した効率的でスケーラブルなSLA手法の必要性が高まっている。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:14:37 GMT)
Flat Posterior Does Matter For Bayesian Model Averaging [15.4] この研究では、BNNが平らさを捉えるのにしばしば苦労していることを実証的に示しています。
ニューラル・ダイバージェンス(英語版)を計算することによって平坦な後部を求める小説であるシャープネス・アウェア・ベイズモデル平均化(SA-BMA)を提案する。
本研究は,SA-BMAが数発の分類と分布シフトにおいて一般化性能を向上させる効果を検証した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 12:52:00 GMT)
ColPali: Efficient Document Retrieval with Vision Language Models [15.4] 複数のドメイン、言語、設定にまたがる様々なページレベルの検索タスクで構成されるVisual Document Retrieval Benchmark ViDoReを紹介する。
現代のシステムの固有の欠点は、新しい検索モデルアーキテクチャであるColPaliの導入を動機付けている。
ColPaliは最新のドキュメント検索パイプラインよりも大幅に高速で、エンドツーエンドのトレーニングが可能である。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 07:46:00 GMT)
Improving Predictor Reliability with Selective Recalibration [15.3] リカレーションは、事前訓練されたモデルで信頼性の高い信頼度を推定する最も効果的な方法の1つである。
そこで我々は,選択モデルがユーザの選択比率を下げることを学ぶテキスト選択的リカレーションを提案する。
以上の結果から,選択的再校正は幅広い選択基準と再校正基準よりも,キャリブレーション誤差が著しく低いことが示唆された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:17:31 GMT)
Locally Measuring Cross-lingual Lexical Alignment: A Domain and Word Level Perspective [15.2] 親族領域における語彙的ギャップを用いた合成検証と新しい自然主義的検証の両方を解析する手法を提案する。
我々の分析は16の多様な言語にまたがっており、新しい言語モデルを使用することで改善の余地があることを実証している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:37:32 GMT)
A Survey of Optimization-based Task and Motion Planning: From Classical To Learning Approaches [15.1] タスク・アンド・モーション・プランニング(TAMP)は、高レベルなタスク計画と低レベルなモーション・プランニングを統合し、ロボットに自律性を持たせ、長期にわたる動的タスクを推論する。
この調査では、最適化に基づくTAMPの包括的なレビュー、(i)計画ドメイン表現、(ii)AI計画と軌道最適化(TO)を含むコンポーネントの個別ソリューション戦略、(iii)論理ベースのタスク計画とモデルベースのTOの動的相互作用について紹介する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 10:09:16 GMT)
On the Rigour of Scientific Writing: Criteria, Analysis, and Insights [15.1] リグールは、結果と結果の妥当性と妥当性を保証するため、科学的研究に不可欠である。
我々は、厳格な基準を自動的に識別し定義するためのボトムアップなデータ駆動フレームワークを導入します。
我々のフレームワークはドメインに依存しないので、様々な分野の科学的厳密さの評価に合わせることができる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:22:06 GMT)
Tokenization Is More Than Compression [14.9] Byte-Pairのような既存のトークン化アプローチ。
(BPE)はデータ圧縮の分野に由来する。
PathPieceは、文書のテキストを与えられた語彙に対して最小のトークン数に分割する新しいトークンライザである。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 13:17:03 GMT)
LLM-Based Multi-Agent Systems for Software Engineering: Vision and the Road Ahead [14.8] 本稿では,複雑かつ多面的なソフトウェア工学の課題に対処する上で,マルチエージェント(LMA)システムの進化を考察する。
将来のソフトウェアエンジニアリングプラクティスにおけるLMAシステムの役割を調べることで、このビジョンペーパーは潜在的なアプリケーションと新たな課題を強調します。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 10:28:25 GMT)
Mixture of Linear Models Co-supervised by Deep Neural Networks [14.8] 本稿では,比較的単純な説明可能なモデルとディープニューラルネットワーク(DNN)モデルとのギャップを埋めるためのアプローチを提案する。
私たちの主なアイデアは、DNNからのガイダンスでトレーニングされた差別モデルの組み合わせです。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 04:57:43 GMT)
DOPL: Direct Online Preference Learning for Restless Bandits with Preference Feedback [14.6] 優先信号の存在下でのRMABモデルであるPref-RMABを紹介する。
しかし、選好フィードバックはスカラー報酬よりも情報が少ないため、Pref-RMABはより困難に思える。
本稿では,Pref-RMABのためのオンライン嗜好学習(DOPL)アルゴリズムを提案し,未知の環境を効率的に探索する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 22:14:20 GMT)
MetaMetrics: Calibrating Metrics For Generation Tasks Using Human Preferences [14.6] メタメトリクス(MetaMetrics)は,様々なモダリティにまたがる生成タスクを教師付きで評価するメタメトリクスである。
我々の測定基準は、言語と視覚の両方の下流タスクにおける柔軟性と有効性を示し、様々な多言語および多ドメインのシナリオにおいて大きな利点を示します。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:39:24 GMT)
MetaMetrics: Calibrating Metrics For Generation Tasks Using Human Preferences [14.6] メタメトリクス(MetaMetrics)は,様々なモダリティにまたがる生成タスクを教師付きで評価するメタメトリクスである。
我々の測定基準は、言語と視覚の両方の下流タスクにおける柔軟性と有効性を示し、様々な多言語および多ドメインのシナリオにおいて大きな利点を示します。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:39:24 GMT)
AlphaRouter: Quantum Circuit Routing with Reinforcement Learning and Tree Search [14.5] 本稿では,モンテカルロ木探索(MCTS)と強化学習(RL)を統合するソリューションを提案する。
我々のルータはAlpha RLと呼ばれ、現在の最先端のルーティング手法より優れており、最大20%のルーティングオーバーヘッドで量子プログラムを生成する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:10:54 GMT)
Quasi-Majorana modes in the $p$-wave Kitaev chains on a square lattice [14.4] 隣り合う, 隣り合う, 隣り合う, 隣り合う二乗格子上の北エフ鎖のホッピングとペアリングについて検討した。
このモデルは、ゼロエネルギーに厳密に属さない位相的ギャップのない位相ホストエッジモードを示す。
チャーン数ゼロのトポロジカルエッジ状態とディラック点の出現は、このモデルが弱いトポロジカル超伝導体であることを示唆している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:54:51 GMT)
MINER: Mining the Underlying Pattern of Modality-Specific Neurons in Multimodal Large Language Models [14.4] MLLM(Multimodal large language model)は、様々なアプリケーションにモダリティを組み込んだ、大幅に進歩した言語モデルである。
説明責任の欠如は、意思決定の透明性を必要とするシナリオで使用する上で、依然として大きな障壁である。
MLLMにおけるモーダリティ特異的ニューロンをマイニングするためのフレームワークであるMINERを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:13:16 GMT)
SplatSim: Zero-Shot Sim2Real Transfer of RGB Manipulation Policies Using Gaussian Splatting [14.3] SplatSimは、RGBベースの操作ポリシーのSim2Realギャップを減らすために、Gaussian Splattingを主要なレンダリングプリミティブとして活用する新しいフレームワークである。
我々は,SplatSim内の操作ポリシーを訓練し,実環境にゼロショットで展開することで,フレームワークの有効性を実証する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:37:36 GMT)
SplatSim: Zero-Shot Sim2Real Transfer of RGB Manipulation Policies Using Gaussian Splatting [14.3] SplatSimは、RGBベースの操作ポリシーのSim2Realギャップを減らすために、Gaussian Splattingを主要なレンダリングプリミティブとして活用する新しいフレームワークである。
我々は,SplatSim内の操作ポリシーを訓練し,実環境にゼロショットで展開することで,フレームワークの有効性を実証する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:37:36 GMT)
Lighthouse: A User-Friendly Library for Reproducible Video Moment Retrieval and Highlight Detection [14.2] 再現性のあるビデオモーメント検索とハイライト検出(MR-HD)のためのユーザフレンドリーなライブラリLighthouseを提案する。
1つ目は、さまざまなメソッド、データセット、ビデオテキスト機能にまたがる包括的な再現可能な実験の欠如である。これは、統一されたトレーニングと評価が複数の設定をカバーすることができないためである。
ほとんどの作業はトレーニングコードのみをリリースし、MR-HDの推論プロセス全体を実装する必要がある。Lighthouseは6つのモデル、3つの機能、5つのデータセットを含む統一的な再現可能な実装によってこれらの問題に対処する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:13:24 GMT)
Diffusion Model Predictive Control [14.0] Diffusion Model Predictive Control (D-MPC)は、マルチステップアクション提案とマルチステップダイナミックスモデルを学ぶ新しいMPCアプローチである。
MPCを用いた既存のモデルベースオフライン計画手法よりもはるかに優れた性能を示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:56:47 GMT)
Learning Contrastive Feature Representations for Facial Action Unit Detection [13.8] 顔アクションユニット(AU)検出は、AUが活性化する際の微妙な特徴差を検出するという課題に長年遭遇してきた。
本稿では、自己教師付き信号と教師付き信号の両方を組み込んだAU検出を目的とした、新しいコントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 10:14:00 GMT)
DALL-M: Context-Aware Clinical Data Augmentation with LLMs [13.8] 放射線医は、基礎疾患の診断に不十分な胸部X線をしばしば見出す。
臨床データを用いた拡張技術により臨床コンテキストを向上する新しい枠組みを提案する。
症例文脈合成データを生成するために,大規模言語モデルを用いた臨床データ拡張の先駆的アプローチを導入する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:51:46 GMT)
PrivImage: Differentially Private Synthetic Image Generation using Diffusion Models with Semantic-Aware Pretraining [13.8] 差分プライバシー(DP)画像データ合成により、企業はプライバシの懸念なしに合成画像を共有し、利用することができる。
従来の手法では、生成モデルの高度な技術と、公開データセットでの事前学習を取り入れて、例外的なDP画像データを生成する。
本稿では,事前学習データを慎重に選択する新しいDP画像合成手法PRIVIMAGEを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 19:51:47 GMT)
SegINR: Segment-wise Implicit Neural Representation for Sequence Alignment in Neural Text-to-Speech [13.8] 我々は、ニューラルテキスト音声(TTS)の新しいアプローチであるSeginRを提案する。
補間予測や複雑な自己回帰(AR)や非自己回帰(NAR)フレームレベルのシーケンスモデリングに頼ることなく、シーケンスアライメントに対処する。
ゼロショット適応TSシナリオにおける実験により、SegINRは従来の音声品質を計算効率で上回ることを示した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:04:58 GMT)
On Instruction-Finetuning Neural Machine Translation Models [13.8] ニューラルネットワーク翻訳(NMT)モデルのための命令微調整を導入する。
我々の研究は、従来のNMTモデルの命令追従能力を示す最初のものの一つである。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 23:26:13 GMT)
LOTOS: Layer-wise Orthogonalization for Training Robust Ensembles [13.8] リプシッツ連続性が伝達率に及ぼす影響について検討する。
アンサンブルのための新しい訓練パラダイムであるLOTOSを導入し、この悪影響に対処する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:43:28 GMT)
Initialization of Monocular Visual Navigation for Autonomous Agents Using Modified Structure from Small Motion [13.7] 本稿では,自律型宇宙ロボットのためのスタンドアロンの単眼視覚的同時局在マッピング(vSLAM)パイプラインを提案する。
提案手法は, 宇宙船の点検軌道における単分子エージェントを頑健に初期化するために, 構造を小型運動から拡張する。
本手法の有効性を実証し,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:17:15 GMT)
PhotoReg: Photometrically Registering 3D Gaussian Splatting Models [13.6] 環境の正確な表現を構築することは、インテリジェントなロボットがデプロイメント中に決定を下す上で非常に重要です。
PhotoRegは、複数のフォトリアリスティックac3DGSモデルを3Dファウンデーションモデルで登録するフレームワークである。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:58:40 GMT)
A Comparison of Language Modeling and Translation as Multilingual Pretraining Objectives [13.6] プレトレーニング言語モデル(PLM)は優れたパフォーマンスを示し、NLPコミュニティの注目を集めている。
本稿では,制御された方法論環境における多言語事前学習目標の比較を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:55:15 GMT)
Differentiable and Learnable Wireless Simulation with Geometric Transformers [13.5] Wi-GATrは、シーンプリミティブに基づいたチャネル観測を予測するために設計された、完全に学習可能なニューラルネットワークシュロゲートである。
我々は,Wi-GATrが正確で,高速で,試料効率が高く,対称性に起因した変換に頑健であることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:59:03 GMT)
IGroupSS-Mamba: Interval Group Spatial-Spectral Mamba for Hyperspectral Image Classification [13.5] 本稿では,HSI分類のための軽量なインターバル群空間スペクトルマンバフレームワーク(IGroupSS-Mamba)について検討する。
IGroupSS-Mambaは、グループ化と階層化により、多方向及びマルチスケールの空間スペクトル情報抽出を可能にする。
実験により、IGroupSS-Mambaは最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:55:50 GMT)
Images Speak Louder than Words: Understanding and Mitigating Bias in Vision-Language Model from a Causal Mediation Perspective [13.5] 広範囲なデータセットで事前訓練された視覚言語モデルは、性情報とオブジェクトやシナリオを関連付けることによって、必然的にバイアスを学習することができる。
本稿では,因果媒介分析を取り入れた枠組みを提案し,バイアス発生と伝播の経路を計測・マッピングする。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 22:38:25 GMT)
SoK: Towards Security and Safety of Edge AI [13.5] いずれの側面もEdge AIにとって重要であり、さらにその統合も重要だ、と私たちは主張する。
我々は、セキュリティと安全性の脅威を調査し、既存の対策を要約し、この分野のさらなる研究を促すためにオープンな課題を収集する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 10:52:53 GMT)
ETGL-DDPG: A Deep Deterministic Policy Gradient Algorithm for Sparse Reward Continuous Control [13.3] 我々は、疎度な報酬を伴う強化学習の文脈において、Deep Deterministic Policy gradient (DDPG) を考慮する。
探索手順としてemph$epsilont$-greedyを導入する。
報酬のある遷移によって提供される情報をより効率的に利用するために、我々は新しいデュアルエクスペリエンスバッファーフレームワークを開発する。
結果として得られるアルゴリズムであるemphETGL-DDPGは、3つのテクニックをすべて統合する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:31:52 GMT)
Auxiliary Classifiers Improve Stability and Efficiency in Continual Learning [13.3] 連続学習における中間的ニューラルネットワーク層の安定性について検討する。
補助分類器(AC)はこの安定性を利用して性能を向上させることができることを示す。
以上の結果から,ACは継続学習モデルの拡張に有望な道筋であることを示唆した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:41:47 GMT)
Synthetic Generation of Dermatoscopic Images with GAN and Closed-Form Factorization [12.8] 本稿では,GAN(Generative Adversarial Network)ベースのモデルを活用する,革新的な教師なし拡張ソリューションを提案する。
セマンティックなバリエーションを取り入れた合成画像を作成し、これらの画像でトレーニングデータを拡張した。
皮膚病変分類において,機械学習モデルの性能を向上し,非アンサンブルモデルに新しいベンチマークを設定できた。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:09:50 GMT)
Error Reduction from Stacked Regressions [12.7] 積み重ね回帰は、予測精度を高めるために異なる回帰推定器の線形結合を形成するアンサンブル手法である。
本稿では,非負性制約を受ける経験的リスクの正規化バージョンを最小化することにより,これらの重みを類似的に学習する。
適応的縮小効果により、結果として生じる累積推定量は、最も優れた単一推定値よりも人口リスクが厳しく小さい。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:39:48 GMT)
RFWave: Multi-band Rectified Flow for Audio Waveform Reconstruction [12.6] 本稿では,メルスペクトルや離散音響トークンから高忠実度音声波形を再構成する,最先端マルチバンド整流流法RFWaveを紹介する。
RFWaveは複雑なスペクトログラムを独自に生成し、フレームレベルで動作し、全てのサブバンドを同時に処理して効率を向上する。
実験により、RFWaveは優れた再構成品質を提供するだけでなく、計算効率も非常に優れており、GPU上でのオーディオ生成は、リアルタイムよりも最大160倍高速であることがわかった。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 02:08:05 GMT)
Better than Your Teacher: LLM Agents that learn from Privileged AI Feedback [12.6] 大きな言語モデル(LLM)は印象的な意思決定能力を示している。
現在のメソッドでは、タスク実行中にエラーから自動的に自己改善するメカニズムが欠如している。
我々は,AIの専門家教師からのフィードバックを用いて,LLMエージェントを継続的に改善する反復的微調整フレームワークLEAPを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:55:53 GMT)
DART: A Diffusion-Based Autoregressive Motion Model for Real-Time Text-Driven Motion Control [12.5] テキスト条件付きヒューマンモーション生成は、自然言語によるユーザインタラクションを可能にする。
DARTは、リアルタイムテキスト駆動モーション制御のための拡散型自動回帰モーションプリミティブモデルである。
動作合成タスクにおいて,モデルの汎用性と優れた性能を実証し,両手法に有効なアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:58:22 GMT)
Large Language Model for Vulnerability Detection and Repair: Literature Review and the Road Ahead [12.3] 現在、脆弱性の検出と修復にLarge Language Modelsの利用に焦点を当てた調査は行われていない。
本稿では,LSMの活用による脆弱性検出と修復の改善を目的とした手法について,系統的な文献レビューを行う。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 11:52:19 GMT)
Error exponent of activated non-signaling assisted classical-quantum channel coding [12.2] 最適指数(信頼性関数とも呼ばれる)は、よく知られた球パッキング境界に等しいことが分かる。
注目すべきは、臨界速度は存在せず、キャパシティ以下で任意に低いレートでキャラクタリゼーションを厳格に保っていることです。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:52:35 GMT)
Error exponent of activated non-signaling assisted classical-quantum channel coding [12.2] 古典量子チャネル符号化における誤差指数の厳密な評価法を提案する。
我々の証明は半定値なプログラム双対性と、ヤング不等式によるペッツ・レーニ微分の双対表現に依存している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:52:35 GMT)
Persistent Test-time Adaptation in Recurring Testing Scenarios [12.0] テスト時の適応アプローチは、継続的に変化する環境に適応することを目的としています。
TTA法が長期にわたって適応性を維持することができるかどうかは不明である。
本稿では,モデルが崩壊に向かって変動していることを検知し,適応戦略を調整する**peristent TTA (PeTTA)*を提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:36:17 GMT)
The SkipSponge Attack: Sponge Weight Poisoning of Deep Neural Networks [12.0] SkipSpongeは、いくつかのデータサンプルのみを使用して事前訓練されたモデルのパラメータに直接実行される最初のスポンジ攻撃である。
実験の結果,SkipSpongeは画像分類モデル,GAN,オートエンコーダのエネルギー消費を増加させることができた。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:19:17 GMT)
Finding Safety Violations of AI-Enabled Control Systems through the Lens of Synthesized Proxy Programs [11.9] ファルシフィケーションは、制御システムが正式な安全仕様に違反する原因となる入力信号を見つけることを目的としている。
AI対応制御システムにファルシフィケーションを適用することは、2つの大きな課題をもたらす。
本稿では,AI対応制御システムに適したファルシフィケーションフレームワークであるSynthifyを紹介する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:34:20 GMT)
HE-Drive: Human-Like End-to-End Driving with Vision Language Models [11.8] HE-Driveは,人類初のエンドツーエンド自動運転システムである。
HE-Driveは、データセット上での最先端性能(すなわち、平均衝突速度をVADより71%削減)と効率(SparseDriveより1.9倍高速)を達成することを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:06:16 GMT)
ReasoningRank: Teaching Student Models to Rank through Reasoning-Based Knowledge Distillation [11.8] ReasoningRankは2種類の推論を生成することによって明確性を高める新しいアプローチである。
我々は、大きな言語モデル(LLM)を教師モデルとして活用し、これらの説明を生成し、これらの知識をより小さく、よりリソース効率の良い学生モデルに抽出する。
実験によると、ReasoningRankは精度を向上し、意思決定プロセスに関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:25:39 GMT)
Driving with Regulation: Interpretable Decision-Making for Autonomous Vehicles with Retrieval-Augmented Reasoning via LLM [11.7] この研究は、自動運転車の解釈可能な意思決定の枠組みを示す。
我々は、検索型拡張生成(RAG)に基づく交通規制検索(TRR)エージェントを開発する。
検索したルールの意味的な複雑さを考えると、我々はLarge Language Model (LLM)を利用した推論モジュールも設計する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 05:27:22 GMT)
H-SIREN: Improving implicit neural representations with hyperbolic periodic functions [11.5] 入射神経表現(INR)は、コンピュータビジョンタスクから偏微分方程式の解法による物理シミュレーションまで、様々な用途で最近採用されている。
我々はH-SIRENを様々なコンピュータビジョンと流体流問題で実証し、いくつかの最先端INRの性能を上回った。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:13:19 GMT)
Efficient Model-Based Reinforcement Learning Through Optimistic Thompson Sampling [11.5] 本稿では,トンプソンサンプリングに基づく楽観的な探索手法を提案する。
実験により,楽観的な探索は,少ない報奨を伴う環境における学習を著しく促進することが示された。
さらに、最適化がいつ有用かについての洞察を提供し、探索を導く上でのモデル不確実性の重要性を強調します。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:42:51 GMT)
Transformers are Efficient Compilers, Provably [11.5] トランスフォーマーベースの大規模言語モデル(LLM)は、幅広い言語関連タスクにおいて驚くほど堅牢なパフォーマンスを示している。
本稿では,表現力の観点から,トランスフォーマーをコンパイラとして用いることの正式な調査に向けて第一歩を踏み出す。
代表言語であるMini-Huskyを導入し、現代のC言語の特徴をカプセル化する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:31:13 GMT)
netFound: Foundation Model for Network Security [11.4] 本稿では,新しいトランスフォーマーベースネットワーク基盤モデルであるnetFoundを紹介する。
我々は、事前学習のために、豊富なラベルのないネットワークテレメトリデータに自己教師付き学習技術を採用する。
実運用環境では,netFoundが隠れたネットワークコンテキストを効果的にキャプチャすることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 23:07:07 GMT)
IRASNet: Improved Feature-Level Clutter Reduction for Domain Generalized SAR-ATR [11.2] 本研究ではIRASNetと呼ばれるドメイン一般化SAR-ATRのためのフレームワークを提案する。
IRASNetは効果的な機能レベルのクラッタ削減とドメイン不変の機能学習を可能にする。
IRASNetは、性能を向上するだけでなく、特徴レベルのクラッタ低減を大幅に改善し、レーダ画像パターン認識の分野での貴重な進歩となる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:39:35 GMT)
sDPO: Don't Use Your Data All at Once [11.1] 本稿では、アライメントチューニングのためのDPO(DPO)の拡張であるステップワイズDPO(SDPO)を提案する。
このアプローチでは、利用可能な選好データセットを分割して、すべてを一度に使用するのではなく、段階的に活用する。
本手法は, DPOトレーニングフレームワーク内で, より正確に整列された参照モデルの使用を容易にすることを実証する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 04:21:15 GMT)
SkillMatch: Evaluating Self-supervised Learning of Skill Relatedness [11.1] SkillMatchは、数百万の求人広告から専門知識をマイニングしたスキル関連性タスクのためのベンチマークです。
また,求人広告におけるスキル共起に基づくSentence-BERTモデルを適応するための,スケーラブルな自己教師型学習手法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:05:26 GMT)
On the Biased Assessment of Expert Finding Systems [11.1] 大きな組織では、特定のトピックについて専門家を特定することが、チームや部門にまたがる内部知識を活用する上で非常に重要です。
このケーススタディでは、これらのレコメンデーションが専門家発見システムの評価に与える影響について分析する。
本稿では,システム検証アノテーションが従来の用語ベース検索モデルの性能過大評価につながることを示す。
また,同義語を用いた知識領域を拡大し,その構成語に対するリテラル言及に対する強い偏見を明らかにする。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:19:08 GMT)
$$\mathbf{L^2\cdot M = C^2}$$ Large Language Models are Covert Channels [11.0] 大規模言語モデル(LLM)が最近大きな人気を集めている。
LLMは様々な攻撃を受けやすいが、多様なシステムのセキュリティも改善できる。
オープンソースLLMは、例えば検閲に抵抗する通信を促進するために、どの程度の振る舞いをするのでしょうか?
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:21:00 GMT)
MMP: Towards Robust Multi-Modal Learning with Masked Modality Projection [10.9] マルチモーダル学習は、下流タスクの性能を高めるために、複数の入力源からのデータを組み合わせることを目指している。
欠落したモダリティを処理できる既存の方法は、各入力モダリティの組み合わせに対するカスタムトレーニングまたは適応ステップを含む。
そこで我々は,MMP (Masked Modality Projection) を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:12:25 GMT)
MMP: Towards Robust Multi-Modal Learning with Masked Modality Projection [10.9] マルチモーダル学習は、下流タスクの性能を高めるために、複数の入力源からのデータを組み合わせることを目指している。
欠落したモダリティを処理できる既存の方法は、各入力モダリティの組み合わせに対するカスタムトレーニングまたは適応ステップを含む。
そこで我々は,MMP (Masked Modality Projection) を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:12:25 GMT)
Next state prediction gives rise to entangled, yet compositional representations of objects [10.8] 分散表現を持つモデルは、下流予測タスクにおいて、オブジェクトスロットでモデルにマッチしたり、性能を上回ります。
分散モデルのオブジェクト表現は、たとえ線形分離可能であっても、完全に切り離されることはない。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:32:17 GMT)
Low-Rank Continual Pyramid Vision Transformer: Incrementally Segment Whole-Body Organs in CT with Light-Weighted Adaptation [10.7] 軽量低ランク適応 (LoRA) を用いた新しい連続体器官分割モデルを提案する。
まず、最初のタスクでピラミッドビジョントランスフォーマー(PVT)ベースセグメンテーションモデルをトレーニングし、その後、新しい学習タスク毎に凍結モデルに軽量でトレーニング可能なLoRAパラメータを継続的に追加する。
提案モデルでは, 破滅的忘れを伴わず, 低パラメータ増加率を維持しながら, 新しい臓器を連続的に分割する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:00:13 GMT)
Continuous Ensemble Weather Forecasting with Diffusion models [10.7] 連続アンサンブル予測は拡散モデルにおけるアンサンブル予測をサンプリングするための新しいフレキシブルな手法である。
時間的に一貫したアンサンブル軌道を、自動回帰ステップなしで完全に並列に生成することができる。
本手法は, 確率特性のよいグローバル気象予報において, 競争力のある結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:51:23 GMT)
Training Interactive Agent in Large FPS Game Map with Rule-enhanced Reinforcement Learning [10.6] 我々はTencent Gamesが開発したオンラインマルチプレイヤー競争型3D FPSゲームであるArena BreakoutにおけるゲームAIの実践的展開に焦点を当てた。
本稿では,大規模なゲームマップ内で対話可能なゲームAIシステムとして,PMCA(Private Military Company Agent)を提案する。
現代の3D FPSゲームにおけるナビゲーションと戦闘の課題に対処するために,ナビゲーションメッシュ(Navmesh)とシューティングルールと深部強化学習(NSRL)を組み合わせた手法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:27:45 GMT)
Towards Embedding Dynamic Personas in Interactive Robots: Masquerading Animated Social Kinematics (MASK) [10.4] 本稿では,キャラクターライクなペルソナを用いたユーザエンゲージメントを高める革新的な対話型ロボットシステムの設計と開発について述べる。
ペルソナ駆動のダイアログエージェントの基礎の上に構築されたこの研究は、エージェントを物理的な領域に拡張し、ロボットを使ってより魅了的で対話的な体験を提供する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:33:28 GMT)
Build Issue Resolution from the Perspective of Non-Contributors [10.3] 本稿では,非コントリビュータが経験したビルド問題の症状と原因を理解することを目的とした研究について述べる。
この調査結果は、解決が困難なビルドの問題を強調し、非コントリビュータの振る舞いを理解することの重要性を強調している。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:15:59 GMT)
Online Convex Optimization with a Separation Oracle [10.2] 本稿では,オンライン凸最適化(OCO)のための新しいプロジェクションフリーアルゴリズムを提案する。
我々のアルゴリズムは、$widetildeO(sqrtdT + kappa d)$の償却バウンダリを達成し、ラウンド毎に$widetildeO(1)の呼び出ししか必要としない。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:15:37 GMT)
Online Convex Optimization with a Separation Oracle [10.2] 本稿では,オンライン凸最適化(OCO)のための新しいプロジェクションフリーアルゴリズムを提案する。
我々のアルゴリズムは、$tildeO(sqrtdT + kappa d)$の後悔のバウンダリを達成します。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:15:37 GMT)
Transition Path Sampling with Improved Off-Policy Training of Diffusion Path Samplers [10.2] 遷移経路サンプリングのための拡散経路サンプリングを訓練する新しい手法を提案する。
我々はこの問題を対象経路測定の償却サンプリングとして再考した。
我々はTPS-DPSを合成二重井戸電位と3つのペプチドで評価した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:54:18 GMT)
Efficient, Multimodal, and Derivative-Free Bayesian Inference With Fisher-Rao Gradient Flows [10.2] 正規化定数を含む確率分布の効率的な近似サンプリングについて検討した。
具体的には,科学技術応用における大規模逆問題に対するベイズ推定における問題クラスに着目する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 11:15:41 GMT)
Annotation alignment: Comparing LLM and human annotations of conversational safety [10.1] 近年のDICESデータセットを用いて、チャットボットの安全性の認識がユーザによる安全性の認識とどの程度一致しているかを調査する。
LLMが異なる人口集団とどのように相関するかの相違を示すためには、より大きなデータセットが必要であることを示す。
GPT-4は、ある集団が他の集団よりも会話が安全でないと予測できない。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:13:45 GMT)
Navigating the Maze of Explainable AI: A Systematic Approach to Evaluating Methods and Metrics [10.0] LATECは、20の異なる指標を用いて17の顕著なXAI手法を批判的に評価する大規模なベンチマークである。
信頼性の低いランキングに繋がるメトリクスの衝突リスクを実証し、その結果、より堅牢な評価手法を提案する。
LATECは将来のXAI研究における役割を強化し、326kのサリエンシマップと378kのメトリクススコアを(メタ評価)データセットとして公開している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:53:26 GMT)
FairFML: Fair Federated Machine Learning with a Case Study on Reducing Gender Disparities in Cardiac Arrest Outcome Prediction [10.0] 本稿では,Fair Federated Machine Learning (FairFML)について紹介する。
概念実証として,心停止予測における性差の低減を目的とした実世界の臨床ケーススタディを用いて,FairFMLを検証した。
その結果,FairFMLは局所モデルと集中モデルの両方に匹敵する性能を維持しながら,集中モデルと比較して最大65%のモデルフェアネス向上を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 13:02:04 GMT)
Neural Fourier Modelling: A Highly Compact Approach to Time-Series Analysis [10.0] 時系列解析のためのコンパクトで強力なソリューションであるニューラルフーリエモデリング(NFM)を導入する。
NFM はフーリエ変換 (FT) の2つの重要な性質 (i) 有限長時系列をフーリエ領域の関数としてモデル化する能力 (ii) フーリエ領域内のデータ操作の能力 (ii) に基礎を置いている。
NFMは幅広いタスクで最先端のパフォーマンスを達成しており、テスト時にこれまで見つからなかったサンプリングレートを持つ時系列シナリオに挑戦する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:39:55 GMT)
Neural Networks Decoded: Targeted and Robust Analysis of Neural Network Decisions via Causal Explanations and Reasoning [9.9] 本稿では、因果推論理論に基づく新しい手法TRACERを紹介し、DNN決定の根底にある因果ダイナミクスを推定する。
提案手法は入力特徴に系統的に介入し,特定の変化がネットワークを介してどのように伝播するかを観察し,内部の活性化と最終的な出力に影響を与える。
TRACERはさらに、モデルバイアスの可能性のある反ファクトを生成することで説明可能性を高め、誤分類に対する対照的な説明を提供する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 20:44:53 GMT)
Function-Space MCMC for Bayesian Wide Neural Networks [9.9] 本研究では,プレコンディション付きクランク・ニコソン法とそのランゲヴィン法を用いて,重みの分離後分布の標本化を行った。
提案手法の受容確率は,ネットワークの幅が大きくなるにつれて1に近づく。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:23:50 GMT)
Rule-based Data Selection for Large Language Models [9.9] トレーニングデータの質は、大規模言語モデル(LLM)の性能に大きく影響する。
複数の人為的指標(ルール)に基づいてデータを評価・選択するためにLLMを用いた研究が増えている。
従来のルールベースのアプローチは、しばしば人間のベクトルに強く依存し、ルールを評価するための効果的な指標が欠如し、新しいタスクへの適応性が制限されている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:13:06 GMT)
Boost Your NeRF: A Model-Agnostic Mixture of Experts Framework for High Quality and Efficient Rendering [9.9] 本研究では,Sparsely-Gated Mixture of Expertsにインスパイアされたモデル非依存のフレームワークを導入し,計算複雑性を増大させることなくレンダリング品質を向上させる。
本稿では,専門家の能力を最大化するために設計された新しいゲートの定式化と,空間を効果的に誘導し,シーンを分解する解像度ベースのルーティング手法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:27:28 GMT)
CYCLO: Cyclic Graph Transformer Approach to Multi-Object Relationship Modeling in Aerial Videos [9.8] 本研究では,空中ビデオにおける多目的関係モデリングに焦点を当てた新しいAeroEyeデータセットを提案する。
本稿では,Cyclic Graph Transformer (CYCLO) アプローチを提案する。
また、提案手法により、固有巡回パターンでシーケンスを処理し、オブジェクト関係を正しい順序で処理することができる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:20:39 GMT)
SH2: Self-Highlighted Hesitation Helps You Decode More Truthfully [9.8] 本稿では,大規模言語モデルのより真に復号化を支援するための推論時間法,Self-Highlighted Hesitation (SH2)を提案する。
実験の結果,我々のSH2は,LLMが事実知識を抽出し,幻覚的文脈を識別するのに役立つことが示された。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 09:58:48 GMT)
Learning-Based Shielding for Safe Autonomy under Unknown Dynamics [9.8] シールド(英: Shielding)は、ブラックボックスコントローラの下でシステムの安全性を保証する方法である。
本稿では,未知システムの安全性を保証するデータ駆動遮蔽手法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:10:15 GMT)
Exploring Distortion Prior with Latent Diffusion Models for Remote Sensing Image Compression [9.7] 遅延拡散モデルに基づくリモートセンシング画像圧縮法(LDM-RSIC)を提案する。
第1段階では、自己エンコーダは、高品質な入力画像から予め学習する。
第2段階では、既存の学習ベース画像圧縮アルゴリズムの復号化画像に条件付LDMにより前者が生成される。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:23:50 GMT)
Behavior Matters: An Alternative Perspective on Promoting Responsible Data Science [9.7] データサイエンスパイプラインは、社会的不平等と害を容易に伝播することができる。
伝統的な解法は本質的に技術的であり、例えばバイアスアルゴリズムを緩和する。
本稿では,行動変化の理論を用いて,責任あるデータ科学を促進する新しいレンズを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:59:18 GMT)
The Informed Elastic Net for Fast Grouped Variable Selection and FDR Control in Genomics Research [9.7] グループ化変数選択特性を維持しながら計算時間を著しく短縮する新しいベースセレクタを提案する。
提案したT-Rex+GVS(IEN)は、所望のグルーピング効果を示し、時間を短縮し、T-Rex+GVS(EN)と同じTPRを実現するが、FDRは低い。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:18:25 GMT)
CMR Scaling Law: Predicting Critical Mixture Ratios for Continual Pre-training of Language Models [9.7] 大規模言語モデル(LLM)は様々なタスクで優れるが、ドメイン固有またはプロプライエタリなコーパスに制限があるため、特殊分野では性能が劣ることが多い。
しかし、一般コーパスとドメイン固有コーパスのデータ混合比は忘れ去られ、実際は準最適トレーニング効率をもたらす。
我々は、一般とドメイン固有の機能間のトレードオフを形式化し、一般とドメインデータの明確に定義された臨界混合比(CMR)をもたらす。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 05:16:25 GMT)
EgoQR: Efficient QR Code Reading in Egocentric Settings [9.5] 本稿では,エゴセントリック画像からQRコードを読み取る新しいシステムであるEgoQRを紹介する。
当社のアプローチは,デバイス上で高解像度の画像を操作するために設計された,検出と復号の2つの主要コンポーネントで構成されている。
我々は,エゴセントリックな画像のデータセットに対するアプローチを評価し,既存のQRコードリーダの状況と比較して,コードの読みやすさが34%向上したことを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:06:59 GMT)
TextHawk2: A Large Vision-Language Model Excels in Bilingual OCR and Grounding with 16x Fewer Tokens [9.5] 汎用, OCR, 接地作業において, 画像トークンの16倍の精度で, きめ細かな認識と, 最先端の性能を示すバイリンガルLVLMであるTextHawk2を提案する。
我々は、LVLMコトレーニングを通じて視覚エンコーダを強化し、中国のOCRや接地のようなこれまで目に見えないタスクの可能性を解き放つ。
我々はTextHawk2を複数のベンチマークで評価し、継続的に優れたパフォーマンスを提供し、同様のスケールのクローズドソースモデルより優れています。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:58:35 GMT)
NeuroBOLT: Resting-state EEG-to-fMRI Synthesis with Multi-dimensional Feature Mapping [9.4] 我々は,脳内のfMRI活動信号に生の脳波データを変換するためにNeuroBOLT,すなわちNeuro-to-BOLD Transformerを導入する。
実験の結果,NeuroBOLTは一次感覚野,高レベル認知領域,深部皮質下脳領域から静止状態のfMRI信号を効果的に再構成することがわかった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:47:55 GMT)
Optimal Aggregation of Prediction Intervals under Unsupervised Domain Shift [9.4] 分散シフトは、基礎となるデータ生成プロセスが変化したときに発生し、モデルの性能のずれにつながる。
予測間隔は、その基礎となる分布によって引き起こされる不確実性を特徴づける重要なツールとして機能する。
予測区間を集約し,最小の幅と対象領域を適切にカバーする手法を提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:07:09 GMT)
Entropy-Based Uncertainty Modeling for Trajectory Prediction in Autonomous Driving [9.4] 我々は、不確実性の定量化、分解、およびモデル構成の影響に焦点を当てた全体論的アプローチを採用する。
提案手法は,不確実性を測定するための理論に基づく情報理論に基づく手法である。
我々はnuScenesデータセットに関する広範な実験を行い、異なるモデルアーキテクチャと構成が不確実性定量化とモデルロバスト性にどのように影響するかを評価する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:57:37 GMT)
Hard Quantum Extrapolations in Quantum Cryptography [9.2] 普遍外挿タスクの量子アナログについて検討する。
量子コミットメントが存在すれば困難であり、量子空間にとって容易であることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:33:50 GMT)
Building Damage Assessment in Conflict Zones: A Deep Learning Approach Using Geospatial Sub-Meter Resolution Data [9.1] 我々は,ウクライナのマリプオール市における,紛争前の画像と紛争後の画像を用いた注釈付きデータセットを構築した。
次に、ゼロショットおよび学習シナリオの両方において、CNNモデルの転送可能性について検討する。
これは、サブメートル分解能画像を用いて戦闘帯の建物損傷を評価する最初の研究である。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:26:38 GMT)
I Bet You Did Not Mean That: Testing Semantic Importance via Betting [8.9] 我々は、条件付き独立性を用いて不透明モデルの予測に対する意味論的概念のグローバル(すなわち人口以上)とローカル(すなわちサンプル)の統計的重要性を定式化する。
我々は、シーケンシャルなカーネル化独立テストという最近の考え方を用いて、概念間の重要度を誘導し、我々のフレームワークの有効性と柔軟性を示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 13:21:13 GMT)
Toward General Object-level Mapping from Sparse Views with 3D Diffusion Priors [8.7] 一般的なオブジェクトレベルのマッピングは、細かな形状と多視点センサーの観察によるポーズで、シーン内のオブジェクトの3Dマップを構築する。
最近の研究は、スパースビューからオブジェクトレベルのマッピングに先立つ生成的な形状を導入しているが、それは単一カテゴリオブジェクトに限定されている。
本研究では,3次元拡散モデルを用いた汎用オブジェクトレベルマッピングシステム GOM を提案し,シーン内の全てのオブジェクトのテクスチャと幾何学の両方に対してニューラルレージアンス場 (NeRF) を出力する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:33:30 GMT)
Meta-Dynamical State Space Models for Integrative Neural Data Analysis [8.6] 環境間の共有構造を学習することは、ニューラルネットワークの迅速な学習と適応的な振る舞いを促進する。
ニューラル記録から潜伏ダイナミクスを学習するのと同様の作業中に、ニューラルアクティビティの共有構造を利用する作業は限られている。
本稿では,訓練動物のタスク関連神経活動から,この解空間をメタラーニングするための新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:35:49 GMT)
A Neural-Evolutionary Algorithm for Autonomous Transit Network Design [8.6] 経路ネットワーク構築のポリシーとしてグラフニューラルネットモデルを使用し、進化的アルゴリズムにおいていくつかの突然変異演算子の1つとしてこのポリシーを使用する。
我々はこのアルゴリズムをトランジットネットワーク設計のための標準的なベンチマークセットで評価し、学習ポリシーを最大20%向上させ、リアルなベンチマークインスタンス上では最大53%の進化的アルゴリズムアプローチを立案した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:45:38 GMT)
Evalverse: Unified and Accessible Library for Large Language Model Evaluation [8.5] EvalverseはLarge Language Models (LLMs) の評価を効率化する新しいライブラリである。
Evalverseは、人工知能に関する限られた知識を持つ個人がLLMの評価を簡単に要求し、詳細な報告を受け取ることを可能にする。
Evalverseのデモビデオを公開し、その機能と実装を2分間のフォーマットで示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 02:47:36 GMT)
Compression via Pre-trained Transformers: A Study on Byte-Level Multimodal Data [8.5] 本稿では,事前学習したバニラ変圧器との競合圧縮比が可能なスイートスポットが存在するかを検討する。
テキスト、画像、オーディオデータの165GBの生のバイトシーケンスでモデルのファミリーをトレーニングします。
比較的小さなモデル(つまり数百万のパラメータ)が、標準的な汎用圧縮アルゴリズムより優れていることが分かりました。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:32:03 GMT)
Testing Credibility of Public and Private Surveys through the Lens of Regression [8.4] 本稿では,線形回帰の観点から,サンプル調査の信頼性を検証するためのアルゴリズムを設計する。
我々は、調査におけるプライバシーを保証する標準技術であるローカル微分プライバシー(LDP)に焦点を当てる。
本稿では,LDPで公表した調査において,線形回帰モデルを高い確率で学習するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:44:20 GMT)
Defense-as-a-Service: Black-box Shielding against Backdoored Graph Models [8.3] リソース制約のあるビジネスオーナーがサードパーティに頼ってバックドア攻撃を回避できるGraphProtを提案する。
GraphProtはモデルに依存しず、入力グラフのみに依存します。
3つのバックドア攻撃と6つのベンチマークデータセットによる実験結果から、GraphProtがバックドア攻撃の成功率を大幅に低下させることが示された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:04:38 GMT)
Art2Mus: Bridging Visual Arts and Music through Cross-Modal Generation [8.2] 我々は$mathcalAtextitrt2mathcalMtextitus$を紹介した。
実験の結果、$mathcalAtextitrt2mathcalMtextitus$は入力刺激に共鳴する音楽を生成することができることが示された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 10:48:08 GMT)
Transforming Color: A Novel Image Colorization Method [8.0] 本稿では,色変換器とGANを用いた画像カラー化手法を提案する。
提案手法は,グローバルな情報を取得するためのトランスフォーマーアーキテクチャと,視覚的品質を改善するためのGANフレームワークを統合する。
実験の結果,提案するネットワークは,他の最先端のカラー化技術よりも優れていた。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:23:42 GMT)
Jailbreak Antidote: Runtime Safety-Utility Balance via Sparse Representation Adjustment in Large Language Models [8.0] ジェイルブレイク攻撃は、大きな言語モデルを操作して有害なコンテンツを生成する。
Jailbreak Antidoteは、モデルの内部状態のスパースサブセットを操作することで、安全優先のリアルタイム調整を可能にする。
解析の結果,LLMの安全性関連情報はわずかに分散していることがわかった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:40:35 GMT)
Jailbreak Antidote: Runtime Safety-Utility Balance via Sparse Representation Adjustment in Large Language Models [8.0] ジェイルブレイク攻撃は、大きな言語モデルを操作して有害なコンテンツを生成する。
Jailbreak Antidoteは、モデルの内部状態のスパースサブセットを操作することで、安全優先のリアルタイム調整を可能にする。
解析の結果,LLMの安全性関連情報はわずかに分散していることがわかった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:40:35 GMT)
Discovering distinctive elements of biomedical datasets for high-performance exploration [8.0] 教師なし深層学習手法である特徴要素分析(DEA)を提案する。
DEAはデータセットの高次元相関情報を用いて特徴データ要素を抽出する。
DEAは従来の手法に比べて最大45%精度が向上していることがわかった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:58:43 GMT)
Quantum Walk Search on Complete Multipartite Graph with Multiple Marked Vertices [7.9] 本稿では,完全多部グラフ上での量子ウォーク探索アルゴリズムについて検討する。
我々は、量子ウォークモデルを用いて、二次的なスピードアップを実現する。
また、量子アルゴリズムの数値シミュレーションと回路実装も提供する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:13:41 GMT)
LADEV: A Language-Driven Testing and Evaluation Platform for Vision-Language-Action Models in Robotic Manipulation [7.9] Vision-Language-Action(VLA)モデルは、ロボット操作タスクのための統合されたソリューションである。
VLAモデルのデータ駆動性は、解釈可能性の欠如と相まって、その有効性と堅牢性を保証することが難しい課題である。
本稿では,VLAモデルの評価に特化して設計された,包括的で効率的なプラットフォームであるLADEVを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:49:16 GMT)
Classification of All Blood Cell Images using ML and DL Models [7.7] ヒトの血液は、主に血漿、赤血球、白血球、血小板から構成される。
栄養素を異なる臓器に輸送する上で重要な役割を担っている。
血液分析は、医師が個人の生理状態を評価するのに役立つ。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 09:48:14 GMT)
Synthesizing Interpretable Control Policies through Large Language Model Guided Search [7.7] Pythonのような標準言語のプログラムとしてコントロールポリシを表現しています。
シミュレーションで候補コントローラを評価し,事前学習したLLMを用いてそれらを進化させる。
本手法は,カップタスクにおける振り子の振り上げとボールの解釈可能な制御ポリシの合成への応用を通して述べる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:12:20 GMT)
Multi-Stage Graph Learning for fMRI Analysis to Diagnose Neuro-Developmental Disorders [7.7] 限られたデータでより多くの情報を収集し、監督が不十分な学習フレームワークを開発することが重要である。
本稿では,fmriデータの不十分な監視に自己教師付きグラフ学習を取り入れた多段階グラフ学習フレームワークを提案する。
自閉症脳画像データ交換 ABIDE I, ABIDE II, ADHD with AAL1。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:31:39 GMT)
Leveraging Grammar Induction for Language Understanding and Generation [7.5] 言語理解と生成のための教師なし文法帰納法を提案する。
我々は,下流タスクで同時に訓練された選挙区構造と係り受け関係を誘導する文法を構築した。
複数の機械翻訳タスクの自然言語理解タスクに対して,本手法の評価と適用を行った。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:57:59 GMT)
TidalDecode: Fast and Accurate LLM Decoding with Position Persistent Sparse Attention [7.4] 大規模言語モデル (LLM) は様々なNLPタスクにおいて大幅な進歩をもたらした。
本稿では,定位置スパークアテンションによる高速かつ高精度なLCMデコーディングシステムであるTidalDecodeを紹介する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:30:27 GMT)
A Limit on the Power of Entanglement-Assistance in Quantum Communication [7.4] 量子チャネル上での信頼性の高い通信の最適な速度は、事前に共有された絡み合いによって向上することができる。
長年の予想は、絡み合い支援された古典的容量と無支援の古典的容量の比が有限次元の設定で有界であると主張する。
ノイズの多いエンコーダとデコーダによる量子通信への応用について述べる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:36:52 GMT)
Automatic Identification and Visualization of Group Training Activities Using Wearable Data [7.1] Human Activity Recognition (HAR)は、スマートウォッチのようなウェアラブルデバイスによって収集された時系列データから日々のアクティビティを特定する。
本稿では,ウェアラブルデータからアクティビティを計算,分析,識別するための包括的枠組みを提案する。
当社のアプローチは、Garmin 55スマートウォッチを6ヶ月にわたって装着した135人の兵士から収集されたデータに基づいています。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:35:15 GMT)
BSG4Bot: Efficient Bot Detection based on Biased Heterogeneous Subgraphs [7.0] 悪意のあるソーシャルボットの検出は、偽情報を拡散するために簡単にボットを展開・操作できるため、重要なタスクとなっている。
既存のアプローチのほとんどは、グラフニューラルネットワーク(GNN)を使用して、ユーザ確率と構造的特徴の両方をキャプチャする。
本稿では,BSG4Botと名づけられたBSG4Botを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:52:51 GMT)
Learning Long Range Dependencies on Graphs via Random Walks [6.8] メッセージパッシンググラフニューラルネットワーク(GNN)は、局所的な関係を捉えるのに優れているが、グラフの長距離依存に苦慮している。
グラフ変換器(GT)はグローバルな情報交換を可能にするが、グラフを固定長ベクトルの集合として表現することでグラフ構造を単純化することが多い。
この研究は、ランダムウォークの長距離情報とローカルメッセージパッシングを組み合わせることによって、両方のアプローチの欠点を克服する新しいアーキテクチャを導入する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:01:11 GMT)
Refining Counterfactual Explanations With Joint-Distribution-Informed Shapley Towards Actionable Minimality [6.8] 対実的説明(CE)は、観測データによく似ているが、異なる機械学習(ML)モデル出力を生成するデータポイントを特定する。
既存のCEメソッドは、説明に含まれる不要な特徴の変化のため、実行可能効率が欠如していることが多い。
本稿では,CEの有効性を維持しつつ,必要な特徴変化を最小限に抑える手法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:31:19 GMT)
Aiding Global Convergence in Federated Learning via Local Perturbation and Mutual Similarity Information [6.8] 分散最適化パラダイムとしてフェデレートラーニングが登場した。
本稿では,各クライアントが局所的に摂動勾配のステップを実行する,新しいフレームワークを提案する。
我々は,FedAvgと比較して,アルゴリズムの収束速度が30のグローバルラウンドのマージンとなることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 23:14:05 GMT)
Memory-Enhanced Neural Solvers for Efficient Adaptation in Combinatorial Optimization [6.7] 本稿では、メモリを活用してニューラルネットワークの適応性を向上させるアプローチであるMementOを提案する。
我々は,大規模インスタンス上で全RL自動回帰解法をトレーニングし,MementOが拡張可能で,データ効率がよいことを示す。
全体として、MementOは評価された12のタスクのうち11に最先端のタスクをプッシュすることができる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:33:37 GMT)
Narrative-of-Thought: Improving Temporal Reasoning of Large Language Models via Recounted Narratives [6.6] 時間的推論において重要な課題である時間的グラフ生成について検討する。
この課題は,最も強力な言語モデルにおいても大きな課題となる。
本稿では,時間的推論,Narrative-of-Thoughtに適した新しいプロンプト手法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 23:36:05 GMT)
S-JEPA: towards seamless cross-dataset transfer through dynamic spatial attention [6.6] 本稿では,脳波信号処理におけるシームレスなクロスデータセット転送の課題に触発され,JEPA(Joint Embedding Predictive Architectures)の利用に関する探索的研究を行う。
本稿では、新しい領域固有の空間ブロックマスキング戦略と、下流分類のための3つの新しいアーキテクチャを含む、脳波記録を表現するためのSignal-JEPAを紹介する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:07:53 GMT)
Generating CAD Code with Vision-Language Models for 3D Designs [6.5] CADCodeVerifyはCADコードから生成された3Dオブジェクトを反復的に検証し、改善するための新しいアプローチである。
提案手法は,視覚言語モデルに一連の検証質問の生成と回答を促すことで,改善的なフィードバックを生成する。
その結果,CADCodeVerifyは視覚的フィードバックの提供,3Dオブジェクトの構造の向上,コンパイルプログラムの成功率の向上などにより,VLMの性能向上を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:44:50 GMT)
Investigating Guiding Information for Adaptive Collocation Point Sampling in PINNs [6.5] 物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式や系の近似解を得る手段を提供する。
PINNの解の質は、これらのコロケーション点の数や分布を含む多くのパラメータに依存する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:29:14 GMT)
Falcon Mamba: The First Competitive Attention-free 7B Language Model [6.5] 本稿では,新しいMambaアーキテクチャに基づく新しいベースとなる大規模言語モデルであるFalcon Mamba 7Bを紹介する。
純粋なMambaベースのモデルとして、Falcon Mamba 7BはTransformersをベースにした主要なオープンウェイトモデルを上回っている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:40:45 GMT)
Resource-Efficient Multiview Perception: Integrating Semantic Masking with Masked Autoencoders [6.5] 本稿では、マスク付きオートエンコーダ(MAE)を用いた通信効率の高い分散マルチビュー検出と追跡のための新しい手法を提案する。
本稿では,事前訓練されたセグメンテーションモデルと調整可能なパワー関数を利用して,情報領域の優先順位付けを行う意味誘導型マスキング手法を提案する。
我々は,仮想および実世界のマルチビューデータセットを用いて本手法の評価を行い,性能指標の検出と追跡において同等の性能を示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:06:41 GMT)
Thompson Sampling For Combinatorial Bandits: Polynomial Regret and Mismatched Sampling Paradox [6.4] 我々は、線形半バンドと準ガウス報酬に対するトンプソンサンプリング(TS)を考える。
有限時間後悔が問題の次元と指数関数的にスケールしない最初の既知のTSを提案する。
報酬分布と正後分布からのサンプルを知れば、報酬を知らない学習者よりも指数関数的に劣る。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:17:08 GMT)
Automatic Instantiation of Assurance Cases from Patterns Using Large Language Models [6.3] 大きな言語モデル(LLM)は、特定のパターンに従う保証ケースを生成することができる。
LLMは保証ケースの自動生成の可能性を秘めているが、その能力は人間の専門家と比べても劣っている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 20:58:29 GMT)
Learning Interpretable Hierarchical Dynamical Systems Models from Time Series Data [6.3] 単一ドメインの動的特性を維持しつつ,グループレベル(複数ドメイン)情報を効率的に取得する方法を示す。
全ての動的状態の忠実な再構築に加えて、我々の教師なし方法論は共通の低次元特徴空間を発見する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:54:53 GMT)
Cost Estimation in Unit Commitment Problems Using Simulation-Based Inference [6.3] ユニットコミット(英: Unit Commitment)は、有限時間にわたって電力ユニットの生成スケジュールを予測するための、電力システムにおける重要な最適化タスクである。
UCの問題で要求される多くのパラメータは、コストなど不明である。
本研究では,これらの未知のコストを,実証的なUC問題に対するシミュレーションベース推論を用いて推定する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:44:08 GMT)
Explanation sensitivity to the randomness of large language models: the case of journalistic text classification [6.2] 本研究では,大規模言語モデルの学習におけるランダム要素の影響について,その予測可能性について検討する。
微調整のCamemBERTモデルと、関連性伝播に基づく説明手法を用いて、異なるランダムシードを用いたトレーニングは、類似の精度であるが可変的な説明を伴うモデルを生成する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:39:45 GMT)
Masked Autoencoder with Swin Transformer Network for Mitigating Electrode Shift in HD-EMG-based Gesture Recognition [6.2] HD-sEMGに基づくパターン認識モデルは、記録条件の変化に対して脆弱である。
本稿では,Masked Autoencoder with Swin Transformer (MAST)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 02:55:36 GMT)
Precise Model Benchmarking with Only a Few Observations [6.1] 本稿では,各サブグループの直接推定と回帰推定を個別にバランスする経験的ベイズ推定器を提案する。
EBは、直接的および回帰的アプローチと比較して、LCM性能のより正確な推定を一貫して提供する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:26:31 GMT)
OMNI-EPIC: Open-endedness via Models of human Notions of Interestingness with Environments Programmed in Code [6.1] オープンエンドおよびAI生成アルゴリズムは、ますます複雑なタスクを無期限に生成し、解決することを目的としている。
この壮大なビジョンを達成するためには、学習は潜在的なタスクの膨大な範囲内で行われなければならない。
OMNI-EPICという新しいフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 23:21:20 GMT)
Stateful Large Language Model Serving with Pensieve [5.8] 既存のLarge Language Models (LLM) はリクエスト間でステートレスである。
本稿では,マルチターン会話LLM配信に最適化されたシステムである$Pensieve$を設計する。
Pensieve$は、以前処理された履歴をキャッシュすることで、リクエスト間での会話状態を維持する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:21:57 GMT)
VILENS: Visual, Inertial, Lidar, and Leg Odometry for All-Terrain Legged Robots [5.8] 本報告では,足ロボットのための視覚的慣性ライダー脚ナビゲーションシステム(VILENS)について述べる。
重要な新規性は、信頼性の高い動作を実現するために、4つの異なるセンサーモードの密接な融合である。
最先端の疎結合アプローチと比較して, 平均62%の翻訳誤差と51%の回転誤差が改善した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 11:27:30 GMT)
TeX-NeRF: Neural Radiance Fields from Pseudo-TeX Vision [5.8] 赤外線画像のみを用いた3次元再構成法Ne-RFを提案する。
我々は、シーンの温度、放射性(e)、テクスチャ(X)を彩度(S)、色空間の色調(H)、値(V)チャネルにマッピングする。
処理した画像を用いた新しいビュー合成は優れた結果を得た。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:43:28 GMT)
Coprocessor Actor Critic: A Model-Based Reinforcement Learning Approach For Adaptive Brain Stimulation [5.7] Coprocessor Actor Criticは、脳刺激のためのニューラルコプロセッサポリシーを学ぶための、新しいモデルベース強化学習(MBRL)アプローチである。
提案手法は,従来のMFRL手法の限界を,サンプル効率とタスク成功の観点から克服することを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 21:07:33 GMT)
Fast unconditional reset and leakage reduction in fixed-frequency transmon qubits [5.6] 量子ビットリセットとリークリダクションの両方を実装可能なプロトコルを示す。
合計して、クビットリセット、リークリセット、カプラリセットの組み合わせは83nsで完了する。
また,本プロトコルは,QECサイクル実行時間を短縮し,量子コンピュータにおけるアルゴリズムの忠実度を向上させる手段を提供する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 20:23:13 GMT)
Rational Metareasoning for Large Language Models [5.6] 大きな言語モデル(LLM)を使用するためのコアテクニックとして,推論への関与を促す声が上がっている。
本研究は,認知科学で用いられるメタレゾニングの計算モデルに基づく新しいアプローチを導入する。
我々は不必要な推論を罰することで計算の価値を組み込む報酬関数を開発する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 23:48:52 GMT)
Nonlocal photonic quantum gates over 7.0 km [5.5] 空間的に7.0km離れている2つのノード間の非局所フォトニック量子ゲートを実証する。
その結果は、大都市圏における量子ゲートの実証実験である。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:29:00 GMT)
Deciphering Refactoring Branch Dynamics in Modern Code Review: An Empirical Study on Qt [5.5] 本研究の目的は,Refactorブランチの変更に対するレビュープロセスの理解と,このブランチのコードをレビューする場合の開発者が何に関心を持っているかを明らかにすることである。
リファクタリングブランチからのレビューは、コードレビューの観点で解決する時間が非常に少なくなっています。
さらに、開発者意図のドキュメンテーションは、他のブランチと比べて、Refactorブランチ内では特に少ない。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 01:18:56 GMT)
Privacy Vulnerabilities in Marginals-based Synthetic Data [5.4] 最強の合成データ生成アルゴリズムは, テクスチャマージの確率を保っていることを示す。
そこで本研究では,MAMA-MIAという新たなメンバシップ推論攻撃を提案し,これを3つのセミナルDPアルゴリズムに対して評価する。
当社のアプローチは、最初のSNAKE(SaNitization Algorithm under attacK... $varepsilon$)コンペに勝ちました。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:24:22 GMT)
TextureMeDefect: LLM-based Defect Texture Generation for Railway Components on Mobile Devices [5.4] AI-Inferenceエンジンを活用した革新的なツールであるTextureMeDefectを紹介した。
このツールを使うと、スマートフォンやタブレットで撮った鉄道部品の画像からリアルな欠陥テクスチャを作れる。
このツールをiOSおよびAndroidプラットフォームで使用する際のテクスチャ,時間,コストの関連性を評価するために,多面的評価を行った。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 19:07:08 GMT)
Deciphering the Interplay of Parametric and Non-parametric Memory in Retrieval-augmented Language Models [5.3] Retrieval-Augmented Generation (RAG)モデルは、応答を生成する前に情報を取得するように振舞う。
我々は、因果媒介分析と制御実験を用いて、内部表現が情報処理にどのように影響するかを調べる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:14:47 GMT)
Brain Mapping with Dense Features: Grounding Cortical Semantic Selectivity in Natural Images With Vision Transformers [5.3] 本稿では,脳内視覚概念を分離するBrainSAILを紹介する。
BrainSAILは、事前訓練された視覚モデルから意味的に一貫性があり、密集した空間的特徴を利用する。
カテゴリー選択性のある大脳皮質領域におけるBrainSAILの評価を行った。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:59:45 GMT)
Matrix-weighted networks for modeling multidimensional dynamics [5.3] 行列重み付きネットワーク(MWN)を用いた多次元相互作用力学モデリングのための新しい汎用フレームワークを提案する。
MWNの数学的基礎を概説し、この文脈におけるコンセンサス力学とランダムウォークを考察する。
この結果から,MWNのコヒーレンスにより,従来のネットワークにおけるコミュニティの概念と構造的バランスを一般化する,非自明な定常状態が生まれることが明らかとなった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:47:30 GMT)
Quantum Group Actions [5.1] 量子暗号では、暗号が可能であるが一方的関数(OWF)が存在しない新しい世界であるMicrocryptが存在する可能性がある。
基本的なプリミティブと有用なアプリケーションはMicrocryptで発見されているが、OWFs-free'の具体的な硬さの仮定が欠落している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:36:32 GMT)
Dynamic Pricing in Securities Lending Market: Application in Revenue Optimization for an Agent Lender Portfolio [5.0] 証券貸出市場では,既存の文脈的バンディットの枠組みをうまく活用できることが示されている。
我々は、文脈的バンディットアプローチが、生成した総収益の少なくとも15%以上の典型的なアプローチを一貫して上回ることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:59:42 GMT)
Dynamic Pricing in Securities Lending Market: Application in Revenue Optimization for an Agent Lender Portfolio [5.0] 証券貸出市場では,既存の文脈的バンディットの枠組みをうまく活用できることが示されている。
我々は、文脈的バンディットアプローチが、生成した総収益の少なくとも15%以上の典型的なアプローチを一貫して上回ることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:59:42 GMT)
Blind Image Quality Assessment Using Multi-Stream Architecture with Spatial and Channel Attention [5.0] BIQA(Blind Image Quality Assessment)は、画像を自動的に評価する重要な研究分野である。
ほとんどのアルゴリズムは重要な関心領域を強調せずに品質を生成する。
この問題を解決するために,マルチストリーム空間およびチャネルアテンションに基づくアルゴリズムが提案されている。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 18:56:53 GMT)
ESPACE: Dimensionality Reduction of Activations for Model Compression [5.0] 本研究では, アクティベーションの次元的低減に基づくLLM圧縮技術であるESPACEを提案する。
ESPACEでは、GPT3、Llama2、Nemotron4モデルの50%の圧縮が可能で、精度は低い。
ESPACEはGEMMの実行時間を短縮し、既存のハードウェアで推論遅延をプリフィルする。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:59:22 GMT)
GOOSE Algorithm: A Powerful Optimization Tool for Real-World Engineering Challenges and Beyond [4.9] GOOSEアルゴリズムは19のよく知られたテスト関数でベンチマークされる。
提案アルゴリズムは, 最新のベンチマーク関数10を用いて検証する。
得られた結果は,提案アルゴリズムの優れた性能を示すものである。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 21:05:47 GMT)
MARs: Multi-view Attention Regularizations for Patch-based Feature Recognition of Space Terrain [4.9] 現在のアプローチは、事前収集されたパッチベースの機能とテンプレートマッチングに依存している。
マルチビューアテンション・レギュラライゼーション(MAR)を導入し,複数の特徴ビューにまたがるチャネルと空間的注意を制約する。
地形特徴認識性能は85%以上向上した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:41:45 GMT)
Integrated or Segregated? User Behavior Change after Cross-Party Interactions on Reddit [4.9] Reddit上での米国政治討論会で、クロスプラットフォームの回答を受けて、ユーザーがコミュニティのエンゲージメントを変更する方法について検討する。
非党派の議論空間におけるコメントに対する当事者間の回答は、外部のサブレディット活動の増加とそれほど関係がないことが判明した。
その結果, 外部コミュニティの活性化にともなう, パーティ間の相互作用にともなう高条件脱分極効果が明らかとなった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:12:52 GMT)
FAME: Towards Factual Multi-Task Model Editing [4.9] 大規模言語モデル(LLM)は、幅広い知識を組み込んで、様々なタスクで非常によく機能する。
提案するFAMEは,モデル編集の実用性を高めるために設計された,現実的で包括的でマルチタスクなデータセットである。
次に,新しいキャッシング機構を用いて実世界との同期を確保するモデル編集手法であるSKEMEを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 13:46:06 GMT)
Shortcomings of LLMs for Low-Resource Translation: Retrieval and Understanding are Both the Problem [4.8] 本研究では,機械翻訳パイプラインの自動化の一環として,事前学習された大言語モデル(LLM)が低リソース言語から高リソース言語への翻訳を指示する際の文脈内学習能力について検討する。
我々は南ケチュアをスペイン語に翻訳する一連の実験を行い、デジタル化された教育材料と平行コーパスの制約されたデータベースから得られた様々な種類の文脈の情報量について検討する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 22:11:14 GMT)
Systematic Literature Review of Vision-Based Approaches to Outdoor Livestock Monitoring with Lessons from Wildlife Studies [4.7] 我々は,牛,馬,鹿,ヤギ,羊,コアラ,キリン,ゾウなどの大型地球性哺乳類に焦点をあてる。
我々は,現在の視覚に基づく手法がPLFの文脈に適用可能であること,今後の研究に期待できる方向性について詳細に論じる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:53:17 GMT)
An Elementary Predictor Obtaining $2\sqrt{T}+1$ Distance to Calibration [4.6] オンライン予測器は, 対向的な設定でキャリブレーションまでの距離が$O(sqrtT)$であることを示す。
キャリブレーション誤差を最大2sqrtT+1$で求める,極めて単純,効率的,決定論的アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:26:56 GMT)
Decomposition Polyhedra of Piecewise Linear Functions [4.6] 本稿では,連続ピースワイド線形関数(CPWL)を凸CPWL関数に分解する方法について,よく研究されている問題に寄与する。
すべての CPWL 関数は無限分解を持つが、差分 2 個の凸 CPWL 関数を持つ。
できるだけ少ない線形部分で分解を見つけるために、我々のフレームワークを適用します。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 10:48:36 GMT)
A Recipe For Building a Compliant Real Estate Chatbot [4.5] 本稿では, 安全データとともに, 汎用学習データセットを合成する手法を提案する。
我々は,ラマ-3-8Bインストラクタモデルを微調整し,その性能を著しく向上できることを実証した。
我々は、コミュニティにおけるさらなる開発と研究を支援するために、モデル、データ、コードをオープンソースにしています。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:03:47 GMT)
A test suite of prompt injection attacks for LLM-based machine translation [4.5] LLMベースのNLPシステムは典型的には、インプットデータをインプロンプトテンプレートに埋め込むことで動作する。
最近、Sun と Miceli-Barone は LLM ベースの機械翻訳に対して PIA のクラスを提案した。
我々は、WMT 2024の汎用機械翻訳タスクの全ての言語対にこのアプローチを拡張した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:01:20 GMT)
On the Power of Randomization in Fair Classification and Representation [4.4] 正当性制約を課す際に生じる精度の損失を最小限に抑えるためにランダム化の力を示す。
本研究では, DPフェア, EOフェア, PEフェアの表現を, 最適なDPフェア, EOフェア, PEフェアの分類器に比較して, 高い精度で, 精度を損なうことなく構築する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 06:32:03 GMT)
InFusionSurf: Refining Neural RGB-D Surface Reconstruction Using Per-Frame Intrinsic Refinement and TSDF Fusion Prior Learning [4.4] RGB-Dビデオフレームを用いた3次元表面再構成におけるNeRFフレームワークの革新的拡張であるInFusionSurfを導入する。
InFusionSurfは、フレームごとの固有の精細化スキームを通じて、深度フレーム内のカメラモーションによって引き起こされるぼかしに対処する。
それは、古典的なリアルタイム3D表面再構成法であるTSDF Fusionを事前訓練ツールとして組み込んでいる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 01:29:12 GMT)
"Sometimes You Just Gotta Risk It for the Biscuit": A Portrait of Student Risk-Taking [4.3] 本研究は,ソフトウェア技術者のリスクテイク行動に関する先行研究を部分的に再現することを目的としている。
学生は、リスクの高い選択肢と安全な選択肢のどちらを選択する必要があるコースプロジェクトの期限に間に合うという仮説的なシナリオを提示された。
これらの選択に影響を及ぼす可能性のある要因として、決定のフレーミング(潜在的な利得や損失)、プログラミングの楽しさ、プログラミングの難しさの認識、コースにおけるパフォーマンスなどについて検討した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 22:42:58 GMT)
Towards a Modern and Lightweight Rendering Engine for Dynamic Robotic Simulations [4.2] 本稿では,VulkanグラフィックスAPIをサポートするパフォーマンス重視の軽量レンダリングエンジンを提案する。
エンジンはAMBF(Asynchronous Multi-Body Framework)のレガシーレンダリングパイプラインを近代化するために設計されている。
実験によると、エンジンは2ミリ秒以内のGPU計算時間を維持しながら、700万以上の三角形でシミュレーションされたシーンをレンダリングできる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:50:19 GMT)
SWAG: Storytelling With Action Guidance [4.2] 大規模言語モデル(LLM)を用いたストーリーテリングの新しいアプローチであるストーリーテリング・ウィズ・アクション・ガイダンス(SWAG)を紹介する。
提案手法は,2モデルフィードバックループを用いて,ストーリー執筆を検索問題とする。
小さなオープンソースモデルのみを使用したパイプラインは、GPT-3.5-Turboを超えています。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 22:36:38 GMT)
Diffusion Imitation from Observation [4.2] 敵対的模倣学習アプローチは、差別者と区別できない状態遷移を生成するために、ジェネレータポリシーを学ぶ。
生成モデルにおける拡散モデルの成功を動機として,観測フレームワークからの逆模倣学習に拡散モデルを統合することを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:49:55 GMT)
STOP! Camera Spoofing via the in-Vehicle IP Network [4.1] 我々は、GigE Visionプロトコルを利用するアタックツールを作成します。
次に、2種類の受動異常検知器を解析し、そのような攻撃を識別する。
本稿では,映像伝送中にカメラパラメータをランダムに調整する新しいアクティブディフェンス機構を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:30:22 GMT)
DiffuseReg: Denoising Diffusion Model for Obtaining Deformation Fields in Unsupervised Deformable Image Registration [4.1] 変形可能な画像登録は、異なるモダリティや時間から医療画像を正確に整列することを目的としている。
従来のディープラーニング手法は、効果的な一方で、多くの場合、解釈可能性、リアルタイム観測可能性、および登録推論時の調整能力が欠如している。
DiffuseRegは、画像の代わりに変形場を識別し、透過性を向上する革新的な拡散法である。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:41:35 GMT)
Discrete Distribution Networks [4.1] 本稿では,階層的な離散分布を用いてデータ分布を近似する新しい生成モデルであるDcrete Distribution Networks (DDN)を導入する。
CIFAR-10 および FFHQ における実験により,DDN の有効性とその興味深い性質を実証した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 07:14:23 GMT)
Data Publishing in Mechanics and Dynamics: Challenges, Guidelines, and Examples from Engineering Design [4.1] 本稿では、力学および力学におけるデータパブリッシングの価値と課題を分析する。
後者は、データ駆動手法が元来ブームになっている分野では一般的ではない課題や考察も提起している。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 18:26:05 GMT)
Learning quantum states of continuous variable systems [4.1] 量子状態トモグラフィーは、測定データから未知の状態の古典的な記述を導出することを目的としている。
連続変数系のトモグラフィーは時間資源の点で極めて非効率であることを示す。
ガウス状態のトモグラフィーが効率的であることも証明する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 10:46:02 GMT)
On the Convergence of Hermitian Dynamic Mode Decomposition [4.0] 自己随伴クープマン作用素のスペクトル特性に対するエルミート力学モード分解の収束性について検討する。
2次元シュリンガー方程式に適用して数値的な結果を示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:21:37 GMT)
NeRAF: 3D Scene Infused Neural Radiance and Acoustic Fields [4.0] 本研究では,音場と放射場を共同で学習するNeRAFを提案する。
NeRAFは、新しい視点と空間化された部屋インパルス応答(RIR)の両方を新しい位置で合成する。
我々は、NeRAFがSoundSpacesおよびRAFデータセット上で高品質なオーディオを生成することを実証した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 13:52:00 GMT)
Practical, Private Assurance of the Value of Collaboration via Fully Homomorphic Encryption [3.9] 2つのパーティーは、データセットで協力したいと思っています。
一方の当事者は、他方の当事者からのデータを取り入れることで、予測モデルの改善を約束する。
当事者は、更新されたモデルが正確性の向上を示した場合にのみ、さらなる協力を希望する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 23:44:05 GMT)
Hyper-Representations: Learning from Populations of Neural Networks [3.9] この論文は、最も基本的なコンポーネントである重みのレンズを通してニューラルネットワークを理解するという課題に対処する。
この論文では、トレーニングされたNNモデルが、重み空間における意味のある構造を実際に占めており、学習と使用が可能であることを発見した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:03:00 GMT)
Trained Models Tell Us How to Make Them Robust to Spurious Correlation without Group Annotation [3.9] 経験的リスク最小化(ERM)モデルは、ターゲットと高い刺激的な相関を持つ属性に依存する傾向がある。
これにより、これらの属性を欠いた未表現(または'マイナー')グループのパフォーマンスを低下させることができる。
本稿では,環境に基づく検証と損失に基づくサンプリング(EVaLS)を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:17:44 GMT)
Efficient transformer with reinforced position embedding for language models [3.9] 本稿では, エンコーダデコーダの層数の半分で高い性能を実現するために, 強化された位置埋め込みを用いた効率的なトランスフォーマアーキテクチャを提案する。
トレーニング可能なトークン埋め込みとの結合,トークン埋め込みマトリックス内のカラムの正規化,注目層の値として正規化トークン埋め込みマトリックスを用いることで,トレーニングと検証の損失とトレーニング時間を改善できることを実証する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:47:34 GMT)
Towards the generation of hierarchical attack models from cybersecurity vulnerabilities using language models [3.8] 本稿では、テキストベースのサイバーセキュリティ脆弱性データ間の兄弟関係を識別するために、事前訓練された言語モデルとサイムズネットワークを用いて検討する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:05:33 GMT)
1st Place Solution to the 8th HANDS Workshop Challenge -- ARCTIC Track: 3DGS-based Bimanual Category-agnostic Interaction Reconstruction [3.7] 本報告では,ECCV 2024と合わせて第8回HANDSワークショップチャレンジ(ARCTIC Track)の第1位となるソリューションについて述べる。
本研究の目的は,手と物体の3次元再構成をモノクロ映像から生成することである。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:47:45 GMT)
1st Place Solution to the 8th HANDS Workshop Challenge -- ARCTIC Track: 3DGS-based Bimanual Category-agnostic Interaction Reconstruction [3.7] 本報告では,ECCV 2024と合わせて第8回HANDSワークショップチャレンジ(ARCTIC Track)の第1位となるソリューションについて述べる。
本研究の目的は,手と物体の3次元再構成をモノクロ映像から生成することである。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:47:45 GMT)
Fast Streaming Transducer ASR Prototyping via Knowledge Distillation with Whisper [3.7] 我々は,ストリーミングトランスフォーマー・トランスデューサ(TT)モデルを,教師付きデータなしでゼロからトレーニングできることを実証した。
これにより、1つの段階で堅牢なASRモデルをトレーニングでき、大きなデータと計算予算を必要としない。
The proposed framework on 6 languages from CommonVoice and proposed multiple filters to filter out hallucinated PLs。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:16:21 GMT)
Fast Streaming Transducer ASR Prototyping via Knowledge Distillation with Whisper [3.7] 我々は,ストリーミングトランスフォーマー・トランスデューサ(TT)モデルを,教師付きデータなしでゼロからトレーニングできることを実証した。
これにより、1つの段階で堅牢なASRモデルをトレーニングでき、大きなデータと計算予算を必要としない。
The proposed framework on 6 languages from CommonVoice and proposed multiple filters to filter out hallucinated PLs。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:16:21 GMT)
Hydra: Sequentially-Dependent Draft Heads for Medusa Decoding [3.6] 我々はHydra Headを提案する: 標準ドラフトヘッドの逐次依存型ドロップイン代替である。
Hydra++は、Medusaの復号化や自動回帰復号化と比較して、デコードスループットを最大1.31倍と2.70倍に改善している。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:21:29 GMT)
Decoding Intelligence: A Framework for Certifying Knowledge Comprehension in LLMs [3.6] 本稿では,大規模言語モデルにおける知識理解を形式的確率論的保証で証明する最初のフレームワークを提案する。
我々は知識理解の分布を正確に表現する新しい仕様を設計し、認定し、知識グラフを活用する。
モデルのサイズを拡大することで知識理解能力が大幅に向上することがわかった。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:01:48 GMT)
SuperGS: Super-Resolution 3D Gaussian Splatting via Latent Feature Field and Gradient-guided Splitting [3.6] SuperResolution 3DGS (SuperGS) は、2段階の粗大なトレーニングフレームワークで設計された3DGSの拡張である。
SuperGSは、低解像度入力のみを使用して現実世界のデータセットに挑戦する最先端のHRNVSメソッドを超越している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:28:53 GMT)
SuperGS: Super-Resolution 3D Gaussian Splatting via Latent Feature Field and Gradient-guided Splitting [3.6] SuperResolution 3DGS (SuperGS) は、2段階の粗大なトレーニングフレームワークで設計された3DGSの拡張である。
SuperGSは、低解像度入力のみを使用して現実世界のデータセットに挑戦する最先端のHRNVSメソッドを超越している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:28:53 GMT)
Low-Rank Continual Personalization of Diffusion Models [3.6] 近年のDreamboothのような拡散モデルのパーソナライズ手法では、事前訓練されたモデルを微調整して新しい概念を生成することができる。
これらのテクニックを複数のタスクに適用して、いくつかの新しいオブジェクトやスタイルを含むようにすることで、アダプタ間の相互干渉につながる。
実験の結果, 提案手法は, ナチブアプローチと比較して, 忘れを軽減できることがわかった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 10:19:09 GMT)
Full Line Code Completion: Bringing AI to Desktop [3.5] JetBrainsのIntelliJ Platform用のマルチトークンコード補完機能を構築するためのアプローチについて説明する。
この機能は構文的に正しいコードのみを推奨し、ローカルで完全に動作する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:23:25 GMT)
How to Exhibit More Predictable Behaviors [3.5] 本稿では,外部オブザーバが行うことができる予測を最適化するために,エージェントがその戦略を選択する必要がある予測可能性問題について考察する。
環境力学や観察対象者の政策について不確実性を考慮して検討する。
本稿では,エージェントポリシーに対するオブザーバの信念に基づいて,報酬関数を用いた行動予測可能性評価基準を提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 13:06:01 GMT)
Solving Reach-Avoid-Stay Problems Using Deep Deterministic Policy Gradients [3.5] Reach-Avoid-Stay (RAS) の最適制御により、ロボットやエアタクシーなどのシステムが目標に到達し、障害物を避け、目標の近くに留まることができる。
RASの現在の手法は、複雑な動的環境の扱いと高次元システムへのスケーリングにしばしば苦労する。
RLに基づくリーチビリティー法を拡張してRAS問題を解決するための2段階のDeep Deterministic Policy gradient (DDPG)法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:00:47 GMT)
Solving Reach-Avoid-Stay Problems Using Deep Deterministic Policy Gradients [3.5] Reach-Avoid-Stay (RAS) の最適制御により、ロボットやエアタクシーなどのシステムが目標に到達し、障害物を避け、目標の近くに留まることができる。
RASの現在の手法は、複雑な動的環境の扱いと高次元システムへのスケーリングにしばしば苦労する。
RLに基づくリーチビリティー法を拡張してRAS問題を解決するための2段階のDeep Deterministic Policy gradient (DDPG)法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:00:47 GMT)
Native Design Bias: Studying the Impact of English Nativeness on Language Model Performance [3.3] 大規模言語モデル(LLM)は、大規模コーパスで事前訓練中に取得した情報を提供することに優れる。
本研究では,LLM応答の質がユーザの人口分布によって異なるかを検討する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:15:18 GMT)
Measurement-induced phase transitions in monitored infinite-range interacting systems [3.3] 測定誘起相転移の観測における重要な課題は、選択後の障壁の緩和である。
最近の研究では、無限範囲系のいくつかのクラスは、高速な飽和を示すことによってこの問題を緩和することを示唆している。
本稿では,その基礎となる半古典力学により,この特徴が無限系に固有のものであるか否かを問う。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:01:08 GMT)
LLaVA Needs More Knowledge: Retrieval Augmented Natural Language Generation with Knowledge Graph for Explaining Thoracic Pathologies [3.2] 医用画像のための自然言語記述(NLE)を生成するために,知識グラフ(KG)ベースのデータストアを付加したビジョンランゲージフレームワークを提案する。
本フレームワークでは,生成した説明の精度を向上するだけでなく,直接データ検索を回避してデータのプライバシーを保護できるKGベースの検索機構を採用している。
これらのフレームワークはMIMIC-NLEデータセット上で検証され、最先端の結果が得られる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 04:59:08 GMT)
Scalable and Adaptively Secure Any-Trust Distributed Key Generation and All-hands Checkpointing [3.2] DLogベースの暗号システムのための実用的なDKGを提案し、共通のコインの助けを借りて(準)線形化とノード単位の通信コストを実現する。
我々のプロトコルは適応的な敵に対して安全であり、全てのノードの半分以下を破損させる可能性がある。
参加者が異なる重みを持つ場合でも,従来の分散プロトコルであるDKGを効率的にデプロイできる汎用トランスフォーマーを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 06:20:17 GMT)
Highly Excited Electron Cyclotron for QCD Axion and Dark-Photon Detection [3.2] 我々は、閉じ込められた電子の高励起サイクロトロン状態を用いて、MeVアキシオンとダークフォトンダークマターを検出することを提案する。
我々はサイクロトロン検出に必要な平均測定時間を10~6秒に抑え、崩壊前の高励起状態の検出を可能にした。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 23:20:18 GMT)
Entropy-Based Uncertainty Modeling for Trajectory Prediction in Autonomous Driving [3.2] 我々は、不確実性の定量化、分解、およびモデル構成の影響に焦点を当てた全体論的アプローチを採用する。
提案手法は,不確実性を測定するための理論に基づく情報理論に基づく手法である。
我々はnuScenesデータセットに関する広範な実験を行い、異なるモデルアーキテクチャと構成が不確実性定量化とモデルロバスト性にどのように影響するかを評価する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:57:37 GMT)
An Empirical Study of Training ID-Agnostic Multi-modal Sequential Recommenders [3.1] Sequential Recommendation (SR) は、過去のインタラクションに基づいて、将来のユーザとイテムのインタラクションを予測することを目的としている。
多くのSRアプローチはユーザIDとアイテムIDに重点を置いているが、テキストや画像のようなマルチモーダル信号を通じて世界に対する人間の認識は、研究者にIDを使わずにマルチモーダル情報からSRを構築するよう促している。
本稿では,シンプルで普遍的なtextbfMulti-textbfModal textbfSequential textbfRecommendation (textbfMMSR) フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 07:33:35 GMT)
Taming Gradient Oversmoothing and Expansion in Graph Neural Networks [3.1] オーバースムーシングはグラフニューラルネットワーク(GNN)の主要なボトルネックとして主張されている。
トレーニング中に最適化を防ぐための$textitgradient oversmoothingの存在を示します。
勾配拡大を防止するため, 単純かつ効果的な正規化法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:22:20 GMT)
Data-Driven Discovery of Conservation Laws from Trajectories via Neural Deflation [3.1] 本手法は,システムトラジェクトリから直接開発する。
本手法の結果と, 各種事例で得られた保全法数について概説する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:22:55 GMT)
EgoOops: A Dataset for Mistake Action Detection from Egocentric Videos with Procedural Texts [3.0] EgoOopsデータセットには、エゴセントリックなビデオ、手続きテキスト、3種類のアノテーションが含まれている。
ビデオテキストアライメントにより、ビデオと手続き的テキストの両方に基づいてミスを検出することができる。
ラベルや説明の誤りは、現実世界の間違いを詳細に分析することを可能にする。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:19:50 GMT)
Machine Learning for Asymptomatic Ratoon Stunting Disease Detection With Freely Available Satellite Based Multispectral Imaging [3.0] サトウキビの病気検出は効果的な作物管理に重要である。
本研究では,様々なサトウキビ品種におけるRSDの存在を検出するために,様々な機械学習技術を用いた。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:53:15 GMT)
Machine Learning for Asymptomatic Ratoon Stunting Disease Detection With Freely Available Satellite Based Multispectral Imaging [3.0] サトウキビの病気検出は効果的な作物管理に重要である。
本研究では,様々なサトウキビ品種におけるRSDの存在を検出するために,様々な機械学習技術を用いた。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:53:15 GMT)
Hardware-Software Co-optimised Fast and Accurate Deep Reconfigurable Spiking Inference Accelerator Architecture Design Methodology [3.0] Spiking Neural Networks(SNN)は、機械学習モデルのエネルギー効率を改善するための有望なアプローチとして登場した。
我々は,ソフトウェア学習深層ニューラルネットワーク(DNN)を高精度スパイキングモデルに移植するハードウェア・ソフトウェア共同最適化戦略を開発した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 05:04:13 GMT)
Named Clinical Entity Recognition Benchmark [2.9] 本報告では, 名前付き臨床エンティティ認識ベンチマークを紹介する。
臨床物語から構造化された情報を抽出する重要な自然言語処理(NLP)タスクに対処する。
リーダーボードは多様な言語モデルを評価するための標準化されたプラットフォームを提供する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:00:18 GMT)
Fill In The Gaps: Model Calibration and Generalization with Synthetic Data [2.9] 本稿では,合成データを精度良く組み込んだキャリブレーション手法を提案する。
本稿では,予測校正誤差(ECE)をPAC学習フレームワークを用いて導出する。
平均34%の精度, 33%のECE低下を認めた。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 23:06:42 GMT)
TurtleBench: Evaluating Top Language Models via Real-World Yes/No Puzzles [2.9] TurtleBenchは、私たちのオンラインTurtle Soup Puzzleプラットフォームから、実際のユーザ推測を収集します。
TurtleBenchには1,532のユーザ推測とアノテーション後の推測の正確性が含まれている。
私たちは現在利用可能な最も先進的な言語モデルのうち9つを徹底的に評価しました。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:58:47 GMT)
Can LLMs plan paths with extra hints from solvers? [2.9] 大規模言語モデル(LLM)は、自然言語処理、数学的問題解決、プログラム合成に関連するタスクにおいて顕著な能力を示している。
本稿では,従来のロボット計画課題の解決において,解法生成フィードバックを統合することでLCM性能を向上させる手法について検討する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:00:08 GMT)
Comparative Simulation of Phishing Attacks on a Critical Information Infrastructure Organization: An Empirical Study [2.9] 最初の試みでは、タイの鉄道会社の労働者が、IT機器の信頼できる小売業者から特別な取引を受信者に通知するフォニーメールを受け取った。
その結果、735人の労働者の10.9%が詐欺に遭った。
最初の攻撃で犠牲にならなかった労働者の8.0%が騙された。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 06:55:44 GMT)
Inferring Alt-text For UI Icons With Large Language Models During App Development [2.9] そこで我々は,Large Language Models (LLMs) を用いて,部分的なUIデータを持つモバイルUIアイコンに対する情報的アルトテキストを自律的に生成する手法を提案する。
経験的評価とユーザスタディでは、IconDescは関連するalt-textの生成において大幅な改善を示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:04:38 GMT)
A Meta-Complexity Characterization of Quantum Cryptography [2.8] 量子暗号プリミティブの最初のメタ複雑性のキャラクタリゼーションを証明した。
片方向パズルが存在することは、カルモゴロフ複雑性を近似することが困難であるような二進弦の量子サンプリング可能な分布が存在する場合に限る。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:29:27 GMT)
Comparison of marker-less 2D image-based methods for infant pose estimation [2.8] GMA(General Movement Assessment)は、乳児運動機能(英語版)を分類するためのビデオベースのツールである。
一般用および幼児用推定器の性能と最適な記録のための視角の選択を比較した。
以上の結果から,成人のViTPoseを訓練する上で,最も優れた行動モデルが幼児の行動に有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:21:49 GMT)
Smart energy management: process structure-based hybrid neural networks for optimal scheduling and economic predictive control in integrated systems [2.7] 統合エネルギーシステム(IES)は、複数のドメインにまたがる多様な操作ユニットからなる複雑なシステムである。
複数の時間スケールでIESの動的性能を予測するために,物理インフォームドなハイブリッド時系列ニューラルネットワーク(NN)を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 04:24:39 GMT)
Interconnected Kingdoms: Comparing 'A Song of Ice and Fire' Adaptations Across Media Using Complex Networks [2.7] そこで本稿では,メディア間の文字マッチングとネットワークにおけるそれらの位置比較を行う手法を提案する。
我々は,G.R.R.マーティンによる新シリーズ『氷と火の歌』とその漫画・テレビ番組の翻案にこれらの手法を適用した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:35:46 GMT)
IR-Aware ECO Timing Optimization Using Reinforcement Learning [2.6] 本稿では、強化学習(RL)を用いたIR-drop-aware タイミング解析と ECO タイミング最適化を統合する。
物理設計および電力グリッド合成後に動作し、ゲートサイズによるIR滴によるタイミング劣化を補正する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 05:12:36 GMT)
Investigating Role of Big Five Personality Traits in Audio-Visual Rapport Estimation [2.6] 対象者の性格特性をモデル入力として利用することにより,ラプポートの推定性能を向上できるかどうかを検討する。
実験の結果,非言語機能にビッグファイブ機能(BFF)を追加することで,自己報告型ラプポートの評価性能が向上することが示された。
本研究は、対人認識の性格認識推定モデルが高評価性能を実現するための第一歩である。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:52:33 GMT)
FLAME: Adaptive and Reactive Concept Drift Mitigation for Federated Learning Deployments [2.6] 本稿では,適応モニタリング・除去(FLAME)を用いたフェデレーション学習について述べる。
FLAMEは、Federated Learning (FL) Internet of Things (IoT)環境でコンセプトドリフトを検出し緩和する新しいソリューションである。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:14:39 GMT)
FLAME: Adaptive and Reactive Concept Drift Mitigation for Federated Learning Deployments [2.6] 本稿では,適応モニタリング・除去(FLAME)を用いたフェデレーション学習について述べる。
FLAMEは、Federated Learning (FL) Internet of Things (IoT)環境でコンセプトドリフトを検出し緩和する新しいソリューションである。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:14:39 GMT)
Federated brain tumor segmentation: an extensive benchmark [2.5] 本稿では,この課題における3つのクラスすべてからのフェデレーション学習アルゴリズムの広範なベンチマークを提案する。
各カテゴリのいくつかの手法は、若干の性能改善をもたらし、フェデレーションの圧倒的なデータ分布に対する最終モデル(s)バイアスを制限する可能性があることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 09:32:19 GMT)
A Dynamic Model of Performative Human-ML Collaboration: Theory and Empirical Evidence [2.5] 本稿では,人間-機械学習協調システムにおける機械学習モデルの展開を考えるための新しい枠組みを提案する。
このフレームワークでは、MLレコメンデーションの導入によって、人間の意思決定のデータ生成プロセスが変化します。
多くのレベルのMLパフォーマンスにおいて、人間はML予測を改善することができる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:20:55 GMT)
Forest Proximities for Time Series [2.5] PF-GAPは、RF-GAPの近縁林への拡張である。
PF-GAPは正確かつ効率的な時系列分類モデルである。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:41:49 GMT)
Forest Proximities for Time Series [2.5] PF-GAPは、RF-GAPの近縁林への拡張である。
PF-GAPは正確かつ効率的な時系列分類モデルである。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:41:49 GMT)
HF-NTT: Hazard-Free Dataflow Accelerator for Number Theoretic Transform [2.5] 多項式乗法は、完全同型暗号(FHE)など、多くのアプリケーションにおける基本的な演算の1つである。
Numberoretic Transform (NTT) は、適応可能な乗算を向上するための有効なツールであるが、NTT加速器を高速に生成する方法が欠如している。
本稿では,新しいNTTアクセラレータであるHF-NTTを導入し,ビット反転操作を不要とするデータ移動戦略を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:31:38 GMT)
Are causal effect estimations enough for optimal recommendations under multitreatment scenarios? [2.5] 異なる治療やコントロール下での潜在的な結果を比較するために、因果効果推定分析を含めることが不可欠である。
マルチトリートメント選択のための包括的方法論を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:37:35 GMT)
Mastering Chinese Chess AI (Xiangqi) Without Search [2.3] 我々は,検索アルゴリズムに頼らずに動作する高性能な中国チェスAIを開発した。
このAIは、人間の上位0.1%のプレイヤーと競争する能力を示した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:27:51 GMT)
AI-Enhanced Ethical Hacking: A Linux-Focused Experiment [2.3] この研究は、Linuxベースのターゲットマシン上での侵入テストの重要な段階におけるGenAIの有効性を評価する。
このレポートは、誤用、データの偏見、幻覚、AIへの過度信頼といった潜在的なリスクを批判的に調査している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:02:47 GMT)
FRIDA: Free-Rider Detection using Privacy Attacks [2.3] プライバシ攻撃を用いたフリーライダー検出のためのFRIDAを提案する。
FRIDAは、基礎となるトレーニングデータセットの詳細を直接推論し、フリーライダーの振る舞いを示す特徴を明らかにする。
評価の結果,FRIDAは最先端の手法,特に非IID環境では優れていた。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:20:26 GMT)
The power of a single Haar random state: constructing and separating quantum pseudorandomness [2.3] このような神託が量子擬似ランダム性を構成することを、おそらく驚くべきことに示している。
シングルコピー擬似ランダム状態 (1PRS) と呼ばれるより弱い概念は、単一コピーに関してこの性質を満たす。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:58:01 GMT)
A Clifford Algebraic Approach to E(n)-Equivariant High-order Graph Neural Networks [2.3] 我々はClifford Group Equivariant Graph Neural Networks (CG-EGNN)を紹介する。
CG-EGNNはクリフォード代数の文脈で高階局所構造を統合することで高階メッセージパッシングを強化する。
CG-EGNNは,n-body,CMUモーションキャプチャ,MD17など,様々なベンチマークにおいて,従来の手法よりも優れていたことを実証的に検証した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:12:42 GMT)
Training Foundation Models as Data Compression: On Information, Model Weights and Copyright Law [2.2] 本稿では,モデルの重みがトレーニングデータの圧縮表現を具現化する,トレーニング・アズ・圧縮の視点を紹介する。
本稿では,基礎モデルによるアウトプットの著作権侵害から生じる技術的・法的課題について考察する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:40:25 GMT)
DAAL: Density-Aware Adaptive Line Margin Loss for Multi-Modal Deep Metric Learning [2.1] 本稿では,DAAL(Dedentity-Aware Adaptive Margin Loss)と呼ばれる新しい損失関数を提案する。
DAALは、各クラス内の適応サブクラスタの形成を奨励しながら、埋め込みの密度分布を保存する。
ベンチマークによるきめ細かいデータセットの実験は、DAALの優れた性能を示している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:04:24 GMT)
Resisting high-energy impact events through gap engineering in superconducting qubit arrays [2.1] 高エネルギー衝撃事象は超伝導量子ビットアレイの相関誤差を生じる。
クビットのジョセフソン接合の異なる超伝導ギャップは、このようなQPトンネルに抵抗する方法を提供する。
同じ基板上に強いギャップ工学と弱いギャップ工学を兼ね備えた全アルミニウムトランスモン量子ビットを作製することにより、高エネルギー衝撃イベントにおける真に異なる応答を観測する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:37:20 GMT)
Spatio-Temporal 3D Point Clouds from WiFi-CSI Data via Transformer Networks [2.1] 5Gネットワークと6Gネットワークのキーコンポーネントとして、ジョイントコミュニケーションとセンシング(JC&S)が登場している。
本稿では,時間的チャネル状態情報(CSI)データ,特に振幅と位相を処理するトランスフォーマーアーキテクチャを提案し,室内環境の3次元点雲を生成する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:59:04 GMT)
Cyber Threats to Canadian Federal Election: Emerging Threats, Assessment, and Mitigation Strategies [2.0] 近年の選挙における外国の干渉は、技術的および人間の脆弱性を悪用する敵の高度化を全世界的に強調している。
これらの脆弱性を軽減するために、脅威評価は、出現する脅威を特定し、インシデント対応能力を開発し、サイバー脅威に対する公衆の信頼とレジリエンスを構築するために不可欠である。
この研究は、誤情報、偽情報、不正情報(MDM)キャンペーン、重要なインフラと選挙支援システムへの攻撃、悪意あるアクターによるスパイの3つの主要な脅威を特定している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 23:40:40 GMT)
Perceptual Piercing: Human Visual Cue-based Object Detection in Low Visibility Conditions [2.0] 本研究では,大気散乱と人間の視覚野機構に触発された新しい深層学習フレームワークを提案する。
本研究の目的は, 環境条件下での検知システムの精度と信頼性を高めることである。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:28:08 GMT)
Perceptual Piercing: Human Visual Cue-based Object Detection in Low Visibility Conditions [2.0] 本研究では,大気散乱と人間の視覚野機構に触発された新しい深層学習フレームワークを提案する。
本研究の目的は, 環境条件下での検知システムの精度と信頼性を高めることである。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:28:08 GMT)
Autoregressive Image Diffusion: Generation of Image Sequence and Application in MRI [2.0] 生成モデルは画像分布を学習し、アンサンプされたk空間データから高品質な画像の再構成に使用できる。
画像系列に対する自己回帰画像拡散(AID)モデルを提案し,それを後部MRI再構成のサンプリングに用いた。
その結果,AIDモデルは逐次コヒーレントな画像列を確実に生成できることがわかった。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:10:03 GMT)
Improving Image Clustering with Artifacts Attenuation via Inference-Time Attention Engineering [1.9] モデルのサイズが大きくなるにつれて、マルチヘッドアテンションのパッチにハイノームアーティファクトが異常に現れる。
推論中に注意関数を操作するITAE(Inference-Time Attention Engineering)を提案する。
ITAEは、複数のデータセットのクラスタリング精度を改善し、潜在空間でより表現力のある機能を示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:26:10 GMT)
ChatVis: Automating Scientific Visualization with a Large Language Model [1.9] 大規模言語モデル(LLM)を用いてデータ解析と可視化のためのPythonスクリプトを合成的に生成できる反復型アシスタントを開発する。
アシスタントは、ユーザーが自然言語で操作を指定できるようにし、所望の操作に対してPythonスクリプトを生成しようとして、LLMが正しく実行されるまでスクリプトを必要に応じて修正するように促す。
提案手法は,5つの標準的な可視化シナリオ上での正しい実行を示し,その結果を真実と比較する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:37:59 GMT)
Language in Vivo vs. in Silico: Size Matters but Larger Language Models Still Do Not Comprehend Language on a Par with Humans [1.8] 本研究では,人間とモデルの違いがモデルサイズに寄与するかどうかを判断する上で,モデルスケーリングが果たす役割について検討する。
アナフォラ, 中心埋め込み, 比較, 負極性を含む文法判断タスクにおいて, 3つの大言語モデル(LLM)を検証した。
結果,ChatGPT-4の精度は,ChatGPT-4の精度が76%に対して80%であったのに対し,ChatGPT-4の精度は1つのタスク条件,すなわち文法文でのみ優れていた。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 11:37:44 GMT)
Fundamental limits for realising quantum processes in spacetime [1.8] 古典的背景時空で実現可能な量子実験のノーゴー定理を導出する。
我々の最初の定理は、相対論的因果性に反しないICOプロセスの実現は、時空におけるシステムの非局在化を伴わなければならないことを示唆している。
第二の定理は、ICO過程のそのような実現には、定性的かつ非巡回因果順序過程の観点でよりきめ細かな記述が存在することを示している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:12:05 GMT)
Embedding cyclic information-theoretic structures in acyclic spacetimes: no-go results for indefinite causality [1.8] 我々は2つの因果関係の概念を結びつける理論的枠組みを開発し、それらを明確に区別する。
我々は、不定因果関係と循環因果関係、およびそれらの物理的性に関する疑問に光を当てた。
私たちの研究は、時空における量子情報処理の限界にも光を当てています。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 12:35:42 GMT)
Correcting for Popularity Bias in Recommender Systems via Item Loss Equalization [1.8] 人気アイテムの小さなセットが、高い相互作用率のために推奨結果を支配している。
この現象は、ニッチな興味のある人を無視しながら、メインストリームの趣味を持つユーザーに不当に利益をもたらす。
本稿では,推薦モデルのトレーニングプロセスに介入することで,この問題に対処するプロセス内アプローチを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:34:18 GMT)
A Framework for Pupil Tracking with Event Cameras [1.7] サッカデス(Saccades)は、同時に起こる両眼の非常に速い動きである。
ササード中の眼の最高角速度は、ヒトでは700deg/sに達する。
標準的なディープラーニングアルゴリズムで容易に利用できるフレームとしてイベントを提示する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:46:07 GMT)
Quantum Vector Signal Analyzer: Wideband Electric Field Sensing via Motional Raman Transitions [1.7] 我々は1つの閉じ込められたイオン中のラマン転移を用いて、周波数、位相、振幅に対する芸術感度の状態を実現する。
この手法は、スクイーズによる量子増幅とフォック基底での計測の両方と互換性がある。
小型フィールドの量子センシングのための魅力的なプラットフォームを提供するのに加えて、この技術はQHOシステムにおいて量子ビット制御ラインをその場で校正することができる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 22:49:55 GMT)
OffsetBias: Leveraging Debiased Data for Tuning Evaluators [1.6] 様々な判断モデルに固有の6種類のバイアスを定性的に同定する。
データセットの微調整は、バイアスに対する判断モデルの堅牢性を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:49:49 GMT)
Stability of sorting based embeddings [1.5] 一般線型写像 $alpha : mathbbRM times N to mathbbRD$ to mathbbRD$ to the invariant map $beta_Phi : V to mathbbRM times N$ given by sorting the coorbits。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:27:50 GMT)
System Symmetry and the Classification of Out-of-Time-Ordered Correlator Dynamics in Quantum Chaos [1.5] 量子カオス系における外秩序相関器(OTOC)の普遍性について検討する。
アンサンブル平均OTOCダイナミクスはシステム対称性によって異なる普遍的な挙動を示すことを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:03:09 GMT)
Towards Quantum Computational Mechanics [1.5] 本稿では、量子コンピューティングを用いて、計算ホモジェナイゼーションにおける代表要素体積(RVE)問題を解く方法について述べる。
我々の量子RVE解法は古典解法に対して指数加速度を得る。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 12:53:24 GMT)
Machine listening in a neonatal intensive care unit [1.5] 酸素、警報装置、足音は、病院で最も一般的な音源である。
本稿では,エッジコンピューティングとクラウドコンピューティングの組み合わせにより,これら2つの課題に対処する。
プライバシー保護のための音響センサを設計し,音声波形を録音する代わりに,3オクターブのスペクトルをリアルタイムで計算する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:44:38 GMT)
Circuit Design of Two-Step Quantum Search Algorithm for Solving Traveling Salesman Problems [1.5] 2組の演算子を用いた2段階量子探索(TSQS)アルゴリズムを提案する。
最初のステップでは、すべての実現可能な解は、同じ重ね合わせ状態に増幅される。
2番目のステップでは、この重ね合わせ状態から最適解状態が増幅される。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 12:35:27 GMT)
On the Structure of Game Provenance and its Applications [1.4] ゲーム前駆体の微細粒構造について検討する。
我々は、新しい種類の証明をもたらす7つのエッジタイプ、すなわちポテンシャル、現実、プライマリを識別する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:48:56 GMT)
Military Applications of Machine Learning: A Bibliometric Perspective [1.4] 本稿では,軍事組織に適用された機械学習アーキテクチャのモデルを提案する。
2021年までの文献分析が行われ、戦略図を作成し、その結果を解釈した。
今回のケースでは、最も重要な領域と、機械学習の最新の進歩が、軍環境に適用されます。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:54:40 GMT)
Investigating large language models for their competence in extracting grammatically sound sentences from transcribed noisy utterances [1.4] 人間は、意味的に重要な内容と音声特有のノイズを区別する優れた認知能力を示す。
本研究では,大言語モデル (LLM) が類似語理解タスクを効果的に実行できるかを検討する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:55:20 GMT)
HYDRA-FL: Hybrid Knowledge Distillation for Robust and Accurate Federated Learning [1.3] 本稿では,KDベースのFLシステムにおいて,この重大な脆弱性を明らかにするケーススタディを提案する。
KDがなぜこの問題を経験的証拠を通じて引き起こし、それをハイブリッド蒸留技術の設計の動機として利用するのかを示す。
本稿では,ロバストと高精度FL(HYDRA-FL)のためのハイブリッド知識蒸留法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:24:47 GMT)
HYDRA-FL: Hybrid Knowledge Distillation for Robust and Accurate Federated Learning [1.3] 本稿では,KDベースのFLシステムにおいて,この重大な脆弱性を明らかにするケーススタディを提案する。
KDがなぜこの問題を経験的証拠を通じて引き起こし、それをハイブリッド蒸留技術の設計の動機として利用するのかを示す。
本稿では,ロバストと高精度FL(HYDRA-FL)のためのハイブリッド知識蒸留法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:24:47 GMT)
HYDRA-FL: Hybrid Knowledge Distillation for Robust and Accurate Federated Learning [1.3] 本稿では,KDベースのFLシステムにおいて,この重大な脆弱性を明らかにするケーススタディを提案する。
KDがなぜこの問題を経験的証拠を通じて引き起こし、それをハイブリッド蒸留技術の設計の動機として利用するのかを示す。
本稿では,ロバストと高精度FL(HYDRA-FL)のためのハイブリッド知識蒸留法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:24:47 GMT)
Tourism destination events classifier based on artificial intelligence techniques [1.3] 本稿では, 階層的な分類法を用いて, 多様な観光イベントを自動的に分類する手法を提案する。
このツールは、企業やエンドユーザーが観光イベント情報と対話する方法に革命をもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:54:51 GMT)
An active learning method for solving competitive multi-agent decision-making and control problems [1.2] 競合エージェントの集団に対する定常行動プロファイルを特定するための,新しいアクティブラーニング手法を提案する。
提案手法は,典型的なマルチエージェント制御と意思決定問題に適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 10:52:47 GMT)
Ensured: Explanations for Decreasing the Epistemic Uncertainty in Predictions [1.2] 認識の不確実性は、品質を説明するために重要な次元を付け加える。
我々は、この不確実性を特に狙う新しいタイプの説明を紹介します。
我々は、ユーザが最も信頼できる説明を識別できるように設計された新しい指標、保証されたランキングを導入する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 20:21:51 GMT)
QML-IDS: Quantum Machine Learning Intrusion Detection System [1.2] 本稿では量子コンピューティングと古典コンピューティングを組み合わせた新しい侵入検知システムQML-IDSを提案する。
QML-IDSはQuantum Machine Learning(QML)手法を用いてネットワークパターンを分析し、攻撃活動を検出する。
我々は,QML-IDSが攻撃検出に有効であることを示し,バイナリおよびマルチクラス分類タスクで良好に動作することを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 13:07:41 GMT)
From Transparency to Accountability and Back: A Discussion of Access and Evidence in AI Auditing [1.2] 監査は、デプロイ前のリスクアセスメント、進行中の監視、コンプライアンステストなど、さまざまな形式で実施することができる。
AI監査には、その実装を複雑にする多くの運用上の課題がある。
我々は、監査は自然な仮説テストとして、並列仮説テストと法的手続きを引き出すことができると論じ、このフレーミングは、監査実施に関する明確かつ解釈可能なガイダンスを提供すると論じる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:15:46 GMT)
A Framework for Guided Motion Planning [1.2] 我々は、ガイド空間の概念を定義することにより、ガイド付き探索の概念を定式化する。
この新しい言語は、同じフレームワークの下で、明らかに異なる先行メソッドをカプセル化している。
本稿では,既知のアルゴリズムでテストした場合の直感と実験的に一致したガイダンスを評価するための情報理論手法を提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 03:56:10 GMT)
Efficient Shield Synthesis via State-Space Transformation [1.0] 適切な状態空間変換は、計算オーバーヘッドのほとんどない粗いグリッドでも使用できることを示す。
3つのケーススタディにおいて、変換に基づく合成は、数桁の精度で標準合成より優れていることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:41:11 GMT)
Unitary convolutions for learning on graphs and groups [1.0] 我々は、訓練中により安定したより深いネットワークを可能にするユニタリグループ畳み込みについて研究する。
論文の主な焦点はグラフニューラルネットワークであり、ユニタリグラフの畳み込みがオーバー・スムーシングを確実に回避していることを示す。
実験結果から,ベンチマークデータセット上でのユニタリグラフ畳み込みネットワークの競合性能が確認できた。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:09:14 GMT)
AI in Archival Science -- A Systematic Review [1.0] 本研究は,人工知能(AI)を人工科学の広い領域に組み込むことの利点を浮き彫りにするものである。
我々の発見は、記録保存プロセスの合理化とデータ検索効率の向上を約束する重要なAI駆動戦略を強調した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:39:12 GMT)
Quantum property testing in sparse directed graphs [1.0] 古典的な一方向モデルでは、$k$-star-freeness、より一般に$k$-source-subgraph-freenessをテストするという問題は、大きめの$k$にとってほとんど極端に難しい。
量子的にも線形なクエリ数が必要であることも示しています。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:00:43 GMT)
StyleReiser: Stylizing Video With Reinforced Structure Guide [0.9] StyleReiserは、与えられたスタイルをビデオシーケンス全体へ転送するサンプルベースのビデオスタイリング手法である。
提案手法は,所定のスタイルとの整合性を考慮し,対象映像列に現れる新しい構造要素への忠実性を維持する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:04:11 GMT)
StructuReiser: A Structure-preserving Video Stylization Method [0.9] StructuReiserは、ユーザが提供する一連のシーケンスを使用して、入力ビデオをスタイル化されたシーケンスに変換する、ビデオからビデオへの変換方法である。
ターゲットビデオの構造的要素に厳密な固執を保ち、元のアイデンティティを保持しつつ、希望するスタイル的シーケンスをシームレスに適用する。
リアルタイムとカスタム編集をサポートし、インタラクティブなアプリケーションに最適であり、クリエイティブな表現やビデオ操作の可能性を拡大する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:04:11 GMT)
IndicVoices-R: Unlocking a Massive Multilingual Multi-speaker Speech Corpus for Scaling Indian TTS [0.9] IndicVoices-R (IV-R) は、ASRデータセットから派生したインド最大の多言語TSデータセットである。
IV-Rは、LJ、Speech LibriTTS、IndicTTSといったゴールドスタンダードのTSデータセットの品質と一致する。
私たちは、22の公用語すべてを対象とした最初のTSモデルをリリースします。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 05:29:01 GMT)
xLSTM-FER: Enhancing Student Expression Recognition with Extended Vision Long Short-Term Memory Network [0.8] 本稿では、拡張長短期記憶(xLSTM)から派生した新しいアーキテクチャであるxLSTM-FERを紹介する。
xLSTM-FERは入力画像を一連のパッチに分割して処理し、これらのパッチを処理するためにxLSTMブロックのスタックを活用する。
CK+、RAF-DF、FERplusの実験は、発現認識タスクにおけるxLSTM-FERの可能性を示している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:29:24 GMT)
Cybersecurity Threat Hunting and Vulnerability Analysis Using a Neo4j Graph Database of Open Source Intelligence [0.8] 本稿では,オープンソースのインテリジェンステキストと他の情報との共有接続によって形成されるNeo4jグラフデータベースを構築するシステムを提案する。
これらの接続は、妥協の可能性のある指標(IPアドレス、ドメイン、ハッシュ、メールアドレス、電話番号など)と、既知のエクスプロイトや技術に関する情報で構成されている。
グラフデータベースには,悪用された既知のCVEへの接続,既知の悪意のあるIPアドレス,マルウェアのハッシュシグネチャという,興味深いコネクションの具体例が3つある。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 21:15:40 GMT)
KV-Compress: Paged KV-Cache Compression with Variable Compression Rates per Attention Head [0.8] そこで我々は,PagedAttentionフレームワーク内で連続KVブロックを除去する新しい圧縮手法であるKV-Compressを紹介する。
本手法は,Mistral-7B-Instruct-v0.2およびLlama-3.1-8B-InstructのLongBenchにおける圧縮KVの総数を4倍に減らしながら,最先端の性能を実現する。
Llama-3.1-8B-InstructとLlama-3.1-70B-Instruct-FP8の評価は、圧縮速度を最大8倍まで達成し、性能に悪影響を及ぼすことなく、フルキャッシュ性能の90%以上を維持しながら、最大64倍まで向上する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:07:09 GMT)
KV-Compress: Paged KV-Cache Compression with Variable Compression Rates per Attention Head [0.8] そこで我々は,PagedAttentionフレームワーク内で連続KVブロックを除去する新しい圧縮手法であるKV-Compressを紹介する。
本手法は,Mistral-7B-Instruct-v0.2およびLlama-3.1-8B-InstructのLongBenchにおける圧縮KVの総数を4倍に減らしながら,最先端の性能を実現する。
Llama-3.1-8B-InstructとLlama-3.1-70B-Instruct-FP8の評価は、圧縮速度を最大8倍まで達成し、性能に悪影響を及ぼすことなく、フルキャッシュ性能の90%以上を維持しながら、最大64倍まで向上する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:07:09 GMT)
Improving the Sampling Strategy in KernelSHAP [0.8] KernelSHAPフレームワークは、重み付けされた条件付き期待値のサンプルサブセットを用いて、Shapley値の近似を可能にする。
本稿では,現在最先端戦略における重みの分散を低減するための安定化手法,サンプルサブセットに基づいてShapleyカーネル重みを補正する新しい重み付け方式,および重要なサブセットを包含して修正されたShapleyカーネル重みと統合する簡単な戦略を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 10:02:31 GMT)
Revealing non-Markovian Kondo transport with waiting time distributions [0.7] 単一不純物アンダーソンモデルにおける非マルコフ輸送力学と近藤効果のシグネチャについて検討する。
本研究では, 電子トンネルの待ち時間分布(WTD)を, 階層的運動アプローチ方程式(HEOM)と装束マスター方程式の組み合わせを用いて計算する。
その結果,WTD振動はマルコフ的でない系-バス相互作用の探索に有用なツールであることが示された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:08:55 GMT)
Revealing non-Markovian Kondo transport with waiting time distributions [0.7] 単一不純物アンダーソンモデルにおける非マルコフ輸送力学と近藤効果のシグネチャについて検討する。
本研究では, 電子トンネルの待ち時間分布(WTD)を, 階層的運動アプローチ方程式(HEOM)と装束マスター方程式の組み合わせを用いて計算する。
その結果,WTD振動はマルコフ的でない系-バス相互作用の探索に有用なツールであることが示された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:08:55 GMT)
A Moreau Envelope Approach for LQR Meta-Policy Estimation [0.7] 離散時間線形時間不変不確実な力学系における線形二次レギュレータ(LQR)のポリシー推定問題について検討する。
本稿では,不確実なシステムの有限な実現法から構築した代用LQRコストを提案し,新しい実現法に適応可能なメタポリティクスを効率的に定義する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 05:04:42 GMT)
DreamSat: Towards a General 3D Model for Novel View Synthesis of Space Objects [0.7] 本研究では,DreamSatという単一視点画像から3次元宇宙船を再構成する手法を提案する。
我々は、高品質な190の宇宙船モデルのデータセットに基づいて、最先端の単一ビュー再構成モデルであるZero123 XLを微調整する。
このアプローチは、DreamGaussianフレームワークの効率を維持しながら、宇宙船の復元の精度と詳細を向上する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:51:54 GMT)
The collective use and perceptions of generative AI tools in digital humanities research: Survey-based results [0.7] 創造的な人工知能技術は、デジタルヒューマニティに重要な意味を持つ研究環境に革命をもたらした。
本稿では、DH研究者がChatGPTなどの生成AI技術を研究に採用し、批判的に評価する方法について考察する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 18:07:54 GMT)
A Digital Twin Framework for Liquid-cooled Supercomputers as Demonstrated at Exascale [0.6] 本稿では,液体冷却スーパーコンピュータの総合的デジタルツインを開発するためのオープンソースフレームワークであるExaDigiTを紹介する。
1)資源アロケータと電力シミュレータ、(2)過渡的な熱流体冷却モデル、(3)スーパーコンピュータと中央エネルギープラントの拡張現実モデルである。
われわれは、デジタルツインが持続可能なエネルギー効率の高いスーパーコンピュータの鍵となると期待している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:36:50 GMT)
UPCS: Unbiased Persona Construction for Dialogue Generation [0.6] 既存のペルソナプロファイルは、しばしばバイアスを示し、システムの完全性と公平性にリスクを及ぼす。
キャラクタ記述を8次元に分類する UPCS フレームワークを導入する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:14:26 GMT)
Residual Kolmogorov-Arnold Network for Enhanced Deep Learning [0.6] 我々はKANフレームワークを残留成分として組み込んだResidual Arnoldを紹介する。
視覚データにおける深部CNNの能力を高めるためのRKANの可能性を示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:12:32 GMT)
Improving On-Demand Single Photon Source Coherence and Indistinguishability Through a Time-Delayed Coherent Feedback [0.6] 単一光子源(SPS)は多くの量子情報技術にとって重要な資源である。
拡張性のある導波管システムに時間遅延コヒーレントフィードバックを組み込むことで、SPSの2つの重要なメリットを著しく改善できることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:07:29 GMT)
Scalable Inference for Bayesian Multinomial Logistic-Normal Dynamic Linear Models [0.6] この記事では、$textitFenrir$と呼ばれる、後続状態推定に対する効率的で正確なアプローチを開発します。
我々の実験から、フェンリルはスタンよりも3桁効率が良いことが示唆された。
当社のメソッドは,C++で記述されたユーザフレンドリなソフトウェアライブラリとして,Rインターフェースを備えたコミュニティで利用可能です。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 23:20:14 GMT)
Efficient Quantum Simulation Algorithms in the Path Integral Formulation [0.6] 我々は、経路積分定式化のハミルトン版に基づく2つの新しい量子アルゴリズムと、 $fracm2dotx2 - V(x)$ という形でラグランジアンに対して提供する。
我々のラグランジアンシミュレーションアルゴリズムは、連続極限において$D+1$次元の$eta$粒子を持つシステムに対して、$V(x)$が有界であれば$widetildeO(eta D t2/epsilon)$としてスケールする離散ラグランジアンを演算するオラクルに対して、多数のクエリを必要とすることを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:32:40 GMT)
Positive bias makes tensor-network contraction tractable [0.5] テンソルネットワークの収縮は、量子多体物理学、量子情報、量子化学において強力な計算ツールである。
ここでは、テンソル-ネットワークの収縮の複雑さが、量子性、すなわちそのエントリの符号構造の違いにどのように依存するかを研究する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:27:23 GMT)
Analysis of Hybrid Compositions in Animation Film with Weakly Supervised Learning [0.5] 短命フィルムの領域におけるアニメーションにおけるハイブリッド視覚構成の分析手法を提案する。
半教師付き学習と弱教師付き学習のアイデアを組み合わせて、事前にラベル付けされたセグメンテーションマスクを必要とせずにハイブリッド合成をセグメント化できるモデルを訓練する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:57:23 GMT)
Matryoshka Policy Gradient for Entropy-Regularized RL: Convergence and Global Optimality [0.5] The novel Policy Gradient (PG) algorithm called $textitMatryoshka Policy Gradient$ (MPG) is introduced and study。
我々は,MPGのグローバル収束とともに,エントロピー正規化目標の最適方針を証明し,特徴付ける。
概念実証として,標準テストベンチマークでMPGを数値的に評価する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:41:29 GMT)
Towards using Reinforcement Learning for Scaling and Data Replication in Cloud Systems [0.5] 強化学習はクラウドコンピューティングに関連する多くの領域で使われており、自動データレプリケーション戦略を得るための有望な分野である。
本研究では、強化学習(RL)に基づくデータ複製戦略とデータスケーリングについて調査する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 11:32:35 GMT)
Nonparametric Strategy Test [0.5] 本稿では,エージェントが与えられた混合戦略に従っているかどうかを,エージェントのプレイのサンプルが与えられた繰り返し戦略形式のゲームで判定する非パラメトリック統計的テストを提案する。
これには、エージェントの純粋な戦略の頻度がターゲットのイテレーションに十分近いかどうかを判断し、選択された純粋な戦略が異なるゲームイテレーション間で独立であるかどうかを決定する2つのコンポーネントが含まれる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 04:36:10 GMT)
Incorporating Talker Identity Aids With Improving Speech Recognition in Adversarial Environments [0.3] 音声認識と話者識別を共同で行うトランスフォーマーモデルを開発した。
クリーンな条件下では,ジョイントモデルがWhisperと相容れない性能を示す。
以上の結果から,音声認識と音声表現の統合により,対向条件下ではより堅牢なモデルが得られる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:39:59 GMT)
Improved detection of discarded fish species through BoxAL active learning [0.3] 本研究では,より高速なR-CNNオブジェクト検出モデルの認識精度を推定する,BoxALという能動的学習手法を提案する。
この方法では、未ラベルのプールから最も不確実なトレーニングイメージを選択し、オブジェクト検出モデルのトレーニングに使用することができる。
また,本研究では,サンプル化した新データが,未ラベルデータよりもトレーニングに有用であることが確認された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 10:01:30 GMT)
$m$-step rational extensions of the trigonometric Darboux-Pöschl-Teller potential based on para-Jacobi polynomials [0.2] 1ステップのダルブックスによって得られる三角度ダルブックス-P"オシュラーポテンシャルの正則な有理拡大の以前の構成について研究した。
離散パラメータ$m$に依存する例外変換のいくつかの新しい族が研究されている。
有理拡張正則性条件によるこれらのパラメータに課される制限を詳細に研究する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:03:02 GMT)
Error mitigation and circuit division for early fault-tolerant quantum phase estimation [0.0] 本稿では,誤り訂正オーバーヘッドと残差論理ノイズとのトレードオフにより,早期耐故障性アルゴリズムを設計するための枠組みを提案する。
我々は,大域的偏極雑音に頑健なQFT(Quantum-Fourier-Transform)に基づく量子位相推定法を開発した。
この研究は、早期耐故障コストの削減と時空トレードオフをエンドツーエンドで分析し、将来どの領域が改善できるかを特定する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:00:00 GMT)
In-the-loop Hyper-Parameter Optimization for LLM-Based Automated Design of Heuristics [0.0] 大規模言語モデル(LLM)は、(メタ)ヒューリスティックを自動的に生成し最適化する大きな可能性を示している。
本稿では,オープンソースのLLaMEAフレームワークとハイパー進化最適化(HPO)手法を統合した新しいハイブリッドアプローチであるLLaMEA-HPOを提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:04:31 GMT)
Yu-Shiba-Rusinov bound states boost odd-frequency superconductivity [0.0] 2つの異なるセットアップでゼロエネルギーYu-Shiba-Rusinov境界状態の発生について検討する。
YSR境界状態がなければ、偶数周波数の超伝導が支配的となる。
均等なスピン-トリップレット対は、両方の設定において表面誘起奇周波数超伝導において支配的な成分である。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:10:06 GMT)
When does compositional structure yield compositional generalization? A kernel theory [0.0] 固定表現を持つカーネルモデルにおける合成一般化の理論を示す。
学習データのバイアスから生じる合成一般化における新しい障害モードを同定する。
この研究は、トレーニングデータの統計的構造が構成一般化にどのように影響するかに関する理論的視点を提供する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 22:55:53 GMT)
Using Deep Learning to Identify Initial Error Sensitivity for Interpretable ENSO Forecasts [0.0] 本稿では,ディープラーニングとモデル・アナログ予測を統合した解釈可能なモデル・アナログを提案する。
我々は,地域地球系モデルバージョン2大アンサンブルを用いて,季節ごとの時間スケールでエルニーニョ南部振動(ENSO)を予測する。
その結果,赤道太平洋海面温度異常の予測は9~12ヶ月で10%改善した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 21:47:33 GMT)
Unification of popular artificial neural network activation functions [0.0] 本稿では,最も一般的なニューラルネットワーク活性化関数の統一表現について述べる。
分数計算のMittag-Leffler関数を採用することにより、フレキシブルでコンパクトな関数形式を提案する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:45:38 GMT)
Two-electron atomic systems. A simple method for calculating the ground state near the nucleus. Some applications [0.0] 2電子原子/イオンの電子構造の簡単な変分計算法が提案されている。
ヘリウム原子の性質を特徴づける主数値パラメータと核近傍のヘリウム様イオンを計算し、表に示す。
核近傍の正しい振舞いを持つ波動関数を用いてのみ計算できるFock展開の比係数$a_21$は、表とグラフで表される。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 10:35:10 GMT)
Two-dimensional non-Hermitian Su-Schrieffer-Heeger Model [0.0] 粒子ホール対称性で保護された2次元非エルミタンSu-Schrieffer-Heeger (SSH) モデルについて検討した。
例外的な点は、次元のないポテンシャル等級とホッピング振幅が一意に近いときに起こる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:49:35 GMT)
Training quantum machine learning models on cloud without uploading the data [0.0] 本稿では,入力データを符号化する前にパラメータ化量子回路を動作させる手法を提案する。
これにより、データセット所有者は、量子クラウドプラットフォーム上で機械学習モデルをトレーニングすることができる。
また、後に古典的な計算を用いて大量のデータを効果的に符号化することも可能である。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 20:19:38 GMT)
Towards a Universal Method for Meaningful Signal Detection [0.0] 人間の発話と特定の動物の発声は、ある発話が伝達する内容を解読できるため、意味のある内容を伝えることができることが知られている。
本稿では,信号が意味を持つかどうかを判断するための代替手法として,信号自体を解析し,伝達された意味とは無関係であることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:54:37 GMT)
Towards Measuring Goal-Directedness in AI Systems [0.0] 意図しない目標を追求するAIシステムにとって重要な前提条件は、一貫性のあるゴール指向の方法で振る舞うかどうかである。
そこで本稿では,多くの報酬関数に準最適であるかどうかをモデル化する政策の目的指向性の定義を新たに提案する。
私たちの貢献は、AIシステムが危険な目標を追求できるかどうかという問題にアプローチするために、シンプルで計算が容易なゴール指向性の定義です。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 01:34:42 GMT)
The role of interface boundary conditions and sampling strategies for Schwarz-based coupling of projection-based reduced order models [0.0] 本稿では、シュワルツ交互化法を用いて、サブドメイン局所射影に基づくリダクションオーダーモデル(PROM)の結合のためのフレームワークを提案する。
サブドメイン境界上でのDirichlet-Dirichlet (Robin-Robin や交互化Dirichlet-Neumann) 伝送BCを用いた安定かつ正確な結合モデルが得られることを示す。
以上の結果から,提案手法はPROMの精度を向上させる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 00:44:22 GMT)
The lazy (NTK) and rich ($μ$P) regimes: a gentle tutorial [0.0] 現代の機械学習パラダイムの中心的なテーマは、大規模ニューラルネットワークがさまざまなメトリクスでより良いパフォーマンスを達成することである。
本チュートリアルでは,広義のネットワークを効果的に訓練するためには,自由度が1つしかないという,非厳密だが実証的な事実の導出を行う。
この自由度はトレーニング行動の豊かさを制御します。最小限のネットワークはカーネルマシンのように遅延し、最大でも機能学習を示します。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 18:14:21 GMT)
The divide between us: Internet access among people with and without disabilities in the post-pandemic era [0.0] 障害のある人は、ファイバーアクセスを制限し、無線ブロードバンドも高めている。
障害者は、ソーシャルメディアプラットフォームの使用を減らし、特定のオンラインリスクを心配している。
発見は、パンデミック後の時代に障害のある人々のためのインターネットアクセスにおける絶え間ない格差を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:23:18 GMT)
The Role of Governments in Increasing Interconnected Post-Deployment Monitoring of AI [0.0] 言語ベースのAIシステムは社会に拡散し、肯定的および否定的な影響をもたらす。
ネガティブな影響の軽減は、経験的証拠ベースから引き出された正確な影響評価に依存する。
相互接続されたデプロイ後監視は、モデル統合と使用、アプリケーション利用、インシデントと影響に関する情報を組み合わせる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:24:29 GMT)
Tensor category describing anyons in the quantum Hall effect and quantization of conductance [0.0] 我々は、純無限体積基底状態の電荷保存システムを考える。
このシナリオではホールコンダクタンス(英語版)はよく定義されているが、その量子化の証明は存在しない。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 04:10:00 GMT)
T-JEPA: Augmentation-Free Self-Supervised Learning for Tabular Data [0.0] 自己教師付き学習(SSL)は一般的に同じサンプルの異なるビューを生成するため、データ拡張が必要である。
本研究では,構造化データに対する拡張不要なSSL方式を提案する。
我々のアプローチであるT-JEPAは、JEPA(Joint Embedding Predictive Architecture)に依存しており、潜伏した空間における再構築のマスクに似ている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 13:15:07 GMT)
SymmetryLens: A new candidate paradigm for unsupervised symmetry learning via locality and equivariance [0.0] 我々は、生データから始まる新しい教師なし対称性学習法を開発した。
この対称性と局所性の結合は,エントロピー推定のために開発された特別な最適化手法とともに,高度に安定なシステムをもたらすことを実証する。
私たちが考える対称性の作用は群表現であるが、このアプローチは非可換リー群のより一般的な非線形作用に一般化される可能性があると信じている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:40:51 GMT)
Structural Constraints for Physics-augmented Learning [0.0] 物理が間違っているとき、物理学のインフォームド・機械学習は物理のミスフォームド・機械学習になる。
本稿では,ハイブリッドモデル(物理モデルとブラックボックスモデル)が物理モデルを再現できないという整合性を主張するために使用できる2つの基準を提案する。
小信号線形化により近似した非線形機械系のサンプルについて実演する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:25:49 GMT)
Single-shot preparation of hypergraph product codes via dimension jump [0.0] 本稿では,空間的オーバーヘッドを$O(sqrtn)$とすることで,一定レートのハイパーグラフ製品コードのコード空間を一定深さで作成するプロトコルを提案する。
測定誤差が存在する場合でも,プロトコルは堅牢であることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:29:13 GMT)
SimO Loss: Anchor-Free Contrastive Loss for Fine-Grained Supervised Contrastive Learning [0.0] 提案した類似性-直交性(SimO)損失を利用したアンカーフリーコントラスト学習(L)手法を提案する。
提案手法は,2つの主目的を同時に最適化するセミメトリック判別損失関数を最小化する。
埋め込み空間におけるSimO損失の影響を可視化する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:41:10 GMT)
Shifting the Human-AI Relationship: Toward a Dynamic Relational Learning-Partner Model [0.0] 我々は、人間との対話から学ぶ学生に似た、AIを学習パートナーとして見ることへのシフトを提唱する。
我々は「第三の心」が人間とAIの協力関係を通して生まれることを示唆する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 19:19:39 GMT)
Separable ellipsoids around multipartite states [0.0] 我々は、$rho_rm prod$を中心に分離可能な状態の楕円体が存在することを示す。
この分離可能な楕円体の体積は、通常、以前の研究で提案された分離可能な球の体積よりも指数関数的に大きい。
我々の基準は、分離性を厳格に検出する数値的な手順に役立つだろう。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:05:26 GMT)
Self-oscillating open quantum systems [0.0] この振動子における平衡の欠如は、エネルギー源の生成の光の中で議論される。
このようなシステムと既知の非線形自己振動系との接続を示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 06:28:20 GMT)
Scalar Field Prediction on Meshes Using Interpolated Multi-Resolution Convolutional Neural Networks [0.0] 任意のメッシュ上でスカラー場を予測する手法を提案する。
このモデルは有限要素von Mises応力場に基づいて訓練され、一度訓練すれば、任意の入力メッシュ上の各ノードの応力値を推定することができる。
また, 熱伝導問題における温度場のモデルも示しており, 予測値の中央値は0.99である。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:59:34 GMT)
Safe Learning-Based Optimization of Model Predictive Control: Application to Battery Fast-Charging [0.0] 本稿では,モデル予測制御とベイズ最適化を統合し,長期閉ループ性能を最適化する手法について議論する。
この研究は、閉ループ制約満足度を強調することによって、これまでの研究を拡張した。
本手法をリチウムイオン電池の高速充電に適用する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:23:40 GMT)
STIRAP-Inspired Robust Gates for a Superconducting Dual-Rail Qubit [0.0] STImulated Raman Adiabatic Passage (STIRAP) は量子システムにおける堅牢な状態伝達機能のための強力な技術である。
2つの強く結合された固定周波数トランスモン量子ビットからなるデュアルレール量子ビットにおけるロバストな$pi$と$pi$/2ローテーションの実装を実験的に実証した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:27:39 GMT)
Riemannian-geometric generalizations of quantum fidelities and Bures-Wasserstein distance [0.0] Uhlamnn-, Holevo-, Matsumotofidelity のような標準量子忠実度を一般化する。
ブロック行列のキャラクタリゼーションを提供し、ウルマン様の定理を証明する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:28:26 GMT)
Resolvent-based quantum phase estimation: Towards estimation of parametrized eigenvalues [0.0] 行列分解形式に基づく非正規行列の固有値を推定するための新しい手法を提案する。
与えられた非単項行列の単位ノルム固有値の位相を推定するための最初の効率的なアルゴリズムを構築する。
次に、与えられた非エルミート行列の実固有値を推定する効率的なアルゴリズムを構築する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:51:05 GMT)
Real-time chiral dynamics at finite temperature from quantum simulation [0.0] 本研究では, (1+1)-次元QEDにおけるキラル磁気効果(CME)の有限温度におけるリアルタイムダイナミクスについて検討する。
熱状態の研究には量子想像時間進化法(QITE)アルゴリズムを用い,実時間進化には鈴木・トロッター分解法を用いる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:44:20 GMT)
Real-time Ship Recognition and Georeferencing for the Improvement of Maritime Situational Awareness [0.0] この論文は、ディープラーニングとコンピュータビジョンを活用して、リアルタイムの船舶認識とジオレファリングを促進するための調査である。
3,505枚の画像と11,625枚の船体マスクを備えた新しいデータセットであるShipSGが導入された。
カスタムリアルタイムセグメンテーションアーキテクチャであるScatYOLOv8+CBAMはNVIDIA Jetson AGX Xavier組み込みシステム用に設計されている。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:43:42 GMT)
Quasiparton distributions in massive QED2: Toward quantum computation [0.0] 質量2次元量子電磁力学において,最も軽い$eta'$中間子の準粒子分布を解析した。
ハミルトン作用素とブースト作用素は、開境界条件を持つ空間格子のスピン量子ビットに写像される。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:05:48 GMT)
Quantum teleportation implies symmetry-protected topological order [0.0] 標準」テレポーテーションプロトコルでは、すべての結果依存ユニタリは、測定結果の線形関数に条件付けられたパウリ作用素である。
このようなプロトコルはすべて、対称性保護トポロジカル(SPT)順序を示す「資源状態」を作成することを含み、Abelian protect symmetric $mathcalG_k= (mathbbZ times mathbbZ_2)k$である。
k$論理状態は、バルク内の対応する2k$文字列順序パラメータを測定し、結果依存のポールを適用することで、チェーンの端の間でテレポートされる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 17:53:48 GMT)
Quantum synchronization through the interference blockade [0.0] 3レベル(スピン-1)発振器は、利得と減衰率が等しく、外部駆動の対象となっているため、1:1位相ロックは存在しない。
ブロックされた第2スピンを介する第1スピンと第3スピンの同期を見つける。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 12:51:36 GMT)
Quantum jump photodetector for narrowband photon counting with a single atom [0.0] 本研究では,帯域幅が狭く,帯域外光子の強い拒否が可能である単一光子量子ジャンプ光検出器を実証する。
単一パス量子ジャンプ生成の記録である2.9(2)$times 10-3$の量子効率を測定する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:16:52 GMT)
Quantum energy teleportation via random bi-partitioning in N-qubit systems [0.0] 本研究は、量子エネルギーテレポーテーション(QET)を、N-$body Hamiltonian系におけるバイパーティショニングを用いて検討する。
エネルギー伝達効率と基底状態の絡み合いとの間には強い相関関係が認められた。
全体として、より多くの量子ビットはより高いエネルギー伝達効率と絡み合いをもたらし、QET性能における彼らの重要な役割を強調している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:08:33 GMT)
Quantum Rabin oblivious transfer using two pure states [0.0] 控えめな転送では、送信側Aliceはビットを保持し、受信側Bobはビットを取得するか、確率$p_?$で情報を取得する。
本稿では,2つの純状態を用いた量子ラビンオブリバスト転送プロトコルについて検討する。送信側と受信側で異なる不正シナリオを探索し,各ケースにおいて最適な不正確率を決定する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:12:44 GMT)
Qualitatively altered driven Dicke superradiance in extended systems due to infinitesimal perturbations [0.0] パラメータ化駆動によって誘導される興味深い量子相を持つディック模型は、キャビティにおいて集中的に研究されている。
我々は1次元導波管に結合した超伝導量子ビットを拡張系としてシミュレートし、4種類の摂動を理論的に検討した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:22:00 GMT)
Preventing Collapse in Contrastive Learning with Orthonormal Prototypes (CLOP) [0.0] CLOPは、クラス埋め込み間の線形部分空間の形成を促進することにより、神経崩壊を防止するために設計された、新しい半教師付き損失関数である。
CLOPは性能を向上し,学習速度やバッチサイズにまたがる安定性が向上することを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:07:23 GMT)
Pre-Ictal Seizure Prediction Using Personalized Deep Learning [0.0] 世界中で約2300万ないし30%のてんかん患者が薬剤抵抗性てんかん(DRE)を患っている
発作発生の予測不可能さは、安全上の問題や社会的懸念を引き起こし、DRE患者のライフスタイルを制限している。
本研究の目的は、開始から最大2時間前に発作を予測するための改良された技術と方法を使用することであった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:04:41 GMT)
Physics-Informed GNN for non-linear constrained optimization: PINCO a solver for the AC-optimal power flow [0.0] この研究は、AC-OPFを解くために物理インフォームドグラフニューラルネットワーク、PINCOを探索する。
PINCOは、電力系統における様々な負荷条件を効果的に一般化する。
解法としてもハイブリッド普遍関数近似器としても機能する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:08:36 GMT)
Optimizing Tensor Computation Graphs with Equality Saturation and Monte Carlo Tree Search [0.0] モンテカルロ木探索を用いて優れた表現を構築するテンソルグラフ書き換え手法を提案する。
提案手法は,既存の手法と比較して,ニューラルネットワークの推論速度を最大11%向上させる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 22:22:02 GMT)
Optimizing Parking Space Classification: Distilling Ensembles into Lightweight Classifiers [0.0] 画像に基づく駐車空間分類において,教師モデルとして機能する分類器の頑健なアンサンブルを提案する。
これらの教師モデルは、エッジデバイスに直接デプロイ可能な軽量で特殊な学生モデルに蒸留される。
その結果,教師モデルより26倍少ないパラメータを持つ学生モデルは,対象試験データセットの平均精度96.6%を達成した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:29:42 GMT)
Optimal Conversion from Classical to Quantum Randomness via Quantum Chaos [0.0] 近年提案された「深熱化」パラダイムでは、システムAのランダム量子状態は、システムBの射影測定によって生成される。
このスキームでは、投影された状態アンサンブルのランダム性は、Bの測定時の結果の固有のランダム性から生じる。
一般カオス系の場合、この変換は古典エントロピーの各ビットがBに余分な量子ビットを加えるのと同じくらい多くの量子ランダム性を生成するという点で最適であることを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:41:23 GMT)
On the negative-result experiments in quantum mechanics [0.0] 量子力学(QM)におけるいわゆる負回帰実験(ヌル測定、相互作用のない測定など)についてコメントする。
この種の全ての実験(ヌル測度)は、意図的に偏った検出器を設置し、特定の事象を排除または選択する不適切な測定として理解することができる。
ヌル測度による予測の検証は、最終的にはマイクロシステムとマクロな検出器の相互作用を含む標準の非バイアス測定を必要とする。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:16:14 GMT)
Nonadiabatic Quantum Dynamics of Molecules Scattering from Metal Surfaces [0.0] 電子と金属表面の分子運動の間の非断熱結合はエネルギー散逸を引き起こす。
金属表面から分子を散乱させる理論的なアプローチとして、すべての非断熱および量子核効果を包含する手法を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 15:54:36 GMT)
New Power Method for Solving Eigenvalue Problems [0.0] 固有値問題の解を求めるための新しいパワー手法を提案する。
この方法は、支配的あるいは最低の固有値だけでなく、デフレ手続きを必要とせずに全ての固有値を決定することができる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:51:59 GMT)
Neural machine translation system for Lezgian, Russian and Azerbaijani languages [0.0] 我々は、ロシア語、アゼルバイジャン語および絶滅危惧言語間の翻訳のための最初のニューラルマシン翻訳システムをリリースした。
複数の実験により、トレーニング言語ペアとデータドメインの異なるセットが、結果の翻訳品質にどのように影響するかを特定する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 20:08:10 GMT)
NestedMorph: Enhancing Deformable Medical Image Registration with Nested Attention Mechanisms [0.0] 変形可能な画像登録は、異なるモダリティにまたがる非線形な方法で医療画像の整列に不可欠である。
本稿では,Nested Attention Fusion を用いた新たなネットワークであるNestedMorphについて述べる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:25:03 GMT)
NestedMorph: Enhancing Deformable Medical Image Registration with Nested Attention Mechanisms [0.0] 変形可能な画像登録は、異なるモダリティにまたがる非線形な方法で医療画像の整列に不可欠である。
本稿では,Nested Attention Fusion を用いた新たなネットワークであるNestedMorphについて述べる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:25:03 GMT)
Multimodal Fusion Strategies for Mapping Biophysical Landscape Features [0.0] 本研究では,空間的に整列したオルソモザイクのデータセットを用いて,熱,RGB,LiDAR画像の融合を行う3つの手法について検討する。
我々は,アフリカのサバンナ生態系における3つの生態学的に関連のある景観の特徴,すなわちサイ,シロアリマウンド,水を地図化することを目的としている。
全体として、これらの3つの手法はマクロ平均性能を持ち、後期核融合は0.698のAUCを達成するが、クラスごとのパフォーマンスは強く異なる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:40:29 GMT)
Multi-agent reinforcement learning using echo-state network and its application to pedestrian dynamics [0.0] 本研究は, グリッドワールド環境における道路を考察し, エコー状態ネットワークと最小二乗ポリシー反復法を用いて歩行者をMARLエージェントとして実装した。
この環境下では、これらのエージェントが他のエージェントを避けて前進することを学ぶ能力について検討した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 10:28:24 GMT)
Modeling and Estimation of Vocal Tract and Glottal Source Parameters Using ARMAX-LF Model [0.0] 本稿では,ARX-LFモデルを拡張した自己回帰移動平均eXogenous with LF (ARMAX-LF)モデルを提案する。
誤差が少ない複数のパラメータを推定するために、まずディープニューラルネットワーク(DNN)の強力な非線形適合性を利用して、抽出した声門音源導関数や音声波形から対応するLFパラメータへのマッピングを構築する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 02:48:18 GMT)
Maximizing the practical achievability of quantum annealing attacks on factorization-based cryptography [0.0] 本研究は、整数分解問題と離散対数問題に基づくスキームの暗号解析のための量子的手法に焦点を当てる。
本稿では、量子計算と古典計算を組み合わせたアプローチを改善することにより、分解問題の最大の事例を現実的に解く方法を示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:55:23 GMT)
Manipulating quasi-bound states in a photonic crystal with periodic impurities to store quantum information [0.0] フォトニック結晶を表す周期的不純物を持つ一次元格子を第一原理から解析的にモデル化する。
次に、送信係数と反射係数を計算し、連続体における有界状態について検討する。
設計したシステムにより多くの不純物が存在する場合、粒子が本質的に閉じ込められる広い範囲の波数が存在することが判明した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 20:13:50 GMT)
Localization transitions in quadratic systems without quantum chaos [0.0] 擬似空間の局所化から位置空間の局所化への固有状態遷移を示す一次元アンダーソン・ワニエ・スタークモデルについて検討する。
遷移点がヤヌス型の非伝統的な性質を示すこと、すなわち、遷移点において RMT のような普遍性が現れることを示唆する測度や、それから離れる測度があることが示される。
この結果から,最大絡み合っていない二次系における容積法則固有状態絡み合エントロピーの多様性が示唆された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:29:32 GMT)
Legal Theory for Pluralistic Alignment [0.0] 法理論は、多元性と仕様という2つの関連するアライメントの問題に対処することができる。
先行する法理論は、法が規則と事件の相互作用を通じてこれらの問題を解決することを示唆している。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:16:25 GMT)
Key Expansion Based on Internet X.509 Public Key Infrastructure for Anonymous Voting [0.0] この方法により、エンドエンティティは、他のエンドエンティティ、登録権限、認証権限との匿名性を維持しつつ、エンドエンティティ証明書の妥当性を検証できる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 20:35:24 GMT)
Invariant representation learning for sequential recommendation [0.0] シークエンシャルレコメンデーションでは、履歴項目のシーケンスに基づいて、次の項目をユーザに自動的に推奨する。
Irl4Recという新しいシーケンシャルレコメンデーションフレームワークを紹介します。
このフレームワークは、不変学習を活用し、モデルトレーニング中に、スプリアス変数と調整変数の関係を要因とする新しい目的を用いる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 19:45:56 GMT)
Intent Classification for Bank Chatbots through LLM Fine-Tuning [0.0] 本研究は,多言語生成モデルを用いた場合と比較して,微調整BarberTの有効性について検討した。
以上の結果から,SarberBERTは顕微鏡内精度とスコープ外偽陽性率で他のモデルよりも優れていた。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:17:05 GMT)
Human-in-the-loop Reasoning For Traffic Sign Detection: Collaborative Approach Yolo With Video-llava [0.0] 本稿では,映像解析と推論を組み合わせる手法を提案する。
ビデオラバの誘導と推論能力により,YOLOの信号検出能力が向上する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:50:56 GMT)
How do we Observe Relational Observables? [0.0] リレーショナルオブザーバブルは実際にどのように経験と接触するのか?
私は、この質問はオブザーバのスキーマ化を提供することによってのみ答えられると論じます。
これは、時間の問題に対処するために量子参照フレームを使うことの展望にとって何を意味するかを考えます。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:27:19 GMT)
Herd Mentality in Augmentation -- Not a Good Idea! A Robust Multi-stage Approach towards Deepfake Detection [0.0] ディープフェイク技術はデジタルメディアの整合性に大きな懸念を引き起こしている。
ほとんどの標準的な画像分類器は、偽の顔と実の顔の区別に失敗した。
我々は、重み付き損失と更新拡張技術を組み合わせたGenConViTモデルに基づく拡張アーキテクチャを提案する。
このモデルでは、F1スコアが1.71%向上し、Celeb-DF v2データセットの精度が4.34%向上した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:51:46 GMT)
Grover Speedup from Many Forms of the Zeno Effect [0.0] 我々は、他のゼノ効果の現示が、物理的に現実的なモデルにおいて最適なスピードアップをサポートすることを示す。
我々はこれらのアルゴリズムを3つのファミリーに分類し、スピードアップがどのように得られるかの構造化された理解を容易にする。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 11:03:35 GMT)
Greit-HRNet: Grouped Lightweight High-Resolution Network for Human Pose Estimation [0.0] 軽量モジュールは高解像度ネットワークにおけるコストのかかるポイントワイズ畳み込みを置き換えるために提案されている。
グループ化チャネル重み付け(GCW)と空間重み付け(GSW)を含むグリットブロックを提案する。
我々は,MS-COCOとMPIIによるポーズ推定データセットの実験を行い,Greit-HRNetの優れた性能を示し,他の最先端軽量ネットワークよりも優れた性能を示した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:20:03 GMT)
Granular Ball Twin Support Vector Machine [0.0] MixtureTwinサポートベクターマシン(TSVM)における非パラメトリック可能性推定器は、分類および回帰作業に多目的に適用可能な、新興機械学習モデルである。
TSVMは、その効率性と大規模データセットの適用性に対する重大な障害に直面している。
粒状球双対支持ベクトルマシン(GBTSVM)と大型球双対支持ベクトルマシン(LS-GBTSVM)を提案する。
UCI,KEEL,NDCデータセットのベンチマークデータセットを用いて,GBTSVMおよびLS-GBTSVMモデルの総合評価を行う。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 06:20:36 GMT)
Geometric quantum complexity of bosonic oscillator systems [0.0] 適当な作用素空間の幾何学的実現における最小測地線の長さは、演算の量子複雑性の測度を与える。
複雑性に関する新たな洞察は、高次元への体系的な拡張や相互作用の可能性とともに、低次元の設定で見ることができる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 22:24:26 GMT)
Geometric Phases in Optics: Polarization of Light Propagating in Helical Optical Fibers [0.0] 光光学(GPIO)の幾何学的位相は光の偏光に直接関連している。
単モード光ファイバーを円形のヘリックス形状に巻いて伝搬する単モード光ビームの発生の背景となる物理原理について検討した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:46:44 GMT)
Generating QES potentials supporting zero energy normalizable states for an extended class of truncated Calogero Sutherland model [0.0] 準現実解(QES)ポテンシャル系に対する正則ゼロエネルギー正規化解の存在の証拠を示す。
ケースは結合パラメータを制限することで適切に扱われる。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 07:20:55 GMT)
Generalization of Modular Spread Complexity for Non-Hermitian Density Matrices [0.0] この研究において、モジュラー拡散複雑性の概念を、還元密度行列が非エルミート的である場合に一般化する。
エンタングルメントの容量を一般化する擬似容量を定義し、擬似モジュラー複雑性の初期モジュラー時間尺度に対応する。
2レベル系と4-量子ビット系の解析計算を行い、その後、横場イジングモデルの量子相転移に関する数値的な研究を行う。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:59:16 GMT)
GRU-D Characterizes Age-Specific Temporal Missingness in MIMIC-IV [0.0] 高齢者と若年者の二分分類において,GRU-Dと呼ばれる崩壊機構を持つゲートリカレントユニットを訓練した。
その結果, 血圧低下と呼吸速度低下の差は, パラメータ化された隠れゲートユニットによって学習された重要な予測因子であることがわかった。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:07:16 GMT)
Function Gradient Approximation with Random Shallow ReLU Networks with Control Applications [0.0] ニューラルネットワークは、制御における未知の関数を近似するために広く使われている。
いくつかのアプリケーション、特に連続時間値関数近似は、ネットワークが未知の関数とその勾配の両方を十分な精度で近似することを要求する。
我々は、ランダムに生成された入力パラメータとトレーニングされた出力パラメータが$O(log(m)/m)1/2の誤差の勾配をもたらし、さらに、以前の作業から定数を改善することを示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 14:26:49 GMT)
Floquet engineering of quantum thermal machines: A gradient-based spectral method to optimize their performance [0.0] 量子サーマルエンジン (QTM) の最適条件を求める手法について述べ, 実演した。
QTMは、開量子系の周期的に駆動される非平衡定常状態としてモデル化される。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 11:11:51 GMT)
FlashHack: Reflections on the Usage of a Micro Hackathon as an Assessment Tool in a Machine Learning Course [0.0] グループプロジェクトベースの学習は、CS教育において経験的学習として人気が高まっている。
これらの問題に対処するために、私たちはFlashHackを紹介した。
本結果は,教員の簡易な評価プロセスとともに,学生のエンゲージメントと満足度の向上を示唆するものである。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 11:21:11 GMT)
Fast, Accurate, and Local Temperature Control Using Qubits [0.0] 量子ビットを用いた高速で高精度で局所的な温度制御を提案する。
サブケルビン温度の量子系がナノ秒の時間スケールで著しく正確に冷却されることを示す。
我々の提案は超伝導束量子ビット、電荷量子ビット、スピン量子ビットで実現することができる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 07:16:27 GMT)
Exponentially Reduced Circuit Depths Using Trotter Error Mitigation [0.0] リチャードソンと外挿はこれらの公式を用いて引き起こされるトロッター誤差を軽減するために提案されている。
この研究は、時間発展予測値を計算するためのこれらの技術の改良的で厳密な分析を提供する。
誤差$epsilon$を達成するには、$ptextth$-order product formula with expolation, circuits of depths $Oleft(T1+1/p textrmpolylog (1/epsilon)right)$は十分である。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:39:58 GMT)
Exchange-Only Spin-Orbit Qubits in Silicon and Germanium [0.0] 本稿では、スピン軌道相互作用を利用して量子ゲートを実装する交換のみのスピン軌道量子ビットを提案する。
我々の符号化は、ホールスピン特性における大きな局所的変動に対して堅牢である。
複雑なマルチステップシーケンスを必要とする現在の交換専用キュービットとは異なり、我々のキュービット設計は低遅延2キュービットゲートを1ステップで実現している。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:46:59 GMT)
Error Bounds of Supervised Classification from Information-Theoretic Perspective [0.0] 我々は、情報理論の観点から、教師付き分類にディープニューラルネットワークを使用する場合の予測リスクのバウンダリについて検討する。
経験的リスクをさらに分解したモデルリスクとフィッティングエラーを導入する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 05:07:07 GMT)
Entanglement, information and non-equilibrium phase transitions in long-range open quantum Ising chains [0.0] 開量子系の非平衡相転移は古典的だが量子相関は変化しない。
我々はこれらの量について、パワー-ロー相互作用を持つ開量子イジング鎖の定常状態において研究する。
対数ネガティビティ、量子フィッシャー情報、スピンスクイーズという3つの異なる絡み合いを考察する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:00:00 GMT)
Entanglement harvesting in buckled honeycomb lattices by vacuum fluctuations in a microcavity [0.0] 平面マイクロキャビティ内に設置した2つの同一折り畳みハニカム格子間の絡み合いについて検討した。
空洞場の初期状態として真空状態を考慮すると,コンカレンス測定を用いて絡み合いの形成を解析する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:57:00 GMT)
Effective particles in a multishell nanostructure with hardcore [0.0] 多殻ヘテロ構造における位置依存質量を持つインジウム有効担体を解析的に研究した。
複数のvon Roos順序クラスに対する3次元有界固有状態の正確なスペクトルと散乱波動関数を得る。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:48:12 GMT)
Effective light-induced Hamiltonian for atoms with large nuclear spin [0.0] 外部共鳴光との結合は、核スピン状態の選択的かつコヒーレントに操作するための重要なツールである。
このような非共鳴光による超低温フェルミオン原子の核スピン状態に対する有効ハミルトニアンの体系的導出を示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 15:38:01 GMT)
Double-Logarithmic Depth Block-Encodings of Simple Finite Difference Method's Matrices [0.0] 微分方程式の解法は、古典計算において最も計算コストがかかる問題の1つである。
量子コンピューティングと量子アルゴリズムの分野で最近の進歩にもかかわらず、実用的実現に向けたエンドツーエンドの応用はいまだに達成不可能である。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:44:30 GMT)
Deep learning-based Visual Measurement Extraction within an Adaptive Digital Twin Framework from Limited Data Using Transfer Learning [0.0] Digital Twinsの技術は、モデルとシミュレーションをリアルタイムデータに統合することによって、科学的研究における意思決定に革命をもたらしている。
本研究は,人工知能を用いた新しいアプローチを提案する。
畳み込みニューラルネットワークを用いて、デジタル画像相関スペックルパターン画像と変形場とを関連づけることで、リアルタイムで構造挙動を解析する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:10:12 GMT)
Deep Learning Methods for S Shaped Utility Maximisation with a Random Reference Point [0.0] 深層学習法と双対解法を用いて問題を解くための数値解法を開発した。
深層学習法を用いて、原始問題と双対問題の両方に対して関連するハミルトン・ヤコビ・ベルマン方程式を解く。
完全市場と不完全市場の両方において、この非凹凸問題の解を、ベンチマークに依存するランダム関数である定式化ユーティリティの解と比較する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 22:07:59 GMT)
Deep Fusion: Capturing Dependencies in Contrastive Learning via Transformer Projection Heads [0.0] Contrastive Learning (CL) は、ラベルのないデータを用いて特徴抽出モデルを訓練するための強力な方法として登場した。
近年の研究では、線形投射ヘッドポストバックボーンの導入により、モデル性能が著しく向上することが示唆されている。
コントラスト学習におけるプロジェクションヘッドの役割にトランスフォーマーの新たな応用を導入する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:25:02 GMT)
D-PoSE: Depth as an Intermediate Representation for 3D Human Pose and Shape Estimation [0.0] D-PoSEは1枚のRGB画像から人間のポーズとSMPL-X形状パラメータを推定する1段階の手法である。
実世界のベンチマークデータセットEMDBと3DPWで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 10:17:46 GMT)
Convergence rate of Tsallis entropic regularized optimal transport [0.0] 我々は、正規化パラメータがゼロになる傾向にあるモンゲ-カントロヴィッチ問題への最適輸送を Tsallis 正規化した Tsallis の $Gamma$-convergence のような基本的な結果を確立する。
我々は, KL 正規化が Tsallis フレームワークで最速収束率を達成することを示す。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 18:06:53 GMT)
Controlled Gates in the Clifford Hierarchy [0.0] クビットクリフォード階層における任意の制御ゲートによって満たされなければならない条件の集合を証明する。
我々は証明をある種のユニタリの直和からなるゲートに拡張する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:02:01 GMT)
Computational design of target-specific linear peptide binders with TransformerBeta [0.0] 安定な二次構造(ベータシート)内にペプチド対の大規模なライブラリを構築する。
そこで我々は、特定の線形バインダーの設計のためのTransformerアーキテクチャに基づく機械学習手法を開発した。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:52:54 GMT)
Compact quantum algorithms for time-dependent differential equations [0.0] 我々は、ユニタリの線形結合に基づくアイデアに基づいて、非ユニタリで非エルミート量子系をシミュレートする。
我々は,反復行列ベクトル乗算と行列逆演算を効率的に行うハイブリッド量子古典アルゴリズムを生成する。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 16:01:16 GMT)
Combining Structural and Unstructured Data: A Topic-based Finite Mixture Model for Insurance Claim Prediction [0.0] 本稿では,クレーム記述とクレーム量を統合した混合モデルを提案する。
本手法は,テキスト記述と損失量との確率的リンクを確立し,クレームクラスタリングと予測の精度を高める。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 01:37:07 GMT)
ColorwAI: Generative Colorways of Textiles through GAN and Diffusion Disentanglement [0.0] StyleGAN と Diffusion のカラーアンタングルを用いた「世代別カラーウェイ」の創出が提案されている。
StyleGANのW空間は、人間の色の概念と最もよく一致している。
そこで本研究では,色道創出のための創造システムを考案し,専門家のアンケートや創造理論を通じて評価することを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:22:36 GMT)
Classification of symmetry protected states of quantum spin chains for continuous symmetry groups [0.0] 有限オンサイト対称性群 $G$ に対応する SPT は、第二コホモロジー群 $H2(G,U(1))$ によって分類されることを示す。
我々はまた、我々の分類結果が局所的に有界なオンサイト次元を持つスピン鎖のクラスに収まるという意味で、既存の結果を強化する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 08:27:13 GMT)
Catalysis in Quantum Information Theory [0.0] 触媒は触媒を使わずに化学反応を速める新しい反応経路を開く。
同様の現象が量子情報科学で発見されており、量子自由度を利用して物理変換が可能である。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 08:04:03 GMT)
CBF-LLM: Safe Control for LLM Alignment [0.0] 本稿では,制御障壁関数(CBF)を利用した大規模言語モデル(LLM)の整合化のための制御ベースフレームワークを提案する。
提案フレームワークは、CBFに基づいて設計された安全フィルタを、生成されたテキストに介入することを目的としたベースラインLLMの出力生成に適用する。
この実験は、ユーザ特定アライメントタスクに必要な介入回数を減らすための制御能力と有効性を示す。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:49:08 GMT)
Block MedCare: Advancing healthcare through blockchain integration [0.0] 本稿では、医療におけるブロックチェーン技術の統合について検討する。
電子健康記録(EHR)の管理とデータ共有に革命をもたらす可能性に焦点を当てている。
本稿では,患者が医療データを安全に保存し,管理できるようにするための新しいシステムを提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 17:54:13 GMT)
BEADS: A Canonical Visualization of Quantum States for Applications in Quantum Information Processing [0.0] BEADS表現により、任意の量子状態を直感的で分かりやすい方法で視覚化することができる。
量子力学現象の非常に抽象的な数学的記述と、それらを非特殊主義者に伝達する使命のギャップを埋める。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:00:40 GMT)
BEADS: A Canonical Visualization of Quantum States for Applications in Quantum Information Processing [0.0] BEADS表現と呼ばれる量子ビット系の一般化位相空間表現を導入する。
これにより、任意の量子状態を直感的で分かりやすい方法で視覚化することができる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:00:40 GMT)
Assumption-Lean Post-Integrated Inference with Negative Control Outcomes [0.0] 負の制御結果を用いて遅延不均一性を調整する頑健なポストインテグレート推論(PII)手法を提案する。
我々の仮定リーン半推論手法は、仲介者、共同設立者、モデレーターを考慮に入れた予測された直接効果推定に頑健さと一般性を広げる。
提案した二重頑健な推定器は最小限の仮定の下で一貫性があり、機械学習アルゴリズムによるデータ適応推定を容易にする。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 12:52:38 GMT)
Art Forgery Detection using Kolmogorov Arnold and Convolutional Neural Networks [0.0] AIの改善を活用して、アート認証フレームワークを提示します。
我々は、伝統的なAI手法のアプローチを反転させながら、アーティストではなく、フォーガーの専門モデルに焦点を当てます。
我々はその結果をKAN(Kolmogorov Arnold Networks)と比較した。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:32:11 GMT)
Analyzing the quantum approximate optimization algorithm: ansätze, symmetries, and Lie algebras [0.0] 連結グラフ上の最大カット(最大カット)問題に対する3つの QAOA ans" の根底となる代数的性質について検討する。
任意の連結グラフに対して、多角アンザッツのリー代数を完全に特徴づけることができる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:46:20 GMT)
AQMLator -- An Auto Quantum Machine Learning E-Platform [0.0] AQMLatorは、ユーザからの最小限の入力で、MLモデルの量子層を自動的に提案し、トレーニングすることを目的としている。
標準のMLライブラリを使用するため、既存のMLパイプラインを簡単に導入できる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:20:59 GMT)
AQMLator -- An Auto Quantum Machine Learning E-Platform [0.0] AQMLatorは、ユーザからの最小限の入力で、MLモデルの量子層を自動的に提案し、トレーニングすることを目的としている。
標準のMLライブラリを使用するため、既存のMLパイプラインを簡単に導入できる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:20:59 GMT)
AQMLator -- An Auto Quantum Machine Learning E-Platform [0.0] AQMLatorは、ユーザからの最小限の入力で、MLモデルの量子層を自動的に提案し、トレーニングすることを目的としている。
標準のMLライブラリを使用するため、既存のMLパイプラインを簡単に導入できる。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 09:20:59 GMT)
A3: Active Adversarial Alignment for Source-Free Domain Adaptation [0.0] Unsupervised domain adapt (UDA) は、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送することを目的としている。
最近の研究は、ターゲットデータのみが利用可能な、ソースフリーのUDAに焦点を当てている。
本研究では, 自己教師型学習, 対人訓練, アクティブラーニングを組み合わせた, 頑健なソースレスUDAのための新しいフレームワークであるActive Adversarial Alignment (A3)を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:13:07 GMT)
A3: Active Adversarial Alignment for Source-Free Domain Adaptation [0.0] Unsupervised domain adapt (UDA) は、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送することを目的としている。
最近の研究は、ターゲットデータのみが利用可能な、ソースフリーのUDAに焦点を当てている。
本研究では, 自己教師型学習, 対人訓練, アクティブラーニングを組み合わせた, 頑健なソースレスUDAのための新しいフレームワークであるActive Adversarial Alignment (A3)を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 18:13:07 GMT)
A note on the non-planar corrections for the Page curve in the PSSY model via the IOP matrix model correspondence [0.0] 我々は,PSSYモデルとIOP行列モデルとの対応性を開発する。
この対応を応用して、PSSYモデルにおける交差を含む特定の非平面図を仮定する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 01:19:28 GMT)
A Unified Theory of Quantum Neural Network Loss Landscapes [0.0] 量子ニューラルネットワーク(QNN)はランダムにガウス過程として振る舞うことが知られている。
QNNとその最初の2つの導関数が一般に「ウィッシュアートプロセス」と呼ばれるものを形成することを示す。
我々の統合フレームワークは、与えられたQNNモデルの「トレーニング可能性」に対して、ある種の単純な運用定義を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:58:50 GMT)
A Unified Theory of Quantum Neural Network Loss Landscapes [0.0] 量子ニューラルネットワーク(QNN)はランダムにガウス過程として振る舞うことが知られている。
QNNとその最初の2つの導関数が一般に「ウィッシュアートプロセス」と呼ばれるものを形成することを示す。
我々の統合フレームワークは、与えられたQNNモデルの「トレーニング可能性」に対して、ある種の単純な運用定義を提案する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:58:50 GMT)
A Strategy for Label Alignment in Deep Neural Networks [0.0] 本研究では,ディープニューラルネットワークに適したラベルアライメントを利用した適応アルゴリズムの代替式を導出する。
また,本手法は,より安定な収束性を持ちながら,主流の教師なしドメイン適応法に匹敵する性能を発揮することを示す実験を行った。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 03:23:23 GMT)
A Russian Jeopardy! Data Set for Question-Answering Systems [0.0] ロシアの公式クイズデータベースChgk(che ge ka)から収集した、Jeopardy!のようなロシアのQAデータセットについて述べる。
データセットには379,284のクイズのような質問が含まれており、ロシア語のJeopardyのアナログである"Own Game"から29,375の質問が寄せられている。
論文参考訳(メタデータ) (Mon, 07 Oct 2024 14:26:18 GMT)
A Recurrent Neural Network Approach to the Answering Machine Detection Problem [0.0] 本稿では,YAMNetモデルによる伝達学習を利用した特徴抽出手法を提案する。
その結果, 精度が96%以上であることが確認された。さらに, 誤分類標本の詳細な分析を行い, 98%を超える精度が得られることを明らかにした。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 21:28:09 GMT)
A Predictive and Optimization Approach for Enhanced Urban Mobility Using Spatiotemporal Data [0.0] 本研究では,機械学習アルゴリズムと実交通情報を組み合わせた都市移動性向上手法を提案する。
ニューヨーク市の黄色いタクシー旅行のデータを用いて,旅行時間と渋滞解析の予測モデルを構築した。
本研究は、高度データ駆動方式による都市渋滞の低減と交通効率の向上を目的とした継続的な取り組みに寄与する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 16:16:49 GMT)
A Novel Mathematical Framework for Objective Characterization of Ideas through Vector Embeddings in LLM [0.0] 本研究では,CAIシステムや人間によって生み出されるアイデアの多元性を客観的に評価するための,自動解析のための包括的数学的枠組みを提案する。
UMAP,DBSCAN,PCAなどのツールを用いて,アイデアを高次元ベクトルに変換し,それらの多様性を定量的に測定することにより,提案手法は最も有望なアイデアを選択する信頼性と客観的な方法を提供する。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 11:04:31 GMT)
A Deep Learning-Based Approach for Mangrove Monitoring [0.0] 本研究は,マングローブセグメンテーションの課題における最近のディープラーニングモデルの包括的評価を提供する。
我々はまず,Global Mangrove WatchのmangroveアノテーションとSentinel-2の衛星画像を組み合わせた,オープンソースの新しいデータセットMagSet-2を紹介し,公開する。
次に、生成されたデータセットを使用して、3つのアーキテクチャグループ、すなわち畳み込み、トランスフォーマー、mambaモデルをベンチマークします。
論文参考訳(メタデータ) (Mon, 7 Oct 2024 19:22:08 GMT)