Towards Semantic Equivalence of Tokenization in Multimodal LLM [149.1] 視覚トークン化は、視覚と言語間のセマンティックアライメントに不可欠である。
本稿では,新しい動的セマンティック等価ビジョントケナイザ(SeTok)を提案する。
SeTokは動的クラスタリングアルゴリズムを通じて、視覚的特徴をセマンティックユニットにグループ化する。
結果として得られる視覚トークンは意味的整合性を効果的に保持し、低周波と高周波の両方の視覚特徴をキャプチャする。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:01:24 GMT)
Data Selection via Optimal Control for Language Models [134.7] 本研究は,大規模コーパスから高品質な事前学習データを選択することにより,下流利用におけるLMの能力を向上させることを目的とする。
PMP条件を解くことで最適なデータ選択を近似するフレームワークであるPMPベースのデータ選択(PDS)を導入する。
PDSの利点は、スケーリング法則に従ってテスト損失曲線の外挿によって証明されたように、10Tトークンでトレーニングされた400Bモデルにまで拡張される。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:06:57 GMT)
Less is More: High-value Data Selection for Visual Instruction Tuning [127.4] 本稿では,視覚的命令データの冗長性を排除し,トレーニングコストを削減するために,高価値なデータ選択手法TIVEを提案する。
約15%のデータしか使用していない我々のアプローチは、8つのベンチマークで全データ微調整モデルに匹敵する平均性能を実現することができる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:51:45 GMT)
Observation of disorder-free localization and efficient disorder averaging on a quantum processor [117.3] 我々は、量子並列性を利用して、量子プロセッサ上で効率的な手順を実装し、すべての障害実現を効率的にサンプリングする。
1次元と2次元の量子多体ダイナミクスにおいて、乱れのない局所化を観察する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 05:28:14 GMT)
GenSim: A General Social Simulation Platform with Large Language Model based Agents [111.0] 我々はtextitGenSim と呼ばれる新しい大規模言語モデル (LLM) ベースのシミュレーションプラットフォームを提案する。
我々のプラットフォームは10万のエージェントをサポートし、現実世界のコンテキストで大規模人口をシミュレートする。
我々の知る限り、GenSimは汎用的で大規模で修正可能な社会シミュレーションプラットフォームに向けた最初の一歩である。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:03:48 GMT)
GenSim: A General Social Simulation Platform with Large Language Model based Agents [110.4] 我々はtextitGenSim と呼ばれる新しい大規模言語モデル (LLM) ベースのシミュレーションプラットフォームを提案する。
我々のプラットフォームは10万のエージェントをサポートし、現実世界のコンテキストで大規模人口をシミュレートする。
我々の知る限り、GenSimは汎用的で大規模で修正可能な社会シミュレーションプラットフォームに向けた最初の一歩である。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:03:48 GMT)
MotionRL: Align Text-to-Motion Generation to Human Preferences with Multi-Reward Reinforcement Learning [99.1] 我々は、テキスト・ツー・モーション生成タスクを最適化するために、Multi-Reward Reinforcement Learning(RL)を利用する最初のアプローチであるMotionRLを紹介する。
我々の新しいアプローチは、人間の知覚モデルに関する知識以前の人間の嗜好に基づいて、強化学習を用いて運動生成体を微調整する。
さらに、MotionRLは、テキストのアテンデンス、モーションクオリティ、人間の好みの最適性を近似する、新しい多目的最適化戦略を導入している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:27:14 GMT)
Self-Boosting Large Language Models with Synthetic Preference Data [97.9] モデルアライメントのための合成選好データを活用する自己ブースティングパラダイムであるSynPOを紹介する。
4回のSynPOイテレーションの後、Llama3-8BとMistral-7Bは命令追従能力を大幅に強化した。
SynPO は様々なタスクにおける LLM の一般的な性能を改善し、よく認識された Open LLM のリーダーボード上で平均スコアが 3.2 から 5.0 に向上した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:57:31 GMT)
Localizing Factual Inconsistencies in Attributable Text Generation [92.0] 本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
まず,人間のアノテーションに対するQASemConsistency法の有効性を示す。
そこで我々は,局所的な事実の不整合を自動的に検出するいくつかの手法を実装した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 22:53:48 GMT)
AutoHallusion: Automatic Generation of Hallucination Benchmarks for Vision-Language Models [91.8] 視覚言語モデル(LVLM)は幻覚の傾向が強い。
ベンチマークは多くの場合、障害パターンが一般化できない手作りのコーナーケースに依存します。
最初の自動ベンチマーク生成手法であるAutoHallusionを開発した。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:42:22 GMT)
CoCA: Regaining Safety-awareness of Multimodal Large Language Models with Constitutional Calibration [90.4] マルチモーダルな大言語モデル (MLLM) は、視覚的な入力を含む会話への関与において顕著な成功を収めている。
視覚的モダリティの統合は、MLLMが悪意のある視覚的入力に影響を受けやすいという、ユニークな脆弱性を導入している。
本稿では,出力分布を校正することでMLLMの安全性を向上するCoCA技術を紹介する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:39:28 GMT)
SparseGrad: A Selective Method for Efficient Fine-tuning of MLP Layers [88.7] 本稿では,パラメータブロックでよく動作する選択型PEFT法,すなわちSparseGradを提案する。
SparseGrad を NLU タスクに BERT と RoBERTa を,質問応答タスクに LLaMa-2 を適用した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 19:03:52 GMT)
Self-Exploring Language Models: Active Preference Elicitation for Online Alignment [88.6] 本研究では, 分布域外領域を積極的に探索するために, 潜在的に高次応答に対して楽観的に偏りを呈する2段階的客観性を提案する。
実験の結果,Zephyr-7B-SFTとLlama-3-8B-Instructモデルで微調整した場合,SELMは命令追従ベンチマークの性能を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 19:49:05 GMT)
LLM Self-Correction with DeCRIM: Decompose, Critique, and Refine for Enhanced Following of Instructions with Multiple Constraints [86.6] 実世界のマルチ制約命令に従うLLMの能力を評価するために設計された最初のベンチマークであるRealInstructを紹介する。
オープンソースモデルとプロプライエタリモデルのパフォーマンスギャップを解決するため,Decompose, Critique and Refine(DeCRIM)自己補正パイプラインを提案する。
この結果から,DeCRIMはフィードバックが弱い場合でも,RealInstructでは7.3%,IFEvalでは8.0%,Mistralでは7.3%向上した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:25:10 GMT)
Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate [85.3] 複数のエージェントが"tit for tat"の状態で議論を表現するマルチエージェント議論(MAD)フレームワークを提案し、審査員が議論プロセスを管理して最終解を得る。
我々のフレームワークは、深い熟考を必要とするタスクに役立ちそうなLSMにおける散発的思考を奨励する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 02:41:21 GMT)
Embodied Agent Interface: Benchmarking LLMs for Embodied Decision Making [85.2] 我々は,大規模言語モデル(LLM)を具体的意思決定のために評価することを目指している。
既存の評価は最終的な成功率にのみ依存する傾向がある。
本稿では,様々なタスクの形式化を支援する汎用インタフェース (Embodied Agent Interface) を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:59:00 GMT)
Glider: Global and Local Instruction-Driven Expert Router [83.8] モデルMoErging」手法は、保持タスクのパフォーマンスを犠牲にして、未確認タスクへの一般化を優先する。
マルチスケールルーティング機構を統合したGLIDER(Global and Local Instruction Driven Expert Router)を提案する。
GLIDERは、ホールドアウトタスクの強い一般化を維持しながら、ホールドイン性能を大幅に改善する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:59:14 GMT)
Probabilistic Conformal Prediction with Approximate Conditional Validity [81.3] 本研究では,共形手法の柔軟性と条件分布の推定を組み合わせ,予測セットを生成する手法を開発した。
我々の手法は、条件付きカバレッジの観点から既存の手法よりも一貫して優れています。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 09:28:33 GMT)
Needle In A Multimodal Haystack [79.8] 本稿では,従来のMLLMの長大なマルチモーダル文書の理解能力を評価するために設計された,最初のベンチマークを示す。
我々のベンチマークには、マルチモーダル検索、カウント、推論の3種類の評価タスクが含まれている。
既存のモデルには、これらのタスク、特に視覚中心の評価において、改善の余地がまだ残っていることを観察する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 07:46:02 GMT)
Limits of Transformer Language Models on Learning to Compose Algorithms [77.2] 我々は,複数のサブタスクの合成を学習するために必要な4つのタスクにおいて,LLaMAモデルのトレーニングと GPT-4 と Gemini の促進効果を評価する。
その結果,現在最先端のTransformer言語モデルにおける構成学習は,非常に非効率なサンプルであることが示唆された。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:43:34 GMT)
Learning Deep Tree-based Retriever for Efficient Recommendation: Theory and Method [76.3] 効率的なレコメンデーションのために,Deep Tree-based Retriever (DTR)を提案する。
DTRは、トレーニングタスクを、同じレベルでツリーノード上のソフトマックスベースのマルチクラス分類としてフレーム化している。
非リーフノードのラベル付けによって引き起こされる準最適性を緩和するため、損失関数の補正法を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 08:50:06 GMT)
Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization [75.1] 本稿では,BMC という名前のペアデータにおけるブリッジ・アンド・モデリングの効果的なフレームワークを提案する。
目的の修正によって、ペアの選好信号の一貫性と情報性が向上する。
DPOだけではこれらの相関をモデル化し、ニュアンス付き変動を捉えるには不十分である。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:21:47 GMT)
Efficient Distribution Matching of Representations via Noise-Injected Deep InfoMax [73.0] 我々はDeep InfoMax(DIM)を拡張し、学習した表現を選択された事前分布に自動マッチングできるようにする。
このような修正により、一様かつ通常に分散した表現を学習できることを示す。
その結果,下流作業における性能とDMの品質の中間的なトレードオフが示唆された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:40:04 GMT)
Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think [72.5] 生成のための大規模拡散モデルの訓練における主要なボトルネックは、これらの表現を効果的に学習することにある。
本稿では,RePresentation Alignment (REPA) と呼ばれる単純な正規化を導入し,ノイズの多い入力隠れ状態の投影を,外部の事前学習された視覚エンコーダから得られるクリーンな画像表現と整合させる手法を提案する。
我々の単純な戦略は、一般的な拡散やDiTsやSiTsといったフローベースのトランスフォーマーに適用した場合、トレーニング効率と生成品質の両方に大きな改善をもたらす。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:34:53 GMT)
MM-Ego: Towards Building Egocentric Multimodal LLMs [72.5] 本研究の目的は,エゴセントリックな映像理解のためのマルチモーダル基盤モデルの構築である。
我々は,人間による注釈付きデータに基づいて,30秒から1時間に及ぶエゴセントリックビデオの高品質なQAサンプルを効率よく生成するデータエンジンを開発した。
我々は、629の動画と7,026の質問でエゴセントリックなQAベンチマークを作成し、様々な長さのビデオで視覚的詳細を認識・記憶するモデルの能力を評価する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:59:59 GMT)
IterComp: Iterative Composition-Aware Feedback Learning from Model Gallery for Text-to-Image Generation [70.9] IterCompは、複数のモデルから合成対応モデルの好みを集約する新しいフレームワークである。
クローズドループ方式で構成性を向上する反復的フィードバック学習法を提案する。
IterCompは、拡散モデルと合成生成のための報酬フィードバック学習の新たな研究の道を開く。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:59:13 GMT)
Towards Self-Improvement of LLMs via MCTS: Leveraging Stepwise Knowledge with Curriculum Preference Learning [70.2] モンテカルロ木探索 (MCTS) はLLMの推論能力を高める強力な手法として登場した。
既存の蒸留法はMCTSによって生成された豊富な軌跡情報を利用する。
提案するAlphaLLM-CPLは, LLMがMCTSの挙動蒸留により自己改善できる新しいペアワイズトレーニングフレームワークである。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:20:02 GMT)
Towards Natural Image Matting in the Wild via Real-Scenario Prior [70.0] 我々は,COCOデータセット,すなわちCOCO-Mattingに基づく新しいマッチングデータセットを提案する。
構築されたCOCO-Mattingは、複雑な自然シナリオにおける38,251人のインスタンスレベルのアルファマットの広範なコレクションを含む。
ネットワークアーキテクチャにおいて、提案する特徴整合変換器は、きめ細かいエッジと透過性を抽出することを学ぶ。
提案したマットアライメントデコーダは、マット固有のオブジェクトを分割し、粗いマスクを高精度なマットに変換することを目的としている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:43:19 GMT)
Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training [69.5] ジェネラリストの具体化エージェントを学ぶことは、主にアクションラベル付きロボットデータセットの不足に起因して、課題を提起する。
これらの課題に対処するための新しい枠組みを導入し、人間のビデオにおける生成前トレーニングと、少数のアクションラベル付きロボットビデオのポリシー微調整を組み合わせるために、統一された離散拡散を利用する。
提案手法は, 従来の最先端手法と比較して, 高忠実度な今後の計画ビデオを生成し, 細調整されたポリシーを強化する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:25:34 GMT)
Stuffed Mamba: State Collapse and State Capacity of RNN-Based Long-Context Modeling [69.4] 本研究では,RNNの長期的文脈処理能力の低下の原因について検討し,重要な緩和策を提案する。
まず,訓練中に遭遇しないシーケンス長の大幅な性能劣化を引き起こす*状態崩壊*(SC)について検討する。
我々は,言語モデルとパスキー検索における逐次状態キャパシティを実証的に推定するために,長い文書上に一連のマンバ2モデルを訓練する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:54:28 GMT)
Utilize the Flow before Stepping into the Same River Twice: Certainty Represented Knowledge Flow for Refusal-Aware Instruction Tuning [68.6] リファレンス・アウェア・インストラクション・コンストラクション(CRaFT)のための確実性表現型知識フローについて紹介する。
CRaFTは、応答の確実性を取り入れて、データを選択的にフィルタリングし、修正し、静的な競合を減らす。
オープンエンド質問応答と複数選択質問課題について広範な実験を行った。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:12:51 GMT)
HERM: Benchmarking and Enhancing Multimodal LLMs for Human-Centric Understanding [68.4] 本稿では,MLLMの人間中心理解能力を評価するベンチマークであるHERM-Benchを紹介する。
我々の研究は、複雑な人間中心のシナリオを理解する上で、既存のMLLMの限界を明らかにする。
我々は、MLLMのトレーニングを強化することを目的とした、多レベルな人間中心アノテーションを備えた包括的なデータセットHERM-100Kを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:14:07 GMT)
The BRAVO Semantic Segmentation Challenge Results in UNCV2024 [68.2] 我々は,(1)モデルが様々な摂動にさらされたときの精度とキャリブレーションを反映したセマンティック信頼性,(2)トレーニング中に未知のオブジェクトクラスを検出する能力を測定するOOD信頼性の2つのカテゴリを定義した。
その結果、大規模事前学習と最小限のアーキテクチャ設計が、堅牢で信頼性の高いセマンティックセグメンテーションモデルを開発する上で重要であるという興味深い洞察が浮かび上がっている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:09:47 GMT)
Evaluating the Quality of Hallucination Benchmarks for Large Vision-Language Models [67.9] LVLM(Large Vision-Language Models)は幻覚に悩まされている。
以前の研究では、さまざまなタイプのタスクと評価指標を特徴とする一連のベンチマークが提案されている。
本稿では,既存の幻覚ベンチマークの信頼性と妥当性を評価するために,幻覚ベンチマーク品質測定フレームワーク(HQM)を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:43:47 GMT)
Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.5] 判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。
既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。
データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:26:39 GMT)
Boosting the Performance of Decentralized Federated Learning via Catalyst Acceleration [66.4] 本稿では,Catalytics Accelerationを導入し,DFedCataと呼ばれる促進型分散フェデレート学習アルゴリズムを提案する。
DFedCataは、パラメータの不整合に対処するMoreauエンベロープ関数と、アグリゲーションフェーズを加速するNesterovの外挿ステップの2つの主要コンポーネントで構成されている。
実験により, CIFAR10/100における収束速度と一般化性能の両面において, 提案アルゴリズムの利点を実証した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:17:16 GMT)
AdaRC: Mitigating Graph Structure Shifts during Test-Time [66.4] テスト時間適応(TTA)は、ソースドメインに再アクセスすることなく、トレーニング済みのモデルをターゲットドメインに適応できる能力によって注目を集めている。
AdaRCは,グラフの構造シフトに効果的かつ効率的な適応を意図した,革新的なフレームワークである。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:15:40 GMT)
Causal Representation Learning in Temporal Data via Single-Parent Decoding [66.3] 科学的研究はしばしば、システム内の高レベル変数の根底にある因果構造を理解しようとする。
科学者は通常、地理的に分布した温度測定などの低レベルの測定を収集する。
そこで本研究では,単一親の復号化による因果発見法を提案し,その上で下位の潜伏者と因果グラフを同時に学習する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:57:50 GMT)
An undetectable watermark for generative image models [65.3] 生成画像モデルに対する検出不能な最初の透かし方式を提案する。
特に、検出不能な透かしは、効率的に計算可能なメートル法で画質を劣化させることはない。
提案手法は,擬似乱数誤り訂正符号を用いて拡散モデルの初期潜時間を選択する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:33:06 GMT)
TextLap: Customizing Language Models for Text-to-Layout Planning [65.0] メソッドをTextLap(テキストベースのレイアウト計画)と呼びます。
キュレートされた命令ベースのレイアウト計画データセット(InsLap)を使用して、グラフィックデザイナとしてLarge Language Model(LLM)をカスタマイズする。
我々はTextLapの有効性を実証し、画像生成やグラフィカルデザインベンチマークのためのGPT-4ベースの手法を含む強力なベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 19:51:38 GMT)
MoE++: Accelerating Mixture-of-Experts Methods with Zero-Computation Experts [63.7] MoE++は、Feed-Forward Network(FFN)とゼロ計算の専門家を統合した、汎用的で異種なMoEフレームワークである。
MoE++は、1.1-2.1xのエキスパートの前方スループットを同じサイズのバニラのMoEモデルと比較すると、パフォーマンスが向上する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:01:27 GMT)
MovieDreamer: Hierarchical Generation for Coherent Long Visual Sequence [62.7] MovieDreamerは、自己回帰モデルの強みと拡散ベースのレンダリングを統合する、新しい階層的なフレームワークである。
様々な映画ジャンルにまたがって実験を行い、そのアプローチが優れた視覚的・物語的品質を実現することを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:08:05 GMT)
Gaitor: Learning a Unified Representation Across Gaits for Real-World Quadruped Locomotion [61.0] 本稿では,移動歩行における乱れと2次元表現を学習するGaitorについて紹介する。
ゲイターの潜伏空間は容易に解釈可能であり、歩行遷移の間、新しい目に見えない歩行が出現することを発見した。
我々は,ANYmal Cプラットフォーム上でのシミュレーションと実世界におけるGaitorの評価を行った。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:27:51 GMT)
Trans4D: Realistic Geometry-Aware Transition for Compositional Text-to-4D Synthesis [60.9] 既存の4D生成方法は、ユーザフレンドリーな条件に基づいて高品質な4Dオブジェクトやシーンを生成することができる。
現実的な複雑なシーン遷移を可能にする新しいテキストから4D合成フレームワークであるTrans4Dを提案する。
実験では、Trans4Dは、4Dシーンを正確かつ高品質な遷移で生成する既存の最先端の手法を一貫して上回っている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:56:03 GMT)
AvatarGO: Zero-shot 4D Human-Object Interaction Generation and Animation [60.6] AvatarGOはテキスト入力からリアルな4D HOIシーンを生成するために設計された新しいフレームワークである。
我々のフレームワークは、コヒーレントな構成運動を生成するだけでなく、問題に対処する上でより堅牢性を示す。
4Dアバターをオブジェクトインタラクションで合成する最初の試みとして、AvatarGOが人間中心の4Dコンテンツを作るための新しい扉を開くことを願っている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:58:56 GMT)
Enforcing 3D Topological Constraints in Composite Objects via Implicit Functions [60.6] 医学的応用は心臓や脊椎などの複数の部分を持つ複雑な臓器の正確な3D表現を必要とすることが多い。
本稿では,深い暗黙的符号付き距離関数を用いた3次元物体再構成におけるトポロジ的制約を強制する新しい手法を提案する。
そこで本研究では,3次元形状間のトポロジ的制約を効果的に検証・実施するサンプリングベース手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 13:56:08 GMT)
Learning to Plan for Retrieval-Augmented Large Language Models from Knowledge Graphs [59.8] 知識グラフ(KG)から得られた計画データを用いて,大規模言語モデル(LLM)計画能力を向上するための新しいフレームワークを提案する。
KGデータで微調整されたLLMは、計画能力を向上し、検索を含む複雑なQAタスクを処理するのがより適している。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 05:56:07 GMT)
Stanceformer: Target-Aware Transformer for Stance Detection [59.7] スタンス検出は、テキストで表現されたスタンスを特定の主題やターゲットに向けて識別する。
以前の作業は、ターゲットを効果的に優先順位付けする能力に欠ける既存のトランスフォーマーモデルに依存していた。
本稿では,学習と推論の両方において,目標に対する注意を高めるターゲット対応トランスフォーマーモデルであるStanceformerを紹介する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:24:28 GMT)
MentalArena: Self-play Training of Language Models for Diagnosis and Treatment of Mental Health Disorders [59.5] メンタルヘルス障害は世界で最も深刻な病気の1つである。
プライバシーに関する懸念は、パーソナライズされた治療データのアクセシビリティを制限する。
MentalArenaは、言語モデルをトレーニングするためのセルフプレイフレームワークである。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:06:40 GMT)
Language-Guided Joint Audio-Visual Editing via One-Shot Adaptation [56.9] 言語誘導型共同視覚編集という新しいタスクを導入する。
この課題は、音声と映像のペアが与えられたとき、言語指導に基づいて与えられた音質イベントを編集することにより、新たな音声・視覚コンテンツを生成することである。
共同音声・視覚編集のための拡散型フレームワークを提案し,2つの重要なアイデアを紹介した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 22:02:30 GMT)
Is C4 Dataset Optimal for Pruning? An Investigation of Calibration Data for LLM Pruning [56.8] LLMプルーニングのアプローチは、プルーニングスコアを計算するためのキャリブレーションデータとして、C4データセットに依存している。
本研究では, LLMプルーニングにおけるキャリブレーションデータの選択を, 幅広いデータセットで評価する。
私たちの結果は、微妙でしばしば予期せぬ発見もいくつか見つけました。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 22:00:19 GMT)
Does Spatial Cognition Emerge in Frontier Models? [56.5] 本研究では,フロンティアモデルにおける空間認知を体系的に評価するベンチマークSPACEを提案する。
その結果、現代のフロンティアモデルは動物の空間知能に劣っていることが示唆された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:41:49 GMT)
Exploring the design space of deep-learning-based weather forecasting systems [56.1] 本稿では,異なる設計選択がディープラーニングに基づく天気予報システムに与える影響を系統的に分析する。
UNet、完全畳み込みアーキテクチャ、トランスフォーマーベースモデルなどの固定グリッドアーキテクチャについて検討する。
固定グリッドモデルの強靭な性能とグリッド不変アーキテクチャの柔軟性を組み合わせたハイブリッドシステムを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 22:25:50 GMT)
LLMC: Benchmarking Large Language Model Quantization with a Versatile Compression Toolkit [55.7] 鍵圧縮技術である量子化は、大きな言語モデルを圧縮し、加速することにより、これらの要求を効果的に軽減することができる。
本稿では,プラグアンドプレイ圧縮ツールキットであるLLMCについて,量子化の影響を公平かつ体系的に検討する。
この汎用ツールキットによって、我々のベンチマークはキャリブレーションデータ、アルゴリズム(3つの戦略)、データフォーマットの3つの重要な側面をカバーしています。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:09:41 GMT)
SurANet: Surrounding-Aware Network for Concealed Object Detection via Highly-Efficient Interactive Contrastive Learning Strategy [55.6] 本稿では,隠蔽物体検出のための新しいSurrounding-Aware Network,すなわちSurANetを提案する。
周辺特徴の差分融合を用いて特徴写像のセマンティクスを強化し,隠蔽対象の強調を行う。
次に、周囲の特徴写像を対照的に学習することで隠蔽対象を識別するために、周囲のコントラストロスを適用した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:02:50 GMT)
Step-by-Step Reasoning for Math Problems via Twisted Sequential Monte Carlo [55.5] Twisted Sequential Monte Carlo(TSMC)に基づく新しい検証手法を提案する。
TSMCを大規模言語モデルに適用し、部分解に対する将来的な報酬を推定する。
このアプローチは、ステップワイドなヒューマンアノテーションを必要としない、より直接的なトレーニングターゲットをもたらす。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:20:47 GMT)
Step-by-Step Reasoning for Math Problems via Twisted Sequential Monte Carlo [55.5] Twisted Sequential Monte Carlo(TSMC)に基づく新しい検証手法を提案する。
TSMCを大規模言語モデルに適用し、部分解に対する将来的な報酬を推定する。
このアプローチは、ステップワイドなヒューマンアノテーションを必要としない、より直接的なトレーニングターゲットをもたらす。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:20:47 GMT)
Step-by-Step Reasoning for Math Problems via Twisted Sequential Monte Carlo [55.5] Twisted Sequential Monte Carlo(TSMC)に基づく新しい検証手法を提案する。
TSMCを大規模言語モデルに適用し、部分解に対する将来的な報酬を推定する。
このアプローチは、ステップワイドなヒューマンアノテーションを必要としない、より直接的なトレーニングターゲットをもたらす。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:20:47 GMT)
G2D2: Gradient-guided Discrete Diffusion for image inverse problem solving [55.2] 本稿では,従来の離散拡散に基づく画像生成モデルを活用することによって,線形逆問題に対処する新しい手法を提案する。
我々の知る限りでは、これは画像逆問題を解決するために離散拡散モデルに基づく先行手法を使う最初のアプローチである。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:18:25 GMT)
Compositional Entailment Learning for Hyperbolic Vision-Language Models [54.4] 画像とテキストのペアを超えて、双曲的埋め込みの自然的階層性を完全に活用する方法を示す。
双曲型視覚言語モデルのための構成的包摂学習を提案する。
数百万の画像テキストペアで訓練された双曲型視覚言語モデルに対する経験的評価は、提案手法が従来のユークリッドCLIP学習より優れていることを示している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:12:50 GMT)
Pessimistic Nonlinear Least-Squares Value Iteration for Offline Reinforcement Learning [54.0] 非線形関数近似を用いたオフラインRLにおけるPNLSVI(Pessimistic Least-Square Value Iteration)と呼ばれるオラクル効率のアルゴリズムを提案する。
本アルゴリズムは,関数クラスの複雑性に強く依存する後悔境界を享受し,線形関数近似に特化して最小限のインスタンス依存後悔を実現する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 00:58:22 GMT)
Instructional Segment Embedding: Improving LLM Safety with Instruction Hierarchy [53.5] LLM(Large Language Models)は、セキュリティや安全性の脅威を受けやすい言語である。
これらの脆弱性の大きな原因の1つは、命令階層の欠如である。
本稿では,BERTにインスパイアされた命令セグメント埋め込み(ISE)技法を,現代の大規模言語モデルに導入する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:52:41 GMT)
SEGMENT+: Long Text Processing with Short-Context Language Models [53.4] SEGMENT+は、LMが限られたコンテキストウィンドウ内で拡張入力を効率的に処理できるフレームワークである。
SEGMENT+は構造化音符とフィルタリングモジュールを使用して情報の流れを管理し、制御可能かつ解釈可能なシステムを実現する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:40:22 GMT)
Safety Margins for Reinforcement Learning [53.1] 安全マージンを生成するためにプロキシ臨界度メトリクスをどのように活用するかを示す。
Atari 環境での APE-X と A3C からの学習方針に対するアプローチを評価する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 01:57:11 GMT)
Combining AI Control Systems and Human Decision Support via Robustness and Criticality [53.1] 我々は、逆説(AE)の方法論を最先端の強化学習フレームワークに拡張する。
学習したAI制御システムは、敵のタンパリングに対する堅牢性を示す。
トレーニング/学習フレームワークでは、この技術は人間のインタラクションを通じてAIの決定と説明の両方を改善することができる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 02:16:02 GMT)
From Persona to Personalization: A Survey on Role-Playing Language Agents [52.8] 大規模言語モデル(LLM)の最近の進歩はロールプレイング言語エージェント(RPLA)の台頭を後押ししている。
RPLAは、人間の類似性と鮮明なロールプレイングパフォーマンスの素晴らしい感覚を達成します。
彼らは感情的な仲間、インタラクティブなビデオゲーム、パーソナライズされたアシスタント、コピロなど、多くのAI応用を触媒してきた。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:11:15 GMT)
Calibrating the Confidence of Large Language Models by Eliciting Fidelity [52.5] RLHFのようなテクニックで最適化された大規模な言語モデルは、有用で無害な点において優れた整合性を実現している。
調整後、これらの言語モデルはしばしば過剰な自信を示し、表現された自信は正確さの度合いで正確に校正しない。
本稿では,言語モデルの信頼度を推定するプラグイン・アンド・プレイ手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 08:51:28 GMT)
Symbolic Recovery of Differential Equations: The Identifiability Problem [52.2] 微分方程式の記号的回復は、支配方程式の導出を自動化する野心的な試みである。
関数が対応する微分方程式を一意に決定するために必要な条件と十分な条件の両方を提供する。
この結果を用いて、関数が微分方程式を一意に解くかどうかを判定する数値アルゴリズムを考案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 15:27:08 GMT)
DCP: Learning Accelerator Dataflow for Neural Network via Propagation [52.1] この研究は、DNN層の最適なデータフローを人間の努力なしに数秒で自動的に見つけるために、Dataflow Code Propagation (DCP)と呼ばれる効率的なデータ中心のアプローチを提案する。
DCPは、様々な最適化目標を最小化するために、望ましい勾配方向に向けてデータフローコードを効率的に更新する神経予測器を学習する。
例えば、追加のトレーニングデータを使用しないDCPは、数千のサンプルを使用して完全な検索を行うGAMAメソッドを超越している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 05:16:44 GMT)
Privately Counting Partially Ordered Data [51.0] 各データポイントが部分順序を満たす$d$ビットからなる場合、差分プライベートカウントを考える。
私たちの主な技術的貢献は問題固有の$K$-normメカニズムで、時間内に$O(d2)$を実行します。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:43:35 GMT)
InstructG2I: Synthesizing Images from Multimodal Attributed Graphs [50.9] InstructG2Iと呼ばれるグラフ文脈条件拡散モデルを提案する。
InstructG2Iはまずグラフ構造とマルチモーダル情報を利用して情報的隣人サンプリングを行う。
Graph-QFormerエンコーダは、グラフノードをグラフプロンプトの補助セットに適応的に符号化し、デノナイジングプロセスを導く。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:56:15 GMT)
MINDECHO: Role-Playing Language Agents for Key Opinion Leaders [50.4] 本稿では、キーオピニオンリーダー(KOL)の開発と評価のためのフレームワークであるMINDECHOを紹介する。
MINDECHOは、様々な専門分野のインターネットビデオテキストからKOLデータを収集し、GPT-4を利用して会話を合成する。
KOLの一般次元(e, knowledge, tone)とファン中心次元の両方を対象として評価を行った。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:19:34 GMT)
Breaking the Script Barrier in Multilingual Pre-Trained Language Models with Transliteration-Based Post-Training Alignment [50.3] 転送性能は、低リソースのターゲット言語が高リソースのソース言語とは異なるスクリプトで書かれている場合、しばしば妨げられる。
本論文は,この問題に対処するために翻訳を用いた最近の研究に触発されて,翻訳に基づくポストプレトレーニングアライメント(PPA)手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:20:33 GMT)
Automatically Adaptive Conformal Risk Control [50.0] 本稿では,テストサンプルの難易度に適応して,統計的リスクの近似的条件制御を実現する手法を提案する。
我々のフレームワークは、ユーザが提供するコンディショニングイベントに基づく従来のコンディショニングリスク制御を超えて、コンディショニングに適した関数クラスのアルゴリズム的、データ駆動決定を行う。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 07:34:33 GMT)
A ripple in time: a discontinuity in American history [49.8] 歴史的データセットの時間的側面(言語拡張と無関係)と人格的側面(著者帰属)を明らかにするための新しいアプローチを提案する。
我々は過去42人のアメリカ合衆国大統領によって与えられた連邦の住所に対する我々のアプローチを例示する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 21:40:46 GMT)
Learning Recommender Systems with Soft Target: A Decoupled Perspective [49.8] そこで本研究では,ソフトラベルを活用することで,目的を2つの側面として捉えるために,分離されたソフトラベル最適化フレームワークを提案する。
本稿では,ラベル伝搬アルゴリズムをモデル化したソフトラベル生成アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:20:15 GMT)
Deep End-to-End Survival Analysis with Temporal Consistency [49.8] 本稿では,大規模長手データの処理を効率的に行うために,Survival Analysisアルゴリズムを提案する。
我々の手法における中心的な考え方は、時間とともにデータにおける過去と将来の成果が円滑に進化するという仮説である時間的一貫性である。
我々のフレームワークは、安定したトレーニング信号を提供することで、時間的一貫性を大きなデータセットに独自に組み込む。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:37:09 GMT)
Learn while Unlearn: An Iterative Unlearning Framework for Generative Language Models [49.0] Iterative Contrastive Unlearning (ICU)フレームワークは3つのコアコンポーネントで構成されている。
知識未学習誘導モジュールは、未学習の損失を通じて特定の知識を除去する。
Contrastive Learning Enhancementモジュールは、純粋な未学習の目標に対してモデルの表現力を維持する。
また、特定のデータ片の未学習範囲を動的に評価し、反復的な更新を行う反復未学習リファインメントモジュールも用意されている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:30:08 GMT)
Differentially Private Deep Model-Based Reinforcement Learning [47.7] 形式的な差分プライバシー保証を備えたモデルベースRLアルゴリズムであるPriMORLを紹介する。
PriMORLはオフラインデータから環境の軌道レベルのDPモデルのアンサンブルを学習する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 13:31:25 GMT)
Not All Contexts Are Equal: Teaching LLMs Credibility-aware Generation [47.4] Credibility-Aware Generation (CAG) は、信頼性に基づいて情報を識別・処理する能力を備えたモデルを提供することを目的としている。
提案モデルは,生成に対する信頼性を効果的に理解し活用し,検索強化により他のモデルよりも大幅に優れ,ノイズの多い文書による破壊に対するレジリエンスを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 17:16:15 GMT)
Why AI Is WEIRD and Should Not Be This Way: Towards AI For Everyone, With Everyone, By Everyone [47.2] 本稿では,開発の各段階で包括的なAIシステムを構築するためのビジョンを提案する。
我々は、現在のAIパイプラインとそのWEIRD表現における重要な制限に対処する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:44:26 GMT)
Self-Supervised Learning of Whole and Component-Based Semantic Representations for Person Re-Identification [46.5] 個人再識別(ReID)は、さまざまな設定にまたがって個人を特定することに焦点を当て、困難な問題である。
本稿では,対話モデルにインスパイアされた局所意味抽出(LSE)モジュールを提案する。
また,LSEを利用したセマンティックReID(Semantic ReID)を導入し,様々なReIDドメインやモダリティをシームレスに移動するための効果的なセマンティックスを学習する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 19:23:06 GMT)
Convex Distillation: Efficient Compression of Deep Networks via Convex Optimization [46.2] リソース制約のあるデバイスに大規模で複雑な凸ネットワークを配置することは、その要求のために大きな課題となった。
本稿では,本モデルを用いてモデルを効率よく圧縮する新しい蒸留技術を紹介する。
当社のアプローチでは,後処理を必要とせずに,オリジナルモデルに匹敵するパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:04:52 GMT)
Clean Evaluations on Contaminated Visual Language Models [46.0] 視覚言語モデル(VLM)をきれいに評価する方法は、未研究の問題である。
本稿では,視覚的入力情報に対するデータ拡張手法により,そのような目標を達成するための新しい手法を提案する。
コード、データ、モデルの重み付けは、公開時にリリースされます。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:13:19 GMT)
QuAILoRA: Quantization-Aware Initialization for LoRA [46.0] QLoRAは、ベースLLMを定量化することにより、Lolaで大規模言語モデル(LLM)を微調整するメモリコストを削減する。
QLoRAは微調整後のモデル性能に悪影響を及ぼす量子化誤差を導入する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 19:06:37 GMT)
Asymmetry of the Relative Entropy in the Regularization of Empirical Risk Minimization [45.9] 相対エントロピー非対称性の効果は、経験的リスク最小化の文脈で分析される。
良く理解されたタイプI ERM-RERとタイプII ERM-RERを比較することにより、エントロピー非対称性の影響が強調される。
その結果,Type-II正則化は経験的リスク関数の適切な変換を伴うType-I正則化と同値であることが示唆された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:28:41 GMT)
Decouple-Then-Merge: Towards Better Training for Diffusion Models [45.9] 拡散モデルは、ノイズ破損の各ステップを反転させる一連のモデルを学ぶことで訓練される。
この研究はDeouple-then-Merge(DeMe)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:19:25 GMT)
Seg2Act: Global Context-aware Action Generation for Document Logical Structuring [45.6] 文書論理構造化のためのエンドツーエンドな生成手法であるSeg2Actを紹介する。
Seg2Actは、グローバルコンテキスト認識生成モデルを介してアクションシーケンスを反復的に生成し、そのグローバルコンテキストと現在の論理構造を同時に更新する。
ChCatExtとHierDocデータセットの実験は、教師付きおよび転送学習設定の両方において、Seg2Actの優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:58:40 GMT)
AGL-NET: Aerial-Ground Cross-Modal Global Localization with Varying Scales [45.3] 我々は,LiDAR点雲と衛星地図を用いたグローバルローカライゼーションのための新しい学習手法であるAGL-NETを提案する。
我々は,特徴マッチングのための画像と点間の表現ギャップを埋めること,グローバルビューとローカルビューのスケールの相違に対処すること,という2つの重要な課題に取り組む。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:55:07 GMT)
SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference [45.1] 視覚言語モデル(VLM)では、視覚トークンは通常かなりの計算オーバーヘッドを消費する。
本稿では、余分なパラメータや微調整コストを伴わずに、SparseVLMと呼ばれる効率的なトレーニングフリートークン最適化機構を提案する。
実験結果から,SparseVLMは画像理解タスクや映像理解タスクにおいて,様々なVLMの効率を向上することが示された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:04:16 GMT)
SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference [45.1] 視覚言語モデル(VLM)では、視覚トークンは通常かなりの計算オーバーヘッドを消費する。
本稿では、余分なパラメータや微調整コストを伴わずに、SparseVLMと呼ばれる効率的なトレーニングフリートークン最適化機構を提案する。
実験結果から,SparseVLMは画像理解タスクや映像理解タスクにおいて,様々なVLMの効率を向上することが示された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:04:16 GMT)
FreeAvatar: Robust 3D Facial Animation Transfer by Learning an Expression Foundation Model [45.0] ビデオ駆動の3D顔アニメーション転送は、アクターの表情を再現するためにアバターを駆動することを目的としている。
我々は,学習した表現のみに依存する,堅牢な顔アニメーショントランスファー手法であるFreeAvatarを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:29:57 GMT)
FreeAvatar: Robust 3D Facial Animation Transfer by Learning an Expression Foundation Model [45.0] ビデオ駆動の3D顔アニメーション転送は、アクターの表情を再現するためにアバターを駆動することを目的としている。
我々は,学習した表現のみに依存する,堅牢な顔アニメーショントランスファー手法であるFreeAvatarを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:29:57 GMT)
Safe and High-Performance Learning of Model Predicitve Control using Kernel-Based Interpolation [45.0] 本稿では,カーネルを用いたモデル予測制御の効率的かつ安全な近似を可能にする手法を提案する。
近似関数の計算複雑性はデータ点数と線形にスケールするため,最も有望なデータを選択するスコアリング関数を提案する。
設計した近似制御器の安全性と性能を保証するため,モンテカルロ法に基づく到達可能性解析を用いる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:04:15 GMT)
Asymmetry of the Relative Entropy in the Regularization of Empirical Risk Minimization [45.0] 相対エントロピー非対称性の効果は、経験的リスク最小化の文脈で分析される。
良く理解されたタイプI ERM-RERとタイプII ERM-RERを比較することにより、エントロピー非対称性の影響が強調される。
その結果,Type-II正則化は経験的リスク関数の適切な変換を伴うType-I正則化と同値であることが示唆された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:28:41 GMT)
FELLAS: Enhancing Federated Sequential Recommendation with LLM as External Services [44.8] フェデレートシーケンシャルレコメンデーション(FedSeqRec)は、ユーザのプライバシを保護する能力によって注目を集めている。
近年,大きな言語モデル (LLMs) は伝達可能で一般化された言語理解能力を示す。
LLMを外部サービスとして利用することによりFedSeqRecを強化することを目的とした、汎用的なFedSeqRecフレームワークFELLASを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 07:17:03 GMT)
Positive-Augmented Contrastive Learning for Vision-and-Language Evaluation and Training [44.0] PAC-S++はCLIPモデルを利用した学習可能なメトリックであり、Webコンパイルされたデータとクリーンなデータの両方で事前トレーニングされている。
PAC-S++をキャプションモデルの微調整段階に組み込むことで,文の繰り返しや文法的誤りが少なく,意味的に豊かなキャプションが得られることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:00:09 GMT)
Structure-Enhanced Protein Instruction Tuning: Towards General-Purpose Protein Understanding [43.8] 本稿では,このギャップを埋めるために,構造強化タンパク質インストラクションチューニング(SEPIT)フレームワークを紹介する。
提案手法では, 構造的知識を付加するため, 構造的知識を付加し, これらの拡張された pLM を大規模言語モデル (LLM) に接続し, タンパク質の理解を創出する。
我々はこれまでで最大かつ最も包括的なタンパク質命令データセットを構築し、汎用タンパク質理解モデルの訓練と評価を可能にした。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:49:08 GMT)
Structure-Enhanced Protein Instruction Tuning: Towards General-Purpose Protein Understanding [43.8] 本稿では,このギャップを埋めるために,構造強化タンパク質インストラクションチューニング(SEPIT)フレームワークを紹介する。
提案手法では, 構造的知識を付加するため, 構造的知識を付加し, これらの拡張された pLM を大規模言語モデル (LLM) に接続し, タンパク質の理解を創出する。
我々はこれまでで最大かつ最も包括的なタンパク質命令データセットを構築し、汎用タンパク質理解モデルの訓練と評価を可能にした。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:49:08 GMT)
Decomposing Relationship from 1-to-N into N 1-to-1 for Text-Video Retrieval [43.8] Text-Video-ProxyNet (TV-ProxyNet)は、TVRの従来の1対Nの関係をN対1の関係に分解するために設計された新しいフレームワークである。
TV-ProxyNetはMSRVTTとActivityNet Captionsの最先端のパフォーマンスを達成し、既存の方法と比較してDiDeMoを2.0%改善した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:14:49 GMT)
Topologically Faithful Multi-class Segmentation in Medical Images [43.7] 位相的に忠実な多クラスセグメンテーションのための一般損失関数を提案する。
我々はNクラス分割問題をNクラス分割タスクに投射する。
心筋, 細胞, 動脈静脈, およびWillisセグメンテーションの局所的正当性は, 著明に向上する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 17:44:14 GMT)
Beyond Correctness: Benchmarking Multi-dimensional Code Generation for Large Language Models [43.6] 本稿では,大規模言語モデルが生成するコードの品質を包括的に評価する RACE ベンチマークを提案する。
RACEに基づいて28の代表的なLCMを分析し、現在の正しさ中心のベンチマークでは、実世界のシナリオにおけるコードの多面的要求をキャプチャできないことを発見した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 05:59:07 GMT)
Do great minds think alike? Investigating Human-AI Complementarity in Question Answering with CAIMIRA [43.1] 人間は知識に基づく帰納的、概念的推論においてAIシステムより優れています。
GPT-4やLLaMAのような最先端のLLMは、ターゲット情報検索において優れた性能を示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:53:26 GMT)
Measurement-induced transitions for interacting fermions [43.0] エンタングルメントと電荷ゆらぎを特徴付けるオブザーバブルに対する統一的なアプローチを提供する場理論の枠組みを開発する。
このフレームワーク内では、複製されたケルディシュ非線形シグマモデル(NLSM)を導出する。
NLSMに対する正規化群アプローチを用いることで、位相図と物理観測値のスケーリングを決定する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:00:08 GMT)
StopThePop: Sorted Gaussian Splatting for View-Consistent Real-time Rendering [42.9] 本稿では,処理オーバーヘッドを最小限に抑えた新しい階層化手法を提案する。
提案手法はガウス版よりも平均で4%遅い。
レンダリング性能はほぼ2倍に向上し,従来のガウス版よりも1.6倍高速になった。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:57:43 GMT)
Defensive Unlearning with Adversarial Training for Robust Concept Erasure in Diffusion Models [42.7] 拡散モデル(DM)はテキスト・画像生成において顕著な成功を収めてきたが、安全性のリスクも生じている。
マシン・アンラーニングのテクニックは、概念消去としても知られ、これらのリスクに対処するために開発されている。
本研究は, 対人訓練(AT)の原理をマシン・アンラーニングに統合することにより, 概念消去の堅牢性を高めることを目的とする。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:12:40 GMT)
Uncertainty-Guided Optimization on Large Language Model Search Trees [42.7] 大規模言語モデル(LLM)の復号過程における最大可能性列の探索においては,greedy や beam search などの木探索アルゴリズムが標準となっている。
LLMの遷移確率に関する事前の信念を定義し、各反復において最も有望な経路についての後続の信念を得る。
モンテカルロ木探索のような高価なシミュレーションに基づく非光学的手法とは異なり、我々の手法は信念からのサンプルのみを必要とする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:16:18 GMT)
LM-HT SNN: Enhancing the Performance of SNN to ANN Counterpart through Learnable Multi-hierarchical Threshold Model [42.1] スパイキングニューラルネットワーク(SNN)は、よりエネルギー効率の良い方法で情報を伝達する本質的な能力に対して、広く学術的な関心を集めている。
SNNの学習アルゴリズムを様々な方法で最適化する以前の取り組みにもかかわらず、SNNはパフォーマンス面でもANNに遅れを取っている。
本稿では,グローバル入力電流と膜電位リークを動的に制御できる等価多閾値モデルであるLM-HTモデルを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 02:56:46 GMT)
WAPITI: A Watermark for Finetuned Open-Source LLMs [42.1] WAPITIはパラメータ統合によってベースモデルから微調整モデルに透かしを転送する新しい手法である。
提案手法は,透かしの注入に成功し,微調整モデルとの互換性が高いことを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:41:14 GMT)
Progressively Label Enhancement for Large Language Model Alignment [42.0] 大きな言語モデル(LLM)のアライメントは、モデルが人間の期待に反するコンテンツを生成するのを防ぐことを目的としている。
生成したデータの進化的品質に基づいてモデルのトレーニングプロセスを動的に調整するフレームワークであるPLEを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:31:18 GMT)
Emergent Fracton Hydrodynamics in the Fractional Quantum Hall Regime of Ultracold Atoms [41.9] 最下層のランダウでは、系は半拡散的に緩和することを示した。
緩やかな緩和は、全電荷の創発的保存法則から理解される。
我々は、この非伝統的な緩和ダイナミクスを観察するために、光学格子における回転量子ガスと超低温原子の展望について論じる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:00:02 GMT)
PositionID: LLMs can Control Lengths, Copy and Paste with Explicit Positional Awareness [41.9] 大規模言語モデル(LLM)は、様々な領域にまたがる印象的な機能を示している。
これらの進歩にもかかわらず、LLMは長さ制御の課題に直面している。
そこで本研究では,この課題に対処するための新しいアプローチとして,PhysorID PromptingとPhysorID Fine-Tuningを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:15:36 GMT)
On the Noise Robustness of In-Context Learning for Text Generation [41.6] 本研究では、テキスト生成タスクにおいて、ノイズの多いアノテーションがテキスト内学習の性能を著しく損なうことを示す。
この問題を回避するために,LPR(Local Perplexity Ranking)と呼ばれるシンプルで効果的なアプローチを提案する。
LPRは「騒々しい」候補者を、より清潔である可能性が高い隣人に置き換える。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:34:19 GMT)
LLM Compression with Neural Architecture Search [41.5] ニューラルアーキテクチャ検索を利用して、大きな言語モデルを圧縮する。
デバイス上でのレイテンシの高速化により,NASはMMLUの性能を最大3.4%向上することを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:14:39 GMT)
ING-VP: MLLMs cannot Play Easy Vision-based Games Yet [40.9] MLLM(Multimodal large language model)は、幅広いタスクにまたがる競争力の向上を示す。
既存のマルチモーダルベンチマークでは、画像内の空間的関係に基づくマルチステップ計画の集中的な評価が不十分である。
Interactive Game-based Vision PlanningベンチマークであるING-VPを提案し,MLLMの空間的想像力と多段階推論能力を評価する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 05:17:38 GMT)
Dynamic Neural Potential Field: Online Trajectory Optimization in Presence of Moving Obstacles [40.8] 本研究では,静的・動的障害物の存在下での移動ロボットの局所軌道計画の課題に対処する。
ニューラルモデルにより反発電位を推定する手法を開発する。
我々は,提案するMPC局所軌道プランナーの下で,オフィス廊下を移動するHusky UGVモバイルプラットフォームにアプローチを展開させる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:27:09 GMT)
OmniPose6D: Towards Short-Term Object Pose Tracking in Dynamic Scenes from Monocular RGB [40.6] 実環境の多様性を反映した大規模合成データセットOmniPose6Dを提案する。
本稿では,ポーズ追跡アルゴリズムの総合的な比較のためのベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:01:40 GMT)
Stochastic Extragradient with Random Reshuffling: Improved Convergence for Variational Inequalities [40.1] 本稿では,3種類のVIPに対してランダムリシャッフル(SEG-RR)を用いたSEGの収束解析を行う。
我々は,SEG-RRが均一な置換サンプリングSEGよりも高速に収束する条件を導出する。
単調な設定では,SEG-RRの解析により,大きなバッチサイズを伴わずに任意の精度で収束が保証される。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:10:16 GMT)
Rethinking the Evaluation of Visible and Infrared Image Fusion [39.5] Visible と Infrared Image Fusion (VIF) は、様々な高度な視覚タスクにおいて大きな関心を集めている。
本稿では, セマンティック指向評価手法 (SEA) を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:12:08 GMT)
Mitigating the Language Mismatch and Repetition Issues in LLM-based Machine Translation via Model Editing [39.4] 機械翻訳を行うためにLLM(Large Language Models)を活用することに注力する。
誤りの2つのパターンが頻繁に発生し、言語ミスマッチと繰り返しの翻訳品質に劇的な影響を与えていることを観察する。
モデル編集手法を活用することにより,これらの2つの問題を緩和する可能性について検討する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:51:21 GMT)
Do Contemporary CATE Models Capture Real-World Heterogeneity? Findings from a Large-Scale Benchmark [39.1] 本研究では,条件平均処理効果(CATE)推定アルゴリズムを大規模ベンチマークで評価し,予期せぬ結果を示す。
a) CATE推定の62%は、自明なゼロエフェクト予測よりも平均二乗誤差(MSE)が高く、少なくとも1つの有用なCATE推定を持つデータセットでは、80%は、定数エフェクトモデルよりも高いMSEを持ち、c) オルソゴン性に基づくモデルは、他のモデルよりも30%高い。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:04:40 GMT)
GLA-DA: Global-Local Alignment Domain Adaptation for Multivariate Time Series [37.7] GLA-DAは、サンプルを同じクラスラベルにアライメントすることで、異なるラベルを持つデータ間の差異を保存することを目的としている。
我々は,UDAとSSDAの両方のシナリオでGLA-DAを実装し,最先端手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:27:26 GMT)
Atlas Gaussians Diffusion for 3D Generation [37.7] 潜在拡散モデルは、新しい3D生成技術の開発に有効であることが証明されている。
鍵となる課題は、潜在空間と3D空間を結びつける高忠実で効率的な表現を設計することである。
我々は、フィードフォワードネイティブな3D生成のための新しい表現であるAtlas Gaussiansを紹介する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 00:57:02 GMT)
Cheating Automatic LLM Benchmarks: Null Models Achieve High Win Rates [37.6] 常に一定応答を出力する"nullモデル"でさえ、自動ベンチマークを騙し、トップランクの勝利率を達成することができることを示す。
以上の結果から,信頼性の高い自動ベンチマークのための加熱防止機構の開発が望まれる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:53:06 GMT)
Exploring and Exploiting the Asymmetric Valley of Deep Neural Networks [37.0] 最近の研究は、平らな谷と鋭い谷の向こう側に追加の非対称性があることを示唆している。
本研究では,谷の対称性に影響を及ぼす要因を定量的に検討する。
主要観測では,ノイズと収束点との間の信号の整合度が谷対称性の臨界指標であることが示された。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 13:04:29 GMT)
TCGU: Data-centric Graph Unlearning based on Transferable Condensation [36.7] Transferable Condensation Graph Unlearning (TCGU)は、ゼロガンスグラフアンラーニングのためのデータ中心のソリューションである。
我々は,TGUが既存のGU手法よりもモデルユーティリティ,未学習効率,未学習効率において優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:14:40 GMT)
Graph Propagation Transformer for Graph Representation Learning [36.0] グラフ伝搬注意(GPA)と呼ばれる新しい注意機構を提案する。
ノード・ツー・ノード、ノード・ツー・エッジ、エッジ・ツー・ノードという3つの方法で、ノードとエッジ間で明示的に情報を渡す。
提案手法は,多くの最先端のトランスフォーマーベースグラフモデルよりも優れた性能を有することを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:25:18 GMT)
Addax: Utilizing Zeroth-Order Gradients to Improve Memory Efficiency and Performance of SGD for Fine-Tuning Language Models [35.8] 本稿では,MeZOと統合することでIP-SGDのメモリ効率と性能を両立させる新しい手法であるAddaxを紹介する。
我々の実験では、メモリフットプリントに匹敵する精度と収束速度において、AddaxはMeZOを一貫して上回ります。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 00:49:08 GMT)
Depression Diagnosis Dialogue Simulation: Self-improving Psychiatrist with Tertiary Memory [35.4] 本稿では,患者と精神科医の対話を模擬してうつ病診断を促進する自己改善型会話エージェントシステムであるエージェント・メンタル・クリニック(AMC)を紹介する。
本稿では,3次記憶構造,対話制御,およびメモリサンプリングモジュールから構成される精神科医エージェントを設計し,精神科医エージェントが反映するスキルを十分に活用し,抑うつリスクと自殺リスク診断の会話による高精度化を実現する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:37:29 GMT)
A Poincaré Inequality and Consistency Results for Signal Sampling on Large Graphs [35.0] グラフ制限の一種であるグラフオンに対する信号サンプリング理論を導入する。
収束グラフ列上の一意なサンプリング集合は、グラフオン上の一意なサンプリング集合に収束することを示す。
そこで我々は,大規模グラフに対する関連するグラフ信号サンプリングアルゴリズムを提案し,グラフ機械学習タスクにおいて,その優れた経験的性能を示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:28:15 GMT)
MaskBlur: Spatial and Angular Data Augmentation for Light Field Image Super-Resolution [34.9] MaskBlurは、限られたデータで光電場(LF)画像を強化するための新しい戦略である。
MaskBlurは空間的ぼやけと角ばった2つのコンポーネントで構成されている。
実験では、既存のSR法の性能を大幅に向上させるMaskBlurの有効性を実証した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:12:01 GMT)
When "A Helpful Assistant" Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models [34.8] 商用AIシステムは一般に、システムプロンプトにおけるLarge Language Models(LLM)の役割を定義している。
客観的タスクにおいて、異なるペルソナがモデルのパフォーマンスにどの程度影響するかは、まだ不明である。
6種類の対人関係と8つの専門領域を含む162のロールのリストをキュレートする。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 15:44:36 GMT)
Artificial Replay: A Meta-Algorithm for Harnessing Historical Data in Bandits [34.4] 任意のベースバンドアルゴリズムに履歴データを組み込むメタアルゴリズムであるArtificial-Replayを提案する。
我々は,Artificial-Replayが履歴データのごく一部しか使用していないことを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 21:48:01 GMT)
ClinicalLab: Aligning Agents for Multi-Departmental Clinical Diagnostics in the Real World [34.4] 包括的臨床診断剤アライメントスイートである ClinicalLab を紹介する。
ClinicalLabには、エンドツーエンドの多部門間臨床診断評価ベンチマークである ClinicalBenchが含まれている。
我々は17個のLDMを評価し,その性能が各部門で大きく異なることを発見した。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 19:09:30 GMT)
Energy-Efficient Federated Edge Learning with Streaming Data: A Lyapunov Optimization Approach [34.0] 本研究では,長期エネルギー制約下でのデータ到着や資源の可利用性に固有のランダム性に対処する動的スケジューリングと資源割当アルゴリズムを開発した。
提案アルゴリズムは, デバイススケジューリング, 計算容量調整, 帯域幅の割り当ておよび各ラウンドの送信電力を適応的に決定する。
本手法の有効性をシミュレーションにより検証し,ベースライン方式と比較して学習性能とエネルギー効率が向上したことを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 09:11:02 GMT)
Combining Planning and Diffusion for Mobility with Unknown Dynamics [33.9] 大きなオブジェクトは、牽引中のオブジェクトとの同時操作、ナビゲーション、移動を含む移動操作を必要とする。
本稿では,ロボットの動作が部分的に未知な長軸操作問題に対する階層的アルゴリズムを提案する。
私たちは、オフィスの椅子を押したり引っ張ったりしなければならないSpotロボットにモバイル操作ポリシーを訓練します。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:12:28 GMT)
Learning from Mistakes: Iterative Prompt Relabeling for Text-to-Image Diffusion Model Training [33.5] Iterative Prompt Relabeling (IPR) は、反復的な画像サンプリングを通じて画像をテキストにアライメントし、フィードバックでリテラブルを促す新しいアルゴリズムである。
我々はSDv2とSDXLについて徹底的な実験を行い、空間関係の指示に従う能力をテストする。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:39:44 GMT)
Point Cloud Compression with Bits-back Coding [33.0] 本稿では,深層学習に基づく確率モデルを用いて,点雲情報のシャノンエントロピーを推定する。
点雲データセットのエントロピーを推定すると、学習されたCVAEモデルを用いて点雲の幾何学的属性を圧縮する。
本手法の新規性は,CVAEの学習潜在変数モデルを用いて点雲データを圧縮することである。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:34:48 GMT)
MedSafetyBench: Evaluating and Improving the Medical Safety of Large Language Models [32.4] まず,米国医学会の医療倫理原則に基づいて,大規模言語モデル(LLM)における医療安全の概念を定義した。
次に、この理解を活用して、LSMの医療安全を測定するために設計された最初のベンチマークデータセットであるMedSafetyBenchを導入します。
以上の結果から,医療用LLMは医療安全基準に適合せず,MedSafetyBenchを用いた微調整により医療安全を向上し,医療性能の維持が図られている。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 17:22:24 GMT)
Retrieval Replace Reduction: An effective visual token reduction method via semantic match [32.3] textbfTRSM (textbfToken textbfReduction via textbfSemantic textbfMatch)を導入し,MLLMの性能を損なうことなく視覚トークンの数を効果的に削減する。
TRSMは、人間がマルチモーダルタスクを処理する方法に触発され、あるモダリティから意味情報を活用して、関連するセマンティクスを別のモダリティにマッチさせ、視覚トークンの数を減らす。
実験結果に基づいて,視覚的トークンを20%圧縮し,多様な視覚的質問応答タスクと推論タスクに匹敵する性能を実現する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:13:22 GMT)
FltLM: An Intergrated Long-Context Large Language Model for Effective Context Filtering and Understanding [32.2] 我々は,新しいLong-Context Large Language Model (FltLM)を提案する。
FltLMはコンテキストフィルタをソフトマスク機構に組み込み、関連する情報に集中するために無関係な内容を特定し、動的に排除する。
実験の結果,複雑なQAシナリオにおいて,FltLMは教師付き微調整法や検索法よりも優れていた。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:47:50 GMT)
FreqMark: Frequency-Based Watermark for Sentence-Level Detection of LLM-Generated Text [31.6] FreqMarkは、トークンサンプリングプロセス中にLarge Language Models (LLMs) 生成したテキストに周波数ベースの透かしを埋め込む。
メソッドは周期的な信号を利用してトークンの選択をガイドし、短い時間フーリエ変換(STFT)分析で検出できる透かしを生成する。
実験では、FreqMarkの堅牢性と精度を示し、さまざまな攻撃シナリオに対して強力な検出能力を示している。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 05:01:48 GMT)
Unleashing Multi-Hop Reasoning Potential in Large Language Models through Repetition of Misordered Context [31.1] 文脈反復(CoRe)という,シンプルで効果的な手法を提案する。
CoReは、モデルに対して最適な順序でサポートドキュメントが提示されることを保証するために、コンテキストを繰り返し提示することで、モデルに促す。
マルチホップQAタスクではF1スコアが最大30%向上し,合成タスクでは最大70%向上した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:41:53 GMT)
$β$-calibration of Language Model Confidence Scores for Generative QA [31.0] 既存のキャリブレーション手法は、信頼性スコアが解答の正しさを示す平均的な指標であることを保証することを目的としている。
しかし、この標準(平均ケース)のキャリブレーションの概念は、生成的QAにおける意思決定の解釈が困難である。
異なる問合せグループ間でキャリブレーションを保留する$beta$-calibrationを導入する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:12:24 GMT)
$\texttt{ModSCAN}$: Measuring Stereotypical Bias in Large Vision-Language Models from Vision and Language Modalities [31.0] 大規模視覚言語モデル(LVLM)は、様々な分野で急速に開発され、広く利用されているが、モデルにおける(潜在的)ステレオタイプバイアスは、ほとんど探索されていない。
我々は、先駆的な測定フレームワークである$textttModSCAN$を、LVLM内のステレオタイプバイアスである$underlineSCAN$に提示する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:07:05 GMT)
Does Vec2Text Pose a New Corpus Poisoning Threat? [30.8] Vec2Text – テキスト埋め込みインバージョンのためのメソッド – は、高密度検索システムに対する深刻なプライバシー上の懸念を提起している。
本稿では、Vec2Textを新たに検討し、コーパス中毒に対する脅威の程度について検討する。
特定の条件下では、Vec2Textによるコーパス中毒は、密集した検索システムの完全性とユーザエクスペリエンスに深刻な脅威をもたらす可能性があることを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 07:23:02 GMT)
Infusing Self-Consistency into Density Functional Theory Hamiltonian Prediction via Deep Equilibrium Models [30.7] 本稿では,統合ニューラルネットワークアーキテクチャ,Deep Equilibrium Density Functional Theory Hamiltonian (DEQH)モデルを紹介する。
DEQHモデルは本質的にハミルトニアンの自己整合性の性質を捉えている。
本稿では,DECと既製の機械学習モデルを組み合わせた多目的フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:51:36 GMT)
Personalized Visual Instruction Tuning [30.7] MLLM(Multimodal large language model)は、一般的な会話を行うが、特定の個人をターゲットにした対話を行うことができない。
この欠陥は、モバイルデバイスのカスタマイズされた視覚アシスタントなど、パーソナライズされた設定におけるMLLMの適用を妨げる。
我々は、MLLMが画像内のターゲット個人を識別できるように設計された新しいデータキュレーションおよびトレーニングフレームワークである、パーソナライズド・ビジュアル・インストラクション・チューニング(PVIT)を紹介する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:46:53 GMT)
The Lottery Ticket Hypothesis in Denoising: Towards Semantic-Driven Initialization [30.6] ランダムなガウス雑音像を復調する際の抽選券仮説を定式化する。
優勝チケットは独立して特定のコンテンツにデノベートされる傾向がある。
我々は、既知の当選チケットから初期ノイズを生成する意味駆動型初期画像構築を実装した。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:29:17 GMT)
Guided Image Synthesis via Initial Image Editing in Diffusion Model [30.6] 拡散モデルでは、純粋なガウスノイズ画像から高品質な画像を生成することができる。
生成した画像を制御するために初期雑音を操作する新しい方向を提案する。
その結果,生成画像の制御における初期画像操作の柔軟性とパワーを強調した。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:31:44 GMT)
Checker Bug Detection and Repair in Deep Learning Libraries [30.5] Deep Learning (DL)ライブラリのチェッカーバグは批判的だが、十分に調査されていない。
広範に利用されている2つのDLライブラリにおけるDLチェッカーバグの総合的研究について紹介する。
我々は、概念実証のJAXGuardベースのツールであるZeroGuardを提案し、DLライブラリのチェッカーバグを検出し、修正する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 00:48:12 GMT)
Toward Physics-guided Time Series Embedding [30.4] 本稿では,パラメータ化された埋め込み層が非線形時系列の線形推定を本質的に提供するエンベディング・デュナリティ理論を提案する。
この理論により、パラメータ化された埋め込み層をバイパスし、物理再構成技術を直接利用してデータ埋め込み表現を得ることができる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:04:06 GMT)
Improving Data Efficiency via Curating LLM-Driven Rating Systems [30.2] データ選択のための多変量対応スコアキュレーション手法DS2を紹介する。
スコア遷移行列を通じてエラーパターンを体系的にモデル化することにより、DS2はLSMベースのスコアを補正し、選択したデータサンプルの多様性を促進する。
このアプローチは、キュレートされたサブセット(元のデータセットのわずか3.3%)が、さまざまなマシンアライメントベンチマークで、フルスケールデータセット(300kサンプル)より優れていることを示している。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:07:55 GMT)
Unlocking the Power of Large Language Models for Entity Alignment [29.6] ChatEAは、大規模な言語モデル(LLM)を取り入れてEAを改善する革新的なフレームワークである。
限られた入力KGデータの制約に対処するため、ChatEAはKGコード翻訳モジュールを導入した。
エンティティの埋め込み比較の過度な信頼性を克服するため、ChatEAは2段階のEA戦略を実装している。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:22:46 GMT)
Efficient Weight-Space Laplace-Gaussian Filtering and Smoothing for Sequential Deep Learning [29.3] 連続学習のような関連するタスクのシーケンスを効果的に学習することは、ニューラルネットにとって重要な課題となる。
ベイズ推定に基づくタスクを逐次学習するための基盤的枠組みを用いてこの問題に対処する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:54:33 GMT)
Population Transformer: Learning Population-level Representations of Neural Activity [29.2] 本稿では,大規模なニューラル記録の任意のアンサンブルのための集団レベルの符号を学習する自己教師型フレームワークを提案する。
ニューラルネットワークの時系列データを用いてモデルをスケーリングする際の2つの重要な課題に対処する。
マルチチャネルの頭蓋内データの復号化と解釈性を改善するために,事前訓練したPopTもリリースしています。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 17:07:27 GMT)
Thing2Reality: Transforming 2D Content into Conditioned Multiviews and 3D Gaussian Objects for XR Communication [29.1] リモートコミュニケーションの間、参加者は製品デザイン、デジタル資産、環境など、デジタルコンテンツと物理的コンテンツの両方を共有します。
我々は,デジタルおよび物理アイテムの自発的な議論を促進する,拡張現実(XR)コミュニケーションプラットフォームThing2Realityを提案する。
本研究により,物体の3次元表現を操作・操作できる能力は,議論の効率を著しく向上させることが明らかとなった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:49:06 GMT)
Hi-SLAM: Scaling-up Semantics in SLAM with a Hierarchically Categorical Gaussian Splatting [28.8] Hi-SLAMは、新しい階層的分類表現を特徴とするセマンティックな3次元ガウススプラッティングSLAM法である。
正確なグローバルな3Dセマンティックマッピング、スケールアップ機能、および3D世界での明示的なセマンティックラベル予測を可能にする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:48:33 GMT)
Hi-SLAM: Scaling-up Semantics in SLAM with a Hierarchically Categorical Gaussian Splatting [28.8] Hi-SLAMは、新しい階層的分類表現を特徴とするセマンティックな3次元ガウススプラッティングSLAM法である。
正確なグローバルな3Dセマンティックマッピング、スケールアップ機能、および3D世界での明示的なセマンティックラベル予測を可能にする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:48:33 GMT)
Unveiling In-Context Learning: A Coordinate System to Understand Its Working Mechanism [28.8] 大規模言語モデル(LLM)は、テキスト内学習能力に優れる。
最近の研究は、ICLに関する2つの矛盾する見解を示している。
両ビューを体系的なフレームワークに統合する2次元コーディネートシステムを提供する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:58:40 GMT)
Signal Watermark on Large Language Models [28.7] 本稿では,Large Language Models (LLMs) によるテキストに特定の透かしを埋め込む透かし手法を提案する。
この技術は、透かしが人間に見えないことを保証するだけでなく、モデル生成テキストの品質と文法的整合性も維持する。
提案手法は複数のLDMに対して実験的に検証され,高い検出精度を維持している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:49:03 GMT)
Multi-Task Program Error Repair and Explanatory Diagnosis [28.7] マルチタスクプログラムエラー修復・説明診断(mPRED)のための新しい機械学習手法を提案する。
ソースコードのエンコードには事前訓練された言語モデルが使用され、ダウンストリームモデルはエラーを特定して修復するために特別に設計されている。
プログラム構造を可視化・解析するために,プログラム構造の可視化にグラフニューラルネットワークを用いる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 05:09:24 GMT)
Let's Ask GNN: Empowering Large Language Model for Graph In-Context Learning [28.7] 本稿では,逐次テキスト処理とグラフ構造化データのギャップを埋める新しいアプローチであるAskGNNを紹介する。
AskGNNはグラフニューラルネットワーク(GNN)を利用した構造強化レトリバーを使用して、グラフをまたいだラベル付きノードを選択する。
3つのタスクと7つのLLMにわたる実験は、グラフタスクのパフォーマンスにおいてAskGNNが優れていることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:19:12 GMT)
Private prediction for large-scale synthetic text generation [28.5] 大規模言語モデル(LLM)を用いた微分プライベートテキスト生成手法を提案する。
プライベートな予測フレームワークでは、差分プライバシー保証を満たすために出力された合成データのみを必要とする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:45:07 GMT)
PACER: A Fully Push-forward-based Distributional Reinforcement Learning Algorithm [28.5] PACERは、流通批評家、俳優、サンプルベースの奨励者で構成されている。
プッシュフォワード演算子は、それぞれリターン分布とポリシーをモデル化するために、批評家とアクターの両方で利用される。
プッシュフォワードポリシー更新のために、サンプルベースのユーティリティ値ポリシー勾配を確立する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 07:11:15 GMT)
RankSHAP: Shapley Value Based Feature Attributions for Learning to Rank [28.4] 我々は、機能属性コミュニティで人気がある軸論的ゲーム理論のアプローチを採用し、全てのランク付けベースの特徴属性メソッドが満足すべき基本公理のセットを特定する。
次にRang-SHAPを導入し、古典的なShapley値をランキングに拡張します。
また、既存の帰属アルゴリズムの公理解析を行い、提案した公理に準拠するかどうかを判断する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:32:41 GMT)
Can We Trust the Performance Evaluation of Uncertainty Estimation Methods in Text Summarization? [28.3] 4次元にわたる31個のNLGメトリクスを包含した包括的UE-TSベンチマークを導入する。
このベンチマークは、3つのデータセット上で2つの大きな言語モデルと1つの事前訓練された言語モデルの不確実性推定能力を評価する。
本研究は,複数の非相関性NLG指標と多様な不確実性推定手法を検討することの重要性を強調した。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:40:24 GMT)
Guaranteed Generation from Large Language Models [28.2] 大規模言語モデル(LLM)は、様々なアプリケーションでますます使われている。
本稿では, 自己回帰的提案分布と拒絶サンプリングを組み合わせた, 単純かつ効果的なアプローチであるGUARDを提案する。
これらの実験により、GUARDは予測効率を高く向上した理想分布をほぼ保ちながら、完全な制約満足度を達成することが示された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:39:55 GMT)
Staircase Cascaded Fusion of Lightweight Local Pattern Recognition and Long-Range Dependencies for Structural Crack Segmentation [28.2] 本稿では,最小限の計算資源を用いて高品質な亀裂分節マップを生成する階段型亀裂分節ネットワーク(CrackSCF)を提案する。
そこで我々は,局所的な亀裂パターンと画素の長距離依存性を効果的に捉えた階段列融合モジュールを構築した。
モデルが必要とする計算資源を削減するため,ネットワーク内のすべての畳み込み操作を置き換える軽量な畳み込みブロックを導入した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:58:37 GMT)
Cluster-wise Graph Transformer with Dual-granularity Kernelized Attention [27.3] グラフを,各クラスタを1つの埋め込みに圧縮することなく,相互接続したノード集合のネットワークとして想定する。
これらのノード間の効果的な情報伝達を実現するために,ノード間クラスタアテンション(N2C-Attn)機構を提案する。
N2C-Attnがクエリとキーの2レベル特徴マップを組み合わせる方法を示し、二重粒度情報をマージする能力を示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:30:01 GMT)
Open-RGBT: Open-vocabulary RGB-T Zero-shot Semantic Segmentation in Open-world Environments [27.2] オープン語彙RGB-TセマンティックセマンティックセグメンテーションモデルであるOpen-RGBTを提案する。
カテゴリ理解を高めるために視覚的プロンプトを取り入れたインスタンスレベルの検出提案を行う。
画像とテキストの類似性を評価するためにCLIPモデルを使用し、セマンティックな一貫性を補正し、カテゴリ識別におけるあいまいさを軽減する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:22:28 GMT)
MedImageInsight: An Open-Source Embedding Model for General Domain Medical Imaging [27.1] 我々は、オープンソースの医療画像埋め込みモデルであるMedImageInsightを紹介する。
MedImageInsightは、さまざまなドメインのコレクションに関連付けられたテキストとラベルを持つ医療画像に基づいて訓練されている。
厳密な評価は、MedImageInsightが最先端(SOTA)または人間の専門家レベルのパフォーマンスを、分類、画像画像検索、微調整タスクで達成する能力を示している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:36:47 GMT)
Which Programming Language and What Features at Pre-training Stage Affect Downstream Logical Inference Performance? [26.9] 大規模言語モデル(LLM)は、数学や論理的推論タスクにおいて顕著な一般化能力を示している。
本研究の目的は,事前学習中の言語と特徴が論理推論性能にどのような影響を及ぼすかを検証することである。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:13:13 GMT)
TASAR: Transfer-based Attack on Skeletal Action Recognition [26.7] ヒト活動認識(HAR)における骨格配列の役割
既存のスケルトンベースのHAR(S-HAR)攻撃は、主にホワイトボックスのシナリオ用に設計されており、弱い対向性を示す。
textbfTransfer-based textbfAttack on textbfSkeletal textbfAction textbfRecognition, TASARを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:33:04 GMT)
Exploring Adversarial Robustness of Deep State Space Models [26.7] 対人訓練(Adversarial Training、AT)は、対人ロバストネス(AR)を高める主要なアプローチである
純粋なSSM構造はATの恩恵を受けるのに苦労する一方で、注意を取り入れることによってロバスト性と一般化のトレードオフが著しく向上することを示す。
我々は、ロバストオーバーフィッティング(RO)の問題を導入することなく、AT性能を注意統合SSMに近づける、シンプルで効果的な適応スケーリング(AdS)機構を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 02:28:56 GMT)
Motion and Structure from Event-based Normal Flow [26.5] ニューロモルフィックなイベントベースカメラは、この根本的な問題を解決するために、生のイベントデータを入力として利用するアプローチに非常に要求する。
既存の最先端ソリューションは、通常、イベントデータ生成プロセスを反復的に反転することによって暗黙的にデータアソシエーションを推測する。
事象に基づく正規フローは、幾何学的問題群を解く際のフルフローの代替として、提案した幾何学的誤り項を介して利用できることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:59:51 GMT)
From Generalist to Specialist: Adapting Vision Language Models via Task-Specific Visual Instruction Tuning [26.2] 大きな視覚言語モデル(VLM)は、大きな言語モデルと視覚エンコーダを組み合わせて、様々なタスクにおける約束を示す。
タスク特化モデル(TSM)を統合することで、VLMのタスク特化性を高める新しいフレームワークであるVITaskを紹介する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:24:04 GMT)
Rodimus*: Breaking the Accuracy-Efficiency Trade-Off with Efficient Attentions [26.0] RodimusはTransformerベースの大規模言語モデル(LLM)のための新しいタイプのアテンションシステムである。
Rodimusは、線形アテンションベースで純粋にリカレントなフレームワーク内で、データ依存のテンプレート選択機構を採用している。
実験の結果,1兆トークンでトレーニングしたRodimus$+$-1.6Bは,より多くのトークンでトレーニングしたモデルに対して,より優れたダウンストリーム性能を実現することがわかった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:22:36 GMT)
Sylber: Syllabic Embedding Representation of Speech from Raw Audio [25.7] クリーンでロバストな音節構造を持つ音声表現を生成する新モデルSylberを提案する。
具体的には,教師モデルの指数移動平均である教師モデルから抽出した音節セグメントの特徴を回帰する自己教師型モデルを提案する。
1) 高速で線形な音節分割アルゴリズム,2) 平均4.27トークン毎の効率的な音節トークン化,3) 語彙的・構文的理解に適した音節単位。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:59:04 GMT)
MatMamba: A Matryoshka State Space Model [24.9] MatMambaはMatryoshkaスタイルの学習とMamba2を組み合わせた状態空間モデルである。
MatMambaは、様々なモデルサイズにまたがる効率的で適応的なデプロイメントを可能にする。
言語モデルと画像モデルは,35Mから1.4Bまでのパラメータサイズで訓練する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:41:34 GMT)
PFAttack: Stealthy Attack Bypassing Group Fairness in Federated Learning [24.7] フェデレーテッド・ラーニング(FL)は、異なる集団に対して偏見のない決定を下すグローバルモデルを、クライアントが共同でトレーニングすることを可能にする。
これまでの研究では、FLシステムは毒殺攻撃のモデルに弱いことが示されている。
本研究では,グローバルモデル精度を低下させるのではなく,公平性メカニズムを回避することを目的としたPFATTACK(Profit-driven Fairness Attack)を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:23:07 GMT)
Exploiting Positional Bias for Query-Agnostic Generative Content in Search [24.6] 検索結果における非関連テキストの位置に悪影響を及ぼすことなく、文書に非関連テキストを注入できることを示す。
非関連テキストの文脈化は、既存のコンテンツフィルタリング機構を回避しつつ、ネガティブな効果をさらに減少させる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 08:52:33 GMT)
Towards Interpreting Visual Information Processing in Vision-Language Models [24.5] VLM(Vision-Language Models)は、テキストや画像の処理と理解のための強力なツールである。
著名なVLMであるLLaVAの言語モデルコンポーネントにおける視覚トークンの処理について検討する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:55:02 GMT)
Bayes-Nash Generative Privacy Protection Against Membership Inference Attacks [24.3] 本稿では,データ共有機構出力のプライバシ保護のためのゲームモデルを提案する。
本稿では,ベイズ・ナッシュ生成プライバシ(BNGP)とベイズ生成プライバシ(BGP)のリスクについて紹介する。
本手法は要約統計の共有に応用され、MIAは集約データからでも個人を識別できる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:29:04 GMT)
HAHA: Highly Articulated Gaussian Human Avatars with Textured Mesh Prior [24.1] HAHAは単眼入力ビデオからヒトアバターをアニマタブルに生成するための新しいアプローチである。
SMPL-Xパラメトリックモデルを用いて全身のアバターをアニメーション化しレンダリングする効率を実証する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:00:51 GMT)
FedL2G: Learning to Guide Local Training in Heterogeneous Federated Learning [23.9] 不均一フェデレートラーニング(HtFL)のシナリオでは、モデルパラメータの集約は、アグリゲーションとガイダンスのためのプロトタイプの使用につながる。
本研究では,ローカル設定のガイドを適応的に学習し,クライアントの本来の設定に付加的なガイダンスが有用であることを保証できるFedL2G(Training-to-Guide)手法を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:31:49 GMT)
Do better language models have crisper vision? [23.9] テキストのみのLarge Language Models (LLMs)は、ビジュアル世界をどのように把握するか?
本稿では,ビジュアルワールドに適合する言語モデルを実現するキープロパティを分離するためのVisual Text Representation Benchmark (ViTeRB)を提案する。
これらの知見に基づいて,超軽量CLIP様モデルであるShareLockを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:59:33 GMT)
MoDEM: Mixture of Domain Expert Models [23.8] 大規模言語モデル(LLM)の性能と効率を向上させる新しい手法を提案する。
本稿では、BERTベースのルータを用いて、最も適切なドメインエキスパートモデルに入力プロンプトを指示するシステムを提案する。
本研究は,本手法が同等の大きさの汎用モデルを大幅に上回ることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 23:52:54 GMT)
DTVLT: A Multi-modal Diverse Text Benchmark for Visual Language Tracking Based on LLM [23.6] 我々は,VLTとSOTの5つのベンチマークに基づいて,多種多様なテキストを用いた新しい視覚言語追跡ベンチマークDTVLTを提案する。
セマンティック情報の範囲と密度を考慮して、ベンチマークで4つのテキストを提供する。
我々はDTVLTの総合的な実験分析を行い、多種多様なテキストが追跡性能に与える影響を評価する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:07:15 GMT)
DTVLT: A Multi-modal Diverse Text Benchmark for Visual Language Tracking Based on LLM [23.6] 我々は,VLTとSOTの5つのベンチマークに基づいて,多種多様なテキストを用いた新しい視覚言語追跡ベンチマークDTVLTを提案する。
セマンティック情報の範囲と密度を考慮して、ベンチマークで4つのテキストを提供する。
我々はDTVLTの総合的な実験分析を行い、多種多様なテキストが追跡性能に与える影響を評価する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:07:15 GMT)
DTLLM-VLT: Diverse Text Generation for Visual Language Tracking Based on LLM [23.6] Visual Language Tracking (VLT)は、指定されたオブジェクトの正確な追跡のために、ビデオから自然言語記述を統合することで、単一のオブジェクト追跡(SOT)を強化する。
ほとんどのVLTベンチマークは、単一の粒度で注釈付けされており、科学的ガイダンスを提供するための一貫性のあるセマンティックフレームワークが欠如している。
DTLLM-VLTは,環境の多様性を高めるために,多粒度テキストを自動的に生成する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:13:00 GMT)
LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management [23.4] ハードウェアの追加や出力性能の向上を必要とせずにTTFTを効果的に削減する,シンプルで効果的なプラグイン手法であるLayer KVを提案する。
レイヤKVは、システムメモリのきめ細かい制御のために、レイヤワイズなKVブロック割り当て、管理、オフロードを導入します。
様々なGPU構成の7Bから70Bパラメータを含む代表モデルの包括的な評価は、Layer KVがTTFTレイテンシを69倍に改善し、SLO違反率を28.7%削減することを示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:40:31 GMT)
LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management [23.4] ハードウェアの追加や出力性能の向上を必要とせずにTTFTを効果的に削減する,シンプルで効果的なプラグイン手法であるLayer KVを提案する。
レイヤKVは、システムメモリのきめ細かい制御のために、レイヤワイズなKVブロック割り当て、管理、オフロードを導入します。
様々なGPU構成の7Bから70Bパラメータを含む代表モデルの包括的な評価は、Layer KVがTTFTレイテンシを69倍に改善し、SLO違反率を28.7%削減することを示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:40:31 GMT)
LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management [23.4] ハードウェアの追加や出力性能の向上を必要とせずにTTFTを効果的に削減する,シンプルで効果的なプラグイン手法であるLayer KVを提案する。
Layer KVは、レイヤワイドなKVブロック割り当て、管理、システムメモリのきめ細かい制御のためのオフロードを導入し、SLO対応スケジューラと組み合わせて、サービスレベルオブジェクト(SLO)全体を最適化する。
さまざまなGPU構成の7Bから70Bパラメータを含む代表モデルの包括的な評価は、Layer KVがTTFTレイテンシを最大11倍改善し、SLO違反率を28.7%削減することを示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:40:31 GMT)
On the Byzantine-Resilience of Distillation-Based Federated Learning [22.8] ビザンチン環境下でのフェデレートラーニング(FL)アルゴリズムの性能について検討した。
KDをベースとしたFLアルゴリズムは極めて弾力性があり、ビザンチンクライアントが学習プロセスにどのように影響するかを分析する。
KDに基づくFLアルゴリズムのビザンチンレジリエンスを向上させる新しい防御法を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:38:26 GMT)
Dynamic metastability in the self-attention model [22.7] 本稿では,トランスフォーマーの玩具モデルとして機能する自己認識モデル(単位球上の相互作用粒子系)について考察する。
我々は[GLPR23]で予想される動的メタスタビリティの出現を証明する。
適切な時間再スケーリングの下では、エネルギーは有限時間で世界最大に達し、階段の形状を持つことを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:50:50 GMT)
Decompose and Compare Consistency: Measuring VLMs' Answer Reliability via Task-Decomposition Consistency Comparison [22.4] 信頼性測定のための分解・比較一貫性(DeCC)を提案する。
VLMの内部推論プロセスを用いて生成した直接解の一貫性を比較することにより、DeCCはVLMの直接解の信頼性を測定する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:03:26 GMT)
RobustEMD: Domain Robust Matching for Cross-domain Few-shot Medical Image Segmentation [22.4] Few-shot Medical Image segmentation (FSMIS) は、医療画像分析の範囲内で限られたデータ学習を行うことを目的としている。
現在のFSMISモデルは、すべてトレーニングされ、同じデータドメインにデプロイされます。
特定の医療画像領域にまたがってFSMISモデルを一般化するにはどうすればいいのか?
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:57:34 GMT)
RobustEMD: Domain Robust Matching for Cross-domain Few-shot Medical Image Segmentation [22.4] Few-shot Medical Image segmentation (FSMIS) は、医療画像分析の範囲内で限られたデータ学習を行うことを目的としている。
現在のFSMISモデルは、すべてトレーニングされ、同じデータドメインにデプロイされます。
特定の医療画像領域にまたがってFSMISモデルを一般化するにはどうすればいいのか?
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:57:34 GMT)
Latent Diffusion Bridges for Unsupervised Musical Audio Timbre Transfer [22.3] 音楽の音色伝達は、メロディック構造を保ちながら、音声信号の音色特性を変更することを伴う。
本稿では,CocoChoralesデータセットを用いて訓練した二層拡散ブリッジに基づく新しい手法を提案する。
Fr'echet Audio Distance (FAD) とメロディ保存をVAEGANとGFBと比較して低ピッチ距離 (DPD) で再現できることを示す実験結果を得た。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:11:47 GMT)
MaD-Scientist: AI-based Scientist solving Convection-Diffusion-Reaction Equations Using Massive PINN-Based Prior Data [22.3] 科学的基礎モデル(SFM)にも同様のアプローチが適用できるかどうかを考察する。
数学辞書の任意の線形結合によって構築された偏微分方程式(PDE)の解の形で、低コストな物理情報ニューラルネットワーク(PINN)に基づく近似された事前データを収集する。
本研究では,1次元対流拡散反応方程式に関する実験的な証拠を提供する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 00:52:00 GMT)
Quest: Query-centric Data Synthesis Approach for Long-context Scaling of Large Language Model [22.1] 本稿では,クエストと略されるクエリ中心のデータ合成手法を提案する。
我々は、複数の長文ベンチマークデータセットにおいて、コンテキスト長128kまでの長文データセットを合成し、他のデータ合成方法よりも大幅に優れています。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:14:22 GMT)
Quest: Query-centric Data Synthesis Approach for Long-context Scaling of Large Language Model [22.1] Questはクエリ中心のデータメソッドで、セマンティックに関連があるが多様なドキュメントを集約する。
生成モデルを使用して、ドキュメント毎の潜在的なクエリを予測し、同様のクエリとキーワードでドキュメントをグループ化する。
実験では、Questの長文タスクにおける優れたパフォーマンスを示し、最大100万トークンのコンテキスト長で顕著な結果が得られる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:14:22 GMT)
Language Models as Hierarchy Encoders [22.0] 階層変換器エンコーダ(HiTs)として再学習トランスフォーマーエンコーダを用いたLMを提案する。
本手法は, 埋込次元に適応する曲率を持つポアンカー球内に, 予め学習したLMの出力埋め込み空間を定めている。
予め訓練したLM, 標準微調整されたLM, およびいくつかの双曲埋め込みベースラインに対するHiTsの評価を行った。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 20:51:58 GMT)
Efficient Evaluation Methods for Neural Architecture Search: A Survey [22.0] 多くの効率的な評価手法 (EEM) が提案されている。
既存のEEMは、これらのEEMを構築するために訓練されたDNNの数に基づいて、4つのカテゴリに分けられる。
この話題における今後の研究の方向性を明らかにするための課題と課題について論じる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:07:20 GMT)
Functional-level Uncertainty Quantification for Calibrated Fine-tuning on LLMs [21.9] 大規模言語モデル(LLM)のためのキャリブレートファインチューニング(UQ4CT)のための関数レベル不確実性定量化を提案する。
UQ4CTは5ドルのベンチマークで高い精度を維持しつつ、期待エラー(ECE)を25%以上削減することを示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 00:09:15 GMT)
Effective Exploration Based on the Structural Information Principles [21.7] 本稿では,新しい構造情報原則に基づく有効探索フレームワーク,すなわちSI2Eを提案する。
SI2Eは, 最終性能と試料効率に関して, 最先端の探査基準を著しく上回ることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:19:16 GMT)
Faithful Interpretation for Graph Neural Networks [21.6] FGAI(Fhithful Graph Attention-based Interpretation)という新しい概念を導入する。
FGAIには、安定性と解釈に対する感受性と最終的な出力分布に関する4つの重要な特性がある。
実験により,FGAIは優れた安定性を示し,様々な形態の摂動とランダム性の下で注意の解釈可能性を維持することが示された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:47:12 GMT)
OledFL: Unleashing the Potential of Decentralized Federated Learning via Opposite Lookahead Enhancement [21.4] 分散フェデレートラーニング(DFL)は、より高速なトレーニング、プライバシ保護、ライトコミュニケーションという観点で、フェデレーションラーニング(CFL)を超越している。
しかし、DFLは一般化能力の観点からもCFLと大きな相違が見られる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:16:14 GMT)
A Utility-Mining-Driven Active Learning Approach for Analyzing Clickstream Sequences [21.4] 本研究では、SHAP値(HUSPM-SHAP)モデルを用いた高ユーティリティシーケンスパターンマイニングを提案する。
本研究は,電子商取引データ処理を改良し,より合理化され,コスト効率のよい予測モデルに向けたモデルの有効性を示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:44:02 GMT)
CMMD: Contrastive Multi-Modal Diffusion for Video-Audio Conditional Modeling [21.4] ビデオとオーディオの双方向条件生成に適したマルチモーダル拡散モデルを提案する。
本稿では,視覚と聴覚の同期を改善するために,協調学習損失を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:49:58 GMT)
RouteFinder: Towards Foundation Models for Vehicle Routing Problems [21.3] RouteFinderは、異なる車両ルーティング問題(VRP)に対処するためのフレームワークである。
我々の中核的な考え方は、VRPの基盤モデルは、異なる属性を備えた一般化問題のサブセットとして、それぞれを扱い、変分を表現することができるべきである、ということである。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:23:24 GMT)
Toward Robust Real-World Audio Deepfake Detection: Closing the Explainability Gap [20.9] 現在のAI駆動のオーディオディープフェイク検出ソリューションは、現実世界の設定における説明可能性や過小評価を欠いている。
本稿では,最先端のトランスフォーマーを用いたオーディオディープフェイク検出のための新しい説明可能性手法と,実世界の一般化のための新しいベンチマークをオープンソース化する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:08:28 GMT)
Standard Gaussian Process Can Be Excellent for High-Dimensional Bayesian Optimization [20.9] 本研究では,Maternカーネルが高次元問題において,標準BOが一貫した最上位結果が得られることを示す。
また,SEカーネルの故障は長大パラメータの不適切な初期化に起因することを示す。
本研究は,高次元環境下での標準BOの可能性の再評価を提唱する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 02:58:27 GMT)
Tree of Problems: Improving structured problem solving with compositionality [20.7] 大規模言語モデル(LLM)は、コンテキスト内学習を通じて、複数のタスクにまたがる顕著なパフォーマンスを示す。
Tree of Problems (ToP)は、ToTのよりシンプルなバージョンであり、我々は、同一のサブタスクに分割できる複雑なタスクに対して、よりうまく機能すると仮定する。
実験の結果,提案手法はToTやGoTよりも優れており,複雑な推論タスクではCoTよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:35:46 GMT)
Astute RAG: Overcoming Imperfect Retrieval Augmentation and Knowledge Conflicts for Large Language Models [20.6] 現実的な条件下での制御分析により,不完全検索の増大は避けられず,極めて有害である可能性が示唆された。
本稿では,LLMの内部知識から必須情報を適応的に抽出する新しいRAG手法であるAstute RAGを提案する。
さらに分析した結果, Astute RAG は知識紛争を効果的に解決し,RAG システムの信頼性と信頼性を向上させることが判明した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:59:58 GMT)
DRUPI: Dataset Reduction Using Privileged Information [20.6] データセットリダクション(DR)は、ターゲットタスクのパフォーマンスを維持しながら、大規模なデータセットからより小さなサブセットにサンプルを選択または蒸留する。
本稿では,DRUPI(Privleged Information)を用いたデータセットリダクションについて紹介する。
我々の研究結果によると、効果的な特徴ラベルは過度に差別的かつ過度に多様性があり、中程度のレベルがデータセットの有効性を改善するのに最適であることが判明した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:52:54 GMT)
DRUPI: Dataset Reduction Using Privileged Information [20.6] データセットリダクション(DR)は、ターゲットタスクのパフォーマンスを維持しながら、大規模なデータセットからより小さなサブセットにサンプルを選択または蒸留する。
本稿では,DRUPI(Privleged Information)を用いたデータセットリダクションについて紹介する。
我々の研究結果によると、効果的な特徴ラベルは過度に差別的かつ過度に多様性があり、中程度のレベルがデータセットの有効性を改善するのに最適であることが判明した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:52:54 GMT)
OpenGraph: Towards Open Graph Foundation Models [20.4] 本研究では,多種多様なグラフデータに存在する複雑なトポロジ的パターンを理解するための一般グラフ基盤モデルを構築した。
本稿では,グラフモデルに統一的なグラフトークン化手法を提案する。
また,グローバルなトポロジ的コンテキスト内のノード依存性を効果的にキャプチャするスケーラブルなグラフ変換器を開発した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:10:38 GMT)
OpenGraph: Towards Open Graph Foundation Models [20.4] グラフニューラルネットワーク(GNN)は、構造情報を符号化するための有望な技術として登場した。
主な課題は、異なる性質を持つグラフデータを一般化することの難しさである。
この課題に対処するために,OpenGraphと呼ばれる新しいグラフ基盤モデルを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:10:38 GMT)
Weak-eval-Strong: Evaluating and Eliciting Lateral Thinking of LLMs with Situation Puzzles [20.2] SPLATは,Large Language Models (LLMs) の側方的思考を評価・引き起こすためのコンディションパズルを利用したベンチマークである。
このベンチマークは、3つの難易度で975グレードのシチュエーションパズルを含むもので、従来のモデルに基づく評価ではなく、新しいマルチターンプレーヤジャッジフレームワークを採用している。
実験により、WizardLM-2のような頑健な評価モデルが、中間質問回答と最終シナリオの精度の両方において、人間の判断と密接に一致していることが示されている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:09:11 GMT)
AuditWen:An Open-Source Large Language Model for Audit [20.2] 本研究では、Qwenを微調整し、監査領域から命令データを構築するオープンソースの監査LCMであるAuditWenを紹介する。
我々は、15の監査タスクと3つのレイヤから28kの命令データセットを構築したQwenを微調整することで、AuditWenと呼ばれる監査LPMを提案する。
評価段階において、アプリケーションシナリオから派生した重要な監査タスクのセットをカバーする3k命令のベンチマークを提案した。
実験の結果,AuditWenは質問理解と回答生成の両方において優れた性能を示し,即時評価ツールとなった。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 02:28:55 GMT)
Mitigating Time Discretization Challenges with WeatherODE: A Sandwich Physics-Driven Neural ODE for Weather Forecasting [20.1] 天気予報精度を向上させるために,新しい物理駆動型常微分方程式(ODE)モデルを提案する。
波動方程式理論の活用と時間依存ソースモデルの統合により、気象学は時分割誤差や動的大気過程に関連する課題を効果的に解決する。
気象予報は, 気象予報と地域気象予報の双方において優れた性能を示し, 近年の最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 05:41:24 GMT)
ERCache: An Efficient and Reliable Caching Framework for Large-Scale User Representations in Meta's Ads System [20.1] ERCacheは、ソーシャルネットワーク上の広告レコメンデーションシステムにおいて、大規模ユーザ表現のための効率的で堅牢なキャッシュフレームワークである。
ERCacheは6ヶ月以上Metaにデプロイされ、30以上のランキングモデルをサポートする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:51:27 GMT)
Cell Tracking according to Biological Needs -- Strong Mitosis-aware Multi-Hypothesis Tracker with Aleatoric Uncertainty [20.0] 動作推定のための不確実性推定手法を導入し,多仮説追跡フレームワークを拡張した。
我々の不確実性推定は、問題固有のテスト時間拡張を用いて、運動表現を確率論的空間密度に引き上げる。
我々の枠組みでは、明示的な生物学的知識は割り当てコストでモデル化される。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 07:21:56 GMT)
Towards xAI: Configuring RNN Weights using Domain Knowledge for MIMO Receive Processing [20.0] 我々は、無線通信の物理層における説明可能なAI(xAI)の分野を前進させる。
私たちはその仕事に集中する。
MIMO-OFDMは、リザーブコンピューティング(RC)フレームワークを使用した処理(シンボル検出など)を受信する。
リカレントニューラルネットワーク(RNN)の中で
本稿では,信号処理をベースとした第1原理によるRCの動作の理解について述べる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:16:11 GMT)
LaMP: Language-Motion Pretraining for Motion Generation, Retrieval, and Captioning [19.8] この新しいLanguage-Motion PretrainingモデルであるLaMPを紹介する。
LaMPは、モーションインフォームティブなテキスト埋め込みを生成し、生成されたモーションシーケンスの関連性とセマンティックスを大幅に強化する。
キャプションでは,言語非表現の動作特徴を持つ大きな言語モデルを微調整し,強力な動きキャプションモデルを開発する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:33:03 GMT)
Forgetting Through Transforming: Enabling Federated Unlearning via Class-Aware Representation Transformation [19.5] Federated Unlearning (FU)は、クライアントがトレーニングされた学習モデルから特定のデータの影響を選択的に除去することを可能にする。
既存のFU法は、有効消去とモデルユーティリティ保存のバランスをとるのに苦労することが多い。
クラス認識表現変換(FUCRT)によるフェデレーション・アンラーニングを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:08:14 GMT)
Federated Impression for Learning with Distributed Heterogeneous Data [19.5] フェデレートラーニング(FL)は、データを共有することなく、クライアント間で分散データセットから学習できるパラダイムを提供する。
FLでは、データ収集プロトコルや患者人口の多様さにより、異なる保健所のデータに準最適収束が一般的である。
我々は,グローバル情報を表す合成データをフェデレーションとして復元することで,破滅的な忘れを緩和するFedImpresを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:55:01 GMT)
LLM Embeddings Improve Test-time Adaptation to Tabular $Y|X$-Shifts [19.4] 完全に新しく未知の領域に一般化することは不可能である。
ラベル付き例が少なくても,対象領域に適応しやすいモデルについて検討する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 19:46:30 GMT)
DLGNet: Hyperedge Classification through Directed Line Graphs for Chemical Reactions [19.2] 本稿では,有向ハイパーグラフに付随するディレクテッドライングラフ(DGL)の表記法を提案する。
その上に、ハイパーグラフ上での動作を表わすように設計された、初めてのスペクトルベースグラフニューラルネットワーク(GNN)を構築します。
DGLNetは既存のアプローチよりも優れています。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:07:53 GMT)
SBoRA: Low-Rank Adaptation with Regional Weight Updates [19.2] 本稿では,SBORA(Standard Basis LoRA)を提案する。
SBoRAはトレーニング可能なパラメータの数を半分に減らし、LoRAと同様のトレーニング可能なパラメータの数でランクを2倍にする。
本研究は,LoraよりもSBoRA-FAの方が,常識推論や算術推論など,様々な微調整タスクにおいて優れていることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:53:10 GMT)
Neural Circuit Architectural Priors for Quadruped Locomotion [19.0] 自然界では、動物は神経系のアーキテクチャーの形で先駆的に生まれる。
この研究は、ニューラルサーキットがロコモーションに価値あるアーキテクチャ上の先行を提供することを示している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:59:45 GMT)
UniMEEC: Towards Unified Multimodal Emotion Recognition and Emotion Cause [19.0] 感情と感情の因果関係を明らかにするために,統一マルチモーダル感情認識・感情因果分析フレームワーク(UniMEEC)を提案する。
UniMEECは、MERCおよびMECPEタスクをマスク予測問題として再構成し、因果プロンプトテンプレートでそれらを統一する。
4つの公開ベンチマークデータセットの実験結果は、MERCおよびMECPEタスクのモデル性能を検証する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 09:14:17 GMT)
A Benchmark on Directed Graph Representation Learning in Hardware Designs [18.7] 有向グラフ表現学習(DGRL)は、回路網リスト、計算グラフを符号化し、ハードウェア性能予測のための代理モデルを開発する上で重要である。
本研究では,5つのハードウェア設計データセットと,回路抽象化のレベルにまたがる13の予測タスクからなる新しいベンチマークを提案する。
トップパフォーマンスモデルには、BI-MPNN層にインターリーブされたPE強化GTとBI-グラフ同型ネットワークがある。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:32:48 GMT)
Investigating Cost-Efficiency of LLM-Generated Training Data for Conversational Semantic Frame Analysis [18.4] 高品質で高コストな人的データと、低品質で実質的に安価なLDM生成データとのトレードオフのバランスをとる方法を示す。
様々な予算レベルで実施した実験により,人間とLLM生成データを組み合わせた最適コスト効率が得られた。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 05:15:13 GMT)
CriSPO: Multi-Aspect Critique-Suggestion-guided Automatic Prompt Optimization for Text Generation [18.4] 本稿では,CriSPO(Prompt Optimization)アプローチを提案する。
CriSPO はコアコンポーネントとして critique-suggestion モジュールを導入している。
このモジュールは自然にアスペクトを発見し、これらのアスペクト間で生成された参照テキストを比較し、即時修正のための実行可能な提案を提供する。
マルチメトリック最適化によりCrisPOをさらに改善するため、複数のメトリクスにわたるタスクプロンプトのパフォーマンスを向上させるために、自動サフィックスチューニング(AST)拡張を導入する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:29:54 GMT)
CriSPO: Multi-Aspect Critique-Suggestion-guided Automatic Prompt Optimization for Text Generation [18.4] 大規模言語モデル (LLMs) は、プロンプト技術を用いて、ドメイン間の流動的な要約を生成することができる。
キーフレーズをプロンプトに追加することで、ROUGE F1とリコールが改善されることを示す。
本研究は,素早い要約システム構築における有能な情報の活用に関する知見を提供する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:29:54 GMT)
Recurrent Drafter for Fast Speculative Decoding in Large Language Models [18.3] 本稿では,高度な投機的復号法であるRecurrent Drafterを提案する。
大規模言語モデル(LLM)推論の最先端の高速化を実現する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 20:54:02 GMT)
S2HPruner: Soft-to-Hard Distillation Bridges the Discretization Gap in Pruning [18.3] そこで本稿では,S2HPruner という新しい構造微分可能なマスク切断フレームワークを提案し,その差分ギャップを1段階的に橋渡しする。
トレーニング手順では、SH2Prunerはソフトネットワークとそれに対応するハードネットワークの両方を転送し、ソフトネットワークの監督の下でハードネットワークを蒸留する。
S2HPrunerは既存のプルーニング技術と比較して、総合的なベンチマークを微調整することなく、プルーニング性能を超えることができる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:36:45 GMT)
HFH-Font: Few-shot Chinese Font Synthesis with Higher Quality, Faster Speed, and Higher Resolution [18.0] HFH-Fontは高解像度のグリフ画像を効率よく生成できる数ショットフォント合成法である。
プロのフォントデザイナーが手作業で作成したフォントに匹敵する品質の大規模な中国語のベクトルフォントを、初めて自動生成することができる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:30:24 GMT)
FlowDreamer: Exploring High Fidelity Text-to-3D Generation via Rectified Flow [17.9] 本研究では,フロードレーマーという新しいフレームワークを提案し,よりリッチなテキストの詳細とより高速なコンバージェンスで高忠実度な結果を得る。
鍵となる洞察は、修正流れモデルの結合性と可逆性を利用して、対応する雑音を探索することである。
我々は,同じ軌道に沿って3次元モデルを最適化するために,新しい一様マッチング結合(UCM)損失を導入する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:05:53 GMT)
ROSE: Register Assisted General Time Series Forecasting with Decomposed Frequency Learning [17.7] 分解周波数学習(ROSE)を用いた登録型汎用時系列予測モデルを提案する。
ROSEは事前学習タスクに分解周波数学習を採用し、周波数ベースのマスキングと再構成による時系列における意味情報と周期情報を分解し、ドメイン間の統一表現を得る。
大規模時系列データを事前トレーニングした後、ROSEは8つの実世界のベンチマークで最先端の予測性能を達成する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:23:14 GMT)
Deep Learning and Machine Learning, Advancing Big Data Analytics and Management: Object-Oriented Programming [17.6] オブジェクト指向プログラミング(OOP)は、現代のソフトウェアシステムの複雑さの増大を管理するための重要なパラダイムになっています。
この作業は、これらのドメイン内でOOP技術を統合するための包括的な紹介を提供する。
機械学習システムの構造と効率を高めるために,設計パターンとモジュールプログラミングをどのように利用することができるかを検討する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:26:37 GMT)
Deep Learning and Machine Learning, Advancing Big Data Analytics and Management: Object-Oriented Programming [17.6] オブジェクト指向プログラミング(OOP)は、現代のソフトウェアシステムの複雑さの増大を管理するための重要なパラダイムになっています。
この作業は、これらのドメイン内でOOP技術を統合するための包括的な紹介を提供する。
機械学習システムの構造と効率を高めるために,設計パターンとモジュールプログラミングをどのように利用することができるかを検討する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:26:37 GMT)
The Cognitive Capabilities of Generative AI: A Comparative Analysis with Human Benchmarks [17.5] 本研究は、ウェクスラー成人インテリジェンス尺度(WAIS-IV)における大規模言語モデルと視覚言語モデルと人間のパフォーマンスに対するベンチマークである。
ほとんどのモデルは、文字や数字の任意のシーケンスのようなトークンの保存、検索、操作において例外的な機能を示した。
これらの長所にもかかわらず、我々はマルチモーダルモデルから知覚推論指標(PRI)の性能が一貫して劣っていることを観察した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 19:22:26 GMT)
Utilizing Transfer Learning and pre-trained Models for Effective Forest Fire Detection: A Case Study of Uttarakhand [17.5] 森林火災は環境、人命、財産に重大な脅威をもたらす。
従来の森林火災検出手法は、手動観測や衛星画像の信頼性に障害となることが多い。
本稿では、インドにおける森林火災検知の強化におけるトランスファーラーニングの役割を強調した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:21:45 GMT)
SR-PredictAO: Session-based Recommendation with High-Capability Predictor Add-On [17.4] セッションベースのレコメンデーションは、単一のセッションでのみ情報に基づいて、ユーザの次の項目のクリックを予測することを目的としている。
提案するフレームワークは *Session-based Recommendation with Predictor Add-On* (SR-PredictAO) である。
本稿では,ランダムなユーザの振る舞いが予測に与える影響を緩和できる高機能予測モジュールを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 02:27:04 GMT)
Rank Supervised Contrastive Learning for Time Series Classification [17.3] 時系列分類を行うためにRankSCL(Rank Supervised Contrastive Learning)を提案する。
RankSCLは埋め込みスペースにおいて、ターゲットとする方法で生データを増強する。
異なるレベルの正のサンプルに対して異なる重みを割り当てるために、新しいランク損失が開発された。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 18:29:17 GMT)
DiffGAD: A Diffusion-based Unsupervised Graph Anomaly Detector [17.2] 拡散型グラフ異常検出器(DiffGAD)を提案する。
DiffGADの核心は、未熟な宇宙学習のパラダイムであり、それを差別的コンテンツで導くことによって、その習熟度を高めるために細心の注意を払って設計されている。
6つの実世界および大規模データセットを用いて実施したDiffGADの総合評価により,その異常な性能が示された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 05:02:56 GMT)
TorchTitan: One-stop PyTorch native solution for production ready LLM pre-training [17.2] 本稿では,オープンソースのPyTorchネイティブ分散トレーニングシステムであるTorchTitanを紹介する。
最先端のテクニックを統一し、統合を合理化し、オーバーヘッドを減らす。
大型言語モデル (LLM) のLlama 3.1 ファミリー上での TorchTitan の評価を行った。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:26:11 GMT)
Can Transformers Reason Logically? A Study in SAT Solving [17.2] 本研究では, LLMの論理的推論能力について, ブール満足度問題(SAT)の文脈で検討する。
まず,Chain-of-Thought (CoT) によるバックトラックとデダクションを用いてSATを解くデコーダのみの変換器を構築する。
我々は、よく知られたDPLL SAT-solvingアルゴリズムにトレース等価性を示すことによって、その正当性を証明した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:01:52 GMT)
Learning from Spatio-temporal Correlation for Semi-Supervised LiDAR Semantic Segmentation [17.2] 低予算SSLSの2つの大きな問題は、ラベルなしデータに対する品質の悪い擬似ラベルと、パフォーマンスの低下である。
非ラベルデータに対して高精度な擬似ラベルを生成する近接型ラベル推定法を提案する。
実験の結果,低予算環境では顕著な性能を示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:57:39 GMT)
Can DeepFake Speech be Reliably Detected? [17.1] この研究は、最先端のオープンソース音声検出装置に対する能動的悪意のある攻撃に関する最初の体系的研究である。
その結果、敵の脅威が進行する中で、より堅牢な検出方法が緊急に必要であることが明らかとなった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:13:48 GMT)
Adversarial Vulnerability as a Consequence of On-Manifold Inseparibility [17.0] 分類タスクを考慮し,データ分布を低次元多様体として特徴付ける。
クリーントレーニングは、悪条件によるオフマニフォールド方向の収束不良を経験していると論じる。
我々は,長期トレーニングと2次手法の活用によるクリーントレーニングにおいて,実験を行い,大幅な堅牢性向上を示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:18:52 GMT)
Diff-FMT: Diffusion Models for Fluorescence Molecular Tomography [17.0] 拡散確率モデル(DDPM)に基づくFMT再構成手法を提案する。
ステップバイステップの確率サンプリング機構により、画像のきめ細かい再構築を実現し、画像詳細の喪失などの問題を回避する。
Diff-FMTは大規模データセットに頼らずに高解像度の再構成画像が得られることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:41:31 GMT)
Engineering the Nonlinearity of Bosonic Modes with a Multi-loop SQUID [16.8] 工学的な高次非線形性は低次項を抑えながら、ボゾン系の量子誤差補正と状態制御には不可欠である。
NEMSデバイスは、寄生的結合と純粋な立方体、クォート、およびクインティック相互作用を選択的に設計する。
この研究は、量子量子ビット、シミュレーション、センシングに応用可能なボソニックモードの高度で正確な操作を可能にする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:07:40 GMT)
AutoFeedback: An LLM-based Framework for Efficient and Accurate API Request Generation [16.6] AutoFeedbackは、効率的で正確なAPIリクエスト生成のためのフレームワークである。
大規模言語モデルによるAPIリクエストの生成プロセス中に2つのフィードバックループを実装している。
実際のAPIデータセットで100.00%の精度を実現し、GPT-3.5 Turboとのインタラクションコストを23.44%削減し、GPT-4 Turboを11.85%削減する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:38:28 GMT)
Through the Looking Glass: Mirror Schrödinger Bridges [16.1] 密度が不明な対象尺度からのサンプリングは、数学統計学と機械学習の基本的な問題である。
そこで本研究では,ミラー・シュル「オーディンガー橋」と呼ばれるコンディショナル・リサンプリングの新たなモデルを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:48:56 GMT)
Online Bandit Learning with Offline Preference Data [15.8] ノイズの多い選好フィードバックを持つオフラインデータセットでウォームスタートできるオンライン学習のための後部サンプリングアルゴリズムを提案する。
生成したエキスパートの“コンピテンス”をモデル化することで、そのようなデータセットを最も効果的に利用できることを示します。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 07:21:30 GMT)
Locally distinguishing a maximally entangled basis using shared entanglement [15.7] 最大交叉直交基底の要素を識別する最適な成功確率の正確な式を導出する。
また、不完全正則な最大絡み合う基底の要素を識別する成功確率について、下限と上限を提示する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:16:22 GMT)
Beyond the Visible: A Survey on Cross-spectral Face Recognition [15.5] クロススペクトル顔認識 (CFR) とは、異なるスペクトル帯から生じる顔画像を用いて個人を認識することを指す。
近年のディープニューラルネットワーク(DNN)の進歩により、CFRシステムの性能が大幅に向上した。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 01:02:59 GMT)
Herald: A Natural Language Annotated Lean 4 Dataset [15.4] 本稿では,Mathlib4コーパス(形式言語Lean 4における数学の統一ライブラリ)を自然言語に翻訳するための新しいフレームワークを提案する。
私たちはこのパイプラインの結果をHeraldとしてMathlib4で発表します(階層とレトリバルベースのトランスレーショナルリーン)。
また,Heraldを微調整したHerald Translatorを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:11:24 GMT)
Exploring Efficient Foundational Multi-modal Models for Video Summarization [15.4] このようなビデオ基礎モデルは、各モダリティ固有モデルからの出力を同じ埋め込み空間にアライメントすることで事前学習を行う。
本稿では,各入力モダリティから生成したテキストを言語モデルに組み込んだプラグイン・アンド・プレイ型ビデオ言語モデルを提案する。
プラグアンドプレイ方式とベースラインチューニング方式のパフォーマンスと計算コストを比較した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:07:06 GMT)
From Pixels to Tokens: Revisiting Object Hallucinations in Large Vision-Language Models [15.4] 大型視覚モデル(LVLM)における幻覚は、視覚入力に表示されない物体を生成するという重要な課題である。
最近の研究では、幻覚は視覚的な入力の理解の欠如に起因しているが、より根本的な問題は無視されている。
本稿では,LVLMの幻覚をアーキテクチャの観点から再検討し,視覚エンコーダ(機能抽出)とモーダルアライメントモジュール(機能デカップリング)の主な原因について検討する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:46:32 GMT)
Noise is All You Need: Private Second-Order Convergence of Noisy SGD [15.3] プライバシーのために必要となるノイズは、標準の滑らか性仮定の下で既に二階収束を示唆していることが示される。
DP-SGDは、最小限の仮定の下で、二階定常点を見つけるために使用できる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:43:17 GMT)
The Geometry of Categorical and Hierarchical Concepts in Large Language Models [15.1] 線形表現仮説の形式化をベクトルとして(例:is_animal)特徴を表現するために拡張する方法を示す。
形式化を用いて、概念の階層構造とそれらの表現の幾何学との関係を証明する。
我々はこれらの理論結果をGemmaとLLaMA-3大言語モデルで検証し、WordNetのデータを用いて900以上の階層的な概念の表現を推定する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:39:11 GMT)
Measuring Diversity of Game Scenarios [15.1] 我々は,現在の文学と実践のギャップを埋めることを目指しており,ゲームシナリオにおける多様性の測定と統合のための効果的な戦略に関する洞察を提供する。
この調査は、様々なゲームシナリオにおける将来の研究の道筋を示すだけでなく、多様性をゲームデザインと開発の重要な要素として活用しようとする業界の実践者のためのハンドブックとしても機能する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 05:58:58 GMT)
Break the Visual Perception: Adversarial Attacks Targeting Encoded Visual Tokens of Large Vision-Language Models [15.0] 大きな視覚言語モデル(LVLM)は、視覚情報を大きな言語モデルに統合し、目覚ましい多モーダルな会話能力を示す。
一般に、LVLMは視覚エンコーダに頼って画像を視覚トークンに変換するが、これは言語モデルが画像の内容を効果的に知覚するのに不可欠である。
本稿では,VT-Attackと呼ばれる非標的攻撃手法を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:06:56 GMT)
Understanding Model Ensemble in Transferable Adversarial Attack [14.9] まず、逆転送可能性の誤差を測定するために、転送可能性誤差を定義する。
次に、転送可能性エラーを脆弱性、多様性、定数に分解する。
本稿では,情報理論における最新の数学的ツールを用いて,複雑性と一般化項を用いて伝達可能性誤差を限定する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:14:11 GMT)
Nuclear Norm Regularization for Deep Learning [14.8] 深層学習に適した手法を用いて,ジャコビアン核規範を効果的に適用する方法を示す。
提案手法は単純,効率的,高精度であり,ヤコビアン核の正規化を高次元深層学習問題に拡張することができる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 18:25:15 GMT)
Sparse Autoencoders Reveal Universal Feature Spaces Across Large Language Models [14.6] 特徴普遍性を実証することで、潜在表現に関する発見が複数のモデルにまたがって一般化される。
辞書学習(Dictionary Learning)と呼ばれる手法を用いて、LSMの活性化を個々の特徴に対応するニューロンにまたがる解釈可能な空間に変換する。
実験により,SAE特徴空間の様々な LLM における顕著な類似性が明らかとなり,特徴普遍性を示す新たな証拠が得られた。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:18:57 GMT)
Secure Video Quality Assessment Resisting Adversarial Attacks [14.6] 近年の研究では、既存のVQAモデルの敵攻撃に対する脆弱性が明らかにされている。
本稿では,既存のVQAモデルにセキュリティを持たせることを目的とした,一般敵防衛の原則について検討する。
セキュリティ指向の観点から,SecureVQAと呼ばれる新しいVQAフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:27:06 GMT)
Evidence-Focused Fact Summarization for Knowledge-Augmented Zero-Shot Question Answering [14.4] 本稿では,QA(Quesetion Answering)の性能向上を目的とした,エビデンスに着目したFact SummarizationフレームワークであるEFSumを提案する。
実験の結果,EFSumはLDMのゼロショットQA性能を向上することがわかった。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:46:40 GMT)
CursorCore: Assist Programming through Aligning Anything [14.4] 本稿では,情報ソースの統合,データ収集,モデルのトレーニング,性能評価を行う新しい対話型フレームワークを提案する。
CursorCoreは同等のサイズの他のモデルよりも優れています。
このフレームワークは、インラインチャットや自動編集などのアプリケーションを統合することで、コーディングアシスタントの進歩に貢献している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:45:52 GMT)
Distribution of quantum gravity induced entanglement in many-body systems [14.4] 空間的に重畳された量子状態にある2つの遠距離試験質量が、相互重力相互作用により絡み合っていることを示す。
この処理を多体システムに拡張し,時間進化状態の絡み合い特性について検討する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:19:26 GMT)
Universal Vulnerabilities in Large Language Models: Backdoor Attacks for In-context Learning [14.0] In-context Learningは、事前学習と微調整のギャップを埋めるパラダイムであり、いくつかのNLPタスクにおいて高い有効性を示している。
広く適用されているにもかかわらず、コンテキスト内学習は悪意のある攻撃に対して脆弱である。
我々は、コンテキスト内学習に基づく大規模言語モデルをターゲットに、ICLAttackという新しいバックドアアタック手法を設計する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:46:24 GMT)
Training Overhead Ratio: A Practical Reliability Metric for Large Language Model Training Systems [13.9] 大規模言語モデル(LLM)は、優れた能力でAI産業に革命をもたらしている。
これらのモデルのトレーニングには、大規模なGPUクラスタと大幅な計算時間が必要で、頻繁な障害が発生する。
本稿では, 耐故障性LLMトレーニングシステムの信頼性を評価するために, emphTraining Overhead Ratio (TOR) と呼ばれる新しい信頼性指標を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:43:25 GMT)
OpenDriver: An Open-Road Driver State Detection Dataset [13.8] 本稿では,運転状態検出のための大規模マルチモーダル運転データセット OpenDriver を提案する。
OpenDriverは合計3,278回の運転で、信号収集期間は約4,600時間である。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:40:16 GMT)
Who's in and who's out? A case study of multimodal CLIP-filtering in DataComp [13.7] 画像テキストデータフィルタリングにはバイアスがあり、値レイデンであることを示す。
いくつかの差し迫った人口集団に関するデータは、排除率の上昇に関連している。
私たちの結論は、データセットの作成とフィルタリングのプラクティスに根本的な変更が必要であることを示している。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 19:34:13 GMT)
Generative Topology for Shape Synthesis [13.6] 我々はポイントクラウド上での形状生成タスクのための新しいフレームワークを開発する。
提案モデルでは, 復元作業や生成作業の質が高く, 効率の良い潜在空間を確保でき, 既存の手法よりも桁違いに高速である。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 17:19:22 GMT)
One Initialization to Rule them All: Fine-tuning via Explained Variance Adaptation [13.6] 最も一般的に使われている微調整法は、ローランク適応(LoRA)を介してトレーニング済みの重量を更新することである。
我々は,活性化のミニバッチ上での特異値分解を計算し,新しい重みをデータ駆動方式で初期化することによりLoRAを強化することを提案する。
EVAを言語生成や理解から画像分類や強化学習まで,さまざまな微調整タスクに適用する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:59:06 GMT)
Learn from Real: Reality Defender's Submission to ASVspoof5 Challenge [13.5] ASVspoofチャレンジは、検出モデルの一般化性と堅牢性を評価するベンチマークの1つとなっている。
本稿では,ASVspoof5チャレンジへの現実デフェンダーの提出について紹介し,新たな事前学習戦略について紹介する。
我々のシステムSLIMは、自己教師付きコントラスト学習を用いて、様々な種類のボナフィド音声からスタイル言語依存性の埋め込みを学習する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:55:28 GMT)
Evaluating Large Language Models on Time Series Feature Understanding: A Comprehensive Taxonomy and Benchmark [13.5] 大規模言語モデル(LLM)は、自動時系列分析とレポートの可能性を秘めている。
本稿では時系列データに固有の様々な特徴を記述した重要なフレームワークである時系列特徴の包括的分類法を紹介する。
このデータセットは、コンパイル時系列におけるLCMの熟練度を評価するための確かな基盤として機能する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 07:39:29 GMT)
Studying Practitioners' Expectations on Clear Code Review Comments [13.4] コードレビューコメント(CRC)は開発者間のコミュニケーションを促進する。
CRCの明確さの重要性にもかかわらず、良い明快さを構成するものに関するガイドラインがまだ不足している。
CRCの明瞭度を評価する自動化フレームワークであるClearCRCを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:30:59 GMT)
Examining the Prevalence and Dynamics of AI-Generated Media in Art Subreddits [13.3] AI生成コンテンツがRedditのアート関連コミュニティに与える影響について検討する。
私たちは、これらのコミュニティがAIによって透明に作成する画像ベースの投稿や、生成的AIを使用する著者を疑うコミュニティのコメントを見てみます。
我々は、AIコンテンツが新参者にとってより簡単に利用でき、コミュニティのルールに従って参加を増やすのに役立つことを示している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:41:13 GMT)
MedLSAM: Localize and Segment Anything Model for 3D CT Images [13.3] MedLAM(MedLAM)は,数個のテンプレートスキャンを用いて体内の解剖学的部位を正確に同定する3次元基礎局在モデルである。
私たちはMedLAMとSegment Anything Model(SAM)を統合してMedLSAMを開発した。
1)MedLSAMはSAMの性能と,その専門的な医療適応を手動のプロンプトと密に一致させ,データセット全体にわたる広範なポイントアノテーションの必要性を最小限に抑えながら,いくつかのテンプレートスキャンを用いて解剖学的構造を直接ローカライズすることができる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 13:25:56 GMT)
Pap2Pat: Towards Automated Paper-to-Patent Drafting using Chunk-based Outline-guided Generation [13.2] PAP2PATは、文書概要を含む1.8kの特許と特許のペアの新しい挑戦的なベンチマークである。
現在のオープンウェイト LLM とアウトライン誘導型ジェネレーションによる実験は,特許言語の本質的な反復性のために,論文からの情報を効果的に活用できるが,繰り返しに苦慮していることを示している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:52:48 GMT)
Nested Deep Learning Model: A Foundation Model for Brain Signal Data [13.0] 本稿では,現在の手法の限界を克服するための新しいNested Deep Learning(NDL)フレームワークを提案する。
NDLは全てのチャネルに重み付けされた信号の組み合わせを適用し、異なるチャネル設定への適応性を確保する。
その結果,NDLは予測精度を向上し,モダリティ間のデータ統合をサポートし,様々な神経生理学的応用のために微調整できることがわかった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:29:54 GMT)
Nested Deep Learning Model Towards A Foundation Model for Brain Signal Data [13.0] 本稿では,現在の手法の限界を克服するための新しいNested Deep Learning(NDL)フレームワークを提案する。
NDLは全てのチャネルに重み付けされた信号の組み合わせを適用し、異なるチャネル設定への適応性を確保する。
その結果,NDLは予測精度を向上し,モダリティ間のデータ統合をサポートし,様々な神経生理学的応用のために微調整できることがわかった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:29:54 GMT)
EventFlow: Forecasting Continuous-Time Event Data with Flow Matching [13.0] 本研究では,時間的ポイントプロセスのための非自己回帰生成モデルであるEventFlowを提案する。
我々のモデルはフローマッチングフレームワークの上に構築され、イベント時間を通じて関節分布を直接学習し、自己回帰プロセスをサイドステッピングします。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:57:00 GMT)
ECCO: Can We Improve Model-Generated Code Efficiency Without Sacrificing Functional Correctness? [12.9] ECCOは、自然言語(NL)ベースのコード生成と履歴ベースのコード編集という、2つのパラダイムを通じてプログラム効率を評価するためのベンチマークである。
実行情報の追加は機能的正確性を維持するのによく役立ち、NLフィードバックは効率を向上する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 22:20:40 GMT)
Web Retrieval Agents for Evidence-Based Misinformation Detection [12.8] 本稿では,誤情報検出のためのエージェントベース自動事実チェック手法を提案する。
検索にインターネットにアクセスできない強力なLLMエージェントとオンライン検索エージェントを組み合わせることで,各ツールを独立して使用する場合よりも優れた結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 19:13:41 GMT)
Data Taggants: Dataset Ownership Verification via Harmless Targeted Data Poisoning [12.8] 本稿では,非バックドアデータセットのオーナシップ検証技術であるデータタグを新たに導入する。
我々は、VTモデルとResNetモデルと最先端のトレーニングレシピを用いて、ImageNet1kの包括的で現実的な実験を通してアプローチを検証する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:49:23 GMT)
Iterative regularization in classification via hinge loss diagonal descent [12.7] 反復正規化(英: Iterative regularization)は、最近機械学習で人気になった正規化理論における古典的な考え方である。
本稿では,分類の文脈における反復正則化に着目した。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 09:23:34 GMT)
What do Large Language Models Need for Machine Translation Evaluation? [12.4] 大規模言語モデル(LLM)は、微調整された多言語事前訓練言語モデルに匹敵する結果が得られる。
本稿では,LLMの機械翻訳品質を評価するために,ソース,参照,翻訳エラー,ガイドラインなどの翻訳情報が必要であるかを検討する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:07:08 GMT)
What do Large Language Models Need for Machine Translation Evaluation? [12.4] 大規模言語モデル(LLM)は、微調整された多言語事前訓練言語モデルに匹敵する結果が得られる。
本稿では,LLMの機械翻訳品質を評価するために,ソース,参照,翻訳エラー,ガイドラインなどの翻訳情報が必要であるかを検討する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:07:08 GMT)
Greener GRASS: Enhancing GNNs with Encoding, Rewiring, and Attention [12.4] 本稿では,新しいGNNアーキテクチャであるGraph Attention with Structures (GRASS)を紹介する。
GRASSはランダムな正規グラフを重畳して入力グラフをリワイヤし、長距離情報伝搬を実現する。
また、グラフ構造化データに適した新しい付加的注意機構も採用している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:32:11 GMT)
Group Shapley Value and Counterfactual Simulations in a Structural Model [12.3] 構造経済モデルにおける反現実的シミュレーションを解釈するために,Shapley値,グループShapley値の変種を提案する。
本フレームワークは,複数の群に分割した2つのパラメータ集合を比較し,グループシェープ値分解を適用することにより,これらの集合間の変化に対する一意的な加法的寄与が得られる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:38:59 GMT)
Free-DyGS: Camera-Pose-Free Scene Reconstruction based on Gaussian Splatting for Dynamic Surgical Videos [12.2] 本稿では,ダイナミックな手術ビデオに適したカメラレスシーン再構築フレームワークであるFree-DyGSについて述べる。
提案手法では,フレーム・バイ・フレームの再構築戦略を採用し,4つの段階に展開する。
実験は、Free-DyGSが従来のベースラインモデルを超え、忠実度と計算効率の両方をレンダリングすることを示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:08:56 GMT)
ETA: Evaluating Then Aligning Safety of Vision Language Models at Inference Time [12.2] 対向的な視覚入力は、容易にVLM防御機構をバイパスすることができる。
本稿では,入力された視覚的内容と出力応答を評価する2相推論時間アライメントフレームワークを提案する。
実験の結果, ETAは無害性, 有用性, 効率の点で, ベースライン法よりも優れていた。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:21:43 GMT)
Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions [12.1] 責任レンズを介して安全なマルチエージェントインタラクションを規定する要因を定式化する。
本稿では,制御障壁関数と微分可能最適化に基づくデータ駆動モデリング手法を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:20:41 GMT)
Progressive Multi-Modal Fusion for Robust 3D Object Detection [12.0] 既存の方法は、バードアイビュー(BEV)とパースペクティブビュー(PV)の両方のモードから特徴を投影することで、単一ビューでセンサフュージョンを実行する。
本稿では,中間クエリレベルとオブジェクトクエリレベルの両方で,BEVとPVの両方の機能を組み合わせたプログレッシブフュージョンフレームワークProFusion3Dを提案する。
我々のアーキテクチャは、局所的およびグローバルな特徴を融合させ、3次元オブジェクト検出の堅牢性を高める。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 22:57:47 GMT)
ReFeR: Improving Evaluation and Reasoning through Hierarchy of Models [12.0] テキストと画像の両方を含む生成出力を評価するために設計されたReFeRというチューニング不要のフレームワークを導入する。
フレームワークであるReFeRを4つの多様な評価タスクで厳格に評価します。
4つの推論タスクの実験は、フレームワークのより優れた集団推論能力を示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:51:44 GMT)
On the Similarity of Circuits across Languages: a Case Study on the Subject-verb Agreement Task [12.0] 本稿では,Gemma 2Bが実装した2言語間の主語/動詞合意課題を解決する回路について検討する。
どちらの回路も非常に一貫性があり、主に被写体番号の信号を最後の残留ストリームに書き込む特定の注意ヘッドによって駆動される。
我々は,この方向がモデル予測に因果的影響があることを示し,スペイン語の予測動詞を英語の方向と連動させることで効果的に反転させることを示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:49:56 GMT)
SAGMAN: Stability Analysis of Graph Neural Networks on the Manifolds [11.8] 現代のグラフニューラルネットワーク(GNN)は、入力グラフ構造やノードの特徴の変化に敏感である。
本稿では,GNNの安定性を調べるためのSAGMANと呼ばれるスペクトルフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:51:02 GMT)
Zero-Shot Generalization of Vision-Based RL Without Data Augmentation [11.8] 視覚に基づく強化学習(RL)エージェントを新しい環境に一般化することは、依然として困難かつオープンな課題である。
本稿では、ゼロショットの一般化に向けて、標準のオフポリチックRLの上に構築されたアソシエーション・ラテント・ディスタン・アングルメント(ALDA)モデルを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:14:09 GMT)
Joint Fine-tuning and Conversion of Pretrained Speech and Language Models towards Linear Complexity [11.3] 本稿では,変換器モデルを線形時間置換器に変換し,目標タスクに微調整するクロスアーキテクチャ層蒸留(CALD)手法を提案する。
そこで本研究では,CALDが元のモデルの結果を効果的に回収できることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:06:43 GMT)
Evaluating the Generalization Ability of Spatiotemporal Model in Urban Scenario [11.2] 本研究では,自転車シェアリング,311サービス,歩行者交通速度,交通流,配車需要,自転車シェアリングの6つのシナリオからなる時空間アウト・オブ・ディストリビューション(ST-OOD)ベンチマークを提案する。
我々は、最先端モデルについて広範囲に評価し、その性能は分配外設定で著しく低下し、ほとんどのモデルが単純なマルチレイヤ・パーセプトロン(MLP)よりも性能が悪くなっていることを発見した。
その結果,ほとんどのデータセットにおいて若干のドロップアウト率で一般化性能が向上し,分配性能に最小限の影響が認められた。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:03:50 GMT)
Evaluating the Generalization Ability of Spatiotemporal Model in Urban Scenario [11.2] 本研究では,自転車シェアリング,311サービス,歩行者交通速度,交通流,配車需要,自転車シェアリングの6つのシナリオからなる時空間アウト・オブ・ディストリビューション(ST-OOD)ベンチマークを提案する。
我々は、最先端モデルについて広範囲に評価し、その性能は分配外設定で著しく低下し、ほとんどのモデルが単純なマルチレイヤ・パーセプトロン(MLP)よりも性能が悪くなっていることを発見した。
その結果,ほとんどのデータセットにおいて若干のドロップアウト率で一般化性能が向上し,分配性能に最小限の影響が認められた。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:03:50 GMT)
Generating Origin-Destination Matrices in Neural Spatial Interaction Models [11.2] エージェントベースモデル(ABM)は、交通、経済、疫学の政策分野にわたる意思決定ツールとして急速に普及している。
中心となる対象は、位置間の相互作用とエージェントの移動数をキャプチャする離散原点決定行列である。
既存のアプローチでは、ABMシミュレーションとキャリブレーションを実行するために、この行列の連続的な近似と、その後のアドホックな判別を利用する。
これは、部分的に観測された要約統計の条件付けを妨げ、離散的なサポートを越えてマルチモーダル行列分布の探索に失敗し、離散化エラーを引き起こす。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:09:02 GMT)
Causal Concept Graph Models: Beyond Causal Opacity in Deep Learning [11.1] 因果不透明性(英: Causal opacity)とは、ディープニューラルネットワーク(DNN)モデルの決定の根底にある「隠れた」因果構造を理解することの難しさを指す。
この研究は、因果概念グラフモデル(Causal Concept Graph Models, Causal CGMs)を導入している。
実験の結果, (i) 因果不透明モデルの一般化性能に一致し, (ii) ループ内修正を誤予測中間推論ステップに適用し, (iii) 介入シナリオと反事実シナリオの分析を支援することができた。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:34:31 GMT)
To Preserve or To Compress: An In-Depth Study of Connector Selection in Multimodal Large Language Models [11.1] 本稿では,コネクタがマルチモーダル大言語モデル(MLLM)の性能に与える影響を系統的に検討する。
コネクタを特徴保存型と特徴圧縮型に分類する。
本研究は,視覚情報の詳細な保持能力により,細粒度認知タスクにおいて,特徴保存コネクタが優れていることを明らかにした。
対照的に、機能圧縮コネクタは、きめ細かな知覚タスクでは効果が低いが、顕著な速度優位性を提供し、きめ細かな知覚タスクや強調タスクでは相容れない。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:53:18 GMT)
QuadBEV: An Efficient Quadruple-Task Perception Framework via Bird's-Eye-View Representation [11.1] Bird's-Eye-View (BEV) の知覚は、複数のセンサー入力を統一された表現に統合する能力により、自律運転システムにおいて重要な要素となっている。
提案するQuadBEVは,4つのタスク間で共有された空間的・文脈的情報を活用する,効率的なマルチタスク認識フレームワークである。
本研究は,QuadBEVの有効性とロバスト性を検証し,実世界の応用に適合することを示す包括的実験である。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:31:45 GMT)
Learning Content-Aware Multi-Modal Joint Input Pruning via Bird's-Eye-View Representation [11.1] 本稿では,コンテンツ対応型マルチモーダルジョイントプルーニング手法を提案する。
我々は,NuScenesデータセットの広範な実験を通じて,アプローチの有効性を検証する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:30:00 GMT)
Dimension Mixer: Group Mixing of Input Dimensions for Efficient Function Approximation [11.1] CNN、Transformers、Fourier-Mixersは、類似点と相違点を探す動機になりました。
これらのアーキテクチャは、一般的な次元混合の概念のレンズを通して解釈できることがわかった。
グループワイズ, 非線形, 多層, 学習可能な混合方式について検討し, 多くの標準ニューラルアーキテクチャと相補的であることを確認した。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:35:47 GMT)
BELM: Bidirectional Explicit Linear Multi-step Sampler for Exact Inversion in Diffusion Models [11.1] 本稿では,汎用的な定式化 emphBidirectional Linear Explicit Multi-step (BELM) について紹介する。
BELMの定式化は可変段-形式線形多段法から導かれる。
精度の高いインバージョン・スライダの既存の設計が準最適最小化をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:32:26 GMT)
Emergent properties with repeated examples [11.0] 一定数のトレーニングステップに対して、より小さな反復例セットで訓練されたモデルが、より大きな単一使用例セットで訓練されたモデルより優れていることを示す。
2セットのトレーニング — サンプルの小さなランダムなサブセットを繰り返し使用すること、トレーニングセットの他の部分の通常のサンプリング — が、より高速な学習とパフォーマンスを実現することを実証しています。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:28:23 GMT)
Iterative Optimization Annotation Pipeline and ALSS-YOLO-Seg for Efficient Banana Plantation Segmentation in UAV Imagery [11.0] UAV画像に最適化された効率的な軽量セグメンテーションモデルであるALSS-YOLO-Segを開発した。
モデルのバックボーンには、チャネル間の情報交換を改善するために、Adaptive Lightweight Channel Splitting and Shuffling (ALSS)モジュールが含まれている。
MSCA(Multi-Scale Channel Attention)モジュールは、マルチスケールの特徴抽出とチャネルアテンションを組み合わせて、ターゲットサイズや複雑な背景の異なる課題に取り組む。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:19:26 GMT)
Continual Learning: Less Forgetting, More OOD Generalization via Adaptive Contrastive Replay [11.0] 機械学習モデルは、新しいクラスを学ぶ際に、以前に学んだ知識を忘れてしまうことも多い。
リハーサルベースの学習(rehearsal-based learning)は、以前のクラスからのサンプルを保持するが、通常はパフォーマンスが良く、特定のインスタンスを記憶する傾向がある。
これはしばしば高い忘れ込み率と低い一般化につながる。
コントラスト学習とデータ中心の原則に着想を得た,シンプルで効果的な戦略を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:45:47 GMT)
Do Developers Adopt Green Architectural Tactics for ML-Enabled Systems? A Mining Software Repository Study [11.0] 機械学習(ML)と人工知能(AI)技術は、社会でますます普及している。
グリーンAIは応答として現れ、精度を維持しながらAIの計算要求を減らすことを提唱している。
本稿では,GitHub上の168のオープンソースプロジェクトにおけるグリーン戦略の適用性を評価する,マイニングソフトウェアリポジトリの研究について述べる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:27:07 GMT)
SWIFT: On-the-Fly Self-Speculative Decoding for LLM Inference Acceleration [11.0] 投機的復号法(SD)は,大規模言語モデル(LLM)の推論を高速化するパラダイムとして広く用いられている。
本稿では,LLMの中間層を適応的に選択して推論時にスキップする,オンザフライの自己投機的復号アルゴリズムであるSWIFTを紹介する。
SWIFTは生成したテキストの元の分布を保ちながら1.3x-1.6xの高速化を実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:15:30 GMT)
Scaling Laws for Mixed quantization in Large Language Models [10.9] 大規模言語モデル(LLM)の学習後の量子化は、これらのモデルで推論を実行する際の計算量の削減に有効であることが証明されている。
本研究では,低精度量子化のための特定の精度やパープレキシティターゲットを目指している場合,LLMを大規模化する際に,高い精度の数値や計算がいくつ必要か,という簡単な問題に焦点をあてる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:45:01 GMT)
Preference Fine-Tuning for Factuality in Chest X-Ray Interpretation Models Without Human Feedback [10.8] 放射線技師は医療画像を医療報告に翻訳することで重要な役割を担っている。
視覚言語モデル(VLM)を用いた自動アプローチは、アシスタントとして有望であるが、非常に高い精度を必要とする。
胸部X線(CXR)レポート生成に着目し,放射線学におけるVLMの自動選好アライメント手法を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:07:11 GMT)
Modeling Causal Mechanisms with Diffusion Models for Interventional and Counterfactual Queries [10.8] 本稿では,観察的,介入的,反ファクト的クエリに因果的に十分な設定で回答する問題を考察する。
本稿では拡散型因果モデル (DCM) を導入し, 独自の潜伏符号化を生成する因果メカニズムを学習する。
我々の実証評価は、因果クエリに応答する既存の最先端手法よりも大幅に改善されたことを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 18:04:37 GMT)
On the Computational Power of QAC0 with Barely Superlinear Ancillae [10.7] 任意の深さ$$$mathrmQAC0$回路は、近似次数で関数を計算するのに$n1+3d$ ancillaを必要とすることを示す。
これは、パリティの計算に必要なアンシラの大きさに関する最初の超線形下界である。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:55:57 GMT)
Two is Better Than One: Digital Siblings to Improve Autonomous Driving Testing [10.5] 複数の汎用シミュレータ上で、与えられた自動運転車をテストするマルチシミュレータアプローチであるデジタルシミュレータの概念を導入する。
我々は、このようなマルチシミュレーターアプローチを、大規模なテストケースにおいて、物理的にスケールした自動運転車のデジタル双対に対して実証的に比較する。
実験により,デジタル双子の故障予測において,デジタル兄弟によるアンサンブル故障予測器が個々のシミュレータよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 09:14:58 GMT)
Biophysics Informed Pathological Regularisation for Brain Tumour Segmentation [10.5] 本稿では,脳腫瘍進展部分微分方程式(PDE)モデルをディープラーニングを用いた正規化として設計する手法を提案する。
本手法では,特にデータ共有シナリオにおいて,腫瘍増殖PDEモデルをセグメント化プロセスに直接導入し,精度とロバスト性を向上させる。
我々は、BraTS 2023データセットの広範な実験を通じて、我々のフレームワークの有効性を実証する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 00:06:37 GMT)
CSSL: Contrastive Self-Supervised Learning for Dependency Parsing on Relatively Free Word Ordered and Morphologically Rich Low Resource Languages [10.4] 本稿では,単語順の変動に頑健なモデルを実現するための,対照的な自己教師型学習手法を提案する。
提案手法は、7つの比較的自由な単語順序言語における3.03/2.95点の平均的な増加を示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:38:49 GMT)
Exponents for Shared Randomness-Assisted Channel Simulation [10.4] 最短ケースの総偏差距離において、共有ランダム性支援チャネルシミュレーションの正確な誤差と強い逆指数を決定する。
厳密には、チャネル符号化とは対照的に、臨界レートは存在せず、シミュレーション能力以下の任意のレートを厳格に評価することができる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:45:58 GMT)
Can Separators Improve Chain-of-Thought Prompting? [10.4] CoTプロンプトは大規模言語モデル(LLM)の推論能力を改善するためのシンプルで効果的な方法である
人間の認知にインスパイアされたCOT-SEP(COT-SEP)は,CoTプロンプトにおける各指数の最後にセパレータを戦略的に採用する手法である。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:54:29 GMT)
Towards Generalisable Time Series Understanding Across Domains [10.4] 一般時系列解析のためのオープンモデルであるOTiSを紹介する。
本稿では,学習可能なドメイン固有シグネチャを持つトークンマイザを含む,新しい事前学習パラダイムを提案する。
我々のモデルは、8つの異なるドメインにまたがる640,187個のサンプルと11億個のタイムポイントからなる大規模なコーパスで事前訓練されている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:09:30 GMT)
DreamMesh4D: Video-to-4D Generation with Sparse-Controlled Gaussian-Mesh Hybrid Representation [10.3] 本稿では,メッシュ表現と幾何スキン技術を組み合わせた新しいフレームワークDreamMesh4Dを紹介し,モノクロビデオから高品質な4Dオブジェクトを生成する。
我々の手法は現代のグラフィックパイプラインと互換性があり、3Dゲームや映画産業におけるその可能性を示している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:41:08 GMT)
Vocabulary Transfer for Medical Texts [10.2] 我々は,対象語彙を拡張して,ドメイン固有のバイオメディカル用語を組み込む手法である語彙拡張に焦点を当てた。
以上の結果から,語彙拡張は,下流モデルの性能と推論時間の両方において,測定可能な改善をもたらすことが示唆された。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:07:04 GMT)
A Unified Generative Framework for Realistic Lidar Simulation in Autonomous Driving Systems [10.0] Lidarは、Autonomous Driving Systemsの知覚センサーの中で広く使われているセンサーである。
深層生成モデルは、現実的な感覚データを合成するための有望な解決策として現れてきた。
本稿では,Lidarシミュレーションの忠実度を高めるための統一的な生成フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 15:26:25 GMT)
"Always Nice and Confident, Sometimes wrong": Developer's Experiences Engaging Generative AI Chatbots Versus Human-Powered Q&A Platforms [10.0] Stack Overflow(SO)とChatGPTを比較します。
ChatGPTは、高速で明確で包括的な応答を提供し、SOよりも優雅な環境を育みます。
ChatGPTの信頼性に関する懸念は、その過度な自信と、SOの投票システムのような検証メカニズムの欠如に起因する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 15:57:01 GMT)
Tri-Level Navigator: LLM-Empowered Tri-Level Learning for Time Series OOD Generalization [10.0] 事前学習された大言語モデルを用いた時系列OOD一般化について検討する。
まず,textbfSeries textbfOOD 一般化のための新しい textbfTri レベルの学習フレームワーク TTSO を提案する。
本稿では,この三段階最適化問題に適した階層化ローカライゼーションアルゴリズムを開発し,提案アルゴリズムの保証収束を理論的に実証する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:00:21 GMT)
Recommending and Release Planning of User-Driven Functionality Deletion for Mobile Apps [9.9] ソフトウェアを多くの機能で進化させることは、理解性とユーザビリティという面での課題を引き起こします。
以前の研究によると、機能の削除は一般的であり、時にはユーザレビューによって引き起こされる。
ほとんどのユーザにとって、機能の削除はネガティブな感情と結びつき、使用パターンの変更を促し、ユーザを混乱させる可能性がある。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:34:20 GMT)
Schur's Positive-Definite Network: Deep Learning in the SPD cone with structure [9.8] 本研究では,SPD出力を保証する新しい学習モジュールであるSpadNetを紹介する。
特に、SPDとスパース行列を共同で学習するという課題を解決する。
本研究では,これらのアプリケーションに対するSpadNetレイヤの汎用性と妥当性について述べる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:15:05 GMT)
A Novel LLM-based Two-stage Summarization Approach for Long Dialogues [9.8] 本研究では,長い文書から情報を分割・凝縮する階層的枠組みを提案する。
凝縮段階は、教師なし生成モデルを用いて凝縮データを生成する。
要約段階は、縮合されたデータ上の抽象的な要約モデルを微調整して最終結果を生成する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:42:40 GMT)
Adaptive Refinement Protocols for Distributed Distribution Estimation under $\ell^p$-Losses [9.8] 通信制約のある$ellp$損失の離散分布の推定を考える。
我々は、ほとんどのパラメーター系における問題の最小値の最適値を得る。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:46:08 GMT)
Who is better at math, Jenny or Jingzhen? Uncovering Stereotypes in Large Language Models [9.7] 我々はGlobalBiasを使って世界中の幅広いステレオタイプを研究しています。
与えられた名前に基づいて文字プロファイルを生成し、モデル出力におけるステレオタイプの有効性を評価する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:17:46 GMT)
Who is better at math, Jenny or Jingzhen? Uncovering Stereotypes in Large Language Models [9.7] 我々はGlobalBiasを使って世界中の幅広いステレオタイプを研究しています。
与えられた名前に基づいて文字プロファイルを生成し、モデル出力におけるステレオタイプの有効性を評価する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:17:46 GMT)
The FIX Benchmark: Extracting Features Interpretable to eXperts [9.7] FIX(Features Interpretable to eXperts)は、機能の集合が専門家の知識とどの程度うまく一致しているかを測定するベンチマークである。
ドメインの専門家と共同で、さまざまな現実世界の設定にまたがる機能解釈可能性の目標を開発しました。
特徴に基づく一般的な説明手法は、専門家が特定した知識と不一致であることがわかった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:47:01 GMT)
The FIX Benchmark: Extracting Features Interpretable to eXperts [9.7] FIX(Features Interpretable to eXperts)は、機能の集合が専門家の知識とどの程度うまく一致しているかを測定するベンチマークである。
FIXScoreは、宇宙論、心理学、医学領域にまたがる多様な現実世界の設定に適用可能な、統一された専門家アライメント尺度である。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:47:01 GMT)
Taking a turn for the better: Conversation redirection throughout the course of mental-health therapy [9.7] 本稿では,ある発話が会話の流れを即座にリダイレクトする程度を測る尺度を提案する。
オンラインセラピープラットフォームにおける複数セッションにおける患者とセラピストの関係の発達を特徴付けるために,本手法を適用した。
分析の結果, 患者が会話の方向をコントロールできることは, セラピストとの関係が進行するにつれて, 一般的にセラピストの方向に対して増加することが明らかとなった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:54:41 GMT)
Optimizing Transformer based on high-performance optimizer for predicting employment sentiment in American social media content [9.5] 本稿では,Swarmインテリジェンス最適化アルゴリズムに基づくTransformerモデルの改良を行い,雇用関係のテキストコンテンツの感情を予測することを目的とする。
トレーニング期間中、モデルの精度は49.27%から82.83%に徐々に上昇し、損失値は0.67から0.35に低下した。
本稿では、ソーシャルメディア上での雇用関連テキストにおける感情認識の精度の向上だけでなく、重要な実践的意義も挙げる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:14:05 GMT)
Distributionally Robust Clustered Federated Learning: A Case Study in Healthcare [9.4] CS-RCFL(Cross-silo Robust Clustered Federated Learning)と呼ばれる新しいアルゴリズムを導入する。
我々は,各クライアントの経験的分布の周囲にあいまいな集合を構築し,ローカルデータの分布シフトをキャプチャする。
そこで我々は,モデルに依存しない整数分数プログラムを提案し,クライアントの連立への最適分布的ロバストなクラスタリングを決定する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:25:01 GMT)
OPTIMA: Optimized Policy for Intelligent Multi-Agent Systems Enables Coordination-Aware Autonomous Vehicles [9.4] 本研究は,協調自動運転タスクのための分散強化学習フレームワークOPTIMAを紹介する。
我々のゴールは、非常に複雑で混み合ったシナリオにおいて、CAVの汎用性と性能を改善することです。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:28:45 GMT)
Defending Membership Inference Attacks via Privacy-aware Sparsity Tuning [9.4] 本稿では,異なるパラメータに対する適応的なペナルティを用いることで,L1正規化の簡単な修正を提案する。
PASTの背後にある重要な考え方は、プライバシーの漏洩に大きく貢献するパラメータの分散を促進することです。
PASTを使用すると、ネットワークはメンバーと非メンバーの間の損失ギャップを縮小し、プライバシー攻撃に対する強い抵抗をもたらす。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:13:49 GMT)
An Interdisciplinary Survey on Origin-destination Flows Modeling: Theory and Techniques [9.3] Origin-Detination (OD) フローモデリングは、複数の分野にわたる広範囲にわたる研究対象である。
地域経済学、都市地理学、社会物理学は、ODフローの基盤となるメカニズムを探求するために理論的な研究手法を採用することに長けている。
交通、都市計画、コンピュータ科学は、主にOD予測、OD構築、OD推定、OD予測の4つの実践的な問題に対処することに焦点を当てている。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:10:50 GMT)
Fourier-based Action Recognition for Wildlife Behavior Quantification with Event Cameras [9.1] 本稿では,フーリエ変換に基づく行動認識手法を提案する。
特に,我々のアプローチを「静電ディスプレイ」に注釈を付けたペンギンの繁殖データセットに適用する。
我々のアプローチは単純かつ効果的であり、ディープニューラルネットワーク(DNN)よりもわずかに低い結果が得られることが分かりました。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:06:37 GMT)
Structure-Centric Robust Monocular Depth Estimation via Knowledge Distillation [9.0] 単眼深度推定はコンピュータビジョンにおける3次元知覚の重要な手法である。
現実のシナリオでは、悪天候の変動、動きのぼやけ、夜間の照明条件の悪いシーンなど、大きな課題に直面している。
我々は,局所的なテクスチャへの過度な依存を低減し,パターンの欠落や干渉に対する堅牢性を向上するための新しいアプローチを考案した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:20:29 GMT)
PII-Scope: A Benchmark for Training Data PII Leakage Assessment in LLMs [9.0] LLMを対象としたPII抽出攻撃の最先端手法を評価するための総合ベンチマークであるPII-Scopeを紹介する。
我々は、より現実的な攻撃シナリオに研究を拡張し、高度な敵戦略を用いたPII攻撃を探索する。
PII抽出速度は,高度な対数能力とクエリ予算の制限により,事前学習モデルをターゲットにした場合,最大5倍に向上することを示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:16:25 GMT)
Diversify, Rationalize, and Combine: Ensembling Multiple QA Strategies for Zero-shot Knowledge-based VQA [8.5] 知識に基づく教育(DietCoke)のための多様化,エビデンス・トランニケーション,複合化を提案する。
ダイエットコークは、多様化、合理化、合奏の3段階からなる。
実験により、DietCokeは最先端のLCMベースのベースラインを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:04:39 GMT)
The Vital Role of Gradient Clipping in Byzantine-Resilient Distributed Learning [8.3] ビザンチン耐性の分散機械学習は、不正行為や敵対的労働者の存在下で、堅牢な学習性能を達成することを目指している。
最先端(SOTA)の頑健な分散勾配降下法(DGD)は理論的に最適であることが証明されているが、その実験的な成功は、しばしば前凝集勾配クリッピングに依存している。
本稿では,アダプティブロバストクリッピングARC(Adaptive Robust ClippingARC)と呼ばれる適応型クリッピング戦略を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:04:01 GMT)
Fostering Intrinsic Motivation in Reinforcement Learning with Pretrained Foundation Models [8.3] CLIPのような最近の基盤モデルの台頭は、事前訓練されたセマンティックにリッチな埋め込みを活用する機会を提供する。
導入モジュールは、完全な状態情報を有効に活用することができ、サンプル効率を大幅に向上させることができる。
基礎モデルによって提供される埋め込みは、トレーニング中にエージェントが構築したものよりも、時として優れていることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:05:45 GMT)
LocoVR: Multiuser Indoor Locomotion Dataset in Virtual Reality [8.0] LocoVRは、130以上の屋内環境から収集された7000人以上の2人以上の軌跡のデータセットである。
評価の結果,ロコVRは人体軌道を利用した3つの室内作業において,モデル性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 00:45:02 GMT)
The Sampling-Gaussian for stereo matching [8.0] ソフトアルグマックス演算は、ニューラルネットワークベースのステレオマッチング法で広く採用されている。
従来の手法では精度を効果的に向上できず、ネットワークの効率を損なうこともあった。
本稿では,ステレオマッチングのための新しい監視手法,サンプリング・ガウシアンを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:57:13 GMT)
Average Certified Radius is a Poor Metric for Randomized Smoothing [8.0] ランダムな平滑化により得られるロバスト性保証を評価するために,平均認定半径(ACR)が極めて低い指標であることを示す。
ACRは硬いものよりも簡単なサンプルの改良に敏感であることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:58:41 GMT)
Performance Evaluation in Multimedia Retrieval [7.8] マルチメディア検索の性能評価は検索実験に大きく依存する。
これらには、検索プロセス自体に対するヒューマン・イン・ザ・ループとマシンのみの設定と、その後の結果の検証が含まれる。
本稿では,このような検索実験のすべての側面を表現するための形式モデルと,柔軟なオープンソース評価基盤を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 08:06:15 GMT)
Fine-tuning can Help Detect Pretraining Data from Large Language Models [7.7] 現在のメソッドでは、PerplexityやMin-k%といったスコアリング関数を設計することで、メンバと非メンバを区別している。
本研究では,FSD(Fun-Tuned Score Deviation)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 15:36:42 GMT)
Multi-label Classification for Android Malware Based on Active Learning [7.6] 本稿ではMLCDroidを提案する。MLCDroidは、事前に定義された悪意のある動作の存在を直接示すことができるマルチラベル分類手法である。
我々は,70のアルゴリズム組み合わせの結果を比較し,有効性(73.3%)を評価する。
これは、きめ細かい悪意のある振る舞いについて、より詳細な情報を提供することを目的とした、最初のマルチラベルAndroidマルウェア分類アプローチである。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:09:24 GMT)
Calibrating Verbalized Probabilities for Large Language Models [7.6] 単語化確率の校正は,ブラックボックス大言語モデルからの出力を確実に評価し,活用するための新しいアプローチを示す。
近年の手法では,LLMの信頼性スコアにプラットスケーリングや温度スケーリングなどの手法を適用し,キャリブレーションの改善が示されている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:20:24 GMT)
On the Optimal Linear Contraction Order of Tree Tensor Networks, and Beyond [7.6] 木テンソルネットワークに対する線形縮退順序付け問題には,特定時間アルゴリズムが存在することを示す。
その結果、契約コストの隣接するシーケンス特性に依存し、契約順序のグローバルな決定を可能にする。
我々はこのアルゴリズムをテンソルとして一般的な収縮順序や任意のネットワークトポロジに拡張する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:04:07 GMT)
Magnon squeezing via reservoir-engineered optomagnomechanics [7.5] 我々は、オポマノメカニカルシステムにおいて、マグノニック圧縮状態の調製方法を示す。
マグノメカニカルカップリングが線形か分散的かによっては2つのシナリオについて論じる。
提案したマグノン圧縮状態は、マグノンを用いた量子情報処理と量子センシングに有望な応用を見出す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:04:18 GMT)
Robust Regression over Averaged Uncertainty [7.4] この定式化は隆起回帰を正確に回復し、既存の回帰問題に対するロバスト最適化と平均二乗誤差アプローチの欠落するリンクを確立する。
正確な閉形式、場合によっては $ell_p$ norm, Schatten $p$-norm, and general polytopes によって誘導される不確実集合の下での同値な正則化強度に対する解析的解を提供する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:16:15 GMT)
Superluminal spacetime boundary, time reflection and quantum light generation from relativistic plasma mirrors [7.4] プラズマミラー(英: plasma mirror)は、高出力超波長電磁界用光学素子である。
本研究では、超高強度レーザービームによって誘起される様々なプラズマ光の発振が「時空ミラー」として機能することを提案する。
時空鏡にはいくつかのエキゾチックな特徴がある。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:44:30 GMT)
Superluminal spacetime boundary, time reflection and quantum light generation from relativistic plasma mirrors [7.4] プラズマミラー(英: plasma mirror)は、高出力超波長電磁界用光学素子である。
本研究では、超高強度レーザービームによって誘起される様々なプラズマ光の発振が「時空ミラー」として機能することを提案する。
時空鏡にはいくつかのエキゾチックな特徴がある。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:44:30 GMT)
Combining Automated Optimisation of Hyperparameters and Reward Shape [7.4] 本稿では,ハイパーパラメータと報酬関数を組み合わせた最適化手法を提案する。
近似ポリシー最適化とソフト・アクター・クリティカルを用いた広範囲な実験を行った。
以上の結果から,統合最適化は環境の半分のベースライン性能よりも有意に向上し,他の環境との競争性能も向上することが示された。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:24:24 GMT)
An analysis of the noise schedule for score-based generative models [7.2] 対象分布と推定分布とのKL分散の上限を確立する。
We provide a tighter error bound in Wasserstein distance than the state-of-the-art results。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 07:37:40 GMT)
Scalable Co-Clustering for Large-Scale Data through Dynamic Partitioning and Hierarchical Merging [7.1] クラスタの行と列を同時にクラスタリングすることで、よりきめ細かいグループを明らかにします。
既存のクラスタリング手法はスケーラビリティが悪く、大規模なデータを扱うことができない。
本稿では,高次元大規模データセットにおける複雑なパターンを明らかにするために,新しい,スケーラブルなコクラスタリング手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:47:22 GMT)
SAGE: Scalable Ground Truth Evaluations for Large Sparse Autoencoders [7.1] SAGE: Scalable Autoencoder Ground-Truth Evaluationは,SAEの真理評価フレームワークである。
提案手法は,タスク固有のアクティベーションを自動的に識別し,これらの点における基底的真理特徴を計算できることを実証する。
我々の枠組みは、解釈可能性研究におけるSAEの一般化可能な大規模評価の道を開くものである。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:42:39 GMT)
Pair-VPR: Place-Aware Pre-training and Contrastive Pair Classification for Visual Place Recognition with Vision Transformers [6.9] 視覚的位置認識(VPR)のための新しい共同学習法を提案する。
ペア分類器は、与えられた画像のペアが同じ場所から来ているか否かを予測することができる。
トレーニングの第2段階でMaskイメージモデリングエンコーダとデコーダウェイトを再使用することにより、Pair-VPRは最先端のVPRパフォーマンスを実現することができる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:09:46 GMT)
What Makes Programmers Laugh? Exploring the Subreddit r/ProgrammerHumor [6.6] 本研究では,大規模ソーシャルメディアコミュニティにおけるプログラミング関連ユーモアの解明を目的とする。
私たちはRedditのサブレディットr/ProgrammerHumorから139,718件の応募を集めました。
その結果,ソフトウェア開発者のユーモアの予測は困難であることが示唆された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:04:12 GMT)
UpDLRM: Accelerating Personalized Recommendation using Real-World PIM Architecture [6.5] UpDLRMは、実際のプロセッシングインメモリハードウェアであるUPPMEM DPUを使用して、メモリ帯域幅を拡大し、レコメンデーションレイテンシを低減する。
UpDLRMは、CPU専用とCPU-GPUハイブリッドの両方と比較してDLRMの推論時間を大幅に短縮する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:11:28 GMT)
A Safety Modulator Actor-Critic Method in Model-Free Safe Reinforcement Learning and Application in UAV Hovering [6.5] 本稿では、モデルフリーな安全強化学習(RL)における安全性制約と過大評価を解消する安全変調器アクタ・クリティカル(SMAC)手法を提案する。
無人航空機(UAV)ホバリングにおけるシミュレーションと実世界のシナリオ実験の両方で、SMACが安全性の制約を効果的に維持し、メインストリームのベースラインアルゴリズムより優れていることを確認した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:07:24 GMT)
Prompt Infection: LLM-to-LLM Prompt Injection within Multi-Agent Systems [6.5] 本稿では、相互接続されたエージェント間で、悪意のある自己複製を促す新しい攻撃であるPrompt infectionを紹介する。
この攻撃は、データ盗難、詐欺、誤報、システム全体の破壊など、深刻な脅威を引き起こす。
そこで本研究では,既存の安全対策と組み合わせることで感染拡大を著しく軽減する防衛機構であるLSM Taggingを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:01:29 GMT)
GMSR:Gradient-Guided Mamba for Spectral Reconstruction from RGB Images [6.4] GMSR-Netは、大域的受容場と線形計算複雑性を特徴とする軽量モデルである。
最先端のパフォーマンスを実現しつつ、パラメータの数と計算負荷を著しく削減します。
既存のアプローチと比較して、GMSR-NetはパラメータとFLOPSをそれぞれ10倍と20倍のマージンで削減している。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:29:10 GMT)
Counterfactuals As a Means for Evaluating Faithfulness of Attribution Methods in Autoregressive Language Models [6.4] 本稿では,自己回帰型言語モデルに対する帰属手法の忠実度を評価するために,反事実生成を利用する手法を提案する。
提案手法は, 流動性, 分散性, 分散性, 分散性, 評価プロトコルの信頼性を向上する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:12:50 GMT)
Counterfactuals As a Means for Evaluating Faithfulness of Attribution Methods in Autoregressive Language Models [6.4] 本稿では,自己回帰型言語モデルに対する帰属手法の忠実度を評価するために,反事実生成を利用する手法を提案する。
提案手法は, 流動性, 分散性, 分散性, 分散性, 評価プロトコルの信頼性を向上する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:12:50 GMT)
Predicting Bitcoin Market Trends with Enhanced Technical Indicator Integration and Classification Models [6.4] 本研究では,暗号市場の方向性を予測するための分類に基づく機械学習モデルを提案する。
歴史的データと、移動平均収束分量、相対強度指数、ボリンジャーバンドなどの重要な技術指標を用いて訓練されている。
その結果、購入/販売信号の精度は92%を超えた。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:29:50 GMT)
Linear combinations of Gaussian latents in generative models: interpolation and beyond [6.4] ガウス変数の組合せ(COG)は、実装が容易でありながら最近の高度な手法よりも優れている汎用手法である。
COGは、潜在変数の一般線型結合を形成するというより広範なタスクに自然に対処し、潜在空間の部分空間の構築を可能にする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:39:43 GMT)
Linear combinations of Gaussian latents in generative models: interpolation and beyond [6.4] ガウス変数の組合せ(COG)は、実装が容易でありながら最近の高度な手法よりも優れている汎用手法である。
COGは、潜在変数の一般線型結合を形成するというより広範なタスクに自然に対処し、潜在空間の部分空間の構築を可能にする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:39:43 GMT)
HBTP: Heuristic Behavior Tree Planning with Large Language Model Reasoning [6.3] Heuristic Behavior Tree Planning (HBTP) はBT生成のための信頼性と効率的なフレームワークである。
本稿では,BT拡張プロセスと最適計画と満足度計画のための2つの変種を紹介する。
実験では、HBTPの理論的限界を示し、4つのデータセットから得られた結果により、日々のサービスロボット応用における実用性が確認された。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 08:55:21 GMT)
Aligning AI-driven discovery with human intuition [6.2] AI駆動の科学モデリングプロセスは、一般的に隠れた状態変数を特定することから始まる。
有意な予測変数のコンパクトな集合を見つけることは数学的に困難であり、定義されていない。
人間の直感と自然に整合した表現を蒸留するための新しい一般原理を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 19:52:59 GMT)
Enabling Novel Mission Operations and Interactions with ROSA: The Robot Operating System Agent [6.0] 本稿では,ロボットオペレーティングシステム(ROS)と自然言語インタフェースのギャップを埋めるAIエージェントであるROSA(Robot Operating System Agent)を紹介する。
最先端の言語モデルを活用し、オープンソースのフレームワークを統合することで、ROSAはオペレーターが自然言語を使ってロボットと対話することを可能にする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:54:02 GMT)
CAMEL: Physically Inspired Crosstalk-Aware Mapping and gatE scheduLing for Frequency-Tunable Quantum Chips [5.9] Crosstalkは、量子コンピューティングにおける大きな障害である。
クロストークを緩和するためのCrosstalk-Aware Mapping and gatE Scheduling (CAMEL) 手法を提案する。
クロストークゲートをシリアライズするアプローチとは対照的に、CAMELはデコヒーレンスをうまく抑制する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 07:04:43 GMT)
Linguistic Structure from a Bottleneck on Sequential Information Processing [5.9] 予測情報によって制約されたコードに自然言語のような体系性が生じることを示す。
人間の言語は、音韻学、形態学、構文学、意味論のレベルにおいて、低い予測情報を持つように構成されている。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 15:25:25 GMT)
DDRN:a Data Distribution Reconstruction Network for Occluded Person Re-Identification [5.8] 本研究では,データ分布を利用した生成モデルを提案し,無関係な詳細をフィルタリングする。
Occluded-Dukeデータセットでは、62.4%(+1.1%)のmAPと71.3%(+0.6%)のランク1の精度を達成した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:52:05 GMT)
Gymnasium: A Standard Interface for Reinforcement Learning Environments [5.7] 強化学習(Reinforcement Learning、RL)は、人工知能の多くの領域に革命をもたらす可能性がある成長分野である。
その約束にもかかわらず、RLの研究は環境やアルゴリズムの実装における標準化の欠如によってしばしば妨げられている。
Gymnasiumはオープンソースのライブラリで、RL環境の標準APIを提供する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:48:15 GMT)
Simultaneous Masking, Not Prompting Optimization: A Paradigm Shift in Fine-tuning LLMs for Simultaneous Translation [5.7] 大規模言語モデル(LLM)は、様々な言語処理タスクにおいて最先端のパフォーマンスを達成した。
同時翻訳のための微調整LDMのための新しいパラダイムであるSimulMaskを提案する。
5つの言語対における最先端の最適化戦略と比較して,翻訳品質の大幅な改善が見られた。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 01:12:19 GMT)
Peer-to-Peer Energy Trading of Solar and Energy Storage: A Networked Multiagent Reinforcement Learning Approach [5.7] 我々は,ソーラーPVとエネルギー貯蔵資源の消費者の入札と管理を自動化するために,マルチエージェント強化学習(MARL)フレームワークを提案する。
我々は、MARLフレームワークが物理的ネットワーク制約を統合して電圧制御を実現し、P2Pエネルギートレーディングの物理的実現性を確保する方法を示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:57:47 GMT)
Quantum Advantage: A Single Qubit's Experimental Edge in Classical Data Storage [5.7] 我々は,古典情報記憶における基本量子システムの有効性を確立するためのフォトニック量子プロセッサの実験を行った。
我々の研究は、短期量子技術における即時応用の道を開いた。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:48:07 GMT)
A new approach to delegate signing rights to proxy signers using isogeny-based cryptography [5.7] CSI-PS(commutative supersingular isogeny proxy signature)を提案する。
同種性に基づくグループアクション逆問題(IPGA)の硬度下では, uf-cmaが安全であることが証明された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 05:24:04 GMT)
Magnetic field dependence of $V_B^-$ Defects in hexagonal boron nitride [5.4] 我々は,hBNにおけるV_B-$欠陥のコヒーレンス性に及ぼすオフ軸磁場の影響について検討した。
結果はhBNにおける$V_B-$欠陥の最適化に不可欠であり、堅牢な量子センサとしての重要性を確立している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:40:05 GMT)
Detecting Subtle Differences between Human and Model Languages Using Spectrum of Relative Likelihood [5.4] 本研究は、絶対値ではなく相対的確率値を用いることにより、新たな視点を提供する。
本稿では,教師型と教師型という2つの分類法を用いた検出手法を提案する。
また,人間の言語とモデル言語との微妙な差異を明らかにし,心理言語学研究の理論的ルーツを見出すことができる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 09:36:49 GMT)
On the Security of Bitstream-level JPEG Encryption with Restart Markers [5.3] 本稿では,再起動マーカーを用いて,ビットストリームレベルのJPEG暗号化手法の安全性を評価することを目的とする。
本手法の安全性は, ブルートフォース攻撃における鍵空間解析に関してのみ評価された。
実験では、画像暗号化に使用するパラメータが慎重に選択された場合、暗号文のみの攻撃に対して堅牢であることが確認された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:50:31 GMT)
Enhancing Interpretability and Generalizability in Extended Isolation Forests [5.1] ExIFFI (Extended isolated Forest Feature Importance) は、EIF(Extended isolated Forest)モデルによる予測を説明する手法である。
EIF+は、修正された分割戦略により、見えない異常を検出するモデルの能力を高めるように設計されている。
ExIFFIは、11の現実世界のデータセットのうち8つで、他の教師なしの解釈可能性メソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 09:56:32 GMT)
On diffusion-based generative models and their error bounds: The log-concave case with full convergence estimates [5.1] 我々は,強い対数対数データの下での拡散に基づく生成モデルの収束挙動を理論的に保証する。
スコア推定に使用される関数のクラスは、スコア関数上のリプシッツネスの仮定を避けるために、リプシッツ連続関数からなる。
この手法はサンプリングアルゴリズムにおいて最もよく知られた収束率をもたらす。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:38:01 GMT)
MeteoRA: Multiple-tasks Embedded LoRA for Large Language Models [5.0] MeteoRAはスケーラブルで効率的なフレームワークで、複数のタスク固有のLoRAアダプタをベースLLMに再利用する。
MeteoRAは複合タスクの処理において優れた性能を実現し、単一の推論パスで10のシーケンシャルな問題を効果的に解決する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 15:33:10 GMT)
JPEG Inspired Deep Learning [5.0] 精巧なJPEG圧縮は、ディープラーニング(DL)の性能を実際に向上させる
トレーニング可能なJPEG圧縮層で基盤となるDNNアーキテクチャをプリペイドする新しいDLフレームワークであるJPEG-DLを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:23:54 GMT)
Surgical Depth Anything: Depth Estimation for Surgical Scenes using Foundation Models [4.7] 深度推定の最先端基盤モデルであるDepth Anythingは、ぼやけ、出血、反射といった問題に苦慮している。
本稿では,より正確な深度マップの提供を目的として,外科領域に特化してDepth Anythingモデルを微調整する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:06:14 GMT)
Swin-BERT: A Feature Fusion System designed for Speech-based Alzheimer's Dementia Detection [4.7] 認知症自動検出のための音声ベースシステムSwin-BERTを提案する。
音響的部分については,移動窓のマルチヘッドアテンションを用いて音響系を設計する。
言語的部分については、ADの有無によって異なるリズム関連情報を削除し、音声記録を転写文に書き起こしする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:58:20 GMT)
Selecting the Best Sequential Transfer Path for Medical Image Segmentation with Limited Labeled Data [4.7] 医用画像に適したタスク親和性尺度を用いた新しいシーケンシャルトランスファー方式を提案する。
医用画像分割作業の特徴を考慮し,課題間の画像とラベルの類似性を解析する。
与えられた目標タスクに対して、最も優れたシーケンシャルな転送パスを特定する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:55:52 GMT)
$φ_0$-junction and Josephson diode effect in high-temperature superconductor [4.6] 超伝導体接合部のs波/d波/s波(s-d-s)におけるジョセフソンダイオード効果(JDE)を実現する。
本研究は,高温d波ペアリングに依存するJDE機構を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:54:54 GMT)
EEG-estimated functional connectivity, and not behavior, differentiates Parkinson's patients from health controls during the Simon conflict task [4.5] パーキンソン病(PD)バイオマーカーとしての脳波推定機能接続(FC)について検討した。
スペクトルバンド中のFCは脳全体のプロセスの違いを知らせるものであり、疾患で見られるものと通常の脳機能とを区別するバイオマーカーとして機能することを発見した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:18:32 GMT)
TEASMA: A Practical Methodology for Test Adequacy Assessment of Deep Neural Networks [4.5] TEASMAはDeep Neural Networksのテストセットの精度を正確に評価するために設計された包括的で実用的な方法論である。
遠隔ベースサプライズカバレッジ(DSC)、ライクフードベースサプライズカバレッジ(LSC)、入出力カバレッジ(IDC)、ミューテーションスコア(MS)の4つの測定値を用いてTEASMAを評価する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 20:37:13 GMT)
Likelihood-Free Frequentist Inference: Bridging Classical Statistics and Machine Learning for Reliable Simulator-Based Inference [4.5] 古典統計学と現代の機械学習を橋渡しするモジュラー推論フレームワークを提案する。
我々は、このフレームワークを、可能性のない頻繁性推論(LF2I)と呼ぶ。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:47:08 GMT)
Transducer Consistency Regularization for Speech to Text Applications [4.5] 本稿では,トランスデューサモデルの整合正則化手法であるTransducer Consistency Regularization (TCR)を提案する。
作業確率を利用してトランスデューサ出力分布に異なる重みを与えるので、オラクルアライメントに近いアライメントのみがモデル学習に寄与する。
提案手法は他の整合正規化実装よりも優れていることを示すとともに,textscLibrispeechデータセットの強いベースラインと比較して,単語誤り率(WER)を4.3%削減できることを示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 23:53:13 GMT)
On the Security and Design of Cryptosystems Using Gabidulin-Kronecker Product Codes [4.5] 本稿では,Gabidulin-KroneckerProduct Codesを用いた暗号システムのセキュリティと設計に関する予備的研究を行う。
特に,システムの設計の非現実性を指摘し,その改善方法を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:09:29 GMT)
A neural network-based approach to hybrid systems identification for control [4.3] 本研究では,未知の力学系の機械学習モデルの設計を有限個の(状態入力)状態データポイントから検討する。
ニューラルネットワーク(NN)アーキテクチャを採用して、適切なトレーニングをすれば、連続的なピースワイズ-ファインダイナミクスを備えたハイブリッドシステムが得られるのです。
NNの重みを慎重に選択すると、有限地平面最適制御問題の一部として使用する場合に非常に有利な構造特性を持つハイブリッドシステムモデルが得られることを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 17:58:59 GMT)
Toward a Better Understanding of Fourier Neural Operators from a Spectral Perspective [4.3] SpecB-FNOは、様々なPDEアプリケーションで予測精度を向上し、平均50%の改善を実現している。
本稿では,FNOのスペクトル解析による大規模カーネルの難易度に関する実証的な知見を提供する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:43:57 GMT)
Adaptive Active Inference Agents for Heterogeneous and Lifelong Federated Learning [4.3] 本研究では,グローバルシステムの制約を高レベルなSLOとして設定できる異種普及型システムの概念的エージェントを提案する。
私たちは、異なるリソースタイプとベンダー仕様を持つデバイスの物理的テストベッドで実験を行います。
AIFエージェントは、資源不均質環境で競合するSLOをバランスさせ、最大98%の充足率を確保することができる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:43:29 GMT)
SCILLA: SurfaCe Implicit Learning for Large Urban Area, a volumetric hybrid solution [4.2] SCILLAは2次元画像から大きな運転シーンを再構築するハイブリッドな表面学習手法である。
SCILLAは,様々な都市シナリオにおいて,正確な3次元表面のシーン表現を学べることを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:52:15 GMT)
Adaptive Training of Grid-Dependent Physics-Informed Kolmogorov-Arnold Networks [4.2] 物理インフォームドニューラルネットワーク(PINN)は、部分微分方程式(PDE)を解くための堅牢なフレームワークとして登場した。
本稿では、PDEを解くために、グリッド依存のKolmogorov-Arnold Networks(PIKAN)の高速なJAXベースの実装を提案する。
適応的特徴は解の精度を著しく向上させ,基準解に対するL2誤差を最大43.02%減少させることを示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:18:37 GMT)
LEGO: QEC Decoding System Architecture for Dynamic Circuits [4.1] 量子誤り訂正(QEC)はFTQCの重要な構成要素である。
近年,リアルタイムQECデコーダの開発が急速に進んでいる。
LEGOと呼ばれるQECデコーダアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 19:08:53 GMT)
LEGO: QEC Decoding System Architecture for Dynamic Circuits [4.1] 量子誤り訂正(QEC)はFTQCの重要な構成要素である。
近年,リアルタイムQECデコーダの開発が急速に進んでいる。
LEGOと呼ばれるQECデコーダアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 19:08:53 GMT)
SHyPar: A Spectral Coarsening Approach to Hypergraph Partitioning [4.1] 大規模ハイパーグラフのためのマルチレベルスペクトルフレームワークSHyParを導入し,ハイパーエッジ有効抵抗とフローベースコミュニティ検出技術を利用した。
SHyParの鍵となるコンポーネントは、ハイパーグラフ粗化のためのフローベースの局所クラスタリングスキームであり、最大フローベースのアルゴリズムを組み込んで、コンダクタンスを大幅に改善したノードを生成する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:29:47 GMT)
Bridging Today and the Future of Humanity: AI Safety in 2024 and Beyond [3.8] あらゆる物のインターネットが現実になる未来を概説する。
この青写真に対する現在の取り組みを推し進めることで、現在のモチベーションと長期的ニーズの整合性を検討する。
このビジョンペーパーは、AIの安全性に関するより広い視点を提供することを目的としており、我々の取り組みは緊急の懸念に対処するだけでなく、潜在的なリスクを予測すべきである、と強調している。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 05:36:29 GMT)
VehicleSDF: A 3D generative model for constrained engineering design via surrogate modeling [3.7] 本研究は,自動車開発におけるデザイン空間の探索に3次元生成モデルを用いたことを明らかにする。
我々は、所定の幾何学的仕様を満たす車両の様々な3Dモデルを生成する。
また,空力抵抗などの性能パラメータを高速に推定する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:59:24 GMT)
Imaging coupled vibrational, rotational, and electronic wave packet dynamics in a triatomic molecule [3.7] 振動, 回転, 電子自由度の間の相互作用が分子波パケットの進化をどのように制御するかを示す。
以上の結果から,多分子分子における電子・原子間相互作用の結合を特徴付けるための効率的な実験ツールとして,多共起CEIが有用であることが示唆された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:54:21 GMT)
WardropNet: Traffic Flow Predictions via Equilibrium-Augmented Learning [3.6] 我々は,高速かつ正確なトラフィックフロー予測を可能にする,新しい拡張ニューラルネットワークアーキテクチャを導入する。
本稿では、平衡の幾何に適合するブレグマンの発散を利用して、エンドツーエンドの学習を可能にする方法を示す。
WardropNetは、リアルでスタイリングされたトラフィックシナリオに対するトラフィック均衡を予測する純粋な学習ベースのアプローチよりも優れています。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:07:29 GMT)
Crafting desirable climate trajectories with RL explored socio-environmental simulations [3.6] 統合アセスメントモデル(IAM)は、社会、経済、環境シミュレーションを組み合わせて、潜在的な政策効果を予測する。
従来の解決法を置き換えるために強化学習(RL)を用いた最近の予備研究は、不確実でノイズの多いシナリオにおける意思決定において有望な結果を示している。
我々は、様々な利害関係者や国家間の複雑な相互作用の相互作用をモデル化するための予備分析として、複数の対話的RLエージェントを導入することにより、この研究を拡大する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:21:50 GMT)
Logarithmic-Depth Quantum Circuits for Hamming Weight Projections [3.5] 入力純状態上でのコヒーレントハミング重みの射影測定を実現する量子アルゴリズムを提案する。
我々は、対応する量子回路の深さ幅のトレードオフを分析し、より多くの制御量子ビットのコストで回路の深さの低減を可能にする。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 01:42:45 GMT)
On the Hölder Stability of Multiset and Graph Neural Networks [3.4] リプシッツとホルダーのパラメトリック関数への適応に基づくペアワイズ分離品質解析フレームワークを提案する。
一般的な和モデルでは,ネットワークの深さとともに急速に減衰する指数が期待値よりも低いことが証明される。
これらのMPNNは、敵の例を簡単に分類でき、標準的なグラフ学習タスクにおける標準MPNNと良好に比較できることを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 19:44:36 GMT)
On the Expressive Power of Sparse Geometric MPNNs [3.4] 幾何学グラフに対するメッセージパッシングニューラルネットワークの表現力について検討する。
非同型幾何グラフの一般的なペアは、メッセージパッシングネットワークによって分離可能であることを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:47:38 GMT)
CAFEEN: A Cooperative Approach for Energy Efficient NoCs with Multi-Agent Reinforcement Learning [3.3] 高性能ネットワークオンチップ(NoC)アーキテクチャでは、エネルギー消費を最小限に抑えるために効率的な電力管理が不可欠である。
本稿では,エネルギー効率のよいNoCに対して,きめ細粒度と機械学習に基づく粗粒度パワーゲーティングを併用したCAFEENという新しいフレームワークを提案する。
結果として、CAFEENはパフォーマンスと電力効率を適応的にバランスさせ、単一のアプリケーションワークロードで2.60倍、マルチアプリケーションワークロードで4.37倍削減する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:42:55 GMT)
KID-PPG: Knowledge Informed Deep Learning for Extracting Heart Rate from a Smartwatch [3.3] 本稿では,適応線形フィルタリング,深層確率推論,データ拡張による知識情報の統合型ディープラーニングモデルを提案する。
以上の結果から,先行知識を深層学習モデルに組み込むことにより,心拍追跡の大幅な改善が示された。
このアプローチは、ディープラーニングモデルに既存のエキスパート知識を取り入れることで、様々なバイオメディカル応用の強化を約束する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 15:03:38 GMT)
Evaluating Computational Pathology Foundation Models for Prostate Cancer Grading under Distribution Shifts [3.3] UNI (10万枚以上) と CONCH (1100万枚以上) の2つの計算病理基盤モデルを評価する。
UNIとCONCHはベースラインとよく比較できるが、絶対的な性能は特定の設定ではあまり満足できない。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:45:53 GMT)
LLMs learn governing principles of dynamical systems, revealing an in-context neural scaling law [3.3] 主にテキストに基づいて訓練された言語モデルは、微調整やプロンプトエンジニアリングなしで動的システム時系列の正確な予測を行う。
LLMから直接多桁数の確率密度関数を抽出するフレキシブルで効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:02:13 GMT)
Density estimation with LLMs: a geometric investigation of in-context learning trajectories [3.3] 大規模言語モデル(LLM)は、様々なタスクでコンテキスト内学習を行う際、顕著な創発的能力を示す。
本研究は,LLMがコンテキスト内で観測されたデータから確率密度関数を推定する能力について検討する。
我々は、集中主成分分析(Intensive principal Component Analysis, InPCA)を活用し、LLaMA-2モデルのコンテキスト内学習ダイナミクスを可視化および解析する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 22:23:20 GMT)
Density estimation with LLMs: a geometric investigation of in-context learning trajectories [3.3] 大規模言語モデル(LLM)は、様々なタスクでコンテキスト内学習を行う際、顕著な創発的能力を示す。
本研究は,LLMがコンテキスト内で観測されたデータから確率密度関数を推定する能力について検討する。
我々は、集中主成分分析(Intensive principal Component Analysis, InPCA)を活用し、LLaMA-2モデルのコンテキスト内学習ダイナミクスを可視化および解析する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 22:23:20 GMT)
Deep Learning Ensemble for Predicting Diabetic Macular Edema Onset Using Ultra-Wide Field Color Fundus Image [3.3] 糖尿病黄斑浮腫(英: Diabetic macular edema, DME)は、糖尿病の重篤な合併症である。
超広視野カラー写真画像を用いて1年以内にci-DMEの発症を予測するアンサンブル手法を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:16:29 GMT)
Speech Separation based on Contrastive Learning and Deep Modularization [3.3] 本稿では,コントラスト学習を用いてフレームの表現を確立し,下流の深いモジュール化タスクにおいて学習された表現を使用する。
そこで我々は,与えられた話者に属するフレーム間の距離を最小化するために,自己教師型学習を実装した。
学習した表現は、下流の深いモジュール化タスクで、話者のアイデンティティに基づいたクラスタフレームに使用される。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 13:06:48 GMT)
An Approach for Auto Generation of Labeling Functions for Software Engineering Chatbots [3.2] ラベル付きユーザクエリからパターンを抽出し,ラベル付け関数(LF)を自動的に生成する手法を提案する。
提案手法の有効性を,4種類のSEデータセットのクエリに適用することで評価する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:34:14 GMT)
Leaf Stripping on Uniform Attachment Trees [3.2] 確率が 1 - epsilon$ の場合、残される頂点の集合は根を含み、木のサイズによらず、$epsilon$ に依存するだけのサイズを持つことを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:15:57 GMT)
FedECA: A Federated External Control Arm Method for Causal Inference with Time-To-Event Data in Distributed Settings [3.2] 外部制御アーム(ECA)は、実験薬の初期臨床開発を知らせることができる。
ECAは、規制承認の有効な証拠を提供することができる。
ECAを実装する上での大きな課題は、現実世界または歴史的な臨床試験データにアクセスすることである。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 08:29:40 GMT)
User Feedback in Continuous Software Engineering: Revealing the State-of-Practice [3.2] 継続的エンジニアリングのプラクティスには、顧客とエンドユーザからのインプットを伴う継続的フィードバックループが必要です。
実践者がCSEでユーザフィードバックをどのように扱うかを説明する文献は限られている。
製品開発企業13社の21社のインタビューから質的な調査と報告を行った。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:59:16 GMT)
An Overview of zbMATH Open Digital Library [3.1] zbMATH Openは数学文献の総合的なリポジトリである。
数学的情報を発見し、評価し、接続するための、統一された品質保証基盤として機能する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:45:43 GMT)
ReCon: Reconfiguring Analog Rydberg Atom Quantum Computers for Quantum Generative Adversarial Networks [3.1] ReConはアナログRydberg原子量子コンピュータ上で量子対向ネットワーク(GAN)を実装する最初の研究である。
本評価は, 超伝導量子ビット技術に実装された最先端技術よりも33%高い品質(Frechet Inception Distance (FID) を用いた生成画像の評価)を示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 22:08:17 GMT)
rECGnition_v1.0: Arrhythmia detection using cardiologist-inspired multi-modal architecture incorporating demographic attributes in ECG [3.0] 本稿では,心電図解析と不整脈分類のための新しいマルチモーダル手法を提案する。
提案したrECGnition_v1.0アルゴリズムはクリニックへの展開の道を開く。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:17:02 GMT)
Revisiting Multi-Permutation Equivariance through the Lens of Irreducible Representations [3.0] 非シーム層は、グラフ異常検出、重み空間アライメント、ワッサーシュタイン距離の学習といったタスクのパフォーマンスを向上させることができることを示す。
また、これらの追加の非シーム層は、グラフ異常の検出、重み空間のアライメント、ワッサーシュタイン距離の学習といったタスクのパフォーマンスを向上させることを実証的に示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:19:31 GMT)
Representation-Enhanced Neural Knowledge Integration with Application to Large-Scale Medical Ontology Learning [3.0] 本稿では,関係型の同時学習を実現するため,理論的に保証されたRENKIという統計フレームワークを提案する。
提案フレームワークは,表現学習出力をニューラルネットワークの初期エンティティ埋め込みに組み込んで,知識グラフのスコア関数を近似する。
ヘテロジニアス関係の存在下での重み付けの効果と、非パラメトリックモデルに表現学習を組み込むことの利点を実証する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:38:48 GMT)
Graph Fourier Neural Kernels (G-FuNK): Learning Solutions of Nonlinear Diffusive Parametric PDEs on Multiple Domains [2.9] グラフフーリエニューラルカーネルに基づくニューラル演算子の新しいファミリーを導入する。
G-FuNKはパラメータ適応されたコンポーネントと、そうでないコンポーネントを組み合わせる。
実験では、G-FuNKが熱、反応拡散、心電気生理学的方程式を正確に近似する能力を示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:46:31 GMT)
Graph Fourier Neural Kernels (G-FuNK): Learning Solutions of Nonlinear Diffusive Parametric PDEs on Multiple Domains [2.9] グラフフーリエニューラルカーネルに基づくニューラル演算子の新しいファミリーを導入する。
G-FuNKはパラメータとドメイン適応のコンポーネントを、そうでないコンポーネントと組み合わせている。
実験では、G-FuNKが熱、反応拡散、心電気生理学的方程式を正確に近似する能力を示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:46:31 GMT)
AI, Climate, and Regulation: From Data Centers to the AI Act [2.9] 我々は、特にデータセンターとAIの気候関連規制に関するガイダンスを提供することを目標としている。
我々は、AIの推論から、これまで未解決であったエネルギー消費の報告を、その範囲に戻すために、AI法の具体的な解釈を提案する。
我々は、環境問題を含むAI法を強制リスクアセスメントに解釈することを主張する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:43:53 GMT)
Understanding Higher-Order Correlations Among Semantic Components in Embeddings [2.8] 独立成分分析(ICA)は、埋め込みの固有の幾何学的構造を意味的要素として解釈する有効な方法である。
ICAが排除できない推定成分間の非依存性を定量化した。
構造全体の可視化は、セマンティックコンポーネントの最大スパンニングツリーを使用して行われた。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:57:48 GMT)
Understanding Higher-Order Correlations Among Semantic Components in Embeddings [2.8] 独立コンポーネント分析(ICA)は、埋め込みの解釈可能なセマンティックコンポーネントを提供する。
我々は高次相関を用いて非独立性を定量化し、それら間の強い意味的関連を実証した。
これらの知見はICAによる埋め込みに関する深い洞察を与える。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:57:48 GMT)
Axis Tour: Word Tour Determines the Order of Axes in ICA-transformed Embeddings [2.8] ICA変換された単語埋め込みは解釈可能な意味軸を示すが、これらの軸の順序は任意である。
1次元の単語埋め込み手法であるWord Tourに着想を得て,単語埋め込み空間の明瞭さの向上を目指す。
我々は,Axis Tour が PCA と ICA のどちらよりも優れた,あるいは同等の低次元埋め込みをもたらすことを示す実験を通して示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 17:38:22 GMT)
Bots can Snoop: Uncovering and Mitigating Privacy Risks of Bots in Group Chats [2.8] SnoopGuardはグループメッセージングプロトコルで、強力なエンドツーエンドセキュリティを維持しながら、チャットボットに対するユーザのプライバシを保証する。
私たちのプロトタイプ実装では、メッセージレイヤセキュリティ(MLS)と統合された場合、50人のグループでメッセージを送信するのに約30ミリ秒かかります。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:37:41 GMT)
YoloTag: Vision-based Robust UAV Navigation with Fiducial Markers [2.8] リアルタイムな画像マーカーに基づく位置決めシステムであるYoloTagを提案する。
YoloTagは軽量のYOLO v8オブジェクト検出器を使用して、画像中の画像マーカーを正確に検出する。
検出されたマーカーは、UAV状態を推定するために効率的な視点-n-pointアルゴリズムによって使用される。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:08:30 GMT)
Multi-Neuron Unleashes Expressivity of ReLU Networks Under Convex Relaxation [2.8] 一般的なReLUネットワークに対して,(階層的に)多重ニューロン緩和が完全な認証を提供することを示す。
我々は、ReLUネットワークの表現性は、マルチニューロン緩和下ではもはや制限されないことを示した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:14:24 GMT)
Gumbel Rao Monte Carlo based Bi-Modal Neural Architecture Search for Audio-Visual Deepfake Detection [2.7] ディープフェイクは、高度にリアルな合成メディアを生成することによって、生体認証システムに重大な脅威をもたらす。
既存のマルチモーダルディープフェイク検出器は、しばしば多様なデータに適応するのに苦労し、単純な融合法に依存している。
本稿では,Gumbel-Rao Monte Carloサンプリングを用いてマルチモーダル融合を最適化する新しいアーキテクチャ探索フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:37:35 GMT)
Gem: Gaussian Mixture Model Embeddings for Numerical Feature Distributions [2.7] 本稿では,列から数値分布をベースとした埋め込みを生成するGem (Gaussian Mixed Model Embeddings) 法を提案する。
我々は,分布,統計,文脈の3つの数値データ特性に対する埋め込みを生成する。
Gemと、数値のみと数値+コンテキストタスクのベースラインメソッドを比較し、Gemが4つのベンチマークデータセットのベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 23:40:58 GMT)
Collusion Detection with Graph Neural Networks [2.7] 本稿では,ニューラルネットワーク(NN)とグラフニューラルネットワーク(GNN)を用いて,各国市場における共謀パターンの検出と予測を行う革新的な手法を提案する。
GNNはこのタスクに特に適しているのは、共謀やその他の経済問題に存在するネットワーク構造を活用できるからである。
本研究では,GNNが複雑な凝固パターンを検出する上で,NNよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:31:41 GMT)
Rebuilding ROME : Resolving Model Collapse during Sequential Model Editing [2.6] Rank-One Model Editing (ROME) の実装において,編集の無効化は不規則な成果であることを示す。
我々は、r-ROME と呼ばれるより安定した実装 ROME を提供し、r-ROME で大規模な逐次編集を行う場合、モデル崩壊はもはや観測されないことを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:41:43 GMT)
A Unified Framework for Model Editing [2.6] ROMEとMEMITは、主に2つの異なるモデル編集アルゴリズムであると信じられている。
我々はこの2つのアルゴリズムを一つの概念的な傘の下に統一し、同じ目標を最適化する。
両アルゴリズムは, 最適化目標, 能力, モデル編集性能, 限界の観点から等価であることを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:37:30 GMT)
Automated and Complete Generation of Traffic Scenarios at Road Junctions Using a Multi-level Danger Definition [2.6] 本稿では,任意の道路交差点において,完全な(潜在的に危険な)抽象シナリオを導出する手法を提案する。
これらの抽象的なシナリオから、アクターがシミュレーションベースのテストをガイドするために従わなければならない正確なパスを導き出す。
その結果, AV-under-test はシミュレーションにおける不安全行動の割合の増加に関与していることがわかった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:23:51 GMT)
LSTM networks provide efficient cyanobacterial blooms forecasting even with incomplete spatio-temporal data [2.6] シアノバクテリアの早期警報システム(EWS)は、タイムリーな管理対策の実装を可能にする。
本稿では,6年間の非完全高周波時間データを用いたシアノバクテリアの開花予測に有効なEWSを提案する。
その結果,ハイブリッドシステムで評価した4日から28日間の7つの予測時間地平線について分析した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:13:24 GMT)
Scalable Event-by-event Processing of Neuromorphic Sensory Signals With Deep State-Space Models [2.6] イベントベースのセンサーはリアルタイム処理に適している。
現在の方法では、イベントをフレームに分解するか、イベントデータをイベント単位で直接処理する場合にスケールアップできない。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:57:39 GMT)
A Notion of Complexity for Theory of Mind via Discrete World Models [2.5] ToM(Theory of Mind)は、社会的推論が必要な複雑なシナリオにおいて、LLM(Large Language Models)の機能を評価するために用いられる。
本研究では,ToMタスクの複雑さを測定するための認知負荷理論に着想を得たフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:59:31 GMT)
Double Robust Bayesian Inference on Average Treatment Effects [2.5] 不整合下での平均処理効果(ATE)に対する二重頑健なベイズ推定法を提案する。
新しいベイズ的アプローチでは、まず条件付き平均関数の事前分布を調整し、得られた ATE の後方分布を補正する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 08:23:35 GMT)
Towards Efficient Information Fusion: Concentric Dual Fusion Attention Based Multiple Instance Learning for Whole Slide Images [2.4] 本稿では,CDFA-MIL(Concentric Dual Fusion Attention-MIL)フレームワークを紹介する。
CDFA-MILは、同心パッチを用いて、ポイント・ツー・ゾーン・アテンションとポイント・ツー・ポイント・コンセントリック・アテンションを組み合わせたものである。
そのアプリケーションは例外的な性能を示しており、既存のMILメソッドの精度と、著名なデータセットのF1スコアを大きく上回っている。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 13:49:42 GMT)
UniAutoML: A Human-Centered Framework for Unified Discriminative and Generative AutoML with Large Language Models [2.4] 我々は、人間中心のAutoMLフレームワークであるUniAutoMLを紹介し、AutoMLを識別的タスクと生成的タスクの両方に統一する。
UniAutoMLの人間中心の設計は、自然言語の対話を容易にする対話型ユーザインタフェース(CUI)を革新的に特徴付けている。
この設計により、AutoMLトレーニングプロセス全体の透明性とユーザコントロールが向上し、ユーザがトレーニング対象のモデルをシームレスに分解あるいは修正できるようになる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 17:33:15 GMT)
On the Communication Complexity of Approximate Pattern Matching [2.4] 上界が$O(n/m cdot k log2 m)$ bitsであることを証明する。
また、$O(n/m cdot k log2 m)$ bits は、$k$-error 発生毎に$P$ in $T$ のエンコードを可能にする。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:08:17 GMT)
Near-Optimal-Time Quantum Algorithms for Approximate Pattern Matching [2.4] パターンマッチングにおけるハミング距離と、編集によるパターンマッチングにおける編集距離の2つを考える。
時間的複雑性は$tildeO(sqrtnk+sqrtn/mcdot k3.5)$ for Pattern Matching with Mismatchesと$hatO(sqrtnk+sqrtn/mcdot k3.5)$ for Pattern Matching with Editsである。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:05:26 GMT)
Functionality learning through specification instructions [2.4] テストスイートは、自然言語処理モデルのパフォーマンスを特定の機能で評価する。
本稿では,細粒度タスク固有の振る舞いを記述したテキスト記述について述べる。
我々は、仕様記述と仕様拡張プロンプトを組み合わせ、自然の命令データに基づいて事前訓練された言語モデルにフィードする。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:54:38 GMT)
A Framework for SLO, Carbon, and Wastewater-Aware Sustainable FaaS Cloud Platform Management [2.4] 持続可能性の観点からFunction-as-a-Service(F)スケジューリングとスケーリングについて検討する。
Fと炭素排出量のサービスレベル目標(SLO)が相反していることが判明した。
本研究では, 持続可能性に着目した新しいFスケジューリング・スケーリング・フレームワークを提案し, 性能, 二酸化炭素排出量, 排水の発生を最適化する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 20:47:52 GMT)
Transfer Learning for a Class of Cascade Dynamical Systems [2.4] 我々は、強化学習の文脈でトランスファーラーニングの問題を考察する。
整列システムにおけるポリシのトレーニングと,それをフルステートシステムにデプロイすることを検討する。
このトレーニング戦略の動機は、力学が複雑であれば、フルステートシステムでシミュレーションを実行するのに過剰な時間を要する可能性があることである。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:40:31 GMT)
Incompressible Navier-Stokes solve on noisy quantum hardware via a hybrid quantum-classical scheme [2.4] 流体流に対するナヴィエ・ストークス方程式を解くためには偏微分方程式解法が必要である。
この研究は、圧縮不能なナビエ-ストークス方程式に対するハイブリッド量子古典アルゴリズムを示す。
我々は、ノイズフリーシミュレーションを用いてアルゴリズムを検証し、ノイズの多いIBM超伝導量子ハードウェア上でテストする。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:12:56 GMT)
Towards Error Budgeting for Superconducting Modular Quantum Architecture Designs [2.3] 本稿では,SNAILモジュール内の実現可能なゲートの物理モデルを記述することによって,物理インフォームド設計制約を提案する。
モジュールの半径が増加するにつれて,周波数群集がゲートの忠実度に与える影響を分析することで,アロケーション問題に対処する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:04:12 GMT)
Towards Error Budgeting for Superconducting Modular Quantum Architecture Designs [2.3] 本稿では,SNAILモジュール内の実現可能なゲートの物理モデルを記述することによって,物理インフォームド設計制約を提案する。
モジュールの半径が増加するにつれて,周波数群集がゲートの忠実度に与える影響を分析することで,アロケーション問題に対処する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:04:12 GMT)
Towards Error Budgeting for Superconducting Modular Quantum Architecture Designs [2.3] 本稿では,SNAILモジュール内の実現可能なゲートの物理モデルを記述することによって,物理インフォームド設計制約を提案する。
モジュールの半径が増加するにつれて,周波数群集がゲートの忠実度に与える影響を分析することで,アロケーション問題に対処する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:04:12 GMT)
Optimizing Estimators of Squared Calibration Errors in Classification [2.3] 本稿では,2乗キャリブレーション誤差の推定器の比較と最適化を可能にする平均二乗誤差に基づくリスクを提案する。
キャリブレーション誤差を推定する際のトレーニングバリデーションテストパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:58:06 GMT)
Explicit decoders using fixed-point amplitude amplification based on QSVT [2.3] 量子情報を回復可能な2つの明示的復号化量子回路を提供する。
量子特異値変換(QSVT)に基づく固定点振幅増幅(FPAA)を用いてデコーダを構築する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 22:18:16 GMT)
DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining [2.2] 大規模言語モデル(LLM)は、多くの業界領域で効果的に一般化する能力を示している。
LLMは、専門分野や低リソース産業領域での業務を行う際の制限を示す。
本研究では,シードガイドデータマイニングによるDoPAMine:Domain固有の事前トレーニング適応を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:39:59 GMT)
DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining [2.2] 大規模言語モデル(LLM)は、多くの業界領域で効果的に一般化する能力を示している。
LLMは、専門分野や低リソース産業領域での業務を行う際の制限を示す。
本研究では,シードガイドデータマイニングによるDoPAMine:Domain固有の事前トレーニング適応を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:39:59 GMT)
Structured Spatial Reasoning with Open Vocabulary Object Detectors [2.1] オブジェクト間の空間的関係に関する推論は多くの実世界のロボット作業において不可欠である。
我々は、リッチな3次元幾何学的特徴と最先端のオープンボキャブラリオブジェクト検出器を統合する構造的確率的アプローチを導入する。
この手法は、空間推論タスクにおける最先端ビジョン・言語モデル(VLM)のゼロショット性能を評価・比較する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 19:37:01 GMT)
Can Your Generative Model Detect Out-of-Distribution Covariate Shift? [2.0] 条件付き正規化フロー(cNFs)を用いたOODセンサデータ検出のための新しい手法を提案する。
CIFAR10 対 CIFAR10-C と ImageNet200 対 ImageNet200-C では,提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:44:35 GMT)
Capturing Bias Diversity in LLMs [2.0] 本稿では,Large Language Models (LLMs) の拡張について,その出力の多様性を付加して検討する。
性別,年齢,人種など,特定の人口特性のバイアスを反映したGPTモデルの複数のカスタムインスタンスを開発することにより,我々はBiasGPTと呼ぶ,よりニュアンスで代表的なAI対話のためのフレームワークを提案し,開発し,評価する。
本稿では、実験を通じて、より包括的なAI技術の可能性を開くことができる様々なバイアスを埋め込むGPTモデルの能力を実証する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 17:07:50 GMT)
A two-stage transliteration approach to improve performance of a multilingual ASR [2.0] 本稿では,言語に依存しないエンドツーエンドモデルを構築するためのアプローチを提案する。
我々は2つのIndic言語に対するエンドツーエンドの多言語音声認識システムを用いて実験を行った。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 05:30:33 GMT)
Read Over the Lines: Attacking LLMs and Toxicity Detection Systems with ASCII Art to Mask Profanity [1.9] 言語モデルがASCIIアートを解釈できないことを生かした,敵対的攻撃の新たなファミリーを紹介した。
特殊トークンを利用したASCIIアートフォントと,テキストを埋め込んだ文字形状を用いたASCIIアートフォントを開発した。
当社の攻撃は,OpenAIのo1-previewやLLaMA 3.1を含む10モデルで,完全な1.0アタック成功率を実現しています。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:29:38 GMT)
Read Over the Lines: Attacking LLMs and Toxicity Detection Systems with ASCII Art to Mask Profanity [1.9] 言語モデルがASCIIアートを解釈できないことを生かした,敵対的攻撃の新たなファミリーを紹介した。
特殊トークンを利用したASCIIアートフォントと,テキストを埋め込んだ文字形状を用いたASCIIアートフォントを開発した。
当社の攻撃は,OpenAIのo1-previewやLLaMA 3.1を含む10モデルで,完全な1.0アタック成功率を実現しています。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:29:38 GMT)
Read Over the Lines: Attacking LLMs and Toxicity Detection Systems with ASCII Art to Mask Profanity [1.9] 言語モデルがASCIIアートを解釈できないことを生かした,敵対的攻撃の新たなファミリーを紹介した。
特殊トークンを利用したASCIIアートフォントと,テキストを埋め込んだ文字形状を用いたASCIIアートフォントを開発した。
当社の攻撃は,OpenAIのo1-previewやLLaMA 3.1を含む10モデルで,完全な1.0アタック成功率を実現しています。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:29:38 GMT)
TinyLidarNet: 2D LiDAR-based End-to-End Deep Learning Model for F1TENTH Autonomous Racing [1.9] 自動運転車のための軽量2D LiDARベースのエンドツーエンドディープラーニングモデルであるTinyLidarNetを紹介した。
ティニーライダーネットを使用したF1TENTH車両は、12回目のF1TENTH自律グランプリで3位を獲得した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:28:33 GMT)
Aligning Motion-Blurred Images Using Contrastive Learning on Overcomplete Pixels [1.9] 動きのぼかしに不変なオーバーコンプリート画素レベルの特徴を学習するための新しいコントラスト的目的を提案する。
我々の目的を訓練した単純なU-Netは、現実的で困難な条件下で撮影される見えないビデオのフレームを移動カメラに合わせるのに有用なローカル機能を生み出すことができることを実証する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:21:43 GMT)
En masse scanning and automated surfacing of small objects using Micro-CT [1.9] そこで本研究では,マイクロCTスキャンを多用する新しいプロトコルを提案する。
10個のマイクロCTスキャンで1,112個の動物の骨片をスキャンし、個別のPLYファイルに処理した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 19:05:22 GMT)
Jointly Generating Multi-view Consistent PBR Textures using Collaborative Control [1.9] 協調制御は、通常のバンプマップを含むPBR画像の確率分布を直接モデル化する。
本稿では,このモデルをマルチビューで一貫した設計決定について論じ,アブレーション研究におけるアプローチの有効性を実証する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:21:46 GMT)
Decay of the vortex muon [1.8] ミューオン崩壊は自己解析であり、放出された電子のスペクトル角分布は偏光ミューオンのスピン配向を示す。
ここでは、非平面波状態のミューオンに同じ特徴が適用されることを示す。
我々は、ミューオンが非ゼロ軌道角運動量を持ついわゆる渦状態に焦点を当てる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 06:08:36 GMT)
Students' Perceptions and Use of Generative AI Tools for Programming Across Different Computing Courses [1.8] 生成的人工知能(GenAI)の教育における利用に対する学生の認識と意見の調査が注目されている。
学生がGenAIツールをどのように認識し利用しているかは、背景知識を含む多くの要因に依存する可能性がある。
ヨーロッパ大の研究大学の全コンピュータプログラムの学生を対象に,3つの調査を行った。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:24:06 GMT)
Inference over Unseen Entities, Relations and Literals on Knowledge Graphs [1.7] 知識グラフ埋め込みモデルは、様々な課題に対処するために、トランスダクティブな設定でうまく適用されている。
本稿では、エンティティとリレーションのバイトペアエンコードされたサブワード単位のシーケンスから三重埋め込みを構築するための注意的バイトペアエンコーディング層(BytE)を提案する。
BytEは、知識グラフの埋め込みモデルに、エンティティやリレーションではなくサブワード単位の埋め込みを学習させるため、重み付けによる大規模な機能の再利用につながる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:20:54 GMT)
Post-Userist Recommender Systems : A Manifesto [1.7] 我々は,ユーザとシステムの関係を考慮に入れたレコメンデーションシステムに対するアプローチとして,ユーザリストレコメンデーションを定義した。
ポストユーザーストレコメンデーションは、利害関係者が埋め込まれ、レコメンデーション機能が生成メディアと区別される、より大きな関係分野を仮定する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:16:37 GMT)
Exploiting Distribution Constraints for Scalable and Efficient Image Retrieval [1.7] 最先端の画像検索システムは、データセットごとに特定のニューラルネットワークをトレーニングする。
オフザシェルフのファンデーションモデルは、データセット固有のモデルに匹敵するパフォーマンスを達成するには不足している。
本稿では,基本モデルの性能を著しく向上するAE-SVC(Strong Variance Constraints)を用いたオートエンコーダを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:05:16 GMT)
NetDiff: Deep Graph Denoising Diffusion for Ad Hoc Network Topology Generation [1.7] 本稿では,無線アドホックネットワークリンクトポロジを生成する拡散確率的アーキテクチャを記述したグラフであるNetDiffを紹介する。
この結果から,生成したリンクは現実的であり,データセットグラフに類似した構造的特性を有しており,操作するには小さな修正と検証ステップのみが必要であることがわかった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:39:49 GMT)
Outlier Detection with Cluster Catch Digraphs [1.6] 本稿では,クラスタ・キャッシュ・ダイグラフ(CCD)に基づく異常検出アルゴリズムを新たに導入する。
そこで我々は,Uniformity-based CCD with Mutual Catch Graph (U-MCCD), The Uniformity- and Neighbor-based CCD with Mutual Catch Graph (UN-MCCD), and their shape-adaptive variants (SU-MCCD and SUN-MCCD)を提案する。
以上の結果から,これらのアルゴリズムは,外乱検出の精度と適応性を大幅に向上させることが示唆された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:38:36 GMT)
Estimating Exoplanet Mass using Machine Learning on Incomplete Datasets [1.6] 発見されている惑星の70%以上が、測定された惑星の質量を持っていない。
提案手法は,惑星質量の計算に欠落した特性を推定するために,機械学習アルゴリズムを用いる方法を示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:19:33 GMT)
Siamese networks for Poincaré embeddings and the reconstruction of evolutionary trees [1.6] 本研究では,鳥の鳴き声スペクトログラムを用いた高次元データから進化木を再構成する手法を提案する。
提案手法は2つの主要な要素を組み合わす: 次元減少と距離計算のためのPoincarの埋め込みと、木再構築のための隣接する結合アルゴリズムである。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 19:10:08 GMT)
Directly Handling Missing Data in Linear Discriminant Analysis for Enhancing Classification Accuracy and Interpretability [1.5] 重み付き欠失線形判別分析(WLDA)と呼ばれる新しい頑健な分類法を提案する。
WLDAは線形判別分析(LDA)を拡張して、計算不要な値でデータセットを処理する。
我々はWLDAの特性を確立するために詳細な理論解析を行い、その説明可能性について徹底的に評価する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:51:23 GMT)
Applying Quantum Autoencoders for Time Series Anomaly Detection [1.5] 異常検出は、不正検出、パターン認識、医療診断など、様々な分野の応用において重要な問題である。
本稿では,量子オートエンコーダの時系列異常検出への応用について検討する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:56:28 GMT)
Applying Quantum Autoencoders for Time Series Anomaly Detection [1.5] 異常検出は、不正検出、パターン認識、医療診断など、様々な分野の応用において重要な問題である。
本稿では,量子オートエンコーダの時系列異常検出への応用について検討する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:56:28 GMT)
Modeling chaotic Lorenz ODE System using Scientific Machine Learning [1.5] 本稿では,SciML(SciML)手法を基礎的な気象モデルに統合する。
物理気候モデルの解釈可能性とニューラルネットワークの計算能力を組み合わせることで、SciMLモデルは気候をモデル化するための信頼できるツールであることが証明できる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:17:06 GMT)
Evaluating the Impact of Point Cloud Colorization on Semantic Segmentation Accuracy [1.5] ポイントクラウドセマンティックセグメンテーションは3Dシーン理解に不可欠である。
画像ベースセグメンテーションは、その成熟度から広く採用されているが、RGB情報のみに依存する手法は、色の不正確さによる劣化性能に悩まされることが多い。
近年の進歩には、強度や幾何情報などの付加的な特徴が組み込まれているが、RGBチャネルは、色付けにおける誤差が発生した場合のセグメンテーション精度に悪影響を及ぼし続けている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:46:53 GMT)
Generalizing Segmentation Foundation Model Under Sim-to-real Domain-shift for Guidewire Segmentation in X-ray Fluoroscopy [1.4] Sim-to-real ドメイン適応アプローチは、コスト効率の良いソリューションを提供するシミュレーションから合成データを利用する。
対象領域のアノテーションを使わずに、SAMを蛍光X線ガイドワイヤセグメント化に適応させる戦略を提案する。
提案手法は、事前訓練されたSAMと、最先端のドメイン適応技術の両方を大きなマージンで上回っている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:59:48 GMT)
Quantitative Theory of Meaning. Application to Financial Markets. EUR/USD case study [1.4] 本論文は、情報と投資家の期待と市場価格運動の関連性に焦点を当てている。
我々は,情報量論の補完として,意味の定量的理論を構築した。
提案手法は、将来の市場資産の価格変動をよりよく理解し予測するために使用することができる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:06:40 GMT)
Diffuse or Confuse: A Diffusion Deepfake Speech Dataset [1.4] 本稿では,現実的な合成音声を生成する新しい手法である拡散モデルについて検討する。
利用可能なツールと事前訓練されたモデルを使って拡散データセットを作成します。
本研究は,拡散生成型ディープフェイクと非拡散型ディープフェイクの品質と,現在のディープフェイク検出システムに対する潜在的な脅威を評価する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:51:08 GMT)
Harnessing Generative AI for Economic Insights [1.3] 私たちはジェネレーティブAIを使用して、12万件のコーポレートカンファレンスの書面から、彼らの経済見通しに対する管理上の期待を抽出しています。
AIエコノミースコア(AI Economic Score)は、GDPの成長、生産、雇用などの将来の経済指標を強く予測する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:25:56 GMT)
Harnessing Generative AI for Economic Insights [1.3] 私たちはジェネレーティブAIを使用して、12万件のコーポレートカンファレンスの書面から、彼らの経済見通しに対する管理上の期待を抽出しています。
AIエコノミースコア(AI Economic Score)は、GDPの成長、生産、雇用などの将来の経済指標を強く予測する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:25:56 GMT)
Dimension-independent weak value estimation via controlled SWAP operations [1.2] 任意の観測値の弱値を推定するための次元非依存のスキームを提案する。
このスキームは制御されたSWAP演算に基づいており、弱い値の数学的表現における状態と観測変数を関連付ける。
これは、2つの同一の量子系の状態の1つの時点における状態と、2つの時点における1つの量子系の状態の2つの時点における状態の関係に関する洞察を与える。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 13:45:51 GMT)
Robust infrared small target detection using self-supervised and a contrario paradigms [1.2] 我々は、赤外線小ターゲット検出(IRSTD)を改善するために、コントラリオパラダイムと自己監視学習(SSL)を組み合わせた新しいアプローチを導入する。
一方、YOLO検出ヘッドへの対向基準の統合は、誤報を効果的に制御しつつ、小型で予期せぬ物体に対する特徴マップ応答を高める。
本研究は, YOLOを用いた小型物体検出に適用した場合, インスタンス識別手法がマスク画像モデリング手法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:08:57 GMT)
Boosting Few-Shot Detection with Large Language Models and Layout-to-Image Synthesis [1.2] 本稿では,最先端な生成的拡張アプローチを超越した,少数ショット検出のためのフレームワークを提案する。
我々は,新しいレイアウト対応CLIPスコアをサンプルランキングに導入し,生成したレイアウトと画像の密結合を可能にする。
アプローチでは,COCO5-,10-,30ショット設定でYOLOX-Sベースラインを140%以上,50%,35%のmAPで強化する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:57:45 GMT)
A Stability Principle for Learning under Non-Stationarity [1.2] 非定常環境における統計的学習のための多目的フレームワークを開発する。
解析の中心には、関数間の類似性の尺度と、非定常データ列を準定常断片に分割するセグメンテーション技法の2つの新しい要素がある。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:55:30 GMT)
Efficient representation learning of scintillation signal characteristics with spectrum-inspired temporal neural networks [1.1] シンチレータを用いた核放射線検出器は、粒子・高エネルギー物理実験、核医学イメージング、産業・環境検出等に広く利用されている。
本稿では,従来の時系列解析に基づくシンチレーション信号のキャラクタリゼーションに適したネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:44:53 GMT)
Ring-exchange physics in a chain of three-level ions [1.1] 3つの内部レベルを持つ捕捉イオンの連鎖は、ラング当たりの最大1ボソンの占有に制約されたはしごのような系を模倣するために利用できることを示す。
この設定は調整可能な環交換相互作用を可能にし、全てのボソンが片足に制限された偏極状態とDBL状態の間の遷移を引き起こす。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:07:11 GMT)
Learning Noise-Robust Stable Koopman Operator for Control with Hankel DMD [1.1] 非線形力学系のクープマン演算子に対するノイズロスト学習フレームワークを提案する。
我々は,Coopman演算子の安定なパラメータ化と,ロールアウト繰り返し損失の漸進的学習戦略を開発する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:33:23 GMT)
Hybrid Quantum-inspired Resnet and Densenet for Pattern Recognition [1.0] パターン認識のための残差と高密度接続を有する2つのハイブリッド量子インスピレーションニューラルネットワークを提案する。
一般化パワーに関する数値実験の集まりは、我々のハイブリッドモデルが純粋古典モデルと同じ一般化パワーを持っていることを示している。
ある研究によると、我々のハイブリッドモデルの認識精度は、残差や密接な接続のない量子ニューラルネットワークの認識精度よりも2%-3%高い。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 02:02:41 GMT)
Answering Questions in Stages: Prompt Chaining for Contract QA [1.0] 複数選択質問に対する構造化された回答を生成するための2段階のプロンプト連鎖を提案する。
我々は、この技術がうまく機能する状況と、さらなる改良が必要な領域を分析する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 17:14:13 GMT)
Experimental quantum triangle network nonlocality with an AlGaAs multiplexed entangled photon source [0.9] 入力のない量子非局所性は、任意のレベルの独立性を持つソースに対して証明可能であることを示す。
シミュレーショントライアングルネットワークを用いてベルのような不等式を初めて実験的に破る。
この結果から,ネットワーク非局所性に対する理解を深めると同時に,量子通信ネットワークの実践的妥当性を高めることができた。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:21:11 GMT)
TuringQ: Benchmarking AI Comprehension in Theory of Computation [0.9] 本稿では,計算理論における大規模言語モデル(LLM)の推論能力を評価するために設計された最初のベンチマークであるTuringQを紹介する。
チューリングQは4,006人の学部生と大学院レベルの質問応答ペアで構成され、難易度は4つの難易度に分類され、7つの中核的な理論領域をカバーする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:53:38 GMT)
Exploring Prompt Engineering: A Systematic Review with SWOT Analysis [0.7] 言語原理を強調し,その強み,弱さ,機会,脅威を識別する様々な手法を検討する。
我々の研究は、AIインタラクションの強化と人間のプロンプトの言語モデル理解の改善に関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 19:48:35 GMT)
Segmenting objects with Bayesian fusion of active contour models and convnet priors [0.7] 本稿では,自然資源モニタリング(NRM)画像を対象とした新しい事例分割手法を提案する。
我々は、個々の物体の輪郭を学習する際に、形状、位置、位置の先行を組み込むベイズ最大値後部推論として問題を定式化する。
実験では、個々の枯木樹冠と正確な輪郭を分割する、挑戦的で現実的な問題に取り組む。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:36:43 GMT)
Interesting Scientific Idea Generation Using Knowledge Graphs and LLMs: Evaluations with 100 Research Group Leaders [0.7] 我々は,5800万件の研究論文と大規模言語モデルを用いて研究アイデアを生成するSciMuseを紹介した。
我々は、100以上の研究グループのリーダーが興味に基づいて4,400以上のパーソナライズされたアイデアをランク付けする大規模な評価を行う。
このデータにより,(1)人間の評価に基づいて訓練された教師付きニューラルネットワーク,(2)大規模言語モデルを用いた教師なしゼロショットランキングを用いて,研究の関心を予測できる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 18:58:13 GMT)
Explicit gate construction of block-encoding for Hamiltonians needed for simulating partial differential equations [0.6] 本稿では,ハミルトニアンの重要なクラスに対するブロック符号化の明示的な構築のための効率的な量子プロトコルを提案する。
提案アルゴリズムは空間的サイズに対するスケーリングを示し,古典的有限差分法に対する指数的高速化を示唆する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 03:33:55 GMT)
Parametric PDE Control with Deep Reinforcement Learning and Differentiable L0-Sparse Polynomial Policies [0.6] パラメトリック偏微分方程式(PDE)の最適制御は、工学や科学における多くの応用において重要である。
深部強化学習(DRL)は高次元および複雑な制御問題を解く可能性がある。
本研究では、辞書学習とL$_0$正規化を利用して、PDEのスパース、ロバスト、解釈可能な制御ポリシーを学習する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 08:24:52 GMT)
On the role of coherence for quantum computational advantage [0.6] 量子計算における経路干渉のコヒーレントな経路干渉の尺度として経路コヒーレンスを導入する。
この結果は,古典計算機を用いた大規模量子計算のシミュレーションに応用できる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:06:07 GMT)
Transesophageal Echocardiography Generation using Anatomical Models [0.6] 合成TEE画像と対応するセマンティックラベルを生成するパイプラインを開発する。
In the pipeline's unpaired image-to-image (I2I) translation section, we explore two generative methods。
合成画像を用いてデータセットを拡大すると、ダイススコアが最大10%向上する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:20:28 GMT)
AUPIMO: Redefining Visual Anomaly Detection Benchmarks with High Speed and Low Tolerance [0.6] Per-IMage Overlap(PIMO)は、AUROCとAUPROの欠点に対処する新しいメトリクスである。
画像ごとのリコールの測定は、計算を単純化し、ノイズの多いアノテーションに対してより堅牢である。
実験の結果,PIMOは実用的優位性があり,性能の見識に乏しいことがわかった。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 12:58:55 GMT)
Field theory of monitored, interacting fermion dynamics with charge conservation [0.5] 我々は1次元における相互作用するフェルミオンの電荷保存モニタリングダイナミクスに焦点をあてる。
セルディシュ場理論を統一化することにより、よりダイナミックな位相と遷移が現れることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:00:01 GMT)
Collective variables of neural networks: empirical time evolution and scaling laws [0.5] 実験的なニューラル・タンジェント・カーネルのスペクトル、特にエントロピーとトレースのスペクトルに対する特定の測定により、ニューラルネットワークが学習した表現についての洞察が得られることを示す。
結果は、トランスフォーマー、オートエンコーダ、グラフニューラルネットワーク、強化学習研究など、より複雑なネットワークで示される前に、まずテストケースで実証される。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:37:14 GMT)
Metric-Based Few-Shot Learning for Exercise Repetition Counting with IMU Data [0.5] 本研究は、IMU信号の解析により、運動繰り返しを自動カウントする方法を開発した。
このようなモデルを開発する上で重要な課題は、さまざまなタイプのエクササイズにまたがるピークパターンのかなりのバリエーションを扱うことだ。
本稿では,深度測定に基づく数点学習手法を用いた反復カウント手法を提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:37:36 GMT)
Intelligent Repetition Counting for Unseen Exercises: A Few-Shot Learning Approach with Sensor Signals [0.5] 本研究は、IMU信号の解析により、運動繰り返しを自動カウントする方法を開発した。
本稿では,深度測定に基づく数点学習手法を用いた反復カウント手法を提案する。
86.8%の確率で、28回の異なるエクササイズで1セットに10回以上の繰り返しを正確に数えることが可能である。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:37:36 GMT)
BiC-MPPI: Goal-Pursuing, Sampling-Based Bidirectional Rollout Clustering Path Integral for Trajectory Optimization [0.5] Bidirectional Clustered MPPI (BiC-MPPI) は、新しい軌道最適化手法である。
BiC-MPPIには、双方向ダイナミクス近似と新しいガイドコスト機構が組み込まれている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:36:35 GMT)
Mitigation of gender bias in automatic facial non-verbal behaviors generation [0.5] 非言語的手がかりから話者の性別を識別できる分類器を導入する。
本稿では,従来の行動生成モデルにジェンダー判別器と勾配反転層を統合した新しいモデルFairGenderGenを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:41:24 GMT)
WorkflowHub: a registry for computational workflows [0.3] 分析記録と処理手順の記述の両方が再利用され、再利用され、利用可能であるべきである。
ワークフロー共有は、不要な再発明を減らし、再利用を促進し、非専門家のベストプラクティス分析へのアクセスを増やし、生産性を高める機会を提供する。
Hubは、コミュニティリポジトリにリンクするすべての計算レジストリに統一レジストリを提供する。
このレジストリは世界中に広がり、何百もの研究組織が関与し、700以上の登録がある。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:36:27 GMT)
Feedback-based Quantum Algorithm Inspired by Counterdiabatic Driving [0.3] 本稿では,量子リアプノフ制御と反断熱駆動プロトコルのアイデアを用いたプロトコルを提案する。
我々は,1次元量子イジングスピン鎖の基底状態の生成にアルゴリズムを適用した。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 18:44:04 GMT)
A Blockchain and Artificial Intelligence based System for Halal Food Traceability [0.3] ハラル食品の需要は世界中で急速に増加している。
ハラル食品の消費はムスリムだけでなく、ハラル食品の純度から非ムスリムにも及んでいる。
この課題は、製品がハラルであることの真偽について、ハラル食品消費者の間で疑念を巻き起こしている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:57:01 GMT)
Fast leave-one-cluster-out cross-validation using clustered Network Information Criterion (NICc) [0.3] クラスタベースのバリデーションを使用して、目に見えないクラスタ上でのモデルの一般化性を評価することが重要です。
本稿では,ネットワーク情報量基準(NICc)のクラスタ化推定手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 18:24:39 GMT)
Deep Learning for Surgical Instrument Recognition and Segmentation in Robotic-Assisted Surgeries: A Systematic Review [0.2] ロボットによる最小侵襲手術における手術器具のアノテートのための深層学習(DL)の適用は,手術技術の大幅な進歩を示している。
これらの高度なDLモデルは、手術器具の検出と分節の精度と効率を顕著に改善した。
外科教育におけるDLの応用は変革的である。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:07:38 GMT)
Exact analytic toolbox for quantum dynamics with tunable noise strength [0.2] 我々は、コヒーレントノイズを受ける量子力学の正確な解析処理を可能にする枠組みを導入する。
ハミルトンのアンサンブルを平均化すると、効果的な量子チャネルが生成される。
このアプローチの主な利点は、任意の$N$に対して正確な分析結果にアクセスできることと、ノイズフリー限界に調整できることである。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:00:01 GMT)
Detecting Bias and Enhancing Diagnostic Accuracy in Large Language Models for Healthcare [0.2] バイアスドAIによる医療アドバイスと誤診は患者の安全を脅かす可能性がある。
本研究では、医療における倫理的かつ正確なAIを促進するために設計された新しいリソースを紹介する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:00:05 GMT)
A Two-Model Approach for Humour Style Recognition [0.2] 異なるユーモアスタイルを認識することは、確立されたデータセットと機械学習(ML)モデルが欠如しているため、課題となる。
4つのスタイルにまたがる1463のインスタンスを含むユーモアスタイル認識のための新しいテキストデータセットを提案する。
ユーモアスタイルの認識を高めるための2モデルアプローチを提案し,特にアフィリエティブなスタイルとアグレッシブなスタイルを区別する手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 18:25:07 GMT)
Categorizing Social Media Screenshots for Identifying Author Misattribution [0.2] 本稿では、誤情報と偽情報の違いと、著者の誤帰をソーシャルメディアプラットフォームに広める際のスクリーンショットの使用方法について論じる。
スクリーンショットのオリジナルの投稿を見つけて、スクリーンショットが正しく属性付けられているかどうかを判断できることが重要です。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 01:06:00 GMT)
Predictability maximization and the origins of word order harmony [0.2] シーケンスの予測可能性を最大化するヘッドの配置を最適に検討する。
提案手法では,頭部の延期が予測可能性の最大化のための最適戦略であると同時に,依存者の予測可能性の最大化のための最適戦略であることを示す。
以上の結果から,実言語で採用した頭部の配置や,異なる種類の実験で出現した頭部の配置が明らかになった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:52:19 GMT)
Predictability maximization and the origins of word order harmony [0.2] シーケンスの予測可能性を最大化するヘッドの配置を最適に検討する。
提案手法では,頭部の延期が予測可能性の最大化のための最適戦略であると同時に,依存者の予測可能性の最大化のための最適戦略であることを示す。
以上の結果から,実言語で採用した頭部の配置や,異なる種類の実験で出現した頭部の配置が明らかになった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:52:19 GMT)
Long-lived oscillations of metastable states in neutral atom systems [0.1] 長距離リドバーグ相互作用を持つ1次元反強磁性中性原子鎖における準安定状態と基底状態の長寿命振動について検討した。
反強磁性中性原子系とは異なる準粒子振動の新しいスペクトルシグネチャを同定する。
提案装置の現在の中性原子プラットフォーム上での実験的アクセシビリティを評価する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:30:03 GMT)
False vacuum decay and nucleation dynamics in neutral atom systems [0.1] ライドバーグ相互作用を持つ1次元反強磁性中性原子鎖の核生成ダイナミクスについて検討した。
我々は,必要状態の準備と,短期中性原子量子シミュレータのクエンチを行うための実験的プロトコルを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:21:54 GMT)
Weak value advantage in overcoming noise on the primary system [0.1] We show that the weak value measurement protocol (WVMP) is shown that quadratically more robust to noise than strong measured。
我々は、振幅減衰ノイズチャネルに対して、WVMPは、強い測定プロトコルよりも二次的に有利であることを示すことで、これを反論する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:16:02 GMT)
Efficient and Robust Knowledge Distillation from A Stronger Teacher Based on Correlation Matching [0.1] 相関マッチング知識蒸留 (CMKD) 法は, ピアソンとスピアマンの相関係数に基づくKD損失を組み合わせ, より効率的で堅牢な蒸留を実現している。
CMKDはシンプルだが実用的であり、CIRAR-100とImageNetの最先端性能を継続的に達成できることを広範な実験で実証している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 05:42:47 GMT)
A Computational Harmonic Detection Algorithm to Detect Data Leakage through EM Emanation [0.1] EMエマニュエーション(EMエマニュエーション)として知られる電子機器からの意図しない電磁放射は、重大なセキュリティリスクを引き起こす。
防衛組織は通常、データ漏洩を防ぐために金属遮蔽を使用するが、このアプローチはコストが高く、広く使われるには実用的ではない。
本稿では,高調波検出装置の開発による高調波検出手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:40:15 GMT)
Systematic Feature Design for Cycle Life Prediction of Lithium-Ion Batteries During Formation [0.0] 生成データから抽出したフレームワークから設計した2つの簡単なQ(V)特徴は、サイクルライフサイクル予測の9.20%の誤差を達成した。
デザインされた機能の強いパフォーマンスは、その物理的起源に起因しています。
高度に解釈可能な特徴を設計することにより,我々は形成研究を加速することができる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 21:58:54 GMT)
Z-upscaling: Optical Flow Guided Frame Interpolation for Isotropic Reconstruction of 3D EM Volumes [0.0] 異方性3次元EMボリュームの軸方向分解能を高めて等方性3次元再構成を実現するための新しい光学フローベース手法を提案する。
画素レベルの運動は、zに沿って隣接する2次元スライス間で推定され、空間勾配流の推定を用いて補間し、新しい2次元スライスを生成し、等方的ボクセルを生成する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:34:39 GMT)
What can PhD students and postdocs do to counter inequalities? [0.0] これは、最近International Society for Optics and Photonics (spie.org) のウェブサイトで発表された意見書のより長いバージョンである。
アーリーステージ研究者がアカデミックで不平等に対して何をするかについて、いくつかの考察と実践的なヒントを集めました。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:25:05 GMT)
Very High-Resolution Bridge Deformation Monitoring Using UAV-based Photogrammetry [0.0] 本研究は, 構造型健康モニタリング(SHM)におけるUAVモニタリングの適合性に疑問を呈するものである。
調査強化コンクリート橋は、グラウンドアンカーを介して予め定義された荷重に曝すことができる。
非常に高解像度の画像ブロックは、制御された負荷の塗布前、中、および後に捕獲された。
表面データ取得の性能を評価するために,高密度画像点雲を計算した。
導入したUAVに基づくモニタリング手法を用いることで、古典的点数やプロファイル測定と対照的に、全領域にわたって変形の定量化が可能であることを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 08:17:03 GMT)
Variational approach to photonic quantum circuits via the parameter shift rule [0.0] ボソンサンプリングパラダイムに基づく再構成可能な光線形回路のパラメータシフト則の定式化を導出する。
また、変分パラメータ上の積分の計算についても同様の規則を提示する。
我々は、再構成可能な6モード統合干渉計で処理される単一光子状態の変分アルゴリズムを実験的に試験する手法を開発した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:06:17 GMT)
Using Rely/Guarantee to Pinpoint Assumptions underlying Security Protocols [0.0] Rely/guaranteeは環境からの干渉を抽象的に推論するメカニズムを提供する。
本稿では,Needham-Schroeder Public Keyプロトコルのこのアプローチについて検討する。
その結果,プロトコルが侵入者からの攻撃に耐えられるという仮定を効果的に解明できることが示唆された。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 09:32:31 GMT)
Universal scaling of quantum caustics in the dynamics of interacting particles [0.0] スピン鎖内の局所クエンチによって引き起こされるダイナミックスについて検討し,その結果として外向きに伝播する励起が異なった因果パターンを生成する。
本研究では,エアリー関数のカタストロフィに付随する2/3の万能指数を求めるために,因果的な服装を施した干渉縞の最初の2つの最大値のスケーリングを計算する。
この堅牢なスケーリングは、モデルの可積分性を損なう摂動の下でも持続する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:00:17 GMT)
Transport of magnetically sensitive atoms in a magnetic environment [0.0] この研究は、成層圏の磁場を直接原子自身を用いて測定できることを実証した。
このアプローチは転送効率を大幅に改善し、メインチャンバーから56cm離れた科学チャンバーに原子の1/3以上を移動させる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:44:53 GMT)
Trainability Barriers in Low-Depth QAOA Landscapes [0.0] QAOA(Quantum Alternating Operator Ansatz)は最適化問題を解くための変分量子アルゴリズムである。
以前の結果から、小さなパラメータの固定数の解析性能が保証された。
本研究は,近年の数値研究の焦点である中間体制における訓練の難しさについて考察する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:51:54 GMT)
Towards a benchmark for quantum computers based on an iterated post-selective protocol [0.0] 本稿では,量子コンピュータのテストとベンチマークを目的とした量子状態マッチングプロトコルを提案する。
測定値と1つの最終選択された量子ビットの理論的条件確率を比較することにより、ベンチマーク計量を定義する。
測定値の慎重な分析は、初期位相への依存が量子デバイスのコヒーレントゲートエラーに関する有用な情報を明らかにすることを示唆している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:54:09 GMT)
Toward hybrid quantum simulations with qubits and qumodes on trapped-ion platforms [0.0] トラップイオンプラットフォーム上での離散(量子)変数と連続(量子)変数を用いたハイブリッド量子コンピューティングの実現可能性について検討する。
既存のトラップイオン量子プラットフォームにおいて,高忠実度ハイブリッドゲートと測定操作が実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:01:15 GMT)
Thermomajorization Mpemba Effect: Unification and Universality [0.0] Mpemba効果(Mpemba effect)は、熱いシステムが温かいものよりも速く冷却する反直感的な物理現象である。
このレターでは、熱行列化理論に基づくムペンバ効果の厳密な定量化を導出する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:50:07 GMT)
The manifestations of 'l-Doubling' in gas-phase rotational dynamics [0.0] l-Doubling'現象は、分子の回転と多原子分子の垂直振動(曲げモード)の結合から生じる。
ここでは、三原子分子の周囲温度以上のコヒーレントな回転ダイナミクスに対する'l-Doubling'の影響を探索、明らかにする。
観測された'l-Doubling'のダイナミクスは、過去の数百ピコ秒間の衝突崩壊と見なされることがある。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:32:26 GMT)
The Moral Turing Test: Evaluating Human-LLM Alignment in Moral Decision-Making [0.0] 我々は、様々な道徳的シナリオに対して、人間とLLMが生成する反応の大規模なコーパスを作成しました。
我々は人間とLLMの道徳的評価の相違を見出した。
LLMも人間も道徳的に複雑な実用ジレンマを拒絶する傾向があったが、LSMは個人のフレーミングに敏感であった。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:52:00 GMT)
The Clear Sky Corridor: Insights Towards Aerosol Formation in Exoplanets Using An AI-based Survey of Exoplanet Atmospheres [0.0] 我々は人工知能を用いて、公開されているHST WFC3データセットの均一な伝送スペクトルを生成する。
280から2580ケルビンの温度を持つ43個の太陽系外惑星を調査し、熱い木星の1.4 mにおける水バンドの振幅と平衡温度の関係をモデル化した。
興味深いことに、惑星の質量対平衡温度図では、700から1700のケルビンの惑星がより強い1.4um H2O帯の測定値を示す「クラー・スカイ・コリドール」が示される。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:00:56 GMT)
Support Vector Boosting Machine (SVBM): Enhancing Classification Performance with AdaBoost and Residual Connections [0.0] 従来のブースティングアルゴリズムでは、誤分類されたトレーニングサンプルに焦点が当てられているのは、学習過程の難しさに基づいて、その重要性を強調している。
本稿では,SVMアルゴリズムと残差接続技術を組み合わせた新しいサブサンプリングプロセスであるSupport Vector Boosting Machine(SVBM)を提案する。
SVBMフレームワークは複雑な決定境界を形成する能力を高め、分類性能を向上させる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:55:19 GMT)
Steering Large Language Models using Conceptors: Improving Addition-Based Activation Engineering [0.0] 本稿では,事前学習したLLMの出力を,推論時にその活性化を操作することによって制御する,アクティベーションエンジニアリングについて検討する。
本稿では,活性化ベクトルの集合を楕円体領域として表現する数学的構成法を提案する。
本実験は,複数のコンテキスト内学習ステアリングタスクにおいて,概念的手法が従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:09:37 GMT)
Statistical Arbitrage in Rank Space [0.0] 本稿では, 名前空間上のランク空間における統計的仲裁の優れた性能を示し, 市場表現の頑健さと, ランク空間における残差平均回帰特性の強化を特徴とする。
我々は、名前空間とランク空間の両方におけるニューラルネットワークの統計的仲裁を探索し、ランク空間におけるニューラルネットワークによるポートフォリオが、名前空間においてかなり優れていることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:05:11 GMT)
Single-Particle Universality of the Many-Body Spectral Form Factor [0.0] 我々は、非相互作用ユニタリ回路と相関するオンサイトポテンシャルによって進化したフェルミオンの系を考える。
これらの電位が円ランダム行列アンサンブルの固有値分布から引き出されるとき、結果の回路アンサンブルのスペクトル形成係数(SFF)を数値サンプリングなしで正確に計算することができる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:00:00 GMT)
Sharp Bounds of the Causal Effect Under MNAR Confounding [0.0] 共同ファウンダーが無作為に欠席している場合、暴露対象の事実的結果の確率と暴露対象外との差について報告する。
我々は、欠落メカニズムが結果に依存しないことを仮定し、我々の境界が任意にシャープであること、すなわち、事実上達成可能か論理的に可能であることを証明する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:50:06 GMT)
Shap-Select: Lightweight Feature Selection Using SHAP Values and Regression [0.0] 本稿では,新しい特徴選択フレームワーク,shap-selectを提案する。
フレームワークは、特徴のShapley値、検証セットに基づいてターゲットの線形的あるいはロジスティックな回帰を行い、回帰係数の符号と重要度を用いて特徴選択の効率的な実装を行う。
筆者らは、Kaggleクレジットカード詐欺データセットのシェープ選択を評価し、確立された方法と比較して、その有効性を実証した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:14:06 GMT)
Secure Software/Hardware Hybrid In-Field Testing for System-on-Chip [0.0] Modern Systems-on-Chips (SoCs) は組み込みセルフテスト (BIST) モジュールをデバイスの知的財産権 (IP) ブロックに深く組み込んでいる。
BISTの結果は、テスト中のデバイスの内部構造と状態を明らかにし、そのため攻撃ベクトルを開放する可能性がある。
いわゆる結果のコンパクト化は、BISTチェーン構造を隠すことでこの脆弱性を克服できるが、エイリアス化や無効なシグネチャの問題を提起する。
上述した制限を克服する、低オーバーヘッドのソフトウェア/ハードウェアハイブリッドアプローチを導入します。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:01:46 GMT)
Secure Software/Hardware Hybrid In-Field Testing for System-on-Chip [0.0] Modern Systems-on-Chips (SoCs) は組み込みセルフテスト (BIST) モジュールをデバイスの知的財産権 (IP) ブロックに深く組み込んでいる。
BISTの結果は、テスト中のデバイスの内部構造と状態を明らかにし、そのため攻撃ベクトルを開放する可能性がある。
いわゆる結果のコンパクト化は、BISTチェーン構造を隠すことでこの脆弱性を克服できるが、エイリアス化や無効なシグネチャの問題を提起する。
上述した制限を克服する、低オーバーヘッドのソフトウェア/ハードウェアハイブリッドアプローチを導入します。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:01:46 GMT)
Robots in the Middle: Evaluating LLMs in Dispute Resolution [0.0] 大規模言語モデル(LLM)が紛争の会話を分析し、適切な介入タイプを選択し、適切な介入メッセージを生成することができるかどうかを検討する。
我々の結果は、オンライン紛争解決(ODR)プラットフォームにAIを統合する可能性を示している。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:51:10 GMT)
RoCP-GNN: Robust Conformal Prediction for Graph Neural Networks in Node-Classification [0.0] グラフニューラルネットワーク(GNN)は、グラフ構造化データの結果を予測する強力なツールとして登場した。
この問題に対処する一つの方法は、事前に定義された確率マージンを持つ真のラベルを含む予測セットを提供することである。
我々は,GNNに対するロバスト・コンフォーマル予測(RoCP-GNN)と呼ばれる新しい手法を提案する。
我々のアプローチはグラフベース半教師付き学習(SSL)の領域における予測の不確実性を定量化しながら、任意の予測的GNNモデルで結果を確実に予測する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:54:58 GMT)
Reviving QFT in $2+1$ de Sitter Spacetime [0.0] 2+1$ 次元静的アインシュタイン宇宙上の共形結合スカラー QFT を考える。
我々は、この理論が秘密裏に、2+1$ de Sitter 空間の QFT であると説明している。
理論がUVで切り離されるとき、基底次元はベーケンシュタイン・ホーキングの公式としてスケールする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:30:06 GMT)
Reproducing and Extending Experiments in Behavioral Strategy with Large Language Models [0.0] 我々は,大規模言語モデル(LLM)生成エージェントを用いた行動戦略における人間の実験室実験を再現する。
以上の結果から,LLMエージェントは,人間に匹敵する探索行動や意思決定を効果的に再現できることが示唆された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:26:20 GMT)
Recent advancements in LLM Red-Teaming: Techniques, Defenses, and Ethical Considerations [0.0] 大規模言語モデル(LLM)は自然言語処理タスクにおいて顕著な機能を示しているが、Jailbreak攻撃に対する脆弱性は重大なセキュリティリスクをもたらす。
本稿では,Large Language Model (LLM) のレッドチームにおける攻撃戦略と防御機構の最近の進歩を包括的に分析する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:35:38 GMT)
Quantum generalisation of Einstein's Equivalence Principle can be verified with entangled clocks as quantum reference frames [0.0] アインシュタイン等価原理(Einstein Equivalence Principle,EEP)は一般相対性理論の基礎をテストする上で重要である。
脳波に違反すると、物理学に劇的な結果がもたらされる。
ここでは、非局在量子粒子に対する一般化されたEEPを定式化する。
これは例えば原子干渉計で実験的に検証できる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:33:49 GMT)
Quantum entanglement assisted via Duffing nonlinearity [0.0] 光学系における量子エンタングルメントを向上する手法を提案する。
1つの共振器はダッフィング非線形性をサポートし、もう1つの共振器はサポートしない。
我々は光と他の機械共振器との絡み合いの増加を観察する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:10:48 GMT)
Quantum Frequency Combs with Path Identity for Quantum Remote Sensing [0.0] 光子は、リモートセンシングのための量子プローブとして明らかな選択である。
既存のスキームは主に量子照明フレームワークに基づいており、最初の絡み合ったペアの単一の光子を格納するために量子メモリを必要とする。
本稿では,これらの課題に対処する新しい量子センシングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:34:41 GMT)
Preliminary characterization of a surface electrode Paul trap for frequency metrology [0.0] 我々は表面電極(SE)トラップに基づく単一イオン光時計を開発している。
試作SEトラップを用いて加熱速度の測定を行った。
シリコンを用いたマイクロファブリックSEトラップチップを絶縁体技術に導入する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:44:30 GMT)
Predictability and Fairness in Load Aggregation with Deadband [0.0] 制御器の交流電流モデルとデッドバンドにおける損失の影響を考察する。
フィリポフ不変測度は予測可能性と公平性についての推論を可能にすることを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:17:32 GMT)
Phase Transitions in Quantum Many-Body Scars [0.0] 本稿では,高励起量子多体散乱状態において発生する量子多体系における相転移のタイプを提案する。
このようなスカー状態の相転移は、親ハミルトニアンの熱スペクトルにスカー状態として、相転移を経る行列積状態(英語版)を埋め込むことで実現できる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 17:48:14 GMT)
Phase Transition in the Quantum Capacity of Quantum Channels [0.0] 量子チャネルの容量を決定することは 量子情報理論の基本問題の一つです
任意の次元で全ての量子チャネル$Lambda$が、$Lambda_x(rho)=(1-x)Lambda(rho)+xtextTr(rho) fracId$の形でホワイトノイズによって汚染されると、$xgeq frac12$のときに量子状態を送信する能力が完全に失われることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:58:20 GMT)
Phase Diagram from Nonlinear Interaction between Superconducting Order and Density: Toward Data-Based Holographic Superconductor [0.0] 物理インフォームドニューラルネットワークを用いて、位相遷移の振る舞いを理解するために必要となる質量関数$M(F2)$を求める。
我々は,アルゴリズムの学習過程を改善するために位置埋め込み層を導入し,Adam最適化を用いてホログラフィック計算による臨界温度データを精度良く予測する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 03:52:18 GMT)
Personal Intelligence System UniLM: Hybrid On-Device Small Language Model and Server-Based Large Language Model for Malay Nusantara [0.0] 本稿では,デバイス上のモデルとサーバベースのモデルの両方を効率的に統合するパーソナリティ・インテリジェンス・システムを提案する。
このシステムはSLiM-34Mをオンデバイス処理に、メモリと電力使用量に最適化し、MANYAK-1.3Bをサーバベースのタスクに組み込んでおり、スケーラブルで高性能な言語処理を可能にしている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:11:13 GMT)
Optimization of the sensitivity of a temperature sensor based on germanium-vacancy color center (GeV) in diamond [0.0] ダイヤモンドのGeV色中心に基づく温度センサーは、科学や産業で多くの注目を集めている。
元々のセンサ設計は、ゼロフォノン線のスペクトル特性の測定に基づいていた。
この手法の修正は、GeV放出を二色鏡で分割し、2つの信号の比から温度を決定することを利用して提案されている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:53:44 GMT)
Online Epsilon Net and Piercing Set for Geometric Concepts [0.0] 有界VC次元を持つ幾何学的概念に対するオンライン$varepsilon$-net問題について検討する。
区間の最適競合比を$mathbbRd$で表した最初の決定論的オンラインアルゴリズムを提案する。
我々はまた、$mathbbRd$の定数記述複雑性の類似サイズのオブジェクトを解析するための新しい手法も導入する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:58:36 GMT)
One-dimensional photonic wire as a single-photon source: Implications of cavity QED to a phonon bath of reduced dimensionality [0.0] 本研究では、均質円筒ナノワイヤの1次元系に置かれた量子ドットに対するフォノン誘起デコヒーレンスについて検討する。
ポーラロン法では, 1D純脱落速度の解析式が導出され, バルクに比べて純脱落速度が低下する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:40:21 GMT)
On The Relationship between Visual Anomaly-free and Anomalous Representations [0.0] 異常検出はコンピュータビジョンにおいて重要な問題であり、様々な現実の応用がある。
本稿では,本研究の要旨として,正規サンプルの異常のない視覚パターンの空間が,クラス固有の異常サンプルの様々な異常パターンの空間とよく相関していることを示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:18:53 GMT)
Observational constraints on quantum decoherence during inflation [0.0] パワースペクトルを変化させることなくデコヒーレンスが発生することを示す。
これはデコヒーレンスが理論的に重要であるだけでなく、天体物理学的な観測にも重要であることを示している。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:57:38 GMT)
Muzzle-Based Cattle Identification System Using Artificial Intelligence (AI) [0.0] 牛の銃口の独特さは科学的に確立されており、人間の指紋に似ている。
これは、牛の銃口の特異性を抽出する牛の識別システムを開発するきっかけとなった前提です。
我々のシステムは、9,6.489%$、9,7.334%$のF_1$スコアと8,7.993%$の真の正率(tpr)を驚くほど低い偽陽性率(fpr)の0.098%$の精度で実行する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:17:12 GMT)
Mixing of the No-U-Turn Sampler and the Geometry of Gaussian Concentration [0.0] No-U-Turn Smpler (NUTS) の混合時間は$d1/4$で、対数因子までは$d$である。
具体的には、測定値の濃度は、高い確率で保たれるNUTSの局所適応遷移において顕著な均一性をもたらす。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:17:01 GMT)
Manipulation of the NV center nuclear spin using invisible transition [0.0] コヒーレント集団トラップによる核スピンのコヒーレント操作は、同位体的に純粋なダイヤモンドでうまく実証されている。
この発見は、自然発生の炭素13を持つダイヤモンドプレートにおいても、コヒーレント核スピン制御が実現可能であることを確認する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:13:13 GMT)
LightDE: A Lightweight Method for Eliminating Dangling Pointers [0.0] UAF(Use-After-Free)脆弱性は、ソフトウェアセキュリティに深刻な脅威をもたらす。
ダングリングポインタを排除してUAFの脆弱性を防御する既存の方法は、プログラムの実行を中断する必要がある。
この欠点を克服するために、LightDEと呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 13:51:07 GMT)
Learning parameter dependence for Fourier-based option pricing with tensor trains [0.0] そこで我々は,FTベースのオプション価格で現れる関数に近似したテンソルトレインを構築する,テンソルトレイン学習アルゴリズムを提案する。
ベンチマークテストとして,様々な揮発性の値と現在の資産価格に対するマルチアセットオプションの価格設定を行う。
提案手法は,最大11の資産を含むテストケースにおいて,モンテカルロをベースとしたオプション価格を105ドルおよび106ドルのパスで上回る性能を示した。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:28:00 GMT)
LLaMP: Large Language Model Made Powerful for High-fidelity Materials Knowledge Retrieval and Distillation [0.0] 大規模言語モデル(LLM)は本質的に長期記憶を欠いているため、ドメイン固有の文献やデータに基づいてそれらを微調整する非自明でアドホックで必然的にバイアスのあるタスクである。
本稿では、階層的推論・実行(RAG)エージェントのフレームワークであるLLaMPを紹介し、計算および実験データと相互作用できる。
微調整なしでは、LLaMPは材料科学の概念の様々なモダリティを理解し統合する強力なツール利用能力を示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 20:13:51 GMT)
LISBET: a machine learning model for the automatic segmentation of social behavior motifs [0.0] LISBET(LISBET Is a Social BEhavior Transformer)は,社会的相互作用の検出とセグメンテーションのための機械学習モデルである。
身体追跡データを用いた自己教師型学習により,広範囲な人的アノテーションの必要性を排除した。
生体内電気生理学的には,本モデルで同定されたモチーフに対応する腹側歯根膜領域の神経信号が明瞭であった。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:08:29 GMT)
Kramers-Wannier self-duality and non-invertible translation symmetry in quantum chains: a wave-function perspective [0.0] 臨界量子鎖のKramers-Wannier自己双対性について、モデル波動関数の観点から検討する。
逆場イジング鎖と3$状態ポッツ鎖を例に、クラマース=ワニエ自己双対の対称性作用素が単純かつ直接的な方法で従うことを実証する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:50:57 GMT)
Knowledge Gradient for Multi-Objective Bayesian Optimization with Decoupled Evaluations [0.0] いくつかのケースでは、目的を個別に評価することができ、異なるレイテンシや評価コストをそれぞれの目標に関連付けることができる。
目的の異なる評価コストを考慮に入れたスカラー化に基づく知識獲得機能を提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 08:50:08 GMT)
K-SAM: A Prompting Method Using Pretrained U-Net to Improve Zero Shot Performance of SAM on Lung Segmentation in CXR Images [0.0] 肺領域分割作業におけるSAMのゼロショット性能を自動的プロンプト選択により向上させるアルゴリズムを提案する。
提案手法は,事前学習したモデルを用いて迅速な選択を行うことで,SAMの印象的な一般化能力を最大限に活用できることを示唆する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:37:12 GMT)
Integrability is generic in homogeneous U(1)-invariant nearest-neighbor qubit circuits [0.0] 可積分性(Integability)は、微調整されたパラメータを持つシステムに対してのみ成り立つと信じられている例外的な性質である。
U(1)対称性を持つ同次近傍量子ビット回路において、可積分性は一般的であることを示す。
保存法則,輸送特性,強ゼロエッジモードの異なる2つの相を同定する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 10:46:09 GMT)
Independent projections of diffusions: Gradient flows for variational inference and optimal mean field approximations [0.0] 本稿では,2つの自然条件に対して最適である,独立射影(emphindependent projection)という構成を提案する。
まず、元の拡散が不変測度$rho_*$で可逆であるとき、独立射影は積測度空間に制約された相対エントロピー$H(cdot,|,rho_*)$に対するワッサーシュタイン勾配フローとして機能する。
第2に、独立な座標を持つ全てのプロセスの中で、独立射影は、元の拡散に対する経路空間エントロピーの最も遅い成長速度を示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 15:12:02 GMT)
InAttention: Linear Context Scaling for Transformers [0.0] 我々は、自己アテンションをInAttentionに置き換え、デコーダのみのトランスフォーマーを変更する。
ベンチマークによると、InAttentionは推論時のVRAM使用量を著しく削減する。
InAttentionは、トランスフォーマーモデルにおける長距離依存に対するスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:05:15 GMT)
In-situ tunable interaction with an invertible sign between a fluxonium and a post cavity [0.0] 非線形性は、アシラリー2レベル量子ビットを介してキャビティモードに導入される。
アンシラの急激な加熱は、完全なフォールトトレラントなボソニッククビットへの進行を妨げている。
本研究は, 読み出し共振器を介してフラクソニウムアンシラに結合した3次元後空洞を含む, 量子情報処理のための新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:46:06 GMT)
Improving the portability of predicting students performance models by using ontologies [0.0] 教育データマイニングと学習分析の主な課題の1つは、予測モデルの移植性である。
そこで,本研究では,学生がMoodle学習管理システムと相互作用する行動の分類を用いたオントロジーの利用を提案する。
その結果,提案するオントロジーを用いることで,予測精度の観点からモデルのポータビリティが向上することが示唆された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:18:54 GMT)
Hyperbolic Machine Learning Moment Closures for the BGK Equations [0.0] 本稿では,BGKのモーメントデータに基づいてトレーニングされたニューラルネットワーク(NN)を用いて,Bhatnagar-Gross-Krookの運動モデルのグラッドモーメント展開のための双曲的クロージャを導入する。
この閉鎖は、Huang2022-RTE1輸送路における閉鎖に関する論文で得られた自由ストリーミング制限の正確な閉鎖によって動機づけられる。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 18:41:33 GMT)
Honesty to Subterfuge: In-Context Reinforcement Learning Can Make Honest Models Reward Hack [0.0] 我々は,学習したフロンティアモデルが,タスクのカリキュラムのトレーニングを伴わずに,有益で無害で誠実に,仕様ゲームに携わることができることを示した。
また, ICRL を用いて, 専門家の反復に高度に回帰した出力を生成することにより, 仕様ゲーミングポリシーを学習するためのモデルの妥当性が向上する可能性が示唆された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:34:27 GMT)
Hallucinating AI Hijacking Attack: Large Language Models and Malicious Code Recommenders [0.0] 研究者は、人気のあるコードリポジトリで悪意のあるコードに対して、コピーコードや幻覚されたAIレコメンデーションを導入するための敵の可能性を構築し、評価する。
OpenAI, Google, Anthropicの基本的な大規模言語モデル(LLM)は、有害な振る舞いと有害な文字列の両方に対して保護する。
我々は、この攻撃を、以前の文脈シフトに関する研究と比較し、マルウェア文学における「土地から逃れる」攻撃の新たなバージョンとして攻撃面を対比した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 01:36:25 GMT)
Geometric Floquet theory [0.0] 量子幾何学からフロケ理論を導出する。
進化への幾何学的貢献は本質的に非平衡効果であることを示す。
この研究は、非平衡物理学の一見無関係な領域を直接ブリッジする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:12:15 GMT)
Generative Model for Less-Resourced Language with 1 billion parameters [0.0] GaMS 1B - 10億のパラメータを持つスロベニアの生成モデル。
我々はスロベニア語、クロアチア語、英語に適応した新しいトークンライザを開発した。
我々は,Slovene ベンチマークスイートと生成文単純化タスク SENTA から,いくつかの分類データセットを用いてモデルを評価した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:59:34 GMT)
Gate-based counterdiabatic driving with complexity guarantees [0.0] 反断熱駆動のための一般完全ゲート型量子アルゴリズムを提案する。
このアルゴリズムは従来の変分法のように二次性に依存しず、アディバティックゲージポテンシャルの正規化を利用して、関心の固有状態からの遷移のみを抑制する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:15:39 GMT)
Foundation of statistical mechanics under even more experimentally realistic conditions [0.0] 有限時間摂動下であっても、多くの重要なエネルギー準位を投入すれば、系は平衡する。
この結果は、孤立量子系における熱化を理解するための、より広く、より現実的な枠組みを提供する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:55:50 GMT)
Floquet engineering of quantum thermal machines: A gradient-based spectral method to optimize their performance [0.0] 量子サーマルエンジン (QTM) の最適条件を求める手法について述べ, 実演した。
QTMは、開量子系の周期的に駆動される非平衡定常状態としてモデル化される。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:34:46 GMT)
Fermi's golden rule rate expression for transitions due to nonadiabatic derivative couplings in the adiabatic basis [0.0] 我々は, 断熱状態間の非断熱遷移に対するフェルミの黄金律 (FGR) 式の解析を行った。
結果の速度表現は、NDC項の二次的寄与とフランク・コンドンモードへの結合を含む。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:18:13 GMT)
Federated learning with distributed fixed design quantum chips and quantum channels [0.0] 古典的なフェデレーション学習におけるプライバシは、局所的な勾配結果と、クライアントにエンジニアリングされたクエリを組み合わせることで破ることができる。
本稿では,集中型サーバから送信される量子状態に基づいて,固定設計量子チップを動作させる量子フェデレート学習モデルを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 10:19:49 GMT)
Faithfulness and the Notion of Adversarial Sensitivity in NLP Explanations [0.0] 本稿では, 信頼度評価の新しいアプローチとして, 適応感について紹介する。
本手法は, 逆入力変化に対する感度を捉えることによって, 説明者の忠実さを考慮に入れている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 11:59:34 GMT)
Extreme events and power-law distributions from nonlinear quantum dissipation [0.0] 非線形散逸を伴う量子力学系の原型系を導入する。
エネルギーの定常状態確率分布におけるパワーローテールの出現を解析的に証明する。
この現象は、光-物質相互作用とセンシングの新しい応用のための極端光子源の開発に利用することができる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 06:43:16 GMT)
Extending the planar theory of anyons to quantum wire networks [0.0] 一般的なワイヤネットワークのためのグラフブリードド・エニオン融合モデルを構築した。
特に、三連結ネットワークは、平面エニオンモデルと同じブレイディング交換演算子を生成することを証明している。
我々は、グラフブレイドされた任意の核融合モデルが(一般化された)コヒーレンス特性を持つことを予想する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:38:21 GMT)
Exploring the Readiness of Prominent Small Language Models for the Democratization of Financial Literacy [0.0] 小型言語モデル(SLM)は、異なる社会経済的地位と異なるプライバシーの好みを持つ個人のための言語モデルへのアクセスを民主化する可能性を持っている。
本研究は、金融分野における金融リテラシーの育成を支援するために、いくつかの最先端のSLMを評価した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:48:40 GMT)
Experimental single-copy distillation of quantumness from higher-dimensional entanglement [0.0] 絡み合いは量子理論の中心であり、様々な量子励起技術に責任を負う。
この要件を満たすために、単一コピーの局所フィルタリング操作をどう使うかを実験的に示す。
結果は、絡み合った状態のベル非局所性に関する最初の実証実験的な証明を提供する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:04:55 GMT)
Evaluating Model Performance with Hard-Swish Activation Function Adjustments [0.0] 本研究では,ReLU,Swish,Hard-Swishのアクティベーション機能を用いた画像データセット間のモデルの性能評価を行った。
CIFAR-10データセットの精度は2.06%向上し,ATLASデータセットの精度は0.30%向上した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:43:34 GMT)
Entanglement enhancement induced by noise in inhomogeneously monitored systems [0.0] 非均一に観測された量子系における強いノイズが絡み合いをいかに高めるかを研究する。
以上の結果から, 典型的には騒音に起因する有害な影響とは対照的に, アシラの騒音はシステム内の絡み合いを著しく高めることが示唆された。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:35:06 GMT)
Enhancing the Harrow-Hassidim-Lloyd (HHL) algorithm in systems with large condition numbers [0.0] 我々はPsi-HHLが$mathcalkappa$行列を含む状況に対処できることを実証する。
行列は最大で256倍256$で、mathcalkappa$は約466である。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:46:09 GMT)
Enhancing the Harrow-Hassidim-Lloyd (HHL) algorithm in systems with large condition numbers [0.0] 我々はPsi-HHLが$mathcalkappa$行列を含む状況に対処できることを実証する。
行列は最大で256倍256$で、mathcalkappa$は約466である。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 04:46:09 GMT)
Enhancing Vision-Language Model Pre-training with Image-text Pair Pruning Based on Word Frequency [0.0] 本稿では,新しいデータプルーニング手法であるWFPPを提案する。
WFPPはトレーニングデータセット全体にわたって、高周波ワードを含むテキストイメージペアをプルーフする。
実験により,CLIPモデルのトレーニングにおけるWFPPの適用により,幅広い下流タスクのパフォーマンスが向上することが示された。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:54:41 GMT)
Enhancing Soccer Camera Calibration Through Keypoint Exploitation [0.0] 本稿では,高品質な点対を得るという課題に対処する多段階パイプラインを提案する。
本手法は,直線交点や直線-円錐交点,円錐上の点,その他の幾何学的特徴を活用することにより,校正に利用できる点の数を大幅に増加させる。
我々は,サッカー放送カメラのキャリブレーション・データセットの最大化について検討し,サッカーネットカメラチャレンジ2023でトップの地位を確保した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:01:14 GMT)
Enhanced Fault-tolerance in Photonic Quantum Computing: Floquet Code Outperforms Surface Code in Tailored Architecture [0.0] 本稿では,2つの量子誤り訂正符号,表面符号とハニカムフロッケ符号の比較検討を行う。
ミツバチFloquetコード実装の光子損失閾値は6.4%である。
これは、大規模な多重化のないフォトニックプラットフォームにとって、これまでで最も高い報告である。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:08:41 GMT)
Efficient excitation transfer in an LH2-inspired nanoscale stacked ring geometry [0.0] サブ波長のリング状の量子エミッタ構造は優れた放射特性を示し、アンテナ、励起輸送、貯蔵に有用である。
2レベル原子で形成された3次元(3次元)サブ波長の同心重心リング構造における高効率な励起伝達を予測した。
本研究は, バイオミメティックな光物質プラットフォームやエミッタアレイを応用して, 効率的なエネルギー移動を実現するための展望を明らかにした。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:42:08 GMT)
Efficient excitation transfer in an LH2-inspired nanoscale stacked ring geometry [0.0] サブ波長のリング状の量子エミッタ構造は、優れた放射特性を示す。
3次元(3D)準同心積層環の直径400$nm$の高効率励起転移を2層原子で予測した。
本研究は, バイオミメティックな光物質プラットフォームやエミッタアレイを応用して, 効率的なエネルギー移動を実現するための展望を明らかにした。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 13:42:08 GMT)
Effects of dissipation in reservoir computing using a spin qubit array [0.0] 貯留層コンピューティング(Reservoir Computing, RC)は、多くの物理機器の応用として最も熱い研究トピックの一つである。
1次元の量子ビットアレイからなる実験においてスピン量子ビットの状態を反映したスピン量子ビット系に基づく量子RCを提案する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 23:23:50 GMT)
Effects of DM and KSEA interactions on entanglement, Fisher and Wigner-Yanase information correlations of two XYZ-Heisenberg-qubit states under a magnetic field [0.0] 我々は、2つのXYZ-ハイゼンベルク量子ビット状態間の熱的絡み合いを特徴付けるために、絡み合いの負性、局所量子不確実性(LQU)、局所量子フィッシャー情報(LQFI)を用いる。
比較試験では、これらの相関指標に類似した挙動が示される。
LQFIは負性やLQUよりも強い堅牢性を示し、ある時点では凍結現象を示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:19:54 GMT)
Effects of Chromatic Dispersion on Single-Photon Temporal Wave Functions in Quantum Communications [0.0] 量子通信における色分散が単一光子時間波関数(TWF)に与える影響について検討する。
我々は,色分散効果を緩和する際のチャープパラメータの影響を実証し,チャープおよびチャープされたガウスTWFを紹介する。
量子ビット干渉パターンに対する分散効果の相互作用を探索することにより、量子情報処理に重要な洞察を与える。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 09:23:57 GMT)
DisasterQA: A Benchmark for Assessing the performance of LLMs in Disaster Response [0.0] 災害対応知識におけるLarge Language Models (LLM) の機能を評価する。
ベンチマークでは、幅広い災害対応トピックをカバーしている。
その結果, LLM には災害対応知識の改善が必要であることが示唆された。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 00:13:06 GMT)
Direct measurement of the lifetime and coherence time of Cu2O Rydberg excitons [0.0] リドベルクは励起子について、固体系において巨大な非線形性を工学するために量子オブジェクトを約束していると述べている。
酸化銅中の励起子の2光子吸収が様々なリドベルク状態と共鳴する実験結果について報告する。
我々は長寿命コヒーレント振動の存在を含むいくつかの興味深いダイナミクスを観察する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 18:11:10 GMT)
Direct measurement of darkness using a standard single-photon avalanche photodiode [0.0] 人間の視覚実験に適した専用暗室における暗黒を直接測定する実験と詳細な統計分析を報告する。
サベージ・ディッキー比と光度0.039$ cnt/sに基づいて絶対暗黒を決定的に証明する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 08:52:37 GMT)
Dirac Brackets $\leftrightarrow$ Lindblad Equation: A Correspondence [0.0] ゴリニ-コサコフスキー-スダルシャン-リンドラー方程式によって支配される開量子系の時間発展を研究する。
同様に、古典的に制約された力学系における物理可観測体の時間発展は、リウヴィル方程式の一般化によって制御される。
我々は、リンドブラッド作用素を制約に接続する上記の状況の間の興味深いが正確な古典量子対応を導出する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:24:46 GMT)
Diffusion Density Estimators [0.0] 本稿では,フローを解くことなくログ密度を計算できる新しい並列化手法を提案する。
我々のアプローチは、モンテカルロによる経路積分を、拡散モデルのシミュレーション不要な訓練と同一の方法で推定することに基づいている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:21:53 GMT)
Diagnosis of Malignant Lymphoma Cancer Using Hybrid Optimized Techniques Based on Dense Neural Networks [0.0] 本研究では,特徴抽出のためのDenseNet201と分類のためのニューラルネットワーク(DNN)を組み合わせた新しいハイブリッドディープラーニングフレームワークを提案する。
提案手法は99.33%の精度を達成し,精度とモデル解釈性の両方を著しく改善した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 15:12:35 GMT)
Device-independent dimension leakage null test on qubits at low operational cost [0.0] 我々は、デバイス独立であり、少数の異なる実験を必要とするキュービットの2レベル空間のヌルテストを構築する。
ほとんどの量子ビットは10以上の標準偏差でテストに失敗する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 11:37:19 GMT)
Detecting Multipartite Entanglement Patterns using Single Particle Green's Functions [0.0] 単一粒子グリーン関数を用いた多体電子システムにおける多粒子絡み検出プロトコルを提案する。
まず,量子フィッシャー情報(QFI)と単一粒子グリーン関数との接続を目撃者の集合を構成することにより確立する。
検出された絡み合いレベルは、目撃者の演算子に付随する波動ベクトルに敏感である。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 18:06:08 GMT)
Demonstration of dual Shapiro steps in small Josephson junctions [0.0] 量子化された電流ステップ、いわゆる双対シャピロステップは、ブロッホ振動を外部マイクロ波信号に同期させるときに生成される。
我々は,小さなAl/AlO$_mathrmx$/Al Josephson接合におけるブロッホ振動を正弦波駆動に同期させることにより,この基本的関係を実現する。
今日の電圧標準に触発されて、ジョセフソン振動の単一磁束量子モードと双対となるパルス駆動状態を調べ、二重シャピロステップの同様の非対称パターンを観察する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:26:19 GMT)
Crystallinity in Niobium oxides: A pathway to mitigate Two-Level System Defects in Niobium 3D Resonator for quantum applications [0.0] 2レベル系(TLS)欠陥は超伝導量子回路におけるデコヒーレンスの主要な原因である。
650degCでの10時間高真空加熱処理により3次元超伝導ニオブ共振器の2レベル系損失の低減を実証した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:02:32 GMT)
Context-Augmented Code Generation Using Programming Knowledge Graphs [0.0] 大きな言語モデル(LLM)とコード-LLM(CLLM)は、困難で複雑な問題に対処する際にしばしば困難に直面します。
本稿では,プログラミング知識グラフ(PKG)を利用して,コードの意味的表現と検索を行う新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 16:35:41 GMT)
Composite Learning Units: Generalized Learning Beyond Parameter Updates to Transform LLMs into Adaptive Reasoners [0.0] 連続学習が可能な学習者へ推論器を変換する複合学習ユニット(CLU)を導入する。
CLUは、動的知識リポジトリの保守と進化を可能にするアーキテクチャ上に構築されている。
我々は暗号推論タスクを通じてCLUの有効性を実証し、フィードバックを通じて理解を継続的に進化させ、隠れた変換規則を明らかにする。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:27:58 GMT)
Complexity Assessment of Analog and Digital Security Primitives Signals Using the Disentropy of Autocorrelation [0.0] 本研究は,Pseudo-Random Number Generators (PRNG) などのセキュリティプリミティブに焦点を当てる。
このようなプリミティブは、アプリケーションに対する十分なセキュリティを保証するために、レスポンスにおいて高いレベルの複雑さやエントロピーを持つ必要があります。
自己相関の非エントロピーは、ApEnやFuzEnよりも優れたコントラストを持つアナログドメインとバイナリドメインにおいて、よく知られたPRNGと最適化されていないPRNGとを区別できることを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:12:18 GMT)
Comment on "Unified framework for open quantum dynamics with memory" [0.0] 最近の論文では、一般化量子マスター方程式(GQME)と調和浴に結合した系の経路積分の関係を見いだしている。
このコメントでこれらの3つの批判について詳しく述べる。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:15:52 GMT)
Closed-form expressions for smeared bi-distributions of a massless scalar field: non-perturbative and asymptotic results in relativistic quantum information [0.0] 時空領域の量子場と相互作用する局所量子系について検討する。
ガウス時空領域で相互作用するプローブによって得られる絡み合いを見つける。
2つの隙間のない検出器の場合を再検討し、相互作用領域間に2つのスミアドウェイ信号が存在する場合、検出器が絡み合うことができることを示す。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 19:53:14 GMT)
Bootstrapping the stationary state of bosonic open quantum systems [0.0] ボソニック開量子系の定常状態における可観測物の期待値を計算する。
境界は厳密で、定常状態の退化に対して頑健であり、我々の検討した例では、占有数が増加するにつれて数値的に改善される。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 19:04:22 GMT)
Bahasa Harmony: A Comprehensive Dataset for Bahasa Text-to-Speech Synthesis with Discrete Codec Modeling of EnGen-TTS [0.0] 本研究では,包括的バハサテキスト音声データセットと,新しいTSモデルであるEnGen-TTSを紹介する。
提案したEnGen-TTSモデルは、確立されたベースラインよりも優れており、平均オピニオンスコア(MOS)は4.45$pm$ 0.13である。
この研究はバハサ TTS 技術の進歩であり、多様な言語応用に影響を及ぼす。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 07:01:05 GMT)
Autonomous Navigation and Collision Avoidance for Mobile Robots: Classification and Review [0.0] 本稿では,自律移動ロボット(AMR)の新しい分類法を提案する。
自律的な衝突のない航法に焦点をあて、提案した分類の各段階において、主要な手法と広く受け入れられた技術を示す。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 16:56:42 GMT)
Analysis of different disparity estimation techniques on aerial stereo image datasets [0.0] 本研究は,異なる手法を用いて空中画像の立体対応解析を行う。
従来の手法では,異なるコスト関数を用いてStereo SGBMのアーキテクチャを実装した。
標準データセットにおけるほとんどの手法の分析は優れた性能を示しているが、空中データセットの場合、ベンチマークはそれほど多くはない。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 09:33:48 GMT)
An Improved Approach for Cardiac MRI Segmentation based on 3D UNet Combined with Papillary Muscle Exclusion [0.0] 異なるフェーズにおいて、心臓構造を正確にセグメンテーションするための堅牢なアルゴリズムを開発することが重要である。
本研究では,乳頭筋を除いた心筋とLVのセグメンテーションに改良された3次元UNetモデルを導入する。
提案フレームワークの実用試験では, 合計8,400枚の心MRI画像を収集し, 解析した。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 12:19:58 GMT)
All-fiber microendoscopic polarization sensing at single-photon level aided by deep-learning [0.0] 単一光子レベルまで精度の高いリアルタイム偏光測定法を提案する。
生体試料および液晶ポリマー試料の分極構造を可視化し, 本手法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:25:58 GMT)
A two-boson lattice Hamiltonian with interactions up to next-neighboring sites [0.0] 接続されたコンポーネントへの$(gamma,lambda,mu)$-スペースのパーティションを確立する。
各連結成分に対して、2ボソンシュル「オーディンガー作用素の孤立固有値の個数に鋭い下界が成立する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 17:15:21 GMT)
A problem with the conservation law observed in macroscopic quantum phenomena is a consequence of violation of the correspondence principle [0.0] マイスナー効果やその他のマクロ量子現象は熱力学の第二法則と矛盾する。
物理学者が熱力学の第二法則に違反していることを認めることは、超伝導現象の誤った理解を引き起こした。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 14:47:54 GMT)
A covariance representation and an elementary proof of the Gaussian concentration inequality [0.0] 特徴関数に基づく共分散表現を用いて、ガウス濃度の不等式に関する既知の初等証明を示す。
他にもいくつかのアプリケーションが紹介されている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 14:30:55 GMT)
A Data-to-Product Multimodal Conceptual Framework to Achieve Automated Software Evolution for Context-rich Intelligent Applications [0.0] 本研究では,ソフトウェアの自動進化を実現するための概念的枠組みを提案する。
概念的枠組みに基づいて選択的シーケンススコープモデル(3S)モデルを開発する。
この研究はインテリジェントなアプリケーションに関するものだが、フレームワークと分析方法は、AIが彼らのライフサイクルにより多くのインテリジェンスをもたらすため、他のタイプのソフトウェアに適用される可能性がある。
論文参考訳(メタデータ) (Wed, 09 Oct 2024 04:49:27 GMT)
3D2M Dataset: A 3-Dimension diverse Mesh Dataset [0.0] 本稿では,多様な顔構造とそれに対応する顔のランドマークを特徴とする3Dメッシュの包括的データセットを提案する。
データセットは、女性候補者73名、男性候補者114名を含む188個の3D顔メッシュで構成されている。
民族的背景を広く表現しており、45の異なる民族からの貢献により、顔の特徴の豊富な多様性が保証されている。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 20:29:16 GMT)
3D Representation Methods: A Survey [0.0] 3D表現は、様々なアプリケーションにおける高忠実度3Dモデルの需要の増加によって、大きな進歩を遂げてきた。
本稿では,3次元表現法の開発と現状を概観し,研究の軌跡,革新,強度,弱さを概観する。
論文参考訳(メタデータ) (Wed, 9 Oct 2024 02:01:05 GMT)