Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone [264.1] 我々は3.3兆のトークンでトレーニングされた38億のパラメータ言語モデルであるphi-3-miniを紹介する。
MMLUでは69%、MTベンチでは8.38である。
また、画像とテキストのプロンプトに強い推論能力を持つphi-3-miniに基づく420億のパラメータモデルであるphi-3-visionを導入する。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:42:40 GMT)
Rho-1: Not All Tokens Are What You Need [132.3] 以前の言語モデル事前学習手法は、すべてのトレーニングトークンに次トーケン予測損失を均一に適用した。
最初の分析では,異なるトークンの損失パターンを明らかにするために,言語モデルのトークンレベルのトレーニングダイナミクスについて検討した。
コーパス内のすべての次のトークンを予測することを学ぶ従来のLMとは異なり、Rho-1は選択言語モデリング(SLM)を採用している。
Rho-1は9つの数学タスクで最大30%のショット精度で絶対的に改善する。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:57:07 GMT)
ALF: Adaptive Label Finetuning for Scene Graph Generation [116.6] 画像中の被写体と物体の関係を予測するためのシーングラフ生成の試み
関係の長期分布は、しばしば粗いラベルの偏りの予測につながり、SGGにおいて大きなハードルとなる。
我々はSGGに1段階のデータ転送パイプラインを導入し、ALF(Adaptive Label Finetuning)と呼ばれ、追加のトレーニングセッションを不要にする。
ALFは一般的なSGG法であるMotifに比べてmR@100が16%改善され、最先端のIETransに比べて計算コストは6%増加した。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:54:18 GMT)
Adaptive Rentention & Correction for Continual Learning [114.6] 連続学習における一般的な問題は、最新のタスクに対する分類層のバイアスである。
アダプティブ・リテンション・アンド・コレクション (ARC) のアプローチを例に挙げる。
ARCはCIFAR-100とImagenet-Rのデータセットで平均2.7%と2.6%のパフォーマンス向上を達成した。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:43:09 GMT)
JiuZhang3.0: Efficiently Improving Mathematical Reasoning by Training Small Data Synthesis Models [110.5] 既存の研究は、事前学習のための大規模な数学関連のテキストを収集したり、巨大な数学問題を合成するために強力なLLMに依存している。
そこで本研究では,数学問題合成のための小さなLLMを効率的に学習し,高品質な事前学習データを効率的に生成する手法を提案する。
我々は、GPT-4 API 9.3k回の呼び出しと4.6Bデータの事前トレーニングのみを必要とする、JuZhang3.0モデルの事前トレーニングに600万の数学問題を合成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:43:19 GMT)
Make-it-Real: Unleashing Large Multimodal Model for Painting 3D Objects with Realistic Materials [108.6] GPT-4Vは、材料を効果的に認識し、記述することができ、詳細な材料ライブラリを構築することができる。
そして、整合した材料を、新たなSVBRDF材料生成の基準として慎重に適用する。
Make-it-Realは、3Dコンテンツ作成ワークフローに合理化された統合を提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:12:51 GMT)
MER 2024: Semi-Supervised Learning, Noise Robustness, and Open-Vocabulary Multimodal Emotion Recognition [102.8] マルチモーダル感情認識は人工知能における重要な研究課題である。
現在のシステムは、実用的な応用の要求を満たすのが難しい。
昨年、私たちはMER2023を立ち上げ、マルチラベル学習、ノイズの堅牢性、半教師付き学習という3つのトピックに焦点を当てました。
今年は、MER2024の組織化を継続し、オープン語彙の感情認識に関する新たなトラックを導入します。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:43:15 GMT)
Implicit Personalization in Language Models: A Systematic Study [94.3] インプリシトパーソナライゼーション (IP) は、入力プロンプト内の暗黙の手がかりからユーザの背景を推測する言語モデルの現象である。
この研究は、厳密な数学的定式化、多面的道徳的推論フレームワーク、そして一連の事例研究を通じて、IPを体系的に研究する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:18:46 GMT)
Settling the Sample Complexity of Online Reinforcement Learning [92.0] バーンインコストを発生させることなく、最小限の最適後悔を実現する方法を示す。
最適値/コストや一定の分散といった問題依存量の影響を明らかにするために、我々の理論を拡張します。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:31:50 GMT)
IPDreamer: Appearance-Controllable 3D Object Generation with Complex Image Prompts [90.5] IPDreamerは、複雑な画像から詳細で包括的な外観特徴を抽出するために、画像プロンプト適応を取り入れた新しいアプローチである。
以上の結果から,IDDreamerは提供されたテキストと複雑な画像プロンプトの出現の両方に整合した高品質な3Dオブジェクトを効果的に生成できることが示唆された。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:45:48 GMT)
Agent Planning with World Knowledge Model [88.5] エージェント計画を容易にするためにパラメトリック世界知識モデル(WKM)を導入する。
我々はWKMを開発し、グローバルな計画と動的状態の知識を導くために、事前のタスク知識を提供する。
我々は、我々のWKMが視覚障害者の試行錯誤と幻覚的行動の問題を効果的に緩和できることを示すために分析を行った。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:03:19 GMT)
Large Language Models-guided Dynamic Adaptation for Temporal Knowledge Graph Reasoning [87.1] 大規模言語モデル (LLM) は、時間的推論において広範な知識と卓越した能力を示した。
本稿では,時間的知識グラフに基づく推論のためのLarge Language Models-Guided Dynamic Adaptation (LLM-DA)法を提案する。
LLM-DAは、歴史的データを解析し、時間的論理規則を抽出するLLMの機能を利用する。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:54:37 GMT)
MUSTARD: Mastering Uniform Synthesis of Theorem and Proof Data [85.5] MUSTARDは、高品質で多様性のある定理と証明データの均一な合成をマスターするフレームワークである。
5,866個の有効なデータポイントを持つMUSTARDSAUCEベンチマークを示す。
我々は広範囲な解析を行い、MUSTARDが検証された高品質なステップバイステップデータを生成することを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:13:23 GMT)
A Cross-Field Fusion Strategy for Drug-Target Interaction Prediction [85.3] 既存の方法は、DTI予測中にグローバルなタンパク質情報を利用することができない。
ローカルおよびグローバルなタンパク質情報を取得するために、クロスフィールド情報融合戦略が採用されている。
SiamDTI予測法は、新規薬物や標的に対する他の最先端(SOTA)法よりも高い精度を達成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:25:20 GMT)
Self-Taught Recognizer: Toward Unsupervised Adaptation for Speech Foundation Models [84.9] Self-Taught Recognizer (STAR) は、音声認識システムのための教師なし適応フレームワークである。
その結果,STARは14のドメインで平均13.5%の単語誤り率の相対的な減少を実現していることがわかった。
STARは1時間以内のラベル付きデータを必要とする高いデータ効率を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:27:11 GMT)
TerDiT: Ternary Diffusion Models with Transformers [83.9] TerDiTは変圧器を用いた3次拡散モデルのための量子化対応トレーニングスキームである。
我々は、DiTネットワークの3元化とスケールモデルサイズを600Mから4.2Bに焦点をあてる。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:57:24 GMT)
Efficient Visual State Space Model for Image Deblurring [83.6] 畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:13:36 GMT)
Regressor-free Molecule Generation to Support Drug Response Prediction [83.3] 目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:22:17 GMT)
RaFe: Ranking Feedback Improves Query Rewriting for RAG [83.2] アノテーションを使わずにクエリ書き換えモデルをトレーニングするためのフレームワークを提案する。
公開されているリランカを活用することで、フィードバックはリライトの目的とよく一致します。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:00:19 GMT)
Evaluation of Test-Time Adaptation Under Computational Time Constraints [80.4] テスト時間適応(TTA)メソッドは、テスト時にラベルのないデータを活用して、分散シフトに適応する。
現在の評価プロトコルは、この余分なコストの影響を見落とし、実際の適用性に影響を与える。
本稿では,TTA手法のより現実的な評価プロトコルを提案し,一定の速度のデータストリームからデータをオンライン形式で受信する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:38:24 GMT)
Parrot: Enhancing Multi-Turn Instruction Following for Large Language Models [79.3] 大規模言語モデル(LLM)のためのマルチターン命令の強化を目的としたソリューションであるParrotを紹介する。
まず,アナフォラやエリプシスなどの人間的なクエリを特徴とするマルチターン命令を効率よく,効率的に収集する手法を提案する。
第2に,マルチターンインタラクションにおける複雑なクエリに対するLLMをさらに強化する,コンテキスト対応の選好最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:32:52 GMT)
FLoRA: Low-Rank Core Space for N-dimension [78.4] さまざまな下流タスクに事前訓練された基礎モデルを適応させることは、人工知能において一般的である。
これを軽減するために、事前訓練されたモデルの重みをより資源効率の良い方法で更新するために、いくつかの微調整技術が開発されている。
本稿では,多次元パラメータ空間用に設計された一般化されたパラメータ効率きめ細調整フレームワークFLoRAを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:04:42 GMT)
WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models [78.2] 大規模言語モデル(LLM)は、成長を続ける世界の事実に適合し、幻覚的応答を修正するために知識更新を必要とする。
更新された知識が記憶にどこに存在するかは、モデル編集の基本的な問題である。
記憶のギャップを埋めるためにWISEを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:35:52 GMT)
ReactXT: Understanding Molecular "Reaction-ship" via Reaction-Contextualized Molecule-Text Pretraining [76.5] 反応テキストモデリングのためのReactXTと実験手順予測のためのOpenExpを提案する。
ReactXTは、インプットコンテキストの3つのタイプをインクリメンタルに事前トレーニングする。
私たちのコードはhttps://github.com/syr-cn/ReactXT.comで公開されています。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:55:59 GMT)
Self-Play Probabilistic Preference Optimization for Language Model Alignment [75.8] 近年の進歩は、嗜好の確率で直接作業することで、人間の嗜好をより正確に反映できることを示している。
本稿では,言語モデルアライメントのためのセルフプレイ方式を提案する。
提案手法は,PSPO (textit-play Probabilistic Preference Optimization) と呼ばれ,反復的なポリシー更新を通じてナッシュ均衡を近似する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:58:39 GMT)
Detecting Multimodal Situations with Insufficient Context and Abstaining from Baseless Predictions [75.5] VLU(Vision-Language Understanding)ベンチマークには、提供されたコンテキストによってサポートされない仮定に答えが依存するサンプルが含まれている。
サンプル毎にコンテキストデータを収集し,エビデンスに基づくモデル予測を促進するためにコンテキスト選択モジュールをトレーニングする。
我々は,十分なコンテキストを欠いたサンプルを同定し,モデル精度を向上させる汎用なコンテキスト・アワレ認識検出器を開発した。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:11:56 GMT)
Power Hungry Processing: Watts Driving the Cost of AI Deployment? [74.2] 生成された多目的AIシステムは、機械学習(ML)モデルをテクノロジに構築するための統一的なアプローチを約束する。
この「一般性」の野心は、これらのシステムが必要とするエネルギー量と放出する炭素量を考えると、環境に急激なコストがかかる。
これらのモデルを用いて,代表的なベンチマークデータセット上で1,000の推論を行うのに必要なエネルギーと炭素の量として,デプロイメントコストを測定した。
本稿は、多目的MLシステムの展開動向に関する議論から締めくくり、エネルギーと排出の面でコストの増大に対して、その実用性はより意図的に重み付けされるべきである、と警告する。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:15:44 GMT)
MagicDrive3D: Controllable 3D Generation for Any-View Rendering in Street Scenes [72.0] 制御可能な3Dストリートシーン生成のための新しいパイプラインであるMagicDrive3Dを紹介する。
生成モデルをトレーニングする前に再構築する従来の方法とは異なり、MagicDrive3Dはまずビデオ生成モデルをトレーニングし、生成したデータから再構成する。
以上の結果から, 自律運転シミュレーションなどにおけるトランスフォーメーションの可能性を示すとともに, フレームワークの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:04:51 GMT)
Fast Shapley Value Estimation: A Unified Approach [71.9] 冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。
既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:07:48 GMT)
A Survey on Vision-Language-Action Models for Embodied AI [71.2] 視覚言語アクションモデル(VLA)はロボット学習の基盤となっている。
汎用性、デキスタリティ、一般化可能性など、様々な手法が提案されている。
VLAは、長い水平タスクを実行可能なサブタスクに分解できるハイレベルなタスクプランナとして機能する。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:43:54 GMT)
From Text to Pixel: Advancing Long-Context Understanding in MLLMs [70.8] 本稿では,この問題に対処するために設計された多モーダル大規模言語モデルであるSEEKERを紹介する。
SEEKERは、画像を介してテキストシーケンスを視覚ピクセル空間に圧縮することで、長文のコンパクトエンコーディングを最適化することを目的としている。
6つの長文マルチモーダルタスクに関する実験により、SEEKERは、OCRベースの手法と比較して、同じ量のテキスト情報を伝達するために、少ない画像トークンを利用できることを示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:17:23 GMT)
Graph Sparsification via Mixture of Graphs [70.8] そこで我々はMixture-of-Graphs (MoG)を導入し、各ノードに対して動的に調整されたプルーニングソリューションを選択する。
MoGには複数のスパシファイアの専門家が組み込まれており、それぞれが独自のスパーシリティレベルとプルーニング基準によって特徴付けられ、各ノードに対して適切な専門家を選択する。
5つのGNNを備えた4つの大規模OGBデータセットと2つのスーパーピクセルデータセットの実験により、MoGはより高い空間レベルのサブグラフを識別することを示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:40:21 GMT)
DeepInception: Hypnotize Large Language Model to Be Jailbreaker [70.3] 大規模言語計算モデル(LLM)は、敵のジェイルブレイクに対して脆弱である。
本稿では,LDMをジェイルブレーカーに催眠機能を持たせる,DeepInceptionと呼ばれる軽量な手法を提案する。
経験的に、DeepInceptionは以前のものと競合するジェイルブレイクの成功率を達成することができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:17:38 GMT)
Towards Efficient LLM Grounding for Embodied Multi-Agent Collaboration [70.1] 本稿では,多エージェント協調のための新しいフレームワークを提案する。これは,効率的な自己調整のための強化アドバンテージフィードバック(Reinforced Advantage feedback, ReAd)を導入する。
Over-AIと難解なRoCoBenchの実験は、ReAdが成功率のベースラインを超え、エージェントの相互作用ステップを著しく減少させることを示している。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:33:19 GMT)
EditWorld: Simulating World Dynamics for Instruction-Following Image Editing [68.6] 拡散モデルは画像編集の性能を大幅に改善した。
本稿では,様々な世界シナリオに根ざした命令を定義し,分類する,世界指導による画像編集について紹介する。
本手法は,既存の編集方法よりも大幅に優れる。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:54:17 GMT)
Boosting Medical Image-based Cancer Detection via Text-guided Supervision from Reports [68.4] 本研究では, 高精度ながん検出を実現するための新しいテキスト誘導学習法を提案する。
本手法は,大規模プレトレーニングVLMによる臨床知識の活用により,一般化能力の向上が期待できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:03:38 GMT)
Perception of Knowledge Boundary for Large Language Models through Semi-open-ended Question Answering [67.9] 大きな言語モデル(LLM)は知識探索に広く用いられているが、幻覚に悩まされている。
本稿では,LLMの知識境界(KB)を半オープンな質問(SoeQ)で知覚する。
GPT-4 は SoeQ では性能が悪く,KB に気づいていないことが多い。
我々の補助モデルであるLLaMA-2-13Bは、より曖昧な答えを見つけるのに有効である。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:00:14 GMT)
AutoTimes: Autoregressive Time Series Forecasters via Large Language Models [67.8] 本稿では,時系列セグメントを埋め込み空間に独立に投影し,任意の長さで将来予測を自動回帰的に生成する自動回帰時系列予測器としてAutoTimesを提案する。
AutoTimesは、高度なLSMベースの予測装置と比較して、0.1%のトレーニング可能なパラメータと5倍以上のトレーニング/推論のスピードアップで最先端を実現している。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:58:28 GMT)
SliM-LLM: Salience-Driven Mixed-Precision Quantization for Large Language Models [67.7] 後学習量子化(PTQ)は、大規模言語モデル(LLM)において研究される強力な圧縮手法である。
既存のPTQ法は、特に4ビット幅以下では、精度と効率の点で理想的ではない。
本稿では,LSM,すなわちSliM-LLMに対するSalience-Driven Mixed-Precision Quantizationスキームを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:21:48 GMT)
Vision-Language Models Provide Promptable Representations for Reinforcement Learning [67.4] 視覚言語モデル(VLM)に符号化された多量の一般知識と索引可能な世界知識をインターネット規模で事前学習して具体的強化学習(RL)を行う新しい手法を提案する。
提案手法では,共通意味的推論の表現にチェーン・オブ・シントを用いることで,新規シーンのポリシー性能を1.5倍向上できることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:04:11 GMT)
Gradient Transformation: Towards Efficient and Model-Agnostic Unlearning for Dynamic Graph Neural Networks [66.7] グラフアンラーニングは、ユーザのプライバシ保護と、望ましくないデータによるネガティブな影響軽減に不可欠なツールとして登場した。
DGNNの普及に伴い、動的グラフアンラーニングの実装を検討することが不可欠となる。
DGNNアンラーニングを実装するために,効率的,効率的,モデルに依存しない,事後処理手法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:26:18 GMT)
RoPINN: Region Optimized Physics-Informed Neural Networks [66.4] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)の解法として広く応用されている。
本稿では,地域最適化としての新たな訓練パラダイムを提案し,理論的に検討する。
実践的なトレーニングアルゴリズムであるRerea Optimized PINN(RoPINN)は、この新しいパラダイムからシームレスに派生している。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:45:57 GMT)
InfoRM: Mitigating Reward Hacking in RLHF via Information-Theoretic Reward Modeling [66.3] Reward Hacking(報酬の過度な最適化)は依然として重要な課題だ。
本稿では,報奨モデル,すなわちInfoRMのためのフレームワークを提案する。
InfoRMの過度な最適化検出機構は、有効であるだけでなく、幅広いデータセットにわたって堅牢であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:39:53 GMT)
DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data [65.5] 本稿では,高校・学部レベルの数学競争問題から得られたリーン4証明データを生成する手法を提案する。
この合成データセットでDeepSeekMath 7Bモデルを微調整します。
我々のモデルは、Lean 4 Formalized International Mathematical Olympiad (FIMO)ベンチマークで148の問題を5つ証明しましたが、GPT-4は証明できませんでした。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:03:42 GMT)
Message-Passing Monte Carlo: Generating low-discrepancy point sets via Graph Neural Networks [64.4] 本稿では,Message-Passing Monte Carlo という低差点集合を生成する機械学習手法を提案する。
MPMCの点は、各次元の相違点に関して、最適かほぼ最適であると実証的に示される。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:17:20 GMT)
End-to-end resource analysis for quantum interior point methods and portfolio optimization [63.5] 問題入力から問題出力までの完全な量子回路レベルのアルゴリズム記述を提供する。
アルゴリズムの実行に必要な論理量子ビットの数と非クリフォードTゲートの量/深さを報告する。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:55:06 GMT)
LOVA3: Learning to Visual Question Answering, Asking and Assessment [63.4] 質問への回答、質問、評価は、世界を理解し、知識を得るのに不可欠な3つの人間の特性である。
現在のMLLM(Multimodal Large Language Models)は主に質問応答に焦点を当てており、質問や評価スキルの可能性を無視することが多い。
本研究では,「LOVA3」について紹介する。「学習tOビジュアル質問回答,質問及び評価」という,革新的なフレームワークである。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:21:59 GMT)
MVBench: A Comprehensive Multi-modal Video Understanding Benchmark [63.1] 本稿では、MVBenchという総合的なマルチモーダルビデオ理解ベンチマークを紹介する。
まず、これらの時間的タスクを定義するための新しい静的-動的手法を提案する。
そして,タスク定義に従って,公開ビデオアノテーションを複数選択QAに自動的に変換し,各タスクを評価する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:49:29 GMT)
CSCD-NS: a Chinese Spelling Check Dataset for Native Speakers [62.6] CSCD-NSは中国初のネイティブ話者向けスペルチェックデータセットである。
CSCD-NSはスケールが10倍大きく、誤差分布が異なる。
本稿では,入力過程をシミュレーションする新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:41:10 GMT)
BootsTAP: Bootstrapped Training for Tracking-Any-Point [62.6] Tracking-Any-Point (TAP) は、ビデオ中の固体表面上の任意の点を追跡するアルゴリズムとして形式化することができる。
大規模でラベルなし、未修正のリアルワールドデータが、最小限のアーキテクチャ変更でTAPモデルを改善することができることを示す。
我々は,TAP-Vidベンチマークにおける最先端性能が,従来の結果よりも広いマージンで上回っていることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:00:26 GMT)
Premier-TACO is a Few-Shot Policy Learner: Pretraining Multitask Representation via Temporal Action-Driven Contrastive Loss [61.4] Premier-TACOはマルチタスクの特徴表現学習手法である。
シーケンシャルな意思決定タスクにおいて、数ショットのポリシー学習効率を改善するように設計されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:41:29 GMT)
Lessons from the Trenches on Reproducible Evaluation of Language Models [61.1] 我々は,大規模言語モデルの評価を3年間経験し,研究者に指導とレッスンを提供してきた。
本稿では,言語モデルの独立性,再現性,評価を行うオープンソースライブラリであるLanguage Model Evaluation Harness(lm-eval)を紹介する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:50:49 GMT)
CALF: Aligning LLMs for Time Series Forecasting via Cross-modal Fine-Tuning [59.9] MTSFのためのクロスモーダルLCMファインチューニング(CALF)フレームワークを提案する。
分散の相違を低減するため,クロスモーダルマッチングモジュールを開発した。
CALFは、長期および短期の予測タスクの最先端のパフォーマンスを確立する。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:47:29 GMT)
Unchosen Experts Can Contribute Too: Unleashing MoE Models' Power by Self-Contrast [59.0] Mixture-of-Experts (MoE) は、計算効率を保ちながら、モデルサイズをスケールするための顕著なアーキテクチャとして登場した。
本研究では,無声専門家を推論中に自己コントラスト的に活用する学習自由戦略である自己コントラスト混合(SCMoE)を提案する。
我々の手法は概念的には単純で計算量も軽量であり、グリージー復号法に比べて最小限の遅延を発生させる。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:45:29 GMT)
Neural Pfaffians: Solving Many Many-Electron Schrödinger Equations [58.1] 神経波関数は、計算コストが高いにもかかわらず、多電子系の基底状態の近似において前例のない精度を達成した。
近年の研究では、個々の問題を個別に解くのではなく、様々な構造や化合物にまたがる一般化波動関数を学習することでコストを下げることが提案されている。
この研究は、分子間の一般化に適した過度にパラメータ化され、完全に学習可能なニューラルウェーブ関数を定義することで、この問題に取り組む。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:30:51 GMT)
MuDreamer: Learning Predictive World Models without Reconstruction [58.0] 本稿では,DreamerV3アルゴリズムに基づく堅牢な強化学習エージェントであるMuDreamerについて述べる。
本手法は,Atari100kベンチマークにおいて,より高速なトレーニングの恩恵を受けながら,同等のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:09:01 GMT)
NeRF-Casting: Improved View-Dependent Appearance with Consistent Reflections [57.6] 最近の研究は、遠方の環境照明の詳細な明細な外観を描画するNeRFの能力を改善しているが、近い内容の一貫した反射を合成することはできない。
我々はこれらの問題をレイトレーシングに基づくアプローチで解決する。
このモデルでは、それぞれのカメラ線に沿った点における視界依存放射率を求めるために高価なニューラルネットワークをクエリする代わりに、これらの点から光を流し、NeRF表現を通して特徴ベクトルを描画します。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:59:57 GMT)
Chain of Thought Empowers Transformers to Solve Inherently Serial Problems [57.6] 思考の連鎖(CoT)は、算術や記号的推論タスクにおいて、大きな言語モデル(LLM)の精度を向上させるための非常に効果的な方法である。
この研究は、表現性のレンズを通してデコーダのみの変換器に対するCoTのパワーを理論的に理解する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:10:39 GMT)
DeepfakeArt Challenge: A Benchmark Dataset for Generative AI Art Forgery and Data Poisoning Detection [57.5] 悪意ある目的のために生成的AIを使用することについて懸念が高まっている。
生成AIを用いた視覚コンテンツ合成の領域では、画像偽造とデータ中毒が重要な関心事となっている。
DeepfakeArt Challenge(ディープフェイクアートチャレンジ)は、AIアートのジェネレーションとデータ中毒検出のための機械学習アルゴリズムの構築を支援するために設計された、大規模なチャレンジベンチマークデータセットである。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:41:50 GMT)
From Role-Play to Drama-Interaction: An LLM Solution [57.2] 本稿では,従来のドラマに前例のない没入感を与えるemphLLMベースのインタラクティブドラマを紹介する。
我々は、この新たな芸術ジャンルを、6つの重要な要素-プラット、キャラクタ、思考、辞書、スペクタクル、相互作用によって定義する。
本稿では,プレイヤーとのインタラクションにおける物語の進行をより細かく制御するためのemphNarrative Chainを提案し,任意のストーリーをドラマスクリプトに合成するemphAuto-Dramaを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:03:56 GMT)
UDKAG: Augmenting Large Vision-Language Models with Up-to-Date Knowledge [56.8] 大規模視覚言語モデル(LVLM)は、LLaVAシリーズのような最新の知識を知らない。
有望な解決策は、推論中のインターネット検索、すなわちインターネット拡張世代(IAG)を通じてLVLMに最新の知識を提供することである。
UDKAGと呼ばれる最新の知識に関する視覚的質問応答(VQA)を扱うために,既存のLVLMを増補するプラグイン・アンド・プレイフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:32:07 GMT)
Fine-grained Image-to-LiDAR Contrastive Distillation with Visual Foundation Models [56.0] Visual Foundation Models (VFM) は、3D表現学習を強化するために使用される。
VFMは、弱制御された画素間コントラスト蒸留のためのセマンティックラベルを生成する。
我々は,空間分布とカテゴリー周波数の不均衡に対応するために,点のサンプリング確率を適応させる。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:48:19 GMT)
Towards Privacy-Aware and Personalised Assistive Robots: A User-Centred Approach [55.6] この研究は、フェデレートラーニング(FL)のようなユーザー中心のプライバシーに配慮した技術のパイオニアである。
FLは機密データを共有せずに協調学習を可能にし、プライバシとスケーラビリティの問題に対処する。
この作業には、スマート車椅子アシストのためのソリューションの開発、ユーザの独立性の向上、幸福感の向上が含まれる。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:14:08 GMT)
Entrywise error bounds for low-rank approximations of kernel matrices [55.5] 切り抜き固有分解を用いて得られたカーネル行列の低ランク近似に対するエントリーワイド誤差境界を導出する。
重要な技術的革新は、小さな固有値に対応するカーネル行列の固有ベクトルの非局在化結果である。
我々は、合成および実世界のデータセットの集合に関する実証的研究により、我々の理論を検証した。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:26:25 GMT)
Klein-Gordon oscillators, RQM and quantum time [55.2] 相対論的スピンレス粒子と相対論的量子力学(RQM)の真空との相互作用をオンにすると、Klein-Gordon方程式とKlein-Gordon方程式が置き換えられることを示す。
この場合、座標時間は演算子となり、自由相対論的粒子は仮想状態に入る。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:20:56 GMT)
PaGoDA: Progressive Growing of a One-Step Generator from a Low-Resolution Diffusion Teacher [55.2] PaGoDAは、ジェネレータの解像度を、元の教師DMよりも徐々に拡大させる技術である。
逆問題に対するPaGoDAの有効性を実証し、制御可能な生成を可能にする。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:39:09 GMT)
Two-Stage ML-Guided Decision Rules for Sequential Decision Making under Uncertainty [55.1] SDMU (Sequential Decision Making Under Uncertainty) は、エネルギー、金融、サプライチェーンといった多くの領域において、ユビキタスである。
いくつかのSDMUは、自然にマルチステージ問題(MSP)としてモデル化されているが、結果として得られる最適化は、計算の観点からは明らかに困難である。
本稿では,2段階の一般決定規則(TS-GDR)を導入し,線形関数を超えて政策空間を一般化する手法を提案する。
TS-GDRの有効性は、TS-LDR(Two-Stage Deep Decision Rules)と呼ばれるディープリカレントニューラルネットワークを用いたインスタンス化によって実証される。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:19:47 GMT)
GaussianCube: A Structured and Explicit Radiance Representation for 3D Generative Modeling [55.1] 構造的かつ完全明快な放射率表現を導入し、3次元生成モデリングを大幅に促進する。
我々はまず,新しい密度制約付きガウス適合アルゴリズムを用いてガウスキューブを導出する。
非条件およびクラス条件オブジェクト生成、デジタルアバター生成、テキスト・トゥ・3Dによる実験は、我々のモデル合成が最先端の生成結果を達成することを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:58:53 GMT)
EMR-Merging: Tuning-Free High-Performance Model Merging [55.0] Elect, Mask & Rescale-Merging (EMR-Merging) は既存のマージ手法と比較して優れた性能を示した。
EMR-Mergingはチューニング不要なので、データアベイラビリティや追加のトレーニングは必要ありません。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:25:45 GMT)
PuzzleAvatar: Assembling 3D Avatars from Personal Albums [54.8] 我々は,OOTDアルバムから忠実な3Dアバターを生成する新しいモデルであるPuzzleAvatarを開発した。
学習したトークンを“パズルピース”として利用して,忠実でパーソナライズされた3Dアバターを組み立てます。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:59:56 GMT)
Improved Distribution Matching Distillation for Fast Image Synthesis [54.7] この制限を解除し、MDDトレーニングを改善する一連の技術であるMDD2を紹介する。
まず、回帰損失と高価なデータセット構築の必要性を排除します。
第2に, GAN損失を蒸留工程に統合し, 生成した試料と実画像との識別を行う。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:59:49 GMT)
AGRaME: Any-Granularity Ranking with Multi-Vector Embeddings [53.8] 我々は,多ベクトル埋め込みを利用して粒度の異なるレベルにランク付けする,任意の粒度ランキングの考え方を紹介した。
検索強化世代におけるポストホック励振付加への命題レベルのランク付けの適用を実証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:04:54 GMT)
Federated Domain-Specific Knowledge Transfer on Large Language Models Using Synthetic Data [53.7] フェデレートされたドメイン固有の知識伝達フレームワークを紹介する。
クライアントのデータプライバシを保護しながら、LLMからSLMへのドメイン固有の知識転送を可能にする。
提案されたFDKTフレームワークは、プライバシー予算が10未満のSLMのタスクパフォーマンスを約5%改善する。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:14:35 GMT)
Efficient Encoder-Decoder Transformer Decoding for Decomposable Tasks [53.6] エンコーダ・デコーダモデルのための新しい構成を導入し、構造化された出力と分解可能なタスクの効率を改善する。
提案手法は,インプットを一度エンコードして並列にデコードすることで,トレーニングと推論の効率を向上する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:17:26 GMT)
A self-supervised framework for learning whole slide representations [52.8] 我々は、全スライド画像のギガピクセルスケールの自己スーパービジョンのためのSlide Pre-trained Transformer (SPT)を提案する。
バイオメディカル・マイクロスコープ・データセットを用いて,5つの診断課題におけるSPT視覚表現のベンチマークを行った。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:23:53 GMT)
LoRA-Ensemble: Efficient Uncertainty Modelling for Self-attention Networks [52.5] 本稿では,自己注意ネットワークのためのパラメータ効率の高いディープアンサンブル手法であるLoRA-Ensembleを紹介する。
全メンバー間で重みを共有できる1つの事前学習型自己注意ネットワークを利用することで、注意投影のために、メンバー固有の低ランク行列を訓練する。
提案手法は明示的なアンサンブルよりも優れたキャリブレーションを示し,様々な予測タスクやデータセットに対して類似あるいは良好な精度を実現する。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:10:32 GMT)
Unveiling the Achilles' Heel of NLG Evaluators: A Unified Adversarial Framework Driven by Large Language Models [52.4] 我々は,NLG評価器に対する新しいブラックボックス対逆フレームワークであるAdvEvalを紹介する。
AdvEvalは、人間と被害者の評価者との強い意見の相違をもたらすデータを生成するために特別に調整されている。
我々は,12名の被害者評価者と11名のNLGデータセットを用いて,対話,要約,質問評価などのタスクを分散した実験を行った。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:48:15 GMT)
Breaking Free: How to Hack Safety Guardrails in Black-Box Diffusion Models! [52.1] EvoSeedは、フォトリアリスティックな自然対向サンプルを生成するための進化戦略に基づくアルゴリズムフレームワークである。
我々は,CMA-ESを用いて初期種ベクトルの探索を最適化し,条件付き拡散モデルで処理すると,自然逆数サンプルをモデルで誤分類する。
実験の結果, 生成した対向画像は画像品質が高く, 安全分類器を通過させることで有害なコンテンツを生成する懸念が高まっていることがわかった。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:35:45 GMT)
A Poisson-Gamma Dynamic Factor Model with Time-Varying Transition Dynamics [51.1] 非定常PGDSは、基礎となる遷移行列が時間とともに進化できるように提案されている。
後続シミュレーションを行うために, 完全共役かつ効率的なギブスサンプリング装置を開発した。
実験により,提案した非定常PGDSは,関連するモデルと比較して予測性能が向上することを示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:21:27 GMT)
TransliCo: A Contrastive Learning Framework to Address the Script Barrier in Multilingual Pretrained Language Models [50.4] 本稿では,mPLM を微調整する TransliCo を提案する。
Furinaは様々なゼロショット・クロスリンガル・トランスファータスクにおいてオリジナルのGlot500-mより優れていることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:30:09 GMT)
Offline Reinforcement Learning from Datasets with Structured Non-Stationarity [50.4] 現在の強化学習(RL)は、成功するポリシーを学ぶのに必要な大量のデータによって制限されることが多い。
本稿では,データセットを収集しながら,各エピソードの遷移と報酬関数が徐々に変化するが,各エピソード内で一定に保たれるような新しいオフラインRL問題に対処する。
本稿では、オフラインデータセットにおけるこの非定常性を識別し、ポリシーのトレーニング時にそれを説明し、評価中に予測するContrastive Predictive Codingに基づく手法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:41:36 GMT)
SpikeMba: Multi-Modal Spiking Saliency Mamba for Temporal Video Grounding [50.3] 時間的ビデオグラウンドティングのためのマルチモーダル・スパイク・サリエンシ・マンバであるSpikeMbaを紹介した。
我々のアプローチでは、スパイキングニューラルネットワーク(SNN)と状態空間モデル(SSM)を統合して、そのユニークな利点を活用する。
我々の実験は、最先端の手法を一貫して上回るSpikeMbaの有効性を実証した。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:53:12 GMT)
Thermodynamics of adiabatic quantum pumping in quantum dots [50.2] 2つのフェルミオンリードに接続された単一レベルの量子ドットである共鳴レベルモデルによる断熱量子ポンピングを考察する。
我々は, このモデルについて, 点のエネルギーレベルと熱浴によるトンネル速度の変動を考慮した一貫した熱力学的記述を開発した。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:05:01 GMT)
The formation of non-Gaussian states in the process of parametric down-conversion [50.2] 非ガウス状態の形成は、ポンプモードが量子的かつ枯渇したと見なされるときに研究される。
シュロディンガーの猫のような状態は、基本モードと第2高調波モードで形成される。
ウィグナー関数は、質的に非ガウス状態の可視化に使用される。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:11:07 GMT)
Towards Verifiable Generation: A Benchmark for Knowledge-aware Language Model Attribution [48.9] 本稿では,知識認識型言語モデル属性(KaLMA)の新たな課題について述べる。
まず、属性のソースを構造化されていないテキストから知識グラフ(KG)に拡張し、そのリッチな構造は属性のパフォーマンスと作業シナリオの両方に役立ちます。
第2に,不完全な知識リポジトリを考慮した「意識的非能力」の設定を提案する。
第3に,テキスト品質,引用品質,引用アライメントを含む総合的な自動評価指標を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:51:35 GMT)
A Textbook Remedy for Domain Shifts: Knowledge Priors for Medical Image Analysis [48.8] ディープネットワークは、医学的なスキャンに適用すると、例外のない状況で失敗することが多いため、自然画像の解析において広く成功している。
胸部X線や皮膚病変画像の文脈において、異なる病院から採取したデータや、性別、人種などの人口統計学的変数によって構築されたデータなど、ドメインシフトに対するモデル感度に焦点をあてる。
医学教育からインスピレーションを得て,自然言語で伝達される明示的な医学知識を基盤としたディープネットワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:55:02 GMT)
ALI-Agent: Assessing LLMs' Alignment with Human Values via Agent-based Evaluation [48.5] 大規模言語モデル(LLM)は、人間の価値観と不一致した場合、意図しない、有害なコンテンツも引き出すことができる。
現在の評価ベンチマークでは、LLMが人的価値とどの程度うまく一致しているかを評価するために、専門家が設計した文脈シナリオが採用されている。
本研究では, LLM エージェントの自律的能力を活用し, 奥行き及び適応的アライメント評価を行う評価フレームワーク ALI-Agent を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:57:42 GMT)
MiniCache: KV Cache Compression in Depth Dimension for Large Language Models [48.0] キーバリュー(KV)キャッシュは、以前に生成されたトークンのキー値状態を格納する。
KVキャッシュのサイズはシーケンス長とともに線形に増加し、長いコンテキスト入力と広範囲なシーケンス生成を必要とするアプリケーションの課題を提起する。
レイヤ間のKVキャッシュを,新しい奥行きの観点から圧縮する,MiniCacheという,シンプルで効果的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:43:52 GMT)
Neural Directional Encoding for Efficient and Accurate View-Dependent Appearance Modeling [47.9] NDEは特徴グリッドに基づく空間符号化の概念を角領域に転送する。
合成データと実データの両方の実験により、NDEを用いたNeRFモデルは、スペクトルオブジェクトのビュー合成において、技術の状態よりも優れていたことが示されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:56:34 GMT)
Data Mixing Made Efficient: A Bivariate Scaling Law for Language Model Pretraining [47.8] 本研究は、データ混合物の低コストプロキシに基づく戦略を検証することによって、制限に対処する。
データ量と混合比の2変量スケーリング挙動を正確にモデル化する統合スケーリング法、BiMixを提案する。
特に,エントロピー駆動のトレーニングフリーなデータ混合は,リソース集約的な手法に比べて,同等あるいはそれ以上のパフォーマンスを達成できることがわかった。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:44:02 GMT)
S-Eval: Automatic and Adaptive Test Generation for Benchmarking Safety Evaluation of Large Language Models [47.7] 大規模な言語モデルは、その革命的な能力にかなりの注目を集めている。
安全性に関する懸念も高まっている。
S-Evalは,多次元かつオープンな安全評価ベンチマークである。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:34:31 GMT)
From Explicit CoT to Implicit CoT: Learning to Internalize CoT Step by Step [47.6] 本稿では,CoTステップを内在化するためのモデルについて検討する。
本稿では,CoTのステップを内部化するためのシンプルで効果的な手法を提案する。
提案手法はMistral 7Bのような大規模言語モデルに対して有効であり,中間ステップを生成せずにGSM8K上で50%以上の精度を達成できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:54:14 GMT)
Advancing Spiking Neural Networks for Sequential Modeling with Central Pattern Generators [47.4] スパイキングニューラルネットワーク(SNN)は、人工ニューラルネットワークを開発するための有望なアプローチである。
SNNをシーケンシャルなタスクに適用することは、効果的でハードウェアフレンドリーなスパイク形式の位置符号化戦略を作成するという課題によって妨げられている。
CPG-PEと呼ばれる新しいSNNのためのPE手法を提案する。我々は、一般的に使われているsinusoidal PEが、数学的に特定のCPGの膜電位ダイナミクスの特定の解であることを実証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:39:12 GMT)
Can LLMs Solve longer Math Word Problems Better? [47.2] 大規模言語モデル(LLM)の能力評価にはMWP(Math Word Problems)が不可欠である
この研究は、文脈長一般化可能性(CoLeG)の探索の先駆者である。
これらの問題を解決する上で, LLMの有効性とレジリエンスを評価するために, 2つの新しい指標が提案されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:13:50 GMT)
Long-CLIP: Unlocking the Long-Text Capability of CLIP [47.1] Long-CLIPはContrastive Language-Image Pre-trainingに代わるプラグインとプレイである。
Long-CLIPは、長文入力をサポートし、ゼロショットの一般化性を維持または超える。
CLIPをプラグイン・アンド・プレイで置き換えることで、詳細なテキスト記述から画像を生成する機能が強化されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:48:43 GMT)
Embodied LLM Agents Learn to Cooperate in Organized Teams [46.3] 大規模言語モデル(LLM)は、推論、計画、意思決定のための統合的なツールとして登場した。
本稿では,これらの問題を緩和するために,LSMエージェントにプロンプトベースの組織構造を課す枠組みを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:29:00 GMT)
Aya 23: Open Weight Releases to Further Multilingual Progress [46.3] Aya 23は、Ayaモデルの最新リリース("Ust"un et al., 2024)の上に構築されており、高性能で事前訓練されたモデルと、最近リリースされたAyaコレクションとのペアリングに焦点を当てている。
その結果、23の言語を提供する強力な多言語大言語モデルとなり、最先端の言語モデリング能力を世界の人口の約半分にまで拡張した。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:10:38 GMT)
Preliminary Study of the Impact of AI-Based Interventions on Health and Behavioral Outcomes in Maternal Health Programs [46.2] 我々は,AIによる介入による聴取能力の向上が,妊娠や乳児期の重要な健康問題をよりよく理解することにつながる証拠を提示する。
この理解の向上は、母親とその赤ちゃんの健康上の利益をもたらす可能性がある。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:18:20 GMT)
Decision-Focused Learning: Foundations, State of the Art, Benchmark and Future Opportunities [46.1] 決定中心学習(DFL)は、機械学習(ML)と制約付き最適化を統合し、意思決定品質を向上させる新興パラダイムである。
本稿では,MLと制約付き最適化を組み合わせた勾配法と勾配法の両方を詳細に解析する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:38:44 GMT)
Revisiting MoE and Dense Speed-Accuracy Comparisons for LLM Training [46.0] Mixture-of-Experts (MoE)は、計算コストを一定に保ちながら、モデルキャパシティを増大させることにより、パフォーマンスの向上を享受する。
我々は高密度から高密度までのステップタイムを健全な範囲で増加させる3Dシャーディング法を採用した。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:00:53 GMT)
Mamba-R: Vision Mamba ALSO Needs Registers [45.4] ビジョントランスフォーマーと同様に、視覚マンバの特徴マップにも存在しているアーティファクトを識別する。
これらのアーティファクトは、画像の低情報背景領域に出現するハイノームトークンに対応しており、Vision Mambaではより深刻に見えます。
この問題を緩和するために、私たちはVision Mambaにレジスタトークンを導入するという以前のソリューションに従います。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:58:43 GMT)
Efficient Large Language Models: A Survey [45.4] この調査は、効率的な大規模言語モデル研究の体系的で包括的なレビューを提供する。
文献を3つの主要なカテゴリからなる分類学で整理し、異なるが相互に相互に繋がる効率的なLLMのトピックを網羅する。
この調査で特集された論文を整理するGitHubリポジトリも作成しました。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:08:37 GMT)
Which entropy for general physical theories? [45.0] 任意の情報理論のための情報源の情報内容の定量化の問題に対処する。
古典的および量子論におけるこの問題を解決する関数は、それぞれシャノンのエントロピーとフォン・ノイマンのエントロピーである。
一般的な情報理論では、エントロピーの概念を拡張する3つの異なる関数が存在し、これが情報内容に対する量化器の役割を普遍的に果たせるかどうかという疑問を提起する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:00:26 GMT)
Regret Minimization in Stackelberg Games with Side Information [44.7] 両プレイヤーがプレー前に外部コンテキストを観察するサイド情報付きStackelbergゲームを定式化する。
リーダーは(コンテキストに依存した)戦略をコミットし、フォロワーはリーダーの戦略とコンテキストの両方に最もよく対応します。
非コンテクストバージョンとは対照的に、完全な対向的な設定では、リーダが優れたパフォーマンス(後悔によって測定される)を達成することは不可能であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:39:31 GMT)
Distilling Vision-Language Pretraining for Efficient Cross-Modal Retrieval [44.6] ハッシュの学習は、高速な検索速度と低ストレージコストを提供する、効率的な検索のための実用的なソリューションである。
本研究は, 学習能力の向上と, 強力な事前学習モデルの普及を両立させる可能性を探るものである。
ハッシュ表現学習を改善するために,DCMQ (Distillation for Cross-Modal Quantization) という新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:54:59 GMT)
Towards Cross-modal Backward-compatible Representation Learning for Vision-Language Models [44.6] 後方互換性トレーニング(BT)は、新しいモデルが古いモデルの埋め込みと整合することを保証するために提案されている。
本稿では、視覚のみのBTの概念を、クロスモーダル検索の分野に拡張する。
本稿では,新しいモデルの埋め込みを古いモデルにマッピングするプロジェクションモジュールを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:46:35 GMT)
Provably Efficient Bayesian Optimization with Unbiased Gaussian Process Hyperparameter Estimation [44.5] 目的関数の大域的最適値にサブ線形収束できる新しいBO法を提案する。
本手法では,BOプロセスにランダムなデータポイントを追加するために,マルチアームバンディット法 (EXP3) を用いる。
提案手法は, 様々な合成および実世界の問題に対して, 既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:50:42 GMT)
Axioms for AI Alignment from Human Feedback [44.5] 我々は、強力な公理保証を持つ報酬関数を学習するための新しいルールを開発する。
社会的選択の観点からの重要な革新は、我々の問題が線形構造を持っていることである。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:29:29 GMT)
SemRel2024: A Collection of Semantic Textual Relatedness Datasets for 13 Languages [44.0] textitSemRelは13言語にまたがるネイティブスピーカーによって注釈付けされた新しいセマンティック関連データセットである。
これらの言語は5つの異なる言語族の出身であり、主にアフリカとアジアで話されている。
SemRelデータセットの各インスタンスは、2つの文間の意味的テキスト関連性の度合いを表すスコアに関連付けられた文対である。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:51:23 GMT)
Time-FFM: Towards LM-Empowered Federated Foundation Model for Time Series Forecasting [43.6] 我々は、事前訓練されたLMを活用して時系列予測のためのFederated Foundation ModelであるTime-FFMを提案する。
総合的な実験により、Time-FFMは最先端の予測よりも優れており、効果的に数発・ゼロショットの予測が可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:31:10 GMT)
GLaD: Synergizing Molecular Graphs and Language Descriptors for Enhanced Power Conversion Efficiency Prediction in Organic Photovoltaic Devices [43.5] 本稿では,分子グラフと言語記述子の相乗化という,有機太陽光発電(OPV)デバイスにおける電力変換効率(PCE)の予測手法を提案する。
我々は、500対のPVドナーとアクセプター分子からなるデータセットを、対応するPCE値とともに収集し、予測モデルのトレーニングデータとして利用する。
GLaDはPCEの正確な予測を実現し、効率を向上した新しいPV分子の合成を容易にする。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:02:07 GMT)
SimPO: Simple Preference Optimization with a Reference-Free Reward [43.1] 直接選好最適化は、広く使われているオフライン選好最適化アルゴリズムである。
我々はDPOに対するよりシンプルで効果的なアプローチであるSimPOを提案する。
SimPO は、応答長を大幅に増加させることなく、DPO を一貫して大幅に上回る。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:01:46 GMT)
Generative Camera Dolly: Extreme Monocular Dynamic Novel View Synthesis [43.0] 制御可能な単分子動的ビュー合成パイプラインを提案する。
我々のモデルは入力として深度を必要としないし、明示的に3次元シーン形状をモデル化しない。
私たちのフレームワークは、リッチな動的シーン理解、ロボット工学の知覚、バーチャルリアリティのためのインタラクティブな3Dビデオ視聴体験において、強力なアプリケーションをアンロックできる可能性があると考えています。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:59:52 GMT)
Instruction Tuning With Loss Over Instructions [42.9] インストラクション・モデリング(IM)は、出力部のみではなく、インストラクションとプロンプト部に損失関数を適用してLMを訓練する。
多くのシナリオにおいて、IMはNLPタスクとオープン・エンド・ジェネレーション・ベンチマークの両方でのLM性能を効果的に改善できることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:12:03 GMT)
A Video is Worth 256 Bases: Spatial-Temporal Expectation-Maximization Inversion for Zero-Shot Video Editing [42.7] ビデオ編集法は通常、通常の2D DDIMインバージョンや、編集前のナイーブな時空間 DDIMインバージョンを適用する。
本稿では,STEM(Spatial-Temporal expectation-Maximization)インバージョンを提案する。
我々の逆転は、2つの最先端のビデオ編集方法において一貫した改善を達成できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:15:47 GMT)
PEAC: Unsupervised Pre-training for Cross-Embodiment Reinforcement Learning [42.4] 本稿では,教師なし学習を活用するクロス・エボディメント・アントラクショナル・RL(CEURL)の概念を導入し,エージェントがエンボディメント・アウェア・ナレッジを習得できるようにする。
我々はCEURLを扱うための新しいアルゴリズムPEAC(Pre-trained Embodiment-Aware Control)を開発し、クロス・エボディメント・プレトレーニング用に特別に設計された本質的な報酬関数を組み込んだ。
PEACは適応性能とクロスエボディメントの一般化を著しく改善し、CEURLのユニークな課題を克服する効果を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:35:23 GMT)
RefChecker: Reference-based Fine-grained Hallucination Checker and Benchmark for Large Language Models [42.2] RefCheckerは、大規模な言語モデルでクレームを表現するクレームトリップレットを導入するフレームワークである。
RefCheckerでは、抽出器がレスポンスからクレームトリップを生成し、チェッカーが参照に対して評価する。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:18:11 GMT)
Control landscapes for high-fidelity generation of C-NOT and C-PHASE gates with coherent and environmental driving [41.9] 環境下でC-Zゲートを詳細に検討した2ビットC-NOTとC-PHASEの高忠実度発生問題について考察する。
本研究では, 忠実度の挙動を制御の関数として記述した量子制御環境について検討する。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:04:19 GMT)
QGFN: Controllable Greediness with Action Values [41.9] 我々は、GFNポリシーとアクション値の推定値である$Q$を組み合わせることで、よりグレディエなサンプリングポリシーを作成することを提案する。
提案手法のいくつかの変種であるQGFNは,多様性を犠牲にすることなく,様々なタスクで生成される高次サンプルの数を改善することができることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:19:00 GMT)
PointBeV: A Sparse Approach to BeV Predictions [41.6] Bird's-eye View (BeV) の表現は、駆動アプリケーションにおけるデファクト共有スペースとして現れている。
本稿では,高密度グリッドではなく,スパースBeVセルで動作する新しいスパースBeVセグメンテーションモデルであるPointBeVを提案する。
PointBeVはトレーニングに効率的な2パス戦略を採用しており、興味のある領域にフォーカスできる。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:43:44 GMT)
Multi-turn Reinforcement Learning from Preference Human Feedback [41.3] RLHF(Reinforcement Learning from Human Feedback)は、大規模言語モデルと人間の嗜好を整合させる標準的なアプローチとなっている。
既存のメソッドは、選好を単一の決定(ターン)レベルでエミュレートすることで機能する。
本研究では,2つの全会話間の嗜好フィードバックから強化学習のための新しい手法を開発する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:53:54 GMT)
Synergistic Global-space Camera and Human Reconstruction from Videos [41.3] この研究は、SynSynR(SynSynR)とSynSynR(SynSynR)を導入し、両者の長所を結婚させた。
具体的には、メカニカルカメラのポーズとシーンポイントの雲を再構成するために、人間対応のメカニカルCHMを設計する。
さらにScene-aware SMPL Denoiserを学習し、密集時間的コヒーレンシと動的シーン制約を組み込むことで世界フレームHMRを強化する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:57:50 GMT)
UFO: A UI-Focused Agent for Windows OS Interaction [40.9] われわれは,Windows OS上のアプリケーションに適したユーザ要求を満たす,革新的なUIフォーカスエージェントであるUFOを紹介した。
UFOはデュアルエージェントフレームワークを使用して、グラフィカルユーザインタフェース(GUI)を注意深く観察し、分析し、Windowsアプリケーションの情報を制御する。
我々は9つの人気のあるWindowsアプリケーションでUFOのテストを行い、ユーザの日々の使用を反映したさまざまなシナリオを網羅した。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:18:58 GMT)
Chain-of-Thought Reasoning Without Prompting [40.9] CoT推論パスは、テキストデコーディングプロセスを変更するだけで、事前訓練された言語モデルから引き出すことができる。
復号経路におけるCoTの存在は、モデルの復号解に対する高い信頼と相関する。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:53:59 GMT)
Pre-Trained Vision-Language Models as Partial Annotators [40.9] 事前学習された視覚言語モデルは、画像と自然言語の統一表現をモデル化するために大量のデータを学習する。
本稿では,事前学習型モデルアプリケーションのための「事前学習型-弱教師付き学習」パラダイムについて検討し,画像分類タスクの実験を行う。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:17:27 GMT)
Soft Preference Optimization: Aligning Language Models to Expert Distributions [40.8] SPOは、Large Language Models (LLMs)のような生成モデルと人間の好みを整合させる手法である。
SPOは、選好損失をモデル全体の出力分布全体にわたる正規化項と統合する。
本稿では,SPOの方法論,理論的基礎,および単純さ,計算効率,アライメント精度における比較優位性について紹介する。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:32:11 GMT)
G3: An Effective and Adaptive Framework for Worldwide Geolocalization Using Large Multi-Modality Models [40.7] 我々は、レトリーバル拡張世代(RAG)に基づく世界規模の地理的ローカライゼーションのための新しい枠組みを提案する。
G3は、ジオアライメント、ジオディバーシフィケーション、ジオビジュアライゼーションの3つのステップから構成される。
2つの確立されたデータセットの実験は、他の最先端手法と比較してG3の優位性を検証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:37:06 GMT)
RectifID: Personalizing Rectified Flow with Anchored Classifier Guidance [40.6] 既存の分類器を用いて拡散モデルを操り、画像のパーソナライズのためのトレーニングフリー手法を利用する。
本研究は,近年の補正フローの枠組みに基づいて,バニラ分類器指導の限界を簡単な固定点解法で解決できることを示唆する。
本発明の方法は、市販画像識別装置の異なる正流に実装され、人間の顔、生きた被写体、特定の対象物に対して有利なパーソナライズ結果を提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:12:15 GMT)
Tighter Privacy Auditing of DP-SGD in the Hidden State Threat Model [40.5] 我々は,DP-SGDなどの個人的敵を通じて,機械学習モデルをプライバシ保証でトレーニングできることを実証した。
我々は、この手法が隠れ状態モデルを監査する以前の試みよりいかに優れているかを実証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:38:38 GMT)
Metric Flow Matching for Smooth Interpolations on the Data Manifold [40.2] Metric Flow Matching (MFM) は条件付きフローマッチングのための新しいシミュレーションフリーフレームワークである。
我々は,MFMを条件付き経路のフレームワークとして提案し,ソース分布をターゲット分布に変換する。
我々は、LiDARナビゲーション、未ペア画像翻訳、セルラーダイナミクスのモデリングなど、一連の課題でFMをテストする。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:48:06 GMT)
A Neighbor-Searching Discrepancy-based Drift Detection Scheme for Learning Evolving Data [40.0] 本研究では,Nighbor-Searching Discrepancyに基づく新しい概念ドリフト検出手法を提案する。
提案手法は,仮想ドリフトを無視しながら,実概念ドリフトを高精度に検出することができる。
また、ある階級の侵略や撤退を特定することで、分類境界の変化の方向を示すこともできる。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:03:36 GMT)
Navigating Scaling Laws: Compute Optimality in Adaptive Model Training [40.0] 近年、ディープラーニングの最先端は、大量のデータに基づいて事前訓練された非常に大きなモデルによって支配されている。
適応的な'モデル、すなわちトレーニング中にその形状を変えることができるモデルを可能にすることで、最適性の概念を拡張します。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:28:56 GMT)
Certified Robustness against Sparse Adversarial Perturbations via Data Localization [39.9] 本論では,MNISTデータセットとFashion-MNISTデータセットのスパース攻撃に対する信頼性の高いロバスト性において,この問題の幾何学を自然に組み込んだ単純な分類器であるBox-NNについて述べる。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:02:00 GMT)
MAmmoTH2: Scaling Instructions from the Web [39.8] そこで本研究では,学習前のWebコーパスから,1000万の自然界に存在するインストラクションデータを効率的に抽出するパラダイムを提案する。
我々はMAmmoTH2モデルを構築し、推論ベンチマークの性能を大幅に向上させた。
さらに、パブリックインストラクションチューニングデータセット上でMAmmoTH2をトレーニングすると、MAmmoTH2-Plusが得られ、最先端のパフォーマンスが達成される。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:34:35 GMT)
Large Language Models Can Self-Correct with Minimal Effort [39.7] 単純で効果的な検証手法は,大規模言語モデルの本質的な能力を解き放つことができる。
本稿では, 誤応答を段階的に識別し, 訂正する反復的検証列補正フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:43:45 GMT)
One-shot Active Learning Based on Lewis Weight Sampling for Multiple Deep Models [39.6] 複数のターゲットモデルに対するアクティブラーニング(AL)は、ラベル付きデータクエリの削減と、複数のモデルを並列に効果的にトレーニングすることを目的としている。
既存のALアルゴリズムは、しばしば計算コストのかかる反復的なモデルトレーニングに依存している。
本稿では,この課題に対処する一発AL手法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:48:16 GMT)
JointRF: End-to-End Joint Optimization for Dynamic Neural Radiance Field Representation and Compression [39.4] 本稿では,動的NeRF表現と圧縮を両立する新しいエンドツーエンドのジョイント最適化手法,JointRFを提案する。
ジョイントRFは, 従来手法に比べて, 品質と圧縮効率を著しく向上させる。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:32:46 GMT)
Learning Elastic Costs to Shape Monge Displacements [39.4] モンスター問題は、一方の分布をもう一方にマップする最も効率的な方法を見つけるように要求する。
弾力性のあるコストは、Monge mapのtextitdisplacementsを$T$にします。
本稿では,モンジュマップを最適に計算するための数値計算法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:00:05 GMT)
MorphGrower: A Synchronized Layer-by-layer Growing Approach for Plausible Neuronal Morphology Generation [38.9] 本稿では,ニューロンの自然成長機構を模倣したMorphGrowerを提案する。
MorphGrowerは層ごとにモルフォロジー層を生成し、その後の各層は以前に生成された構造に条件付けされる。
4つの実世界のデータセットの結果、MorphGrowerはMorphVAEを顕著な差で上回っている。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:53:22 GMT)
Semi-Discrete Optimal Transport: Nearly Minimax Estimation With Stochastic Gradient Descent and Adaptive Entropic Regularization [38.7] 我々は,ラゲールセル推定と密度支持推定の類似性を用いて,OTマップに対して$mathcalO(t-1)$の低いバウンダリレートを証明した。
所望の速さをほぼ達成するために,サンプル数に応じて減少するエントロピー正規化スキームを設計する。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:46:03 GMT)
User Simulation for Evaluating Information Access Systems [38.5] インタラクティブな知能システムの有効性を評価することは 複雑な科学的課題です
本書は,評価に特化して設計されたユーザシミュレーション技術について,詳細な理解を提供する。
ユーザシミュレータを設計するための一般的なフレームワークと、検索エンジン、レコメンダシステム、会話アシスタントとのユーザインタラクションをシミュレートする特定のモデルとアルゴリズムの両方をカバーする。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:29:07 GMT)
Improving Gloss-free Sign Language Translation by Reducing Representation Density [38.2] Gloss-free sign language translation (SLT) は、コストのかかるGlossアノテーションを必要とせずに、良好なパフォーマンスのSLTシステムを開発することを目的としている。
我々は、光沢のないSLTの性能を制限するボトルネックとなる表現密度問題を特定する。
比較学習戦略,すなわちSignCLを導入し,より差別的な特徴表現を学習するための光沢のないモデルを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:32:58 GMT)
RE-Adapt: Reverse Engineered Adaptation of Large Language Models [38.0] 既存の命令チューニングを劣化させることなく、新しいドメイン上で大きな言語モデルを微調整するアプローチであるRE-Adaptを導入する。
我々は、命令チューニングされたモデルが学習したことを、対応する事前学習ベースモデルを超えて分離するアダプタをリバースエンジニアリングする。
すると、新しいドメインのベースモデルを微調整して、リバースエンジニアリングされたアダプタで命令の順に読み込むことができます。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:23:40 GMT)
Attending to Topological Spaces: The Cellular Transformer [37.8] トポロジカルディープラーニングは、入力データにトポロジ的構造を活用することにより、ニューラルネットワークモデルの予測性能を高めることを目指している。
本稿では,グラフベースのトランスをセルコンプレックスに一般化する新しいアーキテクチャであるCellular Transformer(CT)を紹介する。
CTは最先端のパフォーマンスを実現するが、より複雑な拡張を必要としない。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:48:32 GMT)
Analog Counterdiabatic Quantum Computing [37.5] 我々は、地上のRydberg量子ビットを持つアナログ量子デバイス上でACQCによる制限を回避するために、逆断熱プロトコルを設計する。
最大100キュービットの独立集合 (MIS) 問題に対して実験的に適用し, 短い進化時間で近似比の増大を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:46:40 GMT)
Base of RoPE Bounds Context Length [37.1] 回転位置埋め込み (RoPE) は、位置情報を回転行列で符号化する技法である。
本稿では, LLM が OOD 理論に基づく表層長文能力を得る可能性があることを明らかにする。
我々の研究は、文脈長とRoPEベースとの関係を理論的にも経験的にも明らかにし、将来の長期の文脈トレーニングに光を当てるかもしれない。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:03:31 GMT)
OceanGPT: A Large Language Model for Ocean Science Tasks [37.1] 我々は,海洋科学の課題に精通した,海洋領域における最初の大規模言語モデルであるOceanGPTを紹介した。
また,大量の海洋ドメイン命令データを自動的に取得する新しいフレームワークであるOceanGPTを提案する。
海洋域におけるLLMの能力を評価するため,最初の海洋学ベンチマークであるOceanBenchを構築した。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:04:07 GMT)
Reinforcing Language Agents via Policy Optimization with Action Decomposition [37.0] 本稿では,アクションレベルからトークンレベルへの言語エージェントの最適化を提案する。
次に、アクション内トークンとアクション間トークンの両方に対するクレジット代入を統合するために、アクション分解(BAD)を用いてベルマンバックアップを導出する。
PPOアルゴリズムにおけるBADの実装, 行動分解による政策最適化(POAD)の導入
論文参考訳(メタデータ) (Thu, 23 May 2024 14:01:44 GMT)
Pard: Permutation-Invariant Autoregressive Diffusion for Graph Generation [36.9] 本稿では,拡散モデルと自己回帰手法を統合した置換不変な自己回帰拡散モデルを提案する。
Pardは分子と非分子のデータセットで最先端のパフォーマンスを達成し、1.9M分子を含むMOSESのような大規模なデータセットにスケールする。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:38:47 GMT)
PuTR: A Pure Transformer for Decoupled and Online Multi-Object Tracking [36.5] 我々は、純粋なトランスフォーマーが、疎結合でオンラインな方法で、短期および長期の関連を統一できることを示します。
実験により、古典的なトランスフォーマーアーキテクチャが自然に関連問題に適合し、強力なベースラインを達成できることが示されている。
この作業は、MOTタスクのための有望なTransformerベースのアプローチの先駆者であり、さらなる研究を促進するためのコードを提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:44:46 GMT)
MVP-Shot: Multi-Velocity Progressive-Alignment Framework for Few-Shot Action Recognition [36.4] MVP-Shotは、セマンティック関連アクション機能をマルチ速度レベルで学習し、調整するフレームワークである。
MVFAモジュールは、サポートからのフィーチャと、異なる速度スケールのクエリビデオの類似度を測定する。
PSTモジュールは、チャネルと時間領域の機能相互作用を通じて、速度調整されたテキスト情報をビデオ機能に注入する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:17:23 GMT)
Where is the answer? Investigating Positional Bias in Language Model Knowledge Extraction [36.4] 大規模な言語モデルでは、更新を最新状態に保つか、あるいは新しいドメインに適応する必要がある。
1つの鍵は、記憶された情報がクエリプロンプトで抽出可能な方法で最新の情報を記憶することである。
微調整中に文書の難易度を最小化しているにもかかわらず、LLMはプロンプト文を通して情報を取り出すのに苦労している。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:52:31 GMT)
Multi-modality Regional Alignment Network for Covid X-Ray Survival Prediction and Report Generation [36.3] 本研究は,放射線学報告の生成と生存予測のための説明可能なモデルであるマルチモーダル地域アライメントネットワーク(MRANet)を提案する。
MRANetは、領域固有の記述を視覚的に根拠として、完了戦略を備えた堅牢な解剖学的領域を提供する。
横断LDMアライメントは、画像からテキストへの転送プロセスを強化するために使用され、その結果、臨床詳細に富んだ文と、放射線医の説明可能性が改善された。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:41:08 GMT)
Membership Inference on Text-to-Image Diffusion Models via Conditional Likelihood Discrepancy [36.2] テキスト間の拡散モデルでは、画像の限界分布よりもテキストが与えられた画像の条件分布を過度に最適化する傾向があることを示す。
我々は,条件的類似性(CLiD)の分析指標を導出し,会員推定を行う。
実験結果から,本手法は様々なデータやスケールにおいて,従来手法よりも有意に優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:09:51 GMT)
Quantum Chaos in Random Ising Networks [36.1] ErdHos-R'enyiネットワーク上の横場イジングモデルにおける普遍量子カオスシグネチャの検討
レベル間隔統計とスペクトルフォームファクターは、疎密で密接なネットワークのこの分解を示唆している。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:50:59 GMT)
A Survey on Multi-modal Machine Translation: Tasks, Methods and Challenges [35.9] マルチモーダル機械翻訳は学術と産業の両方に大きな関心を集めている。
テキストと視覚の両方を入力として取り、視覚的コンテキストを活用して、ソーステキストの曖昧さに対処する。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:56:56 GMT)
Critical Data Size of Language Models from a Grokking Perspective [35.0] 我々は、グラッキング構成下での位相遷移をデータ効率仮説に定式化する。
一般化は言語モデルが臨界サイズに達する場合にのみ起こることを示す。
その結果,言語モデルの学習メカニズムにおけるデータの役割について,新たな視点を提供するとともに,言語モデル学習の理解を深めることができた。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:06:02 GMT)
Is ImageNet worth 1 video? Learning strong image encoders from 1 long unlabelled video [34.9] 初対人ビデオを調査し,「ウォーキングツアー」データセットを導入する。
これらのビデオは高解像度で数時間の長さで、1回の未中断撮影で撮影される。
本稿では,連続ビデオからの学習に適した自己教師付き画像事前学習手法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:54:46 GMT)
CraftsMan: High-fidelity Mesh Generation with 3D Native Generation and Interactive Geometry Refiner [34.8] CraftsManは、非常に多様な形状、通常のメッシュトポロジ、詳細な表面を持つ高忠実な3Dジオメトリを生成することができる。
本手法は,従来の方法に比べて高品質な3Dアセットの製作に有効である。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:30:12 GMT)
Learning Constrained Markov Decision Processes With Non-stationary Rewards and Constraints [34.7] 制約付きマルコフ決定プロセス(CMDP)では、逆の報酬と制約があり、よく知られた不合理性の結果、任意のアルゴリズムがサブリニア後悔とサブリニア制約違反を達成できない。
非定常的な報酬や制約のあるCMDPでは、非定常性の増加とともに性能がスムーズに低下するアルゴリズムを提供することで、この負の結果が緩和できることが示される。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:48:48 GMT)
Tele-Aloha: A Low-budget and High-authenticity Telepresence System Using Sparse RGB Cameras [34.5] 本稿では,ピアツーピア通信シナリオを対象とした低予算・高精度双方向テレプレゼンスシステムTele-Alohaを提案する。
Tele-Alohaは、高解像度(2048x2048)、リアルタイム(30fps)、低レイテンシ(150ms未満)、堅牢な遠隔通信を実現するために、わずか4つのスパースRGBカメラ、1つのコンシューマグレードGPU、1つのオートステレオスコープスクリーンを使用する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:59:45 GMT)
On provable privacy vulnerabilities of graph representations [34.5] グラフ表現学習(GRL)は複雑なネットワーク構造から洞察を抽出するために重要である。
また、これらの表現にプライバシー上の脆弱性があるため、セキュリティ上の懸念も高まる。
本稿では,エッジ再構成攻撃により,高感度なトポロジ情報を推定できるグラフニューラルモデルの構造的脆弱性について検討する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:04:30 GMT)
Learning to Detect and Segment Mobile Objects from Unlabeled Videos [34.2] 身体的エージェントは興味のある対象を検出し、ローカライズしなければならない。
注釈付きボックスがないため、どのピクセルがオブジェクトにグループ化されなければならないのか、どのオブジェクトが興味を持つのかは不明である。
未ラベルビデオのみから学習した移動物体検出器MOD-UVを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:55:11 GMT)
Online Self-Preferring Language Models [34.2] オンライン自己選好(OSP)言語モデルは、自己生成の応答ペアと自己判断の選好強度から学習する。
OSPは、広く使われている2つの人間の嗜好データセットにおいて、さまざまなメトリクスをまたいだ最先端のアライメント性能を達成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:13:34 GMT)
Towards Imperceptible Backdoor Attack in Self-supervised Learning [34.1] 自己教師型学習モデルは、バックドア攻撃に対して脆弱である。
自己教師付き学習に有効な既存のバックドア攻撃は、しばしば顕著なトリガーを伴う。
本稿では,自己教師型モデルに対する非受容的で効果的なバックドア攻撃を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:08:31 GMT)
Improving Generalization of Deep Neural Networks by Optimum Shifting [33.1] 本稿では,ニューラルネットワークのパラメータを最小値からフラット値に変化させる,近位シフトと呼ばれる新しい手法を提案する。
本手法は,ニューラルネットワークの入力と出力が固定された場合,ネットワーク内の行列乗算を,未決定線形方程式系として扱うことができることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:31:55 GMT)
Semantica: An Adaptable Image-Conditioned Diffusion Model [32.9] 本稿では,条件付き画像のセマンティクスに基づいて画像を生成することができる画像条件拡散モデルであるSemanticaを紹介する。
ImageNet, LSUN Churches, LSUN Bedroom, SUN397におけるSemanticaの転写特性について検討した。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:58:03 GMT)
Statistical Advantages of Perturbing Cosine Router in Sparse Mixture of Experts [32.7] The cosine router in sparse Mixture of Experts (MoE) is recently appeared as a attractive alternative to the conventional linear router。
本研究は,コサイン・ルーティング・スパース・MoEにおけるモデルパラメータと専門家の双方の推定速度が,摂動速度に大きく改善されていることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:11:07 GMT)
Graph Neural Networks with Diverse Spectral Filtering [32.7] スペクトルグラフニューラルネットワーク(GNN)は、グラフ機械学習において大きな成功を収めている。
本稿では,ノード固有のフィルタ重みを自動的に学習する新しいスペクトルフィルタリング(DSF)フレームワークを提案する。
我々のフレームワークは、ノード分類タスクにおいて、モデル性能を最大4.92%向上させることができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:06:32 GMT)
Human-Agent Cooperation in Games under Incomplete Information through Natural Language Communication [32.7] 不完全な情報の下で共通の目的を達成するために、2人のプレイヤーが交互にトークンを制御できる共有制御ゲームを導入する。
本ゲームでは,人間を相手とする自律エージェントのポリシー合成問題を定式化する。
本稿では,言語モジュールと計画モジュールからなるコミュニケーションベースのアプローチを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:58:42 GMT)
Scalable Optimization in the Modular Norm [32.5] 我々は、任意のニューラルネットワークアーキテクチャのフルウェイト空間における自然なノルムであるモジュラーノルムを定義する。
実用面では、モジュラーノルムを用いて任意のベースのアップデートを正規化し、学習率が幅と深さで転送可能となるようにすることができる。
の原子モジュールから構築された任意のニューラルネットワークに対して、ネットワークの勾配はモジュラーノルムにおいてリプシッツ連続であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:23:30 GMT)
Stochastic Two Points Method for Deep Model Zeroth-order Optimization [32.5] 本稿では,勾配自由状態下での効率的な2点(S2P)アプローチを提案する。
一般および緩和された滑らか性仮定の下で、S2Pの理論収束性を示す。
我々は、VS2Pが深層モデルの目的を最適化するのに非常に効果的であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:01:11 GMT)
Universal Post-Training Reverse-Engineering Defense Against Backdoors in Deep Neural Networks [32.3] ユニバーサルメソッドは、攻撃者が使用する組み込みメカニズムに関係なく、バックドアを確実に検出および/または緩和しようとする。
本稿では,防衛されたDNNの内部特徴マップを利用してバックドアの検出とリバースエンジニアリングを行う新しい検出器について述べる。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:36:52 GMT)
Learning to Transform Dynamically for Better Adversarial Transferability [32.3] 人間に知覚できない摂動を加えることで構築された敵対的な例は、ニューラルネットワークを欺く可能性がある。
我々はL2T(Learning to Transform)という新しいアプローチを導入する。
L2Tは、候補プールからの操作の最適な組み合わせを選択することにより、変換された画像の多様性を高める。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:46:53 GMT)
Efficient Pre-training for Localized Instruction Generation of Videos [32.1] 手続きビデオはステップバイステップの指示を伝えるのに役立ちます。
本稿では,レシピ領域の高品質なトレーニングデータを自動的に生成する手法を提案する。
また、プロシージャビデオのためのエンドツーエンドのステップローカライズと命令生成のためのモデルであるプロシージャトランスフォーマー(ProcX)を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:24:33 GMT)
4+3 Phases of Compute-Optimal Neural Scaling Laws [31.7] マロニー、ロバーツ、サリーによって導入された解決可能なニューラルスケーリングモデルについて考察する。
我々は計算制限付き無限データスケーリング法則に関する新しい予測を導出する。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:50:54 GMT)
Evaluating Alternatives to SFM Point Cloud Initialization for Gaussian Splatting [31.7] 3次元ガウススプラッティングは、シーン再構成と新規なビュー合成のための汎用的で効果的な方法として受け入れられている。
Structure-from-Motion (SFM) アルゴリズムは克服すべき重要な限界である。
SFMデータへの依存を回避するために、NeRF再構成をどのように利用できるかを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:15:38 GMT)
Rethinking Spectral Graph Neural Networks with Spatially Adaptive Filtering [31.6] スペクトルと空間アグリゲーションの理論的関係を考察し、スペクトルが元のグラフを適応した新しいグラフに暗黙的に導く本質的な相互作用を明らかにする。
理論的および実証的研究の両方で、適応された新しいグラフは非局所性を示すが、ノード間のラベルの一貫性を反映する符号付きエッジウェイトも備えていることが明らかになった。
本稿では,非局所的な補助的なアグリゲーションのためのスペクトルフィルタリングにより適応された新しいグラフを利用する空間適応フィルタリング(SAF)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:53:42 GMT)
PV-Tuning: Beyond Straight-Through Estimation for Extreme LLM Compression [31.3] 最先端の量子化手法には、限られたキャリブレーションデータに対する圧縮パラメータの微調整(一部)が含まれる。
既存の微調整戦略を一般化し改善する表現に依存しないフレームワークであるPV-Tuningを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:57:04 GMT)
Semantic-guided Prompt Organization for Universal Goal Hijacking against LLMs [30.6] 本稿では,意味誘導型プロンプト処理戦略を取り入れたPOUGHと呼ばれる汎用ゴールハイジャック手法を提案する。
この方法はまず、候補プールから代表プロンプトを選択するためのサンプリング戦略から始まり、次にプロンプトを優先順位付けするランキング戦略が続く。
4種類の人気言語モデルと10種類のターゲット応答を用いた実験により,本手法の有効性が検証された。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:31:41 GMT)
A Semantic Segmentation-guided Approach for Ground-to-Aerial Image Matching [30.3] 本研究は,GPSデータを使わずに,問合せ地上画像と対応する衛星画像とをマッチングする問題に対処する。
これは地上画像と衛星画像の特徴を比較することで行われ、3ストリームのシームズ様のネットワークを通じて、対応する衛星のセグメンテーションマスクを革新的に活用する。
この新しさは、衛星画像とセマンティックセグメンテーションマスクの融合にあり、モデルが有用な特徴を抽出し、画像の重要な部分に集中できるようにすることを目的としている。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:30:05 GMT)
Selection, Ensemble, and Adaptation: Advancing Multi-Source-Free Domain Adaptation via Architecture Zoo [30.3] 私たちはZoo-MSFDAを紹介します。これはより一般的な設定で、各ソースドメインが異なるアーキテクチャを持つ複数のソースモデルの動物園を提供することができます。
ソース知識を豊かにする一方で、Zoo-MSFDAは最適/有害なモデルによって支配されるリスクがある。
本稿では,転送可能性を測定するための新しいソースフリーな非教師なし転送可能性推定(SUTE)を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:46:05 GMT)
OAC: Output-adaptive Calibration for Accurate Post-training Quantization [30.1] 大規模言語モデル(LLM)を圧縮するPTQ(Post-training Quantization)技術が開発されている。
ほとんどのPTQは、キャリブレーションされた層単位で$ell$損失に基づいて量子化誤差を定式化する。
キャリブレーションプロセスにモデル出力を組み込むための出力適応型(OAC)を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:01:17 GMT)
ExcelFormer: Can a DNN be a Sure Bet for Tabular Prediction? [30.1] ExcelFormerは、堅牢で、効果的で、データセットに耐性があり、ユーザフレンドリな表形式予測アプローチのためのフレームワークである。
ExcelFormerは、(P1)回転分散特性の欠如、(P2)大容量データ需要、(P3)過滑らかなソリューションなど、深い表形式モデルの3つの重要な欠点に対処する。
実世界のデータセットで実施された大規模で階層化された実験は、我々のモデルが過去のアプローチより優れていることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:41:58 GMT)
A Behavior-Aware Approach for Deep Reinforcement Learning in Non-stationary Environments without Known Change Points [30.1] 本研究では,環境変化検出と行動適応を融合させる革新的なフレームワークである行動認識検出適応(BADA)を紹介する。
我々の手法の背後にある重要なインスピレーションは、ポリシーが環境の変化に異なるグローバルな振る舞いを示すことである。
一連の実験の結果は、現在のアルゴリズムと比較して優れた性能を示している。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:17:26 GMT)
Federated Online Adaptation for Deep Stereo [30.0] 本稿では,ディープステレオネットワークを協調的に適用するための新しいアプローチを提案する。
我々は,異なる環境にデプロイされた多数のクライアントに対して最適化プロセスを要求できる分散フレームワークを開発した。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:59:58 GMT)
Document-Level In-Context Few-Shot Relation Extraction via Pre-Trained Language Models [29.9] 本稿では,文書レベルのインコンテクスト・イン・ショット関係抽出のための新しいフレームワークを提案する。
ドキュメントレベルの関係抽出用データセットとして最大であるDocREDを用いて,本フレームワークの評価を行った。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:33:51 GMT)
SEA-RAFT: Simple, Efficient, Accurate RAFT for Optical Flow [29.8] よりシンプルで効率的で正確な光流用RAFTであるSEA-RAFTを紹介する。
SEA-RAFTは、3.69のエンドポイントエラー(EPE)と0.36の1ピクセルアウトレイラレート(1px)でSpringベンチマークの最先端の精度を達成する
SEA-RAFTは高い効率で既存の手法よりも少なくとも2.3倍速く動作し、競争性能を維持している。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:04:04 GMT)
Polyak Meets Parameter-free Clipped Gradient Descent [29.8] クリッピング勾配降下に対するパラメータフリー手法について検討した。
具体的には、ハイパーパラメータチューニングを伴わない最適解に収束するInexact Polyak Stepsizeを提案する。
合成関数を用いて収束結果を数値的に検証し,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:29:38 GMT)
ASI++: Towards Distributionally Balanced End-to-End Generative Retrieval [29.7] ASI++は、新しいエンドツーエンドの生成検索手法である。
バランスの取れたIDの割り当てを同時に学習し、検索性能を向上させることを目的としている。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:54:57 GMT)
Exposure Diffusion: HDR Image Generation by Consistent LDR denoising [29.5] 我々は、伝統的に「ブラケット」と呼ばれるLDR画像の集合を融合させ、単一のHDR画像を生成するHDR画像キャプチャー文献からインスピレーションを得る。
有効なHDR結果を生成する複数のLDRブラケットを生成するために,複数の復調処理を運用する。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:24:22 GMT)
Dialogue Agents 101: A Beginner's Guide to Critical Ingredients for Designing Effective Conversational Systems [29.4] 本研究は,対話エージェントの主要な特徴,対応するオープンドメインデータセット,およびこれらのデータセットをベンチマークする手法について概説する。
我々は,既存のデータセットの会話から構築された統一dIalogue dataseTであるUNITを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:45:34 GMT)
Dinomaly: The Less Is More Philosophy in Multi-Class Unsupervised Anomaly Detection [29.4] 本稿では,最小限の再構成に基づく異常検出フレームワーク,すなわちDianomalyを紹介する。
提案したDianomalyは,3つのデータセットでそれぞれ99.6%,98.7%,89.3%の印象的な画像AUROCを実現している。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:55:20 GMT)
FuseMoE: Mixture-of-Experts Transformers for Fleximodal Fusion [29.1] FuseMoEは、革新的なゲーティング機能を備えた、エキスパートの混成フレームワークである。
多様なモダリティを統合するために設計されたFuseMoEは、欠落したモダリティと不規則にサンプリングされたデータトラジェクトリのシナリオを管理するのに効果的である。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:20:28 GMT)
P2RBox: Point Prompt Oriented Object Detection with SAM [29.0] 我々はP2RBoxを紹介した。これはオブジェクト指向オブジェクト検出のための回転ボックス(RBox)アノテーションを生成するためにポイントプロンプトを利用する。
P2RBoxには、境界感性マスクガイダンスと、空間情報を利用して粒度のあいまいさを低減する中心性ガイダンスという、2つの先進的なガイダンスが組み込まれている。
最先端のポイントアノテート生成手法であるPointOBBと比較すると、P2RBoxはDOTA-v1.0データセット上で約29%のmAPで性能が向上する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:18:08 GMT)
Link Prediction with Relational Hypergraphs [28.6] 知識グラフとのリンク予測は、グラフ機械学習において徹底的に研究されている。
本稿では,グラフニューラルネットワークの完全なリレーショナル構造への応用を解き放ち,リレーショナルハイパーグラフとリンク予測を行うフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:37:16 GMT)
Representation noising effectively prevents harmful fine-tuning on LLMs [28.5] オープンソースの大規模言語モデル(LLM)のリースは、悪質なアクターがこれらのモデルを有害な目的のために簡単に微調整できるため、デュアルユースリスクをもたらす。
本稿では,攻撃者が重みにアクセスできる場合でも有効である防御機構であるRepresentation Noising(RepNoise)を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:51:55 GMT)
AnalogCoder: Analog Circuit Design via Training-Free Code Generation [28.4] 本稿では,アナログ回路を設計するための訓練不要なLarge Language ModelsエージェントであるAnalogCoderを紹介する。
フィードバック強化フローとドメイン固有のプロンプトが組み込まれており、アナログ回路の自動化および自己修正設計を可能にする。
20個の回路を設計し、標準のGPT-4oより5個多く設計した。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:13:52 GMT)
High-throughput quantum photonic devices emitting indistinguishable photons in the telecom C-band [28.3] テレコムCバンド波長における単一識別不能光子は、量子ネットワークと将来の量子インターネットにとって不可欠である。
エピタキシャル半導体量子ドットを用いたCバンド波長で動作する量子フォトニック集積デバイスの高スループット化を実証する。
収率とコヒーレンス特性のさらなる改善は、単一光子非線型デバイスと、テレコム波長で高度な量子ネットワークを実装するための道を開くだろう。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:09:33 GMT)
Distributed Harmonization: Federated Clustered Batch Effect Adjustment and Generalization [28.2] 医療分野では、複数のサイトや機関からデータを収集することが一般的な戦略である。
様々な場所からのデータは、現地の環境や施設に偏りやすい。
一般的な戦略は、重要な生物学的情報を保持しながら、サイトのバイアスを調和させることである。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:07:54 GMT)
Self-playing Adversarial Language Game Enhances LLM Reasoning [28.2] 本稿では,大言語モデル (LLM) の自己演奏訓練手順を,Adversarial Taboo と呼ばれる2人対戦型言語ゲームで検討する。
この目標により、我々はいくつかのオープンソースのLCMを選択し、攻撃者として各動作させ、広範囲のターゲットワードのディフェンダーとして自身のコピーでプレイする。
我々は LLM の性能が広範囲の推論ベンチマークで一様に改善されていることを観察した。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:38:15 GMT)
Sample, estimate, aggregate: A recipe for causal discovery foundation models [28.1] 我々は、古典因果探索アルゴリズムの出力からより大きな因果グラフを予測することを学ぶ教師付きモデルを訓練する。
我々のアプローチは、古典的手法の出力における典型的なエラーがデータセット間で比較できるという観察によって実現されている。
実データおよび合成データに関する実験では、このモデルが不特定性や分布シフトに直面して高い精度を維持することを示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:09:20 GMT)
Optimal Rates for Vector-Valued Spectral Regularization Learning Algorithms [28.0] ベクトル値出力を持つ多種多様な正規化アルゴリズムの理論的特性について検討する。
ベクトル値出力によるリッジ回帰に対するいわゆる飽和効果を厳密に検証する。
有限サンプルリスク一般ベクトル値スペクトルアルゴリズムの上限について述べる。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:45:52 GMT)
Towards Stability of Parameter-free Optimization [28.0] 我々は、新しいパラメータフリー勾配、textscAdamG(黄金のステップサイズを持つアダム)を提案する。
textscAdamGは優れたパフォーマンスを実現しています。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:31:34 GMT)
TopoLogic: An Interpretable Pipeline for Lane Topology Reasoning on Driving Scenes [27.9] レーン幾何距離とレーンクエリ類似度に基づくレーントポロジー推論の解釈可能な手法を提案する。
提案手法は,主要なベンチマークであるOpenLane-V2において,既存の最先端手法よりも大幅に優れています。
提案する幾何距離トポロジ推論法は, 再学習なしによく訓練されたモデルに組み込むことができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:15:17 GMT)
LiteVAE: Lightweight and Efficient Variational Autoencoders for Latent Diffusion Models [27.8] LiteVAEは、潜在拡散モデル(LDM)のためのオートエンコーダのファミリーである
我々のモデルは、現在のLCDにおける確立されたVAEの品質と、エンコーダパラメータの6倍の削減とを一致させる。
私たちのより大きなモデルは、評価されたすべてのメトリクスで、同等の複雑さのVAEよりも優れています。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:06:00 GMT)
Calibrated Self-Rewarding Vision Language Models [27.7] LVLM(Large Vision-Language Models)は、訓練済みの大規模言語モデル(LLM)と視覚モデルを統合することで、指導チューニングを通じて大幅に進歩した。
LVLMは、しばしば幻覚現象を示し、生成されたテキスト応答は言語的に妥当に見えるが、入力画像に矛盾する。
本稿では,候補応答を反復的に生成し,各応答に対する報酬を評価し,微調整のための選好データをキュレートすることで,モデルの自己改善を可能にするCalibrated Self-Rewarding(CSR)アプローチを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:30:33 GMT)
SIAVC: Semi-Supervised Framework for Industrial Accident Video Classification [27.5] 半教師付き学習は、ビデオ監視シナリオにおけるラベル付きおよびラベルなしトレーニングデータの不均衡に悩まされる。
本稿では,産業事故映像分類のための半教師付き学習手法SIAVCを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:44:51 GMT)
HydraLoRA: An Asymmetric LoRA Architecture for Efficient Fine-Tuning [27.4] 大規模言語モデルへの微調整による新しいタスクへの適応は、導入によってより効率的になった。
LoRAのようなPEFT(Efficient Fine-Tuning)技術は、フル微調整に比べて性能が劣ることが多い。
ドメインの専門知識を必要としない非対称構造を持つLoRAフレームワークであるHydraLoRAを開発した。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:06:02 GMT)
Nuclear Pleomorphism in Canine Cutaneous Mast Cell Tumors: Comparison of Reproducibility and Prognostic Relevance between Estimates, Manual Morphometry and Algorithmic Morphometry [27.1] 核の大きさと形状の変化は多くの腫瘍の悪性度の重要な基準である。
本研究の目的は,犬皮膚マスト細胞腫瘍に対する代替形態計測法を開発することである。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:26:31 GMT)
Surge Phenomenon in Optimal Learning Rate and Batch Size Scaling [27.1] 本稿では,Adamスタイルにおける最適学習率とバッチサイズとの関係について検討する。
最適学習率が最初に上昇し、バッチサイズが大きくなるにつれて低下することを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:52:36 GMT)
Average gradient outer product as a mechanism for deep neural collapse [26.9] Deep Neural Collapse (DNC)は、Deep Neural Networks (DNN)の最終層におけるデータ表現の驚くほど硬い構造を指す。
本研究では,平均勾配外積(AGOP)を通した特徴学習によりDNCが生成するデータ依存環境を提案する。
本稿では,各層で計算されたAGOP行列による投影の結果,DNCがDeep Recursive Feature Machinesで発生することを理論的,実証的に実証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:36:39 GMT)
Multi-Scale VMamba: Hierarchy in Hierarchy Visual State Space Model [26.8] 状態空間モデル(SSM)は、その大域的受容場と線形複雑性のために広く注目を集めている。
視覚タスクにおけるSSMの性能向上のために,マルチスキャン戦略が広く採用されている。
本稿では,MSVMamba(Multi-Scale Vision Mamba)を導入し,限られたパラメータを持つ視覚タスクにおけるSSMの優位性を維持する。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:59:49 GMT)
UniST: A Prompt-Empowered Universal Model for Urban Spatio-Temporal Prediction [26.7] 都市時間予測のためのユニバーサルモデルUniSTを提案する。
15の都市と6つのドメインの実験は、最先端の予測性能を前進させるUniSTのブレークスルーを実証している。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:01:23 GMT)
NormAd: A Benchmark for Measuring the Cultural Adaptability of Large Language Models [26.6] 我々は75カ国の社会的・文化的規範を表す新しい物語のデータセットであるNormAdを紹介した。
我々は,大規模言語モデルが社会的・文化的文脈の粒度の異なるレベルに適応する能力を評価する。
NormAdデータセットとその関連コードはGitHubでリリースしています。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:49:51 GMT)
Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer [26.4] Direct3Dは、Wildの入力画像にスケーラブルなネイティブな3D生成モデルである。
提案手法は, 直接3次元変分オートエンコーダ(D3D-VAE)と直接3次元拡散変換器(D3D-DiT)の2成分からなる。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:49:37 GMT)
AlignGPT: Multi-modal Large Language Models with Adaptive Alignment Capability [26.2] MLLM(Multimodal Large Language Models)は、人工知能(AGI)の探索において重要であると考えられている。
MLLMのコアは、クロスモーダルアライメントを実現する能力にある。
彼らの成功にもかかわらず、これらのモデル内のアライメント機能のモデリングには欠点がある。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:07:56 GMT)
On the sample complexity of parameter estimation in logistic regression with normal design [26.1] 本稿では,ロジスティック回帰モデルのパラメータを与えられた$ell$エラーまで推定するサンプル複雑性について検討する。
試料の複雑性曲線は逆温度の点で2つの変化点を持ち, 低温, 中温, 高温状態を明確に分離することを示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:39:13 GMT)
A Nurse is Blue and Elephant is Rugby: Cross Domain Alignment in Large Language Models Reveal Human-like Patterns [26.0] クロスドメインアライメント(クロスドメインアライメント)とは、あるドメインから別のドメインへ概念をマッピングするタスクを指す。
この一見特異なタスクは、人々が具体的で抽象的な概念をどのように表現するかを調査するために設計されている。
我々は、このタスクを認知科学から適応させ、大規模言語モデルの概念化と推論能力を評価する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:59:26 GMT)
Interpretable and Editable Programmatic Tree Policies for Reinforcement Learning [26.0] 本稿では,INERpretable Editable tRee Programs for ReinforcEmenT lEaRningを提案する。
我々は,アタリゲームにおける不正調整を正し,実際の農業戦略を説明するために,我々の方針を解釈し,編集することができることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:07:38 GMT)
Data Valuation by Leveraging Global and Local Statistical Information [25.9] グローバルとローカルの両方の値分布が、機械学習の文脈におけるデータ評価に有意な可能性を秘めていることを示す。
提案手法は,探索された分布特性を既存手法であるAMEに組み込むことで,Shapley値を推定する新しいデータ評価手法であるAMEを提案する。
また,グローバルな値分布と局所的な値分布の情報を統合した最適化問題を定式化することにより,動的データ評価問題に対処する新たな経路を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:58:08 GMT)
DIDI: Diffusion-Guided Diversity for Offline Behavioral Generation [25.9] オフライン動作生成のための拡散誘導ダイバーシティ(DIDI)と呼ばれる新しい手法を提案する。
DIDIの目標は、ラベルなしオフラインデータの混合から多様なスキルセットを学ぶことである。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:00:15 GMT)
MoGU: A Framework for Enhancing Safety of Open-Sourced LLMs While Preserving Their Usability [25.8] 大規模言語モデル(LLM)は、様々なアプリケーションにますます多くデプロイされている。
我々の研究は、既存の防衛戦略がLLMに主に拒絶指向の姿勢を採用することを示唆している。
ユーザビリティを保ちつつ,LLMの安全性を高めるために設計されたMoGUフレームワークを紹介する。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:19:59 GMT)
An Empirical Study of Training State-of-the-Art LiDAR Segmentation Models [25.3] MMDetection3D-lidarsegは、最先端LiDARセグメンテーションモデルの効率的なトレーニングと評価のための包括的なツールボックスである。
我々は、幅広いセグメンテーションモデルをサポートし、堅牢性と効率を高めるために高度なデータ拡張技術を統合する。
統一されたフレームワークを育むことで、MMDetection3D-lidarsegは開発とベンチマークを合理化し、研究とアプリケーションのための新しい標準を設定します。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:59:57 GMT)
CroCoSum: A Benchmark Dataset for Cross-Lingual Code-Switched Summarization [25.2] 自然に発生するCLSリソースの希少さを考えると、データセットの大部分は翻訳に頼らざるを得ない。
これにより、コードスイッチングのインスタンスを含む有機的辞書をキャプチャする自然発生のCLSペアを観測する能力を制限することができます。
我々はCroCoSumを紹介した。CroCoSumは、言語間のコード変更による技術ニュースの要約のデータセットである。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:26:22 GMT)
Unveiling the Tapestry of Consistency in Large Vision-Language Models [25.1] 本研究では,プロンプトの解空間が知識点を中心に回転する際に,大規模視覚言語モデル(LVLM)がどのように機能するかを検討する。
ConBenchツールに基づいて、タペストリーを最初に公開し、以下の結果を得た。
我々は,本論文が研究コミュニティのモデル評価を加速し,一貫性領域の今後の進歩を促進することを願っている。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:08:23 GMT)
Focus Anywhere for Fine-grained Multi-page Document Understanding [24.8] 本稿では,LVLMを単ページ/複数ページの文書に注目する上で,効果的パイプライン,ハイブリッドデータ,チューニング戦略であるFoxを提案する。
我々は、複数の視覚語彙を用いて、インターリーブされた文書ページの視覚的ハイブリッド知識を抽出する。
我々は、複数の視覚語彙と文書内図形理解の完全な反応を達成するために、複数の語彙間の視覚データを前景として描画する。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:15:49 GMT)
Explaining Graph Neural Networks via Structure-aware Interaction Index [24.6] 本稿では,グラフ構造を内部化してノード値とノード間の相互作用値に寄与させるMyerson-Taylor相互作用指標を提案する。
そこで我々は,MAGE (Myerson-Taylor Structure-Aware Graph Explainer) を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:24:33 GMT)
HC-GAE: The Hierarchical Cluster-based Graph Auto-Encoder for Graph Representation Learning [24.6] グラフデータ解析に有効な構造特性を学習できる階層型クラスタベースGAE(HC-GAE)を開発した。
提案したHC-GAEは,ノード分類やグラフ分類に有効な表現を生成できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:08:04 GMT)
Top-Down Partitioning for Efficient List-Wise Ranking [24.6] 本稿では、ランクを深さkに分割し、文書をトップダウンで処理する新しいアルゴリズムを提案する。
このアルゴリズムは、文書から任意の深さまでを同時に比較できるピボット要素を用いることにより、本質的に並列化可能である。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:00:26 GMT)
HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models [24.5] 我々は,ヒトの長期記憶の海馬索引付け理論に触発された新しい検索フレームワークであるHippoRAGを紹介する。
その結果,本手法は最先端の手法を最大20%向上させることができた。
提案手法は,既存の手法に及ばない新たなシナリオに対処することができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:47:55 GMT)
Visual Echoes: A Simple Unified Transformer for Audio-Visual Generation [24.3] 本稿では,マルチモーダル生成において十分に検討されていない,シンプルで軽量な生成変換器について述べる。
トランスは離散オーディオおよび視覚ベクトル量子化GAN空間で動作し、マスクを装飾的に訓練する。
実験の結果,本手法は最新の画像2audio 生成法を超越していることがわかった。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:13:16 GMT)
Higher-Rank Irreducible Cartesian Tensors for Equivariant Message Passing [23.8] 機械学習された原子間ポテンシャルは、ab initio 法と first-principles 法と同等の精度を達成する。
球面テンソルの代替として高階既約カルトテンソルを導入する。
我々は、最先端の球面モデルよりも連続的に、あるいは優れた性能を観察する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:31:20 GMT)
CLAP4CLIP: Continual Learning with Probabilistic Finetuning for Vision-Language Models [23.4] 継続学習(CL)は、深層ニューラルネットワークが学習内容を保持しながら新しい知識を学ぶのを支援することを目的としている。
近年、CLIPのような学習済みの視覚言語モデルが、実用的なCL候補として注目を集めている。
我々の研究は、確率的微調整(CLAP)による連続LeArningを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:33:58 GMT)
Mixture of Experts Meets Prompt-Based Continual Learning [23.4] 本稿では、連続学習におけるそのような利点をいかにもたらすかを明らかにするための理論的分析を行う。
我々は,新しいタスク固有の専門家の追加として,プレフィックスチューニングに関する新しい視点を提供し,新しいゲーティング機構の設計を刺激する。
NoRGaの有効性は、様々なベンチマークや事前学習パラダイムで理論的にも経験的にも裏付けられている。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:49:57 GMT)
KorNAT: LLM Alignment Benchmark for Korean Social Values and Common Knowledge [23.2] KorNATは韓国と国家の整合性を測定する最初のベンチマークである。
社会価値データセットについて,6,174人の韓国人参加者を対象とした大規模調査から,基礎的真理ラベルを得た。
共通知識データセットについて,韓国の教科書とGED参照資料に基づくサンプルを構築した。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:39:13 GMT)
Intervention and Conditioning in Causal Bayesian Networks [23.2] 単純だが現実的な独立を仮定することで、介入公式の確率を推定できることを示す。
多くの場合、仮定が適切であれば、これらの確率推定は観測データを用いて評価することができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:55:38 GMT)
Explicitly Modeling Universality into Self-Supervised Learning [23.1] 自己教師型学習(SSL)における普遍性の理論的定義を提供する。
我々は、普遍性をSSLに明示的にモデル化する、GeSSLと呼ばれる一般的なSSLフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:06:24 GMT)
Online bipartite matching with imperfect advice [23.0] 本研究では, 学習強化手法が, 対向的到着モデルの下で1/2$-robustよりも厳密に優れた1-consistentと1-consistentの両方で成り立たないことを示す。
ランダム到着モデルでは,オンライン頂点に対する外部からのアドバイスを取り入れたアルゴリズムを設計するために,分散テストの手法を利用する方法を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:15:06 GMT)
Causal Effect Identification in a Sub-Population with Latent Variables [22.8] s-ID問題は、同じサブ集団に関する観測データから、特定のサブ集団における因果効果を計算しようとする。
本稿では,潜伏変数の存在を許容するs-ID問題の拡張について考察する。
潜伏変数を持つs-ID問題に対する音響アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:25:41 GMT)
Recurrent Early Exits for Federated Learning with Heterogeneous Clients [22.4] フェデレーテッド・ラーニング(FL)は、プライバシを保存する方法で、複数のクライアントにまたがるモデルの分散学習を可能にした。
FLの主な課題の1つは、クライアントに様々なハードウェア能力を持たせることである。
本稿では,異なるサブモデルの特徴を1つの共有分類器に融合するReeFLという早期終了手法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:01:53 GMT)
PoseCrafter: One-Shot Personalized Video Synthesis Following Flexible Poses [22.3] PoseCrafterは、フレキシブルポーズのコントロールに続くパーソナライズされたビデオ生成のためのワンショット方式である。
安定拡散と制御ネットに基づいて、我々は、高品質なビデオを生成するための推論プロセスを慎重に設計する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:53:50 GMT)
Translating Subgraphs to Nodes Makes Simple GNNs Strong and Efficient for Subgraph Representation Learning [22.1] Subgraph-To-Node (S2N) 翻訳は、サブグラフの表現を学習するための新しい定式化である。
S2N翻訳を用いた微調整モデルでは、最先端モデルよりも183-711倍のサブグラフサンプルを処理可能であることを実証した。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:00:02 GMT)
Grokked Transformers are Implicit Reasoners: A Mechanistic Journey to the Edge of Generalization [22.0] 我々は、トランスフォーマーがパラメトリック知識よりも暗黙的に推論できるかどうかを研究する。
我々は2つの代表的な推論タイプ、構成と比較に焦点を当てる。
トランスフォーマーは暗黙の推論を学習できるが、それはグルーキングでしか学べない。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:42:19 GMT)
Generating Less Certain Adversarial Examples Improves Robust Generalization [22.0] 本稿では,対人訓練における頑健なオーバーフィット現象を再考する。
我々は、敵の例を予測する際の過信が潜在的な原因であると主張している。
本稿では, モデルが予測するロジットの分散を, 逆数例で捉えた逆数確かさの形式的定義を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:15:47 GMT)
DreamScene4D: Dynamic Multi-Object Scene Generation from Monocular Videos [21.9] 本稿では,新しいビュー合成によるモノクロ映像から複数の物体の3次元動的シーンを生成するための最初のアプローチであるDreamScene4Dを紹介する。
私たちの重要な洞察は、ビデオシーンを背景とオブジェクトトラックに分解する"分解分解"アプローチです。
DAVIS, Kubric, 自撮りビデオについて, 定量的比較とユーザ嗜好調査を行った。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:27:11 GMT)
Synthetic Query Generation for Privacy-Preserving Deep Retrieval Systems using Differentially Private Language Models [21.7] 深層検索システムのトレーニングに先立って,クエリプライバシの確保を優先する手法を提案する。
提案手法では,DP言語モデル(LM)を用いて,元のデータを表すプライベートな合成クエリを生成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:53:39 GMT)
Towards Transferable Attacks Against Vision-LLMs in Autonomous Driving with Typography [21.6] Vision-Large-Language-Models (Vision-LLMs)は、自律走行(AD)システムに統合されつつある。
我々は,ビジョンLLMの意思決定能力に頼って,ADシステムに対するタイポグラフィー攻撃を活用することを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:52:02 GMT)
AnyLoss: Transforming Classification Metrics into Loss Functions [21.3] 評価指標は、バイナリ分類タスクにおけるモデルの性能を評価するために使用することができる。
ほとんどのメトリクスは、非微分可能形式の混乱行列から派生しており、直接最適化できる微分可能損失関数を生成することは困難である。
本稿では,任意の混乱行列に基づく計量を,最適化プロセスで利用可能な損失関数 textitAnyLoss に変換する汎用的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:14:16 GMT)
Exploring Prosocial Irrationality for LLM Agents: A Social Cognition View [21.3] 大規模言語モデル(LLM)は、人間のバイアスを頻繁に含んでいるデータのために幻覚に直面することが示されている。
幻覚特性を利用してLLMエージェントのソーシャルインテリジェンスを評価し,強化するオープンエンドマルチLLMエージェントフレームワークであるCogMirを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:13:33 GMT)
An Asymptotically Optimal Algorithm for the Convex Hull Membership Problem [21.3] 純粋な探査環境における凸船体構成問題について検討する。
我々はThompson-CHMというアルゴリズムを初めて提案し、そのモジュラー設計は停止規則とサンプリング規則から構成される。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:16:52 GMT)
Less but Better: Enabling Generalized Zero-shot Learning Towards Unseen Domains by Intrinsic Learning from Redundant LLM Semantics [21.3] 汎用ゼロショット学習(GZSL)は、ドメインシフト問題(DSP)に対する見知らぬクラスと見えないクラスを認識することに焦点を当てている。
我々は、GZSLに対処するクロスドメインGZSLのパイオニアである。
大規模言語モデル(LLM)を付加した冗長クラスセマンティクスによる情報非対称性問題を考えると,メタドメインアライメント・セマンティック・リファインメント(MDASR)を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:50:31 GMT)
Streamlining Redundant Layers to Compress Large Language Models [21.3] 本稿では,LLM-Streamlineについて紹介する。
異なる層が隠れた状態に様々な影響を与え、重要でない層を識別できるという観察に基づいている。
実験により,LLM-Streamlineは従来の最先端プルーニング法を精度と安定性の両方で上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:29:26 GMT)
E2E-MFD: Towards End-to-End Synchronous Multimodal Fusion Detection [21.2] マルチモーダル核融合検出のための新しいエンドツーエンドアルゴリズムであるE2E-MFDを紹介する。
E2E-MFDはプロセスの合理化を図り、単一のトレーニングフェーズで高いパフォーマンスを達成する。
複数の公開データセットに対する広範なテストは、E2E-MFDの優れた機能を明らかにします。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:23:49 GMT)
Large Language Models on Wikipedia-Style Survey Generation: an Evaluation in NLP Concepts [21.2] 大規模言語モデル(LLM)は、様々な一般的なタスクで大きな成功を収めた。
本研究では,コンピュータ科学におけるNLPのニッチ分野に特有な簡潔な調査項目を生成する上で,LCMsの有効性について検討する。
人間の評価スコアとGPTによる評価スコアを比較し,詳細な分析を行った。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:42:06 GMT)
Neural Collapse versus Low-rank Bias: Is Deep Neural Collapse Really Optimal? [21.1] ディープニューラルネットワーク(DNN)は、ニューラル崩壊(NC)と呼ばれる最終層に驚くべき構造を示す
多クラス分類において、任意の深さの非線形モデルに焦点をあて、驚くべき定性的シフトを明らかにする。
主な原因は、多層正規化スキームの低ランクバイアスである。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:55:49 GMT)
Can GPT-4 Replicate Empirical Software Engineering Research? [20.9] 我々は,GPT-4が実験ソフトウェア工学研究の複製を行う能力について検討した。
GPT-4は正しい仮定を導出できるが、ソフトウェア工学データに関する共通知識を応用した仮説を生成するのに苦労している。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:43:21 GMT)
Bounds for the smallest eigenvalue of the NTK for arbitrary spherical data of arbitrary dimension [20.4] ニューラル・タンジェント・カーネル(NTK)の最小固有値の境界は、ニューラルネットワークの最適化と記憶の解析において重要な要素である。
我々はヘミスフィア・トランスフォーメーションの新たな応用を通してその結果を証明した。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:36:52 GMT)
Video Diffusion Models are Training-free Motion Interpreter and Controller [20.4] 本稿では,映像拡散モデルにおける動き認識機能を理解し,ローカライズし,操作するための新しい視点を提案する。
コンテンツ相関情報とフィルタリング動作チャネルを除去し,MOFT(Motion FeaTure)を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:59:40 GMT)
SCMix: Stochastic Compound Mixing for Open Compound Domain Adaptation in Semantic Segmentation [20.3] オープン複合ドメイン適応(OCDA)は、ラベル付きソースドメインから未ラベルの同種化合物ターゲットドメインの混合に知識を伝達し、未確認ドメインを一般化することを目的としている。
既存のOCDA法は、分割・分散戦略によって領域内ギャップを解決し、この問題を複数の個別・並列領域適応(DA)タスクに分割する。
本稿では、ソースと混合ターゲット分布のばらつきを軽減するために、主目的の複合混合戦略(SCMix)を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:53:10 GMT)
On the Limitations of General Purpose Domain Generalisation Methods [20.2] 本稿では,いくつかのドメイン一般化(DG)設定における学習アルゴリズムの基本的な性能制限について検討する。
従来提案手法が経験的リスク最小化(ERM)を確実に上回っている難しさから,ERMの過大なリスクと最小限の過大なリスクの上限を導出する。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:36:11 GMT)
Seeing is not always believing: The Space of Harmless Perturbations [20.1] 入力に印加した場合、ネットワークの出力が変化しない無害な摂動空間が存在することを示す。
我々の研究は、敵対的な例とは対照的に、ディープニューラルネットワーク(DNN)の独特な堅牢性を強調している。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:54:05 GMT)
From Fourier to Neural ODEs: Flow Matching for Modeling Complex Systems [20.0] ニューラル常微分方程式(NODE)を学習するためのシミュレーション不要なフレームワークを提案する。
フーリエ解析を用いて、ノイズの多い観測データから時間的および潜在的高次空間勾配を推定する。
我々の手法は、トレーニング時間、ダイナミクス予測、堅牢性の観点から、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:27:10 GMT)
ZipCache: Accurate and Efficient KV Cache Quantization with Salient Token Identification [20.0] KVキャッシュは、再計算を避けるために、以前のトークンからキーと値の状態を格納する。
KVキャッシュ圧縮はトークンの正当性を識別し、重要でないトークンを積極的に圧縮しながら重要な情報を保存する。
LLMの高精度かつ効率的なKVキャッシュ量子化手法ZipCacheを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:37:16 GMT)
3D Learnable Supertoken Transformer for LiDAR Point Cloud Scene Segmentation [19.9] 本稿では, 3D Learnable Supertoken Transformer (3DLST) という新しい3Dトランスフレームワークを提案する。
3DLSTは、一般的なU-net設計ではなく、新しいW-netアーキテクチャを備えている。
アルゴリズムの効率は従来の最高の性能の手法よりも最大5倍高速である。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:41:15 GMT)
RET-CLIP: A Retinal Image Foundation Model Pre-trained with Clinical Diagnostic Reports [19.9] Vision-Language Foundationモデルは、コンピュータビジョンと自然言語処理の分野でますます研究されている。
この問題に対処するために,CLIP型網膜画像基盤モデルを開発した。
我々の基礎モデルであるRET-CLIPは、カラーファンドスの一般的な特徴を抽出するために、193,865人の患者のデータセットで特別に訓練されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:20:51 GMT)
TimeMixer: Decomposable Multiscale Mixing for Time Series Forecasting [19.9] 時系列予測は、交通計画や天気予報などのアプリケーションで広く使われている。
TimeMixerは、長期および短期の予測タスクにおいて、一貫した最先端のパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:27:07 GMT)
Survey on Visual Signal Coding and Processing with Generative Models: Technologies, Standards and Optimization [19.9] この調査は、VAEモデル、GANモデル、自己回帰(AR)モデル、正規化フロー、拡散モデルなど、確立された生成モデルの簡単な導入から始まる。
また、生成モデルを用いた視覚信号品質評価と生成モデルの品質評価とともに、生成的視覚信号合成と編集の最新の展開を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:32:27 GMT)
Heteroscedastic Preferential Bayesian Optimization with Informative Noise Distributions [19.8] 本研究では,不確実性を捉えるヘテロスセダスティックノイズモデルを提案する。
そのようなモデルは、取得関数にシームレスに統合することができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:55:18 GMT)
SSUMamba: Spatial-Spectral Selective State Space Model for Hyperspectral Image Denoising [19.8] 本稿では,空間スペクトル選択状態モデルに基づくU字型ネットワークである空間スペクトルU-Mambaを提案する。
本研究では,複数方向の連続的な情報フローを活用するための空間スペクトル交互ジグザグスキャン(SSAZS)戦略を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:47:33 GMT)
Efficient Point Transformer with Dynamic Token Aggregating for Point Cloud Processing [19.7] ポイントクラウド表現と処理のための動的トークン集約(DTA-Former)を用いた効率的なポイントトランスフォーマーを提案する。
ModelNet40、ShapeNet、航空機搭載MultiSpectral LiDAR(MS-LiDAR)データセット上の前点変換器よりも最大30$times$高速でSOTAパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:50:50 GMT)
Large Language Models as Urban Residents: An LLM Agent Framework for Personal Mobility Generation [19.6] 本稿では,Large Language Models (LLMs) をエージェントフレームワークに統合した,個人用モビリティ生成のための新しいアプローチを提案する。
本研究は,LLMと実際の都市モビリティデータとの整合性,信頼性の高い活動生成戦略の開発,都市モビリティにおけるLLM応用の探索という3つの研究課題に対処する。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:30:23 GMT)
Efficient Multitask Dense Predictor via Binarization [19.5] 資源集約型マルチタスク密度予測器を圧縮するために,ネットワークバイナライゼーションを導入する。
両立マルチタスクDense Predictor, Bi-MTDP, およびいくつかの種類のBi-MTDPを提案する。
Bi-MTDPの1つの変種は、フル精度(FP)マルチタスク密度予測SoTA、ARTC(CNNベース)、InvPT(ViTベース)より優れている
論文参考訳(メタデータ) (Thu, 23 May 2024 03:19:23 GMT)
Synergy-of-Thoughts: Eliciting Efficient Reasoning in Hybrid Language Models [19.5] 大規模言語モデル(LLM)は、幅広いタスクにおいて驚くべき創発的能力を示してきたが、複雑な推論問題に対処する上ではまだ課題に直面している。
人間の認知の二重過程理論に触発され,効率的な推論のためにハイブリッドLLMの相乗的ポテンシャルを解き放つために,SoT(Synergy of Thoughts)を提案する。
SoTはトークンのコストを38.3%-75.1%削減し、最先端の推論精度と解の多様性を同時に達成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:20:53 GMT)
NeuroGauss4D-PCI: 4D Neural Fields and Gaussian Deformation Fields for Point Cloud Interpolation [19.3] 補間は、点の空間性、複雑な時間的ダイナミクス、そして、疎度な時間的情報から完全な3次元点雲を導出することの難しさから課題に直面している。
本稿では,様々な動的シーンにまたがる複雑な非剛性変形のモデル化に優れるNeuroGauss4D-corruptを提案する。
NeuroGauss4D-corruptは、オブジェクトレベルのタスクと大規模自律運転データセットの両方で、主要なパフォーマンスを提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:21:01 GMT)
Knowledge Localization: Mission Not Accomplished? Enter Query Localization! [19.2] 知識ニューロン(KN)理論は、これらのメカニズムを説明するための顕著な理論である。
我々は、知識ローカライゼーション(KL)の仮定を再検討し、統計的および知識修正の観点から、それに準拠しない事実の存在を確認する。
そこで本研究では,知識修正の性能を向上させるConsistency-Aware KN修飾法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:44:12 GMT)
On the Computational Complexity of Private High-dimensional Model Selection [19.0] プライバシー制約下での高次元疎線形回帰におけるモデル選択の問題点を考察する。
そこで本研究では,よく知られた指数モデルを用いて,高い効用性を有する微分プライベートなベストサブセット選択法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:19:26 GMT)
Imagery as Inquiry: Exploring A Multimodal Dataset for Conversational Recommendation [18.9] このデータセットはタイトル生成と複数選択という2つの推奨タスクをサポートする。
本稿では,画像の連鎖的プロンプトを提案し,その結果,顕著な改善が得られた。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:36:31 GMT)
A Cascade Dual-Decoder Model for Joint Entity and Relation Extraction [18.7] 重なり合う三重項を抽出する効果的なカスケード二重復号器法を提案する。
我々のアプローチは単純であり、テキスト固有の関係デコーダと関係対応エンティティデコーダを含んでいる。
提案手法の一般化性を検証するために,実世界の露天採掘データセットと2つの公開データセットについて実験を行った。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:56:15 GMT)
Small Language Models for Application Interactions: A Case Study [18.7] 本研究では,Small Language Models (SLM) の有効性について検討した。
我々の実験では、小さなデータセットを微調整しても、精度と実行時間の両方において、小さなモデルの方がはるかに大きなモデルより優れていることが示された。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:33:32 GMT)
Detecting AI-Generated Sentences in Human-AI Collaborative Hybrid Texts: Challenges, Strategies, and Insights [18.3] 本研究では,人間-AI協調テキストにおける文レベルAI生成テキスト検出の課題について検討する。
CoAuthorデータセットには、人間のライターとインテリジェントな書き込みシステムとのコラボレーションを通じて生成される、多様な、現実的なハイブリッドテキストが含まれている。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:18:33 GMT)
Panacea: Pareto Alignment via Preference Adaptation for LLMs [18.3] Panaceaは、多次元の選好最適化問題としてアライメントを再構築する革新的なアプローチである。
主要な課題は、モデルの振舞いを導くために低次元の嗜好ベクトルを使うことである。
パナセアは特異値分解(SVD)に基づく低ランク適応を使用するように設計されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:49:25 GMT)
Learning Multi-dimensional Human Preference for Text-to-Image Generation [18.1] テキスト・ツー・イメージ・モデル評価のための最初の多次元選好スコアモデルである多次元選好スコア(MPS)を提案する。
MPSはCLIPモデルに設定条件モジュールを導入し、これらの様々な好みを学習する。
MHP(Multi-dimensional Human Preference)データセットに基づいて,4次元にわたる918,315人の選好選択をトレーニングする。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:39:43 GMT)
A Generative Framework for Self-Supervised Facial Representation Learning [18.1] 自己教師付き表現学習は、ペア化されたデータセットに頼ることなく、強力な一般化能力に注目されるようになった。
自己監督型顔表現学習は、顔のアイデンティティ、表情、ポーズや光といった外部要因の結合により未解決のままである。
自己教師型顔表現のための新しい生成フレームワークであるLatentFaceを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:40:07 GMT)
O$n$ Learning Deep O($n$)-Equivariant Hyperspheres [18.0] 我々は、$n$Dの反射と回転の変換の下で、深い特徴同変を学習するためのアプローチを提案する。
すなわち、任意の次元$n$に一般化する球面決定曲面を持つ O$(n)$-同変ニューロンを提案する。
我々は理論的貢献を実験的に検証し、O$(n)$-equivariantベンチマークデータセットの競合する手法よりもアプローチの方が優れていることを発見した。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:17:15 GMT)
PhyloLM : Inferring the Phylogeny of Large Language Models and Predicting their Performances in Benchmarks [17.9] 本稿では,Large Language Models(LLMs)に系統解析アルゴリズムを適用するPhyloLMを紹介する。
本手法は, LLMの出力の類似性に基づいて, 系統的距離の指標を算出する。
我々の系統的距離は標準ベンチマークの性能を予測し,その機能的妥当性を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:03:29 GMT)
Enhanced Spatiotemporal Prediction Using Physical-guided And Frequency-enhanced Recurrent Neural Networks [17.9] 本稿では,時空間力学を推定する物理誘導型ニューラルネットワークを提案する。
また、物理状態をより正確にモデル化するための物理制約付き適応二階ルンゲ・クッタ法を提案する。
我々のモデルは最先端の手法より優れ、より少ないパラメータ数でデータセットで最高の性能を発揮する。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:39:49 GMT)
Reinforcement Learning for Fine-tuning Text-to-speech Diffusion Models [17.8] 人間のフィードバックによる強化学習は、画像合成のための拡散モデルを強化することができる。
本稿では、損失誘導型RLポリシー最適化(DLPO)を導入し、他のRLHF手法と比較する。
以上の結果から,RLHFは拡散に基づく音声合成モデルを向上させることができることがわかった。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:39:35 GMT)
PTA: Enhancing Multimodal Sentiment Analysis through Pipelined Prediction and Translation-based Alignment [17.7] マルチモーダル・アスペクトベース感情分析(MABSA)は、意見のきめ細かい理解を目的としている。
伝統的に、MABSA法は側面と感情を同時に識別するために共同予測手法を用いている。
本稿では、まずその側面を予測し、次に翻訳に基づくアライメント(TBA)を用いて、画像利用を改善するためにマルチモーダルなセマンティック一貫性を向上させるパイプラインフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:16:45 GMT)
Provably Efficient Reinforcement Learning for Infinite-Horizon Average-Reward Linear MDPs [17.7] 我々は、$widetildeO(sqrtT)$ regret を用いて、無限水平平均逆線形マルコフ決定過程(MDP)に対する計算効率のよいアルゴリズムを設計するというオープンな問題を解決した。
割引設定を学習するための楽観的な反復型アルゴリズムを実行すると、割引係数$gamma$が適切に調整された場合、$widetildeO(sqrtT)$ regretが得られることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:58:33 GMT)
Adaptive Interventions with User-Defined Goals for Health Behavior Change [17.7] モバイルヘルスアプリケーションは、低コストでスケーラブルなヘルス行動変化促進のための有望な道を示す。
個人固有の目標、好み、生活状況に対するアドバイスを調整することは、健康コーチングの重要な要素である。
パーソナライズされた報酬関数に対応する新しいトンプソンサンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:56:04 GMT)
Improving Single Domain-Generalized Object Detection: A Focus on Diversification and Alignment [17.5] 基底検出器は、単一領域の一般化のための既存の手法を良いマージンで上回ることができる。
分類と局所化の両方の出力を考慮して,複数のビューから検出を整列する手法を提案する。
我々のアプローチは検出器非依存であり、単段検出器と二段検出器の両方にシームレスに適用できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:29:25 GMT)
Consistent Validation for Predictive Methods in Spatial Settings [17.4] 空間予測タスクは 天気予報や大気汚染の研究 その他の科学的取り組みの鍵です
検証のための古典的なアプローチでは、バリデーションで利用可能な場所と、予測したい場所(テスト)の間のミスマッチを処理できません。
我々は、検証データが任意に密になるにつれて、検証が任意に正確になる検証方法を定式化する。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:52:36 GMT)
HyenaPixel: Global Image Context with Convolutions [17.4] コンボリューションに基づくアテンション置換であるHyenaを、因果配列から双方向データ、二次元画像空間まで拡張する。
画像分類において、HyenaPixelと双方向Hyenaは、それぞれ84.9%と85.2%の競合するImageNet-1kトップ1の精度を達成した。
両方向ハイエナの成功は、固定された近傍定義を使わずに、データ依存の幾何学的配置を学習することによるものである。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:32:56 GMT)
Fast Denoising Diffusion Probabilistic Models for Medical Image-to-Image Generation [17.3] 我々は,トレーニング速度,サンプリング速度,生成品質を同時に向上する,シンプルで効果的なアプローチであるFast-DDPMを紹介した。
1000のタイムステップでイメージデノイザを訓練するDDPMとは異なり、Fast-DDPMは10のタイムステップのみを使用する。
DDPMはDDPMに比べてトレーニング時間を5倍に短縮し,サンプリング時間を100倍に短縮した。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:12:22 GMT)
Minimax-Optimal Reward-Agnostic Exploration in Reinforcement Learning [17.2] 本稿では,強化学習(RL)における報酬非依存探索について検討する。
S$状態、$A$作用、および水平長$H$を持つ有限水平不均一決定過程を考える。
我々のアルゴリズムは任意の数の報酬関数に対して$varepsilon$精度を得ることができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:16:25 GMT)
FreeTuner: Any Subject in Any Style with Training-free Diffusion [17.2] FreeTunerは、フレキシブルでトレーニングのない、作曲のパーソナライズのためのメソッドで、任意のユーザが提供する対象を、ユーザが提供するスタイルで生成することができる。
提案手法では, 生成過程を2段階に分けて, 概念の絡みを効果的に緩和する。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:01:13 GMT)
Pragmatic Feature Preferences: Learning Reward-Relevant Preferences from Human Input [17.1] より正確な報酬モデルを学ぶのに有用な例が好まれる理由について,より詳細なデータを抽出する方法を検討する。
本研究は, 実用的特徴嗜好を取り入れることが, より効率的なユーザ適応型報酬学習に有望なアプローチであることが示唆された。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:36:16 GMT)
Amortized Variational Inference: When and Why? [17.1] 償却変分推論(A-VI)は共通の推論関数を学習し、各観測結果を対応する潜伏変数の近似後方にマッピングする。
A-VI が F-VI の最適解を得るために必要で十分かつ検証可能な潜在変数モデル上で条件を導出する。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:36:50 GMT)
GOTCHA: Real-Time Video Deepfake Detection via Challenge-Response [17.1] 本稿では,ライブ環境での信頼性を確立するための課題応答手法を提案する。
本稿では,RTDF生成パイプラインに固有の制約を特に対象とする課題の分類について述べる。
この結果は、説明可能でスケーラブルなリアルタイムディープフェイク検出のためのチャレンジ応答システムの有望な可能性を示している。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:00:04 GMT)
Multistable Shape from Shading Emerges from Patch Diffusion [17.1] 単一シェーディング画像から形状のマルチモーダル分布を再構成するモデルを提案する。
本研究では,このモデルから「あいまいな」テスト画像に対して,マルチスタブルな形状説明が現れることを示す。
これは、3D形状の知覚のための新しいアーキテクチャを刺激し、より効率的で、人間の体験に合わせたものになるかもしれない。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:15:24 GMT)
From Identifiable Causal Representations to Controllable Counterfactual Generation: A Survey on Causal Generative Modeling [17.1] 基本的な理論、方法論、欠点、データセット、メトリクスに重点を置いています。
フェアネス、プライバシ、アウト・オブ・ディストリビューションの一般化、精密医療、生物科学における因果生成モデルの応用について述べる。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:59:29 GMT)
Synergizing Spatial Optimization with Large Language Models for Open-Domain Urban Itinerary Planning [17.1] ItiNeraはOUIPシステムで、自然言語で記述されたユーザリクエストから、パーソナライズされた都会のイテレーションを生成する。
我々の知る限り、本研究はLCMを初めて統合し、反復計画の革新を図ったものである。
オンラインプラットフォーム上にデプロイされた当社のシステムは,都市旅行計画のために何千人ものユーザを惹きつけている。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:24:00 GMT)
Direct Preference Optimization With Unobserved Preference Heterogeneity [16.9] 本稿では,生成モデルと人間の嗜好を一致させる新しい手法を提案する。
そこで我々はDPOに対する期待最大化適応を提案し、アノテータの潜在選好型に基づくモデルの混合を生成する。
我々のアルゴリズムはDPOの単純さを生かし、多様な好みを調節する。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:25:20 GMT)
Learning Geospatial Region Embedding with Heterogeneous Graph [16.9] 様々な下流タスクに対する包括的領域埋め込みを学習するための有効なヘテロジニアスグラフ構造であるGeoHGを提案する。
具体的には、地理的領域分割とPOI(point-of-interest)統合による衛星画像表現学習を、表現的地域内特徴のために調整する。
GeoHGは情報的空間依存性と社会環境特性を強力なヘテロジニアスグラフに統合し、高次の地域間関係の明示的なモデリングを促進する。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:19:02 GMT)
Recursive PAC-Bayes: A Frequentist Approach to Sequential Prior Updates with No Information Loss [16.8] PAC-Bayesian分析は、事前知識を学習に組み込むための頻繁なフレームワークである。
我々は,情報損失のない逐次的事前更新を可能にする,驚くほどシンプルで強力なPAC-Bayesianプロシージャを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:15:17 GMT)
Bayesian Adaptive Calibration and Optimal Design [16.8] 現在の機械学習アプローチは、主に観測データで利用可能な固定された設計セットに対する再実行シミュレーションに依存している。
本稿では,バッチシーケンスプロセス内で最大情報化シミュレーションを実行するためのデータ効率アルゴリズムを提案する。
合成問題と実データ問題にまたがる関連手法と比較して,本手法の利点を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:14:35 GMT)
FinRobot: An Open-Source AI Agent Platform for Financial Applications using Large Language Models [16.8] FinRobotは、複数の金融専門のAIエージェントをサポートする、オープンソースのAIエージェントプラットフォームである。
FinRobotは、高度な財務分析に強力なAI技術を利用するために、プロ級のアナリストとレイパーの両方にハンズオンを提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:35:20 GMT)
Ferrari: Federated Feature Unlearning via Optimizing Feature Sensitivity [16.8] 連邦学習(FL)の出現は、すべての顧客にとって「忘れられる権利」の実践的な必要性を強調している。
未学習のセンシティブな機能、バックドア機能、バイアス機能などに応用されているため、フィーチャーアンラーニングは大きな注目を集めている。
既存の手法では、非学習プロセスにおいて他のクライアントの参加を必要とするため、FLでは現実的ではない機能非学習を実現するために影響関数を採用している。
本稿では,フェラーリと呼ばれる機能非学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:20:45 GMT)
K-band: Self-supervised MRI Reconstruction via Stochastic Gradient Descent over K-space Subsets [16.8] 我々はkバンドと呼ばれる新しい数学的枠組みを導入し、部分的かつ限定的なk空間データのみを用いてDLモデルを訓練する。
各トレーニングイテレーションでは、完全にサンプリングされたk-空間を勾配を計算する代わりに、小さなk-空間の部分のみを使用する。
生MRIデータを用いた数値実験により、kバンドは限定分解能データで訓練された他の2つの方法より優れていることが示された。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:27:41 GMT)
$T^2$ of Thoughts: Temperature Tree Elicits Reasoning in Large Language Models [16.7] 大規模言語モデル(LLM)は人工知能、特に複雑な意思決定シナリオにおいて強力なツールとして登場した。
粒子群最適化による温度木(T2$)によるLCMの推論能力の向上について検討する。
温度に基づく動的探索深度調整は混合結果が得られるが,T2oT$の適応能力と組み合わせた固定探索深度は,より信頼性が高く,汎用的な問題解決戦略をもたらすことが示唆された。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:40:43 GMT)
AnomalyDINO: Boosting Patch-based Few-shot Anomaly Detection with DINOv2 [16.7] DINOv2をワンショットおよび数ショットの異常検出に適用し、産業応用に焦点をあてる。
提案するビジョンのみのアプローチであるAnomalyDINOは,パッチの類似性に基づいて,画像レベルの異常予測と画素レベルの異常セグメンテーションの両方を可能にする。
その単純さにもかかわらず、AnomalyDINOは1発と数発の異常検出(例えば、MVTec-ADの1発のパフォーマンスを93.1%から96.6%まで押し上げる)で最先端の結果を達成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:15:13 GMT)
Eidos: Efficient, Imperceptible Adversarial 3D Point Clouds [16.6] Eidosは、3D pOintクラウドSに対して効果的な非受容性アディバーサリアルアタックを提供するフレームワークである。
本稿では,3次元pOintクラウドSに対して,効率的な非知覚的アディバーサリアルアタックを提供するフレームワークであるEidosを提示することで,敵攻撃の理解を深める。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:09:08 GMT)
Optimize Weight Rounding via Signed Gradient Descent for the Quantization of LLMs [16.6] SignRoundは、符号付き勾配降下(SignSGD)を使用して、200ステップ以内のラウンド値とウェイトクリッピングを最適化する手法である。
2ビットから4ビットにわたる例外的な結果を達成すると同時に、チューニングコストの低減と、追加の推論オーバーヘッドの回避を実現している。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:43:09 GMT)
Characterization of Nearly Self-Orthogonal Quasi-Twisted Codes and Related Quantum Codes [16.6] この構造は、ほぼ自己直交符号を用いて量子安定化器符号を設計する。
得られた量子符号の最小距離における洗練された下界が確立される。
更新されたオンラインデータベースに含められたランダムな検索から、多数の記録破りの量子コードを報告した。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:10:23 GMT)
Camera Relocalization in Shadow-free Neural Radiance Fields [16.4] カメラのリローカライゼーションはコンピュータビジョンとロボティクスにおいて重要な問題である。
ニューラルレイディアンスフィールド(NeRF)の最近の進歩は、フォトリアリスティック画像において有望であることを示している。
照明条件や影条件の異なる画像を正規化してカメラ再配置を改善する2段パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:41:15 GMT)
Flexible Motion In-betweening with Diffusion Models [16.3] 比較によって導かれる多様な人間の動きを生成する際の拡散モデルの可能性について検討する。
従来のインベントワイニング法とは異なり、精密かつ多様な動作を生成できる単純な統一モデルを提案する。
テキスト条件付きHumanML3Dデータセット上でのCondMDIの性能を評価する。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:23:39 GMT)
Scalable Visual State Space Model with Fractal Scanning [16.1] State Space Models (SSM) はTransformerモデルの効率的な代替品として登場した。
本稿では, フラクタル走査曲線を用いたパッチシリアライゼーションを提案する。
画像分類,検出,セグメンテーションタスクにおいて,本手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:12:11 GMT)
CLIPScope: Enhancing Zero-Shot OOD Detection with Bayesian Scoring [16.1] ゼロショットOOD検出手法であるCLIPScopeを導入する。
CLIPScopeは、大きな語彙データベースからOODクラスをマイニングするための新しい戦略を取り入れている。
OODサンプルのカバレッジを最大化するために、CLIP埋め込み距離の観点から、最も多く、最もIDクラスに最も近いクラスラベルを選択する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:03:55 GMT)
Amortized nonmyopic active search via deep imitation learning [16.0] アクティブ検索は、希少で価値のあるクラスのメンバを集めることを目標とする、特別なアクティブな学習環境を形式化する。
本稿では,ニューラルネットワークをトレーニングして検索学習を行うことにより,このポリシーの償却について検討する。
我々のネットワークは、合成データに基づいて訓練され、非神秘的な決定をもたらす有益な探索戦略を学習する。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:10:29 GMT)
Exploring Alignment in Shared Cross-lingual Spaces [16.0] 多言語モデル内の潜在概念を明らかにするためにクラスタリングを採用しています。
本分析は,これらの概念のテキストアライメントとテキストオーバーラップを様々な言語で定量化することに焦点を当てている。
本研究は、3つの多言語モデル(textttmT5, texttmBERT, textttXLM-R)と3つの下流タスク(Machine Translation, Named Entity Recognition, Sentiment Analysis)を含む。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:20:24 GMT)
Causal Bayesian Optimization via Exogenous Distribution Learning [15.8] 既存の因果ベイズ最適化(CBO)法は、報酬を最大化するために因果構造を変更するハード介入に依存する。
学習内因性分布を利用した新しいCBO法を開発した。
異なるデータセットとアプリケーションの実験により,提案手法の利点が示された。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:32:02 GMT)
Which Experiences Are Influential for RL Agents? Efficiently Estimating The Influence of Experiences [15.8] 経験的なリプレイを伴う強化学習(RL)では、リプレイバッファに格納された経験がRLエージェントのパフォーマンスに影響を与える。
経験の影響を推定する1つの方法は、LOO法である。
ターンオーバー・ドロップアウト(PIToD)によるポリシー・イテレーションを行い,経験の影響を効率的に推定する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:35:56 GMT)
Can multiple-choice questions really be useful in detecting the abilities of LLMs? [15.8] 大規模言語モデル(LLM)の評価には,MCQ(Multiple-choice Question)が広く用いられている。
課題と評価方法のミスアライメントは,MCQの有効性の思慮深い分析を必要とする。
質問応答(QA)データセットを中国語と英語の2言語で評価した。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:32:25 GMT)
PhiNets: Brain-inspired Non-contrastive Learning Based on Temporal Prediction Hypothesis [15.7] 本研究では,時間的予測仮説に基づく海馬モデルにインスパイアされたPhiNetを提案する。
PhiNetは、海馬のCA1領域を模倣するために、元の画像表現を推定する追加の予測ブロックを統合する。
我々は,学習表現の完全崩壊を防止するために,PhiNetが追加の予測器から得られる学習ダイナミクスを分析して実演する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:50:59 GMT)
Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence [15.7] リスクに敏感な強化学習(RL)は、高い評価のアプリケーションにおいて信頼性の高い性能を維持するために不可欠である。
本稿では、一般的なコヒーレントリスク対策を用いたリスク感応型DRLのポリシー勾配法を提案する。
また、カテゴリー分布ポリシー評価と軌道勾配推定に基づくカテゴリー分布ポリシー勾配アルゴリズム(CDPG)を設計する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:16:58 GMT)
Efficient Certificates of Anti-Concentration Beyond Gaussians [15.7] この研究は、反濃縮のための新しい(そしておそらく最も自然な)定式化を提示する。
非ガウス分布の幅広いクラスを保った反集中の正方形証明を検証できる準多項式時間を与える。
提案手法は,意図された応用とは無関係に,正準2乗緩和の反集中と解析のための正準整数プログラムを構築する。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:13:44 GMT)
Reprompting: Automated Chain-of-Thought Prompt Inference Through Gibbs Sampling [15.6] Repromptingは、人間の介入なしに与えられたタスクに対するCoT(Chain-of-Thought)レシピを自動的に学習する反復サンプリングアルゴリズムである。
我々は20の挑戦的推論タスクについて広範な実験を行った。
その結果、Repromptingは人間によるCoTのプロンプトを平均で+9.4ポイント上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:23:12 GMT)
Identifying Breakdowns in Conversational Recommender Systems using User Simulation [15.5] 本稿では,会話のブレークダウンに関して,会話レコメンデーションシステムをテストする手法を提案する。
システム間で発生した会話を調べ、事前に定義されたブレークダウンタイプに対してユーザをシミュレートする。
提案手法を既存の会話レコメンデータシステムとユーザシミュレータを用いたケーススタディに適用し,ほんの数イテレーションで,会話のブレークダウンに対してシステムをより堅牢にすることができることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:28:26 GMT)
Min-K%++: Improved Baseline for Detecting Pre-Training Data from Large Language Models [15.5] 我々はMin-K%++という名前の事前学習データ検出のための新しい理論的動機付け手法を提案する。
具体的には,各入力次元に沿ったモデル分布の局所的な最大値であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:06:49 GMT)
A New Method in Facial Registration in Clinics Based on Structure Light Images [15.5] 神経外科では、情報と詳細を改善するための臨床画像と深度画像の融合が手術に有用である。
既存の方法では,顔深度画像の登録が頻繁に無効であることが判明した。
我々は,顔認識に使用可能なC++ライブラリであるdlibライブラリを使用し,構造光カメラとCT画像から顔のキーポイントを認識した。
新たな手法は, 構造光画像とCT画像から低誤差で顔深度画像の登録に成功した。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:10:09 GMT)
Automated Loss function Search for Class-imbalanced Node Classification [15.4] クラス不均衡ノード分類タスクは、現実世界のシナリオで一般的である。
この課題に対処するために,高性能でフレキシブルで汎用的な自動損失関数探索フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:12:49 GMT)
Enhanced Object Tracking by Self-Supervised Auxiliary Depth Estimation Learning [15.4] MDETrackと呼ばれる新しい手法を提案する。この手法は,シーンの深度を理解するための追加機能を備えたトラッキングネットワークを訓練する。
その結果,実際の深度を伴わずとも追跡精度が向上した。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:43:38 GMT)
A structure-aware framework for learning device placements on computation graphs [15.3] 本稿では,OpenVINOツールキットから抽出したより小さなグラフに頼って,デバイス配置作業のための新しいフレームワークを提案する。
このフレームワークは、グラフの粗大化、ノード表現学習、ポリシー最適化を含む5つのステップで構成されている。
3つのベンチマークモデルを用いた複数の実験により,提案手法の柔軟性と有効性を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:29:29 GMT)
Multi-view Remote Sensing Image Segmentation With SAM priors [15.1] リモートセンシングにおけるマルチビューセグメンテーションは、シーン内の様々な視点から画像を分割することを目指している。
近年の手法では、インプシットニューラルネットワーク(INF)から抽出した3次元情報を活用し、複数のビューにまたがって結果の整合性を高めている。
本稿では,視覚基盤モデル-Segment Anything (SAM) の先行を INF に注入し,限られたトレーニングデータ量でより良い結果を得る方法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:57:41 GMT)
A Gap in Time: The Challenge of Processing Heterogeneous IoT Point Data in Buildings [15.1] 持続可能なエネルギーソリューションの必要性は、デジタル化された建物を電力網に統合するきっかけとなった。
エネルギー管理のためのディープラーニングフレームワークにIoTポイントデータを組み込むことは、複雑な課題である。
本稿では,実世界のIoTデータストリーム構築における多面的不均一性を包括的に分析する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:45:48 GMT)
What Variables Affect Out-Of-Distribution Generalization in Pretrained Models? [15.0] トレーニング済みのディープニューラルネットワーク(DNN)によって生成された埋め込みは広く使用されているが、下流タスクに対する効果は様々である。
トンネル効果仮説のレンズによるプレトレーニングDNN埋め込みの分布外一般化に影響を与える要因について検討した。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:43:45 GMT)
Investigation of Customized Medical Decision Algorithms Utilizing Graph Neural Networks [15.0] 本稿では,グラフニューラルネットワーク(GNN)を用いた個人化医療意思決定アルゴリズムを提案する。
提案アルゴリズムは, 疾患予測精度, 治療効果評価, 患者リスク階層化の点で, 高い性能を示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:30:41 GMT)
How Do Transformers "Do" Physics? Investigating the Simple Harmonic Oscillator [15.0] 物理学における最も基本的なシステムの一つである単純高調波発振器(SHO)について検討する。
我々は変換器がSHOをモデル化するために使用する手法を特定し、それらの手法の中間体の符号化を解析することにより、可能な手法を仮説化し評価する。
解析フレームワークは高次元線形系や非線形系に便利に拡張でき、変換器に隠された「世界モデル」を明らかにするのに役立ちたい。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:14:22 GMT)
A First Look at GPT Apps: Landscape and Vulnerability [14.9] 本研究は,2つのGPTアプリストアである textitGPTStore.AI と公式 textitOpenAI GPT Store に焦点を当てた。
具体的には、2つの自動ツールとTriLevel構成抽出戦略を開発し、これら2つのストアにまたがる全GPTアプリのメタデータを効率的に収集する。
1) GPTアプリのユーザへの熱意は一貫して上昇し, 2) GPTアプリのローンチから3ヶ月以内にクリエーターの関心高原が増加し, (2) GPTアプリの構成が不安定なため,システムプロンプトの90%近くが容易にアクセス可能である。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:30:02 GMT)
Nuclear Norm Regularization for Deep Learning [14.8] 深層学習に適した手法を用いて,ジャコビアン核規範を効果的に適用する方法を示す。
提案手法は単純,効率的,高精度であり,ヤコビアン核の正規化を高次元深層学習問題に拡張することができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:24:38 GMT)
P4Control: Line-Rate Cross-Host Attack Prevention via In-Network Information Flow Control Enabled by Programmable Switches and eBPF [14.8] P4Controlは、ネットワーク内のエンド・ツー・エンドの情報フローを制限し、ラインレートでのクロスホスト攻撃を防ぐネットワーク防御システムである。
我々は、P4Controlがクロスホスト攻撃を効果的にリアルタイムに防ぐことができることを示すため、広範囲な評価を行う。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:19:10 GMT)
A New Formulation for Zeroth-Order Optimization of Adversarial EXEmples in Malware Detection [14.8] ゼロオーダー最適化フレームワークでマルウェア検出を学習する方法を示す。
我々は、Windows マルウェア検出に対するゼロオーダー攻撃である ZEXE を提案し、研究する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:01:36 GMT)
Drones Help Drones: A Collaborative Framework for Multi-Drone Object Trajectory Prediction and Beyond [14.6] 協調軌道予測は、多視点補完情報を通して、オブジェクトの将来の動きを包括的に予測することができる。
本研究では,精密なバードアイビュー表現を生成するために,DHD(Drones Help Drones)という新しいフレームワークを提案する。
DHDは、BEV表現における位置ずれを20%以上削減し、相互作用の伝達比の4分の1しか必要としない。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:11:23 GMT)
Co-Representation Neural Hypergraph Diffusion for Edge-Dependent Node Classification [14.5] ENCでは、ノードは異なるハイパーエッジに異なるラベルを持つことができ、単一のノードやハイパーエッジの代わりにノードとハイパーエッジのペアをモデル化する必要がある。
このタスクの既存のソリューションはメッセージパッシングに基づいており、マルチインプット単一出力関数として、エッジ内およびノード内相互作用をモデル化する。
我々はハイパーグラフ拡散に基づく新しいソリューションであるCoNHDを開発した。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:01:25 GMT)
GFFE: G-buffer Free Frame Extrapolation for Low-latency Real-time Rendering [14.5] 我々は、新しいフレームワークと効率的なニューラルネットワークを備えたGFFEを提案し、追加のレイテンシを導入することなく、新しいフレームをリアルタイムで生成する。
動的フラグメントと異なる種類の非閉塞の運動を分析し、対応するモジュールを設計する。
排他物を充填した後、遮蔽補正網を用いて遮蔽を補正し、全体的な品質を改善する。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:35:26 GMT)
Conformal Validity Guarantees Exist for Any Data Distribution [14.4] 理論上,共形予測はテキスト共同データ分布に拡張可能であることを示す。
実践的な応用として、任意のデータ分布に対して特定の共形アルゴリズムを導出する手順を概説する。
提案アルゴリズムは,合成ブラックボックス最適化とアクティブ学習タスクを実証的に評価する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:34:14 GMT)
Unraveling overoptimism and publication bias in ML-driven science [14.4] 本稿では,パラメトリック学習曲線と上記のバイアスを統合することで,観測精度の新たなモデルを提案する。
次に、このモデルに基づいて、観測データ中のこれらのバイアスを補正する推定器を構築する。
本モデルは, 神経画像に基づく, 音声による様々な病態の分類を含む, デジタル健康文学における様々なメタ分析に応用する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:43:20 GMT)
A Transformer-Based Approach for Smart Invocation of Automatic Code Completion [14.3] コード補完ツールの起動時期を予測する機械学習モデルを開発した。
クロスIDEコード補完プラグインと200万の開発者インタラクションのデータセットを収集します。
以上の結果から,我々の小型変圧器モデルがベースラインを大きく上回っていることが示唆された。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:19:32 GMT)
A Declarative System for Optimizing AI Workloads [14.3] Palimpzestは、宣言型言語で定義することで、誰でもAIによる分析クエリを処理できるシステムである。
本稿では,AIを活用した分析タスクの作業負荷,Palimpzestが使用している最適化手法,プロトタイプシステム自体について述べる。
私たちの単純なプロトタイプでさえ,3.3倍高速で2.9倍安価で,ベースライン方式よりも優れたデータ品質を備えた,魅力的なプランを提供していることを示しています。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:31:18 GMT)
Measuring Implicit Bias in Explicitly Unbiased Large Language Models [14.3] 大規模言語モデル(LLM)は明示的な社会的バイアステストに合格するが、それでも暗黙のバイアスを課す。
我々は、暗黙のバイアスを明らかにするプロンプトベースの方法であるLSM Implicit Biasと、意思決定タスクにおける微妙な差別を検出する戦略であるLSM Decision Biasの2つの新しいバイアス対策を導入する。
これらの指標を用いて,4つの社会カテゴリーにまたがる8つの価値整合モデルにおいて,社会における傾向を反映する広汎なステレオタイプバイアスが発見された。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:50:45 GMT)
Eliciting Informative Text Evaluations with Large Language Models [14.2] 生成的ピア予測機構(GPPM)と生成的シンプシスピア予測機構(GSPPM)の2つのメカニズムを導入する。
我々は,この機構がベイズ・ナッシュ均衡(近似)として高い努力と真理を動機付けることができることを示した。
ICLRデータセットでは、人間によるレビュー、GPT-4生成レビュー、GPT-3.5生成レビューの3つの品質レベルを、期待されるスコアの観点から区別することが可能です。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:56:12 GMT)
MAMBA4D: Efficient Long-Sequence Point Cloud Video Understanding with Disentangled Spatial-Temporal State Space Models [14.0] 我々は、最近進歩したステートスペースモデル(SSM)に基づく、新しい4Dポイントクラウドビデオ理解バックボーンを提案する。
具体的には、私たちのバックボーンは、生の4Dジオメトリで空間と時間を取り除き、セマンティック・テンポラルなビデオを確立することから始まります。
我々の手法は、トランスフォーマーベースのMS3Dと比較して、87.5%のメモリ削減、5.36倍のスピードアップ、さらにはるかに高い精度(+104%)を持つ。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:08:09 GMT)
Path-metrics, pruning, and generalization [13.9] 本稿では,パラメータのパスメトリックス(path-metrics)という用語で関数の新たなバウンダリを証明した。
これは、ResNets、VGGs、U-netsなど、現代のネットワークに広く適用される最初の境界である。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:23:09 GMT)
Exploring the Low-Pass Filtering Behavior in Image Super-Resolution [13.8] 本稿では,画像超解像におけるディープニューラルネットワークの挙動の解釈を試みる。
ISRタスクにおけるニューラルネットワークの動作を分析するために,Hybrid Response Analysis (HyRA) という手法を提案する。
最後に、注入された高周波情報を定量化するために、周波数スペクトル分布類似性(FSDS)と呼ばれる画像から画像へのタスクのメトリクスを導入する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:22:47 GMT)
High Fidelity Scene Text Synthesis [13.8] シーンテキスト合成では、指定されたテキストを任意の画像にレンダリングする。
現在の方法は、通常、このタスクをエンドツーエンドで定式化するが、トレーニング中に効果的なキャラクタレベルのガイダンスが欠如している。
本稿では,高忠実度シーンテキスト合成のためのDreamTextを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:35:48 GMT)
Let's Fuse Step by Step: A Generative Fusion Decoding Algorithm with LLMs for Multi-modal Text Recognition [13.8] テキスト認識システムに大規模言語モデルを統合するために、GFD(Generative Fusion Decoding')を導入する。
GFDが異なるモデルの不一致トークン空間をまたいで動作できるようにするのに必要な公式を導出する。
GFDはプラグアンドプレイであり、様々な自動回帰モデルと互換性があり、機能アライメントのための再トレーニングを必要としない。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:39:42 GMT)
SLIFER: Investigating Performance and Robustness of Malware Detection Pipelines [13.7] アカデミアは、モデル1つまたはアンサンブル内の静的解析と動的解析を組み合わせることに焦点を当てる。
静的解析と動的解析の両方を逐次利用したWindowsのマルウェア検出パイプラインであるSLIFERを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:06:10 GMT)
Linear Mode Connectivity in Differentiable Tree Ensembles [13.7] 線形モード接続性(英: Linear Mode Connectivity, LMC)は、パラメータ空間における線形補間モデルに対して一貫して存在する現象である。
我々はまず,木に基づく微分可能モデルであるソフトツリーニューロンのLCCを実現する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:11:26 GMT)
GeONet: a neural operator for learning the Wasserstein geodesic [13.5] 本稿では、初期分布と終端分布の入力対から2つのエンドポイント分布を接続するワッサーシュタイン測地線への非線形マッピングを学習するメッシュ不変なディープニューラルネットワークであるGeONetを提案する。
シミュレーション例では,GeONet が標準 OT ソルバと同等の精度で,MNIST データセットに比較して,予測段階の計算コストを桁違いに大幅に削減することを示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:41:51 GMT)
Good Seed Makes a Good Crop: Discovering Secret Seeds in Text-to-Image Diffusion Models [13.5] 拡散推論におけるランダム種子の影響について,大規模な科学的研究を行う。
我々は、最も優れた'金'シードが21.60の印象的なFIDを達成したのに対し、最悪の'金'シードのFIDは31.97であることがわかった。
分類器は、わずか数回で99.9%以上の精度で画像を生成するために使用されるシード番号を予測することができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:46:23 GMT)
QUSL: Quantum Unsupervised Image Similarity Learning with Enhanced Performance [13.3] タスクの特定の特性に合わせて、量子回路を設計することが不可欠である。
本稿では,新しい量子教師なし類似性学習手法QUSLを提案する。
三重項の性能と量子回路の特性を活用することで、QUSLは体系的に高性能な量子回路アーキテクチャを探求する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:19:52 GMT)
ULTRA-MC: A Unified Approach to Learning Mixtures of Markov Chains via Hitting Times [13.3] 離散的および連続的なマルコフ連鎖の混合を学習するための統一戦略を導入する。
具体的には、推定打点時間を正確に反映した混合物を出力する再構成アルゴリズムを設計する。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:57:15 GMT)
Prediction-Powered Ranking of Large Language Models [13.3] 大規模な言語モデルは、しばしば人間の好みに合わせてランク付けされる。
このギャップを埋める統計フレームワークを開発します。
ペアワイズ比較のみを用いて構築されたランクセットは、人間のペアワイズ選好と(分布の)矛盾することが多いことを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:50:21 GMT)
Robot Synesthesia: A Sound and Emotion Guided AI Painter [13.2] 本稿では,ロボット合成と呼ばれるロボット塗装プロセスの指導に音声と音声を用いたアプローチを提案する。
一般音に対しては,模擬絵画を符号化し,同じ潜在空間に入力音を符号化する。音声では,音声をその書き起こしテキストと音声のトーンに分離する。テキストを用いて内容を制御する一方で,そのトーンからの感情を推定し,絵のムードを導出する。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:33:49 GMT)
RecycleGPT: An Autoregressive Language Model with Recyclable Module [13.2] 高速な復号速度を持つ生成言語モデルであるRecycleGPTを提案する。
我々のアプローチは、隣接するトークンが通常強い相関を持つという観察に依存している。
実験と解析により、最大1.4倍のスピードアップを達成し、推論遅延を下げるアプローチの有効性が示された。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:07:07 GMT)
LocMoE: A Low-Overhead MoE for Large Language Model Training [13.2] 本稿では,部分的なノード間通信をノード内通信に変換することで,負荷バランスと局所性を組み合わせた新しいルーティング手法を提案する。
提案されたLocMoEは、古典的なルータと比較して、エポックあたりのトレーニング時間を12.68%削減して22.24%に短縮した。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:03:35 GMT)
OpFlowTalker: Realistic and Natural Talking Face Generation via Optical Flow Guidance [13.1] OpFlowTalkerは、直接画像予測ではなく、音声入力から予測される光フロー変化を利用する新しい手法である。
画像の遷移を円滑にし、変更をセマンティックコンテンツと整合させる。
また,全顔と唇の動きを調節する光フロー同期モジュールを開発した。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:42:34 GMT)
Fisher Flow Matching for Generative Modeling over Discrete Data [13.0] 離散データのための新しいフローマッチングモデルであるFisher-Flowを紹介する。
Fisher-Flowは、離散データ上のカテゴリー分布を考慮し、明らかに幾何学的な視点を採っている。
Fisher-Flowにより誘導される勾配流は, 前方KLの発散を低減するのに最適であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:02:11 GMT)
MineLand: Simulating Large-Scale Multi-Agent Interactions with Limited Multimodal Senses and Physical Needs [13.0] 大規模スケーラビリティ,マルチモーダル感覚の制限,物理的ニーズの3つの重要な特徴を導入することで,このギャップを埋めるマルチエージェントMinecraftシミュレータであるMineLandを提案する。
シミュレータは64以上のエージェントをサポートします。エージェントは視覚的,聴覚的,環境的な意識に制限があり,食物や資源といった物理的ニーズを満たすために積極的にコミュニケーションし,協力せざるを得ません。
実験により,シミュレータ,対応するベンチマーク,およびAIエージェントフレームワークが,より生態学的・ニュアンスな集団行動に寄与することが示された。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:27:15 GMT)
Stepwise Alignment for Constrained Language Model Policy Optimization [13.0] 大規模言語モデル(LLM)を用いたAIシステムの現実的な応用には、安全性と信頼性が不可欠である
本稿では、安全制約下での報酬を最大化するために、言語モデルポリシーの最適化問題として、人間の価値アライメントを定式化する。
SACPOの背景にある重要な考え方の1つは、報酬と安全を取り入れた最適な政策は、報酬に整合した政策から直接得ることができるということである。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:13:41 GMT)
Beyond the Buzz: Strategic Paths for Enabling Useful NISQ Applications [12.9] 我々は、現実世界のNISQ量子アプリケーションはまだ古典的アプリケーションを超えていないと主張している。
NISQコンピューティングを実用的で有用な実装に導くための3つの重要な戦略を特定した。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:40:28 GMT)
AdaAugment: A Tuning-Free and Adaptive Approach to Enhance Data Augmentation [12.7] AdaAugmentは、チューニング不要なAdaptive Augmentationメソッドである。
対象ネットワークからのリアルタイムフィードバックに基づいて、個別のトレーニングサンプルの増大度を動的に調整する。
優れた効率を保ちながら、他の最先端のDAメソッドの効率を一貫して上回ります。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:58:34 GMT)
Overview of the EHRSQL 2024 Shared Task on Reliable Text-to-SQL Modeling on Electronic Health Records [12.7] 1つの戦略は質問応答システムを構築することであり、おそらくはテキスト・ツー・リレーショナル・モデルを活用することである。
EHR 2024共有タスクは、EHRのための質問応答システムの開発における研究の推進と促進を目的としている。
共有タスクに応募した100人以上の参加者のうち、8チームが編成され、共有タスク要求全体を完成させた。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:25:21 GMT)
Closed-form Symbolic Solutions: A New Perspective on Solving Partial Differential Equations [12.7] 閉形式シンボリック解を用いた偏微分方程式(PDE)不変空間の解法は、数学者にとって長年の夢であった。
深層学習にインスパイアされた物理情報ニューラルネットワーク(PINN)は,PDEを数値的に解く上で大きな可能性を秘めている。
テキスト形式のtextbfbfSymbolic framework for textbfPDEs (SymPDE) を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:29:15 GMT)
Aligning Embeddings and Geometric Random Graphs: Informational Results and Computational Approaches for the Procrustes-Wasserstein Problem [12.6] Procrustes-Wstein問題(英語版)は、2つの高次元の点雲を教師なしの設定でマッチングするものである。
2つのデータセットが$X,Y$で、$mathbbRd$の$n$データポイントで構成されています。
そこで我々は,フランク=ウルフ凸緩和法を用いて,変換とレバーベリングを代替的に推定するPing-Passerongアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:18:51 GMT)
TIGER: Text-Instructed 3D Gaussian Retrieval and Coherent Editing [12.5] 本稿では,テキストによる3Dガウス検索と編集のための体系的アプローチ,すなわちTIGERを提案する。
本稿では,2次元画像編集拡散モデルと多視点拡散モデルを集約したコヒーレントスコア蒸留(CSD)を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:37:17 GMT)
Identity Inference from CLIP Models using Only Textual Data [12.5] CLIPモデルにおけるID推論の既存の方法は、完全なPIIでモデルをクエリする必要がある。
従来のメンバーシップ推論攻撃(MIA)は、ターゲットモデルの振る舞いを模倣するためにシャドーモデルを訓練する。
テキストデータのみを用いてターゲットモデルに問い合わせる新しいID推論法である,CLIP モデルにおけるテキスト・ユニモーダル・ディテクター (TUNI) を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:54:25 GMT)
Quantum Public-Key Encryption with Tamper-Resilient Public Keys from One-Way Functions [12.5] 我々は一方通行関数から量子公開鍵暗号を構築する。
私たちの構成では、公開鍵は量子だが、暗号文は古典的である。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:42:01 GMT)
Deep Learning Fusion For Effective Malware Detection: Leveraging Visual Features [12.4] 本研究では,マルウェアの実行可能量の異なるモードで学習した畳み込みニューラルネットワークモデルを融合する能力について検討する。
我々は3種類の視覚的マルウェアを利用した新しいマルチモーダル融合アルゴリズムを提案している。
提案した戦略は、与えられたデータセット内のマルウェアを識別する際の検出レート1.00(0-1)である。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:32:40 GMT)
ArchesWeather: An efficient AI weather forecasting model at 1.5° resolution [12.4] そこで,Pangu-Weatherの3次元局所処理は計算的に準最適であることを示す。
2次元アテンションとカラムワイズアテンションに基づく特徴相互作用モジュールを組み合わせたトランスフォーマーモデルArchesWeatherを設計する。
ArchesWeatherは1.5degの解像度と24hのリードタイムでトレーニングされている。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:11:49 GMT)
Efficiency for Free: Ideal Data Are Transportable Representations [12.4] モデル生成表現は共有線型空間に収束し、モデル間の効果的な線形移動を促進する。
本稿では,Representation Learning Accelerator (ReLA) を提案する。
動的データ生成の事前モデルとしてCLIP ViT B/16を使用することで、ReLA支援のBYOLは、ImageNet-1Kの50%でResNet-50をスクラッチからトレーニングすることができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:06:02 GMT)
Advancing Transportation Mode Share Analysis with Built Environment: Deep Hybrid Models with Urban Road Network [12.3] 本研究では,移動モード共有分析のための入力として,道路ネットワークと社会デマログラフィー機能を直接結合したディープハイブリッドモデル(DHM)を提案する。
シカゴにおけるモード共有予測の実験において、DHMは社会デマトグラフィー構造に価値ある空間的洞察を与えることができることを示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:59:00 GMT)
Switched Flow Matching: Eliminating Singularities via Switching ODEs [12.3] フローマッチング(FM)のような連続時間生成モデルは、ある分布と別の分布の間を移動する確率経路を構築する。
しかし、推論の間、学習したモデルはフローを正確に統合するために複数のニューラルネットワーク評価を必要とすることが多い。
本研究では,一様の ODE を FM で使用するのに対して,スイッチング ODE による特異性を排除した Switched FM (SFM) を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:42:02 GMT)
Segformer++: Efficient Token-Merging Strategies for High-Resolution Semantic Segmentation [12.2] トークンマージは、画像分類タスクにおける推論速度、トレーニング効率、メモリ利用の大幅な向上を示した。
本稿では,資源制約のあるデバイスやリアルタイムアプリケーションへのトランスフォーマーアーキテクチャの展開を容易にする。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:54:27 GMT)
Sparse-Tuning: Adapting Vision Transformers with Efficient Fine-tuning and Inference [12.1] textbfSparse-Tuningは、トレーニング済みViTモデルの微調整と推論の効率を大幅に向上させる新しいチューニングパラダイムである。
Sparse-Tuningは、情報トークンをわずかに保存し、冗長なトークンをマージすることで、トレーニング済みのViTを効率的に微調整する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:34:53 GMT)
SparseLLM: Towards Global Pruning for Pre-trained Language Models [12.1] 本研究では,グローバルプルーニングプロセスを再定義する新しいフレームワークであるSparseLLMを提案する。
SparseLLMのアプローチは、LLMをモジュラ関数の連鎖として概念化し、問題の分解に補助変数を利用する。
高いスパーシティ・レシエーションにおいて、特に顕著なパフォーマンス向上を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:19:07 GMT)
A Comprehensive Overview of Large Language Models (LLMs) for Cyber Defences: Opportunities and Directions [12.0] 最近のLLM(Large Language Models)の進歩は、データ中心のアプリケーション分野で大きな成功を収めている。
サイバー防衛部門におけるLSMの最近の活動の概要について概説する。
トランスフォーマー, 事前学習トランスフォーマー, GPTからのLCMの進行に関する基本的な概念を述べる。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:19:07 GMT)
MobilityGPT: Enhanced Human Mobility Modeling with a GPT model [12.0] 我々はこれらの問題に対処するために、自己回帰生成タスクとして、人間のモビリティモデリングを再構築する。
本稿では,ジオスパティカル・アウェア・ジェネレーティブ・モデルであるモビリティGPTを提案する。
実世界のデータセットの実験では、モビリティGPTは最先端の手法よりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:55:54 GMT)
FUSE: Fast Unified Simulation and Estimation for PDEs [12.0] 同じフレームワーク内で両方の問題を解決することは、正確性と堅牢性において一貫した利益をもたらす可能性がある、と私たちは主張する。
本研究は,本手法の全身血行動態シミュレーションにおける連続的および離散的バイオマーカーの予測能力について述べる。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:37:26 GMT)
PrivCirNet: Efficient Private Inference via Block Circulant Transformation [11.9] ホモモルフィック暗号化(HE)ベースのディープニューラルネットワーク(DNN)推論は、データとモデルのプライバシを保護するが、大きな計算オーバーヘッドに悩まされる。
ブロック循環変換に基づくプロトコル/ネットワーク協調最適化フレームワークであるPrivCirNetを提案する。
PrivCirNetはブロック循環変換と完全に互換性のあるHE符号化アルゴリズムをカスタマイズする。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:44:48 GMT)
EHR-SeqSQL : A Sequential Text-to-SQL Dataset For Interactively Exploring Electronic Health Records [11.8] EHRデータベースのための新しいシーケンシャルテキスト・ツー・スクールのデータセットであるEHR-Seqを紹介する。
EHR-Seqは、シーケンシャルな質問と文脈的な質問を含む最初の医療用テキストからsqlのデータセットベンチマークである。
本実験は, 単ターン法よりも多ターン法の方が構成性に優れていることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:14:21 GMT)
Doubly-Dynamic ISAC Precoding for Vehicular Networks: A Constrained Deep Reinforcement Learning (CDRL) Approach [11.8] 車両ネットワークの実現にはISAC技術が不可欠である。
本稿では,ISACプリコーダ設計の動的更新を容易にするために,制約付き深部強化学習(CDRL)を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:19:14 GMT)
The Disappearance of Timestep Embedding in Modern Time-Dependent Neural Networks [11.5] 本稿では、時間依存ニューラルネットワークの時間認識を無効にする時間ステップ埋め込みの脆弱性を報告する。
我々の分析は、この現象の詳細な説明と、根本原因に対処するいくつかの解決策を提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:58:23 GMT)
RoGS: Large Scale Road Surface Reconstruction based on 2D Gaussian Splatting [11.5] 道路面の再建は自動運転において重要な役割を担っている。
本稿では,2次元ガウススプラッティング (2DGS) に基づく大規模道路表面再構成手法RoGSを提案する。
我々は,様々な挑戦的な現実のシーンにおける道路表面の再構築において,優れた成果を上げた。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:11:47 GMT)
Reassessing Evaluation Functions in Algorithmic Recourse: An Empirical Study from a Human-Centered Perspective [11.5] アルゴリズム・リコースの基礎的前提を批判的に検討する。
参加者のリコース受け入れは,リコース距離と相関しないことがわかった。
これらの結果は、アルゴリズム的リコース研究の一般的な仮定に疑問を投げかけた。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:43:24 GMT)
Integer Scale: A Free Lunch for Faster Fine-grained Quantization of LLMs [11.4] スケールは、追加のキャリブレーションや微調整を必要としないため、無料のランチである。
ほとんどの微細な量子化法では、プラグアンドプレイが使用できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:12:58 GMT)
Robust Quantum Gates against Correlated Noise in Integrated Quantum Chips [11.4] 超伝導量子回路におけるロバスト量子ゲートの実験的実現について報告する。
我々の研究は、ノイズ耐性複素量子回路を実現するための汎用的なツールボックスを提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:39:08 GMT)
Reliable Trajectory Prediction and Uncertainty Quantification with Conditioned Diffusion Models [11.3] 本研究は, 拡散モデルを用いた高速道路軌道予測のための新しいネットワークアーキテクチャである, 条件付き車両運動拡散(cVMD)モデルを紹介する。
cVMDのアーキテクチャの中心は、安全クリティカルなアプリケーションにおいて重要な機能である不確実な定量化を実行する能力である。
実験により,提案アーキテクチャは最先端モデルと比較して,競合軌道予測精度が向上することが示された。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:01:39 GMT)
Distributed Speculative Inference of Large Language Models [11.3] 大規模言語モデル(LLM)の推論を加速することは、人工知能において重要な課題である。
本稿では,分散投機推論(DSI)について紹介する。分散投機推論(DSI)は,投機推論(SI)よりも確実に高速な分散推論アルゴリズムである。
ターゲットとドラフトの複数のインスタンスをオーケストレーションすることで、DSIはSIよりも高速なだけでなく、SIで加速できないLLMもサポートする。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:14:17 GMT)
PipeFusion: Displaced Patch Pipeline Parallelism for Inference of Diffusion Transformer Models [11.1] 本稿では,拡散変換器(DiT)モデルを用いた高解像度画像生成手法であるPipeFusionを紹介する。
隣接する拡散ステップからの入力間の高い類似性を活用することで、PipeFusionはパイプラインの待ち時間を排除します。
実験により,既存の DiT 並列手法がOOM を満たす場合の高解像度画像を生成することができることを示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:00:07 GMT)
Certified Inventory Control of Critical Resources [11.1] 我々は、未知の需要プロセスにおいて、最小限の仮定で所定のサービスレベルを認証するデータ駆動注文ポリシーを提案する。
この方針は、あらゆるオンライン学習手法と統合行動を用いてこれを達成している。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:27:38 GMT)
Little is Enough: Improving Privacy by Sharing Labels in Federated Semi-Supervised Learning [11.0] 多くの重要なアプリケーションでは、機密データは本質的に分散しており、プライバシー上の懸念のために集中できない。
これらのアプローチのほとんどは、ローカルモデルパラメータ、パブリックデータセット上のソフト予測、あるいは両方の組み合わせを共有している。
しかし、これは依然としてプライベート情報を開示し、勾配ベースの手法でトレーニングを行う人たちにローカルモデルを制限している。
我々は、公開されていないデータセットでハードラベルのみを共有し、共有ラベルに関するコンセンサスを、クライアントが使用する擬似ラベルとして使用することを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:16:54 GMT)
Actively Learning Combinatorial Optimization Using a Membership Oracle [10.8] 会員オラクルを用いて未知の線形制約を用いて最適化問題を解くことを検討する。
意思決定者の目標は、オラクルの呼び出し数に関する予算の対象となる最善の解決策を見つけることである。
代用線形制約を学習し、活用することで問題を解決するために、古典的なフレームワークを適応させる。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:34:21 GMT)
Subtle Biases Need Subtler Measures: Dual Metrics for Evaluating Representative and Affinity Bias in Large Language Models [10.7] 本研究では,Large Language Models (LLMs) における2つのバイアスに対処する。
我々は,これらのバイアスを測定するために,代表バイアススコア(RBS)と親和性バイアススコア(ABS)の2つの新しい指標を導入する。
我々の分析では、白人、ストレート、男性と関連する身元を選好する著名なLSMにおいて、顕著な偏見が明らかとなった。
親和性バイアスによる各モデルにおける特徴的評価パターンの解明
論文参考訳(メタデータ) (Thu, 23 May 2024 13:35:34 GMT)
On the Asymptotic Mean Square Error Optimality of Diffusion Models [10.7] 生成前駆体としての拡散モデル(DM)は近年,タスクを認知する大きな可能性を示している。
本稿では, MSE-Optimal Conditional mean (CME) の構造から着想を得た新しい認知戦略を提案する。
結果のDMベースのデノイザは、トレーニング済みのDMを用いて便利に使用することができ、特に逆拡散ステップをトラッピングすることで高速である。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:39:31 GMT)
Structural Entities Extraction and Patient Indications Incorporation for Chest X-ray Report Generation [10.5] 胸部X線レポート生成のための新しい方法である textbfStructural textbfEntities 抽出法と textbfIncorporation (SEI) を考案した。
我々は、レポートにおけるプレゼンテーションスタイルの語彙を排除するために、構造エンティティ抽出(SEE)アプローチを採用する。
我々は,X線画像,類似の歴史的症例,患者固有の指標からの情報を統合するクロスモーダル融合ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:29:47 GMT)
Clinical Reasoning over Tabular Data and Text with Bayesian Networks [10.4] 本稿では,ベイジアンネットワークをニューラルテキスト表現で拡張するための戦略を比較検討する。
プライマリ・ケア・ユース・ケース(肺炎の診断)のシミュレーションの結果を概説し,より広範な臨床状況で考察した。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:41:19 GMT)
No Algorithmic Collusion in Two-Player Blindfolded Game with Thompson Sampling [10.4] プレイヤーがトンプソンサンプリングを使用すると、ゲームダイナミクスはペイオフ行列の軽度な仮定の下でナッシュ平衡に収束することを示す。
アルゴリズムによる共謀は 発生しない プレイヤーが意図的に 競争戦略を展開していないにもかかわらず
論文参考訳(メタデータ) (Thu, 23 May 2024 08:21:48 GMT)
CoMERA: Computing- and Memory-Efficient Training via Rank-Adaptive Tensor Optimization [10.3] ディープラーニングレコメンデーションシステムや基礎言語(あるいはマルチモーダル)モデルといった大規模なAIモデルのトレーニングには、膨大なGPUと計算時間を要する。
CoMERAは、多目的最適化の定式化により、エンドツーエンドのテンソル圧縮トレーニングを実現する。
CoMERAは1回のバッチトレーニングでテストされた6エンコーダトランスで、GaLoreよりも2倍高速で、9倍高速である。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:52:15 GMT)
Nearly Tight Black-Box Auditing of Differentially Private Machine Learning [10.3] 本稿では,ブラックボックスモデルにおけるDP-SGDアルゴリズムについて,ほぼ厳密な検証を行った。
本手法は,DP-SGDからのプライバシー漏洩を,メンバーシップ推論攻撃を用いて実証的に推定する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:24:52 GMT)
Do Large Language Models Pay Similar Attention Like Human Programmers When Generating Code? [10.2] 我々は,Large Language Models (LLMs) が,コード生成中に人間のプログラマと同じタスク記述に係わるかどうかを検討する。
手動で211の間違ったコードスニペットを分析し、多くのコード生成エラーを説明するのに使える5つの注意パターンを見つけました。
この結果から,人間によるLLMの理解性向上とプログラマの信頼度向上の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:27:12 GMT)
Which Information Matters? Dissecting Human-written Multi-document Summaries with Partial Information Decomposition [10.2] 本稿では,部分的な情報分解を用いた要約を特徴付ける手法を提案する。
異なるMDSデータセットに対する実証分析では、ソース数と要約への貢献との間に直接依存があることが示されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:56:54 GMT)
Differentiable Annealed Importance Sampling Minimizes The Jensen-Shannon Divergence Between Initial and Target Distribution [10.1] DAISは初期分布と目標分布の対称性を持つKL分散を最小化することを示す。
DAISは、その初期分布が難解な対象分布に適合するパラメトリックなパラメータであるという点において、変分推論(VI)の一形態と見なすことができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:55:09 GMT)
MaSS: Multi-attribute Selective Suppression for Utility-preserving Data Transformation from an Information-theoretic Perspective [10.0] 本稿では,このユーティリティ保護プライバシ保護問題に対する情報理論の形式的定義を提案する。
我々は、ターゲットデータセットからセンシティブな属性を抑えることができるデータ駆動学習可能なデータ変換フレームワークを設計する。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:35:46 GMT)
Overcoming the Challenges of Batch Normalization in Federated Learning [9.9] 本稿では、フェデレート学習におけるバッチ正規化の利点を回復する新しいスキームであるFederated BatchNorm(FBN)を紹介する。
基本的に、FBNは、トレーニング中のバッチの正規化が集中的な実行で達成されるものと一致していることを保証する。
複雑性がわずかに増加すると、FBNを堅牢化して誤った統計を緩和し、潜在的に敵対的な攻撃を軽減できることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:07:21 GMT)
Cascade of phase transitions in the training of Energy-based models [9.9] 原型エネルギーベース生成モデルBernoulli-Bernoulli RBMの特徴符号化過程について検討した。
本研究は、その特異値分解によるモデルの重み行列の進化をトラックする。
我々はBernoulli-Bernoulli RBMを実データ集合上でトレーニングすることで理論的結果を検証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:25:56 GMT)
Iterative Methods for Full-Scale Gaussian Process Approximations for Large Spatial Data [9.9] 本稿では, FSAを用いた確率, 勾配, 予測分布の計算コストの削減に, 反復法をどのように利用できるかを示す。
また,推定法や反復法に依存する予測分散を計算する新しい,正確かつ高速な手法を提案する。
すべてのメソッドは、ハイレベルなPythonとRパッケージを備えたフリーのC++ソフトウェアライブラリで実装されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:25:22 GMT)
Diffusion-based Quantum Error Mitigation using Stochastic Differential Equation [9.9] 外部環境との相互作用によって生じるランダムなゆらぎは、量子系の状態に影響を与えるノイズを引き起こし、システムエラーを引き起こす。
本稿では拡散モデルを用いた誤差軽減のための新しい手法を提案する。
この手法は、フォワード・バックワード微分方程式(FBSDE)として状態進化中のノイズ発生の定式化と、スコアベース生成モデル(SGM)を用いて量子状態の誤差を復号化することで実現できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:59:26 GMT)
LucidPPN: Unambiguous Prototypical Parts Network for User-centric Interpretable Computer Vision [9.7] Lucid Prototypeal Parts Network (LucidPPN) は、カラープロトタイプと他の視覚的特徴を分離する新しいプロトタイプ部品ネットワークである。
提案手法では,非カラー視覚特徴,グレースケール画像処理,カラー情報のみに焦点をあてた2つの推論枝を用いる。
LucidPPNは、分類されたオブジェクトの意味的な部分に対応するプロトタイプの部分を特定し、データクラス間の比較をより直感的にする。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:00:59 GMT)
Mallows-DPO: Fine-Tune Your LLM with Preference Dispersions [9.7] 直接選好最適化(DPO)は、人間のフィードバックによる強化学習を改善するための一般的なアプローチとして現れている。
Mallows の選好ランク理論に触発されて,新しいアプローチである Mallows-DPO を開発した。
このアプローチの際立った特徴は、人選好のプロンプトへの分散を反映する分散指標である。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:01:11 GMT)
Optimizing example selection for retrieval-augmented machine translation with translation memories [9.7] アップストリーム検索のステップを改善し、ダウンストリーム編集に基づく修正モデルを検討することを目的としている。
このタスクは、ソース文の全体カバレッジを最大化する一連の例を見つけることで構成される。
機械翻訳作業における結果のパフォーマンス向上を評価した。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:42:03 GMT)
Numerical investigations of the extensive entanglement Hamiltonian in quantum spin ladders [9.6] 絡み合いは量子力学における鍵となる概念の一つであり、量子多体系を理解するのに欠かせない道具である。
我々は結合した量子スピン鎖の広範な絡み合い特性について広範な数値的研究を行う。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:43:39 GMT)
Private Regression via Data-Dependent Sufficient Statistic Perturbation [9.6] 線形回帰に対するデータ依存型SSPを導入する。
この結果を、十分な統計量で表現できる近似的な目的を開発することにより、ロジスティック回帰に拡張する。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:09:50 GMT)
Conformal prediction for multi-dimensional time series by ellipsoidal sets [9.4] コンフォーマル予測(CP)は、分布のない、モデルに依存しない、理論的に健全であるため、不確実性定量化の一般的な方法である。
多変量応答に対して$textit Regions$をビルドする、$textttMultiDimS PCI$と呼ばれる逐次CP手法を開発した。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:51:43 GMT)
Model-Agnostic Utility-Preserving Biometric Information Anonymization [9.4] 近年のセンサ技術と機械学習技術の急速な進歩は、人々のバイオメトリックスの普遍的な収集と利用を引き起こしている。
生体認証の利用は、本質的なセンシティブな性質と、センシティブな情報を漏洩するリスクが高いため、深刻なプライバシー上の懸念を引き起こしている。
本稿では,生体データに対して,その感度特性を抑え,下流機械学習による解析に関連のある特徴を保持することで,生体データを匿名化できる新しいモダリティ非依存型データ変換フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:21:40 GMT)
Extracting Prompts by Inverting LLM Outputs [9.4] output2promptはモデルのロジットにアクセスせずにプロンプトを抽出することを学ぶ。
メモリ効率を向上させるため、output2promptは新しいスパース符号化技術を採用している。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:35:03 GMT)
Combining Constrained Diffusion Models and Numerical Solvers for Efficient and Robust Non-Convex Trajectory Optimization [9.3] 本稿では,拡散モデルと数値最適化解法を組み合わせた一般フレームワークを提案する。
局所最適解の真の分布を近似する新しい制約付き拡散モデルを開発する。
実験は、改善された制約満足度と計算効率を4$times$から30$times$Accelerationで検証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:08:38 GMT)
Generating Exceptional Behavior Tests with Reasoning Augmented Large Language Models [9.3] ソフトウェア開発者は例外的な振る舞いテスト(EBT)を書き、コードが不要なイベントを検出し、適切な例外を投げることをチェックする。
EBTを自動生成する最初のフレームワークであるEXLONGを提示する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:28:41 GMT)
Large language models can be zero-shot anomaly detectors for time series? [9.2] sigllmは,大規模言語モデルを用いた時系列異常検出のためのフレームワークである。
本稿では,入力のどの要素が異常であるかを言語モデルに直接問うプロンプトベースの検出手法を提案する。
その結果, 予測手法はF1スコアに対して, 全11データセットにおいてプロンプト法よりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:21:57 GMT)
Adversarial Imitation Learning from Visual Observations using Latent Information [9.2] 視覚的観察から模倣学習の課題に焦点をあて,学習エージェントが専門家の動画を唯一の学習源として利用できるようにする。
本研究では,非政治的敵対的模倣手法とエージェントの状態を観察シーケンスから学習した潜在的表現を組み合わせ,Relatnt Adversarial from Observationsというアルゴリズムを導入する。
高次元連続ロボットタスクの実験では、潜在空間におけるモデルフリーアプローチが最先端の性能と一致していることが示されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:42:04 GMT)
xFinder: Robust and Pinpoint Answer Extraction for Large Language Models [9.2] キー応答抽出に特化して設計されたモデルであるxFinderを提案する。
5億のパラメータしか持たない最小の xFinder モデルでは平均解解抽出精度が93.42% であることを示す。
対照的に、最高の評価フレームワークにおけるRegExの精度は74.38%である。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:00:45 GMT)
Decomposition-based Hierarchical Task Allocation and Planning for Multi-Robots under Hierarchical Temporal Logic Specifications [9.2] 時間論理仕様を用いたロボット計画のための分解に基づく階層的枠組みを定式化する。
混合線形プログラムは、様々なロボットにサブタスクを割り当てるために使用される。
本手法はナビゲーションと操作の領域に実験的に適用された。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:20:36 GMT)
Conformal Classification with Equalized Coverage for Adaptively Selected Groups [9.0] 本稿では、適応的に選択された特徴に対して有効なカバレッジ条件付き予測セットを生成することにより、分類の不確かさを評価するための共形推論手法を提案する。
シミュレーションおよび実データに対して,本手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:32:37 GMT)
360$^\circ$ High-Resolution Depth Estimation via Uncertainty-aware Structural Knowledge Transfer [9.0] 高分解能(HR)全方位深度マップを予測するために、既存の手法では、完全に教師付き学習を通じて入力としてHR全方位画像(ODI)を利用するのが一般的である。
本稿では,HR深度GTマップが存在しない場合に,低分解能(LR) ODIから直接HR全方位深度を推定する。
我々のキーとなる考え方は、HR画像のモダリティと対応するLR深度マップからシーン構造的知識を移譲し、余分な推論コストを伴わずにHR深度推定の目標を達成することである。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:37:24 GMT)
Improved sampling via learned diffusions [8.9] 近年,制御拡散過程を用いた対象分布からの深層学習に基づくアプローチが提案されている。
我々はこれらのアプローチを一般化されたシュリンガー橋問題(英語版)の特別な場合とみなす。
時間反転拡散過程の経路空間測度間のばらつきに基づく変分定式化を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:15:24 GMT)
Controlling Behavioral Diversity in Multi-Agent Reinforcement Learning [8.9] 本研究では,ある指標の正確な値に対する多様性を制御できるダイバーシティ制御(DiCo)を導入する。
マルチエージェント強化学習における性能向上とサンプル効率向上のための新しいパラダイムとしてDiCoを用いる方法を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:03:33 GMT)
Explaining Black-box Model Predictions via Two-level Nested Feature Attributions with Consistency Property [8.8] 本稿では,2段階の特徴属性を同時に推定するモデルに依存しない局所的説明法を提案する。
提案手法の重要な考え方は、HiFAとLoFAの間に存在するべき一貫性性を導入することである。
この一貫性により、提案手法は、ブラックボックスモデルに忠実であり、互いに一貫性のあるHiFAとLoFAを生成できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:03:26 GMT)
Synthetic Data Generation for Intersectional Fairness by Leveraging Hierarchical Group Structure [8.7] 分類タスクにおける交差公正性を高めるために,特にデータ拡張手法を導入する。
本手法は,群を親圏の交叉と見なすことにより,交叉性に固有の階層構造に乗じる。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:03:23 GMT)
Learning with Fitzpatrick Losses [8.6] フィッツパトリック関数に基づいた凸損失関数の族であるフィッツパトリック損失を導入する。
極大単調作用素論におけるよく知られた理論ツールであるフィッツパトリック函数は、自然に洗練されたフェンシェル・ヨンの不等式をもたらす。
Fitzpatrick の損失は Fenchel-Young の損失と見なせる。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:49:37 GMT)
PILOT: Equivariant diffusion for pocket conditioned de novo ligand generation with multi-objective guidance via importance sampling [8.6] 等変拡散モデル PILOT を用いて,$textitde novo$ で 3次元リガンド構造を生成するためのシリカ内アプローチを提案する。
その多目的的重要度サンプリング戦略は、モデルが望ましい特性を示す分子に向けられるよう設計されている。
我々はPILOTを用いて、Kinodata-3Dデータセットから未確認タンパク質ポケットの新しいメトリクスを生成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:58:28 GMT)
Not All Language Model Features Are Linear [8.6] 独立的・非共起的な低次元特徴に分解できるかどうかに基づいて、既約多次元特徴の厳密な定義を開発する。
我々は、これらの正確な円が、その年の週と月におけるモジュラー算術に関わる計算問題を解くのに使用されるタスクを特定する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:59:04 GMT)
Omitted Labels in Causality: A Study of Paradoxes [8.5] また, 適切な調整を行うには, 交換不能な治療群と制御群が必要であることも示唆した。
これらの落とし穴は、異なる文脈から引き出された結論のネットワークに繋がる。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:58:14 GMT)
Fault Tolerant ML: Efficient Meta-Aggregation and Synchronous Training [8.4] 分散機械学習(ML)システムにおけるビザンチン・ロバスト学習の挑戦的枠組みについて検討する。
最初のコントリビューションは,ベースラインアグリゲータを最適なパフォーマンスレベルにアップグレードする,効率的なメタアグリゲータの導入です。
本稿では,ビザンチン・ロバスト訓練の理論的および実践的優位性,特にチューニングプロセスの簡略化について述べる。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:29:30 GMT)
Neuroexplicit Diffusion Models for Inpainting of Optical Flow Fields [8.3] 我々は、PDEに基づく明示的なアプローチと畳み込みニューラルネットワークを組み合わせることで、モデルとデータ駆動アプローチを結合する方法を示す。
我々のモデルは、再構築の質、堅牢性、必要なトレーニングデータの量の観点から、完全に明示的かつ完全にデータ駆動のベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:14:27 GMT)
Boosting Robustness by Clipping Gradients in Distributed Learning [8.3] State-of-the-art (SOTA) robust distributed gradient descent (Robust-DGD) 法は最適であることが証明されている。
その結果,低境界を回避し,学習性能を向上させることが可能であることが示唆された。
我々は、適応ロバストクリッピング(ARC)と呼ばれる新しいスキームを用いて、労働者の勾配の事前集約クリッピングを提案し、これを証明した。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:00:31 GMT)
CoPeD-Advancing Multi-Robot Collaborative Perception: A Comprehensive Dataset in Real-World Environments [8.2] 本稿では,先駆的で包括的な実世界のマルチロボット協調認識データセットを提案する。
生のセンサー入力、ポーズ推定、オプションのハイレベル認識アノテーションが特徴である。
この研究は、マルチロボット設定におけるマルチモーダル協調認識を通して、ハイレベルなシーン理解の潜在的研究を解き放つだろうと考えている。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:59:48 GMT)
Harmful Speech Detection by Language Models Exhibits Gender-Queer Dialect Bias [8.2] 本研究では,ジェンダークェア方言の有害な音声分類におけるバイアスの存在について検討した。
LGBTQ+スラーの非退行的使用を実証する109個のテンプレートに基づく新しいデータセットであるQuierLexを紹介する。
筆者らは,これらのテキストの害評価において,市販の5つの言語モデルの性能を体系的に評価した。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:07:28 GMT)
Imitating Cost-Constrained Behaviors in Reinforcement Learning [8.1] 本稿では, トラジェクティブコスト制約の存在下で, 専門家分布に適合する手法を提案する。
試行錯誤学習手法はコスト制約の少ない動作を模倣することを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:57:17 GMT)
MetaOptimize: A Framework for Optimizing Step Sizes and Other Meta-parameters [8.1] 本稿ではメタファクタを動的に調整するメタフレームワークについて紹介する。
より具体的には、Metaは任意の一階最適化アルゴリズムをラップし、特定の形態の後悔を最小限に抑えるために、ステップサイズの調整をオンザフライで行うことができる。
また、複数の最適化アルゴリズムへの適応性とともに、手作り学習率の最高のスケジュールに匹敵する性能を示すメタの低複雑性な変種も導入する。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:02:06 GMT)
AGILE: A Novel Framework of LLM Agents [8.0] ユーザとの複雑な対話処理を実現するために,LLMエージェントの新たなフレームワークを提案する。
エージェントの能力には、会話だけでなく、リフレクション、ツールの利用、専門家との相談が含まれる。
実験の結果, PPOで訓練した13Bおよび7B LLMをベースとしたAGILEは, GPT-4エージェントより優れていた。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:17:44 GMT)
Automatic Differentiation is Essential in Training Neural Networks for Solving Differential Equations [7.9] 本稿では、ニューラルネットワークのトレーニングにおいて、自動微分(AD)の利点を定量的に示す。
実験および理論的解析により、ADは偏微分方程式の解法において有限差分(FD)より優れていることが示された。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:01:05 GMT)
Understanding the Training and Generalization of Pretrained Transformer for Sequential Decision Making [7.9] 逐次的意思決定問題に対する教師付き事前学習型変換器について検討する。
このような構造は、事前学習フェーズにおける最適なアクション/決定の使用を可能にする。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:28:44 GMT)
MOKA: Moral Knowledge Augmentation for Moral Event Extraction [7.8] ニュースメディアは、しばしばニュース記事における明示的な道徳的言語を最小化しようと試みるが、ほとんどの記事は、報告された出来事自体を通して表現される道徳的価値に富んでいる。
この現象を調査するために,政治スペクトルの多種多様な米国メディアによる474のニュース記事に5,494の構造化イベントアノテーションからなる新たなデータセットMORAL EVENTSを注釈付けした。
本稿では,モラル知識を付加したモラルイベント抽出フレームワークであるMokaを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:53:15 GMT)
Convolutional Neural Network Model Observers Discount Signal-like Anatomical Structures During Search in Virtual Digital Breast Tomosynthesis Phantoms [7.8] 畳み込みニューラルネットワーク(CNN)は,新しいタイプのモデルオブザーバとして提案されている。
本稿では,従来の線形モデルオブザーバが失敗する探索作業において,CNNが人為的モデルオブザーバとして使用できることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:49:42 GMT)
Dynamic Frequency-Based Fingerprinting Attacks against Modern Sandbox Environments [7.8] 我々は,Intel および AMD CPU の CPU 周波数レポートセンサによる指紋認証コンテナの可能性について検討した。
我々はDockerイメージがユニークな周波数シグネチャを示し、最大84.5%の精度で異なるコンテナの区別を可能にすることを実証した。
実験の結果、これらの攻撃は40秒未満で全てのサンドボックスに対して成功できることが判明した。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:17:43 GMT)
Universal Robustness via Median Randomized Smoothing for Real-World Super-Resolution [7.6] 本稿では,ディープラーニング超解法のロバスト性向上のための様々な手法の普遍性について検討する。
正中性ランダム化平滑化(MRS)は, 対向学習法に比べ, 頑健性においてより一般的であることを示す。
また,提案手法により,SRモデルにより標準的な汚職をより効果的に扱えることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:00:01 GMT)
Enhancing Trust and Security in the Vehicular Metaverse: A Reputation-Based Mechanism for Participants with Moral Hazard [7.6] 我々は、車体メタバースの領域における道徳的ハザードの問題に取り組む。
評価に基づく戦略を中心としたインセンティブメカニズムを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:17:07 GMT)
Kinetics of orbital ordering in cooperative Jahn-Teller models: Machine-learning enabled large-scale simulations [7.5] 本稿では,Jern-Teller(JT)システムの断熱力学に対するスケーラブル機械学習(ML)力場モデルを提案する。
JT模型の大規模動力学シミュレーションは、コロッサル磁気抵抗マンガナイトの軌道秩序ダイナミクスに光を当てた。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:44:29 GMT)
Retrieve, Merge, Predict: Augmenting Tables with Data Lakes [7.4] 結合可能なテーブルを検索し、情報をマージし、結果のテーブルと予測する。
データレイクとして、論文ではYADL(Yet Another Data Lake)と、よく参照された実際のデータレイクであるOpen Data USを使用している。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:31:18 GMT)
Towards General Conceptual Model Editing via Adversarial Representation Engineering [7.4] 本稿では,概念モデル編集のための統一的で解釈可能なアプローチを提供するために,ARE(Adversarial Representation Engineering)フレームワークを提案する。
複数のモデル編集パラダイムの実験は、様々な環境でのAREの有効性を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:06:59 GMT)
Artificial Intelligence (AI) in Legal Data Mining [7.4] 実践者や下流の自動化作業に役立つ方法で法的情報を整理することが重要である。
作業オントロジーのよい例は、DhaniとBhattによって開発された。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:41:35 GMT)
Almost Surely Asymptotically Constant Graph Neural Networks [7.3] 出力は定数関数に収束し、これらの分類器が一様に表現できる上限となることを示す。
結果は、広範囲のランダムグラフモデルに適用できる。
我々はこれらの知見を実証的に検証し、収束現象がランダムグラフだけでなく、実世界のグラフにも現れることを観察した。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:03:45 GMT)
Deep Convolutional Neural Networks Meet Variational Shape Compactness Priors for Image Segmentation [7.3] 形状コンパクト性は、多くの画像分割タスクにおいて興味深い領域を記述するための重要な幾何学的性質である。
そこで本稿では,従来の形状特徴を取り入れた画像分割問題を解くために,新しい2つのアルゴリズムを提案する。
提案アルゴリズムは、ノイズの多い画像データセット上で20%のトレーニングをすることで、IoUを大幅に改善する。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:05:35 GMT)
LaFiCMIL: Rethinking Large File Classification from the Perspective of Correlated Multiple Instance Learning [7.2] 本稿では,大規模ファイル分類に特化して設計されたLaFiCMILを紹介する。
LaFiCMILは1つのGPU上での効率的な操作に最適化されており、バイナリ、マルチクラス、マルチラベルの分類タスクのための汎用的なソリューションとなっている。
このアプローチの注目すべき成果は、32GBのメモリを持つ単一のGPU上で動作しながら、BERTを2万近いトークンを扱うようにスケールできることである。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:39:01 GMT)
Configuring Data Augmentations to Reduce Variance Shift in Positional Embedding of Vision Transformers [7.2] 視覚変換器(ViT)は様々な視覚タスクにおいて顕著な性能を示した。
Mixup、Cutmix、ランダム消去といったリッチなデータ拡張を使用することは、ViTのトレーニングの成功に不可欠である。
ここでは、Mixupのようなデータ拡張によって、ViTの位置埋め込みのばらつきが生じるという脆弱性を報告する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:42:32 GMT)
Collaborative Learning with Different Labeling Functions [7.2] 我々は、$n$のデータ分布ごとに正確な分類器を学習することを目的とした、協調型PAC学習の亜種について研究する。
データ分布がより弱い実現可能性の仮定を満たす場合、サンプル効率の学習は依然として可能であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:09:25 GMT)
Expert exploranation for communicating scientific methods -- A case study in conflict research [7.2] 本研究では,研究者同士のコミュニケーションを支援するだけでなく,研究者同士のコミュニケーションを直接支援できることを示す。
我々は,対話型ビジュアルストーリーの3つのバージョンを開発し,研究者と対立する手法を説明した。
評価からの肯定的かつ広範囲なフィードバックは、専門家の爆発がビジュアルなストーリーテリングにとって有望な方向であることを示している。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:15:46 GMT)
Surveilling the Masses with Wi-Fi-Based Positioning Systems [7.1] 我々は、AppleのWPSが悪用され、世界規模でプライバシーを脅かす可能性があることを示しています。
我々は、非特権の攻撃者が世界中のWi-Fi BSSID位置情報のスナップショットを蓄積できる攻撃を提案する。
我々は、AppleのWPSが提供するプライバシーに対する攻撃のタイプを示すいくつかのケーススタディを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:22:12 GMT)
Logarithmic Smoothing for Pessimistic Off-Policy Evaluation, Selection and Learning [7.1] 本研究は,文脈的包帯問題のオフライン定式化について検討する。
目標は、行動ポリシーの下で収集された過去のインタラクションを活用して、新しい、より優れたパフォーマンスのポリシーを評価し、選択し、学習することである。
重要度重み付けリスク推定器の幅広いクラスに対して,新しい完全経験的濃度境界を導入する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:07:27 GMT)
GIFT: Unlocking Full Potential of Labels in Distilled Dataset at Near-zero Cost [7.1] ラベルのフル活用を強調することによって,新しい視点を導入する。
本稿では,ソフトラベルの精細化とコサイン類似度に基づく損失関数を含むGIFTを紹介する。
GIFTは、計算コストを増大させることなく、最先端のデータセット蒸留法を一貫して強化する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:02:30 GMT)
Detecting Out-of-Distribution Through the Lens of Neural Collapse [7.0] アウト・オブ・ディストリビューション(OOD)検出は、AIの安全なデプロイに不可欠である。
ニューラル・コラプス(Neural Collapse)に触発されて、OOD試料の特徴と比較して重量ベクトルに近づいた分布内分布(ID)サンプルの特徴が明らかになった。
我々は,OOD検出における重みベクトルへの特徴近接を利用して,OODサンプルをフィルタする特徴ノルムを用いて,この視点を補うことを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:25:02 GMT)
A safe exploration approach to constrained Markov decision processes [7.0] 無限水平制限マルコフ決定過程(CMDP)について考察する。
目標は、期待される累積的制約の対象となる累積的報酬を最大化する最適なポリシーを見つけることである。
安全クリティカルなシステムのオンライン学習におけるCMDPの適用により、モデルフリーでシミュレータフリーなアルゴリズムの開発に焦点をあてる。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:20:16 GMT)
Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations [7.0] 本稿では,視覚的特徴を学習するために,視覚言語学習と識別的・生成的自己スーパービジョンを組み合わせたフレームワークであるHarmonyを紹介する。
当社のフレームワークは, ネガティブな例に頼らず, 1対1の対応問題に対処することで, ウェブスクラッドデータに特化して動作するように設計されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:18:08 GMT)
AutoCoder: Enhancing Code Large Language Model with \textsc{AIEV-Instruct} [7.0] 我々はHuman Evalベンチマークテストでpass@1でGPT-4 Turbo(2024年4月)とGPT-4oを上回る最初の大規模言語モデルであるAutoCoderを紹介した。
さらに、AutoCoder は GPT-4 Turbo や GPT-4o よりも汎用的なコードインタープリタを提供している。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:53:25 GMT)
Generalization of Hamiltonian algorithms [6.8] 本稿では,学習アルゴリズムのクラスに対する一般化結果を示す。
この方法はアルゴリズムが任意のa-プリオリ測度に対して絶対連続分布を生成するときに適用される。
Gibbsアルゴリズムと安定した決定論的アルゴリズムのランダム化、およびデータ依存の先行値を持つPAC-Bayesian境界に対する応用である。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:56:05 GMT)
Improved Canonicalization for Model Agnostic Equivariance [6.8] 従来の方法で同変モデルを構築するには、既存のモデルの同変モデルを設計し、それらをゼロから訓練する必要がある。
そこで本研究では,任意の非同変ネットワークを正準化に利用する新しい手法を提案する。
提案手法はコントラスト学習を用いて,一意な正準方向を効率よく学習し,正準化ネットワークの選択に柔軟性を提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:34:12 GMT)
Adapting to Unknown Low-Dimensional Structures in Score-Based Diffusion Models [6.8] 周囲の次元が$d$である場合、各デノイングステップ内で発生する誤差の依存性は、一般的には避けられない。
これはDDPMサンプリング器がターゲット分布の未知の低次元構造に適応できるという最初の理論実証である。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:59:10 GMT)
A geometric perspective: experimental evaluation of the quantum Cramer-Rao bound [6.8] 量子センシングのパワーは、量子クレーマー・ラオ境界(QCRB)によって量子化されたその究極の精度限界に依存する
量子不確実性原理が境界の飽和をいかに防ぐかを示す。
系の幾何学的性質に「量子性」の計量をリンクすることにより、達成可能なQCRBを調査および実験的に抽出する。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:47:40 GMT)
A finite time analysis of distributed Q-learning [6.7] マルチエージェント強化学習(MARL)は、単一エージェント強化学習(RL)の適用において達成された経験的成功によって、目覚ましい関心の高まりを目撃している。
本研究では,多くのエージェントが局所報酬の平均値である中央報酬関数にアクセスせずに逐次意思決定問題を協調的に解決する分散Q-ラーニングシナリオについて考察する。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:52:38 GMT)
Learning Multimodal Confidence for Intention Recognition in Human-Robot Interaction [6.7] 新たな学習型マルチモーダル融合フレームワークBatch Multimodal Confidence Learning for Opinion Pool (BMCLOP)を提案する。
提案手法は,ベイズ多モード融合法とバッチ信頼度学習アルゴリズムを組み合わせることで,精度,不確実性低減,成功率を向上させる。
所望の補助シナリオでは、3つのモーダルティ・ジェスチャ、スピーチ、視線を考慮し、これらすべてがすべての有限の意図に対してカテゴリー分布を生成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:43:31 GMT)
End-to-End User-Defined Keyword Spotting using Shifted Delta Coefficients [6.6] そこで本研究では,発音の変動を捉えるのに役立つシフトデルタ係数(SDC)を提案する。
提案手法は最先端のUDKWS技術と比較して優れた性能を示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:24:01 GMT)
A Watermark for Low-entropy and Unbiased Generation in Large Language Models [6.5] 大規模言語モデル(LLM)の最近の進歩は、誤用リスクを浮き彫りにした。
本研究では, 透かし強度とテキスト品質の新たなトレードオフを提案する。
低エントロピーおよび高エントロピーデータセットの実験結果は、STA-1が既存の非バイアスウォーターマークに匹敵するテキスト品質と透かし強度を達成することを示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:17:29 GMT)
Marvelous Agglutinative Language Effect on Cross Lingual Transfer Learning [6.4] 類似言語構造を持つ言語を使用することは,言語間移動学習に有効であることが知られている。
韓国語などの凝集言語の使用は、言語間移動学習においてより効果的であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:10:43 GMT)
Explainable automatic industrial carbon footprint estimation from bank transaction classification using natural language processing [6.4] 提案手法は, 銀行取引に関連するCO2排出量を推定する。
局所的解釈可能なモデルを用いて,トランザクション記述から抽出した入力項の影響を評価する。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:43:06 GMT)
AlphaMath Almost Zero: process Supervision without process [6.3] 大規模言語モデル(LLM)は、複数の推論ステップを必要とする複雑な問題に悩まされる。
我々はモンテカルロ木探索(MCTS)フレームワークを利用することで、プロセスアノテーション(人間やGPTから)の必要性を回避できる革新的なアプローチを導入する。
提案手法はポリシーと価値モデルを反復的に訓練し,LLMの能力を活用している。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:07:24 GMT)
High Rank Path Development: an approach of learning the filtration of stochastic processes [6.2] そこで我々は,HRPCFD(High Rank PCF Distance)と呼ばれる新しい尺度を導入する。
そして、そのようなHRPCFDは、データからHRPCFDを訓練し、HRPCF-GANを構築するための効率的なアルゴリズムを設計できるように、多くの好意的な解析特性を許容していることを示す。
仮説テストと生成モデルの両方に関する数値実験は、いくつかの最先端手法と比較して、我々のアプローチのアウトパフォーマンスを検証している。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:20:47 GMT)
Deep Reinforcement Learning for 5*5 Multiplayer Go [6.2] 本稿では,検索と深層強化学習(DRL)を用いた最新のアルゴリズムの利用と解析を提案する。
我々は,2人以上のプレイヤーがいても,検索とDRLによりプレイレベルを向上できたことを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:44:24 GMT)
Pure Exploration for Constrained Best Mixed Arm Identification with a Fixed Budget [6.2] 固定予算の制約付きベスト・ミックスアーム識別(CBMAI)問題を導入する。
目標は、与えられた学習予算$N$で、期待されるコストの制約によって期待される報酬を最大化する最高の混合アームを見つけることである。
我々は、(最良の混合アームの支持の)誤識別に関する理論上の上限を提供し、予算$N$で指数関数的に崩壊することを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:35:11 GMT)
TransAnaNet: Transformer-based Anatomy Change Prediction Network for Head and Neck Cancer Patient Radiotherapy [6.2] 本研究では、視覚変換器(ViT)をベースとしたニューラルネットワークを用いて、HNC患者のRT誘発解剖学的変化を予測することの実現可能性を評価することを目的とする。
UNetスタイルのViTネットワークは、埋め込みCT、線量、CBCT01、GTVp、GTVn画像パッチから空間対応や文脈情報を学習するために設計された。
提案手法の予測画像は,pCT,CBCT01,および他の比較モデルによるCBCTよりも実画像(CBCT21)に最もよく似ている。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:55:09 GMT)
Logical Characterizations of Recurrent Graph Neural Networks with Reals and Floats [6.2] 本稿では,2つのシナリオにおいて,繰り返しグラフニューラルネットワーク(GNN)の正確な論理的特徴について述べる。
フロートに対して、繰り返しGNNと一致する形式主義は数えられるルールベースのモーダル論理であり、実数に対しては適切な無限のモーダル論理を用いる。
キャラクタリゼーションを適用することで、モナディック二階述語論理で定義可能なグラフ特性と比較して、無限論理と規則論理は等しく表現力があることが証明できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:19:21 GMT)
Vocabulary for Universal Approximation: A Linguistic Perspective of Mapping Compositions [6.2] V=phi_i: mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd to mathbbRd
論文参考訳(メタデータ) (Thu, 23 May 2024 08:38:10 GMT)
Decoding Decision Reasoning: A Counterfactual-Powered Model for Knowledge Discovery [6.2] 医用画像では、AIモデルの予測の背後にある根拠を明らかにすることが、信頼性を評価する上で重要である。
本稿では,意思決定推論と特徴識別機能を備えた説明可能なモデルを提案する。
提案手法を実装することにより,データ駆動モデルにより活用されるクラス固有の特徴を効果的に識別および可視化することができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:00:38 GMT)
Deep Learning for Protein-Ligand Docking: Are We There Yet? [6.1] PoseBenchは、実用的なタンパク質リガンドドッキングのための最初の包括的なベンチマークである。
コード、データ、チュートリアル、ベンチマーク結果はhttps://github.com/BioinfoMachineLearning/PoseBench.comで公開されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:27:39 GMT)
Application of Machine Learning in Agriculture: Recent Trends and Future Research Avenues [6.0] 食品生産は重要な世界的関心事であり、人工知能(AI)による農業革命の可能性はほとんど解明されていない。
本稿では,農業における機械学習(ML)の適用に焦点をあてた総合的なレビューを行い,農業実践におけるその変革的ポテンシャルと効率向上を探求する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:53:31 GMT)
Compilation for Dynamically Field-Programmable Qubit Arrays with Efficient and Provably Near-Optimal Scheduling [6.0] フィールドプログラマブル量子ビットアレイは、量子コンピューティングにおいて高い忠実度と高い並列ゲートを持つ。
本研究では,このアーキテクチャのコンパイルをスケジューリング,配置,ルーティングの3つのタスクに分割する。
グラフエッジのカラー化に基づくスケジューリングは、2キュービットゲートステージ数においてほぼ最適である。
Enolaは、30分以内で1万キュービットの回路をコンパイルできるなど、非常にスケーラブルである。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:57:49 GMT)
High-dimensional Learning with Noisy Labels [6.0] 本稿では,クラス条件付き雑音ラベルを用いた高次元二項分類に関する理論的知見を提供する。
導出に基づいて,高次元のノイズラベル処理において,より効率の良い最適化手法を設計する。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:32:25 GMT)
Local Causal Discovery for Structural Evidence of Direct Discrimination [5.9] 直接識別のための局所的な発見(LD3): 直接識別の構造的証拠を復元するリアルタイムアルゴリズムを提案する。
本研究は,肝移植を事例として,複雑な意思決定システムにおける公平性をモデル化するためのLD3の潜在的影響を強調した。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:56:38 GMT)
An Empirical Study on the Characteristics of Database Access Bugs in Java Applications [5.8] データベースを基盤とするアプリケーションはデータベースアクセスコードに依存し、基盤となるデータベース管理システム(DBMS)と相互作用する。
本稿では,7つの大規模Javaソースアプリケーションから収集した423のデータベースアクセスバグを実証的に調査する。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:26:29 GMT)
Microwave Quantum Illumination with Optical Memory and Single-Mode Phase-Conjugate Receiver [5.8] マイクロ波信号の絡み合った対と光アイドラーモードによるマイクロ波量子照明は、準最適性能を実現することができる。
まず,イドラーモードの遅延線を模擬した光メモリを用いたマイクロ波量子照明テストベッドを提案する。
本稿では,低反射率ビームスプリッタ,電気光学式位相共役器,光子数分解検出器からなる単一モード位相共役受信機を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:44:19 GMT)
Posterior Sampling-based Online Learning for Episodic POMDPs [5.8] 本研究では,遷移モデルと観測モデルが未知のエピソードPOMDPに対するオンライン学習問題を考察する。
ポストリアサンプリングに基づくPOMDPのための強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:26:19 GMT)
Time Cell Inspired Temporal Codebook in Spiking Neural Networks for Enhanced Image Generation [5.8] 本稿では、スパイキングニューラルネットワーク(SNN)を利用した変分量子オートエンコーダ(VQ-VAE)の構築手法を提案する。
この設計は、時間的依存を捕捉し、利用し、SNNの生成能力を著しく向上させる。
提案手法は,高分解能かつ時間的整合性のあるデータ生成に優れ,SNNに基づく生成モデルにおける時間的情報の重要性を浮き彫りにする。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:04:46 GMT)
Simple-RF: Regularizing Sparse Input Radiance Fields with Simpler Solutions [5.7] ニューラル・ラジアンス・フィールド(NeRF)は、シーンのフォトリアリスティックなフリービューレンダリングにおいて印象的なパフォーマンスを示す。
TensoRFやZipNeRFといったNeRFの最近の改良は、最適化とレンダリングの高速化のために明示的なモデルを採用している。
放射場によって推定される深度を監督することは、より少ない視点で効果的に学習することに役立つことを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:04:54 GMT)
Is Algorithmic Stability Testable? A Unified Framework under Computational Constraints [5.7] ブラックボックスアルゴリズムの安定性をテストすることは、データが数えきれないほど無限の空間にあるような環境では不可能であることを示す。
アルゴリズム安定性テストの難易度を定量化するための統一的なフレームワークを開発し,全ての設定において,利用可能なデータが制限されている場合,網羅的探索がアルゴリズム安定性を証明するための唯一の普遍的なメカニズムであることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:51:25 GMT)
A Systematic and Formal Study of the Impact of Local Differential Privacy on Fairness: Preliminary Results [5.6] 差分プライバシー(DP)は、プライバシ保護機械学習(ML)アルゴリズムの主要なソリューションである。
近年の研究では、ローカルDPが個人の異なるサブグループに対するML予測に影響を及ぼすことが示されている。
ローカルDPの下でのMLモデルによる決定の公平性は,プライバシやデータ分布の異なるレベルにおいてどのように変化するかを検討する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:54:03 GMT)
Complex-valued 3D atomic spectroscopy with Gaussian-assisted inline holography [5.6] 本研究では, インラインホログラフィーにおけるガウス分解支援手法の開発と実験により, 3次元に分散した小原子試料の吸収と相変化の同時測定を行った。
原子数や相互作用強度の不確かさに非常に敏感な位相角の読み出しでは、数百原子の遷移周波数に対して100kHzレベルの単発分解能が得られる。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:30:22 GMT)
End-to-End Streaming Video Temporal Action Segmentation with Reinforce Learning [5.6] 我々は、強化学習(SVTAS-RL)を用いたエンド・ツー・エンドのストリーミングビデオ時間的動作分割モデルを提案する。
SVTAS-RLモデルは既存のSTASモデルを大幅に上回り、同じ評価基準の下で複数のデータセット上で最先端のTASモデルと競合する性能を達成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:32:27 GMT)
Promoting Constructive Deliberation: Reframing for Receptiveness [5.4] 本稿では,意味を保ちながら信号受容性に対する不一致応答を自動的にリフレーミングする手法を提案する。
Redditのコメントと返信のデータセットを使用して、各戦略に従って返信を自動的に再設定します。
我々のフレームワークで生成された応答は、元の応答よりもはるかに受信性が高いと認識されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:35:22 GMT)
Mitigating Quantization Errors Due to Activation Spikes in GLU-Based LLMs [5.4] ポストトレーニング量子化(PTQ)は、ウェイトとアクティベーションを定量化し、精度を下げる一般的なアプローチとなっている。
本稿では,現代の大規模言語モデルのフィードフォワードネットワーク(FFN)において広く利用されているGLU変種におけるアクティベーション量子化の課題について述べる。
本稿では,量子化時のアクティベーションスパイクを分離するために,量子化フリーモジュール(QFeM)と量子化フリープリフィックス(QFeP)の2つの経験的手法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:54:14 GMT)
CEEBERT: Cross-Domain Inference in Early Exit BERT [5.4] CeeBERTは、中間層で観測されたドメイン固有の信頼度から最適な閾値を学習する。
CeeBERTは、BERT/ALBERTモデルを最小限の精度で、$2times$ -3.5times$でスピードアップすることができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:36:10 GMT)
Large Language Models Help Reveal Unhealthy Diet and Body Concerns in Online Eating Disorders Communities [5.4] 摂食障害(ED)は世界中の何百万人もの若者、特に青年に影響を及ぼす。
EDを宣伝し、標準化するオンラインコミュニティの急増は、この公衆衛生危機に結びついている。
本研究では,大規模言語モデルをコミュニティの言語に適応させることにより,オンラインコミュニティの暗黙の態度を明らかにする新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:12:07 GMT)
MambaMixer: Efficient Selective State Space Models with Dual Token and Channel Selection [5.4] トークンとチャネル間の二重選択機構を用いたデータ依存重みを持つ新しいSSMベースのアーキテクチャであるMambaMixerブロックを提案する。
また、QSMixerと呼ばれる効率の良いMambaMixerの変種も提示し、シークエンスと埋め込み次元の両方に沿って情報を混合する。
画像分類,セグメンテーション,オブジェクト検出における手法の性能を評価する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:53:15 GMT)
Hand bone age estimation using divide and conquer strategy and lightweight convolutional neural networks [5.4] 小児の骨年齢の推定は、成長障害や関連疾患を診断し、成熟後の最終身長を推定する上で非常に重要である。
骨年齢を推定する従来の方法は、時間を要する左手のアトラス画像とX線画像を比較して行う。
深層ニューラルネットワークモデルを用いて骨の年齢を推定するために,提案手法を用いて骨の精度と速度を改善するために多くの研究がなされている。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:39:33 GMT)
Lower Bound on the Greedy Approximation Ratio for Adaptive Submodular Cover [5.3] 適応部分モジュラー被覆のグリーディアルゴリズムは、少なくとも1.3*(1+ln Q)の近似比を持つことを示す。
同じアルゴリズムに対して (1+ln2 近似比) を主張する先行結果を無効化する。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:56:46 GMT)
On the Weight Dynamics of Deep Normalized Networks [5.3] ディープニューラルネットワークの層間の効果的な学習率(ELR)の相違は、トレーニング容易性に悪影響を及ぼす可能性がある。
正規化層を持つネットワークの重み力学をモデル化することにより、これらの相違が時間とともにどのように進化するかを定式化する。
一定の学習率のトレーニングでは,初期勾配の爆発にもかかわらず,ELR比が1に収束することが証明された。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:49:02 GMT)
Credal Wrapper of Model Averaging for Uncertainty Estimation on Out-Of-Distribution Detection [5.2] 本稿では,ベイズニューラルネットワーク(BNN)と深層アンサンブルのモデル平均化のクレダルセット表現を定式化するための,クレダルラッパー(redal wrapper)と呼ばれる革新的なアプローチを提案する。
BNNや深層アンサンブルから導かれる単一分布の有限個の集合が与えられた場合、提案手法はクラスごとの上層と下層の確率境界を抽出する。
提案手法は,BNNおよび深層アンサンブルベースラインと比較して,不確実性推定において優れた性能を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:51:22 GMT)
EvGGS: A Collaborative Learning Framework for Event-based Generalizable Gaussian Splatting [5.2] 本稿では,EvGGSと呼ばれるイベントベース汎用3D再構成フレームワークを提案する。
フィードフォワード方式でイベント入力のみから3Dガウスとしてシーンを再構築する。
提案手法は, 再現性, 深度・強度予測において, 良好な速度で全てのベースラインより優れた性能を発揮する。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:10:26 GMT)
EVI-SAM: Robust, Real-time, Tightly-coupled Event-Visual-Inertial State Estimation and 3D Dense Mapping [5.2] 単眼イベントカメラを用いた6自由度ポーズトラッキングと3次元再構成の課題に対処するために,EVI-SAMを提案する。
新しいイベントベースのハイブリッドトラッキングフレームワークは、特徴マッチングの堅牢性と直接アライメントの精度を活用することで、ポーズを推定するように設計されている。
私たちの知る限りでは、イベントベースの高密度マッピングを実現するための非学習作業としてはこれが初めてです。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:39:26 GMT)
Leverage Staking with Liquid Staking Derivatives (LSDs): Opportunities and Risks [5.2] Proof of Stake (PoS) エコシステムでは、ユーザは Lido に ETH を張って stETH (Liquid Stake Derivative, LSD) を受け取ることができる。
Lido、Aave、Curveのコンポーザビリティは、レバレッジ・ステークとして知られる新たな戦略を可能にします。
本稿では,レバレッジ・ステークの機会とリスクについて考察する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:50:59 GMT)
Efficient Medical Question Answering with Knowledge-Augmented Question Generation [5.1] 本稿では,医療領域における小言語モデルの習熟度を2倍のアプローチで向上させる手法を提案する。
まず、医療教科書のコーパスでモデルを微調整する。
そして、GPT-4を用いて、下流タスクに類似した質問を生成し、教科書の知識でトリガーし、モデルを微調整する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:53:52 GMT)
AndroidWorld: A Dynamic Benchmarking Environment for Autonomous Agents [5.0] 我々は、20の現実のAndroidアプリケーションで116のプログラムタスクに対して報酬信号を提供する、完全に機能するAndroid環境であるAndroidWorldを提示する。
AndroidWorldのメリットと運用モードを示すために、新しいコンピュータ制御エージェントM3Aを導入する。M3Aは、AndroidWorldのタスクの30.6%を完了し、将来の作業に十分な余地を残している。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:48:54 GMT)
Push and Pull: A Framework for Measuring Attentional Agency [5.0] 本稿では,デジタルプラットフォーム上での注目度測定のための枠組みを提案する。
これらの定義は、生成基盤モデルの影響を暗示するために用いられる。
我々は、オンラインの注目機関の流通を理解し、形を変えるための一連の政策戦略で締めくくります。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:26:04 GMT)
FAdam: Adam is a natural gradient optimizer using diagonal empirical Fisher information [5.0] 我々はアダムの対角的経験的フィッシャー情報行列(FIM)を厳密に分析した。
我々の分析は、元のAdamアルゴリズムの欠陥を明らかにし、提案された修正に繋がる。
修正アルゴリズムであるFisher Adam (FAdam) は、様々な領域で優れた性能を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:46:39 GMT)
Multi-Representation Genetic Programming: A Case Study on Tree-based and Linear Representations [5.0] 本稿では,ツリーベースおよび線形表現に基づく多表現GPアルゴリズムを提案する。
また,木に基づく表現と線形表現の相互作用を利用するクロス表現演算子を開発した。
実験結果から,基本木に基づく表現と線形表現の学習知識のナビゲートがGPの有効性を向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:47:06 GMT)
Exclusively Penalized Q-learning for Offline Reinforcement Learning [4.9] 制約に基づくオフライン強化学習(RL)は、分散シフトに起因する過大評価誤差を軽減するために、ポリシー制約や値関数に対する罰則を課す。
本稿では、ペナル化値関数を持つ既存のオフラインRL法における制限に着目し、値関数に導入される不要なバイアスによる過小評価バイアスの可能性を示す。
本稿では,推定誤差を誘導し易い状態を選択的にペナライズすることで,値関数における推定バイアスを低減する排他的罰則Q-ラーニング(EPQ)を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:06:05 GMT)
Large Language Models for Conducting Advanced Text Analytics Information Systems Research [4.9] 大規模言語モデル(LLM)は、巨大な構造化されていないテキストデータセットから洞察を処理および抽出できるツールとして登場した。
本稿では,情報システム研究のためのテキスト分析(TAISR)フレームワークを提案し,LLMの運用方法を理解するために情報システムコミュニティを支援する。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:24:59 GMT)
Capsule Network Projectors are Equivariant and Invariant Learners [4.9] 本稿では,Capsule Networks(CapsNets)を用いた不変な自己教師型アーキテクチャを提案する。
等価な自己教師型アーキテクチャにおけるCapsNetsの使用により,下流性能が向上することが実証された。
Capsule Invariant Equivariant Network(Capsule Invariant Equivariant Network)と呼ばれるこのアプローチは、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:04:23 GMT)
TrustRate: A Decentralized Platform for Hijack-Resistant Anonymous Reviews [4.8] 私たちはTrustRateを紹介します。これは、真正、匿名、改ざん防止レビューのための、エンドツーエンドの分散、ハイジャック耐性プラットフォームです。
数千のノード規模のプロトタイプの実装と評価により、当社のプラットフォームの有効性と性能を実証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:27:53 GMT)
Qubit-efficient Variational Quantum Algorithms for Image Segmentation [4.7] 量子コンピューティングは、古典的なアルゴリズムの範囲を超えて、様々な計算タスクを変換することが期待されている。
本研究では,教師なし画像分割における変分量子アルゴリズム(VQA)の適用について検討する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:21:57 GMT)
Hierarchical Salient Patch Identification for Interpretable Fundus Disease Localization [4.7] 階層型サルエントパッチ同定法(HSPI)を提案する。
HSPIは、画像レベルのラベルとニューラルネットワーク分類器のみを使用して、解釈可能な疾患の局在を達成することができる。
医用画像データセット上で病気の局所化実験を行い、複数の評価指標上で最高のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:07:21 GMT)
SFDDM: Single-fold Distillation for Diffusion models [4.7] 本研究では,教師の拡散モデルを任意のステップの生徒モデルに柔軟に圧縮できる一次元蒸留アルゴリズムSFDDMを提案する。
4つのデータセットの実験では、SFDDMは、ステップを約1%に減らした高品質なデータをサンプリングできることが示されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:11:14 GMT)
This Too Shall Pass: Removing Stale Observations in Dynamic Bayesian Optimization [4.6] 我々は、データセットから無関係な観測をその場で除去できるDBOアルゴリズムを構築した。
We establish the superiority of W-DBO which is outperforming state-of-the-art method by a comfortable margin。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:22:59 GMT)
Masked Image Modelling for retinal OCT understanding [4.6] 本研究は,網膜CT画像の表現学習におけるマスク画像モデリングの有効性について検討する。
我々は、自己教師付き学習のためのシンプルでスケーラブルな方法であるMasked Autoencoders (MAE)を活用し、OCT画像の強力で汎用的な表現を得る。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:57:54 GMT)
Unified Neural Backdoor Removal with Only Few Clean Samples through Unlearning and Relearning [4.6] ニューラルネットワークのバックドアは、攻撃者がモデル動作を悪意を持って変更できるようにするため、深刻なセキュリティ上の脅威となる。
本研究では,ULRLと呼ばれるバックドアの包括的かつ効果的な除去方法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:49:09 GMT)
CityGPT: Towards Urban IoT Learning, Analysis and Interaction with Multi-Agent System [4.6] CityGPTはIoTデータの時間的分析を達成するために3つのエージェントを使用している。
我々は,大規模言語モデル(LLM)によって促進されたフレームワークを認証し,データの理解性を高めた。
実世界のデータを異なる時間で評価した結果、CityGPTフレームワークは、コンピューティングにおける堅牢な性能を保証できることが示されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:27:18 GMT)
Explaining Multi-modal Large Language Models by Analyzing their Vision Perception [4.6] 本研究では,画像埋め込み成分に着目し,MLLMの解釈可能性を高める新しい手法を提案する。
オープンワールドのローカライゼーションモデルとMLLMを組み合わせることで、同じビジョンの埋め込みからテキストとオブジェクトのローカライゼーション出力を同時に生成できる新しいアーキテクチャを構築する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:24:23 GMT)
Concept Visualization: Explaining the CLIP Multi-modal Embedding Using WordNet [4.6] 埋め込みのマルチモーダルな性質を利用して画像のCLIP埋め込みを説明する新しいサリエンシ手法を提案する。
ConVisはWordNetからの語彙情報を利用して、終末モデルがトレーニングした概念に限らず、あらゆる概念に対してタスク非依存のSaliency Mapsを計算している。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:41:17 GMT)
Automatic diagnosis of cardiac magnetic resonance images based on semi-supervised learning [4.6] 本稿では,心臓画像の自動分割と補助診断のための半教師付きモデルを提案する。
このモデルは、心臓画像の完全自動化された高精度セグメンテーション、特徴抽出、臨床指標の計算、疾患の予測を実現する。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:21:03 GMT)
IB-AdCSCNet:Adaptive Convolutional Sparse Coding Network Driven by Information Bottleneck [4.5] IB-AdCSCNetは情報ボトルネック理論に基づくディープラーニングモデルである。
IB-AdCSCNetは、情報ボトルネックトレードオフ戦略をディープネットワークにシームレスに統合する。
CIFAR-10とCIFAR-100データセットの実験結果は、IB-AdCSCNetが深い残差畳み込みネットワークの性能にマッチするだけでなく、破損したデータを扱う際の性能も優れていることを示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:35:57 GMT)
Worldwide Federated Training of Language Models [4.5] フェデレーションのフェデレーションに基づく世界規模のフェデレーション言語モデルトレーニング(Worldwide Federated Language Model Training, WorldLM)システムを提案する。
我々はWorldLMが標準フェデレーションを最大1.91Times$で上回り、完全ローカルモデルのパーソナライズされたパフォーマンスにアプローチし、プライバシー強化技術の下でこれらのアドバンテージを維持することを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:25:19 GMT)
Reframing Spatial Reasoning Evaluation in Language Models: A Real-World Simulation Benchmark for Qualitative Reasoning [4.4] 言語モデル(LM)における空間推論評価のための新しいベンチマークを提案する。
現実的な3Dシミュレーションデータに基づいており、様々なオブジェクトとそれらの空間的関係を持つ一連の多様な部屋レイアウトを提供する。
重要なコントリビューションは、論理ベースの一貫性チェックツールです。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:22:00 GMT)
Multilingual Prosody Transfer: Comparing Supervised & Transfer Learning [4.4] 本研究は,事前学習したモノリンガルテキスト音声モデルを多言語条件に適応させる学習手法の評価に焦点をあてる。
その結果,スーパービジョンファインチューニング (SFT) と比較して,TLは性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:43:24 GMT)
CrossVoice: Crosslingual Prosody Preserving Cascade-S2ST using Transfer Learning [4.4] CrossVoiceは、高度なASR, MT, TTS技術を用いて、トランスファー学習による言語間韻律の保存を行う新しいカスケードベースの音声音声翻訳システムである。
我々は、CrossVoiceと直接S2STシステムを比較し、Fisher Es-En、VoxPopuli Fr-EnなどのタスクにおけるBLEUスコアの改善と、ベンチマークデータセットCVSS-T、IndicTTSの韻律保存について総合的な実験を行った。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:30:54 GMT)
A Bias-Variance Decomposition for Ensembles over Multiple Synthetic Datasets [4.4] 最近の研究は、教師あり学習のための複数の合成データセットを生成する利点を強調している。
これらの利点は明らかな実証的な支持を持っているが、理論的な理解は今のところ非常に軽い。
複数の合成データセットを使用するいくつかの設定に対して、バイアス分散分解を導出することで理論的理解を高めることを目指す。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:35:55 GMT)
Make Inference Faster: Efficient GPU Memory Management for Butterfly Sparse Matrix Multiplication [4.4] 本稿では,バタフライ構造のためのGPU上の既存のスパース行列乗算アルゴリズムの状態を初めて評価する。
新しいカーネルを導入することで、これらのメモリ操作を最適化できることが示される。
また、新しいカーネルがニューラルネットワークの推論をいかに高速化できるかを示すことで、結果のより広範な重要性を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:36:10 GMT)
Motion-based video compression for resource-constrained camera traps [4.3] そこで我々は,カメラトラップデバイス上での動作を考慮した動画圧縮アルゴリズムを提案する。
本研究では,このアルゴリズムを昆虫・寄生虫運動追跡のケーススタディを用いて実装・テストした。
本稿では,コンピュータビジョン対応低消費電力カメラトラップ装置の遠隔動物行動監視への応用について概説する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:39:33 GMT)
Dive into Machine Learning Algorithms for Influenza Virus Host Prediction with Hemagglutinin Sequences [4.3] インフルエンザウイルスは急速に変異し、公衆衛生、特に脆弱な集団に脅威をもたらす可能性がある。
近年,機械学習アルゴリズムによるウイルス配列の高速かつ正確な予測への関心が高まっている。
本研究では,さまざまな分類レベルで機械学習アルゴリズムを評価するために,実検定データセットと各種評価指標を用いた。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:14:08 GMT)
Class incremental learning with probability dampening and cascaded gated classifier [4.3] 本稿では, Margin Dampening と Cascaded Scaling という新たな漸進正規化手法を提案する。
1つ目は、ソフト制約と知識蒸留のアプローチを組み合わせて、過去の知識を保存し、新しいパターンを忘れることを可能にします。
提案手法は,複数のベンチマークにおいて,確立されたベースラインで良好に動作することを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:10:57 GMT)
Testing Quantumness via Photon Statistics for Time-Bin based Quantum Random Number Generators [4.2] QRNGモデルにより生成される乱数におけるランダム性と量子性について考察する。
我々は、サンプルデータが既知の分布に従うかどうかをテストする効果的な方法であることが知られているので、量子性をテストするのに適した$chi2$を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:13:06 GMT)
Deep Learning Methods for Adjusting Global MFD Speed Estimations to Local Link Configurations [4.2] 本研究では,MFDに基づくネットワーク平均速度とネットワーク構成を統合し,リンクの個々の速度を正確に推定するローカル補正係数(LCF)を提案する。
ネットワークの空間的構成と時間的ダイナミクスの両方をキャプチャするために、新しいディープラーニングフレームワークを使用します。
本モデルは,集約モデルの計算的利点を保ちながら,リンクレベルの交通速度推定の精度を向上させる。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:37:33 GMT)
The Brain Tumor Segmentation (BraTS) Challenge 2023: Focus on Pediatrics (CBTN-CONNECT-DIPGR-ASNR-MICCAI BraTS-PEDs) [4.1] 中枢神経系の小児腫瘍は、小児におけるがん関連死の最も一般的な原因である。
小児の高次グリオーマの生存率は20%未満である。
BraTS-PEDs 2023チャレンジは、小児脳グリオーマのためのボリュームセグメンテーションアルゴリズムの開発に焦点を当てている。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:20:51 GMT)
Mixture of Public and Private Distributions in Imperfect Information Games [4.1] パフォーマンスを向上させるためには,プレイヤーの個人情報を使用するかを選択する必要がある。
実験により,パフォーマンスの向上を実証的に示すとともに,パフォーマンスの向上を目的として,ゲーム内の位置に応じて新たな分布を使用する必要がある。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:18:25 GMT)
Dynamic Mixture of Experts: An Auto-Tuning Approach for Efficient Transformer Models [4.1] 本稿では,トランスフォーマーに基づく基礎モデルのトレーニングと推論の効率を高めるために,DynMoE(Dynamic Mixture of Experts)技術を導入する。
DynMoEには、各トークンがアクティベートする専門家の数を自動的に決定できる新しいゲーティングメソッドが組み込まれている。
本研究は,視覚・言語タスクにおけるGMoEと視覚言語タスクにおけるMoE-LLaVAとの競合性能を比較検討した。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:18:30 GMT)
SE3D: A Framework For Saliency Method Evaluation In 3D Imaging [4.1] 3D畳み込みニューラルネットワーク(3D CNN)は、LIDAR、MRI、CTスキャンを処理できる。
Explainable Artificial Intelligenceの最近の進歩にもかかわらず、3D CNNの説明にはほとんど注力していない。
本稿では,3次元イメージングにおけるSaliency Method EvaluationのためのフレームワークSE3Dを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:55:11 GMT)
ShapeFormer: Shapelet Transformer for Multivariate Time Series Classification [4.1] 本稿では,クラス固有および汎用トランスモジュールからなる新しいシェープレットトランス (ShapeFormer) を提案する。
30のUEA MTSCデータセットに対する実験により、ShapeFormerは最先端の手法に比べて高い精度でランク付けされていることが示された。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:21:35 GMT)
Does context matter in digital pathology? [4.0] 視力の深層学習モデルが病理組織学者の慣行に従っているかどうかを解析し,病変の一部を診断する場合,周囲の組織も考慮する。
その結果,DLモデルの性能は文脈情報の量を制限すると著しく低下することがわかった。
モデルがいくつかの画像のように不安定に振る舞う場合があり、状況に応じて何回も予測を変更できることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:21:11 GMT)
Lieb-Schultz-Mattis theorems and generalizations in long-range interacting systems [4.0] 我々はリーブ=シュルツ=マティス(LSM)定理と、長距離相互作用を持つ系におけるそれらの一般化を確立する。
量子スピン鎖に対して、相互作用が距離が増加するほど早く崩壊し、ハミルトニアンが異常対称性を持つならば、ハミルトニアンは特異なギャップを持つ対称基底状態を持つことは不可能である。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:00:00 GMT)
Newton Informed Neural Operator for Computing Multiple Solutions of Nonlinear Partials Differential Equations [3.9] 非線形性に対処するNewton Informed Neural Operatorを提案する。
提案手法は,古典的ニュートン法を組み合わせ,適切な問題に対処し,一つの学習過程において複数の解を効率的に学習する。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:52:54 GMT)
Exploration of Multi-Scale Image Fusion Systems in Intelligent Medical Image Analysis [3.9] MRI画像上で脳腫瘍の自動分離を行う必要がある。
このプロジェクトは、U-Netに基づいたMRIアルゴリズムを構築することを目的としている。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:33:12 GMT)
Integrating Medical Imaging and Clinical Reports Using Multimodal Deep Learning for Advanced Disease Analysis [3.9] 医用画像や臨床報告からの異種情報を深く統合する,革新的なマルチモーダル深層学習モデルを提案する。
医用画像では、畳み込みニューラルネットワークを用いて高次元の特徴を抽出し、重要な視覚情報をキャプチャした。
臨床報告テキストでは,2方向の長期・短期記憶ネットワークと注意機構を組み合わせることで,深い意味理解を実現する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:22:10 GMT)
Can sparsity improve the privacy of neural networks? [3.9] 本稿は、ネットワークのトレーニングに使用するデータのプライバシーが向上する可能性についても検討する。
実験の結果,モデルの疎度,プライバシ,分類誤差との間には正の相関関係が認められた。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:00:59 GMT)
Domain-specific augmentations with resolution agnostic self-attention mechanism improves choroid segmentation in optical coherence tomography images [3.8] 脈絡膜は眼の重要な血管層であり、網膜光受容体に酸素を供給する。
現在、コロイドを測定するには、独立した半自動および深層学習に基づく複数のアルゴリズムを使う必要がある。
我々は、コロイドセグメンテーション(REACH)のためのロバストで解像度に依存しない、効果的な注意に基づくネットワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:35:23 GMT)
Super Tiny Language Models [3.8] Super Tiny Language Models (STLM) はパラメータ数を大幅に削減したハイパフォーマンスの実現を目指している。
我々は,プーリング機構によるバイトレベルのトークン化,ウェイトタイリング,効率的なトレーニング戦略など,革新的な手法を探求する。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:12:49 GMT)
DL2Fence: Integrating Deep Learning and Frame Fusion for Enhanced Detection and Localization of Refined Denial-of-Service in Large-Scale NoCs [3.7] DL2Fenceは、DoSの検出とローカライゼーションにDeep Learning (DL)とFrame Fusion (2F)を利用する新しいフレームワークである。
16x16メッシュNoCでは95.8%と91.7%の精度、98.5%と99.3%の精度を達成している。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:34:45 GMT)
Blood Glucose Control Via Pre-trained Counterfactual Invertible Neural Networks [3.7] 対実的可逆ニューラルネットワーク(CINN)に基づくイントロスペクティブ強化学習(RL)を提案する。
事前学習したCINNをRLエージェントのフリーズイントロスペクティブブロックとして使用し、フォワード予測と反ファクト推論を統合してポリシー更新を誘導する。
本稿では,BG予測における事前学習CINNの精度と一般化能力を実験的に検証した。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:34:59 GMT)
Gaussian Ensemble Belief Propagation for Efficient Inference in High-Dimensional Systems [3.7] 本稿では,Gaussian Ensemble Belief propagation (GEnBP)アルゴリズムを提案する。
これはEnsemble KalmanフィルタとGaBP(Gassian Belief propagation)法の融合である。
データ同化、システム識別、階層モデルなどの一般的な問題構造に適用できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 01:46:22 GMT)
Adaptive Teaching in Heterogeneous Agents: Balancing Surprise in Sparse Reward Scenarios [3.6] 実証から学ぶことは、類似エージェントでシステムを訓練する効果的な方法である。
しかし、生徒の能力の限界から外れたデモを自然に複製することは、効率的な学習を制限することができる。
本稿では,教師と学生エージェントの異質性の課題に対処するために,教員-学生学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:52:42 GMT)
MixLoRA: Enhancing Large Language Models Fine-Tuning with LoRA-based Mixture of Experts [3.6] MixLoRAは、リソース効率の良いスパースMoEモデルを構築するためのアプローチである。
評価の結果,MixLoRAはマルチタスク学習シナリオにおける最先端PEFT法と比較して約9%精度が向上していることがわかった。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:16:33 GMT)
When predict can also explain: few-shot prediction to select better neural latents [3.6] 基礎的真理をより正確に反映した潜伏変数を求めるために考案された新しい予測指標を提案する。
基底的真理が欠如している場合には、外部ダイナミクスを定量化するためのプロキシ測度を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:48:30 GMT)
A Rational Model of Dimension-reduced Human Categorization [3.6] 確率的主成分分析器(mPPCA)の混合を用いた新しい次元再現圏表現法を提案する。
$tt CIFAR-10H$データセットの試験では、各カテゴリに1つの主成分しか持たないmPPCAが、自然画像の人間の分類を効果的に予測できることが示されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:53:06 GMT)
TorchMD-Net 2.0: Fast Neural Network Potentials for Molecular Simulations [3.6] 本稿では,TorchMD-Netソフトウェアにおける大幅な進歩について述べる。
TorchMD-Netのより包括的で汎用的なフレームワークへの進化が強調されている。
最も顕著な拡張は、計算効率の大幅な改善である。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:22:55 GMT)
Online Uniform Allocation:Randomized Learning-Augmented Approximation Algorithms with Application to Digital Health [3.5] 本研究は,オンライン一様割当(OUA)の新たな課題として,未知の意思決定時間に均一に予算を分配することを目的とする。
この問題に対して設計された最初のランダム化アルゴリズムを提示し、その後、学習拡張を組み込むように拡張する。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:34:30 GMT)
Exploring the Improvement of Evolutionary Computation via Large Language Models [3.5] 進化計算(EC)は様々な領域に適用されている。
問題の複雑さが増大するにつれて、ECの限界はより明確になっている。
大きな言語モデルの膨大な知識と適応能力を活用することで、潜在的な改善の先見的な概要を提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:10:11 GMT)
How Does Bayes Error Limit Probabilistic Robust Accuracy [3.4] 敵対的な例は、ニューラルネットワーク上に構築された多くのクリティカルシステムにセキュリティ上の脅威をもたらす。
近傍に同じラベルを持つ確率は$ge 1-kappa$である。
確率的ロバストネスの訓練方法は、依然として非自明な精度損失を経験する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:51:36 GMT)
Investigating the Common Authorship of Signatures by Off-Line Automatic Signature Verification Without the Use of Reference Signatures [3.3] 本稿では,参照シグネチャが存在しない場合に,自動シグネチャ検証の問題に対処する。
私たちが探求するシナリオは、同じ著者または複数の署名者によって署名される可能性のある署名のセットで構成されています。
オフラインシグネチャの集合の共通オーサシップを自動的に推定する3つの方法について議論する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:30:48 GMT)
SmartCS: Enabling the Creation of ML-Powered Computer Vision Mobile Apps for Citizen Science Applications without Coding [3.3] 機械学習支援アプリは、データ収集タスクについて市民科学者にフィールドガイダンスを提供する。
これらのアプリはサーバ側のMLサポートに依存しているため、信頼性の高いインターネット接続が必要である。
我々は市民科学を民主化するためのプラットフォームを、研究者と参加者の両方のより広い聴衆に利用できるようにする。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:54:50 GMT)
Quantum Doeblin coefficients: A simple upper bound on contraction coefficients [3.3] 収縮係数はデータ処理の不等式を定量的に強化する。
これらの係数を計算することはしばしば困難である。
ドエブリン係数の量子一般化について議論する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:03:23 GMT)
Exploration of Attention Mechanism-Enhanced Deep Learning Models in the Mining of Medical Textual Data [3.2] 本研究では,医療用テキストマイニングにおける注意機構を利用した深層学習モデルの利用について検討した。
本研究の目的は、深層学習と注意機構を取り入れることで、本質的な医療情報を特定する能力を高めることである。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:20:14 GMT)
Large Language Models for Explainable Decisions in Dynamic Digital Twins [3.2] 動的データ駆動型Digital Twins(DDT)は、インフォームドな意思決定を可能にし、基盤となるシステムのための最適化プラットフォームを提供する。
本稿では,大規模言語モデル(LLM)を用いてDDTの説明可能性プラットフォームを提案する。
ドメイン固有の知識ベースを活用することにより、システムの意思決定に関する自然言語の説明を生成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:32:38 GMT)
Improving Language Models Trained with Translated Data via Continual Pre-Training and Dictionary Learning Analysis [3.2] 学習言語モデルにおける翻訳と合成データの役割について検討する。
我々はTinyStoriesを英語からアラビア語に翻訳する。
これらの問題を是正するために、我々は、合成された高品質なストーリーの小さなデータセットでモデルを事前訓練する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:53:04 GMT)
SoK: A Defense-Oriented Evaluation of Software Supply Chain Security [3.2] ソフトウェアサプライチェーンのセキュリティ研究と開発の次の段階は、防衛指向のアプローチから大きな恩恵を受けるだろう、と私たちは主張する。
本稿では,ソフトウェアサプライチェーンの基本的な要素とその因果関係を表現するフレームワークであるAStRAモデルを紹介する。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:53:48 GMT)
Toward TransfORmers: Revolutionizing the Solution of Mixed Integer Programs with Transformers [3.1] 混合整数プログラムの課題に対処するためにトランスフォーマーモデルを用いた革新的なディープラーニングフレームワークを導入する。
提案手法は,MIP問題のバイナリ変数の予測にトランスフォーマーを用いた最初の手法である。
本稿では,変圧器ニューラルネットワークを用いてCLSPソリューションを学習する効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:24:38 GMT)
Image Classification in High-Energy Physics: A Comprehensive Survey of Applications to Jet Analysis [3.1] 本稿では機械学習(ML)とその専門分野である深層学習(DL)を用いたアプリケーションの概要を紹介する。
本研究の第1部では, 各種粒子物理学の基礎を考察し, 利用可能な学習モデルとともに粒子物理を評価するためのガイドラインを策定する。
次に、よく定義されたビームエネルギーにおける陽子-陽子衝突を中心に高エネルギー衝突で再構成されたジェット画像の詳細な分類を行う。
提案技術は、高輝度LHC(HL-HLC)や将来の円柱ハドロンなどの将来のハドロン-ハドロン衝突体(HLC)に適用できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:06:42 GMT)
In-context Time Series Predictor [3.1] 我々は「時系列予測タスク」を入力トークンとして、トークン内に一連の(振り返り、将来の)ペアを構築することで再構成する。
従来のアーキテクチャと比較して、フルデータ、少数ショット、ゼロショット設定でパフォーマンスが一貫して向上する。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:37:00 GMT)
A Lost Opportunity for Vision-Language Models: A Comparative Study of Online Test-time Adaptation for Vision-Language Models [3.0] この研究は、様々な現実のシナリオにおける視覚言語モデルの適応性と堅牢性を高めることを目的としている。
この調査には、手作りのプロンプト、即興のアンサンブル、即発的な学習技術など、迅速なエンジニアリング戦略の分析が含まれている。
本研究では,テキスト空間のみのアンサンブルに比べて平均性能を大幅に向上させる視覚テキスト空間アンサンブルを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:27:07 GMT)
Cosmological complexity of the modified dispersion relation [3.0] スカラー場の曲率摂動は2モード圧縮状態と同一視される。
我々の数値は、修正された分散関係の複雑さは、地平線が出口した後に非線形パターンを持つことを示している。
修正された分散関係は、量子重力の様々なフレームワークの結果として呼ぶことができるので、これらのフレームワークに適用できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:51:09 GMT)
Passive and Active Learning of Driver Behavior from Electric Vehicles [3.0] 運転者の振る舞いをモデル化することは、電気自動車のエネルギー消費の予測など、自動車業界にいくつかの利点をもたらす。
機械学習手法はドライバーの行動分類に広く使われており、いくつかの課題をもたらす可能性がある。
これには、長期のウィンドウ上のシーケンスモデリングや、高価なアノテーションによるラベル付きデータの欠如が含まれる。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:39:32 GMT)
Closure Discovery for Coarse-Grained Partial Differential Equations Using Grid-based Reinforcement Learning [3.0] 本稿では,グリッドベース強化学習を用いて,未解決PDEにおけるクロージャの同定のための体系的アプローチを提案する。
我々は, 対流方程式とバーガース方程式の数値解を用いて, フレームワークの機能と限界を実証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:48:05 GMT)
Desirable Characteristics for AI Teaching Assistants in Programming Education [2.9] デジタル教育アシスタントは、即時かつ公平なラウンド・ザ・クロックのサポートを提供する、魅力的でスケーラブルな方法として登場した。
この結果から,学生はこのようなツールを,即時かつ活発な支援を提供する能力に重きを置いていることが明らかとなった。
彼らはまた、学習ジャーニーにおける自律性を維持する機能への強い好意を表明した。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:03:49 GMT)
Insight Into the Collocation of Multi-Source Satellite Imagery for Multi-Scale Vessel Detection [2.9] 深層学習(DL)を用いた衛星画像からの船舶検出は、海上監視にとって必須のソリューションである。
1つのデータセットでトレーニングされたDLモデルを、空間分解能と放射能の特徴が異なる他のデータセットに適用するには、多くの調整が必要である。
本稿では、異なる光学画像とレーダと光学データの組み合わせからなるデータセットに基づいて訓練されたDLモデルに焦点を当てた。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:19:23 GMT)
Hyperspectral Image Dataset for Individual Penguin Identification [2.9] 我々は、ハイパースペクトル(HS)画像を用いたペンギンの個人識別に取り組む。
我々の知る限りでは、HSカメラを用いてペンギンの個体間のスペクトル差を初めて分析する研究である。
実験の結果,個々のペンギンの識別にHS画像を用いることの有効性が示された。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:43:13 GMT)
Evaluating Vulnerability of Chiplet-Based Systems to Contactless Probing Techniques [2.9] 我々は、チップレットをベースとしたAMD/Xilinx VU9P FPGAにレーザー非接触型プローブ技術を適用することにより、チップレットのプローブへの露出を評価する。
我々は、インターポーラワイヤドライバを識別し、マップし、内部ノードを探索するよりも、探すことが簡単であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:38:13 GMT)
FloodDamageCast: Building Flood Damage Nowcasting with Machine Learning and Data Augmentation [2.9] FloodDamageCastは、現在、不動産洪水の被害に対応する機械学習フレームワークである。
このフレームワークは、2017年のハリケーン・ハービーの間、テキサス州ハリス郡で500メートル×500メートルの解像度で住宅の洪水被害を予測するために、異種データを活用している。
洪水被害から回復した洞察は、緊急対応者がより効率的に修理ニーズを特定し、リソースを割り当て、地上での検査を合理化するのに役立つ。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:04:41 GMT)
Text-to-Model: Text-Conditioned Neural Network Diffusion for Train-Once-for-All Personalization [2.8] テキスト・ツー・モデル生成におけるGenAIの能力について検討する。
具体的には、列車一対一パーソナライズという現実的なシナリオについて検討する。
我々は、全個人化のためのテキスト条件付きニューラルネットワーク拡散であるTinaを提示する。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:11:18 GMT)
Magnetic Resonance Image Processing Transformer for General Reconstruction [2.8] 本研究では,MR-IPT (MR-IPT) にマルチヘッドテールと1つの共有ウィンドウトランスを組み込んだ。
MR-IPTモデルの設計をガイドするために, 変圧器構造が異なるMR-IPTの3つの変異を行った。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:13:02 GMT)
AutoTRIZ: Artificial Ideation with TRIZ and Large Language Models [2.8] 発明的問題解決の理論は、体系的なイノベーションに広く適用されている。
TRIZリソースと概念の複雑さは、ユーザの知識、経験、推論能力への依存と相まって、実用性を制限する。
提案するAutoTRIZは,LPMを用いてTRIZ手法を自動化・拡張する人工的思考ツールである。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:19:12 GMT)
Conformal Convolution and Monte Carlo Meta-learners for Predictive Inference of Individual Treatment Effects [2.7] コンフォーマル畳み込みTラーナー(CCT-learner)とコンフォーマルモンテカルロメタラーナー(CMC)を紹介する。
これらの手法は、重み付き共形予測システム(WCPS)、モンテカルロサンプリング、CATEメタラーナーを利用する。
個々の治療効果(ITE)の予測分布を生成し、個別の意思決定を強化する。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:12:45 GMT)
Des-q: a quantum algorithm to provably speedup retraining of decision trees [2.7] Des-qは、回帰および二分分類タスクのための決定木を構築し、再訓練するための新しい量子アルゴリズムである。
我々は,複数のデータセット上での最先端の古典的手法に対して,Des-qのシミュレーションバージョンをベンチマークする。
提案アルゴリズムは,最新の決定木に類似した性能を示しながら,周期木再学習を著しく高速化する。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:09:22 GMT)
Subgradient Convergence Implies Subdifferential Convergence on Weakly Convex Functions: With Uniform Rates Guarantees [2.7] 非平滑な非平均近似最適化では、サブディファレンシャルマッピングの均一収束を理解することは、リスクのサンプルの定常点を解析するために重要である。
この研究は、下次写像の一様収束と下次写像の経験収束を結びつける。
ハウスドルフ計量によって測定された偏微分凸コンポジットに対する一様収束率を導出する。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:38:47 GMT)
DuEDL: Dual-Branch Evidential Deep Learning for Scribble-Supervised Medical Image Segmentation [2.7] 我々はDuEDL(Dual-Branch Evi-dential Deep Learning)と呼ばれる新しいフレームワークを提案する。
提案手法は, 精度を犠牲にすることなく, モデルの信頼性と一般化能力を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:23:57 GMT)
A Quantum Speed-Up for Approximating the Top Eigenvectors of a Matrix [2.7] 与えられた$dtimes d$ matrix $A$ のトップ固有ベクトルのよい近似を見つけることは、基礎的で重要な計算問題である。
上位固有ベクトルの近似の古典的な記述を出力する2つの異なる量子アルゴリズムを与える。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:33:13 GMT)
Space-bounded quantum state testing via space-efficient quantum singular value transformation [2.6] 空間有界量子計算のための新しい完全特徴付けを提案する。
片側エラー(単位coRQL)と片側エラー(BQL)の設定について検討する。
この結果から,空間境界状態試験問題はすべて同じクラスに対応することが明らかとなった。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:51:36 GMT)
An LSTM Feature Imitation Network for Hand Movement Recognition from sEMG Signals [2.6] 我々は,Ninapro DB2上の300ms信号ウィンドウ上での閉形式時間特徴学習にFIN(Feature-imitating Network)を適用することを提案する。
次に、下流手の動き認識タスクに事前学習したLSTM-FINを適用して、転送学習機能について検討する。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:45:15 GMT)
Harnessing Machine Learning for Discerning AI-Generated Synthetic Images [2.6] 我々は、AI生成画像と実画像の識別に機械学習技術を用いる。
ResNet、VGGNet、DenseNetといった先進的なディープラーニングアーキテクチャを洗練し、適応しています。
実験結果は重要であり、最適化されたディープラーニングモデルが従来の手法より優れていることを示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:48:08 GMT)
Quantum coherent feedback control of an N-level atom with multiple excitations [2.5] 我々は、量子コヒーレントフィードバックネットワークのダイナミクスについて研究し、そこでは、$N$レベルの原子を空洞と結合し、空洞を単一または複数の平行導波路と結合する。
原子が最高エネルギーレベルにあるとき、複数の光子がキャビティに放出され、光子は導波路にさらに伝達され、キャビティ量子電気力学(キャビティQED)システムと再相互作用する。
我々は,キャビティQEDシステムの原子状態とフォトニック状態のダイナミクスを,遅延を伴う線形制御系としてモデル化する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:47:05 GMT)
Dissociation of Faithful and Unfaithful Reasoning in LLMs [2.5] 大規模言語モデル(LLM)は、回答を生成する前に思考の連鎖推論テキストを生成するとき、下流タスクのパフォーマンスを改善する。
本研究は,LLMが思考の連鎖の誤りからどのように回復するかを考察する。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:38:58 GMT)
Enhancing Student Feedback Using Predictive Models in Visual Literacy Courses [2.4] 本研究では,5年以上にわたる大学生の視覚リテラシーコースから得られたピアレビューデータを,Na"ive Bayesモデルを用いて分析した。
本研究は,ナイーブベイズモデルの有用性,特に音声による学生のコメントの分析における有用性に注目した。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:02:36 GMT)
GaussianVTON: 3D Human Virtual Try-ON via Multi-Stage Gaussian Splatting Editing with Image Prompting [2.3] 電子商取引はバーチャルトライオン(VTON)の重要性を強調している
3D VTONの研究は、主に衣服体形状の整合性に焦点を当てている。
3Dシーン編集の進歩により、多視点編集による3D編集に2D拡散モデルが適用された。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:54:48 GMT)
Efficient recursive encoders for quantum Reed-Muller codes towards Fault tolerance [2.3] ゲートを許容する量子コードのための効率的な符号化回路は、ノイズを低減し、有用な量子コンピュータを実現するために不可欠である。
Reed-Muller と punctured Reed-Muller から構築した量子符号のクラスに対して,資源効率の良いエンコーダを構築する。
n$ qubits 上のこれらのエンコーダは回路深さが$O(log n)$で、ゲート数が以前のものよりも低い。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:28:52 GMT)
Deep Learning Classification of Photoplethysmogram Signal for Hypertension Levels [2.3] 前高血圧(正常レベル)と高血圧(ステージIとステージIIを含む)の2つのカテゴリで分類された。
精度と特異性の100%と82.1%のリコールにより、LSTMモデルはニューラルネットワークのすべての組み合わせの中で最良の結果を提供する。
最大精度71.9%はLSTM-CNNモデルによって達成されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:35:53 GMT)
Markovian Flow Matching: Accelerating MCMC with Continuous Normalizing Flows [2.3] 連続正規化フロー(CNF)は、ニューラルネットワークを用いて前記経路を生成するベクトル場をモデル化することにより、基準と目標密度の間の確率経路を学習する。
近年,Lipman et al. (2022) は生成モデルにおけるCNFsの簡易かつ安価な学習法であるフローマッチング (FM) を導入した。
我々は,この手法をマルコフサンプリング法をFM目標評価に応用し,学習した確率経路を用いてモンテカルロサンプリングを改善することにより,確率的推論に再利用する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:08:19 GMT)
Early years of Biased Random-Key Genetic Algorithms: A systematic review [2.2] 本稿では,Biased Random-Key Genetic Algorithms(BRKGA)に着目した系統的な文献レビューと文献分析を行う。
BRKGAは、遺伝的アルゴリズムとともにバイアス付き、均一でエリート的な交配戦略を持つランダムキーベースの染色体を使用するメタヒューリスティックなフレームワークである。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:47:57 GMT)
Causal Discovery under Latent Class Confounding [2.2] 非巡回因果構造は、因果を示す矢印を持つ有向非巡回グラフ(DAG)を用いて記述することができる。
グローバルに構築された因果構造は、パラメトリックな仮定なしでも同定可能であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:55:55 GMT)
Iterative Causal Segmentation: Filling the Gap between Market Segmentation and Marketing Strategy [2.1] 因果機械学習(ML)の分野は近年大きな進歩を遂げている。
これらの進歩にもかかわらず、この分野は依然として課題に直面している。
本稿では,この問題に対処するため,提案アルゴリズムの反復因果分割を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:12:33 GMT)
Reinforcement Learning with Adaptive Control Regularization for Safe Control of Critical Systems [2.1] 強化学習(Reinforcement Learning, RL)は、動的システムを制御する強力な方法であるが、その学習メカニズムは、クリティカルシステムの安全性を損なう予測不可能な行動を引き起こす可能性がある。
本稿では、RLポリシーと安全制約をハードコードするポリシー正規化器を組み合わせることで、安全なRL探索を可能にするアルゴリズムであるAdaptive Control Regularization (RL-ACR)を提案する。
本稿では,RL-ACRが安全性を無視したモデルフリーなRL手法の性能基準を達成しつつ,トレーニング中の安全性を確保することを実証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:12:00 GMT)
AdjointDEIS: Efficient Gradients for Diffusion Models [2.1] 本稿では,拡散モデルの潜在変数とパラメータを最適化する新しい手法を提案する。
我々は拡散SDEのユニークな構成を利用して、随伴拡散SDEの定式化をさらに単純化する。
共役拡散解法は確率フローODEと拡散SDEの両方の勾配を効率的に計算できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:51:33 GMT)
Hybrid Global Causal Discovery with Local Search [2.1] 関数因果モデルに基づく手法は、ユニークなグラフを識別することができるが、次元性の呪いや強いパラメトリックな仮定を課すことに苦しむ。
本研究では,局所的な因果構造を利用した観測データにおけるグローバル因果発見のための新しいハイブリッド手法を提案する。
我々は, 合成データに対する実証的な検証を行い, 正確性および最悪の場合の時間複雑度を理論的に保証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:28:16 GMT)
Autoregressive Image Diffusion: Generating Image Sequence and Application in MRI [2.0] 生成モデルは画像分布を学習し、アンサンプされたk空間データから高品質な画像の再構成に使用できる。
画像系列に対する自己回帰画像拡散(AID)モデルを提案し,それを後部MRI再構成のサンプリングに用いた。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:57:10 GMT)
Smart Bilingual Focused Crawling of Parallel Documents [2.0] 本稿では,より並列なコンテンツを見つけるためのスマートクローリング手法を提案する。
あるモデルは言語URLを推論し、別のモデルはURLのペアが並列文書を生成するかどうかを推測する。
その結果,両モデルの有効性が示された。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:45:59 GMT)
Agile Culture Clash: Unveiling Challenges in Cultivating an Agile Mindset in Organizations [2.0] アジャイル変革には、アジャイルプラクティスと組織の目標と戦略の整合性など、多くの課題があります。
非常に重要な課題の1つは、アジャイルマインドセットに関連する文化的課題である。
アジャイル文化と組織文化の相互作用から生じる課題を特定します。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:33:38 GMT)
USP: A Unified Sequence Parallelism Approach for Long Context Generative AI [2.0] シーケンス並列性(SP)は、生成AIモデルの長期コンテキスト機能をアンロックする鍵となっている。
本稿では,最先端SPアプローチ,すなわちDeepSpeed-UlyssesとRing-Attentionについて検討し,統一SPアプローチを提案する。
LLAMA3-8BモデルトレーニングにSPを用いた2つの8xA800ノードに対して,シーケンス長208Kを用いた47%のMFUを達成した。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:33:14 GMT)
Decoding Social Sentiment in DAO: A Comparative Analysis of Blockchain Governance Communities [2.0] 本稿では、主要なDeFiプロジェクトの公開フォーラムにおける言論と感情のダイナミクスの進化を深く掘り下げる。
分散化コミュニティの参加者は、Discordの議論において、概して肯定的な感情を表現している。
議論の強度と感情のダイナミクスの間には潜在的な相互作用があり、より高い議論のボリュームは、コード分析によるより安定した感情に寄与する可能性がある。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:51:33 GMT)
Zero-inflation in the Multivariate Poisson Lognormal Family [1.9] 我々はZero-Inflated PLNモデルを導入し、さらにBernoulli潜在変数として多変量ゼロインフレート成分をモデルに追加する。
数千の変数を持つデータセットにスケールアップする変動推論を用いてモデルパラメータを推定する。
次に、ZIPLNとPLNの両方を、90.6%のゼロを含む牛のマイクロバイオームデータセットに適用する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:45:21 GMT)
A Systematic Evaluation of Euclidean Alignment with Deep Learning for EEG Decoding [1.9] ユークリッドアライメント(EA)は、使いやすさ、計算の複雑さの低さ、ディープラーニングモデルとの互換性のために人気を集めている。
EAは対象物のデコーディングを4.33%改善し、収束時間を70%以上短縮する。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:54:29 GMT)
Leveraging feature communication in federated learning for remote sensing image classification [1.9] 本研究は,リモートセンシング画像分類に適用されたフェデレートラーニング(FL)のための革新的なコミュニケーション戦略を紹介し,評価する。
調査では,特徴中心のコミュニケーション,擬似重畳化,重みと特徴の両面を利用した組み合わせ手法について検討した。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:15:37 GMT)
A Comparative Analysis of Energy Consumption Between The Widespread Unreal and Unity Video Game Engines [1.8] この研究は、最も広く使われている業界規模のビデオゲームエンジンであるUnityとUnreal Engineのエネルギー消費を評価する。
我々の研究は、ビデオゲームエンジンのエネルギー消費に大きな違いがあることを確認した。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:19:16 GMT)
Qualifying and Quantifying the Benefits of Mindfulness Practices for IT Workers [1.8] 本研究は、ストレスを緩和し、IT従事者の精神的健康を改善するためのマインドフルネスを提案する。
8週間のプログラムで、ITワーカーはマインドフルネスを学び、呼吸の習慣を身につける。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:11:14 GMT)
Quantum Simulation of Spin-Boson Models with Structured Bath [1.7] 捕捉したイオンの運動状態を用いた構造浴を用いたスピンボソンモデルの量子シミュレーションを行う。
最大3つのローレンツピークからなるスペクトル密度を持つ様々なスピンボソンモデルの力学をシミュレートする。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:32:04 GMT)
Endowing Interpretability for Neural Cognitive Diagnosis by Efficient Kolmogorov-Arnold Networks [1.6] 本稿では,効率的なコルモゴロフ・アルノルドネットワーク(KAN)による神経認知診断モデルの解釈可能性の向上を提案する。
Kanは2つの方法で解釈可能性を高めるように設計されている。
4つの実世界のデータセットの実験では、提案されたKA2NCDは従来のCDMよりも優れた性能を示している。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:19:10 GMT)
Sketch-and-Project Meets Newton Method: Global $\mathcal O(k^{-2})$ Convergence with Low-Rank Updates [1.6] 高速な$mathcal O(k-2)$大域収束率を持つスケッチ・アンド・プロジェクトニュートン法を提案する。
SGNは、スケッチ・アンド・プロジェクト方式の安価なイテレーションコスト、最先端の$mathcal O(k-2)$フルランクニュートン方式のグローバル収束率、減衰ニュートン方式のアルゴリズム単純さの3つを継承している。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:37:09 GMT)
The Subfield Metric and its Application to Quantum Error Correction [1.5] 非対称誤差補正のための有限拡大体上の新しい重みと対応する計量を導入する。
重みは、基底場の要素と外部の要素を区別するが、これは非対称量子符号によって動機付けられる。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:34:09 GMT)
Sample Complexity of Algorithm Selection Using Neural Networks and Its Applications to Branch-and-Cut [1.5] 本研究は,最適な性能を持つ1つのアルゴリズムを選択するのではなく,インスタンスに基づいてアルゴリズムを選択することが可能となるような設定を考慮し,最近の研究を基礎にしている。
特に、代表的なインスタンスのサンプルが与えられた場合、問題のインスタンスをそのインスタンスの最も適切なアルゴリズムにマッピングするニューラルネットワークを学習する。
言い換えれば、ニューラルネットワークは混合整数最適化インスタンスを入力として取り、そのインスタンスの小さな分岐とカットツリーをもたらす決定を出力する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:45:26 GMT)
Activation of entanglement in generalized entanglement swapping [1.4] 本研究では,2つのベル対を含む一般化エンタングルメントスワッピングプロセスにおけるエンタングルメントの活性化と,一般化された測定値について検討する。
本研究では,最大エンタングルド2ビット初期状態と一般化された測定値に着目し,エンタングルド測定演算子の必要性と充足条件について検討する。
本研究は, 量子ネットワークの絡み合い分布に光を流すことにより, 遠方部同士の絡み合いの発生の可能性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:38:17 GMT)
ChronosLex: Time-aware Incremental Training for Temporal Generalization of Legal Classification Tasks [1.4] 本研究では,法的概念が時間とともに進化する,法的多ラベルテキスト分類タスクの動的性質がもたらす課題について検討する。
既存のモデルはしばしばトレーニングプロセスの時間的次元を見落とし、時間とともにそれらのモデルの最適以下のパフォーマンスをもたらす。
我々はChronosLexを紹介した。ChronosLexは、時系列分割のモデルを訓練し、データの時間的順序を保存するインクリメンタルトレーニングパラダイムである。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:09:16 GMT)
A Legal Risk Taxonomy for Generative Artificial Intelligence [1.4] 本稿では、生成AI(GenAI)に関連する法的リスクの分類について述べる。
これは、GenAIモデルの開発とデプロイに関する潜在的な法的課題に関する共通の理解を提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:39:46 GMT)
LARS-VSA: A Vector Symbolic Architecture For Learning with Abstract Rules [1.3] 我々は、オブジェクトレベルの特徴を抽象ルールから分離し、限られた量のデータから学習できる「関係ボトルネック」を提案する。
我々は「関係ボトルネック」戦略を高次元空間に適応させ、シンボルと関係表現の間の明示的なベクトル結合操作を取り入れた。
我々のシステムは超次元空間における演算のオーバーヘッドが低いことの恩恵を受けており、様々なテストデータセットで評価すると、技術の状態よりもはるかに効率的である。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:05:42 GMT)
Bell Nonlocality from Wigner Negativity in Qudit Systems [1.2] ウグナー負性性は、キュディット系における非局所性に必要であることを示す。
安定状態のウィグナー負性に関する相関を問うベル不等式の族を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:44:36 GMT)
Carefully Blending Adversarial Training and Purification Improves Adversarial Robustness [1.2] CARSOは、防御のために考案された適応的なエンドツーエンドのホワイトボックス攻撃から自身を守ることができる。
提案手法はCIFAR-10, CIFAR-100, TinyImageNet-200の最先端技術により改善されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:01:22 GMT)
Deterministic Policies for Constrained Reinforcement Learning in Polynomial-Time [1.2] 本稿では,制約付き強化学習問題に対する近似的決定性ポリシを効率的に計算するアルゴリズムを提案する。
我々の研究は、意思決定における現実世界の課題に対処するための証明可能な効率的なアルゴリズムを提供するだけでなく、制約された決定論的ポリシーの効率的な計算のための統一理論も提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:27:51 GMT)
Linking In-context Learning in Transformers to Human Episodic Memory [1.1] 本稿では,Transformer を用いた大規模言語モデルのコンテキスト内学習に寄与する誘導ヘッドに着目した。
本研究では,インダクションヘッドの動作,機能,機械的特性が,ヒトのエピソード記憶の文脈的保守と検索モデルに類似していることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:51:47 GMT)
DiffClone: Enhanced Behaviour Cloning in Robotics with Diffusion-Driven Policy Learning [1.1] DiffCloneは、拡散に基づくポリシー学習を伴う拡張行動クローニングエージェントのオフラインアルゴリズムである。
この論文は、NeurIPS 2023で組織されたTOTOベンチマークチャレンジへの公式提出である。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:51:24 GMT)
HUGO -- Highlighting Unseen Grid Options: Combining Deep Reinforcement Learning with a Heuristic Target Topology Approach [1.1] 本稿では,従来のDRLエージェントであるCurriculumAgent(CAgent)を新たなトポロジエージェントにアップグレードする検索アルゴリズムを提案する。
TTを含む中央値生存時間は25%向上した。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:42:25 GMT)
Contrastive and Consistency Learning for Neural Noisy-Channel Model in Spoken Language Understanding [1.1] 音声認識(ASR)に基づく自然言語理解手法を提案する。
ASRエラーによる書き起こしの不整合を処理するため,ノイズチャネルモデルの改良を行った。
4つのベンチマークデータセットの実験は、Contrastive and Consistency Learning (CCL)が既存のメソッドより優れていることを示している。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:10:23 GMT)
Computing the Bias of Constant-step Stochastic Approximation with Markovian Noise [1.1] マルコフ雑音と定数ステップサイズ$alpha$の近似アルゴリズムについて検討する。
時間平均バイアスが$alpha V + O(alpha2)$に等しいことを示し、ここでは$V$はリアプノフ方程式によって特徴づけられる定数である。
また、$bartheta_n$ は $theta*+alpha V$ 付近で高い確率で収束することを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:00:45 GMT)
Feature Fusion for Improved Classification: Combining Dempster-Shafer Theory and Multiple CNN Architectures [1.1] 本稿では、DST(Dempster-Shafer Theory)を利用して、複数の事前学習モデルを統合し、より信頼性が高く拡張された分類を提供するアンサンブルを形成する新しいアルゴリズムを提案する。
CIFAR-10とCIFAR-100データセットでいくつかの実験が行われ、提案したDST法より優れた分類精度が示された。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:44:10 GMT)
A Survey of Distributed Learning in Cloud, Mobile, and Edge Settings [1.1] この調査では、クラウドとエッジ設定を含む分散学習の状況について調査する。
データとモデルの並列性という中核的な概念を掘り下げて、モデルをさまざまな次元と層に分割して、リソースの利用とパフォーマンスを最適化する方法を調べます。
計算効率,通信オーバヘッド,メモリ制約のトレードオフを浮き彫りにして,完全接続層,畳み込み層,繰り返し層など,さまざまなレイヤタイプに対するパーティショニング方式を解析する。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:00:38 GMT)
Defining error accumulation in ML atmospheric simulators [1.0] 本稿では,誤差蓄積を測定するための定義と関連する指標を提案する。
我々の定義では、モデル欠陥による誤差と、大気系の本質的な性質による誤差を区別する。
本手法は,大気系の選択におけるRMSEと拡散/スキルによる性能向上を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:46:34 GMT)
Generating camera failures as a class of physics-based adversarial examples [1.0] カメラの故障は、外部の物理的プロセス、すなわちストレスによるコンポーネントの破壊、または内部のコンポーネントの故障の結果起こる。
本研究は、物理に基づく対角レンズのクラスとして、破壊レンズを生成するためのシミュレーション物理プロセスを開発する。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:11:20 GMT)
Training robust and generalizable quantum models [1.0] トレーニング可能なエンコーディングを持つ量子モデルに対してパラメータ依存リプシッツ境界を導出する。
固定および非トレーニング可能な符号化に対して、リプシッツ境界はパラメータをチューニングすることによって影響を受けないことが示される。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:04:16 GMT)
Markovian Agents for Informative Language Modeling [1.0] CoT(Chain-of-Thought)推論は原則として、言語モデルの内部推論をより深く理解することを可能にする。
以前の研究は、LMはCoTの変更にもかかわらず同様の質問に答えることができることを示唆しており、これらのモデルがCoTを真に使っているわけではないことを示唆している。
本研究では,将来のテキストを予測するのに十分なCoTを生成するための強化学習手法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:00:23 GMT)
Effects of Topological Boundary Conditions on Bell Nonlocality [0.9] Bell nonlocalityは、デバイスに依存しない量子情報処理タスクを可能にするリソースである。
我々の研究は、多ビットデバイスにおけるベル非局所性を証明するためのガイドとして機能する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:58:50 GMT)
Unbiased Kinetic Langevin Monte Carlo with Inexact Gradients [0.9] 動力学的ランゲヴィンダイナミクスに基づく後進手段の非バイアス化手法を提案する。
提案した推定器は偏りがなく、有限分散となり、中心極限定理を満たす。
以上の結果から, 偏りのないアルゴリズムは, ランダムなハミルトニアンモンテカルロよりもはるかに効率的であることが示唆された。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:01:36 GMT)
StyleX: A Trainable Metric for X-ray Style Distances [0.8] 本稿では,非マッチング画像ペアのスタイル差を定量化する,新しいディープラーニングベースのメトリクスを提案する。
私たちのメトリクスの中心は、X線画像スタイルの表現を生成するエンコーダです。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:48:38 GMT)
MultiCast: Zero-Shot Multivariate Time Series Forecasting Using LLMs [0.8] MultiCast は多変量時系列予測のためのゼロショット LLM ベースのアプローチである。
3つの新しいトークン多重化ソリューションは、キー繰り返しパターンを保持しながら、次元性を効果的に減少させる。
実世界の3つのデータセットに対する最先端アプローチに対するRMSEと実行時間の観点から,我々のアプローチのパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:16:00 GMT)
Mining the Explainability and Generalization: Fact Verification Based on Self-Instruction [0.8] 本稿では,自己指導に基づくファクトチェックのための微調整手法を提案する。
最小スケールのLLaMA-7Bモデルを微調整し、挑戦的な事実チェックデータセットFEVEROUSとHOVERで評価する。
本手法は, 自己指導型学習をファクトチェックに活用し, コントラスト学習とDPOの改善を両立させる。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:02:37 GMT)
PySCIPOpt-ML: Embedding Trained Machine Learning Models into Mixed-Integer Programs [0.8] 機械学習予測器を最適化問題に組み込むオープンソースツールであるPySCIPOpt-MLを紹介した。
PySCIPOpt-MLは、広く使われているMLフレームワークとオープンソースのMIPソルバと対話することによって、ML制約を最適化問題に簡単に統合する方法を提供する。
本稿では,SurrogateLIB上での計算結果について述べる。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:28:01 GMT)
Equipping Computational Pathology Systems with Artifact Processing Pipelines: A Showcase for Computation and Performance Trade-offs [0.7] 損傷組織, ぼかし, 折りたたみ組織, 気泡, 組織学的に無関係な血液を含む5つの重要な人工物を検出するための専門家(MoE)の混合手法を提案する。
2つのMoEと2つのマルチクラスモデルであるDCNNとビジョントランスフォーマーを用いたDLパイプラインを開発した。
提案されたMoEは86.15%のF1と97.93%の感度スコアを持ち、ViTを用いたMoEよりも推論の計算コストが低い。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:10:49 GMT)
What exactly does Bekenstein bound? [0.7] ウンルーチャネルの古典的および量子的容量は、復号器ボブに関連するベッケンシュタイン境界に従うことを示す。
古典ビットや量子ビットとは異なり、ゼロビットとその関連する情報処理能力は一般にベーケンシュタイン境界に制約されない。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:56:27 GMT)
Saturated absorption spectroscopy and frequency locking of DBR laser on the D2 transition of rubidium atoms [0.7] Rb原子のLD2遷移に0.5MHz線幅を有する狭帯域DBRレーザーの飽和吸収分光(SAS)および周波数同期(FL)を実験的に報告した。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:05:52 GMT)
Emergence of spatial patterns and synchronization in superconducting time crystals [0.6] 故障した超伝導体における駆動周波数の周波数半分を特徴とする時間結晶相について検討した。
我々は、結晶相が終了する金属相において、依然として深い臨界障害強度を見出した。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:22:12 GMT)
Temporal Stamp Classifier: Classifying Short Sequences of Astronomical Alerts [0.6] 本研究では,ZTF (Zwicky Transient Facility) 調査で報告された警報を用いた天体の深層学習に基づく分類モデルを提案する。
このモデルは、各アラートに含まれるスタンプイメージとメタデータのシーケンスと、All-WISEカタログの特徴を入力として扱う。
提案モデルでは, 約98%の精度で3種類の天体を識別できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:49:32 GMT)
stl2vec: Semantic and Interpretable Vector Representation of Temporal Logic [0.6] 論理式を意味的に基底としたベクトル表現(機能埋め込み)を提案する。
我々はいくつかの望ましい性質を持つ公式の連続的な埋め込みを計算する。
本稿では,学習モデル検査とニューロシンボリック・フレームワークの2つの課題において,アプローチの有効性を実証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:04:56 GMT)
Fairness Hub Technical Briefs: Definition and Detection of Distribution Shift [0.6] 分散シフトは機械学習タスクにおいて一般的な状況であり、モデルのトレーニングに使用されるデータは、モデルが現実世界に適用されるデータとは異なる。
本稿では,教育環境における分布変化の定義と検出に焦点をあてる。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:29:36 GMT)
Efficient Mitigation of Bus Bunching through Setter-Based Curriculum Learning [0.5] 本稿では,セッターモデルを用いて,行動空間,対向強み,集団強みを自動生成するカリキュラム学習手法を提案する。
自動カリキュラム学習の手法は、動的に選択され、敵対するネットワークによって学習されるカリキュラムを含む。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:26:55 GMT)
Retrieval-Augmented Mining of Temporal Logic Specifications from Data [0.5] この研究は、観測された振る舞いからデータ駆動的な方法でSTL要求を学習するタスクに対処する。
本稿では,ベイズ最適化(BO)と情報検索(IR)技術を組み合わせて,STL式の構造とパラメータを同時に学習する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:29:00 GMT)
Sports center customer segmentation: a case study [0.4] この調査は顧客セグメンテーションの健全な提案につながった。
この提案のハイライトは、問題を分解する便利なデータ分割、適応距離関数の定義、遺伝的アルゴリズムによる最適化である。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:05:04 GMT)
Data Augmentation Method Utilizing Template Sentences for Variable Definition Extraction [0.4] 本研究では,テンプレート文と変数定義ペアから新たな定義文を生成する手法を提案する。
その結果,提案手法が生成した定義文で訓練したモデルは89.6%の精度で既存モデルを上回った。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:14:05 GMT)
As an AI Language Model, "Yes I Would Recommend Calling the Police'': Norm Inconsistency in LLM Decision-Making [0.4] われわれは、Amazon Ringのホーム監視ビデオで警察を呼ぶかどうかを判断するリスクの高いアプリケーションに焦点を当てている。
対象者の肌色, 性別, 映像が記録された地区の特徴について, 3つの最先端LCMの判断について検討した。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:22:02 GMT)
Emotion Identification for French in Written Texts: Considering their Modes of Expression as a Step Towards Text Complexity Analysis [0.4] 本稿では,文章中の文が感情を表現するかどうか,(B)その表現のモード,(C)基本か複雑か,(D)その感情カテゴリーを予測することを目的とする。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:02:13 GMT)
Training Quantum Boltzmann Machines with the $β$-Variational Quantum Eigensolver [0.4] 量子ボルツマンマシン(Quantum Boltzmann machine, QBM)は、古典的データと量子状態の両方に対する生成機械学習モデルである。
我々は,$beta$-VQEで得られる低ランク表現が,低ランクターゲット状態の学習に有効な方法であることを示す。
物理量子デバイス上でのトレーニングモデルを実装した。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:10:42 GMT)
Advancements in Feature Extraction Recognition of Medical Imaging Systems Through Deep Learning Technique [0.4] 高速な画像認識を実現するために,重みに基づく目的関数を提案する。
単純なアルゴリズムを用いたしきい値最適化手法を提案する。
異なる種類のオブジェクトは互いに独立しており、画像処理においてコンパクトであることがわかった。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:46:51 GMT)
Evaluating Large Language Models for Public Health Classification and Extraction Tasks [0.4] 本稿では,自由テキストの分類と抽出を含む公衆衛生業務におけるLarge Language Models(LLMs)の評価について述べる。
当初、ゼロショットインコンテキスト学習を用いて、全タスクにまたがる5つのオープンウェイトLCMを評価した。
LLMが公衆衛生の専門家にとって、様々な無料テキストソースから情報を抽出するのに有用なツールであることを示す有望な兆候を見出した。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:33:18 GMT)
Generative Plant Growth Simulation from Sequence-Informed Environmental Conditions [0.3] 植物成長シミュレーションは、植物または植物系の再構成された視覚表現として特徴付けられる。
本稿では、条件付き生成モデルを用いて、植物表現の分布を暗黙的に学習するシーケンスインフォームド植物成長シミュレーションフレームワーク(SI-PGS)を紹介する。
我々は,SI-PGSが時間的依存を捕捉し,植物シーンの現実的なフレームを連続的に生成できることを実証した。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:06:46 GMT)
Towards Educator-Driven Tutor Authoring: Generative AI Approaches for Creating Intelligent Tutor Interfaces [0.3] 我々は、教師インターフェイス作成において、教育者を支援するための生成AI機能を導入する。
提案手法では,Large Language Models (LLM) を利用して,チューターのレイアウトと内容を生成する。
小規模比較では,教師インタフェース設計の効率を高めるためのアプローチの可能性を示している。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:46:10 GMT)
Exploring the use of a Large Language Model for data extraction in systematic reviews: a rapid feasibility study [0.3] 本稿では,大規模言語モデル (LLM) である GPT-4 を用いて,体系的レビューにおけるデータ抽出(セミ)の実現可能性について述べる。
その結果,約80%の精度で,領域間での変動が認められた。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:24:23 GMT)
HTN-Based Tutors: A New Intelligent Tutoring Framework Based on Hierarchical Task Networks [0.3] 階層型タスクネットワーク(HTN)を用いたエキスパートモデルを表現するインテリジェントなチュータフレームワークであるHTNベースのチュータを提案する。
さまざまな問題解決戦略の柔軟なエンコーディングを可能にし、階層的な知識組織によるさらなるメリットを提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:46:42 GMT)
Event-based dataset for the detection and classification of manufacturing assembly tasks [0.2] このデータセットは、あらゆる製造組立体において人間の操作者が行う製造原始的なタスク(アイドル、ピック、プレース、ネジ)の選択を示す。
DAVIS240Cイベントカメラは、光強度値の変化が発生した時にイベントを登録する非同期視覚センサである。
各製造プリミティブは、合計400のサンプルに対して、イベントやグレースケールフレームを含むDAVIS240Cデータの100のサンプルを記録している。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:32:52 GMT)
Operational Framework for a Quantum Database [0.2] 古典的および量子的データとインデックス化を用いて、データ構造のより広い文脈で量子データベースを導入する。
重畳状態に格納されたデータの生成と操作に必要な基本的な操作の定義に焦点を当てる。
アルゴリズムの実装を示し、その利点と限界を強調します。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:00:20 GMT)
Evaluation of the Programming Skills of Large Language Models [0.2] 大規模言語モデル(LLM)は、タスクが完了する効率とスピードに革命をもたらした。
本稿では,OpenAI の ChatGPT と Google の Gemini AI の2つの主要な LLM の出力品質を,双方のフリーバージョンで生成されたプログラミングコードの品質と比較することにより,批判的に検証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:04:36 GMT)
Quantum field theory for multipolar composite bosons with mass defect and relativistic corrections [0.1] 我々は、核と電子からなる原子の相互作用、スピン輸送、あるいは荷電アンサンブルのための部分空間有効場理論を提案する。
我々は、コボソンの中心運動と質量欠陥によって符号化された内部構造との間の相対論的結合を得る。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:07:49 GMT)
Simulating the Air Quality Impact of Prescribed Fires Using Graph Neural Network-Based PM$_{2.5}$ Forecasts [0.1] 本研究では, 時空PM$_2.5$予測のための時空間グラフニューラルネットワーク(GNN)に基づく予測モデルを提案する。
2段階のアプローチを用いて、予測モデルを用いて、山火事のPM$_2.5$の寄与を推定する。
本稿では,GNNに基づくPM$_2.5$予測モデルと所定の火災シミュレーションを統合し,PM$_2.5$予測手法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:41:48 GMT)
Ab-initio tree-tensor-network digital twin for quantum computer benchmarking in 2D [0.1] ノイズのある中間スケール量子(NISQ)コンピュータのハミルトン力学の大規模数値シミュレーションは、特定のハードウェアに量子アルゴリズムをチューニングする戦略を開発する上で大きな役割を果たす可能性がある。
我々は、リドベルク原子間のファンデルワールス相互作用によって誘導されるゲートクロストークの効果を定量化する。
約700個のゲートを持つ64ビットのグリーンバーガー・ホーネ・ザイリンガー状態(GHZ)の調製により、クローズドシステムでは99.9%の忠実度が得られ、並列化により35%のスピードアップが達成される。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:51:14 GMT)
Automatic segmentation of Organs at Risk in Head and Neck cancer patients from CT and MRI scans [0.1] 深層学習(DL)は、OAR(Organs at Risk)セグメンテーションのために広く研究されている。
本研究は頭部癌と頸部癌患者のMRIおよびCTから30個のOARを分離するためのパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:59:40 GMT)
Label Propagation Techniques for Artifact Detection in Imbalanced Classes using Photoplethysmogram Signals [0.1] 本研究では,光胸腺X線写真(PPG)信号間のラベル伝搬技術の適用について検討した。
1571例のPSG記録を含むデータセットについて検討し, サンプルの約82%がクリーンであり, 残りの18%がアーティファクトによって汚染された。
その結果,LPアルゴリズムは精度91%,リコール90%,F1スコア90%を達成できた。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:36:51 GMT)
Graphcode: Learning from multiparameter persistent homology using graph neural networks [0.1] グラフコードは、2つの実数値スケールパラメータに沿ってフィルタリングされるデータセットを処理する。
グラフコードは情報的かつ解釈可能な要約を与える。
グラフニューラルネットワークを使用して、機械学習パイプラインに簡単に統合できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:22:00 GMT)
The Channel Capacity of a Relativistic String [0.1] 電力と情報を伝達する相対論的チャネルの容量の制限について検討する。
弦の一方の端を束ねることで、電力と情報の両方を他方の端に伝達することができる。
私は、電力と情報という2種類のチャネル容量が互いに干渉していると推測するので、最大電力を伝送する唯一の方法は情報を送ることであり、その逆である。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:58:00 GMT)
Probing de Sitter Space Using CFT States [0.0] 三次元ド・ジッター空間における局所励起に双対な CFT 状態を構築する。
バルク座標値の量子推定のための情報計量は、ド・ジッター空間計量を再現することを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:15:57 GMT)
Lagrangian Neural Networks for Reversible Dissipative Evolution [0.0] 最も一般的には、摩擦損失のない保守的なシステムがモデル化されているため、規則化を必要とせずに、システムは前後に進むことができる。
この研究は、進行進化で発生する散逸のために逆方向が悪くなるシステムに対処する。
新規性はMorse-Feshbach Lagrangian(英語版)の使用であり、これは系の次元の数を2倍にすることで散逸力学をモデル化する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:47:07 GMT)
Work fluctuation theorems with initial quantum coherence [0.0] ゆらぎ定理は、線形反応則を超えた非平衡熱力学の基本的な結果である。
作業変動定理における初期量子コヒーレンスの役割について検討する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:56:25 GMT)
Wigner Analysis of Particle Dynamics and Decoherence in Wide Nonharmonic Potentials [0.0] 非調和ポテンシャルにおける粒子の1次元運動の時間発展を概ね記述したウィグナー関数の解析式を導出する。
その結果,古典物理学と量子物理学の相互作用と非線形力学におけるデコヒーレンスの影響が解明された。
この分析結果は、大粒子のマクロ量子状態を生成するために非線形力学を用いて提案を設計し、最適化し、理解するのに役立つ。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:30:54 GMT)
ViHateT5: Enhancing Hate Speech Detection in Vietnamese With A Unified Text-to-Text Transformer Model [0.0] 提案する大規模ドメイン固有データセット VOZ-HSD を事前トレーニングした T5 ベースのモデルである ViHateT5 を紹介する。
ViHateT5はテキストからテキストへのアーキテクチャのパワーを活用することで、統一モデルを使用して複数のタスクに対処し、ベトナムのすべての標準HSDベンチマークで最先端のパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:31:50 GMT)
UzMorphAnalyser: A Morphological Analysis Model for the Uzbek Language Using Inflectional Endings [0.0] 接尾辞は、単語に付加的な意味と文法的機能を加えることによって、単語の形態解析において重要な役割を果たす。
本稿では,ユーズベク語の形態解析のモデル化について述べる。
提案されたモデルに基づく開発ツールは、WebベースのアプリケーションとオープンソースのPythonライブラリとして利用できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:06:55 GMT)
Understanding the dynamics of the frequency bias in neural networks [0.0] 近年の研究では、従来のニューラルネットワーク(NN)アーキテクチャは学習プロセスにおいて顕著な周波数バイアスを示すことが示されている。
2層NNの誤差の周波数ダイナミクスを明らかにする偏微分方程式(PDE)を開発した。
実験により、同じ原理が多層NNに拡張されていることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:09:16 GMT)
Unbounded entropy production and violent fragmentation in long-range interacting super-Tonks-Girardeau systems [0.0] 長距離相互作用を持つ1次元ボース気体の非平衡ダイナミクスを、$(frac1ralpha)$$(0.5 alpha 4.0$)として崩壊させる。
緩和は、暴力的な断片化とカオス的な非局在化によって実証される複雑な中間力学によって達成される。
本研究は、最先端の実験で設計可能な、チューニング可能な長距離相互作用システムの複雑な緩和挙動を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:00:00 GMT)
Ultra-cold atoms quantum tunneling through single and double optical barriers [0.0] ボース・アインシュタイン凝縮トンネルに関する教科書実験を行った。
特に、量子散乱状態において単一の光学障壁を持つ原子トンネルを実証する。
原子性ファブリ・ペロトキャビティを形成する2つのバリアの事例について検討した。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:54:11 GMT)
Transformers for Image-Goal Navigation [0.0] 本稿では,画像目標,カメラ観測,ロボットの過去の動作を共同でモデル化し,将来の行動を予測するための生成トランスフォーマーモデルを提案する。
本モデルでは,長期間の地平線上での視覚情報の収集と関連性を実証し,ナビゲーションの効率化に寄与する。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:01:32 GMT)
Towards Realistic Long-tailed Semi-supervised Learning in an Open World [0.0] 我々は、既知のカテゴリと新規カテゴリの分布関係を前提としない、よりエフェリアティックなオープンワールドLong-tailed Semi-supervised Learning(textbfROLSSL)を構築する。
提案したROOSSL設定では、二重ステージロジット調整と呼ばれる、シンプルで効果的な解を提案する。
CIFAR100やImageNet100のようなデータセットの実験では、最大50.1%のパフォーマンス改善が示されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:53:50 GMT)
Time-dependent Hamiltonians and Geometry of Operators Generated by Them [0.0] 量子力学系のハミルトニアンに付随する複雑性幾何学を得る。
時間的発展を通じて演算子を得るための総コストの間に等価性が存在することを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:32:29 GMT)
The role of excitation vector fields and all-polarisation state control of cavity magnonics [0.0] キャビティマグノニクスは、量子およびスピンベースの技術の進歩を可能にするプラットフォームを提供する。
本稿では,2ポートキャビティ構成で偏光とプロファイルを容易に調整できる励起ベクトル場を提案する。
我々はキャビティ共振器内の任意の偏極状態と電界分布について実験結果を正確に予測し、再現する理論モデルを開発した。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:17:05 GMT)
The nuclear-spin dark state in silicon [0.0] ゲート定義シリコン二重量子ドットにおける核スピン暗黒状態の形成について報告する。
暗黒状態は、量子ドット中の電子が半導体中の核を解離状態に駆動するときに、動的核分極中に現われると予測されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:47:27 GMT)
The last Dance : Robust backdoor attack via diffusion models and bayesian approach [0.0] 拡散モデルは、前方と後方の学習原理に基づいて訓練された最先端のディープラーニング生成モデルである。
人工知能研究の世界で人気のあるフレームワークであるHugging Faceから派生したオーディオトランスフォーマーに対するバックドア攻撃の可能性を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:27:39 GMT)
The hydrogen atom perturbed by a 1-dimensional Simple Harmonic Oscillator (1d-SHO) potential [0.0] 一定の1次元弱二次ポテンシャルによって摂動された水素原子は、一階摂動理論において解かれる。
この結果の物理的応用は、例えば、微細構造効果よりも弱い二次ゼーマン効果の研究において見られる。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:39:07 GMT)
The Rarity of Musical Audio Signals Within the Space of Possible Audio Generation [0.0] ホワイトノイズ信号は任意の値の構成にアクセスできるが、統計学的に多くのサンプルが均一なスペクトル分布を呈する傾向がある。
ホワイトノイズが異なる期間にわたって音楽のような信号を生成する確率を解析する。
本研究の適用性は,音楽が貴重な希少性を持つことを示すだけでなく,音声信号空間の全体サイズに対する音楽の大きさの検証によって,新しい世代のアルゴリズム音楽システムに情報を提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:25:46 GMT)
The Dual Imperative: Innovation and Regulation in the AI Era [0.0] 本稿では,人工知能における規制の欠如に伴う社会的コストについて論じる。
50年以上にわたるAI研究は、AIを主流に、有望な経済的利益へと押し上げてきた。
この談話は、加速主義者と、未発の技術的進歩を提唱するドーマー、そしてディストピア的な結果を防ぐための減速を求めるドーマーの間で偏在している。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:26:25 GMT)
Text-Based Correlation Matrix in Multi-Asset Allocation [0.0] 本研究の目的は、財務テキスト分析を用いて、複数の資産間の相関構造を推定することである。
我々はニューステキストと中央銀行のテキストで自然言語処理を行い、将来の相関係数の変化の予測精度を検証した。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:25:51 GMT)
Tell my why: Training preferences-based RL with human preferences and step-level explanations [0.0] そこで我々は,人間にフィードバックを与えるためのより表現力豊かなインタフェースを提供する,嗜好に基づく新しい学習手法を提案する。
これらの説明により、人は軌道のどの部分が好みに最も関係しているかを説明できる。
以上の結果から,拡張されたフィードバックによって学習速度が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:23:33 GMT)
Targeted Nakamoto: A Bitcoin Protocol to Balance Network Security and Energy Consumption [0.0] ターゲットナカモト(Targeted Nakamoto)は、ターゲットのハッシュレート間隔で鉱山労働者を誘引するProof-of-Workプロトコル拡張である。
ハッシュレートが目標以上の場合、天井は、採掘者が受け取ることができるブロック報酬の上に置かれる。
ハッシュレートが目標より下にある場合、床は採掘者のブロック報酬の下に置かれる。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:26:25 GMT)
Spread complexity in saddle-dominated scrambling [0.0] 本研究では, サーモフィールド二重状態の拡散複雑性について考察した。
Lanczosアルゴリズムを適用すると、これらのシステムにおける拡散複雑性が、エンフェーシス系を連想させる特徴を示すことが判明した。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:04:26 GMT)
Spectral radii for subsets of Hilbert $C^*$-modules and spectral properties of positive maps [0.0] Rota-Strang型の特徴付けは、関節のスペクトル半径に対して証明される。
外部スペクトル半径の観点からの関節スペクトル半径の近似結果が確立されている。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:28:05 GMT)
Sparse $L^1$-Autoencoders for Scientific Data Compression [0.0] L1$-regularizedの高次元ラテント空間を用いたオートエンコーダの開発により,効率的なデータ圧縮手法を提案する。
本稿では,これらの情報に富む潜伏空間を用いて,ぼやけなどのアーティファクトを緩和し,科学的データに対する高効率なデータ圧縮手法を実現する方法について述べる。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:48:00 GMT)
SpaceByte: Towards Deleting Tokenization from Large Language Modeling [0.0] トークン化は、パフォーマンスが大幅に向上するため、大きな言語モデルで広く使用されている。
バイトレベルとサブワード自動回帰言語モデリングのパフォーマンスギャップを埋める新しいバイトレベルデコーダアーキテクチャであるSpaceByteを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:41:41 GMT)
SolNet: Open-source deep learning models for photovoltaic power forecasting across the globe [0.0] SolNetは、新しい汎用多変量太陽発電予測器である。
我々はSolNetがデータスカース設定よりも予測性能を向上させることを示す。
転校学習実践者に対するガイドラインと考察を行う。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:00:35 GMT)
Social AI and The Equation of Wittgenstein's Language User With Calvino's Literature Machine [0.0] 大規模言語モデル(LLM)に基づいたチャットボットのようなAIシステムに心理的述語を登録するのは賢明か?
ソーシャルAIは完全な言語ユーザではなく、むしろItalo Calvinoの文学マシンに似ている。
致命的な計算の枠組みは、社会AIが物語のファクソン・ド・パラーに必要な基本的オートポエシスを欠いていることを示すために用いられる。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:51:44 GMT)
Slow measurement-only dynamics of entanglement in Pauli subsystem codes [0.0] サブシステム量子誤り訂正符号に基づく量子回路の非単位ダイナミクスについて検討する。
サブシステム符号の非局所安定化器生成器がサブシステム対称性の形式をとる回路を考える。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:00:00 GMT)
Simple Hamiltonian dynamics is a powerful quantum processing resource [0.0] 50以上の物理量子ビットを持つ量子プロセッサによってホストされる4次元ヒルベルト空間は、計算タスクを実行するのに十分強力であると予想されている。
量子システムの複雑性と積分可能性/対称性の相互作用が量子ニューラルネットワークとしての性能を規定していることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:24:50 GMT)
Selective disclosure of claims from multiple digital credentials [0.0] 本稿では,MerkleハッシュツリーとBoneh-Lynn-Shachamシグネチャを組み合わせた選択的開示手法を提案する。
選択的な開示に加えて、このアプローチを用いて複数の発行者が署名した証明書の発行を可能にする。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:26:39 GMT)
Scalable embedding of parity constraints in quantum annealing hardware [0.0] 我々はイジング・ハミルトニアンと呼ばれる最適化問題を埋め込むのに使える固定的でモジュラーでスケーラブルな埋め込みを提示する。
これらの埋め込みは、よく知られたパリティ写像の拡張の結果である。
我々は、新しい埋め込みが既存の量子異方体にどのようにマッピングされ、埋め込みされたハミルトンの物理的性質が元のハミルトンの性質と一致するかを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:14:33 GMT)
Rotations of Gödel algebras with modal operators [0.0] 本論文は、直微分可能構造に基づく作用素を持つG"odel環の連結かつ非連結な回転の効果を研究することを目的としている。
この構成から得られる構造は、直微分可能代数上で定義される特別なモジュラー作用素を持つ零極小(否定的不動点を持つか否かに関わらず)である。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:59:06 GMT)
Rethinking the Elementary Function Fusion for Single-Image Dehazing [0.0] 本稿では,画像デハージングのための革新的なデハージングネットワーク(CL2S)を提案する。
DM2Fモデルに基づいて、アブレーション実験の問題を識別し、元の対数関数モデルを三角(正弦)モデルに置き換える。
実験により、CL2Sは複数のデハジングデータセットにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:58:14 GMT)
Realizing triality and $p$-ality by lattice twisted gauging in (1+1)d quantum spin systems [0.0] ツイストガウス法則作用素を定義し、格子上の有限群のツイストガウイングを実装する。
SPTアンタングルを最初に適用し,その後に未操作のガウイングを行う2段階の手順と等価であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:00:02 GMT)
Real Time Deep Learning Weapon Detection Techniques for Mitigating Lone Wolf Attacks [0.0] 本研究は、モデル検証とトレーニングのための(You Look Only Once)ファミリーとFaster RCNNファミリに焦点を当てる。
モデルは推定速度8.1msで最高スコア78%に達する。
しかし、より高速なRCNNモデルはAP 89%を達成している。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:48:26 GMT)
Ravnest: Decentralized Asynchronous Training on Heterogeneous Devices [0.0] Ravnestは、計算ノードをクラスタに効率的に整理することで、分散トレーニングを促進する。
遅延更新を伴うブロック構造最適化問題として,非同期SGD損失関数のフレーム化を行った。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:01:25 GMT)
Qudit generalization of the qubit echo and its application to a qutrit-based Toffoli gate [0.0] 一般キューディットに対するクォービットエコーの一般化であるベースサイクリングを導入する。
我々は、IBM量子コンピュータ上での量子プロセストモグラフィーにより、CCZゲート忠実度93.8 +-0.1を得る。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:18:09 GMT)
Quantum-assisted Rendezvous on Graphs: Explicit Algorithms and Quantum Computer Simulations [0.0] 我々は,単純なグラフ上での一段階のランデブーゲームにおいて,ノイズの多い中間スケール量子(NISQ)プロセッサを用いて量子優位性について検討した。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:01:02 GMT)
Quantum thermodynamic derivation of the energy resolution limit in magnetometry [0.0] エネルギー分解能の限界は、量子計測とランダウアー消去に関連する量子熱力学的作用の結果であることを示す。
これらの考察を原子磁気センサやSQUIDSに適用する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:24:51 GMT)
Quantum coherence from Kirkwood-Dirac nonclassicality, some bounds, and operational interpretation [0.0] 我々は、KD非古典性に基づく量子コヒーレンスの忠実な量子化器を開発する。
KD-非古典性コヒーレンス(英語版)は、KD準確率の非現実性と負性性を同時にキャプチャする。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:28:15 GMT)
Quantum amplitude estimation from classical signal processing [0.0] 本稿では, 振幅推定の問題は, 到着方向推定と呼ばれる信号処理における問題に直接対応できることを示す。
位相推定自由な並列量子振幅推定(QAE)アルゴリズムを作成し、全クエリの複雑さは$sim 4.9/varepsilon$で、並列クエリの複雑さは$sim 0.40/varepsilon$で95%の信頼性を持つ。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:31:46 GMT)
Quantum algorithm for collisionless Boltzmann simulation of self-gravitating systems [0.0] 衝突のないボルツマン方程式(CBE)を解くための効率的な量子アルゴリズムを提案する。
我々は,自己重力系の量子シミュレーションを行うアルゴリズムを拡張し,重力を計算する手法を取り入れた。
これにより、将来の量子コンピュータで大規模なCBEシミュレーションを実行できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:34:25 GMT)
Quantum Self-Propulsion of an Inhomogeneous Object out of Thermal Equilibrium [0.0] エキゾチックな電磁特性を必要とせず、真空中で自然力が発生することを示す。
推進力の源は、体の異なる部分からの放射の非対称パターンである。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:20:42 GMT)
Quantum Mpemba Effect in Random Circuits [0.0] クイディット上の電荷保存ランダム回路における量子Mpemba効果を、エンタングルメント非対称性を用いて研究する。
我々は、初期状態の非対称なクラスがより高速に対称性を回復し、大カノニカルアンサンブルに達することを示す。
この結果は,ジェネリックシステムにおけるMpemba物理の出現を明らかにする上で,大きな進歩を示している。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:51:54 GMT)
Quantum Mixtures of Ultracold Atomic Gases [0.0] 異なる種類の超低温ガスの組み合わせは、強力な実験の枠組みを構成する。
少数の人から多体体制に至るまで,様々な話題を調査するためにどのように活用できるかを示す。
最近の実験結果の選択と今後の興味深い方向性について述べる。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:40:54 GMT)
Quadrupolar resonance spectroscopy of individual nuclei using a room-temperature quantum sensor [0.0] 核四極子共鳴(NQR)分光は、物質や分子の化学結合パターンを明らかにする。
従来のNQR技術では、検出可能な信号を得るためには、核のマクロなアンサンブルが必要となる。
ダイヤモンド中の窒素空孔(NV)中心のような光学活性電子スピン量子ビットは、個々の核の検出と制御を容易にする。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:58:48 GMT)
Proximity to Losslessly Compressible Parameters [0.0] ニューラルネットワークでは、隠れたユニットが少なくて同じ関数を実装できる。
単層双曲型タンジェントネットワークの設定において、パラメータのランクを隠蔽単位の最小数として定義する。
パラメータの近位を厳密に拘束する問題はNP完全であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:52:59 GMT)
Prediction of cancer dynamics under treatment using Bayesian neural networks: A simulated study [0.0] 我々は,治療中の癌動態を予測するために,サブポピュレーション動態の階層的ベイズモデルを構築した。
多発性骨髄腫 (MM) では, 血清M蛋白が腫瘍負担の指標としてよく知られている。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:47:19 GMT)
Predicting Traffic Congestion at Urban Intersections Using Data-Driven Modeling [0.0] 本研究は,米国の主要都市の交差点における混雑予測モデルの構築を目的とする。
データセットには、座標、通り名、日時、トラフィックメトリクスを含む27の機能が含まれている。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:46:32 GMT)
Photon-Pressure with an Effective Negative Mass Microwave Mode [0.0] 我々は、負の質量振動子の力学を模倣する超伝導LC回路にマイクロ波モードを示す。
実効性負の質量力学は, 動的バックアクションの逆転と, ブルー変調ポンプ場による低周波回路のサイドバンド冷却に繋がることを示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:49:02 GMT)
Parametrically controlled chiral interface for superconducting quantum devices [0.0] 本稿では,超伝導量子ビットと直接統合される制御可能な指向性インタフェースの設計と実験的実現について報告する。
我々は,30dB程度の最大方向性を実現し,独立キャリブレーション測定から装置の性能を定量的に予測した。
我々の研究は、超伝導量子デバイスのオール・ツー・オール接続ネットワークにおいて、アイソレータフリーの量子ビット読み出し方式と高忠実な絡み合い発生への経路を提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:15:40 GMT)
Out-of-Time Ordered Correlators in Kicked Coupled Tops: Information Scrambling in Mixed Phase Space and the Role of Conserved Quantities [0.0] オフ・オブ・タイム順序相関器(OTOC)を用いた二部蹴り結合トップス(KCT)システムの演算子成長について検討した。
OTOCはカオス力学による「情報の揺らぎ」を定量化し、古典的なリャプノフ指数の量子アナログとして機能する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:31:00 GMT)
Open-Path Detection of Organic Vapors via Quantum Infrared Spectroscopy [0.0] QFTIR分光は、スペクトルの中赤外領域における従来の分光の代替として現れた。
大気中における複数の干渉性有機ガスの開路検出にQFTIR分光計を初めて使用した。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:24:23 GMT)
On the Sample Complexity of Quantum Boltzmann Machine Learning [0.0] モデルと目標との期待値の差からQBM学習の運用的定義を与える。
解は、少なくとも複数のギブス状態を用いて勾配降下で得られることを証明した。
特に,平均場,ガウスフェルミオン,幾何学的局所ハミルトニアンに基づく事前学習戦略を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:56:28 GMT)
Music Genre Classification: Training an AI model [0.0] 音楽ジャンル分類は、音声信号の処理に機械学習モデルと技法を利用する分野である。
本研究では,音楽ジャンル分類のための機械学習アルゴリズムについて,音声信号から抽出した特徴を用いて検討する。
ジャンル分類のための機械学習モデルの堅牢性を評価し、その結果を比較することを目的としている。
論文参考訳(メタデータ) (Thu, 23 May 2024 23:07:01 GMT)
Minimum number of neurons in fully connected layers of a given neural network (the first approximation) [0.0] 本稿では,任意のネットワークが与えられた問題を解く際の,完全連結層内のニューロンの最小数を探索するアルゴリズムを提案する。
提案アルゴリズムは,検出されたニューロン数のニューラルネットワークが要求される品質に適応可能であることを保証していないため,層内のニューロンの最小数を推定するための最初の近似である。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:46:07 GMT)
M2ANET: Mobile Malaria Attention Network for efficient classification of plasmodium parasites in blood cells [0.0] マラリアはPlasmodium parasites(プラスモジウム・寄生虫)によって引き起こされる致命的な伝染病であり、世界中の公衆衛生問題を引き起こす。
深層学習技術は医用画像解析タスクにおいて顕著に成功し、診断精度を向上させるための有望な道を提供する。
血液細胞画像中のプラスモジウム寄生虫の効率的な分類のためのハイブリッド移動モデルであるM2ANET(Mobile Malaria Attention Network)を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:22:33 GMT)
Local and nonlocal stochastic control of quantum chaos: Measurement- and control-induced criticality [0.0] 古典ベルヌーイ写像に着想を得た量子モデルの族における位相図の普遍性を位相制御の下で研究する。
量子モデルは、古典的なモデルから制御誘起相転移を継承し、また、量子設定への固有の絡み合い相転移を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:00:01 GMT)
Lindbladian way for the relaxation time approximation, application to Kibble-Zurek processes due to environment temperature quench, and to Lindbladian perturbation theory [0.0] 大域的なリンドブラディアン・アンサッツが構築され、温度$T$で、調査された系のギブズ状態に熱化される。
このアンザッツはハミルトニアンの2つの固有状態全てを接続し、緩和時間近似(RTA)として知られる単純なマスター方程式をもたらす。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:41:51 GMT)
Likelihood-Free Gaussian Process for Regression [0.0] 確率モデルについてはほとんど知識がない場合もある。
可能性自由ガウス過程(LFGP)と呼ばれる新しい枠組みを提案する。
提案するフレームワークは、可能性のないモデリングに多大な貢献を期待する。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:48:08 GMT)
Lieb-Schultz-Mattis Theorem with Long-Range Interactions [0.0] 我々は、$SO(3)$スピン回転と格子変換対称性を示す$d$次元スピン系におけるリーブ=シュルツ=マティスの定理を証明した。
I型は長距離スピンスピン結合を持ち、II型は$SO(3)$対称局所作用素の間の長距離スピンスピン結合である。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:00:37 GMT)
Leveraging Semantic Segmentation Masks with Embeddings for Fine-Grained Form Classification [0.0] 本稿では,意味的セグメンテーションとディープラーニングモデルを統合した表現型学習戦略を提案する。
我々は、きめ細かい、教師なしの形式分類に埋め込まれた埋め込みを初めて評価する。
我々は、我々のアプローチを実証するために、2つの新しいデータセット(19世紀と1950年の国勢調査記録)をコントリビュートした。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:28:50 GMT)
Large Language Models' Detection of Political Orientation in Newspapers [0.0] 新聞の立場をよりよく理解するための様々な方法が開発されている。
LLM(Large Language Models)の出現は、研究者や市民を補助する破壊的な可能性を秘めている。
我々は,広く採用されている4つのLCMが新聞の位置づけを評価する方法を比較し,その回答が相互に一致しているかどうかを比較する。
膨大なデータセットを通じて、新聞の記事は単一のLCMによって著しく異なる位置に配置され、アルゴリズムの一貫性のないトレーニングや過度なランダム性を示唆している。
論文参考訳(メタデータ) (Thu, 23 May 2024 06:18:03 GMT)
Language processing in humans and computers [0.0] このノートは、言語モデルの高レベルな概要を提供し、学習機械の低レベルなモデルの概要を示す。
幻覚を認識し、安全に夢を見ることができるようになった後、言語学習機械は、誤った信念と自己確認理論のより広範なシステムを生成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:08:57 GMT)
Lai Loss: A Novel Loss for Gradient Control [0.0] ライロス」は、正規化項(特に勾配)を従来の損失関数に統合した新しい損失設計である。
この損失により、モデルの滑らかさと感度を効果的に制御できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:41:32 GMT)
Interpretable Price Bounds Estimation with Shape Constraints in Price Optimization [0.0] 本稿では、価格最適化の文脈における価格境界の解釈可能な推定について述べる。
まず、歴史的価格データに基づく3つの異なるアプローチを用いて価格境界を推定する。
次に、形状制約を含む最適化問題を解くことにより、推定価格境界を調整する。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:30:16 GMT)
Interpolating Parametrized Quantum Circuits using Blackbox Queries [0.0] 本稿では、(三角法)を用いたパラメタライズド量子回路のための古典的サロゲートの開発に焦点をあてる。
このようなサロゲートを構築するための2つのアルゴリズムを開発し、性能保証を証明する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:25:12 GMT)
Integrability and chaos in the quantum brachistochrone problem [0.0] 制御ハミルトニアン部分集合の司法的選択から生じる、完全に可積分なブラキストロンプロトコルの族を導入する。
完全に統合可能なプロトコルの固有の安定性が、それらを数値的に抽出可能であり、したがって実践可能であることを実証する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:45:10 GMT)
Inside the black box: Neural network-based real-time prediction of US recessions [0.0] 長期記憶(LSTM)とゲートリカレントユニット(GRU)は、1967年から2021年までのアメリカの不況をモデル化するために使用される。
シェープ法は、S&P500指数のような重要なリセッション指標を3カ月間予測する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:51:59 GMT)
Input-driven circuit reconfiguration in critical recurrent neural networks.Marcelo O. Magnasco [0.0] 入力のみを用いて経路を「オンフライ」に再構成できる,非常に単純な単一層再帰ネットワークを提案する。
このネットワークは、信号の伝搬を各領域に沿ってのみ評価することで、古典的な接続性問題を解決する。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:15:23 GMT)
In Silico Sociology: Forecasting COVID-19 Polarization with Large Language Models [0.0] 我々は、デジタル化されたテキストの膨大なアーカイブにディープニューラルネットワークをトレーニングし、歴史的および現代的な言説を構成する複雑な言語パターンを学習する。
我々は、2019年の世論の展望を再構築し、既存の政治談話の中で、COVID-19に対する今後の偏極がどの程度予測されたかを調べる。
その結果、シミュレートされた回答者は84%の患者において、新型コロナウイルスの態度のパルチザン的な違いを再現した。
論文参考訳(メタデータ) (Thu, 23 May 2024 22:10:12 GMT)
Impact of the form of weighted networks on the quantum extreme reservoir computation [0.0] 量子極端貯水池計算(QERC)は、汎用的な量子ニューラルネットワークモデルである。
本稿では,その簡単な実装経路を持つ乱れ離散時間結晶に基づく単純なハミルトンモデルが,ほぼ最適性能を実現する方法を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:34:34 GMT)
Impact of Non-Standard Unicode Characters on Security and Comprehension in Large Language Models [0.0] 本稿では、15個の異なるモデルの性能の比較分析を行う。
モデルは、ジェイルブレイク、幻覚、理解エラーの総発生に基づいて評価される。
Unicodeの数字記号を標準ラテンブロックの外側に組み込んで、他の言語の文字の変種を組み込むことで、ガードレールの有効性の低下を観測した。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:24:38 GMT)
Identification of malfunctioning quantum devices [0.0] 我々は、そのような機器のネットワークの一部を構成する誤動作量子デバイスを正しく識別する問題を考察する。
同定に最適な確率は、大域的な量子測定を必要とすることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:46:13 GMT)
High transparency induced superconductivity in field effect two-dimensional electron gases in undoped InAs/AlGaSb surface quantum wells [0.0] 本研究では,24nm幅のヒ素表面量子井戸における電界効果2次元電子ガス(2DEG)の輸送特性について報告する。
量子化量子化量子ホールプラトーを用いた高品質単一サブバンド磁気輸送が観測された。
酸化超伝導はNb系超伝導体-正規超伝導体(SNS)接合で示される。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:22:33 GMT)
High fidelity distribution of triggered polarization-entangled telecom photons via a 36km intra-city fiber network [0.0] 単位[780]nmからのQD放射をテレコム波長に変換するために、双方向偏光保存量子周波数変換(QFC)を用いる。
実世界の応用に向けてのステップとして、ユニット[35.8]フィールドを設置した標準単一モードファイバリンクに沿って絡み合ったペアの1つの光子が伝播した後、高い絡み合いの忠実度を報告する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:35:54 GMT)
Green Multi-Objective Scheduling -- A memetic NSGA-III for flexible production with real-time energy cost and emissions [0.0] この研究は、生産をリアルタイムエネルギー市場へ調整する産業に焦点を当て、グリッドに柔軟な消費を提供する。
本研究では, 省エネ, 省エネ, 排出を最小化し, 実エネルギー市場データを統合するための新しいメメティックNSGA-IIIを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:11:21 GMT)
Graphlets correct for the topological information missed by random walks [0.0] 我々は、2つのノードの隣接度を、与えられた一対のグラフレット軌道上で共起するものとして定量化する軌道隣接性を導入する。
我々は、kノードまでのランダムウォーキングが、kノードグラフレットまでの全ての軌道隣接部分集合のみをキャプチャすることを証明する。
ランダムウォークで見えないものを含む軌道上の隣接性は、ランダムウォークに基づく隣接性よりも優れています。
論文参考訳(メタデータ) (Thu, 23 May 2024 05:42:38 GMT)
Giant splitting of the hydrogen rotational eigenenergies in the C$_2$ filled ice [0.0] 水素水和物は、圧力と温度の両方に影響される豊富な相図を示し、いわゆるC$$相は2.5GPa以上で顕著に現れる。
この相では、水素分子は立方体氷のような格子の中に密に充填され、周囲の水分子との相互作用は量子回転力学に大きな影響を与える。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:03:16 GMT)
Ghost-Stereo: GhostNet-based Cost Volume Enhancement and Aggregation for Stereo Matching Networks [0.0] ステレオマッチングに基づく深度推定の現在の手法は,多数のパラメータとスローランニング時間に悩まされている。
本稿では,新しいステレオマッチングネットワークであるGhost-Stereoを提案する。
Ghost-Stereoは、いくつかの公開ベンチマークで最先端のリアルタイムメソッドと同等のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:02:30 GMT)
Generation of vortex electrons by atomic photoionization [0.0] 我々は、第1ボルン近似における原子イオン化において、ツイスト光線から電子への軌道角運動量移動の過程を探求する。
励起電子は光子の伝播軸上に1つの原子が配置されている場合、OAMの絶対射影を持つ。
原子の位置をシフトすると、電子OAMの有限分散が得られる。
論文参考訳(メタデータ) (Thu, 23 May 2024 20:06:47 GMT)
Fast Inference Using Automatic Differentiation and Neural Transport in Astroparticle Physics [0.0] 多次元パラメータ空間は、アストロ粒子物理学の理論でよく見られる。
彼らはしばしば、このコミュニティに伝統ある技法を使って横断するのに高価である複雑な後部幾何学を持っている。
この分野に進出し始めたばかりの最近のイノベーションは、そのような複雑な後部をナビゲートすることを可能にした。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:00:00 GMT)
Extreme Solar Flare Prediction Using Residual Networks with HMI Magnetograms and Intensitygrams [0.0] HMI強度図とマグネティックグラムを用いた極端太陽フレアの予測手法を提案する。
強度図から太陽点を検出し、磁気グラムから磁場パッチを抽出することにより、極度のクラスフレアを分類するためにResidual Network(ResNet)を訓練する。
我々のモデルは高精度で、極端太陽フレアを予測し、宇宙天気予報を改善するための堅牢なツールを提供する。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:17:16 GMT)
Exact Gauss-Newton Optimization for Training Deep Neural Networks [0.0] 一般化されたガウスニュートン(GN)ヘッセン近似と低ランク線形代数を組み合わせた2階最適化アルゴリズムEGNを提案する。
線形探索,適応正則化,運動量などの改良をEGNにシームレスに追加して,アルゴリズムをさらに高速化する方法について述べる。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:21:05 GMT)
Evolution and learning in differentiable robots [0.0] 我々は、異なるシミュレーションを用いて、多数の候補体計画において、行動の個々の神経制御を迅速かつ同時に最適化する。
個体群における各ロボットの機械的構造の変化は,探索の外ループに遺伝的アルゴリズムを適用した。
シミュレーションで発見された非常に微分可能な形態の1つは、物理ロボットとして実現され、その最適化された振る舞いを維持できた。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:45:43 GMT)
Evidence of the quantum-optical nature of high-harmonic generation [0.0] 我々は,高調波発生は,非古典的な光の発生を,システムのデコヒーレンスに先立って行うことができることを示す。
これはスケーラビリティやデコヒーレンス、巨大な絡み合った状態の生成といった量子技術の課題に対処する可能性がある。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:53:45 GMT)
Enhancing Image Layout Control with Loss-Guided Diffusion Models [0.0] 条件付き拡散モデルは、単純なテキストプロンプトを使用して、所望の画像の内容を指定することができる。
空間制約(例えばバウンディングボックス)を導入するほとんどのメソッドは微調整を必要とするが、これらのメソッドのより小型でより最近のサブセットはトレーニング不要である。
本稿では,これらの手法を補完的な特徴を強調した解釈を行い,両手法がコンサートで使用される場合,優れた性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 02:08:44 GMT)
Enhancing Critical Infrastructure Cybersecurity: Collaborative DNN Synthesis in the Cloud Continuum [0.0] 研究者は、重要なインフラストラクチャ(CI)システムのコスト効率と効率を高めるために、IoTとクラウド継続とAIの統合を検討している。
しかし、この統合はCIシステムのサイバー攻撃に対する感受性を高め、停電、石油流出、核事故などの破壊につながる可能性がある。
我々は、訓練されたエッジクラウドモデルを使用して、中央クラウドモデルを合成する革新的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:36:45 GMT)
Enhanced Droplet Analysis Using Generative Adversarial Networks [0.0] この研究は、DropletGANという画像生成装置を開発し、ドロップレットの画像を生成する。
また、合成データセットを用いた光液滴検出器の開発にも用いられている。
我々の知る限りでは、この研究は初めて、液滴の検出を増強するための生成モデルを用いたものである。
論文参考訳(メタデータ) (Thu, 23 May 2024 00:36:27 GMT)
Employing weak-field homodyne detection for quantum communications [0.0] 我々は、コヒーレントな状態符号化を持つ損失ボソニックチャネル上での量子通信における弱場ホモダイン(WF)測定の役割について検討する。
この種の受信機は、有限分解能と低強度局所発振器を備えた光子数分解(PNR)検出器を用いる。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:30:34 GMT)
Embedding Compression for Efficient Re-Identification [0.0] ReIDアルゴリズムは、オブジェクトの新しい観測結果を以前に記録されたインスタンスにマッピングすることを目的としている。
我々は3つの異なる次元還元法とともに量子化学習をベンチマークする。
ReIDの埋め込みは96倍まで圧縮でき、性能は最小限に抑えられる。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:57:11 GMT)
EHRMamba: Towards Generalizable and Scalable Foundation Models for Electronic Health Records [0.0] 我々は,Mambaアーキテクチャ上に構築された堅牢な基盤モデルであるEHRMambaを紹介する。
EHRMambaは、線形計算コストのために、以前のモデルよりも最大4倍長いシーケンスを処理できる。
EHRデータに対するMTF(Multitask Prompted Finetuning)の新たなアプローチを導入することで,EHRMambaは単一ファインタニングフェーズで複数の臨床タスクを同時に学習することが可能になる。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:43:29 GMT)
Dynamic, Symmetry-Preserving, and Hardware-Adaptable Circuits for Quantum Computing Many-Body States and Correlators of the Anderson Impurity Model [0.0] ハミルトン予想値は$omega(N_q)N_textmeas. leq O(N_textimpN_textbath)$対称性保存並列測定回路を必要とする。
我々のアンサッツは、初期のフォールトトレラントプロセッサの電子的相関を考慮に入れるのに有用なツールである。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:41:28 GMT)
DuanzAI: Slang-Enhanced LLM with Prompt for Humor Understanding [0.0] 本稿では,中国語のスラングを深く理解したLarge Language Models(LLM)の革新的アプローチであるDuanzAIを紹介する。
キュレートされたデータセットと高度な技術を活用して、DuanzAIは人間の表現とAI理解のギャップを埋める。
実験では,LLMの性能をPunchline Entity Recognition(PER)システムと対比し,音声マッチングとPinyin2hanzi技術を統合した。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:13:50 GMT)
Domain Wall Magnetic Tunnel Junction Reliable Integrate and Fire Neuron [0.0] 本稿では,磁区壁と磁気トンネル接合を用いた人工統合火災ニューロンデバイスの設計と製造について述べる。
本研究では,磁壁-磁気トンネル接合型ニューロンデバイスにおける信頼性のある統合火炎リセットの実証実験を行った。
その結果、磁壁-磁気トンネル接合型ニューロンデバイスにおいて、信頼性の高い統合火炎リセットを初めて実現し、ニューロモルフィックコンピューティングにおけるスピントロニクスの約束を示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:56:52 GMT)
Distributed High-Dimensional Quantile Regression: Estimation Efficiency and Support Recovery [0.0] 我々は高次元線形量子レグレッションのための分散推定とサポート回復に焦点をあてる。
元の量子レグレッションを最小二乗最適化に変換する。
効率的なアルゴリズムを開発し、高い計算と通信効率を享受する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:15:05 GMT)
Discretization of continuous input spaces in the hippocampal autoencoder [0.0] 本研究は,海馬位置細胞と同様の空間的チューニングを,スパルスオートエンコーダニューロンにおける視覚事象の離散記憶の形成により実現可能であることを示す。
実験の結果を聴覚領域に拡張し、経験に依存した方法でニューロンが同様に周波数空間を刺激することを示した。
最後に,これらの疎密で高次元の表現を用いて,強化学習エージェントが様々な空間認知タスクを効果的に実行可能であることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:16:44 GMT)
Diffusion models for Gaussian distributions: Exact solutions and Wasserstein errors [0.0] 拡散モデルやスコアベースモデルでは画像生成の性能が向上した。
本研究では,データ分布がガウス的である場合の拡散モデルの挙動とその数値的実装について理論的に検討する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:28:56 GMT)
Designing A Sustainable Marine Debris Clean-up Framework without Human Labels [0.0] 海洋の破片は、鳥類、魚、その他の動物の生命に重大な生態学的脅威をもたらす。
伝統的に残骸の堆積を評価する方法には、労働集約的かつ高価な手作業による調査が含まれる。
本研究では,ドローンが捉えた空中画像を利用して遠隔地ゴミ調査を行うフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:28:23 GMT)
Deep learning lattice gauge theories [0.0] ニューラルネットワーク量子状態を用いて格子ゲージ理論の基底状態を2+1$次元で正確に計算する。
この結果から,ニューラルネットワーク量子状態は格子ゲージ理論の高精度な研究方法として有望であることが示唆された。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:46:49 GMT)
Deep Blur Multi-Model (DeepBlurMM) -- a strategy to mitigate the impact of image blur on deep learning model performance in histopathology image analysis [0.0] スライド画像全体の非シャープ領域を含む画質は、モデルパフォーマンスに影響を及ぼす。
本研究では,非シャープ画像領域の負の影響を軽減するためのマルチモデル手法を提案する。
DeepBlurMMはいくつかの条件下で予測性能を改善した。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:55:39 GMT)
Decolonial AI as Disenclosure [0.0] 機械学習とAIによる「AI植民地主義」は、概念的には「データ植民地主義」と重なる用語であり、不正の一形態である。
政治的には、デジタル資本主義のヘゲモニーを強制するが、生態学的には環境に悪影響を及ぼし、天然資源の抽出とエネルギー消費を増大させる。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:45:37 GMT)
Decision-Focused Forecasting: Decision Losses for Multistage Optimisation [0.0] 本稿では,予測の時間的時間的決定効果を考慮した多層モデルである決定中心予測を提案する。
本モデルでは,予測による状態パスを考慮した調整を行った。
エネルギー貯蔵調停タスクへのモデルの適用を実証し,本モデルが既存手法より優れていることを報告する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:48:46 GMT)
Data Augmentation Techniques for Process Extraction from Scientific Publications [0.0] 我々はプロセス抽出タスクをシーケンスラベリングタスクとしてキャストし、文中のすべてのエンティティを識別し、プロセス固有の役割に従ってラベル付けする。
提案手法は,(1)原文からのプロセス固有の情報,(2)役割ラベルの類似性,(3)文類似性を利用して意味のある拡張文を作成する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:09:02 GMT)
D-MiSo: Editing Dynamic 3D Scenes using Multi-Gaussians Soup [0.0] そこで我々はD-MiSo(Dynamic Multi-Gaussian Soup)を提案する。
また,パラメータ化されたガウススプラットをリンクし,推定メッシュと三角スープを形成する手法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:53:01 GMT)
Critical quantum dynamics of observables at eigenstate transitions [0.0] 我々は、局所的な電荷密度波状態からクエンチした時、転移時にスケール不変臨界ダイナミクスを示す物理観測変数を同定する。
これらの性質は、量子クエンチ力学におけるスケール不変臨界ダイナミクスが観測可能量によっても示されることを示唆している。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:50:23 GMT)
Critical behaviours of non-stabilizerness in quantum spin chains [0.0] 非安定化器性は、量子状態が安定化器状態から逸脱する程度を測定する。
本研究では, 量子スピン鎖の臨界度に関する非安定化剤の挙動について検討する。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:42:25 GMT)
Corrupted sensing quantum state tomography [0.0] 本稿では, 量子状態と構造ノイズの同時再構成を可能にする, 劣化検出型量子状態トモグラフィの概念を提案する。
ノイズの多い量子システムにおいて、量子トモグラフィーのコストと計算労力を大幅に削減するために、これらの技術が実用的なツールとなることが考えられている。
論文参考訳(メタデータ) (Thu, 23 May 2024 10:13:59 GMT)
Controlling dephasing of coupled qubits via shared-bath coherence [0.0] 結合量子ビット系のデコヒーレンスを最小化したり、バス自体の量子コヒーレンスを利用して取り除いたりできることを示す。
空間的に分離された電子的に疎結合された2つの量子ビットのシステムにおいて,直接結合あるいは媒介結合によるデファス化について検討する。
論文参考訳(メタデータ) (Thu, 23 May 2024 15:22:30 GMT)
Contribute to balance, wire in accordance: Emergence of backpropagation from a simple, bio-plausible neuroplasticity rule [0.0] 我々は,脳にBPを実装するための潜在的なメカニズムを提供する新しい神経可塑性規則を導入する。
我々は,我々の学習規則が階層型ニューラルネットワークのBPを近似なしで正確に再現できることを数学的に証明した。
論文参考訳(メタデータ) (Thu, 23 May 2024 03:28:52 GMT)
Comparison of algorithms in Foreign Exchange Rate Prediction [0.0] 本稿では,3大通貨であるユーロ,パウンド・スターリング,USドルに対するネパール・ルピー間の予測モデルを開発する。
Feed forward Neural Network、Simple Recurrent Neural Network (SRNN)、Gated Recurrent Unit (GRU)、Long Short Term Memory (LSTM)といった異なるANNアーキテクチャモデルが使用された。
本研究では,LSTM ネットワークが SRNN や GRU ネットワークよりも優れた結果を示した。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:45:59 GMT)
Comparative Analysis of Predicting Subsequent Steps in Hénon Map [0.0] 本研究では,H'enonマップの進化予測における機械学習モデルの性能評価を行った。
その結果、LSTMネットワークは、特に極端な事象予測において、予測精度が優れていることが示唆された。
この研究は、カオス力学の解明における機械学習の重要性を浮き彫りにする。
論文参考訳(メタデータ) (Thu, 23 May 2024 08:19:28 GMT)
Combining Denoising Autoencoders with Contrastive Learning to fine-tune Transformer Models [0.0] 本研究は,分類タスクのベースモデルを調整するための3段階手法を提案する。
我々は,DAE(Denoising Autoencoder)を用いたさらなるトレーニングを行うことで,モデルの信号をデータ配信に適用する。
さらに、教師付きコントラスト学習のための新しいデータ拡張手法を導入し、不均衡なデータセットを修正する。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:08:35 GMT)
Coherence-enhanced single-qubit thermometry out of equilibrium [0.0] 量子温度計として用いられる有限次元量子系をマルコフ入浴熱力学に接触させる。
量子フィッシャー情報によって量子化された温度計の感度は、初期状態における量子コヒーレンスによって向上していることを示す。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:11:01 GMT)
ClusterTabNet: Supervised clustering method for table detection and table structure recognition [0.0] 文書中の単語をクラスタリングする深層学習に基づく新しい手法を提案する。
表構造ボトムアップを一対の単語間の関係グラフとして解釈し、変圧器エンコーダモデルを用いてその隣接行列を予測する。
DETRやFaster R-CNNのような現在の最先端検出手法と比較して,本手法は比較的小さなモデルを必要とするが,類似性や精度が向上する。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:16:53 GMT)
Casimir-Lifshitz force for graphene-covered gratings [0.0] 金板とグラフェン被覆格子のカシミール・リフシッツ力について検討した。
グラフェンでコーティングしたただの誘電体スラブと比較して, CLFは幅広い温度で顕著に向上していることがわかった。
我々はCLFがグラフェンの化学的ポテンシャルに強く依存していることを示し、その最大効果は低い充填率で観測された。
論文参考訳(メタデータ) (Thu, 23 May 2024 13:07:32 GMT)
Can Large Language Models Create New Knowledge for Spatial Reasoning Tasks? [0.0] 本研究では,Large Language Models (LLM) が空間次元を持つ問題に対して洗練された推論を行うことができることを示した。
これは、最先端のLLMが今や達成できるという、かなりのレベルの理解を示している。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:54:54 GMT)
Borromean states in a one-dimensional three-body system [0.0] 2つの同一粒子と識別可能な粒子からなる1次元量子3体系におけるボロメアン境界状態の存在を示す。
2つのボソンの間に相互作用はないと仮定され、質量不均衡な2体のサブシステムは、有界あるいは非有界に調整できる。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:59:43 GMT)
Beta decay and related processes from an angular momentum perspective [0.0] 角運動量は弱い相互作用過程では保存されないことを示す。
角運動量の明らかな非保存は、量子測定プロセスの結果である。
論文参考訳(メタデータ) (Thu, 23 May 2024 19:34:32 GMT)
Bayesian optimisation with improved information sharing for the variational quantum eigensolver [0.0] 本研究は,変分量子固有解法(VQE)のための情報共有(BOIS)を用いたベイズ最適化の詳細な実験的検討である。
我々は, 水素分子のノイズの影響下で, 無雑音シミュレーションを行い, アルゴリズムの性能について検討した。
特に,H2の共有方式と比較して1.5倍,H2Oの共有方式に比べて少なくとも5倍の改善が認められた。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:27:46 GMT)
Automated Optimal Layout Generator for Animal Shelters: A framework based on Genetic Algorithm, TOPSIS and Graph Theory [0.0] 動物保護区の人口過多は、病気の拡大と動物の医療費の増大に寄与する。
シェルターが直面する最大の課題の1つは、犬小屋の騒音レベルである。
本稿では,シェルター容量を最大化するケージレイアウトを自動設計する多基準最適化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 04:57:55 GMT)
AstroPT: Scaling Large Observation Models for Astronomy [0.0] 我々は、100万から210億のパラメータに増大する基盤モデルをトレーニングし、AstroPTがテキストモデルに類似した飽和ログスケーリング法に従うことを発見した。
私たちは、共同コミュニティ開発がオープンソースの大規模観測モデルの実現への最良の道のりだと信じています。
論文参考訳(メタデータ) (Thu, 23 May 2024 18:00:00 GMT)
Applied Machine Learning to Anomaly Detection in Enterprise Purchase Processes [0.0] 本研究は、実データから2つの大きな購入データセットから検出された事例を優先的に調査する手法を提案する。
目的は、企業の管理努力の有効性に寄与し、その実施実績を高めることである。
論文参考訳(メタデータ) (Thu, 23 May 2024 16:21:51 GMT)
Analysis of Atom-level pretraining with QM data for Graph Neural Networks Molecular property models [0.0] 量子力学(QM)データを用いた原子レベルの事前トレーニングは、トレーニングデータとテストデータ間の分布類似性に関する仮定違反を軽減することができることを示す。
隠れ状態の分子表現を解析し、QMデータに対する分子レベルと原子レベルの事前学習の効果を比較するのは、これが初めてである。
論文参考訳(メタデータ) (Thu, 23 May 2024 17:51:05 GMT)
A high-level comparison of state-of-the-art quantum algorithms for breaking asymmetric cryptography [0.0] 我々はRegevの量子アルゴリズムを、一方のEkeraa-G"artnerの拡張と、他方の離散対数分解と計算のための既存の最先端量子アルゴリズムと比較する。
我々の結論は、空間節約最適化のないRegevのアルゴリズムは、非計算量子メモリが安価であれば、ラン当たりの優位性を得るが、全体的な優位性は得られないということである。
論文参考訳(メタデータ) (Thu, 23 May 2024 09:59:00 GMT)
A fast algorithm to minimize prediction loss of the optimal solution in inverse optimization problem of MILP [0.0] 本稿では,MILPの最適解(PLS)の予測損失を与えられたデータで最小化する問題に取り組む。
我々はMILPのPSSを最小化するための高速アルゴリズムを提案する。
提案アルゴリズムは,既存のアルゴリズムと比較して,PSSを2桁以上改善した。
論文参考訳(メタデータ) (Thu, 23 May 2024 07:51:05 GMT)
A classification model based on a population of hypergraphs [0.0] 本稿では,新しいハイパーグラフ分類アルゴリズムを提案する。
ハイパーグラフは任意の順序の多方向相互作用を探索する。
このアルゴリズムは2つのデータセットで評価される。
論文参考訳(メタデータ) (Thu, 23 May 2024 21:21:59 GMT)
A Short Introduction to Basic Principles of Quantum Navigation Based-on Rb Cold Atom Interferometry [0.0] レーザー分光法はより精密な加速度計やジャイロスコープを実現することができる。
衛星を持たない自己校正ナビゲーションシステムを実現することができる。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:46:39 GMT)
A Profunctorial Semantics for Quantum Supermaps [0.0] 図形のブラックボックスの一般化は、コンクリートネットワーク上のコプレシーブの圏における射として、プロファンクター光学のより広い分野に置かれる。
これらの分解定理の核心には、ヨネダ補題と表現可能性の概念があることが示される。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:20:43 GMT)
A Matrix-based Distance of Pythagorean Fuzzy Set and its Application in Medical Diagnosis [0.0] ピタゴラスファジィ集合 (pythagorean fuzzy set, PFS) は、不確定な状況において不確実性を解明し、分解するのにより効率的である。
2つのピタゴラスファジィ集合の間の距離を測る方法はまだ未解決の問題である。
距離測定の公理の要件を満たす新しい距離測定法を提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 12:59:12 GMT)
A FAIR and Free Prompt-based Research Assistant [0.0] 研究アシスタント(RA)ツールは6種類の研究タスクを支援するために開発された。
RAのChatGPTやGeminiのような生成AIツールへの依存は、あらゆる科学分野において同様の研究タスク支援を提供することを意味する。
論文参考訳(メタデータ) (Thu, 23 May 2024 14:16:46 GMT)
A Christmas Story about Quantum Teleportation [0.0] 量子テレポーテーション(quantum teleportation)は、量子物理学とテレポーテーションの概念を組み合わせた概念である。
近年の研究では、量子物理学の話題について学生を魅了する教師の重要性が示唆されている。
クリスマスギフトブリングのサンタクロースを用いて,量子テレポーテーションの概念を教えるパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 23 May 2024 11:44:38 GMT)