Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context [666.2] 本稿では,次世代の計算効率の高いマルチモーダルモデルであるGemini 1.5モデルについて紹介する。
ファミリーには2つの新しいモデルが含まれている: (1) アップデートされたGemini 1.5 Proは、機能とベンチマークの大部分で2月バージョンを超え、(2) Gemini 1.5 Flashは、品質の最小限の回帰で効率よく設計された、より軽量な派生型である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:39:39 GMT)
MVGamba: Unify 3D Content Generation as State Space Sequence Modeling [150.8] 本稿では,多視点ガウス再構成器を備えた一般軽量ガウス再構成モデルMVGambaを紹介する。
オフザディテールのマルチビュー拡散モデルを統合することで、MVGambaは単一の画像、スパース画像、テキストプロンプトから3D生成タスクを統一する。
実験により、MVGambaは、すべての3Dコンテンツ生成シナリオで最先端のベースラインを約0.1タイムのモデルサイズで上回ります。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:32:01 GMT)
Skip Tuning: Pre-trained Vision-Language Models are Effective and Efficient Adapters Themselves [123.1] 下流タスクに視覚言語モデルを適用するための新しいパラダイムとして,Skip Tuningを提案する。
既存のPTやアダプタベースの方法とは異なり、Skip Tuningは追加のコンテキストベクトルやアダプタモジュールを導入することなく、FTベースラインにLayer-wise Skipping(LSkip)とClass-wise Skipping(CSkip)を適用する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:33:23 GMT)
Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling [121.1] InternVL 2.5は、InternVL 2.0上に構築された高度マルチモーダル大規模言語モデル(MLLM)シリーズである。
InternVL 2.5は、GPT-4oやClaude-3.5-Sonnetといった主要な商用モデルと競合する競争力を持つ。
このモデルが、マルチモーダルAIシステムの開発と適用のための新しい標準を設定することで、オープンソースコミュニティに貢献できることを願っています。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:14:43 GMT)
Exploring Vacant Classes in Label-Skewed Federated Learning [113.7] 本稿では,ラベルスキュード・フェデレーション学習の新しいアプローチであるFedVLSを紹介する。
空のクラス蒸留とロジット抑制を同時に統合する。
FedVLSの有効性を検証する実験は、従来のSOTA(State-of-the-art)法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:42:53 GMT)
MaskCLIP++: A Mask-Based CLIP Fine-tuning Framework for Open-Vocabulary Image Segmentation [109.2] オープン語彙画像のセグメンテーションはマスク生成器と視覚言語モデルとの相乗効果によって進歩している。
MaskCLIP++と呼ばれる新しい微調整フレームワークを提案し、このフレームワークは生成されたマスクの代わりにグラウンドトルースマスクを使用する。
我々は,A-847,PC-459,A-150,PC-59,PAS-20データセット上で+1.7,+2.3,+2.1,+3.1,+0.3 mIoUの性能改善を実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:44:45 GMT)
Efficient Scaling of Diffusion Transformers for Text-to-Image Generation [105.7] 各種拡散変換器(DiT)のテキスト・画像生成におけるスケーリング特性について,広範かつ厳密なアブレーションにより検討した。
We found that U-ViT, a pure self-attention based DiT model provides a simple design and scales using cross-attention based DiT variants。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:59:26 GMT)
Revisiting Backdoor Attacks against Large Vision-Language Models from Domain Shift [104.8] 本稿では,LVLMの学習訓練におけるバックドア攻撃について検討する。
我々は,攻撃の堅牢性を評価するために,新たな評価次元,バックドア領域の一般化を導入する。
本稿では,ドメイン非依存的トリガを臨界領域に注入するマルチモーダルアトリビューションバックドアアタック(MABA)を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:59:33 GMT)
Predictive Models in Sequential Recommendations: Bridging Performance Laws with Data Quality Insights [104.5] 本稿では,モデル性能とデータ品質の関係を理論的に検討し,モデル化することを目的としたSRモデルの性能法則を紹介する。
データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:46:03 GMT)
RoDE: Linear Rectified Mixture of Diverse Experts for Food Large Multi-Modal Models [96.4] Uni-Foodは、さまざまな食品ラベルを持つ10万以上の画像からなる統合食品データセットである。
Uni-Foodは、食品データ分析に対するより包括的なアプローチを提供するように設計されている。
本稿では,食品関連マルチタスキングの課題に対処するため,新しいリニア・リクティフィケーション・ミックス・オブ・ディバース・エキスパート (RoDE) アプローチを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:16:27 GMT)
Red Pill and Blue Pill: Controllable Website Fingerprinting Defense via Dynamic Backdoor Learning [93.4] Webサイト指紋(WF)攻撃は、訪問するWebページを特定するために、ユーザーのコミュニケーションを秘密裏に監視する。
既存のWFディフェンスは、ユニークなトラフィックパターンを乱すことで攻撃者の精度を低下させようとする。
バックドア学習に基づく新しい防衛視点である制御可能なWebサイトフィンガープリントディフェンス(CWFD)を紹介した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:12:56 GMT)
MaxInfoRL: Boosting exploration in reinforcement learning through information gain maximization [91.8] 強化学習アルゴリズムは、現在のベスト戦略の活用と、より高い報酬につながる可能性のある新しいオプションの探索のバランスを図ることを目的としている。
我々は本質的な探索と外生的な探索のバランスをとるためのフレームワークMaxInfoRLを紹介する。
提案手法は,マルチアームバンディットの簡易な設定において,サブリニアな後悔を実現するものである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:59:53 GMT)
Distilling Rule-based Knowledge into Large Language Models [90.8] 私たちは、人間がルールから学習することで、新しいタスクや知識を別の方法で学習できることにインスピレーションを受けています。
まず, LLMの強い文脈内能力を用いて, テキスト規則から知識を抽出する規則蒸留法を提案する。
実験の結果, LLMをルールから学習させることは, サンプルサイズと一般化能力の両方において, サンプルベース学習よりもはるかに効率的であることがわかった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 00:37:33 GMT)
Geometric monotones of violations of quantum realism [90.0] 量子実在論(Quantum realism)は、量子系における射影測定が、明らかな結果が存在しない場合でも、物理的性質の現実を確立すると述べている。
この枠組みは、古典的および量子的リアリズムの概念の区別に関するニュアンスな見解を提供し、量子システムに固有の文脈性と相補性を強調する。
我々は、トレース距離、ヒルベルト=シュミット距離、シャッテン$p$-距離、ビュール、ヘルリンガー距離を用いた量子リアリズムの幾何学的モノトンを導出した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:22:28 GMT)
SPaR: Self-Play with Tree-Search Refinement to Improve Instruction-Following in Large Language Models [88.3] SPaRは、木探索の自己制限を統合したセルフプレイフレームワークで、気を散らさずに有効かつ同等の選好ペアを得る。
実験により,SPaRで誘導された3回の反復で訓練されたLLaMA3-8Bモデルが,一般機能を失うことなくIFEvalベンチマークでGPT-4-Turboを上回った。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:47:43 GMT)
RL-LLM-DT: An Automatic Decision Tree Generation Method Based on RL Evaluation and LLM Enhancement [85.3] RL評価とLLM強調に基づく自動決定木生成法であるRL-LLM-DTを提案する。
この統合手法の有効性を評価するため,カーリングゲームで実験を行った。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:33:49 GMT)
Just a Simple Transformation is Enough for Data Protection in Vertical Federated Learning [83.9] 我々は、入力データ妥協を目標とする一般的なリスクである特徴再構成攻撃について検討する。
フェデレーションベースのモデルは、最先端の機能再構築攻撃に耐性があることが示される。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:02:12 GMT)
SECRET: Towards Scalable and Efficient Code Retrieval via Segmented Deep Hashing [83.4] ディープラーニングは、検索パラダイムを語彙ベースのマッチングから、ソースコードとクエリをベクトル表現にエンコードした。
従来の研究では、クエリやコードスニペットのハッシュコードを生成し、ハミング距離を使ってコード候補を高速にリコールするディープハッシュベースの手法が提案されている。
提案手法は,既存の深層ハッシュ法によって計算された長いハッシュコードを,反復的学習戦略により複数の短いハッシュコードセグメントに変換する手法である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:51:35 GMT)
OpenOOD v1.5: Enhanced Benchmark for Out-of-Distribution Detection [82.9] アウト・オブ・ディストリビューション(OOD)検出は、オープンワールド・インテリジェントシステムの信頼性の高い運用に不可欠である。
本稿では,OOD検出手法の正確かつ標準化された評価を実現するために,OpenOOD v1.5を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:09:28 GMT)
GARLIC: GPT-Augmented Reinforcement Learning with Intelligent Control for Vehicle Dispatching [81.8] GARLIC: GPT拡張強化学習のフレームワーク。
本稿では,GPT強化強化学習とインテリジェント制御のフレームワークであるGARLICについて紹介する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 00:11:13 GMT)
CharacterBench: Benchmarking Character Customization of Large Language Models [80.3] 我々は,最大2言語生成ベンチマークである characterBench を提案し,3,956 文字を含む22,859 人の注釈付きサンプルを作成した。
我々は,各応答に現れる特定の次元によって評価される特徴量に基づいて,スパース次元と密度次元に分類される6つの側面の11次元を定義する。
また,コスト効率と安定した評価のためのキャラクタジャッジモデルも開発している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:55:34 GMT)
EasyHOI: Unleashing the Power of Large Models for Reconstructing Hand-Object Interactions in the Wild [79.7] 本研究の目的は,手動物体のインタラクションを単一視点画像から再構築することである。
まず、手ポーズとオブジェクト形状を推定する新しいパイプラインを設計する。
最初の再構築では、事前に誘導された最適化方式を採用する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:06:19 GMT)
BrushEdit: All-In-One Image Inpainting and Editing [79.6] BrushEditは、インペイントベースの命令誘導画像編集パラダイムである。
本研究では,MLLMとデュアルブランチ画像の描画モデルを統合することで,自由形式の命令編集を可能にするシステムを提案する。
本フレームワークは,MLLMとインパインティングモデルを効果的に組み合わせ,7つの指標で優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:54:44 GMT)
Intention Analysis Makes LLMs A Good Jailbreak Defender [79.4] 我々は,シンプルかつ高能率な防衛戦略,すなわち意図分析(mathbbIA$)を提示する。
$mathbbIA$ は LLM 固有の自己修正をトリガーし、2段階のプロセスを通じて能力を向上させる。
さまざまなjailbreakベンチマークの実験によると、$mathbbIA$は一貫して応答の有害性を著しく低減できる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:43:24 GMT)
Uncovering LLM-Generated Code: A Zero-Shot Synthetic Code Detector via Code Rewriting [78.5] 原符号とLLM書き換え版との類似性に基づく新しいゼロショット合成符号検出器を提案する。
以上の結果から,既存のSOTA合成コンテンツ検出装置よりも顕著な改善が得られた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:42:38 GMT)
Findings of the WMT 2024 Shared Task on Discourse-Level Literary Translation [75.0] 我々は、中国語、ドイツ語、ロシア語の3つの方向に注目している。
今年は5つのアカデミックチームと業界チームから10の応募を受け取りました。
システムの公式ランキングは、全体的な人間の判断に基づいている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:54:52 GMT)
Unanswerability Evaluation for Retreival Augmented Generation [74.3] UAEval4RAGは、RAGシステムが解答不能なクエリを効果的に処理できるかどうかを評価するために設計されたフレームワークである。
我々は、6つの未解決カテゴリを持つ分類を定義し、UAEval4RAGは、多様で挑戦的なクエリを自動的に合成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:11:55 GMT)
LLM-Based Multi-Agent Systems are Scalable Graph Generative Models [73.3] GraphAgent-Generator (GAG) は動的でテキスト対応のソーシャルグラフ生成のための新しいシミュレーションベースのフレームワークである。
GAGは,大規模エージェントシミュレーションを通じて,最大10万ノードあるいは1000万エッジのグラフの生成をサポートする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:03:04 GMT)
DEMO: Reframing Dialogue Interaction with Fine-grained Element Modeling [73.1] 大規模言語モデル(LLM)は、対話を人間と機械の相互作用における中心的なモードの1つにした。
多くの対話関連研究にもかかわらず、包括的な対話要素を含むベンチマークの欠如がある。
新しいリサーチタスクであるtextbfD$ialogue $textbfE$lement $textbfMO$delingを紹介します。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:36:19 GMT)
Risk and cross validation in ridge regression with correlated samples [72.6] 我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
この設定では、一般化されたクロスバリデーション推定器(GCV)がサンプル外リスクを正確に予測できないことを示す。
さらに、テストポイントがトレーニングセットと非自明な相関を持つ場合、時系列予測でしばしば発生する設定にまで分析を拡張します。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:30:54 GMT)
Training Strategies for Isolated Sign Language Recognition [72.3] 本稿では,孤立手話認識のための包括的モデル学習パイプラインを提案する。
構築されたパイプラインには、慎重に選択された画像とビデオの拡張が含まれており、低いデータ品質とさまざまなサインスピードの課題に対処している。
WLASLとSlovoのベンチマークでは、以前のベストソリューションと比較して1.63%と14.12%の改善が得られた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:37:58 GMT)
DynaMoN: Motion-Aware Fast and Robust Camera Localization for Dynamic Neural Radiance Fields [71.9] 動的ニューラルラジアンス場(DynaMoN)の高速かつロバストなカメラ位置推定法を提案する。
DynaMoNは、初期のカメラポーズ推定と高速で正確なノベルビュー合成のための静的集光線サンプリングのために動的コンテンツを処理している。
我々は,TUM RGB-DデータセットとBONN RGB-D Dynamicデータセットの2つの実世界の動的データセットに対するアプローチを広く評価した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:49:16 GMT)
AIpparel: A Large Multimodal Generative Model for Digital Garments [71.1] 縫製パターンの生成と編集のための大規模なマルチモーダルモデルであるAIpparelを紹介する。
当社のモデルでは,12万以上のユニークな衣服をカスタマイズした大規模データセット上で,最先端の大規模マルチモーダルモデルを微調整する。
本稿では,これらの複雑な縫製パターンを簡潔に符号化し,LLMが効率的に予測できる新しいトークン化手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:39:18 GMT)
Dissecting Adversarial Robustness of Multimodal LM Agents [70.2] 我々は、VisualWebArena上に現実的な脅威モデルを用いて、200の敵タスクと評価関数を手動で作成する。
ブラックボックスフロンティア LLM を使用する最新のエージェントのレンジを切断できることが分かりました。
AREを使用して、新しいコンポーネントの追加に伴うロバスト性の変化を厳格に評価しています。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 00:21:27 GMT)
An Enhanced Classification Method Based on Adaptive Multi-Scale Fusion for Long-tailed Multispectral Point Clouds [68.0] 長距離分布を持つMPCに対する適応的マルチスケール融合に基づく拡張型分類法を提案する。
トレーニングセット生成段階では、スパースラベル付きデータセットからトレーニングサンプルを確実に生成するグリッドバランスサンプリング戦略が設計されている。
特徴学習の段階では,異なるスケールの土地被覆の浅い特徴を融合させるため,マルチスケールの特徴融合モジュールが提案されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:21:20 GMT)
QUITO-X: A New Perspective on Context Compression from the Information Bottleneck Theory [66.0] 問題をモデル化するために情報ボトルネック理論(IB)を導入する。
IBにおける相互情報に近似するクロスアテンションに基づく手法を提案する。
提案手法は,最先端技術と比較して25%の圧縮率向上を実現している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:03:54 GMT)
Establishing a New Benchmark in Quantum Computational Advantage with 105-qubit Zuchongzhi 3.0 Processor [65.6] Zuchongzhi 3.0は105量子ビットからなる超伝導量子コンピュータのプロトタイプである。
83量子32サイクルのランダム回路サンプリング実験は、Zuchongzhi 3.0の優れた性能を示し、数百秒で100万サンプルを達成した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:11:26 GMT)
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator [65.6] 大規模言語モデル(LLM)は、自然言語処理タスクの範囲で例外的な性能を示した。
特定の意味のない特別なトークン(セパレータ)は、意味的に意味のあるトークンと比較して注意点に不均等に寄与する。
SepLLMは,これらのセグメントを圧縮し,冗長なトークンを除去することによって推論を高速化する,プラグイン・アンド・プレイのフレームワークである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:58:57 GMT)
Specifications: The missing link to making the development of LLM systems an engineering discipline [65.1] 我々は、構造化出力、プロセスの監督、テストタイム計算など、これまでの分野の進歩について論じる。
モジュール型かつ信頼性の高いLCMシステムの開発に向けた研究の今後の方向性について概説する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:17:09 GMT)
Frequency-Aware Transformer for Learned Image Compression [64.3] 学習画像圧縮(lic)のためのマルチスケール指向性アナリシスを初めて実現した周波数認識変換器(FAT)ブロックを提案する。
FATブロックは、自然画像のマルチスケールおよび指向性周波数成分をキャプチャするための周波数分解ウィンドウアテンション(FDWA)モジュールを含む。
また、周波数変調フィードフォワードネットワーク(FMFFN)を導入し、異なる周波数成分を適応的に変調し、周波数歪み性能を向上させる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:09:40 GMT)
Lipschitz Singularities in Diffusion Models [64.3] 拡散モデルは、零点付近の時間変数に関して、しばしばネットワークの無限のリプシッツ特性を示す。
ゼロ点近傍の拡散モデルのリプシッツ特異点を緩和する新しい手法 E-TSDM を提案する。
我々の研究は、一般拡散過程の理解を深め、拡散モデルの設計に関する洞察を提供するかもしれない。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:15:13 GMT)
IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations [64.1] 画像から幾何学的および物質的情報をキャプチャすることは、コンピュータビジョンとグラフィックスの基本的な課題である。
従来の最適化に基づく手法では、密集した多視点入力から幾何学、材料特性、環境照明を再構築するために数時間の計算時間を必要とすることが多い。
IDArbは、様々な照明条件下で、任意の画像に対して本質的な分解を行うために設計された拡散モデルである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:52:56 GMT)
CSR:Achieving 1 Bit Key-Value Cache via Sparse Representation [63.7] キャッシュスパース表現(CSR)と呼ばれる新しい手法を提案する。
CSRは、密度の高いKey-Valueキャッシュテンソルをスパースインデックスとウェイトに変換し、LLM推論中によりメモリ効率のよい表現を提供する。
我々の実験は、CSRが最先端KVキャッシュ量子化アルゴリズムに匹敵する性能を達成することを示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:01:53 GMT)
Generative Inbetweening through Frame-wise Conditions-Driven Video Generation [63.4] 生成的inbetweeningは、2つのキーフレームを入力として利用することで中間フレームシーケンスを生成することを目的としている。
補間ビデオフレームの時間的安定性を著しく向上するフレームワイド・コンディション駆動ビデオ生成法(FCVG)を提案する。
FCVGは線形曲線と非線形曲線の両方を用いて時間的に安定なビデオを生成する能力を示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:19:41 GMT)
AutoScale: Automatic Prediction of Compute-optimal Data Composition for Training LLMs [61.1] 本稿では,異なる領域からのトレーニングデータの最適構成がスケール依存であることを示す。
我々は、潜在的に大規模なトレーニングデータスケールでデータ合成を最適化するための、新しい実用的なアプローチである*AutoScale*を紹介します。
GPT-2Large and BERT pre-training の評価は,トレーニング収束性および下流性能向上における *AutoScale* の有効性を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:39:20 GMT)
How Reliable are LLMs as Knowledge Bases? Re-thinking Facutality and Consistency [60.3] 大規模言語モデル (LLM) は知識ベース (KB) として研究されている。
現在の評価手法は、信頼性の高い性能の他の決定的な基準を見越して、知識の保持に過度に焦点を絞っている。
我々は,事実と一貫性を定量化するための新しい基準と指標を提案し,最終的な信頼性スコアを導いた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:23:14 GMT)
VRVVC: Variable-Rate NeRF-Based Volumetric Video Compression [59.1] NeRFベースのビデオは、FVV(Photorealistic Free-Viewpoint Video)体験を提供することによって、ビジュアルメディアに革命をもたらした。
大量のデータボリュームは、ストレージと送信に重大な課題をもたらす。
ビデオ圧縮のための新しいエンドツーエンドの可変レートフレームワークであるVRVVCを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:28:04 GMT)
VersaGen: Unleashing Versatile Visual Control for Text-to-Image Synthesis [59.1] 本稿では,テキスト・トゥ・イメージ(T2I)合成における多目的視覚制御を可能にする生成AIエージェントVersaGenを提案する。
我々は,凍結したT2Iモデルに適応器を訓練し,テキスト支配拡散プロセスに視覚情報を適応させる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:32:23 GMT)
GenEx: Generating an Explorable World [59.1] 我々は、その生成的想像力によって導かれる複雑なエンボディ世界探査を計画できるシステムGenExを紹介する。
GenExは、単一のRGB画像から3D一貫性のある想像環境全体を生成します。
GPT支援エージェントは、ゴールに依存しない探索とゴール駆動ナビゲーションの両方を含む複雑な実施作業を行う。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:17:55 GMT)
Multilingual and Explainable Text Detoxification with Parallel Corpora [58.8] 並列テキストデトックス化コーパスを新しい言語に拡張する。
本研究は, 有毒な文と非有毒な文の両方の記述的特徴について, 自動的, 説明可能な分析を行う。
そこで我々は,Chain-of-Thoughts推論手法に触発された新しいテキスト解毒法を実験した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:08:59 GMT)
InfuserKI: Enhancing Large Language Models with Knowledge Graphs via Infuser-Guided Knowledge Integration [58.6] 知識を統合する手法が開発され、外部モジュールを通してLLMをドメイン固有の知識グラフに拡張した。
本研究は,未知の知識をLLMに効率的に統合することで,未知の知識を不要に重複させるという,新たな問題に焦点をあてる。
新しい知識を導入するリスクは、既存の知識を忘れることである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:18:06 GMT)
EACO: Enhancing Alignment in Multimodal LLMs via Critical Observation [58.5] 臨界観測(EACO)によるMLLMのアライメント向上を提案する。
EACOは、経済的に5k画像のみを使用して、MLLMを自己生成の選好データで整列する。
EACOは幻覚全体の65.6%をHalusionBenchで減らし、MME-Cognitionで21.8%改善する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:47:29 GMT)
Seeker: Towards Exception Safety Code Generation with Intermediate Language Agents Framework [58.4] 現実世界のソフトウェア開発では、不適切な例外処理がコードの堅牢性と信頼性に重大な影響を与えます。
コードにおける例外処理を改善するために,大規模言語モデル (LLM) の利用について検討する。
例外処理のエキスパート開発者戦略に触発されたマルチエージェントフレームワークであるSeekerを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:35:29 GMT)
When Backdoors Speak: Understanding LLM Backdoor Attacks Through Model-Generated Explanations [58.3] 大規模言語モデル(LLM)は、バックドア攻撃に弱いことが知られている。
本稿では,自然言語説明の新しいレンズによるバックドア攻撃について検討する。
以上の結果から,バックドアモデルではクリーンな入力に対してコヒーレントな説明が得られたが,有毒なデータに対して多様かつ論理的に欠陥のある説明が得られた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:44:52 GMT)
Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment [58.0] 大規模言語モデル (LLM) の刈り取りにおける重み付け重要度の評価を, 微粒化と粗粒化にマージする手法であるHybrid-fine Weight Importance Assessment (HyWIA) を導入する。
LLaMA-V1/V2, Vicuna, Baichuan, Bloomの様々なベンチマークによる大規模な実験により, 刈り込みLDMにおけるHyWIAの有効性が示された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:31:27 GMT)
Unified Multimodal Interleaved Document Representation for Retrieval [57.7] 複数のモダリティでインターリーブされた文書を階層的に埋め込む手法を提案する。
セグメント化されたパスの表現を1つのドキュメント表現にマージする。
我々は,本手法が関連するベースラインを大幅に上回ることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:11:11 GMT)
A Method for Auto-Differentiation of the Voronoi Tessellation [57.6] ボロノイテッセルレーション(英: Voronoi tessellation)またはボロノイ図(英: Voronoi diagram)は、重要な計算幾何学手法である。
本稿では,2次元ヴォロノイテッセルレーションの自動微分法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:23:47 GMT)
TGDataset: Collecting and Exploring the Largest Telegram Channels Dataset [57.2] 本稿では,120,979のTelegramチャネルと4億以上のメッセージを含む新しいデータセットであるTGDatasetを提案する。
我々は、データセット内で話される言語と、英語チャンネルでカバーされるトピックを分析した。
生のデータセットに加えて、データセットの分析に使用したスクリプトと、Sabmykと呼ばれる新しい陰謀論のネットワークに属するチャネルのリストもリリースしました。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:20:33 GMT)
OmniPrism: Learning Disentangled Visual Concept for Image Generation [57.2] 創造的な視覚概念の生成は、しばしば関連する結果を生み出すために参照イメージ内の特定の概念からインスピレーションを引き出す。
我々は,創造的画像生成のための視覚的概念分離手法であるOmniPrismを提案する。
提案手法は,自然言語で案内される不整合概念表現を学習し,これらの概念を組み込むために拡散モデルを訓練する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:59:52 GMT)
PICLe: Pseudo-Annotations for In-Context Learning in Low-Resource Named Entity Detection [56.9] In-context Learning (ICL)により、大規模言語モデルでは、デモをほとんど使わずにタスクを実行することができる。
PICLeは、ノイズの多い擬似アノテーション付き実演によるインコンテキスト学習のためのフレームワークである。
バイオメディカルな5つのNEDデータセット上でPICLeを評価し,PICLeが低リソース環境でICLより優れていることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:09:35 GMT)
Align$^2$LLaVA: Cascaded Human and Large Language Model Preference Alignment for Multi-modal Instruction Curation [56.8] 本稿では,人間とLLMの選好アライメントという2つのユニークな視点から導いた,新しい命令キュレーションアルゴリズムを提案する。
実験により,合成マルチモーダル命令を最大90%圧縮することにより,モデル性能の維持や改善が可能であることが示された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:33:44 GMT)
Chain-of-Discussion: A Multi-Model Framework for Complex Evidence-Based Question Answering [55.3] 本稿では,オープンソースのLarge Language Model間の相乗効果を利用する新しいChain-ofDiscussionフレームワークを提案する。
実験の結果,複数のLSM間の議論は回答の質を高める上で重要な役割を担っていることがわかった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:11:59 GMT)
Second Language (Arabic) Acquisition of LLMs via Progressive Vocabulary Expansion [55.3] 本稿では,アラブ世界における大規模言語モデル(LLM)の民主化の必要性に対処する。
アラビア語のLLMの実用的な目的の1つは、復号を高速化するトークン化器にアラビア語固有の語彙を使用することである。
第二言語(アラビア語)による人への獲得の間に語彙学習に触発されたAraLLaMAは、進歩的な語彙拡張を採用している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:29:06 GMT)
Learning from Synthetic Data for Visual Grounding [55.2] そこで本研究では,SynGroundが市販のビジョン・アンド・ランゲージモデルのローカライズ能力を向上できることを示す。
SynGroundで生成されたデータは、事前訓練されたALBEFモデルとBLIPモデルのポインティングゲーム精度をそれぞれ4.81%、絶対パーセンテージポイント17.11%向上させる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:53:21 GMT)
Game Development as Human-LLM Interaction [55.0] 本稿では,Human-LLMインタラクションを利用したChat Game Engine(ChatGE)を紹介する。
ChatGEは、Human-LLMインタラクションを通じて、自然言語を使ってカスタムゲームを開発することができる。
ポーカーゲームのためのChatGEをケーススタディとして構築し、インタラクションの品質とコードの正確性という2つの観点から評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:58:49 GMT)
CP-Guard: Malicious Agent Detection and Defense in Collaborative Bird's Eye View Perception [54.8] コラボレーティブ・パーセプション(CP)は自動運転に有望な技術を示している。
CPでは、ego CAVは協力者からのメッセージを受信する必要があるため、悪意のあるエージェントによる攻撃が容易になる。
我々は,各エージェントが協調ネットワーク内の悪意あるエージェントを正確に検出し,排除するための新しい方法である textbfCP-Guard を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:28:25 GMT)
Towards Effective User Attribution for Latent Diffusion Models via Watermark-Informed Blending [54.3] 我々は、ウォーターマークインフォームドブレンディング(TEAWIB)による潜伏拡散モデルに対する効果的なユーザ属性に向けた新しいフレームワークを提案する。
TEAWIBは、ユーザ固有の透かしを生成モデルにシームレスに統合する、ユニークな準備可能な構成アプローチを取り入れている。
TEAWIBの有効性を検証し、知覚的品質と帰属精度で最先端の性能を示す実験を行った。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:37:33 GMT)
MQM-APE: Toward High-Quality Error Annotation Predictors with Automatic Post-Editing in LLM Translation Evaluators [53.9] 大規模言語モデル(LLM)は、機械翻訳(MT)の品質評価の裁判官として大きな可能性を秘めている。
非インパクト的なエラーをフィルタリングするアイデアに基づいて、ユニバーサルでトレーニング不要なフレームワークである$textbfMQM-APEを紹介します。
実験の結果,GEMBA-MQMに対する誤差の信頼性と品質の両方が一貫して改善されていることがわかった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:08:51 GMT)
Haar Nuclear Norms with Applications to Remote Sensing Imagery Restoration [53.7] 本稿では,Har Nuclear norm (HNN) という,高効率かつ効率的なリモートセンシング画像復元のための新しい低ランク正規化用語を提案する。
2次元前方スライス-ワイド・ハール離散ウェーブレット変換から導出されるウェーブレット係数の低ランク特性を利用する。
ハイパースペクトル像の着色, マルチテンポラル画像雲の除去, ハイパースペクトル像の脱色実験により, HNNの可能性が明らかとなった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:19:58 GMT)
Searching Personal Collections [53.5] 本稿では,個人文書収集における情報検索の歴史について述べる。
また、米国における個人文書コレクションの情報検索の歴史についても記述している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:00:51 GMT)
Enhancing Logical Reasoning in Large Language Models through Graph-based Synthetic Data [53.4] 本研究では,大規模言語モデルの推論能力を高めるための学習信号としてグラフベースの合成推論データを使用することの可能性と限界について検討する。
2つの確立された自然言語推論タスクにおいて,合成グラフに基づく推論データによる教師付き微調整が,他の標準評価ベンチマークでの有効性を損なうことなく,LLMの推論性能を効果的に向上することを示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:06:38 GMT)
Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.2] 本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:14:32 GMT)
A Survey of Artificial Intelligence in Gait-Based Neurodegenerative Disease Diagnosis [51.1] 神経変性疾患(神経変性疾患、ND)は、伝統的に医学的診断とモニタリングのために広範囲の医療資源と人的努力を必要とする。
重要な疾患関連運動症状として、ヒトの歩行を利用して異なるNDを特徴づけることができる。
人工知能(AI)モデルの現在の進歩は、NDの識別と分類のための自動歩行分析を可能にする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:44:47 GMT)
Evaluation Agent: Efficient and Promptable Evaluation Framework for Visual Generative Models [51.1] 視覚生成モデルの評価には時間を要するし、計算コストもかかる。
本研究では,効率的,動的,多ラウンドな評価に人間的な戦略を用いる評価エージェントフレームワークを提案する。
1)効率性、2)多様なユーザニーズに合わせた迅速な評価、3)1つの数値スコア以上の説明可能性、4)さまざまなモデルやツールのスケーラビリティ。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:05:05 GMT)
Leveraging Foundation Language Models (FLMs) for Automated Cohort Extraction from Large EHR Databases [50.6] 本稿では,2つの大規模かつ広くアクセス可能なEHRデータベース上で列マッチングを自動化するアルゴリズムを提案し,評価する。
提案手法は,学習済みの小型汎用言語モデルを用いて,13ドル列のうち12ドルを正確にマッチングし,高いトップ3の精度を92%の精度で達成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:19:35 GMT)
MGH Radiology Llama: A Llama 3 70B Model for Radiology [50.4] 本稿では,高度な放射線学に焦点を当てた大規模言語モデルMGH Radiology Llamaを提案する。
Llama 3 70Bモデルを使用して開発され、Radiology-GPTやRadiology-Llama2といった従来のドメイン固有モデルをベースにしている。
従来の指標とGPT-4に基づく評価の両方を取り入れた評価では,汎用LLMよりも高い性能を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:25:26 GMT)
Mixture of Hidden-Dimensions Transformer [50.4] 隠れ次元の空間性について検討し、訓練されたトランスフォーマーがわずかなトークン次元しか利用していないことを観察する。
スパース条件付アクティベーションアーキテクチャであるMoHD(Mixture of Hidden Dimensions)を提案する。
50%のアクティベーションパラメータが減少し、3.7%のハイパフォーマンスを実現し、3倍のパラメータを一定のアクティベーションコストで拡張する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:12:19 GMT)
InterDyn: Controllable Interactive Dynamics with Video Diffusion Models [50.4] 我々は、初期フレームと駆動対象またはアクターの動作を符号化する制御信号が与えられたインタラクティブな動画像を生成するフレームワークであるInterDynを提案する。
私たちの重要な洞察は、大規模ビデオデータからインタラクティブなダイナミクスを学習することで、大きなビデオファンデーションモデルがニューラルと暗黙の物理シミュレータの両方として機能できるということです。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:57:02 GMT)
GS-ProCams: Gaussian Splatting-based Projector-Camera Systems [49.7] プロジェクタカメラシステム(ProCams)のための最初のガウススプラッティングベースのフレームワークであるGS-ProCamsを紹介する。
GS-ProCamsはプロジェクションマッピングの効率を大幅に向上させる。
600倍高速で、GPUメモリの1/10しか使用していない。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:26:52 GMT)
Transformers Use Causal World Models in Maze-Solving Tasks [49.7] 各種領域にまたがるタスクで訓練された変圧器モデルの内部動作について検討する。
トランスフォーマーは、トレーニング中に見るよりも多くのアクティブな機能に対して理にかなっていることが分かりました。
様々な位置エンコーディングがモデルの残留ストリームにWMをエンコードする方法を変えることを観察する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:21:04 GMT)
Error Diversity Matters: An Error-Resistant Ensemble Method for Unsupervised Dependency Parsing [49.6] 本稿では,誤りの蓄積を回避する効率的なアンサンブル選択手法を提案する。
提案手法は,従来のアンサンブル手法と同様に個々のモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:23:50 GMT)
EmotiveTalk: Expressive Talking Head Generation through Audio Information Decoupling and Emotional Video Diffusion [49.6] 拡散モデルは、会話のヘッドジェネレーションの分野に革命をもたらしたが、長期的には表現性、制御可能性、安定性に課題に直面している。
これらの問題に対処するためのEmotiveTalkフレームワークを提案する。
実験結果から,EmotiveTalkは表現力のある対話型ヘッドビデオを生成することができ,長時間発生時の感情の制御性と安定性を保証できることがわかった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:11:49 GMT)
ProsodyFM: Unsupervised Phrasing and Intonation Control for Intelligible Speech Synthesis [49.3] 韻律は、言葉の文字通りの意味を超えた豊富な情報を含んでいる。
現在のモデルは、フレーズやイントネーションにおいて不足しており、複雑な構造を持つ長い文を合成する際に、ミスやミスプレースを犯すだけでなく、不自然なイントネーションを生み出す。
本稿では,韻律対応のテキスト音声合成(TTS)モデルであるProsodyFMを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:07:39 GMT)
Emptiness Instanton in Quantum Polytropic Gas [49.2] この問題は、気体の基底状態における空の間隔の自然発生の確率を決定することである。
虚空時間における流体力学方程式の解法により、空のインスタントンの解析形式を導出する。
この解は、等角体論における相関関数に類似した積分表現として表される。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:58:51 GMT)
You Only Submit One Image to Find the Most Suitable Generative Model [48.7] 我々は生成モデル同定(GMI)と呼ばれる新しい設定を提案する。
GMIは、ユーザの要求に対して最も適切な生成モデルを効率的に特定できるようにすることを目的としている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:46:57 GMT)
SweepEvGS: Event-Based 3D Gaussian Splatting for Macro and Micro Radiance Field Rendering from a Single Sweep [48.3] SweepEvGSは、イベントカメラを活用して、単一のスイープから堅牢で正確な新しいビュー合成を行う、新しいハードウェア統合手法である。
SweepEvGSの強靭性と効率性は,3つの異なる画像環境における実験により検証した。
以上の結果から,SweepEvGSは視覚的レンダリング品質,レンダリング速度,計算効率において,既存の手法を超越していることがわかった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:09:42 GMT)
Re-Attentional Controllable Video Diffusion Editing [48.1] 本稿では,Re-Attentional Controllable Video Diffusion Editing (ReAtCo)法を提案する。
対象物体の空間配置と編集されたテキストプロンプトを無訓練で整合させるために,再注意拡散(RAD)を提案する。
RADは、編集されたテキストプロンプトとデノナイジング段階のターゲットビデオとの間の相互注意活性化反応を再焦点化し、空間的に位置整列し、意味的に高忠実に操作されたビデオを生成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:32:21 GMT)
ConceptEdit: Conceptualization-Augmented Knowledge Editing in Large Language Models for Commonsense Reasoning [48.0] ConceptEditは、概念化とインスタンス化をKnowledge Editingパイプラインに統合するフレームワークである。
その結果,コンセプション編集は,他のベースラインに比べて信頼性が向上し,コモンセンスの知識を生み出すことができた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:34:40 GMT)
Leveraging RGB-D Data with Cross-Modal Context Mining for Glass Surface Detection [47.9] ガラスの表面は、現代の建物が多くのガラスパネルを使用する傾向にあるため、ますます広くなっている。
これは、ロボット、自動運転車、ドローンなどの自律システムの運用に重大な課題をもたらす。
RGBと深度情報を組み合わせた新しいガラス表面検出フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:58:51 GMT)
Region-Based Optimization in Continual Learning for Audio Deepfake Detection [47.7] 本稿では,オーディオディープフェイク検出のための領域ベース最適化(RegO)という連続学習手法を提案する。
実験結果から,本手法は音声深度検出のための最先端の連続学習手法RWMに対して,21.3%のEER向上を実現していることがわかった。
RegOの有効性は、オーディオディープフェイク検出ドメインを超えて拡張され、画像認識などの他のタスクにおいて潜在的に重要となる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:34:09 GMT)
SCITAT: A Question Answering Benchmark for Scientific Tables and Text Covering Diverse Reasoning Types [47.4] 多様な推論型(SciTaT)を用いた科学表とテキストのベンチマークを提案する。
SciTaTに基づいて,異なる推論型やプロセステーブル,テキストを同時に扱うための様々な推論手法を組み合わせた強力なベースライン(CaR)を提案する。
CaRはSciTaT上の他のベースラインよりも平均12.9%の改善をもたらし、その有効性を検証する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:21:57 GMT)
PoCo: Point Context Cluster for RGBD Indoor Place Recognition [47.1] 本稿では,屋内RGB-D位置認識タスクのための新しいエンドツーエンドアルゴリズム(PoCo)を提案する。
本稿では,最近のコンテキスト・オブ・クラスタ(CoC)を一般化したネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 00:10:24 GMT)
Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning [46.4] Critic-Vは、視覚言語モデル(VLM)の推論能力を高めるためにアクター・クライブパラダイムにインスパイアされたフレームワークである。
リアソナーは視覚的およびテキスト的入力に基づいて推論パスを生成し、批判はこれらのパスを洗練するための建設的批評を提供する。
評価の結果,Critic-V フレームワークは GPT-4V を含む既存手法を8つのベンチマークのうち5つで大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:12:17 GMT)
A Distributed Collaborative Retrieval Framework Excelling in All Queries and Corpora based on Zero-shot Rank-Oriented Automatic Evaluation [46.3] 分散協調検索フレームワーク(DCRF)を提案する。
様々な検索モデルを統合システムに統合し、ユーザのクエリに対して最適な結果を動的に選択する。
RankGPTやListT5のような効果的なリストワイドメソッドに匹敵するパフォーマンスを実現することができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:55:57 GMT)
UniLoc: Towards Universal Place Recognition Using Any Single Modality [46.1] 位置認識のための汎用的なソリューションであるUniLocを開発した。
UniLocは、インスタンスレベルのマッチングとシーンレベルのマッチングの2つのレベルで階層的にマッチングすることで学習する。
KITTI-360データセットの実験は、位置認識におけるクロスモダリティの利点を実証している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:48:58 GMT)
Dimension-free discretizations of the uniform norm by small product sets [45.9] ベルンシュタインの古典的不等式は、単位円上の最高ノルムの$f$と、その最高ノルムの$K$-階根のサンプリング集合上の最高ノルムと比較する。
次元自由離散化は、濃度が$deg(f)$とは独立なサンプリング集合で可能であり、代わりに$f$の最大個人次数によって支配されることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:19:56 GMT)
SegMAN: Omni-scale Context Modeling with State Space Models and Local Attention for Semantic Segmentation [45.7] 高品質なセマンティックセグメンテーションは,グローバルコンテキストモデリング,ローカルディテールエンコーディング,マルチスケール機能抽出という,3つの重要な機能に依存している。
SegMANと呼ばれるハイブリッド機能エンコーダと状態空間モデルに基づくデコーダを組み合わせた新しい線形時間モデルであるSegMANを紹介する。
ADE20K、Cityscapes、COCO-Stuffの3つの挑戦的なデータセットでSegMANを総合的に評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:38:25 GMT)
AsymRnR: Video Diffusion Transformers Acceleration with Asymmetric Reduction and Restoration [45.6] ビデオ拡散変換器 (DiTs) は高忠実度ビデオを生成する重要な可能性を示しているが, 計算集約性が高い。
ビデオDiTを高速化するためのトレーニング不要なアプローチとして,非対称リダクションとリカバリ(AsymRnR)を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:28:22 GMT)
GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training [45.4] GeoXは幾何学的理解と推論タスクに焦点を当てたマルチモーダルな大規模モデルである。
図形エンコーダとシンボルデコーダを開発するために,単調な事前学習を導入し,幾何学的画像やコーパスの理解を深める。
本研究では,識別クエリを生成し,不均一に分布した幾何学的信号から不定形表現を除去するジェネレータ・アンド・サンプラー変換器(GS-Former)を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:20:03 GMT)
BlenderLLM: Training Large Language Models for Computer-Aided Design with Self-improvement [45.2] 我々は,大規模言語モデル(LLM)をCAD(Computer-Aided Design)で訓練するフレームワークであるBlenderLLMを提案する。
以上の結果から,既存のモデルではCADスクリプトの正確な生成に重大な制限があることが明らかとなった。
命令ベースの微調整と反復的な自己改善によって、BlenderLLMはCADスクリプト生成の機能と精度の両方においてこれらのモデルを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:34:02 GMT)
Temporal evolution of a forced optomechanical system with linear and quadratic field -- mechanical oscillator couplings [45.0] 非駆動システムの場合を考慮し、その正確な時間発展演算子を求める。
時間発展演算子が近似形式で得られる強制システムの場合を考える。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:02:57 GMT)
Temporal Contrastive Learning for Video Temporal Reasoning in Large Vision-Language Models [45.0] TSADP(Temporal Semantic Alignment via Dynamic Prompting)は、時間的推論能力を高める新しいフレームワークである。
VidSitu データセット上での TSADP の評価を行った。
我々の分析は、TSADPの堅牢性、効率性、実用性を強調し、ビデオ言語理解の分野における一歩を踏み出した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:37:58 GMT)
Intention Knowledge Graph Construction for User Intention Relation Modeling [44.4] 本稿では,意図的知識グラフを自動生成するフレームワークを提案する。
3億3100万のエッジを持つ意図グラフを構築し、高い妥当性と受容性を示す。
本モデルは,新規セッションの意図を効果的に予測し,製品レコメンデーションを強化する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:18:40 GMT)
Generate Any Scene: Evaluating and Improving Text-to-Vision Generation with Scene Graph Programming [44.3] シーングラフを列挙するフレームワークであるGenerate Any Sceneを紹介した。
Any Sceneを生成することで、各シーングラフをキャプションに変換し、テキスト・ツー・ビジョンモデルのスケーラブルな評価を可能にする。
我々は,テキスト・ツー・イメージ,テキスト・ツー・ビデオ,テキスト・ツー・3Dモデルに対して広範囲な評価を行い,モデル性能に関する重要な知見を提示する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:54:46 GMT)
PSGraph: Differentially Private Streaming Graph Synthesis by Considering Temporal Dynamics [44.2] PSGraphは、時間的ダイナミクスを統合する、微分的にプライベートなストリーミンググラフ合成フレームワークである。
5つの一般的なメトリクスで4つの実世界のデータセットを広範囲に実験する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:56:32 GMT)
PriPHiT: Privacy-Preserving Hierarchical Training of Deep Neural Networks [44.0] エッジデバイスとクラウドサーバの両方でディープラーニングモデルのトレーニングフェーズを実行する方法を提案する。
提案するプライバシ保存方法は,敵の早期出口を利用してエッジのセンシティブなコンテンツを抑制し,タスク関連情報をクラウドに送信する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:10:10 GMT)
Wonderland: Navigating 3D Scenes from a Single Image [44.0] 本研究では,映像拡散モデルから潜伏木を用いた大規模再構成モデルを導入し,シーンの3次元ガウススプラッティングを予測する。
プログレッシブトレーニング戦略により,映像潜時空間上での3D再構成モデルをトレーニングし,高品質,広スコープ,汎用的な3Dシーンの効率的な生成を可能にする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:58:17 GMT)
CG-Bench: Clue-grounded Question Answering Benchmark for Long Video Understanding [43.9] CG-Benchは、長いビデオのヒント付き質問応答のための新しいベンチマークである。
14の一次カテゴリ、171の二次カテゴリ、638の第三カテゴリからなる粒度のシステムで、1,219の動画を手作業でキュレートする。
このベンチマークには、知覚、推論、幻覚という3つの主要な質問タイプに12,129のQAペアが含まれている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:46:45 GMT)
Text Proxy: Decomposing Retrieval from a 1-to-N Relationship into N 1-to-1 Relationships for Text-Video Retrieval [43.8] Text-Video-ProxyNet (TV-ProxyNet)は、TVRの従来の1対Nの関係をN対1の関係に分解するために設計された新しいフレームワークである。
TV-ProxyNetはMSRVTTとActivityNet Captionsの最先端のパフォーマンスを達成し、既存の方法と比較してDiDeMoを2.0%改善した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:52:32 GMT)
InverseCoder: Self-improving Instruction-Tuned Code LLMs with Inverse-Instruct [43.8] 本稿では、微調整されたオープンソースモデルを用いて、追加データを生成して命令調整データセットを拡張できるかどうかを考察する。
Inverse-Instructは、微調整 LLM を用いて、独自のトレーニングデータセットからコード応答の追加命令を生成するデータ拡張手法である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:08:42 GMT)
Barbie: Text to Barbie-Style 3D Avatars [43.2] 多様な高品質なバービーのような衣服やアクセサリーを身に着けた3Dアバターを作るための新しいフレームワークであるBarbieを提案する。
バービーは人体と衣服のセマンティックアライズされたモデルによって、アバターの細粒度のゆがみを達成している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:18:51 GMT)
Steering Language Models with Game-Theoretic Solvers [43.0] 大規模言語モデル(LLM)によって生成される自然言語対話の空間上で平衡解法が機能するフレームワークを導入する。
具体的には、対話の「ゲーム」におけるプレイヤー、戦略、ペイオフをモデル化することにより、自然言語の相互作用から従来のゲーム理論の記号論理への結合を生成する。
我々は,会議のスケジューリング,果物の取引,討論など,異なる交渉戦略を必要とする3つの領域に注目し,解決者によって指導されたLLMの言語を評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:03:31 GMT)
EGP3D: Edge-guided Geometric Preserving 3D Point Cloud Super-resolution for RGB-D camera [42.8] RGB-Dカメラに適したエッジガイド型3次元点雲超解像法(EGP3D)を提案する。
提案手法は,投影された2次元空間のエッジ制約を伴って点雲を革新的に最適化することにより,3次元PCSRタスクにおける高品質なエッジ保存を実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:42:25 GMT)
Time-dependent Neural Galerkin Method for Quantum Dynamics [42.8] 本稿では,グローバル・イン・タイムの変動原理に依存する量子力学の古典的計算手法を提案する。
本稿では,グローバルな量子クエンチを1次元および2次元のパラダイム的横フィールドイジングモデルでシミュレーションする手法の有効性を示す。
概して,本手法は,最先端の時間依存変分法と比較して,競合性能を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:48:54 GMT)
Semidefinite programming relaxations for quantum correlations [42.7] 量子相関論において、半定緩和のコアアイデアがどのように様々な研究トピックに適用できるかを論じる。
これらのトピックには、非局所性、量子通信、量子ネットワーク、絡み合い、量子暗号が含まれる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:32:38 GMT)
autrainer: A Modular and Extensible Deep Learning Toolkit for Computer Audition Tasks [42.5] autrainerは、監査タスクのコンピュータトレーニングのためのPyTorchベースのツールキットである。
本稿では,その内部動作と重要な機能について概説する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:25:58 GMT)
OmniCount: Multi-label Object Counting with Semantic-Geometric Priors [42.4] 本稿では,オープン語彙フレームワークを用いた複数のオブジェクトカテゴリの同時カウントを実現するための,より実践的なアプローチを提案する。
我々のソリューションであるOmniCountは、事前訓練されたモデルから意味的および幾何学的な洞察(優先順位)を用いて、ユーザが指定した複数のカテゴリのオブジェクトをカウントすることで際立っている。
OmniCount-191の包括的な評価は、他の主要なベンチマークとともに、OmniCountの例外的なパフォーマンスを示し、既存のソリューションを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:43:39 GMT)
UAlign: Leveraging Uncertainty Estimations for Factuality Alignment on Large Language Models [41.7] 大きな言語モデル(LLM)は、しばしば、彼らが持っている事実の知識を正確に表現するのに苦労する。
知識境界を表現するために不確実性推定を利用するUAlignフレームワークを提案する。
提案したUAlign は LLM の能力を大幅に向上させ,既知の疑問に自信を持って答えることができることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:14:27 GMT)
Energy-Constrained Information Storage on Memristive Devices in the Presence of Resistive Drift [41.7] エネルギー制約下での抵抗的ドリフトノイズの影響を受け, メムリスタの情報保存の問題について検討する。
我々は、経験的状態の情報寿命と、そのデバイスを特定の状態にするために必要なエネルギーとの間に、新しい基本的なトレードオフを導入する。
本稿では,画像の類似的な保存を行うためのJSCC(Joint Source-Channel code)手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:40:13 GMT)
Weighted Poisson-disk Resampling on Large-Scale Point Clouds [40.2] 本稿では,処理のユーザビリティと効率を向上させるために,重み付きポアソンディスク (WPD) 再サンプリング法を提案する。
実験により,本手法は大規模クラウド再サンプリングの性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:51:27 GMT)
Multi-modal and Multi-scale Spatial Environment Understanding for Immersive Visual Text-to-Speech [39.7] M2SE-VTTSは、環境イメージを音声コンテンツに対する残響音声の合成のプロンプトとすることを目的としている。
没入型VTTSを実現するためのマルチモーダル・マルチスケール空間環境理解手法を提案する。
本モデルは,環境音声生成における先進的ベースラインよりも優れる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:25:23 GMT)
High dynamic-range quantum sensing of magnons and their dynamics using a superconducting qubit [39.6] 超伝導量子ビットを用いて、約2000個の励起範囲のフェライトマグノンを探査する。
クォービット制御とパラメトリック誘導されたクォービット-マグノン相互作用を用いて、マグノンのほとんど励起に敏感な検出を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:18:26 GMT)
Cross-View Geo-Localization with Street-View and VHR Satellite Imagery in Decentrality Settings [39.3] Cross-View Geo-Localizationは、ストリートビュークエリ画像とジオタグ付き空中ビュー参照画像とを一致させる。
既存のデータセットとメソッドは、しばしば中心的な設定を前提とするか、限定的な分散性しか考慮しない。
CVSatは、地理的に広い範囲で、クロスビューなジオローカライゼーションを評価するために設計された、新しいデータセットである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:07:53 GMT)
CURE: A dataset for Clinical Understanding & Retrieval Evaluation [38.8] 医療提供者が医療現場で使用することを意図した検索システムのテストデータセットは少ない。
CUREは、単言語(英語)とクロスランガル(フランス語/スペイン語 ->英語)の2つの条件を持つ10の医療ドメインにまたがる2000のクエリからなる、通過ランキングのためのアドホック検索テストデータセットである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:18:28 GMT)
PanSplat: 4K Panorama Synthesis with Feed-Forward Gaussian Splatting [38.5] 最大4K解像度(2048$times$4096)を効率的にサポートする汎用フィードフォワードアプローチであるPanSplatを提案する。
提案手法は,フィボナッチ格子を配置した球状3次元ガウスピラミッドを特徴とし,情報冗長性を低減しつつ画質を向上させる。
実験により、PanSplatは、合成データセットと実世界のデータセットの両方で、優れた効率と画質を実現することが示された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:59:45 GMT)
Vocabulary Expansion of Chat Models with Unlabeled Target Language Data [38.3] チャットモデル(つまり、人間との会話を通じて指示に従うために訓練された言語モデル)は、会話と一般的なタスク解決能力の両方において、ベースモデル(すなわち、ラベルなしデータにのみ訓練された)より優れている。
これらのモデルは一般的に英語中心であり、トレーニングデータから不足している言語や欠落している言語にさらに適応する必要がある。
そこで本研究では,本手法の有効性を明らかにする実験を行い,87%のケースにおいて,適合モデルが性能改善を達成するのに有効であることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:26:28 GMT)
Understanding Knowledge Hijack Mechanism in In-context Learning through Associative Memory [37.9] In-context Learning (ICL) は、大規模言語モデルが微調整なしで新しいタスクに適応できるようにする。
本稿では,トークン予測における文脈内情報と事前学習したビッグラム知識のバランスについて検討する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:33:05 GMT)
ASLoRA: Adaptive Sharing Low-Rank Adaptation Across Layers [37.8] ASLoRAはグローバル共有と部分適応共有を組み合わせた多層パラメータ共有戦略である。
我々は様々なNLPタスクの実験を行い、パラメータの25%未満を使用しながら、ASLoRAがLoRAより優れていることを示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:05:38 GMT)
A Survey on Large Language Models for Communication, Network, and Service Management: Application Insights, Challenges, and Future Directions [37.4] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおける非並列性のため、大きな注目を集めている。
本研究では,モバイルネットワークや関連技術,車両ネットワーク,クラウドネットワーク,フォグ/エッジネットワークなど,さまざまな通信ネットワークドメインを対象としたLCMの統合について検討する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:01:36 GMT)
Near Large Far Small: Relative Distance Based Partition Learning for UAV-view Geo-Localization [37.3] UAV-view Geo-Localization (UVGL) は、主にドローンビューと衛星ビューの外観の違いによって大きな課題を呈している。
相対的距離に基づく分割学習フレームワークを提案し,粒度の細かい特徴をマイニングしながらスケールの一貫性への依存を軽減する。
提案手法は, 様々なスケール不整合シナリオにおいて, 高精度な局所化精度を実現し, スケール変動に対する顕著なロバスト性を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:13:05 GMT)
3D$^2$-Actor: Learning Pose-Conditioned 3D-Aware Denoiser for Realistic Gaussian Avatar Modeling [37.1] ポーズ条件付き3D対応ヒューマンモデリングパイプラインである3D$2$-Actorを導入する。
実験により、3D$2$-アクターは高忠実度アバターモデリングにおいて優れ、新しいポーズに頑健に一般化することを示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:37:52 GMT)
MPQ-DM: Mixed Precision Quantization for Extremely Low Bit Diffusion Models [37.1] 本稿では,拡散モデルのための混合精度量子化法MPQ-DMを提案する。
重み付き外周波による量子化誤差を軽減するために,外周波混合量子化手法を提案する。
時間ステップを横断する表現を頑健に学習するために,時間-平滑な関係蒸留方式を構築した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:31:55 GMT)
SciSafeEval: A Comprehensive Benchmark for Safety Alignment of Large Language Models in Scientific Tasks [37.0] 大規模言語モデル(LLM)は、生物学、化学、医学、物理学など、様々な分野の科学的なタスクに変革をもたらす。
既存のベンチマークは主にテキストの内容に焦点を当て、分子、タンパク質、ゲノム言語などの重要な科学的表現を見渡す。
SciSafeEvalは, LLMの安全アライメントを, 様々な科学的タスクで評価するためのベンチマークである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:57:23 GMT)
Efficiently Achieving Secure Model Training and Secure Aggregation to Ensure Bidirectional Privacy-Preservation in Federated Learning [36.9] 局所勾配とグローバルモデルの両方がプライバシーを侵害する可能性があるため、双方向のプライバシー保護フェデレーション学習が不可欠である。
我々は、安全なモデルトレーニングと安全なアグリゲーションを実現するために、フェデレートラーニングのための効率的で高精度な双方向プライバシー保護スキームを設計する。
提案手法は, 計算コスト, モデル精度, 防衛能力において, 最先端の双方向プライバシー保護ベースラインを著しく上回っている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:58:21 GMT)
How Private are Language Models in Abstractive Summarization? [36.8] 言語モデル(LM)は、医学や法律などの繊細な分野を含むテキスト要約において、優れたパフォーマンスを示している。
しかし、私的でない資料がまだ調査されていないため、LMがプライバシー保護の要約をどの程度提供できるかは未定である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:08:22 GMT)
Constructing Confidence Intervals for Average Treatment Effects from Multiple Datasets [36.8] 本稿では、複数の観測データセットからATEを推定し、有効なCIを提供する新しい手法を提案する。
本手法は観測データセットの仮定をほとんど行わず,医学的実践に広く応用できる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:39:46 GMT)
Speech Foundation Models and Crowdsourcing for Efficient, High-Quality Data Collection [36.7] 本稿では,データ取得におけるコスト/品質トレードオフを初めて検討し,音声基礎モデル(SFM)を用いた検証プロセスの自動化について検討する。
フランス、ドイツ、韓国のデータを用いた実験では、SFMベースの検証は人間の検証への依存を減らす可能性があり、最終的なデータ品質を劣化させることなく40.0%以上のコスト削減が期待できることが示された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:59:22 GMT)
Ultra-High-Definition Dynamic Multi-Exposure Image Fusion via Infinite Pixel Learning [36.5] 動的シーンにおけるマルチ露光画像を融合する既存の手法は、低解像度画像のために設計されている。
本稿では,UHDマルチ露光ダイナミックシーン画像融合を実現するための新しい学習パラダイムを提案する。
提案手法は,UHD動的マルチ露光画像をリアルタイムに融合しながら,高品質な視覚性能を維持する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:55:26 GMT)
Beyond Graph Convolution: Multimodal Recommendation with Topology-aware MLPs [36.2] マルチモーダルレコメンデータシステムは、ユーザとイテムの相互作用を超えた、よりリッチなセマンティック情報を利用する必要がある。
最近の研究は、グラフ畳み込みネットワーク(GCN)を利用して、マルチモーダルアイテム-イテム関係を明示的にモデル化することで、パフォーマンスを著しく向上させることを強調している。
本稿では,アイテム・イテム関係のモデル化においてGCNをバイパスする手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:05:13 GMT)
CEM: A Data-Efficient Method for Large Language Models to Continue Evolving From Mistakes [36.1] 大きな言語モデルを維持し、その欠点に対処するためには、継続的な学習が不可欠です。
本稿では,CPTデータ収集を目的としたデータ効率の高い手法であるCEM法を提案する。
実験の結果、CEMはドメイン内QAタスクとドメイン外QAタスクの両方で複数のモデルの性能を大幅に向上させ、最大29.63%のゲインを達成している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:21:30 GMT)
Snakes and Ladders: Adapting the surface code to defects [36.1] 我々は、欠陥量子ビットとゲートの存在下で、表面コードパッチを適応するための、新しい高性能な一連の方法を開発した。
従来の手法と比較して,本手法は実際の欠陥率に適応した表面コードパッチのコード距離を大幅に改善する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:27:24 GMT)
Online Writer Retrieval with Chinese Handwritten Phrases: A Synergistic Temporal-Frequency Representation Learning Approach [35.5] DOLPHINは,相乗的時間周波数解析による手書き表現の向上を目的とした新しい検索モデルである。
OLIWER(OLIWER)は,1,731人から670,000以上の中国語の字句を含む大規模オンライン作家検索データセットである。
本研究は,手書き表現の質向上における点サンプリング周波数と圧力特性の重要性を強調した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:19:22 GMT)
Point Cloud-Assisted Neural Image Compression [35.5] 本稿では,点雲の助けを借りて画像圧縮性能を向上させる。
画像テクスチャと構造を保存するための点雲支援ニューラルネットワーク(PCA-NIC)を提案する。
私たちの研究は、ポイントクラウドを用いて画像圧縮性能を初めて改善し、最先端のパフォーマンスを実現しました。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:44:26 GMT)
Instruction-based Image Manipulation by Watching How Things Move [35.4] 命令ベースの複雑な操作が可能なモデルであるInstructMoveをトレーニングする新しいデータセットを作成します。
本モデルでは,ポーズの調整,要素の並べ替え,カメラ視点の変更などのタスクにおいて,最先端の性能を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:56:17 GMT)
MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering [35.2] MLE-benchは、AIエージェントが機械学習エンジニアリングでどのように機能するかを測定するためのベンチマークである。
われわれはKaggleから75のMLエンジニアリング関連のコンペを開催する。
私たちはKaggleが公開しているリーダーボードを使って、各競技の人間ベースラインを確立します。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:05:09 GMT)
MOVIS: Enhancing Multi-Object Novel View Synthesis for Indoor Scenes [35.2] MOVISは、多目的NVSのためのビュー条件拡散モデルの構造的認識を高めることを目的としている。
本稿では,新しいビューオブジェクトマスクを同時に予測するためにモデルを必要とする補助タスクを提案する。
合成画像の可視性を評価するために,クロスビューの一貫性と新しいビューオブジェクト配置を評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:23:45 GMT)
Predicting the Original Appearance of Damaged Historical Documents [34.9] 歴史資料には多くの文化財が含まれているが、文字の欠如、紙の損傷、インク浸食などの深刻な被害に悩まされている。
既存の文書処理方法は、主にバイナライゼーション、強化等に重点を置いており、これらの損傷の修復を怠っている。
我々は,損傷した史料の本来の出現を予測することを目的とした,歴史文書修復という新たな課題を提示する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:25:03 GMT)
ACE-$M^3$: Automatic Capability Evaluator for Multimodal Medical Models [34.8] ACE-$M3$, textbfAutomatic textbfCapability textbfEvaluator for textbfMultimodal textbfMedical textbfModelsを紹介する。
最初に、標準的な医療評価基準に基づく詳細な分析と簡潔な最終スコアを提供するために、ブランチマージアーキテクチャを利用する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:15:43 GMT)
Towards a Speech Foundation Model for Singapore and Beyond [34.6] MERaLiON 音声は200K 時間にスクラッチから事前訓練された。
このモデルは、シンガポールで話される諸種を含む、主に英語をサポートしている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:15:19 GMT)
Adversarial Attacks on Large Language Models in Medicine [34.2] 医療アプリケーションへの大型言語モデルの統合により、医療診断、治療勧告、患者医療の進歩が期待できる。
LLMの敵対的攻撃に対する感受性は重大な脅威となり、繊細な医学的文脈で有害な結果をもたらす可能性がある。
本研究では,3つの医療課題における2種類の敵攻撃に対するLDMの脆弱性について検討した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:32:32 GMT)
CoinMath: Harnessing the Power of Coding Instruction for Math LLMs [34.1] 大規模言語モデル (LLM) は数学的な問題を解く上で高い性能を示している。
数学的推論を強化するための符号化命令データを活用するベストプラクティスは、いまだ研究されていない。
CoinMathは、簡潔なコメント、記述的な命名規則、ハードコードされたソリューションを組み込んだ、さまざまなコードベースの論理を生成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:21:11 GMT)
IDEA-Bench: How Far are Generative Models from Professional Designing? [34.0] 実世界の100のタスクを含むベンチマークであるIDEA-Benchを紹介する。
これには、レンダリング、ビジュアルエフェクト、ストーリーボード、絵本、フォント、スタイルベース、アイデンティティ保存生成が含まれる。
最高のパフォーマンスモデルでさえ、IDEA-Benchで22.48しか達成せず、最高の汎用モデルは6.81しか達成していない。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:39:32 GMT)
Fast-DetectGPT: Efficient Zero-Shot Detection of Machine-Generated Text via Conditional Probability Curvature [33.8] 大規模言語モデル(LLM)は、流動的でコジェントなコンテンツを生成する能力を示している。
信頼できるAIシステムを構築するためには、マシン生成コンテンツと人間によるコンテンツとを区別することが不可欠である。
Fast-DetectGPTは、ディテクターGPTの摂動ステップを、より効率的なサンプリングステップで置き換える最適化されたゼロショット検出器である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:20:31 GMT)
Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning [33.4] 思考の接地連鎖とルックアヘッド空間推論によるマルチモーダル行動モデルEmma-X
思考の接地連鎖とルックアヘッド空間推論を併用したマルチモーダル行動モデルEmma-Xを提案する。
Emma-Xは、特に空間的推論を必要とする現実世界のロボットタスクにおいて、競争ベースラインよりも優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:58:28 GMT)
Joint Identity Verification and Pose Alignment for Partial Fingerprints [33.1] 本稿では,部分指紋ペアの協調識別とポーズアライメントのための新しいフレームワークを提案する。
本手法は,部分的指紋認証と相対的ポーズ推定の両方において,最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:18:28 GMT)
StrandHead: Text to Strand-Disentangled 3D Head Avatars Using Hair Geometric Priors [33.0] ストランドヘッド(StrandHead)は3次元頭部アバター生成法である。
StrandHeadが生成した3D頭部と毛髪の最先端の現実と多様性を実現することを示す。
生成された3Dヘアは、物理シミュレーションやその他の用途のために、Unreal Engineで容易に実装できる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:17:36 GMT)
One for Dozens: Adaptive REcommendation for All Domains with Counterfactual Augmentation [32.9] マルチドメインレコメンデーション(MDR)は、さまざまなドメインにわたるレコメンデーションパフォーマンスの向上を目的としている。
従来のMDRアルゴリズムは一般に5つ未満の領域にフォーカスする。
本稿では,全てのドメインに対するアダプティブ・レコメンデーションを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:52:17 GMT)
Learning Implicit Features with Flow Infused Attention for Realistic Virtual Try-On [32.9] 仮想トライオンでFlow Infused Attentionモジュールを採用することにより,暗黙のワープ機能を利用するFIA-VTONを提案する。
VTON-HDおよびDressCodeデータセットの実験結果は、最先端の手法よりも大幅に優れている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:23:33 GMT)
EventSum: A Large-Scale Event-Centric Summarization Dataset for Chinese Multi-News Documents [32.6] イベント中心多文書要約(ECS)タスクは、複数の関連するニュース文書に基づいて、所定のイベントの簡潔で包括的な要約を生成することを目的としている。
EventSumデータセットを構築し,5,100件のイベントと57,984件のニュースドキュメントを含む。
我々は、イベントリコール、Argument Recall、Causal Recall、Temporal Recallなどの特定のメトリクスを、対応する計算方法とともに設計し、評価を行った。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:29:49 GMT)
Generalization Analysis for Deep Contrastive Representation Learning [32.6] 本稿では,Deep Contrastive Representation Learningフレームワークにおける教師なしリスクの限界について述べる。
我々は損失増大手法を用いて、行列ノルムへの依存性とネットワーク深さへの暗黙的依存を減らす。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:40:05 GMT)
Benchmarking VLMs' Reasoning About Persuasive Atypical Images [31.9] 視覚言語モデル(VLM)は、様々なタスクにおいて強力なゼロショット一般化を示している。
広告のような修辞的で説得力のあるビジュアルメディアを理解する能力は、まだ検討されていない。
本稿では,VLMによる説得的イメージの非定型性理解のベンチマークを行うための3つの新しいタスクを紹介する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 00:37:54 GMT)
Unveiling Language Skills via Path-Level Circuit Discovery [31.6] 相互接続された線形鎖を通しての動作の出現を検知する新しい経路レベル回路発見フレームワークを提案する。
本フレームワークは,元モデルから切り離されたメモリ回路の線形結合を,完全距離で構成する。
既存の研究のサーキットグラフとは対照的に、入力の個々のコンポーネントに対するきめ細かい応答ではなく、ジェネリックスキルの完全なパスに焦点を当てる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:33:36 GMT)
Instruct-IPT: All-in-One Image Processing Transformer via Weight Modulation [31.5] 我々は、オールインワン画像処理変換器(IPT)であるインストラクト-IPTを提案する。
Instruct-IPTは、大きなタスク間ギャップを持つ多様体画像復元タスクに効果的に対処できる。
優れた圧縮戦略のランク解析を行い、バイアスに対して低ランク分解を行う。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:04:24 GMT)
TIV-Diffusion: Towards Object-Centric Movement for Text-driven Image to Video Generation [31.4] テキスト駆動映像生成(TI2V)は、第1フレームと対応するテキスト記述が与えられた制御可能なビデオを生成することを目的としている。
本稿では,オブジェクト中心のテキスト・ビジュアルアライメントを通じて,TIV-Diffusionと呼ばれる新しい拡散型TI2Vフレームワークを提案する。
我々のTIV-Diffusionは、既存のTI2V法と比較して最先端の高品質ビデオ生成を実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:32:09 GMT)
Future Sight and Tough Fights: Revolutionizing Sequential Recommendation with FENRec [31.3] 逐次レコメンデーション(SR)システムは、時間順のインタラクションシーケンスを分析することによって、ユーザの好みを予測する。
SRの一般的な課題は、ユーザーが通常、限られた数のアイテムとのみ対話するため、データスパシティである。
シーケンシャルレコメンデーション(FENRec)におけるコントラスト学習のための継続ネガティクスを用いた今後のデータ活用を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:20:29 GMT)
Can video generation replace cinematographers? Research on the cinematic language of generated video [31.0] 本稿では,制御可能な映像言語を生成するためのT2Vモデルの能力を高めるための3倍のアプローチを提案する。
ショットフレーミング、アングル、カメラの動きを含む映画言語データセットを導入し、様々な映画スタイルを学習できるようにする。
次に、提案したデータセットに基づいて微調整されたモデルであるCameraCLIPを紹介する。
最後に,コスト誘導型動的LoRA合成法であるCLIPLoRAを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:02:24 GMT)
Visual Instruction Tuning with 500x Fewer Parameters through Modality Linear Representation-Steering [30.5] MLLM(Multimodal Large Language Models)は、大規模言語モデル(LLM)に視覚表現を統合することで、視覚的タスクを大幅に進歩させる。
目的を達成するためにモダリティリニア表現ステアリング(MoReS)を導入する。
MoReSはモデル全体の固有のモダリティを効果的に再バランスさせ、そこでキーとなるアイデアは、各モデル層をまたいだ視覚部分空間の線形変換を通じて視覚表現を操ることである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:14:11 GMT)
MeshArt: Generating Articulated Meshes with Structure-guided Transformers [30.4] MeshArtは階層的なトランスフォーマーベースのアプローチで、調音された3Dメッシュを生成する。
構造カバレッジは57.1%向上し,メッシュ生成FIDは209ポイント向上した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:35:08 GMT)
Unveiling the Power of Source: Source-based Minimum Bayes Risk Decoding for Neural Machine Translation [30.3] ニューラルマシン翻訳(NMT)の一般的な手法である、最大後部復号法は、推定後部確率を最大化することを目的としている。
最小ベイズリスク(MBR)復号法は、最も期待されているユーティリティで仮説を求める方法を提供する。
以上の結果から, sMBRはNMT復号法として有望なアプローチであることが示唆された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:04:37 GMT)
Controllable Distortion-Perception Tradeoff Through Latent Diffusion for Neural Image Compression [30.3] ニューラル画像圧縮は、レート、歪み、知覚の間で難しいトレードオフに直面していることが多い。
固定されたニューラルイメージの両面を同時に扱う新しいアプローチを提案する。
1dB以上のPSNRを犠牲にすることなくLPIPS-BDRateを150%以上改善できる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:09:32 GMT)
"They've Stolen My GPL-Licensed Model!": Toward Standardized and Transparent Model Licensing [30.2] 我々は、MLワークフロー管理のための新しい語彙を開発し、ライセンスルールを符号化し、権利付与とコンプライアンスの問題を分析するためのオントロジ的推論を可能にする。
分析ツールは、Linked Open Model Dataへの第一歩として想定されている、Turtle言語とNotation3推論エンジンをベースにしています。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:52:09 GMT)
Can Knowledge Graphs Make Large Language Models More Trustworthy? An Empirical Study over Open-ended Question Answering [30.1] 我々は,KG(Knowledge Graphs)で拡張されたLarge Language Models (LLMs) を評価するために設計された新しいベンチマークであるOKGQAを紹介する。
OKGQAは、様々なタイプの質問を使って実践的なアプリケーションの複雑さを深く反映するように設計されており、幻覚の減少と推論能力の強化の両方を測定するために特定のメトリクスを取り入れている。
KGのセマンティクスと構造が意図的に乱れ、汚染された場合のモデル性能を評価するため、OKGQA-Pを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:18:12 GMT)
Score and Distribution Matching Policy: Advanced Accelerated Visuomotor Policies via Matched Distillation [29.9] 視覚的モビリティ学習のためのスコア・アンド・ディストリビューション・マッチング・ポリシー(SDM Policy)を提案する。
SDMポリシーは拡散ベースのポリシーを2段階最適化プロセスを通じて単一ステップジェネレータに変換する。
最先端のアクション品質を持ちながら、6倍の推論スピードアップを達成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:43:20 GMT)
Multi-modal Sensor Fusion for Auto Driving Perception: A Survey [29.8] 本稿では,自律運転における知覚課題に対する既存のマルチモーダル方式の文献的考察を行う。
融合段階の観点から,より合理的な分類法により,これらを2つの主要なクラス,4つのマイナークラスに分割する革新的な方法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:42:56 GMT)
ChatTracker: Enhancing Visual Tracking Performance via Chatting with Multimodal Large Language Model [29.7] Vision-Language(VL)トラッカーは、様々なアプリケーションにおける汎用性を高めるために、追加の自然言語記述を活用することを提案している。
VLトラッカーは、追跡性能の点で依然としてState-of-The-Art (SoTA)ビジュアルトラッカーより劣っている。
本稿では,MLLM(Multimodal Large Language Model)における多言語知識の豊富な活用を目的としたChatTrackerを提案し,高品質な言語記述を生成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:53:25 GMT)
MUSES: 3D-Controllable Image Generation via Multi-Modal Agent Collaboration [29.7] ユーザクエリから3次元制御可能な画像生成のための汎用AIシステムであるMUSESを導入する。
このマルチモーダルエージェントパイプラインは、人間のプロのコラボレーションを模倣することにより、3D制御可能なオブジェクトによる画像の効果的かつ自動生成を容易にする。
我々はT2I-3DisBench(3D画像シーン)の新しいベンチマークを構築し、50の詳細なプロンプトを持つ多様な3D画像シーンを記述した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:08:29 GMT)
Personalized LLM for Generating Customized Responses to the Same Query from Different Users [28.9] そこで本研究では,問合せ型大規模言語モデル (LLM) のパーソナライズ方式を提案する。
マルチビュー強化によるコントラスト学習を適用し,異なる質問者の対話表現を抽出しながら,同じ質問者の対話表現をクローズする。
また、英語と中国語のスクリプトとWeChatレコードから複数のクェリタデータセットを構築し、MQDialogと呼ばれる173の質問者と12の応答者を含む。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:57:19 GMT)
A LoRA is Worth a Thousand Pictures [28.9] 低ランク適応(LoRA)は、最小限のデータと計算を用いてアーティストのスタイルや主題を再現することができる。
画像生成やトレーニングセットの知識を必要とせずに,LoRA重みだけで効果的なスタイル記述子として機能することを示す。
ゼロショットLORAファインチューニングやモデル属性など,将来的な応用の可能性について論じる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:18:17 GMT)
Speak & Improve Challenge 2025: Tasks and Baseline Systems [28.9] Speak & Improve Challenge 2025: Spoken Language Assessment and Feedback"は、ISCA SLaTE 2025ワークショップに関連する課題である。
この課題の目標は、基礎技術と言語学習の両方のフィードバックに関連するタスクを用いて、音声言語アセスメントとフィードバックの研究を進めることである。
本稿では、S&I Corpus 2025の課題と、チャレンジ用にリリースされたベースラインシステムについて述べる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:05:18 GMT)
Speak & Improve Corpus 2025: an L2 English Speech Corpus for Language Assessment and Feedback [28.5] Speak & Improve 2025は、L2学習者の英語データのデータセットである。
コーパスリリースの目的は、L2音声言語処理システムの開発において大きな課題に取り組むことである。
ELiTのウェブサイトで非商用利用が可能である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:07:26 GMT)
BiM-VFI: directional Motion Field-Guided Frame Interpolation for Video with Non-uniform Motions [28.5] 既存のビデオフレーム(VFI)モデルは、一様でない動きのビデオで訓練する際、時間と位置のあいまいさに悩まされる傾向がある。
非一様運動を効果的に記述するための双方向運動場(Bidirectional Motion Field, BiM)を提案する。
BiM-VFIモデルは、最近の最先端のVFI手法を26%、LPIPSとSTLPIPSの45%で大幅に上回っている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:37:51 GMT)
EvoLlama: Enhancing LLMs' Understanding of Proteins via Multimodal Structure and Sequence Representations [28.3] タンパク質を理解するための現在の大規模言語モデル(LLM)は、主にアミノ酸配列をテキストモダリティとして扱う。
EvoLlamaは構造ベースのエンコーダ、配列ベースのタンパク質エンコーダ、およびタンパク質理解のためのLLMを接続するフレームワークである。
実験の結果,EvoLlamaのタンパク質理解能力は著しく向上した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:01:33 GMT)
FedMKT: Federated Mutual Knowledge Transfer for Large and Small Language Models [28.3] FedMKTは、大小の言語モデルのためのパラメータ効率の良い相互知識伝達フレームワークである。
我々は,FedMKTがLLMとSLMの両方の性能を同時に向上させることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:13:14 GMT)
OpenFactCheck: Building, Benchmarking Customized Fact-Checking Systems and Evaluating the Factuality of Claims and LLMs [27.9] OpenFactCheckは、カスタマイズされたファクトチェックシステムを構築するためのフレームワークである。
ユーザーは自動的にファクトチェッカーをカスタマイズし、文書やクレームの事実的正当性を検証できる。
CheckerEVALは、人間の注釈付きデータセットを使用して、自動ファクトチェッカーの検証結果の信頼性を高めるソリューションである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:06:08 GMT)
Towards joint graph learning and sampling set selection from data [27.5] グラフ構造が事前に定義されていないシナリオにおいて,グラフ信号をサンプリングする問題について検討する。
既存のアプローチは、2段階のプロセスに依存しており、まずグラフを学習し、次にサンプリングする。
この研究は、グラフ構造とサンプリングセットを共同最適化するための基礎的なステップを提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:35:27 GMT)
FSFM: A Generalizable Face Security Foundation Model via Self-Supervised Facial Representation Learning [27.3] 実顔画像の基本表現を学習するための自己教師付き事前学習フレームワークを提案する。
我々のモデルは、教師付き事前学習、視覚的および顔的自己指導型学習技術よりも優れており、タスク特化SOTA法よりも優れています。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:58:45 GMT)
Comprehensive Assessment of Jailbreak Attacks Against LLMs [27.0] 様々なジェイルブレイク攻撃法を大規模に測定した。
我々は17の最先端のジェイルブレイク手法を収集し、それらの特徴を要約し、新しいジェイルブレイク攻撃分類を確立した。
検閲された8つのLLMと16の違反カテゴリからの160の質問に基づいて、攻撃の有効性を統一的かつ公平に評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:02:14 GMT)
High-speed and High-quality Vision Reconstruction of Spike Camera with Spike Stability Theorem [26.8] スパイクストリーム特性と安定光強度の関係を明らかにする新しいスパイク安定性定理を提案する。
スパイク安定定理に基づき、スパイクカメラのリアルタイムビジョン再構成のために2つのパラメータフリーアルゴリズムを設計する。
我々の研究は、スパイクカメラのリアルタイムエッジビジョン処理のための新しい定理とアルゴリズムの基礎を提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:33:10 GMT)
Does VLM Classification Benefit from LLM Description Semantics? [26.7] 本稿では,クラス名アンサンブル効果とは無関係に機能する識別的記述を選択するための学習自由手法を提案する。
7つのデータセットにまたがる分類精度の向上を実証し,説明に基づく画像分類の妥当性について考察した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:01:18 GMT)
Smoothness Really Matters: A Simple yet Effective Approach for Unsupervised Graph Domain Adaptation [26.7] Unsupervised Graph Domain Adaptation (UGDA)は、ラベル付きソースグラフからの知識をラベル付きターゲットグラフに転送することで、ドメイン間の分散シフトをブリッジする。
TDSS(Target-Domain Structure Smoothing)と呼ばれるUGDAのための新しいアプローチを提案する。
TDSSは、ターゲットグラフ上で直接構造的滑らか化を行うための、シンプルで効果的な方法である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:56:58 GMT)
MuSHRoom: Multi-Sensor Hybrid Room Dataset for Joint 3D Reconstruction and Novel View Synthesis [26.7] 実世界のマルチセンサーハイブリッドルームデータセット(MuSHRoom)を提案する。
我々のデータセットは、エキサイティングな課題を示し、最先端の手法がコスト効率が高く、ノイズの多いデータやデバイスに対して堅牢であることを要求する。
共同3Dメッシュ再構成と新しいビュー合成のためのデータセット上で、いくつかの有名なパイプラインをベンチマークする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:22:12 GMT)
Attention with Dependency Parsing Augmentation for Fine-Grained Attribution [26.6] 提案手法は,検索した文書から各回答に対する証拠を裏付ける,きめ細かな属性機構を開発する。
既存の属性法は、応答と文書間のモデル-内部類似度(Saliency scores)や隠れ状態類似度(hidden state similarity)など)に依存している。
まず,表現の粒度を保ちつつ,集合ユニオン操作を通じてトークンに関する証拠を集約する。
第二に、ターゲットスパンの意味的完全性を強化するために依存性解析を統合することで属性の強化を行う。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:12:13 GMT)
SEAGraph: Unveiling the Whole Story of Paper Review Comments [26.4] 従来のピアレビュープロセスでは、著者は曖昧または不十分な詳細なフィードバックを受け取ることが多い。
これにより、著者によるレビューコメントの理解を深める方法について、批判的な疑問が持ち上がる。
提案するSEAGraphは,レビューの意図を明らかにすることによって,レビューコメントを明確にするための新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:24:36 GMT)
Unsupervised Anomaly Detection for Tabular Data Using Noise Evaluation [26.3] 教師なし異常検出(UAD)は、現代のデータ分析において重要な役割を果たす。
データに含まれるノイズの量を評価することによって,新しいUAD手法を提案する。
提案手法が異常データの検出に有効であることを証明し,理論的保証を提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:35:58 GMT)
ChatTime: A Unified Multimodal Time Series Foundation Model Bridging Numerical and Textual Data [26.3] ChatTimeは時系列とテキスト処理のための統合されたフレームワークである。
アウトオブボックスのマルチモーダル時系列基盤モデルとして、ChatTimeはゼロショット予測機能を提供する。
複数のタスクやシナリオでChatTimeの優れたパフォーマンスを検証するために、一連の実験を設計する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:04:06 GMT)
A Survey of Mathematical Reasoning in the Era of Multimodal Large Language Model: Benchmark, Method & Challenges [25.8] 本調査は,マルチモーダル大言語モデル(MLLM)の時代における数学的推論の包括的解析である。
2021年以降に出版された200以上の研究を概観し,Math-LLMの最先端の展開について検討する。
特に、マルチモーダルな数学的推論パイプラインと(M)LLMと関連する方法論について検討する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:21:41 GMT)
Deep Learning Model Security: Threats and Defenses [25.1] ディープラーニングはAIアプリケーションを変えたが、重要なセキュリティ課題に直面している。
この調査は、これらの脆弱性を調べ、それらのメカニズムとモデル完全性と機密性への影響を詳細に示す。
この調査は、自動化された防御、ゼロトラストアーキテクチャ、大規模AIモデルのセキュリティ上の課題を強調し、今後の方向性を結論付けている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:34:55 GMT)
P$^2$ Law: Scaling Law for Post-Training After Model Pruning [25.1] プルーニングは、大規模言語モデル(LLM)のハードウェア要件を減らすために広く採用されている技術である。
プルーニング後のモデル性能を回復するため、結果として生じる性能劣化を軽減するために後訓練が一般的である。
学習後コストとモデル性能のバランスをとるためには,学習後データの最適量を探索する必要がある。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:00:34 GMT)
Equivariant Action Sampling for Reinforcement Learning and Planning [24.4] 連続制御タスクのための強化学習アルゴリズムは、正確なサンプリングベースのアクション選択を必要とする。
この研究はサンプリングに基づく計画と制御における対称性の保存という課題に対処する。
所望の対称性を強制するアクションサンプリング手法を導入する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:51:14 GMT)
What Matters in Learning A Zero-Shot Sim-to-Real RL Policy for Quadrotor Control? A Comprehensive Study [24.2] 実世界の四角形においてゼロショット展開が可能なロバストなRLベースの制御ポリシーを学習するための重要な要因について検討する。
これら5つのテクニックを統合した,PPOベースのトレーニングフレームワークSimpleFlightを開発した。
クレージーフリー四重極に対するSimpleFlightの有効性を検証し,軌道追従誤差を50%以上低減できることを実証した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:31:26 GMT)
Modeling Inter-Intra Heterogeneity for Graph Federated Learning [24.1] We propose a novel Federated learning method by integrally modeling the Inter-Intra Heterogeneity (FedIIH)。
本稿では, サブグラフ間の関係について, 階層的変動モデルを提案し, サブグラフデータの分布全体を多段階的に推定する。
我々のFedIIHは、部分グラフ間の分布類似性を適切に計算するだけでなく、部分グラフ内の無関係な要因に対して頑健な非絡み合った表現も学習する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:02:42 GMT)
SE-GCL: An Event-Based Simple and Effective Graph Contrastive Learning for Text Representation [23.6] テキスト表現のためのイベントベース,シンプル,効果的なグラフコントラスト学習(SE-GCL)を提案する。
正確には、テキストからイベントブロックを抽出し、意味的相互接続を表す内部関係グラフを構築する。
特に、コア表現セマンティクスのためのイベントスケルトンの概念を導入し、典型的には複雑なデータ拡張テクニックを単純化する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:53:24 GMT)
Proactive Model Adaptation Against Concept Drift for Online Time Series Forecasting [23.5] textscProceedはオンライン時系列予測のための新しいプロアクティブモデル適応フレームワークである。
これは、最近使用したトレーニングサンプルと現在のテストサンプルの間のコンセプトドリフトを推定する。
次に、推定ドリフトをパラメータ調整に効率的に変換するために適応生成器を使用する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:02:52 GMT)
Semantically Grounded QFormer for Efficient Vision Language Understanding [23.5] 近年,汎用視覚言語モデル (VLM) が注目されている。
非常に人気のある作業の1つは、QFormerと呼ばれるトレーニング可能なモジュールを使用して、視覚表現を言語にブリッジすることで、凍結したユニモーダルモデルを利用する。
我々はQFormerベースの視覚言語アライメントのためのより効率的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:03:08 GMT)
MGDA: Model-based Goal Data Augmentation for Offline Goal-conditioned Weighted Supervised Learning [23.4] Goal-Conditioned Weighted Supervised Learning (GCWSL) と呼ばれる最先端のアルゴリズムが、オフライン目標条件強化学習 (RL) における課題に取り組むために導入された。
GCWSLは、多様な目標達成タスクで優れたパフォーマンスを示し、シンプルで効果的で安定したソリューションを提供しています。
しかし、以前の研究ではGCWSLの限界として、軌跡縫合能力の欠如が指摘されている。
本稿では,モデルに基づく目標データ拡張(MGDA)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:25:28 GMT)
UIBDiffusion: Universal Imperceptible Backdoor Attack for Diffusion Models [23.1] 拡散モデル(DM)はバックドア攻撃に対して脆弱である。
DMに対する汎用的非受容バックドアアタックであるUIBDiffusionを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:47:55 GMT)
Selective Forgetting: Advancing Machine Unlearning Techniques and Evaluation in Language Models [23.1] 言語モデルに対する選択的かつきめ細かな未学習を可能にする新しい方法であるSeULを提案する。
我々は2つの革新的な評価指標、感度抽出可能性(S-EL)と感度記憶精度(S-MA)を導入する。
アンラーニングフレームワークをサポートするために,オンラインおよびオフラインのセマンティックスパンアノテーション手法を効率よく提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:44:07 GMT)
Spatiotemporal Blind-Spot Network with Calibrated Flow Alignment for Self-Supervised Video Denoising [23.1] 自己監督型ビデオデノベーションは、地上の真実データに頼ることなく、ビデオからノイズを取り除くことを目的としている。
本研究では,グローバルフレーム機能利用のための時空間ブラインドスポットネットワーク(STBN)を提案する。
提案手法は,合成および実世界のビデオデノゲーションデータセットにおいて,優れた性能を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:37:16 GMT)
SpeechPrune: Context-aware Token Pruning for Speech Information Retrieval [23.1] 音声大言語モデルのための新しい長文タスクである音声情報検索(SIR)を導入する。
我々は90秒音声入力から重要な詳細を抽出するベンチマークテストモデルであるSPIRALを提案する。
SpeechPruneは、無関係なトークンを効率的に破棄するために、音声テキストの類似性と注意スコアを近似したトレーニング不要なトークン刈り取り戦略である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:36:02 GMT)
Meta Curvature-Aware Minimization for Domain Generalization [22.8] モデルが平らなミニマに収束することを奨励する改良されたモデルトレーニングプロセスを提案する。
そこで我々は,Meta Curvature-Aware Minimization (MeCAM) と呼ばれる新しいアルゴリズムを考案し,局所ミニマ周辺の曲率を最小化する。
本稿では,MeCAMの一般化誤差と収束率に関する理論的解析を行い,既存のDG法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:22:23 GMT)
ReflecTool: Towards Reflection-Aware Tool-Augmented Clinical Agents [22.6] 大規模言語モデル(LLM)は医療分野で有望な可能性を示している。
ClinicalAgent Bench (CAB) は、5つの重要な臨床次元にわたる18のタスクからなる総合的な医療エージェントベンチマークである。
ReflecToolはドメイン固有のツールを2段階以内で利用できる新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:28:33 GMT)
The Baldwin Effect in Advancing Generalizability of Physics-Informed Neural Networks [22.6] 物理インフォームドニューラルネットワーク(PINN)は、科学機械学習の最前線にある。
PINNは1つの物理タスクのために訓練されることが多く、新しいタスクごとに計算的に高価な再訓練を必要とする。
本稿では,ボールドウィン進化の枠組みを通じて,PINNの一般化可能性を高めるための先駆的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:26:24 GMT)
QUENCH: Measuring the gap between Indic and Non-Indic Contextual General Reasoning in LLMs [22.4] QUENCHは、YouTubeのクイズビデオから手作業でキュレーションされ、書き起こされる新しいテキストベースのイングリッシュ・クイズ・ベンチマークである。
地理的文脈と常識推論の交差において、QUENCHはLLMの世界の知識と推論能力を評価するのに役立っている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:28:29 GMT)
V2X-Real: a Large-Scale Dataset for Vehicle-to-Everything Cooperative Perception [22.4] V2X-Realは大規模なデータセットで、複数の車両とスマートインフラストラクチャが混在している。
我々のデータセットには33KのLiDARフレームと171Kのカメラデータが含まれており、非常に困難な都市シナリオでは10のカテゴリに1.2Mの注釈付きバウンディングボックスがある。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:00:47 GMT)
Text and Image Are Mutually Beneficial: Enhancing Training-Free Few-Shot Classification with CLIP [22.3] 我々は、IGT(Image-Guided-Text)コンポーネントとTGI(Text-Guided-Image)コンポーネントを導入し、相互誘導機構を構築する。
広範囲な実験により、TIMOは最先端(SOTA)トレーニングフリー法よりも著しく優れていた。
提案する改良型TIMO-Sは,最高のトレーニング要求手法を約100倍の時間コストで0.33%以上越えることが可能である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:03:45 GMT)
SAM Decoding: Speculative Decoding via Suffix Automaton [22.3] 本稿では,検索に基づく新しい投機的復号法を提案する。
共通テキストコーパスと動的テキストシーケンスを利用して、効率よく正確なドラフト生成のために接尾辞オートマトンを適応する。
Spec-Benchの実験から,本手法は他のSD法よりも18%以上高速であることがわかった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:48:28 GMT)
AraDiCE: Benchmarks for Dialectal and Cultural Capabilities in LLMs [22.1] 本稿ではアラビア方言と文化評価のベンチマークであるAraDiCEを紹介する。
湾岸地域、エジプト地域、レバント地域の文化意識を評価するために設計された最初のきめ細かいベンチマーク。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:57:08 GMT)
CLIP-SR: Collaborative Linguistic and Image Processing for Super-Resolution [21.8] 畳み込みニューラルネットワーク(CNN)は高度な画像超解像(SR)を持つ
ほとんどのCNNベースのメソッドはピクセルベースの変換のみに依存しており、アーティファクトやぼやけにつながっている。
テキストのセマンティックスと視覚的特徴を組み合わせたマルチモーダルなセマンティックエンハンスメント手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:50:09 GMT)
RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation [21.8] RetroLLMは、検索と生成を単一の凝集プロセスに統合する統合フレームワークである。
制約付きエビデンス生成の過程での偽プルーニングを軽減するために,階層的FM-Index制約を導入する。
5つのオープンドメインQAデータセットの実験では、ドメイン内タスクとドメイン外タスクの両方にわたって、RetroLLMの優れたパフォーマンスが示されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:03:25 GMT)
MindTuner: Cross-Subject Visual Decoding with Visual Fingerprint and Semantic Correction [21.5] クロスオブジェクトタスクにおける高品質な画像の再構成は、被験者間の個人差が深いため、難しい問題である。
MindTunerは1時間分のfMRIトレーニングデータを使用して高品質でリッチなセマンティック再構築を実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:59:51 GMT)
Depth-Centric Dehazing and Depth-Estimation from Real-World Hazy Driving Video [21.4] 本研究では,実際のモノクラーハジービデオからヘイズを同時に除去し,深度を推定する課題について検討する。
本稿では,ASMモデルとBCC制約を統合した新しい深度中心学習フレームワークを提案する。
私たちのキーとなる考え方は、ASMとBCCの両方が共有深度推定ネットワークに依存しているということです。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:48:55 GMT)
Speech-Forensics: Towards Comprehensive Synthetic Speech Dataset Establishment and Analysis [21.2] 本稿では,音声サンプルの真正性,合成性,部分的偽造性を広範囲に網羅し,音声・フォレンジスデータセットを提案する。
我々はまた、認証検出、複数の偽セグメントのローカライゼーション、アルゴリズム認識を同時に行うことを目的とした、TEST(TEmporal Speech LocalizaTion Network)を提案する。
平均mAPは83.55%,EERは5.25%である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:30:41 GMT)
IDProtector: An Adversarial Noise Encoder to Protect Against ID-Preserving Image Generation [21.1] 本稿では,1つのフォワードパスのポートレート写真に対して,非知覚的な逆方向ノイズを印加する逆方向ノイズエンコーダであるIDProtectorを紹介する。
我々のアプローチは、InstantID、IP-Adapter、PhotoMakerなど、最先端のエンコーダベースの複数のメソッドに対して、ポートレートを普遍的に保護する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:27:48 GMT)
GenderAlign: An Alignment Dataset for Mitigating Gender Bias in Large Language Models [21.0] 大きな言語モデル(LLM)は、性別バイアスを示すコンテンツを生成する傾向がある。
GenderAlignデータセットは8kのシングルターンダイアログで構成されており、それぞれに "chosen" と "rejected" の応答がペアリングされている。
拒絶された」反応と比較すると、「ちょうせん」反応は性バイアスのレベルが低く、より高い品質を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:51:46 GMT)
SpatialMe: Stereo Video Conversion Using Depth-Warping and Blend-Inpainting [21.0] 本研究では,深度ワープとブレンドインペインティングに基づく新しいステレオビデオ変換フレームワークであるSpatialMeを紹介する。
データ不足を軽減するために、高品質な現実世界のステレオビデオデータセット -- StereoV1K を実行しています。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:42:49 GMT)
Data-driven Precipitation Nowcasting Using Satellite Imagery [21.0] ほとんどの発展途上国は、独自のレーダーシステムを操作するのではなく、解像度の低いグローバルな数値モデルに依存している。
我々は,地球規模の静止衛星画像を用いたニューラル沈殿モデル(NPM)を提案する。
NPMは降水量を最大6時間予測し、1時間ごとに更新する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:48:30 GMT)
Enhancing Character-Level Understanding in LLMs through Token Internal Structure Learning [20.8] Token Internal Position Awareness (TIPA) は、トークン内の文字位置をキャプチャするモデルの能力を大幅に改善する手法である。
TIPAは、大きな言語モデルにおける位置予測精度を高め、元のテキストにおけるターゲット文字のより正確な識別を可能にする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:40:32 GMT)
Towards a Universal Synthetic Video Detector: From Face or Background Manipulations to Fully AI-Generated Content [20.5] 既存のDeepFake検出技術は主に顔のスワッピングや唇の同期といった顔操作に焦点を当てている。
フルフレーム操作をキャプチャするアンダーラインTampered と SynthunderlineEtic Video (textttUNITE) モデルに対して,アンダーラインUniversal UnderlineNetworkを導入している。
textttUNITEは、顔、非人体、複雑な背景修正のないシナリオに検出機能を拡張する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:00:19 GMT)
Federated Domain Generalization with Label Smoothing and Balanced Decentralized Training [20.4] ラベルの平滑化とバランスの取れた分散トレーニング(FedSB)による新しいドメイン一般化手法を提案する。
FedSBは、クライアントレベルでのラベルの平滑化を利用して、ドメイン固有の機能への過度な適合を防ぎ、様々なドメインにわたる一般化機能を強化する。
FedSBには、クライアント間のトレーニングのバランスをとる分散予算機構が組み込まれており、これは集約されたグローバルモデルの性能を改善することが示されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:25:19 GMT)
Failures to Find Transferable Image Jailbreaks Between Vision-Language Models [20.4] 視覚およびテキスト入力に条件付けされたテキスト出力を生成する視覚言語モデル(VLM)の一般的なクラスに焦点を当てる。
転送可能な勾配に基づく画像ジェイルブレイクは、取得が極めて困難である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:20:42 GMT)
Integrated Sensing and Communications for Low-Altitude Economy: A Deep Reinforcement Learning Approach [20.4] 低高度経済(LAE)のための統合センシング・通信(ISAC)システムについて検討する。
所定の飛行期間における通信総和レートは、GBSとUAVの軌道でのビームフォーミングを共同最適化することにより最大化する。
本稿では, 深部強化学習(DRL)技術を活用して, 深部LAE-ISAC(Deep LAE-ISAC)と呼ばれる新しいLEE指向ISAC方式を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:36:07 GMT)
How Different AI Chatbots Behave? Benchmarking Large Language Models in Behavioral Economics Games [20.1] 本稿では,5つの主要な大規模言語モデル(LLM)を,行動経済学の一連のゲームとして包括的に分析する。
私たちは、さまざまなシナリオにまたがって、共通かつ異なる行動パターンを解明し、文書化することを目指しています。
この発見は、各LSMの戦略的嗜好に関する貴重な洞察を与え、重要な意思決定の役割への展開に影響を及ぼす可能性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:25:45 GMT)
From Specific-MLLM to Omni-MLLM: A Survey about the MLLMs alligned with Multi-Modality [20.0] オムニ・MLLMは、異なるモダリティの特徴を異なる「外部言語」として扱い、統一された空間内での相互モーダル相互作用と理解を可能にする。
我々はまず,Omni-MLLMの4つのコアコンポーネントについて説明する。
次に,「アライメント事前学習」と「インストラクション微調整」によって達成された効果的な統合について紹介し,オープンソースデータセットとインタラクション機能のテストについて議論する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:12:45 GMT)
Relieving Universal Label Noise for Unsupervised Visible-Infrared Person Re-Identification by Inferring from Neighbors [20.0] 本稿では,近隣情報を用いたユニバーサルラベルノイズを緩和し,U.S.L-VI-ReIDの簡易かつ効果的な解法を提案する。
具体的には,N-ULC(Neighbor-guided Universal Label)モジュールを導入する。
また,信頼できない試料の影響を最小限に抑え,トレーニング安定性を高めるため,Nighbor-guided Dynamic Weighting (N-DW)モジュールを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:04:41 GMT)
Training-free Camera Control for Video Generation [19.5] 本稿では,市販ビデオ拡散モデルに対して,カメラの動き制御を実現するためのトレーニングフリーで堅牢なソリューションを提案する。
本手法では,カメラ注釈付きデータセットの教師付き微調整やデータ拡張による自己教師型トレーニングは不要である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:13:09 GMT)
AGS-Mesh: Adaptive Gaussian Splatting and Meshing with Geometric Priors for Indoor Room Reconstruction Using Smartphones [19.4] 室内シーンの正確な3次元再構成のためのガウススメッティング法における接合面深度と正規化のアプローチを提案する。
我々のフィルタリング戦略と最適化設計は、メッシュ推定と新規ビュー合成の両方において大きな改善を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:14:57 GMT)
Collapse or Thrive? Perils and Promises of Synthetic Data in a Self-Generating World [19.3] 生成機械学習モデルがWebスケールデータセット上で事前訓練されている場合、崩壊と崩壊の回避について検討する。
意外なことに、実データと合成データの非自明な相互作用は、テスト損失を減らすための合成データの値は、実データの絶対量に依存する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:37:01 GMT)
View Transformation Robustness for Multi-View 3D Object Reconstruction with Reconstruction Error-Guided View Selection [19.1] ビュートランスフォーメーション・ロバストネス(VTR)は,深層学習に基づく多視点3次元オブジェクト再構成モデルにおいて重要である。
本稿では,3次元予測の空間分布を考慮した再構成誤り誘導ビュー選択法を提案する。
提案手法は、最先端の3D再構成法や、他のビュー変換ロバスト性比較法よりも優れている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:54:08 GMT)
MIT-10M: A Large Scale Parallel Corpus of Multilingual Image Translation [19.1] 実世界のデータから得られた10万以上の画像テキストペアを用いた多言語画像翻訳の大規模並列コーパスであるMIT-10Mを紹介する。
3つのサイズの840Kイメージ、28のカテゴリ、難易度3レベルのタスク、14の言語とテキストのペアが含まれており、既存のデータセットでは大幅に改善されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:28:53 GMT)
JEN-1 Composer: A Unified Framework for High-Fidelity Multi-Track Music Generation [19.0] JEN-1 Composerは、マルチトラック音楽上での限界分布、条件分布、共同分布を効率的にモデル化するように設計されている。
本研究では、段階的なカリキュラム学習戦略を導入し、段階的に訓練作業の難しさを増大させる。
提案手法は,制御可能かつ高忠実なマルチトラック音楽合成における最先端性能を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:34:52 GMT)
OTA-Key: Over the Air Key Management for Flexible and Reliable IoT Device Provision [18.7] IoTベンダは頻繁に、共有キーをデバイスのバッチに割り当てる。
このプラクティスは、アタッカーによるデータ盗難など、デバイスをリスクに晒すことができる。
この問題に対処するためのOTAキー方式を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:50:00 GMT)
A Novel Approach to Solving Goal-Achieving Problems for Board Games [18.6] 本稿では、まず、GoのL&D問題を解決するために、RZベースサーチ(RZS)と呼ばれる新しいRZベースのアプローチを提案する。
RZSは、Nullがポストホックであるかどうかを決定する前に動きを試みます。
また、AlphaZeroを改良してより高速に勝利させるFTL(Faster to Life)という新たなトレーニング手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:23:46 GMT)
SitPose: Real-Time Detection of Sitting Posture and Sedentary Behavior Using Ensemble Learning With Depth Sensor [18.6] 座り心地の悪い姿勢は、様々な作業関連筋骨格障害を引き起こすことがある。
最新のKinect深度カメラを用いた座位姿勢・鎮静検知システムであるSitPoseについて述べる。
システムは、骨関節の3次元座標をリアルタイムで追跡し、関連する関節の角度値を算出する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 00:40:49 GMT)
Privacy-Preserving Low-Rank Adaptation against Membership Inference Attacks for Latent Diffusion Models [18.5] 低ランク適応(LoRA)は、個人データセットに潜時拡散モデル(LDM)を適用して特定の画像を生成するための効率的な戦略である。
しかし、LoRAに適応したLDMは、特定のデータポイントがプライベートデータセットに属するかどうかを判断できるメンバーシップ推論(MI)攻撃に弱い。
我々はMI攻撃を防ぎ,高品質な画像を生成するために,MP-LoRA(Community-Privacy-Reserving LoRA)を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:54:47 GMT)
Emergence of Abstractions: Concept Encoding and Decoding Mechanism for In-Context Learning in Transformers [18.1] 自己回帰変換器は, 自己回帰変換器の表現における内部抽象をどう形成し, 利用するかを検討する。
私たちの経験的洞察は、その表現を通じて、大きな言語モデルの成功と失敗モードの理解を深めました。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:00:18 GMT)
C3oT: Generating Shorter Chain-of-Thought without Compromising Effectiveness [18.1] 解答の導出前のChain-of-Thought(CoT)は、大規模言語モデル(LLM)の推論能力を改善することができる。
しかし、生成したCoTの長さは、望ましい最終回答よりもはるかに長いため、さらなる復号コストが生じる。
本稿では、圧縮機がオリジナルの長いCoTを短いCoTに圧縮するCOT圧縮フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:12:45 GMT)
Understanding Language Model Circuits through Knowledge Editing [18.0] 我々は,GPT-2言語モデルの回路上で,系統的な知識編集実験を行う。
分析の結果,回路が編集にどう反応するかという興味深いパターンが明らかになった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:54:05 GMT)
How Well Can Knowledge Edit Methods Edit Perplexing Knowledge? [18.0] 大規模言語モデル(LLM)は目覚ましい能力を示しているが、トレーニング後の知識の更新は依然として重要な課題である。
我々は,新しい知識がLLMの学習された概念的階層や分類的関係と矛盾する程度であるパープレキシングネスの概念を紹介する。
我々の分析によると、より抽象的な概念(ハイポニム)を含む編集は一般的に、より難易度が高く、特定の概念(ハイポニム)よりも修正に耐性がある。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:47:29 GMT)
CPath-Omni: A Unified Multimodal Foundation Model for Patch and Whole Slide Image Analysis in Computational Pathology [17.8] CPath-OmniはパッチとWSIレベルの画像解析を統合するために設計された最初のLMMである。
CPath-Omniは、42データセット中39のタスクに対して、最新技術(SOTA)のパフォーマンスを達成する。
CPath-CLIPは、初めて異なるビジョンモデルを統合し、大きな言語モデルをテキストエンコーダとして組み込んで、より強力なCLIPモデルを構築する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:46:58 GMT)
HResFormer: Hybrid Residual Transformer for Volumetric Medical Image Segmentation [17.7] ビジョントランスフォーマーは、長距離依存を学習する能力により、医用画像セグメンテーションにおいて大きな優位性を示す。
医用画像分割のための新しいtextbfHybrid textbfResidual transtextbfFormer textbf(HResFormer)を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:32:28 GMT)
GraphInsight: Unlocking Insights in Large Language Models for Graph Structure Understanding [17.7] 大規模言語モデル(LLM)は、グラフ記述シーケンスのプロンプトを通じてグラフィカルな構造情報を理解するのに苦労する。
マクロおよびマイクロレベルのグラフィカル情報に対するLLMの理解を改善するための新しいフレームワークであるGraphInsightを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:06:27 GMT)
InterCLIP-MEP: Interactive CLIP and Memory-Enhanced Predictor for Multi-modal Sarcasm Detection [17.6] ソーシャルメディアでは、しばしばテキストと画像の組み合わせを通して表現されるサルカズムは、感情分析と意図的マイニングの課題を提起する。
我々は、リッチテキストイメージ表現を抽出する効率的なトレーニング戦略を備えたInterCLIP-MEPを提案する。
その結果,InterCLIP-MEPは,MMSDとMMSD2.0の精度とF1スコアの改善を達成できた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:13:38 GMT)
V-MIND: Building Versatile Monocular Indoor 3D Detector with Diverse 2D Annotations [17.5] V-MIND(Versatile Monocular Indoor Detector)は,室内3D検出器の性能を向上させる。
大規模2次元画像を3次元点雲に変換し,その後に擬似3次元境界ボックスを導出することにより,3次元学習データを生成する。
V-MINDはOmni3D屋内データセット上の幅広いクラスにわたる最先端のオブジェクト検出性能を実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:28:00 GMT)
HYATT-Net is Grand: A Hybrid Attention Network for Performant Anatomical Landmark Detection [17.3] 医学的画像からの解剖学的ランドマーク検出(ALD)は、幅広い臨床応用に不可欠である。
CNNとTransformerを統合した新しいハイブリッドアーキテクチャを提案する。
5つの多様なデータセットの実験は、最先端のパフォーマンスを示し、精度、堅牢性、効率の既存の手法を超越している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:00:52 GMT)
Towards a Dynamic Future with Adaptable Computing and Network Convergence (ACNC) [17.2] 本稿では,コンピュータとネットワークリソースの協調オーケストレーションを目的とした自律機械学習(ML)支援機構として,適応型CNC(ACNC)の概念を提案する。
ACNCは、状態認識とコンテキスト検出の2つの主要な機能を含んでいる。
継続的学習が採用され、システムの状態を専用のMLエージェントによって制御されたコンテキストに分類することで、効率的に運用することができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:42:33 GMT)
Challenges Faced by Large Language Models in Solving Multi-Agent Flocking [17.1] フラッキング(Flocking)とは、システム内の複数のエージェントが衝突を避け、望ましい形成を維持しながら互いに近づこうとする行動である。
近年,大規模言語モデル (LLM) は,個々の意思決定者として様々な協調課題を解くという印象的な能力を示している。
本稿では,マルチエージェント・フロッキングにおいてLLMが直面する課題について論じ,今後の改善分野を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:45:53 GMT)
FTP: A Fine-grained Token-wise Pruner for Large Language Models via Token Routing [17.0] 大規模言語モデル(LLM)は、法則を拡張することによって、様々なタスクにおいて優れた性能を示す。
重要でないトークンを適応的に識別する学習可能なルータを提案する。
提案手法は,既存の刈り込み手法を超越して,最先端(SOTA)刈り込み結果を実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:09:46 GMT)
Exploiting the Index Gradients for Optimization-Based Jailbreaking on Large Language Models [16.8] Greedy Coordinate Gradient (GCG) 法は, 脱獄状態のLDMを自動生成する能力を示した。
本稿では、接尾辞トークンの勾配情報を利用して間接効果に対処するモデル攻撃勾配指数GCG(MAGIC)を提案する。
AdvBenchの実験では、MAGICは最大1.5倍のスピードアップを実現し、ASR(Attack Success Rates)を同等以上維持している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:05:45 GMT)
Automated Detection of Inter-Language Design Smells in Multi-Language Deep Learning Frameworks [16.8] 不適切な言語間相互作用は、複数のプログラミング言語(PL)、すなわちILDS(Inter-Language Design Smells)を含む設計臭いをもたらす可能性がある。
この研究は、PythonとC/C++の組み合わせで書かれた多言語DLFでILDSを自動的に検出するアプローチを開発する。
CPSMELLツールは、そのようなILDSを自動的に検出するための検出ルールを実装し、ツールの精度を手動で検証する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:22:36 GMT)
Making FETCH! Happen: Finding Emergent Dog Whistles Through Common Habitats [16.8] ソーシャルメディアの巨大コーパスで新しい犬の口笛を見つけるタスクである textbfFETCH! を紹介した。
我々は,ベクトルデータベースとLLM(Large Language Models)の強みを組み合わせた新しいシステムである textbfEarShot を提案し,新しい犬のwhiを効率よく,効果的に同定する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:46:12 GMT)
LIFBench: Evaluating the Instruction Following Performance and Stability of Large Language Models in Long-Context Scenarios [16.7] LIFBenchは、大規模言語モデルの命令フォロー機能と長期にわたる安定性を評価するために設計されたスケーラブルなデータセットである。
LIFEvalは、複雑なLCM応答の正確な自動スコアリングを可能にするルーリックベースの評価手法である。
我々の研究はLIFBenchとLIFEvalを、複雑で長いコンテキスト設定でLLMのパフォーマンスを評価するための堅牢なツールとして貢献しています。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:53:06 GMT)
Transferable Adversarial Face Attack with Text Controlled Attribute [16.7] 本稿では,自然言語で誘導される対人顔を生成するための新しいテキスト制御属性攻撃(TCA$2$)を提案する。
具体的には、カテゴリーレベルのパーソナル・ソフトマックス・ベクターを用いて、偽造攻撃を正確に誘導する。
2つの高解像度顔認証データセットの実験により、我々のTCA$2$メソッドは、高い転送性で自然なテキスト誘導対向顔を生成することができることを確認した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:56:57 GMT)
WFCAT: Augmenting Website Fingerprinting with Channel-wise Attention on Timing Features [16.4] Webサイトフィンガープリントは、暗号化されたネットワークトラフィックを分析して、Torネットワーク上のユーザを匿名化することを目的としている。
最近のディープラーニングベースの攻撃は、防御されていないトレースに対して高い精度を示す。
しかし、ダミーパケットの注入や実際のパケットの遅延といった戦術を使う現代の防衛と戦う。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:04:44 GMT)
DG-Mamba: Robust and Efficient Dynamic Graph Structure Learning with Selective State Space Models [16.4] 選択状態空間モデル(Mamba)を用いた動的グラフ構造学習フレームワークを提案する。
我々のフレームワークは、敵攻撃に対する最先端のベースラインよりも優れている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:44:32 GMT)
RITUAL: Random Image Transformations as a Universal Anti-hallucination Lever in Large Vision Language Models [16.2] RITUALは、ランダムに変換された画像を活用することで幻覚を低減する単純な復号法である。
RITUAL+は、Large Vision Language Modelsから自己フィードバックに基づいて画像変換を選択する拡張である。
実験により、RITUALとRITUAL+はいくつかの対象幻覚ベンチマークで幻覚を著しく減少させることが示された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:27:35 GMT)
Apollo-Forecast: Overcoming Aliasing and Inference Speed Challenges in Language Models for Time Series Forecasting [16.2] アンチエイリアシング量子化モジュール(AAQM)とレースデコーディング(RD)技術について述べる。
AAQMは、元の信号の高周波ノイズを緩和しながら、シーケンスをトークンに順応的にエンコードする。
RDは並列処理と結果の統合を可能にするためにドラフトモデルを採用しており、長期予測の推論速度を著しく向上させる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:01:20 GMT)
Differentially Private Prototypes for Imbalanced Transfer Learning [16.0] 本稿では,個人間移動学習の新たなパラダイムとして,DPPL(differially Private Prototype Learning)を提案する。
DPPLは、埋め込み空間内の各プライベートクラスを表すプロトタイプを生成し、推論のために公開することができる。
エンコーダの事前トレーニング以上の公開データを活用すれば,プライバシユーティリティのトレードオフをさらに改善できることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:28:19 GMT)
An Ensemble Framework for Explainable Geospatial Machine Learning Models [16.0] GeoShapleyメソッドは、機械学習(ML)とShapley値を統合し、地理的特徴の寄与を説明する。
ここでは,このギャップを埋めるために,局所空間重み付け方式をXAIとML技術と組み合わせるためのアンサンブルフレームワークを提案する。
このフレームワークは地理的回帰と分類の両方で機能し、複雑な空間現象を理解するための新しいアプローチを提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:27:52 GMT)
Synthetic multi-dimensional Aharonov-Bohm cages in Fock state lattices [16.0] 超伝導量子回路を用いた多次元FSLの構成を実証する。
量子重畳状態のコヒーレントな干渉を探索し、特定の部分空間内で極端に局所化を達成する。
我々の発見は、高次元システムにおける幅広い種類の量子状態の挙動を操作するための道を開いた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:29:15 GMT)
Glimpse: Enabling White-Box Methods to Use Proprietary Models for Zero-Shot LLM-Generated Text Detection [15.9] 部分的な観測から全分布を予測する確率分布推定手法であるGlimpseを提案する。
Glimpseの単純さにもかかわらず、Entropy, Rank, Log-Rank, Fast-DetectGPTといったホワイトボックスメソッドを最新のプロプライエタリなモデルに拡張することに成功しました。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:28:36 GMT)
INTERACT: Enabling Interactive, Question-Driven Learning in Large Language Models [15.8] 大規模言語モデル(LLM)は、質問に答える能力は優れているが、受動的学習者であり続ける。
本稿では,LLMが学生と教師の対話を通して,対話型,質問駆動型学習にどのように移行できるかを考察する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:28:53 GMT)
Gradient Alignment Improves Test-Time Adaptation for Medical Image Segmentation [15.8] グラディエントアライメントに基づくテスト時間適応法(GraTa)を提案する。
GraTa法は、勾配アライメントを容易にするために、擬似的勾配に補助勾配を組み込む。
擬似勾配と補助勾配のコサイン類似度に基づいて動的学習率を設計する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:06:15 GMT)
From 2D CAD Drawings to 3D Parametric Models: A Vision-Language Approach [15.8] 2次元CAD図面から3次元パラメトリックモデルを再構成するCAD2Programを提案する。
本稿では、2D CAD描画を元のフォーマットによらず画像として扱い、標準の ViT モデルで画像をエンコードする。
出力側では,本手法はテキスト形式で3次元パラメトリックモデルを記述する汎用言語を自動回帰予測する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:41:14 GMT)
MASt3R-SLAM: Real-Time Dense SLAM with 3D Reconstruction Priors [15.8] 我々はMASt3Rからボトムアップを設計したリアルタイム単分子高密度SLAMシステムを提案する。
本システムは固定カメラモデルやパラメトリックカメラモデルでは仮定しないが,Wild ビデオシーケンス上では堅牢である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:00:05 GMT)
Accurate, Robust and Privacy-Preserving Brain-Computer Interface Decoding [15.6] EEGベースの脳コンピュータインタフェース(BCI)は、脳と外部デバイス間の直接通信を可能にする。
EEGベースのBCIは、データ不足と個人差、敵対的脆弱性、データプライバシという、現実世界のアプリケーションで少なくとも3つの大きな課題に直面しています。
EEGベースのBCIにおける3つの大きな課題が同時に対処できるのは今回が初めてであり、現実のBCIにおけるEEGデコーディングの実践性を大幅に改善する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:37:38 GMT)
Targeted Angular Reversal of Weights (TARS) for Knowledge Removal in Large Language Models [15.4] 大規模言語モデル(LLM)から知識を除去するターゲット角反転法(TARS)を導入する。
TARS法はまず LLM と詳細なプロンプトを組み合わせることで,選択した概念に関する情報を集約する。
次に、この近似概念ベクトルを改良し、その近似概念ベクトルをノイズで摂動させることにより、高い確率で概念トークンをトリガーする。
TARS法のモジュラリティは、有名な文学探偵シャーロック・ホームズや惑星土星など、ラマ3.1の8Bから連続的に概念を除去することができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:54:00 GMT)
The Stabilizer Bootstrap of Quantum Machine Learning with up to 10000 qubits [15.3] 変動量子回路は、短期量子デバイスと初期のフォールトトレラント量子コンピュータにおいて主要なパラダイムである可能性がある。
我々は、安定化器ブートストラップを使用して、量子実行前に量子ニューラルネットワークを最適化する。
変動アンサーゼの一般的な設定では、安定化器ブートストラップによる改善の可能性は、観測可能な構造とデータセットのサイズに依存する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:12:00 GMT)
MiMoTable: A Multi-scale Spreadsheet Benchmark with Meta Operations for Table Reasoning [15.2] 我々はtextbfMeta textbfoperation for textbfTable reasoning, named as MiMoTable を用いた textbfMulttextbfi-scale spreadsheet ベンチマークを提案する。
まず、MiMoTableのテーブルは、実際のシナリオで使用されるスプレッドシートで、7つのドメインをカバーし、異なるタイプを含む。
既存のベンチマークの難易度を測定するための新しい視点として,MiMoTableにおける各質問の難易度を計測するための6つのカテゴリのメタ操作を用いた新しい基準を定義した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:33:12 GMT)
Enhancing Robustness in Incremental Learning with Adversarial Training [15.2] 本研究では,漸進学習における対人ロバスト性を扱うARCIL(Adversarially Robust Class Incremental Learning)について検討する。
まず,新たな知識の獲得と過去の知識の保持の相反を招き,既存の学習手法と漸進的な学習を統合した一連のベースラインについて検討する。
textbfFLatness-versa textbfAdversarial textbfIncremental Learning for textbfRobustness (textbfFLAIR)。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:09:01 GMT)
NEST: A Neuromodulated Small-world Hypergraph Trajectory Prediction Model for Autonomous Driving [15.2] NEST(Neuromodulated Small-world Hypergraph Trajectory Prediction)は、より優れた相互作用モデリングと予測精度を実現するために、Small-world NetworksとHypergraphsを統合した新しいフレームワークである。
我々はNESTモデルをnuScenes, MoCAD, HighDなどの実世界のデータセット上で検証する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:49:12 GMT)
The Impact of Token Granularity on the Predictive Power of Language Model Surprisal [15.1] 認知モデリングにおいて見過ごされてきた要素の1つは、サブワードトークンの粒度である。
自然主義的読解時間を用いた実験は、トークンの粒度が副次的に与える影響を顕著に示している。
ガーデンパスの構成では、粗い粒度のトークンで訓練された言語モデルが、一般に臨界領域に対して高い確率を割り当てた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:24:58 GMT)
FAMNet: Frequency-aware Matching Network for Cross-domain Few-shot Medical Image Segmentation [15.1] 既存の数発の医用画像分割(FSMIS)モデルは、様々な画像技術によって引き起こされる領域シフトという、医療画像の実践的な問題に対処できない。
本稿では、周波数対応マッチング(FAM)モジュールとマルチスペクトル融合(MSF)モジュールの2つの主要なコンポーネントを含む周波数対応マッチングネットワーク(FAMNet)を提案する。
我々のFAMNetは、既存のFSMISモデルと3つのクロスドメインデータセット上のクロスドメインFew-shot Semanticモデルを上回っています。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:45:46 GMT)
Vertical Federated Unlearning via Backdoor Certification [15.0] VFLは機械学習における新しいパラダイムを提供し、データプライバシを維持しながら、異なるエンティティが協力してモデルをトレーニングできるようにする。
最近のプライバシー規制では、個人が忘れられる権利を強調しており、モデルが特定のトレーニングデータを学習する能力を必要としている。
本稿では,従来のVFLに対して,特定のデータコントリビューションを抽出する目的で,典型的な学習軌跡を逆転させる機構を取り入れた革新的な修正を導入する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:40:25 GMT)
Fast and Interpretable Mortality Risk Scores for Critical Care Patients [15.0] GroupFasterRiskは、解釈可能な死亡リスクスコアアルゴリズムである。
ドメインの専門家が選択できるような、同等に優れたモデルが多数生成されます。
GroupFasterRiskのモデルは、現在病院で使われているリスクスコアよりも優れており、ブラックボックスMLモデルと同等である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:34:34 GMT)
SeSeMI: Secure Serverless Model Inference on Sensitive Data [14.8] 既存のクラウドベースのモデル推論システムは費用がかかり、スケールするのは簡単ではない。
我々の目標は、信頼できないクラウドプロバイダからモデルとユーザ要求データを保護するサーバーレスモデル推論システムの設計です。
セキュアで効率的で費用対効果の高いサーバレスモデル推論システムであるSeSeMIを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:37:30 GMT)
Re-Examine Distantly Supervised NER: A New Benchmark and a Simple Approach [14.8] 実生活DS-NERデータセットであるQTLを導入し、ドメイン辞書を用いてトレーニングデータをアノテートし、テストデータをドメインの専門家がアノテートする。
既存のDS-NERアプローチはQTLに適用されると失敗し、既存のDS-NERアプローチを再検討する動機となる。
そこで我々は,カリキュラム学習を用いて学習サンプルを簡単から難易度まで注文する,トークンレベルの正正解学習(CuPUL)を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:39:47 GMT)
LLM-RG4: Flexible and Factual Radiology Report Generation across Diverse Input Contexts [14.7] 現在の放射線学レポート生成モデルは、固定的なタスクパラダイムに制約されている。
本稿ではLLM-RG4という新しい大規模言語モデル(LLM)に基づくRRGフレームワークを提案する。
我々のモデルは入力非依存の幻覚を最小限に抑えているのに対し、現在のオープンソースモデルは一般的にこの問題に悩まされている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:29:51 GMT)
Causal Diffusion Transformers for Generative Modeling [14.7] 本稿では,Diffusionモデルの自己回帰(AR)モデルとしてCausal Diffusionを紹介する。
CaulFusionはデコーダのみのトランスフォーマーで、シーケンシャルトークンと拡散ノイズレベルにまたがるデータを二重化する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:59:29 GMT)
Robust Synthetic Data-Driven Detection of Living-Off-the-Land Reverse Shells [14.7] LOTL(Living-off-the-land)技術は、セキュリティ運用において大きな課題となる。
セキュリティ情報およびイベント管理(SIEM)ソリューションとして,サイバー防衛システムのための堅牢な拡張フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:43:48 GMT)
DAOP: Data-Aware Offloading and Predictive Pre-Calculation for Efficient MoE Inference [14.7] Mixture-of-Experts (MoE)モデルは、メモリ制限されたデバイスにおいて、重大なデプロイメント上の課題に直面している。
並列GPU-CPU実行を最適化するデバイス上でのMoE推論エンジンである presentP を提案する。
Pは従来のエキスパートキャッシングとプリフェッチの手法を最大8.20倍、オフロード技術は1.35倍、精度は維持する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:59:21 GMT)
DARWIN 1.5: Large Language Models as Materials Science Adapted Learners [14.6] 材料科学に適したオープンソースの大規模言語モデル(LLM)であるDarwin 1.5を提案する。
自然言語を入力として活用することで、Darwinはタスク固有の記述子を必要としない。
我々はLLaMA-7Bベースモデルと比較して最大60%の精度でLLMの予測精度を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:51:27 GMT)
RTP-LX: Can LLMs Evaluate Toxicity in Multilingual Scenarios? [14.3] RTP-LXは,28言語で有毒なプロンプトとアウトプットのコーパスである。
文化的に感受性のある多言語シナリオにおいて10個のS/LLMが有害な内容を検出する能力について検討した。
一般的には正確さで評価されるが、プロンプトの毒性を均等に評価する際、人間の判断とはあまり一致しない。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:34:22 GMT)
Suboptimality analysis of receding horizon quadratic control with unknown linear systems and its applications in learning-based control [14.3] 多くの場合、予測の地平線は制御性能を改善するために1つまたは無限のどちらかであることを示す。
時間対数関数として増加する適応予測地平線は、後悔の最小化に有用であることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:24:22 GMT)
VG-TVP: Multimodal Procedural Planning via Visually Grounded Text-Video Prompting [14.1] 本稿では,新しいマルチモーダル・プロシージャ・プランニング・フレームワークであるVG-TVP法を提案する。
特定の高レベルな目標を与えられた凝集性テキストとビデオプロシージャプランを生成する。
当社のVG-TVP法は,Daily-PPデータセット上での単調なベースラインよりも優れていた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:08:38 GMT)
On Crowdsourcing Task Design for Discourse Relation Annotation [14.0] 英語の暗黙の言論関係アノテーションを接続挿入によってクラウドソースする2つの手法を比較した。
強制選択アプローチを用いてDiscoGeM 1.0コーパス全体を再注釈する。
しかし、13万以上のアノテーションを比較すると、自由選択戦略はより多様でないアノテーションを生み出していることがわかる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:26:11 GMT)
No More Adam: Learning Rate Scaling at Initialization is All You Need [13.9] SGD-SaIは運動量による勾配降下(SGDM)の簡易かつ効果的な増強である
適応的な2階運動量に頼ることなく学習率を調整することで、SGD-SaIはトレーニングの不均衡を第1段階から防ぐことができる。
その単純さと効率にもかかわらず、SGD-SaIは様々なトランスフォーマーベースのタスクのトレーニングにおいて、AdamWと一貫して一致し、より優れています。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:41:37 GMT)
Non-Convex Optimization in Federated Learning via Variance Reduction and Adaptive Learning [13.8] 本稿では,不均一なデータ間の非エポジロン設定に適応学習を用いたモーメントに基づく分散低減手法を提案する。
異種データによる学習率調整から,分散に関する課題を克服し,効率を損なうとともに,収束の遅さを抑えることを目的としている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:02:38 GMT)
FinLoRA: Finetuning Quantized Financial Large Language Models Using Low-Rank Adaptation [13.8] 大規模言語モデル(LLM)の微調整は、財務上のタスクにおいて顕著なパフォーマンスを示している。
しかし、FinLLMの微調整はGPUメモリの制約や長い入力シーケンスといった問題を引き起こす。
我々は、低ランク行列分解と量子化技術を利用するFinLLMを微調整するために、量子化低ランク適応(QLoRA)を用いる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:05:49 GMT)
A Variable Occurrence-Centric Framework for Inconsistency Handling (Extended Version) [13.7] 本稿では,命題ベースにおける不整合の分析と処理を行うフレームワークを提案する。
最小整合関係(MIR)と最大整合関係(MCR)の2つの双対概念を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:22:10 GMT)
Fool Me, Fool Me: User Attitudes Toward LLM Falsehoods [13.6] 本研究では,Large Language Models (LLMs) による偽造応答に関するユーザの嗜好について検討する。
意外なことに、ユーザの61%は、マークされたものよりも、マークされていない偽りの応答を好む。
以上の結果から,LLM学習に影響を及ぼすユーザの嗜好が不注意に偽造を促進させる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:10:27 GMT)
One Initialization to Rule them All: Fine-tuning via Explained Variance Adaptation [13.6] 最も一般的に使われている微調整法は、ローランク適応(LoRA)を介してトレーニング済みの重量を更新することである。
活性化のミニバッチ上での特異値分解(SVD)を計算し,データ駆動方式で新たな重み付けを初期化することによりLoRAを改善することを提案する。
新しいメソッドを $textbfE$xplained $textbfV$ariance $textbfA$daptation (EVA) と呼びます。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:19:14 GMT)
Planning with Multi-Constraints via Collaborative Language Agents [13.6] 本稿では,協調型マルチエージェントシステムのためのゼロショット手法であるPMC(Planning with Multi-Constraints)を紹介する。
PMCは、制約で複雑なタスク計画を簡単にし、従属タスクの階層に分解する。
PMCはTravelPlannerで平均42.68%の成功率を記録し、GPT-4 (2.92%) をはるかに上回り、API-BankでReActを13.64%上回った。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:27:55 GMT)
TurboAttention: Efficient Attention Approximation For High Throughputs LLMs [13.5] 注意の定量化を可能にする包括的アプローチであるTurboAttentionを提案する。
FlashQは、KVキャッシュの圧縮とアクティベーション-アクティベーション乗算の量子化の両方を可能にする、ヘッドワイズアテンション量子化技術である。
SASは、注目中の指数演算中にFP32への復調を不要にする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:37:07 GMT)
Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering [13.5] 我々は,新しい評価指標であるI-HallA (Image Hallucination Evaluation with Question Answering)を紹介する。
I-HallAは視覚的質問応答(VQA)を用いて生成画像の事実性を測定する
我々はI-HallAを用いて5つのテキスト・ツー・イメージモデルを評価し、これらの最先端モデルが事実情報を正確に伝達できない場合が多いことを明らかにした。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:13:24 GMT)
Can LLM Prompting Serve as a Proxy for Static Analysis in Vulnerability Detection [13.4] 大規模言語モデル(LLM)は、脆弱性検出などの応用タスクにおいて限られた能力を示している。
本稿では,脆弱性の自然言語記述を,対照的な連鎖推論アプローチと統合するプロンプト戦略を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:08:14 GMT)
Aligning Visual and Semantic Interpretability through Visually Grounded Concept Bottleneck Models [13.4] 概念ボトルネックモデル(CBM)は、人間の理解可能な概念を予測プロセスに組み込んで、透明性と解釈可能性を高める。
画像レベルでのセグメンテーションと検出基盤モデルを用いて概念を導出するGCBM(Visually Grounded Concept Bottleneck Models)を提案する。
提案手法は,帰納的手法を用いて入力画像に接地可能な本質的に解釈可能な概念を生成し,その解釈を画像平面に遡ることができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:04:58 GMT)
GroupFace: Imbalanced Age Estimation Based on Multi-hop Attention Graph Convolutional Network and Group-aware Margin Optimization [13.2] マルチホップアテンショングラフ畳み込みネットワークとグループ認識マージン戦略を統合した,革新的な協調学習フレームワークを提案する。
本アーキテクチャは,複数の年齢推定ベンチマークデータセットにおいて優れた性能を発揮する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:08:15 GMT)
TRAIL: Trust-Aware Client Scheduling for Semi-Decentralized Federated Learning [13.1] 本稿では,クライアントの状態とコントリビューションを評価する信頼対応クライアントスケジューリング機構(TRAIL)を提案する。
実世界のデータセットを用いて行った実験は、TRAILが最先端のベースラインより優れていることを示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:02:50 GMT)
SHARP: Unlocking Interactive Hallucination via Stance Transfer in Role-Playing Agents [13.0] 多様な世界観においてインタラクティブなパターンを解き放つための、一般化可能で明示的で効果的なパラダイムを提案する。
具体的には、姿勢伝達に基づく対話型幻覚を定義し、一般的なコモンセンス知識グラフから関係を抽出し、ベンチマークSHARPを構築する。
本研究は,これらの指標に影響を及ぼす要因を考察し,役割に対する盲目の忠誠心と,RPAにおける事実への固執とのトレードオフについて考察した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:24:42 GMT)
Inferring Functionality of Attention Heads from their Parameters [12.9] 本稿では,モデルトレーニングや推論を伴わずに,そのパラメータから注目点の機能を推定するフレームワークを提案する。
6大言語モデル(LLM)における20の操作に対するMAPSの評価を行った。
我々のパイプラインは、人間の判断によって評価されるように、ほとんどの頭部に対して、多彩な操作記述を生成しながら、多様な操作を明らかにします。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:45:33 GMT)
The State of Robot Motion Generation [12.8] 本稿では,50年間にわたるロボット工学研究の成果を概説する。
これは、通常調査されていない方法論の境界を、明示的なモデルで運用するものから暗黙的なモデルで学習するものへと横断する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:25:35 GMT)
Magnon Blockade with Skyrmion Qubit-Magnon Coupling in a Hybrid Quantum System [12.7] 本稿では,YIGthinspace マイクロマグネットとスカイミリオンからなるハイブリッドシステムにおいて,マグノン遮断効果を実現する手法を提案する。
駆動フィールドをチューニングすることにより、マルチマグノン状態が効果的に抑制され、高純度単一マグノン状態が得られる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:18:10 GMT)
RemDet: Rethinking Efficient Model Design for UAV Object Detection [12.7] 無人航空機(UAV)画像における物体検出は研究の焦点領域として現れている。
現在のリアルタイム物体検出器は、UAV画像に最適化されていない。
これらの課題に対処するために,新しい検出器RemDetを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:31:03 GMT)
Are You Doubtful? Oh, It Might Be Difficult Then! Exploring the Use of Model Uncertainty for Question Difficulty Estimation [12.6] 本研究では,不確実性の特徴が難易度予測に大きく寄与することを示し,難易度は質問に正しく答えられる学生数に逆比例することを示した。
このアプローチの価値を示すことに加えて、BEAが公開しているデータセット上で、私たちのモデルが最先端の結果を達成することも観察します。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:55:09 GMT)
Biased or Flawed? Mitigating Stereotypes in Generative Language Models by Addressing Task-Specific Flaws [12.6] 生成言語モデルは、しばしば出力の社会的バイアスを反映し増幅します。
生成モデルにおいて観測されたステレオタイプを暗黙的に緩和する目的のステレオタイプ緩和フレームワークを提案する。
複数の次元にわたるステレオタイプ出力を60%以上削減する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:29:08 GMT)
Prompt Valuation Based on Shapley Values [12.5] 大きな言語モデル(LLM)は、単に自然言語のプロンプトを提供することで、追加のトレーニングなしで新しいタスクを最適化する。
本稿では、Shapley値を用いてプロンプトの寄与を正確に定量化する。
本稿では,各プロンプトの寄与を効果的に識別し,定量化するため,シャープリー値を用いたプロンプトの有効性を検証する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:57:29 GMT)
Expansive Supervision for Neural Radiance Field [12.5] 我々は,NeRFトレーニングにおける時間とメモリコストを削減するために,拡張スーパービジョンを導入する。
トレーニング誤差は画像内容と相関する長テール分布を示す。
従来の監視手法と比較して,冗長なレンダリング処理を効果的に回避する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:19:27 GMT)
Learning to Navigate in Mazes with Novel Layouts using Abstract Top-down Maps [12.5] 我々は、抽象的な2ドルのトップダウンマップを使って、ゼロショットナビゲーション機能に注力する。
このマルチタスク学習問題に対するモデルに基づく強化学習手法を提案する。
我々の手法はゼロショットで新しい環境に適応でき、ノイズに対してより堅牢である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:51:09 GMT)
Causal Invariance Learning via Efficient Optimization of a Nonconvex Objective [12.4] 本稿では,因果関係の因果関係を同定する新しい手法を提案する。
我々のアルゴリズムは徹底的な探索を避ける。
本手法は因果結果モデルに収束することを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:11:02 GMT)
TextureCrop: Enhancing Synthetic Image Detection through Texture-based Cropping [12.3] 合成画像検出(SID)法は、オンラインのAI生成コンテンツを識別するために不可欠である。
我々は,事前学習した任意のSIDモデルにプラグインして,その性能を向上させるイメージ前処理コンポーネントであるTextureCropを提案する。
実験結果は、中央の収穫に比べてAUCが6.1%改善し、リサイズに比べて15%改善したことを示している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:53:08 GMT)
CAPrompt: Cyclic Prompt Aggregation for Pre-Trained Model Based Class Incremental Learning [12.2] 本稿では,タスクID予測への依存性を排除するために,新しいCAPromptアグリゲーション法を提案する。
凹凸条件下では、集約プロンプトは単一のタスク固有のプロンプトを選択するよりも低いエラーを達成する。
提案したCAPromptは最先端手法を2%-3%上回る性能を示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:56:34 GMT)
Achieving Collective Welfare in Multi-Agent Reinforcement Learning via Suggestion Sharing [12.2] 自己利益と集団福祉の対立は、しばしば共有福祉を達成する努力を妨げる。
この問題に対処するために,マルチエージェント強化学習(MARL)を提案する。
伝統的なMARLソリューションには、報酬、価値、ポリシーを共有すること、あるいはエージェントに最適なポリシーを学習するよう促すために固有の報酬を設計することが含まれる。
Suggestion Sharing(SS)に基づく新しいMARLアプローチを導入し、エージェントはアクション提案のみを交換する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:44:44 GMT)
Theoretical Analysis of Quality Diversity Algorithms for a Classical Path Planning Problem [12.2] 本稿では,古典的計画問題に対する品質多様性(QD)アルゴリズムの挙動について検討する。
この結果から,Map-Elites QDアルゴリズムは各ノードの最短経路を並列に計算できることがわかった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:58:32 GMT)
Block Circulant Codes with Application to Decentralized Systems [12.0] 我々は,分散消去復号化をサポートするブロック循環符号のファミリ[n,k,d]を開発する。
このコードは、ブロックチェーンネットワークのデータ可用性問題に対処するプロトコルで使用するのに理想的だ。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:33:04 GMT)
LMM-Regularized CLIP Embeddings for Image Classification [11.8] 我々は,強力なCLIPビジョン言語モデルを用いた画像分類タスクに対処する。
本稿では,LMMに基づく正規化手法を提案する。
このようにして、識別能力を増強した埋め込みを生成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:11:23 GMT)
STAIR: Manipulating Collaborative and Multimodal Information for E-Commerce Recommendation [11.7] 本稿では,eコマースレコメンデーションにおける協調的かつマルチモーダルな情報の共存を可能にするために,新しいSTepwise grAph畳み込みを用いたSTAIRを提案する。
STAIRは、計算とメモリのコストを最小限に抑えた3つの公開eコマースデータセットで最先端のレコメンデーションパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:53:06 GMT)
Does it Chug? Towards a Data-Driven Understanding of Guitar Tone Description [11.6] 自然言語は一般に「ウォーム」や「ヘビー」のような楽器の音色を記述するために使われる。
本研究では,ギター音の文脈における形容詞の理解を深めるために,データ駆動型アプローチを追求する。
我々の主な貢献は音色形容詞のデータセットであり、楽器音の単一クリップを処理して、EQの調整や歪みなどの効果を通じて様々な音色を生成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:44:19 GMT)
Exploring More from Multiple Gait Modalities for Human Identification [11.3] 歩行は、軟質な生体計測特性の一種であり、遠くにいる個体の異なる歩行パターンを反映することができる。
本研究は,3つの一般的な歩行表現,すなわちシルエット,人間のパーシング,光学的流れについて,様々な融合評価を行った。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:15:13 GMT)
Quark and gluon entanglement in the proton based on a light-front Hamiltonian [11.3] 陽子内の各粒子のスピンおよび縦運動量エンタングルメントを計算する。
計算の結果, 動的グルーオンはプロトン粒子間の絡み合いを著しく高めることが示唆された。
これらの結果から, 粒子間の絡み合いの実験的検証の可能性が示唆された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:18:40 GMT)
Towards Adversarial Robustness of Model-Level Mixture-of-Experts Architectures for Semantic Segmentation [11.3] 都市交通シーンと高速道路交通シーンのセマンティックセグメンテーションにおけるMoEsの脆弱性を評価する。
多くの場合、MoEsは、インスタンスごとの攻撃や汎用的なホワイトボックス攻撃に対してより堅牢であり、転送攻撃に耐えられることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:49:59 GMT)
Towards Scientific Discovery with Generative AI: Progress, Opportunities, and Challenges [11.2] 本稿では、科学的な課題に応用された大規模言語モデルやその他のAI技術の最近の進歩に注目し、科学的な発見のためのAIの現状について考察する。
そして、科学的な発見のためのより包括的なAIシステムの開発に向けた重要な課題と研究の方向性を概説する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:52:20 GMT)
SPADE: Spectroscopic Photoacoustic Denoising using an Analytical and Data-free Enhancement Framework [11.2] sPA画像はノイズの影響を受けやすいため、信号対雑音比(SNR)が低く、画質が損なわれる。
フレーム平均化のような従来の denoising 技術は SNR の改善に有効だが、ダイナミックイメージングのシナリオでは実用的ではない。
本研究では,SPA画像のノイズ化のためのSPADEフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:42:05 GMT)
AUEB-Archimedes at RIRAG-2025: Is obligation concatenation really all you need? [11.2] 本稿では,RIRAG-2025のために開発したシステムについて述べる。
生成された回答は、参照フリーでモデルベースのメトリクスであるRePASを用いて評価される。
抽出された節から重要な文(「無視」)を抽出するRePASの神経成分を利用することで、精度の高いスコア(0.947)が得られることを示す。
そして、いくつかの代替案の中で最も優れたRePASで答えを選択することで、より可読で比較的高い結果が得られる可読で一貫性のある回答を生成することができることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:54:21 GMT)
Optimizing Hyperparameters for Quantum Data Re-Uploaders in Calorimetric Particle Identification [11.1] 本稿では,1量子ビットデータ再アップロード(QRU)量子モデルの粒子分類への応用について述べる。
このモデルは、強力な分類性能を提供しながら、最小の量子ビットを必要とする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:10:00 GMT)
$\texttt{DINO-Foresight}$: Looking into the Future with DINO [11.1] $textttDINO-Foresight$は、事前訓練されたビジョンファウンデーションモデル(VFM)のセマンティック特徴空間で動作する。
提案手法は,VFM特徴量の時間的変化を予測するために,マスク付き特徴変換器を自己教師型で訓練する。
このフレームワークでは、VFM機能は遅延空間として扱われ、異なるヘッドが将来のフレーム分析のために特定のタスクを実行する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:26:46 GMT)
Fast and Slow Gradient Approximation for Binary Neural Network Optimization [11.1] ハイパーネットワークに基づく手法は、ニューラルネットワークを用いて微分不可能な量子化関数の勾配を学習する。
本稿では,ヒストリ・グラディエント・ストレージ(HGS)モジュールを提案する。これは,ヒストリ・グラディエント・シーケンスをモデル化し,最適化に必要な1次モーメントを生成する。
また、ハイパーネットワークに層認識埋め込み(LRE)を導入し、層固有の微細勾配の生成を容易にする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:48:40 GMT)
DB-PAISA: Discovery-Based Privacy-Agile IoT Sensing+Actuation [11.0] IoT(Internet of Things)デバイスは、多くのパブリックおよびセミプライベートな設定において、ますます一般的なものになりつつある。
現在、ほとんどのデバイスは、所有者やオペレーターではないカジュアルな(近くの)ユーザーによる発見を促進するメカニズムを欠いている。
これは自然にプライバシー、セキュリティ、安全性の問題を引き起こします。
本研究では,DB-PAISAを構築し,これらの問題にプルベースの手法で対処する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:57:24 GMT)
HGSFusion: Radar-Camera Fusion with Hybrid Generation and Synchronization for 3D Object Detection [10.9] ミリ波レーダーは、自律走行のための3次元物体検出において重要な役割を果たす。
レーダー点雲は、鮮明な間隔と避けられない角度推定誤差に悩まされる。
レーダーとカメラデータの直接融合は、負の効果や反対効果につながる可能性がある。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:06:17 GMT)
Precision-Enhanced Human-Object Contact Detection via Depth-Aware Perspective Interaction and Object Texture Restoration [10.8] 人間オブジェクト接触(Human-object Contact、HOT)は、人間と物体が接触する領域を正確に識別するように設計されている。
現在の手法では、オブジェクトが頻繁にビューをブロックしているシナリオを考慮できません。
我々は、深度マップ生成モデルを用いて、カメラに関連する人間や物体の深度情報を提供するPIHOTと呼ばれる視点相互作用HOT検出器を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:50:46 GMT)
EOV-Seg: Efficient Open-Vocabulary Panoptic Segmentation [10.8] EOV-Segは、オープン・ボキャブラリ・パノプティ・セグメンテーションのための新しい単一ステージ、共有、効率的、空間認識のフレームワークである。
視覚的アグリゲーションのセマンティック理解を改善するために,Vocabulary-Aware Selection (VAS) モジュールを導入する。
The Two-way Dynamic Embedding Experts (TDEE) was introduced a Two-way Dynamic Embedding Experts (TDEE) to leverage the spatial awareness ability of ViT-based CLIP backbone。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:16:14 GMT)
No More Tuning: Prioritized Multi-Task Learning with Lagrangian Differential Multiplier Methods [10.7] Web検索では、クリックスルー率やユーザエンゲージメントなど、他の指標よりも関連性が優先されることが多い。
既存のフレームワークは、さまざまなタスクの優先順位付けに十分な注意を払っている。
ステップワイドなマルチタスク最適化のために,Lagrangian Differential Multiplier Methodsを用いた新しいマルチタスク学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:58:28 GMT)
AI-Driven Health Monitoring of Distributed Computing Architecture: Insights from XGBoost and SHAP [10.7] 本稿では、XGBoostに基づく健康状態判定手法を提案し、SHAP法を組み合わせてモデルの解釈可能性を分析する。
XGBoostは、エッジコンピューティングノードの複雑な特徴や非線形データを処理するのに優れた性能を持つ。
AI技術とコンピュータシステムの最適化を組み合わせることで、エッジコンピューティングノードの健康状態のインテリジェントなモニタリングを実現することができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:37:09 GMT)
Improving Automatic Fetal Biometry Measurement with Swoosh Activation Function [10.6] 胎児視床径(FTD)と胎児頭周率(FHC)の測定は、異常な胎児発生の同定に不可欠である。
現在の最先端(SOTA)アルゴリズムであるBiometryNetは、FTDとFHC測定には不十分である。
本稿では,ランドマーク検出アルゴリズムによって生成されるヒートマップの正規化を強化するために,新しい活性化関数(SAF)を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:05:15 GMT)
Cost-Effective Label-free Node Classification with LLMs [10.5] グラフニューラルネットワーク(GNN)は,グラフデータのノード分類モデルとして登場した。
大規模言語モデル (LLMs) の出現により、有望な方法は、ノードラベリングに非常に優れたゼロショット機能と膨大な知識を活用することである。
この研究は、LCMをGNNに統合する能動的自己学習フレームワークであるCellaを費用対効果で提示する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:04:40 GMT)
Learning Massive-scale Partial Correlation Networks in Clinical Multi-omics Studies with HP-ACCORD [10.5] 擬似表現に基づくグラフィカル・モデル・フレームワークを提案する。
これは高次元の仮定の下で様々な指標における推定と選択の整合性を維持する。
最大100万変数のシミュレーションデータを用いて,我々のフレームワークの高性能コンピューティング実装を検証した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:38:02 GMT)
Are LLMs Rigorous Logical Reasoner? Empowering Natural Language Proof Generation with Contrastive Stepwise Decoding [10.4] 本稿では,論理的推論のためのモデルの能力を高めるために,負の推論経路を用いることにより,ステップワイズな証明生成に対照的な復号を導入する。
EntailmentBankの実験は、言語モデルの計画能力を実証する上で、我々の手法の成功を裏付けている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:18:05 GMT)
CLDA-YOLO: Visual Contrastive Learning Based Domain Adaptive YOLO Detector [10.4] 非教師付きドメイン適応(UDA)アルゴリズムは、ドメインシフトの条件下でオブジェクト検出器の性能を著しく向上させることができる。
視覚コントラスト学習(CLDA-YOLO)に基づく教師なし領域適応型YOLO検出器を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:25:52 GMT)
Endangered Alert: A Field-Validated Self-Training Scheme for Detecting and Protecting Threatened Wildlife on Roads and Roadsides [10.4] 本稿では,オーストラリアにおけるカソーファリーなどの希少動物の検出を目的とした,革新的な自己学習手法を提案する。
提案手法は,希少種のセンサデータを取得し,ラベル付けすることを含む,現実世界における重要な課題に対処する。
クラウドとエッジコンピューティングを活用し、フィールドデプロイモデルの検出性能を向上させるために自動データラベリングを実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:44:27 GMT)
Self-Testing Positive Operator-Valued Measurements and Certifying Randomness [10.4] デバイス非依存のシナリオでは、正の演算子値の測定は射影測定よりもランダム性を証明できる。
本稿では,ブロッホ球面のX-Z平面における3出力極端量子ビットPOVMを自己検証する。
このPOVMを使用すると、およそ1.58ビットの局所ランダム性が証明され、これはこの平面の極端量子ビットPOVMによって達成できる最大量である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:35:35 GMT)
A Survey on LLM-as-a-Judge [10.3] 大規模言語モデル(LLM)は、様々な領域で大きな成功を収めています。
LLMは、従来の専門家主導の評価に代わる魅力的な代替手段である。
LLM-as-a-Judgeシステムはどうやって構築できるのか?
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:00:53 GMT)
Token Prepending: A Training-Free Approach for Eliciting Better Sentence Embeddings from LLMs [10.2] Token Prepending (TP) 技術は、各レイヤのデコードされた文を次のレイヤの入力に埋め込む。
TP技術はプラグアンドプレイおよびトレーニングフリー技術であり、即時ベースの文埋め込み手法とシームレスに統合できる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:42:00 GMT)
MOANA: Multi-Radar Dataset for Maritime Odometry and Autonomous Navigation Application [10.1] 海洋環境検知には、厳しい天候、プラットフォーム摂動、大きな動的物体、長い検知範囲の要求といった課題を克服する必要がある。
レーダーセンサーは、天候や塩分からの物理的汚染に対する堅牢な長距離検知機能とレジリエンスを提供する。
このデータセットは、短距離LiDARデータ、中距離Wバンドレーダデータ、長距離Xバンドレーダデータを統一されたフレームワークに統合する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:21:55 GMT)
Classification of Spontaneous and Scripted Speech for Multilingual Audio [9.9] 発話スタイルが音声処理研究にどのように影響するかをよりよく理解するためには,自発音声からスクリプトを識別することが不可欠である。
本稿では,様々な形式や言語にまたがってよく一般化された分類器を構築することの課題に対処する。
従来型,手作り音響,韻律的特徴から高度なオーディオトランスフォーマーまで,様々なモデルを体系的に評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:45:10 GMT)
Near-Field Spot Beamfocusing: A Correlation-Aware Transfer Learning Approach [9.8] 3次元(3D)スポットビームフォーカス(SBF)は、近距離領域の非常に小さな体積内で放射能を集中させる。
近年,チャネル状態情報 (CSI) に依存しない機械学習 (ML) による効果的なSBFのための実装が開発されている。
本稿では, ELPMを用いた近接場SBFについて検討し, 長期学習に伴う課題に対処する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:56:32 GMT)
THESAURUS: Contrastive Graph Clustering by Swapping Fused Gromov-Wasserstein Couplings [9.8] We present conTrastive grapH clustEring by SwApping fUsed gRomov-wasserstein couplingS (THESAURUS)
本手法では,コンテキスト情報を提供するためのセマンティックプロトタイプを導入し,クロスビュー代入予測プレテキストタスクを採用する。
これはGromov-Wasserstein Optimal Transport (GW-OT) と提案したプロトタイプグラフを利用して、グラフ構造のクラスタ情報を徹底的に活用する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:33:56 GMT)
OmniVLM: A Token-Compressed, Sub-Billion-Parameter Vision-Language Model for Efficient On-Device Inference [9.8] デバイス上での効率的な推論のための視覚言語モデルであるOmniVLMを提案する。
視覚トークンシーケンスの長さを729から81に短縮し、計算オーバーヘッドを大幅に削減する。
968MのパラメータフットプリントでnanoLLAVAのような既存のベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:38:00 GMT)
ProxyLM: Predicting Language Model Performance on Multilingual Tasks via Proxy Models [9.7] ProxyLMは、プロキシモデルを用いてLMのパフォーマンスを予測するために設計されたタスクおよび言語に依存しないフレームワークである。
ProxyLMはタスク評価の計算オーバーヘッドを大幅に減らし、従来の手法よりも37.08倍の高速化を実現した。
この結果から, ProxyLM は事前学習した LM の未確認言語に適応するだけでなく,異なるデータセットに対して効果的に一般化できることが示された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:06:46 GMT)
BA-BFL: Barycentric Aggregation for Bayesian Federated Learning [9.7] ベイズ連邦学習(BFL)の文脈における集約の問題について検討する。
情報幾何学的視点を用いて,BFLアグリゲーションのステップを,予め特定された発散度測定値に対するトレーニング後部のバリセンタの発見と解釈する。
非IID設定を考慮し、最先端(SOTA)ベイズアグリゲーション法に対して開発したアルゴリズムの性能を解析する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:47:05 GMT)
SP$^2$T: Sparse Proxy Attention for Dual-stream Point Transformer [9.6] ローカルプロキシベースのデュアルストリームポイントトランスであるSP$2$Tを提案する。
地域情報とグローバル情報のバランスを維持しながら、グローバルな受容分野を促進する。
我々のモデルは下流タスクにおけるSOTA性能を達成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:21:09 GMT)
Runtime Analysis for Multi-Objective Evolutionary Algorithms in Unbounded Integer Spaces [9.6] 整数探索空間に対する多目的進化アルゴリズムを解析する。
パワーロー変異は指数的な尾を持つ突然変異よりも優れていることが判明した。
整数空間における未知問題に対して、パワーロー突然変異を推奨する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:53:54 GMT)
Can AI Extract Antecedent Factors of Human Trust in AI? An Application of Information Extraction for Scientific Literature in Behavioural and Computer Sciences [9.6] AIへの信頼は、AIアプリケーションに対する人間の信頼に寄与する要因を研究する場所である。
ドメインエキスパートの入力により、このドメインで最初の注釈付き英語データセットを作成します。
我々は、名前付きエンティティと関係抽出における大きな言語モデルを用いて、最先端の手法でベンチマークを行う。
本結果から,本課題には,現在,プロンプトベースLLMでは実現不可能な教師あり学習が必要であることが示唆された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 00:02:38 GMT)
Nearly Zero-Cost Protection Against Mimicry by Personalized Diffusion Models [9.5] 遅延を低減するための事前学習を導入し、性能劣化を最小限に抑えるための混合摂動手法を提案する。
我々の新しいトレーニング戦略は、複数のVAE特徴空間における保護損失を計算し、推論における適応的目標保護はロバスト性を高める。
実験では、視認性を向上し、推論時間を劇的に短縮した同等の保護性能を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:46:45 GMT)
Query3D: LLM-Powered Open-Vocabulary Scene Segmentation with Language Embedded 3D Gaussian [9.3] 本稿では,自律運転におけるオープンな3次元シーンクエリのための新しい手法を提案する。
そこで我々は,Large Language Models (LLMs) を用いて,文脈的に正のフレーズを生成するとともに,肯定的な単語によるセグメンテーションとシーン解釈を支援することを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:54:56 GMT)
Self-Adaptive Paraphrasing and Preference Learning for Improved Claim Verifiability [9.1] 事実チェックにおいて、クレームの構造と言い換えは、モデルの判断を正確に予測する能力に重大な影響を及ぼす。
ラベル付きトレーニングデータに依存しないクレームを抽出する自己適応型手法を提案する。
本稿では,従来のソーシャルメディアの定式化よりも検証可能なクレームパラフレーズを抽出した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:54:57 GMT)
Relation-Guided Adversarial Learning for Data-free Knowledge Transfer [9.1] 本稿では,三重項損失を考慮したリレーショナルガイド型逆学習手法を提案する。
本手法は,生成標本のクラス内多様性とクラス間混同を促進することを目的としている。
RGALは従来の最先端手法に比べて精度とデータ効率が大幅に向上した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:11:02 GMT)
Speeding Up the NSGA-II With a Simple Tie-Breaking Rule [9.0] 我々は、次の人口の選択において、単純なタイブレーキングルールを解析する。
従来のOneMinMax、LeadingOnesZero、OneJumpJumpベンチマークでベンチマークの有効性を証明する。
両目的問題に対して,最小サイズ以上の集団規模を適度に増やすと,実行時保証が増加しないことを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:15:37 GMT)
Category Level 6D Object Pose Estimation from a Single RGB Image using Diffusion [9.0] 一つのRGB画像からカテゴリレベルのオブジェクトのポーズ推定を行う難しい問題に対処する。
本稿では,特定のオブジェクトモデルや深度情報を必要としない新しいソリューションを提案する。
我々のアプローチは、REAL275データセットの現在の最先端をかなりのマージンで上回る。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:39:33 GMT)
Forward KL Regularized Preference Optimization for Aligning Diffusion Policies [9.0] 拡散政策の学習における中心的な問題は、様々なタスクにおいて、政策の出力と人間の意図を一致させることである。
そこで本稿では,拡散ポリシーを優先事項と整合させる新しいフレームワーク,フォワードKL正規化参照最適化を提案する。
その結果,提案手法は好みとの整合性が優れ,従来の最先端アルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:32:15 GMT)
LineArt: A Knowledge-guided Training-free High-quality Appearance Transfer for Design Drawing with Diffusion Model [8.9] 複雑な外観を詳細な設計図に転送するフレームワークであるLineArtを紹介する。
階層的な視覚認知をシミュレートすることで、構造的精度を維持しつつ、高忠実な外観を生成する。
正確な3Dモデリング、物理的特性仕様、ネットワークトレーニングは必要とせず、設計作業に便利である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:54:45 GMT)
Theory of the monochromatic advanced-wave picture and applications in biphoton optics [8.7] クリシュコの進行波画像(AWP)は、主に自発的なパラメトリックダウンコンバージョンにより、非線形結晶が生成する双光子を置き換えることによって解釈される。
我々は,1つの光子の条件波関数が伝搬,乗算,および他の伝播によって計算されるという,単色光を用いたAWPの形式理論を開発した。
我々は、空間分解能などの特性を簡潔に推定できる偏光エンタングルメントを用いて、未検出光子と量子ホログラフィーを用いて量子イメージングを解析する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:17:27 GMT)
MSDiagnosis: A Benchmark for Evaluating Large Language Models in Multi-Step Clinical Diagnosis [8.6] われわれはMSDiagnosisと呼ばれる中国の臨床診断基準を提案する。
このベンチマークは12の部門から2,225のケースで構成され、一次診断、鑑別診断、最終診断などのタスクをカバーする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:33:05 GMT)
Individual Bus Trip Chain Prediction and Pattern Identification Considering Similarities [8.6] そこで本稿では,同時代の交通機関をベースとしたバストリップチェーンを新たに構築する手法を提案する。
鍵となる類似パターンは実世界のデータを使って定義され、テストされ、これらのパターンをキャプチャするために類似関数が開発される。
本研究は,バス旅行チェーンの類似性に基づく予測の有効性を実証し,個別のバス旅行パターンを解析するための新たな視点を提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:32:26 GMT)
LLMs Can Simulate Standardized Patients via Agent Coevolution [8.5] 標準化された患者(SP)を用いた医療従事者の養成は、依然として複雑な課題である。
EvoPatientは、患者エージェントと医師エージェントがマルチターン対話を通じて診断プロセスをシミュレートする、新しいシミュレートされた患者フレームワークである。
我々のフレームワークは、既存の推論手法を10%以上改善し、要求アライメントと人間の嗜好を改善する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:36:47 GMT)
BearLLM: A Prior Knowledge-Enhanced Bearing Health Management Framework with Unified Vibration Signal Representation [8.4] 大規模言語モデル(BearLLM)を活用したベアリング型健康管理フレームワークを提案する。
BearLLMは、ユーザのプロンプトと振動信号を処理することで、複数のベアリング関連タスクを統合する。
私たちは、より有能な産業マルチモーダルモデルの構築に関する将来の研究を刺激するデータセット、モデル、コードを提供しています。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:08:16 GMT)
BioBridge: Unified Bio-Embedding with Bridging Modality in Code-Switched EMR [8.3] 本稿では,自然言語処理(NLP)を電子カルテ(EMR)にフリーテキスト形式で適用する手法であるBioBridgeフレームワークを紹介する。
韓国などの非英語圏では、EMRデータは、ネイティブ言語と英語を混ぜ合わせたコードスイッチング(Code-Switching, CS)形式で書かれることが多い。
BioBridgeフレームワークは、"bridging modality in context"と"unified bio-embedding"の2つのコアモジュールで構成されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:24:54 GMT)
DVP-MVS: Synergize Depth-Edge and Visibility Prior for Multi-View Stereo [8.3] そこで我々は,DVP-MVSを提案する。DVP-MVSは,より堅牢で可視性の高いパッチ変形に先立って,奥行き整合とクロスビューを相乗化できる。
本手法は, 頑健さと一般化性に優れ, 最先端の性能を実現することができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:09:10 GMT)
How Can LLMs and Knowledge Graphs Contribute to Robot Safety? A Few-Shot Learning Approach [8.2] 大規模言語モデル(LLM)は、ロボットが自然言語命令を理解し実行できるようにすることで、ロボット工学領域を変革している。
本稿では,ChatGPTが生成したコードを検証した安全層について概説する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:28:34 GMT)
Quantum Adversarial Machine Learning and Defense Strategies: Challenges and Opportunities [8.1] 量子セキュアニューラルネットワークの開発は、敵の攻撃を防ぐために不可欠である。
本稿では,ポスト量子暗号を含む3つの量子セキュア設計原則を提案する。
また、量子セキュリティ、プライバシ、信頼に関するオープンな問題を特定し、適応的な敵攻撃や自動敵攻撃を将来の方向として検討することを推奨している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:07:27 GMT)
MVQ:Towards Efficient DNN Compression and Acceleration with Masked Vector Quantization [8.1] 限られた数のコードワードで重要な重みをよりよく近似することを目的としたMVQと呼ばれる新しいアプローチが提案されている。
本アルゴリズムは,画像分類,オブジェクト検出,セグメンテーションタスクの様々なモデルで検証される。
ASIC評価では, MVQ加速器はエネルギー効率を2.3$times$で向上し, ベースEWS加速器と比較してサイストリックアレイのサイズを55%削減する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:54:43 GMT)
Exploring Temporal Event Cues for Dense Video Captioning in Cyclic Co-learning [8.0] 本稿では,MCCL(Multi-Concept Cyclic Learning)と呼ばれる高密度ビデオキャプションネットワークを提案する。
我々は各フレームに対して弱い教師付き概念検出を行い、検出された概念埋め込みをビデオ機能に統合してイベントキューを提供する。
キャプションネットワークでは,ジェネレータがセマンティックマッチングを通じてイベントローカライズを誘導する循環的コラーニング戦略を確立する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:48:44 GMT)
Auto-bidding in real-time auctions via Oracle Imitation Learning [7.8] マルチスロット第2価格オークションにおける自動入札エージェントのトレーニングフレームワークを提案する。
広告キャンペーンが終了すると、各インプレッション機会の最適入札を決定することは、複数の選択knapsack問題とみなすことができるという知見を活用できる。
本稿では,印象の機会と広告スロットをほぼ最適に組み合わせた「オークル」アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:21:35 GMT)
Context Filtering with Reward Modeling in Question Answering [7.7] Reward Modelingを通して重要コンテンツを要約し、非重要詳細を除去するコンテキストフィルタリング手法を導入する。
EMパートークン(EPT)の6.8倍の増大により,本手法がベースラインを大幅に上回ることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:29:24 GMT)
Modeling Latent Non-Linear Dynamical System over Time Series [7.5] 本研究では,データから直接方程式を導出することにより時系列を与えられる非線形力学系をモデル化する問題について検討する。
本稿では、時間依存型モデリングを可能にする潜在状態を導入し、この問題を潜時状態の動的推定問題として定式化する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:25:18 GMT)
Can Machines Think Like Humans? A Behavioral Evaluation of LLM-Agents in Dictator Games [7.5] LLM(Large Language Model)ベースのエージェントは、現実のタスクを担い、人間の社会と関わるようになっている。
独裁者ゲームにおけるAIエージェントの利他的行動に異なるペルソナと実験的フレーミングがどう影響するかを検討する。
LLMに人間のようなアイデンティティを割り当てても、人間のような振る舞いは生じないことを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:00:43 GMT)
Augmenting Math Word Problems via Iterative Question Composing [7.5] 本稿では,処理されたWebデータと合成質問応答ペアを組み合わせたMMIQCデータセットを提案する。
Qwen-72B-MMIQC は45.0%の精度を達成し、2023年にリリースされた最初のバージョン GPT-4 を8.2%上回った。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:13:03 GMT)
RepFace: Refining Closed-Set Noise with Progressive Label Correction for Face Recognition [7.4] 顔認識性能はラベルノイズ、特にクローズドセットノイズに大きく影響を受ける。
早期のトレーニングを安定させる新しい枠組みを提案し,サンプルをクリーンであいまいでうるさいグループに分割する。
本手法は,メインストリームの顔データセット上での最先端の処理結果を実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:57:33 GMT)
RAG Playground: A Framework for Systematic Evaluation of Retrieval Strategies and Prompt Engineering in RAG Systems [7.4] RAG Playgroundは、Retrieval-Augmented Generation (RAG)システムの体系的評価のためのオープンソースのフレームワークである。
本稿では,新しいメトリクスを用いた包括的評価フレームワークを導入し,異なる言語モデルの比較実験結果を提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:40:26 GMT)
An Incremental Clustering Baseline for Event Detection on Twitter [7.4] テキストストリームにおけるイベント検出は,オンラインメディアやソーシャルネットワークの分析において重要な課題である。
本研究では, 文埋め込みの最近の進歩と相まって, 漸進的クラスタリングアルゴリズムを用いた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:33:13 GMT)
Controllable Shadow Generation with Single-Step Diffusion Models from Synthetic Data [7.4] 本研究では,2次元オブジェクト画像の高速・制御可能・背景自由影生成のための新しい手法を提案する。
我々は3Dレンダリングエンジンを用いて大規模な合成データセットを作成し、制御可能なシャドウ生成のための拡散モデルを訓練する。
修正フローの目的は, リアルタイムアプリケーションを実現する1つのサンプリングステップで, 高品質な結果が得られることがわかった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:55:22 GMT)
Enhancing Transformer-based models for Long Sequence Time Series Forecasting via Structured Matrix [7.4] Transformerベースのモデルのコアコンポーネントとしての自己保持機構は、大きな可能性を秘めている。
本稿では,Surrogate Attention Blocks (SAB) とSurrogate Feed-Forward Neural Network Blocks (SFB) を統合してトランスフォーマーモデルを強化する新しいアーキテクチャフレームワークを提案する。
このフレームワークは、自己注意層とフィードフォワード層をSABとSFBで置き換えることで、時間と空間の複雑さを軽減します。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:47:34 GMT)
Memory-Reduced Meta-Learning with Guaranteed Convergence [7.3] 本稿では,履歴パラメータ/勾配の使用を回避し,各イテレーションにおけるメモリコストを大幅に削減するメタ学習アルゴリズムを提案する。
メタラーニングベンチマーク実験の結果,提案アルゴリズムの有効性が確認された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:55:55 GMT)
DeepSN: A Sheaf Neural Framework for Influence Maximization [7.3] 影響はデータマイニングにおいて重要であり、ソーシャルネットワーク分析やバイラルマーケティングに広く応用されている。
近年、研究者たちはこの問題に対処するための機械学習技術に目を向けている。
DeepSNは、データ駆動のエンドツーエンド方式で多様な影響パターンを学ぶために、せん断神経拡散を用いる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:49:51 GMT)
SoundMorpher: Perceptually-Uniform Sound Morphing with Diffusion Model [7.3] 本研究では,知覚的に均一なモーフィング軌跡を生成するために設計された,オープンワールドなモーフィング手法SoundMorpherを提案する。
従来の音響モーフィング技術は、モーフィング因子と音知覚の線形関係を仮定し、滑らかな遷移を達成する。
SoundMorpherは、モーフィング係数とモーフィング音の知覚との明確な関係を探索し、ログメル・スペクトログラムの特徴を活用している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:10:56 GMT)
Regional Expected Improvement for Efficient Trust Region Selection in High-Dimensional Bayesian Optimization [7.2] 本研究では,中~高次元設定における信頼領域ベースBOの強化を目的とした,新たな獲得機能である地域期待改善(REI)を提案する。
本稿では、REIが最適信頼領域を効果的に同定し、REIが従来のBO法や他の高次元BO法を中~高次元実世界の問題で上回っていることを実証的に証明する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:23:01 GMT)
On Large Language Models in Mission-Critical IT Governance: Are We Ready Yet? [7.1] ミッションクリティカルシステム(MCS)のセキュリティは、コンピュータの登場以来、基本的な問題となっている。
我々は、IT MCSのガバナンスに生成AI(GAI)を使用することについて、実践者の視点、特に開発者とセキュリティ担当者を探求することを目的としている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:21:05 GMT)
Probing the Mid-level Vision Capabilities of Self-Supervised Learning [7.0] 自己教師付き学習アプローチは、主にハイレベルな認識タスクのために設計され、評価される。
私たちの研究はSSLモデルが学んだことの全体像とタイムリーなビューを提供し、主にハイレベルなビジョンタスクに焦点を当てた既存の研究を補完します。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:55:09 GMT)
Priority-Aware Model-Distributed Inference at Edge Networks [7.0] 分散推論技術は、データ分散スキームとモデル分散スキームに広く分類することができる。
データ分散推論(DDI)では、各ワーカーは機械学習(ML)モデル全体を運ぶが、データのサブセットのみを処理する。
新たなパラダイムはモデル分散推論(MDI)であり、各ワーカはMLレイヤのサブセットのみを格納する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:01:55 GMT)
SAMIC: Segment Anything with In-Context Spatial Prompt Engineering [6.9] 既存のビジョンファウンデーションモデル(VFM)を活用して、新しいドメインのための数ショットセグメンテーションモデルを作成するためのインクリメンタルコストを削減する方法について説明する。
具体的には、ドメイン固有のアプリケーションに新しいタイプのオブジェクトを分割するために、VFMをプロンプトする方法を学ぶ小さなネットワークSAMICを紹介する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:26:06 GMT)
Conditioned quantum-assisted deep generative surrogate for particle-calorimeter interactions [6.8] 本研究では,大型ハドロン衝突型加速器シミュレーションのための量子支援深部生成モデルを提案する。
このモデルでは,条件付き変分オートエンコーダ (VAE) と条件付き制限ボルツマンマシン (RBM) を統合する。
RBMノードと接続は、サンプリングのためにD-WaveのPegasus-structured textitAdvantage Quantum Annealer (QA)上でqubitsと couplerを使用するように慎重に設計されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:05:53 GMT)
Harnessing Language for Coordination: A Framework and Benchmark for LLM-Driven Multi-Agent Control [6.7] HIVEは、LLMと自然言語ダイアログを使用して、最大2,000個のエージェントの群れを協調する権限を、一人の人間に与えている。
エージェントの動きのコーディネート、ユニットの弱点の活用、地形と戦略点の理解といったタスクをハイブリッドで解くことで、このマルチエージェントベンチマークに有望な結果を提示する。
この研究は、人間とスワムの協調におけるLLMの可能性と限界に光を当て、この分野における将来の研究の道を開く。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:25:42 GMT)
Leveraging Group Classification with Descending Soft Labeling for Deep Imbalanced Regression [6.6] ディープ・インバランス・レグレッション(DIR)は、機械学習において興味深いが未探索の課題である。
まず、DIRの目的とベイズ的観点からの分類の関連性を橋渡しする。
具体的には、近隣のラベルのデータを同じグループに集約することにより、順序付きグループ認識学習損失を導入する。
また,データ間の固有類似性を生かした対称な下降型ソフトラベリング手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:54:57 GMT)
The Role of Natural Language Processing Tasks in Automatic Literary Character Network Construction [6.6] 本稿では、共起ネットワーク抽出における名前付きエンティティ認識(NER)とコア参照解決の役割に焦点を当てる。
我々は,NERの性能がテストされたノベルに依存し,文字検出に強く影響を及ぼすことを示した。
また、NER検出された参照は、多くの文字共起を見逃しているだけで、それを防ぐためにコア参照の解決が必要であることも示しています。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:46:53 GMT)
Efficient Layered New Bit-Flipping QC-MDPC Decoder for BIKE Post-Quantum Cryptography [6.6] Bit Flipping Key Encapsulationメカニズムは、ポスト量子暗号標準化の候補である。
新しいビットフリップ(BF)復号アルゴリズムは、高精度係数を持つアフィン関数によりBF閾値を決定する。
本稿では,新しいBIKE BFデコーダの列層デコーダを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:23:41 GMT)
Merging Text Transformer Models from Different Initializations [6.6] 異なるTransformer minimaが類似した特徴を学習する程度について検討する。
損失景観におけるこれらのミニマの関係を調べるためのモデルマージ手法を提案する。
以上の結果から,これらのモデルのミニマは従来理解されていたよりもシャープで孤立していないことが明らかとなった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:00:10 GMT)
Quantum sampling on a quantum annealer for large volumes in the strong coupling limit for gauge group U(3) [6.5] 我々はD-Wave量子アニールを用いてサブ格子のヒストグラムを生成し、Metropolis-Hastingsアルゴリズムを用いて熱力学的観測値を決定する。
従来のモンテカルロシミュレーションから得られたものと比較した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:33:21 GMT)
Fairness Shields: Safeguarding against Biased Decision Makers [6.4] 我々は、シンボル的意思決定者が別のデプロイされたブラックボックス意思決定者の決定順序を監視するフェアネス・シールドを導入する。
フェアネスシールドを計算するための4つの異なるアルゴリズムを提案し、そのうちの1つは固定された水平線に対するフェアネスを保証する。
我々のアルゴリズムは計算コストと最適性保証のレベルが異なる有界-水平最適制御問題の異なるインスタンスを解く。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:21:12 GMT)
Efficient Policy Adaptation with Contrastive Prompt Ensemble for Embodied Agents [6.4] 本稿では,強化学習のための新しいコントラスト・プロンプト・アンサンブル(ConPE)フレームワークを提案する。
視覚言語モデル上に複数の視覚的プロンプトを持つガイド付きアテンションに基づくアンサンブルアプローチを考案し、ロバストな状態表現を構築する。
実験では,いくつかの具体的エージェントタスクに対して,ConPEが他の最先端アルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:53:00 GMT)
Towards Better Multi-task Learning: A Framework for Optimizing Dataset Combinations in Large Language Models [6.4] ニューラルネットワークを利用して最適なデータセットの組み合わせを予測する新しいフレームワークを提案する。
このフレームワークは、モデル、データセット、ドメインに依存しないまま、選択を反復的に洗練し、効率を大幅に改善します。
提案手法は,人間の視点から見れば不成功に思えるタスクであっても,より優れた組み合わせを効果的に識別できることを実証する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:20:18 GMT)
IGR: Improving Diffusion Model for Garment Restoration from Person Image [6.4] 仮想試着作業の逆転であるガーメント修復は、人物画像から標準服を復元することに焦点を当てている。
そこで本研究では,正装回復のための改良された拡散モデルを提案する。
提案手法では,被写体画像から低レベル特徴と高レベル意味を独立に捉えるために,2つの衣服抽出器を用いる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:48:30 GMT)
UnMA-CapSumT: Unified and Multi-Head Attention-driven Caption Summarization Transformer [6.4] 本稿では,Unified Attention and Multi-Head Attention-driven Caption Summarization Transformer (UnMA-CapSumT) ベースのキャプションフレームワークを提案する。
修正適応注意に基づく実写画像キャプションモデル(MAA-FIC)とSF-Bi-ALSTM駆動のスタイル化画像キャプションモデル(SF-Bi-ALSTM)の両方を用いている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:57:40 GMT)
Embodied CoT Distillation From LLM To Off-the-shelf Agents [6.3] DeDerは、大規模言語モデル(LLM)から具体的推論能力を分解し、蒸留するためのフレームワークである。
ALFREDベンチマークによる我々の実験は、DeDerが先進的な言語計画と蒸留アプローチを超越していることを示している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:18:02 GMT)
LogBabylon: A Unified Framework for Cross-Log File Integration and Analysis [6.2] LogBabylonは、Large Language Models(LLM)とRetrieval-Augmented Generation(RAG)技術を統合した、中央ログデータ統合ソリューションである。
LogBabylonは多様なログソースを統合し、抽出された情報の正確性と関連性を高める。
その機能は、継続的監視、パフォーマンス最適化、セキュリティ保証のための貴重なツールを提供する、コンテキスト対応の洞察の生成にまで拡張されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:36:03 GMT)
A Digital twin for Diesel Engines: Operator-infused PINNs with Transfer Learning for Engine Health Monitoring [6.1] 本研究の目的は,平均値ディーゼルエンジンモデルの未知パラメータを同定するための,計算効率のよいニューラルネットワークベースのアプローチを開発することである。
本稿では,物理情報ニューラルネットワーク,PINN,深層ニューラルネットワーク,DeepONetを組み合わせたハイブリッド手法を提案する。
オペレータネットワークは、オフライントレーニングを通じて学習した独立アクチュエータダイナミクスを予測し、PINNのオンライン計算コストを低減させる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:47:15 GMT)
CSI Compression using Channel Charting [6.1] 周波数分割デュプレックス(FDD)におけるマルチアンテナ通信システムでは、移動体から基地局(BS)へのチャネル状態情報(CSI)の報告が必要となる。
CSIレポートに伴うオーバーヘッドを軽減するため、モバイルユーザから送信された圧縮バージョンからBSでオリジナルのCSIを復元する目的で圧縮CSI技術が提案されている。
チャネルチャートは、CSIから無線環境マップを構築するための教師なし次元削減手法である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:30:53 GMT)
PARAPHRASUS : A Comprehensive Benchmark for Evaluating Paraphrase Detection Models [6.0] PARAPHRは、パラフレーズ検出モデルの多次元評価、ベンチマーク、選択のためのベンチマークである。
詳細な評価レンズ下でのパラフレーズ検出モデルは,単一分類データセットでは取得できないトレードオフを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:09:23 GMT)
Efficient Generative Modeling with Residual Vector Quantization-Based Tokens [5.9] ResGenは、サンプリング速度を損なうことなく高忠実度サンプルを生成する効率的なRVQベースの離散拡散モデルである。
我々は,ImageNet 256x256における条件付き画像生成とゼロショット音声合成の2つの課題に対して,提案手法の有効性と一般化性を検証する。
RVQの深さを拡大するにつれて、我々の生成モデルは、同様の大きさのベースラインモデルと比較して、より優れた生成忠実度またはより高速なサンプリング速度を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:51:01 GMT)
Two-Timescale Critic-Actor for Average Reward MDPs with Function Approximation [5.9] 本稿では,長期平均報酬設定における関数近似を用いた最初の2段階の批評家・アクターアルゴリズムを提案する。
また、そのようなスキームに対する収束解析と同様に、最初の有限時間非漸近アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:17:46 GMT)
Qsco: A Quantum Scoring Module for Open-set Supervised Anomaly Detection [5.9] 複雑なデータ構造を扱う量子コンピューティングの最近の進歩と機械学習モデルの改善は、異常検出手法におけるパラダイムシフトを先導している。
本研究では、量子変動回路をニューラルネットワークに埋め込み、不確実性やラベルなしデータを扱う際のモデルの処理能力を向上する量子スコーリングモジュール(Qsco)を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:11:07 GMT)
Semantic Component Analysis: Discovering Patterns in Short Texts Beyond Topics [5.9] 本稿では,新しいトピックモデリング手法であるセマンティックコンポーネント分析(SCA)を紹介する。
SCAは、短いテキストで単一のトピックを越えて、複数のニュアンス付きセマンティックコンポーネントを発見します。
英語、ハウサ語、中国語のTwitterデータセット上でSCAを評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:43:50 GMT)
Adsorb-Agent: Autonomous Identification of Stable Adsorption Configurations via Large Language Model Agent [5.8] 本稿では,システム固有の安定な吸着構成を効率的に識別するLarge Language Model (LLM)エージェントであるAdsorb-Agentを紹介する。
徹底的なサンプリングへの依存を減らすことで、必要な初期設定の数を著しく削減する。
システム全体の35%で実際の世界最小値に近い低いエネルギーを達成し、従来の方法よりもはるかに少ない初期設定を必要とする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:21:00 GMT)
Gramian Multimodal Representation Learning and Alignment [5.8] グラミアン表現アライメント尺度(GRAM)について紹介する。
GRAMは、モダリティ埋め込みが横たわる高次元空間において、$n$モダリティを学習し、アライメントする。
GRAMに基づく新しいコントラスト損失関数は、高次元埋め込み空間におけるマルチモーダルモデルのアライメントを高める。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:41:51 GMT)
Video Repurposing from User Generated Content: A Large-scale Dataset and Benchmark [5.8] 1万本以上のビデオと12万本以上の注釈付きクリップからなる広範囲なデータセットであるRepurpose-10Kを提案する。
実世界のユーザ生成コンテンツからアノテーションを得るための2段階のソリューションを提案する。
この課題に対処するためのベースラインモデルとして,音声,視覚,キャプションの各側面を統合する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:16:59 GMT)
Domain Adapting Deep Reinforcement Learning for Real-world Speech Emotion Recognition [5.7] 音声感情認識(SER)は、クロスコーパスおよび実世界のライブデータフィードシナリオで改善することができる。
既存のモデルを新しいドメインに適応できないことは、SERメソッドの欠点の1つです。
実世界のライブデータフィード設定に事前学習モデルを適用するための深層強化学習型戦略(RL-DA)を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:04:55 GMT)
TransPeakNet: Solvent-Aware 2D NMR Prediction via Multi-Task Pre-Training and Unsupervised Learning [5.7] 2次元NMRにおけるクロスピーク予測のための教師なしトレーニングフレームワークを提案する。
このアプローチでは、1Hと13Cシフトの注釈付き1Dデータセット上でMLモデルを事前トレーニングし、教師なしの方法で微調整する。
479名のエキスパートアノテートHSQCスペクトルの評価は,従来の手法よりもモデルの方が優れていることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 00:31:21 GMT)
Revelations: A Decidable Class of POMDPs with Omega-Regular Objectives [5.7] 部分的に観測可能なマルコフ決定プロセス(POMDP)は、シーケンシャルな意思決定における不確実性の顕著なモデルを形成する。
我々は、エージェントが最終的に現在の状態の完全な情報を持っていることをほぼ確実に要求することで、情報損失を制限する啓示機構を導入する。
これにより、概念的には単純で正確なアルゴリズムが、多種多様なPOMDPに対して得られる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:37:06 GMT)
Designing Semi-Structured Pruning of Graph Convolutional Networks for Skeleton-based Recognition [5.7] プルーニング(Pruning)は、不要なネットワーク部品を除去して動作させる軽量なネットワーク設計手法の1つである。
本稿では,構造的および非構造的プルーニングの欠点を解消する,新しい半構造化手法を提案する。
提案手法は, (i) 大きさに応じて重みを振る舞うバンドストップ機構, (ii) 個別にあるいはグループ的に接続するウェイトシェアリングパラメトリゼーション, (iii) 異なるグループワイドとエントリーワイドプルーニングを仲裁するゲーティング機構を組み合わせた, 微分可能なカスケードパラメトリゼーションに基づく。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:29:31 GMT)
Private Yet Social: How LLM Chatbots Support and Challenge Eating Disorder Recovery [5.6] 摂食障害 (ED) は、長期管理と支援を必要とする複雑な精神疾患である。
大規模言語モデル(LLM)ベースのチャットボットの最近の進歩は、個人が即時サポートを受けるのを支援する可能性を秘めている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:59:49 GMT)
From Division to Unity: A Large-Scale Study on the Emergence of Computational Social Science, 1990-2021 [5.6] 計算社会科学(CSS)の出現に関する総合的研究について述べる。
CSSは、社会科学の問題に対処するための計算手法を活用する学際分野である。
私たちは、CSSにフォーカスした場所の論文を使用して堅牢なCSS分類器をトレーニングし、1990年から2021年までの1100万の論文に適用しました。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:37:34 GMT)
Loosely Synchronized Rule-Based Planning for Multi-Agent Path Finding with Asynchronous Actions [5.5] MAPF(Multi-Agent Path Finding)は、各開始地点から各目標地点まで、複数のエージェントの衝突のない経路を求める。
多くのMAPFアルゴリズムは数千のエージェントを処理できるが、エージェントの各アクションが時間単位を必要とするという仮定に依存している。
本稿では,新たなプランナを開発し,スケーラビリティのためのソリューション品質をトレードオフする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:36:24 GMT)
Beyond Dataset Creation: Critical View of Annotation Variation and Bias Probing of a Dataset for Online Radical Content Detection [5.5] 我々は、ラディゼーションレベル、行動呼び出し、英語、フランス語、アラビア語で名前付きエンティティを注釈付けした、一般公開された多言語データセットを紹介します。
このデータセットは、コンテキスト情報を保持しながら個人のプライバシを保護するために匿名化される。
我々はアノテーションのプロセスを分析し、アノテータ間のバイアスと不一致を強調し、それらがモデル性能に与える影響を明らかにする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:03:43 GMT)
Coconut Palm Tree Counting on Drone Images with Deep Object Detection and Synthetic Training Data [5.5] 本研究では、リアルタイム物体検出装置であるYOLOを用いて、ガーナの農業用ドローンの映像からココナッツヤシの木を特定し、数えた。
YOLOを少ないデータで最適化するために、モデルトレーニングと検証のために合成画像が作成された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:33:28 GMT)
Which Augmentation Should I Use? An Empirical Investigation of Augmentations for Self-Supervised Phonocardiogram Representation Learning [5.4] 自己監視型学習(SSL) 対照的な学習は、データの不足を軽減できる可能性を示している。
本研究の目的は,PCG分類におけるSSLモデルの性能向上を目的とした,幅広いオーディオベースの拡張と組み合わせの探索と評価である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:32:52 GMT)
Quantization of Climate Change Impacts on Renewable Energy Generation Capacity: A Super-Resolution Recurrent Diffusion Model [5.4] 超解像リカレント拡散モデル(SRDM)は、気候データの時間分解能を高めるために開発された。
メカニズムモデルを用いた高分解能気候データから電力値に変換する。
中国内モンゴル・江名地方における事例研究
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:54:21 GMT)
Estimating the history of a random recursive tree [5.4] ヨルダン中心度尺度に基づく順序推定器を提案する。
提案した推定器が次数ベースおよびスペクトル順序付け法より優れていることを数値的に示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:20:42 GMT)
M2SE: A Multistage Multitask Instruction Tuning Strategy for Unified Sentiment and Emotion Analysis [5.4] 汎用MLLMのためのマルチステージマルチタスク・インストラクション・チューニング戦略であるM2SEを提案する。
マルチモーダル感情分析、感情認識、表情認識、感情理由推論、感情因果抽出といったタスクでモデルをトレーニングするために、組み合わせたアプローチを採用する。
我々のモデルであるEmotion Universe (EmoVerse) は、修正なしにMLLMフレームワーク上に構築されているが、M2SE戦略でトレーニングすると、これらのタスク間で大幅な改善が達成される。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:31:03 GMT)
L4Q: Parameter Efficient Quantization-Aware Fine-Tuning on Large Language Models [5.3] 量子化学習(QAT)とローランド適応(LoRA)を統合したL4Qを提案する。
メモリ最適化レイヤ設計を採用することで、L4QはQATのメモリオーバーヘッドを大幅に削減し、トレーニングコストはLoRAに匹敵する。
この量子化法と微調整法の組み合わせにより精度が向上することを示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:06:53 GMT)
A More Advanced Group Polarization Measurement Approach Based on LLM-Based Agents and Graphs [5.3] ソーシャルメディア上でのグループ偏極を測定することは、既存のソリューションでまだ解決されていないいくつかの課題を提示する。
我々はマルチエージェントシステムに基づくソリューションを設計し、偏光状態を表すためにグラフ構造化コミュニティセンチメントネットワーク(CSN)を用いた。
要約すると、提案手法はユーザビリティ、正確性、解釈可能性の観点から大きな価値を持っている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:13:49 GMT)
State-Space Systems as Dynamic Generative Models [5.2] 本稿では、入力過程と出力過程の間の決定論的離散時間状態空間システムによって引き起こされる依存構造について検討する。
状態空間系は、これらの2つの空間の間に機能的関係が存在しない場合でも、入力列空間と出力列空間の間の純粋確率的依存構造を誘導できることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:56:28 GMT)
Visual IRL for Human-Like Robotic Manipulation [5.2] 本研究では,協調ロボット(コボット)が操作タスクを学習し,それを人間的な方法で実行するための新しい手法を提案する。
本手法は,ロボットが人間の行動を観察してタスクの実行を学習する,LfO(Learning-from-observation)パラダイムに該当する。
2つの異なる現実的な操作課題に対して,本手法の性能を評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:23:13 GMT)
Mining In-distribution Attributes in Outliers for Out-of-distribution Detection [5.1] Out-of-Distribution (OOD) 検出は、現実のシナリオで信頼性の高い機械学習システムをデプロイするのに不可欠である。
本稿では,アウトレーヤ内における固有分布属性の合理的処理を容易にする,構造化されたマルチビュー・アウト・オブ・ディストリビューション検出学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:47:35 GMT)
Extrapolating Jet Radiation with Autoregressive Transformers [5.1] 自己回帰変換器は、粒子の変動数でイベントを生成することができる。
生成したジェットの数で、ジェット放射の分解率と外挿率をいかに学習できるかを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:46:43 GMT)
Common Ground, Diverse Roots: The Difficulty of Classifying Common Examples in Spanish Varieties [5.1] スペイン語のような言語では、多様体は著しく重複しうるが、多くの例はそれらの間に有効である。
トレーニングダイナミクスを使用して、既存のスペインデータセットの一般的な例やエラーを自動的に検出します。
本稿では,キューバおよびカリブ海のスペイン語品種のより正確な検出を容易にするために,共通例アノテーションを用いたキューバのスペイン語品種識別データセットを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:10:09 GMT)
Linear Equations with Min and Max Operators: Computational Complexity [5.1] min および max 演算子を持つ線形方程式系によって定義される最適化問題のクラスを考える。
条件 C2 と C4 ではNP完全であるのに対し、条件 C1 では UP は coUP と交差する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:18:36 GMT)
UA-PDFL: A Personalized Approach for Decentralized Federated Learning [5.1] フェデレートラーニング(Federated Learning, FL)は、データ漏洩なしにグローバルモデルを協調的に学習するように設計された、プライバシ保護機械学習パラダイムである。
この問題を軽減するために、分散統合学習(DFL)が提案され、すべてのクライアントが中央サーバなしでピアツーピア通信を行う。
我々は,DFLにおける非IID課題に対処するため,UA-PDFLという,分散化された分散学習フレームワークを支援する新しい単位表現を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:27:35 GMT)
Deep Joint Unrolling for Deblurring and Low-Light Image Enhancement (JUDE) [5.0] JUDEはDeblurring and Low-Light Image EnhancementのためのDeep Joint Unrollingである。
レチネックス理論とぼやけたモデルに基づいて、低照度のぼやけた入力を反復的に分解して分解する。
我々は,初期ぼやけたカーネルを推定し,明るさを高め,最終画像のノイズを除去するために,様々なモジュールを組み込んだ。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:43:29 GMT)
STDHL: Spatio-Temporal Dynamic Hypergraph Learning for Wind Power Forecasting [5.0] 風力発電所における空間的特徴を表現するための動的ハイパーグラフ学習(STDHL)モデルを提案する。
STDHLモデルは、動的空間相関をモデル化するための新しい動的ハイパーグラフ畳み込み層と、チャネル非依存の時間モデルのためのグループ化された時間畳み込み層を組み込んでいる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:43:29 GMT)
RankAdaptor: Hierarchical Rank Allocation for Efficient Fine-Tuning Pruned LLMs via Performance Model [4.9] そこで我々は,階層的なランクアロケーション手法であるRancedAdaptorを紹介した。
RankAdaptorは、様々なプルーニング設定やLLMアーキテクチャにおいて、最先端のメソッドよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:19:26 GMT)
Tight upper bound of the maximal quantum violation of Gisin's elegant Bell inequality and its application in randomness certification [4.9] ベルの不等式違反は非局所性の存在を意味し、デバイスに依存しないランダム性認証を可能にする。
本稿では、任意の2量子状態に対するギシンのエレガントなベル不等式(EBI)の最大量子違反に対する厳密な上限を導出する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:51:33 GMT)
Exploring Semantic Consistency and Style Diversity for Domain Generalized Semantic Segmentation [4.9] ドメイン一般化セマンティック(Domain Generalized Semantic)は、未知のターゲットドメイン間のセマンティックセグメンテーションの一般化を強化することを目的としている。
本稿では,セマンティック一貫性予測とスタイル多様性の一般化のためのSCSDを紹介する。
SCSDは既存の最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:20:06 GMT)
A Framework for Debugging Quantum Programs [4.7] 量子プログラムの開発には時間と手間がかかる。
開発者がこれらのエラーを解決するのに役立つ新しいツールはまだほとんど存在していない。
本研究は、https://github.com/cda-tum/mqt-gerでオープンソース実装として利用可能なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:00:07 GMT)
Testing Medical Rules Web Services in Practice [4.6] ノルウェーがん登録 (CRN) はノルウェーのがん関連データを収集・処理している。
現在のプラクティスは、CRNのシステムを手動でテストして、障害を防ぎ、信頼性を確保することです。
本稿では、システムレベルのテストツールであるEvoMasterを使用して、CRNの医療ルールエンジンであるGURIの自動テストに焦点を当てる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:54:46 GMT)
Mitigating Challenges in Ethereum's Proof-of-Stake Consensus: Evaluating the Impact of EigenLayer and Lido [4.6] Proof-of-Work(PoW)からProof-of-Stake(PoS)コンセンサスメカニズムへの移行は、ブロックチェーンバリデーションに対する変革的なアプローチを導入している。
本稿では,EigenLayer と Lido の2つの革新的なソリューションについて検討する。
よりレジリエントで包括的なエコシステムを育むために,EigenLayer と Lido の併用の可能性を評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:05:19 GMT)
Comprehensive Survey on Adversarial Examples in Cybersecurity: Impacts, Challenges, and Mitigation Strategies [4.6] 広告敵例(AE)は、ディープラーニングベースのシステムの堅牢性と信頼性に重要な課題を提起する。
本稿では,主要なサイバーセキュリティアプリケーションに対するAE攻撃の影響を概観する。
我々は,近年の防御機構の進歩を探求し,グラデーションマスキング,対人訓練,検出技術について検討した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:54:07 GMT)
Effective Generative AI: The Human-Algorithm Centaur [4.6] 私たちは、多くの分野におけるAI開発と利用の未来は、他のAIアプローチとは対照的に、センタウロスにもっと集中する必要があると論じています。
センタウロス(Centaurs)は、形式分析と人間の直観を共生的に組み合わせたハイブリッドな人間-アルゴリズムモデルである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:37:51 GMT)
AlphaZero Neural Scaling and Zipf's Law: a Tale of Board Games and Power Laws [4.6] 我々は、言語モデルスケーリングの理論を用いて、強化学習アルゴリズムAlphaZeroのパワー・ロースケーリングについて研究する。
学習と推論データにおけるゲーム状態は,環境のツリー構造から生じることが知られているZipfの法則と一致している。
また、逆スケーリング(逆スケーリング)は、サイズを改良するモデルの失敗は、エンドゲーム状態が最も頻繁な状態である特異なZipf曲線と相関していることも見出した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:59:55 GMT)
PhysAug: A Physical-guided and Frequency-based Data Augmentation for Single-Domain Generalized Object Detection [4.6] Single-Domain Generalized Object Detection (S-DGOD) は、オブジェクト検出器を利用することで、さまざまな未確認対象領域にわたる堅牢なパフォーマンスのために、単一のソースドメイン上でトレーニングすることを目的としている。
既存のS-DGODアプローチは、検出器の一般化能力を高めるために、視覚変換の合成を含むデータ拡張戦略に依存することが多い。
本稿では,S-DGODタスクの適応性を高めるために,新しい物理モデルに基づく非理想的撮像条件データ拡張法であるPhysAugを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:18:01 GMT)
Demonstrating Data-to-Knowledge Pipelines for Connecting Production Sites in the World Wide Lab [4.6] 我々は,デジタルシャドウネットワーク上に構築されたユニバーサルなコンセプトビルディングとして,生産のためのデータ-知識パイプラインを提案する(デジタルツインを増強する概念)。
既存のインフラを基盤として,1)異なる組織内の複数の類似しているが独立したロボットの軌跡データと,2)データレイクハウスにおけるユースケースをキャプチャし,意味的に注釈付けする概念実証と,2) ロボット制御のための逆動的基礎モデルをトレーニングするためのマッチングデータを動的にクエリする独立プロセスを示す。
この記事では、このアプローチの課題とメリット、そして研究の展望として、Data-to-KnowledgeパイプラインがWorld Wide Labにおける効率向上と産業のスケーラビリティにどのように貢献するかについて論じる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:36:51 GMT)
DANCE: Deep Learning-Assisted Analysis of Protein Sequences Using Chaos Enhanced Kaleidoscopic Images [4.5] 癌は、制御不能な細胞増殖を特徴とする複雑な疾患である。
T細胞受容体(TCR)は、癌に関連する抗原の認識において重要な役割を担っている。
近年のシークエンシング技術の進歩は、TCRレパートリーの包括的なプロファイリングを促進している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:58:18 GMT)
Conversational Query Reformulation with the Guidance of Retrieved Documents [4.4] 本稿では,最初に検索したドキュメントからキー情報を活用することでクエリを洗練するフレームワークである GuideCQR を紹介する。
提案手法は,複数のデータセットにまたがる最先端性能を実現し,従来のCQR手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:18:16 GMT)
Look Ahead Text Understanding and LLM Stitching [4.4] 本稿では,先進部識別(LASI)を例として,先進部識別(LASI)を用いたテキスト理解問題を提案する。
変換器をベースとしたLLMを用いてこの問題に対処する。
我々は、双方向コンテキスト情報(BERTなど)と一方向予測能力(GPTなど)の両方が、このタスクの恩恵をもたらすと論じている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:32:32 GMT)
Enhancing Healthcare Recommendation Systems with a Multimodal LLMs-based MOE Architecture [4.4] 患者の説明に基づいて健康食品を推奨するための小さなデータセットを構築した。
我々は,精度,リコール,NDCG,MAP@5など,いくつかの重要な指標を用いてモデルの性能を評価する。
本稿では,パーソナライズされたレコメンデーションシステムの性能を比較的限定的に改善した画像データを見出した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:42:43 GMT)
Positivity of state, trace, and moment polynomials, and applications in quantum information [4.4] 状態、トレース、モーメント表現は、いくつかの演算子または確率変数における表現であり、その積上の正の関数である。
量子情報理論の問題から生まれたが、自然に理論の傘の下に収まる。
この調査は、簡潔で統一された方法で状態、トレース、モーメント表現を提示する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:33:42 GMT)
Attention-Seeker: Dynamic Self-Attention Scoring for Unsupervised Keyphrase Extraction [4.3] Attention-Seekerは教師なしキーフレーズ抽出法である。
大規模言語モデルからの自己注意マップを使用して、候補句の重要性を推定する。
公開データセットを4つ評価した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:42:07 GMT)
Take Fake as Real: Realistic-like Robust Black-box Adversarial Attack to Evade AIGC Detection [4.3] 本稿では,後処理の融合最適化を用いた現実的なロバストブラックボックス攻撃(R$2$BA)を提案する。
R$2$BAは優れた抗検出性能,可視性,GANおよび拡散型症例の強い堅牢性を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:28:49 GMT)
Improved Models for Media Bias Detection and Subcategorization [4.2] 英語ニュース記事において,粒度検出およびサブ分類メディアバイアスのための改良されたモデルを提案する。
我々は、ゼロショットと微調整された大型ニューラルトランスフォーマー言語モデルの性能を比較した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:56:31 GMT)
The impact of AI on engineering design procedures for dynamical systems [4.2] 本稿では,VDIガイドライン2206のVモデルを用いて,AIをエンジニアリング設計プロセスに統合する可能性を検討する。
エンジニアリング製品設計ワークフロー内の特定のステージに対する適合性に基づいて、AIメソッドを特定し、分類する。
著者らによってAI支援設計がうまく実装された一連のアプリケーション例を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:26:27 GMT)
Combating Semantic Contamination in Learning with Label Noise [4.2] ノイズラベルはディープニューラルネットワークの性能に悪影響を及ぼす可能性がある。
1つの一般的な解決策はラベル修復であり、予測と分布を通してノイズラベルを再構成する。
これらの手法は、セマンティック汚染(Semantic Contamination)と同一視される現象である問題的セマンティックアソシエーションを導入する可能性がある。
本研究では,再生ラベルに対する半教師付き学習を利用して,ビューやモデルにまたがる埋め込みから適切な意味的関連を抽出する,協調的クロスラーニング(Collaborative Cross Learning)という新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:07:15 GMT)
Learning interactions between Rydberg atoms [4.2] グラフニューラルネットワーク(GNN)を用いたハミルトン学習へのスケーラブルなアプローチを提案する。
我々は、GNNモデルがトレーニング領域を超えて外挿できることを実証した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:45:30 GMT)
Hierarchical Meta-Reinforcement Learning via Automated Macro-Action Discovery [4.1] 複雑なタスクや高次元タスクにまたがってパフォーマンスポリシーを学ぶことは依然として困難である。
本稿では,1)タスク表現の学習,2)タスクに依存しないマクロアクションの自動発見,3)プリミティブアクションの学習という3つの階層レベルの新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:15:36 GMT)
EDformer: Embedded Decomposition Transformer for Interpretable Multivariate Time Series Predictions [4.1] 本稿では,時系列予測タスクのための組込みトランス「EDformer」を提案する。
基本要素を変更することなく、Transformerアーキテクチャを再利用し、その構成部品の有能な機能について検討する。
このモデルは、複雑な実世界の時系列データセットの精度と効率の観点から、最先端の予測結果を得る。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:13:57 GMT)
EditSplat: Multi-View Fusion and Attention-Guided Optimization for View-Consistent 3D Scene Editing with 3D Gaussian Splatting [3.9] MFG(Multi-view Fusion Guidance)とAGT(Attention-Guided Trimming)を統合した新しい3D編集フレームワークである textbfEditSplat を提案する。
我々のMFGは,テキスト・ツー・イメージ拡散モデルと3DGSの幾何学的特性からのフリーガイダンスを利用して,本質的な多視点情報を拡散過程に組み込むことにより,多視点整合性を確保する。
我々のAGTは、3DGSの明示的な表現を活用し、3Dガウスを選択的にプルークし、最適化し、最適化効率を向上し、正確でセマンティックにリッチなローカル編集を可能にする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:56:04 GMT)
Quantum Frequency Mixing using an N-$V$ Diamond Microscope [3.9] 我々は、70MHzまでの交流により駆動される試験構造の広視野磁気画像を生成するために、量子周波数混合を用いる。
さらなる改良により、電子パワースペクトル分析、電子診断とトラブルシューティング、量子コンピューティングハードウェア検証のためのハイパースペクトルイメージングに有用性を見出すことができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:40:17 GMT)
Interpretable, multi-dimensional Evaluation Framework for Causal Discovery from observational i.i.d. Data [3.8] 観測データからの因果発見は、データ生成プロセスで使用される構造方程式の定式化に厳密な識別可能性の仮定を課す。
統合された性能評価フレームワークの欠如により、我々は解釈可能な6次元評価指標、すなわち、最適解の距離(DOS)を導入する。
本研究は、7つの異なる家系における構造学習アルゴリズムの性能を、不特定非非線形因果パターンの割合の増加に基づいて評価する最初の研究である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:09:58 GMT)
Residual-INR: Communication Efficient On-Device Learning Using Implicit Neural Representation [3.8] Residual-INRはフォグコンピューティングに基づく通信効率の高いデバイス上での学習フレームワークである。
データ転送を最大5.16倍に削減する。
また、CPUを使わずにデバイス上での学習を加速し、精度を犠牲にすることなく最大2.9倍のスピードアップを達成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:35:54 GMT)
DART: An AIGT Detector using AMR of Rephrased Text [3.8] DARTは、リフレクション、セマンティックパーシング、スコアリング、マルチクラス分類の4つのステップから構成される。
実験結果から,DARTは統語的特徴を用いることなく,AIGTの起源を知ることなく複数のブラックボックスLDMを識別できることが示唆された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:51:09 GMT)
Privacy in Metalearning and Multitask Learning: Modeling and Separations [3.8] 本研究では,個人別個別学習の体系的研究を行う。
最初の主な貢献は、個人化された学習のための形式的なフレームワークの分類を作ることです。
第2の貢献は、選択の異なるパーソナライズされた学習問題の分離を証明することです。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:07:33 GMT)
Purcell-Enhanced Generation of Photonic Bell States via the Inelastic Scattering of Single Atoms [3.8] 光学キャビティに閉じ込められた単一原子は、将来の量子情報処理において重要なノードとして大きな可能性を秘めている。
ここでは, 単一二層層内原子の非弾性散乱過程を通じて, 真正光子ベル状態の効率よく生成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:48:16 GMT)
GSDiff: Synthesizing Vector Floorplans via Geometry-enhanced Structural Graph Generation [3.8] 建築のフロアプラン設計は住宅やインテリアの設計に不可欠であり、建築家による手作業によるスケッチのより高速で費用対効果の高い代替手段を提供する。
ルールベースおよび学習ベースのアプローチを含む既存の手法は、広範な後処理を伴う設計と制約付き生成の課題に直面している。
本稿では,GSDiffと呼ばれる構造グラフ生成によるベクトル設計のための新しい生成フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:46:03 GMT)
Enhancing Temporal Link Prediction with HierTKG: A Hierarchical Temporal Knowledge Graph Framework [3.7] HierTKGは、キー伝搬フェーズをキャプチャし、時間的リンク予測の改善と誤情報制御のための実行可能な洞察を可能にする。
構造化イベントシーケンスと動的社会的相互作用をモデル化することにより、HierTKGは多様な伝播パターンに対応し、リアルタイム分析と噂の拡散予測のためのスケーラブルで堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:43:41 GMT)
A Theory of Formalisms for Representing Knowledge [3.7] フォーマリズムがAIの知識を表現するのに最適なのかという長年にわたる論争があった。
我々は,私たちが関心を持っている様々な知識表現形式を捉えるための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:13:30 GMT)
LLäMmlein: Compact and Competitive German-Only Language Models from Scratch [3.7] 我々は、2つのドイツ専用デコーダモデル、LL"aMmlein 120Mと1Bを作成し、それらをスクラッチから透過的に公開し、トレーニングデータとともに、ドイツのNLP研究コミュニティが使用できるようにしました。
モデルトレーニングには、広範なデータ前処理、カスタムなドイツのトークン化器の作成、トレーニング自体、および様々なベンチマークの最終モデルの評価など、いくつかの重要なステップが含まれていた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:29:41 GMT)
FedCAR: Cross-client Adaptive Re-weighting for Generative Models in Federated Learning [3.7] フェデレーション学習は、データセンター間で分散データセットをトレーニングするためのプライバシ保護ソリューションである。
FL内における生成モデルの性能向上を目的とした新しいアルゴリズムを提案する。
3つの公開胸部X線データセットの実験結果から,医用画像生成において優れた性能を示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:43:14 GMT)
OpenReviewer: A Specialized Large Language Model for Generating Critical Scientific Paper Reviews [3.7] OpenReviewerは、機械学習とAIカンファレンスの論文の高品質なピアレビューを生成するための、オープンソースのシステムである。
Llama-OpenReviewer-8Bは8Bパラメータ言語モデルで、上位MLカンファレンスから79,000人の専門家レビューに基づいて微調整されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:31:00 GMT)
Quantum observables over time for information recovery [3.6] 本稿では、2つの異なる時間点で2つの観測可能を共同で記述する演算子であるQOOT(Quantum observables Over Time)について紹介する。
我々はQOOTを用いて、参照可観測性に関する汎用量子チャネルの時間反転の概念を確立する。
本稿では,提案プロトコルが参照可観測値のノイズのない期待値を検索し,最適なサンプリングオーバヘッドを実現することを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:02:15 GMT)
Industrial-scale Prediction of Cement Clinker Phases using Machine Learning [3.6] セメントの生産量は410億トンを超え、年間2.4トンのCO2を生産している。
セメント製造の伝統的なプロセスモデルは、鉱物学的相の予測能力に制限のある定常状態に限られている。
ここでは, 産業用セメントプラントからの総合的な2年間の運用データセットを利用して, プロセスデータからクリンカー鉱物学を正確に予測する機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:03:04 GMT)
Characterizing the Networks Sending Enterprise Phishing Emails [3.6] 企業従業員に対するフィッシング攻撃は、組織にとって最もコストがかかり強力な脅威の1つだ。
何千もの企業、数十億のEメール、80万件以上のフィッシング攻撃に関するデータセットを1年間にわたって作成しています。
私たちのデータセットのフィッシングメールの3分の1以上が、AmazonやMicrosoftなど、非常に信頼性の高いネットワークから来ていることが分かりました。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:15:40 GMT)
AMI-Net: Adaptive Mask Inpainting Network for Industrial Anomaly Detection and Localization [3.6] 適応マスク塗装の観点から, ulineAdaptive ulineMask ulineInpainting ulineNetwork (AMI-Net)を提案する。
非意味的画像画素を対象とする従来の再構成手法とは対照的に,本手法では事前学習ネットワークを用いて,再構成対象として多スケールの意味的特徴を抽出する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:12:06 GMT)
A Large Language Model Approach to Identify Flakiness in C++ Projects [3.5] 不安定なテストは非決定的な振る舞いを導入し、回帰テスト結果の信頼性を損なう。
コードレベルでのC++プロジェクトにおけるフレキテストの根本原因を特定するためのLLMベースのアプローチを提案する。
我々は、C++データセットと既存のJavaデータセット上でMistral-7b、Llama2-7b、CodeLlama-7bモデルを微調整し、精度、リコール、精度、F1スコアで性能を評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:20:45 GMT)
Improvement in Sign Language Translation Using Text CTC Alignment [3.5] 本稿では,CTC/AttentionとTransfer Learningを組み合わせた新しい手法を提案する。
共同CTC/Attentionは階層的エンコーディングを導入し、デコード中の注意機構とCTCを統合する。
提案手法は,最先端技術に匹敵する結果を達成し,純アテンションベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:02:51 GMT)
Magnetic Field Data Calibration with Transformer Model Using Physical Constraints: A Scalable Method for Satellite Missions, Illustrated by Tianwen-1 [3.5] 本研究は、天wen-1火星ミッションの磁場データ補正と、マクスウェル方程式に制約されたニューラルネットワークアーキテクチャを統合する新しいアプローチを提案する。
トランスフォーマーモデルを用いることで、衛星力学、機器干渉、環境騒音による計測異常を補正する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:35:40 GMT)
Are Large Language Models Useful for Time Series Data Analysis? [3.4] 時系列データは、医療、エネルギー、金融といった様々な分野において重要な役割を果たす。
本研究では,大規模言語モデル(LLM)が時系列データ解析に有効かどうかを検討する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:47:44 GMT)
Are the Latent Representations of Foundation Models for Pathology Invariant to Rotation? [3.4] デジタル病理学のための自己教師型基礎モデルは、H&E全体からの小さなパッチを下流タスクに使用する潜在表現にエンコードする。
本研究では,12の基底モデルにおける潜在表現の回転不変性について,互いに$k$-アネレスト近傍とコサイン距離を用いて非回転パッチと回転パッチのアライメントを定量化することによって検討した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:23:05 GMT)
A partial likelihood approach to tree-based density modeling and its application in Bayesian inference [3.4] 本稿では,コヒーレンシを復元する上で,候補パーティションをデータ依存にしつつ,簡単な戦略を提案する。
我々の部分的確率的アプローチは、既存の可能性に基づく手法、特に木に基づくモデルに対するベイズ推定に広く適用できる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:10:23 GMT)
RL-MILP Solver: A Reinforcement Learning Approach for Solving Mixed-Integer Linear Programs with Graph Neural Networks [3.4] Mixed-Integer Linear Programming (MILP) は様々な分野で広く使われている最適化手法である。
MILPの既存のエンドツーエンド学習手法は、決定変数のサブセットの値を生成し、残りの問題を従来の解法に委譲する。
そこで本研究では,MILPと対話して,より優れた実現可能な解を段階的に発見する,新しい強化学習(RL)ベースの解法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:33:38 GMT)
Asynchronous Distributed Gaussian Process Regression for Online Learning and Dynamical Systems: Complementary Document [3.3] これは、"Asynchronous Distributed Gaussian Process Regression for Online Learning and Dynamical Systems"と題した論文の補完文書である。
毎週のNewsquizを使って、Newsquizで見たストーリーの知識をテストする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:34:48 GMT)
Against All Odds: Overcoming Typology, Script, and Language Confusion in Multilingual Embedding Inversion Attacks [3.2] 大規模言語モデル(LLM)は、敵、バックドア、侵入攻撃などの侵入を通じて、サイバー攻撃者による悪意ある影響を受けやすい。
本研究では,20言語にまたがる言語間およびクロススクリプト・インバージョン・インバージョン・アタックの文脈における多言語LDMの安全性について検討する。
アラビア文字とキリル文字で書かれた言語は、インド・アーリア語族の言語と同様に、特にインバージョンに弱いことが示唆された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:53:09 GMT)
SPGL: Enhancing Session-based Recommendation with Single Positive Graph Learning [3.1] セッションベースのレコメンデーションは、ユーザが関心を持つ次の項目を、インタラクションシーケンスに基づいて予測する。
従来の手法は、正と負のサンプルを生成するために複雑なモデルを構築することで特徴学習を強化する。
本稿では,Single Positive Optimization loss と Graph Learning を用いたセッションベース推薦モデルを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:08:44 GMT)
QPruner: Probabilistic Decision Quantization for Structured Pruning in Large Language Models [3.1] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクを大幅に進歩させた。
構造化プルーニングはモデルサイズの削減に有効な手法であるが、しばしば精度を著しく低下させる。
我々は、微調整と推論の両方でメモリ消費を減らすために、構造化プルーニングフレームワークに量子化を導入する。
モデルサイズの削減に構造化プルーニングを用いた新しいフレームワークQPrunerを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:14:01 GMT)
Grading Massive Open Online Courses Using Large Language Models [3.1] 大規模なオープンオンラインコース(MOOC)は、世界中で無料の教育を提供している。
ピアグレーディング(Peergrading)は、しばしば直感的なルーリックによって導かれるもので、選択の方法である。
大規模言語モデル(LLM)を用いてMOOCのピアグレーディングを置き換えることの実現可能性について検討する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:50:20 GMT)
Improving Sequential Market Coordination via Value-oriented Renewable Energy Forecasting [3.1] 本稿では,実運用段階においてより効率的にRIEQ(RES Improved Entering Quantities)を決定するために,価値指向予測(value-oriented forecasting)と呼ばれるトレーニングされた予測モデルを提案する。
統計的予測誤差を最小化する従来のモデルとは異なり、我々のアプローチはパラメータを訓練し、DA市場とRT市場の両方で期待される全体の運用コストを最小化する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:34:33 GMT)
A Method for Detecting Legal Article Competition for Korean Criminal Law Using a Case-augmented Mention Graph [3.0] 本稿では,ある法律内で競合する記事を特定することを目的とした,法律記事競合検出(LACD)と呼ばれる新たな法的AIタスクを提案する。
新たな検索手法であるCAM-Re2は、既存の関連手法より優れ、偽陽性が20.8%、偽陰性が8.3%減少する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:59:10 GMT)
Sequence Matters: Harnessing Video Models in Super-Resolution [3.0] 3次元超解像は、低解像度(LR)マルチビュー画像から高忠実度3Dモデルを再構成することを目的としている。
ビデオ超解像モデル(VSR)を利用した3次元超解像の包括的研究を行う。
以上の結果から,VSRモデルでは正確な空間アライメントが欠如している配列でも極めて良好に動作できることが判明した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:00:50 GMT)
TrackFormers: In Search of Transformer-Based Particle Tracking for the High-Luminosity LHC Era [2.9] 高エネルギー物理実験は、新しいイテレーション毎に複数倍のデータの増加に直面している。
このようなオーバーホールが必要なステップの1つは、粒子トラックの再構築、すなわち追跡のタスクである。
機械学習支援ソリューションは、大幅な改善が期待されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:22:23 GMT)
Improving the accuracy of circuit quantization using the electromagnetic properties of superconductors [2.9] 超伝導回路の量子化のための改良手法を提案する。
本手法は, 物質および形状に依存した動的インダクタンスを含む。
薄膜35nmのニオブ薄膜で作製した超伝導素子を用いて,本手法の有効性を実験的に検証した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:46:21 GMT)
QG from SymQRG: AdS$_3$/CFT$_2$ Correspondence as Topological Symmetry-Preserving Quantum RG Flow [2.8] 与えられた対称性を明示的に保存する非摂動的RGフローは、より高次元の$textitSymTFT$の量子パス積分として表現できることを示す。
それぞれの2次元CFTに対して、Wheeler-DeWitt方程式が自然に非摂動制約として現れるSymTFTの対応する基底状態を特定する。
我々は,非摂動性AdS/CFT対応が,位相ホログラフィーの$textitmaximal$形式であることを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:15:11 GMT)
Experimental Acceleration of Spin Transition in Nitrogen-Vacancy Center [2.8] STA(Shortcuts to adiabaticity)は、量子システムの高速かつ堅牢なコヒーレント制御を可能にする。
不変量に基づく逆エンジニアリングは、NVシステムの高速かつ堅牢な操作に有効である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:58:28 GMT)
Cross-Cultural Differences in Mental Health Expressions on Social Media [2.8] インドに居住する個人によるRedditのメンタルヘルス投稿を調査し、Res of the World(RoW)のユーザと比較して、インド特有のソーシャルメディア言語の変化を特定する。
我々の実験は、感情(インドにおける悲しみとRoWにおける不安)、時間的指向(現在インドと西洋における過去に焦点を当てている)、社会文化的側面(素材使用と労働・養育)の有意な精神社会的変化を明らかにした。
本研究は、メンタルヘルスにおける異文化間差異を識別するためのソーシャルメディアプラットフォームの可能性を示すものである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:10:05 GMT)
Asymmetric Learning for Spectral Graph Neural Networks [2.8] スペクトルGNNにおけるグラフ畳み込みパラメータと特徴変換パラメータの相違について検討する。
分析の結果,これらの差異は条件の悪い問題に寄与することが明らかとなり,その結果,準最適性能が得られた。
本研究では,非対称な学習手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:00:49 GMT)
Stabilizing Machine Learning for Reproducible and Explainable Results: A Novel Validation Approach to Subject-Specific Insights [2.8] 本稿では,一般的なMLモデルを用いて再現可能な性能とロバストな特徴重要度分析を保証する新しい検証手法を提案する。
ドメイン、サンプルサイズ、人口統計の異なる9つのデータセットに対して、1つのランダムフォレスト(RF)モデルをテストしました。
被験者レベルでの重要な特徴を一貫して同定し,グループレベルの特徴重要度分析を改善した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:14:26 GMT)
Towards Efficient Training and Evaluation of Robust Models against $l_0$ Bounded Adversarial Perturbations [2.7] スパース・PGDと呼ばれるホワイトボックスのPGDライクな攻撃法を提案し,スパース摂動を生成する。
スパースPGDとブラックボックス攻撃を組み合わせてモデルの堅牢性を評価する。
我々の逆行訓練されたモデルは、様々なスパース攻撃に対する最先端の堅牢性を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:50:59 GMT)
Thermodynamics-informed graph neural networks for real-time simulation of digital human twins [2.7] 本稿では,軟組織シミュレーション研究の進展をめざした新しい手法を提案する。
提案手法は, グラフニューラルネットワークの幾何学的バイアスと, 垂直構造の配置から導かれる物理的バイアスを統合する。
そこで本研究では,ヒト肝臓のトラクションおよび圧縮負荷に対する応答を7.3ミリ秒以内で予測するモデルを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:01:40 GMT)
Matrix Completion via Residual Spectral Matching [2.7] ノイズ行列の完成は、レコメンデーションシステム、信号処理、画像復元などへの応用により、大きな注目を集めている。
本稿では,残差の数値的および位置的情報を含む新しい残差スペクトルマッチング基準を提案する。
スパースランダム行列のスペクトル特性を解析し,低ランク摂動と部分観測の影響を限定することによって,最適統計特性を導出する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:48:34 GMT)
Positive Text Reframing under Multi-strategy Optimization [2.6] 本稿では,流動的で多様なタスク制約のあるリフレーミングテキストを生成するフレームワークを提案する。
我々のフレームワークは、制約なしおよび制御なしのポジティブリフレーミングタスクにおいて、大幅な改善を実現している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:57:12 GMT)
Quantifying Misalignment Between Agents: Towards a Sociotechnical Understanding of Alignment [2.6] 最近の社会技術的アプローチは、複数の人間とAIエージェント間の複雑なミスアライメントを理解する必要性を強調している。
我々は、人間の競合の計算社会科学モデルをアライメント問題に適用する。
我々のモデルは、潜在的に矛盾する目標を持つ多種多様なエージェントグループにおけるミスアライメントを定量化する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:55:37 GMT)
Learning biologically relevant features in a pathology foundation model using sparse autoencoders [2.6] 我々は、病理予知基礎モデルの埋め込みについてスパースオートエンコーダを訓練した。
Sparse Autoencoderの機能は, 解釈可能な, 単意味的な生物学的概念を表す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:02:15 GMT)
Is There No Such Thing as a Bad Question? H4R: HalluciBot For Ratiocination, Rewriting, Ranking, and Routing [2.6] 提案するHaluciBotは,クエリが生成前に幻覚する確率を推定するモデルである。
HalluciBotは、クエリ書き換えのためのプロキシ報酬モデルとして機能する。
複数質問に対して95.7%の出力精度が得られることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:35:31 GMT)
SECOMP: Formally Secure Compilation of Compartmentalized C Programs [2.6] C言語の未定義の動作は、しばしば破壊的なセキュリティ脆弱性を引き起こす。
本稿では,機械チェックによるC言語のコンパイラSECOMPを紹介する。
このような強い基準が主流のプログラミング言語で証明されたのは、これが初めてです。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:19:52 GMT)
RADARSAT Constellation Mission Compact Polarisation SAR Data for Burned Area Mapping with Deep Learning [2.5] 近年の山火事の急激な増加により、山火事のモニタリングがますます重要になっている。
センチネル2やランドサットのような光学衛星は、焼かれた領域のマッピングに広く利用されている。
光センサーの有効性は雲や煙によって損なわれ、燃えた領域の検出を妨げている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:47:55 GMT)
C-R-T Fractionalization in the First Quantized Hamiltonian Theory [2.5] 最近の研究により、フェルミオンのCRT対称性は$mathbbZ5,6,7bmod8$とは異なる分数化を示すことが明らかになった。
異なる質量項が質量多様体にまたがることができるある次元において、CRT-内部対称性はこの質量多様体に対して非自明に作用することができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:41:46 GMT)
Generalized Bayesian deep reinforcement learning [2.5] マルコフ依存を仮定した深部生成モデルを用いて未知環境のダイナミクスをモデル化する。
これらのモデルに対する可能性関数が存在しないため、一般化された予測順序(または述語)スコアリング規則(SR)を学習することでそれらを訓練する。
政策学習では,後部分布に関する期待値関数を最大化することにより,最適な政策を学習するためのトンプソンサンプリング(ETS)を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:02:17 GMT)
Neural general circulation models optimized to predict satellite-based precipitation observations [2.5] 衛星による降水観測を直接訓練したハイブリッドモデルを提案する。
我々のアプローチは、バイアスの低減、より現実的な降水分布、極度の表現の改善をもたらす。
ECMWFアンサンブルの中間降水予測を上回っている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:55:34 GMT)
Dual Unscented Kalman Filter Architecture for Sensor Fusion in Water Networks Leak Localization [2.4] 本稿では,デュアルアンセント・カルマンフィルタ (UKF) を用いた油圧状態推定手法を提案する。
この戦略は、モデナとL-TOWNという有名なオープンソースケーススタディで評価されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:01:08 GMT)
Task-Based Role-Playing VR Game for Supporting Intellectual Disability Therapies [2.4] Space Exodus(スペースエクソダス)は、知的障害児の治療を支援するタスクベースのロールプレイングバーチャルリアリティ(VR)ゲームである。
ゲームは日常のシナリオを没入型環境に統合し、スキル獲得と移行を強化する。
結果は、VRをID治療の有望なツールとして支持する実証的な証拠を提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:46:00 GMT)
The Impact of Generalization Techniques on the Interplay Among Privacy, Utility, and Fairness in Image Classification [2.3] 近年の研究では、一般化技術はプライバシとユーティリティのバランスを改善することが示唆されている。
合成および実世界のバイアスのあるデータセットで訓練されたプライベートおよび非プライベート学習モデルの公平性を検証した。
我々は、正確さ、プライバシー、公平さを1つの尺度に組み合わせた、新しい測度、"Emphharmonic score"を導入する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:35:31 GMT)
TS-SatFire: A Multi-Task Satellite Image Time-Series Dataset for Wildfire Detection and Prediction [2.3] 2017年1月から2021年10月まで、米国内の山火事をカバーし、3552面の反射率画像と補助データ、合計71GBである。
このデータセットは3つのタスクをサポートする。アクティブファイア検出、毎日の燃えているエリアマッピング、および山火事の進行予測だ。
このデータセットとそのベンチマークは、ディープラーニングを使って山火事の研究を進める基盤を提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:40:12 GMT)
Bilevel Learning with Inexact Stochastic Gradients [2.2] バイレベル学習は、機械学習、逆問題、イメージングアプリケーションで有名になった。
これらの問題の大規模な性質は、不正確な計算効率の手法の開発に繋がった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:18:47 GMT)
Ensemble Learning and 3D Pix2Pix for Comprehensive Brain Tumor Analysis in Multimodal MRI [2.1] 本研究では,ハイブリッドトランスモデルと畳み込みニューラルネットワーク(CNN)を用いたアンサンブル学習の強みを活用した統合的アプローチを提案する。
本手法は,アキシャルアテンションとトランスフォーマーエンコーダを併用して,高機能な空間関係モデリングを行う。
その結果,Dice similarity Coefficient (DSC), Hausdorff Distance (HD95), Structure similarity Index Measure (SSIM), Peak Signal-to-Noise Ratio (PSNR), Mean-Square Error (MSE) などの画期的な評価が得られた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:10:53 GMT)
Codenames as a Benchmark for Large Language Models [2.1] 一般的な単語ベースのボードゲームであるCodenamesを,大規模言語モデルの推論能力を評価するための適切なベンチマークとして使用しています。
我々は,GPT-4o,Gemini 1.5,Claude 3.5 Sonnet,Llama 3.1など,最先端のLLMの能力を評価する。
以上の結果から, ゲームプレイ中に異なるモデルが出現し, 特定の役割に優れることが示唆された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:59:03 GMT)
Quantum open system identification via global optimization: Optimally accurate Markovian models of open systems from time-series data [2.1] オープンデータを用いて量子システムを識別する方法を示す。
モーメント/サム・オブ・2乗法を用いて最適化することで,正確な減衰システムが得られることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:41:02 GMT)
Alternate Preference Optimization for Unlearning Factual Knowledge in Large Language Models [2.1] 機械学習は、特定のトレーニングデータの影響をモデルから効率的に排除することを目的としている。
既存の未学習手法は, 無視集合に関連する応答を抑制するために, 負のフィードバックのみに頼っている。
本稿では,AltPO(Alternate Preference Optimization)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:06:42 GMT)
Parallel Greedy Best-First Search with a Bound on the Number of Expansions Relative to Sequential Search [2.1] PUHF は, 逐次 GBFS で拡張された状態数と, 最悪ケースのタイブレング戦略との定数倍数で束縛されていないことを示す。
提案手法は,拡張された状態の数が連続GBFSで拡張された状態の数に一定の範囲内にあることを保証する並列グリージー検索である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:39:59 GMT)
From Automation to Cognition: Redefining the Roles of Educators and Generative AI in Computing Education [2.1] Generative Artificial Intelligence(GenAI)は、コンピュータ教育(CE)における教育と学習に革命をもたらす機会を提供する
しかし、教育者は、学生がGenAIを過度に信頼し、これらのツールを使って学習プロセスに携わることなくソリューションを生成するのではないかという懸念を表明している。
本稿では、CSに着目した教育環境におけるGenAIの使用経験と、それに従って実施した変化について述べる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:36:25 GMT)
HyperPg -- Prototypical Gaussians on the Hypersphere for Interpretable Deep Learning [2.1] ProtoPNetは、トレーニング画像から既知のプロトタイプ部品を“見た目”で学習し、予測力とケースベースの推論の固有の解釈可能性を組み合わせる。
この研究は、潜在空間の超球面上のガウス分布を利用した新しいプロトタイプ表現であるHyperPgを導入する。
CUB-200-2011とStanford Carsデータセットの実験では、HyperPgNetが他のプロトタイプ学習アーキテクチャより優れていることが示されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:28:02 GMT)
Can Language Models Rival Mathematics Students? Evaluating Mathematical Reasoning through Textual Manipulation and Human Experiments [2.0] 我々は,LLaMA-2,LLaMA-3.1,GPT-4,Mixtralを,数学オリンピアードの経験のあるヒトの生徒や大学生と比較した。
その結果, GPT-4 に基づくモデルでは, 正解率が他のモデルよりも優れており, 問題の数学的変動は人間よりも有意に優れていた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:54:06 GMT)
Investigating Mixture of Experts in Dense Retrieval [2.0] 最終トランスフォーマー層の出力後,単一のMoEブロック(SB-MoE)を統合するアーキテクチャについて検討する。
MoEブロックを追加せずに4つのベンチマークコレクションに3つのDRM(TinyBERT、BERT、Contriever)を微調整します。
SB-MoEは4つのベンチマークで微調整された基礎モデルを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:20:13 GMT)
LawLuo: A Multi-Agent Collaborative Framework for Multi-Round Chinese Legal Consultation [2.0] LawLuoは、マルチターン中国の法律相談のためのマルチエージェントフレームワークである。
LawLuoには、ユーザの意図を評価して弁護士エージェントを選択する受付エージェントと、ユーザと対話する弁護士エージェントと、会話記録を整理して相談報告を生成する秘書エージェントと、4つのエージェントが含まれている。
これらのエージェントの相互作用は、実際の法律事務所の運営を模倣している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:53:28 GMT)
Efficient Object-centric Representation Learning with Pre-trained Geometric Prior [2.0] 本稿では、幾何学的理解を重視し、事前学習された視覚モデルを利用して物体発見を促進する弱教師付きフレームワークを提案する。
本手法では,オブジェクト中心学習に特化して設計された効率的なスロットデコーダを導入し,露骨な深度情報を必要としない多目的シーンの効率的な表現を可能にする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:01:35 GMT)
PointNet with KAN versus PointNet with MLP for 3D Classification and Segmentation of Point Sets [1.9] Kolmogorov-Arnold Networks(KAN)は、ディープラーニングフレームワークにおける従来のマルチレイヤパーセプトロン(MLP)に代わるものとして、最近注目を集めている。
我々は従来のネットワークの代わりに Kan を用いる PointNet-KAN を紹介する。
我々は、Lagrange、Chebyshev、Gegenbauersなど、様々な種類のPointNet-KANを評価した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:15:53 GMT)
Adapting Segment Anything Model (SAM) to Experimental Datasets via Fine-Tuning on GAN-based Simulation: A Case Study in Additive Manufacturing [1.9] Segment Anything Model (SAM) は汎用画像セグメンテーション用に設計されている。
本研究では,添加物製造部品の工業用X線CT検査におけるSAMの適用と限界について検討する。
本稿では,パラメータ効率の高い手法,特にConv-LoRaを用いてSAMを材料固有のデータセットに適用するための微調整手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:11:19 GMT)
Virtual Agent-Based Communication Skills Training to Facilitate Health Persuasion Among Peers [1.8] 本稿では,バーチャルエージェントを用いて,地域ボランティアの健康カウンセリングを指導する手法を提案する。
我々は、このアプローチを仮想エージェントベースのシステムで、新型コロナウイルスの予防接種を増やすために使用します。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:34:32 GMT)
BetaExplainer: A Probabilistic Method to Explain Graph Neural Networks [1.8] グラフニューラルネットワーク(GNN)は、グラフデータに対する推論を行う強力なツールである。
多くの解釈可能なGNN法が存在するが、エッジウェイトの不確かさを定量化することはできない。
マスクが重要でないエッジに先立って,これらの問題に対処するBetaExplainerを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:45:26 GMT)
Deep Random Features for Scalable Interpolation of Spatiotemporal Data [1.8] 地球観測システムの急速な成長は、リモートセンシング観測を補間するためのスケーラブルなアプローチを要求する。
ガウス過程(GP)はスケーラブルな補間のための候補モデル選択である。
GPは通常、その表現性を制限する推論のための点の誘導に依存する。
深層GPはこの問題を克服することができ、トレーニングや推論は困難である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 00:32:04 GMT)
MT-LENS: An all-in-one Toolkit for Better Machine Translation Evaluation [1.8] MT-LENSは、様々なタスクで機械翻訳(MT)システムを評価するために設計されたフレームワークである。
ユーザーフレンドリーなプラットフォームを提供し、システムを比較し、翻訳をインタラクティブな視覚化で分析する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:57:28 GMT)
Hybrid quantum network for sensing in the acoustic frequency range [1.7] 量子光学センシングの適用性は、しばしば利用可能なフォトニック量子源の固定波長によって制限される。
ここでは、量子状態処理によるブロードバンド量子センシングのための新しいツールを示す。
異なる波長における測定のための周波数依存性・絡み合い可能な量子ノイズ低減効果を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:45:44 GMT)
The Impact of AI Assistance on Radiology Reporting: A Pilot Study Using Simulated AI Draft Reports [1.7] 放射線学者は、画像量の増加に伴い作業負荷が増加し、燃え尽きや報告の遅れのリスクが生じる。
人工知能(AI)をベースとした自動放射線学レポート生成では、ワークフロー最適化の報告が約束されているが、臨床精度と効率に対する実際の影響の証拠は限られている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:10:49 GMT)
BioRAGent: A Retrieval-Augmented Generation System for Showcasing Generative Query Expansion and Domain-Specific Search for Scientific Q&A [1.7] 本稿では,生物医学的質問応答のための対話型Webベース検索拡張生成システムであるBioRAGentについて述べる。
このシステムは、クエリ拡張、スニペット抽出、回答生成に、ソースドキュメントへの引用リンクを通じて透明性を維持しながら、大きな言語モデル(LLM)を使用する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:09:28 GMT)
Beyond adaptive gradient: Fast-Controlled Minibatch Algorithm for large-scale optimization [1.7] そこで我々は,F-CMA,F-Controlled Mini-batchアルゴリズムを導入し,各エポックあたりの損失低減を確保するために,十分な減少条件とライン探索手順を備えたランダムリシャッフル法を提案する。
テストでは、トレーニング時間全体の68%の削減、エポック毎の効率の最大20%向上、モデル精度の最大5%向上など、大幅な改善が見られた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:06:00 GMT)
A Bilevel Optimization Framework for Imbalanced Data Classification [1.6] 合成データによるノイズや重なりの落とし穴を回避する新しいアンダーサンプリング手法を提案する。
多数データをランダムにアンサンプするのではなく、モデル損失を改善する能力に基づいてデータポイントをアンアンサンプする。
本手法は,モデル損失の改善を指標として,データポイントが損失に与える影響を評価し,それを改善することができない者を拒絶する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:27:06 GMT)
COBRA -- COnfidence score Based on shape Regression Analysis for method-independent quality assessment of object pose estimation from single images [1.5] そこで本研究では,6次元オブジェクトのポーズ推定を汎用的に評価する手法を提案する。
提案手法は観測対象の幾何学における相違点の評価に依存する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:21:03 GMT)
Probing entanglement dynamics and topological transitions on noisy intermediate-scale quantum computers [1.5] 我々は、IBM量子コンピュータ上のSu-Schrieffer-Heeger鎖のクエンチダイナミクスをシミュレートする。
我々はR'enyiエンタングルメントエントロピー、ツイストオーダーパラメータ、ベリー位相を計算する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:06:06 GMT)
Slice it up: Unmasking User Identities in Smartwatch Health Data [1.5] 本稿では、時系列健康データに対する類似性に基づく動的時間ワープ(DTW)再識別攻撃のための新しいフレームワークを提案する。
私たちの攻撃はトレーニングデータとは独立しており、1つのCPUコア上で1万の被験者に対して約2分で類似性ランキングを計算します。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:29:20 GMT)
Fully Dynamic Graph Algorithms with Edge Differential Privacy [1.5] 完全動的更新を伴う連続リリースの難易度設定において,グラフを解析するための差分プライベートアルゴリズムについて検討した。
これまでの研究では、挿入のみや削除のみを処理できる多くのグラフ問題に対して、差分プライベートなアルゴリズムが提案されてきた。
いくつかの基本グラフ問題に対して、事象レベルとアイテムレベルの完全動的アルゴリズムの誤差について、上下境界を与える。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:26:50 GMT)
Prompto: An open source library for asynchronous querying of LLM endpoints [1.4] promptoはオープンソースのPythonライブラリで、LLM(Large Language Model)エンドポイントの非同期クエリを容易にする。
我々のライブラリーは、研究者や開発者がより効果的にLLMと対話し、実験、データ生成、評価を高速に行えるようにします。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:26:21 GMT)
Precise Length Control in Large Language Models [1.4] 大規模言語モデル(LLM)は、プロダクションシステムでますます使われている。
本稿では,事前学習したデコーダのみのLCMを応答長の正確な制御に適応させる手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:22:27 GMT)
Coherent information as a mixed-state topological order parameter of fermions [1.4] 誤差補正可能な位相における量子メモリは、マヨラナゼロモードの存在によってキャプチャされる。
我々の研究は、安定符号における量子情報の堅牢性と対称性に保護されたフェルミオン物質における混合状態トポロジカル相転移とのより広範な関係を示唆している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:00:20 GMT)
Structured Extraction of Real World Medical Knowledge using LLMs for Summarization and Search [1.3] 大規模モデル抽出手法を用いて患者知識グラフを作成することを提案する。
提案手法は,既存の階層(SHMe,SNOMED-CT RxNORM,HPO)から抽出されたエンティティにマップする。
患者固有の知識グラフの構築と症状に基づく患者検索について述べる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:57:00 GMT)
DenseSeg: Joint Learning for Semantic Segmentation and Landmark Detection Using Dense Image-to-Shape Representation [1.3] 本稿では,ランドマークとセマンティックセグメンテーションの併用学習を可能にする画像と形状の濃密な表現を提案する。
本手法では,解剖学的対応の表現による任意のランドマークの抽出を直感的に行うことができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:53:50 GMT)
Security Properties for Open-Source Hardware Designs [1.3] 4つの共通設計に対してSystemVerilog Assertionsを提供する。
プロパティは設計によって整理され、セキュリティ欠陥と関連するCWEの詳細がタグ付けされている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:52:14 GMT)
TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation [1.3] 本稿では,より少ない推論コストのモデルを用いて,大規模言語モデルからの短い蒸留出力をフルナラティブに再構成する,計算コストの削減のためのパイプラインを提案する。
実験の結果、特に20.58%のトークンを平均で保存し、評価基準を小さくする一般知識領域において有望な結果が得られた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:06:25 GMT)
Bayesian Surrogate Training on Multiple Data Sources: A Hybrid Modeling Strategy [1.2] 代理訓練中にシミュレーションデータと実世界の計測データを統合するための2つの新しい手法を提案する。
第1の方法は、各データソースに対するサロゲートモデルを訓練し、予測分布を組み合わせ、第2の方法は、単一のサロゲートをトレーニングすることで、両方のデータソースを組み込む。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:27:28 GMT)
Whisper-GPT: A Hybrid Representation Audio Large Language Model [1.2] 音声と音楽のための生成的大規模言語モデル(LLM)により,単一アーキテクチャの一部として連続的な音声表現と離散トークンを同時に扱うことができる。
我々は,次のトークン予測において,我々のアーキテクチャが難易度と負のログライクなスコアを,音声と音楽のトークンベースのLLMと比較していかに改善するかを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:03:48 GMT)
Application of Quantum Pre-Processing Filter for Binary Image Classification with Small Samples [1.2] 提案する量子前処理フィルタ(QPF)のバイナリ画像分類への応用について検討した。
MNIST(手書き桁)、EMNIST(手書き桁とアルファベット)、CIFAR-10(写真画像)、GTSRB(実生活交通標識画像)の4つのデータセットでQPFを評価した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:04:38 GMT)
Error and Resource Estimates of Variational Quantum Algorithms for Solving Differential Equations Based on Runge-Kutta Methods [1.2] 我々は、エラーソースを広範囲に分析し、特定のターゲットエラーを達成するために必要なリソース要件を決定する。
ショットノイズのないシナリオに対する分析誤差と資源推定を導出する。
従来の1ドルの常微分方程式の解法と,変分アルゴリズムによる線形偏微分方程式の解法である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:00:03 GMT)
Relativistic particles in super-periodic potentials: exploring graphene and fractal systems [1.2] 超周期繰り返しの矩形ポテンシャル障壁に遭遇するスピンレスクライン粒子の反射・透過確率を計算した。
グラフェン単層膜における実験で実現可能な質量を持たないディラック電子の挙動を解析的に検討した。
その結果,送信確率は障壁の数と超周期性の順序に依存する一連の共鳴を示すことが明らかとなった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:42:43 GMT)
AutoSciLab: A Self-Driving Laboratory For Interpretable Scientific Discovery [1.2] AutoSciLabは、自律的な科学実験を駆動するための機械学習フレームワークである。
これは高次元空間における科学的発見を目的とした代理研究者を形成する。
オープンエンドなナノフォトニクスの課題に私たちのフレームワークを適用することで、AutoSciLabは、非コヒーレント発光を誘導する根本的に新しい方法を発見しました。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:41:46 GMT)
Simultaneous measurement of multimode squeezing [1.2] マルチモード圧縮光は、フォトニック量子技術においてますます人気のあるツールである。
本稿では,複数の空間モードで同時にスキューズを計測する方法を実験的に示す。
我々は,最高値の5.2 pm 0.2$dB,最高値の8.6 pm 0.3$dBを得る。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:06:17 GMT)
Let your LLM generate a few tokens and you will reduce the need for retrieval [1.1] 大規模言語モデル(LLM)は、パラメトリックメモリに解答がすでに格納されているかどうかをトレーニングすることができる。
IK(I Know)スコアを計算するためにLLM-as-a-judgeを蒸留する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:13:14 GMT)
InfraLib: Enabling Reinforcement Learning and Decision-Making for Large-Scale Infrastructure Management [1.0] InfraLibは、インフラ管理の問題をモデリングし分析するためのオープンソースのモジュラーフレームワークである。
階層的で劣化したモデルを実装し、現実的な部分的な可観測性をサポートし、実用的な制約を処理する。
InfraLibは、専門家データ収集とポリシー評価のためのツールとともに、意思決定アプローチのベンチマークのための標準化された環境を提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:32:49 GMT)
Gatemon Qubit Revisited for Improved Reliability and Stability [1.0] ゲート可変超伝導トランスモン量子ビット(ゲートモン)は、そのような超伝導回路のパラダイム的な例である。
その結果,ゲートモンは印加されたゲート電圧に対して不安定でヒステリックなクビットに悩まされ,コヒーレンス時間が短縮されることがわかった。
我々は,数GHz帯で1MHzの精度でキュービット周波数の高信頼性チューニングを実現し,フローティングコンデンサ設計のゲートモンに比べてグラウンドドゲートモンの安定性が向上した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:51:46 GMT)
Dynamical systems and complex networks: A Koopman operator perspective [1.0] クープマン・オペレーターはここ数年、多くの研究分野に参入してきた。
無限ネットワークによる非線形系を表現するという概念がラプラシアンにどのように変換されるかを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:28:23 GMT)
Bridging the Gap: Enhancing LLM Performance for Low-Resource African Languages with New Benchmarks, Fine-Tuning, and Cultural Adjustments [0.9] 本稿では,8つの低リソースアフリカ言語において,約100万の人文翻訳語を新たにベンチマークデータとして生成する。
我々のベンチマークはウィノグランデの翻訳とMMLUの3つのセクション(大学医学、臨床知識、ウイルス学)である。
翻訳されたベンチマークを用いて、英語とアフリカ語におけるSOTA(State-of-the-art LLM)のパフォーマンスギャップについて報告する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:50:21 GMT)
Execution-Based Evaluation of Natural Language to Bash and PowerShell for Incident Remediation [0.9] 生成されたコードが構文的かつ意味論的に正しいか、意図した通りに正しく実行できるかを確認することは重要である。
大規模言語モデルによって生成されたコードの品質を評価するための現在の手法は、表面形状の類似度指標に大きく依存しています。
Bashを評価するための3つのテストスイートを作成した最初の実行ベース評価プラットフォームを提示する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:13:26 GMT)
Android App Feature Extraction: A review of approaches for malware and app similarity detection [0.9] 本稿では,2002年から2022年にかけてのAndroidマルウェア,クローン,類似性検出の分野における研究をレビューする。
既存の研究で使用されるデータソース、ツール、機能を調べ、包括的なクロスドメインデータセットの必要性を特定する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:20:29 GMT)
Combining Large Language Models with Tutoring System Intelligence: A Case Study in Caregiver Homework Support [0.9] 我々は,Large Language Model (LLM) が生成する会話レコメンデーションを通じて,介護者に対して指導支援を行うシステムを開発する。
教師システムからリアルタイムの問題解決コンテキストを学習プラクティスの例と組み合わせることで、望ましいメッセージレコメンデーションが得られた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:22:40 GMT)
Blockchain in Environmental Sustainability Measures: a Survey [0.9] ブロックチェーンの応用を、温室効果ガスの排出、固体廃棄物、水、プラスチック、食品廃棄物、循環経済など、さまざまな分野の関心事に分類する。
最後に、今後の研究に残るニッチと課題について論じる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:28:45 GMT)
Optimal Gradient Checkpointing for Sparse and Recurrent Architectures using Off-Chip Memory [0.8] 本稿では,スパースRNNとスパイキングニューラルネットワークの一般クラスに適したメモリ効率の高い勾配チェックポイント戦略を提案する。
再計算のオーバーヘッドを最小限に抑えながら、ローカルメモリリソースの使用を最適化し、Double Checkpointingが最も効果的な方法であることが判明した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:23:31 GMT)
Large-scale Group Brainstorming using Conversational Swarm Intelligence (CSI) versus Traditional Chat [0.8] Conversational Swarm Intelligence (CSI) は、リアルタイムな会話の議論と優先順位付けを可能にするAIに精通した手法である。
本研究では,75人のグループ間でリアルタイムのブレインストーミングと優先順位付けを可能にする,ThinkscapeというCSIプラットフォームの利用に焦点を当てた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:11:25 GMT)
Improving Cooperation in Language Games with Bayesian Inference and the Cognitive Hierarchy [0.8] 言語ゲームでは、失敗は発話の意味論または実用論の理解の相違による可能性がある。
言語モデルの事前分布を用いて意味論における粗い不確かさをモデル化し、認知階層を用いて実用論における不確かさをモデル化する。
あらゆる形の不確実性を扱うために、ベイズ推論を用いてパートナーの振る舞いを学ぶエージェントを構築する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:24:12 GMT)
Apriori Knowledge in an Era of Computational Opacity: The Role of AI in Mathematical Discovery [0.8] 我々は、現代のLLMとDNNの不透明さは、それらの数学的知識を得るのに障害をもたらすと論じる。
しかし、人間の証明チェックを自動化した証明チェッカーがそのような機械に取り付けられている場合、それらからアプリロリの数学的知識を得ることができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:31:15 GMT)
Analyzing Images of Legal Documents: Toward Multi-Modal LLMs for Access to Justice [0.8] 大規模言語モデル(LLM)は、このギャップに対処する可能性を持つ強力な技術として登場した。
本稿では,多モードLCMを用いた手書き紙の画像解析について検討する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:58:27 GMT)
$G$-Mapper: Learning a Cover in the Mapper Construction [0.8] Mapperアルゴリズムは、与えられたデータセットの構造を反映したグラフを出力するトポロジカルデータ解析(TDA)の可視化技術である。
本稿では,正規性に関する統計的テストに従って繰り返し被覆を分割することで,Mapperグラフの被覆を最適化するアルゴリズムを提案する。
我々のアルゴリズムは,アンダーソン・ダーリング試験を反復的に適用することにより,$k$-meansの最適なクラスタ数を探索する$G$-meansクラスタリングに基づいている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:58:17 GMT)
Sound Classification of Four Insect Classes [0.7] このプロジェクトの目的は、シカ、カブトムシ、シロアリ、クリケットの4つの異なる音を分類することである。
このプロジェクトの1つの応用は、害虫のコントロールが私たちのエコシステムを監視し、保護することです。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:03:28 GMT)
Multi-channel, tunable quantum photonic devices on a fiber-integrated platform [0.7] 我々は、複数の調整可能な量子フォトニックデバイスを実現するためのブレークスルーを提示する。
我々のファイバ集積量子プラットフォームは、テレコム波長の小型ファイバチップ内で、スケーラブルで信頼性の高い単一光子アレイを実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:37:52 GMT)
Explicit and Implicit Graduated Optimization in Deep Neural Networks [0.7] 本稿では,最適雑音スケジューリングを用いた明示的な累積最適化アルゴリズムの性能を実験的に評価する。
さらに、ResNetアーキテクチャを用いた画像分類タスクの実験を通じて、その効果を実証する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:23:22 GMT)
The dark side of the forces: assessing non-conservative force models for atomistic machine learning [0.7] 顕微鏡シミュレーションにおける非保守モデルの適用性について検討する。
エネルギー保存の欠如は、学習し、制御し、正しいことが難しい。
直接力評価によって得られる加速度を利用する最善の方法は、それを保守的なモデルと組み合わせて使うことであるかもしれない。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:55:03 GMT)
Krony-PT: GPT2 compressed with Kronecker Products [0.6] 我々はKronecker ProductsをベースにしたGPT2 citepradford 2019の圧縮技術であるKrony-PTを紹介する。
具体的には、元のトランス層の層を対象とし、フィードフォワード層を様々な程度に体系的に圧縮する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:44:01 GMT)
The suboptimality ratio of projective measurements restricted to low-rank subspaces [0.6] 本稿では,2つの量子状態間の平均距離を最小化するProcrustes問題から生じる準最適性について理論的に検討する。
部分最適比は全空間の次元とは独立であり、ローランク部分空間の次元において最も多対数的であることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:35:21 GMT)
Habit Coach: Customising RAG-based chatbots to support behavior change [0.6] Habit Coachは、パーソナライズされたインタラクションを通じて、ユーザの習慣の変化をサポートするように設計されている。
本研究では,言語モデルを再学習することなく,行動のパーソナライズを可能にするRAG(Retrieval-Augmented Generation)システムを開発した。
開発プロセスにおける重要な課題は、宣言的知識を効果的な相互作用行動に変換することの難しさだった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:16:54 GMT)
Scaled Conjugate Gradient Method for Nonconvex Optimization in Deep Neural Networks [0.6] ディープニューラルネットワークを用いた非最適化問題の解法として,スケールド共役勾配法を提案する。
提案手法は,画像分類やテキスト分類の実用化において,共役勾配法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:57:23 GMT)
F-RBA: A Federated Learning-based Framework for Risk-based Authentication [0.6] 我々は,フェデレート・ラーニングを活用し,プライバシ中心のトレーニングを保証するフェデレート・リスクベース認証(F-RBA)フレームワークを提案する。
F-RBAは、リスクアセスメントをユーザーのデバイス上でローカルに行う分散アーキテクチャを導入している。
統一されたユーザプロファイルを維持しながらデバイス間でのリアルタイムリスク評価を容易にすることで、F-RBAはデータ保護、セキュリティ、スケーラビリティのバランスを実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:42:30 GMT)
Experimental demonstration of improved quantum optimization with linear Ising penalties [0.6] 我々は、線形イジング項のみを含む代替ペナルティ法を検討し、それを顧客データサイエンス問題に適用する。
我々は,線形イジングペナルティ法は量子最適化の性能を向上させるべきであるという仮説を支持した。
多くの制約がある場合、全ての罰則を線形にすることは不可能であり、線形の罰則と二次の罰則を組み合わせるための戦略について検討する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:01:39 GMT)
Simulation Based Bayesian Optimization [0.6] 本稿では,獲得関数を最適化するための新しいアプローチとして,シミュレーションベースベイズ最適化(SBBO)を提案する。
GPは後続予測分布への解析的アクセスを提供するため、サロゲートモデルとして一般的に使用される。
本研究では,SBBOの有効性を種々の代理モデルを用いて実証的に実証する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:55:12 GMT)
AgroXAI: Explainable AI-Driven Crop Recommendation System for Agriculture 4.0 [0.5] 我々は、農業分野の運用効率と生産性を向上させるために、IoT(Internet of Things)、機械学習(ML)、説明可能な人工知能(XAI)などの新興技術を採用しています。
具体的には、気候や土壌条件に基づいて、地域に適した作物を提示するエッジコンピューティングによる説明可能な作物推薦システムAgroXAIを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:18:10 GMT)
Quantum optimization with linear Ising penalty functions for customer data science [0.5] 量子アルゴリズムでは、制約は典型的には2次ペナルティ関数で実装される。
このペナルティ法は大きなエネルギースケールを導入し、相互作用グラフをより密にすることができる。
線形イジングペナルティ関数は、物理資源をより効率的に利用するための制約を実装する代替手法であると考えている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:38:20 GMT)
A Comprehensive Review of Adversarial Attacks on Machine Learning [0.5] 本研究は、AIモデルとMLモデルに対する敵攻撃の包括的概要を提供し、様々な攻撃タイプ、テクニック、潜在的な害を探索する。
実用的な洞察を得るためには、自動運転車のような現実世界のユースケースに対する攻撃をシミュレートするために、Adversarial Robustness Toolbox(ART)ライブラリを使用します。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:27:54 GMT)
Circuit-based leakage-to-erasure conversion in a neutral atom quantum processor [0.5] 計算部分空間からの漏れは、現在の最先端の原子-原子量子コンピュータの大きな限界である。
リーク検出ユニット(LDU)によるリークエラーから消去エラーへの回路ベース変換を実証する。
LDUは、装置の技術的欠陥によって制限された93.4%の精度で原子損失誤差を検出する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:50:46 GMT)
But Can You Use It? Design Recommendations for Differentially Private Interactive Systems [0.5] この研究は、公共政策を伝えるために、異なるプライベートな対話システムを開発するための障壁を概説し、考察する。
プライバシ保証,統計ユーティリティ,システムのユーザビリティという,3つの設計上の考慮事項のバランスをとることを提案する。
我々の研究は、公共政策の立案と今後の研究のきっかけとなるために、差別化されたプライベートな対話システムの実践的開発を前進させようとしている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:07:16 GMT)
Bias Vector: Mitigating Biases in Language Models with Task Arithmetic Approach [0.5] 本稿では,これらのLMバイアスを緩和するためのバイアスベクトル法を提案する。
提案手法の3つのステップは,(1) マスク言語モデルを用いて事前学習したLMをバイアス付きデータ上で連続的にトレーニングすること,(2) バイアス付きLMの重みと事前学習したLMの重みとの差としてバイアスベクトルを構築すること,(3) バイアス付きLMの重みからバイアスベクトルを減算すること,である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:38:23 GMT)
GHIssuemarket: A Sandbox Environment for SWE-Agents Economic Experimentation [0.5] ピアツーピアの経済システムは、直接取引を可能にし、経済的自由と傾きを育むことによって個人に権限を与える。
ソフトウェアエンジニアリングエージェント (swe-agents) は、業界における支援から主要な役割への転換に向けたプログラムの終了に関する議論の場に置かれている。
筆者らによる経済実験のための制御された仮想環境であるグアズマーケットサンドボックスについて紹介する。
ソフトウェアアーティファクトをオープンソース化し、サンドボックスのエンジニアリング決定について議論し、swe-agentsの経済調査を提唱します。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:44:42 GMT)
Sonar-based Deep Learning in Underwater Robotics: Overview, Robustness and Challenges [0.5] 水中でのソナーの使用は、限られた訓練データと固有のノイズが特徴であり、頑丈さをモデル化する上での課題となっている。
本稿では,分類,物体検出,セグメンテーション,SLAMなどのソナーベース認知タスクモデルについて検討する。
ソナーベースの最先端データセット、シミュレータ、ニューラルネットワーク検証、アウト・オブ・ディストリビューション、敵攻撃などの堅牢性メソッドを体系化する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:03:08 GMT)
DriveGazen: Event-Based Driving Status Recognition using Conventional Camera [0.5] 運転者の視線観測から運転状況を特定するために、照明条件の変化に頑健な新しいリアルタイム手法とともに、ウェアラブル運転状況認識装置とオープンソースデータセットを導入している。
提案手法のコアは,従来の強度フレームからイベントフレームを生成することであり,もう1つは,新たに設計された注意運転状態ネットワーク(ADSN)である。
我々の知る限りでは、従来のカメラから生成されたガイドアテンションスパイクニューラルネットワークとアイベースのイベントフレームを利用してステータス認識を行うのが初である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:12:11 GMT)
Learning Equivariant Maps with Variational Quantum Circuits [0.5] 幾何学的量子機械学習は、データ固有の対称性を使用して、カスタマイズされた機械学習タスクを設計する。
この研究は、有限群の2つのユニタリ表現が与えられた同変写像を学ぶという関連する問題を探求する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:37:53 GMT)
ChronoFlow: A Data-Driven Model for Gyrochronology [0.5] ジャロクロノロジー(英: Gyrochronology)は、恒星の周期を回転周期で制限する技法であり、磁気ブレーキによって恒星の主系列寿命が変化する。
我々はこれまでに、オープンクラスタにおけるローターの最も大きな標準化されたデータカタログを、1.5 Myrから4 Gyrまでの30個のオープンクラスタ/アソシエーションにまたがる7,400個の星からなる、オープンクラスタにまとめてきた。
クロノフローは、モデル回転進化を正確に前進させ、星団年齢と個々の恒星年齢の両方を推定するために使用できることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:00:00 GMT)
Is Self-Supervision Enough? Benchmarking Foundation Models Against End-to-End Training for Mitotic Figure Classification [0.4] ファンデーションモデル(FM)は近年、病理学の領域で広く普及している。
本研究は, 有糸分裂型図形分類にも適用できる程度について検討する。
その結果,データ提供量にかかわらず,エンドツーエンド学習ベースラインがすべてのFM分類器を上回っていることが判明した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:25:31 GMT)
CiTrus: Squeezing Extra Performance out of Low-data Bio-signal Transfer Learning [0.4] 近年, 生体信号の伝達学習は, 小さな生体信号データセットを用いて下流タスクの予測性能を向上させる重要な手法となっている。
低データの生体信号伝達学習のためのマスク付き自動符号化を用いた畳み込み変換型ハイブリッドモデルアーキテクチャを提案する。
我々のハイブリッドモデルにおける畳み込みのみの部分は、いくつかの低データダウンストリームタスクにおいて最先端のパフォーマンスを達成できることが示唆された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:15:16 GMT)
A Mapper Algorithm with implicit intervals and its optimization [0.4] Mapperアルゴリズムは、トポロジデータ解析において複雑な高次元データを可視化するための重要なツールである。
手動のパラメータチューニングと固定間隔、および固定オーバーラップ比の必要性は、標準的なMapperアルゴリズムの性能を損なう可能性がある。
隠れた代入行列を通して暗黙的に間隔を表す新しいフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:16:54 GMT)
Investigating Self-Supervised Image Denoising with Denaturation [0.3] 理論的解析と数値実験により,デ変性データを用いた自己教師付き復調アルゴリズムを解析する。
その結果, 劣化画像を用いたアルゴリズムトレーニングは有効であり, 経験的性能は理論的結果と一致していることがわかった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:37:17 GMT)
MAGIC: Generating Self-Correction Guideline for In-Context Text-to-SQL [0.3] 本稿では,自己補正ガイドライン作成を自動化する新しいマルチエージェント手法であるMAGICを紹介する。
MAGICは、マネージャ、修正、フィードバックエージェントの3つの特殊エージェントを使用する。
我々の実験によると、MAGICのガイドラインは、人間の作ったものよりも優れています。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:52:51 GMT)
Development of an End-to-end Machine Learning System with Application to In-app Purchases [0.2] プレイヤーが次のアプリ内購入をいつ行うかを予測するため,我々はMLシステムを開発した。
これらの予測はプレイヤーにオファーを提示するために使用される。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:57:46 GMT)
HiGDA: Hierarchical Graph of Nodes to Learn Local-to-Global Topology for Semi-Supervised Domain Adaptation [0.2] 機能レベルとカテゴリレベルの両方で表現を同時に提示するように設計されたノードの階層グラフを導入します。
本研究では、画像内の最も関連性の高いパッチを識別するための局所グラフを導入し、定義された主オブジェクト表現への適応性を促進する。
カテゴリレベルでは、グローバルグラフを使用して、同じカテゴリ内のサンプルから特徴を集約し、全体的な表現を豊かにする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:35:52 GMT)
Unitary-transformed projective squeezing: applications for circuit-knitting and state-preparation of non-Gaussian states [0.2] 連続可変(CV)量子コンピューティングは、量子計算の有望な候補である。
この研究は、スクイーズ法を拡張して、スクイーズ真空からユニタリ変換された状態に量子状態を投影する形式を確立した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:11:03 GMT)
Phase-aware Training Schedule Simplifies Learning in Flow-Based Generative Models [0.2] 本研究では,フローベース生成モデルのパラメータ化に用いる2層オートエンコーダのトレーニングを分析する。
速度場を表すオートエンコーダは,各位相に関係するパラメータのみを推定することにより,簡易化を図る。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:12:06 GMT)
Selective and noise-resilient wave estimation with quantum sensor networks [0.1] ノイズの存在下での平面波の選択的センシングについて考察する。
本稿では、量子センサネットワークの感度を制御し、任意に選択された波から分離する様々な方法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:04:15 GMT)
Leveraging User-Generated Metadata of Online Videos for Cover Song Identification [0.0] 本稿では,オンラインビデオプラットフォーム上での楽曲識別のためのマルチモーダル手法を提案する。
エンティティ・レゾリューション・モデルとオーディオ・ベース・アプローチをランキング・モデルを用いて組み合わせる。
本研究は,ユーザ生成メタデータを活用することで,YouTubeのカバー楽曲識別性能を安定させることができることを示唆している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:35:32 GMT)
A Benchmark and Robustness Study of In-Context-Learning with Large Language Models in Music Entity Detection [0.0] In-context Learning (ICL)を用いた最近の言語モデルを用いて、ユーザ生成メタデータの新しいデータセットを提供し、ベンチマークと研究を行う。
以上の結果から,ICL設定におけるLCMはSLMよりも高い性能を示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:11:03 GMT)
Establishing a Foundation for Tetun Text Ad-Hoc Retrieval: Indexing, Stemming, Retrieval, and Ranking [0.0] 本研究では,アドホック検索タスクに着目したテトゥーンのテキスト検索について検討する。
最初は、ストップワードのリスト、ストローマー、テストコレクションなど、重要な言語リソースの開発から始まります。
次に、文書タイトルとコンテンツの両方を用いて、検索の有効性を評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:22:34 GMT)
Fractal decompositions and tensor network representations of Bethe wavefunctions [0.0] 一般の$M$-粒子Beの1d格子上の波動関数の絡み合い構造について検討する。
我々は、Bethe波動関数がフラクタル多重粒子分解を受け入れることを示す。
我々はより大きな一般化されたベーテ波動関数のクラスを提唱した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:27:44 GMT)
Wonderful Matrices: Combining for a More Efficient and Effective Foundation Model Architecture [0.0] 状態空間双対性アルゴリズムに回転位置を埋め込むことが可能であることを示し、これは2次因果自己アテンションと状態空間双対性の組み合わせの複雑さを4%以上減少させる。
次に,より難易度の高いマルチクエリ・アソシエイト・リコールタスクにおいて,100%の精度を維持するダイナミックマスクアテンションを提案する。
第3に、専門家のクロスドメイン混在を設計し、専門家の混在の8倍から10倍の速さで1024人以上の専門家による専門家検索の計算速度を向上する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:56:28 GMT)
Why Is Anything Conscious? [0.0] 生物系が階層的に階層的に知覚情報を解釈するためにどのように自己組織化するかを記述するフォーマリズムを提供する。
我々の提案は、ゾンビフィクションよりも人間の事実に近い、意識の正式な科学の基礎を築いた。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:38:49 GMT)
Why Does ChatGPT "Delve" So Much? Exploring the Sources of Lexical Overrepresentation in Large Language Models [0.0] 科学者による大規模言語モデル(LLM)の使用が言語変化の原因であると広く考えられている。
我々は,これらの言語変化を特徴付ける形式的,伝達可能な方法を開発した。
LLM の使用により,科学的な抽象概念の出現が増加する21の焦点単語が検出された。
ヒトのフィードバックからの強化学習が焦点単語の過剰使用に寄与するかどうかを評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:27:59 GMT)
When Every Token Counts: Optimal Segmentation for Low-Resource Language Models [0.0] 最適Byte-Pair(BPE)構成は,グリーディセグメンテーションに比べてトークン数を大幅に削減することを示す。
この結果から,圧縮最適化トークン化戦略が多言語および低リソース言語アプリケーションに多大なメリットをもたらす可能性が示唆された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:08:19 GMT)
What Can Youth Learn About in One Hour? Examining How Hour of Code Activities Address the Five Big Ideas of Artificial Intelligence [0.0] 我々は、Hour of CodeアクティビティがAIの5つの大きなアイデア、特に機械学習と社会的影響にどのように関与するかをレビューする。
驚くべき発見は、コンピューティングの重要な側面に注意が払われたことだ。
議論では、より広範なトピックを提供するために、今後の導入活動がどのように設計されるかについて論じる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:55:31 GMT)
Wavelength-Tunable and High-Heralding-Efficiency Quantum Photon Source in Birefringent Phase-Matched Lithium Niobate Waveguide [0.0] ニオブ酸リチウム(Lithium niobate、LN)は、強い複屈折熱光学効果が量子光子源の生成に期待できる複屈折材料である。
絶縁体上に5$mu$mの厚さのXカットリチウムニオブ酸リチウム上に作製した20mm長導波路の複屈折相整合を実証した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:58:39 GMT)
Using machine learning to inform harvest control rule design in complex fishery settings [0.0] 本研究では, 一部観察, 年齢構造, 余剰魚群に対する収量制御則を設計する際の問題点を考察する。
カナダのアルバータ州にあるWalleyeの漁業では、非常に多様な採用のダイナミクスがマネージャや生態学者を困惑させています。
いくつかの相補的なパフォーマンス指標を使用して、ポリシーを最適化し、評価しました。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:13:00 GMT)
Using Instruction-Tuned Large Language Models to Identify Indicators of Vulnerability in Police Incident Narratives [0.0] 我々はボストン警察署が記録した警察と公共の相互作用に関する公開テキストの物語を分析した。
命令調律大言語モデル(IT-LLM)の定性的符号化と人間のコーダとの比較を行った。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:27:37 GMT)
Using Contextual Information for Sentence-level Morpheme Segmentation [0.0] 形態素セグメンテーションをシーケンス・ツー・シーケンス問題として再定義し、個々の単語を分離するのではなく、文全体を入力として扱う。
その結果,多言語モデルの方が単言語モデルに比べて優れた性能を示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:40:11 GMT)
User-Centered Course Reengineering: An Analytical Approach to Enhancing Reading Comprehension in Educational Content [0.0] 本研究は,教育内容の充実と学習成果の充実を支援するための分析的枠組みを提案する。
本手法は,読者とコンテンツ間のデジタル読解トレース-インタラクションの分析から得られた知見に基づいて,文書の内容と構造に適応する。
本フレームワークでは,インタラクティブなダッシュボードを通じて適切なコンテンツリビジョンレコメンデーションを受け取ることができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:26:20 GMT)
Unsupervised Foundation Model-Agnostic Slide-Level Representation Learning [0.0] 自己教師付き学習は、パッチ埋め込み生成のための組織モデル(FM)の訓練に成功している。
本稿では,有用なスライド表現を生成する単一モダリティSSL方式を提案する。
対照的な事前学習戦略はCOBRAと呼ばれ、複数のFMとMamba-2に基づくアーキテクチャを採用している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:34:06 GMT)
Uniform response theory of non-Hermitian systems: Non-Hermitian physics beyond the exceptional point [0.0] 我々は、すべてのスペクトルシナリオに一様に適用される非エルミート系の一般応答理論を開発する。
一般例と具体例の両方において、より高次幾何的多重性の以前に到達不可能なシナリオが超ローレンツ的応答のユニークな変種をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:18:25 GMT)
Uncovering Student Engagement Patterns in Moodle with Interpretable Machine Learning [0.0] 本研究では,仮想学習環境(VLE)のアクティビティログデータを用いて,モジュール全体のエンゲージメントを定量化する手法を提案する。
学習セッション頻度,即時性,多様性を用いて,累積エンゲージメント尺度を作成する。
ユニヴァーシティ・カレッジ・カレッジ・ロンドンの統計科学科における計算モジュールのケーススタディにおいて、デリバリー手法が学生の行動にどのように影響するかを検討する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:47:25 GMT)
Towards Physically-Based Sky-Modeling [0.0] 物理的に捉えたHDR画像から直接天気予報を学習する全天候スカイモデルを提案する。
我々のモデル(AllSky)は、空の拡張ダイナミックレンジ(EDR)の維持を改善した物理的に捕獲された環境マップのエミュレーションを可能にする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:32:05 GMT)
The isoholonomic inequality and tight implementations of holonomic quantum gates [0.0] ホロノミック量子計算では、量子論理ゲートは計算空間の巡回平行輸送によって実現される。
計算空間の余次元が十分に大きいとき、任意の量子ゲートは、並列輸送ハミルトニアンを用いて実装できることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:39:07 GMT)
The fate of Wannier-Stark localization and skin effect in periodically driven non-Hermitian quasiperiodic lattices [0.0] 電場が時間とともにゆっくりと変調されると、WS局所化相の代わりに複数の移動端を持つ新しい非自明位相が出現することを示す。
大きな駆動周波数に対して、通常の急激な非局在化-局在化遷移を通常の(WSを含まない)局所化相に戻す。
さらに、ドライブの存在下では、非エルミート系の通常の性質とは対照的に、皮膚状態は多フラクタルであることが分かる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:01:35 GMT)
The effect of curvature on local observables in quantum field theory [0.0] 時空の局所化領域における曲率による実場の2乗場振幅の期待値に対する先行順序補正を計算する。
次に、粒子検出器モデルに適用し、局所場プローブにおける時空曲率の影響を定量化する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:07:32 GMT)
The binarisation loophole in high-dimensional quantum correlation experiments [0.0] 我々は,ブラックボックス相関実験において,測定バイナライゼーションの手順に欠陥があり,抜け穴が開いていることを論じる。
本稿では,二項化による相関関係を忠実に解析する手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:16:14 GMT)
The Three Social Dimensions of Chatbot Technology [0.0] 本研究では,3次元のチャットボットの構造的検討を行った。
科学研究、商業機器、親密な相互作用のエージェントとしての役割を強調している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:45:53 GMT)
The State Preparation of Multivariate Normal Distributions using Tree Tensor Network [0.0] そこで我々は,D$D$次元多変量正規分布に対する状態準備回路を生成するスケーラブルな手法を提案する。
そこで本研究では,ネットワーク構造と小型回路の最適化に自動構造最適化を用いるコンパイル手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:41:51 GMT)
The Ramanujan Library -- Automated Discovery on the Hypergraph of Integer Relations [0.0] 数学的定数とその相互関係に関する最初のライブラリを提示する。
このライブラリは、数学的定数の式を整理するための新しい表現に基づいている。
開発とテストの間、我々の戦略は定数間の75の未知の接続を発見しました。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:18:44 GMT)
The Open Source Advantage in Large Language Models (LLMs) [0.0] 大規模言語モデル(LLM)は自然言語処理(NLP)の重要な転換点である。
LLaMAやBLOOMといったオープンソースのイニシアチブは、コミュニティ主導の開発と計算効率による民主化を優先している。
確実に、クローズドソースアプローチとオープンソースアプローチの緊張は、AIにおける透明性とコントロールに関するより広範な議論を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:32:11 GMT)
The Eclipsing Binaries via Artificial Intelligence. II. Need for Speed in PHOEBE Forward Models [0.0] 現代の天文学では、収集されたデータの量は手動分析の能力を大きく上回っている。
AIは、フォワードモデルを生成するのに必要な時間から計算ボトルネックが発生するシミュレーションコードを最適化することができる。
我々は、100万以上の合成光曲線のデータセットに基づいてトレーニングされた、完全に接続されたフィードフォワード人工ニューラルネットワーク(ANN)を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:00:15 GMT)
Temporal quantum eraser: Fusion gates with distinguishable photons [0.0] 2光子ゲートの理想的な操作は、識別可能な光子から回収できることを示す。
一対の変調入射単光子源の間に時間量子消光器を導入する。
同一光子の要求を解除する能力は、線形光学量子情報処理においてかなりの可能性を秘めている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:46:18 GMT)
Survey on safe robot control via learning [0.0] 本研究は, 安全ロボット学習の現場を探索し, 厳密な安全制約と高性能制御のバランスをとる方法を検討する。
古典的な制御手法、学習に基づくアプローチ、組込みシステム設計を調べることで、複雑な運用環境全体にわたって最適な性能を維持しながら、有害な状態を防ぐためにロボットシステムをいかに開発できるかを理解することを目指す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:04:09 GMT)
Superradiant Neutrino Lasers from Radioactive Condensates [0.0] スーパー放射能は光励起ガス中の集団自然放出から生じる。
電子捕獲同位体8,3$Rbの凝縮物に基づく可視的実験により、可視大きさのルビジウム縮合物106$原子において、82日から数分に加速された有効な放射性崩壊速度を示すことができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:35:54 GMT)
Spectra and transport of probability and energy densities in a $\mathcal{PT}$-symmetric square well with a delta-function potential [0.0] 単純な $mathcalPmathcalT$-symmetric モデルのスペクトル,固有状態,輸送特性について検討する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:01:57 GMT)
Spatial averaging for light reflection and transmission through cold atom arrays [0.0] 原子位置のコヒーレント波動関数が同じ空間分布を持つ熱分布から異なる結果をもたらすかどうかを考察する。
光が弱く、電子状態が時間スケールで進化しても、トラップ内の原子の発振周期よりも短い場合、コヒーレンスは関係がない。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:07:31 GMT)
Semi-automated analysis of audio-recorded lessons: The case of teachers' engaging messages [0.0] 2年間に75名の教師から2,477名の音声録音レッスンを収集した。
自動書き起こしとキーワードベースのフィルタリング分析を用いて,係り受けメッセージの識別と分類を行った。
最も多く用いられたメッセージは、学校活動への参加による将来の利益を強調した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:35:58 GMT)
Security and Fairness in Multi-Party Quantum Secret Sharing Protocol [0.0] 量子秘密共有(Quantum Secret Share, QSS)は、量子力学を利用して秘密を複数のパーティに分散する暗号プロトコルである。
我々は、しきい値スキームに基づいて、汎用分散量子ネットワークに頼った新しいQSSの概念を導入する。
本稿では,提案プロトコルの有効性と性能を,古典的および量子的攻撃に対して検証することによって示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:18:52 GMT)
Secure and robust randomness with sequential quantum measurements [0.0] 我々は、シーケンシャルな量子相関に対するTsirelsonのような境界を証明し、シーケンシャルなユーザによって共有される非局所性のトレードオフを表す。
我々の単純なqubitプロトコルはこの境界に達し、数値解析により現実的な雑音下でのロバスト性の向上が示されている。
本研究は、逐次量子相関の理解を深め、効率的なデバイス非依存プロトコルに対する洞察を提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:26:14 GMT)
SciFaultyQA: Benchmarking LLMs on Faulty Science Question Detection with a GAN-Inspired Approach to Synthetic Dataset Generation [0.0] 現在の大きな言語モデル(LLM)は、しばしば「0.5」と答えるが、意味をなさない。
我々はSciFaultyQAという科学的な質問のデータセットを開発しました。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:11:48 GMT)
Scaling laws for nonlinear dynamical models of articulatory control [0.0] タスク動的モデルに非線形復元力を加えることで、パラメータ化と解釈可能性の課題がもたらされることを示す。
スケーリング法則を立方体モデルに適用し,それらが調音力学の解釈可能なシミュレーションを促進する方法を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:24:53 GMT)
Scalable Temporal Anomaly Causality Discovery in Large Systems: Achieving Computational Efficiency with Binary Anomaly Flag Data [0.0] 本研究は異常因果発見法(AnomalyCD)を提案する。
バイナリフラグデータセットから因果グラフを生成する際の精度と計算上の課題に対処する。
その結果,計算オーバーヘッドの大幅な低減と時間因果発見の精度の適度な向上が示された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:11:28 GMT)
SFFT-based Homogenization: Using Tensor Trains to Enhance FFT-Based Homogenization [0.0] 均一化(homogenization)は、マイクロスケールの不均一性を持つ材料のマクロ特性を近似する鍵となる技術である。
FFTに基づくホモジェナイゼーション法は、複雑なミクロ構造を扱う際の計算効率と精度のために広く利用されている。
本稿では,量子変換の量子化列車変種を利用した,SFFTに基づく新しい均質化アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:53:12 GMT)
Robust Spectral Anomaly Detection in EELS Spectral Images via Three Dimensional Convolutional Variational Autoencoders [0.0] EELS-SIデータにおける自動異常検出のための3次元畳み込み変分オートエンコーダ(3D-CVAE)を提案する。
負の対数損失とバルクスペクトルのトレーニングを用いることで、欠陥のない材料の特徴を持つバルク特性を再構築する。
以上の結果から, 3D-CVAEは異常検出に優れ, 各種シフトグレードにおける一貫した性能を維持していることがわかった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:55:08 GMT)
Reliable Breast Cancer Molecular Subtype Prediction based on uncertainty-aware Bayesian Deep Learning by Mammography [0.0] 深層学習法は, 種々の医用画像を用いた乳癌分類作業において, 良好な成績を示した。
不確実性は予測の妥当性を表す。
本研究では,全マンモグラム画像を用いた不確実性を考慮したベイズ深層学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:37:03 GMT)
Relativistic Locality from Electromagnetism to Quantum Field Theory [0.0] 量子物理学の多世界解釈は基本レベルで局所的であることを示す。
我々は、この基本的地域性は、世界の非基礎的な分枝の地域的またはグローバルな説明と相容れないと論じる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:09:56 GMT)
Relative volume of comparable pairs under semigroup majorization [0.0] 行列の任意の半群 $mathcalS$ は、確率 $n$-ベクトルの集合 $Delta_n-1$ 上で半群素化関係 $precmathcalS$ を誘導する。
Delta_n-1$:$X$と$Y$が$precmathcalS$に匹敵する確率は?
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:46:39 GMT)
Real-valued continued fraction of straight lines [0.0] 非有界平面では、直線は数学的解析に広く用いられる。
直線は、独立変数よりもはるかに遅い速度で非有界となる有界非線形曲線に変換される。
画像分類の問題を解くことにより,連続分数の有界性の有用性を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:37:47 GMT)
Quantum trails and memory effects in the phase space of chaotic quantum systems [0.0] 位相空間における局所波束の弱い分散力学が固有状態に「量子軌跡」を残すことを示す。
量子トレイルは、局所的なウェーブパケットの系において、短時間の軌道に沿って長時間の位相空間分布が増強される、顕著な力学効果を支えている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:39:30 GMT)
Quantum search in a dictionary based on fingerprinting-hashing [0.0] 長さ$m$の単語を、大きさ$n$の未分類辞書で検索する量子クエリアルゴリズムを提案する。
このアルゴリズムは以前のアルゴリズムと同様に$O(sqrtn)$クエリ(Grover演算子)を使用する。
このアルゴリズムは(a)Grover振幅増幅演算子のシーケンスを適用する前に第1レベルの振幅増幅を提供し、(b)メモリ使用の観点からアルゴリズムをより効率的にする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:43:59 GMT)
Quantum heat engine in the optomechanical system with mechanical parametric drive [0.0] 本研究では, キャビティを作動物質として選択したオットー型量子熱エンジンについて考察する。
パラメトリック駆動によるメカニカルモードはキャビティを燃料とし,エネルギーの利用効率について考察した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 08:58:30 GMT)
PyPotteryLens: An Open-Source Deep Learning Framework for Automated Digitisation of Archaeological Pottery Documentation [0.0] PyPotteryLensは、考古学的考古学的図面のデジタル化と処理を自動化するフレームワークである。
このフレームワークは、陶器検出および分類タスクにおいて97%以上の精度とリコールを達成する。
手作業に比べて処理時間を最大5倍から20倍に短縮する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:01:32 GMT)
Polynomially efficient quantum enabled variational Monte Carlo for training neural-network quantum states for physico-chemical applications [0.0] ニューラルネットワーク量子状態(NQS)は、物理系に対する従来の変分アンゼの代替を提供する。
エネルギーベースのフレームワークは、統計物理学を利用して量子状態をエネルギーランドスケープにマッピングし、メモリディスクリプタとして機能する。
このようなモデルは、量子デバイスによって強化されたモンテカルロ技術を用いて効率的に訓練できることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:11:41 GMT)
Policy Learning for Optimal Dynamic Treatment Regimes with Observational Data [0.0] 本研究では,各段階における各個人に対する最適な治療課題を,個人の進化史に基づいて導くための最適動的治療体制(DTR)の統計的学習について検討する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:48:51 GMT)
Physics-informed Transformers for Electronic Quantum States [0.0] ニューラル量子状態表現のための変分モンテカルロフレームワークを提案する。
Transformerは、参照状態に対する修正をパラメトリズし、自己回帰的にサンプリングするために使用される。
この研究は、より効率的で解釈可能な神経量子状態表現の道を開く。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:00:00 GMT)
Perturbation theory scope for predicting vibronic selectivity by entangled two photon absorption [0.0] 超広帯域光子に励起された二原子系の振動数に対する近似式を導出した。
本結果は,2次摂動理論における通常の近似を超えることが重要であることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:13:41 GMT)
PROPOE 2: Avanços na Síntese Computacional de Poemas Baseados em Prosa Literária Brasileira [0.0] 本報告では, 構造的およびリズミカルな可能性を拡張したPROPOE2について述べる。
システムによって生成された詩の結果は、生成と評価を実証するためのパラメータのバリエーションによって示される。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:53:24 GMT)
Optimized Quran Passage Retrieval Using an Expanded QA Dataset and Fine-Tuned Language Models [0.0] Qur'an QA 2023の共有タスクデータセットには、弱いモデル検索を伴う限られた数の質問があった。
251の質問を含む最初のデータセットをレビューし、629の質問に拡張し、質問の多様化と修正を行った。
AraBERT、RoBERTa、CAMeLBERT、AraELECTRA、BERTなど、微調整されたトランスモデルを実験する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:03:58 GMT)
On-the-Fly Ab Initio Hagedorn Wavepacket Dynamics: Single Vibronic Level Fluorescence Spectra of Difluorocarbene [0.0] Hagedorn Wavepacketは、モデル高調波ポテンシャルにおいて、単一の振動レベル(SVL)スペクトルを効率的に計算するために使われてきた。
我々は,グローバル・ハーモニック・モデルではCF2が不十分であるのに対し,実機でのローカル・ハーモニック・ハゲゴルン・ウェーブパケット・ダイナミクスを用いて計算したスペクトルは実験データとよく一致していることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:27:58 GMT)
On the Role of Surrogates in Conformal Inference of Individual Causal Effects [0.0] UnderlineEfficient IunderlineNdividual UnderlineCausal UnderlineEffects (SCIENCE) に対する UnderlineSurrogate-assisted Underline Conformal Underline Inference を導入する。
SCIENCEは、個々の治療効果(ITE)に対してより効率的な予測間隔を構築するために設計されたフレームワークである。
これは第3相であるModerna COVE COVID-19ワクチンの臨床試験に適用される。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:36:11 GMT)
On the Ability of Deep Networks to Learn Symmetries from Data: A Neural Kernel Theory [0.0] 一般化は、データの局所構造が非局所的、対称的構造よりも優勢である場合にのみ成功することを示す。
我々のフレームワークは、アーキテクチャの設計をガイドし、データから対称性を学習する訓練手順を拡張することができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:56:54 GMT)
Omics-driven hybrid dynamic modeling of bioprocesses with uncertainty estimation [0.0] この研究は、機械学習ツールを統合するオミクス駆動モデリングパイプラインを提示している。
ランダムフォレストと置換特徴の重要性は、オミクスデータセットをマイニングするために提案されている。
連続的かつ微分可能な機械学習関数は、減ったオミクス機能を動的モデルのキーコンポーネントにリンクするように訓練することができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:54:14 GMT)
NoteContrast: Contrastive Language-Diagnostic Pretraining for Medical Text [0.0] i) ICD-10 診断符号列の大規模実世界データセットを用いたモデル,(i) 医療用メモ用大言語モデル,(iii) ICD-10 診断符号と対応する医療用テキストの統合モデルを構築するための対照的な事前学習モデルを開発する。
本研究は,MIMIC-III-50,MIMIC-III-rare50,MIMIC-III-fullの診断コーディングタスクにおいて,先行訓練に対する対照的なアプローチにより,先行訓練の性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:44:39 GMT)
Nonperturbative features in the Lie-algebraic Kähler sigma model with fermions [0.0] 複数の右利きキラルフェルミオンを持つリー代数K"ahler sigmaモデルから導かれる量子力学系について検討する。
我々は,サドル点解の同定と解析を行い,基底状態エネルギーの摂動膨張におけるそれらの寄与について検討する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:55:14 GMT)
Nonlinear topological pumping of edge solitons [0.0] エッジソリトンのトポロジカルポンピングに及ぼす非線形強度の影響について検討した。
弱い非線形強度のために、非線形性の導入はエネルギースペクトルの対称性を破る。
強い非線形強度のために、エッジソリトンは自己トラッピングされ、全てのトポロジカルポンプチャネルは閉鎖される。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:06:04 GMT)
Noisy intermediate-scale quantum simulation of the one-dimensional wave equation [0.0] 本研究では,量子H1-1量子コンピュータ上での1次元波動方程式のシミュレーションのための量子回路の設計と実装を行う。
波動方程式をシミュレーションする手法は、異なる量子プロセッサ間で適切な状態準備アルゴリズムを用いて使用することができ、アプリケーション指向のベンチマークとして機能する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:37:17 GMT)
Noise-Resilient Homomorphic Encryption: A Framework for Secure Data Processing in Health care Domain [0.0] ホモモルフィック・インテグリティ・モデル(HIM)は、暗号化されたデータ処理におけるセキュリティ、効率、信頼性を高めるために設計された。
復号化機構により、複雑な同型計算によって得られたデータが有効で信頼性が高いことが保証される。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:26:40 GMT)
Neural information field filter [0.0] 本稿では,高次元非線形力学系に対するニューラル情報場フィルタ,ベイズ状態およびパラメータ推定手法を提案する。
有限線形基底のスパンを用いて時間発展状態経路をパラメータ化する。
真の状態パスを知る前に表現的だが単純な線形基底を設計することは、推論の正確性には不可欠だが困難である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:10:12 GMT)
Multiplex Dirichlet stochastic block model for clustering multidimensional compositional networks [0.0] ネットワークデータは複数の種類の関係を表すことが多く、交換量を表すこともある。
従来のクラスタリング手法は多重ネットワークには適していない。
合成層を有する多重化ネットワーク用に設計された多重化ディリクレブロックモデルを提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:51:50 GMT)
Multimodal LLM for Intelligent Transportation Systems [0.0] 本稿では,アプリケーション,機械学習手法,ハードウェア機器の交わりをカプセル化する新しい3次元フレームワークを提案する。
複数の機械学習アルゴリズムを使う代わりに、我々のフレームワークは時系列、画像、ビデオを分析する単一のデータ中心のLLMアーキテクチャを使用する。
我々は,このLLMフレームワークを,Oxford Radar RobotCar,D-Behavior (D-Set),MotionalのnuScenes,Comma2k19など,さまざまなセンサデータセットに適用した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:50:30 GMT)
Multilabel Classification for Lung Disease Detection: Integrating Deep Learning and Natural Language Processing [0.0] 本稿では,多ラベル肺疾患分類のためのトランスファーラーニングモデルを提案する。
提案モデルはF1スコア0.69、AUROC0.86を達成し、臨床応用の可能性を示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:14:08 GMT)
Multi-head attention debiasing and contrastive learning for mitigating Dataset Artifacts in Natural Language Inference [0.0] 自然言語推論モデルのための構造的デバイアス化手法を開発した。
提案手法は, 誤差率を14.19%から10.42%に下げると同時に, バイアスのない例では高い性能を維持する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:12:21 GMT)
Multi-Scale Incremental Modeling for Enhanced Human Motion Prediction in Human-Robot Collaboration [0.0] 本稿では,複数の時間スケールにまたがるインクリメンタルモデルを明示的に符号化する新しいフレームワークを提案する。
4つのデータセットの実験では、連続性、生体力学的一貫性、長期予測安定性が大幅に改善された。
提案したマルチスケールインクリメンタルアプローチは、シームレスな人間とロボットの相互作用に不可欠な人間の動き予測能力を向上するための強力な技術を提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:20:46 GMT)
Monotones in Resource Theories for Dynamical Decoupling [0.0] 修正された相対エントロピーに基づく資源定量化器を示し、それらが実際に資源理論において単調であることを証明する。
DDは時間的資源蒸留として理解でき, マルチスケール最適動的デカップリング法(MODD)によるノイズ低減は, 対応する非マルコビアン性モノトンの減少と一致する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:33:35 GMT)
Mixture equivalence principles and post-quantum theories of gravity [0.0] モラー・ローゼンフェルト半古典重力が弱いMEPに反することを示す。
我々は、モラー・ローゼンフェルト半古典重力はブラックホール時空の文脈における量子重力の半古典的極限ではないと主張する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:02:22 GMT)
Many-body dynamics with explicitly time-dependent neural quantum states [0.0] 時間依存型ニューラル量子状態(t-NQS)を導入する。
時間に依存しないパラメータの集合を1つに最適化し、時間に依存するシュリンガー方程式を全時間間隔で解く。
結果はt-NQSを強い相関系における量子力学を探索する強力なフレームワークとして確立する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:53:26 GMT)
Machine Learning-Based Automated Assessment of Intracorporeal Suturing in Laparoscopic Fundoplication [0.0] 我々は,Segment Anything Model(SAM)を用いたAIベースのツールトラッキングを開発し,アノテータの必要性を解消した。
ブタ腸におけるNissen骨形成の録画ビデオに自動ツールトラッキングモデルを適用した。
評価は教師なしモデルと教師なしモデルを用いて行った。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:44:44 GMT)
Machine Learning for Predicting Chaotic Systems [0.0] カオス力学系の予測は、天気予報など多くの科学分野において重要である。
本稿では,軽量かつ重厚な機械学習アーキテクチャの比較を行う。
従来のメトリクスの望ましい特性を組み合わせ、カオスシステムに適した新しい計量である累積最大誤差を導入する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:28:45 GMT)
Leveraging Retrieval-Augmented Tags for Large Vision-Language Understanding in Complex Scenes [0.0] Vision-Aware Retrieval-Augmented Prompting (VRAP)は、大規模ビジョンランゲージモデルを強化するジェネレーティブアプローチである。
VRAPは、微細な推論とマルチモーダル理解において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 02:52:19 GMT)
Leveraging Machine Learning to Overcome Limitations in Quantum Algorithms [0.0] 本研究は,機械学習(ML)と量子アルゴリズムを組み合わせたハイブリッドフレームワークを提案する。
PubChemの分子特性を用いて,3つのデータセット(ケミカルディスクリプタ,クーロンマトリックス,ハイブリッド組み合わせ)を調製した。
XGBは4.41 pm 11.18%$で、RF(5.56 pm 11.66%$)とLGBM(5.32 pm 12.87%$)を上回った。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:14:14 GMT)
LeARN: Learnable and Adaptive Representations for Nonlinear Dynamics in System Identification [0.0] 非線形システム識別フレームワークLeARNを導入する。
基礎関数のライブラリをデータから直接学習することで、事前のドメイン知識の必要性を超越します。
我々はNeural Flyデータセットのフレームワークを検証し、その堅牢な適応と能力を示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:03:23 GMT)
Laser-Induced Quenching of the Th-229 Nuclear Clock Isomer in Calcium Fluoride [0.0] レーザー誘起焼成法(LIQ)をCaF$$229$Thomer集団を除染する方法として実証した。
我々は、20mWのレーザーパワーで異性体寿命を3倍に減らし、異なる波長でのLIQの実験的な証拠を提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:18:38 GMT)
Large Language Models in Politics and Democracy: A Comprehensive Survey [0.0] 大規模言語モデル(LLM)は、政策作成、政治コミュニケーション、分析、ガバナンスなど、様々な分野に可能性を提供する。
LLMは、政治プロセスにおける効率性、傾倒性、意思決定を向上させる機会を提供する。
また、バイアス、透明性、説明責任に関する課題も提示する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:27:41 GMT)
LLM-DaaS: LLM-driven Drone-as-a-Service Operations from Text User Requests [0.0] 本稿では,自由文ユーザ要求を構造化し,動作可能なD操作タスクに変換する新しいDroneas-a-Serviceフレームワークを提案する。
システムは、自由テキスト要求処理、構造化要求生成、動的D選択と構成の3つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:25:56 GMT)
Investigating the Feasibility of Mitigating Potential Copyright Infringement via Large Language Model Unlearning [0.0] LLM(Pre-trained Large Language Models)は、優れた能力を示すと同時に、著作権のある資料の学習と生成によるリスクも生んでいる。
本研究では,LLMから複数の時間ステップで著作権付きコンテンツを解放する新しいフレームワークであるSSU(Stable Sequential Unlearning)を提案する。
SSUは時に、未学習の有効性と汎用言語能力の効果的なトレードオフを達成し、既存のベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:01:06 GMT)
Invertible ResNets for Inverse Imaging Problems: Competitive Performance with Provable Regularization Properties [0.0] Arndtらによる最近の研究は、可逆的残差ネットワーク(iResNets)に基づくデータ駆動型再構成法を解析して、このギャップに対処している。
Arndtらによる理論的結果のいくつかを非線形逆問題に包含するように拡張し、大規模高性能iResNetアーキテクチャの設計に対する洞察を提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:04:31 GMT)
Introduction to AI Planning [0.0] 注記は州モデルの導入から始まり、古典的な計画の探求に移る。
最も広範なセクションは階層的タスクネットワーク(HTN)計画に特化している。
講演ノートは、計画ドメイン定義(PDDL)言語に関するボーナス章で終わる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:38:04 GMT)
Interaction-induced phase transitions and critical phases in nonreciprocal non-Hermitian quasicrystals [0.0] 相互作用と非相互ホッピングが準周期格子上の2つのボソンの挙動にどのように影響するかを示す。
我々の研究は非エルミート系における局所化と位相位相の理解を前進させる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:09:33 GMT)
Integrating Sustainable Computing With Sustainable Energy Research [0.0] NRELの計算科学センターには、サステナビリティ研究に特化した最大の高性能コンピューティング能力がある。
EEREによるサステナビリティ研究におけるHPC使用率は10年間で30。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:56:24 GMT)
Impact of Face Alignment on Face Image Quality [0.0] 顔画像品質に対するアライメントの影響については, 十分に調査されていない。
本研究では,顔のアライメントが顔の画質に及ぼす影響について検討した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:49:57 GMT)
IQViC: In-context, Question Adaptive Vision Compressor for Long-term Video Understanding LMMs [0.0] 我々は、新しいビジュアルコンプレッサー、IQViC(In-context, Question Adaptive Visual)を組み込んだ長期ビデオ理解のためのフレームワークを提案する。
IQViCはトランスフォーマーベースのビジュアル圧縮機であり、ビデオの完全な視覚的特徴に依存する既存の方法とは異なり、質問条件付きテキスト内圧縮を可能にする。
提案するIQViCフレームワークの有効性と,映像理解の精度とメモリ効率の観点から,最先端手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:04:33 GMT)
Homeostasis and Sparsity in Transformer [0.0] 本稿では, RFB-kWTA や Smart Inhibition などのホメオスタシス機構をトランスの注意機構やトランスの出力に応用することを提案する。
提案手法は,従来の変圧器0.2768BLEUと,変圧器ブロック0.3007BLEUのアテンション機構と出力にのみ適用可能なモデルとを著しく上回っている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:59:05 GMT)
Harvesting stabilizer entropy and non-locality from a quantum field [0.0] ミンコフスキー時空における加速Unruh-DeWitt検出器を用いて、無質量場の真空状態からSREを抽出する方法を示す。
特に、ローカル操作によって消去できない特定の非ローカル形式のSREを収穫することができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:01:48 GMT)
Grating magneto-optical trap of cesium atoms with an additional retroreflected laser beam [0.0] 反射格子に円偏光冷却レーザビームを印加してセシウム原子の磁気光学トラップを生成する。
インシデントビームの変形とパワーが10MHzと131mWであったときに、かなりの数の冷たい原子が捕獲された。
トラップ法における逆反射ビームの重要性は, 強度比を24%に下げた時に強調された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 07:24:43 GMT)
Generalizable Representation Learning for fMRI-based Neurological Disorder Identification [0.0] 正常な特徴から臨床的特徴への一般化を改善するために,新しい表現学習戦略を導入する。
このアプローチは、少ないトレーニングデータを含む臨床課題への一般化を可能にする。
その結果,多種多様な臨床関連課題における表現学習戦略の優位性を示した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:07:35 GMT)
GNN Applied to Ego-nets for Friend Suggestions [0.0] 我々は、拡張性を犠牲にすることなく複雑な教師付きモデルを使用することを可能にする、一般化ネットワークフレンドシップスコアフレームワークを紹介した。
基礎となるモデルは、Ego-netを入力として取り、そのノードに対するペアワイズ関連行列を生成する。
さらに,ソーシャルネットワーク領域で効果的に機能するWalkGNNモデルを開発した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:37:17 GMT)
GLARE: Google Apps Arabic Reviews Dataset [0.0] 本稿では,サウジアラビアのGoogle PlayStoreから収集したアラビアアプリレビューデータセットであるGLAREを紹介する。
7600万のレビューで構成され、そのうち69万は9,980のAndroidアプリケーションに関するアラビア語レビューである。
本稿では,データ収集手法と詳細な探索データ解析 (EDA) と特徴工学をまとめて紹介する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:31:20 GMT)
Fractional domain wall statistics in spin chains with anomalous symmetries [0.0] 量子スピン鎖における磁壁励起の統計について検討する。
異常なMPU対称性の存在は、ボソンやフェルミオンとして振る舞うのではなく、むしろ分数統計として振る舞うドメインウォール励起を引き起こす。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:48:51 GMT)
Formulations and scalability of neural network surrogates in nonlinear optimization problems [0.0] 非線形制約最適化問題において、トレーニングニューラルネットワークを表現するためのフルスペース、リダクションスペース、グレーボックスの定式化を比較した。
これらの定式化は、過渡安定に制約された、セキュリティに制約のある交流電流最適潮流(SCOPF)問題で検証する。
我々は、安定性の制約のないより単純なSCOPF問題に要する時間として2.5$timesで、我々の最大のニューラルネットワークサロゲートを用いて、テスト問題を解決する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 03:09:06 GMT)
Floquetifying stabiliser codes with distance-preserving rewrites [0.0] 任意の重み安定化器の測定を1ビットと2ビットの演算で量子回路に分解する。
距離保存リライトのみを使用するため、結果回路内の1つのエラーがデータキュービット上で少なくとも1つのエラーを生成することが保証される。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:54:54 GMT)
Flex-PE: Flexible and SIMD Multi-Precision Processing Element for AI Workloads [0.0] 本研究は,フレキシブル・SIMDマルチ精度処理素子(FlexPE)を提案する。
提案設計では,パイプラインモードで最大16倍FxP4,8倍FxP8,4倍FxP16,1倍FxP32のスループットを実現する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:25:57 GMT)
Final States in Quantum Cosmology: Cosmic Acceleration as a Quantum Post-Selection Effect [0.0] 量子宇宙論における確率割当における最終状態の影響を解析する。
初期条件と最終条件の両方に従うシステムに対して、有効な古典的な運動方程式を導出する。
宇宙加速は、選択後の量子的効果、すなわち、マクロ的な量子現象として現れる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:59:16 GMT)
Fermi's golden rule in tunneling models with quantum waveguides perturbed by Kato class measures [0.0] ハミルトンの分解剤は、$z(rho)$で共振を再現する第二極を持ち、$z(rho)=mathcal E_beta ; n+mathcal O Big(frac exp(-sqrt2 |mathcal E_beta ;n| rho )rho Big)$が$rho$で、共鳴エネルギー$mathcal E_beta ;n$であることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:37:27 GMT)
Fault Localization in a Microfabricated Surface Ion Trap using Diamond Nitrogen-Vacancy Center Magnetometry [0.0] ダイヤモンド中の窒素空孔中心をベースとした高分解能量子磁気イメージング技術を用いて,イオントラップチップの短絡欠陥を解析する。
これらの短絡断層から地中への電流を意図的に生成した断層と比較したところ、断層の根本原因はオンチップトレンチコンデンサの故障であることがわかった。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:40:20 GMT)
Fast-staged CNN Model for Accurate pulmonary diseases and Lung cancer detection [0.0] 本研究は, 肺がん, 特に肺結節の検出を目的とした深層学習モデルと, 胸部X線写真を用いた8つの肺病理組織について検討した。
アンサンブル法とトランスファーラーニングを利用した2段階分類システムを用いて,最初のトリアージ画像を正規あるいは異常に分類する。
このモデルでは、最高の性能の精度は77%、感度は0.713、特異度は0.776、AUCスコアは0.888である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:47:07 GMT)
Fast single-qubit gates for continuous dynamically decoupled systems [0.0] クロック、情報プロセッサ、通信ネットワーク、センサーにおける量子重畳を用いた性能は、縦方向ノイズに対する感度を低下させるために、注意状態と外部フィールドの選択に依存する。
我々は、周波数調整可能なCDDトランスモン超伝導回路上で、縦方向雑音に強く敏感な単一量子ビットゲートを$mathcalF=0.9947(1)$で示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:37:35 GMT)
Extremal graphical modeling with latent variables via convex optimization [0.0] 本稿では,潜在変数の存在下での極端グラフィカルモデル学習のためのトラクタブル凸プログラムを提案する。
提案手法では,H"usler-Reiss精度行列を,グラフィカル構造を符号化したスパース成分に分解する。
条件付きグラフと潜伏変数の数を連続的に復元することを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:30:09 GMT)
Evaluating the Propensity of Generative AI for Producing Harmful Disinformation During an Election Cycle [0.0] 本研究は, 選挙期間中に有害な偽情報を生成するための, 現在の生成AIモデルの妥当性について検討する。
コピロとジェミニは、予想される最低限の損害に気付き、全体的な安全性能に結びついていることが判明した。
敵対的役割の特徴が発見され 全てのモデルに より大きな害をもたらすことが判明しました
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:42:47 GMT)
Evaluating the Efficacy of Vectocardiographic and ECG Parameters for Efficient Tertiary Cardiology Care Allocation Using Decision Tree Analysis [0.0] 実単語データを用いてGEHの心電図マーカーの性能を機械学習モデルの特徴として評価する。
GEHパラメータは、この人口に統計的に有意であることが判明した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:01:53 GMT)
Entropic relations for indistinguishable quantum particles [0.0] von Neumann entropy of a $k$-body reduced density matrix $gamma_k$は、$k$量子粒子と残りの粒子の間の絡み合いを定量化する。
結果は、区別不可能な量子粒子であり、統計とは独立である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:59:37 GMT)
Entanglement transitions in SU(1, 1) quantum dynamics: applications to Bose-Einstein condensates and periodically driven coupled oscillators [0.0] SU(1, 1)構造を持つ非平衡量子系の絡み合い特性について検討する。
量子力学がSU(1, 1)構造を示す実験可能な2つのシステムを考える。
熱領域内の2つの異なる位相は, 絡み合いエントロピーの成長速度によってのみ識別される。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:52:59 GMT)
Entanglement Hamiltonian and orthogonal polynomials [0.0] 我々は、特定の形の不均一性を持つ自由フェルミオン鎖に対するハミルトニアンの絡み合いについて研究する。
この変形は局所的逆温度として解釈され、連続極限で得られることを示す。
この予測を用いて、通勤作用素の適切に再スケールされた固有値は、絡み合いスペクトルとエントロピーの非常に良い近似を与える。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:46:53 GMT)
Enhanced Encoder-Decoder Architecture for Accurate Monocular Depth Estimation [0.0] 本稿では、インセプション-ResNet-v2モデルがエンコーダとして機能する拡張エンコーダ-デコーダアーキテクチャを用いた、新しいディープラーニングベースのアプローチを提案する。
NYU Depth V2データセットの実験結果によると、我々のモデルは、0.064の絶対相対誤差(ARE)、0.228のルート平均角誤差(RMSE)、89.3%の精度で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 13:16:45 GMT)
Electrostatic forces from reactive molecular orbitals driving chemical reactions [0.0] 本研究は化学反応を理解するための物理ベースの枠組みを提供する。
静電気力は軌道エネルギーの負の勾配によって支配されていることを示す。
この研究は、軌道エネルギーの変動と核運動を結びつけることによって、電子構造と反応機構の相互作用を理解するための堅牢な枠組みを確立する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:23:59 GMT)
Efficient Pumping of Spectral Holes in a Tm$^{3+}$: YAG Crystal for Broadband Quantum Optical Storage [0.0] ストレージ効率はTm$3+$:YAG結晶で28%以上である。
固体中における非クラマーレアアースイオン(REI)を用いた大帯域原子周波数メモリの汎用手法を提案する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:16:34 GMT)
Echo State network for coarsening dynamics of charge density waves [0.0] エコー状態ネットワーク(英語: echo state network, ESN)は、疎結合層を持つリカレントニューラルネットワークを用いた貯水池型コンピュータである。
ここでは、半古典的なホルシュタインモデルにおいて電荷密度波(CDW)の粗大化ダイナミクスをモデル化するためのESNを構築する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:04:10 GMT)
Domain Generalization in Autonomous Driving: Evaluating YOLOv8s, RT-DETR, and YOLO-NAS with the ROAD-Almaty Dataset [0.0] 本研究では,カザフスタンのユニークな運転環境における3つの最先端物体検出モデル(YOLOv8s, RT-DETR, YOLO-NAS)の領域一般化能力について検討した。
モデルの性能を再トレーニングせずに評価する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:42:26 GMT)
Diversity in Software Engineering Education: Exploring Motivations, Influences, and Role Models Among Undergraduate Students [0.0] ソフトウェアエンジニアリング(SE)は、学術と産業の両方において、大きな多様性の課題に直面しています。
本研究は,SE教育における疎外集団の学生が経験した排他的研究にも拘わらず,未表現の学生を現場で追及し継続させる特定の動機づけ,影響,役割モデルについて限定的な理解が得られている。
本研究は,SEの不足したグループから学生のキャリア願望を形作る動機と影響について考察する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 22:14:10 GMT)
Discrete-phase-space method for driven-dissipative dynamics of strongly interacting bosons in optical lattices [0.0] 我々は、散逸性SU($cal N$)スピン絶縁体のリアルタイム進化を解析するために、離散的に切り離されたウィグナー法を開発した。
本手法を三次元散逸型Bose-Hubbardモデルのアナログ量子シミュレータを含む最先端実験に適用する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:44:40 GMT)
DisEmbed: Transforming Disease Understanding through Embeddings [0.0] DisEmbedは病気に焦点を当てた埋め込みモデルである。
DisEmbedは、疾患の説明、症状、および疾患関連Q&Aペアを含むようにキュレートされた合成データセットでトレーニングされている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 12:04:22 GMT)
Detecting and protecting entanglement through nonlocality, variational entanglement witness, and nonlocal measurements [0.0] 本稿では、量子絡みの検出と保護を強化する革新的な方法を提案する。
本手法は量子状態の絡み合いを維持しながら絡み合い検出の信頼性を高める。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 00:38:53 GMT)
Detecting a long lived false vacuum with quantum quenches [0.0] より短い時間スケールで、その差を診断できる物理現象があることが示される。
小さな遷移バブルは大きなバブルよりも一般的である。
このようなシグネチャが連続体理論に持続することを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:10:12 GMT)
Deep-learning-based identification of individual motion characteristics from upper-limb trajectories towards disorder stage evaluation [0.0] 本研究では,タスク空間で計測された3次元上肢輸送軌跡のデータセットを用いて,個々の動作パターンを識別するための予備的研究を行う。
本研究では,9のサブセットに対して約95%の分類精度を達成し,31人のフルセットに対して約78%の分類精度を達成した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:41:33 GMT)
Deep Learning for Hydroelectric Optimization: Generating Long-Term River Discharge Scenarios with Ensemble Forecasts from Global Circulation Models [0.0] 水力発電は世界のエネルギーマトリックスの重要な構成要素であり、特にブラジルのような国々ではエネルギー供給の大半を占めている。
しかし、気候の変動により本質的に不確実な河川流出への強い依存は、大きな課題を招いている。
伝統的に、統計モデルは、エネルギー最適化において河川の排出を表すために使われてきたが、しかしながら、これらのモデルは、気候の挙動が構造的に変化しているため、現実的なシナリオを生み出すことがますます困難になっている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:37:27 GMT)
Deep Learning Calabi-Yau four folds with hybrid and recurrent neural network architectures [0.0] 本稿では,ハイブリッド畳み込み再帰型ニューラルネットワークアーキテクチャに基づくディープラーニングを,h1,1,h2,1,h3,1,h2,2$のデータセットに適用する。
CNN-LSTM-400は、LSTMの隠蔽サイズ400のハイブリッドCNN-LSTMである。
72%のトレーニング比と比較して、精度は99.85%、98.66%、96.26%、84.77%に向上した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:44:05 GMT)
Data-Dependent Generalization Bounds for Parameterized Quantum Models Under Noise [0.0] 本稿では、量子フィッシャー情報行列に接地したデータ依存の一般化について述べる。
量子フィッシャー情報行列固有値によって定義される局所パラメータ近傍と有効次元を統合することにより、量子モデルにおける複雑性の構造化された特徴付けを提供する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 05:10:58 GMT)
Cross-Axis Transformer with 3D Rotary Positional Embeddings [0.0] 本稿では,Cross-Axis Transformerを紹介する。
CATは、Axial TransformersとMicrosoftのRetentive Networkの両方にインスパイアされたモデルである。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:43:18 GMT)
Control of a Josephson Digital Phase Detector via an SFQ-based Flux Bias Driver [0.0] Josephson Digital Phase Detector (JDPD) による低温オンチップ量子ビット読み出し
フラックスバイアス特性がJDPD性能に及ぼす影響を数値的に検討した。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:42:26 GMT)
Connecting Gravity and Quantum Physics: Primordial Black Holes and the Evolution of the Universe [0.0] 本研究では、重力と量子力学の基本的な関係を探求する新しい枠組みを提案する。
具体的には、宇宙論における原始ブラックホール(PBH)の役割に焦点を当てている。
このモデルは、質量、エントロピー、温度などのPBHの量子化特性も調べ、量子過程がブラックホール力学の基本であることを示唆している。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 06:26:52 GMT)
Computable Cross Norm in Tensor Networks and Holography [0.0] The Computable Cross Norm (CCNR) was recently discussed in Ref.citeYin:2022toc as a measure of multipartite entanglement in a condensed matter context。
ランダムテンソルネットワークおよびホログラフCFTにおけるCCNRの計算について論じる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:26:40 GMT)
Commentary on the decomposition of universal multiport interferometers: how it works in practice [0.0] マルチポート干渉計の分解は、量子光学と計算の基本的なツールである。
このノートは、最も一般的な設計手法に従って分解を行うための簡潔な参照として機能することを目的としている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:40:09 GMT)
Coherent enhancement of collection of light from linear ion crystals [0.0] 本稿では, 線形イオン弦から光子を収集する手法を提案する。
これは、線形ポールトラップの軸方向に沿ってイオンから散乱した光の建設的干渉を利用する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:55:55 GMT)
Chirally-protected state manipulation by tuning one-dimensional statistics [0.0] 我々は,エノン・ハバードモデルにおける統計的パラメータを理論的に進化させる。
このキラル部分空間には非自明なベリー位相とホロノミーが存在する。
対応する状態は、N$粒子密度の定常チェッカーボードパターンを持つ。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 15:31:07 GMT)
Chirality-induced emergent spin-orbit coupling in topological atomic lattices [0.0] V型原子の格子中の光励起は、幾何がキラルであるときにスピン軌道の創発的な結合を示す。
キラル性によって引き起こされるスピン軌道結合は、基礎となる格子幾何学のキラル性または好適に選択された外部量子化軸とのアキラル格子の組み合わせから生じる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:08:40 GMT)
CNNtention: Can CNNs do better with Attention? [0.0] 本研究の目的は,従来のCNNと注意増進CNNを画像分類タスクで比較することである。
彼らの性能、精度、計算効率を評価し、比較することで、プロジェクトは従来のCNNの局所的特徴抽出の利点とトレードオフを強調します。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 11:00:02 GMT)
Bayesian Flow Is All You Need to Sample Out-of-Distribution Chemical Spaces [0.0] ベイジアンフローネットワークは,高品質なアウト・オブ・ディストリビューション・サンプルを生成することができることを示す。
本研究では,半自己回帰型トレーニング/サンプリング手法を導入し,モデル性能の向上と最先端モデルの超越を支援する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:43:54 GMT)
Automated Generation of Massive Reasonable Empirical Theorems by Forward Reasoning Based on Strong Relevant Logics -- A Solution to the Problem of LLM Pre-training Data Exhaustion [0.0] 大規模言語モデル(LLM)の事前学習に使用されるデータは、しばしば枯渇したと言われている。
本稿では、この問題の解を提案する: 前方推論による大規模合理的な経験定理の自動生成。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 23:18:17 GMT)
Atomic fluorescence collection into planar photonic devices [0.0] 個々のエミッタからの蛍光収集は、状態検出とリモート絡み合い生成において重要な役割を果たす。
平面フォトニクスは、閉じ込められたイオン系の堅牢でスケーラブルな対処のために実証されている。
遠距離場光子収集効率は、エミッタ位置のみの集光光学に関連付けられたフィールドで簡単に表現できることを示す。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 16:53:55 GMT)
Atom-mediated deterministic generation and stitching of photonic graph states [0.0] 高絡み合い多光子グラフ状態は、フォトニック量子計算と通信において重要な資源である。
光共振器に結合したW型レベルスキームにおいて、単一原子からなるマルチゲート量子ノードを導入する。
フォトニック量子ビットを決定論的に絡める能力は、異なるデバイスからグラフを縫い合わせることによって生成された状態を拡大することができる。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 04:49:01 GMT)
Artificial Intelligence in Traffic Systems [0.0] この記事では、AIとトラフィック管理が交わるトピックについてレビューする。
AIによる交通信号制御システム、自動距離、速度認識などの分野で構成されている。
トラフィック管理におけるAIのメリットも様々である。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 18:15:49 GMT)
Approximation Power of Deep Neural Networks: an explanatory mathematical survey [0.0] この調査では、ニューラルネットワークがターゲット関数をいかに効果的に近似するかを調べ、従来の近似法より優れている条件を特定する。
主なトピックは、ディープネットワークの非線形で構成的な構造と、回帰と分類設定における最適化問題としてのニューラルネットワークタスクの形式化である。
このサーベイは、深いReLUネットワークの近似能力と他の近似手法の近似能力を比較することで、連続関数空間におけるニューラルネットワークの密度を探索する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 21:06:21 GMT)
Application of machine learning in grain-related clustering of Laue spots in a polycrystalline energy dispersive Laue pattern [0.0] 教師なし機械学習(ML)を用いて、エネルギー分散Laure回折実験における結晶粒対応Laure反射を同定する。
我々は,階層的クラスタリング(HC)とK平均(K-means)を組み合わせたクラスタリングアルゴリズムを用いて,ローパターンの粒度を同定する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 09:28:17 GMT)
Algorithmic Idealism II: Reassessment of Competing Theories [0.0] 本稿では、競合するフレームワークによるアイデンティティ、個人性、現実の交わりについて考察する。
固定アイデンティティの伝統的なメタ物理概念は、クローン化、テレポート化、デジタル複製の進歩によって挑戦される。
ルリアス・アンド・コンストラクタ理論(英語版)のような計算的アプローチは、創発的な現実に対する広範な見解を提供するが、しばしば観察者の関連性に対する実践的な制約を欠いている。
アルゴリズムの理想主義は統一的な枠組みとして導入され、現実は計算規則によって支配される創発的な構成であると主張する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 19:52:29 GMT)
Algorithmic Idealism I: Reconceptualizing Reality Through Information and Experience [0.0] アルゴリズム的理想主義は現実を理解するための変革的アプローチを表している。
自己状態の情報構造とアルゴリズムの遷移を強調する。
情報実体の連続性、重複、終了に関する深い倫理的な疑問を提起する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:33:43 GMT)
Agentic AI-Driven Technical Troubleshooting for Enterprise Systems: A Novel Weighted Retrieval-Augmented Generation Paradigm [0.0] 本稿では,企業の技術的トラブルシューティングに適したRAG(Weighted Retrieval-Augmented Generation)フレームワーク上に構築されたエージェントAIソリューションを提案する。
製品マニュアル、内部知識ベース、FAQ、トラブルシューティングガイドなどの検索ソースを動的に重み付けすることで、最も関連性の高いデータを優先順位付けする。
大規模エンタープライズデータセットに関する予備評価では、トラブルシューティングの精度を改善し、解決時間を短縮し、さまざまな技術的課題に適応する上で、フレームワークの有効性が示されている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 17:32:38 GMT)
Advancements and Challenges in Bangla Question Answering Models: A Comprehensive Review [0.0] 本稿では,この領域の進展に寄与する7つの研究論文の総合的なレビューを行う。
本稿では,注意機構を持つLSTMモデル,文脈に基づくQAシステム,事前知識に基づく深層学習技術など,革新的な手法を紹介する。
進歩にもかかわらず、十分な注釈付きデータの欠如、高品質な読解データセットの欠如、文脈における単語の意味を理解することの難しさなど、いくつかの課題が残っている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:42:26 GMT)
Advanced ingestion process powered by LLM parsing for RAG system [0.0] 本稿では LLM を利用した OCR を用いたマルチストラテジー解析手法を提案する。
この手法はノードベースの抽出手法を用いて、異なる情報タイプ間の関係を作り、コンテキスト対応メタデータを生成する。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 20:33:33 GMT)
Adaptive Intelligence: leveraging insights from adaptive behavior in animals to build flexible AI systems [0.0] 適応的な生物学的知能の行動的および神経的基盤、AIの並行的な進歩についてレビューし、より適応的なアルゴリズムを構築するための脳に触発されたアプローチを探る。
次のフロンティアは、従来のAIを超えて"適応知性(adaptive intelligence)"を開発することであり、ここで定義されているのは、生物学的インテリジェンスからの洞察を活用して、オンラインで学習し、一般化し、環境の変化に迅速に適応できるエージェントを構築することだ。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 14:28:01 GMT)
Accelerating Sparse Graph Neural Networks with Tensor Core Optimization [0.0] グラフセンスネットワーク(GNN)は、ソーシャルネットワーク、バイオインフォマティクス、計算、レコメンデーションシステムなどの分野に広く応用されている。
従来の計算手法は、GNNの性能要求を満たすには不十分である。
最近の研究では、CoresとCoresを使った並列アクセラレーションが検討されているが、大きな課題が続いている。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:57:53 GMT)
A comprehensive GeoAI review: Progress, Challenges and Outlooks [0.0] Geospatial Artificial Intelligence (GeoAI)は、最も関連性の高い研究と産業応用で注目を集めている。
本稿では,地理空間データに人工知能(AI)手法とモデルを適用した相乗的概念としてGeoAIを包括的にレビューする。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 10:41:02 GMT)
A Low-cost IoT Architecture to support Urban Mobility for Visually Impaired People [0.0] 本稿では,Single-Border Computers (SBC) を用いた低コストなIoTアーキテクチャの提案と評価を行った。
性能評価では,我々の低コストアーキテクチャがバストレースの作業負荷を処理し,障害のある人々がスマートシティのシナリオでバスの位置に関する情報を得るのに適していることが示された。
論文参考訳(メタデータ) (Mon, 16 Dec 2024 01:28:59 GMT)