論文の概要: Breadth-First Search vs. Restarting Random Walks for Escaping Uninformed Heuristic Regions
- arxiv url: http://arxiv.org/abs/2511.09549v1
- Date: Thu, 13 Nov 2025 02:01:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.618681
- Title: Breadth-First Search vs. Restarting Random Walks for Escaping Uninformed Heuristic Regions
- Title(参考訳): 難解なヒューリスティック領域を脱出するランダムウォークの再起動に対するブレンドファーストサーチとリスタート
- Authors: Daniel Platnick, Dawson Tomasz, Eamon Earl, Sourena Khanzadeh, Richard Valenzano,
- Abstract要約: 非形式的ヒューリスティック領域(UHR)を脱出する2つの一般的な方法の比較を行う。
まず、UHRの特性とランダムウォーク手順に基づいて、BrFSとRRWを用いてUHRをエスケープする予測ランタイムを導出する。
次に, BrFS を用いて UHR を脱出する標準的な EHC と,その目的のために RRW を用いる EHCRRW と呼ばれる EHC の変種を比較して, これらの UHR の脱出方法を評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Greedy search methods like Greedy Best-First Search (GBFS) and Enforced Hill-Climbing (EHC) often struggle when faced with Uninformed Heuristic Regions (UHRs) like heuristic local minima or plateaus. In this work, we theoretically and empirically compare two popular methods for escaping UHRs in breadth-first search (BrFS) and restarting random walks (RRWs). We first derive the expected runtime of escaping a UHR using BrFS and RRWs, based on properties of the UHR and the random walk procedure, and then use these results to identify when RRWs will be faster in expectation than BrFS. We then evaluate these methods for escaping UHRs by comparing standard EHC, which uses BrFS to escape UHRs, to variants of EHC called EHC-RRW, which use RRWs for that purpose. EHC-RRW is shown to have strong expected runtime guarantees in cases where EHC has previously been shown to be effective. We also run experiments with these approaches on PDDL planning benchmarks to better understand their relative effectiveness for escaping UHRs.
- Abstract(参考訳): Greedy Best-First Search (GBFS) や Enforced Hill-Climbing (EHC) は、ヒューリスティック・ローカル・ミニマやプラトーのような非インフォームド・ヒューリスティック・リージョン (UHR) に直面すると、しばしば苦労する。
本研究では,広帯域探索(BrFS)におけるUHRのエスケープとランダムウォーク(RRW)の再起動の2つの手法を理論的,実証的に比較した。
まず、UHRの特性とランダムウォーク手順に基づいて、BrFS と RRW を用いて UHR をエスケープする予測ランタイムを導出し、これらの結果を用いて、RRW が BrFS よりも高速になるかどうかを判断する。
次に, BrFS を用いて UHR を脱出する標準的な EHC と,その目的のために RRW を用いる EHC-RRW と呼ばれる EHC の変種を比較して, これらの UHR の脱出方法を評価する。
EHC-RRWは、以前EHCが有効であることが示されている場合、強い期待実行保証を持つ。
また,これらの手法をPDDL計画ベンチマーク上で実験し,その相対的有効性についてよりよく理解した。
関連論文リスト
- Retrieval-Augmented Perception: High-Resolution Image Perception Meets Visual RAG [79.61269381878547]
マルチモーダル大言語モデル(MLLM)における高分解能画像認識の課題
本稿では,従来の専門的アプローチから脱却し,MLLMの長文能力を高めることにより,最も基本的な考え方を人事知覚に再考する。
本研究では,空間的コンテキストを保ちながら関連する画像作物を抽出・融合する学習自由フレームワークであるRetrieval-Augmented Perception (RAP)を提案する。
論文 参考訳(メタデータ) (2025-03-03T06:40:21Z) - STAIR: Improving Safety Alignment with Introspective Reasoning [44.780098674618614]
SafeTyアライメントとItrospective Reasoningを統合したフレームワークSTAIRを提案する。
その結果,STAIRは本能的アライメント戦略と比較して,有害なアウトプットを効果的に軽減し,有用性を保っていることがわかった。
テスト時のスケーリングでは、STAIRは一般的なジェイルブレイク攻撃に対して、Claude-3.5に匹敵する安全性能を達成する。
論文 参考訳(メタデータ) (2025-02-04T15:02:55Z) - Learning to Hash for Recommendation: A Survey [49.943390288789494]
このサーベイは、最先端のHashRecアルゴリズムの概要を提供する。
既存の研究を,(i)学習目標,(ii)最適化戦略,(iii)推薦シナリオに基づく3段階の分類に分類する。
論文 参考訳(メタデータ) (2024-12-05T05:07:19Z) - Expected Runtime Comparisons Between Breadth-First Search and Constant-Depth Restarting Random Walks [1.9735829027026905]
広帯域探索(BrFS)と一定深度再起動ランダムウォーク(RRW)の性能解析を行った。
RRW が BrFS よりも高速であることは,その目標深度に十分な目標がある場合に証明する。
我々の境界線は、木の分岐係数、ゴール深さ、ランダムウォーク深さの誤差とともに、交差点が直線的に成長することを示している。
論文 参考訳(メタデータ) (2024-06-24T15:00:59Z) - ResLoRA: Identity Residual Mapping in Low-Rank Adaption [96.59370314485074]
低ランク適応(LoRA)の改良フレームワークであるResLoRAを提案する。
提案手法は,LoRAと比較してトレーニング可能なパラメータや推論コストを必要とせずに,より少ないトレーニングステップでより良い結果を得ることができる。
NLG,NLU,テキスト・ツー・イメージタスクの実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-02-28T04:33:20Z) - PriorBand: Practical Hyperparameter Optimization in the Age of Deep
Learning [49.92394599459274]
我々は,Deep Learning(DL)パイプラインに適したHPOアルゴリズムであるPresideBandを提案する。
各種のDLベンチマークでその堅牢性を示し、情報的専門家のインプットと、専門家の信条の低さに対してその利得を示す。
論文 参考訳(メタデータ) (2023-06-21T16:26:14Z) - Hindsight Goal Ranking on Replay Buffer for Sparse Reward Environment [16.422215672356167]
本稿では,HGR(Hindsight Goal Ranking)と呼ばれるリプレイ体験の優先順位付け手法を提案する。
HGRは時間差(TD)の誤差が大きいエピソードに訪れた状態に対して高い確率で試料を採取した。
提案手法は,非政治モデル自由アクター批判アルゴリズムであるDeep Deterministic Policy Gradient (DDPG)と組み合わせることで,学習の高速化を図る。
論文 参考訳(メタデータ) (2021-10-28T12:09:10Z) - DETR for Crowd Pedestrian Detection [114.00860636622949]
提案した検出器PED(Pedestrian End-to-end Detector)は、CityPersonsとCrowdHumanの以前のEDとFaster-RCNNの両方より優れている。
また、最先端の歩行者検出手法と同等の性能を達成している。
論文 参考訳(メタデータ) (2020-12-12T11:02:05Z) - RBF-HS: Recursive Best-First Hitting Set Search [0.0]
本稿では,2つの新しい診断アルゴリズムを提案する。
RBF-HS (Recursive Best-First Hitting Set Search)とHBF-HS (Hybrid Best-First Hitting Set Search)
最小限の心不全説明の計算では,RBF-HSがメモリ要求を大幅に削減することがわかった。
論文 参考訳(メタデータ) (2020-10-08T22:09:39Z) - Best-First Beam Search [78.71330480725668]
本研究では,ビームサーチの標準実装を10倍高速に実現可能であることを示す。
ダウンストリーム性能の面でも同様に有益な探索バイアスを有するBest-First Beam Searchのメモリ再生版を提案する。
論文 参考訳(メタデータ) (2020-07-08T05:56:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。