本发明属于高超声速飞行器轨迹设计领域,具体涉及一种基于Q-learning算法的高超声速飞行器动态路径规划方法。该方法中假设飞行器进入巡航阶段,飞行速度定常,飞行高度不变。包括以下步骤:1)       建立飞行器飞行场景,建立符合高超声速飞行器飞行特性的环境。2)为高超声速飞行器建立搜索策略,即在任一状态下的动作选择集。3)为高超声速飞行器建立合理的奖励值函数,能够使飞行器在与环境交互中获得最大的累计奖励。4)    在已知起点与终点的情况下,为飞行器规划出一条能够避障的路径。该方法不需要建立环境的动态特性模型即可做出策略预测及最优决策,实现高超声速飞行器对未知威胁的动态避障, 可用于未知障碍下的飞行器路径规划问题。