什么是随机游走(Random Walk)

AI解读 2小时前 硕雀
2 0

随机游走Random Walk)是一种核心的随机过程Stochastic Process‍模型,广泛用于描述各种系统中‍“每一步的移动方向和步长由概率决定”‍的现象。

它不仅是统计物理学(如布朗运动)的基础,也是金融学(如股票价格波动模型)、生物学(如粒子扩散)、计算机科学(如图算法和机器学习)的重要工具。


1. 核心概念与定义

随机游走指的是在离散或连续的数学空间(如整数格子、二维平面、图结构)上,主体(如粒子、“蚂蚁”)在每个时间步骤上以一定的概率规则随机移动的过程。

核心特征

  • 随机性:每一步的移动方向(如向左/向右)或步长由随机变量决定,通常是均匀分布或其他已知分布。
  • 无记忆性(Markov性)‍:主体的下一步移动只依赖于当前所在的位置,而与过去的路径无关(除非特意设计成有记忆的变体,如自回避随机游走)。

2. 主要类型

随机游走的模型非常丰富,常见的分类包括:

类型 描述 典型应用/特征
简单随机游走(Simple Random Walk) 最基本的模型,通常在一维整数格子上进行,主体每一步以一定概率向左或向右移动一格。 经典的“醉汉行走”模型;金融学中的基础假设(股价涨跌概率相等)。
偏向随机游走(Biased Random Walk) 移动的概率不对称,例如向右的概率为0.7,向左为0.3。 描述有外力或趋势的系统(如河流中的漂流物)。
连续时间随机游走 位置是连续的(如实数轴),步长通常服从正态分布,这种模型在极限情况下趋近于布朗运动(Brownian Motion)‍。 物理学中的粒子扩散模型
图上的随机游走(Random Walk on Graph) 主体在图的节点之间跳转,以一定概率从当前节点移动到邻居节点。 PageRank算法(网页排名);网络节点相似度计算;社交网络分析。
带重启的随机游走(Random Walk with Restart, RWR) 在图上游走的同时,设定一定概率返回起始节点。 生物信息学中的蛋白质相互作用网络分析;推荐系统。

3. 关键性质

随机游走虽然看似混乱,但在统计上具有深刻的规律性:

  • 扩散性:随机游走的方差随时间线性增长。简单地说,主体离开原点的距离会随时间变大,但并不倾向于特定方向。
  • 极限定理:在一定条件下,大量独立随机游走的路径集合会趋向于正态分布(中心极限定理)。
  • 稳态分布:对于图上的随机游走,经过足够长的时间后,访问每个节点的概率会收敛到一个稳定的分布(Stationary Distribution),这正是PageRank得分的数学基础

4. 典型应用场景

随机游走的理论被广泛应用于各个学科:

  • 金融学随机游走假说(Random Walk Hypothesis)认为股票价格的走势是不可预测的,涨跌就像掷硬币一样。
  • 物理学:解释布朗运动(微小粒子在流体中的无规则运动)。
  • 计算机科学
    • 搜索引擎:Google的PageRank算法基于网页链接图的随机游走模型。
    • 网络分析:通过随机游走评估节点重要性、社群结构或预测链接。
    • 机器学习:节点嵌入(Node Embedding)算法(如DeepWalkNode2Vec)利用随机游走生成节点序列进行学习。

总结:随机游走不仅仅是一个数学游戏,它是连接“微观随机性”与“宏观规律性”的桥梁,帮助我们在复杂系统中找到隐藏的结构和模式。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!