1. Random Walk 이란?
ㅇ 단위 보행 마다 움직이는 방향 및 보폭이 랜덤한 확률적 현상을 나타내는 말
ㅇ n회 걸음 후 출발점부터의 총 이동 거리를 확률적으로 추정하는 문제
- n이 무한대이면, 확률분포가 정규분포에 접근하며,
- n이 극한으로 연속이면, 물리적으로 브라운 운동으로 묘사됨
ㅇ Yn = Yn-1 + en
- Yn : n번째 보행까지 이동한 거리
- e : 무작위한 단위 걸음
ㅇ 例) 도박, 주가 시세 변화, 브라운 운동, 기체 분자의 확산 등
2. 단순 확률 보행 (Simple Random Walk)
ㅇ 확률 보행의 특별한 경우로써,
- 단위 걸음이 +1,-1 처럼 단지 두 경우 만 있을 경우를 말함
- 만일, 두 경우 각 확률이 서로 같을(대칭)때는,
. 대칭 단순 확률보행(Symmetric Simple Random Walk) 이라고 함
3. 단순 확률 보행의 확률 계산 예시(例示) 및 의미
ㅇ 매 시점(걸음) 마다 확률변수 : {#X_i = \{+1, -1\}#}
ㅇ (+1),(-1) 각 경우의 발생 확률 : {#p = \frac{1}{2}#}
ㅇ t번 걸었을 때의 전체 이동량 : {#S_t = X_1 + X_2 + \cdots + X_t#}
ㅇ 확률변수 {#X_i#}의 기대값(평균) : {#E[X_i] = \sum^n_{i=1} x_i P(x_i) = (+1)\frac{1}{2} + (-1)\frac{1}{2} = 0#}
ㅇ 확률변수 {#X_i#}의 분산 : {#Var(X_i) = E[X_i^2] - (E[X_i])^2 = 1 - 0 = 1#}
ㅇ 전체 이동량(합) {#S_t#}의 분산 :
- {#X_i#}들은 서로 독립이므로, 합 {#S_t#}의 분산은 단순히 합쳐짐
- {#Var(S_t) = Var(X_1 + X_2 + \cdots + X_t) = t \cdot Var(X_i) = t#}
ㅇ 전체 이동량(합) {#S_t#}의 표준편차 : {#\sigma_{S_t} = \sqrt{Var(S_t)} = \sqrt{t}#}
ㅇ 전체 이동량(합) {#S_t#}의 확률분포 :
- {#X_i#}들이 서로 독립이고 평균 0, 분산 1이므로,
- {#S_t#}의 확률분포는, t가 커질수록 `정규분포`에 근사함 (중심극한정리)
ㅇ 중심극한정리 (정규분포로의 수렴) :
[#\frac{S_t - E[S_t]}{\sqrt{Var(S_t)}} = \frac{S_t}{\sqrt{t}} \rightarrow \mathcal{N}(0,1)#]
- 여기서, 표준화 확률변수 : {#Z_i = \frac{X_i - μ}{σ} = \frac{S_t - E[S_t]}{\sqrt{Var(S_t)}}#}
. 평균 0, 표준편차 1로 변환된(표준화된) 표준 정규분포의 표준화된 확률 변수
ㅇ 결국, 랜덤보행의 합은, 평균 0, 분산이 시간 t에 비례하는 정규분포가 됨
ㅇ 만일, 각 걸음의 표준편차가 {#σ#}라면, : {#Var(X_i) = \sigma^2 #}
- 전체 이동량(합)의 분산 : {#Var(S_t) = t\sigma^2#}
- 전체 이동량(합)의 표준편차 : {#σ\sqrt{t}#}
ㅇ 따라서, 시간이 흐를수록,
- 각 걸음의 기대값(평균)은, 0 이지만,
- 전체 이동량(합)은, 때론 큰 값이거나 때론 작은 값일 수 있으며,
- 전체 이동량(합)의 확률분포는, 표준편차가 {#σ\sqrt{t}#}인 정규분포로 근사됨
ㅇ 이를 물리적으로 설명하면,
- 시간이 두 배가 되면, 이동의 "불확실성(흩어짐의 폭)"이, 2배가 아니라 √2배가 됨
- 즉, "확률적 확산"의 속도는, 시간의 제곱근에 비례한다는 뜻임