Variance   분산 [통계], 분산 (Variance)

(2020-02-04)

분산 [Variance]

Top > [기술공통]
[기초과학]
[진동/파동]
[전기전자공학]
[방송/멀티미디어/정보이론]
[통신/네트워킹]
[정보기술(IT)]
[공학일반(기계,재료등)]
[표준/계측/품질]
[기술경영]
기초과학 >   1. 과학
[수학]
[물리]
[화학]
[지구,천체 과학]
[생명과학]
[뇌과학]
수학 >   1. 수학
[기초수학]
[집합,논리]
[해석학(미적분 등)]
[대수학]
[확률/통계]
[수치해법]
확률/통계 > [확률 이란?]
[확률 정리/법칙]
[확률 공간]
[확률 모형,분포]
[확률 변수]
[확률 과정]
[통계량]
[통계학]
통계량 >   1. 통계량
  2. 모멘트(원점적률,중심적률)
  3. 적률생성함수
  4. 비율
[집중경향]
[산포/분산]
[형태/모양]
산포/분산  1. 편차/변동/변동계수
  2. 분산(Variance)
  3. 표준편차(Standard Deviation)
  4. 분위수 (백분위수,사분위수)

1. 분산 (Variance)

  ㅇ 자료들이 불규칙하게 분포하는 정도를 나타내는 통계량   
     - 자료들이 기대값(평균값)으로부터 얼마나 퍼져 있는가를 가늠해볼 수 있음
        . 분산이 클수록 자료 집단에 변화가 큼을 나타냄


2. 분산의 활용산포의 경향을 알기위해 분산 및 표준편차가 많이 사용됨
     - 주어진 자료들의 평균, 최소, 최대 값 만으로는 자료 특성 파악이 어려움
     - 특히, 자료들의 산포(흩어짐)의 경향 또는 자료가 평균을 중심으로 어느정도 흩어져 있는가
     - 등을 알고자 할 때가 그런 경우임


3. 분산의 표현

  ㅇ 분산 이란?
     - 편차 제곱 합(변동)을 데이터 수로 나눈 값        ☞ 변동성(Variability) 참조
  
  ㅇ 즉, 분산은 제곱된 편차들의 산술평균 임
     - 편차 = (데이터값) - (데이터들의 평균값)
     - 변동 = (편차 제곱 합) = (편차 1)2 + (편차 2)2 + ...
     - 분산 = (변동) / (데이터 수) = (편차 제곱 합) / (데이터 수)

     * 결국, 분산은, 변동성(Variability) 개념을 평균 개념으로 요약한 것임

  ㅇ 분산의 표기
     - 보통  Var[X] 또는 σX2 또는 σ², S2 등으로 표기

  ㅇ 분산의 표현식
     -  Var[X]  =  E [(X-μX)2]  =  σX2
        . 즉, 편차(평균에서 떨어진 거리)의 제곱의 기대값과 같음

     - 한편, 행렬,벡터에 의한 분산의 표현식
        . 편차 벡터 : x = (x1 - x̅, ... , xn - x̅)
        . 분산 : Var[X] = (1/n) xTx = (1/n) <x,x>


4. 분산과 산포 형상 간의 의미

  ㅇ 분산이  0 에 가까울수록,
     - 자료의 산포 변동이 심하지 않으며, 
     - 대체로 자료들이 평균에 몰려 있음을 의미함


5. 분산의 계산식

  ㅇ 자료 분산 (Data Variance)
     
     - (N : 자료 개수, N-1 : 자유도, X- : 자료 평균)

  ㅇ 모 분산 (Population Variance)
     
     - (N : 모집단 개수, μ : 모 평균)

  ㅇ 표본 분산 (Sample Variance)
     
     - (n : 표본 개수, n-1 : 자유도, x- : 표본 평균)


6. 분산의 성질(관계식)

  ㅇ  Var[X] = E[X2] - (E[X])2 = E[X2] - μX2

  ㅇ  Var[X] = E[X(X-1)] + E[X](1 - E[X])

  ㅇ  Var[aX + b] = a2 Var[X]


[산포/분산] 1. 편차/변동/변동계수 2. 분산(Variance) 3. 표준편차(Standard Deviation) 4. 분위수 (백분위수,사분위수)

    요약목록

Copyrightⓒ written by 차재복 (Cha Jae Bok)     (소액후원)