엔지닉 반도체 데이터 분석 스터디 25기 3일차

성실한오리1865

2025.06.18 17:21

조회 3추천 0스크랩 0

https://community.weport.co.kr/board_EouY72/109952337

- 연속형 Data 종류

확률질량함수 p(x)가 아닌 확률밀도함수 f(x)로 식이 쓰여진다.

균등분포 특정 구간에 대한 모든 확률이 동일 – 시계 분침이 특정 구간에 있을 확률

지수분포 대기시간에 대한 확률 – 버스를 기다리는 시간

정규분포 평균 근처로 Data가 모여 있는 경우 – 키, 몸무게

t-분포 표본을 통한 모평균 추론

카이제곱분포 표본을 통한 모분산 추론

F분포 분산분석에 사용

- 균등 분포

특정 구간 [a, b]에서 어떤 값이 일어날 확률이 모두 동일한 분포

시계 분침이 특정 구간에 있을 확률

- 지수 분포

λ는 단위시간 당 발생율을 의미

대기시간 등을 계산할 때, 사용되는 확률분포, 지금부터 기다려야 할 시간은 이전에 기다렸던 시간과는 독립적

인터넷에서 다음 패킷이 도착할 때까지의 시간, 버스 기다리는 시간, 특정 제품의 수명 등

- 정규 분포

특정 확률을 가진 변수나 오차 등의 분포가 정규분포를 따름

Ex) DRAM Latency의 spec이 10ns +-2ns 일 때, N(10, 1²)의 분포를 따름

실생활에서 접하는 변수 등도 대부분 정규분포를 따름

Ex) 키, 몸무게 등

- 이항 분포의 정규 근사

일반적으로 이항분포의 n이 충분히 크게 되면 정규분포의 형태에 근사하게 된다. (n>30)

- 표준 정규 분포

평균이 0, 분산이 1인 표준정규분포에 따르게 됨

정규분포의 형태를 표준정규분포로 변환 후, 특정 범위 내의 확률을 구할 수 있음.

- t 분포

표본평균을 표준화시키는 과정에서 모표준편차(σ)를 모를 경우, 추정량 s를 통해 모평균(μ)의 추론에 이용

t분포는 0을 중심으로 좌우대칭이며, 표준정규분포와 흡사한 모양, 정규분포에 비해, 넓게 퍼져 있는 형태이며, n=∞ 일 때, 표준정규분포와 일치

- 카이 제곱

정규분포로부터 추출한 표본에서 Sum of Square를 모집단의 분산으로 나눈 통계량

모분산의 추론에 사용, 오차 제곱합에 대한 확률분포

좌우대칭

스터디 학습일지 작성