
엔지닉 반도체 데이터 분석 스터디 25기 3일차

- 연속형 Data 종류
확률질량함수 p(x)가 아닌 확률밀도함수 f(x)로 식이 쓰여진다.
균등분포 특정 구간에 대한 모든 확률이 동일 – 시계 분침이 특정 구간에 있을 확률
지수분포 대기시간에 대한 확률 – 버스를 기다리는 시간
정규분포 평균 근처로 Data가 모여 있는 경우 – 키, 몸무게
t-분포 표본을 통한 모평균 추론
카이제곱분포 표본을 통한 모분산 추론
F분포 분산분석에 사용
- 균등 분포
특정 구간 [a, b]에서 어떤 값이 일어날 확률이 모두 동일한 분포
시계 분침이 특정 구간에 있을 확률
- 지수 분포
λ는 단위시간 당 발생율을 의미
대기시간 등을 계산할 때, 사용되는 확률분포, 지금부터 기다려야 할 시간은 이전에 기다렸던 시간과는 독립적
인터넷에서 다음 패킷이 도착할 때까지의 시간, 버스 기다리는 시간, 특정 제품의 수명 등
- 정규 분포
특정 확률을 가진 변수나 오차 등의 분포가 정규분포를 따름
Ex) DRAM Latency의 spec이 10ns +-2ns 일 때, N(10, 12)의 분포를 따름
실생활에서 접하는 변수 등도 대부분 정규분포를 따름
Ex) 키, 몸무게 등
- 이항 분포의 정규 근사
일반적으로 이항분포의 n이 충분히 크게 되면 정규분포의 형태에 근사하게 된다. (n>30)
- 표준 정규 분포
평균이 0, 분산이 1인 표준정규분포에 따르게 됨
정규분포의 형태를 표준정규분포로 변환 후, 특정 범위 내의 확률을 구할 수 있음.
- t 분포
표본평균을 표준화시키는 과정에서 모표준편차(σ)를 모를 경우, 추정량 s를 통해 모평균(μ)의 추론에 이용
t분포는 0을 중심으로 좌우대칭이며, 표준정규분포와 흡사한 모양, 정규분포에 비해, 넓게 퍼져 있는 형태이며, n=∞ 일 때, 표준정규분포와 일치
- 카이 제곱
정규분포로부터 추출한 표본에서 Sum of Square를 모집단의 분산으로 나눈 통계량
모분산의 추론에 사용, 오차 제곱합에 대한 확률분포
좌우대칭
작성자 성실한오리1865
신고글 엔지닉 반도체 데이터 분석 스터디 25기 3일차
- 욕설/비하 발언
- 음란성
- 홍보성 콘텐츠 및 도배글
- 개인정보 노출
- 특정인 비방
- 기타
허위 신고의 경우 서비스 이용제한과 같은
불이익을 받으실 수 있습니다.