엔지닉 반도체 데이터 분석 빡공스터디 1일차

따뜻한고구마7538

2025.06.18 23:00

조회 5추천 0스크랩 0

https://community.weport.co.kr/board_EouY72/109987848

전수조사를 하면 비용과 품질에 문제가 생겨 표본(sample)조사를 하는데 표본의 평균과 분산으로 모집단의 평균과 모분산을 추측해 볼 수 있다.

Data 수집시 유의할 사항은 전체를 대표할 수 있어야 하고 표본의 크기가 충분히 클 때 무작위 추출한다. 무작위 분석이지만 의도하는 목적에 맞게 표본을 뽑아서 전체를 대표할 수 있도록 분석해야 한다.(미대선 여론조사 예측)평균,절사평균, 중앙값(Median),최빈값(mode),가중평균의 개념을 배웠다.

또한 각 data가 얼마나 퍼져있는지 나타내는 산포에 대해 배웠고, 튀는값이 별로 없이 산포가 작을수록 제품의 품질이 유지된다.

총 변동(Total Sum of Square, TSS): 편차 제곱의 합

자유도(Degree of Freedom): n개의 표본 데이터 → 자유도 = n-1 (평균이 고정되므로 마지막 값은 자유롭지 않음)

불편분산(Unbiased Variance): TSS ÷ (n-1), → n-1로 나누는 이유: 표본분산이 모분산의 추정치에 가깝도록 보정

변동계수(Coefficient of Variation, CV): 표준편차 ÷ 평균 × 100 (%), → 서로 다른 모집단의 상대적 변동성 비교 가능

Unbiasesd variance가 잘 이해가 가지 않았으나 다시 다룬다고 하니 앞으로 수업을 잘 들어야겠다

스터디 학습일지 작성

엔지닉 반도체 데이터 분석 빡공스터디 1일차