메뉴버튼

엔지닉 반도체 데이터 분석 빡공스터디 1일차

상세페이지-메뉴
https://community.weport.co.kr/board_EouY72/109987848

전수조사를 하면 비용과 품질에 문제가 생겨 표본(sample)조사를 하는데 표본의 평균과 분산으로 모집단의 평균과 모분산을 추측해 볼 수 있다. 

Data 수집시 유의할 사항은 전체를 대표할 수 있어야 하고 표본의 크기가 충분히 클 때 무작위 추출한다. 무작위 분석이지만 의도하는 목적에 맞게 표본을 뽑아서 전체를 대표할 수 있도록 분석해야 한다.(미대선 여론조사 예측)평균,절사평균, 중앙값(Median),최빈값(mode),가중평균의 개념을 배웠다.

 

또한 각 data가 얼마나 퍼져있는지 나타내는 산포에 대해 배웠고, 튀는값이 별로 없이 산포가 작을수록 제품의 품질이 유지된다.

총 변동(Total Sum of Square, TSS): 편차 제곱의 합

자유도(Degree of Freedom): n개의 표본 데이터 → 자유도 = n-1 (평균이 고정되므로 마지막 값은 자유롭지 않음)

불편분산(Unbiased Variance): TSS ÷ (n-1), → n-1로 나누는 이유: 표본분산이 모분산의 추정치에 가깝도록 보정

변동계수(Coefficient of Variation, CV): 표준편차 ÷ 평균 × 100 (%), → 서로 다른 모집단의 상대적 변동성 비교 가능

 

Unbiasesd variance가 잘 이해가 가지 않았으나 다시 다룬다고 하니 앞으로 수업을 잘 들어야겠다

 

신고하기
close-icon

작성자 따뜻한고구마7538

신고글 엔지닉 반도체 데이터 분석 빡공스터디 1일차

사유선택
  • check-icon
    욕설/비하 발언
  • check-icon
    음란성
  • check-icon
    홍보성 콘텐츠 및 도배글
  • check-icon
    개인정보 노출
  • check-icon
    특정인 비방
  • check-icon
    기타

허위 신고의 경우 서비스 이용제한과 같은
불이익을 받으실 수 있습니다.

댓글 0