메뉴버튼

엔지닉 반도체 데이터 분석 빡공 스터디 2회차

상세페이지-메뉴
https://community.weport.co.kr/board_EouY72/109984047

연속형 데이터와 이산형 데이터의 분포 및 특징 학습

2회차에서는 데이터 유형 구분과 대표적인 확률분포에 대해 학습했다.
데이터는 수치형(이산형, 연속형)과 범주형으로 구분후 다르게 분석해야 한다.연속형 데이터는 제품의 전력소모량, 무게, 분석시간 등에서 많이 사용된다.

이산형 데이터는 셀 수 있는 값으로, 확률질량함수(p(x))를 사용한다. 

베르누이분포:1회 시행했을 때 pass/fail형태

이항분포:n회 시행 성공 횟수에 대한 분포

다항분포:3개 이상의 다양한 케이스가 있을 때  결과의 횟수 분포

기하분포:첫 성공까지 시행 횟수 분포

음이항분포:r회 성공까지 시행 횟수),

포아송분포:사건 발생이 서로 독립적이고, 단위 시간당 평균 발생횟수 λ이다 자동 생산공정에서 찍어내는 제품 대비 특정시간 동안의 불량개수를 알 때 등에 유용하다.

각 분포별 조건과 적용 사례를 명확히 구분한 후,실제 데이터셋을 통해 응용력을 높이고 싶다.

사진은 음이항 분포의 기대값 유도(빨강글씨)와 푸아송분포 공식 p(x)유도#엔지닉 #반도체데이터분석

신고하기
close-icon

작성자 따뜻한고구마7538

신고글 엔지닉 반도체 데이터 분석 빡공 스터디 2회차

사유선택
  • check-icon
    욕설/비하 발언
  • check-icon
    음란성
  • check-icon
    홍보성 콘텐츠 및 도배글
  • check-icon
    개인정보 노출
  • check-icon
    특정인 비방
  • check-icon
    기타

허위 신고의 경우 서비스 이용제한과 같은
불이익을 받으실 수 있습니다.

댓글 0