반응형

데이터분석 12

[데이터분석] 윈스펙 K디지털기초역량훈련 후기

안녕하세요! 데이터 분석의 마지막 글, '윈스펙 K디지털기초역량훈련' 후기를 작성해 보겠습니다! 먼저 저는 윈스펙의 "엑셀로 쉽게 배우는 반도체 데이터 분석과정"을 수료했습니다. 위 과정은 윈스펙의 'K디지털기초역량훈련'으로, 내일배움카드 발급이 가능한 저는 환급까지 받으며 쉽게 수료했습니다! 10개의 챕터와 7개의 과제와 함께 총 23개의 강의로 구성되어 있습니다. 그리고, 마지막 최종 과제까지 제출하면 수료가 가능합니다!! 이전 게시글을 보면 어떠한 내용을 배우는지, 실습은 어떻게 진행하는지 확인하실 수 있을거에요 :) 위 강의의 좋은점을 생각해 보면, 1) 내일배움카드를 통한 수강비 지원이 가능하다! 2) 엑셀 실습자료가 있어 분석 방법에 대한 이해를 더 높일 수 있고, 실습 해설이 정말 잘 되어 ..

[반도체데이터분석] 요인배치법

안녕하세요 :) 데이터분석 마지막 글, 요인배치법에 대해 알아보려 합니다! 앞에서는 실험을 설계하고, 유의미한 결과들의 관계를 확인했다면, 이번 글에서는 각 요인을 구체적으로 define하고 실험 스킬을 효율적으로 하는 요인배치법에 대해 알아보겠습니다! 마지막까지 파이팅해서 써보겠습니다! 요인배치법(Factorial Design) 요인 실험은 과 같이 나타내고, 모든 인자간의 수준 조합에서 실험을 진행하게 됩니다. 반복을 피해도 최소한 K^n번 실험을 해야하고, 랜덤한 순서로 진행해야 합니다. 요인실험은 모든 요인들의 주효과(인자 단일효과)와 2인자간의 교호작용을 추정할 수 있습니다. 고려되는 인자 수에는 제한이 없지만, 2^n 부분배치법은 2^n번 실행하게 됩니다. 실험 계획 초기에 인자가 많다면 sc..

[반도체데이터분석] 분산분석

안녕하세요! 이번 데이터분석에서 다룰 내용은 '분산분석'입니다. 데이터 분석의 꽃...!! 저는 배우면서 너무 재밌었어요 ㅎㅎ 배운대로 잘 정리해보겠습니다! 분산분석(Analysis of Variance => ANOVA) 분산분석은 2개 이상 하위모집단 간의 평균 차이가 통계적으로 유의한지 검증하는 과정을 말합니다. 귀무가설 H0은 모든 평균에 차이가 없다를 가정하고, 대립가설 H1은 평균에 차이가 있다를 가정합니다. 하위모집단 간의 분산(특정 요인에 의한 변동)과 하위모집단 내의 분산(우연에 의한 변동)을 비교하는데, 이때 사용하는 분석은 F분석을 사용해 유의수준에 비교하여 검증하게 됩니다. 평균차이가 많이나고 각각 분산이 적당한 경우 그에따른 요인이 실험에 영향을 미치는구나라고 판단..

[반도체데이터분석] 실험계획법

안녕하세요! 오늘 데이터분석에서 다뤄볼 내용은 실험계획법 입니다! 이전에는 데이터를 어떻게 분석하느냐 에대해 배워왔다면, 이후부터는 데이터를 어떻게 수집하고 실험은 어떻게 진행할 것인지에 대한 내용을 알아보려 합니다. 실험계획법 실험계획법, DOE(Design of Experiments)는 제품의 특성에 영향을 미치는 여러 인자를 선정하는 것 입니다. 이 인자들의 관계를 알아보기 위한 실험을 진행하고, 제품 최적조건을 최소노력과 최소비용으로 찾아내는 기법입니다. 즉, 경제성과 효율성을 추구하는 방법입니다. 여기서 말하는 실험은, 출력 변화에 대한 원인을 관찰할 수 있도록 공정이나 시스템 입력변수에 계획된 변화를 가하는 일련의 시행을 말합니다. 위 그림처럼 제어가 가능하거나 불가능한 인자..

[반도체데이터분석] 관리도

안녕하세요! 이번 데이터 분석 내용은 ’관리도‘입니다. 복잡한 수식은 없지만, 공정관리에서 연관이 큰 부분이라고 할 수 있겠네요! 관리도 관리도는 공정에 이상이 발생했을 때, 가능한 이를 빨리 탐지하여 수정조치를 취함으로써 불량제품의 발생을 사전에 억제하기 위해 사용하는 방법입니다. 국내에는 KSA3201(관리도법)이 제정되어 있어서, KS 허가공장을 중심으로 생산공장에 파급되며 사용됩니다. 물론 삼성전자, 하이닉스와 같은 대기업도 적용되어 있고 반도체 공장은 더욱 tight한 조건을 가지고 관리하고 있습니다. 관리도에는 관리한계선이 존재하는데, 중심선(CL;center line), 관리상한선(UCL;upper control line), 관리하한선(LCL;lower control line) 으로 구성되어..

[반도체데이터분석] 회귀분석

안녕하세요! 이번 글은 지난 글인 상관분석에 이어서 회귀분석에 대해 알아보려 합니다. 상관분석은 두 변수 사이의 상관관계를 -1~1 사이의 상관계수로 나타내는 분석방법이었습니다. 반면 회귀분석은 둘 사이의 관계를 수식으로 정립해주고, 다양한 분석을 진행하게 됩니다. 이 회귀분석, 지금부터 정리해보겠습니다! 회귀분석이란 회귀분석은 두 변수 사이의 함수관계(회귀방정식)을 찾아내고 분석하는 기법을 말합니다. y=f(x)라는 회귀방정식을 구하는데, x는 독립변수, y는 종속변수로써의 역할을 합니다. 이 방정식을 통해 새로운 x data를 넣었을 때 y data를 추론할 수 있습니다. 일반적으로 선형회귀를 사용하는데, (simple is best!) 회귀분석의 목적인 '추론'을 위해서는 1차식인 선형방정식이 가장..

[반도체데이터분석] 상관분석

안녕하세요! 이번 글은 상관분석에 대해 알아보겠습니다! 분석 도구 저번 글에서(가설설정), 다음과 같은 데이터 유형에 따른 분석도구에 대한 표를 보았습니다. 위를 통해 상관분석은 인자가 모두 연속형일 때 사용하는 분석임을 확인할 수 있었습니다. 이러한 상관분석은 다음과 같은 직선적 관계가 가시적으로 잘 드러날 때 사용하게 됩니다. 산점도 산점도는 그래프를 통해 가시적으로 관계를 쉽게 파악할 수 있습니다. 지수화를 하지 않고 단순하게 표현하였기 때문에, 객관적이지 않다는 단점이 존재합니다. 위 그래프에서 강한정도와 약한정도를 나누는 것은 기울기의 차이가 아닌, 직선을 기준으로 data의 퍼짐이 적을수록 강한 상관관계, 퍼짐이 클수록 약한 상관관계로 표현합니다. 그리고 ⑥비선형 관계와 같은 경우에는 상관분석..

[반도체데이터분석] 가설검정

안녕하세요! 이번 글은 '가설 검정'에 대한 내용입니다. 데이터 분석에서 중요하게 쓰이기도 하고 처음 보는 내용이 많아 조금 어려웠네요ㅎㅎ.. 여러번 복습하고 이해하면서 완벽하게 활용하도록 해보겠습니닷 💪 분석 도구 데이터를 분석하는 방법에는 여러가지가 있는데, 서로다른 두 인자 X, Y의 data 유형에 따라 분석도구가 달라집니다. 두 인자간의 관계를 분석하기 위한 그래프, 통계 분석 방법론은 아래와 같습니다. 또한 집단간을 비교할 때도 다음과 같은 방법들을 사용하여 진행하게 됩니다. 그래프 분석 그래프 분석에 대해 조금 자세히 적어보자면 아래와 같습니다. - 그래프를 활용하면 X에 의한 Y의 관계를 개략적으로 파악, 공정에 대한 평균치 이동/산포 등을 가시적으로 확인 가능 - 그림을 보는 것이기 때문..

[반도체데이터분석] 공정능력

안녕하세요! 이번에는 데이터 분석에서 사용하는 '공정능력'에 대해 알아보려 합니다! ( 식스시그마 자격증을 딸 때, 이 내용을 배웠었는데 ... 새록새록하네요 😎 ) 공정능력 먼저, 공정능력은 '생산공정이 요구조건에 맞춰 얼마나 균일한 품질의 제품을 생산할 수 있는가'에 대한 생산능력치를 말합니다. 품질 관리를 통해 공정의 미래 수행능력을 평가하는 지표가 되는 것이죠. 그리고 규격한계(Spec Limit) 대피 공정의 수행능력을 수치로 표현한 것을 공정능력지수라고 합니다. 중심이 target에 가깝고, 산포가 적어야지 우수하다고 판단합니다. 공정능력 지수에는 전통지수인 Cp, Cpk, Pp, Ppk와 6시그마인 DPU, DPMO, Zst, Zlt, Zbench등이 있습니다. 데이터의 유형에 따라 공정능력..

[반도체데이터분석] Data 유형

안녕하세요! 오늘은 데이터의 유형에 대해 알아보려 합니다! 이번 내용도 저번 내용과 마찬가지로 고등학교때와 대학교때 접해본 내용이 있어서 이해가 쉬울 것 같아요 :) Data 유형 먼저, data의 유형을 분리하는 것이 왜 중요한지 알아보겠습니다. data의 형태에 따라 분석 방법, 계산법과 같은 후속 작업이 달라지기 때문에, 이에 대한 정확한 판단과 고민이 필요합니다. 그리고 data는 크게 이산형과 연속형으로 나눠집니다. 이산형(descrete) data는 자연수, 정수로 주로 표현되고 주로 ~개, ~건과 같은 단위로 적용됩니다. wafer 불량 개수, PKG test fail 개수, 고객 불만족 건수 등이 이 예시가 됩니다. 이산형 데이터는 확률질량함수 p(x)로 표현되고, 확률의 합은 시그마로 합..

반응형