안녕하세요!
이번에 작성을 시작한 '데이터 분석' 카테고리는 수강하고있는 강의 정리를 목적으로 형성했습니다.
저는 반도체 분야로 취업을 희망하고 있고, 평가/품질 분야에 지원을 하기 위해 이 강의를 수강했습니다.
파이썬과 C언어를 다룰 수 있지만, 엑셀로 데이터를 분석해보고자 진행하게 되었습니다 :)
이번 글은 Orientation, OT 내용이고
Data 분석이란 무엇인가에 대한 주제로 정리해보려 합니다!
- Data 분석의 필요성
'Data 분석'에 대한 큰 의미를 보면,
현장의 수 많은 데이터는 날것 그 자체, raw data이기에 큰 가치가 존재하지 않습니다.
그렇기에 체계적으로 수집하고 분석하고 관리하고 가공하기 위한 지식이 필요하고,
이러한 과정를 거침으로써 유용한 정보로 사용할 수 있게 됩니다.
많은 data를 통해 의미있는 통계를 냈다면, 수치적 근거를 마련할 수 있게 되고 의사 결정에 중요한 영향을 미치게 됩니다.
즉, Data 분석은 어떤 수치적, 과학적 근거를 마련하여 합리적인 의사결정을 돕는 활동이라고 표현할 수 있습니다.
그럼 반도체 산업에서 'Data 분석'은 왜 필요할까요?
'반도체'는 사실 물리적으로 표준분포를 따르거나 양자역학, 수율과 같은 부분이 확률로써 표현됩니다.
그리고 공정 과정 자체에서 다양한 변수가 존재하기에 변수에 취약하고, nm의 설비에서 작은 이슈는 큰 변화가 됩니다.
다시 말해, 많은 변수로 인해 취약해 지면서 제품의 질 차이가 크게 일어나는 거죠.
반도체 품질에 문제가 생긴 경우, 다양한 sample의 결과를 통해 어느 공정에서 생긴 문제인지 엔지니어가 다양한 가정을 세우고 분석해야 하기 때문에, 이러한 방법론들을 제시하는 것이 바로 'Data 분석'인 것입니다.
- 문제 해결 방법에서 Data 분석 사용
문제 해결 과정에서 사용되는 data 분석이 어떻게 활용되는지 다음과 같은 표로 정리할 수 있습니다.
문제 해결 과정 | Data 분석 활용 |
현상 관찰 (문제 발견 이전) | 표본추출, 관리도 |
문제 감지 | 관리도, 기술통계 |
Data 취합 | 표본추출, 측정, 기술통계 |
비교, 판단 | 분산분석 -> 결론 |
원인 분석 | 상관분석 |
예측 | 추정 및 검정 |
문제해결 방안 및 요인 탐색 | 실험계획법 |
관리 및 유지 | 관리도 |
위 과정을 차례대로 반복하며 문제를 해결할 수 있습니다.
- 반도체 Process에서의 사례
위 표 내용을 반도체 Process에 적용시켜 가볍게 알아봅시다!
(자료에는 불화수소 관련 예시가 있지만, 품질 부트캠프에서 겪었던 예시를 적용해보겠습니다!)
1) 현상 관찰, 문제 감지 (표본추출, 관리도)
기존에는 사람이 직접 관찰하는 방법을 사용했는데, 사람마다 다른 기준/컨디션에 따른 human error이 존재했기 때문에,
이를 방지하기 위해 관리도와 같은 방법을 활용하게 되었습니다.
data 분석을 활용하여 system하게 처리할 수 있도록 하는 것입니다.
만약 문제가 감지되면, 설비 로그를 관찰하고 표본을 추출할 수 있습니다.
관리도에는 rule이 존재하는데, 엄격한 조건을 가질수록 rule의 갯수가 증가합니다.
반도체 분야에서는 이 rule의 갯수가 많다고 합니다.
2) data 취합 (표본추출, 측정, 기술통계)
문제가 되는 설비에서 의심되는 원인에 대한 측정을 수행해 data를 얻는 과정입니다.
이때의 표본추출은 1)의 표본에서 문제가 발생된 표본에서 다시 표본을 추출하여 사용하는 것 입니다.
예를 들어, CVD가 제대로 진행되지 않은 경우, 다른 회사 제품으로 변경하여 측정하게 됩니다.
3) 비교, 판단 (분산분석)
같은 회사 제품으로 측정한 집단 내 오차와, 다른 회사 제품으로 측정한 집단 간의 오차를 비교하는 분산분석을 하게됩니다.
기존 CVD를 진행한 A회사 제품으로 진행할 때 수율이 91-93%(평균 92%)이면 집단 내 2%의 오차를 가지게 됩니다.
다른 회사인 B 제품으로 진행했을 때 수율이 90-92%(평균 91%)로 측정되면, 집단 간 오차는 1%가 됩니다.
집단 내 오차가 집단 간 오차보다 크기 때문에,
A에서 B로 제품을 변경해도 의미있는 결과가 없다 판단할 수 있게 됩니다.
4) 원인 분석 (상관분석)
원인을 분석하기 위해, 추측되는 원인과 결과간의 상관관계를 찾게 됩니다.
CVD 장비 내에 들어가는 반응성 가스의 순도가 다를 경우, 순도에 의한 불량률의 추이를 분석할 수 있습니다.
이 순도는 제작 회사마다 다르기 때문에, quality와 불량률 등의 상관관계를 확인할 수 있습니다.
5) 예측 (추정 및 검정)
표본을 통해 추출하였기 때문에, 표본에 따른 신뢰도 차이가 존재할 것 입니다.
평균의 차이가 있더라도 그 값이 유의미한 수준인지를 판단하고 계산하는 단계입니다.
6) 분제 해결 방안 및 요인 탐색 (실험계획법)
문제를 해결하기 위해 기존 문제 의외에 다른 인자들을 고려하여 적절하게 조합하고 이를 통한 실험을 설계해야 합니다.
제품 A/B를 사용하고 가스 A/B를 사용하면, 가능한 조합은 AA, AB, BA, BB가 있고 각각의 시너지 효과를 분석할 수 있게됩니다.
이때 각 인자는 매우 많이 존재하기 때문에 실험계획법으로 실험을 단순화시켜 원하는 값을 얻어낼 수 있습니다.
7) 관리 및 유지 (관리도)
6)으로 특정 인자나 인자 조합으로 원인을 찾은 후, 이를 관리도에 반영하여 문제를 해결하고 방지할 수 있게 합니다.
위와 같은 과정을 겪음으로써 반도체 process에서 발생하는 문제를 data 분석을 통해 해결할 수 있습니다!
data분석이 반도체 직무에 많이 활용됨을 배움으로써 더욱 흥미롭게 공부할 수 있을 것 같습니다..!
(제품 품질관리, 평가분석에서 데이터의 경향을 통해 수치화된 자료로 제시 가능하다!)
또한 이 과정을 통해 기본적인 통계지식 & data 유형을 이해하고, data간의 관계와 설득력에 대한 판단이 가능해지며, 계획적인 실험 set-up이 가능해 질 것 같습니다.
그리고 다음과 같은 직무능력이 어필될 수 있습니다.
① 반도체 제작 과정에서의 산출물에 대해 체계적으로 분석
② 여러 상황에 대한 가설과 설득력에 대한 판단 가능
③ 설비 관리 체계적으로 할 수 있는 기본 지식
④ 의사 결정의 근거를 수치화 된 자료로 제시 가능
오늘 글은 여기까지 입니다!
다음 글 부터 Data에 대한 기본적인 내용과 다양한 분석, 통계에 대한 이야기로 작성해보도록 하겠습니다.
감사합니다 :)

'[학부 일기] 그 외 활동 > 데이터 분석' 카테고리의 다른 글
[반도체데이터분석] 상관분석 (0) | 2023.08.24 |
---|---|
[반도체데이터분석] 가설검정 (0) | 2023.08.21 |
[반도체데이터분석] 공정능력 (0) | 2023.08.21 |
[반도체데이터분석] Data 유형 (0) | 2023.08.18 |
[반도체데이터분석] Data 분석의 기초 (0) | 2023.08.16 |