안녕하세요!
오늘 데이터분석에서 다뤄볼 내용은 실험계획법 입니다!
이전에는 데이터를 어떻게 분석하느냐 에대해 배워왔다면, 이후부터는 데이터를 어떻게 수집하고 실험은 어떻게 진행할 것인지에 대한 내용을 알아보려 합니다.
< 실험계획법 >
- 실험계획법
실험계획법, DOE(Design of Experiments)는 제품의 특성에 영향을 미치는 여러 인자를 선정하는 것 입니다.
이 인자들의 관계를 알아보기 위한 실험을 진행하고, 제품 최적조건을 최소노력과 최소비용으로 찾아내는 기법입니다.
즉, 경제성과 효율성을 추구하는 방법입니다.
여기서 말하는 실험은,
출력 변화에 대한 원인을 관찰할 수 있도록 공정이나 시스템 입력변수에 계획된 변화를 가하는 일련의 시행을 말합니다.
위 그림처럼 제어가 가능하거나 불가능한 인자들을 넣어 프로세스(실험)를 진행하고 출력을 통해
인자에 따른 제품의 퀄리티를 분석하고 결과를 도출하는 과정을 만들 수 있습니다.
- 실험계획법 용어
실험계획법에서 사용되는 용어는 아래와 같이 정리할 수 있습니다.
- 특성치(Characteristic Value) : 실험에서 데이터의 형태로 측정되는 결과치 (ex) 수율 98%)
- 인자(Factor) : 특성치/데이터 산포에 영향을 준다고 생각되는 무수히 많은 원인들 중 실험에 직접 취급되는 major한 원인
(ex) 온도, 습도, 기압 ... )
- 인자의 수준(Level) : 실험을 하기 위한 인자의 조건. 이 수준으로 취한 값의 수를 인자의 수준수라 함.
(ex) 기압 = 1hPa/ 0.5fPa)
- 반복(Replication) : 실험에 취급되는 인자들의 동일한 수준조합에서 2회이상 실험하는 것.
-> 제어가 불가능한 인자는 계속해서 같은 값을 보장할 수 없어 오차 발생할 수 있기에, 반복으로 오차를 보정해줌.
- 인자의 분류
ⅰ모수인자(Fixed Factor) : 기술적으로 미리 정해진 수준 사용. 각 수준이 기술적 의미를 가짐.
온도/압력/작업방법 등 현장에서 사용하는 대부분의 인자들을 말함
ⅱ변량인자(Random Factor) : 수준 선택이 랜덤이기에 기술적 의미를 갖고있지 않은 인자.
작업자의 기분, 마음가짐 등
실험계획법의 예시를 보면 아래와 같이 표현할 수 있습니다.
인자는 온도/압력 2개, 처리는 7번, 수준은 온도(100, 150, 200) 3개&압력 (1, 2) 2개, 반복은 (200,1) 두번 과 같이 확인할 수 있습니다!
- 교호작용
교호작용은 특정인자 수준이 변할 때, 다른 인자가 이 수준에 영향을 받아 반응에 영향을 주는 시너지 효과를 말합니다.
변수 상태의 문제로 주요 인자끼리 교호작용이 크게 됩니다.
교호작용의 특성으로는,
- 실험자 조절 불가능
- 실험 전에는 확인할 수 없음
- 인자들 수준 범위에 따라 달라짐
- 반복 실험을 통해 교호작용 확인 가능
- 교호작용 존재하면, 최적조건은 교호작용을 중심으로 도출
과 같은 점들이 존재합니다.
- 실험계획법 목적
실험계획법은 경제성과 효율성이 뛰어난 방법을 택하여 진행하는 방법입니다.
실험계획법으로 진행하였을 때와 진행하지 않았을 때를 비교하면 아래와 같습니다.
- 직감적 실험(실험계획법X)
: 시행착오 -> 시간낭비, 교호작용 미고려 -> 결론오류, 한정적 범위 오류, 실험 횟수 과다 -> 비용 낭비
- 계획된 실험(실험계획법O)
: 시행착오X, 교호작용 고려한 계획, 적은횟수&다양한 범위 커버 가능
- 한 인자씩 실험(실험계획법X)
: 최적조건 발견 어려움, 교호작용 미고려 -> 결론 오류, 시간소모, 비효율적
- 다인자 실험(실험계획법O)
: 최적조건 체계적 확인 가능, 교호작용 추론/의심 가능, 효율적, 효과적
또한 실험계획법에서 교호작용을 미고려 한다면, 오류가 발생할 수 있습니다.
실험의 여러 인자에서 교호작용을 생각하지 않고 한번에 한 인자씩 실험하는 오류를 말합니다.
예를들어, A : 온도, B : 시간, Y : 수율일 때,
A1에서 B, B1에서 A 경향성만을 확인한다면 A3/B4에서 최적의 수율을 기대하지만,
실제로는 A3/B3에서 최적수율을 보이는 교호작용 오류가 발생하게 됩니다.
- DOE 5대 기본원리
실험계획법의 5대 기본원이는 아래와 같습니다.
1. 랜덤화의 원리
데이터에 사람이 개입하면 반드시 오류가 생기기에, 이러한 에러는 없어야 합니다.
실험에서 발생하는 모든 에러를 동등하게 분배하면 에러로 인한 결론을 피할수 있습니다.
따라서, 실험 에러가 결과값에 특정 경향성을 가지고 영향을 주지 않도록, 모든 실험 순서는 랜덤으로 정해서 실험해야합니다.
랜덤화 없이 순서대로 진행한다면 수준간 차이가 날짜와 같은 차이로 인해 교락되어 실험 목적을 달성할 수 없습니다.
2. 반복의 원리
반복은 신뢰성을 검증하고, 교호작용을 검출할 수 있습니다.
2번 이상 같은 조건을 반복하면서 결과 차이를 통해 실험을 의심하고 결론 오류를 피할 수 있게 됩니다.
또한, 교호작용은 2인자 이상에 대해 반복실험 해야만 검출되기에, 오차항의 자유도를 늘려 신뢰도를 좋게 추정할 수 있게됩니다.
3. 블록화의 원리
인자 외 실험조건이 다르면 같은 실험조건끼리 묶어 실험하고 해석해야 합니다.
날짜, 설비, 작업조 등 의도한 인자가 아닌 요인들은 동일한 블록으로 묶어 실험 결과에 영향을 주는지 먼저 분석해야 합니다.
4. 교락의 원리
검출할 필요 없는 고차의 교호작용을 블록고 혼합해 실험 효율을 높이는 원리입니다.
인자가 많으면 모든 실험을 하기엔 불가능해 일부만 실험하는 부분실험이 필요합니다.
이때 교호작용을 혼합시켜 실험을 수행해 실험 횟수를 줄일 수 있습니다.
5. 직교화의 원리
요인간의 직교성을 이용해 설계하는 원리로, 불필요한 교호작용 검출을 피할 수 있습니다.
많은 인자를 적은 실험횟수로 검출할 수 있지만, 모든 실험설계에 해당되지는 않습니다.
예를들어, NAND FLASH의 성능 조사를 위해
Latency 2개, Frequency 2개, 용량 2개에 대해 진행하였다면, 모두 다 진행하려면 8번의 실험을 진행해야 합니다.
4번만 실험을 진행하는 상황에서, latency와 frequency는 서로 혼합할 수 있기에 둘 중 하나와 용량을 진행한다면 4번 실험을 통해 더 정확한 결과를 도출해낼 수 있습니다.
- 실험계획법 단계
실험계획법은 3가지 단계로 진행할 수 있습니다.
추가적으로 EVOP는 수준 값을 추론하여 추가적인 실험을 더 진행하는 것을 말합니다.
예를 들어, PCB 제조공정에서 납땜기계가
기판세척->기판예열->컨베이어
의 단계로 이동하며 납땜될 때, 언제 가장 납땜이 잘 되는지 확인해 보려 하는 상황을 생각해 봅시다.
결점률은 2000번 작업시 20개 -> 1.0%의 결점률을 최소값으로 낮출조건을 찾는 상황이 됩니다.
이 상황에서 제어 가능한 인자는 납땜 온도, 예열 온도, 납땜 깊이, 컨베이어 속도&각도 등이 있고,
제어 불가능한 인자는 작업자, 생산계획, 회로 기판 두께, 기판 내 부품 배치 등이 있습니다.
우리는 제어 가능한 인자들을 가지고 실험을 진행하게 됩니다.
스크리닝 기법) 결점발생에 영향 미치는 주요인자를 부분요인실험을 통해 분삭하여
납땜온도와 납땜깊이에 대해 선정하여 실험을 진행하는 계획을 세웁니다.
특성화 기법) 주요 인자의 영향을 알아내기 위해, 단위당 결점수를 줄이기 위한 납땜온도/깊이를 수정하기로 합니다.
결점률이 높아지는 방향을 피가히 위해 제어 변수들에 대해 정보를 제공하고,
납땜온도/깊이를 입력변수로 하여 범위를 가지고 실험을 진행합니다.
최적화 기법) 결점률을 최소로하는 납땜온도/깊이의 수준을 결정합니다.
이를 입력변수로 하여 최적화 실험을 진행하고, 결과를 도출해 냅니다.
실험계획법 단계에서 유의해야 할 사항은,
문제에 대한 협업적 지식(비통계적 지식)을 사용하여 인자선정, 인자 수준, 반복 횟수, 분석 등에 사용해야 합니다.
또한 설계와 분석은 간단하게 하여, 지나치게 복잡하고 세련된 기법은 지양해야 합니다.
Simple is Best가 실험계획법에 딱 어울리는 말이라고 합니다 ㅎㅎ :)
- 실험계획법 순서
실험의 순서는 아래와 같이 진행할 수 있습니다.
그리고, 실험배치법을 선택하는 가이드는 아래 표를 참고하면 될 것 같습니다 !!!
오늘 글은 여기까지입니다!
실험계획법을 이해하였으니, 다음 장부터는 분석에 대한 내용을 알아보겠습니다!
이젠 다시 실습을 할 수 있겠네요 ㅎㅎ

감사합니다 :)!!!
'[학부 일기] 그 외 활동 > 데이터 분석' 카테고리의 다른 글
[반도체데이터분석] 요인배치법 (0) | 2023.08.31 |
---|---|
[반도체데이터분석] 분산분석 (0) | 2023.08.29 |
[반도체데이터분석] 관리도 (0) | 2023.08.28 |
[반도체데이터분석] 회귀분석 (0) | 2023.08.25 |
[반도체데이터분석] 상관분석 (0) | 2023.08.24 |