2024.03.29 (금)

  • 흐림동두천 1.0℃
  • 흐림강릉 1.3℃
  • 서울 3.2℃
  • 대전 3.3℃
  • 대구 6.8℃
  • 울산 6.6℃
  • 광주 8.3℃
  • 부산 7.7℃
  • 흐림고창 6.7℃
  • 흐림제주 10.7℃
  • 흐림강화 2.2℃
  • 흐림보은 3.2℃
  • 흐림금산 4.4℃
  • 흐림강진군 8.7℃
  • 흐림경주시 6.7℃
  • 흐림거제 8.0℃
기상청 제공

[청년발언대] 반도체 수율 잡는 이상탐지…"폼 미쳤다"

 

【 청년일보 】 만약 반도체 공정에서 비정상적인 행동이 감지된다면 어떻게 될까? 당연한 말이지만 해당 행동이 치명적인 경우, 생산량 감소와 품질 하락 등의 문제가 동반된다.


우리는 이를 빠르게 감지하고 해결하기 위해 다양한 통계적, 소프트웨어 기법들을 활용한다. 이때, 다양한 기법 중 머신러닝을 활용한 '이상탐지' 방법론에 대해 알아보고자 한다.


이상탐지(Anomaly Detection)란 정상적인 데이터의 패턴을 학습한 모델을 이용해 새로운 데이터를 분석하고, 해당 데이터가 정상적인 패턴과 일치하지 않을 경우 이를 이상 데이터로 간주하는 방법론이다.


이는 효율적인 데이터 분석과 모니터링이 가능하다는 이점이 있다. 따라서 반도체 제조 과정에서 생성되는 수많은 센서를 활용해 이상 상황을 빠르게 파악하고, 조치를 취할 수 있어 반도체 산업에서 매우 중요한 역할을 하고 있다.


먼저, 이상탐지는 우리가 흔히 알고 있는 이상치(Outlier)와는 다른 개념이다. 이상치는 데이터 집합 내의 특이한 값으로서 이상 데이터라고는 할 수 없다. 예를 들어, 어떤 도시의 인구 통계 자료를 분석할 때 대다수의 인구가 20대와 30대인 경우, 100세 이상의 노인이 이상치일 수는 있지만 이상 데이터라고 판단하기엔 부적절하다.


그럼 어떻게 이상 데이터를 탐지하는 것일까?


이상탐지 방법론은 크게 지도학습 기반 방법론과 비지도 학습 기반 방법론으로 나눌 수 있다. 먼저, 지도학습 기반 방법론은 정상 데이터와 이상 데이터를 미리 라벨링해 학습하는 방법이다. 이때, 정상 데이터와 이상 데이터 패턴을 미리 알고 있어야 하므로 이상 데이터에 대한 사전 지식이 필요하다.


이러한 지도학습 기반 방법론에는 데이터를 이상과 정상으로 분류하는 분류기반 방법, 데이터의 이상치 정도를 수치화해 예측하는 방법 등이 있다.


반면, 비지도 학습 기반 방법론은 정상 데이터만을 이용해 모델을 학습하고, 이상 데이터를 탐지하는 방법이다. 따라서 지도학습 기반 방법론과는 달리 데이터에 대한 사전지식이 없는 경우에도 사용할 수 있다.


대표적인 방법론으로는 데이터 간의 거리차이를 측정해 이상 데이터를 탐지하는 거리 기반 방법, 비슷한 데이터들을 묶어 이상 데이터를 탐지하는 클러스터링 기반 방법, 마지막으로 데이터의 밀도를 이용해 탐지하는 방법 등이 있다.


특히 반도체 공정은 복잡하고 다양하기에 한 공정에서 발생하는 이상은 생산성과 제품 품질에 직접적인 영향을 미치게 된다.

 

이때, 앞서 설명한 이상탐지 방법론을 적용한다면 생산 과정에서 불량품을 제거하거나 생산 설비의 이상을 신속하게 감지해 수리 및 교체 등의 조치를 취할 수 있다. 이에 현재 반도체 산업에서는 이상탐지 방법론을 적용해 공정의 안정성을 높이고 생산성과 품질을 개선하는데 많은 노력을 기울이고 있다.
 


【 청년서포터즈 6기 우지수 】

관련기사




청년발언대

더보기


기자수첩

더보기

배너
배너
배너
배너