계장기술(PROCON)

특별기고 성공할 수밖에 없는 인공지능 예측 분석 솔루션

페이지 정보

작성자 최고관리자 댓글 0건 조회 46회 작성일 20-07-15 14:51

본문

〈제1부 : 기업의 디지털 혁명을 위한 가장 효과적이고 확실한 솔루션〉


1. 코로나19로부터 배우는 교훈

중국에서는 2019년 12월부터, 국내는 2020년 1월부터 시작된 코로나19는 전 세계로 확산되어 세계 경제를 완전히 멈추게 만들었다. 뉴욕, 런던, 파리, LA를 비롯하여 전 세계 공항들이 문을 닫고, 가게들은 영업을 정지하고, 길거리는 텅비었다. 이제는 조금만 아파도 재택근무로 전환하였고, 예전에는 할 수 없다고 생각되었던 일들(원격근무 상황에 적응해야만 하는 상황)이 현실이 되었다. 

POST CORONA 시대를 준비해야 할 정도로, 코로나바이러스는 여러 가지 방법으로 세상을 변화시켰다. 이번 일로 우리가 얻을 수 있는 교훈 중의 하나는 예기치 않은 상황에 대비해야 한다는 것. 아무도(사태가 이렇게 될 때까지) 현재의 상황을 예상하지 못했다. 과거에 잘 작동했던 것이 영원히 지속될 것이라고 생각할 수 없으며, 이제 일을 다르게 할 수 있도록 마음을 열어야 한다.

b9e74203ab69c10e7a5910d7d1ff1e11_1594791986_4494.jpg 

예지보전은 예방 정비보다 한 단계 진보된 정비 기술로, 예측할 수 없는 미래를 대비할 수 있는 정비 활동이 될 수 있다. 예지보전이란 인공지능에 의하여 설비의 상태를 감시하여 전조 증상을 파악하고, 고장이 나기 전에 경고함으로써 사고를 예방하고 손실을 줄이는 효과적이고 능동적인 보전 활동을 말한다. 그런데 정말로 사전에 고장이 날 것을 예측할 수 있을까? 최근 인공지능 기술의 발달로 기존의 데이터 분석 및 상태 진단 솔루션들은 충분히 예지보전을 가능하게 한다.

예지보전은 4차 산업혁명과도 밀접한 관련이 있다. 하지만 4차 산업혁명의 차원에서 이야기하고 싶지는 않다. 최근 4차 산업혁명 또는 스마트공장이라는 멋진 이름 아래 잘 포장된 기술들은 보기에는 좋았지만 실제로는 그냥 과거 기술에 포장만 한 제품들도 많고, 현실적으로 적용하기가 너무 어렵거나 의미 있는 실제적인 활동을 제시하지 못하는 반쪽짜리 제품들도 많으며, 투자 대비 실제적인 이득이 미비한 경우가 많기 때문이다. 지금까지 수많은 기업들이 예지보전 시스템을 도입하였지만 별다른 효과를 보지 못하고, 잘 활용하지 못하고 있다.

필자가 아는 한 플랜트는 외국 기술로 설치되었는데, 중대한 설비가 고장나면서 수리까지 무려 1달이 걸렸다. 너무나도 큰 손실을 보았고, 앞으로도 다시 발생할 수 있다는 위기의식을 느낀 나머지 엄청난 금액으로 예지보전 솔루션을 도입하였지만, 엄청난 데이터의 홍수와 사용하기 어려운 전문성으로 데이터 분석 전문가가 필요하거나, 또는 엄청난 과도한 업무 등 여러 가지 이유로 결국 별 효과를 보지 못하고 방치하고 있는 것이 현실이다. 즉, 지금의 예지보전 솔루션은 이상은 좋았지만 실제 적용 현실은 이상과는 너무 멀었다.

이런 이유로 그 동안 개인적으로는 잘 포장된 예지보전 솔루션들의 기술은 인정하여도 실질적인 적용에는 찬성하지 않았다. 그러던 어느날 Precognize에서 개발된 SAM GUARD란 제품을 접하게 되었고, 이 솔루션이야말로 실패할 수 없는 진정한 예지보전 솔루션이 될 것이라는 생각이 들었다. 제품이 사용하는 기술은 아주 전문적이지만, 사용자는 기존의 운영팀이면 되고, 다른 전문가를 필요로 하지 않는다. 뿐만 아니라 꼭 필요한 경고를 사전에 경고하여 주고, 최소한의 관리로 의미 있는 보전 활동을 돕는다. 현실적이고 실질적인 솔루션을 발견한 것이다. 그래서 본고를 통해 그것이 어떤 제품인지, 어떻게 사용하는지 그리고 이 제품을 사용하면 왜 성공적인 예지보전 활동을 할 수밖에 없는지 살펴보려고 한다.

b9e74203ab69c10e7a5910d7d1ff1e11_1594792006_6868.png 

2. 예지보전 – 무엇에 초점을 맞추어야 하나?

제조업에서 신경써야 하는 것들은 무엇이 있을까? 여러 가지가 있을 수 있겠지만, 큰 범주로 정리하면 품질, 안전, 생산성의 세 가지라고 말할 수 있다. 이 세 가지를 위해서 모든 기업들은 최선을 다해왔다. 그리고 현장 운영자의 경험으로 높은 품질과 생산성으로 안전하게 공장을 운영하고 있다. 그럼에도 불구하고 대부분의 플랜트들은 잠재적인 사고 위험과 그로 인한 생산성 저하의 위험성을 안고 있다. 아마도 제조 현장에서 이러한 사고의 경험이 없는 사람은 없을 것이다. 바로 이 점에 예지보전이 필요한 이유가 있다. 기존의 시스템으로는 알 수 있는 문제에 대해서는 대응할 수 있었지만, 잠재적인 문제는 언제 어떻게 발생할지 예측할 수 없다. 

진정한 예측 분석 시스템은 예측할 수 없는 설비의 고장을 사전에 경고해 줄 수 있어야 한다. SAM GUARD는 예측할 수 없는 문제에 집중한다. 그렇게 잠재적인 설비 고장의 요소까지 제거함으로써 SAM GUARD는 무늬만 스마트공장이 아닌 진정한 디지털 혁명을 이루는 예지보전 솔루션의 방향을 제시한다. 
3. 예지보전의 경제적 가치

그럼, SAM GUARD를 사용한 예지보전 솔루션의 경제적 가치는 얼마나 될까? 이 솔루션이 주는 가치는 유지보수 비용을 절감하는 것 이외에도, 플랜트의 셧다운을 피함으로써 기업에 커다란 생산성 향상에 대한 이득을 안겨준다. 하지만 잠재적 고장을 예방하게 된 경우, 실제적인 이득을 산정하기는 쉽지 않다. 우측 상단의 그림은 고객으로부터 SAM GUARD의 경고를 조치하지 않은 경우 파급되었을 최소 손해 비용과 최대 손해 비용을 산출한 이익 규모이다.

이 회사가 단 2개월 동안에 얻은 최소 손실 비용은 1.7억원이었고, 최대 손실 비용은 47.8억원 있었다. 비단 이것이 남의 이야기만은 아니다. 필자도 수년 전에 P사에 아주 간단한 설비 진단 시스템을 설치하고, 큰 고장을 사전에 예방한 경험이 있다. 그 시스템은 인공지능도 적용되지 않았다. 다만 특이한 기능은 10ms의 빅데이터를 트렌드로 보여줄 수 있는 기능이 있을 뿐이었다. 그런데 그렇게하자 보이지 않던 데이터가 보였고, 현장 담당자도 열심히 데이터 분석 활동은 하던 중에 의심스러운 증상을 발견하고 설비를 진단한 결과, 모터의 베어링에 이상을 발견하고 조치를 하였다. 한 번의 예방으로 그들은 진단 시스템 설치에 대한 투자비를 모두 회수할 수 있었다. 이 사례 하나만 보더라도 고장을 예비(豫備)하는 효과가 얼마나 큰지를 알 수 있다. 

하지만 인공지능을 사용하지 않는 시스템은 사람이 모든 데이터에 대해서 의사 판단을 해야만 한다. 사람은 모든 시간에 모든 데이터를 진단할 수는 없지만, SAM GUARD는 자동으로 모든 시간에 모든 데이터에 대해서 정확한 진단을 해준다. 이로 인한 기업의 이득은 가히 산출할 수 없을 정도로 클 것이다.

b9e74203ab69c10e7a5910d7d1ff1e11_1594792057_6731.png

4. 정의된 문제 vs 정의되지 않은 문제

생산성 증대는 두 가지 종류의 문제들을 해결함으로써 달성될 수 있다. 그 한 종류는 이미 알고 있는 문제들이며, 이 문제들은 반복적으로 나타나는 특징이 있다.  간단하게는 모터 과열, 모터 트립, 수위 High High, 압력 High 등이 있으며, 더 나아가 골든 배치 실행, 품질 이슈 등이 있다. 이들 대부분의 기능들은 현장에 구축되어 있다. 잘 만들어진 PLC, DCS, HMI, MES 등의 시스템은 이들 문제 관리를 통해서 사전에 고장 및 생산성 저하를 예방할 수 있다. SAM GUARD는 굳이 기존의 시스템에서 할 수 있는 일들을 중복으로 하지 않는다. 이미 알고 있는 문제에 대해서는 나중에 설명될 Vitual Sensor 기능을 통하여 최적화 및 골든 배치 실행 등과 같은 좀 더 고급 기능에 집중한다.

두 번째 종류의 문제는 정의되지 않은, 예상치 못한 문제들이다. 이들 문제는 뭔가 잘못되기 전까지는 알 수 없으며, 반복되지 않는 특성이 있다. 같은 방식으로 두 번 다시는 발생하지 않기 때문에 예측할 수가 없다. 또한, 잘 발생하지 않지만 한 번 발생되면 손실이 매우 큰 특징이 있다. 정의되지 않은 문제의 예로는 설비 고장, 작은 공정 편차, 오동작/비정상 상태 등으로 인한 공정 변경이 있다. SAM GUARD는 바로 이런 문제에 집중한다.

5. SAM GUARD는 정의되지 않은 문제를 예측

SAM GUARD는 인적 영역의 지식을 머신러닝에 결합하여, 플랜트 엔지니어가 정의되지 않고, 반복되지 않는 문제들까지도 원인을 분석하여 해결책을 찾을 수 있도록 하여 주는 유일한 솔루션이다. SAM GUARD는 플랜트의 특정 구조와 동작을 고려한 플랜트 도메인 모델을 사용한다. 이것은 P&ID를 기반으로 신속하게 생성되며, 머신러닝의 능력을 향상시키고, 이전에는 발생하지 않았던 잠재적인 문제를 인지할 수 있도록 사용자를 플랜트의 올바른 영역으로 안내해 준다. 예상치 못한 문제를 피하는 것이 프로세스 플랜트의 모든 예측 분석 프로그램의 궁긍적인 목표이며, 전반적으로 이것이 플랜트에 훨씬 더 많은 가치를 부여한다. 
6. 머신러닝의 한계

머신러닝은 프로세스 산업의 생산성 향상을 위해 많은 것을 보장하지만, 심각한 한계도 있음을 알아야 한다. 이 한계가 고려되지 않은 솔루션은 결국 무늬만 인공지능을 사용하는 꼴이 될 것이다. 머신러닝의 잠재력을 현실에서 얻고 싶다면, 먼저 프로세스 산업의 도전 과제와 산업에서의 머신러닝의 한계를 이해해야 한다.

1) 지도 학습 머신러닝의 한계 – 과거 샘플의 부족
플랜트는 설비의 모든 측면의 성능을 측정하고, 다양한 센서로부터 발생되는 엄청난 양의 데이터를 갖고 있다. 하지만 설비 고장을 예지하기 위해 참조할 수 있는 과거 샘플은 턱없이 부족하다. 예를 들어, 대부분의 밸브, 펌프들은 결코 고장나지 않거나 또는 있어도 한두 번에 지나지 않으며, 그마저도 서로 크게 다른 상황에서 발생된다. 이것은 만약 당신이 밸브, 펌프의 고장을 예측하기 위해서 지도 학습을 사용하여 시도한다면, 성공하지 못할 수 있음을 의미한다.
지도 학습에서 신뢰할 수 있는 예측을 생성하기 위해서는 펌프 고장에 대해 매번 비슷한 조건에서의 최소한의 유사한 사례들을 필요로 한다. 하지만 플랜트에서는 그러한 상황이 발생되지 않으며, 발생된다 하더라고 그 사례는 대부분의 경우 관련이 없다. 톨스토이의 말을 인용하면, “행복한 가정은 서로 닮았지만 불행한 가정은 모두 저마다의 이유로 불행하다”라고 할 수 있다. 이전의 고장 원인이 어떤 것이든지 간에 고쳐진 문제는 재발할 가능성이 낮으며, 과거의 고장이 굳이 미래의 고장이 될 필요는 없다.

b9e74203ab69c10e7a5910d7d1ff1e11_1594792116_0953.png 

2) 비지도 머신러닝의 한계 – 과도한 노이즈
어떤 사람들은 플랜트의 정상 상태를 정의하기 위해서 비지도 머신러닝을 시도하는 경우가 있다. 왜냐하면 “정상”에 대한 수많은 데이터와 사례가 있기 때문이다. 이것은 머신러닝 알고리즘을 사용하는 비교적 간단하며 직선적인 작업이지만, 문제는 엄청난 양의 노이즈를 생성한다. 주어진 시간 동안 플랜트에서 있을 수 있는 가능한 상태는 거의 무한대인데, Precognize에서는 ‘우주의 원자 수보다도 크다’라고 표현할 정도이다. 결과적으로 비지도 머신러닝 시스템은 지속적으로 비정상 상태를 등록하지만, 그 중에 실제적인 문제를 지시하는 것은 거의 없다.
어떤 회사들은 소수의 자산에만 초점을 맞추고, 노이즈를 제거하여 문제를 해결하려고 하는 경우도 있다. 충분히 수행할 수 있는 일이지만, 그러기 위해서는 방대한 양의 데이터를 검사, 정제 및 처리하는 엄청난 양의 수작업을 필요로 한다. 소량의 자산에 대해서는 가능하겠지만, 수백 또는 수천 개의 아이템으로 확장할 수가 없다. 이 방법을 적용하려면 먼저 플랜트의 어느 영역에 적용할지를 결정하고, 나머지 영역은 무시해야 하는데, 그 경우 문제가 누락되고 결과가 부정확해질 수 있다.

b9e74203ab69c10e7a5910d7d1ff1e11_1594792159_1011.png 

3) 프로세스 플랜트에 적합한 Human Enhance Machine Learning
대부분의 플랜트에는 수천 또는 수만 개의 센서들이 있다. 이러한 엄청난 데이터는 사람이 분석하기에는 너무 많아 인공지능의 도움이 필요한데, 앞에서 살펴본 바와 같이 지도 학습 머신러닝은 모델을 훈련하는데 과거 사례에 의존적이기 때문에 반복되지 않는 문제에는 대응할 수가 없으며, 충분한 과거 사례가 없어 지도 학습 머신러닝은 사용할 수 없다.
동시에 엄청난 양의 데이터 때문에 비지도 학습 머신러닝으로 예지된 결과는 너무나도 많은 데이터로 인하여 이상 상태를 지적하기 위해 배경으로 사용할 “정상” 상태를 정의할 수가 없다. 비지도 학습 머신러닝의 관점에서는 표준의 석유화학 또는 화학 처리 플랜트도 종종 이상 상태로 경고된다.
이러한 머신러닝의 한계를 극복하고, 실제적이고 의미 있는 정보를 제공하기 위해 SAM GUARD는 Human Enhanced Machine Learning을 사용한다. SAM GUARD는 기본적으로 최초 모델은 과거 1년간의 데이터를 기반으로 Baseline Model을 자동으로 생성한다. 그리고 사용자의 지식과 지속적인 피드백을 알고리즘과 자동으로 결합할 수 있는 수학적인 그래프로 전환할 수 있도록 모델링 기능을 제공한다. 이렇게 사람의 입력을 소프트웨어를 통합하는 것은 프로세스 플랜트에서의 성공적인 조합이 되어, 정확성과 정밀도를 향상시킬 수 있다. 이러한 방식으로, SAM GUARD의 머신러닝은 수천 개의 태그와 경고 분석 작업을 줄이고, 단지 몇 개의 잠재적인 문제에 노력을 집중함으로써 직원들의 작업을 편하고 효율적으로 만들어준다.

b9e74203ab69c10e7a5910d7d1ff1e11_1594792177_8212.png
7. Alert Fatigue

지난 수년간, 수많은 연구에서 경고 피로가 많은 산업 현장에서 실제적이고 문제가 되는 것으로 밝혀졌다. 모든 플랜트에서는 매일 수백 개의 센서가 수천 개의 경보를 생성하고 있으며, 프로세스 산업도 예외는 아니다.

1) 경고 피로(Alert Fatigue)란 무엇인가?
경고 피로란 사람들이 심각한 경고에 익숙해져서 적절한 수준으로 대응하는 것을 멈추고, 심지어는 전혀 그것들을 알아차리지 않을 정도가 된 인지 상태를 말한다.

2) 경고 피로의 원인
경고 피로에는 두 가지 주요 원인이 있다.
•경고가 너무 많은 경우, 사람이 대응할 수 있는 능력을 압도할 수 있다.
•중요하지 않은 경고가 너무 많은 경우, 심각한 경고에 대한 본능적인 반응을 약화시킨다.
경고 피로는 본질적으로 둔감화된 한 형태이다. 이에 대해서는 유명한 「양치기 소년」 이솝우화가 있다. 당신이 처음 경고를 들었을 때는, 아마도 그것을 확인하기 위해 달려갔을 것이다. 하지만 그것이 중요하지 않은 것으로 판명되면, 다음에 그 경고를 들을 때 당신은 좀 더 느리게 반응하게 될 것이다. 그렇게 다섯 번을 반응하고 여섯 번째 알람이 발생하면, 아마도 다른 일을 끝내고 대응하거나 또는 다른 사람이 확인하도록 내버려 둘지도 모른다.
모든 경고를 조사하려면 많은 시간과 자원이 필요하다. 크리티컬스타스 조사 기관에 따르면 78%의 기업 보안팀 리더들은 각각의 경고를 조사하는데 최소한 10분이 걸린다고 한다. 또한 직원들은 매일 경보에 대응하는데 평균 2.5~5시간을 소비한다. 이는 직원 시간의 상당한 낭비이며, 이 작업이 반복되는 경우 일반적으로는 경고를 무시하게 되는 강력한 동기가 된다. 
경고 피로는 거의 대부분의 산업 종사자에게 영향을 미치는 문제이다. 과잉 예측 분석 솔루션은 시스템 이상에 대해 너무 많은 경고와 알람을 생성할 수 있으며, 대부분은 중요하지 않음으로 판명된다. Chemical Engineer ing의 위(89p)는 2009년도 화학 플랜트에서 시간당 경고가 얼마나 발생했는지를 보여준다.

3) 경고 피로는 심각하게 고려해야 할 문제
경고 피로는 가볍게 처리될 문제가 아니다. 경고 피로를 경험하는 직원은 경고 확인을 중단하거나 또는 소음을 듣지 않기 위해서 경고를 끌 수 있다. 경고 피로는 무엇보다도 피로의 한 형태로 스트레스 수준을 높이고, 압박감, 번아웃 및 이탈률을 높인다.
공정 플랜트에서 경고 피로는 심각한 장비 고장 또는 안전 문제로 이어질 수 있다. 예를 들어, E&E News에 보고된 한 가지 심각한 사건은 오일 드릴 작업자가 셀 수 없이 수신되는 오류 경보 중에 중대한 알람을 비활성화하여 발생했다. 경고 피로는 그것을 전혀 없애지 않고, 싸워야 하는 필수적인 일이다.

8. SAM GUARD는 경고 피로에 어떻게 대응하나?

경고 피로를 피하거나 줄이는 방법에 대해서 많은 조언이 있지만, 가장 좋은 접근 방법은 직원이 모든 경고가 중요하다고 느끼도록 경고의 수를 줄이면서, 그것이 지속적으로 정확하고 중요한 경고가 되게 하는 것이다.

SAM GUARD는 불필요한 경고를 줄이고, 노이즈를 감소시키기 위해서 도메인 기반의 플랜트 모델을 생성한다. 그리고 Precognize의 세계적인 특허 기술을 사용해 비정상 상태의 데이터를 수집하고, 정확한 정상 표준을 정의하여, 실제적이고 심각한 문제와 관련된 경고만을 생성한다. 이렇게 해서 하루에 평균 2~3개 수준의 적은 경고를 만들어 낸다. 매일 2~3개의 경고를 조사하는 것은 크지 않으며, 사용자가 빼먹지 않고 경고 분석 활동을 할 수 있도록 돕는다.

9. 필요한 데이터는 이미 있어

프로세스 플랜트들은 이미 센서 데이터들을 히스토리 서버에 저장을 하고 있다. 이들 서버는 플랜트에 설치된 수천 개의 센서들로부터 데이터를 수집하고 있으며, 트렌드 형태로 데이터를 표시하고 있다. 굳이 데이터를 수집하기 위해서 새로운 시스템을 도입할 필요가 없으며, 데이터가 쌓이기까지 기다릴 필요가 없다. 그냥 현장에서 저장한 데이터이면 충분하다. 현장에서는 이렇게 소중한 데이터를 이미 가지고 있었음에도, 머신러닝이 적용된 예지보전 솔루션이 없었기 때문에 하루에 10개 아니면 20개 정도만 분석하였을 것이다. 그것도 문제가 발생하지 않으면 보지도 않았을 것이다. 아무도 모든 태그에 대해서 모든 시간의 데이터를 보고 분석할 수는 없다.

하지만 SAM GUARD는 정확하게 그것을 수행한다. SAM GUARD는 모든 태그들을 모든 시간에 대해서 감시한다. 그것은 사전에 중요한 이벤트를 알려주기 위해서다. 이 솔루션은 점심 시간도 없으며, 휴가도 가지 않으며, 일이 많다고 불평하지도 않는다. SAM GUARD는 여러분이 담당해야 할 막대한 일을 담당하고, 덜어줄 것이다.


citkor@gmail.com

www.smartmnf.com