계장기술(PROCON)

기획특집 상수도에서 머신러닝 알고리즘 적용 및 활용 방안

페이지 정보

작성자 최고관리자 댓글 0건 조회 53회 작성일 20-08-14 11:01

본문

정수처리 공정은 수치에 기반한 빅데이터 분석 기법 적용

최근 정보통신기술 발전과 더불어 정수처리 공정의 개별 프로세스에서 생성되는 수질/수량이 자동으로 계측, 저장되어 전체 공정의 관리, 제어뿐만 아니라 분석의 목적으로 활용이 증가되고 있다. 정수처리 공정은 경계조건이 비교적 명확한 시스템으로써 수치에 기반으로 한 빅데이터 분석 기법을 적용한 예측 및 최적화에 매우 적절한 분야이다.

따라서 물 관련 분야에서 지속적으로 측정, 저장되는 많은 데이터에 포함되어 있는 데이터 상호 간의 상관관계 및 패턴을 찾기 위한 빅데이터 분석이 요구된다. 일반적인 정수처리 공정은 취수장에서 착수정으로 들어온 물을 응집제를 투입하여 혼화하고, 응집·침전공정에서 큰 현탁 물질을 대부분 제거하고, 여과 및 정수공정을 거쳐 배수지 및 관로를 통하여 시민들에게 공급한다.

수돗물을 생산하는 정수장의 경우 많은 데이터를 취득하고 있으며, 그 예로 생산용량 285,000㎥/h인 B 정수장에서는 HMI(Human Machine Interface)에서 1만 개 넘는 태그를 관리하고 있으나, 운영 인력은 2~3명에 불과하다. 제한된 인원으로 정수장을 관리하기 위해서는 중요 데이터만 주로 관리하고 있으며, 사람이 눈으로 확인할 수 없는 상황은 이벤트 알람으로 인지하고 있다. 이를 보다 효율적으로 관리하기 위하여 인공지능, 빅데이터 기술을 활용한 운영자의 경험과 일정한 패턴을 모사하기 위한 다양한 시도들이 행해지고 있으며, 그중 일부를 소개하고자 한다.

c40d85b2d6935982a294cbfbc7149b5d_1597370331_6124.png

머신러닝 알고리즘의 발전 과정과 수처리 공정 적용 사례

우선 머신러닝, 데이터 마이닝, 인공지능, 빅데이터 등 많은 유사한 용어들을 사용하고 있지만, 약간의 차이만 있을 뿐, 데이터를 기반으로 가치 있는 것을 발굴해 내자는 뜻으로 생각된다. 이를 위해서는 기존 PLC 기반에서  구현이 어려움이 있으며, K-water에서는 이를 개선하기 위하여 제어 알고리즘을 SCADA 기반으로 표준화하고자 하였다. 이를 통해 전국 산재되어 있는 수도사업장에 동일한 로직으로 운영할 수 있으며, 설치비도 저렴하게 할 수 있었다. 또한, 소프트웨어의 중요성을 인지하여 소프트웨어 개발센터를 신설하여 정수장 물리·화학적 및 Data Driven Model 개발을 자체적으로 수행하고 있다.
머신러닝 알고리즘의 발전 과정과 수처리공정에 적용된 사례를 살펴보면, 선형회귀 알고리즘은 약품 주입 시 원수 수질 5개 인자를 바탕으로 응집제 주입률 결정 시 사용하고 있다. 퍼지(Fuzzy) 제어는 염소 주입률 결정 시 잔류염소 증발률을 계산하여 이를 주입률에 반영할 때 사용할 수 있다. 신경망(Neural net)은 선형이 아닌 비선형 곡선 형태에 적용하는데 유리하며, SVM은 신경망과 알고리즘 형태는 다르지만, 수학적 모델을 기반으로 비선형을 학습할 수 있는 알고리즘으로 수요예측 등에 활용되고 있다. 최근 신경망을 보다 복잡하게 구성하여 분석하는 딥러닝 알고리즘으로 영상, 음성 등으로 영역이 확장되고 있는 추세다.

머신러닝 하면서 ‘학습한다’라는 개념은 시퀀스 제어로직에서 피드백 알고리즘과 매우 유사하다. 예를 들어 60점 맞는 아이한테 올해 80점 맞도록 목표를 설정했다고 했을 때, 공부시간을 Input으로 하고, 너무 많이 공부하면 80점 이상의 성적을 얻을 수 있으나 아이에게는 과부하가 걸리고 말 것이다. 이때 과거에 공부한 시간이 0시간이라고 가정하고, 공부시간 Input을 1시간을 늘려 70점을 맞았다면, 다음번에는 공부시간을 1시간에 추가 30분을 더해 75점을 맞고, 이를 지속 반복하여 80점을 맞을 수 있는 공부시간을 결정하는 것이 피드백 알고리즘의 과정이다. 이와 같이, 머신러닝을 이용한 약품주입공정에서 원수 수질 5개 인자 pH, 탁도, 전도도, 수온, 알카리도 Input에 얼마나 가중치를 더해서 응집제를 주입하는 것으로, 가중치를 변경하면서 과거 응집제 주입률과 가장 유사하도록 최적 가중치를 정하는 과정이 피드백 알고리즘과 동일하며, 이것이 학습을 하는 과정이며, 이를 역전파 알고리즘이라 칭한다.

c40d85b2d6935982a294cbfbc7149b5d_1597370243_603.png
특히 약품투입 공정은 매우 중요

정수처리 공정에서 중요한 공정이 많지만, 특히 약품투입 공정은 매우 중요하다. 좌측의 <그림 4>는 K 정수장의 탁도 대비 응집제 주입률 곡선으로 뉴럴렛 네트워크의 Hidden Node를 2개만 해도 개략적인 약품 주입이 가능함을 보여주고 있다. 하지만 이를 5개의 Hidden Node를 고려하면 우측 하단의 곡선처럼 탁도 상승 대비 약품주입률 하락 구간이 발생하는 문제점을 발생한다. 따라서 탁도 데이터만 고려한다면, 2개의 Node를 선정하는 것이 타당하다. 약품투입 공정 제어를 위해서는 통상 5개의 수질인자를 고려하여야 하므로 기존 선형 회귀 알고리즘을 대체하기 위하여 신경망을 고려한다면 너무 복잡한 알고리즘은 현장 적용에 부담이 될 수 있다고 생각된다. 따라서, 모델은 선형이나 Hidden Layer와 Node를 최소화하여 설명 가능한 알고리즘을 구현하는 것이 무엇보다 중요하다고 판단된다.

c40d85b2d6935982a294cbfbc7149b5d_1597370387_4145.png 

c40d85b2d6935982a294cbfbc7149b5d_1597370399_5152.png 

K-water 10개 정수장 유입 탁도를 선제적으로 예측

둘째로, 수도권 팔당취수원을 수원으로 하는 K-water 10개 정수장 유입 탁도를 선제적으로 예측하고자 했다. 수도권 정수장에서 탁도 전파 과정을 데이터로 살펴보면, 팔당취수장에서 탁도 변화가 발생하면 2~24시간까지 변할 수 있음을 <표 1>을 통하여 개략적인 시간 흐름을 확인할 수 있어 이를 머신러닝 알고리즘으로 해석 가능하다고 판단하였다. 팔당취수장에서 멀리 떨어져 있는 G 정수장을 예를 들면, 취수장과 정수장 탁도의 교차 상관관계를 구해 상관계수가 가장 높은 시간으로 G 정수장의 체류시간 15.25시간으로 산출되었다. 산출된 15.25시간의 지연을 고려하여 회귀분석을 실시하면 취수장의 과거 탁도를 이용하여 90% 이상의 신뢰도를 가진 정수장 미래 탁도를 예측할 수 있다. 이를 보다 복잡한 시계열 신경망 알고리즘을 적용해 본 결과 학습 결과는 98% 이상의 신뢰성이 확보할 수 있으나, 평가 데이터에서 40% 이하로 저하되었다.

이는 흔히 발생하는 과적합 문제로 해석이 쉬운 데이터에 복잡한 알고리즘을 적용하여 문제를 초래할 수 있음을 보여주고 있다. 기존 선형 회귀 알고리즘을 추가 개선하기 위하여 수질계측기의 오차 특성을 감안하였다. 취수장에서 탁도가 100NTU로 측정되었다고 해서 정수장에 15.25시간 경과 후 탁도 측정값이 100NTU가 계측된다는 보장이 없으며, 현장 상황에 따라 90NTU, 120 NTU로 측정될 수 있다. 따라서, 각 정수장별 수질계측기 오차 특성을 반영한 “선형회귀+피드백 알고리즘”을 고려한다면, 예측 신뢰도를 95% 이상 높일 수 있다. 이러한 부분은 머신러닝 알고리즘의 추가 학습 경향성 반영에 대안으로도 활용될 수 있다.

앞에서 검토된 알고리즘을 소프트웨어로 개발하여 현장에 시범 구축한 결과, 고탁도 발생을 선제적으로 확인하여 응집제를 고염기도 제품으로 변경하고 알칼리도, pH가 감소함에 따라 탄력적인 약품 주입률 산정하도록 돕고 있다. 향후 지자체에서도 예측 결과를 공유하여 지자체 정수장의 선제적 대응에 도움을 줄 예정이다.


물의 소독을 위해 사용되는 염소는 처리 과정에서 증발

셋째로, 물의 소독을 위해 사용되는 염소는 처리 과정에서 증발하며, 특히 전염소의 경우 침전지에서 3~7시간 머무르는 동안 잔류염소 증발이 발생한다. 주간 시간에 일사량 증가에 따라 증발이 많이 되는 것을  <그림 6>을 통해 확인할 수 있으며, 침전지 유출 목표 잔류염소를 설정하고, 증발률을 사전 반영하는 알고리즘이 필요하다. 이때 퍼지 제어로직 알고리즘을 사용하면 증발률이 반영된 염소주입률을 사전 설정하여 제어할 수 있으며, 안정적인 잔류염소 관리가 가능하다. 부가적으로 중염소나 후염소 투입 시 해당 구간에 유량계를 설치할 수 없어 원수 유량을 대신 참조하여 잔류염소 투입에 어려움을 겪는 사업장이 있다. 이러한 경우에도 침전지나 여과지 유출유량을 원수 유량을 통해 추정하는데, 이를 머신러닝 분석으로 대체할 수 있다.

누수의 사례를 살펴보면, 유량계를 관로상 곳곳에 설치하면 누수를 쉽게 파악할 수 있으나, 유량계 설치가 까다롭고 설치비가 과다하여 설치에 어려움이 있다. 압력계는 가격이 저렴하고, 설치가 까다롭지 않아 대안으로 고려될 수 있을 것으로 사료된다. 압력 자체는 누수가 발생하면 전·후단 모두 저하되게 된다. 하지만 압력으로 파생되는 손실수두는 유량과 동일하게 누수 지점 전단에서는 상승하고, 후단에서는 저하되게 된다. 따라서 손실수두를 유량화할 수 있다면 누수 지점을 예측할 수 있다. 이를 머신러닝 알고리즘 활용하여 압력을 유량화하고, 누수지점을 분석한 결과 완벽하지는 않으나, 60% 신뢰도의 누수지점 서치가 가능하리라 판단되었다.

c40d85b2d6935982a294cbfbc7149b5d_1597370433_5761.png
머신러닝 알고리즘 이용하여 전력요금 절감 방안 고민

마지막으로, 머신러닝 알고리즘을 이용하여 수도 생산원가의 80%에 달하는 전력요금 절감 방안을 고민해 보고자 하였다. 전기요금의 구성은 경부하, 중간부하, 최대부하로 구분되며, 경부하와 최대부하 사이는 최대 3배 이상 차이가 발생한다. 물을 저장할 수 있는 배수지와 각종 저장 탱크들을 최대한 확보하고, 이를 현실에 맞는 제어 기법을 개발한다면 국가 에너지 정책에 기여할 수 있을 것이다. 이외에도 물 관련 다양한 분석들이 빅데이터, 인공지능 기반으로 이루어지고 있으며, 향후 수처리 전반에 걸친 Digital Twin 기술이 완성된다면 시뮬레이션을 통한 최적 운영 방안이 수립된다면 수질은 안전하고, 수량은 효율적으로 관리할 수 있는 방안이 제시될 수 있을 것이다. 


lhh@kwater.or.kr sthong@kwater.or.kr gwshin@kwater.or.kr