계장기술(PROCON)

기획특집 PI System의 플랜트 빅데이터 관리기술

페이지 정보

작성자 최고관리자 댓글 0건 조회 270회 작성일 19-06-07 14:21

본문

e5d9fbd17ae5049f3065db113a9f7f29_1559884728_2604.png
스마트 팩토리와 빅데이터

플랜트에서는 항상 생산성 향상, 비용 절감, 품질 향상을 최우선적으로 생각한다. 기업들은 이를 위해 지금까지 공장자동화, ERP/PLM 등의 생산관리 애플리케이션, 도입 그리고 MES, 식스시그마 프로젝트 등에 상당한 투자를 해오고 있다. 하지만 아직 못해 본 부분이 한 가지 있는데, 그것은 바로 생산설비에서 발생되는 Raw Data를 수집하고 분석하는 것이다. Raw Data를 분석한다는 것은 생산설비의 이상이나 고장의 근본적인 원인이 무엇인지 알아낼 수 있고, 플랜트에 잠재된 문제까지도 찾아낼 수 있음을 의미한다. 고장에 영향을 미치는 인자, 품질에 영향을 미치는 인자들을 도출하고, 인자들 간에 상관관계를 분석하기 위해서는 이러한 Raw Data가 수집되어야 한다.

Raw Data는 플랜트 생산설비에서 초 단위 혹은 밀리초 단위로 끊임없이 쏟아져 나오는 머신 데이터를 의미한다. 이는 사람이 만들어내는 데이터와 조금 다른 특성들을 가지고 있다. 우리가 인터넷 쇼핑/뱅킹할 때 발생되는 주문/이체 데이터와 같은 트랜잭션 데이터는 그 하나하나가 매우 중요하지만, 머신에서 발생하는 데이터는 각각의 데이터보다 트렌드 패턴을 더 중요하게 생각한다. 그래서 트랜잭션 데이터는 잘못되었을 때 롤백을 하기 위해 오라클로 대표되는 RDB(Relational Database)에 저장되지만, 머신 데이터는 가장 빠르게 많은 데이터를 저장해야 하기 때문에 RDB보다는 OSIsoft의 PI System 같은 RTDB(Real-time Database)를 사용한다.
e5d9fbd17ae5049f3065db113a9f7f29_1559884744_6616.png
Raw Data를 분석해 데이터 기반의 의사결정을 하기까지의 과정은 그림 1과 같이 다양한 사전 작업들이 필요하다. Raw Data에 의미를 불어넣고, 데이터를 정리정돈해서, 다차원의 테이블 구조로 만들어줘야 한다. 이렇게 가공된 정보는 BI 툴을 가지고 시각적 분석을 통한 의사결정을 할 수도 있고, 머신러닝 기반의 통계적 분석을 위해 학습 데이터로 활용되기도 한다. 사전 작업이란 다차원의 Data set을 만들어내는 것이다. 예를 들어 매출 데이터를 분석한다고 가정해보자. 지역별, 월별/계절별, 제품별, 고객 분류별 등등 다양한 관점의 매출 분석을 위해서는 그림 2와 같은 Data set이 필요하다. 이런 하나의 관점들이 매출에 영향을 줄 수 있는 인자이며, 이런 것들을 우리는 하나의 차원이라고 정의될 수 있다. 이렇듯 다차원 분석을 위해서는 다차원이 포함된 Data set이 준비되어 있어야 한다.

다차원의 Data set을 만들어 내기 위해서는 Raw Data에 의미를 불어넣는 작업, 즉 Context를 부여하는 작업이 필수적이다. 하나의 값에 대해 그 값을 설명하는 다양한 차원을 정의하는 작업으로 매출 분석을 위해 지역, 주문시간, 고객분류 등의 여러 차원을 덧붙이는 것과 같다.
 
Refinery 공장에 물/에너지 사용량에 대해 분석을 하기 위해  Raw Data를 수집한다고 가정해보면, 특정 시간에 측정된 ‘사용량’ 하나의 값에 대해서 어떤 원료/제품을 생산할 때, 어떤 설비를 거쳤고, 그때 설비 상태는 어땠고, 어떤 공정을 수행 중이었는지에 대한 다양한 데이터가 동일한 시간에 수집되어야 한다. 그림 3에서는 큐브 한 조각의 Real-time data 값에 다차원의 의미가 덧붙여져 시간순으로 정리된 테이블을 확인할 수 있다.

e5d9fbd17ae5049f3065db113a9f7f29_1559884771_5043.png
플랜트 빅데이터 관리기술

A사에서는 조립 라인의 로봇에 대한 고장을 예측하는데 Raw Data 분석을 활용하였다. 기존에는 10초 단위의 부하율 모니터링만 했었는데, 고장과 특별한 상관관계가 없어서 100ms 주기의 100배 정밀한 Raw Data를 수집함으로써 로봇 관절을 제어하는 모터의 토크와 전류의 상관관계를 분석하였다. 정상상태의 패턴을 학습하게 한 후 고장 예측 모델을 개발했고, 패턴을 벗어나게 되었을 때 미세 변화는 주의, 큰 변화는 경고를 발생하게 설정한 결과, 경고가 처음 발생하고 5일 정도 후에 고장이 나는 것을 알 수 있었다. 이를 토대로 경고가 나고, 실제 고장이 발생하는 5일 동안 생산계획이나 전후 공정에 영향을 최소화하는 방향으로 정비를 할 수 있었다.

위 사례는 설비-PI System-분석 시스템(Hadoop/SAS) 의 전형적인 데이터 분석 아키텍처를 보여주고 있다. 이번 장에서는 여기에서 활용된 다양한 플랜트 빅데이터 관리기술에 대해 살펴보겠다.

플랜트 빅데이터 관리기술이라 함은, 플랜트 초단위 혹은 밀리초 단위로 쏟아지는 빅데이터를 안정적으로 수집하는 것을 시작으로 Raw Data에 대해 실시간 계산을 적용해 KPI, 설비 효율 등 보다 가치 있는 정보를 도출해내고, 이렇게 나온 정보들을 실시간 모니터링/분석이 가능한 형태로 시각화를 시키며, 다차원 분석이나 머신러닝과 같은 빅데이터 분석 플랫폼에서 활용 가능한 데이터 형태로 정제된 데이터를 제공하는 것을 의미한다.

1) 플랜트 고속 데이터 수집 기술
플랜트 설비의 고장이나 품질 이상에 대해 근본적인 원인을 분석하기 위해서는 생산과정에서 발생하는 설비 데이터 그 자체로 수집하는 것이 중요하다. 몇몇 사이트를 예로 들면, 초단위로 수집할 때는 발견되지 않은 문제가 100ms 또는 5ms 등 실제 Raw Data 그 자체로 수집했을 때 발견된 사례가 보고되고 있다. 밀리초 단위의 데이터 수집은 OPC와 같은 표준 프로토콜로는 한계가 있다. 그래서 DCS, PLC와 같은 컨트롤러와의 Native 인터페이스를 얼마나 확보하고 있는지가 중요하다. OSIsoft사는 40여 년간 Raw Data수집 모듈 개발에 많은 투자를 한 결과 업계 최대인 500여 종의 인터페이스를 보유하고 있다. 또한 성능에 있어 서버당 초당 500,000건의 이벤트를 기록할 수 있기 때문에 밀리초 단위의 데이터 수집에 용이하고, 데이터 조회 성능 역시 수집 성능에 10배 이상을 보이고 있다.

2) 하이테크 IoT 센서와의 연결성
근래 하이테크 IoT 기술의 발전으로 플랜트 생산설비로부터 기존보다 정밀한 데이터를 수집할 수 있게 되었다. 문제는 기존 DCS, PLC 컨트롤러에서 이러한 IoT Gate way와의 연결성을 확보하기가 어렵다는 것이다. 이미 잘 동작되고 있는 설비에 부하를 주게 되었을 때 어떤 영향을 미칠지 예측할 수 없기 때문에 이 부분은 RTDB와 직접 연결성을 확보하는 것이 좋다. OSIsoft사는 이미 Cisco, Dell, Qualcomm사의 IoT Gateway와의 직접 연결성을 확보하고 있으며, 영세한 벤더에 대해서는 OMF(OSIsoft Message Format) API를 제공하여 벤더에서 PI System으로 데이터를 전달할 수 있는 방법을 제공하고 있다.

3) 압축/필터링 기술
30,000 태그를 초단위로 수집하게 되면 하루에 25억건의 데이터가 생성된다. 데이터에 대한 압축/필터링을 통해 데이터 용량을 줄일 수 있다면 저장공간과 관련된 비용을 줄일 수 있을 뿐만 아니라, 롱텀데이터에 대해 더 오랜 기간의 데이터를 한번에 분석할 수 있다. 아날로그 데이터의 경우 값 하나하나보다 트렌드의 패턴을 주로 보게 되는데, 이때 원래의 패턴을 왜곡하지 않으면서 데이터를 최대한 압축을 하는 것이 중요하다.

4) 구조화/표준화
하루에 25억 건씩 쌓이는 데이터를 구조화해서 관리하지 않는다면 데이터 홍수에 빠져 제대로 된 분석이 어렵게 된다. OSIsoft사는 PI Asset Framework을 통해 Raw Data를 연관된 것끼리 그룹핑하고, 기업에서 사용 중인 설비관리구조를 적용시킴으로써 태그 중심이 아닌 사용자/설비 중심의 직관적인 설비 데이터 관리 환경을 제공하고 있다. 또한, 표준 템플릿을 통해 플랜트에서 표준화된 설비 데이터 관리를 할 수 있도록 해준다. 설비별로 동일한 항목의 데이터를 관리하게 되면 설비별 성능 비교가 가능하고, 설비별 일괄적인 계산식, 이벤트 발생 조건적용이 가능해지며, 특히 하나의 모니터링/분석화면을 만들었을 때 자동으로 다른 설비의 화면을 자동으로 생성할 수 있다. 

5) 빅데이터 분석을 위한 데이터 통합
앞서 언급했듯이 데이터 기반의 의사결정 환경을 만들기 위해서는 Raw Data에 의미부여를 해서 다차원의 Data set을 만들어야 한다. 이를 위해서는 먼저 다양한 데이터 소스와 연계하여 데이터를 통합적으로 관리해야 한다. PI Asset Framework에서는 ERP, LIMS, CMMS 등 다양한 시스템과의 연결 방법을 제공함으로써 생산, 품질, 설비 정보를 쉽게 통합 관리할 수 있게 해준다.

6) Real-time Analytics(실시간 계산)
데이터 기반의 의사결정을 하기 위해 또 하나 중요한 것은 실시간으로 Raw Data를 가공해 보다 가치가 있는 Information 형태로 재생산하는 것이다. 생산 중간중간 발생하는 계산, 통계치나 설비 성능 및 가동률, 생산 효율, 양품률, 에너지 사용량과 같은 KPI가 대표적인 Infor mation이다. OSIsoft는 실시간 계산을 위한 120여개 수학, 논리, 통계 함수를 제공하고, 예측 데이터 생성을 위해 Matlab 함수를 활용할 수 있으며, 초당 250,000건의 실시간 계산 성능을 지원하고 있다. 또한 특정 설비를 대상으로 가상으로 계산된 결과를 보여줌으로써 수식에 대한 검증이 가능하고, 과거 몇 년치 데이터에 대한 계산 시뮬레이션도 가능하다.
e5d9fbd17ae5049f3065db113a9f7f29_1559884804_4631.png
7) 학습 이벤트 생성, 알림
하루에 25억 건씩 발생하는 데이터 중에서 정말 중요한 데이터는 설비 고장이나 품질 이상과 관련된 데이터일 것이다. 사용자가 정의한 다양한 조건을 기반으로 설비이상, 다운타임 등 중요 이벤트를 따로 기록하고, 이메일 등으로 사용자에게 즉각적인 알림을 줄 수 있어야 한다. 이러한 이벤트 데이터는 머신러닝 등의 분석 시스템에서 예측 모델링을 하기 위해 학습 데이터로 활용된다. 또한, BI나 엑셀 Pivot 차트 등 시각적인 분석을 위한 기반 데이터로도 활용된다. 그림 4는 설비별 다운타임과 생산량 손실에 대한 이벤트 데이터를 기반으로 엑셀 Pivot 차트를 통해 다운타임 원인별, 설비별 다운타임 시간과 설비별 다운타임에 따른 생산 손실을 보여주고 있다.
 

8) 데이터 전처리와 빅데이터 플랫폼 연계
BI를 통한 시각적 분석 이외에도 Hadoop, DW, Data Lake, 머신러닝, 클라우드에 이르기까지 빅데이터  분석시스템은 굉장히 많다. 하지만 이들 시스템을 통해 분석을 시작하기 위해서는 Raw Data에 대한 전처리 작업이 필요하다. 이러한 사전 작업은 사실 굉장히 많은 시간이 소요되는 것으로 알려져 있다. 포브스 조사에 따르면, 분석작업에 걸리는 시간을 측정해 봤을 때 약 79%의 시간이 데이터 준비작업이 소요되며, 78%의 Data Scientist들은 이 작업이 가장 하기 싫다고 응답했다. 이렇듯 시간을 줄이는 것이야말로 기업의 경쟁력이라고 할 수 있다. PI System은 Asset Framework을 통해 다차원의 테이블 구조로 데이터를 생성할 수 있고, 앞서 언급한 빅데이터 분석시스템으로 전처리된 데이터를 자동으로 전달하는 Integrator를 제공한다.

9) 현업 주도의 모니터링/분석 화면 생성
Raw Data의 실시간 분석을 통해 기업의 빅데이터 분석 역량을 향상시키기 위해서는 현업 사용자가 IT 도움 없이 직접 빠른 속도로 보고 싶은 화면을 구성해내는 것이 중요하다. OSIsoft PI Vision은 사용자가 별도 교육 없이도 화면별로 10분 내외로 제작할 수 있다. 또한, HTML5 표준 웹기반으로 구성되어 누구나 인터넷 브라우저에도 확인할 수 있고, 스마트폰/패드를 가지고 원격에서도 접근이 가능하다.
 
e5d9fbd17ae5049f3065db113a9f7f29_1559884828_2927.png
10) 예측 데이터 디스플레이
최근 예측 데이터 활용에 대한 니즈가 증대되고 있다. 설비의 고장을 사전에 예측해 대응할 수 있게 해줄 수 있고, 발전 산업의 생산량 예측에도 활용될 수 있다. 요즘 탈원전과 맞물려 중요도가 높아지고 있는 신재생에너지의 경우, 날씨 예측 데이터가 굉장히 중요하다. 예상되는 날씨 데이터에 근거해 태양광, 풍력을 통해 얼마의 발전량이 예측되는지 산정해서 기존 화력발전소를 통해 얼마의 발전이 더 필요한지 산정할 수 있다. 사용자는 OSIsoft 사의 Futue data display 기능을 통해 예측 데이터와 실측 데이터를 같이 보면서 운전을 할 수 있고, 일부 차이가 나는 데이터의 오차를 줄일 수 있도록 예측 모델을 수정해 그 활용도를 높일 수 있다.

11) 엑셀 기반의 자동 보고서
현업 사용자들은 엑셀을 통한 보고서 작업에 많은 시간을 할애하고 있다. PI System의 Datalink는 하나의 보고서 템플릿을 만들고, 날짜 혹은 대상 설비만 변경하면 자동으로 데이터를 갱신해서 화면에 보여줄 수 있기 때문에 수작업에 걸리는 시간을 상당히 단축시킬 수 있다. 또한, 필터링 및 계산 함수를 제공함으로써 사용자가 필요한 데이터를 빨리 생성할 수 있도록 도와준다.


mpark@osisoft.com