Seoul National UniversityProcess Systems & Safety
Lab.
`
SVM(Support Vector Machine) 을
이용한 recovery boiler 에 대한 연구
윤영필 , 김미영 , 이창준 , 윤인섭*
Seoul National UniversityProcess Systems & Safety
Lab.
`요약
• 비선형성 (non-linearity) 화학공정의 multivariable 에 대한 영향을 알아보기 위해 다변량 통계분석 (multivariate data analysis) 의 하나인 SVM(support vector machine) 을 이용함 .
• SVM(support vector machine) 은 학습속도가 매우 빠르고 입력값의 차원에 영향을 받지 않으므로 비선형 데이터에 용이함 .
• Recovery Boiler 의 operation data 를 SVM(support vector machine) 통해 medeling 하고 , 영향을 주는 입력 변수를 산출함 .
•이를 통해 출력 변수에 영향을 multivariable 을 control 할 수 있고 , 이를 바탕으로 SVM (support vector machine) 를 이용해 비선형성 (non-linearity) 화학공정을 control 할 수 있음 .
Seoul National UniversityProcess Systems & Safety
Lab.
`Support Vector Machine(1)
1x
2x
3x
1x
2x
3x
21( )x
22( )x
23( )x
1 2x x
2 3x x
3 1x x
1( )x
2 ( )x
3 ( )x
4 ( )x
5 ( )x
6 ( )x
7 ( )x
8 ( )x
9 ( )x
b
1
( )d x ( ( ))Fi sign d x
Second order polynomial hypersurface d(x) in input space
Mapping Hyperplane in a feature space( )z x : ( ) TF d z w x b
Seoul National UniversityProcess Systems & Safety
Lab.
`Support Vector Machine(2) Vapnik 에 의해 소개된 강력한 통계방법으로써 ,
통계적 학습 이론에서 유도한 학습 바이어스를 이용한 학습 알고리즘으로 훈련되는 고차원의 feature space 상의 선형식의 가상공간을 이용한다 .
1. 명료한 이론적 근거를 기반으로 하여 입력으로부터 어떠한 학습방법을 이용하는가에 대한 직관적인 해석을 제공 .
2. 실제 응용 문제에서 높은 인식 성능을 발휘함 .
3. 비선형 패턴 인식문제 , 함수 회귀문제 , HCI(Human –Computer Integration), 인공지능 등의 분야에서 크게 활용되고 있음 .
Seoul National UniversityProcess Systems & Safety
Lab.
`Support Vector Machine(3)
Kernel function
Nonlinear SVM 에서 이용하는 hyperplane equation
( ) ( )Tf x x w b
( )x 는 x의 basis function 로 p 차원의 에서 m 차원으로의 mapping 이며 , 실제로는 구체적인 형태를 알 필요는 없으므로 널리 알려진 kernel function 의
형태를 활용 . 본 연구에서는 알려진 kernel function 중 “ Polynomial Kernel function” 을 이용 .
( , ) ( ' 1)ri j i jK x x x x
x
Seoul National UniversityProcess Systems & Safety
Lab.
`
Support Vector Machine(4)
Support Vector Regression
Linear Regression 의 경우 ,Intensive Loss function, Quadratic Loss function, Huber Loss function 을 이용 .
Nonlinear Regression 의 경우 , Intensive Loss function 을 이용 →
• SVM 을 Loss function 을 이용하여 Regression 으로 이용 .
→ Support Vector Regression
• Loss function( -Intensive Loss function)
* ** * * *
, ,1 1 1
1max ( , ) max ( )( ) ( ) ( )
2
l l l
i i i i i j i i i ii j i
W x x y y
Seoul National UniversityProcess Systems & Safety
Lab.
`
• 본 연구에서는 Recovery Boiler Process 의 data set 을 이용하여 SVM 을 process modeling 과 control 에 적용함 .
• Recovery Boiler 는 Kraft process 의 일부로 나무에서 Cellulose pulp 를 생산하는 대표적인 공정이며 , wood cooking 으로부터 남은 잔여액을 Recovery Boiler 에서 태워 steam 을 발생시키고 다른 chemical 들은 회수함 .
• 본 연구에서는 이 공정의 input variable 는 15 개로 설정하고 input variable에 따른 output variable(response variable) 를 1 개로 하여 약 2900 여 개의 data variable 을 이용함 .
• 이 공정에서 얻어진 data set 중 일부를 이용하여 비교적 정확한 model 을 구현하고 , 이를 바탕으로 Recovery Boiler 의 output variable 과 이에 영향을 주는 input variable 의 관계를 알아봄 .
Recovery Boiler 공정 (1)
Seoul National UniversityProcess Systems & Safety
Lab.
`
Recovery Boiler 공정 (2)
Code Colleting Point
Input Black liquor flow rate, t/h VZ LP 1
Black liquor temp. oc T LP 2
Black liquor pressure, mmH2O P LP 3
Dry solids percentage in the liquor, % %SS 4
Dry solids flow rate, t/h VZ SS 5
Primary air flow rate, t/h VZ AP 6
Primary air temp. oc T AP 7
Primary air pressure, mmH2O P AP 8
Secondary air flow rate, t/h VZ AS 9
Secondary air temp. oc T AS 10
Secondary air pressure, mmH2O P AS 11
Tertiary air flow rate, t/h VZ AT 12
Tertiary air temp. oc T AT 13
Tertiary air pressure, mmH2O P AT 14Steam drum pressure kg/cm2 P BL 15
Out put Steam flow rate, t/h VZ VG 16
Boiler Operational Variable, Unit
1,2,3,46,7,8
9.10.11
12,13,14
15 16
Seoul National UniversityProcess Systems & Safety
Lab.
`결과 (1)
SVM Regression
Training data
Testing data(Input) Model
Testing data(output) 결과 비교 ! (MSE) Testing data(output)
Seoul National UniversityProcess Systems & Safety
Lab.
`결과 (2)
MSE=0.1197
예측 값
실제 값
Seoul National UniversityProcess Systems & Safety
Lab.
`결과 (3)
Training data 의 각 변수마다 (–2~2) 의 변위를 더해줌 .
Model
Testing data(output) 결과 비교 ! (MSE) Testing data(output)
각 변수들이 Output 에 어느정도 기여하는지 파악하여 ,
이를 이상진단 , 최적화 및 제어에 활용함 !!
Seoul National UniversityProcess Systems & Safety
Lab.
`결과 (4)
0
2
4
6
8
10
12
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
input
MSE
각 Input 의 변위가 Output 에 미치는 영향
1, 4, 5, 15 번 Input 이 Output 에 큰 영향을 미침 .
Seoul National UniversityProcess Systems & Safety
Lab.
`결론 및 제언
SVM regression 을 이용한 output 의 예측이 잘 맞고 있다 .
또한 , normalization 을 이용하여 중요 input 을 선별할 수 있다 .
이상진단 , 최적화 , 제어 등에 활용함 .
이상 데이터를 Classification 한 후 , 이를 토대로 실제 데이터를 실시간으로 Fault Detection 할 수 있을 것이다 . 또한 중요 input 을 제어함으로써 , Fault Diagnosis 에 활용할 수 있을 것이다 .
제 언