Modelização híbrida de bioprocessos com base em métodos de ... ?· cados ao processo de fermento…

Embed Size (px)

Text of Modelização híbrida de bioprocessos com base em métodos de ... ?· cados ao processo de...

Modelizao hbrida de bioprocessos com base em

mtodos de engenharia de conhecimento

Maria Joana Monteiro de Carvalho Peres

Dissertao para a obteno do grau de Doutor em Engenharia Qumica

pela Faculdade de Engenharia da Universidade do Porto.

Esta tese foi orientada pelo

Professor Doutor Sebastio Jos Cabral Feyo de Azevedo,

Professor Catedrtico do Departamento de Engenharia Qumica da Faculdade de

Engenharia da Universidade do Porto

e co-orientada pelo

Professor Doutor Rui Manuel Freitas Oliveira,

Professor Auxiliar do Departamento de Qumica da Faculdade de Cincias e Tecnologia

da Universidade Nova de Lisboa

Abril de 2005

Ao meu Marido, Antnio Jos, e aos meus Filhos,

Joo Rodrigo e Diogo.

Resumo

Esta tese identifica e desenvolve formas alternativas de modelizao de bioprocessos. abordadade forma particular a metodologia de modelizao hbrida, no sentido de integrar diversas formas deconhecimento, tendo a preocupao da sistematizao desta metodologia. Investigaram-se estruturas demodelos hbridos adequadas a processos biolgicos e estudaram-se mtodos de identificao de parmetros.

definida uma estrutura hbrida dinmica geral vlida para uma larga classe de problemas de mode-lizao de biorreactores. Esta estrutura permite descrever um biorreactor por um conjunto de balanosmateriais e a populao celular representada por uma mistura ajustvel de representaes mecansticas eno paramtricas. So derivadas as condies de estabilidade entrada limitada - sada limitada para estaestrutura hbrida por forma a garantir a positividade das concentraes em concordncia com a realidadefsica. So comparadas duas estratgias para a identificao dos componentes no paramtricos: umabaseada no erro dos mnimos quadrados ao nvel das cinticas de reaco e outra baseada no erro dosmnimos quadrados ao nvel das concentraes. Estas tcnicas so ilustradas e validadas com dois casosde estudo de simulao: a produo de protena recombinante com culturas de Saccharomyces cerevisiaeem modo semicontnuo e o processo de produo de fermento de padeiro.

Posteriormente prope-se uma estrutura hbrida mais complexa baseada em redes de mistura de peri-tos (mixture of experts - ME) para modelizar o sistema clula. Esta rede consiste numa estrutura comdois ou mais mdulos que competem entre si para formar a sada da estrutura, os quais so mediados poruma unidade de integrao. A identificao dos parmetros baseia-se no mtodo da mxima verosimi-lhana, tendo sido empregue o algoritmo da Esperana-Maximizao (Expectation-Maximization - EM).So comparados os resultados obtidos com as estruturas mais frequentes para modelizar os componentesno paramtricos, nomeadamente as redes de Perceptro de Camada Mltipla (Multiple Layer Perceptron- MLP) e as redes de Funes de Base Radial (Radial Basis Function - RBF). Estes mtodos foram apli-cados ao processo de fermento de padeiro com dados experimentais e dados simulados e, ao processo deremoo de fsforo de guas residuais por lamas activadas com dados simulados. Demonstrou-se que asredes ME detectam a transio entre estados metablicos distintos e que cada perito capaz de descrever,individualmente, cada um dos estados metablicos. Concluiu-se que as redes de mistura de peritos podemconstituir um avano na extraco de informao a partir de dados experimentais produzindo modelosmais exactos e com melhor capacidade de extrapolao no contexto da modelizao hbrida.

So definidas duas estruturas hbridas baseadas em redes de mistura de peritos em que o sistemabiorreactor modelizado por balanos materiais e o sistema clula modelizado por uma representaomecanstica e uma rede de mistura de peritos. A diferena entre as duas estruturas reside na ponderaode peritos, isto , uma faz a ponderao ao nvel das cinticas de reaco, a outra faz a ponderao ao nveldas concentraes. Esta ltima obrigou modificao do algoritmo EM. Estes mtodos foram validadoscom dados experimentais dum processo de produo de Polihidroxialcanoatos por culturas mistas.

proposto um mtodo novo de integrar a informao obtida dos diferentes (sub)modelos disponveisacerca dum processo. Este mtodo hbrido permite misturar peritos baseados em diferentes paradigmasde modelizao e tem o mrito de obter uma combinao ptima entre os diversos modelos/fontes deconhecimento acerca do processo em estudo. Aplicando este mtodo garante-se que em cada instanteo modelo mais exacto usado para calcular a sada final superando os mtodos hbridos existentes naliteratura que no entram em considerao com o verdadeiro desempenho de cada modelo nas diferentesregies do espao das entradas. Este mtodo foi validado com dados experimentais dum processo deproduo de fermento de padeiro.

Assim, as principais contribuies deste trabalho consistem no s no aprofundamento da base tericada modelizao hbrida como tambm na construo de estruturas de modelos hbridos adequados a pro-cessos biolgicos, perspectivando a sua integrao em metodologias avanadas de optimizao e controlode bioprocessos.

Abstract

Alternative methods of bioprocess modelling are identified and developed in this thesis. The focusis in hybrid modelling through knowledge integration having in mind the systematisation of this method-ology. Hybrid modelling structures, designed for biological processes, were investigated and parameteridentification methods were studied.

A general dynamic hybrid structure, valid for a wide class of problems of bioreactor modelling, is defined.This structure allows the description of the bioreactor system by a set of mass balance equations wherethe cell population system is represented by an adjustable mixture of non-parametric and mechanisticrepresentations. Bounded input bounded output (BIBO) stability conditions are derived for this hybridstructure which assures the positiveness of concentrations in accordance to the physical process. Twostrategies for the identification of embedded non-parametric components are compared: one based on theleast square errors of kinetic reactions and another one based on the least square errors of concentrations.These technics are illustrated and validated with two simulation case studies: the fed-batch production ofrecombinant protein by Saccharomyces cerevisiae cultures and a Bakers yeast production process.

Next a more complex hybrid structure based on mixture of experts networks (ME) is proposed formodelling the cell system. These networks consist on a structure of two or more modules, mediated byan integration unit, that compete between themselves to form the final system output. The parameteridentification method follows the maximum likelihood formulation along the Expectation-Maximisation(EM) algorithm. The results obtained are compared with the most used structures for modelling thenon-parametric components, such as Multiple Layer Perceptron (MLP) and the Radial Basis Functions(RBF) networks. These methods were applied to the Bakers yeast production process with simulated andexperimental data, and to the simulation of wastewater phosphorus removal treatment process by activatedsludge. It was demonstrated that the ME network detects the switch between metabolic pathways andeach expert developed expertise in modelling each metabolic pathway. This study concluded that themixture of experts network may represent an advance in the extraction of information from experimentaldata yielding more accurate models with better extrapolation properties in the context of hybrid modelling.

Two hybrid structures based on mixture of experts networks, where the bioreactor system is modelledby a set of mass balance equations and the cell system is modelled by a mechanistic term and mixture ofexperts network, were defined. The difference between these two structures lies in the experts weighing,i.e., one of them takes care of the weighing at the reaction kinetics level and the other one the weighingat the concentrations level. The latter demanded a modification in the EM algorithm. These methodswere validated with experimental data from a mixed culture cultivation process for the production ofPolyhydroxyalkanoates.

A new method of weighing the information obtained from the different available (sub-)models of theprocess was proposed. This method allows mixing experts based on different modelling paradigms and hasthe merit of searching for the optimal combination among the available models/sources of knowledge ofthe underlying process. Its application guarantees that at each instant the most accurate model is usedto form the final output of the system, outperforming the existing methods in the literature that donttake into account the performance of each model in different regions of the input space. This methodwas validated with experimental data from a Bakers yeast production process.

The main contributions of this work consist not only on a better understanding of the hybrid modellingtheoretical basis but also on the development of adequate hybrid model structures for biological processes,seeking its integration on advanced model-based bioreactor optimisation and control strategies.

Rsum

Cette thse identifie et dveloppe des formes alternatifs de modlisation de bioprocessus. La mtho-dologie de modlisation hybride est abord, dans le sens dintgration des formes de connaissance diverses,aient la proccupation de systmatise cet mthodologie. On a recherche des structures de modles hybridespour des procds biologiques et des mthodes didentification de paramtres ont t tudi.

On dtermine une structure hybride dynamique gnral valide pour une large classe de problmesde modlisation de bioracteurs. Cette structure permet dcrire un bioracteur par un ensemble de bilansmatriels et la population cellulaire est reprsente par un mlange ajustable des reprsentations mcanisteset non-paramtriques. Les conditions de stabilit entre l