10
DESARROLLO Y EXPERIMENTACI ´ ON DE UN VEH ´ ICULO BASADO EN P ´ ENDULO INVERTIDO (PPCAR) A. Viguria A. Prieto M. Fiacchini R. Cano F. R. Rubio J. Aracil C. Canudas-de-Wit ∗∗ Dpto. Ingenier´ ıa de Sistemas y Autom´ atica, Universidad de Sevilla, Espa˜ na ∗∗ Laboratoire d’Automatique de Grenoble (CNRS-LAG), Francia Resumen: En este art´ ıculo se describe el desarrollo de un veh´ ıculo basado en la estabilizaci´ on de un p´ endulo invertido. El prototipo ha sido dise˜ nado y realizado en la Escuela Superior de Ingenieros de Sevilla, utilizando componentes comerciales y de bajo coste. Para el control del veh´ ıculo se han implementado dos leyes de control (lineal y no lineal), habi´ endose probado con ´ exito en diferentes experimentos. ∗∗∗ Copyright c 2006 CEA-IFAC *** Este trabajo ha sido galardonado en las XXVI Jornadas de Autom´ atica con el premio en ”Innovaci´ on y desarrollo en los sistemas de automatizaci´on”. Palabras clave: p´ endulo invertido, control no lineal, tiempo real, sistemas subactuados, veh´ ıculo de transporte. 1. INTRODUCCI ´ ON El control de un p´ endulo invertido constituye un problema cl´asico dentro del campo del control no lineal. Existen diferentes variantes del pro- blema, entre las que destacan: p´ endulo de Fu- ruta (Furuta, 2003), (Astr¨ om and Furuta, 1996), endulo sobre un carro m´ ovil (Gordillo et al., 2004) y as recientemente endulo sobre un veh´ ıculo de dos ruedas con motores indepen- dientes (Baloh and Parent, 2003), (Grasser et al., 2002),(Salerno and Angeles, 2003), (Pathak et al., 2004), (Tirmant et al., 2002) y (Segway, 2004). A su vez, existe una amplia gama de controladores (lineales, no lineales, ´ optimos, robustos, predicti- vos, etc.) que han sido dise˜ nados para estas aplica- ciones en las ´ ultimas d´ ecadas. Debido al car´acter pr´actico de este trabajo y al reducido coste de los componentes utilizados, se han seleccionado aque- llos cuya ley de control requiere poca potencia de alculo. Figura 1. Vista general del veh´ ıculo (PPCar)

Desarrollo y Experimentación de un Vehículo Basado en Péndulo Invertido (PPCAR)

Embed Size (px)

Citation preview

DESARROLLO Y EXPERIMENTACION DE UNVEHICULO BASADO EN PENDULO

INVERTIDO (PPCAR)

A. Viguria ∗ A. Prieto ∗ M. Fiacchini ∗ R. Cano ∗

F. R. Rubio ∗ J. Aracil ∗ C. Canudas-de-Wit ∗∗

∗ Dpto. Ingenierıa de Sistemas y Automatica, Universidadde Sevilla, Espana

∗∗ Laboratoire d’Automatique de Grenoble (CNRS-LAG),Francia

Resumen: En este artıculo se describe el desarrollo de un vehıculo basado en laestabilizacion de un pendulo invertido. El prototipo ha sido disenado y realizado enla Escuela Superior de Ingenieros de Sevilla, utilizando componentes comerciales yde bajo coste. Para el control del vehıculo se han implementado dos leyes de control(lineal y no lineal), habiendose probado con exito en diferentes experimentos. ∗∗∗

Copyright c© 2006 CEA-IFAC

∗∗∗ Este trabajo ha sido galardonado en las XXVI Jornadas de Automatica con el premio en

”Innovacion y desarrollo en los sistemas de automatizacion”.

Palabras clave: pendulo invertido, control no lineal, tiempo real, sistemassubactuados, vehıculo de transporte.

1. INTRODUCCION

El control de un pendulo invertido constituye unproblema clasico dentro del campo del controlno lineal. Existen diferentes variantes del pro-blema, entre las que destacan: pendulo de Fu-ruta (Furuta, 2003), (Astrom and Furuta, 1996),pendulo sobre un carro movil (Gordillo et al.,2004) y mas recientemente pendulo sobre unvehıculo de dos ruedas con motores indepen-dientes (Baloh and Parent, 2003), (Grasser etal., 2002),(Salerno and Angeles, 2003), (Pathak etal., 2004), (Tirmant et al., 2002) y (Segway, 2004).A su vez, existe una amplia gama de controladores(lineales, no lineales, optimos, robustos, predicti-vos, etc.) que han sido disenados para estas aplica-ciones en las ultimas decadas. Debido al caracterpractico de este trabajo y al reducido coste de loscomponentes utilizados, se han seleccionado aque-

llos cuya ley de control requiere poca potencia decalculo.

Figura 1. Vista general del vehıculo (PPCar)

JLDIEZ
Placed Image
JLDIEZ
ISSN: 1697-7912. Vol. 3, Núm. 4, Octubre 2006, pp. 54-63

Este artıculo se centra en el problema del penduloinvertido sobre un vehıculo de dos ruedas parael transporte de personas (figura 1), donde real-mente el pendulo esta constituido por la per-sona que esta sobre el vehıculo. El movimientode avance esta provocado por la inclinacion de lapersona con respecto a la posicion de equilibrio.De hecho los controladores expuestos en la seccion4 estan disenados solo teniendo en cuenta el mo-vimiento en lınea recta de este, mientras que elmovimiento de rotacion se controla mediante unaconsigna impuesta por la persona a traves de undispositivo electrico.

El nucleo del sistema esta compuesto por un mi-crocontrolador que es el encargado, a partir de lainformacion proveniente de los distintos sensores,de calcular las acciones de control. Este micro-controlador se comunica con un PC permitiendoel ajuste de los controladores en lınea y la capturade datos relevantes del vehıculo para su posteriorestudio. Estas caracterısticas permiten el estudiode diversas tecnicas de control mediante la reali-zacion de sencillos experimentos.

El artıculo esta organizado de la siguiente manera.La seccion 2 describe los distintos componentesque forman el sistema y las relaciones entre ellostanto a nivel hardware como software. La seccion3 muestra el modelo de la plataforma que serautilizado en la seccion 4 en la fase de diseno decontroladores. En la seccion 5 se presentan losresultados obtenidos tanto en simulacion comoen los experimentos realizados. La ultima seccionesta dedicada a las conclusiones y a los posiblesdesarrollos futuros.

2. ARQUITECTURA DEL SISTEMA

A continuacion se ilustra la arquitectura del sis-tema desde el punto de vista hardware y software.

2.1 Arquitectura hardware

El nucleo del sistema es un microcontrolador de 8bits y bajo coste (Atmega128 de la marca Atmel)que se comunica con los distintos perifericos. Estemicrocontrolador es bastante completo, incorpo-rando: temporizadores, dos UARTS, hasta seisposibles senales PWM, varias entradas al conver-tidor analogico digital, 128 kilobytes de memoriade programa, etc. Aunque en principio, un micro-controlador de 8 bits no se considere convenientepara un control en tiempo real y con un tiempo demuestreo del orden de varios milisegundos comoes el caso del vehıculo a controlar, se ha demos-trado que sı lo es. Esto es posible gracias al reloja 16MHz que lleva incorporado, consiguiendoseunas 16 MIPS.

Como se puede observar en la figura 2, existendos grandes grupos de dispositivos conectados almicrocontrolador (Viguria et al., 2005): sensores yactuadores. El grupo de los sensores esta formado,en primer lugar, por un encoder por cada rueda,que en el vehıculo se han utilizado para medir lavelocidad de rotacion de estas. El segundo ele-mento del grupo de los sensores es un inclinometrode la marca MicroStrain que incorpora un pre-procesamiento de la senal basado en un filtro deKalman. Aunque la senal procesada presente unasbuenas caracterısticas ha sido necesario aplicar unfiltro pasa bajo para atenuar el ruido, como semuestra en la seccion 5. El ultimo de los sensoresse utiliza para indicar al control la referencia enla direccion que se desee tome el vehıculo. Estareferencia se indica a partir de un puno con unainterfaz electrica. Con respecto a los actuadores,el sistema consta de dos motores electricos alimen-tados a 24V y capaces de llegar a las 240 rpm. Lapotencia electrica que necesitan estos motores essuministrada por una controladora de los motoresde la marca RoboteQ y que se comunica con elmicrocontrolador a partir del estandar RS-232 yun protocolo de comunicaciones.

En lo referente a los equipos auxiliares, cabe des-tacar el enlace inalambrico basado en tecnologıaBluetooth. Este enlace permite utilizar una co-nexion serie inalambrica pero transparente a am-bos extremos y que se utiliza para comunicar elmicrocontrolador con el PC de supervision. Lacaja de control, por otra parte, permite: apagar yencender el sistema, conocer facilmente el estadodel microcontrolador a partir de un led e incorporaun mecanismo de seguridad que consiste en uninterruptor que mientras el controlador este activodebe estar pulsado, en caso contrario el controldejara de funcionar y el vehıculo se parara.

2.2 Software del microcontrolador

El software para el microcontrolador se ha basadoen el sistema operativo para sistemas embebidosTinyOS (Hill et al., 2000), desarrollado en laUniversidad de Berkeley. Este sistema operativoesta dirigido por eventos, es decir, que el softwareresponde ante eventos que son propagados desde elnivel hardware hasta los niveles superiores, siendoestos cada vez mas abstractos.

TinyOS, es un software de fuentes abiertas y queofrece varias ventajas como una estructura demodulos jerarquica que permite al programadorde aplicaciones abstraerse de las singularidadesdel hardware con el que esta trabajando. Ademasesta estructura de modulos permite una reuti-lizacion sencilla del codigo, que incluso permiteel desarrollo de ciertas aplicaciones casi sin lacreacion de nuevo codigo.

Marina
Text Box
A. Viguria, A. Prieto, M. Fiacchini, R. Cano, F. R. Rubio, J. Aracil, C. Canudas-de-Wit
JLDIEZ
Line
Marina
Text Box
55

Figura 2. Arquitectura del sistema

En este sistema operativo se utiliza un nuevolenguaje de programacion llamado NesC, que per-mite el desarrollo de programas compactos quenecesitan poco espacio de memoria lo cual es muyimportante en los sistemas embebidos. En estossistemas el diseno debe estar basado en un nucleomultihilo que sea extremadamente simple y efi-ciente. Este nucleo tiene dos tipos estructuras:

• Eventos: pueden interrumpir a las tareas,se ejecutan cuando se produce un eventohardware y deben realizar pocos calculos.

• Tareas: no son temporalmente crıticas, suelenutilizar un mayor tiempo de calculo que loseventos, ademas las tareas no se interrumpenentre ellas por lo que la siguiente tarea solo seejecuta cuando termina la anterior (esto sim-plifica el nucleo del sistema al solo necesitaruna unica pila).

En principio, este sistema operativo esta pensadopara ser utilizado en los nodos de las redes desensores inalambricas. Sin embargo ha sido modi-ficado para que pueda ser utilizado en un sistemade control en tiempo real. Para ello, se ha creadoun reloj de tiempo real de 10ms que dotara al sis-tema de una base de tiempo y sera el encargado deactivar el ciclo de control. Mientras que tanto paralas comunicaciones por el puerto serie como parala lectura de los datos de los distintos sensores, sehan utilizado interrupciones.

Por ultimo, conviene destacar que en el desarrollodel software se ha seguido la estructura basadaen modulos anteriormente mencionada con la in-tencion de que el programa sea facilmente escala-ble y abstraer a nuevos desarrolladores del nivelhardware. Los modulos basicos que se han desa-rrollado son: convertidor analogico digital, puerto

serie, encoder y temporizador. Cada uno de estosmodulos ofrece en su nivel mas alto una interfazque permite la utilizacion de estos sin tener queconocer los niveles inferiores.

2.3 Sistema de monitorizacion

Para la realizacion de experimentos utiles, es ne-cesario tener un medio fiable para monitorizar yalmacenar los datos generados por los mismos,motivando el desarrollo de una aplicacion softwarede PC (figura 3) cuyos objetivos son: monitoriza-cion en tiempo real de las variables del sistema,capacidad de guardar las muestras obtenidas du-rante el experimento para su posterior estudio,control de los distintos estados del controlador(parada, activo, parada de emergencia) y posibi-lidad de cambiar de forma sencilla los parametrosde control sin la necesidad de volver a programarel microcontrolador.

Para llevar a cabo estos objetivos ha sido necesarioutilizar un enlace inalambrico y ademas el disenode un protocolo de comunicaciones que permita,tanto al PC como al microcontrolador, interpretartodos los datos correctamente. Este protocolo decomunicaciones esta formado por una serie dePDUs, donde el PC controla las comunicaciones yel microcontrolador solo responde a las peticionesde este. Por ejemplo, si el PC quiere cargar losparametros del controlador, entonces transmitirıala PDU asociada a esa tarea y que esta formadapor: una cabecera indicando el tipo de PDU, unidentificador del controlador al que se quierencargar los nuevos valores y por ultimo los distintosvalores de los parametros. Una vez recibida todala informacion correctamente el microcontroladorrealiza un acuse de recibo mandando unicamente

Marina
Text Box
56
JLDIEZ
Line
Marina
Text Box
Desarrollo y Experimentación de un Vehículo Basado en Péndulo Invertido (PPCar)

Figura 3. Aplicacion de PC para monitorizar el sistema

de vuelta la cabecera que indica el tipo de PDUrecibida.

Para facilitar la carga de los distintos controlado-res y permitir de forma sencilla el cambio de losparametros de estos, desde el PC y sin tener quereprogramar el microcontrolador, se han desarro-llado una serie de plantillas graficas basadas enXML.

3. MODELO DEL SISTEMA

El sistema, de forma simplificada, esta constituidopor una plataforma montada sobre dos ruedas queson accionadas por dos motores independiente-mente. Sobre esta plataforma se situa una masaque puede ser modelada como una masa puntuala una distancia l del plano de la base. La figura 4muestra de forma esquematica la estructura delvehıculo, los ejes de referencias, los grados delibertad y las entradas del sistema.

Desde el punto de vista del control, el sis-tema puede descomponerse en dos subsistemasque practicamente estan desacoplados entre sı.Una parte esta formada por un robot movilcon traccion diferencial, la otra la constituye unpendulo invertido sobre un carro movil.

3.1 Vehıculo con traccion diferencial

La variable de salida en este sistema es la veloci-dad de giro respecto al eje vertical. La referenciapara ella viene dada por una senal procedente delpuno de direccion del vehıculo.

Considerando las fuerzas ejercidas por cada unade las ruedas, Fi y Fd, puede obtenerse la ecuaciondel vehıculo

Figura 4. Esquema de la estructura del vehıculo

J δ = (Fd − Fi) d, (1)

donde:

• Fi y Fd : fuerza ejercida por la rueda iz-quierda y derecha respectivamente,

• J : momento de inercia respecto al eje verti-cal,

• δ : aceleracion angular alrededor del eje z,• d : distancia entre las ruedas.

3.2 Pendulo invertido sobre base movil

En la figura 5 se ha representado el subsistemaconstituido por el pendulo invertido sobre plata-forma movil.

El equilibrio de fuerzas en el eje x permite obtenerla ecuacion

(M + m)x + Mlθ cos θ − Mlθ2 sin θ = F. (2)

Marina
Text Box
A. Viguria, A. Prieto, M. Fiacchini, R. Cano, F. R. Rubio, J. Aracil, C. Canudas-de-Wit
JLDIEZ
Line
Marina
Text Box
57

Figura 5. Pendulo invertido sobre carro movil

Por otra parte el balance de momentos en tornoal punto de giro del pendulo conduce a

xMl cos θ + Ml2θ − Mgl sin θ = 0, (3)

donde:

• m : masa del carro,• M : masa del pendulo,• l : altura del centro de masa,• g : aceleracion de la gravedad.

Ya que el objetivo del control es la estabilizaciondel angulo en cero y de la velocidad lineal x = v,las variables de estado de interes del sistema sonsolamente el angulo θ, la velocidad angular θ y lavelocidad lineal v.

4. DISENO DE CONTROLADORES

En esta seccion, se describen los dos metodos decontrol empleados para este sistema. El primeroes un LQR (Linear Quadratic Regulator), uncontrol lineal para el que es necesario un modelodel sistema linealizado alrededor del punto deequilibrio. El otro es un control no lineal que sedisena a partir de las ecuaciones diferenciales nolineales obtenidas anteriormente.

4.1 Controlador LQR

El controlador LQR es un control por realimen-tacion del vector de estados de la forma

u = −Kx, (4)

tal que el valor de K se obtiene a partir de unproblema de minimizacion del funcional de coste

J =

∞∫

0

(x′Qx + u′Ru)dt. (5)

Las matrices Q y R penalizan respectivamente elerror del estado y el esfuerzo de control.

El sistema puede ser linealizado en torno al puntode equilibrio θ = 0, θ = 0 y v = 0. En este puntopueden realizarse las aproximaciones cos θ ≈ 1 ysin θ ≈ 0. Con ello las ecuaciones de estado enforma matricial quedan de la forma

θ

θ

v

=

0 1 0

0(M + m)g

ml0

0 −Mg

m0

θ

θ

v

+

0

−1

ml

1

m

F. (6)

Utilizando este modelo la solucion del problemaLQR conduce a un controlador de la forma

F = −K1θ − K2θ − K3v, (7)

donde los parametros K1, K2 y K3 vienen deter-minados por los valores de los elementos de lasmatrices Q y R de la expresion (5).

4.2 Controlador no lineal

El diseno del controlador no lineal se ha realizadoen varias fases. En primer lugar se ha obtenidouna linealizacion parcial de las ecuaciones del sis-tema. Posteriormente se ha procedido a la esta-bilizacion del pendulo mediante el moldeo de lafuncion de energıa, para finalmente estabilizar lavelocidad lineal del vehıculo mediante el contro-lador propuesto por Astolfi-Kaliora (Kaliora andAstolfi, 2004). En las subsecciones siguientes sedetallan cada una de estas fases.

4.2.1. Linealizacion parcial. Para el diseno decontroladores no lineales suele resultar conve-niente realizar, en primer lugar, una linealizacionparcial de las ecuaciones del sistema a traves de latecnica de linealizacion por realimentacion (feed-back linearization). Esto no significa linealizar lasecuaciones sustituyendo los terminos no linealescon los primeros terminos de sus desarrollos deTaylor, como se suele hacer habitualmente. Estatecnica consiste en definir un bucle de controlinterno que genere una entrada ficticia tal que lafuncion de transferencia entre esta entrada y la sa-lida sea lineal. Cuando no es posible encontrar unaentrada ficticia que elimine todas las no linealida-des, se procede a una linealizacion parcial. Es loque sucede con el pendulo invertido. Claramente,la ley que define la entrada ficticia en funcion dela real y de las variables de estado es, en general,no lineal.

Se consideran las ecuaciones del sistema no linea-les definidas por (2) y (3). Si se despeja lθ de (3)y se sustituye en (2) se obtiene la ecuacion

Marina
Text Box
58
Marina
Text Box
Desarrollo y Experimentación de un Vehículo Basado en Péndulo Invertido (PPCar)
JLDIEZ
Line

x =F + Mlθ2 sin θ − Mg sin θ cos θ

(M + m) − M cos2 θ(8)

cuyo segundo miembro proporciona la ley no linealde la entrada ficticia. De hecho, si se define comonueva variable de control

u =F + Mlθ2 sin θ − Mg sin θ cos θ

(M + m) − M cos2 θ, (9)

las ecuaciones (2) y (3) del modelo pueden rees-cribirse como

u cos θ + lθ − g sin θ = 0x = u

, (10)

por lo que las ecuaciones de estado del sistemaquedan

x1 = x2

x2 =g sin x1 − u cos x1

lx3 = u

, (11)

donde x1 = θ, x2 = θ, x3 = x. Se puededestacar como la dinamica entre la entrada ficticiau y el estado x3 es ahora lineal. Ademas, elsistema presenta ahora una estructura en cascadaque permite obtener una solucion escalonada alproblema de control.

4.2.2. Moldeo de la funcion de energıa. Existendiversas formas de estabilizar el pendulo. Una deellas consiste en modificar la funcion de la energıadel sistema mediante una ley de control adecuada,de manera que el mınimo de la misma se encuentreen el punto que se desea estabilizar.

Para obtener esta ley de control basta con igualarla ecuacion del pendulo no invertido, es decirestable para θ = 0:

θ = −g sin θ

l(12)

con la del nuestro sistema:

θ =g sin θ − u cos θ

l(13)

es decir,

−g sin θ

l=

g sin θ − u cos θ

l(14)

obteniendose

u = 2g tan x1. (15)

En la practica, esto permite obtener el valor de laentrada u tal que el sistema en bucle cerrado secomporte como si la gravedad se hubiera cambiado

de signo, es decir, como si tuviera la funcion deenergıa:

Va = − cos x1 (16)

Utilizando esta ley de control el sistema presen-tarıa oscilaciones alrededor del punto de equili-brio. Si se desea un comportamiento asintotica-mente estable es necesario anadir un termino deamortiguamiento:

u = 2Kmg tan x1 +Ka

Mx2, (17)

donde Km es una constante que anade un mayorgrado de libertad al ajuste del controlador.

4.2.3. Estabilizacion de la velocidad. Para ter-minar el diseno del controlador se emplean tecnicasllamadas de forwarding para estabilizar la veloci-dad del vehıculo.

Estas tecnicas se aplican al problema de la estabi-lizacion de sistemas que tengan una estructura encascada, es decir, compuestos por dos subsistemasde la forma

X1 = f1 (X1,X2, U)

X2 = f2 (X2, U)

(18)

La tecnicas de forwarding proponen estabilizar enun primer paso el subsistema superior a traves deuna senal de control U , para luego modificarla demanera que se controle el segundo subsistema sinque el equilibrio de X1 pierda su caracter estable.

Como el sistema tras la linealizacion parcial en(11) tiene estructura en cascada y el primer sub-sistema, formado por x1 y x2, ha sido estabilizadoa traves del moldeo de energıa, se pueden aplicardichas tecnicas para la estabilizacion de la veloci-dad.

Este objetivo se consigue anadiendo un nuevotermino a la ley de control de la forma

u = 2Kmg tan x1 +Ka

Mx2 + ud . (19)

El valor de ud puede obtenerse de diversas mane-ras. En (Gordillo et al., 2004) se imponen condi-ciones sobre la funcion de energıa del sistema enbucle cerrado. Esto lleva a la necesidad de resolverecuaciones en derivadas parciales que proporcio-nan una ley de control bastante compleja. En estetrabajo, debido a su simplicidad de calculo, se hautilizado la ley de control propuesta por Astolfi-Kaliora (Kaliora and Astolfi, 2004) donde

ud = ǫ sat

(

Kvx3

ǫ

)

. (20)

Marina
Text Box
A. Viguria, A. Prieto, M. Fiacchini, R. Cano, F. R. Rubio, J. Aracil, C. Canudas-de-Wit
JLDIEZ
Line
Marina
Text Box
59

Los detalles de esta ley pueden ser encontrados enel artıculo referenciado anteriormente. De todasformas se va a detallar brevemente a continuacion.

Debido a la presencia de la saturacion y a oportu-nos valores de los parametros Kv y ǫ, el terminoud es despreciable respecto a los terminos relativosal angulo y a la velocidad angular en (19), cuandoestos se hallan lejos del origen. Por lo tanto,cuando el sistema esta lejos de la posicion deseadala accion de control se ocupa casi exclusivamentede llevar el pendulo a la posicion vertical. Una vezque el pendulo se encuentra cerca del equilibrio, en(19) los dos primeros terminos del segundo miem-bro practicamente se anulan y solo actua ud, quefunciona como una pequena perturbacion de laentrada. Esto conlleva que el angulo nulo no sea unequilibrio mientras que la velocidad no sea nula.De manera que, cuando el pendulo se encuentracerca del origen y la senal ud esta saturada, elangulo se estabiliza en un valor cercano al cero y lavelocidad lineal decrece lentamente. Finalmente,en cuanto la velocidad entra en la zona lineal dela saturacion, los tres estados son estabilizados enel origen.

−0.1 0 0.1 0.2 0.3 0.4 0.5 0.6−0.02

0

0.02

0.04

0.06

0.08

0.1

0.12

An

gu

lo

Velocidad

Figura 6. Evolucion de velocidad y angulo sin ud.

En la figura 6, se puede ver la evolucion de lavelocidad respecto al angulo sin el control develocidad. En este caso el sistema se estabiliza enun punto con angulo cero y velocidad no nula.Comparandola con la figura 7 se puede notarel efecto de la senal ud. El primer tramo de latrayectoria es practicamente igual al anterior, perouna vez que se llega cerca del angulo cero lavelocidad empieza a deslizarse lentamente hacia elorigen. En la figura 8 se muestra una ampliacionde la trayectoria final de la figura 7. Se puedeobservar como el angulo se mantiene constantecuando la velocidad esta en la zona de saturaciony como evoluciona hacia el origen cuando entra enla zona lineal.

Finalmente tras deshacer la linealizacion parcial,la ley de control global que indica la fuerza aaplicar al vehıculo para conseguir la estabilizaciondel pendulo y la velocidad de este, resulta ser

−0.1 0 0.1 0.2 0.3 0.4 0.5 0.6−0.02

0

0.02

0.04

0.06

0.08

0.1

0.12

Velocidad

An

gu

lo

Figura 7. Evolucion de velocidad y angulo con ud.

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35

−2.5

−2

−1.5

−1

−0.5

0

0.5

1x 10

−3

Velocidad

An

gu

lo

Figura 8. Evolucion de velocidad y angulo con ud

en la zona lineal.

F =[

(M + m) − M cos2 θ]

u+

Mg sin θ cos θ − Mlθ2 sin θ, (21)

con

u = 2Kmg tan θ +Ka

Mθ + ǫ sat

(

Kvv

ǫ

)

. (22)

4.2.4. Sintonizacion del controlador no linealEl controlador LQR presenta un comportamientooptimo entorno al punto de equilibrio. Ası que, sise determina la relacion entre las constantes deeste controlador y las del Astolfi-Kaliora, podranobtenerse unos valores de Km, Ka y Kv queproporcionen un comportamiento similar a LQRal menos en el punto de equilibrio.

Deshaciendo la linealizacion parcial que se realizocomo paso previo al diseno del control no lineal sellega a la ecuacion (21) donde u esta definida porla expresion (22).

Si se linealizan estas ecuaciones en el punto deequilibrio θ = 0, θ = 0 y v = 0, se obtiene que

F = [Mg + 2gmKm]θ + mKaθ + mKvv. (23)

Marina
Text Box
60
Marina
Text Box
Desarrollo y Experimentación de un Vehículo Basado en Péndulo Invertido (PPCar)
JLDIEZ
Line

Si se compara esta ecuacion con la del LQR,ecuacion (7), pueden obtenerse los valores deKm, Ka y Kv que proporcionaran buenas carac-terısticas al controlador, esto es

Km =−K1 − Mg

2gm

Ka =−K2

m

Kv =−K3

m

. (24)

5. RESULTADOS OBTENIDOS

Concluido el diseno de controladores se ha reali-zado un conjunto de simulaciones con la herra-mienta Simulink de Matlab. Esto ha permitidocomprobar su funcionamiento ası como procedera la sintonizacion de los distintos parametrosde dichos controladores. La senal procedente delcontrolador, que se corresponde a la fuerza aaplicar al carro, es repartida de forma simetricaentre las dos ruedas del vehıculo.

Figura 9. Comparacion de controladores

Por otra parte, para el guiado del vehıculo se hautilizado un control proporcional que aumenta lafuerza ejercida por una de las ruedas y la dismi-nuye en la otra, lo que provoca el giro deseado.

Los valores de los parametros del sistema son:

• m = 35 kg : masa del carro,• M = 70 kg : masa del pendulo,• l = 1 m : altura del centro de masa,• g = 9.8 m/s2 : aceleracion de la gravedad,• J = 10 kg m2 : momento de inercia respecto

al eje vertical,• d = 0.83 m : distancia entre las ruedas.

Para el calculo de los parametros del controladorlineal se ha resuelto la ecuacion de Riccati asocia-da al problema LQR empleando las matrices

Q =

100 0 00 100 00 0 1

R = 0.1 , (25)

en la ecuacion (5), obteniendo los siguientes valo-res

K1 = 2070 K2 = 385.1 K3 = 3.2 . (26)

Los valores de las matrices Q y R han sido elegidospara priorizar la estabilizacion del pendulo conrespecto a la velocidad.

Usando las ecuaciones (24) de sintonizacion, losparametros del controlador no lineal son

Km =−4.017 Ka =−11.004 Kv =−0.090 , (27)

mientras que el valor ǫ = 0.01 ha sido elegidoempıricamente.

Las simulaciones realizadas con estos parametrosmuestran que los dos controladores, LQR y nolineal, presentan un comportamiento muy similaren torno al punto de equilibrio. Solo se aprecian di-ferencias cuando el pendulo se aleja de la posicionvertical. En la figura 9 se muestra la evoluciondel angulo, con ambos controladores, partiendo deuna posicion inicial de 0.5 rad hasta su estabili-zacion en cero.

Al implementar estos controladores en el vehıculose ha observado una fuerte vibracion debida a lapresencia de un ruido en la senal del inclinometro.El efecto de este ruido se presenta en la realimen-tacion de la medida del angulo θ y sobre todo en lade su derivada θ, ya que esta se calcula en base alincremento de la senal en el intervalo de muestreo.Como el tiempo de muestreo es muy pequeno,10 ms, las rapidas variaciones debidas al ruidoconllevan valores muy elevados de la derivada.

0 10 20 30 40 50 60 70 80 90−0.05

0

0.05

0.1

0.15

0.2

0.25

0.3

Tiempo (segundos)

Incl

inac

ión

(rad

ian

es)

Señal original

Señal filtrada

Figura 10. Comparacion entre la senal θ originaly filtrada

Para atenuar este fenomeno se puede actuar sobredos aspectos; aplicando un filtro pasa bajo ala senal para eliminar las componentes de altafrecuencia debidas al ruido y disminuyendo elvalor de la constante de realimentacion del estadoθ. Ambos efectos quedan ilustrados en las figuras10 y 11.

Marina
Text Box
A. Viguria, A. Prieto, M. Fiacchini, R. Cano, F. R. Rubio, J. Aracil, C. Canudas-de-Wit
JLDIEZ
Line
Marina
Text Box
61

0 10 20 30 40 50 60 70−0.5

−0.4

−0.3

−0.2

−0.1

0

0.1

0.2

0.3

0.4

0.5

Tiempo (segundos)

Der

ivad

a

de

la

incl

inac

ión

(rad

/seg

)

Derivada con K = 100

Derivada con K = 300

Figura 11. Incremento del ruido en θ al aumentarla ganancia

Concretamente se ha aplicado un filtro de se-gundo orden Butterworth utilizando la tecnica dediseno de filtros IIR (Infinite Impulse Response)mediante la transformacion bilineal (Ifeachor andJervis, 1993). La funcion de transferencia del filtroimplementado es:

H(z−1) =0.0133z−2 + 0.0266z−1 + 0.0133

0.85z−2 − 1.9734z−1 + 1.1766. (28)

Con respecto a los experimentos, se ha observadoempıricamente un buen comportamiento fijandoK2 = 100 para el LQR y calculando el Ka

asociado para el controlador no lineal. En lasfiguras 12 y 13 se muestran las fuerzas asociadas acada una de las ruedas del vehıculo para cada unode los controladores implementados. En ambasgraficas se muestra un mismo experimento dondeen primer lugar el vehıculo se desplaza haciaadelante, a continuacion da una vuelta sobre sımismo y finalmente se vuelve a desplazar girandoa izquierda y a derecha.

0 10 20 30 40 50 60 70 80−100

−50

0

50

100

150

200

250

Tiempo (segundos)

Fu

erza

(New

ton

)

F. Izq

F. Der

Figura 12. Resultados experimentales obtenidoscon el controlador LQR

Por otra parte, en la figura 15 se muestra laevolucion de la inclinacion en un experimento real.En la grafica se puede observar que la inclinacionmaxima es de 0.16 radianes. Esto implica que enlos experimentos, el vehıculo no suele inclinarse

0 10 20 30 40 50 60 70 80−100

−50

0

50

100

150

200

250

Tiempo (segundos)

Fu

erza

(New

ton

)

F. Izq

F. Der

Figura 13. Resultados experimentales obtenidoscon el controlador no lineal

demasiado y que por lo tanto el comportamientode ambos controladores es muy parecido, coinci-diendo con los resultados de las simulaciones. Estounido al hecho que no es posible repetir exacta-mente el mismo experimento debido al efecto dela persona que lo conduce, provoca que la compa-racion experimental entre los dos controladores nohaya proporcionado resultados que demuestren lasdiferencias entre ellos. Este tipo de comparacionessolo serıa posible si el sistema desarrollado fueracompletamente autonomo.

Figura 15. Evolucion de la inclinacion durante unexperimento

Finalmente, en la figura 14 se muestra una se-cuencia de fotogramas de un vıdeo de una de laspruebas donde se puede observar como el pendulose estabiliza incluso cuando se realizan giros.

6. CONCLUSIONES Y DESARROLLOFUTURO

En este artıculo se presenta el proyecto y elfuncionamiento de un vehıculo cuyo movimientoesta basado en la estabilizacion de un penduloinvertido. Este vehıculo ha sido disenado porlos autores y realizado a partir de componentescomerciales de bajo coste. Se ha conseguido un

Marina
Text Box
62
Marina
Text Box
Desarrollo y Experimentación de un Vehículo Basado en Péndulo Invertido (PPCar)
JLDIEZ
Line

Figura 14. Secuencia de fotogramas de un experimento

sistema de experimentacion que permite de formasencilla el estudio de diversos controladores.

En las pruebas realizadas se han utilizado dos ti-pos de controladores: un controlador lineal optimo(LQR) y un controlador no lineal basado enmoldeo de energıa, obteniendo una conduccioncomoda y suave en ambos casos.

Dentro de los desarrollos futuros se contempla eldiseno de nuevas tecnicas de control y un estudiocomparativo entre ellas. Ademas, se contempla elestudio de la interaccion entre el giro alrededor deleje vertical y el sistema constituido por el penduloinvertido.

Finalmente varios vıdeos demostrativos estan dis-ponibles en la pagina web:

http://nyquist.us.es/∼ppcar .

AGRADECIMIENTOS

Los autores desean expresar su agradecimiento alMCYT-FEDER por subvencionar este trabajo apartir de los proyectos DPI2004-06419, DPI2003-00429, HF2003-0237 y SAB2003-0085. Tambienagradecen la subvencion proporcionada por elprograma PICASSO No. 07261YJ (EGIDE) delMinisterio Frances de Asuntos Exteriores y deLAFMA.

REFERENCIAS

Astrom, K. J. y K. Furuta (1996). Swinging-up apendulum by energy control. En: Proc. IFACCongress. pp. 37–95.

Baloh, M. y M. Parent (2003). Modeling mo-del verification intelligent self-balancing two-wheeled vehicle for an autonomous urbantransportation system. En: Conf. Comp.Intelligence, Robotics Autonomous Systems.Singapore.

Furuta, K. (2003). Control of pendulum: Fromsuper mechano-system to human adaptativemechatronics. En: Proceedings of the 42ndIEEE CDC.

Gordillo, F., F. Salas y J. Aracil (2004). A forwar-ding controller for the pendulum on a cart.En: Proceedings of Controlo. Vol. 6. Portugal.

Grasser, F., A. D’Arrigo, S. Colombi y A. Ru-fer (2002). Joe: A mobile, inverted pen-dulum. IEEE Trans. Industrial Electronics40(1), 107–114.

Hill, J., R. Szewczyk, A. Woo, S. Hollar, D. Cullery K. Pister (2000). System architecture direc-tions for networked sensors. ACM. OperatingSystems Review. 34(5), 93–104.

Ifeachor, E.C. y B.W. Jervis (1993). Digital SignalProcessing: A Practical Approach. Addison-Wesley.

Kaliora, G. y A. Astolfi (2004). Nonlinear controlof feedforward systems with bounded signals.IEEE Trans. Autom. Control 49(11), 1975–1990.

Pathak, K., J. Franch y S.K. Agrawal (2004). Ve-locity control of a wheeled inverted pendulumby partial feedback linearization. En: 43rdIEEE Conference on Decision and Control.Vol. 4. pp. 3962– 3967.

Salerno, A. y J Angeles (2003). On the nonli-near controllability of a quasiholonomic mo-bile robot. En: Proceedings of IEEE Inter-national Conference onRobotics and Automa-tion. Vol. 3. pp. 3379– 3384.

Segway, Inc. (2004). http://www.segway.com.Tirmant, H., M. Baloh, L. Vermeiren, T.M. Gue-

rra y M. Parent (2002). B2, an alternativetwo wheeled vehicle for an automated urbantransportation system. En: IEEE IntelligentVehicle Symposium. Vol. 2. pp. 594– 603.

Viguria, A., M. Fiacchini, A. Prieto, R. Cano yB.J. Vela (2005). Vehıculo basado en penduloinvertido. Memoria tecnica. Universidad deSevilla. http://nyquist.us.es/∼ppcar.

Marina
Text Box
A. Viguria, A. Prieto, M. Fiacchini, R. Cano, F. R. Rubio, J. Aracil, C. Canudas-de-Wit
JLDIEZ
Line
Marina
Text Box
63