Click here to load reader
View
216
Download
0
Embed Size (px)
International Journal of Engineering Research and Development
e-ISSN: 2278-067X, p-ISSN: 2278-800X, www.ijerd.com
Volume 9, Issue 6 (December 2013), PP. 15-26
15
Etude des effets des algorithmes dapprentissage et des fonctions
de transfert sur la performance des modles statistiques
neuronaux : Application dans le domaine mtorologique
Hicham El Badaoui1, Abdelaziz Abdallaoui
2, Samira Chabaa
3
1,2 Universit Moulay Ismail, Facult des Sciences, Laboratoire de Chimie-Biologie Appliques
lEnvironnement, Equipe Chimie Analytique et Environnement,
B.P. 11201, Zitoune, Mekns. Maroc. 3 Universit Ibn Zohr, Ecole Nationale des Sciences Appliques, Dpartement Gnie industriel
BP. 1136, Agadir. Maroc.
Rsum:- Ce travail prsente le dveloppement d'un modle de rseau de neurones artificiel (RNA) de type
Perceptron Multicouche (PMC) pour la prdiction du taux dhumidit de la zone de Chefchaouen. Notre objectif
cest traiter une srie chronologique des donnes mesures entre les annes 2008 et 2013 pour valuer la
rponse du rseau. Cette srie est constitue dun certain nombre de paramtres mtorologiques telles que le
taux dhumidit, la temprature de lair, la temprature de rose, la pression atmosphrique, la visibilit, la
nbulosit, la vitesse du vent et la prcipitation. Pour dterminer larchitecture du rseau utiliser, nous avons
vari le nombre des couches caches, le nombre de neurones dans la couche cache, les fonctions de transfert et
les couples de fonctions de transfert ainsi que les algorithmes dapprentissage. Plusieurs critres statistiques
comme lerreur quadratique moyenne (MSE) et le coefficient de corrlation (R), ont t tudis pour
lvaluation des modles dvelopps. Les meilleurs rsultats ont t obtenus avec un rseau darchitecture
[7-5-1], les fonctions dactivations (Tansig-Purelin) et un algorithme dapprentissage de Levenberg-Marquardt.
Mots cls:- Rseau de neurones artificiel, Perceptron Multicouche, Prdiction, Algorithme dApprentissage,
Humidit.
I. INTRODUCTION La mtorologie accumule des quantits normes de donnes. Ces donnes proviennent dobservations
effectues au sol, en altitude, en mer et dans lespace. Elles sont htrognes et fortement bruites. Pour extraire
des informations prcises de ces donnes, les mtorologues utilisent diffrents types de modles qui dpendent
des domaines comme la physique ou la statistique. La physique a pour objet la reprsentation de la ralit
laide de modles qualifis de boite blanche. Tandis que la statistique essaie de construire ces modles
mathmatiques de type boite noire partir des donnes empiriques. Linformation extraite va dpendre de
lensemble des modles physiques ou statistiques utiliss pour dcrire le problme et les diffrentes hypothses
qui seront choisies au dpart. Dans le domaine mtorologique, les lois des paramtres climatiques sont non
linaires et afin de modliser ce type de problmes, nous nous sommes intresss particulirement un modle
typique de rseau neuronal connu sous le nom Perceptron Multicouche. Les rseaux de neurones artificiels sont
extrmement appliqus pour rsoudre des phnomnes fortement complexes et non linaires. Dans la littrature,
les rseaux de neurones artificiels ont prsent un grand succs dans lanalyse statistique, les traitements de
donnes et la prvision des paramtres environnementaux, et diffrents travaux de recherches ont t proposs
dans le cadre de la prdiction en utilisant les rseaux de neurones de type PMC.
Abdelli S. et al., en 2012, [1] ont prsent la mthode des rseaux de neurones de type perceptron
multicouche, pour prdire des polluants dair. Leur objectif est de prvoir les concentrations de NO2- et de
trouver ses relations avec les autres variables mtorologiques.
Fock E. et al., en 2000, [2] ont trait un modle statistique neuronal pour la modlisation thermique des
btiments. Cette dmarche base sur la prdiction de la temprature de surface intrieure dune paroi montre la
faisabilit et la possible implmentation du rseau dans un code.
Abdallaoui A. et al., 2013, [3] ont utilis aussi les rseaux de neurones multicouche pour la prdiction
des concentrations des mtaux lourds dans les sdiments fluviaux marocains, partir dun certain nombre de
paramtres physico-chimiques.
Lhumidit relative est lun des paramtres mtorologiques importants vue son influence sur la sant
de lhomme, les matires de construction, lagriculture et lenvironnement, etc. Ainsi nous avons jug utile de
dvelopper des modles mathmatiques statistiques neuronaux pour la prdiction de lhumidit relative dans la
zone de Chefchaouen partir dun certain nombre de paramtres mtorologiques.
Etude des effets des algorithmes dapprentissage et des fonctions de transfert
16
II. MATRIEL ET MTHODES A. Prsentation de la zone dtude
Notre zone dtude est la province de Chefchaouen qui est localise dans une rgion importante
caractrise par une grande diversit des sols et des formations gologiques. Elle se trouve dans la zone de
transition entre le domaine des nappes de flyschs et le domaine interne.
Fig.1 : Situation gographique de la zone de Chefchaouen (Maroc).
La Province de Chefchaouen, situe au Nord-Ouest du Maroc (Latitude: 351017 nord; Longitude: 5
16 11 Ouest; Altitude: 564 mtres) sur la chane rifaine, est limite au Nord par la mditerrane sur une
longueur de 120 Km, au Sud par les provinces de Taounate et Sidi Kacem, l'Est par la province d'Al Hoceima
et l'Ouest par les provinces de Ttouan et Larache. Cest une province qui relve de la rgion administrative
de Tanger-Ttouan (Fig. 1).
B. Base de donnes
La base de donnes utilise dans le cadre de cette tude est constitue par les valeurs de huit variables
mtorologiques relatives la zone de Chefchaouen:
Sept variables indpendantes (explicatives) : Temprature de lair, temprature de rose, pression atmosphrique, visibilit, nbulosit, vitesse du vent et la prcipitation.
Une variable dpendante ( prdire) : le taux dhumidit (lhumidit relative). Ces valeurs ont t releves toutes les quatre heures pendant 1856 jours entre les annes 2008 et 2013. Elles ont
t converties en moyennes journalires pour toutes les variables, sauf la quantit de prcipitations qui a t
transforme en une valeur cumulative de la journe [4].
C. Mise en forme des donnes
Les donnes dentre (variables indpendantes) sont des valeurs brutes non transformes qui ont des
ordres de grandeurs trs diffrents selon les variables. Afin duniformiser les chelles de mesures, ces donnes
sont converties en variables standardises. En effet, les valeurs Ii de chaque variable indpendante (i) ont t
standardises par rapport sa moyenne et son cart-type suivant la relation :
I i =Ii i
i
I i : Valeur standardise relative la variable i ; Ii: Valeur brute relative la variable i ;
i : Valeur moyenne relative la variable i ;
i: cart-type relative la variable i.
Les valeurs correspondantes aux variables dpendantes ont t galement normalises dans lintervalle
[-1,1] partir de la relation suivante [5]:
Etude des effets des algorithmes dapprentissage et des fonctions de transfert
17
I i =2(Ii Min(Ii))
(Max(Ii) Min(Ii)) 1
III. RESEAUX DE NEURONES ARTIFICIELS (RNA) Un rseau de neurones artificiels est un modle de calcul dont l'inspiration originelle tait un modle
biologique, c'est--dire le modle du cerveau nerveux humain. Les rseaux de neurones artificiels sont
optimiss par des calculs dapprentissage de type statistique. Ils sont placs dune part, dans la famille
des applications statistiques, permettant de gnrer de vastes espaces fonctionnels, souples et
partiellement structurs, et dautre part dans la famille des mthodes de lintelligence artificielle,
permettant de prendre des dcisions sappuyant davantage sur la perception que sur le raisonnement
logique formel [6].
A. Modle mathmatique dun neurone formel Le modle mathmatique d'un neurone artificiel est illustr par la figure 2. Un neurone est
essentiellement constitu d'un intgrateur qui effectue la somme pondre de ses entres. Le rsultat de cette
somme ensuite transforme par une fonction de transfert f qui produit la sortie On du neurone. Les n entres du
neurone correspondent au vecteur not: I = I1, I2,, I3, , In et le vecteur de poids est reprsent par :
W = (W1 , W2,; W3 , , Wn ).
Fig.2 : Structure d'un neurone artificiel
La sortie On de l'intgrateur est dfinie par l'quation suivante : O = WTI b
Le rsultat de la somme pondre s'appelle le niveau d'activation du neurone. Le biais b s'appelle aussi
le seuil d'activation du neurone [7].
B. Choix dun rseau de neurones Il existe un grand nombre de types de rseaux de neurones, dont chacun a des avantages et des
inconvnients. Le rseau choisit dans notre tude est un rseau perceptron multicouche (PMC). Ce choix est fait
pour la facilit et la rapidit de sa construction et encore par le fait que notre problme ne prsente quun
nombre considr limit de variables dentres [8]. La figure 3 illustre le perceptron multicouche dans le cas
dune seule couche dentre, une seule couche cache et une seule sortie.
Fig.3 : Exemple darchitecture dun PMC n variables dentre, n neurones dans la couche cache et une seule
sortie
Le perceptron multicouche est compos dun assemblage de neurones rpartis sur plusieurs couches.
La premire couche correspondant au