Click here to load reader

Etude des effets des algorithmes d’apprentissage et des ... · PDF filenébulosité, la vitesse du vent et la précipitation. Pour déterminer l‟architecture du réseau à utiliser,

  • View
    216

  • Download
    0

Embed Size (px)

Text of Etude des effets des algorithmes d’apprentissage et des ... · PDF...

  • International Journal of Engineering Research and Development

    e-ISSN: 2278-067X, p-ISSN: 2278-800X, www.ijerd.com

    Volume 9, Issue 6 (December 2013), PP. 15-26

    15

    Etude des effets des algorithmes dapprentissage et des fonctions

    de transfert sur la performance des modles statistiques

    neuronaux : Application dans le domaine mtorologique

    Hicham El Badaoui1, Abdelaziz Abdallaoui

    2, Samira Chabaa

    3

    1,2 Universit Moulay Ismail, Facult des Sciences, Laboratoire de Chimie-Biologie Appliques

    lEnvironnement, Equipe Chimie Analytique et Environnement,

    B.P. 11201, Zitoune, Mekns. Maroc. 3 Universit Ibn Zohr, Ecole Nationale des Sciences Appliques, Dpartement Gnie industriel

    BP. 1136, Agadir. Maroc.

    Rsum:- Ce travail prsente le dveloppement d'un modle de rseau de neurones artificiel (RNA) de type

    Perceptron Multicouche (PMC) pour la prdiction du taux dhumidit de la zone de Chefchaouen. Notre objectif

    cest traiter une srie chronologique des donnes mesures entre les annes 2008 et 2013 pour valuer la

    rponse du rseau. Cette srie est constitue dun certain nombre de paramtres mtorologiques telles que le

    taux dhumidit, la temprature de lair, la temprature de rose, la pression atmosphrique, la visibilit, la

    nbulosit, la vitesse du vent et la prcipitation. Pour dterminer larchitecture du rseau utiliser, nous avons

    vari le nombre des couches caches, le nombre de neurones dans la couche cache, les fonctions de transfert et

    les couples de fonctions de transfert ainsi que les algorithmes dapprentissage. Plusieurs critres statistiques

    comme lerreur quadratique moyenne (MSE) et le coefficient de corrlation (R), ont t tudis pour

    lvaluation des modles dvelopps. Les meilleurs rsultats ont t obtenus avec un rseau darchitecture

    [7-5-1], les fonctions dactivations (Tansig-Purelin) et un algorithme dapprentissage de Levenberg-Marquardt.

    Mots cls:- Rseau de neurones artificiel, Perceptron Multicouche, Prdiction, Algorithme dApprentissage,

    Humidit.

    I. INTRODUCTION La mtorologie accumule des quantits normes de donnes. Ces donnes proviennent dobservations

    effectues au sol, en altitude, en mer et dans lespace. Elles sont htrognes et fortement bruites. Pour extraire

    des informations prcises de ces donnes, les mtorologues utilisent diffrents types de modles qui dpendent

    des domaines comme la physique ou la statistique. La physique a pour objet la reprsentation de la ralit

    laide de modles qualifis de boite blanche. Tandis que la statistique essaie de construire ces modles

    mathmatiques de type boite noire partir des donnes empiriques. Linformation extraite va dpendre de

    lensemble des modles physiques ou statistiques utiliss pour dcrire le problme et les diffrentes hypothses

    qui seront choisies au dpart. Dans le domaine mtorologique, les lois des paramtres climatiques sont non

    linaires et afin de modliser ce type de problmes, nous nous sommes intresss particulirement un modle

    typique de rseau neuronal connu sous le nom Perceptron Multicouche. Les rseaux de neurones artificiels sont

    extrmement appliqus pour rsoudre des phnomnes fortement complexes et non linaires. Dans la littrature,

    les rseaux de neurones artificiels ont prsent un grand succs dans lanalyse statistique, les traitements de

    donnes et la prvision des paramtres environnementaux, et diffrents travaux de recherches ont t proposs

    dans le cadre de la prdiction en utilisant les rseaux de neurones de type PMC.

    Abdelli S. et al., en 2012, [1] ont prsent la mthode des rseaux de neurones de type perceptron

    multicouche, pour prdire des polluants dair. Leur objectif est de prvoir les concentrations de NO2- et de

    trouver ses relations avec les autres variables mtorologiques.

    Fock E. et al., en 2000, [2] ont trait un modle statistique neuronal pour la modlisation thermique des

    btiments. Cette dmarche base sur la prdiction de la temprature de surface intrieure dune paroi montre la

    faisabilit et la possible implmentation du rseau dans un code.

    Abdallaoui A. et al., 2013, [3] ont utilis aussi les rseaux de neurones multicouche pour la prdiction

    des concentrations des mtaux lourds dans les sdiments fluviaux marocains, partir dun certain nombre de

    paramtres physico-chimiques.

    Lhumidit relative est lun des paramtres mtorologiques importants vue son influence sur la sant

    de lhomme, les matires de construction, lagriculture et lenvironnement, etc. Ainsi nous avons jug utile de

    dvelopper des modles mathmatiques statistiques neuronaux pour la prdiction de lhumidit relative dans la

    zone de Chefchaouen partir dun certain nombre de paramtres mtorologiques.

  • Etude des effets des algorithmes dapprentissage et des fonctions de transfert

    16

    II. MATRIEL ET MTHODES A. Prsentation de la zone dtude

    Notre zone dtude est la province de Chefchaouen qui est localise dans une rgion importante

    caractrise par une grande diversit des sols et des formations gologiques. Elle se trouve dans la zone de

    transition entre le domaine des nappes de flyschs et le domaine interne.

    Fig.1 : Situation gographique de la zone de Chefchaouen (Maroc).

    La Province de Chefchaouen, situe au Nord-Ouest du Maroc (Latitude: 351017 nord; Longitude: 5

    16 11 Ouest; Altitude: 564 mtres) sur la chane rifaine, est limite au Nord par la mditerrane sur une

    longueur de 120 Km, au Sud par les provinces de Taounate et Sidi Kacem, l'Est par la province d'Al Hoceima

    et l'Ouest par les provinces de Ttouan et Larache. Cest une province qui relve de la rgion administrative

    de Tanger-Ttouan (Fig. 1).

    B. Base de donnes

    La base de donnes utilise dans le cadre de cette tude est constitue par les valeurs de huit variables

    mtorologiques relatives la zone de Chefchaouen:

    Sept variables indpendantes (explicatives) : Temprature de lair, temprature de rose, pression atmosphrique, visibilit, nbulosit, vitesse du vent et la prcipitation.

    Une variable dpendante ( prdire) : le taux dhumidit (lhumidit relative). Ces valeurs ont t releves toutes les quatre heures pendant 1856 jours entre les annes 2008 et 2013. Elles ont

    t converties en moyennes journalires pour toutes les variables, sauf la quantit de prcipitations qui a t

    transforme en une valeur cumulative de la journe [4].

    C. Mise en forme des donnes

    Les donnes dentre (variables indpendantes) sont des valeurs brutes non transformes qui ont des

    ordres de grandeurs trs diffrents selon les variables. Afin duniformiser les chelles de mesures, ces donnes

    sont converties en variables standardises. En effet, les valeurs Ii de chaque variable indpendante (i) ont t

    standardises par rapport sa moyenne et son cart-type suivant la relation :

    I i =Ii i

    i

    I i : Valeur standardise relative la variable i ; Ii: Valeur brute relative la variable i ;

    i : Valeur moyenne relative la variable i ;

    i: cart-type relative la variable i.

    Les valeurs correspondantes aux variables dpendantes ont t galement normalises dans lintervalle

    [-1,1] partir de la relation suivante [5]:

  • Etude des effets des algorithmes dapprentissage et des fonctions de transfert

    17

    I i =2(Ii Min(Ii))

    (Max(Ii) Min(Ii)) 1

    III. RESEAUX DE NEURONES ARTIFICIELS (RNA) Un rseau de neurones artificiels est un modle de calcul dont l'inspiration originelle tait un modle

    biologique, c'est--dire le modle du cerveau nerveux humain. Les rseaux de neurones artificiels sont

    optimiss par des calculs dapprentissage de type statistique. Ils sont placs dune part, dans la famille

    des applications statistiques, permettant de gnrer de vastes espaces fonctionnels, souples et

    partiellement structurs, et dautre part dans la famille des mthodes de lintelligence artificielle,

    permettant de prendre des dcisions sappuyant davantage sur la perception que sur le raisonnement

    logique formel [6].

    A. Modle mathmatique dun neurone formel Le modle mathmatique d'un neurone artificiel est illustr par la figure 2. Un neurone est

    essentiellement constitu d'un intgrateur qui effectue la somme pondre de ses entres. Le rsultat de cette

    somme ensuite transforme par une fonction de transfert f qui produit la sortie On du neurone. Les n entres du

    neurone correspondent au vecteur not: I = I1, I2,, I3, , In et le vecteur de poids est reprsent par :

    W = (W1 , W2,; W3 , , Wn ).

    Fig.2 : Structure d'un neurone artificiel

    La sortie On de l'intgrateur est dfinie par l'quation suivante : O = WTI b

    Le rsultat de la somme pondre s'appelle le niveau d'activation du neurone. Le biais b s'appelle aussi

    le seuil d'activation du neurone [7].

    B. Choix dun rseau de neurones Il existe un grand nombre de types de rseaux de neurones, dont chacun a des avantages et des

    inconvnients. Le rseau choisit dans notre tude est un rseau perceptron multicouche (PMC). Ce choix est fait

    pour la facilit et la rapidit de sa construction et encore par le fait que notre problme ne prsente quun

    nombre considr limit de variables dentres [8]. La figure 3 illustre le perceptron multicouche dans le cas

    dune seule couche dentre, une seule couche cache et une seule sortie.

    Fig.3 : Exemple darchitecture dun PMC n variables dentre, n neurones dans la couche cache et une seule

    sortie

    Le perceptron multicouche est compos dun assemblage de neurones rpartis sur plusieurs couches.

    La premire couche correspondant au

Search related