Upload
bruce-bob
View
103
Download
1
Embed Size (px)
Citation preview
Bertrand Audras, Microsoft MTCEric Pouvreau, HP FranceFrédéric Pichaut, Microsoft [email protected]@[email protected]
IT099 - Mise en place d'un datacenter SQL Server 2005
Partenariat HP-Microsoft
Des partenaires qui collaborent ensemble depuis de nombreuses années
Investissement conjoint de 300M$ en R&D annoncé en 2006Forte implication dans les Microsoft Technology CentersPartenariat sur le programme SQL Always OnConduite conjointe de projets afin de sécuriser les projets, engagements contractuels communs de bout en bout
Des clients communs en production sur des applications Business Critical, certains depuis plusieurs années et versions
FNAC.comCiments Français (environnement SAP)Caisse Nationale des Caisses d’EpargneL’OréalCrédit Agricole
Les missions d’un Datacenter
Assurer la production quotidienne des opérations en fournissant la puissance nécessaire aux applicationsFournir un tableau de bord de pilotage de l’activité et d’anticipation des besoinsGarantir une qualité de service stable et conforme au SLA en protégeant les données et leur accès
Pannes matérielles et logiciellesErreurs humaines et agressionsFacteurs externes liés à l’électricité, le réseau, la climatisation, l’incendie…
Datacenter: Les enjeux SQL ServerAgendaGarantir la continuité des opérations
MéthodologieRedondance et performancesSolutions de haute-disponibilitéLe point de vue de l’architecte, expériences projets
Mettre en œuvre aux standards ITILSupporter, changer, exploiter, optimiser
Accompagner l’exploitation au quotidienLe support technique, élément clé de la réactivitéAnticiper les pannes
Construire les contrats de service
Réduire la perception de l'indisponibilité pour les utilisateurs
Dialogue entre des responsables infrastructures et les clients internes
Démarche application par applicationQuelle est la Qualité de Service attendue par les utilisateurs ?Combien d'utilisateurs utilisent-ils cette application? Est-il possible de chiffrer la perte d'une heure d'interruption de service?Quels sont les risques à couvrir en priorité? Quelle est la fréquence des pannes?Quelles sont les ressources déjà en place et quel est le budget d'investissement disponible?
Recovery Point/Time Objectives
RPO: Point de redémarrageJours Heures Minutes
Transactions
Désastre
Corruption des données
Erreurs humaines
Perte de serveurs
Opérations de
maintenance
Pannes du stockage
Cau
ses
des
inte
rru
pti
on
s d
e
serv
ice
99.9%
99.99%
99.999%
99.9999%
8.75h/an
52min/an
5.2min/an
32sec/an
Jours Heures Minutes SecondesInstantané
RTO: Temps de redémarrage
Coûts
Performance et robustesse matérielle
Redondance des composantsLAN, SAN doublésServeurs (alimentations, ventilation, RAID …)Baie de stockage (contrôleurs, cache, RAID …)
Performance serveurSMP vs NUMA32-bit, x64 ou IA64Attachements SAN
Performance d’une baie de stockageChoix de la performance vs capacité Dépend de la performance du (des) contrôleur(s)et … du nombre de disques dont il(s) dispose(nt) pour exercer cette puissanceEffet limité du cache en environnement transactionnelOverhead : réplication à distance, duplication de volumes …Répartition des profils d’IO (random, séquentiel)Performance du back-end prédictibleTests : Microsoft SQLIOSim
Sauvegarde et restauration
Le principal enjeu est la restaurationQualité et rapidité de la restaurationProtection multiple des données, protection des copiesCapacité de reprise sur erreur humaineUtilisation des sauvegardes pour alimenterd’autres plateformes (assurance qualité, dw)
Selon les besoins, technologies complémentairesSQL Server 2005 Database SnapshotSystem Center Data Protection ManagerHP Business Copy
Snapshot Snapclone (copie complète)Orchestration via VSS (Volume Shadow copy Services)
tt
0t
2T
1
tapelib
Solutions de haute disponibilité
Solution RPO RTO Bascule automatique
Impact sur les performances
SQL2005 Database Mirroring mode Synchrone
100% 100% Oui avec témoin
Faibleavec Network Roundtrip
< 10msec
Cluster local MSCS 100% H+1min Oui Reconnexion
client
Non
Database Mirroring SQL Server
Miroir
DonnéesLog
SQL Server
Témoin
Principal
DonnéesLog
SQL Server
Application
commit
MS Cluster Services
App A
App B
App BApp A Cluster
AdresseServeurVirtuel
Solutions de secours à distance
Solution RPO RTO Bascule automatique
Impact sur les performances
SQL2005 Log Shipping H-15min H+30min Non Faiblelié à l’activité IO
SQL2005 Database Mirroring mode Asynchrone
99% H+5min Non Faiblelié à l’activité IO
Réplication de volumes
à distance
100% en
synchrone
H+30min Non En fonction de la distance
Géo-cluster 100% H+5min Oui Reconnexion
client
Non
Log shipping SQL Server
Principal
Secondaire(s)
Svg JournauxRéapplication des Journaux
Copie des Journaux
Principal
Réplication de volumes à distance
App A
App BApp AClust
er
WAN
App B
App A
App B
App A
App B
HP Continuous Access
Cluster géographique
App A
App BApp A
Cluster
WAN
App B
App A
App A
FailoverFailback
HP Continuous Access+ Cluster extension
Combinaison de solutions
Architecture type incluant sécurité locale (physique) et site de secours (logique)
Cas de pannesRPO 100%RTO 1 minuteBascule automatiqueMaintient de la QOS
Cas de désastreRPO 99%RTO 5 minutesBascule manuelleMode dégradé
App A
App ACluster
DB Mirroringasynchrone
Référence Cdiscount.com
Groupe Casino - Leader de la vente par InternetApplication de Front-office
Catalogues produitsGestion du panier de commande
Plusieurs Clusters SQL ServerHP Proliant DL585Baies de stockage SAN en miroir
Log shipping vers site de secoursÉvolution vers DB mirroring asynchrone à l’étude
Le point de vue de l’architecte
La granularité est l’applicationDisposer de ressources garanties pour la productionÉliminer les Single Point Of FailureDimensionner l’architecture en fonction de l’impact du secoursDéfinir la QOS en mode secoursProtéger le système principal contre la panne du système de secoursAnticiper les évolutions et les maintenancesEntrainer les équipes sur la procédure de secours
Le référentiel de mesure est l’indisponibilité perçue par l’utilisateur
Détecter les pannes et les interruptions de serviceDéfinir les modes de bascule vers le secours et le retour arrièreRendre transparente la bascule
Le point de vue de l’architecte
La mise en œuvre une solution simple est un gage d’efficacité
Inutile de sécuriser la machine ou l’application au-delà de la sécurité définie pour les donnéesLa simplicité permet de tester facilementPrendre en considération le plan de secours simultanément à la conception de l’application ou à l’évaluation d’un progiciel Inclure la maintenance des postes utilisateursPlus la procédure est simple, plus elle sera respectée !Construire un système réaliste et évolutif
Cas
de
pan
ne
RPO/RTO
Expériences de projets
Mettre en œuvre un plan de secours par lotsRéduire les délais entre 2 lotsÉtapes intermédiaires concrètes offrant un premier niveau de servicePérenniser la connaissance, l’expérience et les équipes
Conduire le projet au succès Rassurer sur le contrôle des délais et des budgets
Acceptation et compréhension par les utilisateurs et l’équipe projet
Le nouveau système m’empêche de livrer à temps le patchLes temps de réponse se sont dégradées avec le plan de secoursJe ne comprend pas les nouvelles règles de sécurité, c’est trop contraignant
Communiquer, accompagner le changement Créer des binômes avec les représentants des clients
internes
Microsoft Technology Center
Un Datacenter de 20TB et 200CPU x86, x64, IA64 mono & dual coreUne équipe d’architectes pour vous aider dans vos choix technologiquesUne démarche de conseil et d’accompagnement
Partage de l'expérience Microsoft et validation de l'architecture technologiqueMise en place de Proof Of Concept
Contacter votre interlocuteur Microsoft ou [email protected]
Agenda
Garantir la continuité des opérations Méthodologie Redondance et performances Solutions de haute-disponibilité Le point de vue de l’architecte, expériences projets
Mettre en œuvre aux standards ITILSupporter, changer, exploiter, optimiser
Accompagner l’exploitation au quotidienLe support technique, élément clé de la réactivitéAnticiper les pannes
ITIL
Le référentiel ITIL (Information Technology Infrastructure Library) a pour objectif de proposer des guides de best-practices en terme de gestion des services informatiques (administration, déploiement, support) dans une logique d’évolution constante
Gestion des niveaux de services et de configurationsGestion des changements et des mises en productionGestion des problèmes et incidents
Microsoft et HP sont des membres actifs et contributeurs de la communauté ITIL et proposent des offres de services conjointes
Microsoft Operation FrameworkHP IT Service ManagementGarantir le déroulement des opérations, contrôler les coûts et réduire les risques d’un système en évolution constante
Le modèle de processus MOF
Revue d’implémentation
Revue de mise à disposition de l’application
Revue de SLA
Revue des opérations
Changer
ExploiterSupporter
Optimiser
Gestion de capacitéGestion de la disponibilitéOptimisation des coûtsGestion des ressourcesContinuité de serviceGestion de sécurité
Help Desk, suivi des incidents, escalade Gestion des problèmes« Failover » & « Recovery »
Gestion du changementGestion de configuration
Gestion des révisions
Supervision et instrumentation
Administration systèmes, services d’annuaire,
produits, réseaux, sécurité
Sauvegardes, restaurationsTravaux batch
Microsoft Services (consulting et support) propose des prestations de services pour vous accompagner de « bout en
bout », depuis les phases amont de réflexions, jusqu’à l’exploitation des solutions conçues
Microsoft Operation Framework
http://www.microsoft.com/mof
Agenda
Garantir la continuité des opérations Méthodologie Redondance et performances Solutions de haute-disponibilité Le point de vue de l’architecte, expériences projets
Mettre en œuvre aux standards ITIL Supporter, changer, exploiter, optimiser
Accompagner l’exploitation au quotidienLe support technique, élément clé de la réactivitéAnticiper les pannes
Enquêtes régulières sur les incidents support, la satisfaction globale, mise en place d’un COS
Points d’activité réguliers TAM / CSM
Suivi du plan de services et des actionsPoint sur les projets majeursBilan 4 mois et 9 mois
Gestion des escalades avec les équipes supportMise en place de services proactifs, gestion des compétences et planification des servicesCoordination des ressourcesRespect des délais
Mise en place d’un plan de serviceAxes de travail principauxPlan de supportPlanification des actions
Informations techniquesTransfert d’informations techniques
Rapports mensuels d’activitéConsommation du contratAnalyse des incidentsDemandes traitées par le TAM
Mise en place de Post-Mortems pour les incidents critiques
Réunion d’orientations et d’initialisation des services
Présentation du contratDéfinition des rôlesAnalyse de l’existantOrganisation du client et interlocuteurs clésIdentification des projets
Connaissance et analyse du contexte du client
Connaissance de votre contexteConnaissance de votre contexte
Méthodologie Méthodologie CoordinationCoordination
Gestion technique de compte : TAM
Le processus d’escalade
Client
Ingénieur Support (spécialiste) Responsable Technique de Compte(TAM)
Manager Support
Manager Situation Critique
Ingénieur d’Escalade (CPR)
Développement de correctifs(QFE)
Client Support Groupe de développement
CPR (Critical Problem Résolution) : Une équipe mondiale d'ingénieurs de haut niveau dont le but est de trouver des solutions aux problèmes critiques. En étroite collaboration avec les équipes de développement.
Support partenaire
Le processus d’escalade PREMIER
CPR (Critical Problem Résolution) : Une équipe mondiale d'ingénieurs de haut niveau dont le but est de trouver des solutions aux problèmes critiques. En étroite collaboration avec les équipes de développement.
Client
Ingénieur Support (spécialiste) Responsable Technique de Compte(TAM)
Manager Support
Manager Situation Critique
Ingénieur d’Escalade (CPR)
Développement de correctifs(QFE)
Client Support Groupe de développement
Best Practices Support
Tester la stratégie de sauvegarde et restauration (régulièrement)
Sur un autres système et/ou sur le system de productionNoter le temps pour faire une restauration complète
Prendre une image de son système en activité normaleSQL Trace pour la capture des événementsReadtrace pour générer des rapports d’activitésSSMS Reports (en SP2 possibilité de rapports personnalisés)
Que va demander le supportProblèmes de performance, les rapports d’activité « normale »Les ERRORLOG donc penser à les conserver et archiverSQLdiag utilitaire de collecte d’informations
http://msdn2.microsoft.com/en-us/library/ms162833.aspx
Les clés du succès
Simplicité
Évolutivité
Réalisme
Anticipation
Dialogue
Maitrise des coûts
Performances
Maitrise du projet
Questions & Réponses
SQL Server – Microsoft Francehttp://www.microsoft.com/france/sql/sql2005/default.mspxhttp://www.microsoft.com/france/technet/produits/sql/2005
Programme SQL Always On http://www.microsoft.com/sql/alwayson/default.mspx
Webcast Technethttp://www.microsoft.com/events/series/technetsqlserver2005.mspx
La référence technique
pour les IT Pros :technet.microsoft.com
La référence technique
pour les développeurs :
msdn.microsoft.com
S’informer - Un portail d’informations, des événements, une newsletter bimensuelle personnalisée
Se former - Des webcasts, des articles techniques, des téléchargements, des forums pour échanger avec vos pairs
Bénéficier de services - Des cursus de formations et de certifications, des offres de support technique
Visual Studio 2005 +
Abonnement MSDN Premium
Abonnement TechNet Plus :
Versions d’éval + 2 incidents support
© 2007 Microsoft France
Votre potentiel, notre passion TM