Des partenaires qui collaborent ensemble depuis de nombreuses années Investissement conjoint de 300M$ en R&D annoncé en 2006 Forte implication dans les

Bertrand Audras, Microsoft MTCEric Pouvreau, HP FranceFrédéric Pichaut, Microsoft [email protected]@[email protected]

IT099 - Mise en place d'un datacenter SQL Server 2005

mailto:[email protected]



Partenariat HP-Microsoft

Des partenaires qui collaborent ensemble depuis de nombreuses années

Investissement conjoint de 300M$ en R&D annoncé en 2006Forte implication dans les Microsoft Technology CentersPartenariat sur le programme SQL Always OnConduite conjointe de projets afin de sécuriser les projets, engagements contractuels communs de bout en bout

Des clients communs en production sur des applications Business Critical, certains depuis plusieurs années et versions

FNAC.comCiments Français (environnement SAP)Caisse Nationale des Caisses d’EpargneL’OréalCrédit Agricole

Les missions d’un Datacenter

Assurer la production quotidienne des opérations en fournissant la puissance nécessaire aux applicationsFournir un tableau de bord de pilotage de l’activité et d’anticipation des besoinsGarantir une qualité de service stable et conforme au SLA en protégeant les données et leur accès

Pannes matérielles et logiciellesErreurs humaines et agressionsFacteurs externes liés à l’électricité, le réseau, la climatisation, l’incendie…

Datacenter: Les enjeux SQL ServerAgendaGarantir la continuité des opérations

MéthodologieRedondance et performancesSolutions de haute-disponibilitéLe point de vue de l’architecte, expériences projets

Mettre en œuvre aux standards ITILSupporter, changer, exploiter, optimiser

Accompagner l’exploitation au quotidienLe support technique, élément clé de la réactivitéAnticiper les pannes

Construire les contrats de service

Réduire la perception de l'indisponibilité pour les utilisateurs

Dialogue entre des responsables infrastructures et les clients internes

Démarche application par applicationQuelle est la Qualité de Service attendue par les utilisateurs ?Combien d'utilisateurs utilisent-ils cette application? Est-il possible de chiffrer la perte d'une heure d'interruption de service?Quels sont les risques à couvrir en priorité? Quelle est la fréquence des pannes?Quelles sont les ressources déjà en place et quel est le budget d'investissement disponible?

Recovery Point/Time Objectives

RPO: Point de redémarrageJours Heures Minutes

Transactions

Désastre

Corruption des données

Erreurs humaines

Perte de serveurs

Opérations de

maintenance

Pannes du stockage

Cau

ses

des

inte

rru

pti

on

s d

e

serv

ice

99.9%

99.99%

99.999%

99.9999%

8.75h/an

52min/an

5.2min/an

32sec/an

Jours Heures Minutes SecondesInstantané

RTO: Temps de redémarrage

Coûts

Performance et robustesse matérielle

Redondance des composantsLAN, SAN doublésServeurs (alimentations, ventilation, RAID …)Baie de stockage (contrôleurs, cache, RAID …)

Performance serveurSMP vs NUMA32-bit, x64 ou IA64Attachements SAN

Performance d’une baie de stockageChoix de la performance vs capacité Dépend de la performance du (des) contrôleur(s)et … du nombre de disques dont il(s) dispose(nt) pour exercer cette puissanceEffet limité du cache en environnement transactionnelOverhead : réplication à distance, duplication de volumes …Répartition des profils d’IO (random, séquentiel)Performance du back-end prédictibleTests : Microsoft SQLIOSim

Sauvegarde et restauration

Le principal enjeu est la restaurationQualité et rapidité de la restaurationProtection multiple des données, protection des copiesCapacité de reprise sur erreur humaineUtilisation des sauvegardes pour alimenterd’autres plateformes (assurance qualité, dw)

Selon les besoins, technologies complémentairesSQL Server 2005 Database SnapshotSystem Center Data Protection ManagerHP Business Copy

Snapshot Snapclone (copie complète)Orchestration via VSS (Volume Shadow copy Services)

tt

0t

2T

1

tapelib

Solutions de haute disponibilité

Solution RPO RTO Bascule automatique

Impact sur les performances

SQL2005 Database Mirroring mode Synchrone

100% 100% Oui avec témoin

Faibleavec Network Roundtrip

< 10msec

Cluster local MSCS 100% H+1min Oui Reconnexion

client

Non

Database Mirroring SQL Server

Miroir

DonnéesLog

SQL Server

Témoin

Principal

DonnéesLog

SQL Server

Application

commit

MS Cluster Services

App A

App B

App BApp A Cluster

AdresseServeurVirtuel

Solutions de secours à distance

Solution RPO RTO Bascule automatique

Impact sur les performances

SQL2005 Log Shipping H-15min H+30min Non Faiblelié à l’activité IO

SQL2005 Database Mirroring mode Asynchrone

99% H+5min Non Faiblelié à l’activité IO

Réplication de volumes

à distance

100% en

synchrone

H+30min Non En fonction de la distance

Géo-cluster 100% H+5min Oui Reconnexion

client

Non

Log shipping SQL Server

Principal

Secondaire(s)

Svg JournauxRéapplication des Journaux

Copie des Journaux

Principal

Réplication de volumes à distance

App A

App BApp AClust

er

WAN

App B

App A

App B

App A

App B

HP Continuous Access

Cluster géographique

App A

App BApp A

Cluster

WAN

App B

App A

App A

FailoverFailback

HP Continuous Access+ Cluster extension

Combinaison de solutions

Architecture type incluant sécurité locale (physique) et site de secours (logique)

Cas de pannesRPO 100%RTO 1 minuteBascule automatiqueMaintient de la QOS

Cas de désastreRPO 99%RTO 5 minutesBascule manuelleMode dégradé

App A

App ACluster

DB Mirroringasynchrone

Référence Cdiscount.com

Groupe Casino - Leader de la vente par InternetApplication de Front-office

Catalogues produitsGestion du panier de commande

Plusieurs Clusters SQL ServerHP Proliant DL585Baies de stockage SAN en miroir

Log shipping vers site de secoursÉvolution vers DB mirroring asynchrone à l’étude

Le point de vue de l’architecte

La granularité est l’applicationDisposer de ressources garanties pour la productionÉliminer les Single Point Of FailureDimensionner l’architecture en fonction de l’impact du secoursDéfinir la QOS en mode secoursProtéger le système principal contre la panne du système de secoursAnticiper les évolutions et les maintenancesEntrainer les équipes sur la procédure de secours

Le référentiel de mesure est l’indisponibilité perçue par l’utilisateur

Détecter les pannes et les interruptions de serviceDéfinir les modes de bascule vers le secours et le retour arrièreRendre transparente la bascule

Le point de vue de l’architecte

La mise en œuvre une solution simple est un gage d’efficacité

Inutile de sécuriser la machine ou l’application au-delà de la sécurité définie pour les donnéesLa simplicité permet de tester facilementPrendre en considération le plan de secours simultanément à la conception de l’application ou à l’évaluation d’un progiciel Inclure la maintenance des postes utilisateursPlus la procédure est simple, plus elle sera respectée !Construire un système réaliste et évolutif

Cas

de

pan

ne

RPO/RTO

Expériences de projets

Mettre en œuvre un plan de secours par lotsRéduire les délais entre 2 lotsÉtapes intermédiaires concrètes offrant un premier niveau de servicePérenniser la connaissance, l’expérience et les équipes

Conduire le projet au succès Rassurer sur le contrôle des délais et des budgets

Acceptation et compréhension par les utilisateurs et l’équipe projet

Le nouveau système m’empêche de livrer à temps le patchLes temps de réponse se sont dégradées avec le plan de secoursJe ne comprend pas les nouvelles règles de sécurité, c’est trop contraignant

Communiquer, accompagner le changement Créer des binômes avec les représentants des clients

internes

Microsoft Technology Center

Un Datacenter de 20TB et 200CPU x86, x64, IA64 mono & dual coreUne équipe d’architectes pour vous aider dans vos choix technologiquesUne démarche de conseil et d’accompagnement

Partage de l'expérience Microsoft et validation de l'architecture technologiqueMise en place de Proof Of Concept

Contacter votre interlocuteur Microsoft ou [email protected]


Agenda

Garantir la continuité des opérations Méthodologie Redondance et performances Solutions de haute-disponibilité Le point de vue de l’architecte, expériences projets

Mettre en œuvre aux standards ITILSupporter, changer, exploiter, optimiser


ITIL

Le référentiel ITIL (Information Technology Infrastructure Library) a pour objectif de proposer des guides de best-practices en terme de gestion des services informatiques (administration, déploiement, support) dans une logique d’évolution constante

Gestion des niveaux de services et de configurationsGestion des changements et des mises en productionGestion des problèmes et incidents

Microsoft et HP sont des membres actifs et contributeurs de la communauté ITIL et proposent des offres de services conjointes

Microsoft Operation FrameworkHP IT Service ManagementGarantir le déroulement des opérations, contrôler les coûts et réduire les risques d’un système en évolution constante

Le modèle de processus MOF

Revue d’implémentation

Revue de mise à disposition de l’application

Revue de SLA

Revue des opérations

Changer

ExploiterSupporter

Optimiser

Gestion de capacitéGestion de la disponibilitéOptimisation des coûtsGestion des ressourcesContinuité de serviceGestion de sécurité

Help Desk, suivi des incidents, escalade Gestion des problèmes« Failover » & « Recovery »

Gestion du changementGestion de configuration

Gestion des révisions

Supervision et instrumentation

Administration systèmes, services d’annuaire,

produits, réseaux, sécurité

Sauvegardes, restaurationsTravaux batch

Microsoft Services (consulting et support) propose des prestations de services pour vous accompagner de « bout en

bout », depuis les phases amont de réflexions, jusqu’à l’exploitation des solutions conçues

Microsoft Operation Framework

http://www.microsoft.com/mof

Agenda

Garantir la continuité des opérations Méthodologie Redondance et performances Solutions de haute-disponibilité Le point de vue de l’architecte, expériences projets

Mettre en œuvre aux standards ITIL Supporter, changer, exploiter, optimiser


Enquêtes régulières sur les incidents support, la satisfaction globale, mise en place d’un COS

Points d’activité réguliers TAM / CSM

Suivi du plan de services et des actionsPoint sur les projets majeursBilan 4 mois et 9 mois

Gestion des escalades avec les équipes supportMise en place de services proactifs, gestion des compétences et planification des servicesCoordination des ressourcesRespect des délais

Mise en place d’un plan de serviceAxes de travail principauxPlan de supportPlanification des actions

Informations techniquesTransfert d’informations techniques

Rapports mensuels d’activitéConsommation du contratAnalyse des incidentsDemandes traitées par le TAM

Mise en place de Post-Mortems pour les incidents critiques

Réunion d’orientations et d’initialisation des services

Présentation du contratDéfinition des rôlesAnalyse de l’existantOrganisation du client et interlocuteurs clésIdentification des projets

Connaissance et analyse du contexte du client

Connaissance de votre contexteConnaissance de votre contexte

Méthodologie Méthodologie CoordinationCoordination

Gestion technique de compte : TAM

Le processus d’escalade

Client

Ingénieur Support (spécialiste) Responsable Technique de Compte(TAM)

Manager Support

Manager Situation Critique

Ingénieur d’Escalade (CPR)

Développement de correctifs(QFE)

Client Support Groupe de développement

CPR (Critical Problem Résolution) : Une équipe mondiale d'ingénieurs de haut niveau dont le but est de trouver des solutions aux problèmes critiques. En étroite collaboration avec les équipes de développement.

Support partenaire

Le processus d’escalade PREMIER

CPR (Critical Problem Résolution) : Une équipe mondiale d'ingénieurs de haut niveau dont le but est de trouver des solutions aux problèmes critiques. En étroite collaboration avec les équipes de développement.

Client

Ingénieur Support (spécialiste) Responsable Technique de Compte(TAM)

Manager Support

Manager Situation Critique

Ingénieur d’Escalade (CPR)

Développement de correctifs(QFE)

Client Support Groupe de développement

Best Practices Support

Tester la stratégie de sauvegarde et restauration (régulièrement)

Sur un autres système et/ou sur le system de productionNoter le temps pour faire une restauration complète

Prendre une image de son système en activité normaleSQL Trace pour la capture des événementsReadtrace pour générer des rapports d’activitésSSMS Reports (en SP2 possibilité de rapports personnalisés)

Que va demander le supportProblèmes de performance, les rapports d’activité « normale »Les ERRORLOG donc penser à les conserver et archiverSQLdiag utilitaire de collecte d’informations

http://msdn2.microsoft.com/en-us/library/ms162833.aspx

http://msdn2.microsoft.com/en-us/library/ms162833.aspx

Les clés du succès

Simplicité

Évolutivité

Réalisme

Anticipation

Dialogue

Maitrise des coûts

Performances

Maitrise du projet

Questions & Réponses

SQL Server – Microsoft Francehttp://www.microsoft.com/france/sql/sql2005/default.mspxhttp://www.microsoft.com/france/technet/produits/sql/2005

Programme SQL Always On http://www.microsoft.com/sql/alwayson/default.mspx

Webcast Technethttp://www.microsoft.com/events/series/technetsqlserver2005.mspx

http://www.microsoft.com/france/technet/produits/sql/migrer.mspx

http://www.microsoft.com/france/technet/produits/sql/2005

http://www.microsoft.com/sql/alwayson/default.mspx



La référence technique

pour les IT Pros :technet.microsoft.com

La référence technique

pour les développeurs :

msdn.microsoft.com

S’informer - Un portail d’informations, des événements, une newsletter bimensuelle personnalisée

Se former - Des webcasts, des articles techniques, des téléchargements, des forums pour échanger avec vos pairs

Bénéficier de services - Des cursus de formations et de certifications, des offres de support technique

Visual Studio 2005 +

Abonnement MSDN Premium

Abonnement TechNet Plus :

Versions d’éval + 2 incidents support

© 2007 Microsoft France

Votre potentiel, notre passion TM

Documents

Des partenaires qui collaborent ensemble depuis de nombreuses années Investissement conjoint de 300M$ en R&D annoncé en 2006 Forte implication dans les