23
Процессоры Intel ® Xeon ® E5-2600 v3 Александр Мельников Специалист по корпоративным технологиям, Европейская Техническая Группа Intel

Процессоры Intel® Xeon® E5-2600 v3

Embed Size (px)

DESCRIPTION

Процессоры Intel® Xeon® E5-2600 v3

Citation preview

Page 1: Процессоры Intel® Xeon® E5-2600 v3

Процессоры Intel® Xeon® E5-2600 v3

Александр Мельников

Специалист по корпоративным технологиям,

Европейская Техническая Группа

Intel

Page 2: Процессоры Intel® Xeon® E5-2600 v3

2

Семейство Intel® Xeon® E5-2600 v3

^Refer to Slide 14 for Source and Configuration details

+Refer to Slide 17 for Source and Configuration details

Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests are measured using

specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other

information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other

products. For more information go to http://www.intel.com/performance

90%-ное повышение производительности с Intel® AVX 2^

Самый энергоэффективный серверный процессор+

Возможности управления виртуализацией с

Cache Monitoring

Page 3: Процессоры Intel® Xeon® E5-2600 v3

• Node Manager 3.0

• Cache QoS Monitoring

3

Основные новшества

• Advanced Vector Extensions (AVX) 2.0

• PCPS (Per Core P-States)

• Память DDR4

• Virtual Machine Control Structure (VMCS) Shadowing

• Дедупликация

• Иерархия хранения

• Тонкие диски

• Шифрование

• Твердотельные накопители

Вычисления

• Контроллер 10/40 Gb Ethernet

• Разгрузка сетевой вирт-ции

• Flow Director

• Вирт-ция сетевых функций (NFV)

• Intel® QuickAssist® Technology

Хранени

е

Сеть

Page 4: Процессоры Intel® Xeon® E5-2600 v3

4

Intel® Advanced Vector Extensions (AVX) 2.0

2012 2013 2014

Пр

ои

зво

дите

льно

сть

\яд

ро

Intel® AVX 1.0

2X Flops: 256-битные векторы с

плавающей запятой

E5-2600

(32 нм «Так»)

Поддержка вычислений с

плав. запятой половинной

точности, ГСЧ

Intel®

AVX

2.0

E5-2600 v2

(22 нм «Тик»)

E5-2600 v3

(22 нм «Так»)

С 2001 года:

128-битные векторы

Source as of August 2014 TR#3034 on Linpack*. Baseline configuration: Intel® Server Board S2600CP with two Intel® Xeon® Processor E5-2697 v2, Intel® HT Technology

disabled, Intel® Turbo Boost Technology enabled, 8x8GB DDR3-1866, RHEL* 6.3, Intel® MKL 11.0.5, score: 528 GFlops. New configuration: Intel® Server System R2208 ВтTTYS

with two Intel® Xeon® Processor E5-2699 v3, Intel® HT Technology disabled, Intel® Turbo Boost Technology enabled, 8x16GB DDR4-2133, RHEL* 6.4, Intel® MKL 11.1.1, score:

1,012 GFlops Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark

and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to

vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when

combined with other products. For more information go to http://www.intel.com/performance *Other names and brands may be claimed as the property of others.

new

• Ускорение высокопроизводительных вычислений

с плавающей запятой с помощью инструкций

Fused Multiply Add (FMA)

• 256-битные целочисленные векторные

инструкции помогают в математических задачах,

кодеках, при обработке изображений и сигналов

90%

До 90% прироста производительности от поколения к поколению

Page 5: Процессоры Intel® Xeon® E5-2600 v3

5

Преимущества памяти DDR4

Source as of August 2014 TR#3044 on STREAM (triad): Intel® Server Board S2600CP with two Intel® Xeon® Processor E5-2697 v2, 24x16GB DDR3-1866

@1066MHz DR-RDIMM, score: 58.9 GB/sec. New Configuration: Intel® Server System R2208 WTTYS with two Intel® Xeon® Processor E5-2699 v3, 24x16GB

DDR4-2133 @ 1600MHz DR-RDIMM, score: 85.2 GB/sec. Software and workloads used in performance tests may have been optimized for performance only on

Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and

functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully

evaluating your contemplated purchases, including the performance of that product when combined with other products. For more information go to

http://www.intel.com/performance

*Other names and brands may be claimed as the property of others.

1000

1400

1800

2200

128 GB 256 GB 384GB 512 GB 768 GB

32GB LRDIMM ONE5-2600 v3DDR4-2133

32GB LRDIMM ONE5-2600 v2DDR3-1866

Емкость подсистемы памяти 40%До 40% увеличения пропускной способностис 3-мя DIMM на канал

• Развитие технологий памяти с более высокими

скоростями и плотностью, и пониженным

напряжением

• Поддержка более высоких частот памяти на

бóльших емкостях

Page 6: Процессоры Intel® Xeon® E5-2600 v3

6

Самый энергоэффективный процессор:Поядерные режимы P-States (PCPS) делают общий вклад в

сохранение энергии

Один процессор

Одна производи-

тельность

Меньшее

потребление

PCPS Выкл

PCPS Вкл

Средняя частота/потребление на ядро

2 4 6 8 10 12

Ядро

2 4 6 8 10 12

Ядро

Comparison based on SPECpower*_ssj2008 results published as of August 26, 2014. Sugon I620-G20 platform with two Intel® Xeon® Processor E5-2699 v3, 10,599

overall ssj_ops/watt. Source. Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance

tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those

factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including

the performance of that product when combined with other products. For more information go to http://www.intel.com/performance *Other names and brands may be

claimed as the property of others.

24До 24% снижения потребления питания по сравнению с предыдущим поколением

%

Page 7: Процессоры Intel® Xeon® E5-2600 v3

Технологии для облачных вычисленийУлучшение качества сервисов с процессорами Intel® Xeon® E5 v3

7

Телеметрия платформы

Мониторинг Кэша

Этапы облаков:• Виртуализация

• Автоматизация

• Оркестрация

VMCS Shadowing

Быстрое шифрование данных

Сетевая виртуализация

Частное

облако

Page 8: Процессоры Intel® Xeon® E5-2600 v3

Мониторинг кэша обеспечивает качество сервиса

8

Проблема: Не видно используемые

ресурсы виртуальными машинамиРешение: согласованное предоставление

сервиса

= нет больше шумного соседа!

Раньше:

Одно приложение в

многопользовательской среде использует

слишком много ресурсов

(или “проблемы шумного соседа”)

Сегодня с мониторингом кэша:

Видимость в использовании ресурсов

кэша виртуальной машиной

VM

3

VM

4

VM

1 VM

2

Испол

ьзо

вание

Кэш

а

VM

3

VM

4

VM

1

VM

2

Испол

ьзо

вание

Кэш

а

Page 9: Процессоры Intel® Xeon® E5-2600 v3

9

VMCS Shadowing: Улучшение изоляции ВМ и возможностей мониторинга

Управление/ Защита Разраб./Тест.Поддержка старых

приложений

Hardware

Root VMM

Guest VMM

Current OS

VM0

Hardware

Root VMM

Current

OS

VM0

Legacy VMM

Legacy OS

VM1

Manage VM

Monitor for

malicious

activities

Hardware

Root VMM

Production

Env.

VM0

Pre-production VMM

Production

Env.

VM1

Dev / Test

Env.

VM2

Page 10: Процессоры Intel® Xeon® E5-2600 v3

• Node Manager 3.0

• Cache QoS Monitoring

10

Основные новшества

• Advanced Vector Extensions (AVX) 2.0

• PCPS (Per Core P-States)

• Память DDR4

• Virtual Machine Control Structure (VMCS) Shadowing

• Дедупликация

• Иерархия хранения

• Тонкие диски

• Шифрование

• Твердотельные накопители

Вычисления

Сеть

Хранение

• Контроллер 10/40 Gb Ethernet

• Разгрузка сетевой вирт-ции

• Flow Director

• Вирт-ция сетевых функций (NFV)

• Intel® QuickAssist® Technology

Page 11: Процессоры Intel® Xeon® E5-2600 v3

Трансформация СХД: строительные блоки Intel

11

Данные для

эффективности и

отказоустойчивости

Разделение данных

по типам для

увеличения

емкости и

доступности Cache Acceleration

SoftwareEnterprise Edition for

Lustre

PCIe SSDs

Развитие экосистемы

Ускорители СХД & SoC’s

СХД ПО

* Other brands and names may be claimed as the property of others.

Storage Acceleration

Library (ISA-L)

Intel® Rapid Storage

Technology enterprise

Page 12: Процессоры Intel® Xeon® E5-2600 v3

Виртуальный SAN: кардинально простой гипервизор- Конвергентная СХД

12

vSphere + Virtual SAN

Virtual SAN Shared

Datastore

Основы:• Програмно определяемая СХД внедрена в

vSphere

• Запускается на любых стандартных x86

серверах

• Объединяет HDD/flash в общее хранилище

• Система управления на базе политик СХД

• Высокая производительность за счет флэш

ускорения

• Высоко надежная - без потери данных в

случае аппаратных сбоев

• Глубоко интегрирована со стеком VMware

Hard disksSSD Hard disksSSDHard disksSSD

Page 13: Процессоры Intel® Xeon® E5-2600 v3

Кардинальная простота

• Устанавливается в два клика

• Управляется из клиента

vSphere

• Управление на основе политик

• Глубоко интегрирована со

стеком VMware

Высокая

производительность

• Интегрирована в ядро vSphere

• Флэш-ускорение

• Подбирает плотность VDI всего

флэш массива

• Лучшая

Цена/Производительность

Низкая Стоимость Владения

• Устраняет большие стартовые

инвестиции (CAPEX)

• Растет вместе с вами (OPEX)

• Гибкий выбор стандартного

оборудования

• Не требует специальных навыков

Основные преимущества Virtual SAN

13

Page 14: Процессоры Intel® Xeon® E5-2600 v3

Значительно снижается задержка при шифрованииреализовано за счет улучшенных инструкций Intel® AES-NI

0

0,5

1

1,5

2

E5-2600 v2 E5-2600 v3

Скорость передачи шифрованных данных

AES-GCM

14

Source as of June 2014 on AES-128-GCM Encryption algorithm: Intel internal measurements using Aztec City platform with two E5-2658 v3, DDR4-2133, CentoOS v3.8.4, Open SSL v1.0.2-beta1. Baseline

Configuration: Intel internal measurements with two E5-2658 v2, DDR3-1866, CentoOS v3.8.4, Open SSL v1.0.2-beta1. Software and workloads used in performance tests may have been optimized for performance

only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those

factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined

with other products. For more information go to http://www.intel.com/performance *Other names and brands may be claimed as the property of others.

2xДо 2XВыросла скорость

Page 15: Процессоры Intel® Xeon® E5-2600 v3

• Node Manager 3.0

• Cache QoS Monitoring

15

Основные новшества

• Advanced Vector Extensions (AVX) 2.0

• PCPS (Per Core P-States)

• Память DDR4

• Virtual Machine Control Structure (VMCS) Shadowing

• Дедупликация

• Иерархия хранения

• Тонкие диски

• Шифрование

• Твердотельные накопители

Вычисления

Сеть

Хранение

• Контроллер 10/40 Gb Ethernet

• Разгрузка сетевой вирт-ции

• Flow Director

• Вирт-ция сетевых функций (NFV)

• Intel® QuickAssist® Technology

Page 16: Процессоры Intel® Xeon® E5-2600 v3

10GbE / 40GbE создан для E5 v3Отличительные особенность Intel® Ethernet CNA XL710

• Новое поколение 10 / 40 GbE – спроектировано для

использования в облачных средах

• Программно определяемая инфраструктура – разгрузка

сетевой виртуализации, Intel® Ethernet Flow director для

управления трафиком

• Виртуализация сетевых функций (NFV) – высокая

производительность на маленьких пакетах, Intel® DPDK

Валидация платформ

Драйверы Intel

30 лет – «Just Works»

Проверенные

Созданы для программно определяемой

инфраструктуры SDI

Конверг.: LAN / SAN

Интерфейсы: 2x40, 1x40,

4x10, 2x10

Гибкие

Виртуализация: VMDq, SR-

IOV, Flow Director,

оптимизирован для DPDK

Производительные

Page 17: Процессоры Intel® Xeon® E5-2600 v3

Ускорение виртуальных оверлейных сетей

Производительность VXLAN Overlay

Source Intel Arch Lab Aug 2014 1: Test Configuration SUT1 2x Xeon E5-2697 v2 (2.7ГГц, 24c) 128GB, 8-ch, DDR3, 1600MHz 2x Intel X520, ixgbe 3.21.2 Ubuntu x64, kernel v3.11, SUT2: 2x Xeon E5-2699 v3 (2.3ГГц, 14c) 128GB, 8-ch, DDR4, 2133MHz Intel Ethernet CNA XL710, i40e 1.0.15 Linux x64, kernel v3.15.6, Netperf 2.6 default settings running on 4 VNIs with 8 threads eachSoftware and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products.For more information go to http://www.intel.com/performance *Other names and brands may be claimed as the property of others.

25%Более 25% увеличения

пропускной способности

1 x 40 GbEПропускная 39 Гбит/с

@ 11% загрузка CPU

4 x 10 GbE LAGПропускная 31 Гбит/с

@ 52% загрузка CPU

78%До 78% снижения нагрузки на CPU

Контроллер

Ethernet

без механизма

UDP RSS для

VXLAN

4 x 10 GbE LAGПропускная 4 Гбит/с

@ 5% загрузка CPU

Page 18: Процессоры Intel® Xeon® E5-2600 v3

Intel® Ethernet Flow Director

19

Более чем в три раза memcachedЗапросов В Секунду (RPS)1

~3x RPS

Снижениелатентности

Из-за уменьшеногопереключения контекста

Source Intel Arch Lab Aug 2014 1: Test Configuration Memcached v1.4.20, 48 or 64 thr 12 Clients, Mcblaster Record Size = 64 Bytes (TCP) Number of keys = 1,000,000 Threads per client (-t) = 24 Connections per

thread (-c) = 1 Nagles Disabled, SUT1 2M RPS – RSS and 5.6M RPS – Flow Director: 2x Xeon E5-2697 v2 (2.7GHz, 24c) 128GB, 8-ch, DDR3, 1600MHz Intel X520, ixgbe 3.21.2 RHEL 7.0 x64, optimized kernel

v3.10, SUT2 7.6M RPS – Flow Director: 2x Xeon E5-2699 v3 (2.3GHz, 36c) 128GB, 8-ch, DDR4, 2133MHz Intel Ethernet CNA XL710, i40e 1.0.15 RHEL 7.0 x64, optimized kernel v3.10

Performance tests and ratings are measured using specific computer systems and/or components and reflect the approximate performance of Intel products as measured by those tests. Any difference in system

hardware or software design or configuration may affect actual performance. Buyers should consult other sources of information to evaluate the performance of systems or components they are considering

purchasing. For more information on performance tests and on the performance of Intel products, visit http://www.intel.com/performance/resources/benchmark_limitations.htm.

Non Intel EthernetController

Hardware Queues

Intel EthernetController XL710Hardware Queues

Linux* OSLinux* OS

Intel® Data Direct I/O (Intel® DDIO)Intel® Data Direct I/O (Intel® DDIO)

Rx1Queue

App

Rx0Queue

Core1

App

Received Side Scaling ONLY Intel® Ethernet Flow Director

No Flow to Core Alignment Intelligent Flow to Core Alignment

Core0

Context Switch

Flow Flow

Core1

Page 19: Процессоры Intel® Xeon® E5-2600 v3

Intel® Ethernet Flow Director

20

Source Intel Arch Lab Aug 2014 1: Test Configuration Memcached v1.4.20, 48 or 64 thr 12 Clients, Mcblaster Record Size = 64 Bytes (TCP) Number of keys = 1,000,000 Threads per client (-t) = 24

Connections per thread (-c) = 1 Nagles Disabled, SUT1 2M RPS – RSS and 5.6M RPS – Flow Director: 2x Xeon E5-2697 v2 (2.7GHz, 24c) 128GB, 8-ch, DDR3, 1600MHz Intel X520, ixgbe 3.21.2 RHEL 7.0

x64, optimized kernel v3.10, SUT2 7.6M RPS – Flow Director: 2x Xeon E5-2699 v3 (2.3GHz, 36c) 128GB, 8-ch, DDR4, 2133MHz Intel Ethernet CNA XL710, i40e 1.0.15 RHEL 7.0 x64, optimized kernel v3.10

Performance tests and ratings are measured using specific computer systems and/or components and reflect the approximate performance of Intel products as measured by those tests. Any difference in

system hardware or software design or configuration may affect actual performance. Buyers should consult other sources of information to evaluate the performance of systems or components they are

considering purchasing. For more information on performance tests and on the performance of Intel products, visit http://www.intel.com/performance/resources/benchmark_limitations.htm.

Non Intel Ethernet Controller Hardware Queues Intel Ethernet Controller XL710 Hardware Queues

AppApp

Linux* OSLinux* OS

Intel® Data Direct I/O (Intel® DDIO)Intel® Data Direct I/O (Intel® DDIO)

App App App App

AppApp App App App

AppApp App App App App

AppApp App App App

Received Side Scaling ONLY Intel® Ethernet Flow Director

No Flow to Core Alignment Intelligent Flow to Core Alignment

Более чем в три раза memcachedЗапросов В Секунду (RPS)1

~3x RPS

Снижениелатентности

Из-за уменьшеногопереключения контекста

Page 20: Процессоры Intel® Xeon® E5-2600 v3

Процессоры

Intel® Xeon® E5-2600 v3

Процессор Intel® Xeon®,

SSD диски Intel и ПО

Контроллеры и

адаптеры Intel® 40

Gb Ethernet

21

Intel® Xeon® E5 v3: выигрышная комбинациякомплексного подхода

Вычисления

Сеть

Хранение

Page 21: Процессоры Intel® Xeon® E5-2600 v3
Page 22: Процессоры Intel® Xeon® E5-2600 v3

Back up

23

Page 23: Процессоры Intel® Xeon® E5-2600 v3

24

Cache Monitoring Designed to Improve Service Quality and Utilization

Hardware

VMM

“Good

Neighbor”

VM1

Cache Subsystem

Unused Cache

E5 v3: Cache Monitoring

Hardware

VMM

“Good

Neighbor”

VM1

“Noisy

Neighbor”

VM0

Cache Subsystem

“Good Neighbor” cache

“Noisy Neighbor” cache

Cache QoS provides information

on individual VMs in Cache.

E5 v2:

No Cache Monitoring

First come, first served

“Good Neighbor” cache

Hardware

VMM

“Good

Neighbor”

VM1

Cache Subsystem

Unused Cache

“Good Neighbor” cache

Enables IT automation to make

better utilization decisions

+“Better Neighbor” cache