Upload
jud
View
75
Download
0
Embed Size (px)
DESCRIPTION
Intel Pentium 4 1.4GHz & 1.5GHz. เกียรติกุล อูทอง ประกาย นาดี. หัวข้อในการนำเสนอ. NetBurst Architecture ของ Pentium 4 Hyper Pipelined Technology Rapid Execution Engine Cache ของ Pentium 4 SSE2 The Interface การสร้างชิพ ชิพเซ็ตและบัส การทดสอบประสิทธิ์ภาพ. NetBurst Architecture. - PowerPoint PPT Presentation
Citation preview
Intel Pentium 41.4GHz & 1.5GHz
เกี�ยรติ�กี�ล อู�ทอูงประกีาย นาดี�
2
หั�วข้�อูในกีารน�าเสนอู NetBurst Architecture ข้อูง Pentium 4 Hyper Pipelined Technology Rapid Execution Engine Cache ข้อูง Pentium 4 SSE2 The Interface กีารสร�างชิ�พ ชิ�พเซ็�ติและบั�ส กีารทดีสอูบัประส�ทธิ์�#ภาพ
3
NetBurst Architecture
ป%จจ�บั�น NetBurst Architecture มี�ใชิ�อูย�(ใน ซ็�พ�ย� ข้อูง Intel 2 ร� (น คื*อู Pentium 4 1.4GHz และ 1.5GHz
อูงคื+ประกีอูบัข้อูง NetBurst Architecture ประกีอูบัไปดี�วย – Hyper Pipelined Technology– Rapid Execution Engine– Execution Trace Cache – System Bus 400MHz
4
NetBurst Architecture
นอูกีจากีน�-น ย�งปร�บัปร�ง P6 micro – architecture ท�.ใชิ�ใน ซ็�พ�ย� ร� (นกี(อูนใหั�มี�คืวามีสามีารถเพ�.มีข้0-น– Advance Dynamic Execution
– Advance Transfer Cache
– Enhanced Floating Point & Multimedia Unit
– Streaming SIMD Extension 2
5
Hyper Pipeline Technology
กีารเพ�.มีคืวามีเร�วในกีารท�างานข้อูง ซ็�พ�ย� ว�ธิ์�กีารหัน0.งกี�คื*อู เพ�.มีคืวามีเร�วข้อูงส�ญญาณนาฬิ�กีา
กีารท�.จะท�าใหั� ซ็�พ�ย� ท�างานไดี�ในส�ญญาณนาฬิ�กีาท�.ส�งข้0-น ว�ธิ์�กีารหัน0.งกี�คื*อู ท�ากีารลดีข้นาดีข้อูง Die ลง
กีารลดีข้นาดีข้อูง Die จะติ�อูงพ�ฒนาในส(วนข้อูงกีระบัวนกีารผล�ติ แติ(ติ�อูงใชิ�คื(าใชิ�จ(ายส�ง ในกีารพ�ฒนา
6
Hyper Pipeline Technology
อู�กีว�ธิ์�กีารหัน0.ง ในกีารเพ�.มีคืวามีเร�วในกีารท�างาน คื*อู สร�าง ซ็�พ�ย�ใหั�ท�างานน�อูยลงในหัน0.งรอูบัส�ญญาณ ท�าใหั�สามีารถท�างานไดี�กี�บัส�ญญาณนาฬิ�กีาท�.เร�วข้0-น
กีารลดี กีารท�างานใหั�น�อูยลงติ(อูส�ญญาณนาฬิ�กีาน�-นสามีารถกีระท�าไดี�โดียกีารเพ�.มีจ�านวนข้อูง stage ท�.อูย�(ใน pipeline ข้อูง Processor
Pentium Pro มี� 5 State, Pentium II/III มี� 10 State และ Pentium 4 มี� 20 State
7
Hyper Pipelined Technology
Pipeline ท�.มี�คืวามีล0กี 20-stage ทาง Intel เร�ยกีมี�นว(า Hyper Pipelined Technology
8
Hyper Pipelined Technology เมี*.อู Pipeline มี�คืวามีล0กีมีากีข้0-น จะติ�อูง
ท�ากีารพ�ฒนาในส(วนข้อูง Branch Tree Prediction ใหั�มี�คืวามีสามีารถมีากีข้0-น
เมี*.อูมี�กีารท�านายผ�ดีพลาดี จะติ�อูงกีล�บัไปเร�.มีท�างานใน State แรกีเสมีอู
Processor ท�.มี�จ�านวน Pipeline 10 State จะเส�ยเวลากีล�บัไปเร�.มีท�างานน�อูยกีว(า Processor ท�.มี�จ�านวน Pipeline 20 State
9
Rapid Execution Engine
คืวามีเร�วในกีารท�างานข้อูง Arithmetic Logic Unit ข้อูง Pentium 4 จะมี�คืวามีเร�วเป7น 2 เท(าข้อูง ส�ญญาณนาฬิ�กีา
Pentium 4 คืวามีเร�ว 1.5GHz, Arithmetic Logic Unit จะท�างานท�.คืวามีเร�ว 3GHz
หัล�กีกีารน�-เร�ยกีว(า Double pump
10
Rapid Execution Engine
11
Rapid Execution Engine
กีารจ�ดีกีารกี�บัติ�วเลข้จ�านวนเติ�มี ไมี(เหัมีาะส�าหัร�บักีารท�างานแบับั Branch Prediction เพราะจะเกี�ดีกีารผ�ดีพลาดีไดี�ง(าย
Pentium 4 จะเกี�ดีผลกีระทบัส�ง เพราะมี� Pipeline ถ0ง 20 State เมี*.อูเท�ยบักี�บั Pentium III
Pentium 4 จ0งอูอูกีแบับัส(วนประมีวลผงติ�วเลข้จ�านวนเติ�มีใหั�มี�ประส�ทธิ์�#ภาพส�งเข้�าไว�
12
Rapid Execution Engine
ในอูนาคืติ เมี*.อูมี�กีารพ�ฒนาส(วนติ(าง ๆ ข้อูง Pentium ใหั�ท�างานแบับั double pumped เพ*.อูติ(อูร(วมีเข้�ากี�บั double pumped ALUs
ท�าใหั�บัางส(วนข้อูง ซ็�พ�ย� มี�ชิ(วงเวลาในกีารรอูคือูยลดีลง (Low latency)
13
Cache ข้อูง Pentium 4
Branch target buffer คื*อูส(วนท�.พ�กีกี�.งคื�าส�.งเป9าหัมีาย ใน Pentium 4 มี�ข้นาดีเป7น 8 เท(าข้อูง Pentium III
ท�าใหั� Branch predictor มี�อู�ติรากีารท�านายท�.ถ�กีติ�อูงส�งข้0-น
Cache L1 ข้อูง Pentium 4 มี�ข้นานเล�กีเพ�ยง 8 KB ท�าใหั�มี� ชิ(วงเวลาในกีารรอูคือูยท�.น�อูยกีว(า (Low latency)
Cache L1 ข้อูง Pentium III มี�ข้นาดี 16 KB
14
Cache ข้อูง Pentium 4
คืวามีกีว�างข้อูงชิ(อูงทางส(งข้�อูมี�ล ระหัว(าง Cache L1 และ Cache L2 ข้อูง Pentium 4 มี�คืวามีกีว�าง 512 bits สามีารถส(งข้�อูมี�ลไดี�ถ0ง 48GB/s
Pentium III มี�คืวามีกีว�าง 256 bits สามีารถส(งข้�อูมี�ลไดี� 24GB/s
Athlon มี�คืวามีกีว�าง 64 bits สามีารถส(งข้�อูมี�ลไดี� 6GB/s
15
Cache ข้อูง Pentium 4
Execution Trace Cache ท�าหัน�าท�.เป7นติ�วกีลางระหัว(างข้�-นติอูนในกีารถอูดีรหั�สและข้�-นติอูนในกีารประมีวลผลคื�าส�.ง
เมี*.อูมี�กีารประมีวลผลคืร�-งใหัมี( Pentium 4 จะติรงเข้�าไปย�ง Trace Cache และร�บัเอูา decoded micro-ops มีาเร�.มีท�ากีารประมีวลผลคื�าส�.ง
ล�กีษณะข้อูง Trace Cache ข้อูง Pentium 4 เป7นแบับั 8-way set association
สามีารถเกี�บัคื�าส�.ง micro-ops ไดี�ถ0ง 12 K
16
SSE2
SSE (Streaming SIMD Extension) คื*อูคืวามีสามีารถในกีารใชิ�คื�าส�.งหัน0.งกี�บัข้�อูมี�ลท�.มี�คืวามีแติกีติ(างกี�บัหัลาย ๆ ชิ�ดี เชิ(นกีารแปลงโพล�กีอูนใหั�อูย�(ในปร�ภ�มี�แบับั 3 มี�ติ� (3D space)
SIMD เร�.มีใชิ�ใน Intel คืร�-งแรกีใน ชิ�ดีคื�าส�.ง MMX
SMID-FP ข้อูง Intel เร�ยกีว(า SSE Pentium 4 เพ�.มีชิ�ดีคื�าส�.งเข้�าไปอู�กี 144 คื�าส�.ง
โดียเร�ยกีว(า SSE2
17
SSE2
SSE2 มี�กีารจ�ดีกีารกี�บั SIMD-Int ข้นาดี 64 bits และ SIMD-FP เป7นแบับั double precision 64 bits
กีารใชิ� SSE2 ใหั�เกี�ดีประโยชิน+ จะติ�อูงมี� Software ท�.สน�บัสน�น SSE2 ป%จจ�บั�นย�งไมี(มี�มีากีน�กี
18
The Interface
ข้ณะน�- Pentium 4 ใชิ� Socket-423 และอู�กีไมี(นานจะเปล�.ยนมีาใชิ� Socket-478
19
กีารสร�างชิ�พ Pentium 4 ใชิ�กีระบัวนกีารผล�ติท�. 0.18 ไมีคืรอูน ใชิ�กีาร
เชิ*.อูมีติ(อูดี�วย อูะล�มี�เน�ยมี (Aluminum Interconnects) ในอูนาคืติจะถ�กีพ�ฒนาโดียใชิ� กีระบัวนกีารผล�ติท�. 0.13
ไมีคืรอูน ใชิ�กีารเชิ*.อูมีติ(อูดี�วย ทอูงแดีง (Copper Interconnects)
20
กีารสร�างชิ�พ Pentium 4 มี�กีารอูอูกีแบับัท�.ซ็�บัซ็�อูนในส(วนข้อูง
Hyper Pipeline Technology ท�าใหั�ประกีอูบัไปดี�วย ทรานซ็�สเติอูร+ 42 ล�านติ�ว ในข้ณะท�. Athlon ประกีอูบัไปดี�วย ทรานซ็�สเติอูร+ 37 ล�านติ�ว
Pentium 4 มี� die size เท(ากี�บั 271 ติารางมี�ลล�เมีติร ส(วน Athlon มี� die size เท(ากี�บั 120 ติารางมี�ลล�เมีติร
21
กีารสร�างชิ�พ ซ็�พ Pentium 4 ท�.คืวามีถ�. 1.5GHz ผล�ติคืวามี
ร�อูนอูอูกีมีา ประมีาณ 52W เมี*.อูเท�ยบักี�บั Athlon ท�. 1GHz ผล�ติคืวามีร�อูน
อูอูกีมีา 54 W และ Athlon ท�. 1GHz ผล�ติคืวามีร�อูนอูอูกีมีา 64 W
22
23
ชิ�พเซ็�ติและบั�ส ชิ�พเซ็�ติบันแพลติฟอูร+มี Pentium 4 คื*อู i850
(Tehama) ประกีอูบัดี�วยกีารสน�บัสน�น AGP 4x ,รอูงร�บั Ultra
ATA/100 และรอูงร�บักีารท�างานแบับั Multi processor
บั�สข้อูง Pentium 4 จะใชิ� quad pumped 100MHz ท�าใหั�เสมี*อูนกี�บัท�างานท�.คืวามีถ�. 400MHz
i850 จะใชิ�คือูนโทรเลอูร+ ส�าหัร�บัหัน(วยคืวามีจ�า dual channel RDRAM ท�าใหั� แบันว�ดีธิ์+ ส�าหัร�บัหัน(วยคืวามีจ�า เพ�.มีข้0-นเป7นสอูงเท(า
24
ชิ�พเซ็�ติและบั�ส เน*.อูงจากีมี�กีารสน�บัสน�น RDRAM ท�าราคืาข้อูง
i850 มี�ราคืาแพงเกี*อูบั 2 เท(าเมี*.อูเท�ยบักี�บั AMD760
แหัล(งจ(ายไฟน�-น จะใชิ�ร� (นใหัมี( โดีย ATX 2.03 Specification น�-นจะเร�ยกี Power Supply ร� (นใหัมี(น�-ว(า ATX12V ซ็�.งจะสน�บัสน�นชิ(อูงเส�ยบัจ(ายไฟเพ�.มีเติ�มีท�.อูย�(บันบัอูร+ดี i850
มี�สายติ(อูส�าหัร�บัจ(ายไฟ +12V ท�.เพ�.มีเข้�ามีาน�-จะจ(ายไปส�(แผงวงจรหัล�กีรอูบั ๆ ซ็�พ�ย� ในกีรณ�ท�.มี�กีารเปล�.ยนแปลงอู�ปกีรณ+ติ(าง ๆ ภายหัล�ง
25
กีารทดีสอูบัประส�ทธิ์�#ภาพ
26
กีารทดีสอูบัประส�ทธิ์�#ภาพ เน*.อูงจากี Athlon มี� L1 Cache ข้นาดีใหัญ(
ข้นาดี 64 KB ท�าใหั�สามีารถใชิ�งานกี�บั ข้นาดีข้�อูมี�ลน�อูย ๆ ไดี�ดี�กีว(า
เมี*.อูข้นาดีข้อูงข้�อูมี�ลใหัญ(ข้0-นท�าใหั� ประส�ทธิ์�ภาพจะข้0-นอูย�(กี�บั คืวามีเร�วข้อูงส�ญญาณนาฬิ�กีา และประส�ทธิ์�ภาพ ข้อูงหัน(วยคืวามีจ�า
27
28
29
สร�ป ใชิ�กีระบัวนกีารผล�ติ 0.18 ไมีคืรอูน และจะพ�ฒนาใหั�
ท�างานท�.คืวามีท�. 2GHz ประมีาณไติรมีาศท�. 3 ข้อูงป=หัน�า
คื(า latency ติ�.า เน*.อูงจากี hit rate ข้อูง Cache L1 ส�ง และแบันว�ดีธิ์+ข้อูง L2 ท�.ส�ง
SSE2 เพ*.อูรอูงร�บักีารพ�ฒนา เพ*.อูใหั� Application สามีารถใชิ�ประโยชิน+ ข้อูง Pentium 4 ใหั�มีากีย�.งข้0-น
Branch Predictor ท�.เหัมีาะส�าหัร�บักีารประมีวลผล ติ�วเลข้ทศน�ยมี ท�.มี�คืวามีซ็�บัซ็�อูน
Question?