วันอังคารที่ 5 กรกฎาคม พ.ศ. 2554

cpu multi-core มีลักษณะอย่างไร

 


ลักษณะและความเป็นมาของ CPU แบบ Multi-Core
 เป็นลักษณะของชิป(chip) ที่ภายในมีหน่วยประมวลผลอยู่หน่วยเดียวต่อมาความต้องการความสามารถในการประมวลผล2มีมากขึ้นก็นำ CPU มาใช้เทคนิคให้สามารถประมวลผลได้มากขึ้น เราเรียกว่า ไฮเปอร์เทรดดิ้ง(Hyper-Threading) การทำงานแบบไฮเปอร์เทรดดิ้ง ยังมีข้อเสียหลายประการและเทคโนโลยีซีพียู จึงพัฒนามาสู่ยุคของซีพียูแบบหลายหน่วยประมวลผลหรือที่เรียกว่า (core) ซึ่งทำให้การพัฒนาสมรรถนของซีพียูเป็นไปอย่างต่อเนื่อง

ข้อมูลทั่วไปของซีพียู Multi-Core
ภายใน Chip CPU  นั้นมีหน่วยประมวลผลย่อย  ที่เราเรียกว่าคอร์มากกว่า  แต่ละคอร์มีหน่วยความจำหลักเป็นของตัวเอง  เรียกว่า แคชระดับที่1 หรือ  L1(Cache L1)แต่ละแกนอาจจะมีการใช้หน่วยความจำร่วมกันเรียกว่า แคช L2   การเข้าถึงข้อมูลที่อยู่ภายในแคช L1  นั้นสามารถทำได้รวดเร็วกว่าการเข้าถึงแคช L2  หรือการเข้าถึงข้อมูลจากหน่วยความจำหลัก  แต่การออกแบบโครงสร้างซีพียูนั้น  จะต้องมีส่วนที่ทำงานร่วมกันได้ด้วย  เพื่อที่จะทำให้สามารถประมวลผลร่วมกันได้ซึ่งส่วนที่จำทำงานร่วมกันก็คือแคช L2

แสดงโครงสร้างโดยคร่าว ของ Dual-Core, Quad-Core แบบ 2 แกน



ข้อดี
1.  การดีไซน์ซีพียูแบบมัลติคอร์ทำให้แคชของแต่ละคอร์ออกแบบมาให้แคบอยู่ใกล้กันกับซีพียูทำให้สัญญาณที่สิ่งระว่างแคชไปที่ซีพียูนั้นเป็นไปอย่างรวดเร็ว
2.  ในแต่ละที่ประกอบไปด้วยซีพียูและแคชนั้นอยู่ใกล้กันมากดังนั้นจึงมีการเพิ่มเทคโนโลยีที่ชื่อว่า  Cache coherency ซึ่งเป็นการทำให้ข้อมูลในแต่ละแคชนั้นเข้าถึงกันได้ สามารถแบ่งงานกันโหลดได้ระหว่างหน่วยประมวลผล
3.  เนื่องจากมัลติคอร์ใช้พื้นที่ของแผงวงจรน้อยกว่า  ทำให้มีสมรรถนะสูงกว่า ขณะที่อัตราการใช้พลังงานยังคงอยู่ในระดับเดียวกันเมื่อเทียบกับซีพียูแบบเดิม  นอกจากนั้น ระบบจัดการความร้อนที่เล็กลงทำให้ใช้ไฟน้อยลงด้วย  จึงช่วยประหยัดพลังงาน แต่ความร้อนกลับน้อยลง เพราะมัลติคอร์ ไม่ได้ใช้งานทุกคอร์ตลอดเวลา
4.  ราคาลดต่ำลงมาเรื่อยๆ  จนในตอนนี้เครื่องคอมพิวเตอร์ส่วนบุคคลใหม่ๆก็เริ่มทยอยกันใช้ซีพียูแบบดูอัลคอร์กันหมดแล้ว
ความแตกต่างจาก Cpu เดิม

            การพัฒนาสมรรถณะของซีพียูแบบมัลติคอร์ Multi-Core  เป็นลักษณะของชิป(chip) ที่ภายในมีหน่วยประมวลผลอยู่หน่วยเดียวต่อมาความต้องการความสามารถในการประมวลผลมีมากขึ้นก็เริ่มมีการพัฒนาความเร็วของซีพียู (CPU) ให้มากขึ้นไปเรื่อยๆให้พอต่อความต้องการ เมื่อความเร็วนั้นพัฒนาขึ้นมากจนยากที่จะทำต่อไปได้จึงมีการนำ CPU มาใช้เทคนิคให้สามารถประมวลผลได้มากขึ้น  เพื่อให้ได้มาซึ่ง ความสมรรณนะที่เพิ่มขึ้นแล้วโดยหลักก็คือ การเพิ่มความเร็วของสัญญานนาฬิกาขึ้นมานั่นเองแต่การกระทำดังกล่าวทำให้ซีพียูต้องใช้พลังงานมากขึ้น  ทำให้เกิดความร้อนสูงตามมาอีกด้วย  ต่อมาเมื่อมีแนวคิดการเพิ่มคอร์ให้กับซีพียูแล้ว  ทำให้การพัฒนาแบบใหม่ถือกำเนิดขึ้นมา  นั่นคือ การเพิ่มหน่วยประมวลผลให้แก่ซีพียูปรากฏซ่าผลที่ออกมาเป้นที่น่าพอใจ  นั่นคือซีพียูนอกจากจะทำงานในสมรรถนะที่สูงขึ้นมากแล้วยังใช้พลังงานน้อยกว่าอีกด้วย  ทำให้ได้มีการเพิ่มจำนวนคอร์ให้กับซีพียูเป็นสี่  แปด  หรือมากกว่านั้นทำให้การพัฒนาซีพียูในยุคใหม่นี้นอกจากจะพัฒนาความเร็วสัญญานนาฬิกาแล้ว  ยังเน้นถึงเรื่อง การประหยัดพลังงานและการเพิ่มหน่วยประมวลผล ด้วยทำให้การพัฒนาซีพียูในยุคนี้เป็นไปอย่างรวดเร็ว
แนวโน้มในอนาคตและบทสรุป
                การพัฒนาชิปและเทคนิคตั้งแต่อดีตจนถึงปัจจุบันเป็นไปอย่างรวดเร็วในแง่ของสมรรถนะและปัจจุบันยังเน้นถึงประสิทธิภาพในการใช้พลังงานให้คุ้มค่ามากที่สุดอีกด้วย  และในบทนี้จะกล่าวถึงแนวโน้มในอนาคตและบทสรุปของเรื่องราวเกี่ยวกับซีพียูแบบมัลติคอร์อีกด้วย




 
ภาพประกอบของการพัฒนา Cpu


วันจันทร์ที่ 4 กรกฎาคม พ.ศ. 2554

รวบรวมวิวัฒนาการของ cpu ของ Intel

     
วิวัฒนาการของ CPU Intel
                 อินเทล (Inter Corporation)
                            เป็นบริษัทผู้ผลิตซีพียูที่เก่าสุดที่รักและพัฒนามาอย่างต่อเนื่อง นับตั้งแต่ซีพียู 8086, 8088 และซีพียูในตระกูล 80x86 เรื่อยมา จนถึง Celeron Pentium II และ III ซึ่งได้รับความนิยมอย่างมากในสมัยนั้น ก่อนที่จะก้าวเข้าสู่ยุค Celeron II ,Pentium 4 และ Pentium 4 Extreme Editionที่ได้รับการตอบรับจากผู้ใช้อย่างกว้างขวางเรื่อยมาซีพียูรุ่นตั้งแต่อดีตจนถึงปัจจุบันของบริษัทอินเทล (Inter)

   CPU จาก 8 บิต ถึง 64 บิต
  การส่งข้อมูลนั้นจะสูงมาเป็น ชุดๆ  แต่ละชุดนั้นสามารถอ้างที่อยู่(address) ได้กี่ตัว  ก็ใช้เลขบิต(Bit) ตัวนี้เป็นตัวกำหนดว่าสามารถอ้างที่อยู่ ได้มากน้อยเพียงใด  ยิ่งอ้างได้มากนั่นหมายถึงทำให้ส่งข้อมูลเข้าหรืออออกที่ซีพียูตามไปด้วย  ซึ่งไม่ว่าจะทำงานเป็น 8,16,32,64 บิตได้หรือไม่นั้นต้องขึ้นอยู่กับระบบปฏิบัติการที่รองรับการทำงานด้วย
8086, 8088  ซีพียูสำหรับเครื่องคอมพิวเตอร์ ตระกูลเครื่องพีซีหรือคอมพิวเตอร์ส่วนบุคคล(PC) ตัวแรกเป็นผลผลิตของบริษัทอินเทล(Intel) ยักษ์ใหญ่มือวางอันดับหนึ่งของวงการซีพียูนั่นเอง
80286  ยุคเริ่มต้นซีพียูขนาด 16 บิตเริ่มจากซีพียูตัวนี้
80386, 80486  เป็น CPU เบอร์แรกที่ประมวลผลทีละ 32 บิต ทำให้สามารถจัดการหน่วยความจำได้ดีกว่า 80286
Pentium  เนื่องจากเริ่มมีบริษัทอื่นๆ ผลิตซีพียูสำหรับพีซีออกมาแข่งขันกับอินเทลจึงทำให้ CPU รุ่น
ถัดมาของ Intel ไม่ใช้ชื่อเรียกเป็นหมายเลข ใช้เป็นชื่ออื่นแทน
Pentium MMX, AMD K6 3DNOW, Cylix 6X86MX  คือ Pentium ที่เพิ่มความสามารถในเชิงมัลติมิเดีย (MMX สำหรับ Pentium, 3DNOW)
Intel Itanium  Intel ได้ตั้งชื่ออย่างเป็นทางการให้กับ CPU 64 บิตของตัวเองว่า  Itanuim
                                
Cpu ซีพียูแต่ละรุ่นของอินเทล                 
   Intel 8086 / 8088 (1978-1979)
ซีพียูรุ่น 8086 เป็นซีพียูของอินเทลที่ทำงานแบบ 16 บิตแบบสมบูรณ์ เพราะทั้งสถาปัตยกรรม ภายในและภายนอกเป็นแบบ 16 บิตอย่างแท้จริง ต่างจาก 8088 ที่สถาปัตยกรรมภายในเป็น ระบบประมวลผลแบบ 16 บิต แต่สถาปัตยกรรมภายนอกที่ใช้ในการเชื่อมต่อกับดาต้าบัส เพื่อ รับส่งข้อมูลเป็นแบบ 8 บิต 


Intel 80286 (1982)
ในปี ค.ศ. 1982 อินเทลก็ได้ผลิตซีพียูรุ่น 80286 ที่มีความเร็วเพียงแค่ 6 เมกิเฮิรตช์ ซึ่งบัสของ 80286 เป็นแบบ 16 บิต ภายในมีทรานซิลเตอร์บรรจุอยู่ประมาณ 130 , 000 ตัว จึงเป็นเหตุให้เกิด ความร้อนสูงในขณะทำงาน ดังนั้นจึงต้องมีการติดตั้งพัดลมและแผ่นระบายความร้อน ( Heat Sink )

Intel 80386SX/80386DX (1985-1990)

ผลิตออกมาเมื่อปี ค.ศ. 1985 ด้วยความเร็ว 16 เมกะเฮิรตซ์ เป็นซีพียูที่มีขนาดของบัสข้อมูล 16 บิต แต่มีขีดความสามารถและความเร็วสูงกว่า 80826 มีทรานซิสเตอร์ภายใน 250 , 000 ตัว สถาปัตยกรรมภายในเป็นระบบประมวลผลแบบ 32 บิต แต่สถาปัตยกรรมภายนอกที่ใช้ในการเชื่อมต่อกับดาต้าบัสเพื่อรับ ส่งข้อมูลจะเป็นแบบ 16 บิต โดย 80386 SX มีความเร็วตั้งแต่ 16 , 50 , 25 , และ 33 เมกะเฮิรตซ์

Intel 80486SX/ 80486 DX (1989-1994)
ซีพียูรุ่น 80486 มีความเร็วตั้งแต่ 20 , 25 , และ 33 เมกะเฮิรตซ์ ทำงานแบบ 32 บิต และมีแคช ภายใน ( Intel Cache ) ทำสามารถทำงานได้เร็วกว่ารุ่น 80386 ที่จำนวนของสัญญาณนาฬิกา เท่ากัน โดยในรุ่น 80486 SX ยังไม่มี Math Coprocess รวมอยู่ในซีพียู ต่อมาทางอินเทลก็ได้ออกเครื่องรุ่น 80486 DX มีความเร็วตั้งแต่ 50 , 66 , 100 เมกะเฮิรตซ์ เป็นซีพียูที่มีขีดความสามารถสูงขึ้นทั้งด้านความเร็วในการคำนวณและเทคโนโลยีโดยการรวม เอา Math Coprocessor และ แคชมารวมอยู่ในชิปเดียวกันกับซีพียู
INTEL PENTIUM


อินเทลเพนเทียม Intel Pentium (1993-1998)
ในช่วงแรกได้ผลิตออกมาที่ความเร็ว 60 และ66 เมกะเฮิรตซ์ อีกไม่นานนักอินเทลก็ได้ ผลิตความเร็วสูงขึ้นอีกเป็น 75 และ 90 เมกิเฮิรตซ์ ซึ่งมีสถาปัตยกรรมที่แตกต่างจากรุ่นแรกๆ และยังสามารถพัฒนาความเร็วไปได้อีกคือ 100 , 13 , 150 และ 166 เมกะเฮิรตซ์ เป็นซีพียูที่มีขีด ความสามารถสูงขั้นทั้งทางด้านความเร็วและเทคโนโลยี มีแคชภายในมากขึ้น และมี ความสามารถในการทำงานกับเลขทศนิยมได้ดีขึ้น และมีความสามารถในการทำงานกับเลข ทศนิยมได้ดีขึ้นโดยรุ่นแรกๆนั้นมีทรานซิสเตอร์ล้านกว่าตัว จึงทำให้มีความร้อนสูงมาก

PENTIUM II
Pentium ll เป็นซีพียูที่ประกอบไปด้วยเทคโนโลยีของ Pentium Pro ผนวกเข้ากับเทคโนโลยี MMX ที่ใช้สถาปัตยกรรมการทำงานแบบใหม่ที่เรียกว่า “Single InstructionMultiple Data (SIMD)” ซึ่งได้มีการปรับโครงสร้างสถาปัตยกรรมภายในซิปถึง 70 จุด เพื่อเร่งความเร็วในการ ทำงานแบบ 64 บิต และยังมีการเพิ่มชุดคำสั่งเข้าไปอีก 70 คำสั่ง เพื่อเพิ่มประสิทธิภาพในการ ประมวลผลงานด้าน 3 มิติ


Pentium II Klamath
  Pentium ll เป็นซีพียูที่ประกอบไปด้วยเทคโนโลยีของ Pentium Pro ผนวกเข้ากับเทคโนโลยี MMX ที่ใช้สถาปัตยกรรมการทำงานแบบใหม่ที่เรียกว่า “Single InstructionMultiple Data (SIMD)” ซึ่งได้มีการปรับโครงสร้างสถาปัตยกรรมภายในซิปถึง 70 จุด เพื่อเร่งความเร็วในการ ทำงานแบบ 64 บิต และยังมีการเพิ่มชุดคำสั่งเข้าไปอีก 70 คำสั่ง เพื่อเพิ่มประสิทธิภาพในการ ประมวลผลงานด้าน 3 มิติ
เพนเทียมทูคลาเมธ Pentium II Klamath
คือชิปรุ่นต่อมาซึ่งถูกพัฒนาความสามารถให้สูงขึ้น Pentium II Klamath เป็นชิปตัวแรก ในตลาด ที่เปลี่ยนจากอินเอตร์เฟซแบบซ็อกเกตมาเป็นสล็อตแทน ซีพียูเพนเทียมทูคลาเมธ มี ความเร็วเริ่มตั้งแต่ 233-300
MHz . ใช้เทคโนโลยีการผลิตขนาด 0.35 ไมครอน มีสถาปัตยกรรม แบบ SECC (Single Eade Contact Cartridge)
เพนเทียมทูเดสชู๊ตส์ ( Pentium II Deschutes )
ซีพียูในรุ่นนี้เป็นการพัฒนาในส่วนของแกนซีพียูให้สามารถทำงานได้ที่ความเร็วสูงขึ้น โดย การลดขนาดการผลิตลงจาก 0.35 มาเป็น 0.25 ไมครอน และเนื่องจากการใช้เทคโนโลยีการ ผลิตที่เล็กลง ทำให้ลดการใช้ไฟเลี้ยงซีพียูน้อยลงอีกด้วย ซึ่งจะช่วยลดความร้อนบนแกนซีพียู
เนื่องจากชิปแคชระดับสองที่ใช้กับซีพียูคลาเมธนั้น ถูกออกแบบให้สามารถรองรับการทำงานที่ความเร็วประมาณ 300 MHz เท่านั้น แต่ในการผลิตซีพียูในรุ่นเดสชู๊ตนี้ สามารถรองรับความเร็วได้ถึง 450 MHz ทำให้แคชระดับสองจะต้องทำงานที่ความเร็วสูงถึง 225 MHz
CELERON
เซลเลอรอนโควินตัน( Covington )
ทางอินเทลได้นำเอาซีพียูเพนเทียมทูในรุ่นคลาเมธมาทำการตัดเอาส่วนของหน่วยความจำแคช ระดับสองออก เพื่อเป็นการลดต้นทุนการผลิตให้ต่ำลงทำให้ซีพียูเซเลอรอนมีสถาปัตยกรรม ภายในแบบเดียวกับเพนเทียมทู เพียงแต่ซีพียูเซลเลอรอนจะไม่มีหน่วยความจำแคชระดับสอง เท่านั้น การที่ Celeron สนันสนุน

เซลเลอรอนโควินตัน( Covington )
MMX การโอนถ่ายข้อมูลมัลติมีเดียได้ด้วยความเร็วสูง แต่ ความสามารถของมันก็ไม่ได้เร็วอย่างที่คาดไว้ เพราะ แคชที่มีเพียง 32 K กับบัส ที่ความเร็ว 66 MHz ก็ไม่ได้ช่วยอะไรมากนัก และให้ชื่อรหัสการพัฒนาในรุ่นนี้ว่าโควินตัน ( Covignton )
ซีพียูโควินตันจะมีด้วยกัน 2 รุ่นคือ รุ่นความเร็ว 266 และ 300 MHz ใช้เทคโนโลยีการ ผลิตขนาด 0.35 ไมครอน ส่วนของชิปจะถูกติดตั้งบนแผงวงจรขนาดเล็กที่เรียกว่า SECC ในเพ นเทียมทู แต่ในตระกูลเซลเลอรอนจะเรียกแผงวงจรดังกล่าวว่า SEPP (Single Edge Processor Packege) แทน ซึ่งจะใช้ติดตั้งบนเมนบอร์ดแบบ Slot 1 เช่นเดียวกัน และแผงวงจร SEPP ก็จะ ถูกบรรจุอยู่ในพลาสติกสีดำคล้ายตลับเกม
เซลเลอรอนเมนโดชิโน (Mendocino )
ซีพียูในรุ่นนี้จีสถาปัตยกรรมแบบเดียวกับเพนเทียมทูรุ่นรหัส Deschutes คือใช้ เทคโนโลยีการผลิตขนาด 02.5 ไมครอน ซึ่งเป็นเทคโนโบยีการผลิตซีพียูที่มีขนาดเล็กกว่าเซล เลอรอนโควินตันที่ใช้ 0.35 ไมครอน และที่สำคัญยังด้เพิ่มส่วนของหน่วยความจำแคชระดับ สองเข้าไปบนตัวชิปซีพียูอีก 128 KB โดยแคชจะทำงานที่ความเร็วเดียวกับซีพียู จะเป็นว่า หน่วยความจำแคชระดับสองของเมนโดชิโนจะมีขนาดเล็กกว่าเพนเทียมทูซึ่งมีขนาด 512 KB แต่แคชระดับสองเมนโดชิโนจะทำงานเร็วกว่า แคชของเพนเทียมทู ซึ่งมีความเร็วเพียง ครึ่งหนึ่งของซีพียูเท่านั้น โดยซีพียูในรุ่นนี้จะเริ่มที่ความเร็ว 300 -433 MHz และถูกติดตั้งบน แผงวงจรขนาดเล็กที่เรียกว่า SEPP
ซีพียูเซลเลอรอน PPGA Socket 370
เพื่อเป็นการลดต้นทุนอินเทลจึงได้ออกแบบ PPGA ซึ่งมีต้นทุนที่ถูกกว่าแบบ Slot 1 สำหรับ ซีพียูเซลเลอรอนแบบ PPGA Socket 370 นี้ ยังคงมีสถาปัตยกรรมแบบเดียวกับเมนโดชิโนที่ใช้ เทคโนโลยีการผลิตขนาด 0.25 ไมครอน กับแคชระดับสองขนาด 128 KB ซึ่งทำงานที่ ความเร็วเดียวกับซีพียู มีความเร็วตั้งแต่ 300 – 533 MHz
  PENTIUM III
Streaming SIMD Extension :SSE เข้าไป 70 คำสั่ง ซึ่งมีหน้าที่เร่งความเร็วให้กับการประมวลผลข้อมูลที่เป็นภาพ 3 มิติ พร้อมกับการเปลี่ยน หน่วยความจำแคชระดับสองให้เร็วขึ้นคือ จาก5.5 ns มาเป็น 4 ns
ซึ่งในรุ่นแรกนี้ใช้ชื่อรหัสว่า แคทไม Katmai และยังคงใช้เทคโนโลยีซีพียูแบบ Slot 1 เช่นเดียวกับเพนเทียมทู ต่อมาทางอินเทลได้ผลิตซีพียูเพนเทียมทรีออกมาใหม่คือ Coppermine ซึ่งมี รูปแบบซีพียูแบบ Slot 1 เช่นกัน
Pentium III Katmai

เพนเทียมทรี Pentium III 
ซีพียูเพนเทียมทรีเป็นซีพียูที่ได้ทำการเพิ่มชุดคำสั่ง Streaming SIMD Extension :SSE เข้าไป 70 คำสั่ง ซึ่งมีหน้าที่เร่งความเร็วให้กับการประมวลผลข้อมูลที่เป็นภาพ 3 มิติ พร้อมกับการเปลี่ยน หน่วยความจำแคชระดับสองให้เร็วขึ้นคือ จาก5.5 ns มาเป็น 4 ns
ซึ่งในรุ่นแรกนี้ใช้ชื่อรหัสว่า แคทไม Katmai และยังคงใช้เทคโนโลยีซีพียูแบบ Slot 1 เช่นเดียวกับเพนเทียมทู ต่อมาทางอินเทลได้ผลิตซีพียูเพนเทียมทรีออกมาใหม่คือ Coppermine ซึ่งมี รูปแบบซีพียูแบบ Slot 1 เช่นกัน
ซีพียูเพนเยมทรีแคทไม
เป็นซีพียูที่มีความเร็วเริ่มต้นที่ 450 MHz ไปจนถึง 620 MHz ใช้เทคโนโลยีการผลิตขนาด0.25 ไมครอน มีทรานซิสเตอร์จำนวน 28 ล้านตัว ใช้สถาปัตยกรรมแบบ SECC 2 (Single Edge Contact Cartridge 2

ซีพียูเพนเทียมทรีคอปเปอร์ไมน์ Pentuim III Coppermine
ใช้เทคโนโลยีการผลิตขนาด 0.18 ไมครอน มีทรานซิสเตอร์จำนวน 28 ล้านตัว ซีพียูมีแพ็คเกจแบบ SECC2 และลดขนาดของหน่วยความจำแคชระดับสองลงเหลือเพียงครึ่งหนึ่งคือ 256 KB แต่เป็น หน่วยความจำแคชที่สร้างบนชิปซีพียูซึ่งทำงานที่ความเร็วเดียวกับซีพียู เท่ากับว่าแคชของซีพียูคอปเปอร์ไมน์ทำงานเร็วเป็น 2 เท่า ของซีพียูแคทไม โดยหน่วยความจำแคชระดับสองนี้จะใช้ เทคโนโลยีใหม่ที่เรียกว่า Advanced Transfer Cache: ATC
Pentium 4 เพนเทียมโฟร์ Pentium 4 เป็นรุ่นที่ค่อนข้างจะมีความเร็วผิดจากที่คาดไว้ และมี Cache น้อย อย่างไรก็ดี ชิปชุดนี้ก็ได้รับการพัฒนาขึ้นอย่างมาก ไม่ว่าจะเป็นสถาปัตยกรรมการ ออกแบบที่ใหม่ทั้งหมด ระบบไปป์ไลน์ 20 ขั้น ต่อมาได้ชื่ออย่างไม่เป็นทางการว่า Intel Pentium Processor ที่จะมาแทนที่ Pentium III จะออกสู่ตลาดด้วยความเร็วเริ่มต้นที่ 1.4 GHz 1.5 GHz ภายใต้สถาปัตยกรรมใหม่ล่าสุดที่ชื่อ Intel NetBurst micro - architecture นอกจากนี้ ยังได้เพิ่มชุดคำสั่งใหม่ SSE 2 เข้าไปอีก 144 ชุดคำสั่ง

เทคโนโลยีใหม่ที่พัฒนาขึ้นใน Pentium 4
1. Intel NetBurst micro – architecture
เป็นสถาปัตยกรรมแบบใหม่ล่าสุดที่ช่วยให้สามารถ เร่งความเร็วของสัญญาณนาฬิกาให้ทำงานได้ที่ความถี่สูงๆ และเป็นจุดกำเนิดเทคโนโลยีใหม่ ๆอีก หลายอย่าง ที่ช่วยให้ Pentium 4 มีประสิทธิภาพมากขึ้น
2. Hyper Pipelined Technology
เป็นเทคโนโลยีที่ช่วยให้ Pentium 4 สามารถทำงานตามคำสั่งซอฟต์แวร์ใน Pipeline ได้สูงถึง 20 ขั้นตอน รวมถึงการรองรับความเร็วสัญญาณนาฬิกาที่ความเร็ว 1.5 และ 1.4 GHz
3. Rapid Execution Engine
เป็นเทคโนโลยีที่ทำให้ซีพียู Pentium 4 มีความเร็วของบัสระบบ สูงถึง 400 MHz ซึ่งจะช่วยให้ซีพียูสามารถรับส่งข้อมูลระหว่างซีพียูและอุปกรณ์อื่นๆเร็วขึ้น รวมถึงการรับส่งข้อมูลกับหน่วยความจำ Rambus ก็มีประสิทธิภาพขึ้นด้วย
4. Streaming SIMD Extensions 2 (SSE2)
เป็นเทคโนโลยีชุดคำสั่งพิเศษที่พัฒนาต่อจาก SSE ซึ่งได้บรรจุคำสั่งใหม่เพิ่มเข้าไปอีก 144 คำสั่ง จากคำสั่งที่มีอยู่เดิมใน MMX และ SSE ซึ่ง ประกอบด้วยคำสั่งที่จัดการกับข้อมูลแบบจำนวนเต็มและทศนิยม อีกทั้งขยายขนาดของ SIMD Integer จากเดิม 64 บิต ที่ใช้กับเทคโนโลยี MMX มาเป็น 128 บิต ที่ทำให้เพิ่มประสิทธิภาพ อัตรากรรคำนวณสำหรับ SIMD Integer เป็น 2 เท่า
5. Execution Trace Cache
เป็นตัวถอดรหัสเพื่อแปลความหมายของคำสั่งที่ได้รับจากแรม พร้อมกับจัดเก็บคำสั่งที่ผ่านการถอดรหัสเรียบร้อยแล้ว เมื่อใดก็ตามที่ซีพียูมีการเรียกคำสั่งบางคำสั่งที่ อาจซ้ำกับคำสั่งที่มีอยู่ใน Trace Cache ก็จะได้ไม่ต้องเสียเวลามาถอดรหัสซ้ำอีก
6. Advanced Trace Cache
เป็นหน่วยความจำแคชระดับ 2 ขนาด 256 KB ที่ติดตั้งอยู่บน Die ของแผ่นซิลิกอน ที่ทำงานด้วยความเร็วเดียวกับซีพียู ซึ่งเทคโนโลยีนี้ใช้มาตั้งแต่ซีพียู Pentium III แล้ว แต่ได้ทากรขยายช่องทางการส่งข้อมูลระหว่างซีพียูกับแคชเพิ่มจากเดิมที่มีขนาด 64 ไบต์ ขณะที่ Pentium 4 มีขนาด 128 ไบต์ ทำให้มีการรับส่งข้อมูลได้สูงกว่ามาก
7. Advanced Dynamic Execution
ซึ่งเรียกอีกอย่างหนึ่งว่า ‘Speculative Execution' ซึ่งเป็น กระบวนการทำงานคำสั่งใดๆ เสร็จเพียงครึ่งทางก่อน แล้วรอดูว่ามีคำสั่งไหนที่ต้องการใช้ใน ขั้นต่อไป โดย Pentium 4 สามารถมองเห็นคำสั่งได้ 126 คำสั่ง ในแต่ละเที่ยว และโหลดคำสั่ง ได้ 48 คำสั่ง และเก็บคำสั่งไว้ใน Pipeline ได้ 24 คำสั่ง ช่วยลดจำนวนโครงข่ายที่เป็นสาเหตุให้ เกิดการทำนายผิดพลาดลง 33 %
8. Enhanced Floating Point/ Multimedia
ซีพียู Pentium 4 ได้ขยายส่วนของการคำนวณ Floating Point Register ให้กว้างถึง 128 บิต เพื่อให้การคำนวณเลขทศนิยมมีความรวดเร็วขึ้น ซึ่งจะทำให้สามารถทำงานกับโปรแกรมด้านมัลติมีเดียได้ดี
Pentuim 4 90 นาโนเมตร
เป็นโปรเซสเซอร์รุ่นใหม่ที่ใช้เทคโนโลยีการผลิตแบบ 90 นาโนเมตรเป็นเทคโนโลยีที่ทันสมัยที่สุดในวงอุตสาหกรรมเซมิคอนดักเตอร์ ที่อินเทลนำมาใช้เป็นพิเศษสำหรับผลิตชิปบน เวเฟอร์ ขนาด 300 มิลลิเมตร เทคโนโลยีการผลิตใหม่นี้ประกอบด้วยทรานซิลเตอร์ที่มีประสิทธิภาพสูงขึ้นและกินไปต่ำลง สเตรน
ซิลิคอน( strained silicon ) อินคอนเน็ค ความเร็วสูงที่ทำจากทองแดง( high – speed copper intercon - nects ) และวัสดุใหม่แบบ ( low – k dielectric ) ยังคงมีเทคโนโลยีไฮเปอร์ เธรดดิ่ง ที่ช่วยการทำงานแบบมัลติทาสก์กิ้งอยู่เช่นเดิม และมี คุณสมบัติใหม่ๆเพิ่มเติม เช่น Enhanced Intel Micro-architecture แคช L2 มีขนาดใหญ่ขึ้นเป็น 1 เมกะไบต์ และมีชุดคำสั่งเพิ่มขึ้นอีก 13 ชุด โปรเซสเซอร์ของอินเทลรุ่นต่างๆ ที่มีเทคโนโลยี ไฮเปอร์ เธรดดิ่ง
บทสรุป
             จากที่กล่าวมาข้างต้นจะเห็นว่า   ในยุคเริ่มแรกซีพียู เป็นแบบหน่วยประมวลผลเดี่ยว
(single-core) แล้วจึงพัฒนาเป็นหลายหน่วยประมวลผล(multi-core)  ซึ่งคาดว่าจะพัฒนาต่อไปอีกในอนาคตอาจจะมีชิปที่มีหน่วยประมวลมากมาย(many-core)  แสดงถึงการพัฒนาของCPU ควบคู่กับประสิทธิภาพและการใช้พลังงาน