Mục Lục
Phần I.Giới thiệu
Phần II.Kiến trúc tập lệnh .
Phần III.Đặc tính và công nghệ mới
1. Đặc điểm kỹ thuật
2. Memory .
3. Graphics
4. Công nghệ nâng cao .
Phần IV. Tổng kết
Phần V. Nguồn tài liệu .
37 trang |
Chia sẻ: maiphuongdc | Lượt xem: 4386 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đề tài Tìm hiểu kiến trúc vi xử lý Intel core i5 thế hệ 2, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
I+BX],[SI+BP],[SI][BX][1000h]…
*Địa chỉ hiệu dụng không hợp lệ:
[70000],[AX],[SI+DI+1000h]…
Địa chỉ hiệu dụng chính là thành phần offset của địa chỉ luận lý bộ nhớ.
Segment của địa chỉ hiệu dụng được mặc định như sau:
.Nếu không sử dụng BP trong địa chỉ hiệu dụng thì mặc định theo thanh ghi DS.
.Nếu có BP trong địa chỉ hiệu dụng thì mặc định theo thanh ghi SS.
-Các hoạt động thực hiện trên bộ nhớ thông qua địa chỉ hiệu dụng chia ra làm 2 trường hợp :hoạt động 8 bít và hoạt động 16 bít.
*Hoạt động bộ nhớ 8 bít làm việc trên 1 byte bộ nhớ ngay vị trí chỉ ra bởi địa chỉ hiệu dụng
*Hoạt động bộ nhớ 16 bít sẽ làm việc trên 2 byte bộ nhớ có địa chỉ kế tiếp nhau và nội dung của chúng được ghép lại thành dữ liệu 16 bít theo qui tắc “byte cao địa chỉ cao,byte thấp địa chỉ thấp”
Ví dụ: địa chỉ---> 1000h 1001h
Bộ nhớ 34 12
Dữ liệu 1234h
b.Trong kiến trúc trúc x86 những tập lệnh cơ bản ta có thể liệt kê như sau:
+Nhóm lệnh chuyển dữ liệu gồm :MOV;PUSH ;POP; XCHG;….
Ví dụ:lệnh MOV:
.Dạng lệnh: MOV reg,reg MOV reg ,immed
MOV mem,reg MOV reg,immed….
.Giải thích: toán hạng đích ß toán hạng nguồn
.Tác động cờ OF DF IF SF ZF AF FF CF
.Chép toán hạng nguồn vào toán hạng đích.
.ví dụ: MOV AX,CX ;AXßCX
MOV[SI+1000H],BP ; [SI+1001h,SI +1000h] ßBP
(Trong đó các từ viết tắt: reg=thanh ghi tổng quát; mem=bộ nhớ; immed=số tức thời)
+Nhóm lệnh số học:ADD;ADC…
+Nhóm lệnh luận lý:NOT;SHL/SAL…
+Nhóm lệnh xử lý chuỗi:REP;MOVS…
+Nhóm lệnh chuyển điều khiển:CALL;JMP…
+Nhóm lệnh điều khiển bộ xử lý:CLC;STC…
3.Tiếp nối kiến trúc 16 bít mà đại diện là vi xử lý 8086 intel ,là thế hệ thứ 4:vi xử lý 32 bít mà đại diện là 80386/80486,IA 32(intel) và thế hệ thứ 5:vi xử lý 64 bít đại diện là dòng coro i3,i5,i7.Nhìn chung kiến trúc tập lệnh trong vi xử lý 32 bít và 64 bít có nhiều điểm tương đồng với kiến trúc tập lênh vi xử lý 16 bít,dựa trên nền kiến trúc 16 bít để phát triển .Đa dạng và phức tạp hơn.
•Với dòng Core i5
* Clarkdale - nền tảng 32 nm
• Tất cả các tập lệnh hỗ trợ: MMX , SSE , SSE2 , SSE3 , SSSE3 , SSE4.1 , SSE4.2 , Enhanced Intel SpeedStep Technology (EIST), Intel 64 , XD bit (một bit NX thực hiện), TXT , Intel VT-x , Intel VT-d , Hyper-Threading , Turbo Boost , Smart Cache và AES-NI
• i5-661 không hỗ trợ Intel VT-d
• FSB đã được thay thế với DMI.
* Lynnfield - nền tảng 45 nm
•Dựa trên Nehalem
•Tất cả các tập lệnh hỗ trợ: MMX , SSE , SSE2 , SSE3 , SSSE3 , SSE4.1 , SSE4.2 , Enhanced Intel SpeedStep Technology (EIST), Intel 64 , XD bit (một bit NX thực hiện), Intel VT-x , Turbo Boost , Smart Cache
•Hyper-Threading bị vô hiệu hóa.
Tập lệnh MMX gồm có các nhóm lệnh chính MMX-The Registers (Thanh ghi MMX),State Management,Data Movement,Boolean Logic
Là một tập hợp mở rộng gồm 57 lệnh hỗ trợ đồ họa được xây dựng dành riêng cho CPU Intel Pentium nhằm mục đích giúp hệ thống xử lý các tác vụ đa phương tiện (multimedia operation) như âm thanh, phim, hình ảnh và modem (truyền nhận dữ liệu).
Nó gồm các lệnh:
ØLệnh quản lý trạng thái(State Management): enums
Ølệnh trao đổi dữ liệu(Data movement): movd,movq
ØLệnh logic
ØLệnh tính toán số học
ØLệnh so sánh
ØLệnh đóng gói dữ liệu
MMX được thiết kế sẵn trong các dòng CPU Pentium MMX và Pentium II (Tập lệnh MMX cho phép các tác vụ được thực hiện đồng thời trên nhiều đơn vị dữ liệu khác nhau. Các đối thủ cạnh của Intel (như AMD, Cyrix, Centaur) cũng phát triển các bộ xử lý tương thích MMX của họ (MMX-compliant chips) với các bộ lệnh riêng chuyên xử lý các tác vụ tính tóan hình học và dấu chấm động cần thiết khi di chuyển các hình ảnh 3D (3 Dimension - 3 chiều) trên màn hình .
Tập lện SSE Tập lệnh Sse: Một nhóm gồm 70 lệnh được thiết kế thêm trên Bộ xử lý Pentium III nhằm tăng cường chất lượng thực thi các tác vụ đồ họa 3 chiều (3D graphics). Kiến trúc tập lệnh SSE gồm :
SSE — MXCSR.
SSE — OpCode List: các lệnh về toán học,logic,so sánh….
Nó hỗ trợ khả năng thực hiện tính toán dấu chấm động và hình học - các tính năng cần thiết để hiển thị và di chuyển hình ảnh 3 chiều trên màn hình. Đây là tập hợp các lệnh tăng cường thứ 2 của Intel nhằm cải tiến khả năng đồ họa của các bộ vi xử lý (tập hợp đầu tiên chính là MMX). SSE còn được gọi là KNI (Katmai New Instruction) do tên mã trước đây của CPU Intel Pentium III là Katmai.Nó gồm có những lệnh sau: Lệnh tính toán số học
ØLệnh logic
ØLệnh so sánh
ØLệnh chuyển đổi
ØLệnh trạng thái
ØLệnh Load/Store
ØLệnh Shuffling
ØLệnh cache control
SSE2: Là tập lệnh được thiết kế cho Intel Pentium 4. Nó tăng cường thêm 144 lệnh hỗ trợ đồ họa, truyền thông đa phương tiện và kết nối mạng trực tuyến (true multimedia and online Internet).Các lệnh này bao gồm các tác vụ số Nguyên SIMD 128-bit (128-bit SIMD integer arithmetic operations) và các tác vụ dấu chấm động với độ chính xác gấp đôi SIMD 128-bit (128-bit SIMD double-precision floating-point operations). Các lệnh mới này làm tối ưu hóa khả năng thực hịên các ứng dụng như phim video, xử lý âm thanh - hình ảnh, mã hóa, tài chính, thiết kế và nghiên cứu khoa học, kết nối mạng trực tuyến...
1)
Tập lệnh SSE 4.1 với 47 lệnh SSE mới :
• Công nghệ Deep Power Down ( chỉ có trong những CPU Mobile và được gọi là Trạng thái C6 – State )
• Công nghệ Enhanced Intel Dynamic Acceleration Technology ( chỉ có trong những CPU Mobile ) .
• Cải thiện FPU ( Bộ tính toán dấu phảy động ) bằng những phép chia theo hệ số 16 nhanh hơn “ Fast Radix-16 Divider “
• Cải thiện FPU ( Bộ tính toán dấu phảy động ) bằng “Super Shuffle Engine”
• Công nghệ Ảo hoá nâng cao “Enhanced Virtualization Technology” ( hiệu suất tăng 25 – 75% khi chuyển trạng thái sang máy ảo ) .
Tập lệnh SSE 4.2 mới với việc thêm bảy lệnh mới để hỗ trợ cho xử lí văn bản , có tên gọi “Application Target Accelerator “ .
• MMX - MultiMedia eXtensions: Là một tập hợp mở rộng gồm 57 lệnh hỗ trợ đồ họa được xây dựng dành riêng cho CPU Intel Pentium nhằm mục đích giúp hệ thống xử lý các tác vụ đa phương tiện (multimedia operation) như âm thanh, phim, hình ảnh và modem (truyền nhận dữ liệu).. Tập lệnh MMX cho phép các tác vụ được thực hiện đồng thời trên nhiều đơn vị dữ liệu khác nhau. Các đối thủ cạnh của Intel (như AMD, Cyrix, Centaur) cũng phát triển các bộ xử lý tương thích MMX của họ (MMX-compliant chips) với các bộ lệnh riêng chuyên xử lý các tác vụ tính tóan hình học và dấu chấm động cần thiết khi di chuyển các hình ảnh 3D (3 Dimension - 3 chiều) trên màn hình.
à Kiến trúc tập lệnh MMX : MMX-The Registers (Thanh ghi MMX),State Management,Data Movement,Boolean Logic .
Nguồn :
•SSE - Single SIMD Extentions:
Một nhóm gồm 70 lệnh được thiết kế thêm trên Bộ xử lý Pentium III nhằm tăng cường chất lượng thực thi các tác vụ đồ họa 3 chiều (3D graphics). Nó hỗ trợ khả năng thực hiện tính toán dấu chấm động và hình học - các tính năng cần thiết để hiển thị và di chuyển hình ảnh 3 chiều trên màn hình. Đây là tập hợp các lệnh tăng cường thứ 2 của Intel nhằm cải tiến khả năng đồ họa của các bộ vi xử lý (tập hợp đầu tiên chính là MMX). SSE còn được gọi là KNI (Katmai New Instruction) do tên mã trước đây của CPU Intel Pentium III là Katmai.
àKiến trúc tập lệnh SSE gồm :
SSE — MXCSR.
SSE — OpCode List: các lệnh về toán học,logic,so sánh….
Nguồn :
•SSE2: Là tập lệnh được thiết kế cho Intel Pentium 4. Nó tăng cường thêm 144 lệnh hỗ trợ đồ họa, truyền thông đa phương tiện và kết nối mạng trực tuyến (true multimedia and online Internet).Các lệnh này bao gồm các tác vụ số Nguyên SIMD 128-bit (128-bit SIMD integer arithmetic operations) và các tác vụ dấu chấm động với độ chính xác gấp đôi SIMD 128-bit (128-bit SIMD double-precision floating-point operations). Các lệnh mới này làm tối ưu hóa khả năng thực hịên các ứng dụng như phim video, xử lý âm thanh - hình ảnh, mã hóa, tài chính, thiết kế và nghiên cứu khoa học, kết nối mạng trực tuyến...
• SSE3 : là phiên bản thứ ba của SSE đặt cho kiến trúc IA-32.Hỗ trợ làm tăng kết nội mạng, đa phương tiện… SSE3 thêm vào 13 câu lệnh mới.
•SSE4
Instruction Description
MPSADBW Compute eight offset sums of absolute differences, four at a time (i.e., |x0−y0|+|x1−y1|+|x2−y2|+|x3−y3|,|x0−y1|+|x1−y2|+|x2−y3|+|x3−y4|, …, |x0−y7|+|x1−y8|+|x2−y9|+|x3−y10|); this operation is important for some HD codecs, and allows an 8×8 block difference to be computed in fewer than seven cycles.[5] One bit of a three-bit immediate operand indicates whether y0 .. y10 or y4 .. y14 should be used from the destination operand, the other two whether x0..x3, x4..x7, x8..x11 or x12..x15 should be used from the source.
PHMINPOSUW Sets the bottom unsigned 16-bit word of the destination to the smallest unsigned 16-bit word in the source, and the next-from-bottom to the index of that word in the source.
PMULDQ Packed signed multiplication on two sets of two out of four packed integers, the 1st and 3rd per packed 4, giving two packed 64-bit results.
PMULLD Packed signed multiplication, four packed sets of 32-bit integers multiplied to give 4 packed 32-bit results.
DPPS, DPPD Dot product for AOS (Array of Structs) data. This takes an immediate operand consisting of four (or two for DPPD) bits to select which of the entries in the input to multiply and accumulate, and another four (or two for DPPD) to select whether to put 0 or the dot-product in the appropriate field of the output.
BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDW Conditional copying of elements in one location with another, based (for non-V form) on the bits in an immediate operand, and (for V form) on the bits in register XMM0.
PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINSD, PMAXSD Packed minimum/maximum for different integer operand types
ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD Round values in a floating-point register to integers, using one of four rounding modes specified by an immediate operand
INSERTPS, PINSRB, PINSRD/PINSRQ, EXTRACTPS, PEXTRB, PEXTRW, PEXTRD/PEXTRQ The INSERTPS and PINSR instructions read 8, 16 or 32 bits from an x86 register memory location and insert it into a field in the destination register given by an immediate operand, EXTRACTPS and PEXTR read a field from the source register and insert it into an x86 register or memory location. For example, PEXTRD eax, [xmm0], 1; EXTRACTPS [addr+4*eax], xmm1, 1 stores the first field of xmm1 in the address given by the first field of xmm0.
PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ Packed sign/zero extension to wider types
PTEST This is similar to the TEST instruction, in that it sets the Z flag to the result of an AND between its operators: ZF is set, if DEST AND SRC is equal to 0. Additionally it sets the C flag if (NOT DEST) AND SRC equals zero.
This is equivalent to setting the Z flag if none of the bits masked by SRC are set, and the C flag if all of the bits masked by SRC are set.
PCMPEQQ Quadword (64 bits) compare for equality
PACKUSDW Convert signed DWORDs into unsigned WORDs with saturation.
MOVNTDQA Efficient read from write-combining memory area into SSE register; this is useful for retrieving results from peripherals attached to the memory bus.
• [edit] SSE4.2
• These instructions were first implemented in the Nehalem-based Intel Core i7 product line and complete the SSE4 instruction set. Support is indicated via the CPUID.01H:ECX.SSE42[Bit 20] flag.
Instruction Description
CRC32 Accumulate CRC32C value using the polynomial 0x11EDC6F41 (or, without the high order bit, 0x1EDC6F41).[6][7]
PCMPESTRI Packed Compare Explicit Length Strings, Return Index
PCMPESTRM Packed Compare Explicit Length Strings, Return Mask
PCMPISTRI Packed Compare Implicit Length Strings, Return Index
PCMPISTRM Packed Compare Implicit Length Strings, Return Mask
PCMPGTQ Compare Packed Signed 64-bit data For Greater Than
• EM64T (Intel ®( Extended Memory 64 Technology ) giúp tăng cường hiệu suất xử lý 2 nhân, hỗ trợ công nghệ điện toán 64bit hỗ trợ mạnh mẽ cho hệ điều hành Microsoft Windows Vista.
• Công nghệ nổi bật : EIST , HyperThreading XD bit (một bit NX thực hiện), TXT , Intel VT-x , Intel VT-d , Hyper-Threading , Turbo Boost , Smart Cache và AES-NI
• EIST(Intel SpeedStep® Technology) là công nghệ đặc biệt của Intel được áp dụng cho các sản phẩm vi xử lý của họ, EIST sẽ giúp các vi xử lý chạy với tốc độ phù hợp nhất trong các thời điểm khác nhau tuỳ theo trạng thái các ứng dụng đang chạy. Ta hãy hình dung một CPU có tốc độ 3.6GHz với công suất 110w có thể chạy chỉ với tốc độ 2.8GHz khi máy tính ở trạng thái nhàn rỗi và mức tiêu hao điện năng cũng như độ ồn hệ thống suy giảm đáng kể.Thực tế ta thấy trong suốt một buổi làm việc, các máy tính thường xuyên hoạt động dưới mức công suất tối đa vì thế nếu EIST được ứng dụng sẽ tiết kiệm được một lượng điện năng đáng kể, đặc biệt là với các nhà máy công sở có sử dụng máy vi tính với số lượng lớn.
Nguồn :
• HyperThreading (HT) Hyper-Threading công nghệ cung cấp 2 luồng (thread) trên mỗi nhân,tức là nhân đôi số tác vụ mà một bộ vi xử lý có thể thực thi.
HyperThreading là tên của Intel đặt cho công nghệ SMT (Simultaneous Multi-Threading). Công nghệ này cho phép một nhân xử lý có thể thực sự xử lý song song các thread do các ứng dụng tạo ra, bằng cách trang bị thêm một số thành phần của nhân xử lý, khiến hệ điều hành nghĩ rằng nó đang làm việc với nhiều nhân xử lý. Như vậy, với một hệ điều hành tương thích bộ xử lý nhiều nhân hay nhiều bộ xử lý, nó sẽ sắp xếp để nhiều thread cùng được gửi đến các bộ xử lý “ảo” đó. Về mặt lý thuyết, khi chúng ta chỉ có một nhân xử lý thì nó có xử lý song song được bao nhiêu thread cũng không thể tăng tốc độ xử lý chúng lên được. Tuy nhiên trong thực tế, không phải bất kỳ lúc nào mọi thành phần của nhân xử lý cũng được sử dụng đến, và những thành phần không được sử dụng đến này có thể dùng để xử lý thread thứ hai (hoặc thứ ba, thứ tư…). Công nghệ SMT còn giúp bộ xử lý làm việc hiệu quả hơn bằng cách giảm bớt số lần nhân xử lý phải chuyển qua chuyển lại giữa các thread ‘’song song”. Quá trình chuyển này, như đã nói ở trên, diễn ra rất nhanh và liên tục, nhưng không có nghĩa là không mất thời gian, và bằng việc giảm bớt lượng công việc này, bộ xử lý có thể được rảnh rang để tập trung vào chuyên môn hơn.
Nguồn :
Intel VT-x : Các kiến trúc x86 không phải là ảo hóa. Intel Virtualization Technology là một tập lệnh mở rộng giúp nâng cao hiệu suất và tạo điều kiện cho các văn bản của một hypervisor. Có hai loại của Intel VT, VT-x cho x86, Itanium-VT-i.
Vai trò chính của một hypervisor là để quản lý truy cập vào phần cứng để đảm bảo rằng nguồn tài nguyên có thể được chia sẻ bởi nhiều máy ảo. Một số vấn đề trong việc ảo hóa các kiến trúc x86 là:
• deprivileging nhẫn: một máy ảo chạy các ứng dụng như một hệ thống điều hành khách đang chạy ở mức đặc quyền rằng ông là không đúng.
• Vòng Aliasing: một số hướng dẫn không có đặc quyền được thực hiện trực tiếp trên bộ xử lý mà không có sự can thiệp của hypervisor.
• nén vòng: các máy ảo chạy trên hệ điều hành cùng một mức độ ứng dụng
Phần mở rộng được thiết kế bởi AMD và Intel cũng được sử dụng để vượt qua những vấn đề này. Ví dụ, VT-x x86 thêm vào hai loại mới của hoạt động: vmx gốc và vmx không phải root. Các loại đầu tiên được thiết kế cho các hypervisor, hành vi của nó là rất tương tự như IA-32 mà không có VT-x. Tuy nhiên, khác cho máy ảo. Cả hai vmx không vmx gốc rễ đó cho phép sử dụng 4 cấp độ của đặc quyền để chạy các phần mềm. VT-x cũng xác định hai cấp độ đặc quyền chuyển tiếp (từ root-không để gốc và ngược lại) và một cấu trúc dữ liệu gọi là một máy ảo kiểm soát cấu trúc (VMCS) có chứa các trạng thái của máy ảo và bộ xử lý của nó. Điều này giải quyết nhiều vấn đề được liệt kê ở trên và làm cho nó dễ nhất và nhanh nhất hypervisor
Inthel VT-d Intel Virtualization Technology dành cho Directed I / O (Intel VT-d). "Đối với ảo hóa máy tính để bàn, Intel VT-d tăng tốc độ chuyển dữ liệu và loại bỏ phần lớn tải trọng bất lợi ảnh hưởng đến hiệu suất bằng cách giảm sự cần thiết phải can thiệp vào việc quản lý của VMM I / O tốc độ giao thông Intel VT-d chuyển động dữ liệu và loại bỏ phần lớn tải trọng bất lợi ảnh hưởng đến hiệu suất bằng cách giảm sự cần thiết phải can thiệp vào việc quản lý của VMM I / O giao thông "
XD(một Bit NX) mà là viết tắt của Không thực hiện, là một công nghệ được sử dụng trong CPU để cô lập các khu vực bộ nhớ sử dụng bằng cách lưu trữ các hướng dẫn xử lý (hoặc mã) hoặc lưu trữ dữ liệu, một tính năng thường chỉ tìm thấy trong kiến trúc Harvard bộ vi xử lý. Tuy nhiên, các bit NX đang được ngày càng được sử dụng trong truyền thống của von Neumann kiến trúc bộ vi xử lý, vì lý do an ninh .
Một hệ thống điều hành với sự hỗ trợ cho các bit NX có thể đánh dấu một số khu vực của bộ nhớ không thực thi. Bộ xử lý sau đó sẽ từ chối thực hiện bất kỳ mã cư trú trong các khu vực này bộ nhớ. Các kỹ thuật nói chung, được gọi là bảo vệ không gian thực thi, được sử dụng để một số loại phần mềm độc hại dùng trên máy tính bằng cách chèn mã của họ vào khu vực lưu trữ khác của chương trình dữ liệu và chạy mã của họ từ bên trong phần này, này là được biết đến như là lỗi tràn bộ đệm tấn công.
AES (Advanced Encryption Standard) là một tiêu chuẩn mã hóa được thông qua bởi chính phủ Hoa Kỳ bắt đầu vào năm 2001. Nó được sử dụng rộng rãi trên toàn hệ sinh thái phần mềm để bảo vệ lưu lượng mạng, dữ liệu cá nhân, và cơ sở hạ tầng CNTT của công ty. AES là một thuật toán mã hóa khối đối xứng mã hóa / giải mã dữ liệu thông qua nhiều vòng. Năm 2010 mới của Intel ® Core ™ xử lý gia đình (tên mã Westmere) bao gồm một tập hợp các hướng dẫn mới, Intel ® Advanced Encryption Standard (AES) Hướng dẫn (AES-NI) . Các hướng dẫn được thiết kế để thực hiện một số bước chuyên sâu phức tạp và hiệu suất của thuật toán AES sử dụng phần cứng và do đó đẩy nhanh việc thực hiện các thuật toán AES. AES-NI có thể được sử dụng để đẩy nhanh tiến độ thực hiện của một thực hiện AES 3 đến 10 lần trên một phần mềm thực hiện hoàn toàn.
Các thuật toán AES làm việc bằng cách mã hóa kích thước khối cố định của 128 bit của văn bản đơn giản trong nhiều vòng để sản xuất các văn bản mật mã được mã hóa cuối cùng. Số lượng (10, 12, 14) đã sử dụng phụ thuộc vào độ dài chính (128b, 192b, hoặc 256b). Mỗi vòng thực hiện một chuỗi các bước trên nhà nước đầu vào, sau đó được đưa vào vòng sau. Mỗi vòng được mã hóa bằng cách sử dụng một khóa con được tạo ra bằng cách sử dụng một lịch trình quan trọng.
Tập lệnh AES-NI bao gồm sáu hướng dẫn mới thực hiện một số tính toán các bộ phận chuyên sâu của các thuật toán AES. Những hướng dẫn này có thể thực hiện bằng cách sử dụng các chu kỳ đồng hồ ít hơn đáng kể so với một giải pháp phần mềm. Bốn trong số những hướng dẫn mới để tăng tốc độ mã hóa / giải mã của vòng một và hai hướng dẫn mới cho thế hệ quan trọng vòng. Sau đây là một mô tả của các hướng dẫn mới.
• AESENC. Hướng dẫn thực hiện một vòng duy nhất của mã hóa. Hướng dẫn kết hợp bốn bước của thuật toán AES ShiftRows, SubBytes, MixColumns & AddRoundKe y vào một lệnh duy nhất .
• AESENCLAST. Hướng dẫn cho vòng cuối cùng của mã hóa. Kết hợp các ShiftRows, SubBytes AddRoundKey bước vào một hướng dẫn.
• AESDEC. Hướng dẫn một vòng duy nhất của giải mã. Điều này kết hợp bốn bước AES - InvShiftRows, InvSubBytes, InvMixColumns, AddRoundKey thành một lệnh đơn
• AESDECLAST. Thực hiện vòng cuối cùng của giải mã. Nó kết hợp InvShiftRows, InvSubBytes, AddRoundKey thành một trong những hướng dẫn.
• AESKEYGENASSIST được sử dụng để tạo ra các phím tròn được sử dụng để mã hóa.
• AESIMC được sử dụng để chuyển đổi các phím tròn mã hóa để có thể sử dụng một hình thức để giải mã bằng cách sử dụng các yếu tương đương Inverse.
Phần III. Đặc tính và Công nghệ mới của Intel
Bài viết sau sẽ cung cấp cái nhìn tổng quát về Sandy Brige, thế hệ vi xử lý mới của Intel. Cùng với Westmere, đây là kiến trúc đầu tiên của Intel được sản xuất trên tiến trình 32nm cùng với thế hệ 2 của Hi-K+ Metal Gate (Transitor cổng kim loại) mang lại hiệu xuất cao và tiêu thụ ít điện năng hơn.
Mục tiêu của Intel khi đưa ra sản phẩm của mình gồm:
Smart Performance
• Xung nhịp và hiệu năng cao. Giúp bạn hoàn thành công việc nhanh hơn với ít điện hơn
• Intel Turbo Boost 2.0 sẽ tự động đem đến hiệu năng cao hơn cho bạn nếu cần
• Hỗ trợ SMT 4-way và 8-way đưa đến khả năng multi-tasking ấn tượng
Seamless Visual Experience
•Mang đến khả năng tạo, quản lý và chia sẻ hình ảnh một cách nhah chóng
•IGP build-in cho hình ảnh sắc nét, hiệu ứng trung thực hơn
Vậy những công nghệ nào đã đem đến cho Intel core thế hệ thứ 2, với cấu trúc tương tự Core i5 (Lynnfield) trên nền tảng 1156 của Intel, vậy Core i5 Sandy Bridge có gì nổi bật hơn so với thế hệ trước đó:
I – Đặc điểm kỹ thuật
1. Đó là tiếng tock trong tiếng tick - tock của tiến trình 32nm. Vâng, thế hệ thứ 2 của Intel trên tiến trình 32nm giống như Westmere nhưng lại có kiến trúc hoàn toàn mới- kiến trúc Sandy Bridge. Thế hệ 2 của công nghệ Hi-K+ Metal Gate nhằm đem đến khả năng tiếp kiệm điện và giảm lượng điện thừa.
Tiến trình 32nm là một cải tiến quan trọng để mở rộng kích thước mạch tích hợp, tăng mật độ transitor trên chip, và tăng hiệu suất transitor, Công nghệ xử lý 32nm với thế hệ thứ hai high-k + metal gate cho phép thiết kế để tối ưu hóa hiệu suất, kích cỡ và sức mạnh cùng một lúc. Với những cải tiến so với các thế hệ trước, với công nghệ Hi-K+ Metal Gate, hiệu suất của transitor tăng lên 22%, rò rỉ điện giảm >5x cho các transitor NMOS, >10% cho các transitor PMOS trên tiến trình 45nm. Tóm lại, nhờ tiến trình này, ta có thể có được những vi xử lý có kích thước nhỏ, hiệu năng cao với mức tiêu thụ điện thấp đáng kinh ngạc
2. Các nhân xử lý được cải tiến với kết nối mạch vòng (Ring Interconnect) đột phá kết nối giữa các Core, Graphic, Last lever Cache và System Agent (tên gọi mới của Chip Cầu Bắc) tạo ra băng thông lên đến 384Gb/s
Vi kiến trúc của CPU Intel Core thế hệ thứ 2 được trang bị những nhân xử lý cải tiến có khả năng kết nối tốt hơn với công nghệ kết nối mạch vòng nhằm cung cấp băng thông dữ liệu cao hơn, hiệu suất hoạt động và khả năng tiết kiệm điện năng tốt hơn. Kết nối mạch vòng là một hệ thống ngay trên đế có cấu trúc mô-đun, độ trễ thấp, băng thông cao để kết nối giữa các thành phần của bộ vi xử lý (gồm các nhân xử lý được cải tiến, nhân đồ họa tích hợp và các thành phần tích hợp khác như hệ thống điều khiển bộ nhớ và hiển thị) nhằm nâng cao hiệu suất hoạt động.
3.Intel Smart Cache bộ nhớ chia sẻ tự động phân bố cho các lõi tùy vào khối lượng công việc, làm giảm đáng kể độ trễ, tăng hiệu suất
Cache của các dòng VXL cũ : Intel Smart Cache:
Phân chia tài nguyên cho các đơn vị tùy thuộc vào yêu cầu, khối lượng công việc
II - Memory
1.Tích hợp Integrate Memory Controller điều khiển bộ nhớ tích hợp, giúp nâng cao hiệu suất đọc/ghi thông qua các thuật toán tìm nạp hiệu quả, độ trễ thấp hơn, băng thông rộng hơn
2. Bộ nhớ kênh đôi DDR3-1333 gồm 2 kênh mỗi kênh 2 thanh RAM cùng hoạt động
III - Graphics
1.Nhân đồ hoạ IGP tích hợp trên cùng 1 đế với CPU và sẽ sử dụng chung bộ nhớ đệm trên chip mà ko phải kết nối trực tiếp với RAM
So sánh vs các dòng VXL thế hệ trước:
Từ trái qua: CPU vi kiến trúc Nehalem (Core i đầu tiên Socket LGA1366 chỉ có nhân xử lý); CPU thế hệ Westmere với chip đồ họa được tích hợp vào đế chung với nhân xử lý (Core i Socket LGA1156); và CPU thế hệ Sandy Bridge với IGP được tích hợp luôn vào nhân xử lý nên trên đế chỉ còn 1 con chip
2. IGP sử dụng công nghệ 32nm là một bước tiến khi so với các BXL Clarkdale vốn có nhân đồ hoạ dựa trên công nghệ 45nm. Nhờ vào tiến trình 32nm, Intel đã có thể đặt nhiều transistor hơn cho IGP này – Intel gọi là HD Graphics 2000 & 3000. IGP trên Westmere vẫn dùng tiến trình 45nm và ngốn nhiều điện hơn phiên bản 32nm
3. Nhân đồ họa tích hợp IGP, mà quan trọng hơn là tích hợp trên cùng 1 đế với x86. Nhờ việc trung 1 đế với x86 mà IGP còn thừa hưởng được cả tính năng Turbo Boost vốn đã có trên Nehalem. Thực tế có những tựa game nặng về đồ hoạ hơn năng lực tính toán chung, có nghĩa CPU có thể hoạt động ở xung thấp hơn mà chẳng ảnh hưởng mấy đến lượng fps xuất ra màn hình. Vì thế mà TDP toả ra trên CPU cũng ít hơn. Còn TDP trên GPU thì cần nhiều hơn. Với Turbo Boost, Intel tận dụng điều này để “nhường” phần TDP vốn dành cho nhân x86 sang các nhân đồ hoạ (Execution Unit – EU, cách gọi của Intel). Tức xét về tổng TPD toả ra trên con chip thì không đổi, nhưng có sự thay đổi “tỷ lệ ăn chia” giữa nhân x86 và IGP, mà kết quả là lượng fps (về lý thuyết) sẽ cao hơn so với không có Turbo Boost.
4. Điểm nhấn là tích hợp đồ hoạ trong CPU giúp bạn mua 1 được 2. Hiệu năng đã có sự cải thiện ấn tượng so với lần tích hợp đầu tiên trong Clarkdale. Nhưng cũng chỉ có 16 lines cho PCI-e để sử dụng card đồ hoạ với cấu hình 16x hoặc 8x-8x
5. Intel® Quick Sync Video Technology giúp chuyển đổi định dạng trên các thiết bị cầm tay và chia sẻ qua mạng một cách nhanh nhất.
Tốc độ chuyển mã trên Quick Sync phải nói cực kỳ ấn tượng. Nguyên nhân thì không khó hình dung lắm : IGP trên SnB nằm cùng
Các file đính kèm theo tài liệu này:
- bao_cao_intel_core_i5_the_he_2_1242.docx