Chương I.1
Các Hệ Vi xử lý tiên tiến .1
I.1. Tổng quan về Hệ Vi xử lý tiên tiến .1
I.2. Đặc điểm kiến trúc Hệ Vi xử lý tiên tiến.10
I.3. Phân loại các bộ Vi xử lý song song .12
I.3.1. Phân loại theo Flynn.13
I.3.2. Phân loại theo kiến trúc .16
Chương II. .27
Kỹ thuật đường ống và siêu hướng.27
II.1. Đa xử lý đường ống tuyến tính .27
II.2. Cấu trúc và hoạt động của hệ thống đường ống siêu hướng .31
II.3. Hệ thống BUS và bộ nhớ.37
II.4. Tổ chức bộ nhớ cache.44
II.4.1. Các phương thức đánh địa chỉ cache.44
II.4.2. Cache liên hợp và cache ánh xạ trực tiếp .48
II.5. Tổ chức bộ nhớ chia sẻ .57
II.5.1. Tổ chức bộ nhớ đan xen (Interleaved Memory Organization) .57
II.5.2. Băng thông và dung sai lỗi.61
II.5.3. Sơ đồ định vị bộ nhớ.62
Chương III .68
Các mô hình máy tính xử lý song song.68
III.1. Liên kết hệ thống đa xử lý.68
III.1.1. Hệ thống BUS phân cấp .71
III.1.2. Chuyển mạch ngang dọc và bộ nhớ đa cổng .76
III.1.3. Mạng tổng hợp và mạng nhiều tầng .82
III.2. Một số hệ thống xử lý song song .87
III.2.1. Hệ thống đa vector và các máy tính SIMD.87
III.2.2. Hệ thống vô hướng, đa luồng và kiến trúc dòng dữ liệu.104
Chương IV.105
Sơ lược về lập trình và đặc trưng mạng.105
IV.1. Mối liên hệ nguồn tài nguyên và dữ liệu.105
III.1.1. Quan hệ phụ thuộc tài nguyên và dữ liệu .106
III.1.2. Cơ chế song song mềm và song song cứng .111
III.1.3. Phân cấp các mức song song .115
120 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 422 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Giáo trình Hệ thống vi xử lý tiên tiến - Nguyễn Trung Đồng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
s bít cho mỗi khối cache. Với s > r, độ dài thẻ tăng đáng kể.
a)Tìm kiếm
liên kết
trên tất cả
các khối
đích
s
s
w
s
Memory Address
Tag Word
Khối
Bộ nhớ chính
W0
W1
W2
W3
W4j
W(4j+1)
W(4j+2)
W(4j+3)
Tag Cache
Data
Data
Data
Data
Data
Data
Data
Data
B0
Bj
Data
Data
Data
Data
Bm
So sánh Cache hit
Cache miss Khung khối
s+w
s
w
Hệ Vi xử lý tiên tiến
52
Cách gọi cache liên kết đầy đủ xuất phát từ việc tìm
kiếm đường liên kết m bất kỳ trên thẻ được so sánh với tất
cả các thẻ khối trong cache. (Xem hình II.14a). Cách tổ
chức này tạo nên sự mềm dẻo trong chiến lược thay thế các
khối nhằm tạo tỷ lệ cache hit cao hơn.
Hình II.14b cho thấy một ví dụ ánh xạ 4 đường theo
phương thức tìm kiếm liên kết đầy đủ. Thẻ cache có 4 bit
tạo khả năng một trong 16 khối có thể nạp vào một khung
khối.
Cache liên kết theo tệp và cache vùng (Set-
Associative and Sector Cache)
Tổ chức cache theo tệp rất thông dụng và được sử dụng
trong máy tính thương mại. Cache ánh xạ theo vùng thường
được sử dụng cùng cache liên kết theo tệp.
Tag 4 bit Cache
Bộ nhớ chính
B0
B1
B2
B3
B4
B5
B6
B7
B8
B9
B10
B11
B12
B13
B14
B15
B0
B1
B2
B3
Hình II.14 b) Mỗi khối có thể được “ánh xạ” đến bất kỳ khung
khối nào
Nguyễn Trung Đồng Tel. 0983 410 866 53
+) Cache liên kết theo tệp (Set-associative cache) là
cách tổ chức thoả hiệp giữa ánh xạ trực tiếp và liên kết đầy
đủ. Tổ chức theo phương thức này làm giảm giá thành đáng
kể.
Trong cache liên kết thứ k có m khung khối cache được
chia thành v = m/k tệp, với k khung khối trong mỗi tệp. Mỗi
tệp được nhận dạng nhờ số hiệu tệp gồm d bít, 2d = v. Thẻ
khối cache bây giờ chỉ cần s – d bít. Trong thực tế, độ lớn
của tệp k hay còn gọi là tính liên hợp thường được chọn
bằng 2, 4, 8, 16 hoặc 64 phụ thuộc vào độ lớn của khối w,
độ lớn dung lượng cache m và giá thành sản phẩm hoàn
thiện. Ánh xạ liên kết đầy đủ có thể xem như trường hợp
với v = 1, hoặc là trường hợp tính liên hợp với dung lượng
cache là m. Khi tìm kiểm trong trường hợp liên kết đường k,
thẻ cache được so sánh với với k thẻ trong tệp (Hình II. 15).
Có thể hiểu phương thức tổ chức này trên Hình II.15b
là ví dụ ánh xạ với n = 16 khối nhớ từ bộ nhớ chính vào
cache liên kết 2 đường (k = 2) và số tệp là v = 4 qua m = 8
khung khối.
cache
s+w
w
w d
s-d
Thẻ cache
Địa chỉ từ nhớ
Tag Set Word B0
B1
B(k-1)
B(ik)
B(ik+1)
B(ik+k-1)
B0
B1
B2
B3
B(ik+1)
So sánh
Bộ nhớ chính
set 0
set i
Cache hit
Cache miss
Hình II.15. a) Tìm liên kết đường thứ k trong các tệp có k khối cache
Hệ Vi xử lý tiên tiến
54
Với hệ thống i860 của Intel (Hình II.12b) D-cache và I-
cache là liên kết 2 đường (k = 2) với 128 tệp trong D-cache,
64 tệp trong I-cache với 256 và 128 khung khối.
+) Cache ánh xạ theo vùng (Sector mapping cache)
được tổng hợp từ những phương thức trên. Ý tưởng chủ yếu
là phân vùng cache và bộ nhớ chính thành từng phân vùng
cố định (sectors), sau đó sử dụng phương thức liên kết đầy
đủ. Nghĩa là mỗi phân vùng (sector) có thể được nạp vào bất
kỳ một khung phân vùng (sector frame) nào có thể.
Yêu cầu truy xuất bộ nhớ được đưa đến các khối, chứ
không được chuyển đến các vùng. Có thể lọc ra yêu cầu này
bằng cách so sánh thẻ vùng trong địa chỉ ô nhớ với tất cả
các thẻ vùng sử dụng cách tìm kiếm liên kết đầy đủ. Khi
khung vùng phù hợp, (cache hit) vùng khối được sử dụng để
định vị khối được yêu cầu trong khung vùng.
Bộ nhớ chính
B0
B1
B2
B3
B4
B5
B6
B7
B0
B1
B2
B3
B4
B5
B6
B7
B8
B9
B10
B11
B12
B13
B14
B15
set 0
set 1
set 2
set 3
Thẻ 2 bít cache
Hình II.15.b) Ánh xạ khối cache vào liên kết 2 đường và 4 tệp
Bộ nhớ chính
Địa chỉ ô nhớ
Sector Block Word
(3 bít) (2 bít) (4 bít)
B0
B1
B2
B3
Vùng
0
Nguyễn Trung Đồng Tel. 0983 410 866 55
Hệ Vi xử lý tiên tiến
56
Khi xẩy ra cache miss, chỉ khối bị lỗi được lấy từ bộ
nhớ chính và đặt vào khung khối thích hợp trong khung
vùng. Có nghĩa là khối thứ i trong vùng phải được đặt đúng
vào khung khối thứ i trong khung vùng đích. Bít xác nhận
hợp lệ (valid bít) được gắn với mỗi khối khung để chỉ ra
khối là hợp lệ hay không hợp lệ. Khi nội dung một khung
khối bị thay thế, tất cả các khung khối còn lại sẽ bị đánh dấu
là không hợp lệ. Chỉ khung khối mới bị thay thế nhất trong
vùng được đánh dấu là hợp lệ cho phép tham chiếu.
Nếu so sánh với hai phép ánh xạ đã trình bày trên đây,
thì phép ánh xạ vùng có ưu điểm ở sự mềm dẻo của thuật
thay thế nội dung các khối và hiệu quả hơn trong việc tìm
kiếm liên kết đầy đủ thông qua một số giới hạn thẻ vùng.
Hình II.16 là một ví dụ về tổ chức cache ánh xạ vùng
với mỗi vùng có 4 khối. Mỗi vùng có thể ánh xạ vào bất kỳ
khung vùng nào với phương thức liên kết đầy đủ ở mức
vùng. Cách tổ chức này được hiện thực hoá trên hệ thống
IBM System/360 Model 85. Tổ chức ở Model 85 có 16
vùng, mỗi vùng có 16 khối, với dung lượng khối là 64
bytes. Như vậy mỗi vùng có 1024 bytes và tổng dung lượng
cache là 16KB.
Hiệu suất sử dụng cache có thể nhìn nhận trên hai
phạm vi liên quan là số chu kỳ (Cycle Count) và tỷ lệ trúng
cache (Hit Ratio). Số chu kỳ được tính dựa vào số các chu
kỳ máy cần cho một truy xuất cache, bổ sung thông tin và
điều khiển liên kết. Tỷ lệ trúng cache xác định tính hiệu quả
của sử dụng cache so với tổng thời gian truy xuất bộ nhớ.
Cần có sự điều chỉnh cân bằng giữa hai phạm vi này. Các hệ
số ảnh hưởng đến tốc độ truy xuất cache và tỷ lệ trúng cache
bao gồm việc mô phỏng theo từng bước thực hiện chương
Nguyễn Trung Đồng Tel. 0983 410 866 57
trình (program trace-driven simulation) và mô hình hoá
phân tích (analytical modeling) quá trình tổ chức và quản lý
bộ nhớ cache. Sự thoả hiệp thông qua kết quả của hai quá
trình này sẽ đưa tới quyết định tổ chức cấu trúc và phương
thức quản lý cache.
II.5. Tổ chức bộ nhớ chia sẻ
Tổ chức bộ nhớ theo phương thức đan xen
(interleaving) tạo ra được giải thông cao hơn cho các hệ
thống truy xuất của đường ống đối với các vị trí liên tiếp
trong bộ nhớ. Phương pháp định vị và phân vùng bộ nhớ
chính cho các chương trình được quan tâm nhất nhằm sử
dụng bộ nhớ một cách tối ưu.
II.5.1. Tổ chức bộ nhớ đan xen (Interleaved
Memory Organization)
a) Tổ chức đan xen
Có nhiều cách tổ chức bộ nhớ vật lý. Kỹ thuật đan xen
được sử dụng để làm giảm nhỏ lỗ hổng (bong bóng) trong
tăng tốc truy xuất CPU-cache và bộ nhớ chính. Mục tiêu của
thiết kế bộ nhớ là mở rộng hiệu suất băng thông nhớ sao
cho nhiều từ nhớ có thể truy xuất được trong một đơn vị
thời gian. Mục tiêu cuối cùng chính là phù hợp băng thông
nhớ với băng thông của BUS và băng thông của bộ xử lý.
Giả sử bộ nhớ chính có m = 2a mô đun, mỗi mô đun nhớ
chứa w = 2b từ trong một vị trí nhớ. Tổng dung lượng nhớ
sẽ là m.w = 2a+b từ nhớ. Các từ nhớ này được gán các địa
chỉ tuyến tính. Các phương thức gán địa chỉ tuyến tính khác
nhau sẽ dẫn đến các tổ chức bộ nhớ khác nhau.
Ngoài các truy xuất ngẫu nhiên, bộ nhớ chính còn bị
truy xuất theo khối tại các vùng có địa chỉ liên tiếp nhau.
Hệ Vi xử lý tiên tiến
58
Việc truy xuất theo khối là cần thiết đối với chuỗi lệnh hay
cấu trúc dữ liệu tuyến tính. Mỗi truy xuất theo khối tương
ứng với độ rộng của khối hoặc một số khối trong cache. Tất
nhiên yêu cầu này dẫn đến việc thiết kế bộ nhớ sao cho
thích hợp với việc truy xuất theo khối.
Hình II.17 a,b chỉ ra hai dạng thức địa chỉ cho đan xen
bộ nhớ. Đan xen bậc thấp (Low-order interleaving) trải
rộng của các vị trí nhớ liên tục trên m mô đun. Hàm ý bậc
thấp tức là a bít thấp của địa chỉ ô nhớ được dùng để xác
định mô đun nhớ, trong khi b bit cao là địa chỉ của từ nhớ
trong từng mô đun. Lưu ý rằng địa chỉ từ nhớ được đưa đến
tất cả các mô đun nhớ đồng thời, còn địa chỉ mô đun nhớ
qua giải mã địa chỉ để xác định mô đun nhớ.
Hình II.17a. m đường đan xen bậc thấp (Low-order)
MDB: Đệm dữ
liệu bộ nhớ
MAB: Đệm địa
chỉ mô đun
Mm-1 M1 M0
Địa chỉ ô nhớ
BUS dữ liệu
Word Mô đun
MA
0
m
m(
MD
MAB
1
m+1
mw-m+1)
MDB
MAB
m-1
2m-1
mw-1
MDB
W
A
B
MAB
0
m
m(w-1)
MDB
a
b
Giải mã
địa chỉ
Đệm địa chỉ từ nhớ
Giải mã
địa chỉ
Mm-1
MA
0
m
MAB
w
w+1
MAB
(m-1)w
mw
MAB
0
1 a
Nguyễn Trung Đồng Tel. 0983 410 866 59
Đan xen bậc cao (High-order interleaving) sử dụng các
bit bậc cao (a bít) làm địa chỉ của mô đun nhớ còn các bít
bậc thấp (b bít) là địa chỉ của từ nhớ. Các vị trí nhớ liên tiếp
được đặt trong từng mô đun. Trong mỗi chu kỳ bộ nhớ, chỉ
một từ nhớ được truy xuất từ mỗi mô đun nhớ. Đây cũng là
nguyên nhân bộ nhớ đan xen bậc cao không thể sử dụng cho
truy xuất theo khối các vị trí nhớ liên tiếp nhau. Chỉ bộ nhớ
đan xen bậc thấp cho phép truy xuất các vị trí nhớ liên tiếp
nhau theo khối trong cơ chế đường ống.
b) Truy xuất bộ nhớ đường ống hoá
Truy xuất m mô đun nhớ có thể thực hiện gối nhau theo
thể thức đường ống hoá. Vì mục đích này, chu kỳ bộ nhớ
(chu kỳ chính) được phân chia thành m chu kỳ thứ cấp.
Hình II.17. Hai cách tổ chức bộ nhớ đan xen với m = 2a và w = 2b từ trong
mỗi mô đun nhớ
Hình II.17b. m đường đan xen bậc cao (High-order)
Hệ Vi xử lý tiên tiến
60
Một ví dụ về tổ chức bộ nhớ đan xen với m = 8, w = 8,
ứng với a = b = 3 được thể hiện trên Hình II.18a. Gọi θ là
chu kỳ chính và τ là chu kỳ thứ cấp, ta có:
m
trong đó m là bậc đan xen (degree of interleaving).
Định thời của truy xuất đường ống hoá 8 từ nhớ liên tiếp
trong bộ nhớ được thể hiện trên Hình II.18b. Thể thức truy
xuất đồng thời (concurrent access) các từ nhớ liên tiếp nhau
được gọi là biểu đồ C-truy xuất. Chu kỳ chính θ là tổng thời
gian cần thiết để hoàn thành truy xuất một từ trong mô đun.
Chu kỳ thứ cấp τ là thời gian thực tế cần để tạo nên từ, bao
gồm việc truy xuất gối kề các mô đun nhớ kế tiếp nhau và
được phân tách bởi chu kỳ thứ cấp τ.
a)Đan xen bậc thấp 8
đường
1
9
17
25
33
41
49
57
2
10
18
26
34
42
50
58
3
11
19
27
35
43
51
59
4
12
20
28
36
44
52
60
5
13
21
29
37
45
53
61
6
14
22
30
38
46
54
62
7
15
23
31
39
47
55
63
0
8
16
24
32
40
48
56
Thanh ghi địa chỉ ô nhớ
Địa chỉ từ nhớ Địa chỉ mô đun
Thanh ghi dữ liệu ô nhớ
M0 M1 M2 M3 M4 M5 M6 M7
Nguyễn Trung Đồng Tel. 0983 410 866 61
Thấy rằng truy xuất đường ống hoá 8 từ liên tiếp được
thực hiện như trên băng tải giữa truy xuất các khối đường
ống hoá với các khối khác. Trong khi tổng thời gian truy
xuất khối là 2θ, thời gian truy xuất hiệu dụng mỗi từ được
rút xuống chỉ còn là τ, như đối với bộ nhớ truy xuất liên tiếp
trong phương thức đường ống hoá.
II.5.2. Băng thông và dung sai lỗi
Năm 1967 Hellerman đã đưa ra biểu thức khảo sát sự
tăng hiệu quả theo băng thông qua việc tổ chức bộ nhớ đan
xen nhiều đường. Giả sử một mô đun nhớ đơn cho phép truy
xuất một từ trong một chu kỳ bộ nhớ thì băng thông B được
tính bằng 1.
Băng thông B của bộ nhớ đan xen m đường bị
giới hạn trên bởi m và giới hạn dưới bằng 1. Hellerman đưa
ra biểu thức khảo sát B như sau:
mmB 56.0
W0
W1
W2
W3
W4
W5
W6
W7
Thời gian
τ θ
2θ
b)Truy xuất đường ống hoá 8 từ liên tiếp trong bộ nhớ truy
xuất đồng thời (C-access)
Hệ Vi xử lý tiên tiến
62
trong đó m là số các mô đun nhớ đan xen. Thấy ngay rằng
nếu sử dụng 16 mô đun nhớ theo tổ chức đan xen, băng
thông sẽ gần gấp 4 lần so với bộ nhớ chỉ một mô đun.
Trong máy tính xử lý vector, thời gian truy xuất của
một vector dài n phần tử với khoảng cách giữa chúng bằng 1
được Cragon khảo sát năm 1992 như sau: Giả sử có n phần
tử được lưu giữ liên tiếp trong bộ nhớ đan xem m đường,
thời gian trung bình t1 cần để truy xuất 1 phần tử trong
vector là:
)
1
1(1
n
m
m
t
Khi n→∞, (vector rất dài), t1→θ/m = τ, còn khi n→1
thì t1 = θ, và có thể kết luận, theo quan điểm này, vector
càng dài càng tốt hơn.
Dung sai lỗi : Thấy rằng đan xen bậc cao và đan
xen bậc thấp có thể tổ hợp để tạo ra nhiều cách tổ chức bộ
nhớ đan xen. Các địa chỉ tuần tự sẽ được gán cho bộ nhơ
đan xen bậc cao trong mỗi mô đun nhớ. Nó cho phép dễ
dàng loại trừ lỗi mô đun nhớ trong băng nhớ m mô đun. Khi
xẩy ra lỗi tại một mô đun, lúc đó các mô đun khác có thể
dùng để mở một cửa sổ trong không gian nhớ. Lỗi loại trừ
này không xuất hiện trong tổ chức đan xen bậc thấp, vì lỗi
mô đun có thể gây rối loạn toàn băng nhớ. Chính vì vậy, bộ
nhớ đan xen bậc thấp không thể coi là loại bộ nhớ có dung
sai lỗi.
II.5.3. Sơ đồ định vị bộ nhớ
Ý tưởng bộ nhớ ảo (Virtual Memory) cho phép nhiều
quá trình được thực hiện sử dụng chiến lược chia sẻ theo
Nguyễn Trung Đồng Tel. 0983 410 866 63
thời gian sử dụng bộ nhớ chính, nguồn tài nguyên quý giá
nhưng lại rất hạn chế về dung lượng. Sự phân chia của hệ
điều hành về định vị và hoán vị bộ nhớ chính trong quá trình
thực thi chương trình được gọi là điều hành bộ nhớ
(Memory Manager). Điều hành bộ nhớ thực hiện việc giám
sát phần chung của bộ nhớ và xác định quá trình nào sẽ
được định vị vào, quá trình nào phải trả về ổ đĩa khi dung
lượng bộ nhớ là giới hạn.
Chiến lược định vị (Allocation Policies): Hoán đổi
bộ nhớ là quá trình di chuyển các khối thông tin giữa các
mức của phân cấp bộ nhớ. Để dễ hiểu, ở đây chỉ trình bày
sự hoán vị thông tin giữa bộ nhớ chính và ổ đĩa.
Trước tiên chiến lược hoán đổi có thể thực hiện không
chỉ với vùng nhớ được ưu tiên hay không được ưu tiên.
Trong trường hợp định vị không ưu tiên, khối thông tin đến
chỉ có thể được nạp vào vùng rỗi của bộ nhớ chính. Còn
trường hợp định vị ưu tiên thì khối thông tin mới sẽ thay thế
vị trí tại vùng đang bị chiểm giữ bởi một quá trình. Trong cả
hai trường hợp, điều hành bộ nhớ luôn cố gắng định vị
thông tin vào vùng được ưu tiên.
Khi không gian bộ nhớ chính đã định vị đầy đủ, sơ đồ
không ưu tiên hoán vị một số quá trình đang được định vị
(hoặc trang) để giành chỗ cho các khối sẽ được chuyển đến.
Mặt khác, sơ đồ ưu tiên có sự lựa chọn ưu tiên cho quá trình
đang thực thi. Sơ đồ không ưu tiên tuy dễ dàng thực hiện,
song sự sử dụng bộ nhớ không được hoàn hảo. Sơ đồ ưu
tiên có tính mềm dẻo cao, song nó yêu cầu cơ chế thiết lập
để xác định trang nào hay quá trình nào sẽ phải hoán vị
khỏi, và ngăn ngừa sự thua thiệt do quá thừa vùng hoán vị
giữa các mức bộ nhớ.
Hệ Vi xử lý tiên tiến
64
Chiến lược định vị có thể là cục bộ hoặc toàn cục.
Chiến lược định vị cục bộ chỉ bao gồm các lớp công việc
của các quá trình không tường minh. Chiến lược định vị
toàn cục cân nhắc quá khứ của lớp các công việc thuộc các
quá trình thường trú để đi đến quyết định hoán vị.
Các hệ thống hoán vị (Swapping Systems) :
Thiết bị hoán vị (swap device) là một phần được định
trước của đĩa đặt trong vùng tạm lưu để sẽ được hoán vị
khỏi bộ nhớ chính. Một phần của vùng nhớ đĩa thiết lập cho
thiết bị hoán vị được gọi là không gian hoán vị (Hình II.19).
Điều hành bộ nhớ định vị không gian đĩa cho tệp
chương trình một khối, nhưng nó lại định không gian cho
thiết bị hoán vị một nhóm các khối liền kề. Để dễ hình
dung, giả thiết các khối là những trang có dung lượng cố
định. Không gian địa chỉ ảo có thể chiếm nhiều trang. Độ
lớn của không gian địa chỉ quá trình bị giới hạn bởi dung
lượng bộ nhớ chính trong hệ thống hoán vị.
a)Di chuyển quá trình (trang) vào vùng hoán vị của đĩa
1023K
400K
(63K)
(16K)
(0)
(1K)
(17K)
2K
800K
801K
(0)
Không
gian
hoán
vị
(4M)
Bộ nhớ chính Bộ nhớ ổ đĩa
Nguyễn Trung Đồng Tel. 0983 410 866 65
Hệ thống hoán vị được sử dụng trong máy tính PDP-11
và các hệ thống UNIX gần đây. Nó được dùng để chuyển
nội dung của quá trình giữa bộ nhớ chính và thiết bị hoán vị,
chứ không chuyển các thành phần (trang) riêng biệt của quá
trình. PDP-11 cho phép quá trình có độ dài lớn nhất là
64KB. Cần nhắc lại rằng, mọi quá trình đều phải được nạp
vào bộ nhớ chính thì mới có thể thực thi được.
Hình II.19 là ví dụ đơn giản mô tả nguyên lý trao đổi
thông tin phục vụ thực hiện quá trình có 5 trang hiện hành
được xác nhận qua địa chỉ bộ nhớ ảo 0, 1K, 16K, 17K và
63K với giả thiết dung lượng trang là 1K từ (tương đương
b)Hoán vị quá trình (trang) vào bộ nhớ
Hình II.19. Nguyên lý hoán vị trong bộ nhớ ảo phân
cấp (dung lượng trang là 1k từ - 4KB)
1
023K
1023K
Bộ nhớ chính Bộ nhớ ổ đĩa
1022K
465K
(0)
(16K)
(63K)
(17K)
(1K)
4K
700K
(0)
Không
gian
hoán
vị
(4M)
b)Hoán vị quá trình (trang) trở lại bộ nhớ chính
Hình II.19. Nguyên lý hoán vị bộ nhớ vào trang bộ nhớ ảo phân
cấp được nhận dạng bởi giả thiết số lượng trang độ lớn là 1K
Hệ Vi xử lý tiên tiến
66
4Kbyte) Hình II.19a chỉ ra sự định vị trong bộ nhớ vật lý
trước khi hoán vị. Giả thiết bộ nhớ chính có 1024 khung
trang, ổ đĩa có thể điều tiết để có 4M trang. 5 trang thường
trú rời rạc trên bộ nhớ chính được được hoán vị khỏi bộ nhớ
và sắp xếp lại thành các trang liên tiếp trên thiết bị hoán vị.
Sau này, quá trình có thể cần được sắp xếp lại vào bộ
nhớ chính như trong Hình II.19b. Các khung trang khác có
thể được định vị để điều tiết lại sự sắp xếp các trang. Mục
đích của việc ánh xạ các khối liên tiếp vào thiết bị hoán vị là
để tăng tốc hoạt động trao đổi thông tin đa khối so với việc
di chuyển từng khối.
Các hệ thống lập trang theo yêu cầu
(Demand Paging Systems):
Hệ thống bộ nhớ theo trang sử dụng lập trang theo yêu
cầu trong chiến lược định vị. Chiến lược này chỉ cho phép
các trang (không cho phép quá trình) được hoán vị giữa bộ
nhớ chính và thiết bị hoán vị. Trên Hình II.19, các trang của
quá trình được hoán vị độc lập và đó là hệ thống lập trang
theo yêu cầu. Trong hệ thống lập trang theo yêu cầu, toàn bộ
quá trình không được chuyển vào bộ nhớ chính để được
thực thi, chỉ các trang được nạp vào bộ nhớ chính theo yêu
cầu. Ý tưởng lập trang theo yêu cầu tương thích hoàn toàn
với nguyên lý tập hiện hành (working-set). Chỉ các tập hiện
hành của quá trình đang được thực thi là hiện hữu trong bộ
nhớ chính. Back (1996) định nghĩa tập hiện hành của quá
trình là tập các trang tham chiếu bởi quá trình trong n tham
chiếu cuối cùng, và n được gọi là độ rộng cửa sổ (window
size) của tập hiện hành.
Nguyễn Trung Đồng Tel. 0983 410 866 67
Các hệ thống nhớ hỗn hợp (Hybrid Memory
Systems):
Các hệ thống máy tính VAX/VMS và UNIX System V
được lắp đặt hệ thống nhớ hỗn hợp ứng dụng những ưu
điểm của hai phương thức hoán vị và lập trang theo yêu cầu.
Khi một số quá trình đồng thời ở trạng thái sẵn-sàng-chạy
đã-được-hoán-vị (ready-to-run-but-swapped), thiết bị hoán
vị có thể chọn để hoán vị ra một số quá trình để làm rỗng
không gian nhớ cần thiết. Một số hệ thống nhớ ảo có thể sử
dụng phương thức lập trang dự đoán (anticipation
pagging), nghĩa là nhặt trước các trang theo dự đoán. Sơ đồ
làm việc theo phương thức này rất khó thực thi. Cho đến khi
các mẫu tham chiếu bộ nhớ có thể tiên đoán được tại thời
điểm khi bộ dịch tạo địa chỉ, sơ đồ này không phát huy được
thế mạnh. Với các mẫu tham chiếu bộ nhớ ngắn hạn, sẽ dễ
dàng hơn để dự đoán thông qua các đặc trưng cục bộ.
Hệ Vi xử lý tiên tiến
68
Chương III
Các mô hình máy tính xử lý song song
Chương này khảo sát kiến trúc hệ thống đa xử lý
(MultiProcessors) và kiến trúc hệ thống đa máy tính
(MultiComputers). Các vấn đề được quan tâm ở đây gồm
phương pháp đồng bộ, các mạch chuyển mạch mạng liên
kết, các bộ nhớ đa cổng, mạng nhiều tầng , v. v
III.1. Liên kết hệ thống đa xử lý
Xử lý song song đòi hỏi việc liên kết hệ thống đảm bảo
truyền thông nhanh chóng giữa các bộ Vi xử lý với bộ nhớ
chia sẻ, với các thiết bị Vào/Ra và với các thiết bị ngoại vi.
BUS phân cấp, các phần tử chuyển mạch và mạng nhiều
tầng luôn được sử dụng co các mục tiêu này.
Hình III.1 là hệ thống đa xử lý tổng quát. Kiến trúc này
tổng hợp các ưu điểm của hệ thống UMA, NUMA và
COMA. Mỗi bộ xử lý Pi được gắn thêm mô đun nhớ cục bộ
và cache riêng. Các bộ xử lý được liên kết với các mô đun
nhớ chia sẻ nhờ mạng kết nối xử lý-bộ nhớ IPMN
(Interprocessor-Memory Network).
Các bộ xử lý chia sẻ nhau các thiết bị Vào/Ra và các
thiết bị ngoại vi khác thông qua mạng kết nối thiết bị
Vào/Ra PION (Processor-I/O Network). Hai mạng liên kết
IPNM và PION là cần thiết cho việc chia sẻ tài nguyên
trong hệ thống đa xử lý. Truyền thông tin trực tiếp giữa các
bộ xử lý với nhau được đảm bảo nhờ mạng liên kết truyền
thông IPCN (Interprocessor-Communication Network) thay
vì phải thông qua bộ nhớ chia sẻ.
Nguyễn Trung Đồng Tel. 0983 410 866 69
Hệ Vi xử lý tiên tiến
70
Đặc trưng của mạng: Mỗi một mạng được nêu trên có
thể được hiện thực hoá theo nhiều phương pháp. Thông
Ngoại vi bao gồm:
- Các ổ đĩa
- Băng từ
- Máy in
- Thiết bị đầu cuối
Các từ viết tắt: IPMN mạng kết nối các mô đun nhớ với các bộ Vi xử lý
PION Mạng kết nối các bộ Vi xử lý với các thiết bị ngoại vi
IPCN Mạng kết nối các bộ Vi xử lý Pi Bộ Vi xử lý thứ i
Ci Bộ nhớ cache thứ i (của Pi) SM Mô đun nhớ chia sẻ
LM Các mô đun nhớ cục bộ
Hình III.1. Cấu trúc kết nối hệ thống đa xử lý song song tổng
quát với các mô đun nhớ cục bộ, cache riêng, các mô đun
nhớ chia sẻ, thiết bị ngoại vi chia sẻ
Bộ nhớ chia sẻ
Thiết
bị
ngoại
vi
chia
sẻ
S
SM2 S
SMm
IPMN
SM1
IPMN
Cn
Pn LM
Cn
Pn LM
IPCN
PION
Nguyễn Trung Đồng Tel. 0983 410 866 71
thường, chúng được chọn theo tôpô mạng, thep phương thức
định thời, phương pháp chuyển mạch và chiến lược điều
khiển. Định thời, chuyển mạch và điều khiển là ba đặc trưng
chức năng chính của một mạng liên kết. Điều khiển định
thời có thể là đồng bộ hoặc dị bộ. Mạng đồng bộ được điều
khiển bằng xung nhịp toàn cục để đồng bộ hoạt động của
toàn mạng. Mạng không đồng bộ sử dụng cơ chế bắt tay
(Handshaking) hoặc cơ chế liên động (Interlocking
Mechanisms) để điều phối đối với các thành phần có tốc độ
thu phát thông tin nhanh chậm khác nhau trên cùng một
mạng.
Mạng có thể chuyển dữ liệu sử dụng mạch chuyển
(Circuit Swiching) hoặc gói chuyển (Packet switching). Ở
phương thức dùng mạch chuyển, khi một thiết bị được cấp
đường truyền trên mạng, thiết bị chiếm đường truyền trong
một khoảng thời gian nhất định cho việc truyền dữ liệu. Còn
trong phương thức gói chuyển, thông tin được phân thành
từng gói nhỏ và chia nhau đường truyền trên mạng.
Điều khiển mạng được phân thành 2 loại: tập trung
(Centralized) hoặc phân tán (Distributed). Ở phương thức
điều khiển tập trung, bộ điều khiển toàn cục tiếp nhận các
yêu cầu từ tất cả các thành phần gắn kết trên mạng và phân
phối việc truy cập mạng cho một hoặc một số yêu cầu. Còn
ở phương thức điều khiển phân tán các yêu cầu được tiếp
nhận độc lập nhờ các thiết bị cục bộ.
III.1.1. Hệ thống BUS phân cấp
Hệ thống BUS bao gồm hệ phân cấp các BUS kết nối
các hệ thống và các thành phần trong một máy tính. Mỗi
một BUS bao gồm một số các đường dây tín hiệu, đường
Hệ Vi xử lý tiên tiến
72
dây điều khiển và cấp nguồn nuôi. Các BUS khác nhau thực
hiện các chức năng kết nối khác nhau. Hình III.2 thể hiện
các BUS ở các mức khác nhau, bao gồm BUS cục bộ trên
vỉ, BUS trên bo mạch chủ, BUS Vào/Ra v.v
BUS cục bộ (Local BUS) thông thường được thực hiện
bằng các đường mạch in trên vỉ chức năng. Trên bo mạch
CPU, BUS cục bộ làm chức năng kết nối truyền thông tin
giữa các phần tử chính (chip) được gắn trên bo. Vỉ nhớ sử
dụng BUS nhớ (Memory BUS) để kết nối bộ nhớ với giao
diện logic. Vỉ Vào/Ra hay vỉ giao diện mạng sử dụng BUS
dữ liệu. Các BUS này bao gồm các đường dây tín hiệu và
đường dây chức năng tiện dụng. Với phương thức chia sẻ
chức năng và tín hiệu trên đường dây, có những đường dây
truyền dẫn các tín hiệu khác nhau theo chia sẻ thời gian.
BUS bo mạch chủ (Backplane BUS) chính là mạch
in có khả năng kết nối thông qua các khối kết nối
(connector) để sử dụng cho việc cắm các vỉ chức năng. BUS
hệ thống, bao gồm các dường dây tín hiệu chia sẻ và các
đường dây đa dụng được thực hiện bằng kết nối mạch in.
BUS hệ thống làm chức năng kết nối tất cả các vỉ chức năng
trong máy tính.
Các BUS này có chuẩn chung và đã được phát triển, sử
dụng nhiều như BUS VME (theo chuẩn IEEE Standard
1014-1987), MultiBus II (IEEE Standard 1296-1987) và
FutureBus+ (IEEE Standard 896.1-1991).
Bo
Bo mạch CPU
Ngoại vi cục bộ
(BUS SCSI)
Bo mạch nhớ
CPU IOC Các ô nhớ LM
Nguyễn Trung Đồng Tel. 0983 410 866 73
BUS Vào/Ra (I/O BUS) kết nối các thiết bị Vào/Ra với
hệ thống máy tính.
Hệ Vi xử lý tiên tiến
74
Có thể kể ra BUS giao diện hệ thống máy tính nhỏ
SCSI (Sma
Các file đính kèm theo tài liệu này:
- giao_trinh_he_thong_vi_xu_ly_tien_tien_nguyen_trung_dong.pdf