MỤC LỤC
LỜI NÓI ĐẦU.2
A.PHẦN LÝ THUYẾT.4
I. CÁC KHÁI NIỆM CƠ BẢN VÀ
KIẾN THỨC CHUNG VỀ HỆ TIN HỌC PHÂN TÁN.4
I.1. Khái niệm.4
I.2. Ưu điểm và hạn chế của hệ phân.4
I.3. Vấn đề về trỏ thông tin.5
I.4. Vấn đề hệ thống nhiều bản sao.6
II. SỰ GẮN BÓ THÔNG TIN TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN.6
II.1 Các điều kiện giả định và thực tế.6 II.2 Tác động và giao dịch.7
II.3 Triển khai giao dịch tôn trọng sự gắn bó.8
II.4 Quản lý gắn bó các giao dịch.9
III. CÁC THUẬT TOÁN ĐẢM BẢO SỰ GẮN BÓ DỮ LIỆU
TRONG CÁC CƠ SỞ DỮ LIỆU PHÂN TÁN.10
III.1 Thuật toán cung cấp.10 III.2 Kiểu sắp xếp đóng dấu.10
III.2.1 Nguyên lý.11 III.2.2 Triển khai hệ số ổn định.11
III.2.3. Các hành vi ngoài chế độ bình thường.11
III.3. Thuật toán đảm bảo sự gắn bó yếu nhờ bộ tuần tự tuần hoàn.11
III.3.1 Nguyên lý.11 III.3.2 Triển khai hệ số ổn định.12
III.3.3. Các hành vi ngoài chế độ bình thường.12
III.4. Thuật toán đảm bảo sự gắn bó mạnh.12
III.4.1 Nguyên lý.12 III.4.2 Triển khai hệ số ổn định.13
III.4.3 Các hành vi ngoài chế độ bình thường.13
III.4 4 Phân tán biểu hiện trạng thái và chức năng cung cấp.14
B.PHẦN BÀI TẬP.16
I. ĐẶT VẤN ĐỀ .16
I.1 Giới thiệu bài toán .16
I.2 Cơ sở lý thuyết để giải quyết bài toán . .16
II. GIẢI QUYẾT VẤN ĐỀ. .19
II.1 Các trạng thái khác nhau cần xem sét cho mỗi bản sao. .19
II.2 Sơ đồ hoạt động của thuật toán . .20
II.3 Đánh giá hàm của số lượng bản sao, số lượng thông điệp
cần thiết để thực hiện một cập nhật .21
II.4 Xử lý sự cố trên một trạm .22
C. KẾT LUẬN .24
TÀI LIỆU THAM KHẢO.25
25 trang |
Chia sẻ: netpro | Lượt xem: 2303 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Tiểu luận Lập trình mạng nâng cao, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
n tán
1) Ưu điểm
Chia xẻ tài nguyên: Chia xẻ tài nguyên trong hệ thống phân tán cung cấp một cơ chế để chia xẻ tập tin ở vị trí xa, xử lý thông tin trong một cơ sở dữ liệu phân tán, in ấn tại một vị trí xa, sử dụng những thiết bị ở xa để thực hiện các thao tác…
Tăng tốc độ tính toán: Hệ thống phân tán cho phép phân chia việc tính toán trên nhiều vị trí khác nhau để tính toán song song.
An toàn: Nếu một vị trí trong hệ thống phân tán bị hỏng, các vị trí khác vẫn tiếp tục làm việc mà không ảnh hưởng đến toàn bộ hệ thống.
Thông tin liên lạc với nhau: Có nhiều lúc, chương trình cần chuyển đổi dữ liệu từ vị trí này sang vị trí khác. Khi các vị trí được nối kết với nhau trong một hệ thống mạng, việc trao đổi dữ liệu diễn ra rất dễ.
2) Hạn chế
Giá phát triển phần mềm cao: Do các khó khăn khi cài đặt một hệ thống phân tán, giá thành sẽ tăng lên.
Dễ mắc lỗi hơn: Vì các trạm trong hệ phân tán làm việc song song, khó có thể đảm bảo thuật toán được thực hiện đúng trên tất cả các trạm. Do vậy mà số lỗi sẽ tăng lên.
Khối lượng các xử lý tăng: Hệ thống phân tán cần truyền nhiều thông báo, nhiều tính toán phụ. Do vậy khối lượng xử lý tăng lên so với hệ thống tập trung.
I.3 Vấn đề trỏ thông tin
Trong hệ phân tán, thời hạn truyền một thông điệp là hiệu số giữa thời điểm nhận và thời điểm truyền. Ta giả sử rằng, thời hạn đó đủ lớn so sánh với hệ tập trung, là địa lượng biến thiên và ở cặp máy này khác với ở cặp máy khác. Từ đó ta có hai hệ quả sau đây:
1) Ở một thời điểm cho trước, một bộ xử lý đang thực hiện trên một máy chỉ có thể biết được trạng thái gần đúng của các máy khác.
2) Trật tự nhận các thông điệp trên các máy nhận có thể không giống trật tự phát của chính các thông điệp đó.
Các máy trên mạng có thể bị sự cố và các thông điệp có thể bị mất. Giải pháp cho vấn đề này là máy phát đánh số thứ tự tất cả các gói thông tin gửi đi kèm theo các số đó cho máy nhận. Nếu máy phát không đánh số thì máy nhận sẽ không xác đinh được thứ tự các gói tin. Ta có hệ quả ba là:
3) Hai máy giống nhau chứa thông tin hoàn toàn giống nhau lại không bao giờ giống nhau về mặt trạng thái.
Từ những vấn đề nêu trên, ta rút ra các đặc tính tổng quát của hệ phân tán:
i) Thời gian truyền thông điệp là một biến với giá trị khác nhau, giá trị này có thể rất lớn.
ii) Tần suất xuất hiện các sự cố trong khi vận hành mạng lớn.
iii) Việc truy cập tài nguyên, kích hoạt các tiến trình trong mạng không thể thực hiện bởi một thiết bị duy nhất, mà chức năng này phải được phân tán trên nhiều máy trên mạng.
I.4 Vấn đề hệ thống nhiều bản sao
Trong hệ phân tán, quá trình tổ chức, vận hành các hệ thống cho phép đăng ký từ xa, từng hệ thống cục bộ đều có lưu trữ một bản sao của tất cả các thông tin liên quan đang có ở tất cả các hệ thống cục bộ.
Ưu điểm nổi bật của kiểu tổ chức này là:
i) Dễ dàng thực hiện việc truy cập thông tin cần thiết cho các yêu cầu ngay tại hệ thống cục bộ của mình
ii) Cho kết quả truy cập một cách nhanh chóng.
Tuy nhiên, chỉ cho kết qủa tương đối chính xác và phụ thuộc rất nhiều vào phương pháp và thời hạn cập nhật thông tin trong các CSDL cục bộ.
Sự tồn tại nhiều bản sao trong một hệ phân tán trên nhiều hệ thống cục bộ khác nhau có thể dẫn đến các hệ quả sau đây:
i) Cập nhật thông tin diễn ra do đăng ký gần hay từ xa hoặc sự thay đổi thông tin cục bộ trên một hệ cục bộ nào đó cần phải được tiến hành cho tất cả các hệ thống cục bộ và không được phép bỏ sót hệ thống nào cả. trong khoản thời gian làm tươi, thông tin phải đảm bảo sao cho việc truy vẩn dữ liệu cho kết quả kịp thời hay đặt truy vấn trong trạng thái treo.
ii) Cần phải tránh trường hợp các thao tác trên hai bản sao khác nhau nhưng chứa cùng một thông tin được truy cập bởi hai hay nhiều yêu cầu dẫn đến không gắn bó.
Hai vấn đề vừa nêu trên xác định về các ràng buộc đối với vấn đề gắn bó dữ liệu. Để đảm bảo sự gắn bó này điều kiện đủ là phải bắt buộc tuân thủ trình tự nào đó cho các bản sao, các cập nhật thông tin.
Biện pháp hàng đầu nhằm thực hiện việc loại trừ tương hỗ tổng quát trên tập hợp các bản sao khi đăng ký và thực hiện việc đăng ký trước khi trả lại bình thường. Biện pháp này có mặt hạn chế là không cho phép các chương trình đăng ký thực hiện song song. Tất cả các bản sao đều được khoá chặt trong lúc đăng ký.
II. SỰ GẮN BÓ THÔNG TIN TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN
II.1 Các điều kiện giả định và thực tế
Ta có một tập thông tin nào đó có thể được truy cập bởi một tập các tiến trình. Số lượng các thông tin có thể truy cập được và các tiến trình có nhu cầu thông tin là con số cố định. Hệ này phát triển rời rạc theo thời gian giữa các điểm quan sát, ta có thể nhận biết được trạng thái thực của chúng, có nghĩa là các đối tượng và ngữ cảnh thực hiện các tiến trình, hệ kiểu như vậy hoạt động với độ ổn định tuyệt vời.
Các điều kiện giả định này so với hệ thực tế có những điểm khác nhau cơ bản sau đây:
STT
So sánh
1
- Các đối tượng và các tiến trình có thể
- Được tạo lập và huỷ bỏ có tính chất động trong suốt quá trình tồn tại của hệ.
2
- Các đối tượng và các tiến trình có thể được phân tán trên các trạm khác nhau liên hệ với nhau qua hệ thống viễn thông. Do vậy, ta không thể xác định trạng thái thời điểm của hệ vì lí do độ trễ đường truyền giữa các trạm và tính không tương thích giữa các điểm quan sát trong trạm đó.
3
- Hệ thống viễn thông và các tiến trình là các đối tượng có thể xảy ra sự cố kỹ thuật.
II.2 Tác động và giao dịch
Các đối tượng khác nhau của hệ không phải là các đối tượng độc lập nhau, chúng quan hệ với nhau bởi tập hợp các quan hệ gọi là các ràng buộc toàn vẹn. Các ràng buộc này thể hiện sâu sắc các đặc tính riêng biệt của hệ.
Trạng thái của hệ thoả mãn một tập các ràng buộc toàn vẹn gọi là trạng thái gắn bó.
Các nhà thiết kế và vận hành hệ mong muốn rằng việc thực hiện các tiến trình phải duy trì cho được hệ trong trạng thái gắn bó. Để chính xác hoá đặc tính này, cần phải lưu ý là trạng thái của hệ chỉ được xác định ở mức quan sát cho trước.
Ta quan tâm đến hai mức quan sát:
STT
Mức
Giải thích
1
NSD
- Tiến trình là một dãy thực hiện các giao dịch Giao dịch đó là chương trình duy nhất được thực hiện từ một trạng thái gắn bó dẫn hệ đến một trạng thái gắn bó khác.
2
Hệ thống
- Mỗi giao dịch được cấu tạo từ nột dãy các tác động được thể hiện như sau. Nếu 2 tác động A và B thuộc hai giao dịch khác nhau được thực hiện bởi hai tiến trình thì hiệu ứng tổng quát của chúng sẽ là hiệu ứng của dãy (A;B) hoặc là (B;A)
Cho một tập hợp giao dịch M={T1,T2…,Tn} lần lượt được thực hiện bởi các tiến trình độc lập p1,p2…,pn. việc thực hiện tuần tự có nghĩa là thực hiện tất cả các giao dịch của M theo kiểu nối đuôi nhau và tuân thủ một trật tự nào đó. Sự gắn bó của hệ được bảo toàn.
Ở mức hệ thống, ta có thể nói rằng các tác động là phần tử nhỏ nhất không thể chia cắt được nữa. Nếu vì lý do hiệu quả, nhiều giao dịch được thực hiện song song thì sự gắn bó không còn đảm bảo được nữa. Một yêu cầu khác nữa rất quan trọng là trong quá trình thực hiện hệ phải đảm bảo cho các tác động không bị ngắt quãng.
II.3 Triển khai giao dịch tôn trọng sự gắn bó
Cho một tập hợp giao dịch M={T1,T2…,Tn}. Một trật tự hóa của tập hợp các tác động thành phần sẽ tương ứng với việc thực hiện hoàn toàn các giao dịch. Việc thu được một trật tự hóa gắn bó chỉ có thể thành công khi áp dụng các ràng buộc trên trật tự thực hiện các tác động. Nguyên lý của phương pháp là ở chỗ làm chậm một tác động nào đó cho đến thời điểm mà sự thực hiện của nó không còn có nguy cơ phá hủy sự gắn bó của trật tự hóa.
Để đảm bảo các giao dịch trên tôn trọng sự gắn bó thông tin thì người ta đưa ra các phương pháp, cơ chế để đảm bảo khi giao dịch vẫn có sự gắn bó thông tin toàn vẹn dữ liệu trên cơ sở dữ liệu phân tán là:
Cơ chế then cài.
Then cài loại trừ tương hỗ.
Then cài lựa chọn đối tượng.
Giao dịch hai pha.
Bây giờ ta tưởng tượng rằng các đối tượng được phân tán trên nhiều trạm khác nhau và được nối với nhau thông qua hệ thống viễn thông và các tiến trình diễn ra trên các trạm khác nhau. Hệ thống viễn thông cho phép các tiến trình trên các trạm khác nhau có thể trao đổi các thông điệp với nhau. Ta giả định rằng các tiến trình và các phương tiện truyền thông là các đối tượng có thể rơi vào sự cố. Một hệ quản lý tập hợp thông tin phân tán bao gồm:
STT
Cơ chế
1
- Cơ chế cho phép sắp xếp một cách tổng quát các tác động của cùng một giao dịch, ngay cả khi các tác động này diễn ra trên các trạm khác nhau.
2
- Cơ chế điều khiển các tranh chấp truy cập cục bộ vào các đối tượng đảm bảo tôn trọng tính toàn vẹn của các đối tượng truy cập cục bộ này.
3
- Cơ chế có khả năng xử lý các bế tắc và thiếu thốn vô hạn, hậu quả của việc hủy bỏ các giao dịch.
4
- Cơ chế phục hồi các giao dịch đã hủy bỏ hay xử lý các sự cố.
Cơ chế xử lý sự cố
STT
Phải thực hiện
1
Giao dịch T bắt buộc phải thực hiện một cách trọn vẹn
2
Nếu có sự cố xảy ra thì phải quay lại điểm xuất phát.
Muốn thực hiện những điều vừa nêu ở trên, người ta đòi hỏi giao dịch phải có các đặc tính toàn vẹn như sau:
STT
Phải thực hiện
1
- Nếu một tiến trình bị sự cố trước khi kết thúc T nhưng lại sau các thao tác thay đổi cần thiết của T, trạng thái của hệ là gắn bó.
2
- Nếu một tiến trình bị sự cố trước khi diễn ra các thay đổi của T, trạng thái của hệ là gắn bó.
3
- Nếu một tiến trình bị sự cố giữa các thay đổi của T, trạng thái của hệ là không gắn bó.
Nếu dữ liệu được phân tán trên nhiều server, để bảo đảm dữ liệu sẽ được ghi lên đúng đắn lên mọi cơ sở dữ liệu, đòi hỏi phải có các cơ chế bảo vệ dữ liệu. Ví dụ như việc cập nhật bảng cân đối tài khoản khách hàng ở ba cơ sở dữ liệu khác nhau. Nếu có sự cố kết nối xảy ra trong thời gian ghi giao dịch, cơ sở dữ liệu sẽ mất tính đồng bộ. Xử lý giao dịch khắc phục tình trạng này bằng cách giám sát những thay đổi tác động lên các cơ sở dữ liệu liên quan nhằm bảo đảm toàn vẹn dữ liệu một khi có sự cố.
II.4 Quản lý gắn bó các giao dịch
Bây giờ ta hãy xem xét một hệ, trong đó các đối tượng được phân tán trên nhiều trạm, không có bản sao mỗi đối tượng chỉ tồn tại có một bản duy nhất. Một giao dịch Tj có thể tham chiếu đến các đối tượng nằm trên các trạm khác nhau và do vậy gồm nhiều tác động thực hiện trên nhiều trạm. Như vậy ta phải xác định trên một trạm Si một tiến trình Pji với nhiệm vụ thực hiện các tác động giao dịch Tj trên Si, các tác động được thực hiện trên các trạm khác nhau có thể tiến hành theo kiểu song song.
Các phương pháp để quản lý gắn bó các giao dịch như: Phương pháp dự phòng để chống bế tắc, phương pháp dựa vào việc hạn chế các khả năng diễn ra bằng cách phát hiện bế tắc có tính chất động, điều đó dẫn đến hủy bỏ các giao dịch.
III. CÁC THUẬT TOÁN ĐẢM BẢO SỰ GẮN BÓ DỮ LIỆU TRONG CÁC CƠ SỞ DỮ LIỆU PHÂN TÁN
III.1 Thuật toán cung cấp:
Vì sự ổn định và hiệu quả mà ta phải phân tán chức năng cung cấp trên nhiều trạm khác nhau. Sự hoạt động gắng bó với nhau giữa các chương trình cung cấp là rất cần thiết để bảo đảm cho hoạt động cung cấp được hoàn toàn chính xác.
Một sự hoạt động gắn bó dữ liệu của các chương trình cung cấp phân tán quản lý trên cùng một tập hợp các tài nguyên chỉ đạt được nếu tuân thủ các nguyên tắc sau:
i) Các bộ cung cấp bắt buộc phải thực hiện cùng một giải thuật
ii) Các bộ cung cấp đều nhận tất cả các thông điệp phát đi từ các tiến trình
iii) Các thông điệp phải được xử lý cùng một trật tự như nhau trong các chương trình cung cấp. Trật tự duy nhất trên tập hợp các thông điệp của hệ, và trật tự được thực hiện thông qua việt hợp lực giữa các tiến trình cung cấp hay tiến trình
phát thông điệp
III.2 Sắp xếp kiểu đóng dấu
Trạm phát được gắn một giá trị gọi là dấu. Giá trị này có tính chất thời điểm cho trạm phát thông tin và dựa vào đồng hồ Logíc cục bộ của chính trạm.
III.2.1 Nguyên lý:
Tập hợp tất cả các yêu cầu cập nhật được sắp xếp theo cùng một kiểu trên tất cả các trạm nhờ cơ chế dấu. Theo đó mỗi một yêu cầu được phát đi cho tập hợp các trạm, trên mỗi trạm tồn tại một tiến trình server đảm nhận nhiệm vụ tiếp nhận các yêu cầu theo một trật tự về dấu. Điều đó cho phép có một sự gắn bó yếu giữa các bản sao.
III.2.2. Triển khi hệ số ổn định:
Các giao dịch cần xét ở đây là các khả năng đọc, ghi hay cập nhật. Cập nhật được xác định như một dãy các thao tác đọc rồi ghi, thao tác kiểm tra - đọc tức thì trạng thái hiện hành của bản sao.
Mỗi một server tiếp nhận các yêu cầu ghi đến các trạm cục bộ ở thời điểm cho trước. nó tiếp nhận các yêu cầu và tính toán trên cơ sở dấu theo tiêu chí lâu nhất. Điều đó dẫn đến chúng ta cần phải chú ý ở hai trường hợp:
Trường hợp 1: Tập hợp các yêu cầu ghi khi chờ chứa các yêu cầu từ tất cả các trạm khác. Trong trường hợp này các yêu cầu đi qua, nếu chúng tồn tại, là mới hơn so với các yêu cầu đã đi qua. Nói cách khác, yêu cầu lâu nhất chính là yêu cầu đang chờ.
Trường hợp 2: Tồn tại các trạm mà không có bất kỳ yêu cầu nào được truyền đến. Ta giải quyết bằng cách truyền cho tất cả các trạm một thông điệp yêu cầu và bắt buộc phải xác nhận. Do vậy, sau một khoảng thời gian theo giả thiết về độ ổn định ta sẽ xác nhận: hoặc là các yêu cầu đi qua, hoặc là trả lời các thông điệp yêu cầu. Lúc này, ta nói được các thông điệp đến từ tất cả các trạm.
III.2.3. Các hành vi bên ngoài chế độ bình thường:
Có hai vấn đề mở rộng hơn đối với thuật toán này là cho phép rút ra hay chèn vào tuỳ ý một trạm nào đó. Điều đó, dẫn đến hai vấn đề sau chúng ta cần phải tôn trọng:
Vấn đề 1: Việc đột nhiên biến mất một trạm nào đó pahỉ được các trạm khác nhận biết một cách tự động.
Vấn đề 2: Việc phát đi một thông điệp là phép toán không thể chia cắt đi được nữa. Đó là một thông điệp hoặc là tất cả các trạm đều phải nhận được hoặc là không một trạm nào nhận được cả.
Vì vậy, nếu điều kiện đầu tiên được khống chế thì điều kiện thứ hai mới được đảm bảo.
III.3. Thuật toán đảm bảo sự gắn bó yếu nhờ bộ tuần tự tuần hoàn:
III.3.1. Nguyên lý:
Trước khi phát một yêu cầu một trạm nào đó cần phải kết hợp với nó một số thứ tự được cấp từ bộ tuần tự tuần hoàn. Các yêu cầu được tiếp nhận tại mỗ trạm theo cùng một trật tự thống nhất. Điều đó giúp ta có được một sự gắn bó yếu. Điều chúng ta cần quan tâm ở đây là cơ chế phân phối các số dựa trên nền tảng tổ chức các trạm theo kiểu vòng tròn ảo.
III.3.2. Triển khai hệ số ổn định:
Bộ tuần tự cung cấp cho mỗi yêu cầu số sắp tới còn chưa dùng, giả sử dó là T. Khi đến phiên của trạm nhận bộ tuần tự, nó yêu cầu một số lượng n số đúng bằng số lượng các yêu cầu cập nhật đang chờ trên trạm này. Các số này là:
T, T + 1, T + 2, ….T + n – 1
Nó tiếp tục chuyển bộ tuần tự cho trạm kế tiếp liền sau nó và số sắp tới chưa dùng đến T + n.
Khi một trạm đã có sự cố, nó phát yêu cầu cập nhật cùng vơi số này. Trên mỗi trạm, các cập nhật được thực hiện bằng cách tiếp nhận các yêu cầu cùng các số liên tiếp nhau( theo một trật tự). Để xác định yêu cầu sắp đến cần phải xử lý , mỗi một trạm duy trì một biến số V được phối hợp với yêu cầu xử lý cuối cùng. Các yêu cầu mang các số lớn hơn V + 1 được lưu trữ trong khi chờ xử lý yêu cầu V + 1.
III.3.3. Các hành vi ngoài chế độ bình thường:
Hiện tại. người ta đã chế tạo thành công và đưa vào sử dụng một cách ổn đọnh trong mạng một số giao thức cho phép tái sinh bộ tuần tự khi bộ này bị mất và đặt cấu hình vòng tròn ảo trở lại theo kiểu tự động.
Các giao thức hoạt động trong điều kiện giả định là mạng viễn thông cho phép phát hiện các sự cố của một trạm và cần phải được bổ khuyết một cách đầy đủ nhằm duy trì trật tự toàn phần cần thiết cho việc gắn bó:
Vấn đề 1: Việc tái sinh bộ tuần tự cần phải tiến hành song song với việc tính toán số sắp có để dùng.
Vấn đề 2: Khi phát hiện có một trạm bị sự cố, ta cần phải xác định các số mà trạm này đã lấy và các số còn chưa sử dụng, rồi gửi các yêu cầu có mang các số này
Vấn đề 3: Việc cho một trạm hội nhập vào lại trong vòng tròn cần phải tiến hành song song với việc cập nhật lại các bản sao của nó.
Sử dụng các số liên tục cho phép tránh được hiện tượng một vài cập nhật bị mất và các lần mất mà không được phát hiện. Việc triển khai bộ tuần tự tuần hoàn cũng làm cho ta gặp phải một số khó khăn khác.
III.3.4. Thuật toán đảm bảo sự gắn bó mạnh:
III.3.4.1. Nguyên lý:
Tập hợp bao gồm các trạm được tổ chức theo kiểu vòng tròn ảo. các cập nhật được thực hiện theo hai thì:
1. Thống nhất giữa các trạm.
2. Thực hiện cập nhật.
Do vậy, thuật toán này đảm bảo sự gắn bó mạnh. Nếu có nhiều yêu cầu cập nhật diễn ra đồng thời thì ta phải có quy tắc để quyết định yêu cầu nào được tiếp nhận và thỏa mãn. Nhằm phục vụ cho ý tưởng đó, ta thường hay sử dụng dấu phối hợp cho mỗi cập nhật và ta xử lý yêu cầu có thời gian lâu nhất.
III.3.4.2. Triển khai hệ số ổn định:
Trạng thái có thể cảu mỗi trạm là:
STT
Trạng thái
Giải thích
1
Nghỉ ngơi
Trạm không thực hiện cập nhật nào cả
2
Hoạt động
Trạm đãnhận một yêu cầu cập nhật cục bộ mà yêu cầu này đã được truyền cho trạm khác để kiểm tra.
3
Thụ động
Trạm đồng ý cho một cập nhật và chờ trật tự tương ứng.
4
Cập nhật
Trạng đang trong tình trạng chuyển của cập nhật , trong khi đó tất cả các yêu cầu khác truyền đến đều được lưu trữ. Chúng sẽ được xử lý khi quay về một trong các trạng thái khác.
Lúc khởi sự, tất cả các trạm đều ở trong trạng thái nghỉ ngơi.
Trạm khởi sự việc cập nhật , đầu tiên cần phải gửi một yêu cầu cho phép cập nhật, nó chỉ làm được việc đó trong trạng thái nghỉ ngơi. Lúc này nó được nhận dấu và được gửi vào vòng tròn trạm khởi sự chuyển từ trạng thái nghỉ ngơi sang trạng thái hoạt động.
Nếu chỉ có một yêu cầu duy nhất được đưa vào vòng tròn, nó đi qua tất cả các trạm để chuyển các trạm từ nghỉ ngơi sang thụ động. khi đó, nó trở về nơi khởi sự thì việc thống nhất coi như hoàn tất. việc cập nhật nói riêng lúc này được gửi đi và mỗi trạm sau khi thực hiện trở về trạng thái nghỉ ngơi.
Nếu có nhiều yêu cầu đưa ra đồng thời trong vòng tròn, thì tình hình đó dễ dàng diễn ra xung đột. lúc này, ta phải chọn một yêu cầu có thời gian dấu lâu nhất. Để tiến hành công việc đó, ta nêu bật vai trò của bộ chắn đường cho các trạm khởi sự. Một trạm nào đó trong trạng thái nghỉ ngơi hay thụ động phải chuyển toàn bộ yêu cầu đã đến nó, một trạm trong trạng thái hoạt động chỉ phải chuyển các yêu cầu có thời gian lâu hơn các yêu cầu mà chính nó phát đi, các yêu cầu khác đều bị dừng lại và được lưu trữ.
Các yêu cầu bị lưu trữ lại sẽ được gửi tiếp vào vòng tròn, khi trạm lưu trữ chúng hoàn thành công việc cập nhật riêng của mình.
III.3.4.3. Hành vi ngoài chế độ bình thường:
Các giao thức đặt lại cấu hình vòng tròn theo kiểu tự động được sử dụng nhằm rút ra hay cho vào tùy ý một số trạm nhất định. Các sự cố kỹ thuật là rất khó khăn phát hiện các chiến lược mà ở dó các yêu cầu không được ghi lại khắp nơi trong mạng.
III.4 Phân tán biểu hiện trạng thái và chức năng cung cấp
Phân tán biểu hiện trạng thái và chức năng cung cấp, có các giải pháp có thể:
i) Duy trì tại mỗi trạm một bản sao trạng thái tài nguyên tổng quát
ii) Phân tán biểu hiện trang thái trên các trạm, mỗi một trạm chỉ có trạng thái các tài nguyên cục bộ của mình. Các quyết định được đưa ra trên các trạm khác nhau cần phải được phối hợp theo kiểu sao cho dữ liệu của việc cung cấp phải được gắn bó với nhau
iii) Nhóm sắp xếp nhằm bảo đảm cho tất cả các yêu cầu tài nguyên xuất phát từ các tiến trình đến được các bộ cung cấp khác nhau theo một trật tự duy nhất được cố định từ trước.
Nội dung của các bản sao trên các trạm của hệ có thể phản ảnh như sau:
- Tập hợp tất cả các tài nguyên còn chưa được cung cấp
- Tập hợp các tài nguyên đã cung cấp
- Đối tượng đang chiếm giữ tài nguyên
- Kiểu sử dụng
- Tập hợp các yêu cầu không được thỏa mãn
- Tập hợp các thông điệp dành cho trường hợp đã được sử dụng
- Tập hợp các thông điệp dành cho trường hợp thất bại
Ngày nay, trong các ứng dụng lớn như thương mại điện tử, giáo dục điện tử,…, bản sao dữ liệu được sử dụng để tăng tính sẵn sàng của dữ liệu. Tuy nhiên, lợi ích sẵn sàng của dữ liệu này chỉ có được khi phải trả giá bằng những thuật toán phức tạp để ẩn đi tính phức tạp trong việc bảo trì nhiều bản sao của đối tượng. Sự khó khăn nằm ở việc phải đảm bảo gắn bó cho các bản sao của đối tượng để tránh bế tắc khi vận hành hệ thống.
Các thuật toán giải quyết những vấn đề này được gọi là các thuật toán điều khiển bản sao.
Việc quản lý nhiều bản sao của cùng một đối tượng thông tin đang được các nhà chuyên môn tin học quan tâm nghiên cứu ngay trong giai đoạn phân tích, thiết kế và xây dựng hệ điều hành. Ngoài ra, đây còn là một trong những vấn đề có tính chất cơ sở cho các ứng dụng phức tạp.
Quản lý nhiều bản sao là giải pháp kỹ thuật bao gồm tập hợp các thông tin được nhân bản từ một đối tượng thông tin và các chương trình quản lý chúng trong môi trường phân tán.
Vấn đề truy cập và xử lý thông tin phân tán nói chung, quản lý nhiều bản sao nói riêng được nghiên cứu trong hàng loạt các công trình của Herman, Ellis, Wilms và Le Lann.
Nội dung quản lý nhiều bản sao là các giải pháp cho phép tự động hóa các công việc:
Kiểm tra tính hợp lệ của việc truy cập thông tin
Khôi phục thông tin
Cập nhật thông tin
An toàn dữ liệu cho các bản sao
Sử dụng các bộ nhớ, đĩa
Chuyển các bản loại bỏ vào vùng có thể khôi phục
Trong các nội dung nêu trên, vấn đề quan trọng nhất là cập nhật tự động thông tin vào các bản sao./.
B. BÀI TẬP
I. ĐẶT VẤN ĐỀ
I.1 Giới thiệu bài toán
Trong một hệ thống phân tán giả định có độ ổn định tuyệt vời, ta muốn duy trì một sự gắn bó mạnh giữa các bản sao của một đối tượng được định vị trên các trạm khác nhau.
Thuật toán dựa trên các nguyên lý sau đây:
Trước khi thực hiện cập nhật, một trạm nào đó cần phải yêu cầu và thống nhất với các trạm khác.
Khi đã có được sự thống nhất, thì trạm này tiến hành công việc cập nhật; điều này phải tiến hành trên tất cả các bản sao; đối tượng không thể truy cập chừng nào các bản sao còn chưa cập nhật hết.
Các xung đột giữa các trạm được giải quyết bằng một trật tự có hệ số ưu tiên giữa các trạm, được cố định một lần lúc khởi sự cho toàn bộ.
Hỏi có bao nhiêu trạng thái khác nhau cần xem xét cho mỗi bản sao.
Hãy trình bày sơ đồ hoạt động của thuật toán (đồ thị phát triển).
Hãy đánh giá bằng hàm của số lượng bản sao, số lượng các thông điệp cần thiết để thực hiện một thông điệp.
Ta phải sửa đổi thuật toán như thế nào để chịu đựng được sự cố trên một trạm (giả sử hệ viễn thông hoạt động tốt).
I.2 Cơ sở lý thuyết để giải quyết bài toán
Khi nghiên cứu về hệ phân tán chúng ta thấy rằng, thời gian truy cập trung bình vào thông tin trong hệ phân tán có thể được rút ngắn, trong một số trường hợp, nhờ vào phương pháp nhân nhiều bản và được gọi là nhiều bản sao của một đối tượng thông tin.
Ta cần phân biệt hai trường hợp khác nhau được thể hiện sau đây:
- Trường hợp 1:
Bộ nhớ cục bộ (e)
Bộ xử lý
a) Đa xử lý với bộ nhớ chung:
Bộ nhớ chung (e)
Hình 6. Đa xử lý với bộ nhớ chung
Mỗi một bộ xử lý đều có bộ nhớ cục bộ của mình, hay còn gọi là cache, được dùng để sao chép lại các vùng đang làm việc của bộ nhớ chung. Một chương trình thể hiện thuật toán thay thế đảm nhận nhiệm vụ làm mới các bộ nhớ cục bộ. Trường hợp có nhiều bộ xử lý muốn truy cập vào cùng một đối tượng, ta sử dụng như là sự tham chiếu đến phiên bản của đối tượng tìm thấy trong bộ nhớ chung.
Bộ xử lý
Bộ nhớ cục bộ (e)
Bộ nhớ chung (e)
Hệ thống viễn thông
Máy client
Máy server
b) Hệ truy cập từ xa thông qua một máy server duy nhất:
Hình 7. Hệ truy cập từ xa thông qua máy server
Trong trường hợp này, một đối tượng được đưa vào trên một trạm xác định và được quản lý bởi một server cục bộ trên trạm này. Khi một tiến trình ở xa muốn sử dụng đối tượng, nó phải bắt đầu bằng yêu cầu server cho một bản sao thông qua hệ thống viễn thông. Sau khi sử dụng xong, tiến trình phải gửi lại cho server một phiên bản đã được sửa đổi của đối tượng.
Các trường hợp thể hiện trong hình 2.1 và 2.2 xét theo chức năng là giống nhau. Đó là trường hợp một bản duy nhất của đối tượng là một đặc quyền.
- Trường hợp 2:
Hệ thống viễn thông
Tính cân đối giữa các người sử dụng tài nguyên thông tin của mạng.
Hình 8. Hệ thống đối xứng
Tại đây, tất cả các bản đóng vai trò đối xứng. Công việc được tiến hành theo kiểu này cho phép rút ngắn thời gian truy cập, nếu số lần truy cập để đọc lớn hơn số lần truy cập để cập nhật và vì lý do thuận lợi sử dụng theo nghĩa có sẵn để dùng.
Tình hình nêu trên đặt ra cho chúng ta nhiều vấn đề cần phải giải quyết. Đó chính là các lần cập nhật thông tin hay nói một cách tổng quát là cập nhật các bản sao. Từ đó, ta rút ra các đặc điểm quan trọng sau đây :
1) Khi chỉ tồn tại một bản tập trung đặc quyền, ta có thể đặt ra rằng việc thay đổi đối tượng thực hiện trên một trong các bản sao sẽ được sao lại ngay lập tức vào bản chính. Đó chính là trường hợp ghi tức thời và các cập nhập đều gắn bó. Với các phương pháp ghi khác, ngược lại, các thay đổi tương ứng của một bản sao đối tượng cục bộ chỉ được sao lại trên bản chính khi thuật toán thay thế được thực hiện nhằm cung cấp lại các bản ghi bị chiếm bởi bản sao cục b
Các file đính kèm theo tài liệu này:
- Lập trình mạng nâng cao.doc