Luận văn Truy nhập cơ sở dữ liệu trên mạng trong môi trường mạng Internet và Intranet

Việc quản trị giao tác phân tán liên quan đến ý đồ của giao tác. Một giao tác bao gồm nhiều xử lí, nhiều truy nhập dữ liệu trên nhiều cơ sở dữ liệu, nhưng giao tác là đơn vị nhỏ nhất đảm bảo được điều khiển tương tranh và khôi phục dữ liệu. Vấn đề ở đây là toàn bộ quá trình phải được coi như đơn vị. Nếu một phần giao tác bị lỗi thì kết quả phần trước của giao tác cũng bị huỷ khỏi hệ thống.

Hệ thống cơ sở dữ liệu phân tán trợ giúp quá trình khôi phục phân tán, trong đó các phần tử dữ liệu trên các vị trí vật lí khác nhau có thể được cập nhật như một phần của xử lí giao tác. Nếu một phần của giao tác bị lỗi thì bất kì cập nhật nào với phần khác của cơ sở dữ liệu cần được quay ra để khôi phục lại toàn bộ cơ sở dữ liệu phân tán về trạng thái trước khi bắt đầu giao tác.

Hệ thống cơ sở dữ liệu phân tán cũng trợ giúp điều khiển tương tranh phân tán. Hệ thống có cơ chế phù hợp, cho phép nhiều chương trình đồng thời truy nhập các phần khác nhau của cơ sở dữ liệu, và ngăn cản khoá chết khi xảy ra các phép xung đột. Xử lí giao tác phân tán nhìn chung được thực hiện với giao thức khẳng định khoá hai pha với các tiện nghi khoá dữ liệu.

 

doc62 trang | Chia sẻ: lethao | Lượt xem: 2010 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Truy nhập cơ sở dữ liệu trên mạng trong môi trường mạng Internet và Intranet, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hần mềm máy Server truyền thông. Phần mềm chạy trên máy Client có nhiều thành phần thiết bị thiết kế cho giao diện với nguồn dữ liệu cụ thể. Phần mềm trên máy Client có thành phần quản trị thiết bị; thành phần này thực hiện hai giao diện sau: Giao diện dịch vụ. Đây là API mà các thiết bị sử dụng để lập giao diện với quản trị thiết bị. Nhà phân phối phần mềm viết thiết bị cho phù hợp với giao diện dịch vụ để phần mềm cơ sở dữ liệu của họ giao tiếp được với quản trị thiết bị. Giao diện chương trình ứng dụng. Đây là API mà chương trình ứng dụng dùng để yêu cầu dịch vụ cơ sở dữ liệu. Do sự phụ thuộc vào thiết bị và quản trị thiết bị, mô hình giao diện đôi khi được gọi là mô hình thiết bị. Mô hình giao diện chuẩn có nhiều điểm tương tự như mô hình cổng. Khác nhau chính ở chỗ mô hình này phụ thuộc vào API chuẩn mà tất cả các cơ sở dữ liệu đều dùng. Người ta phát triển ứng dụng cơ sở dữ liệu muốn tham gia vào môi trường mô hình giao diện chuẩn cần phải viết chương trình theo API chuẩn hoặc sử dụng phần mềm chuyển API riêng sang API chuẩn. 2.3. Liên kết cơ sở dữ liệu mở của Microsoft Để mô hình thiết bị hữu dụng trong môi trường không đồng nhất, nhiều tổ chức đủ mạnh cần tạo và thông báo về API yêu cầu và chuẩn giao diện thiết bị. Ngoài ra số lớn người dùng và nhà cung cấp phần mềm cơ sở dữ liệu cần cam kết tham gia chuẩn này. Trên môi trường máy cá nhân, Microsoft là tổ chức như vậy. Hãng này đã xây dựng chuẩn giao diện cơ sở dữ liệu gọi là liên kết cơ sở dữ liệu mở ODBC (open database connectivity); giao diện này phù hợp với mô hình giao diện chuẩn. Một số nhà cung cấp phần mềm cơ sở dữ liệu cho thị trường máy cá nhân đã tạo thiết bị ODBC cho các bộ phần mềm của họ, và ODBC đã trở thành chuẩn truy nhập cơ sở dữ liệu phân tán được công nhận cho dịch vụ môi trường máy cá nhân. Những nhà phát triển ứng dụng lợi dụng tiếp cận ODBC cho cơ sở dữ liệu phân tán bằng cách phát triển ứng dụng cơ sở dữ liệu mà không quan tâm đến nguồn dữ liệu chuyên dụng sẽ dùng. Ứng dụng này sẽ làm việc trên thiết bị của nhà phân phối và trên bất kì nguồn dữ liệu tương thích nhằm thực hiện kiến trúc ODBC. Những nhà phân phối phần mềm làm như vậy vì họ chỉ cần cung cấp phần mềm thiết bị phù hợp với những thứ mà họ đã cam kết cung cấp. 2.4. Mô hình giao thức chuẩn Hình vẽ kèm theo giới thiệu mô hình kiến trúc giao thức truy nhập cơ sở dữ liệu. Mô hình kiến trúc này thay vì chuẩn hóa giao diện chương trình ứng dụng được dùng, lại tuỳ thuộc vào việc chuẩn hoá giao thức dùng trong truyền thông giữa các máy tính trong môi trường phân tán. Mô hình giao thức chuẩn này cho phép bất kì API được dùng như phần mềm sẽ phù hợp với chuẩn giao thức. Chương trình ứng dụng cơ sở dữ liệu API cơ sở dữ liệu A Client truyền thông Server truyền thông API cơ sở dữ liệu B Phần mềm cơ sở dữ liệu B Giao diện chuẩn Cơ sở dữ liệu B Hình 9. Mô hình cơ sở dữ liệu phân tán có giao thức chuẩn. Thuật ngữ giao thức được dùng rộng rãi trong tài liệu về mạng máy tính. Nó được dùng để tham chiếu đến dạng thức của thông báo trao đổi trên mạng giữa hai máy tính liên lạc với nhau và qui luật quản lí cách thức trao đổi. Ưu điểm của việc chuẩn hoá giao thức là người ta có thể làm việc độc lập để sản xuất ra các thành phần phần mềm khác nhau dùng với API khác nhau thay vì chuẩn hoá API do những nhà phân phối phần mềm cung cấp, khi tất cả thành phần phù hợp với cùng giao thức, tức chuyển thông báo chuẩn trên mạng theo cùng qui luật, chúng sẽ tác động lẫn nhau qua môi trường phân tán. 2.5. Kiến trúc quan hệ phân tán Tiếp theo chuẩn ODBC, để thực hiện được giao thức chuẩn, vài tổ chức mạnh đưa ra chuẩn giao thức. Một số lớn người dùng và nhà phân phối tham gia chuẩn và cài đặt thành phần Client, Server truyền thông để thực hiện giao thức chuẩn. Trong môi trường mainframe, IBM đóng vai trò tổ chức như vậy. IBM đã đề xuất chuẩn giao thức truy nhập cơ sở dữ liệu gọi là kiến trúc cơ sở dữ liệu quan hệ phân tán DRDA. Họ đưa ra chuẩn này để trợ giúp phần mềm DB2 trên máy mainframe. Phạm vi của DRDA lan rộng đến các ứng dụng trên máy vi tính. 2.5.1. Các mức truy nhập cơ sở dữ liệu phân tán Chuẩn DRDA xác đình bốn mức truy nhập cơ sở dữ liệu phân tán dựa trên độ phức tạp của giao tác do ứng dụng tạo ra, dựa trên phạm vi chức năng của phần mềm cơ sở dữ liệu dành cho mỗi loại giao tác, và dựa trên khả năng của giao thức truyền thông giữa những thành phần. Bốn mức đó gồm: Yêu cầu từ xa. Tại mức truy nhập này, phần mềm cơ sở dữ liệu trợ giúp giao tác; mỗi giao tác là câu SQL đơn, truy nhập cơ sở dữ liệu ở xa. Phần mềm cơ sở dữ liệu cần đến chức năng xử lí giao tác không đặc biệt để trợ giúp mức này. Đơn vị làm việc ở xa. Với mức truy nhập này, phần mềm cơ sở dữ liệu trợ giúp giao tác; giao tác gồm một loạt câu SQL truy nhập cùng một cơ sở dữ liệu ở xa. Phần mềm cơ sở dữ liệu cần có khả năng điều phối quá trình khẳng định và khôi phục dữ liệu qua tất cả các lệnh SQL như một phần của giao tác. Điều này đòi hỏi phần mềm cơ sở dữ liệu có khả năng khẳng định từ xa. Đơn vị làm việc phân tán. Với mức truy nhập này, phần mềm cơ sở dữ liệu trợ giúp giao tác gồm xâu câu lệnh SQL truy vấn đến nhiều cơ sở dữ liệu ở xa. Tuy nhiên mỗi câu lệnh SQL chỉ truy nhập một cơ sở dữ liệu. Điều này đòi hỏi phần mềm cơ sở dữ liệu có khả năng cập nhật phân tán, trong đó giao tác đơn có thể cập nhật cơ sở dữ liệu trên các máy tính khác nhau. Yêu cầu phân tán. Mức truy nhập này tương tự như đơn vị công việc phân tán, chỉ khác là mỗi câu SQL có thể tham chiếu thông tin trên nhiều cơ sở dữ liệu khác nhau, trên nhiều máy tính khác nhau. Điều này đòi hỏi phần mềm cơ sở dữ liệu có khả năng kết nối phân tán, tức chuyển thông tin từ các máy khác nhau về một nơi. Dưới đây là chi tiết bốn mức vừa nêu: 2.5.1.1. Yêu cầu từ xa Cấu hình yêu cầu từ xa đòi hỏi hỗ trợ tối thiểu từ phần mềm cơ sở dữ liệu của bốn tiếp cận cơ sở dữ liệu Client/Server do DRDA xác định. Nó cho phép phần mềm cơ sở dữ liệu không thiết kế chuyên để truy nhập cơ sở dữ liệu từ xa vẫn dùng được trong môi trường phân tán. Máy Client Máy Server Chương trình ứng dụng Client truyền thông Mạng truyền thông Phần mềm cơ sở dữ liệu Cơ sở dữ liệu Server truyền thông Hình 10. Cấu hình yêu cầu từ xa. Với kĩ thuật này, một chương trình ứng dụng chạy trong hệ thống máy tính cục bộ tạo một yêu cầu truy nhập cơ sở dữ liệu và chuyển yêu cầu này sang thành phần Client truyền thông. Chương trình ứng dụng và Client truyền thông đều chạy trên hệ thống tính toán cục bộ. Thành phần Client truyền thông gửi thông báo qua mạng đến chức năng phần mềm bổ sung gọi là máy Server cơ sở dữ liệu. Giao thức chuẩn do DRDA xác định sẽ dùng vào việc truyền thông giữa thành phần Client và Server. Thành phần Server truyền thông, phần mềm cơ sở dữ liệu, và bản thân cơ sở dữ liệu được đặt trên hệ thống tính toán ở xa. Hình vẽ cho thấy cấu hình xử lí yêu cầu từ xa. Thành phần Server truyền thông chạy trên hệ thống tính toán ở xa đưa yêu cầu truy nhập cơ sở dữ liệu mà nó nhận được đến phần mềm cơ sở dữ liệu đang chạy ở đó. Rồi Server truyền thông gửi kết quả truy nhập cơ sở dữ liệu về Client tính toán trong hệ thống ứng dụng cục bộ. Thành phần Client truyền thông lại chuyển các dữ liệu yêu cầu đến chương trình ứng dụng cục bộ. Bất kì API cơ sở dữ liệu nào cũng sử dụng cả máy Server và máy Client khi thành phần truyền thông Server, Client đã cài đặt giao thức truyền thông chuẩn DRDA. Với qua trình yêu cầu từ xa, tất cả các chức năng phân tán được thành phần truyền thông Client, Server thâu tóm. Thành phần cơ sở dữ liệu trong máy ở xa không cần biết trước về truy nhập cơ sở dữ liệu phân tán. Yêu cầu về dữ liệu được chuyển đến phần mềm cơ sở dữ liệu trong máy tính ở xa theo chức năng Server truyền thông. Server truyền thông đối với phần mềm cơ sở dữ liệu được coi như chương trình ứng dụng bình thường chạy trên máy ở xa. Phần mềm cơ sở dữ liệu chạy trên máy ở xa có thể thiết lập và giải phóng các khoá và có thể thực hiện việc khôi phục dữ liệu với tư cách là chức năng Server truyền thông. Tuy nhiên nếu có lỗi trên mạng hay nếu việc truy nhập thành phần Client cơ sở dữ liệu của chương trình ứng dụng bị lỗi, thì các lỗi này sẽ được chương trình ứng dụng, thành phần Client truyền thông hay thành phần Server truyền thông quản lý. Phần mềm cơ sở dữ liệu trong máy ở xa không biết trước lỗi sẽ xảy ra trong máy thực hiện chương trình ứng dụng hay lỗi xảy ra trên mạng. 2.5.1.2. Đơn vị công tác ở xa Máy Client Máy Server Chương trình ứng dụng Mạng truyền thông Phần mềm cơ sở dữ liệu Cơ sở dữ liệu Phần mềm cơ sở dữ liệu Hình 11. Cấu hình đơn vị công tác ở xa. Với cấu hình đơn vị công tác ở xa, phần mềm cơ sở dữ liệu phụ trợ được đặt trên máy tính cục bộ và trên máy tính ở xa. Theo tiếp cận này, bản thân phần mềm cơ sở dữ liệu thực hiện chức năng Client, Server về truyền thông và cài đặt giao thức DRDA đối với các thông báo gửi đi, nhận được thông báo qua mạng. Hình vẽ mô tả cấu hình truy nhập cơ sở dữ liệu theo kiểu đơn vị làm việc từ xa. Với xử lí đơn vị công tác ở xa, ứng dụng có thể truy nhập cơ sở dữ liệu quan hệ đơn trên hệ thống tính toán ở xa. Chương trình ứng dụng có thể dùng các câu lệnh SQL như một phần của cùng giao tác. Hai thành phần phần mềm cơ sở dữ liệu phụ trợ bảo trì thông tin trạng thái liên quan đến quá trình của toàn bộ giao tác thông qua các câu lệnh SQL. Chúng có khả năng thực hiện quá trình khẳng định và khôi phục dữ liệu đối với giao tác cũng như đối với toàn bộ quá trình. Cấu hình đơn vị công tác ở xa trong suốt về nhiều loại lỗi đối với chương trình ứng dụng. Vì truyền thông giữa hai máy tính được bản thân phần mềm cơ sở dữ liệu quản lý, phần mềm cơ sở dữ liệu có thể được thiết kế để khôi phục sau sự cố tại máy tính cục bộ, máy ở xa hay trên mạng truyền thông. Do toàn bộ cơ sở dữ liệu được đặt trên một máy tính, các chức năng quản trị một giao tác cần cho việc khôi phục và xử lí quay lui là đơn giản. Giao thức khẳng định khoá hai pha không yêu cầu cài đặt mức truy nhập cơ sở dữ liệu này. 2.5.1.3. Cấu hình cơ sở dữ liệu phân tán Hai mức DRDA nêu trên để truy nhập cơ sở dữ liệu từ xa cho phép chương trình truy nhập cơ sở dữ liệu đơn trên máy tính đơn ở xa. Hai mức hỗ trợ truy nhập tiếp theo đây cho phép chương trình truy nhập cơ sở dữ liệu phân tán trên nhiều máy tính ở xa. Hai tiếp cận xử lí cơ sở dữ liệu phân tán có thể lập nên cấu hình được mô tả như trong hình vẽ sau: Máy Client Máy Server Chương trình ứng dụng Mạng truyền thông Phần mềm cơ sở dữ liệu Cơ sở dữ liệu Phần mềm cơ sở dữ liệu Máy Server Phần mềm cơ sở dữ liệu Cơ sở dữ liệu Hình 12. Cấu hình cơ sở dữ liệu phân tán. 2.5.1.4. Đơn vị công tác phân tán Với cấu hình đơn vị công tác phân tán, chương trình ứng dụng có thể truy nhập dữ liệu trong cơ sở dữ liệu ở xa, trên một hay nhiều máy tính. Chương trình ứng dụng có thể yêu cầu một số câu lệnh SQL trong phạm vi giao tác. Tuy nhiên với tiếp cận này mỗi câu lệnh SQL riêng lẻ cần tham chiếu đến dữ liệu trong hệ thống tính toán ở xa. Dữ liệu nhằm thoả mãn câu SQL này không thực hiện trên nhiều máy tính được. Phần mềm cơ sở dữ liệu chạy trên máy tính cục bộ và phần mềm cơ sở dữ liệu chạy trên các máy tính ở xa làm việc với nhau để điều phối quá trình khôi phục. Do nhiều máy phân tách có thể yêu cầu xử lí đơn vị công tác ở xa nên phần mềm cơ sở dữ liệu cần thực hiện các giao thức khẳng định khóa hai pha nhằm thực hiện khẳng định và khôi phục quay lui, đồng bộ hoá các hệ thống đa dạng. 2.5.1.5. Yêu cầu phân tán Mức ít hạn chế mà lại trong suốt hơn DRDA trong quá trình phân tán là cấu hình yêu cầu phân tán. Với cấu hình này cơ sở dữ liệu có thể đặt trên một số máy ở xa, và một câu SQL được phép tham chiếu dữ liệu trên nhiều hệ thống tính toán phân biệt. Theo tiếp cận yêu cầu phân tán, chương trình ứng dụng hoàn toàn độc lập với vị trí của dữ liệu. Cơ sở dữ liệu phân tán có thể được tổ chức lại và thay đổi vị trí dữ liệu mà không cần chỉnh lí chương trình ứng dụng. Phần mềm cơ sở dữ liệu cần đáp ứng các hỗ trợ cần thiết để đảm bảo truy nhập trong suốt đến dữ liệu của hệ thống tính toán ở xa. Như trong môi trường đơn vị công tác phân tán, phần mềm cơ sở dữ liệu với quá trình yêu cầu phân tán cần sử dụng giao thức khẳng định khoá hai pha để thực hiện khẳng định và khôi phục dữ liệu. 2.5.2. Chuẩn truy nhập cơ sở dữ liệu của hệ X/Open Một thí dụ về chuẩn giao thức truy nhập cơ sở dữ liệu khác là chuẩn truy nhập cơ sở dữ liệu quan hệ RDA (relational database access) do X/Open xác định. X/Open là tổ chức chuẩn quốc tế. Chuẩn RDA phù hợp với mô hình tổng quát chung như DRDA của IBM theo cùng mục đích, kết quả. Tuy nhiên RDA xác định giao thức khác với DRDA. 2.6. Kết hợp nhiều mô hình kiến trúc Cũng có thể tổ chức sẽ dùng các sản phẩm phù hợp với nhiều mô hình kiến trúc về phần mềm cơ sở dữ liệu phân tán. Như trong phần trên, ODBC của Microsoft chuẩn hoá giao diện chương trình ứng dụng trong khi DRDA của IBM chuẩn hoá giao thức truy nhập cơ sở dữ liệu. Hai mô hình kiến trúc bổ trợ cho nhau chứ không cạnh tranh, và việc dùng chuẩn này không ngăn cản ý muốn dùng chuẩn khác. Một vài phần mềm cơ sở dữ liệu dùng API của ODBC nối kết với RDA của X/Open. 2.7. Các đối tượng của cơ sở dữ liệu phân tán Theo Date năm 1990, cơ sở dữ liệu phân tán có mục đích xâu xa là quản lý việc thiết kế sao cho người dùng trong hệ thống này luôn cảm như làm việc trong hệ thống không phân tán. Nói cách khác, tất cả các cơ chế dùng để đạt đến phân bố phân tán về cơ sở dữ liệu cần ẩn giấu người dùng. Một cơ sở dữ liệu phân tán được hình dung như mạng lưới nhiều trạm xa nhau về không gian. Cơ sở dữ liệu phân tán cần thể hiện hình ảnh của cơ sở dữ liệu logic đơn, chỉ khác là phân bố vật lý trên nhiều trạm. Điểm quan trọng là khi đạt được sự phân tán, với cơ chế phần mềm cơ sở dữ liệu đúng, người dùng không thể phân biệt được hệ thống tính toán ở xa là hệ thống đơn hay hệ thống phân tán. Tiếp theo đây là mười hai đối tượng của các hệ thống cơ sở dữ liệu phân tán. Các đối tượng do Date tổng kết tạo cơ sở đánh giá mức độ người dùng cảm nhận được tính hiệu dụng của hệ thống phân tán để có thể tiếp cận. Các đối tượng này không chỉ áp dụng riêng cho hệ thống cơ sở dữ liệu phân tán. 2.7.1. Tự trị địa phương Điều này khẳng định mong muốn của tất cả những vị trí trong hệ thống phân tán là độc lập lẫn nhau. Có nghĩa là thao tác trên hệ thống này không bị chương trình của hệ thông khác điều khiển từ xa. Thao tác thực hiện tại một trạm sẽ không phụ thuộc vào thao tác tại nơi khác trong hệ thống phân tán. Điều này ngầm định rằng dữ liệu đặt trên vị trí cụ thể sẽ được phần mềm tại đó điều khiển, dù rằng phần mềm hệ thống ở xa của môi trường phân tán có thể truy nhập dữ liệu này. Đối tượng này khó thực hiện được trong thực tế, vì trong hệ thống phân tán đôi khi nhiều vị trí cần truy nhập dữ liệu. Để mang ý nghĩa thực tế, người ta theo phương châm nới rộng nhất nếu có thể. 2.7.2. Không tin cậy ở trạm trung tâm Mục đích tự trị địa phương ngầm ý tất cả các vị trí trong hệ thống phân tán sẽ thao tác theo cặp và không tin tưởng vào một trạm thực hiện cho tất cả các trạm khác. Việc tin cậy vào dịch vụ của một trạm có thể dẫn đến tắc nghẽn tại trạm trung tâm, và toàn bộ hệ thống sẽ trục trặc khi lỗi xảy ra tại trạm chính. 2.7.3. Thao tác tiếp diễn Có thể thiết kế hệ thống cơ sở dữ liệu phân tán để không bao giờ một yêu cầu lại có thể làm sập hệ thống chung. Liên quan đến việc này là phép bổ sung vị trí mới vào hệ thống, nâng cấp phần mềm tại một trạm cụ thể... 2.7.4. Độc lập về địa điểm Đối tượng độc lập về địa điểm còn được gọi là trong suốt về địa điểm. Người dùng hay chương trình ứng dụng không liên can đến địa điểm vật lí khi chúng yêu cầu thao tác trên dữ liệu. Hệ thống cơ sở dữ liệu phân tán sẽ tạo dữ liệu phân tán như là nó được lưu trên cơ sở dữ liệu logic đơn; mà đó cũng là địa điểm của người dùng. Đối tượng này thực ra là mở rộng của đối tượng chung trong cơ sở dữ liệu về độc lập dữ liệu. 2.7.5. Độc lập phân đoạn Phần mềm cơ sở dữ liệu sẽ cho phép cơ sở dữ liệu phân đoạn để các phần khác nhau của cơ sở dữ liệu có thể chuyển sang các địa điểm khác nhau trong môi trường phân tán. Đối tượng này là quan trọng đối với vấn đề hiệu suất sử dụng. Phân đoạn cho phép nhóm các phần tử dữ liệu lưu trên các vị trí thường được truy nhập nhất. Người ta chia ra làm hai loại phân đoạn là phân theo dòng hoặc theo cột, tức theo chiều ngang hay chiều dọc. Với phân đoạn ngang, cơ sở dữ liệu được phân đoạn để tất cả những thể hiện của tập phần tử dữ liệu ứng với thực thể kinh doanh sẽ lưu tại một nơi. Chẳng hạn yêu cầu vào cơ sở dữ liệu, thông tin về yêu cầu được lưu tại một nơi, thông tin về Client hàng tại nơi khác, và thông tin về đầu tư lại xa hơn. Phân đoạn dọc theo phép các phần tử dữ liệu cùng kiểu sẽ lưu cùng nơi. Chẳng hạn thông tin đầu tư vào Hải Phòng lưu tại địa phương Hải Phòng, thông tin đầu tư vào Cần Thơ đặt tại Cần Thơ. Việc độc lập phân đoạn cũng ngầm ý trong suốt về phân đoạn, là một dạng độc lập về địa điểm. Không cần báo trước với người dùng hay chương trình ứng dụng về lược đồ phân đoạn dùng trong hệ thống phân tán. Toàn bộ cơ sở dữ liệu sẽ hiện ra như một cơ sở dữ liệu đơn, không hề bị phân nhỏ. 2.7.6. Độc lập về bản sao Hệ thống cơ sở dữ liệu phân tán bảo quản nhiều bản sao của cùng một phần tử dữ liệu tại các trạm khác nhau. Các bản sao thường được dùng trong hệ thống phân tán để tăng khả năng và cải thiện hiệu suất. Bản sao cần trong suốt đối với người dùng và chương trình ứng dụng. Người dùng sẽ thu được cùng kết quả dù sử dụng bất kì dữ liệu trên bản sao nào. Các thay đổi của chương trình ứng dụng trên một bản sao sẽ được lan truyền tới các bản sao còn lại. 2.7.7. Xử lí câu hỏi phân tán Đối tượng này cho biết rằng khi một người dùng hay chương trình ứng dụng tại một nơi ra câu hỏi thì bản thân câu hỏi này có khả năng được gửi đến những nơi có dữ liệu thỏa mãn câu hỏi. Phần trước đã điểm qua về khác nhau giữa mô hình trạm Server file và mô hình cơ sở dữ liệu Client/Server. Nếu tất cả các câu hỏi được xử lí tại A và dữ liệu đặt tại B thì khối lượng lớn dữ liệu sẽ qua lại giữa A và B để thực hiện câu hỏi. Nếu câu hỏi được truyền sang B rồi thực hiện thì tình trạng liên lạc nhiều lần sẽ được giải quyết. Để đáp ứng hoàn toàn đối tượng này, cần có cơ chế tối ưu hoá câu hỏi, chuyển câu hỏi trên nhiều trạm về một số hạn chế các trạm. 2.7.8. Quản trị giao tác phân tán Việc quản trị giao tác phân tán liên quan đến ý đồ của giao tác. Một giao tác bao gồm nhiều xử lí, nhiều truy nhập dữ liệu trên nhiều cơ sở dữ liệu, nhưng giao tác là đơn vị nhỏ nhất đảm bảo được điều khiển tương tranh và khôi phục dữ liệu. Vấn đề ở đây là toàn bộ quá trình phải được coi như đơn vị. Nếu một phần giao tác bị lỗi thì kết quả phần trước của giao tác cũng bị huỷ khỏi hệ thống. Hệ thống cơ sở dữ liệu phân tán trợ giúp quá trình khôi phục phân tán, trong đó các phần tử dữ liệu trên các vị trí vật lí khác nhau có thể được cập nhật như một phần của xử lí giao tác. Nếu một phần của giao tác bị lỗi thì bất kì cập nhật nào với phần khác của cơ sở dữ liệu cần được quay ra để khôi phục lại toàn bộ cơ sở dữ liệu phân tán về trạng thái trước khi bắt đầu giao tác. Hệ thống cơ sở dữ liệu phân tán cũng trợ giúp điều khiển tương tranh phân tán. Hệ thống có cơ chế phù hợp, cho phép nhiều chương trình đồng thời truy nhập các phần khác nhau của cơ sở dữ liệu, và ngăn cản khoá chết khi xảy ra các phép xung đột. Xử lí giao tác phân tán nhìn chung được thực hiện với giao thức khẳng định khoá hai pha với các tiện nghi khoá dữ liệu. 2.7.9. Độc lập phần cứng Người ta khuyến cáo về nền tảng độc lập với việc xây dựng hệ thống. Độc lập phần cứng khẳng định hệ thống cơ sở dữ liệu phân tán có thể đặt trên nhiều kiểu hệ thống tính toán. Chẳng hạn người ta dùng các môi trường khác nhau như mainframe của IBM, bộ xử lí của VAX DEC và máy tính cá nhân có vi xử lí Intel. 2.7.10. Độc lập hệ thống điều hành Độc lập hệ thống điều hành một phần do đối tượng độc lập phần cứng ngầm qui định. Hệ thống phân tán có thể dùng hệ thống tính toán với các hệ thống điều hành khác nhau như MVS của IBM, OpenVMS của DEC, Windows NT của Microsoft. Độc lập hệ điều hành và độc lập phần cứng có thể tách biệt vì hệ thống điều hành linh động trên nhiều cấu hình máy tính của các nhà cung cấp khác nhau. Khả năng các hệ thống điều hành khác nhau trên cùng một máy cho phép hệ thống phân tán dùng phần cứng thuần nhất và phần mềm không thuần nhất. 2.7.11. Độc lập mạng Ngày nay nền tảng cho hệ thống tính toán được đặc trưng bởi kiểu phần cứng cụ thể, chạy hệ thống điều hành riêng, và có phần mềm truyền thông mạng phù hợp, như TCP/IP, SNA, NetWare của Novell. Cũng có thể dùng phần mềm truyền mạng khác trên các phần khác nhau của hệ thống phân tán mà người dùng không cần biết đến những khác nhau này. 2.7.12. Độc lập phần mềm cơ sở dữ liệu Đối tượng này nhằm vào hệ thống cơ sở dữ liệu phân tán dùng các phần mềm cơ sở dữ liệu khác nhau chạy trên vị trí khác nhau trong môi trường phân tán. Đối tượng này không giống như kết quả chốc lát mà do việc chuẩn hoá giao diện đã trở thành chuẩn thông dụng. Các kiến trúc cơ sở dữ liệu phân tán của các nhà cung cấp đã được giới thiệu trong các phần trên, góp phần đảm bảo độc lập phần mềm cơ sở dữ liệu. 2.8. Kết luận về kiến trúc phần mềm cơ sở dữ liệu phân tán Để tiện tạo dựng môi trường cơ sở dữ liệu phân tán không đồng nhất, người ta dùng ba mô hình kiến trúc phần mềm khác nhau là mô hình cổng, mô hình giao diện chuẩn và mô hình giao thức truy nhập cơ sở dữ liệu. Với mô hình cổng, máy Client dùng một API cơ sở dữ liệu để nối với máy cổng. Cổng này truy nhập tiện nghi của cơ sở dữ liệu tại máy Server cơ sở dữ liệu; tại đó phần mềm cơ sở dữ liệu máy Server có API khác. Chức năng cổng dịch yêu cầu mà chương trình ứng dụng cần thực hiện sang yêu cầu mà phần mềm cơ sở dữ liệu hiểu được. Với mô hình giao diện chuẩn, phần mềm thiết bị chạy trên máy Client thiết lập liên kết mạng và dịch yêu cầu theo dạng chuẩn API sang yêu cầu truy nhập cơ sở dữ liệu mà phần mềm cơ sở dữ liệu chấp nhận được. Chuẩn API liên kết cơ sở dữ liệu mở ODBC thực hiện mô hình giao diện chuẩn để truy nhập từ xa. Với mô hình giao thức chuẩn, giao thức được chuẩn hoá sẽ điều khiển truyền thông giữa các thành phần phần mềm đa dạng trong môi trường phân tán. Các tiếp cận như kiến trúc cơ sở dữ liệu quan hệ phân tán DRDA, truy nhập cơ sở dữ liệu phân tán RDA là hai tiếp cận truy nhập cơ sở dữ liệu từ xa đã chuẩn hoá giao thức truy nhập cơ sở dữ liệu. DRDA xác định bốn mức truy nhập cơ sở dữ liệu từ xa. Các kiểu yêu cầu từ xa và đơn vị công tác ở xa khi truy nhập cơ sở dữ liệu phân tán cho phép truy nhập cơ sở dữ liệu đơn. Còn đơn vị công tác phân tán và các cấu hình yêu cầu phân tán cho phép truy nhập cơ sở dữ liệu phân tán. Mười hai đối tượng để thiết kế cơ sở dữ liệu phân tán là tự trị địa phương, không tin vào trạm trung tâm, thao tác liên tục, độc lập về địa điểm, độc lập về phân đoạn, độc lập giữa các bản sao, xử lí câu hỏi phân tán, quản trị giao tác phân tán, độc lập phần cứng, độc lập hệ thống điều hành, độc lập mạng và độc lập phần mềm cơ sở dữ liệu. 3. Kết luận Trong chương này đã giới thiệu sơ lược về vấn đề liên quan đến cơ sở dữ liệu. Người ta có thể khảo cứu cơ sở dữ liệu theo tiếp cận cơ sở dữ liệu quan hệ theo một phần mềm cơ sở dữ liệu cụ thể, tức một hệ quản trị cơ sở dữ liệu cụ thể. Trong chương này không đi sâu vào các vấn đề mà chỉ nêu các khái niệm tổng quát nhất, nhưng với mức độ chưa cao. Các nội dung đã được giới thiệu gồm: Khái niệm về Client, Server, Client/Server. Cấu hình cơ sở dữ liệu Client/Server. Kiến trúc phần mềm cơ sở dữ liệu phân tán. Những phần được giới thiệu trên ngoài ra còn các hệ thống cơ sở dữ liệu phân cấp, mạng hay quan hệ, cơ sở dữ liệu suy diễn. Đó là cơ sở dữ liệu xử lý các dữ liệu cùng tri thức. Trong nghiên cứu cơ bản và các ứng dụng, người ta cần truy nhập không chỉ một cơ sở dữ liệu mà nhiều cơ sở dữ liệu, có các kiểu khác nhau. Việc truy nhập cơ sở dữ liệu phân tán đã phức tạp, nay nhu cầu cần truy nhập cơ sở dữ liệu không đồng nhất. Nó đòi hỏi các nghiên cứu về tích hợp hệ thống, tổng hợp dữ liệu từ nhiều nguồn khác nhau. Kho thông tin khi đó không thực hiện được theo một mô hình nhất định mà nó đã tồn tại dưới nhiều dạng khác nhau. CHƯƠNG II THIẾT KẾ BÀI TOÁN THỰC TẾ Trong chương này ta thiết kế cơ sở dữ liệu dựa trên bài toán "Quản lý học viên" để sử dụng trong môi trường Client/Server. 1. Đặt vấn đề 1.1. Sự cần thiết của việc quản lý học viên Từ khi máy tính ra đời đến nay, những ứng dụng của nó trong mọi lĩnh vực của cuộc sống nói chung và trong lĩnh vực quản lý nói riêng ngày càng phát triển. Cùng với sự phát triển của phần cứng, phần mềm và công nghệ mạng các phần mềm quản lý ngày càng phục vụ tốt hơn công việc cho các cán bộ quản lý, lãnh đạo trong công tác nghiệp vụ quản lý kinh doanh, ra quyết định, lập kế hoạch... Viện đào tạo công nghệ thông tin của trường đại học Quốc gia Hà Nội là một đơn vị quản lý một khối lượng cơ sở vật chất lớn phục vụ cho việc đào tạo và giảng dạy. Ngoài việc này Viện còn quản lý một số lượng lớn học viên học tại Viện. Với y

Các file đính kèm theo tài liệu này:

  • docTruy nhập cơ sở dữ liệu trên mạng trong môi trường mạng Internet và Intranet.doc