Đề tài Tổng quan về quản trị tổng kho dữ liệu trong các tổ chức doanh nghiệp

Chúng ta nghiên cứu những phương pháp, công cụ để xử lí thông tin: sau đó là những kĩ thuật xử lí phân tích, đặc biệt nhấn mạnh phương pháp xử lí bằng trực tuyến.

Các bước trong quá trình xử lí thông tin gần giống các bước phân tích để có được những quyết định của những người thành thạo trong công việc của mình.

 

doc32 trang | Chia sẻ: maiphuongdc | Lượt xem: 1411 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Đề tài Tổng quan về quản trị tổng kho dữ liệu trong các tổ chức doanh nghiệp, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
iệu được chuyển sang dạng tên gọi các dữ liệu chuẩn và các định nghĩa chính của nó. Trong thành phần tái kiến thiết, dữ liệu được tạo ra sao cho phù hợp với yêu cầu của người sử dụng. Khối kiến thiết trung tâm Khối này được tạo ra các trung tâm dữ liệu được xd từ kho dữ liệu các thành phần của nó cũng tương tự như như khối kiến thiết kho dữ liệu. b . Truy nhập và sử dụng kho dữ liệu Khối này gồm hai chức năng chính: truy nhập và tìm kiếm, phân tích lập báo cáo Tầng quản lí Chiết xuất và quản trị dữ liệu mới. Câu hỏi yêu cầu Nạp, lưu trữ và cập nhật hệ thống Quyền ttruy nhập và an toàn hệ thống Cất giữ thanh lọc và khôi phục hệ thống Tầng quản lí metadata Kiến trúc kho dữ liệu được xây dựng dựa trên những khái niệm định nghĩa dữ liệu (được gọi là meta data). Metadata boa quát mọi hoạt động của kho dữ liệu Tầng meta chụi trách nhiệm : Đảm bảo chuẩn hoá các định nghĩa dữ liệu (bao gồm cả định nghĩa chức năng và định nghĩa tác nghiệp )được lưu trữ trong kho. Tạo lập các meta data được xây dựng trong khối làm mịn dần và tái xây dựng Xây dựng các meta data dựa trên hạt nhân, các vùng chú điểm, gộp chung và tổng hợp lại Xác định những mô tả những câu hỏi và báo cáo những định nghĩa trước Xác địnhcác meta data mô tả5 chỉ số hoá, các quy tắc phân chia thời gian, cập nhật hệ thống. c. Tầng truyền thông Tầng này phục vụ cho việc trao đổi giữa các khối trong kiến trúc chung của hệ thống. Truyền dữ liệu và phân phối mạng Client-serverr và các công cụ phục vụ trung gian Hệ thống trả lời Quyền truy nhập và an toần hệ thóng Chức năng truyền dữ liệu và phân phối mạng bao gồm những loại hệ thống: Giao lễ của mạng Cơ cấu quản lí của mạng Hệ điều hành mạng Loại kết nối mạng Bộ phận Client-serverrvaf công cụ phục vụ trung gian bao gồm: phần phục vụ truyền thông và bộ phận môi giới Hệ thống trả lời bao gồm các hệ thống nhỏ sau: IBMData EdA SQL. Các sản phẩm d. Tầng cơ sở Tầng cơ sởcủa hệ thống đề cập đến: * Cấu hình hệ thống Bộ nhớ lưu trữ Độ an toàn Phân phối phần mền Theo dõi sự hoạt động các công việc Phân tích các khả năng, công suất. Tìm hiểu thêm về OLAP OLAP là kĩ thuật phân tích dữ liệu bao gồm: _ Thể hiện vieulogic nhiều chiều của dữ liệu trong kho dữ liệu, view nào cũng độc lập với cách lưu trữ dữ liệu _Xử lí câu hỏi và dữ liệu trực tiếp _ Tạo ra khả năng tổng hợp và dữ liệu gộp chungtheo một cấu trod phân cấp. _ Hỗ trợ tạo ra mô hình chức năng để dự báo, phân tích xu thế phát triển và phân tích xu thế thống kê. _ Tìm kiếm và hiển thị dữ liệu trong không gian _ Trả lời các câu hỏi, quá trình phân tích không bị gián đoạn, thông tin không bị tổn thất. OLAP là thành phần quan trọng trong phân tích và lập báo cá, là thành phần quan trọng để truy nhập và sử dụng dữ liệu trong kho dữ liệu Truy nhập trực tiếp vào dữ liệu trong datawarrehouse hay từ datamart biến đổi chúng sang cấu trúc nhiều chiềuvà lưu trữ chúng ở kho của các trạm . Truy nhập trực tiếp vào dữ liệu trong datawarrehouse hay từ datamart biến đổi chúng sang dạng view đa chiều và thể hiện nó như cấu chúc nhiều chiều phục vụ cho phân tích và lập báo cáo ở các trạm II. Khai thác sử dụng kho dữ liệu 7. Mục đích của kho dữ liệu Mục đích của kho dữ liệu là để chocác nhà quản lí hiểu được bản chất của những gì đã xẩy ra và nắm bắt được những gì sẽ xảy ra trong tương lai. Các nhà quản lí phải trả lời những câu tương tự như sau: Khách hàng cần mua gì ? họ không cần mua gì ? Bao nhiêu nhân viên bán hàng phục vụ cho một khách hàng? khách hàng nghĩ như thế nào về dịch vụ của công ty? Đối thủ cạnh tranh có thể làm những gì? Những điều đó ảnh hưởng như thế nào đối với khách hàng ? Chi phí cho một đơn vị mặt hàng so với ba năm qua tăng hay giảm? những yếu tố chính làm cho nó tăng… Những nhà quản lí phải có được những câu hỏi chủ chốt để có được những quyết định kịp thời và tốt hơn. Hệ thống kho dữ liệu giúp chúng ta đạt được mục tiêu đó. Dữ liệu được lấy ra từ kho dữ liệu và được chuyển đổi sang dạng thông tin hỗ trợ cho các doanh nghiệp(tổ chức) có được nhiều khả năng lựa chọn với nhiều thông tin hơn để có được quyết định tốt hơn và duy trì được lợi thế trong cạnh tranh. Quá trình sử dụng kho dữ liệu được thực hiện qua nhiều bước. Đầu tiên là kho dữ liệu được sử dụng để lập báo cáo và định nghĩa trước các câu hỏi. Sau đó là nó được sử dụng để phân tích tổng hợp hay chi tiết dữ liệu mà kết quả là các bản báo cáo hay các biểu đồ. Trong giai đoạn này cũng cần kiểm tra chất lượng và tính đầy đủ các nội dung dữ liệu, đồng thời tiến hành huấn luỵện, đào tạo người sử dụng. Khi người sử dụng cảm thấy tiện lợi trong công việc thì họ sẽ sử dụng kho dữ liệu để thực hiện công việc để đạt được những mục tiêu chiến lược thông qua phân tích nhiều chiều hay nhiều phép toán khác trên kho dữ liệu. 8. Tiềm năng của kho dữ liệu Trong môi trường cạnh tranh hiện nay, không có chỗ đứng cho những quyết định chậm hay thiếu thông tin. Việc sử dụng dữ liệu trong kho dữ liệu dưới dạng các thông tin cần thiết để có những quyết định tốt có thể mô tả như trong hình8.1 Tri thức Dữ liệu Sự kiện thông tin Kho dữ liệu có thể cung cấp đầy đủ những thông tin cần thiết cho các nhà phân tích, quản lí và những người thực hiện. Họ sử dụng kho dữ liệu để đề ra kế hoạch, chiến lược phát triển và từ việc quản lí tốt mối quan hệ giữa khách hàng để điều chỉnh theo hướng có lợi hơn trong môi trường cạnh tranh. Phân tích tăng lợi nhuận và tăng trưởng kho: kho dữ liệu cung cấp các dữ liệu để phân tích hỗ trợ để có được những quyết định tốt đảm bảo sự phát triển và tăng lợi nhuận cho từng xí nghiệp Quản lí được các mục tiêu chiến lược: những dữ liệu tác nghiệp của xí nghiệp là những nguồn thông tin cơ bản được lưu trữ trong kho. Chính những dữ liệu này sẽ cung cấp đủ thông tin để hiểu, nắm được thị hiếu, nhu cầu phát triển của khách hàng trên cơ sở đó đề ra chiến lược phát triển cho xí nghiệp. Giúp cho việc cải tiến quá trình tác nghiệp và quản lí toàn bộ chất lượng. 9. Các ứng dụng của kho dữ liệu Những kinh nghiệm trong các hoạt động nhân hành và tài chính và dịch vụ, kinh doanh,sản xuất,…cũng đã nêu lên khả năng ứng dụng của kho dữ liệu để thực hiện chức năng của một tổ chức. Chúng ta xét một số lĩnh vực ứng dụng kho dữ liệu phổ biến: Trong lĩnh vực tài chính và ngân hàng:kho dữ liệu được sử dụng trong quản lí các dịch vụ, khách hàng và phát hiện những may rủi trong hoạt động đầu tư phát triển. Trong các dịch vụ kinh doanh và quản lí: trong lĩnh vực này, ứng dụng kho dữ liệu đóng vai trò quan trọng trong hoạt động kinh doanh, khách hàng, hàng hoá, mối quan hệ giữa chúng…ngoài công việc hỗ trợ cho quản lí còn cho ta biết được nhu cầu, thị hiếu và xu thế phát triển của khách hàng nói riêng và thị trường nói chung. Trong sản xuất: kho dữ liệu giúp cho việc tăng hiệu quả của sản xuất, vốn đầu tư đảm bảo đáp ứng nhu cầu khách hàng và phù hợp với nhu cầu phát triển của xí nghiệp. 10.Những người sử dụng kho dữ liệu và yêu cầu của họ Nhiệm vụ của kho dữ liệu là hỗ trợquyết định cho phạm vi rộng lớn các lớp người sử dụng khác nhau với sự giúp đỡ cuả công nghệ thông tin. Người sử dụng hệ thống kho dữ liệu phải có những khả năng sau: Hiểu biết về lĩnh vực tác nghiệp và kho dữ liệu hỗ trợ Hiểu được ngữ nghĩa có được của thông tin từ kho dữ liệu Biết được cách truy nhập và tìm kiếm thông tin trong kho. Có khả năng xử lí,biến đổi những dữ liệu tìm được từ trong kho dữ liệu sang những dạng thông tin sự kiện,rồi chuyển chúng sang tri thức để ra quyết định. Nhu cầu cơ bản của tất cả những người sử dụng kho dữ liệu là biết được cái gì có trong kho dữ liệu, phân tích các dữ liệu,xác định được những thông tin cần thiết để lấy ra từ trong kho dữ liệu, nhu cầu của họ được thoả mãn khi trả lời được những câu hỏi sau: Kho dữ liệu chính xác chứa những gì?và chất lượng của chúng? Cách truy nhập và tìm kiếm dữ liệu Tất nhiên nhu cầu về tìm kiếm nghiệp vụ,công nghệ…cũng rất khác nhau đối với những người sử dụng khác nhau vi dụ như bảng dưới đây: Người thực hiện Công cụ phân tích đóng gói thông tin Khả năng của trạm làm việc Người quản lí lâu năm Người lập báo cáo Biểu đồ Hình thức tác nghiệp Biểu diễn đa phương tiện Mô hình tác nghiệp Lập kế hoạch và mô hình dự báo Đồ hoạ chất lượng cao Cơ chế ảo Giám đốc phân tích tác nghiệp Các câu hỏi Biểu đồ và báo cáo Bảng tính và các hệ quản trị CSDL Mô hình lập kế hoạch và dự báo Mô hình tác nghiệp Đồ thị Khả năng ảo của những thông tin đã được phân tích Phân tích viên tác nghiệp Các truyền viên CNTT Tổng hợp dữ liệu Chi tiết dữ liệu Biến đổi dữ liệu CSDL Bảng tính và hthử QTCSDL Quản trị dữ liệu nội bộ Dữ liệu bên ngoài CSDL Khai thác dữ liệu Phân tích dữ liệu ảo hoá dữ liệu 10. Sử dụng kho dữ liệu từ xu thế phát triển của công việc, kho dữ liệu được xây dựng đã cung cấp những dữ liệu và thông tin ở dưới dạng thông tin và khuân mẫu thuận lợi cho người sử dụng nghiệp vụ, những người sử dụng với những công cụ và khả năng phân tích để có những quyết định đúng nhất. Kho dữ liệu được sử dụng hàng ngày với hai hoạt động chính: Truy nhập và tìm kiếm phân tích và làm báo cáo. Truy nhập trực tiếp vào kho dữ liệu Các công cụ làm báo cáo Truy nhập vào data mart Công cụ phân tích và trợ giúp quyết định Xây dựng lại Công cụ xây dựng mô hình tác nghiệp Chuyển đổi sang cấutrúc nhiều chiều Các công cụ khai thác dữ liệu Tạo ra những kho ứng dụng sản xuất Hiển thị và điều hành Quản lí meta dữ liệu OLAP Quản lí Khối truy nhập và sử dụng trong kiến trúc quy chiếu của kho dữ liệu 11. Kĩ thuất sử dụng kho dữ liệu Công cụ trợ giúp quyết định thường sử dụng sau khi sử dụng những công cụ hay những trương trình ứng dụng để tìm kiếm xử lí phân tích những dữ liệu tìm được trong kho theo yêu cầu để cuối cùng có được những kết luận tốt. Hỗ trợ quyết định Kiển phát Chứng hiện Thông Phân Khai thác tin tích dữ liệu Hình trên ta thấy những kĩ thuật sử dụng chính ở đâylà kiểm chứng và phát triển. Theo chức năng kiểm chứng người sử dụng đưa ra các giả thuyết đó là những câu hỏi liên quan đến nghiệp vụ rồi tìm cách khẳng định những điều nêu ra thông qua các dữ liệu truy nhập được phân tích nhiều chiềulấy ra từ kho dữ liệu. Chức năng kiểm chứng làm nhiệm vụ phát hiện những đặc tính của dữ liệu. 12. Các bước sử dụng dữ liệu các bước sử dụng dữ liệu của kho dữ liệu oàn toàn giống xử lí dữ liệu của những người quản lí giàu kinh nghiệm. Nó bao gồm các bước Kiểm tra chất và tính chất công việc Xây dựng luận cứ về kết quả công việc Xác định mục tiêu hoăc những vấn đề nghiệp vụ Xây dựng cách truy nhập vào kho dữ liệu Truy nhập và tìm kiếm trong kho dữ liệu Phân tích dữ liệu Giới thiệu và quyết định Các bước sử dụng dữ liệu 13. Phân tích và xử lí thông tin trong kho dữ liệu Chúng ta nghiên cứu những phương pháp, công cụ để xử lí thông tin: sau đó là những kĩ thuật xử lí phân tích, đặc biệt nhấn mạnh phương pháp xử lí bằng trực tuyến. Các bước trong quá trình xử lí thông tin gần giống các bước phân tích để có được những quyết định của những người thành thạo trong công việc của mình. Truy nhập và tìm kiếm trong kho dữ liệu Biểu diễn và phân tích kết quả Xác định nhu cầu về dữ liệu Xây dựng giả thuyết Xác định công việc Quá trình phân tích và thực hiện công việc của công nhân thạo nghề Định nghĩa câu hỏi Những giả thuyết về câu hỏi tương tựCác mùa trong năm và lượt các mặt hàng được bán ra trong quý có mối quan hệ như thế nào? ” cần phải được chuyển sang dạng câu hỏi có những trả lời từ kho dữ liệu. Công việc chuyển đổi này có thể thực hiện bởi các chuyên gia công nghệ thông tin hay người có nghiệp vụ hay người có trình độ chuyên môn cao về hệ thống thông tin. Truy nhập và tìm kiếm dữ liệu Nhiều công cụ truy nhập hỗ trợ để đưa ra những câu hỏi tính toán và tìm ra những dữ liệu thích hợp. Quá trình truy nhập và tìm kiếm có thể bao gồm cả những khả năng tính toán và sắp xếp theo một tiêu chí nào đó. định nghĩa câu hỏi Các công cụ Truy nhập và tìm kiếm tính toán xử lí /phân tích Biểu diễn kết quả/lậpbáo cáo Trao đổi thông tin: E-mail Quá trình xử lí thông tin c. Tính toán,xử lí, phân tích dữ liệu để thực hiện công việc được giao thì người thừa hành công việc phải tính toán,xử lí nhiều kết quả từ kho dữ liệu theo những câu hỏi đặt ra. Thực hiện phân tích với mục đích là chuyển những dữ liệu tìm được sang dạng thông tin và các sự kiện. Có nhiều công cụ được sử dụng để phân tích như sơ đồ, đồ thị. d. Biểu diễn thông tin Những kết quả phân tích có thể biểu diễn dưới nhiều dạng như biểu đồ đồ thị, các báo cáo hay những dữ liệu được xử lí trước cho những quá trình phân tích tiêp theo. Những kết quả đó có thể thể hiện trong không gian hai chiều,ba chiều e. Trao đổi thông tin các lượng thông tin có thêtrao đổi với nhau dưới nhiềy hình thứckhác nhau như dưới dạng tài liệu, báo cáo hoặc dưới các dạng tệp thông tin hay thư tín điện tử…Để tăng hiệu quả xử lí của hệ thống thì những kết quả phân tích phải được chuyển ngay đến thực tế dưới dạng trang điện tử hoặc để soạn các báo cáo để cung cấp các tài liệu cần thiết. Phục vụ khách hàng Sản xuất Bán hàng Nghiên cứu thị trường Tài chính kế toán Những người sử dụng bất thường Những người sử dụng thường xuyên Những người sử dụng tiềm năng Cách nhìn của người sử dụng III. Xây dựng và phát triển kho dữ liệu Hệ thống kho dữ liệu cũng có chu trình phát triển giống như các phần mềm khác. để phát triển hệ thống kho dữ liệu chúng ta phải thực hiện lần lượt qua các bước: lập kế hoạch, xác định yêu cầu,phân tích , thiết kế, cài đặt, trắc nghiệm và cuối cùng là bảo trì,phát triển. Bảo trì và phát triển trắc nghiệm cài đặt Xác định phân tích thiết Yêu cầu kế Lập KH Chu trình phát triển của hệ thống 1. Lập kế hoạch Để xây dựng kho dữ liệu cần thực hiện qua các bước, một số bước có thể thực hiện đồng thời Xác định chiến lược cài đặt hệ thống Lập KH Tập hợp meta data Xây dựng kịch bản sử dụng trong tác nghiệp Xây dựng chương trình ngân sách cho kế hoạch Lựa chọn cách tiếp cận kiến túc Xác định miền pham vi của hệ thống Lựa chọn phương pháp luận dể phát triển a.Xác định chiến lược cài đặt Đây là bước đầu tiên vô ùng quan trọng, nó được quyết định đưa cơ sở vào cơ cấu tổ chức cần thiết phát triển hệ thống kho dữ liệu. Chúng ta có thể lựa chọn một trong ba cách tiếp cận sau: Cách tiiếp cận trên –xuống Cách tiếp cận dưới—lên Tổ hợp hai cách trên Nên chọn cách tiếp cận trên – xuống khi có những điều kiện sau: + khi tổ chức thực hiện cài đật nấm vững được thông tinvà có nhiều kinh nghiệm đẻ phát triển các ứng dụng dựa trên việc xác định danh sách các yêu cầu cua hệ thống + Khi thực hiện các nhà quyết định, nhà đầu tư đã xác định rõ mục đích và yêu cầu đối với hệ thống kho dữ liệu + khi thực hiện những nhà quyết định, những nhà đầu tư đã có ý tưởng rõ ràng nơi nào hệ thống kho dữ liệu sẽ được sử dụng và sử dụng như thế nào để có những quyết định trợ giúp * Nên lựa chọn cách tiếp cận từ dưới lên trên khi có các điều kiện sau: + Khi chưa xác định được công nghệ cài đặt chủ đạo và có nhiều công nghệ mới cần phải tiếp xúc và xem xét + Khi tổ chức chưa phó thác cho công nghệ khai thác kho dữ liệu nhưng đang tìm kiếm một công nghệ để xác định triển khai công nghệ + Khi mục tiêu về hệ thống kho dữ liệu chưa rõ ràng, hoặc là quá trình tác nghiệp hiện thời hay trong chưa cụ thể * Nên chọn cách tiếp cận tổ hợp khi có những điều kiện sau: + Tổ chức thực hiện cài đặt có những chuyên gia cài đặt giàu kinh nghiệm . tổ chức này có cơ sở vững chắc về xây dựng và phát triển kho dữ liệu + Khi tổ chức đã có một nhóm thực hiện dự án,xác định rõ những nơi cần ứng dụng kho dữ liệu. Thông thường nhóm dự án là một phòng ban, một ban được bổ sung thêm một số người và những đội ngũ cán bộ của hệ thống thông tin thống nhất với nhau để đề xuất một giải pháp cụ thể để cài đặt hệ thống kho dữ liệu phù hợp với yêu cầu của công việc b. Lựa chọn phương pháp luận để phát triển Trong công nghệ phần mềm có nhiều phương pháp luận đã được tập trung nghiên cứu và ứng dụng để phát triển các hệ thống phần mềm. Mỗi phương pháp đều có những ưu và nhược điểm khác nhau. Những kĩ thuật phát triển hệ thống phần mềm hiện nay chủ yếu được sử dụng là: phương pháp phân tích thiết kế cơ sở cấu trúc theo mô hình thác nước, phương pháp phân tích thieets kế cài đật hướng đối tượngtheo mô hình đài phun nước và phương pháp phát triển theo vòng xoắn ốc c. Xác định mục tiêu Để hiểu rõ công việc và để thực hiện thành công dự án thì vấn đề đầu tiên quan trong nhất láac định rõ mục tiêu, nhiệm vụ và hệ thống cần cài đặt. Việc xã các định các mục tiêu của kho dữ liệu là công việc rất phức tạp vì kho dữ liệu chính là CSDL với khối lượng thông tin phức hợp trong một phạm vi xử lí rất rộng. Ngoài ra còn luôn phát triển nhiều xu thế phát triển công cụ Để khắc phục được những khó khăn trong việc xác định mục tiêu, khi lập kế hoạch chúng ta nên trả lời những câu hỏi : Thị trường những người sử dụng kho dữ liệu tiềm năng là gì? Câu trảt lơi sẽ phụ thuộc vào mơc độ nhận thớc và nhu cầu của hệ thống . việc lựa chọn các đối tượng phục vụ cần phải xét tới những khả năng cần tới trạm làm việc, kết nối mạng và trình độ t của khách hàng. Những lĩnh vực nào đang ứng dụng hoặc dự kiến sẽ ứng dụng? Câu trả lời cần phải chú ý và miên ứng dụng nhiều chiều, rất rộng: người phục vụ các trạm làm việc của khách hàng, giao diện đồ hoạ, các hệ thống thông tin (hệ quản trị CSDL các quan hệ truyền thông ). Những vấn đề cần lập kế hoạch chủ yếu dựa vào chức năng, vào đặc tính là gì? đặc tính và chức năngcủa hệ thống được chia làm hai lớp: -Những đặc tính chức năng nhìn thấy được có thể sử dụng bởi những người từ bên ngoài tổ chức của hệ thống kho dữ liệu. Những đặc tính chức năng không nhìn thấy được cụ thể những cần phải cài đật bên trong hệ thống để phát triển được các khả năng của hệ thống Những nguồn dữ liệu nào có thể hoặc cần phải tích hợp để đưa vào hệ thống kho dữ liệu Khi nào thì hệ thống kho dữ liệu được đưa vào triển khai ứng dụng. d. Xác định phạm vi của hệ thống Trong hầu hết các tổ chức, lí do cần phải phát triển hệ thống kho dữ liệu là nhằm đáp ứng nhu cầu công việc của một nhóm người, một bộ phận nào đó, sau khi đã xác dịnh mục tiêu thì cần xác định phạm vi hoạt động và ứng dụng của kho dữ liệu. Phạm vi của dự án phát triển có thể theo nhiều chiều. Có thể chia các yếu tố giúp cho việc xác định phạm vi của hệ thống thành hai loại: Những yếu tố xác định phạm vi về triển vọng của công việc trong hệ thống kho dữ liệu. Những yếu tố phụ thuộc vào các nền công nghệ Chúng ta cần trả lời cho các câu hỏi Ai, phòng ban nào cần sử dụng kho dữ liệu? Trong từng phòng ban cần biết những ai được sử dụng và sử dụng để làm gì ? Phạm vi những câu hỏi, những vấn đề đặt ra, số lượng báo cáo và số lượng những thông tin cần nhập vào kho Kích thước của metamodel của kho dữ liệu thế nào? Metamodel là mô hình xử lí cá định nghĩa của kho dữ liệu. Kích thước này sẽ xác định kích cỡ dữ liệu cần phải quản lí trong kho dữ liệu, điều này giúp ta cài đặt hệ thống dễ dàng hơn Số lượng bên trong kho dữ liệu là bao nhiêu ? kho dữ liệu không chỉ chứa những dữ liệu hiện thời mà còn chứa những dữ liệu mang tính lịch sử được tập hợp lại qua nhiều năm. độ tổng hợp xác định khả năng nén của kho dữ liệu. Các nguồn dữ liệu là gì số lượng là bao nhiêu ? kho dữ liệu luôn nhập các thông tin từ các CSDL về sản xuất về những hoạt động nghiệp vụ hàng ngày Khả năng sử dụng dữ liệu từ các nguồn dữ liệu ? Nhiều CSDLđ xây dựng từ trước đến nay thiếu chọn lọc và chưa được làm sạch dữ liệu. Quyết định chọn những nguồn dữ liệu như thế sẽ làm chậm tiến độ cài đặt hệ thống. Các tài liệu về nguồn dữ liệu có tốt không ? những tài liệu mô tả về tổ chức dữ liệu trong các CSDL di sản cần thiết: chất lượng của các tài liệu đó sẽ ảnh hưởng đến công việc sàng lọc và làm sạch dữ liệu từ các nguồn để đưa vào kho dữ liệu. Khả năng của các mô hình logic và các công cụ phát triển phần mềm với sự trợ giúp của máy tính như thế nào? Có tồn tại những kho dữ liệu 6ương tự hay không ? số lượng người có kinh nghiệm và đã sử dụng kho dữ liệu Kho dữ liệu theo một định nghĩa nào đó là mở rộng thực sự về kiến trúc dữ liệu. 2. Xác định các yêu cầu của hệ thống Danh sách các yêu cầu đóng vai trò quan trọng trong việc đậc tả các chức năng của hệ thống và nó ảnh hưởng rất lớn đến chất lượng của hệ thống và nó ảnh hửng rất lớn đến khả năng mở rộng và phát triển của kho dữ liệu Khi phân tích các yêu cầu, chúng ta có thể chia ra làm các loại Các yêu cầu định nghĩa yêu cầu của người sử dụng định nghĩa yêu cầu của người phát triển định nghĩa yêu cầu của kiến trúc sư định nghĩa yêu cầu của chủ sở hữu Yêu cầu của chủ sở hữu đế xác định được yêu cầu của chủ sở hữu chúng ta phải trả lời những câu hỏi sau: -Tại sao phải xây dựng kho dữ liệu ? mục đích của kho dữ liệu Ai là người chủ đầu tư, tài trợ khách hàng? Kinh phí bao nhiêu ? Khi nào thì hệ thống hoàn thành Những đầu tư về môi trường công nghệ ? Kinh nghiệm để thực hiện dự án Những may rủi có thẻ sảy ra Những yêu cầu của kiến trúc sư Kiến trúc sư là người chụi trách nhiệm xây dựng những thành phần cơ sở của hệ thống kho dữ liệu nhằm đáp ứng các nhu cầu hiện tại và tương lai của một số tổ chức. Chất lượng xây dựng kết cấu phụ thuộc vào: phạm vi chức năng của hệ thống, sử dụng các chuẩn và giao diện mở, khả năng mở rộng và phát triển của hệ thống Khi xây dựng các kiến trúc sư lưu ý tới ba loại kiến trúc : Kiến trúc dữ liệu: mô tả các hạng thức dữ liệu và các quan hệ của chúng Kiến trúc các trương trình ứng dụng: hệ thống được xem như là tổ hợp các trương trình ứng dụng. Loại kiến trúc này thự chất là catalog các trương trình ứng dụng thực hiện theo các chức năng mà chúng quan tâm. Mỗi trương trình ứng dụng có thể truy nhập chéo tới một hay nhiều phần tử dữ liệu Kiến trúc công nghệ: loại kiến trúc này mô tả tất cả các thành phần công nghệ. Hệ thống được chia thành những phần dễ dàng sử dụng những công nghệ hiện đại như máy tính chủ, giao diện đồ hoạ. c. Yêu cầu của những người xây dựng hệ thống Các kiến trúc sư quan tâm đến những khía cạnh trừu tượng, còn những người xây dựng hệ thống lại quan tâm đến những vấn đề cụ thể của kho dữ liệu. Họ có những yêu cầu về dữ liệu, cacá trương trình ứng dụng và những công nghệ cụ thể để phát triển những ứng dụng máy tính, giao diện và các CSDL, mạng truyền tin....những yêu cầu này sẽ liên quan đến nhiều đặc tả hệ thống Các yêu cầu về công nghệ Đối với các khối, các nguồn dữ liệu chúng ta cần biết về các meta dữ liệu, sàng lọc dữ liệu và meta dữ liệu quản trị, meta dữ liệu truyền thông, các bộ phận tác nghiệm xử lí , môi trường tác nghiệp và chuẩn hoá Đối với các nguồn kho dữ liệu cần thiết quá trình làm mịn và tái tạo lại *Các yêu cầu về triển khai Duy trì tính nhất quán, tin cậy và đồng thời của thông tin Quản lí được meta và metadata của kho dữ liệu đảm bảo được rằng cơ chế trao đổi tin, CSDL luôn được thông suốt. Có chính sách, thủ tục đảm bảo được quyền truy nhập được an toàn. Quản lí được kích cỡ CSDL sử dụng trong các kho dữ liệu kể cả những hệ thống cực lớn. d. Những yêu cầu của người phát triển và trình độ của họ Để có thể hệ thống kho dữ liệu thì cần phải có một đội ngũ cán bộ có trình độ phát triển phần mềm, vừa có khả năng nắm bắt các lĩnh vực chuyên môn của nghiệp vụ, có kinh nghiệm về xử lí dữ liệu, kết hợp được vơí nhau để có thể thực hiện dự án đề ra e. Những yêu cầu của người sử dụng đầu cuối Những người sử dụng đầu cuối xem kho dữ liệu như là hộp đen khổng lồ chứa nhiều dữ liệu mà họ chỉ có thể xem được thông qua những câu hỏi, những phần mềm và những trương trình ứng dụng để lấy được thông tin cần thiết và quý giá cho các hoạt động của họ. Yêu câu của người sử dụng có thể phân loại như sau: Theo dòng sử lí công việc là cách sử lí tự động của các dữ liệu thích hợp từ hình ảnh âm thanh và dữ liệu trong nghiệp vụ, để xác định những yêu cầu của câu hỏi này chúng ta phải trả lời được những câu hỏi: hệ thống kho dữ liệu giúp cho họ giải quyết các dòng công việc của họ như thế nào? Những yêu cầu về các lĩnh vực mà các câu hỏi người sử dụng đề cập đến: đó là những tình huống gồm cả các thuật ngữ như hoá đơn, bán hàng, giao hàng và những đơn vị liên quan như phòng ban xí nghiệp, công ty, khách hàng. Những yêu cầu làm báo cáo: những hoạt động sự kiệncần tổng kết, đánh giá theo các khoảng thời gian thông thường cần làm báo cáo như ngày, tuần, tháng, quý, năm ... ngoài ra người sử dụng còn có thể xác định được yêu cầu về dữ liệu, kiểu dữ liệu cần thiết để phân tích và thực hiện những công việc tính toán và xử lí sau khi chúng được kết xuất từ hệ thống kho dữ liệu. Người sử dụng nhiều thì cần: Phân tích dữ liệu theo nhiều chiều khác nhau Khai thác, tìm hiểu sâu hơn các mẫu dữ liệu còn bị ấu kím Xây dựng các mô hình tác nghiệp như sử dụng các bảng tính điện tử chẳng hạn Theo dõi sự biến đổi dữ liệu hay có thể cập nhật cụ

Các file đính kèm theo tài liệu này:

  • doc35349.doc