Luận văn Số hóa tài liệu lưu trữ tại kho lưu trữ Trung Ương Đảng khảo sát, đánh giá và kiến nghị

MỤC LỤC

LỜ I MỞ ĐẦ U

1. Lý do chọn đề tài .7

2. Mục tiêu và nhiệm vụ nghiên cứu.8

3. Đối tượng và phạm vi nghiên cứu .9

4.Phương phá p nghiên cứ u.9

5. Lịch sử nghiên cứu vấn đề . 10

6. Nguồn tà i liêụ tham khảo. 16

7. Bố cuc̣ của luận văn. 17

CHƢƠNG 1: SỰ CẦN THIẾT CỦA SỐ HOÁ TÀI LIỆU TẠI KHO LƢU TRỮ

TRUNG ƢƠNG

1.1. Chức năng, nhiệm vụ, quyền hạn của Cục Lƣu trữ Văn phòng Trung ƣơng

Đảng. . 19

1.2. Phạm vi, khối lƣợng, thành phần, nội dung tài liệu trong Kho Lƣu trữ

Trung ƣơng Đảng. . 22

1.3. Tình trạng vật lý của tài liệu. 29

1.4. Tình hình khai thác sử dụng tại Kho Lƣu trữ Trung ƣơng. 30

1.5. Chủ trƣơng của Bộ Chính trị, Ban Bí thƣ, Văn phòng Trung ƣơng, Ban Chỉ

đạo Công nghệ thông tin của cơ quan Đảng về số hoá tài liệu . 35

1.6. Sự cần thiết số hoá tài liệu lƣu trữ Kho Lƣu trữ Trung ƣơng Đảng. 40

TIỂU KẾT CHƢƠNG 1 . 41

CHƢƠNG 2: THỰC TRẠNG CÔNG TÁC SỐ HOÁ TÀI LIỆU TẠI KHO

LƢU TRỮ TRUNG ƢƠNG

2.1. Khái quát về số hoá tài liệu lƣu trữ . 43

pdf115 trang | Chia sẻ: Thành Đồng | Ngày: 11/09/2024 | Lượt xem: 51 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Luận văn Số hóa tài liệu lưu trữ tại kho lưu trữ Trung Ương Đảng khảo sát, đánh giá và kiến nghị, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
52 Trƣớc khi tiến hành các trình tự số hoá tài liệu thì những nhà quản lý cần xác định một số công việc nhƣ: mục tiêu số hoá, sƣu tầm tài liệu, lựa chọn công nghệ, số hoá nguồn tài liệu, vận hành, bảo quản và cung cấp dữ liệu.. Xác định mục tiêu số hoá (số hoá để khai thác, sử dụng hay số hoá để bảo hiểm hay số hoá để dùng cho cả bảo hiểm và khai thác sử dụng): đây là yêu tố quan trọng để các nhà quản lý quyết định các vấn đề quan trọng trong quá trình số hoá nhƣ đầu tƣ trang thiết bị, con ngƣời, công nghệ và kinh phí Sưu tầm tài liệu: đây là công đoạn đầu tiên trong quy trình số hoá tài liệu, bao gồm việc cân nhắc, lựa chọn và xác định những đối tƣợng tài liệu nào đƣợc đƣa vào số hoá. Các nhà quản lý lƣu trữ cần đƣa ra những tiêu chí cụ thể làm cơ sở và căn cứ cho việc lựa chọn tài liệu nhƣ: vấn đề bản quyền, nội dung tài liệu, điều kiện bảo quản hiện tại Lựa chọn công nghệ: đóng vai trò rất quan trọng bởi đây là công cụ đắc lực giúp cơ quan thông tin thực hiện các công việc trong quy trình tạo lập và vận hành bộ sƣu tập số. Công nghệ để tiến hành số hoá sau khi đƣợc tạo lập sẽ dễ dàng, thuận tiện cho ngƣời dùng tiếp cận; có đủ độ tin cậy cho ngƣời quản trị và kỹ thuật viên trong quá trình tạo lập, bảo quản và cung cấp dữ liệu trong quá trình hoạt động của bộ sƣu tập; đáp ứng đầy đủ các yêu cầu về chuẩn nghiệp nghiệp vụ lƣu trữ; dễ dàng trao đổi dữ liệu với các chuẩn khác, có công cụ sao lƣu an toàn dữ liệu. Để bộ sƣu tập số phát huy đƣợc hết tác dụng, lƣu trữ khi thực hiện tạo lập bộ sƣu tập số cần phải có cơ sở hạ tầng sau: hệ thống mạng intranet đƣợc kết nối internet với đƣờng truyền đủ đáp ứng cho số ngƣời dùng tối thiểu của Kho Lƣu trữ; hệ thống máy chủ đủ mạnh để đáp ứng việc lƣu trữ, bảo quản, cung cấp dữ liệu và quản lý ngƣời dùng và các phần mềm hệ thống có bản quyền; trang web đăng tải và là cổng truy cập của ngƣời dùng vào bộ sƣu tập; phần mềm quản lý tài liệu số. Phần mềm quản lý tài liệu số phải đáp ứng các 53 yêu cầu nhƣ: tạo siêu dữ liệu theo 3 dạng (siêu dữ liệu mô tả: mô tả các thông tin về tài liệu; siêu dữ liệu cấu trúc: mô tả các liên kết giữa các đối tƣợng thông tin liên quan của tài liệu nhƣ mục lục, phụ lục, hình ảnh minh hoạ giúp ngƣời dùng dễ dàng di chuyển đến các thành phần của tài liệu; siêu dữ liệu theo tệp tài liệu (tệp toàn văn): gồm tạo kích cỡ tập tin, định dạng tài liệu (PDF), đặc tính sử dụng và tình trạng của tài liệu); mô tả dữ liệu (theo một trong các chuẩn siêu dữ liệu MARC, Dubli Core, ISO 2709 trong đó chuẩn Dublin Core tƣơng đối phổ biến cho tài liệu điện tử vì có khả năng tuỳ biến cho các tiêu chuẩn khác với 15 trƣờng biên mục); vận hành liên kết (tạo ra một giao diện tra cứu tích hợp cho ngƣời dùng trên nhiều bộ sƣu tập cùng một lúc dựa trên các điểm truy cập nhất quán nhƣ tác giả, nhan đề tài liệu, từ khoá, tiêu đề chủ đề); quản lý các nguồn dữ liệu truy cập đƣợc cho phép (phân quyền truy cập vào tài liệu hoặc quản lý chế độ download của tài liệu) Số hoá tài liệu: đây là công đoạn đòi hỏi đầu tƣ nhiều công sức, kinh phí nhƣng lại là khâu dễ dàng thực hiện nhất, bởi hiện nay công nghệ số hoá đã tiến bộ rất nhiều. Hiện nay, sau khi số hoá tài liệu sẽ cho ra một sản phẩm tài liệu số đảm bảo chất lƣợng tốt, sắc nét, hình ảnh đẹp, giống 100% bản gốc và đặc biệt còn cho phép tự động nhận dạng và tạo lập các siêu dữ liệu mô tả, siêu dữ liệu cấu trúc, siêu dữ liệu tệp tài liệu của tài liệu ở định dạng XML. Vận hành, bảo quản và cung cấp dữ liệu: trong quá trình quét tài liệu, tạo sản phẩm số cho đến biên mục tài liệu số nên đƣợc sao lƣu, cất giữ bảo quản ở các dạng: ổ cứng của máy chủ, trên CD-ROM, trên ổ cứng ngoài Cung cấp, tải dữ liệu lên mạng: bao gồm việc đƣa bộ sƣu tập lên mạng của lƣu trữ để phục vụ trực tuyến và thiết kế giao diện với ngƣời dùng; tạo ra các công cụ sử dụng, chính sách khai thác đối với ngƣời dùng, ý kiến đóng góp, đánh giá của ngƣời sử dụng, xây dựng các ứng dụng tuỳ biến, chính sách phát triển nguồn tài liệu 54 Qua tìm hiểu, tác giả thấy chƣa có một quy trình chuẩn (ISO) cho việc số hoá tài liệu. Các quốc gia, các cơ quan tổ chức thƣờng tự nghiên cứu, ban hành quy trình để thực hiện trong một quốc gia, một cơ quan, tổ chức nhƣ: Tại Việt Nam, Quy trình số hóa tài liệu lưu trữ do Cục Văn thư và Lưu trữ Nhà nước ban hành theo Quyết định số 176/QĐ-VTLTNN ngày 21/10/2011 hiện đang đƣợc nhiều Trung tâm Lƣu trữ thực hiện. Qui trình gồm 12 bƣớc nhƣ sau: Bƣớc 1: Giao nhận và vận chuyển tài liệu về nơi nhận. Bƣớc 2: Chuẩn bị tài liệu: a, Nhận tài liệu; b, Bóc, tách và làm phẳng tài liệu c, Xác định và đặt tiêu chụp đặc biệt Bƣớc 3: Thực hiện số hóa tài liệu: a, Nhận tài liệu; b, Khởi động máy quét, máy tính, thiết bị lƣu điện và tạo lập thƣ mục lƣu ảnh; c, Thực hiện số hoá và lƣu ảnh Bƣớc 4: Chuyển ảnh từ các máy trạm về máy chủ. Bƣớc 5: Kiểm tra số lƣợng, chất lƣợng ảnh, quyets lại các ảnh chƣa đạt yêu cầu (nếu có). Bƣớc 6: Loại bỏ các files ảnh là tiêu chụp đặc biệt trong dữ liệu ảnh màu và đặt tên files ảnh. Bƣớc 7: Sao lƣu toàn bộ dữ liệu ảnh đen trắng, dữ liệu ảnh màu sang ổ cứng. Bƣớc 8: Lập danh mục thống kê số lƣợng ảnh theo hồ sơ. 55 Bƣớc 9: Bàn giao dữ liệu ảnh đen trắng cho đơn vị ghi phim và dữ liệu ảnh màu cho đơn vị quản lý cơ sở dữ liệu.. Bƣớc 10: Chuyển dữ liệu ảnh màu vào hệ thống quản lý cơ sở dữ liệu. Bƣớc 11: Vận chuyển và bàn giao tài liệu cho kho bảo quản. Bƣớc 12: Lập hồ sơ về việc số hoá phông/khối tài liệu. Tại Trung Quốc, ngày 01/9/2005, Cục Lƣu trữ Quốc gia đã phê chuẩn “Quy phạm kỹ thuật trong số hóa tài liệu lưu trữ giấy” và đây chính là căn cứ để số hóa tài liệu lƣu trữ giấy truyền thống. Trên cơ sở lý thuyết và thực tiễn thực hiện ở một số quốc gia, chúng ta có thể nhận thấy qui trình số hóa tài liệu lƣu trữ giấy bao gồm các nội dung chủ yếu sau: Một là, chỉnh lý hồ sơ: Chỉnh lý hồ sơ là việc tiến hành chỉnh lý một cách phù hợp đối với các hồ sơ đƣợc quét (Scan). Trƣớc khi quét, cần phải tiến hành chỉnh lý đối với tài liệu lƣu trữ, đặc biệt là tài liệu lƣu trữ hiện hành. Cho dù hiện nay, tài liệu đã đƣợc nộp lƣu theo “cặp”, nhƣng vẫn cần phải chỉnh lý. Vì vậy, bƣớc thứ nhất của chỉnh lý là chia cặp. Đầu tiên phải quét các hồ sơ trong cùng một cặp và không quét các cặp đã tách. Trong khi quét tài liệu trong cặp, đƣa các ảnh, tranh vào trang chỉ định; chú ý trình tự độ phân giải khi quét, đƣa ảnh thực tế vào phần mềm xử lý ảnh rồi tiến hành quét lại, thay đổi các chỉ số (nếu cần) ở trang chỉ định, tiếp đó điền dữ liệu vào bảng “Điền dữ liệu trong quá trình xử lý” Quá trình xử lý gia công dữ liệu TT Tên gọi tuyến thuỷ lƣu Tên gọi nhiệm vụ Tên gọi trình tự công việc Tên ngƣời làm Thời gian bắt đầu Thời gian kết thúc Ghi chú 56 Bƣớc 2 là phân trang, với các tài liệu lƣu trữ đã đƣợc quét vẫn tiến hành đánh số trang, ghi tiêu chuẩn số cặp. Bƣớc 3 là dỡ hồ sơ, trừ các vật đã để nguyên xi trong tài liệu lƣu trữ, còn lại ta tiếp tục tiến hành công việc quét, sau đó có thể quét lại số đó. Sau khi quét xong phải dựa vào yêu cầu bảo quản mà đóng lại khôi phục nhƣ ban đầu. Nhƣng đối với tài liệu lƣu trữ văn thƣ thì không cần phải đóng gói, có thể bảo tồn theo cặp hồ sơ. Hai là, xây dựng kho mục lục: Căn cứ vào “Quy tắc danh mục tài liệu lƣu trữ” DA/T 18-1999 xác định cho phần danh mục tài liệu lƣu trữ, để tiến hành làm danh mục. Mục lục của một danh mục tốt sẽ đƣợc nhập vào máy tính, từ đó xây dựng kho dữ liệu mục lục. Trong quá trình làm danh mục, định dạng dữ liệu đƣợc lựa chọn phải thông dụng, nó phải thích hợp để có thể tiến hành trao đổi dữ liệu thông qua tài liệu XML hoặc định dạng tài liệu DBF một cách gián tiếp hoặc trực tiếp. Ba là, quét tài liệu: Phƣơng thức quét tài liệu lƣu trữ giấy gồm 2 loại: quét theo chế độ đen trắng và chế độ hình ảnh nhiều mầu liên tục. Đối với tài liệu giấy là chữ đơn sắc, chữ phải rõ ràng, không có kèm theo tƣ liệu lƣu trữ bằng hình ảnh, lựa chọn chế độ quét đen trắng. Đối với tƣ liệu lƣu trữ bằng hình ảnh nhiều màu và các loại chữ có màu, độ nét không rõ ràng hoặc tài liệu lƣu trữ có kèm hình ảnh, lựa chọn chế độ quét hình ảnh nhiều màu liên tục. Độ nét (độ phân giải) khi quét phải đạt 100 dpi trở lên. Cần căn cứ vào độ nét mà điều chỉnh độ phân giải. Trong khi quét có thể sẽ gặp một số trang đặc thù, ta cần điều chỉnh các chế độ cho thích hợp, ví nhƣ chữ bé phải điều chỉnh cho lớn lên, khoảng cách dãn ra, chế độ màu cũng phải lựa chọn thích hợp, lựa chọn kỹ thuật phù hợp để giải quyết từng vấn đề cụ thể. 57 Nếu trong tài liệu lƣu trữ có kèm hình ảnh, để bảo đảm bố cục và hình ảnh đó luôn đƣợc rõ nét nhƣ lúc ban đầu, có thể dùng chế độ khôi phục ở độ phân giải cao hoặc lựa chọn kỹ thuật quét màu để đƣa bức tranh cùng các chữ trên tài liệu theo một chế độ quét. Nếu nhƣ có ảnh trong tài liệu lƣu trữ, có thể chọn quét theo định dạng JPEG, xác định rõ độ nét của film, của bức ảnh, đồng thời tránh lƣu trữ những bức ảnh chiếm không gian quá lớn. Do những bức ảnh sau khi đƣợc số hóa sẽ đƣợc đặt vào các thiết bị để phục vụ trên mạng, vì vậy phải bố trí vào các khu vực có kết nối mạng để có thể truyền tải tới ngƣời khai thác sử dụng. cần bảo đảm dữ liệu trong khu vực mạng đó có độ rộng bằng 10 Base – T, hình ảnh hiển thị bình quân là 1 giây. Trên mạng truyền tải tới ngƣời khai thác sử dụng, tốc độ mạng internet phải đạt 56 Kbit/s, hình ảnh hiển thị bình quân là 5 giây. Vì thế yêu cầu dung lƣợng lƣu trữ của bức ảnh số trên trang lƣu trữ chỉ trong phạm vi 50K. Bốn là, xử lý dữ liệu: Sau khi kết thúc việc quét, cần tiến hành xử lý dữ liệu, đặc biệt cần chú ý hiệu chỉnh các bức ảnh đã đƣợc quét. Thông qua hai lần hiệu chỉnh, các vấn đề về độ nét, độ chuẩn và chất lƣợng của bức ảnh sẽ đƣợc kiểm tra đầy đủ. Kết hợp với tình trạng thực chiếu theo bảng (Quá trình xử lý gia công dữ liệu), chúng ta tiến hành xử lý theo các chuẩn đã đề ra đối với một ảnh. Sau khi xử lý, những bức ảnh nào không phù hợp với quy cách sẽ tiếp tục đƣợc xử lý làm mới. Khi đã đƣợc kết quả quét tài liệu lƣu trữ giấy, tiếp tục trải qua quá trình kiểm tra dữ liệu, tiếp đó đƣa tranh vào thiết bị để bảo tồn, đồng thời xây dựng danh mục (mục lục) về mối quan hệ của tranh với tài liệu lƣu trữ đó, tức là ta điền địa chỉ bảo tồn của ảnh vào thiết bị phục vụ mà các đƣờng dẫn sẽ thông qua mục lục đƣa ta tới kho dữ liệu có chứa tranh, công việc này có thể tiến hành thông qua phần mềm quản lý tài liệu lƣu trữ. 58 Định dạng của các tranh đƣợc số hóa để lƣu trữ thƣờng đƣợc mã nén theo định dạng JPEG hay TIFF Nhƣ vậy, số hoá tài liệu lƣu trữ phụ thuộc rất lớn vào mục đích sử dụng, tình hình thực tế (nhân lực, tài chính, thiết bị.) của các lƣu trữ. Trên thực tế, để một dự án số hoá tài liệu lƣu trữ đƣợc thực hiện phải trải qua nhiều giai đoạn khác nhau: giai đoạn chuẩn bị số hoá (xây dựng kế hoạch, xác định mục tiêu, lựa chọn, chuẩn bị tài liệu), giai đoạn tiến hành số hoá (scan và thiết lập hệ thống ảnh; đặt tên file; tạo siêu dữ liệu) và giai đoạn quản lý, sử dụng tài liệu sau khi số hoá (quản lý cơ sở dữ liệu, tổ chức khai thác sử dụng). Các giai đoạn trong quy trình số hoá tài liệu lƣu trữ tác động lẫn nhau và ảnh hƣởng đến kết quả cuối cùng của việc số hoá. Số hoá tài liệu lƣu trữ là công việc phức tạp và cần đầu tƣ lớn. 2.2. Thực trạng số hoá tài liệu tại Kho Lưu trữ Trung ương 2.2.1. Tiêu chí để lựa chọn tài liệu số hoá: Đây là việc hết sức quan trọng, bởi không có Kho Lƣu trữ nào có khả năng số hoá toàn bộ kho tài liệu. Khi lựa chọn tài liệu trƣớc hết cần chú trọng đến nhu cầu thông tin (nội dung, ngôn ngữ, dạng tài liệu) của ngƣời khai thác, sử dụng mà Kho Lƣu trữ đang phục vụ. Đặc biệt là nhu cầu về nội dung tài liệu/giá trị tri thức của tài liệu gốc. Thứ hai là cần tuyển lựa các tài liệu tiềm năng/đặc thù mà Kho Lƣu trữ mình đang lƣu giữ, các kho lƣu trữ khác không có. Thứ ba là tính tới các tài liệu chỉ có một bản, tài liệu sắp hƣ hỏng khó hồi phục. Thứ tƣ là tài liệu quý hiếm. Thứ năm là tài liệu chƣa có nơi nào số hoá để tránh trùng lặp. 59 Đặc biệt khi lựa chọn tài liệu lƣu trữ thuộc diện số hoá phải đƣợc tiến hành theo phông hoặc sƣu tập lƣu trữ và chỉ áp dụng đối với những phông, sƣu tập hoặc những khối tài liệu đƣợc chỉnh lý hoàn chỉnh, đƣợc bảo quản vĩnh viễn trong Kho Lƣu trữ Trung ƣơng. Tóm lại, khi xây dựng kế hoạch số hoá của một kho, một phông hay một sƣu tập tài liệu, cần nghiên cứu để phân loại, sắp xếp thứ tự số hoá trƣớc hoặc sau để đảm bảo công tác số hoá tài liệu đạt đƣợc mục tiêu tốt nhất cho các Kho Lƣu trữ. Hiện nay, Văn phòng Trung ƣơng Đảng cũng nhƣ Cục Lƣu trữ có văn bản chính thức về các tiêu chí để lựa chọn tài liệu đƣa ra số hoá của Kho Lƣu trữ Trung ƣơng nói riêng và hệ thống cấp uỷ nói chung. Tuy nhiên, trên thực tế, việc lựa chọn tài liệu đƣa ra số hoá tại Kho Lƣu trữ Trung ƣơng đã đáp ứng đƣợc cơ bản các tiêu chí lựa chọn nhƣ: xác định thứ tự ƣu tiên là giá trị thông tin, tình trạng vật lý của tài liệu và tần suất khai thác, sử dụng tài liệu. Trong đó, giá trị thông tin của tài liệu là yếu tố quyết định; tình trạng vật lý của tài liệu và tần số khai thác, sử dụng tài liệu là những điều kiện bổ sung nhằm xác định trật tự ƣu tiên thực hiện việc số hoá. Với những yêu cầu đó, nếu các phông lƣu trữ có giá trị nhƣ nhau thì trƣớc hết ƣu tiên số hoá những phông mà tài liệu có tình trạng vật lý kém hoặc những tài liệu có tần xuất sử dụng cao. Bên cạnh đó khi xác định, lựa chọn tài liệu lƣu trữ có giá trị đặc biệt để số hoá đã vận dụng các tiêu chuẩn xác định giá trị tài liệu (ý nghĩa của đơn vị hình thành phông; tác giả tài liệu; thời gian hình thành nên tài liệu; ý nghĩa nội dung của tài liệu; hiệu lực pháp lý, độ gốc của tài liệu; các đặc điểm bên ngoài của tài liệu) Tuy nhiên trên thực tế, việc lựa chọn tài liệu cần đƣợc linh hoạt, mềm dẻo hơn. Ví dụ: trƣớc mắt có thể lựa chọn những tài liệu có tình trạng vật lý kém (có thể giá trị và tần suất sử dụng không bằng các tài liệu khác) để ƣu tiên số hoá trƣớc. 60 2.2.2. Các phông, tài liệu được số hoá Hiện nay, số phông, tài liệu số hoá mới đƣợc một số ít (tài liệu tên gọi Trung ƣơng từ khoá I đến khoá IX và Phông Đại hội đại biểu toàn quốc lần thứ XI) Trong hai dự án Kho Lƣu trữ Điện tử và bảo hiểm tài liệu bằng số hoá - microfilm cũng đã xác định số hoá các phông, sƣu tập trong thời gian tới nhằm phục vụ hai dự án này, gồm: - Các sƣu tập tài liệu của Đảng trƣớc năm 1945 gồm: sƣu tập các tổ chức tiền thân của Đảng, sƣu tập Hội nghị hợp nhất - Đại hội I - Ban Thƣờng vụ Trung ƣơng, sƣu tập sách báo, truyền đơn của Đảng. - Phông Ban chấp hành Trung ƣơng Đảng từ khóa I đến IX. - Phông Đại hội đại biểu toàn quốc lần thứ II đến lần thứ X của Đảng. - Phông Chủ tịch

Các file đính kèm theo tài liệu này:

  • pdfluan_van_so_hoa_tai_lieu_luu_tru_tai_kho_luu_tru_trung_uong.pdf
Tài liệu liên quan