MỤC LỤC
LỜ I MỞ ĐẦ U
1. Lý do chọn đề tài .7
2. Mục tiêu và nhiệm vụ nghiên cứu.8
3. Đối tượng và phạm vi nghiên cứu .9
4.Phương phá p nghiên cứ u.9
5. Lịch sử nghiên cứu vấn đề . 10
6. Nguồn tà i liêụ tham khảo. 16
7. Bố cuc̣ của luận văn. 17
CHƢƠNG 1: SỰ CẦN THIẾT CỦA SỐ HOÁ TÀI LIỆU TẠI KHO LƢU TRỮ
TRUNG ƢƠNG
1.1. Chức năng, nhiệm vụ, quyền hạn của Cục Lƣu trữ Văn phòng Trung ƣơng
Đảng. . 19
1.2. Phạm vi, khối lƣợng, thành phần, nội dung tài liệu trong Kho Lƣu trữ
Trung ƣơng Đảng. . 22
1.3. Tình trạng vật lý của tài liệu. 29
1.4. Tình hình khai thác sử dụng tại Kho Lƣu trữ Trung ƣơng. 30
1.5. Chủ trƣơng của Bộ Chính trị, Ban Bí thƣ, Văn phòng Trung ƣơng, Ban Chỉ
đạo Công nghệ thông tin của cơ quan Đảng về số hoá tài liệu . 35
1.6. Sự cần thiết số hoá tài liệu lƣu trữ Kho Lƣu trữ Trung ƣơng Đảng. 40
TIỂU KẾT CHƢƠNG 1 . 41
CHƢƠNG 2: THỰC TRẠNG CÔNG TÁC SỐ HOÁ TÀI LIỆU TẠI KHO
LƢU TRỮ TRUNG ƢƠNG
2.1. Khái quát về số hoá tài liệu lƣu trữ . 43
115 trang |
Chia sẻ: Thành Đồng | Ngày: 11/09/2024 | Lượt xem: 10 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Luận văn Số hóa tài liệu lưu trữ tại kho lưu trữ Trung Ương Đảng khảo sát, đánh giá và kiến nghị, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
52
Trƣớc khi tiến hành các trình tự số hoá tài liệu thì những nhà quản lý
cần xác định một số công việc nhƣ: mục tiêu số hoá, sƣu tầm tài liệu, lựa chọn
công nghệ, số hoá nguồn tài liệu, vận hành, bảo quản và cung cấp dữ liệu..
Xác định mục tiêu số hoá (số hoá để khai thác, sử dụng hay số hoá để
bảo hiểm hay số hoá để dùng cho cả bảo hiểm và khai thác sử dụng): đây là
yêu tố quan trọng để các nhà quản lý quyết định các vấn đề quan trọng trong
quá trình số hoá nhƣ đầu tƣ trang thiết bị, con ngƣời, công nghệ và kinh phí
Sưu tầm tài liệu: đây là công đoạn đầu tiên trong quy trình số hoá tài
liệu, bao gồm việc cân nhắc, lựa chọn và xác định những đối tƣợng tài liệu
nào đƣợc đƣa vào số hoá. Các nhà quản lý lƣu trữ cần đƣa ra những tiêu chí
cụ thể làm cơ sở và căn cứ cho việc lựa chọn tài liệu nhƣ: vấn đề bản quyền,
nội dung tài liệu, điều kiện bảo quản hiện tại
Lựa chọn công nghệ: đóng vai trò rất quan trọng bởi đây là công cụ đắc
lực giúp cơ quan thông tin thực hiện các công việc trong quy trình tạo lập và
vận hành bộ sƣu tập số. Công nghệ để tiến hành số hoá sau khi đƣợc tạo lập
sẽ dễ dàng, thuận tiện cho ngƣời dùng tiếp cận; có đủ độ tin cậy cho ngƣời
quản trị và kỹ thuật viên trong quá trình tạo lập, bảo quản và cung cấp dữ liệu
trong quá trình hoạt động của bộ sƣu tập; đáp ứng đầy đủ các yêu cầu về
chuẩn nghiệp nghiệp vụ lƣu trữ; dễ dàng trao đổi dữ liệu với các chuẩn khác,
có công cụ sao lƣu an toàn dữ liệu.
Để bộ sƣu tập số phát huy đƣợc hết tác dụng, lƣu trữ khi thực hiện tạo
lập bộ sƣu tập số cần phải có cơ sở hạ tầng sau: hệ thống mạng intranet đƣợc
kết nối internet với đƣờng truyền đủ đáp ứng cho số ngƣời dùng tối thiểu của
Kho Lƣu trữ; hệ thống máy chủ đủ mạnh để đáp ứng việc lƣu trữ, bảo quản,
cung cấp dữ liệu và quản lý ngƣời dùng và các phần mềm hệ thống có bản
quyền; trang web đăng tải và là cổng truy cập của ngƣời dùng vào bộ sƣu tập;
phần mềm quản lý tài liệu số. Phần mềm quản lý tài liệu số phải đáp ứng các
53
yêu cầu nhƣ: tạo siêu dữ liệu theo 3 dạng (siêu dữ liệu mô tả: mô tả các thông
tin về tài liệu; siêu dữ liệu cấu trúc: mô tả các liên kết giữa các đối tƣợng
thông tin liên quan của tài liệu nhƣ mục lục, phụ lục, hình ảnh minh hoạ
giúp ngƣời dùng dễ dàng di chuyển đến các thành phần của tài liệu; siêu dữ
liệu theo tệp tài liệu (tệp toàn văn): gồm tạo kích cỡ tập tin, định dạng tài liệu
(PDF), đặc tính sử dụng và tình trạng của tài liệu); mô tả dữ liệu (theo một
trong các chuẩn siêu dữ liệu MARC, Dubli Core, ISO 2709 trong đó chuẩn
Dublin Core tƣơng đối phổ biến cho tài liệu điện tử vì có khả năng tuỳ biến
cho các tiêu chuẩn khác với 15 trƣờng biên mục); vận hành liên kết (tạo ra
một giao diện tra cứu tích hợp cho ngƣời dùng trên nhiều bộ sƣu tập cùng một
lúc dựa trên các điểm truy cập nhất quán nhƣ tác giả, nhan đề tài liệu, từ khoá,
tiêu đề chủ đề); quản lý các nguồn dữ liệu truy cập đƣợc cho phép (phân
quyền truy cập vào tài liệu hoặc quản lý chế độ download của tài liệu)
Số hoá tài liệu: đây là công đoạn đòi hỏi đầu tƣ nhiều công sức, kinh
phí nhƣng lại là khâu dễ dàng thực hiện nhất, bởi hiện nay công nghệ số hoá
đã tiến bộ rất nhiều. Hiện nay, sau khi số hoá tài liệu sẽ cho ra một sản phẩm
tài liệu số đảm bảo chất lƣợng tốt, sắc nét, hình ảnh đẹp, giống 100% bản gốc
và đặc biệt còn cho phép tự động nhận dạng và tạo lập các siêu dữ liệu mô tả,
siêu dữ liệu cấu trúc, siêu dữ liệu tệp tài liệu của tài liệu ở định dạng XML.
Vận hành, bảo quản và cung cấp dữ liệu: trong quá trình quét tài liệu,
tạo sản phẩm số cho đến biên mục tài liệu số nên đƣợc sao lƣu, cất giữ bảo
quản ở các dạng: ổ cứng của máy chủ, trên CD-ROM, trên ổ cứng ngoài
Cung cấp, tải dữ liệu lên mạng: bao gồm việc đƣa bộ sƣu tập lên mạng
của lƣu trữ để phục vụ trực tuyến và thiết kế giao diện với ngƣời dùng; tạo ra
các công cụ sử dụng, chính sách khai thác đối với ngƣời dùng, ý kiến đóng
góp, đánh giá của ngƣời sử dụng, xây dựng các ứng dụng tuỳ biến, chính sách
phát triển nguồn tài liệu
54
Qua tìm hiểu, tác giả thấy chƣa có một quy trình chuẩn (ISO) cho việc
số hoá tài liệu. Các quốc gia, các cơ quan tổ chức thƣờng tự nghiên cứu, ban
hành quy trình để thực hiện trong một quốc gia, một cơ quan, tổ chức nhƣ:
Tại Việt Nam, Quy trình số hóa tài liệu lưu trữ do Cục Văn thư và Lưu
trữ Nhà nước ban hành theo Quyết định số 176/QĐ-VTLTNN ngày
21/10/2011 hiện đang đƣợc nhiều Trung tâm Lƣu trữ thực hiện. Qui trình gồm
12 bƣớc nhƣ sau:
Bƣớc 1: Giao nhận và vận chuyển tài liệu về nơi nhận.
Bƣớc 2: Chuẩn bị tài liệu:
a, Nhận tài liệu;
b, Bóc, tách và làm phẳng tài liệu
c, Xác định và đặt tiêu chụp đặc biệt
Bƣớc 3: Thực hiện số hóa tài liệu:
a, Nhận tài liệu;
b, Khởi động máy quét, máy tính, thiết bị lƣu điện và tạo lập thƣ mục lƣu
ảnh;
c, Thực hiện số hoá và lƣu ảnh
Bƣớc 4: Chuyển ảnh từ các máy trạm về máy chủ.
Bƣớc 5: Kiểm tra số lƣợng, chất lƣợng ảnh, quyets lại các ảnh chƣa đạt
yêu cầu (nếu có).
Bƣớc 6: Loại bỏ các files ảnh là tiêu chụp đặc biệt trong dữ liệu ảnh
màu và đặt tên files ảnh.
Bƣớc 7: Sao lƣu toàn bộ dữ liệu ảnh đen trắng, dữ liệu ảnh màu sang ổ cứng.
Bƣớc 8: Lập danh mục thống kê số lƣợng ảnh theo hồ sơ.
55
Bƣớc 9: Bàn giao dữ liệu ảnh đen trắng cho đơn vị ghi phim và dữ liệu
ảnh màu cho đơn vị quản lý cơ sở dữ liệu..
Bƣớc 10: Chuyển dữ liệu ảnh màu vào hệ thống quản lý cơ sở dữ liệu.
Bƣớc 11: Vận chuyển và bàn giao tài liệu cho kho bảo quản.
Bƣớc 12: Lập hồ sơ về việc số hoá phông/khối tài liệu.
Tại Trung Quốc, ngày 01/9/2005, Cục Lƣu trữ Quốc gia đã phê chuẩn
“Quy phạm kỹ thuật trong số hóa tài liệu lưu trữ giấy” và đây chính là căn cứ
để số hóa tài liệu lƣu trữ giấy truyền thống.
Trên cơ sở lý thuyết và thực tiễn thực hiện ở một số quốc gia, chúng ta
có thể nhận thấy qui trình số hóa tài liệu lƣu trữ giấy bao gồm các nội dung
chủ yếu sau:
Một là, chỉnh lý hồ sơ:
Chỉnh lý hồ sơ là việc tiến hành chỉnh lý một cách phù hợp đối với các
hồ sơ đƣợc quét (Scan).
Trƣớc khi quét, cần phải tiến hành chỉnh lý đối với tài liệu lƣu trữ, đặc
biệt là tài liệu lƣu trữ hiện hành. Cho dù hiện nay, tài liệu đã đƣợc nộp lƣu
theo “cặp”, nhƣng vẫn cần phải chỉnh lý. Vì vậy, bƣớc thứ nhất của chỉnh lý
là chia cặp. Đầu tiên phải quét các hồ sơ trong cùng một cặp và không quét
các cặp đã tách. Trong khi quét tài liệu trong cặp, đƣa các ảnh, tranh vào trang
chỉ định; chú ý trình tự độ phân giải khi quét, đƣa ảnh thực tế vào phần mềm
xử lý ảnh rồi tiến hành quét lại, thay đổi các chỉ số (nếu cần) ở trang chỉ định,
tiếp đó điền dữ liệu vào bảng “Điền dữ liệu trong quá trình xử lý”
Quá trình xử lý gia công dữ liệu
TT Tên gọi
tuyến
thuỷ lƣu
Tên gọi
nhiệm
vụ
Tên gọi
trình tự
công
việc
Tên
ngƣời
làm
Thời
gian bắt
đầu
Thời gian
kết thúc
Ghi
chú
56
Bƣớc 2 là phân trang, với các tài liệu lƣu trữ đã đƣợc quét vẫn tiến
hành đánh số trang, ghi tiêu chuẩn số cặp.
Bƣớc 3 là dỡ hồ sơ, trừ các vật đã để nguyên xi trong tài liệu lƣu trữ,
còn lại ta tiếp tục tiến hành công việc quét, sau đó có thể quét lại số đó. Sau
khi quét xong phải dựa vào yêu cầu bảo quản mà đóng lại khôi phục nhƣ ban
đầu. Nhƣng đối với tài liệu lƣu trữ văn thƣ thì không cần phải đóng gói, có
thể bảo tồn theo cặp hồ sơ.
Hai là, xây dựng kho mục lục:
Căn cứ vào “Quy tắc danh mục tài liệu lƣu trữ” DA/T 18-1999 xác định
cho phần danh mục tài liệu lƣu trữ, để tiến hành làm danh mục. Mục lục của
một danh mục tốt sẽ đƣợc nhập vào máy tính, từ đó xây dựng kho dữ liệu mục
lục. Trong quá trình làm danh mục, định dạng dữ liệu đƣợc lựa chọn phải
thông dụng, nó phải thích hợp để có thể tiến hành trao đổi dữ liệu thông qua
tài liệu XML hoặc định dạng tài liệu DBF một cách gián tiếp hoặc trực tiếp.
Ba là, quét tài liệu:
Phƣơng thức quét tài liệu lƣu trữ giấy gồm 2 loại: quét theo chế độ đen
trắng và chế độ hình ảnh nhiều mầu liên tục. Đối với tài liệu giấy là chữ đơn
sắc, chữ phải rõ ràng, không có kèm theo tƣ liệu lƣu trữ bằng hình ảnh, lựa
chọn chế độ quét đen trắng. Đối với tƣ liệu lƣu trữ bằng hình ảnh nhiều màu
và các loại chữ có màu, độ nét không rõ ràng hoặc tài liệu lƣu trữ có kèm hình
ảnh, lựa chọn chế độ quét hình ảnh nhiều màu liên tục.
Độ nét (độ phân giải) khi quét phải đạt 100 dpi trở lên. Cần căn cứ vào
độ nét mà điều chỉnh độ phân giải.
Trong khi quét có thể sẽ gặp một số trang đặc thù, ta cần điều chỉnh các
chế độ cho thích hợp, ví nhƣ chữ bé phải điều chỉnh cho lớn lên, khoảng cách
dãn ra, chế độ màu cũng phải lựa chọn thích hợp, lựa chọn kỹ thuật phù hợp
để giải quyết từng vấn đề cụ thể.
57
Nếu trong tài liệu lƣu trữ có kèm hình ảnh, để bảo đảm bố cục và hình
ảnh đó luôn đƣợc rõ nét nhƣ lúc ban đầu, có thể dùng chế độ khôi phục ở độ
phân giải cao hoặc lựa chọn kỹ thuật quét màu để đƣa bức tranh cùng các chữ
trên tài liệu theo một chế độ quét. Nếu nhƣ có ảnh trong tài liệu lƣu trữ, có thể
chọn quét theo định dạng JPEG, xác định rõ độ nét của film, của bức ảnh,
đồng thời tránh lƣu trữ những bức ảnh chiếm không gian quá lớn.
Do những bức ảnh sau khi đƣợc số hóa sẽ đƣợc đặt vào các thiết bị để
phục vụ trên mạng, vì vậy phải bố trí vào các khu vực có kết nối mạng để có
thể truyền tải tới ngƣời khai thác sử dụng. cần bảo đảm dữ liệu trong khu vực
mạng đó có độ rộng bằng 10 Base – T, hình ảnh hiển thị bình quân là 1 giây.
Trên mạng truyền tải tới ngƣời khai thác sử dụng, tốc độ mạng internet phải
đạt 56 Kbit/s, hình ảnh hiển thị bình quân là 5 giây. Vì thế yêu cầu dung
lƣợng lƣu trữ của bức ảnh số trên trang lƣu trữ chỉ trong phạm vi 50K.
Bốn là, xử lý dữ liệu:
Sau khi kết thúc việc quét, cần tiến hành xử lý dữ liệu, đặc biệt cần chú
ý hiệu chỉnh các bức ảnh đã đƣợc quét.
Thông qua hai lần hiệu chỉnh, các vấn đề về độ nét, độ chuẩn và chất
lƣợng của bức ảnh sẽ đƣợc kiểm tra đầy đủ. Kết hợp với tình trạng thực chiếu
theo bảng (Quá trình xử lý gia công dữ liệu), chúng ta tiến hành xử lý theo
các chuẩn đã đề ra đối với một ảnh. Sau khi xử lý, những bức ảnh nào không
phù hợp với quy cách sẽ tiếp tục đƣợc xử lý làm mới. Khi đã đƣợc kết quả
quét tài liệu lƣu trữ giấy, tiếp tục trải qua quá trình kiểm tra dữ liệu, tiếp đó
đƣa tranh vào thiết bị để bảo tồn, đồng thời xây dựng danh mục (mục lục) về
mối quan hệ của tranh với tài liệu lƣu trữ đó, tức là ta điền địa chỉ bảo tồn của
ảnh vào thiết bị phục vụ mà các đƣờng dẫn sẽ thông qua mục lục đƣa ta tới
kho dữ liệu có chứa tranh, công việc này có thể tiến hành thông qua phần
mềm quản lý tài liệu lƣu trữ.
58
Định dạng của các tranh đƣợc số hóa để lƣu trữ thƣờng đƣợc mã nén
theo định dạng JPEG hay TIFF
Nhƣ vậy, số hoá tài liệu lƣu trữ phụ thuộc rất lớn vào mục đích sử
dụng, tình hình thực tế (nhân lực, tài chính, thiết bị.) của các lƣu trữ. Trên
thực tế, để một dự án số hoá tài liệu lƣu trữ đƣợc thực hiện phải trải qua nhiều
giai đoạn khác nhau: giai đoạn chuẩn bị số hoá (xây dựng kế hoạch, xác định
mục tiêu, lựa chọn, chuẩn bị tài liệu), giai đoạn tiến hành số hoá (scan và
thiết lập hệ thống ảnh; đặt tên file; tạo siêu dữ liệu) và giai đoạn quản lý, sử
dụng tài liệu sau khi số hoá (quản lý cơ sở dữ liệu, tổ chức khai thác sử
dụng). Các giai đoạn trong quy trình số hoá tài liệu lƣu trữ tác động lẫn
nhau và ảnh hƣởng đến kết quả cuối cùng của việc số hoá. Số hoá tài liệu lƣu
trữ là công việc phức tạp và cần đầu tƣ lớn.
2.2. Thực trạng số hoá tài liệu tại Kho Lưu trữ Trung ương
2.2.1. Tiêu chí để lựa chọn tài liệu số hoá:
Đây là việc hết sức quan trọng, bởi không có Kho Lƣu trữ nào có khả
năng số hoá toàn bộ kho tài liệu.
Khi lựa chọn tài liệu trƣớc hết cần chú trọng đến nhu cầu thông tin (nội
dung, ngôn ngữ, dạng tài liệu) của ngƣời khai thác, sử dụng mà Kho Lƣu
trữ đang phục vụ. Đặc biệt là nhu cầu về nội dung tài liệu/giá trị tri thức của
tài liệu gốc.
Thứ hai là cần tuyển lựa các tài liệu tiềm năng/đặc thù mà Kho Lƣu trữ
mình đang lƣu giữ, các kho lƣu trữ khác không có.
Thứ ba là tính tới các tài liệu chỉ có một bản, tài liệu sắp hƣ hỏng khó hồi
phục.
Thứ tƣ là tài liệu quý hiếm.
Thứ năm là tài liệu chƣa có nơi nào số hoá để tránh trùng lặp.
59
Đặc biệt khi lựa chọn tài liệu lƣu trữ thuộc diện số hoá phải đƣợc tiến
hành theo phông hoặc sƣu tập lƣu trữ và chỉ áp dụng đối với những phông,
sƣu tập hoặc những khối tài liệu đƣợc chỉnh lý hoàn chỉnh, đƣợc bảo quản
vĩnh viễn trong Kho Lƣu trữ Trung ƣơng.
Tóm lại, khi xây dựng kế hoạch số hoá của một kho, một phông hay
một sƣu tập tài liệu, cần nghiên cứu để phân loại, sắp xếp thứ tự số hoá trƣớc
hoặc sau để đảm bảo công tác số hoá tài liệu đạt đƣợc mục tiêu tốt nhất cho
các Kho Lƣu trữ.
Hiện nay, Văn phòng Trung ƣơng Đảng cũng nhƣ Cục Lƣu trữ có văn
bản chính thức về các tiêu chí để lựa chọn tài liệu đƣa ra số hoá của Kho Lƣu
trữ Trung ƣơng nói riêng và hệ thống cấp uỷ nói chung. Tuy nhiên, trên thực
tế, việc lựa chọn tài liệu đƣa ra số hoá tại Kho Lƣu trữ Trung ƣơng đã đáp
ứng đƣợc cơ bản các tiêu chí lựa chọn nhƣ: xác định thứ tự ƣu tiên là giá trị
thông tin, tình trạng vật lý của tài liệu và tần suất khai thác, sử dụng tài liệu.
Trong đó, giá trị thông tin của tài liệu là yếu tố quyết định; tình trạng vật lý
của tài liệu và tần số khai thác, sử dụng tài liệu là những điều kiện bổ sung
nhằm xác định trật tự ƣu tiên thực hiện việc số hoá. Với những yêu cầu đó,
nếu các phông lƣu trữ có giá trị nhƣ nhau thì trƣớc hết ƣu tiên số hoá những
phông mà tài liệu có tình trạng vật lý kém hoặc những tài liệu có tần xuất sử
dụng cao. Bên cạnh đó khi xác định, lựa chọn tài liệu lƣu trữ có giá trị đặc
biệt để số hoá đã vận dụng các tiêu chuẩn xác định giá trị tài liệu (ý nghĩa của
đơn vị hình thành phông; tác giả tài liệu; thời gian hình thành nên tài liệu; ý
nghĩa nội dung của tài liệu; hiệu lực pháp lý, độ gốc của tài liệu; các đặc điểm
bên ngoài của tài liệu)
Tuy nhiên trên thực tế, việc lựa chọn tài liệu cần đƣợc linh hoạt, mềm
dẻo hơn. Ví dụ: trƣớc mắt có thể lựa chọn những tài liệu có tình trạng vật lý
kém (có thể giá trị và tần suất sử dụng không bằng các tài liệu khác) để ƣu
tiên số hoá trƣớc.
60
2.2.2. Các phông, tài liệu được số hoá
Hiện nay, số phông, tài liệu số hoá mới đƣợc một số ít (tài liệu tên gọi
Trung ƣơng từ khoá I đến khoá IX và Phông Đại hội đại biểu toàn quốc lần
thứ XI)
Trong hai dự án Kho Lƣu trữ Điện tử và bảo hiểm tài liệu bằng số hoá -
microfilm cũng đã xác định số hoá các phông, sƣu tập trong thời gian tới
nhằm phục vụ hai dự án này, gồm:
- Các sƣu tập tài liệu của Đảng trƣớc năm 1945 gồm: sƣu tập các tổ
chức tiền thân của Đảng, sƣu tập Hội nghị hợp nhất - Đại hội I - Ban Thƣờng
vụ Trung ƣơng, sƣu tập sách báo, truyền đơn của Đảng.
- Phông Ban chấp hành Trung ƣơng Đảng từ khóa I đến IX.
- Phông Đại hội đại biểu toàn quốc lần thứ II đến lần thứ X của Đảng.
- Phông Chủ tịch
Các file đính kèm theo tài liệu này:
- luan_van_so_hoa_tai_lieu_luu_tru_tai_kho_luu_tru_trung_uong.pdf