Luận văn Dự án số hóa tài liệu lưu trữ Trung tâm lưu trữ quốc gia III

MỤC LỤC

PHẦN MỞ ĐẦU .4

CHƢƠNG 1: HIỆN TRẠNG TÀI LIỆU LƢU TRỮ ĐANG BẢO QUẢN TẠI

TRUNG TÂM LƢU TRỮ QUỐC GIA III .10

1.1. Trung tâm Lƣu trữ Quốc gia III.10

1.2. Cơ cấu tổ chức và chức năng nhiệm vụ .10

1.3. Tình hình tài liệu lƣu trữ tại Trung tâm Lƣu trữ Quốc gia III .12

1.3.1. Nội dung và thành phần tài liệu lƣu trữ tại Trung tâm.12

1.3.2. Hình thức tài liệu lƣu trữ tại Trung tâm.17

1.3.3. Tình trạng vật lý của tài liệu lƣu trữ tại Trung tâm.17

1.3.4. Giá trị của tài liệu lƣu trữ tại Trung tâm .18

1.4. Nhận xét chung .20

CHƢƠNG 2: NGHIỆP VỤ SỐ HÓA TÀI LIỆU LƢU TRỮ.23

2.1. Một số khái niệm, thuật ngữ cơ bản về số hóa tài liệu lƣu trữ .23

2.1.1. Một số khái niệm cơ bản.23

2.1.2. Một số thuật ngữ chuyên môn về ảnh số, máy quét và máy tính.27

2.2. Mục tiêu áp dụng kỹ thuật số hóa đối với tài liệu lƣu trữ.28

2.3. Những ƣu điểm và hạn chế của kỹ thuật số hóa tài liệu lƣu trữ .33

2.3.1. Ƣu điểm.33

2.3.2. Hạn chế.34

2.4. Kỹ thuật số hóa tài liệu .35

2.4.1. Một số thiết bị chuyển đổi: máy scan, máy chụp ảnh số .35

2.4.2. Thuộc tính của tài liệu.36

2.4.3. Kỹ thuật quét tài liệu .37

2.4.4. Những yếu tố tác động đến chất lƣợng ảnh số.37

2.5. Nhận dạng ký tự quang học (OCR) .42

2.5.1. Giới thiệu về nhận dạng ký tự quang học .42

2.5.2. Mô hình tổng quát của một hệ nhận dạng chữ.43

2.6. Xây dựng siêu dữ liệu cho tài liệu đƣợc số hóa.44

2.6.1. Tạo lập metadata .44

2.6.2. Lựa chọn chuẩn dữ liệu đặc tả .45

2.6.3. Đề xuất metadata cho tài liệu đƣợc số hóa.48

CHƢƠNG 3: DỰ ÁN SỐ HÓA TÀI LIỆU LƢU TRỮ TRUNG TÂM LƢU TRỮ

QUỐC GIA III.51

3.1. Cơ sở lý luận và bối cảnh hình thành dự án.51

3.1.1. Hệ thống văn bản quản lý nhà nƣớc về công tác lƣu trữ .51

3.1.2. Tình hình triển khai thực hiện các dự án số hóa ở trong nƣớc.522

3.2. Mục tiêu của dự án.52

3.2.1. Mục tiêu chung.52

3.2.2. Mục tiêu cụ thể.53

3.3. Nội dung triển khai và giải pháp thực hiện.53

3.3.1. Giải pháp về quy trình số hóa .53

3.3.2. Giải pháp hệ thống công nghệ thực hiện số hóa .57

3.4. Dự toán kinh phí cho dự án.64

3.4.1. Tổng dự toán .64

3.4.2. Kinh phí số hóa tài liệu lƣu trữ hành chính.64

3.4.3. Kinh phí đầu tƣ trang thiết bị các hệ thống phần mềm ứng dụng.64

3.4.4. Kinh phí đầu tƣ xây dựng phần mềm ứng dụng.65

KẾT LUẬN .67

TÀI LIỆU THAM KHẢO .69

pdf75 trang | Chia sẻ: Thành Đồng | Ngày: 11/09/2024 | Lượt xem: 107 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Dự án số hóa tài liệu lưu trữ Trung tâm lưu trữ quốc gia III, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
nƣớc Anh, 1 inch = 2,54 cm). Đây là số điểm mà máy quét có thể nhận biết đƣợc trên 1 inch. Đây còn đƣợc gọi là độ phân giải quang học của máy quét. Ví dụ: 300 dpi có nghĩa là có 300 điểm trên mỗi 1 inch hoặc 2,54 cm. Thông thƣờng thuật ngữ này đƣợc áp dụng với máy in, máy quét, cũng có thuật ngữ tƣơng đƣơng với nó là PPI (Pixels Per Inch) nhƣng nó thƣờng đƣợc áp dụng với ảnh số, màn hình của máy tính. 2.2. Mục tiêu áp dụng kỹ thuật số hóa đối với tài liệu lƣu trữ Xuất phát với nhu cầu quản lý, sử dụng thông tin ngày càng nhiều của các bộ phận trong xã hội, chúng đòi hỏi việc tìm kiếm, xử lý , lƣu trữ nguồn thông tin phải đƣợc tiến hành một cách nhanh chóng, chính xác, tin cậy và chất lƣợng hơn. Đối với yêu cầu mới đặt ra này, các hình thức tổ chức thông tin truyền thống nói chung đã bộc lộ những mặt hạn chế, phần lớn không còn đáp ứng những vấn đề thực tiễn đang đặt ra, trong đó hình thức tổ chức quản lý, sử dụng tài liệu lƣu trữ truyền thống cũng không nằm ngoài điều này. Do sự phát triển, tiến bộ của khoa học-công nghệ, chúng đã mở ra cơ hội mới đồng thời cũng là thách thức mới đối với các ngành liên quan đến công tác quản lý nguồn thông tin nói chung, cơ quan lƣu trữ - là cơ quan tổ chức quản lý, bảo quản và sử dụng tài liệu lƣu trữ nói riêng, đó là việc áp dụng kỹ thuật số hóa đối với tài liệu. Đối với tài liệu lƣu trữ, mục tiêu trong việc áp dụng kỹ thuật số hóa chủ yếu tập trung vào 3 mục tiêu chính nhƣ sau: - Mục tiêu 1: Đồng nhất các loại hình tài liệu lƣu trữ từ dạng tƣơng tự sang dạng số 29 Nhƣ chúng ta đã biết, tài liệu lƣu trữ bao gồm nhiều loại hình trên các vật mang tin khác nhau nhƣ: trên giấy, ảnh, băng, phim, gỗ mỗi loại hình đều có đặc trƣng, thuộc tính riêng tƣợng trƣng cho bản thân chúng, chính điều này đã đặt ra các yêu cầu khác nhau về vấn đề quản lý, bảo quản và tổ chức sử dụng chúng. Do đó, đòi hỏi chúng ta cần áp dụng các biện pháp phù hợp để bảo quản, kéo dài tuổi thọ và tổ chức phát huy giá trị thông tin của chúng. Các biện pháp truyền thống đƣợc sử dụng nhƣ: bố trí, bảo quản từng loại hình tài liệu lƣu trữ tại kho, phòng lƣu trữ chuyên dụng khác nhau với các hệ thống phƣơng tiện, thiết bị, chế độ bảo quản, tổ chức sử dụng phù hợp. Xét về ba phƣơng diện nhƣ: bảo quản, quản lý và sử dụng sẽ thấy rằng đây là quy trình tách biệt, có khoảng cách với nhau khiến cho công tác lƣu trữ chậm chễ, rƣờm rà và mất nhiều thời gian. Nếu tất cả các loại hình tài liệu lƣu trữ trên đƣợc số hóa, tức chuyển từ các dạng tƣơng tự của vật mang tin khác nhau thành dạng tín hiệu số trong hệ thống cơ sở dữ liệu trong máy tính bằng phƣơng tiện, thiết bị số hóa thì khoảng cách giữa ba phƣơng diện này sẽ thu hẹp đáng kể và tập trung chỉ trong một dạng – dạng số. Điều này có thể đƣợc biểu hiện nhƣ sơ đồ dƣới đây: Hình 2.2: Mô hình các loại hình tài liệu lưu trữ được đồng nhất với nhau trong định dạng số bằng phương pháp số hóa Chính việc đồng nhất các loại hình tài liệu lƣu trữ từ dạng tƣơng tự sang tập trung với một dạng - dạng số trong một hệ thống cơ sở dữ liệu số hóa sẽ tạo khả năng vƣợt trội chƣa từng có về mặt bảo quản, quản lý và tổ chức sử dụng tài liệu lƣu trữ cho cơ quan lƣu trữ. Đồng thời tăng cƣờng khả năng tiếp cận nguồn thông tin lƣu trữ của 30 độc giả ngày càng rộng rãi, thuận lợi hơn và thu hẹp khoảng cách giữa cơ quan lƣu trữ và độc giả, làm cho hai bên xích lại gần nhau hơn. Điều này sẽ đƣợc đề cập cụ thể trong các mục tiêu tiếp theo. - Mục tiêu 2: Kéo dài tuổi thọ của tài liệu lƣu trữ bản gốc Trên cơ sở của mục tiêu đầu tiên, sau khi đã chuyển tài liệu lƣu trữ từ dạng tƣơng tự sang dạng số thì cơ quan lƣu trữ sẽ có tài liệu lƣu trữ ở hai dạng: dạng tƣơng tự (dạng truyền thống của tài liệu) và dạng số . Nếu quá trình chuyển đổi đảm bảo yêu cầu nhƣ: tính xác thực, toàn vẹn đối với nguyên bản gốc thì về cơ bản cả 2 dạng này không có gì quá khác biệt về nội dung thông tin, chỉ khác về hình thức thể hiện thông tin. Một mặt, phần lớn nhu cầu sử dụng tài liệu lƣu trữ chủ yếu là khai thác nội dung thông tin chứ không phải vật mang thông tin và khi nào cần làm căn cứ pháp lý, bằng chứng thì bản gốc mới đƣợc sử dụng đến. Do đó, nếu đảm bảo yếu tố tính xác thực và toàn vẹn của nội dung thông tin với nguyên bản gốc bằng các hình thức chứng thực với bản số thì chúng ta có thể sử dụng bản sao số hóa này thay thế trong việc tổ chức khai thác sử dụng mà trƣớc đây chủ yếu sử dụng bản gốc. Chính điều này đã tạo điều kiện thuận lợi đối với bản gốc của các loại hình tài liệu lƣu trữ mà phần lớn đã và đang trong tình trạng xuống cấp ở các mức độ nặ ng nhẹ khác nhau. Trên cơ sở đó, chúng sẽ đƣợc bảo quản an toàn trong kho lƣu trữ chuyên dụng, đƣợc hạn chế tiếp xúc với các yếu tố gây hƣ hỏng tài liệu (nhƣ: con ngƣời, môi trƣờng, vi sinh vật) trong quá trình vận chuyển, khai thác sử dụng. Ngoài ra, còn tạo điều kiện trong việc áp dụng các biện pháp nâng cao chất lƣợng tài liệu lƣu trữ đang trong tình trạng xuống cấp và kéo dài tuổi thọ của tài liệu nhƣ: tu bổ phục chế, chụp microfilm, sử dụng hóa chất để lấy nét chữ đối với tài liệu chữ mờ Bằng các biện pháp này sẽ tạo điều kiện trong việc kéo dài tuổi thọ của tài liệu lƣu trữ gốc. Vì vậy, chúng ta sẽ giải quyết một trong hai nhiệm vụ chính của công tác lƣu trữ là bảo quản an toàn và kéo dài tuổi thọ của tài liệu lƣu trữ bản gốc. - Mục tiêu 3: Quản lý và khai thác tập trung nguồn tài liệu số hóa Mục tiêu này có thể đƣợc thể hiện ở 2 cấp độ: một là trong phạm vi của một cơ quan lƣu trữ (lƣu trữ lịch sử); hai là trong phạm vi của hệ thống các cơ quan lƣu trữ (mạng lƣới lƣu trữ từ trung ƣơng đến địa phƣơng). Một, trong phạm vi của một cơ quan lƣu trữ đƣợc thể hiện nhƣ sau: 31 Hình 2.3: Mô hình quản lý và khai thác tập trung hệ thống cơ sở dữ liệu số hóa của các loại hình tài liệu lưu trữ Nhƣ hình trên, các loại hình tài liệu lƣu trữ khác nhau đang đƣợc bảo quản trong một trung tâm lƣu trữ sẽ đƣợc số hóa và đƣa vào tổ chức quản lý và khai thác sử dụng trong hệ thống cơ sở dữ liệu tập trung. So với hình thức truyền thống, chúng ta sẽ thấy rằng các loại hình tài liệu lƣu trữ này thông thƣờng phải nằm ở các kho, phòng bảo quản chuyên dụng khác nhau, thậm chí nằm ở những vị trí địa lý khác nhau. Điều này gây khó khăn trong việc quản lý tài liệu và tổ chức khai thác sử dụng tài liệu của cơ quan lƣu trữ cũng nhƣ việc tiếp cận nguồn tài liệu của độc gia. Nhƣng khi chúng đã đƣợc số hóa thì cơ quan lƣu trữ có thể : + Cung cấp nguồn thông tin cho độc giả đa dạng hơn bằng nhiều loại hình tài liệu lƣu trữ cùng một chủ đề hoặc có liên quan với nhau một cách nhanh chóng. Ví dụ: tài liệu lƣu trữ về sự kiện giải phóng miền Nam năm 1975, cơ quan lƣu trữ có thể cung cấp tài liệu số hóa không chỉ tài liệu mà bản gốc của nó là tài liệu lƣu trữ trên giấy, hơn nữa có thể cung cấp các loại tài liệu lƣu trữ ở dạng khác nhƣ: tài liệu trên ảnh, ghi âm, video cùng với sự kiện đó. + Quản lý, thống kế, báo cáo, tìm kiếm về cơ sở dữ liệu cũng nhƣ các quy trình cung cấp tài liệu cho độc giả sẽ đƣợc diễn ra một cách nhanh chóng, chính xác, tiết kiệm thời gian và sức lực bằng sự hỗ trợ của hệ thống phần cứng và phần mềm quản lý chuyên dụng nhƣ: công cụ tra cứu, tra tìm tự động, trang thông tin điện tử 32 + Tổ chức phục vụ nguồn thông tin lƣu trữ dƣới dạng số với nhiều hình thức đa dạng, phong phú vƣợt qua giới hạn về không gian và thời gian nhƣ: tổ chức giới thiệu, công bố, trao đổi và cung cấp nguồn thông tin, tổ chức triển lãm tài liệu lƣu trữ trên mạng nội bộ, internet Vì vậy, việc quản lý và tổ chức khai thác sử dụng tài liệu lƣu trữ đã đƣợc nâng cao rõ rệt. Hai, trong phạm vi của hệ thống các cơ quan lƣu trữ đƣợc thể hiện nhƣ sau: Hình 2.4: Mô hình kết nối các hệ thống cơ sở dữ liệu số hóa của các cơ quan lưu trữ các cấp và các cơ quan khác Xét trong phạm vi rộng hơn, nếu các cơ quan lƣu trữ các cấp đều có nguồn cơ sở dữ liệu số hóa của tài liệu lƣu trữ có giá trị cao về các mặt và đƣợc tổ chức khai thác rộng rãi thì mục tiêu lớn hơn của chúng ta là kết nối chúng vào với nhau nhƣ mô hình trên. Hơn nữa chúng còn đƣợc kết nối, trao đổi cơ sở dữ liệu hoặc giới thiệu với các lĩnh vực khác có liên quan nhƣ: thƣ viện, bảo tàng thông qua các trang thông tin của họ. Việc kết nối và trao đổi nhƣ vậy sẽ tạo nên một hệ thống mạng lƣới nguồn thông tin lƣu trữ khổng lồ, bao quát nhiều lĩnh vực. Mục tiêu này nhằm tạo điều kiện thuận lợi cho các đối tƣợng sử dụng nguồn thông tin lƣu trữ hoặc độc giả, điều này thể hiện rõ rệt ở hai phƣơng diện: không gian và thời gian trong việc tiếp cận nguồn tài liệu lƣu trữ. Thứ nhất về không gian, độc giả không còn phụ thuộc vào các kho bảo quản tài liệu lƣu trữ riêng biệt để tiếp cận đƣợc nguồn thông tin đó. Tức là dù tài liệu lƣu trữ 33 bản gốc sẽ phân tán ở những nơi bảo quản khác nhau về địa lý thì độc giả chỉ cần đến một trung tâm lƣu trữ cũng có thể tiếp cận đƣợc toàn bộ dữ liệu thông tin đó thông qua hệ thống cơ sở dữ liệu số hóa đƣợc kết nối tập trung, hơn nữa còn đƣợc mở rộng đến các lĩnh vực của nguồn tài nguyên số khác có liên quan nhƣ: thƣ viện, bảo tàng Ngoài ra, độc giả có thể ngồi ở nhà cũng có thể tiếp cận đƣợc chúng thông qua trang thông tin điện tử của cơ quan lƣu trữ nếu cơ sở dữ liệu đó đƣợc tổ chức khai thác sử dụng phổ biến. Điều này sẽ giúp độc giả tiết kiệm đƣợc thời gian, kinh phí và sức lực. Thứ hai về thời gian, việc tra cứu và truy cập nguồn thông tin tài liệu lƣu trữ số hóa sẽ đƣợc diễn ra một cách nhanh chóng, chính xác và tiện lợi vƣợt trội hơn bằng các chƣơng trình phần mềm tra cứu tự động và hệ thống cơ sở dữ liệu số hóa tập trung. Nếu cơ sở dữ liệu đƣợc sử dụng phổ biến trên trang thông tin điện tử thì độc giả có thể tiếp cận nguồn thông tin mọi lúc, mọi nơi 24/24 giờ mà điều này không thể diễn ra đối với hình thức tổ chức khai thác sử dụng truyền thống. Ngoài ra, độc giả vẫn có thể yêu cầu cung cấp thông tin theo chuyên đề, sự kiện đối với cơ quan lƣu trữ và đƣợc cung cấp thông qua hệ thống mạng theo sự thỏa thuận hợp pháp của hai bên. Cả hai quy mô này sẽ tạo điều kiện, tiền đề quan trọng trong việc tiến tới một xã hội thông tin, mọi ngƣời có thể tiếp cận đến nguồn thông tin lƣu trữ một cách thuận lợi, nhanh chóng. Điều này là sự mong chờ lâu này của cơ quan lƣu trữ cũng nhƣ độc giả. Nhƣ vậy, sức mạnh của nguồn thông tin lƣu trữ sẽ đƣợc truyền bá một cách rộng rãi và mạnh mẽ hơn bao giờ hết. Điều này sẽ tạo điều kiện thuận lợi đối với cơ quan lƣu trữ trong việc phát huy giá trị tài liệu lƣu trữ, đồng thời độc giả cũng tiếp cận đến nguồn thông tin đó rất thuận lợi hơn. Vì vậy, chúng ta sẽ giải quyết nhiệm vụ thứ hai của công tác lƣu trữ là tăng cƣờng khả năng phát huy giá trị nguồn thông tin tài liệu lƣu trữ một cách rộng rãi, đáp ứng nhu cầu của xã hội. Trên đây là ba mục tiêu chính trong việc áp dụng kỹ thuật số hóa đối với tài liệu lƣu trữ, đồng thời cũng là mục tiêu mà tôi đang hƣớng tới trong tƣơng lai đối với tài liệu lƣu trữ đang bảo quản tại Trung tâm Lƣu trữ Quốc gia III nói riêng, ngành lƣu trữ nói chung. Mặc dù việc đồng nhất các loại hình tài liệu lƣu trữ và quản lý tập trung hệ thống cơ sở dữ liệu số hóa chƣa đƣợc diễn ra cùng một lúc do điều kiện, hoàn cảnh thực tế của Trung tâm thì việc triển khai số hóa tài liệu lƣu trữ khối tài liệu hành chính (là khối tài liệu chiếm số lƣợng nhiều nhất tại Trung tâm hiện nay) cũng là việc rất cần thiết, là bƣớc đầu để tiến tới mục tiêu chung đó. Trong khuôn khổ của luận văn, tôi chỉ đề cập đến việc nghiên cứu triển khai số hóa khối tài liệu lƣu trữ hành chính này. 2.3. Những ƣu điểm và hạn chế của kỹ thuật số hóa tài liệu lƣu trữ 2.3.1. Ưu điểm Trong ngành lƣu trữ, hai nhiệm vụ quan trọng hàng đầu, đồng thời là nhiệm vụ quyết định đến sự tồn tại của các trung tâm lƣu trữ là việc bảo quản an toàn, kéo dài 34 tuổi thọ của tài liệu lƣu trữ và tổ chức khai thác sử dụng, phát huy giá trị thông tin trong tài liệu lƣu trữ ngày càng rộng rãi, đa dạng, phong phú về nội dung và hình thức phục vụ nhu cầu chính đáng, hợp pháp của độc giả. Việc số hóa tài liệu lƣu trữ có thể đáp ứng trong việc giải quyết những nhiệm vụ đặt ra này một cách hiệu quả nhƣ đã trình bày ở phần trên. Do đó, ƣu điểm chủ yếu của kỹ thuật số hóa tài liệu lƣu trữ có thể khái quát nhƣ sau: - Giúp nâng cao trong việc bảo quản an toàn tài liệu lƣu trữ bản gốc đang trong tình trạng hƣ hỏng về tình trạng vật lý và nội dung thông tin bằng cách sử dụng tài liệu số hóa thay thế việc sử dụng trực tiếp, thƣờng xuyên tài liệu gốc và áp dụng các biện pháp củng cố, nâng cao chất lƣợng đối với tài liệu gốc để kéo dài tuổi thọ. - Nâng cao việc quản lý và tổ chức sử dụng nguồn tài liệu lƣu trữ của cơ quan lƣu trữ phục vụ việc chia sẻ, tra tìm, truy cập nguồn thông tin của các đối tƣợng độc giả một cách nhanh chóng, chính xác, thuận tiện vƣợt qua giới hạn về không gian và thời gian. - Nâng cao chất lƣợng hiển thị của nguồn thông tin từ tài liệu lƣu trữ bản gốc (có tình trạng vật lý, nội dung kém nhƣ: mờ, vết bẩn, thủng) tốt hơn bằng chƣơng trình phần mềm hiệu chỉnh/đồ họa chuyên dụng nhƣ: tăng độ nét, độ sáng tối, xóa vết bẩn trên bề mặt tài liệu gốc - Góp phần hiện đại hóa công tác lƣu trữ của cơ quan lƣu trữ. - Kỹ thuật số hóa có thể đƣợc sử dụng để hỗ trợ lẫn nhau với các phƣơng pháp khác để tăng cƣờng khả năng bảo quản và tổ chức khai thác sử dụng tài liệu lƣu trữ một cách hiệu quả hơn. 2.3.2. Hạn chế Tuy việc số hóa tài liệu lƣu trữ mang lại nhiều lợi ích đối với cơ quan lƣu trữ và độc giả, nhƣng chúng cũng có những mặt hạn chế cần phải cân nhắc, thận trọng trƣớc khi quyết định áp dụng phƣơng pháp này. Những điều này đƣợc thể hiện qua các mặt sau: - Để áp dụng thành công phƣơng pháp này, đòi hỏi phải nghiên cứu, tính toán rất kỹ và khách quan, trên cơ sở đó lập kế hoạch phát triển cho phù hợp trong từng giai đoạn. - Phải đầu tƣ kinh phí tƣơng đối nhiều trong quá trình triển khai cũng nhƣ quản lý, sử dụng. - Tài liệu số hoá có thời hạn tuổi thọ không cao vì nó phụ thuộc vào vật mang tin, phần cứng, phần mềm tƣơng ứng. Do công nghệ thông tin thay đổi rất nhanh, 35 cho nên tài liệu số hóa cũng không ngừng phải nâng cấp theo. Điều này dẫn đến phải sử dụng kinh phí tƣơng đối nhiều. Mặt khác, để tiếp cận đƣợc dạng tài liệu này, chúng ta phải có thiết bị điện tử, phƣơng tiện kết nối thích hợp. - Đòi hỏi cán bộ có trình độ chuyên môn giỏi đáp ứng các yêu cầu công việc khác nhau trong từng

Các file đính kèm theo tài liệu này:

  • pdfluan_van_du_an_so_hoa_tai_lieu_luu_tru_trung_tam_luu_tru_quo.pdf
Tài liệu liên quan