Luận văn Xây dựng hệ GIR Việt Nam

Mục lục

Mục lục . 1

Danh mục hình ảnh . 4

Danh sách bảng biểu . 6

Giới thiệu . 7

Chương 1: Tổng quan về hệ thống truy vấn thông tin địa lý . 9

1.1 Giới thiệu: . 9

1.2 Các đặc điểm của thông tin địa lý: . 10

1.3 Ảnh hưởng của các phương pháp nhận thức không gian: . 12

1.4 Vai trò của từ điển địa lý và Ontology: . 14

1.5 Tìm kiếm thông tin địa lý: . 18

1.6 Hệ thống truy vấn thông tin địa lý Việt Nam: . 19

Chương 2: Lập chỉ mục cho nội dung tài liệu . 20

2.1 Các phương pháp lập chỉ mục: . 20

2.1.1 Phương pháp lập chỉ mục thuần theo nội dung (PT): . 20

2.1.2 Phương pháp 1 lập chỉ mục kết hợp nội dung - không gian (ST): . 22

2.1.3 Phương pháp 2 lập chỉ mục kết hợp nội dung - không gian (TS): . 24

2.1.4 Phương pháp 3 lập chỉ mục kết hợp không gian – nội dung (T): . 25

2.1.5 So sánh, đánh giá các phương pháp: . 26

2.2 Lựa chọn mô hình lập chỉ mục cho hệ GIR Việt Nam: . 31

Chương 3: Phân tích câu truy vấn . 32

3.1 Giới thiệu: . 32

3.2 Các khái niệm và công việc liên quan: . 33

3.3 Phân tích các thành phần trong câu truy vấn: . 34

3.4 Giải thuật phân tích các thành phần trong câu truy vấn: . 36

3.4.1 Xác định bộ ba <what, relation, where>: . 36

3.4.2 Xác định ý nghĩa thành phần where: . 42

3.4.3 Xác định ý nghĩa thành phần what: . 46

3.5 Đánh giá các giải thuật: . 50

Chương 4: Tìm kiếm và xếp hạng kết quả . 55

4.1 Giới thiệu: . 55

4.2 Tìm kiếm: . 55

4.2.1 Tìm kiếm theo vùng (Region-based Range Query): . 57

4.2.2 Tìm kiếm xung quanh điểm (Point-based Range Query): . 58

4.2.3 Tìm kiếm theo đường (Path-based Range Query): . 59

4.2.4 Đánh giá phương pháp tìm kiếm theo đường: . 64

4.3 Xếp hạng: . 66

4.3.1 Xếp hạng trong tìm kiếm theo vùng: . 67

4.3.2 Xếp hạng trong tìm kiếm xung quanh điểm: . 68

4.3.3 Xếp hạng trong tìm kiếm theo đường: . 69

Chương 5: Tổng kết và hướng phát triển . 71

5.1 Tổng kết: . 71

5.2 Hướng phát triển: . 71

Tài liệu tham khảo . 73

Phụ lục . 76

pdf2 trang | Chia sẻ: maiphuongdc | Lượt xem: 1710 | Lượt tải: 2download
Bạn đang xem nội dung tài liệu Luận văn Xây dựng hệ GIR Việt Nam, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
7 Giới thiệu Với sự bùng nổ của thông tin ngày nay thì yêu cầu đặt ra là làm thế nào để tiếp cận được với thông tin một cách hiệu quả, nhanh chóng và tiện lợi nhất. Theo một nghiên cứu cho thấy, đa phần các thông tin tồn tại trên thế giới này đều ít nhiều có liên quan đến một nơi nào đó. Do đó, giới hạn địa lý trong tìm kiếm là một tiêu chuẩn giúp các máy tìm kiếm có thể trả ra những kết quả chính xác hơn, phù hợp hơn với yêu cầu tìm kiếm. Ví dụ một người muốn tìm các tài liệu về tình hình giáo dục ở Việt Nam, họ sẽ cảm thấy không hài lòng chút nào nếu trong các kết quả trả ra có những kết quả nói về tình hình giáo dục của Singapore hay bất kỳ một nơi nào khác. Nhằm giúp giải quyết tốt các dạng tìm kiếm liên quan đến vị trí địa lý như trên, các nhà khoa học trên thế giới nghĩ đến việc xây dựng một hệ thống truy vấn thông tin địa lý (Geographic Information Retrieval System – GIR System). Hệ thống truy vấn thông tin địa lý cũng chính là một hệ truy vấn thông tin (Information Retrieval - IR) thông thường, nó sẽ thực hiện các nhiệm vụ lập chỉ mục trên tài liệu, phân tích các câu truy vấn và tìm kiếm, xếp hạng kết quả sao cho phù hợp với yêu cầu từ phía người dùng nhưng sẽ dựa trên những đặc trưng của loại thông tin địa lý, của yếu tố không gian trong nội dung tài liệu, trong câu truy vấn, v.v… Không nằm ngoài tầm ảnh hưởng chung của việc bùng nổ thông tin. Các thông tin liên quan đến Việt Nam, mang tính cục bộ ở từng vùng, miền của Việt Nam cũng tăng lên từng ngày. Tuy nhiên, theo khảo sát thì hiện ở Việt Nam chưa có một hệ thống GIR nào được xây dựng để phục vụ nhu cầu tìm kiếm thông tin liên quan đến vị trí địa lý như cách mà thế giới tiếp cận, hầu hết các dịch vụ cung cấp khả năng tìm kiếm thông tin ở Việt Nam đều chưa quan tâm đến yếu tố không gian trong truy vấn từ phía người dùng cũng như là yếu tố không gian trong nội dung thông tin. Trong khi đó, các hệ thống tìm kiếm thông tin địa lý đang làm việc rất hiệu quả như Google Maps (Google Local) hay Live Maps thì lại không thể phục vụ được người dùng Việt Nam do trở ngại 8 về dữ liệu và sự khác biệt trong văn hóa ngôn ngữ. Với tình hình thực tế đó, luận văn này xin giới thiệu một số các giai đoạn quan trọng trong quá trính xây dựng một hệ thống GIR dùng cho Việt Nam, đồng thời tiến hành xây dựng hệ thống dựa trên những đặc trưng, kinh nghiệm, thói quen, nhận thức của người Việt Nam về thông tin địa lý và cách thức tìm kiếm thông tin liên quan đến vị trí, địa điểm thể hiện trong câu truy vấn. Phần tiếp theo của luận văn được trình bày theo cấu trúc như sau: Chương 1, luận văn sẽ trình bày sơ nét về hệ thống GIR cùng với những vấn đề sẽ gặp phải khi đi sâu vào nghiên cứu. Từ chương 2 đến chương 4 luận văn sẽ trình bày các giai đoạn chính, các vấn đề cũng như là các hướng tiếp cận để giải quyết vấn đề trong việc xây dựng hệ thống GIR cho Việt Nam, đó là các giai đoạn lập chỉ mục, xử lý câu truy vấn, tìm kiếm và xếp hạng kết quả, v.v… Chương 5 sẽ tổng kết lại những gì luận văn đã làm được và định hướng nghiên cứu, phát triển tiếp theo trong tương lai.

Các file đính kèm theo tài liệu này:

  • pdf3.pdf
  • pdf1.pdf
  • pdf2.pdf
  • pdf4.pdf
  • pdf5.pdf
  • pdf6.pdf
  • pdf7.pdf
  • pdf8.pdf
  • pdf9.pdf
  • pdf10.pdf