Khóa luận Nghiên cứu vai trò của dữ liệu lớn trong điểm đến du lịch thông minh

Hiện nay có rất nhiều giải pháp khác nhau trong việc cải thiện chất lượng của dữ

liệu lớn, nhưng các đặc điểm dưới đây sẽ nâng cao chất lượng dữ liệu lớn hơn, đó là:

quản lý doanh thu, quản lý danh tiếng, tiếp thị chiến lược, trải nghiệm khách hàng,

nghiên cứu thị trường, tiếp thị mục tiêu.

- Quản lý doanh thu

Một trong những cách sử dụng dữ liệu lớn hiệu quả nhất trong ngành du lịch đó là

có liên quan đến quản lý doanh thu. Để tối đa hóa kết quả tài chính, khách sạn và các

công ty du lịch khác cần có khả năng bán đúng sản phẩm, đúng khách hàng, vào đúng

thời điểm, với mức giá phù hợp, thông qua kênh phù hợp và dữ liệu lớn có thể là vô giácho việc này. Cụ thể, dữ liệu nội bộ như tỷ lệ lấp đầy trong quá khứ, doanh thu phòng và

đặt phòng hiện tại có thể được kết hợp với dữ liệu bên ngoài, chẳng hạn như thông tin về

các sự kiện địa phương, chuyến bay và ngày nghỉ của trường, để dự đoán chính xác hơn

và dự đoán nhu cầu. Do đó, các khách sạn sau đó có khả năng quản lý giá và giá phòng

tốt hơn, tăng chúng vào những thời điểm có nhu cầu cao, để tối đa hóa doanh thu được

tạo ra

pdf58 trang | Chia sẻ: honganh20 | Ngày: 16/02/2022 | Lượt xem: 454 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Khóa luận Nghiên cứu vai trò của dữ liệu lớn trong điểm đến du lịch thông minh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ăm, các giai đoạn và các khái niệm liên quan đến vấn đề này. Theo cách tiếp cận thông minh, nền tảng công nghệ được cấu thành bởi ba thành phần công nghệ: dịch vụ điện toán đám mây, mạng internet và thiết bị người dùng cuối. Chương này cũng nhấn mạnh việc tăng cường tác động của công nghệ thông tin trong những năm tới sẽ hình thành một kịch bản mới cho quản lý được đặc trưng bởi công nghệ và quản lý dữ liệu. Tuy nhiên, hiệu quả của phương pháp STD sẽ không chỉ phụ thuộc vào công nghệ mà còn phụ thuộc vào quản trị điểm đến phù hợp, kết hợp một cách có hệ thống ba cấp độ của STD, cụ thể là các cấp độ quan hệ, công cụ và ứng dụng chiến lược [10]. • PHÂN TÍCH, ĐÁNH GIÁ VAI TRÒ CỦA DỮ LIỆU LỚN TRONG STD • Giới thiệu về dữ liệu lớn • Khái niệm dữ liệu Dữ liệu là chuỗi bất kỳ của một hoặc nhiều ký hiệu có ý nghĩa thông qua việc giải thích một hành động cụ thể nào đó. Dữ liệu cần phải được thông dịch để trở thành thông tin. Để dữ liệu thành thông tin, cần xem xét một số nhân tố bao gồm người (hoặc vật) sinh ra dữ liệu và thông tin được mong muốn từ dữ liệu đó. Thuật ngữ si HYPERLINK "https://vi.wikipedia.org/wiki/Si%C3%AAu_d%E1%BB%AF_li%E1%BB%87u"êu d HYPERLINK "https://vi.wikipedia.org/wiki/Si%C3%AAu_d%E1%BB%AF_li%E1%BB%87u"ữ liệu chỉ các dữ liệu được dùng làm dữ liệu tham khảo về một dữ liệu khác. Siêu dữ liệu có thể được ngầm hiểu, được chỉ định hoặc cho trước. Dữ liệu liên quan đến sự kiện hoặc quy trình vật lý thường có nhân tố thời gian. Trong hầu hết các trường hợp, nhân tố thời gian được ngầm hiểu. Dữ liệu có thể được tổ chức trong nhiều loại cấu trúc dữ liệu khác nhau, bao gồm mảng, đồ th HYPERLINK "https://vi.wikipedia.org/wiki/%C4%90%E1%BB%93_th%E1%BB%8B"ị và đối tượng. Cấu trúc dữ liệu lưu nhiều loại dữ liệu khác nhau, bao gồm số, chu HYPERLINK "https://vi.wikipedia.org/w/index.php?title=String_(computer_science)&action=edit&redl ink=1"ỗi và thậm chí các c HYPERLINK "https://vi.wikipedia.org/wiki/C%E1%BA%A5u_tr%C3%BAc_d%E1%BB%AF_li%E1%BB%87 u"ấu tr HYPERLINK "https://vi.wikipedia.org/wiki/C%E1%BA%A5u_tr%C3%BAc_d%E1%BB%AF_li%E1%BB%87 u"úc d HYPERLINK "https://vi.wikipedia.org/wiki/C%E1%BA%A5u_tr%C3%BAc_d%E1%BB%AF_li%E1%BB%87 u"ữ liệu khác. Dữ liệu ra vào máy tính thông qua các thi HYPERLINK "https://vi.wikipedia.org/wiki/Thi%E1%BA%BFt_b%E1%BB%8B_ngo%E1%BA%A1i_vi"ết bị ngoại vi [35]. • Khái niệm dữ liệu lớn Dữ liệu lớn là một trong những mô hình tiêu biểu nhất của nền kinh tế tri thức và là một lĩnh vực điều tra mới nổi cho các nhà nghiên cứu và thực hành. Do khả năng cung cấp cho các tổ chức và công ty một lượng dữ liệu khổng lồ và đa dạng, từ đó có thể giúp đạt được những hiểu biết vô giá [27] về quan điểm, sở thích, nhu cầu cũng như thái độ của khách hàng... Do đó, dữ liệu lớn đang được công nhận là nguồn chính tạo ra giá trị. Tuy nhiên, trong khi sự xuất hiện của dữ liệu lớn là xu hướng chung cho tất cả các ngành, nó trở nên đặc biệt phù hợp với ngành du lịch vì tính chất thông tin mạnh mẽ và sự phụ thuộc vào Công nghệ thông tin và truyền thông [18]. Từ quan điểm dựa trên thông tin, du lịch là một hiện tượng phức tạp, trong đó dữ liệu, thông tin, kiến thức từ và về khách du lịch, là cơ sở thiết yếu cho khả năng cạnh tranh và đổi mới của điểm đến. Ngoài ra, việc sử dụng các thiết bị công nghệ khác nhau trong cuộc sống hàng ngày, cùng với sự sinh sôi nảy nở của tất cả các loại cảm biến, tạo ra một kịch bản dữ liệu hóa dữ liệu, một quy trình chưa biết cho đến nay có thể được xác định là khả năng tạo dữ liệu, có thể được xử lý bằng máy tính [26]. Tuy nhiên, trái với những gì có vẻ thấy, không chỉ khối lượng dữ liệu quan trọng, sự đa dạng của dữ liệu và tốc độ mà nó được xử lý cũng xác định bản chất của dữ liệu lớn [34]. Trong thực tế, dữ liệu lớn có thể được gọi là một bộ dữ liệu giới hạn chức năng phù hợp của các tài nguyên có sẵn để lưu trữ, phục hồi, xử lý và phân tích dữ liệu. Do đó, kích thước phân biệt khái niệm dữ liệu lớn là khối lượng (kích thước lớn của bộ sưu tập dữ liệu), là sự đa dạng (cấu trúc khác nhau hoặc thiếu cấu trúc mà dữ liệu có thể có) và là vận tốc (tốc độ mà dữ liệu được tạo, truy cập và phân tích) [34]. Mặc dù khái niệm về dữ liệu lớn vẫn đang được tiến hành, nhưng ngày càng có nhiều bài viết dành cho vấn đề này, vì vậy tôi đã tiến hành tổng hợp về các khái niệm dữ liệu lớn chi tiết như ở Bảng 2. 1 • Các khái niệm về dữ liệu lớn theo từng tác giả qua các năm Tác giả Khái niệm Madde Dữ liệu lớn là một thuật ngữ cho việc xử lý một tập hợp dữ liệu rất lớn và phức tạp n, S (20150 [27] mà các ứng dụng xử lý dữ liệu truyền thống không xử lý được. Dữ liệu lớn bao gồm các thách thức như ph HYPERLINK "https://vi.wikipedia.org/wiki/Ph%C3%A2n_t%C3%ADch_k%E1%BB%B9_thu%E1%BA %ADt"ân tích, thu th HYPERLINK "https://vi.wikipedia.org/wiki/Truy_h%E1%BB%93i_th%C3%B4ng_tin"ập, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan, truy vấn và tính riêng tư. Thuật ngữ này thường chỉ đơn giản đề cập đến việc việc sử dụng các phân tích dự báo, phân tích hành vi người dùng, hoặc một số phương pháp phân tích dữ liệu tiên tiến khác trích xuất giá trị từ dữ liệu mà ít khi đề cập đến k HYPERLINK "https://vi.wikipedia.org/wiki/K%C3%ADch_th%C6%B0%E1%BB%9Bc"ích th HYPERLINK "https://vi.wikipedia.org/wiki/K%C3%ADch_th%C6%B0%E1%BB%9Bc"ước của bộ dữ liệu. Del Vecchi o, P (2017) [24] Dữ liệu lớn là một thuật ngữ phổ biến nhất và được sử dụng thường xuyên nhất để mô tả sự tăng trưởng theo cấp số nhân về tính sẵn có của dữ liệu trong thời hiện đại, có khả năng được duy trì hoặc thậm chí tăng tốc trong tương lai gần. Đây là một thuật ngữ rộng cho các bộ dữ liệu có kích thước lớn hoặc phức tạp đến mức các ứng dụng xử lý dữ liệu và công cụ phần mềm truyền thống không đủ để nắm bắt, quản lý và xử lý dữ liệu trong một khoảng thời gian hợp lý. DeVan, 2016; IBM, 2017; [34] Dữ liệu lớn là một thuật ngữ được sử dụng để mô tả các bộ dữ liệu cực lớn, phức tạp và phải phân tích các bộ dữ liệu đó để xác định các mẫu và xu hướng hữu ích hoặc thú vị. Các đặc điểm chính của Dữ liệu lớn thường được thể hiện dưới dạng 4V: - Volume (khối lượng): Một trong những đặc điểm mang tính biểu tượng nhất của Dữ liệu lớn là khối lượng lớn, với lượng dữ liệu khổng lồ được tạo ra bởi máy móc, mạng và tương tác của con người trên các hệ thống như phương tiện truyền thông xã hội. - Variety (tính đa dạng): Điều này đề cập đến nhiều nguồn và loại dữ liệu, cả có cấu trúc (ví dụ: cơ sở dữ liệu hoặc các định dạng tương tự khác) và không có cấu trúc (ví dụ: email, ảnh, video, thiết bị giám sát, PDF, âm thanh, v. v. ) Các loại dữ liệu sau tạo ra những thách thức đáng kể cho việc lưu trữ, khai thác và phân tích dữ liệu. - Velocity (vận tốc): Điều này liên quan đến tốc độ khổng lồ mà dữ liệu mới được tạo ra, bao gồm cả trong thời gian thực, cũng như tốc độ phân tích cần phải diễn ra để sử dụng dữ liệu đó. - Veracity (độ chính xác): Điều này liên quan đến sự sai lệch, tiếng ồn và sự bất thường trong dữ liệu - tức là chất lượng của chính dữ liệu. Dữ liệu phải được củng cố, làm sạch, nhất quán và hiện hành để tạo điều kiện cho các quyết định đúng đắn. Mazón Lospez (2017) [8] Dữ liệu lớn là một trong những mô hình tiêu biểu nhất của nền kinh tế tri thức trên thế giới và đại diện cho một lĩnh vực điều tra mới nổi dành cho các nhà nghiên cứu và các học viên. Do khả năng cung cấp cho các tổ chức và công ty một lượng dữ liệu khổng lồ và đa dạng từ đó có thể đạt được những hiểu biết vô giá về quan điểm, sở thích, nhu cầu, thái độ của khách hàng Dữ liệu lớn đang được công nhận là nguồn chính tạo ra giá trị (Nguồn tổng hợp năm 2020) • Đặc điểm của dữ liệu lớn Đặc điểm của dữ liệu lớn được gói gọn trong 5V (value) đó là: volume (khối lượng), variety (sự đa dạng), velocity (tốc độ), veracity (độ chính xác) và value (giá trị). Đây chính là điểm nhấn độc đáo dùng để xác định dữ liệu lớn trong du lịch. • Volume (khối lượng) Khối lượng đứng đầu danh sách các đặc điểm dữ liệu lớn, đây là yếu tố chính gây ra vấn đề tại sao các hệ thống quản lý cơ sở dữ liệu quan hệ truyền thống không xử lý được dữ liệu lớn (39). Khối lượng dữ liệu lớn về du lịch đến từ các điểm bán hàng hoặc các kênh phân phối truyền thống là khác nhau (ví dụ như trung tâm cuộc gọi, trang web, cơ sở, bản tin, quan hệ khách hàng ). Nội dung của dữ liệu lớn về du lịch được tạo ra hàng ngày, hoặc thậm chí hàng giờ và vấn đề cần quan tâm là việc hiểu ý nghĩa của thông tin, chuyển đổi dữ liệu lớn thành dữ liệu thông minh và sau đó sử dụng nó để lập ra kế hoạch du lịch. • Variety (sự đa dạng) Một đặc điểm quan trọng khác của dữ liệu lớn, cả về chi phí và dễ sử dụng, là sự đa dạng của dữ liệu bắt nguồn từ tất cả các công nghệ có thể truy cập. Tính đa dạng mô tả các định dạng khác nhau của dữ liệu không vay mượn để lưu trữ trong các hệ thống cơ sở dữ liệu quan hệ có cấu trúc. Các định dạng của dữ liệu lớn bao gồm một danh sách dài các dữ liệu như tài liệu, e-mail, tin nhắn, văn bản, hình ảnh, đồ thị, video và đầu ra từ tất cả các loại dữ liệu do máy tạo từ điện thoại di động, tín hiệu GPS, cảm biến, nhật ký máy và các thiết bị phân tích DNA [30]. Đặc trưng của loại dữ liệu này là không cấu trúc hoặc bán cấu trúc và luôn luôn tồn tại. Hầu hết 80% thông tin liên quan đến du lịch bắt nguồn từ dạng không có cấu trúc và các tổ chức chỉ có thể dựa vào 20% dữ liệu có cấu trúc, ví dụ: hệ thống quản lý tài sản (PMS), hệ thống quản lý nội dung web hoặc blog (CMS) hoặc hệ thống quản lý quan hệ khách hàng (CMS). Các hệ thống (CRM) chỉ có thể xử lý dữ liệu có cấu trúc, trong khi các tùy chọn của khách hàng, dữ liệu tại các điểm tiếp xúc khác nhau lại ở dạng dữ liệu phi cấu trúc hoặc bán cấu trúc. Điều này đòi hỏi các công nghệ mới phải phân tích chúng để phát triển hoặc cải tiến các sản phẩm và dịch vụ mới. • Velocity (tốc độ) Đặc điểm chính thứ ba của dữ liệu lớn là vận tốc, hay còn gọi là tốc độ phản ứng. Có ba khía cạnh quan trọng của vận tốc dữ liệu lớn về du lịch [30]. Khía cạnh đầu tiên là thu thập, lưu trữ và phân tích thống nhất và đầy đủ các luồng dữ liệu lớn di chuyển nhanh, ví dụ: luồng đọc từ cảm biến hoặc lịch sử weblog của các lượt truy cập trang và nhấp chuột của mỗi khách truy cập vào trang web. Khía cạnh thứ hai là các đặc điểm của tính kịp thời hoặc độ trễ. Chúng ta nên nắm bắt, lưu trữ và sử dụng dữ liệu lớn trong một khoảng thời gian trễ nhất định tùy thuộc vào loại thông tin vì một số dữ liệu có giá trị trong khi một số dữ liệu sẽ không còn ý nghĩa sau một khoảng thời gian rất ngắn. Khía cạnh thứ ba là tốc độ mà dữ liệu lớn phải được lưu trữ và truy xuất; kiến thức của việc nắm bắt, phân tích và triển khai phải hỗ trợ quay vòng thời gian thực (trong trường hợp này là các phân số của giây); và phải làm điều này một cách nhất quán trên hàng ngàn khách hàng mới. Ví dụ, trong du lịch, vấn đề đáng quan tâm là làm thế nào để gửi đúng lời đề nghị đến đúng người vào đúng thời điểm khi người đó đến điểm đến và bạn nên làm gì nếu ai đó đăng ký vào khách sạn của bạn và được bổ nhiệm vào phòng và quyết định tweet về nó hơn là gọi cho quầy lễ tân. Lấy các hãng hàng không trong ngành kinh doanh du lịch làm ví dụ, quản lý doanh thu năng động có thể thay đổi giá kịp thời theo các thuật toán phức tạp dựa trên các hành vi trực tuyến của khách hàng. • Veracity (độ chính xác) Độ chính xác có nghĩa là tính trung thực và chính xác của dữ liệu được cung cấp theo ngữ cảnh, sự đa dạng của các điểm giao tiếp, điểm cảm ứng, và tốc độ xảy ra. Độ chính xác của dữ liệu lớn đề cập đến sự sai lệch, nhiễu và bất thường trong dữ liệu: Dữ liệu được lưu trữ và khai thác có ý nghĩa đối với vấn đề được phân tích không? So với khối lượng và vận tốc, tính chính xác trong phân tích dữ liệu là thách thức lớn nhất. Khi phát triển một chiến lược dữ liệu lớn, bạn cần nhóm của mình và các đối tác giúp bạn giữ sạch dữ liệu của mình và có các quy trình để giữ dữ liệu bẩn không bị tích lũy trong hệ thống của bạn. • Value (giá trị) Giá trị được xem là một đặc tính quan trọng khác của dữ liệu lớn. Giá trị của dữ liệu lớn về du lịch có thể được mô tả bằng ứng dụng mới lạ của nó trong ngành du lịch. Đầu tiên, đó là ứng dụng cá nhân hóa dữ liệu lớn về du lịch. Tiếp thị cá nhân và thiết kế sản phẩm nhắm mục tiêu là những cơ hội cực kỳ mạnh mẽ có thể thu được từ dữ liệu lớn [30]. Sử dụng một loạt các cuộc phỏng vấn được thực hiện trong ngành du lịch, Radovich [30] đã chỉ ra cách dữ liệu lớn có thể được sử dụng để tăng tác động và giảm ma sát giữa các ngành, cả trong một công ty và trong công nghiệp. Cá nhân hóa là một nguyên lý chính của dữ liệu lớn. Để giành chiến thắng một cách hiệu quả nhất khi cá nhân hóa, các công ty du lịch lớn phải làm việc trên cơ sở dữ liệu thông tin để thu thập vô số dữ liệu được người tiêu dùng xử lý tại các điểm khác nhau. Ứng dụng có giá trị thứ hai của dữ liệu lớn về du lịch là trải nghiệm lấy khách hàng làm trung tâm. Khách hàng nên là trung tâm của mọi nỗ lực dữ liệu lớn. Nếu thu thập dữ liệu lớn được xem là đáng sợ hoặc xâm lấn, người tiêu dùng sẽ không hài lòng và lòng trung thành sẽ bị mất. Tuy nhiên, tất cả các dấu hiệu cho thấy người tiêu dùng sẵn sàng chấp nhận sự xâm nhập lớn vào hành vi của họ nếu sản phẩm kết quả được nhắm mục tiêu nhiều hơn và có thể dự đoán nhu cầu của họ trong suốt quá trình trải nghiệm. • Phân loại dữ liệu lớn Dữ liệu lớn cung cấp những hiểu biết sâu sắc chưa từng có của khách hàng trong quá trình ra quyết định bằng cách cho phép các công ty theo dõi và phân tích các mô hình mua sắm, khuyến nghị, hành vi mua hàng của khách hàng và các quá trình điều khiển khác có ảnh hưởng đến doanh số. Các cơ quan và tổ chức liên quan đến du lịch có thể tìm ra những cách sáng tạo để sử dụng nguồn tài nguyên dữ liệu dồi dào này để kết nối với khách truy cập tiềm năng ở mọi giai đoạn của chuyến đi và sử dụng các nguồn dữ liệu lớn để hiểu rõ hơn và kịp thời về nhân khẩu học của khách truy cập tăng trưởng nhanh nhất. Họ cũng có thể tiếp thị để nhắm mục tiêu của người mua sắm đã xem xét một điểm đến cụ thể trên trang web của công ty du lịch trực tuyến hay chưa. Thông qua việc sử dụng dữ liệu lớn, việc dự đoán nhu cầu của các ngành công nghiệp trở nên hiệu quả hơn. Ngày càng có nhiều công ty bắt đầu chuyên lưu trữ và đánh giá một lượng lớn dữ liệu về khách du lịch tại khách sạn, giao dịch mua hàng và thông tin khách hàng để cung cấp dịch vụ chất lượng cao và hiệu quả hơn. Do vậy, để nắm bắt được mục đích, nhu cầu và trải nghiệm của khách hàng, thì cần hiểu rõ về nội dung từng dữ liệu của dữ liệu lớn. Hashlem [21] đã phân loại dữ liệu lớn theo năm phần (Hình 2.1). Thứ nhất, thông tin về dữ liệu xuất phát từ đâu; thứ hai, nội dung dữ liệu như thế nào; thứ ba, dữ liệu ở kho nào; tiếp đến, dữ liệu đã được chuyển hóa hay chưa, nếu chưa thì phần cuối chính là phần xử lí dữ liệu. • Phân loại dữ liệu lớn: Hashem và cộng sự [21] • Phân tích dữ liệu của dữ liệu lớn trong STD Trong các hệ sinh thái du lịch thông minh, phân tích dữ liệu của dữ liệu lớn rất cần thiết cho việc xử lý, mô hình hóa và trực quan hóa dữ liệu để có thể sử dụng nó thông báo cho các quyết định hoạt động ở các điểm đến du lịch một cách hữu hiệu nhất [9]. Phân tích dữ liệu lớn chứng tỏ là một công cụ thiết yếu để tạo ra trí tuệ kinh doanh thực sự ở các điểm du lịch làm thay đổi hệ thống thông tin truyền thống và giúp tạo ra kiến thức ở điểm đến [9]. Điều này cho thấy dữ liệu của dữ liệu lớn là vô cùng quan trọng, xem như dữ liệu phải được phân tích theo cách mà nó có thể được sử dụng để tạo ra giá trị, nghĩa là nó ủng hộ việc ra quyết định có hiểu biết. Một ví dụ về những khả năng mới này chính là hệ thống thông tin quản lý điểm đến. Mô hình của Pasquale [18] (bảng 2.2) giúp hiểu rõ giá trị của việc phân tích dữ liệu của dữ liệu lớn. Vì nó nêu ra được những việc mà dữ liệu lớn có thể đáp ứng và giải quyết, hay nói cách khác, khi phân tích và hiểu rõ được dữ liệu của dữ liệu lớn, thì sẽ hỗ trợ được việc ra quyết định, tạo sản phẩm, duy trì khách hàng • Bảng chi tiết về mô hình dữ liệu của Pasquale Del Vecchio Kích thước tạo giá trị dữ liệu lớn (Tại sao?) Quá trình tạo giá trị từ dữ liệu lớn (Như thế nào?) Cải thiện quy trình ra quyết định Bằng cách đồng bộ hóa thông tin thu được trong thời gian thực Tăng cường và làm phong phú thêm trải nghiệm của khách du lịch Bằng cách khám phá và dự đoán nhu cầu, phơi bày sự thay đổi, tùy chỉnh các dịch vụ, trải nghiệm đồng sáng tạo Mô hình kinh doanh mới và phát triển sản phẩm / dịch vụ mới Bằng cách cho phép kết nối động với các bên liên quan bên ngoài, trao đổi kiến thức và tài nguyên, chế độ quan hệ khách hàng mới, luồng doanh thu sáng tạo và đề xuất giá trị mới Hệ sinh thái kết nối kinh doanh Bằng cách cho phép bằng sự hợp tác, minh bạch và tin tưởng được thiết lập với khách hàng và các bên liên quan. (Nguồn: Mô hình dữ liệu của Pasquale Del Vecchio) [18] Việc phân tích dữ liệu của dữ liệu lớn sẽ biến chúng thành tài sản thông tin, xác định các nhu cầu cần trải nghiệm của khách hàng. Khi được khai thác, có thể cung cấp cho các công ty cơ hội dự đoán thị trường và xu hướng của người tiêu dùng, nâng cao khả năng giữa các đối thủ cạnh tranh, cải thiện hiệu suất tối ưu. • Phương pháp tiếp cận dữ liệu của dữ liệu lớn Hiện nay, các loại dữ liệu được sử dụng để tạo số liệu thống kê du lịch được nhóm thành ba loại: người dùng, thiết bị và hoạt động [26]. Do đó, để tiếp cận được dữ liệu của dữ liệu lớn, phải dựa vào dữ liệu của ba loại trên. Thứ nhất, nội dung do người dùng tạo (UGC) là nguồn phổ biến nhất, được sử dụng trong 60% các giấy tờ. Điều này bao gồm dữ liệu văn bản trực tuyến, chủ yếu là phương tiện truyền thông xã hội, tin tức và hình ảnh được gắn thẻ địa lý. Tiếp theo, 20% khác là khai thác tiềm năng của các thiết bị bằng cách thu thập thông tin từ chuyển vùng di động, vòng lặp giao thông và camera điều khiển giao thông. Và cuối cùng, dữ liệu giao dịch được sử dụng bởi 10% khác, đặc biệt là các điểm bán hàng (POS), máy rút tiền ATM và Booking. com. Theo đó, có thể nói rằng UGC là nguồn phù hợp nhất cho mục đích thống kê du lịch. Kết luận này có được khi nghiên cứu ứng dụng dữ liệu lớn trong nghiên cứu du lịch nói chung, mặc dù chúng đề cập đến sự thống trị thấp hơn của UGC [26]. • Nguồn thống kê dữ liệu lớn của Newell và cộng sự [26] • Vai trò của dữ liệu lớn trong STD Dữ liệu lớn đóng một vai trò rất quan trọng trong khái niệm điểm đến thông minh, trong bối cảnh mà khối lượng thông tin khổng lồ được tạo ra và trao đổi từ nhiều nguồn rất khác nhau (mạng lưới phân phối, cảm biến, cư dân, công ty, v. v. ) [8]. Trong các mô hình điểm đến du lịch thông minh, thì mô hình của Ivars et al [15], nêu rõ nhất về vai trò của dữ liệu lớn. • Mô hình điểm đến du lịch thông minh của Ivars Baidal và các cộng sự [15] Theo Ivars et al [15], dữ liệu lớn là công cụ thiết yếu trong việc hợp nhất các điểm đến du lịch thông minh. Có ba cấp độ liên quan đến nhau trong mô hình đích thông minh, đó là: cấp độ chiến lược kết hợp với quản trị, sự bền vững tạo sẽ môi trường mới; thứ hai là cấp độ công cụ liên quan đến khả năng kết nối và khả năng tương tác của các hệ thống cùng với hệ thống thông tin du lịch, tập trung vào các thông tin thu được từ nhiều nguồn khác nhau trong môi trường dữ liệu mở và dữ liệu lớn; và cuối cùng là cấp độ áp dụng, trong đó các giải pháp thông minh được đề xuất cần một chiến lược đích được xác định rõ sẽ được thiết lập trước đó và một hệ thống thông tin có khả năng biến các khả năng dữ liệu lớn thành hiện thực. Ngoài ra, nắm bắt được giá trị dữ liệu thông qua dữ liệu lớn có nghĩa là sử dụng công nghệ cụ thể và phương pháp phân tích [31] sẽ biến chúng thành các tài sản thông tin dẫn đến việc xác định các mô hình ẩn và hiểu biết về trải nghiệm của khách hàng. Khi được khai thác, dữ liệu lớn có thể cung cấp cho các công ty cơ hội dự đoán thị trường và xu hướng của người tiêu dùng, cải thiện hiệu suất, tùy chỉnh và cá nhân hóa các dịch vụ, đổi mới sản phẩm hoặc dịch vụ và cho phép sự minh bạch và sự phản hồi ngay lập tức [24]. Giá trị của dữ liệu được tạo ra hằng ngày là kết quả của việc quản lý thông tin và là tài sản tri thức để cải thiện việc ra quyết định sau này. • Sử dụng dữ liệu lớn nhằm dự đoán nhu cầu trong du lịch Hiện nay, việc sử dụng dữ liệu lớn để dự đoán nhu cầu trong du lịch đã trở nên phổ biến, để dự đoán đúng đắn các nhu cầu cần thực hiện theo quy trình: (1) Nắm bắt được dữ liệu của dữ liệu lớn trong việc dự đoán; (2) Lựa chọn dữ liệu và thu nhỏ nó; (3) Dựa vào khung dự báo nhu cầu du lịch theo dữ liệu lớn. • Nắm bắt dữ liệu của dữ liệu lớn trong dự đoán du lịch Việc nắm bắt và thực hiện hiệu quả các chiến lược dữ liệu lớn giúp các công ty du lịch có được lợi thế cạnh tranh vì công nghệ cần để xử lý dữ liệu lớn là một trở ngại đối với nhiều người dùng doanh nghiệp do tính phức tạp và chi phí của nó. Một quy trình đúng để thu thập dữ liệu sẽ bao gồm các bước: (1) Mục tiêu Bước đầu tiên là mục tiêu của việc sử dụng dữ liệu lớn, nhằm đảm bảo rằng lợi ích kinh doanh có được từ nó. Khi thu thập dữ liệu lớn, có thể truy cập vào phần dữ liệu đó và biết những gì có sẵn và xác định giá trị doanh nghiệp nằm ở đâu. Nói cách khác, chúng ta nên biết khả năng của dữ liệu lớn và chính xác những gì chúng ta đang tìm kiếm để xem giá trị của nó là gì. Điều quan trọng là đặt mục tiêu kinh doanh cụ thể thay vì chỉ xử lý dữ liệu lớn. (2) Trực quan hóa dữ liệu lớn Bước thứ hai là làm cho dữ liệu lớn hiển thị cho người dùng trong một công ty / tổ chức. Điều này sẽ cho phép các nhà dự báo du lịch xác định số lượng tối ưu của sản phẩm và điều chỉnh các quy trình hậu cần để tối đa hóa hiệu quả. Mục đích của trực quan hóa dữ liệu là tìm ra cách thức thu thập hiệu quả dữ liệu từ các nguồn khác nhau (trực quan và không trực quan) để người dùng có thể dễ dàng hiểu chúng. Điều này cũng sẽ giúp các nhà dự báo sử dụng tốt hơn dữ liệu lớn trong việc hoàn thành các nhiệm vụ dự báo của họ. (3) Định dạng cấu trúc dữ liệu lớn Bước thứ ba là cấu trúc dữ liệu phi cấu trúc. Điều này có nghĩa là sắp xếp dữ liệu lớn theo độ dài và định dạng dữ liệu truyền thống để chúng có thể được sắp xếp gọn gàng vào các hàng và cột trong bảng tính. Dữ liệu có cấu trúc thường nằm trong cơ sở dữ liệu quan hệ, do đó đôi khi được gọi là dữ liệu quan hệ. Dữ liệu phi cấu trúc có thể dễ dàng được ánh xạ vào các trường được thiết kế trước: ví dụ: trung tâm cuộc gọi dữ liệu có cấu trúc được bao gồm các số, ngày tháng và các nhóm từ và số được gọi là chuỗi. Người ta thường đồng ý rằng loại dữ liệu này chiếm khoảng 20% tổng số lượng dữ liệu lớn. Dữ liệu phi cấu trúc rất khó phân tích, vì hầu hết dữ liệu lớn là dữ liệu không có cấu trúc hoặc bán cấu trúc có chứa nhiều thông tin có giá trị và không phù hợp với các mô hình dữ liệu được xác định trước. Do đó, một số giải pháp phần mềm khác nhau đã được thiết kế để tìm kiếm dữ liệu phi cấu trúc và trích xuất thông tin quan trọng. • Lựa chọn và thu nhỏ dữ liệu Dữ liệu lớn chứa rất nhiều thông tin, không chỉ tạo ra vấn đề lưu trữ mà còn là vấn đề phân tích lớn. Làm thế nào để sử dụng các bộ dữ liệu lớn này là vấn đề lớn nhất trong dự báo du lịch bằng cách sử dụng dữ liệu lớn có cấu trúc. Hai phương pháp phổ biến nhất được sử dụng trong việc lựa chọn và thu hẹp một lượng lớn dữ liệu có cấu trúc là các phương pháp mô hình hóa nhân tố và toán tử LASSO (ít co ngót tuyệt đối nhất). (1) Mô hình nhân tố Mô hình nhân tố là phương pháp được sử dụng phổ biến nhất trong việc lựa chọn và thu hẹp dữ liệu lớn có cấu trúc. Một số nghiên cứu gần đây trong các tài liệu kinh tế đã tập trung vào tính hữu ích của các mô hình nhân tố trong bối cảnh dự báo liên quan đến việc sử dụng các bộ dữ liệu lớn [22]. (2) Phương pháp LASSO Phương pháp LASSO là một phương pháp lựa chọn đồng biến trong khung hồi quy tuyến tính. Nó hoạt động bằng cách xử phạt vấn đề tối ưu hóa liên quan đến hồi quy với thuật ngữ liên quan đến định mức L1 của các hệ số [23]. Các tài liệu đã chỉ ra rằng LASSO có xu hướng có rủi ro sai sót thấp hơn trong các mô hình dự báo khi so sánh với các tiêu chí thông tin thông thường. Phương pháp LARS [23] có thể được kết hợp với mô hình nhân tố để thu nhỏ bộ dữ liệu lớn và được sử dụng để dự báo chuỗi kinh tế. • Khung dự báo nhu cầu du lịch dựa trên dữ liệu lớn Một số nhà nghiên cứu cho rằng có rất nhiều kỹ thuật để khai thác dữ liệu có thể giúp dự báo dữ liệu lớn [22]. Tuy nhiên, kỹ thuật khai thác dữ liệu luôn sử dụng dữ liệu tĩnh trái ngược với chuỗi thời gian và hiếm khi được sử dụng trong dự báo nhu cầu du lịch. Nhưng khi chuyển sang các ph

Các file đính kèm theo tài liệu này:

  • pdfkhoa_luan_nghien_cuu_vai_tro_cua_du_lieu_lon_trong_diem_den.pdf
Tài liệu liên quan