Hiện nay có rất nhiều giải pháp khác nhau trong việc cải thiện chất lượng của dữ
liệu lớn, nhưng các đặc điểm dưới đây sẽ nâng cao chất lượng dữ liệu lớn hơn, đó là:
quản lý doanh thu, quản lý danh tiếng, tiếp thị chiến lược, trải nghiệm khách hàng,
nghiên cứu thị trường, tiếp thị mục tiêu.
- Quản lý doanh thu
Một trong những cách sử dụng dữ liệu lớn hiệu quả nhất trong ngành du lịch đó là
có liên quan đến quản lý doanh thu. Để tối đa hóa kết quả tài chính, khách sạn và các
công ty du lịch khác cần có khả năng bán đúng sản phẩm, đúng khách hàng, vào đúng
thời điểm, với mức giá phù hợp, thông qua kênh phù hợp và dữ liệu lớn có thể là vô giácho việc này. Cụ thể, dữ liệu nội bộ như tỷ lệ lấp đầy trong quá khứ, doanh thu phòng và
đặt phòng hiện tại có thể được kết hợp với dữ liệu bên ngoài, chẳng hạn như thông tin về
các sự kiện địa phương, chuyến bay và ngày nghỉ của trường, để dự đoán chính xác hơn
và dự đoán nhu cầu. Do đó, các khách sạn sau đó có khả năng quản lý giá và giá phòng
tốt hơn, tăng chúng vào những thời điểm có nhu cầu cao, để tối đa hóa doanh thu được
tạo ra
58 trang |
Chia sẻ: honganh20 | Ngày: 16/02/2022 | Lượt xem: 443 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Khóa luận Nghiên cứu vai trò của dữ liệu lớn trong điểm đến du lịch thông minh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ăm, các giai
đoạn và các khái niệm liên quan đến vấn đề này. Theo cách tiếp cận thông minh, nền tảng
công nghệ được cấu thành bởi ba thành phần công nghệ: dịch vụ điện toán đám mây,
mạng internet và thiết bị người dùng cuối. Chương này cũng nhấn mạnh việc tăng cường
tác động của công nghệ thông tin trong những năm tới sẽ hình thành một kịch bản mới
cho quản lý được đặc trưng bởi công nghệ và quản lý dữ liệu. Tuy nhiên, hiệu quả của
phương pháp STD sẽ không chỉ phụ thuộc vào công nghệ mà còn phụ thuộc vào quản trị
điểm đến phù hợp, kết hợp một cách có hệ thống ba cấp độ của STD, cụ thể là các cấp độ
quan hệ, công cụ và ứng dụng chiến lược [10].
• PHÂN TÍCH, ĐÁNH GIÁ VAI TRÒ CỦA DỮ LIỆU LỚN TRONG STD
• Giới thiệu về dữ liệu lớn
• Khái niệm dữ liệu
Dữ liệu là chuỗi bất kỳ của một hoặc nhiều ký hiệu có ý nghĩa thông qua việc giải
thích một hành động cụ thể nào đó. Dữ liệu cần phải được thông dịch để trở thành thông
tin. Để dữ liệu thành thông tin, cần xem xét một số nhân tố bao gồm người (hoặc vật)
sinh ra dữ liệu và thông tin được mong muốn từ dữ liệu đó. Thuật ngữ si HYPERLINK
"https://vi.wikipedia.org/wiki/Si%C3%AAu_d%E1%BB%AF_li%E1%BB%87u"êu d
HYPERLINK "https://vi.wikipedia.org/wiki/Si%C3%AAu_d%E1%BB%AF_li%E1%BB%87u"ữ
liệu chỉ các dữ liệu được dùng làm dữ liệu tham khảo về một dữ liệu khác. Siêu dữ liệu có
thể được ngầm hiểu, được chỉ định hoặc cho trước. Dữ liệu liên quan đến sự kiện hoặc
quy trình vật lý thường có nhân tố thời gian. Trong hầu hết các trường hợp, nhân tố thời
gian được ngầm hiểu. Dữ liệu có thể được tổ chức trong nhiều loại cấu trúc dữ liệu khác
nhau, bao gồm mảng, đồ th HYPERLINK
"https://vi.wikipedia.org/wiki/%C4%90%E1%BB%93_th%E1%BB%8B"ị và đối tượng. Cấu
trúc dữ liệu lưu nhiều loại dữ liệu khác nhau, bao gồm số, chu HYPERLINK
"https://vi.wikipedia.org/w/index.php?title=String_(computer_science)&action=edit&redl
ink=1"ỗi và thậm chí các c HYPERLINK
"https://vi.wikipedia.org/wiki/C%E1%BA%A5u_tr%C3%BAc_d%E1%BB%AF_li%E1%BB%87
u"ấu tr HYPERLINK
"https://vi.wikipedia.org/wiki/C%E1%BA%A5u_tr%C3%BAc_d%E1%BB%AF_li%E1%BB%87
u"úc d HYPERLINK
"https://vi.wikipedia.org/wiki/C%E1%BA%A5u_tr%C3%BAc_d%E1%BB%AF_li%E1%BB%87
u"ữ liệu khác. Dữ liệu ra vào máy tính thông qua các thi HYPERLINK
"https://vi.wikipedia.org/wiki/Thi%E1%BA%BFt_b%E1%BB%8B_ngo%E1%BA%A1i_vi"ết bị
ngoại vi [35].
• Khái niệm dữ liệu lớn
Dữ liệu lớn là một trong những mô hình tiêu biểu nhất của nền kinh tế tri thức và là
một lĩnh vực điều tra mới nổi cho các nhà nghiên cứu và thực hành. Do khả năng cung
cấp cho các tổ chức và công ty một lượng dữ liệu khổng lồ và đa dạng, từ đó có thể giúp
đạt được những hiểu biết vô giá [27] về quan điểm, sở thích, nhu cầu cũng như thái độ
của khách hàng... Do đó, dữ liệu lớn đang được công nhận là nguồn chính tạo ra giá trị.
Tuy nhiên, trong khi sự xuất hiện của dữ liệu lớn là xu hướng chung cho tất cả các
ngành, nó trở nên đặc biệt phù hợp với ngành du lịch vì tính chất thông tin mạnh mẽ và
sự phụ thuộc vào Công nghệ thông tin và truyền thông [18]. Từ quan điểm dựa trên thông
tin, du lịch là một hiện tượng phức tạp, trong đó dữ liệu, thông tin, kiến thức từ và về
khách du lịch, là cơ sở thiết yếu cho khả năng cạnh tranh và đổi mới của điểm đến.
Ngoài ra, việc sử dụng các thiết bị công nghệ khác nhau trong cuộc sống hàng ngày,
cùng với sự sinh sôi nảy nở của tất cả các loại cảm biến, tạo ra một kịch bản dữ liệu hóa
dữ liệu, một quy trình chưa biết cho đến nay có thể được xác định là khả năng tạo dữ liệu,
có thể được xử lý bằng máy tính [26]. Tuy nhiên, trái với những gì có vẻ thấy, không chỉ
khối lượng dữ liệu quan trọng, sự đa dạng của dữ liệu và tốc độ mà nó được xử lý cũng
xác định bản chất của dữ liệu lớn [34]. Trong thực tế, dữ liệu lớn có thể được gọi là một
bộ dữ liệu giới hạn chức năng phù hợp của các tài nguyên có sẵn để lưu trữ, phục hồi, xử
lý và phân tích dữ liệu. Do đó, kích thước phân biệt khái niệm dữ liệu lớn là khối lượng
(kích thước lớn của bộ sưu tập dữ liệu), là sự đa dạng (cấu trúc khác nhau hoặc thiếu cấu
trúc mà dữ liệu có thể có) và là vận tốc (tốc độ mà dữ liệu được tạo, truy cập và phân
tích) [34].
Mặc dù khái niệm về dữ liệu lớn vẫn đang được tiến hành, nhưng ngày càng có
nhiều bài viết dành cho vấn đề này, vì vậy tôi đã tiến hành tổng hợp về các khái niệm dữ
liệu lớn chi tiết như ở Bảng 2. 1
• Các khái niệm về dữ liệu lớn theo từng tác giả qua các năm
Tác giả Khái niệm
Madde Dữ liệu lớn là một thuật ngữ cho việc xử lý một tập hợp dữ liệu rất lớn và phức tạp
n, S
(20150
[27]
mà các ứng dụng xử lý dữ liệu truyền thống không xử lý được. Dữ liệu lớn bao gồm
các thách thức như ph HYPERLINK
"https://vi.wikipedia.org/wiki/Ph%C3%A2n_t%C3%ADch_k%E1%BB%B9_thu%E1%BA
%ADt"ân tích, thu th HYPERLINK
"https://vi.wikipedia.org/wiki/Truy_h%E1%BB%93i_th%C3%B4ng_tin"ập, giám sát dữ
liệu, tìm kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan, truy vấn và tính riêng tư.
Thuật ngữ này thường chỉ đơn giản đề cập đến việc việc sử dụng các phân tích dự
báo, phân tích hành vi người dùng, hoặc một số phương pháp phân tích dữ liệu tiên
tiến khác trích xuất giá trị từ dữ liệu mà ít khi đề cập đến k HYPERLINK
"https://vi.wikipedia.org/wiki/K%C3%ADch_th%C6%B0%E1%BB%9Bc"ích th
HYPERLINK
"https://vi.wikipedia.org/wiki/K%C3%ADch_th%C6%B0%E1%BB%9Bc"ước của bộ dữ
liệu.
Del
Vecchi
o, P
(2017)
[24]
Dữ liệu lớn là một thuật ngữ phổ biến nhất và được sử dụng thường xuyên nhất để mô
tả sự tăng trưởng theo cấp số nhân về tính sẵn có của dữ liệu trong thời hiện đại, có
khả năng được duy trì hoặc thậm chí tăng tốc trong tương lai gần. Đây là một thuật
ngữ rộng cho các bộ dữ liệu có kích thước lớn hoặc phức tạp đến mức các ứng dụng
xử lý dữ liệu và công cụ phần mềm truyền thống không đủ để nắm bắt, quản lý và xử
lý dữ liệu trong một khoảng thời gian hợp lý.
DeVan,
2016;
IBM,
2017;
[34]
Dữ liệu lớn là một thuật ngữ được sử dụng để mô tả các bộ dữ liệu cực lớn, phức tạp
và phải phân tích các bộ dữ liệu đó để xác định các mẫu và xu hướng hữu ích hoặc
thú vị. Các đặc điểm chính của Dữ liệu lớn thường được thể hiện dưới dạng 4V:
- Volume (khối lượng): Một trong những đặc điểm mang tính biểu tượng nhất của Dữ
liệu lớn là khối lượng lớn, với lượng dữ liệu khổng lồ được tạo ra bởi máy móc, mạng
và tương tác của con người trên các hệ thống như phương tiện truyền thông xã hội.
- Variety (tính đa dạng): Điều này đề cập đến nhiều nguồn và loại dữ liệu, cả có cấu
trúc (ví dụ: cơ sở dữ liệu hoặc các định dạng tương tự khác) và không có cấu trúc (ví
dụ: email, ảnh, video, thiết bị giám sát, PDF, âm thanh, v. v. ) Các loại dữ liệu sau tạo
ra những thách thức đáng kể cho việc lưu trữ, khai thác và phân tích dữ liệu.
- Velocity (vận tốc): Điều này liên quan đến tốc độ khổng lồ mà dữ liệu mới được tạo
ra, bao gồm cả trong thời gian thực, cũng như tốc độ phân tích cần phải diễn ra để sử
dụng dữ liệu đó.
- Veracity (độ chính xác): Điều này liên quan đến sự sai lệch, tiếng ồn và sự bất
thường trong dữ liệu - tức là chất lượng của chính dữ liệu. Dữ liệu phải được củng cố,
làm sạch, nhất quán và hiện hành để tạo điều kiện cho các quyết định đúng đắn.
Mazón
Lospez
(2017)
[8]
Dữ liệu lớn là một trong những mô hình tiêu biểu nhất của nền kinh tế tri thức trên
thế giới và đại diện cho một lĩnh vực điều tra mới nổi dành cho các nhà nghiên cứu và
các học viên. Do khả năng cung cấp cho các tổ chức và công ty một lượng dữ liệu
khổng lồ và đa dạng từ đó có thể đạt được những hiểu biết vô giá về quan điểm, sở
thích, nhu cầu, thái độ của khách hàng Dữ liệu lớn đang được công nhận là nguồn
chính tạo ra giá trị
(Nguồn tổng hợp năm 2020)
• Đặc điểm của dữ liệu lớn
Đặc điểm của dữ liệu lớn được gói gọn trong 5V (value) đó là: volume (khối
lượng), variety (sự đa dạng), velocity (tốc độ), veracity (độ chính xác) và value (giá trị).
Đây chính là điểm nhấn độc đáo dùng để xác định dữ liệu lớn trong du lịch.
• Volume (khối lượng)
Khối lượng đứng đầu danh sách các đặc điểm dữ liệu lớn, đây là yếu tố chính gây ra
vấn đề tại sao các hệ thống quản lý cơ sở dữ liệu quan hệ truyền thống không xử lý được
dữ liệu lớn (39). Khối lượng dữ liệu lớn về du lịch đến từ các điểm bán hàng hoặc các
kênh phân phối truyền thống là khác nhau (ví dụ như trung tâm cuộc gọi, trang web, cơ
sở, bản tin, quan hệ khách hàng ). Nội dung của dữ liệu lớn về du lịch được tạo ra hàng
ngày, hoặc thậm chí hàng giờ và vấn đề cần quan tâm là việc hiểu ý nghĩa của thông tin,
chuyển đổi dữ liệu lớn thành dữ liệu thông minh và sau đó sử dụng nó để lập ra kế hoạch
du lịch.
• Variety (sự đa dạng)
Một đặc điểm quan trọng khác của dữ liệu lớn, cả về chi phí và dễ sử dụng, là sự đa
dạng của dữ liệu bắt nguồn từ tất cả các công nghệ có thể truy cập. Tính đa dạng mô tả
các định dạng khác nhau của dữ liệu không vay mượn để lưu trữ trong các hệ thống cơ sở
dữ liệu quan hệ có cấu trúc. Các định dạng của dữ liệu lớn bao gồm một danh sách dài
các dữ liệu như tài liệu, e-mail, tin nhắn, văn bản, hình ảnh, đồ thị, video và đầu ra từ tất
cả các loại dữ liệu do máy tạo từ điện thoại di động, tín hiệu GPS, cảm biến, nhật ký máy
và các thiết bị phân tích DNA [30]. Đặc trưng của loại dữ liệu này là không cấu trúc hoặc
bán cấu trúc và luôn luôn tồn tại. Hầu hết 80% thông tin liên quan đến du lịch bắt nguồn
từ dạng không có cấu trúc và các tổ chức chỉ có thể dựa vào 20% dữ liệu có cấu trúc, ví
dụ: hệ thống quản lý tài sản (PMS), hệ thống quản lý nội dung web hoặc blog (CMS)
hoặc hệ thống quản lý quan hệ khách hàng (CMS). Các hệ thống (CRM) chỉ có thể xử lý
dữ liệu có cấu trúc, trong khi các tùy chọn của khách hàng, dữ liệu tại các điểm tiếp xúc
khác nhau lại ở dạng dữ liệu phi cấu trúc hoặc bán cấu trúc. Điều này đòi hỏi các công
nghệ mới phải phân tích chúng để phát triển hoặc cải tiến các sản phẩm và dịch vụ mới.
• Velocity (tốc độ)
Đặc điểm chính thứ ba của dữ liệu lớn là vận tốc, hay còn gọi là tốc độ phản ứng.
Có ba khía cạnh quan trọng của vận tốc dữ liệu lớn về du lịch [30]. Khía cạnh đầu tiên là
thu thập, lưu trữ và phân tích thống nhất và đầy đủ các luồng dữ liệu lớn di chuyển
nhanh, ví dụ: luồng đọc từ cảm biến hoặc lịch sử weblog của các lượt truy cập trang và
nhấp chuột của mỗi khách truy cập vào trang web. Khía cạnh thứ hai là các đặc điểm của
tính kịp thời hoặc độ trễ. Chúng ta nên nắm bắt, lưu trữ và sử dụng dữ liệu lớn trong một
khoảng thời gian trễ nhất định tùy thuộc vào loại thông tin vì một số dữ liệu có giá trị
trong khi một số dữ liệu sẽ không còn ý nghĩa sau một khoảng thời gian rất ngắn. Khía
cạnh thứ ba là tốc độ mà dữ liệu lớn phải được lưu trữ và truy xuất; kiến thức của việc
nắm bắt, phân tích và triển khai phải hỗ trợ quay vòng thời gian thực (trong trường hợp
này là các phân số của giây); và phải làm điều này một cách nhất quán trên hàng ngàn
khách hàng mới. Ví dụ, trong du lịch, vấn đề đáng quan tâm là làm thế nào để gửi đúng
lời đề nghị đến đúng người vào đúng thời điểm khi người đó đến điểm đến và bạn nên
làm gì nếu ai đó đăng ký vào khách sạn của bạn và được bổ nhiệm vào phòng và quyết
định tweet về nó hơn là gọi cho quầy lễ tân. Lấy các hãng hàng không trong ngành kinh
doanh du lịch làm ví dụ, quản lý doanh thu năng động có thể thay đổi giá kịp thời theo
các thuật toán phức tạp dựa trên các hành vi trực tuyến của khách hàng.
• Veracity (độ chính xác)
Độ chính xác có nghĩa là tính trung thực và chính xác của dữ liệu được cung cấp
theo ngữ cảnh, sự đa dạng của các điểm giao tiếp, điểm cảm ứng, và tốc độ xảy ra. Độ
chính xác của dữ liệu lớn đề cập đến sự sai lệch, nhiễu và bất thường trong dữ liệu: Dữ
liệu được lưu trữ và khai thác có ý nghĩa đối với vấn đề được phân tích không? So với
khối lượng và vận tốc, tính chính xác trong phân tích dữ liệu là thách thức lớn nhất. Khi
phát triển một chiến lược dữ liệu lớn, bạn cần nhóm của mình và các đối tác giúp bạn giữ
sạch dữ liệu của mình và có các quy trình để giữ dữ liệu bẩn không bị tích lũy trong hệ
thống của bạn.
• Value (giá trị)
Giá trị được xem là một đặc tính quan trọng khác của dữ liệu lớn. Giá trị của dữ liệu
lớn về du lịch có thể được mô tả bằng ứng dụng mới lạ của nó trong ngành du lịch. Đầu
tiên, đó là ứng dụng cá nhân hóa dữ liệu lớn về du lịch. Tiếp thị cá nhân và thiết kế sản
phẩm nhắm mục tiêu là những cơ hội cực kỳ mạnh mẽ có thể thu được từ dữ liệu lớn
[30]. Sử dụng một loạt các cuộc phỏng vấn được thực hiện trong ngành du lịch, Radovich
[30] đã chỉ ra cách dữ liệu lớn có thể được sử dụng để tăng tác động và giảm ma sát giữa
các ngành, cả trong một công ty và trong công nghiệp. Cá nhân hóa là một nguyên lý
chính của dữ liệu lớn. Để giành chiến thắng một cách hiệu quả nhất khi cá nhân hóa, các
công ty du lịch lớn phải làm việc trên cơ sở dữ liệu thông tin để thu thập vô số dữ liệu
được người tiêu dùng xử lý tại các điểm khác nhau. Ứng dụng có giá trị thứ hai của dữ
liệu lớn về du lịch là trải nghiệm lấy khách hàng làm trung tâm. Khách hàng nên là trung
tâm của mọi nỗ lực dữ liệu lớn. Nếu thu thập dữ liệu lớn được xem là đáng sợ hoặc xâm
lấn, người tiêu dùng sẽ không hài lòng và lòng trung thành sẽ bị mất. Tuy nhiên, tất cả
các dấu hiệu cho thấy người tiêu dùng sẵn sàng chấp nhận sự xâm nhập lớn vào hành vi
của họ nếu sản phẩm kết quả được nhắm mục tiêu nhiều hơn và có thể dự đoán nhu cầu
của họ trong suốt quá trình trải nghiệm.
• Phân loại dữ liệu lớn
Dữ liệu lớn cung cấp những hiểu biết sâu sắc chưa từng có của khách hàng trong
quá trình ra quyết định bằng cách cho phép các công ty theo dõi và phân tích các mô hình
mua sắm, khuyến nghị, hành vi mua hàng của khách hàng và các quá trình điều khiển
khác có ảnh hưởng đến doanh số. Các cơ quan và tổ chức liên quan đến du lịch có thể tìm
ra những cách sáng tạo để sử dụng nguồn tài nguyên dữ liệu dồi dào này để kết nối với
khách truy cập tiềm năng ở mọi giai đoạn của chuyến đi và sử dụng các nguồn dữ liệu lớn
để hiểu rõ hơn và kịp thời về nhân khẩu học của khách truy cập tăng trưởng nhanh nhất.
Họ cũng có thể tiếp thị để nhắm mục tiêu của người mua sắm đã xem xét một điểm đến
cụ thể trên trang web của công ty du lịch trực tuyến hay chưa. Thông qua việc sử dụng dữ
liệu lớn, việc dự đoán nhu cầu của các ngành công nghiệp trở nên hiệu quả hơn. Ngày
càng có nhiều công ty bắt đầu chuyên lưu trữ và đánh giá một lượng lớn dữ liệu về khách
du lịch tại khách sạn, giao dịch mua hàng và thông tin khách hàng để cung cấp dịch vụ
chất lượng cao và hiệu quả hơn. Do vậy, để nắm bắt được mục đích, nhu cầu và trải
nghiệm của khách hàng, thì cần hiểu rõ về nội dung từng dữ liệu của dữ liệu lớn.
Hashlem [21] đã phân loại dữ liệu lớn theo năm phần (Hình 2.1). Thứ nhất, thông tin về
dữ liệu xuất phát từ đâu; thứ hai, nội dung dữ liệu như thế nào; thứ ba, dữ liệu ở kho nào;
tiếp đến, dữ liệu đã được chuyển hóa hay chưa, nếu chưa thì phần cuối chính là phần xử lí
dữ liệu.
• Phân loại dữ liệu lớn: Hashem và cộng sự [21]
• Phân tích dữ liệu của dữ liệu lớn trong STD
Trong các hệ sinh thái du lịch thông minh, phân tích dữ liệu của dữ liệu lớn rất cần
thiết cho việc xử lý, mô hình hóa và trực quan hóa dữ liệu để có thể sử dụng nó thông báo
cho các quyết định hoạt động ở các điểm đến du lịch một cách hữu hiệu nhất [9].
Phân tích dữ liệu lớn chứng tỏ là một công cụ thiết yếu để tạo ra trí tuệ kinh doanh
thực sự ở các điểm du lịch làm thay đổi hệ thống thông tin truyền thống và giúp tạo ra
kiến thức ở điểm đến [9]. Điều này cho thấy dữ liệu của dữ liệu lớn là vô cùng quan
trọng, xem như dữ liệu phải được phân tích theo cách mà nó có thể được sử dụng để tạo
ra giá trị, nghĩa là nó ủng hộ việc ra quyết định có hiểu biết. Một ví dụ về những khả
năng mới này chính là hệ thống thông tin quản lý điểm đến. Mô hình của Pasquale [18]
(bảng 2.2) giúp hiểu rõ giá trị của việc phân tích dữ liệu của dữ liệu lớn. Vì nó nêu ra
được những việc mà dữ liệu lớn có thể đáp ứng và giải quyết, hay nói cách khác, khi
phân tích và hiểu rõ được dữ liệu của dữ liệu lớn, thì sẽ hỗ trợ được việc ra quyết định,
tạo sản phẩm, duy trì khách hàng
• Bảng chi tiết về mô hình dữ liệu của Pasquale Del Vecchio
Kích thước tạo giá trị dữ liệu lớn
(Tại sao?)
Quá trình tạo giá trị từ dữ liệu lớn (Như thế
nào?)
Cải thiện quy trình ra quyết định
Bằng cách đồng bộ hóa thông tin thu được
trong thời gian thực
Tăng cường và làm phong phú
thêm trải nghiệm của khách du
lịch
Bằng cách khám phá và dự đoán nhu cầu, phơi
bày sự thay đổi, tùy chỉnh các dịch vụ, trải
nghiệm đồng sáng tạo
Mô hình kinh doanh mới và phát
triển sản phẩm / dịch vụ mới
Bằng cách cho phép kết nối động với các bên
liên quan bên ngoài, trao đổi kiến thức và tài
nguyên, chế độ quan hệ khách hàng mới, luồng
doanh thu sáng tạo và đề xuất giá trị mới
Hệ sinh thái kết nối kinh doanh
Bằng cách cho phép bằng sự hợp tác, minh
bạch và tin tưởng được thiết lập với khách hàng
và các bên liên quan.
(Nguồn: Mô hình dữ liệu của Pasquale Del Vecchio) [18]
Việc phân tích dữ liệu của dữ liệu lớn sẽ biến chúng thành tài sản thông tin, xác
định các nhu cầu cần trải nghiệm của khách hàng. Khi được khai thác, có thể cung cấp
cho các công ty cơ hội dự đoán thị trường và xu hướng của người tiêu dùng, nâng cao khả
năng giữa các đối thủ cạnh tranh, cải thiện hiệu suất tối ưu.
• Phương pháp tiếp cận dữ liệu của dữ liệu lớn
Hiện nay, các loại dữ liệu được sử dụng để tạo số liệu thống kê du lịch được nhóm
thành ba loại: người dùng, thiết bị và hoạt động [26]. Do đó, để tiếp cận được dữ liệu của
dữ liệu lớn, phải dựa vào dữ liệu của ba loại trên. Thứ nhất, nội dung do người dùng tạo
(UGC) là nguồn phổ biến nhất, được sử dụng trong 60% các giấy tờ. Điều này bao gồm
dữ liệu văn bản trực tuyến, chủ yếu là phương tiện truyền thông xã hội, tin tức và hình
ảnh được gắn thẻ địa lý. Tiếp theo, 20% khác là khai thác tiềm năng của các thiết bị bằng
cách thu thập thông tin từ chuyển vùng di động, vòng lặp giao thông và camera điều
khiển giao thông. Và cuối cùng, dữ liệu giao dịch được sử dụng bởi 10% khác, đặc biệt là
các điểm bán hàng (POS), máy rút tiền ATM và Booking. com. Theo đó, có thể nói rằng
UGC là nguồn phù hợp nhất cho mục đích thống kê du lịch. Kết luận này có được khi
nghiên cứu ứng dụng dữ liệu lớn trong nghiên cứu du lịch nói chung, mặc dù chúng đề
cập đến sự thống trị thấp hơn của UGC [26].
• Nguồn thống kê dữ liệu lớn của Newell và cộng sự [26]
• Vai trò của dữ liệu lớn trong STD
Dữ liệu lớn đóng một vai trò rất quan trọng trong khái niệm điểm đến thông minh,
trong bối cảnh mà khối lượng thông tin khổng lồ được tạo ra và trao đổi từ nhiều nguồn
rất khác nhau (mạng lưới phân phối, cảm biến, cư dân, công ty, v. v. ) [8]. Trong các mô
hình điểm đến du lịch thông minh, thì mô hình của Ivars et al [15], nêu rõ nhất về vai trò
của dữ liệu lớn.
• Mô hình điểm đến du lịch thông minh của Ivars Baidal và các cộng sự [15]
Theo Ivars et al [15], dữ liệu lớn là công cụ thiết yếu trong việc hợp nhất các điểm
đến du lịch thông minh. Có ba cấp độ liên quan đến nhau trong mô hình đích thông
minh, đó là: cấp độ chiến lược kết hợp với quản trị, sự bền vững tạo sẽ môi trường mới;
thứ hai là cấp độ công cụ liên quan đến khả năng kết nối và khả năng tương tác của các
hệ thống cùng với hệ thống thông tin du lịch, tập trung vào các thông tin thu được từ
nhiều nguồn khác nhau trong môi trường dữ liệu mở và dữ liệu lớn; và cuối cùng là cấp
độ áp dụng, trong đó các giải pháp thông minh được đề xuất cần một chiến lược đích
được xác định rõ sẽ được thiết lập trước đó và một hệ thống thông tin có khả năng biến
các khả năng dữ liệu lớn thành hiện thực.
Ngoài ra, nắm bắt được giá trị dữ liệu thông qua dữ liệu lớn có nghĩa là sử dụng
công nghệ cụ thể và phương pháp phân tích [31] sẽ biến chúng thành các tài sản thông tin
dẫn đến việc xác định các mô hình ẩn và hiểu biết về trải nghiệm của khách hàng. Khi
được khai thác, dữ liệu lớn có thể cung cấp cho các công ty cơ hội dự đoán thị trường và
xu hướng của người tiêu dùng, cải thiện hiệu suất, tùy chỉnh và cá nhân hóa các dịch vụ,
đổi mới sản phẩm hoặc dịch vụ và cho phép sự minh bạch và sự phản hồi ngay lập tức
[24]. Giá trị của dữ liệu được tạo ra hằng ngày là kết quả của việc quản lý thông tin và là
tài sản tri thức để cải thiện việc ra quyết định sau này.
• Sử dụng dữ liệu lớn nhằm dự đoán nhu cầu trong du lịch
Hiện nay, việc sử dụng dữ liệu lớn để dự đoán nhu cầu trong du lịch đã trở nên phổ
biến, để dự đoán đúng đắn các nhu cầu cần thực hiện theo quy trình: (1) Nắm bắt được dữ
liệu của dữ liệu lớn trong việc dự đoán; (2) Lựa chọn dữ liệu và thu nhỏ nó; (3) Dựa vào
khung dự báo nhu cầu du lịch theo dữ liệu lớn.
• Nắm bắt dữ liệu của dữ liệu lớn trong dự đoán du lịch
Việc nắm bắt và thực hiện hiệu quả các chiến lược dữ liệu lớn giúp các công ty du
lịch có được lợi thế cạnh tranh vì công nghệ cần để xử lý dữ liệu lớn là một trở ngại đối
với nhiều người dùng doanh nghiệp do tính phức tạp và chi phí của nó. Một quy trình
đúng để thu thập dữ liệu sẽ bao gồm các bước:
(1) Mục tiêu
Bước đầu tiên là mục tiêu của việc sử dụng dữ liệu lớn, nhằm đảm bảo rằng lợi ích
kinh doanh có được từ nó. Khi thu thập dữ liệu lớn, có thể truy cập vào phần dữ liệu đó
và biết những gì có sẵn và xác định giá trị doanh nghiệp nằm ở đâu. Nói cách khác,
chúng ta nên biết khả năng của dữ liệu lớn và chính xác những gì chúng ta đang tìm kiếm
để xem giá trị của nó là gì. Điều quan trọng là đặt mục tiêu kinh doanh cụ thể thay vì chỉ
xử lý dữ liệu lớn.
(2) Trực quan hóa dữ liệu lớn
Bước thứ hai là làm cho dữ liệu lớn hiển thị cho người dùng trong một công ty / tổ
chức. Điều này sẽ cho phép các nhà dự báo du lịch xác định số lượng tối ưu của sản phẩm
và điều chỉnh các quy trình hậu cần để tối đa hóa hiệu quả. Mục đích của trực quan hóa
dữ liệu là tìm ra cách thức thu thập hiệu quả dữ liệu từ các nguồn khác nhau (trực quan và
không trực quan) để người dùng có thể dễ dàng hiểu chúng. Điều này cũng sẽ giúp các
nhà dự báo sử dụng tốt hơn dữ liệu lớn trong việc hoàn thành các nhiệm vụ dự báo của
họ.
(3) Định dạng cấu trúc dữ liệu lớn
Bước thứ ba là cấu trúc dữ liệu phi cấu trúc. Điều này có nghĩa là sắp xếp dữ liệu
lớn theo độ dài và định dạng dữ liệu truyền thống để chúng có thể được sắp xếp gọn gàng
vào các hàng và cột trong bảng tính. Dữ liệu có cấu trúc thường nằm trong cơ sở dữ liệu
quan hệ, do đó đôi khi được gọi là dữ liệu quan hệ. Dữ liệu phi cấu trúc có thể dễ dàng
được ánh xạ vào các trường được thiết kế trước: ví dụ: trung tâm cuộc gọi dữ liệu có cấu
trúc được bao gồm các số, ngày tháng và các nhóm từ và số được gọi là chuỗi. Người ta
thường đồng ý rằng loại dữ liệu này chiếm khoảng 20% tổng số lượng dữ liệu lớn. Dữ
liệu phi cấu trúc rất khó phân tích, vì hầu hết dữ liệu lớn là dữ liệu không có cấu trúc
hoặc bán cấu trúc có chứa nhiều thông tin có giá trị và không phù hợp với các mô hình dữ
liệu được xác định trước. Do đó, một số giải pháp phần mềm khác nhau đã được thiết kế
để tìm kiếm dữ liệu phi cấu trúc và trích xuất thông tin quan trọng.
• Lựa chọn và thu nhỏ dữ liệu
Dữ liệu lớn chứa rất nhiều thông tin, không chỉ tạo ra vấn đề lưu trữ mà còn là vấn
đề phân tích lớn. Làm thế nào để sử dụng các bộ dữ liệu lớn này là vấn đề lớn nhất trong
dự báo du lịch bằng cách sử dụng dữ liệu lớn có cấu trúc. Hai phương pháp phổ biến nhất
được sử dụng trong việc lựa chọn và thu hẹp một lượng lớn dữ liệu có cấu trúc là các
phương pháp mô hình hóa nhân tố và toán tử LASSO (ít co ngót tuyệt đối nhất).
(1) Mô hình nhân tố
Mô hình nhân tố là phương pháp được sử dụng phổ biến nhất trong việc lựa chọn và
thu hẹp dữ liệu lớn có cấu trúc. Một số nghiên cứu gần đây trong các tài liệu kinh tế đã
tập trung vào tính hữu ích của các mô hình nhân tố trong bối cảnh dự báo liên quan đến
việc sử dụng các bộ dữ liệu lớn [22].
(2) Phương pháp LASSO
Phương pháp LASSO là một phương pháp lựa chọn đồng biến trong khung hồi quy
tuyến tính. Nó hoạt động bằng cách xử phạt vấn đề tối ưu hóa liên quan đến hồi quy với
thuật ngữ liên quan đến định mức L1 của các hệ số [23]. Các tài liệu đã chỉ ra rằng
LASSO có xu hướng có rủi ro sai sót thấp hơn trong các mô hình dự báo khi so sánh với
các tiêu chí thông tin thông thường. Phương pháp LARS [23] có thể được kết hợp với mô
hình nhân tố để thu nhỏ bộ dữ liệu lớn và được sử dụng để dự báo chuỗi kinh tế.
• Khung dự báo nhu cầu du lịch dựa trên dữ liệu lớn
Một số nhà nghiên cứu cho rằng có rất nhiều kỹ thuật để khai thác dữ liệu có thể
giúp dự báo dữ liệu lớn [22]. Tuy nhiên, kỹ thuật khai thác dữ liệu luôn sử dụng dữ liệu
tĩnh trái ngược với chuỗi thời gian và hiếm khi được sử dụng trong dự báo nhu cầu du
lịch. Nhưng khi chuyển sang các ph
Các file đính kèm theo tài liệu này:
- khoa_luan_nghien_cuu_vai_tro_cua_du_lieu_lon_trong_diem_den.pdf