Luận văn Xây dựng kiến trúc triển khai liên tục cho các hệ thống dựa trên vi dịch vụ

LỜI CAM ĐOAN -------------------------------------------------------------------------------1

LỜI CẢM ƠN------------------------------------------------------------------------------------1

BẢNG CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ---------------------------------------------1

DANH MỤC HÌNH VẼ ------------------------------------------------------------------------1

DANH MỤC BẢNG BIỂU --------------------------------------------------------------------1

MỞ ĐẦU ------------------------------------------------------------------------------------------1

CHƯƠNG 1: KIẾN THỨC CƠ BẢN -------------------------------------------------------4

1.1 Tính toán đám mây--------------------------------------------------------------------4

1.1.1 Giới thiệu về tính toán đám mây -----------------------------------------------4

1.1.2 Sự phổ biến của ứng dụng dựa vào đám mây---------------------------------5

1.2 Tích hợp, chuyển giao và triển khai liên tục -------------------------------------6

1.2.1 Tích hợp liên tục------------------------------------------------------------------6

1.2.2 Chuyển giao liên tục -------------------------------------------------------------7

1.2.3 Triển khai liên tục ----------------------------------------------------------------8

1.3 Kiến trúc hệ thống---------------------------------------------------------------------8

1.3.1 Kiến trúc một khối----------------------------------------------------------------9

1.3.2 Kiến trúc hướng dịch vụ ------------------------------------------------------- 10

1.3.3 Kiến trúc vi dịch vụ ------------------------------------------------------------ 11

1.4 Các mô hình triển khai ------------------------------------------------------------- 13

1.4.1 Mô hình triển khai tùy biến --------------------------------------------------- 13

1.4.2 Mô hình không tùy biến kết hợp với Reverse Proxy----------------------- 14

1.4.3 Mô hình không tùy biến với ứng dụng vi dịch vụ-------------------------- 15

1.5 Khái niệm Container---------------------------------------------------------------- 17

CHƯƠNG 2: YÊU CẦU CỦA HỆ THỐNG TRIỂN KHAI LIÊN TỤC----------- 21

2.1 Yêu cầu về điều phối container --------------------------------------------------- 21

2.1.1 Khám phá dịch vụ -------------------------------------------------------------- 21

2.1.2 Bộ lập lịch ----------------------------------------------------------------------- 22

2.1.3 Điều phối container ------------------------------------------------------------ 23

2.2 Yêu cầu cho các nhà phát triển --------------------------------------------------- 24

2.2.1 Khả năng tự triển khai --------------------------------------------------------- 24

2.2.2 Nhận được các thông tin về kết quả build----------------------------------- 25

2.3 Yêu cầu về vận hành ---------------------------------------------------------------- 25

2.3.1 Quản lý cấu hình---------------------------------------------------------------- 25

2.3.2 Thu thập và lưu trữ log -------------------------------------------------------- 25

2.3.3 Giám sát và thông báo lỗi ----------------------------------------------------- 26

2.3.4 Triển khai không bị gián đoạn và có khả năng đảo ngược phiên bản --- 27

2.3.5 Thiết kế mạng triển khai------------------------------------------------------- 27

CHƯƠNG 3: THIẾT KẾ HỆ THỐNG TRIỂN KHAI LIÊN TỤC ----------------- 28

3.1 Luồng triển khai cơ bản------------------------------------------------------------ 28

3.2 Phân tích và lựa chọn công nghệ ------------------------------------------------- 29

83 trang | Chia sẻ: honganh20 | Lượt xem: 719 | Lượt tải: 3Free

Bạn đang xem trước 20 trang tài liệu Luận văn Xây dựng kiến trúc triển khai liên tục cho các hệ thống dựa trên vi dịch vụ, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

phối container và các thành phần Hình 2.2 thể hiện các thành phần cơ bản của một nền tảng điều phối container như thành phần kiểm tra sức khỏe, tự động scale, thành phần khám phá dịch vụ, bộ lập lịch hay thành phần nâng cấp hệ thống. Nền tảng điều phối container sẽ thực hiện qúa trình khởi tạo, lập lịch, lựa chọn máy cho tới giám sát, cập nhật và đảm bảo giao tiếp của các container trong cluster. 24 Các nền tảng điều phối container khác nhau thường có nhiều đặc điểm khác nhau, nhưng tất cả những nền tảng này đều phải đảm bảo cung cấp được các tính năng cơ bản như: • Cách thức cấu hình đơn giản: Những nền tảng điều phối container thường cho phép người dùng khai báo các thông tin về cấu hình ứng dụng, kho ảnh, cấu hình về mạng và các cổng được mở trên máy, thông tin về bộ lưu trữ ... một cách đơn giản, trực quan thông qua các định dạng JSON hoặc YAML. • Có các API để bật tắt container: Nền tảng điều phối container sẽ có API cho phép việc cung ứng hay xếp lịch để bật container. Dựa vào các ràng buộc về tài nguyên, về mối tương quan của container cần bật với các container đang chạy khác mà các nền tảng điều phối sẽ chọn máy phù hợp để triển khai. • Có cơ chế khám phá dịch vụ: Khi triển khai một hệ thống gồm rất nhiều dịch vụ, các dịch vụ được đóng gói theo dạng ảnh container và chạy trên nhiều máy khác nhau thì việc một container có thể nhận biết các thông tin về container khác sẽ trở nên khó khăn và đây là một trong những việc quan trọng hàng đầu trong qúa trình quản lý toàn bộ cluster. Các nền tảng điều phối container đều cung cấp giải pháp để giải quyết vấn đề này cho người dùng, chẳng hạn thông qua các dịch vụ dạng DNS, dịch vụ proxy, ... • Cơ chế giám sát và sửa lỗi: Nền tảng điều phối container có trách nhiệm theo dõi, giám sát container cũng như các máy mà chúng đang chạy. Nếu container bị lỗi, việc bật một container mới để thay thế được thực hiện gần như ngay lập tức. Nếu một máy trong cluster bị lỗi, các container đang chạy trên máy đấy sẽ được phân phối để bật lại trên những máy còn lại. Thường thì người sử dụng sẽ miêu tả trạng thái container mong muốn thông qua file cấu hình (phổ biến nhất là dạng JSON hoặc YAML) còn nền tảng điều phối sẽ giám sát để luôn đảm bảo điều này. Để đảm bảo xây dựng được hệ thống triển khai liên tục cho các phần mềm dựa trên vi dịch vụ, yêu cầu đầu tiên chính là việc lựa chọn nền tảng điều phối container thỏa mãn những tính chất đã nêu trên, phù hợp với cơ sở hạ tầng mà tổ chức đang sử dụng, có nhiều công cụ hỗ trợ cũng như có khả năng mở rộng tốt trong tương lai. 2.2 Yêu cầu cho các nhà phát triển 2.2.1 Khả năng tự triển khai Ngoài việc tự động triển khai khi có sự thay đổi mã nguồn trên kho mã chung, hệ thống triển khai liên tục cũng cần có cơ chế để cho phép các đội phát triển, kiểm thử tự triển khai ứng dụng lên các môi trường, phục vụ mục đích kiểm tra tính năng hoặc 25 kiểm thử, tái hiện lỗi. Hệ thống phân quyền cần được cấu hình để đảm bảo quyền hạn khác nhau tùy theo vai trò của các đội. 2.2.2 Nhận được các thông tin về kết quả build Quá trình triển khai liên tục thường gồm hai giai đoạn: dịch và triển khai. Dịch là quá trình biên dịch từ mã nguồn để đưa ra được một phiên bản chạy của ứng dụng, còn triển khai sẽ sử dụng sản phầm của quá trình dịch để cập nhật lên môi trường. Trách nhiệm của các đội phát triển là phải đảm bảo build thành công đối với bất cứ sự thay đổi mã nào. Tuy nhiên, quá trình dịch thường mất thời gian và các lập trình viên thường bận rộn với việc phát triển tính năng mới cho sản phẩm, do vậy cần có cơ chế để thông báo trạng thái của các tác vụ dịch cho các đội thông qua các kênh giao tiếp của công ty như email, phần mềm chat, ... 2.3 Yêu cầu về vận hành 2.3.1 Quản lý cấu hình Cơ sở hạ tầng được quản lý như mã (Infrastructure as code - IAC) là cách tiếp cận việc tự động hóa quản lý cơ sở hạ tầng dựa trên những kinh nghiệm từ quá trình phát triển phần mềm [12]. IAC nhấn mạnh vào tính nhất quán, lặp đi lặp lại đối với việc cung ứng và thay đổi các hệ thống cũng như cấu hình của chúng. Ý tưởng của IAC là người dùng sẽ viết và thực thi mã để định nghĩa, triển khai và cập nhật cơ sở hạ tầng. IAC thay đổi nhận thức của mọi người trong việc đối xử các hoạt động vận hành như là phần mềm, dù một số hoạt động thực tế liên quan tới phần cứng (ví dụ: cài đặt máy chủ triển khai). Bằng việc ứng dụng IAC, không chỉ người quản trị, bất cứ ai cũng có thể đọc và hiểu về toàn bộ cấu hình hệ thống, có khả năng đảo ngược cấu hình về phiên bản chạy tốt bằng việc sử dụng hệ thống quản lí phiên bản. IAC cũng cho phép đánh giá, kiểm thử trước khi thực sự triển khai sự thay đổi về cơ sở hạ tầng. Hệ thống quản lý cấu hình là một dạng công cụ IAC. Các hệ thống công nghệ thông tin thường xuyên thay đổi. Với mỗi bản phát hành, để hệ thống hoạt động được, người vận hành có thể cần thay đổi một số cấu hình nhất định. Trong hệ thống triển khai liên tục, tần suất triển khai cao có thể khiến cấu hình của cơ sở hạ tầng ngày một khác biệt so với trạng thái ban đầu, trở nên khó quản lý và lộn xộn. Nhằm tránh tình trạng không nhất quán này, cần có một hệ thống quản lý cấu hình phù hợp. 2.3.2 Thu thập và lưu trữ log Thu thập và lưu trữ log là yêu cầu cơ bản đối với bất cứ hệ thống phần mềm thực tế nào [13]. 26 Trong một hệ thống vi dịch vụ dựa vào container, các container sẽ được triển khai trong một cluster gồm nhiều máy. Với mỗi máy, ngoài các container còn có những dịch vụ khác đang chạy. Các ứng dụng sẽ sản sinh ra các tệp log với định dạng, vị trí khác nhau, khiến cho việc quản lý và sử dụng log trở nên khó khăn [14] (Hình 2.3). Hình 2.3: Cách thức thu thập log trước đây Cần có cơ chế để thu thập toàn bộ log cho tất cả các ứng dụng hay container này, đồng thời cho phép người dùng sử dụng chúng một cách hiệu quả: ví dụ như việc sau khi thu thập, sẽ có quá trình phân loại log, đánh chỉ số và cho phép người dùng tìm kiếm trên một giao diện phù hợp. 2.3.3 Giám sát và thông báo lỗi Các nền tảng điều phối container có cơ chế giám sát để đảm bảo các dịch vụ hoạt động bình thường và có phương pháp sửa lỗi nếu phát hiện vấn đề. Tuy nhiên, cơ chế cung cấp bởi nền tảng điều phối container thường chỉ ở mức cơ bản. Ví dụ: các dịch vụ cung cấp một API luôn trả lại mã trạng thái 200 (HTTP CODE), thành phần giám sát trong điều phối container sẽ gửi yêu cầu tới API này một cách định kỳ, nếu kết quả trả lại khác 200 thì thành phần giám sát sẽ thông báo tới bộ lập lịch để tắt và bật lại dịch vụ đó. 27 Trên thực tế, các dịch vụ thường chứa logic nghiệp vụ phức tạp, mỗi một dịch vụ lại có yêu cầu và các tham số giám sát riêng. Cần có cơ chế để các nhà phát triển có thể tùy biến các tham số cần giám sát, có công cụ trực quan để đội vận hành theo dõi và các phương thức tự động thông báo nếu có lỗi xảy ra. 2.3.4 Triển khai không bị gián đoạn và có khả năng đảo ngược phiên bản Hệ thống triển khai liên tục cần có khả năng đảo ngược phiên bản triển khai một cách dễ dàng. Điều này giúp giảm áp lực trong việc triển khai và khuyến khich mọi người triển khai thường xuyên hơn để đẩy tính năng mới người dùng một cách nhanh chóng. Ngoài ra, hệ thống phải cho phép cập nhật phiên bản mới của ứng dụng mà không có thời gian ngừng hoạt động để đảm bảo tính liên tục. Một kỹ thuật thường được sử dụng là triển khai dạng blue-green: chạy hai bản sao giống hệt nhau của ứng dụng. Tại thời điểm ban đầu, cả hai bản sao được gọi là blue. Khi cần cập nhật, một trong hai bản sao sẽ được cập nhật trước và được gọi là green. Sau khi đảm bảo phiên bản green hoạt động tốt, phiên bản blue còn lại sẽ được thay thế bằng phiên bản green. Ngược lại, nếu có vấn đề xảy ra, phiên bản green sẽ bị loại và phiên bản blue sẽ được triển khai lại. Ở lần cập nhật tiếp theo, một trong hai phiên bản green sẽ được thay bằng phiên bản mới được gọi là blue. Phương pháp này là một biến thể của mô hình triển khai không tùy biến có sử dụng reverse proxy đã giới thiệu trong chương 01. 2.3.5 Thiết kế mạng triển khai Trong thực tế, các máy triển khai trong đám mây của một công ty/tổ chức thường nằm trong một VPC (Virtual Private Cloud) với dải mạng ảo riêng. Các máy trong VPC có thể kết nối ra ngoài Internet thông qua một thiết bị NAT hoặc Internet Gateway được cung cấp bởi nhà cung cấp dịch vụ đám mây. Tuy nhiên, chúng không thể được truy cập trực tiếp từ bên ngoài nếu không gắn các địa chỉ Public IP vào những máy này với những cấu hình định tuyến thích hợp, tạo liên kết VPN hay sử dụng các dạng cấu hình port-forwarding tại các bộ định tuyến. Máy chủ triển khai thường được cài đặt tại ngay trong mạng nội bộ của công ty, do vậy ở điều kiện bình thường sẽ không thể kết nối tới tất cả các máy trong VPC, gây khó khăn cho việc triển khai tự động. Những phương pháp nêu trên đều có thể được áp dụng để giải quyết vấn đề này. Tuy nhiên, khi số lượng các máy trong VPC tăng lên, hoặc khi công ty muốn tạo ra nhiều VPC (chẳng hạn tạo ra nhiều môi trường để kiểm thử, đánh giá, mỗi môi trường được triển khai trên một VPC) thì những cách kết nối này đều có các hạn chế nhất định. Do vậy, thiết kế hệ thống triển khai liên tục cần tìm ra giải pháp đề giải quyết được yêu cầu này. 28 CHƯƠNG 3: THIẾT KẾ HỆ THỐNG TRIỂN KHAI LIÊN TỤC Trong chương này, luận văn sẽ đề xuất luồng triển khai liên tục cơ bản cho một hệ thống vi dịch vụ, đồng thời tìm hiểu, đánh giá các công nghệ hiện có cho mỗi thành phần trong luồng, dựa vào các điều kiện, yêu cầu được đưa ra ở các chương trước để đưa ra lựa chọn công nghệ và thiết kế hệ thống triển khai hoàn thiện. 3.1 Luồng triển khai cơ bản Hình 3.1: Luồng triển khai liên tục cơ bản Hình 3.1 thể hiện thiết kế luồng triển khai liên tục cơ bản cho một hệ thống vi dịch vụ sử dụng container, trong đó hoạt động của các thành phần cụ thể như sau: 29 Các lập trình viên sẽ phát triển tính năng và đẩy mã nguồn lên kho chứa mã chung (repository) của toàn bộ công ty/tổ chức. Khi kho chứa mã nhận biết có sự thay đổi về mã, máy chủ CI sẽ được kích hoạt để dịch mã vừa được cập nhật. Khi mã được dịch xong, máy chủ sẽ đóng gói bản dịch theo dạng ảnh container. Sau đó, các cơ chế kiểm thử tự động sẽ được dùng để đảm bảo mã không có lỗi. Nếu build thất bại, toàn bộ quá trình sẽ bị dừng lại. Ngược lại, máy chủ sẽ đẩy bản build mới lên một kho chứa chung dùng để triển khai. Kết quả build thành công hay thất bại đều có thông báo gửi tới nhà phát triển thông qua các kênh giao tiếp chung của công ty. Sau khi bản build được đẩy lên kho chứa, máy chủ CI sẽ kích hoạt máy chủ triển khai để triển khai bản build lên môi trường sản phẩm. Quá trình triển khai cần đảm bảo không có thời gian ngừng hoạt động và trong suốt với người sử dụng. Việc lựa chọn máy để triển khai và giao tiếp giữa các container trong các máy sẽ được một nền tảng điều phối container quản lý. Các bản build được triển khai trên môi trường sản phẩm sẽ được hệ thống giám sát kiểm tra thường xuyên. Nếu có vấn đề xảy ra, hệ thống giám sát sẽ gửi thông báo tới thành phần cảnh báo. Thành phần cảnh báo có trách nhiệm gửi thông báo lỗi tới nhà phát triển thông qua các kênh giao tiếp. Hệ thống quản lý log sẽ liên tục thu thập log từ các dịch vụ được triển khai, lưu trữ log vào một hệ thống lưu trữ và cho phép người dùng truy cập, tìm kiếm thông tin log khi có lỗi xảy ra thông qua giao diện người dùng. 3.2 Phân tích và lựa chọn công nghệ 3.2.1 Hệ thống quản lý mã nguồn Luận văn sẽ sử dụng Git làm hệ thống quản lý mã nguồn do đặc điểm phân tán, khả năng hỗ trợ rẽ nhánh, làm việc nhóm hiệu quả cùng sự phổ biến của nó. Mô hình rẽ nhánh được sử dụng trong quá trình phát triển được miêu tả trong Hình 3.2 [15]. Nhánh develop là nhánh chính được sử dụng cho việc phát hành. Các nhà phát triển sẽ tạo nhánh mới cho các tính năng mới, cho việc sửa lỗi hay các bản vá. Sau khi đảm bảo mã hoạt động tốt ở nhánh mới, nhà phát triển sẽ gửi một yêu cầu hợp nhất mã (merge request) vào nhánh develop. Ngay khi yêu cầu được tạo ra, Git sẽ sử dụng kỹ thuật Web Hook để kích hoạt quá trình build với mã mới (pre-merge build). Kết quả quá trình build và yêu cầu sẽ được gửi cho người quản lý kho mã nguồn. Người quản lý kho mã sẽ đánh giá yêu cầu và chấp nhận hợp nhất. Ngay sau khi người quản lý chấp nhận, một quá trình build khác sẽ được kích hoạt (post-merge build). Quá trình này sẽ đóng gói bản build mới vào ảnh container theo công nghệ container được chọn, 30 thực hiện kiểm thử với ảnh đóng gói và đẩy ảnh lên kho lưu trữ container nếu không có lỗi xảy ra. Hình 3.2: Mô hình rẽ nhánh 3.2.2 Máy chủ CI và máy chủ triển khai Ngay khi nhà phát triển gửi yêu cầu hợp nhất vào nhánh develop, Git sẽ kích hoạt các tác vụ dịch được chuẩn bị trong máy chủ CI. Quá trình dịch sẽ bao gồm tiền hợp nhất (pre-merge) và hậu hợp nhất (post-merge), với các bài kiểm thử khác nhau được thực hiện để đảm bảo chất lượng mã. Tất cả các bên liên quan đều có thể nhìn thấy quá trình dịch, thời gian thực hiện, trạng thái kết quả từ máy chủ CI. Nếu có vấn đề xảy ra, sẽ có thông báo gửi tới các bên liên quan thông qua kênh giao tiếp chung. Máy chủ CI được sử dụng trong bài là Jenkins, một phần mềm tự động hóa, mã nguồn mở và viết bằng Java. Jenkins hỗ trợ hầu hết các phần mềm quản lý mã nguồn 31 hiện nay như Git, Subversion, Mercurial ... và hỗ trợ các mã lệnh của nhiều loại ngôn ngữ kịch bản như Bash, Python, Groovy, Gradle ... Jenkins có kiến trúc plugin, cho phép thêm bớt các tính năng tùy theo yêu cầu. Một số plugin phổ biến cho Jenkins như phân quyền, Slack, Mail, ... Việc sử dụng Jenkins sẽ đảm tính mở rộng sau này do khả năng hỗ trợ đa dạng các công nghệ của nó. Do các đặc điểm linh hoạt, Jenkins cũng sẽ được sử dụng làm máy chủ triển khai trong luận văn. Hình 3.3: Máy chủ CI Jenkins Jenkins có thể chạy ở chế độ một mình. Tuy nhiên, ở chế độ một mình, khi số lượng các tác vụ build tăng lên, CPU và bộ nhớ sẽ không đáp ứng được. Để ngăn chặn điều này, cách sử dụng Jenkins phổ biến là theo mô hình chủ-nô lệ (master-slave) (Hình 3.4). Một máy nô lệ là một thiết bị được cấu hình để hành xử như một executor của máy chủ. Máy chủ sẽ phục vụ như giao diện chính, nhận các tác vụ và phân tán tải lên các executor/slave được đăng kí. 32 Hình 3.4: Kiến trúc master-slave của Jenkins [16] Các máy nội bộ của mỗi đội có thể được cấu hình và tham giao vào Jenkins với vai trò slave. Các bản build mã của những đội này có thể được điều chỉnh để luôn chạy trên các máy slave của đội. Điều này giúp hạn chế việc quản lý slave cho đội vận hành và phân phối tải tùy theo nhu cầu sử dụng về mỗi đội, phù hợp với mô hình phát triển vi dịch vụ. 3.2.3 Công nghệ container Mã nguồn sau khi được hợp nhất và build hậu hợp nhất sẽ được đóng gói thành ảnh container và lưu trong kho ảnh. Luận văn sẽ sử dụng công nghệ container phổ biến nhất hiện nay là Docker. Docker sử dụng Dockerfile để miêu tả các lớp ảnh, các câu lệnh cần thực hiện cho việc build ảnh container. Nhằm đảm bảo tính nhất quán trong việc tích hợp build ảnh container với mã nguồn, Dockerfile sẽ được lưu trữ và được quản lý trong cùng thư mục trên kho lưu trữ chung như mã nguồn. 3.2.4 Nền tảng điều phối container Hiện nay, cùng với sự phổ biến của công nghệ container, số lượng các nền tảng điều phối container ngày càng tăng lên. Trong đó, các nền tảng phổ biến nhất là Amazon ECS, Azure Container Service, Goole Container Engine, Diego của Cloud Foundry, Kubernetes, Docker Swarm, Mesosphere Marathon. Tuy nhiên, hầu hết các nền tảng điều phối đều là bản thương mại được cung cấp bởi các công ty điện toán đám mây, ngoại trừ Docker swarm, Mesosphere Marathon và Kubernetes. Luận văn do vậy chỉ tập trung hướng tới phân tích ba nền tảng này. 33 3.2.4.1 Docker swarm Từ Docker Engine phiên bản 1.12.0 trở đi, Docker cho phép người dùng triển khai container theo trạng thái Swarm. Docker swarm được xây dựng dựa trên Docker API và làm việc như sau: một swarm là một nhóm các máy chạy Docker và làm việc cùng nhau như một cluster. Người dùng vẫn sử dụng các lệnh Docker như trước để tương tác nhưng ở trạng thái này, các lệnh sẽ được thực thi trong cluster bởi swarm manager. Hình 3.5: Kiến trúc của Docker Swarm [17] Swarm manager có trách nhiệm như bộ lập lịch, phối hợp với các agent chạy trên mỗi máy để quản lý tài nguyên. Trong Docker swarm, chức năng lập lịch không bị giới hạn bởi Docker và có thể được thay thế bởi các phần mềm khác như Apache Mesos. Các swarm manager là các máy duy nhất nhận yêu cầu của người dùng. Các máy khác gia nhập vào swarm sẽ đóng vai trò là worker, được ủy quyền để thực hiện tác vụ. Để chạy một dịch vụ trong Docker Swarm, người dùng khai báo ảnh container cần chạy và số lượng bản sao cần thiết. Ví dụ: để khai báo việc chạy dịch vụ nginx với hai bản sao, người dung có thể triển khai bằng câu lệnh sau: # docker service create --replicas 2 --name mynginx nginx Trong ví dụ này, hai bản sao của ảnh nginx sẽ được các manager node điều phối để chạy trên worker node. Mỗi ảnh sẽ là một container chạy độc lập. Để đảm bảo giao tiếp mạng giữa các container trên các máy khác nhau, Docker swarm cần sử dụng thêm kỹ thuật mạng multihost. Kỹ thuật mạng multihost được hỗ 34 trợ mặc định trên Docker swarm là Docker Overlay Driver. Ngoài ra, người dùng có thể sử dụng các công nghệ khác để thay thế như Flannel, Weave, Calico ... Docker swarm hỗ trợ các công nghệ thường dùng để lưu trạng thái cluster như etcd, consul và zookeeper. Trước đây người dùng cần tự phát triển tính năng khám phá dịch vụ dựa vào Docker API và các công nghệ lưu trữ nêu trên, nhưng hiện tại một số công cụ khám phá tự động dựa vào DNS đã được phát triển và sử dụng phổ biến với Docker Swarm như wagl. 3.2.4.2 Mesosphere Marathon Apache Mesos là nền tảng quản lý cluster mục đích chung, hoạt động như nhân của một điều hành phân tán, được xây dựng dựa trên các nguyên lý tương tự như nhân Linux nhưng khác ở phạm vi ứng dụng: Mesos trừu tượng hóa CPU, bộ nhớ, bộ lưu trữ và các tài nguyên tính toán khác trong toàn bộ cluster, khiến cluster giống như một máy tính khổng lồ mà dựa vào đó các hệ thống phân tán được build và chạy một cách dễ dàng, hiệu quả. Nhân Mesos được chạy trên tất cả các máy và cung cấp các ứng dụng lớp trên (như: Hadoop, Spark, Cassandra, Elasticsearch) những API giúp quản lý tài nguyên và lập lịch chạy trên toàn bộ cluster. Giống với nhân hệ điều hành bình thường, Mesos thường không hoạt động một mình mà được sử dụng kèm với các bộ khung khác, như Apache Spark, Apache Casandra, Chronos hay Marathon (Hình 3.6). Mesos hỗ trợ chạy dịch vụ ở dạng đã được container hóa cũng như dạng chạy trực tiếp (bash script, Python, ứng dụng JVM...). Mesosphere Marathon là một bộ khung giúp điều phối container trên Mesos, cung cấp khả năng scale và tự khôi phục. Tương tự như Docker Swarm, Mesos hoạt động theo mô hình chủ-nô lệ, trong đó các agent trong máy nô lệ sẽ gửi thông tin về tài nguyên cho máy chủ. Bộ lập lịch trong Marathon đăng kí với Mesos để nhận các thông tin cập nhật về tài nguyên và dựa theo đó để lựa chọn máy chạy một cách hợp lí. Kết nối mạng giữa các container trên các máy chạy trong Mesos cluster phụ thuộc vào công nghệ container được sử dụng: Mesos containerizer hoặc Docker containerizer. Với Docker containerizer, kỹ thuật mạng multihost được sử dụng như đề cập ở phần Docker swarm [11]. 35 Hình 3.6: Kiến trúc của Apache Mesos Mesos cho phép người dùng tích hợp nhiều công cụ khám phá dịch vụ khác nhau, tuy nhiên giải pháp thường được dùng là Mesos-DNS, một dạng dịch vụ DNS tương tự như DNS trong Docker swarm wagl. Hình 3.7: Kiến trúc Mesosphes Marathon [18] 36 3.2.5 Kubernetes Kubernetes là một nền tảng điều phối mã nguồn mở được phát triển sau hơn một thập kỷ chạy các ứng dụng container của Google. Như hai nền tảng ở trên, Kubernetes gồm ít nhất một máy chủ và nhiều máy nô lệ. Máy chủ cung cấp API cho người dùng, có trách nhiệm lập lịch để triển khai và quản lý toàn bộ cluster. Tất cả các node trong Kubernetes cluster đều cung cấp môi trường chạy container, ví dụ như Docker hay rkt. Trong Kubernetes, một pod là một tập hợp các container được triển khai và quản lý cùng nhau. Pod là đơn vị triển khai nhỏ nhất, đóng vai trò như lớp bao của các container với môi trường ngoài. Các ảnh container trong pod và số lượng bản sao các pod cần chạy có thể được khai báo trực quan trong tệp dạng JSON hoặc YAML. Thành phần Replication Controller (trong các phiên bản Kubernetes mới hơn, thành phần ReplicaSet hoặc Deployment có thể được sử dụng thay cho Replication Controller) có vai trò đọc các tệp JSON được khai báo và đảm bảo trạng thái của các pod. Kubernetes cài lên mỗi máy trong cluster một kubelet agent, chịu trách nhiệm điều khiển các dịch vụ Docker, giám sát và thông báo cho master trạng thái tài nguyên của máy. Máy chủ thu thập và lưu trữ trạng thái toàn bộ các máy vào cơ sở dữ liệu dạng key-value etcd; dựa vào đó, bộ lập lịch trong máy chủ lựa chọn vị trí triển khai cho các pod. Hình 3.8: Kiến trúc của Kubernetes [11] Trong Kubernetes, các pod có thể xuất hiện hay biến mất trên mỗi máy tùy thuộc vào tài nguyên hiện tại. Do vậy, các thông tin về pod như địa chỉ IP hay các cổng được 37 mở ra cho các container trong pod là không đáng tin cậy. Để giải quyết vấn đề này, Kubernetes cung cấp một lớp trừu tượng gọi là lớp dịch vụ. Một tập hợp các pod sẽ được đại diện bởi một dịch vụ, với tên và cổng không đổi. Dịch vụ lựa chọn các pod để đại diện dựa vào Label Selector. Trong các ứng dụng nội bộ, Kubernetes cung cấp các Endpoints API và luôn cập nhật API theo sự thay đổi của các Pod trong dịch vụ. Với các ứng dụng khác, Kubernetes cung cấp một dạng IP ảo cho dịch vụ, từ dịch vụ sẽ redirect các yêu cầu sang Pod. Trên mỗi máy trong Kubernetes cluster đều được cài kube-proxy, có nhiệm vụ cung cấp một dạng địa chỉ IP ảo cho các service. Kube-proxy có nhiều dạng hoạt động, tuy nhiên mục đích chung đều là ánh xạ các yêu cầu gửi tới Service vào các Pod chạy phía sau. Ví dụ (Hình 3.9): Ở dạng userspace, kube-proxy sẽ lắng nghe sự kiện thêm/bớt Service hay Pod từ master. Với mỗi Service, kube-proxy sẽ mở một cổng proxy ảo trên máy. Tất cả yêu cầu gửi tới cổng sẽ được đẩy tới các Pod mà Service ánh xạ tới (thông tin ánh xạ của Service và Pod được lưu trong EndPoints API). Kube- proxy cũng sẽ sửa đổi bảng iptables để redirect tất cả yêu cầu tới địa chỉ IP ảo và cổng của Service sang cổng proxy ảo, từ đó redirect sang đúng Pod mà Service đang đại diện. [19] Hình 3.9: Ánh xạ Service và Pod trong Kubernetes Kubernetes hỗ trợ công cụ khám phá dịch vụ bằng DNS, cho phép phân giải tên của dịch vụ sang địa chỉ Cluster IP, từ đó giúp tất cả các container trên các máy trong cluster có thể giao tiếp với nhau thông qua tên dịch vụ. Dịch vụ ngoài ra còn đóng vai trò như load-balancing trong nội bộ kubernetes. Kubernetes không cung cấp giải pháp để đảm bảo thông tin kết nối mạng giữa các máy mà đòi hỏi người dùng sử dụng dịch vụ ngoài như: Flannel, CNI, ... Dựa vào đó, Kubernetes sinh ra các Cluster IP ảo để đại diện cho dịch vụ và các Pod. 38 3.2.5.1 So sánh và lựa chọn nền tảng Ba nền tảng điều phối đều cung cấp các chức năng cơ bản nhất để quản lý container, tuy nhiên độ phức tạp trong sử dụng, số lượng máy có thể quản lý và khả năng tùy biến của các nền tảng hoàn toàn khác nhau: • Docker Swarm: dễ sử dụng và cài đặt do được cung cấp bởi Docker, tuy nhiên khả năng tùy biến thấp. Quản lý số lượng máy nhỏ tốt (dưới 10), tuy nhiên hiệu năng giảm đáng kể khi số lượng máy tăng lên (dưới 100). Chưa có số liệu thống kê về sử dụng Docker swarm để quản lý tới 1000 máy. Docker swarm phù hợp với các tổ chức có quy mô nhỏ. Nền tảng < 10 máy 10 - 100 máy 100 – 1000 máy > 1000 máy Khả năng tùy biến Tính dễ sử dụng Docker swarm ++ + ? ? + +++ Mesphere Marathon + ++ ++ ++ ++ + Kubernetes ++ ++ + ? ++ ++ Bảng 3-1: So sánh Docker Swarm, Mesosphere Marathon và Kubernetes • Mesosphere Marathon: Sử dụng Mesos để quản lý số lượng máy nhỏ là không hiệu quả (dưới 10), do được thiết kế để hỗ trợ tối đa sự dư thừa cho các hệ thống lớn. Mesos cho phép cấu hình linh hoạt và có thể quản lý tới hơn 1000 máy mà vẫn đảm bảo hiệu năng. Tuy nhiên, cấu hình Mesos quá phức tạp, đòi hỏi nhiều kiến thức, do vậy chỉ phù hợp với các công ty quy mô lớn. • Kubernetes: Kubernetes là phiên bản trung hòa của hai nền tảng trên, cho phép cấu hình linh hoạt, hoạt động tốt với cả số lượng máy nhỏ và vừa (từ 10 tới trên 100 máy). Cấu hình Kubernetes không quá phức tạp, có nhiều tài liệu hỗ trợ và cộng

Các file đính kèm theo tài liệu này:

luan_van_xay_dung_kien_truc_trien_khai_lien_tuc_cho_cac_he_t.pdf