TRANG PHỤ BÌA
LỜI CAM ĐOAN .i
LỜI CÁM ƠN.ii
TÓM TẮT.iii
ABSTRACT.iv
MỤC LỤC.v
DANH MỤC CÁC TỪ VIẾT TẮT .vii
DANH MỤC CÁC BẢNG.viii
DANH MỤC CÁC HÌNH.ix
CHƯƠNG 1: MỞ ĐẦU .1
1.1. Đặt vấn đề.1
1.2. Mục tiêu nghiên cứu.3
1.2.1 Mục tiêu tổng quát.3
1.2.2 Mục tiêu cụ thể.3
1.3. Phạm vi và giới hạn của luận văn .3
1.4. Nội dung nghiên cứu.3
1.5. Phương pháp nghiên cứu.4
1.5.1 Mô hình bài toán hình thành tế bào (CFP) .4
1.5.2. Phương pháp.4
1.6. Những đóng góp của luận văn.5
1.7. Cấu trúc của luận văn.5
CHƯƠNG 2: TỔNG QUAN VÀ CÁC PHƯƠNG PHÁP HEURISTIC .6
2.1. Tổng quan về bài toán tối ưu trong sản xuất và bàn toán CF.6
2.1.1 Tổng quan về bài toán tối ưu trong sản xuất.6
2.2.2 Giới thiệu bài toán cell formation (CF) .9
2.2. Tổng quan về heuristic và tìm kiếm cục bộ .20
2.2.1 Tìm kiếm heuristic.20
2.2.2 Tìm kiếm meta-heuristic.21
105 trang |
Chia sẻ: honganh20 | Ngày: 25/02/2022 | Lượt xem: 589 | Lượt tải: 4
Bạn đang xem trước 20 trang tài liệu Luận văn Tiếp cận thuật toán meta - Heuristic giải bài toán tối ưu hóa quá trình sản xuất, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
nghiệm.
Để thực hiện các bước trên, thông thường các kỹ thuật giải sau được áp dụng:
- Quy hoạch: tuyến tính, động, phi tuyến.
- Quy hoạch luồng.
- Quy hoạch động.
- Cận – nhánh.
17
- Quy hoạch thỏa mãn ràng buộc.
- Các thuật giải heuristic, approximation, tiến hóa (evolutionary), meta-
heuristics.
- Thuật giải ngẫu nhiên.
Trong thực tế quản lý và vận hành, do các bài toán hiện nay sẽ xuất hiện với tốc độ
nhanh và biến đổi liên tục nên nhiều bài toán, đặc biệt trong sản xuất, có yêu cầu
tìm nghiệm tối ưu (nghiệm gần đúng). Về tổng quan, bài toán CFP là một bài toán
có độ phức tạp không đa thức (NP). Về bản chất, đây là bài toán tổ hợp. Các thuật
toán giải CFP bao gồm nhiều định hướng toán học. Cụ thể các nhóm phương pháp
như:
- Kỹ thuật phân tích gom cụm (clustering) nhằm nhận biết cấu trúc trong một
tập dữ liệu. Như Chandrasekharan và Rajagopalan (1989) [11] đề xuất
phương pháp “grouping efficiency”; Kumar và Chandrasekharan (1990)
[31] đề xuất phương pháp “grouping efficacy”; Hsu (1990) [25] đề xuất giải
pháp “group capability index”...
- Phân hoạch đồ thị (graph) với graph hay một mạng đại diện được sử dụng
để xây dựng CFP. Nhóm phương pháp này sử dụng các thuật toán phân tích
đồ thị để tìm kiếm tối ưu.
- Các phương pháp quy hoạch toán học đưa CFP về bài toán quy hoạch
nguyên. Việc lựa chọn các nghiệm trong bài toán CFP là các nghiệm nguyên
thỏa cực đại về số nhóm được tạo thành.
- Các phương pháp Heuristics như tìm kiếm (SA), tìm kiếm Tabu (Tabu
Search), thuật toán di truyền (GA), tối ưu cục bộ (PSO), mạng nơron (ANN).
Chi tiết hơn về các phương pháp heuristic đối với bài toán CFP. Hiện tại, nhiều
nhóm nghiên cứu đã thử nghiệm nhiều phương pháp heuristics khác nhau để giải bài
toán CFP. Sơ lược bao gồm những thử nghiệm nghiên cứu:
- Nhóm các phương pháp tìm kiếm cục bộ (local search algorithm).
- Nhóm các phương dựa trên quần thể (population-based method).
- Các phương pháp lai (hybrid).
18
Những phương pháp trên được áp dụng với các chiến lược tìm kiếm theo thống kê
hoặc theo các chiến lược. Cụ thể hơn, cho đến nay, phần lớn các nghiên cứu đều
xem xét đến dữ liệu phân tích dòng sản xuất (PFA) và cố gắng nhóm các bộ phận và
máy để thỏa các tiêu chí được tối ưu như tính hiệu quả nhóm, tính hiệu nghiệm
nhóm, hiệu quả về kỹ thuật nhóm,... Trong các phương pháp PFA, hầu hết ma trận 2
chiều bộ phận - máy, là ma trận A = [aij], được sử dụng. Với aij=1, nghĩa là bộ phận
i cần xử lý trên máy j, ngược lại aij=0. Bài toán CFP nhằm đến nhóm tất cả các "1"
trong dạng khối đường chéo. Trong một số nghiên cứu gần đây, đa số xem CFP như
một ma trận incident bộ phận - máy nhị phân được đề cập.
Ví dụ nghiên cứu của Chen và Cheng (1995) [41] xét mạng nơron dựa vào CFP
trong CM. Cụ thể hơn, Chen và Cheng sử dụng lý thuyết cộng hưởng (ART –
adaptive resonance theory) với nền tảng mạng nơron cho bài toán CF trong CM.
Được biết, theo wikipedia, ART là lý thuyết do Stephen Grossberg và Gail
Carpenter phát triển dựa trên khía cạnh “làm thế nào não xử lý thông tin” và ART
sử dụng nhiều mô hình mạng neuron vừa có học giám sát vừa học không giám sát
để nhận dạng mẫu và dự báo. Ưu điểm của mạng ART so với phương thức truyền
thống là tính toán nhanh và khả năng vượt trội xử lý các vấn đề diện lớn trong công
nghiệp vì, một cách khái quát, mô hình ART sẽ nhận diện đối tượng theo phương
pháp quan sát kì vọng từ trên xuống (top-down) và “gặt hái/thu nhận” thông tin từ
dưới lên (bottom-up).
Mahdavi, Kaushal và Chandra (2001) [42] đề xuất phương án mạng đồ thị nơron
giải quyết bài toán CF. Nhiều nỗ lực để phát triển một thuật toán đáng tin hơn các
phương thức truyền thống được đưa ra. Những nghiên cứu có khả năng xử lý các
vấn đề công nghiệp lớn mà không cần giả thiết tham số hoặc các thành phần thiếu
trong các máy/bộ phận bị nghẽn cổ chai.
Soleymanpour và cộng sự (2002) [43] áp dụng phương pháp mạng nơron hỗn độn
(TCCN) cho thiết kế CM. Thuật toán TCCN nhằm vào mục đích nhóm các thành
phần tương đồng và máy không tương đồng để cực tiểu tổng thành phần ngoại lệ.
Theo [3], một mạng được xây dựng và thuật toán đề xuất để thử nghiệm nhóm 18
19
vấn đề. Các kết quả được so sánh với các phương pháp khác nhau như: ART1 (là
mạng ART đơn giản với các giá trị nhập nhị phân), ART1 mở rộng, phương pháp
OSHN (Ortho-Synapse Hopfield Neuron Network). Kết quả là phương pháp đề xuất
có ba ưu điểm chính bao gồm: khả năng tránh các cực tiểu địa phương; khả năng
giải quyết các vấn đề có kích thước khác nhau có cùng tập giá trị tham số; và thời
gian tính toán giảm thiểu.
Wang (2003) [44] trình bày một thuật toán phân công tuyến tính cho ô máy và hình
thành họ bộ phận cho việc thiết kế các hệ thống CF. Đầu tiên, giải pháp trình bày
bằng việc quyết định họ bộ phận hoặc ô-máy được thể hiện bằng việc so sánh các hệ
số tương tự giữa các bộ phận và máy và tìm kiếm tập các bộ phận và máy ít tương
đồng. Bằng việc sử dụng nhóm thể hiện và các hệ số tương tự liên hệ nhau, mô hình
gán nhãn tuyến tính được hình thành để giải bài toán CFP cấp phát các bộ phận còn
lại cho máy và tối ưu về chỉ số tương tự. Dựa trên mô hình gán tuyến tính được hình
thành, thuật toán thành lập nhóm được phát triển.
Mahdavi, Javadi, Alipour và Slomp (2007) [45] đề xuất mô hình toán học mới cho
hình thành ô trong hệ thống CM (gọi là CMS – cellular manufacturing system), dựa
trên khái niệm về sử dụng các ô. Mục tiêu của mô hình là tối thiểu số lượng void
trong cell để đạt được tốc độ cao hơn về cell utilization. Kiểm chứng mô hình bằng
phần mềm LINGO 8 sử dụng phương pháp rẽ nhánh và biên (B&B). Năm 2008,
Wu, Chang và Chung đề xuất phương án đơn giản hiệu quả giả lập dựa trên kỹ thuật
annealing để hình thành các nhóm máy – bộ phận khi hệ thống sản xuất được thể
hiện bằng ma trận quan hệ giữa máy – bộ phận với trị 0 và 1.
Năm 2009, Iraj Mahdavi và cộng sự [1] đã đề xuất mô hình hệ phi tuyến với các
biến nguyên và mô hình được đề xuất giải cho bài toán có kích thước thật bằng
thuật toán di truyền. Và phương pháp hiệu quả nhóm (group efficacy) có kết quả tốt
hơn so với các phương pháp cell formation hiện tại.
Như vậy, bài toán CF được phát biểu theo một mô hình toán học dưới dạng bài toán
tối ưu. Đồng thời, bài toán CF được định hướng giải theo phương pháp heuristic với
các nghiên cứu liên quan. Dưới đây là tổng quan một số phương pháp tìm kiếm gần
20
đúng (heuristic).
2.2. Tổng quan về heuristic và tìm kiếm cục bộ
2.2.1 Tìm kiếm heuristic
Tìm kiếm heuristic là một kỹ thuật thông minh nhân tạo sử dụng tính chất gần đúng
cho việc tìm kiếm. Heuristic là luật có xác suất cho việc giải quyết một vấn đề. Các
phương pháp heuristic đóng vai trò lớn trong các chiến lược tìm kiếm cho nhiều bài
toán phức tạp. Các đặc điểm của một thuật toán heuristic:
- Không phải lúc nào cũng tìm được giải pháp tốt nhất.
- Tuy nhiên, tìm được giải pháp tốt trong thời gian hợp lý.
Từ đó, phương pháp heuristic thường được sử dụng để giải các bài toán nhằm đạt
đến hai yếu tố chính: thỏa mãn yêu cầu đưa ra và định hướng tăng cường hiệu quả
trong điều kiện: hoặc không tìm được thuật toán hay cách giải chính thức cho bài
toán; hoặc giải pháp có thuật toán nhưng thời gian kéo dài vô tận hay việc tính toán
cần khoảng thời gian rất lớn.
Về quy trình, phương pháp tìm kiếm heuristic bao gồm các bước sau:
- Bước 1: Sinh tập nghiệm có thể từ từ không gian bài toán hoặc từ các trạng
thái ban đầu.
- Bước 2: Kiểm tra để tìm ra các giải pháp thực so sánh với trạng thái đạt đến
các trạng thái mục tiêu.
- Bước 3: Nếu nhận được kết quả tốt thì dừng. Ngược lại lặp lại bước 1 để
phát sinh tập nghiệm có thể khác.
Với quan điểm trên, tư tưởng của heuristic được áp dụng trong nhiều lĩnh vực khác
do có các ưu điểm về: tốc độ tìm kiếm và có thể kết hợp các phương pháp khác. Tuy
nhiên, phương pháp cũng có một số nhược điểm là cần đến kiến thức, kinh nghiệm
cũng như chuyên gia nhận định vấn đề để xây dựng các nghiệm vì những ước tính
có thể nhận dạng được các vấn đề nhỏ mà không xử lý hoặc lường trước được các
vấn đề lớn phát sinh trong khi tìm kiếm.
Một số kỹ thuật về thuật toán heuristic được ứng dụng như sau: phương pháp thuần
heuristic (pure heuristic search), tìm kiếm chiều sâu (depth-first search), tìm kiếm
21
chiều rộng (breadth-first search), thuật toán A* ứng dụng trong tìm kiếm đường đi
ngắn nhất,
Hiện nay, heuristic được phát triển theo nhiều hướng khác nhau với các dạng như:
meta-heuristic và hyper-heuristic. Theo đó, hyper-heuristic được sử dụng trong việc
tìm kiếm hình thức liên quan đến các kỹ thuật máy học, các quá trình lựa chọn, tổ
hợp, phát sinh hoặc dựa theo một số loại heuristic cơ bản. Hyper-heuristic thường
áp dụng cho các nghiên cứu về xây dựng các hệ thống để xử lý phân loại các lớp bài
toán (hơn là chỉ xử lý một vấn đề).
2.2.2 Tìm kiếm meta-heuristic
Trong khoa học máy tính và toán học, phương pháp metaheuristic là tiến trình
heuristic mức cao để tìm, phát sinh và chọn phương án gần đúng với đầy đủ tiêu chí
tìm nghiệm tốt hơn cho một bài toán tối ưu. Phương pháp metaheuristic đặc biệt phù
hợp với các bài toán thiếu hoặc không đầy đủ thông tin hoặc các bài toán giới hạn
về khả năng tính toán. Phương pháp metaheuristic tạo mẫu tập nghiệm và thường
ứng dụng cho cả các bài toán tối ưu chưa được giải. Do đó, phương pháp
metaheuristic được sử dụng trong nhiều bài toán.
So sánh với các thuật toán tối ưu và các phương pháp lặp, metaheuristics không
đảm bảo nghiệm được giải là tối ưu toàn cục với một số bài toán. Nhiều phương
pháp metaheuristic được cài đặt dựa trên các kỹ thuật tối ưu ngẫu nhiên với các
“nghiệm” tìm thấy phụ thuộc trên tập biến ngẫu nhiên sinh ra. Trong các bài toán tối
ưu tổ hợp, bằng việc tìm kiếm trên tập nghiệm khả thi, metaheuristic có thể tìm thấy
nghiệm tốt với việc tính toán ít hơn các giải thuật tối ưu, lặp hoặc các giải thuật
heuristic đơn giản. Về phân loại, đến nay, metaheuristic được phân thành các loại
sau:
- Tìm kiếm cục bộ (local search) và tìm kiếm toàn cục (global search).
- Tìm nghiệm đơn (single solution) và tìm nghiệm quần thể (population-
based).
- Thuật toán lai (hybridization) và thuật toán thuần (memetic).
- Các thuật toán metaheristic song song (parallel metaheuristic).
22
- Các thuật toán metaheuristic theo cảm hứng của sinh vật theo tự nhiên (như:
các thuật toán đàn kiến - ant, đàn ong - bee, chim cu - cookie,).
Các giải thuật metaheuristics gồm các đặc tính sau:
- Có các chiến lược đề ra phục vụ tiến trình tìm kiếm.
- Mục tiêu là khám phá một cách tối ưu không gian tìm kiếm để tìm được các
giải pháp gần tối ưu.
- Các kỹ thuật sử dụng trong các thuật toán metaheuristic gồm cả các tiến
trình tìm kiếm cục bộ đơn giản đến các tiến trình học phức tạp.
- Các thuật toán metaheuristic đều là xấp xỉ (approximate) và thường là bất
định (non-deterministic).
- Lưu ý: metaheuristic không phải là việc xác định bài toán (problem-
specific).
2.2.3 Tìm kiếm cục bộ
Trong khoa học máy tính, tìm kiếm cục bộ, một nhánh nhỏ của meta-heuristic, là
một phương pháp heuristic để giải quyết các bài toán tính toán và tối ưu hóa. Tìm
kiếm cục bộ được sử dụng để tìm các giải pháp cực trị các tiêu chí giữa các giải
pháp đề xuất. Chi tiết hơn, tìm kiếm cục bộ (local search) là thuật toán lặp để di
chuyển từ một giải pháp S thành giải pháp S’ dựa trên cấu trúc lân cận được định
nghĩa. Và việc thay đổi các giải pháp đến khi vượt quá thời gian tìm kiếm hoặc giải
pháp có khả năng tối ưu nhất xuất hiện. Với ưu điểm sử dụng ít bộ nhớ và luôn tìm
kiếm được các “nghiệm” hợp lý trong không gian trạng thái liên tục/lớn, các giải
pháp tìm kiếm cục bộ điển hình được áp dụng trong nhiều ứng dụng như: bài toán
người bán hàng (TSP – Traveling Salesman Problem),... và các bài toán khác trong
khoa học máy tính (đặc biệt trong trí tuệ nhân tạo), trong toán học, điều khiển học,
sinh tin học...
Về quy trình, thông thường tìm kiếm cục bộ sẽ bao gồm bốn bước sau:
- Bước 1: Bước khởi tạo (initialisation) bằng việc chọn một nghiệm S ban đầu
và tính giá trị hàm mục tiêu F(S).
23
- Bước 2: Bước sinh các “lân cận” (neighbour generation) bằng việc chọn các
nghiệm “lân cận” S’ và tính các giá trị F(S’).
- Bước 3: Bước kiểm định chấp nhận (acceptance test) là kiểm định chấp nhận
sự di chuyển từ S sang S’. Nếu chấp nhận di chuyển này thì giải pháp S’ sẽ
thay thế S. Ngược lại, S vẫn giữ là giải pháp hiện hành.
- Bước 4: Kiểm định để dừng tìm kiếm (termination test) là bước quyết định
thuật toán có dừng hay không. Nếu dừng, đầu ra phải là một trong những giải
pháp tối ưu. Ngược lại, thuật toán tiếp tục tìm kiếm những “lân cận” như
bước 1.
Hiện tại, bốn kỹ thuật tìm kiếm cục bộ bao gồm: iterative improvement (kỹ thuật
hill climbing hoặc greedy local search), threshold accepting (kỹ thuật gradient
method), Simulated Annealing và kỹ thuật tìm kiếm Tabu search (thuộc nhóm thuật
toán di truyền).
Các thuật toán đều tương đồng ở các bước 1, 2 và 4. Với bước 3, việc chấp nhận
một giải pháp S’ không tối ưu hơn S là đặc điểm của từng giải pháp như bảng dưới
đây:
Bảng 2.4: Các dạng tìm kiếm cục bộ
TT Kỹ thuật tìm
kiếm cục bộ
Điều kiện chấp nhận
S’
Giải thích thêm
1 Iterative
Improvement
F(S’) < F(S)
2 Threshold
Accepting
F(S’) 0, là giá trị threshold. α
ban đầu mang giá trị lớn, sau sẽ bé
dần
3 Simulated
Annealing
Nếu : chọn
Nếu : chọn với
Sử dụng Kiểm định chấp nhận xác
suất (Probabilistic Acceptance Test).
T thay đổi trong suốt thuật toán. T ban
đầu lớn. Sau đó T sẽ nhỏ dần
24
TT Kỹ thuật tìm
kiếm cục bộ
Điều kiện chấp nhận
S’
Giải thích thêm
xác suất với T là
tham số theo thời gian.
4 Tabu Search Chấp nhận nghiệm S’
“tồi” hơn
Mọi nghiệm được lưu vào trong danh
sách tabu list để theo dõi các nghiệm
mới phát sinh. Do đó, chúng ta phải
biện luận thêm các nghiệm đã hoặc
chưa thuộc về danh sách nghiệm
(non-tabu).
Theo đó, cả hai thuật toán Threshold Accepting và Simulated Annealing có thể
quay lại nghiệm đã duyệt. Và giải pháp để việc tìm nghiệm không bị lặp là chúng ta
tạo ra một danh sách (gọi là tabu list). Các giải pháp mới được chấp nhận sẽ được
đưa vào trong danh sách. Với phương án tabu search, việc tìm kiếm sẽ loại bỏ được
những cực trị trong khu vực nhỏ để tiến đến cực trị toàn cục.
Mặt khác, về phân lớp, hai lớp tìm kiếm cục bộ bao gồm: tìm kiếm cục bộ trên một
phần miền nghiệm (partial solutions) và tìm kiếm cục bộ dựa trên toàn bộ miền
nghiệm (complete solution).
2.4. Các thuật toán giải gần đúng CFP
Nhánh nhóm thuật toán metaheuristic phát triển rực rỡ trong những năm gần đây
với nhiều ưu điểm như độc lập thông tin, uyển chuyển và hiệu quả, ẩn song song,
đã góp phần thúc đẩy các nghiên cứu giải bài toán CF trong CM bằng kỹ thuật thuật
toán di truyền. Là một trong những phương pháp metaheuristic, thuật toán di truyền
(GA – genetic algorithm) là một trong những giải pháp tối ưu mới để bắt chước các
tiến trình tự nhiên để tạo các tiến trình tối ưu (Goldberg, 1989).
25
Hình 2.3: Minh họa về một chuỗi “nhiễm sắc thể”
Theo đó, dựa trên tính tương tự của các hiện tượng chọn lọc tự nhiên trong sinh học,
đầu tiên, một cấu trúc nhiễm sắc thể (chromesome) để thể hiện các giải pháp cho
vấn đề. Sau đó, các thành phần của quần thể được chọn, dựa trên hàm ước lượng,
gọi là hàm phù hợp (fitness), liên quan đến giá trị mỗi thành phần dựa trên hàm mục
tiêu. Giá trị phù hợp cao hơn của thành phần thì sẽ được ưu tiên chọn. Do đó, các cá
nhân ít phù hợp sẽ được thay thế bằng cái phù hợp hơn. Các phép toán về di truyền
được áp dụng để chọn các thành viên tạo ra thế hệ quần thể mới. Tiến trình này
được lặp lại khi đến số lượng các bước lặp nhất định. Thuật toán di truyền do
Holland phát triển (1975) được sử dụng rộng rãi như một phương pháp thay thế cho
việc giải các bài toán tối ưu trong các ứng dụng khác nhau như kỹ thuật, kinh tế,
nông nghiệp, kinh doanh, truyền thông và sản xuất (theo Gen và Cheng, 1997 [46];
Goldberg, 1989 [47]; Man, Tang và Kwong, 1999 [48]). Như một phương pháp tìm
kiếm chung, ưu điểm một thuật toán di truyền là kết hợp các thành tố tìm kiếm có
hướng và ngẫu nhiên để khám phá không gian tìm kiếm để đạt được kết quả tốt
nhất. Các nghiên cứu về thuật toán di truyền áp dụng đối với bài toán CF trong CM
gồm:
- Venugopal và Narendran (1992) [50] mô hình CFP dựa trên cực tiểu sự biến
đổi tổng tải trên cell sử dụng thuật toán di truyền.
- Joines, Culbreth và King (1996) [27] sử dụng quy hoạch nguyên cho bài toán
thiết kế cell và sử dụng thuật giải di truyền để giải mô hình sau đó.
- Zhao và Wu (2000) [51] thể hiện thuật giải di truyền cho CF với nhiều đường
đi (route) và đa mục tiêu.
- Onwubolu và Mutingi (2001) [51] phát triển giải thuật di truyền để giải sự
thay đổi của tải trong ô.
- Brow và Sumichrast (2001) [53] đề cập đến bài toán nhóm tổng quát, nghĩa
là mỗi bộ phận có hơn một tiến trình route. Bài toán được hình thành như bài
26
toán quy hoạch nguyên và đề xuất tiến trình giải quyết dựa trên một thuật
toán di truyền.
- Goncalves và Resende (2004) [54] trình bày một giải pháp mới để phân “họ”
machine cell và sản phẩm. Phương pháp kết hợp heuristic tìm kiếm cục bộ
với một thuật toán di truyền.
- Ngoài ra còn có các nghiên cứu của Papaioannou và Wilson (2010).
Về nguyên lý, thuật toán di truyền được cài đặt theo nhiều cách khác nhau với 06
bước như sau:
Hình 2.4: Lược đồ công việc khung tổng quát cho thuật toán di truyền
- Bước 1: Xây dựng lược đồ mã hóa (coding). Bước này để mã hóa các lựa
chọn thành dãy.
27
- Bước 2: Khởi tạo quần thể (create initial population).
- Bước 3: Tính toán, đánh giá và ước lượng mức độ phù hợp của mỗi thành
phần trong quần thể.
- Bước 4: Luật/Thủ tục chọn. Xác định nghiệm đã được chọn lựa theo các giá
trị tham số điều khiển nhất định (như: kích thước quần thể, số lần lặp tối đa,
các xác suất cho phép toán di truyền).
- Bước 5: Nếu nghiệm được chọn thì tiến hành giải mã và kết xuất phương án
(problem decoding) và kết thúc tiến trình. Ngược lại sang bước 6.
- Bước 6: Phép toán di truyền để tạo dựng cho thế hệ mới bằng các phép toán
như: lai chéo (crossover), đột biến (mutation), và lặp bước 3. Lưu ý: phép
đột biến là thay đổi nhỏ (thường là đảo bit ngẫu nhiên) tại một vị trí trong
chuỗi gen.
Hình 2.5: Minh họa một phép “lai” crossover
2.4.1 Xây dựng lược đồ mã hóa
Với bất kì một cài đặt của GA, bước đầu tiên là định các đặc tính của giải pháp
trong định dạng chuỗi nhiễm sắc thể. Mỗi nhiễm sắc thể được tạo từ các gen tuần tự
từ các chữ cái nhất định. Chữ cái có thể là số nhị phân, số thực, biểu tượng hoặc ma
trận (theo Goldberg, 1989 [47]). Việc thể hiện lược đồ quyết định không chỉ là tính
ảnh hưởng của bài toán được cấu trúc mà còn thể hiện hiệu quả của phép toán di
truyền được sử dụng.
Ví dụ: dưới đây là một loại mã được sử dụng trong một nghiên cứu như sau: mỗi
28
gen thể hiện số lượng ô mà máy hoặc bộ phận phụ thuộc (Chu và Tsai, 2001 [48];
Venugopal và Narendra, 1992 [49]). Sự thể hiện nhiễm sắc thể gồm hai phần: phần
đầu thể hiện các bộ phận và phần hai thể hiện các máy. Nhiễm sắc thể sử dụng cho
bài toán CF có thể được thể hiện như bên dưới với Pi là nhóm với bộ phận i được
gán và Mj thể hiện nhóm mà máy j được gán:
P1 P2 P3 P4 ... Pp M1 M2 M3... Mm
Khi đó, xét một nhiễm sắc thể cho một vấn đề CF với 10 bộ phận và 10 máy:
2 2 2 3 3 1 1 1 2 2 2 2 1 1 2 3 3 1 1 1
Nhiễm sắc thể trên nghĩa là: 3 ô đầu trong phần 1 thuộc về cell 2, máy thứ 3 thuộc
cell 1,... Và như thế, ô 1 chứa các bộ phận {6, 7, 8} và máy {3, 4, 8, 9, 10}, ô 2
chứa các bộ phận {1,2,3,9,10} và máy {1,2,5}, và ô 3 chứa các bộ phận {4,5} và
máy {7,8}. Lưu ý rằng phần bộ phận và máy trong nhiễm sắc thể đã cố định theo
kích thước của bài toán.
2.4.2 Khởi tạo quần thể
Bước thứ hai trong việc cài đặt GA là phát sinh tập nghiệm ban đầu, gọi là quần thể.
Số lượng nghiệm ban đầu gọi là kích thước quần thể. Quần thể khởi tạo được phát
sinh một lần duy nhất tại thời điểm phát sinh của thuật toán. Kích thước của quần
thể quyết định đến việc cài đặt thuật toán GA. Nếu kích thước quần thể nhỏ, chúng
ta không thể nhận nghiệm tốt. Ngược lại, nếu kích thước quần thể lớn, việc tính toán
sẽ chiếm nhiều thời gian (Back, Fogel và Michalawecz, 1997 [50]).
Ví dụ: trong bài toán CFP, một tiến trình đặc biệt được phát triển để phát sinh quần
thể khởi tạo ngẫu nhiên thỏa các ràng buộc các biến quyết định, nghĩa là mỗi máy
và mỗi bộ phận chỉ được gán vào một ô.
Nhắc lại ràng buộc các biến quyết định được phát biểu trong chương 1:
29
2.4.3 Mức độ tuân theo độ phù hợp của mỗi thành phần trong quần thể
Trong cài đặt GA, hàm phù hợp được sử dụng để ước tính và tái tạo ra các nhiễm
sắc thể mới gọi là các con cháu cho các thế hệ kế tiếp. Mục tiêu của hàm phù hợp là
đo đạc độ "tốt" của ứng viên nghiệm trong quần thể so với hàm mục tiêu và các
ràng buộc trong mô hình. Giá trị phù hợp của các nhiễm sắc thể trong thuật toán đề
xuất là tổng số voids và EE trong tất cả các ô.
2.4.4 Luật chọn
Goldberg (1989 [47]) đề xuất luật chọn Roulette Wheel theo tiêu chí cá nhân “phù
hợp” nhất được xem xét thường xuyên để tạo ra “con cháu” và thế hệ tiếp theo. Mỗi
cá nhân được gán một xác suất chọn dựa trên giá trị phù hợp. Tuy các cá nhân có
xác suất chọn lớn hơn sẽ được chọn nhiều hơn nhưng tất cả các cá thể trong quần
thể đều có cơ hội được chọn. Do đó, chúng ta có thể chọn các “bố mẹ” ngẫu nhiên
sau khi xếp hạng các cá thể dựa trên sự phù hợp và đặt trọng số xác suất chọn cho
mỗi cá thể trong quần thể.
2.4.5 Phép toán di truyền
Mục đích các phép toán di truyền là tạo ra các thế hệ “con cháu” mới trên các “bố
mẹ” được chọn lọc. Với bài toán CFP, phép toán di truyền có thể bao gồm:
Phép toán “lai” (crossover): là phép toán kết hợp thông tin của bố lẫn mẹ để
“con cái” có tính chất “giống” cả bố lẫn mẹ. Theo nghiên cứu của Goldberg
(1989) [47], thông thường, các kỹ thuật crossover là: 1-điểm, 2-điểm và đồng
dạng. Tuy nhiên, nếu ứng dụng phép toán này có sự sai về nhiễm sắc thể nào
đó, những sự thay đổi như các phương pháp PMX (crossover một phần), OX
(order crossover), CX (cycle crossover) sẽ được sử dụng. Tóm lại, đây là
phép toán để tạo ra “con” có tính chất giống với “bố mẹ”. Ví dụ với bài toán
CFP, hai phép crossover có thể như sau:
- Crossover đơn (simple crossover): với 2 cá thể “bố mẹ” được lựa chọn ngẫu
nhiên từ quần thể. Khi đó, chọn ngẫu nhiên một số r có giá trị từ 1 đến M+P
(với M là số lượng máy và P là số lượng bộ phận). Khi đó, gen từ r đến M+P
của bố mẹ sẽ đổi nhau để tạo ra 2 nhiễm sắc thể con mới.
30
Hình 2.6: Minh họa về phép toán lai đơn giản (simple crossover)
- Crossover đồng dạng (uniform crossover): với mỗi cặp “bố mẹ” được chọn
ngẫu nhiên, một phần nhỏ gen được chọn ngẫu nhiên sẽ thay đổi cho nhau.
Hình 2.7: Minh họa phép toán lai đồng dạng (uniform crossover)
Phép toán đột biến (mutation operator): phép toán sẽ biến đổi giá trị của gen
ngẫu nhiên dựa trên những xác suất nhỏ của phép biến đổi. Phép biến đổi
ngẫu nhiên và hoàn toàn không có định hướng tối ưu cho nghiệm. Ví dụ, với
một cá thể từ quần thể và một giá trị r (1 ≤ r ≤ M+P), chúng ta có thể tạo quy
luật biến đổi ngẫu nhiên với một ar là gen thứ r của nhiễm sắc thể được chọn:
Nếu ar = 1
Gán ar = C
31
Ngược lại:
Nếu ar = C
Gán ar = 1
Ngược lại
Phát sinh một giá trị ngẫu nhiên rx nào đó từ 0 đến 1;
Nếu rx ≤ 0.5
ar = ar – 1
Ngược lại
ar = ar + 1
2.4.6 Các giá trị tham số (để điều khiển nhất định)
Thông thường bao gồm: kích thước quần thể, số lượng thế hệ, số lượng vào lặp, các
xác suất thực hiện các phép toán crossover và mutation. Các giá trị trên sẽ tác động
đến không gian nghiệm. Ví dụ: việc chọn kích thước quần thể sẽ thay đổi tùy theo
ứng dụng và số lần lặp sẽ ảnh hưởng đến tiến trình hội tụ của thuật toán di truyền và
thuật toán crossover sẽ tác động đến hiệu quả của việc lai tạo bên cạnh phép toán
mutation sẽ là nền tảng cho sự đa dạng của quần thể. Lưu ý: thông thường xác suất
cho phép toán mutation rất nhỏ.
Ví dụ: Bộ tham số ứng dụng thuật toán di truyền của nghiên cứu của Araj Mahdavi
và cộng sự (2009) [1]:
Bảng 2.5. Bộ giá trị tham số ứng dụng thuật toán di truyền trong các thuật toán
TT Tham số Giá trị tham số
1 Kích thước nhiễm sắc thể M + P
2 Kích thước quần thể 1000
3 Xác suất phép toán lai chéo (crossover) 0.70 – 0.80
4 Xác suất phép toán đột biến (mutation) 0.01 – 0.1
5 Số lượng thế hệ phát sinh Biến thay đổi
Tóm lại, trong chương này các phương pháp về tìm kiếm heuristic và meta-heuristic
32
được nêu lên cùng với tổng quan các phương pháp, đặc biệt là thuật toán di truyền,
để giải quyết bài toá
Các file đính kèm theo tài liệu này:
- luan_van_tiep_can_thuat_toan_meta_heuristic_giai_bai_toan_to.pdf