Đề tài Thuật toán nhánh cận trên môi trường song song

MỤC LỤC

Chương 1 : TỔNG QUAN VỀ THUẬT TOÁN NHÁNH CẬN - 3 -

1.1. Thuật toán nhánh cận - 3 -

1.2. Một số ví dụ cụ thể áp dụng thuật toán nhánh cận - 4 -

Chương 2 : XÂY DỰNG KHUNG THUẬT TOÁN NHÁNH CẬN - 6 -

* Nhóm các lớp yêu cầu - 7 -

* Nhóm các lớp cung cấp - 9 -

2.1. Xây dựng khung nhánh cận - 11 -

2.1.1. Cấu trúc dữ liệu - 11 -

2.1.2. Thuật toán - 11 -

2.2. Xây dựng khung nhánh cận tuần tự - 14 -

2.3. Xây dựng khung nhánh cận song song - 15 -

2.3.1. Lược đồ song song dữ liệu tập trung - 18 -

2.3.2. Lược đồ song song dữ liệu phân tán - 20 -

2.4. Công cụ phát triển hệ thống - 24 -

2.5. Lựa chọn mô hình phát triển hệ thống - 25 -

Chương 3 : SỬ DỤNG THUẬT TOÁN NHÁNH CẬN ĐỂ GIẢI QUYẾT BÀI TOÁN TSP - 27 -

* Bài toán TSP (Bài toán người du lịch) - 27 -

3.1. Giới thiệu bài toán - 27 -

3.2. Định nghĩa bài toán - 27 -

3.3. Sử dụng thuật toán nhánh cận để giải bài toán TSP - 28 -

3.4. Chương trình thực thi - 31 -

 

 

doc33 trang | Chia sẻ: maiphuongdc | Lượt xem: 2392 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Đề tài Thuật toán nhánh cận trên môi trường song song, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ai hay nhiều tập con biểu diễn như một nút của cây tìm kiếm và cố gắng bằng phép đánh giá cận các nút, tìm cách loại bỏ các nhánh cây (những tập con các phương án của bài toán) mà ta biết chắc chắn không phải là phương án tối ưu. Mặc dù trong trường hợp tồi nhất thuật toán sẽ trở thành duyệt toàn bộ, nhưng những trường hợp cụ thể nó rút ngắn đáng kể thời gian tìm kiếm. Để áp dụng phương pháp nhánh cận đối với 1 tập các bài toán tối ưu chúng ta cần làm theo các bước sau: Bước1 ( khởi tạo): L:={П0}, Q: ={П0},bs:= -∞ và T:=(tập hợp rỗng). Bước 2( tìm kiếm): đi tới Bước 9 nếu L = đi đến Bước 3 sau khi lựa chọn Пi:= s(Ls) để kiểm tra. Bước 3 (cập nhật ): Nếu lower_bound(Пi)> bs, thì bs:= lower_bound(Пi) và T:={σ } với σ là lời giải khả thi của Пi sao cho f(x,σ )= lower_bound(П i). Đi tới bước 4. Bước 4 : đi tới Bước 8 nếu Пi G (tập hợp các bài toán bộ phận Пi được giải trong tiến trình tính toán cận trên của Пi). ngược lại thì đi đến Bước 5. Bước 5: ( kiểm tra cận trên): đi đến bước 8 nếu cận trên nhỏ hơn bs: upper_bound(Пi) ≤ bs. Ngược lại đi tới bước 6. Bước 6: đi tới bước 8 nếu tồn tại một Пk (≠ Пi) Q mà f(Пk) ≥ f(Пi). Ngược lại đi tới bước 7. Bước7: (phân nhánh): Phân và cập nhật . Quay trở lại bước 2. Bước 8 ( kết thúc bài toán con): gán L:= L - Пi sau đó quay trở lại bước 2. Bước 9 ( kết thúc toàn bộ ) : Dừng. bs = f(П0) và T lưu trữ một lời giải tối ưu của П0, nếu bs = - ∞ , П0 không có lời giải Một số ví dụ cụ thể áp dụng thuật toán nhánh cận Bài 1: Bài toán người du lịch( TSP) Phát biểu bài toán : Một người du lịch muốn đi thăm quan n thành phố T1 , T2 , ….., Tn .Xuất phát từ một thành phố nào đó người du lịch muốn đi qua tất cả các thành phố còn lại, mối thành phố đúng một lần, rồi quay trở lại thành phố xuất phát. Biết ci,j là chi phí từ thành phố Ti đến thành phố Tj . Hãy tìm hành trình với tổng chi phí nhỏ nhất Xây dựng công thức : Phương án : p = (p1, p2, … pn) là hoán vị của 1, 2, …, n Hành trình : T p1 ® T p2 ® …… ® T pn Chi phí : f(p) = c p1, p2 + c p2, p3 + …. + c pn, p1 P : tập tất cả các hoán vị => min {f(p) : p Î P } Tư tưởng của thuật toán nhánh cận: Cố định thành phố 1 Tìm cực tiểu của hàm : f(x2, x3, . . , xn) = c[1,x2] + c[x2,x3] + ... + c[xn,1] => min x2, x3, . . , xn là hoán vị của các số 2, 3, …, n Ký hiệu : cmin = min{c[i,j]; i, j = 1,2,…,n, i≠j} Giả sử có phương án bộ phận (u1,u2, …, uk) Chi phí phải trả là : s = c[1,u2] + c[u2,u3] + ... + c[uk-1, uk] Cận dưới là : g (u1,u2, …, uk) = s + (n-k+1)*cmin Phương pháp phân nhánh: + Nếu bài toán con có g() > f -(Kỉ lục tạm thời) thì cắt luôn nhánh của bài toán này + Nếu không thì phân nhánh tiếp bài toán con cho đến khi tính được kỉ lục của bài toán con này. Nếu kỉ lục của bài toán con nhỏ hơn f() thì cập nhật lại kỉ lục tạm thời f() Phương pháp tính cận: tính cận trên của bài toán con dựa vào công thức = c[1,u2] + c[u2,u3] + ... + c[uk-1, uk] g (u1,u2, …, uk) = s + (n-k+1)*cmin Bài 2: Bài toán cái túi Phát biểu bài toán : Một nhà thám hiểm cần đem theo một cái túi có trọng lượng không quá b. Có n đồ vật có thể đem theo. Đồ vật thứ j có trọng lượng a và giá trị sử dụng là c . Hỏi rằng nhà thám hiểm cần đem theo các đồ vật nào để cho tổng giá trị sử dụng của các đồ vật đem theo là lớn nhất. Xây dựng công thức : Phương án x = {x1,x2, …, xn} Giá trị đồ vật đem theo Tổng trọng lượng đồ vật min{f(x) : g(x) ≤ b} XÂY DỰNG KHUNG THUẬT TOÁN NHÁNH CẬN Thuật toán nhánh cận được xây dựng với mong muốn giải quyết được tập các bài toán tối ưu tổ hợp. Có nghĩa là tất cả các bài toán đó sẽ được giải quyết dựa trên một khung chung của thuật toán để khi vào một bài toán cụ thể người viết chương trình chỉ cần thêm vào khung đó những dữ liệu phù hợp với bài toán của mình. Nó giảm bớt thời gian xây dựng thuật toán đồng thời nó hữu ích cho những người không biết kỹ thuật nhánh cận trên môi trường song song vẫn có thể cài đặt song song. Chương này sẽ trình bày việc xây dựng khung của kĩ thuật nhánh cận và kỹ thuật nhánh cận trên môi trường tuần tự hoặc song song. Hệ thống gồm hai nhóm : một nhóm các lớp cung cấp (Provided) bao hàm các thủ tục chung cho thuật toán nhánh cận (ví dụ như khung của thuật toán nhánh cận tuần tự, khung của thuật toán nhánh cận song song ...) và nhóm các lớp yêu cầu (Required) bao hàm các thủ tục riêng để giải quyết một bài toán cụ thể sử dụng kỹ thuật nhánh cận (ví dụ như các thủ tục tính cận, thủ tục phân nhánh, ...). Để giải quyết một bài toán bằng kỹ thuật nhánh cận, người sử dụng chỉ cần viết các khai báo và xây dựng các hàm trong nhóm yêu cầu mà không cần xây dựng lại nhóm cung cấp. Hình 4.1 diễn tả mô hình UML tổng quan của hệ thống. Hình 1 : Mô hình UML * Nhóm các lớp yêu cầu Mô hình chung của nhóm các lớp yêu cầu Hình 2 diễn tả các lớp và thủ tục chính trong nhóm yêu cầu. Hình 2 : Các lớp yêu cầu Các lớp yêu cầu được sử dụng để lưu trữ dữ liệu cơ bản của thuật toán : bài toán, trạng thái không gian tìm kiếm. Nó bao gồm các lớp chính sau : Bài toán (Problem): Diễn tả các tham số của bài toán cần giải quyết. Bài toán con (Subproblem) : Diễn tả vùng không gian chưa được khai thác và cung cấp các chức năng sau : InitSubProblem(pbm) : Sinh ra bài toán con đầu tiên từ bài toán ban đầu LowerBound(pbm, sol) : Tính toán cận dưới của hàm mục tiêu cho lời giải bộ phận sol của bài toán pbm. UpperBound(pbm, sol) : Tính giá trị hàm mục tiêu của lời giải toàn cục sol của bài toán pbm. Branch(pbm, sps) : Sinh ra một tập các bài toán con của bài toán đang xét và lưu vào sps. Lớp bài toán con diễn tả một bài toán bộ phận. Một bài toán con được xác định bởi các dữ liệu sau : vector sol chứa các chỉ số đỉnh làm median của bài toán con (hay là lời giải bộ phận của bài toán cần giải quyết) và được sắp xếp theo thứ tự tăng dần, chỉ số đỉnh cuối eV của lời giải bộ phận, và cận dưới cost ứng với lời giải bộ phận sol. Lớp bài toán con phải cung cấp các hàm chính sau : InitSubProblem(pbm): sinh ra bài toán con ban đầu với Các hàm tính cận dưới (LowerBound), tính cận trên (UpperBound), phân nhánh (Branch). * Nhóm các lớp cung cấp Trước khi mô tả lớp cung cấp chúng ta cần xem xét cấu trúc dữ liệu để lưu các bài toán con chưa được giải quyết trong quá trình tính toán. Vì số lượng các bài toán con là rất lớn và không biết trước nên ta sử dụng một danh sách liên kết kép để quản lý chúng. Lớp Solver : Làm nhiệm vụ đưa ra và duy trì các thông tin có liên quan tới trạng thái tìm kiếm trong suốt quá trình thực hiện class Solver { protected: const Problem& pbm;// bài toán cần giải quyết Direction dir; SubProblem sp; // bài toán con hiện thời cần giải quyết Solution sol; // giải pháp tốt nhất hiện thời container HP;// danh sách các bài toán con cần giải quyết Bound high;// cận trên của nhánh bài toán con Bound low;// cận dưới của nhánh bài toán con Bound bestSol;// kỉ lục hiện thời của bài toán public: Solver(const Problem &problem); .......................... Có hai lớp kế thừa từ lớp Solver Lớp Solver_Seq : Chứa thủ tục run() để giải quyết bài toán một cách tuần tự Lớp Solver_Lan : Chứa thủ tục run(int argc, char** argv) để giải quyết bài toán một cách song song trên môi trường mạng LAN. Với tham số truyền vào của hàm chính là các tên máy tham gia vào quá trình tính toán. Người sử dụng muốn thực hiện theo phương thức nào (song song hay tuần tự) thì tạo ra một đối tượng tương ứng sau đó gọi tới thủ tục run . Ví dụ chúng ta muốn tiến hành thuật toán nhánh cận tuần tự để giải quyết bài toán TSP có đoạn mã của thủ tục main như sau Int Main(int argc, char** argv) { Problem pbm; // Bài toán cần giải quyết SolVec sol; // Lời giải tối ưu của bài toán Bound bs; // Giá trị tối ưu của bài toán Solver_Seq sv(pbm); Sv.run(); Bs = sv.bestSolution(); Sol = sv.solution(); } Xây dựng khung nhánh cận Cấu trúc dữ liệu Cấu trúc dữ liệu sử dụng là hàng đợi động để điều khiển bài toán con được sinh ra bằng phương thức phân nhánh. Các bài toán con được thêm và0 hàng đợi phụ thuộc vào phương thức tìm kiếm cụ thể trong lớp cài đặt: lifo(last in first out), fifo (first in first out) hoặc prio-rity. Mỗi một bài toán con được kết nối bởi 2 con trỏ tới thành phần trứơc và sau của danh sách riêng biệt. Hình 3: Hàng đợi các bài toán con của kĩ thuật nhánh cận Thuật toán Các bài toán sử dụng nhánh cận để giải quyết đều phải sử dụng khung của thuật toán. Điều này nhấn mạnh rằng người dùng nếu giải bài toán của mình trên môi trường tuần tự hoặc song song thì chỉ cần thêm một số phương thức, dữ liệu phù hợp mà không cần suy nghĩ đến việc phải thiết kế các bước như thế nào. Dưới đây là khung chung của thuật toán: Khởi tạo Tập hoạt động (tập các bài toán con chưa được duyệt) chứa bài toán ban đầu. Giá trị kỷ lục(best solution=bs) bằng ¥. Lựa chọn Dựa trên một phương pháp nào đó (theo chiều sâu, chiều rộng, hoặc cận tốt nhất ,...) để lựa chọn một bài toán con khả thi cùng cận của nó từ tập hoạt động. Xóa bài toán con khỏi tập hoạt động. Phân nhánh Áp dụng luật phân nhánh để sinh ra các bài toán con mới từ bài toán đang xét. Tính cận của các bài toán con mới này. Tiến hành kiểm tra các bài toán con vừa được sinh ra. Có hai trường hợp : bài toán con đã được giải quyết – đi tới bước 5 bài toán con chưa được giải quyết – đi tới bước 4. Kiểm tra tính khả thi : Đưa các bài toán con có cận nhỏ hơn kỷ lục tạm thời vào tập hoạt động. Dò xét kết thúc Bài toán con được duyệt là một lời giải khả thi khi có cận nhỏ hơn kỷ lục và khi đó nó sẽ thay thế kỷ lục. Ngược lại sẽ bị xóa. Khi cập nhật kỷ lục mới (5a) thì tất cả các bài toán con trong tập hoạt động có cận dưới lớn hơn hoặc bằng kỷ lục sẽ bị xóa. Kết thúc thuật toán Lặp lại các bước từ 2-5 nếu tập hoạt động không rỗng. Ngược lại, thì kết thúc thuật toán và lời giải tối ưu là giá trị kỷ lục. Ta gọi L : là tập hoạt động Q: là tập các bài toán con hiện tại được sinh ra. bs: giá trị kỉ lục σ : lời giải T: lưu trữ lời giải tốt nhất Пi: các bài toán con được sinh ra Dưới đây là đoạn mã giả của thuật toán phân nhánh: Ta có thể sử dụng cấu trúc heap và queue để lưu trữ các bài toán con chưa được giải quyết. Ở đây chúng tôi sử dụng queue bởi lí do khi số lượng các thành phố là lớn thì không gian bài toán con tăng lên rất nhiều mà heap không thể lưu trữ được. Queue gồm 3 lớp sau : Class bbnode : Định nghĩa các nút trên cây Class BandbQueue : Lớp trừu tượng này miêu tả một queue Class BranchQueue : Lớp này sử dụng trong suốt giai đoạn phân nhánh Xây dựng khung nhánh cận tuần tự Ta có thể tóm lược hoạt động của thuật toán nhánh cận tuần tự như sau : Tại thời điểm khởi tạo, tập hoạt động L chứa bài toán ban đầu, và giá trị kỷ lục tạm thời bs là µ. Lặp đi lặp lại các bước sau cho đến khi tập hoạt động bằng Æ : Lựa chọn một bài toán con từ tập hoạt động, bài toán con có lời giải bộ phận là v1, v2, ...., vi-1. Nếu cận dưới của bài toán con nhỏ hơn kỷ lục tạm thời ta tiến hành phân nhánh thành các bài toán con nhỏ hơn với lời giải bộ phận tương ứng là (v1, v2, ...., vi-1+1), ......, (v1, v2, ...., N – K + 1), tiến hành tính cận cho các bài toán con này. Nếu các bài toán con đã được giải quyết ta tiến hành duyệt và cập nhật kỷ lục tạm thời bs, ngược lại thì đưa các bài toán con này vào tập hoạt động L. Sau đây là đoạn mã giả mô phỏng thuật toán nhánh cận tuần tự. Hình 4: Thuật toán nhánh cận tuần tự Xây dựng khung nhánh cận song song Để song song hóa khung sử dụng kỹ thuật nhánh cận chúng ta sử dụng chiến lược chủ - thợ. Chiến lược này có thể được định nghĩa như sau: một bộ xử lý chủ giữ tất cả thông tin về không gian trạng thái, nơi mà chứa đựng số lượng các bài toán con chưa được phân nhánh trên cây liệt kê và nó cũng lưu giữ lời giải hiện thời. Máy chủ gửi bài toán con tới máy thợ rỗi và nhận các bài toán con mới được phát sinh từ các máy thợ đó. Một vài máy thợ định giá những bài toán con và phát sinh thêm những cái mới nếu cần thiết. Một máy thợ rỗi nhận một bài toán con chỉ khi có những bài tóan con mà có khả năng dẫn tới một giải pháp tối ưu. Chiến lược này đề xuất những sự kiện có ý nghĩa như là khả năng điều khiển dễ dàng và thuật toán nhánh cận song song theo phương pháp dễ hiểu và tự nhiên hơn. - Bộ xử lí chủ: chỉ có một bộ xử lí chủ trong khung. Nó chứa tất cả thông tin về không gian trạng thái và tình trạng của mỗi máy thợ ( bận hoặc rỗi.) - Bộ xử lí thợ: Số lượng bộ xử lí thợ được xác định bởi tham số đầu vào. Nó thực hiện tất cả những thao tác tính toán để giải quyết hoặc ước lượng một bài toán con. Sự song song hiển thị cấu trúc trong Hình 4. Máy chủ có một hàng đợi những bài toán chưa được giải quyết. Nó loại bỏ mọi bài toán con từ hàng đợi của nó và giao việc của nó tới máy thợ rỗi trong giai đoạn a. Trong giai đoạn b, một tập bài toán con của máy thợ đưa đến máy chủ.Trong giai đoạn c, máy chủ nhận những bài toán con và chèn chúng vào trong hàng đợi của nó. Cuối cùng, máy chủ loại bỏ những bài toán con có thể thực hiện đc và gửi chúng đến máy thợ rỗi trong giai đoạn d. Tiến trình kết thúc khi hàng đợi máy chủ là rỗng và lời giải tốt nhất tìm thấy đc. Hình 5: Các giai đoạn của mô hình Chủ - thợ Ta nhận thấy rằng mô hình hoạt động ở trên tương đối đơn giản và dễ dàng cài đặt. Tuy nhiên nó có một nhược điểm lớn là số lượng bài toán con chỉ tập trung tại máy chủ, điều đó dễ dẫn tới tràn bộ nhớ do số lượng bài toán con này là rất lớn. Thêm vào nữa máy chủ luôn phải điều động từng bài toán con tới các máy thợ dẫn tới tăng số lượng công việc tại máy chủ cũng như lưu lượng truyền thông trên mạng là lớn. Để giải quyết vấn đề này chúng tôi đề xuất một mô hình dữ liệu phân tán, nghĩa là trên mỗi máy thợ đều có một vùng nhớ để lưu các bài toán con. Và bây giờ các bài toán con được chuyển một cách trực tiếp từ máy thợ bận (có nhiều bài toán con) tới máy thợ rỗi ( không còn bài toán con để tìm kiếm) dưới sự điều phối của máy chủ. Sau đây là thiết kế chi tiết đối với cả hai hệ thống này. Lược đồ song song dữ liệu tập trung Cấu trúc dữ liệu : Danh sách các bài toán con chưa được giải quyết lưu tại máy chủ, các bài toán con được rời và gửi tới các máy thợ. Mỗi máy thợ khi nhận bài toán con tiến hành phân nhánh và lưu các bài toán con vừa mới được sinh ra cùng với cận của nó trong một danh sách cục bộ. Sau đó nó gửi tới máy chủ, máy chủ lúc này tiến hành nối các bài toán con nhận được từ danh sách đó nếu cận của nó nhỏ hơn kỷ lục tạm thời. Cấu trúc dữ liệu để lưu các bài toán con là một danh sách liên kết kép. Thuật toán Thực hiện trên máy chủ Hình 6 mô tả các công việc được thực hiện trên máy chủ. Máy chủ thực hiện phân phối các bài toán con giữa các máy thợ. Máy chủ có một danh sách cục bộ L để lưu trữ bài toán con và cấu trúc dữ liệu I để ghi nhận trạng thái hiện thời của các máy thợ (dòng 1); Ban đầu tất cả các máy thợ đều rỗi. Khi có các máy thợ rỗi, máy chủ liên tục trích lọc từng bài toán con khả thi (có cận nhỏ hơn kỷ lục tạm thời), sau đó lựa chọn một máy thợ rỗi và gửi bài toán con tới nó để tiến hành phân nhánh và ước lượng( dòng 6-7). Nếu danh sách L rỗng hoặc không có máy thợ nào rỗi, máy chủ tiến hành kiểm tra có dữ liệu (là các bài toán con mới sinh ra) được gửi về từ máy thợ hay không. Nếu có nó sẽ nhận dữ liệu từ máy thợ là một tập các bài toán con cùng cận dưới của nó. Kiểm tra lần lượt từng bài toán con. Nếu bài toán được giải quyết (có số lượng median bằng k), thì cập nhật kỷ lục và lời giải tạm thời (nếu có cận nhỏ hơn kỷ lục tạm thời) ngược lại nối các bài toán con khả thi vào danh sách L (Dòng 12-17). Quá trình tìm kiếm kết thúc khi tất cả các máy thợ đều rỗi và danh sách L rỗng, và khi đó máy chủ gửi một thông báo kết thúc quá trình tính toán tới các máy thợ (Dòng 20). Sau đây là đoạn mã giả của thủ tục. Hình 6: Hoạt động trên máy chủ (Dữ liệu tập trung) Thực hiện trên máy thợ Máy thợ nhận lệnh từ máy chủ. Có thể là kết thúc quá trình tính toán hoặc nhận một bài toán con cần phân tích. Nếu lệnh yêu cầu nhận một bài toán con, máy thợ thực hiện nhận dữ liệu (Dòng 6) , sau đó tiến hành phân nhánh và tính cận cho các bài toán con vừa được sinh ra (Dòng 7-8). Dữ liệu này được gửi tới máy chủ. Sau đây là đoạn mã giả của thủ tục. Hình 7: Hoạt động trên máy thợ (Dữ liệu tập trung) Lược đồ song song dữ liệu phân tán Cấu trúc dữ liệu Mỗi máy thợ lưu một danh sách các bài toán con cục bộ. Máy chủ chỉ gửi bài toán con đầu tiên tới một máy thợ rỗi ban đầu và sau đó không lưu trữ bất kỳ bài toán con nào mà chỉ thực hiện điều phối các bài toán con giữa các máy thợ. Thuật toán a. Thực hiện trên máy chủ Hình 4.6 chỉ ra các công việc trên máy chủ. Máy chủ có một cấu trúc dữ liệu I để ghi nhận trạng thái hiện thời của các máy thợ (Dòng 1); ban đầu tất cả các máy thợ đều rỗi. Bài toán con đầu tiên, kỷ lục và lời giải tạm thời được gửi tới một máy thợ rỗi (dòng 3-4). Máy chủ nhận thông tin gửi về từ máy thợ và quyết định hoạt động tiếp theo phụ thuộc vào bài toán con được giải quyết (dòng 8) hay là một yêu cầu các máy thợ rỗi từ máy thợ nào đó (dòng 10) hay là thông báo một máy thợ đang rỗi (dòng 16). Nếu bài toán con đã được giải quyết, máy chủ nhận và lưu trữ lời giải (nếu cận của nó nhỏ hơn kỷ lục tạm thời). Khi máy chủ nhận một yêu cầu r máy thợ rỗi từ một máy thợ nào đó, nó sẽ tiến hành xác định các máy thợ đang rỗi và gửi thông tin về số lượng và tên các máy thợ đang rỗi tới máy thợ yêu cầu (dòng 13-14), sau đó chờ đợi và nhận lại từ máy thợ đó các máy thợ không được sử dụng. Quá trình kết thúc khi tất cả các máy thợ đều rỗi và máy chủ gửi một thông báo kết thúc tới toàn bộ hệ thống( dòng 19). Dưới đây là đoạn mã giả của thủ tục. Hình 8: Hoạt động trên máy chủ (Dữ liệu phân tán) b. Thuật toán trên máy thợ Máy thợ nhận bài toán con và kỷ lục tạm thời từ một máy thợ nào đó, sau đó tiến hành phân nhánh và tính cận các bài toán con vừa được sinh ra. Nếu các bài toán con đã được giải quyết (có số median là k), nó đi tìm bài toán con có cận tốt nhất và gửi tới máy chủ (Dòng 12 -18). Ngược lại nó gửi một thông báo xin máy chủ cấp cho các máy thợ đang rỗi để hỗ trợ quá trình tính toán. Nếu số lượng máy thợ nhận được lớn hơn 0 nó tiến hành gửi các bài toán con tới các máy thợ này ngược lại thì thực hiện các hoạt động của thuật toán một cách cục bộ ( Dòng 20-24). Nếu trong tập hoạt động không còn bài toán con nào, máy thợ gửi một thông báo đang rỗi tới máy chủ (Dòng 25). Công cụ phát triển hệ thống Hệ thống sử dụng ngôn ngữ C++ để phát triển và thư viện Nestream để quản lý quá trình trao đổi dữ liệu giữa các máy trong hệ thống. Netstream hỗ trợ gửi services(basic và advandced) qua một giao thức mạng và Netstream được phát triển như một lớp trên chuẩn MPI. Lựa chọn mô hình phát triển hệ thống Phân lớp thuật toán nhánh cận song song Có ba cách tiếp cận chính trong việc thiết kế thuật toán nhánh cận song song. Song song loại 1 : Tiến hành song song hóa các hoạt động trên bài toán con, ví dụ như tính cận song song trên bài toán con. Cách tiếp cận này không ảnh hưởng tới cấu trúc chung của thuật toán nhánh cận. Song song loại 2 : Xây dựng cây nhánh cận một cách song song bằng việc thực hiện các hoạt động trên các bài toán con một cách đồng thời. Vì thế nó có thể ảnh hưởng tới việc thiết kế thuật toán. Song song loại 3 : Một vài cây nhánh cận được xây dựng một cách song song. Các cây được đặc thù bởi các hoạt động khác nhau (phân nhánh, tính cận, kiểm tra ước lượng hay lựa chọn), và thông tin sinh ra khi xây dựng một cây có thể được sử dụng cho việc xây dựng cây khác. Dưới đây ta trình bày cách tiếp cận song song loại 2 để thiết kế thuật toán nhánh cận song song. Lựa chọn mô hình phát triển thuật toán Có hai hệ thống tính toán song song chủ yếu là bộ nhớ dùng chung và bộ nhớ phân tán. Chúng tôi lựa chọn hệ thống bộ nhớ phân tán để tiến hành thiết kế thuật toán vì một số lý do sau : Lý do đầu tiên xuất phát từ thực tế đó là có thể tiến hành các thuật toán song song trên mạng nối kết ethernet đơn giản bằng kỹ thuật chuyển thông báo. Đây là một cách kinh tế để có một hệ thống song song. Thứ hai đó là số lượng bộ xử lý trong các hệ thống bộ nhớ dùng chung là giới hạn. Các mô hình phân biệt với nhau bởi cách quản lý và điều phối tập các bài toán con nằm trong cơ sở dữ liệu chính của thuật toán. Mô hình đầu tiên có cơ sở dữ liệu tập trung. Nghĩa là máy chủ sẽ lưu trữ tập các bài toán con và điều phối chúng tới các máy thợ rỗi. Mô hình có ưu điểm dễ xây dựng, dễ quản lý nhưng khối lượng công việc cũng như không gian bộ nhớ trên máy chủ là tương đối lớn đồng thời lưu lượng truyền thông trên mạng cũng lớn. Mô hình thứ hai có cơ sở dữ liệu phân tán, nghĩa là các bài toán con lúc này sẽ được lưu một cách cục bộ tại các máy thợ và sẽ được chuyển giao một cách trực tiếp giữa các máy thợ dưới sự điều phối của máy chủ. Với mô hình này ngoài chiến lược lựa chọn nút để khai thác không gian lời giải một cách có hiệu quả, hệ thống còn phải thực hiện các chiến lược để cân bằng công việc giữa các máy thợ sao cho không xảy ra tình trạng có máy thợ phải thực hiện quá nhiều công việc trong khi các máy khác rỗi. SỬ DỤNG THUẬT TOÁN NHÁNH CẬN ĐỂ GIẢI QUYẾT BÀI TOÁN TSP Trong chương này chúng tôi đưa ra các kết quả thực nghiệm nhằm đánh giá hiệu suất của mô hình thuật toán nhánh cận song song đề xuất ở trên. Thuật toán tuần tự được lựa chọn để so sánh có cùng cách tính cận, phân nhánh và lựa chọn bài toán con như trong mô hình thuật toán song song. * Bài toán TSP (Bài toán người du lịch) Giới thiệu bài toán Bài toán người du lịch(TSP) là bài toán tiêu biểu trong việc sử dụng thuật toán nhánh cận song song. Bài toán được phát biểu như sau: Một người du lịch có trong tay bản đồ gồm n thành phố và chi phí đi lại giữa chúng, các con đường này đều là đường 1 chiều(nghĩa là chi phi từ A đến B sẽ khác khoảng cách từ B đến A). người du lịch muốn làm một hành trình đi qua tất cả các thành phố với điều kiện mỗi thành phố chỉ đi qua một lần, rồi quay trở về thành phố xuất phát. Bài toán đặt ra là tìm đường đi cho người du lịch sao cho tổng chi phí là nhỏ nhất. Định nghĩa bài toán Cho n thành phố và một ma trận chi phí của các đường đi. Hãy tìm đường đi sao cho tổng chi phí là nhỏ nhất đảm bảo điều kiện của bài toán Xây dựng công thức : Phương án : p = (p1, p2, … pn) là hoán vị của 1, 2, …, n Hành trình : T p1 ® T p2 ® …… ® T pn Chi phí : f(p) = c p1, p2 + c p2, p3 + …. + c pn, p1 P : tập tất cả các hoán vị => min {f(p) : p Î P } Dữ liệu vào cho trong file TSP.DAT, trong đó: - Dòng đầu: Chứa N là số lượng các thành phố - Tiếp theo : Ma trận c(n*n) trong đó c(i,j)= chi phí đi lại từ thành phố i đến thành phố j Mỗi giá trị chi phí khác nhau được ghi cách nhau một dấu cách trắng Kết qủa: Ghi trực tiếp lên file TSP.DAT, trong đó: - Dòng đầu ghi tổng chi phí mà người đó đi hết bằng cách tốt nhất - Dòng tiếp theo đưa ra phươg án tối ưu nhất qua các thành phố Sử dụng thuật toán nhánh cận để giải bài toán TSP Để đi tìm lời giải chính xác cho bài toán TSP không còn cách nào khác ngoài việc chúng ta phải duyệt tất cả các lời giải có thể, tuy nhiên số lượng này là quá lớn (= n!), trong đó rất lãng phí các lời giải không cần thiết. Cách tiếp cận hiệu quả nhất từ trước tới nay trong chiến lược này đó chính là thuật toán nhánh cận(có thể cắt các nhánh ở các lời giải không cần thiết) * Tính cận và phân nhánh - Tính cận: Cố định thành phố 1 Tìm cực tiểu của hàm : f(x2, x3, . . , xn) = c[1,x2] + c[x2,x3] + ... + c[xn,1] => min x2, x3, . . , xn là hoán vị của các số 2, 3, …, n Ký hiệu : cmin = min{c[i,j]; i, j = 1,2,…,n, i≠j} Giả sử có phương án bộ phận (u1,u2, …, uk) Chi phí phải trả là : s = c[1,u2] + c[u2,u3] + ... + c[uk-1, uk] Cận dưới là : g (u1,u2, …, uk) = s + (n-k+1)*cmin - Thuật toán phân nhánh dựa vào thuật toán liệt kê các hoán vị của n phần tử{1, 2, ...., n}. Nghĩa là nếu bài toán con của ta có lời giải bộ phận là c1, c2, ...., ci. Thì các bài toán con sinh ra có lời giải bộ phận (c1, c2, ...., ci-1+1), .........., (c1, c2, ...., n – k + i). * Các lớp xây dựng cho bài toán TSP Như chúng ta đã biết, bài toán yêu cầu tìm giải pháp tốt nhất cho người du lịch sao cho chi đi qua mỗi thành phố một lần và tổng chi phí quãng đường là nhỏ nhất. Dưới đây là khai báo lớp Problem cho bài toán TSP: Lớp Problem lưu giữ số lượng thành phố và ma trận giá trị giữa các thành phố class Problem { private: Number N; // Số lượng thành phố trong bài toán Matrix c; // Ma trận giá trị giữa các đỉnh public: Problem (); ................. }; Lớp bài toán con diễn tả một bài toán bộ phận. Một bài toán con được xác định bởi các dữ liệu sau : đỉnh đầu iV, đỉnh cuối eV của lời giải bộ phận, và cận dưới cost ứng với lời giải bộ phận sol . class SubProblem { private: unsigned iV, /// đỉnh đầu tiên eV, /// đỉnh kết thúc trong hành trình cost; /// gía trị thật Tset visitedSet; /// các thành phố đến thăm Solution sol; /// giá trị tốt nhất hiện thơi public: SubProblem (); ...................... }; Lớp bài toán con phải cung cấp các hàm chính sau : InitSubProblem(pbm) : sinh ra bà

Các file đính kèm theo tài liệu này:

  • docthuat toan nhanh can tren moi truong song song.doc