MỤC LỤC 1
LỜI MỞ ĐẦU 2
A.VẤN ĐỀ, MỤC ĐÍCH VÀ PHẠM VI NGHIÊN CỨU CỦA ĐỀ TÀI 4
B. TÌM HIỂU VỀ BÀI TOÁN SẮP XẾP 5
C. NỘI DUNG CỦA CÁC PHƯƠNG PHÁP SẮP XẾP 7
I. Phương pháp chọn trực tiếp (Selection sort): 7
1. Giải thuật: 7
2. Đánh giá giải thuật: 9
3. Lưu đồ thuật toán : 9
II. Phương pháp chèn trực tiếp (Insert sort): 10
1. Giải thuật: 10
2. Đánh giá giải thuật : 11
3. Lưu đồ thuật toán: 12
Xem như dãy số cần sắp xếp đã được nhập vào sẵn: 12
III. Phương pháp sắp xếp nổi bọt (Bubble sort): 13
1. Giải thuật . 15
2. Đánh giá giải thuật : 15
3. Lưu đồ thuật toán: 16
IV. Phương pháp sắp xếp vun đống (Heap sort): 17
1. Định nghĩa heap : 17
2. Giải thuật Heapsort: 17
3. Đánh giá giải thuật : 20
V. Phương pháp sắp xếp nhanh (Quick sort): 22
1. Giải thuật : 22
2. Đánh giá giải thuật : 24
3. Lưu đồ thuật toán : 25
Xem như dãy số cần sắp xếp đã được nhập vào sẵn 25
VI. Phương pháp sắp xếp trộn (MergerSort): 26
2. Đánh giá giải thuật: 28
3. Lưu đồ thuật toán: 28
D. KẾT LUẬN. 34
HƯỚNG DẪN SỬ DỤNG CHƯƠNG TRÌNH DEMO 31
TÀI LIỆU THAM KHẢO 35
PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN VÀ GIÁO VIÊN CHẤM 35
PHIẾU CHẤM ĐIỂM BÀI TẬP CHỦ ĐỀ LỚN 1 36
36 trang |
Chia sẻ: netpro | Lượt xem: 4697 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Đề tài Tìm hiểu và vận dụng các lý thuyết cơ bản về các phương pháp sắp xếp trong pascal, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ion sort);
3. Phương pháp sắp xếp nổi bọt( Bubble sort);
4.Phương pháp sắp xếp trộn ( Merge sort);
5.Phương pháp sắp xếp nhanh ( Quick sort);
6..Phương pháp sắp xếp kiểu vun đống ( Heap sort);
Ngoài ra còn có nhiều thuật toán sắp xếp khác nữa như: Phương pháp sắp xếp cải tiến ( Shellsort).... Trong bài tập chủ đề lớn 1 này chúng ta sẽ được lần lượt tìm hiểu khảo sát từng thuật toán trên. Các thuật toán như Selection sort, Insertion sort, Bubble sort là những thuật toán đơn giản dễ cài đặt nhưng chi phí cao. Các thuật toán Merge sort, Quick sort, Heap sort, phức tạp hơn nhưng hiệu suất cao hơn nhóm thuật toán đầu. Các nhóm thuật toán trên đều có một điểm chung là đều được xây dựng dựa trên cơ sở so sánh giá trị của các phần tử trong mảng (hay so sánh các khóa tìm kiếm). Khi xây dựng một thuật toán sắp xếp cần chú ý tìm cách giảm thiểu những phép so sánh và đổi chổ không cần thiết để tăng hiệu quả của thuật toán.
Mặt dù nhóm chúng em đã rất cố gắng và nổ lực để làm bài tập chủ đề lớn này do kinh nghiệm còn hạn chế và kiến thức chúng em nắm chưa sâu nên chúng em biết sẽ không tránh khỏi những thiếu sót. Nhóm chúng em rất mong nhận được sự thông cảm và đóng góp của các Thầy, Cô để lần sau làm bài tập chủ đề được tốt hơn.
Hoàn thành bài tập chủ đề lớn 1 này là niềm vui của cả nhóm, nhóm chúng em rất là biết ơn Thầy Huỳnh Dương Trung Trực đã hướng dẫn chúng em tận tình trong suốt thời gian chúng em làm bài tập chủ đề. Một lần nữa nhóm chúng em xin gửi lời cám ơn chân thành nhất đến Thầy.
Sóc Trăng, Ngày 16 Tháng 05 Năm 2010
A. VẤN ĐỀ, MỤC ĐÍCH VÀ PHẠM VI NGHIÊN CỨU CỦA ĐỀ TÀI
I. Nêu vấn đề :
Quá trình sắp xếp là quá trình bố trí lại các phần tử của một tập đối tượng điển hình như là một dãy số nào đó, một dãy chữ theo thứ tự của từ điển.v.v., nhằm sắp xếp theo một thứ tự nhất định theo thứ tự tăng dần (hoặc giảm dần) đối với một dãy số, thứ tự từ điển đối với một dãy chữ.v.v….
Bài toán sắp xếp thường được xuất hiện thường xuyên nhất trong các ứng dụng tin học như trong ngôn ngữ lập trình Pascal...,với những yêu cầu, mục đích khác nhau thì sắp xếp dữ liệu lưu trữ trong máy tính theo cách và các bước khác nhau….Nói chung, dữ liệu có thể xuất hiện dưới nhiều dạng khác nhau và thường phải lưu trữ một khối lượng dữ liệu đáng kể, nên việc xây dựng các giải thuật sắp xếp sẽ cho phép tìm kiếm nhanh sẽ có ý nghĩa rất lớn. Từ các vấn đề nêu trên giúp cho chúng em hiểu rỏ mục đích đề tài là: Để sắp xếp các dãy số theo một trật tự, thứ tự tăng dần (hoặc là giảm dần) tùy theo vào yêu cầu của người muốn sắp xếp, sắp xếp theo thự tự để giúp cho việc tìm kiếm được dễ dàng hơn, qua đó có thể giúp chúng em hiểu rỏ các ưu khuyết điểm của các phương pháp sắp xếp để so sánh tốc độ sắp xếp, từ đó để vận dụng các phương pháp đó trong việc sắp xếp theo yêu cầu cùa bài toán đặt ra một cách có hiệu quả và đó cũng là mục đích mà nhóm chúng em chọn đề tài về các sắp xếp để nghiên cứu.
II. Phạm vi nghiên cứu của đề tài :
Tìm hiểu và vận dụng các lý thuyết cơ bản về một số phương pháp sắp xếp như phương pháp chọn trực tiếp (Selectsort), chèn trực tiếp (Insertsort), sắp xếp nổi bọt (Bubblesort), sắp xếp kiểu vun đống (Heapsort), sắp xếp nhanh (Quicksort), sắp xếp trộn (Mergesort), để cài đặt chương trình Demo, cho phép sắp xếp một dãy số đã cho tuỳ ý thành một dãy số có thứ tự theo các thuật toán sắp xếp vừa nêu trên.
III. Mục tiêu của đề tài cần đạt được:
1. Đối với báo cáo :
- Mô tả quá trình thực hiện của tất cả các phương pháp sắp xếp.
- Tính được độ phức tạp của từng phương pháp.
- Thể hiện được tất cả các giao diện trong Demo.
- Mô tả các chức năng trong Demo.
2. Đối với Demo :
- Thiết kế giao diện hài hoà rõ ràng. Có sử dụng đồ hoạ.
- Demo phải có dữ liệu mẫu để test và có chức năng nhập dữ liệu để kiểm tra thủ công.
B. TÌM HIỂU VỀ BÀI TOÁN SẮP XẾP
I. Định nghĩa về bài toán sắp xếp:
1. Khái niệm về sắp xếp:
Sắp xếp là quá trình xử lý một danh sách các phần tử (hoặc các mẫu tin) để đặt chúng theo các thứ tự thỏa mãn một tiêu chuẩn nào đó dựa trên nội dung thông tin lưu giữ tại mọi phần tử.
Tại sao cần phải sắp xếp các phần tử thay vì để nó ở dạng tự nhiên (chưa có thứ tự vốn có? Ví dụ của bài toán tìm kiếm với phương pháp tìm kiếm nhị phân và tuần tự để trả lời câu hỏi này.
Khi khảo sát bài toán sắp xếp, ta sẽ phải làm việc nhiều với một khái niệm gọi là nghịch thế.
2:Khái niệm nghịch thế :
Xét một mảng các số a0,a1, …, an. Nếu có i aj, thì ta gọi đó là một nghịch thế.
Ví dụ : Mảng chưa sắp xếp sẽ có nghịch thế.
Mảng đã có thứ tự sẽ không chứa nghịch thế. Khi đó a0 sẽ là phấn tử nhỏ nhất rối đến a1, a2.
Như vậy, để sắp xếp một mảng, ta có thể tìm cách giảm số các nghịch thế trong mảng này bằng cách hoán vị các cặp phần tử ai, aj nếu có i aj theo một quy luật nào đó.
Cho trước một dãy số a1,a2, …, an được lưu trữ trong cấu trúc dữ liệu mảng.
A : array [1..100] of integer;
Sắp xếp dãy số a1,a2, …, an là thực hiện việc bố trí lại các phần tử sao cho hình thành được dãy mới ak1, ak2, …, akn có thứ tự (giả sử xét thứ tự tăng) nghĩa là aki > aki-1. Mà để quyết định được những tình huống cần thay đổi vị trí các phần tử trong dãy, cần dựa vào kết quả của một loạt phép so sánh. Chính vì vậy, hai thao tác so sánh và gán là các thao tác cơ bản của hầu hết các thuật toán sắp xếp.
Khi xây dựng một thuật toán sắp xếp cần chú ý tìm cách giảm thiểu những phép so sánh và đổi chổ không cần thiết để tăng hiệu quả của thuật toán. Đối với các dãy số được lưu trữ trong bộ nhớ chính, nhu cầu tiết kiệm bộ nhớ được đặt nặng, do vậy những thuật toán sắp xếp đòi hỏi cấp phát thêm vùng nhớ để lưu trữ dãy kết quả ngoài vùng nhớ lưu trữ dãy số ban đầu thường ít được quan tâm. Thay vào đó, các thuật toán sắp xếp trực tiếp trên dãy số ban đầu – gọi là các thuật toán sắp xếp tại chổ - lại được đầu tư phát triển. Phần này giới thiệu một số giải thuật sắp xếp từ đơn giản đến phức tạp có thể áp dụng thích hợp cho việc sắp xếp nội.
C. NỘI DUNG CỦA CÁC PHƯƠNG PHÁP SẮP XẾP
I. Phương pháp chọn trực tiếp (Selection sort):
1. Giải thuật:
- Phương pháp sắp xếp chọn trực tiếp - selection sort là phương pháp sắp xếp bằng cách chọn phần tử nhỏ nhất xếp vào vị trí thứ nhất, tương tự các phần tử nhỏ tiếp theo xếp vào vị trí tiếp theo lần lượt cho đến hết số phầm tử trong dãy.Ta thấy rằng, nếu mảng có thứ tự, phần tử ai luôn là min(ai, ai+1, .., an-1). Ý tưởng của thuật toán chọn trực tiếp mô phỏng một trong những cách sắp xếp tự nhiên nhất trong thực tế: chọn phần tử nhỏ nhất trong n phần tử ban đầu, đưa phần tử này về vị trí đúng là đầu dãy hiện hành; sau đó không quan tâm đến nó nữa, xem dãy hiện hành chỉ còn n – 1 phần tử của dãy ban đầu, bắt đầu từ vị trí thứ hai; lặp lại quá trình trên cho dãy hiện hành … đến khi dãy hiện hành chỉ còn một phần tử. Dãy ban đầu còn n phần tử, vậy tóm tắt ý tưởng thuật toán là thực hiện n-1 lượt việc đưa phần tử nhỏ nhất trong dãy hiện hành về vị trí đúng ở đầu dãy.
- Các bước tiến hành như sau :
+ Bước 1: Gán i bằng 1 (i:=1,bắt đầu từ phần tử đầu tiên của dãy);
+ Bước 2: Tìm phần tử a[min] nhỏ nhất trong dãy tiến hành từ a[i] đến a[n].
+ Bước 3: Hoán vị a[min] và a[i].
+ Bước 4: Nếu i < n-1 thì i := i + 1; Lặp lại Bước 2. Ngược lại: Dừng.( n-1 phần tử đã nằm đúng vị trí ).
- Ví dụ : Cho dãy số a : 12 2 8 5 1 6 4 15
12
2
8
5
1
6
4
15
I=1
5
12
6
4
15
1
2
8
I=2
15
4
6
12
5
8
2
1
I=3
8
6
12
5
4
2
1
15
I=4
8
6
12
5
4
2
1
15
I=5
15
8
12
6
5
4
2
1
I=6
12
8
6
5
4
2
1
15
I=7
2. Đánh giá giải thuật:
- Đối với giải thuật chọn trực tiếp, có thể thấy rằng ở lượt thứ i, bao giờ cũng cần ( n-1) lần so sánh để xác định phần tử nhỏ nhất hiện hành. Số lượng phép so sánh này không phụ thuộc vào tình trạng của dãy số ban đầu, do vậy trong mọi trường hợp có thể kết luận :
Số lần so sánh bằng =
- Số lần hoán vị ( một hoán vị bằng 3 phép gán ) lại phụ thuộc vào tình trạng ban đầu của dãy số, ta chỉ có thể ước lược trong từng trường hợp như sau:
Trường hợp
Số lần so sánh
Số phép gán
Tốt nhất
n(n-1)/2
0
Xấu nhất
n(n-1)/2
3n(n-1)/2
Begin
Đổi chổ
a[j] & a[j-1];
i = 1
j = n
j >= i+1
i<=n-1
Đúng
Sai
Sai
End
a[j]<a[j-1]
Đúng
Đúng
Sai
Xuất dãy số
3. Lưu đồ thuật toán :
Xem như dãy số cần sắp xếp đã được nhập vào sẵn
II. Phương pháp chèn trực tiếp (Insert sort):
1. Giải thuật:
Giả sử có một dãy a1, a2, …, ai-1 đã có thứ tự. Ý tưởng của giải thuật sắp xếp bằng phương pháp chèn trực tiếp là tìm cách chèn phần tử ai vào vị trí thích hợp của đoạn đã được sắp xếp để được dãy mới a1, a2, …, ai trở nên có thứ tự. Vị trí này chính là vị trí giữa hai phần tử ak-1 và ak thỏa ak-1 < ai < ak
Cho dãy ban đầu a1, a2, …, an ta có thể xem như đã có đoạn gồm một phần tử a1 đã được sắp xếp, sau đó thêm a2 vào đoạn a1 sẽ có đoạn a1, a2 được sắp xếp; tiếp tục thêm a3 vào đoạn a1, a2 để có đoạn a1, a2, a3 được sắp; tiếp tục cho đến khi thêm xong aN vào đoạn a1 a2, …aN-1 sẽ có dãy a1 a2… aN được sắp.
- Các bước tiến hành như sau:
+ Bước 1: i = 2; (giả sử có đoạn a[1] được sắp)
+ Bước 2: x:= a[i]; tìm vị trí pos thích hợp trong đoạn a[1] để chèn a[i] vào;
12
+ Bước 3: Dời chổ các phần tử từ a[pos đến a[i-1] sang phải một vị trí để dành chổ cho a[i];
+ Bước 4: a[pos] := x; (có đoạn a[1]…a[i] đã được sắp)
+ Bước 5: i := i+1 ; nếu i < n : lặp lại bước 2. Ngược lại : Dừng
- Ví dụ : Xét dãy số gồm các số hạng :
12 2 8 5 1 6 4 15
15
4
6
1
5
8
2
12
I=2
15
4
6
1
5
8
12
2
I=3
15
4
6
1
5
12
8
2
I=4
15
4
6
1
12
8
5
2
I=5
15
4
6
12
8
5
2
1
I=6
15
4
12
8
6
5
2
1
I=7
15
12
8
6
5
4
2
1
I=8
2. Đánh giá giải thuật :
Đối với giải thuật chèn trực tiếp, các phép so sánh xảy ra trong mỗi vòng lặp while tìm vị trí thích hợp pos, và mỗi lần xác định vị trí đang xét không thích hợp, sẽ dời chỗ phần tử a[pos] tương ứng. Giải thuật thực hiện tất cả n -1 vòng lặp while, do số lượng phép so sánh và dời chỗ này phụ thuộc vào tình trạng dãy số ban đầu, nên chỉ có thể ước lược trong từng trường hợp như sau :
Trường hợp
Số phép so sánh
Số phép gán
Tốt nhất
Xấu nhất
3. Lưu đồ thuật toán:
Xem như dãy số cần sắp xếp đã được nhập vào sẵn:
Begin
Đổi chổ
a[j] & a[j-1];
j = j – 1;
i = 2
j = i
j >1 và a[j] <a[j-1]
i < = n
Đúng
Sai
Sai
Đúng
End
Xuất dãy số
III. Phương pháp sắp xếp nổi bọt (Bubble sort):
1. Giải thuật :
- Sắp xếp nổi bọt (bubble sort) là một thuật toán sắp xếp đơn giản, so sánh hai phần tử đầu, nếu phần tử đứng trước lớn hơn phần tử đứng sau thì đổi chỗ chúng cho nhau. Tiếp tục làm như vậy với cặp phần tử tiếp theo cho đến cuối tập hợp dữ liệu. Sau đó, quay lại với hai phần tử đầu cho đến khi không còn cần phải đổi chỗ nữa. Nó có tên gọi này từ hình ảnh của các "bọt" khí nhẹ hơn được nổi lên trên. Nó sử dụng phép so sánh các phần tử nên là một sắp xếp kiểu so sánh.
- Các bước tiến hành như sau :
+ Bước 1: i := 1 ; // Lần xử lí đầu tiên.
+ Bước 2: j : = n ; // duyệt từ cuối dãy ngược về vị trí i .
Trong khi ( j > i) thực hiện :
Nếu a[j]<a[j-1] : a[j] : = a[j-1]; // Xét cặp phần tử kế cận j = j-1;
+ Bước 3: i = i + 1; // Lần xử lí kế tiếp
Nếu i > n-1 : hết dãy. Dừng.
Ngược lại : Lặp lại bước 2 . Cho đến khi j=i thì dừng thuật toán.
- Ví dụ : Cho dãy số a gồm các phần tử sau :
12 2 8 5 1 6 4 15
15
4
6
1
5
8
2
12
I=1
J=7
15
6
4
1
5
8
12
2
J=5
I=1
15
6
4
5
1
8
12
2
1
2
4
5
6
8
12
15
l = 8
1
2
5
6
8
12
4
15
l = 7
J=4
I=1
15
6
4
5
8
1
12
2
I=1
J=3
15
6
4
5
8
12
1
2
I=1
J=2
15
6
4
5
8
12
2
1
I=2
J=6
15
6
5
4
8
12
2
1
I=2
J=5
15
6
5
8
4
12
2
1
J=4
I=2
15
6
5
8
12
4
2
1
J=6
I=3
Cứ tiếp tục như vậy và tăng dần i lên cho đến khi i > n-1 thì dừng và dãy đã được sắp xếp xong.
Dãy khi sắp xếp xong là : 1 2 4 5 6 8 12 15
2. Đánh giá giải thuật :
Đối với giải thuật nổi bọt, số lượng các phép so sánh xảy ra không phụ thuộc vào tình trạng của dãy số ban đầu, nhưng số lượng phép toán hoán vị thực hiện tuỳ thuộc vào kết quả so sánh, có thể ước lượt trong từng trường hợp như sau:
Trường hợp
Số lần so sánh
Số lần hoán vị
Tốt nhất
0
Xấu nhất
à Nhận xét:
Bubblesort có các khuyết điểm sau : không nhận diện được tình trạng dãy đã có thứ tự hay có thứ tự từng phần. Các phần tử nhỏ được đưa về vị trí đúng rất nhanh, trong khi các phần tử lớn lại được đưa về vị trí đúng
rất chậm.
3. Lưu đồ thuật toán :
Xem như dãy số cần sắp xếp đã được nhập vào sẵn.
Begin
Đổi chổ
a[j] & a[j-1];
i = 1
j = n
j >= i+1
i<=n-1
Đúng
Sai
Sai
End
a[j]<a[j-1]
Đúng
Đúng
Sai
Xuất dãy số
IV. Phương pháp sắp xếp vun đống (Heap sort):
1. Định nghĩa heap :
Giả sử xét trường hợp sắp xếp tăng dần, khi đó heap được định nghĩa là một dãy các phần tử a1, a2, …, ar thỏa các quan hệ sau với mọi i [l,r] :
1/. ai >= a2i
2/. ai >= a2i+1 {(ai, a2i), (ai, a2i+1) là các cặp phần tử liên đới}
Heap có các tính chất sau :
Tính chất 1: Nếu a1, a2, …, ar là một heap thì khi cắt bỏ một số phần tử ở hai đầu của heap, dãy con còn lại vẫn là một heap.
Tính chất 2: Nếu a1, a2, …, an là một heap thì phần tử a1 (đầu heap) luôn là phần tử lớn nhất trong heap.
Tính chất 3: Mọi dãy a1, a2, …, ar với 2l > r là một heap.
2. Giải thuật Heapsort:
- Giải thuật hepsort trải qua hai giai đoạn:
Giai đoạn 1: Hiệu chỉnh dãy số ban đầu thành heap;
Giai đoạn 2: Sắp xếp dãy số dựa trên heap :
Bước 1: Đưa phần tử nhỏ nhất về vị trí đúng ở cuối dãy :
r : = n ; Hoán vị (a1, ar);
Bước 2: Loại bỏ phần tử nhỏ nhất ra khỏi heap : r : = r – 1;
Hiệu chỉnh phần còn lại của dãy từ a1, a2, …, ar thành một heap.
Bước 3: Nếu r > 1 (heap còn phần tử): Lặp lại bước 2. Ngược lại :Dừng.
- Ví dụ :Cho dãy số a : 12 2 8 5 1 6 4 15
15
4
6
1
5
8
2
12
Phần tử liên đới
I= 4
Giai đoạn 1 : Hiệu chỉnh dãy ban đầu thành heap
5
4
6
1
15
8
2
12
Phần tử liên đới
I= 3
5
4
6
1
15
8
2
12
I= 2
Phần tử liên đới
5
4
6
1
2
8
15
12
Lan truyền việc hiệu chỉnh
I = 1
2
4
6
1
5
8
15
12
Phần tử liên đới
I = 1
2
4
6
1
5
8
12
15
Giai đoạn 2: Sắp xếp dãy số dựa trên heap :
2
4
6
1
5
8
12
15
r=8
Hiệu chỉnh lại heap
15
4
6
1
2
8
5
12
15
4
6
1
2
8
5
12
r=7
Hiệu chỉnh lại heap
15
12
4
1
2
6
5
8
15
12
4
1
2
6
5
8
r=6
Hiệu chỉnh lại heap
15
12
8
1
2
4
5
6
15
12
8
1
2
4
5
6
r=5
Thực hiện tương tự cho r =5, 4, 3, 2 ta được :
15
12
8
6
5
4
2
1
3. Đánh giá giải thuật :
Việc đánh giá giải thuật heapsort rất phức tạp, nhưng đã chứng minh được trong trường hợp xấu nhất độ phức tạp là O(nlog2n).
4. Lưu đồ thuật toán :
Xem như dãy số cần sắp xếp đã được nhập vào sẵn.
* Hiệu chỉnh Heap :
Begin
i = l ; j = 2*i ;
x = a[i] ;
cont = true ;
Sai
j <= r & Cont
Đúng
Sai
j < r
Đúng
Sai
a[j] < a[j+1]
Đúng
j = j + 1
Sai
a[j] < x
Đúng
a[i] = a[j] ;
i = j ;
j = 2*j ;
Cont = false
a[i] = x
End
* Sắp xếp vun đống:
Begin
Hiệu chỉnh dãy a1, a2,...,an thành Heap ;
r = n ;
Sai
r > 0
Đúng
Đổi chổ a[l] và a[r];
r = r – 1 ;
Hiệu chỉnh dãy al, al+1,...,ar thành Heap;
Xuất dãy số
End
V. Phương pháp sắp xếp nhanh (Quick sort):
1. Giải thuật :
Để sắp xếp dãy a1, a2, …, an giải thuật Quick sort dựa trên việc phân hoạch dãy ban đầu thành 2 phần:
Dãy con 1: Gồm các phần tử a1.. ai có giá trị không lớn hơn x.
Dãy con 2: Gồm các phần tử ai.. an có giá trị không nhỏ hơn x.
Với x là giá trị của một phần tử tùy ý trong dãy ban đầu. Sau khi thực hiện phân hoạch, dãy ban đầu được phân thành 3 phần :
1. ak < x , với k = 1.. i
2. ak = x , với k = i.. j
3. ak > x , với k = j.. n
ak < x
ak = x
ak > x
Trong đó, dãy con thứ 2 đã có thứ tự, nếu các dãy con 1 và 3 chỉ có một phần tử thì chúng cũng đã có thứ tự, khi đó dãy ban đầu đã được sắp. Ngược lại, nếu các dãy con 1 và 3 có nhiều hơn một phần tử thì dãy ban đầu chỉ có thứ tự khi các dãy con 1 và 3 được sắp. Để sắp xếp dãy con 1 và 3, ta lần lượt tiến hành việc phân hoạch từng dãy con theo cùng phương pháp phân hoạch dãy ban đầu vừa trình bày.
Giải thuật phân hoạch dãy al, al+1, .., ar thành hai dãy con :
Bước 1: Chọn tùy ý một phần tử a[k] trong dãy là giá trị mốc, l < k < r: x : = a[k]; i:=l; j : = r ;
Bước 2: Phát hiện và hiệu chỉnh cặp phần tử a[i], a[j] nằm sai chỗ :
Bước 2a: Trong khi (a[i] < x) i : = i+1;
Bước 2b: Trong khi (a[j] > x) j : = j-1;
Bước 2c: Nếu i x > a[j] mà a[j] đứng sau a[i] thì hoán vị (a[i],
a[j]);
Bước 3: Nếu i < j : Lặp lại bước 2. // chưa xét hết mảng
Nếu i > j : Dừng.
Giải thuật phân hoạch dãy sắp xếp dãy al , al+1, …, ar :
Có thể phát biểu giải thuật sắp xếp một cách đệ quy như sau :
Bước 1: Phân hoạch dãy a1 . ar thành các dãy con :
Dãy con 1 : a1.. aj <x
Dãy con 2: aj+1.. ai-1 = x
Dãy con 1: ai.. ar >x
Bước 2: Nếu (l < j) // dãy con 1 có nhiều hơn 1 phần tử
Phân hoạch dãy a1.. aj
Nếu (i < r) // dãy con 3 có nhiều hơn 1 phần tử
Phân hoạch dãy ai.. ar
Ví dụ : Cho dãy số a : 12 2 8 5 1 6 4 15
Phân hoạch đoạn l =1, r = 8, x =A[4]=5
15
4
6
1
5
8
2
12
r=8
l=1
15
12
6
8
5
1
2
4
Phân hoạch đoạn l =1, r = 3, x =A[2]=2
15
12
6
8
5
1
2
4
r=3
l=1
15
12
6
8
5
4
2
1
Phân hoạch đoạn l =5, r = 8, x =A[6]=6
12
6
8
5
4
2
1
15
r=8
l=5
15
12
8
6
5
4
2
1
15
12
8
5
4
2
1
Phân hoạch đoạn l =7, r = 8, x =A[7]=6
6
l=7
r=8
12
8
6
5
4
2
1
15
Dừng.
2. Đánh giá giải thuật :
Hiệu quả thực hiện của giải thuật Quicksort phụ thuộc vào việc chọn giá trị mốc. Trường hợp tốt nhất xảy ra nếu mỗi lần phân hoạch đều chọn được phần tử median (phần tử lớn hơn (hay bằng) nữa số phần tử, và nhỏ hơn (hay bằng) nữa số phần tử còn lại) làm mốc, khi đó dãy được phân chia thành hai phần bằng nhau và cần log2n lần phân hoạch thì sắp xếp xong. Nhưng nếu mỗi lần phân hoạch lại chọn nhằnm phần tử có giá trị cực đại (hay cực tiểu) là mốc, dãy sẽ bị phân chia thành hai phần không đều : một phần chỉ có 1 phần tử, phần còn lại gồm (n-1) phần tử, do vậy cần phân hoạch n lần mới sắp xếp xong.
à Ta có bảng tổng kết sau:
Trường hợp
Độ phức tạp
Tốt nhất
n*log(n)
Trung bình
n*log(n)
Xấu nhất
n2
3. Lưu đồ thuật toán :
Begin
x = a[(l+r)/2];
i = l;
j = r;
a[i]<x
a[j]>x
Sai
i = i+1;
Đúng
j = j -1;
Đúng
Sai
i <= j
Đúng
i < j
Đổi chổ a[i] và a[j];
i=i+1; j=j-1;
Sai
Đúng
Sai
l < j
Đúng
Quicksort(l,j);
Sai
i < r
Đúng
Quicksort(i,r);
Sai
End
Xem như dãy số cần sắp xếp đã được nhập vào sẵn
.
VI. Phương pháp sắp xếp trộn (MergerSort):
* Nguyên tắc sắp xếp bằng phép trộn:
- Để sắp xếp dãy a1, a2,...,an, giải thuật MergeSort dựa trên nhận xét sau:
Mỗi dãy a1, a2,...,an bất kỳ đều có thể coi như là một tập hợp các dãy con liên tiếp mà mỗi dãy con đều đã có thứ tự. Ví dụ: 12, 2, 8, 5, 1, 6, 4, 15 có thể coi như gồm 5 dãy con không giảm (12); (2,8); (1,6); (4,5).
Dãy đã có thứ tự coi như có một dãy con.
Như vậy, một cách tiếp cận để sắp xếp dãy là tìm cách làm giảm dãy con không giảm của nó. Đây chính là hướng tiếp cận của thuật toán sắp xếp theo phương pháp trộn.
- Trong phương pháp MergeSort, mấu chốt của vấn đề là cách phân hoạch dãy ban đầu thành các dãy con. Sau khi phân hoạch xong, dãy ban đầu sẽ tách ra thành 2 dãy phụ theo nguyên tắc phân phối đều luân phiên. Trộn từng cặp dãy con của hai dãy phụ thành một dãy con của dãy ban đầu, ta sẽ nhận lại dãy ban đầu nhưng với số lượng dãy con ít nhất giảm đi một nửa. Lặp lại qui trình trên sau một số bước, ta sẽ nhận lại được một dãy chỉ gồm 1 dãy con không giảm. Nghĩa là dãy ban đầu đã được sắp xếp.
1. Giải thuật:
- Giải thuật trộn trực tiếp là phương pháp đơn giản nhất. Việc phân hoạch thành các dãy con đơn giản chỉ là tách dãy n phẩn tử thành n dãy con. Đòi hỏi của thuật toán về tính có thứ tự của các dãy con luôn được thõa trong cach1 phân hoạch này vì dãy gồm một phần tử luôn có thứ tự. Cứ mỗi lần tách rồi trộn, chiều dài của các dãy con sẽ được nhân đôi.
- Các bước thực hiện thuật toán như sau:
Bước 1: // Chuẩn bị
k = 1; // k là chiều dài của dãy con trong bước thực hiện
Bước 2: Tách dãy a1 , a2 ,…, an thành 2 dãy b, c theo nguyên tắc luân phiên từng nhóm k phần tử:
b= a1 , ak , a2k+1 ,…, a3k , .
c= ak+1 ,., a2k , a3k+1 ,…, a4k , .
Bước 3: Trộn từng cặp dãy con gồm k phần tử của 2 dãy b, c vào a.
Bước 4 : k = k*2;
Nếu k < n thì trở lại bước 2.
Ngược lại : Dừng.
- Ví dụ : Cho dãy số a : 12 2 8 5 1 6 4 15
k = 1 :
15
4
6
1
5
8
2
12
4
1
8
12
b=
15
6
5
2
c=
Bước tách a thành b,c
15
4
6
1
8
5
12
2
k = 2:
15
4
6
1
8
5
12
2
b=
6
1
12
2
15
4
8
5
c=
Bước tach a thành b,c
15
8
5
4
12
6
2
1
k=4
15
8
5
4
12
6
2
1
.
12
6
2
1
b=
15
8
5
4
c=
Bước tách a thành b,c
15
12
8
6
5
4
2
1
2. Đánh giá giải thuật:
Ta thấy rằng số lần lặp của bước 2 và bước 3 trong thuật toán MergeSort bằng log2n do sau mỗi lần lặp giá trị của k tăng lên gấp đôi. Dễ thấy, chi phí thực hiện bước 2 và bước 3 tỉ lệ thuận với n. Như vậy, chi phí thực hiện của giải thuật MergeSort sẽ là O(nlog2n). Do không sử dụng thông tin nào về đặc tính của dãy cần sắp xếp, nên trong mọi trường hợp của thuật toán chi phí là không đổi. Đây cũng chính là một trong những nhược điểm lớn của thuật toán.
3. Lưu đồ thuật toán:
Xem như dãy số cần sắp xếp đã được nhập vào sẵn.
* Lưu đồ thực hiện công việc 1:
Sai
s > 0
r 0
Sai
a[ i] < a[j]
a[k] = a[i]
i = i+1 ; s = s-1
a[k] = a[j]
j = j-1 ; r = r-1
Sai
Đúng
Đúng
k = k + d
s 0
a[k] = a[i] ; k= k+d
i = i + 1; s = s - 1
r 0
Đúng
a[k] = a[j] ; k= k+d
j = j – 1 ; r = r - 1
d = -d ; t = k
k = q ; q = t
Sai
Đúng
Begin
up = true ; p = 1
d =1 ; m = n
up = true
i = 1 ; J = n
k = n + 1 ; q =2*n
i = n + 1 ; j = 2*n
k = 1 ; q = n
Đúng
Sai
m>=p
s = p
r = p
s = m
r = m
Đúng
Sai
m = m – s
m = m -r
Gọi đoạn chương trình thực hiện công việc 1
m = 0
up = not up
p = 2*p
p >= n
not up
Đúng
Sai
i < n
a[i] = a[i + n]
Đúng
Đúng
End
Sai
Sai
Đúng
Sai
Xuất dãy số
*Lưu đồ thực hiện chương trình:
D. KẾT LUẬN
Qua bài tập chủ đề 1 này nhóm chúng em đã tìm hiểu nghiên cứu và cài đặt được 6 phương pháp sắp xếp đó là: Phương pháp chọn trực tiếp (Selection sort); Phương pháp chèn trực tiếp ( Insertion sort); Phương pháp sắp xếp nổi bọt ( Bubble sort); Phương pháp sắp xếp trộn (Merge sort);Phương pháp sắp xếp nhanh (Quick sort);Phương pháp sắp xếp kiểu vun đống( Heap sort);Thực hiện được việc sắp xếp dãy số đã cho tùy ý ban đầu chưa có thứ tự thành một dãy số có thứ tự được sắp xếp bằng 6 phương pháp trên.
* Về mặt ưu điểm của kết quả đạt được :
- Biết được ưu, khuyết điểm cũng như độ phức tạp của từng phương pháp trên.
- Mô tả được quá trình thực hiện 6 phương pháp sắp xếp trên.
- Demo có phần dữ liệu ngẫu nhiên để test và có chức năng nhập dữ liệu để kiểm tra thủ công.
- Giao diện chạy chương trình dễ sử dụng.
- Sắp xếp dãy số theo 6 phương pháp đều cho kết quả đúng.
* Về mặt khuyết điểm, hạn chế :
- Chương trình Demo còn đơn giản.
- Do chưa hiểu được sâu tất cả các thuật toán sắp xếp.
- Chưa biểu diễn được quá trình sắp xếp của các phần tử trong dãy số trong đồ họa,chưa tính được số lần so sánh và hoán vị của các phần tử trong quá trình sắp xếp.
* Bài học kinh nghiệm cần rút ra:
- Cần phải nghiên cứu kỉ và tìm hiểu nhiều hơn nữa về các phương pháp sắp xếp, tìm hiểu các ngôn ngữ lập trình để có thể lựa chọn cho mình ngôn ngữ phù hợp có giao diện đẹp hơn, lập trình được tốt hơn.
- Đặc biệt cần phải nghiên cứu thật kỉ và tìm hiểu rỏ hơn nữa về ngôn ngữ mà mình chọn để cài đặt làm trong bài tập chủ đề 1 này.
- Do đây là lần đầu tiên nhóm chúng em làm bài tập chủ đề, do kiến thức về ngôn ngữ lập trình chưa vững còn nhiều hạn chế nên chương trình còn nhiều chổ chưa hoàn thiện cần được sự đóng góp ý kiến thầy và các bạn để cho nhóm chúng em học hỏi giúp cho nhóm chúng em có thêm kinh nghiệm để giúp cho chương trình của nhóm
chúng em được hoàn thiện hơn.
- Đầu tiên chọn file Pascal chương trình Demo1 giao diện màn hình xuất hiện như sau:
- Tiếp theo để chạy chương trình ta nhấn Ctrl+F9 ta sẽ thấy màn hình xuất hiện như sau:
- Sau đó nhấn Enter để vào menu chương trình chính để ta lựa chọn các phương pháp sắp xếp và để lựa chọn các phương pháp sắp xếp ta sử dụng 2 phím mũi tên lên hoặc là xuống. Minh họa màn hình giao diện xuất hiện như sau:
- Sau khi dãy số đã được sắp xếp, bạn nhấn Enter thì chương trình sẽ quay lại vào menu chính và bạn có thể thực hiện thao tác sắp xếp khác tương tự như trên. Nếu bạn muốn thoát thì chọn Thoát chương trình sẽ xuất hiện màn hình như sau :
- Tiếp tục nhấn Enter thì màn hình sẽ quay lại màn hình chương trình Demo1 như ban đầu.
TÀI LIỆU THAM KHẢO
1. Cấu trúc dữ liệu (NXB trung tâm điện toán trường đại học bách khoa TPHCM . Tác giả NGUYỄN TRUNG TRỰ
Các file đính kèm theo tài liệu này:
- Các phương pháp sắp xếp bằng pascal.doc