Chuyên đề Phân tích cơ cấu khách hàng trong Công ty chứng khoán Apec và định hướng cho sàn Apec Bắc Ninh

NỘI DUNG

CHƯƠNG I : TỔNG QUAN VỀ THỊ TRƯỜNG CHỨNG KHOÁN

1.1. Thị trường chứng khoán

1.1.1.Thị trường chứng khoán và lịch sử hình thành phát triển

1.1.2.Chức năng

1.1.3. Cấu trúc thị trường chứng khoán

1)Cơ cấu thị trường

2)Các loại hàng hoá

3) Các chủ thể tham gia thị trường chứng khoán

4)Nguyên tắc hoạt động

1.1.4. Vai trò Nhà nước đối với thị trường chứng khoán

1.2. Giới thiệu về công ty

1.2.1. Giới thiệu chung

1.2.2.chiến lược kinh doanh

1.2.2.1Mục tiêu phát triển

1.2.2.2. Mục tiêu chiến lược

2.2.2. Phương châm hoạt động

CHƯƠNG 2 : CÁC PHƯƠNG PHÁP PHÂN LỚP

2.1. Một số khái niệm cơ sở

2.1.1. Khoảng cách và độ khác biệt

2.1.2. Vấn đề tổ hợp trong phân nhóm

2.2. Các phương pháp chia lớp

2.2.1. Các phương pháp kiểu đám mây động

2.2.2. Phân lớp với các biến nhị phân

2.3. Phân lớp theo thứ bậc

2.3.1. Thứ bậc trong phép phân lớp

2.3.2. Các độ đo kết hợp dựa trên sự phát tán (khác biệt)

2.3.3.Tiêu chuẩn quán tính và phương pháp Ward

2.4. Phân lớp đối với các biến

2.4.1- Phân lớp các biến bằng tách tổng thể theo giác độ nghiên cứu

2.4.2- Độ đo khoảng cách đối với các biến định lượng

2.4.3- Độ đo khoảng cách đối với các biến định tính

2.4.4- Tiếp cận Lerman và thuật toán dựa trên tính đúng đắn của các liên hệ

CHƯƠNG III : MÔ HÌNH HOÁ VÀ ỨNG DỤNG

3.1. Phân tích sơ bộ

3.2. Phân tích bằng Spss

. Thủ tục K – Means Cluster

MỘT SỐ KIẾN NGHỊ

 

 

doc54 trang | Chia sẻ: maiphuongdc | Lượt xem: 1398 | Lượt tải: 5download
Bạn đang xem trước 20 trang tài liệu Chuyên đề Phân tích cơ cấu khách hàng trong Công ty chứng khoán Apec và định hướng cho sàn Apec Bắc Ninh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
/ngày, APEC Securities là một trong 10 công ty chứng khoán có doanh số giao dịch lớn nhất hiện nay. Ngay từ khi mới thành lập công ty và ban lãnh đã đã xác định một tầm nhìn với mục tiêu chiến lược đó là trở thành một tập đoàn đầu tư tài chính có tên tuổi ở khu vực cũng như trên toàn thế giới, kinh doanh trong nhiều lĩnh vực như đầu tư, tài chính, chứng khoán, bảo hiểm, ngân hàng và giáo dục. Chính vì vậy bên cạnh thành lập công ty chứng khoán APEC, công ty cũng thành lập APEC Investment. Một công ty đầu tư phát triển mạnh và đã là cổ đông chiến lược cho nhiều công ty có tiềm năng đang hoạt động hiệu quả và chuẩn bị niêm yết trên sở giao dịch chứng khoán. Bên cạnh đó APEC đang xúc tiến các thủ tục để thành lập Công ty APEC Land với mục tiêu chính là đầu tư bất động sản và hạ tầng trên toàn quốc Công nghệ hiện đại Công nghệ đột phá - giá trị vững bền: Hiện nay các dịch vụ của các công ty chứng khoán hầu hết đều như nhau, vì vậy công ty đã đưa ra phương châm cạnh tranh với các công ty khác đó là công nghệ hiện đại., độ an toàn của thông tin khách hàng cao và dễ dàng trong sử dụng. Để thực hiện mục tiêu là một trong những công ty có công nghệ hiện đại và dễ sử dụng nhất, Công ty Chứng khoán APEC là một trong số 2 công ty hiện nay tại Việt Nam áp dụng công nghệ Trading Online trong cả nước và là công ty đầu tiên cung cấp dịch vụ đặt lệnh mua bán chứng khoán qua SMS (MobileInvestor). Ngày 14/4/2007 APEC Securities chính thức làm lễ khai trương và triển khai hai dịch vụ Công nghệ mới: dịch vụ APEC CyberInvestor (đặt lệnh mua bán chứng khoán qua Internet) và dịch vụ APEC MobileInvestor (đặt lệnh mua bán chứng khoán qua tin nhắn SMS), là các dịch vụ dựa trên nền tảng công nghệ mới nhất hiện nay, tạo ra một phương thức mới để các nhà đầu tư tiếp cận với sàn chứng khoán. Dịch vụ này cho phép nhà đầu tư chỉ với một chiếc điện thoại di động có thể đặt lệnh mua bán chứng khoán, theo dõi các diễn biến thị trường, cung cấp số liệu về giá trần và giá sàn mà không cần phải chen lấn xếp hàng trên sàn chứng khoán; hoặc nhà đầu tư cũng có thể lướt web, đăng ký mở tài khoản, đặt lệnh mua, bán chứng khoán... trong một quán cafe wifi thay vì phải lo lắng theo sát thông tin chứng khoán tại sàn đông đúc. Ngày 25/6/2007, Công ty Chứng khoán APEC chính thức triển khai dịch vụ nhắn tin SMS kết quả giao dịch chứng khoán tới các nhà đầu tư khi giao dịch tại APEC. Với dịch vụ này, khách hàng của APEC sẽ được cập nhật thông tin chi tiết về kết quả giao dịch chứng khoán ngay khi lệnh giao dịch của nhà đầu tư được khớp trên hai sàn HASTC và HOSTC.  Như vậy APEC với 2 dịch vụ đã thu hút rất nhiều các nhà đầu tư cá nhân tham gia đăng ký tài khoản. CyberInvestor và MobileInvestor. Dịch vụ CyberInvestor cho phép khách hàng có thể đăng ký mở tài khoản; đặt lệnh mua bán chứng khoán; truy vấn số dư tài khoản; kiểm tra tình trạng khớp lệnh chứng khoán chỉ cần qua một máy tính có kết nối Internet. Còn với MobileInvestor, dịch vụ này cho các nhà đầu tư đặt lệnh mua bán, theo dõi diễn biến của thị trường và quyết định đầu tư nhanh chóng ngay cả khi không online. - Ngày 10/1/2008, Công ty CP chứng khoán Châu Á Thái Bình Dương (APEC Securities) đã ký hợp đồng mua giải pháp chứng khoán IBOSS từ Tập đoàn Châu Á Thái Bình Dương 3I- Infotech (do CFTD-IS là đại diện độc quyền tại Việt Nam). Theo đó, CFTD-IS, một công ty chuyên cung cấp giải pháp CNTT cho khối tài chính, chứng khoán, ngân hàng, là đơn vị cung cấp độc quyền giải pháp IBOSS của 3I- Infotech tại thị trường Việt Nam với khách hàng đầu tiên là APEC Securities. APEC Securities sẽ sử dụng giải pháp IBOSS (Integrated Broker Office Solfware Solutions) để điều hành toàn bộ quá trình giao dịch kể từ lúc đặt lệnh cho tới lúc thanh toán. IBOSS sẽ giúp APEC tiết kiệm được chi phí và tích hợp toàn bộ hệ điều hành nối liền front - office, hệ thống quản lý rủi ro và back - office. Đây là giải pháp cho phép thực thiện giao dịch online (trực tuyến) theo thời gian thực ngay trên mạng Internet giữa khách hàng với các sàn giao dịch chứng khoán ở Việt Nam. Sử dụng giải pháp IBOSS, công ty chứng khoán không chỉ có thể môi giới với những chứng khoán tiêu chuẩn mà còn có thể thực hiện giao dịch với những chứng khoán khác như hợp đồng tương lai, hợp đồng lựa chọn... Công ty 3I- Infotech là nhà cung cấp hàng đầu các sản phẩm và dịch vụ công nghệ thông tin cho ngành ngân hàng, tài chính và bảo hiểm. Công ty là một phần của tập đoàn ICICI Bank (niêm yết trên sàn giao dịch chứng khoán New York). Giải pháp IBOSS đã được 3I- Infotech ứng dụng thành công trên 600 công ty chứng khoán tại châu Á trong thời gian qua… APEC đã thu hút được 1.000 các nhà đầu tư quan tâm và sử dụng dịch vụ CyberInvestor và hơn 500 các nhà đầu tư sử dụng dịch vụ MobileInvestor. Công ty APEC mới đây cũng đưa ra chương trình khuyến mại "Miễn phí 03 tháng giao dịch chứng khoán cho khách hang lần đầu tiên mở tài khoản tại APEC". Những khách hàng đã mở tài khoản giao dịch tại APEC trước ngày 15/5/2007 sẽ được hưởng mức phí giao dịch 0,2% đến hết ngày 30/6/2007. Tỷ suất lợi nhuận trên vốn lớn -Với sự phát triển mạnh và được thành lập vào thời điểm thị trường chứng khoán Việt Nam đang sôi động, lợi nhuận sau thuế dự kiến của APEC Securities đến cuối năm 2007 là 55 tỷ đồng. Ngày 27/11/2007 tại Tokyo đã diễn ra lễ ký kết hợp đồng đối tác chiến lược giữa Công ty Dịch vụ Tư vấn Đầu tư Nhật Bản (JICS) và CTCP Chứng khoán Châu Á- Thái Bình Dương (APEC) trước sự chứng kiến của Phó Thủ tướng Hoàng Trung Hải, cùng các quan chức lãnh đạo Việt Nam tháp tùng đoàn của chủ tịch nước Nguyễn Minh Triết sang thăm Nhật Bản. Theo hợp đồng này, JICS trở thành cổ đông chiến lược của APEC Securities và sẽ đầu tư vào Việt Nam 200 triệu USD thông qua APEC Securities. JICS được thành lập năm 2001 là một định chế tài chính chuyên tư vấn cho các cá nhân và doanh nghiệp Nhật bản trên các lĩnh vực như đầu tư, cơ cấu nguồn vốn, quản lý tài chính và niêm yết trên thị trường chứng khoán Nhật Bản. Ông Nguyễn Đỗ Lăng, Chủ tịch HĐQT APEC Securities cho biết, để trở thành nhà quản lý quỹ trung gian của các công ty nước ngoài tại Việt Nam, APEC Securities đang phát triển quy mô hoạt động về mọi mặt. Công ty đang hoàn thành các thủ tục cuối cùng để tăng vốn điều lệ lên 350 tỷ và niêm yết tại TTGDCK Hà Nội vào đầu năm 2008. APEC Securities cũng xúc tiến thành lập Công ty quản lý quỹ đầu tư APEC, Công ty Bảo hiểm phi nhân thọ APEC và Công ty Đầu tư Tài chính và Bất động sản Miền Trung và mô hình APEC Franchise (đại lý ủy quyền). Cũng theo ông Lăng, riêng phí quản lý của hợp đồng này đã ngang bằng với mức lợi nhuận năm 2007 của APEC Securities vào khoảng 55 tỷ đồng. 2.2.2. Phương châm hoạt động Để đạt được những mục đặt ra, phương châm hoạt động của công ty là: “Lấy con người làm nền tảng, lấy khách hàng làm trung tâm, lấy chất lượng dịch vụ làm phương tiện nhằm cùng với khách hàng đạt được những thành công vượt bậc” Lấy con người làm nền tảng: Apec securities được thành lập bởi các tổ chức và cá nhân có nhiều kinh nghiệm về tài chính, tư vấn, kinh doanh. Công ty đã, đang và sẽ tiếp tục dành sự quan tâm đặc biệt cho việc phát triển đội ngũ nhân viên chuyên nghiệp giàu tâm huyết, kiến thức và kinh nghiệm nhằm cung cấp cho khách hàng của mình các dịch vụ với chất lượng vượt trội. Lấy khách hàng làm trung tâm: Hiểu một cách sâu sắc rằng sự thành công của khách hàng chính là tiền đề tạo nên sự thành công cho công ty. Lấy chất lượng dịch vụ làm phương tiện:APECs mong muốn và tin tưởng rằng với sự vượt trội về chất lượng dịch vụ và sự phong phú về dịch vụ mà công ty cung cấp, sẽ mang đến cho khách hàng của mình sự hiệu quả trong kinh doanh, sự tin cậy của thông tin, sự thân thiện trong giao dịch và sự tiện dụng trong sử dụng. Cụ thể là các khách hàng: - Có thể thực hiện giao dịch ở nhiều nơi trên toàn quốc thông qua hệ thống mạng lưới các chi nhánh và đại lý nhận lệnh, thông qua hệ thống APEC CyberInvestor (giao dịch chứng khoán online), hoặc đặt lệnh qua hệ thống SMS. - Có thể kiểm tra tài khoản chứng khoán, khớp lệnh qua dịch vụ SMS - Được cung cấp hệ thống thông tin về các ngành nghề một cách chính xác và chuyên nghiệp thông qua đội ngũ chuyên gia phân tích giàu kinh nghiệm - Có thể sử dụng miễn phí phần mềm ứng dụng theo dõi danh mục đầu tư ngay trên Website của công ty. - Có thể thực hiện giao dịch ở nhiều nơi trên toàn quốc thông qua hệ thống mạng lưới các chi nhánh và đại lý nhận lệnh, thông qua hệ thống APEC CyberInvestor (giao dịch chứng khoán online), hoặc đặt lệnh qua hệ thống SMS. - Có thể kiểm tra tài khoản chứng khoán, khớp lệnh qua dịch vụ SMS - Được cung cấp hệ thống thông tin về các ngành nghề một cách chính xác và chuyên nghiệp thông qua đội ngũ chuyên gia phân tích giàu kinh nghiệm - Có thể sử dụng miễn phí phần mềm ứng dụng theo dõi danh mục đầu tư ngay trên Website của công ty. - Sự hợp tác giữa APECS và Cafe 3M là mô hình kết hợp cà phê và chứng khoán Tại sàn giao dịch chứng khoán cà phê 3M, ngoài mục đích giao dịch chứng khoán, nhà đầu tư còn có thể ngồi bàn luận hoặc nghiên cứu cổ phiếu bên ly cafe. Dịch vụ này mang lại cho nhà đầu tư một không gian hoàn toàn khác biệt khi đầu tư chứng khoán, mang lại sự thoải mái sau những tính toán, suy tư mệt mỏi. - APEC cũng là công ty chứng khoán đầu tiên cam kết mở rộng dịch vụ mở tài khoản 24/24 giờ; có riêng đường dây nóng (hotline) 1900545469 chăm sóc khách hàng. Những dịch vụ này sẽ giúp Công ty kết nối với nhà đầu tư, với doanh nghiệp cả ở trong và ngoài nước. Các dịch vụ của APEC được thiết kế dành riêng cho các đối tượng khách hàng khác nhau: dịch vụ APEC CyberInvestor/APEC MobileInvestor cho những khách hàng bận rộn; dịch vụ VIP với những mức phí rất ưu đãi cho khách hàng tổ chức và khách hàng lớn; dịch vụ tư vấn đầu tư và cung cấp các báo cáo nghiên cứu ngành, phân tích cổ phiếu cho khách hàng… Øchiến lược kinh doanh: phân chia được đối tượng khách hàng để xây dưng cơ cấu khách hàng và có chién lược quan tam dến khách hàng tôt hơn theo cơ cấu. CHƯƠNG 2 : CÁC PHƯƠNG PHÁP PHÂN LỚP Phân lớp là một trong những bài toán được quan tâm rất sớm trong lịch sử. Từ xa xưa người ta đã tiến hành phân lớp trong tất cả mọi lĩnh vực. Trong trường hợp tổng thể chỉ có một đặc trưng việc phân lớp hoàn toàn hình thành tự động hay theo một quan điểm chủ quan nào đó. Ngay trong trường hợp chỉ dùng một đặc trưng, ý tưởng phân lớp đã rõ ràng và nó cũng mặc nhiên vượt khỏi giới hạn tổng thể một đặc trưng. Chẳng hạn, khi quan sát nghiên cứu thu nhập của cư dân. Cho dù các điều kiện kinh tế xã hội, chính trị cũng như các điều kiện khác là thuần nhất thì người nghiên cứu thu nhập với mục đích tìm thị trường cho một loại hàng hoá cũng thường trực một ý niệm là mức hay tỷ lệ chi cho tiêu dùng mặt hàng mà họ quan tâm có thể khác nhau theo giới. Tổng thể mặc nhiên được phân lớp nam và nữ. Có rất nhiều trường hợp bài toán phân lớp tự bộc lộ bài giải ngay trong quá trình vận động của tổng thể. Sẽ không ai thắc mắc tại sao giới tính của cư dân lại chia thành hai lớp, hàng hoá lại chia thành hàng hoá thiết yếu, thông thường và xa xỉ cũng như cách phân chia chúng trong mỗi thời đại. Tuy nhiên, khi mỗi cá thể của tổng thể có quá nhiều đặc trưng, nhất là có nhiều đặc trưng mới mà chúng ta không thể hiểu cặn kẽ; khi chính các đặc trưng này lại vận động trong mối quan hệ tác động qua lại đồng thời thì việc phân lớp trở thành phức tạp. Có thể thấy, vấn đề không chỉ giới hạn ở việc có quá nhiều đặc trưng cho mỗi cá thể mà chính trong điều kiện này người ta không thể áp đặt một quan niệm hay mục đích chủ quan cho một bài toán phân lớp. Trong chương này chúng ta sẽ nghiên cứu những cơ sở của những phương pháp khác nhau giải quyết bài toán phân lớp khách quan, không phụ thuộc vào các quan điểm chủ quan mà chỉ phụ thuộc vào chính sự biểu hiện của các cá thể trong quá trình vận động của chúng. Tiêu chuẩn cao nhất trong phân lớp một tổng thể là tạo ra các lớp ( tập con) với sự thuần nhất tối đa có thể trong từng lớp cũng như sự khác biệt tối đa của cá thể khác lớp 2.1. Một số khái niệm cơ sở 2.1.1. Khoảng cách và độ khác biệt Dữ liệu cho phân lớp một tập hợp n cá thể có thể được cho dưới dạng một bảng số ( số liêu thô) hay một bảng quan hệ n x n. Các quan hệ thông thường được thể hiện dưới hai dạng : khoảng cách hoặc độ khác biệt (độ phân tán) của các cặp cá thể khoảng cách Xét tập n cá thể, mỗi cá thể có thể được đặc trưng bởi p đặc trưng (biến). Gọi E là tập các cá thể cần phân lớp Khoảng cách giữa các cá thể i và cá thể j là một số thực d(i,j) thoả mãn các điều kiện sau : d(i,j) = d(j,i) d(i,j) ≥ 0 d(i,j) = 0 nếu và chỉ nếu i = j d(i,j) ≤ d(i,k) + d(k,j) cho mọi k thuộc E có thể mở rộng định nghĩa trên với việc bỏ đi điều kiện thứ tư ta được một khoảng cách phi Ocơlit. b. Độ kết hợp Độ khác biệt của I và j là số thực của s(I,j) được xác định thoả mãn các điều kiện sau : s(i,j) = s(j,i) s(i,j) ≥ 0 s(i,i) ≥ s(i,j) Độ đo này tương tự độ đo nhận được từ ma trận hiệp phương sai. c. Các khoảng cách khác nhau cho tập các biến nhị phân Nếu ta có n cá thể được thể hiện bởi p (đặc trưng) biến định tính, ta có thể xem xét sự khác biệt của hai cá thể I,j nhờ thông tin các đặc trưng có xuất hiện ở các cá thể này hay không. Gọi : a là đặc trưng sơ cấp của toàn bộ tập hợp cá thể b là số đặc trưng có ở i mà không có ở j c là số đặc trưng có ở j mà không có ở i d là số đặc trưng có ở i và cả ở j Một số độ đo phát tán lấy phần bù đơn vị được sử dụng như sau : Jaccard Cxekanowski (Dice) Ochiai Russel – Rao Rogers - Tanismoto 2.1.2. Vấn đề tổ hợp trong phân nhóm Về mặt lý thuyết, khi tập E là hữu hạn chúng ta có thể cung cấp mọi cách phân nhóm, sau đó dùng một tiêu chuẩn nào đó để chọn cách phân nhóm tối ưu. Tuy nhiên, ngay điều này cũng không dễ dàng gì, hơn thế nếu có sẵn một tiêu thức có vai trò hàm mục tiêu thì tiêu thức này cũng chỉ cung cấp một cách phân nhóm chủ quan. Số cách tổ hợp khác nhau từ n phần tử quá lớn, chưa nói đến mỗi cách tổ hợp sinh ra một số lớn các tập hợp. Hãy xem xét tình trạng số tổ hợp và mối quan hệ của chúng. Số cách phân chia tập n cá thể thành các lớp k cá thể Ký hiệu Pn,k là số cách chia n cá thể thành các lớp có k cá thể, ta thấy Pn,1 = Pn,n = 1 Pn,n-1 = n(n-1)/2 …… Pn,2 = 2n-1 – 1 Có thể chứng minh rằng : Pn,k = Pn-1,k-1 + kPn-1,k và Pn,k = Tổng số cách chia n cá thể Gọi Pn là tổng số cách chia n cá thể ta có thể xác định Pn theo công thức sau : Pn = với P0 = 0 2.2. Các phương pháp chia lớp 2.2.1. Các phương pháp kiểu đám mây động Các phương pháp loại này cho phép giải quyết nhanh bài toán phân lớp, đối với các tập hợp, theo một tiêu chuẩn tối ưu địa phương được sử dụng như một độ đo quán tính. Chúng ta giả sử rằng các cá thể của tập hợp được mô tả bởi các điểm trong Rp xác định một khoảng cách Ocơlit a).Quán tính giữa các lớp và trong từng lớp Cho đám mây n điểm với tâm g, giả sử rằng đám mây này được chia thành k lớp. Gọi g1,g2,…,gk là các tâm của các lớp và I1,I2,….,Ik là quán tính của các lớp, chúng ta sẽ gọi là quán tính trong của các lớp để phân biệt với quán tính chung của đám mây điểm. Các quán tính này được tính theo các phân lớp Tổng các quán tính của các lớp gọi là quán tính trong của các lớp ký hiệu là Iw : Iw = Trong đó Pj là trọng số của lớp j; xji là điểm mô tả cá thể I của lớp j Tổng quán tính giữa các lớp, ký hiệu là IB, xác định như sau : IB = Nhờ công thức Huygens ta có thể nhận được công thức tính tổng quán tính chung như sau : I = IB + Iw Tiêu chuẩn sử dụng phân lớp là cực tiểu hoá Iw hoặc tương đương là cực đại hoá IB ( vì I hoàn toàn xác định ). Chú ý rằng tiêu chuẩn này dựa trên giả thiết k xác định, nếu k không xác định có thể dẫn đến việc chia tập hợp n điểm thành n lớp b). Phương pháp tâm di động Bước 1 : Chọn ngẫu nhiên k điểm c1,c2, …, ck của E, k điểm này xác định một cách chia E thành k nhóm . Một điểm I nào đó sẽ có k khoảng cách tương ứng với k điểm c1,c2, …, ck. điểm i thuộc nhóm nào có khoảng cách này nhỏ hơn. Bước 2 : Với mỗi nhóm ở bước 1 ta có một tâm nhóm gj(l), ( j = 1…k), cách chia nhóm ở bước 2 lập lại như bước 1 với việc thay cj bằng gj(1). Kết quả ta có k nhóm . Tiếp tục tìm các tâm nhóm mới của các nhóm nhận được từ bước 2 và phân nhóm lại như pử bước 2. Thuật toán sẽ hội tụ và dấu hiệu hội tụ là các tâm nhóm ở bước sau chính là các tâm nhóm từ bước trước. Dễ dàng chứng minh rằng thuật toán này hội tụ vì mỗi lần chọn tâm mới chúng ta làm giảm tổng quán tính của các nhóm vì nếu một tâm nhóm được xác định thì quán tính trong nhóm không tăng. Thật vậy, với ci ta lập nhóm , gọi tâm nhóm này là gi thì theo công thức Huyghens ta có : nên dấu bằng xảy ra khi ci = gi. c). Phương pháp đám mây di động Phương pháp này do E. Diday đề nghị vào năm 1989. Đám mây di động xuất phát là một mở rộng của phương pháp tâm di động, tuy vậy người ta nhận được kết quả tổng quát hơn khi xem xét độ đo khoảng cách của các biến. Có thể tóm tắt phương pháp này như sau : Thay vì chọn một tâm nhóm, người ta có thể chọn một “hạt nhân” nhóm. Hạt nhân này có thể là một tập q điểm của E, có thể là một trục chính hay một thành phần chính, … Trên cơ sở này tiến hành chia E thành k nhóm bao gồm nhiều các điểm tập trung quanh các hạt nhân. Tính toán lại các khoảng cách theo một độ đo nào đó và thiết lập các hạt nhân mới sao cho các nhóm thuần nhất hơn. Tiếp tục như vậy cho đến khi không thể cải thiện hơn nữa cách chia nhóm. Để làm được như vậy mỗi bước lặp cần tiến hành các thủ tục sau : Tính toán khoảng cách từ các cá thể của E đến hạt nhân Xác định k nhóm tương ứng với hạt nhân Đánh giá (đo) chất lượng của cách phân nhóm hiện có Cách phân nhóm như vậy cho phép sử dụng một “khoảng cách” mở rộng, không nhất thiết là khoảng cách Ơcolit. 2.2.2. Phân lớp với các biến nhị phân Các phương pháp phân lớp một tập hợp n cá thể được mô tả qua các chỉ tiêu định tính đx được P.Michaud và F.Marcotorchino xây dựng. Người ta gọi các phương pháp này là các phương pháp mô tả số liệu dưới dạng quan hệ nhị phân. a). Số liệu cặp thiết lập nhờ một quan hệ nhị phân Cho tập E có n cá thể, quan hệ nhị phân B xác định một bảng C, n dòng, n cột với với ci = 0 neeus i vaf j không có quan hệ B (i không B). Một cách chia lớp là một quan hệ nhị phân tương đương kiểu B. Như vậy nếu chỉ có 1 biến định tính có m trạng thái mô tả các cá thể, thì các cá thể của tập hợp n cá thể nói trên được chia thành m lớp. Một quan hệ tương đương với cách phân lớp nói trên đặc trưng bởi 3 tính chất : Phản xứng, đối xứng và bắc cầu, có thể được thiết lập nhờ một bảng C thoả mãn các tính chất sau : Cii = 1 Cij = cji Cij + cjk – cik <1 Như vậy, nếu X là ma trận chỉ số lớp n dòng m cột thì ma trận C thoả mãn các điều kiện nói trên. Nếu có một ma trận C như vậy, chúng ta có thể chứng tỏ rằng số lớp ( số đặc trưng của X ) là : Thật vậy, giả sử có n cá thể và một quan hệ nhị phân mô tả bởi C thoả mãn các điều kiện trên. Nếu cij = 0 cho mọi i khác j thì chắc chắn là tập hợp n cá thể này phải chia thành n lớp vì mỗi cá thể có một trạng thái không giống bất kể cá thể nào khác. Ta suy ra biến định tính có đúng n dấu hiệu. Công thức trên đúng. Nếu có đúng 2 cá thể có cij = cji = 1, không mất tính tổng quát ta chọn i= 1, j = 2. Lúc này cá thể 1 và cá thể 2 hoàn toàn như nhau ( có thể coi chúng là mộy cá thể ) và khác tất cả n-2 cá thể còn lại. Biến định tính có n-1 dấu hiệu, lúc này tổng mỗi cột đầu bằng 2 còn tổng các cột khác bằng 1. aTổng n giá trị nghịch đảo đúng bằng n-1. Công thức trên nghiệm đúng. Tiếp tục như vậy ( sử dụng tính chất bắc cầu khi có từ 3 cá thể trở lên như nhau ) ta có kết quả trên. b). Phân lớp theo trung tâm theo quy tắc số đông với ràng buộc kiểu Condorcet Cho n cá thể được mô tả bởi p biến định tính có m1, m2, …,mp dấu hiệu sơ cấp. Nếu theo cách phân lớp ở phần a ta có p cách khác nhau cùng muốn đặt lên một tập hợp n cá thể. Cần tìm một cách phân lớp có tính thoả hiệp xuất phát từ cách chia ban đầu. gọi c1, c2, … , cp là các abnrg quan hệ nhị phân tương ứng cách chia ban đầu. Phần tử cij là số i và j thuộc cùng một nhóm nếu tiến hành p cách phân nhóm độc lập. Gọi c1=(2c-p), đối với một biến Xk nào đó ta có : nếu i và j cùng nhóm trong số lớn cách phân nhóm, nếu i, j cùng nhóm trong một số ít cách phân nhóm; Và cij = 0 nếu i, j cùng nhóm theo một số biến và khác nhóm khác theo một số biến khác. Một phép chia c nói chung không thoả mãn tính chất bắc cầu trong khi các phép chia ban đầu thoả mãn tính chất này. Người ta tìm cách áp đặt các ràng buộc sao cho phép chia nhóm cuối cùng thoả mãn tính chất bắc cầu với quy tắc số đông được tôn trọng. Bài toán được thiết lập như sau : Nếu Y là ma trận chỉ số phân lớp cần tìm thoả mãn các điều kiện : Thì cho mỗi biến Xk có thể tính khoảng cách của Y và C* như sau : Vì các phần tử của ck chỉ là 0 hoặc 1 và với một biến Xk thì Tiêu chuẩn cho Y là cực tiểu tổng sai khác của Y với các Ck. Tức là tìm Y : Cuối cùng ta có bài toán : Tìm Y – ma trận chỉ số phân nhóm sao cho : Với : Đây là bài toán quy hoạch tuyến tính với các biến nhị phân. Ma trận C’ xác định theo công thức : C’ = 2C – p . c). Các tiêu chuẩn kết hợp tối đa Về mặt phương pháp, có thể tổng quát hoá tiêu chuẩn nêu ở mục trước như sau : Tìm vecto định tính Y làm cực đại hàm , trong đó Φ là tiêu chuẩn kết hợp của các biến định tính. Nói chung không phải lúc nào cũng có thể qui bài toán trên về dạng bài toán thông thường nếu không biết số lớp của Y. tuy vậy nếu sử dụng Φ là độ đo kết hợp của Y và các Ck như trên với các tính chất phản xứng, đối xứng và bắc cầu thì F.Marcotorchino đã chứng minh được rằng bài toán trên có thể qui về bài toán qui hoạch tuyến tính. Chỉ số đo độ thích hợp của Y và Xk có thể được chọn khác nhau. Hiện nay chỉ số được chấp nhận rộng rãi là chỉ số Belson có dạng sau : Trong đó : nij là tần số cá biệt của Y và Xk trên bảng tiếp liên. Thực hiện các biến đổi tương tự như ở mục b ta có : Trong đó : Với : 2.3. Phân lớp theo thứ bậc Các phương pháp phân lớp được trình bày ở các mục trước luôn dựa trên cơ sở số lớp đã ấn định, cho dù trong chương II-c ta không biết trước số lớp khi có p biến định tính. Phương pháp phân lớp theo thứ bậc chỉ ra tất cả các cách phân lớp mà người sử dụng có thể chọn số lớp mà họ cho là phù hợp. 2.3.1. Thứ bậc trong phép phân lớp a. Thứ bậc của các lớp trong tập hợp cá thể cho trước Một họ H các lớp của tập E là một họ các thứ bậc nếu: E và các lớp một phần tử đều thuộc H. Cho mọi A, B thuộc H ta có Người ta có thể thiết lập các chỉ số (i) đối với các lớp, cho mỗi phép chia lớp có thứ bậc theo cách sau: Nếu A là một lớp con của B thì i(A) <= i(B), chỉ số I như vậy sẽ tăng theo tính không thuần nhất trong lớp. Chẳng hạn với kết quả chia lớp ở trên có thể thiết lập chỉ số chia lớp cho các tập con của tập đang xét như sau: Người ta cũng xác định chỉ số kết hợp của hai lớplà chỉ số của lớp hợp thành chẳng hạn: i(a2,a4,a1) = δ((a2,a4),a1) , trong đó δ((a2,a4),a1) là chỉ số kết hợp của hai nhóm (a2,a4) và a1. Một phép phân lớp phù hợp với H là phép phân lớp mà các lớp là các thành phần của H. Nói cách khác phép phân lớp này có thể nhận được nhờ việc cắt cây phân lớp theo chiều ngang va tập hợp các phần của nó. Chẳng hạn, đường thẳng g tạo ra các lớp sau đây gồm các thành phần cảu H: Một thứ tự H sẽ được gọi là thứ tự phân tầng nếu a được ghép với b trước c được ghép với d theo một thứ tự bao hàm, hay nói cách khác là chúng ta xem xét việc ghép lớp bắt đầu từ cặp hai phần tử bất kì khác nhau. Một cách phân lớp có chỉ số nếu nó là một họ H có thứ bậc và tồn tại một cách lập các chỉ số (i) tăng. Có nghĩa là nếu A chứa B thì i(A) <= i(B). Như vậy có thể nói rằng một cách phân lớp có chỉ số tương ứng một phép phân lớp có thứ tự phân tầng. Vấn đề đặt ra với mỗi thứ bậc H là nếu hai cá thể a,b được ghép vào một lớp trước c và d trong thuật toán phân lớp thì thính chất i(a,b) < i(c,d) có thoả mãn hay không. Nếu điều kiện này thoả mãn thì có thể mô tả H một cách tường minh, xác định. Ngược lại sẽ có nhiều H mô tả tương ứng với một phép chia lớp. b. Khoảng cách siêu Metric Mỗi thứ bậc H tương ứng với một chỉ số với khoảng cách giữa các phần tử của H: d(A,B) do mức độ kết hợp giữa A và B tức là chỉ số của bộ phận nhỏ nhất của H đồng thời chứa cả A và B. Khoảng cách này có tính chất: với mọi a,b,c. Tính chất này được gọi ;à tính chất siêu Metric. Thực tế tính chất siêu Metric được thể hiện như sau: trong lần đầu tiên a và b được nhóm với nhau có thể: Một là: một điểm c không còn được nhóm với a và cũng như vậy nó không được nhóm với b. Nó có thể được nhóm với (a,b) về sau, theo cách tính trên d(a,c) = d(b,c) và nói chung lớn hơn d(a,b). Hai là: điểm c được nhóm với a hoặc b trước (chẳng hạn nhóm với a) Thì d(a,c) lớn hơn d(a,b) nhưng d(b,c) = d(a,b) vì c và a cùng nhóm với b trong một lần. Có thể thấy rằng khoảng cách dạng này không thông thường và có những điều kiện rất lỏng. Tuy vậy trong thực tế có nhiều trường hợp khoảng cách dạng này cũng được sử dụng trong phân lớp. 2.3.2. Các độ đo kết h

Các file đính kèm theo tài liệu này:

  • doc28591.doc
Tài liệu liên quan