PHÂN TÍCH PHƯƠNG SAI
BẰNG CÁC CÔNG CỤ CỦA SPSS
Phân tích phương sai một yếu tố
+ Các giả sử
+ Các so sánh cặp và kiểm định phạm vi
+ Sự so sánh tương phản
Phân tích phương sai một yếu tố với kiểm định
Levene
+ Thủ tục One-Way ANOVA
+ Các tuỳ chọn
+ Kiểm định Leveve về ngang bằng phương sai
(Test of Homogenneity of Variances)29
PHÂN TÍCH PHƯƠNG SAI
BẰNG CÁC CÔNG CỤ CỦA SPSS (TIẾP)
Một số thuật ngữ thường dùng trong một bảng Anova:
+ Sourse, Groups, Error, Total
+ Sum of Squares
+ Within – group sum of squares
+ Between – group sum of squares
+ Total sum of squares
+ Mean Square
+ Within groups mean squares
+ Between groups mean squares
+ Mean square total
77 trang |
Chia sẻ: trungkhoi17 | Lượt xem: 446 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Ứng dụng tin học trong kinh tế và quản trị kinh doanh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
định phương án tối ưu
3. ứng dụng Powerpoint trong thuyết trình các
báo cáo
3Yêu cầu đối với học viên
1. Có kiến thức của tin học
2. Kiến thức chuyên ngành
3. Tự học, nghiên cứu và sáng tạo đẻ nâng
cao trình độ
4. Sử dụng vào chuyên ngành
4ỨNG DỤNG PHẦN MỀM SPSS
TRONG KINH TẾ - XÃ HỘI
Tài liệu tham khảo:
2. SPSS Base 8.0 – Application Guide (Tác giả nước
ngoài)
3. ứng dụng SPSS for Windows để xử lý và phân
tích dữ kiện nghiên cứu. NXB khoa học & kỹ
thuật 1997
4. SPSS 8.0 – 9.0 ứng dụng trong phân tích dữ liệu
quản trị kinh doanh và khoa học tự nhiên – xã
hội. NXB GTVT 2000
5. ứng dụng SPSS FOR Windows để xử lý & phân
tích dữ kiện nghiên cứu( Võ Văn Huy và cộng
sự)- NHà xuất bản khoa học kỹ thuật
5KHAI THÁC PHẦN MỀM
SPSS
Nội dung:
I. Tổng quan về SPSS
II. Nhập dữ liệu
III. Thống kê mô tả, tính toán các chỉ tiêu
IV. Phân tích phương sai
V. Phân tích Hồi quy
VI. Xử lý dữ liệu khác
6I. TỔNG QUAN VỀ PHẦN MỀM SPSS
1.1. SPSS là gì ?
Phần mềm SPSS: viết tắt của Statistical Products for the
Social Services.
Trước đây chạy dưới môi trường DOS, từ Vesion 7.0
chạy được trên Windows, hiện nay đã có phiên bản
15.0
Cài đặt phần mềm SPSS:
+ Lưu ý đến license hoặc cdkey.
Giao diện SPSS trong Windows: (Hình sau)
7Giao diện phần mềm SPSS trong windows
8Các bộ phận của SPSS
+ SPSS Professional Statistics: Cung cấp dữ liệu dạng
không thích hợp với mô hình tuyến tính
+ SPSS Advanced Statistics: áp dụng cho nghiên cứu sinh
học và thí nghiệm
+ SPSS Tables: Xây dựng các báo cáo dạng biểu và các
trình bày của dữ liệu đa dạng
+ SPSS Trends: Thực hiện phép dự đoán và phân tích dãy
số thời gian.
9Các loại cửa sổ của SPSS
+ Data Editor (Hiệu đính dữ liệu): Thể hiện nội dung tệp
dữ liệu hiện hành
+ Viewer (Xem): Được mở ra tự động lần đầu để chứa kết
quả, bảng biểu
+ Draft: Chỉ có văn bản được thể hiện
+ Pivot Table Editor (Hiệu đính bảng trụ): Sửa đổi trong
bảng trụ kết quả
+ Chart Editor (Hiệu đính đồ thị):
+ Syntax Editor (Hiệu đính cú pháp): Lưu các mã lệnh, có
thể sửa chữa được.
+ Text Output Editor (Hiệu đính văn bản đầu ra).
+ Script Editor (Tự động hoá): Dùng cho lập trình nhỏ
10
Các của sổ của SPSS
Menu Bar: 10 trình đơn chính, đặc biệt là option trong Edit và
font trong View
Có thể tự tạo ra một menu cho chính mình nhờ công cụ
Utilities...Menu Editor...
Thanh công cụ ( Toolbar): có thể được thay đổi bằng
view...Toolbar, thêm vào bớt đi tuỳ ý.
Thanh tình trạng (Status bar):
Các hộp thoại
Di chuyển con trỏ trong tệp dữ liệu hiện hành: dùng chuột hoặc
bàn phím (các phím mũi tên, Page up, Page down)
+ Về đầu tệp: Ctrl + home
+ Về cuối tệp: Ctrl + end
+ Về đầu Case: home
+ Về cuối Case: end
11
TỔNG QUAN VỀ PHẦN MỀM SPSS
Chèn thêm biến, trường: bôi đen 1 dòng hoặc cột, bấm
phải chuột và chọn insert case hoặc insert variable.
Có thể sử dụng các thanh công cụ như word excel
Xoá biến, trường, tương tự, chọn clear hoặc phím
Delete trên bàn phím.
Dữ liệu dạng text luôn lệch về trái, dữ liệu số luôn lệch
về phải.
12
Một số thuật ngữ thường dùng trong
SPSS
1. Case (trường hợp, quan sát)
2. Khái niệm về biến:
Chính là đại diện cho một chỉ tiêu, một đại lượng nào đó, được ký hiệu bằng một
tên ngắn gọn, có thể tham gia vào quá trình tính toán, lưu trữ, có thể nhận
nhiều giá trị khác nhau.
Trong SPSS, biến được quy định bắt đầu bằng 8 ký tự (độ dài tối đa)
Đặt tên biến, Nhãn của biến , Giá trị biến, biến định tính, định lượng
3. Các loại thang đo cho biến
+ Thang đo định danh (Norminal): biểu hiện cùng loại của tiêu thức. Ví dụ giới
tính,
+ Thang đo thứ bậc (Ordinal): là thang đo định danh nhưng có phân ra thứ bậc
cao thấp. Ví dụ Huân chương hạng 1, 2, 3.
+ Thang đo khoảng (interval): Là thang đo thứ bậc có khoảng cách đều nhau, có
thể đánh giá sự khác biệt giữa các biến.
+ Thang đo tỷ lệ (Ratio- Scale): Để đo lường các biểu hiện của tiêu thức như các
đơn vị vật lý thông thường
13
BIẾN TRONG SPSS
Biến định tính:
Là những biến thường sử dụng thang đo là định danh
Nếu có mã hoá bằng số thì việc áp dụng các phép tính số học là không có ý nghĩa.
Thường nhận ít giá trị
Ví dụ:...
Biến định lượng
Là những biến có thể lượng hoá, có thể thang đo khoảng hoặc thang đo tỷ lệ
Thường nhận nhiều giá trị
Có thể áp dụng các tính toán, đặc biệt là các chỉ tiêu thống kê mô tả
Quan hệ giữa các biến định tính: ví dụ Dân tộc và trình độ hiểu biết...
Quan hệ giữa các biến định lượng: thường là khá phổ biến, ví dụ
Quan hệ giữa biến định tính & định lượng: ví dụ trình độ và thu nhập...
14
BIẾN TRONG SPSS
Biến độc lập, biến phụ thuộc
Biến độc lập (Independent): sự thay đổi của các biến khác không
làm ảnh hưởng tới nó. Có thể hoàn toàn độc lập hoặc liên quan ở
mức độ rất thấp
Biến phụ thuộc (Dependent): Sự thay đổi các biến có liên quan kéo
theo sự thay dổi của nó
Ví dụ: Các biến biểu thị lượng đạm, lân, kali... bón cho 1 sào lúa là
các biến độc lập; Biến NS lúa là phụ thuộc...
Xem các thông tin về biến trong SPSS:
+ Có thể xem trực tiếp ở cửa sổ Variable View hoặc
Utilities...Variable
15
BIẾN TRONG SPSS
Các thành phần cơ bản của biến trong SPSS:
+ Name: Tên của biến, không quá 8 ký tự, không dấu
+ Type: Kiểu của biến, có 8 kiểu khác nhau
+ Width: Độ rộng tối đa của cột chứa biến
+ Decimals: phần thập phân
+ Label: Nhãn của biến, là tên chỉ dẫn của biến
+ Value: giá trị của biến, dùng trong trường hợp mã hoá
+ Missing: Quy định cho trường hợp không có phương án trả lời
+ Column: Độ rộng cột hiện hành, có thể lớn hơn hoặc nhỏ hơn so
với độ rộng đặt ban đầu.
+ Align: Lề, kiểu String lệch trái, kiểu Numeric lệch phải
+ Measure: thang đo, có 4 loại thang đo như đã trình bày
16
SO SÁNH SPSS VÀ EXCEL
SPSS EXCEL
§iÓm m¹nh
- Qu¶n lý d÷ liÖu theo biÕn vµ
trêng, sè lîng kh«ng h¹n chÕ.
- ThuËn lîi vÒ m« t¶, ph©n tÝch
-Tèc ®é xö lý nhanh
- Cã thÓ lu l¹i có ph¸p lÖnh ®Ó
sö dông l¹i khi cÇn thiÕt.
-Ph©n tÝch, xö lý d÷ liÖu ë nhiÒu
cÊp ®é
-Ng«n ng÷ lËp tr×nh ®¬n gi¶n
-C¸c b¶ng tÝnh rÊt thuËn lîi cho
tÝnh to¸n sè häc th«ng thêng.
- Qu¶n lý d÷ liÖu theo dßng, cét,
®Þa chØ.
-NhiÒu hµm tÝnh to¸n rÊt thuËn
tiÖn
-NhËp d÷ liÖu trùc quan, thuËn
tiÖn
-Cã nhiÒu sheet trong 1 file
thuËn lîi cho viÖc kh©u nèi.
§iÓm yÕu
-Kh«ng cã b¶ng tÝnh
- Sö dông c¸c hµm tÝnh to¸n
kh«ng thuËn tiÖn
-Sè lîng cét h¹n chÕ (256)
- Kh«ng thuËn tiÖn trong ph©n tæ
d÷ liÖu
- Kh«ng lu ®îc có ph¸p lÖnh
-Ng«n ng÷ lËp tr×nh phøc t¹p.
17
SO SÁNH SPSS VÀ FOXPRO
So s¸nh SPSS Foxpro
§iÓm gièng
- Qu¶n lý d÷ liÖu theo biÕn vµ
trêng, sè lîng gÇn nh kh«ng
h¹n chÕ.
-Tèc ®é xö lý nhanh
- Cã thÓ lu l¹i có ph¸p lÖnh ®Ó
sö dông l¹i khi cÇn thiÕt.
-Ng«n ng÷ lËp tr×nh ®¬n gi¶n
- Qu¶n lý d÷ liÖu theo biÕn vµ tr-
êng, sè lîng gÇn nh kh«ng h¹n
chÕ.
- Tèc ®é xö lý nhanh
- Cã thÓ lu l¹i có ph¸p lÖnh ®Ó sö
dông l¹i khi cÇn thiÕt.
-Ng«n ng÷ lËp tr×nh ®¬n gi¶n
§iÓm kh¸c
- ThuËn lîi vÒ m« t¶, ph©n tÝch,
x©y dùng m« h×nh.
- Ph©n tÝch, xö lý d÷ liÖu ë
nhiÒu cÊp ®é
-Kh«ng thuËn lîi cho viÖc ph©n
tÝch thèng kª, x©y dùng m« h×nh.
-
18
Bài 2: Nhập và Quản lý dữ liệu trong spss
2.1. Mã hoá dữ liệu:
Đây là việc làm cần thiết, áp dụng cho các biến định tính. Ví dụ:...
Có thể việc mã hoá đã được quy định ngay từ đầu, ví dụ trình độ học vấn...
Có thể sau khi thu thập dữ liệu ta phải mã hoá lại, ví dụ các câu hỏi mở có nhiều
phương án, ta phải chọn 1 số phương án phổ biến, còn lại cho vào phương án
trả lời khác.
2.2. Nhập dữ liệu:Có nhiều cách nhập:
+ Nhập từ phần mềm Excel hoặc Foxpro, cần lưu ý đến tiêu đề các cột, vì sau này
chuyển qua SPSS sẽ trở thành các biến.
+ Nhập từ cửa sổ Data Editor: Vẫn phải quan tâm đến việc thiết kế các biến cho
phù hợp.
Ưu điểm: Dễ dàng nhập vào do giao diện thuận tiện.
Nhược điểm: Khi số lượng biến lớn, nhập các biến sau bị che khuất khó quan sát
toàn cảnh, dễ nhầm lẫn khó phát hiện.
19
2.3. Một số kỹ thuật thông dụng của
SPSS.13.0
2.3.1. Sort cases: chọn data/sort case
2.3.2. Select Cases chọn data/select case
2.3.3. Split File (Chia nhỏ các tệp)
2.3.4. Phép biến đổi hay tạo biến mới bằng tính toán ( Transformation)
transform / compute : dùng để tính cột ln(x)
transform/
2.3.5. Mã hoá lại biến (Recode)
2.3.6. Lập Bảng
20
2.3. Một số kỹ thuật thông dụng của
SPSS.13.0
analyzis / table/ basic table tạo lạpp bảng mới
summarier: tạo lập biến để cộng tổng
Down: chọn biến để vào hàm vd: giới
acrors chọn biến để vào cột. vd: taphuan
nếu cần tính thống kê gì thì chọn statistics.
tính tổng từng nhóm group, total: chọn vào total
sau đó tạo file đầu ra bảng spss:
yêu cầu cột gioitinh, hàng trinhdovanhoa. ô thu nhập. trồng lên một
lớp là một biến.
analyzis/ table / general/
across the top: trồng hàng theo cột
vd: vanhoa cho vào rows.thunhap vào row nếu tính % thì vào edit statistics.
chọn biến tổng kết: is summaries
đưa gioitinh vào cột
đưa biến xếp trồng lên nhau: layer. có thể tính toán các biến cộng tổng hay
biến khác....
21
2.3. Một số kỹ thuật thông dụng của
SPSS.13.0
Bảng tổng kết
Báo cáo theo cột:analyze/reports/ summaries in columms
tuoi mean thì sẽ chọn biến nam, nữ để cộng tổng. sau đó vào data colum (vào summary) chọn tất
cả các biến để cộng tổng các biến.
sau đó vào biến ngắt report option chọn display granda
Báo cáo theo hàng:
Báo cáo theo từng nhóm riêng: analyze/reports/ summaries
phân tích: analyze/dòng 2 / dòng 1 chọn frequencies: thể hiện tần số. chọn các biến có tần số lặp
nhiều lần thì nó sẽ có ý nghĩa thống kê. ta có thể chọn nhiều biến kết quả ta có các bảng tần
số.N là các quan sát có giá trị . valid số các tần số có giá trị. nhìn cột valid percent để biết
giá trị đúng. cumulative: tần số cộng dồn.
22
III. THỐNG KÊ MÔ TẢ, TÍNH TOÁN CÁC CHỈ
TIÊU
Tính toán các chỉ tiêu thống kê mô tả:
+ Sum :
+ Max
+ Min
+ Mean
+ Median
+ Frequency
(Dùng thủ tục: Descriptive từ Analyze/Descriptive Statitics/Descriptive): cho kết quả đầu ra là
đồ thị bảng, ...
(Chỉ dùng cho biến kiểu số)
Quatietle : chọn tứ phân vị
ý nghĩa số liệu thống kê kết xuất từ bảng.
chọn tính phân vị percentiles. ví dụ phân vị thứ 50 thì có 100% - 50% = 50% người có thu nhập
trên 550.000 đồng.
chọn histogram : để chọn hàm phân bố thống kê có tuân theo hàm phân phối chuẩn hay không.
23
III. THỐNG KÊ MÔ TẢ, TÍNH TOÁN CÁC CHỈ
TIÊU
ví dụ thực hành: tính tần suất, tần số của thu nhập, tập huấn của 2 nhóm nam và nữ
tính thống kê mô tả của biến theo giới. thu nhập, tứ phân vị, thấp nhất, cao nhất
ta sử dụng: split file. chọn giới đưa vào. sau đó vào Descriptive từ Analyze/Descriptive
Statitics/Descriptive . sau đó chọn, tick tất cả các yêu cầu với percentiles là 10 và 90
Descriptive từ Analyze/Descriptive Statitics/Explore: cho khám phá các số liệu lạ, để loại
bớt. cho biểu đồ mô tả số liệu bằng các đồ thị hình hộp.
Dependent list: chọn thu nhập: biến phụ thuộc
factor lish: biến độc lập nhóm gộp
label: là nhãn của factor
Descriptive từ Analyze/Descriptive Statitics/crosstas : mô tả quan hệ các biến, mối quan hệ 2
chiều
s
24
III. THỐNG KÊ MÔ TẢ, TÍNH TOÁN CÁC CHỈ
TIÊU
so sánh giữa các số trung bình.
kiểm định T –text: nghiên cứu thu nhập đến mức sống của người dân. kiểm định T 1 mấu so với
1 số kỳ vọng cho trước.
25
BẢNG TRỤ VÀ CÁC BÁO CÁO
Hiệu đính bảng trụ
+ Công cụ Pivot tables
+ Công cụ Pivot table Editor
Các báo cáo theo lớp, trang
+ Thủ tục OLAP Cube
+ Báo cáo tổng kết (Summary Report)
+ Phân tích kết quả
+ Ví dụ thực hành
26
IV. ĐỒ THỊ VÀ MỘT SỐ TIỆN TÍCH TRONG SPSS
Các loại đồ thị cơ bản trên SPSS
Cách tạo biểu đồ:
+ Hình thanh (Bar)
+ Hình tròn (Pie)
+ Diện tích (Area)
Hiệu chỉnh, bổ sung một đồ thị
Các khuôn mẫu đồ thị
Tính toán trên đồ thị
27
ĐỒ THỊ VÀ MỘT SỐ TIỆN TÍCH TRONG SPSS (TIẾP)
Liên kết đồ thị với các ứng dụng khác
Các tiêu đề cho trang kết quả
In ấn trong SPSS
28
V. PHÂN TÍCH PHƯƠNG SAI
BẰNG CÁC CÔNG CỤ CỦA SPSS
Phân tích phương sai một yếu tố
+ Các giả sử
+ Các so sánh cặp và kiểm định phạm vi
+ Sự so sánh tương phản
Phân tích phương sai một yếu tố với kiểm định
Levene
+ Thủ tục One-Way ANOVA
+ Các tuỳ chọn
+ Kiểm định Leveve về ngang bằng phương sai
(Test of Homogenneity of Variances)
29
PHÂN TÍCH PHƯƠNG SAI
BẰNG CÁC CÔNG CỤ CỦA SPSS (TIẾP)
Một số thuật ngữ thường dùng trong một bảng Anova:
+ Sourse, Groups, Error, Total
+ Sum of Squares
+ Within – group sum of squares
+ Between – group sum of squares
+ Total sum of squares
+ Mean Square
+ Within groups mean squares
+ Between groups mean squares
+ Mean square total
30
PHÂN TÍCH PHƯƠNG SAI
BẰNG CÁC CÔNG CỤ CỦA SPSS (TIẾP)
Các so sánh nhiều cặp và kiểm định phạm vi
+ Thủ tục One-Way ANOVA
+ Các lựa chọn:
Equal Variances Assumed
Multiple Comparions
* So sánh tương phản
31
PHÂN TÍCH PHƯƠNG SAI
BẰNG CÁC CÔNG CỤ CỦA SPSS (TIẾP)
Phân tích phương sai nhiều yếu tố tổng quát
(General Factorial Analysis of Variance)
+ Phân tích phương sai 2 yếu tố cùng cỡ mẫu
(Thủ tục GLM-General Factorial và các lựa chọn)
+ Kiểm tra tương tác giữa các chủ thể (Test of
Between – Subjects Effects)
* Phân tích phương sai biến đơn (Mô hình các ảnh
hưởng cố định: fix – effects model)
32
VI. PHÂN TÍCH HỒI QUY - TƯƠNG QUAN
BẰNG CÁC CÔNG CỤ CỦA SPSS
Thăm dò mối quan hệ, hệ số tương quan
Hệ số tương quan hạng
Tương quan cục bộ
Đo lường tương quan giữa 2 biến:
Các hệ số tương quan Pearson với các phương
pháp Pairwise và Listwise đối với dữ liệu không
đầy đủ:
+Thủ tục: Analysis ... Correlate...Bivariate và các
lựa chọn
33
PHÂN TÍCH HỒI QUY - TƯƠNG QUAN
BẰNG CÁC CÔNG CỤ CỦA SPSS (TIẾP)
Mô hình hồi quy tuyến tính giản đơn:
+ Mô hình giản đơn (Các hệ số, hệ số góc, hằng số,
cách tính)
+ Mô hình hồi quy bội
+ Phương pháp bình phương nhỏ nhất (OLS)
+ Vấn đề phi tuyến tính
+ Các số ngoại lai
+ Sự có mặt của các nhóm/tổ phụ không đồng nhất
+ Bảng ANOVA trong phân tích hồi quy
34
PHÂN TÍCH HỒI QUY - TƯƠNG QUAN
BẰNG CÁC CÔNG CỤ CỦA SPSS (TIẾP)
Thủ tục: Analyze...Regresion..Linear và các lựa
chọn.
+ Ví dụ và phân tích các kết quả:
Mô tả: Descriptive Statistics
Tương quan: Correlation
Tóm tắt Mô hình: Model Summary
Sai số chuẩn của ước lượng
Anova
+ Các hệ số: Coefficients
35
PHÂN TÍCH HỒI QUY - TƯƠNG QUAN
BẰNG CÁC CÔNG CỤ CỦA SPSS (TIẾP)
Thủ tục: Analyze...Regresion..Linear và các lựa
chọn cho phân tích hồi quy bội
+ Ví dụ và phân tích các kết quả:
Mô tả: Descriptive Statistics
Tương quan: Correlation
Tóm tắt Mô hình: Model Summary
Sai số chuẩn của ước lượng
Anova
+ Các hệ số: Coefficients
36
PHÂN TÍCH HỒI QUY - TƯƠNG QUAN
BẰNG CÁC CÔNG CỤ CỦA SPSS (TIẾP)
Lựa chọn các biến: Phương pháp loại bỏ dần:
+ Đưa dần vào (Forward selection)
+ Loại dần ra (Backward Elimintion)
+ Đưa vào – loại ra (Stepwise Selection)
+ Các tiêu chuẩn của loại bỏ biến
* Lựa chọn các biến: Phương pháp lựa chọn từng
bước
+ Các biến đưa ra (Exclude Variables)
+ Chẩn đoán cộng tuyến Collinearrity Diagnosstics
37
VII. XLDL VÀ THỰC HÀNH
Ôn tập, nhấn mạnh một số tính năng ưu
việt của SPSS
Xử lý dữ liệu
* Bài tập thực hành
* Các câu hỏi, trao đổi và giải đáp
* Kết thúc
38
XỬ LÝ DỮ LIỆU
Truy nhập dữ liệu
Kiểm tra dữ liệu
Tạo biến mới
Mã hóa biến
Thiết kế các bảng biểu:
+ Cấu trúc các bảng
+ Xác định các bảng giả định
+ Các bảng cơ bản (Basic tables)
+ Các bảng tổng hợp (General tables)
39
XỬ LÝ DỮ LIỆU
Thiết kế file SYNTAX
Chỉnh sửa file SYNTAX
Chạy chương trình
Tiếp tục kiểm tra dữ liệu.
Chạy lại chương trình
Chạy một phần
Chạy toàn bộ.
EXPORT sang EXCEL hoặc dạng khác
Chỉnh sửa file OUTPUT cho hợp lý
Copy sang WINWORD nếu cần
40
XỬ LÝ DỮ LIỆU
Thiết lập file dữ liệu
1. Lấy dữ liệu từ EXCEL
2. Tạo file dữ liệu mới
41
XỬ LÝ DỮ LIỆU
Gép file:
Trường hợp ghép biến:
MATCH FILES /FILE=*
/FILE='đường dẫn\tên file muốn ghép vào'.
EXECUTE.
42
XỬ LÝ DỮ LIỆU
Gép file:
Trường hợp ghép Case:
ADD FILES /FILE=*
/FILE='đường dẫn\tên file muốn ghép vào'.
EXECUTE.
43
XỬ LÝ DỮ LIỆU
Kiểm tra dữ liệu ban đầu
44
XỬ LÝ DỮ LIỆU
Lệnh Sort:
SORT CASES BY
x13 (A) .
45
XỬ LÝ DỮ LIỆU
Biến chạy:
- Khái niệm
- Tác dụng
- Ví dụ: HTX, huyện, tỉnh...
Các nhóm tuổi, các nhóm thu nhập, quy
mô...
46
XỬ LÝ DỮ LIỆU
Thống kê Mô tả:
descriptives
variables= Biến1 Biến 2
/statitics = mean min max stdev
variance. (kết thúc bằng .)
47
XỬ LÝ DỮ LIỆU
Tính tần số:
frequency Biến1 Biến 2.
48
Xử lý dữ liệu
Tạo biến mới:
COMPUTE Biến mới = Tính toán dựa trên
các biến cũ.
VARIABLE LABELS Biến mới 'Nhãn
biến’.
EXECUTE .
49
Xử lý dữ liệu
Mã hóa lại biến (phân tổ):
RECODE
Tên biến cần mã hóa
(0 thru K1=1) (k1 thru K2=2) (k2 thru
Highest=3) INTO Tên biến mới .
VARIABLE LABELS Tên biến mới ‘Nhãn
biến'.
EXECUTE .
50
XỬ LÝ DỮ LIỆU
Mã hóa lại biến (Tự động):
AUTORECODE
VARIABLES=Tên biến cũ /INTO tên biến mới
/PRINT.
Dùng trong trường hợp biến định tính, kiểu
STRING và chưa quy định Value
51
XỬ LÝ DỮ LIỆU
Chọn, lọc dữ liệu:
use all.
COMPUTE filter_$=(Tên biến = a).
FILTER BY filter_$.
EXECUTE .
52
XỬ LÝ DỮ LIỆU
Chấm dứt lọc dữ liệu:
FILTER OFF.
USE ALL.
EXECUTE .
53
XỬ LÝ DỮ LIỆU
Xây dựng bảng giả định
(Dummy Table):
+ Bảng cơ bản, đơn giản
+ Bảng tổng quát
+ Bảng bội: đếm số lượng, tần suất
54
XỬ LÝ DỮ LIỆU
Bảng cơ bản:
* Basic Tables.
VARIABLE LABELS Tên biến chạy.
TABLES
/OBSERVATION Biến cần tính
/TABLES Tên biến chạy
BY Biến cần tính
/STATISTICS
mean( ( F7.0 ))
maximum( ( F7.0 ))
/TITLE ‘Tên bảng'.
55
XỬ LÝ DỮ LIỆU
Bảng bội:
* Multiple Response Tables.
TABLES
/TABLE= Biến 1 +Biến 2 by Biến chạy
/STATISTICS
count( Biếnchạy( F5.0 ) 'Count')
cpct( Biếnchạy( F7.2 ) 'Column %' : Biếnchạy)
/TITLE ' Tên bảng '.
56
XỬ LÝ DỮ LIỆU
Bảng tổng hợp:
* General Tables.
TABLES
/OBSERVATION= Biến 1 Biến 2
/TABLE= Biến 1 + Biến 2 BY Biến chạy
/STATISTICS
mean(Biến 1( F7.2 ) '')
mean(Biến 2( F7.2 ) '')
/TITLE ‘Tên bảng'.
57
XỬ LÝ DỮ LIỆU
Thiết lập file SYNTAX
Chạy File SYNTAX
58
XỬ LÝ DỮ LIỆU
Xem lại file output
Phát hiện dữ liệu sai, nhầm...
59
XỬ LÝ DỮ LIỆU
Chạy lại file SYNTAX
Kết xuất sang Excel hoặc Winword
60
XỬ LÝ DỮ LIỆU
Một số bài tập thực hành
61
62
II. QUẢN LÝ DỮ LIỆU TRONG SPSS
Nguồn dữ liệu:
+ Dạng số:
+ Text:
Thu thập tài liệu:
- Tài liệu thứ cấp: Tài liệu có sẵn
- Tài liệu sơ cấp: Phải tổ chức đi điều tra, phỏng vấn
Thiết lập form điều tra: Phải căn cứ vào mục đích của việc phân tích và các
thông tin cần thiết để lập các bảng hỏi (questionare):
Kỹ thuật lập bảng hỏi: cần lưu ý một số loại câu hỏi:
+ Câu hỏi đóng: dạng câu hỏi có/không. Ví dụ
+ Câu hỏi mở: Dạng câu hỏi có nhiều cách trả lời khác nhau, người hỏi chưa liệt
kê ra trước
+ Câu hỏi tuyển: Chỉ có 1 lựa chọn trong số các lựa chọn đã được liệt kê ra trước.
+ Câu hỏi hội: có thể có nhiều lựa chọn trong số các lựa chọn đã được liệt kê.
63
QUẢN LÝ DỮ LIỆU TRONG SPSS
Có thể thiết kế 1 số mục cần thông tin dưới dạng bảng cho gọn.
Ví dụ thông tin về các thành viên trong gia đình, thông tin về các
thửa đất, các loại cây trồng...
Đối với các câu hỏi để lấy thông tin định lượng cần chú ý đến
đơn vị tính cho phù hợp:
Ví dụ: Năng suất cây trồng nên lấy đơn vị tích là kg/sào hoặc tạ/ha,
giá trị sản lượng nên lấy đơn vị là 1000đ...
Nên đề rõ đơn vị tính bên dưới các chỉ tiêu để người hỏi và tính
toán lại được thống nhất.
* Một số chỉ tiêu có thể được tính toán thông qua các chỉ tiêu khác
thì không cần thu thập ngay từ đầu. Ví dụ tổng diện tích các thửa
ruộng, tổng thu nhập...
64
PHẦN MỀM NHẬP DỮ LIỆU DE
+ Nhập dữ liệu từ phần mềm DE (Data Entry)
Một số vấn đề chính trong nhập dữ liệu từ phần mềm DE:
Đặt tên các biến: Đây là việc làm hết sức quan trọng và
tiên quyết. Cách đặt biến thuận lợi nhất là căn cứ vào
kết cấu của bảng hỏi, thứ tự các câu mà đặt, điều này sẽ
giúp cho người nhập và người xử lý được thuận lợi hơn,
dễ nhớ.
Quy trình tạo Form:
@ tạo File mới từ đầu: Từ cửa số của
DE.Shift+F2F4Đặt tên File (Không quá 8 ký tự,
không dấu, liền nhau).
@ Thoát khỏi DE, có ghi lại:
Shift+F2F3EnterEnterShift+F10.
65
PHẦN MỀM NHẬP DỮ LIỆU DE
@ Làm việc với File cũ: Từ cửa sổ của DEShift+F2F2 Gõ
tên FileEnter.
@ Tạo biến mới: Từ File hiện hànhShift+F4F2: Lần lượt đặt
tên biến và các thuộc tính của nó như nhãn, kiểu, độ dài, số thập
phân, Missing Cần hết sức lưu ý đến kiểu (String hay numeric
ngay từ đầu), kết thúc 1 việc đặt 1 biến bằng Ctrrl+F10.
@ Copy biến: từ danh sách biến mầu xanh, đưa con chỏ đến biến
cần copy bấm F4, bản tạo biến màu đỏ sẽ hiện ra, ta gõ tên biến
mới vào.
@ Quy định giá trị cho nhãn biến: Đưa con chỏ đến biến cần đặt,
bấm F5, bảng màu đỏ sẽ hiện ra, lần lượt gõ các giá trị quy định
vào, sau mối thao tác đều gõ Enter, kết thúc gõ Ctrl+F10.
66
PHẦN MỀM NHẬP DỮ LIỆU DE
@ Copy nhãn biến: Từ bảng liệt kê biến màu xanh, đưa con chỏ đến
biến được cần copy, nhấn F6, di chuyển đến biến được copy,
nhấn Enter.
@ Xoá biến: từ danh sách biến màu xanh, đưa con chỏ đến biến cần
xoá, nhấn F9chọn YEnter.
@ Khống chế phạm vi giá trị của biến: Bấm Shift+F6F2, đưa con
chỏ đến biến cần tạo vùng rồi Enter, ta đánh các giá trị biến cách
nhau bằng các dấu phảy, kết thúc là dấu chấm.
Trong trường hợp giới hạn là 1 khoảng ta dùng Thru.
Ví dụ: 1 thru 10.
Kết thúc bấm Ctrl+F10
Nếu muốn copy khai báo này đến biến khác, ta chuyển con trỏ đến
biến này, bấm F7, di đến biến được copy bấm Ctrl+F10.
67
PHẦN MỀM NHẬP DỮ LIỆU DE
@ Tạo bước nhảy: ấn Shift+F7F2, một bản các biến màu đỏ hiện
ra, di chuyển con trở đến biến cần tạo rồi Enter, bảng khung đỏ
xuất hiện, ta dùng lệnh:
IF (tên biến = Giá trị nào không trả lời câu sau) tên biến
Có thể copy việc tạo này đến các biến khác nhờ F7 di chuyển đến
biến được copy, Enter để hiệu chỉnh rồi chọn Ctrrl+f10.
@ Làm việc với Form: Form là khuôn mẫu giúp cho việc nhập số
liệu được dễ dàng, thuận lợi, Form phải được thiết kế hoàn toàn
phù hợp với bảng câu hỏi.
Dùng Shift+F3, menu sẽ hiện lên, muốn tạo Form giống bảng hỏi,
theo trật tự các biến, ta nhấn Space hoặc chon No rồi Enter.
Muốn tạo Form không theo trật tự biến được thiết lập, sau khi nhấn
Shift+F3 ta chọn f2 hoặc chọn yes từ hộp thoại hỏi màu đỏ nổi
lên.
68
PHẦN MỀM NHẬP DỮ LIỆU DE
Trong trường hợp trong Form có một vài vị trí không phù hợp với
bảng hỏi (các biến được tạo ra không đúng trật tự), ta nên đặt con
trở ở vị trí đúng, tạo cho nó 1 khoảng trống 2 dòng, đưa con trở
đến đầu biến cần move đi, bấm F7phím mũi tên sang
phải+xuống dướiEnter, đưa con trở lên khoảng
trốngCtrl+F10, sau đó chỉnh sửa lại.
Đưa con trỏ vào vị trí biến mớiF8, bảng màu đỏ hiện lên, ta dùng
phím mũi tên lê xuống để dịch biến cho đúng vị trí theo ý của ta
trong form.
Lưu ý: Form mới là quyết định cho việc nhập dữ liệu.
@ Nhập dữ liệu: Shift+F5F6, sau đó nhập tuần tự hết case này
đến case khác.
69
NHỮNG ƯU, NHƯỢC CỦA DE
Ưu điểm:
- Màn hình nhập chuyên dụng, đỡ mỏi mắt
- Có thể sơ bộ kiểm tra được dữ liệu
- Có thể chuyển qua câu hỏi khác (tạo bước nhảy) một cách nhanh
chóng..
Nhược điểm:
+ Thiết kế form khá lâu
+ Thao tác không thuận tiện
+ Quản lý biến nghiêm ngặt, khó khăn trong thay đổi vị trí, xóa.
+ Không gõ được nhãn bằng tiếng Việt
70
QUẢN LÝ DỮ LIỆU TRONG SPSS (TIẾP)
Định nghĩa biến
Lưu dữ liệu
Nhập nhãn cho biến
Mô tả giá trị khiếm khuyết
Tạo kiểu biến chung
Tạo định dạng mẫu
Sử dụng khuôn mẫu
71
QUẢN LÝ DỮ LIỆU TRONG SPSS (TIẾP)
Chọn dữ liệu:
+ Mẫu ngẫu nhiên: Thủ tục Select case
Mã hoá lại biến:
+ Sự cần thiết:
+ Thao tác
Tạo biến mới
+ Tạo biến mới không điều kiện
+ Tạo biến mới thoả điều kiện
72
QUẢN LÝ DỮ LIỆU TRONG SPSS (TIẾP)
Truy xuất dữ liệu:
+ Dữ liệu ASCII
+ Dữ liệu từ bảng tính Excel
+ Dữ liệu từ Foxpro
Tách tệp
Nối tệp
In dữ liệu
73
IV. KIỂM ĐỊNH GIẢ THIẾT TRONG PHÂN TÍCH
THỐNG KÊ BẰNG CÁC CÔNG CỤ CỦA SPSS
Sử dụng thủ tục T Test để so sánh các số trung
bình
+ Mẫu và dung lượng mẫu
+ Khái niệm về kiểm định
+ Độ tin cậy
+ Khoảng tin cậy
+ Bậc tự do
+ Giả thiết, đối thiết
+ Ôn lại một số công thức tính toán:
74
KIỂM ĐỊNH GIẢ THIẾT TRONG PHÂN TÍCH THỐNG
KÊ BẰNG CÁC CÔNG CỤ CỦA SPSS (TIẾP)
Kiểm định t 2 mẫu với một biến dạng mã số
không có thứ bậc:
+ Thủ tục Indipendent – sample T Test
Kiểm định T hai mẫu với biến dạng chuỗi:
+ Thủ tục Indipendent – sample T Test
+ Pivot, Transpose Rows and Columns
+ Một vài nhận xét
75
KIỂM ĐỊNH GIẢ THIẾT TRONG PHÂN TÍCH THỐNG
KÊ BẰNG CÁC CÔNG CỤ CỦA SPSS (TIẾP)
Kiểm định t 2 mẫu sử dụng một điểm giới hạn
để lập các nhóm/tổ
+ Thủ tục Indipendent – sample T Test
+ Cut point
+ Exclude cases listwise
Kiểm định T so sánh cặp:
+ Paires Samples Statitics
+ Paires Samples Correlation
+ Paired Samples Test
76
KIỂM ĐỊNH GIẢ THIẾT TRONG PHÂN TÍCH THỐNG
KÊ BẰNG CÁC CÔNG CỤ CỦA SPSS (TIẾ
Các file đính kèm theo tài liệu này:
- bai_giang_ung_dung_tin_hoc_trong_kinh_te_va_quan_tri_kinh_do.pdf