Nhóm khoa học công nghệ qtkd hỗ trợ spss giới thiệu bài giảng phân tích biệt thức của Th.s phle hong nhung, mời các bạn chú ý
Phân tích biệt thức là gì?
Phân tích phân biệt được sử dụng để giải quyết một số tình huống mà nhà nghiên cứu muốn tìm ra sự khác biệt giữa các nhóm nghiên cứu như phân biệt khách hàng trung thành và không trung thành theo một số đặc điểm nhân khẩu học, phân biệt nhóm khách hàng theo một số tiêu chí lợi ích khi sử dụng sản phẩm……
Điều kiện để phân tích biệt thức là phải có biến phụ thuộc (biến dùng để phân loại đối tượng, thường theo thang thứ tự hoặc thang danh nghĩa) và một số biến độc lập (đặc trưng). Được sử dụng để phân tích sự khác biệt giữa các nhóm đối tượng, thường sử dụng thang đo khoảng hoặc tỷ lệ). Phân tích phân biệt có thể làm như sau:
– Xây dựng hàm phân biệt phân biệt rõ biểu thức của biến phụ thuộc.
– Nghiên cứu xem có sự khác biệt có ý nghĩa thống kê giữa các nhóm khi xem xét các yếu tố độc lập hay không.
—Xác định biến độc lập là nguyên nhân chính gây ra sự khác biệt giữa các nhóm.
Có 2 trường hợp phân tích biệt thức: phân tích biệt lập 2 nhóm (khi biến phụ thuộc có 2 biểu thức), phân tích gấp (khi biến phụ thuộc có từ 3 biểu thức trở lên).
Đánh giá ví dụ
Khi phân tích lợi nhuận của nông dân tham gia làng nghề, các nhà nghiên cứu chia họ thành hai loại: nông dân có lợi nhuận (profit > 0) và nông dân không có lợi nhuận (ln ≤ 0). Các nhà nghiên cứu muốn xem xét sự khác biệt giữa hai nhóm hộ có lợi nhuận trên ở các yếu tố: tuổi, số năm kinh nghiệm, vốn, số lao động, số lượng hàng hóa, tính chất làng nghề (1-đồng ý, 0-không đồng ý). ), bản chất của các hoạt động gia đình (1 -gia đình chuyên nghiệp, 0-gia đình bán thời gian).
Thực hành phân tích biệt thức trên spss
Bước đầu tiên là chia mẫu quan sát thành hai phần
Đối với phân tích phân biệt ta phải chia mẫu quan sát thành 2 phần: mẫu ước lượng hoặc mẫu phân tích (phần dùng để ước lượng hàm phân biệt); phần còn lại là kiểm tra tính đúng đắn của hàm phân biệt (mẫu kiểm tra). ). Khi cỡ mẫu đủ lớn có thể chia thành 2 phần bằng nhau, tỷ lệ với toàn bộ mẫu.
Ví dụ: Trong ví dụ trên, cỡ mẫu là 122 mẫu (66 mẫu không có ln – 54% và 56 mẫu có ln – 46%). Chúng tôi chia làm 2 phần, mỗi phần gồm 61 mẫu: 33 mẫu không có ln và 28 mẫu có ln.
bước 2. Phân tích khả năng phân biệt của sp
Vào phân tích->phân loại->phân biệt, xuất hiện hộp thoại sau:
– Đặt biến phân loại 2 nhóm hộ có tỷ lệ khác nhau vào ô phân nhóm biến -> khai báo khoảng xác định (1 là hộ có tn, 0 là hộ không có tn) -> tiếp tục.
– Đặt các biến độc lập vào hộp biến độc lập.
– Xác định biến quan sát cần phân tích, khảo sát trong ô Chọn biến. Giá trị sẽ được khai báo tiếp theo. Khi chia mẫu ở bước đầu ta đã mã hóa nhóm phân tích là 1 và nhóm kiểm tra là 0 nên ta điền số 1 vào ô biến lựa chọn. -> tiếp tục.
– Tiếp theo chọn nút Statistics và khai báo như sau: Means, ANOVA, Correlation Matrix and Covariance…
– Sau đó chọn nút Chuyên mục và khai báo chuyên mục như sau ->Tiếp tục
·in the box previous probabilities: xác suất dùng để phân biệt các đối tượng. Có hai cách xác định: xác suất bình đẳng giữa các nhóm (tất cả các nhóm đều bình đẳng), xác suất theo tỷ lệ hoặc quy mô nhóm (tính từ quy mô nhóm).
Hiển thị: Hiển thị kết quả chi tiết (case khôn ngoan kết quả) cho mỗi lần quan sát, và tóm tắt bảng kết quả phân biệt (summary table).
· Sử dụng ma trận hiệp phương sai: Phân biệt các quan sát bằng ma trận hiệp phương sai trong nhóm hoặc theo ma trận hiệp phương sai theo từng nhóm.
· vẽ ô: vẽ ô chung cho các nhóm hoặc ô riêng cho từng nhóm và vị trí ô.
Diễn giải kết quả phân tích biệt thức
– Bảng kiểm tra bình đẳng trung bình nhóm
Nếu xét riêng rẽ thì chỉ xét tính chất hoạt động của hộ (chuyên hay hộ), số lượng hàng hóa, vốn cố định và đặc điểm của làng nghề (được công nhận và không được công nhận). và các gia đình phi lợi nhuận.
Kiểm tra tính bình đẳng của phương tiện nhóm
Lambda của Wilkes
f
df1
df2
tín hiệu.
Tuổi
.999
.071
1
59
.791
Nam Goldham
.998
.138
1
59
.712
Đặc điểm gia đình
.862
9,437
1
59
.003
Đang chuyển dạ
.975
1.496
1
59
.226
Sô-ma-đăng
.923
4.925
1
59
.030
von co dinh (1000d)
.922
4.988
1
59
.029
von luu dong (1000d)
.962
2.322
1
59
.133
Nghe trò chuyện
.721
22,785
1
59
.000
– giá trị tính năng của bảng. Vì chỉ có 2 nhóm trong trường hợp này (có lợi nhuận và không có lợi nhuận) nên chỉ có thể đánh giá 1 hàm phân biệt. Giá trị riêng là 0,858, chiếm 100% phương sai nhân quả. Hệ số tương quan chính tắc tương ứng là 0,680 cho thấy mô hình giải thích được 46% phương sai của biến phụ thuộc (lợi nhuận). (hệ số bình phương 0,680 = 0,46 = 46%).
Giá trị bản địa
Chức năng
Giá trị riêng
% thay doi
Phần trăm tích lũy
Tương quan chính tắc
1
.858a
100,0
100,0
.680
A. Hàm phân biệt chính tắc top 1 đã được sử dụng trong phân tích.
-next sẽ xác định xem hàm phân biệt ước tính có ý nghĩa thống kê hay không. Với hệ số wilk l là 0,538 và giá trị p là 0,000 thấp hơn nhiều so với mức ý nghĩa 5%, có thể kết luận rằng sự khác biệt có ý nghĩa thống kê ở mức 5% và có thể giải thích được. kết quả
Lambda của Wilkes
Thử nghiệm chức năng
Lambda của Wilkes
Chi bình phương
df
tín hiệu.
1
.538
34,068
8
.000
– Kết quả được giải thích chi tiết bên dưới:
Tầm quan trọng của các biến được biểu thị bằng độ lớn tuyệt đối của các hệ số đã chuẩn hóa (Bảng Hệ số hàm phân biệt chính tắc chuẩn hóa). Giá trị tuyệt đối của hệ số chuẩn hóa càng cao thì đóng góp vào khả năng phân biệt của hàm càng lớn. Hoặc bạn có thể xem xét điều này trong một bảng ma trận cấu trúc, trong đó tác động của các biến được sắp xếp theo thứ tự giảm dần.
Hệ số chức năng phân biệt chính tắc được chuẩn hóa
Chức năng
1
Tuổi
.147
Nam Goldham
.316
Đặc điểm gia đình
.551
Đang chuyển dạ
.105
Sô-ma-đăng
.229
von co dinh (1000d)
.464
von luu dong (1000d)
.197
Nghe trò chuyện
.816
Từ kết quả, chúng tôi thấy rằng biến hoạt động hộ gia đình là yếu tố dự báo lợi nhuận quan trọng nhất để phân biệt hai nhóm, tiếp theo là các biến Làng nghề, Vốn cố định và Số lượng hàng hóa.
Dấu hệ số của các biến dự báo đều dương chứng tỏ nông dân tham gia xác định làng nghề, nông dân sản xuất chuyên môn hóa, vốn cố định và vốn lưu động càng cao thì số lượng hàng hóa bán ra càng nhiều. . , tổng lực lượng lao động càng nhiều, kinh nghiệm, tuổi của chủ hộ càng cao thì lợi nhuận của gia đình càng cao.
– Đánh giá hàm phân biệt bằng mẫu thử.
Bảng Kết quả phân loại hiển thị kết quả phân loại dựa trên các mẫu được phân tích. Tỷ lệ phân biệt đúng là (26+22)/61 = 0,787 = 78,7%, được tính toán dựa trên mẫu do nhà nghiên cứu lựa chọn. Để kiểm tra tính đúng đắn của hàm phân biệt ước lượng, chúng ta phải thực hiện kiểm định trên các mẫu được chọn ngẫu nhiên. Tỷ lệ này là (16+19)/61 = 0,574 = 57,4%. Có thể kết luận rằng mô hình phân biệt đối xử này là khá tốt.
Kết quả phân loại a, b
1 cao – 0 muỗng cà phê
Thành viên nhóm dự báo
Tổng
0
1
lựa chọn trường hợp
Bản gốc
đếm
0
26
7
33
1
6
22
28
%
0
78,8
21.2
100,0
1
21,4
78,6
100,0
trường hợp không được chọn
Bản gốc
đếm
0
16
17
33
1
9
19
28
%
0
48,5
51,5
100,0
1
32.1
67,9
100,0
A. 78,7% các trường hợp được nhóm ban đầu được chọn đã được phân loại chính xác.
57,4% trường hợp nhóm ban đầu không được chọn đã được phân loại chính xác.
để phân tích biệt thức trong khi giải thích ý nghĩa một cách chi tiết. Liên hệ với nhóm nếu bạn cần hỗ trợ thực hiện công việc, xử lý dữ liệu của mình.
Liên hệ:
-Zalo/Viber qua số điện thoại
-facebook: http://facebook.com/hoidapsps/
-email: hotrosspss@gmail.com