Dữ liệu bảng Panel Data là gì – Phân Tích Stata

Nhóm hỗ trợ dữ liệu giúp bạn hiểu khái niệm về dữ liệu dạng bảng với hình ảnh ở trên. dữ liệu bảng là sự kết hợp của dữ liệu mặt cắt ngang và dữ liệu chuỗi thời gian. chuỗi thời gian ở đây là 4 năm 2014 2015 2016 2017. dữ liệu được lấy chéo ở đây là 3 tên quốc gia: vietnam, thailand, malaysia. vì vậy bảng này có 3 × 4 = 12 hàng quan sát. đây là định nghĩa đơn giản và dễ hiểu nhất về dữ liệu bảng. (Lưu ý rằng số liệu GDP và dân số chỉ mang tính minh họa cho dữ liệu bảng, không chính xác.) Tóm lại, dữ liệu bảng có cả quy mô không gian và thời gian.

Dữ liệu bảng điều khiển còn được gọi bằng các tên khác, chẳng hạn như dữ liệu tổng hợp (kết hợp các quan sát mặt cắt và chuỗi thời gian), là sự kết hợp của dữ liệu mặt cắt và chuỗi thời gian, dữ liệu bảng điều khiển vi mô, dữ liệu bảng điều khiển vi mô , dữ liệu dọc (nghĩa là một số nghiên cứu theo thời gian của một biến số hoặc một nhóm đối tượng), phân tích các sự kiện lịch sử (ví dụ: nghiên cứu sự thay đổi theo thời gian của các đối tượng thông qua các trạng thái hoặc điều kiện tiếp tục theo thời gian), phân tích thuần tập. Mặc dù có những biến thể tinh tế, tất cả những tên gọi này đều đề cập đến sự biến đổi theo thời gian của các đơn vị được gạch chéo. do đó, chúng tôi sẽ sử dụng thuật ngữ bảng dữ liệu theo nghĩa chung để bao gồm một hoặc nhiều thuật ngữ ở trên. và chúng tôi sẽ gọi chúng là mô hình hồi quy theo hướng dữ liệu là mô hình hồi quy dữ liệu bảng điều khiển.

ưu điểm của dữ liệu bảng so với dữ liệu chéo hoặc chuỗi thời gian 1. bởi vì dữ liệu bảng liên quan đến con người, công ty, tiểu bang, quốc gia, v.v. theo thời gian, có thể có sự không đồng nhất trong các đơn vị này. các kỹ thuật ước tính dựa trên dữ liệu bảng có thể giải thích rõ ràng cho sự không đồng nhất như vậy bằng cách bao gồm các biến cụ thể riêng lẻ, như chúng tôi sắp trình bày. chúng tôi sử dụng thuật ngữ cá nhân ở đây theo nghĩa chung nhất để bao gồm các đơn vị nhỏ như cá nhân, công ty, tiểu bang và quốc gia. 2. Bằng cách kết hợp chuỗi thời gian của các quan sát chéo, dữ liệu bảng cung cấp cho chúng ta “dữ liệu hữu ích hơn, nhiều biến đổi hơn, ít đa cộng tuyến hơn giữa các biến, nhiều bậc tự do hơn và hiệu quả cao hơn”. 3. Khi nghiên cứu việc quan sát lặp lại các đơn vị chéo, dữ liệu bảng thích hợp hơn để nghiên cứu các động lực thay đổi theo thời gian của các đơn vị chéo này. Các tác động của thất nghiệp, thay đổi công việc và di chuyển việc làm được nghiên cứu tốt nhất khi có dữ liệu bảng điều khiển. 4. Dữ liệu bảng điều khiển có thể phát hiện và đo lường tốt hơn các hiệu ứng không thể quan sát được trong chuỗi thời gian thuần túy hoặc dữ liệu mặt cắt. Ví dụ, tác động của luật lương tối thiểu đối với việc làm và thu nhập có thể được nghiên cứu tốt nhất bằng cách bao gồm các đợt tăng lương tối thiểu liên tiếp ở các tiểu bang và / hoặc mức lương tối thiểu của liên bang. 5. dữ liệu bảng cho phép nghiên cứu các mẫu hành vi phức tạp hơn. ví dụ: chúng tôi có thể đối phó tốt hơn với các hiện tượng dữ liệu bảng, chẳng hạn như tính kinh tế theo quy mô và thay đổi công nghệ, hơn là dữ liệu theo mặt cắt ngang hoặc chuỗi thời gian. 6. Bằng cách cung cấp dữ liệu cho vài nghìn đơn vị, dữ liệu bảng có thể giảm thiểu sự sai lệch có thể xảy ra nếu chúng ta nhóm các cá nhân hoặc công ty theo các biến có tổng số phù hợp cao. Tóm lại, dữ liệu bảng có thể làm phong phú thêm phân tích thực nghiệm so với cách chúng ta chỉ sử dụng dữ liệu mặt cắt hoặc dữ liệu chuỗi thời gian.

Hai kỹ thuật nổi bật để xử lý dữ liệu bảng là Mô hình Hiệu ứng Cố định (FEM) và Mô hình Hiệu ứng Ngẫu nhiên (REM) hoặc Mô hình Thành phần Lỗi (ECM).

ở fem , độ dốc trong mô hình hồi quy được phép thay đổi giữa các cá nhân do nhận thấy thực tế là mỗi đơn vị hoặc cá thể lai có thể có một số đặc điểm riêng để phân biệt nó. để giải thích cho các tọa độ gốc khác nhau, có thể sử dụng các biến giả. fem sử dụng các biến giả được gọi là mô hình biến giả bình phương nhỏ nhất (lsdv). emf thích hợp trong các tình huống mà các gradient riêng lẻ cụ thể có thể tương quan với một hoặc nhiều bộ hồi quy độc lập. Một nhược điểm của lsdv là nó sử dụng nhiều bậc tự do khi số đường chéo duy nhất, n, rất lớn. trong trường hợp này, chúng ta sẽ phải bao gồm n biến giả (nhưng hạn chế thuật ngữ chặn chung). một giải pháp thay thế cho fem là rem . trong rem, nguồn gốc của một đơn vị riêng lẻ được giả định là được lấy ngẫu nhiên từ một tổng thể lớn hơn nhiều, với giá trị trung bình không đổi. thì độ dốc của cá nhân được biểu thị bằng độ lệch so với giá trị trung bình không đổi này. Một ưu điểm của rem so với emf là nó tiết kiệm bậc tự do, bởi vì chúng ta không phải ước tính n gốc chéo. chúng ta chỉ cần ước tính giá trị trung bình của điểm gốc và phương sai của nó. rem thích hợp trong các tình huống mà gốc (ngẫu nhiên) của mỗi đơn vị chéo không tương quan với các bộ hồi quy độc lập. lựa chọn mô hình

Để chọn giữa ols và fem, hãy chạy kiểm tra f. phép thử f kiểm tra xem các hiệu ứng cố định = 0 hay không. nếu giá trị p <5%, bác bỏ giả thuyết rỗng h0 (h0: hiệu ứng cố định = 0), sau đó sử dụng kiểm định hausman so sánh để chọn emf và rem.

Phần trước đã giới thiệu khái niệm cơ bản về bảng điều khiển, nếu bạn cần trợ giúp giải đáp thắc mắc, vui lòng liên hệ với nhóm tại đây. https://phantichstata.com/lien-he-gioi-thieu

tệp hướng dẫn chương trình nền kinh tế fullbright: mpp03-521-r22v-2012-02-10-10300799.pdf

Related Articles

Back to top button