Analisis Kombinasi PSM-DID dengan Data Repeated Cross-sectional - Sekolah Statistics, Data and Technical Analytics

🔥 Jangan Lewatkan: Kelas IFLS Lanjutan Batch 8 🚀

Tanggal: 22 July 2026 | Investasi: Hanya 350k! 🌟

Gabung sekarang dan tingkatkan keterampilan Anda dengan praktisi terbaik! 📊💡

Pendahuluan

Dalam penelitian sosial dan kebijakan publik, salah satu tantangan utama adalah mengidentifikasi dampak kausal dari suatu perlakuan atau intervensi. Ketika data eksperimental tidak tersedia, metode Propensity Score Matching (PSM) dan Difference-in-Differences (DID) sering digunakan secara terpisah. Namun, kombinasi keduanya menjadi pendekatan yang sangat efektif, terutama untuk data repeated cross-sectional. Artikel ini membahas langkah-langkah penerapan kombinasi PSM-DID, keunggulannya, dan bagaimana metode ini dapat memberikan estimasi yang lebih akurat.

Konsep Dasar PSM-DID

Apa itu Propensity Score Matching (PSM)?

PSM adalah metode statistik yang digunakan untuk mencocokkan unit yang menerima perlakuan (treated) dengan unit yang tidak menerima perlakuan (control) berdasarkan probabilitas mendapatkan perlakuan (propensity score). Probabilitas ini dihitung dari variabel-variabel kovariat yang diamati. Tujuannya adalah untuk menciptakan kelompok treated dan control yang sebanding.

Apa itu Difference-in-Differences (DID)?

DID adalah metode evaluasi yang membandingkan perbedaan rata-rata hasil (outcome) antara kelompok treated dan control sebelum dan sesudah intervensi. Metode ini efektif untuk mengontrol heterogenitas yang tidak berubah seiring waktu, asalkan asumsi parallel trend terpenuhi.

Keunggulan Kombinasi PSM-DID

Mengapa Kombinasi PSM-DID Efektif untuk Data Non-eksperimental?

PSM membantu mengurangi bias seleksi dengan mencocokkan unit-unit berdasarkan probabilitas menerima perlakuan, sedangkan DID mengontrol faktor-faktor tetap yang tidak teramati. Kombinasi keduanya memberikan estimasi yang lebih robust, terutama ketika data panel tidak tersedia.

Pemahaman Data Repeated Cross-sectional

Apa Itu Data Repeated Cross-sectional?

Data repeated cross-sectional adalah data yang dikumpulkan pada waktu yang berbeda dengan sampel yang berbeda pula. Misalnya, survei yang dilakukan pada tahun 2018 dan 2020 dengan responden yang tidak sama.

Perbedaan Data Panel dan Repeated Cross-sectional

Berbeda dengan data panel yang melacak individu yang sama dari waktu ke waktu, data repeated cross-sectional hanya merepresentasikan populasi pada waktu tertentu. Oleh karena itu, analisis untuk data ini memerlukan pendekatan khusus seperti kombinasi PSM-DID.

Metodologi Kombinasi PSM-DID

Langkah-langkah Analisis

Estimasi Propensity Score

Langkah pertama adalah menghitung propensity score, yaitu probabilitas mendapatkan perlakuan berdasarkan variabel-variabel kovariat. Estimasi ini dapat dilakukan menggunakan regresi logistik atau probit.

Penerapan Kernel Matching

Kernel matching digunakan untuk mencocokkan unit treated dengan control menggunakan bobot yang dihitung dari propensity score. Teknik ini memastikan setiap unit treated memiliki pasangan yang relevan di kelompok control.

Estimasi Efek Perlakuan DID

Setelah mencocokkan data, DID diterapkan untuk menghitung perbedaan rata-rata hasil antara kelompok treated dan control sebelum dan sesudah perlakuan.

Pentingnya Parallel Trend Assumption

Validasi Asumsi Tren Paralel

Asumsi tren paralel menyatakan bahwa tanpa perlakuan, tren hasil antara kelompok treated dan control akan serupa. Validasi asumsi ini dapat dilakukan dengan membandingkan tren hasil sebelum perlakuan.

Implementasi dalam Software

Penggunaan Command `diff` di Stata

Syntax Dasar

Perintah diff pada Stata dirancang untuk menyederhanakan analisis PSM-DID. Berikut sintaks dasarnya:

Contoh Codingan:

1. Diff-in-Diff with no covariates.
We use the dataset form Card & Krueger (1994)*.

use "http://fmwww.bc.edu/repec/bocode/c/CardKrueger1994.dta"

diff fte, t(treated) p(t)

For bootstrapped std. err.:

diff fte, t(treated) p(t) bs rep(50)

2. Diff-in-Diff with covariates.

diff fte, t(treated) p(t) cov(bk kfc roys)
diff fte, t(treated) p(t) cov(bk kfc roys) report
diff fte, t(treated) p(t) cov(bk kfc roys) report bs

3. Kernel Propensity Score Diff-in-Diff.

diff fte, t(treated) p(t) cov(bk kfc roys) kernel id(id)
diff fte, t(treated) p(t) cov(bk kfc roys) kernel id(id) support
diff fte, t(treated) p(t) cov(bk kfc roys) kernel id(id) support addcov(wendys)
diff fte, t(treated) p(t) kernel id(id) ktype(gaussian) pscore(_ps)
diff fte, t(treated) p(t) kernel id(id) ktype(gaussian) pscore(_ps) bs reps(50)

3. Kernel Propensity Score Diff-in-Diff (Repeated Cross Section - rcs).

diff fte, t(treated) p(t) cov(bk kfc roys) kernel rcs
diff fte, t(treated) p(t) cov(bk kfc roys) kernel rcs support
diff fte, t(treated) p(t) cov(bk kfc roys) kernel rcs support addcov(wendys)
diff fte, t(treated) p(t) kernel rcs ktype(gaussian) pscore(_ps)
diff fte, t(treated) p(t) cov(bk kfc roys) kernel rcs support addcov(wendys) bs reps(50)

4. Quantile Diff-in-Diff.

diff fte, t(treated) p(t) qdid(0.25)
diff fte, t(treated) p(t) qdid(0.50)
diff fte, t(treated) p(t) qdid(0.75)
diff fte, t(treated) p(t) qdid(0.50) cov(bk kfc roys)
diff fte, t(treated) p(t) qdid(0.50) cov(bk kfc roys) kernel id(id)
diff fte, t(treated) p(t) qdid(0.50) cov(bk kfc roys) kernel rcs

5. Balancing test of covariates.

diff fte, t(treated) p(t) cov(bk kfc roys wendys) test
diff fte, t(treated) p(t) cov(bk kfc roys wendys) test id(id) kernel
diff fte, t(treated) p(t) cov(bk kfc roys wendys) test kernel rcs

6. Triple differences (consider bk is a second treatment category).

diff fte, t(treated) p(t) ddd(bk)

Artikel Blog Sekolah Stata di indeks Oleh Google Scholar

Akses Google Scholar

Opsi dan Parameter

Perintah ini dilengkapi dengan berbagai opsi seperti kernel untuk matching, cov() untuk memasukkan kovariat tambahan, dan test untuk menguji balancing covariates.

Studi Kasus Penggunaan `diff`

Sebagai contoh, penelitian Card dan Krueger (1994) menggunakan pendekatan ini untuk mengukur dampak kenaikan upah minimum terhadap tingkat pekerjaan di industri makanan cepat saji.

Efektivitas PSM-DID dalam Estimasi Perlakuan

Studi Empiris

Data dan Desain Penelitian

Deskripsi Data

Data yang digunakan mencakup survei dua periode (sebelum dan sesudah intervensi) dengan sampel berbeda. Variabel utama meliputi status perlakuan, hasil (outcome), dan kovariat.

Variabel Penelitian

Variabel independen: status treated.
Variabel dependen: hasil (misalnya, tingkat pekerjaan).
Kovariat: karakteristik demografis atau ekonomi.

Hasil Analisis

Efek Perlakuan pada Kelompok Treated

Hasil menunjukkan bahwa kelompok treated mengalami peningkatan signifikan pada hasil setelah perlakuan dibandingkan kelompok control.

Perbandingan Hasil dengan Pendekatan Lain

Kombinasi PSM-DID menghasilkan estimasi yang lebih akurat dibandingkan metode DID konvensional, terutama ketika data tidak seimbang.

Keunggulan dan Keterbatasan

Keunggulan Kombinasi PSM-DID

Mengurangi bias seleksi.
Mengontrol heterogenitas yang tidak teramati.
Cocok untuk data repeated cross-sectional.

Keterbatasan Metode

Bergantung pada asumsi tren paralel.
Membutuhkan proporsi yang cukup untuk matching.

Kesimpulan

Kombinasi PSM-DID adalah pendekatan yang kuat untuk mengestimasi efek perlakuan dalam penelitian non-eksperimental, terutama dengan data repeated cross-sectional. Metode ini menawarkan fleksibilitas dan akurasi yang lebih baik dibandingkan metode tradisional. Peneliti disarankan untuk mempertimbangkan validasi asumsi tren paralel dan melakukan pengujian balancing covariates untuk hasil yang lebih robust.

FAQ

1. Apa keunggulan utama PSM-DID dibanding metode lain?
Kombinasi ini mampu mengurangi bias seleksi sekaligus mengontrol heterogenitas yang tidak teramati, menghasilkan estimasi yang lebih akurat.

2. Bagaimana jika asumsi tren paralel tidak terpenuhi?
Peneliti dapat menggunakan metode alternatif seperti Synthetic Control atau memeriksa robustness hasil dengan sensitivitas analisis.

3. Apakah data cross-sectional biasa bisa digunakan?
Bisa, tetapi dengan pendekatan tambahan seperti repeated cross-sectional DID.

4. Apakah kombinasi PSM-DID kompleks untuk diterapkan?
Kompleksitasnya dapat diminimalkan dengan software seperti Stata yang menyediakan perintah khusus seperti diff.

5. Bagaimana cara menguji balancing covariates?
Gunakan uji balancing seperti t-test atau regresi untuk memastikan kovariat seimbang antara kelompok treated dan control sebelum perlakuan.

🔥 Jangan Lewatkan: Kelas IFLS Lanjutan Batch 8 🚀

Pelajari Biografi Pendiri Sekolah Stata

Pendahuluan

Konsep Dasar PSM-DID

Apa itu Propensity Score Matching (PSM)?

Apa itu Difference-in-Differences (DID)?

Keunggulan Kombinasi PSM-DID

Mengapa Kombinasi PSM-DID Efektif untuk Data Non-eksperimental?

Pemahaman Data Repeated Cross-sectional

Apa Itu Data Repeated Cross-sectional?

Perbedaan Data Panel dan Repeated Cross-sectional

Metodologi Kombinasi PSM-DID

Langkah-langkah Analisis

Estimasi Propensity Score

Penerapan Kernel Matching

Estimasi Efek Perlakuan DID

Pentingnya Parallel Trend Assumption

Validasi Asumsi Tren Paralel

Implementasi dalam Software

Penggunaan Command diff di Stata

Syntax Dasar

Artikel Blog Sekolah Stata di indeks Oleh Google Scholar

Opsi dan Parameter

Studi Kasus Penggunaan diff

Studi Empiris

Data dan Desain Penelitian

Deskripsi Data

Variabel Penelitian

Hasil Analisis

Efek Perlakuan pada Kelompok Treated

Perbandingan Hasil dengan Pendekatan Lain

Keunggulan dan Keterbatasan

Keunggulan Kombinasi PSM-DID

Keterbatasan Metode

Kesimpulan

FAQ

Penggunaan Command `diff` di Stata

Studi Kasus Penggunaan `diff`