🔥 Jangan Lewatkan: Kelas Google Earth Engine Batch 8 🚀
Tanggal: 06 June 2026 | Investasi: Hanya 350k! 🌟
Gabung sekarang dan tingkatkan keterampilan Anda dengan praktisi terbaik! 📊💡 Daftar Sekarang 🔗Pendahuluan
Analisis regresi adalah salah satu metode statistik yang paling umum digunakan untuk menganalisis hubungan antara satu atau lebih variabel independen dengan variabel dependen. Namun, dalam beberapa kasus, kita ingin menganalisis bagaimana faktor-faktor tertentu mempengaruhi kemungkinan suatu peristiwa terjadi atau tidak. Dalam hal ini, analisis logit dan probit adalah pilihan yang tepat. Dalam tutorial ini, kita akan mempelajari cara melakukan analisis logit dan probit dengan menggunakan bahasa pemrograman Python.
Pengertian Analisis Logit dan Probit
Analisis logit dan probit adalah teknik analisis statistik yang digunakan untuk menganalisis hubungan antara variabel independen dan variabel biner. Variabel biner adalah variabel yang hanya memiliki dua nilai, yaitu 0 atau 1. Analisis logit dan probit digunakan untuk mengestimasi kemungkinan suatu peristiwa terjadi atau tidak terjadi. Kedua teknik ini sangat mirip, tetapi probit lebih jarang digunakan.
Persiapan Data
Sebelum kita melakukan analisis logit atau probit, kita perlu menyiapkan data. Data yang kita gunakan dalam tutorial ini adalah data tentang kinerja siswa dalam ujian matematika. Kita akan menggunakan variabel “Kelamin”, “Umur”, dan “Jumlah Jam Belajar” sebagai variabel independen dan variabel “Lulus/Tidak Lulus” sebagai variabel dependen.
Instalasi Paket
Pertama-tama, kita perlu menginstal paket “statsmodels” dan “pandas”. Kita dapat melakukannya dengan menjalankan perintah berikut di command prompt:
pip install statsmodels
pip install pandas
Analisis Logit
Langkah 1: Mengimpor Data
Kita mulai dengan mengimpor data dari file CSV menggunakan pandas. Berikut adalah kode untuk mengimpor data:
import pandas as pd data = pd.read_csv("data.csv")
Langkah 2: Mempersiapkan Data
Selanjutnya, kita mempersiapkan data untuk analisis logit. Kita membagi data menjadi data latih dan data uji dengan menggunakan train_test_split dari scikit-learn. Kode untuk mempersiapkan data adalah sebagai berikut:
from sklearn.model_selection import train_test_split X = data[["Kelamin", "Umur", "Jumlah Jam Belajar"]] y = data["Lulus/Tidak Lulus"] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
Langkah 3: Membuat Model Logit
Setelah mempersiapkan data, kita membuat model logit dengan menggunakan Logit dari statsmodels. Kode untuk membuat model logit adalah sebagai berikut:
import statsmodels.api as sm X_train = sm.add_constant(X_train) logit_model = sm.Logit(y_train, X_train) result = logit_model.fit()
Langkah 4: Melakukan Prediksi dan Evaluasi
Setelah membuat model logit, kita melakukan prediksi pada data uji dan mengevaluasi model. Kode untuk melakukan prediksi dan evaluasi adalah sebagai berikut:
from sklearn.metrics import classification_report X_test = sm.add_constant(X_test) y_pred = result.predict(X_test) y_pred_binary = [1 if x > 0.5 else 0 for x in y_pred] print(classification_report(y_test, y_pred_binary))
Output dari kode di atas adalah laporan klasifikasi yang berisi akurasi, presisi, recall, dan f1-score. Laporan klasifikasi ini akan membantu kita dalam mengevaluasi performa model.
Artikel Blog Sekolah Stata di indeks Oleh Google Scholar
Akses Google Scholar
Analisis Probit
Langkah 1: Mengimpor Data
Seperti pada analisis logit, kita mulai dengan mengimpor data dari file CSV menggunakan pandas. Berikut adalah kode untuk mengimpor data:
import pandas as pd data = pd.read_csv("data.csv")
Langkah 2: Mempersiapkan Data
Selanjutnya, kita mempersiapkan data untuk analisis probit. Kita membagi data menjadi data latih dan data uji dengan menggunakan train_test_split dari scikit-learn. Kode untuk mempersiapkan data adalah sebagai berikut:
from sklearn.model_selection import train_test_split X = data[["Kelamin", "Umur", "Jumlah Jam Belajar"]] y = data["Lulus/Tidak Lulus"] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
Langkah 3: Membuat Model Probit
Setelah mempersiapkan data, kita membuat model probit dengan menggunakan Probit dari statsmodels. Kode untuk membuat model probit adalah sebagai berikut:
import statsmodels.api as sm X_train = sm.add_constant(X_train) probit_model = sm.Probit(y_train, X_train) result = probit_model.fit()
Langkah 4: Melakukan Prediksi dan Evaluasi
Setelah membuat model probit, kita melakukan prediksi pada data uji dan mengevaluasi model. Kode untuk melakukan prediksi dan evaluasi adalah sama seperti pada analisis logit:
from sklearn.metrics import classification_reportX_test = sm.add_constant(X_test)
y_pred = result.predict(X_test)
y_pred_binary = [1 if x > 0.5 else 0 for x in y_pred]
print(classification_report(y_test, y_pred_binary))
Contoh kode untuk melihat tabel regresi pada model logit:
import statsmodels.api as sm
import pandas as pd # Membuat dataframe dari dataset
df = pd.read_csv('nama_file.csv')
# Menentukan variabel independen dan variabel dependen
X = df[['variabel_independen_1', 'variabel_independen_2', 'variabel_independen_3']]
y = df['variabel_dependen'] # Menambahkan konstanta pada variabel independen X = sm.add_constant(X) # Membuat model logit
model = sm.Logit(y, X)
# Melakukan fitting pada model
result = model.fit()
# Menampilkan tabel regresi
print(result.summary())
Kesimpulan
Dalam tutorial ini, kita telah mempelajari cara melakukan analisis logit dan probit dengan menggunakan bahasa pemrograman Python. Kedua teknik analisis ini sangat berguna dalam menganalisis hubungan antara variabel independen dan variabel biner. Kita juga telah mempelajari cara mempersiapkan data, membuat model, dan mengevaluasi performa model. Dengan menggunakan teknik ini, kita dapat membuat prediksi dan memahami bagaimana faktor-faktor tertentu mempengaruhi kemungkinan suatu peristiwa terjadi atau tidak.
Dengan Google Collab : Klik DISINI
FAQ
- Apa itu variabel biner?
- Variabel biner adalah variabel yang hanya memiliki dua nilai, yaitu 0 atau 1. Analisis logit dan probit adalah dua teknik analisis yang digunakan untuk menganalisis hubungan antara variabel independen dan variabel biner. Namun, perbedaan utama antara keduanya adalah dalam cara mereka memodelkan probabilitas variabel biner. Logit memodelkan probabilitas variabel biner sebagai fungsi logistik, sementara probit memodelkannya sebagai fungsi distribusi normal.
- Apa manfaat dari analisis logit dan probit?
- Â Analisis logit dan probit berguna untuk memahami bagaimana faktor-faktor tertentu mempengaruhi kemungkinan suatu peristiwa terjadi atau tidak. Kedua teknik analisis ini juga dapat digunakan untuk memprediksi hasil berdasarkan variabel independen yang ada.
- Apa perbedaan antara data latih dan data uji?
- Data latih digunakan untuk melatih model, sedangkan data uji digunakan untuk menguji performa model. Data latih biasanya lebih besar daripada data uji dan diambil secara acak dari dataset asli.
- Apa itu laporan klasifikasi?
- Laporan klasifikasi adalah laporan yang berisi akurasi, presisi, recall, dan f1-score dari model klasifikasi. Laporan ini dapat digunakan untuk mengevaluasi performa model dan memahami seberapa baik model dapat memprediksi hasil yang benar.
Baca juga:
