🎉 Diskon hingga 15% semua kelas Sekolah Stata! Presale & Early Bird

Tutorial Analisis Logit atau Probit dengan Python

🔥 Jangan Lewatkan: Kelas Google Earth Engine Batch 8 🚀

Tanggal: 06 June 2026 | Investasi: Hanya 350k! 🌟

Gabung sekarang dan tingkatkan keterampilan Anda dengan praktisi terbaik! 📊💡

Daftar Sekarang đź”—
 E-book: Analisis Data Penelitian Menggunakan SPSS: Langkah Praktis dan Studi Kasus

E-book: Analisis Data Penelitian Menggunakan SPSS: Langkah Praktis dan Studi Kasus

Rp 30.000

Informasi Lengkap

Pendahuluan

Analisis regresi adalah salah satu metode statistik yang paling umum digunakan untuk menganalisis hubungan antara satu atau lebih variabel independen dengan variabel dependen. Namun, dalam beberapa kasus, kita ingin menganalisis bagaimana faktor-faktor tertentu mempengaruhi kemungkinan suatu peristiwa terjadi atau tidak. Dalam hal ini, analisis logit dan probit adalah pilihan yang tepat. Dalam tutorial ini, kita akan mempelajari cara melakukan analisis logit dan probit dengan menggunakan bahasa pemrograman Python.

Pengertian Analisis Logit dan Probit

Analisis logit dan probit adalah teknik analisis statistik yang digunakan untuk menganalisis hubungan antara variabel independen dan variabel biner. Variabel biner adalah variabel yang hanya memiliki dua nilai, yaitu 0 atau 1. Analisis logit dan probit digunakan untuk mengestimasi kemungkinan suatu peristiwa terjadi atau tidak terjadi. Kedua teknik ini sangat mirip, tetapi probit lebih jarang digunakan.

 

Persiapan Data

Sebelum kita melakukan analisis logit atau probit, kita perlu menyiapkan data. Data yang kita gunakan dalam tutorial ini adalah data tentang kinerja siswa dalam ujian matematika. Kita akan menggunakan variabel “Kelamin”, “Umur”, dan “Jumlah Jam Belajar” sebagai variabel independen dan variabel “Lulus/Tidak Lulus” sebagai variabel dependen.

Instalasi Paket

Pertama-tama, kita perlu menginstal paket “statsmodels” dan “pandas”. Kita dapat melakukannya dengan menjalankan perintah berikut di command prompt:

python
pip install statsmodels
pip install pandas

Analisis Logit

Langkah 1: Mengimpor Data

Kita mulai dengan mengimpor data dari file CSV menggunakan pandas. Berikut adalah kode untuk mengimpor data:

python
import pandas as pd data = pd.read_csv("data.csv")

Langkah 2: Mempersiapkan Data

Selanjutnya, kita mempersiapkan data untuk analisis logit. Kita membagi data menjadi data latih dan data uji dengan menggunakan train_test_split dari scikit-learn. Kode untuk mempersiapkan data adalah sebagai berikut:

python
from sklearn.model_selection import train_test_split X = data[["Kelamin", "Umur", "Jumlah Jam Belajar"]] y = data["Lulus/Tidak Lulus"] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

Langkah 3: Membuat Model Logit

Setelah mempersiapkan data, kita membuat model logit dengan menggunakan Logit dari statsmodels. Kode untuk membuat model logit adalah sebagai berikut:

python
import statsmodels.api as sm X_train = sm.add_constant(X_train) logit_model = sm.Logit(y_train, X_train) result = logit_model.fit()

Langkah 4: Melakukan Prediksi dan Evaluasi

Setelah membuat model logit, kita melakukan prediksi pada data uji dan mengevaluasi model. Kode untuk melakukan prediksi dan evaluasi adalah sebagai berikut:

python
from sklearn.metrics import classification_report X_test = sm.add_constant(X_test) y_pred = result.predict(X_test) y_pred_binary = [1 if x > 0.5 else 0 for x in y_pred] print(classification_report(y_test, y_pred_binary))

Output dari kode di atas adalah laporan klasifikasi yang berisi akurasi, presisi, recall, dan f1-score. Laporan klasifikasi ini akan membantu kita dalam mengevaluasi performa model.

 

 

 

Artikel Blog Sekolah Stata di indeks Oleh Google Scholar

Akses Google Scholar

 

 

 

Analisis Probit

Langkah 1: Mengimpor Data

Seperti pada analisis logit, kita mulai dengan mengimpor data dari file CSV menggunakan pandas. Berikut adalah kode untuk mengimpor data:

python
import pandas as pd data = pd.read_csv("data.csv")

Langkah 2: Mempersiapkan Data

Selanjutnya, kita mempersiapkan data untuk analisis probit. Kita membagi data menjadi data latih dan data uji dengan menggunakan train_test_split dari scikit-learn. Kode untuk mempersiapkan data adalah sebagai berikut:

python
from sklearn.model_selection import train_test_split X = data[["Kelamin", "Umur", "Jumlah Jam Belajar"]] y = data["Lulus/Tidak Lulus"] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

Langkah 3: Membuat Model Probit

Setelah mempersiapkan data, kita membuat model probit dengan menggunakan Probit dari statsmodels. Kode untuk membuat model probit adalah sebagai berikut:

python
import statsmodels.api as sm X_train = sm.add_constant(X_train) probit_model = sm.Probit(y_train, X_train) result = probit_model.fit()

Langkah 4: Melakukan Prediksi dan Evaluasi

Setelah membuat model probit, kita melakukan prediksi pada data uji dan mengevaluasi model. Kode untuk melakukan prediksi dan evaluasi adalah sama seperti pada analisis logit:

python

from sklearn.metrics import classification_reportX_test = sm.add_constant(X_test)
y_pred = result.predict(X_test)
y_pred_binary = [1 if x > 0.5 else 0 for x in y_pred]

print(classification_report(y_test, y_pred_binary))


Contoh kode untuk melihat tabel regresi pada model logit:

import statsmodels.api as sm
 import pandas as pd # Membuat dataframe dari dataset
 df = pd.read_csv('nama_file.csv')
 # Menentukan variabel independen dan variabel dependen
 X = df[['variabel_independen_1', 'variabel_independen_2', 'variabel_independen_3']]
y = df['variabel_dependen'] # Menambahkan konstanta pada variabel independen X = sm.add_constant(X) # Membuat model logit
 model = sm.Logit(y, X)
 # Melakukan fitting pada model
 result = model.fit()
 # Menampilkan tabel regresi
 print(result.summary())

Kesimpulan

Dalam tutorial ini, kita telah mempelajari cara melakukan analisis logit dan probit dengan menggunakan bahasa pemrograman Python. Kedua teknik analisis ini sangat berguna dalam menganalisis hubungan antara variabel independen dan variabel biner. Kita juga telah mempelajari cara mempersiapkan data, membuat model, dan mengevaluasi performa model. Dengan menggunakan teknik ini, kita dapat membuat prediksi dan memahami bagaimana faktor-faktor tertentu mempengaruhi kemungkinan suatu peristiwa terjadi atau tidak.

Dengan Google Collab : Klik DISINI

FAQ

  1. Apa itu variabel biner?
    • Variabel biner adalah variabel yang hanya memiliki dua nilai, yaitu 0 atau 1. Analisis logit dan probit adalah dua teknik analisis yang digunakan untuk menganalisis hubungan antara variabel independen dan variabel biner. Namun, perbedaan utama antara keduanya adalah dalam cara mereka memodelkan probabilitas variabel biner. Logit memodelkan probabilitas variabel biner sebagai fungsi logistik, sementara probit memodelkannya sebagai fungsi distribusi normal.
  2. Apa manfaat dari analisis logit dan probit?
    •  Analisis logit dan probit berguna untuk memahami bagaimana faktor-faktor tertentu mempengaruhi kemungkinan suatu peristiwa terjadi atau tidak. Kedua teknik analisis ini juga dapat digunakan untuk memprediksi hasil berdasarkan variabel independen yang ada.
  3. Apa perbedaan antara data latih dan data uji?
    • Data latih digunakan untuk melatih model, sedangkan data uji digunakan untuk menguji performa model. Data latih biasanya lebih besar daripada data uji dan diambil secara acak dari dataset asli.
  4. Apa itu laporan klasifikasi?
    • Laporan klasifikasi adalah laporan yang berisi akurasi, presisi, recall, dan f1-score dari model klasifikasi. Laporan ini dapat digunakan untuk mengevaluasi performa model dan memahami seberapa baik model dapat memprediksi hasil yang benar.

Baca juga:

Scroll to Top