Tutorial Visualisasi Data Violin plot dengan Aplikasi Stata

[sitemap]

Tutorial Visualisasi data Violin plot dengan aplikasi stata -Violin plot adalah representasi grafis data statistik yang mirip dengan box plot. Plot ini menampilkan ringkasan distribusi variabel kontinu atau kategorik, dengan tambahan plot kernel density yang diputar di setiap sisinya. Grafik ini sering digunakan dalam analisis data untuk mengevaluasi bagaimana data tersebar di sekitar mean-nya.

Violin plot terdiri dari sebuah kotak yang menggambarkan interval antara minimum dan maksimum data, dengan garis tengah yang menunjukkan mean data. Selain itu, violin plot juga menampilkan informasi tentang variasi data dengan menggambarkan distribusi data dalam bentuk “violin” yang berbentuk seperti bantalan.

Bagian tengah dari violin plot menunjukkan bagian dari data yang paling banyak, sedangkan bagian ujung violin plot menunjukkan bagian dari data yang paling sedikit. Violin plot juga dapat menampilkan informasi tentang kuartil data dengan menggunakan garis yang ditarik di bagian atas dan bawah violin plot.

Violin plot sangat berguna dalam mengevaluasi bagaimana data tersebar di sekitar mean-nya dan dapat memberikan informasi yang lebih lengkap daripada grafik lain seperti box plot atau histogram. Selain itu, violin plot juga dapat digunakan untuk membandingkan distribusi data antara beberapa kelompok dengan menggunakan warna atau tanda yang berbeda untuk setiap kelompok.

Bagaimana menvisualisasi data dengan aplikasi stata?

Untuk membuat visualisasi data dengan menggunakan aplikasi Stata, pertama-tama Anda perlu membuka aplikasi tersebut dan memasukkan data yang akan diolah ke dalam program. Setelah itu, Anda dapat menggunakan perintah-perintah yang tersedia di aplikasi untuk memvisualisasikan data tersebut.

sebelum masuk ke visualisasi data tersebut sobat perlu install library sebagai berikut:

ssc install dstat, replace
ssc install moremata, replace
ssc install palettes, replace
ssc install colrspace, replace
ssc install violinplot, replace

kalian pasti pusing bukan hehehe?

tenang sobat berikut kami coba ringkas langkah-langkahnya supaya lebih mudah dipahami ya sobat.

 

import delimited "https://raw.githubusercontent.com/tidyverse/ggplot2/master/data-raw/mpg.csv", clear

 * Original Violin Plot
 * This plot contains box and distribution
 violinplot cty,  over(class) vertical scheme(white_w3d) ///
      ytitle("City Mileage", size(2.25)) ///
      ylabel(, nogrid) ///
      title("{bf}Box Plot", pos(11) size(2.75)) ///
      b1title(" " "Class of vehicle", size(2.5)) ///
      subtitle("City Mileage grouped by class of vehicle", pos(11) size(2))
      
 

 

Dari hasil perintah diatas akan mengeluarkan output gambar sebagai berikut:

Tutorial Visualisasi Data dengan Aplikasi Stata

untuk menbuat versi tanpa ada gambar box dapat menggunakan perintah berikut ini :



  violinplot cty,  over(class) vertical scheme(white_w3d) nobox nomedian noline nowhiskers ///
      ytitle("City Mileage", size(2.25)) ///
      ylabel(, nogrid) ///
      title("{bf}Box Plot (Density Only)", pos(11) size(2.75)) ///
      b1title(" " "Class of vehicle", size(2.5)) ///
      subtitle("City Mileage grouped by class of vehicle", pos(11) size(2))

Tutorial Visualisasi Data dengan Aplikasi Stata

Tuh gambarnya menarik bukan ?

Dibalik menariknya visualisasi ini terdapat pula kekurangan yang ada pada visualisasi data, tentang sobat kami coba analisis nih buat sobat kekuranganya berdasarkan pengalaman mimin

 

Apa Kekurangan Visualisasi data Violin PLot ?

Salah satu kekurangan potensial dari violin plot adalah bahwa dapat sulit untuk membandingkan ukuran violin satu sama lain, karena lebar violin ditentukan oleh plot kernel density, yang tergantung pada data yang dipetakan. Hal ini dapat membuat lebih sulit untuk membandingkan distribusi kelompok yang berbeda atau untuk melihat tren dalam data.

Kekurangan lainnya adalah bahwa plot kernel density dapat terpengaruh oleh pilihan bandwidth, yang menentukan seberapa halus plot tersebut. Jika bandwidth terlalu besar, plot mungkin terlalu halus dan tidak akurat mencerminkan data yang mendasarinya. Jika bandwidth terlalu kecil, plot mungkin terlalu bising dan tidak memberikan ringkasan yang jelas dari data.

Terakhir, violin plot mungkin tidak sepopuler jenis plot lain, seperti plot batang atau plot scatter, yang dapat membuatnya kurang terjangkau bagi beberapa audiens

Baca Juga :

Reference

https://medium.com/the-stata-gallery/top-25-stata-visualizations-with-full-code-668b5df114b6

Scroll to Top