Regresi Linier vs Regresi Logistik
Dalam analisis statistik, penting untuk mengidentifikasi hubungan antar variabel yang bersangkutan dengan penelitian. Terkadang itu mungkin satu-satunya tujuan dari analisis itu sendiri. Salah satu alat kuat yang digunakan untuk menetapkan keberadaan hubungan dan mengidentifikasi hubungan tersebut adalah analisis regresi.
Bentuk analisis regresi yang paling sederhana adalah regresi linier, dimana hubungan antar variabel merupakan hubungan linier. Dalam istilah statistik, ini memunculkan hubungan antara variabel penjelas dan variabel respons. Misalnya, dengan menggunakan regresi, kita dapat menetapkan hubungan antara harga komoditas dan konsumsi berdasarkan data yang dikumpulkan dari sampel acak. Analisis regresi akan menghasilkan fungsi regresi dari kumpulan data, yang merupakan model matematika yang paling sesuai dengan data yang tersedia. Ini dengan mudah dapat diwakili oleh plot pencar. Regresi grafis setara dengan menemukan kurva yang paling cocok untuk kumpulan data yang diberikan. Fungsi kurva tersebut adalah fungsi regresi. Dengan menggunakan model matematis, penggunaan suatu komoditas dapat diprediksi dengan harga tertentu.
Oleh karena itu, analisis regresi banyak digunakan dalam memprediksi dan meramalkan. Ini juga digunakan untuk membangun hubungan dalam data eksperimen, dalam bidang fisika, kimia, dan dalam banyak ilmu alam dan disiplin ilmu teknik. Jika hubungan atau fungsi regresi tersebut merupakan fungsi linier, maka proses tersebut disebut dengan regresi linier. Dalam plot pencar, itu dapat direpresentasikan sebagai garis lurus. Jika fungsinya bukan kombinasi linier dari parameter, maka regressi adalah non-linier.
Regresi logistik dapat dibandingkan dengan regresi multivariasi, dan ini menciptakan model untuk menjelaskan dampak beberapa prediktor pada variabel respon. Namun, dalam regresi logistik, variabel hasil akhir harus dikategorikan (biasanya dibagi; yaitu, sepasang hasil yang dapat dicapai, seperti kematian atau kelangsungan hidup, meskipun teknik khusus memungkinkan informasi yang lebih dikategorikan untuk dimodelkan). Variabel hasil yang berkelanjutan dapat diubah menjadi variabel kategori, yang akan digunakan untuk regresi logistik; namun, menciutkan variabel kontinu dengan cara ini sebagian besar tidak disarankan karena mengurangi keakuratan.
Berbeda dengan regresi linier, terhadap mean, variabel prediktor dalam regresi logistik tidak harus dipaksa untuk dihubungkan secara linier, terdistribusi secara umum, atau memiliki varian yang sama di dalam setiap cluster. Akibatnya, hubungan antara variabel prediktor dan hasil tidak mungkin menjadi fungsi linier.
Apa perbedaan antara Regresi Logistik dan Linear?
• Dalam regresi linier, hubungan linier antara variabel penjelas dan variabel respon diasumsikan dan parameter yang memenuhi model ditemukan dengan analisis, untuk memberikan hubungan yang tepat.
• Regresi linier dilakukan untuk variabel kuantitatif, dan fungsi yang dihasilkan adalah kuantitatif.
• Dalam regresi logistik, data yang digunakan dapat bersifat kategorik atau kuantitatif, namun hasilnya selalu bersifat kategorik.