Analisis prediktif
Analisis prediktif mengkaji penggunaan data, algoritma statistik dan teknik pembelajaran mesin untuk mengidentifikasi kemungkinan hasil masa depan berdasarkan data historis. Tujuannya adalah untuk tidak mengetahui apa yang telah terjadi untuk memberikan penilaian terbaik tentang apa yang akan terjadi di masa depan
Kontributor: Ifa Nuzulul R.
Apa itu analisis prediktif?
Analisis prediktif adalah cabang dari analisis lanjutan yang digunakan untuk membuat prediksi mengenai kejadian di masa depan. Analisis prediktif menggunakan banyak teknik dari pertambangan data, statistik, modeling,pembelajaran mesin, dan kecerdasan buatan untuk menganalisis data yang baru saja dibuat untuk memprediksi data di masa depan. Pemodelan prediktif dan teknikal analisis menggambungkan manajemen, informasi teknologi, permodelan bisnis proses untuk memprediksi masa depan. Pola yang ditemukan di data masa lalu dan data transaksi dapat digunakan untuk mengidentifikasi resiko dan kesempatan untuk masa depan.Mengapa analisis prediktif itu penting?
Organisasi beralih ke analisis prediktif untuk meningkatkan keunggulan kompetitif mereka. Beberapa penggunaan yang paling umum meliputi:- Mendeteksi kecurangan Menggabungkan beberapa metode analisis dapat memperbaiki deteksi pola dan mencegah perilaku kriminal. Karena keamanan dunia maya menjadi perhatian yang berkembang, analisis perilaku berkinerja tinggi menguji semua tindakan pada jaringan secara real time untuk menemukan kelainan yang mungkin mengindikasikan kecurangan, kerentanan zero-day dan ancaman terus-menerus yang terus-menerus.
- Mengoptimalkan kampanye pemasaran Analisis prediktif digunakan untuk menentukan tanggapan atau pembelian pelanggan, serta mempromosikan peluang jual silang. Model prediktif membantu bisnis menarik, mempertahankan dan menumbuhkan pelanggan mereka yang paling menguntungkan.
- Memperbaiki operasi Banyak perusahaan menggunakan model prediksi untuk meramalkan persediaan dan mengelola sumber daya. Maskapai penerbangan menggunakan analisis prediktif untuk menetapkan harga tiket. Hotel mencoba memprediksi jumlah tamu untuk malam tertentu untuk memaksimalkan hunian dan meningkatkan pendapatan. Analisis prediktif memungkinkan organisasi berfungsi lebih efisien.
- Mengurangi resiko Skor kredit digunakan untuk menilai kemungkinan default pembelian pembeli dan merupakan contoh analisis prediktif yang terkenal. Skor kredit adalah angka yang dihasilkan oleh model prediktif yang menggabungkan semua data yang relevan dengan kelayakan kredit seseorang. Penggunaan terkait risiko lainnya termasuk klaim dan koleksi asuransi.
Bagaimana analisis prediktif bekerja?
Model prediktif menggunakan hasil yang diketahui untuk mengembangkan (atau melatih) model yang dapat digunakan untuk memprediksi nilai untuk data berbeda atau baru. Pemodelan memberikan hasil dalam bentuk prediksi yang mewakili probabilitas dari variabel target (misalnya, pendapatan) berdasarkan perkiraan signifikansi dari seperangkat variabel input.Ini berbeda dengan model deskriptif yang membantu Anda memahami apa yang terjadi, atau model diagnostik yang membantu Anda memahami hubungan kunci dan menentukan mengapa sesuatu terjadi. Seluruh buku dikhususkan untuk metode dan teknik analisis. Kurikulum perguruan tinggi yang lengkap menggali secara mendalam masalah ini. Tapi untuk pemula, berikut adalah beberapa hal mendasar.
Ada dua jenis model prediktif. Model klasifikasi memprediksi keanggotaan kelas. Misalnya, Anda mencoba untuk mengklasifikasikan apakah seseorang cenderung pergi, apakah dia akan menanggapi permintaan, apakah dia berisiko kredit baik atau buruk, dll Biasanya, hasil modelnya dalam bentuk 0 atau 1, dengan 1 menjadi Acara yang Anda targetkan Model regresi memprediksi angka - misalnya, berapa besar pendapatan yang akan dihasilkan pelanggan selama tahun depan atau jumlah bulan sebelum komponen akan gagal pada mesin.
Data Pre Processing.
- Pembersihan Data Variabel input model (atau fitur) perlu dibersihkan, kosong, mungkin perlu ada data yang dihaluskan (dengan regresi, clustering atau binning) untuk menghapus "outlier" dan juga memiliki ketidakkonsistenan yang dikoreksi.
- Transformasi Data Variabel numerik kemudian dapat diskalakan ke rentang yang umum - dinormalisasi. Variabel kategorikal dapat dikelompokkan (umum) dan seringkali variabel baru (lebih kuat) akan dibangun - mis. 'Jarak dari toko' dari kode pos
- Pengurangan Data Adalah khas untuk memiliki ribuan variabel kandidat yang siap dilewatkan ke dalam model. Ini kemudian dapat dianalisis untuk memahami mana yang harus dikecualikan (misalnya distribusi yang tidak relevan atau rendah). Variabel itu sendiri dapat dikurangi dengan binning dan clustering.
Tiga teknik pemodelan prediktif yang paling banyak digunakan adalah pohon keputusan, regresi dan jaringan syaraf tiruan.
- Pohon keputusan adalah model klasifikasi yang mempartisi data menjadi himpunan bagian berdasarkan kategori variabel input. Ini membantu Anda memahami jalan keputusan seseorang. Pohon keputusan terlihat seperti pohon dengan masing-masing cabang mewakili pilihan antara sejumlah alternatif, dan setiap daun mewakili klasifikasi atau keputusan. Model ini melihat data dan mencoba menemukan satu variabel yang membagi data menjadi kelompok logis yang paling berbeda. Pohon keputusan populer karena mudah dipahami dan diinterpretasikan. Mereka juga menangani nilai yang hilang dengan baik dan berguna untuk pemilihan variabel awal. Jadi, jika Anda memiliki banyak nilai yang hilang atau menginginkan jawaban yang cepat dan mudah ditafsirkan, Anda bisa mulai dengan pohon.
- Regresi (linier dan logistik) adalah salah satu metode statistik yang paling populer. Analisis regresi memperkirakan hubungan antar variabel. Ditujukan untuk data kontinu yang dapat diasumsikan mengikuti distribusi normal, ia menemukan pola kunci dalam kumpulan data yang besar dan sering digunakan untuk menentukan berapa banyak faktor spesifik, seperti harga, mempengaruhi pergerakan aset. Dengan analisis regresi, kami ingin memprediksi suatu bilangan, yang disebut respon atau variabel Y. Dengan regresi linier, satu variabel independen digunakan untuk menjelaskan dan / atau memprediksi hasil Y. Regresi berganda menggunakan dua atau lebih variabel bebas untuk memprediksi hasilnya. Dengan regresi logistik, variabel variabel diskrit yang tidak diketahui diprediksi berdasarkan nilai variabel lain yang diketahui. Variabel respon bersifat kategoris, artinya hanya dapat diasumsikan jumlah nilai tertentu. Dengan regresi logistik biner, variabel respon hanya memiliki dua nilai seperti 0 atau 1. Pada regresi logistik ganda, variabel respon dapat memiliki beberapa tingkat, seperti rendah, sedang dan tinggi, atau 1, 2 dan 3.
- Jaringan saraf adalah teknik canggih yang mampu memodelkan hubungan yang sangat kompleks. Mereka populer karena mereka kuat dan fleksibel. Kekuatan datang dalam kemampuan mereka untuk menangani hubungan nonlinear dalam data, yang semakin umum saat kami mengumpulkan lebih banyak data. Mereka sering digunakan untuk mengkonfirmasi temuan dari teknik sederhana seperti pohon regresi dan keputusan. Jaringan saraf didasarkan pada pengenalan pola dan beberapa proses cerdas secara artifisial yang secara grafis "model" parameter. Mereka bekerja dengan baik ketika tidak ada rumus matematika yang diketahui yang menghubungkan input dengan output, prediksi lebih penting daripada penjelasan, atau ada banyak data pelatihan. Jaringan syaraf tiruan pada awalnya dikembangkan oleh para periset yang mencoba meniru neurofisiologi otak manusia.
Siapa yang menggunakan analisis prediktif?
Setiap industri dapat menggunakan analisis prediktif untuk mengurangi risiko, mengoptimalkan operasi mereka dan meningkatkan pendapatan. Berikut adalah beberapa contohnya.- Perbankan & Jasa Keuangan Industri keuangan, dengan sejumlah besar data dan uang yang dipertaruhkan, telah lama memeluk analisis prediktif untuk mendeteksi dan mengurangi kecurangan, mengukur risiko kredit, memaksimalkan peluang menjual / menjual hingga menjual dan mempertahankan pelanggan berharga. Commonwealth Bank menggunakan analisis untuk memprediksi kemungkinan aktivitas kecurangan untuk transaksi tertentu sebelum diberi otorisasi - dalam waktu 40 milidetik dari inisiasi transaksi.
- Eceran Karena studi yang sekarang terkenal yang menunjukkan bahwa pria yang membeli popok sering membeli bir pada saat bersamaan, pengecer di mana saja menggunakan analisis prediktif untuk menentukan produk mana yang akan dijual, keefektifan acara promosi dan penawaran mana yang paling tepat untuk konsumen. Staples menganalisis perilaku konsumen untuk memberikan gambaran lengkap tentang pelanggan mereka, dan menyadari ROI 137 persen.
- Minyak, Gas & Utilitas Entah itu memprediksi kegagalan peralatan dan kebutuhan sumber daya masa depan, mengurangi risiko keselamatan dan keandalan, atau memperbaiki kinerja secara keseluruhan, industri energi telah menganut analisis prediktif dengan kekuatan. Salt River Project adalah utilitas tenaga publik terbesar kedua di AS dan salah satu pemasok air terbesar di Arizona. Analisis data sensor mesin memprediksi saat turbin pembangkit listrik memerlukan perawatan.
- Pemerintah & Sektor Publik Pemerintah telah menjadi pemain kunci dalam kemajuan teknologi komputer. Biro Sensus Amerika Serikat telah menganalisis data untuk memahami tren populasi selama beberapa dekade. Pemerintah sekarang menggunakan analisis prediktif seperti banyak industri lainnya - untuk memperbaiki layanan dan kinerja; Mendeteksi dan mencegah kecurangan; Dan lebih memahami perilaku konsumen. Mereka juga menggunakan analisis prediktif untuk meningkatkan keamanan dunia maya.
- Asuransi Kesehatan Selain mendeteksi klaim penipuan, industri asuransi kesehatan mengambil langkah untuk mengidentifikasi pasien yang paling berisiko terkena penyakit kronis dan menemukan intervensi apa yang terbaik. Script Ekspres, perusahaan farmasi besar, menggunakan analisis untuk mengidentifikasi mereka yang tidak mematuhi perawatan yang ditentukan, menghasilkan penghematan sebesar $ 1.500 sampai $ 9.000 per pasien.
- Manufaktur Bagi produsen, sangat penting untuk mengidentifikasi faktor-faktor yang menyebabkan berkurangnya kualitas dan kegagalan produksi, serta mengoptimalkan suku cadang, sumber daya dan distribusi layanan. Lenovo hanyalah satu produsen yang telah menggunakan analisis prediktif untuk lebih memahami klaim garansi - sebuah inisiatif yang menghasilkan pengurangan biaya garansi 10 sampai 15 persen.
Contoh analisis prediktif
Prediktif Analytics Merampingkan Operasi PerusahaanHarvard Business Review melaporkan bahwa data besar sangat membantu untuk memprediksi permintaan pelanggan akan produk yang bukan "hits", namun agak dijual kepada banyak orang di berbagai relung (atau dikenal sebagai "ekor panjang").
Pertambangan jenis data ini lebih menantang karena produk di ekor panjang tidak sepopuler produk hit dan daerah yang mereka jual tidak besar.
Contoh yang lainnya meliputi:
- Sistem rekomendasi untuk produk perjalanan (mis., Hotel, penerbangan, layanan tambahan)
- Sistem pengenal video, gambar, dan suara untuk tujuan perjalanan.
- Pengoptimalan klik dan konversi untuk produk perjalanan dan kampanye iklan online.