diklatkerja

Ilmu Data

Apa Itu Data Visualization?

Dipublikasikan oleh Mochammad Reichand Qolby pada 01 Februari 2023

Data Visualization

Visualisasi Data merupakan sebuah representasi grafis dari informasi dan data. Data ini menggunakan elemen visual seperti bagan, grafik, peta yang memudahkan untuk melihat dan memahami sebuah tren dalam data. Hal ini bertujuan untuk memberikan informasi terbaik untuk karyawan atau pemiliki bisnis untuk menyajikan sebuah data kepada audiens.

Dalam dunia Big Data, alat dan teknologi visualisasi data sangat penting untuk menganalisis sejumlah besar informasi dan membuat keputusan berdasarkan data.

Pentingnya Data Visualization

Pentingnya visualisasi data itu sederhana: ini membantu orang melihat, berinteraksi dengan, dan memahami data dengan lebih baik. Baik sederhana maupun kompleks, visualisasi yang tepat dapat menyatukan semua orang, terlepas dari tingkat keahlian Visualisasi dapat digunakan secara produktif, hal ini merupakan salah satu keterampilan profesional yang paling berguna untuk dikembangkan. Semakin baik Anda menyampaikan poin Anda secara visual, baik di dasbor atau dek slide, semakin baik Anda dapat memanfaatkan informasi tersebut. Kumpulan keterampilan berubah untuk mengakomodasi dunia yang digerakkan oleh data. Semakin berharga bagi para profesional untuk dapat menggunakan data untuk membuat keputusan dan menggunakan visual untuk bercerita tentang kapan data menginformasikan siapa, apa, kapan, di mana, dan bagaimana.

Sumber : tableau.com

Selengkapnya

Ilmu Data

Analisis diskriminan linear

Dipublikasikan oleh Muhammad Farhan Fadhil pada 25 Maret 2022

Analisis diskriminan linear (bahasa Inggris: linear discriminant analysis, disingkat LDA) adalah generalisasi diskriminan linear Fisher, yaitu sebuah metode yang digunakan dalam ilmu statistika, pengenalan pola dan pembelajaran mesin untuk mencari kombinasi linear fitur yang menjadi ciri atau yang memisahkan dua atau beberapa objek atau peristiwa. Kombinasi yang diperoleh dapat dijadikan pengklasifikasi linear, atau biasanya digunakan untuk proses reduksi dimensionalitas sebelum pengklasifikasian.

Metode ini sangat terkait dengan analisis variansi (ANOVA) dan analisis regresi, yang juga mencoba untuk menyatakan suatu variabel dependen sebagai suatu kombinasi linear fitur-fitur atau pengukuran-pengukuran lainnya. Namun, ANOVA menggunakan variabel independen kategoris dan variabel dependen yang kontinu, sementara analisis diskriminan memiliki variabel independen yang kontinu dan variabel dependen yang kategoris. Regresi logistik dan regresi probit lebih mirip dengan LDA daripada ANOVA, karena keduanya juga mencoba menjelaskan variabel kategoris dari nilai variabel independen kontinu.

LDA juga terkait dengan analisis komponen utama dan analisis faktor karena sama-sama mencari kombinasi linear variabel-variabel yang terbaik dalam menjelaskan data. LDA secara eksplisit mencoba memodelkan perbedaan antara kelas-kelas data. PCA di sisi lain tidak mempertimbangkan perbedaan kelas, dan analisis faktor membangun kombinasi fitur berdasarkan perbedaan daripada kesamaan. Analisis diskriminan juga berbeda dari analisis faktor karena analisis diskriminan bukan teknik yang interdependen: perbedaan antara variabel independen dan dependen harus ditetapkan.

LDA berfungsi jika pengukuran yang dilakukan terhadap variabel-variabel independen untuk setiap pengamatan merupakan kuantitas yang kontinu. Jika yang dihadapi adalah variabel independen kategoris, teknik yang serupa adalah analisis korespondensi diskriminan.

Sumber Artikel: id.wikipedia.org

Selengkapnya

Ilmu Data

Pemelajaran dalam

Dipublikasikan oleh Muhammad Farhan Fadhil pada 25 Maret 2022

Pemelajaran dalam (bahasa Inggris: deep learning) atau sering dikenal dengan istilah pemelajaran struktural mendalam (bahasa Inggris: deep structured learning) atau pemelajaran hierarki (bahasa Inggris: hierarchical learning) adalah salah satu cabang dari ilmu pemelajaran mesin (bahasa Inggris: machine learning) yang terdiri algoritme pemodelan abstraksi tingkat tinggi pada data menggunakan sekumpulan fungsi transformasi non-linear yang ditata berlapis-lapis dan mendalam. Teknik dan algoritme dalam pemelajaran dalam dapat digunakan baik untuk kebutuhan pemelajaran terarah (supervised learning), pemelajaran tak terarah (unsupervised learning) dan semi-terarah (semi-supervised learning) dalam berbagai aplikasi seperti pengenalan citra, pengenalan suara, klasifikasi teks, dan sebagainya. Model pada pembelajaran dalam pada dasarnya dibangun berdasarkan jaringan saraf tiruan, yang risetnya sudah berlangsung sejak era 80-an namun baru-baru ini kembali bangkit dengan adanya komputer yang semakin cepat apalagi ditambah dengan kemampuan kartu grafis modern yang mampu melakukan kalkulasi berbasis matriks secara simultan.

Berdasarkan riset yang baru-baru ini dilakukan, pemelajaran dalam mampu melakukan pengenalan grafis, pola tulis tangan dan beberapa pola lainnya lebih akurat dibandingkan dengan algoritme pemelajaran mesin lainnya.

Arsitektur

Deep Feedforward Network
- Deep Feedforward Network atau dikenal dengan Multilayer Perceptron (MLP) merupakan pengembangan dari jaringan saraf tiruan yang menekankan pada penggunakan satu atau lebih lapis tersembunyi (hidden layer) pada jaringannya dan penggunaan fungsi transformasi non-linear sebagai fungsi transformasi. Jaringan ini disebut Feedforward oleh karena sifatnya yang membawa informasi dari lapis masukan (input layer) untuk dibawa dan ditransformasi ke depan hingga lapis luaran (output layer).
Recurrent Neural Network
- Recurrent Neural Network merupakan pengembangan dari Deep Feedforward Network yang mana informasi dari suatu neuron dapat berputar kembali ke neuron yang sama (Deep Feddforward Network hanya membawa informasi ke lapis A ke lapis B secara progresif tanpa kembali ke lapis sebelumnya).
Convolutional Neural Network
- Convolutional Neural Network merupakan modifikasi dari Deep Feedforward Network yang mana setiap lapisnya dibuat dalam bentuk topologi grid mendalam.

Sumber Artikel: id.wikipedia.org

Selengkapnya