1. Pertanyaan dari Bapak Nurdiansyah
Bagaimana kita me-manajemen proyek yang akan berjalan atau akan dijalankan? Apakah harus berdasarkan data dan track record Project yang sudah berjalan sebelumnya?
Jawaban: Kalau proyeknya mirip kita bisa menggunakan yang sebelumnya sebagai perencanaan, termasuk didalamnya dapat analisis manajemen risikonya. Jadi yang mau muncul kira-kira apa kita lakukan dengan manajemen risiko kita hitung peluangnya kemudian kita hitung berapa nilai risikonya kemudian langkah-langkah apa yang dipakai untuk mitigasi risiko. Saya kira itu tidak berkaitan langsung dengan data mining tetapi berkaitan dengan pengelolaan proyek. Mungkin data mining bisa dipakai untuk membantu bagaimana memprediksi sesuatu berdasarkan pada data-data masa lalu. Tetapi data apa yang mau diprediksi itu tergantung kebutuhan, tetapi kalau untuk manajemen risiko tadi saya kira itu berbeda topik bisa menggunakan metodologi risk management atau risk analysis untuk memprediksi kemudian memitigasikan menyusun langkah-langkah kontingensi untuk memperkecil terjadinya risiko maupun menurunkan biaya akibat terjadinya risiko.
2. Pertanyaan dari Ibu Cut Agusniar
Untuk menentukan nilai sumbu X dan sumbu Y pada sebuah kasus itu bagaimana, Prof? Apakah untuk nilai sumbu X dan sumbu Y itu bisa diganti-ganti dengan atribut yang lain pada sebuah data yang sama? Bisa tolong dicontohkan?
Jawaban: X itu hanya nama, jadi kalau kita meng-create variabel tadi mau diberi nama lain juga boleh, kebetulan tadi saya memberi nama X. Misalnya mau saya beri nama fitur lalu lab itu juga boleh, nanti fiturnya misalnya tingkat fitur pertama, kita boleh saja memberi nama berbeda, lab itu Y nya. Jadi make_blobs ini by default, menceritakan data dengan dua dimensi yaitu X1 dan X2 dan Y itu adalah label masing-masing data ini. Ini berbeda lagi karena kita bangkitkan lagi dan dia random jadi berbeda dengan yang pertama tadi.
Untuk namanya bisa diganti-ganti, tetapi kita harus menyimpan jangan sampai nanti terbalik. Misalkan kita berbicara mengenai harga rumah, Y itu adalah harga rumah kemudian X satunya itu adalah luas rumah, X2 nya itu umur rumah. Jadi X1 nya luas, X2 nya umur, Y nya harga. Itu X1 dan X2 mau diganti-ganti boleh, tetapi kita harus ingat bahwa X1dan X2 masing-masingnya adalah umur dan luas, Y adalah harganya. Jadi tidak boleh dibalik, tetapi mau diberi nama apa saja boleh.
3. Pertanyaan dari MPS
Apakah bisa kita impor data dari data berupa .xlsx?
Jawaban: Kalau data lengkap berupa data Excel bisa langsung.
4. Pertanyaan dari Bapak Indra Jakobalis
Di mana letak perbedaan clustering dengan hierarchical clustering?
Jawaban: Jadi sebenarnya ada kelas besar clustering yang pertama adalah partitioning clustering dan yang kedua adalah hierarchical clustering. K-means yang pertama tadi itu adalah masuk ke dalam partitioning. Partitioning itu kita mengcluster kan dengan cara kita menciptakan pusat-pusat cluster, Kemudian datang kita hitung, jaraknya terhadap pusat-pusat Cluster itu. Data-datanya akan mengelompok ke pusat cluster yang paling dekat dengan dia. Kalau hierarki, kita punya sejumlah data, kita hitung jarak antar data itu, mana yang dekat kita kelompokkan jadi satu. Jadi setiap iterasi, misalnya 1 dan 3 dekat kita jadikan satu, iterasi berikutnya 2 dan 4 dekat jadikan satu. Jadi data di Cluster-kan tahap demi tahap. Nanti sampai sekian step itu kita bisa membuat pohon Cluster tadi, Jadi kalau misalkan data ingin dikelompokkan menjadi hanya 2 kelompok, pohonnya kita potong di atas. Jadi kelompok 1 berisi ini, dan kelompok 2 berisi ini. Tetapi kalau kita menginginkan Clusternya banyak, kita potong pohon di bawah.
5. Pertanyaan dari (Tanpa Nama)
Apakah semua data harus diclusteringkan terlebih dahulu?
Jawaban: Kalau datanya itu tidak ada labelnya kita ingin mengelompokkan, tugasnya kita mengcluster-kan data itu kita kelompokkan kemana. Clustering ini sebenarnya untuk mengelompokkan objek yang belum diketahui kelompoknya. Misalnya ada sejumlah mahasiswa dikelompokkan dalam tiga kelompok, itu tugas kita. Misalnya dikelompokkan berdasarkan apa, misalnya berdasarkan kesamaan minat. Tetapi di dalam clustering itu variabelnya tidak hanya satu variabel, jadi bisa multivariabel. X1 misalnya income, X2 nya worksite. Persoalan yang lain variabelnya mungkin 3,4,10 itu terserah, tetapi begitu banyak variabelnya akan semakin sulit untuk mengelompokkan. Jadi kalau di variabel x1 mungkin variabelnya berdekatan tetapi, di variabel 2, 3, 4 mungkin tidak berdekatan. Jadi, kelompok nya itu adalah kompromi dari setiap variabel, di mana objek yang berdekatan itu akan kelompokkan menjadi satu.
Profil InstrukturProf. Budi Santosa, Ph.D
Dosen Teknik Industri Institut Teknologi Sepuluh November
Deskripsi Pemateri:
Pendidikan
•Sarjana, Teknik Industri (S1), Institut Teknologi Bandung, Bandung, Indonesia, 1992
•Master, Industrial Engineering, University of Oklahoma, Norman, Oklahoma, USA, 1999
•Doktor, Industrial Engineering, University of Oklahoma, Norman,Oklahoma, USA, 2005
Bidang Keahlian
Data Mining, Optimasi dan Metaheuristik, Operations Research, Manajemen Proyek
Pengalaman Kerja
1.Rektor Institut Teknologi Kalimantan
2.Dosen Teknik Industri ITS, 1993-1997, 2005- sekarang
3.Assesor Badan Akreditasi Nasional (BAN-PT), Ristekdikti, 2008-sekarang
4.Interviewer LPDP Departemen Keuangan, 2013- sekarang
5.Anggota Tim Evaluasi Kinerja PTS, Dirjen Kelembagaan Dikti 2015-sekarang
6.Anggota Senat Akademik ITS PTN BH (2015-2020)
7.Visiting professor, Mei 2012, Short Course on Metaheuristics (7-19 May, 54 credit hours), Industrial Management, National Taiwan University of Sceince and Technology (NTUST), Taiwan
8.Visiting professor, Mei 2014, Short Course on Metaheuristics (25 May-6 June, 54 credit hours) , Industrial Management, National Taiwan University of Sceince and Technology (NTUST), Taiwan
9.Teaching Assistant, Engineering Optimization, Neural Networks, Optimization in Data Mining (2002- 2004, University of Oklahoma, USA)