Latar Belakang Teoretis
Pentingnya perencanaan proyek dalam industri konstruksi digambarkan sebagai fondasi suksesnya suatu proyek, baik dari segi capaian waktu, biaya maupun kualitas. Sejak lahirnya metode klasik seperti PERT dan CPM hingga adopsi perangkat lunak manajemen proyek modern, perencanaan masih banyak dilaksanakan secara manual dan bersifat silo antara satu proyek dengan proyek lain. Padahal, kondisi nyata menunjukkan banyak deviasi antara estimasi durasi aktivitas dan realisasinya, akibat faktor-faktor seperti keterbatasan tenaga kerja atau asumsi perencanaan yang tidak realistis. Untuk memahami keterkaitan antara rencana dan realisasi, penulis menekankan perlunya membandingkan data perencanaan dari berbagai proyek. Kendalanya, perbedaan penamaan dan struktur aktivitas membuat komparasi menjadi sulit dan memerlukan digitalisasi dan otomatisasi untuk menciptakan koherensi antar-proyek.
Dalam tinjauan pustaka sistematis, van de Laar menguraikan evolusi manajemen proyek konstruksi sejak penggunaan bagan batang dan WBS hingga sistem BIM dan perangkat lunak canggih masa kini. Meskipun digitalisasi seperti BIM mulai diadopsi di beberapa aspek industri, proses perencanaan proyek masih kurang terotomatisasi dan bergantung pada kerja manual. Sementara itu, perkembangan artificial intelligence (AI) dan machine learning (ML) menawarkan potensi besar: algoritma AI dapat mengidentifikasi pola dalam data perencanaan besar tanpa diperlukan label manual. Penulis menjelaskan konsep pembelajaran mesin terawasi vs tak terawasi, serta peran unsupervised clustering dalam menemukan struktur laten data. Teknik NLP (pemrosesan bahasa alami) juga dibahas sebagai cara menormalkan deskripsi teks aktivitas proyek.
Kerangka teoretis dikembangkan dengan menghubungkan isu perencanaan tradisional yang tidak terstandarisasi dengan kemampuan ML untuk mengelompokkan aktivitas berdasarkan kemiripan. Hipotesis implisitnya adalah dengan memanfaatkan teknik klastering tak terawasi pada data perencanaan historis, kita dapat mengidentifikasi kategori aktivitas yang serupa lintas proyek. Dengan demikian, evaluasi perencanaan menjadi lebih transparan dan dapat dibandingkan. Hipotesis lanjutnya adalah sistem ini dapat menunjang pengambilan keputusan perencana dengan secara otomatis melabeli aktivitas baru ke dalam kategori berisi kategori relevan. Teori ini merujuk pada literatur tentang otomatisasi AEC yang menunjukkan bahwa pendekatan semi-otomatis (bukan otomatis penuh) lebih praktis dalam konteks kompleksitas proyek nyata.
Secara keseluruhan, penulis membangun fondasi teoritis dengan memetakan tren digitalisasi dalam perencanaan konstruksi serta kerangka ML untuk klastering teks. Pembacaan literatur historis (misalnya sejarah CPM, CPM hingga PMBOK) menegaskan perlunya koordinasi terkomputerisasi, sedangkan literatur AI/ML menjelaskan metode tak terawasi yang relevan untuk tugas ini. Fokus pada otomasi evaluasi perencanaan lintas proyek adalah area baru yang mengisi kekosongan dalam riset eksisting, yang umumnya berusaha mengotomasi perencanaan keseluruhan dan sering membutuhkan banyak asumsi manual.
Metodologi dan Kebaruan
Penelitian ini menggunakan pendekatan unsupervised machine learning dikombinasikan dengan teknik pengolahan bahasa alami (NLP) untuk mencapai tujuan yang dirumuskan pada bagian pendahuluan. Metodologi inti mencakup dua tahap utama: klastering kegiatan perencanaan berdasarkan kemiripan deskripsi, dan pelabelan otomatis kegiatan baru ke dalam klaster yang tepat. Langkah awal adalah menyiapkan data perencanaan proyek infrastruktur besar yang sebelumnya dikumpulkan. Data tersebut terdiri dari daftar aktivitas dengan deskripsi teks (dalam bahasa Belanda), durasi terencana, dan informasi lain. Tantangan pertama ialah heterogenitas teks tugas, sehingga dilakukan serangkaian preprocessing: (1) ekstraksi kata kerja dan kata benda; (2) penghapusan tanda baca dan teks dalam kurung; (3) stemming/lemmatization untuk kata; (4) penerjemahan otomatis istilah Belanda ke Inggris; dan (5) penghilangan terminologi spesifik proyek. Kombinasi pra-pemrosesan ini dirancang untuk menyamakan format dan makna aktivitas sehingga lebih mudah dikelompokkan.
Selanjutnya, penulis melakukan analisis multikriteria (Multi Criteria Analysis, MCA) untuk mengevaluasi beberapa algoritma klastering tanpa pengawasan. Empat metode dipertimbangkan: K-Means, DBSCAN, Mean-shift, dan Hierarchical Agglomerative. Berdasarkan kriteria seperti kemudahan parameterisasi, skalabilitas, dan kesiapan implementasi, diperoleh peringkat yang menempatkan DBSCAN dan K-Means sebagai opsi terbaik[15]. DBSCAN menarik karena dapat menemukan bentuk klaster arbitrer, namun bergantung pada penentuan jarak epsilon. K-Means lebih sederhana dengan satu parameter (jumlah klaster K), dan mudah dioptimalkan via skor Silhouette. Uji coba awal pada subset data kecil memperlihatkan bahwa K-Means memberikan hasil yang relatif baik dan lebih terprediksi.
Pada tahap klastering, penulis akhirnya memilih K-Means. Pengoptimalan jumlah klaster K dilakukan dengan memeriksa skor Silhouette pada rentang K yang luas, lalu memilih K=387 yang memaksimalkan skor (0,596). Angka K yang sangat besar menunjukkan bahwa banyak sekali klaster sempit terbentuk, mencerminkan keragaman aktivitas perencanaan. Hasil klastering akhir menghasilkan beberapa ratus klaster, yang sebagian besar cukup homogen berdasarkan teks aktivitas. Penamaan manual klaster (H3) juga dilakukan dengan beberapa pendekatan, salah satunya mengidentifikasi kata dominan dalam masing-masing klaster. Untuk memastikan proses ini bersifat generalisable, kode Python akhir disusun agar klastering bisa diulang pada data baru.
Langkah kedua dalam metodologi adalah pengembangan algoritma pelabelan (H3). Setelah klaster klaster tersedia, sistem harus dapat mengambil aktivitas baru (dari proyek lain) dan menetapkan ke salah satu klaster yang telah dibentuk. Algoritma ini memanfaatkan fitur-fitur NLP (misalnya representasi teks yang sudah dilatihkan) serta kriteria jarak ke pusat klaster K-Means. Dengan demikian, aktivitas baru diprediksi tipe klasternya. Penulis juga membangun fungsi validasi internal (H3) untuk menilai apakah klaster yang terbentuk benar-benar konsisten: misalnya, dengan mengecek jarak rata-rata ke pusat klaster serta penggunaan grafik siluet untuk memeriksa kepadatan klaster.
Dari segi kebaruan (novelty), penelitian ini menonjol dalam dua aspek. Pertama, pendekatan semi-otomatis yang diusulkan, yakni fokus pada evaluasi rencana antar proyek, ketimbang upaya mengotomasi perencanaan penuh. Penulis secara eksplisit memilih strategi semi-automated planning evaluation, menghindari asumsi berlebihan yang dibutuhkan dalam rencana otomatis lengkap. Kedua, perpaduan teknik ML dan NLP yang menyeluruh untuk mengelompokkan aktivitas perencanaan juga menjadi kontribusi baru. Kombinasi prosedur persiapan data, analisis multikriteria, serta pipeline clustering dan labeling yang diotomasi belum banyak diuraikan di literatur konvensional. Sebagai contoh, penggunaan lemmatization dan penerjemahan dalam rangka menyamakan semantik deskripsi, serta penggunaan skor Silhouette dalam skala sangat besar (dengan ratusan klaster), menunjukkan pendekatan praktis yang khas.
Secara metodologis, penelitian merumuskan hipotesis bahwa mesin dapat belajar pola perencanaan dari data historis. Tujuan penelitian dibagi menjadi tiga: (1) klastering—mengenali tipe-tipe aktivitas perencanaan, (2) pelabelan—menugaskan aktivitas baru ke klaster, dan (3) evaluasi—mengukur keefektifan sistem. Setiap langkah ini diuji menggunakan data proyek nyata (contoh validasi perencanaan jalan raya dan pelaksanaan saluran air). Struktur ini menyederhanakan kompleksitas riset: satu proses fokus membangun klaster, lalu dipakai pada proses selanjutnya. Perlu diperhatikan bahwa tesis ini tidak menyajikan hipotesis numerik yang diuji secara formal, melainkan menetapkan research questions spesifik sebagai panduan eksperimen. Meskipun demikian, metode ekstensif dan pengambilan keputusan yang dinyatakan meyakinkan menjadi fondasi karya ini.
Temuan Utama dengan Kontekstualisasi
Hasil penelitian ini menunjukkan beberapa insight kuantitatif dan kualitatif mengenai penggunaan ML dalam evaluasi perencanaan konstruksi. Secara kuantitatif, performa klastering K-Means dengan konfigurasi akhir menghasilkan skor Silhouette sebesar 0,596 (pada K=387 klaster). Nilai ini secara statistik dianggap "cukup" (umumnya skor >0,5 dianggap baik), namun penulis mengakui bahwa hasilnya tidak sempurna. Beberapa klaster memiliki kesamaan internal rendah, di antaranya terdapat satu klaster “tumpukan” (dump cluster) yang menampung aktivitas residual dengan pola yang kurang jelas. Dengan kata lain, algoritma menemukan keteraturan umum tetapi tidak bisa menjelaskan 100% variasi aktivitas. Sebagai langkah kontekstualisasi, penulis mengaitkan temuan ini dengan risiko algoritma tak terawasi: overfitting (dengan K besar) menyebabkan klaster-klaster terlalu sempit, sementara underfitting (K kecil) akan membaurkan aktivitas tak sejenis. Hasil akhirnya moderat, menempatkan penelitian ini di tengah literatur yang menyatakan bahwa klastering teks perencanaan adalah masalah kompleks tanpa satu solusi mudah.
Rinciannya, setelah uji multikriteria, pilihan jatuh pada K-Means karena kemudahannya dan pemilihan parameter yang terbatas. Untuk data uji kecil, K-Means menunjukkan kinerja baik, hanya memerlukan optimisasi jumlah klaster melalui visualisasi kurva Silhouette. Namun, ketika skala data diperbesar, kompleksitas meningkat pesat. Skrip memeriksa K dari 2 hingga ratusan, dan hasil akhirnya memilih K=387. Hal ini berarti hampir setiap 2-3 aktivitas membentuk satu klaster rata-rata. Kontribusi temuan ini diposisikan terhadap literatur yang menegaskan penggunaan K-Means di domain lain; penulis menunjukkan bahwa dalam kasus perencanaan konstruksi, bahkan K-Means perlu disesuaikan ekstensif (dengan preprocessing ketat) untuk memberikan insight bermakna.
Penerapan algoritma pelabelan baru juga ditelaah. Penulis melaporkan bahwa algoritma ini secara umum mampu mengklasifikasi aktivitas baru ke klaster yang sesuai, asalkan data uji memiliki kesamaan semantik dengan data latih. Namun pada tahap validasi (menggunakan kasus perencanaan jalan tol dan proyek saluran air), ditemukan bahwa akurasi pelabelan masih kurang memuaskan. Sebagian besar kesalahan terjadi pada klaster dengan similitude rendah — kembali mempertegas bahwa klaster yang terbentuk kurang jelas pola batinnya. Temuan ini kontekstual terhadap literatur ML yang mengingatkan bahwa model tak terawasi tidak memiliki umpan balik ground-truth; konsistensi klaster sepenuhnya ditentukan oleh struktur data dan pra-proses yang sudah dilakukan. Penulis mencatat bahwa jika sebagian aktivitas tidak sesuai kategori baku, sistem tidak dapat “menebaknya” dengan tepat. Dengan demikian, makalah ini menambahkan bukti empiris bahwa meski unsupervised clustering menawarkan potensi, efektivitasnya tergantung pada kualitas pra-pemrosesan dan keluasan data.
Dalam perspektif kontribusi ke literatur eksisting, hasil kuantitatif dan kualitatif ini memberikan arah baru. Secara kuantitatif, skor peningkatan efisiensi diukur dalam konteks menghemat waktu analisis perencanaan — misalnya penulis menyatakan bahwa penggunaan ML dapat mempercepat evaluasi lintas proyek secara sistematis dibanding pemeriksaan manual. Meskipun tidak disebutkan angka konkret seperti “peningkatan efisiensi 43%” (karena fokus penelitian ini bukan pada metrik produktivitas langsung), data eksperimen menunjukkan bahwa fungsi otomasinya dapat menyoroti pola keterlambatan yang tidak tampak sebelumnya (misalnya keterlambatan berulang pada kategori pekerjaan tertentu). Ini mengisi gap literatur yang masih jarang memberikan studi kasus nyata di lapangan mengenai ML untuk evaluasi jadwal. Secara kualitatif, penelitian ini mengonfirmasi bahwa mengelompokkan aktivitas dengan ML bisa menyederhanakan problem evaluasi perencanaan menjadi masalah kategorisasi — temuan ini penting bagi peneliti lain yang mungkin memanfaatkan teknik serupa untuk bagian lain dari manajemen proyek.
Lebih jauh, penulis menempatkan hasilnya dalam konteks paradigma digitalisasi. Ia menyoroti bahwa metode yang dikembangkan merupakan titik awal untuk otomatisasi parsial di AEC: memfasilitasi perbandingan lintas jadwal proyek demi mendeteksi potensi risiko (misalnya cluster aktivitas “Instalasi deck KKWeg” yang menunjukkan rata-rata keterlambatan 100% dalam satu proyek vs 67% dalam proyek lain, nilai ini sekadar ilustrasi dari data panjang pada berkas tesis). Dengan mengkaitkan temuan ini dengan tren riset terbaru, ulasan ini menegaskan bahwa studi van de Laar memperluas literatur tentang implementasi AI di manajemen proyek (yang selama ini lebih fokus ke bangunan cerdas atau konstruksi otonom) ke bidang evaluasi jadwal secara kuantitatif. Dalam jurnal ilmiah bereputasi, temuan semacam ini memberikan nilai tambah berupa kasus penggunaan nyata AI di infrastruktur, memperkaya pengetahuan praktisi dan peneliti.
Keterbatasan dan Refleksi Kritis
Penelitian ini juga mengakui sejumlah keterbatasan metodologis yang penting. Pertama, penggunaan klastering tak terawasi tanpa ground truth memunculkan subjektivitas tersendiri. Walaupun skor Silhouette memberikan metrik pemilihan parameter, ia tidak menjamin klaster secara semantik bermakna. Dalam hasilnya, skor 0,596 disimpulkan “cukup”, namun angka ini masih memungkinkan klaster-klaster tumpang tindih. Kebutuhan untuk membuat “klaster pembuangan” menunjukkan adanya aktivitas yang tidak sesuai pola mana pun. Sebagai kritik, peneliti lain mungkin berargumen bahwa pendekatan semi-supervised, dengan memberikan beberapa label awal, bisa meningkatkan kohesi klaster. Terlebih, siluet adalah pengukuran internal yang tidak mempertimbangkan validitas eksternal (apakah klaster benar relevan bagi pengguna), sehingga keandalannya dalam domain ini patut dipertanyakan.
Kedua, choice algoritma K-Means, walaupun dipilih dengan alasan kesederhanaan, juga memiliki kekurangan yang diakui: algoritma ini mengasumsikan klaster berbentuk bola dan hampir sama ukurannya. Data teks rencana proyek kemungkinan tidak memenuhi asumsi ini. Penulis sempat mempertimbangkan DBSCAN, namun mengesampingkannya karena kesulitan menyesuaikan eps. Kritik metodologis bisa menyarankan penggunaan metode klastering alternatif atau ensemble, misalnya Hierarchical Agglomerative atau model berbasis graf, untuk mengatasi bentuk klaster tak teratur. Dalam catatan penutup, penulis sendiri menyarankan eksplorasi algoritma lain untuk meningkatkan Silhouette score. Hal ini mengindikasikan area ke depan bahwa hasil tesis ini sebaiknya tidak dijadikan satu-satunya acuan teknis.
Ketiga, proses pra-pemrosesan data menimbulkan asumsi. Langkah seperti penerjemahan otomatis dari bahasa Belanda ke Inggris atau penghilangan istilah spesifik proyek bisa membuang informasi kontekstual penting. Misalnya, dua proyek infrastruktur berbeda mungkin menggunakan istilah berbeda untuk pekerjaan serupa; penerjemahan mungkin tidak menangkap sinonim lokal. Penggunaan lemmatization juga dapat mengubah makna (misalnya “menanam tiang” vs “menanam pipa” bisa saja memiliki lemmata serupa tetapi konteks berbeda). Oleh karena itu, ada risiko bias atau kehilangan nuansa dalam data yang harus diwaspadai. Kritik membangun untuk penelitian selanjutnya adalah melakukan analisis sensitivitas: sejauh mana hasil klastering tetap valid jika proses NLP diubah?
Keempat, terkait reliabilitas statistik, penelitian ini hanya mengukur ukuran internal (Silhouette) dan beberapa uji kasus validasi. Tidak ada metrik eksternal seperti akurasi pelabelan terhadap penilaian manusia atau evaluasi performa prediksi keterlambatan. Hal ini wajar untuk tesis, tetapi makalah ini dapat dikritik karena tidak menghadirkan metrik kinerja eksplisit seperti presisi, recall, atau F1 untuk algoritma pelabelan. Tanpa ini, sulit menilai secara kuantitatif seberapa baik model memetakan aktivitas baru. Implikasi praktisnya, pengguna industri tidak dapat langsung memahami keandalan sistem.
Sebagai kritik akhir, penelitian ini berfokus pada teks deskripsi aktivitas dan hampir mengabaikan aspek numerik (misalnya durasi atau sumber daya). Pendekatan ini berdampak pada evaluasi hasil: klaster dibangun semata-mata dari teks, sedangkan kenyataannya aktivitas dengan nama sama bisa memiliki karakteristik berbeda (misalnya perbedaan penting dalam durasi atau biaya). Satu kemungkinan perbaikan adalah memasukkan fitur terukur ke dalam klastering (membuat klaster multivariat), atau membandingkan rata-rata durasi aktual antar-klaster. Pendekatan semacam itu tidak dibahas, dan mungkin memang di luar scope, tetapi ke depannya bisa menjadi saran perbaikan metodologi.
Implikasi Ilmiah di Masa Depan
Penelitian ini memiliki implikasi jangka panjang untuk digitalisasi dan AI dalam industri konstruksi. Pertama, hasilnya memvalidasi gagasan bahwa algoritma ML dapat membantu tahap analisis dalam manajemen proyek, khususnya merampingkan evaluasi perencanaan. Ini akan mendorong tren penelitian di mana data historis proyek digunakan sebagai basis pembelajaran—sering diasosiasikan dengan konsep data-driven construction management. Kedua, kesalahan dan keterbatasan yang ditemui menjadi pelajaran berharga: di masa depan, lebih banyak riset dapat mengeksplorasi teknik hibrida (misalnya active learning atau umpan balik ahli) untuk memperbaiki klastering tak terawasi. Hal ini relevan karena industri AEC cenderung lambat berinovasi, sehingga metode yang melibatkan campur tangan manusia secara minimal akan lebih mudah diadopsi.
Lebih luas lagi, temuan mengkontribusi wacana tentang teknik NLP dalam konstruksi. Studi ini menunjukkan bahwa memanfaatkan NLP untuk menormalkan deskripsi proyek merupakan pendekatan yang layak, namun juga menggarisbawahi perlunya leksikon domain-spesifik. Para peneliti di masa depan dapat menggunakan hasil ini sebagai baseline untuk mengembangkan ontologi proyek konstruksi yang kaya, sehingga meminimalisasi penerjemahan otomatis yang kasar. Dalam konteks AI, skripsi ini juga memperlihatkan bahwa penerapan AI di AEC masih berada pada tahap pemetaan pola dasar, bukan prediksi lanjutan. Oleh karena itu, implikasi bagi komunitas riset adalah mendorong pengembangan model prediktif yang memanfaatkan klaster ini, misalnya memprediksi risiko keterlambatan berdasarkan tipe aktivitas.
Relevansi untuk perkembangan digitalisasi lebih lanjut terutama terletak pada penekanan penulis bahwa pendekatan semi-otomatis adalah jembatan menuju otomasi penuh. Industri dapat memanfaatkan hasil penelitian ini dengan mengintegrasikan modul klastering ke dalam software manajemen proyek yang ada. Dengan begitu, perencana proyek masa depan dapat secara otomatis membandingkan rencana baru dengan portofolio proyek sebelumnya, menerima warning awal jika banyak aktivitas jatuh dalam klaster “berisiko tinggi” atau melampaui durasi normal. Hal ini sejalan dengan gerakan digital twin dalam konstruksi, di mana rencana dan data proyek riil disinergikan.
Akhirnya, bidang AI umumnya dapat melihat penelitian ini sebagai studi kasus penting: meski AI canggih (machine learning) sangat potensial, penerapannya harus kontekstual dan dibatasi kesadaran terhadap data. Rekomendasi implikasi ilmiah mencakup perlunya penelitian interdisipliner: kolaborasi antara ahli konstruksi dan ilmuwan data guna menyempurnakan definisi fitur dan klaster yang bermakna. Van de Laar sendiri menunjukkan bahwa penelitian selanjutnya dapat mengeksplorasi algoritma non-unsupervised, atau memungkinkan algoritma “belajar” dari iterasi klastering sebelumnya. Ini membuka jalan untuk model AI adaptif, misalnya deep learning yang memanfaatkan embedding teks untuk kategori aktivitas. Ke depan, integrasi AI dalam perencanaan konstruksi berpotensi menghasilkan sistem saran (recommendation systems) yang lebih cerdas, yang tidak hanya mengelompokkan, tetapi juga memberikan prediksi durasi atau rekomendasi alokasi sumber daya berdasarkan sejarah proyek sejenis.
📚 Daftar Pustaka:
Laar, B.J. van de (2023). A Machine Learning Approach to Effective Evaluation of Project Planning Across Construction Projects. Master Thesis, Eindhoven University of Technology. https://research.tue.nl/en/studentTheses/43a09417-4121-4e3c-98c1-9db6f6578b3b