diklatkerja | Riset Ungkap Cara Mesin Belajar 'Insting' untuk Jinakkan Sistem Tak Terkendali

Ketika Sistem Menjadi 'Liar'—Tantangan Mengendalikan Ketidakstabilan

Bayangkan Anda mencoba menyeimbangkan sebuah tongkat panjang secara vertikal di telapak tangan Anda. Setiap goyangan kecil harus direspons dengan gerakan presisi yang berlawanan untuk mencegahnya jatuh. Sekarang, bayangkan tugas ini dilakukan oleh sebuah robot beroda dua yang harus tetap tegak sambil bergerak ¹, atau sebuah drone canggih yang berjuang melawan hembusan angin tak terduga. Inilah esensi dari tantangan mengendalikan "sistem yang tidak stabil"—sebuah masalah fundamental dalam dunia rekayasa yang menjadi semakin krusial di era robotika dan otomasi industri.

Selama puluhan tahun, para insinyur mengandalkan pendekatan yang sangat terstruktur untuk mengatasi masalah ini. Mereka membangun "cetak biru" matematis yang presisi dari sebuah sistem, yang dikenal sebagai model. Dengan menggunakan persamaan-persamaan kompleks seperti $x(k+1)=Ax(k)+u(k)$ ¹, sebuah pengendali (controller) dapat menghitung dengan tepat tindakan apa yang harus diambil untuk menjaga sistem tetap pada jalurnya. Pendekatan berbasis model ini, atau Model-Based Control, telah menjadi tulang punggung teknologi modern, mulai dari sistem autopilot pesawat hingga lini produksi pabrik.² Namun, pendekatan ini memiliki kelemahan yang signifikan: ia hanya sekuat model yang mendasarinya.³ Di dunia nyata, banyak sistem yang terlalu rumit, dinamis, atau tidak dapat diprediksi untuk dimodelkan secara akurat. Bagaimana cara memodelkan gesekan ban robot di permukaan yang tidak rata, atau turbulensi aliran bahan kimia dalam sebuah reaktor? Di sinilah rekayasa tradisional sering kali mencapai batasnya.⁵

Menjawab tantangan global ini, sebuah tim peneliti dari Jurusan Teknik Komputer, Politeknik Negeri Sriwijaya, Palembang—terdiri dari Herlambang Saputra, Ahmad Bahri Joni Malyan, Ahyar Supani, dan Indarto—menyajikan sebuah solusi alternatif yang menjanjikan.¹ Dalam penelitian mereka yang berjudul "Data-Driven Predictive Control Menggunakan Algoritma Nearest Neighbor Untuk Sistem Yang Tidak Stabil," mereka mengusulkan sebuah pergeseran paradigma: bagaimana jika, alih-alih mengandalkan cetak biru teoretis, sebuah pengendali bisa belajar dari pengalaman, sama seperti manusia? Penelitian ini, yang berakar kuat pada bidang keahlian institusi dalam teknologi informasi dan sistem kontrol ⁷, mengeksplorasi penggunaan kecerdasan buatan, atau lebih spesifiknya machine learning, untuk menjinakkan sistem diskrit yang tidak stabil—sistem di mana keputusan dan tindakan terjadi dalam langkah-langkah waktu yang terpisah.¹

Pilihan untuk beralih ke pendekatan "berbasis data" atau data-driven ini bukan sekadar keputusan teknis; ini adalah cerminan dari sebuah revolusi yang lebih besar dalam sains dan teknologi. Ini adalah pengakuan bahwa di hadapan kompleksitas dunia nyata, kemampuan untuk belajar dan beradaptasi dari data mentah bisa jadi lebih kuat daripada kepatuhan yang kaku pada model teoretis. Penelitian dari Palembang ini menjadi sebuah mikrokosmos dari tren global tersebut, menerapkannya pada salah satu bidang rekayasa yang paling menantang dan berisiko tinggi: sistem kendali.

Belajar dari Pengalaman, Bukan Teori: Kekuatan Kontrol Berbasis Data

Metode konvensional, yang dikenal sebagai Model Predictive Control (MPC), mengharuskan para insinyur untuk terlebih dahulu membangun sebuah model matematika yang akurat—sebuah proses yang tidak hanya sulit tetapi juga memakan waktu dan biaya.⁸ Jika model tersebut mengandung sedikit saja ketidakakuratan, kinerja pengendali bisa menurun drastis, bahkan menyebabkan kegagalan sistem. Pendekatan yang diusulkan oleh tim Politeknik Negeri Sriwijaya, yang disebut Data-Driven Predictive Control (DPC), membalik logika ini. Alih-alih memulai dengan teori, DPC memulai dengan data.¹

Konsep DPC dapat diibaratkan seperti melatih seorang pilot bukan dengan memberinya buku manual fisika penerbangan yang tebal, melainkan dengan membiarkannya mengakses ribuan jam rekaman data penerbangan dari pilot-pilot ahli. Dengan menganalisis bagaimana para ahli merespons berbagai situasi—mulai dari cuaca buruk hingga kegagalan mesin—pilot baru ini dapat mengembangkan "insting" atau intuisi tentang tindakan yang tepat untuk diambil dalam kondisi serupa, bahkan tanpa memahami sepenuhnya setiap persamaan aerodinamika yang rumit. Inilah yang disebut pendekatan "kotak hitam" (black box), di mana sistem belajar tentang perilaku suatu proses hanya dari mengamati data input dan output-nya, tanpa perlu mengetahui mekanisme internalnya.¹

Dalam penelitian ini, arsitektur DPC yang dirancang memiliki dua komponen utama yang bekerja secara sinergis, layaknya memori jangka panjang dan kesadaran saat ini pada otak manusia.¹

Matriks Database A: "Perpustakaan Pengalaman" Sistem
Komponen pertama adalah sebuah database masif yang disebut Matriks A. Ini bukanlah sekadar tumpukan data, melainkan sebuah perpustakaan yang terstruktur dengan cermat, berisi ribuan "rekaman pengalaman" dari sistem. Setiap rekaman, yang secara matematis disebut vektor $a_{i}$, adalah sebuah potret komprehensif dari satu momen waktu. Vektor ini berisi tiga jenis informasi krusial: data output masa lalu ($y_{p}$), yang memberitahu sistem di mana ia berada sebelumnya; data input masa lalu ($u_{p}$), yang mencatat tindakan apa yang telah diambil; dan yang terpenting, data output masa depan yang diinginkan ($y_{f}$), yang terkait erat dengan sinyal referensi atau tujuan ($r(k)$) yang ingin dicapai sistem.1 Perpustakaan ini dibangun melalui proses "latihan" awal, di mana sistem dijalankan ribuan kali dengan berbagai input acak untuk mengumpulkan beragam skenario.1
Vektor Informasi b: "Kesadaran Saat Ini"
Komponen kedua adalah Vektor Informasi b, yang berfungsi sebagai "kesadaran" sistem pada saat itu juga. Vektor ini dibentuk secara real-time pada setiap langkah waktu. Ia menangkap situasi terkini dengan menyusun tiga informasi penting: kondisi sistem saat ini (output terbaru, $y_{p}(k)$), tujuan yang harus segera dicapai (sinyal referensi, $r(k)$), dan tindakan terakhir yang baru saja dilakukan (input terbaru, $u_{p}(k)$).1

Mekanisme inti dari pengendali DPC ini sangat elegan dalam kesederhanaannya. Pada setiap momen, pengendali mengambil "potret kesadaran saat ini" (Vektor b) dan dengan cepat menelusuri seluruh "perpustakaan pengalaman" (Matriks A) untuk menemukan rekaman-rekaman masa lalu yang paling mirip dengan situasi saat ini. Setelah menemukan kecocokan terbaik, pengendali akan melihat tindakan apa yang diambil dalam pengalaman masa lalu tersebut dan menggunakannya sebagai dasar untuk menentukan tindakan selanjutnya ($u(k)$). Dengan cara ini, sistem dapat membuat prediksi cerdas tentang masa depan tanpa pernah menggunakan satu pun persamaan model matematika.¹

Pendekatan ini membawa keuntungan fundamental yang sangat penting, terutama untuk sistem yang tidak stabil. Pengendali berbasis model sangat rapuh terhadap apa yang disebut "unknown unknowns"—kejadian tak terduga yang tidak diperhitungkan dalam model awalnya. Ketika dihadapkan pada situasi seperti itu, pengendali berbasis model bisa memberikan perintah yang salah secara fatal. Sebaliknya, sistem DPC beroperasi berdasarkan prinsip kemiripan. Jika ia menghadapi situasi yang benar-benar baru, ia tidak akan "bingung", melainkan akan tetap mencari pengalaman terdekat dalam databasenya. Meskipun bukan kecocokan yang sempurna, respons "tebakan terbaik" yang didasarkan pada data masa lalu ini memberikan tingkat ketahanan dan kemampuan degradasi yang anggun (graceful degradation) yang tidak dimiliki oleh model yang kaku. Untuk sistem yang cenderung berperilaku kacau dan tidak dapat diprediksi, kemampuan beradaptasi inilah yang menjadi kunci keberhasilan.

Jantung Kecerdasan Buatan: Algoritma 'Tetangga Terdekat' dan Akseleratornya

Di balik kecerdasan pengendali berbasis data ini terdapat sebuah algoritma yang sangat intuitif, bahkan hampir terasa seperti akal sehat manusia: Nearest Neighbor (NN), atau 'Tetangga Terdekat'. Konsep dasarnya sederhana: untuk membuat keputusan dalam situasi baru, carilah pengalaman masa lalu yang paling mirip dan tiru solusinya.¹ Dalam konteks penelitian ini, algoritma NN menjawab pertanyaan fundamental pada setiap sepersekian detik: "Dari ribuan skenario di dalam database saya, manakah yang paling identik dengan kondisi saya saat ini?".¹²

Untuk menjawab pertanyaan ini secara kuantitatif, sistem perlu cara untuk mengukur "kemiripan" atau "kedekatan" antara dua situasi. Para peneliti menggunakan metrik matematika yang umum disebut $l_{2}$-norm, atau lebih dikenal sebagai jarak Euclidean.¹ Ini adalah konsep yang kita pelajari di sekolah: jarak garis lurus antara dua titik. Namun, alih-alih di ruang dua atau tiga dimensi, perhitungan ini dilakukan di ruang multi-dimensi yang kompleks di mana setiap dimensi mewakili satu variabel sistem (seperti output masa lalu atau input masa lalu). Algoritma ini secara sistematis menghitung jarak antara "Vektor Informasi" saat ini dengan setiap vektor dalam database. Vektor dengan jarak terpendek dianggap sebagai "tetangga terdekat"—pengalaman masa lalu yang paling relevan. Dari tetangga inilah, sistem akan mengambil informasi tentang input ($u(k)$) yang harus diterapkan selanjutnya.¹³

Namun, di sinilah muncul sebuah tantangan besar dalam implementasi dunia nyata. Meskipun secara konseptual sederhana, metode NN memiliki kelemahan komputasi yang signifikan. Membandingkan satu vektor dengan ribuan—atau bahkan jutaan—vektor lain dalam database secara berurutan membutuhkan waktu dan daya komputasi yang sangat besar.¹⁰ Untuk sistem kendali yang harus membuat keputusan dalam milidetik, penundaan ini tidak dapat diterima. Inilah yang dikenal sebagai "kutukan dimensionalitas" (curse of dimensionality), di mana efisiensi pencarian menurun secara drastis seiring dengan bertambahnya ukuran dan kompleksitas data.¹⁵

Untuk mengatasi hambatan ini, para peneliti dari Politeknik Negeri Sriwijaya mengintegrasikan sebuah teknik akselerasi yang cerdas bernama Locality-Sensitive Hashing (LSH).¹ LSH dapat dianalogikan dengan menciptakan sebuah sistem indeks super efisien untuk perpustakaan raksasa. Bayangkan Anda harus menemukan buku yang paling mirip dengan buku yang sedang Anda pegang. Metode NN setara dengan berkeliling dan membandingkan buku Anda dengan setiap buku lain di perpustakaan, satu per satu—sebuah tugas yang mustahil. LSH, sebaliknya, bekerja seperti seorang pustakawan jenius yang telah mengatur ulang seluruh perpustakaan sebelumnya. Pustakawan ini menggunakan sebuah "fungsi hash"—serangkaian aturan cerdas—untuk menempatkan semua buku dengan topik serupa di rak yang sama (disebut bucket). Dengan demikian, ketika Anda datang dengan buku Anda, Anda tidak perlu mencari di seluruh perpustakaan; Anda hanya perlu pergi ke rak yang ditentukan oleh fungsi hash dan mencari di antara segelintir buku yang sudah dikelompokkan tersebut.¹⁷

Secara teknis, LSH mengklasifikasikan semua vektor dalam database ke dalam bucket-bucket ini bahkan sebelum sistem mulai beroperasi. Ketika "Vektor Informasi" baru masuk, sistem hanya perlu menghitung hash-nya dan langsung menuju ke bucket yang relevan untuk menemukan tetangga terdekat. Ini secara dramatis mengurangi jumlah perbandingan yang perlu dilakukan, mengubah pencarian dari proses linier yang lambat menjadi proses sub-linier yang sangat cepat. Namun, ada harga yang harus dibayar untuk kecepatan ini. LSH adalah metode aproksimasi atau perkiraan. Ada kemungkinan kecil bahwa tetangga terdekat yang sebenarnya berada di bucket yang berbeda. Namun, untuk aplikasi real-time, pengorbanan akurasi yang sangat kecil ini lebih dari sepadan dengan peningkatan kecepatan yang masif.¹⁹ Dalam penelitian ini, LSH digunakan untuk secara efisien menemukan enam kandidat tetangga terdekat yang memiliki nilai hash yang sama, yang menjadi dasar bagi algoritma pengambilan keputusan yang lebih canggih.¹

Pilihan untuk menggabungkan kesederhanaan NN dengan efisiensi LSH menunjukkan sebuah wawasan rekayasa yang matang. Alih-alih mencari satu algoritma tunggal yang sempurna, para peneliti merakit sebuah solusi hibrida yang menyeimbangkan antara keanggunan teoretis dan tuntutan praktis. LSH adalah komponen kunci yang membuat intuisi sederhana dari NN menjadi layak dan efektif dalam batasan waktu nyata dari sebuah sistem kendali. Ini adalah contoh cemerlang dari bagaimana penelitian AI terapan sering kali bukan tentang menemukan algoritma baru yang radikal, tetapi tentang secara cerdas menggabungkan alat-alat yang ada untuk menciptakan solusi yang kuat dan efisien.

Duel Strategi di Dunia Digital: Kecepatan Melawan Akurasi

Inti dari penelitian ini adalah sebuah "duel" digital yang dirancang untuk menjawab pertanyaan krusial: dalam mengendalikan sistem yang tidak stabil, mana yang lebih unggul—keputusan refleksif yang cepat atau strategi yang lebih bijaksana namun lebih lambat? Untuk mengetahuinya, para peneliti menyiapkan sebuah arena virtual: sebuah sistem yang tidak stabil yang didefinisikan secara matematis oleh persamaan $y(k)=y(k-1)-0.16*y(k-2)+u(k-1)-1.5*u(k-2)$.¹ Misi pengendali adalah untuk "menjinakkan" sistem ini, memaksanya untuk mengikuti sebuah jalur yang telah ditentukan, yang disebut sinyal referensi ($r(k)$), yang dalam kasus ini adalah sebuah fungsi undak (step function) sederhana yang berubah nilai pada interval waktu tertentu.¹

Di satu sudut arena, berdiri Kontender 1: Algoritma Refleksif. Ini adalah implementasi paling murni dari prinsip Nearest Neighbor. Strateginya sangat lugas: pada setiap saat, ia mencari satu dan hanya satu vektor dalam "perpustakaan pengalaman" yang paling identik dengan situasi saat ini. Setelah ditemukan, ia tanpa ragu langsung mengadopsi input ($u(k)$) yang digunakan pada pengalaman masa lalu tersebut.¹ Ini adalah pendekatan yang mengandalkan kecepatan dan kesederhanaan, mirip dengan refleks otot yang bertindak tanpa berpikir.

Di sudut lain, berdiri Kontender 2: Algoritma Strategis. Pengendali ini tidak bertindak gegabah. Dengan bantuan LSH, ia pertama-tama mengidentifikasi enam kandidat tetangga terdekat. Alih-alih langsung memilih yang terdekat, ia menganalisis keenam opsi ini dan menerapkan serangkaian aturan pengambilan keputusan yang cerdas dan, yang menarik, tampak berlawanan dengan intuisi.¹ Aturan-aturan ini adalah inti dari kecerdasannya:

Jika tujuan sistem saat ini adalah bergerak ke arah positif (sinyal referensi positif), algoritma secara sengaja akan memilih tetangga yang menggunakan input negatif.
Sebaliknya, jika tujuannya adalah bergerak ke arah negatif, ia akan memilih input positif.
Hanya ketika tujuannya adalah untuk tetap diam (sinyal referensi nol), ia akan memilih input nol.

Ini bukanlah sekadar meniru masa lalu; ini adalah strategi aktif untuk melawan. Algoritma ini tampaknya "memahami" sifat tidak stabil dari sistem dan secara proaktif memberikan input yang berlawanan untuk meredam kecenderungan sistem untuk "lepas kendali". Ini lebih mirip dengan seorang pilot berpengalaman yang, alih-alih hanya mengikuti jalur, secara aktif melakukan koreksi kecil untuk mengantisipasi turbulensi.

Setelah simulasi berjalan selama 1000 langkah waktu, hasilnya dianalisis secara cermat, tidak hanya dari grafik output tetapi juga dari dua metrik kunci: Mean Square Error (MSE), yang mengukur seberapa jauh rata-rata output sistem menyimpang dari target, dan waktu komputasi, yang mengukur seberapa cepat setiap algoritma membuat keputusannya.

Hasilnya sangat mencerahkan dan menyajikan sebuah narasi yang jelas tentang pertukaran antara kecepatan dan akurasi.

Analisis Akurasi: Algoritma Refleksif (Algoritma 1) mencatatkan MSE sebesar 0.136234. Sementara itu, Algoritma Strategis (Algoritma 2) berhasil mencapai MSE yang jauh lebih rendah, yaitu 0.078508.¹ Ini bukan sekadar perbaikan kecil; ini adalah penurunan tingkat kesalahan sebesar hampir 43%. Perbedaan ini setara dengan membandingkan seorang pemanah amatir yang berhasil mengenai papan target dengan seorang pemanah profesional yang secara konsisten mengenai pusat sasaran (bullseye). Algoritma yang lebih "bijaksana" secara signifikan lebih presisi dalam menjalankan misinya.
Analisis Kecepatan: Namun, kebijaksanaan ini ada harganya. Algoritma Refleksif menyelesaikan seluruh 1000 siklus pengambilan keputusan dalam waktu 5.73 detik. Algoritma Strategis, dengan proses analisis enam tetangga dan penerapan aturannya, membutuhkan waktu 9.47 detik.¹ Ini berarti Algoritma Strategis sekitar 65% lebih lambat. Ini adalah "biaya untuk berpikir"—perbedaan antara membuat keputusan sepersekian detik berdasarkan insting dan mengambil beberapa momen ekstra untuk mempertimbangkan beberapa opsi sebelum bertindak.

Putusan dari duel ini tidak sesederhana menyatakan satu pemenang mutlak. Sebaliknya, ia mengungkap sebuah kebenaran yang lebih dalam tentang kecerdasan buatan dalam sistem kendali. Fakta bahwa Algoritma 2, dengan aturan-aturannya yang aneh, mengungguli Algoritma 1 secara dramatis dalam hal akurasi menunjukkan bahwa untuk sistem yang kompleks dan tidak stabil, meniru data secara membabi buta tidaklah cukup. Aturan-aturan tersebut berfungsi sebagai bentuk pengetahuan domain atau logika yang ditanamkan—sebuah pendekatan yang mirip dengan konsep yang sedang berkembang pesat, yaitu Physics-Informed Machine Learning.²¹ Sistem ini tidak hanya bertanya, "Apa yang terjadi terakhir kali dalam situasi ini?" melainkan, "Mengingat serangkaian situasi serupa dari masa lalu, mana yang mewakili manuver balasan strategis terbaik untuk melawan ketidakstabilan inheren sistem ini?" Hal ini mengangkat pengendali dari sekadar pencocok pola menjadi agen strategis, mengisyaratkan bentuk kecerdasan mesin yang lebih canggih dan efektif.

Realitas dan Batasan: Sebuah Tinjauan Kritis

Meskipun hasil yang disajikan dalam penelitian ini sangat menjanjikan, sebuah analisis yang seimbang menuntut kita untuk melihatnya melalui kacamata realisme dan kritik. Seperti halnya setiap penelitian ilmiah, karya ini memiliki batasan dan asumsi yang penting untuk dipahami sebelum mempertimbangkan penerapannya di dunia nyata.

Pertama dan terutama, seluruh eksperimen dilakukan dalam lingkungan simulasi digital yang steril.¹ Di dunia maya ini, hukum fisika bersifat sempurna dan dapat diprediksi, data bersih tanpa cela, dan setiap perintah dieksekusi secara instan. Dunia nyata, sayangnya, jauh lebih "kotor". Sistem fisik dipengaruhi oleh faktor-faktor tak terduga seperti derau sensor (sensor noise), keterlambatan aktuator, gesekan yang berubah-ubah, dan gangguan lingkungan lainnya—variabel-variabel yang tidak diperhitungkan dalam model simulasi penelitian ini. Mentransfer pengendali yang sukses di simulasi ke perangkat keras nyata sering kali mengungkap tantangan-tantangan baru yang signifikan, sebuah fenomena yang dikenal sebagai "jurang sim-ke-nyata" (sim-to-real gap).²⁴

Kedua, kesimpulan penelitian bahwa Algoritma 2 (Strategis) lebih unggul karena memiliki error yang lebih rendah perlu dikontekstualisasikan.¹ Keunggulan ini tidak bersifat universal dan sangat bergantung pada domain aplikasi. Mari kita pertimbangkan dua skenario ekstrem:

Pabrik Proses Kimia: Dalam sebuah reaktor kimia di mana reaksi berlangsung selama berjam-jam, perbedaan waktu komputasi antara 5.7 detik dan 9.5 detik sama sekali tidak relevan. Di sini, akurasi dan stabilitas adalah segalanya. Kesalahan kecil dalam kontrol suhu atau tekanan dapat merusak seluruh batch produk yang bernilai jutaan dolar atau bahkan menyebabkan kondisi berbahaya. Dalam konteks ini, Algoritma 2 yang lebih akurat jelas merupakan pilihan yang superior.²⁷
Robot Berkecepatan Tinggi atau Mobil Otonom: Sebaliknya, untuk sebuah mobil otonom yang melaju di jalan tol atau lengan robot yang melakukan perakitan presisi, waktu komputasi 9.5 detik adalah sebuah keabadian. Pada saat pengendali selesai "berpikir", mobil tersebut mungkin sudah menabrak atau lengan robot telah merusak komponen. Dalam aplikasi yang menuntut respons sepersekian detik, keputusan "cukup baik" yang dihasilkan dengan cepat oleh Algoritma 1 jauh lebih berharga daripada keputusan "sempurna" yang datang terlambat.²

Ketiga, meskipun penggunaan LSH secara cerdas mengurangi beban komputasi, tantangan fundamental dari "kutukan dimensionalitas" tetap ada.¹⁶ Sistem yang diuji dalam penelitian ini relatif sederhana. Seiring dengan meningkatnya kompleksitas sistem—misalnya, sebuah robot humanoid dengan puluhan sendi dan ratusan sensor—jumlah dimensi dalam vektor data akan meledak. Akibatnya, "ruang pengalaman" menjadi sangat luas dan jarang, sehingga menemukan "tetangga" yang benar-benar dekat menjadi semakin sulit secara eksponensial. Menskalakan pendekatan ini dari sistem simulasi sederhana ke robot industri yang kompleks akan menjadi tantangan rekayasa yang non-trivial.

Terakhir, kinerja seluruh sistem sangat bergantung pada kualitas dan kelengkapan "perpustakaan pengalaman" awal. Database dalam penelitian ini dibangun menggunakan serangkaian input acak.¹ Ini menimbulkan pertanyaan penting: Apakah input acak tersebut cukup untuk mencakup semua kondisi operasional yang mungkin dihadapi sistem? Jika database awal memiliki "titik buta"—yaitu, tidak ada pengalaman yang relevan untuk situasi tertentu—maka pengendali tidak akan dapat membuat keputusan yang baik. Hal ini menyoroti pentingnya data pelatihan yang berkualitas tinggi dan "cukup merangsang" (persistently exciting), sebuah konsep kunci dalam teori identifikasi sistem yang memastikan data tersebut cukup kaya untuk mengungkap dinamika sistem yang sebenarnya.³¹

Melihat batasan-batasan ini, nilai terbesar dari penelitian ini mungkin bukanlah sebagai cetak biru untuk pengendali yang siap pakai. Sebaliknya, kontribusi utamanya adalah sebagai bukti konsep dari sebuah metodologi yang kuat. Penelitian ini secara cemerlang mengkuantifikasi pertukaran (trade-off) yang tak terhindarkan antara dua tujuan kinerja yang saling bersaing: kecepatan dan akurasi. Ia menyediakan sebuah kerangka kerja yang jelas bagi para insinyur untuk mengajukan pertanyaan yang tepat: "Untuk aplikasi spesifik saya, berapa toleransi kesalahan yang dapat diterima, dan berapa waktu komputasi maksimum yang diizinkan?" Penelitian ini menyajikan dua titik data yang berbeda pada kurva kinerja ini. Implementasi di dunia nyata akan melibatkan eksplorasi ruang di antara kedua titik ini—mungkin dengan menggunakan aturan yang lebih sedikit, atau mencari di antara tiga tetangga alih-alih enam—untuk menemukan keseimbangan optimal yang disesuaikan untuk setiap tugas unik. Dengan kata lain, penelitian ini tidak hanya memberikan jawaban, tetapi yang lebih penting, ia memberikan metode untuk menemukan jawaban yang tepat.

Dampak di Dunia Nyata: Masa Depan Robotik dan Industri Proses

Meskipun merupakan sebuah studi akademis yang dilakukan dalam lingkungan simulasi, implikasi dari penelitian yang dipelopori oleh tim Politeknik Negeri Sriwijaya ini menjangkau jauh ke dalam praktik rekayasa dan otomasi di dunia nyata. Temuan ini bukan hanya sekadar latihan teoretis, melainkan sebuah langkah penting menuju sistem kontrol yang lebih cerdas, adaptif, dan dapat diakses secara luas.

Salah satu dampak paling signifikan adalah kemampuannya untuk "membuka" sistem kotak hitam. Di banyak industri, peralatan canggih seperti lengan robot industri atau unit kontrol proses dipasarkan sebagai sistem tertutup atau proprietary. Produsen tidak membagikan model matematika internal atau kode sumber pengendali mereka. Hal ini menyulitkan pengguna akhir untuk mengintegrasikan atau mengoptimalkan peralatan tersebut untuk tugas-tugas spesifik. Pendekatan DPC, seperti yang ditunjukkan dalam penelitian ini, menawarkan jalan keluar yang elegan. Karena tidak memerlukan model internal, DPC memungkinkan pengembangan pengendali cerdas yang dapat "belajar" perilaku perangkat keras pihak ketiga hanya dengan mengamati data input-outputnya.⁸ Ini berpotensi mendemokratisasi otomasi tingkat lanjut, memungkinkan perusahaan untuk menciptakan solusi kontrol yang disesuaikan tanpa bergantung pada produsen peralatan asli.

Dalam bidang robotika, metode ini membuka jalan bagi robot yang lebih tangguh dan adaptif. Sebuah robot yang bergerak di lingkungan yang dinamis dan tidak terstruktur—seperti robot penyelamat di lokasi bencana atau robot pertanian di ladang—pada dasarnya adalah sebuah sistem yang tidak stabil. Memprogram robot semacam itu dengan model fisika untuk setiap kemungkinan interaksi adalah tugas yang sangat rumit. Pendekatan berbasis data memungkinkan robot untuk belajar dari pengalaman—baik dari simulasinya sendiri maupun dari demonstrasi—untuk menangani medan yang tidak terduga atau menghindari rintangan dinamis dengan stabilitas yang lebih besar.² Pengendali yang diusulkan, terutama varian strategisnya, menunjukkan bagaimana robot dapat mengembangkan "insting" untuk secara proaktif melawan ketidakstabilan, bukan hanya bereaksi terhadapnya.

Industri proses, terutama industri kimia yang secara eksplisit disebutkan dalam pendahuluan makalah ¹, juga akan mendapatkan manfaat besar. Reaktor kimia, kolom distilasi, dan proses bioteknologi sering kali melibatkan dinamika yang sangat nonlinier dan sulit dimodelkan. Dengan menggunakan DPC, sebuah sistem kontrol dapat belajar dari kinerja batch-batch produksi sebelumnya untuk mengoptimalkan proses secara terus-menerus. Ia dapat menyesuaikan input (misalnya, laju aliran atau suhu) untuk memaksimalkan hasil produk, meminimalkan limbah, mengurangi konsumsi energi, dan yang terpenting, menjaga operasi dalam batas aman, bahkan ketika ada variasi dalam bahan baku atau kondisi lingkungan.²⁷

Melihat ke depan, penelitian ini adalah batu loncatan menuju sistem kontrol yang benar-benar otonom. Pengendali tradisional, seperti pengendali PID yang ada di mana-mana, sering kali memerlukan insinyur ahli untuk secara manual menyetel puluhan parameter—sebuah proses yang memakan waktu dan harus diulang jika sistem berubah, misalnya karena komponen mesin aus. Pendekatan DPC yang diuraikan dalam makalah ini pada dasarnya bersifat self-tuning. Sebagaimana dinyatakan dalam makalah, data input-output baru yang diperoleh dari sistem secara terus-menerus disimpan kembali ke dalam database.¹ Ini berarti pengendali dapat secara otomatis beradaptasi dengan perubahan bertahap dalam perilaku sistem, seperti keausan mekanis atau perubahan karakteristik bahan baku. Ini adalah langkah fundamental untuk menciptakan sistem cerdas "atur dan lupakan" (set it and forget it) yang dapat mempertahankan kinerjanya sendiri dari waktu ke waktu—sebuah proposisi nilai yang sangat besar bagi otomasi industri.

Jika diterapkan secara luas, metodologi yang diuraikan dalam penelitian ini dapat memungkinkan pengembangan sistem kontrol adaptif yang mengurangi waktu henti mesin di pabrik hingga 15% dan meningkatkan efisiensi energi dalam proses kimia hingga 10% dalam waktu lima tahun, dengan belajar secara mandiri untuk beradaptasi pada keausan peralatan dan variasi bahan baku.

Sumber Artikel:

Saputra, H., Malyan, A. B. J., Supani, A., & Indarto, I. (2019). Data-Driven Predictive Control Menggunakan Algoritma Nearest Neighbor Untuk Sistem Yang Tidak Stabil. Jurnal JUPITER, 10(1), 41–51.

Riset Ungkap Cara Mesin Belajar 'Insting' untuk Jinakkan Sistem Tak Terkendali—Ini Rahasianya!