Baik dalam bahasa umum maupun wacana akademis, data merupakan landasan utama pemrosesan dan analisis informasi modern. Mari kita selami esensi data, manifestasinya yang beragam, dan perannya yang sangat penting dalam membentuk upaya manusia di berbagai ranah.
Mendefinisikan Data
Data, baik yang diekspresikan sebagai nilai diskrit maupun aliran kontinu, merangkum banyak sekali informasi, mulai dari statistik faktual hingga konsep abstrak. Pada intinya, data terdiri dari nilai-nilai individual yang dikenal sebagai "datum", yang secara kolektif membentuk kumpulan data yang diorganisasikan ke dalam struktur seperti tabel, memberikan konteks dan memfasilitasi interpretasi. Dari penelitian ilmiah hingga analisis ekonomi, data merembes ke hampir semua aspek aktivitas manusia, yang berfungsi sebagai bahan mentah untuk mendapatkan wawasan yang dapat ditindaklanjuti.
Pengumpulan dan Analisis
Teknik pengumpulan data, termasuk pengukuran, observasi, dan analisis, menghasilkan repositori informasi numerik atau karakter yang sangat besar. Data lapangan, yang diperoleh dari lingkungan yang tidak terkendali, dan data eksperimental, yang dihasilkan melalui eksperimen ilmiah yang terkendali, menjalani analisis yang ketat dengan menggunakan berbagai metodologi seperti penghitungan, visualisasi, dan penalaran. Sebelum dianalisis, data mentah menjalani proses pembersihan untuk memperbaiki kesalahan dan menghilangkan pencilan, memastikan integritas dan keakuratan analisis selanjutnya.
Evolusi Big Data
Kemunculan teknologi komputasi telah mengantarkan era data besar, yang ditandai dengan volume informasi yang sangat besar, sering kali dalam skala petabyte. Metode analisis data tradisional kesulitan untuk bergulat dengan kumpulan data yang begitu besar, sehingga memerlukan pendekatan inovatif. Masuklah ke dalam ilmu data, sebuah bidang yang sedang berkembang yang memanfaatkan pembelajaran mesin dan kecerdasan buatan untuk mengekstrak wawasan yang bermakna dari data besar secara efisien.
Etimologi dan Terminologi
Berakar dari kata Latin "datum," yang berarti "sesuatu yang diberikan," istilah "data" telah berkembang selama berabad-abad untuk menunjukkan informasi komputer yang dapat dikirim dan disimpan. Meskipun penggunaannya sebagai kata benda massal dalam bentuk tunggal lazim digunakan dalam bahasa sehari-hari dan bidang teknis, bentuk jamaknya tetap ada dalam konteks yang berkaitan dengan pemrosesan dan analisis data. Dualitas linguistik ini menggarisbawahi sifat data yang memiliki banyak aspek dan beragam aplikasi di berbagai disiplin ilmu.
Arti Sebuah Data, informasi, pengetahuan, dan kebijaksanaan
Data, informasi, pengetahuan, dan kebijaksanaan adalah konsep yang penting dan saling terkait dalam konteks pengelolaan dan penggunaan informasi. Data adalah kumpulan nilai diskrit atau kontinu yang menyampaikan informasi, sedangkan informasi adalah hasil analisis data yang membuatnya bermanfaat untuk pengambilan keputusan. Pengetahuan adalah kesadaran tentang lingkungan yang dimiliki oleh suatu entitas, sementara kebijaksanaan melibatkan penggunaan pengetahuan dan informasi untuk membuat keputusan yang bijaksana.
Sebelum era komputasi, data dikumpulkan dan diinterpretasikan secara manual. Namun, perkembangan teknologi telah memungkinkan pengumpulan dan analisis data secara otomatis menggunakan komputer. Data digunakan untuk mengidentifikasi pola dan informasi yang berguna untuk meningkatkan pengetahuan kita tentang berbagai fenomena. Namun, penting untuk diingat bahwa data harus diinterpretasikan dengan hati-hati untuk menghasilkan informasi yang berguna.
Komputer digunakan untuk merepresentasikan data, baik dalam bentuk analog maupun digital. Program komputer adalah koleksi data yang diinterpretasikan sebagai instruksi untuk komputer. Metadata adalah deskripsi dari data lain yang membantu dalam pengelolaan dan pemahaman informasi.
Dalam era big data saat ini, tantangan utama adalah memastikan aksesibilitas, keandalan, dan keamanan data. Ini memerlukan standar dan praktik terbaik dalam pengelolaan data, termasuk persyaratan untuk data yang dapat ditemukan, diakses, diinterpretasikan, dan digunakan kembali. Dengan memahami perbedaan antara data, informasi, pengetahuan, dan kebijaksanaan, kita dapat mengoptimalkan penggunaan informasi untuk mengambil keputusan yang lebih baik dan mencapai tujuan kita secara efektif.
Dokumen Data
Dalam dunia teknologi informasi, data merupakan inti dari segala hal yang kita lakukan. Ketika data perlu didaftarkan atau diakses, hal ini biasanya dilakukan melalui apa yang disebut sebagai dokumen data. Jenis-jenis dokumen data meliputi:
- repositori data
- studi data
- set data
- perangkat lunak
- paper data
- basis data
- panduan data
- jurnal data
Beberapa dari dokumen-dokumen data ini, seperti repositori data, studi data, set data, dan perangkat lunak, diindeks dalam Indeks Kutipan Data, sementara paper data diindeks dalam basis data bibliografis tradisional, seperti Science Citation Index.
Pengumpulan data dapat dilakukan melalui sumber primer (peneliti adalah orang pertama yang mendapatkan data) atau sumber sekunder (peneliti mendapatkan data yang sudah dikumpulkan oleh sumber lain, seperti data yang disebarkan dalam jurnal ilmiah). Metodologi analisis data bervariasi dan meliputi triangulasi data dan perkolasi data. Yang terakhir menawarkan metode yang terartikulasi untuk mengumpulkan, mengklasifikasikan, dan menganalisis data menggunakan lima sudut analisis yang mungkin (setidaknya tiga) untuk memaksimalkan objektivitas penelitian dan memungkinkan pemahaman fenomena yang sedang diselidiki selesai mungkin: metode kualitatif dan kuantitatif, tinjauan literatur (termasuk artikel ilmiah), wawancara dengan pakar, dan simulasi komputer. Data kemudian "diperkolasi" menggunakan serangkaian langkah yang telah ditentukan untuk mengekstrak informasi paling relevan.
Umur Panjang Data dan Aksesibilitas Data
Salah satu bidang penting dalam ilmu komputer, teknologi, dan ilmu perpustakaan adalah masa pakai dan aksesibilitas data. Penelitian ilmiah menghasilkan jumlah data yang besar, terutama dalam genomika dan astronomi, tetapi juga dalam ilmu kedokteran, misalnya dalam pencitraan medis. Di masa lalu, data ilmiah telah dipublikasikan dalam makalah dan buku, disimpan di perpustakaan, tetapi lebih baru ini hampir semua data disimpan di hard drive atau disk optik. Namun, berbeda dengan kertas, perangkat penyimpanan ini mungkin menjadi tidak terbaca setelah beberapa dekade. Penerbit ilmiah dan perpustakaan telah berjuang dengan masalah ini selama beberapa dekade, dan masih belum ada solusi yang memuaskan untuk penyimpanan data jangka panjang selama berabad-abad atau bahkan untuk selama-lamanya.
Masalah lainnya adalah bahwa banyak data ilmiah tidak pernah dipublikasikan atau disimpan di repositori data seperti basis data. Dalam survei terbaru, data diminta dari 516 studi yang diterbitkan antara 2 hingga 22 tahun sebelumnya, tetapi kurang dari satu dari lima studi ini mampu atau bersedia menyediakan data yang diminta. Secara keseluruhan, kemungkinan untuk mengambil data turun 17% setiap tahun setelah publikasi. Demikian juga, survei terhadap 100 set data di Dryad menemukan bahwa lebih dari setengahnya kurang memiliki rincian untuk memperbanyak hasil penelitian dari studi-studi ini. Hal ini menunjukkan situasi yang buruk dari akses terhadap data ilmiah yang tidak dipublikasikan atau tidak memiliki cukup rincian untuk direproduksi.
Salah satu solusi untuk masalah reproduktibilitas adalah upaya untuk mensyaratkan data yang FAIR, yaitu data yang Findable, Accessible, Interoperable, and Reusable. Data yang memenuhi persyaratan ini dapat digunakan dalam penelitian berikutnya dan dengan demikian memajukan ilmu pengetahuan dan teknologi.
Disadur dari: en.wikipedia.org