Untuk menentukan apakah data yang kita sebut adalah benar-benar BigData karena memiliki karakteristik penting, yaitu 4V (Variety, Velocity, Volume, Veracity), sehingga disebut bigdata.
Variety
Variety memiliki tempat yang sangat penting. Variety mengacu pada jenis data yang jelas dan berbagai sumber dari mana data tersebut diperoleh.
Dengan proliferasi teknologi dan jumlah aplikasi yang terus bertambah (perusahaan dan pribadi yang berbeda), ada penekanan yang tinggi pada variasi data. Ini tidak akan turun dalam waktu dekat; sebaliknya, ini diatur untuk meningkat selama periode waktu tertentu.
Secara umum, tipe data dapat dikategorikan menjadi terstruktur dan tidak terstruktur. Aplikasi selama ini terutama berurusan dengan data terstruktur yang sebagian besar disimpan dalam relational database management system (RDBMS).
Hal ini sangat umum, namun saat ini kebutuhan untuk melihat lebih banyak data yang tidak terstruktur, dan beberapa contohnya dapat berupa konten video, konten gambar, konten file dalam bentuk binari, dan sebagainya.
Velocity
Dalam konteks Big Data, kecepatan mengacu pada dua aspek, yaitu:
- rate di mana data dihasilkan
- kemampuan dimana sejumlah besar data dapat dianalisis secara real-time untuk mendapatkan beberapa makna.
Aspek inilah yang menjadi salah satu kekuatan dari beberapa bisnis khususnya ritel. Memberi pelanggan penawaran yang dipersonalisasi dan tepat waktu dapat menjadi faktor penentu pelanggan membeli produk atau meninggalkannya untuk memilih produk yang lebih disukai.
Volume
Dalam konteks Big Data, volume mengacu pada jumlah/skala data yang perlu dianalisis untuk mendapatkan hasil yang bermakna. Tidak ada angka kuantitatif yang mengkategorikan data untuk masuk ke dalam Big Data.
Biasanya, volume ini pasti lebih dari yang ditangani aplikasi konvensional saat ini. Jadi, secara umum, ini cukup besar dan menimbulkan masalah bagi aplikasi tradisional untuk menanganinya sehari-hari (OLTP - OnLine Transaction Processing).
Bagi banyak bisnis, menganalisis dan memanfaatkan data sosial telah menjadi kebutuhan. Aplikasi sosial ini (Facebook, Google+, LinkedIn, dan sebagainya) memiliki miliaran pengguna terdaftar yang menghasilkan miliaran data (terstruktur dan tidak terstruktur) dalam mode sehari-hari.
Selain itu, ada aplikasi yang menghasilkan data dalam jumlah besar dalam bentuk transaksi konvensional dan analitik lainnya (perilaku, berbasis lokasi, dan sebagainya).
Selain itu, dengan semakin banyaknya perangkat yang dapat dikenakan dan sensor yang mengeluarkan data setiap milidetik, aspek volume akan menjadi sangat penting, dan ini tidak akan turun dalam waktu dekat.
Seperti yang dijelaskan di bagian sebelumnya, sampai saat ini dulu ada 3V. Namun baru-baru ini, V keempat diperkenalkan oleh IBM, yaitu veracity.
Untuk data yang tumbuh secara rate eksponensial dan seperti yang disimpulkan dari berbagai sumber yang dapat diandalkan dan tidak dapat diandalkan, pentingnya V ini sangat besar.
Anda pasti sudah pernah mendengar/membaca berita/materi palsu yang beredar di berbagai media sosial ketika ada sesuatu yang penting terjadi di dunia.
V ini membawa aspek akurasi yang sangat penting dalam Big Data. Dengan proliferasi data, terutama di saluran sosial, V ini akan menjadi sangat penting, dan daripada 3V, ini sangat condong ke 4V Big Data.
Veracity
Dalam konteks Big Data, veracity mengacu pada keakuratan data yang dianalisis untuk mendapatkan hasil yang bermakna. Dengan berbagai sumber, terutama data tidak terstruktur yang dimasukkan pengguna yang tidak begitu andal, data yang berasal dari beberapa saluran ini harus dikonsumsi secara yudisial.
Jika suatu perusahaan ingin menggunakan data ini untuk menghasilkan bisnis, keasliannya harus diverifikasi lebih jauh lagi.
Untuk Big Data 4 V tradisional, kita dapat menambahkan 3 V lain yang juga mendasar dalam teknologi Big Data:
Nilai data
Pentingnya dan kemungkinan manfaat yang dapat diperoleh dari data merupakan salah satu faktor mendasar dari teknologi ini.
Nilai yang dapat diperoleh dari data bergantung pada banyak faktor, antara lain penggunaan yang dibuat atau kombinasi yang dibuat antara data itu sendiri untuk mendapatkan hasil yang maksimal.
Visualisasi data
Visualisasi data adalah cara di mana data direpresentasikan untuk ditampilkan dan dijelaskan untuk memfasilitasi pemahaman dan pengambilan keputusan. Selain itu, alat visualisasi data membuat data lebih mudah diakses dan dipahami serta membantu menemukan masalah dan pola.
Kelayakan Data
Ini mengacu pada kemampuan perusahaan untuk menggunakan data yang mereka kumpulkan secara efektif. Dengan kata lain, tidak ada gunanya memiliki data dalam jumlah besar jika informasi yang mereka berikan tidak digunakan secara efisien.
Baca juga: Evolusi Database Jenis Baru - ksqlDB.
Referensi:
- https://www.oracle.com/ph/big-data/what-is-big-data/
- https://opensistemas.com/en/the-four-vs-of-big-data
- https://www.investopedia.com/terms/b/big-data.asp