PENDAHULUAN
Ketika
dunia menjadi suatu sumber informasi lebih dari yang sebelumnya, tantangan
utamanya adalah bagaimana berurusan dengan ledakan data yang begitu besar. Kerangka
tradisional pengelolaan data sekarang gesper di bawah volume raksasa dataset
hari ini. Untungnya, lanskap yang berubah dengan cepat teknologi baru
adalah mendefinisikan ulang bagaimana kita bekerja dengan data pada skala super
besar. Teknologi ini menuntut generasi baru DBA dan infrastruktur insinyur
/ pengembang untuk mengelola sistem yang jauh lebih canggih.
Berikut ini adalah ikhtisar teknologi penting untuk
mengetahui tentang untuk konteks di sekitar infrastruktur data yang besar.
- RDBMS
tradisional (teknologi yang lebih tua, kehilangan relevansi)
- NoSQL
Sistem Basis Data
- Hadoop,
MapReduce, dan komputasi paralel masif
PEMBAHASAN
Apa
yang dimaksud dengan Relational Database?
RDBMS
tradisional (sistem manajemen database relasional) telah menjadi standar de
facto untuk manajemen database seluruh usia internet. Arsitektur belakang
RDBMS adalah sedemikian rupa sehingga data yang diatur dalam cara yang sangat
terstruktur, mengikuti model
relasional . Padahal, RDBMS sekarang dianggap sebagai
teknologi database menurun. Sementara organisasi yang tepat dari data yang
terus meningkat, kebutuhan data yang akan terstruktur dengan baik benar-benar
menjadi beban yang cukup besar pada volume yang sangat besar, sehingga
penurunan kinerja sebagai ukuran akan lebih besar. Dengan demikian, RDBMS
umumnya tidak dianggap sebagai solusi scalable untuk memenuhi kebutuhan data
yang besar.
Apa
NoSQL?
NoSQL
(sering disebut sebagai " Not Only SQL " )
merupakan kerangka kerja yang sama sekali berbeda dari database yang memungkinkan
untuk kinerja tinggi, pengolahan tangkas informasi di skala besar. Dengan
kata lain, itu adalah infrastruktur database yang seperti sangat baik
disesuaikan dengan tuntutan berat data besar.
Efisiensi NoSQL dapat dicapai karena tidak seperti
database relasional yang sangat terstruktur, database NoSQL yang tidak
terstruktur di alam, perdagangan dari persyaratan ketat untuk konsistensi
kecepatan dan kelincahan.NoSQL berpusat di sekitar konsep database
terdistribusi, dimana data tidak terstruktur dapat disimpan di beberapa node
pengolahan, dan sering di beberapa server. Arsitektur ini memungkinkan
didistribusikan database NoSQL menjadi horizontal scalable; sebagai data
terus meledak, hanya menambah hardware untuk menjaga, tanpa perlambatan kinerja. The
NoSQL infrastruktur basis data terdistribusi telah menjadi solusi untuk
menangani beberapa data warehouse terbesar di planet ini - yaitu orang-orang
seperti Google, Amazon, dan CIA.
Apa
Hadoop?
Hadoop
bukan tipe database, melainkan ekosistem perangkat lunak yang memungkinkan
untuk komputasi paralel secara besar-besaran. Ini adalah enabler jenis
tertentu NoSQL database terdistribusi (seperti HBase), yang dapat memungkinkan
untuk data yang akan tersebar di ribuan server dengan sedikit penurunan kinerja.
Sebuah
pokok dari ekosistem Hadoop MapReduce adalah, model komputasi yang pada
dasarnya membutuhkan proses data yang intensif dan menyebar perhitungan di
sejumlah berpotensi tak berujung server (umumnya disebut sebagai cluster
Hadoop). Ini telah menjadi game-changer dalam mendukung kebutuhan
pengolahan besar data yang besar; prosedur data yang besar yang mungkin
memakan waktu 20 jam dari waktu pemrosesan pada sistem database relasional
terpusat, hanya dapat mengambil 3 menit ketika didistribusikan di sebuah Hadoop
kelompok besar server komoditas, semua proses secara paralel.
The
Bottom Line
Sebagai
data yang besar terus turun jalurnya pertumbuhan, tidak ada keraguan bahwa
pendekatan inovatif - memanfaatkan arsitektur database NoSQL dan software
Hadoop - akan menjadi pusat untuk memungkinkan perusahaan mencapai potensi
penuh dengan data. Selain itu, majunya teknologi ini data yang telah
memicu meningkatnya permintaan untuk menyewa generasi berikutnya jenius teknis
yang dapat membangun infrastruktur yang kuat ini. Biaya teknologi dan
bakat mungkin tidak murah, tapi untuk semua nilai bahwa data yang besar mampu
membawa ke meja, perusahaan menemukan bahwa itu adalah investasi yang sangat
layak.
KESIMPULAN
Penulisan ini
berisi penjelasan-penjelasan mengenai teorema-teorema pemrosesan data berskala
besar atau Big Data Teknologi beserta
metode-metode yang berpengaruh pada aspek-spek yang berhubungan dalam
pemrosesan-pemrosesan data-data yang berskala besar agar mapu dikoordinasi
dengan baik, agar meminimalisasi overflow pada sistem penyimpanan data yang
tersedia sehingga munculnya beberapa metode-metode umum yang menangani
kasus-kasus dalam pemrosesan data diantaranya yaitu RDBMS, NoSQL,Hadoop, Bottom
Line, dan sebagainya, dimana pada pembahasan penulisan ini dilengkapi dari pengertian-pengertian
metode dan kesimpulan berdasarkan metode yang digunakan. Selain itu sebagai
bahan untuk pembaca yang ingin mempelajari mengenai pemrosesan big data. Dapat
mempelajarinya dengan beberapa metode yang telah ibahas sebelumnya.
DAFTAR PUSTAKA
https://datajobs.com/what-is-hadoop-and-nosql
http://thetechnologychronicle.blogspot.com/2013/08/what-is-big-datahadoopnosql-and.html
Tidak ada komentar:
Posting Komentar