Pages

Subscribe:

Pengikut

Sabtu, 10 Mei 2014

Teknologi Big Data

PENDAHULUAN
Ketika dunia menjadi suatu sumber informasi lebih dari yang sebelumnya, tantangan utamanya adalah bagaimana berurusan dengan ledakan data yang begitu besar. Kerangka tradisional pengelolaan data sekarang gesper di bawah volume raksasa dataset hari ini. Untungnya, lanskap yang berubah dengan cepat teknologi baru adalah mendefinisikan ulang bagaimana kita bekerja dengan data pada skala super besar. Teknologi ini menuntut generasi baru DBA dan infrastruktur insinyur / pengembang untuk mengelola sistem yang jauh lebih canggih.
Berikut ini adalah ikhtisar teknologi penting untuk mengetahui tentang untuk konteks di sekitar infrastruktur data yang besar.
  • RDBMS tradisional (teknologi yang lebih tua, kehilangan relevansi)
  • NoSQL Sistem Basis Data
  • Hadoop, MapReduce, dan komputasi paralel masif

PEMBAHASAN
Apa yang dimaksud dengan Relational Database?
RDBMS tradisional (sistem manajemen database relasional) telah menjadi standar de facto untuk manajemen database seluruh usia internet. Arsitektur belakang RDBMS adalah sedemikian rupa sehingga data yang diatur dalam cara yang sangat terstruktur, mengikuti model relasional . Padahal, RDBMS sekarang dianggap sebagai teknologi database menurun. Sementara organisasi yang tepat dari data yang terus meningkat, kebutuhan data yang akan terstruktur dengan baik benar-benar menjadi beban yang cukup besar pada volume yang sangat besar, sehingga penurunan kinerja sebagai ukuran akan lebih besar. Dengan demikian, RDBMS umumnya tidak dianggap sebagai solusi scalable untuk memenuhi kebutuhan data yang besar.
Apa NoSQL?
NoSQL (sering disebut sebagai " Not Only SQL " ) merupakan kerangka kerja yang sama sekali berbeda dari database yang memungkinkan untuk kinerja tinggi, pengolahan tangkas informasi di skala besar. Dengan kata lain, itu adalah infrastruktur database yang seperti sangat baik disesuaikan dengan tuntutan berat data besar.
Efisiensi NoSQL dapat dicapai karena tidak seperti database relasional yang sangat terstruktur, database NoSQL yang tidak terstruktur di alam, perdagangan dari persyaratan ketat untuk konsistensi kecepatan dan kelincahan.NoSQL berpusat di sekitar konsep database terdistribusi, dimana data tidak terstruktur dapat disimpan di beberapa node pengolahan, dan sering di beberapa server. Arsitektur ini memungkinkan didistribusikan database NoSQL menjadi horizontal scalable; sebagai data terus meledak, hanya menambah hardware untuk menjaga, tanpa perlambatan kinerja. The NoSQL infrastruktur basis data terdistribusi telah menjadi solusi untuk menangani beberapa data warehouse terbesar di planet ini - yaitu orang-orang seperti Google, Amazon, dan CIA.
Apa Hadoop?

Hadoop bukan tipe database, melainkan ekosistem perangkat lunak yang memungkinkan untuk komputasi paralel secara besar-besaran. Ini adalah enabler jenis tertentu NoSQL database terdistribusi (seperti HBase), yang dapat memungkinkan untuk data yang akan tersebar di ribuan server dengan sedikit penurunan kinerja.
Sebuah pokok dari ekosistem Hadoop MapReduce adalah, model komputasi yang pada dasarnya membutuhkan proses data yang intensif dan menyebar perhitungan di sejumlah berpotensi tak berujung server (umumnya disebut sebagai cluster Hadoop). Ini telah menjadi game-changer dalam mendukung kebutuhan pengolahan besar data yang besar; prosedur data yang besar yang mungkin memakan waktu 20 jam dari waktu pemrosesan pada sistem database relasional terpusat, hanya dapat mengambil 3 menit ketika didistribusikan di sebuah Hadoop kelompok besar server komoditas, semua proses secara paralel.

The Bottom Line
Sebagai data yang besar terus turun jalurnya pertumbuhan, tidak ada keraguan bahwa pendekatan inovatif - memanfaatkan arsitektur database NoSQL dan software Hadoop - akan menjadi pusat untuk memungkinkan perusahaan mencapai potensi penuh dengan data. Selain itu, majunya teknologi ini data yang telah memicu meningkatnya permintaan untuk menyewa generasi berikutnya jenius teknis yang dapat membangun infrastruktur yang kuat ini. Biaya teknologi dan bakat mungkin tidak murah, tapi untuk semua nilai bahwa data yang besar mampu membawa ke meja, perusahaan menemukan bahwa itu adalah investasi yang sangat layak.

KESIMPULAN
Penulisan ini berisi penjelasan-penjelasan mengenai teorema-teorema pemrosesan data berskala besar atau Big Data Teknologi beserta metode-metode yang berpengaruh pada aspek-spek yang berhubungan dalam pemrosesan-pemrosesan data-data yang berskala besar agar mapu dikoordinasi dengan baik, agar meminimalisasi overflow pada sistem penyimpanan data yang tersedia sehingga munculnya beberapa metode-metode umum yang menangani kasus-kasus dalam pemrosesan data diantaranya yaitu RDBMS, NoSQL,Hadoop, Bottom Line, dan sebagainya, dimana pada pembahasan penulisan ini dilengkapi dari pengertian-pengertian metode dan kesimpulan berdasarkan metode yang digunakan. Selain itu sebagai bahan untuk pembaca yang ingin mempelajari mengenai pemrosesan big data. Dapat mempelajarinya dengan beberapa metode yang telah ibahas sebelumnya.

DAFTAR PUSTAKA
https://datajobs.com/what-is-hadoop-and-nosql
http://thetechnologychronicle.blogspot.com/2013/08/what-is-big-datahadoopnosql-and.html

Tidak ada komentar:

Posting Komentar