Sistem Basis Data Terdistribusi
Sunday, October 25, 2020
Edit
Sistem Basis data Terdistribusi
a. Pengantar.
File processing/pemrosesan file memakai prinsip setiap aplikasi mempunyai data tersendiri. Hal ini menghipnotis efesiensi dan efekifitas sehingga muncul konsep data base system /system basis data. Konsep ini mendasarkan pada prinsip bahwa data dibuat, disediakan dan dikelola secara terpusat/sentral. Konsep ini menjadikan kegiatan aplikasi tidak lagi tergantung pada perubahan data baik secara logic maupun fisik dan juga sebaliknya, yang disebut dengan data independence.
Pada perkembangan system database; data yang tersimpan semakin besar, pemrosesan semakin kompleks, data sanggup diakses dengan memakai teknologi sehingga muncul system database terdistribusi.
b. Distributed data processing / pemrosesan data terdistribusi.
Merupakan sekumpulan peralatan pemrosesan yang saling terhubung melalui jaringan yang mengerjakan tugas-tugas tertentu.
Pemrosesan terdistribusi sanggup dikelompokan menurut beberapa kriteria yaitu :
- Degree Coupling / Tingkat korelasi : tinggi atau rendah ?
- Jumlah data yang saling digunakan dibandingkan dengan jumlah pemrosesan lokal.
- Struktur antar korelasi : berpengaruh atau lemah ?
Jika komponen sanggup di share dikatakan kuat
Kesaling tergantungan komponen-komponen.
Kuat atau lemah dalam mengekseskusi proses.
Keselarasan antar komponen.
Pemrosesan terdistribusi berkembang alasannya ialah kebutuhan untuk sanggup memecahkan problem besar dan kompleks dengan memakai banyak sekali macam hukum divide and conquer. Alasan lain yang fundamental ialah struktur organisasi yang bermetamorfosis terdistribusi.. Karena perkembangan pemrosesan terdistribusi inilah maka kemudian berkembang distributed database system.
c. Distributed database system / system database terdistribusi
Merupakan sekumpulan database yang saling terhubung secara logical dan secara fisik terdistribusi pada banyak sekali tempat melalui jaringan computer.
Sistem yang mengelola database terdistribusi dan menyediakan prosedur biar distribusi transparent ialah distributed database management system (DDBMS).
Berikut ini ialah ciri-ciri untuk system yang bukan merupakan system database terdistribusi :
Sistem yang berisi kumpulan file
Berbagai arsitektur fisik berkait dengan system multiprocessor dibawah ini :
- Shared memory multiprocessor
- Shared disc multiprocessor
Shared nothing multiprocessor system
Database terpusat pada jaringan
d. Sistem Database terdistribusi
d.1 Beberapa ciri system database terdistribusi ialah :
- Data disimpan pada sejumlah tempat. Setiap tempat secara logic terdiri dari processor tunggal.
- Processor pada tempat yang berbeda tersebut dihubungkan dengan jaringan computer.
- Bukan sekumpulan file yang berada pada banyak sekali tempat tetapi merupakan database pada banyak sekali tempat.
- Setiap tempat mempunyai kemampuan untuk berdikari memproses usul user yang membutuhkan jalan masuk kedata ditempat tersebut, dan juga bisa untuk memproses data yang tersimpan di tempat lain.
d.2 Keuntungan sistem database terdistribusi ialah :
Pengelolaan secara transparan data terdistribusi dan replicated.
- Mengurangi ketergantungan data
- Transparansi jaringan
- Transparansi replikasi
- Transparansi fragmentasi
- Mengacu pada struktur organisasi
- Meningkatkan kemampuan untuk share dan otonomi local
- Meningkatkan ketersediaan data
- Meningkatkan kehandalan
- Meningkatkan unjuk kerja
- Memudahkan pengembangan system
d.3 Kelemahan system database terdistribusi ialah :
- Kompleksitas manajemen
- Control integritas lebih sulit
- Biaya pengembangan
- Keamanan
- Kurang standarisasi
- Menambahkan kebutuhan penyimpanan
- Lebih sulit dalam mengatur lingkungan data
- Menambah biaya pelatihan.
Bagian II
Jaringan Komputer
a. Konsep Jaringan dam Hubungannya Dengan Sistem DatabaseTerdistribusi
Untuk sanggup saling bekerjasama antar site pada sistem database terdistribusi dibutuhkan jaringan komunikasi komputer. Jaringan komputer ialah interkoneksi antara sejumlah komputer autonomous yang sanggup saling bertukar informasi antara komputer yang terhubung. Bentuk komputer yang saling terhubung biasanya disebut dengan Node, host atau site. Bentuk korelasi antar komputer tidak hanya melalui kawat tembaga saja, tetapi sanggup melalui serat optic, gelombang mikro dan satelit komunikasi.
Komponen pokok dalam jaringan komputer ialah hardware yang digunakan untuk saling berkomunikasi.
Distributed Database Management System (DDBMS) dibangun pada top of network, sedemikian rupa sehingga jaringan tidak nampak pada user. User tidak perlu tahu kerumitan pengelolaan jaringan, semuanya sudah dilakukan secara otomatik oleh sistem.
Konsep komunikasi merupakan perpindahan informasi berbantuan sistem transmisi listrik via lebih dari 1 jaringan data yang tergantung pada protokol. Komunikasi data dibutuhkan alasannya ialah adanya pengiriman dan penerimaan data atau saling tukar infromasi jarak jauh.
b. Tipe Jaringan
Terdapat 3 kriteria untuk pembagian terstruktur mengenai jaringan komputer, yaitu :
- Topologi Jaringan : menurut struktur interkoneksi dari komputer
- Model transmisian
- Scale : menurut pada distribusi secara geografis
b.1 Topologi
- Struktur fisik setiap elemen jaringan sanggup saling berhubungan.
- Arsitekstur topologi dasar :
- Bus, yang hanya mempunyai satun jalur transmisi muara elemen jaringan, terbuka keduabelah ujung.
- Ring, yang mempunyai hanya satu jalur transmisi bulat tertutup.
- Star, yang mempunyai central node dan dengan dasar point to point link elemen-elemen jaringan tersambung, sehingga transmisi sanggup dilakukan secara simultan.
- Hub/tree, variasi bus dan rin
b.2 Model transmisi
Terdapat 2 jenis transmisi yaitu :
1. Jaringan broadcast (Multi point)
Memiliki saluran komunikasi tunggal yang digunakan bersama oleh semua mesin. Pesan berukuran kecil biasanya disebut dengan paket. Setiap paket mempunyai alamat yang akan digunakan untuk men cek pada dikala paket tersebut diterima oleh mesin akseptor (tujuan).
2. Jaringan point to point (Unicast point)
Terdiri dari beberapa korelasi pasangan individu dari mesin. Untuk mengirim paket dari sumber ketempat tujuan, sebuah paket mungkin harus melalui satu atau lebih mesin-mesin perantara.
b.3 Scale (LAN, WAN, MAN)
LAN apabila distribusi pada letak geografis jarak pendek (short) pada site yang sama, sedang WAN untuk jarak jauh (long). MAN ialah bentuk Istimewa dari WAN yang umumnya meng-cover kota atau kawasan pinggir kota.
Bagian III
Desain Sistem Database Terdistribusi (SBDT)
Hal yang penting dperhatikan dalam system terdistribusi ialah memilih penempatan data dan kegiatan pada jaringan computer. Menentukan desain suatu organisasi sanggup dipandang 3 dimensi, yaitu :
1. Tingkat Sharing, terdiri dari :
· Tidak ada sharing : apilikasi dan data dijalankan dari setiap lokasi dan tidak ada komunikasi dengan kegiatan atau jalan masuk ke data ke lokasi lain.
· Shaing data : semua kegiatan disalin/replica disemua lokasi, tetapi data tidak disalin. Permintaan data dari user diolah oleh komputer dimana user mengakses dan file data akan dikirimkan melalui jaringan.
· Sharing data dan kegiatan : user dari suatu lokasi sanggup meminta layanan baik kegiatan maupun data dari lokasi lain dan juga sebaliknya.
2. Jenis Pola Akses, terdiri data :
- Statik. Pola jalan masuk tidak berubah dari waktu ke waktu
- Dinamik. Pola jalan masuk berubah dari waktu ke waktu
3. 3. Tingkat pengetahuan pada jenis contoh akses.
Diukur dari berapa banyak desainer mempunyai informasi perihal bagaimana user akan megakses data.
- Informasi lengkap : tidak ada penyimpangan yang signifikan dari prediksi perihal contoh jalan masuk user.
- Informasi sebagian : ada penyimpangan dari prediksi.
a. Pendekatan Desain Terdistribusi
Terdapat 2 seni administrasi desain yang utama untuk membangun SBDT ialah pendekatan top down dan pendekatan bottom up
- Pendekatan Bottom Up dilakukan jika sudah ada database yang disebar dibeberapa lokasi.
- Pendekatan Top Down
Dalam ”Distribution Design” dilakukan desain untuk mendistribusilam kekerabatan ke semua lokasi dalam sistem terdistribusi. Tetapi kelemahan dalam mendistribusikan sebuah kekerabatan ialah harus menangani data yang besar, maka kekerabatan dipecah-pecah menjadi sub kekerabatan yang disebut :
Fragmen.
Fragmen.
Desain untuk sistem terdistribusi sanggup melalui langkah Fragmentasi, penempatan data atau alokasi dan replikasi.
Tujuan Distribusi Data dengan cara Fragmentasi, penempatan data atau alokasi dan replikasi ialah :
1. Referensi lokalitas.
Data seharusnya diletakan sedekat mungkin dengan lokasi pengaksesan data. Jika fragmen data digunakan pada beberapa lokasi maka akan lebih menguntungkan jika fragmen disimpan pada lokasi-lokasi tersebut.
2. Meningkatkan Reliabilitas/kehandalan dan avaibilitas/ketersediaan.
Hal ini sanggup dilakukan dengan replikasi, yaitu terdapat salinan data dilokasi lain.
3. Meningkatkan unjuk kerja.
Penemapatan/alokasi yang tidak baik akan menghasilkan kemacetan dalam mengakses data. Contoh sebuah lokasi ada rush/kebanjiran usul data akan menghipnotis unjuk kerja.
4. Keseimbangan kapasitas penyimpanan dan biaya.
Meskipun harus menjamin ketersediaan data dan mempertimbangkan rujukan lokalitas tetapi harus dipertimbangkan juga kapasitas penyimpanan yang tidak besar sehingga menjamin biaya penyimpanam lebih murah.
5. Biaya komunikasi minimal.
Harus dipertimbangkan biaya komunikasi antar lokasi penyimpanan. Biaya pengambilan data minimal jika lokalitas maksimum (fragmen data ada dibanyak lokasi). Tetapi jika terjadi update, maka harus dilakukan terhadap data disemua lokasi salinan fragmen data, sehingga biaya akan membengkak.
b. Fragmentasi
Yang akan didistribusikan ádalah kekerabatan atau tabel. Alasan mengapa suata tabel difragmentasi untuk kemudian didistribusikan ádalah :
1. Penggunaan.
Dalam realitas, data yang sering digunakan bukanlah data dalam seluruh tabel, tetapi hanya sebagian data atau sering disebut view.
2. Efesiensi.
Data disimpan dilokasi paling bersahabat dengan pengguna yang sering mengakses. Sehingga data yang tidak sering dibutuhkan untuk lokasi tertentu tidak akan disimpan pada lokasi yang bersangkutan.
3. Paralel.
Karena data yang didistribusikan berupa fragmen data, maka transaksi yang berupa Query tunggal sanggup dipecah menjadi subquery yang dikenalan terhadap fragmen data, sehingga transaksi sanggup dillakukan secara bersamaan (Concurrent)
4. Keamanan.
Data yang tidak dibutuhkan oleh aplikasi local tidak akan disimpan dalam lokasi tersebut, sehingga pengguna yang tidak mempunyai hak untuk mengakses tidak akan bisa mengakses data yang lain.
Kelemahan dari fragmentasi ádalah :
1. Menurunnya unjuk kerja.
View yang melibatkan lebih dari satu fragüen data pada lokasi yang berbeda akan mengalami penurunan unjuk kerja.
2. Integritas.
Pengendalian integritas lebih sulit jira atribut yang berperan dalam dependency didistribusikan kebeberapa lokasi.
Fragmentasi data sanggup dibuat secara HORIZONTAL atau VERTICAL atau CAMPURAN.
c. Aturan-aturan kebenaran Fragmentasi
Fragmentasi tidak sanggup dilakukan secara sembarangan. Untuk memastikan bahwa tidak terdapat perubahan data dalam database selama menjalani proses fragmentasi, proses fragmentasi harus memenuhi 3 hukum berikut ini :
1. Compléteness.
- ika sebuah kekerabatan R dibagi menjadi fragmen-fragmen r1, r2., … ,rn, maka fragmentasi dikatakan komplit jika dan hanya jika setiap item data yang ditemukan dalam R sanggup juga ditemukan didalam salah satu atau lebih fragmen ri.
- Aturan ini dibutuhkan untuk memastikan bahwa tidak ada data yang hilang selama proses fragmentasi
2. Reconstruction
3. Disjointness
- Jika sebuah kekerabatan R dibagi menjadi fragmen-fragmen r1, r2., … ,rn, dan data item dj berada didalam fragmen ri maka fragmentasi dikatakan disjoint jika dan hanya jika data dj tidak berada didalam fragmen lain.
- Fragmentasi secara vertical mempunyai pengecualian untuk hukum ini, alasannya ialah atribut-atribut dari primary key harus diulang untuk sanggup melaksanakan rekontruksi.
- turan ini dibutuhkan untuk memastikan terjadinya redudansi data seminimal mungkin.
d. Fragmentasi Horizontal.
Fragmentasi horizontal berisi tuple-tuple yang dipartisi atau dibagi dari sebuah kekerabatan global R kedalam sejumlah subset r1, r2., … ,rn. Tiap-tiap subset berisikan sejumlah tuple dari R. Setiap tuple dalam R harus mempunyai lebih dari satu fragmen, sehingga kekerabatan yang orisinil sanggup disusun kembali. Sebuah fragmen dalam fragmentasi horizontal sanggup didefinisikan sebagai sebuah seleksi pada kekerabatan global R. Oleh alasannya ialah itu sebuah predikat Pi digunakan untuk menyusun fragmen ri didefinisikan dengan operasi selection sebagai berikut : ri = σpi(r). Penyusunan kembali dari kekerabatan R sanggup diperoleh dengan mengambil adonan dari seluruh fragmen : R= r1U r2U r3….U rn.
e Fragmentasi Vertical.
Dalam fragmentasi vertical, setiap fragmen ri didefinisikan dengan operasi Project sebagai : ri = Πci (R). Penyusunan kembali dari kekerabatan R sanggup diperoleh dengan mengambil adonan dari seluruh fragmen operasi ф (natural joint) : R= r1ф r2 ф r3…. ф rn. Relasi hasil fragmentasi berisi sebagian atribut/kolom dari kekerabatan global dan harus mempunyai atribut primary key yang akan digunakan sebagai tuple-id pada dikala rekontruksi. Dalam fragmentasi vertikal tidak harus mempunyai fragmen yang dijoint menyerupai pada fragmen horizontal.