Perbedaan Antara Semi Join Dan Bloom Join

Perbedaan Antara Semi Join Dan Bloom Join
Perbedaan Antara Semi Join Dan Bloom Join

Video: Perbedaan Antara Semi Join Dan Bloom Join

Video: Perbedaan Antara Semi Join Dan Bloom Join
Video: 1 Relational Algebra Semijoin 2024, November
Anonim

Semi Bergabung vs Bloom Bergabung

Semi join dan Bloom join adalah dua metode penggabungan yang digunakan dalam pemrosesan kueri untuk database terdistribusi. Saat memproses kueri dalam database terdistribusi, data perlu ditransfer antar database yang terletak di situs berbeda. Ini bisa menjadi operasi yang mahal tergantung pada jumlah data yang perlu ditransfer. Oleh karena itu, saat memproses kueri dalam lingkungan database terdistribusi, penting untuk mengoptimalkan kueri untuk meminimalkan jumlah data yang ditransfer antar situs. Semi join dan bloom join adalah dua metode yang dapat digunakan untuk mengurangi jumlah transfer data dan melakukan pemrosesan kueri yang efisien.

Apa itu Semi Join?

Semi join adalah metode yang digunakan untuk pemrosesan kueri yang efisien dalam lingkungan database terdistribusi. Pertimbangkan situasi di mana database Karyawan (menyimpan informasi seperti nama karyawan, nomor departemen tempat dia bekerja, dll) terletak di situs 1 dan database Departemen (menyimpan informasi seperti nomor departemen, nama departemen, lokasi, dll) terletak di situs 2. Misalnya jika kita ingin mendapatkan nama karyawan dan nama departemen tempat dia bekerja (hanya dari departemen yang terletak di "New York"), dengan menjalankan kueri di pemroses kueri yang terletak di situs 3, ada beberapa cara yang data dapat ditransfer antara tiga situs untuk mencapai tugas ini. Tetapi saat mentransfer data, penting untuk dicatat bahwa tidak perlu mentransfer seluruh database antar situs. Hanya beberapa atribut (atau tuple) yang diperlukan untuk gabungan yang perlu ditransfer antar situs untuk menjalankan kueri secara efisien. Semi join adalah metode yang dapat digunakan untuk mengurangi jumlah data yang dikirim antar situs. Dalam semi join, hanya kolom join yang ditransfer dari satu situs ke situs lainnya dan kemudian kolom yang ditransfer itu digunakan untuk mengurangi ukuran hubungan yang dikirim antara situs lain. Untuk contoh di atas, Anda dapat mentransfer nomor departemen dan nama departemen tupel dengan lokasi = "New York" dari situs 2 ke situs 1 dan melakukan penggabungan di situs 1 dan mentransfer relasi terakhir kembali ke situs 3.hanya kolom gabungan yang ditransfer dari satu situs ke situs lainnya dan kemudian kolom yang ditransfer itu digunakan untuk mengurangi ukuran hubungan yang dikirim antara situs lain. Untuk contoh di atas, Anda bisa mentransfer nomor departemen dan nama departemen tupel dengan location = "New York" dari situs 2 ke situs 1 dan melakukan penggabungan di situs 1 dan mentransfer relasi terakhir kembali ke situs 3.hanya kolom gabungan yang ditransfer dari satu situs ke situs lainnya dan kemudian kolom yang ditransfer itu digunakan untuk mengurangi ukuran hubungan yang dikirim antara situs lain. Untuk contoh di atas, Anda bisa mentransfer nomor departemen dan nama departemen tupel dengan location = "New York" dari situs 2 ke situs 1 dan melakukan penggabungan di situs 1 dan mentransfer relasi terakhir kembali ke situs 3.

Apa itu Bloom Join?

Seperti yang disebutkan sebelumnya, bloom join adalah metode lain yang digunakan untuk menghindari transfer data yang tidak perlu antar situs saat menjalankan kueri dalam lingkungan database terdistribusi. Dalam bloom join, daripada mentransfer kolom join itu sendiri, representasi kompak dari kolom join ditransfer antar situs. Bloom join menggunakan filter mekar yang menggunakan vektor bit untuk menjalankan kueri keanggotaan. Pertama, filter mekar dibuat menggunakan kolom gabungan dan ditransfer antara situs dan kemudian operasi penggabungan dilakukan.

Apa perbedaan antara Semi Join dan Bloom Join?

Meskipun metode semi join dan bloom join digunakan untuk meminimalkan jumlah data yang ditransfer antar situs saat menjalankan kueri di lingkungan database terdistribusi, bloom join mengurangi jumlah data (jumlah tupel) yang ditransfer dibandingkan dengan semi join dengan memanfaatkan konsep filter mekar, yang menggunakan vektor bit untuk menentukan keanggotaan yang ditetapkan. Oleh karena itu penggunaan bloom join akan lebih efisien daripada menggunakan semi join.

Direkomendasikan: