Różnica Między Połączeniem Semi I Rozkwitem

Różnica Między Połączeniem Semi I Rozkwitem
Różnica Między Połączeniem Semi I Rozkwitem
Anonim

Semi Join vs Bloom Join

Łączenie semi i łączenie Bloom to dwie metody łączenia używane w przetwarzaniu zapytań dla rozproszonych baz danych. Podczas przetwarzania zapytań w rozproszonych bazach danych dane muszą być przesyłane między bazami danych znajdującymi się w różnych witrynach. Może to być kosztowna operacja w zależności od ilości danych, które należy przesłać. Dlatego podczas przetwarzania zapytań w środowisku rozproszonej bazy danych ważna jest optymalizacja zapytań w celu zminimalizowania ilości danych przesyłanych między lokacjami. Łączenie semi i bloom to dwie metody, których można użyć w celu zmniejszenia ilości przesyłanych danych i wydajnego przetwarzania zapytań.

Co to jest Semi Join?

Łączenie półprzewodnikowe to metoda używana do wydajnego przetwarzania zapytań w środowiskach rozproszonych baz danych. Rozważmy sytuację, w której baza danych pracowników (zawierająca informacje, takie jak imię i nazwisko pracownika, numer działu, dla którego pracuje, itp.) Znajdująca się w lokacji 1 oraz baza danych działu (zawierająca informacje, takie jak numer działu, nazwa działu, lokalizacja itp.) Znajdująca się w lokalizacji 2. Na przykład, jeśli chcemy uzyskać nazwisko pracownika i nazwę działu, dla którego pracuje (dotyczy to tylko działów znajdujących się w „Nowym Jorku”), wykonując zapytanie w procesorze zapytań znajdującym się w lokacji 3, istnieje kilka sposobów, aby dane mogłyby być przesyłane między trzema lokalizacjami w celu realizacji tego zadania. Jednak podczas przesyłania danych należy pamiętać, że nie jest konieczne przenoszenie całej bazy danych między witrynami. Tylko niektóre atrybuty (lub krotki) wymagane do łączenia muszą być przesyłane między lokacjami, aby efektywnie wykonać zapytanie. Łączenie częściowe to metoda, której można użyć w celu zmniejszenia ilości danych przesyłanych między lokacjami. W przypadku półzłączenia tylko kolumna złączenia jest przenoszona z jednego miejsca do drugiego, a następnie ta przeniesiona kolumna jest używana do zmniejszenia rozmiaru przesyłanych relacji między innymi lokalizacjami. W powyższym przykładzie możesz po prostu przenieść numer działu i nazwę działu krotek z lokalizacją = „Nowy Jork” z ośrodka 2 do ośrodka 1 i wykonać łączenie w ośrodku 1 i przenieść ostateczną relację z powrotem do ośrodka 3.tylko kolumna łączenia jest przenoszona z jednej lokalizacji do drugiej, a następnie ta przeniesiona kolumna jest używana do zmniejszenia rozmiaru przesłanych relacji między innymi lokalizacjami. W powyższym przykładzie możesz po prostu przenieść numer działu i nazwę działu krotek z lokalizacją = „Nowy Jork” z ośrodka 2 do ośrodka 1 i wykonać łączenie w ośrodku 1 i przenieść ostateczną relację z powrotem do ośrodka 3.tylko kolumna łączenia jest przenoszona z jednej lokalizacji do drugiej, a następnie ta przeniesiona kolumna jest używana do zmniejszenia rozmiaru przesłanych relacji między innymi lokalizacjami. W powyższym przykładzie możesz po prostu przenieść numer działu i nazwę działu krotek z lokalizacją = „Nowy Jork” z ośrodka 2 do ośrodka 1 i wykonać łączenie w ośrodku 1 i przenieść ostateczną relację z powrotem do ośrodka 3.

Co to jest Bloom Join?

Jak wspomniano wcześniej, łączenie typu bloom to kolejna metoda używana do unikania przesyłania niepotrzebnych danych między lokacjami podczas wykonywania zapytań w środowiskach rozproszonych baz danych. W przypadku łączenia typu bloom, zamiast przenoszenia samej kolumny łączenia, między miejscami przenoszona jest zwarta reprezentacja kolumny łączenia. Łączenie Blooma używa filtra bloom, który wykorzystuje wektor bitowy do wykonywania zapytań o członkostwo. Najpierw za pomocą kolumny złącznej budowany jest filtr bloom, który jest przenoszony między stanowiskami, a następnie wykonywane są operacje łączenia.

Jaka jest różnica między Semi Join a Bloom Join?

Mimo że metody łączenia typu semi-join i bloom są używane w celu zminimalizowania ilości danych przesyłanych między lokacjami podczas wykonywania zapytań w środowisku rozproszonej bazy danych, łączenie typu bloom zmniejsza ilość przesyłanych danych (liczbę krotek) w porównaniu z łączeniem połowicznym poprzez wykorzystanie koncepcja filtrów poświaty, które wykorzystują wektor bitowy do określenia członkostwa w zestawie. Dlatego użycie łączenia typu bloom będzie bardziej wydajne niż użycie połączenia semi