Otimização de Consultas em SQL Parte I - Planos de Execução e Equivalências de Expressões da...

Preview:

Citation preview

Otimização de Consultas em SQL Parte I - Planos de Execução e

Equivalências de Expressões da Álgebra Relacional

AULA 19

Profa. Sandra de Amo

Programa de Pós-Graduação em CC - UFU

Sistemas de Banco de Dados - 2012-2

Principais etapas do processo Transformar os blocos simples SQL em

expressões da álgebra relacional Enumerar os possíveis planos de execução da

expressão da álgebra relacional correspondendo à consulta

Estimar o custo de cada plano Escolher o plano com menor custo

Esquema Geral do Otimizador

SQL Parser Consulta SQL

usuário

Coleção de blocos simplesB1, B2, ...., Bn

Otimizador

Melhor Plano de execução

Bloco SQL simples

Plano canônico

Cria planos alternativos

Planos alternativos

Estima custos

Melhor Plano de execução

Transforma em Algebra

Decompor consulta em blocos simples

Um bloco SQL simples é um comando sem subconsultas aninhadas, onde aparece somente um SELECT, somente um FROM no máximo um WHERE (em FNC) no máximo um GROUP BY no máximo um HAVING

Bloco simples SELECT <lista atributos>

FROM <lista relações>

WHERE <condição em FNC>

GROUP BY

HAVING

ExemploR(sid,bid,day,rname) : RESERVA

S(sid,sname,rating,age) : SAILORS

B(bid,bname, color) : BOAT

Para cada sailor com o mais alto status (rating) e que fez pelo menos 2 reservas de barcos vermelhos, dê seu identificador e a data mais recente em que fez reserva de barco vermelho.

Exemplo (continuação) SELECT DISTINCT S.sid, Min (R.day)

FROM Sailors S, Reservas R, Boats B

WHERE S.sid = R.sid AND R.bid = B.bid AND B.color = ‘red’

AND S.rating = (SELECT MAX (S2.rating) FROM Sailors S2 )

GROUP BY S.sid

HAVING COUNT (*) > 1

Exemplo (continuação) Bloco 1 : bloco interno

SELECT MAX (S2.rating) FROM Sailors S2 Resultado : Relação temporária T(A)

Bloco 2 : bloco externo SELECT DISTINCT S.sid, Min (R.day) FROM Sailors S, Reservas R, Boats B, T WHERE S.sid = R.sid AND R.bid = B.bid

AND B.color = ‘red’ AND S.rating = T.A GROUP BY S.sid HAVING COUNT (*) > 1

Bloco SQL Expressão algébrica

ΠA,B,..., MIN (C)

Having .... Group by ...

σ condições do WHERE

R1 X R2 X ... X Rn

Projeção sobre os atributos do SELECT

Seleção sobre as condições do WHERE

Produto Cartesiano das relações do FROM

Plano de Execução “Canônico”ΠA,B,...,Min(C)

σ condições do WHERE

R1 X R2 X ... X Rn

Having .... Group by A

ΠA,B,...,C

σ

ΠA,B,...,C

X

R1 R2 Rn

Resultado R é ordenado O GROUP BY é executado sobre o resultado R ordenado. O HAVING é aplicado para eliminar certos grupos. Funções de agregação são executadas sobre os grupos finais

O que é um plano de execução ? Plano de execução correspondente à uma

expressão algébrica E Sequência de operações equivalente à expressão

E, isto é, produzindo o mesmo resultado que E. Para cada operação da sequência (projeção,

seleção, junção), um algoritmo é especificado para implementar tal operação.

Exemplo

σ

X

R S

Π Projeção com ordenação

Seleção usando indice B+tree no atributo A

Hash Join

σ

X

R S

Projeção com ordenação

Sort Merge Join

Π

Seleção usando indice Hash no atributo B

Planos Alternativos Transformar a expressão algébrica “canônica”

(Π σ x ) em outra expressão equivalente.

Utilizar algoritmos alternativos para implementar as operações algébricas

ExemploR(sid,bid,day,rname) : RESERVA

S(sid,sname,rating,age) : SAILORS

B(bid,bname, color) : BOAT

Quais os dias em que foram reservados barcos vermelhos ?

Plano 1Select R.Day

From R, B

Where R.Bid = B.Bid AND

B.Color = ‘Vermelho’

σcolor = ‘vermelho’

R B

ΠDay

Plano 2 (otimizado)

Select R.Day

From R

Where R.Bid IN

( Select B.Bid

From B

Where B.Color = ‘Vermelho’ )

σcolor = ‘vermelho’

R

ΠDay

B

ΠBid

Equivalências de Expressões Algébricas

Seleção σ c1 ^ c2 ^ ... ^ cn (R) = σ c1 (σ c2 (... (σ cn (R))...)

Vantagens: Permite realizar uma única seleção, verificando todas as condições simultaneamente, em vez de se executar n seleções separadamente em sequência.

σ c1 (σ c2 (R) ) = σ c2 (σ c1 (R) )

As condições podem ser executadas em qualquer ordem.

Vantagem: executar a condição mais seletiva primeiro.

Equivalências de Expressões Algébricas Projeção

Π X1 (R) = Π X1 (Π X2 (... (Π Xn (R))...) Onde cada Xi é um conjunto de atributos Xi está contido em Xi+1

Exemplo: Π A (R) = Π A (ΠAB (Π ABC (R)))

Vantagem: Reduz o número de execuções do algoritmo de projeção

Equivalências de Expressões Algébricas

Produto Cartesiano e Junção Associativa

R (S T) = (R S) T

R (S T) = (R S) T Comutativa

(R S) = (S R)

(R S) = (S R)

Exercicio Mostre que

R (S T) = (T R) S

Conclusão: A junção entre diversas relações pode ser feita em

qualquer ordem. Propriedade importante na geração de planos

alternativos.

Equivalências de Expressões Algébricas

Seleção e Projeção ΠX σc (R) = σc ΠX (R)

Onde todos os atributos aparecendo na condição c estão contidos em X

Exercício: Mostrar que isto não é verdade caso existam atributos de c que não aparecem em X

Equivalências de Expressões Algébricas Seleção e Junção

R S = σc (R S)

σc (R S) = (σc R S) se todos os atributos de c são atributos de R e não de S

σc (R S) = (σc R S) se todos os atributos de c são atributos de R e não de S

Vantagens: junção pode ser feita entre relações menores.

c

Exercícios Dê um exemplo para mostrar que as

propriedades não são válidas caso c contenha atributos de ambas as relações R e S.

Seja c = c1 ^c2 ^c3c1 envolve atributos de R e S

c2 envolve atributos somente de R c3 envolve atributos somente de S

Mostre que: σc (R S) = σc1(σc2 R σc3 S)

Equivalências de Expressões Algébricas

Projeção e Produto Cartesiano ΠX (R S) = (ΠY R ΠZ S)

Y = atributos de X que aparecem em R Z = atributos de X que aparecem em S

Exemplo: ΠAB (R S) = (ΠA R ΠB S) onde R(AC) e S(BC) Vantagem: Produto cartesiano pode ser feito entre

relações menores.

Equivalências de Expressões Algébricas Projeção e Junção

ΠX (R S) = (ΠY R ΠZ S) Os atributos envolvidos na condição de junção c devem aparecer

em X Y = atributos de X que aparecem em R Z = atributos de X que aparecem em S

Exemplo : R(ACD), S(BEC), X = {A, B, C},

condição de junção : C = 3

ΠABC (R S) = (ΠA R ΠB S)

c c

c c

Exercicio Dê um exemplo para mostrar que a

propriedade não é válida caso Y contenha atributos que não apareçam em X.

Dê um exemplo para mostrar que a propriedade não é válida caso a condição de junção c contenha atributos que não estão em X

Equivalências de Expressões Algébricas

Distribuição Generalizada (Projeção e Junção) ΠX (R S) = ΠX (ΠY R ΠZ S)

Y = atributos de R que aparecem em X ou c Z = atributos de S que aparecem em Y ou c

Exemplo : R(ACD), S(BEC), X = {A, B}, condição de junção : C = 3

ΠAB (R S) = ΠAB (ΠAC R ΠBC S)

c c

c c

Equivalências de Expressões Algébricas

União, Intersecção: Associativa Comutativa

Seleção e Projeção podem comutar com União, Intersecção e Diferença

Recommended