105

REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

REDSHIFTS FOTOMÉTRICOSCOM REGRESSÃO PONDERADA

LOCALMENTE

WALTER AUGUSTO DOS SANTOS JUNIOR

Orientador: Prof. Dr. Laerte Sodré Jr.

Dissertação apresentada ao Departamento de Astronomia doInstituto de Astronomia, Geofísica e Ciências Atmosféricas daUniversidade de São Paulo como parte dos requisitos para aobtenção do título de Mestre em Astronomia.

SÃO PAULO - MAIO DE 2007

Page 2: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação
Page 3: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

à sobrinha Marília

Page 4: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação
Page 5: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Agradecimentos

Agradeço o apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP),através do processo 05/01019-0, sem o qual não seria possível a realização deste trabalho.

Agradeço ao professor Laerte por sua paciência, disposição e conança em meu trabalhodurante a orientação deste Mestrado, e por seus vastos conhecimentos em Astronomia.

Agradeço aos meus pais, Walter e Edna, e à minha irmã Adriana por proporcionaremuma base sólida para minha formação.

Agradeço à professora Cláudia por me conduzir à area de Astronomia e por suas sugestõesem relação ao meu trabalho.

Agradeço aos professores Nemitala, Márcia e Manfredo que, durante minha iniciaçãocientíca em Física Nuclear, me ensinaram a pensar como um pesquisador em Ciências.

Agradeço ao professor Alex Szalay, a Tamás Budavári, a Ani Thakar, e a todo o pessoalda Universidade Johns Hopkins, por me receberem muito bem em Baltimore durante osestágios que z por lá.

Agradeço a todos os meus amigos pela convivência e pelos incentivos.

Page 6: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação
Page 7: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

It is good to have an end to journey towards,

but it is the journey that matters in the end.

Ursula K. Le Guin

Page 8: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação
Page 9: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Sumário

RESUMO xi

ABSTRACT xiii

1 Introdução 1

1.1 Redshifts Fotométricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2 Aplicações recentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3 Sloan Digital Sky Survey . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.4 Plano da dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2 Grupos Fósseis no Sloan Digital Sky Survey 17

2.1 Introdução a grupos fósseis . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.2 Denição de sistema fóssil . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.3 Procedimento da busca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3.1 Seleção de galáxias elípticas . . . . . . . . . . . . . . . . . . . . . . 19

i

Page 10: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

2.3.2 Correlação com dados de raios-X . . . . . . . . . . . . . . . . . . . 19

2.3.3 Seleção de galáxias vizinhas . . . . . . . . . . . . . . . . . . . . . . 20

2.3.4 Condição fotométrica para grupos fósseis . . . . . . . . . . . . . . . 21

2.3.5 Análise das galáxias dominantes . . . . . . . . . . . . . . . . . . . . 21

2.4 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3 Redshifts Fotométricos com Regressão Ponderada Localmente 29

3.1 Regressão Ponderada Localmente . . . . . . . . . . . . . . . . . . . . . . . 29

3.2 Determinação do parâmetro K . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.3 Resultados para a amostra do SDSS . . . . . . . . . . . . . . . . . . . . . . 36

3.3.1 A amostra do SDSS . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.3.2 Dependência de K com o tamanho do conjunto de treinamento . . . 39

3.3.3 Dependência dos resultados com o conjunto de cores . . . . . . . . 42

3.3.4 Análise com magnitudes . . . . . . . . . . . . . . . . . . . . . . . . 46

3.3.5 Resultados para galáxias LRGs do SDSS . . . . . . . . . . . . . . . 48

3.4 Comparações com outros métodos . . . . . . . . . . . . . . . . . . . . . . . 50

3.5 Aplicação na busca de estruturas associadas a pares de quasares . . . . . . 51

4 Estimativa de Linhas de Emissão por Fotometria 57

4.1 Conjuntos de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

ii

Page 11: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

4.2 Análises e Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.3 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5 Conclusões e Perspectivas 69

5.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.2 Perspectivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

REFERÊNCIAS 73

APÊNDICE A 77

APÊNDICE B 83

iii

Page 12: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Lista de Figuras

1.1 Distribuição de galáxias em um cone do céu, medidas pelo survey de redshiftsde galáxias 2dFGRS. A gura exibe a correspondência entre redshift e dis-tância. Imagem obtida de http://magnum.anu.edu.au/∼TDFgg/ . . . . . 2

1.2 Exemplo de um espectro de uma galáxia superposta às bandas fotométricasdo SDSS (Way & Srivastava 2006). . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Evolução de espectros de diferentes tipos espectrais a partir dos modelosde Bruzual & Charlot (2003), utilizando Função de Massa Inicial de Miller& Scalo e metalicidade solar (Bolzonella et al. 2000). . . . . . . . . . . . . 5

1.4 Quatro espectros médio de Coleman, Wu & Weedman (CWW), observadospara galáxias locais, representando quatro tipos espectrais. Os espectros fo-ram extendidos para uma faixa maior de λ a partir dos modelos de Bruzual& Charlot (2003). (Bolzonella et al. 2000). . . . . . . . . . . . . . . . . . . 6

1.5 Combinação de medidas de espectros de potência angular, na tentativa dese encontrar evidências de oscilações de bárions no padrão de aglomeração(Blake et al. 2007). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.6 Distribuições de probabilidade para os parâmetros cosmológicos Ωm (den-sidade de matéria) e Ωb/Ωm (fração bariônica). Os contornos referem-se a1 e 2σ para os parâmetros dados na legenda (Blake et al. 2007). . . . . . . 11

1.7 Áreas de cobertura do céu do Sloan Digital Sky Survey, representando ima-geamento/fotometria (imagem superior) e espectroscopia (imagem inferior)da versão DR5, em coordenadas equatoriais J2000 (Adelman-McCarthy etal. 2007). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

iv

Page 13: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

2.1 Imagem de um candidato (ID = 1) a grupo fóssil. A imagem de fundo éproveniente do SDSS, as linhas vermelhas representam a emissão de raios-X do ROSAT, os círculos azuis são os membros dos grupos e as linhas emverde representam a emissão em radio do survey First. . . . . . . . . . . . 23

2.2 Imagem de um candidato (ID = 26) a grupo fóssil. A imagem de fundo éproveniente do SDSS, as linhas vermelhas representam a emissão de raios-X do ROSAT, os círculos azuis são os membros dos grupos e as linhas emverde representam a emissão em radio do survey First. . . . . . . . . . . . 24

3.1 O gráco da esquerda mostra uma regressão linear global obtida minimi-zando a função comum (não-ponderada) de χ2. O gráco da direita mostrauma regressão linear ponderada localmente (RPL), onde as larguras daslinhas cinzas representam o peso de cada ponto do ajuste, a linha azul re-presenta a reta ajustada para o dado ponto de entrada xq (marcado comum X) e a linha vermelha seria a curva obtida quando se variasse de formacontínua os pontos de entrada, mapeando assim todo o conjunto de dados.Figura adaptada de Moore et al. (1997). . . . . . . . . . . . . . . . . . . . 32

3.2 Um exemplo da variação de σrms em função do parâmetro K, apresentandoum mínimo em torno de 0.12. . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.3 Distribuições de 100 valores de σrms mínimo para o conjunto de treinamentode 9000 galáxias do SDSS. O histograma de linha cheia indica os resultadossem sigma-clipping e o de linha pontilhada se refere aos resultados comsigma-clipping. Os valores médios das distribuições sem e com clipping são0.033 e 0.023, respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.4 Distribuições de 100 valores de K associados aos σrms mínimos para oconjunto de treinamento de 9000 galáxias do SDSS. O histograma de linhacheia indica os resultados sem sigma clipping e o de linha pontilhada serefere aos resultados com sigma clipping. Os valores medianos para K seme com clipping são 0.29 e 0.11, respectivamente. . . . . . . . . . . . . . . . 38

3.5 Gráco de comparação entre redshifts espectroscópicos (zspec) e fotométri-cos (zphot) para as 1000 galáxias do conjunto de teste do SDSS, considerandoK = 0.11. Os valores de σrms com e sem clipping são 0.022 e 0.039, respec-tivamente e o número de erros catastrócos é de 3%. No gráco, a reta delinha cheia indica zspec = zphot e as retas de linhas pontilhadas indicam asregiões de 1 e 3 σrms (com clipping). . . . . . . . . . . . . . . . . . . . . . . 39

v

Page 14: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

3.6 Gráco de comparação entre redshifts espectroscópicos (zspec) e fotométri-cos (zphot) para as 1000 galáxias do conjunto de teste do SDSS, considerandoK = 0.29. Os valores de σrms com e sem clipping são 0.024 e 0.031, respec-tivamente e o número de erros catastrócos é de 2.3%. No gráco, a retade linha cheia, indica zspec = zphot e as retas de linhas pontilhadas indicamas regiões de 1 e 3 σrms (com clipping). . . . . . . . . . . . . . . . . . . . . 40

3.7 Gráco de comparação entre redshifts fotométricos comK = 0.11 (zphot_011)e com K = 0.29 (zphot_029) para as 1000 galáxias do conjunto de teste doSDSS. O valor de σrms entre os dois resultados é de 0.011. No gráco, a retade linha cheia, indica zphot_011 = zphot_029 e as retas de linhas pontilhadasindicam as regiões de 1 e 3 σrms. . . . . . . . . . . . . . . . . . . . . . . . . 41

3.8 Gráco da variação de σrms com o número N de pontos do conjunto detreinamento do SDSS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.9 Gráco da variação do parâmetro K ótimo com o número N de pontos doconjunto de treinamento do SDSS. . . . . . . . . . . . . . . . . . . . . . . 45

3.10 Distribuição de 100 valores de σrms mínimo para o conjunto de treinamentode 490 galáxias do ACS-GOODS. O valor médio da distribuição é 0.16. . . 53

3.11 Gráco de comparação entre redshifts espectroscópicos (zspec) e fotométri-cos (zphot) para as galáxias do conjunto de validação do ACS-GOODS. Ovalor de σrms é de 0.16. No gráco, a reta de linha cheia, indica zspec = zphot

e as retas de linhas pontilhadas indicam as regiões de 1 e 3 σrms (com clip-

ping). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.12 Distribuições de redshifts fotométricos para as galáxias dos 4 campos depares de quasares. A área hachurada corresponde aos intervalos de zpair±σz. 55

4.1 Gráco de comparação entre larguras equivalentes da linha de emissão Hαpara os dados do SDSS-DR2. log(EW [Hα])RPL é a estimativa de RPLe log(EW [Hα])teste são os valores de teste. No gráco, a reta de linhacheia indica log(EW [Hα])RPL = log(EW [Hα])teste e as retas de linhaspontilhadas indicam as regiões de 1 e 3 σrms (com clipping). . . . . . . . . 60

vi

Page 15: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

4.2 Gráco de comparação entre larguras equivalentes da linha de emissão Hαpara os dados do SDSS-DR2. log(EW [Hβ])RPL é a estimativa de RPLe log(EW [Hβ])teste são os valores de teste. No gráco, a reta de linhacheia indica log(EW [Hβ])RPL = log(EW [Hβ])teste e as retas de linhaspontilhadas indicam as regiões de 1 e 3 σrms (com clipping). . . . . . . . . 61

4.3 Gráco de comparação entre larguras equivalentes da linha de emissão OIpara os dados do SDSS-DR2. log(EW [OI])RPL é a estimativa de RPL elog(EW [OI])teste são os valores de teste. No gráco, a reta de linha cheiaindica log(EW [OI])RPL = log(EW [OI])teste e as retas de linhas pontilha-das indicam as regiões de 1 e 3 σrms (com clipping). . . . . . . . . . . . . . 62

4.4 Gráco de comparação entre larguras equivalentes da linha de emissão OIIpara os dados do SDSS-DR2. log(EW [OII])RPL é a estimativa de RPLe log(EW [OII])teste são os valores de teste. No gráco, a reta de linhacheia indica log(EW [OII])RPL = log(EW [OII])teste e as retas de linhaspontilhadas indicam as regiões de 1 e 3 σrms (com clipping). . . . . . . . . 63

4.5 Gráco de comparação entre larguras equivalentes da linha de emissão OIIpara os dados do SDSS-DR2. log(EW [OIII])RPL é a estimativa de RPLe log(EW [OIII])teste são os valores de teste. No gráco, a reta de linhacheia indica log(EW [OIII])RPL = log(EW [OIII])teste e as retas de linhaspontilhadas indicam as regiões de 1 e 3 σrms (com clipping). . . . . . . . . 64

4.6 Gráco de comparação entre larguras equivalentes da linha de emissão NIIpara os dados do SDSS-DR2. log(EW [NII])RPL é a estimativa de RPLe log(EW [NII])teste são os valores de teste. No gráco, a reta de linhacheia indica log(EW [NII])RPL = log(EW [NII])teste e as retas de linhaspontilhadas indicam as regiões de 1 e 3 σrms (com clipping). . . . . . . . . 65

4.7 Gráco de comparação entre larguras equivalentes da linha de emissãoOII para os dados do TKRS. log(EW [OII])RPL é a estimativa de RPLe log(EW [OII])teste são os valores de teste. No gráco, a reta de linhacheia indica log(EW [OII])RPL = log(EW [OII])teste e as retas de linhaspontilhadas indicam as regiões de 1 e 3 σrms (com clipping). . . . . . . . . 66

vii

Page 16: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Lista de Tabelas

1.1 Compilação dos resultados recentes de redshifts fotométricos da literatura,listando survey, método de zphot, bandas fotométricas utilizadas e erromédio na estimativa de zphot (σz). . . . . . . . . . . . . . . . . . . . . . . 9

2.1 Lista de candidatos a sistemas fósseis: coordenadas. . . . . . . . . . . . . . 25

2.2 Lista de candidatos a sistemas fósseis: propriedades. . . . . . . . . . . . . . 26

3.1 Tabela de resultados do método RPL aplicado à amostra do SDSS, paradiferentes valores do número N de pontos do conjunto de treinamento. Atabela apresenta, para cada valor de N , K ótimo, σrms (com clipping) naanálise do conjunto de teste (de 1000 pontos) e número de erros catastrócos. 42

3.2 Tabela de resultados do método RPL aplicado à amostra do SDSS, paradiferentes valores do número de cores (2, 3, 4 e 5 cores) do SDSS, comtodas as variações possíveis entre as cores u-g, g-r, r-i, i-z e r-z. A tabelaapresenta o número de cores, as cores, K ótimo, σrms (com clipping) naanálise do conjunto de teste (de 1000 pontos) e número de erros catastrócos. 43

3.3 Tabela de resultados do método RPL aplicado à amostra do SDSS, para ascombinações (u-g,g-r,r-i,r-z,r) e (u-g,g-r,r-i,r-z,µr). A tabela apresenta Kótimo, σrms (com clipping) na análise do conjunto de teste (de 1000 pontos)e número de erros catastrócos. . . . . . . . . . . . . . . . . . . . . . . . . 46

viii

Page 17: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

3.4 Tabela de resultados do método RPL aplicado à amostra do SDSS, paradiferentes valores do número de bandas fotométricas (2, 3, 4 e 5 bandas)do SDSS, com todas as variações possíveis entre as bandas u, g, r, i e z.A tabela apresenta o número de bandas, as bandas, K ótimo, σrms (comclipping) na análise do conjunto de teste (de 1000 pontos) e número deerros catastrócos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.5 Tabela de resultados do método RPL aplicado à amostra de galáxias LRGsdo SDSS, para as combinações de 5 cores (u-g,g-r,r-i,i-z,r-z) e 5 magnitudes(u,g,r,i,z). A tabela apresenta K ótimo, σrms (com clipping) na análise doconjunto de teste (de 1000 pontos) e número de erros catastrócos. . . . . 49

3.6 Informações sobre os quatro pares de quasares. . . . . . . . . . . . . . . . . 52

4.1 Tabela de resultados das estimativas de largura equivalente de linhas deemissão pelo método RPL. A tabela apresenta a linha de emissão, o survey(SDSS ou TKRS), K ótimo e σrms (com clipping). . . . . . . . . . . . . . . 59

ix

Page 18: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

x

Page 19: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Resumo

Esta dissertação apresenta um método empírico, denominado Regressão Ponderada Lo-calmente (RPL), para se estimar redshifts de galáxias usando apenas informações fotomé-tricas. O método RPL permite obter ajustes locais entre dados fotométricos (magnitudesou cores) e redshifts a partir de um conjunto de treinamento, formado por objetos comredshifts espectroscópicos conhecidos. Foi implementado um algoritmo com base nestatécnica e aplicado a um conjunto de 10 mil galáxias provenientes do Sloan Digital SkySurvey (SDSS). Notou-se que o método apresenta melhores resultados à medida em quese aumenta o número de objetos do conjunto de treinamento e quando se considera mag-nitudes nas cinco bandas fotométricas (u, g, r, i, z) do SDSS, ao invés de cores (u-g,g-r, r-i, i-z, r-z). Os redshifts fotométricos determinados pelo RPL, a partir dos dadosdo SDSS, apresentam uma incerteza de σz = 0.0210, quando são consideradas as cincobandas fotométricas do SDSS, sendo que da ordem de 3% dos resultados são consideradoserros catastrócos, isto é, com dispersão é maior do que 3σ. Nesta dissertação, são apre-sentados também estudos que exemplicam aplicações de redshifts fotométricos, como abusca por grupos fósseis de galáxias e a determinação de estruturas em grandes escalasassociadas a pares de quasares. Além disso, o método RPL foi utilizado para se estimarlarguras equivalentes de linhas de emissão de galáxias, usando dados fotométricos. Aconclusão nal é que a técnica de Regressão Ponderada Localmente de determinação deredshifts fotométricos apresenta resultados satisfatórios, sendo que as incertezas encontra-das são, no mínimo, comparáveis às obtidas pelas melhores técnicas empíricas disponíveisatualmente.

xi

Page 20: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

xii

Page 21: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Abstract

This work presents an empirical method, called Locally Weighted Regression (RPL), toestimate redshifts of galaxies using only photometric information. The RPL method allowsto obtain local ts between photometric data (magnitudes or colors) and redshifts usinga training set, which contains objects with known spectroscopic redshifts. An algorithm,based on this method, was implemented and applied to a data set of 10,000 galaxiesfrom the Sloan Digital Sky Survey (SDSS). It was found that the method provides betterresults as the number of objects in the training set increases and when magnitudes in theve SDSS photometric bands (u, g, r, i, z) are used, instead of colors (u-g, g-r, r-i, i-z,r-z). The photometric redshifts determined by RPL, using SDSS data, have uncertainty ofσz = 0.0210, when ve SDSS bands are used, and around 3% of the results are consideredto be catastrophic errors, with dispersion larger than 3σ. In this work, we also presentstudies that exemplify redshift photometric applications, like the search for fossil groupsof galaxies and the determination of large scale structures around quasar pairs. Moreover,the RPL method was utilized to estimate equivalent widths of galaxy emission lines, usingphotometric data. The nal conclusion is that the Locally Weighted Regression methodto determine photometric redshifts presents satisfactory results, since the uncertaintiesfound are, at least, comparable with the ones obtained from the best empirical methodsavailable currently.

xiii

Page 22: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

xiv

Page 23: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Capítulo 1

Introdução

Quase todas as galáxias que observamos estão se afastando de nós, o que é interpretadocomo evidência de que o Universo está se expandindo. Com isso, a luz proveniente dasgaláxias é deslocada para o vermelho, ou seja, há um aumento no comprimento de onda decada fóton emitido pela galáxia. A medida do deslocamento para o vermelho é chamadaredshift, indicado pela letra z. A denição de redshift é dada por:

z =λ− λ0

λ0

(1.1)

onde λ é o comprimento de onda medido de um fóton emitido por uma galáxia e λ0 é ocomprimento de onda do mesmo fóton no referencial em repouso na fonte.

O valor do redshift está relacionado com a velocidade de afastamento da galáxia e, pelaLei de Hubble, com a sua distância. Por essa razão, o redshift z de uma galáxia podeser utilizado como uma medida de distância, o que permite determinar propriedadesfísicas de uma galáxia (luminosidade, por exemplo) a partir de dados observacionais (comomagnitude aparente). Além disso, a partir de medidas de redshift de um grande númerode galáxias, é possível estudar a distribuição espacial delas, identicando as chamadasestruturas em grandes escalas, como grupos e aglomerados de galáxias, como pode servisualizado na Figura 1.1, que mostra a distribuição de galáxias para o survey de redshifts2dF Galaxy Redshift Survey.

A maneira usual de se determinar o redshift de uma galáxia é através da observação doseu espectro. Os comprimentos de onda das linhas do espectro podem ser comparados

1

Page 24: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 1.1: Distribuição de galáxias em um cone do céu, medidas pelo survey de redshiftsde galáxias 2dFGRS. A gura exibe a correspondência entre redshift e distância. Imagemobtida de http://magnum.anu.edu.au/∼TDFgg/

com os comprimentos de onda das linhas em repouso (catalogados em laboratório). Oredshift é, então, determinado pela equação (1.1). Ao longo desta dissertação, o redshiftdeterminado a partir do espectro de uma galáxia será denominado redshift espectroscópico.

No entanto, ao invés de espectroscopia, pode-se estimar o redshift de uma galáxia a partirde sua fotometria, como magnitudes em 3 ou mais bandas ou cores. Essa estimativa deredshift é denominada redshift fotométrico, usualmente abreviado por photoz ou zphot.Nesse caso, para a determinação do redshift, a fotometria de uma galáxia pode ser en-tendida como uma reconstituição aproximada da distribuição de energia espectral (SED,do inglês, spectral energy distribution), onde, ao invés de se medir características maisespecícas de uma galáxia, como as linhas de emissão, obtém-se informações mais gerais,como a forma geral do espectro. A Figura 1.2 exibe um exemplo da relação entre umespectro e um sistema de bandas fotométricas (do SDSS, nesse caso), de onde se podeobter um SED. Nesta dissertação, usaremos zphot para se referir ao redshift fotométrico.

Existem diversas vantagens em se utilizar fotometria para se estimar redshifts, em com-paração com a espectroscopia. A principal delas é que, do ponto de vista observacional, afotometria permite uma economia de tempo e de recursos considerável, já que redshifts demuitos objetos podem ser estimados simultaneamente e mais rapidamente do que com es-pectroscopia, mesmo considerando a evolução atual dos espectrógrafos. Além disso, paragaláxias mais fracas, é possível que a espectroscopia seja inviável, tornando o redshiftfotométrico a única medida de redshift disponível. Muitas vezes, as galáxias mais fracas

2

Page 25: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 1.2: Exemplo de um espectro de uma galáxia superposta às bandas fotométricasdo SDSS (Way & Srivastava 2006).

são as mais distantes; então pode-se utilizar o método de redshift fotométrico para seestudar o Universo mais distante, ou seja, em mais alto z.

A desvantagem intrínseca do redshift fotométrico é que apresenta menor precisão do queo espectroscópico. A incerteza do zphot é tipicamente da ordem de 10 a 100 vezes maiordo que a do redshift espectroscópico. Além disso, as estimativas de redshift fotométricopodem conter os chamados erros catastrócos, que são resultados muito diferentes (maiordo que 3 sigmas) do que os medidos espectroscopicamente. Tipicamente, 1% a 10%dos resultados de redshifts fotométricos podem ser classicados como erros catastrócos,dependendo da técnica e dos dados utilizados. Estas desvantagens, embora de formaalguma inviabilizem a utilização de redshifts fotométricos, devem ser levadas em contaquando se deseja utilizar zphot em aplicações astronômicas.

Dadas essas características do redshift fotométrico, pode-se deduzir que é mais útil utilizá-lo em estudos que envolvam um grande número de galáxias, geralmente associados a sur-veys fotométricos e/ou a estudos estatísticos. Assim, as principais aplicações de redshiftsfotométricos estão relacionadas com busca de estruturas em grandes escalas e determina-ção de parâmetros cosmológicos.

3

Page 26: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

1.1 Redshifts Fotométricos

O conceito de redshift fotométrico não é novo, tendo sido proposto pela primeira vez porBaum (1962). Neste trabalho, ele observou SEDs de galáxias elípticas do aglomerado deVirgo, com redshifts previamente conhecidos, e os comparou com SEDs de galáxias deum outro aglomerado (Abell 801). Através da comparação das SEDs, pôde determinaro redshift desse segundo aglomerado, que se mostrou próximo do valor espectroscópico.Com isso, cou demonstrada, pela primeira vez, a viablidade de se estimar redshift atravésapenas de fotometria.

Koo (1985) adotou uma outra abordagem para determinar redshifts fotométricos. Elepartiu de SEDs teóricas de diversos tipos de galáxias, convertendo-as em cores. Então,através da comparação das cores de galáxias observadas em um diagrama cor-cor, deter-minadas a partir das SEDs teóricas, pôde calcular os redshifts fotométricos.

O trabalho de Koo (1985) deu origem aos métodos de template de redshift fotométrico,os quais utilizam um pequeno conjunto de SEDs representativas dos tipos de galáxias (oschamados templates). Exemplos de templates incluem os espectros teóricos de Bruzual& Charlot (2003) (Figura 1.3) e os espectros observados de Coleman, Wu & Weedman(1980), usualmente denominados CWW (Figura 1.4). O redshift de uma galáxia é esti-mado vericando-se qual SED e em qual redshift reproduz melhor as cores (ou uxos) ob-servadas, através de minimização de chi-quadrado ou de máxima verossimilhança. Gwyn(1995) contém uma descrição detalhada do método de template. Bolzonella et al. (2000)disponibilizaram um código público de redshifts fotométricos que se baseia no método detemplate chamado Hyperz, assim como Benítez (2000), que disponibilizou o código BPZ,o qual inclui uma abordagem bayesiana ao método de template.

Connolly et al. (1995) estabeleceram relações polinomiais entre redshifts e cores, a partirde um conjunto de galáxias com redshifts espectroscópicos conhecidos. Essa abordagemdo problema daria origem aos chamados métodos empíricos de redshift fotométrico, nosquais relações empíricas entre cores e redshifts são obtidas a partir de um conjunto detreinamento, ou seja, um conjunto de galáxias com redshifts espectroscópicos conhecidos.

1.2 Aplicações recentes

Ultimamente, redshifts fotométricos adquiriram maior visibilidade devido a importantesobservações fotométricas realizadas nos últimos anos (por exemplo, Hubble Deep Field

4

Page 27: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 1.3: Evolução de espectros de diferentes tipos espectrais a partir dos modelosde Bruzual & Charlot (2003), utilizando Função de Massa Inicial de Miller & Scalo emetalicidade solar (Bolzonella et al. 2000).

5

Page 28: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 1.4: Quatro espectros médio de Coleman, Wu & Weedman (CWW), observadospara galáxias locais, representando quatro tipos espectrais. Os espectros foram extendidospara uma faixa maior de λ a partir dos modelos de Bruzual & Charlot (2003). (Bolzonellaet al. 2000).

6

Page 29: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

North - HDF-N - e Sloan Digital Sky Survey - SDSS), cenário este ideal para a utilizaçãode redshifts estimados por fotometria, como discutido anteriormente.

Fernandez-Soto et al. (1999) calcularam redshifts fotométricos para galáxias do HDF-N,a partir de quatro templates teóricos. As estimativas de redshift foram obtidas com fun-ções de verossimilhança, as quais comparavam os uxos observados com os dos templates.Com um procedimento semelhante, através da utilização de 6 templates, Rowan-Robinson(2003) calculou redshifts fotométricos para galáxias do HDF-N e do HDF-S (Hubble DeepField South), e vericou que é possível obter melhores resultados com a inclusão de parâ-metros adicionais, como a extinção. Nesse caso, o chi-quadrado é dado em função não sóda SED e do redshift, mas também da extinção.

Csabai et al. (2003) calcularam redshifts fotométricos para galáxias da base de dados doEarly Data Release (EDR, primeira versão do survey SDSS), comparando diversos méto-dos, tanto de template quanto empíricos. Neste trabalho, constatou-se que os métodosempíricos geralmente fornecem melhores resultados, já que apresentam valores menoresde incerteza (da ordem de 0.03) em comparação com métodos de template (com incertezada ordem de 0.05). No entanto, os redshifts espectroscópicos do SDSS (e de outros sur-veys) não cobrem toda a faixa de redshift esperada para o limite fotométrico do SDSS, oque sugere que as incertezas de zphot para galáxias mais fracas deve ser maior do que oobtido. Isso indica que métodos empíricos dependem de quão representativo é o conjuntode treinamento em relação aos dados observados para os quais se quer estimar redshifts.

Para todo o conjunto fotométrico do EDR, Csabai et al. (2003) optaram por utilizar ummétodo híbrido entre template e empírico, descrito em Csabai et al. (2000) e Budaváriet al. (2000, 2001). Este método ajusta as SEDs (templates) de acordo com as coresmédias de um conjunto empírico de galáxias, previamente separadas nas classes espectraisdenidas pelos templates. Atualmente, já estão disponibilizados redshifts fotométricos,determinados por esse método híbrido de Csabai & Budavári, para todos os dados doSDSS, até a versão mais atual (DR5 - Data Release 5), descrita em Adelman-McCarthyet al. (2007).

Outra técnica recente que adota uma abordagem empírica é a chamada ANNz, baseada emredes neurais articiais (Collister & Lahav 2004), que também se baseia em um conjuntode treinamento para estimar redshifts fotométricos. Esta técnica vem apresentando resul-tados muito bons, como por exemplo na determinação de zphot para todo o conjunto degaláxias do SDSS-DR5, trabalho desenvolvido por Cunha et al.1 (ver Adelman-McCarthyet al. 2007).

Outros métodos de redshift fotométrico foram desenvolvidos nos últimos anos. Babbedge

1http://yummy.uchicago.edu/SDSS/

7

Page 30: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

et al. (2004) publicaram o código IMPZ, que adota a abordagem de template para seestimar redshifts, tendo como base os 6 templates utilizados em Rowan-Robinson (2003).

Diferentes métodos empíricos também foram propostos, tais como o classicador de árvorede decisão (decision tree classier - ClassX), de Suchkov et al. (2005), o qual permiteclassicar, de forma acurada, objetos fotométricos do SDSS entre estrelas, galáxias eAGNs, além de obter os zphot. Outro método é o baseado em máquinas de vetoresde suporte (support vector machines), proposto por Wadadekar (2005), que é um tipode técnica denominada aprendizagem de kernel. Mais recentemente, Way & Srivastava(2006) proposeram os seguintes métodos de se estimar redshifts fotométricos, com base naidéia de sensores virtuais: aprendizado por agrupamento (ensemble learning) e Gaussianprocess regression. Todos esses métodos empíricos foram utilizados para se obter redshiftsfotométricos de amostras do SDSS e apresentaram resultados satisfatórios (ver Tabela1.1).

Variações de métodos previamente existentes também foram publicados, tais como Raf-faele et al. (2007), que aplicaram redes neurais para se determinar redshifts fotométricosdo SDSS, porém dividindo o conjunto de treinamento em galáxias próximas (z < 0.25) emais distantes (0.25 < z < 0.5), utilizando uma rede neural de Perceptrons Multicamadas

(Multi-Layer Perceptron - MLP), com bons resultados na aplicação aos dados do SDSS(ver Tabela 1.1).

Foram calculados redshifts fotométricos para diversos surveys, além dos já citados (SDSS,HDF-N/S) e para outros tipos de objetos extragalácticos além de galáxias, como super-novas do tipo Ia (Wang et al. 2007) e quasares (Weinstein et al. 2004, Ball et al. 2007).Redshifts fotométricos foram determinados para a amostra de galáxias vermelhas lumi-nosas do SDSS (Luminous Red Galaxies - LRGs) por dois trabalhos: Padmanabhan etal. (2005), usando o algorítmo híbrido de Budavári et al. (2000, 2001) na versão DR1do SDSS; e Collister et al. (2007), na versão DR4 do SDSS, através do código de redesneurais ANNz (Collister & Lahav 2004), cujo catálogo é denominado MegaZ-LRG.

Ilbert et al. (2006) obtiveram redshifts fotométricos de galáxias provenientes do Canada-France-Hawaii Telescope Legacy Survey (CFHTLS - Deep Survey), com um conjunto detreinamento obtido a partir do VIMOS VLT Deep Survey (VVDS). Em relação a galáxiasdistantes, Coe et al. (2006) calcularam zphot do Hubble Ultra Deep Field, utilizando ométodo bayesiano (Benítez 2000). Mobasher et al. (2006) obtiveram redshifts fotométricospara o survey COSMOS, a partir do método de template.

A Tabela 1.1 exibe uma compilação dos resultados recentes mais importantes de redshiftsfotométricos da literatura.

8

Page 31: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Tabela1.1:

Com

pilaçãodosresultados

recentes

deredshiftsfotométricosda

literatura,

listand

osurvey,métodode

zphot,

band

asfotométricasutilizadaseerro

médio

naestimativade

zphot(σ

z).

survey

método

bandas

σz

referências

SDSS-EDR

Polinomial2

aordem

ugriz

0.0273

Connollyetal.(1995),Csabaietal.(2003)

SDSS-EDR

Vizinhomaispróxim

ougriz

0.0327

Csabaietal.(2003)

SDSS-EDR

Kd-tree

ugriz

0.0226

Csabaietal.(2003)

SDSS-EDR

Templates-CWW

ugriz

0.0621

Csabaietal.(2003)

SDSS-EDR

Templates-Bruzual&

Charlot

ugriz

0.0509

Csabaietal.(2003)

SDSS-EDR

Templates-Bayesiano

ugriz

0.0422

Benítez(2000),Csabaietal.(2003)

SDSS-EDR

HíbridodeCsabai&

Budavári

ugriz

0.035

Budavárietal.(2000,2001),Csabaietal.(2000,2003)

SDSS-LRG

Templates-CWW

ugriz

0.0306

Csabaietal.(2003)

SDSS-LRG

HíbridodeCsabai&

Budavári

ugriz

0.0289

Budavárietal.(2000,2001),Csabaietal.(2000,2003)

2dF

HíbridodeCsabai&

Budavári

ugriz

0.0433

Csabaietal.(2003)

CNOC2

HíbridodeCsabai&

Budavári

ugriz

0.0842

Csabaietal.(2003)

SDSS-DR5

RedesNeurais

ugriz

0.026

Collister&

Lahav(2004),

http://yummy.uchicago.edu/SDSS/

SDSS-DR2

ClassX

ugriz

0.0340

Suchkovetal.(2005)

SDSS-DR2

Support

VectorMachine

ugriz

0.0270

Wadadekar(2005)

SDSS-DR3

EnsembleLearning

ugriz

0.0205

Way&

Srivastava(2006)

SDSS-DR3

GaussianProcess

ugriz

0.0230

Way&

Srivastava(2006)

SDSS-DR5

RedesNeurais-MLP

ugriz

0.0208

Raaeleetal.(2007)

SDSS-LRG

RedesNeurais-MLP

ugriz

0.0164

Raaeleetal.(2007)

SDSS-LRG

HíbridodeCsabai&

Budavári

ugriz

∼0.0

35

Padmanabhanetal.(2005)

SDSS-LRG

-0.4

<z

<0.7

RedesNeurais

ugriz

0.049

Collisteretal.(2007)

HubbleUltra

DeepField

BPZ

BVi'z'JH

0.0

4(1

+z

sp

ec)

Coeetal.(2006)

9

Page 32: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 1.5: Combinação de medidas de espectros de potência angular, na tentativa dese encontrar evidências de oscilações de bárions no padrão de aglomeração (Blake et al.2007).

Uma importante aplicação de redshifts fotométricos é a determinação de parâmetros cos-mológicos, a partir do espectro de potência da distribuição de galáxias. A viabilidade detal aplicação foi demonstrada em Blake & Bridle (2005), Zhan et al. (2006) e Knox etal. (2006). Em particular, Blake & Bridle (2005), Blake et al. (2006, 2007) discutema possibilidade de se utilizar distribuição de galáxias com redshifts fotométricos para sedetectar oscilações acústicas de bárions no espectro de potência (Figura 1.5). Blake etal. (2007) apresentaram os primeiros ajustes de parâmetros cosmológicos (Figura 1.6) apartir de espectros de potência angular de galáxias provenientes de um survey de redshiftsfotométricos, no caso o MegaZ-LRG (Collister et al. 2007).

Outra aplicação importante de redshifts fotométricos é a busca de estruturas em grandesescalas, como aglomerados e grupos. Botzler et al. (2004) propuseram um método deno-minado extended friends-of-friends com essa nalidade. Trevese et al. (2007) apresentamum algoritmo de busca de aglomerados a partir de redshifts fotométricos do survey Chan-dra Deep Field South. Santos et al. (2007) apresentam uma busca por grupos fósseis noSDSS (Capítulo 2 e Apêndice B) a partir de redshifts fotométricos descritos em Csabaiet al. (2003).

Redshifts fotométricos também podem ser utilizados na determinação de distribuições de

10

Page 33: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 1.6: Distribuições de probabilidade para os parâmetros cosmológicos Ωm (densi-dade de matéria) e Ωb/Ωm (fração bariônica). Os contornos referem-se a 1 e 2σ para osparâmetros dados na legenda (Blake et al. 2007).

11

Page 34: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

redshifts e de funções de luminosidade de galáxias. Esta aplicação de zphot foi testadapela primeira vez por Gwyn (1995), com resultados satisfatórios. Em seguida, Gwyn &Hartwick (1996) obtiveram a distribuição de redshifts e funções de luminosidade paraas galáxias do Hubble Deep Field. Mais recentemente, Sheth (2007) propõe dois novosalgorítmos (generalização do algorítmo de Vmax e abordagem de máxima verossimilhança)para se determinar funções de luminosidade a partir de redshifts fotométricos.

1.3 Sloan Digital Sky Survey

A maior parte dos dados utilizados nesta Dissertação foram obtidos do Sloan Digital Sky

Survey2 (SDSS). O SDSS é o maior survey astronômico da atualidade, contando com umagrande base de dados de qualidade, tanto fotométricos quanto espectroscópicos, o queo torna ideal para estudos de redshift fotométrico e de busca de estruturas em grandesescalas.

O SDSS fornece dados em uma grande área do céu, principalmente no hemisfério galác-tico norte (ver Figura 1.7). Utiliza um telescópio dedicado de 2,5 m no Apache Point

Observatory, localizado no Novo México, EUA.

A quinta versão dos dados públicos (Data Release 5 - DR5), descrita em Adelman-McCarthy et al. (2007), inclui fotometria em cinco bandas (u, g, r, i, z) para 217 milhõesde objetos em uma área da ordem de 8000 graus2 e mais de 1 milhão de espectros degaláxias, quasares e estrelas, em uma área de 5713 graus2, contida na área fotométrica.O DR5 contém dados de toda as versões anteriores do SDSS e representa a conclusão doprojeto do SDSS-I.

2Funding for the SDSS and SDSS-II has been provided by the Alfred P. Sloan Foundation, the par-ticipating Institutions, the National Science Foundation, the U.S. Department of Energy, the NationalAeronautics and Space Administration, the Japanese Monbukagakusho, the Max Planck Society, andthe Higher Education Funding Council for England. The SDSS Web Site is http://www.sdss.org/. TheSDSS is managed by the Astrophysical Research Consortium for the Participating Institutions. The Par-ticipating Institutions are the American Museum of Natural History, Astrophysical Institute Potsdam,University of Basel, University of Cambridge, Case Western Reserve University, University of Chicago,Drexel University, Fermilab, the Institute for Advanced Study, the Japan Participation Group, JohnsHopkins University, the Joint Institute for Nuclear Astrophysics, the Kavli Institute for Particle As-trophysics and Cosmology, the Korean Scientist Group, the Chinese Academy of Sciences (LAMOST),Los Alamos National Laboratory, the Max-Planck-Institute for Astronomy (MPIA), the Max-Planck-Institute for Astrophysics (MPA), New Mexico State University, Ohio State University, University ofPittsburgh, University of Portsmouth, Princeton University, the United States Naval Observatory, andthe University of Washington.

12

Page 35: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 1.7: Áreas de cobertura do céu do Sloan Digital Sky Survey, representando image-amento/fotometria (imagem superior) e espectroscopia (imagem inferior) da versão DR5,em coordenadas equatoriais J2000 (Adelman-McCarthy et al. 2007).

13

Page 36: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

A base de dados do SDSS contém diversas sub-amostras interessantes, incluindo a amostrade galáxias vermelhas luminosas (Luminous Red Galaxies - LRGs), para redshifts até daordem de 0.5, selecionadas a partir de "cortes" no espaço de cor-magnitude (Eisensteinet al. 2001).

Os dados do SDSS podem ser acessados através de buscas (queries) em sua base de dadosSQL (Structured Query Language) denominada CasJobs3. Mais informações sobre SQL eCasJobs podem ser encontradas no Apêndice A.

1.4 Plano da dissertação

O principal objetivo deste trabalho de mestrado consiste em implementar e testar umatécnica empírica de determinação de redshifts fotométricos, denominada Regressão Pon-

derada Localmente (RPL), utilizando principalmente dados do Sloan Digital Sky Survey

(SDSS). Aplicações de redshifts fotométricos também serão apresentados nesta disserta-ção.

O Capítulo 2 descreve a busca de grupos fósseis na base de dados do SDSS (Santos etal. 2007), e se trata de uma aplicação de redshifts fotométricos. Este trabalho utilizaredshifts fotométricos descritos em Csabai et al. (2003).

No Capítulo 3, descrevemos a técnica Regressão Ponderada Localmente, assim como osdiversos testes realizados com uma amostra de 10000 galáxias do SDSS. Descreve-se tam-bém uma aplicação de redshifts fotométricos, calculados com a técnica RPL. Trata-se deum estudo das propriedades fotométricas de quatro campos ao redor de pares de quasares,vericando se eles estão localizados em aglomerados em alto redshift (Boris et al. 2007).

O capítulo 4 descreve outra aplicação da técnica RPL, não para se determinar redshifts,mas para se estimar a largura equivalente de linhas de emissão de galáxias, usando apenasdados fotométricos.

As conclusões deste trabalho de mestrado são apresentadas no Capítulo 5, no qual sediscute também perspectivas futuras.

No Apêndice A, são apresentadas tecnologias de acesso a dados em bancos de dadosastronômicos, utilizadas ao longo desta Dissertação. E o Apêndice B contém o artigo

3http://casjobs.sdss.org/CasJobs/

14

Page 37: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

submetido sobre grupos fósseis (Santos et al. 2007), trabalho descrito no Capítulo 2.

15

Page 38: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

16

Page 39: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Capítulo 2

Grupos Fósseis no Sloan Digital Sky

Survey

Este capítulo apresenta a busca de grupos fósseis na base de dados do Sloan DigitalSky Survey utilizando redshifts fotométricos (Santos et al. 2007). Este trabalho podeser visto como um exemplo de aplicação de zphot na busca de estruturas, embora osredshifts fotométricos utilizados aqui foram obtidos diretamente do banco de dados doSDSS (descritos em Csabai et al. 2003) e não através da técnica Regressão PonderadaLocalmente. A seção 2.1 contém uma breve introdução sobre grupos fósseis. Na seção 2.2,é apresentada a denição de grupos fósseis adotada no presente trabalho. O procedimentoda busca é explicado na seção 2.3, que contém também os resultados obtidos. Por m, aseção 2.4 apresenta uma breve discussão sobre o trabalho.

2.1 Introdução a grupos fósseis

Grupos fósseis são sistemas com massas e luminosidades em raios-X comparáveis comas observadas em grupos e aglomerados de galáxias, mas cuja luz é dominada por umagaláxia elíptica grande e isolada. O nome fóssil associado a esses grupos decorre de umahipótese sobre sua formação, pois se acredita que sejam grupos antigos onde, de acordocom o cenário mais aceito, a galáxia central sofreu fusões (mergers) com as outras galáxiasbrilhantes do grupo para exibir sua forma atual (ver, por exemplo, Mendes de Oliveira etal. 2006).

17

Page 40: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Os estudos de grupos fósseis são bem recentes, sendo que o primeiro sistema foi observadopor Ponman et al. (1994). Eles deniram um grupo fóssil como um sistema com halode raios-X extenso e brilhante (> 0.5 × 1043 h−2

50 erg s−1), dominado por uma galáxiaelíptica luminosa (mais brilhante que L*) e circundada por galáxias vizinhas de menorluminosidade, onde a diferença em magnitude entre a elíptica dominante e a vizinha maisbrilhante é maior do que 2 mag na banda R.

Dois estudos realizaram buscas por grupos fósseis com critérios de seleção bem denidos(Vikhlinin et al. 1999; Jones et al. 2003) e concluíram que esses sistemas são bemabundantes. No entanto, até recentemente, havia somente 15 grupos fósseis conhecidosna literatura (Tabela 4 de Mendes de Oliveira et al. 2006).

O trabalho apresentado neste capítulo se propõe a divulgar uma nova lista de candidatosa grupos fósseis, obtidos a partir do Sloan Digital Sky Survey (SDSS), o que permitirá arealização de estudos estatísticos das propriedades de grupos fósseis.

2.2 Denição de sistema fóssil

A denição de um sistema fóssil adotada neste trabalho é inspirada na de Jones et al.(2003), onde a imagem óptica consiste de uma galáxia elíptica circundada por galáxiasvizinhas mais fracas, de modo que a diferença em magnitude na banda R entre a elípticae a vizinha mais brilhante dentro de metade do raio virial é ≥ 2 mag. O sistema devetambém ser detectado como uma fonte extensa de raios-X (no presente caso, no ROSAT

All-Sky Survey). Jones et al. (2003) impuseram um limite inferior para a luminosidadeem raios-X (LX ≥ 1042 h−2

50 erg s−1), mas no presente trabalho decidiu-se não incluir limiteem LX na denição de grupos fósseis. Além disso, considera-se aqui um valor xo parao raio de busca ao redor da elíptica dominante: 0.5h−1

70 Mpc, enquanto que Jones et al.(2003) consideram metade do raio virial.

A denição adotada aqui também não assume nenhum limite inferior para o número demembros do sistema fóssil, desde que esteja associado com uma fonte de raios-X extensa.

18

Page 41: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

2.3 Procedimento da busca

A busca por grupos fósseis foi feita na base de dados do SDSS-DR5 (Sloan Digital SkySurvey - Data Release 5, ver Adelman-McCarthy et al. 2007) e seguindo diversos passos,sendo a maioria deles utilizando SQL (Structured Query Language) na base de dadosSQL do SDSS denominada CasJobs e ADQL (Astronomical Data Query Language) naferramenta OpenSkyQuery do Observatório Virtual Americano (NVO - National VirtualObservatory)1. No Apêndice A serão descritas as linguagens SQL e ADQL, assim comoas queries (buscas associadas a banco de dados) utilizadas neste trabalho.

2.3.1 Seleção de galáxias elípticas

Foram selecionadas galáxias do catálogo Luminous Red Galaxies (Eisenstein et al. 2001)com r < 19 e com redshift espectroscópico medido pelo SDSS. Esta restrição assegura queapenas galáxias vizinhas com r < 21 são relevantes para se vericar se um dado sistemaé um fóssil, de acordo com a denição dada em 2.2. A razão é que são usados redshiftsfotométricos para identicar os objetos associados com as LRGs e, como discutido emCsabai et al. (2003), os zphot são bem mais incertos para galáxias fracas (r > 21),tornando pouco conável a identicação de membros do sistema.

Esta seleção foi feita a partir de uma query SQL (dada no Apêndice A) feita no CasJobsdo SDSS.

Com estas condições, obtém-se 112510 galáxias, que corresponde basicamente a todo ocatálogo espectroscópico de LRGs. No entanto, nem todos os objetos da amostra LRG sãoelípticas. Portanto, na etapa nal do procedimento, serão selecionados apenas os sistemasdominados por galáxias elípticas, identicadas através de inspeção visual dos candidatos.

2.3.2 Correlação com dados de raios-X

A correlação entre nossa amostra de LRG e o ROSAT All-Sky Survey foi feita com afunção XMATCH da ferramenta do NVO OpenSkyQuery2 (O'Mullane et al. 2003), que

1This research has made use of software provided by the US National Virtual Observatory, which issponsored by the National Science Foundation.

2openskyquery.net/

19

Page 42: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

permite correlacionar catálogos astronômicos usando uma linguagem de query chamadaADQL, semelhante a SQL (ver Apêndice A para mais detalhes).

A correlação considera apenas objetos com emissão extensa em raios-X medida pelo RO-SAT, ou seja, quando o parâmetro de extensão da fonte é maior do que zero. Com essascondições, obtém-se 188 LRGs associadas com fontes extensas de raios-X. O próximopasso é, então, analisar as regiões em volta desses objetos para determinar se são mesmofósseis.

2.3.3 Seleção de galáxias vizinhas

Foram selecionadas galáxias vizinhas dentro de um raio de 0.5h−170 em volta de cada uma

das 188 LRGs. Os raios angulares correspondentes foram calculados a partir dos redshiftsespectroscópicos (medidos pelo SDSS) assumindo os seguintes valores para os parâmetroscosmológicos: h = 0.7, Ωm = 0.3, and Ωλ = 0.7.

Os objetos vizinhos foram encontrados utilizando a função spGetNeighborsRadius no ser-vidor SQL CasJobs, selecionando apenas os objetos classicados como galáxias pelo SDSS.

Para se determinar as galáxias vizinhas que fazem parte dos sistemas dominados pelaselípticas, utilizou-se redshifts espectroscópicos quando disponíveis, mas para a grandemaioria dos objetos, faz-se necessário utilizar redshifts fotométricos. Estes zphot, assimcomo suas incertezas, são descritos em Csabai et al. (2003) e publicamente disponíveispara todos os objetos da base de dados do SDSS-DR5 (Adelman-McCarthy et al. 2007).A razão para se utilizar redshifts fotométricos determinados por Csabai et al. (2003),ao invés do método RPL, é puramente técnica, já que durante o Mestrado não tivemoscondições de aplicar o método RPL para as dezenas de milhões de objetos fotométricosdo SDSS. Além disso, os zphot de Csabai et al. (2003) estão completamente integradosao banco de dados SQL do SDSS, o que facilita a utilização deles em trabalhos como odescrito aqui.

Um objeto é identicado como companheiro de uma LRG a redshift ze se o seu redshiftz satisfaz a condição:

ze −∆z < z < ze + ∆z (2.1)

onde ∆z é o intervalo em redshift. Este intervalo poderia ser, em princípio, associado àdispersão de velocidades do sistema. No entanto, como a maioria das galáxias vizinhaspossui apenas redshifts fotométricos, cujas incertezas são sempre maiores dos que as dis-persões de velocidades esperadas, decidiu-se adotar a incerteza do redshift fotométrico

20

Page 43: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

(cuja valor mediano é 0.035) como o valor para ∆z.

Para os poucos vizinhos com redshift espectroscópico medido, adotou-se o valor de ∆z =0.002. Note que este valor restringe fortemente a seleção de galáxias companheiras, mascomo o número nal de sistemas fósseis é pequeno (seção 2.3.5), decidiu-se permitir de-tecções falsas para evitar a exclusão de sistemas fósseis reais da amostra nal.

Decidiu-se também considerar apenas vizinhos com incertezas nos redshifts fotométricosmenores ou iguais a 0.1, que é o erro médio dos zphot para objetos com r ∼ 21 (Csabaiet al. 2003), de modo a evitar que valores grandes dessas incertezas afetem de formanegativa os resultados. Aqui também adotou-se uma abordagem para se evitar a exclusãode sistemas fósseis reais, mas aumentando a probabilidade de se incluir alguns sistemasfalsos.

2.3.4 Condição fotométrica para grupos fósseis

Nesta etapa do procedimento, considera-se a condição fotométrica que dene um sistemafóssil: a diferença em magnitude na banda r entre a galáxia elíptica e o próximo membromais brilhante deve ser de no mínimo 2 magnitudes. Portanto, a seguinte condição évericada para cada vizinho selecionado:

mi > m1 + 2 (2.2)

onde m1 e mi são as magnitudes na banda r da galáxia elíptica e do i-ésimo vizinho,respectivamente. Se esta condição é vericada para todo membro, o sistema é entãoclassicado como um candidato a grupo fóssil. Das 188 LRGs, 44 delas se encontram emsistemas que estão de acordo com a condição fotométrica.

2.3.5 Análise das galáxias dominantes

Nem todos os objetos no catálogo LRG são elípticas, então o próximo passo foi fazeruma inspeção visual das galáxias dominantes desses sistemas para vericar se são, defato, elípticas. Entre as 44 LRGs na amostra de candidatos a grupos fósseis, 8 sistemascontêm galáxias dominantes que não parecem apresentar morfologia elíptica (6 espirais e2 mergers), os quais foram excluídos da lista de grupos fósseis.

Outro sistema teve que ser excluído porque sua emissão de raios-X está associada, na

21

Page 44: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

verdade, com uma anã branca, que aparece como uma fonte extensa no catálogo doROSAT devido à sua forte intensidade em raios-X.

Em um outro sistema, a galáxia dominante é identicada como NGC 5846 que, de acordocom a literatura (Mahdavi et al. 2005), é parte de um grupo isolado, porém não fóssil. Abusca falhou nesse caso devido à incerteza no redshift fotométrico de um membro brilhantedesse grupo. Este sistema foi, então, excluído da lista de grupos fósseis.

A lista nal de 34 candidatos a sistemas fósseis é apresentada nas Tabela 2.1 e Tabela2.2. As Figuras 2.1 e 2.2 exibem, como exemplo, imagens de dois candidatos a sistemasfósseis.

Na Tabela 2.1, a coluna 1 contém o número de identicação (ID) do sistema fóssil, a coluna2 o nome SDSS da galáxia elíptica dominante, as colunas 3 e 4 contêm as coordenadasascensão reta e a declinação (J2000), para a elíptica dominante (e medidas pelo SDSS) ea coluna 5 contém o nome ROSAT para a fonte de raios-X associada com o sistema.

Na Tabela 2.2, a coluna 1 contém o número ID do sistema fóssil, a coluna 2 o redshiftespectroscópico da elíptica dominante, a coluna 3 sua magnitude aparente na banda r, acoluna 4 sua magnitude absoluta na banda r, a coluna 5 contém o raio em arcominutospara 0.5h−1

70 Mpc, a coluna 6 a distância entre a galáxia elíptica e a fonte do ROSAT, acoluna 7 contém a extensão em raios-X obtida do catálogo do ROSAT e a coluna 8 fornecea luminosidade em raios-X estimada a partir das taxas de contagens do ROSAT.

Pode-se notar que todas as galáxias elípticas dominantes com exceção de uma (sistemaID = 8) possuem luminosidade tal que LR < LR*. A elíptica do sistema 8 apresenta umamagnitude na banda r de −21.25 enquanto que o valor médio para as demais elípticas dosoutros sistemas é −23.74.

Os uxos em raios-X foram estimados para cada candidato a sistema fóssil a partir dastaxas de contagens do catálogo do ROSAT, utilizando a ferramenta WebPIMMS3, consi-derando um modelo de Raymond-Smith com uma temperatura de kT = 3 keV e umametalicidade Z = 0.4 Zsolar.

3http://heasarc.gsfc.nasa.gov/Tools/w3pimms.html, WebPIMMS is a Web version of the PIMMS(v3.9b) tool. PIMMS was developed by Koji Mukai at the HEASARC. The rst Web version was develo-ped at the SAX Data Center. The SAX PIMMS package was ported to and modied for the HEASARCWeb site by Michael Arida.

22

Page 45: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 2.1: Imagem de um candidato (ID = 1) a grupo fóssil. A imagem de fundo éproveniente do SDSS, as linhas vermelhas representam a emissão de raios-X do ROSAT,os círculos azuis são os membros dos grupos e as linhas em verde representam a emissãoem radio do survey First.

23

Page 46: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 2.2: Imagem de um candidato (ID = 26) a grupo fóssil. A imagem de fundo éproveniente do SDSS, as linhas vermelhas representam a emissão de raios-X do ROSAT,os círculos azuis são os membros dos grupos e as linhas em verde representam a emissãoem radio do survey First.

24

Page 47: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Tabela 2.1: Lista de candidatos a sistemas fósseis: coordenadas.

ID Nome do SDSS SDSS RA SDSS DEC Nome do ROSAT(J2000) (J2000)

1 J171811.93+563956.1 17:18:11.9 +56:39:56.1 J171810.9+5639552 J172852.16+551640.8 17:28:52.2 +55:16:40.8 J172850.5+5516223 J015021.27-100530.5 01:50:21.3 -10:05:30.5 J015021.2-1005374 J104302.57+005418.2 10:43:02.6 +00:54:18.3 J104303.0+0054235 J153344.13+033657.5 15:33:44.1 +03:36:57.5 J153344.0+0337176 J164702.07+385004.2 16:47:02.1 +38:50:04.3 J164702.5+3850037 J172010.03+263732.0 17:20:10.0 +26:37:32.1 J172009.3+2637278 J163720.51+411120.2 16:37:20.5 +41:11:20.3 J163721.3+4111069 J133559.98-033129.1 13:35:60.0 -03:31:29.2 J133601.0-03314710 J235815.10+150543.5 23:58:15.1 +15:05:43.6 J235814.4+15052411 J225630.04-003210.8 22:56:30.0 -00:32:10.7 J225629.8-00323112 J105452.03+552112.5 10:54:52.0 +55:21:12.5 J105453.3+55210213 J080730.75+340041.6 08:07:30.8 +34:00:41.6 J080730.4+34010414 J084449.07+425642.1 08:44:56.6 +42:58:35.7 J084456.2+42582615 J094829.04+495506.7 09:48:29.0 +49:55:06.7 J094827.2+49552316 J145359.01+482417.1 14:53:59.0 +48:24:17.1 J145356.9+48241817 J152946.28+440804.2 15:29:46.3 +44:08:04.2 J152947.4+44075518 J114647.57+095228.1 11:46:47.6 +09:52:28.2 J114647.4+09523619 J112155.27+104923.2 11:21:55.3 +10:49:23.2 J112154.2+10493620 J114803.81+565425.6 11:48:03.8 +56:54:25.6 J114804.1+56541021 J153950.78+304303.9 15:39:50.8 +30:43:04.0 J153950.3+30430522 J154855.85+085044.3 15:48:55.9 +08:50:44.4 J154855.0+08510223 J161431.10+264350.3 16:14:31.1 +26:43:50.4 J161431.2+26433624 J075244.19+455657.3 07:52:44.2 +45:56:57.4 J075243.6+45565325 J090303.18+273929.3 09:03:03.2 +27:39:29.4 J090302.8+27393926 J114128.29+055829.5 11:41:28.3 +05:58:29.5 J114128.4+05582727 J084257.55+362159.2 08:42:57.6 +36:21:59.3 J084257.7+36214128 J015241.95+010025.5 01:52:42.0 +01:00:25.6 J015242.1+01004029 J114915.02+481104.9 11:49:15.0 +48:11:04.9 J114912.9+48105830 J130009.36+444301.3 13:00:09.4 +44:43:01.3 J130007.7+44425131 J141004.19+414520.8 14:10:04.2 +41:45:20.9 J141006.4+41452032 J111439.76+403735.1 11:14:39.8 +40:37:35.2 J111439.4+40373533 J124742.07+413137.6 12:47:42.1 +41:31:37.7 J124740.1+41312834 J144516.86+003934.2 14:45:16.9 +00:39:34.3 J144516.1+003918

25

Page 48: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Tabela2.2:

Lista

decand

idatos

asistem

asfósseis:

propriedades.

IDRedshift

Magr

MagAbsr

Raio

Distância

Extensãode

LX(h−

270)

(arcmin)

(arcmin)

Raios-X(arcsec)

(erg

s−1)(0

.5-2keV)

10.114

15.27

-23.55

4.037

0.144

68

2.9E+42

20.148

16.72

-22.81

3.214

0.393

14

2.1E+41

30.365

17.26

-24.85

1.641

0.118

44

9.2E+42

40.125

15.98

-23.16

3.704

0.138

25

3.1E+42

50.293

17.23

-24.21

1.902

0.335

41

3.7E+42

60.135

16.13

-23.09

3.480

0.083

27

4.1E+41

70.159

15.44

-24.33

3.030

0.181

62

1.1E+43

80.032

14.51

-21.25

13.153

0.274

17

2.5E+40

90.177

15.84

-24.14

2.787

0.396

36

2.3E+42

10

0.178

16.08

-23.98

2.763

0.369

21

5.7E+41

11

0.224

16.81

-23.91

2.314

0.351

15

1.4E+42

12

0.468

17.69

-25.30

1.415

0.250

13

7.2E+42

13

0.208

16.38

-24.05

2.449

0.388

16

2.6E+42

14

0.054

14.08

-22.97

7.919

0.180

37

1.3E+41

15

0.409

18.21

-24.22

1.529

0.407

10

3.8E+42

16

0.146

15.87

-23.58

3.255

0.351

29

3.4E+41

17

0.148

15.77

-23.71

3.224

0.252

13

6.7E+41

18

0.221

16.36

-24.24

2.333

0.137

20

3.7E+42

19

0.240

16.97

-23.84

2.194

0.345

28

2.8E+42

20

0.105

16.49

-22.08

4.339

0.255

14

7.7E+41

21

0.097

14.93

-23.50

4.636

0.106

62

3.6E+42

22

0.072

13.50

-24.25

6.060

0.362

59

3.7E+41

23

0.184

15.76

-24.36

2.693

0.232

19

1.8E+42

24

0.052

14.46

-22.64

8.241

0.123

10

4.2E+41

25

0.489

18.06

-25.19

1.380

0.182

37

1.3E+43

26

0.188

16.03

-24.11

2.652

0.048

21

1.6E+42

27

0.282

16.79

-24.52

1.951

0.306

63

2.2E+43

28

0.230

15.72

-24.95

2.269

0.242

58

1.1E+43

29

0.283

17.60

-23.66

1.948

0.374

29

4.5E+42

30

0.233

16.88

-23.80

2.243

0.342

20

1.9E+42

31

0.094

14.66

-23.64

4.781

0.413

10

2.1E+41

32

0.202

17.14

-23.16

2.504

0.069

93.1E+42

33

0.155

15.88

-23.70

3.093

0.403

14

4.4E+41

34

0.306

17.94

-23.65

1.843

0.326

35

5.3E+42

26

Page 49: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

2.4 Discussão

A busca por grupos fósseis descrita neste capítulo foi idealizada para ser tão inclusivaquanto possível, minimizando a probabilidade de exclusão de sistemas fósseis reais daamostra. Por outro lado, isso signica que o procedimento adotado leva a um aumento naprobabilidade de se ter falsos grupos fósseis na lista nal. As condições consideradas aolongo da busca, como valores menores para o raio do sistema e para o intervalo mínimode redshift, tendem a diminuir o número de vizinhos ao redor das galáxias elípticas, o quepor sua vez aumenta a probabilidade de se detectar um sistema fóssil, já que um númeromenor de galáxias são submetidas à condição fotométrica para um sistema ser um fóssil.

Neste trabalho, para se identicar galáxias espacialmente próximas das elípticas dominan-tes, foram utilizados redshifts fotométricos cujas incertezas são consideravelmente maisaltas do que os espectroscópicos, como já discutido anteriormente. Então, mesmo conside-rando apenas galáxias vizinhas com magnitude menor que 21 na banda r e com incertezano redshift fotométrico menor que 0.1 (ver 2.3.3), a precisão do zphot é um fator limi-tante para a eciência da busca. No entanto, para o tipo de busca descrita aqui, o usode redshifts fotométricos é a única forma de se encontrar estruturas ao redor das galáxiaselípticas.

Uma discussão mais completa deste trabalho pode ser encontrada em Santos et al. (2007),incluído no Apêndice B.

27

Page 50: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

28

Page 51: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Capítulo 3

Redshifts Fotométricos com Regressão

Ponderada Localmente

Este capítulo apresenta a técnica de Regressão Ponderada Localmente na determinaçãode redshifts fotométricos. A seção 3.1 contém o desenvolvimento teórico do método RPL,bem como denições e parâmetros que serão utilizados ao longo do capítulo. Na seção3.2, descreve-se como se pode obter o valor do parâmetro, à priori, livre do método(K), a partir de um dado conjunto de objetos. A seção 3.3 apresenta os resultados deredshifts fotométricos, determinados pelo método RPL, a partir de conjuntos de dadosdo SDSS. Ainda nesta seção, discute-se em detalhes como os resultados dependem dediversos parâmetros de entrada, como número de objetos para o conjunto de treinamentoe variáveis fotométricas (cores e magnitudes). Por m, a seção 3.5 mostra uma aplicaçãode redshifts fotométricos, obtidos com o método RPL, no estudo de 4 campos de imagensao redor de pares de quasares.

3.1 Regressão Ponderada Localmente

Regressão Ponderada Localmente (Locally Weighted Regression, em inglês) é um métodode aprendizagem contínua para mapeamentos de caráter não-linear. Na prática, estabelecerelações entre variáveis que, em princípio, seriam dadas por funções não-lineares altamentecomplexas.

É um tipo de método de análise estatística conhecido como lazy learning ("aprendizagem

29

Page 52: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

preguiçosa") ou memory-based learning ("aprendizagem baseada em memória"). Nessetipo de método, um conjunto de treinamento permanece armazenado até que um resultadoseja requerido. Então, a análise é feita levando-se em conta a relevância de cada dado doconjunto de treinamento em relação ao valor de entrada particular (query) da variável (ouvariáveis) independente(s), para o qual se quer prever o valor da variável dependente. Arelevância é, geralmente, determinada por uma função de distância entre o valor de querye os dados do conjunto de treinamento.

A técnica Regressão Ponderada Localmente (RPL) se popularizou nas últimas décadasna literatura de estatística (Cleveland & Delvin 1988, Grosse 1989, Atkeson et al. 1997),tornando-se conhecida principalmente por sua aplicação na dinâmica de aprendizagem emrobótica (Moore 1992, 1997, Schaal & Atkeson 1994).

Em Astronomia, a técnica RPL foi aplicada por de la Calleja & Fuentes (2004) na clas-sicação morfológica automática de galáxias, com resultados considerados satisfatórios.Outra aplicação que está sendo desenvolvida é a previsão de larguras equivalentes delinhas de emissão a partir de fotometria de galáxias, descrita no Capítulo 4.

Em sua aplicação feita a redshifts fotométricos, o RPL estabelece uma relação empíricaentre cores (ou magnitudes) e redshifts diretamente dos dados, usando um conjunto detreinamento (isto é, com redshifts espectroscópicos conhecidos). Com isso, a partir de umamedida fotométrica (conjunto de cores ou magnitudes em bandas) de um dado objeto, épossível se fazer uma estimativa de seu redshift. No que segue, ilustraremos o método con-siderando cores, mas usando magnitudes ou mesmo outras quantidades, o procedimentoé equivalente.

Durante uma predição de regressão ponderada localmente, um ponto de entrada xq éfornecido, que representa um conjunto de cores de um objeto para o qual se quer deter-minar seu redshift. Faz-se então um ajuste entre cores e redshift que é local, ou seja,mais fortemente inuenciado pelos dados do conjunto de treinamento que se encontrampróximos do ponto xq.

Para o ajuste, assume-se uma relação linear, em torno de xq, da forma:

y(x) = a0 + aT.x = a0 +n∑

i=1

aixi (3.1)

onde x é o vetor que contém as n cores fotométricas, y(x) é a coordenada dependente(redshift, nesse caso) e T designa uma matriz transposta. É possível reescrever a equação

30

Page 53: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

3.1 para incluir o termo constante a0 no vetor de parâmetros:

y(x) = aT.t(x) (3.2)

onde o vetor t(x) expressa, além dos termos de cores, a constante 1, ou seja: t(x) =(t1(x), t2(x), ..., tM(x)) = (1, x1, ..., xn). Analogamente, o vetor a, nesse caso, é dado por(a0, a1, ..., an). Além disso, note que o número total de parâmetros agora é M = n + 1.

Para um dado objeto com valor de entrada xq (ou t(xq)), é possível determinar os parâ-metros a e obter o redshift através da minimizaçao da seguinte função de χ2, ponderadalocalmente:

χ2 =N∑

k=1

ω2k

(yk − aT · t(xk)

)2(3.3)

onde ωk é o peso associado ao k-ésimo ponto do conjunto de treinamento, composto deN pontos no total. O peso aqui é dado por uma função que decresce com o aumento dadistância euclidiana d(xk,xq) entre os pontos xk e xq. Nesse caso, utiliza-se uma funçãogaussiana:

ωk = exp

(−d2(xk,xq)

2K2

)(3.4)

O parâmetro K, chamado de largura do kernel (kernel width), determina quão rápidoo peso diminui à medida que o ponto xk do conjunto de treinamento se afasta de xq.Em outras palavras, K determina um "volume efetivo" em torno de xq: apenas pontosdentro dessa "esfera" afetam de forma efetiva os valores dos parâmetros do ajuste e, porconseguinte, a estimativa de redshift. K é o único parâmetro livre da técnica RPL e épossível determinar seu valor ótimo para um dado conjunto de treinamento usando, porexemplo, validação cruzada (ver seção 3.2).

O ajuste local denido pelo método RPL pode ser visualizado na Figura 3.1, em compa-ração com um ajuste global padrão. A gura demonstra qualitativamente os efeitos dospesos associados aos pontos do conjunto de treinamento na determinação do ajuste linearlocal.

31

Page 54: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 3.1: O gráco da esquerda mostra uma regressão linear global obtida minimizandoa função comum (não-ponderada) de χ2. O gráco da direita mostra uma regressão linearponderada localmente (RPL), onde as larguras das linhas cinzas representam o peso decada ponto do ajuste, a linha azul representa a reta ajustada para o dado ponto de entradaxq (marcado com um X) e a linha vermelha seria a curva obtida quando se variasse deforma contínua os pontos de entrada, mapeando assim todo o conjunto de dados. Figuraadaptada de Moore et al. (1997).

A partir da minimização da equação 3.3, obtém-se os parâmetros a do ajuste a partir daseguinte equação matricial:

a =(XT ·X

)−1 ·(XT · y

)(3.5)

onde XTX é uma matriz M ×M e XTy é um vetor de M linhas, denidos por:

(XT ·X

)ij

=N∑

k=1

ω2kti(xk)tj(xk) (3.6)

(XT · y

)i=

N∑k=1

ω2kti(xk)yi (3.7)

Com os parâmetros do ajuste calculados, é possível então obter o redshift fotométricozRPL associado ao ponto de query xq, a partir da equação 3.1 (ou 3.2), ou seja:

32

Page 55: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

zRPL = y(xq) = aT.t(xq) = a0 +n∑

i=1

aixi,q (3.8)

Para obter os parâmetros do ajuste, deve-se resolver o sistema de equações lineares de-nido na equação 3.5. Existem diversos métodos de álgebra linear onde a inversão damatriz XTX não é necessária para se resolver a equação. No código de RPL desenvolvidonesta Dissertação, foi utilizado o método chamado decomposição de Cholesky (Choleskydecomposition), cuja descrição e sub-rotina podem ser obtidas em Press et al. (1992).Este método decompõe a matriz (simétrica e positiva-denida) da equação linear emduas matrizes triangulares (inferior e superior), sendo que a superior é a transposta dainferior.

Então, resolvendo-se o sistema separadamente para cada matriz triangular, é possívelobter o resultado da equação rapidamente. De fato, de acordo com Press et al. (1992), adecomposição de Cholesky permite resolver equações lineares mais rapidamente (por umfator de 2) em relação a outros métodos.

Uma preocupação na resolução da equação 3.5, levada em conta no código de RPL, é evitarque a matriz XTX seja praticamente singular, o que causa problemas na resolução dasequações lineares. A matriz XTX pode ser praticamente singular caso não haja pontossucientes com pesos diferentes de zero. Nesse caso, utiliza-se o método denominado Ridgeregression, descrito em Atkeson et al. (1997). Neste método, valores pequenos e positivos,da ordem de 1E−10, são adicionados aos elementos diagonais da matriz XTX, evitandoque ela se torne singular. O método SVD (Singular Value Decomposition) também permitelidar com a eventual singularidade dessas matrizes (ver Press et al. 1992).

3.2 Determinação do parâmetro K

O parâmetro K ótimo na relação 3.4, para um dado conjunto de treinamento, pode serdeterminado a partir de validação cruzada. Suponha que o conjunto de treinamentotenha N pontos, ou seja, N dados fotométricos com redshifts espectroscópicos conhecidos.Divide-se esse conjunto em dois sub-conjuntos: 2/3 N pontos para treinamento e 1/3 Npara validação.

Então, aplica-se o método RPL no sub-conjunto de validação (com 1/3 de N) utilizando-se o subconjunto de 2/3 de N como treinamento, a princípio para um dado valor deK qualquer. A partir da nomenclatura usada na seção 3.1, tem-se que cada ponto do

33

Page 56: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

sub-conjunto de validação constitui-se em um dado xq, para o qual se estima o redshiftfotométrico.

Nesse caso, como os pontos de validação possuem redshifts espectroscópicos, é possí-vel avaliar os resultados encontrados nas estimativas de redshift fotométrico (zphot). Aavaliação dos resultados é dada pela comparação entre os zphot obtidos e os redshiftsespectroscópicos (zspec), através da dispersão das diferenças:

σrms =

√√√√ 1

n

n∑i=1

(zphoti − zspeci)2 (3.9)

onde n equivale a 1/3 N, zphoti é o valor do redshift fotométrico do i-ésimo ponto doconjunto de validação e zspeci seu respectivo valor de redshift espectroscópico. Note queo valor de σrms possibilita uma avaliação quantitativa do método RPL, para um dadoconjunto de validação e para um dado valor do parâmetro K.

Assim, é possível avaliar os resultados de RPL para diferentes valores de K, denindo-seque o valor de K ótimo para um dado conjunto de treinamento é aquele para o qual seobtém o menor valor de σrms, a partir dos subconjuntos de 2/3 N de treinamento e 1/3N de validação do conjunto de treinamento.

No código de RPL desenvolvido no Mestrado, a determinação do valor de K ótimo consi-dera, tipicamente, uma variação de K entre 0.01 e 1.00, com passo de 0.01. No entanto,como esse procedimento leva um tempo considerável de processamento (pelo menos emum microcomputador comum), é possível restringir essa variação quando se conhece apro-ximadamente a faixa de K na qual o mínimo de σrms ocorre. Isso é possível porque avariação de σrms em função de K apresenta um comportamento relativamente singular,como pode ser visualizado na Figura 3.2, que mostra um exemplo de σrms × K para oconjunto de dados descrito na próxima seção.

Vericou-se que as curvas de σrms em função de K apresentam variações perceptíveisquando se consideram diferentes divisões do conjunto de treinamento, em 2/3 para trei-namento e 1/3 para validação. Então, para que o valor de K ótimo possa ser o maispreciso possível, faz-se necessário variar também os subconjuntos de treinamento e devalidação.

O procedimento adotado é obter a curva de σrms ×K (como na Figura 3.2), assim comoo valor de σrms mínimo e o valor do K associado a este mínimo, para cada uma de

34

Page 57: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

0 0.1 0.2 0.3 0.4 0.5

0.024

0.026

0.028

0.03

0.032

0 0.1 0.2 0.3 0.4 0.5

0.024

0.026

0.028

0.03

0.032

K

Figura 3.2: Um exemplo da variação de σrms em função do parâmetro K, apresentandoum mínimo em torno de 0.12.

100 divisões aleatórias de 2/3 para treinamento e 1/3 para validação do conjunto detreinamento.

Dessa forma, obtém-se 100 valores de σrms mínimo e 100 valores de K associados aosmínimos, cujas distribuições típicas podem ser visualizadas nas Figuras 3.3 e 3.4. Noteque a distribuição de σrms mínimo é simétrica e assemelha-se a uma gaussiana, enquantoque a distribuição de K é assimétrica. Assim, optou-se por considerar o valor ótimo doparâmetro K como a mediana da distribuição dos 100 valores de K associados com osmínimos de σrms.

O σrms obtido pela equação 3.9 pode ser fortemente inuenciado pelos erros catastrócos,discutidos na Introdução (Capítulo 1). Isso acaba afetando, também, as distribuições dosvalores mínimos de σrms e do K ótimo. Para contornar este problema, é possível utilizaro método conhecido como sigma-clipping, em que o cálculo de σrms é feito eliminando-se os pontos, de forma iterativa, para os quais |zphoti − zspeci| > 3σrms. Exemplos dedistribuições de σrms e K com e sem sigma-clipping podem ser visualizadas nas Figuras3.3 e 3.4.

35

Page 58: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

3.3 Resultados para a amostra do SDSS

3.3.1 A amostra do SDSS

Como descrito na seção 3.1, o método Regressão Ponderada Localmente faz uso de umconjunto de treinamento para poder estimar redshifts a partir de dados fotométricos. Foiobtido, então, um conjunto de dados espectrofotométricos do Sloan Digital Sky Survey

(SDSS) para servir como um conjunto de treinamento.

Foram obtidos, de forma aleatória, 10000 objetos da base de dados do SDSS, com acondição de que tivessem sido classicados como galáxias pelos algoritmos de classicaçãodo SDSS (tanto pela fotometria quanto pela espectroscopia) e que apresentassem redshiftespectroscópico medido. É importante que nenhuma outra restrição seja imposta a estaamostra, já que o conjunto de treinamento deve abranger o maior número possível detipos de galáxias em diversos redshifts, cobrindo tanto quanto possível o espaço de coresde galáxias.

Assim como no trabalho de grupos fósseis (Capítulo 2), os dados do SDSS foram obtidosatravés do servidor SQL do SDSS, denominado CasJobs. A query SQL utilizada encontra-se no Apêndice A.

A amostra de 10000 objetos foi dividida em dois conjuntos, também de forma aleatória:9000 objetos para formar o conjunto de treinamento propriamente dito e 1000 objetos paraconstituir um conjunto de teste. Este conjunto de teste, de forma análoga ao conjuntode validação descrito na seção 3.2, constitui-se de dados para os quais serão aplicados ométodo RPL e que possuem redshifts espectroscópicos medidos. Com isso, pode-se testaro método RPL, determinar suas incertezas e compará-lo com outros métodos de redshiftfotométrico.

Para o conjunto de treinamento de 9000 objetos, é possível obter o valor de K ótimoassociado a este conjunto, a partir do procedimento descrito na seção 3.2. Considera-se,por enquanto, que o método RPL utiliza para o ajuste as seguintes cinco cores (combase nas bandas fotométricas do SDSS - u, g, r, i, z): u-g, g-r, r-i, i-z e r-z. Segundoa nomenclatura utilizada, tem-se que N = 9000 e o número de pontos do conjunto devalidação é n = 1/3N = 3000, sendo o restante (6000 pontos) para treinamento.

As distribuições dos 100 valores de σrms mínimo e 100 valores de K associados aos mínimossão dadas nas Figuras 3.3 e 3.4, as quais apresentam os resultados com e sem sigma-

clipping. Sem sigma-clipping, obtém-se σrms = 0.033 e K = 0.29 e, para com sigma-

36

Page 59: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

clipping, σrms = 0.023 e K = 0.11. O número típico de iterações para o procedimento declipping é em torno de 5.

Se denirmos como erros catastrócos os pontos eliminados pelo sigma-clipping, obtemosque eles correspondem a aproximadamente 3% do total.

0.02 0.025 0.03 0.035 0.040

10

20

30

Figura 3.3: Distribuições de 100 valores de σrms mínimo para o conjunto de treinamentode 9000 galáxias do SDSS. O histograma de linha cheia indica os resultados sem sigma-

clipping e o de linha pontilhada se refere aos resultados com sigma-clipping. Os valoresmédios das distribuições sem e com clipping são 0.033 e 0.023, respectivamente.

Com o valor de K associado ao conjunto de treinamento, é possível aplicar o método RPLpara se determinar os redshifts fotométricos para as 1000 galáxias do conjunto de teste,comparando-os com os redshifts espectroscópicos do SDSS. Para isso, serão utilizados osdois valores de K obtidos, com e sem sigma-clipping. Dessa forma, podemos tambémavaliar como os resultados variam com valores diferentes de K.

Os resultados para K = 0.11 podem ser visualizados na Figura 3.5, que exibe um grácozspec × zphot. Para esse tipo de comparação, também é possível calcular o σrms para os1000 objetos, com e sem clipping. Tem-se que, sem clipping, σrms = 0.039 e, com clipping,σrms = 0.022. Note que esses valores de σrms são próximos aos obtidos na análise deK (Figura 3.3), como esperado. O número de resultados catastrócos (eliminados pelo

37

Page 60: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

0 0.2 0.4 0.6 0.80

10

20

30

40

K

Figura 3.4: Distribuições de 100 valores de K associados aos σrms mínimos para o conjuntode treinamento de 9000 galáxias do SDSS. O histograma de linha cheia indica os resultadossem sigma clipping e o de linha pontilhada se refere aos resultados com sigma clipping.Os valores medianos para K sem e com clipping são 0.29 e 0.11, respectivamente.

sigma-clipping) foi de 30, ou 3% do total.

O gráco da Figura 3.6 exibe os resultados para K = 0.29, sendo que, sem clipping, σrms =0.031 e, com clipping, σrms = 0.024. O número de resultados catastrócos (eliminadospelo sigma-clipping) foi de 2.3% do total.

Portanto, pode-se notar que diferentes valores de K não produzem diferenças signicativasnos resultados de redshift fotométrico. Esse fato também pode ser vericado no grácoda Figura 3.2 em que, para valores razoáveis de K (K > 0.05), a variação em sigma épequena. De fato, o gráco da Figura 3.7 comprova a proximidade entre os resultadospara K = 0.11 e K = 0.29, os quais apresentam entre si σrms = 0.011.

38

Page 61: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 3.5: Gráco de comparação entre redshifts espectroscópicos (zspec) e fotométricos(zphot) para as 1000 galáxias do conjunto de teste do SDSS, considerando K = 0.11. Osvalores de σrms com e sem clipping são 0.022 e 0.039, respectivamente e o número de erroscatastrócos é de 3%. No gráco, a reta de linha cheia indica zspec = zphot e as retas delinhas pontilhadas indicam as regiões de 1 e 3 σrms (com clipping).

3.3.2 Dependência de K com o tamanho do conjunto de treina-

mento

Pode-se fazer a análise do parâmetro K e do conjunto de teste para diferentes valores deN (número de pontos) do conjunto de treinamento, vericando assim como os resultadosdependem do tamanho dele. Para essa análise, apenas os valores com sigma-clipping foramconsiderados. Os resultados são obtidos para os seguintes valores de N : 100, 200, 500,1000, 2000, 5000, 9000, sendo que tais subconjuntos são provenientes da mesma amostrade 9000 pontos do conjunto de treinamento do SDSS, escolhidos de forma aleatória.

Para cada valor de N do conjunto de treinamento, obtém-se os valores de K ótimosassociados a cada conjunto, a partir do procedimento descrito acima. Então, os valores

39

Page 62: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 3.6: Gráco de comparação entre redshifts espectroscópicos (zspec) e fotométricos(zphot) para as 1000 galáxias do conjunto de teste do SDSS, considerando K = 0.29. Osvalores de σrms com e sem clipping são 0.024 e 0.031, respectivamente e o número de erroscatastrócos é de 2.3%. No gráco, a reta de linha cheia, indica zspec = zphot e as retas delinhas pontilhadas indicam as regiões de 1 e 3 σrms (com clipping).

de zphot são determinados para os dados do conjunto de teste de 1000 objetos do SDSS,também para cada conjunto de treinamento de tamanho N . Os resultados (K, σrms enúmero de erros catastrócos) estão compilados na Tabela 3.1.

Pode-se notar que σrms, um indicativo da qualidade do ajuste, diminui com o aumento donúmero N de pontos do conjunto de treinamento. Este resultado indica que o ajuste localde RPL é mais preciso para um número maior de pontos do conjunto de treinamento,como era de se esperar. De fato, nota-se que o ganho entre se utilizar N = 9000 ao invésde N = 100 é da ordem de 20% em σrms. Entretanto, percebe-se que o ganho em σrms

não é linear e diminui à medida que N aumenta (ver Figura 3.8).

O valor de K também parece ter uma relação com a variação de N (Figura 3.9), pelomenos para os valores maiores deste (1000, 2000, 5000 e 9000). Para os conjuntos de

40

Page 63: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 3.7: Gráco de comparação entre redshifts fotométricos com K = 0.11 (zphot_011)e com K = 0.29 (zphot_029) para as 1000 galáxias do conjunto de teste do SDSS. O valorde σrms entre os dois resultados é de 0.011. No gráco, a reta de linha cheia, indicazphot_011 = zphot_029 e as retas de linhas pontilhadas indicam as regiões de 1 e 3 σrms.

treinamento menores (100, 200 e 500), a variação de K com N parece ser mais aleatória.Em particular, para N = 200, o valor de K ótimo obtido é 0.42, muito acima em relaçãoaos outros. Mas, em geral, nota-se uma tendência de queda do valor de K conforme Naumenta, sendo que para N = 9000, o valor de K ótimo assume um valor menor (0.11)do que para os outros conjuntos, o que pode ser explicado pelo fato de que o "volumeefetivo" tende a ser menor à medida que mais pontos contribuem signicativamente parao ajuste local.

Em relação ao número de erros catastrócos, sua variação em função de N parece sermais aleatória do que a de σrms e a de K, mas também é possível concluir que taiserros se tornam menores quando se considera conjunto de treinamentos maiores. Porexemplo, ao se utilizar N = 9000 ao invés de N = 100, o número de erros catastrócosdiminui em, aproximadamente, 24%. Vale a pena mencionar que para em torno de 20galáxias do conjunto de teste sempre temos erros catastrócos, independente do conjunto

41

Page 64: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Tabela 3.1: Tabela de resultados do método RPL aplicado à amostra do SDSS, paradiferentes valores do número N de pontos do conjunto de treinamento. A tabela apresenta,para cada valor de N , K ótimo, σrms (com clipping) na análise do conjunto de teste (de1000 pontos) e número de erros catastrócos.

N K σrms no catastrócos100 0.25 0.0267 38200 0.42 0.0258 27500 0.26 0.0241 381000 0.22 0.0238 302000 0.18 0.0231 345000 0.12 0.0224 329000 0.11 0.0219 30

de treinamento.

3.3.3 Dependência dos resultados com o conjunto de cores

Até aqui, para todos os resultados apresentados, considerou-se como dados fotométricosde entrada cinco cores do SDSS (u-g, g-r, r-i, i-z e r-z). A mesma análise de redshifts foto-métricos pode ser feita considerando menos cores (2, 3 e 4), para as diversas combinaçõespossíveis delas. Espera-se que os resultados sejam menos precisos do que os obtidos com5 cores, isto é, espera-se que σrms aumente à medida que se diminui o número de variáveis(cores) de entrada. Mas tal análise permite também descobrir quais combinações de coresproduzem os melhores resultados.

Para essa análise, utiliza-se um valor xo do número N de pontos do conjunto de treina-mento (1000 pontos) e do tamanho do conjunto de teste (também 1000 galáxias do SDSS).Obviamente, os conjuntos de treinamento e de teste devem conter as mesmas cores, parauma dada combinação delas. Os resultados (K, σrms e número de erros catastrócos)estão compilados na Tabela 3.2.

A partir dos valores da Tabela 3.2, pode-se notar que, em média, obtém-se valores maiorespara σrms quando se considera um número menor de cores, como era esperado. No entanto,esse fato é válido apenas em média e não se verica para certas combinações de cores. Porexemplo, para se obter erros menores em zphot, é preferível utilizar uma das seguintescombinações de 3 cores: (u-g,g-r,r-i), (u-g,g-r,i-z), (u-g,g-r,r-z) do que uma combinação de4 cores (g-r,r-i, i-z,r-z). De fato, o σrms para uma das combinações de 4 cores (u-g,g-r,r-

42

Page 65: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Tabela 3.2: Tabela de resultados do método RPL aplicado à amostra do SDSS, paradiferentes valores do número de cores (2, 3, 4 e 5 cores) do SDSS, com todas as variaçõespossíveis entre as cores u-g, g-r, r-i, i-z e r-z. A tabela apresenta o número de cores, ascores, K ótimo, σrms (com clipping) na análise do conjunto de teste (de 1000 pontos) enúmero de erros catastrócos.

no cores K σrms no catastrócos5 u-g,g-r,r-i,i-z,r-z 0.25 0.0242 324 u-g,g-r,r-i,i-z 0.23 0.0243 30

u-g,g-r,r-i,r-z 0.25 0.0237 38u-g,g-r,i-z,r-z 0.23 0.0246 29u-g,r-i,i-z,r-z 0.12 0.0404 33g-r,r-i,i-z,r-z 0.13 0.0284 25

3 u-g,g-r,r-i 0.23 0.0248 28u-g,g-r,i-z 0.18 0.0255 49u-g,g-r,r-z 0.24 0.0256 27u-g,r-i,i-z 0.10 0.0410 27u-g,r-i,r-z 0.12 0.0406 31u-g,i-z,r-z 0.12 0.0416 30g-r,r-i,i-z 0.11 0.0282 26g-r,i-z,r-z 0.12 0.0285 26g-r,r-i,r-z 0.12 0.0281 28r-i,i-z,r-z 0.08 0.0407 17

2 u-g,g-r 0.18 0.0286 28u-g,r-i 0.06 0.0406 36u-g,i-z 0.06 0.0572 58u-g,r-z 0.07 0.0484 40g-r,r-i 0.08 0.0293 31g-r,i-z 0.11 0.0326 38g-r,r-z 0.12 0.0305 30r-i,i-z 0.05 0.0405 23r-i,r-z 0.06 0.0406 19i-z,r-z 0.05 0.0410 19

43

Page 66: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

0 2000 4000 6000 8000 10000 120000.02

0.022

0.024

0.026

0.028

0.03

N

Figura 3.8: Gráco da variação de σrms com o número N de pontos do conjunto detreinamento do SDSS.

i,r-z) é menor do o de cinco cores, embora a diferença, nesse caso, seja pequena e dentroda variação esperada de σrms (da ordem de 0.0005).

De modo geral, nota-se que combinações de cores que envolvem u-g, g-r e r-i tendem aapresentar resultados melhores, ou seja, menores valores para σrms. Isso provavelmentese deve ao fato de que características mais facilmente identicáveis do espectro de umagaláxia, como a quebra em 4000A, ocorrem entre as bandas fotométricas u, g e r para osredshifts típicos do SDSS, que são da ordem de 0.1. Em particular, o valor de σrms paraas combinações de 2 cores (u-g,g-r) e (g-r,r-i) é menor do que para diversas combinaçõesde 3 cores.

A combinação de cores que apresenta o valor mais alto de σrms é (u-g,i-z), que é a com-binação também cujas cores estão mais "afastadas" entre si.

Em relação ao K ótimo, há uma tendência de se obter valores menores à medida quese diminui o número de cores utilizadas. Por outro lado, K tende a apresentar valoresmaiores, da ordem 0.20, quando estão presentes ambas as cores u-g e g-r e valores menorespara as combinações de cores mais vermelhas (r-i e i-z).

44

Page 67: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

0 2000 4000 6000 8000 10000 120000

0.1

0.2

0.3

0.4

0.5

N

Figura 3.9: Gráco da variação do parâmetro K ótimo com o número N de pontos doconjunto de treinamento do SDSS.

A variação do número de erros catastrócos não apresenta nenhuma relação aparente comas combinações de cores. De fato, os menores e os maiores valores de erros catastrócosocorrem para diferentes combinações de 2 cores.

Além das combinações puramente de cores, análises foram feitas também considerandooutras duas combinações: (u-g,g-r,r-i,r-z,r), que contém a melhor combinação de coresmais a magnitude na banda r; e (u-g,g-r,r-i,r-z,µr), onde µr é o brilho supercial nabanda r de cada galáxia, dado por:

µr = r + 2.5× log A (3.10)

onde A é a área da galáxia em arcosegundos ao quadrado. No caso do SDSS, tal áreapode ser calculada através do raio Petrosian rp, denido de tal forma que se possa mediruma fração constante da luz total de um objeto, dando origem à magnitude Petrosian,independente da posição e da distância do objeto. O raio rp pode ser calculado atravésda forma do perl de luminosidade na banda fotométrica r, como descrito em Blanton etal. (2001), e é um parâmetro disponível na base de dados do SDSS.

45

Page 68: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Tabela 3.3: Tabela de resultados do método RPL aplicado à amostra do SDSS, para ascombinações (u-g,g-r,r-i,r-z,r) e (u-g,g-r,r-i,r-z,µr). A tabela apresenta K ótimo, σrms (comclipping) na análise do conjunto de teste (de 1000 pontos) e número de erros catastrócos.

variáveis K σrms no catastrócosu-g,g-r,r-i,r-z,r 0.41 0.0221 39u-g,g-r,r-i,r-z,µr 0.48 0.0231 34

Assim, a equação do brilho supercial (eq. 3.10) pode ser reescrita como:

µr = r + 5× log rp + 2.5× log(π) (3.11)

Os resultados (K, σrms e número de erros catastrócos) para as combinações (u-g,g-r,r-i,r-z,r) e (u-g,g-r,r-i,r-z,µr) são dados na Tabela 3.3. Nota-se que os valores de σrms

obtidos para os dois casos são menores do que os encontrados em todas as combinaçõesde cores da Tabela 3.2, o que indica que a inclusão dessas variáveis extras, especialmentea magnitude r, contribui para a obtenção de redshifts fotométricos mais precisos. Emrelação ao número de erros catastrócos, não se vericou nenhuma diminuição quando seinclui a magnitude r e o brilho supercial µr.

3.3.4 Análise com magnitudes

Como descrito na seção 3.1, o método RPL de determinação de redshifts fotométricos podeutilizar magnitudes em bandas fotométricas como variáveis de entrada, ao invés de cores.Nesse caso, como todo o procedimento de análise é o mesmo, pode-se obter resultadosequivalentes aos dados na Tabela 3.2, mas considerando combinações de 2, 3 e 4 bandasdo SDSS (u, g, r, i, z), ao invés de combinações de cores. Para essa análise, utiliza-seos mesmos conjuntos de treinamento e de teste usados na análise com cores, de modoa permitir comparações entre todos os resultados. Os resultados (K, σrms e número deerros catastrócos) para combinações de bandas fotométricas estão compilados na Tabela3.4.

As conclusões que se pode tirar sobre os resultados da Tabela 3.4 são análogas às obtidaspara a análise com cores (Tabela 3.2). Nota-se que, em geral, σrms apresenta valoresmaiores à medida que o número de bandas diminui, mas isso não ocorre para todas ascombinações. Em particular, combinações que envolvem as bandas u, g e r tendem aapresentar valores menores de σrms, o que pode ser explicado também pelo fato de que as

46

Page 69: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Tabela 3.4: Tabela de resultados do método RPL aplicado à amostra do SDSS, paradiferentes valores do número de bandas fotométricas (2, 3, 4 e 5 bandas) do SDSS, comtodas as variações possíveis entre as bandas u, g, r, i e z. A tabela apresenta o númerode bandas, as bandas, K ótimo, σrms (com clipping) na análise do conjunto de teste (de1000 pontos) e número de erros catastrócos.

no bandas K σrms no catastrócos5 u,g,r,i,z 0.66 0.0229 314 u,g,r,i 0.47 0.0233 32

u,g,r,z 0.53 0.0228 36u,g,i,z 0.65 0.0252 32u,r,i,z 0.51 0.0330 26g,r,i,z 0.50 0.0261 27

3 u,g,r 0.37 0.0243 43u,g,i 0.63 0.0266 26u,g,z 0.60 0.0286 23u,r,i 0.42 0.0336 26u,r,z 0.43 0.0348 28u,i,z 0.47 0.0372 32g,r,i 0.31 0.0276 19g,r,z 0.46 0.0275 28g,i,z 0.62 0.0277 31r,i,z 0.32 0.0355 19

2 u,g 0.35 0.0369 19u,r 0.40 0.0380 28u,i 0.39 0.0381 31u,z 0.35 0.0382 36g,r 0.23 0.0292 24g,i 0.43 0.0301 22g,z 0.44 0.0309 26r,i 0.31 0.0353 21r,z 0.20 0.0388 15i,z 0.24 0.0455 21

47

Page 70: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

características espectrais mais visíveis, para galáxias do SDSS, se encontram nessa faixade bandas fotométricas.

Em relação ao valor de K ótimo, pode-se dizer que, em média, decresce à medida que sediminui o número de bandas utilizadas, mas tal comportamento é menos perceptível doque na análise de cores. A variação do número de erros catastrócos, de maneira análoga àanálise com cores, não parece indicar nenhuma tendência com as combinações de bandas.

Pela comparação entre os resultados da análise de cores (Tabela 3.2) e de magnitudes(Tabela 3.4), pode-se notar que, para combinações equivalentes, os resultados da análisecom magnitudes são, em geral, mais precisos do que com cores, apresentando valoresligeiramente menores (da ordem de 5%) de σrms.

Em relação aos valores de K ótimo, nota-se que são maiores quando se considera magni-tudes ao invés de cores. Isso pode ser explicado pelo fato de que as distâncias entre ospontos no espaço de magnitudes tendem a ser maiores do que no espaço de cores, emborarelativamente tais distâncias devam ser equivalentes. Como K entra na fórmula do peso(Equação 3.4) dividindo as distâncias, espera-se que seja maior para os resultados commagnitudes.

Como foi mostrado que os melhores resultados são obtidos quando se considera 5 mag-nitudes nas bandas u,g,r,i,z ao invés de 5 cores, decidiu-se repetir a análise com as 5magnitudes, mas considerando o conjunto de treinamento de 9000 pontos para se obterum valor menor possível de σrms nas estimativas de redshift fotométrico para o métodoRPL. Para essa análise, obteve-se: σrms = 0.0210 que é, de fato, um valor mais precisodo que a análise com cores; K = 0.30; e número de erros catastrócos = 30.

3.3.5 Resultados para galáxias LRGs do SDSS

O Sloan Digital Sky Survey contém uma amostra de galáxias denominada Luminous RedGalaxies (LRGs), que compila as galáxias mais vermelhas e brilhantes do survey. A seleçãodessa amostra é feita através de "cortes" no espaço de cores (g-r e r-i) de galáxias doSDSS, com restrições também na magnitude na banda fotométrica r e no brilho supercialdo objeto. A seleção da amostra de LRGs é descrita em Eisenstein et al. (2001).

Os objetos da amostra LRG extendem-se a mais alto redshift (até aproximadamente 0.5,com média em torno de 0.2) em comparação com o conjunto de objetos padrão do SDSS,que apresenta um redshift médio de aproximadamente 0.1. Isso torna o conjunto de LRGs

48

Page 71: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Tabela 3.5: Tabela de resultados do método RPL aplicado à amostra de galáxias LRGsdo SDSS, para as combinações de 5 cores (u-g,g-r,r-i,i-z,r-z) e 5 magnitudes (u,g,r,i,z). Atabela apresenta K ótimo, σrms (com clipping) na análise do conjunto de teste (de 1000pontos) e número de erros catastrócos.

variáveis N K σrms no catastrócosu-g,g-r,r-i,i-z,r-z 9000 0.13 0.0205 30u-g,g-r,r-i,i-z,r-z 1000 0.19 0.0238 30

u,g,r,i,z 9000 0.39 0.0199 34u,g,r,i,z 1000 1.10 0.0212 29

importante no estudo da estrutura em larga escala e, por conseguinte, de parâmetroscosmológicos (ver, por exemplo, Eisenstein et al. 2005).

Além disso, redshifts fotométricos tendem a ser mais facilmente estimados para as ga-láxias LRGs, pois estas apresentam quebras em 4000A mais acentuadas, característicanotadamente importante para se estimar zphot com mais precisão, independente do mé-todo utilizado. Com isso, espera-se que os valores de σrms para os redshifts fotométricosestimados sejam menores do que quando se considera o conjunto padrão do SDSS.

Foram obtidos, de forma aleatória, 10000 galáxias da base de dados do SDSS, que apresen-tassem redshift espectroscópico medido e que fossem classicados como galáxias vermelhasluminosas (LRGs). A query SQL utilizada encontra-se no Apêndice A.

De forma análoga ao que foi feito com a amostra padrão do SDSS (subseção 3.3.1), dividiu-se 9000 objetos para formar um conjunto de treinamento, enquanto que o restante dos 1000objetos forma o conjunto de teste. Para esta análise de redshifts fotométricos das LRGs,considerou-se também um subconjunto de 1000 objetos do conjunto de treinamento edois tipos de variáveis fotométricas: 5 cores (u-g,g-r,r-i,i-z,r-z) e 5 magnitudes nas bandasu,g,r,i,z.

Note que o procedimento adotado aqui para a análise das LRGs é mais simplicado,embora análogo ao utilizado na análise da amostra padrão do SDSS (subseções 3.3.2,3.3.3 e 3.3.4). Assim, foram obtidos K ótimo, σrms (com clipping) para os seguintesconjuntos de treinamento: 5 cores com N = 9000; 5 cores com N = 1000; e 5 magnitudescom N = 1000 e 5 magnitudes com N = 9000, sendo que em todos os casos utiliza-se omesmo conjunto de 1000 pontos para teste. Os resultados são dados na Tabela 3.5.

Analisando os resultados encontrados, percebe-se que há um ganho na precisão de redshiftsfotométricos quando se utiliza um conjunto de treinamento maior, N = 9000, ao invés

49

Page 72: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

do conjunto de N = 1000 pontos de treinamento. Além disso, obtém-se também valoresligeiramente menores de σrms quando se utiliza as 5 magnitudes u,g,r,i,z ao invés das cores.Tais resultados reetem o que já havia sido concluído na análise da amostra padrão doSDSS, nas subseções anteriores.

Através da comparação dos resultados obtidos para a amostra de LRGs com relação àamostra padrão do SDSS, verica-se que no caso das LRGs os valores de σrms são menoresdo que os valores correspondentes na análise da amostra padrão do SDSS. Ou seja, o valorde σrms obtido para o conjunto de 5 cores e N = 9000, 0.0205, deve ser comparado como σrms da Tabela 3.1 correspondente a N = 9000, que é 0.0219. O mesmo ocorre paraos resultados considerando N = 1000, sendo que, neste caso, consulta-se as Tabelas 3.2e 3.4. Por outro lado, os números de erros catastrócos são praticamente os mesmos nacomparação entre a amostra padrão do SDSS e a amostra de LRGs.

3.4 Comparações com outros métodos

Nesta seção, os resultados obtidos pelo método RPL são comparados com os de outrosmétodos da literatura para se estimar redshifts fotométricos. Para isso, utiliza-se osresultados compilados na Tabela 1.1 que envolvem os dados do SDSS. No caso do métodoRPL, considera-se para comparação o valor de σrms = 0.0210, proveniente da análisedo conjunto de dados do SDSS-DR5 com 9000 pontos de treinamento e considerandomagnitudes nas 5 bandas fotométricas (u,g,r,i,z) que, de acordo com a Tabela 1.1, é o quese considera também na literatura.

No caso do método RPL, assim como de todos os outros métodos empíricos, considera-se ovalor de σrms, obtido com análises de conjuntos de teste, como sendo o erro na estimativade redshift fotométrico para um dado método. Por isso, é possível comparar σrms com osvalores listados na coluna σz da Tabela 1.1.

Nota-se que o valor de σrms = 0.0210 do método RPL é da mesma ordem dos demaismétodos empíricos, os quais, por sua vez, apresentam valores de σz menores do que osobtidos pelos métodos de templates e pelo método híbrido de Csabai & Budavári.

Considerando apenas os surveys do SDSS, de qualquer versão (EDR, DR3 ou DR5), épossível perceber que apenas dois métodos, ambos empíricos, apresentam valores menoresde σz do que o do método RPL: redes neurais (MLP) de Raaele et al. (2007), quepossui σz = 0.0208; e ensemble learning de Way & Srivastava (2006), que apresenta omelhor erro em zphot, σz = 0.0205. No entanto, os valores de σz dos 3 métodos (RPL,

50

Page 73: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

MLP e ensemble learning) são muito próximos entre si e, portanto, os 3 métodos sãoprovavelmente equivalentes.

Entretanto, é preciso notar que os conjuntos de treinamento utilizados nos outros métodosempíricos são, em geral, muito maiores do que os utilizados aqui (máximo de 9000 pontos).Em particular, o método MLP utilizou da ordem de 270 mil pontos (Raaele et al. 2007)de treinamento e o método ensemble learning considerou em torno de 200 mil pontos.Pelo Gráco 3.8, que exibe a dependência de σrms do método RPL com o tamanho doconjunto de treinamento, pode-se prever que os valores de σrms obtidos pelo método RPLpoderiam ser ainda menores caso fossem considerados valores maiores para N .

Um comentário que se deve fazer sobre os valores de σz de Way & Srivastava (2006) e deRaaele et al. (2007) é que, neste último, foi explicitado no artigo que se usou sigma-

clipping para se obter o valor de σz. Já no caso de Way & Srivastava (2006), não constaa informação de que sigma-clipping foi utilizado, ou seja, se eles consideraram ou não oserros catastrócos no cálculo de σrms.

Para o conjunto de LRGs, nota-se que apenas o método MLP apresenta um menor valorde σz (0.0164), em relação ao método de RPL (0.0199). Mas, ao contrário do conjuntopadrão do SDSS, a diferença entre os dois valores de σz é signicativa no caso das LRGs.

3.5 Aplicação na busca de estruturas associadas a pares

de quasares

O método RPL foi utilizado na obtenção de redshifts fotométricos de objetos de 4 camposao redor de pares de quasares em torno de redshift z ∼ 1. Este trabalho se propõe a estudaras propriedade fotométricas desses 4 campos com o objetivo de se identicar estruturas emgrandes escalas, como grupos e aglomerados de galáxias, associadas aos pares de quasares.Esta seção concentra-se mais especicamente na parte do estudo que trata de redshiftsfotométricos, sendo que o trabalho completo está descrito detalhadamente em Boris et al.(2007).

Neste estudo, os redshifts fotométricos são necessários para se encontrar os objetos quepossuem reshifts próximos a 1, ou seja, galáxias que estejam espacialmente próximas dospares de quasares. Com isso, pode-se desconsiderar da análise os objetos que fazem partedos campos apenas por efeito de projeção.

51

Page 74: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Tabela 3.6: Informações sobre os quatro pares de quasares.

Nome do Par Nomes dos Quasares RA DEC Redshift(J2000) (J2000)

QP1310+0007 J131046+0006 13 10 46.2 00 06 33 0.925J131055+0008 13 10 55.9 00 08 14 0.933

QP1355-0032 J135457-0034 13 54 57.2 -00 34 06 0.932J135504-0030 13 55 04.7 -00 30 20 0.934

QP0110-0219 Q 0107-0235 01 10 13.2 -02 19 53 0.958PB 6291 01 10 16.3 -02 18 51 0.956

QP0114-3140 J011441-3139 01 14 41.8 -31 39 25 0.974J011446-3141 01 14 46.4 -31 41 31 0.968

Os 4 campos foram observados com o instrumento GMOS nos telescópios do Gemini

Norte e Sul. A fotometria foi realizada em 4 bandas fotométricas do SDSS (Fukugita etal. 1996): g', r', i' e z'. Os nomes adotados aqui para os pares, os nomes dos quasares,suas coordenadas e redshifts são dados na Tabela 3.6.

Considerando-se os altos valores de redshift (z ∼ 1) em questão, os dados espectroscópicosdo SDSS não são os mais indicados para servir como conjunto de treinamento (como osutilizados nas seções anteriores), pois não possuem a profundidade necessária para seremrepresentativos do conjunto de dados para os quais se quer obter os redshifts fotométricos.Assim, decidiu-se utilizar, como conjunto de treinamento, dados espectroscópicos da regiãodo ACS-GOODS (Cowie et al. 2004). O sistema fotométrico desses objetos do ACS-GOODS (UBVRIz'), no entanto, não estava no mesmo sistema da fotometria dos camposdos pares de qusares (g', r', i', z'), então as magnitudes nas bandas do ACS-GOODStiveram de ser interpoladas para corresponder às mesmas bandas do GMOS adotadasneste estudo.

Para se determinar os zphot pelo método RPL, foram utilizadas cores ao invés de mag-nitudes como parâmetros fotométricos de entrada do método. Isso permite estender aanálise a todos os objetos dos campos (completo até i′ = 24), mesmo que a completezaespectroscópica do ACS-GOODS seja só até z′ = 22. Evidentemente, para isso, assume-seque as cores sejam bons indicativos de redshift mesmo para os objetos mais fracos doscampos.

O valor de K ótimo foi obtido de acordo com o procedimento descrito na seção 3.2, sendoque o conjunto de treinamento do ACS-GOODS possui N = 490 objetos. Assim, obteve-se K = 0.33, que é o valor mediano da distribuição de 100 valores de K, provenientes das100 divisões de 2/3N para treinamento e 1/3N para validação.

52

Page 75: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

0 0.1 0.2 0.3

0

20

40

60

erro

Figura 3.10: Distribuição de 100 valores de σrms mínimo para o conjunto de treinamentode 490 galáxias do ACS-GOODS. O valor médio da distribuição é 0.16.

Como o conjunto de treinamento já possui um número baixo de pontos (N = 490), nenhumconjunto de teste foi obtido a partir desses dados e considerou-se como erro no zphot (σz)o valor médio da distribuição dos 100 valores de σrms mínimos associados a cada divisão2/3 e 1/3. A distribuição encontra-se na Figura 3.10 e o valor médio encontrado foi deσz = 0.16. A Figura 3.11 mostra o gráco comparativo zspec × zphot para um conjunto de1/3 de pontos de validação.

Nota-se que tal valor de σz é bem maior do que os σrms obtidos na análise com os dadosdo SDSS (por exemplo, na Tabela 3.2). Isso pode ser explicado por diversos fatores, sendoo principal deles é que, neste estudo com dados do ACS-GOODS, os campos consideradossão mais profundos do que os dados do SDSS, o que intrinsecamente produz uma maiorincerteza na determinação dos redshifts fotométricos (ver, por exemplo, Ilbert et al. 2006e Coe et al. 2006). Além disso, o conjunto de treinamento considerado aqui é menor(N = 490) e, decerto, menos representativo do que os conjuntos de treinamento utilizadosna análise do SDSS. Por m, outras possíveis fontes de erro relevantes são: as incertezasfotométricas nos valores de magnitude provenientes das interpolações das bandas; a ex-trapolação do espaço de cores para objetos mais fracos, dadas as diferenças na completezaentre os conjuntos de treinamento e de dados; e a ausência da banda u, que causa maiordispersão em zphot para mais baixos redshifts (z < 0.6), como mostrado na Figura 3.11.

53

Page 76: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

0 0.2 0.4 0.6 0.8 1 1.20

0.2

0.4

0.6

0.8

1

1.2

Figura 3.11: Gráco de comparação entre redshifts espectroscópicos (zspec) e fotométricos(zphot) para as galáxias do conjunto de validação do ACS-GOODS. O valor de σrms é de0.16. No gráco, a reta de linha cheia, indica zspec = zphot e as retas de linhas pontilhadasindicam as regiões de 1 e 3 σrms (com clipping).

54

Page 77: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

0 0.5 1 1.5 2

0

10

20

30

redshift

(a)

0 0.5 1 1.5 2

0

10

20

30

40

redshift

(b)

0 0.5 1 1.5 2

0

10

20

30

redshift

(c)

0 0.5 1 1.5 2

0

5

10

15

20

redshift

(d)

Figura 3.12: Distribuições de redshifts fotométricos para as galáxias dos 4 campos depares de quasares. A área hachurada corresponde aos intervalos de zpair ± σz.

Com o valor de K ótimo, foi possível rodar o código de RPL para os objetos fotométricosdos 4 campos, obtendo seus redshifts fotométricos. Então, pode-se estudar estruturaspróximas aos redshifts zpair dos pares de quasares, ou seja, objetos com zphot = zpair±∆z.Considerou-se ∆z como sendo igual a σz = 0.16, embora os resultados variam poucoquando se considera ∆z = 0.1 ou ∆z = 0.2.

A Figura 3.12 apresenta as distribuições de redshifts fotométricos para as galáxias dos 4campos de pares de quasares. Nota-se que todos os campos apresentam picos próximosaos redshifts dos quasares (z ∼ 1). Pode-se analisar, então, propriedades desses conjuntosde galáxias dos intervalos zphot = zpair ± ∆z a m de se determinar se formam de fatoestruturas, como grupos e aglomerados.

Foram feitas análises que envolvem: densidade numérica de galáxias, em relação a objetos

55

Page 78: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

da região do HHDFN (Hawaii Hubble Deep Field North, Capak et al. 2004); aglomeraçãode galáxias, a partir da estimativa de um nível de conança que mede a probabilidadedas galáxias estarem mais concentradas em relação a uma distribuição uniforme; riqueza,com um critério semelhante ao de Abell; e presença de sequência vermelha no diagramacor-magnitude, bem como a forma da distribuição projetada das galáxias vermelhas.

Os resultados (detalhados em Boris et al. 2007) indicam que três dos quatro pares dequasares são, provavelmente, membros de aglomerados de galáxias. Para o outro par(QP0114-3140), não foram encontradas evidências fortes o suciente para armar que fazparte de um aglomerado, mas poderia estar em um aglomerado pobre, em um grupo ouna vizinhança de um aglomerado.

A conclusão deste trabalho é que pares de quasares são, de fato, bons indicadores dapresença de estruturas em grandes escalas em alto redshift. Uma extensão desse trabalhoseria analisar pares em diferentes redshifts para obter informações sobre a evolução deestruturas e de aglomerados de galáxias.

56

Page 79: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Capítulo 4

Estimativa de Linhas de Emissão por

Fotometria

Como descrito no Capítulo 3, o método de Regressão Ponderada Localmente estabeleceuma relação empírica entre duas ou mais variáveis quaisquer que, em princípio, seriamdadas por funções não-lineares complexas. Portanto, o método no geral pode contribuir emoutros trabalhos em Astronomia, além do estimador de redshifts. Este capítulo apresentaum trabalho que utiliza o método RPL para se estimar a largura equivalente de linhas deemissão de galáxias, usando apenas dados fotométricos. A motivação principal é identicaralvos para os futuros levantamentos de redshift que estão sendo planejados, como o doWFMOS (Wide-Field Multi-Object Spectrograph) que, eventualmente, será instalado notelescópio Subaru em parceria com o consórcio Gemini. A seção 4.1 descreve os conjuntosde dados utilizados. Na seção 4.2, são apresentadas as análises realizadas, bem como osresultados. E a seção 4.3 apresenta uma breve discussão sobre os resultados.

4.1 Conjuntos de Dados

Este trabalho se propõe a vericar a viabilidade de se utilizar estimativas fotométricas delarguras equivalentes de linhas de emissão com o objetivo de prover alvos espectroscópicospara possíveis surveys de redshift. Para essa análise, utilizou-se conjuntos de dados obtidosa partir de dois surveys com profundidades diferentes em redshift: Sloan Digital Sky Survey(Data Release 2, SDSS-DR2) e Team Keck Treasury Redshift Survey1 (TKRS).

1http://www2.keck.hawaii.edu/science/tksurvey/

57

Page 80: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

No caso do SDSS-DR2, foram considerados 1500 objetos para o conjunto de treinamento(N = 1500) e da ordem de 2500 objetos para teste, para uma faixa de redshifts z <0.3. Foram analisadas larguras equivalentes das seguintes linhas de emissão: Hα, Hβ,[OI]λ6301, [OII]λ3727, [OIII]λ5007 e [NII]λ6584. Os dados fotométricos de entradasão as magnitudes nas 5 bandas do SDSS: u, g, r, i, z.

Para o TKRS, foram utilizados aproximadamente 1000 objetos para treinamento e daordem de 400 pontos para teste, numa faixa maior de redshifts (z < 1.5). A análise foifeita para a linha [OII]λ3727 e foram utilizadas as bandas fotométricas b, v, i, z, cujasmagnitudes foram obtidas do campo do GOODS-N, dados disponíveis também no websitedo TKRS.

4.2 Análises e Resultados

O método RPL pode ser usado, então, para se estimar larguras equivalentes das linhas deemissão a partir de magnitudes em bandas fotométricas. O código, descrito na seção 3.1,é o mesmo que foi utilizado para se determinar redshifts fotométricos, sendo que aqui aequação 3.8 é substituída por:

EW [linha]RPL = y(xq) = aT.t(xq) = a0 +n∑

i=1

aixi,q (4.1)

onde EW [linha]RPL é a largura equivalente de uma dada linha, estimada pelo RPL, aoinvés do redshift fotométrico.

De fato, para se evitar os efeitos catastrócos gerados pelos dados que continham largu-ras equivalentes nulas, foram utilizados os valores do logaritmo da largura equivalente.Portanto, temos na verdade:

log(EW [linha])RPL = y(xq) = aT.t(xq) = a0 +n∑

i=1

aixi,q (4.2)

Os valores de K foram obtidos de maneira análoga ao procedimento descrito na seção3.2, utilizando conjuntos de treinamento e de validação para encontrar os valores de K

58

Page 81: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Tabela 4.1: Tabela de resultados das estimativas de largura equivalente de linhas deemissão pelo método RPL. A tabela apresenta a linha de emissão, o survey (SDSS ouTKRS), K ótimo e σrms (com clipping).

linha survey K σrms

log(EW [Hα]) SDSS-DR2 0.58 0.364log(EW [Hβ]) SDSS-DR2 1.29 0.274log(EW [OI]) SDSS-DR2 4.93 0.222log(EW [OII]) SDSS-DR2 0.59 0.232log(EW [OIII]) SDSS-DR2 0.92 0.319log(EW [NII]) SDSS-DR2 0.87 0.318log(EW [OII]) TKRS 1.56 0.238

correspondentes aos mínimos de σrms. Então, utilizando esses valores de K, aplica-se ométodo RPL nos conjuntos de teste, os quais possuem larguras equivalentes medidas paraas linhas de emissão em questão, permitindo-se a comparação entre as estimativas obtidase os valores medidos do conjunto do teste.

A Tabela 4.1 apresenta os resultados encontrados (K e σrms) para as diversas linhas deemissão, tanto do conjunto de dados do SDSS-DR2, quanto dos dados do TKRS. Osgrácos comparativos entre os valores estimados log(EW [linha])RPL e os valores de testelog(EW [linha])teste são dados nas Figuras 4.1 a 4.6, para as linhas de emissão do SDSS,e Figura 4.7 para o TKRS. O número de erros catastrócos é da ordem de 5% a 10% emtodos os casos.

4.3 Discussão

Dos resultados obtidos, nota-se que, de fato, existe uma relação entre as cores de umagaláxia e as intensidades de suas linhas de emissão, o que viabiliza esse estudo de seestimar larguras equivalentes de linhas de emissão a partir de dados fotométricos. Poroutro lado, os σrms encontrados são bem maiores (da ordem de 10 vezes maior) do que osobtidos na análise de redshifts fotométricos (Capítulo 3). Isso indica que as característicasgerais do espectro de uma galáxia dependem mais fortemente de seu redshift do que dapresença de linhas de emissão, o que é um resultado esperado.

Considerando os valores altos de σrms nesta análise de linhas de emissão, é preciso to-mar um certo cuidado para se utilizar os resultados obtidos em aplicações que envolvamlarguras equivalentes de linhas de emissão. Para o objetivo proposto inicialmente, que é

59

Page 82: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 4.1: Gráco de comparação entre larguras equivalentes da linha de emissão Hαpara os dados do SDSS-DR2. log(EW [Hα])RPL é a estimativa de RPL e log(EW [Hα])teste

são os valores de teste. No gráco, a reta de linha cheia indica log(EW [Hα])RPL =log(EW [Hα])teste e as retas de linhas pontilhadas indicam as regiões de 1 e 3 σrms (comclipping).

60

Page 83: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 4.2: Gráco de comparação entre larguras equivalentes da linha de emissão Hαpara os dados do SDSS-DR2. log(EW [Hβ])RPL é a estimativa de RPL e log(EW [Hβ])teste

são os valores de teste. No gráco, a reta de linha cheia indica log(EW [Hβ])RPL =log(EW [Hβ])teste e as retas de linhas pontilhadas indicam as regiões de 1 e 3 σrms (comclipping).

61

Page 84: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 4.3: Gráco de comparação entre larguras equivalentes da linha de emissão OIpara os dados do SDSS-DR2. log(EW [OI])RPL é a estimativa de RPL e log(EW [OI])teste

são os valores de teste. No gráco, a reta de linha cheia indica log(EW [OI])RPL =log(EW [OI])teste e as retas de linhas pontilhadas indicam as regiões de 1 e 3 σrms (comclipping).

62

Page 85: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 4.4: Gráco de comparação entre larguras equivalentes da linha de emis-são OII para os dados do SDSS-DR2. log(EW [OII])RPL é a estimativa de RPL elog(EW [OII])teste são os valores de teste. No gráco, a reta de linha cheia indicalog(EW [OII])RPL = log(EW [OII])teste e as retas de linhas pontilhadas indicam as regiõesde 1 e 3 σrms (com clipping).

63

Page 86: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 4.5: Gráco de comparação entre larguras equivalentes da linha de emissãoOII para os dados do SDSS-DR2. log(EW [OIII])RPL é a estimativa de RPL elog(EW [OIII])teste são os valores de teste. No gráco, a reta de linha cheia indicalog(EW [OIII])RPL = log(EW [OIII])teste e as retas de linhas pontilhadas indicam asregiões de 1 e 3 σrms (com clipping).

64

Page 87: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 4.6: Gráco de comparação entre larguras equivalentes da linha de emissãoNII para os dados do SDSS-DR2. log(EW [NII])RPL é a estimativa de RPL elog(EW [NII])teste são os valores de teste. No gráco, a reta de linha cheia indicalog(EW [NII])RPL = log(EW [NII])teste e as retas de linhas pontilhadas indicam as re-giões de 1 e 3 σrms (com clipping).

65

Page 88: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Figura 4.7: Gráco de comparação entre larguras equivalentes da linha de emissão OIIpara os dados do TKRS. log(EW [OII])RPL é a estimativa de RPL e log(EW [OII])teste

são os valores de teste. No gráco, a reta de linha cheia indica log(EW [OII])RPL =log(EW [OII])teste e as retas de linhas pontilhadas indicam as regiões de 1 e 3 σrms (comclipping).

66

Page 89: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

obter alvos espectroscópicos para possíveis surveys de galáxias com linhas de emissão, osresultados podem ser considerados satisfatórios.

A relação entre cores e larguras equivalentes de linhas de emissão se mostra melhor paracertas linhas em relação a outras, como pode ser visto pelos valores de dispersão σrms

(Tabela 4.1) e pela distribuição dos pontos nos grácos (Figuras 4.1 a 4.7). Em particular,a distribuição obtida no caso da linha [OI]λ6301 do SDSS-DR2 apresenta uma formaincomum, onde o método parece superestimar o valor da largura equivalente para valoresmenores que log(EW [OII])teste = −0.3.

Em relação à linha [OII]λ3727 do TKRS, percebe-se que apresenta uma distribuição eum valor de σrms = 0.238 comparavéis com o que se obteve para as linhas do SDSS-DR2.

Os resultados foram complementados também pelo método de redes neurais (ANNz),que também gerou estimativas para as larguras equivalentes das linhas de emissão, comresultados bastante semelhantes aos obtidos com o método de Regressão Ponderada Lo-calmente (Abdalla et al. 2007). Além disso, com a técnica de redes neurais, é possívelfornecer os resultados na forma de probabilidade de existência de linha de emissão, ouseja, indica a probabilidade da galáxia ter ou não uma dada linha de emissão.

67

Page 90: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

68

Page 91: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Capítulo 5

Conclusões e Perspectivas

5.1 Conclusões

Foi implementado um método empírico de determinação de redshifts fotométricos, deno-minado Regressão Ponderada Localmente (RPL), o qual estabelece ajustes locais entredados fotométricos (magnitudes ou cores) e redshifts, a partir de um conjunto de treina-mento com redshifts conhecidos. Foram apresentados também estudos, desenvolvidos aolongo do Mestrado, que exemplicam aplicações de redshifts fotométricos, como a buscapor grupos fósseis, determinação de estruturas em grandes escalas associadas a pares dequasares e estimativas fotométricas para intensidades de linhas de emissão de galáxias.

Diversos testes de obtenção de redshifts fotométricos, pelo método RPL, foram realizados,utilizando-se dados espectro-fotométricos do Sloan Digital Sky Survey (SDSS). Os testesincluem a dependência dos resultados com o tamanho do conjunto de treinamento (de 100a 9000 objetos), a dependência com as variáveis fotométricas de entrada, com o númerodelas (2, 3, 4 e 5 cores ou magnitudes) e com a inclusão de um parâmetro adicional (brilhosupercial ou magnitude).

A partir dos testes realizados, conclui-se que o método RPL fornece melhores resultados àmedida em que se aumenta o conjunto de treinamento. Presumivelmente, esta tendênciade queda deve se manter para conjuntos com mais de 9000 pontos de treinamento, valormáximo utilizado no presente trabalho.

Além disso, obtém-se melhores resultados quando se considera magnitudes nas 5 bandas

69

Page 92: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

fotométricas (u, g, r, i e z) do SDSS, ao invés de cores (u-g,g-r,r-i,i-z,r-z). Notou-se tambémque certas combinações de cores ou de magnitudes são mais importantes do que outrasna determinação de redshifts fotométricos. Em particular, combinações que envolvam asmagnitudes u, g e r ou as cores u-g, g-r e r-i tendem a produzir redshifts fotométricosmais precisos.

Notou-se que o número de erros catastrócos, ou seja, estimativas de redshift fotomé-trico que apresentam diferença para o redshift espectroscópico de mais de 3σ, se mantémpraticamente constante e da ordem de 3% para todos os testes considerados.

Foram feitas também análises com um conjunto de dados referentes a galáxias vermelhase luminosas do SDSS (LRGs). De modo geral, apresentam redshifts fotométricos maisprecisos do que os obtidos para o conjunto padrão do SDSS, conforme se verica naliteratura.

Conclui-se que o método RPL apresenta um erro médio de 0.0210 nos redshifts fotométri-cos dos dados do SDSS, quando se considera o conjunto de treinamento de 9000 objetose as magnitudes u, g, r, i, z. No caso do conjunto de LRGs, o erro médio ca em 0.0199.Estes valores são comparáveis aos menores erros obtidos na literatura, o que comprova aecácia do método RPL na determinação de redshifts fotométricos.

5.2 Perspectivas

Há muitas formas de se melhorar o código de RPL na obtenção de redshifts fotométri-cos. A mais óbvia, conforme vericado nesta Dissertação, é utilizar conjuntos maiores detreinamento, de modo a obter menores incertezas. Para isso, deve-se rodar o código empotentes clusters de computadores, principalmente na etapa de determinação do parâme-tro K, adaptando o código para torná-lo eciente em sistemas de computação paralela.

Além disso, pode-se incluir uma abordagem bayesiana ao código de RPL, incorporando,por exemplo, um prior sobre a distribuição esperada de redshifts. Pretendemos desenvol-ver também um algoritmo híbrido, que incorpore não só o método RPL, como tambémredes neurais e templates. Acreditamos que este algoritmo híbrido poderá ter um de-sempenho melhor que os usado até agora quando aplicado a qualquer conjunto de dadosfotométricos, independente da profundidade em redshift e em cores.

Os redshifts fotométricos obtidos com o método RPL poderão ser utilizados para diversasaplicações, como busca por estruturas em grandes escalas. Um exemplo é a busca de

70

Page 93: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

aglomerados em redshifts intermediários na amostra de Luminous Red Galaxies do SDSS.Em Cosmologia, os redshifts fotométricos podem ser aplicados na detecção de oscilaçõesde bárions, utilizando também a amostra de LRGs do SDSS.

O procedimento de busca de grupos fósseis pode ser aplicado em outros surveys, comoo Canada-France-Hawaii Telescope Legacy Survey (CFHTLS), com a expectativa de seaumentar o número de candidatos a grupos fósseis.

Por m, o método RPL pode ser aplicado a outros problemas astrofísicos, além de redshiftsfotométricos, como na estimativa de larguras equivalentes de linhas de emissão, conformemostrado na Dissertação.

71

Page 94: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

72

Page 95: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Referências

Abdalla, F. et al. 2007., em preparação

Adelman-McCarthy, J. K. et al. 2007. ApJS, in press

Atkeson, C. G., Moore, A. W., Schaal, S. 1997. Articial Intelligence Review 11,11

Babbedge, T. S. R. et al. 2004. MNRAS 353, 654

Ball, N. M., Brunner, R. J., Myers, A. D., Strand, N. E., Alberts, S. L.,

Tcheng, D., Llorà, X. 2007. ApJ, in press

Baum, W. A. 1962. Problems of extra-galactic reasearch: IAU Symposium, 15, 390

Benítez, N. 2000. ApJ 536, 571

Blake, C., Bridle, S. 2005. MNRAS 363, 1329

Blake, C., Parkinson, D., Bassett, B., Glazebrook, K., Kunz, M., Nichol,

R. C. 2006. MNRAS 365, 255

Blake, C., Collister, A., Bridle, S., Lahav, O. 2007. MNRAS 374, 1527

Blanton, M. et al. 2001. AJ 121, 2358

Bolzonella, M., Miralles, J.-M., Pelló, R. 2000. A&A 363, 476

Boris, N., Sodré Jr., L., Cypriano, E. S., Santos, W. A., Mendes de Oliveira,

C., West, M. 2007. ApJ, submetido

73

Page 96: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Botzler, C. S., Snigula, J., Bender, R., Hopp, U. 2004. MNRAS 349, 425

Bruzual, G., Charlot, S. 2003. MNRAS 344, 1000

Budavári, T., Szalay, A. S., Connolly, A. J., Csabai, I., Dickinson, M. 2000.AJ 120, 1588

Budavári, T. et al. 2001. AJ 122, 1163

Capak, P. et al. 2004. AJ 205, 3801

Cleveland, W. S., Delvin, S. J. 1988. Journal of the American Statistical Association

83(403), 596

Coe, D., Benítez, N., Sánchez, S. F., Jee, M., Bouwens, R., Ford, H. 2006. AJ132, 926

Coleman, G. D., Wu, C.-C., Weedman, D. W. 1980. ApJS 43, 393

Collister, A., Lahav, O. 2004. PASP 116, 345

Collister, A. et al. 2007. MNRAS 375, 68

Connolly, A. J., Csabai, I., Szalay, A. S., Koo, D. C., Kron, R. G., Munn, J.

A. 1995. AJ 110, 2655

Cowie, L. L., Barger, A. J., Hu, E. M., Capak, P., Songaila, A. 2004. AJ 1273137

Csabai, I., Connolly, A. J., Szalay, A. S., Budavári, T. 2000. AJ 119, 69

Csabai, I. et al. 2003. AJ 125, 580

de la Calleja, J., Fuentes, O. 2004. MNRAS 349, 87

Eisenstein, D. J. et al. 2001. AJ 122, 2267

Eisenstein, D. J. et al. 2005. ApJ 633, 560

Fernández-Soto, A., Lanzetta, K. M., Yahil, A. 1999 ApJ 513, 34

Fukugita, M., Ichikawa, T., Gunn, J. E., Doi, M., Shimasaku, K., Schneider,

D. P. 1996. AJ 111, 1748

Grosse, E. 1989. Approximation Theory VI, Academic Press

74

Page 97: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Gwyn, S. D. J. 1995. Master Thesis, University of Victoria

Gwyn, S. D. J., Hartwick, F. D. A. 1996. ApJ 468, 77

Ilbert, O. et al. 2006. A&A 457, 841

Jones, L. R., Ponman, T. J., Horton, A., Babul, A., Ebeling, H., Burke, D.

J. 2003. MNRAS 343, 627

Knox, L., Song, Y.-S., Zhan, H. 2006. ApJ 652, 857

Koo, D. C. 1985. AJ 90, 418

Mahdavi, A., Trentham, N., Tully, R. B. 2005. AJ 130, 1502

Mendes de Oliveira, C., Cypriano, E.S., Sodré Jr., L. 2006. AJ 131, 158

Mobasher, B. et al. 2006. ApJS, submetido

Moore, A. W. 1992. Advances in Neural Information Processing Systems, Moody, J.E., Hanson, S. J., Lippman, R. P. editores. Morgan Kaufmann

Moore, A. W., Schneider, J., Deng K. 1997. Proc. Int. Machine Learning Confe-

rence, ed. D. Fisher (San Francisco: Morgan Kaufmann)

O'Mullane, W. et al. 2003. ASP Conf. Ser. 347: Astronomical Data Analysis Software

and Systems XIV

Padmanabhan, N. et al. 2005. MNRAS 359, 237

Ponman, T. J., Allan, D. J., Jones, L. R., Merrifield, M., McHardy, I. M.,

Lehto, H. J., Luppino, G. A. 1994. Nature 369, 462

Press, W. H., Flannery, B. P., Teukolsky, S. A., Vetterling, W. T 1992.Numerical Recipes in C, Cambridge University Press

Raffaele, D., Antonino, S., Giuseppe, L., Massimo, B., Maurizio, P., De Fi-

lippis E., Roberto, T. 2007. ApJ, in press

Rowan-Robinson, M. 2003. MNRAS 345, 819

Santos, W. A., Mendes de Oliveira, C., Sodré Jr., L. 2007. AJ, submetido

Schaal, S., Atkeson, C. 1994. Control Systems Magazine 14

Sheth R. K. 2007. MNRAS, submetido

75

Page 98: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Suchkov, A. A., Hanisch, R. J., Margon, B. 2005. AJ 130, 2439

Trevese, D., Castellano, M., Fontana, A., Giallongo, E. 2007. A&A 463, 853

Vikhlinin, A., McNamara, B. R., Hornstrup, A., Quintana, H., Forman, W.,

Jones, C., Way, M. 1999. ApJ 520, L1

Wadadekar, Y. 2005. PASP 117, 79

Wang, Y. 2007. ApJ 654, 123

Way, M. J., Srivastava, A. N. 2006. ApJ 647, 102

Weinstein, M. A. et al. 2004. ApJS 155, 243

Zhan, H., Knox, L. 2006. ApJ 644, 663

76

Page 99: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Apêndice A

Tecnologias de banco de dados em Astronomia

Neste apêndice, são apresentadas tecnologias de acesso e busca de dados em bancos dedados em Astronomia. Inicialmente, discute-se a linguagem SQL (Structured Query Lan-

guage) na busca de dados do Sloan Digital Sky Survey (SDSS) e, em seguida, a ferramentaOpenSkyQuery do Observatório Virtual Americano (NVO - National Virtual Observatory),que utiliza a linguagem ADQL (Astronomical Data Query Language).

SQL e CasJobs

SQL é uma linguagem de computador utilizada para se trabalhar com bancos de dados,que permite criar e alterar tabelas, assim como fazer buscas por dados em tabelas jáexistentes, que é o caso que interessa ao se fazer pesquisas astronômicas. Uma buscapode ser feita através de uma query SQL, que é um conjunto de instruções escritos nessalinguagem. Uma query é composta por três partes básicas:

• SELECT: determina quais os parâmetros (colunas de tabelas) que serão retornados;

• FROM: indica a(s) tabela(s) de onde se quer obter os dados;

• WHERE: condições para restringir os dados que serão retornados;

• ORDER BY: indica qual parâmetro será utilizado na ordenação dos dados retorna-dos.

Assim, pode-se obter quaisquer dados (fotométricos ou espectroscópicos) do SDSS a partirde queries escritas pelo próprio usuário (astrônomo). As buscas são feitas no sistemaSQL do SDSS denominado CasJobs 1 (Catalog Archive Server Jobs System), que pode

1http://casjobs.sdss.org/CasJobs/

77

Page 100: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

ser acessado de forma completa mediante um registro feito no próprio site. O registrogarante também ao usuário uma base de dados pessoal (MyDB), na qual se pode salvarresultados de buscas. É possível também fazer upload de tabelas para o MyDB, para quetais tabelas possam ser utilizadas em queries, correlacionando-as com os dados do SDSS.

As tabelas e os parâmetros do SDSS que podem ser acessados pelo CasJobs são listadose descritos no site Schema Browser 2. Para mais informações sobre a linguagem SQL,existem diversos tutoriais on-line, inclusive um tutorial no próprio site do SDSS3. Pode-seconsultar também o site4 Sample SQL Queries, que contém diversos exemplos de queries.

A seguir, serão listadas todas as queries utilizadas ao longo desta dissertação, separadaspelos números dos capítulos a que se referem.

Queries do Capítulo 2:

Para a seleção das galáxias vermelhas e luminosas (LRGs):

SELECT

p.objID, s.ra, s.dec, s.z as redshift, p.u, p.g, p.r, p.i, p.z,

(p.u-p.r) as u_r, l.ew as d4000, s.eClass, p.lnlDev_r,

p.lnlExp_r INTO lrgs

FROM SpecObj as s, Galaxy as p, SpecLineIndex as l

WHERE

s.bestObjID = p.objID AND

s.specClass = 2 AND

s.zStatus > 1 AND

(s.primTarget & 0x00000020 > 0) AND

s.z > 0 AND p.r < 19 AND

l.specobjid = s.specobjid AND

l.name = `4000Abreak'

ORDER BY p.objID

Para selecionar galáxias vizinhas ao redor das elípticas:

CREATE TABLE neighbors (

ra float,

dec float,

rad float,

id int,

z float,

objid bigint,

2http://cas.sdss.org/dr5/en/help/browser/browser.asp3http://cas.sdss.org/dr5/en/help/docs/sql_help.asp4http://cas.sdss.org/dr5/en/help/docs/realquery.asp

78

Page 101: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

r real

)

CREATE TABLE #UPLOAD(

up_ra FLOAT,

up_dec FLOAT,

up_rad FLOAT,

up_id int

)

INSERT INTO #UPLOAD

SELECT

ra AS UP_RA,

dec AS UP_DEC,

rad as UP_RAD,

id AS UP_ID

FROM mydb.radius

ORDER BY id

CREATE TABLE #tmp (

up_id int,

objid bigint

)

INSERT INTO #tmp

EXEC spGetNeighborsRadius

INSERT INTO mydb.neighbors

SELECT a.ra, a.dec, a.rad, a.id, a.redshift, t.objid, g.r

FROM #tmp t, mydb.radius a, Galaxy g

WHERE t.up_id = a.id AND t.objid = g.objID AND g.r < 21

ORDER BY a.id, t.objid

Para selecionar redshifts fotométricos das galáxias vizinhas:

SELECT n.id, n.objid, p.z, p.zErr, p.quality, n.r

INTO redshifts

FROM neighbors as n, dr5.photoz as p

WHERE n.objid = p.objid

ORDER BY n.id, n.objid

Para substituir redshifts fotométricos por espectroscópicos quando estes encontram-sedisponíveis:

UPDATE redshifts

79

Page 102: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

SET z =

(SELECT TOP 1 d.z

FROM dr5.specObj as d

WHERE d.bestObjID = redshifts.objID AND d.zStatus > 1 AND d.z > 0)

WHERE EXISTS

(SELECT TOP 1 d.z

FROM dr5.specObj as d

WHERE d.bestObjID = redshifts.objID AND d.zStatus > 1 AND d.z > 0)

UPDATE redshifts

SET zErr = 0.002

WHERE EXISTS

(SELECT top 1 d.zErr

FROM dr5.specObj as d

WHERE d.bestObjID = redshifts.objID AND d.zStatus > 1 AND d.z > 0)

Para excluir objetos que possuem incertezas altas em redshift:

DELETE

FROM redshifts

WHERE zErr > 0.1

Para agrupar sistemas no intervalo de redshift:

SELECT s.* INTO groups FROM redshifts as s, lrgs as t

WHERE

s.id = t.id AND

(s.z BETWEEN (t.redshift - s.zErr) AND (t.redshift + s.zErr))

ORDER BY s.id, s.objid

Para identicar sistemas não-fósseis:

SELECT s.* INTO nofossils

FROM lrgs as l, groups as s

WHERE s.id = l.id AND (s.r <= (l.r + 2))

ORDER BY s.id, s.objid

Query para excluir sistemas não-fósseis, permanecendo na tabela apenas os candidatos afósseis:

DELETE FROM fossils

WHERE EXISTS

(SELECT *

FROM nofossils as g

80

Page 103: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

WHERE g.id = fossils.id)

Queries do Capítulo 3:

Para selecionar o conjunto de 10000 galáxias aleatórias:

SELECT TOP 10000 p.objID, s.specObjID, s.z as redshift, s.zErr, p.ra, p.dec,

p.u, p.g, p.r, p.i, p.z, p.petroRad

FROM specobj as s, Galaxy as p

WHERE s.bestObjID = p.objID AND s.specClass = 2 AND s.zStatus > 1 AND s.z >

0 AND s.bestObjID > 0

ORDER BY NEWID()

Para selecionar o conjunto de 10000 galáxias LRGs:

SELECT TOP 10000 p.objID, s.specObjID, s.z as redshift, s.zErr, p.ra, p.dec,

p.u, p.g, p.r, p.i, p.z, p.petroRad

FROM specobj as s, Galaxy as p

WHERE s.bestObjID = p.objID AND s.specClass = 2 AND s.zStatus > 1 AND s.z >

0 AND s.bestObjID > 0 AND (s.primTarget & 0x00000020 > 0)

ORDER BY NEWID()

81

Page 104: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Observatórios Virtuais, OpenSkyQuery e ADQL

No trabalho sobre grupos fósseis, descrito no Capítulo 2, foi utilizada uma ferramentado Observatório Virtual Americano (NVO5 - National Virtual Observatory), denominadaOpenSkyQuery 6.

Os Observatórios Virtuais (VOs) são uma iniciativa da comunidade astronômica internaci-onal, que tem por objetivo disponibilizar acesso a bases de dados astronômicas complestas,além de prover serviços e ferramentas de análise de dados, por meio de denições (no âm-bito do IVOA7 - International Virtual Observatory Alliance) de padrões (standards) quetais dados e ferramentas devem seguir.

O OpenSkyQuery é uma das principais ferramentas do NVO, pois permite correlacionardados de um grande número de surveys entre si, o que é extremamente útil em estudosque envolvem diferentes faixas de comprimento de onda, como foi o caso do trabalho sobregrupos fósseis.

O OpenSkyQuery utiliza a linguagem ADQL (Astronomical Data Query Language) para sefazer queries nos dados dos surveys. Com esta linguagem, é possível correlacionar dadosde diferentes surveys, não só em termos de coordenadas (cross-match), como tambémentre todas as variáveis disponíveis nos bancos de dados. É possível também importarum catálogo pessoal de objetos e correlacioná-lo com outros surveys.

A linguagem ADQL foi desenvolvida a partir da linguagem SQL e, por isso, são muitosemelhantes entre si. No entanto, ADQL possui algoritmos8 voltados para queries emAstronomia, como XMATCH, que correlaciona dados de dois ou mais catálogos a partirde suas coordenadas, e REGION, que restringe os resultados retornados em uma regiãocircular do céu.

No caso dos grupos fósseis, foram correlacionados galáxias LRGs do SDSS com objetosextensos de raios-X medidos pelo ROSAT, utilizando-se a seguinte query:

SELECT x.objid, x.ra, x.dec, x.ext, t.*

FROM Rosat:PhotoPrimary x, MyData:lrgs_1 t

WHERE XMATCH(x, t) < 6 AND x.ext > 0

5http://www.us-vo.org/6openskyquery.net/7http://www.ivoa.net/8http://openskyquery.net/Sky/SkySite/help/algo.aspx

82

Page 105: REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO ......REDSHIFTS FOTOMÉTRICOS COM REGRESSÃO PONDERADA LOCALMENTE ALWTER AUGUSTO DOS SANTOS JUNIOR Orientador: Prof. Dr. Laerte Sodré Jr. Dissertação

Apêndice B

Artigo cientíco sobre grupos fósseis no SDSS:

Fossil Groups in the Sloan Digital Sky Survey

Este trabalho foi submetido para a revista cientíca The Astronomical Journal e está emprocesso de revisão. O artigo contém as informações descritas no Capítulo 2, além de aná-lises e discussões mais detalhadas sobre os candidatos a sistemas fósseis encontrados. Noteque a versão apresentada aqui sofrerá alterações em relação ao artigo nal no momentoem que o trabalho for, eventualmente, aceito para publicação na referida revista.

83