11
Matice distancí v mnohorozměrné analýze

Matice distancí v mnohorozměrné analýze

  • Upload
    urbana

  • View
    23

  • Download
    0

Embed Size (px)

DESCRIPTION

Matice distancí v mnohorozměrné analýze. Distanční matice – proč se objevují?. Vzdálenosti mezi objekty v terénu Vzdálenosti mezi taxony ve fylogenetickém stromečku Vzdálenosti mezi pozorováními, které nelze kvantitativně měřit (např. degustační výsledky). Jak s distančními maticemi nakládat?. - PowerPoint PPT Presentation

Citation preview

Page 1: Matice distancí v mnohorozměrné analýze

Matice distancív mnohorozměrné analýze

Page 2: Matice distancí v mnohorozměrné analýze

Distanční matice – proč se objevují?

• Vzdálenosti mezi objekty v terénu

• Vzdálenosti mezi taxony ve fylogenetickém stromečku

• Vzdálenosti mezi pozorováními, které nelze kvantitativně měřit (např. degustační výsledky)

Page 3: Matice distancí v mnohorozměrné analýze

Jak s distančními maticemi nakládat?

• Můžeme pracovat přímo s hodnotami distancí a z údajů, které nejsou distance, je vypočítat (tak se užívá například Mantelův test). To má ale spoustu nevýhod

• Můžeme distance převést na souřadnice – metody mnohorozměrného škálování. Častěji v takovém případě užíváme metrickou metodu (principal coordinates analysis, PCoA)

Page 4: Matice distancí v mnohorozměrné analýze

Distance máme pro druhová data

• To je případ, ve kterém nám nevyhovují distance, implikované metodou CCA (chi-square distance) nebo RDA (Eukleidovská distance), spočteme si vlastní

• Převedeme na souřadnice pomocí PCoA; nevadí, že jich máme hodně (vysvětlované proměnné mohou být v ordinačních metodách korelovány)

• Použijeme tyto souřadnice v metodě RDA – to je tzv. distance-based RDA (db-RDA), Legendre & Anderson, Ecol.Monographs 1999

Page 5: Matice distancí v mnohorozměrné analýze

Distance máme pro prediktory

• V tomto případě musíme obvykle z vypočítaných hlavních koordinát vybírat (ty, které dobře vysvětlují hodnoty v druhových datech) – jinak by vysvětlily všechno

• Častá je situace, kdy máme některé prediktory jako distance (vzdálenost, fylogenetická spřízněnost), zatímco jiné ne (ekologické vlastnosti druhů, vlastnosti prostředí u snímků)

Page 6: Matice distancí v mnohorozměrné analýze

Prostorové uspořádání I.

• Doporučovaná metoda: PCNM (principal coordinates of neighbour matrices), Borcard & Legendre, Ecol.Modelling 2002

• Spočítáme matici vzdáleností mezi jednotlivými vzorky a pak "utneme" všechny distance větší než hodnota největší vzdálenosti mezi bezprostředními sousedy. Tyto "uťaté" hodnoty nahradíme jednou – 4násobkem limity

Page 7: Matice distancí v mnohorozměrné analýze

Prostorové uspořádání II.

• Výslednou matici pak zpracujeme pomocí PCoA

• Pro pravidelně rozmístěné body odpovídá sinus-cosinus dekompozici (Fourierova transformace) – například lineární transekt

• Ale funguje i pro nepravidelně uspořádaná data, například pobřeží jezera

Page 8: Matice distancí v mnohorozměrné analýze

Prostorové uspořádání III.

• Nejčastěji užíváme tato data, vysvětlující prostorové souvislosti, v rámci variation partitioning

Page 9: Matice distancí v mnohorozměrné analýze

Fylogenetické vztahy I.• Také se nejčastěji užívá v kombinaci

s variation partitioning• Pro překryv v objasňujících schopnostech se

užívá termín „phylogenetically structured environmental variation“ (Desdevides et al., Evolution 2003), odpovídá pojmu „phylogenetic niche conservatism“

• Tento postup lze užít i v případě, že nejde o mnohorozměrná data (příklad vlivu populační density na velikost těla savců)

Page 10: Matice distancí v mnohorozměrné analýze

Fylogenetické vztahy II.

Jak převedeme stromeček na matici?

• Musíme mít tzv. ultrametrický strom (všechny cesty od terminálních nód ke kořenu, tj. počátku divergence dané skupiny, jsou stejně dlouhé)

• Převod na patristickou matici provádí i některé programy pro fylogenetickou analýzu (ape package v R)

Page 11: Matice distancí v mnohorozměrné analýze

Fylogenetické vztahy III.

• Matici převedeme na souřadnice pomocí PCoA (PrCoord)

• Vybereme jen souřadnice, které něco průkazně vysvětlují (forward selection), metoda RDA

• Zvolené souřadnice lze interpretovat jejich pozicí v původním stromečku

• Dále je používáme typicky jako kovariáty