User Tools

Site Tools


cs:data_preparation

Česká verze stránek není od roku 2013 aktualizována.

Příprava dat pro analýzy

Transformace

Pro transformaci dat postačí základní eRkové funkce. Řekněme, že proměnná veg.data obsahuje matici vzorky x druhy, přičemž abundance druhů je vyjádřená v procentech (rozmezí 0-100%).

Odmocninová transformace

veg.data.transf <- sqrt (veg.data)

Logaritmická transformace

veg.data.transf <- log1p (veg.data)

je funkce, která vypočte přirozený logaritmu z algoritmu po přičtení jedničky (kvůli nule). Stejný výsledek dostaneme takto:

veg.data.transf <- log (veg.data + 1)

Standardizace

Standardizace, na rozdíl od transformace, znamená že měníme jednotlivé hodnoty matice relativně vůči jiným hodnotám; pokud například standardizuji matici po sloupcích, pak pro každý sloupec vypočtu hodnotu nějaké statistiky (např. součet) a tou podělím hodnoty jednotlivých buněk sloupce.

Celá řada standardizačních metod je obsažena ve funkci decostand, která je součástí knihovny vegan.

Standardizace na jednotný rozsah (ranging)

Upraví hodnoty v jednotlivých sloupcích na rozsah 0 až 1:

veg.data.stand <- decostand (veg.data, method = 'range')

O tom, jak výsledek vypadá, se můžeme přesvědčit třeba funkcí:

apply (veg.data.stand, MARGIN = 2, FUN = range)

která by měla vrátit sérii nul a jedniček pro jednotlivé sloupce.

Standardizace sensu stricto

Za standardizaci v úzkém slova smyslu se považuje standardizace na průměr hodnot nula a jednotkovou varianci:

veg.data.stand <- decostand (veg.data, method = 'standardize')
cs/data_preparation.txt · Last modified: 2017/10/11 20:36 (external edit)