User Tools

Site Tools


zpradat:advanced:solution_6.1

Řešení cvičení 6.1

Import dat: výsledkem je, že v CANOCO budete mít tři matice, dvě typu compositional (molluscs1) a vascular) a jednu typu general (matice env). Všechny matice musí obsahovat 43 řádků (ploch).

Analýza 1: sestává ze dvou kroků, a není na ni možné použít přednastavenou šablonu. Při vytvoření této analýzy postupujte takto:

  1. Analysis > Add new analysis > Customized (analýzu nějak pojmenujte, nebo nechte Analysis 1)
  2. do Analysis purpose můžete napsat krátký popis, co analýza dělá (ale nemusíte)
  3. klikněte na Step 1 a potom na tlačítko Add step - tím přidáte do analýzy druhý krok
  4. pokračujte klikání v Analysis setup wizard, který sestává z dvou kroků (prvních několik oken je Step 1, pak následuje Step 2)
    1. Step 1 - Response data - vyberte matici s cévnatými rostlinami (vascular),
    2. Step 1 - Ordination method - zde vyberte PCA, Response data (species) transformation None a Center and standardize by samples Hellinger standardization.
    3. Step 2 - Response data - vyberte matici s plži (moluscs), Explanatory data - sem je třeba vložit skóre na ordinačních osách z předchozí analýzy, a to takto: klikněte na tlačítko Advanced role v sekci Explanatory data, v novém okně na tlačítko New, v okně Use score results from: vyberte Current analysis a Step 1, vpravo v boxu Select score type: vyberte Case scores a pod ním Use these scores from vyberte all axes. Klikněte na OK, a v políčku pro Explanatory variables se objeví Case scores from step 1, což je přesně to, co potřebujeme.
    4. Step 2 - Ordination method - vyberte RDA, Response data (species) transformation Log a Center and standardize by samples None (na plžích není třeba dělat Hellingerovu standardizaci, je ale potřeba je log ztransformovat, protože jde o počty).
    5. Step 2 - Test or Explore Predictor Effect - vyberte možnost Forward selection, v možnosti Permutation Test Parameters vyberte Unrestricted permutations.
    6. Analýzu spusťte, a vyberte vysvětlující proměnné (ordinační osy z PCA na cévnatých rostlinách). V mém řešení se vybraly dvě (CaseR.1 a CaseR.2), je ale možné, že vám druhá osa už nevyjde signifikantní (s Bonferroniho korekcí).
    7. Analysis 'Analysis 1', step 'Step 2'
      Forward Selection Results:
      Name	Explains %	Contribution %	pseudo-F	P	P(adj)
      CaseR.1	25.4		56.4		14.0		0.002	0.016
      CaseR.2	4.5		10.0		2.6		0.006	0.048
    8. Aby bylo možné s těmito proměnnými pracovat i v Analýze 3 (rozkladu variance, viz dole), je třeba tyto proměnné nakopírovat (ručně) do tabulky env, a to takto:
      1. v záložce Cases (1)2) označte sloupce s osami, které byly vybrány postupným výběrem v analýze Step 2 (v mém případě CaseR.1 a CaseR.2), a nakopírujte je na clipboard (CTRL+C)
      2. v Data tables vyberte tabulku env, posuňte se na poslední sloupeček, pravým tlačítkem myši klikněte na záhlaví prvního prázdného sloupce ([C15]) a vyberte Append ... from Clipboard - vloží se vám sloupečky se skóre na vegetačních ordinačních osách.

Analýza 2 - Analysis > Add new analysis > Canoco adviser, vyberte matice molluscs a env, analýzu Interactive forward selection ....

  1. Jako Response data vyberte molluscs a jako Explanatory data vyberte matici env a v ní všechny proměnné kromě skóre na vegetačních osách z předchozí analýzy (chceme dělat výběr jen mezi měřenými proměnnými prostředí).
  2. Vyberte RDA na log transformovaných datech a bez Hellingerovy standardizace (stejně jako v předchozí analýze při použití šnečích dat).
  3. Proveďte postupný výběr proměnných (s Bonferroniho korekcí).
  4. V mém případě vyšel jako nejdůležitější vápník (proměnná Ca) a marginálně signifikantní i konduktivita (cond) - kterou jsem nakonec zahrnul do modelu, i když její P(adj) byl mírně vyšší než 0.05.
  5. Analysis 'Interactive-forward-selection', step 'Forward Selection'
    Forward Selection Results:
    Name	Explains %	Contribution %	pseudo-F	P	P(adj)
    Ca	20.2		41.5		10.4		0.002	0.028
    conduct	5.3		10.9		2.8		0.004	0.056

Analýza 3 - vlastní rozklad variance: Analysis > Add new analysis > Canoco adviser, vyberte matice molluscs a env a analýzu v sekci Variation Partitioning Analyses, konkrétně s testováním parciálních (conditional efektů (Var-part-2groups-Conditional-effects-tested...).

  1. Response data bude tabulka molluscs, Explanatory data tabulka env (která nyní obsahuje jak vlastní měřené proměnné, tak i ordinační skóre z vegetačních dat)
  2. v dalším kroku nadefinujete, které proměnné patří do které ze dvou skupin pro následný rozklad variance: First group bude CaseR1 a CaseR2 (tedy vliv vegetace), Second group bude Ca a cond (vliv prostředí, proměnné které vyšli jako důležité při postupném výběru).
  3. Ordination method - RDA, log transformace druhových dat, žádná standardizace po vzorcích, ostatní default.
  4. Proveďte vlastní analýzu a podívejte se na výsledky:
  5. Variation Partitioning Results for Two Groups in Analysis 'Var-part-2groups-Conditional-effects-tested'
    Explained variation
    
    Fraction	Variation(adj)	% of Explained	% of All	DF	Mean Square
    a		0.062197	22.2		6.2		2	0.04677
    b		0.015341	5.5		1.5		2	0.02446
    c		0.20208		72.3		20.2		--	--
    Total Explained	0.27962		100.0		28.0		4	0.08706
    All Variation	1	--	100.0		42		--
  6. Variation Partitioning Results for Two Groups in Analysis 'Var-part-2groups-Conditional-effects-tested'
    Significance tests
    
    Tested Fraction	F	P
    a+b+c		5.1	0.002
    a		2.7	0.002
    b		1.4	0.072

Obě skupiny proměnných vysvětlí celkem 28% variability (adjustovaný R2), z toho čistý efekt vegetace je 6.2% (a ten je průkazný na p < 0.01), zatímco čistý efekt proměnných prostředí je jen 1.5% (a není průkazný, p = 0.072). Sdílená složka je největší - 20.2%, protože obě sady proměnných jsou výrazně korelované (prostředí ovlivňuje vegetaci).

Interpretace by byla asi následující: vegetace je lepší prediktor druhového složení než měřené proměnné prostředí, a obsahuje i informaci, kterou proměnné prostředí neobsahují. Pokud bych měl jistotu, že v proměnných prostředí jsou všechny faktory, které mohou být relevantní pro složení plžích společenstev, pak by se dalo říci, že variabilita kterou vegetace vysvětlí navíc odráží biotické interakce mezi plži a rostlinami. Protože ale s jistotou nevím, jestli jsou měřeny všechny proměnné prostředí, je pravděpodobné, že variabilita kterou vegetace vysvětlí navíc je způsobena některým z faktorů prostředí který nebyl změřen (proto není ve frakci [b] nebo [c]) a kytky na něj reagují stejně jako plži. Celý model a parciální efekt vlivu vegetace jsou průkazné, parciální vliv proměnných prostředí už průkazný není.

1)
Pro matice můžete použít i jiné názvy, tyto budu používat v tomto textu.
2)
Pokud tuto záložku nevidíte, pak musíte vypnout zobrazování zkrácené verze výsledků, a to v menu Edit > Settings > Canoco5 options..., a v sekci General boxu Presentation options nesmí být zaškrtnutá volba Show brief version of notebooks with analysis results. Když analýzu provedete znovu, objeví se vám i další záložky se skóre na osách a dalšími informacemi.
zpradat/advanced/solution_6.1.txt · Last modified: 2015/04/09 13:00 (external edit)