Comprendre les relations entre des variables toutes quantitatives.
Example
Quels sont lens entre les différentes variables morphométriques ?
X_pca <- penguins %>%select(where(is.numeric))
head(X_pca)
# A tibble: 6 × 4
bill_length_mm bill_depth_mm flipper_length_mm body_mass_g
<dbl> <dbl> <int> <int>
1 39.1 18.7 181 3750
2 39.5 17.4 186 3800
3 40.3 18 195 3250
4 36.7 19.3 193 3450
5 39.3 20.6 190 3650
6 38.9 17.8 181 3625
\[\Xbf \in \R^{n\times d}; \quad \Xbf = \begin{pmatrix}
x_{1,1} & \ldots & x_{1,p} \\
\vdots & &\vdots \\
x_{n,1} & \ldots & x_{n,p} \\
\end{pmatrix}.
\]
Comprendre les combinaisons de variables quantitatives qui expliquent les groupes, ou comment visualiser au mieux les différences entre les groupes.
Example Comment visualiser au mieux les différences morpohologiques entre les espèces ?
X_afd <- penguins %>% select(-island, -sex, -year)
head(X_afd)
# A tibble: 6 × 5
species bill_length_mm bill_depth_mm flipper_length_mm body_mass_g
<fct> <dbl> <dbl> <int> <int>
1 Adelie 39.1 18.7 181 3750
2 Adelie 39.5 17.4 186 3800
3 Adelie 40.3 18 195 3250
4 Adelie 36.7 19.3 193 3450
5 Adelie 39.3 20.6 190 3650
6 Adelie 38.9 17.8 181 3625
\[ \Xbf = \begin{pmatrix}
\class{rouge}{y_1} & x_{1,1} & \ldots & x_{1,p} \\
\vdots & &\vdots \\
\class{rouge}{y_n} & x_{n,1} & \ldots & x_{n,p} \\
\end{pmatrix}, \quad x_{ij}\in\R,\ g_i \in \mathcal{G} =\left \lbrace g_1, \ldots, g_G\right \rbrace.
\]
On souhaite étudier les liens entre deux variables qualitatives.
Example
Comment la répartition entre espèce diffère entre les îles.
X_acm <- penguins %>%select(species, island)
head(X_acm)
# A tibble: 6 × 2
species island
<fct> <fct>
1 Adelie Torgersen
2 Adelie Torgersen
3 Adelie Torgersen
4 Adelie Torgersen
5 Adelie Torgersen
6 Adelie Torgersen
\[\Xbf = \begin{pmatrix}
\class{bleu}{a_1} & \class{orange}{b_1} \\
\class{bleu}{\vdots} &\class{orange}{\vdots} \\
\class{bleu}{a_n} & \class{orange}{b_n} \\
\end{pmatrix}, \quad a_{i}\in \mathcal{A}, \ \#\mathcal{A}= p,\quad b_{i}\in \mathcal{B}, \ \#\mathcal{B}= q.
\]