On souhaite étudier le poids des bébés à la naissance en fonction du sexe du bébé et du nombre de semaines de grossesse. On dispose pour cela d’un échantillon constitué de 477 nouveaux nés (242 filles et 255 garçons) et du nombre de semaines d’aménorrhée (plus exactement du nombre de semaines par rapport au terme normal qui est de 40 semaines en France: −3 signifie donc 37 semaines d’aménorrhée, et 1, 41 semaines d’aménorrhée).
Nous cherchons à déterminer si le poids à la naissance est différent chez les garçons et les filles.
Les données sont disponibles dans le fichier bebe.csv
.
Importer les données. Pour chaque bébé , on note son sexe, le nombre de semaines d’aménorrhée Nbsem
, et le poids du bébé à la naissance PoidsBB
Proposer une visualisation permettant de visualiser l’effet du nombre de semaines de grossesse sur le poids du bébé à la naissance. Cet effet peut être différent pour les garçons et les filles.
Qu’est ce que le code ci-dessous permet de visualiser ?
%>% ggplot() +
bebe_dta geom_point(aes(x=Nbsem, y = PoidsBB, col = Sexe)) +
geom_smooth(method = 'lm', aes(x=Nbsem, y = PoidsBB, col = Sexe), se = FALSE)
Lors d’un test de dégustation sensorielle, on veut comparer plusieurs caractéristiques sensorielles de 10 chocolats noirs. Pour cela, un jury d’analyse sensoriel, constitué de 12 juges a évalué chacun des chocolats 2 fois, lors de 2 séances de dégustation. On va s’intéresser ici à la variable A.cacao qui correspond à l’arôme de cacao perçue par le juge (0 = par d’arôme cacoo, 10=très fort arôme de cacao). Les données sont diponibles dans le fichier.
On veut répondre aux questions suivantes : + y a-t-il des différences d’arôme de cacao d’un produit à l’autre ? + les juges perçoivent-ils les différences entre chocolats de la même façon au niveau de l’arôme de cacao ? + d’une séance à l’autre, la perception des chocolats est-elle la même ?
Importer les données et les représenter pour avoir quelques idées sur les questions précédentes.
Construire un modèle et faire la sélection avec le critère “bic”, le critère “aic” et en faisant une sélection “à la main” (i.e. en supprimant pas à pas d’abord les interactions non significatives, puis les effets non significatifs)
Commenter les résultats des effets et interactions (significatifs et non significatifs).
Commenter les coefficient.
Quels chocolats ont des arômes de cacao perçus équivalents ?
En préparation d’une future expérimentation en champs, on a comparé, dans deux types de sols, trois types de sondes destinées à prélever des échantillons de terre, en effectuant plusieurs prélèvements et en mesurant la teneur en anhydride phosphorique (\(P_20_5\)) en mg pour 100 g de terre sèche. On s’intéresse principalement aux différences qui pourraient exister d’un type de sonde à l’autre, et aux interférences éventuelles des types de sonde avec les types de sol. Les données sont disponibles dans le fichier sonde_sol.csv.
Importer les données et les représenter sous forme d’un boxplot dans lequel l’abscisse est le sol, ce boxplot étant rempli par une couleur qui représente la sonde.
Visualiser l’effet de l’interaction Sol - Sonde sur la variable réponse.
%>%
dta group_by(Sonde, Sol) %>%
summarize(P205_m = mean(P205)) %>%
ggplot() + aes(x=Sol, col = Sonde, y=P205_m) + geom_line(aes(group = Sonde)) + geom_point()
Construire un modèle permettant de répondre à la question “Le taux d’anhydride phosphaté est-il le même dans tous les types de sol, pour tous les sortes de sonde ?”
Les différences entre les sondes sont elles les mêmes quel que soit le type de sol ?
Y a-t-il des différences de résultats entre les sondes ?
Quelles sondes donnent des résultats équivalents ?
library(FactoMineR)
<- LinearModel(P205 ~ Sol*Sonde, data=dta)
mod compMeans(mod, ~sonde)