Dans ce cas particulier, je fais référence au jour où un lac gèle. Cette date "glacée" n'a lieu qu'une fois par an, mais parfois elle ne se produit pas du tout (si l'hiver est chaud). Ainsi, sur une année, le lac peut geler le jour 20 (20 janvier) et une autre année, il peut ne pas geler du tout.
Le but est de déterminer les conducteurs de la date de départ sur glace.
Les prédicteurs seraient des choses comme la température de l'air automne / hiver chaque année. L'année pourrait être un prédicteur de la tendance linéaire à long terme.
1) Le nombre entier "jour de l'année" est-il une variable de réponse raisonnable (sinon, qu'est-ce que c'est?)?
2) Comment gérer les années où le lac n'a jamais gelé?
Éditer:
Je ne sais pas quelle est l'étiquette ici, mais j'ai pensé publier le résultat des suggestions que j'ai reçues. Voici le papier, en accès libre . J'ai eu de bons retours sur l'approche utilisée, merci @pedrofigueira et @cboettig. Bien sûr, les erreurs sont les miennes.