J'ai un ensemble de données contenant des données sur la température, les précipitations et les rendements de soja pour une ferme pendant 10 ans (2005 - 2014). Je voudrais prédire les rendements pour 2015 sur la base de ces données.
Veuillez noter que l'ensemble de données a des valeurs QUOTIDIENNES pour la température et les précipitations, mais seulement 1 valeur par an pour le rendement, car la récolte de la récolte a lieu à la fin de la saison de croissance de la culture.
Je veux construire une régression ou un autre modèle basé sur l'apprentissage automatique pour prédire les rendements de 2015, basé sur une régression / un autre modèle dérivé en étudiant la relation entre les rendements et la température et les précipitations des années précédentes.
Je connais bien le machine learning avec scikit-learn. Cependant, je ne sais pas comment représenter ce problème. La partie délicate ici est que la température et les précipitations sont quotidiennes mais que le rendement n'est que de 1 valeur par an.
Comment puis-je aborder cela?