Quelqu'un peut-il aider à donner une explication conceptuelle de la façon dont les prédictions sont faites pour les nouvelles données lors de l'utilisation de lissages / splines pour un modèle prédictif? Par exemple, étant donné un modèle créé à l'aide gamboost
du mboost
package dans R, avec des p-splines, comment sont faites les prédictions pour les nouvelles données? Qu'est-ce qui est utilisé à partir des données d'entraînement?
Supposons qu'il existe une nouvelle valeur de la variable indépendante x et que nous voulons prédire y. Une formule de création de spline est-elle appliquée à cette nouvelle valeur de données en utilisant les nœuds ou df utilisés lors de l'apprentissage du modèle, puis les coefficients du modèle entraîné sont appliqués pour générer la prédiction?
Voici un exemple avec R, que prévoit faire conceptuellement la sortie 899.4139 pour les nouvelles données mean_radius = 15.99?
#take the data wpbc as example
library(mboost)
data(wpbc)
modNew<-gamboost(mean_area~mean_radius, data = wpbc, baselearner = "bbs", dfbase = 4, family=Gaussian(),control = boost_control(mstop = 5))
test<-data.frame(mean_radius=15.99)
predict(modNew,test)