Je suis novice en modélisation avec les réseaux de neurones, mais j’ai réussi à établir un réseau de neurones avec tous les points de données disponibles qui correspond bien aux données observées. Le réseau de neurones a été réalisé en R avec le paquet nnet:
require(nnet)
##33.8 is the highest value
mynnet.fit <- nnet(DOC/33.80 ~ ., data = MyData, size = 6, decay = 0.1, maxit = 1000)
mynnet.predict <- predict(mynnet.fit)*33.80
mean((mynnet.predict - MyData$DOC)^2) ## mean squared error was 16.5
Les données que je suis en train d’analyser ressemblent à ceci, où DOC est la variable à modéliser (il ya environ 17 000 observations):
Q GW_level Temp t_sum DOC
1 0.045 0.070 12.50 0.2 11.17
2 0.046 0.070 12.61 0.4 11.09
3 0.046 0.068 12.66 2.8 11.16
4 0.047 0.050 12.66 0.4 11.28
5 0.049 0.050 12.55 0.6 11.45
6 0.050 0.048 12.45 0.4 11.48
Maintenant, j'ai lu que le modèle devrait être formé avec 70% des points de données et validé avec les 30% restants. Comment puis-je faire cela? Quelles fonctions dois-je utiliser?
J'ai utilisé la fonction de train du paquet caret pour calculer les paramètres de taille et de décroissance.
require(caret)
my.grid <- expand.grid(.decay = c(0.5, 0.1), .size = c(5, 6, 7))
mynnetfit <- train(DOC/33.80 ~ ., data = MyData, method = "nnet", maxit = 100, tuneGrid = my.grid, trace = f)
Toute aide directe ou lien vers d’autres sites Web / publications est grandement apprécié.