J'essaie de résoudre un ensemble d'équations qui a 40 variables indépendantes (x1, ..., x40) et une variable dépendante (y). Le nombre total d'équations (nombre de lignes) est ~ 300, et je veux résoudre pour l'ensemble des 40 coefficients qui minimise l'erreur totale de somme des carrés entre y et la valeur prédite.
Mon problème est que la matrice est très clairsemée et je ne connais pas la meilleure façon de résoudre le système d'équations avec des données clairsemées. Un exemple de l'ensemble de données est illustré ci-dessous:
y x1 x2 x3 x4 x5 x6 ... x40
87169 14 0 1 0 0 2 ... 0
46449 0 0 4 0 1 4 ... 12
846449 0 0 0 0 0 3 ... 0
....
J'utilise actuellement un algorithme génétique pour résoudre ce problème et les résultats sortent avec environ un facteur de différence de deux entre observé et attendu.
Quelqu'un peut-il suggérer différentes méthodes ou techniques capables de résoudre un ensemble d'équations avec des données rares.