J'ai besoin de former un classificateur linéaire sur mon ordinateur portable avec des centaines de milliers de points de données et environ dix mille fonctionnalités. Quelles sont mes options? Quel est l'état de l'art pour ce type de problème?
Il semble que la descente de gradient stochastique soit une direction prometteuse, et mon sentiment est que c'est l'état de l'art:
"Pegasos: Primal Estimated sub-GrAdient SOlver for SVM" Shai Shalev-Shwartz, Yoram Singer, Nathan Srebro, Andrew Cotter. "Mathematical Programming, Series B, 127 (1): 3-30, year: 2007."
Est-ce le consensus? Dois-je regarder dans une autre direction?