Ai-je besoin d'une classification ou d'une régression pour prédire la disponibilité d'un utilisateur compte tenu de certaines fonctionnalités?


9

En étudiant les méthodes d'exploration de données, j'ai compris qu'il existe deux catégories principales:

  • Méthodes prédictives:

    • Classification
    • Régression
  • Méthodes descriptives:

    • Regroupement
    • Règles d'association

Comme je veux prédire la disponibilité de l'utilisateur (sortie) en fonction de l'emplacement, de l'activité, du niveau de la batterie (entrée pour le modèle de formation), je pense qu'il est évident que je choisirais des "méthodes prédictives", mais maintenant je n'arrive pas à choisir entre classification et régression. D'après ce que je comprends jusqu'à présent, la classification peut résoudre mon problème, car la sortie est "disponible" ou "non disponible".

La classification peut-elle me fournir la probabilité (ou la probabilité) que l'utilisateur soit disponible ou non?

Comme dans la sortie, ce ne serait pas seulement 0 (non disponible) ou 1 (pour disponible), mais ce serait quelque chose comme:

  • 80% disponible
  • 20% non disponible

Ce problème peut-il également être résolu en utilisant la régression?

8080%20%

Réponses:


6
  1. Oui. Par exemple, la régression softmax populaire vous donne une distribution de probabilité pour chaque classe.
  2. Oui. Softmax est une régression sur un ensemble de classes discrètes.

Nous pouvons utiliser la régression pour la classification, la stratégie la plus courante consiste à saisir la classe la plus probable pour la prédiction.


1

Oui, vous pouvez utiliser la classification ou la régression en fonction de vos besoins de sortie,

Si vous voulez une sortie étiquetée, comme disponible ou non disponible, alors la classification doit être utilisée.

Si vous souhaitez que la sortie soit sous forme de% de disponibilité, la régression doit être utilisée.


Pouvez-vous sauvegarder cela avec des sources quelque part?
Mithical

-1

Vous pouvez utiliser la classification bayésienne naïve et calculer les probabilités postérieures à l'aide de croyances antérieures ou la régression logistique peut être utilisée avec la fonction sigmoïde.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.