Je me demande s’il existe des packages pour Python capables d’effectuer une analyse de survie. J'utilisais le paquet de survie dans R mais j'aimerais porter mon travail en python.
survival
paquet de R est examiné de près par une grande communauté.
Je me demande s’il existe des packages pour Python capables d’effectuer une analyse de survie. J'utilisais le paquet de survie dans R mais j'aimerais porter mon travail en python.
survival
paquet de R est examiné de près par une grande communauté.
Réponses:
Autant que je sache, il n’existe aucun logiciel d’analyse de survie en python. Comme le commente mbq ci-dessus, le seul itinéraire disponible serait celui de Rpy .
Même si un paquet pur en python était disponible, je le ferais avec une grande prudence, en particulier:
L'un des avantages de R est que ces packages standard font l'objet de nombreux tests et commentaires de la part des utilisateurs. Lorsqu’il s’agit de données réelles, des cas inattendus peuvent se glisser.
Découvrez le projet Llines ¹ pour une implémentation simple et propre des modèles de survie en Python, y compris
Avantages:
La documentation est disponible ici: documentation et exemples
Exemple d'utilisation:
from lifelines import KaplanMeierFitter
survival_times = np.array([0., 3., 4.5, 10., 1.])
events = np.array([False, True, True, False, True])
kmf = KaplanMeierFitter()
kmf.fit(survival_times, event_observed=events)
print(kmf.survival_function_)
print(kmf.median_)
kmf.plot()
Exemples de graphiques de la bibliothèque de graphiques intégrée:
python-asurv est un effort pour porter le logiciel asurv pour les méthodes de survie en astronomie. Cgillespie a raison sur tous les points à surveiller: le chemin à parcourir est long et le développement ne semble pas être actif. (AFAICT n’existe qu’une seule méthode, elle est même terminée, l’ensemble peut manquer pour les biostatisticiens.)
Vous feriez probablement mieux d'utiliser le package de survie en R de Python via quelque chose comme RPy ou PypeR . Je n'ai eu aucun problème à le faire moi-même.
PyIMSL contient une poignée de routines pour les analyses de survie. C'est gratuit comme dans la bière pour une utilisation non commerciale, entièrement pris en charge autrement. De la documentation dans le Guide de l'utilisateur de la statistique ...
Calcule des estimations de Kaplan-Meier des probabilités de survie: kaplanMeierEstimates ()
Analyse les données de survie et de fiabilité à l'aide du modèle des risques proportionnels de Cox: propHazardsGenLin ()
Analyse les données de survie à l'aide du modèle linéaire généralisé: survivalGlm ()
Estimations à l'aide de divers modes paramétriques: survivalEstimates ()
Estime une fonction de risque de fiabilité utilisant une approche non paramétrique: nonparamHazardRate ()
Produit des tables de mortalité des populations et des cohortes: lifeTables ()
Vous pouvez maintenant utiliser R depuis IPython . Vous voudrez peut-être utiliser IPython avec l'extension R.
rpy2
). Moi aussi j'aimerais voir un exemple rapide. (D'après ce que j'ai compris, les modèles de survie ne sont pas encore totalement disponibles dans les modèles de statistiques .)
Je souhaite également mentionner scikit-survival , qui fournit des modèles d'analyse de survie pouvant être facilement combinés avec des outils de scikit-learn (par exemple, la validation croisée KFold).
À la date de rédaction de ce document, scikit-survival inclut des implémentations de
Outre l'utilisation de R
through RPy
ou l'équivalent, il existe un certain nombre de routines d'analyse de survie dans la bibliothèque statsmodels (anciennement sicpy.statsmodel
) python. Ils sont cependant dans le paquet "sandbox", ce qui signifie qu'ils ne sont pas censés être prêts pour la production pour le moment.
Par exemple, vous avez le modèle de Cox du risque proportionnel codé ici .