La déviance est un concept GLM, les modèles ZIP et ZINB ne sont pas des glms mais sont formulés comme des mélanges finis de distributions qui sont des GLM et peuvent donc être résolus facilement via l'algorithme EM.
Ces notes décrivent la théorie de la déviance de manière concise. Si vous lisez ces notes, vous verrez la preuve que le modèle saturé pour la régression de Poisson a une probabilité logarithmique
ℓ ( λs) = ∑i = 1 , ∀ yje≠ 0n[ yjel o g( yje) - yje- l o g( yje! ) ]
qui résulte de l'estimation plug-in .yje= λ^je
Je vais maintenant procéder avec la probabilité ZIP car les calculs sont plus simples, des résultats similaires sont valables pour le ZINB. Malheureusement pour le ZIP, il n'y a pas de relation simple comme dans le Poisson. La ème observation log-vraisemblance estje
ℓje( ϕ , λ ) = Zjel o g( ϕ + ( 1 - ϕ ) e- λ) + ( 1 - Zje) [ - λ + yjel o g( λ ) - l o g( yje! ) ] .
les ne sont pas observés, donc pour résoudre ce problème, vous devrez prendre des dérivées partielles par rapport à la fois à λ et à ϕ , régler les équations à 0, puis résoudre pour λ et ϕ . La difficulté ici sont les y i = 0 valeurs, celles - ci peuvent aller dans un λ ou en φ et il est impossible sans observer Z i qui pour mettre l' y i = 0 observations dans. Cependant, si nous connaissions le Z iZjeλϕλϕyje= 0λ^ϕ^Zjeyje= 0Zjevaleur, nous n'aurions pas besoin d'un modèle ZIP car nous n'aurions aucune donnée manquante. Les données observées correspondent à la vraisemblance des «données complètes» dans le formalisme EM.
Une approche qui pourrait être raisonnable consiste à travailler avec l'espérance par rapport à de la vraisemblance complète du journal de données, E ( ℓ i ( ϕ , λ ) ) qui supprime le Z i et le remplace par une attente, cela fait partie de ce que le L'algorithme EM calcule (l'étape E) avec les mises à jour les plus récentes. Je ne connais aucune littérature ayant étudié cette approche de la déviance e x p e c t e d .ZjeE ( ℓje( ϕ , λ ) )Zjee x p e c t e d
En outre, cette question a été posée en premier, j'ai donc répondu à ce message. Cependant, il y a une autre question sur le même sujet avec un bon commentaire de Gordon Smyth ici:
déviance pour le modèle composé de poisson zéro gonflé, données continues (R)
où il a mentionné la même réponse (ceci est une élaboration de ce commentaire que je dire) et ils ont mentionné dans les commentaires à l'autre poste un article que vous voudrez peut-être lire. (avertissement, je n'ai pas lu le document référencé)