Interprétation de la vraisemblance du journal


9

J'ai du mal à interpréter certains résultats. Je fais une régression liée hiérarchique avec ecoreg. Si j'entre le code, je reçois une sortie avec des rapports de cotes, des rapports de confiance et une probabilité logarithmique maximisée 2x.

Cependant, je ne comprends pas entièrement comment interpréter la probabilité de log maximisée 2x. Pour autant que je sache, la log log vraisemblance est utilisée comme un moyen pratique de calculer une vraisemblance et elle calcule la valeur des paramètres en fonction des résultats. Mais je ne comprends pas si une valeur supérieure ou inférieure est meilleure. J'ai regardé plusieurs sources en ligne, par exemple /programming/2343093/what-is-log-likelihood , mais je suis toujours bloqué.

Ci-dessous le résultat que je reçois:

Call:
eco(formula = cbind(y, N) ~ deprivation + meanIncome, binary = ~fracSmoke + 
    soclass, data = dfAggPlus, cross = cross)

Aggregate-level odds ratios: 
                   OR        l95        u95
(Intercept) 0.0510475 0.03837276 0.06790878
deprivation 0.9859936 0.88421991 1.09948134
meanIncome  1.0689951 0.95574925 1.19565924

Individual-level odds ratios:
                OR       l95      u95
fracSmoke 3.124053 2.0761956 4.700765
soclass   1.001050 0.9930815 1.009083

-2 x log-likelihood:  237.4882 

Alors, comment dois-je interpréter une valeur de 237,4882 par rapport à un résultat de 206 ou 1083? L'aide est très appréciée!


Qu'est-ce qui n'est pas clair pour vous?
Tim

Eh bien, je veux comprendre si une probabilité logarithmique plus élevée signifie que le résultat est plus fiable ou par exemple moins fiable. De plus, je veux savoir comment je dois interpréter les différences entre plusieurs résultats (par exemple 206 237 ou 1083)
Keizer

Reproduction possible de l' estimation
Tim

J'ai marqué votre question comme un doublon d'une autre question, plus générale, qui demande quelle est l'estimation du maximum de vraisemblance - vérifiez-la.
Tim

Il semble qu'il soit utilisé comme déviance. Voir < en.wikipedia.org/wiki/Deviance_information_criterion >
pglpm

Réponses:


0

Pour obtenir au moins une certaine signification de la probabilité L, vous pouvez vous rappeler que pour le nombre d'échantillons fixes N, la log-vraisemblance maximale pour un certain modèle de distribution dépend principalement de l'échelle. Pour une variance donnée, la distribution normale a la valeur la plus élevée. Pour avoir un aperçu, je diviserais logL par N, puis je ferais peut-être aussi une correction d'échelle. Si vos données s'adaptent mieux à une distribution uniforme, il serait préférable d'utiliser la probabilité uniforme comme fonction d'entropie maximale pour une plage donnée comme une sorte de référence. Une autre valeur de référence générale pourrait être pour un cas continu d'utiliser un ajustement KDE et de calculer le L pour cela. Cependant, quoi que vous fassiez L est plus difficile à interpréter que par exemple la valeur KS ou l'erreur rms.
Si vous prenez un autre modèle et obtenez un L plus élevé, cela ne signifie pas que le modèle est meilleur, car vous êtes peut-être dans une situation de sur-ajustement. Pour l'inclure, utilisez la valeur AIC. Ici, c'est mieux, et encore une fois, vous pouvez utiliser une distribution normale comme "référence".

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.