Quelle est la bonne mesure de l'efficacité des tests / testeurs?


11

Je suis sur le point de participer à une discussion avec la direction concernant la mesure de l'efficacité de nos tests en tant qu'organisation d'AQ. La principale raison derrière cela est que la moitié de notre équipe est sous-traitée et notre entreprise souhaite fournir des mesures de notre efficacité / efficience, afin que nous ayons des données de base sur lesquelles négocier les paramètres du contrat avec l'accord de service de nos sous-traitants. .

J'ai fouillé un peu et la plupart des opinions que j'ai trouvées à ce sujet tournent autour de l'efficacité des développeurs: lignes de code, story stories livrées, défauts introduits, etc.

Mais qu'en est-il des testeurs? Nos tests sont principalement basés sur des exigences et un mélange de tests manuels, semi-automatisés et automatisés (non pas parce que nous n'avons pas encore tout automatisé, mais parce que certaines choses ne sont pas automatisables dans notre système de test).


1
stevemcconnell.com/ieeesoftware/bp09.htm pourrait être utile d'une manière ou d'une autre.

Cela est étrange. Si vous devez tester gmail.com et que vous ne parvenez pas à trouver un seul défaut, pensez-vous que vous avez échoué? Si vous écrivez un million de cas de test pour quelque chose de très mesquin, pensez-vous que cela vous réussit? Recherchez les fuites de défauts, c'est-à-dire les défauts qui n'ont pas été identifiés lors du SIT et qui ont glissé à travers l'UAT. Il existe d'autres moyens pour que l'AQ ajoute de la valeur au SDLC global.

Réponses:


8

Le nombre de tests écrits est inutile, et un nombre élevé de bogues trouvés peut être une mesure d'un développement médiocre plutôt que d'une AQ efficace.

Les mesures d'automatisation (couverture de code, couverture de fonctionnalités ...) peuvent être bonnes, mais je pense qu'elles aident davantage au développement (en tant que développeur, vais-je savoir si je casse quelque chose accidentellement) que les clients (je veux le faire et ça ne marche pas).

Étant donné que la qualité est bonne si les clients ne rencontrent pas de problèmes, une bonne mesure de l'efficacité (et non de l'efficacité) d'une équipe et d'un processus d'assurance qualité est la mesure des bogues détectés par les clients qui n'ont pas été détectés par l'assurance qualité .

Le principal problème avec cette métrique est qu'il peut y avoir un délai considérable entre le travail effectué et le moment où vous commencez à avoir des nombres significatifs.


1
+1 en fin de compte, la satisfaction du client est la principale mesure de toute l'équipe
jk.


6

Il y a quelques mesures que nous avons utilisées lors de mon dernier travail pour évaluer l'AQ:

  • Nombre de bogues trouvés. Je déteste celui-ci. C'est comme "Nombre de lignes de code écrites" pour un développeur.
  • Nombre de cas de tests automatisés produits.
  • Pourcentage de l'application totale couverte par les tests fonctionnels.
  • Nombre de bogues trouvés dans la mise en scène par rapport à la production.

En fin de compte, le travail de votre équipe d'assurance qualité est de trouver les bogues avant qu'ils ne sortent dans la nature. Leurs mesures devraient être basées sur la réalisation effective de cet objectif. S'il y a une faible couverture des cas de test, une quantité minimale de tests automatisés et un taux élevé de bogues en production, alors ils ne font pas du bon travail. Cependant, s'ils ont de bons antécédents de recherche des bogues bien avant qu'ils ne frappent prod, leurs mesures devraient être assez élevées.


3
Juste une remarque: les trois premiers sont des mesures de gestion, ce qui signifie que le gestionnaire de l'entrepreneur devrait essayer d'optimiser cela à court terme (mensuel ou trimestriel). Cependant, seul le 4ème a des conséquences commerciales réelles et doit être utilisé comme seule base pour le renouvellement du contrat. (Un mauvais gestionnaire peut être en mesure de très bien marquer sur les trois premières mesures en gonflant les chiffres, mais laisse encore beaucoup de bugs s'infiltrer dans le public.) Malheureusement, le 4ème a un cycle de collecte de données de 2-3 ans.
rwong

les tests fonctionnels devraient être des tests de boîte noire , ou je me trompe?
BЈовић

"Nombre de bogues trouvés": Ce devrait être une mesure appliquée au développeur. De plus, si en tant que testeur je subis cet indicateur, je deviendrai bientôt ami avec un développeur désireux d'introduire des bugs dans le code que je teste.
mouviciel

3

Le contrôle qualité doit être mesuré par deux mesures principales: combien de bogues dépassent le contrôle qualité à trouver sur le terrain? Quelle est leur gravité?

Vous pourriez être en mesure de tester QA pour trouver des bogues graves plus proches de la version que de la version complète. Vous pourriez être en mesure de ding QA pour ne pas terminer les tests par leur date d'achèvement estimée (par fonctionnalité).

Bien qu'en fin de compte, je crains que vous ne dépensiez plus d'argent en essayant de mesurer l'efficacité de votre personnel contractuel que les économies réalisées en utilisant un personnel contractuel ...


0

L'entreprise dans laquelle je travaille utilise un certain nombre de mesures d'assurance qualité.

Celui qui me semble le plus pertinent est la couverture du code. Un outil comme EMMA fonctionne très bien car ils écrivent des tests automatisés approfondis en plus de leurs tests manuels.

Quoi que vous fassiez, ne vous concentrez pas sur le nombre de tests. C'est à peu près aussi utile que LOC par jour.


-1

De nombreuses façons de mesurer les performances dans les phases de développement et de test pendant l'exécution du projet. Nous avons utilisé les mesures ci-dessous dans nos projets. Performances de développement mesurées par 4 métriques de code populaires (indice de maintenabilité, complexité cyclométrique, profondeur d'héritage, couplages de classes). Pour C # l'obtiendra dans Microsoft Visual Studio. Pour la couverture des tests, Ncover / Ndepend est très utile. Test des performances mesuré par le nombre de bogues de développement -roulant au cours des 4 derniers sprints Système testant les bogues survolant les 4 derniers sprints. Aucun test d'automatisation réussi dans la version / les fonctionnalités fournies.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.