Contexte: Mon organisation compare actuellement ses statistiques sur la diversité de la main-d'œuvre (ex.% De personnes handicapées,% de femmes,% d'anciens combattants) à la disponibilité totale de main-d'œuvre pour ces groupes sur la base de l'American Community Survey (un projet d'arpentage du US Census Bureau). Il s'agit d'une référence inexacte, car nous avons un ensemble très spécifique d'emplois dont la démographie est différente de celle de la population active dans son ensemble. Disons, par exemple, que mon organisation est principalement composée d'ingénieurs. L'ingénierie est seulement environ 20% de femmes dans mon état. Si nous nous comparons à la référence de la population active totale, qui ressemble plus à 50% de femmes, cela donne lieu à la panique que «nous n'avons que 20% de femmes, c'est un désastre!» alors qu'en réalité, 20% est ce à quoi nous devrions nous attendre, car c'est à cela que ressemble le paysage du travail.
Mon objectif: ce que je voudrais faire, c'est prendre les données sur les professions de l'American Community Survey (par catégorie de diversité) et les pondérer en fonction de la composition des emplois dans mon entreprise. Voici un exemple d'ensemble de données pour les travailleurs des services sociaux et communautaires . Je veux ajouter ces codes de travail énumérés ensemble (parce que notre tableau de concordance concerne des groupes de travail, pas des codes de travail spécifiques), alors je veux pondérer ce repère en fonction du nombre de personnes que nous avons dans cette catégorie (par exemple, nos 3000 réseaux sociaux et Travailleurs des services communautaires), alors je veux faire la même chose pour tous les autres groupes d'emplois, additionner ces chiffres et diviser par notre nombre total de travailleurs. Cela me donnerait une nouvelle mesure de diversité repondérée (ex. De 6% de personnes handicapées à 2% de personnes handicapées).
Mes questions: Comment puis-je adapter les marges d'erreur à cette référence finale cumulée? Je n'ai pas l'ensemble de données brutes du recensement (évidemment), mais vous pouvez afficher les marges d'erreur pour chaque numéro dans le lien que j'ai fourni en basculant le champ "Estimation" sur "Marge d'erreur" en haut du tableau. Mes autres collègues qui travaillent avec ces données ont bien l'intention d'ignorer les marges d'erreur, mais je crains que nous ne nous créons une référence statistiquement dénuée de sens. Ces données sont-elles encore utilisables après la manipulation décrite ci-dessus?