Je recherche des informations sur l'organisation d'un projet Python Machine Learning. Pour les projets habituels Python, il y a Cookiecutter et pour R ProjectTemplate .
Il s'agit de ma structure de dossiers actuelle, mais je mélange Jupyter Notebooks avec le code Python réel et cela ne semble pas très clair.
.
├── cache
├── data
├── my_module
├── logs
├── notebooks
├── scripts
├── snippets
└── tools
Je travaille dans le dossier des scripts et j'ajoute actuellement toutes les fonctions dans les fichiers sous my_module, mais cela entraîne des erreurs de chargement des données (chemins relatifs / absolus) et d'autres problèmes.
Je n'ai pas pu trouver de bonnes pratiques ou de bons exemples sur ce sujet en dehors de certaines solutions de compétition kaggle et de certains ordinateurs portables qui ont toutes les fonctions condensées au début d'un tel ordinateur portable.