Nous avons un référentiel Git avec plus de 400 commits, dont les deux premières douzaines étaient beaucoup d'essais et d'erreurs. Nous voulons nettoyer ces commits en en écrasant plusieurs en un seul commit. Naturellement, git-rebase semble la voie à suivre. Mon problème est que cela aboutit à des conflits de fusion, et ces conflits ne sont pas faciles à résoudre. Je ne comprends pas du tout pourquoi il devrait y avoir des conflits, car je suis juste en train d'écraser les commits (pas de suppression ni de réorganisation). Très probablement, cela démontre que je ne comprends pas complètement comment git-rebase fait ses squashes.
Voici une version modifiée des scripts que j'utilise:
repo_squash.sh (c'est le script qui est réellement exécuté):
rm -rf repo_squash
git clone repo repo_squash
cd repo_squash/
GIT_EDITOR=../repo_squash_helper.sh git rebase --strategy theirs -i bd6a09a484b8230d0810e6689cf08a24f26f287a
repo_squash_helper.sh (ce script n'est utilisé que par repo_squash.sh):
if grep -q "pick " $1
then
# cp $1 ../repo_squash_history.txt
# emacs -nw $1
sed -f ../repo_squash_list.txt < $1 > $1.tmp
mv $1.tmp $1
else
if grep -q "initial import" $1
then
cp ../repo_squash_new_message1.txt $1
elif grep -q "fixing bad import" $1
then
cp ../repo_squash_new_message2.txt $1
else
emacs -nw $1
fi
fi
repo_squash_list.txt: (ce fichier est utilisé uniquement par repo_squash_helper.sh)
# Initial import
s/pick \(251a190\)/squash \1/g
# Leaving "Needed subdir" for now
# Fixing bad import
s/pick \(46c41d1\)/squash \1/g
s/pick \(5d7agf2\)/squash \1/g
s/pick \(3da63ed\)/squash \1/g
Je laisse le contenu du "nouveau message" à votre imagination. Au départ, je l'ai fait sans l'option "--strategy theirs" (c'est-à-dire en utilisant la stratégie par défaut, qui, si je comprends bien la documentation, est récursive, mais je ne suis pas sûr de la stratégie récursive utilisée), et cela n'a pas non plus été le cas. t travailler. De plus, je dois souligner qu'en utilisant le code commenté dans repo_squash_helper.sh, j'ai sauvegardé le fichier original sur lequel le script sed fonctionne et j'ai exécuté le script sed pour m'assurer qu'il faisait ce que je voulais qu'il fasse ( c'était). Encore une fois, je ne sais même pas pourquoi il y aurait un conflit, donc peu importe quelle stratégie est utilisée. Tout conseil ou aperçu serait utile, mais je veux surtout que cela fonctionne.
Mise à jour avec des informations supplémentaires issues de la discussion avec Jefromi:
Avant de travailler sur notre énorme dépôt "réel", j'ai utilisé des scripts similaires sur un dépôt de test. C'était un référentiel très simple et le test a fonctionné proprement.
Le message que je reçois en cas d'échec est:
Finished one cherry-pick.
# Not currently on any branch.
nothing to commit (working directory clean)
Could not apply 66c45e2... Needed subdir
C'est le premier choix après le premier commit de squash. L'exécution git status
donne un répertoire de travail propre. Si je fais ensuite un git rebase --continue
, j'obtiens un message très similaire après quelques commits supplémentaires. Si je le fais à nouveau, j'obtiens un autre message très similaire après quelques dizaines de commits. Si je le fais encore une fois, cette fois, il passe par une centaine de commits, et renvoie ce message:
Automatic cherry-pick failed. After resolving the conflicts,
mark the corrected paths with 'git add <paths>', and
run 'git rebase --continue'
Could not apply f1de3bc... Incremental
Si je cours ensuite git status
, j'obtiens:
# Not currently on any branch.
# Changes to be committed:
# (use "git reset HEAD <file>..." to unstage)
#
# modified: repo/file_A.cpp
# modified: repo/file_B.cpp
#
# Unmerged paths:
# (use "git reset HEAD <file>..." to unstage)
# (use "git add/rm <file>..." as appropriate to mark resolution)
#
# both modified: repo/file_X.cpp
#
# Changed but not updated:
# (use "git add/rm <file>..." to update what will be committed)
# (use "git checkout -- <file>..." to discard changes in working directory)
#
# deleted: repo/file_Z.imp
Le bit «les deux modifiés» me semble bizarre, car ce n'était que le résultat d'un choix. Il est également intéressant de noter que si je regarde le "conflit", il se résume à une seule ligne avec une version commençant par un caractère [tabulation], et l'autre avec quatre espaces. Cela sonnait comme si cela pouvait être un problème avec la façon dont j'ai configuré mon fichier de configuration, mais il n'y a rien de tel. (J'ai noté que core.ignorecase est défini sur true, mais évidemment git-clone l'a fait automatiquement. Je ne suis pas complètement surpris par cela étant donné que la source d'origine était sur une machine Windows.)
Si je corrige manuellement file_X.cpp, il échoue peu de temps après avec un autre conflit, cette fois entre un fichier (CMakeLists.txt) qu'une version pense devrait exister et une version ne devrait pas. Si je résout ce conflit en disant que je veux ce fichier (ce que je fais), quelques commits plus tard, j'obtiens un autre conflit (dans ce même fichier) où maintenant il y a des changements plutôt non triviaux. Ce n'est encore qu'environ 25% du chemin à travers les conflits.
Je dois également souligner, puisque cela peut être très important, que ce projet a commencé dans un référentiel svn. Cet historique initial a très probablement été importé de ce référentiel svn.
Mise à jour n ° 2:
Sur une alouette (influencée par les commentaires de Jefromi), j'ai décidé de changer mon repo_squash.sh pour qu'il soit:
rm -rf repo_squash
git clone repo repo_squash
cd repo_squash/
git rebase --strategy theirs -i bd6a09a484b8230d0810e6689cf08a24f26f287a
Et puis, je viens d'accepter les entrées originales, telles quelles. C'est-à-dire que le "rebase" n'aurait rien dû changer. Il s'est retrouvé avec les mêmes résultats décrits précédemment.
Mise à jour n ° 3:
Alternativement, si j'omets la stratégie et remplace la dernière commande par:
git rebase -i bd6a09a484b8230d0810e6689cf08a24f26f287a
Je n'obtiens plus les problèmes de rebase «rien à commettre», mais il me reste encore les autres conflits.
Mise à jour avec le référentiel de jouets qui recrée le problème:
test_squash.sh (c'est le fichier que vous exécutez réellement):
#========================================================
# Initialize directories
#========================================================
rm -rf test_squash/ test_squash_clone/
mkdir -p test_squash
mkdir -p test_squash_clone
#========================================================
#========================================================
# Create repository with history
#========================================================
cd test_squash/
git init
echo "README">README
git add README
git commit -m"Initial commit: can't easily access for rebasing"
echo "Line 1">test_file.txt
git add test_file.txt
git commit -m"Created single line file"
echo "Line 2">>test_file.txt
git add test_file.txt
git commit -m"Meant for it to be two lines"
git checkout -b dev
echo Meaningful code>new_file.txt
git add new_file.txt
git commit -m"Meaningful commit"
git checkout master
echo Conflicting meaningful code>new_file.txt
git add new_file.txt
git commit -m"Conflicting meaningful commit"
# This will conflict
git merge dev
# Fixes conflict
echo Merged meaningful code>new_file.txt
git add new_file.txt
git commit -m"Merged dev with master"
cd ..
#========================================================
# Save off a clone of the repository prior to squashing
#========================================================
git clone test_squash test_squash_clone
#========================================================
#========================================================
# Do the squash
#========================================================
cd test_squash
GIT_EDITOR=../test_squash_helper.sh git rebase -i HEAD@{7}
#========================================================
#========================================================
# Show the results
#========================================================
git log
git gc
git reflog
#========================================================
test_squash_helper.sh (utilisé par test_sqash.sh):
# If the file has the phrase "pick " in it, assume it's the log file
if grep -q "pick " $1
then
sed -e "s/pick \(.*\) \(Meant for it to be two lines\)/squash \1 \2/g" < $1 > $1.tmp
mv $1.tmp $1
# Else, assume it's the commit message file
else
# Use our pre-canned message
echo "Created two line file" > $1
fi
PS: Oui, je sais que certains d'entre vous grincent des dents quand vous me voyez utiliser emacs comme éditeur de secours.
PPS: Nous savons que nous devrons éliminer tous nos clones du référentiel existant après le rebase. (Dans le sens de "vous ne rebaserez pas un référentiel après sa publication".)
PPPS: Quelqu'un peut-il me dire comment ajouter une prime à cela? Je ne vois l'option nulle part sur cet écran, que je sois en mode d'édition ou en mode d'affichage.
rebase --interactive
- ce sont en quelque sorte une liste d'actions que git doit tenter. J'espérais que vous pourriez être en mesure de réduire cela à un seul squash qui causait des conflits, et éviter toute la complexité supplémentaire de vos scripts d'aide. L'autre information manquante est quand les conflits se produisent - quand git applique les correctifs pour former le squash, ou quand il essaie de passer au-delà du squash et d'appliquer le patch suivant? (Et êtes-vous sûr que rien de mal ne se passe avec votre kludge GIT_EDITOR? Un autre vote pour un cas de test simple.)
rebase -p
toute façon)