Entwicklung/Git: Unterschied zwischen den Versionen
(aus dem Teamwiki kopiert; Originalautor: selbst) |
(kein Unterschied)
|
Version vom 4. April 2013, 00:19 Uhr
Versionsverwaltung der Entwicklungsdaten mit Git
Das Opencaching.de-Projekt verwendet Git zur Verwaltung von Quellcode, Dokumentationen etc. Git ist leistungsfähiger und komplexer als klassische Versionsverwaltungstools wie CVS und Subversion. Es kann wesentlich besser mit Branches umgehen, also verschiedenen Codeversionen eines Projekts -- "branches (in Git) are cheap and easy". So kann man zu Testzwecken, zum Programmieren einzelner Features etc. eigene Zweige anlegen, die dann später wieder in den Haupt-Code (den Master-Branch) einfließen oder wahlweise verworfen werden. Dieses Verzweigen und Wieder-Zusammenführen von Codeversionen ist erstaunlich einfach und zuverlässig. Richtig eingesetzt, erleichtert es das Projektmanagement.
Die Verwendung von Git setzt eine gewisse Lernkurve voraus. Diese Anleitung soll dir den Einstieg erleichtern und erklärt alles, was du für den Git-Einsatz bei Opencaching.de wissen musst (und Einiges mehr). Sie erklärt die Verwendung von Git anhand der Kommandozeilenversion, die für alle relevanten Betriebssysteme erhältlich ist. Daneben gibt es verschiedene komfortable Benutzeroberflächen. Gerne kannst du ein weiteres Kapitel für die von dir bevorzugte Git-UI hinzufügen!
Allgemeine Einführungen in Git findest du z.B. hier (Liste gerne ergänzen):
- http://gitref.org/index.html - eine leichtverständliche Einführung
- http://www.spheredev.org/wiki/Git_for_the_lazy - eine Kurzeinführung
- http://git-scm.com/documentation - offizielle Dokumentation
Installation
Git-Download
... für Windows: http://code.google.com/p/msysgit/downloads/list?q=full+installer+official+git
... für Mac: http://code.google.com/p/git-osx-installer/
Installation per Installationsprogramm und Standardeinstellungen. Zur Installation in der Entwickler-VM siehe altes Entwicklersystem.
Nach der Installation von Git muss du einmalig deinen Name und eine Emailadresse eingeben:
git config --global user.name "Your Name Here" git config --global user.email "your_email@youremail.com"
Diese Information wird später - für jeden einsehbar - zusammen mit jedem Codebeitrag (commit) von dir gespeichert. Verwende eine Emailadresse, die veröffentlicht werden darf, und ggf. einen Nickname. Diese Daten werden in der Datei .gitconfig
in deinem Benutzerverzeichnis abgelegt.
Funktionsweise von Git und Einsatz bei OC.de
Git arbeitet im Gegensatz zu Subversion dezentral. Jeder Entwickler hat eine eigene Kopie - einen "Klon" - des Repositories, also der Datenbank in der sich alle Dateien des Projekts in allen Branches und Versionsständen befinden. Aus diesem Klon werden die Arbeitsdaten ausgecheckt, und Änderungen der Arbeitsdaten werden dort eingecheckt.
Die Entwickler können in beliebigen Topologien organisiert werden und gleichen den Inhalt ihrer Repositories wechselseitig miteinander ab. Opencaching.de verwendet eine Art Sternstruktur, mit einem Haupt-Repository unter der Adresse
Auf dieses Repo hat nur der Entwicklungsleiter Schreibzugriff; alle anderen können nur lesen. Um auch Daten hochladen zu können, besitzt jeder Entwickler bei Github.com eine eigene Kopie - einen "Fork" - des Haupt-Repositories, z.B.
Dein erster Schritt als Opencaching-Entwickler ist das Anlegen deines Forks. Dazu legst du dir auf [[1]] einen kostenlosen Account an, gehst auf http://github.com/OpencachingDeutschland/oc-server3 und klickst oben rechts auf "Fork".
Der zweite Schritt ist, dir eine lokale Kopie - einen "Klon" - deines Forks anzulegen. Wie du das im OC.de-Entwicklersystem machst, ist im Artikel Entwicklersystem beschrieben. Hier machen wir es einfach mal testweise - du kannst so viele Klone anlegen wie du möchtest, den Github-Repositories ist das egal:
git clone git://github.com/<DeinBenutzername>/oc-server3
Nun wird bei dir ein Verzeichnis oc-server3/.git
angelegt, das zunächst eine 1:1-Kopie deines Github-Forks ist (der zunächst eine 1:1-Kopie des Opencaching-Deutschland-Repos ist), und von dort der komplette aktuelle OC.de-Code in Unterverzeichnisse von oc-server3
ausgecheckt. In oc-server3
befinden sich also sowohl deine Arbeitsdaten als auch der lokale Repository-Klon. oc-server3/.git/config
ist die Konfigurationsdatei des lokalen Repositories, die du aber nur selten von Hand bearbeiten wirst.
Dein Github-Fork heißt in deinem lokalen Repository origin; über diesen Name kannst du mit verschiedenen Git-Kommandos darauf zugreifen. Um die Konfiguration abzuschließen, muss zusätzlich noch der upstream definiert werden - das Repository, aus dem du neue Daten abrufst. Dies ist nicht dein eigener Fork, sondern du beziehst die Daten direkt von OpencachingDeutschland:
git remote add upstream http://github.com/OpencachingDeutschland/oc-server3
Mit git remote -v
kannst du dir nun alle "remote"-Repositories anzeigen lassen, die in deinem Klon eingestellt sind.
Datenfluss
Die folgende Grafik zeigt den Git-Datenfluss im Opencaching-Team am Beispiel von drei Entwicklern. Oben siehst du die "remote"-Repositories - das für alle Entwickler als "upstream" dienende Haupt-Repo und die drei "origin" genannten Forks -, und unten die drei lokalen Repositories und die Arbeitsdaten. Die grauen Pfeile zeigen, was du eben gemacht hast: 1. den Fork auf Github.com, und 2. das Erzeugen des lokalen Klons (nicht erschrecken lassen durch die vielen Details - das wird unten alles schrittweise erklärt):
(TODO: Grafik defekt, muss neu hochgeladen werden)
Die schwarzen Pfeile zeigen, wie ab sofort die Daten fließen werden: In umgekehrter Richtung! Du beziehst Daten vom upstream, schiebst deine eigenen Änderungen in deinen origin, und von dort übernimmt der Entwicklungsleiter sie wiederum in den upstream. Aus Sicht jedes Entwicklers fließen die Daten also zwischen drei Repositories im Kreis.
Links und in der Mitte ist der Standard-Git-Workflow zu sehen, rechts ein vereinfachter mit nur einem Branch.
Daten bearbeiten und hochladen
Nach dem ersten Auschecken ist der master-Branch aktiv. Dieser enthält den aktuellen Entwicklungsstand. Welcher Branch aktiv ist, siehst du mit
git branch
Unser Standard-Workflow sieht vor, dass nie im Master gearbeitet wird. Stattdessen musst du dir - ausgehend von master - für jede Aufgabe einen Arbeitsbranch anlegen:
git checkout -b 1234-new-feature master
Die vorangestellte Nummer ist eine Ticketnummer aus der Todo-Liste. Wenn es keine passende gibt, lässt du sie weg. Verwende nach Möglichkeit englische Namen und Kommentare, denn das OC-Projekt ist international vernetzt. Nun kannst du mit git branch
sehen, dass es in deinem lokalen Repo zwei Branches gibt, und der neu angelegte ist aktiv. Mit dem Kommando git checkout Branchname
kannst du zwischen den Branches hin- und herwechseln; dabei wird jeweils der Code in den Arbeitsdaten entsprechend ausgetauscht.
Beim Anlegen des Branches sind wir davon ausgegangen, das unmittelbar zuvor der Klon angelegt wurde und die lokale master-Kopie aktuell ist. Wenn Letzteres evtl. nicht der Fall ist, solltest du sie vor dem Anlegen des neuen Branches aktualisieren:
git checkout master git pull upstream git checkout -b 1234-new-feature [master]
Nun ist es soweit: Du kannst deine ersten Änderungen am OC-Code vornehmen und hochladen! Zum Bearbeiten musst du einen UTF8-fähigen Editor verwenden. Dass er das ist, erkennst du an den zwei japanischen Sonderzeichen oben in jeder Quelltextdatei: Wenn dort zwei Fragezeichen, Klötzchen oder Ähnliches erscheinen, ist dein Editor falsch eingestellt oder ungeeignet. Zum Thema Editoren/IDEs siehe auch im Forum: "Git-UI / PHP-IDE"
Wenn du die Änderungen vorgenommen hast, zeigt dir
git status
in roter Farbe an, welche Dateien geändert oder hinzugefügt wurden, und
git diff
die Änderungen im Einzelnen. Falls dein Editor bzw. deine Eintwicklungsumgebung irgendwelche zusätzlichen Dateien angelegt hat, kannst du diese in .git/info/exclude
eintragen, damit sie nicht ins Repository gelangen.
Als nächstes musst du Git mitteilen, dass die Daten zum aktiven Branch hinzugefügt werden sollen; dies geschieht mit
git add .
für alle geänderten und neuen Dateien im aktuellen Verzeichnisbaum (falls du Branches gewechselt hast vergewissere dich evtl. mit git branch
, dass du im richtigen bist!) Wahlweise kannst du einzelne Dateien per (Pfad+)Dateiname hinzufügen oder Wildcards verwenden. Dateien löschen kann man mit
git rm Dateiname
Nun zeigt git status
in grüner Farbe alle vorbereiteten Änderungen an, und mit
git commit
checkst du sie in dein lokales Repository ein. Es öffent sich ein vi-Editor, in dem du einen Kommentar eingeben musst. Schreibe eine aussagekräftige, möglichst englische Zusammenfassung in die erste Zeile, und evtl. zusätzliche Erläuterungen in die weiteren Zeilen. Wenn es nur ein einzeiliger Kommentar sein soll, kannst du dir den Editor auch sparen und den Kommentar direkt angeben mit
git commit -m "Kommentar"
Wenn keine neuen Dateien hinzugefügt, sondern nur vorhandene geändert werden sollen, kannst du auch das add
mit einbauen, also alle geänderten Daten mit nur einem Befehl einchecken:
git commit -am "Kommentar"
Mit
git log
siehst du nun, dass ein neuer commit in die Versionsgeschichte des aktiven Branches eingefügt wurde. Wahlweise kannst du auch mit git log --stat
nochmals alle geänderten Dateien anzeigen lassen.
Exkurs: commits
Commits sind das Hauptelement der Arbeit mit Git. Jeder Branch ist eine bestimmte Abfolge von Commits. Verschiedene Branches unterscheiden sich dadurch, welche Commits sie enthalten. Ein Commit ist ein Patch, der eine oder mehrere Dateien verändert, hinzufügt und/oder löscht. Jeder Commit hat einen eindeutigen Hashcode, der im Log angezeigt wird. Über diesen Code lassen sich Commits einzeln herauspicken, rückgängig machen, als Diff anzeigen etc. Dabei genügt die Angabe der ersten paar Zeichen, sofern sie eindeutig sind; üblich als Kurzform sind die ersten 7-10 Zeichen.
Der letzte (neueste) Commit des aktiven Branches hat auch den Name HEAD, der vorletzte HEAD~1, der drittletzte HEAD~2 etc. Mit
git diff HEAD~1
kannst du dir z.B. alle Änderungen zwischen aktuellem und vorletztem Codestand anzeigen lassen - also genau das, was du mit deinem letzten commit
eingecheckt hast.
Rebase auf aktuellen Codestand
Grundsätzlich solltest du Daten erst dann hochladen, wenn sie verwendbar sind und in das Haupt-Repository oder an einen anderen Entwickler weitergegeben werden sollen. Unfertiges bleibt zunächst nur lokal bei dir liegen. Wir tun jetzt einfach mal so, als sei deine Codeänderung fertig (du kannst den Upload danach wieder löschen, wenn es nur ein Test war).
Zunächst solltest du deine Daten nochmal auf den aktuellen Stand bringen. Damit ist sichergestellt, dass deine Änderungen mit dem aktuellsten OC-Code funktionieren:
git fetch upstream git rebase upstream/master
Das erste Kommando aktualisiert deine lokale Kopie der Upstream-Branches (die du mit git branch -r
auflisten kannst), bzw. legt diese erstmalig an. Das zweite übernimmt alle neuen commits aus dem Upstream - also dem OC-Hauptrepository - in deinen aktiven Branch, und zwar fügt es sie vor deine eigenen Änderungen ein! Deine Änderungen werden auf Basis des aktuellen OC-Codestandes neu aufgesetzt (re-based), d.h. sie werden als Patch auf diesen Codestand angewandt. Beide Kommandos lassen sich auch zu einem zusammenfassen:
git pull --rebase upstream master
Verwende niemals ein einfaches git pull
(ohne --rebase
) in einem Arbeitsbranch! Es würde die Versionsgeschichte unlesbar machen und das Zurückverfolgen von Codeänderungen verhindern.
Beim rebase
können "Merge-Konflikte" enstehen, wenn deine Codeänderungen nicht automatisch auf dem aktuellen Codestand aufgesetzt werden können, z.B. weil es mehrere Änderungen in der gleichen Codezeile gab. Git zeigt dann eine Fehlermeldung an, und die Konflikte sind in im Quelltext markiert (suche nach "===="). Korrigiere den Code, markiere die geänderte Datei erneut mit git add zum Hinzufügen, und gib git rebase --continue
ein, um das Rebase abzuschließen.
Daten hochladen
Nun kannst du deinen neuen Branch mit
git push origin 1234-new-feature
in deinen Fork hochladen. Wenn du auf http://github.com/<DeinUsername>/oc-server3 links die Branch-Dropdown-Box aufklappst, oder weiter rechts auf "branches" klickst, sollte dort der neue Branch auftauchen (manchmal mit etwas Verzögerung). Wenn du oben auf "Network" klickst, siehst du wie dein neuer Branch vom master abzweigt. Jeder Punkt in diesem Diagramm steht für einen commit.
Wenn dein Branch fertig ist und in den master übernommen werden soll, wählst du ihn aus der Branches-Liste aus und klickst oben auf "Pull Request"; hier kannst du noch einen zusätzlichen Kommentar angeben. Der Entwicklungsleiter wird per E-Mail informiert und wird deinen Code prüfen und ggf. übernehmen.
In diesem Fall war es wahrscheinlich nur ein Test, daher kannst du den Branch nun mit
git push origin :1234-new-feature
wieder aus deinem Fork löschen. Wenn du ihn auch lokal wieder löschen willst, geht das mit
git checkout master git branch -D 1234-new-feature
Das große -D
ermöglicht es, einen Branch zu verwerfen, der nicht weiterverwendet wurde. Wenn du stattdessen -d
angibst, sind nur Branches löschbar die bereits in einen anderen Branch (z.B. den master) übernommen wurden, wo durch die Löschung also keine Daten verloren gehen können. Im Zweifelsfall verwende immer -d; dabei kann nichts versehentlich verloren gehen.
Zusammenfassung des OC-Git-Standard-Workflow
Neuen Branch für eine neue Aufgabe anlegen:
1. git checkout master
2. git pull upstream
3. git checkout -b 1234-new-feature
... oder die Arbeit an einem bereits bestehenden Branch mit git checkout 1234-new-feature
fortsetzen
Programmierzyklen:
4. Code schreiben
5. mit git status
/ git diff
lokale Änderungen kontrollieren
6. Änderung mit git add
/ git commit
ins lokale Repo einchecken
7. mit git pull --rebase upstream master
auf aktuellen OC-Code aufsetzen
8. weiter bei 4, wenn der Code noch nicht fertig ist
Hochladen:
9. git push origin 1234-neues-Feature
10. Branch 1234-neues-Feature im Github aufrufen und Pull Request starten
Nicht mehr benötigte Branches löschen:
11. lokal: git checkout master
/ git branch -d 1234-neues-Feature
12. auf dem Fork: git push origin :1234-neues-Feature
Commits zusammenfassen
Wenn in Schritt 4-8 mehrere Einzelcommits entstehen, kannst du sie vor dem Hochladen zur besseren Übersicht zu einem zusammenfassen. Prüfe mit git log
nach, wieviele Commits zusammenzufassen sind - sie sollten noch nicht hochgeladen sein! - und gib ein:
git rebase -i HEAD~n
... wobei n die Zahl der Commits ist. Nun erscheint ein Editorfenster mit einem "pick" je Commit. Ersetze alle "picks" ab dem zweiten durch "squash" oder "s", was bedeutet, dass sie mit dem Commit davor zusammenzufassen sind. Nach dem Speichern erscheint ein zweiter Text im Editor, in dem du auch die Commit-Kommentare zusammenfassen kannst.
Wenn du dir ganz sicher bist, dass ein bereits hochgeladener Commit noch nicht weiterverwendet wurde - z.B. wenn du ihn eben erst hochgeladen und noch keinen Pull Request gemacht hast - kannst du ihn auch noch nachträglich mit neuen Commits zusammenfassen. Dies funktioniert wie oben beschrieben, allerdings musst du beim anschließenden push
zusätzlich --force
angeben, um den/die alten Commit(s) in deinem Fork zu überschreiben.
Aktuelle Daten holen; mehrere Änderungen testen
Wenn du selbst gerade nichts programmieren willst, sondern dir einfach nur ein Update vom OC-Server holen und anschauen, machst du
git checkout master git pull upstream
Wenn du mehrere Branches mit eigenen Änderungen angelegt hast, und diese alle im Zusammenhang testen möchtest, kannst du dir dafür einen Testbranch anlegen:
git checkout -b test master git merge 1234-new-feature git merge 2345-my-bugfix ...
Änderungen verwerfen
- alle geänderten Dateien:
git reset --hard
- alles im aktuellen Verzeichnisbaum:
git checkout .
- nur eine bestimmte Datei:
git checkout Dateiname
... die bereits "commitet", aber noch nicht "gepusht" sind:
git reset --hard HEAD~n
... wobei n die Zahl der zu verwerfenden Commits ist. Wenn die Änderungen bereits "gepusht" wurden:
- mit
git log
die rückgängig zu machende Commit-ID raussuchen git revert commit-ID
git push
- evt. Pull-Request auf dem Github, wenn es bereits im Upstream angekommen war
Den Kommentar des letzten Commit korrigieren:
git commit --amend
Daten direkt von anderen Entwicklern holen
Wenn du z.B. den Branch 1234-new-feature von Entwickler heinz testen möchtest, kannst du ihn in einen Testbranch bei dir herunterladen. Zunächst musst du heinz' Fork einmalig als weitere Upstream definieren:
git remote add heinz http://github.com/heinz/oc-server3
Dann legst du bei dir einen Testbranch an, am besten auf Basis aktuellster Daten ...
git checkout master git pull upstream git checkout -b tolles-heinz-feature
... und mergst seinen Feature-Branch in deinen Testbranch:
git pull heinz 1234-new-feature
Der stable-Branch
Neben dem Master gibt es im OC-Repository einen Branch "stable". Dieser enthält immer den gleichen Stand wie das Produktivsystem www.opencaching.de. Neue Features werden im Master entwickelt und getestet und später über den Stable-Branch freigegeben.
Mit dem Stable-Branch wirst du nur dann zu tun haben, wenn du einen "Hotfix" schreibst - eine dringende Korrektur, die sofort freigegeben werden soll. Diese setzt du auf dem Stable statt dem Master auf; der übrige Workflow ist der gleiche wie oben beschrieben.
Vereinfachter Workflow
Der oben beschriebene Workflow ist Pflicht für alle Entwickler, die Code zu OC.de beitragen. Wer nur hin und wieder mal eine Grafik oder einen Text beisteuert, kann ausnahmsweise auch ohne separate Branches arbeiten. In diesem Fall ist ein einfaches git pull
im Master-Branch verboten! Stattdessen muss überall, wo oben git pull upstream
steht, stattdessen
git pull --rebase upstream master
verwendet werden! Der vereinfachte Ablauf ist dann:
1. Code schreiben
2. mit git status
/ git diff
lokale Änderungen kontrollieren
3. Änderung mit git add
/ git commit
ins lokale Repo einchecken
4. mit git pull --rebase upstream master
auf aktuellen OC-Code aufsetzen
5. weiter bei 1, wenn der Code noch nicht fertig ist
6. git push origin
7. Pull-Request
Noch ein paar Gimmicks
git diff Branchname
zeigt alle Unterschiede zwischen dem aktuellen Branch und einem anderen an.
git cherry-pick Commit-ID
übernimmt einen bestimmten Commit (von wo auch immer) in den aktiven Branch.
git gc
führt eine Garbage Collection durch und gibt Platz im lokalen Repository frei. Per git reset --hard
oder git branch -d
gelöschte Commits werden damit endgültig weggeworfen (vorher sind sie mit einigen Verrenkungen noch rekonstruierbar).
git grep Suchbegriff
durchsucht den Code des aktuellen Verzeichnisbaums; für zahlreiche Optionen siehe Git-Doku.
git help Kommando
zeigt die Doku für ein Git-Kommando an.