大纲:
一、前言
二、Git 简介
三、Git 的诞生
四、集中管理 vs 分布式管理
五、Git 特点
六、Git 原理
七、总结
注,测试机 CentOS 5.5 x86_64,Git 服务器版本:git version 1.8.2.1,客户端版本:git version 1.9.2.msysgit.0。所有软件请到这里下载:。
一、前言
本来作为一个专职运维,嘿嘿!会搭建Git服务器就OK了,当时真这么想,嘿嘿!本来公司的版本控制器一直在用SVN,我们版本发布用SVN+shell脚本进行发布,但是最近开发部的老大换了,嘿嘿。你懂的。强烈要求我们换版本控制器,虽然很多人不满意,最后还是换成了Git,但是发现很多同事不怎么会使用Git,于是我就写了这个教程到内部tower中,大家看了不错,于是我发出来与大家分享一下!网上很多教程都是从开发的角度来讲Git的,今天我从运维的角度来说Git,大家有什么问题随时与我交流,先在这里谢谢大家了^_^!
二、Git 简介
Git 是什么?大家肯定会说不就是版本控制器嘛,是的Git是目前世界上最先进的分布式版本控制系统(没有之一)。
1.那什么是版本控制器呢?
举个简单的例子,比如我们用Word写文章,那你一定有这样的经历:比如增加一个段落你得复制一份,你删除一个段落你又得复制一份,防止下次又要修改保留上次你要删除的段落。最后一个接一个的版本,你复制了很多版本,最后可能你自己都不知道修改了哪些?嘿嘿,然后你只能一个一个的找,太麻烦了,若是有东西帮你管理那应该多好。
2.分布式管理
你写的文章或书,你肯定会给你朋友或者其他人看,让他们给你建议并做相应的修改,然后他们用邮件或U盘再发给你,你再合并修改一下,真是麻烦,于是你想,如果有一个软件,不但能自动帮我记录每次文件的改动,还可以让朋友之间协作编辑,这样就不用自己管理一堆类似的文件了,也不需要把文件传来传去。如果想查看某次改动,只需要在软件看一眼就可以,岂不是很方便?这个软件用起来就应该像这个样子,能记录每次文件的改动:
版本 | 用户 | 说明 | 修改日期 |
1 | user1 | 增加一行内容 | 2014/4/10 10:22 |
2 | user2 | 修改一行内容 | 2014/4/10 13:12 |
3 | user3 | 删除几个字 | 2014/4/15 20:42 |
4 | user2 | 增加某个内容 | 2014/4/20 16:32 |
哈哈,这样你就从手工控制“版本”时代到软件自动管理的时代,而且还是分布式管理,至于什么是分布式管理我们下面将详细说明。
三、Git 的诞生(很传奇)
先简看一下,下面的图片,是不是很熟悉,嘿嘿!
简单说:Linus开发Linux内核,需要版本控制器,于是开发了Git。下面是开发周期:
2005/4/3 开发;
2005/4/6 发布;
2005/4/7 管理自身;
2005/6/16 管理Kernel2.6.12。
大牛是怎么定义的呢?大家可以体会一下。哈哈^_^…… Git 迅速成为最流行的分布式版本控制系统,尤其是2008年,GitHub网站上线了,它为开源项目免费提供Git存储,无数开源项目开始迁移至GitHub,包括jQuery,PHP,Ruby等等。至于Git与GitHub的关系,会再下面的文章里说明。
四、集中管理 vs 分布式管理
Linus一直痛恨的CVS及SVN都是集中式的版本控制系统,而Git是分布式版本控制系统,集中式和分布式版本控制系统有什么区别呢? 下面我们来看看两张图:
1.集中管理
集中式版本控制系统,版本库是集中存放在中央服务器的,而干活的时候,用的都是自己的电脑,所以要先从中央服务器取得最新的版本,然后开始干活,干完活了,再把自己的活推送给中央服务器。中央服务器就好比是一个图书馆,你要改一本书,必须先从图书馆借出来,然后回到家自己改,改完了,再放回图书馆。
缺点:
集中式版本控制系统最大的毛病就是必须联网才能工作,如果在局域网内还好,带宽够大,速度够快,可如果在互联网上,遇到网速慢的话,可能提交一个10M~20M的文件就需要10分钟甚至更多时间,这还不得把人给急死啊。
2.分布式管理
那分布式版本控制系统与集中式版本控制系统有何不同呢?首先,分布式版本控制系统没有“中央服务器”,每个人的电脑上都是一个完整的版本库,这样,你工作的时候,就不需要联网了,因为版本库就在你自己的电脑上。既然每个人电脑上都有一个完整的版本库,那多个人如何协作呢?比方说你在自己电脑上改了文件fiel,你的同事也在他的电脑上改了文件file,这时,你们俩之间只需把各自的修改推送给对方,就可以互相看到对方的修改了。
和集中式版本控制系统相比,分布式版本控制系统的安全性要高很多,因为每个人电脑里都有完整的版本库,某一个人的电脑坏掉了不要紧,随便从其他人那里复制一个就可以了。而集中式版本控制系统的中央服务器要是出了问题,所有人都没法干活了。
在实际使用分布式版本控制系统的时候,其实很少在两人之间的电脑上推送版本库的修改,因为可能你们俩不在一个局域网内,两台电脑互相访问不了,也可能今天你的同事病了,他的电脑压根没有开机。因此,分布式版本控制系统通常也有一台充当“中央服务器”的电脑,但这个服务器的作用仅仅是用来方便“交换”大家的修改,没有它大家也一样干活,只是交换修改不方便而已。如上图!
五、Git 特点
1.Git 总结
分布式
存储快照而非差异
本地有完全的版本库,几乎所有操作都在本地
有内在的一致性,SHA1
优秀的分支管理
支持各种协同模式
开源,有一些第三方软件可整合使用,几乎所有操作都是
2.与CVS/SVN,Git 的优势
支持离线开发,离线Repository(仓库)
强大的分支功能,适合多个独立开发者协作
速度块
六、Git 原理
1.四种基本类型
BLOB:每个blob代表一个(版本的)文件,blob只包含文件的数据,而忽略文件的其他元数据,如名字、路径、格式等。
TREE:每个tree代表了一个目录的信息,包含了此目录下的blobs,子目录(对应于子trees),文件名、路径等元数据。因此,对于有子目录的目录,git相当于存储了嵌套的trees。
COMMIT:每个commit记录了提交一个更新的所有元数据,如指向的tree,父commit,作者、提交者、提交日期、提交日志等。每次提交都指向一个tree对象,记录了当次提交时的目录信息。一个commit可以有多个(至少一个)父commits。
TAG:tag用于给某个上述类型的对象指配一个便于开发者记忆的名字, 通常用于某次commit。
2.工作区(Working Dir),提交区/暂存区(stage/index),版本库
注,大家对上面的原理不了解没关系,大家只要简单的看一下这几张图,在下面的文章中我们会深入了解。
七、总结
Q & A:欢迎大家提出问题。最后,希望大家有所收获^_^……