人類單拷貝基因組大約含有30億個堿基對。人類基因組計劃的目的就是獲得一組完整的基因序列,并在2003年4月宣布了人類基因組的最終參考序列。從人類基因組計劃中得到的信息,將對醫(yī)學及法醫(yī)個體識別有很大貢獻,并可幫助我們更好地了解自己的基因構造。
在人類細胞中,細胞核內(nèi)的染色體包括DNA的稠密小體和保護DNA的組蛋白。人類基因組由22對配對常染色體和兩條性染色體組成。因此,一般人類細胞中包括46條不同的染色體或23對染色體。男性性別標記為XY,因為它們包含有一條單拷貝X染色體和一條單拷貝Y染色體;而女性包含兩條X染色體,所以性別標記為X-X。大多數(shù)個體同一認定所使用的標記在常染色體上,判斷性別的標記在性染色體上。
所有體細胞中的染色體均為二倍體,即包括兩套染色體。另一方面,生殖細胞(精子和卵子)是單倍體,它們只含有一套染色體。而當一個卵子細胞和一個精子細胞結合成為受精卵,則其中的染色體又成為二倍體。因此,受精卵中的每對染色體分別來自其父母雙方。
體細胞核的分裂過程叫有絲分裂?所產(chǎn)生的子細胞與母細胞的遺傳信息完全相同。性細胞或生殖細胞的分裂過程叫減數(shù)分裂。在減數(shù)分裂中細胞連續(xù)分裂兩次,產(chǎn)生四個而不是兩個子細胞,每個細胞含單倍體的染色體。
染色體上的DNA由“編碼區(qū)”和“非編碼區(qū)”構成。編碼區(qū)叫基因,包含有細跑合成蛋白質(zhì)所需要的必需信息。一個基因一般長度范圍是從幾千到幾萬個堿基對不等。人類基因組計劃驚奇地發(fā)現(xiàn),人類只有不到3萬個基因用于編碼蛋白質(zhì),而不像先前所認為的5萬~10萬個。
基因由外顯子(蛋白質(zhì)的編碼部分)和內(nèi)含子(插入序列)組成,只占人類DNA的5%, DNA中的非蛋白質(zhì)編碼區(qū)則構成染色體的剩余部分。因為這部分區(qū)域與合成蛋白質(zhì)沒有直接聯(lián)系,它們有時被叫做“垃圾”DNA。人類個體識別應用的標記位于基因間或基因內(nèi)的季編碼區(qū),故遺傳變異而沒被編碼。
具有個體特異性的多態(tài)性遺傳標記,可以從人類基因組的非編碼區(qū)找到。一個基因或非編碼區(qū)的DNA標記在染色體上的位置一般被稱為基因座(Locus,復數(shù)Loci)。通過在世界范圍內(nèi)努力實施的人類基因組計劃,已確定了數(shù)以千計的基因座并在人類染色體上作圖定位。
成對的兩條染色體互稱為同源染色體(Homologous),因為它們具有相同的長度和基因結構。每個基因的拷貝,在同源染色體上對應位置相同(基因座)o同源染色體中,一個從母親處繼承,另一個從父親處繼承。由于有時會發(fā)生突變,一對同源染色體的序列有可能相同,也有可能不完全相同。
同一個基因座上不同序列的基因被稱為等位基因。如果同源染色體上同一個基因座上的兩個等位基因不同,稱為雜合子( Heterozygous),相同則稱之為純合子(Homozygous)。分析基因座上等位基因的差異是人糞同一認定時必不可少的過程。
基因型是基因座等位基因的特異性表達。如果在一個基因座上有兩個等泣基因,如A和a,那么可能存在三種基因型:AA、Aa和aa。AA和aa是純合子,Aa是雜合子。一個DNA分型是多個基因座上基因型的聯(lián)合。DNA分型或DNA分析是確定DNA分子特定區(qū)域內(nèi)基因型的過程。為了避免無關個體間分型隨機匹配的可能性,人類個體識別采用多個基因座分型。