為實現STR遺傳標記的分析,須確定重復區(qū)域兩側序列恒定的側翼區(qū)域。知道側翼序列后就可設計引物,擴增分析重復區(qū)域。識別新的STR遺傳標記有下列兩種方法:①在GeneBank等DNA序列數據庫中尋找重復6次或更多的連續(xù)重復單元(Weber及May,1989; Collins et a1.,2003;Subramanian et a1.,2003);②通過分子生物學分離法尋找(Edwards et a1., 1991; Chambers及MacAvoy,2000).
STR重復序列以重復單位的長度命名。二核苷酸重復具有兩個核苷酸一個接一個的重復。三核苷酸的重復單位有3個核苷酸,四核苷酸的有4個,五核苷酸的有5個,六核苷酸的有6個。理論上講,一、二、三、四、五、六核苷酸的重復分別會有4、16、64、256、1024、4096種可能的核心序列排列方式(Jin et al.,1994)。
STR序列不僅在重復單位的長度和重復次數上不同,而且其重復次數增加的模式嚴格講也是不一致的。按照重復模式的不同,STR被分成幾類。簡單重復中重復單位的長度和序列一致,復合重復由兩種或兩種以上的簡單重復連接而成,復雜重復則可能包含幾種不同長度的重復單元,并且重復單元之間可能含有不同長度的插入序列( Urquhart et a1., 1994)U。高變復雜重復具有大量長度和序列不一致的等位基因,因此給基鼠分型帶來函難(urquhart etal.1993 ,Gill et al. 1994)。最后一種分類方法在法醫(yī)實驗室并不常用,因為實驗室間等位基因的命名和檢測存在差異。目前有兩種包含高變復雜STR基因座SE33(有時稱ACTBP2)的商業(yè)試劑盒(Urquhart et a1.,1993;Promega Corporati仰,2002;Applied Bio-systems,2002)。
對一個STR基因座而言,并非所有的等位基因都包含完整的重復單位。即使是簡單重復也可能在完整重TH01之間插入不一致的等位基因。微變異即指含有不完全重復單位的等位基因。比如THol的等位基因9.3,它包含9個四核苷酸完全重復和一個不完整的三核苷酸重復,因為第7個重復的AATG重復中缺失了一個A('Puers et a1.,1993)。