如果可能,用于法醫(yī)學(xué)DNA分型的群體數(shù)據(jù)庫應(yīng)包含已知種族的無關(guān)個體樣本。但是,由于許多實驗室使用匿名樣本,從實際角度講這是不可能的。此外,種族類別的劃分通常過于主觀,可能僅根據(jù)感知的表型或文化類型劃分。采集的個體樣本可能不只具有一種明確的種族背景,如果不根據(jù)生物學(xué)特征,而是從文化角度看就可能被歸類為另一種族。最后,被收養(yǎng)或源自人工授精的人往往不知道他們真正的遺傳背景。
盡管并不能完全杜絕存在血緣關(guān)系的個體,但數(shù)據(jù)庫中存在的一些這樣樣本并不能使等位基因頻率估計無效。只有數(shù)據(jù)庫中包括特定基因座可影響后代授精或生育的相關(guān)個體時,估計等位基因頻率才會發(fā)生系統(tǒng)偏差。但是,人類個體識別中選用的遺傳標(biāo)記一般可以避免這一類型的采樣偏差。采集無關(guān)個體樣本最主要的目的是通過提高采集的獨立等位基因數(shù)目,以提高等位基因頻率估計的精準(zhǔn)度。
選擇DNA數(shù)據(jù)庫個體樣本時,應(yīng)事先不知所檢測基因座的分型,以確保樣本選擇的隨機性。通常采集血液捐贈者或醫(yī)院志愿者的樣本。在很多情況下,需根據(jù)人類學(xué)特征仔細劃分群體樣本,以仔細定義群體的種族。但是,在法醫(yī)學(xué)DNA數(shù)據(jù)庫中沒有必要一定要獲得詳細信息。個體自稱所屬民族是樣本民族分類的合適方法。
民族的一般分類對大多數(shù)法醫(yī)學(xué)數(shù)據(jù)庫是足夠的,除非是研究一個隔離人群,如美國土著民族阿帕契印第安人。對全美不同群體的檢測表明同一種族內(nèi)樣本間等位基因頻率的差別是很小的。同樣,佛羅里達和弗吉尼亞白人多數(shù)常見等位基因很相似,如等位基因11,頻率分別是0.323和0.317.因此,如果比較佛羅里達和弗吉尼亞白人的群體數(shù)據(jù),DNA分型頻率的估計不會有明顯區(qū)別。