ДНК порекло > Основе генетичке генеалогије

Број јединствених СНП-ова

<< < (3/6) > >>

Uzi:
Колко сам ја разумео проучавајучи БАМ фајлове битно је и то колико пута је 'прочитан' неки део гена. Ако је прочитан 20 пута и сваки пут се испостави да је на том делу Ц онда је то доста сигуран СНП. Али ако се та исти део прочита 100 пута и од тога је 60 пута Ц а 40 Т онда то више није сигуран СНП.

Ја имам 15 непоузданих СНПова, и непоуздани со зато јер су прочитани само по 2 пута. Знаћи ако би били прочитани више пута и сваки пут се ипостави исто слово онда постају поуздани.

Селаковић:
Узи, а колико имаш поузданик јединствених и која ти је најнизводнија СНП грана?

Uzi:

--- Цитат: Селаковић  Фебруар 27, 2017, 06:43:29 поподне ---Узи, а колико имаш поузданик јединствених и која ти је најнизводнија СНП грана?

--- Крај цитата ---

Имам 3 приватне СНПове високе квалитете прочитани 50 пута и вше. Подграна N-FGC28483

Плус 1 приватни СНП прихватљиве квалитете, јер је прошитан само 4 пута.

Селаковић:

--- Цитат: Uzi  Фебруар 27, 2017, 07:03:14 поподне ---Имам 3 приватне СНПове високе квалитете прочитани 50 пута и вше. Подграна N-FGC28483

Плус 1 приватни СНП прихватљиве квалитете, јер је прошитан само 4 пута.

--- Крај цитата ---

Хвала! Значи и код тебе приближно слична прича као код Синише, Невског и Млађа.

Rigel:
Треба разликовати квалитет очитавања СНП-а и поузданост СНП-а у погледу утврђивања филогенетских веза.

Категорије које је Синиша поменуо се односе на квалитет очитавања. За одређивање квалитета очитавања се користе параметри као што је број очитавања (number of reads) за дату локацију СНП-а и проценат регистроване мутације (derived allele) у односу на укупан број очитавања. За утврђивање филогенетских веза се користе они који су квалификовани као најбољег и прихватљивог квалитета. Ја их на пример имам 12 (8+4). Грана R1a-YP4278*; TMRCA 1850 ybp просечна вредност, а израчуната на основу мојих личних СНП-ова 1976 ybp. Формула која се користи је: SNPS*144.41+60, где је SNPS број поузданих личних СНП-ова коригован тако да одговара покривености Y хромозома код конкректног узорка. Ван YFull-а се обично узима да се једна нова, поуздана мутација догоди на сваких 150 година, што је наравно само статистичка процена.

Проблем су понављајући СНП-ови (recurrent или floating SNPs) који су регистровани у више давно раздвојених грана (типа у неким гранама хаплогрупе Р1б и Г2а). Може се десити да мутација погоди исто место независно у две линије (доста ретко!), али појава истог СНП-а код удаљених линија исто тако може бити индикација да је дата локација из неког разлога склонија мутацији. У другом случају се наравно овај СНП не узима у обзир за утврђивање филогенетских веза, чак и ако има квалитетно очитавање. Још неке проблематичне ситуације су када СНП има више верзија, рецимо два изведена алела, као и неки СНП-ови где су откривене повратне мутације (у нормалним околностима веома, веома мала вероватноћа дешавања). Да би се установило да ли је СНП поуздан или не треба упоредити податаке свих тестираних. Дешава се наравно и да неки СНП који је важио за поуздан постане непоуздан.

Овде је рад где објашњавају методологију коју користе на YFull-у:
https://www.researchgate.net/publication/273773255_Defining_a_New_Rate_Constant_for_Y-Chromosome_SNPs_based_on_Full_Sequencing_Data

Навигација

[0] Индекс порука

[#] Следећа страна

[*] Претходна страна

Иди на пуну верзију