И једно добро питање за математичаре, ако је мутација I2-PH908 настала у 3-4. вијеку (а такев су досад све процјене старости) колико је носилаца ове мутације уопште могло бити у периоду сеобе 300 година касније?
Evo jedan mali pokušaj pa sami prosudite.
Iz slike koju nam pruža Yfull možemo trenutačno izvuči nekoliko matematičkih datosti. Najprije imamo TMRCA od 1700 godina. Zatim imamo podatak da je taj vremenski period na svakoj liniji prosiječno pokriven sa oko 20 mutacija na Y-kromozomu. Tako dobijemo kod svakog trećeg rođenja jednu vidljivu mutaciju sa prosiječnim razmakom od 85 godina između dvije mutacije i prosiječnom dužinom jedne generacije od 28 godina.
To jednostavno proizlazi iz činjenice da Yfull-algoritam koristi oko prilike jednu trečinu dužine Y-kromozoma za detektiranje validnih mutacija (length coverage) i dobro se poklapa sa najnovijim istraživanjima da pri mejozi nastanu oko 80 mutacija na cijelom genomu (Y-kromozom pri tome čini oko 2% dužine cijelog genoma).
Zatim, trenutačni raspored uzoraka po haplogrupama pokazuje da na ukupno 25 haplogrupa direktno ispod PH908 prvih 5 haplogrupa po veličini (20% svih haplogrupa) pokrivaju 80% svih uzoraka. To je klasična Pareto-distribucija i ona se ne pojavljuje slučajno nego samo pri određenim okolnostima kod inicijalnog demografskog rasta.
Znači, tražimo model demografskog rasta koji će pod datim YFull-okolnostima ispuniti 2 uvjeta, (i) oko prilike 25 direktnih pod-haplogrupa (ii) sa približnom Pareto distribucijom.
Pretpostavimo da je prvi čovjek sa PH908-mutacijom rođen oko 250AD i da je do 300AD začeo 3 sina koji će preživjeti djetinstvo i sami začeti mušku dijecu. Šansa pri svakom rođenju da sin pokaže novu Yfull-mutaciju je 33,33% a da ih nema 66,66%. To je dovoljno za najprimitivniji stohastički model demografskog rasta.
Naime, nakon 12 generacija (oko 600AD) gore postavljeni uvjeti će samo biti ispunjeni pri prosiječnom konstantnom rastu od točno 1,8% godišnje. Pod ovim uvjetima čemo oko 600AD imati oko 2000 živečih PH908-muškaraca sa 25 različitih haplogrupa sa Pareto—distribucijom i to sa sljedečim teoretskim redoslijedom največih 5 haplogrupa.
1. 33,33% uzoraka
2. 22,22% uzoraka
3. 14,81% uzoraka
4. 4,94% uzoraka
5. 4,94% uzoraka
Takva raspodijela je jednostavno efekat vremenskog prioriteta kod nastanka mutacija. Od onih prvih 3 sina najvjerovatnije će samo jedan pokazati Yfull-mutacije i ako pretpostavimo da će muško naslijedstvo svih 3 sinova rasti približno istom stopom rasta ta vremenski prva haplogrupa će uvijek činiti oko 33% svih uzoraka.
Efektivni godišnji prirast od 1,8% danas odgovora demografskom rastu Egipta ili Botswane. Takav rast zasigurno nije dugo održiv, ali je u rasponu od 10-12 generacija već često zabilježen. Ja na primjer za svoje selo raspolažem dosta dobrim podacima i točno takav rast je zabilježen između 1650 i 1950g.
Ako povečamo onu brojku od 3 sina na 6 dobit ćemo linearno povečanje muške populacije oko 600AD na 4000 ali i postojećih haplogrupa u tom trenutku na 50. Ako se prati trend broja direktnih haplogrupa pod PH908 kroz godine može se uočiti da se trend rasta dosta usporio i pretpostavljam da na kraju nećemo vidjeti više od 30-40 direktnih haplogrupa ispod PH908.
Po opisanom modelu najrealniji broj PH908-muškaraca oko 600AD bi bio između 3000-4000 muškaraca = 6000 – 8000 PH908 populacije (sa ženama) = 12000 – 16000 imigrirajučih Slovena na zapadni Balkan (ako pretpostavimo da je već onda PH908 činila oko 50% svih Slavena). Svaka hipoteza o inicijalnom broju PH908 sinova od 10, 15, ili više ne samo da nije realistična nego po modelu daje rezultate koje nisu spojive sa do sada raspoloživim podacima o broju haplogrupa i njihovoj distribuciji.