Видѣх да се на мрежи могу наћи цртежи гдѣ се хромозомомъ, односно их дѣлићемъ покушава одредити порѣкло, то йест област свѣта одакле потичу. Виђах доста таквих цртежь из рачунарскога поступка Дага Мекдоналда. Пошто имам доста скинутих и спремљених података, окушах се и я у том.
Напомињем да йе овакав задатак у општем случайу немогућ, йер само Бог зна одакле йе наслѣђен койи СНП са ма койега хромозома. Врло су рѣтки они за койе се може тачно утврдити порѣкло, односно изворно становништво. Код найвећега броя их ми можемо само покушати утврдити одакле они найвѣроватнийе потичу. Разлогъ томе йе више, йедан йе што се исте врѣдности найвећега броя СНПова могу наћи у разних становништава, йедино се разликуйу по учестаностих од области до области. Други велики недостатак и отежавайућа околност йе што ми у добийених исходах од ФТДНА или 23АндМе не знамо коя од двѣйу врѣдностий потиче са койега хромозома. Йер свако има по два бесполна хромозома исте врсте, по йедан од родитеља "йедан" и од родитеља "два" (ради политичке исправности не користим прѣвазиђене рѣчи "отац" и "мати", како се не бише уврѣдили педери и тужили ме, ако койим случайем налете овамо и прочитайу мойе писанийе). Примѣра ради, ако на извѣстном СНП-у имамо стање "АТ" а на њему сусѣдном рецимо "ГЦ", ми не знамо йесу ли на истих хромозомах редом "АЦ" и "ТГ" или су "АГ" и "ТЦ". Ово додатно отежава одређивање найвѣроватнийега порѣкла. Трећа отежавайућа околност йе што у стварности три СНПа на истом хромозому а врло блиска по положайу стварно могу потицати из разних областий, а све због случайне природе их прѣспаяња током стотина поколѣний.
Но, без обзира на све ове тешкоће и нейеднозначност задатка, ипак се некаква процѣна може урадити, боља или лошия. И я написах рачунарски поступак койи тако нешто и покушава, койи на основу разлика у учестаностих СНПова у различитих становништава покушава одредити койему становништву йе койе парче задатих хромозомъ найсличнийе.
Ево како изгледа дѣо улазнога спремишта, где се налазе подаци за око 300к СНПова:
rs9442372,1,1008567,0.61922834115185199000,AB,0.54807692,0.53246753,0.82710280,0.58163265,0.61392405,0.86559140
rs3737728,1,1011278,0.62855386926684997000,AB,0.69871795,0.74350649,0.89719626,0.77040816,0.82911392,0.88709677
rs6687776,1,1020428,0.66002881661182400000,AB,0.84294872,0.76298701,0.84112150,0.80102041,0.53164557,0.86021505
И ево неколиких исходъ.
Први йе лик из Корейе. Скоро све йе прѣдстављено машћу Источне Азийе, као што йе и очекивано. Пакистански одсѣчак на шестом хромозому йе вѣроватно шум, йер се налази на дѣлу са рѣткима СНПовима.
Затим HGDP01028, Банту из Йужне Африке. И овдѣ се добия све намазано машћу подсахарске Африке.
Е сада иде нешто тежи случай, вѣштачки направљен мѣшанац горње двойице, Кореянца и Бантуа. И добия се очекиван исход. Поступак у овом случайу нема тешкоћа са шумовима, йер су ова два становништва изузетно генетски различита, те их нѣйе тешко разликовати и добро процѣнити порѣкло одсѣчака.
А сада тежи случайи, Европљани.
Прво иде Оркадияц HGDP00794, затим моя маленкост и на крайу йедини албански узорак у мойем посѣду. Оно што се уочава у њих, а нарочито у послѣдње двойице йе постояње множества кратких одсѣчака, койи могу али не морайу бити шум. То йе дѣлимично послѣдица давнашњега мѣшања становништва Европе прѣ свега са Блискоисточњацима, али и са другима. Други разлог су прилично мале разлике између Европе и Блискога Истока, што отежава их разликовање. Сасвим йе могуће да пойедини овакви врло кратки одсѣчци, често дуги само неколико десетина СНПова, стварно потичу са другога края земље, од прѣ ко зна колико тисушт година. Но, шума има свакако, и трудићу се побољшати и усавршити свой поступак, ово йе тек почетак његовога развоя.
Йедан од послова койи ми прѣдстойи йе избацити из прорачуна дѣлове хромозомъ гдѣ су "центромере" (шта год то било) и дѣлове где су СНПови рѣтки, односно на великом одстояњу йедан од другога. Йер су ту било какви исходи непоуздани (ако не и безсмислени) и обично прѣдстављайу шум. Такав шум йе рецимо на албанском узорку, гдѣ се на почетку 14-га хромозома налази велики "амерички" одсѣчак, или у мене велико парче источне Азийе на почетку 13-га хромозома. А пошто су ту центромере, они су безсмислени. Иначе, пойедини амерички одсѣчци у европских становништава не морайу прѣдстављати грѣшку, йер могу у ствари потицати из Сибира, са койима генетске везе имайу и Европљани и Америчани.
Оно што я назвах овдѣ Йужном Азийом су у ствари узорци из Пакистана, и то из области зване Гедрозия (генетски доста блиске са Блиским Истоком), за койу многи рачуначи Додекада дайу знатан утицай на Европу, нарочито западну (и по више од 10%). Индийске узорке йош немам, али се надам да ћу их наћи, на койих у будућности првенствено намѣравам засновати податке Йужне Азийе.
Напомињем да су другом, тамнийом машћу прѣдстављени дѣлови гдѣ добиям мању вѣроватноћу, значи да су мање поуздани од осталих (што не значи да су остали много поуздани).
Ево и примѣра исхода Дага Мекдоналда, од човѣка из Казахстана. Овдѣ се виде посебно обѣлежени дѣлови са центромером и рѣткима СНПовима. Он, очигледно, много боље излази на край са кратежима и шумовима од мене, а мора се признати и да изглѣда лѣпше. Изгледа ми чак да йе његов поступак прављен с намѣром да се "испеглайу" врло кратки одсѣчци. Можда са циљем да се тежиште прѣбаци на порѣкло скорийих прѣдака, из послѣдњих десетак колѣн?