ДНК порекло > Аутосомална ДНК

Нагађање порѣкла одсѣчака на хромозомах

(1/4) > >>

Александар Невски:
Видѣх да се на мрежи могу наћи цртежи гдѣ се хромозомомъ, односно их дѣлићемъ покушава одредити порѣкло, то йест област свѣта одакле потичу. Виђах доста таквих цртежь из рачунарскога поступка Дага Мекдоналда.  Пошто имам доста скинутих и спремљених података, окушах се и я у том.

Напомињем да йе овакав задатак у општем случайу немогућ, йер само Бог зна одакле йе наслѣђен койи СНП са ма койега хромозома. Врло су рѣтки они за койе се може тачно утврдити порѣкло, односно изворно становништво. Код найвећега броя их ми можемо само покушати утврдити одакле они найвѣроватнийе потичу. Разлогъ томе йе више, йедан йе што се исте врѣдности найвећега броя СНПова могу наћи у разних становништава, йедино се разликуйу по учестаностих од области до области. Други велики недостатак и отежавайућа околност йе што ми у добийених исходах од ФТДНА или 23АндМе не знамо коя од двѣйу врѣдностий потиче са койега хромозома. Йер свако има по два бесполна хромозома исте врсте, по йедан од родитеља "йедан" и од родитеља "два" (ради политичке исправности не користим прѣвазиђене рѣчи "отац" и "мати", како се не бише уврѣдили педери и тужили ме, ако койим случайем налете овамо и прочитайу мойе писанийе). Примѣра ради, ако на извѣстном СНП-у имамо стање "АТ" а на њему сусѣдном рецимо "ГЦ", ми не знамо йесу ли на истих хромозомах редом "АЦ" и "ТГ" или су "АГ" и "ТЦ". Ово додатно отежава одређивање найвѣроватнийега порѣкла. Трећа отежавайућа околност йе што у стварности три СНПа на истом хромозому а врло блиска по положайу стварно могу потицати из разних областий, а све због случайне природе их прѣспаяња током стотина поколѣний.

Но, без обзира на све ове тешкоће и нейеднозначност задатка, ипак се некаква процѣна може урадити, боља или лошия. И я написах рачунарски поступак койи тако нешто и покушава, койи на основу разлика у учестаностих СНПова у различитих становништава покушава одредити койему становништву йе койе парче задатих хромозомъ найсличнийе.

Ево како изгледа дѣо улазнога спремишта, где се налазе подаци за око 300к СНПова:

rs9442372,1,1008567,0.61922834115185199000,AB,0.54807692,0.53246753,0.82710280,0.58163265,0.61392405,0.86559140
rs3737728,1,1011278,0.62855386926684997000,AB,0.69871795,0.74350649,0.89719626,0.77040816,0.82911392,0.88709677
rs6687776,1,1020428,0.66002881661182400000,AB,0.84294872,0.76298701,0.84112150,0.80102041,0.53164557,0.86021505

И ево неколиких исходъ.

Први йе лик из Корейе. Скоро све йе прѣдстављено машћу Источне Азийе, као што йе и очекивано. Пакистански одсѣчак на шестом хромозому йе вѣроватно шум, йер се налази на дѣлу са рѣткима СНПовима.



Затим HGDP01028, Банту из Йужне Африке. И овдѣ се добия све намазано машћу подсахарске Африке.



Е сада иде нешто тежи случай, вѣштачки направљен мѣшанац горње двойице, Кореянца и Бантуа. И добия се очекиван исход. Поступак у овом случайу нема тешкоћа са шумовима, йер су ова два становништва изузетно генетски различита, те их нѣйе тешко разликовати и добро процѣнити порѣкло одсѣчака.



А сада тежи случайи, Европљани.
Прво иде Оркадияц HGDP00794, затим моя маленкост и на крайу йедини албански узорак у мойем посѣду. Оно што се уочава у њих, а нарочито у послѣдње двойице йе постояње множества кратких одсѣчака, койи могу али не морайу бити шум. То йе дѣлимично послѣдица давнашњега мѣшања становништва Европе прѣ свега са Блискоисточњацима, али и са другима. Други разлог су прилично мале разлике између Европе и Блискога Истока, што отежава их разликовање. Сасвим йе могуће да пойедини овакви врло кратки одсѣчци, често дуги само неколико десетина СНПова, стварно потичу са другога края земље, од прѣ ко зна колико тисушт година. Но, шума има свакако, и трудићу се побољшати и усавршити свой поступак, ово йе тек почетак његовога развоя.







Йедан од послова койи ми прѣдстойи йе избацити из прорачуна дѣлове хромозомъ гдѣ су "центромере" (шта год то било) и дѣлове где су СНПови рѣтки, односно на великом одстояњу йедан од другога. Йер су ту било какви исходи непоуздани (ако не и безсмислени) и обично прѣдстављайу шум. Такав шум йе рецимо на албанском узорку, гдѣ се на почетку 14-га хромозома налази велики "амерички" одсѣчак, или у мене велико парче источне Азийе на почетку 13-га хромозома. А пошто су ту центромере, они су безсмислени. Иначе, пойедини амерички одсѣчци у европских становништава не морайу прѣдстављати грѣшку, йер могу у ствари потицати из Сибира, са койима генетске везе имайу и Европљани и Америчани.
Оно што я назвах овдѣ Йужном Азийом су у ствари узорци из Пакистана, и то из области зване Гедрозия (генетски доста блиске са Блиским Истоком), за койу многи рачуначи Додекада дайу знатан утицай на Европу, нарочито западну (и по више од 10%). Индийске узорке йош немам, али се надам да ћу их наћи, на койих у будућности првенствено намѣравам засновати податке Йужне Азийе.

Напомињем да су другом, тамнийом машћу прѣдстављени дѣлови гдѣ добиям мању вѣроватноћу, значи да су мање поуздани од осталих (што не значи да су остали много поуздани).

Ево и примѣра исхода Дага Мекдоналда, од човѣка из Казахстана. Овдѣ се виде посебно обѣлежени дѣлови са центромером и рѣткима СНПовима. Он, очигледно, много боље излази на край са кратежима и шумовима од мене, а мора се признати и да изглѣда лѣпше. Изгледа ми чак да йе његов поступак прављен с намѣром да се "испеглайу" врло кратки одсѣчци. Можда са циљем да се тежиште прѣбаци на порѣкло скорийих прѣдака, из послѣдњих десетак колѣн?


Александар Невски:
Ево исходъ йош четрийу "гатања".

Први йе Словенац, йедини койега имам. Бѣях изненађен, видѣвши колико йе исход по учестаности областий сличан мойему. Очекивах да ће бити знатно мање Блискога Истока, йер йе исти овай узорак на ПОС (ПЦА) прорачунах доста "сѣвернийе" од србскога грозда. Ми смо тамо одмах испод мађарскога грозда, а он йе одмах изнад њега.



Ево и Турчина. Нѣйе од Турака Бехара из Кападокийе коришћених мноме у ПОС прорачунах. Мислим да йе знатно западнийе, могуће из Истанбула. Овдѣ йе примѣтно знатно веће учешће Источне Азийе него ли у Европљана, што йе у складу са повѣшћу и са другима генетскима показатељима. Евролики одсѣчци су присутни у знатном обиму.



Ево сада и Финца. И овдѣ йе осѣтнийе учешће Источне Азийе него ли у осталих Европљана мноме приказаних, што йе опет очекивано. Док йе учешће блискоисточних одсѣчака смањено, што йе такође очекивано.



И на крайу поданик племена Ал Сауд. Примѣтно йе знатно учешће подсахарске Африке (што йе већ познато из других прорачунъ, рецимо на рачуначих Додекада). А Источне Азийе има знатно мање него ли у Турчина или Финца.



На добийених сликах се може примѣтити да мой поступак често има тешкоћа разликовати различита порѣкла на истих парчићих на истих хромозомах. Рецимо на пуно мѣст и горе и долѣ имам по парче са Блискога Истока гдѣ около прѣовлађуйе Европа. То йе нарочито изражено где трѣба направити разлику између Европе и Блискога Истока, а у мањой мѣри и са Йужном Азийом. Мислим да се то догађа због малих разлика у их генетици, односно у учестаностих СНПова. Мораћу се мало потрудити како бих побољшао прѣпознавање и у оваквих случайих.

Александар Невски:
Прво се извињавам читаоцемъ за приврѣмено затрпавање найсвѣжийих порука на разговаралишти бройними великими сликами. :)

Послѣдњих недѣља дорађивах мой рачунарски поступак за прѣдвиђање порѣкла одсѣчака на хромозомах. Мислим да йе сада поступак доста унапрѣђен, поузданийи и без ранийе откривених грѣшака. Приступ йе значайно промѣњен те на сваком дѣлићу хромозома приказуйем вѣроватноће порѣкла из задатих областий. Пошто задатак койи покушавам рѣшити нѣйе йеднозначно одређен (као што су, рецимо, рачунске радње сабирања и множења), има више могућих рѣшењ а тешко йе одредити койе йе рѣшење боље а койе лошийе. Због тога поступак има неопходан улазни податак Ш, койиме се управља грубошћу односно подробношћу испитивања. За мање врѣдности Ш-а поступак йе осѣтљивийи, могу се открити краћи одсѣчци припадайући разним извориштним областим, али йе такође и далеко подложнийи шуму. Насупрот томе, за већи улазни податак Ш се добия мање шума, али многи краћи одсѣчци остайу непримѣћени, односно утапайу се у околину. Досадашњим испитивањем дођох до закључка да су исходи найкориснийи за Ш у опсегу од 150 до 250. Наредни примѣри сви користе учестаности СНПова Рачунача Додекада К7б, пошто он има само 7 становништава. Наравно, поступак може користити улазне податке учестаностий СНПова и за друге рачуначе Додекада, као и за мойе, али я овдѣ баратам само са К7б-ом, ради йеднообразности.

Прво ћу, увида ради, дати прорачуне над мойим узорком (узорком Невскога) са разнима улазнима подацима Ш, редом са врѣдностима 20, 50, 100, 150, 200 и 250. Ту се може видѣти да постотак Атлантик-Балтика у мене са порастом Ш-а расте од 29.9% (за Ш=20) до 57.71% за Ш=250. Тачна моя врѣдност Атлантик-Балтика за К7б йе 60.51%, док разлика до овога постотка прѣдставља шум (поступак прорачуна измѣшаности йе йеднозначан, и я имам свой рачунарски поступак койим се то рачуна, чийи се исходи поклапайу са Додекадовима). Исто тако йе видљиво да са порастом Ш-а у мене опада постотак Африке и Источне Азийе и примиче се правим врѣдностим 0.0% односно 0.17%. слично йе и са осталима становништвима, што йе Ш веће одступања су мања.














Ево и мойега узорка за Ш = 250, али поравнатога, тако да изгледа уреднийе и "лѣпше" за око, као што йе радио Даг Мекдоналд. До душе, овако се губи доста од података. А и не ради баш савршено. Мораће се мало боље подесити поравнавање.



А сада ћу дати неколико узорака из разних народъ. Сви су срачунати са Ш = 250.

Оркадияц:



Финац:



Словенац:



Албанац:



Турчин:



Поданик породице Ал-Сауд:



Посебно йе занимљив исход за Каритияну, домородца бразилских прашума. Пошто К7б нема америчке Индиянце за узорно становништво, њему найвећим дѣлом додѣљуйе Сибир, па затим Источну Азийу. Њему йе и Атлантик-Балтик значаян, цѣлих 10.9%, што прѣдставља одйек давнашњих веза древних Сибираца са становништвом сѣверне Европе (то нѣйе послѣдица новийега мѣшања, пошто му йе учешће срѣдоземне генетике готово непостойеће, само 0.06%).



А ево и Кореянца, у койега йе видљиво значайно учешће Сибира, поред прѣовладавайуће генетике Источне Азийе.



А затим иде Банту из Йужне Африке, и потом његов вѣштачки мѣшанац са Кореянцем.
 




На крайу мала напомена. Пойединости ових исходъ ми не трѣбамо узимати здраво за готово, односно не трѣбамо бити увѣрени да йе све тако као што се добия. Ми не можемо знати потиче ли койе парче стварно из области чийом машћу йе премазано, односно не можемо бити увѣрени ради ли се о тачном податку или о шуму. Овдѣ се ипак ради само о вѣроватноћах, срачунатих на основу задатих учестаностий СНПова у разних областих свѣта и на основу улазнога податка Ш задуженога за "грубост" рачунице. Одакле стварно потиче койе парче наших хромозомъ зна само Бог на небесих. А ми можемо само нагађати, и покушавати понешто срачунати.

Поступак провѣрих на тройци: дѣте и двойе његових родитељ, из иностранства, за разне Ш-ове. Тако за сваку неуобичайену мрљу на дѣтету тражах извор на родитељих. Већини нађох извориште, али неким не, што би могло значити да такве чине шум, добивен несрећним спойем СНПов добийених од родитељ койи личи на нешто треће. Но, и то йе могуће.

Александар Невски:
Изражавам свойе найоштрийе негодовање поводом прѣправљања мойега чланка уредитељем Порѣкла и избацивања слов Ѣ, Й, Я и Ъ , а нарочито због убацивања нѣмачке латиничне йоте умѣсто нашега слова "Й".

http://poreklo.rs/srpski-dnk-projekat/slikovit-prikaz-porijekla-odabranih-naroda-svijeta/

Не схватам како га нѣйе мрзело да онолико писанийе мноме послато прѣправља и ятовицу замѣњуйе ийекавицом.
Срећом, слова Ѣ, Й и Я осташе на сликах, њих не могаше промѣнити.


Јовица Кртинић:
Извињавамо се, Невски, много се извињавамо. Важно је да држимо до ћирилице и да се сви добро разумемо.

Навигација

[0] Индекс порука

[#] Следећа страна

Иди на пуну верзију