Бавећи се анализом османских дефтера и посебно регионалном ономастичком структуром пописаних популација досад сам се само фокусирао на имена кршћанске популације. Наиме, пошто је предкршћански ономастички фонд на нашим просторима врло уједначен и једноличан (имена са основима Рад-, Вук-, Драг-, Мил-, Влад- итд.) до знатнијих регионалних одступања (са изузетком приобалних градских популација) долази тек током 14. стољећа, тако да кршчанска имена католичке и православне провенијенције полако истискују народна имена. Тај процес се у католичким регијама одвијао брже него у православним, али већ крајем 15. и почетком 16. стољећа се на већој конфесионално хомогеној групи на први поглед може одредити припадност.
Истовремено се бавећи генетичким питањима и тражећи начин формализације описане ономастичке анализе дошао сам на замисао да се истом статистичким методом као код аутосомалних анализа може анализирати ономастички фонд једне мање популације. Референтни узорак при томе би била широка народна ономастика, по којој се полако шире календарска имена као посебне мутације. С временом добијамо различите кластере популација које се могу успоредити.
Пошто у дефтерима Босне из 1604г. и оном Клишког санџака из 1550г. имамо доста муслимана који кроз име оца показују одраз старе ономастике њиховог краја (најчешће у старим именима баштина), можемо и њих укључити у такву анализу.
У ту сврху сам одрадио католике и муслимане из сљедећих нахија средње Босне: Високо, Брод, Лашва, Рама, Ускопље и Неретва. За успоредбу сам се служио нахијама Озрен, Змијање, Сана, Котор и Требава за православна подручја источно од прије наведених. Свеукупно су то око 7500 имена (католици 2651, православни, 2588 и муслимани 2174).
Укупно тако имамо ономастички фонд са 44 различитих календарских основа. Велика вечина њих има врло малу заступљеност унутар календарских имена (знатно испод 1%). Потом најстарија и најпространија календарска имена (Иван, Петар, Павал, Никола) не показују неко релевантно одступање у релативној заступљености. Ако ове двије групе имена одстранимо остајемо на 14 имена са знатно различитом дистрибуцијом односно дискриминаторном снагом. У табели су приказани проценти заступљености у односу на свеукупни календарски именички фонд. Због једноставности приказа католике нисам посебно распоредио на наведене 6 нахије, него их скупно обрадио.
https://ibb.co/54L7fVhНа тој основи сам направио један ономастички калкулатор, зовимо га
О14-калкулатор.
PCA (Principal Component Analysis) методом добијемо сликовни приказ ономастичке варијације у наведеним нахијама. Притом прва компонента (X-оса) већ осликава 63,03% цијелокупне варијације а друга компонента (Y-оса) надодаје још 9,77%. Тако да је на овом визуалном приказу обухвачено око 73% варијације у кориштеној бази имена.
https://ibb.co/ypjGQL0Затим се може приказати како свака именска основа појединачно утиче на позицију на PCA-плоту (Biplot анализа).
https://ibb.co/t3b44zmНа крају можемо још погледати дендограм који је резултат Agglomerative Hierarchical Cluster анализе. Најприје се повезују најближе точке у кластере које се онда хиерархиски посложе у једно стабло. Релативна дужина повеузних линија показује при томе блискост односно различитост анализираних података.
https://ibb.co/JzkMrC4Ето, можда је неком занимљиво