С обзиром да често правимо статистике заступљености хаплогрупа по регионима, мислим да је важно да дефинишемо који су параметри потребни да тај пресек буде што реалнији. Ту се пре свега јављају проблеми малог и неравномерног узорка, као и плански тестираних родова.
Код анонимних истраживања такав проблем не постоји, зато што су тамо углавном тестирани несродни појединци, пореклом из одређених области. Ту са друге стране постоји проблем што некада не знамо ко је све обухваћен истраживањем.
Што се јавних база тиче, конкретно код нас у пројекту сада већ постоји велики број плански тестираних родова, што може реметити неку реалну слику, која нам је, верујем, свима циљ. Посебно уколико је узорак незадовољавајући.
Први услов је да узорак буде задовољавајућ. Уколико је могуће и равномерно распоређен.
Други, већи проблем, постоји са плански тестираним родовима и/или породицама које се "понављају". Већ смо раније констатовали да се не требају рачунати породице које се у потпуности дуплирају (исто презиме, слава и место порекла).
Главно питање је како регулисати плански тестиране породице, тј. родове који су тестирани да би се потврдила генетска веза на основу литературе, предања, презимена/славе. Да не набрајам, списак таквих породица је сада већ прилично велики.
Некада те породице носе исто презиме, а нису из истог места, мада сматрам да их ни ту не треба рачунати, посебно ако је узорак мали. Исти принцип би можда требао бити и код оних који се сасвим случајно тестирају, а у том крају већ имају презимењаке који припадају истој хаплогрупи/подграни.
Код ових других, где постоји веза на основу литературе, па се "плански" организује и тестирање да би се потврдила иста, треба некако регулисати бројку. Убацити можда само неколико породица, главна братства и сл. То је већ за дискусију.
Да не дужим, немам идеју како би то тачно изгледало. Не бих да звучим грубо са тим "избацивањем" из статистике, увек можемо урадити и комплетну статистику на основу свих тестираних. Ово је више покушај да се креира колико-толико реална генетска слика неког подручја.
Сви предлози су добродошли!