Пре извесног времена, у теми везаној за Dante Labs, била је дискусија о томе да ли вреди доплатити генерисање BAM датотеке са очитавањима поравнатим са новијим реферетним људским геномом GRCh38/hg38.
Наиме, Dante Labs подразумевано даје BAM фајл у старијем GRCh37/hg19 формату, али на захтев (и уз доплату од 29 EUR) може да сирова очитавања генома експортује и у новији GRCh38/hg38 формат који би требало да има мало боље покривање неких тешко читљивих делова Y хромозома (информација добијена од техничке подршке YFULL).
Обзиром да сам за једног пријатеља прво послао на YFULL сирову BAM датотеку у GRCh37/hg19 формату, а онда након што је иста процесирана доплатио "upgrade" и послао и BAM у GRCh38/hg38 формату, ево да укратко резимирам да ли је било разлика у анализи и које су.
Што се тиче статистике коју YFULL даје по извршеној анализи BAM датотеке, ево која је разлика између BAM фајлова у Hg19 и Hg38 формату:
Full statistics (Hg19 BAM)
Full statistics (Hg38 BAM)
Што се тиче броја SNP новела, за очекивати је било да из Hg38 формата евентуално "исплива" и још нека додатна приватна мутација, али испоставило се да је YFULL заправо на крају установио мањи број поуздано очитаних мутација из Hg38 фајла, у односу на првобитну анализу из Hg19 BAM фајла:
Novel SNPs (Hg19 BAM)
Novel SNPs (Hg38 BAM)
Анализа STR маркера из Hg38 BAM фајла још увек није завршена, тако да у овом тренутку не знам да ли ће евентуално ту ситуација бити боља (тј. да ли ће више вредности STR маркера бити очитано, односно мање њих захтевати додатну ручну проверу).