Melkijades ме је питао за помоћ око генерисања аутосомалних фајлова помоћу програма WGS Extract, па да не бих слао само њему, боље да напишем овде кратко упутство, можда још некоме затреба.
Наравно, први корак је да се са genome.dantelabs.com преузме BAM фајл и индекс фајл (BAI).
Ако је неко поручивао поравнање FASTQ фајлова са Hg38 референтним људским геномом, треба напоменути да је за прављење аутозомалних фајлова ипак неоподан BAM фајл поравнат са старијом верзијом Hg19 референтног људског генома, јер се за аутозомалне тестове по правилу и даље користи Hg19 формат.
Преузете BAM и BAI фајлове снимите у било који директоријум (фолдер), али водите рачуна да нема размака ("спејс") било где у стази до фајла, пошто WGS Extract не гута размаке у стази. Јам сам рецимо направио фолдер C:\Autosomal\
Стартујте WGS Extract, изаберите BAM фајл који се налази у фолдеру C:\Autosomal а затим исти тај фолдер изаберите и за излазни директоријум.
Кликните на другу картицу (таб) под називом "Extract Data" а затим на дугме "Generate files in several autosomal formats"
Штиклирати опције као на слици доле, и кликнути на дугме "Generate the selected files". Мало појашњење овде:
- Прва опција ефективно прави аутозомални фајл који је унија аутозомалних фајлова свих наведених фирми (тзв. "суперкит"), тако да се може поуздано користити за поређење са аутозомалним резултатим других људи без обзира код које фирме су се они тестирали. Ово је најбољи могући формат за слање на GedMatch. Исти супер-фајл сма успео да уплоадујем и на FTDNA, али сам "пријавио" да пребацујем фајл са 23andMe.
Међутим, MyHeritage одбија да прогута овакав суперкит, па да је за трансфер на MyHeritage најбоље користити FTDNA аутозомлани формат (јер MyHeritage користи услуге исте лабораторије у Хјустону коју користи и FTDNA и аутозомални фајлови су им 99% идентични).
Ето то би било то...
Генерисање самих аутозомалних фајлова може мало потрајати, у зависности од снаге рачунара, а као резултат, добиће се фајлови чији називи јасно указују о ком формату се ради:
GFX0437471__CombinedKit_All_SNPs_RECOMMENDED.txt
GFX0437471_23andMe_V5.txt
GFX0437471_Ancestry_V2.txt
GFX0437471_FTDNA_V3.csv
GFX0437471_LDNA_V2.txt
GFX0437471_MyHeritage_V2.csv
Поступак самог слања (transfer) аутозомалних фајлова на GEDMATCH, FTDNA и MyHeritage, добијених на основу BAM фајла из Dante Labs 30x WGS теста превише излази из ове теме, па ако нешто запне, можда је боље да се отвори посебна тема за то.