Форум - Порекло

ДНК порекло => Основе генетичке генеалогије => Савети за тестирање => Тему започео: Прерад Јануар 31, 2020, 12:33:51 пре подне

Наслов: Корисне алатке, линкови и упутства
Порука од: Прерад Јануар 31, 2020, 12:33:51 пре подне
Мислим да на форуму нема сличне теме, ако има нека модератори пребаце пост у њу и бришу што је већ написано.

Неколико алатки које вам могу користити код баратања са различитим фајловма.

1. WGSExtract (https://dnagenics.com/adn/wgs-extract-bam-file-fastq/)

Алатка за WGS BAM фајл. Са њом се нпр. може из WGS BAM фајл (DanteLabs) издвојити Y-DNA, mtDNA (заједно или одвојено) и различите врсте аутосомалних фајлова (FTDNA, 23andMe, Ancestry...). Добијени Y-DNA и mtDNA BAM фајл је много мањи од WGS BAM фајл и пуно "лакши" за пребацивање на YFull. Док аутосомалне фајлове се може пребацити на GEDmatch, MyHeritage... Наводно се најбоље резултате постиже са извлачењем 23andMe_V4 фајла. Ако имам случајно криву информацију, слободно ме исправите.


2. DNA Kit Studio (https://dnagenics.com/dna-kit-studio/)

Алатка за аутосомалне фајлове. На жалост није употребљива за mtDNA предикцију из Дантеовог VCF фајла, пошто се mtDNA подаци заснивају на другом стандарду. Али може се извући mtDNA txt фајл и ручно исправити постојеће вриједности. Више информација имате овдје (https://haplogrep.i-med.ac.at/2014/09/08/rcrs-vs-rsrs-vs-hg19/).


3. Admixture Studio (https://dnagenics.com/admixture-studio/)

Алатка за аутосомалне фајлове, омогућује поређење са бројним популационим рачунарима.


4. jameslick сајт (https://dna.jameslick.com/mthap/)

Сајт за mtDNA предикцију из различитих фајлова које садрже mtDNA податке. Нпр. из WGS BAM фајла (DanteLabs) се извуче mtDNA FASTA фајл уз помоћ WGSExtract алатке (под бр. 1) и убаци ту, након неколико тренутака добије се предикција mtDNA хаплогрупе.


5. useGalaxy сајт (https://usegalaxy.org/)

Потребна је регистрација. Сајт са прегршт функција, нпр. може се пребацити и обрађивати WGS BAM и FASTQ фајлове (DanteLabs). Има 250 GB бесплатне запремине.
Наслов: Одг: Корисне алатке, линкови и упутства
Порука од: Прерад Фебруар 05, 2020, 12:11:46 пре подне
Подијелио би упутство за израду BAM hg38p13 фајла из FASTQ фајлова са DanteLabs-a и извлачење Y-DNA и mtDNA података уз помоћ useGalaxy сајта.

1. Потребно је регистрација на usegalaxy.org (https://usegalaxy.org/) или usegalaxy.eu (https://usegalaxy.eu/). Ради се о истој платформи на двије различите и неовисне адресе. На свакој имамо 250 GB запремине.

2. Након уписа на сајт, у горњем лијевом углу кликнемо на икону за пријенос податка, која је у облику стријелице (поред звијездице) и са свог диска пренесете оба FASTQ фајла, које смо претходно пребацили са DanteLabs-a.

3. На сај такођер пребацимо FASTA GRCh38_full_plus_hs38d1 фајл са ове адресе (http://ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/001/405/GCA_000001405.28_GRCh38.p13/GRCh38_major_release_seqs_for_alignment_pipelines/GCA_000001405.15_GRCh38_full_plus_hs38d1_analysis_set.fna.gz), тако што у прозору за пребацивање фајла кликнемо на дугме "Paste/Fetch data" и у оквир испод коментара "Download data from the web...." копирамо поменути линк (URL). Потом кликнемо на дугме "Start".

4. Након одрађеног пребацивања фајлова у оквир за претрагу, такођер на лијевој горњој страни, упишемо "BWA" и испод одаберемо "Map with BWA-MEM" алатку.

5. Подешавања за "Map with BWA-MEM" алатку:
Припрема BAM фајла може да потраје више од 24 часа, све зависи колико су им оптерећени ресурси. Добијени BAM фајл ће износити негдје између 30 и 50 GB, у зависности од квалитета и величине FASTQ фајлова.

6. За извлачење Y-DNA и mtDNA података у мањи BAM фајл упишемо у оквир за претрагу "slice" и одаберемо "Slice BAM by genomic regions".

7. Подешавања за "Slice BAM by genomic regions" алатку:
Припрема овог BAM фајла је врло брза, јер је пуно мањи, по мом искуству негдје између 250 и 400 GB. Добијени фајл скинемо на свој компјутер и пребацимо га на неки интернетни простор (нпр. Dropbox, Google Drive, OneDrive...) одакле можемо прослиједити линк за скидање YFull-u.

Вјероватно са овом процедуром нећете добити најквалитетније и најсадржајније BAM фајлове, пошто је моје знање из генетике и процесирања генетичких података врло ограничено. Знам да међу члановима форума и друштва има изврсних познавалаца ове материје, па би свака сугестија добро дошла. Како год, из личног искуству са YFull-om, мој BAM фајл само са Y-DNA и mtDNA подацима је изгледа испао доста добар, на стаблу сам добио нову грану.

Још само мало поређење оваквог BAM фајла са фајлом из DanteLabs-a:

DanteLabs
BAM GRCh37/hg19 - 45,2 GB
BAM Y-DNA & mtDNA - 170,7 MB
chrY Mapped Gbases - 0.47
chrY Avg data depth - 7x

usegalaxy
BAM GRCh38/hg38 - 39,3 GB
BAM Y-DNA & mtDNA - 282,2 MB
chrY Mapped Gbases - 0.65
chrY Avg data depth - 11x
 
Наслов: Одг: Корисне алатке, линкови и упутства
Порука од: Слатинац Фебруар 05, 2020, 12:27:13 пре подне
Мислим да је једноставније и боље решење да се овима из Yfull-a да приступ налогу на Дантеовом сајту, као што су Сунце и НСБ урадили. После ће они сами да извуку све податке које си ти навео и резултате да окаче на њихово стабло. Ово је боље решење, јер нема петљанција, скидања фајлова, и некоме ко се не разуме добро у компијутере овај процес о ком си ти писао биће мало компликован.
Наслов: Одг: Корисне алатке, линкови и упутства
Порука од: Прерад Фебруар 05, 2020, 12:43:23 пре подне
Да, једноставније им је дати доступ до рачуна код ДантеЛабса. YFull сигурно не претвара BAM hg19 у hg38, а како знам FASTQ фајлове не примају. Неко од познавалаца тематике би требао прокоментарисати шта се добија односно губи ако имамо hg19 или hg38.
Ако неко жели имати BAM hg38 онда га може сам израдити на овај начин и на YFull послати само Y-DNA и mtDNA, пошто им остало не треба.

BAM hg38 се може израдити из FASTQ фајлова исто преко Yseq-a. Ако се не варам, цијена је 25$ за постојеће муштерије. Мислим да га и они онда шаљју на YFull.
Наслов: Одг: Корисне алатке, линкови и упутства
Порука од: Uzi Фебруар 05, 2020, 01:07:27 пре подне
Да ли се из FASTQ фајла на Галаксију поред .бам фајла добије и .баи фајл?
Наслов: Одг: Корисне алатке, линкови и упутства
Порука од: Ojler Фебруар 05, 2020, 01:15:46 пре подне
Да ли се из FASTQ фајла на Галаксију поред .бам фајла добије и .баи фајл?

Да.
Наслов: Одг: Корисне алатке, линкови и упутства
Порука од: Прерад Фебруар 21, 2020, 12:25:11 пре подне
Мада сам овај линк (https://docs.google.com/document/d/1TqRF_CZMs4QOEuVlrhLkzL-uc-dvHAO92O-S7tc7FhY/mobilebasic) са одличним упутствима за WGSExtract већ ставио у другој теми, нека буде и овдје.

Недавно је изашла нова верзија програма и сада предвиђа Y-DNA хаплогрупу.

И још двије слике корисничког сучеља.

(https://lh5.googleusercontent.com/cGPu2s963o2ivn8_RHEyWeMdEWn7fm-IhWqdY15rJUmfJm67WDU1UdKqbNFxX2fNxWq28TsfLgxso0GVdx5gWKS26pf89VSEMvSzN1bxBJ89Paz5bHq5JCXKQ_Q3jbVi4Q=s800)

(https://lh4.googleusercontent.com/76Kcq1QyITz4QIQmZELtGOaAEeKkde_4LGwa25-K9uHuetu_TCjVhHs_wIQ3SFR5u6ggXJ_FiSmFxDOfYGxLTXs1i1SpNHqAJ7GmWjVSXCQcgKFnfiL-UW6yh5LFJQ_lWg=s800)