Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Po ukončení sekvenace, dostaneme z externí laboratoře data ve formátu FASTQ.

...

FASTQ soubor obsahuje čtyři řádky pro každou sekvenci(READ):

  1. Název sekvence: Začíná znakem '@' a může obsahovat různé informace o vzorku nebo experimentu.

  2. Sekvence: Řetězec nukleotidů/bází (A, T, C, G) představující DNA sekvenci.

  3. Znak oddělení: Další řádek, který obvykle obsahuje pouze znak '+' (může být doplněn o další informace, jako je název vzorku).

  4. Skóre kvality: Řetězec, kde každý znak odpovídá kvalitě jednotlivého nukleotidu v sekvenci. Kvalita určuje, jak moci jistý je sekvenátor, že přečetl příslušnou bázi.

...

My tento formát vezmeme a zahájíme analýzu dat. Ta spočívá v několika krocích:

...

Náš unikátní vyhodnocovací systém tyto data obdrží, vyhodnotí jejich kvalitu a provede následující kroky představující vyhodnocení

IMG_0128.jpgImage Added

  1. Sestavení - jednotlivé obdržené malé fragmenty jsou sestaveny do jedné dlouhé DNA sekvence v elektronické podobě.

  2. Hledání variant genu – Provádíme tzv. variant calling. To je proces, při kterém se porovnává Vaše sekvence genomu s referenční sekvencí genomu, a identifikují se místa, kde se jednotlivé sekvence liší. Tento proces pomáhá identifikovat varianty, jako jsou mutace, polymorfismy a jiné genetické změny.

  3. Anotace - druhý krok, který představuje proces, při kterém přiřazujeme informace k těmto identifikovaným variantám. To zahrnuje určení, zda jsou varianty spojeny s nějakými genetickými onemocněními, zda ovlivňují funkci genů, nebo jakou mají biologickou roli. V podstatě znamená anotace hledání vysvětlení, co jednotlivé rozdíly v sekvenci DNA znamenají. Jsme napojeni na databázi ClinVar. Tato databáze shromažďuje a sdílí informace o jednotlivých genetických variantách a jejich klinickém významu. My si z této databáze vezmeme všechny patogenní varianty (tyto varianty mají schopnost způsobit nebo přispět k rozvoji určitého onemocnění) a variantu zanotujeme příslušným způsobem závažnosti.

  4. Klasifikace - následně určíme, jaký význam mají jednotlivé varianty ve Vašem případě. Význam může být:

    1. Patogenní - Tato klasifikace znamená, že varianta je považována za příčinu onemocnění na základě dostupných důkazů.

    2. Pravděpodobně patogenní- Tato kategorie zahrnuje varianty, které mají vysokou pravděpodobnost, že jsou škodlivé, ale dosud není dostatek důkazů pro jejich klasifikaci jako patogenní.

    3. Nejistý význam - Tato klasifikace znamená, že dostupné důkazy nejsou dostatečné k určení, zda je varianta spojena s onemocněním nebo ne. Může to být způsobeno nedostatkem informací o variantě, jejím vzácném výskytu, nebo nejasnostmi v tom, jak ovlivňuje funkci genu. Varianta s nejistým významem může být vyžadovat další výzkum nebo sledování, aby se lépe porozumělo jejímu dopadu na zdraví.

    4. Pravděpodobně benigní  - Varianta, která je pravděpodobně neškodná, ale pro jistotu může být zapotřebí další důkaz nebo analýza.

    5. Benigní - Tato kategorie označuje varianty, které jsou považovány za neškodné a nemají žádný vliv na zdraví nebo vývoj onemocnění.

    Report
    1. Těchto variant je většina.

  5. Lékařská zpráva - Na základě nalezených informací vznikne report návrh lékařské zprávy o jehož detailech se můžete dočíst ve článku „Jak se vyznat v reportu výsledků“Předání reportu lékaři - report výsledků předáme v lékařské zprávě“

  6. Podstoupení lékařské zprávy lékaři k posouzení - každý návrh lékařské zprávy obsahující výsledky je předán k posouzení lékařskému genetikovi, který výsledky zkontroluje a schválí.

  7. Předání reportu lékařské zprávy klientovi - Po schválení zprávy lékařem pak report putuje k Vámje Vám výsledná zpráva zpřístupněna.

Info

Víte, jak se určuje referenční sekvence, se kterou srovnáváme Vaše DNA?

  1. Výběr jedinců: Referenční sekvence je obvykle vytvořena z genomických dat několika jedinců, aby se zohlednily variabilní části genomu.

  2. Konsenzus: Sekvence se vytváří jako konsenzus, kde se vyberou nejčastější nukleotidy na každé pozici v genomu.

  3. Standardizace: Referenční sekvence je často standardizována a publikována mezinárodními organizacemi (např. Genome Reference Consortium), což zajišťuje, že vědci používají stejnou referenci pro srovnání.

Referenční genom, je tedy v podstatě genom průměrného člověka na základě sekvenací velkého počtu lidí. DNAmeter používá GRCh38/hg38 jako referenční lidský genom.