Vítejte! V tomto článku se od písmenka k písmenku podíváme na zdrojový kód mRNA vakcíny proti SARS-CoV-2 od firmy BioNTech/Pfizer.
Chci poděkovat velké hromadě lidí, kteří strávili čas revizí tohoto článku pro jeho věrohodnost a správnost. Všechny chyby zůstavají každopádně mými, rád bych se o nich rychle dozvěděl na bert@hubertnet.nl nebo na Twitteru: @PowerDNS_Bert
Tato slova vás mohou trochu překvapit – vakcína je přece tekutina, která se píchá injekcí do ramena. Jak se můžeme bavit o zdrojovém kódu?
To je dobrá otázka, začněme proto s malou částí celého zdrojového kódu vakcíny BioNTech/Pfizer, také známou jako BNT126b2, případně jako Tozinameran nebo Comirnaty.
Prvních 500 znaků BNT162b2 mRNA. Zdroj: Světová zdravotnická organizace
mRNA vakcína BNT162b2 má tento kód zabudovaný ve svém jádru. Kód je 4284 znaků dlouhý, takže by se dal narvat do hromady tweetů. Na samém začátku vývoje této vakcíny někdo tento kód nahrál do DNA tiskárny (ano, vážně), která tento kód následně převedla z bajtů na disku na skutečnou DNA molekulu.
DNA Tiskárna BioXp 3200
Z takového přístroje vychází malé množství DNA, které po mnoha biologických a chemických procesech skončí jako RNA (o němž si povíme později) v lahvičce s vakcínou. 30 mikrogramová dávka obsahuje 30 mikrogramů RNA. K tomu všemu je zde ještě chytře provedený lipidový (tukový) balící systém, který tuto mRNA dostane do našich buněk.
RNA je vlastně nestálá verze DNA. Můžeme ji přirovnat k pracovní paměti v PC. DNA je jako flash disk uložiště pro biologii. DNA je velmi odolná, v těle je jí nadbytek a je velmi spolehlivá. Ale podobně jako počítače nevykonají kód přímo z flash disku. Než se něco stane, kód je rychle zkopírován do rychlejší, univerzálnějšího ale zároveň křehčího systému.
Pro počítače by takový systém byla klasická paměť RAM. Pro biologii je to však RNA. Podobnost těchto systému je až pozoruhodná. Narozdíl od flash paměti však paměť RAM degraduje rychleji, pokud se s ní dobře nezachází. Důvod, proč musí být mRNA vakcína Pfizer/BioNTech skladována v těch nejmrazivějších mrazácích je tedy stejný: RNA je křehká květina.
Každý RNA znak řádově váží 0,53·10-21 gramů, což znamená, že na každou třicetigramovou vakcínu připadá 6·1016 znaků. Vyjádřeno v bajtech to dělá něco okolo 25 petabajtů. Ačkoliv je nutno dodat, že těchto 25 petabajtů je složeno ze zhruba dvou trilionů opakování těchto stejných 4284 znaků. Samotný informační obsah vakcíny má však něco přes kilobyte a SARS-CoV-2, ten “váží” okolo 7,5 kilobajtů.
Krátký úvod do pozadí
DNA je digitální kód, který narozdíl od počítačů, které využívají nuly a jedničky využívá námi popsané hodnoty A, C, G a U/T (“nukleotidy”, nebo “báze”).
V počítačích ukládáme nuly a jedničky jako znaky přítomnosti nebo absence elektrického náboje, proudu, napětí, magnetických přechodů, modulace signálu nebo změny odrazivosti. Ve zkratce, naše nuly a jedničky nejsou nějakým abstraktním konceptem – existují jako elektrony a taky v mnoha dalších fyzických formách.
V přírodě jsou hodnoty A, C, G a U/T molekulami uloženými jako řetězy DNA nebo RNA.
V počítači 8 bitů řadíme do jednoho bajtu a byte je typickou jednotkou námi zpracovávaných dat.
Příroda však řadí 3 nukleotidy do kodonu, a tento kodon je typickou jednotkou pro zpracování. Kodon obsahuje 6 bitů informací (2 bity na písmeno DNA, 3 písmena = 6 bitů. To znamená 26 = 64 různých hodnot v kodonu).
Zatím se zdá vše až moc digitální, že? Pokud máš pochyby, neváhej se mrknout na dokument WHO v angličtině, kde se můžeš podívat na digitální kód na vlastní oči.
*Další četba je dostupná zde – tento odkaz na článek v angličtině (“What is Life”) ti možná pomůže pochopit zbytek této stránky. A jestli máš rád videa, tady je pro tebe jedno dvouhodinové.
Co tedy ten kód DĚLÁ?
Základní myšlenkou vakcíny je naučit náš imunitní systém bojovat proti patogenu, aniž bychom kvůli němu onemocněli. Historicky bylo toto prováděno vpíchnutím neschopného či oslabeného viru do našeho těla s látkami, které pomáhají polekat náš imunitní systém a tím nastartovat imunitní reakci. Dalo by se říci, že toto byl rozhodně “analogový” způsob vývoje vakcíny, zahrnující miliony vajíček, či hmyzu. Zároveň hodně času a štěstí. Občas musel být pro tento účel využit i nesouvisející virus.
mRNA vakcína dosahuje tohoto samého výsledku v “učení našeho imunitního systému” skoro až s laserovou účinností – tedy přesně a účinně.
Takže, jak to funguje … Injekce obsahuje nestálý genetický materiál, který popisuje náš slavný SARS-CoV-2 “Spike” protein. Pomocí chytrých chemických prostředků vakcína dokáže tento genetický materiál dostat do některých z našich buněk.
Tyto buňky poté začnou poslušně vyrábět SARS-CoV-2 Spike protein v tak velkém množství, že náš systém začne jednat. Konfrontovaný se Spike proteinem a především i obeznámen s tím, že něco cizího převzalo kontrolu nad našimi buňkami imunitní systém vyvine účinnou reakci proti více aspektům Spike proteinu a celému reprodukčnímu procesu tohoto proteinu našimi buňkami.
A toto nás přivádí k vakcíně s 95% účinností.
Zdrojový kód!
Začněme na úplném začátku, například tady. Dokument od Světové zdravotnické organizace obsahuje tento pomocný obrázek:
Toto je jakýsi obsah. Začneme s “čepicí” (“cap”), znázorněnou kšiltovkou.
Podobně, jako nelze bez operačního kódu spustit na počítači soubor, tak i biologický “operační systém se neobejde bez “hlaviček”. Má také něco jako linkery a volací konvence.
Kód vakcíny proto začíná následující dvojící nukleotidů: GA
Toto může být slušně přirovnáno ke každému spustitelnému souboru na DOS a Windows počínaje s MZ. Anebo také k UNIXovým skriptům začínající #!. Jak v živém organismu, tak v operačním systému tyto dva znaky nejsou žádným způsobem provedeny. Jednoduše tam musí být, protože v opačném případě se nic nestane.
mRNA čepice má řadu funkcí. Jako jednu například to, že kóduje původ kódu z nuklea (jádra) buňky. V našem případě však ale toto není pravda, protože náš kód pochází z vakcinace. To ale nemusíme naší buňce říkat. Čepice náš kód udělá důvěryhodným, což ho chrání před zničením.
Počáteční dva GA nukleotidy se však také mírně chemicky liší od zbytku našeho RNA. V tomto smyslu GA lze jaksi odlišit od zbytku pásma.
Pátá nepřekládaná oblast
Trošku hatmatilky. RNA molekuly mohou být čteny pouze jedním směrem. Matoucí je, že čast, kde čtení začíná, se nazývá 5′ anebo (“five-prime”). Čtení se zastaví na 3′ (“three-prime end”).
Život je tvořen proteiny (anebo z částí vytvořených z proteinů). A tyto proteiny jsou popsány v RNA. Když se RNA přemění na protein, nazýváme takový proces (“translace”) – překlad.
Dole můžeme vidět 5′ nepřeloženou oblast (“UTR” – jako “untranslated region”), takže tenhle kousek neskončí ve výsledném proteinu.
Zde narážíme na naše první překvapení. Obyčejné RNA znaky jsou A, C, G a U. U je též známo jako ‘T’ v DNA. Ale zde nacházíme znak Ψ, copak se to děje?
To je jeden z vyjímečně chytrých kousků této vakcíny. Naše tělo má svůj vlastní účinný antivirový systém, pravděpodobně (“Ten původní antivirus”). Z tohoto důvodu naše buňky příliš nerady pracují z cizí RNA a důsledně se snaží takové RNA zničit, než udělá nějakou neplechu.
Toto je pro naši vakcínu tak trochu problém – musí obejít náš imunitní systém tak, aby si vakcíny nevšiml. Během mnoha let experimentů bylo zjištěno, že pokud je U v RNA nahrazeno mírně modifikovanou molekulou, náš imunitní systém ztrácí zájem. Je tomu tak.
A to je přesně to, co vidíme jak se děje na videu výše. Černý pásek ve spodu je RNA. Pásek, který se objevuje v zelené oblasti je formující se protein. Věci létající dovnitř a ven jsou aminokyseliny a “adaptéry”, díky kterým sedí na RNA.
Tento ribozom potřebuje fyzicky sedět na řetězci RNA, aby s ním mohl pracovat. Jakmile se usadí, může ribozom začít tvořit proteiny na základě RNA, kterou právě zpracovává. Z toho si dokážete představit, že ještě nemůže zpracovat části, na které přistál jako první. Toto je jen jedna z funkcí UTR: Přistávací plocha pro ribozom. UTR navádí …
UTR zároveň poskytuje metadata: Kdy má překlad začít? Kolik má být překladů? Pro tuto vakcínu vybrali tu nejokamžitější UTR, jakou našli, převzatou z genu alfa globinu. Tento gen je známý svou robustní schopností produkovat vysoký počet proteinů. V předešlých letech vědci dokázali optimalizovat toto UTR ještě intenzivněji (vycházíme z dokumentu WHO), takže to vlastně není až tak úplně UTR alfa globinu. Je lepší.
Signální peptid S glykoproteinu
Jak již bylo řečeno, cílem vakcíny je přinutit buňku, aby vyráběla velké množství Spike proteinu SARS-CoV-2. Do této chvíle jsme se pouze setkali s metadaty a volacími konvencemi ve zdrojovém kódu vakcíny. Nyní však vstupujeme do samotné oblasti virálního proteinu.
Stále však zbývá jedna vrstva metadat. Jakmile ribozom (z animace výše) vytvořil protein, tak tento protein musí někam jít. Toto je uchováno v Signálním peptidu S glykoproteinu (Rozšířený vedoucí sekvence).
Způsob, jakým toto zjistit je, že na začátku proteinu existuje určitý druh adresního štítku – zakódovaný jako součást samotného proteinu. V tomto konkrétním případě signální peptid říká, že tento protein by měl opustit buňku přes “endoplazmatické retikulum.” Ani hatmatilka ve Star Treku není tak půvabná jako tahle!
“Signální peptid” není přilíš dlouhý, ale když se podíváme na kód, jsou v něm rozdíly mezi RNA virovou a vakcínovou: (Všimněte si, že pro účely srovnání jsem nahradil efektní upravený Ψ klasickým znakem RNA U).
Takže, co se tu děje? RNA jsem do skupin po třech nespojil náhodou. Tři RNA znaky tvoří kodon, to už víme. A každý kodon kóduje specifickou aminokyselinu. Signální peptid ve vakcíně se skládá právě z těch samých aminokyselin jako samotný virus.
Jak je tedy možné, že jsou RNA rozdílné?
Existuje 43 = 64 různých kodonů, protože existují 4 znaky RNA a tři z nich jsou v kodonu. Přesto zde je pouze 20 různých aminokyselin. To znamená, že více kodonů kóduje stejnou aminokyselinu.
Život využívá tuto téměř univerzální tabulku pro mapování kodonů RNA na aminokyseliny:
V této tabulce vidíme, že úpravy ve vakcíně (UUU -> UUC) jsou všechny synonymické. Kód RNA vakcíny je jiný, ale vzniknou z něho stejné aminokyseliny a stejné proteiny.
Podíváme-li se pozorně, zjistíme, že většina změn nastává v třetí pozici kodonu, označeného ‘3’ výše. A pokud se podíváme na univerzální kodonovou tabulku, vidíme, že pro produkci aminokyselin třetí pozice v kodonu není rozhodující.
Změny jsou tedy synonymické, ale proč tam tedy jsou? Když se podíváme pozorně, uvidíme, že všechny změny kromě jedné vedou k více znaků C a G.
Proč se tak tedy vlastně děje? Jak již bylo zmíněno výše, náš imunitní systém bere “exogenní” kód RNA, vycházející z vně buňky, pouze letem světem. Abychom se vyhnuli detekci, znak “U” již v RNA bylo znovu nahrazeno Ψ.
Nicméně, ukázalo se, že RNA s vyšším počtem znaků G a C je přeložena na protein efektivněji.
A tohoto bylo dosaženo ve vakcínovém RNA výměnou znaků za znaky G a C kdykoliv to bylo možné.
Jsem mírně fascinován tou jednou změnou, která nevede k dalším znakům C nebo G, ta modifikace CCA -> CCU. Pokud někdo zná důvod, dejte mi prosím vědět! Berte v potaz, že vím, že některé kodony jsou běžnější než ostatní v lidském genomu, ale také jsem četl, že taková věc příliš neovlivňuje rychlost překladu.
Samotný Spike protein
Dalších 3777 znaků vakcínové RNA je podobně “kodonově optimalizováno” pro přidávání velkého počtu C a G. Pro lepší čitelnost je zde neuvedu všechny, ale rád bych se zaměřil na jednu obzvláště speciální část. Část, díky které to vše funguje; část, která nám pomůže vrátit se zpátky do života jako předtím.
Takže ve vakcíně BioNTech/Pfizer bylo každé U nahrazeno 1-methyl-3’-pseudouridylylem, označeným jako Ψ. Nejdůmyslnějším na tom je, že ačkoliv tato záměna Ψ uchová imunitní systém v klidu, je příslušnými částmi buňky přijímána jako klasické U.
V počítačové bezpečnosti je tento trik známý též – někdy je možné odeslat mírně porušenou verzi zprávy, která ošálí firewall a další bezpečnostní řešení a nakonec ji back-end servery přijmou – přičemž pak mohou být hacknuty.
Nyní však sklízíme ovoce výhod, které nám zajistil fundamentální vědecký výzkům v minulosti. Objevitelé této Ψ techniky museli bojovat, aby na svou práci dostali příslušné finance a aby jejich práce byla následně přijata. Všichni bychom měli být velice vděční a já jsem si jistý, že Nobelova cena se takovým lidem dostaví posléze.
Mnoho lidí se ptalo, zda mohou viry také použít tuto Ψ techniku na to, aby porazily naše imunitní systémy. Stručně řečeno, je to velmi nepravděpodobné. Život jednoduše nemá nástroje na výrobu 1-methyl-3′-pseudouridylyl nukleotidů. Viry se spoléhají na mechanismus života, aby se mohly reprodukovat a takové zařízení tam jednoduše není. Vakcíny mRNA v těle rychle degradují a není zde možnost Ψ-modifikované RNA replikace s Ψ stále v něm. “A ne, vakcíny mRNA opravdu neovlivní vaše DNA”. Je to taky zajímavé čtení.
OK, zpátky z 5′ UTR (“nepřeložené oblasti”). Co těchto 51 znaků dělá? Jako vše v přírodě, ne vše má vždy jasnou funkci.
Když naše buňky potřebují přeložit RNA na proteiny, tak tento proces vykonají buněčná zařízení zvaná ribozomy. Ribozom je jako 3D tiskárna na proteiny. Požije vlákno RNA a na základě něho emituje / vysílá řetězec aminokyselin, které se poté složí na protein.
Zde vidíme obvyklé synonymitické změny RNA. Například v prvním kodonu vidíme, že CUU se změnilo na CUG. To přidává další “G” do vakcíny, o čemž víme, že zlepšuje produkci proteinů. Jak CUU, tak CUG kódují aminokyselinu “L” nebo leucin, takže v proteinu se nic nemění.
Když porovnáme celý protein Spike ve vakcíně, všechny změny jsou synonymitické jako tyto. Až na dvě a ty jsou těmi, které zde nyní vidíme.
Třetí a čtvrtý kodon výše představují skutečné změny. Aminokyseliny K a V jsou obě vyměněny za “P”, nebo Prolin. Kvůli této změně byly potřebné tři změny pro (“! ! !”) pro “K” a dvě změny (“! !”) pro “V”.
A dle všeho se ukazuje, že tyto dvě změny obrovsky zvyšují účinnost této vakcíny.
Jak je toto možné? Když se podíváte na skutečnou částici viru SARS-CoV-2, můžete vidět zmíněny Spike protein stejně, jako, nuže, hromadu výběžků:
Výčnělky jsou upevněny na těle viru (“nukleokapsidový protein”). Ale jde o to, že naše vakcína generuje pouze samotné výčnělky a nepřipevňujeme je na žádný druh virového těla.
Ukázalo se, že nemodifikované, volně stojící Spike proteiny se zhroutí do jiných struktur. Pokud by byl aplikován jako vakcína, skutečně by způsobil v našem těle vývoj imunity, ale pouze proti zhroucenému Spike proteinu.
A skutečný SARS-CoV-2 se objeví se svým špičatým Spike proteinem. Vakcína by v tomto případě nefungovala velmi dobře.
Takže, co s tím udělat? V roce 2017 bylo popsáno, že správné umístění dvou záměn za Prolin ve správných pozicích dokáže udržet proteiny SARS-CoV-1 a MERS S v jejich “neposkládané” konfiguraci bez toho, aniž by byli součástí celého viru.
Ti lidé, kteří na tenhle trik přišli by si teď měli neustále dávat high-five a nechat ze sebe vycházet nesnesitelné množství samolibosti. A to vše zcela zaslouženě!
Update! Byl jsem kontaktován laboratoří McLellan, jednou ze skupin, které stojí za tím objevem s Prolinem. Řekli mi, že high-fivování je utlumeno kvůli probíhající pandemii, ale jsou potěšeni, že mohli přispět k vývoji vakcín. Zároveň také zdůrazňují práci mnoha dalších skupin, pracovníků a dobrovolníků.
Konec proteinu, další kroky
Pokud si projdeme zbytek zdrojového kódu, narazíme na malé úpravy ke konci Spike proteinu.
Na konci proteinu najdeme “stop” kodon, zde označený malým písmenem “s”. Toto je zdvořilý způsob, jak říci, že by zde měl protein končit. Původní virus využívá stop kodon UAA, vakcína používá dva stop kodony UGA, snad jen pro dobrou míru.
3′ nepřekládaná oblast
Stejně jako ribozom potřeboval nějakou navigaci na 5′ konci, kde jsme nalezli “5′ nepřekládanou oblast” (“UTR”), na konci kódujícího proteinu nacházíme podobný konstrukt zvaný 3′ UTR.
Našlo by se mnoho způsobů, jak něco napsat o 3′ UTR, ale zde budu citovat, co říká Wikipedie:
3′ nepřekladaná oblast hraje klíčovou roli v genovém vyjádření kvůli svému vlivu na účinnost lokalizace, stability, exportování a překladu mRNA … navzdory našemu součásnému pozorumění je však pro nás 3′ UTR stále relativně záhadou.
Víme však, že určité 3′ UTR jsou velmi úspěšné při propagaci proteinové exprese. Podle dokumentu WHO, byla 3′ UTR v BioNTech/Pfizer vakcíně vybraná z “mRNA amino-terminal enhancer of split (AES) a mitochondriální kódované 12S ribozomové RNA na dosáhnutí stability RNA a celkové výši proteinové exprese.” K čemuž mohu pouze dodat, skvělá práce.
AAAAAAAAAAAAAAAAAAAAAA nakonec všeho
Samotný konec mRNA je polyadenylovaný. To je hodně nóbl způsob, jak říct, že to končí s hodně AAAAAAAAAAAAAAAAAAA. Dokonce i mRNA má toho v roce 2020 už dost, zdá se.
mRNA může být využita mnohokrát, ale jakmile se je použita, tak se ztratí některé A na konci. A jakmile mRNA tato A dojdou, je již nepoužitelné a je vyloučeno. Tímto způsobem je vlastně mnoho-Ačkový ocas vlastně ochranou proti degradaci.
Byly provedeny studie, aby se zjistilo, jaký je optimální počet A na konci pro mRNA vakcíny. V otevřené literatuře jsem se dočetl, že taková hodnota dosáhla až 120 nebo tak nějak.
Vakcína BNT162b2 končí takto:
****** **** UAGCAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAGCAUAU GACUAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA
To je 30 A, pak “10 nukleotidový linker” (GCAUAUGACU), za ním následuje dalších 70 A.
Mám podezření, že to, co zde vidíme, je výsledkem další optimalizace pro ještě větší zvýšení exprese proteinů.
Shrnutí
S tímto nyní známe přesný obsah mRNA vakcíny BNT162b2 a pro většinu částí chápeme, proč tam jsou:
- (“CAP”) nebo čepice zajišťuje, že RNA vypadá jako běžná mRNA
- Známá úspěšná a optimalizovaná 5′ nepřekládaná oblast (UTR)
- Kodonově optimalizovaný signální peptid, který posílá Spike protein na správné místo (100% zkopírováno z původního viru)
- Kodonově optimalizovaná verze původního výčnělku se dvěma substitucemi ‘Prolinu’, aby se zajistilo, že se protein objeví ve správné formě
- Známá úspěšná a optimalizovaná 3′ nepřekládaná oblast
- Trochu záhadný mnoho-Ačkový ocas s nevysvětlitelným „linkerem“
Optimalizace kodonů přidává do mRNA hodně G a C. Mezitím pomocí Ψ (1-methyl-3′-pseudouridylyl) namísto U pomáháme vákcíně se vyhnout se našemu imunitnímu systému, takže mRNA zůstává v těle dostatečně dlouho, tak abychom mohli skutečně pomoci trénovat náš imunitní systém. https://benedikz.space/articles/reverse-engineering-zdrojoveho-kodu-vakciny-biontech-pfizer.html