ELI5: proteiner, struktur, sekvens
Eller, kanske inte som att jag är fem. Men jag har börjat läsa lite om proteiner och olika problem relaterat till detta som jag inte förstår. Främst är det att jag har förstått att ett protein består av en sekvens av aminosyror. Sedan har jag läst om ett problem som innebär att man, givet en proteinstruktur (koordinater för individuella atomer), försöker förutsäga vilken aminosyrasekvens som viker sig på det sättet som strukturen man har.
I mitt huvud känns det dock närmast trivialt, hur man kan bara inte titta på strukturen, se vilka aminosyror som sitter där och sedan skriva ned sekvensen?
(Som sagt, jag har 0 kunskap om proteiner och är inte speciellt bra på kemi i allmänhet)
Hondel skrev:Eller, kanske inte som att jag är fem. Men jag har börjat läsa lite om proteiner och olika problem relaterat till detta som jag inte förstår. Främst är det att jag har förstått att ett protein består av en sekvens av aminosyror. Sedan har jag läst om ett problem som innebär att man, givet en proteinstruktur (koordinater för individuella atomer), försöker förutsäga vilken aminosyrasekvens som viker sig på det sättet som strukturen man har.
I mitt huvud känns det dock närmast trivialt, hur man kan bara inte titta på strukturen, se vilka aminosyror som sitter där och sedan skriva ned sekvensen?
(Som sagt, jag har 0 kunskap om proteiner och är inte speciellt bra på kemi i allmänhet)
Jovisst, men det går att vrida och vända på den långa aminosyra-kedjan på många olika sätt, och det är bara ett enda sätt som får proteinet att fungera som det skall.
I vilken ordning de olika aminosyrorna kommer kallas proteinets primärstruktur. Hur kedjan vrider och vänder sig kallas sekundärstruktur, och dessutom finns det två nivåer till.
Ja har du en modell av strukturen, som bestämts från experimentellt data, och är av tillräckligt hög kvalité, så visst går det att "läsa av sekvensen". Det är tämligen trivialt, du utgår i det fallet ifrån "facit" och bara läser av.
Men kruxet kommer när du vill försöka göra det tvärt om, att lista ut hur säg 600 aminosyror i en känd sekvens kommer att ordna sig och bilda en proteinstruktur. 600 aminosyror motsvarar ca 9000 atomer, och är ungefär så stort som proteinet albumin är (som vi har massvis av i blodet). Var och en av de 9000 atomerna påverkar sin direkta omgivning, säg allt inom en radie på 2.5-4 Å. Men eftersom atomerna även är del av större enheter (aminosyrorna) kommer dessa enheter att även påverka(s) som just en enhet. Och enheterna interagerar med sin direkta omgivning, men även via andra aminosyror, med effekter på aminosyror långt längre bort. Vissa av aminosyraresterna bildar sekundärstrukturelement (t.ex. alfahelix/betasträng), som håller ihop och påverka(s) av andra sekundärstrukturelement, och bygger tillsammans upp större enheter (domäner), vilka i sin tur påverka(s) av andra motsvarande enheter.
Så på sätt och vis påverkar varje aminosyrarest, och varje atom, alla andra inom proteinet, men med olika styrka. Det blir motsvarande ett nätverk av svaga till starka interaktioner, där vissa sträcker sig en kort bit, medans andra interaktioner sträcker sig (in)direkt över hela proteinets struktur. Det blir m.a.o. en vektor för varje atom - till varje annan atom, och dessa vektorers längd är alla individuella och samtidigt dynamiska. En atom i en alfahelix påverkas mest av de närmast liggande atomerna, men summavektorn för atomens rörelse sammanfaller med de andra atomernas vektorer i en gemensam rörelse för hela helixen. Så utan att ta med samtliga vektorer inom helixen, kan inte vektorn för en enskild atom i helixen beskrivas korrekt, det till att vikta bidraget från de andra atomernas vektorer, för att kunna beskriva den enskilda atomens vektor. Och vice versa, den enskilda atomens vektor, påverkar de andras vektorer.
Just dynamiken hos proteiner, är en central faktor att ha i åtanke i samband med proteinstrukturer. Oftast presenteras en modell (motsvarande en .pdb fil) för ett proteins struktur, vid ett tillstånd (visst pH, temperatur, tillsammans med en faktor etcetera). Men denna modell, är just det en enda modell, som representerar proteinets struktur vid ett tillstånd. Men strukturen är inte statisk motsvarande ett motorblock, utan proteinets atomer har hela tiden en oscillation, de vibrerar - vilket påverkar vektorerna jag nämnde tidigare, hos atomernas och t.ex. helixarna.
De flesta av dessa oscillationer är små, och atomen rör sig tidsmässigt runt ett och samma masscentrum, men ett kluster av dessa oscillationer kan tillsammans påverka ett annat kluster av atomer, med resultatet att proteinets struktur ändras en aning - det kanske öppnar upp sig lite i en del, så att något kan binda dit. Men det finns teoretiskt ett tillstånd där energin är lägst, och det är mot detta tillstånd som strukturen rör sig mot/från hela tiden, och det anses vara drivkraften för hur/att proteiner veckas rätt (oftast och till slut).
Så en struktur motsvarar ett enda tillstånd, av massvis av tillstånd som proteinet hela tiden rör sig mellan. Sedan kan strukturen förändras rejält, varpå proteinets funktion även påverkas - men det är likväl en struktur, som kan studsa tillbaka till något närmare "normalfallet" eller gegga ihop helt och vara bortom räddning. Dock är en strukturmodell ofta tillräcklig för att beskriva/besvara många av de frågor som väcks, eller för att ge uppslag för vidare experiment in vitro / in silico i syfte att bekräfta/falsifiera en hypotes.
Ibland används "struktur" synonymt med "modell", men modellen är i princip en avbildning av strukturen, och det finns begränsningar i hur exakt denna modell är - just eftersom det inte går att få en perfekt avbildning av strukturen rent experimentellt. Det går att få väldigt bra strukturmodeller från experimentellt data, men precis som i vilken metod som helst finns det begränsningar.
De experimentella strukturerna, är på ett fundamentalt plan olika de modeller som "modelleras fram" med MD eller liknande. Viss risk för begreppsförvirring mellan modell (från experimentella observationer) och modell som genererats med mjukvara. Att det är en skillnad låter helt uppenbart när man säger/skriver det - men endast den ena är en avbildning av ett fysisk/reellt objekt, den andra är en förutsägelse av hur objektet kan se ut. Båda metoderna har dock sina egna fördelar och begränsningar. Och för att skapa förutsägelsen har inspiration tagits ifrån experimentella strukturer så klart, men det är långt ifrån trivialt att förutse en struktur av ett protein.