6.1 – Struktur og funktion af det genetiske materiale

Genetik er videnskaben om arvelighed. Det omfatter studiet af gener: hvordan de bærer information, hvordan de kopieres og videregives til efterfølgende generationer af celler eller mellem organismer og hvordan deres information inden for en organisme bestemmer dens karakteristika. Den genetiske information i en celle kaldes genomet. En celles genom omfatter dens kromosomer og plasmider. Kromosomer er strukturer, der indeholder DNA og som fysisk bærer arvelig information; kromosomerne indeholder generne. Gener er segmenter af DNA (undtagen i nogle vira, hvor de er fremstillet af RNA), som koder for funktionelle produkter. Normalt er disse produkter proteiner, men det kan også være RNA (ribosomalt RNA, transfer-RNA eller mikro-RNA).

DNA er et makromolekyle sammensat af gentagne enheder kaldet nukleotider. Hvert nukleotid består af en nukleobase (adenin, thymin, cytosin eller guanin), deoxyribose (et pentosesukker) og en phosphatgruppe. DNA’et i en celle, eksisterer som lange strenge af nukleotider, snoet sammen i par, til dannelsen af en dobbeltspiral. Hver streng består af skiftevis en sukkergruppe og en phosphatgruppe (sin sukker-phosphat rygrad) og en nitrogenholdig base bundet til sukkermolekylet i rygraden. De to strenge holdes sammen af hydrogenbindinger, mellem deres nitrogenholdige baser. Disse basepar, forekommer altid på en bestemt måde: adenin danner altid par med thymin og cytosin danner altid par med guanin. På grund af denne særlige baseparring, kan man ud fra basesekvensen af en DNA-streng bestemme basesekvensen af den anden streng. De to DNA-strenge er således komplementære.

Strukturen af DNA hjælper med at forklare to primære karakteristika ved biologisk informationsopbevaring. For det første, genetisk information, er koden af rækkefølgen af baser langs en streng af DNA, på samme måde som vores skriftsprog anvender en lineær rækkefølge af bogstaver for at danne ord og sætninger. Det genetiske sprog, benytter dog et alfabet med kun fire bogstaver – de fire slags nukleotidbaser i DNA (eller RNA). Men 1.000 af disse fire baser, der er antallet af nukleotidbaser der koder for et gennemsnitsstørrelses protein, kan arrangeres på 41.000 forskellige måder. Dette store tal, forklarer hvordan gener kan varieres nok til at give alle de oplysninger, en celle der skal vokse og udføre sine opgaver, har brug for. Den genetiske kode, det sæt af regler, der bestemmer hvordan en nukleotidsekvens omdannes til aminosyresekvensen for et protein, beskrives mere detaljeret senere i denne del.

For det andet, muliggør den komplementære struktur, den præcise gentagelse af DNA under celledeling. Hver ny celle modtager en af de oprindelige strenge DNA fra modercellen, hvilket sikrer en streng der fungerer korrekt.

Meget af den cellulære metabolisme, handler om at oversætte det genetiske budskab fra gener, til specifikke proteiner. Et gen, koder normalt for et messenger-RNA (mRNA) molekyle, som i sidste ende resulterer i dannelsen af et protein. Når det endelige molekyle, for hvilket et gen koder for, er produceret (et protein for eksempel), siger man, at genet er blevet udtrykt. Strømmen af den genetiske information, kan vises som strømmen fra DNA til RNA til protein som følger:

Denne teori blev kaldet det centrale dogme af Francis Crick i 1956, da han første gang foreslog, at sekvensen af nukleotider i DNA bestemmer sekvensen af aminosyrer i et protein.

6.1.1 Genotyper og fænotyper

Genotypen for en organisme er dens genetiske informations sammensætning – hele dens DNA – som koder for alle de særlige træk ved organismen. Genotypen repræsenterer potentielle egenskaber, men ikke egenskaberne selv. Fænotype refererer til de faktisk udtrykte egenskaber, som for eksempel en organismes evne til at udføre en bestemt kemisk reaktion. Fænotypen er altså manifestationen af genotypen.

I en vis forstand, er en organismes fænotype, den samling af proteiner, fordi de fleste af en celles egenskaber stammer fra den struktur og funktion som proteinerne har. I mikroorganismer er de fleste proteiner enten enzymatiske (de katalyserer bestemte funktioner) eller strukturelle (de deltager i store funktionelle komplekser, som for eksempel membraner eller flageller). Selv fænotyper der er afhængige af strukturelle makromolekyler, som for eksempel lipider eller polysaccharider, baserer sig indirekte på proteiner. For eksempel, resulterer strukturen af en kompleks lipid eller polysaccharid, fra katalytiske aktiviteter af enzymer der syntetiserer, bearbejder og nedbryder disse molekyler. Således, er det at sige at fænotyper skyldes proteiner, en nyttig forenkling af virkeligheden.

6.1.2 DNA og kromosomer

Bakterier har typisk et cirkulært kromosom, bestående af et enkelt cirkulært DNA molekyle med associerede proteiner. Kromosomet er snoet og pakket og er fastgjort til et eller flere punkter på plasmamembranen. DNA’et for E. coli indeholder omkring 4,6 millioner basepar og er omkring 1 mm langt, cirka 1.000 gange længere end hele cellen selv. Se figur 6.1.2.1. Imidlertid, fylder kromosomet kun 10% af cellens volumen, fordi DNA’et er snoet eller supersnoet.

Hele genomet består ikke af ryg-mod-ryg gener. Regioner der ikke koder for noget, kaldet korte tendemgentagelser (engelsk short tandem repeats eller STRs) forekommer i de fleste genomer, inklusiv E. coli genomet. STRs er gentagne sekvenser på to til fem basesekvenser. Disse bruges i teknikken, der kaldes DNA-fingeraftryk.

I dag, kan den fuldstændige basesekvens af kromosomer bestemmes. Computere bruges til at søge efter åbne læserammer, det vil sige regioner af DNA, der sandsynligvis koder for et protein. Som vi vil gennemgå senere, ligger disse basesekvenser mellem start- og stopkodoner. Sekvensering og molekylær karakteristik af genomer, kaldes genomik.

6.1.3 Strømmen af genetisk information

DNA-replikation muliggør strømmen af genetisk information, fra den ene generation til den næste. Dette kaldes vertikal gen-overførsel. Som vist i figur 6.1.3.1, replikeres DNA’et inden celledeling, således at hver dattercelle modtager et kromosom der er identisk med modercellens. Inde i enhver metaboliserende celle, strømmer den genetiske information indeholdt i DNA’en, også på en anden måde; Det transskriberes til mRNA og oversættes herefter til et protein. Processerne i transskription og translation beskrives senere i denne del.

Figur 6.1.3.1 – Strømmen af genetisk information

6.1.4 DNA replikering

I DNA-replikation, er et dobbeltstrenget forældre DNA-molekyle, konverteret til to identiske dattermolekyler. Den komplementære struktur af de nitrogenholdige basesekvenser i DNA-molekylet, er nøglen til at forstå DNA-replikation. Fordi baserne langs de to strenge det dobbeltstrengede, spiralformede DNA er komplementære, kan en streng fungere som en skabelon til fremstilling af den anden streng. Se figur 6.1.4.1 (a).

DNA-replikation kræver tilstedeværelsen af flere cellulære proteiner, som styrer en bestemt sekvens af begivenheder. Enzymer der er involveret i DNA-replikation og andre processer er anført i tabel 6.1.4.1. Når replikeringen begynder, er det afslappes det supersnoede DNA af tpopisomerase eller gyrase. De to strenge af forældre DNA udrulles af helicase og skilles fra hinanden i så segmenter ad gangen. Frie nukleotider, der er til stede i cellens cytoplasma, matches op med de eksponerede baser af den enkelt strengede forældre DNA. Hvor thymin er til stede på den oprindelige streng, er det kun adenin der kan passe på pladsen i den nye streng; hvor guanin er til stede på den oprindelige streng, er det kun cytosin der kan passe på pladsen i den nye streng. Eventuelle baser, der fejlagtigt er baseparret, fjernes og erstattes med de korrekte af replikeringsenzymer. Når det er rettet, bliver den nyligt tilføjede nukleotid forbundet til forældre DNA-strengen af et enzym der hedder DNA-polymerase. Herefter udrulles forældre DNA’et et stykke yderligere, der muliggør tilføjelsen af de næste nukleotider. Det punkt hvor replikeringen finder sted, kaldes replikeringsgaflen. Som replikeringsgaflen, bevæger sig langs forældre DNA’et, forbinder hver af de udrullede enkeltstrenge sig med nye nukleotider. Den oprindelige streng og den nyligt dannede streng, vikles herefter sammen igen. Fordi hver af de nye dobbeltstrengede DNA-molekyler indeholder en original (konservativ)streng og en ny streng, er processen med replikation benævnt som semikonservativ replikering.

Figur 6.1.4.1 – DNA replikering

Inden vi ser på DNA-replikationen i flere detaljer, lad os først se på strukturen af DNA. Det er vigtigt at forstå, at de parrede DNA-strenge er orienteret modsat i forhold til hinanden. Kulstofatomerne i sukkerkomponenterne af hvert nukleotid er nummereret 1’ (udtales ”en primer”) til 5’. For at de parrede baser kan være ved siden af hinanden, er sukkerkomponenterne på en streng på hovedet i forhold til den anden streng. Enden med hydroxylgruppen som er bundet til det 3 kulstofatom, kaldes den 3’ ende af DNA-strengen; enden der har en phosphatgruppe bundet til det 5 kulstofatom, kaldes den 5’ ende. Måden hvorpå de to strenge passer sammen, dikterer at 5 à 3 retningen af den ene streng, løber modsat af 5 à 3 retningen af den anden streng. Se figur 6.1.4.1 (b). Denne struktur af DNA, påvirker replikeringsprocessen, fordi DNA-polymerase kan kun tilføje nye nukleotider til den 3’ ende. Derfor skal, mens replikeringsgaflen bevæger sig langs forældre DNA-strengen, de to nye strenge bygges i forskellige retninger.

DNA-replikering kræver en stor mængde energi. Energien leveres af nukleotider, som faktisk er nukleosidphosphater. Vi kender allerede ATP; den eneste forskel mellem ATP og adeninnukleotid i DNA er sukkerkomponenten. Deoxyribose er sukkeret i nukleosiderne anvendt til syntese af DNA og nukleosidtriphosphater med ribose anvendes til at syntetisere RNA. To phosphatgrupper fjernes, for at tilføje en nukleotid til en voksende DNA-streng; hydrolyse af nukleotidet er eksergonisk og giver energi til at lave de nye bindinger i DNA-strengen. Se figur 6.1.4.2.

Figur 6.1.4.2 – Tilføjelse af nukleotid til DNA

Figur 6.1.4.3 giver flere detaljer om de mange trin, der indgår i denne komplekse proces.

Figur 5.1.4.3 – Resumé af begivenhederne ved DNA-replikeringsgaflen

DNA replikation i nogle bakterier, som for eksempel E. coli, går bidirektionelt rundt om kromosomet. Se figur 6.1.4.4. To replikeringsgafler, bevæger sig i modsatte retninger fra replikeringsstartpunktet. Fordi det bakterielle kromosom er et lukket kredsløb, mødes de to replikeringsgafler når replikeringen afsluttes. De to sløjfer, adskilles af topoisomerase. Mange beviser antyder en sammenhæng mellem den bakterielle plasmamembran og replikeringsstartpunktet. Efter duplikering, hvis kopierne binder sig til hver sin ende af cellen, vil begge søsterceller få et identisk kopi af DNA-molekylet ved deling, det vil sige et komplet kromosom.

DNA-replikering er en utrolig præcis proces. Typisk laves der kun fejl ved 1 ud af 10 milliarder baser der indarbejdes. En sådan præcision, skyldes i høj grad den korrekturlæsningsevne DNA-polymerase har. Som hver ny base tilføjes, vurderer enzymet hvorvidt det er en korrekt komplementær baseparring. Hvis ikke, fjerner enzymet den forkerte base og erstatter den med den korrekte. På denne måde, kan DNA replikeres meget nøjagtigt, så hvert datter-kromosom er næsten identisk med forældre-DNA’et.

Figur 6.1.4.4 – Replikering af bakteriel DNA ved bidirektionel replikering

6.1.5 RNA og proteinsyntese

Hvordan anvendes informationen i DNA til at fremstille proteiner, der styrer celleaktiviteter? I processen med transskription, kopieres genetisk information i DNA’et, eller transskriberes, til en komplementær basesekvens af RNA. Cellen anvender der på denne information kodet i RNA’et til at syntetisere specifikke proteiner, ved en proces kaldet translation. Vi skal nu kigge nærmere på disse to processer, som de forekommer i bakterieceller.

Transskription i prokaryoter
Transskription er syntesen af en komplementær streng af RNA fra en DNA-skabelon. Vi vil her behandle transskription i prokaryote celler.

Ribosomalt RNA (rRNA) udgør en integreret del af ribosomer, det cellulære maskineri til proteinsyntese. Transfer-RNA er også involveret i proteinsyntesen, som vi vil se. Messenger RNA (mRNA) bærer den kodede information til fremstilling af specifikke proteiner fra DNA til ribosomerne, hvor proteinerne syntetiseres.

Under transskription, syntetiseres en streng af mRNA ved anvendelse af en bestemt del af cellens DNA som skabelon. Med andre ord er den genetisk information lagret i sekvensen af nitrogenholdige baser i DNA, der omskrives således at den samme information vises i basesekvensen af mRNA.

Som i DNA-replikering, dikterer en guanin (G) en cytosin (C) i mRNA’et der fremstilles og et C i DNA’et dikterer et G i mRNA’et. Ligeledes dikterer en thymin (T) i DNA skabelonen en adenin (A) i mRNA’et. Men en adenin i DNA’et, dikterer en uracil (U) i mRNA’et, fordi mRNA indeholder uracil i stedet for thymin (uracil har en kemisk struktur der er en anelse forskellig fra thymin, men det baseparres på samme måde). Hvis for eksempel skabelondelen af DNA’et har basesekvensen 3’-ATGCAT, vil den nysyntetiserede mRNA-streng have den komplementære basesekvens 5’-UACGUA.

Processen med transskription, kræver både et enzym kaldet RNA polymerase og en forsyning af RNA nukleotider (se figur 6.1.5.1). Transskriptionen begynder, når RNA polymerase bindes til DNA på et sted kaldet promotoren. Kun en af de to DNA-strenge tjener som skabelon for RNA syntese for et givent gen. Ligesom DNA, syntetiseres RNA i 5’ à 3’ retning. RNA syntesen fortsætter indtil RNA polymerasen når et sted på DNA der kaldes terminatoren.

Figur 6.1.5.1 – Transskriptionsprocessen i prokaryote celler

Transskription, tillader cellen af fremstille kortsigtede kopier af gener, der så kan anvendes som direkte kilde ved proteinsyntesen. mRNA fungerer som mellemprodukt mellem den permanente lagerform der er DNA og den proces (translation) der bruger informationen.

Translation
Vi har set hvordan den genetiske information i DNA, overføres til ,RNA under transskription. Nu vil vi se på, hvordan mRNA fungerer som informationskulde for syntesen af proteiner. Proteinsyntesen kaldes translation, fordi den indebærer at afkode nukleinsyrernes ”sprog” og omdanne det til proteinernes ”sprog”.

mRNA’s sprog, er i form af codoner, grupper af tre nukleotider, som for eksempel AUG, GGC eller AAA. Sekvensen af codonerne på et mRNA molekyle bestemmer sekvensen af aminosyrer, der vil være i proteinet der syntetiseres. Hvert codon ”koder” for en bestemt aminosyre. Dette er den genetiske kode. Se tabel 6.1.5.1.

Figur 6.1.5.1 – Den genetiske kode

Codoner er skrevet i form af deres basesekvens i mRNA. Bemærk at der i tabel 6.1.5.1 er 64 mulige codoner, men kun 20 aminosyrer. Det betyder, at de fleste aminosyrer signaleres af flere alternative codoner. Dette er en situation benævnt som degeneration af koden. For eksempel har leucin 6 codoner og alanin 4 codoner. Degeneration giver mulighed for en vis mængde fejllæsninger eller mutation i DNA’et, uden at påvirke det protein der i sidste ende fremstilles.

Af de 64 codoner, er de 61 såkaldte fornufts-codoner og 3 er stop-codoner. Fornufts-codoner koder for aminosyrer og stop-codoner gør ikke. Stop-codonerne signalerer snarer afslutningen af proteinmolekylets syntese – Det er UAA, UAG og UGA. Start-codonen, der initierer syntesen af proteinmolekylet er AUG, der også er codonen for methionin. I bakterier, koder start-codonen AUG for formylmethionin, snarere end for methionin der findes i andre dele af proteinet. Det initierende methionin, fjernes ofte senere, så ikke alle proteiner indeholder methionin.

Under translationen, ”læses” codonerne på et mRNA molekyle sekventielt; og som svar på hver codon, bliver den tilsvarende aminosyre samlet til en voksende kæde. Stedet for translationen er ribosomet og transfer RNA (tRNA) molekyler, både genkender de forskellige codoner og transporterer de korrekte aminosyrer.

Hvert tRNA molekyle har en anticodon, en sekvens af tre baser, der er komplementær til en codon. På denne måde kan tRNA molekylet baseparre sig med dets tilhørende codon. Hvert tRNA molekyle kan også i sin anden ende, bære aminosyren, som codonet tRNA’et genkender koder for. Funktionen af ribosomet, er at lede en velordnet kæde af tRNA’er til codonerne og at samle aminosyrerne til en kæde, der kommer til at udgøre proteinet i sidste ende.

Figur 6.1.5.2 viser detaljerne i translation. De to ribosomale underenheder, et tRNA med anticodonet AUC og mRNA molekylet der skal oversættes, sammen med adskillige andre proteinfaktorer, der samles. Dette opstiller start-codonet (AUG) i den rette position og tillader translationen at begynde. Efter ribosomet forbinder de to første aminosyrer med en peptidbinding, forlader et første tRNA molekyle ribosomet. Ribosomet bevæger sig herefter langs mRNA’et til den næste codon. Som de korrekte aminosyrer bringes på linje en efter en, dannes peptidbindingerne mellem dem og en polypeptidkæde dannes. Translationen afsluttes, når en af de tre stop-codoner i mRNA er nået. Ribosomet deler sig så i sine to underenheder og mRNA’et og den dannede polypeptidkæde frigives. Ribosomet, mRNA’et og tRNA’et er så tilgængelige til at blive brugt igen.

Ribosomet bevæger sig i 5’ à 3’ retningen. Som et ribosom bevæget sig langs mRNA’et, vil start-codonet snart blive fritlagt igen. Yderligere ribosomer kan herefter samles og begynde at syntetisere proteinet. På denne måde er en række af ribosomer ofte bundet til et enkelt mRNA, alle i forskellige stadier i proteinsyntesen. I prokaryote celler, kan translationen af mRNA begynde, selv før transskriptionen er færdig, se figur 6.1.5.3. Fordi mRNA produceres i cytoplasmaet i prokaryoter, er start-codonerne for et mRNA der transskriberes, tilgængelige for ribosomer før hele mRNA molekylet er færdiggjort.



Figur 6.1.5.2 – Translationsprocessen
Figur 6.1.5.3 – Simultan transskription og translation i bakterier

Transskription i Eukaryoter
I eukaryote celler, finder transskription sted i kernen. mRNA skal være helt syntetiseret og føres gennem kernemembranen til cytoplasmaet, før transskription kan begynde. Derudover undergår RNA en forarbejdning før det forlader kernen. I eukaryote celler, er regionerne af gener der koder for proteiner, ofte afbrudt af DNA der ikke koder for noget. Således er eukaryote gener sammensat af exoner, de områder af DNA der koder for proteiner og introner, der er de mellemliggende områder der ikke koder for noget. I kernen producerer et molekyle kaldet RNA polymerase, et RNA transskript, som indeholder kopierne af intronerne. Partikler kaldet små nukleare ribonucleoproteiner, forkortet snRNP’s og udtales ”snurps”, fjerner intronerne og splejser extronerne sammen. I nogle organismer, fungerer intronerne som ribozymer der katalyserer deres egen fjernelse. Se figur 6.1.5.4.

Figur 6.1.5.4 – RNA bearbejdning i eukaryote celler

 

Som opsummering, er gener de biologiske enheder af information, der koder for sekvensen af nukleotidbaser i DNA’et. Et gen udtrykkes, eller omdannes til et produkt i cellen gennem de processer der kaldes transskription og translation. Den genetiske information der bæres i DNA, overføres til et midlertidigt mRNA molekyle ved transskription. Derefter, under translationen, dirigerer mRNA samlingen af aminosyrer til en polypeptidkæde: et ribosom aflæser mRNA’et og får tRNA til at levere aminosyrer til ribosomet som anvist af mRNA’ets codonsekvenser og ribosomet samler herefter aminosyrerne i kæder, der ender med at blive til det syntetiserede protein.

6.2 – Regulering af bakteriel genskspression →