Hoe machine learning de mysteries van eiwitten ontvouwt

Het begrijpen van eiwitten – zoals het spike-eiwit van het coronavirus – is superbelangrijk voor de studie van ziekten en de ontwikkeling van medicijnen en vaccins.

Er is dus veel opwinding over de AlphaFold Protein Structure Database, gebouwd door het kunstmatige-intelligentielab DeepMind met het European Molecular Biology Laboratory. Onderzoekers daar hebben machine learning gebruikt om meer dan 200 miljoen eiwitstructuren van allerlei organismen te voorspellen en in kaart te brengen.

Meghan McCarty-Carino van “Marketplace Tech” sprak met Matthew Higgins, hoogleraar moleculaire parasitologie aan de Universiteit van Oxford. Hij bestudeert malariaparasieten voor een potentieel vaccin, en hij zei dat de database dat werk heeft versneld.

Het volgende is een bewerkte transcriptie van hun gesprek.

Matthew Higgins: Dus machine learning begint met alle eiwitstructuren die al bekend zijn, en leert vervolgens van die eiwitstructuren. Het kijkt naar hoe eiwitmoleculen opvouwen om te voorspellen hoe eiwitten, waarvan we de structuur niet kennen, ook hoe ze vouwen. En dit is echt handig. Er zijn twee hoofdmethoden waarmee we de structuur van een eiwit kunnen bepalen. En een daarvan wordt de elektronenmicroscopiemethode genoemd. Het kan ons een nogal wazig beeld geven. En toch kunnen we de voorspelde structuur van een machine learning-benadering nemen en deze in die vage weergave plaatsen, zien hoe goed deze twee bij elkaar passen, en dat kan ons in staat stellen een veel scherpere en veel gedetailleerdere kaart te genereren.

Meghan McCarty-Carino: Hoe heeft deze machine learning-eiwitdatabase u geholpen bij uw werk aan het molecuul van de malariaparasiet?

Foto aan de voorkant van professor Matthew Higgins van de Universiteit van Oxford
Matthew Higgins (met dank aan de Universiteit van Oxford)

Higgins: Ja absoluut. We werken al een aantal jaren aan een bepaald molecuul. En we vinden het heel moeilijk om de structuur uit te werken. De postdoctoraal onderzoeker in mijn lab bonkte echt met haar hoofd tegen de muur om erachter te komen hoe dit moest. En toen kwam de AlphaFold-database. En plotseling zag ze een geweldige overeenkomst tussen het gedetailleerde AlphaFold-model en het vage beeld dat we kregen van onze experimentele informatie, en ze kon ze samenvoegen. En ze begreep meteen hoe dit molecuul werkte en zijn structuur en architectuur. Het heeft ons dus echt geholpen om dat project te versnellen en direct door te gaan naar de volgende fase van het project, namelijk het testen van hun vermogen als vaccins in dit soort preklinische tests. En ik weet van collega’s over de hele wereld dat AlphaFold hen echt helpt om dit soort projecten heel snel vooruit te helpen, om ervoor te zorgen dat ze door kunnen gaan naar de volgende fase, namelijk het testen van dingen als vaccins of het ontwerpen van medicijnen.

McCarty-Carino: Deze AlphaFold-database is dus ook toegankelijk voor het publiek. Ik bedoel, wat is daar de betekenis van, vooral voor onderzoekers zoals jij?

Higgins: Het is dus waardevol voor het soort werk dat we doen. Maar het is ook bijzonder waardevol voor mensen die grootschalige vergelijkende studies doen. Laten we zeggen dat je een bepaald molecuul van een bacterie wilt aanvallen met een medicijn en het menselijk lichaam heeft een soortgelijk uitziend molecuul. U kunt zien hoe vergelijkbaar het is en op welke manieren het vergelijkbaar of verschillend is door deze modellen te vergelijken. En dat stelt u in staat om bijvoorbeeld uit te werken hoe u uw medicijnmolecuul zou veranderen, zodat het niet bindt aan het menselijke enzym, het bindt zich alleen aan het bacteriële enzym, waardoor de kans op off-target effecten van uw medicijnmoleculen wordt verkleind. .

McCarty-Carino: En zou je verwachten dat deze database een soort tijdperk van versnelde vooruitgang in de bredere biotechsector inluidt?

Higgins: Ja absoluut. Ik bedoel, biotechbedrijven gebruiken al vele jaren of decennia structurele informatie om medicijnmoleculen te ontwerpen. Ik bedoel, het andere dat een enorme kracht is van deze diepgaande leerbenaderingen, is dat je eiwitten helemaal opnieuw maakt. Je zou bijvoorbeeld een enzym kunnen ontwerpen dat plastic afbreekt of een afvalproduct verwijdert met de AlphaFold-modellen in de eiwitvoorspellingen.

Higgins vertelde me dat het doorzoeken van de database in feite hetzelfde is als het doen van een Google-zoekopdracht. En ik moet er rekening mee houden dat het AI-bedrijf dat het heeft ontwikkeld – DeepMind – een dochteronderneming is van het moederbedrijf van Google, Alphabet.

AlphaFold is niet het enige machine learning-programma dat wordt gebruikt om deze eiwitstructuren te voorspellen. Wetenschappers van de Universiteit van Washington hebben hun eigen tool RoseTTAFold gemaakt, die naar eigen zeggen de structuur van een eiwit kan voorspellen “in slechts tien minuten op een enkele spelcomputer”.

Mogelijk ziet u het “vouw” -thema in de naamgeving. Dat komt omdat de keten van aminozuren waaruit eiwitten bestaan, vouwt, soms een beetje als een Slinky, waardoor eiwitten hun structuur krijgen.

En ik zei al eerder, een eiwit dat we allemaal kennen en waar we niet van houden, is het spike-eiwit van het coronavirus. Wetenschappers van de Universiteit van Californië, San Francisco, hebben een werkdocument uitgebracht over hoe ze de AlphaFold-database hebben gebruikt om te bestuderen hoe COVID werkt en hoe ze nieuwe medicijnen kunnen ontwerpen om het te bestrijden.

Leave a Comment