Microsoft gör nu en proteingenererande AI, Evodiff, tillgänglig som öppen källkod, rapporterar Techcrunch. Inom forskningen pågår arbete med att ta fram nya proteinstrukturer som bland annat kan användas för att studera sjukdomar och även ta fram läkemedel och behandlingar till dem.
Detta arbete har historistk sett varit mycket resurskrävande eftersom det handlar om att både ta fram en möjlig proteinstruktur och sedan hitta en proteinsekvens där den passar in. Tanken med Evodiff är att snabba på arbetet genom att istället utgå från en existerande proteinsekvens för att generera fram olika protein som har hög sannolikhet för att passa in där.
Evodiff är en så kallad diffusionsmodell likt de AI-modeller som gjort sig kända för att generera fram bilder och ljud. Den använder sig av 640 miljoner parametrar som tränats upp på data från alla kända sorter och klasser med protein. Datan har hämtats in från Openfolds dataset för sekvensplacering och från Uniref50 som är en databas med proteinsekvenser.
Viktigt att påpeka är att Evodiff än så länge inte är peer reviewed, alltså kvalitetsgranskad av andra ämnesexperter. Enligt Microsoft själva behövs också mycket mer skalningsarbete innan Evodiffs ramverk kan användas kommersiellt.
Läs också: AI kan upptäcka sjukdomar genom att analysera bilder av näthinnan