sasava

Mikrobioen metaproteomika: laginak prozesatzeko, datuen bilketa eta datuen analisira

Wu Enhui, Qiao Liang*

Kimika Saila, Fudan Unibertsitatea, Shanghai 200433, Txina

 

 

 

Mikroorganismoek oso lotuta daude giza gaixotasunekin eta osasunarekin. Mikrobio-komunitateen konposizioa eta haien funtzioak nola ulertu behar den premiazko gai nagusia da. Azken urteotan, metaproteomika baliabide tekniko garrantzitsu bat bihurtu da mikroorganismoen osaera eta funtzioa aztertzeko. Hala ere, mikrobio-komunitateko laginen konplexutasun eta heterogeneotasun handia dela eta, laginak prozesatzea, espektrometria masen datuak eskuratzea eta datuen analisia bihurtu dira metaproteomikak gaur egun dituen hiru erronka nagusiak. Metaproteomikako analisian, askotan beharrezkoa da lagin mota ezberdinen aurretratamendua optimizatzea eta mikrobioen bereizketa, aberaste, erauzketa eta lisi eskema desberdinak hartzea. Espezie bakar baten proteomaren antzera, metaproteomikan masa-espektrometriako datuak eskuratzeko moduak datu-menpeko eskuratze modua (DDA) eta datuen jabetze independentea (DIA) modua barne hartzen ditu. DIA datuak eskuratzeko moduak laginaren peptidoen informazioa guztiz bil dezake eta garapen ahalmen handia du. Hala ere, metaproteomaren laginen konplexutasuna dela eta, bere DIA datuen analisia metaproteomikaren estaldura sakona oztopatzen duen arazo handi bat bihurtu da. Datuen analisiari dagokionez, pauso garrantzitsuena proteina-sekuentzien datu-base bat eraikitzea da. Datu-basearen tamainak eta osotasunak identifikazio-kopuruan eragin handia izateaz gain, espezie eta maila funtzionaletan ere eragina dute analisian. Gaur egun, metaproteoma datu-base bat eraikitzeko urrezko estandarra metagenoman oinarritutako proteina-sekuentzia datu-base bat da. Aldi berean, bilaketa iteratiboan oinarritutako datu-base publikoak iragazteko metodoak balio praktiko handia duela frogatu da. Datuak aztertzeko estrategia espezifikoen ikuspegitik, peptidoetan zentratutako DIA datuen analisi metodoek erabateko korronte nagusi bat hartu dute. Ikaskuntza sakonaren eta adimen artifizialaren garapenarekin, datu makroproteomikoen analisiaren zehaztasuna, estaldura eta analisi-abiadura asko sustatuko ditu. Beheko analisi bioinformatikoari dagokionez, azken urteotan oharpen-tresna batzuk garatu dira, espezieen oharrak proteina mailan, peptido mailan eta gene mailan egin ditzaketen mikrobio-komunitateen osaera lortzeko. Beste metodo omikekin alderatuta, mikrobio-komunitateen analisi funtzionala makroproteomikaren ezaugarri berezia da. Makroproteomika mikrobio-komunitateen multi-omics analisiaren zati garrantzitsu bat bihurtu da, eta garapen-potentzial handia du oraindik estalduraren sakonerari, detekzio-sentsibilitateari eta datuen analisiaren osotasunari dagokionez.

 

01Laginaren aurretratamendua

Gaur egun, metaproteomika teknologia oso erabilia izan da giza mikrobiomaren, lurzoruaren, elikagaien, ozeanoaren, lohi aktiboaren eta beste alor batzuen ikerketan. Espezie bakar baten proteomaren analisiarekin alderatuta, lagin konplexuen metaproteomaren aurretratamenduak erronka gehiago ditu. Benetako laginetako mikrobio-konposizioa konplexua da, ugaritasunaren barruti dinamikoa handia da, mikroorganismo mota ezberdinen horma zelularraren egitura oso desberdina da eta laginek ostalariaren proteina eta beste ezpurutasun kopuru handia izaten dute. Horregatik, metaproteomaren analisian, askotan beharrezkoa da lagin mota desberdinak optimizatzea eta mikrobioen bereizketa, aberaste, erauzketa eta lisi eskema desberdinak hartzea.

Lagin ezberdinetatik mikrobioen metaproteomak erauzteak antzekotasun batzuk ditu, baita desberdintasun batzuk ere, baina gaur egun metaproteoma lagin mota ezberdinen aurreprozesatze prozesu bateratu bat falta da.

 

02Masa-espektrometriako datuak eskuratzea

Eskopeta proteomaren analisian, aurretratamenduaren ondoren peptido-nahasketa lehenik zutabe kromatografikoan bereizten da, eta, gero, masa-espektrometroan sartzen da ionizazioaren ondoren datuak eskuratzeko. Espezie bakarreko proteomaren analisiaren antzera, makroproteomaren analisian masa-espektrometriako datuak eskuratzeko moduek DDA modua eta DIA modua daude.

 

Masa-espektrometriako tresnen etengabeko iterazio eta eguneraketarekin, metaproteomaren sentsibilitate eta bereizmen handiagoa duten masa-espektrometriako tresnak aplikatzen dira eta metaproteomaren analisiaren estaldura-sakonera ere etengabe hobetzen da. Aspalditik, Orbitrap-ek zuzentzen dituen bereizmen handiko masa-espektrometria-tresna batzuk oso erabiliak izan dira metaproteoman.

 

Jatorrizko testuaren 1. taulan 2011tik gaur egunera arte metaproteomikari buruzko ikerketa adierazgarri batzuk erakusten dira, lagin motari, analisi-estrategiari, masa-espektrometria tresnari, eskuratze-metodoari, analisi-softwareari eta identifikazio-kopuruari dagokionez.

 

03Masa-espektrometriako datuen analisia

3.1 DDA datuak aztertzeko estrategia

3.1.1 Datu-basearen bilaketa

3.1.2de novosekuentziazio estrategia

3.2 DIAren datuak aztertzeko estrategia

 

04Espezieen sailkapena eta oharpen funtzionala

Maila taxonomiko desberdinetako mikrobio-komunitateen osaera mikrobiomaren ikerketaren funtsezko ikerketa-esparruetako bat da. Azken urteotan, hainbat oharpen tresna garatu dira espezieak proteina mailan, peptido mailan eta gene mailan ohartzeko, mikrobio-komunitateen konposizioa lortzeko.

 

Adierazpen funtzionalaren funtsa xede-proteina-sekuentzia proteina-sekuentzia funtzionalaren datu-basearekin alderatzea da. GO, COG, KEGG, eggNOG, etab. bezalako gene funtzioen datu-baseak erabiliz, oharpen funtzionalaren analisi desberdinak egin daitezke makroproteomek identifikatutako proteinen. Oharpen tresnen artean Blast2GO, DAVID, KOBAS, etab.

 

05Laburpena eta aurreikuspenak

Mikroorganismoek garrantzi handia dute gizakien osasunean eta gaixotasunean. Azken urteotan, metaproteomika baliabide tekniko garrantzitsu bat bihurtu da mikrobio-komunitateen funtzioa aztertzeko. Metaproteomikaren prozesu analitikoa espezie bakarreko proteomikaren antzekoa da, baina metaproteomikaren ikerketa-objektuaren konplexutasuna dela eta, ikerketa-estrategia zehatzak hartu behar dira azterketa-urrats bakoitzean, laginaren aurretratamendutik, datuak eskuratzetik datuen analisiraino. Gaur egun, aurretratamendu-metodoen hobekuntzari, masa-espektrometriaren teknologiaren etengabeko berrikuntzari eta bioinformatikaren garapen azkarrari esker, metaproteomikak aurrerapen handia egin du identifikazio-sakonean eta aplikazio-esparruan.

 

Makroproteoma laginen aurretratamendu prozesuan, laginaren izaera kontuan hartu behar da lehenik. Mikroorganismoak inguruneko zeluletatik eta proteinetatik nola bereizi makroproteomek duten erronketako giltzarrietako bat da, eta bereizketa-eraginkortasunaren eta mikrobio-galeren arteko oreka konpondu beharreko premiazko arazoa da. Bigarrenik, mikroorganismoen proteina erauzketan bakterio ezberdinen egitura-heterogeneotasunak eragindako desberdintasunak kontuan hartu behar dira. Arrastoen barrutian dauden makroproteoma laginek aurretratamendu metodo espezifikoak ere behar dituzte.

 

Masa-espektrometria tresnei dagokienez, masa-espektrometria-tresnek trantsizio bat jasan dute Orbitrap masa-espektrometroetatik, hala nola, LTQ-Orbitrap eta Q Exactive, masa-espektrometroetara, ioi mugikortasunean oinarritutako hegaldi-denbora-denbora-masa analizatzaileetara, hala nola timsTOF Pro. . Ioien mugikortasunaren dimentsioko informazioa duten timsTOF tresnen serieak detekzio-zehaztasun handia, detekzio-muga baxua eta errepikakortasun ona ditu. Pixkanaka-pixkanaka tresna garrantzitsu bihurtu dira masa-espektrometria detektatu behar duten hainbat ikerketa-eremutan, hala nola espezie bakar baten proteoma, metaproteoma eta metaboloma. Azpimarratzekoa da denbora luzez, masa-espektrometria tresnen sorta dinamikoak metaproteomaren ikerketaren proteina-estalduraren sakonera mugatu duela. Etorkizunean, gama dinamiko handiagoa duten masa-espektrometria-tresnek metaproteometan proteinen identifikazioaren sentsibilitatea eta zehaztasuna hobetu ditzakete.

 

Masa-espektrometriako datuak eskuratzeko, DIA datuak eskuratzeko modua espezie bakar baten proteoman oso onartua izan arren, egungo makroproteomaren analisi gehienek DDA datuak eskuratzeko modua erabiltzen dute oraindik. DIA datuak eskuratzeko moduak laginaren zati-ioiaren informazioa guztiz lor dezake, eta DDA datuak eskuratzeko moduarekin alderatuta, makroproteoma laginaren peptidoaren informazioa guztiz lortzeko ahalmena du. Hala ere, DIAren datuen konplexutasun handia dela eta, DIA makroproteomaren datuen azterketak zailtasun handiak ditu oraindik. Adimen artifizialaren eta ikaskuntza sakonaren garapenak DIA datuen analisiaren zehaztasuna eta osotasuna hobetzea espero da.

 

Metaproteomikaren datuen analisian, funtsezko urratsetako bat proteina-sekuentzien datu-basea eraikitzea da. Heste-flora bezalako ikerketa-arlo ezagunetarako, hesteetako mikrobioen datu-baseak erabil daitezke, hala nola IGC eta HMP, eta identifikazio emaitza onak lortu dira. Beste metaproteomikako analisi gehienetarako, datu-baseen eraikuntza-estrategia eraginkorrena oraindik lagin-bereziki proteina-sekuentzia datu-base bat ezartzea da, sekuentziazio metagenomikoaren datuetan oinarrituta. Konplexutasun handiko eta barruti dinamiko handiko mikrobio-komunitate laginetarako, beharrezkoa da sekuentziazio-sakonera handitzea, ugaritasun baxuko espezieen identifikazioa areagotzeko, eta horrela proteina-sekuentzien datu-basearen estaldura hobetzeko. Sekuentziazio datuak falta direnean, bilaketa-metodo iteratibo bat erabil daiteke datu-base publikoa optimizatzeko. Hala ere, bilaketa errepikakorrak FDR kalitate-kontrolean eragina izan dezake, beraz, bilaketa-emaitzak arretaz egiaztatu behar dira. Horrez gain, FDR kalitate-kontroleko eredu tradizionalak metaproteomika analisian duten aplikagarritasuna aztertzea merezi du oraindik. Bilaketa-estrategiari dagokionez, liburutegi espektral hibridoen estrategiak DIA metaproteomikaren estaldura-sakonera hobe dezake. Azken urteotan, ikaskuntza sakonean oinarrituta sortutako liburutegi espektralak errendimendu handiagoa erakutsi du DIA proteomikan. Hala ere, metaproteomaren datu-baseek milioika proteina-sarrera izan ohi dituzte, eta horrek aurreikusitako liburutegi espektralen eskala handia eragiten du, baliabide informatiko asko kontsumitzen ditu eta bilaketa-espazio handia sortzen du. Horrez gain, metaproteometan proteinen sekuentzien arteko antzekotasuna asko aldatzen da, liburutegi espektralaren iragarpen ereduaren zehaztasuna ziurtatzea zailduz, beraz, aurreikusitako liburutegi espektralak ez dira asko erabili metaproteomikan. Horrez gain, proteina-inferentzia eta sailkapen-apuntatzeko estrategia berriak garatu behar dira sekuentzia-antzeko proteinen metaproteomikaren analisiari aplikatzeko.

 

Laburbilduz, mikrobiomaren ikerketa-teknologia sortzen ari den heinean, metaproteomikaren teknologiak ikerketa-emaitza esanguratsuak lortu ditu eta garapen-potentzial handia ere badu.


Argitalpenaren ordua: 2024-abuztuaren 30a