Tehnologii proteomice. Set de instrumente

Un biolog intern, în special un biolog molecular, trebuie să scrie din limba sa maternă din ce în ce mai rar. Este clar că majoritatea articolelor științifice din domeniul nostru sunt scrise în limba curentă a comunicării științifice - engleza. Prin urmare, în loc să introduc, vreau să mulțumesc redactorului-șef al Biomoleculei - a reușit cumva să mă oblige să scriu acest text, trezind fie o mâncărime grafomană, fie un ego inflamat, fie doar dragoste pentru limba rusă. Dar mi-a fost ușor să scriu: după voia sorții, fac același lucru de mai bine de cincisprezece ani - identificarea și analiza cantitativă a proteinelor. Adică ceea ce se numește astăzi proteomică... Aproape tot ce știu despre asta este, dacă este posibil, ușor disponibil în rândurile următoare.

Partenerul general al ciclului este compania: cel mai mare furnizor de echipamente, reactivi și consumabile pentru cercetare și producție biologică.

Una dintre misiunile principale ale „Biomoleculei” este de a ajunge chiar la rădăcini. Nu spunem doar ce fapte noi au descoperit cercetătorii - vorbim despre cum le-au descoperit, încercăm să explicăm principiile metodelor biologice. Cum se scoate o genă dintr-un organism și se introduce în altul? Cum să urmărim soarta mai multor molecule mici dintr-o celulă imensă? Cum declanșezi un mic grup de neuroni într-un creier imens?

Astfel, am decis să vorbim despre metodele de laborator într-un mod mai sistematic, pentru a reuni cele mai importante și mai moderne metode biologice într-o singură rubrică. Pentru a fi mai interesant și mai clar, am ilustrat pe larg articole și chiar am adăugat animații ici și colo. Vrem ca articolele noii secțiuni să fie interesante și de înțeles chiar și pentru un trecător obișnuit. Și, pe de altă parte, astfel încât să fie atât de detaliate încât chiar și un profesionist ar putea descoperi ceva nou în ele. Am colectat tehnicile în 12 grupuri mari și vom face un calendar biomedical pe baza lor. Așteptați actualizările!

Eram mulțumit, nu aveam suficiente zile și viața mea era plină de sens.
Frații Strugatsky. Luni începe sâmbătă
- Zece ani, spuse el râzând, mestecând. - Atât timp va scrie ceva.
James Joyce. Ulise (tradus din engleză de V. Khinkis și S. Horuzhego)

Partea 1. Înaintea genomului. Puteți identifica doar natura pe care o înțelegeți

Fizicienii glumesc: „ Totul va merge bine în afacerea dvs. atunci când biologia devine chimie și chimia devine fizică.". Istoria proteomicii înainte de starea sa actuală seamănă puțin cu această glumă. Fizicienii au creat o tehnologie puternică și, atunci când științele vieții au devenit la modă, au încercat să o folosească pentru a analiza proteinele. La început, dezvoltarea instrumentelor fizice a stimulat utilizarea lor în biologie și medicină, iar rezultatele demonstrației au făcut doar aluzie la unele realizări reale. Acum este momentul în care rezultatele serioase sunt vizibile în acest domeniu, inclusiv pentru medicamente. Aici voi încerca să vorbesc despre dezvoltarea analizei proteinelor de mare capacitate - proteomică - pe care o observ de multă vreme și pe care o observ prin ochii unui biolog. Poate că fizicienii vor glumi din nou, dar va fi puțin mai ușor pentru colegii biologi și medici să înțeleagă esența a ceea ce se întâmplă.

Figura 1. Repere proteomice majore. 1950 g.- Grupul suedezului Per Edman a sugerat metoda chimică secvențierea peptidelor. 1951-1955- Sub îndrumarea britanicului Frederick Sanger, a fost determinată structura insulinei proteice scurte și s-a dovedit că proteinele individuale nu sunt amorfe din punct de vedere al compoziției, ci au o secvență constantă de reziduuri de aminoacizi. 1959 g.- Americanii Rosalyn Yalow și Solomon Berson au creat prima imunotestare, inclusiv pentru determinarea proteinelor. 1967 an- Am creat primul secvențiator automat de proteine ​​folosind metoda Edman. 1970 an- Elvețianul Ulrich Laemmli a propus metoda optimă pentru electroforeza pe gel a proteinelor în condiții de denaturare - folosind dodecil sulfat de sodiu. 1975 an- Americanul Patrick O'Farell și germanul Joachim Klose au inventat independent electroforeza proteinelor 2D și au obținut primele hărți proteomice. 1984 an- Sub conducerea americanului John Fenn, au dezvoltat ionizarea moleculelor prin electrospray. Ulterior, a făcut posibilă efectuarea spectrometriei de masă a macromoleculelor, inclusiv a proteinelor, fără a le distruge. Anul 1985- Koichi Tanaka din Japonia a propus ionizarea moale a macromoleculelor cu un laser pentru spectrometrie de masă. Germanii Franz Gillenkamp și Michael Karas au folosit o metodă similară pentru proteine ​​și peptide. S-a născut metoda de ionizare MALDI. 1993-1996- Mai multe grupuri de cercetători au propus identificarea proteinelor folosind spectrometria de masă a fragmentelor de proteoliză și căutarea unei secvențe prezise din genom. A apărut o hartă peptidică spectrometrică de masă (amprentă peptidică sau amprentă digitală). 1994 an- Termenul "proteom" ca adaos de proteină la genom a fost introdus de studentul australian Mark Wilkins. 1994-1999- Au apărut primele programe de căutare pentru identificarea proteinelor prin spectrometrie de masă prin secvențe genomice. Proteomica a devenit disponibilă pentru o gamă largă de utilizatori. 1999-2001- Foc rapid ( pușcă) proteomică. Mai multe grupuri științifice au propus utilizarea unei combinații de cromatografie lichidă de înaltă performanță și spectrometrie de masă tandem pentru a identifica un amestec de peptide. A fost utilizată ionizarea prin pulverizare electronică. 2000-2005- Fizicianul rus Alexander Makarov care lucrează în străinătate a inventat un nou tip de capcană ionică - Orbitrap... Dispozitive bazate pe Orbitrap punere în funcțiune. Spectrometria de masă de înaltă rezoluție a devenit democratizată și utilizată pe scară largă în proteomică. 2005 an- Americanii Christie Hunter și Lee Anderson au demonstrat utilizarea metodei spectrometrice de masă pentru monitorizarea reacțiilor multiple ( MRM) pentru analiza cantitativă a peptidelor naturale. A apărut proteomica direcționată (vizată). 2007 an- Sub conducerea americanului Stephen Gigi, ei au propus o nouă metodă de evaluare a nivelului rezultatelor fals pozitive ale proteomicii cu foc rapid folosind secvențe „false” (analiză ). 2012–2014- Proteomica cu foc rapid a atins nivelul de identificare a aproximativ 10 mii de proteine ​​umane într-o probă - aproximativ jumătate din cele codificate în genom. Sub conducerea germanului Bernhard Kuster și a americanului Achilesh Pandey, au fost publicate în mod independent lucrări care declară versiunile preliminare ale proteomei umane complete.

Să trecem la un moment în care procesele matricei de transfer de informații în celulă au fost deja studiate aproximativ (Fig. 1). Era clar cum in vivo proteinele sunt sintetizate, din ce aminoacizi constau. În același timp, la începutul anilor 1980, deja se dezvoltase imunologia moleculară, o tehnică de obținere Anticorpi monoclonali... Au început să se dezvolte metode de producere a proteinelor recombinante, alimentate de invenție reacția în lanț a polimerazei... Metodele de separare a biomoleculelor au fost perfecționate - diferite tipuri cromatografieși electroforeză .

Activitate enzimatică - primele cunoștințe despre proteine

Pentru a stabili sarcina „identificării” unei proteine ​​dintr-o probă biologică, era deja necesar să realizăm existența „dogmei” de biologie moleculară a lui Crick, în care codul acidului nucleic cu pierderi informaționale este transformat într-o secvență de aminoacizi. Identificarea unui anumit compus este stabilirea structurii sale, în cazul unei polipeptide, o determinare completă sau parțială a secvenței sale, cu alte cuvinte, secvențierea... Etapa următoare nu va fi doar identificarea (adică analiza calitativa proteină), dar și determinarea concentrației sale este o analiză cantitativă. Interesant este faptul că conceptul de determinare a activității unei proteine ​​s-a dezvoltat chiar înainte de stabilirea naturii sale chimice. Aproximativ vorbind, activitatea enzimatică a cărnii tocate proaspete (adică mușchiul de mamifer omogenizat) ar fi putut fi stabilită prin metode spectrofotometrice simple încă de la începutul secolului al XX-lea (Fig. 2), când baza chimică a vieții a rămas necunoscută. Cu toate acestea, catalizatorul proteic care efectuează această reacție ar putea fi cuantificat în unități de activitate arbitrare. Și încă în clinică, mulți biomarkeri sunt determinați în astfel de unități arbitrare - de exemplu, alanina aminotransferazași aspartat aminotransferază, în ciuda faptului că tehnologia modernă este capabilă să determine numărul lor absolut. În cazul multor enzime, determinarea activității este atât convenabilă, cât și corectă, deoarece unele molecule pot să nu funcționeze din cauza inactivării, fiind prezente în probe.

Acestea sunt enzime intracelulare care organizează legătura dintre metabolismul glucidelor și aminoacizilor din mitocondriile celulare. Apariția lor în sânge indică distrugerea celulelor hepatice.

Anticorpul ca identificator prin contradicție

În plus față de evaluarea activității, începând cu anii 1970, cercetătorii au avut o altă oportunitate de a măsura cantitativ proteinele fără a le cunoaște structura. Este vorba în special de utilizarea anticorpilor monoclonal, a cărui chitanță a fost inventată în 1975; articolul " 12 metode în imagini: tehnologii imunologice". Anticorpii pot fi generați împotriva componentelor purificate sau împotriva țesuturilor, celulelor sau fracțiilor întregi. Mai mult, dacă sunt monoclonali, atunci sistemul de producție și caracteristicile lor analitice rămân neschimbate de la un lot la altul. Dacă știm la ce s-au opus anticorpii, adică am folosit un antigen purificat și identificat printr-o altă metodă „ortogonală”, atunci agentul de legare rezultat - un anticorp - poate fi utilizat pe scară largă pentru reidentificarea acestuia în amestecuri complexe. Este mai interesant cu anticorpii obținuți împotriva antigenelor necunoscute. Neavând nicio idee despre structura antigenului, astfel de anticorpi au început să fie utilizați pentru diagnosticarea tumorilor maligne. Unii dintre ei își leagă mult mai mult din antigenul lor la persoanele bolnave decât la persoanele sănătoase. Tehnica de evaluare a fost standardizată și astfel de anticorpi monoclonali au fost folosiți pentru diagnostic fără a se cunoaște structura chimică exactă a antigenului. Un exemplu izbitor al acestei abordări este glicoproteina CA-125, descoperită de Robert Bast și colab. Sub forma unui anticorp împotriva acesteia în 1981. Abia mult mai târziu a fost identificată gena pentru acest produs și proteina în sine - mucină 16.

Izolarea proteinelor pure și secvențierea Edman

Cu toate acestea, până în anii 1970, biochimiștii nu mai erau mulțumiți de munca oarbă, de exemplu, măsurând activitatea enzimelor și a altor compuși fără a înțelege structura lor chimică. Au apărut metode de purificare a proteinelor care combinau principiile cromatografiei, electroforezei, centrifugării, dintre care unele au dispărut din circulație, în timp ce altele sunt încă utilizate. O sarcină separată a fost confirmarea purității compușilor din fracțiuni după purificare. Pentru aceasta s-au folosit metode spectrale (de la simple la complexe), precum și vizualizarea benzilor colorate în timpul electroforezei. Obținerea a cel puțin 90% din puritatea proteinelor dintr-un biomaterial fără utilizarea anticorpilor și a altor lianți specifici, atât atunci, cât și acum, este un proces laborios. Anii 1970 - 1980 - epoca de aur a dezvoltării metodelor de separare a proteinelor, când au fost turnate geluri uriașe pentru electroforeză, au fost proiectate coloane de contor pentru cromatografie manuală și automată.

Dacă ești norocos, atunci după câteva luni sau ani de muncă minuțioasă, ești convins că „produsul” tău se află în eprubetă sau în gel - proteina a cărei funcție o studiezi. Ce opțiuni de identificare aveți dacă sunteți încă în secolul al XX-lea? În primul rând, dacă aveți o ipoteză dacă ce în eprubeta dvs., puteți utiliza anticorpi cunoscuți, dacă sunt disponibili sau prin amabilitatea proprietarilor. Desigur, dacă astăzi anticorpii de diferite tipuri sunt disponibili pentru majoritatea proteinelor oamenilor și a modelelor de animale, la acea dată intervalul lor era mult mai modest. Prin urmare, șansa de a colora molecula de interes cu anticorpi este foarte mică. Dar nu dispera! În anii 1950, chimistul suedez Per Edman a dezvoltat o metodă de secvențiere a peptidelor (Fig. 3).

Figura 3. Secvențierea proteinei Edman. Dacă procesați peptida izotiocianat de fenil (FITZ), atomul de carbon electrofil pe radicalul izotiocianat reacționează cu azotul nucleofil al grupării amino neîncărcate sub alcalinizare moderată. Ca urmare, la capătul N-terminal al peptidei se formează un radical feniltiocarbomoil. Dacă amestecul de reacție este moderat acidificat, acesta este despicat, purtând cu sine aminoacidul N-terminal, cu formarea tiazolinonei cu un radical specific care caracterizează acest aminoacid. În acest caz, restul lanțului de aminoacizi rămâne neschimbat. Derivatul special, care va diferi în radicalul inerent aminoacidului, este din nou transformat în condiții acide - pentru stabilizare - și analizat cromatografic. Astfel, este posibil să se distingă astfel de derivați pentru toți aminoacizii, deoarece, datorită radicalului caracteristic, vor fi caracterizați prin propriul lor timp de eliberare față de faza inversată. Dacă proteina sau peptida pe care o analizăm este atașată la un purtător în fază solidă, derivatul de aminoacid N-terminal poate fi spălat și analizat separat, iar ciclul de analiză se poate repeta, astfel alinierea secvenței de aminoacizi.

Metoda lui Edman era foarte progresivă la acea vreme. El a furnizat cu precizie o secvență de până la 30 de resturi de aminoacizi. Acesta a fost caracterizat de o sensibilitate destul de mare, fiind capabil să secvențeze peptidele în cantități mai mici de 0,1 nmol cu ​​o precizie de 99%. Mai mult, la sfârșitul anilor 1960, a fost automatizat sub forma unui secvențiator peptidic, unde un robot excavator elimină alternativ derivații N-terminali din polipeptide fixați pe hârtie specială, trimițându-i la un cromatograf. Dar cercetătorii au dorit din nou mai mult - nu au fost mulțumiți de necesitatea purificării peptidelor și proteinelor înainte de secvențiere, precum și de alte limitări ale metodei Edman, în special incapacitatea sa de a secvența produse cu un N-terminal modificat.

Până în prezent există puțin interes pentru metoda lui Edman, în special pentru proteine ​​și peptide din organisme a căror secvență nu poate fi prezisă din datele de secvențiere a acidului nucleic. Această metodă implementează analiza directă, în care erorile sunt asociate cu inexactitatea tehnică. Metodele ulterioare de analiză a secvenței de aminoacizi conțin elemente de predicție, prin urmare, li se adaugă erori algoritmice (vezi mai jos).

Electroforeza 2D - prima hartă proteomică

După cum am menționat mai sus, în pregătirea pentru analiza calitativă și cantitativă a proteinelor, s-au folosit metode convenționale de separare moleculară, inclusiv electroforeza. În 1970, a avut loc o revoluție metodologică în electroforeza proteinelor - elvețianul Ulrich Laemmli a propus metoda optimă de electroforeză pe gel în condiții de denaturare. Proteinele au fost denaturate dur cu o substanță amfiphilică, cum ar fi săpunul - dodecil sulfat de sodiu, - datorită căreia fiecare moleculă a fost acoperită cu un strat din acest detergent. S-a constatat că încărcătura negativă totală a unui astfel de complex este aproximativ proporțională cu greutatea moleculară a proteinei. Acest lucru a făcut posibilă divizarea proteinelor într-un gel de poliacrilamidă, deși folosind un câmp electric, dar în funcție de greutatea moleculară a acestora. În mod corect, observăm că Laemmli nu a inventat metoda de novo, dar a optimizat-o doar în conformitate cu condițiile prealabile existente în literatură. Pentru aceasta, apropo, opera sa este acum unul dintre cele mai citate cinci articole științifice din lume. Dezvoltările în acest domeniu au fost publicate mai devreme, inclusiv în 1967 de către americanul Arnold Shapiro și coautori.

Metoda Laemmli bine acceptată a început să fie îmbunătățită și combinată cu alte tipuri de separare a proteinelor. În 1975, americanul Patrick O'Farell și germanul Joachim Klose au propus în mod independent să combine electroforeza pe gel denaturant cu electrofocalizarea preliminară a proteinelor. Focalizarea se efectuează într-un tub de sticlă relativ subțire, cu grosime de gel (1-2 mm). Tubul este umplut cu gel cu polimeri speciali - amfoline , - care sunt capabile să creeze un gradient de pH fix în el. Astfel, atunci când se deplasează într-un câmp electric, proteinele depuse în acest tub se opresc în locul în care amfolinele au atins un pH egal cu punct izoelectric molecule de proteine. Gelul sub formă de șuviță subțire este stors din tub și topit pe placa de gel finită pentru proteina obișnuită de denaturare Laemmli, după care separarea se efectuează în cealaltă direcție. Proteinele, distribuite inițial de-a lungul punctului izoelectric, se mișcă acum în funcție de greutatea lor moleculară. Metoda rezultată este numită pe bună dreptate bidimensională (2D ) electroforeză (fig. 4). După cum vă puteți imagina, fiecare proteină de pe placa de gel finală după colorare nu arată ca o fâșie (spre deosebire de un gel denaturant convențional), ci ca un punct concentrat, rotunjit. Astfel, O'Farell și Klose au prezentat pentru prima dată o hartă a proteinelor, în care fiecare pată de pe o placă mare de gel (până la 40 × 40 cm) reprezintă o izoformă proteică, iar dimensiunea și intensitatea acesteia sunt mai mult sau mai puțin proporționale cu concentrația sa .

Mâinile pricepute ale biochimiștilor din trecut au îmbunătățit în mod repetat metoda electroforezei bidimensionale, care a fost metoda principală în analiza proteinelor până la mijlocul anilor 2000. În loc să umple tuburile, amfolinele au fost așezate pe benzile finite. Au fost propuse diferite dispozitive pentru prepararea plăcilor de gel, diferite modificări ale procesului de electroforeză și pentru diferite dimensiuni și grosimi ale gelului, în funcție de sarcina studiului. În ceea ce privește sensibilitatea, coloranții, inclusiv cei fluorescenți, au fost îmbunătățiți. Mai mult, ca urmare a popularității gelurilor bidimensionale, unele dintre procesele de preparare și colorare a acestora au fost automatizate. Deoarece caracteristicile petelor colorate sunt legate indirect de cantitatea de proteine ​​din probă, este atractiv să se compare imagini cu gel obținute din aceleași probe în condiții diferite. Procesul de procesare a imaginilor gelurilor a fost, de asemenea, automatizat și multe programe de computer concurente au apărut pentru a procesa și compara scanările gelurilor bidimensionale.

În funcție de concentrația de proteine ​​din biomaterial, numărul de pete individuale pe geluri bidimensionale a ajuns la 5 mii. Din punctul de vedere de astăzi, este evident că acest lucru nu înseamnă că produsele a 5 mii de gene sunt vizualizate pe gel. Izoformele unui produs cu o singură genă care diferă în ordine din cauza heterozigozității sau proteolizei sau a structurii mai fine datorită modificărilor reziduurilor, vor apărea în general ca pete discrete. De exemplu, scindarea unui reziduu de arginină dintr-o mică proteină, alfa-amiloid, a schimbat punctul izoelectric atât de semnificativ încât pata s-a deplasat cu aproximativ 10 cm pe gel.

Cu toate acestea, o electroforetogramă bidimensională cu mii de proteine ​​vizualizate poate fi considerată prima proteom - adică primul tip de analiză în care se determină întregul set de proteine ​​prezente într-o probă biologică sau o proporție semnificativă a acestora. Permiteți-mi să observ că această metodă a fost dezvoltată semnificativ cu mult înainte de apariția termenului „proteom”, dar mai multe despre asta mai târziu.

Să presupunem că am analizat prin electroforeză bidimensională mostre de experiență și control, de exemplu, liniile celulare după tratamentul cu o substanță medicamentoasă și fără un astfel de tratament. Am obținut hărți similare cu electroforetogramă, dar zece pete au apărut după tratament, cinci au dispărut complet, iar altele și-au schimbat intensitatea. Ce putem face dacă suntem în 1990? Tot ce am vorbit mai devreme. Aplicați metoda lui Edman. Pentru a picta electroforegrama cu anticorpi disponibili, adică pentru a efectua western blot... Pentru ambele variante, proteinele din gel sunt transferate folosind un câmp electric pe o hârtie sau o membrană similară, care este deja manipulată în continuare. Limitările utilizării anticorpilor sunt clare - deși sunt sensibile, își văd doar țintele. Limita metodei lui Edman aici este sensibilitatea. Funcționează bine din zeci și sute de pmoli de proteine, iar coloranții moderni „văd” pete, care conțin 2,5–5 pmoli. Având în vedere pierderile din timpul transferului la membrană și nevoia probabilă de scindare a proteinelor în peptide, ne dăm seama că metoda lui Edman va putea face față unei părți mai mici a petelor proteice vizualizate pe un gel bun.

„Cerul înstelat” al electroforezei bidimensionale este prima și ultima modalitate de a vedea proteomul cu ochii tăi. Mai mult, cu un cadru de înaltă calitate, tehnica ochiului uman este suficientă pentru a detecta diferențele dintre plăcile similare cu gelul. Metodele ulterioare de proteomică, a căror poveste este în față, formează „date mari” invizibile ca o zeitate. Această circumstanță păstrează în mare măsură popularitatea „bidimensională”, care este folosită până în prezent, deși nu la fel de des ca înainte. Cu toate acestea, echipamentele și software-ul pentru ciclul complet al acestei tehnici sunt încă în vânzare.

Conform impresiilor personale, electroforeza bidimensională a proteinelor este una dintre cele mai laborioase și dificil de efectuat proceduri biochimice, care folosește zeci de etape, reactivi și mai multe tipuri de echipamente de laborator. În laborator, am numit în glumă pe cei care pun în scenă electroforeza 2D „artiști proteomici”. Într-adevăr, stabilirea metodei durează două-trei zile și necesită o concentrare semnificativă în toate etapele sale. Cea mai mică supraveghere duce la o distorsiune semnificativă a „imaginii” de pe gel. Metoda nu este complet automatizată, motiv pentru care a scăzut popularitatea. Cu toate acestea, el a primit un al doilea vânt deja la începutul secolului, când genomul complet a izbucnit în știință și, după aceasta, în proteomică - spectrometrie de masa .

Diaem: echipamente moderne pentru analiza proteomică

Material furnizat de partenerul nostru - Diaem

Partea 2. Postgene

Proteomica ca tehnologie post-genomică

Apariția secvențelor genomice de la multe organisme, de la bacterii la genomi mari de plante și animale (inclusiv oameni), a redus spațiul de căutare pentru identificarea proteinelor. Cu excepția situației cu secvențierea ADN-ului total al unui amestec complex de organisme (așa-numitul metagenom sol, conținut intestinal, ape oceanice etc.), biochimiștii își imaginează de obicei ce fel de organism analizează. Și aceasta înseamnă că proteinele din eșantionul studiat sunt sintetizate folosind fluxul de informații de la genele care le codifică în acest organism. De fapt, acesta este modul în care termenul „ proteom „- în 1994, Mark Wilkins, un student absolvent australian, a propus-o să denote o proteină sau un complement proteic al genomului. Genomul - genomul citit - a dat naștere restului „-omilor”, iar tehnologiile pentru a le analiza, la sfârșitul anilor 1990, aproape ipotetic, alcătuiau grupul postgenomic , sau, așa cum se numește acum deseori, tehnologii omix .

Discuție adevărată, gândește-te la asta, domnilor studenți absolvenți.

Strict vorbind, omixurile adevărate sunt analiza produselor transmiterii informațiilor genomice, adică ARN-uri și proteine ​​care codifică și necodifică. Restul omixurilor sunt, de fapt, indirecte. Ele nu sunt legate de codul genetic printr-un flux direct de informații și sunt combinate în grupuri în funcție de natura chimică a compușilor analizați. Este de remarcat faptul că tehnologiile omix efectuează analiza simultană a mii de compuși, de exemplu, metaboliți, lipide, glicani etc. și sunt numiți, respectiv, metabolomici, lipidomici (se suprapun parțial), glicomici etc. Entuziaștii din ultimul deceniu - era lozincilor și memelor - au venit cu un număr incredibil de „omici”, inclusiv cei destul de comici. Numărul diferitelor utilizări ale sufixului „omica” sau „omix” până în 2010 a depășit două sute, ceea ce a făcut posibilă glumea pe această temă chiar și pentru „civilul” Jurnalul de pe Wall Street, care a numit procesul „incrydingomică”.

Fenomenul spectrometriei de masă pentru persoanele proteice

Măsurarea precisă a greutății moleculare component chimic este scopul dorit al tehnologiei analitice. Într-adevăr, aceste cunoștințe rezolvă multe probleme și, uneori, atunci când sunt disponibile informații suplimentare, oferă identificarea substanței dorite. Spectrometrie de masa - un set de metode care vizează măsurarea greutății moleculare a compușilor. Această abordare s-a dezvoltat de la sfârșitul secolului al XIX-lea, când Sir Joseph John Thomson a reușit să creeze un spectrograf de masă format dintr-un tub cu descărcare de gaz care separă particulele încărcate cu diferite greutăți moleculare de-a lungul traiectoriilor. Apoi Arthur Dampster s-a dezvoltat ... Dar oprește-te! Este imposibil să acoperi întreaga istorie a spectrometriei de masă în acest articol și nici nu este necesar, deoarece a fost făcut de multe ori de către profesioniști. Ca biochimist de profesie, este adecvat să oferiți o imagine de ansamblu asupra acestui câmp fascinant într-un context biologic, pentru a acoperi decalajul dintre tehnologia fizică complexă și aplicațiile sale biomedicale.

În calitate de biologi, va trebui să credem că nu există o altă modalitate de a măsura greutatea moleculară decât făcând moleculele să se miște. Și imediat după aceea, să credem că este posibil ca moleculele să se miște doar într-o formă încărcată, adică transformându-le în ioni. Deci, prima etapă a analizei spectrometrice de masă (Fig. 5) este ionizarea. Primele metode de ionizare au fost dure, astfel încât macromoleculele nu au fost păstrate în ele. Progresele în spectrometria de masă în biologie, după cum va fi clar din cele ce urmează, sunt asociate cu capacitatea de a ioniza biomoleculele fără a le distruge. După ionizare, compușii analizați sub influența unui câmp electric trebuie transferați într-un detector, care va seta caracteristicile mișcării moleculelor într-un câmp electromagnetic în conformitate cu greutatea lor moleculară, sau mai bine zis, raportul dintre greutatea moleculară și încărca. Mai simplu spus, dacă două molecule diferite au aceeași sarcină, dar diferă în masă, aplicarea aceluiași câmp electric le va face să zboare diferit. Dacă vă antrenați, adică calibrați detectorul utilizând standarde cu mase cunoscute, este posibil, prin evaluarea mișcării ionilor necunoscuți, să se determine raportul masă-încărcare. Dacă sarcina este egală cu unu (adică avem de-a face cu ioni încărcați individual), raportul este egal din punct de vedere numeric cu greutatea moleculară.

Spectrometria de masă este astăzi un câmp gigantic, utilizat în mod activ în aproape toate domeniile industriei, în chimie, biologie, medicină și protecția mediului. Mai mult, în proiectul Manhattan și, probabil, în proiectele nucleare sovietice, uraniul radioactiv a fost îmbogățit cu ajutorul unui spectrometru de masă, separându-l în izotopi. La cel mai mare forum de spectrometrie de masă - conferința Societății americane de spectrometrie de masă - reunește anual până la 15 mii de participanți. Ponderea tehnicilor biomedicale în spectrometria de masă continuă să crească odată cu investițiile în biotehnologie în general.

Blestemul distribuției izotopice

Crearea spectrometrelor de masă a coincis cu descoperirea diferiților izotopi din elementele chimice. Când rezolvăm probleme chimice la școală sau efectuăm diferite experimente biologice, de multe ori nu credem că elementele importante care alcătuiesc substanțele organice (C, O, N, S) conțin o proporție semnificativă de izotopi stabili care diferă în masă de cei nominali indicat în tabelul periodic. Biologii se confruntă cu izotopi radioactivi care au fost folosiți recent pentru etichetarea biomoleculelor. Arheologii și paleontologii sunt bine conștienți de problema izotopilor stabili și radioactivi - îi folosesc pentru a-și data descoperirile. Dar, în majoritatea experimentelor biologice moleculare, nu este necesar să ne amintim despre aceste impurități.

Raportul stabil de izotop pentru fiecare element este o proprietate a materialelor. Este interesant faptul că astfel de raporturi ale izotopilor stabili sunt diferite în medii diferite, de exemplu, în apa dulce și de mare, în roci, precum și în diferite perioade ale existenței Pământului și a altor corpuri cerești. Prin urmare, măsurarea acestui parametru în condiții diferite prezintă un mare interes în diferite domenii ale științelor naturii. Dar pentru studierea maselor exacte de proteine ​​și peptide în proteomică, existența izotopilor stabili este un fel de blestem.

Pentru simplitate, vom presupune că compoziția compusului pe care îl măsurăm conține un amestec de numai un izotop stabil de carbon - 13 C. Ponderea sa în masa carbonului total de pe planetă este de aproximativ 1%. Astfel, dacă molecula noastră are 10 atomi de carbon, iar masa sa nominală, conform tabelului periodic, greutatea moleculară este, să zicem, 152 de unități de masă atomică, doar fiecare zecea moleculă va conține un atom de C „greu”. Și molecula noastră nu va avea o greutate moleculară 152 și aproximativ 153 Da. Astfel, un spectrometru de masă dintr-un compus va înregistra nu unul, ci mai multe vârfuri. Prima va conține masa nominală împărțită la sarcina (m / z) - cu o sarcină unitară - 152, a doua - de 10 ori mai mică ca intensitate, care reflectă pur și simplu numărul relativ de molecule ale acestei mase, cu m / z = 153 Da. Întrucât, potrivit statisticilor, vor exista molecule cu doi sau mai mulți atomi „grei”, vârfurile lor pot fi, de asemenea, în spectru, dar datorită intensității lor scăzute, nu pot depăși sensibilitatea detectorului.

Spectrometrele de masă moderne sunt capabile să rezolve vârfuri cu diferențe de greutate moleculară mult mai mici de 1 Da.

Acum să ne imaginăm un compus similar, dar acesta va include deja 100 de atomi de carbon. Fie greutatea sa moleculară nominală să fie 1502 Da. Este ușor de înțeles că numărul de molecule care conțin cel puțin un atom "greu", în acest caz, va depăși cel al greutății moleculare nominale. Dintre mai multe vârfuri care vor corespunde unui număr diferit de atomi ai izotopului 13 C, cel mai mare în acest caz va fi al doilea vârf, cu m / z aproximativ egal cu 1503 Da. Ce se întâmplă dacă filmăm un spectru de masă al unui compus de mărimea unei proteine ​​mici, cu o masă de peste 10.000 Da? Un număr semnificativ de molecule de compoziție izotopică identice din punct de vedere chimic, dar diferite, formează o întreagă pădure de vârfuri din spectrul de masă, iar cele mai intense dintre ele vor fi situate departe în mijlocul acestui set de vârfuri, iar în greutatea moleculară va diferi semnificativ de la nominal, așa-numitul greutate moleculară monoizotopică conexiuni (fig. 6). De exemplu, masa monoizotopică a albuminei serice bovine, un standard proteic atât de iubit de biochimiști, este de 66 389,86 Da, în timp ce masa „medie” corespunzătoare celui mai intens vârf din spectrul de masă este cu aproximativ 43 Da mai mult!

Se acumulează informații despre comportamentul diferit al izotopilor stabili ai aceluiași element în procesele chimice și biologice. Cu toate acestea, în majoritatea cazurilor, presupunerea funcționează că proprietățile compușilor cu aceeași structură cu compoziții izotopice diferite sunt aceleași.

Figura 6. Scheme de distribuție izotopică a moleculelor de la metaboliții cu greutate moleculară mică la proteine. Cu cât ionul este mai greu, cu atât este mai mică intensitatea celui mai înalt vârf. Marcă roșie se arată masa monoizotopică - se calculează ca și când în substanță este prezent doar izotopul principal.

Numărul de ioni din fiecare substanță transferat la detectorul spectrometrului de masă este în mod evident suma intensităților tuturor vârfurilor izotopice asociate compusului. De asemenea, această cantitate poate fi exprimată sub forma zonei de sub tangentă, trecând de-a lungul vârfurilor acestor vârfuri. Imaginați-vă că câteva mii de ioni de aminoacizi cu o masă de 150 Da și aceeași cantitate - o proteină cu o masă de 15.000 Da, au intrat în detector. Aminoacidul va da 2-3 vârfuri principale, foarte înalte, primul fiind cel mai intens, iar proteina - câteva zeci, dar mult mai joasă, cu vârful acestui deal blând undeva la mijloc. Este clar că o piatră înaltă care stă în mijlocul unei stepe plate este mult mai ușor de observat decât o movilă mică, ale cărei margini se îmbină și cu iarba înaltă - zgomotul tehnic care însoțește înregistrarea spectrului de masă.

Deci, sensibilitatea unui spectrometru de masă este caracterizată printr-o dependență inversă de greutatea moleculară a compusului analizat. Cu cât această masă este mai mare, cu atât este mai puțin intens vârful maxim dintre toate variantele izotopice ale compusului. În plus, numărul mare al acestor vârfuri face dificilă interpretarea spectrului de masă. De aceea, în proteomica modernă, proteinele sunt cel mai adesea descompuse în peptide cu o greutate moleculară de 500-2500 Da înainte de analiză, denotând această abordare drept „proteomică de jos în sus” ( de jos în sus). Aceste peptide sunt convenabile pentru analiza într-un spectrometru de masă. Scindarea proteinelor este de obicei efectuată de cea mai specifică dintre proteaze - tripsină, care cu specificitate ridicată efectuează proteoliza la legătura peptidică din dreapta reziduurilor de lizină și arginină. Nevoia de a descompune proteinele este ceea ce eu numesc un blestem, deoarece aceasta este o pierdere de informații. La transportoarele proteomice moderne, unde o astfel de decolteare se realizează fără separare preliminară, proteinele după analiză trebuie reasamblate, desigur, nu fără erori. Situația seamănă cu asamblarea secvențelor de nucleotide după secvențierea unei noi generații, dar aceasta din urmă are un avantaj, deoarece fragmentele se suprapun mai des între ele.

În ciuda confuziei enorme în spectrele de masă ale proteinelor mari, mulți cercetători continuă să lucreze cu ele fără decolteu. Această abordare se numește proteomică de sus în jos ( de sus în jos). Pentru a obține spectre de masă de înaltă calitate a proteinelor întregi, se folosesc detectoare puternice de înaltă rezoluție. Cu toate acestea, metoda nu a fost încă creată de sus în jos care analizează în mod fiabil și reproductibil proteinele la scară proteomică.

Spectrometrie de masă MALDI-TOF și amprentă peptidică

În anii 1980, spectrometria de masă a început să dezvolte o abordare a ionizării moleculelor de către un laser în timpul co-cristalizării lor cu un fotosensibil materie organică- așa-numita matrice. Matricea înconjoară moleculele analitului și, atunci când este iluminată de un laser cu o anumită lungime de undă, își absoarbe energia, se ionizează singură și este capabilă, conform unui mecanism care nu este încă complet clar, să ionizeze în mod eficient moleculele vecine ale substanței. S-a dovedit că, în anumite condiții, acest tip de ionizare - desorbție-ionizare cu laser mediată de matrice (ionizare prin desorbție cu laser asistată de matrice , MALDI ) - asigură ionizarea biomoleculelor fără degradarea lor. De îndată ce a devenit clar, metoda a izbucnit în biologie și unul dintre autorii ei, care a fost primul care a prezentat MALDI pentru proteine, japonezul Koichi Tanaka, a primit Premiul Nobel pentru chimie în 2002. Ionizarea MALDI a fost combinată cu un detector simplu de spectrometrie de masă - ora zborului (ora zborului , TOF ), în care ionii zboară într-un tub de vid, ajungând la detector sub forma unei plăci sensibile la ioni (tub fotomultiplicator) (Fig. 7). Timpul necesar ionizării aceleiași sarcini pentru a parcurge lungimea tubului va fi invers proporțional cu greutatea lor moleculară.

De obicei, matricile sunt acizi organici cu greutate moleculară mică, derivați din cinamic, benzoic și alți acizi.

Împreună cu John Fenn, care a aplicat electrospray ionizarea biomoleculelor, și Kurt Wüthrich (în general pentru RMN). Este de remarcat faptul că cercetările lui K. Tanaka au fost publicate sub forma unui brevet, iar articolul său principal a fost publicat într-un modest jurnal de specialitate Comunicări rapide de spectrometrie de masă... El însuși, inginer de cercetare la o companie privată, nu avea o diplomă. La fel ca în multe alte cazuri, a existat controversă în acordarea Premiului Tanaka. În același timp, germanii Franz Gillenkamp și Michael Karas au adus o mare contribuție la aplicarea MALDI pentru proteine.

În anii 1990 și începutul anilor 2000, spectrometrul de masă MALDI-TOF simplu și de încredere a devenit unul dintre caii de lucru ai proteomicii. După cum s-a menționat mai sus, principala metodă de separare a proteinelor la scara proteomului la acel moment a fost electroforeza bidimensională. Dacă o pată cu o proteină de un anumit grad de purificare este tăiată din gel și proteina denaturată legată de gel este clivată cu tripsină, setul de peptide ale acestei proteine ​​izolate va constitui un set mai mult sau mai puțin unic de greutăți moleculare - cel puțin în limitele unui singur proteom. Acest lucru se datorează în primul rând specificității ridicate a tripsinei și distribuției unice a lizinei și argininei, prin care are loc scindarea, în diferite secvențe. Setul de mase peptidice ale fiecărei proteine ​​le-a amintit cercetătorilor de utilizarea amprentelor digitale pentru identificarea personală, astfel încât noua abordare a fost numită cartografiere peptidică spectrometrică de masă , amprentă peptidică , sau, așa cum este mai bine să spunem în rusă, amprente peptidice (fig. 8).

Ideea unei hărți peptidice a unei proteine ​​a ajuns la spectrometria de masă prin cromatografia lichidă de înaltă performanță dezvoltată atunci. Proteinele purificate ar putea fi clivate de protează în peptide, iar analiza lor pe un cromatograf a dat o hartă unică a peptidelor. Dacă se determină timpul standardizat de eliberare a fiecăreia dintre peptidele din coloana cromatografică, proteina poate fi identificată dintr-o astfel de hartă peptidică cromatografică. Acum s-a decis înlocuirea unui astfel de parametru ca timpul de ieșire cu un indicator mai precis și ușor de formalizat - raportul masă-încărcare al unui ion peptidic determinat într-un spectrometru de masă.

Cum putem evalua în mod formal corespondența dintre spectrul de masă observat și conceptele teoretice ale secvențelor de proteine? În primul rând, este necesar să „împărțiți” toate proteinele cu tripsină virtual și să compilați o bază de date din acestea pentru comparație cu spectrele. Aici proteomica devine post-genomică - la urma urmei, fără secvențe teoretice, vor exista prea multe combinații, iar prezicerea unei coincidențe nu va mai fi posibilă. Apoi, este necesară o metodă pentru a evalua probabilitatea ca setul observat de peptide să aparțină unei proteine ​​specifice. În prima variantă de realizare, calculul probabilității că setul de vârfuri nu este aleatoriu a fost utilizat pentru a rezolva această problemă. Dacă cineva își amintește de la cursul de statistici, probabilități similare sunt calculate atunci când se scoate orbește din geantă bile de diferite culori. În cazul nostru, este necesar să răspundem la întrebarea dacă bilele-peptide ale anumitor mase au fost turnate aleatoriu în spectrul nostru dintr-o pungă mare cu toate posibilitățile? Dacă meciul nu este puternic aleator, sistemul atribuie spectrului nostru un coeficient mare de probabilitate ( Scor).

Unul dintre primii algoritmi pentru amprenta peptidică a fost MOWSE, care a stat la baza programului Mascot, cunoscut pe larg de specialiști. Aș dori să vă atrag atenția asupra unui punct important în dezvoltarea analizei proteomice. De la introducerea amprentelor digitale peptidice, identificarea proteinelor și peptidelor a evoluat de la măsurare la predicție. Astfel, fiecare proteină identificată prin această metodă este caracterizată de parametrul calculat al probabilității că este într-adevăr ea. Când colorăm gelul cu anticorpi, prezența petelor pe Western blot nu ne spune așa ceva. Așadar, proteomica a intrat în era „motoarelor de căutare” - programe care compară secvențele teoretice preluate din genom cu spectrele de masă observate și returnează probabilitatea ca aceste spectre să fie obținute din proteinele și peptidele corespunzătoare.

Amprentarea digitală a peptidelor este o metodă de analiză a proteinelor degradate. În paralel, MALDI-TOF a fost utilizat pentru a studia proteinele întregi în amestecuri complexe - într-o analiză de sus în jos. Profilele proteice ale sângelui pacienților cu diferite boli, diferite celule bacteriene și eucariote au fost analizate în totalitate și spectrele de masă obținute au fost comparate în diferite grupuri în scopul diagnosticului clinic și identificării diferitelor afecțiuni. Spectrul de masă a fost folosit ca imagine, antrenând algoritmi pentru cazuri cunoscute și recunoscând în mod eficient cazuri noi. Dacă utilizarea acestei abordări pentru analiza proteinelor din sânge în diagnosticul tumorilor maligne nu a fost suficient de fiabilă pentru implementare, metoda de analiză a celulelor bacteriene întregi a devenit mai reușită și este acum utilizată în clinici. Metodele implementate pe un spectrometru de masă foarte simplu și algoritmii special instruiți atașați acestuia sunt capabili să identifice microorganismele patogene înainte de specii și genuri, cu analiza MALDI-TOF aplicată celulelor bacteriene întregi. Acestea sunt aplicate pe o țintă metalică a unui spectrometru de masă, acoperit cu o matrice și iradiate cu un laser pentru a obține profiluri specifice care sunt recunoscute de un algoritm bazat pe mase caracteristice.

Spectre de masă tandem și căutare proteomică

Scoaterea bilelor colorate din punga prăfuită a continuat când spectrometrele de masă au învățat să fragmenteze peptidele în condiții ușoare. În interiorul unor detectori, ionii de peptide și alți compuși sunt supuși unor influențe speciale, de exemplu, coliziuni cu molecule neîncărcate de gaze inerte, în urma cărora acești ioni se disociază, formând un set de fragmente (pentru mai multe detalii, vezi Fig. 9 ). După disociere, se pot măsura și masele fragmentelor. Acum, că am învățat să facem exerciții analiza tandem , sau MS-MS , fiecare peptidă este caracterizată prin masa ionului precursor, care este uneori numit ionul „părinte” și un set de mase de ioni fragmentați (ioni „fiice”).

Figura 9. Spectrometrie de masă tandem. Diagrama metodei - sus... Principalele tipuri de fragmente care se formează în timpul disocierii peptidelor în interiorul spectrometrului de masă sunt - în partea de jos... Deoarece peptidele au aceeași structură, în condiții selectate de disociere colizională, ele sunt distruse la anumite legături într-un mod previzibil. Lanțul peptidic se poate descompune la legătura dintre primul și al doilea atom (alfa) de carbon dintr-un aminoacid, formând ioni a- și x în dreapta și în stânga legăturii rupte. În mod similar, atunci când legătura peptidică este ruptă, iau ionii b și y și atunci când legătura dintre atomul de azot și atomul α-carbon este rupt, respectiv ioni c- și z.

Deci, din secvența peptidei, putem presupune greutățile moleculare ale fragmentelor din principalele tipuri formate din aceasta în timpul disocierii într-un spectrometru de masă. La fel ca în amprentele digitale ale peptidelor, secvența proteică este împărțită în peptide, iar masele peptidelor teoretice sunt comparate cu cele observate în spectru, aici este posibil să se compare fragmentele teoretice ale fiecărei peptide virtuale cu vârfurile observate ale masei tandem spectru. Cu alte cuvinte, întregul genom de codificare in Silicon este împărțit în peptide utilizând, de exemplu, tripsina, pentru fiecare dintre ele se construiește un spectru teoretic de fragmentare conform unor reguli empirice bine cunoscute. Acum, astfel de spectre teoretice de masă pot fi comparate cu cele reale și probabilitatea ca aceasta să fie peptida potrivită poate fi calculată într-un fel. Unitatea de predicție a secvenței din spectrele de masă este acum o pereche peptidă teoretică - spectru real (potrivire peptid-spectru, PSM). Evident, multe spectre, în special în cazul unui proteom mare (de exemplu, uman), pot forma perechi cu mai multe peptide teoretice, dintre care trebuie selectate cele mai bune.

Crearea motoarelor de căutare pentru spectrometria de masă tandem este un domeniu imens și au fost dezvoltate zeci de astfel de instrumente. Printre acestea, din fericire, există programe open source și eu sunt un susținător al utilizării doar a unui astfel de software în știință. Cu greu vom putea înțelege complexitățile filtrării PSM corect în acest articol. Voi spune doar că o realizare semnificativă a căutării proteomice prin spectre de masă tandem a fost invenția în 2007 a abordării (Fig. 10), în care peptidele teoretice reale, genomice ( ţintă - ţintă) atunci când se interpretează spectrele de masă, o cantitate egală de peptide false și fără sens special formate ( fals - momeală). Când, printre cei mai buni PSM, algoritmul începe să producă o potrivire cu o peptidă inexistentă cunoscută, putem opri procesul și putem determina nivelul rezultatelor fals pozitive (FDR) în datele noastre proteomice. Adică, există întotdeauna un mic amestec de minciuni în predicțiile noastre, ceea ce este inevitabil în căutările proteomice de acest tip. Este normal ca cel puțin să putem estima proporția de identificări false.

Nu aș vrea să denigrez afacerile cuiva, dar folosirea unui instrument scump în știință fără a ști cum funcționează, în opinia mea, contrazice însăși ideea dezvoltării gândirii științifice.

Figura 10. Principiul confirmării rezultatelor căutării proteomice . Testarea ipotezelor despre coincidența spectrului prezent cu teoretic conduce la formarea perechilor spectru-peptidă (PSM). Algoritmul de căutare atribuie fiecărui spectru real cel mai bun, în opinia sa, peptidă. Dar autorii metodei au înșelat - au adăugat peptide reale spectrelor teoretice ( ţintă) fals, în mod deliberat inadecvat ( momeală). Și atunci când peptidele momeală încep să corespundă spectrelor, acestea sunt erori evidente, adică rezultate fals pozitive. Așteptăm până când proporția de PSM cu aceste momeli - așa-numita rată fals pozitivă (FDR) - atinge o anumită valoare (de obicei 1%) și oprim căutarea. Acum știm aproximativ câte erori avem între identificările PSM „corecte”, deoarece probabilitatea unei greșeli față de țintă este egală cu cea față de momeală.

Invenția peptidelor MS / MS acceptabile și apariția metodelor de prelucrare a acestor date au făcut posibilă livrarea amestecurilor de peptide în spectrometrul de masă fără separarea proteinelor întregi. Adică, a devenit posibilă scindarea tuturor proteinelor din probă cu o protează și operarea cu un set de peptide, nu proteine. A apărut proteomică - „pușcă” (proteomică de pușcă ), care pentru eufonie, în detrimentul exactității, este tradus în rusă ca foc rapid sau panoramic .

Ionizare prin electrospray și proteomică rapidă la foc

Unul dintre câștigătorii Premiului Nobel din 2002, pe care l-am menționat mai sus, a fost chimistul american John Fenn. Anterior, el a sugerat utilizarea în spectrometrie de masă metoda de ionizare prin electrospray , sau, așa cum se mai numește, electrospray (ionizare prin electrospray , ESI ). Când se aplică o tensiune ridicată lichidului care iese din capilarul conic, acesta se transformă într-un aerosol și când lichidul se evaporă din particulele de aerosoli (de exemplu, într-un flux de gaz inert), sarcina electrică se poate transfera către biomolecule dizolvat în acest aerosol. Acest lucru asigură ionizarea moale la presiunea atmosferică, care aproape nu fragmentează compușii cu molecule mari, spre deosebire de multe metode de ionizare utilizate anterior. Nu lipsit de simțul umorului britanic, Fenn, în articolele și prelegerile sale, a comparat alegoric biomoleculele, pe care le-a făcut să urce cu metoda sa, cu elefanții zburători (Fig. 11).

Ionizarea prin pulverizare prin electrospray s-a dovedit a fi extrem de convenabilă pentru combinarea a două importante metode de biochimie analitică - cromatografia lichidă de înaltă performanță și spectrometria de masă. Acum, fluxul fazei cromatografice din coloana analitică ar putea fi direcționat într-un con de electrospray sau un astfel de con ar putea fi aranjat la capătul coloanei, iar spectrometrul de masă ar putea fi folosit ca analizor al moleculelor separate în coloană . Capacitatea de a efectua spectrometrie de masă tandem împreună cu dezvoltarea căutării proteomice de la mijlocul anilor 2000 a făcut o combinație de metode sub acronimul cu mai multe etaje HPLC-ESI-MS / MS , sau pur și simplu LC-MS / MS , modalitatea preferată de a studia proteomul. Acesta este cel proteomică cu foc rapid (fig. 12). A fost puțin dezamăgitor faptul că pentru implementarea sa, de regulă, este necesar să se împartă întregul proteom sau fracțiile sale în peptide de tripsină cu pierderea informațiilor despre proteinele intacte. Cu toate acestea, bonusurile de la introducerea acestei abordări s-au dovedit a fi mult mai mari.

„Democratizarea” spectrometrelor de masă de înaltă rezoluție s-a dovedit a fi un mare ajutor pentru creșterea conținutului informațional al proteomicii cu foc rapid. Anterior, pentru o precizie deosebit de mare de rezoluție și determinare, era necesar să se construiască dispozitive de rezonanță ion-ciclotron cu transformată Fourier, în care erau folosiți magneți supraconductori puternici cu inducție camp magnetic peste 7 Tesla. În ultimul deceniu, alte tipuri de detectoare au obținut performanțe comparabile. Exemple de astfel de dispozitive sunt detectoarele hibride de la diferiți producători, de exemplu, spectrometre de masă cu timp quadrupol (Q-TOF ). Poziția de frunte dintre spectrometrele de masă disponibile este ocupată de un tip special de capcană de ioni care a apărut pe piață în 2005 - Orbitrap (fig. 13). Mândria plăcută este trezită de faptul că creatorul acestei capcane este un fizician rus care lucrează pentru Thermo, absolvent al Institutului de Fizică Inginerie din Moscova, Alexander Makarov.

Brevetul Orbitrap al Thermo va expira în curând, astfel că ne putem aștepta la reduceri suplimentare de preț pentru acest tip de detector.

Acuratețea determinării greutății moleculare în analizele proteomice de rutină a ajuns la 5 ppm (adică 0,0005%) și mai jos. Acest lucru a dus la progrese semnificative în numărul proteinelor proteome astfel identificate. Astăzi, cele mai bune grupuri științifice raportează despre identificarea produselor proteice a 9-10 mii de gene prin metoda proteomicii cu foc rapid în liniile și țesuturile celulare umane, adică aproape jumătate din întregul genom de codificare. Este corect să subliniem că aceste cifre ating rata de 1% fals pozitiv.

Analiza cantitativă și etichetarea izotopilor

În mod clar, nu este suficient să se identifice pur și simplu proteinele prin metoda proteomică în majoritatea cazurilor. Pentru a înțelege mecanismele proceselor biologice, sunt necesare date cantitative care să permită o comparație a proteomilor celulelor și țesuturilor în diferite stări. Cel mai simplu mod este de a analiza câțiva indicatori ai cromatogramelor obținute în timpul lansărilor sistemului LC-MS / MS, furnizate cu date spectrale. Această abordare se numește nemarcat (cuantificare fără etichete , LFQ ), deoarece nu necesită modificări speciale ale metodei de preparare a probei. De exemplu, în proba martor, 200 de spectre au fost înregistrate din toate peptidele unei anumite proteine, iar în cea experimentală - 400. Se poate presupune că numărul spectrelor înregistrate este proporțional cu concentrația de proteine ​​din probă. Pentru comparație, se utilizează și alți parametri ai spectrelor, de exemplu, valorile normalizate ale intensității semnalului. Analiza cantitativă fără etichete bazată pe date proteomice este atractivă pentru simplitatea sa și au fost dezvoltate pentru aceasta un număr mare de soluții software, inclusiv software gratuit cu acces deschis, printre care pachetul MaxQuant dezvoltat de grupul Matthias Mann din Germania este cel mai popular astăzi. Metodele fără etichetă sunt imprecise și semicantitative, iar constatările făcute cu ele trebuie verificate într-un alt mod, cum ar fi Western blot.

Este o problemă diferită atunci când una dintre probele analizate sau toate sunt etichetate cu aceiași izotopi stabili, care au fost deja discutați mai sus. Apoi, în spectrul de masă, vârfuri de aceeași natură chimică, dar care conțin cantități diferite de izotopi stabili, vor sta unul lângă altul în spectre, separate de distanța de-a lungul axei m / z, în funcție de eticheta utilizată. Putem compara intensitățile vârfurilor adiacente ale experimentului și putem controla și calcula cu exactitate raportul dintre concentrațiile peptidelor și proteinelor corespunzătoare.

Au fost dezvoltate un număr mare de soluții tehnice care permit etichetarea izotopică. În cazul în care este posibil să se cultive celule în medii artificiale, este posibil să se eticheteze toate celulele unui grup de analiză folosind medii marcate izotopic. În unele cazuri, etichetele sunt introduse prin digestia cu tripsină. Există etichete care se manifestă pe ioni precursori, precum și pe ioni de fragmente. Acestea din urmă permit adesea analize cantitative în modul multiplex, de exemplu, kitul de etichete Thermo TMT asigură prelucrarea simultană a 11 probe cu etichete diferite! Utilizarea etichetelor izotopice crește semnificativ acuratețea analitică a analizei cantitative, care în unele cazuri poate deveni absolută, adică pentru a determina concentrațiile exacte ale compușilor analizați. Cu toate acestea, un dezavantaj semnificativ în acest caz este costul analizei.

Costul unui kit pentru etichetarea mai multor probe poate fi aproximativ dimensiunea medie a grantului RFBR (!) - pentru cei care știu.

Analiza ghidată a peptidelor - Monitorizarea răspunsului multiplu

În cele din urmă, merită menționată metoda de analiză proteomică, care în funcția sa concurează cu metodele de determinare a proteinelor folosind anticorpi. Când știm ce peptidă care caracterizează întreaga proteină pe care vrem să o măsurăm, putem regla spectrometrul de masă astfel încât să vadă, de fapt, doar această peptidă. Astfel, munca se desfășoară într-un mod direcțional (țintit). Pentru aceasta, se folosește un dispozitiv cu un detector triplu quadrupol. De fapt, acestea sunt trei spectrometre de masă identice, care stau unul după altul și transferă ioni unul la celălalt. În primul, ionul precursor necesar este filtrat, adică peptida care ne interesează, în al doilea - unde are doar „produsul” nostru - suferă fragmentare, iar al treilea înregistrează 3-5 fragmente selectate de noi în avans. Analiza cantitativă se efectuează în funcție de intensitatea fragmentelor.

Abordarea este cunoscută din analiza compușilor cu greutate moleculară mică și a început să fie utilizată pe scară largă pentru peptide la mijlocul anilor 2000, sub denumirea „ monitorizarea reacțiilor multiple » ( monitorizarea reacțiilor multiple , MRM ) sau „ monitorizarea reacțiilor selectate » ( monitorizarea reacției selectate , SRM ) (fig. 14). Această metodă nu este potrivită pentru detectarea fenomenelor noi în proteom, dar oferă o analiză cantitativă fiabilă, în special folosind standarde sintetice marcate izotopic pentru peptidele de interes. MRM permite analiza mai multor peptide într-o singură rundă LC-MS / MS. Este poziționat ca „analiză imună spectrometrică de masă” și își caută în prezent locul nu numai în știință, ci și în practica clinică și biotehnologică.

Proteomica cu anticorpi și alte molecule de legare

Odată cu avansarea aplicării precise a lichidului pe un substrat, cu alte cuvinte, imprimarea diferitelor tipuri de microcipuri, testele imune pentru proteine ​​au putut fi miniaturizate. Concomitent cu cipurile pentru hibridizarea acidului nucleic, au apărut multe soluții tehnice pentru plasarea a sute sau mai mulți anticorpi împotriva diferitelor proteine ​​pe substraturi solide. Această proliferare a testelor imune cunoscute, combinată cu o varietate de metode ingenioase pentru imagistica legării proteinelor țintă, a mutat testul cunoscut anterior în modul proteomic. Detectarea proteinelor în moduri multiple folosind molecule de legare specifice (de exemplu, anticorpi și fragmentele lor) a dobândit până acum forme atât de diverse încât trebuie creat un material separat pentru a le descrie. Nu sunt expert în microarrays-uri proteice, așa că voi lăsa altcineva să o facă.

Ar trebui menționate mai multe soluții tehnice în acest domeniu. La noi, un grup condus de A.D. Mirzabekova în urmă cu aproximativ 20 de ani a creat microcipuri pe bază de hidrogel, inclusiv pentru analiza proteinelor, iar această tehnologie este încă în curs de dezvoltare la Institutul de Biologie Moleculară al Academiei de Științe din Rusia. O alternativă la anticorpi pentru analiza proteinelor multiplex este aptameri - legarea oligonucleotidelor. Bazat pe aptameri modificați chimic, compania americană Somalogic a creat microcipuri pentru analiza a peste o mie de proteine ​​umane. Astfel de cipuri sunt utilizate din ce în ce mai mult pentru a căuta biomarkeri, ca alternativă la proteomica spectrometrică de masă.

Dacă vorbim despre anticorpi pentru analiza proteinelor la scara întregului genom, atunci nu se poate să nu menționăm puternicul proiect suedez condus de Matthias Uhlen - „Atlasul proteinelor umane”. Pe parcursul acestui proiect, anticorpi policlonali antipeptidici au fost obținuți pentru majoritatea proteinelor umane, care au fost apoi colorate cu un număr mare de țesuturi și celule. Cu prețul eforturilor semnificative, am creat o bază de date mare care conține diagrame și imagini care ilustrează sinteza majorității proteinelor genomului din diferite organe și țesuturi.

Când moleculele analizate interacționează cu biosenzorul, se modifică refracția fasciculului de lumină din interiorul biosenzorului, care este înregistrată de dispozitiv și afișată pe monitorul computerului sub formă de curbe de asociere-disociere.

Ce urmeaza?

La sfârșit, ar trebui să sublinieze perspectivele direcției despre care scrieți. Nu sunt foarte sibilă - ce se va întâmpla în continuare, de fapt, nu știu. Dar vă spun. Democratizarea așteaptă toate omixurile - tehnologia va funcționa și mai bine, iar costul analizei va scădea. Desigur, cu spectrometria de masă, nu va ajunge la soluții similare cu secvențierul de acid nucleic pe bază de nanopori, care costă deja foarte puțini bani. Totuși, acolo este necesar un vid, care este creat de o pompă. Ei bine, alte electronice.

Probele vor fi supuse mai multor tipuri de analize omix simultan. Chiar și astăzi, în unele domenii, de exemplu, în caracterizarea moleculară a tumorilor, probele tind să fie examinate în mod cuprinzător, în așa-numitele proteogenomică ... Aceasta este pentru o clasificare îmbunătățită a specimenelor, care poate duce la un management mai eficient al bolii.

A lua citiri moleculare din țesuturi omogenizate care conțin milioane sau cel puțin mii de celule este ca și cum ai estima temperatura medie într-un spital. Dacă, printre mii de celule, zeci conțin proteine ​​unice, ținte importante pentru medicamente, biomarkeri sau alte funcționale, o astfel de analiză va pierde semnalul de la acestea. Prin urmare, trebuie să se dezvolte proteomică cu celule unice ... Trebuie remarcat faptul că este mult mai dificil pentru ea să facă acest lucru decât, de exemplu, transcriptomica, deoarece semnalul de la proteine ​​nu poate fi amplificat, ca acizii nucleici în reacțiile în lanț ale polimerazei.

Ceea ce este, de asemenea, important: deja acum datele pe care le primește spectrometrul de masă sunt foarte mari - se pare că sunt Big Data. Și în mod clar nu sunt suficient interpretate. Tendința în viitorul apropiat este o creștere a conținutului informațional al datelor proteomice. Într-o formă ușor regândită, proverbul va funcționa: „Două cu un bipod (oameni care efectuează experimente și primesc date), șapte cu o lingură (informaticieni care prelucrează aceste date)”. Și este mai bine să eliminați primele două cu totul, lăsați roboții să lucreze pentru ei. Specialiștii IT se vor întinde pe plajă cu laptopuri (le plac) și îmi vor trimite date procesate și voi sta pe o blocadă undeva într-un sat rusesc (îmi place deja asta) și voi scrie despre proteomi.

Și ultimul lucru. Cercetătorii sunt persoane stricte. Prin urmare, mă aștept la unele critici asupra acestui text, care nu este deloc cuprinzător. Este posibil ca erori de fapt și tehnice să fi fost și ele pândite în articol. Cer tuturor să își exprime părerea în comentarii și personal, suntem deschiși la cooperare și cu siguranță vom corecta textul în caz de critici justificate.

Calendar

A.A. ZAMYATNIN, doctor în științe biologice, Institutul de Biochimie numit după A.N. Bach RAS

Povestea noastră va fi dedicată uneia dintre cele mai tinere științe fundamentale (dacă nu chiar cea mai tânără), care s-a născut cu doar câțiva ani în urmă împreună cu cei care sunt încă în școala elementară. Spre deosebire de multe alte științe despre proteomică, puteți spune exact în ce circumstanțe a apărut, indicați anul în care a apărut numele și cine a inventat-o.

Să începem cu circumstanțele. În a doua jumătate a secolului XX. metodele analitice de biochimie, biologie moleculară și tehnologia computerelor s-au dezvoltat rapid. Progresele remarcabile în aceste zone au condus la capacitatea de a descifra uriașe secvențe de baze de acid nucleic și de a înregistra genomul complet al unui organism viu. Pentru prima dată, genomul complet a fost descifrat în 1980 în bacteriofagul phi X-174 (aproximativ 5 × 103 baze), apoi în prima bacterie, Haemophilus influenzae (1, 8 × 106 baze). Și odată cu sfârșitul secolului XX. o lucrare ambițioasă a fost finalizată pentru a descifra genomul uman complet - pentru a identifica secvența a aproximativ 3 miliarde de baze de acid nucleic. Pentru această lucrare s-au cheltuit câteva miliarde de dolari (aproximativ un dolar pe bază). În total, genomurile a câteva zeci de specii de organisme vii au fost deja descifrate. În această perioadă au apărut două noi științe biologice: în 1987 cuvântul „genomică” a fost folosit pentru prima dată în presa științifică, iar în 1993 - „bioinformatică”.

În fiecare specie biologică, o parte a genomului este reprezentată de regiuni care codifică secvențele de aminoacizi ale proteinelor. De exemplu, există aproximativ 100.000 de astfel de zone la oameni (conform unor estimări, acest număr poate ajunge la 300.000 și ținând cont de structurile modificate chimic - câteva milioane). S-ar părea că, cunoscând genomul complet și codul genetic, prin traducere se poate obține toate informațiile despre structura proteinelor. Cu toate acestea, lucrurile nu sunt atât de simple. A devenit evident treptat că în acest sistem celular considerat al corpului nu există nicio corelație între seturile de ARNm și proteine. În plus, multe proteine ​​sintetizate pe ribozomi în conformitate cu secvența nucleotidică suferă modificări chimice după sinteză și pot exista în organism sub forme modificate și nemodificate. Și este, de asemenea, important ca proteinele să aibă o varietate de structuri spațiale, care astăzi nu pot fi determinate de secvențe liniare de nucleotide și chiar de aminoacizi. Prin urmare, izolarea directă și determinarea structurilor tuturor proteinelor funcționale rămâne o sarcină urgentă (determinarea directă a structurii a fost efectuată acum pentru aproximativ doar 10% din proteinele umane). Astfel, pe lângă genomică, a apărut termenul „proteomică”, al cărui obiect este proteomul (din engleza PROTEins - proteine ​​și genom - genom). Și în presa științifică, mențiunea proteomului a apărut pentru prima dată în 1995.

Trebuie adăugat că numeroase fragmente scurte de precursori ai proteinelor, care se numesc oligopeptide, sau pur și simplu peptide, joacă un rol important în viața organismelor. Din cauza lor se observă o astfel de discrepanță în evaluarea cantității de componente proteină-peptidă la reprezentanții unei specii biologice. Prin urmare, împreună cu termenii "proteom" și "proteomică", în prezent sunt deja folosiți termeni precum "peptidă" și "peptidomică", care fac parte din proteom și proteomică. Am vorbit mai devreme despre diversitatea structurii și funcțiilor proteinelor și peptidelor pe paginile ziarului „Biologie”.

Deci, să formulăm definițiile noilor științe care au apărut în timpul vieții tinerei generații actuale și care sunt strâns interconectate între ele (Fig. 1).

Orez. 1. Diagramă care ilustrează relația completă a celor trei noi științe biologice

Genomica este o știință care studiază structura și funcția genelor (genomul este colecția tuturor genelor dintr-un organism).

Bioinformatica este o știință care se ocupă cu studiul informațiilor biologice folosind metode matematice, statistice și computerizate.

Proteomica este o știință care studiază totalitatea proteinelor și interacțiunile acestora în organismele vii (proteomul este totalitatea tuturor proteinelor dintr-un organism).

Rețineți, de asemenea, că proteomica include în general proteomica structurală, proteomica funcțională și proteomica aplicată, pe care le vom lua în considerare separat.

Proteomică structurală

Cea mai izbitoare trăsătură a biologiei este diversitatea. Poate fi văzut la toate nivelurile de organizare biologică (specii biologice, morfologie, structura chimică a moleculelor, rețea de procese de reglementare etc.). Acest lucru se aplică pe deplin proteinelor. Scara diversității lor structurale nu a fost încă identificată pe deplin. Este suficient să spunem că numărul de reziduuri de aminoacizi dintr-o proteină poate fi de la două (structura minimă având o legătură peptidică) la zeci de mii, iar proteina Titinius uman conține 34 350 de reziduuri de aminoacizi și este de departe recordul - cea mai mare dintre toate moleculele proteice cunoscute.

Pentru a obține informații despre proteom, trebuie mai întâi să îl izolați și să îl purificați de alte molecule. Deoarece numărul de proteine ​​din întregul proteom (adică în întregul organism) este foarte mare, de obicei se ia doar o parte a organismului (organul sau țesutul său) și componenta proteică este izolată prin diferite metode. De-a lungul istoriei de aproape 200 de ani de studiu a proteinelor, au fost dezvoltate o varietate de metode pentru izolarea proteinelor - de la simpla precipitare a sării până la metode complexe moderne care iau în considerare diferitele proprietăți fizice și chimice ale acestor substanțe. După obținerea unei fracțiuni pure dintr-o proteină individuală, se determină structura sa chimică.

În proteomica structurală, structura nu a uneia, ci a multor proteine ​​este determinată simultan și până acum a fost dezvoltat un ciclu special de proceduri pentru acest lucru și a fost creat un arsenal de dispozitive corespunzătoare de înaltă precizie. (Un set complet de echipamente pentru cercetarea proteomică costă peste un milion de dolari.)

Orez. 2. Instrumente de proteomică

În fig. 2 prezintă o diagramă a ciclului de laborator de la prepararea probei până la determinarea structurii sale. După izolare și purificare (figura prezintă un preparat deja izolat și purificat), proteinele sunt separate folosind electroforeză bidimensională. Această separare se desfășoară în două direcții: într-una, moleculele de proteine ​​cu mase diferite sunt separate, în cealaltă, o sarcină electrică totală diferită. Ca rezultat al acestei proceduri subtile, molecule identice sunt grupate pe un purtător special, formând pete macroscopice, și fiecare pete conține doar aceleași molecule. Numărul de spoturi, adică numărul diferitelor proteine ​​sau peptide poate fi de multe mii (Fig. 3, 4), iar dispozitivele automate pentru prelucrare și analiză sunt utilizate pentru a le studia. Apoi, petele sunt selectate și substanțele conținute în ele sunt introduse în cel mai complex dispozitiv fizic - un spectrometru de masă, cu ajutorul căruia este determinată structura chimică (primară) a fiecărei proteine.

Orez. 3. Un exemplu de electroforegramă bidimensională de proteine ​​dintr-un extract de ficat de șoarece

Orez. 4. Un exemplu de electroforegramă bidimensională de peptide din lichidul cefalorahidian uman

Orez. 5. Secvența nucleotidică a genei care codifică albumina serică umană

Structura primară a unei proteine ​​poate fi de asemenea determinată folosind rezultatele genomicii și bioinformaticii. În fig. 5 prezintă structura completă a genei serice a albuminei umane. Conține 1830 baze azotate care codifică 610 reziduuri de aminoacizi. Această genă, la fel ca marea majoritate a altora, începe cu codonul atg, care codifică reziduul de metionină și se termină cu unul dintre codonii stop, în acest caz taa. Astfel, este codificată o structură constând din 609 reziduuri de aminoacizi (Fig. 6). Cu toate acestea, această structură nu este încă o moleculă de albumină serică, ci doar precursorul acesteia. Primele 24 de reziduuri de aminoacizi sunt așa-numita peptidă semnal, care este scindată în timpul tranziției moleculei de la nucleu la citoplasmă și numai după aceea se formează structura albuminei serice, care se obține în timpul izolării această proteină. Ca urmare, această moleculă conține 385 reziduuri de aminoacizi.

Orez. 6. Secvența de aminoacizi a precursorului albuminei serice umane, tradusă din secvența nucleotidică utilizând codul genetic

Orez. 7. Structura spațială (terțiară) a moleculei de albumină serică umană

Cu toate acestea, secvența de aminoacizi nu dezvăluie structura spațială a proteinei. Din punct de vedere al termodinamicii, o structură liniară alungită este nefavorabilă din punct de vedere energetic și, prin urmare, într-o anumită secvență, se pliază într-o structură spațială unică, care poate fi determinată folosind două metode fizice puternice - analiza difracției cu raze X și rezonanță magnetică nucleară (spectroscopie RMN). Folosind prima dintre ele, s-au determinat structurile spațiale ale câtorva mii de proteine, inclusiv albumina serică umană, a căror imagine este prezentată în Fig. 7. Această structură, spre deosebire de primară (secvența de aminoacizi), se numește terțiară și regiunile spiralizate, care sunt elemente ale structurii secundare, sunt clar vizibile în ea.

Astfel, sarcina proteomicii structurale se reduce la izolarea, purificarea, determinarea structurilor primare, secundare și terțiare ale tuturor proteinelor unui organism viu, iar principalele sale mijloace sunt electroforeza bidimensională, spectrometria de masă și bioinformatica.

Bioinformatica proteinelor

Existența unui număr imens de proteine ​​variate a dus la necesitatea de a crea matrice de informații - baze de date (sau bănci) de date, în care să fie introduse toate informațiile cunoscute despre ele. În prezent, există multe baze de date generale și specializate care sunt disponibile pe internet pentru toată lumea. Bazele de date generale conțin informații despre toate proteinele cunoscute ale organismelor vii, adică despre proteomul global al tuturor ființelor vii. Un exemplu de astfel de baze de date este SwissProt-TrEMBL (Elveția - Germania), care conține astăzi structurile a aproape 200.000 de proteine, determinate prin metode analitice, și aproape 2 milioane de structuri, care sunt determinate ca urmare a traducerii din secvențe de nucleotide. În fig. 8 și 9 arată numărul de proteine ​​prezente care sunt cunoscute pentru fiecare număr dat de reziduuri de aminoacizi. Axele absciselor din aceste grafice sunt limitate la 2000 de reziduuri, dar, așa cum s-a menționat mai sus, deși nu de multe ori, se întâlnesc și molecule semnificativ mai mari. Din datele prezentate în figuri rezultă că cel mai mare număr proteinele conțin câteva sute de reziduuri de aminoacizi. Acestea includ enzime și alte molecule foarte mobile. Printre proteinele mai mari, există multe care îndeplinesc o funcție de susținere sau de protecție, ținând împreună structuri biologice și oferindu-le rezistență.

Orez. 8. Distribuția proteinelor cunoscute (izolate) după numărul de reziduuri de aminoacizi

Orez. 9. Distribuirea secvențelor de aminoacizi traduse după numărul de reziduuri de acid minic

Orez. 10. Distribuția oligopeptidelor naturale cunoscute după numărul de reziduuri de aminoacizi

În proteomul global, un loc special este ocupat de molecule mici, foarte mobile, care conțin nu mai mult de 50 de reziduuri de aminoacizi și care posedă un spectru specific de activitate funcțională. Sunt numite oligopeptide, sau pur și simplu peptide. Pentru ei, adică pentru peptidomul global, a fost creată o bancă de date specială numită EROP-Moscova. Acest nume este o abreviere a termenului OligoPeptide de reglementare endogene (oligopeptide de reglare endogene) și indică faptul că banca a fost înființată și cu sediul în capitala țării noastre. Până în prezent, structura a aproape 6000 oligopeptide izolate de reprezentanții tuturor regatelor celor vii a fost descifrată. La fel ca proteinele mari, numărul oligopeptidelor cu un număr dat de reziduuri de aminoacizi poate fi reprezentat grafic (Fig. 10). Judecând după grafic, cele mai frecvente oligopeptide care conțin aproximativ 8-10 reziduuri de aminoacizi. Acestea conțin în principal molecule care sunt implicate în reglarea sistemului nervos și, prin urmare, sunt numite neuropeptide. Evident, cele mai rapide procese într-un organism viu se desfășoară cu participarea sistemului nervos; prin urmare, regulatorii peptidici trebuie să fie mobili și, prin urmare, mici. Cu toate acestea, trebuie remarcat faptul că, datorită diversității structurale și funcționale imense atât a proteinelor, cât și a peptidelor, nu a fost încă creată o clasificare strictă pentru acestea.

Astfel, în acest caz, sarcinile bioinformaticii sunt acumularea de informații cu privire la proprietățile fizico-chimice și biologice ale proteinelor, analiza acestor informații, catalogarea și pregătirea bazei de informații și a instrumentelor de calcul pentru identificarea mecanismelor de funcționare a acestora.

Proteomică funcțională

Prezența acestei sau acelei proteine ​​în organism oferă motive să presupunem că are (sau a avut) o anumită funcție, iar întregul proteom servește la desfășurarea întregii activități vitale a întregului organism. Proteomica funcțională se ocupă cu determinarea proprietăților funcționale ale proteomei, iar sarcinile pe care le rezolvă sunt mult mai complicate decât, de exemplu, determinarea structurilor proteine-peptide.

Este evident că funcționarea proteomei se realizează într-un mediu multicomponent în care există multe molecule din alte clase chimice - zaharuri, lipide, prostaglandine, diverși ioni și mulți alții, inclusiv molecule de apă. Este posibil ca după un timp să apară termeni precum „zahăr”, „lipidă” și altele asemenea. Moleculele de proteine ​​interacționează cu alte structuri care le înconjoară sau sunt la fel ca ele, ceea ce duce în cele din urmă la apariția reacțiilor funcționale, mai întâi la nivel molecular și apoi la nivel macroscopic. Multe astfel de procese sunt deja cunoscute, inclusiv cele care implică proteine. Printre acestea se numără interacțiunea unei enzime cu un substrat, un antigen cu un anticorp, peptide cu receptori, toxine cu canale ionice etc. (receptorii și canalele ionice sunt, de asemenea, formațiuni proteice). Pentru a identifica mecanismele acestor procese, se efectuează atât studii experimentale ale participanților individuali la interacțiune, cât și studii de sistem prin intermediul bioinformaticii. Să luăm în considerare câteva exemple de astfel de abordări sistematice.

În fig. 11 prezintă reprezentanții proteomei umane (în acest caz, peptidomul) - diverse gastrine și colecistochinine, care sunt localizate în tractul gastro-intestinal (la scrierea secvențelor de aminoacizi, a fost utilizat codul standard dintr-o literă, a cărui decodificare a fost dat de noi mai devreme). Părțile funcționale ale moleculelor acestor peptide sunt regiuni drepte foarte asemănătoare. Cu toate acestea, peptidele au exact proprietățile comportamentale opuse: gastrinele fac o persoană să se simtă flămândă, iar colecistochininele provoacă sațietate. Aparent, această diferență se datorează faptului că în secvența primară a colecistochininelor, poziția reziduului de tirozină Y este deplasată cu un pas în comparație cu gastrinele. Aceeași figură arată structura primară a cioninei peptidice obținută din cordonul protozoar Ciona intestinalis (Fig. 12). Structura sa este omologă atât pentru gastrine, cât și pentru colecistochinine și se caracterizează prin două reziduuri de tirozină situate în aceleași poziții ca în ambele peptide. Din păcate, proprietățile sale funcționale nu au fost studiate. Și cu un studiu experimental adecvat, s-ar putea răspunde la întrebarea care este rolul structurii chimice în general și a reziduurilor de tirozină în special în manifestarea efectelor fiziologice opuse.

Orez. 11. Structurile primare ale reprezentanților unui peptidom uman în comparație cu structura uneia dintre peptidele învelișului

Orez. 12. Tunicatul Ciona intestinalis, găsit în Marea Nordului

Un alt exemplu: în fig. 13 prezintă secvențele de aminoacizi ale moleculelor foarte similare, care sunt, de asemenea, combinate într-o familie structural omologă. Aceste molecule se găsesc în organisme vii foarte îndepărtate din punct de vedere evolutiv - de la insecte la mamifere. Prima linie oferă structura primară a bradikininei, care conține 9 reziduuri de aminoacizi și se găsește în multe organisme superioare, inclusiv în oameni. De-a lungul anilor, chimiștii au sintetizat diferiți analogi nenaturali ai acestei molecule pentru a răspunde la întrebarea care site este responsabil pentru interacțiunea cu receptorul. În urmă cu aproximativ 30 de ani, toate fragmentele posibile de bradikinină au fost chiar sintetizate - 8 dipeptide, 7 tripeptide etc. (sunt posibile un total de 36 de fragmente), a căror activitate a fost apoi testată în același test biologic. Rezultatul s-a dovedit a fi banal: s-a dovedit că numai întreaga moleculă în ansamblu prezintă activitate maximă și fiecare fragment are în mod individual activitate de urmărire sau zero. Această muncă laborioasă nu ar fi trebuit făcută dacă celelalte bradikinine prezentate în Fig. 2 ar fi fost cunoscute în acel moment. 13 și, prin intermediul bioinformaticii, acestea ar fi izolate de proteomul global. Familia omologă structural prezentată demonstrează clar că toate moleculele au o regiune care practic nu s-a schimbat ca urmare a evoluției biologice (regiune cvasiconservată) și este o moleculă de bradichinină a organismelor vii superioare, selectată ca fiind cea mai perfectă ca rezultat a procesului evolutiv. Acest exemplu demonstrează că proteomica, împreună cu bioinformatica, face posibilă rezolvarea rapidă (și ieftină) a problemelor științifice fundamentale.

Orez. 13. Structuri primare ale peptidelor naturale ale bradichininelor obținute din diferite organisme vii. Regiunile cvasiconservatoare sunt indicate cu caractere aldine

Orez. 14. Structuri primare ale familiei de endotelină / toxine, omologă structural

Și, în sfârșit, al treilea exemplu este familia omologă structural de toxine de endotelină și șarpe de mamifere (Fig. 14). În ciuda similitudinii izbitoare a structurilor, proprietățile lor funcționale sunt deosebit de diferite între ele: unele sunt regulatori foarte utili ai contracției vasculare, în timp ce alții sunt mortali pentru viață. În acest caz, ne confruntăm cu o situație în care structura primară nu are suficiente informații pentru a explica motivul diferenței de funcții și este necesară o analiză mai detaliată a structurii spațiale (terțiare). În fig. Figurile 15 și 16 prezintă structurile spațiale ale a doi membri ai acestei familii, endotelina-1 și sarafotoxina 6b, obținute utilizând spectroscopia RMN. În figuri, acestea sunt rotite astfel încât să se obțină o omologie spațială maximă. Dar omologia completă nu poate fi obținută pentru nicio rotație. În consecință, în ciuda marii similitudini a structurilor primare, interacțiunea lor se realizează cu diferite structuri de receptori și, prin urmare, duce la efecte fiziologice diferite.

Orez. 15. Structura spațială a peptidei vasoconstrictoare endotelină-1 umană

Orez. 16. Structura spațială a sarafotoxinei 6b a șarpelui israelian Atractaspis engaddesis

Desigur, astfel de exemple particulare nu pot caracteriza pe deplin diversitatea proteomicii funcționale. Crearea de idei despre o rețea imensă de interacțiuni între proteine ​​și alte molecule din corp necesită multă muncă și utilizarea tuturor mijloacelor de bioinformatică modernă. De fapt, crearea unor astfel de puncte de vedere abia începe. Cu toate acestea, există motive să credem că în fiecare an cunoștințele noastre în acest domeniu vor crește rapid.

Orez. 17. Contururile generale ale hărții metabolismului acidului carboxilic

Unul dintre primele succese pe această cale este crearea unei hărți a metabolismului acizilor carboxilici la Institutul de Biochimie. UN. Bach al Academiei de Științe din Rusia (Fig. 17). Această hartă este o rețea de reacții cu o structură periodică regulată. Această abordare a avut succes datorită faptului că metaboliții funcționali similari suferă transformări biochimice similare, formând derivați similari din punct de vedere funcțional. Harta conține zone verticale care conțin compuși cu același număr de atomi de carbon (de la 1 la 10), iar rândurile orizontale reprezintă rânduri de metaboliți funcționali similari. Structurile chimice de pe hartă sunt conectate prin numeroase săgeți care indică ce enzime (proteine) sunt implicate în transformările chimice corespunzătoare. Nu este adevărat că această abordare seamănă cu tabelul periodic al elementelor chimice ale D.I. Mendeleev? Și la fel ca sistemul Mendeleev, această hartă are putere predictivă. Cu ajutorul său, au fost prezise o serie de enzime noi, care au fost ulterior descoperite experimental.

Scheme similare pot fi extinse la alte procese metabolice (de exemplu, carbohidrați, aminoacizi etc.) și, de asemenea, utilizate pentru a căuta noi metaboliți ai reacțiilor biochimice.

Astfel, proteomica funcțională se preocupă de studiul relațiilor complexe dintre structura și funcțiile proteomei.

Proteomică practică

Deci, sarcina principală a proteomicii este identificarea mecanismului de interacțiune a unui număr imens de proteine ​​și peptide într-un singur organism. Ce este semnificație practică această lucrare grandioasă și costisitoare? Este evident că, în primul rând, farmacologii și medicii sunt interesați de rezultatele unei astfel de lucrări, deoarece foarte des există o legătură strânsă între modificările compoziției proteinelor și starea de boală a unei persoane. Prin urmare, noi date în proteomică vor fi utilizate (și sunt deja utilizate) pentru dezvoltarea rapidă a noilor medicamente și a noilor metode de tratament a bolilor cu care medicina se luptă de secole. Astăzi, 95% din toți agenții farmacologici afectează proteinele. Proteomica, cu abordarea sa sistemică, poate ajuta la identificarea și evaluarea importanței proteinelor noi mult mai eficient, ceea ce, la rândul său, va accelera dezvoltarea de noi teste de diagnostic și terapii.

Prima aplicare practică a cercetării proteomice a avut loc cu mult înainte de apariția termenului „proteomică”, la începutul secolului al XX-lea, când a fost descoperit rolul insulinei în dezvoltarea unei boli atât de grave precum diabetul. Crearea de medicamente pentru insulină a salvat viețile a milioane de oameni.

În prezent, proteomica, împreună cu genomica și bioinformatica, se concentrează pe crearea de noi medicamente (Fig. 18), în care anumite proteine ​​vor servi drept ținte moleculare. Procesul de găsire a unor noi ținte pentru acțiunea medicamentelor este rezolvat folosind bioinformatica, iar obiectul analizei este genomul. Cu toate acestea, după analiza genomului, este necesar să se obțină dovezi că această proteină este intens exprimată și se află în celulă în stare de lucru. Această problemă este rezolvată de proteomică. Astfel, este identificată o țintă genetică moleculară pentru medicament.

Orez. 18. Relația dintre genomică, proteomică și bioinformatică în rezolvarea problemei proiectării de noi medicamente

Trebuie remarcat faptul că proteomica însăși poate rezolva problema găsirii unei ținte. Dacă obținem hărți proteomice (similare cu cele prezentate în Fig. 3 sau 4) ale țesuturilor normale și patologice, atunci prin diferențele dintre ele este posibil să se stabilească ce proteine ​​sunt importante pentru dezvoltarea unei anumite stări patologice și să se selecteze le folosesc ca obiective sau folosesc aceste cunoștințe pentru diagnostic. Se poate presupune că în viitor, crearea hărților de sânge proteomice va fi adăugată la analiza obișnuită a sângelui. Pentru a face acest lucru, va fi necesar să se utilizeze echipamente speciale în policlinici, cu ajutorul cărora sângele va fi preluat din când în când de la pacienți. În cazul unei stări de boală, harta proteomică a unei persoane bolnave va trebui doar comparată cu propria sa hartă proteomică, dar întocmită la un moment în care era sănătos și va fi posibil să se identifice modificările care au avut loc în compoziția proteică a sângelui și să determine cauza bolii. O astfel de comparație a proteomilor celulelor tumorale și normale, celulelor înainte și după expunerea la anumiți factori (de exemplu, fizici sau chimici), utilizarea fluidelor biologice în scopuri de diagnostic - toate acestea sunt de mare interes și deschid perspective complet noi pentru medicină, medicină veterinară, farmacologie, industria alimentară și alte domenii de aplicare. O lucrare imensă și interesantă ne așteaptă.

Listă literatură

1. Sanger F., Air G.M., Barrell B.G., Brown N.L. și colab. Secvența nucleotidică a bacteriofagului phi X-174 ADN .//Natura. 1977. V. 265, nr. 5596. P. 687–695.

2. Fleischmann R.D., Adams M.D., White O. și colab. Secvențierea aleatorie a întregului genom și asamblarea Haemophilus influenzae Rd. // Știință. 1995. V. 269, nr. 5223. P. 496-512.

3. Natura. 2001. 409, # 6822 (majoritatea numărului revistei este dedicat decodificării genomului uman).

4. Ferguson-Smith A.C., Ruddle F.H. Genomica locurilor care conțin homeobox uman.//Patol. Imunopatol. Rez. 1988. V. 7, nr. 1-2. P. 119-126.

5. Franklin J. Bioinformatica schimbând fața informației // Ann. NY Acad. Știință. 1993. V. 700. P. 145-152.

6. Wasinger V. C., Cordwell S. J., Cerpa-Poljak A. și colab. Progres cu maparea produselor genice a Mollicutes: Mycoplasma genitalium. // Electroforeză. 1995. V. 16, nr. 7. P. 1090-1094.

7. Zamyatnin A.A. Lumea strălucitoare a proteinelor și peptidelor. // Biologie. 2002. Nr. 25–26. P. 8-13.

8. Gorg A., Weiss W., Dunn M. J. Tehnologia actuală de electroforeză bidimensională pentru proteomică.//Proteomică. 2004. V. 4, nr. 12. P. 3665-3685.

9. Ramstrom M., Bergquist J. Proteomică și peptidomică miniaturizată folosind separarea lichidelor capilare și spectrometrie de masă de înaltă rezoluție. // FEBS Lett. 2004. V. 567, nr. 1. P. 92-95.

10.http: //au.expasy.org/sprot/

11.http: //erop.inbi.ras.ru/

12. Malygin A.G. Metabolismul acizilor carboxilici (program periodic). - M.: " Program internațional Educație ", 1999.

Proteomica- o știință care studiază structura și funcția proteinelor, precum și analiza unei rețele complexe de interacțiuni proteină-proteină în cadrul unei celule vii.

Principalele întrebări ale proteomicii pot fi formulate după cum urmează: Care este structura și proprietățile fiecărei proteine ​​individuale? Care este setul de proteine ​​din fiecare celulă specifică a corpului? Cum interacționează numeroase și diverse proteine ​​între ele în interiorul celulei? Ce proteine ​​sunt localizate în nodurile rețelei multicomponente și cum se realizează reglarea activității fiecărei componente proteice a acestei rețele? Din păcate, încă nu există un răspuns complet la aceste întrebări. În timp ce genomul multor organisme a fost descifrat și a fost descrisă secvența nucleotidică a multor gene, funcțiile unui număr semnificativ de gene (și, prin urmare, proteinele pe care le codifică) rămân necunoscute.

Metode și sarcini principale ale proteomicii

Metodele de secvențiere joacă un rol important în studierea structurii proteinelor; metode pentru determinarea secvenței aminoacizilor din proteină (structura primară a proteinei). Metodele spectroscopice (metoda dicroismului circular și metoda spectroscopiei în infraroșu etc.) sunt utilizate pe scară largă pentru a studia organizarea spațială a aminoacizilor în structura unei proteine ​​(structura secundară și terțiară a unei proteine). Metodele RMN și analiza structurală cu raze X oferă cele mai complete și detaliate informații despre structura terțiară a proteinei și fac posibilă investigarea structurii proteinei cu o rezoluție de până la 1-3 Å. Datele privind structura terțiară a unei proteine ​​oferă informații importante despre funcțiile îndeplinite de o anumită proteină și adesea proteinele cu funcții similare au o structură spațială similară. Metodele de ultracentrifugare și filtrare pe gel permit studierea structurii cuaternare a unei proteine. Utilizarea unei combinații a tehnicilor descrise ne permite să caracterizăm în detaliu structura și proprietățile fiecărei proteine ​​individuale și astfel să obținem un răspuns la una dintre principalele întrebări ale proteomicii.

O altă problemă importantă a proteomicii este caracterizarea compoziției complete a tuturor proteinelor exprimate într-o celulă dată. Pentru a rezolva această problemă, se folosește metoda de electroforeză bidimensională pe gel (2D) cuplată cu spectrometria de masă. Electroforeza 2D permite separarea majorității proteinelor care alcătuiesc celula, iar metoda spectrometriei de masă vă permite să identificați în mod unic fiecare dintre proteine. Scopul acestui tip de cercetare este de a compara expresia proteinelor în condiții normale și sub acțiunea diferiților factori sau în diferite condiții patologice. Determinarea nivelului de exprimare a proteinelor specifice (proteine ​​marker) poate fi utilizată în diagnosticul bolilor oncologice, neurodegenerative și de altă natură.

Pentru a înțelege procesele care apar în celulă, nu este suficient să cunoaștem natura și setul de proteine ​​exprimate în anumite condiții. Este extrem de important să studiem întrebarea care proteine ​​interacționează între ele și cum afectează astfel de interacțiuni structura și proprietățile proteinelor partenere. Pentru a analiza interacțiunea proteinelor, se utilizează metode de co-imunoprecipitare (absorbția unui antigen proteic și a proteinelor partenere pe un sorbent imun) urmate de spectrometrie de masă pentru a identifica proteinele partenere, o metodă cu doi hibrizi, afișarea fagilor și multe alții. Determinarea proteinelor partenere poate furniza informații importante despre mecanismul de funcționare a proteinei studiate, iar determinarea interacțiunilor proteină-proteină permite descrierea diferitelor procese care apar în interiorul celulelor.

Istoria proteomicii

Începutul dezvoltării proteomicii poate fi asociat cu experimentele lui Frederick Senger. În anii 1940 și 50, a studiat structura insulinei și pentru prima dată a determinat secvența aminoacizilor și poziția legăturilor disulfidice. Sanger a propus o metodă de secvențiere a proteinelor folosind dinitrofluorobenzen.

  • Secvențierea proteinelor (Senger)
  • Cristalizarea (Sumner și colab.)
  • Spectrometrie de masa
  • Cercetări proteomice moderne

Deci, sarcina principală a proteomicii este identificarea mecanismului de interacțiune a unui număr imens de proteine ​​și peptide într-un singur organism. Care este semnificația practică a acestei lucrări grandioase și scumpe? Este evident că, în primul rând, farmacologii și medicii sunt interesați de rezultatele unei astfel de lucrări, deoarece foarte des există o legătură strânsă între modificările compoziției proteinelor și starea de boală a unei persoane. Prin urmare, noi date în proteomică vor fi utilizate (și sunt deja utilizate) pentru dezvoltarea rapidă a noilor medicamente și a noilor metode de tratament a bolilor cu care medicina se luptă de secole. Astăzi, 95% din toți agenții farmacologici afectează proteinele. Proteomica, cu abordarea sa sistemică, poate ajuta la identificarea și evaluarea importanței proteinelor noi mult mai eficient, ceea ce, la rândul său, va accelera dezvoltarea de noi teste de diagnostic și terapii.

Prima aplicare practică a cercetării proteomice a avut loc cu mult înainte de apariția termenului „proteomică”, la începutul secolului al XX-lea, când a fost descoperit rolul insulinei în dezvoltarea unei boli atât de grave precum diabetul. Crearea de medicamente pentru insulină a salvat viețile a milioane de oameni.

În prezent, proteomica, împreună cu genomica și bioinformatica, se concentrează pe crearea de noi medicamente (Fig. 18), în care anumite proteine ​​vor servi drept ținte moleculare. Procesul de găsire a unor noi ținte pentru acțiunea medicamentelor este rezolvat folosind bioinformatica, iar obiectul analizei este genomul. Cu toate acestea, după analiza genomului, este necesar să se obțină dovezi că această proteină este intens exprimată și se află în celulă în stare de lucru. Această problemă este rezolvată de proteomică. Astfel, este identificată o țintă genetică moleculară pentru medicament.

Trebuie remarcat faptul că proteomica însăși poate rezolva problema găsirii unei ținte. Dacă obținem hărți proteomice (similare cu cele prezentate în Fig. 3 sau 4) ale țesuturilor normale și patologice, atunci prin diferențele dintre ele este posibil să se stabilească ce proteine ​​sunt importante pentru dezvoltarea unei anumite stări patologice și să se selecteze le folosesc ca obiective sau folosesc aceste cunoștințe pentru diagnostic. Se poate presupune că în viitor, crearea hărților de sânge proteomice va fi adăugată la analiza obișnuită a sângelui. Pentru a face acest lucru, va fi necesar să se utilizeze echipamente speciale în policlinici, cu ajutorul cărora sângele va fi preluat din când în când de la pacienți. În cazul unei stări de boală, harta proteomică a unei persoane bolnave va trebui doar comparată cu propria sa hartă proteomică, dar întocmită la un moment în care era sănătos și va fi posibil să se identifice modificările care au avut loc în compoziția proteică a sângelui și să determine cauza bolii. O astfel de comparație a proteomilor celulelor tumorale și normale, celulelor înainte și după expunerea la anumiți factori (de exemplu, fizici sau chimici), utilizarea fluidelor biologice în scopuri de diagnostic - toate acestea sunt de mare interes și deschid perspective complet noi pentru medicină, medicină veterinară, farmacologie, industria alimentară și alte domenii de aplicare. O lucrare imensă și interesantă ne așteaptă.


Bibliografie

1. Sanger F., Air G.M., Barrell B.G., Brown N.L. și colab. Secvența nucleotidică a bacteriofagului phi X-174 ADN .//Natura. 1977. V. 265, nr. 5596. P. 687–695.

2. Fleischmann R.D., Adams M.D., White O. și colab. Secvențierea aleatorie a întregului genom și asamblarea Haemophilus influenzae Rd. // Știință. 1995. V. 269, nr. 5223. P. 496-512.

3. Natura. 2001. 409, # 6822 (majoritatea numărului revistei este dedicat decodificării genomului uman).

4. Ferguson-Smith A.C., Ruddle F.H. Genomica locurilor care conțin homeobox uman.//Patol. Imunopatol. Rez. 1988. V. 7, nr. 1-2. P. 119-126.

5. Franklin J. Bioinformatica schimbând fața informației .//Ann. NY Acad. Știință. 1993. V. 700. P. 145-152.

6. Wasinger V. C., Cordwell S. J., Cerpa-Poljak A. și colab. Progres cu maparea produselor genice a Mollicutes: Mycoplasma genitalium. // Electroforeză. 1995. V. 16, nr. 7. P. 1090-1094.

7. Zamyatnin A.A. Lumea strălucitoare a proteinelor și peptidelor. // Biologie. 2002. Nr. 25–26. P. 8-13.

8. Gorg A., Weiss W., Dunn M.J. Tehnologia actuală de electroforeză bidimensională pentru proteomică.//Proteomică. 2004. V. 4, nr. 12. P. 3665-3685.

9. Ramstrom M., Bergquist J. Proteomică și peptidomică miniaturizată utilizând separarea lichidelor capilare și spectrometrie de masă de înaltă rezoluție. // FEBS Lett. 2004. V. 567, nr. 1. P. 92-95.

10.http: //au.expasy.org/sprot/

11 http://erop.inbi.ras.ru/

12. Malygin A.G. Metabolismul acizilor carboxilici (program periodic). - M.: „Programul internațional de educație”, 1999.

13. Archakov A.I. Ce se află în spatele genomicii? - Proteomică. // Vopr. Miere. chimie. 2000. T. 46, nr. 4. P. 335-343.

14.ru.wikipedia.org/wiki/Proteomics

15.www.biomed.spbu.ru/equipment/proteomics/

16. thesaurus.rusnano.com/wiki/article1579

17.www.inbi.ras.ru/ubkh/49/Terentiev.pdf

18.www.strf.ru/material.aspx?CatalogId=352&d_no=11979

19.www.textronica.com/lcline/proteomics/proteomics.html

20.www.bionet.nsc.ru/bioinf/files/proneomika.pdf

21. www.bionet.nsc.ru/bioinf/files/proneomika.pdf

Proteomica este o știință funcțională, al cărei subiect principal este proteomul. Un proteom este întregul set de proteine ​​care sunt produse sau modificate de un organism sau sistem. Proteomica este știința care studiază tipurile de proteine ​​și, prin urmare, a ajutat la descoperirea multor noi tipuri ale acestui compus - mult mai mult decât se știa înainte de începerea sa ca știință. Cantitatea de proteine ​​pare să depindă de timp și de diferitele solicitări sau stresuri la care sunt expuse celulele sau organismele. Proteomica este un domeniu interdisciplinar care este în mare parte predeterminat de cele mai recente proiecte de cercetare a genomului. Acoperă studiul proteomilor de la nivelul general al compoziției, structurii și activității proteinelor. Proteomica funcțională este adesea citată ca fiind cea mai importantă componentă a genomicii funcționale.

Subiect de studiu

Definirea proteomicii nu este atât de ușoară pe cât ar putea părea la prima vedere. Această știință implică de obicei o analiză experimentală la scară largă a proteinelor și proteomilor, dar este adesea utilizată pentru a studia posibilitățile de purificare a proteinelor.

După genomică și transcriptomică, proteomica este următorul pas în studiul sistemelor biologice. Este mult mai complex decât genomica, deoarece genomul unui organism este mai mult sau mai puțin constant, în timp ce proteomul diferă de la celulă la celulă și din când în când. Genele individuale sunt exprimate în diferite tipuri de celule, ceea ce înseamnă că trebuie identificat chiar și setul principal de proteine ​​care sunt produse în celulă.

Studiază istoria

Proteomica studierii structurii proteinelor este o ramură a biochimiei care a apărut relativ recent. În trecut, cercetările privind proteinele au fost efectuate utilizând analiza ARN, dar sa dovedit că structura ARN-ului nu se corelează în niciun fel cu conținutul de proteine. Se știe că ARNm nu este întotdeauna tradus în proteine, iar cantitatea de proteină produsă pentru o anumită cantitate de ARNm depinde de gena care este transcrisă, precum și de starea fiziologică actuală a celulei. Proteomica este știința care confirmă prezența proteinelor și oferă o estimare directă a cantității prezente.

Modificări ulterioare

Extragerea unei proteine ​​din ARNm nu numai că îi dăunează, dar, în plus, multe proteine ​​suferă, de asemenea, o gamă largă de modificări chimice după acest proces. Multe dintre aceste modificări post-traducere au crucial pentru funcția proteinelor.

Fosforilarea

O astfel de modificare este fosforilarea, care are loc cu multe enzime și proteine ​​structurale în timpul semnalizării celulare. Adăugarea fosfatului la aminoacizi specifici, cel mai frecvent serine și treonină, mediată de serină / treonină kinaze sau mai puțin frecvent tirozină mediată de tirozin kinaze, face ca molecula proteică să devină o țintă pentru legarea sau interacțiunea cu un set diferit de alte molecule care recunoaște domeniul fosforilat.

Deoarece fosforilarea proteinelor este una dintre cele mai studiate modificări ale acesteia, multe eforturi "proteomice" vizează determinarea setului de proteine ​​fosforilate într-un anumit tip de celule sau țesuturi în anumite circumstanțe.

Ubiquitinare

Ubiquitina este o mică proteină care poate fi atașată la anumite substraturi de către enzime numite științific E3 ubiquitin-ligase. Determinarea proteinelor care sunt poli-ubiquitinate ajută la înțelegerea modului în care este reglementată mișcarea moleculelor acestei substanțe. De asemenea, odată ce cercetătorul a stabilit care substraturi sunt ubiquitate de fiecare ligază, este util să se determine setul de ligase exprimate într-un anumit tip de celulă.

Modificări suplimentare

Pe lângă fosforilare și ubiquitinare, proteinele pot suferi (în special) metilare, acetilare, glicozilare, oxidare și nitrozilare. Unele proteine ​​suferă toate aceste modificări, adesea în combinații dependente de timp. Aceasta ilustrează complexitatea potențială a studierii structurii și funcției proteinelor.

Proteinele individuale sunt produse în condiții diferite. O celulă poate crea seturi diferite de proteine ​​în momente diferite sau în condiții diferite, de exemplu, în timpul dezvoltării, diferențierii celulare, ciclului celular sau carcinogenezei. Creșterea în continuare a complexității proteomei, așa cum am menționat deja, implică faptul că majoritatea proteinelor pot suferi o gamă largă de modificări post-translaționale.

Prin urmare, cercetarea în domeniul proteomicii este o sarcină dificilă în viitor, chiar dacă subiectul de studiu al acestei științe rămâne limitat. Pentru sarcini mai ambițioase, cum ar fi căutarea unui biomarker pentru un subtip specific de cancer, un om de știință proteomist poate alege să studieze mai multe probe de ser de la mai mulți pacienți cu cancer pentru a minimiza factorii de confuzie. Astfel, proiectele experimentale complexe sunt uneori necesare pentru a explica complexitatea dinamică a proteomei.

Diferențe față de genomică

Proteomica oferă diferite niveluri de înțelegere decât genomica din mai multe motive:

  1. Nivelul transcripției unei gene este doar o estimare aproximativă a nivelului său de translație în proteine. ARNm abundent poate fi rapid degradat sau nu transformat în cel mai eficient mod, rezultând o cantitate mică de proteine.
  2. Așa cum s-a menționat mai sus, multe proteine ​​suferă modificări post-translaționale care le afectează foarte mult funcționalitatea. De exemplu, unele proteine ​​nu sunt active până nu devin fosforilate. Tehnici precum fosfoproteomica și glicoproteomica sunt folosite pentru a studia modificările post-translaționale.
  3. Multe transcripții au ca rezultat mai multe proteine, prin îmbinarea alternativă sau modificările alternative post-traducere.
  4. Multe proteine ​​formează complexe cu alte proteine ​​sau molecule de ARN și acționează numai în prezența acestor alte molecule. Gradul de degradare a proteinelor joacă un rol important în conținutul său.

Reproductibilitate

Unul dintre principalii factori care afectează reproductibilitatea experimentelor în proteomică este eluția simultană a multor alte peptide care pot fi măsurate prin spectrometre de masă. Acest lucru duce la diferențe stocastice între experimente datorate peptidelor triptice dependente de date. Deși analizele timpurii pe scară largă ale proteomului de drojdie au arătat o variabilitate semnificativă a rezultatelor între diferite laboratoare, aparent datorită parțial diferențelor tehnice și experimentale dintre ele, reproductibilitatea a fost îmbunătățită în analizele spectrometrice de masă ulterioare, în special atunci când se utilizează spectrometre de masă.

Metode de cercetare

Există multe metode pentru studierea proteinelor în proteomică. De obicei, ele pot fi detectate folosind anticorpi (imunoanalize) sau spectrometrie de masă. Dacă se analizează o probă biologică complexă, fie un anticorp foarte specific trebuie utilizat într-un test cantop metop blot (qdb) sau separare biochimică.

Detectarea proteinelor folosind anticorpi (imunoanalize)

Anticorpii la proteine ​​specifice sau formele lor modificate au fost folosiți în cercetarea biochimiei și a biologiei celulare. Acestea sunt printre cele mai frecvente instrumente utilizate de biologii moleculari în prezent. Există mai multe metode și protocoale specifice care implică utilizarea anticorpilor pentru a detecta o proteină. Timp de decenii, testul imunosorbent legat de enzime (ELISA) a fost folosit pentru a le detecta și cuantifica în probe biologice. Western blot poate fi utilizat pentru a detecta și cuantifica proteinele individuale, unde inițial un amestec organic complex este separat folosind SDS-PAGE și apoi proteina de interes este identificată folosind un anticorp.

Proteinele modificate pot fi studiate prin dezvoltarea unui anticorp specific pentru această modificare. De exemplu, există anticorpi care recunosc anumite proteine ​​numai atunci când sunt tirozină fosforilată, cunoscute sub numele de anticorpi fosfospecifici. În plus, există anticorpi specifici pentru alte modificări. Ele pot fi utilizate pentru a determina setul de proteine ​​modificate.

Proteomica în medicină

Detectarea bolilor la nivel molecular conduce la o nouă revoluție în diagnostic și tratament. Tehnologia digitală de imunoanaliză a îmbunătățit sensibilitatea de detectare a moleculelor la așa-numitul interval atomolar. Această oportunitate ne oferă potențialul de a descoperi noi progrese în diagnosticare și terapie, dar astfel de tehnologii au fost clasificate ca proceduri manuale care nu sunt potrivite pentru utilizarea zilnică eficientă.

Deși detectarea unei proteine ​​cu anticorpi este încă foarte frecventă în biologia moleculară, au fost dezvoltate alte metode care nu se bazează pe un anticorp. Aceste metode oferă diferite avantaje, de exemplu, ele pot determina adesea secvența unei proteine ​​sau peptide, pot avea un debit mai mare decât un anticorp și uneori pot identifica și cuantifica proteinele pentru care nu există anticorpi.

Metode de proteomică

Una dintre cele mai vechi metode de analiză a proteinelor a fost degradarea lui Edman (introdusă în 1967), unde o singură peptidă suferă mai multe etape de degradare chimică pentru a-i determina succesiunea. Aceste metode au fost în mare parte înlocuite de tehnologii care asigură un randament mai mare. Diverse domenii ale proteomicii depind, de asemenea, de metode.

Metode de separare de bază

Analiza probelor biologice complexe necesită o reducere a complexității acestora. Acest lucru se poate face folosind divizarea 1D sau 2D. Mai recent, au fost dezvoltate metode online în care peptidele individuale au fost separate folosind cromatografia în fază inversă și apoi ionizate direct folosind metoda ESI.

Tehnologii hibride

Există mai multe tehnologii hibride care purifică analiți individuali pe bază de anticorpi și apoi efectuează analize spectrometrice de masă pentru a le identifica și cuantifica. Exemple ale acestor metode sunt MSIA (Imunoanaliza spectrometrică de masă), dezvoltat de Randal Nelson în 1995 și SISCAPA (Captură standard izotopică stabilă cu anticorpi antipeptidici), introdus de Lee Anderson în 2004.

Analiza proteomică comparativă poate dezvălui rolul proteinelor în sistemele biologice complexe, inclusiv în reproducere. De exemplu, tratamentul cu insecticid triazofos duce la o creștere a răsadurilor brune (Nolaparvata lugens (Stål)) - proteine ​​accesorii masculine de fier (Acps) care pot fi transmise femeilor prin împerechere, rezultând o fertilitate crescută (adică fertilitate) în femele. Pentru a identifica modificările tipurilor de proteine ​​ale glandei accesorii (Acps) și ale proteinelor de reproducere obținute de la lăcustele masculine, cercetătorii au efectuat o analiză proteomică comparativă a masculilor dormiți N. lugens. Rezultatele au arătat că aceste proteine ​​sunt implicate în procesul de reproducere al lăcustelor N. lugens femele și masculi adulți.

Tehnologii proteomice performante

Proteomica este o știință care a crescut constant în ultimul deceniu. Multe dintre abordările dezvoltate de această știință sunt complet revoluționare, în timp ce unele se bazează pe vechi metode științifice. Spectrometria de masă și tehnicile microcelulare sunt cele mai frecvente tehnologii pentru studiile proteine ​​la scară largă.

Spectrometrie de masă și profilare

În prezent, sunt utilizate două metode de spectrometrie de masă pentru profilarea proteinelor. Metoda mai cunoscută și răspândită folosește electroforeza bidimensională de înaltă rezoluție pentru a separa proteinele din diferite probe în paralel cu selecția și colorarea ulterioară a proteinelor exprimate diferențiate, care ar trebui identificate prin spectrometrie de masă. În ciuda progreselor înregistrate în 2DE și a sofisticării generale a acestei metode, ea își are și limitele. Principala problemă este incapacitatea de a identifica toate proteinele dintr-o probă, având în vedere variabilitatea lor și alte proprietăți unice.

A doua abordare cantitativă utilizează etichete stabile de izotopi pentru a diferenția proteinele de două amestecuri complexe diferite. Aici, proteinele dintr-un amestec complex sunt mai întâi marcate cu izotopi și apoi clivate pentru a produce peptide marcate. Apoi amestecurile marcate sunt combinate, iar peptidele sunt separate prin multidimensionale cromatografie lichidăși analizate folosind spectrometria de masă în tandem. Etichetele codate cu izotopi (ICAT) sunt etichete izotopice utilizate pe scară largă. În această metodă științifică, reziduurile de cisteină ale proteinelor sunt atașate covalent la reactivul ICAT, reducând astfel complexitatea amestecurilor, cu excepția reziduurilor, altele decât cisteina.

Proteomica, genomica, metabolomica sunt direcții noi în biologie care se disting prin complexitatea și inovația lor. Nu toată lumea le poate studia.