Características químicas y predicciones de proteínas asistidas por aprendizaje automático
HogarHogar > Blog > Características químicas y predicciones de proteínas asistidas por aprendizaje automático

Características químicas y predicciones de proteínas asistidas por aprendizaje automático

Jun 18, 2023

Scientific Reports volumen 13, número de artículo: 13741 (2023) Citar este artículo

239 Accesos

3 altmétrico

Detalles de métricas

Hay esfuerzos continuos para dilucidar la estructura y las funciones biológicas de los enlaces cortos de hidrógeno (SHB), cuyos heteroátomos donantes y aceptores residen más de 0,3 Å más cerca que la suma de sus radios de van der Waals. En este trabajo, evaluamos 1070 estructuras de proteínas de resolución atómica y caracterizamos las características químicas comunes de los SHB formados entre las cadenas laterales de aminoácidos y ligandos de moléculas pequeñas. Luego desarrollamos un modelo de predicción asistida por aprendizaje automático de SHB de proteína-ligando (MAPSHB-Ligand) y revelamos que los tipos de aminoácidos y grupos funcionales de ligando, así como la secuencia de residuos vecinos, son factores esenciales que determinan la clase de proteína-ligando. enlaces de hidrógeno. El modelo MAPSHB-Ligand y su implementación en nuestro servidor web permiten la identificación efectiva de SHB proteína-ligando en proteínas, lo que facilitará el diseño de biomoléculas y ligandos que exploten estos contactos cercanos para funciones mejoradas.

Los enlaces de hidrógeno desempeñan funciones esenciales en la mediación de la estructura, la transformación conformacional y las funciones biológicas de las proteínas. Los enlaces de hidrógeno canónicos se forman a partir de residuos de aminoácidos y ligandos que contienen átomos de O o N y las distancias entre los heteroátomos, R, generalmente se encuentran dentro del rango de 2,8 a 3,2 Å1. Además de estos enlaces de hidrógeno normales (NHB), a menudo se observan enlaces de hidrógeno cortos (SHB) con R \(\le\) 2,7 Å en la superficie y en las cavidades activas de las proteínas, posiblemente porque sus pliegues tridimensionales pueden traer la columna vertebral del polipéptido, las cadenas laterales polares y los ligandos unidos en estrecha proximidad2,3,4,5,6. Como los átomos donadores y aceptores de protones residen más de un 10% más cerca que la suma de sus radios de van der Waals, las interacciones SHB se desvían significativamente de las fuerzas electrostáticas simples y, en cambio, exhiben fuertes caracteres covalentes que surgen de la deslocalización mecánica cuántica tanto de los electrones como de los electrones. protones5,7,8,9,10,11,12,13,14,15,16. Por ejemplo, cuando R se acorta, la superficie de energía electrónica para transportar el protón en un enlace de hidrógeno varía gradualmente desde un potencial de doble pozo a un potencial de un solo pozo con una barrera decreciente6,7,8,9. En el límite en el que R se vuelve más corto que 2,4 Å, la superficie de energía potencial del protón carece esencialmente de barreras. En estos casos, los efectos cuánticos electrónicos y nucleares se combinan para debilitar el confinamiento del enlace donante-H y permitir que el protón se comparta entre los grupos donante y aceptor.

Un tipo notable de SHB son los enlaces de hidrógeno de baja barrera, donde la barrera de transferencia de protones es comparable a la energía de punto cero de una vibración O – H o N – H, que suele ser de alrededor de 5 kcal / mol. Se propone que la barrera energética se vuelve suficientemente baja cuando R de un enlace de hidrógeno se encuentra entre 2,45 y 2,65 Å y las afinidades de los protones de los grupos donador y aceptor son estrechamente coincidentes. En una estructura tan compacta, los efectos cuánticos nucleares permiten que el protón se mueva libremente entre los heteroátomos y el enlace de hidrógeno se vuelve excepcionalmente fuerte17,18,19,20. Los enlaces de hidrógeno de baja barrera se observan a menudo en el sitio activo de las proteínas y, por lo tanto, están asociados con una variedad de procesos biológicos que van desde la estabilización de los intermediarios de la reacción en la catálisis enzimática hasta la regulación de la unión de antibióticos en proteínas bacterianas y la promoción de la transmisión de señales biológicas18,20. ,21,22,23,24,25,26,27,28,29. Desde su propuesta original17, los enlaces de hidrógeno de baja barrera han sido objeto de extensas investigaciones, aunque su geometría, resistencia e importancia funcional aún están en debate30,31,32,33,34,35,36. Convencionalmente, la espectroscopia de RMN se usa ampliamente para su exploración porque los protones deslocalizados exhiben cambios químicos característicos en el campo y distintos efectos isotópicos cuando se reemplazan con deuterio9,18,19,20,21,24,37. Más recientemente, los avances en la difracción de rayos X y neutrones y la espectroscopía óptica han permitido la detección directa de la posición y el entorno local de los protones, proporcionando información crucial sobre la estructura y el comportamiento de los enlaces de hidrógeno de baja barrera en proteínas grandes23,25,26. 27,28,29,35,36.

Los SHB constituyen aproximadamente el 24% de los enlaces de hidrógeno que se forman entre las cadenas laterales de los aminoácidos y se observan con frecuencia uniendo residuos del sitio activo y ligandos2,3,4,5,6,38,39. Sin embargo, la identificación inequívoca de estas estructuras compactas sólo se puede lograr cuando las proteínas se resuelven con una resolución atómica (\(\le\)1,2 Å), que sigue siendo una tarea exigente para técnicas de determinación de estructuras como la dispersión de rayos X y neutrones, la espectroscopía de RMN. y análisis de partículas individuales por microscopía crioelectrónica. Desde una perspectiva computacional, los métodos de predicción y refinamiento basados ​​en la mecánica molecular generalmente se basan en campos de fuerza clásicos que imponen una fuerte repulsión entre átomos cercanos e impiden la formación de SHB40,41,42. Como resultado de los errores de coordenadas en las estructuras cristalinas y las imprecisiones de los campos de fuerza convencionales, los SHB a menudo se pasan por alto en la construcción y predicción de estructuras de proteínas. Para abordar estos desafíos, recientemente hemos realizado una serie de estudios para analizar exhaustivamente las características estructurales y químicas de los SHB proteína-proteína y diseñar un modelo de predicción de SHB asistida por aprendizaje automático (MAPSHB) para facilitar su identificación6,38,39. En este trabajo, nos centramos en los enlaces de hidrógeno que conectan aminoácidos y ligandos de moléculas pequeñas, como cofactores enzimáticos y fármacos, en las proteínas. Discernaremos las características químicas comunes de los SHB de ligando de proteína y desarrollaremos un modelo de predicción asistida por aprendizaje automático de SHB de ligando de proteína (Ligando-MAPSHB) para la predicción efectiva de su aparición.

Del Protein Data Bank (PDB)43, recopilamos 1070 estructuras cristalinas de complejos proteína-ligando que se refinan a partir de experimentos de difracción de rayos X o neutrones y tienen una resolución mayor o igual a 1,1 Å. Estas estructuras de resolución atómica nos permiten ubicar los átomos de O y N con un error de coordenadas de 0,1 Å y distinguir adecuadamente los SHB de los NHB. Después de evaluar cada enlace de hidrógeno proteína-proteína y proteína-ligando, lo categorizamos como SHB si su R está entre 2,3 y 2,7 ​​Å, o como NHB si su R está entre 2,8 y 3,2 Å. En estos análisis, solo consideramos las cadenas laterales de los residuos de aminoácidos dada su frecuente aparición en SHB (Tablas S1 y S2), e ignoramos los ligandos de poliol y aniones inorgánicos, ya que se usan principalmente en la preparación de cristales de proteínas y son menos Es probable que participe en funciones biológicas (Tabla S4). Esta búsqueda arroja 7070 SHB y 22353 NHB que unen dos aminoácidos, y 1272 SHB y 2733 NHB que involucran tanto aminoácidos como ligandos de moléculas pequeñas. Por tanto, los SHB están presentes en aproximadamente 1 de cada 3 enlaces de hidrógeno proteína-ligando y en cada 4 enlaces de hidrógeno proteína-proteína, destacando su prevalencia en los complejos proteína-ligando.

De la Fig. 1a, aunque hay menos SHB que contienen ligandos que aquellos que involucran solo aminoácidos, tienden a formar contactos más estrechos con R entre 2,3 y 2,6 Å. Con base en nuestros cálculos anteriores de estructura electrónica en SHB proteína-proteína, anticipamos que los SHB proteína-ligando exhibirán una barrera de energía potencial poco profunda para compartir protones y un alargamiento del enlace Donante-H. Además, esperamos que sus propiedades estén fuertemente influenciadas por efectos de la mecánica cuántica en los grados de libertad electrónicos y nucleares6. El 81% de estos SHB tienen O como átomo donador y aceptor, mientras que el resto se forma principalmente entre los átomos de O y N en las cadenas laterales y ligandos de los aminoácidos (Tabla S3).

( a ) Distribuciones de probabilidad de los 7070 SHB proteína-proteína y 1272 SHB proteína-ligando en diferentes R. (b) Distribución de categorías de ligandos en los SHB proteína-ligando. Ejemplos de estructuras de SHB formadas entre (c) Asp10 y G7P en el sitio activo de \(\beta\)-fosfoglucomutasa (PDB ID 2WF7)44 y (d) Ser163 y NADP\(^+\) en el sitio activo de curacina ciclopropanasa (PDB ID 5DP2).45 En las estructuras, plata, rojo, azul, tostado y blanco representan los átomos de C, O, N, P y H, respectivamente.

En nuestro conjunto de datos, los SHB de ligando de proteína están presentes en una amplia gama de macromoléculas biológicas, que incluyen enzimas, proteínas de señalización, proteínas de transporte y proteínas de unión a carbohidratos. Para evaluar sus funciones potenciales en la modulación de las estructuras y funciones de estas biomoléculas, agrupamos los ligandos por sus geometrías moleculares y propiedades químicas e identificamos algunas categorías clave. Como se muestra en la Fig. 1b, los carbohidratos son la categoría más abundante y aparecen en el 21,6% de los SHB de ligandos de proteínas. En particular, se observa comúnmente que \(\alpha\)-L-fucosa, \(\beta\)-D-glucosa, \(\alpha\)-D-manosa y sus derivados participan en interacciones SHB con el sitio activo. Residuos de proteínas fijadoras de carbohidratos. Como ejemplo, la Fig. 1c muestra la unión de 6-fosfonometil-6-desoxi-glucosa (G7P) en el sitio activo de \(\beta\)-fosfoglucomutasa, formando un análogo del estado de transición a lo largo de la vía de isomerización de la conversión de \( \beta\)-D-glucosa 1-fosfato a \(\beta\)-D-glucosa 6-fosfato44. El residuo del sitio activo Asp10 está colocado de manera que su cadena lateral de carboxilato se une con el grupo 1-OH de G7P, formando un contacto cercano de 2,56 Å y posiblemente facilitando la catálisis básica general de la enzima44.

Los nucleótidos representan el 21,4% de los SHB de ligandos de proteínas y el 72% de ellos son nucleótidos de piridina, es decir, dinucleótido de nicotinamida y adenina (NAD), fosfato de dinucleótido de nicotinamida y adenina (NADP) y nucleótidos de flavina como el mononucleótido de flavina (FMN) y el dinucleótido de flavina y adenina ( MODA). Estos cofactores de nucleótidos interactúan con deshidrogenasas y flavoproteínas y son portadores de electrones esenciales en la transferencia de energía celular y los procesos redox. Por ejemplo, la figura 1d muestra la cavidad del sitio activo de la curacina ciclopropanasa, una enoil reductasa que cataliza la biosíntesis de ciclopropano en bacterias45. La cadena lateral de hidroxilo de Ser163 forma un SHB con el grupo fosfato de NADP\(^+\) con un R de 2,64 Å, anclando el cofactor para la catálisis.45 En la Fig. 1b, los ácidos y aniones, como los ácidos grasos, el cítrico El ácido y el ion malonato se observan con frecuencia en los SHB de ligando de proteína. También se encuentra comúnmente que los hemos forman estos contactos cercanos en una variedad de proteínas que incluyen nitroforina, mioglobina, citocromo C y dehaloperoxidasa-hemoglobina. Además, los aminoácidos no proteinógenos como la S-adenosil-L-homocisteína y el ácido D-glutámico participan ocasionalmente en la formación de SHB. Dada la gran diversidad de ligandos, agrupamos el resto en la categoría "Otros". Estos incluyen alcohol, drogas y ligandos que contienen metales y representan el 33,6% de los SHB de ligandos de proteínas. Por ejemplo, se observa que una variedad de inhibidores de proteasa, incluidos indinavir, amprenavir y saquinavir, forman SHB con el residuo catalítico Asp25 de la proteasa del VIH-1, lo que indica el importante papel de estas estructuras compactas en el tratamiento terapéutico de la infección por el virus46,47 ,48.

El alfabeto proteico contiene 20 aminoácidos canónicos, entre los cuales 11 tienen cadenas laterales polares y son capaces de formar enlaces de hidrógeno. Como se muestra en la Fig. 2a, excepto Trp, todos ellos ocurren con frecuencia en SHB de ligando de proteína. Curiosamente, los aminoácidos exhiben diversas propensiones a formar SHB, \(P_{SHB}\), y se pueden clasificar en tres tipos: (A1) Tyr, Asp y Glu; (A2) Ser, Thr y Su; (A3) Arg, Lys, Asn, Gln y Trp. Es muy probable que los aminoácidos tipo A1 participen en interacciones SHB. En particular, Tyr tiene una cadena lateral de fenol que forma 142 SHB y 50 NHB con ligandos, lo que muestra la \(P_{SHB}\) más alta del 74% entre todos los aminoácidos. Le siguen Asp y Glu con valores de \(P_{SHBs}\) de 71% y 64%, respectivamente. Sus cadenas laterales de carboxilato son muy favorecidas como aceptores en los SHB, especialmente cuando los heteroátomos que interactúan están a una distancia de 2,6 Å. En el tipo A2, Ser y Thr poseen grupos hidroxilo, mientras que His tiene un grupo imidazol neutro o catiónico en sus cadenas laterales, y actúan colectivamente como donantes o aceptores de protones en 390 SHB de ligando de proteína. Sin embargo, son igualmente susceptibles a participar en interacciones NHB y sus valores de \(P_{SHBs}\) se reducen al 45%, 50% y 41%, respectivamente. A diferencia de estos dos casos, los aminoácidos tipo A3 tienen más probabilidades de formar NHB y sus \(P_{SHB}\) están por debajo del 16%.

El número (\(N_{SHBs}\)) y la probabilidad (\(P_{SHBs}\)) de SHB de ligando de proteína para (a) 11 aminoácidos con cadenas laterales polares y (b) grupos funcionales representativos en ligandos. ( c ) Distribución de SHB cargados y neutros en los SHB de ligando de proteína.

En comparación con los aminoácidos, los ligandos suelen tener estructuras moleculares más complejas y comprenden una variedad de grupos funcionales que pueden participar en interacciones de enlaces de hidrógeno. Por ejemplo, los monosacáridos son aldehídos o cetonas con múltiples grupos hidroxilo, el hemo contiene un anillo de porfirina que a menudo está unido a grupos carboxilato y los nucleótidos de piridina FAD y NADP están compuestos de nucleobases, ribosas y fosfatos. En la Fig. 2b, identificamos 11 grupos funcionales que se observan con frecuencia en SHB de ligando de proteína y los clasificamos en cuatro tipos según sus respectivos valores de \(P_{SHB}\): (L1) fenol; (L2) alquil hidroxilo; (L3) sulfato, fosfato, carboxilo y carboxilato; (L4) éster, amida, alquilamina y heterociclo aromático que contiene N. A pesar de participar solo en 52 enlaces de hidrógeno, los ligandos que contienen grupos fenol son muy propensos a formar interacciones SHB con aminoácidos. Específicamente, 38 de estos enlaces de hidrógeno son SHB, lo que lleva a un valor notable de \(P_{SHBs}\) del 73% para el grupo funcional tipo L1. Para el tipo L2, los grupos alquil hidroxilo forman la mayor cantidad de enlaces de hidrógeno proteína-ligando y actúan principalmente como donantes de protones en 657 SHB y 621 NHB. Al igual que las cadenas laterales de Ser y Thr, son propensas a formar ambas clases de enlaces de hidrógeno, lo que da como resultado un valor de \(P_{SHBs}\) del 51%. En contraste, los grupos funcionales en los otros dos tipos muestran tendencias significativamente más bajas a participar en SHB, con valores de \(P_{SHBs}\) que oscilan entre 25% y 40% para el tipo L3 y menos del 14% para el tipo L4. Las Figuras 2a yb sugieren que la presencia de cargas en las cadenas laterales de los aminoácidos y los grupos funcionales del ligando podría contribuir a la formación de SHB. Como se demuestra en la Fig. 2c, observamos una gran cantidad de SHB con grupos donantes y aceptores neutros, pero la mayoría de ellos contienen al menos un participante cargado cuando R del enlace de hidrógeno está en el rango de 2,35 a 2,7 Å.

Con base en estos análisis, elegimos 14 características de entrada para el desarrollo del modelo MAPSHB-Ligand. Estos incluyen la carga, el tipo de residuo y el heteroátomo de un aminoácido, y la carga y el grupo funcional de un ligando. Además, utilizamos las constantes de disociación de ácidos y bases (\(pK_a\) y \(pK_b\)) y el coeficiente de partición octanol-agua (logP) para describir los caracteres de ionización y lipofilicidad de un ligando. Además, incluimos la secuencia de los 3 residuos vecinos en ambos lados del aminoácido porque el modelo MAPSHB ha demostrado que la secuencia de la proteína adyacente tiene una influencia considerable en la propensión de un aminoácido a formar un SHB frente a un NHB38. La ubicación del aminoácido en un enlace de hidrógeno proteína-ligando se fija en la cadena lateral de la proteína.

Dadas estas características químicas y de secuencia, se espera que el modelo MAPSHB-Ligando atribuya un enlace de hidrógeno proteína-ligando a un SHB o NHB. Para este propósito, dividimos aleatoriamente la colección general de enlaces de hidrógeno con una proporción de 80:20 y formamos un conjunto de entrenamiento que contiene 1019 SHB y 2200 NHB y un conjunto de prueba con 253 SHB y 533 NHB. De manera similar a los enlaces de hidrógeno proteína-proteína, los conjuntos de datos de los enlaces de hidrógeno proteína-ligando están desequilibrados con el doble de NHB que SHB, y la predicción de la clasificación está fuertemente influenciada por la interdependencia entre los 14 parámetros de entrada. Por lo tanto, seguimos los procedimientos utilizados para el modelo MAPSHB e invocamos los algoritmos de submuestreo y aumento de gradiente para construir el modelo MAPSHB-Ligand38. Como se demuestra en la Fig. 3, comenzamos seleccionando aleatoriamente 1019 NHB del conjunto de entrenamiento y combinándolos con los SHB para crear un conjunto de datos equilibrado con un número igual de ambas clases de enlaces de hidrógeno. Luego, este conjunto de datos se utiliza para entrenar un modelo de aumento de gradiente que emplea una serie de árboles de decisión para tener en cuenta los efectos de interacción de las 14 características de entrada. Este enfoque captura eficazmente las relaciones complejas y no lineales entre las características de entrada, lo que da como resultado una clasificación precisa de los enlaces de hidrógeno en SHB y NHB49. Después de repetir estos pasos en 10 conjuntos de datos equilibrados diferentes, obtenemos un conjunto de 10 modelos de aumento de gradiente que en conjunto constituyen el modelo MAPSHB-Ligando. Observamos que el conjunto de datos de entrenamiento muestra solo un desequilibrio de datos modesto, y es probable que un modelo desarrollado sin la estrategia de submuestreo aún funcione de manera efectiva. Como se analizó en la Sección 1.2.3 de la Información complementaria, hemos construido un modelo de aumento de gradiente únicamente y descubrimos que hace predicciones más conservadoras al favorecer la clasificación de los enlaces de hidrógeno como NHB. Por lo tanto, elegimos utilizar el modelo MAPSHB-Ligand para la detección efectiva de SHB de ligando de proteína en estructuras de proteínas.

Flujo de trabajo esquemático para el desarrollo del modelo MAPSHB-Ligand.

Hemos implementado el modelo MAPSHB-Ligand en el servidor web https://wanggroup.rutgers.edu/mapshb-model/the-mapshb-model. Cuando un investigador envía una estructura proteica al servidor web, el modelo utiliza los 10 modelos de aumento de gradiente para calcular la probabilidad de que un enlace de hidrógeno proteína-ligando sea un SHB y genera la probabilidad promediada como resultado final. Luego, la clase del enlace de hidrógeno se determina comparando la probabilidad predicha con un umbral de clasificación: se clasifica como SHB si la probabilidad es mayor o igual que el umbral, y como NHB en caso contrario. La aparición prevista de SHB de ligando de proteína podría servir como restricciones adicionales para mejorar la precisión y confiabilidad de las estructuras de proteínas refinadas. Además, estas predicciones pueden ayudar en la exploración tanto experimental como computacional de las disposiciones estructurales, la naturaleza de la mecánica cuántica y las funciones biológicas de las interacciones proteína-ligando específicas.

Para evaluar la efectividad del modelo MAPSHB-Ligand, lo aplicamos al conjunto de datos de prueba y calculamos dos métricas, precisión y recuperación, en varios valores de umbral de clasificación50. La precisión se calcula como la fracción de SHB reales entre los SHB predichos, lo que proporciona información sobre la precisión del modelo en términos de predicciones positivas verdaderas y falsas positivas. La recuperación es el porcentaje de SHB predichos correctamente dentro del número total de SHB en el conjunto de datos de prueba y cuantifica qué tan completo el modelo puede capturar estos contactos cortos en proteínas. Ambas métricas tienen una escala entre 0 y 100% y los valores más grandes indican un mejor rendimiento del modelo. Como se muestra en la Fig. 4a, existe una clara compensación entre las dos métricas y el aumento del valor de una se produce a expensas de la otra. Al aprovechar esta propiedad, se puede ajustar el umbral de clasificación y ajustar el equilibrio entre precisión y recuperación para una aplicación específica. Por ejemplo, cuando los investigadores pretenden identificar la gran mayoría de SHB de ligandos de proteínas presentes en una estructura proteica, podrían elegir un pequeño umbral de 0,062 para alcanzar una tasa de recuperación del 96%, aunque la precisión de las predicciones se limitaría a 67. % (Tabla S7). Por otro lado, si el objetivo principal es detectar con precisión la aparición de SHB de ligando de proteína, los investigadores pueden optar por un umbral alto de 0,996, que ofrece una precisión del 98 % a pesar de una tasa de recuperación más baja del 56 % (Tabla S7). ). Recomendamos utilizar un umbral de clasificación de 0,870, que es el mismo valor elegido para el modelo MAPSHB. En este umbral, el modelo MAPSHB-Ligand logra una precisión del 86% y una recuperación del 80%, lo que demuestra su capacidad para realizar predicciones precisas de SHB al tiempo que identifica una parte sustancial de ellos dentro de una proteína (Fig. 4a).

Análisis del modelo MAPSHB-Ligando. a) La precisión y recuperación del modelo en función del umbral de clasificación. La línea discontinua vertical representa nuestro umbral de clasificación recomendado de 0,870, lo que proporciona una precisión del 86 % y una recuperación del 80 %. (b) La curva ROC. Las líneas discontinuas verticales y horizontales representan la curva ROC de un modelo de clasificación perfecto, y la línea diagonal punteada representa la de un modelo de predicción aleatoria. (c) Las puntuaciones de importancia normalizadas de las 14 características de entrada. Las características que contribuyen menos del 1% a la predicción del modelo se combinan en la categoría "Otros". Estos incluyen la carga del aminoácido y la carga, \(pK_a\) y \(pK_b\) del ligando.

Reconociendo que la precisión y la recuperación se calculan en un único umbral de clasificación, construimos además una curva de característica operativa del receptor (ROC) y calculamos el área bajo la curva (AUC) como una métrica integral para evaluar las predicciones del modelo en todos los umbrales de clasificación posibles51,52 . Como se demuestra en la Fig. 4b, el análisis ROC traza el retiro frente a la tasa de falsos positivos de la clasificación binaria, es decir, la fracción de NHB que se clasifican erróneamente como SHB de todos los NHB en el conjunto de datos de prueba, y cada punto surge de un valor umbral diferente. El AUC derivado de una curva ROC oscila entre 0 y 1, y una puntuación más alta sugiere un mejor desempeño del modelo para separar las dos clases de enlaces de hidrógeno51,52. Por ejemplo, si un modelo predice aleatoriamente la clase de un enlace de hidrógeno al lanzar una moneda justa, la curva ROC seguiría la línea diagonal donde el retiro es igual a la tasa de falsos positivos y la puntuación AUC sería 0,5. En comparación, un modelo de clasificación perfecto distingue con precisión entre SHB y NHB y su curva ROC consta de dos líneas rectas, como se muestra en la figura 4b. Alcanza una puntuación AUC de 1, lo que indica un rendimiento impecable tanto en la tasa de recuperación como en la de falsos positivos51. En la Fig. 4b, la tasa de recuperación del modelo MAPSHB-Ligand muestra un rápido aumento inicial y se acerca al 100% a medida que aumenta la tasa de falsos positivos. Su curva ROC se parece mucho a la de un modelo perfecto y la puntuación AUC es 0,96, lo que demuestra la excelente capacidad del modelo MAPSHB-Ligand para diferenciar entre SHB y NHB.

Luego calculamos las puntuaciones de importancia relativa de las 14 características de entrada y descubrimos tres factores clave que determinan la predicción del modelo MAPSHB-Ligando. Como se muestra en la Fig. 4c, el tipo de residuo de los aminoácidos y el grupo funcional de los ligandos desempeñan los papeles más importantes en las predicciones del modelo y sus puntuaciones de importancia son del 19,6% y el 11,8%, respectivamente. Esta observación no es sorprendente ya que estas características químicas gobiernan directamente la afinidad de los protones de los grupos donador y aceptor, influyendo así en la fuerza de las interacciones de los enlaces de hidrógeno. De acuerdo con las figuras 2a y b, el modelo MAPSHB-Ligando proporcionaría una alta probabilidad de SHB cuando los grupos donantes y aceptores de protones consisten en aminoácidos tipo A1, como Asp y Glu, y grupos funcionales tipo L1 o L2, como el grupos alquilo o hidroxilo aromáticos de los ligandos. Por el contrario, el modelo produciría una pequeña probabilidad de SHB para la combinación de aminoácidos de tipo A3 y grupos ligando de tipo L4, por ejemplo, la cadena lateral amida de Gln y el grupo amino del ligando. Tenga en cuenta que los enlaces de hidrógeno que involucran aminoácidos de tipo A2 y grupos ligando de tipo L2 o L3 tienen una probabilidad similar de formar SHB o NHB. En tales casos, el modelo MAPSHB-Ligand considerará características de entrada adicionales, como el tipo de átomo de los aminoácidos y el logP de los ligandos, para realizar una clasificación definitiva.

Curiosamente, la secuencia de proteínas desempeña un papel importante en la modulación de la formación de SHB que contienen ligandos. De la Fig. 4c, las características de la secuencia representan colectivamente el 63,9% de la puntuación de importancia, a pesar de las modestas contribuciones de los residuos individuales que rodean un aminoácido unido por enlaces de hidrógeno (\(\sim\)10%). Como ejemplo, observamos que los residuos de Asp en las secuencias de Gly-Ser-Glu-Asp-Gly-Thr-Asp y Asp-Gly-Thr-Asp-Asn-Asp-Tyr a menudo están involucrados en interacciones SHB con carbohidratos53. 54,55,56,57. De hecho, estas secuencias están ubicadas en el bucle de unión de calcio y monosacáridos de la lectina PA-IIL y están conservadas en varias proteínas similares a PA-IIL que se encuentran en bacterias55. Vale la pena señalar que el conjunto de datos comprende sólo 41 proteínas de unión a carbohidratos, que representan el 3,8% del total de estructuras. Las estructuras restantes abarcan una amplia gama de tipos de proteínas, incluidas proteínas de señalización y transporte. Por lo tanto, el modelo MAPSHB-Ligand aprovecha eficazmente las diversas categorías de proteínas y variaciones de secuencia presentes en los datos de entrenamiento, lo que le permite mejorar la capacidad de predicción más allá de las características químicas asociadas con los SHB de proteína-ligando. Aparte de los tres factores discutidos anteriormente, las otras características de entrada se combinan para dar una puntuación de importancia del 4,7% (Fig. 4c), lo que sugiere que tienen influencias relativamente menores en las predicciones del modelo.

En este trabajo, hemos examinado el 1% de las estructuras de mayor calidad en el PDB y hemos desarrollado el modelo MAPSHB-Ligand que detecta eficazmente la presencia de SHB formados entre las cadenas laterales de aminoácidos y ligandos de moléculas pequeñas. Además, integramos este modelo en un servidor web (https://wanggroup.rutgers.edu/mapshb-model/the-mapshb-model) y brindamos a los investigadores un acceso conveniente para analizar estas interacciones especializadas. La combinación de los modelos MAPSHB-Ligand y MAPSHB presenta un enfoque eficiente para investigar las interacciones proteína-proteína y proteína-ligando que involucran SHB, especialmente en los casos en que las estructuras proteicas son de resolución moderada o baja. Las predicciones obtenidas a partir de estos modelos pueden servir como restricciones adicionales en el refinamiento experimental y computacional de las estructuras de las proteínas, y ayudar a dilucidar las bases estructurales de las interacciones proteína-proteína y proteína-ligando. Los modelos de aprendizaje automático se pueden refinar y optimizar aún más con los avances continuos en el campo de la biología estructural y la creciente disponibilidad de estructuras proteicas de alta calidad. Estos y otros modelos permitirán nuevas estrategias de ingeniería para mejorar la estabilidad y las funciones de las proteínas y facilitarán los esfuerzos racionales de diseño de fármacos para lograr una mayor eficacia aprovechando las interacciones SHB como mecanismo molecular clave.

Después de recolectar 1070 estructuras de alta resolución del PDB, agregamos átomos de H a los residuos de aminoácidos y analizamos los complejos proteína-ligando utilizando el paquete de software Amber 201658. Las estructuras de los ligandos se determinaron a partir de sus archivos de información cristalográfica (CIF). Luego modelamos las proteínas y los ligandos utilizando el campo de fuerza Amber14SB59,60 y el campo de fuerza general Amber (GAFF)61, respectivamente, y optimizamos los complejos mientras manteníamos los átomos distintos de H en sus posiciones en las estructuras cristalinas. Utilizamos tres criterios geométricos para identificar un enlace de hidrógeno: los heteroátomos son átomos de O o N; 2,3 Å \(\le\) R \(\le\) 3,2 Å; el ángulo donante-aceptor-H \(\ge\) 135\(^\circ\). Para cada enlace de hidrógeno, obtuvimos la carga, el residuo y el heteroátomo del aminoácido, la carga del ligando y la información de secuencia relevante del programa Amber 201658. Los \(pK_a\), \(pK_b\) y logP de los ligandos se estimaron utilizando el software Molecular Operating Environment (MOE)62. Los grupos funcionales de ligandos se determinaron a partir de sus conexiones atómicas.

Utilizamos el lenguaje de programación R para desarrollar el modelo MAPSHB-Ligand. Se creó un modelo de aumento de gradiente para cada conjunto de datos equilibrado invocando la función gbm63 con una función de pérdida exponencial, utilizando 5000 árboles de decisión y una contracción de 0,01. Tratamos la profundidad de la interacción como un hiperparámetro y la determinamos mediante una validación cruzada de 10 veces. Específicamente, dividimos aleatoriamente cada conjunto de datos equilibrado en 10 subconjuntos del mismo tamaño, de los cuales 9 subconjuntos se asignaron para entrenar el modelo de aumento de gradiente y el resto se usó para la validación. Este proceso se repitió 10 veces y cada subconjunto sirvió como conjunto de validación una vez. Cada combinación de entrenamiento y validación se denominó pliegue. En cada pliegue, entrenamos el modelo utilizando una profundidad de interacción candidata entre 1 y 12, evaluamos su desempeño aplicándolo al conjunto de validación y registramos la pérdida. Luego calculamos la pérdida final de la profundidad de interacción candidata como el promedio de las pérdidas obtenidas de todos los pliegues. Determinamos la profundidad de interacción óptima como aquella con la pérdida final más baja y procedimos a volver a entrenar el modelo de aumento de gradiente utilizando todo el conjunto de datos equilibrado. La función varImp en el paquete caret64 se utilizó para calcular las puntuaciones de importancia para cada modelo de refuerzo de gradiente, y las puntuaciones de importancia generales para el modelo MAPSHB-Ligando se obtuvieron promediando las de los 10 modelos de refuerzo. Los datos de la curva ROC se generaron utilizando el paquete plotROC65, y la puntuación AUC se calculó utilizando la función auc del paquete pROC66. En la Información complementaria se proporcionan más detalles sobre el análisis de enlaces de hidrógeno y el desarrollo y evaluaciones de los modelos de aprendizaje automático.

Todos los datos generados o analizados durante este estudio se incluyen en este artículo publicado y su archivo de información complementaria. Las estructuras de los complejos proteína-ligando y los códigos fuente utilizados para entrenar y evaluar el modelo MAPSHB-Ligand están disponibles en la página web https://wanggroup.rutgers.edu/mapshb-model/source-codes-for-models. El modelo MAPSHB-Ligand también se implementa como un cuaderno de Colab en https://colab.research.google.com/drive/1CJS0pDvSaKibSigDWAxkVTif_uQKZ2cX.

Baker, EN y Hubbard, RE Enlaces de hidrógeno en proteínas globulares. Prog. Biofísica. Mol. Biol. 44, 97-179 (1984).

Artículo CAS PubMed Google Scholar

Flocco, MM & Mowbray, SL Extraños compañeros de cama: Interacciones entre cadenas laterales ácidas en proteínas. J. Mol. Biol. 254, 96-105 (1995).

Artículo CAS PubMed Google Scholar

Rajagopal, S. & Vishveshwara, S. Enlaces cortos de hidrógeno en proteínas. FEBS J. 272, 1819–1832 (2005).

Artículo CAS PubMed Google Scholar

Panigrahi, SK & Desiraju, GR Enlaces de hidrógeno fuertes y débiles en la interfaz proteína-ligando. Estructura de las proteínas. Función. Bioinf. 67, 128-141 (2007).

Artículo CAS Google Scholar

Qi, HW & Kulik, HJ Evaluación de distancias no covalentes inesperadamente cortas en estructuras cristalinas de proteínas de rayos X con análisis de estructura electrónica. J. química. inf. Modelo. 59, 2199–2211 (2019).

Artículo CAS PubMed Google Scholar

Zhou, S. & Wang, L. Desentrañando las características estructurales y químicas de los enlaces de hidrógeno cortos biológicos. Química. Ciencia. 10, 7734–7745 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Huggins, ML 50 años de teoría del enlace de hidrógeno. Angélica. Química. En t. Ed. 10, 147-152 (1971).

Artículo CAS Google Scholar

Hibbert, F. y Emsley, J. Enlaces de hidrógeno y reactividad química. Adv. Física. Org. Química. 26, 255–379 (1990).

CAS Google Académico

Perrin, CL y Nielson, JB Enlaces de hidrógeno “fuertes” en química y biología. Año. Rev. Phys. Química. 48, 511–544 (1997).

Artículo ADS CAS PubMed Google Scholar

Tuckerman, ME, Marx, D., Klein, ML y Parrinello, M. Sobre la naturaleza cuántica del protón compartido en los enlaces de hidrógeno. Ciencia 275, 817–820 (1997).

Artículo CAS PubMed Google Scholar

Steiner, T. El enlace de hidrógeno en estado sólido. Angélica. Química. En t. Ed. 41, 48–76 (2002).

3.0.CO;2-U" data-track-action="article reference" href="https://doi.org/10.1002%2F1521-3773%2820020104%2941%3A1%3C48%3A%3AAID-ANIE48%3E3.0.CO%3B2-U" aria-label="Article reference 11" data-doi="10.1002/1521-3773(20020104)41:13.0.CO;2-U">Artículo CAS Google Scholar

Raugei, S. & Klein, ML Efectos cuánticos nucleares y enlaces de hidrógeno en líquidos. Mermelada. Química. Soc. 125, 8992–8993 (2003).

Artículo CAS PubMed Google Scholar

Grabowski, SJ ¿Cuál es la covalencia de los enlaces de hidrógeno? Química. Rev. 111, 2597–2625 (2011).

Artículo CAS PubMed Google Scholar

Li, X.-Z., Walker, B. y Michaelides, A. Naturaleza cuántica del enlace de hidrógeno. Proc. Nacional. Acad. Ciencia. Estados Unidos 108, 6369–6373 (2011).

Artículo ADS CAS PubMed Central Google Scholar

Ceriotti, M. et al. Efectos cuánticos nucleares en agua y sistemas acuosos: experimento, teoría y desafíos actuales. Química. Rev. 116, 7529–7550 (2016).

Artículo CAS PubMed Google Scholar

Dereka, B. y otros. Cruce del hidrógeno al enlace químico. Ciencia 371, 160–164 (2021).

Artículo ADS CAS PubMed Google Scholar

Cleland, WW Enlaces de hidrógeno de baja barrera y bases de bajo factor de fraccionamiento en reacciones enzimáticas. Bioquímica 31, 317–319 (1992).

Artículo CAS PubMed Google Scholar

Frey, P., Whitt, S. y Tobin, J. Un enlace de hidrógeno de baja barrera en la tríada catalítica de serina proteasas. Ciencia 264, 1927-1930 (1994).

Artículo ADS CAS PubMed Google Scholar

Cleland, W. & Kreevoy, M. Enlaces de hidrógeno de baja barrera y catálisis enzimática. Ciencia 264, 1887–1890 (1994).

Artículo ADS CAS PubMed Google Scholar

Cleland, WW, Frey, PA y Gerlt, JA El enlace de hidrógeno de baja barrera en catálisis enzimática. J. Biol. Química. 273, 25529–25532 (1998).

Artículo CAS PubMed Google Scholar

Mildvan, A. y col. Enlaces de hidrógeno fuertes y cortos en enzimas: RMN y estudios mecanicistas. J. Mol. Estructura. 615, 163-175 (2002).

Artículo ADS CAS Google Scholar

Yamaguchi, S. y col. Enlaces de hidrógeno de baja barrera en proteína amarilla fotoactiva. Proc. Nacional. Acad. Ciencia. EE.UU. 106, 440–444.

Artículo ADS CAS PubMed PubMed Central Google Scholar

Dajnowicz, S. y col. Visualización directa de átomos de hidrógeno críticos en una enzima piridoxal 5\(^\prime\)-fosfato. Nat. Comunitario. 8, 955 (2017).

Artículo ADS PubMed PubMed Central Google Scholar

Agback, P. & Agback, T. Evidencia directa de un enlace de hidrógeno de baja barrera en la tríada catalítica de una serina proteasa. Ciencia. Rep. 8, 10078 (2018).

Artículo ADS PubMed PubMed Central Google Scholar

Kumar, P., Serpersu, EH y Cuneo, MJ Un enlace de hidrógeno de baja barrera media la resistencia a los antibióticos en una tríada catalítica no canónica. Ciencia. Adv. 4, eas8667 (2018).

Artículo ADS PubMed PubMed Central Google Scholar

Kumar, P. y col. Los enlaces de hidrógeno canónicos y de baja barrera modulan la actividad y la especificidad de una tríada catalítica. Angélica. Química. En t. Ed. 58, 16260–16266 (2019).

Artículo CAS Google Scholar

Dai, S. y col. Enlaces de hidrógeno de baja barrera en la cooperatividad enzimática. Naturaleza 573, 609–613 (2019).

Artículo ADS CAS PubMed Google Scholar

Kemp, MT, Lewandowski, EM y Chen, Y. Enlaces de hidrógeno de baja barrera en la estructura y función de las proteínas. Biochim. Biofísica. Proteoma de Proteínas Acta. 1869, 140557 (2021).

Artículo CAS PubMed Google Scholar

Drago, VN et al. Un enlace de hidrógeno de barrera baja n\(\cdot \cdot \cdot\)h\(\cdot \cdot \cdot\)n preorganiza el sitio catalítico de la aspartato aminotransferasa para facilitar la segunda media reacción. Química. Ciencia. 13, 10057–10065 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Warshel, A., Papazyan, A. y Kollman, P. Sobre enlaces de hidrógeno de baja barrera y catálisis enzimática. Ciencia 269, 102-106 (1995).

Artículo ADS CAS PubMed Google Scholar

Ash, EL, Sudmeier, JL, De Fabo, EC y Bachovchin, WW ¿Un enlace de hidrógeno de baja barrera en la tríada catalítica de serina proteasas? Teoría versus experimento. Ciencia 278, 1128 (1997).

Artículo ADS CAS PubMed Google Scholar

Schutz, CN y Warshel, A. Revisión de la propuesta del enlace de hidrógeno de baja barrera (LBHB): el caso del par áspid-his en serina proteasas. Proteínas 55, 711–723 (2004).

Artículo CAS PubMed Google Scholar

Fuhrmann, CN, Daugherty, MD y Agard, DA La cristalografía de Subangstrom revela que los enlaces de hidrógeno iónicos cortos, y no un enlace de hidrógeno de baja barrera his-asp, estabilizan el estado de transición en la catálisis de serina proteasa. Mermelada. Química. Soc. 128, 9086–9102 (2006).

Artículo CAS PubMed Google Scholar

Perrin, CL ¿Son inusualmente fuertes los enlaces de hidrógeno cortos y de baja barrera? Acc. Química. Res. 43, 1550-1557 (2010).

Artículo CAS PubMed Google Scholar

Oltrogge, LM & Boxer, SG Enlaces cortos de hidrógeno y deslocalización de protones en proteínas fluorescentes verdes. Céntimo ACS. Ciencia. 1, 148-156 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Lin, C.-Y. & Boxer, SG Sensibilidad espectroscópica y de campo eléctrico inusual de cromóforos con enlaces de hidrógeno cortos: GFP y PYP como sistemas modelo. J. Física. Química. B 124, 9513–9525 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Pinney, M. y col. Acoplamiento estructural a lo largo de las redes de enlaces de hidrógeno del sitio activo de la cetoesteroide isomerasa y la proteína amarilla fotoactiva. Mermelada. Química. Soc. 140, 9827–9843 (2018).

Artículo CAS PubMed Google Scholar

Zhou, S., Liu, Y., Wang, S. y Wang, L. Predicción eficaz de enlaces cortos de hidrógeno en proteínas mediante un método de aprendizaje automático. Ciencia. Rep. 12, 469 (2022).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Zhou, S. & Wang, L. Enlaces cortos de hidrógeno en proteínas (Elsevier, 2022).

Reservar Google Académico

Gippert, GP, Yip, PF, Wright, PE y Case, DA Métodos computacionales para determinar estructuras de proteínas a partir de datos de RMN. Bioquímica. Farmacéutico. 40, 15-22 (1990).

Artículo CAS PubMed Google Scholar

Feig, M. Refinamiento computacional de la estructura de las proteínas: casi hemos llegado, pero aún queda mucho por hacer. CABLES Computación. Mol. Ciencia. 7, e1307 (2017).

Artículo de Google Scholar

Moriarty, NW y cols. Restricciones químicas mejoradas para el refinamiento cristalográfico mediante la integración del campo de fuerza ámbar en Phoenix. Acta Crystallogr. D 76, 51–62 (2020).

Artículo CAS Google Scholar

Berman, HM y cols. El banco de datos de proteínas. Ácidos nucleicos res. 28, 235–242 (2000).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Jin, Y. et al.\(\alpha\)-fluorofosfonatos revelan cómo una fosfomutasa conserva la conformación del estado de transición sobre el reconocimiento de hexosa en su reacción de dos pasos. Proc. Nacional. Acad. Ciencia. Estados Unidos 111, 12384–12389 (2014).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Khare, D. y col. Base estructural para la ciclopropanación mediante una proteína reductasa portadora de enoil-acil única. Estructura 23, 2213–2223 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Liu, F. y col. Cambios cinéticos, de estabilidad y estructurales en estructuras cristalinas de alta resolución de la proteasa del VIH-1 con mutaciones resistentes a los medicamentos L24I, I50V y G73S. J. Mol. Biol. 354, 789–800 (2005).

Artículo CAS PubMed PubMed Central Google Scholar

Shen, C.-H., Wang, Y.-F., Kovalevsky, AY, Harrison, RW & Weber, IT Amprenavir complejos con proteasa VIH-1 y sus mutantes resistentes a los medicamentos que alteran los grupos hidrofóbicos. FEBS J. 277, 3699–3714 (2010).

Artículo CAS PubMed PubMed Central Google Scholar

Olajuyigbe, F., Demitri, N. & Geremia, S. Investigación del trastorno doble de los inhibidores y la potencia relativa mediante cristalizaciones de proteasa del VIH-1 en mezclas de ritonavir y saquinavir. Cristal. Crecimiento Des. 11, 4378–4385 (2011).

Artículo CAS Google Scholar

Friedman, JH Aproximación de la función codiciosa: una máquina de refuerzo de gradiente. Ana. Estadístico. 29, 1189-1232 (2001).

Artículo MathSciNet MATEMÁTICAS Google Scholar

Powers, D. Evaluación: desde la precisión, el recuerdo y la medida F hasta la República de China, la información, el marcado y la correlación. J. Mach. Aprender. Tecnología. 2, 37–63 (2011).

Google Académico

Hanley, JA y McNeil, BJ El significado y uso del área bajo una curva característica operativa del receptor (ROC). Radiología 143, 29–36 (1982).

Artículo CAS PubMed Google Scholar

Hajian-Tilaki, K. Análisis de la curva de características operativas del receptor (ROC) para la evaluación de pruebas de diagnóstico médico. Caspian J. Pasante. Medicina. 4, 627 (2013).

PubMed PubMed Central Google Académico

Sudakevitz, D. y cols. Una nueva lectina RS-IIL de unión a manosa de alta afinidad de Ralstonia solanacearum que se asemeja estructuralmente a la lectina PA-IIL específica de fucosa de Pseudomonas aeruginosa. Mol. Microbiol. 52, 691–700 (2004).

Artículo CAS PubMed Google Scholar

Perret, S. y col. Base estructural de la interacción entre los oligosacáridos de la leche humana y la lectina bacteriana PA-IIL de Pseudomonas aeruginosa. Bioquímica. J. 389, 325–332 (2005).

Artículo CAS PubMed PubMed Central Google Scholar

Mitchell, EP y cols. Unión de fucosa de alta afinidad de la lectina PA-IIL de Pseudomonas aeruginosa: estructura cristalina de resolución de 1,0 å del complejo combinada con enfoques de termodinámica y química computacional. Estructura de las proteínas. Función. Bioinf. 58, 735–746 (2005).

Artículo CAS Google Scholar

Pokorná, M. et al. Afinidad inusual impulsada por la entropía de la lectina CV-IIL de Chromobacterium violaceum hacia la fucosa y la manosa. Bioquímica 45, 7501–7510 (2006).

Artículo PubMed Google Scholar

Marotte, K. y col. Estructuras de rayos X y termodinámica de la interacción de PA-IIL de Pseudomonas aeruginosa con derivados disacáridos. Química. Medicina. Química. 2, 1328-1338 (2007).

Artículo CAS PubMed Google Scholar

Caso, D. et al. ÁMBAR 2016 (Universidad de California, 2016).

Google Académico

Ponder, JW & Case, DA Campos de fuerza para simulaciones de proteínas. Adv. Química de proteínas. 66, 27–85 (2003).

Artículo CAS PubMed Google Scholar

Maier, JA et al. ff14SB: Mejora de la precisión de los parámetros de la cadena lateral y la columna vertebral de las proteínas de ff99SB. J. química. Computación teórica. 11, 3696–3713 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Wang, J., Wolf, RM, Caldwell, JW, Kollman, PA y Case, DA Desarrollo y prueba de un campo de fuerza ámbar general. J. Computación. Química. 25, 1157-1174 (2004).

Artículo CAS PubMed Google Scholar

Entorno operativo molecular (MOE) 2022.02 Grupo de informática química ULC, 910-1010 Sherbooke St. West, Montreal, QC H3A 2R7, Canadá (2023).

Greenwell, B., Boehmke, B., Cunningham, J. y GBM Developers. GBM: modelos de regresión potenciados generalizados. Paquete R versión 2.1.8. (2020).

Kuhn, M. Construcción de modelos predictivos en R utilizando el paquete caret. J. estadística. Software. 28, 1–26. (2008).

Sachs, MC plotROC: una herramienta para trazar curvas ROC. J. estadística. Software. 79, 1-19 (2017).

Artículo de Google Scholar

Robin, X. y col. pROC: un paquete de código abierto para R y S+ para analizar y comparar curvas ROC. BMC Bioinf. 12, 77 (2011).

Artículo de Google Scholar

Descargar referencias

Los autores agradecen a Dario Minetti y Edward Konczal del equipo de TI de SAS por configurar el servidor web para el modelo MAPSHB-Ligand. LW reconoce el apoyo de la Fundación Nacional de Ciencias a través del premio CHE-1904800. SW reconoce el apoyo de los Institutos Nacionales de Salud a través del premio R01 HG007377. Los autores agradecen a la Oficina de Computación de Investigación Avanzada de la Universidad de Rutgers por brindar acceso al servidor Amarel.

Estos autores contribuyeron igualmente: Shengmin Zhou y Yuanhao Liu.

YDS Pharmatech, Inc., Albany, Nueva York, 12226, EE. UU.

Shengmin Zhou

Departamento de Estadística, Instituto de Biomedicina Cuantitativa, Universidad de Rutgers, Piscataway, Nueva Jersey, 08854, EE. UU.

Yuanhao Liu y Sijian Wang

Departamento de Química y Biología Química, Instituto de Biomedicina Cuantitativa, Universidad de Rutgers, Piscataway, Nueva Jersey, 08854, EE. UU.

Lu Wang

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

Investigación diseñada por SZ, YL, SW y LW; SZ y YL realizaron investigaciones; SZ, YL, SW y LW analizaron los resultados. Todos los autores escribieron y revisaron el manuscrito.

Correspondencia a Sijian Wang o Lu Wang.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Zhou, S., Liu, Y., Wang, S. et al. Las características químicas y el aprendizaje automático ayudaron a predecir los enlaces de hidrógeno cortos entre proteína y ligando. Informe científico 13, 13741 (2023). https://doi.org/10.1038/s41598-023-40614-7

Descargar cita

Recibido: 04 de mayo de 2023

Aceptado: 14 de agosto de 2023

Publicado: 23 de agosto de 2023

DOI: https://doi.org/10.1038/s41598-023-40614-7

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.