Universidad San Sebastián  
 

Repositorio Institucional Universidad San Sebastián

Búsqueda avanzada

Descubre información por...

 

Título

Ver títulos
 

Autor

Ver autores
 

Tipo

Ver tipos
 

Materia

Ver materias

Buscar documentos por...




Mostrar el registro sencillo del ítem

dc.contributor Universidad San Sebastián. Facultad de Ingeniería en_US
dc.contributor.author Beas Aguilar, Sebastián Alejandro
dc.date 2025
dc.date.accessioned 2026-01-05T15:37:30Z
dc.date.available 2026-01-05T15:37:30Z
dc.date.issued 2025
dc.identifier.uri https://repositorio.uss.cl/handle/uss/20061
dc.description.abstract El propósito de esta tesis fue implementar modelos clasificadores de machine learning que puedan predecir eficazmente la capacidad molecular de atravesar la Barrera Hematoencefálica. Con el fin de acelerar el proceso de síntesis de nuevos fármacos para tratar enfermedades del Sistema Nervioso Central. Esto se hizo a través del entrenamiento de 4 modelos clasificadores diferentes: KNN, SVM, Random Forest y Gaussian Naive Bayes. Para esto se usó la base de datos pública B3DB la cual contiene moléculas previamente etiquetadas, luego se realizó un proceso de selección de características aplicando Información Mutua y RFEcv de manera continua. Finalmente, los parámetros de los modelos fueron optimizados a través de la técnica grid search. Se crearon versiones de los modelos sin selección de características con fines comparativos. Luego de este proceso se obtuvo como principal resultado un modelo Random Forest que logró un AUC de 0.96 y una Especificidad de 0.93. Además, se obtuvieron las importancias de características para el modelo anteriormente mencionado, en donde algunas de las principales variables fueron: TPSA, qed y NOCount. A partir de estos resultados se puede concluir que los modelos sí pueden predecir eficazmente la permeabilidad de las moléculas. Además, algunos de los modelos generados superan levemente modelos generados por otros autores usando los mismos datos. en_US
dc.description.abstract The purpose of this thesis was to implement machine learning classification models that can effectively predict the molecular ability to cross the blood-brain barrier. The aim was to accelerate the process of synthesizing new drugs to treat diseases of the central nervous system. This was done by training four different classification models: KNN, SVM, Random Forest, and Gaussian Naive Bayes. For this, the public B3DB database was used, which contains previously labeled molecules. Then, a feature selection process was performed by continuously applying Mutual Information and RFEcv. Finally, the model parameters were optimized using the grid search technique. Versions of the models without feature selection were created for comparison purposes. After this process, the main result was a Random Forest model that achieved an AUC of 0.96 and a specificity of 0.93. In addition, the feature importance for the model was obtained, where some of the main variables were: TPSA, qed, and NOCount. Based on these results, it can be concluded that the models can effectively predict the permeability of molecules. In addition, some of the models generated slightly outperform models generated by other authors using the same data.
dc.format application/pdf, 1,42 MB en_US
dc.language.iso es en_US
dc.publisher Universidad San Sebastián. Facultad de Ingeniería en_US
dc.rights CC0 1.0 Universal *
dc.rights.uri http://creativecommons.org/publicdomain/zero/1.0/ *
dc.subject Tesis Ingeniería Civil Informática en_US
dc.subject Aprendizaje de máquina
dc.subject Permeabilidad
dc.subject Algoritmos
dc.subject Permeabilidad molecular
dc.title Algoritmos de machine learning para el análisis y predicción de permeabilidad molecular en_US
dc.type Tesis en_US
dc.contributor.guide Pereira Toloza , Alfredo Jesús
dc.contributor.guide Muñoz Castro, Álvaro
dc.coverage.location Santiago en_US
uss.facultad Facultad de Ingeniería en_US
uss.carrera Ingeniería Civil Informática en_US
uss.sede Bellavista en_US
uss.programa Pregrado en_US

 

El ítem tiene asociados los siguientes ficheros de licencia:

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

CC0 1.0 Universal Excepto si se señala otra cosa, la licencia del ítem se describe como CC0 1.0 Universal