Mellora de métodos computacionais semiempíricos para a predición de reactividade química mediante técnicas de “machine learning”
Por favor, use este identificador para citas ou ligazóns a este ítem:
http://hdl.handle.net/10347/27057
Ficheiros no ítem
Metadatos do ítem
Título: | Mellora de métodos computacionais semiempíricos para a predición de reactividade química mediante técnicas de “machine learning” |
Autor/a: | García Andrade, Xabier |
Dirección/Titoría: | Martínez Nuñez, Emilio García Tahoces, Pablo |
Centro/Departamento: | Universidade de Santiago de Compostela. Facultade de Química |
Palabras chave: | Machine learning | Química computacional | Intelixencia artificial | Artificial intelligence | Computational chemistry | Inteligencia artificial | |
Data: | 2021-07 |
Resumo: | O machine learning e a intelixencia artificial estanse convertindo en técnicas
cada vez máis presentes na investigación en química computacional. A medida
que temos acceso a unha maior cantidade datos de química cuántica, aumentan
as posibilidades de uso de algoritmos intelixentes para a exploración do espazo
químico.
Por outra parte, aínda non dispoñemos de métodos eficientes para a predición
de propiedades de reacción cuantitativas. Entre estas propiedades atópase
a enerxía de activación, cuxa predición de forma precisa proporcionaría un
método para o descubrimento de novos mecanismos de reacción e forneceríanos
control sobre a cinética das reaccións.
O presente traballo intenta buscar un algoritmo baseado en machine learning
para a predición de enerxías de activación. O noso modelo depende dun
cálculo a nivel semiempírico (PM7) e proporciona unha predición a nivel DFT
mediante machine learning. Con este procedemento, conseguimos precisión
química cun custo computacional reducido. Ademais de obter un rendemento
equiparable ao estado da arte, esta alternativa contribúe con descritores personalizados,
que poden ser incorporados en novos procedementos de minaría
de datos na química. Por último, tamén proporciona unha interpretación do
modelo dende a perspectiva da intuición química. El machine learning y la inteligencia artificial se están convirtiendo en técnicas cada vez más presentes en la investigación en química computacional. A medida que tenemos acceso a una mayor cantidad de datos de química cuántica, aumentan las posiblidades de uso de algoritmos inteligentes para la exploración del espacio químico. Por otra parte, todavía no disponemos de métodos eficientes para la predicción de propiedades de reacción cuantitativas. Entre estas propiedades se encuentra la energía de activación, cuya predicción de forma precisa proporcionaría un método para el descubrimiento de nuevos mecanismos de reacción y nos facilitaría el control sobre la cinética de las reacciones. El presente trabajo intenta buscar un algoritmo basado en machine learning para la predicción de energías de activación. Nuestro modelo depende de un cálculo a nivel semiempírico (PM7) y proporciona una predicción a nivel DFT mediante machine learning. Con este procedimiento, conseguimos precisión química con un coste computacional reducido. Además de obtener un rendimiento equiparable al estado del arte, esta alternativa contribuye con descriptores personalizados, que pueden ser incorporados en procedimientos de minería de datos en la química. Por último, también proporciona una interpretación del modelo desde una perspectiva de la intuición química. Machine learning and artificial intelligence are becoming ubiquitous techniques in computational chemistry research. With quantum-chemical data becoming increasingly available, intelligent algorithms are taking the upper hand in the exploration of the chemical space. On the other hand, we still lack efficient algorithms when it comes to predicting quantitative reaction properties. Within this properties, accurately predicting activation energies would enable rapid discovery of new reaction mechanisms and would grant control over chemical kinetics. The present work intends to seek for a machine learning-based algorithm to predict activation energies. Our model relies on a semiempirical calculation (PM7 level of theory) and resorts to machine learning to DFT accuracy. With this procedure, we can obtain chemical accuracy while limiting the computational expenditure. In addition to achieving state of the art performance, this approach contribute with innovative custom descriptors that can be harnessed in data mining techniques in the chemical domain and allow interpretability from the perspective of chemical intuition. |
Descrición: | Traballo Fin de Grao en Química. Curso 2020-2021 |
URI: | http://hdl.handle.net/10347/27057 |
Dereitos: | Atribución-NoComercial-CompartirIgual 4.0 Internacional |
Coleccións
-
- Grao en Química [46]
O ítem ten asociados os seguintes ficheiros de licenza: