Ítem
Acceso Abierto

Modelo de reconocimiento para la lengua de señas: aproximación comparativa entre métodos de reconocimiento de patrones por inteligencia artificial

dc.contributor.advisorOrjuela Cañón, Alvaro David
dc.contributor.advisorPerdomo Charry, Oscar Julián
dc.contributor.gruplacGiBiomees
dc.creatorCorredor Camargo, Simon Felipe
dc.creator.degreeMagíster en Ingeniería Biomédicaes
dc.creator.degreeLevelMaestría
dc.creator.degreetypeFull timees
dc.date.accessioned2022-07-22T01:19:36Z
dc.date.available2022-07-22T01:19:36Z
dc.date.created2022-06-24
dc.descriptionLa lengua de señas es la herramienta de comunicación más utilizadas entre la comunidad de personas con discapacidad auditiva, debido a que permite a sus usuarios comunicarse mediante gestos y movimientos. Aun así, en Colombia y en otros países como India y Estados Unidos se evidencia un reto ante la educación, estandarización y enseñanza de esta lengua, como por ejemplo de cada una de sus variaciones entre zonas geográficas y culturales. Es por esto que metodologías que permitan automatizar el proceso de enseñanza y comunicación de los usuarios de esta lengua ya bien sean sordos u oyentes, son de alta relevancia para lograr la inclusión de las personas sordas o con algún tipo de discapacidad auditiva dentro de un contexto educativo y social. Es así como este trabajo busca estudiar alternativas como algoritmos basados en redes neuronales y aprendizaje automático, con el objetivo de generar un modelo inteligente que reconozca y clasifique diferentes señas del abecedario de la Lengua Americana de Señas (ASL). Todo lo anterior se hará entrenando y validando tres modelos ya utilizados en otros problemas de clasificación de imágenes basados en Redes Neuronales Convolucionales (CNN) a los cuales se explorara sistemáticamente ajustes en su estructura e híper-parámetros para buscar el modelo que mejor se adapte a la correcta clasificación de cada una de los 27 tipos de imágenes parte de las señas del abecedario de la ASL.es
dc.description.abstractThe sign language is the communication tool that is most used within the hearingimpaired people community, as it allows their users to communicate through gestures and movements. Even though, in Colombia and some other countries in the world as India and the U.S, the challenge with education, standardization and teaching of this language is evident, an example of this are the multiple variations on these languages between the different cultures and geographic zones. For this reason, the methodologies that allows the automatization of the teaching and communication process within the users of this language (even if they are hearing impaired or not), are relevant to accomplish the inclusion within a social and educational context for the deaf people and those with any type of hear impairing. In this order this investigation aims to study alternatives as algorithms based on Neural Networks and Machine Learning, to generate a model that can recognize and classify different hand gestures part of the alphabet from the American Sign Language (ASL). All the mentioned before will be done training and validating three initial models based on Convolutional Neuronal Networks (CNN) which will be explored systematically with adjustments on structure and hyper-parameters to identify the model structure that adapts the better to the appropriate classification of each of the 27 types of images part of the signs on the ASL alphabet.es
dc.format.extent58 ppes
dc.format.mimetypeapplication/pdfes
dc.identifier.doihttps://doi.org/10.48713/10336_34586
dc.identifier.urihttps://repository.urosario.edu.co/handle/10336/34586
dc.language.isospaes
dc.publisherUniversidad del Rosario
dc.publisherEscuela Colombiana de Ingeniería Julio Garavito
dc.publisher.departmentEscuela de Medicina y Ciencias de la Saludspa
dc.publisher.programMaestría en Ingeniería Biomédicaspa
dc.rightsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.accesRightsinfo:eu-repo/semantics/openAccesses
dc.rights.accesoAbierto (Texto Completo)es
dc.rights.licenciaEL AUTOR, manifiesta que la obra objeto de la presente autorización es original y la realizó sin violar o usurpar derechos de autor de terceros, por lo tanto la obra es de exclusiva autoría y tiene la titularidad sobre la misma.spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.source.bibliographicCitationDipietro, Laura; Sabatini, Angelo M; Dario, Paolo (2008) A Survey of Glove-Based Systems and Their Applications. En: IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications. Vol. 38; No. 4; pp. 461-482 Disponible en: http://dx.doi.org/10.1109/TSMCC.2008.923862. Disponible en: 10.1109/TSMCC.2008.923862.
dc.source.bibliographicCitationSuarez, Arnol; Jimenez, Andres; Castro Franco, Mauricio; Cruz-Roa, Angel (2016) Clasificación automática de coberturas del suelo en imágenes satelitales.
dc.source.bibliographicCitationBadi, Haitham; Hussein, Sabah (2014) Hand posture and gesture recognition technology. En: Neural Computing and Applications. Vol. 25; pp. 871-878 Disponible en: http://dx.doi.org/10.1007/s00521-014-1574-4. Disponible en: 10.1007/s00521-014-1574-4.
dc.source.bibliographicCitationSaunshi, Nikunj; Gupta, Arushi; Hu, Wei (2021) A Representation Learning Perspective on the Importance of.
dc.source.bibliographicCitationMustafa, Mohammed (2021) A study on Arabic sign language recognition for differently abled using. En: Journal of Ambient Intelligence and Humanized Computing. Vol. 12; No. 3; pp. 4101-4115 : Springer Berlin Heidelberg; 1868-5145; Disponible en: https://doi.org/10.1007/s12652-020-01790-w; http://dx.doi.org/10.1007/s12652-020-01790-w. Disponible en: 10.1007/s12652-020-01790-w.
dc.source.bibliographicCitationShorten, Connor; Khoshgoftaar, Taghi M (2019) A survey on Image Data Augmentation for Deep Learning. En: Journal of Big Data. Vol. 6; No. 1; pp. 60 2196-1115; Disponible en: http://dx.doi.org/10.1186/s40537-019-0197-0. Disponible en: 10.1186/s40537-019-0197-0.
dc.source.bibliographicCitationMunib, Qutaishat; Habeeb, Moussa; Takruri, Bayan; Al-Malik, Hiba Abed (2007) American sign language (ASL) recognition based on Hough transform and. En: Expert Systems with Applications. Vol. 32; No. 1; pp. 24-37 0957-4174; Disponible en: http://dx.doi.org/10.1016/j.eswa.2005.11.018. Disponible en: 10.1016/j.eswa.2005.11.018.
dc.source.bibliographicCitationCastro, Robinson Steven (2015) Aplicativo para apoyar el proceso de aprendizaje del lenguaje de señas. : Universidad Piloto de Colombia;
dc.source.bibliographicCitationKulkarni, V S; Lokhande, a D S D (2010) Appearance Based Recognition of American Sign Language Using Gesture. En: International Journal on Computer Science and Engineering IJCSE. Vol. 2; No. 03; pp. 560-565 0975-3397; Disponible en: http://www.enggjournals.com/ijcse/doc/IJCSE10-02-03-33.pdf.
dc.source.bibliographicCitationCui, Yuntao; Weng, Juyang (2000) Appearance-based hand sign recognition from intensity image sequences. En: Computer Vision and Image Understanding. Vol. 78; No. 2; pp. 157-176 1077-3142; Disponible en: http://dx.doi.org/10.1006/cviu.2000.0837. Disponible en: 10.1006/cviu.2000.0837.
dc.source.bibliographicCitationRasband, Dan (2018) ASL Alphabet Test | Kaggle. Disponible en: https://www.kaggle.com/datasets/danrasband/asl-alphabet-test.
dc.source.bibliographicCitationNagaraj, Akash (2018) ASL Alphabet | Kaggle. Disponible en: https://www.kaggle.com/datasets/grassknoted/asl-alphabet?select=asl_alphabet_test.
dc.source.bibliographicCitationQuesada, Luis; López, Gustavo; Guerrero, Luis (2017) Automatic recognition of the American sign language fingerspelling. En: Journal of Ambient Intelligence and Humanized Computing. Vol. 8; No. 4; pp. 625-635 : Springer Berlin Heidelberg; 1868-5145; Disponible en: http://dx.doi.org/10.1007/s12652-017-0475-7. Disponible en: 10.1007/s12652-017-0475-7.
dc.source.bibliographicCitationMinisterio de Educacion Nacional de Colombia (2020) Caracterizacion De Ciudadanos, Usuarios Y Grupos De Interes De Insor 2019. pp. 1-60
dc.source.bibliographicCitationMiotto, Riccardo; Wang, Fei; Wang, Shuang; Jiang, Xiaoqian; Dudley, Joel T (2018) Deep learning for healthcare: review, opportunities and challenges. En: Brief Bioinform. Vol. 19; No. 6; pp. 1236-1246 Disponible en: https://academic.oup.com/bib/article/19/6/1236/3800524; http://dx.doi.org/10.1093/bib/bbx044. Disponible en: 10.1093/bib/bbx044.
dc.source.bibliographicCitationHe, Kaiming; Zhang, Xiangyu; Ren, Shaoqing; Sun, Jian (2016) Deep residual learning for image recognition. En: Proceedings of the IEEE Computer Society Conference on Computer Vision and. Vol. 2016-Decem; pp. 770-778 Disponible en: http://dx.doi.org/10.1109/CVPR.2016.90. Disponible en: 10.1109/CVPR.2016.90.
dc.source.bibliographicCitationNaciones Unidas (2022) Día Internacional de las Lenguas de Señas | Naciones Unidas. Disponible en: https://www.un.org/es/observances/sign-languages-day.
dc.source.bibliographicCitationMinisterio de Educacion Nacional (1996) Diccionario Básico de la Lengua de Señas Colombiana. : Instituto Nacional para Sordos;
dc.source.bibliographicCitationNVIDIA (2020) Driver persistence. No. June;
dc.source.bibliographicCitationTensorFlow (2022) Educación sobre aprendizaje automático | TensorFlow. Disponible en: https://www.tensorflow.org/resources.
dc.source.bibliographicCitationGarcía Salinero, Julia (2004) Estudios descriptivos. pp. 90-100 Disponible en: http://dx.doi.org/10.1016/b978-84-8174-709-6.50009-9. Disponible en: 10.1016/b978-84-8174-709-6.50009-9.
dc.source.bibliographicCitationKessler, G Drew; Hodges, Larry F; Walker, Neff; Evaluation of the CyberGlove as a Whole-Hand Input Device.
dc.source.bibliographicCitationOudah, Munir; Al-Naji, Ali; Chahl, Javaan (2020) Hand Gesture Recognition Based on Computer Vision: A Review of Techniques. En: Journal of Imaging. Vol. 6; No. 8; 2313-433X; Disponible en: http://dx.doi.org/10.3390/JIMAGING6080073. Disponible en: 10.3390/JIMAGING6080073.
dc.source.bibliographicCitationNakjai, Pisit; Katanyukul, Tatpong (2019) Hand Sign Recognition for Thai Finger Spelling: an Application of. En: Journal of Signal Processing Systems. Vol. 91; No. 2; pp. 131-146 : Journal of Signal Processing Systems; 1939-8115; Disponible en: http://dx.doi.org/10.1007/s11265-018-1375-6. Disponible en: 10.1007/s11265-018-1375-6.
dc.source.bibliographicCitationBai, Yu; Chen, Minshuo; Zhou, Pan; Zhao, Tuo; Lee, Jason D; Kakade, Sham; Wang, Huan; Xiong, Caiming (2021) How Important is the Train-Validation Split in Meta-Learning?.
dc.source.bibliographicCitationTowards Data Science (2018) How To Teach A Computer To See With Convolutional Neural Networks | by. Disponible en: https://towardsdatascience.com/how-to-teach-a-computer-to-see-with-convolutional-neural-networks-96c120827cd1.
dc.source.bibliographicCitationStanford Vision Lab (2020) ImageNet. Disponible en: https://www.image-net.org/challenges/LSVRC/.
dc.source.bibliographicCitationSzegedy, Christian; Ioffe, Sergey; Vanhoucke, Vincent; Alemi, Alexander A (2017) Inception-v4, inception-ResNet and the impact of residual connections on. En: 31st AAAI Conference on Artificial Intelligence, AAAI 2017. pp. 4278-4284
dc.source.bibliographicCitationKeras (2022) Keras Applications. Disponible en: https://keras.io/api/applications/.
dc.source.bibliographicCitationKhosla, Rajiv; Howlett, Robert J; Jain, Lakhmi C (2005) Lecture Notes in Artificial Intelligence 3684 Subseries of Lecture Notes.
dc.source.bibliographicCitationBanco de la República, (2017) Lengua y lenguaje. Disponible en: https://enciclopedia.banrepcultural.org/index.php?title=Lengua_y_lenguaje.
dc.source.bibliographicCitationHoward, Andrew G; Zhu, Menglong; Chen, Bo; Kalenichenko, Dmitry; Wang, Weijun; Weyand, Tobias; Andreetto, Marco; Adam, Hartwig (2017) MobileNets: Efficient Convolutional Neural Networks for Mobile Vision. En: Computer Science. Disponible en: http://arxiv.org/abs/1704.04861.
dc.source.bibliographicCitationOrtiz-Farfán, Nelson; Camargo-Mendoza, Jorge E (2020) Modelo computacional para reconocimiento de lenguaje de señas en un. En: TecnoLógicas. Vol. 23; No. 48; pp. 197-232 0123-7799; Disponible en: http://dx.doi.org/10.22430/22565337.1585. Disponible en: 10.22430/22565337.1585.
dc.source.bibliographicCitationOrjuela-Cañon, Alvaro David; Posada-Quintero, Hugo; Valencia, Cesar; Mendoza, Leonardo (2018) On the Use of Neuroevolutive Methods as Support Tools for Diagnosing. En: Springer Nature. pp. 171-181
dc.source.bibliographicCitationMinisterio de Educacion Nacional de Colombia (2022) Plan Estrarégico Institucional INSOR. pp. 21
dc.source.bibliographicCitationScikit Learn (2022) scikit-learn: machine learning in Python — scikit-learn 1.1.1. Disponible en: https://scikit-learn.org/stable/.
dc.source.bibliographicCitationMinisterio de Tecnologías de la Información y las Comunicaciones de Colombia, (2022) Servicio de Interpretación en línea SIEL. Disponible en: https://centroderelevo.gov.co/632/w3-propertyvalue-15254.html.
dc.source.bibliographicCitationWadhawan, Ankita; Kumar, Parteek (2021) Sign Language Recognition Systems: A Decade Systematic Literature Review. En: Archives of Computational Methods in Engineering. Vol. 28; No. 3; pp. 785-813 : Springer Netherlands; 1886-1784; Disponible en: https://doi.org/10.1007/s11831-019-09384-2; http://dx.doi.org/10.1007/s11831-019-09384-2. Disponible en: 10.1007/s11831-019-09384-2.
dc.source.bibliographicCitationCamilo Iván, López Triviño (2018) Sistema para el aprendizaje del lenguaje de señas colombiano usando visión. : Universidad de La Salle;
dc.source.bibliographicCitationMilena Cortés Bello, Yenny; Giovanny Barreto Muñoz, Alex (2013) Variacion Sociolinguistica En La Lengua D Señas Colombiana. En: Forma y Función. Vol. 26; pp. 149-170 Disponible en: http://www.scielo.org.co/pdf/fyf/v26n2/v26n2a07.pdf.
dc.source.bibliographicCitationPython Software Foundation (2022) Welcome to Python.org. Disponible en: https://www.python.org/.
dc.source.bibliographicCitationIBM Cloud Education (2020) ¿Qué es deep learning?. Disponible en: https://www.ibm.com/mx-es/cloud/deep-learning.
dc.source.bibliographicCitationIBM Cloud Education (2020) ¿Qué son las redes neuronales?. Disponible en: https://www.ibm.com/es-es/cloud/learn/neural-networks.
dc.source.instnameinstname:Universidad del Rosario
dc.source.reponamereponame:Repositorio Institucional EdocUR
dc.subjectRedes neuronaleses
dc.subjectDeep Learninges
dc.subjectConvolutional Neural Networks (CNN)es
dc.subjectLengua de Señases
dc.subject.ddcIngeniería & operaciones afineses
dc.subject.keywordNeuronal Networkses
dc.subject.keywordDeep Learninges
dc.subject.keywordConvolutional Neural Networks (CNN)es
dc.subject.keywordSign Languagees
dc.titleModelo de reconocimiento para la lengua de señas: aproximación comparativa entre métodos de reconocimiento de patrones por inteligencia artificiales
dc.title.TranslatedTitleSign language recognition model: comparative approach between artificial intelligence pattern recognition methodses
dc.typemasterThesises
dc.type.documentTesises
dc.type.hasVersioninfo:eu-repo/semantics/acceptedVersion
dc.type.spaTesises
local.department.reportEscuela de Medicina y Ciencias de la Saludspa
Archivos
Bloque original
Mostrando1 - 2 de 2
Cargando...
Miniatura
Nombre:
Tesis_Maestria_Ing_Biomedica_Simon_Corredor_Final.pdf
Tamaño:
3.21 MB
Formato:
Adobe Portable Document Format
Descripción:
Documento final tesis
Cargando...
Miniatura
Nombre:
references.ris
Tamaño:
12.41 KB
Formato:
Unknown data format
Descripción:
Bibliografia