Aplicació de la Intel·ligència Artificial a la recerca sociolingüística del valencià
DOI:
https://doi.org/10.14198/itaca.26599Paraules clau:
sociolingüística valenciana, intel·ligència artificial, mineria de dades, xarxes neuronals, índex de desigualtat lingüística, valencià, catalàResum
L’article presenta dues aplicacions de la Intel·ligència Artificial per a la recerca sociolingüística sobre el valencià, una realitzada amb la mineria de dades i una altra amb xarxes neuronals. S’expliquen aquestes dues funcions de la Intel·ligència Artificial i es detalla com s’ha procedit en els dos casos. Aquestes aplicacions es realitzen amb les dades depurades de les Enquestes de Coneixement i Ús del Valencià (2005, 2010, 2015 i 2021) i amb recerques pròpies fetes amb enquestes i treball de camp, i es refereixen a prediccions, expectatives de competència aliena i indicadors unitaris de competència i ús, així com índex de desigualtat lingüística. Per a la mineria de dades s’han calculat les prediccions per a 2025, de competències i usos lingüístics, el que permet fer un pronòstic de l’evolució d’un índex de desigualtat lingüística referit a les diverses regions sociolingüístiques valencianes. Aquest es fonamenta en relació al conegut Índex de Gini de desigualtat socioeconòmica, que, en el nostre cas, es calcula com a Índex de Desigaltat Lingüística amb un model de corba exponencial. S’hi aporta la fonamentació matemàtica del càlcul. En aquest punt destaquem el problema de la infravalorització de les competències lingüístiques alienes, un factor del decalatge entre competència i ús. A continuació fem una aplicació de xarxes neuronals, basades en un model d’aprenentatge. S’explica el fonament de les xarxes neuronals, el procediment per al seu ensinistrament i l’aplicació a les dades de competències i usos lingüístics de les regions sociolingüístiques del valencià. S’hi aporten les dades resultants i es presenta la interessant la correlació final entre aquell Índex de Desigualtat Lingüística i les simulacions de xarxes neuronals segons el model d’aprenentatge especificat. Aquesta conclusió és summament important, perquè permet simplificar la determinació de la desigualtat lingüística com a un càlcul de simulació de xarxes neuronals, el que obri perspectives innovadores a la recerca lingüística.
Referències
Álvarez Enparantza, Jose Luis (Txillardegi). (1984). Elebidun gizarteen azterketa matematikoa. Iruñea: UEU. Disponible en línia a: https://www.jakin.eus/show/cfd5c0dbbcd0c927fb879b55f136ca87d815d4bb
Balaguer, Pau et al. (2019). CatSent: a Catalan sentiment analysis website. Multimedia Tools and Applications. 78: 28137-28155. https://doi.org/10.1007/s11042-019-07877-7
Breiman, Leo. (2001). "Random Forests". Machine Learning 45, 5-32. https://doi.org/10.1023/A:1010933404324
ECUV (2005). Enquesta 2005. Sobre coneixement i ús social del valencià (síntesi de resultats) [en línia]. València: Generalitat Valenciana. Conselleria d'Educació, Investigació, Cultura i Esport.
ECUV (2010). Enquesta 2010. Sobre coneixement i ús social del valencià (síntesi de resultats) [en línia]. València: Generalitat Valenciana. Conselleria d'Educació, Investigació, Cultura i Esport.
ECUV (2015). Enquesta 2015. Sobre coneixement i ús social del valencià (síntesi de resultats) [en línia]. València: Generalitat Valenciana. Conselleria d'Educació, Investigació, Cultura i Esport.
ECUV (2021). Enquesta 2021. Sobre coneixement i ús social del valencià (síntesi de resultats) [en línia]. València: Generalitat Valenciana. Conselleria d'Educació, Investigació, Cultura i Esport.
Fabà, Albert (2003). L'ús interpersonal del català i altres variables sociolingüístiques. Assaig d'un model interpretatiu. El cas de Santa Coloma de Gramenet. Revista de Llengua i Dret, núm. 40, p. 185-229.
Gupta, Sarah & DiPadova, Anthony. (2019). Deep Learning and Sociophonetics: Automatic Coding of Rhoticity Using Neural Networks. Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop, 92-96, Minneapolis, Minnesota. Association for Computational Lin-guistics. https://doi.org/10.18653/v1/N19-3013
Freund, Yoav i Schapire, Robert. (1996). Experiments with a New Boosting Algorithm. International Conference on Machine Learning, Bari, 3-6 July 1996, 148-156.
Hernàndez F. J. (2016). El tio Canya ha mort. Notes sobre la mecànica sociolingüística del valencià. València: Fundació Nexe. Disponible en: https:// fundacionexe.org/publicacions/el-tio-canya-ha-mort
Hernàndez F. J. (2020a). La Relació entre competència (oral activa) i ús (públic): Un model matemàtic. Treballs de sociolingüística Catalana, núm. 30, juliol, 235-48.
Hernàndez F. J. (2020b). Adaptació del coeficient de GINI per a la formulació d'un coeficient de desigualtat lingüística. Arxius de sociologia, núm. 42, 235-263. https://doi.org/10.36950/elies.2020.42.8480
Hernàndez F. J. (2023). Formulació d'un indicador unitari de competència i d'ús de la llengua per a l'avaluació de polítiques lingüístiques. Treballs de sociolingüística Catalana, núm. 33, 141-157.
Hernàndez, Marc i Hernàndez Francesc Jesús. (2022). Translatum. Informe de recerca presentat a la Conselleria d'Educació, Universitats i Ocupació (inèdit).
Kretzschmar, William A. Jr (2008). "Neural networks and the linguistics of speech", Interdisciplinary Science Reviews, núm. 33: 4, 336-356. https://doi.org/10.1179/174327908X392898
Piloto, Luis S. et al. (2022). "Intuitive physics learning in a deep-learning model inspired by developmental psychology". Nature Human Behaviour, 11 de juliol. https://doi.org/10.1038/s41562-022-01394-8
Rodríguez, Pablo. (2018). Inteligencia artificial. Barcelona: ed. Deusto.
Simões, Alberto et al. (2014). Language identification: a neural network approach https://hdl.handle.net/1822/30676
Sutton, Richard S. i Barto, Andrew G. (2014). Reinforcement Learning: An Introduction [Second edition in progress, 2014, 2015]. Cambridge, Massachusetts; Londres: MIT Press.
Thomas, Erik R.: "Sociolinguistic variables and cognition". WIREs Cognitive Science 2: 16: 701-716. https://doi.org/10.1002/wcs.152
Torrijos, Carmen i Sánchez, José Carlos. (2023). La primavera de la Inteligencia Artificial. Madrid: La Catarata.
Tosi, Zach i Yoshimi, Jeff. (2016). "Simbrain 3. A Flexible, Visually-Oriented Neural Network Simulator". Neural Networks (4 de juliol). https://doi.org/10.1016/j.neunet.2016.07.005
Tsoukala, Chara et al. (2020). "Simulating Code-switching Using a Neural Network Model of Bilingual Sentence Production". Computational Brain & Behavior. 4: 87-100. https://doi.org/10.1007/s42113-020-00088-6
Yoshimi, Jeff; Tosi, Zoë; Hotton, Scott; Gordon, Chelsea i Noelle, David C. (2023). Neural Networks in Cognitive Science. Versió 2023.1.1. Disponible en: http://www.simbrain.net/Documentation/v3/Simbrain¬Docs.html
ChatGPT, Orange, Microsoft i Simbrain són marques enregistrades.
Descàrregues
Estadístiques
Publicades
Com citar
Número
Secció
Llicència
Drets d'autor (c) 2024 Marc Hernàndez Montoro, Francesc J. Hernàndez Dobon
Aquesta obra està sota una llicència internacional Creative Commons Reconeixement-NoComercial-CompartirIgual 4.0.