Aplicació de la Intel·ligència Artificial a la recerca sociolingüística del valencià

Autors/ores

DOI:

https://doi.org/10.14198/itaca.26599

Paraules clau:

sociolingüística valenciana, intel·ligència artificial, mineria de dades, xarxes neuronals, índex de desigualtat lingüística, valencià, català

Resum

L’article presenta dues aplicacions de la Intel·ligència Artificial per a la recerca sociolingüística sobre el valencià, una realitzada amb la mineria de dades i una altra amb xarxes neuronals. S’expliquen aquestes dues funcions de la Intel·ligència Artificial i es detalla com s’ha procedit en els dos casos. Aquestes aplicacions es realitzen amb les dades depurades de les Enquestes de Coneixement i Ús del Valencià (2005, 2010, 2015 i 2021) i amb recerques pròpies fetes amb enquestes i treball de camp, i es refereixen a prediccions, expectatives de competència aliena i indicadors unitaris de competència i ús, així com índex de desigualtat lingüística. Per a la mineria de dades s’han calculat les prediccions per a 2025, de competències i usos lingüístics, el que permet fer un pronòstic de l’evolució d’un índex de desigualtat lingüística referit a les diverses regions sociolingüístiques valencianes. Aquest es fonamenta en relació al conegut Índex de Gini de desigualtat socioeconòmica, que, en el nostre cas, es calcula com a Índex de Desigaltat Lingüística amb un model de corba exponencial. S’hi aporta la fonamentació matemàtica del càlcul. En aquest punt destaquem el problema de la infravalorització de les competències lingüístiques alienes, un factor del decalatge entre competència i ús. A continuació fem una aplicació de xarxes neuronals, basades en un model d’aprenentatge. S’explica el fonament de les xarxes neuronals, el procediment per al seu ensinistrament i l’aplicació a les dades de competències i usos lingüístics de les regions sociolingüístiques del valencià. S’hi aporten les dades resultants i es presenta la interessant la correlació final entre aquell Índex de Desigualtat Lingüística i les simulacions de xarxes neuronals segons el model d’aprenentatge especificat. Aquesta conclusió és summament important, perquè permet simplificar la determinació de la desigualtat lingüística com a un càlcul de simulació de xarxes neuronals, el que obri perspectives innovadores a la recerca lingüística.

Referències

Álvarez Enparantza, Jose Luis (Txillardegi). (1984). Elebidun gizarteen azterketa matematikoa. Iruñea: UEU. Disponible en línia a: https://www.jakin.eus/show/cfd5c0dbbcd0c927fb879b55f136ca87d815d4bb

Balaguer, Pau et al. (2019). CatSent: a Catalan sentiment analysis website. Multimedia Tools and Applications. 78: 28137-28155. https://doi.org/10.1007/s11042-019-07877-7

Breiman, Leo. (2001). "Random Forests". Machine Learning 45, 5-32. https://doi.org/10.1023/A:1010933404324

ECUV (2005). Enquesta 2005. Sobre coneixement i ús social del valencià (síntesi de resultats) [en línia]. València: Generalitat Valenciana. Conselleria d'Educació, Investigació, Cultura i Esport.

ECUV (2010). Enquesta 2010. Sobre coneixement i ús social del valencià (síntesi de resultats) [en línia]. València: Generalitat Valenciana. Conselleria d'Educació, Investigació, Cultura i Esport.

ECUV (2015). Enquesta 2015. Sobre coneixement i ús social del valencià (síntesi de resultats) [en línia]. València: Generalitat Valenciana. Conselleria d'Educació, Investigació, Cultura i Esport.

ECUV (2021). Enquesta 2021. Sobre coneixement i ús social del valencià (síntesi de resultats) [en línia]. València: Generalitat Valenciana. Conselleria d'Educació, Investigació, Cultura i Esport.

Fabà, Albert (2003). L'ús interpersonal del català i altres variables sociolingüístiques. Assaig d'un model interpretatiu. El cas de Santa Coloma de Gramenet. Revista de Llengua i Dret, núm. 40, p. 185-229.

Gupta, Sarah & DiPadova, Anthony. (2019). Deep Learning and Sociophonetics: Automatic Coding of Rhoticity Using Neural Networks. Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop, 92-96, Minneapolis, Minnesota. Association for Computational Lin-guistics. https://doi.org/10.18653/v1/N19-3013

Freund, Yoav i Schapire, Robert. (1996). Experiments with a New Boosting Algorithm. International Conference on Machine Learning, Bari, 3-6 July 1996, 148-156.

Hernàndez F. J. (2016). El tio Canya ha mort. Notes sobre la mecànica sociolingüística del valencià. València: Fundació Nexe. Disponible en: https:// fundacionexe.org/publicacions/el-tio-canya-ha-mort

Hernàndez F. J. (2020a). La Relació entre competència (oral activa) i ús (públic): Un model matemàtic. Treballs de sociolingüística Catalana, núm. 30, juliol, 235-48.

Hernàndez F. J. (2020b). Adaptació del coeficient de GINI per a la formulació d'un coeficient de desigualtat lingüística. Arxius de sociologia, núm. 42, 235-263. https://doi.org/10.36950/elies.2020.42.8480

Hernàndez F. J. (2023). Formulació d'un indicador unitari de competència i d'ús de la llengua per a l'avaluació de polítiques lingüístiques. Treballs de sociolingüística Catalana, núm. 33, 141-157.

Hernàndez, Marc i Hernàndez Francesc Jesús. (2022). Translatum. Informe de recerca presentat a la Conselleria d'Educació, Universitats i Ocupació (inèdit).

Kretzschmar, William A. Jr (2008). "Neural networks and the linguistics of speech", Interdisciplinary Science Reviews, núm. 33: 4, 336-356. https://doi.org/10.1179/174327908X392898

Piloto, Luis S. et al. (2022). "Intuitive physics learning in a deep-learning model inspired by developmental psychology". Nature Human Behaviour, 11 de juliol. https://doi.org/10.1038/s41562-022-01394-8

Rodríguez, Pablo. (2018). Inteligencia artificial. Barcelona: ed. Deusto.

Simões, Alberto et al. (2014). Language identification: a neural network approach https://hdl.handle.net/1822/30676

Sutton, Richard S. i Barto, Andrew G. (2014). Reinforcement Learning: An Introduction [Second edition in progress, 2014, 2015]. Cambridge, Massachusetts; Londres: MIT Press.

Thomas, Erik R.: "Sociolinguistic variables and cognition". WIREs Cognitive Science 2: 16: 701-716. https://doi.org/10.1002/wcs.152

Torrijos, Carmen i Sánchez, José Carlos. (2023). La primavera de la Inteligencia Artificial. Madrid: La Catarata.

Tosi, Zach i Yoshimi, Jeff. (2016). "Simbrain 3. A Flexible, Visually-Oriented Neural Network Simulator". Neural Networks (4 de juliol). https://doi.org/10.1016/j.neunet.2016.07.005

Tsoukala, Chara et al. (2020). "Simulating Code-switching Using a Neural Network Model of Bilingual Sentence Production". Computational Brain & Behavior. 4: 87-100. https://doi.org/10.1007/s42113-020-00088-6

Yoshimi, Jeff; Tosi, Zoë; Hotton, Scott; Gordon, Chelsea i Noelle, David C. (2023). Neural Networks in Cognitive Science. Versió 2023.1.1. Disponible en: http://www.simbrain.net/Documentation/v3/Simbrain¬Docs.html

ChatGPT, Orange, Microsoft i Simbrain són marques enregistrades.

Descàrregues

Estadístiques

Estadístiques en RUA

Publicades

04-11-2024

Com citar

Hernàndez Montoro, M., & Hernàndez Dobon, F. J. (2024). Aplicació de la Intel·ligència Artificial a la recerca sociolingüística del valencià. Ítaca. Revista De Filologia, (15), 245–267. https://doi.org/10.14198/itaca.26599