Gaceta Crítica

Un espacio para la información y el debate crítico con el capitalismo en España y el Mundo. Contra la guerra y la opresión social y neocolonial. Por la Democracia y el Socialismo.

El lenguaje en la era de la tecnología de IA: de la autenticidad humana a la no humana, de la gobernanza pública a los ensamblajes privatizados.

Iker Erdogan, Britta Schneider y Bettina Migge (CAMBRIDGE UNIVERSITY PRESS) – originalmente en inglés -, 1 de Julio de 2025


Abstracto

Los grandes modelos lingüísticos basados ​​en tecnologías de aprendizaje automático están transformando los contextos lingüísticos y la comprensión del lenguaje. Exploramos estas reconfiguraciones investigando los posicionamientos discursivos de las instituciones tradicionales que controlan el poder lingüístico en respuesta a estos cambios. Centrándonos en el discurso de la Real Academia Española (RAE), mostramos cómo se han reimaginado sus funciones sociales, sus formas de afirmar la autoridad y la naturaleza, función y propiedad legítima de su lengua estándar. Fundamentalmente, la RAE se presenta como un poder blando profesional que protege los derechos de los hispanohablantes. Basándose en tropos de autenticidad y peligro, conceptualiza el lenguaje generado por tecnologías de aprendizaje automático como inauténtico y como una amenaza para el español auténtico de los hispanohablantes. Argumentamos que estos discursos son indicativos de una lucha de poder en la que el papel de las instituciones tradicionales que norman el lenguaje se reconfigura ante las innovaciones sociotécnicas en manos de empresas comerciales globales. (Lengua estándar, tecnología de IA, academias de idiomas, autoridad lingüística, grandes tecnológicas, Real Academia Española) *


I


Introducción

Las tecnologías de aprendizaje automático, como los grandes modelos lingüísticos, han impulsado cambios en muchos ámbitos de la vida social, generando nuevas prácticas y interpretaciones. La sociolingüística investiga las prácticas lingüísticas de los usuarios de tecnología y sus indexicalidades sociales (Blommaert).Referencia Blommaert2015 ; AndroutsopoulosReferencia Androutsopoulos2021 ), pero existe poca investigación sobre cómo las herramientas algorítmicas de aprendizaje automático están transformando los contextos lingüísticos y la comprensión de las prácticas lingüísticas. Esto se debe a las dificultades para acceder a los procesos algorítmicos subyacentes y a la ausencia de métodos para estudiar las prácticas cada vez más entrelazadas generadas por humanos y máquinas, así como los procesos, en cierta medida invisibles, de difusión de estas prácticas (Kelly-Holmes).Referencia Kelly-Holmes2022 ). Una forma de explorar estas reconfiguraciones es investigar los posicionamientos discursivos y las negociaciones de las autoridades lingüísticas tradicionales en respuesta a estos cambios.

Los discursos de las instituciones lingüísticas asociadas con las lenguas estándar son objetos ideales para dicha investigación. Estas instituciones son omnipresentes en los contextos nacionales europeos. Las instituciones estatales y públicas, así como los ciudadanos, las han reconocido tradicionalmente como las autoridades sociales legítimas en materia de lo que constituye variedades lingüísticas «correctas» y prestigiosas. Sin embargo, su papel en la sociedad y el de las lenguas estándar ha ido cambiando. La investigación ha analizado el cambio en las lenguas estándar (VandenbusscheReferencia Vandenbussche2022 ) incluyendo procesos de desestandarización y reestandarización (Ayres-Bennett & BellamyReferencia Ayres-Bennett, Bellamy, Ayres-Bennett y Bellamy2021 ) y el impacto de las instituciones lingüísticas en el desarrollo de las lenguas estándar en diferentes contextos nacionales (McLellandReferencia McLelland2021 ). Sin embargo, desconocemos cómo se comportan los guardianes tradicionales de la autoridad en los idiomas estándar en comparación con las tecnologías de aprendizaje automático generadoras de lenguaje desarrolladas y propiedad de las grandes empresas tecnológicas (Google, Meta, Amazon, Apple).Nota1 ni qué nuevas conceptualizaciones y discursos sobre los lenguajes estándar están surgiendo debido a dichas tecnologías.

En este artículo, examinamos los debates ideológicos lingüísticos contemporáneos sobre la normalización y la estandarización lingüística, así como la comprensión de las instituciones que la normalizan de sus funciones en el contexto del establecimiento y la distribución de grandes modelos lingüísticos, lo que implica un creciente dominio de las grandes empresas tecnológicas en las esferas públicas nacionales. A través del análisis crítico del discurso (ACD), el discurso de la Real Academia Española, institución tradicional de normalización lingüística en España, investiga cómo las instituciones europeas que controlan el poder lingüístico negocian su posición y la de su lengua estándar, y critican a los nuevos actores lingüísticos públicos, concretamente las industrias digitales comerciales. Demostramos que la RAE ha redefinido su función social, su enfoque para afirmar su autoridad y su comprensión de lo que considera la naturaleza y la propiedad de la lengua «correcta». Argumentamos que estos cambios son un reflejo de la transformación de las relaciones de poder en la sociedad, caracterizada por un debilitamiento progresivo de las instituciones estatales impulsado por el creciente dominio de entidades privadas con ánimo de lucro.

El artículo se organiza en cinco secciones. Tras esta introducción, presentamos los antecedentes de este estudio, abordando la noción de ideología de la lengua estándar, los modelos lingüísticos como conjuntos de poder sociotécnico y su relación con la lengua y la sociedad, y la RAE. A continuación, presentamos los métodos de investigación y analizamos el discurso reciente de la RAE sobre lengua y autoridad. La última sección resume los hallazgos, explorando sus implicaciones para el lugar de las autoridades lingüísticas tradicionales y las lenguas estándar, así como la relación entre las lenguas (estándar), el lenguaje generado por máquinas y las sociedades en la era digital.

Autoridad lingüística: públicos nacionales, tecnologías mediáticas y RAE

En esta sección se analizan brevemente los factores que tradicionalmente han contribuido a la formación histórica de la autoridad lingüística en contextos públicos nacionales y el papel y la función de las tecnologías de los medios y las instituciones de normalización del lenguaje como la RAE en este contexto, antes de considerar cómo se reformulan los discursos en la era del capitalismo digital.

ideología del lenguaje estándar

Las ideologías del idioma estándar dominan los debates sociales y educativos sobre el lenguaje, lo que implica la idea normativa de que existe una forma de lenguaje que es «mejor» que otras. Si bien es un principio importante en los países occidentales, «un análisis superficial de los hechos revelará que estas variedades estándar no son más que el dialecto social de la clase dominante» (GuyReferencia Guy y Mesthrie2011 :162). Existen diversas estrategias de legitimación, y entre ellas se encuentra la creencia de que esta variedad dominante representa los ideales modernistas de regularidad, claridad, pureza y racionalidad (Bauman y Briggs).Referencia Richard, Charles, Bauman y Charles2003 ). Discursos de nostalgia cultural que construyen formas antiguas como inherentemente «buenas» y refinadas debido a su relación con un pasado mítico (DurrellReferencia Durrell y Durrell2000 ) y también son comunes las ideologías de estabilidad en las que el cambio se entiende como «malo» (véase HickeyReferencia Hickey y Hickey2012 ).

Los discursos sobre el «buen lenguaje» se basan en la comprensión de que existe un espacio social más allá de las relaciones privadas cara a cara en las familias o comunidades locales para el cual es necesario un lenguaje compartido y ordenado. Los relatos sociológicos (por ejemplo, Habermas 1962/Referencia Habermas1989 ) se refieren a ellos como espacios públicos y los definen como un ‘campo comunicativo en el que los actores racionales pueden llegar a un acuerdo sobre la base de la interacción racional’ (Heyd y Schneider).Referencia Heyd y Schneider2019 :5). Pero la suposición de que la interacción pública se basa en el orden y la racionalidad ha sido fuertemente criticada (GardinerReferencia Gardiner2004 ). Con los cambios en las esferas públicas en la era digital, han surgido en muchos entornos discursos contradictorios sobre quién debe definir las normas públicas de conducta lingüística.

En sociolingüística, la lengua estándar no se considera lingüísticamente «mejor» y la atribución de prestigio a ciertas formas de habla y escritura se entiende como resultado de desarrollos sociohistóricos. En Europa, «la idea de una sola nación y una única forma de lengua que emana de su centro es un tema predominante en los escritos [ingleses] del siglo XVIII… una parte integral del complejo lingüístico nacional» (Hickey).Referencia Hickey y Hickey2012 :7).

En la historia de la modernidad europea, las lenguas estándar desempeñan un papel importante en la construcción de la legitimidad y la autoridad de grupos específicos en los estados nacionales. Por lo tanto, el establecimiento de puestos de autoridad pública y el establecimiento de normas lingüísticas se relacionan mutuamente. Gal y Woolard (Referencia Susan y Kathryn1995 ) describen los idiomas estándar como la construcción cultural de una «voz de la nada» (supuestamente) neutral, aunque el proceso de normalización a veces se basaba en las ideas de una sola persona (HickeyReferencia Hickey y Hickey2012 :13).

Para establecer la imagen de una manera de hablar aparentemente tan «neutral», entran en juego discursos tanto de anonimato como de autenticidad (Gal y Woolard).Referencia Susan y Kathryn1995 :134). A las formas de hablar de la élite se les atribuye la autoridad del anonimato: son autoritarias porque se construyen como el lenguaje de todos, de «nadie en particular», basándose en una imagen de «objetividad aperspectiva» (Gal y Woolard).Referencia Susan y Kathryn1995 :134)—y se construyen discursivamente como un código neutral de comunicación que representa a todos dentro del espacio público: ‘Se posicionan como universalmente abiertos y disponibles para todos en una sociedad, aunque solo sea, como Michael Silverstein (Referencia Silverstein, Brenneis y Macaulay1996 ) nos recuerda que somos lo suficientemente buenos e inteligentes como para aprovecharlos (Woolard).Referencia Woolard2016 :25). Al mismo tiempo, la autoridad del anonimato existe simultáneamente con la autoridad de la autenticidad. El lenguaje estándar se construye como legítimo porque es neutral y se entiende como una expresión «auténtica» de pertenencia a un grupo nacional (Woolard).Referencia Woolard2016 :25). En algunos casos, las lenguas estándar son utilizadas por grupos supranacionales, como en el caso del inglés o el español, pero aún se entienden como divididas según la lógica de las naciones (p. ej., inglés canadiense, español mexicano, etc.) y, muy a menudo, el lugar de origen histórico (p. ej., Inglaterra o España) aún ejerce una influencia considerable sobre las construcciones de la lengua legítima en otros lugares (Paffey).Referencia Paffey, Ayres-Bennett y Bellamy2021 ). Estas lenguas nacionalizadas (estándar) coexisten en una relación hegemónica con prácticas lingüísticas «desviadas» (privadas, no estándar). Y solo quienes se ajustan a los ideales de la lengua estándar pueden participar en los poderosos discursos que dan origen a los espacios públicos.

El papel de los conjuntos de tecnología mediática en la construcción y configuración del lenguaje público

La construcción y distribución de políticas lingüísticas dependen de la existencia de tecnologías de escritura e industrias de impresión: sin escritura e impresión homogeneizada, la homogeneidad lingüística, las lenguas estándar y el establecimiento de políticas lingüísticas serían difícilmente concebibles (OngReferencia Ong1982 ). Los diccionarios y las gramáticas son fuentes tangibles de normas que informan sobre las normas vigentes y suelen considerarse autoridades lingüísticas indiscutibles en contextos nacionales, respaldadas y a menudo creadas por academias de lenguas como la RAE. Sin embargo, en los últimos años se han generado intensos debates sobre las normas lingüísticas públicas y las autoridades lingüísticas, como la RAE, y «existe, de hecho, considerable evidencia de la disminución de la influencia de las autoridades tradicionales que promueven la ideología del estándar» (Ayres-Bennett y Bellamy).Referencia Ayres-Bennett, Bellamy, Ayres-Bennett y Bellamy2021 :18). Los discursos públicos y no públicos suelen apuntar a ecologías mediáticas cambiantes, como las plataformas de redes sociales privadas, para explicar la influencia menguante de las autoridades lingüísticas tradicionales.

Los medios digitales ofrecen diferentes posibilidades que los medios tradicionales en cuanto a la forma en que las personas pueden participar y participar en el discurso público. Esto puede influir en los debates de las autoridades tradicionales cuando, por ejemplo, las decisiones de las instituciones que norman el lenguaje se debaten acaloradamente en redes sociales. Los usuarios individuales pueden cuestionar las posturas autoritarias, haciendo visible que las instituciones hegemónicas tradicionales, antes anónimas, también ocupan una posición social, en lugar de ser entendidas como una «voz de la nada». Paffey (Referencia Paffey, Ayres-Bennett y Bellamy2021 :252–56) analiza un ejemplo en el que las decisiones de la RAE sobre las definiciones de significados de palabras relacionadas con el género se convirtieron en tema de debate en Twitter (X). La cuenta de Twitter de la institución fomenta la interacción y la participación, y «es probable —y se espera— que los seguidores de la cuenta de Twitter de la RAE respondan a las normas específicas contenidas en las publicaciones» (Paffey).Referencia Paffey, Ayres-Bennett y Bellamy2021 :253). En algunos casos, la RAE modificó las entradas léxicas de los diccionarios, posiblemente como reacción a dichos debates. Recientemente se ha hecho mucho más evidente que las decisiones de actualización pueden implicar un debate público digital y estar vinculadas a posturas sociales y políticas; anteriormente, estas deliberaciones se llevaban a cabo a puerta cerrada y las decisiones sobre el idioma se presentaban como una «verdad» anónima y objetiva.

Al mismo tiempo, las plataformas de medios digitales son un híbrido entre lo privado y lo público. El público en general puede participar en discursos que, en principio, están disponibles para todos. Sin embargo, los propietarios de la infraestructura son empresas privadas. Esto significa que, si bien la comunidad global de hispanohablantes puede interactuar con instituciones de prestigio como la RAE en Twitter y similares, son predominantemente las empresas tecnológicas estadounidenses las que proporcionan los medios para esta interacción. Las plataformas de redes sociales son espacios predefinidos que, «al menos en el aspecto técnico, no permiten a los participantes desarrollar normas compartidas de conducta y comunicación» (Heyd y Schneider).Referencia Heyd y Schneider2019 :8). En última instancia, son los propietarios de las plataformas quienes deciden qué se ve y qué no en los públicos digitales mediante procesos de moderación de contenido (Gorwa, Binns y Katzenbach).Referencia Gorwa, Binns y Katzenbach2020 ). Infraestructuras de plataforma: animar a los usuarios a atraer la atención en forma de acciones, me gusta, visualizaciones y clics (MalyReferencia Maly2021 )—se basan en la creencia subyacente de que los datos digitales representan la realidad. En consonancia con los ideales económicos cuantitativos, reflejan el deseo de recopilar cada vez más datos y de rastrear y monitorear a los usuarios (Bode & Goodlad).Referencia Katherine y Lauren2023 ).

Los datos que los hablantes producen en estas plataformas y en los espacios en línea sirven como insumo central para los modelos de lenguaje de aprendizaje automático que son conjuntos sociotécnicos altamente complejos (PennycookReferencia Pennycook2024 ). Se basan en el lenguaje humano que se transforma (p. ej., libros) o aparece (p. ej., redes sociales) como datos legibles por máquinas. Posteriormente, las empresas seleccionan los datos, y el diseño algorítmico define qué patrones se reproducen (Schneider).Referencia Schneider2022 ). En este sentido, los modelos son resultado de un trabajo intelectual colectivo (PasquinelliReferencia Pasquinelli2023 ) que ha proporcionado los datos, los cuales son explotados por quienes los utilizan para desarrollar y vender tecnologías de aprendizaje automático a los clientes. Además, las empresas utilizan los datos recopilados de individuos para prácticas (no públicas) de marketing y vigilancia (Zuboff).Referencia Zuboff2019 ).

Estos desarrollos capitalistas no pueden verse aislados de los contextos políticos, ya que los Estados regulan los servicios de los propietarios de las plataformas,Nota2 , incluyendo cómo y qué datos se pueden recopilar y con qué fines. Además, el desarrollo de tecnologías de aprendizaje automático ha sido financiado históricamente por el ejército estadounidense (CrawfordReferencia Crawford2021 ). Por lo tanto, las tecnologías de aprendizaje automático que generan lenguaje pueden entenderse como un ensamblaje interactivo, en el que las empresas que han privatizado los datos (para una discusión crítica de las epistemologías de datos, véase Bode & GoodladReferencia Katherine y Lauren2023 ) y quienes poseen los recursos materiales para construir los modelos se encuentran en una posición hegemónica. Son ellos quienes definen qué se incluye en los modelos y quién tiene acceso a ellos. A pesar de la interrelación entre las empresas y los Estados, entendemos a las empresas como actores privados y a los Estados como públicos, dado que las regulaciones estatales (al menos actualmente y en el mundo occidental) se sancionan en procesos políticos democráticos, mientras que las decisiones empresariales no. Esta distinción entre lo privado y lo público desempeña un papel importante en nuestro análisis posterior.

Aunque estos proveedores de plataformas comerciales que actúan a nivel mundial no están interesados ​​per se en el lenguaje, recopilan continuamente datos lingüísticos y participan en debates sobre el mismo, y sus herramientas basadas en el lenguaje, ampliamente utilizadas, impactan en las ideologías del lenguaje estándar. Las conceptualizaciones del lenguaje por parte de las empresas se basan en la idea de que el lenguaje son datos de usuario legibles por máquinas. A esto lo denominan un enfoque «basado en el uso». En general, los datos históricos de usuario definen el resultado lingüístico de las máquinas, y este resultado influye en lo que los hablantes entienden como lenguaje «correcto». Las prácticas de trabajo precisas y los conjuntos de datos están en manos de empresas privadas y no están disponibles para la inspección o investigación pública. El enfoque técnico e ideológico de las empresas tecnológicas con sede en EE. UU. respecto al lenguaje contrasta con los discursos de las autoridades normativas tradicionales como la RAE. Las tensiones entre las diferentes construcciones de autenticidad y anonimato, pero posiblemente también las nuevas líneas de legitimación discursiva, requieren investigación empírica.

Instituciones de normalización lingüística: el caso de la RAE

Para que las poblaciones nacionales tengan acceso a las normas lingüísticas nacionales, instituciones como los sistemas educativos, los medios de comunicación o las editoriales son cruciales. En algunos países, como España, Francia e Italia, también existen academias de idiomas, como la RAE. Tradicionalmente, estas han sido instituciones exclusivas, compuestas por un grupo selecto de personas que toman decisiones con autoridad sobre la gestión lingüística a puerta cerrada. Estas decisiones suelen basarse en estándares lingüísticos específicos establecidos en diccionarios, gramáticas y otras obras de referencia que sirven como normas prescriptivas para los medios de comunicación y las instituciones educativas. Su autoridad funciona como un mecanismo de control social que define el uso apropiado del lenguaje y refuerza las jerarquías y desigualdades sociales.

La Real Academia Española se fundó en 1713 con la misión de supervisar la lengua española. La RAE ejemplifica la compleja relación entre los ámbitos público y privado. Si bien es una institución semipública, patrocinada por el Estado y que opera al amparo de una carta otorgada por la Corona española, la RAE funciona como una entidad independiente. Recibe financiación tanto de fuentes públicas como privadas, incluyendo el gobierno español y la Fundación pro RAE. Esta fundación, presidida por el rey de España y el presidente del Banco de España, cuenta con miembros de algunas de las mayores corporaciones de España y realiza actividades de recaudación de fondos adicionales para apoyar las iniciativas de la RAE.

Los académicos de la RAE son personas distinguidas, predominantemente hombres (la primera académica fue nombrada en 1978), que tradicionalmente provienen de disciplinas humanísticas como la filología, la literatura, la filosofía, el derecho y el periodismo. Sin embargo, más recientemente, la RAE ha diversificado su representación para incluir académicos del ámbito científico. Este nuevo contexto se refleja en nuestro estudio, que se basa especialmente en la respuesta del presidente de la RAE, Santiago Muñoz Machado, académico de derecho, al discurso inaugural de la recién nombrada académica, Asunción Gómez Pérez, académica de ciencias de la computación, en 2023.

La postura de la RAE ha pasado de una ideología de nacionalismo lingüístico, caracterizada por un enfoque de estandarización que buscaba proporcionar una lengua única y pura para homogeneizar una nación multilingüe dentro de los límites del estado (LodaresReferencia Lodares2002 ), a una ideología de un lenguaje global (Moreno-FernándezReferencia Moreno-Fernández2016 ). La ideología del lenguaje estándar aún sustenta el curso de acción de la RAE, pero su postura actual equivale a lo que Del Valle (Referencia Del Valle, Duchêne y Heller2007 :250) lo denomina una «forma moderada, casi discreta, de prescriptivismo». En su calidad de higienista verbal (CameronReferencia Cameron1995 ), la RAE exhibe un discurso ambivalente. Mantiene la retórica del conservadurismo lingüístico, actuando como custodio de la lengua. En contraste, muestra cierta amplitud de miras al adoptar un enfoque más inclusivo y responsable para la gestión lingüística, por ejemplo, priorizando la corrección basada en el uso lingüístico real. Al igual que otras agencias de gestión lingüística (EdwardsReferencia Edwards y Spolsky2012 ), la RAE ha modificado su percepción de su papel como autoridad lingüística para adaptarse a los desarrollos clave de diferentes períodos históricos. Esta adaptación implica una combinación de continuidad y cambio, que consiste en dos desarrollos principales: la adopción de una visión panhispánica de la lengua y la incorporación del mundo digital. Ambos están presentes en nuestro análisis.

La obsesión de la RAE con el purismo y el nacionalismo lingüístico comenzó a cambiar en las últimas décadas del siglo XX. Esto coincidió con la consolidación de la Asociación de Academias de la Lengua Española (ASALE), que comprende veintitrés academias miembros, de España y países hispanohablantes de Hispanoamérica, así como de Estados Unidos, Filipinas y Guinea Ecuatorial. Frente a las antiguas críticas al eurocentrismo, en la década de 1990 la RAE adoptó un enfoque panhispánico tanto para la lengua como para la política lingüística (Del ValleReferencia Del Valle, Duchêne y Heller2007 ). Este nuevo enfoque implicó el reconocimiento del español como una lengua con variabilidad interna y la subsiguiente adopción de una norma pluricéntrica representada en el lema «unidad en la diversidad», que encapsula tanto la persistente preocupación por la posible fragmentación lingüística como la entusiasta aceptación de la diversidad. Sin embargo, a pesar de la colaboración con sus academias hermanas de la ASALE, la RAE aún mantiene una posición destacada, si no hegemónica, dentro de esta asociación que reproduce las jerarquías coloniales (Del Valle).Referencia Del Valle y Valle2013 ).

En el siglo XXI, la RAE difunde su autoridad con publicaciones impresas tradicionales y se esfuerza por comunicar y reforzar su autoridad con aplicaciones en línea y, en particular, un compromiso activo con el público a través de sus canales de redes sociales (PaffeyReferencia Paffey, Ayres-Bennett y Bellamy2021 :246). Frente a las acusaciones de elitismo, estas interacciones en la esfera pública han permitido a la RAE establecer una imagen más democrática, con un nuevo enfoque que cumple formalmente «con los protocolos de una democracia legítima basada en el debate abierto y racional» (Del Valle).Referencia Del Valle, Duchêne y Heller2007 :254). Esta legitimidad democrática proviene de dos fuentes: las afirmaciones de verdad lingüística basadas en el escrutinio profesional de expertos en lenguas (véase Erdocia y Soler)Referencia Erdocia y Soler2024 ), y la toma de pulso del espacio público nacional mediante el mantenimiento de un diálogo permanente con oradores, instituciones representativas y actores sociales y económicos. En resumen, la interacción de la RAE con el público es crucial, ya que sienta las bases para una legitimidad popular más allá del ámbito académico. La aparición de las tecnologías de aprendizaje automático alteró fundamentalmente tanto la dinámica del uso del lenguaje como el papel de las academias de idiomas en la era de la interacción humano-máquina. Por lo tanto, no sorprende que el presidente de la RAE describa este nuevo período como «desafiante y emocionante», señalando que la RAE está «entrando en una segunda era en su vida institucional» (Muñoz Machado).Referencia Machado y Santiago2023 :119).

En resumen, las lenguas estándar en la era de la modernidad europea son construcciones hegemónicas de autoridad que se entrelazan con los conceptos nacionales de lo social y con la capacidad de algunos grupos para establecer poder en contextos nacionales al crear una imagen de sus formas de hablar como «neutrales», «profesionales» y apropiadas para usos públicos. En la era de las tecnologías lingüísticas digitales y de aprendizaje automático, se observa una reconfiguración de los públicos, y surgen nuevos discursos sobre la legitimidad del lenguaje público. Las instituciones tradicionales de normalización lingüística, como la RAE, ofrecen perspectivas particularmente interesantes sobre estos debates y las nuevas formas emergentes de ideología lingüística.

Metodología y antecedentes

En nuestro estudio, adoptamos un enfoque de análisis crítico del discurso que analiza las relaciones estructurales de dominación, discriminación y control que se manifiestan a través del lenguaje. Adoptamos un enfoque histórico-discursivo (Reisigl y Wodak).Referencia Michael, Wodak, Wodak y Meyer2016 ), ya que nos permite explorar las estrategias discursivas de la RAE y su adaptación en el contexto de los cambios económicos e ideológicos provocados por los avances en la tecnología lingüística de aprendizaje automático. El discurso se conceptualiza como socialmente constitutivo y socialmente condicionado: los discursos configuran y son configurados por las circunstancias históricas, sociopolíticas e ideológicas en las que se insertan. Este enfoque nos permite vincular los textos y sus géneros con una actividad social específica (Fairclough).Referencia Fairclough2015 ) a campos específicos de acción o áreas del mundo social ‘definidos por diferentes funciones de prácticas discursivas’ (Reisigl y WodakReferencia Michael, Wodak, Wodak y Meyer2016 :28).

Uno de estos campos de acción implica la formación de actitudes públicas hacia un asunto de interés social, como la lengua estándar nacional. Considerando que los discursos pueden influir y organizar las prácticas sociales dentro de un campo de acción (Reisigl y Wodak)Referencia Michael, Wodak, Wodak y Meyer2016 ), uno de los supuestos que sustentan nuestro análisis es que los marcos ideológicos lingüísticos de la RAE buscan moldear la opinión pública y la perspectiva de las instituciones públicas respecto a la necesidad de aplicar el lenguaje normativo. En última instancia, estos marcos ideológicos abogan por otorgar a las academias de idiomas un papel instrumental en el desarrollo de tecnologías de aprendizaje automático.

Entendemos el surgimiento de las grandes empresas tecnológicas como nuevos agentes en la regulación del lenguaje frente a la autoridad lingüística de larga data de la RAE como una cuestión de relaciones estructurales de control, poder y dominio (Reisigl y Wodak).Referencia Michael, Wodak, Wodak y Meyer2016 ). Interpretamos el reposicionamiento discursivo e institucional de la RAE como parte de una lucha por la hegemonía en la política lingüística mediada por la tecnología, cuyo resultado puede afectar las percepciones públicas del lenguaje estandarizado y el papel de las academias de idiomas en el siglo XXI.

Nuestro análisis sigue un proceso de dos pasos (WodakReferencia Wodak2015 ) para examinar las prácticas discursivas de la RAE: comenzamos mapeando el contenido temático de los textos y luego pasamos a un análisis en profundidad que examina las estrategias discursivas, las representaciones y la argumentación situadas dentro de la trayectoria histórica de la RAE y el contexto ideológico más amplio del capitalismo digital. Esto nos impulsa a centrarnos en un conjunto de oposiciones encontradas en los datos en el segundo paso de nuestro análisis. Una tensión clave en el discurso de la RAE radica en problematizar una distinción entre las esferas pública y privada, dado que las tecnologías del lenguaje son activos corporativos más allá del control institucional público. Las prioridades del sector corporativo se oponen a las de la RAE, conceptualizada como una entidad pública. Otras estructuras binarias incluyen distinciones entre las tradiciones europea y estadounidense en la (des)regulación del mercado, visiones antropocéntricas versus orientadas a la máquina de la autenticidad del lenguaje y enfoques centralizados versus descentralizados para la estandarización lingüística.

Nuestro enfoque metodológico implica la combinación de diferentes tipos de textos. Recopilamos nuestro material en dos fases. Primero, realizamos búsquedas en la página web de la RAE y en buscadores generales sobre el tema de la IA (siendo este el término público más popular para referirse a estas tecnologías), con búsquedas de palabras clave para términos en español como «RAE + inteligencia artificial », «RAE + sistemas digitales » y «RAE + procesamiento del lenguaje natural ». Esta primera fase de búsqueda dio como resultado numerosos documentos con fechas que van desde 2019 hasta 2024. Tras un escrutinio exhaustivo basado en su relevancia para nuestros objetivos de investigación, seleccionamos nuestro conjunto inicial de datos: un informe, una nota de prensa, el contenido de las páginas web de la RAE y dos noticias que presentaban eventos con declaraciones públicas del presidente de la RAE, Santiago Muñoz Machado. Este material nos proporcionó una visión general, aunque incompleta, del enfoque de la RAE sobre el lenguaje generado por máquinas. En segundo lugar, para comprender mejor la postura discursiva de la academia, decidimos incluir en nuestros datos un discurso sobre IA pronunciado por la presidenta de la RAE. Este discurso fue la respuesta institucional de la RAE al discurso inaugural de Asunción Gómez Pérez cuando asumió el cargo en mayo de 2023.

Para contextualizar, esta nueva miembro es la primera y única experta en IA entre los académicos de la RAE. En su discurso, titulado Inteligencia artificial y lengua española , Asunción Gómez Pérez presenta su objetivo de poner las tecnologías de aprendizaje automático al servicio del español. Para ello, explica la necesidad de garantizar materiales lingüísticos fiables en español en formatos adecuados para dichas tecnologías y el papel crucial que la RAE puede desempeñar en la formación de estas tecnologías en el uso del español normativo. Señala que alcanzar estos objetivos requiere una estrecha colaboración entre la administración pública, las grandes empresas tecnológicas, las pymes, las universidades, los centros de investigación y las instituciones educativas. Su discurso se centra menos en cuestionar la naturaleza distintiva del lenguaje producido por las tecnologías de aprendizaje automático y más en el papel que la academia podría desempeñar para garantizar que los resultados lingüísticos se ajusten a las normas tradicionales. Para destacar la importancia de nombrar a una académica con una experiencia tan excepcional, el propio presidente de la RAE presentó la tradicional respuesta de la institución a su discurso inaugural, un acto de gran simbolismo, ya que no se había producido una respuesta similar en los últimos noventa años de historia de la academia. Entre el público se encontraban personalidades públicas, como la vicepresidenta primera y ministra de Asuntos Económicos y Transformación Digital del Gobierno español, quien presidió el evento.

Nuestro análisis se centra en el discurso de veinticuatro páginas del presidente, ya que ofrece una visión fidedigna y sistemática de la postura institucional de la RAE respecto a los desafíos que plantean las tecnologías de aprendizaje automático. De hecho, tras su nombramiento como presidente en 2019, Santiago Muñoz Machado impulsó personalmente un plan estratégico que llevó a la RAE a involucrarse con dichas tecnologías. Analizamos los textos originales en español.

Hallazgos: El discurso de la RAE sobre el lenguaje y la autoridad en la era digital

A continuación, situamos nuestra discusión en la trayectoria histórica de la RAE y el marco ideológico del capitalismo digital, priorizando extractos del discurso del presidente de la RAE. La presentación está organizada temáticamente y los ejemplos fueron traducidos por el primer autor tras el análisis.

Viejas preocupaciones en tiempos nuevos

Como era de esperar, la postura de la RAE respecto al impacto específico de las tecnologías de aprendizaje automático en el uso del lenguaje y, más ampliamente, en el futuro del español, se basa en «ansiedades» pasadas (Del ValleReferencia Del Valle, Duchêne y Heller2007 ) que están estrechamente relacionados con los discursos sobre la amenaza del lenguaje (Duchêne y Heller).Referencia Duchêne y Heller2007 ) y valores como la belleza, la calidad y la unidad del idioma. Estas preocupaciones persisten en los discursos contemporáneos, ahora adaptados para abordar los desafíos emergentes del panorama tecnológico. El ejemplo (1) lo ilustra, basándose en el valor intrínseco que se otorga a la unidad lingüística del español, un principio fundamental defendido por la RAE que sigue sustentando muchas de las afirmaciones de la academia en la actualidad. Más allá del impacto superficial de las tecnologías de aprendizaje automático en el lenguaje humano, el presidente de la RAE señala que existen

(1) Las repercusiones puramente lingüísticas de este uso, es decir, la calidad y accesibilidad de la lengua hablada por las máquinas y el riesgo de que dañe su unidad, mantenida hasta hoy como una de las mayores conquistas de la expansión ordenada del español en el mundo… La lengua es el principal valor de la cultura de un pueblo, y el español lo es para una comunidad que abarca casi seiscientos millones de personas. Un deterioro de la calidad, la capacidad expresiva, la belleza o la unidad del español debido a los avances de la inteligencia artificial sería un daño cultural de primer orden. (Muñoz Machado)Referencia Machado y Santiago2023 :123–24)

Por supuesto, el uso acrítico de expresiones como «mayores conquistas» y «expansión ordenada», junto con referencias al gran número de hispanohablantes, para referirse a una supuesta expansión natural de la lengua en todo el mundo, claramente pasa por alto la historia colonial de España.

La RAE ofrece ejemplos concretos de la influencia de las tecnologías de aprendizaje automático en el uso del lenguaje mediado tecnológicamente y destaca los riesgos que pueden suponer para los usuarios y profesionales de la lengua. Por ejemplo, la RAE señala que «existen teclados con sistemas de corrección automática que ignoran casi el 20% de las palabras que aparecen en nuestro diccionario» (Muñoz Machado).Referencia Machado y Santiago2023 :128) y ‘nuestro diccionario tiene 94.400 entradas, pero la mayoría de los correctores automáticos utilizan menos de 80.000 palabras de diccionarios extranjeros’ (Muñoz Machado en Iglesias FragaReferencia Machado y Santiago2021 ), lo que implica una simplificación del vocabulario disponible para los usuarios cotidianos del español. Además, la RAE lamenta su preocupación, señalando que «las máquinas no utilizan el canon panhispánico y siguen el canon de Silicon Valley, que puede ser respetable, pero es diferente del lenguaje estandarizado» (Muñoz Machado, en LorenciReferencia Lorenci2023 ). Tras el imperialismo lingüístico moderado que condujo a la universalización del inglés gracias a la red comercial global del siglo XX, la crítica de la RAE puede interpretarse como una acusación contra las empresas de Silicon Valley por una nueva forma de imperialismo lingüístico, esta vez por no adherirse a la forma estándar de idiomas distintos del inglés. Esta etapa en la evolución de las tecnologías lingüísticas tiene implicaciones para el español estándar, ya que el resultado lingüístico generado por el diseño algorítmico de dichas tecnologías puede influir en la percepción de los hablantes sobre lo que constituye una lengua «correcta», en el sentido de las culturas lingüísticas estándar (véase la sección sobre autoridad lingüística más arriba).

La disrupción que las tecnologías de aprendizaje automático pueden causar en la forma en que las personas se comunican a través del lenguaje no se debe simplemente a un desarrollo tecnológico insuficiente ni a la insuficiencia de los corpus existentes en español. La RAE advierte sobre la posibilidad de una presencia desproporcionada en grandes modelos lingüísticos de rasgos lingüísticos específicos de ciertas regiones o programadores hispanohablantes en lugar de otros. Esto, argumenta la RAE, puede dar lugar a los llamados dialectos digitales, un nuevo tipo de riesgo para el futuro de la lengua, ya que «ponen en tensión la unidad y sientan las bases para una fragmentación del uso de la lengua que las normas académicas han logrado evitar durante más de trescientos años» (Muñoz Machado).Referencia Machado y Santiago2023 :127).

En este contexto de desestabilización de las normas tradicionales a través de medios tecnológicos, el mandato de la RAE de preservar la unidad de la lengua se mantiene. Sin embargo, esta vez, los desafíos de la era digital, en particular los derivados del equilibrio asimétrico entre los sectores público y privado, obligan a la academia a evolucionar sus estrategias y explorar nuevas vías para afirmar su tradicional papel hegemónico como árbitro autorizado en asuntos lingüísticos. Como ocurre con muchos esfuerzos de estandarización, en este caso también existen factores ideológicos.

Recuperando la autoridad en la era de la tecnología de aprendizaje automático

Las instituciones normativas tradicionales como la RAE se sienten amenazadas por los cambios sociales provocados por las tecnologías lingüísticas. Para mantener su posición como actores dominantes en la política lingüística en el siglo XXI, deben ampliar su ámbito de influencia y actividad al ámbito digital, que queda fuera de sus ámbitos nacionales. Antes de centrarnos en su reposicionamiento frente a las empresas tecnológicas, examinemos cómo la RAE percibe el impacto que su trabajo de referencia ha tenido tradicionalmente en la sociedad. Esto se ilustra en (2).

(2) Las obras de la RAE siempre han sido aceptadas y consideradas normas de obligado cumplimiento a lo largo de los tres siglos de existencia de la institución. La Academia no dispone de poder sancionador para reprimir a los infractores, pero su autoridad y prestigio determinan que sus normas constituyan una singular «ley blanda» cuya observancia es esencial para quien desee formar parte de una comunidad hispanohablante como persona alfabetizada. Es la propia sociedad la que repudia el uso bárbaro, inapropiado o incorrecto de la lengua común. (Muñoz Machado)Referencia Machado y Santiago2023 :124)

Con un ligero matiz de nostalgia cultural, en este discurso observamos que las nociones de lengua están estrechamente vinculadas a las nociones de sociedad y jerarquía social. De gran importancia para comprender cómo se ejerce la autoridad lingüística en la actualidad, la RAE explica que su poder regulador es una especie de mecanismo disciplinario invisible mediante el cual impone su supuesta autoridad incuestionable: su «voz de la nada». Desde esta perspectiva, la autoridad no es el resultado de un proceso verticalista que se ejerce continuamente sobre los hablantes, sino que refleja las creencias y la adhesión de los hablantes anónimos y generales sobre las normas lingüísticas. Aplicado al ámbito digital, el argumento de la RAE en (2) implica que los usuarios de tecnología hispanohablantes se mostrarían reacios a adoptar comportamientos lingüísticos convencionales que no reflejen fielmente su propio español, en particular el estándar. Sin embargo, esta afirmación aún debe demostrarse empíricamente.

En un discurso a menudo estructurado en torno a una dicotomía público-privada, la RAE se presenta como el representante natural y ejecutor de la voluntad popular y del sentimiento popular, una institución de espíritu público ampliamente legitimada por la sociedad (Del ValleReferencia Del Valle, Duchêne y Heller2007 ). De este modo, establece una base de apariencia democrática para el prescriptivismo lingüístico, que trasciende un enfoque simplista basado únicamente en el prestigio normativo. Como era de esperar, la RAE se adhiere al ideal convencional de la lengua estándar como bien común, pero también eleva su función reguladora a un estatus similar, caracterizándola como un objeto de interés público general.

Dicho esto, este tipo de poder blando, en parte financiado por el Estado mediante financiación pública y representación simbólica (el rey de España es el máximo representante de la RAE), podría ya no ser lo suficientemente influyente en la era tecnológica. Esta percepción de amenaza al papel tradicional de las instituciones normativas se ilustra en (3).

(3) Hay millones de agentes que poseen la lengua, cuyas mutaciones y variantes esta institución monitoriza minuciosamente en toda la geografía universal del español. En los últimos años, y con creciente intensidad, los cambios no son obra exclusiva de la comunidad hispanohablante, ya que se han introducido nuevos agentes en el sistema lingüístico: empresas tecnológicas que utilizan inteligencia artificial, que son potenciales reguladores o, al menos, prescriptores de la lengua que nos pertenece, con la capacidad de imponer variantes que podrían no coincidir con los usos comunes de los humanos. (Muñoz Machado)Referencia Machado y Santiago2023 :125–26)

Al margen de la cultura normativa específica que prevalece en los territorios hispanohablantes, las grandes empresas tecnológicas a menudo no comprenden ni priorizan la incorporación de esta noción de autoridad lingüística en sus modelos lingüísticos. Por lo tanto, considerando las solicitudes previas de la RAE para obtener apoyo económico e institucional de los organismos estatales para combatir la dinámica cambiante de poder en la política lingüística impulsada por las tecnologías de aprendizaje automático, se puede inferir que los representantes gubernamentales y estatales (algunos de los cuales estuvieron presentes en el evento solemne donde Muñoz Machado pronunció este discurso) se encuentran entre los destinatarios de los mensajes de la RAE.

En este nuevo panorama donde las empresas tecnológicas se han convertido en actores influyentes en la política lingüística, el ejemplo (3) ilustra algunas de las ideas que la RAE tradicionalmente utiliza para sustentar su mandato normativo. Estas incluyen una función notarial supuestamente libre de juicios (Paffey).Referencia Paffey, Ayres-Bennett y Bellamy2021 ) o un enfoque descriptivo sistemático basado en el uso lingüístico real y una valoración celebratoria de la diversidad interna de la lengua en diccionarios, gramáticas y otras obras de referencia. Por supuesto, contrariamente a las afirmaciones reduccionistas de que los estándares son creados por hablantes y no por académicos (véase Paffey).Referencia Paffey, Ayres-Bennett y Bellamy2021 ), la autoridad lingüística permite pasar de describir la lengua a prescribir su uso, lo que en el caso de la RAE se ha definido como ‘prescriptivismo moderado’ (Del ValleReferencia Del Valle, Duchêne y Heller2007 :249). En consecuencia, la función principal de la RAE es la supervisión profesional de las prácticas lingüísticas auténticas de hablantes humanos reales, lo que en esencia implica la construcción de la autenticidad misma (Bucholtz).Referencia Bucholtz2003 :403).

En este contexto, los grandes modelos lingüísticos encarnan la ideología del anonimato, es decir, la eliminación de cualquier situación social y cultural en la lengua, borrando potencialmente las formas vernáculas e imponiendo en su lugar voces de la nada. En lugar de aceptar este lenguaje de nadie en particular, disponible para todos en el espacio digital desterritorializado, la reivindicación de la RAE de autoridad como autenticidad considera el lenguaje generado por la tecnología como inauténtico y el lenguaje producido por humanos como genuino, particular y localizado, es decir, un idioma estándar auténtico, producido por humanos, para una comunidad imaginada de hablantes auténticos. Nos referimos a ella como una comunidad imaginada porque la RAE presenta su enfoque pluricéntrico panhispánico como un español neutral: un idioma global desarraigado que no pertenece a España ni a ningún estado nacional en particular (Moreno-Fernández).Referencia Moreno-Fernández2016 ; PaffeyReferencia Paffey, Ayres-Bennett y Bellamy2021 :251). De hecho, la promoción por parte de la RAE de una variedad estándar general, políticamente neutral y geográficamente ubicua se asemeja un poco al lenguaje anónimo producido por las tecnologías de aprendizaje automático, que la RAE critica por ser una influencia externa.

Sin embargo, el repertorio de argumentos de la RAE no se limita a los conceptos ideológicos de autoridad y autenticidad lingüística. Como se ilustra en (3), la caracterización que la RAE hace de los hablantes hispanohablantes y sus comunidades, verdaderos dueños de la lengua e impulsores del cambio lingüístico, como indefensos ante las grandes empresas tecnológicas sugiere una distribución injusta del poder sobre la lengua estandarizada. Como parte de su estrategia en la batalla por el control lingüístico en el ámbito digital, la RAE conecta su misión con un nuevo discurso de «derechos», como se explica con más detalle en la siguiente sección.

Nuevos enfoques para nuevos desafíos

Centrémonos ahora en el marco más amplio del papel regulador de las academias de idiomas en la era de las tecnologías de aprendizaje automático. En un contexto de mercados globales subregulados, donde los Estados individuales ya no tienen la capacidad de regular tanto los continuos avances tecnológicos como a las empresas que los respaldan (CastellsReferencia Castells2010 ), la RAE postula que el control de la tecnología relacionada con el lenguaje forma parte de debates más amplios sobre el imperativo legal y moral de regular los avances tecnológicos. En otras palabras, para la RAE, los desafíos que plantean las tecnologías de aprendizaje automático van de la mano con los que plantean las tecnologías específicas del lenguaje.

Como se ha señalado anteriormente, la RAE experimentó un proceso de apertura hacia Hispanoamérica, ya fuera por iniciativa propia o por necesidad política (Del ValleReferencia Del Valle, Duchêne y Heller2007 )—para reconocer e integrar la autoridad lingüística emanada de las academias estadounidenses. Esto dio lugar a una visión pluricéntrica del español que expresa con orgullo el atractivo mensaje de «unidad en la diversidad». Sin embargo, en esta nueva fase tecnológica, la RAE aspira a encontrar nuevos aliados potenciales en una asociación supraestatal distinta a Hispanoamérica. Los esfuerzos regulatorios de la RAE, en particular en tecnologías lingüísticas, se alinean naturalmente con la tradición regulatoria europea y, más concretamente, con el principio de seguridad jurídica de la UE, que contrasta con los modelos desreguladores predominantes en Estados Unidos. Esta tensión entre ambas tradiciones, incluyendo los principios ideológicos contrastantes que las sustentan, se ilustra en el siguiente ejemplo.

(4) Dado que el desafío de defender la cultura y los derechos frente a los riesgos que plantea la inteligencia artificial es importante, no cabe duda de que la mejor opción para los Estados y la Unión Europea, y esta última, y ​​no los Estados individuales dada la magnitud del problema, es regularla cuanto antes. En los círculos económicos angloamericanos, se inclinan más por la autorregulación. La cultura europea siempre ha preferido la regulación de las nuevas invenciones… El uso del lenguaje natural por parte de la inteligencia artificial es un objetivo ya alcanzado. Es evidente que habrá que establecer límites legales y éticos para la protección de los valores y derechos, ya sea mediante la autorregulación o la regulación. (Muñoz Machado)Referencia Machado y Santiago2023 :123)

A pesar de referirse a marcos político-económicos en este ejemplo específico, esta dicotomía entre regulación y desregulación en la economía de mercado puede aplicarse al ámbito lingüístico y, en particular, a las diferentes tradiciones en las que se gestionan institucionalmente las lenguas estándar. Por ejemplo, mientras que el inglés se ha desarrollado de forma bastante descentralizada, sin una autoridad estatal única y clara sobre la lengua, en el caso de muchas lenguas europeas, los organismos públicos de los estados correspondientes, a menudo las academias de lenguas, gozan del papel privilegiado de regulación lingüística. De ello se desprende que las tecnologías de aprendizaje automático pueden suponer un desafío mayor para las lenguas con un cuerpo de autoridad lingüística ampliamente aceptado, como el español o el francés, que para aquellas sin un organismo de autoridad profesional o la vinculación tradicional con un estado nación. De hecho, dado que las grandes empresas tecnológicas tienen su sede en la anglosfera y sus amplios modelos lingüísticos se nutren principalmente de corpus en inglés, no sorprende que surjan voces críticas sobre la gestión descuidada de la lengua por parte de las tecnologías de aprendizaje automático en países con lenguas estándar nacionales distintas del inglés. Esta sensación de que es necesario hacer algo respecto al impacto que tales tecnologías parecen haber eclipsado las preocupaciones tradicionales de la RAE, como los efectos corruptores de los anglicismos sobre la pureza del español.

En resumen, la RAE sostiene que la cultura reguladora tradicional de la Europa continental debe mantenerse y aplicarse. Además de enmarcar la gestión lingüística desde una perspectiva legal, como se mencionó anteriormente, la RAE utiliza el discurso de los derechos y los valores como nueva base para justificar su mandato autoritario. Más específicamente, la RAE incluye valores morales democráticos como la equidad y la accesibilidad para afirmar que la lengua es un bien público, impulsando así la presión para la validación lingüística en las tecnologías del lenguaje. Esto se ejemplifica en el siguiente ejemplo.

(5) Las simplificaciones, la jerga y los dialectos introducidos por las redes sociales y que la inteligencia artificial puede generalizar requieren especial atención. El deber de usar un lenguaje claro y sencillo está relacionado en gran medida con la preservación de los derechos individuales, que no pueden ejercerse adecuadamente ante comunicaciones oscuras o casi cifradas para quienes carecen de competencias digitales mínimas. Por ello, la idea de un lenguaje accesible debe añadirse a la de un lenguaje claro y sencillo. El lenguaje de la inteligencia artificial debe adaptarse a las capacidades naturales de las personas. (Muñoz Machado)Referencia Machado y Santiago2023 :135–36)

Este ejemplo contiene una crítica tácita a la incorporación de lenguaje no estándar en grandes modelos lingüísticos a través de datos de redes sociales. Cabe destacar, sin embargo, que la RAE introduce matices críticos además de su visión de la deficiente idoneidad de dichos modelos para las comunidades hispanohablantes. En aparente oposición a los enfoques tecnosolucionistas (Morozov)Referencia Morozov2013 ) y la visión de los avances tecnológicos como de aplicación universal, como el proyecto de traducción universal «Ningún idioma se queda atrás» de Meta, diseñado para «aprender» nuevos idiomas con menos datos de entrenamiento, la RAE enfatiza su orientación al servicio público. Al plantear el debate como «humanos vs. máquinas», adopta una postura antropocéntrica que favorece las habilidades centradas en el ser humano frente a las herramientas comunicativas de libre acceso, aunque a menudo inadecuadas, y mediadas artificialmente.

Este enfoque en el lenguaje sencillo y, en general, en el principio moral de la accesibilidad de las herramientas de comunicación (RAE 2024 ) añade complejidad a la creencia predominante, aunque poco crítica, de que las grandes empresas tecnológicas han democratizado el uso de sistemas de aprendizaje automático. En definitiva, como se detalla en la siguiente sección, la RAE considera que la supervisión lingüística profesional y humana es necesaria para garantizar que las tecnologías de aprendizaje automático permitan eficazmente el uso de la comunicación digital mediada por el lenguaje. Dicha supervisión se asemeja en algunos aspectos a los enfoques actuales centrados en el ser humano que las empresas tecnológicas utilizan para la moderación de contenido, incluyendo la detección de lenguaje abusivo en los datos de entrenamiento.

Esforzándose por ejercer autoridad sobre las industrias tecnológicas

Los organismos de autoridad lingüística han dependido tradicionalmente del respaldo de la infraestructura moderna respaldada por el Estado nacional, como los medios impresos, la radiodifusión pública y el sistema educativo. Si bien la RAE se ha esforzado por modernizar el proceso de estandarización, por ejemplo, interactuando con hablantes en redes sociales (PaffeyReferencia Paffey, Ayres-Bennett y Bellamy2021 ), existe la percepción de que la relevancia de su trabajo normativo está disminuyendo (Ayres-Bennett y BellamyReferencia Ayres-Bennett, Bellamy, Ayres-Bennett y Bellamy2021 ), especialmente con la adopción generalizada de la tecnología lingüística en las tareas cotidianas. La RAE es explícita sobre las posibles soluciones para esta situación, que involucran a las empresas tecnológicas, como se ejemplifica en (6).

(6) Hemos convencido a los humanos de cómo deben usar el español basándonos en nuestra reputación. Pero no podemos obligar a las máquinas a seguir las mismas reglas sin consultar con los fabricantes… estamos obligados a posicionarnos en el mundo digital para que la inteligencia artificial empiece a hablar en español, a imponer la razón en este nuevo universo y a evitar que el idioma se descontrole y favorezca a las grandes multinacionales tecnológicas. (Muñoz Machado en Iglesias Fraga)Referencia Machado y Santiago2021 )

En este contexto de desviaciones no estándar, la RAE pretende extender su mandato normativo al ciberespacio, lo que puede interpretarse como la reproducción del monopolio del prescriptivismo lingüístico en el contexto de las tecnologías lingüísticas privadas. Esto implica que las empresas tecnológicas, que suelen favorecer la desregulación, tienen un enfoque comercial y están radicadas en jurisdicciones no hispanohablantes, deben ser lingüísticamente disciplinadas. Esto incluye, por ejemplo, la rigurosa gestión de los conjuntos de datos utilizados para el entrenamiento de algoritmos de aprendizaje automático, que se mantienen al margen del escrutinio público, y que los modelos lingüísticos se ajusten a las normas lingüísticas estandarizadas. Sin embargo, cabe destacar que las empresas tecnológicas consideran a los hablantes como consumidores y se preocupan principalmente por su comportamiento en línea, más que por sus variedades lingüísticas o identidades nacionales. Las tecnologías de aprendizaje automático buscan replicar géneros reconocibles y, en términos más generales, generar un lenguaje que los usuarios perciban como significativo y correcto, sin priorizar necesariamente la normatividad lingüística tradicional. Dicho de otro modo, estas tecnologías representan un tipo diferente de normatividad: una centrada en la gran cantidad de datos y la generación de beneficios, más que en el potencial comunicativo significativo. Por lo tanto, un objetivo tan ambicioso como el de ejercer el poder de la autoridad lingüística sobre el sector corporativo exige un esfuerzo concertado de los actores públicos y privados. Esta compleja interacción entre diferentes actores, a veces con agendas opuestas, ilustra el entramado sociotécnico que define la política lingüística en la era de las tecnologías de aprendizaje automático.

Para lograr este objetivo, la RAE ha emprendido, junto con una de las Secretarías de Estado de España, el proyecto Lengua Española e Inteligencia Artificial (LEIA), una colaboración público-privada que pretende garantizar el uso del español estándar en productos tecnológicos, por ejemplo, poniendo a disposición de las empresas tecnológicas los conjuntos de datos de diccionarios y corpus lingüísticos de la RAE (RAE 2020 ). En los últimos años, la RAE ha establecido acuerdos con Google, Amazon, Microsoft, Twitter y Facebook para garantizar que sus asistentes de voz, procesadores de texto, motores de búsqueda, chatbots, sistemas de mensajería instantánea y redes sociales cumplan con los estándares aprobados por la RAE para un buen uso del español (véase Muñoz-Basols, Palomares Marín y Moreno-Fernández 2024). Además, la RAE planea implementar un sistema de certificación para evaluar la calidad del español utilizado en los sistemas digitales.

LEIA está incluida en el Proyecto Estratégico para la Recuperación Económica y la Transformación en la Nueva Economía de la Lengua (Gobierno de España 2022 ), un proyecto global financiado a través del programa Next Generation EU de la Unión Europea. Dentro de este proyecto global, la LEIA de la RAE se enmarca generalmente como hacer que la IA «piense en español» o facilitar a las empresas tecnológicas el despliegue de sus servicios en un idioma común» (énfasis añadido). Sin embargo, el proyecto estratégico general tiene objetivos manifiestamente orientados al mercado, ya que su principal objetivo es mejorar el potencial del español (y de las lenguas cooficiales de España) como motor de crecimiento económico y competitividad internacional (Gobierno de España 2022 ). Este enfoque se alinea con los principios del capitalismo digital y no sorprende porque coincide con su fuente de financiación: el plan de recuperación de la UE, diseñado para apoyar la recuperación económica de los estados miembros tras la pandemia de Covid-19. A pesar de su enfoque económico, este proyecto abre una ventana de oportunidad para que la RAE renueve su estatus influyente en la sociedad, particularmente durante un período de grave escasez de recursos financieros públicos para la academia.

Para concluir, cabe destacar que, al liderar estas iniciativas, la RAE consolida su posición como autoridad lingüística preeminente sobre las de los demás países hispanohablantes y consolida a Madrid como el centro permanente de la autoridad lingüística en el mundo hispánico. Lo hace tanto simbólicamente, al asumir el papel de portavoz y fuerza impulsora en materia de normalización del español en el ámbito digital, como en la práctica, al conseguir y gestionar la financiación europea para este fin y actuar como principal interlocutor con las grandes empresas tecnológicas. Esto no solo evoca prácticas coloniales pasadas, sino que también nos recuerda que quienes más se beneficiaron del colonialismo son también quienes más se benefician de las tecnologías de aprendizaje automático (Mejías y Couldry).Referencia Mejias y Couldry2024 ).

Discusión y observaciones finales

Hemos analizado cómo las instituciones tradicionales de autoridad lingüística negocian su posición frente a los nuevos actores lingüísticos surgidos en los ensamblajes sociotécnicos moldeados por las industrias digitales comerciales. Nuestra investigación se ha centrado en el discurso de la RAE sobre su posición y su crítica a las grandes empresas tecnológicas de Silicon Valley. Tras resumir nuestras observaciones, analizamos qué sugieren las tensiones entre entidades comerciales e instituciones (semi)públicas como la RAE sobre la redistribución de las estructuras de poder.

El discurso de la RAE se basa en los tropos tradicionales de autenticidad y peligro, presentando ahora las tecnologías comerciales como amenazas a la unidad y las cualidades expresivas y estéticas del español como lengua global. Esta amenaza se presenta como proveniente del lenguaje producido por máquinas, entendido como artificial e inauténtico. Se menciona a los humanos detrás del lenguaje generado artificialmente, es decir, las empresas anglófonas de Silicon Valley, pero el lenguaje producido por estas empresas se trata como supuestamente diferente del lenguaje humano, es decir, como un lenguaje «no humano». Las tecnologías de aprendizaje automático, que operan sobre la base de la idea de que el lenguaje equivale a datos escritos legibles por máquinas y que el lenguaje no debe ser regulado, se entienden como capaces de perturbar y destruir el español auténtico, definido como el español producido por humanos, y, en consecuencia, la comunidad mundial de hispanohablantes.

Al comparar el discurso de la RAE con las nociones previas de lengua estándar, observamos continuidades y cambios. En las conceptualizaciones tradicionales de los estándares nacionales, construidos y respaldados por una institución como la RAE, las normas lingüísticas se percibían como una autoridad no marcada, funcionando como un poderoso mecanismo de control. Una institución como la RAE, en el pasado, no tenía que justificar sus decisiones, operando en su lugar dentro de tradiciones nacionales o supranacionales (supuestamente) aceptadas. Sin embargo, al enfrentarse a las corporaciones digitales multinacionales, las academias lingüísticas tradicionales necesitan justificar su existencia y afirmar su autoridad. En el discurso analizado anteriormente, la RAE invoca aspectos del discurso tradicional de la amenaza y enfatiza su reconocida profesionalidad en materia de lengua española, exigiendo que las empresas tecnológicas privadas reconozcan este conocimiento especial como autoridad lingüística. Ahora basa su autoridad en la unidad supranacional de los países hispanohablantes y en los valores europeos que priorizan la regulación de la innovación tecnológica. Las normas lingüísticas ya no se presentan como símbolos de refinamiento y educación, sino como la representación de una defensa democrática del pueblo frente a entidades externas e inhumanas. Si bien la autoridad lingüística en contextos nacionales se entiende tradicionalmente como anónima y la lengua de todos, los discursos de legitimación más recientes declaran que una lengua estándar es un bien común. Se define como propiedad de los miembros de su comunidad de hablantes (imaginaria) y debe basarse en la lengua comúnmente utilizada por esta comunidad, representando y respetando su diversidad lingüística (como también documenta la RAE); funciona también como una fuerza vital que une a una comunidad global de hablantes. Es este bien común el que se ve amenazado por una fuerza que se construye como ajena, antinatural y inhumana.

¿Qué sugieren estos discursos sobre la redistribución del poder? Parece existir tensión entre los actores comerciales globales y los actores nacionales cuasi tradicionales, quienes pretenden representar al público, pero tienen diferentes interpretaciones de lo que esto implica. La RAE presenta esto como una tensión entre la comunidad humana y una voz asocial no humana. Presenta una imagen de las tecnologías lingüísticas de aprendizaje automático, promovidas por empresas comerciales globales de Silicon Valley, como una amenaza para la cultura tradicional, la autenticidad, los valores democráticos y la unidad. Sin embargo, lo que está en juego aquí también puede interpretarse como una lucha de poder sobre quién puede afirmar una voz «de la nada». Subyacente a este debate se encuentra la cuestión de quién controla el espacio público: ¿las instituciones nacionales tradicionales o las empresas multinacionales y comerciales globales? Estas últimas tienen acceso a enormes conjuntos de datos privados, que utilizan para crear y difundir el lenguaje, impulsando así su privatización. Poderosos intereses privados dominan el principio del ordenamiento social (Zuboff).Referencia Zuboff2019 :192); existe un espacio público global emergente gobernado por empresas comerciales, más que por instituciones políticas nacionales. Los soberanos lingüísticos hegemónicos, antes incuestionables, deben buscar su lugar en esta economía social reconfigurada.

La observación de que las entidades comerciales no públicas se han convertido en actores vitales en los acuerdos de poder global ha sido discutida y problematizada en la teoría sociológica. Los escritos de Bauman sobre las estructuras de la modernidad tardía parecen confirmarse aquí; argumenta que «en la etapa fluida de la modernidad, la mayoría sedentaria está gobernada por la élite nómada y extraterritorial» (Bauman).Referencia Bauman2012 :13), que no es ni democráticamente elegido ni visible, sino que se configura a imagen de los antiguos «terratenientes ausentes». Gobierna sin «preocupaciones de bienestar» ni la «misión de ‘iluminar’, ‘reformar las costumbres’, moralmente edificantes, ‘civilizadoras’ y culturales» (Bauman).Referencia Bauman2012 :13). En consecuencia, el Estado y sus instituciones ya no son el «plenipotenciario de la razón ni el constructor maestro de la sociedad racional» (Bauman).Referencia Bauman2012 :48) pero son ‘reemplazados por un ‘centro comercial’ en el que los individuos liberados buscan entre las ofertas de los proveedores comerciales la que mejor se adapte a sus necesidades (individualizadas) en lugar de perseguir un objetivo común’ (Bauman).Referencia Bauman2012 :20).

Si bien la sociolingüística tiende a considerar la normalización lingüística nacional como una práctica de opresión, instituciones como la RAE, responsables de la creación y el mantenimiento de signos compartidos, podrían contribuir también a la formación de comunidades sociales e identidades compartidas. En este nuevo contexto, al igual que la RAE, la sociolingüística continúa estando dominada por preferencias teóricas y metodológicas por el discurso hablado, fuera de línea, en contextos e identidades temporales, socioculturales e interpersonales fijos y claramente definibles (Blommaert).Referencia Blommaert2019 :486) y conceptualiza el uso del lenguaje cara a cara (o de usuario a usuario) como el locus del lenguaje. En el contexto de las realidades de las grandes tecnologías, la sociolingüística debe encontrar urgentemente un nuevo lugar y replantear gran parte de lo que asume como «natural, primordial y de sentido común sobre el lenguaje» (Blommaert).Referencia Blommaert2019 :486; véase también Erdocia, Migge y SchneiderReferencia Erdocia, Migge y Schneider2024 ). En el contexto posdigital, las comprensiones actuales del lenguaje y el surgimiento, distribución y mantenimiento del lenguaje (Migge et al.Referencia Migge, Schneider, Leblebici, Erdocia, Lau, Viidalepp, Savoldi, Podboj, Meer, Alenezi, Sampietro y Sayers2025 ) se verá cada vez más reestructurado por las prácticas algorítmicas de las grandes empresas tecnológicas (Kelly-HolmesReferencia Kelly-Holmes2022 ) y el lenguaje en el mundo real estará inseparablemente entrelazado con el del mundo digital. Actualmente no está claro qué efecto tendrá la provisión de tecnología lingüística comercial en el futuro del lenguaje compartido y en el futuro de las comunidades sociales.

Lo que está claro es que los deseos de lucro de las grandes empresas tecnológicas y los deseos de normalización de las instituciones políticas nacionales y supranacionales seguirán funcionando como importantes fuerzas centrífugas y centrípetas en este proceso en constante expansión. Las ideas normativas sobre el lenguaje seguirán teniendo una importante función social, pero probablemente observemos el surgimiento de construcciones reconfiguradas de voces anónimas y lenguaje auténtico.

Este trabajo fue apoyado por la Facultad de Humanidades y Ciencias Sociales de la Universidad de la Ciudad de Dublín.

1Por «tecnologías de aprendizaje automático» nos referimos a herramientas basadas en algoritmos que detectan y reproducen patrones en conjuntos de datos. Evitamos llamar a estas herramientas «inteligencia artificial», ya que se trata de un término de marketing que mistifica el funcionamiento de las multiplicaciones algorítmicas de matrices y, por lo tanto, refuerza el poder de unas pocas empresas con los recursos financieros y materiales necesarios para construir grandes modelos lingüísticos desde cero (véase Katz, 2020 ; véase Bender, McMillan-Major, Gebru y Shmitchell, 2021, para una evaluación crítica de la hegemonía de las «grandes tecnológicas»).

2Tenga en cuenta, por ejemplo, que en los EE. UU., la Sec. 230 de la Ley de Telecomunicaciones de EE. UU. permite que las empresas de redes sociales sean tratadas como un «transportista común» (como una empresa de teléfono o mensajería), lo que significa que no son responsables de lo que aparece en sus plataformas (gracias a un revisor por informarnos sobre esto).


 

Deja un comentario

Acerca de

Writing on the Wall is a newsletter for freelance writers seeking inspiration, advice, and support on their creative journey.