Análisis de consultas al Diccionario del español de México en línea

AutorAlfonso Medina Urrea
CargoProfesor-investigador del Centro de Estudios Lingüísticos y Literarios (cell) del colmex
Páginas119-139
119
Andamios
Análisis de consultAs Al
Diccionario Del español De México en líneA
Alfonso Medina Urrea*
Resumen. En este trabajo se examinan las frecuencias y dispersio-
nes geográfica y temporal de las consultas hechas al Diccionario
del español de México entre agosto de 2012 y septiembre de 2013.
Esta información se usa para calcular un índice que permite se-
leccionar aquellas que son más usuales en más lugares y por más
tiempo. Con este índice se puede, por un lado, evaluar la base
estadística que dio lugar a la nomenclatura actual del diccionario
y, por el otro, seleccionar aquellas consultas sin respuesta en el
sistema que sean los mejores candidatos para formar parte de
futuras nomenclaturas del diccionario.
PAlAbRAs clAve. Diccionario del español de México, adquisición lé-
xica, frecuencia de consulta, dispersión geográfica de consultas,
dispersión temporal de consultas.
intRoducción
no de los temas más visibles del proyecto del Diccionario
del español de México (DeM) ha sido el de cómo determinar
la nomenclatura de un diccionario, esto es, la lista de
lemas que se definen en él. Al tratarse de un diccionario
integral, el DeM busca documentar las voces más usuales
del español en México y no solamente las más coloridas y peculiares de
nuestra región. En otras palabras, lo importante no ha sido compilar la
lista de los vocablos que nos parecen más característicos del español mexi-
cano, como si se tratara de un diccionario de mexicanismos, sino determi-
* Profesor-investigador del Centro de Estudios Lingüísticos y Literarios (cell) del colmex.
Miembro del equipo de investigación responsable del Diccionario del español de México
(DeM), del cell-colmex. Dirección electrónica: amedinau@colmex.mx
Volumen 11, número 26, septiembre-diciembre, 2014, pp. 119-139
120 Andamios
Alfonso MedinA UrreA
nar cuáles son los que más usamos día a día, que naturalmente tienden a
ser los que compartimos con otros hablantes de la lengua española.
Un diccionario integral de nuestro español satisface varias necesida-
des. Dos de las más importantes son: 1) documentar el léxico que usamos
hoy en día, para contribuir a la educación y comunicación en nuestro
país y 2) afirmar nuestra herencia lingüística, especialmente nuestro pa-
trimonio léxico, que no es prestado y que en mucho compartimos con
el resto de los hispanoparlantes. Así, un diccionario integral, además
de permitirnos conocer lo particular y peculiar de nuestro dialecto, nos
posibilita ponderar lo frecuente, común y tradicional y, por lo tanto,
más difundido con el mundo de habla hispana.
En este contexto, el equipo lexicográfico del DeM se apoyó desde un pri-
mer momento en criterios estadísticos, los que se le aplicaron al Corpus del
español mexicano contemporáneo (ceMc)1 para conformar una base estadísti-
ca, que nos permite asegurar que los vocablos que forman parte de la no-
menclatura del diccionario son los más representativos del español usado
en México, en diversos géneros textuales y registros dia lectales (Lara et al.
1980: 29-39). En su última versión, el diccionario incluye los vocablos con
frecuencia de tres o más2 en el ceMc. Específicamente, tiene una nomencla-
tura de aproximadamente 25 mil vocablos, que engloban cerca de 50 mil
acepciones; y se puede confiar, gracias a esta base estadística, en que las
palabras del diccionario han sido usadas en México en los siglos xx y xxi.
Ciertamente, el tamaño de la nomenclatura del diccionario deberá
crecer todavía más para satisfacer las necesidades educativas y co-
municativas de los hispanoparlantes mexicanos. Por eso, el equipo del DeM
trabaja nuevos artículos lexicográficos, correspondientes a las palabras con
frecuencia dos o menos en el ceMc, y se ha embarcado en la compilación
de un nuevo corpus, el ceMc2, que servirá para cons tituir una nueva base
estadística, que permitirá determinar qué vocablos adicionales, muchos
muy nuevos, podrán incluirse en la futura nomenclatura.
1 Se trata de un corpus electrónico de cerca de dos millones de palabras que se puede
consultar en http://cemc.colmex.mx.
2 No se trata de la frecuencia absoluta de las palabras en el corpus. Más bien es una fre-
cuencia ajustada para tomar en cuenta su dispersión en los diversos géneros del corpus
(periodismo, literatura, etcétera). De esta manera, aquellos que ocurren en más géneros
tienen una mayor frecuencia y aquellos que ocurren en menos géneros tienen una menor.

Para continuar leyendo

Solicita tu prueba

VLEX utiliza cookies de inicio de sesión para aportarte una mejor experiencia de navegación. Si haces click en 'Aceptar' o continúas navegando por esta web consideramos que aceptas nuestra política de cookies. ACEPTAR