Apéndice:Palabras más frecuentes del español
Lista de frecuencias de palabras del castellano de Chile (Lifcach), Scott Sadowsky & Ricardo Martínez
editarLa Lista de Frecuencias de Palabras del Castellano de Chile (Lifcach) es un conjunto de 102 listas de frecuencias léxicas derivadas de los distintos subcorpora del Corpus Dinámico del Castellano de Chile (Codicach), un corpus del español escrito contemporáneo de Chile desarrollado por Sadowsky entre 1997 y 2002; este corpus contenía aproximadamente 450 millones de palabras a la hora de elaborar la Lifcach (actualmente contiene alrededor de 800 millones de palabras). La Lifcach también contempla una lista no ponderada de frecuencias totales (la columna titulada Total Occurrences), la cual es simplemente la suma de las frecuencias de las 102 listas individuales (en otras palabras, es la lista de las frecuencias del Codicach en su totalidad).
La Lifcach puede bajarse desde aquí.
Palabras más frecuentes de subtítulos
editarEsta lista ha sido generada de subtítulos de películas y series de televisión. Los archivos han sido bajados al azar de un portal de subtítulos en 2007, y contienen un total de 22 millones de palabras. La gran mayoría de los subtítulos son traducciones del inglés, de manera que debe haber cierta preferencia de palabras amigas con el inglés. Por razones técnicas todas las letras son minúsculas.
Por favor tenga cuidado si crea nuevas páginas siguiendo los enlaces de las listas ya que hay muchas palabras que no están en forma primitiva (verbos en infinitivo, adjetivos en forma masculino singular, sustantivos en singular salvo cuando solo existe la forma plural) y la lista contiene faltas de ortografía.
Aquí están las palabras ordenadas por frecuencia (ppm = palabras por millón) las con tilde ' estan todas en Wikcionario:
1-1000 · ' 1001-2000 · ' 2001-3000 · ' 3001-4000 · ' 4001-5000 · ' 5001-6000 · 6001-7000 · 7001-8000 · 8001-9000 · 9001-10000 · 10001-15000 · 15001-20000