Contadores de frecuencia de palabras introducidos en el sitio

This site is available in English. Show this page in English

Recientemente he creado una nueva herramienta en línea que espero le ayudará a aprender lenguas extranjeras de manera más efectiva. Está en los contadores de frecuencia de palabras. Veamos, ¿cómo pueden ayudarle?

Bueno, todos a veces nos enfrentamos al siguiente problema – es posible que desee ver una nueva película o leer un libro en lengua extranjera, pero no sabe si se adapta a su nivel. Por supuesto, usted puede empezar a ver la película o leer el primer capítulo del libro, y puede parecer que está bien, pero luego se da cuenta de que contiene demasiadas palabras desconocidas. Ahora tiene un dilema - dejarlo o continuar viendo (o leyendo). Puede ser difícil de dejar y también puede ser difícil de seguir, si la película o el libro son demasiado complicados.

¡Ya tiene la solución! Puede simplemente copiar y pegar el primer capítulo de su libro en el contador de frecuencia de palabras, y le aparecerán las estadísticas detalladas de su texto: cuántas palabras de diferentes intervalos de frecuencia contiene. El contador también destacará las palabras de mayor frecuencia en diferentes colores (en función de su calificación de frecuencia). Los contadores también admiten archivos de subtítulos, por si usted desea analizar el vocabulario de una película que quiere ver.

Los contadores de frecuencia de palabras están disponibles para los siguientes idiomas:

Si quiere que le cree un contador de frecuencia de palabras en otro idioma, no dude en contactar conmigo. Si existe una lista de frecuencia de palabras para este idioma disponible bajo una licencia adecuada, creo que podré hacérselo.

A los que se pregunten dónde he encontrado las listas de frecuencia, les diré que he utilizado dos fuentes:

  1. Las listas de frecuencia de palabras del blog Invoke IT publicadas bajo licencia de Creative Commons. Estas listas de frecuencia fueron compiladas utilizando subtítulos de opensubtitles.org. La desventaja de este enfoque es que estas listas contienen la calificación de frecuencia sólo para las formas derivadas de las palabras. Puede que no sea tan importante para el idioma inglés, donde por lo general hay un máximo de 2-4 formas para cada palabra. Pero vamos a tomar francés, por ejemplo, donde cada verbo puede tener ¡cerca de 40 formas verbales distintas! Para estos idiomas se debe tener en cuenta que una forma rara, incluso de una palabra muy frecuente puede tener una calificación de baja frecuencia.
  2. Para el idioma inglés también usé la lista de frecuencia de palabras basada en el Corpus de inglés americano contemporáneo compilado por el profesor Mark Davies. He comprado la versión completa de esta lista de frecuencias, y el profesor aceptó tal uso de la lista. Si elige esta opción, el texto será analizado por lemas. Eso significa que todas las formas de una palabra en particular tendrán el mismo índice de frecuencia. Por ejemplo, las palabras "count", "counts", "counted" estarán todas en el intervalo de las 1.001-2.000 palabras más frecuentes. Por cierto, se utilizó esta lista de frecuencias para crear "A Frequency Dictionary of Contemporary American English".

Otra gran noticia es que ahora el resaltado de palabras de alta frecuencia está integrado en todos los transcriptores fonéticos del sitio (a excepción del japonés, que está en preparación). Esta opción sólo funciona si decide convertir su texto a "transcripción debajo de cada palabra" o "transcripción debajo de cada línea de texto".

Etiquetas: alemán, chino, español, francés, inglés, italiano, portugués, portugués de Brasil, ruso