Calcular correctamente el porcentaje de apariciones de letras en el idioma español es un desafío y tanto. Tal vez sea algo imposible de hacer, porque el lenguaje no es un fenómeno estático, sino variable. Pero es posible que se puedan establecer algunos parámetros que permitan tener una visión aproximada y general del comportamiento de la lengua, y más específicamente de las letras, no importando que idioma sea el que está siendo estudiado.
Existe cierto grado de arbitrariedad en el análisis del caso. Pero el fenómeno lingüístico que se pretende estudiar puede ser reducido a un espacio específico, por ejemplo, a una obra literaria de gran importancia para la sociedad, que podría ser, digamos: Don Quijote, Doña Bárbara, Martín Fierro, La Regenta o Cien Años de Soledad.
Para hacer ese análisis es necesario considerar factores como: la interpretación personal o del grupo, el estilo narrativo, el uso de los verbos, el vocabulario del documento, los símbolos, los parámetros técnicos y la presencia de caracteres no alfabéticos.
Estimativa de la frecuencia de uso de las letras en el idioma español, conforme el análisis de algunas obras literarias. Ref.:https://es.wikipedia.org.
Al representar esos valores en un gráfico, siguiendo el orden alfabético, notamos las oscilaciones que sufren las palabras. Por otro lado, si el orden observado por algunos está correcto, en tal caso, al ser ordenadas las letras del idioma español, de mayor a menor frecuencia de uso, se puede obtener el siguiente orden o resultado: E, A, O, S, R, N, I, D, L, C, T, U, M, P, B, G, V, Y, Q, H, F, Z, J, Ñ, X, K, W.
Frecuencia de empleo de las letras en castellano o español, siguiendo el orden alfabético del abecedario. Ref.: https://es.wikipedia.org.
Considerando los datos presentes en la tabla anterior, se puede decir que:
Las vocales pueden ocupar alrededor del 45% del texto.
Las vocales E y A son identificables fácilmente, destacándose sobre todas las otras letras, pero les siguen las vocales O, I y U, en orden decreciente, conforme el porcentaje de apariciones de cada una de ellas.
Las consonantes más usadas: S, R, N, D, L, C (aparecen con una frecuencia de un 37%).
Las seis letras que son usadas con menos frecuentes son: Z, J, Ñ, X, K, W (sumadas tienen una frecuencia que apenas supera el 1,5%).
Frecuencia de empleo de las letras en castellano o español, en la obra Don Quijote, siguiendo el orden decreciente de uso de las letras del abecedario, sin considerar el orden natural del abecedario, los espacios y los símbolos especiales. El texto del Quijote contiene 1.640.502 letras. Ref.: https://es.wikipedia.org.
Frecuencia de empleo de las letras en castellano o español, siguiendo el orden decreciente de uso de las letras del abecedario, en la obra Don Quijote, de Miguel de Cervantes, desconsiderando espacio y símbolos especiales. Ref.: Autor, con base en los datos expuestos en Frecuencia de las letras en castellano: «La Regenta», de Leopoldo Alas (Clarín).
Frecuencia de empleo de las letras en castellano o español, en la obra La Regenta, de Leopoldo Alas (Clarín), siguiendo el orden decreciente de uso de las letras, considerando espacio y símbolos especiales y sin considerar el orden natural del abecedario. El texto de La Regenta contiene 1.734.699 letras. Ref.: https://es.wikipedia.org.
Como se trata de una cuestión idiomática y de una hipótesis, es posible que el margen de diferenciación de los fenómenos aquí expuestos de forma superficial sea corroborado o negado por otras investigaciones, o lo que sea mejor.
Analicemos los datos presentes en la siguiente tabla, relacionada con la obra La Regenta:
Frecuencia de empleo de las letras en castellano o español, siguiendo el orden decreciente de uso de las letras del abecedario, en la obra La Regenta, de Leopoldo Alas (Clarín), desconsiderando espacio y símbolos especiales. Ref.: Autor, Basado en los datos expuestos en Frecuencia de las letras en castellano: «La Regenta», de Leopoldo Alas (Clarín).
A continuación, transcribimos las siguientes observaciones:
1. El porcentaje de caracteres no procesados (signos de admiración, interrogación, paréntesis, etc.) es tan solo de un 2,3 %. 2. Como se esperaba, el separador o espacio es el signo más abundante, casi duplicando a la letra más frecuente. 3. En contra de la extendida creencia de que la letra E es bastante más frecuente que la A (un 14% frente a un 12%, en el caso de El Quijote), los resultados muestran a que la letra A es algo más abundante que la letra E (un 11% frente a un 10%). La creencia errónea de la supremacía de la E es atribuible al uso de trabajos realizados sobre el idioma inglés donde, al parecer, dichas frecuencias están invertidas. De todos modos, convendría revisar la estadística para el caso de El Quijote o de alguna otra obra moderna. 4. La letra R es más abundante que la N. 5. Los signos de puntuación [ , ] y [ . ] son más abundantes que la letra Q y siguientes. En cambio, como cabía esperar, los signos [ ; ] y [ : ] son menos abundantes, aunque el [ ; ] a la Ñ el segundo a la K. Lógicamente, salvo que el texto incluya nombres o palabras extranjeras, la letra W es la menos frecuente de todas. 6. La letra I, cuando incluye la variable acentuada, es más frecuente que la L.
En resumidas cuentas, partiendo de la tesis de que los datos aquí presentados representan un nivel aceptable de la realidad, observamos también que:
1. Cuando comparamos varias obras de referencia, existe una secuencia relativamente parecida en el comportamiento de las letras del idioma español empleadas por diversos escritores.
2. Puede notarse que las letras A y E (vocales) se intercalan en su uso e importancia, dependiendo de la obra analizada, y su proporcionalidad de uso puede variar entre un 14% a 10%, aun así, es bien más seguro que la letra A asuma el liderazgo, en tesis, en la mayoría de las obras.
3. Las letras O, S, R, N, I, L, D, U, T, C, M y P tienen una tendencia decreciente, con comportamiento muy parecido en las dos obras aquí consideradas, oscilando entre un 12% y un 2% de utilización.
4. Por otro lado, las letras Q, Y, J, Z, X y W tienen un comportamiento oscilante, pero bajo en su uso, claro, que puede variar entre un 2% de empleo para bajo, hasta cero.
5. Igualmente, las letras V, G, H, F, Z, Ñ, X, K y Q tienen un nivel de empleo que no ultrapasa el 2%, con un nivel de uso intermedio de 1%, aproximadamente.
En resumidas cuentas, sabemos que este es un tema complexo que no se soluciona con un simple gráfico o con una tabla de datos extraídos de una situación específica, pero por lo menos, este modelo teórico establece un parámetro de investigación y estudio más profundo, por lo que se hace necesario emplear herramientas científicas que permitan hacer comparaciones más acertadas.
Referencias: Fletcher Pratt, Secret and Urgent: the Story of Codes and Ciphers Blue Ribbon Books, 1939, pp. 254-255.
La Nueva gramática de la lengua española (2009-2011), primera gramática académica desde 1931, es una obra consensuada por todas las academias de la lengua. Publicada en tres volúmenes, la obra se articula en tres partes fundamentales: una dedicada a la morfología, que analiza la estructura de las palabras, su constitución interna y sus variaciones; otra a la sintaxis, que se ocupa de la forma en que se ordenan y combinan, y la dedicada a la fonética y fonología, que estudia los sonidos del habla y su organización lingüística.
«Los nombres contrarios a la dignidad o al decoro de la persona por resultar irrespetuosos, soeces, ridículos, vergonzosos o vejatorios» están prohibidos.
A los tradicionales nombres de Antonio, Manuel, Francisco o Juan y a las María, Carmen, Josefa o Isabel les han aparecido fuertes contrincantes: Stalin, Kennedy, Mao, Sisi, Evita, Canuto, Rihanna o Shakira. É aquí un grupo de nombres que empiezan a hacerse común en la geografía española, así como en otras latitudes. El nombre Shakira, ya se cuenta por centenares.
No todos los nombres son válidos en algunas regiones o países. En el estado de Sonora, en México, las autoridades locales prohíben los padres llamar a sus hijos de Harry Potter, Burger King, Michael Jackson, Cesárea, Cheyyene, Circunsición o Christmas Day, la lógica nos lleva a saber el motivo de fondo. Según las autoridades locales, el propósito es acabar con la alta tasa de acoso escolar que se producen en las escuelas de la región.
En España, según la ley de registro civil, si los padres o representantes de la criatura no expresan el nombre o eligen uno inadmisible en el plazo de tres días, el encargado del registro público será quien ponga nombre al niño o niña, especialmente cuando existe discrepancias entre los progenitores. En este país están prohibidos «los nombres contrarios a la dignidad o al decoro de la persona por resultar irrespetuosos, soeces, ridículos, vergonzosos, vejatorios…».
JUDAS NO ESTÁ PERMITIDO; STALIN SÍ
La polémica creada por los nuevos nombres ha llevado a muchos a los tribunales. En España, uno no puede llamarse Mandarina (por ser el nombre de una fruta y a su vez impropio para una persona) pero sí Stalin o Mao (líderes con miles de muertos a sus espaldas). Tampoco se permiten nombres como Caín o Judas, pero sí Canuto o Digna. Según el Instituto Nacional de Estadística (INE), en España existen unas 1.608 mujeres con el nombre de Marciana.
En España viven 32 Stalin, 97 Kennedy, 69 Mao, 66 Caín, 2.182 Digna, 35 Evita, 590 Heidi, 80 Canuto, 73 Rihanna, 44 Miley, 320 Justin y 272 Amelie. Así tenemos nombres como Miguel Marco Gol, Florentina Caldito Blanco o a Digna Marciana.
UN PUEBLO DE ESPAÑA CON LOS NOMBRES MÁS RAROS
Nombres como Canuto o Hierónides han hecho que este pueblecito de Burgos se inscribiese en el Libro Guinness de los Récords. Entre sus habitantes también te encontrarás a Auda, Filogonio, Maerino, Marceonila, Plautila, Eufronia, Tobías, Rolando, Ludovico o Especioso. Ahora ya es normal encontrarse a algún Iván y la tradición de poner nombres raros a los hijos ha ido perdiendo terreno.
En España, los nombres más comunes siguen siendo Antonio (752.596 personas), José (689.554), Manuel (648.131), Francisco (561.332) y Juan (388.323), entre los hombres, y María Carmen (677.777), María (660.385), Carmen (439.387), Josefa (318.980) e Isabel (291.919), entre las mujeres.
HARRY POTTER A LA PIZARRA
Es solo imaginar lo gracioso que debe para algunos que el profesor llame a un alumno por el nombre de Harry Potter, para que solucione un problema en la pizarra. Debe ser una situación por lo menos embarazosa. Bueno, esa tal vez pase. Pero, ¿qué tal llamar a un estudiante de Aceituno, Batman o Burguer King? Eso no es nada. Dentro del grupo de estudiantes, es probable que nos encontremos con un tal Michael Jackson, con Circunsición, con Christmas Day, con Email, hasta con Rambo, Terminator y Twitter… Pare de contar.
Estos son algunos nombres que las autoridades mexicanas del estado de Sonora, pretenden erradicar, por lo que han lanzado una campaña para que sea certificada una nueva ley del Registro Civil que prohíba registrar niños con nombres que pueden ser motivo de discriminación y humillación pública. La cuestión es que en Sonora, como su nombre suena, a las personas les encanta colocar nombres de hombres famosos en sus hijos. Lo mínimo es copiar el nombre que aparece en el calendario.
La prohibición, como siempre, está siendo motivo de polémica. Esta ley comenzó a ser aplicada a partir del 10 de febrero. Algunos la ven con buenos ojos, mientras que otros critican que dicha ley viole los derechos de los padres de criar a sus hijos de la forma que ellos personalmente consideran pertinente, por lo que otros no tienen derecho a decidir la vida de nadie, mucho menos la forma como deberían ser llamados los nuevos habitantes del convulsionado planeta Tierra. El bullying escolar es muy común en México y es un problema social que llama la atención de las autoridades, como reconoce la Comisión Nacional de Derechos Humanos (CNDH), que indica que el 40% de los 18 millones de estudiantes mexicanos de primaria y secundaria ya sufrieron algún tipo de bullying.
Avetecaes el archivo de las Actividades del Aula Virtual de Español. Periódicamente se incorporan aquí todas las actividades, clasificadas de acuerdo con los niveles de referencia A1-A2 ,B1-B2 y C1 que recoge elPlan curricular del Instituto Cervantes.
La Gramática de la Lengua Española es una obra magistral producida por los hombres y mujeres más eminentes del área del idioma, que rescata el habla cotidiana del pueblo, que es la verdadera fuente del uso de la lengua.
¿Es correcta la expresión ‘en base a’? ¿Se dice ‘superior a lo previsto’ o ‘superior que lo previsto’? ¿Se pronuncia ‘adecua’ o ‘adecúa’? ¿Cómo se dice, ‘sentaros’ o ‘sentaos’? ¿Qué diferencia hay entre porque, porqué y por qué? ¿Cómo se escribe, ‘el Papa’ o ‘el papa’? ¿Se acentúan los demostrativos? En este libro del Instituto Cervantes, Las 500 dudas más frecuentes del español, se encuentran las respuestas a estas y a otras muchísimas preguntas que los hispanohablantes nos hacemos a menudo. Esta obra está estructurada en forma de pregunta/respuesta, y desde un enfoque ágil y eminentemente práctico, expone y resuelve los principales problemas que se presentan en el uso de la lengua española.
El Instituto Cervantes pone a disposición de los interesados guías para candidatos DELE que incluyen información básica sobre la descripción y la administración de las pruebas de examen DELE.
El Diploma de español nivel A1 acredita la competencia lingüística suficiente para:
comprender y utilizar expresiones cotidianas de uso muy frecuente en cualquier lugar del mundo hispanohablante para satisfacer necesidades inmediatas;
pedir y dar información personal básica sobre sí mismo y sobre su vida diaria; y
para interactuar de forma elemental con hablantes, siempre que estos hablen despacio y con claridad y estén dispuestos a cooperar.
La estructura del examen DELE A1 (versión 2020) es la siguiente (la información que se ofrece a continuación expresa la secuencia de administración de las pruebas de examen):
PRUEBAS QUE SE CELEBRAN EN LA FECHA OFICIAL DE EXAMEN DELE EN EL HORARIO ESTABLECIDO EN LA CONVOCATORIA DEL CENTRO DE EXAMEN
Prueba 1: Comprensión de lectura
45 minutos
4 tareas
25 ítems
Tarea 1 (5 ítems)
Tarea 2 (6 ítems)
Tarea 3 (6 ítems)
Tarea 4 (8 ítems)
25 puntos
Prueba 2: Comprensión auditiva
25 minutos
4 tareas
25 ítems
Tarea 1 (5 ítems)
Tarea 2 (5 ítems)
Tarea 3 (8 ítems)
Tarea 4 (7 ítems)
25 puntos
Prueba 3: Expresión e interacción escritas
25 minutos
2 tareas
Tarea 1. Interacción escrita
Tarea 2. Interacción escrita
25 puntos
PRUEBA QUE PUEDE CELEBRARSE EN OTRO DÍA INMEDIATAMENTE ANTERIOR O POSTERIOR A LA FECHA OFICIAL DEL EXAMEN DELE, DE ACUERDO CON LA CONVOCATORIA DEL CENTRO DE EXAMEN
El Instituto Cervantes pone a disposición de los interesados modelos de hojas de respuesta de los exámenes DELE para que los candidatos puedan familiarizarse con ellas antes del día del examen.
El Instituto Cervantes pone a disposición de los interesados modelos de examen administrados en anteriores convocatorias para cada uno de los exámenes DELE generales.
Los materiales incluyen cuadernillos de examen en formato PDF, los audios para las tareas de comprensión auditiva y las claves de respuesta de las pruebas de Comprensión de lectura y de comprensión auditiva.
Guías de examen DELE
Las guías de los exámenes DELE se dirigen a profesionales de la enseñanza de español, creadores y editores de materiales didácticos, personal de centros de enseñanza de español, formadores de candidatos, prescriptores de examen y candidatos, interesados en conocer información detallada sobre los exámenes DELE generales.
Las guías incluyen una descripción de la estructura del examen y de las pruebas y las tareas que lo conforman; las escalas de calificación de las pruebas de Expresión e interacción orales y de Expresión e interacción escritas; muestras de la producción de candidatos en estas pruebas y de sus calificaciones; y el sistema de calificación de cada examen.
Este vídeo nos presenta información sobre la presencia de judíos en la Península Ibérica, quienes llegaron en siglos pasados y se ubicaron en diferentes partes de la actual España y Portugal. De estos proceden muchas familias que legaron sus nombres y apellidos. Unos 2000 años atrás, judíos presos, esclavos de los romanos, llegaron a Sefarad (España).
Posiblemente, entraron por el Cabo Gallego de Finisterre, que en latín significa «Fin de la Tierra». En Galicia, se asentaron judíos sefarditas; otros se instalaron en otros países. Según explican algunos teóricos, varios de los judíos fueron llevados a Babilonia, Mesopotamia, otros fueron traídos a España. Estos, parece ser, recibieron el nombre de «Sefarad», que se dice significa «lejísimo».
Este trabajo trata de explicar el origen de muchos de los apellidos judíos que existen en España y que perduran hasta la actualidad.
Muchas veces surgen dudas sobre el uso de ciertos símbolos matemáticos. Uno de ellos es el “%” (tanto por ciento). Cuando leemos algunos textos (periódicos, revistas), nos encontramos con expresiones como: “La tasa general del impuesto a los productos industrializados aumentó un 3% este año”; “Algunos comercios están ofreciendo descuentos de 20% a 50% este fin de temporada” (el valor numérico aparece unido al símbolo de porcentaje).
La Ortografía de las Academias de las Lenguas y el Sistema Internacional de Magnitudes de la ISO, indican que “cuando se escribe una cifra seguida de un símbolo, como el del porcentaje (%), ha de dejarse un espacio de separación entre ambos”. Además, “se recuerda que esta norma se aplica a otros símbolos, como los de las unidades monetarias (por ejemplo, el dólar, $, o el euro, €) o los de las unidades físicas y matemáticas (como el grado Celsius, ºC, pero exceptuando los del ángulo, como º)”.
¿Cómo quedarían los ejemplos anteriores? Quedarían de la siguiente forma: “La tasa general del impuesto a los productos industrializados aumentó un 3 % este año” (con el 3 separado del %). También, “Algunos comercios están ofreciendo descuentos de 20 % a 50 % este fin de temporada” (donde 20 y 50 están separados del símbolo de %, respectivamente).
Por consiguiente, aunque la costumbre es fuerte y se impone en muchos casos, la regla es esa y si queremos escribir correctamente, tenemos que respetarla y aplicarla.