A Aldeia Numaboa ancestral ainda está disponível para visitação. É a versão mais antiga da Aldeia que eu não quis simplesmente descartar depois de mais de 10 milhões de pageviews. Como diz a Sirley, nossa cozinheira e filósofa de plantão: "Misericórdia, ai que dó!"

Se você tiver curiosidade, o endereço é numaboa.net.br.

Leia mais...

Criptografia Numaboa

Frequência de ocorrência de letras no Espanhol

Seg

26

Jan

2009


21:15

(5 votos, média 3.40 de 5) 


A determinação da frequência de letras, digramas e trigramas de um determinado idioma é essencial para a análise de textos cifrados. Este processo é conhecido desde a Antiguidade e deve-se, ao que tudo indica, a al-Kindi. Neste artigo você encontra os dados relativos ao Espanhol.

Frequência das Letras

Alfabética
Histograma por
Ordem Alfabética
Letra Freq.% Letra Freq.%
A 12.30 N 7.41
B 1.03 O 8.68
C 4.49 P 2.63
D 5.04 Q 1.02
E 13.69 R 6.44
F 0.77 S 6.97
G 1.04 T 4.82
H 0.65 U 3.99
I 7.78 V 1.04
J 0.28 W 0.02
K 0.02 X 0.16
L 5.84 Y 0.66
M 2.84 Z 0.34
Frequência
Histograma por
Ordem de Frequência
Análise
  • O comprimento médio das palavras no Espanhol é de 4.96 letras.
  • Quando as letras são ordenadas pela frequência, formam grupos bem definidos:
    1. E, A
    2. O, S
    3. R, N, I, D
    4. L, C, T, U
    5. M, P
    6. B, G, Y, V, Q, H, F, Z, J, X
    7. K, W
  • Se o artigo "el" é omitido, L cai para o 5o. grupo e A se torna a letra mais frequente.
  • Em Espanhol, textos com menos de 500 palavras são inadequados para a determinação de frequências. Mesmo em amostras com este comprimento, a letra A pode mostrar uma frequência maior que E e C, D e P (as quais exibem as variações mais acentuadas das frequências da tabela acima) geralmente aparecem logo após a frequência de E.
  • Peculiaridades mais importantes em relação ao Inglês:
    1. Frequência alta de Q.
    2. Frequência alta de A.
    3. Frequência baixa de T.
  • Peculiaridades mais importantes em relação ao Francês:
    1. Frequência alta de O.
    2. Frequência baixa de T.
    3. Ferquência baixa de U.

Digramas e Trigramas mais frequentes

EN 2731
DE 2285
ES 2232
EL 1876
LA 1866
AL 1698
NT 1649
RE 1536
ER 1526
ON 1523
OS 1523
AD 1435
AR 1426
UE 1352
RA 1325
CI 1323
AS 1315
TE 1261
SE 1174
CO 1147
ENT 959
QUE 902
NTE 768
DEL 695
ELA 588
ION 556
DAD 553
CIO 517
CON 515
EST 513
ADE 512
ALI 502
IDA 481
NCI 434
EAL 418
ODE 403
ACI 394
CIA 393
ESE 389
IEN 386

20 Digramas mais frequentes

20 Trigramas mais frequentes

Observações e Referências

Todas as tabelas desta página foram construídas contando-se as frequências num texto espanhol de 100.000 letras composto por textos sobre o princípio da essência (29.198), sobre a Argentina (14.748), sobre Che Guevara (35.084) e sobre a teoria da relatividade (20.970). Estes textos forma obtidos através da European Literature - Electronic Texts.

Fui buscar referências no site de Didier Müller - Cours de Cryptologie, onde você encontra outras análises de frequência (francês, alemão, inglês e russo).

Informações adicionais foram obtidas da Santa Cruz Public Libraries, na página Frequency of Occurrence of Letters in Spanish, informando que as tabelas e o texto são de Fletcher Pratt, Secret and Urgent: the Story of Codes and Ciphers Blue Ribbon Books, 1939, pp. 254-255.

Вадим Логофет семьяэлектрогриль отзывыотзыв nikas лучший блендер биол интернет магазинлобановский александр

Informações adicionais