Criptografia Numaboa
Frequência de ocorrência de letras no Espanhol
Seg 26 Jan 2009 21:15 |
- Detalhes
- Categoria: Criptoanálise
- Atualização: Segunda, 26 Janeiro 2009 21:43
- Autor: vovó Vicki
- Acessos: 6819
A determinação da frequência de letras, digramas e trigramas de um determinado idioma é essencial para a análise de textos cifrados. Este processo é conhecido desde a Antiguidade e deve-se, ao que tudo indica, a al-Kindi. Neste artigo você encontra os dados relativos ao Espanhol.
Frequência das Letras
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Análise
- O comprimento médio das palavras no Espanhol é de 4.96 letras.
- Quando as letras são ordenadas pela frequência, formam grupos bem definidos:
- E, A
- O, S
- R, N, I, D
- L, C, T, U
- M, P
- B, G, Y, V, Q, H, F, Z, J, X
- K, W
- Se o artigo "el" é omitido, L cai para o 5o. grupo e A se torna a letra mais frequente.
- Em Espanhol, textos com menos de 500 palavras são inadequados para a determinação de frequências. Mesmo em amostras com este comprimento, a letra A pode mostrar uma frequência maior que E e C, D e P (as quais exibem as variações mais acentuadas das frequências da tabela acima) geralmente aparecem logo após a frequência de E.
- Peculiaridades mais importantes em relação ao Inglês:
- Frequência alta de Q.
- Frequência alta de A.
- Frequência baixa de T.
- Peculiaridades mais importantes em relação ao Francês:
- Frequência alta de O.
- Frequência baixa de T.
- Ferquência baixa de U.
Digramas e Trigramas mais frequentes
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
20 Digramas mais frequentes |
20 Trigramas mais frequentes |
Observações e Referências
Todas as tabelas desta página foram construídas contando-se as frequências num texto espanhol de 100.000 letras composto por textos sobre o princípio da essência (29.198), sobre a Argentina (14.748), sobre Che Guevara (35.084) e sobre a teoria da relatividade (20.970). Estes textos forma obtidos através da European Literature - Electronic Texts.
Fui buscar referências no site de Didier Müller - Cours de Cryptologie, onde você encontra outras análises de frequência (francês, alemão, inglês e russo).
Informações adicionais foram obtidas da Santa Cruz Public Libraries, na página Frequency of Occurrence of Letters in Spanish, informando que as tabelas e o texto são de Fletcher Pratt, Secret and Urgent: the Story of Codes and Ciphers Blue Ribbon Books, 1939, pp. 254-255.