Le code doit prendre en entrée un texte (non obligatoire peut être n'importe quoi fichier, stdin, chaîne pour JavaScript, etc.):
This is a text and a number: 31.
La sortie doit contenir les mots avec leur nombre d'occurrences, triés par le nombre d'occurrences dans l'ordre décroissant:
a:2
and:1
is:1
number:1
This:1
text:1
31:1
Notez que 31 est un mot, donc un mot est quelque chose d'alpha-numérique, le nombre n'agit pas comme des séparateurs donc par exemple se 0xAF
qualifie comme un mot. Les séparateurs seront tout ce qui n'est pas alphanumérique, y compris .
(point) et -
(trait d'union), i.e.
ou pick-me-up
donnerait respectivement 2 ou 3 mots. Devrait être sensible à la casse, This
et this
serait deux mots différents, '
serait également séparateur ainsi wouldn
et t
sera 2 mots différents dewouldn't
.
Écrivez le code le plus court dans la langue de votre choix.
Réponse correcte la plus courte à ce jour:
wouldn't
2 mots ( wouldn
et t
)?
This
et this
serait en effet deux mots différents, identiques wouldn
et t
.
i.e.
est un mot mais si nous laissons le point tous les points à la fin des phrases seront prises, même avec des guillemets ou des guillemets simples, etc.
This
le même quethis
ettHIs
)?