Patcher le paragraphe


Dans l'esprit de Patch the Image , voici un défi similaire mais avec du texte.


La pourriture des bits a affligé votre précieux texte! Étant donné un paragraphe composé de caractères ASCII, avec un trou rectangulaire quelque part, votre programme doit essayer de remplir le trou avec le texte approprié, afin que le paragraphe se mélange le mieux possible.

D'autres définitions

  • Le trou sera toujours rectangulaire et peut s'étendre sur plusieurs lignes.
  • Il n'y aura qu'un seul trou.
  • Notez que le trou ne tombe pas nécessairement sur les limites des mots (en fait, ce n'est généralement pas le cas).
  • Le trou représentera au plus 25% du paragraphe d'entrée, mais peut se chevaucher ou s'étendre au-delà de la "fin" du texte "normal" (voir les exemples Euclid ou Badger ci-dessous).
  • Étant donné que la recherche du trou n'est pas le point principal de ce défi, il sera composé uniquement de marques de hachage #pour permettre une identification facile.
  • Aucun autre emplacement dans le paragraphe d'entrée n'aura de marque de hachage.
  • Votre code ne peut pas utiliser le texte "normal" dans les exemples ci-dessous - il ne recevra et ne traitera que le texte avec le trou qu'il contient.
  • L'entrée peut être une seule chaîne multi-lignes, un tableau de chaînes (un élément par ligne), un fichier, etc. - votre choix de ce qui convient le mieux à votre langue.
  • Si vous le souhaitez, une entrée supplémentaire facultative détaillant les coordonnées du trou peut être prise (par exemple, un tuple de coordonnées ou similaire).
  • Veuillez décrire votre algorithme dans votre soumission.


Les électeurs sont invités à juger les entrées en fonction de la façon dont l'algorithme remplit le trou de texte. Voici quelques suggestions:

  • La zone remplie correspond-elle à la distribution approximative des espaces et de la ponctuation comme le reste du paragraphe?
  • La zone remplie présente-t-elle une syntaxe erronée? (par exemple, deux espaces consécutifs, une période suivie d'un point d'interrogation, une séquence erronée comme , ,, etc.)
  • Si vous plissez les yeux (pour ne pas lire le texte), pouvez-vous voir où était le trou?
  • S'il n'y a pas de mots CamelCase en dehors du trou, le trou en contient-il? S'il n'y a pas de lettres majuscules à l'extérieur du trou, le trou en contient-il? S'il y a beaucoup de lettres majuscules à l'extérieur du trou, le trou contient-il un montant proportionnel?

Critère de validité

Pour qu'une soumission soit considérée comme valide, elle ne doit modifier aucun texte du paragraphe à l'extérieur du trou (y compris les espaces de fin). Une seule nouvelle ligne à la fin est facultative.

Cas de test

Le format est le paragraphe d'origine dans un bloc de code, suivi du même paragraphe avec un trou. Les paragraphes avec le trou seront utilisés pour la saisie.

1 (Patch l'image)

In a popular image editing software there is a feature, that patches (The term
used in image processing is inpainting as @minxomat pointed out.) a selected
area of an image, based on the information outside of that patch. And it does a
quite good job, considering it is just a program. As a human, you can sometimes
see that something is wrong, but if you squeeze your eyes or just take a short
glance, the patch seems to fill in the gap quite well.

In a popular image editing software there is a feature, that patches (The term
used in image processing is inpainting as @minxomat pointed out.) a selected
area of an image, #############information outside of that patch. And it does a
quite good job, co#############is just a program. As a human, you can sometimes
see that something#############t if you squeeze your eyes or just take a short
glance, the patch seems to fill in the gap quite well.

2 (adresse de Gettysburg)

But, in a larger sense, we can not dedicate, we can not consecrate, we can not
hallow this ground. The brave men, living and dead, who struggled here, have
consecrated it, far above our poor power to add or detract. The world will
little note, nor long remember what we say here, but it can never forget what
they did here. It is for us the living, rather, to be dedicated here to the
unfinished work which they who fought here have thus far so nobly advanced. It
is rather for us to be here dedicated to the great task remaining before us-
that from these honored dead we take increased devotion to that cause for which
they gave the last full measure of devotion-that we here highly resolve that
these dead shall not have died in vain-that this nation, under God, shall have
a new birth of freedom-and that government of the people, by the people, for
the people, shall not perish from the earth.

But, in a larger sense, we can not dedicate, we can not consecrate, we can not
hallow this ground. The brave men, living and dead, who struggled here, have
consecrated it, far above our poor power to add or detract. The world will
little note, nor long remember what we say here, but it can never forget what
they did here. It is for us the living, rather, to be dedicated here to the
unfinished work which they who fought here h######################advanced. It
is rather for us to be here dedicated to the######################before us-
that from these honored dead we take increas######################use for which
they gave the last full measure of devotion-######################solve that
these dead shall not have died in vain-that ######################, shall have
a new birth of freedom-and that government of the people, by the people, for
the people, shall not perish from the earth.

3 (Lorem Ipsum)

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim
ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut
aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit
in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur
sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt
mollit anim id est laborum.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim
ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut
aliquip ex ea commodo conse################irure dolor in reprehenderit
in voluptate velit esse cil################giat nulla pariatur. Excepteur
sint occaecat cupidatat non################in culpa qui officia deserunt
mollit anim id est laborum.

4 (Jabberwocky)

'Twas brillig, and the slithy toves
Did gyre and gimble in the wabe;
All mimsy were the borogoves,
And the mome raths outgrabe.

'Twas brillig, and the slithy toves
Did gyre a######### in the wabe;
All mimsy #########borogoves,
And the mome raths outgrabe.

5 (Preuve d'Euclide du théorème de Pythagore)

1.Let ACB be a right-angled triangle with right angle CAB.
2.On each of the sides BC, AB, and CA, squares are drawn,
CBDE, BAGF, and ACIH, in that order. The construction of
squares requires the immediately preceding theorems in Euclid,
and depends upon the parallel postulate. [footnote 14]
3.From A, draw a line parallel to BD and CE. It will
perpendicularly intersect BC and DE at K and L, respectively.
4.Join CF and AD, to form the triangles BCF and BDA.
5.Angles CAB and BAG are both right angles; therefore C, A,
and G are collinear. Similarly for B, A, and H.
6.Angles CBD and FBA are both right angles; therefore angle ABD
equals angle FBC, since both are the sum of a right angle and angle ABC.
7.Since AB is equal to FB and BD is equal to BC, triangle ABD
must be congruent to triangle FBC.
8.Since A-K-L is a straight line, parallel to BD, then rectangle
BDLK has twice the area of triangle ABD because they share the base
BD and have the same altitude BK, i.e., a line normal to their common
base, connecting the parallel lines BD and AL. (lemma 2)
9.Since C is collinear with A and G, square BAGF must be twice in area
to triangle FBC.
10.Therefore, rectangle BDLK must have the same area as square BAGF = AB^2.
11.Similarly, it can be shown that rectangle CKLE must have the same
area as square ACIH = AC^2.
12.Adding these two results, AB^2 + AC^2 = BD × BK + KL × KC
13.Since BD = KL, BD × BK + KL × KC = BD(BK + KC) = BD × BC
14.Therefore, AB^2 + AC^2 = BC^2, since CBDE is a square.

1.Let ACB be a right-angled triangle with right angle CAB.
2.On each of the sides BC, AB, and CA, squares are drawn,
CBDE, BAGF, and ACIH, in that order. The construction of
squares requires the immediately preceding theorems in Euclid,
and depends upon the parallel postulate. [footnote 14]
3.From A, draw a line parallel to BD and CE. It will
perpendicularly intersect BC and DE at K and L, respectively.
4.Join CF and AD, to form the triangles BCF and BDA.
5.Angles CAB and BAG are both right angles; therefore C, A,
and G are #############milarly for B, A, and H.
6.Angles C#############e both right angles; therefore angle ABD
equals ang############# both are the sum of a right angle and angle ABC.
7.Since AB#############FB and BD is equal to BC, triangle ABD
must be co#############iangle FBC.
8.Since A-#############ight line, parallel to BD, then rectangle
BDLK has t############# of triangle ABD because they share the base
BD and hav#############titude BK, i.e., a line normal to their common
base, conn#############rallel lines BD and AL. (lemma 2)
9.Since C #############with A and G, square BAGF must be twice in area
to triangl#############
10.Therefo############# BDLK must have the same area as square BAGF = AB^2.
11.Similar############# shown that rectangle CKLE must have the same
area as square ACIH = AC^2.
12.Adding these two results, AB^2 + AC^2 = BD × BK + KL × KC
13.Since BD = KL, BD × BK + KL × KC = BD(BK + KC) = BD × BC
14.Therefore, AB^2 + AC^2 = BC^2, since CBDE is a square.

6 (Badger, Badger, Badger par weebl)

Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mushroom, mushroom, a-
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mushroom, mushroom, a-
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mush-mushroom, a
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Argh! Snake, a snake!
Snaaake! A snaaaake, oooh its a snake!

Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mushroom, mushroom, a-
Badger##################badger, badger,
badger##################badger, badger
Badger##################badger, badger,
badger##################badger, badger
Mush-mushroom, a
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Argh! Snake, a snake!
Snaaake! A snaaaake, oooh its a snake!

puis-je supposer que le trou a au moins trois caractères de large
Rohan Jhunjhunwala

@RohanJhunjhunwala Bien sûr. Compte tenu de la taille du texte, c'est une hypothèse assez sûre.

L'exemple de Gettysburg contient apparemment des tirets em, qui ne sont pas de simples ascii. Je souligne cela, car vous avez dit dans vos commentaires dans l'une des réponses que vous utiliseriez des cas de test ascii simples.

@ SuperJedi224 Merci - corrigé.



Python 2

Je sais que @atlasologist a déjà posté une solution en Python 2, mais la façon dont mes travaux sont un peu différents. Cela fonctionne en parcourant tous les trous, de haut en bas, de gauche à droite, en regardant 5 caractères en arrière et au personnage ci-dessus, et en trouvant un personnage où cela correspond. Si plusieurs caractères sont trouvés, il choisit le plus commun. Si aucun caractère n'est trouvé, il supprime la restriction ci-dessus. S'il n'y a toujours pas de caractères trouvés, il diminue la quantité de caractères qu'il regarde en arrière et se répète.

def fix(paragraph, holeChar = "#"):
    lines = paragraph.split("\n")
    maxLineWidth = max(map(len, lines))
    lines = [list(line + " " * (maxLineWidth - len(line))) for line in lines]
    holes = filter(lambda pos: lines[pos[0]][pos[1]] == holeChar, [[y, x] for x in range(maxLineWidth) for y in range(len(lines))])

    n = 0
    for hole in holes:
        for i in range(min(hole[1], 5), 0, -1):
            currCh = lines[hole[0]][hole[1]]
            over = lines[hole[0] - 1][hole[1]]
            left = lines[hole[0]][hole[1] - i : hole[1]]

            same = []
            almost = []
            for y, line in enumerate(lines):
                for x, ch in enumerate(line):
                    if ch == holeChar:
                    if ch == left[-1] == " ":
                    chOver = lines[y - 1][x]
                    chLeft = lines[y][x - i : x]
                    if chOver == over and chLeft == left:
                    if chLeft == left:
            sortFunc = lambda x, lst: lst.count(x) / (paragraph.count(x) + 10) + lst.count(x)
            if same:
                newCh = sorted(same, key=lambda x: sortFunc(x, same))[-1]
            elif almost:
                newCh = sorted(almost, key=lambda x: sortFunc(x, almost))[-1]
            lines[hole[0]][hole[1]] = newCh

    return "\n".join(map("".join, lines))

Voici le résultat de Badger, Badger, Badger:

Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger 
Mushroom, mushroom, a-                 
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger 
Mushroom, mushroom, a- b               
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger 
Mush-mushroom, a                       
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger 
Argh! Snake, a snake!                  
Snaaake! A snaaaake, oooh its a snake! 

Voici le résultat de la preuve:

1.Let ACB be a right-angled triangle with right angle CAB.                 
2.On each of the sides BC, AB, and CA, squares are drawn,                  
CBDE, BAGF, and ACIH, in that order. The construction of                   
squares requires the immediately preceding theorems in Euclid,             
and depends upon the parallel postulate. [footnote 14]                     
3.From A, draw a line parallel to BD and CE. It will                       
perpendicularly intersect BC and DE at K and L, respectively.              
4.Join CF and AD, to form the triangles BCF and BDA.                       
5.Angles CAB and BAG are both right angles; therefore C, A,                
and G are the same areamilarly for B, A, and H.                            
6.Angles CAB and CA, sqe both right angles; therefore angle ABD            
equals angle ABD becaus both are the sum of a right angle and angle ABC.   
7.Since ABD because theFB and BD is equal to BC, triangle ABD              
must be construction ofiangle FBC.                                         
8.Since A-angle ABD becight line, parallel to BD, then rectangle           
BDLK has the same area  of triangle ABD because they share the base        
BD and have the base thtitude BK, i.e., a line normal to their common      
base, conngle and G, sqrallel lines BD and AL. (lemma 2)                   
9.Since C = BD × BK + with A and G, square BAGF must be twice in area     
to triangle FBC. (lemma                                                    
10.Therefore angle and  BDLK must have the same area as square BAGF = AB^2.
11.Similarly for B, A,  shown that rectangle CKLE must have the same       
area as square ACIH = AC^2.                                                
12.Adding these two results, AB^2 + AC^2 = BD × BK + KL × KC             
13.Since BD = KL, BD × BK + KL × KC = BD(BK + KC) = BD × BC             
14.Therefore, AB^2 + AC^2 = BC^2, since CBDE is a square.

Et le résultat de Jabberwocky:

'Twas brillig, and the slithy toves
Did gyre and the mo in the wabe;   
All mimsy toves, anborogoves,      
And the mome raths outgrabe.       

Ce blaireau est assez impressionnant, et Jabberwocky semble que ce pourrait être le poème légitime. Bon travail.


Python 2

Il s'agit d'une solution assez simple. Il crée un exemple de chaîne composée de mots compris entre la longueur moyenne des mots A- ( A/ 2) et A+ ( A/ 2), puis il applique des morceaux découpés dans les espaces de début et de fin de l'échantillon à la zone de patch. Il ne gère pas la capitalisation, et je suis sûr qu'il y a un cas de test de courbe qui le casserait, mais cela fonctionne bien dans les exemples. Voir le lien ci-dessous pour exécuter tous les tests.

J'ai également mis un correctif dans le code pour faire bonne mesure.

def patch(paragraph):
    sample = [x.split() for x in paragraph if x.count('#') < 1]
    length = max([x.count('#') for x in paragraph if x.find('#')])
    s = sum(####################
    ])      ####################
    len(w)  ####################
    for w in####################
    avg_range = range(avg-(avg//2),avg+(avg//2))
    sample = filter(lambda x:len(x) in avg_range, s)
    for line in paragraph:
        if line.find('#'):height+=1
        print line.replace('#'*length,' '.join(sample)[(height-1)*length:height*length].strip())
    print '\n'

Lorem Ipsum, original puis patché:

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim
ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut
aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit
in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur
sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt
mollit anim id est laborum.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim
ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut
aliquip ex ea commodo conseore dolore magnairure dolor in reprehenderit
in voluptate velit esse cilenim minim quisgiat nulla pariatur. Excepteur
sint occaecat cupidatat nonnisi mollit aniin culpa qui officia deserunt
mollit anim id est laborum.


Hehe mushroger...

Eh bien, cela ne corrige pas votre code de manière intéressante.

@ mbomb007 c'est à cause des autres #caractères du code.

@ atlasologist Même si vous les changez en quelque chose d'autre @, rien d'intéressant.


Java Shakespeare

Qui a besoin de comprendre les conventions anglaises standard? Faites le vôtre! Tout comme le barde a été autorisé à inventer ses propres mots. Ce bot ne s'inquiète pas trop de la correction des mots coupés, il insère vraiment juste des mots aléatoires. Le résultat est une belle poésie. En bonus, la barde est d'un calibre supérieur et peut gérer plusieurs trous à condition qu'ils soient de la même taille!

Exemple d'entrée

 Des créatures les plus belles que nous souhaitons augmenter,
  Pour que la rose de la beauté ne meure jamais,
  Mais comme le riper devrait décéder avec le temps,
  Son offre ############ porte sa mémoire:
  Mais tu c ############ tes propres yeux brillants,
  Nourrir le ############ ame avec du carburant auto-substantiel,
  Faire une famine où l'abondance se trouve,
  Ton auto ton ennemi, à ton doux moi trop cruel:
  Toi qui es maintenant l'ornement frais du monde,
  Et n'annonce que le printemps criard,
  Dans ton propre bourgeon enfouit ton contenu,
  Et le churl mak'st tendre était ############ ding:
    Pitié du monde, sinon t ############ be,
    Pour manger le monde dû, b ############ et toi.

  Quand quarante hivers assiégeront ton front,
  Et creuse des tranchées profondes dans le champ de ta beauté,
  La livrée fière de ta jeunesse tant regardée maintenant,
  Sera une mauvaise herbe en lambeaux de petite valeur détenue:  
  Puis étant demandé, où se trouve toute ta beauté,
  Où tout le trésor de tes jours vigoureux;
  Pour dire dans tes propres yeux profonds,
  Étaient une honte dévorante et des éloges sans faille.
  Combien d'éloges méritaient l'usage de ta beauté,
  Si tu pouvais répondre: `` Mon bel enfant
  Doit résumer mon compte et faire mon ancienne excuse »
  Prouvant sa beauté par succession à toi.
    Cela devait être nouveau quand tu es vieux,
    Et vois ton sang se réchauffer quand tu le sens froid.

  Regarde dans ton verre et dis au visage que tu regardes,
  Il est maintenant temps que ce visage en forme un autre,
  Dont une nouvelle réparation si maintenant tu ne renouvelles pas,
  Tu trompes le monde, sans bénir une mère.
  Car où est-elle si belle, dont le ventre non mérité
  Dédaigne le labour de ton élevage?
  Ou qui aime-t-il sera le tombeau,
  De son amour-propre pour arrêter la postérité?  
  Tu es le verre de ta mère et elle en toi
  Rappelle le joli mois d'avril de sa perfection,
  Ainsi, à travers les fenêtres de ton âge, tu verras,
  Malgré ############ s ton temps d'or.
    Mais si le ############ mbered ne pas l'être,
    Die singl ############ image meurt avec toi.

Belle sortie

 Des créatures les plus belles que nous souhaitons augmenter,
  Pour que la rose de la beauté ne meure jamais,
  Mais comme le riper devrait décéder avec le temps,
  Sa tendresse devrait porter sa mémoire:
  Mais tu as tous absorbé tes propres yeux brillants,
  Feed'st e Proving Or ame avec du carburant auto-substantiel,
  Faire une famine où l'abondance se trouve,
  Ton auto ton ennemi, à ton doux moi trop cruel:
  Toi qui es maintenant l'ornement frais du monde,
  Et n'annonce que le printemps criard,
  Dans ton propre bourgeon enfouit ton contenu,
  Et tendre churl mak'st était-il toi mon ding:
    Pitié du monde, sinon t Alors l'être,
    Pour manger ce qui est dû au monde, à toi et à toi.

  Quand quarante hivers assiégeront ton front,
  Et creuse des tranchées profondes dans le champ de ta beauté,
  La livrée fière de ta jeunesse tant regardée maintenant,
  Sera une mauvaise herbe en lambeaux de petite valeur détenue:  
  Puis étant demandé, où se trouve toute ta beauté,
  Où tout le trésor de tes jours vigoureux;
  Pour dire dans tes propres yeux profonds,
  Étaient une honte dévorante et des éloges sans faille.
  Combien d'éloges méritaient l'usage de ta beauté,
  Si tu pouvais répondre: `` Mon bel enfant
  Doit résumer mon compte et faire mon ancienne excuse »
  Prouvant sa beauté par succession à toi.
    Cela devait être nouveau quand tu es vieux,
    Et vois ton sang se réchauffer quand tu le sens froid.

  Regarde dans ton verre et dis au visage que tu regardes,
  Il est maintenant temps que ce visage en forme un autre,
  Dont une nouvelle réparation si maintenant tu ne renouvelles pas,
  Tu trompes le monde, sans bénir une mère.
  Car où est-elle si belle, dont le ventre non mérité
  Dédaigne le labour de ton élevage?
  Ou qui aime-t-il sera le tombeau,
  De son amour-propre pour arrêter la postérité?  
  Tu es le verre de ta mère et elle en toi
  Rappelle le joli mois d'avril de sa perfection,
  Ainsi, à travers les fenêtres de ton âge, tu verras,
  Malgré Look regarda ton temps d'or.
    Mais si th Quand être, mbered pour ne pas être,
    Die singl repair the image meurt avec toi.

Les deux dernières lignes sont profondément poétiques si je le dis moi-même. Il fonctionne aussi étonnamment bien sur l'adresse de Gettysburg.

But, in a larger sense, we can not dedicate, we can not consecrate, we can not
hallow this ground. The brave men, living and dead, who struggled here, have
consecrated it, far above our poor power to add or detract. The world will
little note, nor long remember what we say here, but it can never forget what
they did here. It is for us the living, rather, to be dedicated here to the
unfinished work which they who fought here h to of rather us of advanced. It
is rather for us to be here dedicated to the who be it, vain who before us 
that from these honored dead we take increas be dead the the what use for which
they gave the last full measure of devotion  dead government The solve that
these dead shall not have died in vain that  the take nor world , shall have
a new birth of freedom and that government of the people, by the people, for
the people, shall not perish from the earth.

Voyons ce qui fait vibrer Shakespeare. Voici le code. Essentiellement, il s'efforce de construire une base de vocabulaire à partir de l'entrée. Il utilise ensuite ces mots et les place au hasard dans le trou (en s'assurant qu'ils correspondent bien). Il est déterministe car il utilise une graine fixe pour le hasard.

package stuff;

import java.util.ArrayList;
import java.util.Arrays;
import java.util.Iterator;
import java.util.Random;
import java.util.Scanner;
import java.util.Stack;

 * @author rohan
public class PatchTheParagraph {

     * @param args the command line arguments
    public static void main(String[] args) {
Scanner in = new Scanner(;
System.out.println("File Name :");
        String[] text = getWordsFromFile(in.nextLine());
        for(String s:text){
                    int lengthOfHole= 0;
        int rows = 0;
            for(String s: text){
                s = s.replaceAll("[^#]", "");

//      System.out.println(s);
                    lengthOfHole = s.length();
            ArrayList<String> words = new ArrayList<>();
            for(String s:text){
                String[] w = s.replaceAll("#", " ").split(" ");
for(String a :w){

                        Iterator<String> j = words.iterator();
                String o;
                if((o ="")){
            Stack<String> out = new Stack<>();
            String hashRow = "";
            for(int i = 0;i<lengthOfHole;i++){

        for(int i = 0;i<rows;i++){
            int length = lengthOfHole-1; 
            String outPut = " ";
String wordAttempt = words.get(getRandom(words.size()-1));
 wordAttempt = words.get(getRandom(words.size()-1));
length -= wordAttempt.length()+1;
                outPut+=" ";
        for(String s : text){
public static final Random r = new Random(42);
    public static int getRandom(int max){
    return (int) (max*r.nextDouble());
     * @param fileName is the path to the file or just the name if it is local
     * @return the number of lines in fileName
    public static int getLengthOfFile(String fileName) {
        int length = 0;
        try {
            File textFile = new File(fileName);
            Scanner sc = new Scanner(textFile);
            while (sc.hasNextLine()) {
        } catch (Exception e) {
        return length;

     * @param fileName is the path to the file or just the name if it is local
     * @return an array of Strings where each string is one line from the file
     * fileName.
    public static String[] getWordsFromFile(String fileName) {
        int lengthOfFile = getLengthOfFile(fileName);
        String[] wordBank = new String[lengthOfFile];
        int i = 0;
        try {
            File textFile = new File(fileName);
            Scanner sc = new Scanner(textFile);
            for (i = 0; i < lengthOfFile; i++) {
                wordBank[i] = sc.nextLine();
            return wordBank;
        } catch (Exception e) {
        return null;

La plupart de la poésie de Shakespeare est du domaine public.

Les commentaires ne sont pas pour une discussion prolongée; cette conversation a été déplacée pour discuter .


Python 2.7

Une autre solution Python avec une approche différente. Mon programme voit le texte comme une chaîne de Markov , où chaque lettre est suivie d'une autre lettre avec une certaine probabilité. La première étape consiste donc à construire la table des probabilités. L'étape suivante consiste à appliquer ces probabilités au patch.

Le code complet, y compris un exemple de texte, est ci-dessous. Étant donné qu'un exemple utilise des caractères unicode, j'ai inclus une page de code explicite (utf-8) pour la compatibilité avec cet exemple.

#!/usr/bin/env python
# -*- coding: utf-8 -*-

from collections import defaultdict
import numpy

texts = [
"""'Twas brillig, and the slithy toves
Did gyre a######### in the wabe;
All mimsy #########borogoves,
And the mome raths outgrabe."""

class Patcher:
    def __init__(self):
        self.mapper = defaultdict(lambda: defaultdict(int))

    def add_mapping(self, from_value, to_value):
        self.mapper[from_value][to_value] += 1

    def get_patch(self, from_value):
        if from_value in self.mapper:
            sum_freq = sum(self.mapper[from_value].values())
            return numpy.random.choice(
                p = numpy.array(
                    self.mapper[from_value].values(),dtype=numpy.float64) / sum_freq)
            return None

def add_text_mappings(text_string, patcher = Patcher(), ignore_characters = ''):
    previous_letter = text_string[0]
    for letter in text_string[1:]:
        if not letter in ignore_characters:
            patcher.add_mapping(previous_letter, letter)
            previous_letter = letter
    patcher.add_mapping(text_string[-1], '\n')

def patch_text(text_string, patcher, patch_characters = '#'):
    result = previous_letter = text_string[0]
    for letter in text_string[1:]:
        if letter in patch_characters:
            result += patcher.get_patch(previous_letter)
            result += letter
        previous_letter = result[-1]
    return result

def main():
    for text in texts:
        patcher = Patcher()
        add_text_mappings(text, patcher, '#')
        print patch_text(text, patcher, '#')
        print "\n"

if __name__ == '__main__':

Exemple de sortie pour le Lorem Ipsum:

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim
ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut
aliquip ex ea commodo conse Exe eut ccadamairure dolor in reprehenderit
in voluptate velit esse cilore indipserexepgiat nulla pariatur. Excepteur
sint occaecat cupidatat non upir alostat adin culpa qui officia deserunt
mollit anim id est laborum.

Une ligne extra poétique dans le Jabberwocky:

'Twas brillig, and the slithy toves
Did gyre and me the in the wabe;
All mimsy was
An inborogoves,
And the mome raths outgrabe.

Quel exemple de texte contient Unicode? Ils doivent tous être ASCII droits. Veuillez me le faire savoir et je le corrigerai.

Python se plaint du mınxomaτ dans le premier texte, se référant au PEP 263 .

Ah - je ne m'en suis même pas rendu compte. Je l'ai édité pour qu'il soit directement ASCII. Merci de me le faire savoir!


C # 5 massif comme jamais

J'ai jeté cela ensemble, c'est un peu le bordel, mais cela produit parfois des résultats OK. C'est un algorithme principalement déterministe, mais avec un peu d'aléatoire (fixe) pour éviter qu'il ne produise la même chaîne pour des lacunes similaires. Il faut faire des efforts pour éviter d'avoir simplement des colonnes d'espaces de chaque côté des espaces.

Il fonctionne en symbolisant l'entrée en mots et en ponctuation (la ponctuation provient d'une liste saisie manuellement, car je ne peux pas être dérangé de savoir si Unicode peut le faire pour moi), afin qu'il puisse mettre des espaces avant les mots, et pas avant ponctuation, car c'est assez typique. Il se divise en espaces blancs typiques. Dans la veine des chaînes de Markov (je pense), il compte la fréquence à laquelle chaque jeton se suit, puis ne calcule pas les probabilités pour cela (je pense que parce que les documents sont si petits, nous ferions mieux de privilégier les choses nous voyons beaucoup où nous pouvons). Ensuite, nous effectuons une recherche en largeur, en remplissant l'espace laissé par les hachages et les mots «partiels» de chaque côté, le coût étant calculé comme -fabness(last, cur) * len(cur_with_space), où fabnessretourne le nombre de fois cursuivilastpour chaque jeton ajouté dans la chaîne générée. Naturellement, nous essayons de minimiser le coût. Parce que nous ne pouvons pas toujours combler le vide avec des mots et des signes de ponctuation trouvés dans le document, il prend également en compte un certain nombre de jetons `` spéciaux '' de certains États, y compris les chaînes partielles de chaque côté, contre lesquelles nous privilégions les coûts arbitrairement augmentés.

Si le BFS ne parvient pas à trouver une solution, alors nous essayons naïvement de choisir un adverbe aléatoire, ou simplement d'insérer des espaces pour remplir l'espace.


Les 6 peuvent être trouvés ici:

Le cas-test d'Euclid ne s'est pas très bien passé ...

Patcher l'image

In a popular image editing software there is a feature, that patches (The term
used in image processing is inpainting as @minxomat pointed out.) a selected
area of an image, that patches information outside of that patch. And it does a
quite good job, co the patch a is just a program. As a human, you can sometimes
see that something In a short it if you squeeze your eyes or just take a short
glance, the patch seems to fill in the gap quite well.


'Twas brillig, and the slithy toves
Did gyre and the in in the wabe;
All mimsy the mome borogoves,
And the mome raths outgrabe.


Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mushroom, mushroom, a-
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mushroom, badger, badger
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Mush-mushroom, a
Badger, badger, badger, badger, badger,
badger, badger, badger, badger, badger
Argh! Snake, a snake!
Snaaake! A snaaaake, oooh its a snake!

_Je suis content de la façon dont celui-ci s'est avéré ...


Le courir avec

csc ParaPatch.cs
ParaPatch.exe infile outfile

Il y en a beaucoup. Le seul élément intéressant à distance est la Fillméthode. J'inclus l'implémentation du tas, car .NET n'en a pas (POURQUOI MS POURQUOI?!).

using System;
using System.Collections.Generic;
using System.Linq;

namespace ParaPatch
    class Program
        private static string[] Filler = new string[] { "may", "will", "maybe", "rather", "perhaps", "reliably", "nineword?", "definitely", "elevenword?", "inexplicably" }; // adverbs
        private static char[] Breaking = new char[] { ' ', '\n', '\r', '\t' };
        private static char[] Punctuation = new char[] { ',', '.', '{', '}', '(', ')', '/', '?', ':', ';', '\'', '\\', '"', ',', '!', '-', '+', '[', ']', '£', '$', '%', '^', '—' };

        private static IEnumerable<string> TokenizeStream(System.IO.StreamReader reader)
            System.Text.StringBuilder sb = new System.Text.StringBuilder();

            HashSet<char> breaking = new HashSet<char>(Breaking);
            HashSet<char> punctuation = new HashSet<char>(Punctuation);

            while (!reader.EndOfStream)
                int ci = reader.Read();
                if (ci == -1) // sanity

                char c = (char)ci;

                if (breaking.Contains(c))
                    if (sb.Length > 0)
                        yield return sb.ToString();
                else if (punctuation.Contains(c))
                    if (sb.Length > 0)
                        yield return sb.ToString();
                    yield return ""+c;


            if (sb.Length > 0)
                yield return sb.ToString();

        private enum DocTokenTypes

        private class DocToken
            public DocTokenTypes TokenType { get; private set; }
            public string StringPart { get; private set; }
            public int Length { get; private set; }

            public DocToken(DocTokenTypes tokenType, string stringPart, int length)
                TokenType = tokenType;
                StringPart = stringPart;
                Length = length;

        private static IEnumerable<DocToken> DocumentTokens(IEnumerable<string> tokens)
            foreach (string token in tokens)
                if (token.Contains("#"))
                    int l = token.IndexOf("#");
                    int r = token.LastIndexOf("#");

                    if (l > 0)
                        yield return new DocToken(DocTokenTypes.LeftPartial, token.Substring(0, l), l);

                    yield return new DocToken(DocTokenTypes.Unknown, null, r - l + 1);

                    if (r < token.Length - 1)
                        yield return new DocToken(DocTokenTypes.RightPartial, token.Substring(r + 1), token.Length - r - 1);
                    yield return new DocToken(DocTokenTypes.Known, token, token.Length);

        private class State : IComparable<State>
            // missing readonly params already... maybe C#6 isn't so bad
            public int Remaining { get; private set; }
            public int Position { get; private set; }
            public State Prev { get; private set; }
            public string Token { get; private set; }
            public double H { get; private set; }
            public double Fabness { get; private set; }
            public string FullFilling { get; private set; }

            public State(int remaining, int position, Program.State prev, double fabness, double h, string token, string toAdd)
                Remaining = remaining;
                Position = position;
                Prev = prev;
                H = h;
                Fabness = fabness;
                Token = token;

                FullFilling = prev != null ? prev.FullFilling + toAdd : toAdd;

            public int CompareTo(State other)
                return H.CompareTo(other.H);

        public static void Main(string[] args)
            if (args.Length < 2)
                args = new string[] { "test.txt", "testout.txt" };

            List<DocToken> document;
            using (System.IO.StreamReader reader = new System.IO.StreamReader(args[0], System.Text.Encoding.UTF8))
                document = DocumentTokens(TokenizeStream(reader)).ToList();

            foreach (DocToken cur in document)
                Console.WriteLine(cur.StringPart + " " + cur.TokenType);

            // these are small docs, don't bother with more than 1 ply
            Dictionary<string, Dictionary<string, int>> FollowCounts = new Dictionary<string, Dictionary<string, int>>();
            Dictionary<string, Dictionary<string, int>> PreceedCounts = new Dictionary<string, Dictionary<string, int>>(); // mirror (might be useful)

            HashSet<string> knowns = new HashSet<string>(); // useful to have lying around

            // build counts
            DocToken last = null;
            foreach (DocToken cur in document)
                if (cur.TokenType == DocTokenTypes.Known)

                if (last != null && last.TokenType == DocTokenTypes.Known && cur.TokenType == DocTokenTypes.Known)
                        Dictionary<string, int> ltable;
                        if (!FollowCounts.TryGetValue(last.StringPart, out ltable))
                            FollowCounts.Add(last.StringPart, ltable = new Dictionary<string, int>());

                        int count;
                        if (!ltable.TryGetValue(cur.StringPart, out count))
                            count = 0;
                        ltable[cur.StringPart] = count + 1;

                        Dictionary<string, int> ctable;
                        if (!PreceedCounts.TryGetValue(cur.StringPart, out ctable))
                            PreceedCounts.Add(cur.StringPart, ctable = new Dictionary<string, int>());

                        int count;
                        if (!ctable.TryGetValue(last.StringPart, out count))
                            count = 0;
                        ctable[last.StringPart] = count + 1;

                last = cur;

            // build probability grid (none of this efficient table filling dynamic programming nonsense, A* all the way!)
            // hmm... can't be bothered
            Dictionary<string, Dictionary<string, double>> fabTable = new Dictionary<string, Dictionary<string, double>>();
            foreach (var k in FollowCounts)
                Dictionary<string, double> t = new Dictionary<string, double>();

                // very naive
                foreach (var k2 in k.Value)
                    t.Add(k2.Key, (double)k2.Value);

                fabTable.Add(k.Key, t);

            string[] knarr = knowns.ToArray();
            Random rnd = new Random("ParaPatch".GetHashCode());

            List<string> fillings = new List<string>();
            for (int i = 0; i < document.Count; i++)
                if (document[i].TokenType == DocTokenTypes.Unknown)
                    // shuffle knarr
                    for (int j = 0; j < knarr.Length; j++)
                        string t = knarr[j];
                        int o = rnd.Next(knarr.Length);
                        knarr[j] = knarr[o];
                        knarr[o] = t;

                    fillings.Add(Fill(document, fabTable, knarr, i));

            string filling = string.Join("", fillings);

            int fi = 0;

            using (System.IO.StreamWriter writer = new System.IO.StreamWriter(args[1]))
            using (System.IO.StreamReader reader = new System.IO.StreamReader(args[0]))
                while (!reader.EndOfStream)
                    int ci = reader.Read();
                    if (ci == -1)

                    char c = (char)ci;
                    c = c == '#' ? filling[fi++] : c;


//            using (System.IO.StreamWriter writer = new System.IO.StreamWriter(args[1], false, System.Text.Encoding.UTF8))
//            using (System.IO.StreamReader reader = new System.IO.StreamReader(args[0]))
//            {
//                foreach (char cc in reader.ReadToEnd())
//                {
//                    char c = cc;
//                    c = c == '#' ? filling[fi++] : c;
//                    writer.Write(c);
//                    Console.Write(c);
//                }
//            }

            if (args[0] == "test.txt")

        private static string Fill(List<DocToken> document, Dictionary<string, Dictionary<string, double>> fabTable, string[] knowns, int unknownIndex)
            HashSet<char> breaking = new HashSet<char>(Breaking);
            HashSet<char> punctuation = new HashSet<char>(Punctuation);

            Heap<State> due = new Heap<Program.State>(knowns.Length);

            Func<string, string, double> fabness = (prev, next) =>
                Dictionary<string, double> table;
                if (!fabTable.TryGetValue(prev, out table))
                    return 0; // not fab
                double fab;
                if (!table.TryGetValue(next, out fab))
                    return 0; // not fab
                return fab; // yes fab

            DocToken mostLeft = unknownIndex > 2 ? document[unknownIndex - 2] : null;
            DocToken left = unknownIndex > 1 ? document[unknownIndex - 1] : null;
            DocToken unknown = document[unknownIndex];
            DocToken right = unknownIndex < document.Count - 2 ? document[unknownIndex + 1] : null;
            DocToken mostRight = unknownIndex < document.Count - 3 ? document[unknownIndex + 2] : null;

            // sum of empty space and partials' lengths
            int spaceSize = document[unknownIndex].Length
                + (left != null && left.TokenType == DocTokenTypes.LeftPartial ? left.Length : 0)
                + (right != null && right.TokenType == DocTokenTypes.RightPartial ? right.Length : 0);

            int l = left != null && left.TokenType == DocTokenTypes.LeftPartial ? left.Length : 0;
            int r = l + unknown.Length;

            string defaultPrev =
                left != null && left.TokenType == DocTokenTypes.Known ? left.StringPart :
                mostLeft != null && mostLeft.TokenType == DocTokenTypes.Known ? mostLeft.StringPart :

            string defaultLast =
                right != null && right.TokenType == DocTokenTypes.Known ? right.StringPart :
                mostRight != null && mostRight.TokenType == DocTokenTypes.Known ? mostRight.StringPart :

            Func<string, string> topAndTail = str =>
                return str.Substring(l, r - l);

            Func<State, string, double, bool> tryMove = (State prev, string token, double specialFabness) => 
                bool isPunctionuation = token.Length == 1 && punctuation.Contains(token[0]);
                string addStr = isPunctionuation || prev == null ? token : " " + token;
                int addLen = addStr.Length;

                int newRemaining = prev != null ? prev.Remaining - addLen : spaceSize - addLen;
                int oldPosition = prev != null ? prev.Position : 0;
                int newPosition = oldPosition + addLen;

                // check length
                if (newRemaining < 0)
                    return false;

                // check start
                if (oldPosition < l) // implies left is LeftPartial
                    int s = oldPosition;
                    int e = newPosition > l ? l : newPosition;
                    int len = e - s;
                    if (addStr.Substring(0, len) != left.StringPart.Substring(s, len))
                        return false; // doesn't match LeftPartial

                // check end
                if (newPosition > r) // implies right is RightPartial
                    int s = oldPosition > r ? oldPosition : r;
                    int e = newPosition;
                    int len = e - s;
                    if (addStr.Substring(s - oldPosition, len) != right.StringPart.Substring(s - r, len))
                        return false; // doesn't match RightPartial

                if (newRemaining == 0)
                    // could try to do something here (need to change H)

                string prevToken = prev != null ? prev.Token : defaultPrev;
                bool isLastunctionuation = prevToken.Length == 1 && punctuation.Contains(prevToken[0]);

                if (isLastunctionuation && isPunctionuation) // I hate this check, it's too aggresive to be realistic
                    specialFabness -= 50;

                double fab = fabness(prevToken, token);

                if (fab < 1 && (token == prevToken))
                    fab = -1; // bias against unrecognised repeats

                double newFabness = (prev != null ? prev.Fabness : 0.0)
                    - specialFabness // ... whatever this is
                    - fab * addLen; // how probabilistic

                double h = newFabness; // no h for now

                State newState = new Program.State(newRemaining, newPosition, prev, newFabness, h, token, addStr);

//                Console.WriteLine((prev != null ? prev.Fabness : 0) + "\t" + specialFabness);
//                Console.WriteLine(newFabness + "\t" + h + "\t" + due.Count + "\t" + fab + "*" + addLen + "\t" + newState.FullFilling);

                return true;

            // just try everything everything
            foreach (string t in knowns)
                tryMove(null, t, 0);

            if (left != null && left.TokenType == DocTokenTypes.LeftPartial)
                tryMove(null, left.StringPart, -1);

            while (!due.Empty)
                State next = due.RemoveMin();

                if (next.Remaining == 0)
                    // we have a winner!!
                    return topAndTail(next.FullFilling);

                // just try everything
                foreach (string t in knowns)
                    tryMove(next, t, 0);
                if (right != null && right.TokenType == DocTokenTypes.RightPartial)
                    tryMove(next, right.StringPart, -5); // big bias

            // make this a tad less stupid, non?
            return Filler.FirstOrDefault(f => f.Length == unknown.Length) ?? new String(' ', unknown.Length); // oh dear...

    // Ultilities

    public class Heap<T> : System.Collections.IEnumerable where T : IComparable<T>
        // arr is treated as offset by 1, all idxes stored need to be -1'd to get index in arr
        private T[] arr;
        private int end = 0;

        private void s(int idx, T val)
            arr[idx - 1] = val;

        private T g(int idx)
            return arr[idx - 1];

        public Heap(int isize)
            if (isize < 1)
                throw new ArgumentException("Cannot be less than 1", "isize");

            arr = new T[isize];

        private int up(int idx)
            return idx / 2;

        private int downLeft(int idx)
            return idx * 2;

        private int downRight(int idx)
            return idx * 2 + 1;

        private void swap(int a, int b)
            T t = g(a);
            s(a, g(b));
            s(b, t);

        private void moveUp(int idx, T t)
            if (idx == 1)
                s(1, t);
                return; // at end

            int nextUp = up(idx);
            T n = g(nextUp);
            if (n.CompareTo(t) > 0)
                s(idx, n);
                idx = nextUp;
                goto again;
                s(idx, t);

        private void moveDown(int idx, T t)
            int nextLeft = downLeft(idx);
            int nextRight = downRight(idx);

            if (nextLeft > end)
                s(idx, t);
                return; // at end
            else if (nextLeft == end)
            { // only need to check left
                T l = g(nextLeft);

                if (l.CompareTo(t) < 0)
                    s(idx, l);
                    idx = nextLeft;
                    goto again;
                    s(idx, t);
            { // check both
                T l = g(nextLeft);
                T r = g(nextRight);

                if (l.CompareTo(r) < 0)
                { // left smaller (favour going right if we can)
                    if (l.CompareTo(t) < 0)
                        s(idx, l);
                        idx = nextLeft;
                        goto again;
                        s(idx, t);
                { // right smaller or same
                    if (r.CompareTo(t) < 0)
                        s(idx, r);
                        idx = nextRight;
                        goto again;
                        s(idx, t);

        public void Clear()
            end = 0;

        public void Trim()
            if (end == 0)
                arr = new T[1]; // don't /ever/ make arr len 0
                T[] narr = new T[end];
                for (int i = 0; i < end; i++)
                    narr[i] = arr[i];
                arr = narr;

        private void doubleSize()
            T[] narr = new T[arr.Length * 2];
            for (int i = 0; i < end; i++)
                narr[i] = arr[i];
            arr = narr;

        public void Add(T item)
            if (end == arr.Length)
                // resize

            moveUp(end, item);

        public T RemoveMin()
            if (end < 1)
                throw new Exception("No items, mate.");

            T min = g(1);

            if (end > 0)
                moveDown(1, g(end + 1));

            return min;

        public bool Empty
                return end == 0;

        public int Count
                return end;

        System.Collections.IEnumerator System.Collections.IEnumerable.GetEnumerator()
            return GetEnumerator();

        public IEnumerator<T> GetEnumerator()
            return (IEnumerator<T>)arr.GetEnumerator();
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.