Existe-t-il des défis textuels CAPTCHA qui peuvent tromper l'IA, mais pas l'homme?


10

Existe-t-il des techniques modernes de génération de défis CAPTCHA textuels (donc la personne doit taper le bon texte) qui peuvent facilement tromper l'IA avec certaines méthodes d'obscurcissement visuel, mais en même temps, les humains peuvent les résoudre sans aucune difficulté?

Par exemple, je parle de la capacité simple de reconnaître le texte intégré à l'image (sans prendre en compte les plugins externes tels que flash ou java, classification des images, etc.) et de retaper le texte qui a été écrit ou quelque chose de similaire.

Je suppose que l'ajout de bruit, de dégradé, de rotation des lettres ou de changement de couleurs ne sont plus des méthodes fiables, car ils peuvent être rapidement brisés.

Des suggestions ou des recherches ont été faites?


4
N'est-ce pas une sorte de recul? Habituellement, quelqu'un fait d'abord un Captcha qui, selon lui, peut tromper un bot, PUIS d'autres personnes commencent à le résoudre automatiquement. Tout ce que vous pourriez penser deviendra obsolète très rapidement.
Désenchanté Lurker

Essayez de penser à ce que les humains peuvent faire de mieux que les ordinateurs. Nous pouvons raisonner et nous (locuteurs natifs) connaîtrons presque tous les idiomes. Voir ceci pour plus d'idées . Je pense qu'en ce qui concerne le texte, le mieux serait que l'utilisateur saisisse du texte analysé avec la PNL pour correspondre à un sentiment déclaré ou peut-être exprimer quelque chose. Les ordinateurs ne sont pas très bons pour rédiger des phrases claires et bien structurées (mais je suppose que la plupart des humains ne sont pas bons non plus).
JakeD

CAPTCHA habituellement textuel est utilisé pour signifier que le CATPCHA est présenté sous forme de texte, et non que l'entrée utilisateur requise doit être du texte. Par exemple TextCaptcha .
Theraot du

Réponses:


5

C'est une question intéressante sur ce qui rend les humains uniques. Il y a un bon livre sur le sujet intitulé What Computers Cant Do par Hubert Dreyfus .

Une tâche qu'un ordinateur ne peut pas gérer (pour le moment du moins) est le classement des choses importantes. Par exemple, CAPTCHA vous demande de commander une liste aléatoire de choses (petites, cinq ou six articles) par importance. Cet exercice particulier nécessite que l'IA prenne des décisions (pas toujours rationnelles) basées sur le jugement humain.


5

Une méthode qui pourrait éventuellement fonctionner utilise des illusions d'optique comme celle où deux lignes dans le couloir sont identiques mais l'une semble plus longue à l'œil humain, puis elles pourraient être invitées à poser une question à choix multiple quant à l'état de la ligne, qui à nos yeux semblent plus longs, mais pour un ordinateur, c'est toujours la même longueur de ligne. Bien sûr, il y a toujours le problème des personnes ayant une déficience oculaire qui ne sont pas en mesure de les compléter, mais différentes illusions pourraient être utilisées pour s'adapter à cela.

Exemple


2

Demandez à l'utilisateur de mettre en surbrillance des objets en vidéo qu'un classificateur de pointe ne peut pas résoudre

Créez un classificateur vidéo de pointe. Autant le former aux données d'entraînement vidéo YouTube-8M de Google . Mais vous voudrez aussi continuellement l'alimenter en vidéo originale.

Demandez au classificateur d'étiqueter autant d'objets que possible. Demandez-lui d'isoler les objets qu'il peut reconnaître en tant qu'objets mais qu'il ne peut pas étiqueter.

Demandez-lui de produire des vidéos qui décrivent les objets. De préférence des GIF, qui peuvent être facilement intégrés dans des formulaires.

Pour 100 d'entre eux, demandez à 100 utilisateurs quel est l'objet. Si 90% des utilisateurs s'accordent sur le nom d'un objet, ajoutez cette vidéo au captcha-set. Appelez cela l'ensemble pré-formé.

Chaque fois qu'un utilisateur doit s'authentifier, montrez-lui l'un des objets mis en surbrillance dans une vidéo qui ne fait pas partie de l'ensemble pré-formé . Si l'image contient moins de 100 images, enregistrez l'étiquette et donnez-en une autre à l'utilisateur de l'ensemble pré-formé. S'ils réussissent, laissez-les passer, sinon, donnez-leur un autre de l'ensemble pré-formé.

Une fois que la vidéo non pré-formée a plus de 100 projections et que plus de 90% des utilisateurs captcha sont d'accord, ajoutez cette vidéo à l'ensemble post-formé.

Au fil du temps, retirez lentement l'ensemble pré-formé. Mettez les expirations sur chaque vidéo dans l'ensemble post-formé et supprimez-les après expiration, afin qu'elles ne soient pas utilisées trop souvent.

Idéalement, ce processus améliorerait constamment le classificateur vidéo, en le gardant à la pointe de la technologie et légèrement en avance sur les autres classificateurs. Peut-être pourrait-il également favoriser des mots et des objets moins courants et des choses plus ésotériques, afin de spécialiser ce classificateur contre d'autres classificateurs.

La même chose pourrait être faite pour l'étiquetage des images, mais l'utilité du classificateur vidéo durera probablement plus longtemps, compte tenu des progrès de l'IA.

À strictement parler, cependant, à moins d'une supercherie quantique, il n'y a pas de système captcha qui ne sera pas un jour résolu par des systèmes d'IA externes.

(modifier: oh, je viens de remarquer que vous avez spécifiquement dit "captcha textuel". Si c'est ce que vous voulez dire, alors non, je ne pense pas que la classification des textes ait beaucoup de mystère. Les ordinateurs peuvent probablement glaner le texte des images mieux que les humains maintenant. Mais d'un point de vue technique, l' entrée dans le système de captcha décrit ci-dessus est textuelle.)

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.