public marks

PUBLIC MARKS from decembre with tags numerisation & securite

31 January 2009 10:00

ReCAPTCHA apporte une solution originale: : quand le spam améliore les logiciels d'OCR

Le système propose deux mots à déchiffrer. Le premier est un mot connu qui sert à s'assurer que la personne en face de l'écran est bien un humain. Le deuxième est un mot rejeté par un logiciel (Un logiciel ou une application est un ensemble de programmes, qui permet à un ordinateur ou à un système informatique...) d'OCR, déformé comme pour un CAPCHA classique. Quand un certain nombre (Un nombre est un concept caractérisant une unité, une collection d'unités ou une fraction d'unité.) d'utilisateurs a déchiffré de la même manière le deuxième mot, celui-ci est validé et peut alors être substitué dans le processus de numérisation du livre. Cette méthode est aujourd'hui utilisée au profit de l'Internet Archive (L'Internet Archive est une organisation à but non lucratif consacrée à l'archivage du Web, fondée par Brewster Kahle en...), une association à but non lucratif de l'Open Content Alliance, pour l'aider dans son travail de numérisation de contenus libres de droits