Non sei loggato | Registrati | Login

reCAPTCHA, combattere lo spam digitalizzando libri Aggiungi

News / Software

Benvenuto! Se sei un nuovo visitatore ti consiglio di iscriverti al mio Feed RSS in modo da essere sempre aggiornato riguardo l'uscita di nuovi articoli oppure sbirciare tra i tutorials ed i progetti.
Per avere un'idea del best-content presente in questo blog puoi leggere il post intitolato "Ed ora è il momento di rilanciare alcune iniziative! (1a parte e 2a parte)".
Buona navigazione e grazie per la visita!

Esempio di reCAPTCHA
reCAPTCHA è un sistema CAPTCHA che sfrutta il lavoro collettivo per digitalizzare libri “antichi” o meno.
Scansionando un libro e passandolo in OCR non sempre si riesce a digitalizzarlo completamente e quindi quelli di reCAPTCHA hanno pensato bene di sfruttare il sistema anti-spam per decifrare quelle parole che risultano incomprensibili ad un sistema computerizzato.
Ma se il computer non sa a che parola corrisponde l’immagine (visto che non è riuscito a digitalizzarla) come fa capire se la corrispondenza è giusta?
Detto fatto:

Each new word that cannot be read correctly by OCR is given to a user in conjunction with another word for which the answer is already known. The user is then asked to read both words. If they solve the one for which the answer is known, the system assumes their answer is correct for the new one. The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct.

Il CAPTCHA è forse il sistema anti-spam più laborioso e noioso da compilare ma almeno la fatica che facciamo serve anche a qualcosa altro :)

Daniele Simonin 24 Maggio 2007 alle 12:02 Trackback URI

Scrivi un commento

Tags di formattazione:








Leggi i 2 commenti

Interessante! Un bel modo di sfruttare questo limite necessario per combattere lo spam.
Ciao,
P|xeL

Commento di P|xeL 24 Maggio 2007 alle 17:22

[…] Ebbene, grazie a Daniele, ho scoperto che una società ha realizzato reCAPTCHA, un sistema captcha che sfrutta il lavoro collettivo, reindirizzando produttivamente le 150.000 ore al giorno, per digitalizzare libri antichi della Internet Archive! […]

Pingback da Levysoft » reCaptcha: il primo sistema captcha antispam collaborativo per salvare migliaia di libri antichi sfruttando le 150.000 ore che ogni giorno l’uomo passa ad interpretare gli antispam 29 Maggio 2007 alle 09:03

Feed

infoPillole (by Wikipedia)

Ultimi commenti

  • flippetta: appena li ho visti sn diventati subito una...
  • Daniele Simonin: Ciao, in giro trovi una marea di guide a...
  • Daniele Simonin: i commenti sono sempre benvoluti ;)
  • chiara: scusate mi sapete dire che cos’è pdo e le...
  • oniduke: Immagino che non dobbiamo neanche commentare :D

Calendario

Maggio 2008
L M M G V S D
« Apr    
 1234
567891011
12131415161718
19202122232425
262728293031  

Archivio

Categorie

News casuali

Ultimi tutorials

Progetti

Alcuni miei lettori

Have a break