Non sei loggato | Registrati | Login

reCAPTCHA, combattere lo spam digitalizzando libri Aggiungi

News / Software

Benvenuto! Se sei un nuovo visitatore ti consiglio di iscriverti al mio Feed RSS in modo da essere sempre aggiornato riguardo l'uscita di nuovi articoli oppure sbirciare tra i tutorials ed i progetti.
Per avere un'idea del best-content presente in questo blog puoi leggere il post intitolato "Ed ora è il momento di rilanciare alcune iniziative! (1a parte e 2a parte)".
Buona navigazione e grazie per la visita!

Esempio di reCAPTCHA
reCAPTCHA è un sistema CAPTCHA che sfrutta il lavoro collettivo per digitalizzare libri “antichi” o meno.
Scansionando un libro e passandolo in OCR non sempre si riesce a digitalizzarlo completamente e quindi quelli di reCAPTCHA hanno pensato bene di sfruttare il sistema anti-spam per decifrare quelle parole che risultano incomprensibili ad un sistema computerizzato.
Ma se il computer non sa a che parola corrisponde l’immagine (visto che non è riuscito a digitalizzarla) come fa capire se la corrispondenza è giusta?
Detto fatto:

Each new word that cannot be read correctly by OCR is given to a user in conjunction with another word for which the answer is already known. The user is then asked to read both words. If they solve the one for which the answer is known, the system assumes their answer is correct for the new one. The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct.

Il CAPTCHA è forse il sistema anti-spam più laborioso e noioso da compilare ma almeno la fatica che facciamo serve anche a qualcosa altro :)

Daniele Simonin 24 Maggio 2007 alle 12:02 Trackback URI

Scrivi un commento

Tags di formattazione:








Leggi i 2 commenti

Interessante! Un bel modo di sfruttare questo limite necessario per combattere lo spam.
Ciao,
P|xeL

Commento di P|xeL 24 Maggio 2007 alle 17:22

[…] Ebbene, grazie a Daniele, ho scoperto che una società ha realizzato reCAPTCHA, un sistema captcha che sfrutta il lavoro collettivo, reindirizzando produttivamente le 150.000 ore al giorno, per digitalizzare libri antichi della Internet Archive! […]

Pingback da Levysoft » reCaptcha: il primo sistema captcha antispam collaborativo per salvare migliaia di libri antichi sfruttando le 150.000 ore che ogni giorno l’uomo passa ad interpretare gli antispam 29 Maggio 2007 alle 09:03

Feed

infoPillole (by Wikipedia)

Ultimi commenti

  • Emanuele: Io invece vedo un altro numero un po’...
  • Attilio Viscido: Thanks, può essere molto utile :)
  • oniduke: AAaaah!!! Tropic Thunder è bellissimo!!!!!11...
  • Gioxx: Non c’è nulla da preoccuparsi lato flipper...
  • Daniele Simonin: Nel mio caso non sono venuto a...

Calendario

Novembre 2008
L M M G V S D
« Ott    
 12
3456789
10111213141516
17181920212223
24252627282930

Archivio

Categorie

News casuali

Ultimi tutorials

Progetti

Alcuni miei lettori

Have a break