Nokioteca [Nokia] Forum: [pc] Decodifica Captcha - Nokioteca [Nokia] Forum

Salta al contenuto

Pagina 1 di 1
  • Non puoi iniziare una nuova discussione
  • Non puoi rispondere a questa discussione

[pc] Decodifica Captcha Cercasi info...

#1 L   Il.Socio 

  • Nokioteca Staff
  • Gruppo: Moderatore
  • Messaggi: 7144
  • Iscritto: 02 dicembre 2005
  • Località:Torino
  • Cellulare:N8-00

Inviato 15 luglio 2009 - 13:30

Qualcuno ha mai avuto esperienze con la decodifica dei captcha?
Mi piacerebbe riuscire a realizzare un motore per la decodifica dei captcha che vengono utilizzati su symbiansigned...

Ne riporto qui di seguito alcuni esempi:
Immagine Postata
Immagine Postata
Immagine Postata
Immagine Postata

Ho gia' fatto diverse prove ma con scarsi risultati...
I problemi maggiori sono:
- filtrare l'immagine rimuovendo lo sfondo (very hard!?)
- separare opportunatamente i vari caratteri (easy!?)
- riconoscerli (hard!?)

A favore c'e' il fatto che il range dei possibili caratteri e' limitato: 0-9 A-F

Dalle vari immagini si nota che la deformazione che viene applicata al carattere in una certa posizione e' sempre la stessa... Vale a dire che tutti i caratteri "5" in prima posizione sono sempre molto simili tra loro.
Quindi, se si riesce ad identificare con successo il carattere in prima posizione, non dovrebbe essere un problema riconoscere anche quelli in posizione 2, 3, 4, 5, 6 7, 8

Semplificando, il problema diventa:
- Come fare per filtrare e riconoscere il primo carattere della stringa?

Riporto qui alcune immagini del primo carattere...
Immagine Postata
Immagine Postata
Immagine Postata
Immagine Postata
Immagine Postata
Immagine Postata
Immagine Postata
Immagine Postata
Immagine Postata

Messaggio modificato da Il.Socio il 16 luglio 2009 - 11:53

0

#2 L   dany88 

  • Millennium Member
  • PuntoPuntoPuntoPuntoPuntoPuntoPunto
  • Gruppo: Utente
  • Messaggi: 1185
  • Iscritto: 09 dicembre 2006

Inviato 15 luglio 2009 - 13:36

so che magari non farà al caso tuo, però io per i miei programmi che necessitano di risoluzione captcha utilizzo "decaptcher", un servizio a pagamento (2$ ogni 1000 captcha), dietro ci sono persone che risolvono i captcha 24 ore su 24 7 giorni su 7 e offrono api per molti linguaggi.
http://decaptcher.com/client/

Messaggio modificato da dany88 il 15 luglio 2009 - 13:37

0

#3 L   Il.Socio 

  • Nokioteca Staff
  • Gruppo: Moderatore
  • Messaggi: 7144
  • Iscritto: 02 dicembre 2005
  • Località:Torino
  • Cellulare:N8-00

Inviato 15 luglio 2009 - 13:42

Recentemente ho sperimentato questo servizio:
Per visualizzare questo link registrati o esegui il log in.

E l'ho trovato molto valido, con una percentuale di riconoscimento di circa il 95%

Vorrei pero' qualcosa offline in modo da slegarmi deltutto da questi servizi...

Messaggio modificato da Il.Socio il 15 luglio 2009 - 13:43

Per segnalare allo Staff un messaggio non conforme al regolamento è sufficiente premere il bottone "Segnala" posizionato in basso a sinistra di ciascun messaggio.
0

#4 L   dany88 

  • Millennium Member
  • PuntoPuntoPuntoPuntoPuntoPuntoPunto
  • Gruppo: Utente
  • Messaggi: 1185
  • Iscritto: 09 dicembre 2006

Inviato 16 luglio 2009 - 09:55

capito, tra i due preferisco decaptcher, se non altro è lowcost (2 dollari ogni mille captcha, contro i 9 richiesti da captcha-bypass) oltretutto ti rimborsano i captcha errati (se hai un modo per verificare che sia errato).

Per quanto riguarda il problema di ocr, vedendo meglio non sembra impossibile, se riuscissi a togliere lo sfondo (e quindi dare un colore uniforme al carattere), si potrebbe riuscire con una suddivisione fissa dei caratteri (intendo dividere l'immagine ogni XX pixel) e poi un confronto pixel per pixel con immagini precatturate (visto che da quanto ho visto negli esempi del primo carattere, inclinazione e grandezza sono sempre la stesse, il maggiore che ne ha uguali vince.

Messaggio modificato da dany88 il 16 luglio 2009 - 09:59

0

#5 L   Il.Socio 

  • Nokioteca Staff
  • Gruppo: Moderatore
  • Messaggi: 7144
  • Iscritto: 02 dicembre 2005
  • Località:Torino
  • Cellulare:N8-00

Inviato 16 luglio 2009 - 11:56

Non hai idea di quanto tempo ci abbia passato dietro cercando di rimuovere per bene lo sfondo pacioccando qua e la con filtri vari... ma sino ad ora i risultati sono stati ahime' scarsini :thumbs:

EDIT: oibe'... proprio ora ho ripreso in mano l'ultimo test che avevo fatto e sai che non era poi cosi' male?
Ora posto qualche screenshot :angry:

Messaggio modificato da Il.Socio il 16 luglio 2009 - 12:04

Per segnalare allo Staff un messaggio non conforme al regolamento è sufficiente premere il bottone "Segnala" posizionato in basso a sinistra di ciascun messaggio.
0

#6 L   memoryn70 

  • Millennium Member
  • Gruppo: Developer
  • Messaggi: 2112
  • Iscritto: 02 maggio 2007
  • Cellulare:Nokia N70
  • Firmware:5.0609.2.0.1

Inviato 16 luglio 2009 - 12:38

Un po di tempo fa si è parlato di un "lettore" del display del contatore di casa. Certo quella è una cosa fissa e costante ma magari puoi prendere alcuni spunti.
Ma perchè ti serve un decodificatore del genere :thumbs:?
0

#7 L   dany88 

  • Millennium Member
  • PuntoPuntoPuntoPuntoPuntoPuntoPunto
  • Gruppo: Utente
  • Messaggi: 1185
  • Iscritto: 09 dicembre 2006

Inviato 16 luglio 2009 - 13:19

Visualizza Messaggimemoryn70, il 16/07/2009 - 13:38, ha scritto:

Un po di tempo fa si è parlato di un "lettore" del display del contatore di casa. Certo quella è una cosa fissa e costante ma magari puoi prendere alcuni spunti.
Ma perchè ti serve un decodificatore del genere :shifty:?

La risoluzione del captcha gli servirà per automatizzare il processo che ne richiede l'inserimento.
bhè si, la situazione è totalmente diversa, la bastava solamente un confronto pixel per pixel supponendo che le foto fossero scattate sempre dalla stessa posizione, o al limite applicare prima dei controlli sulla foto (trovare inizio e fine del display) e agire di conseguenza. Qua invece non è detto che funzioni il confronto, bisognerebbe provare con diverse "tolleranze" e sopratutto ottenere un buon input dell'immagine su cui agire.
0

#8 L   memoryn70 

  • Millennium Member
  • Gruppo: Developer
  • Messaggi: 2112
  • Iscritto: 02 maggio 2007
  • Cellulare:Nokia N70
  • Firmware:5.0609.2.0.1

Inviato 16 luglio 2009 - 16:49

Visualizza Messaggidany88, il 16/07/2009 - 14:19, ha scritto:

La risoluzione del captcha gli servirà per automatizzare il processo che ne richiede l'inserimento.
bhè si, la situazione è totalmente diversa, la bastava solamente un confronto pixel per pixel supponendo che le foto fossero scattate sempre dalla stessa posizione, o al limite applicare prima dei controlli sulla foto (trovare inizio e fine del display) e agire di conseguenza. Qua invece non è detto che funzioni il confronto, bisognerebbe provare con diverse "tolleranze" e sopratutto ottenere un buon input dell'immagine su cui agire.


Si infatti...stavo pensando però ad una cosa. Se si riuscisse ad uniformare sfondo e testo, bisognerebbe evidenziare alcuni pixel nella zona "nera" ( il testo). Ora basterebbe allineare i puntini (cioè se sono più punti in orizzontale, vengono allineati in orizzontale, tipo retta). Stessa cosa per i puntini verticali, fino a formare il carattere in una forma più semplice. Quindi il carattere I potrebbero essere diversi puntini in verticale, O...eh per la O la cosa si complica un po ma come da sopra diventerebbe un + (tutti i puntini allineati)...e la Q..........vabbè io espongo la mia piccola idea :doh:
0

#9 L   dany88 

  • Millennium Member
  • PuntoPuntoPuntoPuntoPuntoPuntoPunto
  • Gruppo: Utente
  • Messaggi: 1185
  • Iscritto: 09 dicembre 2006

Inviato 16 luglio 2009 - 17:10

l'idea non sarebbe poi tanto malsana se non fosse che le lettere hanno tutte la stessa inclinazione, intendo dire che se prendi la 3° lettera in 10 captcha diversi, avranno tutte la stessa inclinazione, quindi sarebbe un lavoro inutile raddrizzarle, porterebbe solo un ulteriore modifica dell'immagine di partenza con conseguente calo di affidabilità per successive elaborazioni. Mentre sarebbe una delle strade percorribili se le inclinazioni fossero calcolate in modo random.

Messaggio modificato da dany88 il 16 luglio 2009 - 17:13

0

#10 L   Il.Socio 

  • Nokioteca Staff
  • Gruppo: Moderatore
  • Messaggi: 7144
  • Iscritto: 02 dicembre 2005
  • Località:Torino
  • Cellulare:N8-00

Inviato 16 luglio 2009 - 17:25

Ecco alcuni risultati che ho ottenuto applicando una sequenza di filtri sull'immagine...
Immagine PostataImmagine Postata
Immagine PostataImmagine Postata
Immagine PostataImmagine Postata
Immagine PostataImmagine Postata
Immagine PostataImmagine Postata
Immagine PostataImmagine Postata
Immagine PostataImmagine Postata
Immagine PostataImmagine Postata
Immagine PostataImmagine Postata

Messaggio modificato da Il.Socio il 16 luglio 2009 - 17:32

0

#11 L   Il.Socio 

  • Nokioteca Staff
  • Gruppo: Moderatore
  • Messaggi: 7144
  • Iscritto: 02 dicembre 2005
  • Località:Torino
  • Cellulare:N8-00

Inviato 16 luglio 2009 - 17:32

Immagine PostataImmagine Postata
Immagine PostataImmagine Postata
Immagine PostataImmagine Postata
Immagine PostataImmagine Postata
Per segnalare allo Staff un messaggio non conforme al regolamento è sufficiente premere il bottone "Segnala" posizionato in basso a sinistra di ciascun messaggio.
0

#12 L   dany88 

  • Millennium Member
  • PuntoPuntoPuntoPuntoPuntoPuntoPunto
  • Gruppo: Utente
  • Messaggi: 1185
  • Iscritto: 09 dicembre 2006

Inviato 17 luglio 2009 - 14:57

sembrano buoni, prova a vedere se riesci ad ottenere buoni risultati applicando direttamente riconoscimento pixel-pixel e diverse tolleranze su caratteri spezzati manualmente, poi se funziona, crea l'algoritmo per separare le varie lettere (che non è banale, per esempio dividere la D e la E della prima immagine è dura)

Messaggio modificato da dany88 il 18 luglio 2009 - 11:07

0

#13 L   Il.Socio 

  • Nokioteca Staff
  • Gruppo: Moderatore
  • Messaggi: 7144
  • Iscritto: 02 dicembre 2005
  • Località:Torino
  • Cellulare:N8-00

Inviato 18 luglio 2009 - 15:11

il problema del riconoscimento a blocchetti di pixel, e' che per poterlo applicare prima bisogna allineare i caratteri...
perche' non sono tutti posizionati alla stessa altezza (il primo carattere a volte si trova piu' in alto, a volte piu' in basso, a volte piu' a sx a volte piu' a dx) e purtroppo il "rumore" residuo non facilita per niente questo compito... Non e' facile filtrare il rumore residuo senza perdersi informazioni utili.

Ora mi sto un po' documentando su approcci differenti... mah... vedremo...

Messaggio modificato da Il.Socio il 18 luglio 2009 - 15:14

Per segnalare allo Staff un messaggio non conforme al regolamento è sufficiente premere il bottone "Segnala" posizionato in basso a sinistra di ciascun messaggio.
0

#14 L   madhacker 

  • Senior Member
  • PuntoPuntoPuntoPuntoPunto
  • Gruppo: Utente
  • Messaggi: 527
  • Iscritto: 16 settembre 2006
  • Cellulare:N95-2,5800

Inviato 21 luglio 2009 - 20:22

scusa la domanda forse poco attinente al topic, ma perchè decodificare un captcha offline se per averlo devi andare online?
infatti dici di nn volerti appoggiare a sistemi online

Quote

Vorrei pero' qualcosa offline in modo da slegarmi deltutto da questi servizi...

non so cosa stia progettando ma spero (come sempre) sia qualcosa di utile :thumbs:
0

#15 L   Il.Socio 

  • Nokioteca Staff
  • Gruppo: Moderatore
  • Messaggi: 7144
  • Iscritto: 02 dicembre 2005
  • Località:Torino
  • Cellulare:N8-00

Inviato 21 luglio 2009 - 20:32

:thumbs: in effetti...
la parte online verso symbiansigned ci sarebbe comunque...
mi interessa eliminare solo la parte di decodifica captcha in modo da poterla gestire senza l'appoggio di servizi esterni.

EDIT:
a dirla tutta, direi poco utile al momento... pero' questi smanettamenti sulla decodifica dei captcha possono sempre tornare utili in futuro. :mumble:
Ad esempio, mi ha dato modo di giocherellare un po' con AForge,
Per visualizzare questo link registrati o esegui il log in.
che prima non conoscevo, ed e' uno spettacolo.

Messaggio modificato da Il.Socio il 21 luglio 2009 - 20:36

Per segnalare allo Staff un messaggio non conforme al regolamento è sufficiente premere il bottone "Segnala" posizionato in basso a sinistra di ciascun messaggio.
0

#16 L   memoryn70 

  • Millennium Member
  • Gruppo: Developer
  • Messaggi: 2112
  • Iscritto: 02 maggio 2007
  • Cellulare:Nokia N70
  • Firmware:5.0609.2.0.1

Inviato 27 luglio 2009 - 17:47

Guardate qui cosa ho trovato per caso (sul forum di rigs of rods, hanno cambiato la sicurezza)

Per visualizzare questo link registrati o esegui il log in.

0

#17 L   dany88 

  • Millennium Member
  • PuntoPuntoPuntoPuntoPuntoPuntoPunto
  • Gruppo: Utente
  • Messaggi: 1185
  • Iscritto: 09 dicembre 2006

Inviato 28 luglio 2009 - 09:33

Visualizza Messaggimemoryn70, il 27/07/2009 - 18:47, ha scritto:

Guardate qui cosa ho trovato per caso (sul forum di rigs of rods, hanno cambiato la sicurezza)

Per visualizzare questo link registrati o esegui il log in.

questo è uno dei servizi più utilizzati per creare captcha, non per risolverli :D
0

#18 L   memoryn70 

  • Millennium Member
  • Gruppo: Developer
  • Messaggi: 2112
  • Iscritto: 02 maggio 2007
  • Cellulare:Nokia N70
  • Firmware:5.0609.2.0.1

Inviato 28 luglio 2009 - 17:53

Visualizza Messaggidany88, il 28/07/2009 - 10:33, ha scritto:

questo è uno dei servizi più utilizzati per creare captcha, non per risolverli :)


Si infatti ma se noti li crea con linee sopra quindi con questo le cose si complicano...
0

#19 L   madhacker 

  • Senior Member
  • PuntoPuntoPuntoPuntoPunto
  • Gruppo: Utente
  • Messaggi: 527
  • Iscritto: 16 settembre 2006
  • Cellulare:N95-2,5800

Inviato 28 luglio 2009 - 18:33

ma nel post si cerca di capire come fare per autoidentificare i captcha, cioè "bypassare" il captcha, nel caso specifico, di symbian signed.
0

#20 L   RosarioCastellana 

  • Newbie
  • Punto
  • Gruppo: Utente
  • Messaggi: 1
  • Iscritto: 22 aprile 2011

Inviato 22 aprile 2011 - 18:51

Ragazzi, ma mi spiegate come funziona
Per visualizzare questo link registrati o esegui il log in.
Sul sito non mi danno programmi, mi danno solo dei codici e non so come far funzionare il sistema...
0

Condividi questa discussione:


Pagina 1 di 1
  • Non puoi iniziare una nuova discussione
  • Non puoi rispondere a questa discussione