Wednesday, August 20, 2008

Könyvek, internet, újrahasznosítás

Mi magunk digitalizáljuk a New York Times-t.

3 megjegyzés:

Renato Csatich said...

na jó, de mennyit kapok ezért?
rohadék modern rabszolgtartó társadalom!!!!

Anonymous said...

De mégis akkor, hogyan lehet az, hogyha rosszul gépelem be a szöveget akkor a gép ezt tudja? Tehát neki már meg kell, hogy legyen a helyes verzió, hogy el tudja dönteni, hogy jó az e amit én begépeltem. Vagy rosszul értettem vmit?

roomann said...

most nézem hogy a kommentezők is problémáznak ezen..

"Ha jól tudom, úgy működik, hogy
1. bescannelik a szöveget
2. szavakra tördelik (automatikusan)
3. kapsz két szót, az egyik szót már sok user beírta ("erős"), így valószínű megvan a helyes átirat, a másikat pedig még kevés ember írta át ("gyenge").
4. Beírod a két szót, amit látsz. (Néha elég nehéz ;-).
5. A rendszer tudja, hogy melyik a sok user által megerősített szó, így azzal kezdi az ellenőrzést. Ha nem egyezik, akkor új captcha-t kapsz.
6. Ha egyezik, akkor a másik szót összehasonlítja az eddig beérkezett átiratokkal, és ebből egy hasonlósági értéket számít. Ha nem stimmel, új captcha-t kapsz.
7. Ha az erős szó stimmel, és a másik egy adott hasonlósági szint felett van, akkor ezt is eltárolja.

A rendszer előnye, hogy minimum egy szó mindig nagy bizonyossággal ellenőrzi, hogy ember vagy gép próbálkozik. A másik szó pedig segít a "szótár" bővítésében, azaz nem lehet olyan, hogy botok megtanulják az összes lehetséges chaptcha képet." (Alex072)