Wednesday, August 20, 2008

Könyvek, internet, újrahasznosítás

Mi magunk digitalizáljuk a New York Times-t.

3 comments:

  1. na jó, de mennyit kapok ezért?
    rohadék modern rabszolgtartó társadalom!!!!

    ReplyDelete
  2. De mégis akkor, hogyan lehet az, hogyha rosszul gépelem be a szöveget akkor a gép ezt tudja? Tehát neki már meg kell, hogy legyen a helyes verzió, hogy el tudja dönteni, hogy jó az e amit én begépeltem. Vagy rosszul értettem vmit?

    ReplyDelete
  3. most nézem hogy a kommentezők is problémáznak ezen..

    "Ha jól tudom, úgy működik, hogy
    1. bescannelik a szöveget
    2. szavakra tördelik (automatikusan)
    3. kapsz két szót, az egyik szót már sok user beírta ("erős"), így valószínű megvan a helyes átirat, a másikat pedig még kevés ember írta át ("gyenge").
    4. Beírod a két szót, amit látsz. (Néha elég nehéz ;-).
    5. A rendszer tudja, hogy melyik a sok user által megerősített szó, így azzal kezdi az ellenőrzést. Ha nem egyezik, akkor új captcha-t kapsz.
    6. Ha egyezik, akkor a másik szót összehasonlítja az eddig beérkezett átiratokkal, és ebből egy hasonlósági értéket számít. Ha nem stimmel, új captcha-t kapsz.
    7. Ha az erős szó stimmel, és a másik egy adott hasonlósági szint felett van, akkor ezt is eltárolja.

    A rendszer előnye, hogy minimum egy szó mindig nagy bizonyossággal ellenőrzi, hogy ember vagy gép próbálkozik. A másik szó pedig segít a "szótár" bővítésében, azaz nem lehet olyan, hogy botok megtanulják az összes lehetséges chaptcha képet." (Alex072)

    ReplyDelete