• Uncategorized

Distributed Proofreaders!

Hvað er það sem að á nú hug minn hálfan? Ja ég skal bara segja frá því. Þetta er voldug færsla en svo stútfull af upplýsingum og áhugaverðu efni (að mínu mati) að það er vonandi enginn svikinn af því að nýta 2-3 mínútur í að renna yfir þetta.

Öll þessi upptalning er þó bara ein leið til að kynna fyrir fólki það að með því að nota vafrann sinn geti það lagt sitt af mörkum á einfaldan máta til að byggja besta bókasafn heims. Jafnvel þó að viðkomandi leggi bara eina síðu af mörkunum, þá er það vel þegið framtak! Best er líklega að skoða myndirnar sem er að finna neðst til að sjá hversu einföldum hlut þessi roknafærsla lýsir.

Þeim sem hafa litla þolinmæði en vilja vita af hverju ég tengi á Leiðarvísir í ástamálum: II. fyrir ungar stúlkur og hvað ég hef verið að bauka geta svo hoppað á viðeigandi stað í færslunni.

Distributed Proofreaders

Hvað er þetta?
Þetta er vefur sem rekinn er af sjálfboðaliðum. Sumir þeirra skanna inn gamlar bækur eða skjöl og senda inn. Þar tekur einhver ábyrgð á bókinni/verkinu og kemur því í ferlið. Endaútkoman er svo yfirleitt tvær rafrænar útgáfur af verkinu, annars vegar snyrtileg vefsíða, með myndum ef við á, og hins vegar einföld og hrá textaskrá. Þeim er svo komið fyrir á Project Gutenberg, sem er gríðarlega metnaðarfullt verkefni sem er í raun ókeypis bókasafn á netinu. Þar má lesa verk Shakespeare í ýmsum útgáfum og þýðingum og sama á við verk Hamsuns og ótal fjölda annara rithöfunda, finna ævafornar uppskriftabækur, manntöl, barnabækur (til dæmis Little Lord Fauntleroy) og svo margt margt margt fleira!

Til hvers er það?
Distributed Proofreaders (sem ég hef þýtt sem Dreifðir prófarkalesarar) er vettvangur fyrir almenning til að leggja sitt af mörkum til þessa glæsilega verkefnis sem Project Gutenberg er. Þetta færir okkur nær því sem margir hafa óskað eftir, að hver sem er getur kallað fram næstum hvaða texta sem er fram hvar sem hann er. Verkamaður í Pittsburgh í Bandaríkjunum getur sest við tölvuna sína og kitlað forn-ensku áhuga sinn með því að lesa Bjólfskviðu, amma í Glasgow getur fundið barnasögu og prentað hana út og lesið fyrir barnabörnin sín, japanskur áhugamaður um Da Vinci getur kynnt sér glósur hans, ítölsk kona getur lesið ljóð um sléttur Karolínufylkis í Bandaríkjunum og íslenskur áhugamaður um Filippseyjar getur lesið ekki bara bindi 1 og upp úr um sögu Filippseyja 1500-1800 heldur líka kynnt sér þjóðsögur þaðan og svo margt margt fleira.

Hvað er þarna?
Á vef DP er að finna umhverfi sem leyfir hverjum sem er að byrja að leggja sitt af mörkum. Sumir gera það vegna svipaðra hugsjóna og er lýst að ofan, aðrir hafa náð sér í gífurlegt efni af Project Gutenberg og vilja þakka fyrir sig með því að leggja til vinnu, sumir fá þarna útrás fyrir þörf sína til að leiðrétta villur í texta sem þeir sjá og sumir líta á þetta sem góða leið til að lesa ótrúlegustu hluti sem þeir myndu aldrei annars rata í, enn aðrir horfa svo til fjölda síðna sem þeir hafa prófarkalesið og eru í endalausri keppni um að komast ofar á listann. Ástæðurnar fyrir því að fólk leggur sitt af mörkum eru margar og misjafnar rétt eins og verkefnin sem þangað rata. Ég mæli sterklega með því að fólk lesi að minnsta kosti fyrstu síðuna í þessari umræðu þar sem nokkrir þátttakendur segja frá hvers vegna þeir nýta frítíma (og stundum vinnutíma) sinn í þetta.

Hvernig gera þeir þetta?
Það skref sem flestir taka þátt í er að opna eina blaðsíðu og leiðrétta textann sem kemur úr ljóslestrinum (þegar tölva les mynd af blaðsíðu og reynir að herma eftir, nefnist OCR á ensku). Aðeins þarf að hafa nýlegan vafra (Internet Explorer, Firefox, og svo framvegis) til þess að geta tekið þátt í þessu. Margir hafa nokkra dauða tímapunkta á hverjum degi sem þeir nýta með því að lesa yfir eins og eina eða fleiri síður. Eftir tíu mínútna setu geta þeir slökkt á vafranum og snúið sér að öðru, vitandi það að þeir hafa lagt sitt af mörkum í verkefni sem næstu ættliðir munu geta nýtt sér.

Hvert verkefni fer í gegnum að minnsta kosti tvær umferðir af prófarkalestri, um seinni umferðina sér einhver sem hefur sannað sig og sýnt að honum er annt um að gera sitt besta til að skila efninu frá sér. Að prófarkalestri loknum tekur einn einstaklingur við efninu, raðar blaðsíðunum saman, snyrtir textann til og skoðar hvort að prófarkalesturinn hafi ekki skilað árangri. Hann skilar svo frá sér vefsíðu og textaskjali sem mun enda á Project Gutenberg. Á eftir honum kemur svo lokaaðilinn sem athugar hvort að vefsíðan og textaskjalið standast kröfur Project Gutenberg og ef svo er, kemur þeim þangað.

Þetta er í raun eins og pýramídi, stór hópur fólks tekur þátt í prófarkalestrinum, hópurinn sem að sendir inn og skilar út verkefnum er minni og fæstir eru í hópnum sem að skilar verkinu að lokum til Project Gutenberg. Margir hafa mjög takmarkaðan tíma og una sér því alsælir í prófarkalestrinum, aðrir hafa meiri tíma aflögu og leggja því í það að taka að sér hin verkefnin. Þeir sem eru áhugasamir og sanna sig geta auðveldlega fært sig ofar í pýramídanum ef þeir vilja það, sumir vilja eingöngu sinna einu ákveðnu hlutverki og gera það því. Það að sjálfboðaliðarnir njóti sín er algjört lykilatriði fyrir framgang slíkra hreyfinga og Distributed Proofreaders er engin undantekning á því.

Af hverju eru til tvær útgáfur af DP og PG?
Distributed Proofreaders er til í tveimur útgáfum, amerískri (DP-int) og evrópskri (DP-eu). Ég valdi evrópska vefinn sem íverustað minn, hann er mun fámennari en með fjölbreyttari tungumál þar sem hinn vefurinn styður ekki öll stafasett (unicode), ólíkt þeim evrópska. Auk þess var ameríska vefnum nýlega breytt þannig að nú fer hver blaðsíða í 4 umferðir yfirlestrar, þar sem annars vegar er textinn skoðaður (stafsetningarvillur) og hins vegar útlit textans (inndregið, feitletrað). Sumir vilja eingöngu vinna í útliti textans og aðrir í stafsetningu hans. Evrópska útgáfan hins vegar fer fram á það að hver prófarkalesari athugi bæði útlit og stafsetningu (sem mér finnst þægilegra). Evrópski vefurinn er að auki til á mörgum tungumálum, þar á meðal íslensku, á meðan að hinn er eingöngu á ensku.

Project Gutenberg er líka til í tveim útgáfum vegna mismunandi stafasetta, ekki er hægt að skoða til dæmis kínverskt eða rússneskt letur á gutenberg.org og því er starfrækt evrópskt Project Gutenberg.

Hvað hef ég verið að gera þarna?
Ég fékk vinnustaðinn til þess að prófa að senda inn verk. Eftir að hafa þýtt megnið af evrópska vefnum yfir á íslensku, fékk ég léðar myndir sem teknar voru af bók sem gefin var út 1922. Ég notaði forrit til að ljóslesa myndirnar og fékk út úr því textaskrár. Ég hafði svo samband við DP-eu og fékk hjá þeim réttindi til að setja inn ný verkefni á vef þeirra. Ég sendi inn myndirnar og textana sem fylgdu með þeim og beið svo á meðan að ýmsir aðilar fóru að prófarkalesa síðurnar og leiðrétta villurnar sem tölvan hafði gert við lesturinn.

Þegar að hver síða hafði verið prófarkalesin tvisvar sinnum var aftur komið að mér. Ég náði í skrá með öllum leiðréttingunum og renndi yfir hana til að sjá hvort að enn leyndust villur og til að laga útlit textans samkvæmt kröfum Gutenberg. Ég bjó svo til vefsíðu og textaskrá sem að ég sendi aftur inn á vefinn. Þar tók annar maður við, sannreyndi að verkefnið stæðist kröfur Project Gutenberg og sendi svo inn á evrópsku útgáfuna, þar er nú að finna Leiðarvísir í ástamálum: II. fyrir ungar stúlkur frá 1922, sem má lesa bæði sem vefsíðu og sem einfalda textaskrá. Þessi bók varð fyrir valinu þar sem hún var stutt og frekar auðveld viðfangs (engar myndir) og því tilvalin sem fyrsta verkefni til að kynnast ferlinu. Af þeim tæpa tug manna sem kom að verkefninu var ég eini Íslendingurinn.

Þar sem mér hafði gengið vel að smíða lokaafurðina ákvað ég að taka að mér annað lítið verkefni. Á vefnum fann ég litla rúmensk-enska ljóðabók sem hafði farið í gegnum prófarkalestur nokkrum mánuðum áður og beið nú bara eftir einhverjum til að koma sér alla leið. Ég náði í skrárnar og vann á sama hátt og áður og sendi inn. Hún bíður nú þess að einhver sannreyni að ég hafi vandað mig og mun svo birtast á netinu á sama hátt og hin (ég mun fylgjast með því). Ljóðskáldið er upphafsmaður nýrrar listastefnu, mér fannst bókin áhugaverð og sótti því næstu ljóðabók hans og hef hana nú hér á tölvunni þar sem ég dútla við að gera hana tilbúna til að fylgja hinni eftir. Hún er reyndar á frönsku þannig að ég get ekki notið hennar á sama hátt en það breytir því ekki að ég ætla að koma henni á Project Gutenberg. Ég ætla að taka fleiri verkefni að mér á sama hátt, bæði íslensk verk sem erlend.

Hvernig geta aðrir hjálpað?
Eitt af lykilatriðunum er einmitt það að prófarkalesarar þurfa ekkert endilega að kunna tungumálin sem þeir eru að prófarkalesa, þeir þurfa bara að passa upp á að textinn sé eins og sá sem er á myndinni af blaðsíðunni. Enginn þeirra sem prófarkalas Leiðarvísinn í ástamálum talaði íslensku, rétt eins og að ég hef prófarkalesið bækur á spænsku og frönsku þó ég kunni aðeins örfá orð í hvoru tungumáli fyrir sig, hvað þá rúmensku.

Þessa stundina er eitt íslenskt verk á DP-int, það er Sæfarinn: Ferðin kring um hnöttinn neðansjávar eftir Jules Verne. Hver sem er getur nýskráð sig á DP-int og byrjað að prófarkalesa hana í fyrri umferð yfirlestrar. Þegar að bókin hefur lokið prófarkalestri ætla ég mér að taka hana að mér og útbúa til birtingar.

Viðkomandi getur einnig nýskráð sig á DP-eu og byrjað að lesa yfir og leiðrétta og lagt þannig sitt af mörkum til að gera efnið aðgengilegt komandi kynslóðum. Á þessari stundu er til dæmis að finna þar verk á ensku, þýsku, frönsku, spænsku, pólsku, ítölsku, bengali og fleiri og fleiri tungumálum. Umfjöllunarefni þeirra er líka margvíslegt, skáldsögur, mannfræði, saga, lögfræði, ævisögur, trúarbragðafræði, bókmenntir, ljóð, ferðalög og fleira og fleira.

Sum verkefnin eru meira sjokkerandi en önnur, karlkyns prófarkalesarar hafa margir hætt að prófarkalesa þetta verkefni þar sem þeim hefur boðið við lýsingum og myndum sem bregða fyrir.

Þeir sem að skrá sig þarna geta svo haft samband við mig á ýmist ameríska eða evrópska vefnum ef þeir eru óöruggir. Nóg er af fólki á báðum vefjum sem að leggur sig fram við að hjálpa fólki, benda því vinsamlega á villur sem það hefur gert og hvetur það áfram til frekari dyggða. Auk þess er til spjallrás helguð þessu og þar er oft hægt að fá góð ráð.

Úff

Þetta er voðalega löng færsla um voðalega einfaldan hlut. Margir notendur DP hafa sagt frá því að þeim hafi langað til að leggja sitt af mörkum en ekki treyst sér í þá svaðalegu vinnu sem þeir héldu að þetta yrði. Raunin varð svo allt önnur.

Til að sýna hversu einfalt þetta er ætla ég því að birta nokkrar skjámyndir! (Smellið á litlu myndina til að fá stærri)

Listi yfir verkefni sem hægt er að prófarkalesa

Prófarkalestur á DP-int (enskt viðmót, íslensk bók eftir franskan höfund):

Prófarkalestur á DP-eu (íslenskt viðmót, frönsk bók eftir rússneskan höfund):

You may also like...