Bases de la documentación linguistica

461
Bases de la documentaci6n linguistic a

description

Este libro aporta elementos teórico metodológicos sobre como realizar la documentación de las lenguas indígenas, para quienes quieran realizar un trabajo de desarrollo de la lengua nahuatl también nos sirve, para el curso de documentación lingüística en Zongolica es importante su lectura.

Transcript of Bases de la documentación linguistica

Bases de la documentaci6n linguistic a Institut o NacionaldeLengUlls Indigenas E. Fcmando NavaL. Director General Edi t oresde la"crsioninglcsa: JOSIGippcrt NikolausHimmclmann UlrikcMosel Bases dela documentaci6n linguistica JohnB.Haviland Jose AntonioFloresFarfan Coordinadorcs de 1aversionenespai'iol Pri",,, ... cdic,oocn csraftol. 2007 Titulo orill,nal:I!ssrnhalsoflanguagc [)ocumcnlahon Edll.....s:.IoM G,ppcrt.Nikol.l ... p. IhmmclmaM y UlnlcMosel rublotado polp":;);)JU:JJopeS!lsJ;\U!unopuun:) .( Oll1l!duJP 0Sl!j"1i\)uQPCS!ISO.,\U!el op SOPUllllSaISOlulUJSSopuullal sym501op SUlJWsCISOIS\'IUCPUO!IU;)Sl}lUseJIU;)!lUIi.SCUoS!PU!SOJOPruoqcloO sns op SOl\!1Jfqo501 f.[C:>OI emllllJ CIsalopu5!lsoi\ u!SOlUIlJZOUO:lSl}lU 'sol\lIJfqoSOlopel ull fuoJu9!:le!:>o5;)uulU;)Ii.OIUO!lU!:>OUO:l [JUOopcsuq0PIlZ!UClIJO ofeqrulopUUldunIi.'soleJolSOJoPUJoqu10J 501Ii. SO[;)JIUOuQl;)lllalcu;mqmill:OJ!lsm5u!1ooum:l ;)PofuqllJlPUJSOSOI!XJSOPCI[I1S;)J J;)uolqol!icdsOlllPruJ SalOIJCJSOpli.ell B\!IBJ"dOOJU9pCPJBun JBIIO.JJ8SJP'\pup!umuoJcunJUJIUOJUaolllep: 1 sO"!PVJdsop"dsVT '(SOOlOUUIlJlse.clJcfJUUWf.f.supucucS 'JCII IlSUOJopJ:)(PPP OJJw!Jd01JnbSl!ilUJ1W"(SOOl ssn!!.l )l )(llpUn:lOpllrunu:>qo:)ciJJllOjIi.JlqCUOZUJcpco!'PUOJJUfcqcJI) PCP!lUllJulOUlOO(CpCll:);)PUPCP!I!:oclOIUCIJCJniioscUJ!ldul! opunihs01'CJOpcu!:>OJlcdcloPIi.pcp!unwoJtiS opsOlIlldlUnJ;)nb119!JCIUJUJI1:>OPuun JPOWOJ'clqul{ oppCP!UnUlOOclUOJusonl;xiSaI f.CJOld)JaIuQ!JClaIcun JPOIUCI :x!n:>oJSJopc5!ls;),\u!p;)nbu;)ii!x;);)nbUJCp!P;)WciU;)sofJ[dwo:)uos OOweJop ofcql!iluoepuscqu9!:)e8!lsJ\u!C[JP SO;)!I;JSOI!S!nOOJsOl 'uQ!JCS!IS;)\U!JP ol;);)f.rudPJCIJJJll ucazalcdouJnbutlc'uQPCUUOjU!e[oppcpo!drudcialqoss;J[UUO!:)CW>lIU! JS>l[CUO! :)cuSOPCIUJI501 opOpCUUOjU!JCISOPIT)Ii. nlUso'UQ!JCUUOjU!U[ J!punJ!pIi JCi\!lj:lJCUJcd"JIUJWlC!JO01of.SJ1CUOPCU)UQ!Jc8"PSJ.\U!JPSOS!UUOd (Lodlllv:J '}/' o!nqlJ.J/ pp SO:J!/:J!,.Jd W/:JiJdnJ.( 1J:J!1"!jl0lll/!do;) 74Arielllle M.DIIJ'er lacomunidad,establ eccr contactos,evitar prescntarsedcimproviso, trabajar en cooperacionconlacomunidadybusearfonnasde compensacion.Gran partedelapresentesecci6nseconcibi6COrllOunrecordatoriode10que debe IOrllarseencuenta antes deunainvestigaci6n de campo, 3.1.Definir loscriterios para elegirlacomunidad Haycuatrocriteriosque,demanerageneral,detenninanladccisi6ndel invcstigadorsobreellugardondevaarcalizarelIrnbajodecampoy respondenlaprcguntainicial:~ c o nquecomunidadesyvariedadlingUistica voyatrabajar? Dh'ersidad lillgiiistica y/o consen'tlcion Siselienelalibertaddeelegirlavariedadlingilislicaconlaquese vaatrnbajar,loscriterioslillgiiisticosparaclegirlapuedenser tipol6gicos(unalenguaX espococomun0representaalguninteres tipol6gico)y/odeconservacion(1avariedadpreservamuybienun estado temprano de lalengua). Condiciones politicos Algunoslugarespucdellestarabicrtos0cerradosalcquipode investigacionporrazoncsdeseguridadnaciOllal0regional.rucde serquelasautoridadeslocalespreficranquesevisitcnsoloeiertos lugares, por razones de seguridad personal0 "tcrritorialcs". " Simpliflcaci611logistica SisecstatrabajandoenlugaresremOIOS0dedificilacceso,pucde resultarpraetieolimitareltrab..1joaciertonumerodcrcgiones.Las limitacioncslogistieaspuedenobligarallingUistaaredefini rlas metas te6ricas 0 cientificas delproyccto. Condicionesinterpersolloles Esposiblequealgunasvariedadcslingil istieasyahayansido cstudiadasporuninvestigadornaciona!reconocidoquesesentiria ofell didoporlacompetenciaquepuederepresentarelinvestigador cxtranjero (veansclas condiciones politicasmencionadasantes).Por IINilosfUrleiorlarioslocalesnilosaeadCmieos eSlanexentos deser poscsivos conunlema o conunIugar. de verlo como SllIcnitorio 0feudo. Capitulo2- Etica y aspectos praclicos del rrabajo de campo75 otrolado,algunospobladosnotienenestasreservas,perocarccen del numero suficiente dehablantes capaces deprodueir elfen6meno investigado,0biencIcontactolocalquetrabajaconelequipode investigaci6n conoce mashablanles enalgunOlrolugar. 3.2.Establecer contaCIOS Hablantes nalil'OS Dctodosloscontactos,loshablantesnativossonlosmas importantes,ylamejormaneradecontaclarlosesatravesde intermediarios.CrearlascondicionesparaestoseTlcuentrosexige paciencia,porqueeslablecerunarelacioncolaborador-investigador s610esposible despuesdeunperiododeconstrucci6ndeeonfianza mutuaa lraves delosintemlcdiarios. 'l Todosloshablantesnalivossonmaestrosenpotenciaparael investigadorextemo(outside,.)ysonfundamenta lesparacualquier proyeclo deinvestigacion.Envezdebasartodalainvestigaci6nen unsolocolaborador,lamayoriadelosproyectossesirvendeun grupodehablantcsparaevitarproducir.inadvertidamente,un eSlUdiodelidiolectoparticulardeunasolapersona0unestudio exclusivamentedclhablamasculina,porejemplo. 1lTrabajarcon varios eolaboradorespennite alinvestigador aprovecharlasvcntajas queofreeecadaunoy,ademas,relacionarlosparnmetros linguisticoscondistintosparnmetrossociol inguisticos.comoeI genero,la edad, cll ugar deorigen y laslenguas habladas. Il UnaeSludianlequeeSlahaapunlodeirseahaeereIlrabajodecampodeldoctorado comc1UOasuamigaquescibapordosai\os.LaamigaIcrcspondi6queera"suficienle liempoparahaecralgunoscontactos".Enescmomento.lacSludianles610seriodel eomentDriodesuamiga.peroluegodemoslrOtenerrazOn:Ielon...omasdeunanohaecr contactos quercalmentcfucranproducti\'ospara cltrahajo dccampo y pasaronsicte ai\os antes dequelaesludianley unoolcgamdigcnapudierangrabar unafonnapartieulanncnu. ram de cancion dearnor.La eonfianza simplemcnte requierc tiempo. IlMuchas sramaticas escritas cnsocicdadcs conun alto Srado dcscgregacion scxualschan basados610enenlrevislashcchasahombres.porlaseneillaraz6ndequeelinvesligador cra hombre.Como lashablanlespuenenlener Icndenciaa eonscn'ar rasgosmas aruisuos de laleng1l3ycomoeltenguajefcmcninopuenctencrdiferenciasdiseursivosimportDntcS rcSpe 0 3/ Apr/ ZOO 5 ngaya I < mform> ngaya pro < subcat > pr o lsgnom banbal guya wl llspear banba v < subcat > vtr spear Igu suff < su beat > vlnfl Ca{Ji/1I104- L05 datos yfadOClImemacionfingiiislica133 fut ylJ suff < su bC05t > prolJg r 1sg nhungill < wgloss > h 1m < wform > yll unh05 thi s yJl u dem < su bClit > dem < / subclIt > thls nhll suff < su bC05t > prolnfl OII(( ass(away], go(toa better place]0 (tomeethis/ he,. maker], croak,CIC.;y 10mismocn espanol:'"pasaramcjorvida'",'"dcjarcstcmundo","qucbrarsc",CIC.)La formadcaprehenderladifercnciaentrelodosCSIOSlerminosnoesapart ir delascondicionesdeverdaddelestadodecosasquedcscriben (consideradasidcnticas).sinopormediodelascondicioncsapropiadasl de lascircunstanciasindexicalcsdcsuuso:quienempleacualcxpresion.anlc quicn.hablandosobrequetipodeentidadesmuenasyenquetipodc situaciones. entre olras cosas. Zgusta equiparaelproblema dellexicografo antelaconnotaci6n con Olrosrclacionadosconrangosdcsignificado,restriccionesdcselecciony cspccificidadcolocacional.UnodelosejemplosdeQuineeraaddled '"hucro", quese diec s610delos huc"os y cleerebro (veaseMcintosh1961). ' Vtasc la noo:.:iOnde '"n:glas de uS()"(mil'S oj It.Ie)en Sih'erslein (1976). 170John B.HaI'iland ZgustacitaaCernyparadospalabrnsgeorgianasquesignifiean"tener": mah's (usadopara cosas)vs.mqas (usadoparapersonasy ani males), "pcm losautom6vilesnosonconsidcrados eosas,sinoanimalcs,porqueunodice mankanamqas."tengounautom6vil"(Zgusta1971:4 4 ) . ~EIeSlUdiode Berlin( 1967)sobreeltsellaFcjemplificaunfen6menoparalelo,puesen esteidiomacxistenselSverhosquesignifican "eomer" y eadaunoseapliea adi stintostiposdecomida.Aquinosencontramoseonenredos conceptualcsquenopodemosesclarecerenestecapituloporfaltade espacio:sibienlaspalabrascondiferentesconnotacionesparecen apropiadasendiferentescontextosdeusa0paradiferemesactiludesdel hablante,l.podemosdistinguirentrerestriccionesdeselecci6ny limitacionesdedenotaci6n?TalvezmaJn.sdenotaunestadodecosas diferentede mqav$,no5610 "elmismoconcepto"aplicado a difercnles lipos deobjeto.Talvezelwe'deltsellal"comer(tortillas,porejemplo)"es rcalmcnlcUllactodiferente de k '/IX"comer (cosas crujientcs. por cjcmplo)"'. Un ejemplomascercano puedeserelverboeninglcstobe. queen espanol equivale,segunelcaso,a"ser"0"estar",dosaClosmuydiferentes,no intercambiables y aplicablesencircunslancias distinlas.Cualquieraquesea nuestrateoriasemi6tica,estasdistincionessistematicasdesignificado evidentementepertenecenallexic6ndocumemal,demodoqueregistrarlas espartedel"deber"'dellexic6grafoyunatareaalaquedebedirigirse atcnci6nmetodologica. Aqui.elproblemadelaevidencianegaliva(0,masbien,Infaltade ella enelhabla laly como ocurrenatural mente) es deimportancia crucial en Incompil aci6ndeunabasededatoslexicosparaunalenguaamenazada. LaspruebassobrelosHmilcseneIrangodesignificadodeunapalabra0 frase,0sobrelasrestriccionesdesuuso0suscondiciones defelicidaden diferenlescontextosculturaleseintertextualespuedensersimplemcnlc incxistcntesenuncorpustextualylaextraccionsislemat icadeintuicioncs Icxieogr.'ificasespecificaspucdeserimposible.Eneldiccionario deIzotzil delaColoniaaparecelaglosa"pcsareIncgocioconcordura0 diligencia" (treatamatter pntdentlyor diligem{yenLaughlin1988).paralacuallos frailcsdanunaversi6nconjugadadelaexpresi6nIzotzil:-a 'j fa-0/0111011. queeslileralmente"oir(0sentir,0emender)conelcoraz6n".Lafraseen tzolzilprecisasercompletadamorfosintacticamente,porqueelverbo transitivo - a 'j requiereunsujeto sintactico (quiensupueslamenle "pesa"el negocio)yunobjclo(ci"negocio"pesado).Adcmas,lapalabra%lllon, 6DcncucrdoconJOSIGippert,"loshablanlCSn31i\osgcorgianosconfinllanqucmqUl"Ssc aphca a cualquicr C0$3movil,scanlUIOS.biciclclas, a\iones 0 similarl:$". ' Entas obros deBerlin sc usala\ Icja onogrnfia 1zehal." Capillllo 6-La docllmentacioll del conocimiell1o lexico171 "corazon", tambicnrcquiere obligadamcntcun poscedor, quea juzgar por el idiomamodemo debe ser correferencial alsujeto delverbo, demodoque "x oyeconsupropiocorazon",noconeldealguienmas.Estasrestricciones morfosintacticasnosoncvidentesapartirdelusooriginal.Tampocoes claroquelaex presionselimitealtipodecontextorcferencialsugeridopor lasparafrasiseningles0enespanol:alcontrario,sencillamenteparece sugeri runaconsideracioncuidadosadealgo,yaseael"negocio"0algo menosespecifico0concrcto.Sinosctieneaccesoa hablantesnativoscon plenafluidez,esimposibleproporcionarmasdetalleslexicos.Mas problcmatieo--y quints mas relcvantc paraladocumentaciondeunalengua amenazada---cselcasodeunapalabra arcaiea0unaqueseusapocoenla comunidaddehabla.Unavezmas,cItzotzi lcolonialofreccunejemplo instructivo.EllenguajeritualdeltlOtzilmodemousalaexpresionIza-lIk, queobviamentesefonnaconunaraiznominal(hipolctica)Izamasun sufijosubj untivo0deirrealis- Ilk.Laughlin(1975)sugierecomoun significadoparaIzallk"takeheed"(prestar0poneratencion,hacereaso), unatradueeionsugeridaporhablantesrnodemosbieninformados.Sin embargo,demaneraalpareeer arbitraria,eneldiccionariomodemo ponela palabrabajolaraizIzak"atrapar,coger".Soloeldeseubrimientodel diccionariocolonial(Laughlin1988)revelolaraizarcaica1=0,quehabia caidocompletamcntcendesusoencltzotzilzinacanteeo,salvoporeluso ritualsobreviviente.LoslexicografosdelaColonialaregistraronconlos significadosde"habilidad,conocimicnto,destreza,intuicion,laboriosidad, inteligencia,opinion,prudcncia,pcricia,especulaeion,talenlo, pensamiento", pero enelusomodemo no se encuentranmuestras de eslo. TalvezcIcuenlomasviejodelalinguisticaantropologicaseala diversidaddedenotacionesenlascartografiaslexicasdela"realidad", captadaencIrefrandeque"laspalabrasdiferentes"impl ican"mundos diferentes".Undominioclasicoeslaelnoanatomia,ladivisionlcxica( ~ y , porende,quizasconceptual?)queseparaelcuerpoenunidadesdisc ret as. LoshablantesdeIngles0espanoldislinguen "manos" de"brazos",perono loshablanlCSderuso0detzotzi!.ElIzotziltienelaraizunicak'Ab,'que puedcquererdecir"mano"0"brazo".Esmas,tambienpuedesignificar "rama", "manga","Iravesano (deunacruz)","pata dclanlera(deungalo)", etc.EnIzotzi!,ni'"nariz",dcnotanosolonadces,sinocualquicr protuberanciarelativamcntcpuntiaguda0cIextremodclgadodecasi cualquiertipodeobjeto,nosolamente deunrostro0unacabeza.Asique, ~ p o rqueprivilcgiarlaacepcionde"partedelcucrpo",como"mano"0 'Et simbolo A denota una vocalltipotetiea que altema entre a y 0enrakes derivad3s. 172JohnB.Haviland "nari z"?Talvezestaspaninomiasinvolucrenalgunmodeloquenoes anat6mico.Olraposibilidadesqueun"significadobasico"seexticndade varias manerashaciaunacadena0unconti nuumdesignificadosderivados carentedepuntosterminalesbiendefinidos.Cruse( 1986)argumentaque Icnninoscomo"boca"enInglesparticipanenun"espectrodesent idos" (sense spec/rum) enelquecadasignifi cado "derivado" 0"metaf6rico"lIeva a otro. 2."Espectro de sent idos" (Cruse1986:71 y ss.) Johnkeeps opening andshutt inghis mOl/thlikea fish, [John abre y eierralaboca como unpcz.] This parasite attachesitself tothemOl/ths of fishes,sea-squins,etc. [Esle parnsito se adhiere a la boca delospeces, ascidias, etc.] Themouth of thesea-squirt resembles thatof a bOll Ie. [La boca de lasascidias separece a la de lasbotellas.] Them01ll1lof theenormouscavewasalsothaI of theunderground flyer. [Labocadelaenormccuevatambieneraladelrio subterrnneo. ] Lostipos deelementos significati vosqueunoescoge para unabase dedatos lexicostam bienseencuentraninexlricablementeligadosalalotalidaddel amilisiscategoria lqueunohacedclalengua,que"panesdelhabla"se postulanyquetipodeperfilessenui nticosseasocianconelias.EIelasico puntodcpartidasemant icoformal,segunelcuallossustantivos correspondenalascosas(esdeeir,aeonjuntos),losadjetivosalas "propiedades"(esdccir,asubconjulllos)ylosverbosaaeontccimientos0 estadosdecosas(predicadossobremult iplescntidades),sedesintcgra rapidamenleantelosdiversos tiposde/l/sion (conjlatioll)semantiea (Tal my 1985) quese observanconstantcmcnteenlosarticuloslexicos.Unejemplo comuneselinglesclimb"escalar,ascender,trepar",euyadefinicionenel silio delproyectoFrameNel9 es/0movevertically its/wily upwards,IIsllolly witheffort("moverseverticalmente,por10generalhaciaarribaycon esfuerzo").Esloes,elverbosugiere,pordefault,unmovimientovertical ascendcnteacompanadoporellipodeesfuerzoqueFillmorellama clambering"treparagatas,encaramarse,galear".Cualquieradeestos elementosfusionados- movimicntoascendenle0esfuerzo--puede suspendcrse sincausar una anomalia semantiea, pero noambos: 9Vcaschllp: llframcnct.icsLbcrkclcy.cdulindcx.phpy clapartado 3 paginas adclanlc. Capitulo 6-La docllmeJ1laciondel cOllocimielllOlexico173 3.Fusi6n cn climb (Fillmore1982) Thcsnakeclimbed(up)thetree.[movimicntoascendente+ esfucrzo] Themonkeyclimbed(up/down)thctrec.[movimiento asccndente + esfucrzo/ s610esfuerzo] l.?Thesnake climbed downthetree.[ninguno delos dos] OtropresupuestocomundelalingOisticaantropol6gicaesquelosidiomas combinandominiossemanticosenformasinesperadas,qUiZ3Sdcmancra mascaracteristicaenlosverbos.Porejemplo,lossiguicntespredicados posicionales deltzotzi l podriantodosreeibir lami smaglosa,yasea stuck en ingles 0 "atorado" en espailo1. 4.Palabras ent:wt zilpara "atorado" Kakal"atorado (entre dossuperficies)" CII ikil'"alorado (cnunagrictacstrccha 0 aprctada)" Katz al'"alorado (cnun orificio enformadcmandibula)"' Xojol"alorado (cnun agujcrocerrado)" Tz apal'"alorado(unobjetopuntiagudoancladocnuna superficie)" Sinembargo,comomuestranlasacepcionesdetalladas,cadapalabra cspecificadiferenlesconfiguraciones,distintasmancrasdeestaratoradoy difcrentcsfonnastantoparaelobjeloatoradocomoparaclsuelo0lugar donde esta atorado. 1OLafusi6nexacta implica,me parece,factores como los siguicnles,silomamos laraiz rz'apcomo ejemplo: 5.Fusi6n entz 'ap a.el"cxtremo" delobjcto csta "dcnlro" dclStlelo; IOElinglcsliencdifercneiasimere$amesensusc1aboraeiones.eomopucdeverseenlas entradasquearrojaFrameNelparalx-ing_lIIwched('cslar_unido"):affixed.ancllored. al/aclled.Ix>lted.OOllnd,chainell.J a ~ l e l l e d ,Jused.gilled.handcllffed.lashed.mllnacled. mQQri6ndelTemayquepro\"oca quepase a estar enposesi6n delReceptor). 182Joh" B.Havila"d 1O.Diagnostico de diatesis aplicado a diferentesverbos (basado en Levin1993:6) touchhitcutbreak CONAT1VO:NoSiSiNo ASC.DE POSEEDORDEPARTE CORPORAL: MEDlO: 5i No 5i No 5i 5i 4. La cxtraecion sistematica dc- bases dedatos lexicas No 5i DespllCsdequesehandocument adolasestruclurasbasieasdeuna gramaticayrcunidounampliocorpus detextos,i,c6mosesuplementanlos ejemploselicitados y lasmuestras de usosct1aladas enlos textospamlograr unacompilacionsistematicadelcOllocimientolexico?Laglosailllcriineal deuncorpusgrandeplledcuS.1l-semecallicamenteparagenemrunalisla eslruclumdadepaJabras,cuyapcrspicaciaanalilicaestitenproporcion direclaconelcuidadoylaconsistenciadelcompiladoreneletiquetado morfologicoysemanticoduranteelprocedimienlodeglosa.Diversas hcrramientascomputacionalescont ribuyenalaextraccionlexicadelos corpora detextos,nosolamenteherramientasdiseiiadasespedalmentepara bases de datoslinguisticas,como Shoeboxffoolbox dellnstitutoLi nguistico deVerano,sinotambicnherramientastantogeneralescomo especializadas deconcordancia(escritas,porejcmplo,comoshellscriptsdeun ix0con lenguajes de progmmacioncomo PERL 0 ICON). '4 Otrastccnicascomputacionalestambicnpuedenayudarac1icilar lexemas deunidioma,aprovechandolospatroncsfonologieosregularcs.Un ejemplobieneonocidoesclmetododeTerryKaufmanpamgenerarlislas exhaustivasde"raices pOlenciales"enlenguasmayensesapanir delcanon elimologico mayaeve 0 algunavariantesenci l1 a derivada deesc canon.La Tabla2 muestraunpequenoprogmmadeleonqueeomienzaconlodaslas consonantesylasvocalesdelidiomamayensctsehalyproduceunali sta completadetodaslaspermutacionesdelaformaeV(:)(j)c.11 Elprogmma arroja8 820raicespotenciales(enlaTabla3aparecenlasprimerasdelas quecomienzanconb).Cadaunadeel1aspuedccotejarseexhaustivamentc (yeXlcnuantemente)conloshablanlesnalivosparavcrqucformas "VisiIChnp: llwww.cs.arizona.eduliconl. II EIprogramasimbolizalascon son amesglm.alizadas0cyC(;livasylasvocalcslargascon letras mayusculas. y sc usauna0 para s c ~ a l a rla auscncia delaj medial. Capiwlo 6- La docllmelllacion del conocimiento lexico183 realmentearrojanitemslexieosreeonocibles(muchoshablantesdelenguas mayensesyolrasconfonotaelicasigualmenledircetashansidosometidos cncl transeurso de losailos a esta abrumadoratareamental). Tab/a2.Ensalada dc ralces tseltales.enc1lenguaje programador deIcon ..inl) C,." bcCjkKhmpPntTvxyzZ' v,."aAeEiloOuU M,.'OJ" I!I} .0' every(CI,.I C)doI every(vi,.IV)doI every(ml,.IM)do everyIc2, .IC)do{ root, .clllvillmlllc2

Tab/a3.Lasprimcras raices tseltales posiblesque eomienzan eonb ba- babbachbach'bajbakbak'balbambanbapbap'baabatbat'baw baxbaybaubau'baj'bajbbajchbajch'bajjbajkbajk'bajlbajllbajn bajpbajp'bajrbajabajtbajt'bajwbaj xbajybajtabaju'baa'bub b ..ch_.etc. Laslislasdepalabrasgeneradasdemaneramecanieainevitablemente revelaranareasquerequiercnmayortrabajolexieografieo- porejcmplo, fraseslexical izadas,paradigmasdcfinidossinlagmalicamente,elementos "funeionales"vs."lexicos"0particulas-y generalmenlelambienhacen evidenleseicrtosdominioslexicosespecialmenlecomplejosquevalela penaexplorarmasafondo.Porolrapartc,eSlosdominiospucdenno emergerdelagunasobvias0algunahiperlrofiaenlosconjunloslexieos gencrados a partir delas eoleeeiones de lextos 0 liSlasdepalabras el icitadas, sinoquepuedenaparecercifradosenlaspraclicaseomunicalivasdeuna comunidaddehabla:porunlado,estanlosjuiciosestClicossobrec1 di scurso"bell o"0 "elocuente"-o bien"feo" 0 "Iorpc"- losliposdchabla especialmentemarcadosy evaluados0biengeneros0 ejccucionesverbales cspeeializados,entre OITOS,y,por OI TO lado,las"preocupaciones" cullurales porlaexpresionlexicaasoeiada,quesemanifieslanenlosvocabularios espccializadosparadiferenlesprofesiones,actividadesuolrolipode inlereses,0bienlainsisteneiaen"encontrarlapalabraadccuada"0enla expresi6n "corrccta" y "precisa". Lamayoriadelosmelodosdcelicilaci6nlexicason,parabien0 paramal,"extensionales" y "refercneiales",esdeeir,basieamcnte consisten enpresentarejemplaresdecosas0siluacionesencImundoantelos hablantesnativosyprcguntarcualessonlascxpresioneslinguisticas 184JollII B.I-Itn'ilcmd adecuadasquepuedenusarsepararefcrirscaellas0earacterizarlas.Este metodotalvezseaineludibleparaladocumentacionlexicaenunprimer nivel.perodejasinrespuestapreguntasmuydificilessobrelaintensionde laspalabras:10queenrcal idadsignifican,quedistincionesdesignificado codifican,quetipoderelacionesdesignificadocstableccnconotras palabrasyexpresiones,ynosolamcnteaqueestadodecosaspueden referirseverdadcramentecuando seemp1can.Estastccnicasdeelicitaciona menudosonigualmenteintitilesparacaptaraspectosnoreferencialesdel significado,comolosregistrosdecortesia,losusosycontextos especializadosyOtTOSsimilarcs.Estascuestioncspueden- yquizas deben-dejarsedeIndoenlasprimeras ctapas deconstrucciondebasesde datoslexicosenladocumentaci6nlinguistica,peronopuedcnpasnrse etemamentcpor alto. Presentounsolocjemplodemipropiotrabajodecampoconel guuguyimi thirr. Muy pronto aprendique enesta Icngualapalabra coloquial lI{lmbalsignifica"piedra",pcroquetambienseextiendeparasignificar "dinero".MiprincipalmaeSirO(ypadresocial)delacomunidad,queen algunasocasionesrecibiadeIllidincroprestado,amenudousaba(0me susurraba)otrapalabracuandoqueriareferirsealdinero:w(lmbllg(lll.Sin embargo,I\ambllgallesenrealidadunequivalenteconesdelapnlabra comlLlllIambalencIvocabulariorespetuoso,obli gatorioalhablarconlos pnrientespoliticosy queenInbibliografiapublicada sell ama"1cnguajedel cunado" (bralher-in-Iaw language;Haviland1979).EIrangodenotativode wambllganesdchcchountantonuisamplioquecldenall/ba/:incluye piedras(entreellas,laspiedrasdemoler,quetienennombresespeciales,el cuarlOyotrasquenonnalmentenoselIamanlIambaf)ydinero. Crucialmenteesunapalabraexageradamente cortes,queyanoseusaenel Hopevalemodemoconlospariemespoliticosyquedehechotampocoes ampliamentecOllocida;s610lausanunoscuantosanciallos,entrequienes siguecomponandountonoeufemisticoderespeto.Ambosfactoresse combi nanparahacer dewlImbugllllunapalabraenc6digoperfectaparaun asuntoembarazoso,comopcdirleunprestamoatuhijoadoplivoy discipulo. Porahoradejarcmosdeladoestasdificultadcsparaconsiderar algunastecnicasquesuplementanlainfomlacionlexicaazarosamente reunidamedianteelrcvenimientomecanicodeloscorporatextuales. Obviamente,eltrucoeslaelicitacionsistematicapeTOcontrolada, prcscntando0simulando anteloshablantesnativosaspectosdeInrealidad "extema",paraestimularlosausarpalabras0expresionesquerepresentan estndosde eosasqueaunnohanocurrido ennuestrapresencia.Demodoun Capilulo6- Ladocumenlacion del collocimielllO lexico185 tantoartifi cial,dividilosmctodosdemuestreosegunlosaspectosdela "reaUdad"quepretendensimular:hechos"natura[es",institueiones soeioeu[turalesy,enlasuhimasseceiones,hechosde(inter)acd6ny construccionideol6gica sobre elidiom a y la sodedad. 4.1."La Naluraleza" Latradici6nenla[ingUfsticaantropol6gica,Ilamadaindistinlamente "semallticaet ll ogmfica"'0"etnocienda",pretendedesplcgarel conoci mi ento cuhuralmente espceifieo sobreelmundonaturaldelal1andola semanti ea de los dominiosIcxieosreladonados conlosfen6menosnat urales correspandientes:lasplantasmedicinalesenhanunoo,[ascategorias tsehalesparalalena,laelnobotanica0etnozoologia,laspartesdeunacasa odelcuerpo,laslaxonomiasdelasenfermcdades,latecnologialocal,elc. Unejemp[oclasicodelgeneroese[exhauslivoeSludiodeBerlin(1968) sobrelos elasificadores Ilumeralcs delIschal,undelalladocompendio delos varioseientosdeelasifieadoresquealgunavezfueronobligatoriosenlas expresionesnumeralesdeltsellaldeTcnejapa.Los elasifieadores numcrales espccifieanlasunidadescOlllablesdediferentestipasdesuslaneias,a mcnudobasandoseenlaforma.ParanueSlrospropositos,[acaraeterislica notabledeleSludiodeBerlineselusodefOlografiascuidadosamente elaboradasyusadasalavczcomoestimu[os(esdecir,paraelidlarenlos hablanteslasexpresionesnumeralesdelIsehal)ycomovehiculode representaci6nmetasemtintica,puesacompananeiluslranla earaeterizaci6n verbaldelasfonnastseltaleselicitadas.(Berlinlambicnus6cl procedimienlomecanicodeKaufmanparagencrarralcespoteneialesde clasificadores numerales,comoyasedeseribi6paginasatras).Paradaruna ideade[aespecificidadseln o Iitz' in I .... 6.. hombre Pi'"eI Ego mlscl.flino D U !banki l! Figllr(l 6.Tcrminosdel1z01/.ilpamloshcrmanos 190JohnB.HaI'iland Sinembargo,como10muestrae1debatecUisico,el"algebra"ylos diagramasdeparenteseoocultanunproblemacentralenladocumcntacion delconocimiClltolexicoantesmcncionado:latensionentreloslIamados metalenguajes"eticos"ylascategorias"cmicas".Eneualquierlengua,es plausibleponereneuestionsilostcrrninossupuestamenteuniversalcspara caracterizar unarclaciondcparcntcsco cnparticular (cnIcrminos,digamos, degenero,generacionylinaje,0contcrminosderelacionpresuntamente primitivos,comoF[atherJ.padre,M(otherJ,madre,H[usband],esposo, W[ife],esposa,0consimbolos algebraicoscomo +, - , ~ ,0) hacenjusticia alsignificado deunterminonaturaldelidioma0deunarclacioncspecifica entredosindividuos.Efectivamente,ensociedadesquemueslranuna evidentcobsesionconelparentescoysuterminologia(porejemplo,las comunidadesaborigenesaustralianasenlasquehetrabajado),unarea centraldedisputasyaltercadosconceptualessue1eserprecisamentecomo asignarlaetiquetalexicaadecuadaaunarelacion0comoexplicar10que implicaunarelacion dClcrminada quese designaconuntcnninopreciso.Mi principalmaeslrodeguuguyimithirr,por ejemplo,acoslUmbrabasenalamle a unpariente queibapasandoy ded,,:"a esc10tienes queHamarX,porque supadrefueluW,peroresultaquevi noysecasoconluY, cnlonccs,i,en queseconvirti6?,i,enIUZ?"Nosololarelaci6ngeneal6gicaent redos individuosdcterminacualpuedescrelterminodeparClllescopcrtinente, puescstepuedeserconsecueneiadefaetorcsconsiderablcmentemas complejossobrequeaspectosdelare1aci6nsonlosrmissobresalientes.En elZinacantanmoderno,haycasosenqueunarelacionritualde compadrazgo (entrelospadresy padrinos deunninorecicnbautizado,por ejemplo)puedcdehecho anteponcrse aunarelaci6ngcncal6gicainmediata: loshennanosquesevuelvencompadrcspuedendcjardeinterpelarseen tcrminos de hem13nos. Paralosfinesdeunadocumcnlnci6nsistematica,estcdominio ilustradenuevacuentalatcnsionentreun"corpus"deejcmplosyla elicitaeionsistematica deinformacion.Ningunaredparticular derclaciones genealogicaslsocinlesrealesysusdistincionesterminologicns correspondientespucdeaspiraracaplarlasistematicidaddelcomplejo tenninologico-conceptualtotal.Tampocoexisteunmetalenguaje extensional(comolagencaloginprimitivadelalgebradeparenteseo)que gnranlieequetodaslasvariablessocialmentesignificativasemerjandela clieitacionmcc:inica.Unabasededatoslexicosadecuadadebecombinar ambostipos deinformacion. Capiwlo 6-a dOCllmetllacioll del cOllocimielllo texico191 4.3.Larealidad pragmatica Enlabibliografiarecientesedificultaaunmasencontrarmetodospara enriquecerunabasededatoslexicosdemaneraqueincluyaelusode unidadeslingOisticasindcxicalesinextricablementeuni dasalcontexto. Cualquier comportamientolingOisticoeSla.por supuesto,ligadoalcontexto yunidoalaacci6n,peroalgunosdelosarticuloslexicosmasdificilesde tratarsue lentenervinculosillherenlesasuentornoindexical:los pronombresyotrosdeicticossonlosejemplosmasobvios,puesinclusive susreferentes(aquienesescogen)debenregislmrschaciendoreferenciaa loscontextosenqueseusan.Loscstudiossobreestosdominioslexicos sugicrenqueelunicoenfoquepn:icticoparadescribirdichaspartesdel lexicoesuntipodetrabajodecampodeobservaci6nexhaustiva.Deeste modo,Hanks(1990)ofreceundelalladoanalisisdelsistemadc demostrativosdelmayayucatecobasadoenunextensotrabajodecampo, enelqueregistr6detalladamentedande ocurriandemaneraespontanealos dcicticos,induciendodelcorpusydelasfonnaslingiiisticaslos componentestearicosparapresentarunaexplicacianadecuadadela pr{lctiea deictica. Otrodominioilust rativo eseldelasexelamaciones e interjecciones. EIampliotrabajohechoporKockelmanconlasinterjeccionesenq'eq'chi (Kockelman2003)requiri6unametodologiade campomuysimilaralade I-b nks.Elautorregistrasistematicamentelascircunstanciasenquelas enunciacionescategorizadascomointerjeccionesocurrianenuna comunidaddehablaq'eq'chienGuatemala.Basandoseenestecorpus elabor6unatcoriadelasintcrjeccionesquevamuchomasaliadelmodelo generalmcnte aceptado dequesucaracter es "expresivo" (parte deunaviej a tradicioneneIpensamientolingUisticooccidentalqueseremontahastalos gramaticoslatinos),parapasaraconsiderarlaspropiedadesindexicales bidireccionalesymultiplesdeestasexpresiones:manifiestanactitudes emotivasy afccli vas,invitanexplicitamente a losinterlocutoresa expresar a suvezlassuyas,conminanaactuar,etc.Losestudiosdeestaindole sugierenquehaypocos atajospamproducirunaexplicaci6n adecuadade10 quesignificanestoselementoslingOisticosconcargapragmtitica,yqueel trabaj o de campo etnogrMicoextensivoes,por10tanto,parteesencialdela lcxicografia de campo. Lomismopuededecirsedeunvocabulariomasprosaico,dcsdelas partesdelcuerpocomuncsycorrienteshastalosregistrosespccialtnente marcadoscomo cortesesy descorteses,como enc1lenguajeparabromear y maldecir.Yahemencionadolas complejidades lexicasresidualcs generadas 192JohnB.flori/and enguuguyimithirrporelusoaltemadodelasfommsrespct uosasyel "vocabulariodelcunado";estascomplejidadessolosemult iplicancuando losdiversosregislrosdelhablaestablecidosseencuent ranenusoactivoen unacomunidaddehabla.Las descripcionesantropol6gicas elasicasde estos fenomenosdanfedelasutilezaylosmat icestransmitidosporlaelecci6n estrategicaentrefonnaslexicasalternativasensociedadesdelaAustralia aborigen,deSamoaytambiendeBali(Duranti1992;Errington1984; Geertz1960),0 entreterminosparainlerpelar aalguienylospronombres personalesdesdeEuropahastaJap6n(BrownyGilman1960).Laughlin (1975)proponeunaseriedeetiquetasparadistinguireneItzotzil zinacantecocosascomo "hablaritual,hablaparabromear,habla masculina y femcnina,habladelosbebes,hablacortes,reganos,habla paradenunciar, [palabras]areaieas",etc.Masalta.desi cllexicografo decampopuede0no proporeiollarunaexplicacionexhaustivadeestoshechosparaunabasede datoslexicoscompleta,esimportanteeonocerlostiposdecategorias metalingiiisticasdelhablaquepodrianserrelevantesenlapropia comunidaddehabla. Por razones que saltan a lavista,lainvestigacion sistematica detales generos- por ejemplo,delhabla tabu-puederesultardificilparapersonas si n experiencia eneItrabajo de campo.Igualmente dificiles sonlossistemas completosdetroposlingiiisticos quea vecesdominanpartes delosrecursos expresivosdeunidioma.Unavezmas,elunicoremediopareceserun espectrodeamplioaleanceyunaaleneionetnograficasistemat ica.Los siguientessondosejemplosdemipropiotTabajodecampo.Cuando estaba aprendiendoguuguyimi lhirr, adverti quemuchasexpresiones coneemientes a inclinacioneshumanasy "estados interiores" eranmetMorastransparentes basadasenunpequenoconjuntodepalabrasquesimplementepareeian Il ombrarpartesdelcuerpo.Independientementedequeestasexpresiones representen-como enciertasocasioneshansugerido[osantrop6logos- ya seaunateoriaimpliciladeladislribueionanat6micadelasemoeionesy las facultadesmentales(10quepodriaaducirseconexprcsioneseningles0 espanolcomohard-headed"cabezadura"0hard-heo/"fed"coraz6nde piedra")0bienexpresionesopacasconvertidas enconvencionesculturales (como podriamosaducir eneIcaso de green-thumb y lily-liwred eningles 0 "manodura"y"sangrepesada"ennocabiadudadequeel MLacllprcsi6n greell/hllmb,litcmlmcnlc "'pulgar vcrdc", quc sc usapamrcfcrirsc a alguicn qucticnc"bucnamano"paralajardillcria.parcccnosercxctusivadetingles.puesen italiallOscdiccpollice'"{'rde(scgimElenaCoHavin)ycnalcmangriillt'r DallmclI(scgun NikolausItimmclnmlln).Encuantoa lily-li"ercd CQbardc"'.titcralmcntc"higado delirio"'. hayunac.xprcsion cnitaliano que sugierc elmismo significado: sCl1za!cgalO "sinhigado". Capitulo6-La docwl1enlaciim del COl1ocimiel11Otexico193 guuguyimithirrteniaunsistemasemiproductivoparagcnerardiversas expresionesapartirdetroposcon"partesdelcuerpo".EI ejemploIIesta basadoenlapalabra/IIiit,"ojo",enguuguyimithirr.Launicafonnaque leniaparadocumentarelsistemaeraparar[aoreja(poTdceirloasi)para atraparexpresionesrclevantesenlaconversaciony tratarsistematicamente deforzarnuevascombinacionesdepartesdeleuerpoconadjetivosy verbos,[0que genera[meme producia mascarcajadasquenuevoslexemas. II.Expresiones en guugu yimithirr basadas enmiil "ojo" mi ilgu mi il wamggu miilnhin-gal miilbiyal mi il ngamba miilwaarril miilbagal miilbathibay =(I iI.,ojo + sufijoENFATICO) despieno = (lit."ojo donnir") somnolienlo = (iiI., "ojo scntar")vigilar, mantenerse atento a algo = (li t. , ojo tendon) quemira todo eltiempo =(lit.ojodcseuidado)distraldo.quecierralosojos ante algo =(lit. ,ojovolar)marearse,enloquecer.desmayarse, emborracharsel l = (lit. , ojo piear) enganar, embauear,ponerse celoso =(lit.,ojohueso)devistaaguda,quesiemprcmira insistentelllente miilbiinii=(lit. , ojo morir) quedarse eiego miilgulnggul= (lit. , ojo pcsado) somnolienlo miilgunhin-gal=(li t. ,ojo+ sufijoENFATICOsentar)mantenerse despierto .. Considcreselambicnellenguajedeltzotzilritual(Gossen1974,1985; Haviland1987,1996,2000).Encontextosquevandesdeelrezoyla cancionhastaladenunciafonnal,loshablamesdetzotzildejandeladoel lexico ylagrarml.ticacomunesy recurrenaunesti lo di scursivosumamente estrueturadoconlineasparalelasquedifierenporunasolapaJabra0frase. Est aslineasparalclasseinterprelanentcrminosdeunaimagenestandar "estereosc6pica"(Fox1977),invocadaporlosdoblclesexpresivos.As!, pararcferirsealcuerpopuedenusarsediferentesdoblclCS,segunel eonlexlO.Unoessumamenteliteralyempleapal,xokoll"dorso,costado" comounamctonimiaparacItodo.Otrocseonsiderablementemasopacoy sugiereunaimagendehumildad,como enelsiguienteextraetodeunrezo 21 AqufpasoporaltocucsrionessinracricasMsicas.POT ejemplo,enlaexpresionmiil 'Wlllrril,13palabra mii''"ojo'' cs el sujelO sinracrieo de,,"uarril'"volar".mienrras que enmiil hugo/.miil es cl QbjelOsinracrico de haglll"picar". 194Johl/B.Havi/ond curativo,cnclqueeldobleteIlimol,ach elo/ht ierra, barro"(ambosconun posesivo) se TefieTealcuerpo 0 alyodelpaciente.l1 12.DeunTezocurativo zi nacanteco ja' metajmala lalumale espero tuticrra ta jmala lavach'elale espeTOtubarro Otro ejemplo es eIdoblcte delhabl a ri tualzinacanteca parareferirse all icor, xiobi/,skexobil,lit eral mente"causadelemor, causadevergiienza".Estas expresiollescompanen caracteristicas can eleuremi smo,quesiempre es un fe nomenoproblematicoenlalexicografi ayexigeuncuidadosotrabajode campo et nografi co. Laelicitacionsistematicarevelapocosobreelsistemageneralde imagi neriaenellenguajeri tual ,aunqueespaneesencialdelpoder expresivodelidioma.EldiccionariodeLaughlindeltzotzilzi naeanteeo modemoanotaeiluslrapalabrasquefonnanpanedeconstrucciones paralclasbajoclencabezadohhablaritual".Enmipropiotrabajo,mehe apoyadoenelregistro exhaustivoylatrascripeion deTezosyot rosgeneros que empleanclparalelismo para expandirlalista delos dobletes. 5. Conclusion i..Cuandolenninaladocumcntaciondellexico?SibieneIlexiconesun dep6sitopara10excepcionaly10ca6ticodelidioma, tambienesunamina deconsiderableregularidady produclividad.Sinembargo,loslexic6grafos decampo comoLaughlincxpresansusdudassobrequeIanest ruclurado0 generali zado esta elconocimienlolexico encualquicTcomunidaddehabla, ybusasuescepticismoensusexperienciasdeelicitaci6ntantocon campesi noszi nacantecoscomoconeSludiantesuniversitariosde WashingtonD.C.Notablemente dificilaun paralosidiomasbienestudiados esladistinci6nentre losusos "Iiterales" y losusos "figurados"0tr6picos de las palabras:loshabl antesmas viejos deltWlzildeseribenlosavionescomo xII/emk 'ok,literalmente(comonosotrosdecimos)"fuegodebuitre"0los ~ lEnettzotzildelvednolamlinzar.eldoblctcritualcquivalentcesalavezhumildey litml:(Jehdo/.wkopalcl \)arro, clcucrpo. Capiwlo 6--La docllmentaci6n del cOllocimielllO/exico195 lelefonoscomoch 'ojoll10k 'j"."alambredemetar',ysoportanlasri sillas burlonasdeloshablantesmasj6vcnes (queencambiousanscncillamenlc unpreslamo delespanol).Mas dincil almes dislinguir unapoliscmia oscura deunasi mpl e(perofonnalmentedesabrida)homonimia.EIdiccionario Izolzi ldeLaughlinplanteadosrakeshom6nimas.j a y(2)- unaraiz posicionalquesignifica"panza(0boca)arriba"- y jay(I)- unarai zde verbotransiti voquesignifi ea"cortarendos"- porqueambossigni ficados pareccn10bastantedi vergentesparaavalarentradasindcpendientes.Sin embargo,laetimologiapopular delzinacanteco conjuraunaimagensuci nta que rclacionalos dos scntidos:cuando scparte endos un arbol.por ejemplo (aeci6nesprcsadaporunverbobasadoenjav (I,lasdosmitadescaen "panl"uarriba"Uav(2.Aquitenemosentoneesuncasodepolisemia encubierta,:tI0quizasdeIllonoscmiasubyacentedeunasolaraizcon difercntesdisfracesgramaticales.Estosfen6menospuedenpennanecersin trabajarsca 10largo de todo unproyecto de documentaci6n lexica. Asi mi smo,l.hastad6ndedebeellexic6grafoincluir10quepuede eatalogarsecomo"usoerr6neo",esdecir,palabrasmalemplcadas. juegos depalabras0palabrasinventadasparalaocasion?Zgusta(1 971 :5657) di stinguelosusos"sistemi cos"delos"ocasionales".Unautorpuedeusar "atadura"envezde"matrimonio"sinporclioeambiarelsignifi cado sislcmicodeningunadelasdospalabras.En1970, durantevari assemanas desesionesdecharlaslujuriosas.loshombresdeZi nacantfmacunaron10 queeneseli emporcsul1abauncufemismosexualde10mascreativoen tzotzilusando eIprestamo illyeksyolldelespanol"inyecci6n",enunaepoca enquelasinyeceioneshipodcnnieastodaviaeranalgorelativamcnte novedosotraidodefuera.AlgunosdeestoshombressiguenusandoeI tcrminoenbroma,casicuarentaaoosdespues.LapalabranoeSlaenel diecionario tzotzildeLaughlin. pero QUi Z3Stendria que estar. Porultimo,lascuesti onesyameneionadassobreobjetivosy usuarios- l.paraquienesseproduceunabasededatosIb:i cos'?,i.,tlque prop6sitos5eprestani?- complkanlas decisionessobre quepalabras deben documentarse y dequemodo.Losproblemas son especialmenlefastidiosos cuandounabasededatoslexicospuedeservirdebasep.1rala estandarizacion0estabilizaei6nlingllisliea,especialmcnleenfom\adeun diccionariopublicado.2'CuandolagenIepuedeusarundiecionariopara busearunapalabra,paravcr c6rnosc escribe0paraleerunadefinici6n.sc alterairrevocablementelaautoridaddelacomunidad dehablasobreel uso 2' Vcascladiscusi6nsobrcpoliscminenZgllsla(1971:77yss.):IcansclambicnEvansy Wilkills (2000. 2001).Evans (1992). :'Vcasc ladiscusi6n de JaneHill sobrc elproycclo de diecionario delhopien cIcapfmlo 5. 196101mB.Haviland "correcIO".Cuanto debeincluirse enInbase de datoslexicos de unproyeclO dedoeumenlaciondeunidiomaesunaeuesti6nquenoselimitaala "exhaustividad"nitampocoesunacuestionde"cobenura";tambien implicadecisioncsideologicasquepucdentenerefectos delargoalcancecn elfulurodeun idioma. Const ruirunabasededatosIcxicosesunapaneespcradade cualquicrproyeclodedocumentaci6n,yqllizaslatareaanalitieamas exigentedetodas,afinalde cucnlas.PucdcapoyarsecnIccnicasmccanicas aplicadasa corporatextualcsyenelconoeimientoprofundodelasgrandes tradicioneslexicogrMicas,queyahanli diadoconlamayoriadelos problemasalosqueseenfrentaquienhaceITabajodecampo:unidades lexicas,lanaturalezadelsignificado.lasvaguedadesdelusoy.finalmente, lasideologias delidiomay la vidasoeial.EIproductofi nalesesencial,pero producirlodependetantodelainspiraeioncomodeltrabajoelnografico minucioso,ytantodelaelicitacioncomodeloshallazgosafortunados. Invariablemente, (re)descubrimos que cltTabajohecho IIlll1caesSll fieientey que cuando ponemos unalto y declaramos cerradalabase de datos,solo nos detenemos a descansar enunlugar cualquiera deunlargo camino. Agradecimi cnt os ESICcapitulo,quesebasacnterminosgeneralesenlaeonfcrencia prcsentadaenlaeseueladcveranodelprogramaDoBeS(Frankfun, septiembrede2004),lieneunafuenedeudaconlasexperienciasde lexicografia compartidas conmismaestros detzolzily guuguyimithirr, con loscomentariosdeNikolausHimrne!mannyJostGippenyconla hospital idad deElena,Renato y Lisetla Collavin durantelaredaccionfinal. Capitulo 7 Laprosodia enladocumentaci6nlinguistica Nikolaus P.Himmelmann Introduccion Losaspectospros6dicos deunmcnsaje linguislico, comolacntonaci6ny cl aecnlolexico,son elementos cscncialcsde su cstruclum (omla!.A lafccha, 10escll eial delanal isis delosrasgosprosOdicostodav!anoschaconvertido enparteintegraldelacapaci laci6nentrabajodecampoiinguislicoy,por consiguicntc,una documcntaci6ny dcscri pci6nrazonablcmcntc dctalladay ampliadelosmi smostodav!anofonllapartedelaspracticas cstandarcsen cllrabajodecampoli ngil istico.Estccapi tuloabordacspcci ficarncntcla dOClIIl1elllaciollderasgospros6dicos,CSIOes,lacuesti6ndequeclasede dutoslicnequeconlcncrunadocumcntaci6nlingui sticaparaquescpueda rcalizarunanal isispros6dico 10mascompletoposible.Pam aprovecharlas sugerenciasanalizadasenestecapi tulo,esnecesariounentendimiento basico delasunidades yprocedimientosusados encIanal isispros6dico.Si se desearevisaruna introducci6nmas amplia al trabajo de campo pros6dico centradoencuestioncsdeanal isisydescripci 6n,veaseHimmclmanny Ladd (en prensa). Dadoqueunadocumentaci6nlingtiisticaincluyeungrancorpusde grabacionesdeeventoscomunicativosdedifcrentcstipos,bienpuede ctlcSlionarsesiexistealgunaneeesidaddeprestaratcll ci61lespccialala prosodiacuandosecompiladichadocumentaci6n.Sicmprequelas grabacionesseandecalidadaceptabl e, 'nohaydudadequeuncorpus semejant epuedc usarsc para analizarlaprosodiainclusocuando no sehaya prestadoatcnci6nparticular alosrasgospros6dicosalcompi lar elcorpus.2 1Los rasgos que definrnuna buena grabaci6n SCC1IIiSlanenelapanado 2. 1 delcapitulo 4. lEjemplos deto que puede haeerse-y de10que no puedc haeerse--en lenninos de amllisis pros6dioos610apartirdeuncorpusdegrdbacionessceneuenlmnenlastesissabre10 cnlonaciondeldyirbalydelbi ninjgun-wokdeKing(1994)yBishop(2002), 198Nikolaus P.Himmeimallll Sin cmbargo, cxistcncsencia[mentc Ires razonesparaprestar cierta atencion especialalosrasgosprosodicoscuandosecompilauncorpusdedatos printarios, demodo queresu[ le rea[mente uli [ para losfinespros6dicos: I)Losfenomenospros6dicossonbastantevariablesysensiblesalas influenciascontextuales.Estodificu[taelreconocimientode patronesdistintivosbasicos,perosepuedecompensarsisetiene[a mismaenuneiaeionpronunciadaparvarioshab[anlesdistintos(0a[ menosmU[lip[esversioncs delamismaenunciaeion).Veaseademas elapartado 2. 2)Laspa[abraspronunciadas aisladamenleson emmeiaciones minimas quemateriali zane[ementoslantolexicos como denivcl enunciativo (post-lexicos).Porconsiguiente,ladifundidapractieadegrabar palabrasaisladas(1istasdepalabras)esdeli sa[imiladopara proposi los prosodicos.Vease adcmas elapartado 3. 3)Losdatosactisticosyaudit ivos(esdeeir,lasgrabacionesde enunciacionesesponlaneas0elieitadas)noproporeionanevideneia direetaenrelaeionconlapercepeiondeloshablantesnativos.es decir,10quecstosdeheehopereibencomocontrastesprosodicos relevantes(aunqueeImaterialconversacionalpuedeproporcionar evidenciaindireeta;veasemasadelante).Lamaneramas direetade obtener datos depercepcion esrealizarexperimcnlos depcrcepcion, como se analiza deformamas ampli a ene[apartado 5. Antes dedesarrollar estos puntos.elapartadoI explica eonunpocomasde detalleaqueseTefiereaquielterminoprosodia.Aden1MODALIDADESEPISTEMlCAS IntcIntagil:nombredeunaantiguaaldeanahukwa. \trs \e. Ites Inte \tn \eo Itea Inec Kalusilleg6a delasaldeasnahukwa situadasa10largodelrioCurisevobasta principiosdelsigleXX.Lasaldeasmencionadas enestasesi6nsonlasqueexistianen101epoea deSeeinen.VERELMAPA XuhikuguimunhigeLahatuaimunhige inthedirectionofXuhikugu,inthedirectionof LahuatA haciaXuhikugu,haciaLahuata Kuhikugu:101primeraaldeakuikuro,fundada despuesdequenumerosasfamiliassalierondel complejodealdeasOti,quesecreeestuvieron habitadasporlosuagihiltil(matipil) .VERSESI6N "KUKOPOGIPUGUH (LAAPARICI6NDELPUEBLOKUIKURO). Lahuata;aldeakuikuroyaestablecidaenelsiglo XXyhabitadabastalosanoscincuenta .VERMAPAS (SITIOSHIST6RIOOSYPREHIST6RlOOS)YESTUDIOS SOBRELACULTURA>HISTORIA. isituhugUKa1usietsuhugUha it washimwhoarrived,it wasXa1usiwhoarrived fue81quien11e96,fueXa1uaiquien11996 Kalusiapareceahoracomoelprotagonista principalde101historia.ElnombreKalusise derivadeKarl,enportuguesCarlos,yesta 6EI mapa no cstdincluido aqui. l Los mapas no cstanincluidos aqui. Capitulo 8-Lo elnograjia en la docllmenlaciol/ !il/guisliea239 adaptadoa1aestructura (ev)y fonol6gicadelaslenguascaribesdeAltoXingli, quecarecendegrupos\ tr.MagiDatuhekehaiDgituhugU \ teMagiDatubroughthim \ te.Maginatu10trajo \ tr.Magin.tu.kataangeingitinhiKuhikugunaha Kuhiku'l\Ula \tealongtimeagoMaginatubroughthimtoKuhikugu, toKuhikugu \ te.hecemuehotiem.poMaginatu10trajoaKuhiku'l\l,a Kuhiku9'\' \t r.MaginatuTugumaieki.eiMaginatui \teMaginatu,heva.aTrumai,Maginatuva. \ te. \ntc Maginatuarauntrumai,a.oeraMaginatu En1aversi6nde delencuentro,vonden Steinenfuetraidoa1aaldeaKuhikuguporun indiotrumai11amadoMaginatu. Enestatrascripci6nencontramoslapanicuiawilke(subrayada)enla primeray pem.ilti malinea.Se trata deunmarcador demodalidadepistcmi ca que yahabiamos encontradoen el"diseurso del jefe".Ladescripei6ndelas lIamadasmodalidadesepiSl(!micasesuntemadegraninterCsparalos etn6grafos.Losmarcadoresdemodalidadepistcmicatransmiten informaci6nacercadelarclaci6nentre1apersonaquehabla.sus afinnacionesylosinterlocutorcs.Incluycnindicadorcsdeevideneia. rumorcs y otrosmodifieadoresdelvalordeverdaddeunenunciado.Existe una amp]iabibliografiaalrcspcctO. 1 Enconsccuencia, en la anotaei6ndelas sesionesesimportantecomentarlapresenciaysignificadodeestos elementos enlalengua. MuchasdeeSlaspaniculaspuedeneneontrarscenlanarraci6nde Hopcse, eentrada enlafiguradeKarlvon den Steinen.Las masinteresant es sonlasqueindicanlaactituddelhablanteenrelaci6n can elcontenido de susrecuerdosyvanfommndoasiunsubgeneronarrativoquepodemos definir como "hist6rico".Estas marcas di stinguen lanarrati vahi st6rica dela lIamadanarrativamitic(l,quecuentalosorigenesdelasvariedades cultural csysesi tuaalprincipiadelosti empos,cuandovivianyse comunieabanent reslloshumanos0nohumanos0cuasihumanos.Los ICI,porcjemplo.Chafe1986: Basso1987.1988.1995;Silverslei n 1993.Yeaselambicn Franchcuo 2005. 240Bruna Franchello marcadoresepistcmicosnosayudanadistinguirentreregistrosnarrativos, comocIhist6ricoy mitico,porunlado,ylostiposdememoria,por cIotro, que sontemasimportantes enlos debates etnologicos actuales. Juntoconlosdefcticosylaspartfeulasquecontienenunvalor aspectual,loskuikuroIl amanlisakisii enkglllOhoa estaspcqueiiaspalabras. SetmtadeunabellametMomquesignificaliteral mente"hcchoparaque nuestraspalabraslleguenabuenpuerto".Sonandasprcdicativas,que realizanelenunciado y fijanSllsignificado vivo. Lasrelaciones entre cOll1poncntes, subcoll1ponentesy sus contenidos ayudanaprofundizarcnlainfonnaci6netnognifica.Continuandocon nuest roejell1plo,lasnarrativashist6ricaspuedenconectarscconestudios hist6ricos y arqueol6gicos.Enelcasodelkuikuro,uno delosresul tadosdel trabajodeinvestigaci6nllevadoacaboporMichaelHeckenberger,el etnoarqueologoquecolaboraconelProyectoKuikufo,eslareeonstrucci6n delas aldcas prchist6rieas, cs deeir,anterioresalprimer testimonio hist6rico redaetadoporKarlvondenSteinen(Heckenberger2005).Deestemodo, pudimosreconstruirlaaldeaKuhikugu,elprimerasentamientoconstruido porloskuikuro,quetodaviaexistiaenIncpoeadevondenSteinen, cuando eletnografoconoci6alabuelodelancianoHopesc(veaseMapa2).Las aldeasprehistoricnseranmuehomasgrandesy complejasquelas actualesy estabanunidas,defonnamasimpresionantequehoy,aunareddealdeas principalesy perifcrieasqueseconectaban entresiporgrandescaminosde 50metrosdeancho.Ademasdetodoesto,cadasitioarqueol6gicoesta asociadoconnarrativashistoricasymi tieasquepennitenconectarelmapa geohist6rieoconelmapacosmologico.Enconsecuencia,lahistoriaoral indigena,laejecllcionritualdelasfonnasde arteverbal,lahistoriaescrita por personas ajenas a la eulturay la investigaci6n arqueol6giease combinan paradelinearunahistoriaenquelasvocesindigenasdesempciianunpapel activo y determinante. 3.4.Paralel ismo Como cualquier otm expresionoral,lamumeion sobreKarlvondenSteinen contadaporHopesetienemuchasrcpcticiones.Laaltaincidenciade repcticionesaparecesobretodoeneulturas basadasenlaoralidadprimaria. Enlugardesermerasrepeticiones,setratageneral mentedeconstrucciones Capilllio 8- La elllograjia en/a dOCllmel1lacion241 paralelas.Esteparalclismo(Iexicoygramaticalalavcz)csuna caractcnsticadcfinitonadelosgencrosdeartcverbal,aunquc,como mencione,ya estabacsbozado demancraclemen tal en eldiscurso cot idiano einfonnal.Enel"discurso deljefe",ubicadoen clextremoopucsto,elde los cantosy elhabl a ri lual, podemos vcr como seentretejen elparalel ismo y lavcrsificacion . Kuhikugu Mt-FlI.-ll uoo " ." _16-:10 . >. .. j .-.====1 -Mil/XI2.Mapadelsi tioprehist6ricoKuhikuguquernuestralasubicacionesdelas aldeaskuikuroocupadasdurantelosultirnosISOconcirculos ccrrndos).Lospunlosnegrosrepresentanlasunidadcsderccolccci6n(tornadode I-Ieekenbcrger1998:638). Enlanarraciontradicional,lahabilidadparaconstruirmicroymacro paralel ismosdefi ne1ahabi lidaddeunrcconocidoakilllia010"duenoJamo 9Sobrcclparalelismo,I'canse, entreOlrOS aUlorcs:lakobson1960.1%6,1968,1973:lord 1985:Zunuhor1983:Tcdlock1983:Fox1998:Finnegan1992:ItYllles1992;Sherar 1990:Urban1991:Monod-Ikcquelin1987. 242BrllllOFranchellO delanarraeion".Losrceursosaponados par lagramatieasonobjeto deuna manipulaeionconseienteempleadaparaprodueir"diseursosbellos"(aliilii ilaginlm).Parejemplo,enkuikuro,eljuegodealtemaneiasentre transitividadeinlransitividad(0eausatividadyanti-eausalividad)es cxplotadadeformamaravi llosaporlosnarradoresexpenos(Franchello 2003).Examinemossolounejemplo,tornadodelanarraeion(historica) sabreel origen delpueblo kuikuro:' O 3.Segmento dela sesion "Kukopogipiigii":I V,d,142-1 43 [tsiu]olohinhakeniigiileha [tsiu]01- ohinhake- nilgilleha rid]3/0 ETR- yuea rozalconar - PNCT CMPL lutuhiituohinhakcniigUlehaiheke[tsiu] Iu- tuhiituohinhake-nUgUlehai- heke[Isiu] RFL- yucayareela yuca roza!cortar-PNCT CMPL3-ERGrid] [Isill}he cleared Ihe mOllioe swidden place he cleared fhe place for his OWIImanioc sll"iddell field [Isill} [Isill} prepar6/a row para CII/lil'llr y"ca limpi61a parcela para 511propia roza de )'lIca [Isill} EneSleejemplo,laescenadecomoeIjefeprcparalaprimerarozapara cultivaryueaenlanuevaaldeaesobservadaatravesdelasperspectivas coneomitallieycomplementariadeunaaceionintransilivayunalransiliva (eomparenselaslineasI y 2). Alexplorar elmetalenguajekuikuro denuevo,deseubrimosquehay untenninoquedesignalasinonimiay,obviamenle,larelacionparalela entreexpresioncscomoladenuestroejemplo.Selraladeltcmlino ololiollgO,quesignifica--elmismootro"0"eIotromismo".Esuntennino utilizadolambienenOlroscampos(nolingUislicos),comoenla difercnciaciondeespecies,derelacionesdeparentesco(hermanos)yde grupos locales. Comoenfalizamosarriba,losdistintosdominiossemanticosy temalicospuedenestarinterrclacionados;enestecaso,larelacionsedaa IOLasabreviaciollCSparalasglosasintcrlincalcssonlassiguicntcs:CMI'L-complcti\"o (paniculaaspcctllal);DETR- dClransilivador;ERG-crgativo;id_idcofono;I'NCT-puntuat(aspcclo);RFL - rellc:ST bunyju-bu-wa 2DU.A: 3SG. J>-POT -morder thetwo(crocodiles)came,andwereabout10biteit (the dog) losdos(coeodrilos)vinicron,yestabanapuntode morderlo (alperro) 99vOl06756 - --LapreguntaacercadeSlsedebe0noincluirestetipodeevenlOS comunicalivosenladocumcntaci6nsurge,enparticular,cuandoestos ocurren enunalenguadecontaclo,esdecir,unalenguadistintaalaquese vaadocumentar.Sinoseineluyenenladocumentaci6n,dichas traduccionesydiscusionesoriginalespuedcnentonccsincorporarseenun nivelindependiente de laanOlaci6n, como se comentaenclapartado3.2. Lareferenciacruzadatambicnpuedeusarseparavincularvcrsiones escritasy editadas deunaenunciaci6n0untexloconunaIrascripci6ndela versi6nhablada(cfMosel2004b).Algunasveces,puedeserpreferible establecer enelniveldelosmetadatosclvinculo entre dostextos 0sesioncs anotados,enlugardevincularcadaenunciaci6n0unidad(aunqueambos metodospodriancombinarse).Lareferencia cruzadapuedeusarsetambien pararelacionarenunciacionesqueserefierenalmismoevento0referente, por ejemplo, comentarios sobrela mistnaescenadeunapclicula 0 video. OtTOuso delareferenciacruzada estamasrelacionado conlasnotas gramaticalcs(vcaseelapartado4.3)entantoquepermilealanOlador vincularejemp[osquemuestrancont rastesinteresantesdentrodeunrasgo gramatical0semantico,esdeeir,queconstituyen"paresminimos sintacticos"encierto sentido.Entonces,valelapenacombinar [areferencia cruzadaconuncomentarioenelniveldelasnotasgramatica1cs,comose muest raenclejemplo25.Lossegmentosdelejemplo25(ayb)sondel mismohablanteydeunmismotexto(sobrelacazadecquidnas),pero contrastan endos aspeetos:enelordendelaspalabras entreelverbonexivo ycl "preverbo"nonexivo(enamboscasosestltawaya"comer')yenla elecci6ndelverbonexivo usado eoneste prevcrbo. Capilulo 9-La ai/o/acionlillgiiislica291 25.Uso delarefereneia eruzada enejemplos eontrastantes (ejemplotomado del jaminjung) a.\ref1997a02O[014 - - -\mongalanymuwa ga-ngga=mangthawayamuyu \itcquidna3SG-ir.PRS=SUBORD comerhonniga \nsince the echidna eats ants \fi: 2poTqueel equidna come honnigas \gmorden de palabras, uso delverbo \Cf1997a0201023 - - -b.\ref1997a0201023 \mothawaya=biyangga-yu=ndi \iteomer=SEQ3SG-be=FOC \fi:...(and) is eating themnow \fi:2...(y) esta comiendolas ahora \gmordende palabras,uso delverbo \cf1997a0201014 - - -7.Resumen Eneste capitulo sepresento unpanoramageneralde[osprineipales tipos de anotaeion[inguisticaquepuedenusarseen[adocumentaciondeunaIcngua deusopocoextendidoyquecump[en conlasdemandasde[egibil idaden compuladoraydelosformalOSdeanotaci6nmultinive[(veasee[apartado I).Como sesenal6 enrepctidas ocasiones a 10largo delcapitulo, alescoger elFormatodcanotaci6nesimportanlereeordarquecxisteuna compensacionentre[aeanlidaddeinformaci6nqueseabarcayelliempo quesededieaa[aanolacion,yquealgunostiposdeanotaei6npuedenser anadidosmasadelanleporusuariosconinteresesespecificos.siemprey cuando csten disponiblesunaanotaeionminimay lagrabacionoriginal.Por 10tanto,elfonnlltodeanotaci6nelcgidodebepodersercalizarCOnel tiempo y elpersonaldisponibles para elproyecto. COEllOregia general,unaanOlaci6ndebeservir para:(a)hacer quela grabaci6noriginalseaaccesibleparalosposiblcsusuarios,incluidoslos miembrosdelacomunidaddehabla;(b)destaearlosaspectosinteresantcs deleventodehablagrabado,y(c)serviralosinteresesparticularesdel anotador(siesquelostiene).EIfonnalominimorecomendadoparala anOlaeioncomprendecuandomenosunatrascripeionortografica(apartado 292Eva SclllIltzeBerndt 2.1),unatraduccionlibrealenguasrmlsaccesibles(si sonvarias,almcnos unadebeseraccesibleparalosmiembrosdelacomunidaddehabla documcntada;vcanselosapartados3.1y3.2)ycualquicrcomcntario contcxtualnccesarioparaquepersonasexternaspuedaninterpretarel eventoeomunicalivoencuestion(3.3).Siunalraseripcionfoncmica(2.2) nopuedederivarsedclatrascripciononognifica, estaIcndraqueafiadirse. Ademas,esesencialqueelfonnalOdeanotacionfacilil clarepresenlacion adccuadadeldiscursoentrevari oshablantesy,enmuchasocasiones. lam biendcldiscursomultilingile(2.6).Tumbienesrecomendableincluir cn IndocumentacionlascaraClcristicassuprasegmenlal csbasicas--comola curvapros6dicadelfinaldeunaunidad0untonoinusualmentealto-asi comorasgosparalingilisticosyextralingilisticos,comosusurros,risas, pausas oralizadas y gestos de seilalamiento (2.4y 2.5). OtTOStiposdeanotacionmcnosescneiales,peropotencialmente utiles,sonlaglosainterlineal(traducci6nmorfemapormorfema;veasecl apartado4. 1),lasnotasgrammicales(4.3),losmelacomentarios(por ejempl o,aeereadelaconfiabilidaddeciertosaspectosdelaanotacion; apartado5)ylasreferenciasenrzadasentreenunciacionesanotadascuyo contcnido eSla relacionado 0 es contrastante (apartado 6). Lostiposdeanotacionmasespecializados,quegcneralmcnlesera Ilevadosa cabopOTpersonasconmetasespccificas deinvestigacion,sonla trascripci6nfonetica(aunquesiempreserccomiendaincluirlatrascTipci6n foneticadeunpequeno subconjunto delcorpus;veaseelapanado 2.3),una brevetrascripci6ndelascaracteristicaspTOs6dicas,paralingilisticasy extral ingil islicas,incluyendolagesticulacion(2.4y2.5)Y lacodifi caci6n gramatical(4.2). Valelaperlarepetiraquiquecualquierdocumentacionlingilistica debeexplicitar las convencionesusadasparalatrascripci6ny laglosa,tales comoelformatogeneraldelaanolaci6n.laortografia,lossimbolosusados pararepresentarlascaracteristicasprosodicasyparalingilisticas,asicomo lasabrcviaturas.Lasconvencionespuedencambi arconfonnesevayan tomandodecisionesenetapasposteriores delproyectodedocumentaciona causa de nuevosconocimientos 0 enrespuesta a losdeseos delacomunidad dehabla.POT10tanto,esnecesariotenerelcuidadodeasegurarla coherenciadelasconvencionesutilizadasydedocumentarlasenforma meticulosa. Capillilo 9- La onolOciimlingiiislica293 Agradl'cimil'ntos PorsusvaliososcomcntariosdClal1adosacercadelosborrodoresdeeste capituloypor brindamlemasejemplos,meguslariaagradcceraNikolaus Himmelmann yUlrikeMoscl. Abrevialuras IeOSlbilidad deimprimir AceJ"\"or..I (" onsultas MelOOoSpara: - b,Lsqnedas simples y compleJAs - presentacl6n ellfonnato web - incOlporaci6n de cometlTarios - eslableCLlllietlTo derebciones - cOllversi61l "al\"uelo' (011Ihe fly) Figura 5.Cuestiones quedebenresolverse en lainteracci6n entre los usuarios y losarchivistas Enelapartado4.2yasediscutieronlasdi stintasexigenciasdelos usuariosparalosprocedimientos debusqueda.Cuando unusuarioencuentra ciertosrecursosinteresames,debetenerlaposibilidaddedescargarlos0 copiarlos.Debeserposi blccopiarcorporacompletos,incluidoslos metadalosy losrecursos.Como yasemencion6 cn elapartado4.1 , nodebe resultardemasiadodifici linstalarunacopiacompletamenteoperativaen otTacomputadora, como pod riaser la de uncentro comunitario. Cuandoselocalizaapartirdemetadatosunrecursoindividual, comounaanotaci6n,linlexiconsimple0unarchivomultimedia,lambicn Capitulo13- Los acen'os lingiifsticos digitales y SitSdesafios381 debeserposibleejecutarlo0verlodi rectamcnteconlostipieosplug-ins parabllsquedaenlared.Sinembargo,enelcasoderecursoslinguisticos mascomplejos,comolosarchivosmultimediaanotadosconstituidospor varias secuencias y capas deanotaciones, eslOnofuncionara conbuscadorcs estandar,sinoqueserequierenbuscadoresnU1sespecializadosquepuedan explotarpaquetesmultimedia.DosherramientasdeestetiposonELANy LEX US,creadosenelInsti tulOMaxPlanckparausarenpsicolingUistica. OtroenfoqueeseldelSMIL(SynchronizedMultimediaInlegration Language, "Lenguajedeintegraci6nmultimediasincronizada"),unestandar delWorldWideWebConsortiumparaintegrar archivosmultimedia.Puede usarse,porejemplo,parasubtitularunagrabaeionenvideo.Losarchivos SMILnocontienen ensimismoslosmedios,sinoligasqueIlevanael1os. Paradesplegarestosarchivosmult imediaserequiereunreproductorque reeonozcaelestandar SM IL. Engeneral,podemosesperarquesedesarrol1enmasherramientas quesoportenoperacionescomplejasapartirdelaccesoalared.LEXUS tieneunaestructuradeestetipo,quepermitecrearnuevoslexiconesy manipular los existentes a traves delared.ANNEXtieneunaestruetura que operaaIravesdelaredconunconjunto dearchivosmultimediaanotados. ANNEXyLEXUSpenni ten alusuariotomar distintos archivosmultimedia anotados0lexieonesdedistintossubarchivosconlaintenci6nexplieitade pemlitiruntTabajointeriingiiistieo.Seestandisenandomecanismospara resolverlosproblemasestrueturalesysemanticosdeestasoperacioncs cruzadas.Laselecci6ndelosreeursossehaecapartirdebusquedasde meladatos. Losinvestigadorespidenamenudolaposibi lidaddeimprimirlos materialesdepositadosenunacervo.AunqueeslOpuedepareeerunatarea scncilla,implieamuehasdecisioll esporpartedeldesarrollador delsistema sobrecomo generarimpresiones enpape!de materialinformatico.Ademas, losinvestigadorespuedentenernecesidadesdistintasalrespccto.Ala fecha,nohayunatecnologiaestandarquepuedanutiliz.1rlosusuariosno experimentadosparaasociarsupropiolayout0presentaei6ncon doeumenlOSXMLricamentecstrueturados,aunqucexistelatecnologia basica (XSL T). 6. Administration del acceso Losproblemaseticosylegalesdeconservaryusarinformacionnoeran visiblescuandolosinvestigadoresindividuales0losproyectosde invcstigaeiontodaviacranlosresponsablesdelosdatosrecolectadosylos 382PalllTrilsbeek yPeter Wittenburg almacenabancnsusoficinas.Debidoaalgunoseasosdemalusodelos datos,aladisponibilidaddelainfonnacionatravesdeInternet,alamayor eonciencia acereadclas euestioneseticasy alaimroducciondelosacervos linguisticoscomounaespeeiedcinstitueionabstraetaentreelinvestigador y los eonsuhantes, lascuestiones etieasy legaleshanrecibidorecientemente muehamasatenci6n.Cualquieracervocnfrcntaraunaseriedeproblemas eticos y legales y tiene quetratarlosconmucho cuidado. 6.1.Cuestiones etieasy legales Lasituacionlegaldelosacervos digilalestiendea ser muycomplejaporque sueleimpli cardistintossistemaslegales.Llegaaocurrir quelacomunidad dehablaesteubicadaenunpais,eIinvestigadorenotroyelarchiviSlaen unterceroy queeneadapaisopereunsistemalegaldislimo.Haygrandes difcreneias,porejemplo,ent reAustralia,EuropayESladosUnidosen cuantoalosderechosdeautor,queesunodelosaspecloslegales potencial menterclevantesparalosreeursosalmaeenadosenunacervo.Para mayorcsdetallessobreestacuestion,veanseLibennan(2000)y elcapitulo 2. Dadalaeomplejidadylarelativanovedaddetodoslosasuntos legalesrclaeionadosconlosacervoslinguisticosdigitales,resulta actualmentemllydificil,cuandonoimposible,obtenerasesorialegal formal.Noobstante,eadaaeervodebeeSlablecerlasbaseslegalesdesu actividady lIegaraacuerdosviablesconsusproveedoresyusuarios.Entre otras cosas,debeasegurar sudercchoaalmacenar elmaterialdeposi tadoy reservartodoslosderechossobreelmaterialparasuscreadores.Tambien debereclamareldercchoadaraccesoalosrecursos,apartirdeun consentimiemoinformadodelosinvestigadoresy hablantesencuanto alos usosposiblesdelmaterialrcunido.Estasdeclaraeionesdedereehosy acuerdosdebenestaradisposici6ndelpublicoenelsitiodeInternet,de modoquetodosestenenterados delasreglasvigentesparaelaecesoyuso delacervo. Comomuehosaspectoslegalessiguensiendoineiertosy seguramente10seguin\nsiendoporunbuentiempo.esfundamental estableecrunarelaci6nbasadaenlaconfianzamutuaentrelodoslos partieipantes.Enestesenlido,serautildesarrollaruncOdigodeeondueta explicitoquedebeseraceptadoyaeatadoportodoslosinvolucradosen eonstruir.manteneryutilizarelacervo(veaseunejemploenelsitiode InternetdelprogramaDoBeS).EImaterialalmacenadoenunaeervo linguistico,sobretodolasgrabaciones.debegenerarseconel CapituloJ3- Los acerl'OS lingiiisticos digilales Y SIISdesafios383 consentimientodelacomunidaddchabla.Estceonsentimientodebe rcferirseexplicitamente alusodelmaterialpor partedeot ros.Tambicnhay quereeordarquelasdeclameionessobreelaccesoalosrecursospueden cambiar coneltiempo. Lamayorcargareferentealaregulaciondel aeeesoalosrecursos correspondera alproveedor principal, quecasi siempre seraelinvestigador. Engeneral,losarehivistasdaranporhechoqueelproveedor-investigador eonocelasexpectati vas deloshablantes y queentiende a fondalosaspectos cticosimplicados.EIproveedortlenequetraducirsusconocimientosal respcctoenpolfticasdeacceso,esdecir,tienequedefinireltipode protocolo quehandeseguirlosusuariosdelrecursoylasdirectricessobre como usarlo. Adem:is,cIacervodebelomarciertasmedidasparacuandoyano estcdisponibleelproveedor queconocelasituaciony expectativaslocales. Aquipuedeserutiluncuerpodeasesoresformadoporinvestigadoresde campo y arehivistas experimentados.Otra opcionesque elacervopidaa los proveedoresquedesignensusti tutosporsiellosmismosyanopueden decidir alglmcambia enlaspolil icas de acceso. 6.2.Sistemas para administrar elacceso La"admini straciondelaeeeso" serefiereaunsistemaquepone en practica laspoliticas deaeeesoyamencionadas.Deberesultar obvio quese requiere unsistemaelaboradoparaadministrarelaccesoyqueestesistemadebe seguirsiendomanejableaunqueseenfrenteaunn(lmerocrecientede solicitudesdeconsul ta.Desdeelpuntodevistadelosusuarios,debeseT minimoelesfuer-LObUTocraticorequeridoparagarantizarelaccesoalos materialesse1eccionados,puesdeotromodosedesalentaran(comolos periodistasquebuscanunaccesomcilynipidoacienainformacionpara escribirunanotasobreelpatrimoniolinguisticoycultural).Loquese necesita,pues,sonsistemasclectr6nicoscficientesparamanejarlas solicit udesdeingreso.AClualmenteseestan dandolosprimerospasos enla exploracion de estas posibilidades. EnelprogramaDoSeSsedesarrollounsistemaconestructuraweb paraadministrar elacccso.Estesistemapcrmite delegara otm gente,como losinvestigadoresresponsables0losproveedoTes,e1derechoaotorgar pennisosdeacceso.Laspersonasautorizadas,comoelarchivistayel proveedor,pueden definir en eonj unto los derechosmediantelaseleceion de eienonodo enla jcrarquia demetadatosenlazadosy cieno tipoderecurso. Deestemodo,5610seneeesitauncomandoparaseiialarquetodoel 384Paul Trilsbeeky Peter Wittenburg materialtextualdeunproyectodocumentaldetenninado estaa disposicion delpllblico.EIsistematambienpennhepediralusuarioqueaeeptelas condiciones deusoy que especifique p.1raqueusnr{1elmaterialconsultado. Esevidente,sinembargo.queningunsistemadeacecsopuede asegurar elusoadccuado delosmateriales delacervo.Solo elcontrolsocial dcntro delacomunidadde usuariospuedeimpcdir que elmaterialsc milice confines di stintos a losdcclarados. 7.)'crspcctil'as Esrnuydeseable quelosmetadatos cOnlenidos enlos di stint osaccrvos esten integradosendominiosaccesiblcsdeInternet.demodoquetodoslos usuarios pucdaninfonnarscacercadelostipos derccursosdisponiblesmas aliadelosacervosconlosqueacostumbratrabajar.Esuiampliamente aceptadoelprincipiodequelosmetadatosdebenestaradi sposici6ndel publ icoengeneral.Actualmcnte.hayproyectos enEuropa.EstadosUnidos yAustraliaqueestandesarrollandoestetipodeintegraci6n.EIdominio integradodemetadatosdeIMDIyOl ACabarcaahoraochenta instituciones entodo elmundo y constituyeunarranque promisorio. UnadelasmetasdelainiciativaDElAMAN.enlaquecolaboran variosacervosimponantcs.esimegrardemancravirtuallosacen;ospara quelosusuariospuedanacceder conunasolaidentificaci6ny contrasenaa lodoslosrccursosautorizados.aunquelosacervosindi vidualesque alberganlacopiaori ginaldelrccursoseguiransiendolaautoridadque OIorgaelaceeso.Se espera que eSlas colaboraciones no s610simplifiquen de manera radicalla administraci6n delacceso a losarehivos. sino quetambien pennilanalosusuariosinleresadosnavegarporeSlosnuevosacervos vinuales si nlimitacionesburocraticas.DemrodelainicialivaOElAMAN lambienscdi stribuirnncopiasdelainfonnacionenlrelosacervos panicipantesparaaumentarlasprobabilidadesdesupervivenciaalargo plazo.Sonmuyrecienteslosproyectos querealizaneSletipo deinlegraci6n dcacervosquevamasaliadeintegrarmeladalos.demodoquelos resultados seranvisi blcs deniro dealgunos anos. EIusodeaecrvoslingilisticoscomplelos(0descgmenlOSmas grnndesdeunaccrvo.queabarqueninfonnaci6ndedistintosproycctos documentaics)puedeplanlearproblemasimponanlespor13faltade mecanismospamopemrsimultaneamenteenvariosniveles.Comoyase indic6.enlosnivclesdefonnatoydecodificaeiontecnicapucdeydebe a1canzarseunaltogradodc coherenciadentrodelflecrvo.Sinembargo,en clniveldelasanotacioneslingilislicasnosseguiremosenfrent:;lIldocon Capitulo13- Los acen'os lingijislicos digitales Y SIISdesoJios385 di stinlastenninologias.Loslingiiislasseguirimdefiniendosuscapasde anotaciones. sus atributoslcxicosylosvaloreseOTTCspondientcsenfuneion desulengua,sustradicionesdescriptivasysusprefercnciastc6ricas.Las diferenciasresultantes entemlinologiay en esquemas dennotncionpodrnn. por ejemplo,limitar elalcancc delasbusquedas.Lasnuevasestmcturas de usoconformatowebdescritasenelapartado5.2tienenqueabordareste problema.Existcnvariasiniciativasparadesarrollarest ructurasflexibles basadasen onlologiasquesegencrcnyaseadesdeabajo--por cjemplo,a partirdelapropiaseleecionderecursos-o desdearriba,conmctodos detenninadosporlatcorialingOistica.Dcnlrodelasegundacatcgoria, podemosmencionariniciativascomoISOTC37/SC4Y GOLD(Gel/eral Olllology for Lingllislic oescriplion,"Ontologla generalparala dcscri pcion lingilist ica").Mienlras queInISOproponeunregist rocentraldecategorias deinfonnacionqueescasiunali staplanayexlcnsadeconceptos IingUist icos,elproyectoGOLDquieredesarrollarunaontologiaque abarquetanto definiciones como rclaciones. Capitulo14 La documentacionlingiiistica y la codificacion de textos )OSIGipper l Introduccion EnladocumentacionlingUi slica.Innotaciondele"IOSellformaescrita sicmprchadesempenadounpapelimportante,inclusodespuesdel desarrollodelosdisposit ivos dealmaccnami ento audi ovisual.Laera digital haprovocado, SI acaso,uncambiamenor acsta situaci6n entanto que ahora podcmoscspcrar quenuestros datoscscritosseanli lilcsparamucha gentc y durantemuchossiglossinquencccsariamcnte seimpri man0scdistribuyan comoIibras.Si nembargo,paralograrCSIC propOsiloscdebeteneren consideraci6nciertascucstioncsprc1iminarcsquesclralarimenCSIC capitulo. Larepresentaci6ndetcXIOS enfannadigitaldi fi credel uso de[api z y pnpel pues presupone laadaptacion de codigos claramente dcfinidosenun scntidodoble:lacodificaci6ndecaracteres,esdeci r,delastetraselllas palabrasquehabn%ndeescribirse,ylacodificaci6ndeloselementos dela estructuratextual,esdecir,encabezados,ejemplos,lislasdevocabulario. ele.Losdos tipos de codifieaei6nson cnlciales para c1inlcrcambio de datos conotraspersonas:unfuturolIsuarioque110tengainformaci6nsobrelos csquemasdecodificacionquesehayanaplieado,probablcmcnletendcl grandcsdificultadesallratardevolveradecodi fi car(yleer)10quese cscribi6;en elpeor delos casos.csos dalOSseran totalmentcirrecllpcrables. Enlas pagi nassiguientesexplicarebrcvementepor que CSIO csdeespcrarse y quese]luedehacer paraevitarlo.Empezaremos conla codificaci6n delas unidadesdetextormi spequCl)as.csdecir,los earaclercs.yprocederemosa elementosmasgrandescomopalabras,frasesysintagmas.GtrosI" iposde codificacionquepudierancaber enlapresentediscusi6n(especial ment ela codificacion de archi vos;veasc cl capitulo 4) se tralanlnde paso. 388) ost Gippert 1.Lacodificacionde caracteres: de 7 bils a 32bits 1.1.ComputadorasdeUnidadCentral(Mainframe):laeraASCII Entodoslosequiposdigitalesmodernos,lacodifi caci6ndeearacleresse basaenunconj untodeterminadodecorrespondenciasentrecaracleresy val oresnumericos,enelquecadacaractereSlarepresentadoporunvalor unico.Paracodificarlas 26letras delalfabetolatinodosveces(mayusculas yminusculas),maslosdigilosdel0al9,lossignosdepuntllacion, parenlesisyotrossignossimilares,esnecesariounconjuntodemenosde 100valores(mi cos.Por estaraz6n, las computadoras deunidadcentraldela "edaddepiedra"(lasdecadas de1960y1970)len iancomobase10 quese conoce como codificaci6nde7bits(digitosbi narios):con 7bitssepueden codificar 27 =128caracteresdemaneraunivoca.EI estandarmas conocido desarrolladosobreeSlabaseeselIl amadoc6digoASCII(American StandardCodeforInformationInterchange,"C6digoestadounidense estandar para clintercambio de infommci6n"), veaselaTablaI. TablaI.Codifi caci6n estandarizadade7 bits (ASCII ) o1 0 1234567890123456789 000 020 040 () '+ "#$%& I0123456789 060?@ABC0EFGHJKLMNO 080PQRSTU VWXY Z[ \1Aabc 100def 9 h J kImn0pqrstuvw 120xyz{} 01234567890123456789 01 Qlledaclaroqueconbaseenesleesquemadecodificaci6n,lostextosen inglespodrianserdigitalizadosfacilmente,peronolostextosenaleman, Capillllo14- La dOCllll1ell/acioll /ingi;islica yfacodijicacion de l exlos389 frances 0cspanol, y nique decir delos lextos griegos,msos 0chinos ensus grafias originales.Sinembargo,estonosignificaqucenescentonccsfuera impos ibleprocesartextosenlenguas"exoticas".S610habiaqucinventar csquemasdeeodificaci6nqueuti lizaranmasdeunauni daddigitalpara representar ciertos caractcres. VeaseenlaTabla2laadaptaci6na7 bits de untexto en sanscri lo, un pasajedel Rigl 'et!a,que se produjo en ladccadade 1970enunacomputadoradeunidadcentral ,alaqueseanadela trascripci6n"tradicional"parasueomparaci6n.Resullaclaroqueesta codifieaci6nteniaalmenosdosdesventajas:diflcilmenteeraposible visualizar eltexto ensuformaoriginalenunapantalladeeomputadora,10 quedabacomoresultadounagrancantidaddeerroresalintroducirlos datos.ylaeodifieaci6nnoeratransparentc(nosc"explieabaporsl mi sma"),enelsenridodequelasunidadesindividuales(Ietras,diacriticos, signosdcaccntuaci6n)nleilmcntepudicronhabersidodetenninadospor (liguienquenoestuvierainvolueradoenlosproeesosdeeodificaci6n.Es eierto que csta eodifieaei6nsalis fac ialacondici6n descr consislente, yaque unadcterminadasccucnciadcc6digossiemprerepresenlabaelmismo earaetcr, y estaesInrazon de queestostcxtossepucdanlItilizary analizar inclusohoyendia.Sinembargo,resultabadcmasiadotorpeparaser sostcnible durante unperiodomas largo. Tabla 2. Codifieaci6nnoeSlandarizada de7 bits (Rigveda7,I) R700123011AGNI !M+NA! RODI :! D)I TIB) IR ARA!N\YOR HA!STACYUTI: JANA YANT APRAS=AST A R700123012!M IDU:RED9!S=AM+ G9HA!PATIM AT)ARYU!M R700123021TA!M AGNI !M A!STEVA!SAVO NY 9&N\VANSUPRATICA!KS\AM A!VASE KU!TAS= CI R700123022T IDAKS\A:!YYO YO! DA!MA A:!SANI! TYAH-R700123031PRE!DD)O AGNE DI: DIHIPURO! NO! 'JASRAYA: SU:RMYA:& YAVI Sm)A I TVA:! R700123032M+S=A!S=VANTA U!PA YANTIVA:!JA:H-, 3 .1j!1/J,!III.1ro d'jdhitibhir ar:l(l)'or Jt.1st.1C)'lItij.1IIay.1",.1 pr.1s.1st.1f1l dOred.fS,11!' c!ldpatim .1th.1lylim r.1111.1gllilll.15te 1.15.110/ly i!W,1/1slIpratic.1kplll dWlsehitas cit yo d,1/11,1pnfddho Ilglle didihi P"/"o 110'j.1smyti sOnny." y:1I (I Sill s:isl 'allt.1Iip.1 milt; 'ilia" 390JOSlGipperl 1.2.PCs,Maes,DOSyMSWindows:cstandaresynoestandaresbasados en8 bi ls Esteproblemaqued6superadoalmenosdemaneraparcialal extender a8 bilslabasedeeodificaci6nASCII .Conunabasede8bits(=I-byte)se puedeneodifieardemaneraunivoca28 =256caractcres.Desdeprincipios deladecadade1980sedesarrollaronyaplicaronmuehosesquemasde codifieaei6nde8bilsqueailadianalinventario caracteresespecialescomo aquellos querepresentanlasvocalescondieresis delalermin ii.ii.ii (conlas quc serepresentalametafoniaintervoca\iea), lasvocales aeentuadas e,(i.0, etc.delfrances0lapalatalnasaln delespaiiol.Desafortunadamente,esto nosehizodeunamanerahomogenea,"estandarizada",desdeelprincipio; sinoquealgunasdelasmasimportantescompailiasdecomputadoras desarrollaroncadaunasupropioesquema.Estoprovoc6seriosproblemas cuandolosdatoshabiandeintercambiarseentresistemas. Comparenselas Tablas3-5,quemuestranlossistemasdecodifieaci6nutil izadosenlas computadorasIBM/ DOS,lascomputadorasMacintoshyelambienteMS Windows.S610estaultimaesmas0menosiMnlieaalestandarde8bits quehastaeldiadehoyseutilizaenambientesweb,elestandarANSI (American NaliOll(l1SrandardsInsrill/le, "Institutonacionaldeestandares de EstadosUnidos),tam bieneonocidocomoctest?@ AB paRSTUV defghij xy z {l} !I!f:S%& 1 0123 4 56789 C0EFGHJKLMN0 WXYZ[ \ "abc klmnopqrsu vw AACE00aaaai rii66Viiar;eitei t lIr.. I8JC "" 6a0uu ". ?@ABC0EFGHJKLMN0 080PQRSTUVWXYZ[\ , abc 100def 9 h ; kmn0pq , stuvw 120 , Y z( I ) -f , . . tt ~ .S< 140CE 0 N S , oeY 1600 , " 180 " ~ , y. Yo. < A A A A A A IE 9 200EoEE rElN66006 0UUU 2200Y na aa ., < eee ,, 2400n00066 + 0uuuu ypy 01234567890123456789 01 Aim asi, estos sistemas 110eran sufi cientesparalacodificacioninmediata de otrasgrafias,comolasdelgriego,elci ri lico0elchino.Porcstose desarrollarondesdemediadosdeladccadade1980lasJlamadas"paginas de c6digos" (code pages)paracomputadorasconbasede8bi ts.Asicomo elllosejemplosanteriores,ellestaspaginasdec6digosscutiliz6clarea "superior"(Iadelosvaloressuperi oresa128),queexcedeelcstfll1 dar ASCIIbasico, para codificar otros conj untos de caractcres.Algunas de eSlas pagillas dec6digos se hanestandarizado con lanonnaISO-8859 (vease, por ejemplo, laTabla6, enlaquese contrastalapagina dec6digosISO-8859-5 para cl cirilico conel estandar ANSI, que cslanonnaISO-8859-1. Cap/wloI4-La doclimelllaci6111il1giiislica yla codificacioll delex/os393 Tabla6 alb.Mapeo eSlandarizado de8 bils:ISO-8859-1(6a)vs.ISO-8859-5 (6b) a.b. 32I- 1/S,, &(I - .I4732I- 1/S"&I ," 480123456789:;c = >?63480123456769;c:>?63 64@ ....BCOEFGHIJKLMNO7964@ABCDEFGHIJKLMNO79 96IIOPQRSTUVWXYZI \ jA_96 96abcdef91'1 1JkImnoIII96abcdefII1'1IJkImoo111 112Pqr,IuvwYlIII- 127112Pqr5IUvwYl{1, - 127 100l' (01- CI - cII- 175180 bte::S I TJ1b Ib nK9U175 176:l'"II1.' YoY,YoL191176A6BrA E)K3101iiiKnMH On191 192AAAA.A.AA:QEEEEIJ' i2fJ7192 207 208DN06666-0UUUUVba223208,,6erlle)f;'MllxnMHoo223 224taaafaaet;:eeeel1I;239224peTy ",.II"W III'bbI0l10"239 2400;;1I61IDot- euIi00YIIY255240NIleIIfC5IiJno101'1A u255 Ademasdeestascxtcnsiones"oficiales", desdeprincipiosdcladccadade 1980sedesarrollounacanti daddesconocidade sistemasde codificacion de 8bilslocaleseinclusopersonalesparasatisfacerlasnecesidadesdelas IcnguasydeloslingUistas.Dehecho,cadavezquealgui endesarrollaba0 aplicabaciertotipodefll entelipognifica,cll yacodificacionno corrcspondicraconalgunadelaspaginasdecooigoscstandarizadas;se creabaunnuevosislemadecodificaci6ndesdecero.Despues,alapl icarel metodode"mapeodecaractcrcs"({Olllmapping),podiamossat isfacer ,por cjcmplo,losrequisitosparaanOlarelgriegoantiguo(polilonico)consus caraclcrcsoriginales0pararcprcscnlarlaslcnguasiraniasCOiluna trascripcionlatina(veanselas Tablas 7-8). EIproblemadetodoestocsquecuandoseaplicaelmapeode caractcrcsnosepueden garantizarlosrequisitosbasicos dc documcnlacion, cs dccir, lapersistencia y laposibilidadderecuperaciondelos datos, porquc nohayunacorrcspondcnciaunivocaentrc elcaracter quehade codificarse yunvalor digitalizadoasignado.Si,porejemplo,aplicamoslafucntcde8 bitsdelgri egoiluslradaenlaTabla7.elvalor231rcprcsenl ariaunaletra gricga pi (1'1:)minuscula,mientrasqueclmismovalorrepresentariaunaclw I) cirilica si ulilizaramosunafuenlcqueequi valieraalapaginadecOdigos cstandarizadaISO-8859-5yunaclatinaconcedi ll asiulilizaramosla normaANS Ibasica.ES10significaquecadavezqueseapliqucuna 394JOSICippen codificaci6nde8bi tsenlacodificaciondctextos,sedebealmacenar informacionadicionalparaindicar que pagina de codigos 0 que codi fi cacion decaracleresesvalidaparauncaracterdetenninado.Sinembargo,estu informacionnosepuedecodificarcomotaldemancraestandari zadayse pierdefacilmentecuandolos datossetransfi erendeunsistemaaotro.Un ejemploserasuficicnte parailustrar estefenomcno,quepuedeser peligroso paraelalmacenamiento de textos alargo plazo. Tabla7.Codificacionnoestandari zadade8bits:gnegoantiguo (politonico) 01 01234567890123456789 000 020 , '71) " nnn r 040()tI0123 , 567S9 060 " , , A8C0EF0HIJKLMNa nI 080P 0 RSTU vIVX y Z[ n1 " , b , "100defgh , mn0 pq ,,, " vw 120 , , , ;1 , '1 0 " , d , i! , tI 140 , \Po , 6Uf66 , v0b0 fI6U 160 , 6 '" 4> i> I0a n ii r6 '"'" II 180 n ew w A " Ww n (0 , Ii> '" '" 'I' Q .>,)6-OO.)) CapitllloJ4- La dOC/llllell/aciolllillgiiistica ylacodificacion de /exlOS40 I b.EImi SI1lOtcxto dcspues deunalransferencia entreversiones deunmi smo programa (MS Word 6 > MS Word 2002) _ 'OM" ,1tJHH - JU) - ""H (" n - JU ) 0020050N ("n" -JU ) _10l0I, ,,:,h, (,,,:,h -)U) _"': .... - JU ) OO2OO OpcnOfficeI) _10MAAAAAEAAA (AAAAAf::MA-f::6A) _MAlA (AAAi-E6A) 0020060MAAAA.v._AAA.-EiA06AAA (A.AA.-EiA06AA-E6A) 002000I0NAAAA-i (AAA-E6A) _AAAAAO-E (AAAAAO-E6A) _ 10l0IMM.-UiA (AAAiEAAi-E6AlOO2OO8OHAA.AtAAiA-l(AAMAAI-E6A) d.Lomismoocurrcalaplicarunafuentediferente (dentrodcOpcnOffice I) OO2OOIOUg:l:'ldvileoo(g33d\'ileb-is:I) 0020030Mg3bul:l(g3bm-iS3) 00l0050M00200101.1(g3:lZlUureb-iS3) II02OOtONgag3-j(g:lg-iS3) 00200&0Pg:lgebul-i(g:lgebul -is:l l 002OO8ON(gagz.wu-isa) i,C6mopuedeexpliearseestaconductaeXlrai'ladeMSWord?Obviamente. elprogramaejeculaunaestrat egiade ci ncopasos cuandoseencuenlracon textos codificados enotr.ts vcrsiones (mas antiguas): 1)Verifica sieldocumenlo est:'lcodificado enUnicode. 2)Encasonegati vo,veri ficasiladi stribuci ondecaractercscoi ncide conladi stribuci6n"tipi ca'"dealgunadelaspaginasdec6digos conocidas. 3)Encasoafimmti vo.daporheehoquccsapagi nadec6digosesla que debe rcpreserl tarse. 4)Convicrteloscaracteresdc8bits delapaginadcc6digosaceptada como correctaa los caractcrcs equivalentes deUnicode. 402Jos' Gipper, 5)Almacenalos caracteres Unicode cnlamcmoria. Entonccs,pucdcser qucvolvera aplicarlasfucntesde8bitsorigi nalcsno seaunremediosicstasnosatisfaccnlacodificacionqueseaeeptocomo Unicode,comoenelejemplodado.enelquesedioporheehoquese trataba de unap:'lgina de cOdigos en japones. 1.6.Noest3.11darespersistentes:el""Area deUsoPrivado" OtroproblemaquepodTiaseTcrucialinelusoenticmposdeUni codeesla persistenciadepor10menosunareaqucestadiser'iadaparaelmapeo personalizadodefuentes.Eslallamada""ArcadeUsoPrivado"(PUApor sussiglaseningles:Pri mteUseArea)queabarea6144caracteresno predefinidosenlosbloquesEOOO-EFFFyFOOO-F7FF.Simi laralarea definibleporellI suariodeWordPerfect5,laPUApuedeserasignadaad libitllmporeomp311ias.gruposdeusuarios0individuos.Estodacomo resultadoqucscllccesiteinfonlmci6nadicionalparadistingui rlos caracteresquese"codifiearon""enella.EnlaTabla13sernuestra10que pOOdapasarcuandoseaplicaunafuemeequivocadaparavisuali zar caracterescodificadosenlaPUA:enelpeordeloscasos.lainfonnacioll prevista se pcrdera Olmvez. Tab/a13a/b.Mapeo defuentesdc16 bits:el""AreadeUsoPrivado" ,. b. O'23.55119ABCDE FO'23466l.9ASCDEr Ell)t,Ell)01 ,.,,,,, 0000000000 EI'u.DDDDDrt- '""" D "1,IIB-I2 -'JIiI EI2EB1 Ee3'"....lt::::':. ...... E83.ok. ....... iIf - hII.. ,. _.., II" It JJJii")"J, ..-_--- EulllVll/i3f11 ....... tlllllft.MMIi:M EM.1.1!.tJJJ11:toJ,;;EMMin!! it 000000000000 Et1j; oS",w."'''EllDDDDDDDDDDDDDDDD E6lI\I'll !)!)J.E6lI0000000000000000 EnEn0000000000000000 ESAESA DDDDDDDDDDDDDDDD Capilllfof4- La dOCllmel1facion lillgiiisfica yfacodificacioll de fextos403 I .7. Sugcrencias y recomcndacioncs En10rcfcrelHealacodificaci6ndecaractcrcs,todo10anteriornosI1cvaa unascuantasrccomcndacionesgcneralesquepodrianserdeuti li dadcon respectotantoalilltercambiodedatoscomoalalmacenamient oalargo plazodematcriales textuales: Cuandoseaposiblc, asegurarsedeutili zar codificaci6ndeI S bitsy no codificaci6n de 8 bi ts. Sise utiliza codificaci6n de16 bits.evitar el Arca de UsoPri vado. Siserequiercunacodificacion de8 bits,tratar dcnomezclar varias fuentes concodificaci6ndifcrcnte dentro dcl mi smo documento. Uevarsiempreunregistrodequefuente y quecodi fi caci6nscesta usando. Infonnarsiemprcalosrcceptorcsdeldocumcntosobretodo10 antcrior y proporcionar las fuentes (sies legalmelHc posiblc). Los archi vistasy encargadosde :Icervosdocumcntales debcnillser aunmas estrietos: Debeninconverti rtodoslosdocumentosde8bitsadocumentos Uni code dc16 bits. NodcberanusarelAreadeUsoPrivadoparalacodi fi cacionde caractercs. Pero,l,c6moproduci r texlOScodificudosen16 bits'!Como hemosViSIO, los procesadoresdepalabrasmas comunesdehoycndi a cstun di sclladospara Imlllejarcodificacionestantode8comode16bits.Alut ilizarMSWord 2002 dentro de MSWindowsXP y alutilizar unteclado "nacional" como el queproporcionaelsistema operat ivo,sepuedetenerla seguridadde que10 queseteclee sealmaccllar.'aenunacodificaci6nde16bits.Sinembargo, si se desca anadir caractcrcs de, por cjemplo,unafuentedelAlfabcto Fonetico Intemacionalmedianteelmenudeinserciondesimbolos,scdebcni verifi car si el val orUnicode dadoparacl caracter cn cucsti6ncoincide 0no con elpuntodc c6digo deUnicode. Sinocoi ncide. 10masprobablc esque lafuente quescesta tratando dculil izar cstc codificada en 8 bits.Dehccho, MSWord2002penniteIl1Czc]lIrcodificaciones de8 y16bits dcntrodeun mismodocumentodetexto.Estasmczc\as,en10quescrcfiereal intcrcambioyalmaccnamientodedatos.podrianrcprcsentarlapeor situaci6nposiblc.Tambienpodrianocurrirproblemascuandoseutilizan 404lost Gippert contro[adoresdetecladoespecia[esquehayansidoproporcionadospor terceros,talescomoTavultesoftKeyman,yaquepuedenhabersido disei\adosuni camenteparacodificacionesde8bitsyestoanularialas posibilidades de insenar con ell ostextos codifieados en16bits.Sf10 quese prelCnde es di senar uncontro[ador detecladopropioconKcyman0 conMS KeybordLayoutCreator,habraqueasegurarscdeuti[izar[acodificacion Uni codecomobase.Porcierto,elprogramaSILShoeboxestababasado exclusivamente en8 bits einteractuaba bienconloscontroladoresKeyman, perounicamenteconbase de8bi ts.Lanuevaversion,Toolbox, tienebase Uni codeydeberiatrabajarbienconlosdisenosdetecladoKeymancon base de16bits. 2.Lacodificaci6nde elementos textuales: Apariencia superfi cial I'S.marcado de contenido 2.1.La estmctura textualvisualizada Tratemosahoraelsegundolemadeestecapitulo,esdeci r,Incodificacion de[oselementosestmctllml esde[osICXlOS.Paraaclarar10queeslO signifi ca, sera ll lilvolver aver el texto enSll anoconelqllehemostrabajado antes(veaselaTabla9).Inclusosinningunconocimient odelalengua,de inmcdiatotenemoslaimpresi6ndequeestetcxto estafonnadoporversos. Estoestaclaramcnteindi eadopordosseiialesalasqueestamos acosturnbradosenlaleeturadetextospoet icos,asaber:laslineasson relativamente cortas, y estanenumeradas (de laI alaII). Sin embargo,hay muehosmaselementosdeestmcturatextualinvolucrados.Primero,esfacil suponer que ellexlo constadecincooracioncs, queseextf enden de manera parcialentrelosversosy que consislen, en panc, dechi usu[as subordinadas: esto estaindicado porlossignosdepuntuac i6n.Oespues,podemos afimlar que eltextoconsta de38 palabras, a suvezindicadas yaseapar espacios en blanco0porsignosdepuntuaci6ncolindantesalosprimeros0ultimos caracteres. 2.I.I.Los elemell10S bllsicos Parala documentaci6nde materiales textuales, aunquepueda parecer trivial, esdetemtinanteconsiderarymarcarloselementosinternoscuandoseles preparaparaclusofuturoy estodeberahacersedemancratanconsistente Capifulo 14- La documemacionlingiiisfica yla codificaci6n de feXfOS405 comolacodificaci6ndeloscaracteresqueaparecenenlaspalabras.loDe que elementosestamoshablando?Ent reloselementosbasicosdetodotipo detcxto,yahelllosmencionadolaspalabras(queensufonnacscritacstan compuestas de caracteres),frases, chiusul as y oraciones;aunnivel superior, encontramossecciones,p:"lrrafos,capilulos,part esdetextoycosasporel estilo.Paramuchos de estoselementos.intuitivamenteadaplamossenales a lasqueeslamosacostumbradosdesdequeibamosalaescuela,comolos espaciosque seiialanladi visi6n depalabras,lospuntosfi nalesqueindican elfinaldeunaoraci6n0elnuevorengl6nqueindicaelini ciodeuna secci6n 0deunparrafo.Sinembargo,estopodrianosersuficient eparala codificaci6nconsistentedeuntextodigi tal.Olroejcmplobastarapara demostrar por que no. 2. 1.2.UIIejemplo iluslrafivo En la Tabla14vemos uncxlracto deun tratado gramaticalen georgiano del sigloXVIIIdigitalizadoconMSWord6.Sintener el minimoconocimiento dela escrit urageorgiana,unlector podriasuponer quelaprimeralineadel lextoesunencabczado0untitulo.puestoque,obviamenle,consistcIan s610 dcunapalabra, est3.alcentro delalineay parece eSlar reprcsentada en ncgri tas.En10 que serefiere alasotraslineas delex to,el lectorfacilmente sospechanlquesetratadeunainteracci6ndepreguntasyrespucstas,esto cSt{1claramentcindicadoporlossignosdeinterrogaci6n.Otrasugerencia podriaimponersc:comolaprimcrapalabradecadapreguntayrespuesta cstascparadapordospuntosydcstacadaporunespaciadoadicionalentre caracteres,ycomoestaspalabrasscrepitenatravesdelaspreguntasy respuestas,podrianserlosnombresdelaspersonasquehablan(comoen unaobradeteatro).Todasestassuposicionessoncorrectas:tenemosuna interacci6ndepreguntasyrcspuestasenunciadasaquipardospersonas difcrentes(unaesloane.laotra,Nikolaoz)ylaprimeralineaeseltitulo (quc significasi mplemente"Sobrelagramatica").Laraz6nporlaquefue Ianraci l descubri r todoesloesque eneste caso, unavezmas,seutil izaron metodosdemarcadoalosqueestamosacostumbradosallecr: centrado de li neas,usadencgri tas,espaciadoentrecaracteres,etc.Si nembargo,para prop6si lOScomplltacionales,estas marcas,alas quellamaremos"oricntadas haci a la supcrfic ic" (slIIjace-orielfled), son arbitrarias einsufici entes endos sentidos. 406JOS(Gippen Tabla14.Muestra de texto georgiano 60JM!!::,'.'lM'ta.'l6:M.)Q.'IMb kb;)!!::.':JOO&..no? OM.6 3 a,3.>6Va"",,:JO.>,"'. 60JM!!::,' .'lM'ta.'l6:2. 1.3.Caracler;.\lic{l$ de programa I'S.esf(illdares Primero,cleentradodelaslineaspuedeserunacaracteristicacomunde todoslosprocesadorcsdepalabrasqucexislenhoycndia, perodeninguna mancraestaestandarizado:laeodificaciondeeSlaearaeteristica simplemente depende dela estruetura delprograma.Parailustrar 10queesto significa,laTabla15Illuestraunapartedele6digointernodeltexto georgianaenMSWord.Aquipodemosloealizarlapalabraineluidaenel eneabezado "SobreGramiltica"engeorglano, alrnacenada enfonnade 8 bils)alfinalde10quepareee ser unasextalinea, seguidodelaspreguntasyrespuestasenformade"textolegible",Nohay ningunaindicacioncolindante alapalabraquecorrespondealtitulo de que eSladebaestarcentrada0ennegTitas,nitampoeoquerepresenteun eneabczado.Todoesto10debeinferirelprogramaque10interpreta, partiendodelcodigoilegibleque10preeede(0deunbloquede elementos dccodificacionsimi larqucseaiiadealfinaldecadadocumentodeMS Word).ImaginemosquealguientuvicraquedecodifieareSlcdocumento dentrode200anos,sintencrningunaecesoaIIICSlmcturadecodigos inlemadelprogramaMSWord6:ciertamente, estapersona110seriacapaz deextraeTnadasalvocl"tcxlosimple",ylodalainfommcionadicional refcrentealccntradodelineasyeltextoennegritasseperderia(dehecho, muchosdel1oS0lroshemosexpcrimentadoestocuandotratamosdelIbrir documentosdeMSWorddeladccadade1980enversionesposteriorcs). LomisllloOClLrririaconloscaractcrcs"cspaciados"queindi canalos hablanteseneltexto.Este espaciadotambicnest,ieubiertoporunafUllcion inlemadelprogramayseperderiajuntoconeleonoei mi entodelcodigo. CapililiodOC/llllelllaciim lillgiiislica yla cociijicaciimde lexlos407 Por eieno,noseria buenaideaevilar eSle efeelo alinsenar manualmenlelos espaciosenlreearacleresenvezdeusarlafuncionespccificaparacliodel procesador depalabras.puescomoulilizamos espaeiosparadi slinguir unas palabras deOlras, cualquieramilisisinform:ilicoIceriaeInombreespaciado lOA NE comocincopalabras (cadaunafonnadapar une,lfaeler)yno 10 encontrada sisebuscara C01110"IOANE". Toblo15.Mucstradeltexloengeorgianoencodifieaci6nespecifieade programa 0Ialt y' """"" """" """"""""" """--- -- --""" -- ... "" """ "" mYYYYBmwAyyyyyyFmMlcrosoftWord6.0 Document m AWWfAWi'fj0AmAWWf Ayyyyy0AyC:\WORKDIRITEMPLATE\ NORMAl.DOTYY yyyuAyyyyy BYYmDByy tOANEM: OTXNtlGI GVARNI MOV. UVREBITNI. ROMELNICA ,EUdGEBIAN. dAEMdEVREBIAN URAMMAol.tASA_ NI .tOLAOzMAN: RAJARS SAXELEBI MATt? IOANEM: GANSAzWREBA, GANAVALEBA. AUMOfEENA dA AULEVA NI.tOLAOzMAN: t VALAdRAJSAQMAR ARS CNOBAd? 2.1.4.Laqlle se l'eNO es10q/le se obliene Emonces,,;,quesepuedchacerparaevi larlaperdidadeinlonnacion refcrentealaestrucluradeloslex lOS ya sus clemen lOS?Primero.debemos deshaccmosdeunidealdenlrodelprocesamientodelex los,queseha ge