Infome de recopilació i organització del corpus (Judit Gracia Adrobau, becària del projecte)

La Facultat de Ciències Polítiques i Sociologia de la UAB ha marcat sempre com a prioritat l’adaptació de les seves titulacions a l’Espai Europeu d’Educació Superior (EEES), iniciant aquest curs 2012/2013 el tercer any d’implantació dels nous graus de Ciència Política i Gestió Pública i Sociologia.

Així doncs, la conversió a grau és fruit d’un procés progressiu engegat ja fa vuit anys amb la implantació d’un pla pilot, que ha anat portant novetats i millores als estudis. Un dels punts més rellevants d’aquesta adaptació és la importància que la llengua anglesa ha anat agafant en el conjunt de la Facultat, ja que no només es modifica l’assignatura “Anglès per a les Ciències Socials” (que ha passat de segon a primer curs), sinó que aquesta llengua passa a tenir una rellevància transversal en tots els estudis impartits a la Facultat.

Amb la finalitat de comprendre i projectar aquest nou paper que la llengua anglesa té dins la Facultat es presenta el projecte de Millora per la Qualitat Docent (MQD) destinat a la Facultat de CCPP i Sociologia, impulsat principalment per Inna Kozlova, conjuntament amb altres membres del departament d’anglès. Els objectius primordials del projecte estan directament relacionats amb la implantació dels nous graus i l’increment de l’ús de l’anglès que això suposa.

Amb la intenció d’assolir aquests objectius, aquest projecte MQD proposa la creació d’un corpus electrònic amb fins específics.[1] Es tracta d’una plataforma virtual a disposició del professorat que recopila materials en llengua anglesa provinents de diferents àrees, no únicament la docent, ampliant així les possibilitats d’aprenentatge i formació. Aquesta plataforma s’utilitzarà per tal de poder generar exercicis de més qualitat, a través de l’ús del vocabulari adient extret de textos representatius provinents de l’àmbit de la politologia i sociologia.

El corpus passarà a ser una eina de treball més pel professorat, ja que disposaran de noves eines, recursos i vocabulari sobre temàtiques directament vinculades als estudis impartits a la Facultat, portant als alumnes una millora en el seu coneixement de la llengua anglesa.

Com es mencionava anteriorment, la creació d’aquest corpus electrònic amb fins específics ha suposat una feina prèvia de recollida de textos procedents de diferents àmbits per tal de poder desenvolupar el projecte correctament. A continuació, analitzarem els objectius i els paràmetres inicials, l’evolució d’aquest procés i el resultat final.

Per tal de generar els materials didàctics i exercicis, així com el vocabulari adient que composen el corpus electrònic, la principal feina a realitzar inicialment era la recollida de textos en llengua anglesa. Des del projecte s’estableix que han de provenir de tres àrees directe o indirectament vinculades als estudiants: textos provinents del món laboral, materials docents ja elaborats pels professors del Departament d’Anglès de la Facultat i textos en anglès utilitzats per professors d’altres assignatures.

La primera fase d’aquesta recollida, va ser la recerca de textos provinents del món laboral. Inicialment, és va seguir un procediment específic per tal de contactar amb aquells estudiants graduats per la Facultat ja immersos en el món laboral, amb l’objectiu d’obtenir com a mínim 30 documents en anglès que poguessin ser utilitzats per la posterior explotació del corpus electrònic. Amb això, es pretenia acostar el món acadèmic al món laboral, tenint referències més clares de les possibles sortides laborals i dels temes que s’hi tracten, i millorant així les competències dels graduats en formació a la facultat.

Per tal d’utilitzar una llista fiable d’ex-alumnes, es va decidir aprofitar el “Directori de Graduats” impulsat pel Deganat de la Facultat [2]. Es va generar un correu electrònic comú amb unes pautes generals, però davant la possibilitat que el missatge passés desapercebut, ja fos per motius laborals o personals, es va pensar incloure certes referències per tal de personalitzar el missatge i fer-lo més atractiu pels receptors. Es va recórrer a una part del professorat de la Facultat amb la intenció de buscar referències més personals dels ex-estudiants de la Facultat per així poder incloure el nom del professor en qüestió i donar més cos al missatge general.

Així doncs es van enviar al voltant de 200 correus electrònics personalitzats, que van generar unes expectatives inicials descoratjadores, ja que les primeres respostes obtingudes podríem agrupar-les en tres tipus de negatives: “no utilitzo textos en anglès en el meu entorn laboral”, “no estic treballant com a politòleg o sociòleg” o “no comprenc l’ús/objectiu del vostre projecte”. Tot i així, les previsions inicials es van anar complint progressivament, i encara que va ser fins i tot necessari fer explicacions més concretes, aclarir dubtes per telèfon i trobar-se en persona en certs casos, els resultats finals van acabar sobrepassant els objectius marcats inicialment. Finalment, es van aconseguir 76 textos provinents de l’entorn laboral, dels quals 60 van poder ser posteriorment inclosos al corpus electrònic, doblant així el mínim de textos a obtenir establert inicialment pel projecte. Tot aquest procés de gestió i comunicació amb els graduats, va ser dut a terme per una estudiant en pràctiques de Ciències Polítiques i de l’Administració.

La segona fase per tal d’obtenir els recursos adequats pel futur contingut del corpus electrònic, va ser la classificació, selecció i digitalització del material docent utilitzat per diferents professors del Departament d’Anglès de la Facultat de Ciències Polítiques i Sociologia. Només una desena part d’aquest material estava disponible en format digital, la resta es trobava en paper, organitzat per dossiers i es difonia entre els alumnes mitjançant fotocòpies. L’objectiu marcat pel projecte era obtenir al voltant de 80 textos digitalitzats, i amb l’ajuda d’una becària parcialment finançada per la mateixa Facultat, es van obtenir 86 textos que reunien les característiques adequades per ser inclosos en el corpus. Al mateix temps que la becària realitzava tots aquests processos, també va engegar la tercera fase del projecte, adreçada a explotar la última font de recursos a incloure al corpus electrònic, és a dir, els textos en anglès ja utilitzats pels professors d’altres assignatures de la Facultat de Ciències Polítiques i Sociologia. El procediment a seguir va ser similar als dos anteriors, per una banda es va contactar personalment amb alguns professors més vinculats al projecte i per l’altre es va fer una crida general a la resta de personal docent via correu electrònic. Tot i que es va marcar la quantitat de quinze textos com a objectiu final per aquest tercer sector, finalment només se’n van aconseguir tretze. Possiblement, la demanda no es va fer amb suficient antelació, tot i que un altre problema a destacar va ser que molts dels professors contactats, van respondre la nostra demanda però lamentablement no utilitzaven textos en anglès en el programa docent de la seva assignatura. Valorant els bons resultats de les dues primeres fases, on es van sobrepassar els objectius inicials, es valora com a suficient tenir tretze textos provinents del professorat. 

Per tal de facilitar l’explotació d’aquests textos a les professionals del Departament de Traducció i Interpretació de la UAB, va ser necessari crear una base de dades general. Això es va fer a partir de la base de dades provisional creada durant la recollida de textos per tal de tenir-los classificats. Per crear la base de dades definitiva va ser necessari assignar “tema” i “gènere” a tots els textos, ja que aquests eren els paràmetres principals a l’hora de codificar-los, juntament amb l’origen del text (graduates, english department or faculty teachers). Els textos provinent del departament d’anglès tenien una codificació inicial diferent, però calia generar-ne una que pogués incloure la totalitat dels documents.

Tota aquesta feina ha sigut necessària per tal de poder tirar endavant el projecte de MQD (EFECT ref. AGAUR 2010MQD00066) de la Facultat de Ciències Polítiques i Sociologia. Alhora, els textos recopilats a més d’utilitzar-se per la creació i explotació del corpus electrònic, aportaran un valor afegit a l’aprenentatge de la llengua anglesa degut a la diversitat de temàtiques que s’han aconseguit cobrir. Economia, conflictes, educació, medi ambient, són alguns dels “topics” en que s’han classificat els textos aconseguits.


[1] Un corpus, que és bàsicament un conjunt de textos en format electrònic reunits sota uns criteris determinats amb l’objectiu de representar una llengua o varietat de llengua, pot considerar-se tant un recurs per l’extracció d’informació, com part d’una metodologia per l’estudi empíric de la llengua, o fins i tot com tota una forma d’entendre la llengua quant a fenomen observable, mesurable i, fins a cert punt, previsible. (Rodriguez-Inés, 2007)

 

[2] http://158.109.129.18/exalumnes/index.asp

Campus d'excel·lència internacional U A B