
|
Presentación
Proxectos de investigación
Actividades
Resultados
Enlaces
Área reservada
|
Exploración de capacidades metalingüísticas na linguaxe infantilResultados. CorpusGuión: A elección do espazo. A fin de que as producións verbais dos nenos acadasen un alto grao de "naturalidade", decidiuse gravalos nun ámbito que lles resultase coñecido. Cumpría, pois, introducirse no seu entorno. Nun primeiro momento, circunstancias de orde práctica (facilidades de acceso, posibilidade de rexistrar producións de moitos nenos en cada rolda, etc.) fixeron elixir a gardería como escenario de traballo. Desbotouse a casa familiar por mor dos atrancos que hai que salvar para acceder a ela (receos dos pais, posible incompatibilidade de horarios entre estes e as investigadoras, etc.). Ademais, a presenza de calquera dos proxenitores podía introducir "distorsións" indesexables: a sua tendencia a corrixir, completar e glosar, conduceos ás veces a ocultar as emisións dos nenos. Gravar a estes no seo de fogar implicaba correr o risco de escoitar antes aos pais que a eles mesmos. A todo isto engadíase o feito de que a gardería nos permitía observar diversos tipos de interaccións: non só podíamos examinar o contacto do neno co adulto, senón tamén a conducta deste con outros nenos. As escolas infantis presentábanse, en fin, como un bo espazo de traballo. Coa selección de garderías nas que se ía gravar, quíxose ofrecer unha mostra razoablemente representativa da diversidade lingüístico-cultural de Galicia. Con outras palabras: evitar a sobrerrepresentación dunha zona, ou o predominio abusivo dun determinado tipo de asentamento poboacional. Evidentemente, as limitacións tanto de tempo como de recursos humanos dispoñibles, actuaron condicionando o resultado final. Aínda así, conseguiuse traballar en tres das catro provincias galegas, e en centros ubicados en localidades con características moi diversas. Ademais dos datos contidos no cadro 1, hai que sinalar, a este respecto, que Santiago de Compostela e Lugo son poboacións de 90.000 habitantes, mentres que A Estrada ten tan só 15.000 habitantes. CADRO 1. Datos das garderías seleccionadas
Mecánica das sesións: os métodos empregados na colleita de datos. A procura da "naturalidade" foi tamén o principio que presidiu o desenvolvemento das sesións. Os primeiros encontros foron meras tomas de contacto. Con isto conseguíase que os nenos se fosen familiarizando coas investigadoras. Todas as sesións foron gravadas en VHS (posteriormente pasáronse a CD e DVD). Decidiuse empregar este soporte porque, ao dispoñer de imaxe e de son, a información recuperada pode ser máis diversa e máis completa. No tocante ás técnicas de recollida de datos, tívose en conta a necesidade de captar a conduta lingüística "natural" do neno. Como as dos adultos, as emisións infantís son, en primeiro lugar, instrumentos que se utilizan na interacción cos demais, pancas que serven para movelos nunha ou noutra dirección. Convén, pois, rexistrar as emisións tal e como xorden no decurso dos procesos comunicativos. Por esta razón, outorgóuselle especial relevancia ao rexistro da conversa espontánea dos nenos, adoptando así as investigadoras un papel basicamente pasivo. Ora ben, tamén se empregaron procedementos de elicitación, para explorar a dimensión representativa do acto verbal, e os recursos lingüísticos que "mobiliza". Así, había momentos nos que as investigadoras tomaban a iniciativa, pedindo aos nenos que relatasen un determinado conto, someténdoos a probas de denominación... As "doses" de conversa espontánea e de elicitación non estaban fixadas de antemán, senón que variaban en función da idade e do comportamento dos nenos. Duración. A media era duns 15-20 minutos. Porén, as variacións eran grandes, porque sempre se tomou en consideración a actitude dos nenos ante os requirimentos e as incitacións que se lles dirixían. Cando se amosaban pouco participativos, a sesión podía non estenderse máis alá dos cinco minutos; mais cando daban mostras de interese, chegaba a durar media hora (non se dilataba máis, para que non aparecesen a fatiga e o tedio). Esta flexibilidade é un novo testemuño da naturalidade que en todo momento se perseguía. Numero de participantes. Polo xeral, durante as sesións había entre 4 e 5 nenos na aula, aínda que as fluctuacións tamén foron considerables neste punto: por riba da fidelidade a un patrón fixo e preestablecido estaba a comodidade dos nenos. Procurouse, iso si, que os dous sexos estivesen representados na maior parte das sesións. Entre os nenos e as nenas hai diferenzas (especialmente acusadas no plano pragmático) que fan pouco recomendables as extrapolacións e as inferencias apresuradas. Velaí a razón pola que se puxo moito empeño en que cada un deles tivese unha ampla representación. Lapso de tempo empregado na colleita de datos. As gravacións leváronse a cabo ao longo de catro anos (entre 1996 e 2000), cunha periodicidade que aspiraba a ser quincenal. "Aspiraba a ser ", pois cando se traballa con nenos non caben os programas de gravación ríxidos. Como é obvio, o contacto cos informantes ficaba interrompido nos períodos vacacionais; engadíase a iso o feito de que alguns asistían á gardería de xeito irregular, ou mantíñanse pasivos durante unhas cantas sesións. A pesar destes pequenos atrancos, hai que dar por cumprido o obxectivo de ter feito nun bo numero de casos un seguemento lonxitudinal. Os cadros que se ofrecen a continuación conteñen datos verbo das gravacións que se fixeron en cada unha das garderías. Convén advertir que só figuran aquelas sesións que se puideron transcribir. Fóra fican, polo tanto, as que houbo que desbotar, fose pola mala calidade do son, fose porque os nenos se comportaban de maneira anárquica ou permanecían nun mutismo case absoluto. Débese sinalar que a perda dunhas poucas sesións é un feito irrelevante, xa que o numero das que si se puideron utilizar é alto. Son, en efecto, un total de 166 sesións (47 en Breogán, 44 en Vite, 28 en Sta. Susana, 33 en Elfos, e mais 14 en Milagrosa) que suman preto de 50 horas de gravación. CADRO 2. Datos das gravacións de Breogán
CADRO 3. Datos das gravacións de Vite
CADRO 4. Datos das gravacións de Sta. Susana
CADRO 5. Datos das gravacións de Elfos
CADRO 6. Datos das gravacións de Milagrosa
Numero. Nas sesións estiveron presentes máis de 70 nenos. Alguns deles non merecen o calificativo de "informantes", porque as suas intervencións foron verdadeiramente escasas. Así e todo, podemos considerar que a recollida de datos tivo un éxito máis que notable, pois rexistráronse intervencións de 34 nenos e 32 nenas. A estes 66 informantes poderíanse sumar 5 nenas das que non nos consta a idade que tiñan ao seren gravadas. Manexamos, polo tanto, como cifra total a de 71 informantes. Uso das linguas. Cando se comezou coas gravacións esperábase obter datos que permitisen estudar a adquisición do galego e do castelán, as duas linguas oficiais e usuais na Comunidade Autónoma de Galicia. Semellaba razoable supoñer que o galego tería unha presenza significativa tanto na Estrada (vila situada nunha bisbarra rural), como en Santiago de Compostela e Lugo (cidades ás que se lles atribue un uso do galego bastante amplo). Estas expectativas víronse parcialmente defraudadas. Os nenos de pais galegofalantes comezan a asumir, xa dende a gardería, as relacións xerárquicas que existen entre as duas linguas no mundo dos adultos. Abandonan o galego ante a presenza dunha mestra ou un compañeiro que fala a outra lingua. A escola convértese con rápidez nun espazo no que o castelán é a lingua de uso habitual. O numero de nenos que se nos amosan como galegofalantes ante as investigadoras merma respecto doutros ámbitos. Esta actitude impediu recoller datos de informantes que empreguen o galego de xeito exclusivo. Non rexistramos este mesmo comportamento no caso dos castelanfalantes: 29 nenos expresáronse unicamente en castelán (vid. infra cadro 7). Con todo, debemos sinalar que hai 34 informantes que utilizan o galego de xeito ocasional (vid. infra cadro 8), e que 8 emprégano con asiduidade (vid. infra cadro 9) . En fin, o camiño percorrido ata este momento amósanos que, se queremos dispoñer dun maior numero de producións en galego, temos que achegarnos forzosamente ás garderías ubicadas no ámbito rural, espazo no que esta lingua segue posuíndo unha presenza maioritaria. Procedencia. Polo que se refire á extracción social dos nenos, tamén se procurou que fose diversa. Así, por exemplo, as garderías compostelás atenden, pola sua variada localización, a unha veciñanza moi diferente. Sta. Susana atópase no corazón da cidade, entre o ensanche e a porción máis florecente do casco antigo. Vite ubícase nun barrio periférico habitado por traballadores de clase media. Breogán, por ultimo, está encravada nun dos campus universitarios, e acolle a fillos de membros do persoal da Universidade de Santiago de Compostela (tanto PAS como PDI). CADRO 7. Informantes castelanfalantes que empregan esta lingua de xeito exclusivo
CADRO 8. Informantes castelanfalantes que empregan o galego ocasionalmente
CADRO 9. Informantes galegofalantes que empregan o castelán ocasionalmente
3. As transcricións e as codificacións Na transcrición dos datos utilizouse o sistema CHILDES (Child Language Data Exchange System), que goza de grande difusión entre os especialistas en linguaxe infantil. Como é evidente, o estendido do seu uso facilita o aproveitamento dos resultados por parte de toda a comunidade científica. Outra vantaxa destacable estriba no feito de que o formato de codificación de CHILDES (denominado CHAT, acrónimo de Codes for the Human Analysis of Transcripts), está asociado a un programa de rastrexo de datos (denominado CLAN, acrónimo de Child Language Analysis Programs). Dado que cabía prever que o corpus alcanzase unha considerable estensión, xulgamos imprescindible o poder recuperar e clasificar información automaticamente. De aí que valorásemos CHILDES como a opción más interesante, e que nos decantásemos por el. Non obstante, vimos que é posible precisar alguns aspectos na codificación, e salvar algunhas das limitacións na ferramenta de busqueda. Por todo iso, estamos facendo certas modificacións no sistema CHILDES. Máis adiante informaremos do seu alcance e os seus obxectivos.> Con respecto á codificación, sinalaremos que CHAT se caracteriza pola sua notable flexibilidade. O repertorio de códigos preestablecidos é sobremaneira exhaustivo; os devanditos códigos, sen adicións, son suficientes para rotular un abano de fenómenos bastante amplo (pode comprobarse consultando o manual de instrucións que se atopa na dirección http://childes.psy.cmu.edu/). Ademais, se se estima necesario, cabe engadir códigos novos con plena libertade, pois iso non traerá problemas á hora de realizar rastrexos mediante CLAN. Esta ultima posibilidade foi aproveitada por nós, sobre todo, ao facer inventario dos usos que xulgamos propios, característicos da linguaxe infantil. Usos que indicamos coa etiqueta %par (< ingl. particularity 'particularidade'), e que CHILDES marca con %err (< ing. error 'erro'). Da razón de ser deste cambio informamos no seguinte apartado. 3.2. Modificacións introducidas no sistema CHILDES Como anunciamos máis arriba, neste momento estamos facendo pequenos retoques en CHILDES, que afectan tanto ás posibilidades de rastrexo como á codificación. Con respecto ao primero destes puntos, hai que dicir que non se trata de reemplazar CLAN, senón de suplementalo. Pese a que CLAN é unha ferramenta moi potente, non basta para satisfacer certas necesidades de rastrexo que foron xurdindo sobre a marcha, a medida que entrabamos en contacto cos datos. Para encontrar resposta a estas demandas, contamos coa colaboración de Susana Sotelo Docío, investigadora especialista en lingüística informática, vinculada ao Departamento de Lingua Española da USC. Grazas á sua asistencia, esperamos contar en breve con ferramentas que nos permitan aumentar o numero de criterios nas busquedas complexas. Con isto medrará tamén, obviamente, o rendemento do corpus. Polo que á codificación se refire, a reforma non foi profunda, pero si estensa; o bastante como para non poder presentala nunhas poucas liñas.
Antes anunciamos un dos aspectos da reforma: o cambio de %err ( A reforma non se cifrou no simple reemplazo de %err por %par. Afectou tamén á clasificación das particularidades. Antes de entrar en materia, desexamos facer unha aclaración: a introdución de modificacións non debe verse como unha práctica insólita. Os propios creadores de CHILDES percatáronse dende un principio de que os investigadores quererían facer cambios, e non xulgaron que iso conlevase perigo algun. No manual de codificación, antes de enumerar precisamente os tipos de erros posibles e as etiquetas correspondentes, recoñecían sen rodeos a inevitabilidade das reformas: "For those who wish to do further analysis, this section provides an initial set of codes. Researchers will surely wish to add to this set" (apdo. 14.2). Así pois, nós limitámonos a franquear unha porta que o equipo de MacWhinney deixou aberta. Dito isto, xa podemos ofrecer unha visión global das nosas decisións neste terreo. Obedecen todas elas á necesidade de harmonizar a clasificación de particularidades coas características estructurais das linguas dos nosos informantes, ou sexa, do galego e do castelán. Esta harmonización é un requisito indispensable para que a clasificación sexa exhaustiva, é dicir, para que abarque todos os fenómenos singulares observables na fala dos suxeitos. Quixeramos deixar claro que estes pasos non os demos por puro capricho, antes de ter trato cos datos. As posibles modificacións comezaron a discutirse cando terminou a transcrición do corpus, e deu comezo -non é unha tarefa concluída- o seu aproveitamento na investigación concreta.
Foi entón, en efecto, cando se viron os inconvenientes dunha excesiva fidelidade á clasificación
recollida no manual de CHILDES. Segundo declaran os autores (apdo. 14), a sua proposta baséase na
colección de "speech errors" reunida por J. P. Stemberger en The lexicon in a model
of language production (New York: Garland. 1985). Stemberger presenta na sua obra un corpus de 6.300
erros recollidos ao longo de tres anos. Todo o material é froito dunha atenta observación
das producións espontáneas emitidas por informantes adultos (o de menor idade ten dazaseis anos)
que dominan o inglés como primeira lingua. Sobre esa sólida
base, elabora unha clasificación elemental: os "erros" agrupanse en función do
compoñente afectado (fonolóxico, morfo-fonolóxico, morfolóxico, sintáctico,
léxico) e do tipo de proceso que se opera (adición, supresión, substitución, etc.).
Se o investigador o cre preciso, pode facer máis detallada a caracterización dos
"erros": o manual de CHILDES ofrece códigos adicionais para os compoñentes fonolóxico,
morfolóxico e sintáctico. Agora ben, polo que se refire aos ultimos compoñentes,
a nómina de códigos non é totalmente satisfactoria. Cando menos, non o é dende o punto de
vista de quen traballa con suxeitos galego ou castelanfalantes. Esta relativa inadecuación non
debería ser causa de estrañeza. Hai que ter sempre presente que a clasificación foi
deseñada por estudosos anglófonos, e que estes pensaban, sobre todo, nos posibles
"erros" dos falantes do inglés. Isto explica, por exemplo, a escaseza de
códigos específicos para os fenómenos sintácticos. A excepción de $POS,
que marca "erros" na posición dos elementos (decisiva na arquitectura da
cláusula en inglés), non se atopa ningun código que remita a particularidades
construcionais sensu stricto. Ademais, na codificación morfolóxica hai
duplicidades aparentemente afuncionais: os "erros" pódense etiquetar segundo a
posición do ítem implicado ($PRE, Considerando todo isto, decidimos sopesar o rendemento de cada etiqueta á luz dos datos que obraban no noso poder. Ademais, proporíamos etiquetas novas se nos parecía oportuno. Esta non é tarefa "menor". O refinamento da codificación pode chegar a requerir tanto tempo como a transcrición de todas as emisións rexistradas. Esixe perseverancia por parte dos que se responsabilizan. Cada vez que se contempla a posibilidade de introducir un novo código, téñense que revisar todas as particularidades do nivel en cuestión (morfolóxico ou sintáctico), determinar cales poderían agruparse baixo a etiqueta proposta, e comprobar que a clase resultante posea suficiente homoxeneidade e suficiente numero de exemplares. Se se cumpren estas duas ultimas condicións, haberá que voltar ás transcricións, e introducir o novo código en todos os casos en que sexa necesario. Dadas as dimensións da empresa, comprenderase que ata o de agora só puidésemos traballar os compoñentes morfolóxico e sintáctico. Nunha fase posterior, pensamos ocuparnos doutros campos; particularmente da pragmática, de ordinario tan esquecida. Por suposto, non descartamos novas aproximacións á morfoloxía ou á sintaxe; a nosa é unha clasificación permanentemente aberta a unha revisión. A continuación presentamos os códigos novos que ata o de agora acuñamos, e ofrecemos algunhas breves indicacións sobre o seu uso. CADRO 10. Clasificación dos usos particulares da linguaxe infantil
NOTA: O contexto no que aparecen os exemplos citados pode coñecerse dando un click neles. Empregouse o formato pdf para facilitar o acceso. Ao deseñar os novos códigos, procuramos reducir as dubidas verbo da ubicación que corresponde a un fenómeno concreto. Agora ben, a sua completa eliminación é imposible. É así, ante todo, porque o numero e a diversidade de peculiaridades que se poden atopar en máis de 50 horas de gravación é moi amplo. Alguns deses fenómenos dignos de atención non terán fácil acomodo baixo ningunha das etiquetas, ou talvez o atoparán baixo duas delas. Para percatarse disto basta pensar no solapamento que acompaña ao código $MIX. Esta etiqueta foi creada para recoller todas as particularidades gramaticais que poidan achacarse ao influxo dunha segunda lingua. Dito doutra maneira: para recoller todas as interferencias que se dean nos niveis morfolóxico e sintáctico. Pois ben, é obvio que esas interferencias poden afectar á flexión nominal ($NOU) ou verbal ($VER), á derivación ($WFO), aos marcadores das relacións de dependencia ($CON), etc. É preciso resignarse á existencia de solapamentos como estes. Non obstante, isto non impide advertir que convén corrixir os excesos que se poden producir a este respecto. Ben coñecida é, por exemplo, a tentación dalguns autores de descubrir casos de elipse ($ELL) de maneira abusiva. Antes de dar por pechado este capítulo, e para evitar malentendidos, quixéramos advertir que o etiquetado non é un traballo mecánico. O investigador que etiqueta vese forzado, ante todo, a tomar decisións con trasfondo teórico. Aínda que non o queira, debe comprometerse (en maior ou menor medida) cunha concepción das linguas e da sua estructura. Para iso necesítanse coñecementos que van moito máis alá dunhas poucas nocións de gramática escolar. A isto engádese unha dificultade non menor. Posto que os informantes son nenos que están adquirindo a primeira lingua, o codificador non pode limitarse a "oír", como quen escribe ao ditado de maneira semi-automática. Debe "escoitar", prestar atención ao contexto verbal e extraverbal dos enunciados. Só así poderá captar as intencións comunicativas dos suxeitos, condición sine qua non para o descubrimento de peculiaridades nas suas emisións. Quen non está seguro de ter entendido, non puede estalo de ter recoñecido trazos singulares. 4. Representatividade e utilidades do corpus A mostra satisface os requisitos necesarios para ser considerada representativa. Non só polas suas grandes dimensións, senón tamén:
O corpus resulta innovador e presenta utilidades claras en alomenos tres frontes xerais:
5. Enlaces para acceder ao corpus Actualmente é posible consultar todas as transcricións que integran o corpus a través da páxina de CHILDES. A continuación ofrecemos os enlaces para acceder ao material que consideramos pertinente:
O ISBN asignado ao corpus Koiné é o 1-59642-273-4. Se os datos do corpus se empregan nalgun traballo é imprescindible advertir sobre a sua procedencia e citar, cando menos, unha das publicacións deste grupo. Taller. As Xornadas sobre eficacia comunicativa e evaluación da fala infantil e afásica (Santiago de Compostela, novembro-decembro de 2005) incluíron un taller sobre o proceso de transcrición. Nel ofrecíase unha aproximación ao labor transcritor destinada a aquelas persoas que nunca tiveran contacto nin con CHILDES, nin con calquera outro sistema. O material repartido entre os asistentes pode consultarse aquí en versión pdf: Panel. Tanto o proxecto de investigacíón como o corpus foron presentados no VII Congrès de Linguistica General (Barcelona, abril de 2006). Os datos ofrecéronse a través dun panel e dunha presentación en powerpoint. A información exposta pode consultarse aquí: |