Presentación
Proxectos de investigación
Actividades
Resultados
Novidades
Enlaces
Área reservada
Resultados. Corpus

Guión:
1. As sesións de gravación

2. Os informantes
3. As transcricións e as codificacións
    3.1. O sistema CHILDES
    3.2. Modificacións introducidas no sistema CHILDES
4. Representatividade e utilidade do corpus
5. Enlaces para acceder ao corpus
6. Materiais e datos diversos

1. As sesións de gravación

A elección do espazo. A fin de que as producións verbais dos nenos acadasen un alto grao de "naturalidade", decidiuse gravalos nun ámbito que lles resultase coñecido. Cumpría, pois, introducirse no seu entorno. Nun primeiro momento, circunstancias de orde práctica (facilidades de acceso, posibilidade de rexistrar producións de moitos nenos en cada rolda, etc.) fixeron elixir a gardería como escenario de traballo. Desbotouse a casa familiar por mor dos atrancos que hai que salvar para acceder a ela (receos dos pais, posible incompatibilidade de horarios entre estes e as investigadoras, etc.). Ademais, a presenza de calquera dos proxenitores podía introducir "distorsións" indesexables: a sua tendencia a corrixir, completar e glosar, conduceos ás veces a ocultar as emisións dos nenos. Gravar a estes no seo de fogar implicaba correr o risco de escoitar antes aos pais que a eles mesmos. A todo isto engadíase o feito de que a gardería nos permitía observar diversos tipos de interaccións: non só podíamos examinar o contacto do neno co adulto, senón tamén a conducta deste con outros nenos. As escolas infantis presentábanse, en fin, como un bo espazo de traballo.

Coa selección de garderías nas que se ía gravar, quíxose ofrecer unha mostra razoablemente representativa da diversidade lingüístico-cultural de Galicia. Con outras palabras: evitar a sobrerrepresentación dunha zona, ou o predominio abusivo dun determinado tipo de asentamento poboacional. Evidentemente, as limitacións tanto de tempo como de recursos humanos dispoñibles, actuaron condicionando o resultado final. Aínda así, conseguiuse traballar en tres das catro provincias galegas, e en centros ubicados en localidades con características moi diversas. Ademais dos datos contidos no cadro 1, hai que sinalar, a este respecto, que Santiago de Compostela e Lugo son poboacións de 90.000 habitantes, mentres que A Estrada ten tan só 15.000 habitantes.


CADRO 1. Datos das garderías seleccionadas

 GARDERÍA   TITULARIDADE   PROVINCIA   POBOACIÓN   UBICACIÓN PRECISA 
 Breogán  Publica  A Coruña  Santiago de Compostela  Periferia; zona universitaria
 Vite  Publica  A Coruña  Santiago de Compostela  Periferia; barrio clase media
 Sta.Susana  Publica  A Coruña  Santiago de Compostela  Zona centro
 Milagrosa  Publica  Lugo  Lugo  Periferia; barrio clase media
 Elfos  Privada  Pontevedra  A Estrada  Zona centro


Mecánica das sesións: os métodos empregados na colleita de datos. A procura da "naturalidade" foi tamén o principio que presidiu o desenvolvemento das sesións. Os primeiros encontros foron meras tomas de contacto. Con isto conseguíase que os nenos se fosen familiarizando coas investigadoras. Todas as sesións foron gravadas en VHS (posteriormente pasáronse a CD e DVD). Decidiuse empregar este soporte porque, ao dispoñer de imaxe e de son, a información recuperada pode ser máis diversa e máis completa. No tocante ás técnicas de recollida de datos, tívose en conta a necesidade de captar a conduta lingüística "natural" do neno. Como as dos adultos, as emisións infantís son, en primeiro lugar, instrumentos que se utilizan na interacción cos demais, pancas que serven para movelos nunha ou noutra dirección. Convén, pois, rexistrar as emisións tal e como xorden no decurso dos procesos comunicativos. Por esta razón, outorgóuselle especial relevancia ao rexistro da conversa espontánea dos nenos, adoptando así as investigadoras un papel basicamente pasivo. Ora ben, tamén se empregaron procedementos de elicitación, para explorar a dimensión representativa do acto verbal, e os recursos lingüísticos que "mobiliza". Así, había momentos nos que as investigadoras tomaban a iniciativa, pedindo aos nenos que relatasen un determinado conto, someténdoos a probas de denominación... As "doses" de conversa espontánea e de elicitación non estaban fixadas de antemán, senón que variaban en función da idade e do comportamento dos nenos.

Duración. A media era duns 15-20 minutos. Porén, as variacións eran grandes, porque sempre se tomou en consideración a actitude dos nenos ante os requirimentos e as incitacións que se lles dirixían. Cando se amosaban pouco participativos, a sesión podía non estenderse máis alá dos cinco minutos; mais cando daban mostras de interese, chegaba a durar media hora (non se dilataba máis, para que non aparecesen a fatiga e o tedio). Esta flexibilidade é un novo testemuño da naturalidade que en todo momento se perseguía.

Numero de participantes. Polo xeral, durante as sesións había entre 4 e 5 nenos na aula, aínda que as fluctuacións tamén foron considerables neste punto: por riba da fidelidade a un patrón fixo e preestablecido estaba a comodidade dos nenos. Procurouse, iso si, que os dous sexos estivesen representados na maior parte das sesións. Entre os nenos e as nenas hai diferenzas (especialmente acusadas no plano pragmático) que fan pouco recomendables as extrapolacións e as inferencias apresuradas. Velaí a razón pola que se puxo moito empeño en que cada un deles tivese unha ampla representación.

Lapso de tempo empregado na colleita de datos. As gravacións leváronse a cabo ao longo de catro anos (entre 1996 e 2000), cunha periodicidade que aspiraba a ser quincenal. "Aspiraba a ser ", pois cando se traballa con nenos non caben os programas de gravación ríxidos. Como é obvio, o contacto cos informantes ficaba interrompido nos períodos vacacionais; engadíase a iso o feito de que alguns asistían á gardería de xeito irregular, ou mantíñanse pasivos durante unhas cantas sesións. A pesar destes pequenos atrancos, hai que dar por cumprido o obxectivo de ter feito nun bo numero de casos un seguemento lonxitudinal.

Os cadros que se ofrecen a continuación conteñen datos verbo das gravacións que se fixeron en cada unha das garderías. Convén advertir que só figuran aquelas sesións que se puideron transcribir. Fóra fican, polo tanto, as que houbo que desbotar, fose pola mala calidade do son, fose porque os nenos se comportaban de maneira anárquica ou permanecían nun mutismo case absoluto. Débese sinalar que a perda dunhas poucas sesións é un feito irrelevante, xa que o numero das que si se puideron utilizar é alto. Son, en efecto, un total de 166 sesións (47 en Breogán, 44 en Vite, 28 en Sta. Susana, 33 en Elfos, e mais 14 en Milagrosa) que suman preto de 50 horas de gravación.


CADRO 2. Datos das gravacións de Breogán

 DENOMINACIÓN  DATA  [día-mes-ano]  DURACIÓN  NÚMERO DE  PARTICIPANTES
 Bre2_01 06-nov-96 24' 32" 5
 Bre2_02 13-nov-96 21' 32" 1
 Bre2_03 27-nov-96 16' 42" 9
 Bre2_04 18-dec-96 24' 51" 6
 Bre2_05 09-xan-97 11' 29" 3
 Bre2_06 19-mar-97 16' 59" 4
 Bre2_07 19-feb-97 27' 37" 4
 Bre3_01 04-xun-97 15' 11" 6
 Bre3_02 11-xun-97 15' 10" 7
 Bre3_04 14-mai-97 21' 05" 6
 Bre3_05 25-xun-97 14' 00" 6
 Bre4_01 20-nov-97 14' 17" 6
 Bre4_02 05-nov-97 11' 12" 5
 Bre4_03 04-dec-97 15' 39" 5
 Bre4_04 18-dec-97 06' 49" 5
 Bre4_05 15-xan-98 14' 14" 5
 Bre4_06 03-feb-98 14' 31" 6
 Bre4_07 12-feb-98 15' 16" 6
 Bre4_08 26-feb-98 15' 16" 6
 Bre4_09 12-mar-98 10' 40" 7
 Bre4_10 02-abr-98 11' 17" 8
 Bre4_11 17-abr-98 05' 28" 7
 Bre4_12 30-abr-98 18' 34" 8
 Bre4_13 14-mai-98 18' 35" 8
 Bre4_14 28-mai-98 12' 49" 7
 Bre5_02 12-nov-98 11' 34" 2
 Bre5_03 26-nov-98 10' 31" 3
 Bre5_04 10-dec-98 16' 42" 3
 Bre5_05 14-xan-99 14' 16" 4
 Bre5_06 27-xan-99 18' 44" 3
 Bre5_07 17-feb-99 17' 06" 2
 Bre5_08 03-mar-99 16' 54" 5
 Bre5_09 18-mar-99 15' 04" 5
 Bre5_10 08-abr-99 15' 04" 4
 Bre5_11 22-abr-99 25' 31" 5
 Bre6_01 20-mai-99 15' 49" 5
 Bre6_02 27-mai-99 15' 34" 4
 Bre6_03 29-nov-99 18' 49" 3
 Bre6_04 15-dec-99 18' 51" 5
 Bre6_05 13-xan-00 17' 04" 5
 Bre6_06 27-xan-00 17' 36" 3
 Bre6_07 17-feb-00 10' 00" 3
 Bre6_09 21-mar-00 14' 57" 7
 Bre6_10 13-abr-00 14' 55" 5
 Bre6_11 25-mai-00 14' 18" 5
 Bre6_12 15-xun-00 06' 19" 5
 Bre6_13 15-xun-00 06' 52" 5CADRO 3. Datos das gravacións de Vite

 DENOMINACIÓN  DATA  [día-mes-ano]  DURACIÓN  NÚMERO DE  PARTICIPANTES
 Vit1_01 05-nov-97 17' 32" 3
 Vit1_02 19-nov-97 18' 33" 3
 Vit1_03 09-dec-97 17' 03" 2
 Vit1_04 14-xan-98 16' 22" 4
 Vit1_05 28-xan-98 20' 32" 3
 Vit1_06 15-abr-98 18' 24" 5
 Vit1_07 29-abr-98 25' 00" 5
 Vit1_08 13-mai-98 17' 13" 6
 Vit1_09 27-mai-98 06' 41" 4
 Vit2_01 23-out-98 02' 49" 2
 Vit2_02 06-nov-98 04' 37" 4
 Vit2_03 06-nov-98 09' 53" 2
 Vit2_04 20-nov-98 14' 56" 4
 Vit2_05 20-nov-98 04' 32" 1
 Vit2_06 27-nov-98 08' 26" 4
 Vit2_07 18-dec-98 07' 18" 4
 Vit2_08 18-dec-98 06' 59" 1
 Vit2_09 15-xan-99 13' 30" 5
 Vit2_10 15-xan-99 12' 22" 2
 Vit2_11 25-feb-99 17' 50" 5
 Vit2_12 25-feb-99 17' 25" 2
 Vit2_13 05-mar-99 12' 17" 4
 Vit2_14 05-mar-99 11' 37" 2
 Vit3a_01 23-mar-99 13' 16" 2
 Vit3a_02 09-abr-99 12' 55" 1
 Vit3a_03 27-abr-99 19' 09" 2
 Vit3b_01 23-mar-99 20' 50" 4
 Vit3b_02 23-abr-99 18' 09" 4
 Vit3b_03 07-mai-99 17' 42" 4
 Vit3b_04 21-mai-99 22' 53" 3
 Vit3b_05 16-xun-99 19' 38" 4
 Vit3b_06 02-xul-99 18' 36" 5
 Vit3b_07 25-nov-99 19' 39" 2
 Vit3b_08 16-dec-99 15' 54" 2
 Vit3b_09 13-xan-00 16' 11" 3
 Vit4_01 26-xan-00 16' 24" 3
 Vit4_02 10-feb-00 16' 24" 3
 Vit4_03 24-feb-00 17' 31" 3
 Vit4_04 16-mar-00 16' 24" 3
 Vit4_05 13-abr-00 15' 43" 3
 Vit4_06 11-mai-00 15' 00" 3
 Vit4_07 24-mai-00 14' 22" 2
 Vit4_08 08-xun-00 14' 56" 3CADRO 4. Datos das gravacións de Sta. Susana

 DENOMINACIÓN  DATA  [día-mes-ano]  DURACIÓN  NÚMERO DE  PARTICIPANTES
 Sus3_01 21-mai-97 25' 28" 2
 Sus3_02 04-xun-97 09' 28" 2
 Sus3_03 11-xun-97 21' 46" 2
 Sus3_04 25-xun-97 14' 22" 2
 Sus4_04 04-dec-97 21' 45" 5
 Sus4_05 15-xan-98 13' 37" 4
 Sus4_06 03-feb-98 09' 48" 3
 Sus4_07 12-feb-98 19' 23" 6
 Sus4_08 26-feb-98 13' 50" 5
 Sus4_09 02-abr-98 15' 07" 5
 Sus4_10 18-xun-98 15' 41" 4
 Sus4_11 17-abr-98 04' 21" 5
 Sus4_12 30-abr-98 13' 12" 5
 Sus4_13 14-mai-98 09' 09" 4
 Sus4_14 28-mai-98 07' 37" 5
 Sus5_02 12-nov-98 14' 48" 3
 Sus5_03 26-nov-98 13' 28" 4
 Sus5_04 10-dec-98 10' 24" 5
 Sus5_05 14-xan-99 16' 13" 3
 Sus5_06 27-xan-99 14' 51" 4
 Sus5_07 17-feb-99 15' 40" 6
 Sus5_08 03-mar-99 19' 28" 3
 Sus5_09 18-mar-99 17' 39" 4
 Sus5_10 08-abr-99 21' 37" 5
 Sus6_01 26-abr-99 19' 19" 4
 Sus6_02 06-mai-99 18' 41" 5
 Sus6_03 27-mai-99 18' 13" 4CADRO 5. Datos das gravacións de Elfos

 DENOMINACIÓN  DATA  [día-mes-ano]  DURACIÓN  NÚMERO DE  PARTICIPANTES
 Elf1_01 08-nov-96 20' 00" 4
 Elf1_02 22-nov-96 25' 44" 2
 Elf1_03 12-dec-96 18' 01" 3
 Elf1_04 27-dec-96 20' 32" 3
 Elf1_05 10-xan-97 16' 28" 2
 Elf1_06 03-abr-97 20' 33" 4
 Elf1_07 11-abr-97 12' 33" 3
 Elf2_01 09-mai-97 16' 16" 3
 Elf2_02 23-mai-97 28' 40" 3
 Elf2_03 06-xun-97 16' 39" 4
 Elf2_04 04-xul-97 06' 09" 2
 Elf2_05 31-xul-97 31' 17" 2
 Elf2_06 14-ago-97 16' 01" 2
 Elf2_07 19-set-97 19' 57" 2
 Elf2_08 11-out-97 12' 45" 3
 Elf2_09 11-out-97 07' 34" 3
 Elf2_10 25-out-97 20' 27" 3
 Elf2_11 07-nov-97 06' 47" 1
 Elf3_01 21-nov-97 26' 22" 3
 Elf3_02 05-dec-97 27' 36" 2
 Elf3_03 23-xan-98 20' 33" 2
 Elf3_04 27-feb-98 23' 00" 2
 Elf3_05 13-mar-98 15' 19" 2
 Elf3_06 27-mar-98 21' 24" 3
 Elf3_07 17-abr-98 16' 12" 3
 Elf3_08 08-mai-98 18' 41" 3
 Elf4_01 22-mai-98 24' 41" 2
 Elf4_02 09-out-98 11' 37" 3
 Elf4_03 23-out-98 24' 03" 1
 Elf4_04 06-nov-98 19' 16" 3
 Elf4_05 20-nov-98 19' 22" 2
 Elf4_06 04-dec-98 21' 33" 3
 Elf4_07 22-dec-98 14' 00" 2CADRO 6. Datos das gravacións de Milagrosa

 DENOMINACIÓN  DATA  [día-mes-ano]  DURACIÓN  NÚMERO DE  PARTICIPANTES
 Mil1_01 10-feb-99 09' 45" 5
 Mil1_02 24-feb-99 16' 38" 4
 Mil1_03 10-mar-99 16' 20" 5
 Mil1_04 24-mar-99 19' 43" 6
 Mil1_05 14-abr-99 24' 45" 6
 Mil1_06 28-abr-99 23' 37" 6
 Mil1_07 19-mai-99 25' 36" 4
 Mil1_08 09-xun-99 26' 19" 5
 Mil1_09 30-xun-99 23' 25" 5
 Mil2_01 16-nov-99 15' 36" 2
 Mil2_02 30-nov-99 17' 04" 2
 Mil2_03 01-feb-00 19' 55" 2
 Mil2_04 16-feb-00 10' 04" 1
 Mil2_05 24-mai-00 21' 57" 22. Os informantes

Numero. Nas sesións estiveron presentes máis de 70 nenos. Alguns deles non merecen o calificativo de "informantes", porque as suas intervencións foron verdadeiramente escasas. Así e todo, podemos considerar que a recollida de datos tivo un éxito máis que notable, pois rexistráronse intervencións de 34 nenos e 32 nenas. A estes 66 informantes poderíanse sumar 5 nenas das que non nos consta a idade que tiñan ao seren gravadas. Manexamos, polo tanto, como cifra total a de 71 informantes.

Uso das linguas. Cando se comezou coas gravacións esperábase obter datos que permitisen estudar a adquisición do galego e do castelán, as duas linguas oficiais e usuais na Comunidade Autónoma de Galicia. Semellaba razoable supoñer que o galego tería unha presenza significativa tanto na Estrada (vila situada nunha bisbarra rural), como en Santiago de Compostela e Lugo (cidades ás que se lles atribue un uso do galego bastante amplo). Estas expectativas víronse parcialmente defraudadas. Os nenos de pais galegofalantes comezan a asumir, xa dende a gardería, as relacións xerárquicas que existen entre as duas linguas no mundo dos adultos. Abandonan o galego ante a presenza dunha mestra ou un compañeiro que fala a outra lingua. A escola convértese con rápidez nun espazo no que o castelán é a lingua de uso habitual. O numero de nenos que se nos amosan como galegofalantes ante as investigadoras merma respecto doutros ámbitos. Esta actitude impediu recoller datos de informantes que empreguen o galego de xeito exclusivo. Non rexistramos este mesmo comportamento no caso dos castelanfalantes: 29 nenos expresáronse unicamente en castelán (vid. infra cadro 7). Con todo, debemos sinalar que hai 34 informantes que utilizan o galego de xeito ocasional (vid. infra cadro 8), e que 8 emprégano con asiduidade (vid. infra cadro 9) . En fin, o camiño percorrido ata este momento amósanos que, se queremos dispoñer dun maior numero de producións en galego, temos que achegarnos forzosamente ás garderías ubicadas no ámbito rural, espazo no que esta lingua segue posuíndo unha presenza maioritaria.

Procedencia. Polo que se refire á extracción social dos nenos, tamén se procurou que fose diversa. Así, por exemplo, as garderías compostelás atenden, pola sua variada localización, a unha veciñanza moi diferente. Sta. Susana atópase no corazón da cidade, entre o ensanche e a porción máis florecente do casco antigo. Vite ubícase nun barrio periférico habitado por traballadores de clase media. Breogán, por ultimo, está encravada nun dos campus universitarios, e acolle a fillos de membros do persoal da Universidade de Santiago de Compostela (tanto PAS como PDI).
CADRO 7. Informantes castelanfalantes que empregan esta lingua de xeito exclusivo

 LETRAS  IDENTIFI-  CADORAS  SEXO  GARDERÍA  NÚMERO DE
 GRAVACIÓNS
 IDADE PRIMEIRA
 GRAVACIÓN
 [anos;meses.días]
 IDADE ÚLTIMA
 GRAVACIÓN
 [anos;meses.;días]
 NÚMERO DE
 INTERVENCIÓNS
 ALB femia Breogán  4 2;8.1 2;10.6 74
 ALE varón Milagrosa  5 2;3.1 2;6.7 115
 ANA femia Elfos  5 1;7.26 2;1.19 101
 ANT femia Sta. Susana  7 2;5.12 2;11.27 124
 ANV femia Vite  1   2
 BER varón Breogán  5 3;1.23 3;4.25 160
 BOR varón Sta. Susana  6 2;8.12 3;0.25 274
 CES varón Milagrosa  13 2;3.10 3;6.23 498
 CLA femia Breogán  8 2;10.0 3;1.16 368
 INA femia Breogán  11 2;8.28 3;8.0 170
 IRE femia Vite  6 2;1.20 2;7.20 210
 JAC varón Breogán  6 2;2.15 3;8.2 76
 JUL femia Breogán  8 2;3.23 2;11.11 145
 LAR femia Elfos  1 1;6.30 1;6.30 1
 LAU femia Milagrosa  7 2;9.3 3;1.2 1
 LBA femia Milagrosa  1   2
 LOS varón Breogán  2 2;10.22 3;1.5 18
 MIA femia Milagrosa  8 3;0.16 3;5.5 468
 NER femia Milagrosa  12 2;3.10 3;6.23 536
 NOE femia Sta. Susana  1 3;3.2 3;3.2 5
 PAB varón Elfos  2 1;9.7 1;9.21 7
 REN varón Breogán  7 2;1.30 2;9.18 86
 RIA femia Breogán  2 2;1.30 2;9.18 13
 RLA femia Elfos  1 2;0.21 2;0.21 11
 RUT femia Elfos  2 2;0.15 2;6.22 86
 SER varón Milagrosa  8 2;10.20 3;2.19 155
 SON femia Sta. Susana  1   2
 UTH femia Milagrosa  1   14
 XUL femia Breogán  4 1;11.22 2;6.6 13CADRO 8. Informantes castelanfalantes que empregan o galego ocasionalmente

 LETRAS  IDENTIFI-  CADORAS  SEXO  GARDERÍA  NÚMERO DE
 GRAVACIÓNS
 IDADE PRIMEIRA
 GRAVACIÓN
 [anos;meses.días]
 IDADE ÚLTIMA
 GRAVACIÓN
 [anos;meses.;días]
 NÚMERO DE
 INTERVENCIÓNS
 AND varón  Breogán  14 2;10.24 3;5.16 352
 ANP femia Vite  19 2;1.12 3;9.9 1119
 ARI femia Breogán  6 2;6.24 3;9.24 50
 CAB varón Breogán  2 2;8.0 2;8.14 147
 CEC femia Breogán  12 1;10.14 3;1.29 646
 CIA femia Sta. Susana  10 2;6.19 3;1.2 518
 DAV varón Sta. Susana  12 2;11.12 3;11.19 705
 DIA femia Breogán  10 1;10.28 3;3.6 637
 DRE femia Vite  2 1;11.14 2;5.8 30
 DVD varón Sta. Susana  11 2;8.0 3;2.14 607
 ELI femia Breogán  12 2;6.14 3;7.9 452
 GAR femia Breogán  17 2;2.15 3;9.6 251
 GON varón Breogán  16 2;1.4 3;7.5 280
 GUI varón Sta. Susana  13 3;4.14 4;5.11 562
 IAG varón Elfos  28 1;11.24 4;1.08 1472
 IAN varón Vite  7 2;10.1 3;4.9 622
 IEL varón Sta. Susana  1 3;8.29 3;8.29 23
 IRI femia Vite  1   8
 IRN femia Breogán  9 2;4.10 3;4.13 544
 JOR varón Vite  22 1;11.23 3;7.8 1478
 JUA varón Breogán  12 2;6.5 3;11.6 644
 MAR femia Breogán  9 2;2.14 2;10.2 197
 MRT varón Sta. Susana  12 2;8.28 3;3.26 1155
 PAU femia Breogán  14 2;6.15 3;9.15 369
 RAU varón Vite  3 3;0.20 3;1.17 44
 RIC varón Elfos  23 1;10.18 3;11.14 1535
 SAN varón Sta. Susana  11 3;9.17 4;4.1 452
 TAT femia Vite  12 2;3.12 2;11.8 389
 TIN varón Breogán  5 2;0.21 2;7.26 26
 TIT varón Sta. Susana  9 3;9.18 4;2.2 412
 URA femia Breogán  6 2;0.9 2;6.16 115
 VIC varón Sta. Susana  9 2;9.17 3;4.14 832
 XAC varón Vite  22 2;5.10 4;0.12 931
 XAQ varón Breogán  14 2;1.20 3;5.26 685CADRO 9. Informantes galegofalantes que empregan o castelán ocasionalmente

 LETRAS  IDENTIFI-  CADORAS  SEXO  GARDERÍA  NÚMERO DE
 GRAVACIÓNS
 IDADE PRIMEIRA
 GRAVACIÓN
 [anos;meses.días]
 IDADE ÚLTIMA
 GRAVACIÓN
 [anos;meses.;días]
 NÚMERO DE
 INTERVENCIÓNS
 ALI femia Vite  1 2;3.14 2;3.14 50
 ART varón Elfos  23 1;9.24 3;11.7 1149
 BRE varón Vite  12 2;10.14 4;3.21 1033
 DRI varón Sta. Susana  11 3;7.26 4;2.10 656
 INE femia Vite  8 2;9.27 3;4.18 444
 RAQ femia Vite  6 2;9.6 3;2.24 153
 UEL varón Breogán  22 2;2.28 3;8.28 646
 XUN varón Vite  16 2;0.8 3;5.29 1418

3. As transcricións e as codificacións

3.1. O sistema CHILDES

Na transcrición dos datos utilizouse o sistema CHILDES (Child Language Data Exchange System), que goza de grande difusión entre os especialistas en linguaxe infantil. Como é evidente, o estendido do seu uso facilita o aproveitamento dos resultados por parte de toda a comunidade científica. Outra vantaxa destacable estriba no feito de que o formato de codificación de CHILDES (denominado CHAT, acrónimo de Codes for the Human Analysis of Transcripts), está asociado a un programa de rastrexo de datos (denominado CLAN, acrónimo de Child Language Analysis Programs). Dado que cabía prever que o corpus alcanzase unha considerable estensión, xulgamos imprescindible o poder recuperar e clasificar información automaticamente. De aí que valorásemos CHILDES como a opción más interesante, e que nos decantásemos por el. Non obstante, vimos que é posible precisar alguns aspectos na codificación, e salvar algunhas das limitacións na ferramenta de busqueda. Por todo iso, estamos facendo certas modificacións no sistema CHILDES. Máis adiante informaremos do seu alcance e os seus obxectivos.>

Con respecto á codificación, sinalaremos que CHAT se caracteriza pola sua notable flexibilidade. O repertorio de códigos preestablecidos é sobremaneira exhaustivo; os devanditos códigos, sen adicións, son suficientes para rotular un abano de fenómenos bastante amplo (pode comprobarse consultando o manual de instrucións que se atopa na dirección http://childes.psy.cmu.edu/). Ademais, se se estima necesario, cabe engadir códigos novos con plena libertade, pois iso non traerá problemas á hora de realizar rastrexos mediante CLAN. Esta ultima posibilidade foi aproveitada por nós, sobre todo, ao facer inventario dos usos que xulgamos propios, característicos da linguaxe infantil. Usos que indicamos coa etiqueta %par (< ingl. particularity 'particularidade'), e que CHILDES marca con %err (< ing. error 'erro'). Da razón de ser deste cambio informamos no seguinte apartado.

3.2. Modificacións introducidas no sistema CHILDES

Como anunciamos máis arriba, neste momento estamos facendo pequenos retoques en CHILDES, que afectan tanto ás posibilidades de rastrexo como á codificación. Con respecto ao primero destes puntos, hai que dicir que non se trata de reemplazar CLAN, senón de suplementalo. Pese a que CLAN é unha ferramenta moi potente, non basta para satisfacer certas necesidades de rastrexo que foron xurdindo sobre a marcha, a medida que entrabamos en contacto cos datos. Para encontrar resposta a estas demandas, contamos coa colaboración de Susana Sotelo Docío, investigadora especialista en lingüística informática, vinculada ao Departamento de Lingua Española da USC. Grazas á sua asistencia, esperamos contar en breve con ferramentas que nos permitan aumentar o numero de criterios nas busquedas complexas. Con isto medrará tamén, obviamente, o rendemento do corpus. Polo que á codificación se refire, a reforma non foi profunda, pero si estensa; o bastante como para non poder presentala nunhas poucas liñas.

Antes anunciamos un dos aspectos da reforma: o cambio de %err (error) por %par (particularity). Chegou o momento de expor os motivos que nos conduciron a iso. O emprego da etiqueta %err pareceunos inconveniente, en primeiro lugar, polas suas desagradables connotacións prescriptivistas. Cando se fala de "erro" en materia de linguaxe, veñen á memoria as "regras" da antiga gramática normativa: regras normalmente artificiosas, carentes de soporte na realidade da fala. Os que se afanaban en sinalar determinados "erros" no falante adulto, as máis das veces estaban demostrando estreitez de miras: incapacidade de percatarse do que é "normal" no discurso oral (pénsese, por exemplo, nas chamadas concordancias ad sensum). Cando acertaban a identificar usos en verdade "anormais", adoitaban limitarse a condenalos; raras veces se esforzaban por descubrir os factores desencadeantes. Se tal enfoque prescriptivo é inadecuado para estudar a fala adulta (que responde a un sistema estable nos seus trazos esenciais), máis aínda o será para estudar a fala infantil (na que se plasma un sistema en proceso, en construción). Non rematan aquí os problemas que xenera a utilización de %err. Existe un máis, fácil de pasar por alto, pero non por iso desprovisto de gravidade. Cando levanta acta dos "erros" dos informantes, o investigador dá a entender que sabe qué é o "correcto" en cada caso, é dicir, que sabe cal é a forma ou construción que se debía utilizar. Se se traballa con adultos, pode ser bastante sinxelo determinar onde tiña que facer branco a frecha, por dicilo dalgun xeito. Agora ben, cando se opera con nenos inmersos no proceso adquisitivo, no tardan en xurdir obstáculos considerables. A brevidade das suas intervencións, a sua propensión ao "egocentrismo", fan difícil determinar que mensaxe queren comunicar. Obviamente, isto complica a tarefa de averiguar se lle deron a articulación lingüística apropiada.

A reforma non se cifrou no simple reemplazo de %err por %par. Afectou tamén á clasificación das particularidades. Antes de entrar en materia, desexamos facer unha aclaración: a introdución de modificacións non debe verse como unha práctica insólita. Os propios creadores de CHILDES percatáronse dende un principio de que os investigadores quererían facer cambios, e non xulgaron que iso conlevase perigo algun. No manual de codificación, antes de enumerar precisamente os tipos de erros posibles e as etiquetas correspondentes, recoñecían sen rodeos a inevitabilidade das reformas: "For those who wish to do further analysis, this section provides an initial set of codes. Researchers will surely wish to add to this set" (apdo. 14.2). Así pois, nós limitámonos a franquear unha porta que o equipo de MacWhinney deixou aberta. Dito isto, xa podemos ofrecer unha visión global das nosas decisións neste terreo. Obedecen todas elas á necesidade de harmonizar a clasificación de particularidades coas características estructurais das linguas dos nosos informantes, ou sexa, do galego e do castelán. Esta harmonización é un requisito indispensable para que a clasificación sexa exhaustiva, é dicir, para que abarque todos os fenómenos singulares observables na fala dos suxeitos. Quixeramos deixar claro que estes pasos non os demos por puro capricho, antes de ter trato cos datos. As posibles modificacións comezaron a discutirse cando terminou a transcrición do corpus, e deu comezo -non é unha tarefa concluída- o seu aproveitamento na investigación concreta.

Foi entón, en efecto, cando se viron os inconvenientes dunha excesiva fidelidade á clasificación recollida no manual de CHILDES. Segundo declaran os autores (apdo. 14), a sua proposta baséase na colección de "speech errors" reunida por J. P. Stemberger en The lexicon in a model of language production (New York: Garland. 1985). Stemberger presenta na sua obra un corpus de 6.300 erros recollidos ao longo de tres anos. Todo o material é froito dunha atenta observación das producións espontáneas emitidas por informantes adultos (o de menor idade ten dazaseis anos) que dominan o inglés como primeira lingua. Sobre esa sólida base, elabora unha clasificación elemental: os "erros" agrupanse en función do compoñente afectado (fonolóxico, morfo-fonolóxico, morfolóxico, sintáctico, léxico) e do tipo de proceso que se opera (adición, supresión, substitución, etc.). Se o investigador o cre preciso, pode facer máis detallada a caracterización dos "erros": o manual de CHILDES ofrece códigos adicionais para os compoñentes fonolóxico, morfolóxico e sintáctico. Agora ben, polo que se refire aos ultimos compoñentes, a nómina de códigos non é totalmente satisfactoria. Cando menos, non o é dende o punto de vista de quen traballa con suxeitos galego ou castelanfalantes. Esta relativa inadecuación non debería ser causa de estrañeza. Hai que ter sempre presente que a clasificación foi deseñada por estudosos anglófonos, e que estes pensaban, sobre todo, nos posibles "erros" dos falantes do inglés. Isto explica, por exemplo, a escaseza de códigos específicos para os fenómenos sintácticos. A excepción de $POS, que marca "erros" na posición dos elementos (decisiva na arquitectura da cláusula en inglés), non se atopa ningun código que remita a particularidades construcionais sensu stricto. Ademais, na codificación morfolóxica hai duplicidades aparentemente afuncionais: os "erros" pódense etiquetar segundo a posición do ítem implicado ($PRE, error involving prefix; $SUF, error involving suffix; $NFX, error involving infix), ou segundo a función que aquel desempeña na constitución da palabra ($NFL, error involving inflection; $DER, error involving derivation). Esta duplicidade de sistemas de etiquetado -presentada ao mellor coa intención de ofrecer un numero maior de códigos ao transcritor- podería chegar a ser un obstáculo á hora de recuperar a información.

Considerando todo isto, decidimos sopesar o rendemento de cada etiqueta á luz dos datos que obraban no noso poder. Ademais, proporíamos etiquetas novas se nos parecía oportuno. Esta non é tarefa "menor". O refinamento da codificación pode chegar a requerir tanto tempo como a transcrición de todas as emisións rexistradas. Esixe perseverancia por parte dos que se responsabilizan. Cada vez que se contempla a posibilidade de introducir un novo código, téñense que revisar todas as particularidades do nivel en cuestión (morfolóxico ou sintáctico), determinar cales poderían agruparse baixo a etiqueta proposta, e comprobar que a clase resultante posea suficiente homoxeneidade e suficiente numero de exemplares. Se se cumpren estas duas ultimas condicións, haberá que voltar ás transcricións, e introducir o novo código en todos os casos en que sexa necesario. Dadas as dimensións da empresa, comprenderase que ata o de agora só puidésemos traballar os compoñentes morfolóxico e sintáctico. Nunha fase posterior, pensamos ocuparnos doutros campos; particularmente da pragmática, de ordinario tan esquecida. Por suposto, non descartamos novas aproximacións á morfoloxía ou á sintaxe; a nosa é unha clasificación permanentemente aberta a unha revisión. A continuación presentamos os códigos novos que ata o de agora acuñamos, e ofrecemos algunhas breves indicacións sobre o seu uso.CADRO 10. Clasificación dos usos particulares da linguaxe infantil

 NIVEL
 LINGÜÍSTICO
 CÓDIGO  APLICACIÓN  EXEMPLOS
MORFOLOXÍA$NOU
(< ing. noun inflection)

- Formas nominais cuxas propiedades gramaticais (xénero, numero) non presentan a manifestación material que cabería agardar

 azulis = azuis

 marrona = marrón
$VER
(< ing. verb inflection)

- Formas verbaies cuxas propiedades gramaticais (tempo, modo, aspecto, etc.) non presentan a manifestación material que cabería agardar

 estuvi = estuve

 ponió = puso
$WFO
(< ing. word formation )

- Palabras derivadas posibles dende o punto de vista do sistema, pero inexistentes na norma adulta

- Palabras derivadas nas que o afixo derivativo non toma a forma que a base require na linguaxe adulta

 floritas = florecitas

 trabajaderos = trabajadores
SINTAXE$CON
(< ing. construction)

- Nas palabras con flexión casual: selección dun "caso" diferente do que, na linguaxe adulta, corresponde á posición sintática que ocupan

- Nas palabras sen flexión casual: omisión ou sustitución do índice funcional que, na linguaxe adulta, corresponde á posición sintática que ocupan

 a pala = coa pala

 yo = a mí
$AGR
(< ing. agreement)

- Falta de concordancia entre dous constituintes frásticos ou clausais que, na linguaxe adulta, concordan obligatoriamente

 blanca = blanco

 pica = pican
$PRE
(< ing. presentation )

- Omisión, sustitución ou emprego imprevisto de calquera das formas (libres ou semi-libres) que enraízan as expresións nominais no contexto verbal e extraverbal

 abuelo uno = un abuelo

 me gusta miel = me gusta la  miel
$ELL
(< ing. ellipsis )

- Omisión dun constituinte clausal cuxa presencia esperaríase na linguaxe adulta

 ete malo = este é malo

 tú bueno = tú eres bueno
BILINGÜISMO$MIX
(< ing. code-mixing)

- Enunciados nos que se combinan materiais léxicos da lingua A con afixos flexivos propios da lingua B

- Enunciados nos que se combinan palabras da lingua A con arranxo a esquemas propios da lingua B

 uno de estes = uno de estos

 la mi mabuela = mi abuela

NOTA: O contexto no que aparecen os exemplos citados pode coñecerse dando un click neles. Empregouse o formato pdf para facilitar o acceso.Ao deseñar os novos códigos, procuramos reducir as dubidas verbo da ubicación que corresponde a un fenómeno concreto. Agora ben, a sua completa eliminación é imposible. É así, ante todo, porque o numero e a diversidade de peculiaridades que se poden atopar en máis de 50 horas de gravación é moi amplo. Alguns deses fenómenos dignos de atención non terán fácil acomodo baixo ningunha das etiquetas, ou talvez o atoparán baixo duas delas. Para percatarse disto basta pensar no solapamento que acompaña ao código $MIX. Esta etiqueta foi creada para recoller todas as particularidades gramaticais que poidan achacarse ao influxo dunha segunda lingua. Dito doutra maneira: para recoller todas as interferencias que se dean nos niveis morfolóxico e sintáctico. Pois ben, é obvio que esas interferencias poden afectar á flexión nominal ($NOU) ou verbal ($VER), á derivación ($WFO), aos marcadores das relacións de dependencia ($CON), etc. É preciso resignarse á existencia de solapamentos como estes. Non obstante, isto non impide advertir que convén corrixir os excesos que se poden producir a este respecto. Ben coñecida é, por exemplo, a tentación dalguns autores de descubrir casos de elipse ($ELL) de maneira abusiva.

Antes de dar por pechado este capítulo, e para evitar malentendidos, quixéramos advertir que o etiquetado non é un traballo mecánico. O investigador que etiqueta vese forzado, ante todo, a tomar decisións con trasfondo teórico. Aínda que non o queira, debe comprometerse (en maior ou menor medida) cunha concepción das linguas e da sua estructura. Para iso necesítanse coñecementos que van moito máis alá dunhas poucas nocións de gramática escolar. A isto engádese unha dificultade non menor. Posto que os informantes son nenos que están adquirindo a primeira lingua, o codificador non pode limitarse a "oír", como quen escribe ao ditado de maneira semi-automática. Debe "escoitar", prestar atención ao contexto verbal e extraverbal dos enunciados. Só así poderá captar as intencións comunicativas dos suxeitos, condición sine qua non para o descubrimento de peculiaridades nas suas emisións. Quen non está seguro de ter entendido, non puede estalo de ter recoñecido trazos singulares.

4. Representatividade e utilidades do corpus

A mostra satisface os requisitos necesarios para ser considerada representativa. Non só polas suas grandes dimensións, senón tamén:

  1. pola representación equilibrada dos dous sexos (en total, 34 nenos e 37 nenas)
  2. polo alto grao de continuidade no seguimento (nunha franxa de idade non moi traballada, ademais)
  3. pola variada extracción social dos nenos, debida á selección de garderías situadas en entornos diferentes.

O corpus resulta innovador e presenta utilidades claras en alomenos tres frontes xerais:

  1. como fonte de datos sobre o desenvolvemento do español (e, en menor medida, do galego) nun período tan crucial como pouco estudado
  2. como observatorio de tendencias adquisitivas en distintas vertentes da lingua (fonética, gramática ou pragmática)
  3. como proveedor de posibles cánones en diferentes fases do proceso evolutivo, que ben puideran tomarse como punto de referencia para valorar casos particulares.
5. Enlaces para acceder ao corpus

Actualmente é posible consultar todas as transcricións que integran o corpus a través da páxina de CHILDES. A continuación ofrecemos os enlaces para acceder ao material que consideramos pertinente:


O ISBN asignado ao corpus Koiné é o 1-59642-273-4. Se os datos do corpus se empregan nalgun traballo é imprescindible advertir sobre a sua procedencia e citar, cando menos, unha das publicacións deste grupo.

6. Materiais e datos diversos


Taller. As Xornadas sobre eficacia comunicativa e evaluación da fala infantil e afásica (Santiago de Compostela, novembro-decembro de 2005) incluíron un taller sobre o proceso de transcrición. Nel ofrecíase unha aproximación ao labor transcritor destinada a aquelas persoas que nunca tiveran contacto nin con CHILDES, nin con calquera outro sistema. O material repartido entre os asistentes pode consultarse aquí en versión pdf:

Panel. Tanto o proxecto de investigacíón como o corpus foron presentados no VII Congrès de Linguistica General (Barcelona, abril de 2006). Os datos ofrecéronse a través dun panel e dunha presentación en powerpoint. A información exposta pode consultarse aquí: