Presentación
Proyectos de investigación
Actividades
Resultados
Enlaces
Área reservada




Exploración de capacidades metalingüísticas en el lenguaje infantil

Resultados. Corpus

Guión:
1. Las sesiones de grabación

2. Los informantes
3. Las transcripciones y las codificaciones
    3.1. El sistema CHILDES
    3.2. Modificaciones introducidas en el sistema CHILDES
4. Representatividad y utilidad del corpus
5. Enlaces para acceder al corpus
6. Materiales y datos diversos

1. Las sesiones de grabación

La elección del espacio. Con el propósito de que las producciones verbales de los niños manifestasen un alto grado de "naturalidad", se decidió grabarlos en un ámbito que les resultase conocido. Fue necesario, pues, introducirse en su entorno. En un primer momento, circunstancias de orden práctica (facilidades de acceso, posibilidad de registrar producciones de muchos niños de forma simultánea, etc.) motivaron la elección de la guardería como escenario de trabajo. Se rechazó la casa familiar a causa de las dificultades que se tendrían que salvar para acceder a ella (recelos de los padres, posible incompatibilidad de horarios entre éstos y las investigadoras, etc.). Además, la presencia de cualquier de los progenitores podía introducir "distorsiones" indeseables: su tendencia a corregir, completar y glosar, les lleva a veces a ocultar las emisiones de los niños. Grabar a éstos en el hogar implicaba correr el riesgo de escuchar antes a los padres que a ellos mismos. A todo esto se añadía el hecho de que la guardería nos permitía observar diversos tipos de interacciones: no sólo podíamos examinar el contacto del niño con el adulto, sino también la conducta de éste con otros niños. Las escuelas infantiles se presentaban, pues, como un buen espacio de trabajo.

Con la selección de guarderías en las que se iban a realizar las grabaciones, se quiso ofrecer una muestra razonablemente representativa de la diversidad lingüístico-cultural de Galicia. Con otras palabras: evitar la sobrerrepresentación de una zona, o el predominio abusivo de un determinado tipo de asentamiento poblacional. Evidentemente, las limitaciones tanto de tiempo como de recursos humanos disponibles, han actúado condicionando el resultado final. Aún así, se consiguió trabajar en tres de las cuatro provincias gallegas, y en centros ubicados en localidades con características muy diversas. Además de los datos contenidos en el cuadro 1, hay que señalar, a este respecto, que Santiago de Compostela y Lugo son poblaciones de 90.000 habitantes, mientras que A Estrada tiene tan sólo 15.000 habitantes.


CUADRO 1. Datos de las guarderías seleccionadas

 GUARDERÍA   TITULARIDAD   PROVINCIA   POBOACIÓN   UBICACIÓN PRECISA 
 Breogán  Pública  A Coruña  Santiago de Compostela  Periferia; zona universitaria
 Vite  Pública  A Coruña  Santiago de Compostela  Periferia; barrio clase media
 Sta.Susana  Pública  A Coruña  Santiago de Compostela  Zona centro
 Milagrosa  Pública  Lugo  Lugo  Periferia; barrio clase media
 Elfos  Privada  Pontevedra  A Estrada  Zona centro


Mecánica de las sesiones: los métodos empleados en la recogida de datos. La búsqueda de la "naturalidad" fue también el principio que presidió el desarrollo de las sesiones. Los primeros encuentros constituyeron meras tomas de contacto. Con esto se conseguía que los niños se fuesen familiarizando con las investigadoras. Todas las sesiones fueron grabadas en VHS (posteriormente se pasaron a CD y DVD). Se decidió utilizar este soporte porque, al disponer de imagen y de sonido, la información recuperada puede ser más diversa y más completa. Por lo que respecta a las técnicas de recogida de datos, se tuvo en cuenta la necesidad de captar la conducta lingüística "natural" del niño. Como las de los adultos, las emisiones infantiles son, en primer lugar, instrumentos que se utilizan en la interacción con los demás, palancas que sirven para moverlos en una o en otra dirección. Es conveniente, pues, registrar las emisiones tal y como surgen en el decurso de los procesos comunicativos. Por esta razón, se le otorgó especial relevancia al registro de la conversación espontánea de los niños, adoptando así las investigadoras un papel básicamente pasivo. Ahora bien, también se emplearon procedimientos de elicitación, para explorar la dimensión representativa del acto verbal, y los recursos lingüísticos que "moviliza". Así, había momentos en los que las investigadoras tomaban la iniciativa, pidiendo a los niños que relatasen un determinado cuento, sometiéndolos a pruebas de denominación... Las "dosis" de conversación espontánea y de elicitación no estaban fijadas de antemano, sino que variaban en función de la edad y del comportamiento de los niños.

Duración. La media era de unos 15-20 minutos. Las variaciones eran grandes, debido a que siempre se tomó en consideración la actitud de los niños ante los requerimientos y las incitaciones que se les dirigían. Cuando se mostraban poco participativos, la sesión podía no extenderse más allá de los cinco minutos; cuando daban muestras de interés, alcanzaba una duración de media hora (no se dilataba más, para que no apareciesen la fatiga y el tedio). Esta flexibilidad es una nueva prueba de la naturalidad que en todo momento se perseguía.

Número de participantes. Por lo general, durante las sesiones había entre 4 y 5 niños en el aula, aunque las fluctuaciones también fueron considerables en este punto: por encima de la fidelidad a un patrón fijo y preestablecido estaba la comodidad de los niños. Se procuró, eso si, que los dos sexos estuviesen representados en la mayor parte de las sesiones. Entre los niños y las niñas hay diferencias (especialmente acusadas en el plano pragmático) que hacen poco recomendables las extrapolaciones y las inferencias apresuradas. Ésta es la razón por la que se puso mucho empeño en que cada uno de ellos tuviese una amplia representación.

Lapso de tiempo empleado en la recogida de datos. Las grabaciones se llevaron a cabo a lo largo de cuatro años (entre 1996 y 2000), con una periocidad que aspiraba a ser quincenal. "Aspiraba a ser ", pues cuando se trabaja con niños no caben los programas de grabación rígidos. Como es obvio, el contacto con los informantes se interrumpía en los períodos vacacionales; a esta situación se añadía el hecho de que algunos asistían a la guardería de manera irregular, o se mantenían pasivos durante unas cuantas sesiones. A pesar de estos pequeños problemas, hay que dar por cumplido el objetivo de haber hecho en un buen número de casos un seguimiento longitudinal.

Los cuadros que se ofrecen a continuación contiene datos sobre las grabaciones que se hicieron en cada una de las guarderías. Conviene advertir que sólo figuran aquellas sesiones que han podido transcribirse. Queran fuera, por tanto, las que se han desechado, ya sea por la mala calidad de sonido, ya sea porque los niños se comportaban de manera anárquica o permanecían en un mutismo casi absoluto. Debe señalarse que la pérdida de unas pocas sesiones es un hecho irrelevante, ya que el número de las que sí pudieron utilizarse es alto. Son, en efecto, un total de 166 sesiones (47 en Breogán, 44 en Vite, 28 en Sta. Susana, 33 en Elfos, y 14 en Milagrosa) que suman cerca de 50 horas de grabación.


CUADRO 2. Datos de las grabaciones de Breogán

 DENOMINACIÓN  FECHA  [día-mes-año]  DURACIÓN  NÚMERO DE  PARTICIPANTES
 Bre2_01 06-nov-96 24' 32" 5
 Bre2_02 13-nov-96 21' 32" 1
 Bre2_03 27-nov-96 16' 42" 9
 Bre2_04 18-dic-96 24' 51" 6
 Bre2_05 09-ene-97 11' 29" 3
 Bre2_06 19-mar-97 16' 59" 4
 Bre2_07 19-feb-97 27' 37" 4
 Bre3_01 04-jun-97 15' 11" 6
 Bre3_02 11-jun-97 15' 10" 7
 Bre3_04 14-may-97 21' 05" 6
 Bre3_05 25-jun-97 14' 00" 6
 Bre4_01 20-nov-97 14' 17" 6
 Bre4_02 05-nov-97 11' 12" 5
 Bre4_03 04-dic-97 15' 39" 5
 Bre4_04 18-dic-97 06' 49" 5
 Bre4_05 15-ene-98 14' 14" 5
 Bre4_06 03-feb-98 14' 31" 6
 Bre4_07 12-feb-98 15' 16" 6
 Bre4_08 26-feb-98 15' 16" 6
 Bre4_09 12-mar-98 10' 40" 7
 Bre4_10 02-abr-98 11' 17" 8
 Bre4_11 17-abr-98 05' 28" 7
 Bre4_12 30-abr-98 18' 34" 8
 Bre4_13 14-may-98 18' 35" 8
 Bre4_14 28-may-98 12' 49" 7
 Bre5_02 12-nov-98 11' 34" 2
 Bre5_03 26-nov-98 10' 31" 3
 Bre5_04 10-dic-98 16' 42" 3
 Bre5_05 14-ene-99 14' 16" 4
 Bre5_06 27-ene-99 18' 44" 3
 Bre5_07 17-feb-99 17' 06" 2
 Bre5_08 03-mar-99 16' 54" 5
 Bre5_09 18-mar-99 15' 04" 5
 Bre5_10 08-abr-99 15' 04" 4
 Bre5_11 22-abr-99 25' 31" 5
 Bre6_01 20-may-99 15' 49" 5
 Bre6_02 27-may-99 15' 34" 4
 Bre6_03 29-nov-99 18' 49" 3
 Bre6_04 15-dic-99 18' 51" 5
 Bre6_05 13-ene-00 17' 04" 5
 Bre6_06 27-ene-00 17' 36" 3
 Bre6_07 17-feb-00 10' 00" 3
 Bre6_09 21-mar-00 14' 57" 7
 Bre6_10 13-abr-00 14' 55" 5
 Bre6_11 25-may-00 14' 18" 5
 Bre6_12 15-jun-00 06' 19" 5
 Bre6_13 15-jun-00 06' 52" 5



CUADRO 3. Datos de las grabaciones de Vite

 DENOMINACIÓN  FECHA  [día-mes-año]  DURACIÓN  NÚMERO DE  PARTICIPANTES
 Vit1_01 05-nov-97 17' 32" 3
 Vit1_02 19-nov-97 18' 33" 3
 Vit1_03 09-dic-97 17' 03" 2
 Vit1_04 14-ene-98 16' 22" 4
 Vit1_05 28-ene-98 20' 32" 3
 Vit1_06 15-abr-98 18' 24" 5
 Vit1_07 29-abr-98 25' 00" 5
 Vit1_08 13-may-98 17' 13" 6
 Vit1_09 27-may-98 06' 41" 4
 Vit2_01 23-oct-98 02' 49" 2
 Vit2_02 06-nov-98 04' 37" 4
 Vit2_03 06-nov-98 09' 53" 2
 Vit2_04 20-nov-98 14' 56" 4
 Vit2_05 20-nov-98 04' 32" 1
 Vit2_06 27-nov-98 08' 26" 4
 Vit2_07 18-dic-98 07' 18" 4
 Vit2_08 18-dic-98 06' 59" 1
 Vit2_09 15-ene-99 13' 30" 5
 Vit2_10 15-ene-99 12' 22" 2
 Vit2_11 25-feb-99 17' 50" 5
 Vit2_12 25-feb-99 17' 25" 2
 Vit2_13 05-mar-99 12' 17" 4
 Vit2_14 05-mar-99 11' 37" 2
 Vit3a_01 23-mar-99 13' 16" 2
 Vit3a_02 09-abr-99 12' 55" 1
 Vit3a_03 27-abr-99 19' 09" 2
 Vit3b_01 23-mar-99 20' 50" 4
 Vit3b_02 23-abr-99 18' 09" 4
 Vit3b_03 07-may-99 17' 42" 4
 Vit3b_04 21-may-99 22' 53" 3
 Vit3b_05 16-jun-99 19' 38" 4
 Vit3b_06 02-jul-99 18' 36" 5
 Vit3b_07 25-nov-99 19' 39" 2
 Vit3b_08 16-dic-99 15' 54" 2
 Vit3b_09 13-ene-00 16' 11" 3
 Vit4_01 26-ene-00 16' 24" 3
 Vit4_02 10-feb-00 16' 24" 3
 Vit4_03 24-feb-00 17' 31" 3
 Vit4_04 16-mar-00 16' 24" 3
 Vit4_05 13-abr-00 15' 43" 3
 Vit4_06 11-may-00 15' 00" 3
 Vit4_07 24-may-00 14' 22" 2
 Vit4_08 08-jun-00 14' 56" 3



CUADRO 4. Datos de las grabaciones de Sta. Susana

 DENOMINACIÓN  FECHA  [día-mes-año]  DURACIÓN  NÚMERO DE  PARTICIPANTES
 Sus3_01 21-may-97 25' 28" 2
 Sus3_02 04-jun-97 09' 28" 2
 Sus3_03 11-jun-97 21' 46" 2
 Sus3_04 25-jun-97 14' 22" 2
 Sus4_04 04-dic-97 21' 45" 5
 Sus4_05 15-ene-98 13' 37" 4
 Sus4_06 03-feb-98 09' 48" 3
 Sus4_07 12-feb-98 19' 23" 6
 Sus4_08 26-feb-98 13' 50" 5
 Sus4_09 02-abr-98 15' 07" 5
 Sus4_10 18-jun-98 15' 41" 4
 Sus4_11 17-abr-98 04' 21" 5
 Sus4_12 30-abr-98 13' 12" 5
 Sus4_13 14-may-98 09' 09" 4
 Sus4_14 28-may-98 07' 37" 5
 Sus5_02 12-nov-98 14' 48" 3
 Sus5_03 26-nov-98 13' 28" 4
 Sus5_04 10-dic-98 10' 24" 5
 Sus5_05 14-ene-99 16' 13" 3
 Sus5_06 27-ene-99 14' 51" 4
 Sus5_07 17-feb-99 15' 40" 6
 Sus5_08 03-mar-99 19' 28" 3
 Sus5_09 18-mar-99 17' 39" 4
 Sus5_10 08-abr-99 21' 37" 5
 Sus6_01 26-abr-99 19' 19" 4
 Sus6_02 06-may-99 18' 41" 5
 Sus6_03 27-may-99 18' 13" 4



CUADRO 5. Datos de las grabaciones de Elfos

 DENOMINACIÓN  FECHA  [día-mes-año]  DURACIÓN  NÚMERO DE  PARTICIPANTES
 Elf1_01 08-nov-96 20' 00" 4
 Elf1_02 22-nov-96 25' 44" 2
 Elf1_03 12-dic-96 18' 01" 3
 Elf1_04 27-dic-96 20' 32" 3
 Elf1_05 10-ene-97 16' 28" 2
 Elf1_06 03-abr-97 20' 33" 4
 Elf1_07 11-abr-97 12' 33" 3
 Elf2_01 09-may-97 16' 16" 3
 Elf2_02 23-may-97 28' 40" 3
 Elf2_03 06-jun-97 16' 39" 4
 Elf2_04 04-jul-97 06' 09" 2
 Elf2_05 31-jul-97 31' 17" 2
 Elf2_06 14-ago-97 16' 01" 2
 Elf2_07 19-set-97 19' 57" 2
 Elf2_08 11-oct-97 12' 45" 3
 Elf2_09 11-oct-97 07' 34" 3
 Elf2_10 25-oct-97 20' 27" 3
 Elf2_11 07-nov-97 06' 47" 1
 Elf3_01 21-nov-97 26' 22" 3
 Elf3_02 05-dic-97 27' 36" 2
 Elf3_03 23-ene-98 20' 33" 2
 Elf3_04 27-feb-98 23' 00" 2
 Elf3_05 13-mar-98 15' 19" 2
 Elf3_06 27-mar-98 21' 24" 3
 Elf3_07 17-abr-98 16' 12" 3
 Elf3_08 08-may-98 18' 41" 3
 Elf4_01 22-may-98 24' 41" 2
 Elf4_02 09-oct-98 11' 37" 3
 Elf4_03 23-oct-98 24' 03" 1
 Elf4_04 06-nov-98 19' 16" 3
 Elf4_05 20-nov-98 19' 22" 2
 Elf4_06 04-dic-98 21' 33" 3
 Elf4_07 22-dic-98 14' 00" 2



CUADRO 6. Datos de las grabaciones de Milagrosa

 DENOMINACIÓN  FECHA  [día-mes-año]  DURACIÓN  NÚMERO DE  PARTICIPANTES
 Mil1_01 10-feb-99 09' 45" 5
 Mil1_02 24-feb-99 16' 38" 4
 Mil1_03 10-mar-99 16' 20" 5
 Mil1_04 24-mar-99 19' 43" 6
 Mil1_05 14-abr-99 24' 45" 6
 Mil1_06 28-abr-99 23' 37" 6
 Mil1_07 19-may-99 25' 36" 4
 Mil1_08 09-jun-99 26' 19" 5
 Mil1_09 30-jun-99 23' 25" 5
 Mil2_01 16-nov-99 15' 36" 2
 Mil2_02 30-nov-99 17' 04" 2
 Mil2_03 01-feb-00 19' 55" 2
 Mil2_04 16-feb-00 10' 04" 1
 Mil2_05 24-may-00 21' 57" 2



2. Los informantes

Número. En las sesiones estuvieron presentes más de 70 niños. Algunos de ellos no merecen el calificativo de "informantes", ya que sus intervenciones fueron verdaderamente escasas. Aún así, podemos considerar que la recogida de datos tuvo un éxito más que notable, pues se registraron intervenciones de 34 niños y 32 niñas. A estos 66 informantes podríamos sumar 5 niñas de las que no nos consta la edad que tenían al ser grabadas. Manejamos, por tanto, como cifra total la de 71 informantes.

Uso de las lenguas. Cuando se iniciaron las grabaciones se esperaba obtener datos que permitiesen estudiar la adquisición del gallego y del castellano, las dos lenguas oficiales y usuales en la Comunidad Autónoma de Galicia. Parecía razonable suponer que el gallego tendría una presencia significativa tanto en A Estrada (población situada en una zona rural), como en Santiago de Compostela y Lugo (ciudades a las que se les atribuye un uso del gallego bastante amplio). Estas expectativas se vieron parcialmente defraudadas. Los niños de padres gallegohablantes comienzan a asumir, ya desde la guardería, las relaciones jerárquicas que existen entre las dos lenguas en el mundo de los adultos. Abandonan el gallego ante la presencia de una maestra o un compañero que habla la otra lengua. La escuela se convierte con rápidez en un espacio en el que el castellano es la lengua de uso habitual. El número de niños que se muestran ante el investigador como gallegohablantes es menor que en otros ámbitos. Esta actitud impidió recoger datos de informantes que empleen el gallego de forma exclusiva. No registramos este mismo comportamiento en el caso de los castellanohablantes: 29 niños se expresaron únicamente en castellano (vid. infra cuadro 7). Con todo, debemos señalar que hay 34 informantes que utilizan el gallego de manera ocasional (vid. infra cuadro 8), y que 8 lo emplean con asiduidad (vid. infra cuadro 9) . En fin, el camino recorrido hasta este momento nos demuestra que, si queremos disponer de un mayor número de producciones en gallego, tenemos que aproximarnos forzosamente a las guarderías ubicadas en el ámbito rural, espacio en el que esta lengua sigue poseyendo una presencia mayoritaria.

Procedencia. Por lo que se refiere a la extracción social de los niños, también se procuró que fuese diversa. Así, por ejemplo, las guarderías compostelanas atienden, por su variada localización, a un vecindario muy diferente. Sta. Susana se encuentra en el corazón de la ciudad, entre el ensanche y la porción más florecente del casco antiguo. Vite se ubica en un barrio periférico habitado por trabajadores de clase media. Breogán, por último, está enclavada en uno de los dos campus universitarios, y acoge a hijos de miembros del persoal de la Universidad de Santiago de Compostela (tanto PAS como PDI).




CUADRO 7. Informantes castellanohablantes que utilizan esta lengua de modo exclusivo

 LETRAS  IDENTIFI-  CADORAS  SEXO  GUARDERÍA  NÚMERO DE
 GRABACIONES
 EDAD PRIMERA
 GRABACIÓN
 [anñs;meses.días]
 EDAD ÚLTIMA
 GRABACIÓN
 [años;meses.;días]
 NÚMERO DE
 INTERVENCIONES
 ALB hembra Breogán  4 2;8.1 2;10.6 74
 ALE varón Milagrosa  5 2;3.1 2;6.7 115
 ANA hembra Elfos  5 1;7.26 2;1.19 101
 ANT hembra Sta. Susana  7 2;5.12 2;11.27 124
 ANV hembra Vite  1   2
 BER varón Breogán  5 3;1.23 3;4.25 160
 BOR varón Sta. Susana  6 2;8.12 3;0.25 274
 CES varón Milagrosa  13 2;3.10 3;6.23 498
 CLA hembra Breogán  8 2;10.0 3;1.16 368
 INA hembra Breogán  11 2;8.28 3;8.0 170
 IRE hembra Vite  6 2;1.20 2;7.20 210
 JAC varón Breogán  6 2;2.15 3;8.2 76
 JUL hembra Breogán  8 2;3.23 2;11.11 145
 LAR hembra Elfos  1 1;6.30 1;6.30 1
 LAU hembra Milagrosa  7 2;9.3 3;1.2 1
 LBA hembra Milagrosa  1   2
 LOS varón Breogán  2 2;10.22 3;1.5 18
 MIA hembra Milagrosa  8 3;0.16 3;5.5 468
 NER hembra Milagrosa  12 2;3.10 3;6.23 536
 NOE hembra Sta. Susana  1 3;3.2 3;3.2 5
 PAB varón Elfos  2 1;9.7 1;9.21 7
 REN varón Breogán  7 2;1.30 2;9.18 86
 RIA hembra Breogán  2 2;1.30 2;9.18 13
 RLA hembra Elfos  1 2;0.21 2;0.21 11
 RUT hembra Elfos  2 2;0.15 2;6.22 86
 SER varón Milagrosa  8 2;10.20 3;2.19 155
 SON hembra Sta. Susana  1   2
 UTH hembra Milagrosa  1   14
 XUL hembra Breogán  4 1;11.22 2;6.6 13



CUADRO 8. Informantes castellanohablantes que utilizan el gallego ocasionalmente

 LETRAS  IDENTIFI-  CADORAS  SEXO  GUARDERÍA  NÚMERO DE
 GRABACIONES
 EDAD PRIMERA
 GRABACIÓN
 [años;meses.días]
 EDAD ÚLTIMA
 GRABACIÓN
 [años;meses.;días]
 NÚMERO DE
 INTERVENCIONES
 AND varón  Breogán  14 2;10.24 3;5.16 352
 ANP hembra Vite  19 2;1.12 3;9.9 1119
 ARI hembra Breogán  6 2;6.24 3;9.24 50
 CAB varón Breogán  2 2;8.0 2;8.14 147
 CEC hembra Breogán  12 1;10.14 3;1.29 646
 CIA hembra Sta. Susana  10 2;6.19 3;1.2 518
 DAV varón Sta. Susana  12 2;11.12 3;11.19 705
 DIA hembra Breogán  10 1;10.28 3;3.6 637
 DRE hembra Vite  2 1;11.14 2;5.8 30
 DVD varón Sta. Susana  11 2;8.0 3;2.14 607
 ELI hembra Breogán  12 2;6.14 3;7.9 452
 GAR hembra Breogán  17 2;2.15 3;9.6 251
 GON varón Breogán  16 2;1.4 3;7.5 280
 GUI varón Sta. Susana  13 3;4.14 4;5.11 562
 IAG varón Elfos  28 1;11.24 4;1.08 1472
 IAN varón Vite  7 2;10.1 3;4.9 622
 IEL varón Sta. Susana  1 3;8.29 3;8.29 23
 IRI hembra Vite  1   8
 IRN hembra Breogán  9 2;4.10 3;4.13 544
 JOR varón Vite  22 1;11.23 3;7.8 1478
 JUA varón Breogán  12 2;6.5 3;11.6 644
 MAR hembra Breogán  9 2;2.14 2;10.2 197
 MRT varón Sta. Susana  12 2;8.28 3;3.26 1155
 PAU hembra Breogán  14 2;6.15 3;9.15 369
 RAU varón Vite  3 3;0.20 3;1.17 44
 RIC varón Elfos  23 1;10.18 3;11.14 1535
 SAN varón Sta. Susana  11 3;9.17 4;4.1 452
 TAT hembra Vite  12 2;3.12 2;11.8 389
 TIN varón Breogán  5 2;0.21 2;7.26 26
 TIT varón Sta. Susana  9 3;9.18 4;2.2 412
 URA hembra Breogán  6 2;0.9 2;6.16 115
 VIC varón Sta. Susana  9 2;9.17 3;4.14 832
 XAC varón Vite  22 2;5.10 4;0.12 931
 XAQ varón Breogán  14 2;1.20 3;5.26 685



CUADRO 9. Informantes gallegohablantes que utilizan el castellano ocasionalmente

 LETRAS  IDENTIFI-  CADORAS  SEXO  GUARDERÍA  NÚMERO DE
 GRABACIONES
 EDAD PRIMERA
 GRABACIÓN
 [años;meses.días]
 EDAD ÚLTIMA
 GRABACIÓN
 [años;meses.;días]
 NÚMERO DE
 INTERVENCIONES
 ALI hembra Vite  1 2;3.14 2;3.14 50
 ART varón Elfos  23 1;9.24 3;11.7 1149
 BRE varón Vite  12 2;10.14 4;3.21 1033
 DRI varón Sta. Susana  11 3;7.26 4;2.10 656
 INE hembra Vite  8 2;9.27 3;4.18 444
 RAQ hembra Vite  6 2;9.6 3;2.24 153
 UEL varón Breogán  22 2;2.28 3;8.28 646
 XUN varón Vite  16 2;0.8 3;5.29 1418





3. Las transcripciones y las codificaciones

3.1. El sistema CHILDES

En la transcripción de los datos se recurrió al sistema CHILDES (Child Language Data Exchange System), que goza de gran difusión entre los especialistas en lenguaje infantil. Como es evidente, lo extendido de su uso facilita el aprovechamiento de los resultados por parte de toda la comunidad científica. Otra ventaja reseñable estriba en el hecho de que el formato de codificación de CHILDES (denominado CHAT, acrónimo de Codes for the Human Analysis of Transcripts), está asociado a un programa de rastreo de datos (denominado CLAN, acrónimo de Child Language Analysis Programs). Dado que cabía prever que el corpus alcanzase una considerable extensión, juzgamos imprescindible el poder recuperar y clasificar información automáticamente. De ahí que valorásemos CHILDES como la opción más interesante, y que nos decantásemos por él. No obstante, hemos visto que es posible precisar algunos aspectos en la codificación, y salvar algunas de las limitaciones en la herramienta de búsqueda. Por todo ello, estamos haciendo ciertas modificaciones en el sistema CHILDES. Más adelante daremos noticia de su alcance y sus objetivos.

Con respecto a la codificación, señalaremos que CHAT se caracteriza por su notable flexibilidad. El repertorio de códigos preestablecidos es sobremanera exhaustivo; dichos códigos, sin adiciones, son suficientes para rotular un abanico de fenómenos bastante amplio (puede comprobarse consultando el manual de instrucciones que se encuentra en la dirección http://childes.psy.cmu.edu/). Además, si se estima necesario, cabe añadir códigos nuevos con plena libertad, pues ello no acarreará problemas a la hora de realizar rastreos mediante CLAN. Esta última posibilidad la hemos aprovechado, sobre todo, al hacer inventario de los usos que juzgamos propios, característicos del lenguaje infantil. Usos que indicamos con la etiqueta %par (< ingl. particularity 'particularidad'), y que CHILDES marca con %err (< ing. error 'error'). De la razón de ser de este cambio informamos en el siguiente apartado.

3.2. Modificaciones introducidas en el sistema CHILDES

Como más arriba anunciamos, en este momento estamos haciendo pequeños retoques en CHILDES, que afectan tanto a las posibilidades de rastreo como a la codificación. Con respecto al primero de estos puntos, hay que decir que no se trata de reemplazar CLAN, sino de suplementarlo. Pese a que CLAN es una herramienta muy potente, no basta para satisfacer ciertas necesidades de rastreo que fueron surgiendo sobre la marcha, a medida que entrábamos en contacto con los datos. Para encontrar respuesta a estas demandas, hemos contado con la colaboración de Susana Sotelo Docío, investigadora especialista en lingüística informática, vinculada al Departamento de Lengua Española de la USC. Gracias a su asistencia, esperamos contar en breve con herramientas que nos permitan aumentar el número de criterios en las búsquedas complejas. Con ello crecerá también, obviamente, la rentabilidad del corpus. Por lo que a la codificación se refiere, la reforma no ha sido profunda, pero sí extensa; lo bastante como para no poder presentarla en unas pocas líneas.

Antes anunciamos uno de los aspectos de la reforma: el cambio de %err (error) por %par (particularity). Ha llegado el momento de exponer los motivos que nos condujeron a ello. El empleo de la etiqueta %err nos ha parecido inconveniente, en primer lugar, por sus desagradables connotaciones prescriptivistas. Cuando se habla de "error" en materia de lenguaje, vienen a la memoria las "reglas" de la antigua gramática normativa: reglas a menudo artificiosas, carentes de soporte en la realidad del habla. Quienes se afanaban en señalar tales o cuales "errores" en el hablante adulto, las más de las veces estaban demostrando estrechez de miras: incapacidad de percatarse de lo que es "normal" en el discurso oral (piénsese, por ejemplo, en las llamadas concordancias ad sensum). Cuando acertaban a identificar usos en verdad "anormales", solían limitarse a condenarlos; raras veces se esforzaban por descubrir los factores desencadenantes. Si tal enfoque prescriptivo es inadecuado para estudiar el habla adulta (que responde a un sistema estable en sus rasgos esenciales), más aún lo será para estudiar el habla infantil (en la cual se plasma un sistema en devenir, en construcción). No terminan aquí los problemas que genera la utilización de %err. Existe uno más, fácil de pasar por alto, pero no por ello desprovisto de gravedad. Cuando levanta acta de los "errores" de los informantes, el investigador da a entender que sabe qué es lo "correcto" en cada caso, es decir, que sabe cuál es la forma o construcción que debía haberse utilizado. Si se trabaja con adultos, puede ser bastante sencillo determinar dónde tenía que hacer blanco la flecha, por decirlo de algún modo. Ahora bien, cuando se opera con niños inmersos en el proceso adquisitivo, no tardan en surgir obstáculos considerables. La brevedad de sus intervenciones, su propensión al "egocentrismo", hacen difícil determinar qué mensaje quieren comunicar. Obviamente, ello complica la tarea de averiguar si le han dado la articulación lingüística apropiada.

La reforma no se ha cifrado en el simple reemplazo de %err por %par. Ha afectado también a la clasificación de las particularidades. Antes de entrar en materia, deseamos hacer una aclaración: la introducción de modificaciones no debe verse como una práctica insólita. Los propios creadores de CHILDES se percataron desde un principio de que los investigadores querrían hacer cambios, y no juzgaron que ello entrañase peligro alguno. En el manual de codificación, antes de enumerar precisamente los tipos de errores posibles y las etiquetas correspondientes, reconocían sin rodeos la inevitabilidad de las reformas: "For those who wish to do further analysis, this section provides an initial set of codes. Researchers will surely wish to add to this set" (apdo. 14.2). Así pues, nosotros nos hemos limitado a franquear una puerta que el equipo de MacWhinney dejó abierta. Dicho esto, ya podemos ofrecer una visión global de nuestras decisiones en este terreno. Obedecen todas ellas a la necesidad de armonizar la clasificación de particularidades con las características estructurales de las lenguas de nuestros informantes, o sea, del gallego y del castellano. Esta armonización es un requisito indispensable para que la clasificación sea exhaustiva, es decir, para que abarque todos los fenómenos singulares observables en el habla de los sujetos. Quisiéramos dejar claro que estos pasos no los dimos por puro capricho, antes de haber tenido trato con los datos. Las posibles modificaciones empezaron a discutirse cuando terminó la transcripción del corpus, y se dio comienzo -no es una tarea concluida- a su aprovechamiento en la investigación concreta.

Fue entonces, en efecto, cuando se vieron los inconvenientes de una excesiva fidelidad a la clasificación recogida en el manual de CHILDES. Según declaran los autores (apdo. 14), su propuesta se basa en la colección de "speech errors" reunida por J. P. Stemberger en The lexicon in a model of language production (New York: Garland. 1985). Stemberger presenta en su obra un corpus de 6.300 errores recogidos a lo largo de tres años. Todo el material es fruto de una atenta observación de las producciones espontáneas emitidas por informantes adultos (el de menor edad tiene dieciséis años) que dominan el inglés como primera lengua. Sobre esa sólida base, elabora una clasificación elemental: los "errores" se agrupan en función del componente afectado (fonológico, morfo-fonológico, morfológico, sintáctico, léxico) y del tipo de proceso que se opera (adición, supresión, sustitución, etc.). Si el investigador lo cree preciso, puede hacer más detallada la caracterización de los "errores": el manual de CHILDES ofrece códigos adicionales para los componentes fonológico, morfológico y sintáctico. Ahora bien, por lo que se refiere a los últimos componentes, la nómina de códigos no es del todo satisfactoria. Cuando menos, no lo es desde el punto de vista de quien trabaja con sujetos gallego o castellanohablantes. Esta relativa inadecuación no debería ser causa de extrañeza. Hay que tener siempre presente que la clasificación fue diseñada por estudiosos anglófonos, y que éstos pensaban, sobre todo, en los posibles "errores" de los hablantes del inglés. Ello explica, por ejemplo, la escasez de códigos específicos para los fenómenos sintácticos. A excepción de $POS, que marca "errores" en la posición de los elementos (decisiva en la arquitectura de la cláusula en inglés), no se encuentra ningún código que remita a particularidades construccionales sensu stricto. Además, en la codificación morfológica hay duplicidades aparentemente afuncionales: los "errores" se pueden etiquetar según la posición del ítem implicado ($PRE, error involving prefix; $SUF, error involving suffix; $NFX, error involving infix), o según la función que aquel desempeña en la constitución de la palabra ($NFL, error involving inflection; $DER, error involving derivation). Esta duplicidad de sistemas de etiquetado -presentada a lo mejor con la intención de ofrecer un número mayor de códigos al transcriptor- podría llegar a ser un obstáculo a la hora de recuperar la información.

Considerando todo ello, decidimos sopesar la rentabilidad de cada etiqueta a la luz de los datos que obraban en nuestro poder. Además, propondríamos etiquetas nuevas si nos parecía oportuno. Ésta no es tarea "menor". El refinamiento de la codificación puede llegar a requerir tanto tiempo como la transcripción de todas las emisiones registradas. Exige perseverancia por parte de quienes se responsabilizan. Cada vez que se contempla la posibilidad de introducir un nuevo código, tienen que revisarse todas las particularidades del nivel en cuestión (morfológico o sintáctico), determinar cuáles podrían agruparse bajo la etiqueta propuesta, y comprobar que la clase resultante posea suficiente homogeneidad y suficiente número de ejemplares. Si se cumplen estas dos últimas condiciones, habrá que regresar a las transcripciones, e introducir el nuevo código en todos los casos en que sea necesario. Dadas las dimensiones de la empresa, se comprenderá que hasta ahora sólo pudiésemos trabajar los componentes morfológico y sintáctico. En una fase posterior, pensamos ocuparnos de otros campos; particularmente de la pragmática, de ordinario tan olvidada. Por supuesto, no descartamos nuevas aproximaciones a la morfología o la sintaxis; la nuestra es una clasificación permanentemente abierta a una revisión. A continuación presentamos los códigos nuevos que hasta ahora hemos acuñado, y ofrecemos algunas breves indicaciones sobre su uso.



CUADRO 10. Clasificaciones de los usos particulares del lenguaje infantil

 NIVEL
 LINGÜÍSTICO
 CÓDIGO  APLICACIONES  EJEMPLOS
MORFOLOGÍA$NOU
(< ing. noun inflection)

- Formas nominales cuyas propiedades gramaticales (género, número) no presentan la manifestación material que cabría esperar

 azulis = azuis

 marrona = marrón
$VER
(< ing. verb inflection)

- Formas verbales cuyas propiedades gramaticales (tiempo, modo, aspecto, etc.) no presentan la manifestación material que cabría esperar

 estuvi = estuve

 ponió = puso
$WFO
(< ing. word formation )

- Palabras derivadas posibles desde el punto de vista del sistema, pero inexistentes en la norma adulta

- Palabras derivadas en las que el afijo derivativo no toma la forma que la base requiere en el lenguaje adulto

 floritas = florecitas

 trabajaderos = trabajadores
SINTAXE$CON
(< ing. construction)

- En las palabras con flexión casual: selección de un "caso" diferente del que, en el lenguaje adulto, corresponde a la posición sintática que ocupan

- En las palabras sin flexión casual: omisión o sustitución del índice funcional que, en el lenguaje adulto, corresponde a la posición sintática que ocupan

 a pala = coa pala

 yo = a mí
$AGR
(< ing. agreement)

- Falta de concordancia entre dos constituyentes frásticos o clausales que, en el lenguaje adulto, concuerdan obligatoriamente

 blanca = blanco

 pica = pican
$PRE
(< ing. presentation )

- Omisión, sustitución o empleo imprevisto de cualquiera de las formas (libres o semi-libres) que enraízan las expresiones nominales en el contexto verbal y extraverbal

 abuelo uno = un abuelo

 me gusta miel = me gusta la  miel
$ELL
(< ing. ellipsis )

- Omisión de un constituyente clausal cuya presencia se esperaría en el lenguaje adulto

 ete malo = este é malo

 tú bueno = tú eres bueno
BILINGÜISMO$MIX
(< ing. code-mixing)

- Enunciados en los que se combinan materiales léxicos de la lengua A con afijos flexivos propios de la lingua B

- Enunciados en los que combinan palabras de la lengua A con arreglo a esquemas propios de la lingua B

 uno de estes = uno de estos

 la mi mabuela = mi abuela

NOTA: El contexto en el que aparecen los ejemplos citados puede conocerse dando un click sobre ellos. Se ha utilizado el formato pdf para facilitar el acceso.



Al diseñar los nuevos códigos, hemos procurado reducir las incertidumbres, las dudas sobre la ubicación que corresponde a un fenómeno concreto. Ahora bien, su completa eliminación es imposible. Lo es, ante todo, porque el número y la diversidad de peculiaridades que se pueden encontrar en más de 50 horas de grabación es amplísimo. Algunos de esos fenómenos dignos de atención no encontrarán fácil acomodo bajo ninguna de las etiquetas, o tal vez lo encontrarán bajo dos de ellas. Para percatarse de ello basta pensar en el solapamiento que acompaña al código $MIX. Esta etiqueta se ha creado para recoger todas las particularidades gramaticales que puedan achacarse al influjo de una segunda lengua. Dicho de otra manera: para recoger todas las interferencias que se den en los niveles morfológico y sintáctico. Pues bien, es obvio que tales interferencias pueden afectar a la flexión nominal ($NOU) o verbal ($VER), a la derivación ($WFO), a los marcadores de las relaciones de dependencia ($CON), etc. Es preciso resignarse a la existencia de solapamientos como estos. Sin embargo, ello no impide advertir sobre la conveniencia de corregir los excesos que pueden producirse a este respecto. Bien conocida es, por ejemplo, la tentación de algunos autores de descubrir casos de elipsis ($ELL) de forma abusiva.

Antes de dar por cerrado este capítulo, y para evitar malentendidos, quisiéramos advertir que el etiquetado no es un trabajo mecánico. El investigador que etiqueta se ve forzado, ante todo, a tomar decisiones con trasfondo teórico. Quiéralo o no, debe comprometerse (en mayor o menor medida) con una concepción de las lenguas y de su estructura. Para ello se necesitan conocimientos que van mucho más allá de unas cuantas nociones de gramática escolar. A esto se añade una dificultad no menor. Puesto que los informantes son niños que están adquiriendo la primera lengua, el codificador no puede limitarse a "oír", como quien escribe al dictado de forma semi-automática. Debe "escuchar", prestar atención al contexto verbal y extraverbal de los enunciados. Sólo así podrá captar las intenciones comunicativas de los sujetos, condición sine qua non para el descubrimiento de peculiaridades en sus emisiones. Quien no está seguro de haber entendido, no puede estarlo de haber reconocido rasgos singulares.





4. Representatividad y utilidades del corpus

La muestra satisface los requisitos necesarios para ser considerada representativa. No sólo por sus grandes dimensiones, sino también:

    1. por la representación equilibrada de los dos sexos (en total, 34 niños y 37 niñas)
    2. por el alto grado de continuidad en el seguimiento (en una franja de edad no muy trabajada, además)
    3. por la variada extracción social de los niños, debida a la selección de guarderías situadas en entornos diferentes.

El corpus resulta innovador y presenta utilidades claras en por lo menos tres frentes generales:

    1. como fuente de datos sobre el desarrollo del español (y, en menor medida, del galego) en un período tan crucial como poco estudiado
    2. como observatorio de tendencias adquisitivas en distintas vertientes de la lengua (fonética, gramática o pragmática)
    3. como proveedor de posibles cánones en diferentes fases del proceso evolutivo, que bien podrían tomarse como punto de referencia para valorar casos particulares.




5. Enlaces para acceder al corpus

Actualmente es posible consultar todas las transcripciones que integran el corpus a través de la página de CHILDES. A continuación ofrecemos los enlaces para acceder al material que consideramos pertinente:


El ISBN asignado al corpus Koiné es el 1-59642-273-4. Si los datos del corpus se emplean en algún trabajo es imprescindible advertir sobre su procedencia y citar, cuando menos, una de las publicaciones de este grupo.





6. Materiales y datos diversos


Taller. Las Jornadas sobre eficacia comunicativa y evaluación del habla infantil y afásica (Santiago de Compostela, noviembre-diciembre de 2005) incluyeron un taller sobre el proceso de transcripción. En el se ofrecía una aproximación a la labor transcriptora destinada a aquellas personas que nunca han tenido contacto ni con CHILDES, ni con cualquier otro sistema. El material repartido entre los asistentes puede consultarse aquí en versión pdf:

Panel. Tanto el proyecto de investigación como el corpus fueron presentados en el VII Congrès de Linguistica General (Barcelona, abril de 2006). Los datos se ofrecieron a través de un panel y de una presentación en powerpoint. La información expuesta puede consultarse aquí: