
|
Presentación
Proyectos de investigación
Actividades
Resultados
Enlaces
Área reservada
|
Exploración de capacidades metalingüísticas en el lenguaje infantilResultados. CorpusGuión: La elección del espacio. Con el propósito de que las producciones verbales de los niños manifestasen un alto grado de "naturalidad", se decidió grabarlos en un ámbito que les resultase conocido. Fue necesario, pues, introducirse en su entorno. En un primer momento, circunstancias de orden práctica (facilidades de acceso, posibilidad de registrar producciones de muchos niños de forma simultánea, etc.) motivaron la elección de la guardería como escenario de trabajo. Se rechazó la casa familiar a causa de las dificultades que se tendrían que salvar para acceder a ella (recelos de los padres, posible incompatibilidad de horarios entre éstos y las investigadoras, etc.). Además, la presencia de cualquier de los progenitores podía introducir "distorsiones" indeseables: su tendencia a corregir, completar y glosar, les lleva a veces a ocultar las emisiones de los niños. Grabar a éstos en el hogar implicaba correr el riesgo de escuchar antes a los padres que a ellos mismos. A todo esto se añadía el hecho de que la guardería nos permitía observar diversos tipos de interacciones: no sólo podíamos examinar el contacto del niño con el adulto, sino también la conducta de éste con otros niños. Las escuelas infantiles se presentaban, pues, como un buen espacio de trabajo. Con la selección de guarderías en las que se iban a realizar las grabaciones, se quiso ofrecer una muestra razonablemente representativa de la diversidad lingüístico-cultural de Galicia. Con otras palabras: evitar la sobrerrepresentación de una zona, o el predominio abusivo de un determinado tipo de asentamiento poblacional. Evidentemente, las limitaciones tanto de tiempo como de recursos humanos disponibles, han actúado condicionando el resultado final. Aún así, se consiguió trabajar en tres de las cuatro provincias gallegas, y en centros ubicados en localidades con características muy diversas. Además de los datos contenidos en el cuadro 1, hay que señalar, a este respecto, que Santiago de Compostela y Lugo son poblaciones de 90.000 habitantes, mientras que A Estrada tiene tan sólo 15.000 habitantes. CUADRO 1. Datos de las guarderías seleccionadas
Mecánica de las sesiones: los métodos empleados en la recogida de datos. La búsqueda de la "naturalidad" fue también el principio que presidió el desarrollo de las sesiones. Los primeros encuentros constituyeron meras tomas de contacto. Con esto se conseguía que los niños se fuesen familiarizando con las investigadoras. Todas las sesiones fueron grabadas en VHS (posteriormente se pasaron a CD y DVD). Se decidió utilizar este soporte porque, al disponer de imagen y de sonido, la información recuperada puede ser más diversa y más completa. Por lo que respecta a las técnicas de recogida de datos, se tuvo en cuenta la necesidad de captar la conducta lingüística "natural" del niño. Como las de los adultos, las emisiones infantiles son, en primer lugar, instrumentos que se utilizan en la interacción con los demás, palancas que sirven para moverlos en una o en otra dirección. Es conveniente, pues, registrar las emisiones tal y como surgen en el decurso de los procesos comunicativos. Por esta razón, se le otorgó especial relevancia al registro de la conversación espontánea de los niños, adoptando así las investigadoras un papel básicamente pasivo. Ahora bien, también se emplearon procedimientos de elicitación, para explorar la dimensión representativa del acto verbal, y los recursos lingüísticos que "moviliza". Así, había momentos en los que las investigadoras tomaban la iniciativa, pidiendo a los niños que relatasen un determinado cuento, sometiéndolos a pruebas de denominación... Las "dosis" de conversación espontánea y de elicitación no estaban fijadas de antemano, sino que variaban en función de la edad y del comportamiento de los niños. Duración. La media era de unos 15-20 minutos. Las variaciones eran grandes, debido a que siempre se tomó en consideración la actitud de los niños ante los requerimientos y las incitaciones que se les dirigían. Cuando se mostraban poco participativos, la sesión podía no extenderse más allá de los cinco minutos; cuando daban muestras de interés, alcanzaba una duración de media hora (no se dilataba más, para que no apareciesen la fatiga y el tedio). Esta flexibilidad es una nueva prueba de la naturalidad que en todo momento se perseguía. Número de participantes. Por lo general, durante las sesiones había entre 4 y 5 niños en el aula, aunque las fluctuaciones también fueron considerables en este punto: por encima de la fidelidad a un patrón fijo y preestablecido estaba la comodidad de los niños. Se procuró, eso si, que los dos sexos estuviesen representados en la mayor parte de las sesiones. Entre los niños y las niñas hay diferencias (especialmente acusadas en el plano pragmático) que hacen poco recomendables las extrapolaciones y las inferencias apresuradas. Ésta es la razón por la que se puso mucho empeño en que cada uno de ellos tuviese una amplia representación. Lapso de tiempo empleado en la recogida de datos. Las grabaciones se llevaron a cabo a lo largo de cuatro años (entre 1996 y 2000), con una periocidad que aspiraba a ser quincenal. "Aspiraba a ser ", pues cuando se trabaja con niños no caben los programas de grabación rígidos. Como es obvio, el contacto con los informantes se interrumpía en los períodos vacacionales; a esta situación se añadía el hecho de que algunos asistían a la guardería de manera irregular, o se mantenían pasivos durante unas cuantas sesiones. A pesar de estos pequeños problemas, hay que dar por cumplido el objetivo de haber hecho en un buen número de casos un seguimiento longitudinal. Los cuadros que se ofrecen a continuación contiene datos sobre las grabaciones que se hicieron en cada una de las guarderías. Conviene advertir que sólo figuran aquellas sesiones que han podido transcribirse. Queran fuera, por tanto, las que se han desechado, ya sea por la mala calidad de sonido, ya sea porque los niños se comportaban de manera anárquica o permanecían en un mutismo casi absoluto. Debe señalarse que la pérdida de unas pocas sesiones es un hecho irrelevante, ya que el número de las que sí pudieron utilizarse es alto. Son, en efecto, un total de 166 sesiones (47 en Breogán, 44 en Vite, 28 en Sta. Susana, 33 en Elfos, y 14 en Milagrosa) que suman cerca de 50 horas de grabación. CUADRO 2. Datos de las grabaciones de Breogán
CUADRO 3. Datos de las grabaciones de Vite
CUADRO 4. Datos de las grabaciones de Sta. Susana
CUADRO 5. Datos de las grabaciones de Elfos
CUADRO 6. Datos de las grabaciones de Milagrosa
Número. En las sesiones estuvieron presentes más de 70 niños. Algunos de ellos no merecen el calificativo de "informantes", ya que sus intervenciones fueron verdaderamente escasas. Aún así, podemos considerar que la recogida de datos tuvo un éxito más que notable, pues se registraron intervenciones de 34 niños y 32 niñas. A estos 66 informantes podríamos sumar 5 niñas de las que no nos consta la edad que tenían al ser grabadas. Manejamos, por tanto, como cifra total la de 71 informantes. Uso de las lenguas. Cuando se iniciaron las grabaciones se esperaba obtener datos que permitiesen estudiar la adquisición del gallego y del castellano, las dos lenguas oficiales y usuales en la Comunidad Autónoma de Galicia. Parecía razonable suponer que el gallego tendría una presencia significativa tanto en A Estrada (población situada en una zona rural), como en Santiago de Compostela y Lugo (ciudades a las que se les atribuye un uso del gallego bastante amplio). Estas expectativas se vieron parcialmente defraudadas. Los niños de padres gallegohablantes comienzan a asumir, ya desde la guardería, las relaciones jerárquicas que existen entre las dos lenguas en el mundo de los adultos. Abandonan el gallego ante la presencia de una maestra o un compañero que habla la otra lengua. La escuela se convierte con rápidez en un espacio en el que el castellano es la lengua de uso habitual. El número de niños que se muestran ante el investigador como gallegohablantes es menor que en otros ámbitos. Esta actitud impidió recoger datos de informantes que empleen el gallego de forma exclusiva. No registramos este mismo comportamiento en el caso de los castellanohablantes: 29 niños se expresaron únicamente en castellano (vid. infra cuadro 7). Con todo, debemos señalar que hay 34 informantes que utilizan el gallego de manera ocasional (vid. infra cuadro 8), y que 8 lo emplean con asiduidad (vid. infra cuadro 9) . En fin, el camino recorrido hasta este momento nos demuestra que, si queremos disponer de un mayor número de producciones en gallego, tenemos que aproximarnos forzosamente a las guarderías ubicadas en el ámbito rural, espacio en el que esta lengua sigue poseyendo una presencia mayoritaria. Procedencia. Por lo que se refiere a la extracción social de los niños, también se procuró que fuese diversa. Así, por ejemplo, las guarderías compostelanas atienden, por su variada localización, a un vecindario muy diferente. Sta. Susana se encuentra en el corazón de la ciudad, entre el ensanche y la porción más florecente del casco antiguo. Vite se ubica en un barrio periférico habitado por trabajadores de clase media. Breogán, por último, está enclavada en uno de los dos campus universitarios, y acoge a hijos de miembros del persoal de la Universidad de Santiago de Compostela (tanto PAS como PDI). CUADRO 7. Informantes castellanohablantes que utilizan esta lengua de modo exclusivo
CUADRO 8. Informantes castellanohablantes que utilizan el gallego ocasionalmente
CUADRO 9. Informantes gallegohablantes que utilizan el castellano ocasionalmente
3. Las transcripciones y las codificaciones En la transcripción de los datos se recurrió al sistema CHILDES (Child Language Data Exchange System), que goza de gran difusión entre los especialistas en lenguaje infantil. Como es evidente, lo extendido de su uso facilita el aprovechamiento de los resultados por parte de toda la comunidad científica. Otra ventaja reseñable estriba en el hecho de que el formato de codificación de CHILDES (denominado CHAT, acrónimo de Codes for the Human Analysis of Transcripts), está asociado a un programa de rastreo de datos (denominado CLAN, acrónimo de Child Language Analysis Programs). Dado que cabía prever que el corpus alcanzase una considerable extensión, juzgamos imprescindible el poder recuperar y clasificar información automáticamente. De ahí que valorásemos CHILDES como la opción más interesante, y que nos decantásemos por él. No obstante, hemos visto que es posible precisar algunos aspectos en la codificación, y salvar algunas de las limitaciones en la herramienta de búsqueda. Por todo ello, estamos haciendo ciertas modificaciones en el sistema CHILDES. Más adelante daremos noticia de su alcance y sus objetivos. Con respecto a la codificación, señalaremos que CHAT se caracteriza por su notable flexibilidad. El repertorio de códigos preestablecidos es sobremanera exhaustivo; dichos códigos, sin adiciones, son suficientes para rotular un abanico de fenómenos bastante amplio (puede comprobarse consultando el manual de instrucciones que se encuentra en la dirección http://childes.psy.cmu.edu/). Además, si se estima necesario, cabe añadir códigos nuevos con plena libertad, pues ello no acarreará problemas a la hora de realizar rastreos mediante CLAN. Esta última posibilidad la hemos aprovechado, sobre todo, al hacer inventario de los usos que juzgamos propios, característicos del lenguaje infantil. Usos que indicamos con la etiqueta %par (< ingl. particularity 'particularidad'), y que CHILDES marca con %err (< ing. error 'error'). De la razón de ser de este cambio informamos en el siguiente apartado. 3.2. Modificaciones introducidas en el sistema CHILDES Como más arriba anunciamos, en este momento estamos haciendo pequeños retoques en CHILDES, que afectan tanto a las posibilidades de rastreo como a la codificación. Con respecto al primero de estos puntos, hay que decir que no se trata de reemplazar CLAN, sino de suplementarlo. Pese a que CLAN es una herramienta muy potente, no basta para satisfacer ciertas necesidades de rastreo que fueron surgiendo sobre la marcha, a medida que entrábamos en contacto con los datos. Para encontrar respuesta a estas demandas, hemos contado con la colaboración de Susana Sotelo Docío, investigadora especialista en lingüística informática, vinculada al Departamento de Lengua Española de la USC. Gracias a su asistencia, esperamos contar en breve con herramientas que nos permitan aumentar el número de criterios en las búsquedas complejas. Con ello crecerá también, obviamente, la rentabilidad del corpus. Por lo que a la codificación se refiere, la reforma no ha sido profunda, pero sí extensa; lo bastante como para no poder presentarla en unas pocas líneas.
Antes anunciamos uno de los aspectos de la reforma: el cambio de %err ( La reforma no se ha cifrado en el simple reemplazo de %err por %par. Ha afectado también a la clasificación de las particularidades. Antes de entrar en materia, deseamos hacer una aclaración: la introducción de modificaciones no debe verse como una práctica insólita. Los propios creadores de CHILDES se percataron desde un principio de que los investigadores querrían hacer cambios, y no juzgaron que ello entrañase peligro alguno. En el manual de codificación, antes de enumerar precisamente los tipos de errores posibles y las etiquetas correspondientes, reconocían sin rodeos la inevitabilidad de las reformas: "For those who wish to do further analysis, this section provides an initial set of codes. Researchers will surely wish to add to this set" (apdo. 14.2). Así pues, nosotros nos hemos limitado a franquear una puerta que el equipo de MacWhinney dejó abierta. Dicho esto, ya podemos ofrecer una visión global de nuestras decisiones en este terreno. Obedecen todas ellas a la necesidad de armonizar la clasificación de particularidades con las características estructurales de las lenguas de nuestros informantes, o sea, del gallego y del castellano. Esta armonización es un requisito indispensable para que la clasificación sea exhaustiva, es decir, para que abarque todos los fenómenos singulares observables en el habla de los sujetos. Quisiéramos dejar claro que estos pasos no los dimos por puro capricho, antes de haber tenido trato con los datos. Las posibles modificaciones empezaron a discutirse cuando terminó la transcripción del corpus, y se dio comienzo -no es una tarea concluida- a su aprovechamiento en la investigación concreta.
Fue entonces, en efecto, cuando se vieron los inconvenientes de una excesiva fidelidad a la clasificación
recogida en el manual de CHILDES. Según declaran los autores (apdo. 14), su propuesta se basa en la
colección de "speech errors" reunida por J. P. Stemberger en The lexicon in a model
of language production (New York: Garland. 1985). Stemberger presenta en su obra un corpus de 6.300
errores recogidos a lo largo de tres años. Todo el material es fruto de una atenta observación
de las producciones espontáneas emitidas por informantes adultos (el de menor edad tiene dieciséis años)
que dominan el inglés como primera lengua. Sobre esa sólida
base, elabora una clasificación elemental: los "errores" se agrupan en función del
componente afectado (fonológico, morfo-fonológico, morfológico, sintáctico,
léxico) y del tipo de proceso que se opera (adición, supresión, sustitución, etc.).
Si el investigador lo cree preciso, puede hacer más detallada la caracterización de los
"errores": el manual de CHILDES ofrece códigos adicionales para los componentes fonológico,
morfológico y sintáctico. Ahora bien, por lo que se refiere a los últimos componentes,
la nómina de códigos no es del todo satisfactoria. Cuando menos, no lo es desde el punto de
vista de quien trabaja con sujetos gallego o castellanohablantes. Esta relativa inadecuación no
debería ser causa de extrañeza. Hay que tener siempre presente que la clasificación fue
diseñada por estudiosos anglófonos, y que éstos pensaban, sobre todo, en los posibles
"errores" de los hablantes del inglés. Ello explica, por ejemplo, la escasez de
códigos específicos para los fenómenos sintácticos. A excepción de $POS,
que marca "errores" en la posición de los elementos (decisiva en la arquitectura de la
cláusula en inglés), no se encuentra ningún código que remita a particularidades
construccionales sensu stricto. Además, en la codificación morfológica hay
duplicidades aparentemente afuncionales: los "errores" se pueden etiquetar según la
posición del ítem implicado ($PRE, Considerando todo ello, decidimos sopesar la rentabilidad de cada etiqueta a la luz de los datos que obraban en nuestro poder. Además, propondríamos etiquetas nuevas si nos parecía oportuno. Ésta no es tarea "menor". El refinamiento de la codificación puede llegar a requerir tanto tiempo como la transcripción de todas las emisiones registradas. Exige perseverancia por parte de quienes se responsabilizan. Cada vez que se contempla la posibilidad de introducir un nuevo código, tienen que revisarse todas las particularidades del nivel en cuestión (morfológico o sintáctico), determinar cuáles podrían agruparse bajo la etiqueta propuesta, y comprobar que la clase resultante posea suficiente homogeneidad y suficiente número de ejemplares. Si se cumplen estas dos últimas condiciones, habrá que regresar a las transcripciones, e introducir el nuevo código en todos los casos en que sea necesario. Dadas las dimensiones de la empresa, se comprenderá que hasta ahora sólo pudiésemos trabajar los componentes morfológico y sintáctico. En una fase posterior, pensamos ocuparnos de otros campos; particularmente de la pragmática, de ordinario tan olvidada. Por supuesto, no descartamos nuevas aproximaciones a la morfología o la sintaxis; la nuestra es una clasificación permanentemente abierta a una revisión. A continuación presentamos los códigos nuevos que hasta ahora hemos acuñado, y ofrecemos algunas breves indicaciones sobre su uso. CUADRO 10. Clasificaciones de los usos particulares del lenguaje infantil
NOTA: El contexto en el que aparecen los ejemplos citados puede conocerse dando un click sobre ellos. Se ha utilizado el formato pdf para facilitar el acceso. Al diseñar los nuevos códigos, hemos procurado reducir las incertidumbres, las dudas sobre la ubicación que corresponde a un fenómeno concreto. Ahora bien, su completa eliminación es imposible. Lo es, ante todo, porque el número y la diversidad de peculiaridades que se pueden encontrar en más de 50 horas de grabación es amplísimo. Algunos de esos fenómenos dignos de atención no encontrarán fácil acomodo bajo ninguna de las etiquetas, o tal vez lo encontrarán bajo dos de ellas. Para percatarse de ello basta pensar en el solapamiento que acompaña al código $MIX. Esta etiqueta se ha creado para recoger todas las particularidades gramaticales que puedan achacarse al influjo de una segunda lengua. Dicho de otra manera: para recoger todas las interferencias que se den en los niveles morfológico y sintáctico. Pues bien, es obvio que tales interferencias pueden afectar a la flexión nominal ($NOU) o verbal ($VER), a la derivación ($WFO), a los marcadores de las relaciones de dependencia ($CON), etc. Es preciso resignarse a la existencia de solapamientos como estos. Sin embargo, ello no impide advertir sobre la conveniencia de corregir los excesos que pueden producirse a este respecto. Bien conocida es, por ejemplo, la tentación de algunos autores de descubrir casos de elipsis ($ELL) de forma abusiva. Antes de dar por cerrado este capítulo, y para evitar malentendidos, quisiéramos advertir que el etiquetado no es un trabajo mecánico. El investigador que etiqueta se ve forzado, ante todo, a tomar decisiones con trasfondo teórico. Quiéralo o no, debe comprometerse (en mayor o menor medida) con una concepción de las lenguas y de su estructura. Para ello se necesitan conocimientos que van mucho más allá de unas cuantas nociones de gramática escolar. A esto se añade una dificultad no menor. Puesto que los informantes son niños que están adquiriendo la primera lengua, el codificador no puede limitarse a "oír", como quien escribe al dictado de forma semi-automática. Debe "escuchar", prestar atención al contexto verbal y extraverbal de los enunciados. Sólo así podrá captar las intenciones comunicativas de los sujetos, condición sine qua non para el descubrimiento de peculiaridades en sus emisiones. Quien no está seguro de haber entendido, no puede estarlo de haber reconocido rasgos singulares. 4. Representatividad y utilidades del corpus La muestra satisface los requisitos necesarios para ser considerada representativa. No sólo por sus grandes dimensiones, sino también:
El corpus resulta innovador y presenta utilidades claras en por lo menos tres frentes generales:
5. Enlaces para acceder al corpus Actualmente es posible consultar todas las transcripciones que integran el corpus a través de la página de CHILDES. A continuación ofrecemos los enlaces para acceder al material que consideramos pertinente:
El ISBN asignado al corpus Koiné es el 1-59642-273-4. Si los datos del corpus se emplean en algún trabajo es imprescindible advertir sobre su procedencia y citar, cuando menos, una de las publicaciones de este grupo. 6. Materiales y datos diversos Taller. Las Jornadas sobre eficacia comunicativa y evaluación del habla infantil y afásica (Santiago de Compostela, noviembre-diciembre de 2005) incluyeron un taller sobre el proceso de transcripción. En el se ofrecía una aproximación a la labor transcriptora destinada a aquellas personas que nunca han tenido contacto ni con CHILDES, ni con cualquier otro sistema. El material repartido entre los asistentes puede consultarse aquí en versión pdf: Panel. Tanto el proyecto de investigación como el corpus fueron presentados en el VII Congrès de Linguistica General (Barcelona, abril de 2006). Los datos se ofrecieron a través de un panel y de una presentación en powerpoint. La información expuesta puede consultarse aquí: |