APLICACIÓN EXPERIMENTAL DEL MUESTREO DE MARCOS MÚLTIPLES EN ESTADÍSTICAS AGRÍCOLAS CONTINUAS USANDO IMÁGENES DE SATÉLITE, UN SIG E INFORMACIÓN DEL CENSO AGRÍCOLA.

Geog (PhD) Zuleima Molina Mora

Centro de Procesamiento Digital de Imágenes

Fundación Instituto de Ingeniería. Caracas. Venezuela.

E-mail: zuleimam@fii.org. Fax: 9034781

 

INTRODUCCIÓN

Este proyecto de investigación realizado conjuntamente entre el CONICIT – Ministerio de Agricultura y Cría (MAC) y la Fundación Instituto de Ingeniería (FII) plantea desarrollar a nivel regional un sistema operacional de estadísticas agrícolas que suministre información sobre producción agropecuaria, así como datos económicos y sociales relacionados con el sector. La metodología está basada en estimaciones estadísticas combinada con información proveniente de imágenes de satélite para generar indicadores que den soporte a la gestión en el sector agropecuario. Se pretende la combinación de técnicas estadísticas de Marcos Múltiples de Muestreo (marcos de área y marcos de lista) y la aplicación de un Sistema de Información Geográfica que permita aligerar los procesos de implementación.

AREA DE ESTUDIO

El estado Yaracuy se localiza aproximadamente entre las coordenadas (UTM): 468000, 1085000 y 589000, 1194000 (figura 1), con una superficie y población aproximada de 6420 Km2 y 400.000 hab. respectivamente. Está conformado por 14 municipios y su base económica es agrícola, dedicada básicamente a la ganadería y a los cultivos de maíz, caña de azúcar, café y frutales.

METODOLOGÍA

Dentro de este gran objetivo propuesto, la fase metodológica contratada al Centro de Procesamiento Digital de Imágenes (CPDI) permitió obtener los Marcos de Muestreo de Área sobre las que el MAC, a través de la aplicación de encuestas en campo, obtendrá las estadísticas agrícolas.

Las metodologías propuestas en el Marco de Muestreo Múltiple (MMM) para obtener los tres Marcos de Muestreo de Áreas, presentan variaciones, así, la primera se basa en el uso exclusivo de información proveniente del Censo Agrícola, la segunda de información obtenida de la interpretación, bajo ciertos criterios, de una imagen de satélite y la tercera de la sectorización del espacio analizado a partir de una cuadrícula de tamaño de celdas diferencial. Cada uno de estos aspectos debe ser probado sobre el área piloto, en este caso el estado Yaracuy, y seleccionar la metodología a aplicar para los demás estados del país. En todos los procesos automatizados que tratan información vectorial se utilizó el programa ARC-INFO y para la información raster ERDAS IMAGINE

En lo que concierne al CPDI, la forma en que fueron seguidos cada uno de los aspectos metodológicos, los problemas encontrados y la solución de los mismos, así como los resultados obtenidos se comentan a continuación.

1.- ASPECTOS GENERALES

El paso inicial consistió en actualizar la información a ser usada de base en cada uno de los marcos. Para ello, se realizó una revisión de la división político territorial del estado Yaracuy y la actualización de la información planimétrica (vialidad e hidrografía). En el proceso de actualización fue utilizada una imagen del satélite Landsat TM. La cartografía digital referida a vialidad e hidrografía a escala 1:100.000 se muestra en las figuras 2 y 3. Por su parte, la división municipal actualizada superpuesta sobre la imagen TM, se muestra en la figura 4.

 

También se realizó una corrección geométrica y realces a la imagen, que implica el uso de técnicas de ajuste de contrastes y aplicación de filtros. Esto permitió, por una parte, ajustar la geometría de la imagen a un sistema cartográfico de referencia y, por la otra, mejorar el aspecto visual de los elementos presentes en ésta, aspectos de gran importancia en la actualización cartográfica.

2 MMM1: DEFINICIÓN DE ÁREAS DE MUESTREO A PARTIR DE LOS SECTORES AGRÍCOLAS

Para obtener las áreas de muestreo a partir de los sectores agrícolas se procedió a trabajar sobre los sectores agrícolas definidos por el Censo Agrícola en julio de 1997. Estos sectores se encontraban, inicialmente, en croquis individuales no georeferenciados.

Tomando como referencia dichos croquis, se procedió a su traslado a una base topográfica a escala 1:100.000, donde se anexaron los límites político – administrativos actualizados, tanto estadales como municipales y parroquiales.

Una vez realizado el vaciado cartográfico de los 176 sectores agrícolas sobre la base georeferenciada, se procedió a su conversión a formato digital. El estado Yaracuy está contenido por 10 cartas, de manera que el siguiente paso fue el de generar un mosaico digital con estas cartas. Se procedió, posteriormente, a corregir los errores inherentes a la digitalización (presencia de arcos colgantes, polígonos sin cerrar, etiquetado, etc.). El mapa resultante se conectó a una base de datos descriptiva.

El MAC realizó, a partir de este mapa y usando métodos estadísticos, la selección de 24 sectores agrícolas sobre los cuales serán definidos segmentos agrícolas

El próximo paso de la metodología consistió en realizar el vaciado de los segmentos agrícolas sobre los 24 sectores seleccionados

Finalizado este trabajo, el MAC seleccionó a partir de la aplicación de técnicas de muestreo estadístico 24 segmentos agrícolas, es decir, uno por cada sector agrícola previamente seleccionado.

Los sectores y segmentos agrícolas seleccionados se muestran en la figura 6

Una vez preparados los segmentos sobre la cartografía, el próximo paso de la metodología consistió en solicitar a Cartografía Nacional las fotografías de contacto y localizar los segmentos en éstas.

Sobre las fotografías aéreas ampliadas fueron identificados cada uno de los segmentos agrícolas y delimitados elementos planimétricos y toponímicos, de manera que se facilitara su ubicación por parte de los encuestadores de campo.

Por último, el equipo MAC realizó la aplicación de las encuestas que permitirán obtener las estadísticas agrícolas y la evaluación de este aspecto de la metodología.

3 – MM2: DEFINICIÓN DE ÁREAS DE MUESTREO A PARTIR DE LA DEFINICIÓN DE UNIDADES PRIMARIAS Y SEGMENTOS DE MUESTREO.

Para definir las áreas de muestreo en esta metodología construyó el marco de área a partir de la imagen del satélite Landsat-TM de fecha 15/12/1997. Se utilizó la imagen corregida geométricamente y con realces de contraste.

Estratificación del área por usos del suelo.

Sobre esta imagen se realizó una estratificación del área por usos del suelo, tomando como referencia la definición de estratos y subestratos (áreas homogéneas desde el punto de vista agrícola) existentes para Yaracuy, y cuya información fue cedida por el MAC. Esta estratificación se realizó por interpretación visual en pantalla. La figura 7 muestra la estratificación realizada, considerando los estratos: 10,20,30,40,50,60,70 y 80.

Para validar la estratificación realizada se llevó a cabo un trabajo de verificación en campo durante 4 días

Construcción de las Unidades Primarias de Muestreo.

Una vez constatada la precisión en la identificación de los estratos, se decidió que para obtener las Unidades Primarias de muestreo (equivalente a los sectores agrícolas en la anterior metodología) se debería incluir otros criterios distintos a los de uso. Los criterios adicionales a ser incorporados fueron:

    1. Deben tener límites espaciales reconocibles
    2. Su tamaño será diferencial de acuerdo al estrato al que pertenezcan. Así:
    3. Estrato Tamaño(Km2) Margen de error

      Estrato 10, y 20 5 (4,5 – 5,5)

      Estrato 30 10 (9,5 – 10,5)

      Estrato 40, 50, 60,70 y 80 20 (19 – 21)

      c) Deben pertenecer única y exclusivamente a un municipio

      Una vez definidas, según estos criterios, las UPMs, los resultados preliminares fueron entregados a personal del MAC para su evaluación. Posteriormente, se procedió sobre la capa definitiva de UPMs (Figura 8) a introducir la información temática correspondiente a cada UPM.

      Selección de UPMs y Construcción de Unidades Secundarias de Muestreo (USMs)

      Sobre un listado, entregado al personal del MAC, que contiene cada una de las 646 UPMs con sus atributos respectivos, se seleccionaron a partir de métodos estadísticos 24 UPMs.

      Sobre las UPMs, seleccionadas se procedió a definir las unidades secundarias de muestreo (segmentos), utilizando como marco de referencia las imágenes de satélite. Estas unidades deben cumplir los siguientes criterios:

      a) Por cada sector deben haber 5 USMs

    4. Deben tener límites espaciales reconocibles
    5. Su tamaño será diferencial de acuerdo al estrato al que pertenezcan. Así:

Estrato 10 y 20 (1 Km2)

Estrato 30 (2 Km2)

Estrato 40, 50, 60 y 70 (4 Km2)

Una vez definidos los segmentos, el equipo MAC realizó una selección estadística de un segmento por cada UPM. En la figura 9 se presentan las USMs seleccionadas.

Las ampliaciones fotográficas fueron preparadas según especificaciones del personal MAC. También fue preparada la cartografía 1:25.000 con la información planimétrica (hidrografía, vialidad y centros poblados) y la ubicación de cada segmento seleccionado. La figura 10 muestra un ejemplo de esta cartografía.

Por último, el equipo realizó la aplicación de las encuestas que permitió obtener las estadísticas agrícolas y la evaluación de este aspecto de la metodología.

4. - MM3 DEFINICIÓN DE ÁREAS DE MUESTREO A PARTIR DEL MÉTODO DE LA CUADRICULA

La construcción de cuadrículas constituye una forma de segmentar un territorio dado para la selección de áreas de muestreo. En este caso los procedimientos aplicados para obtener una malla cuadriculada sobre el estado Yaracuy fue conducido sobre la base de las siguientes premisas:

- Los límites entre estratos deben ser cuadriculados con el objeto de obtener cuadrículas completas.

- Los límites de los estados deben cortar las cuadrículas existentes, por lo cual se generan áreas de muestreo que no poseen la forma de cuadrículas.

- Las cuadrículas deberán ser numeradas en forma de serpentina, de izquierda a derecha y de arriba a abajo.

Contando con estas premisas, el enfoque elegido tratando de automatizar, en la medida de lo posible, este proceso fue el siguiente:

a.- Se creó una malla cuadriculada cuyo tamaño es diferencial dependiendo del estrato. Inicialmente, se crearon tres: 4 Km 2 para los estratos 40, 50 y 60; de 2 Km. 2 para el estrato 30; de 1 Km. 2 para el estrato 20 y de 1 Km. 2 para el estrato 10.

b.- Se tomó la capa de estratos y se transformó del formato vector a un formato raster. Para ello, sólo se usó el tamaño de celda de 4 km2. Una vez obtenida la capa raster con este tamaño de celdas, nuevamente se pasó al formato vectorial, quedando los límites de estrato perfectamente cuadriculados.

c.- A cada estrato de esta capa se le superpuso la malla cuadriculada que posee las celdas de tamaño diferencial en función del estrato. Con este procedimiento se obtuvieron todos los estratos cuadriculados.

d.- El paso siguiente consistió en ajustar las cuadrículas incompletas para tuviesen un tamaño apropiado (de acuerdo a lo señalado en las premisas). La figura 11 muestra el resultado final del proceso de reasignación.

- Finalmente, se numeraron las cuadrículas manualmente y en forma de espiral. De esta numeración se obtuvieron 3.006 celdas.

De este total de cuadrículas el equipo MAC, a través de métodos estadísticos, realizó la selección de 24 celdas que se muestran en la figura 12.

Al igual que en las dos anteriores metodologías, para cada una de las celdas seleccionadas, se solicitó una ampliación fotográfica. Por último, el MAC realizó la aplicación de las encuestas y la evaluación de este aspecto de la metodología.

5.- CÁLCULO DE SUPERFICIES AGRÍCOLAS A PARTIR DE IMÁGENES DE SATÉLITE.

Un objetivo secundario que estaba contemplado en este proyecto era el de realizar un ensayo del cálculo de superficies agrícolas utilizando como referencia el tratamiento digital de la imagen de satélite, adquirida dentro del marco de este proyecto.

En este sentido, la metodología utilizada consistió en clasificar digitalmente la imagen. Un proceso de clasificación digital consta de las siguientes fases: a) definición digital de las categorías (fase de entrenamiento), b) agrupación de los píxeles de la imagen en una de esas categorías (fase de asignación), y c) comprobación y verificación de resultados.

Atendiendo a este esquema metodológico el proceso seguido para obtener digitalmente una estratificación agrícola de la imagen que contiene al estado Yaracuy fue el siguiente:

  1. Definición de los campos de entrenamiento:
  2. Debido a que estamos trabajando con una imagen Landsat cuya resolución espacial es de 30*30 metros, la leyenda de trabajo o clases a categorizar está controlada por este hecho. Esta razón condujo a trabajar sólo a nivel de los estratos definidos por el Censo Agrícola y la cual se describe a continuación:

    Estrato 10. Superficies total o casi totalmente cultivadas

    Estrato 20. Superficies semicultivadas:.

    Estrato 30. Superficies marginalmente cultivadas

    Estrato 40. Mixto

    Estrato 50. Pastos

    Estrato 60. Bosques

    Estrato 70. Sin uso agropecuario

    Estrato 80. Urbano

    Las figuras anexas muestran algunos ejemplos de ventanas de la imagen donde se tomaron campos de entrenamiento.

    Fue necesaria la inclusión de dos categorías debido a su alta representación dentro de la escena Landsat. Las categorías incluidas son: las nubes y la proyección de sus sombras.

    Análisis de las estadísticas de entrenamiento:

    Antes de abordar el proceso de clasificación propiamente dicho, es preciso evaluar la viabilidad de que esas categorías puedan clasificarse sin grave riesgo de error. Para ello, existen varios métodos tanto gráficos como numéricos que permiten evaluar las estadísticas de entrenamiento. En nuestro caso, se ha optado por dos procedimientos numéricos. El primero está definido por un análisis de las estadísticas elementales que definen cada categoría y el segundo por la construcción de una matriz de separabilidad.

    Las estadísticas presentan una tendencia a tener valores más parecidos (media y desviación) en las clases que contienen elementos similares, tal es el caso de las áreas de cultivos y, mayores diferencias en las clases disímiles, tal es el caso de las nubes, agua, pastos y bosques. Por otra parte, un análisis de separabilidad estadística (Divergencia Transformada) mostró que la mayoría de las categorías presentan una buena separabilidad, con valores que exceden la separabilidad promedio (1,84).

  3. Fase de asignación.
  4. En esta fase se trata de adscribir cada uno de los píxeles de la imagen a una de las clases previamente seleccionadas. Fruto de esta fase será una nueva imagen, cuyos ND expresen la categoría temática a la que se ha adscrito cada uno de los píxeles de la imagen original.

    Para realizar este proceso, el clasificador utilizado fue el de máxima probabilidad

    Una vez aplicado este clasificador se obtuvo una imagen categorizada. La figura 14 muestra una composición de mapa donde están representados espacialmente los resultados obtenidos.

    Como comentario final vale destacar que existe una lógica en la asignación, puesto que las áreas más densamente cultivadas se localizan en mayor proporción en los valles de los ríos Yaracuy y Aroa, las categorías mixto y marginalmente cultivado en las zonas de piedemonte y montaña, los bosques en las zonas más altas y los centros urbanos más diseminados por el área.

  5. Fase de validación:

El producto de una clasificación, ya sea esta visual o digital, es un mapa temático. La fiabilidad de este documento cartográfico depende, principalmente, de la metodología adoptada y de la calidad de los datos sobre los que se aplica. En nuestro caso, la validación se realizó comparando el estrato definido en 10 puntos tomados de manera aleatoria sobre la imagen clasificada, con la definición de estratos dada para esos mismos 10 puntos en la capa de sectores agrícolas.

De acuerdo al proceso de validación realizado, el nivel de precisión alcanzada en la identificación de los diferentes estratos o categorías fue 60%.

6 CONCLUSIONES

1.- La evaluación, en términos de tiempo, recursos económicos y resultados obtenidos, de las tres metodologías aplicadas para obtener los Marcos de Área permitió concluir que:

  1. La MM2 resultó la mejor evaluada en los tres parámetros considerados, permitiendo un control absoluto sobre los límites espaciales y la superficie contenida tanto en las UPMs como en USMs .
  2. La MM3 aunque resultó de bajo costo y tiempo de ejecución tiene el inconveniente de que no llega a nivel de segmentos, por el contrario permite trabajar sólo con el equivalente a sectores en la MM1 o a UPMs en la MM2.
  3. La MM1 resultó la más costosa por la cantidad de horas hombre invertida en el proceso de traslado de la información a una fuente georreferenciada y por la cantidad de problemas inherentes al levantamiento de la información

2.- Las imágenes de satélite Landsat – TM resultaron una herramienta eficiente para la delimitación de sectores y segmentos, sin embargo, se recomienda el uso de imágenes de mayor resolución espacial que puedan participar de forma más eficiente en el proceso.

3.- la clasificación digital, a partir de campos de entrenamiento tomados de la imagen, aunque resulto idónea para una estratificación gruesa, no lo es para el reconocimiento detallado de tipos de cultivos, se recomienda la construcción de curvas espectrales por tipo de cultivo y usarlas como campos de entrenamiento.