Loading
Пропустить Навигационные Ссылки.

Авторизоваться
Для зарегистрированных пользователей

Развитие методов локально-адаптивной классификации типов и оценивания количественных характеристик земного покрова для решения задач динамического картографирования биосферы на основе временных рядов данных дистанционного зондирования

Исследования и разработки в рамках данного раздела темы в 2018 году были направлены на создание метода локально-адаптивного построения эталонов динамики сельскохозяйственных культур по данным ДЗЗ с использованием входных данных о сельскохозяйственных полях, включающих информацию о культуре, обладающих значительным уровнем ошибки.

Метод основан на нахождении характерной локальной динамики сельскохозяйственных культур – эталонов – на основе имеющегося в наличии массива наземных данных и информации спутникового мониторинга. Эталоны в дальнейшем могут быть использованы для верификации имеющихся данных и определения полей, для которых наземные данные указаны некорректно.

Построение эталонов динамики сельскохозяйственных культур осуществляется на локальном уровне для каждого муниципального района территории России. Для построения эталона сельскохозяйственной культуры используются все засеянные ею поля в границах района. Требование статистической репрезентативности привело к введению минимально допустимого числа полей для построения эталона, равного 300.  Если число таких полей менее 300, то к ним добавляются ближайшие поля из других районов. Максимальный радиус агрегации полей составляет 300 км, если число полей в этом радиусе остается меньше 300, то эталон для данного района не строится.

Для выделения типичной динамики культуры выполняется кластеризация временных рядов NDVI всех полей. Метод k-средних позволяет выделить характерные сценарии изменения вегетационного индекса в течение сезона. Наличие нескольких характерных кривых динамики NDVI объясняется наличием погрешностей в данных. На рисунке 1 приведен пример кластеризации для полей «озимой пшеницы», на котором видно 4 характерных типа динамики NDVI: озимые (кластер 1), ранние (кластер 2) и поздние (кластер 3) яровые, а также угнетенные посевы (кластер 4).

 
Рисунок 1. Пример временных рядов NDVI и средних значений кластеров, полученных методом к-средних, для полей озимой пшеницы Горшеченского района Курской области, 2017 год

Для определения оптимального числа кластеров используется критерий, основанный на расстоянии между средними значениями NDVI каждого кластера, и вычисляемый по формуле:

Где i – номер недели, - значения индекса в одну неделю для разных кластеров. Расстояние считается попарно для всех возможных комбинаций кластеров, затем выбирается наименьшее из них. В случае если минимальное расстояние оказывается ниже порога в 0,1, то считается, что кластеры слишком похожи и кластеризация избыточна. Таким образом, кластеризация выполняется итеративно, начиная с варианта с 1 кластером и последовательно увеличивая их число на 1. При нарушении порога итерация заканчивается и используется последний адекватный вариант кластеризации, для которого минимальное расстояние выше порога.

Предполагается, что в большинстве районов погрешности данных характерны только для малой части всех полей района. Поэтому считается, что кластер, которому принадлежит наибольшее число полей, в большинстве случаев отражает истинную динамику культуры. На основе полей выбранного кластера рассчитывается локальный эталон данной культуры - многомерное нормальное распределение, в котором каждый элемент – это недельное значение NDVI.

Также на основе полей данного кластера можно оценить их типичный уровень однородности. Для этого для каждого поля оценивается вариация индекса NDVI в его границах для каждой недели. Эта вариация осредняется по всем полям и по всем неделям для получения характерного локального значения неоднородности.

В отдельных районах количество полей с неверно указанной культурой может превышать число полей с корректной культурой. В этом случае описанный выше подход может привести к построению эталона, характеризующего другую культуру. Если регионы с некорректными эталонами изолированы (то есть погрешности не преобладают на значительной части территории страны), то их можно выявить с помощью анализа эталонов близлежащих районов. Анализ эталонов происходит с помощью расстояния Бхаттачария, вычисляемого по формуле:

где    , а    – средние и ковариации нормального распределения.

Если расстояние ниже эмпирически подобранного порога 3, то считается, что эталоны неразличимы. Если эталон неотличим от большинства эталонов в ближайших районах, то можно предположить, что он адекватно характеризует динамику заданной культуры.

Эталон каждого района сравнивается с эталонами данной культуры других районов в окрестности радиуса 150 км. Берется 10 таких эталонов, для каждого из них оценивается его вес – число полей данной культуры в районе, деленое на минимальный размер выборки – 300. Если вес превышает 1, то его значение заменяется на 1. С помощью представленного ранее критерия оценивается, отличим ли эталон текущего района от эталонов соседних районов. Если текущий эталон неотличим от 66% всех эталонов (процент оценивается по их весам), то считается, что достигнут консенсус, и текущий эталон признается корректным. В противном случае анализ неразличимости выполняется для всех остальных эталонов, начиная с ближайшего. Если для одного из них достигается консенсус, то эталон текущего региона заменяется на консенсусный эталон. Если консенсуса не удается достичь, то в список районов добавляется еще один близлежащий район из окрестности 150 км и поиск консенсуса повторяется. Если после перебора всех районов консенсус не был достигнут, то эталон также остается без изменений.

Полученные описанным выше методом локально-адаптивные эталоны разных культур могут использоваться для верификации наземных данных о полях. В случае, если в районе отсутствует эталон данной культуры, верификация не может быть выполнена ввиду отсутствия статистики (не менее 300 полей данной культуры в ближайшей окрестности).

Также верификацию не проходят неоднородные поля. Для оценки однородности поля берется средняя пространственная вариация индекса NDVI в его границах. Поле считается однородным в случае, если медианная вариация вегетационного индекса на нем ниже, чем локальное пороговое значение, оцененное ранее на основе анализа эталонных полей. В противном случае поле считается неоднородным (предположительно частично засеянным другими культурами, подвержено эрозии, не относится к пашне и.т.д.), и не проходит верификацию.

Для проверки принадлежности поля к культуре вычисляется расстояние Махаланобиса между временным рядом NDVI и соответствующим эталоном по формуле

Известно, что для нормального распределения расстояние Махаланобиса распределено по закону хи-квадрат. Таким образом, используя кумулятивную функцию плотности вероятности хи-квадрат, можно задать порог на расстояние Махаланобиса, в котором лежит определенный процент полей, относящихся к заданному эталону. Эмпирически был выбран порог в 90%, если расстояние выходит за это значение, то поле считается выбросом и не проходит верификацию.

Для остальных полей происходит их сравнение с эталонами всех культур, за исключением культур, для которых характерны большие вариации в их поведении, например неиспользуемые земли, пары, многолетние травы, зерносмеси, смеси культур, залежи, пастбища, плодово-ягодные насаждения. Если ближайший к текущему полю эталон соответствует текущей культуре (или неотличим от эталона данной культуры), то поле считается прошедшим верификацию. Пример результатов верификации приведен на рисунке 2.

 
Рисунок 2.2.2 Пример результатов верификации, для полей озимой пшеницы Горшеченского района Курской области, 2017 год

Построение эталонов и выполнение верификации было выполнено на основе данных 2017-18 годов. Всего было обработано свыше 400000 полей. По результатам верификации 300000 полей прошло верификацию, 20000 не прошло верификацию из-за малого объема статистики, 81000 не прошло верификацию из-за отличия от эталона и 6000 из-за их неоднородности. Выборочный экспертный анализ результатов верификации показывает, что точность предложенного метода превышает 90%.