top of page

Перебор количества проб с помощью XVALID

Скрипт создан для упрощения процесса подбора количества проб с помощью процесса XVALID. Работа скрипта заключается в многократном запуске процесса XVALID и сохранении статистики интерполяции в файлах csv и Excel. Предполагается, что рассмотрение статистических характеристик результатов интерполяции позволит подобрать оптимальные количества проб, используемых для интерполяции. В данном скрипте выполняется перебор только трёх параметров: минимального количества проб, используемых для интерполяции, максимального количества проб и максимального количества проб с одним значением ключевого поля (MAXKEY).

При составлении параметров интерполяции у моделёра могут быть некоторые представления о том, сколько проб следует использовать для интерполяции, а могут и не быть. Но в любом случае иметь количественное подтверждение своих предположений будет вовсе не лишним. При этом ручной запуск процесса XVALID с различными сочетаниями этих параметров сопряжён со значительными затратами времени (это если не обращать внимания на то, что эта процедура требует также изрядной усидчивости, стрессоустойчивости и внимательности). Например, несложно посчитать, что пар значений MINNUM-MAXNUM может быть несколько десятков, даже если рассматривать колебания этих значений в относительно узких пределах – например от 5 до 10 проб по каждому из параметров (в этом случае количество вариантов пар составит 21 пара). Понятно, что запускать XVALID 21 раз, корректируя файл SRCPARM по ходу действия, не очень удобно (а через некоторое время ещё и вызывает стойкое желание запустить мышкой в стену). Кроме того, вероятность запутаться в вариантах довольно высока. Для облегчения жизни в этом случае, сохранения количества работоспособных мышей, а также количества нервных клеток, был написан скрипт, автоматизирующий процесс перебора количеств проб. Интерфейс скрипта, как и у всего, находящегося на данном сайте, простой и незамыловатый:

Кроме того, он также довольно прост и понятен. И вряд ли нуждается в дополнительных объяснениях. Можно лишь напомнить не забывать выбирать ссылочный номер окрестности и компонент для проверки. Результат работы скрипта записывается в файл rep_script_full[1]_[2]_[3]_[4]_[5].csv, где:

  • [1] – время (часы) создания файла

  • 2] – время (минуты) создания файла

  • 3] – дата (число) создания файла

  • [4] – дата (месяц) создания файла меньший на 1 (ошибка нумерации месяцев в языке JavaScript, которая не создаёт особых проблем и поэтому до сих пор не исправлена)

  • 5] – дата (год) создания файла

Файл результатов содержит всю информацию о параметрах интерполяции и результатах перекрёстной проверки, т.е. представляет собой объединение файлов ESTPARM, SRCPARM и XVSTATS. Кроме файла формата *.csv, также создаётся файл Excel, имеющий то же имя, что и отчёт в *.csv, но содержащий статистические характеристики в более наглядном виде (цветное форматирование придётся выполнить вручную с помощь. «Условного форматирования» Excel):

Каждая из статистических характеристик, перечисленных выше, находится на соответствующем листе:

  • Наклон линии регрессии (листы, начинающиеся с REG_SLP)

  • Константа регрессии (листы, начинающиеся с REG_CON)

  • Коэффициент корреляции (листы, начинающиеся с COR_COEF)

  • Стандартная ошибка регрессии (листы, начинающиеся с REG_SE)

  • Расхождение средних в процентах (листы, начинающиеся с PC_DIFF)

  • Отношение дисперсий: [реальная дисперсия]/[дисперсия интерполированных значений] (листы, начинающиеся с VAR_RAT)

  • KV_RATIO (листы, начинающиеся с KV_RATIO)

 

Схема наименования листов следующая:

  • Если выполнялся также перебор величины MAXKEY: [тип стат характеристики]_[текущее MAXKEY]. то есть, лист REG_SLP_3 содержит информацию о зависимости величины REG_SLP от минимального и максимального количества проб при MAXKEY=3

  • если MAXKEY не перебирается, листы имеют наименования типа [тип стат характеристики]

 

Имея на руках варианты интерполяции, имеет смысл их сопоставить и выбрать то, что Вам кажется наиболее подходящим. Проверка разумности выбранных параметров целиком лежит на плечах моделёра. Также было бы неплохо помнить, что окончательный результат даст проверка полученной модели, например, с помощью QKNA.

 
 
 
 
 
 
вскрытие
 
вскрытие
 
Транслитерация
vskrytiye
Нет соединения с интернетом
 
bottom of page