68076

Автор(ы): 

Автор(ов): 

6

Параметры публикации

Тип публикации: 

Статья в журнале/сборнике

Название: 

Метод энтропийно-рандомизированного восстановления пропущенных данных

ISBN/ISSN: 

0005-2310

DOI: 

0.1134/S0005231019040061

Наименование источника: 

  • Автоматика и телемеханика

Обозначение и номер тома: 

№ 4

Город: 

  • Москва

Издательство: 

  • ИПУ РАН

Год издания: 

2021

Страницы: 

140-160
Аннотация
Статья посвящена проблеме восстановления про́пусков в коллекциях данных для задач машинного обучения. Предложен новый рандомизированный метод восстановления пропущенных данных, основанный на технологии энтропийно-робастного оценивания и генерации ансамблей случайных величин. Предложенный метод схож с использованием вспомогательной регрессии для восстановления пропущенных значений, но в отличие от последней в случае энтропийного оценивания не накладываются дополнительные ограничения на функцию правдоподобия ошибок в выборке и допустимы малые объемы данных, что становится крайне актуальным в задачах, когда объем данных для обучения ограничен, а пропуски встречаются не систематически. Предложенный метод применяется для восстановления пропущенных данных о площадях термокарстовых озер арктической зоны РФ, измеряемых по спутниковым снимкам.

Библиографическая ссылка: 

Дубнов Ю.А., Полищук В.Ю., Попков Ю.С., Полищук Ю.М., Мельников А.В., Сокол Е.С. Метод энтропийно-рандомизированного восстановления пропущенных данных // Автоматика и телемеханика. 2021. № 4. С. 140-160.