Научим компьютер узнавать хоботы и хвосты

Фотоловушки — хорошо известный инструмент: установленные в удаленных местах и не требующие ручного управления фотокамеры, снабженные датчиками движения и инфракрасными датчиками. Трудности начинаются потом, когда нужно рассортировать десятки тысяч изображений, для чего последнюю пару десятилетий для этого привлекают научных волонтеров. Но теперь эти системы собирают буквально миллионы фотографий, так что и волонтеры уже не успевают за разумное время их все просмотреть и рассортировать.

Поэтому ученые из Миннесотского и Оксфордского университетов и других исследовательских и природоохранных организаций, совместно с Департаментом природных ресурсов штата Висконсин, США, решили научить AI узнавать на фотографиях части животных и, что даже важнее, распознавать «пустые» фотографии — они получаются, например, когда датчик камеры реагирует на движение растений из-за ветра. Поскольку в некоторых наборах изображения без животных составляют до 80% общего количества, возможность автоматически их отбросить еще до начала внимательного рассмотрения очень полезна.

Исследователи использовали три набора данных изображений, собранных в Африке — Snapshot Serengeti, Camera CATalogue и Elephant Expedition — и один набор данных из Snapshot Wisconsin, с изображениями, собранными в Северной Америке. Каждый набор данных включал фотографии от 9 до 55 видов и заметно отличался по ряду параметров: как часто различные виды попадали в объектив, а также по количеству, местам размещения и настройкам фотокамер.

Помимо пустых изображений, авторы проекта учили компьютер узнавать и части животных. Для этого они показывали ему наборы изображений, уже классифицированных людьми, например, полные и частичные фотографии зебр с разных ракурсов. Постепенно AI улучшал качество распознавания, и, предположительно, вновь обретенные AI навыки позволят ему идентифицировать других животных, скажем, оленей или белок, после обучения на меньшем числе изображений.

Пока точность автоматической идентификации пустых изображений в разных проектах варьируется от 91,2% до 98,0%, точность идентификации конкретных видов — от 88,7% до 92,7%. Это немного, а в случае редких видов точность еще ниже. Впрочем, AI способен оценить, насколько он уверен в своих прогнозах. Но даже если компьютер сумеет лишь уверенно отбрасывать большую часть заведомо ненужных фотографий, это уже значительно ускорит работу.

Как объяснила Люси Фортсон (Lucy Fortson), профессор физики и астрономии Миннесотского университета и соучредитель Zooniverse, — крупнейшей онлайн-платформы проектов гражданской науки, — «данные в широком спектре научных областей прибавляются гораздо быстрее, чем число добровольцев, и хотя всегда будут нужны человеческие усилия, объединение этих усилий с методами больших данных может помочь исследователям обрабатывать больше данных еще быстрее и добровольцам сосредоточиться на более сложных и редких классификациях».

Подробнее об этой работе можно прочесть в статье в журнале Methods in Ecology and Evolution.

Иллюстрации: istockphoto.com / cse.umn.edu / news.wisc.edu / eurekalert.org