В мире насчитывается около 3000 гербариев, объём коллекций которых оценивается свыше 350 миллионов экземпляров растений, лишь часть которых на текущий момент оцифрована. Задача осложняется ещё и тем, что подавляющая часть коллекций хранится в отпрепарированном виде, то есть высушена под прессом, частично утратив свой естественный цвет.
Работа, опубликованная в BMC Evolutionary Biology, является первой попыткой использовать глубокое обучение — метод искусственного интеллекта, который учит нейронные сети решению сложной таксономической задачи идентификации видов в естественных условиях.
Ранее группа учёных под руководством ботаника Пьера Бонне из Французского центра сельскохозяйственных исследований уже успела автоматизировать идентификацию растений через проект Pl @ ntNet. Он собрал миллионы изображений свежих растений, которые обычно используются в полевых условиях людьми, применяющими приложение для смартфонов для идентификации образцов.
Другим участником проекта стал инженер по компьютерной технике Эрик Мата-Монтеро из Технологического института Коста-Рики.
Исследователи разработали аналогичные алгоритмы для свыше 260 тысяч отсканированных гербарных листов, охватывающих более 1000 видов растений. Компьютерная программа в конечном итоге определяла виды с почти 80-процентной точностью, что, по мнению других учёных-таксономистов, превышает результаты обычного специалиста.
Этот подход может помочь гербариям обрабатывать новые образцы, упрощая трудные задачи, которые порой требуют многочасовой работы. Любопытно возможное применение таких алгоритмов для идентификации других видов растительного и животного мира.
К тому же, поскольку некоторые коллекции собирались веками, такими методами можно было бы отследить эволюцию растений в свете изменяющегося климата. Привлечение к этой работе миллионов энтузиастов-ботаников на основе краудфандинговых проектов могло бы помочь специалистам уточнить время цветения и плодоношения разных видов растений, что, несомненно, дало бы и экономический эффект.