Classification of audio samples by convolutional networks in audiobeehive monitoring

Bibliographic Details
Parent link:Вестник Томского государственного университета. Управление, вычислительная техника и информатика/ Томский государственный университет (ТГУ)
№ 45.— 2018.— [С. 68-75]
Main Author: Кулюкин В. А. Владимир Алексеевич
Corporate Author: Национальный исследовательский Томский политехнический университет Инженерная школа информационных технологий и робототехники Отделение информационных технологий
Other Authors: Мукерджи С. Сарбаджит, Буркатовская Ю. Б. Юлия Борисовна
Summary:Заглавие с экрана
Текст на английском языке
In the investigation, we consider the problem of classification of audio samples resulting from the audio beehivemonitoring. Audio beehive monitoring is a key component of electronic beehive monitoring (EBM) that can potentiallyautomate the identification of various stressors for honeybee colonies. We propose to use convolutional neural networks(ConvNets) and compare developed ConvNets in classifying audio samples from electronic beehive monitors deployedin live beehives. As a result, samples are placed in one of the three non-overlapping categories: bee buzzing (B), cricketchirping (C), and ambient noise (N). We show that ConvNets trained to classify raw audio samples perform slightlybetter than ConvNets trained to classify spectrogram images of audio samples. We demonstrate that ConvNets cansuccessfully operate in situ on low voltage devices such as the credit card size raspberry pi computer.
В работе решается задача классификации аудиофайлов, полученных в результате аудиомониторинга пчелиных ульев.Аудиомониторинг улья является ключевым компонентом электронного мониторинга ульев, с помощью которого потенциально можно автоматизировать идентификацию различных стрессовых факторов для пчелиных семей. Предлагается использовать сверточные нейронные сети, которые сравниваются по качеству классификации образцов звука от систем электронногомониторинга ульев, развернутых в живых ульях. В результате файлы относятся к одной из трех непересекающихся категорий:жужжание пчел (B), стрекот сверчков (C) и шум (N). Показано, что сети, обученные для классификации необработанныхаудиофайлов, лучше, чем сети, обученные для классификации спектрограмм. Продемонстрирована успешная работа сетейin situ на низковольтных устройствах, таких как компьютер raspberry pi.
Published: 2018
Subjects:
Online Access:https://doi.org/10.17223/19988605/45/8
Format: Electronic Book Chapter
KOHA link:https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=661462