
Автоматизация процесса отбора данных находится лишь на половине пути. Для построения нейронных сетей часть данных все еще отбирается вручную специалистом по Data Science.
Это связано с тем, что в базах данных всегда присутствуют аномалии, называемые аномальными объектами или выбросами. Часть из них автоматически удаляется, но решение по остальным принимает человек.
Например, банк хочет проанализировать, какие категории клиентов возвращают ипотечные кредиты, а какие — нет. В базе данных может быть графа «количество детей у клиента». Значение «100» в этой графе является однозначным выбросом, его можно удалить. Но значение «10» или даже «20» могут быть аномальными, но вполне реальными. Их важно оставить в базе.
В больших структурированных наборах данных могут содержаться ошибки, поэтому на решения нейросетей нельзя полностью полагаться.
Риски обучения нейросетей
Для специалистов, работающих с нейросетями, важно избегать переобучения. Когда нейросеть слишком подстраивается под данные, повышается риск упускания других важных аспектов.
Например, если нейросеть обучена выявлять спам, переобученная модель будет с высокой точностью определять письма определенного типа, содержащие слова «миллионер» и «наследство». Но если спамер изменит одно слово, например, «миллионер» на «миллиардер», нейросеть может пропустить такое письмо.
Преимущества и недостатки нейронных сетей
Преимущества
Использование нейросетей может существенно упростить работу человека, поскольку:
они активно обучаются и могут находить оптимальные решения вместо человека;
хорошо работают вместе с человеком, расширяя область видимости для принятия решений и защищая от серьезных ошибок.
Недостатки
Несмотря на преимущества, нейросети не лишены недостатков.
Результат их работы зависит от выбора исходных данных для обучения.
Они требуют большого объема места на сервере: чем сложнее задача, тем больше объем занимаемой памяти.
Человек не полностью понимает, как работают нейросети и какие именно данные используются для принятия решений.
Не гарантируют правильного решения задачи, так как зависят от данных, выбранных человеком.
Выводы
Нейросети способны заменять или дополнять человеческую работу в случаях, когда решение основывается на предыдущем опыте.
Чтобы запустить нейросеть, необязательно начинать с нуля. Можно использовать предобученную нейросеть и дополнить ее знания в нужных областях.
Нейросети могут применяться во многих сферах деятельности. Главное — давать им задачи, которые уже решались человеком, и обучать их с использованием качественных данных.
Нейросети могут работать вместо человека или совместно с ним. Использование нейросетей снижает риск ошибок, но не исключает их полностью.