Читать книгу Нейросети - - Страница 6

Глава 2: Типы нейронных сетей
Конволюционные нейронные сети

Оглавление

Конволюционные нейронные сети (КНС) – это тип искусственных нейронных сетей, предназначенных для обработки данных с решетчатой структурой, таких как изображения или видео. Они особенно эффективны для таких задач, как классификация изображений, обнаружение объектов и сегментация изображений.

Архитектура типичной CNN состоит из входного слоя, нескольких сверточных слоев, нескольких объединяющих слоев и одного или нескольких полностью связанных слоев. В сверточных слоях сеть применяет набор фильтров или ядер к входному изображению для извлечения особенностей. Каждый фильтр выполняет операцию свертки, которая заключается в умножении значений в небольшом окне входного изображения на веса фильтра и последующем суммировании результатов. Этот процесс повторяется для всех окон входного изображения, в результате чего получается новая карта признаков.

Слои объединения используются для уменьшения размерности карт признаков путем их понижающей выборки. Это помогает сделать сеть более устойчивой к изменениям входных данных, таким как изменения положения или ориентации. Наиболее распространенной операцией объединения является максимальное объединение, которое выбирает максимальное значение в каждом окне карты признаков.

Полностью связанные слои используются для получения конечного результата работы сети, например, предсказания или классификации. Эти слои аналогичны слоям в нейронной сети с прямой передачей и используются для объединения признаков, извлеченных конволюционным и объединяющим слоями, в единый вектор.

CNN обычно обучаются с помощью методов контролируемого обучения, при котором сети предъявляется набор помеченных примеров, а веса связей настраиваются так, чтобы минимизировать разницу между предсказанным выходом и фактическим выходом. Этот процесс обычно выполняется с помощью обратного распространения, которое включает в себя вычисление градиента функции потерь относительно весов, а затем обновление весов с помощью алгоритма оптимизации.

Одним из основных преимуществ CNN является их способность автоматически узнавать особенности из входных данных, без необходимости ручной разработки особенностей. Это делает их хорошо подходящими для таких задач, как распознавание изображений, где визуальные признаки, необходимые для классификации, трудно определить вручную. Кроме того, CNN обладают высокой параллелизуемостью и могут обучаться на больших наборах данных с помощью графических процессоров, что делает их хорошо подходящими для крупномасштабных приложений машинного обучения.

Нейросети

Подняться наверх