Специалистами Google была создана эффективная система распознавания изображений

Специалистами Google была создана эффективная система распознавания изображений

Не секрет, что распознавание объектов на цифровых изображениях крупного масштаба является одной из основных академических проблем в сфере компьютерного зрения. Каждый год Стэндфордский университет выступает в роли организатора конкурса ImageNet large-scale visual recognition challenge, рассчитанным специально на ведущие научные лаборатории и учреждения. В рамках данного мероприятия участниками демонстрируются самые передовые технологические достижения в данной сфере.

Конкурс состоит из трех этапов, включающих в себя классификацию, классификацию с локализацией, а также обнаружение. В первом случае проводится оценка возможности алгоритма создавать соответствующие подписи к изображению, тогда как под локализацией предполагается выделение главных объектов на конкретном изображении. Что касается обнаружения, то данная задача формулируется схожим образом, однако здесь приходиться иметь дело с более строгими критериями оценки. Модель должна быть в состоянии дать описание сложной сцене с большим количеством объектов и разнообразных мелких деталей.

Примечательно, что в этом году в конкурсе вновь приняли участие специалисты команды GoogLeNet (название представляет собой аббревиатуру из слов Google и LeNet, являющейся одним из ответвлений свёрточной нейронной сети). Заметим, что нейронной сети с глубоко переработанной архитектурой по силам в быстром темпе обучать и переобучаться. Плюс ко всему, она в состоянии предоставлять результаты даже с учетом небольшого объема памяти (в этом не последняя заслуга оказалась за более чем десятикратным сокращением количества параметров в сравнении с большинством прочих моделей компьютерного зрения). В результате, продвинутой системе глубокого сканирования не составит особых трудностей отыскать сразу несколько предметов и предложить наиболее выгодные догадки. Конечно, подобная технология еще очень молода, тем не менее, она обладает завидным потенциалом.

Примечательно, что Google рассматривает возможность внедрения разработки своих исследователей в визуальные службы наподобие поиска изображений и YouTube. Кроме этого, данная новинки способна найти свое применение в системах автоматического управления автомобилями и в прочих сферах, где такая технология способна оказаться реальную помощь. 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Команда Team Vitality по FIFA объявляет о партнерстве c Philips Monitors Команда Team Vitality по FIFA объявляет о партнерстве c Philips Monitors

Следуя стратегии развития в киберспорте, компания MMD от лица Philips Monitors заключила партнерство с Team Vitality и стала эксклюзивным...

Читать полностью
Новый 4K UHD монитор Philips 288E2UAE впечатляет цветами и скоростью передачи данных Новый 4K UHD монитор Philips 288E2UAE впечатляет цветами и скоростью передачи данных

Новый монитор Philips 288E2UAE (28 дюймов/71,1 см) отображает 1,07 миллиарда цветов, оснащён возможностью сверхскоростной передачи данных по...

Читать полностью
Наверх