Технологии, которые изменят правила игры

Новое поколение движков распознавания на основе свёрточных нейронных сетей и искусственного интеллекта. Использование глубокого обучения для повышения уровня распознавания до максимума и доведение числа задач с исключением к минимуму.

Сamco Rail Portal

Компания Camco, известна своими высокопроизводительными системами по распознаванию текста и предлагает проверенные решения, которые обслуживают множество терминалов по всему миру. В нашем постоянном стремлении к дальнейшему повышению точности наших систем мы инвестируем значительные средства в постоянное улучшение показателей распознавания.

Как лидер рынка, который стремится к разработке инноваций, компания Camco 3 года назад решила расширить список своих ноу-хау в области искусственного интеллекта (ИИ) за счет методов глубокого обучения для дальнейшего совершенствования своих систем. Наша команда разработчиков программного обеспечения успешно внедрила модели глубокого обучения в наше программное обеспечение для оптического распознавания символов (OCR), что дало отличные результаты.

В традиционных системах оптического распознавания символов для определения конкретных шаблонов или функций, программисты используют правила, написанные методом ручного кодирования. Системы OCR сканируют изображение для поиска и распознавания шаблонов или функций. Каждый шаблон, шрифт, размер шрифта и т. д. Все это необходимо запрограммировать с помощью программы для достижения хороших показателей распознавания и высокого уровня достоверности.

Однако в некоторых случаях традиционные системы оптического распознавания символов генерируют ложные данные: в результате система OCR утверждает, что ее результат является правильным, но на самом деле это не так.

Для разработки и внедрения решений, полученных в области искусственного интеллекта и глубокого обучения, компания Camco опирается на команду из 6 экспертов, занимающихся вопросами компьютерного зрения. Они интегрировали свою технологию в новейшие системы оптического распознавания символов.

Разработка систем с функцией глубокого обучения является очень сложным делом, требующим больших знаний и опыта, а также мощной и надежной архитектуры из программных и аппаратных компонентов. 19-летний опыт компании Camco позволяет получить максимум для оптического распознавания символов и искусственного интеллекта.

Глубокое обучение и изображение

Глубокое обучение — это один из большинства подходов машинного обучения, включающий в себя несколько технологий. Одной из основных таких революционных технологий при работе с изображениями является сверточные нейронные сети (convolutional neural networks, CNN).

Объяснить, что такое сверточные нейронные сети, достаточно сложно. Это новое поколение алгоритмов распознавания изображений, появление которых возникло благодаря исследованиям в той области коры головного мозга животных, которая отвечает за зрение. Эти сети имитируют то, как мозг получает абстрактную информацию из сигналов, генерируемых оптическими нервами глаза. Эта информация может иметь форму квадратов, треугольников и т. д., а также силуэта человека, автомобиля или любого другого объекта.

Как и человеческий мозг, сверточные нейронные сети учатся на собственном опыте. Таким образом, разработчикам больше не нужно вручную создавать шаблоны или элементы, которые нужно искать в изображении. Наоборот, при наличии большого количества меченых изображений — набора для обучения — сеть самостоятельно осваивает черты, которые в совокупности составляют любой объект.

Сamco Rail Portal

Рисунок 1: Пример классификации контейнеров, иллюстрирующий принцип сквозного обучения. Изображение находится на входе, результат его обработки — на выходе. В промежутке между ними сеть самостоятельно изучает черты определенного класса, имеющих значение, на основе тысяч загруженных изображений. В случае дверей контейнера это логотип компании, стержни и петли, номер контейнера и другая текстовая информация. Тепловая карта центральной части контейнера показывает, что полученная сеть очень хорошо научилась получать эти определяющие черты.

Какие именно это функции, зависит от набора данных и архитектуры сети. Например, автомобильный детектор можно учить данным об отдельных частях, из которых состоит автомобиль, таких как шины, радиатор, и научить его распознавать формы и текстуры каждой из этих частей и комбинировать их.

Процесс управляемого обучения требует, чтобы Camco обеспечивала сети большим количеством высококачественных изображений и примечаний к ним (объектов, содержащихся в изображении, и их расположений в изображении). Процессы сбора высококачественных данных, а также оптимизации как данных, так и моделей, процедур обучения — это сложные процессы, требующие опыта и ресурсов. Но результаты их реализации весьма полезны.

Компании Camco нужно много инвестиций и усилий, чтобы достичь контрольных показателей и целей, которые были поставлены в начале разработки этой технологии. Но благодаря сочетанию высокотехнологичных решений, которые используют сенсоры, работающие на аппаратном обеспечении, которое оптимизировано для глубокого обучения (NVIDIA TX2), и разработанном компанией программном обеспечении можно получить надежные результаты.

В чем выгода для терминалов?

Наши большие наборы данных, в число которых входят также дополнительные данные, содержащие изображения со всего мира и являются основой общих свертывающей моделей, которые обеспечивают более высокую скорость распознавания за счет уменьшения количества задач на исключение.

Следующие примеры иллюстрируют ситуации, в которых трудно выполнить определение с помощью традиционного программного обеспечения для оптического распознавания символов, зато можно точно выполнить чтение с использованием наших последних моделей: частично скрытые символы (1), загрязненные и поврежденные символы; смешанные размеры шрифта и цвета шрифта (2) фрагментарные символы (3), наличие теней и повреждений (4).

Рисунок 2: Примеры чисел, точно считываются с использованием моделей глубокого обучения Camco.

Существует также косвенное влияние на успех функционирования техники. Основываясь на некоторых простых классификациях, таких как определение стороны двери контейнера, наш движок может решить, необходимо выявление пломбы, или где следует искать номер контейнера. См. Рисунок 1.

Таблица 1 В таблице показано, как на разных сайтах клиентов, где возникают проблемы с распознаванием номерных знаков, значительно улучшились показатели работы после обновления программного обеспечения Camco License Plate OCR к новой версии с использованием моделей глубокого обучения.

Результаты показывают, что существует огромный шаг вперед в обеспечении точности распознавания номерных знаков. В одном из проектов в области глубокого обучения точность распознавания номеров была повышена с 76,9% до более чем 91%. Для всех сайтов используются одни и те же общие модели.

Глубокое обучения применяется и в других приложениях: повреждение, траектория движения подвесного кранового спредера.

Текущие результаты очень хорошие, и мы видим, что существует еще больше областей, в которых ИИ будет способствовать повышению эффективности и действенности терминалов.

Одна из ключевых областей — улучшение состояния поврежденных символов и данных. ИИ помогает «восстанавливать» поврежденные данные на картинках. Подобно человеческому мозгу, ИИ помогает движкам оптического распознавания добавлять недостающие части символов, позволяя получать нужную информацию.

Распознавание повреждений контейнеров — еще одна область, в которой глубокое обучение может оказаться очень полезным. Хотя это очень сложный вопрос, Camco инвестирует в разработку технологии автоматического обнаружения повреждений. Однако это потребует значительного времени и ресурсов. Для крановых систем ИИ помогает прогнозировать движение объектов. Наблюдая за началом траектории движения контейнера во время операций судна, ИИ будет прогнозировать то место, где контейнер пройдет через опоры портала. Этот расчетный прогноз будет использоваться для более быстрого и точного перемещения BoxCatcher в правое окно.

Рисунок 3: Траектория контейнера, взята из программы оператора крана: зеленая линия представляет собой фактический путь движения контейнера от начала до конца. Красная линия представляет собой положение камер, которое постепенно меняется с управлением в соответствии с прогнозами ИИ.

Эти данные важны при отслеживании и прогнозировании траектории перемещения контейнера для улучшения эксплуатационных навыков машиниста причального крана. Сокращение расстояния перемещения для разбрасывателя/крановой тележки сокращает время рабочего цикла причального крана и улучшает почасовую производительность причального крана, что приводит к сокращению времени оборота судна.

Аппаратное и программное обеспечение, настроенное на достижение оптимальных результатов

Использование глубокого обучения и искусственного интеллекта требует больших вычислительных мощностей. Искусственный интеллект и глубокое обучение используют сложные алгоритмические модели и обработку матричных данных. Аппаратное обеспечение и программное обеспечение должны работать так, чтобы находиться в полной гармонии друг с другом.

К счастью, эти алгоритмы глубокого обучения могут очень эффективно выполняться на графических процессорах (GPU, Graphical Processing Unit) компьютеров. Фактически, эти алгоритмы легко работают на графическом процессоре, причем в 100 раз быстрее, чем на центральном процессоре.

Camco разработала новые камеры с встроенным модулем NVIDIA TX2
Camco разработала новые камеры с встроенным модулем NVIDIA TX2

Такие компании, как NVIDIA, производят специальное оборудование на базе графических процессоров специально для обработки с помощью ИИ. Для обработки изображений существует четыре варианта: обработка на центральном сервере, обработка на локальном ЦБ камеры, в облаке графического процессора (несколько компаний, таких как Amazon, Google и Microsoft, имеют большие фермы графических процессоров) или обработка локальным графическим процессором.

Приложения Camco для работы с искусственным интеллектом очень требовательны к скорости (приложение работает в реальном времени), задержек (задержки недопустимы) и надежности. Для удовлетворения этих требований Camco интегрировала в новую серию интеллектуальных камер производительный процессор NVIDIA GPU. Этот подход является уникальным, поскольку матрица и оборудование для анализа изображений находятся всего в нескольких сантиметрах друг от друга. Новые камеры является частью портала OCR третьего поколения и продуктов BoxCatcher.

Для получения дополнительной информации посетите веб-сайт www.camco.be или свяжитесь с нами sales@camco.be.

Буклет Camco Rail OCR

Буклет Решения и услуги для интермодальных терминалов от Camco Technologies

Автоматическая регистрация и проверка железнодорожных контейнеров

Camco Technologies
Werner Peeters
Project Manager – Business Development
+32 479 473 116
werner.peeters@camco.be
www.camcotechnologies.com

Железнодорожный журнал “Railway Supply”

По теме:

Железнодорожный портал Camco Rail: лучшая в своем классе точность!