Технології, що змінюють правила гри

Нове покоління движків розпізнавання на основі згорточних нейронних мереж і штучного інтелекту. Використання глибокого навчання для підвищення рівня розпізнавання до максимуму і доведення числа завдань з виключенням до мінімуму.

Залізничний портал Сamco Rail Portal

Компанія Camco відома своїми високопродуктивними движками з розпізнавання тексту і пропонує перевірені рішення, які обслуговують безліч терміналів по всьому світу. У нашому постійному прагненні до подальшого підвищення точності наших систем ми інвестуємо значні кошти в постійне поліпшення показників розпізнавання.
Як лідер ринку, який прагне до розробки інновацій, компанія Camco 3 роки тому вирішила розширити список своїх ноу-хау в області штучного інтелекту (ШІ) за рахунок методів глибокого навчання для подальшого вдосконалення своїх систем. Наша команда розробників програмного забезпечення успішно впровадила моделі глибокого навчання в наше програмне забезпечення для оптичного розпізнавання символів (OCR), що дало відмінні результати.

У традиційних системах оптичного розпізнавання символів для визначення конкретних шаблонів або функцій програмісти використовують правила, написані методом ручного кодування. Системи OCR сканують зображення для пошуку і розпізнавання цих шаблонів або функцій. Кожен шаблон, шрифт, розмір шрифту і т. д. необхідно запрограмувати за допомогою програми для досягнення хороших показників розпізнавання і високого рівня достовірності.

Однак в деяких випадках традиційні системи оптичного розпізнавання символів генерують помилкові працьовування: в результаті система OCR стверджує, що її результат є правильним, але насправді це не так.

Для розробки і впровадження рішень, які отримані в області штучного інтелекту і глибокого навчання, компанія Camco покладається на команду з 6 експертів, що займається питаннями комп’ютерного зору. Вони інтегрували свою технологію в новітні системи оптичного розпізнавання символів.

Розробка систем з функцією глибокого навчання є дуже складною справою, що вимагає великих знань і досвіду, а також потужної і надійної архітектури з програмних і апаратних компонентів. 19-річний досвід компанії Camco дозволяє отримати максимум від поєднання традиційних движків для оптичного розпізнавання символів і штучного інтелекту.

Глибоке навчання і зображення

Глибоке навчання — це один з багатьох підходів до машинного навчання, що включає в себе кілька технологій. Однією з основних таких революційних технологій при роботі з зображеннями є згорткові нейронні мережі (convolutional neural networks, CNN).

Пояснити, що таке згорткові нейронні мережі, досить складно. Це нове покоління алгоритмів розпізнавання  зображень, поява яких була завдяки дослідженням в тій області кори головного мозку тварин, яка відповідає за зір. Ці мережі імітують те, як мозок отримує абстрактну інформацію із сигналів, що генеруються оптичними нервами ока. Ця інформація може мати форму квадратів, трикутників і т. д., а також силуету людини, автомобіля або будь-якого іншого об’єкта.

Як і людський мозок, згорткові нейронні мережі навчаються на власному досвіді. Таким чином, розробникам більше не потрібно вручну створювати шаблони або елементи, які потрібно шукати в зображенні. Навпаки, за наявності великої кількості мічених зображень — набору для навчання — мережа самостійно освоює риси, які в сукупності складають будь-який об’єкт.

Малюнок 1: Приклад класифікації контейнерів, який ілюструє принцип наскрізного навчання. Зображення знаходиться на вході, результат його обробки – на виході. У проміжку між ними мережа самостійно вивчає риси певного класу, які мають значення, на основі тисяч завантажених зображень. У разі дверцят контейнера це логотип компанії, стрижні і петлі, номер контейнера та інша текстова інформація. Теплова карта центральної частини контейнера показує, що отримана мережа дуже добре навчилася отримувати ці визначальні риси.

Які саме ці функції, залежить від набору даних і архітектури мережі. Наприклад, автомобільний детектор можна навчати даних про окремі частини, з яких складається автомобіль, таких як шини, радіатор, і навчити його розпізнавати форми і текстури кожної з цих частин і комбінувати їх.

Процес керованого навчання вимагає, щоб Camco забезпечувала мережі великою кількістю високоякісних зображень і приміток до них (об’єктів, що містяться в зображенні, і їх розташувань в зображенні). Процеси збору високоякісних даних, а також оптимізації як даних, так і моделей і процедур навчання – це складні процеси, що вимагають досвіду і ресурсів. Але результати їх реалізації досить корисні.

Компанії Camco потрібно багато інвестицій і зусиль, щоб досягти контрольних показників і цілей, які були поставлені на початку розробки цієї технології. Але завдяки поєднанню високотехнологічних рішень, які використовують сенсори, що працюють на апаратному забезпеченні, яке оптимізовано для глибокого навчання (NVIDIA TX2), і розробленому компанією програмному забезпеченню можна отримати надійні результати.

У чому вигода для терміналів?

Наші великі набори даних, в число яких входять також доповнені дані, містять зображення з усього світу і є основою наших спільних згортальних моделей, які забезпечують більш високу швидкість розпізнавання за рахунок зменшення кількості завдань на виключення.

Наступні приклади ілюструють ситуації, в яких важко виконати визначення за допомогою традиційного програмного забезпечення для оптичного розпізнавання символів, зате можна точно виконати читання з використанням наших останніх моделей: частково приховані символи (1), забруднені і пошкоджені символи; змішані розміри шрифту і кольору шрифту (2); фрагментарні символи (3), наявність тіней і пошкоджень (4).

Малюнок 2: Приклади чисел, які точно зчитуються з використанням моделей глибокого навчання Camco.

Існує також непрямий вплив на успіх функціонування техніки. Грунтуючись на деяких простих класифікаціях, таких як визначення сторони двері контейнера, наш движок може вирішити, чи необхідно виявлення пломби, або де слід шукати номер контейнера. Див. Малюнок 1.

Таблиця 1: У таблиці показано, як на різних сайтах клієнтів, де виникають проблеми з розпізнаванням номерних знаків, значно покращилися показники роботи після оновлення програмного забезпечення Camco License Plate OCR до новітньої версії з використанням моделей глибокого навчання.

Результати показують, що існує величезний крок вперед у забезпеченні точності розпізнавання номерних знаків. В одному з проектів в області глибокого навчання точність розпізнавання номерів була підвищена з 76,9% до більш ніж 91%. Для всіх сайтів використовуються одні й ті ж загальні моделі.

Глибоке навчання застосовується і в інших додатках: пошкодження, траєкторія руху підвісного кранового спредера.

Поточні результати є дуже хорошими, і ми бачимо, що існує ще більше областей, в яких ШІ сприятиме підвищенню ефективності та дієвості терміналів.

Одна з ключових областей — поліпшення стану пошкоджених символів і даних. ШІ допомагає «відновлювати» пошкоджені дані на картинках. Подібно до людського мозку, ШІ допомагає движкам оптичного розпізнавання додавати відсутні частини символів, дозволяючи отримувати потрібну інформацію.

Розпізнавання ушкоджень контейнерів — ще одна область, в якій глибоке навчання може виявитися дуже корисним. Хоча це дуже складне питання, Camco інвестує в розробку технології автоматичного виявлення пошкоджень. Однак це зажадає значного часу і ресурсів. Для кранових систем ШІ допомагає прогнозувати рух об’єктів. Спостерігаючи за початком траєкторії руху контейнера під час операцій судна, ШІ буде вносити свій вклад в прогнозування того, де контейнер пройде через опори порталу. Цей розрахунковий прогноз буде використовуватися для більш швидкого і
точного переміщення BoxCatcher в праве вікно.

Малюнок 3: Траєкторія контейнера, взята з програми оператора крана: зелена лінія являє собою фактичний шлях руху контейнера від початку до кінця. Червона лінія являє собою положення камер, яке поступово змінюється з керуванням відповідно до прогнозів AI.

Ці дані важливі при відстеженні та прогнозуванні траєкторії переміщення контейнера для поліпшення експлуатаційних навичок машиніста причального крана. Скорочення відстані переміщення для розкидача/кранового візка скорочує час робочого циклу причального крана і покращує погодинну продуктивність причального крана, що призводить до скорочення часу обороту судна.

Апаратне та програмне забезпечення, налаштоване на досягнення оптимальних результатів

Використання глибокого навчання і штучного інтелекту вимагає великих обчислювальних потужностей. Штучний інтелект і глибоке навчання використовують складні алгоритмічні моделі та обробку матричних даних. Апаратне забезпечення і програмне забезпечення повинні працювати так, щоб перебувати в повній гармонії один з одним.

На щастя, ці алгоритми глибокого навчання можуть дуже ефективно виконуватися на графічних процесорах (GPU, Graphical Processing Unit) комп’ютерів. Фактично, ці алгоритми легко працюють на графічному процесорі, причому в 100 разів швидше, ніж на центральному процесорі.

Camco розробила нові камери з вбудованим модулем NVIDIA TX2
Camco розробила нові камери з вбудованим модулем NVIDIA TX2

Такі компанії, як NVIDIA, виробляють спеціальне обладнання на базі графічних процесорів спеціально для обробки за допомогою ШІ. Для обробки зображень існує чотири варіанти: обробка на центральному сервері, обробка на локальному ЦП камери, в хмарі графічного процесора (кілька компаній, таких як Amazon, Google і Microsoft, мають великі ферми графічних процесорів) або обробка локальним графічним процесором.

Додатки Camco для роботи з штучним інтелектом дуже вимогливі до швидкості (додаток працює в реальному часі), затримок (затримки є неприпустимими) і надійності. Для задоволення цих вимог Camco інтегрувала в нову серію інтелектуальних камер продуктивний процесор NVIDIA GPU. Цей підхід є унікальним, оскільки датчик зображення та обладнання для аналізу зображень знаходяться всього в декількох сантиметрах один від одного. Нові камери є частиною порталу OCR третього покоління і продуктів BoxCatcher.

Для отримання додаткової інформації відвідайте веб-сайт www.camco.be або зв’яжіться з нами sales@camco.be.

Буклет Camco Rail OCR

Буклет Рішення та послуги для інтермодальних терміналів від Camco Technologies

Автоматическая регистрация и проверка железнодорожных контейнеров

Camco Technologies
Werner Peeters
Project Manager – Business Development
+32 479 473 116
werner.peeters@camco.be
www.camcotechnologies.com

Залізничний журнал “Railway Supply”

По темі:

Залізничний портал Сamco: найкраща у своєму класі точність!