Ученые Smart Engines создали «зеленый» ИИ, который распознает текст в 10 раз точнее и на 20% быстрее прошлых моделей
Компания Smart Engines представила GreenOCR 2.0 — новое поколение «зеленого» ИИ для распознавания текста. Применяемые в нем сверхлегкие вычислительные архитектуры — 4,6-битные и усредняющие 8-битные нейросети — позволили считывать данные быстрее на 20%, а также снизить энергопотребление при распознавании. При этом число ошибок по сравнению с предыдущей версией сократилось в 10 раз.
В основе GreenOCR лежит технология замены вещественных чисел на целые, что позволяет развернуть всю функциональность ИИ даже на устройствах без GPU. Во втором поколении (версии 2.0) комбинируются две технологии — 4,6-битных и усредняющих 8-битных сетей, созданных специально для современных мобильных устройств архитектуры ARM. Фильтры 4,6-битных нейронных сетей квантуются таким образом, чтобы промежуточные данные обладали ограниченной разрядностью, предоставляя возможность более эффективно использовать векторные операции процессора. А в вычислительном ядре усредняющих 8-битных нейронных сетей применяется скалярное произведение на основе древовидного усреднения, благодаря чему можно использовать регистры вдвое интенсивнее. Одновременное внедрение обеих идей позволило добиться непревзойденной скорости распознавания.
Улучшения в скорости и энергоэффективности были произведены не в ущерб качеству. Более того, новая модель ошибается в 10 раз меньше при распознавании документов относительно предыдущей версии. Эти показатели обеспечены нейросетями с расширенным алфавитным пространством, обученными понимать не только сами символы, но и их структурные взаимосвязи: соседство фрагментов букв, точки соединения элементов и другие графические особенности. Система уверенно работает с печатным и рукописным текстом на 103 языках.
«GreenOCR 2.0 соответствует ключевым критериям Green AI, принятым в научной литературе: низкому энергопотреблению, минимальной эмиссии углекислого газа и «зеленым» подходам к обучению. За счет полностью локальной работы технологии не нужны дата-центры и мегаватты энергии: все распознавания клиентов компании за год выделяют меньшее количество CO2, чем три уличных газовых обогревателя за аналогичный период», — отмечает Владимир Арлазаров, генеральный директор Smart Engines, доктор технических наук.
Выпуск GreenOCR 2.0 стал частью реализации комплексной ESG-стратегии, утвержденной советом директоров компании в 2020 году. Тогда же Smart Engines стала первой OCR-компанией, присоединившейся к инициативе «Устойчивого развития» ООН.
GreenOCR 2.0 интегрирован во все программные решения Smart Engines: Smart ID Engine 2.0 для распознавания и проверки подлинности документов, Smart Code Engine для считывания QR-кодов, банковских карт и номеров телефонов, Smart Document Engine для распознавания первичных, бухгалтерских документов, анкет и форм.
Программные продукты Smart Engines включены в Единый реестр российского программного обеспечения Минцифры России и относятся к классу искусственного интеллекта. В настоящее время GreenOCR 2.0 используется аэропортами Шереметьево, Внуково и Кольцово, РЖД, ФНС, ВТБ, Альфа-Банком, Т-Банком, а также большой тройкой сотовых операторов и другими заказчиками из госсектора, промышленности и бизнеса.

22 октября, 2025
12 сентября, 2016
20 ноября, 2017