VisionLabs тестирует в Москве ИИ-поиск на изображениях и видео для ЖКХ

Технология позволяет находить различные ситуации на изображениях и кадрах из видео по текстовому описанию.

Компания VisionLabs (входит в МТС Web Services) разработала технологию мультимодального поиска на естественном языке по текстовому запросу. Она реализована в рамках платформы компьютерного зрения Luna Line, которая позволяет обучать модели искусственного интеллекта под отраслевые сценарии без программирования. Компания начала тестирование технологии с компаниями в Москве. VisionLabs рассчитывает получить от этого направления 5–10% выручки в 2027 году.

Мультимодальный поиск позволяет работать как с фотографиями с телефонов, так и с данными с видеокамер, установленных на улице и в общественном транспорте, и определять практически любые сценарии по текстовому описанию. Например, достаточно написать «разбитое стекло» или «переполненный мусорный бак» — и модель выдаст все изображения или кадры из видео, где они обнаружены.

Традиционные системы компьютерного зрения работают по заранее заданным правилам и фиксированным классам («мусор», «человек», «машина») и требуют ручной разметки под каждую задачу. В отличие от них мультимодальный поиск позволяет находить ситуации без жёсткого перечня сценариев. Пользователь может сформулировать запрос на естественном языке («мусор рядом с контейнером») — и система найдёт нужные кадры. Даже для новых или редких случаев, которые не были заранее прописаны как предмет детекции.

Модель может работать без дообучения на разных сценариях: отслеживать накопление мусора в баках, посторонние предметы во дворах и подъездах, чистоту и свет в подъездах, сломанные лавки, разбитые стёкла на остановках, затопленные или заметённые снегом участки дорог или кондиционеры на фасадах. Сейчас VisionLabs тестирует эти сценарии в Москве.

Системы мультимодального поиска построены на базе визуально-языковых моделей (VLM, visual language model), работа которых основана на понимании связи между изображением и текстом. Нейросеть анализирует все фотографии в базе и сохраняет их визуальные характеристики в виде цифровых отпечатков. Когда пользователь вводит текстовое описание, ИИ преобразует его в цифровой отпечаток, сравнивает со всеми сохранёнными отпечатками и находит наиболее похожие изображения. Благодаря оптимизированным алгоритмам поиск по базе осуществляется за доли секунды.

«Я уверен, что будущее за визуально-языковыми моделями, когда каждый сможет размечать данные и искать изображения с помощью простого текстового запроса. Мы постоянно инвестируем в перспективные направления и в прошлом году вложили в исследования и разработку 200 миллионов рублей. Один из результатов — платформа Luna Line, которая позволяет создавать ML-модели без кода, ускоряет запуск проектов на 30% и на столько же сокращает бюджет на запуск и поддержку ML-решений», — комментирует Дмитрий Марков, генеральный директор VisionLabs.

Платформа Luna Line может разворачиваться в корпоративном контуре заказчика — на собственной инфраструктуре или в частном облаке. Реализация всех ML-сценариев на одной платформе централизует использование ресурсов, улучшает коммуникацию между командами и подразделениями, а также упрощает и ускоряет масштабирование решений на всю сеть предприятия.

VisionLabs — один из мировых лидеров в области решений по распознаванию на базе компьютерного зрения. Компания реализовала более 500 проектов в 37 странах. Технологии VisionLabs применяются в финансовой, телекоммуникационной и транспортной отраслях, а также в ритейле и промышленности. Более 1,7 млн камер по всему миру используют программное обеспечение VisionLabs.

https://visionlabs.ru

Контакты:

Телеграм-канал: https://t.me/visionlabs_news

Для вопросов: pr@visionlabs.ru

MWS AI (входит в МТС Web Services) основана в 2019 году. Она разрабатывает решения для создания и запуска корпоративных приложений на базе искусственного интеллекта. Также MWS AI выступает партнёром по ИИ-трансформации для крупного бизнеса и государственных организаций. Основной продукт MWS AI — платформа MWS AI Agents Platform. С её помощью сотрудники компаний могут без навыков программирования создавать ИИ-агентов и мультиагентные системы в визуальном конструкторе бизнес-сценариев и на естественном языке по текстовому запросу. Собственные разработки компании включают большие языковые и мультимодальные модели Cotype, модели речевой аналитики, алгоритмы распознавания речи и синтеза голоса. Экспертиза MWS AI в области компьютерного зрения сосредоточена в портфельной компании VisionLabs.

Количество просмотров: 74

теги:

28.05.2026 17:44 | iTrend → блог автора

Комментарии (0)

Еще публикации:

Все публикации

• ERROR:256 in {KERNEL_DIR}/include/mysql.php:39;

SQL[1055] Expression #4 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'sitebs.cm.author' which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by

{KERNEL_DIR}/include/mysql.php: 50
query_mysql->query("SELECT h.com_public,(CASE WHEN cnt>0 THEN cnt ELSE 0 END)cnt,(CASE WHEN md>0 THEN md ELSE 0 END)mid FROM htdocs h LEFT JOIN (SELECT COUNT(cm.id) cnt,AVG(cm.rate) md,cm.htdoc_id,cm.author FROM comments cm INNER JOIN users u ON (cm.author=u.id) WHERE cm.public='1' AND 1=1 GROUP BY cm.htdoc_id) as c ON (h.id=c.htdoc_id) WHERE h.id='123908'");
{KERNEL_DIR}/modules/comments/main.php: 29
query_mysql->format("SELECT h.com_public,(CASE WHEN cnt>0 THEN cnt ELSE 0 END)cnt,(CASE WHEN md>0 THEN md ELSE 0 END)mid FROM htdocs h LEFT JOIN (SELECT COUNT(cm.id) cnt,AVG(cm.rate) md,cm.htdoc_id,cm.author FROM comments cm INNER JOIN users u ON (cm.author=u.id) WHERE cm.public='1' AND 1=1 GROUP BY cm.htdoc_id) as c ON (h.id=c.htdoc_id) WHERE h.id='%d'", "123908");
{KERNEL_DIR}/include/common.php: 46
include("{KERNEL_DIR}/modules/comments/main.php");
{DOCUMENT_ROOT}/ajax/comments.php: 7
module("/comments/main.php");
{KERNEL_DIR}/modules/htdocs/templates/postfix.phpt: 41
require_once("{DOCUMENT_ROOT}/ajax/comments.php");
{KERNEL_DIR}/include/common.php: 64
include("{KERNEL_DIR}/modules/htdocs/templates/postfix.phpt");

{KERNEL_DIR}/modules/htdocs/postfix.php: 33
template("{KERNEL_DIR}/modules/htdocs/templates/postfix.phpt", Array ( [tape] => Array ( [0] => Array ( [id] => 125503 [title] => Аренда автобуса на свадьбу: зачем нужен транспорт для гостей [created] => 1785189367 [published] => 1785189367 [updated] => 1785189458 [path] => /blogs/125503.html ) [1] => Array ( [id] => 125502 [title] => Windows 10 Home или Pro: какую редакцию выбрать [created] => 1785176710 [published] => 1785176710 [updated] => 0 [path] => /blogs/125502.html ) [2] => Array ( [id] => 125501 [title] => На фестивале современного искусства появилась советская автобусная остановка от RTVI [created] => 1785175428 [published] => 1785175428 [updated] => 0 [path] => /blogs/125501.html ) [3] => Array ( [id] => 125500 [title] => Квартира от 3,5 млн рублей рядом с Симферополем: ЖК «Республика» — новый формат комфортной жизни [created] => 1785164489 [published] => 1785164489 [updated] => 0 [path] => /blogs/125500.html ) [4] => Array ( [id] => 125499 [title] => Озвучка видео онлайн: когда стоит заказать профессионального диктора [created] => 1785164217 [published] => 1785164217 [updated] => 0 [path] => /blogs/125499.html ) ) [tags] => Array ( ) ) );

{KERNEL_DIR}/include/common.php: 46
include("{KERNEL_DIR}/modules/htdocs/postfix.php");
{KERNEL_DIR}/tmp/maket#2.phpt: 264
module("/htdocs/postfix.php");
{KERNEL_DIR}/include/common.php: 64
include("{KERNEL_DIR}/tmp/maket#2.phpt");
{KERNEL_DIR}/include/common.php: 352
template("{KERNEL_DIR}/tmp/maket#2.phpt");
{KERNEL_DIR}/router.php: 254
maket(2);
{DOCUMENT_ROOT}/errdoc.php: 5
include_once("{KERNEL_DIR}/router.php");

Strict Standards: Only variables should be assigned by reference in /var/www/sitebs_ru_usr/data/www/sitebs.ru/aquilon/include/common.php on line 135

Strict Standards: Only variables should be assigned by reference in /var/www/sitebs_ru_usr/data/www/sitebs.ru/aquilon/include/session.php on line 60