Инструмент на конструкторе Интеграм

Массовое сопоставление каталогов на сотни тысяч позиций

Один и тот же товар в вашем каталоге и в каталоге контрагента назван по-разному и имеет разные артикулы. Инструмент сопоставляет такие позиции автоматически — через токенизацию наименований и пересечение токенов, в несколько потоков и без программирования. Раньше под это разворачивали Elasticsearch и нанимали программистов; здесь всё собрано на конструкторе Интеграм.

Полный цикл сопоставления

Загрузка по сохранённой настройке

Свой каталог (SKU) и каталог контрагента (RFP) загружаются из Excel по сохранённой настройке: Интеграм распознаёт листы и колонки и показывает число строк. Скорость — порядка 500–1000 записей в секунду.

Токенизация наименований

Один запрос разбивает наименование на слова-токены и наполняет общий справочник токенов. Обе таблицы используют один справочник — это позволяет искать пересечения.

Рабочее место сопоставления

Для позиции контрагента по токенам подбираются кандидаты из вашего каталога. Совпадение марки, модели и типа подсвечивается зелёным; настройка под тип товара задаётся запросом, без программирования.

Массовый автоматический подбор

Кнопка Start запускает автоподбор в несколько потоков: механизм пишет в таблицу RFP подобранный артикул и альтернативы. Скорость — порядка 120 сопоставлений в минуту; 22 000 позиций обрабатываются за пару-тройку часов.

Выгрузка и передача

Отдельный запрос собирает подобранный артикул и все альтернативы и выгружает результат в Excel или отдаёт через JSON API.

Доуточнение языковой моделью

Шорт-лист кандидатов отдаётся языковой модели, которая выбирает только то, что точно совпадает. Перемножение «все на все» не нужно — модель работает по уже отобранным парам.

Как считается оценка совпадения

У каждой пары есть числовая оценка точности: она складывается из количества совпавших токенов и отношения их общей длины к длине наименования. Формула на виду — её можно усложнять и оттачивать под номенклатуру: добавлять веса частым и редким токенам, требовать обязательного совпадения бренда и типа товара.

Интеграм против Elasticsearch и заказной разработки

Обычно сопоставление каталогов решают поисковым движком, нечётким поиском и руками программистов. В Интеграме запуск не требует развёртывания индексов и кода, логика сопоставления настраивается запросом без релиза, массовый прогон идёт встроенным многопоточным автоподбором, а результат — подобранный артикул, альтернативы и экспорт в Excel и API — доступен из коробки. Данные хранятся на сервере в РФ.