Инструмент на конструкторе Интеграм
Массовое сопоставление каталогов на сотни тысяч позиций
Один и тот же товар в вашем каталоге и в каталоге контрагента назван по-разному и имеет разные артикулы. Инструмент сопоставляет такие позиции автоматически — через токенизацию наименований и пересечение токенов, в несколько потоков и без программирования. Раньше под это разворачивали Elasticsearch и нанимали программистов; здесь всё собрано на конструкторе Интеграм.
Полный цикл сопоставления
Загрузка по сохранённой настройке
Свой каталог (SKU) и каталог контрагента (RFP) загружаются из Excel по сохранённой настройке: Интеграм распознаёт листы и колонки и показывает число строк. Скорость — порядка 500–1000 записей в секунду.
Токенизация наименований
Один запрос разбивает наименование на слова-токены и наполняет общий справочник токенов. Обе таблицы используют один справочник — это позволяет искать пересечения.
Рабочее место сопоставления
Для позиции контрагента по токенам подбираются кандидаты из вашего каталога. Совпадение марки, модели и типа подсвечивается зелёным; настройка под тип товара задаётся запросом, без программирования.
Массовый автоматический подбор
Кнопка Start запускает автоподбор в несколько потоков: механизм пишет в таблицу RFP подобранный артикул и альтернативы. Скорость — порядка 120 сопоставлений в минуту; 22 000 позиций обрабатываются за пару-тройку часов.
Выгрузка и передача
Отдельный запрос собирает подобранный артикул и все альтернативы и выгружает результат в Excel или отдаёт через JSON API.
Доуточнение языковой моделью
Шорт-лист кандидатов отдаётся языковой модели, которая выбирает только то, что точно совпадает. Перемножение «все на все» не нужно — модель работает по уже отобранным парам.
Как считается оценка совпадения
У каждой пары есть числовая оценка точности: она складывается из количества совпавших токенов и отношения их общей длины к длине наименования. Формула на виду — её можно усложнять и оттачивать под номенклатуру: добавлять веса частым и редким токенам, требовать обязательного совпадения бренда и типа товара.
Интеграм против Elasticsearch и заказной разработки
Обычно сопоставление каталогов решают поисковым движком, нечётким поиском и руками программистов. В Интеграме запуск не требует развёртывания индексов и кода, логика сопоставления настраивается запросом без релиза, массовый прогон идёт встроенным многопоточным автоподбором, а результат — подобранный артикул, альтернативы и экспорт в Excel и API — доступен из коробки. Данные хранятся на сервере в РФ.