Излезе първата експериментална версия на системата за управление на бази данни EuclidesDB, предоставяща възможности за използване на различни модели машинно обучение при индексирането и извличането на данните. Новата СУБД позволява прикачването към различните класове различни модели на машинно обучение. Проектът е написан на C++ и се разпространява под Apache 2.0 лиценз. Моделите на машинно обучение се обработват с помощта на библиотеката PyTorch.

СУБД EuclidesDB е едно универсално решение за създаване на системи за обработка на данни, образуващо готова платформа за търсене на сходни данни. За всяка категория данни могат да се създават отделни модели на машинно обучение. Например, за търсенето на обувки може да се използва един модел, а за търсене на тениски – друг модел на машинно обучение.

При добавяне на нова информация в базата данни, например на изображения, заедно с данните се указва и избрания модел на машинно обучение, като това ще се използва при индексирането.

Взаимодействието с новата СУБД се осъществява с помощта на протокола gRPC. Логиката на обработката на моделите се задава с програмния език Python (TorchScript ). В комплекта са предоставени три готови модела (resnet101, resnet18 и vgg16), осигуряващи разпознаването и класификацията на изображения. В бъдеще ще бъдат включени и модели за обработката на други видове информация.