Специалистите от лабораторията за компютърни технологии на MIT създадоха първата в света система за машинно обучение, която предсказва честотата на появата на определени елементи от данните в потока. Новият подход изпревари по точност всички съвременни методи.

В информатиката „проблемът Бритни Спиърс“ наричат изчислителна задача, свързана с мониторинга на потока данни: вместо да се наблюдава всеки един потребителки пакет от и към провайдъра, използват се специализирани алгоритми, които прогнозират честотата на обмена на данните чрез хеширане. Но при този подход, някои детайли неизбежно се губят.

Новата система LearnedSketch предсказва, дали точно определени елементи от данните се появяват по-често от останалите и ако това е наистина така, тези елементи автоматично се отделят от останалата хеширана група.

За първи път машинно обучение се използва не само за оценка честотата на появяването, но и към поточните алгоритми – клас алгоритми, в които входните данни се представят като поредица и могат да бъдат изучени само след прилагането на няколко паса.

По време на експериментите LearnedSketch показа разкриване и изолиране на големи обеми данни. Така например, системата обучена с 210 милиона мрежови пакети е направила 57% по-малко грешки. А при обучение с 3,8 уникални пакети, получени от провайдъра America Online, системата е успяла да определи броя запитвания със 71% по-точно.

Създателите на LearnedSketch считат, че тази система съвсем скоро ще може да се използва за проследяване трендовете в социалните мрежи, както и за определяне и прогнозиране на пиковите натоварвания в мрежовия трафик.