Google представи своя най-мощен и енергийно ефективен Tensor Processing Unit (TPU), наречен Ironwood, проектиран специално за модели с изкуствен интелект (AI).
 
Новият TPU беше обявен от Амин Вахдат, вицепрезидент на Google и генерален мениджър за машинно обучение, системи и облачен AI, на виртуална пресконференция преди събитието Google Cloud Next 25.

Твърди се, че Ironwood е създаден, за да поддържа следващата фаза на генеративния AI и неговите масивни изчислителни и комуникационни изисквания. Чипът ще направи AI моделите по-бързи и по-интелигентни, особено когато работите върху задачи, които изискват разсъждения или прогнози. Тази дейност е известна като „извод“.

„Това е, което наричаме „ера на извода“, където агентите на изкуствения интелект активно ще извличат и генерират данни, за да разработват съвместно идеи и отговори, не само данни“, каза Вахдат.

Когато се внедри в мащаб, TPU има 24 пъти повече изчислителна мощност от всеки суперкомпютър в света, според компанията. Той може да достави 42,5 екзафлопа изчислителна мощност, когато се мащабира до 9216 чипа на модул. Тези цифри надхвърлят 1,7 екзафлопа на El Capitan, най-бързият суперкомпютър в света.

Ironwood се предлага и със 192 GB памет с висока честотна лента (HBM). Това е шест пъти по-голямо от Trillium, TPU от предишно поколение на Google, обявен миналата година. Ironwood също може да достигне 7,2 терабита в секунда на чип по отношение на честотната лента на паметта, което е 4,5 пъти повече от Trillium.

„Въпреки че наличната мощност е едно от ограниченията за предоставяне на възможности за AI, ние доставяме значително повече мощност на ват за работните натоварвания на клиентите“, каза говорител на Google.

"Ironwood представлява уникален пробив в ерата на умозаключенията с повишена изчислителна мощност, капацитет на паметта, подобрения в мрежата на ICI и надеждност. Тези пробиви, съчетани с почти 2 пъти подобрение на енергийната ефективност, означават, че нашите най-взискателни клиенти могат да поемат обучение и обслужващи работни натоварвания с най-висока производителност и най-ниска латентност, като същевременно отговарят на експоненциалното нарастване на компютърното търсене. Водещи мислещи модели като Gemini 2.5 и носителя на Нобелова награда AlphaFold работят на TPU днес, а с Ironwood нямаме търпение да видим какви пробиви в ИИ са предизвикани от нашите собствени разработчици и клиенти на Google Cloud, когато стане наличен по-късно тази година", добави той.