Microsoft разрабатывает собственный чип под кодовым названием Athena, который можно использовать для обучения больших языковых моделей и избежать дорогостоящей зависимости от NVIDIA.
Согласно отчету The Information, компания тайно работает над Athena с 2019 года, а сейчас общая группа сотрудников Microsoft и OpenAI уже имеет доступ к чипам и может проверить, насколько хорошо они работают с последними крупными языковыми моделями, такими как GPT-4.
Сейчас ключевой поставщик ИИ-чипов – это NVIDIA. Последняя версия графических процессоров компании H100 продается на eBay более чем за $40 000. По оценкам OpenAI для коммерциализации ChatGPT понадобится более 30 000 чипов более ранней версии NVIDIA A100.
В то время как NVIDIA пытается создать как можно больше чипов, чтобы удовлетворить спрос компаний, Microsoft ищет возможности и способ сэкономить деньги на обучении ИИ. Сообщается, что компания ускорила работу над Athena – проектом по созданию чипов для искусственного интеллекта собственного производства. Непонятно, сделает ли Microsoft когда-нибудь эти чипы доступными для клиентов облачного сервиса Azure, однако для собственных проектов (в частности, и тех, что разрабатывает OpenAI) их, вероятно, будут применять уже в следующем году. Компания также разработала дорожную карту, предусматривающую производство чипов нескольких поколений.
Будущие ИИ-чипы Microsoft не называет прямой заменой процессорам NVIDIA, однако считает, что внутренние усилия могут значительно сократить затраты на них. В настоящее время компания продолжает развертывать функции искусственного интеллекта в поисковике Bing, программах Office, GitHub и других собственных продуктах.
Также в конце 2020 года Bloomberg сообщал, что Microsoft рассматривала возможность разработки собственных процессоров на архитектуре ARM для серверов и возможно даже будущего устройства Surface. Готовых продуктов мы еще не видели, но компания сотрудничала с AMD и Qualcomm в разработке специальных чипов для устройств Surface Laptop и Surface Pro X.
У Amazon, Google и Meta есть собственные чипы для искусственного интеллекта, но многие компании все еще полагаются на процессоры NVIDIA для работы с последними большими языковыми моделями.
Google с 2016 года разрабатывает и разворачивает свой чип для искусственного интеллекта под названием Tensor Processing Unit (TPU). Внутри компании TPU используют для более чем 90% работы по обучению искусственного интеллекта. В недавней научной статье Google рассказала, что с помощью своих специально разработанных оптических переключателей объединила более 4000 таких чипов в суперкомпьютер, на котором в течение 50 дней училась модель Google PaLM. И эти машины, по словам компании, значительно более быстрые и энергоэффективные, чем аналогичные системы NVIDIA.