Китайские компании лидируют в гонке вооружений ИИ. Об этом заявил китайский политик и IT-специалист Лу Циньцзянь, недавно похваливший компанию DeepSeek за ее достижения: «DeepSeek придерживается подхода с открытым исходным кодом и способствует широкому применению технологий ИИ в глобальном масштабе, что способствует распространению китайской мудрости в мире».
«На примере таких компаний, как DeepSeek, мы можем наблюдать инновационный и инклюзивный характер технологического развития Китая».
В феврале на саммите Artificial Intelligence Action Summit в Париже вице-президент США Джей Ди Вэнс четко обозначил позицию администрации Трампа в отношении искусственного интеллекта. Он заявил, что, прежде всего, администрация Трампа будет следить за тем, чтобы американские технологии искусственного интеллекта оставались золотым стандартом во всем мире и чтобы американские компании оставались предпочтительными партнерами для международных компаний и зарубежных стран.
Вице-президент утверждал, что чрезмерное регулирование сектора ИИ приведет к гибели зарождающейся отрасли, и что администрация будет поощрять политику развития ИИ.
Я хотел бы, чтобы во многих разговорах на этой конференции присутствовал дерегулирующий дух
- сказал он.
Вэнс также дал понять, что ИИ должен быть свободен от идеологических предрассудков и что американский ИИ не будет превращен в инструмент авторитарной цензуры.
И наконец, администрация Трампа будет обеспечивать развитие ИИ в интересах трудящихся, чтобы он мог создавать рабочие места в Соединенных Штатах. Вэнс также поднял вопрос о том, что иностранные противники могут использовать программное обеспечение ИИ для переписывания истории, слежки за пользователями и цензуры. Как заявил Вэнс:
Конечно, это вряд ли что-то новое, как это происходит и с другими технологиями. Некоторые авторитарные режимы похищают и используют ИИ для усиления своей военной разведки и слежки, сбора персональных данных и создания пропаганды для подрыва национальной безопасности других стран.
Он предостерег участников конференции от сотрудничества с такими режимами. По его словам, мы все знакомы с дешевыми технологиями на рынке, которые в значительной степени субсидируются и экспортируются авторитарными режимами, от систем видеонаблюдения до оборудования 5G. Но, как я знаю, и, думаю, некоторые из нас в этом зале убедились на собственном опыте, партнерство с ними означает приковывание вашей страны к авторитарному хозяину, который стремится проникнуть в вашу информационную инфраструктуру, окопаться в ней и захватить ее».
Под капотом DeepSeek
В январе компания DeepSeek потрясла мировые рынки, представив недорогие модели, из-за которых стало казаться, что американские компании отстают в гонке вооружений ИИ. ИИ снизил затраты на разработку надежных ИИ, зарекомендовав себя как мощная и экономически эффективная языковая модель с открытым исходным кодом.
Он изменил наше представление о том, сколько капитала и вычислительных ресурсов необходимо для разработки ИИ. Исследователи всего западного мира теперь вынуждены играть в догонялки, изучая технические достижения DeepSeeks и социальные последствия.
У DeepSeek есть очевидные преимущества. Например, стартапы, не обладающие такими глубокими карманами, как Google и OpenAI, теперь могут конкурировать в секторе ИИ. В мире после DeepSeep модели ИИ могут делать больше с меньшими затратами. Компания утверждает, что ей потребовалось всего 6 миллионов долларов, используя 2000 графических процессоров Nvidia H800, в то время как стоимость GPT-4 составляла от 80 до 100 миллионов долларов, а для Metas LLaMA 3 потребовалось 16 000 GPU H100.
Модель ИИ стартапа из Ханчжоу использует возможности рассуждений, которые позволяют создавать небольшие модели, в то время как другие ИИ вынуждены использовать более крупные модели. Она также использует обучение с подкреплением, что устраняет необходимость в точной настройке под надзором. Кроме того, механизм DeepSeeks multi-head latent attention (MHLA) снижает потребление памяти до 5%, по сравнению с 13% в более ранних методах ИИ.
DeepSeek вызывает опасения по поводу конфиденциальности и вопросов, связанных с предоставлением данных и авторских прав. DeepSeek имеет открытый вес, но не открытый исходный код. Модели с открытым исходным кодом предоставляют полный исходный код и данные, а модели с открытым весом предоставляют обученные веса, но не код. Поэтому точный исходный код, использованный для обучения моделей, недоступен.
В случае с моделью DeepSeeks с открытым весом неизвестно, каковы ее источники. Похоже, так работает большинство ИИ-компаний. DeepSeek обнародовала свои модели обучения R1 и открытые веса, что позволит другим разработчикам ИИ копировать и строить на основе модели, но не ее исходные тексты.
DeepSeek и геополитика
Гонка за доминирование в области ИИ между Китаем и США вышла на первый план, в то время как возможности России в этом вопросе остаются в секрете. Сбербанк – крупнейший российский государственный банк – раскрыл свои намерения сотрудничать с китайскими исследователями по проектам в области ИИ. Россия и Китай, которые разделяют так называемое стратегическое партнерство «без ограничений», уже давно говорят о сотрудничестве в области ИИ, в том числе в военной сфере, но о его глубине и масштабах мало что известно.
Сбербанк, возглавляемый Германом Грефом, некогда бывший государственный сберегательный банк советского образца, сегодня является одним из ведущих российских игроков в области искусственного интеллекта. Он выпустил свою модель GigaChat в 2023 году. В Сбербанке много ученых. Через них мы планируем проводить совместные исследовательские проекты с учеными из Китая, сказал Reuters первый заместитель председателя правления Сбербанка Александр Ведяхин.
По мере того как накаляется гонка вооружений в области искусственного интеллекта, преимущества инноваций с открытым исходным кодом выходят на первый план. Маленькие цветы пробиваются сквозь бетон по всему миру, предлагая крутые технологии с открытым исходным кодом и децентрализованные.
Комментарии (0)