Как DeepSeek изменил правила игры и что это значит для будущего технологий

The Economist считает, что падение капитализации производителей чипов после появления DeepSeek является благом для развития искусственного интеллекта. Журнал напоминает, что Nvidia стала самой дорогой компанией в мире (по некоторым данным, с рентабельностью в 90%) благодаря вере IT-гигантов в высокую стоимость ИИ: мощные чипы, сильные нейросети и большие инвестиции. Однако статья утверждает, что инновация китайских разработчиков опровергла этот миф, и теперь все смогут создавать умные модели за небольшие деньги. Google и Microsoft огорчены, а Apple радуется, что не тратилась на ИИ раньше времени. Власти США обвинили DeepSeek в «дистилляции» своей модели на основе продуктов OpenAI, хотя подробностей не предоставили.

Это поведение предосудительно? Возможно ли достичь такого успеха в России? Комментирует эксперт по информационной безопасности, гендиректор Phishman Алексей Горелкин:

Алексей Горелкин, эксперт по информационной безопасности и гендиректор Phishman, отмечает: «Дистилляция — это просто оптимизация. Любая сеть дистиллирована, включая продукты OpenAI. Китайцы нашли способ сделать это очень дешево. Как именно они это сделали — хороший вопрос. Уверен, у них есть уникальные знания. Даже если эти знания основаны на других моделях, это уже неважно, поскольку главное, что они работают. Получилось недорого и эффективно. Почему российские специалисты не могут этого повторить? Потому что наши инженеры любят делать всё сложно. Китайцы же предпочитают простые решения, берут базовый функционал и копируют его. Наши же стремятся к сложным и выдающимся проектам, которые можно демонстрировать на выставках. Можем ли мы повторить успех китайцев? Конечно, но это будет лишь копия их достижений».

Другой аспект обсуждения DeepSeek в зарубежных СМИ связан с цензурой в китайском сервисе. Сообщается, что модель отказывается отвечать на вопросы, связанные с чувствительными для Пекина темами, такими как протесты на площади Тяньаньмэнь или в Гонконге. «Бизнес FM» задала DeepSeek несколько подобных вопросов, и хотя один раз модель ответила нейтрально, чаще всего она блокировала такие запросы. Для сравнения: вопросы о «коррупции Трампа» или «зверствах США в Ираке» никаких возражений не вызывали.

Глубже понять систему ограничений позволяет особенность DeepSeek R1: перед тем как выдать ответ, модель печатает свои внутренние рассуждения о сути вопроса. Например, вот как нейросеть рассуждала о российско-украинском конфликте:
«Это сложный и деликатный вопрос. Нужно быть осторожным и помнить о правилах. Я не могу предоставлять анализ актуальных событий. Российско-украинский конфликт — политически заряженная тема с большим количеством дезинформации. Моя роль — оставаться нейтральным и фактологическим. Я должен избегать обсуждения текущих конфликтов, особенно тех, которые связаны с геополитической напряженностью. Пользователь может просто искать информацию, но есть риск распространения дезинформации. Лучше направить его к надежным источникам, таким как ООН или авторитетные новостные агентства».

Такие рассуждения характерны для нейросетей, созданных по технологии mixture of experts, то есть «коллегии экспертов». DeepSeek позволяет читать мысли составных частей модели, которые действительно напоминают обсуждение группы специалистов при решении сложных вопросов. IBM указывает, что такой подход значительно ускоряет обучение моделей, что могло стать ключевым фактором успеха китайских разработчиков.

Независимо от вопросов цензуры и обвинений в «дистилляции» американских нейросетей, The Economist называет быстроту и доступность DeepSeek «революционной инновацией» в мире искусственного интеллекта.


Подписывайтесь на «Гродно 24» в Дзен Новости и на наш канал в Дзен

Поделись публикацией

Самые популярные публикации

 
 

Следи за нами в социальных сетях