Огляд DeepSeek: що відомо про конкурента ChatGPT на даний момент та думки експертів

Огляд DeepSeek: що відомо про конкурента ChatGPT на даний момент та думки експертів
27 січня 2025 року акції світових технологічних гігантів, що займаються розробкою чипів, відеокарт і обчислювального обладнання, різко пішли вниз. Nvidia втратила 17% ринкової капіталізації, котирування Dell просіли на 7,2%, а індекс Nasdaq знизився на 3,04%. Не оминуло падіння й інші компанії: акції Microsoft впали на 2,2%, а Alphabet — на 3,5%.
Основна причина — запуск великої мовної моделі (LLM) R1 від DeepSeek, що позиціонується як прямий конкурент OpenAI o1.
У цьому матеріалі розбираємо, що таке DeepSeek, чому запуск нового ШІ-алгоритму змусив ринок переглянути позиції лідерів індустрії, і чи дійсно запропоноване рішення може перевернути весь сектор.
Що таке DeepSeek?
DeepSeek — це китайська технологічна компанія, що працює у сфері штучного інтелекту. Її історія почалася з інвестиційної компанії High-Flyer, яка використовувала машинне навчання для торгівлі акціями.
У 2019 році команда запустила дочірній проєкт High-Flyer AI, зосереджений на дослідженні ШІ-алгоритмів. У 2023-му компанія змінила вектор розвитку і повністю зосередилася на створенні систем загального штучного інтелекту, що і призвело до появи DeepSeek.
Під час діяльності розробникам DeepSeek вдалося створити кілька LLM, кожна з яких має свої особливості:
- DeepSeek Coder: Представлена в листопаді 2023 року, модель була навчена для роботи з програмним кодом, підтримуючи англійську та китайську мови;
- DeepSeek-VL: Випущена в березні 2024 року, ця модель призначена для розуміння візуально-мовних завдань;
- DeepSeek-V2. З’явилася в травні 2024 року. Використовує архітектуру Mixture-of-Experts, що істотно скорочує вартість навчання;
- DeepSeek-V3. Випущена в листопаді 2024 року, V3 досягла прориву в швидкості виведення і зайняла лідируючі позиції серед моделей з відкритим вихідним кодом
Остання і найбільш значуща розробка компанії — модель DeepSeek R1, представлена в січні 2025 року. Вона заснована на архітектурі DeepSeek-V3 і призначена для вирішення завдань, пов’язаних із логічним мисленням і математичними розрахунками в реальному часі.
Вона продемонструвала високу продуктивність за значно нижчих витрат на обчислення порівняно з передовими моделями OpenAI на кшталт GPT-4o. За оцінками експертів, вартість опрацювання 1 млн токенів у DeepSeek R1 становить трохи більше $2, тоді як витрати OpenAI на той самий обсяг даних становлять близько $60.
Співзасновник платформи Assisterr Дмитро Діменко зазначає, що особливість DeepSeek полягає у використанні архітектури MoE (Mixture of Experts). Це ускладнює налаштування моделі, але через високу потужність потреба в тонкому доналаштуванні менша.
Крім веб-версії, R1 набула поширення і через мобільний застосунок DeepSeek, який швидко посів перше місце серед безплатних застосунків в App Store і GooglePlay, витіснивши клієнт ChatGPT.
Діменко вказує, що розробники DeepSeek імплементували низку нових рішень, які роблять як саму модель, так і механізм її роботи більш компактними. Це дало змогу створити «distilled» варіанти для мобільних пристроїв. І хоч вони збиваються і плутаються на великих текстах або складних питаннях, але на малопотужному обладнанні працюють набагато ефективніше, ніж наявні моделі.
Саме ця демонстрація економічної ефективності DeepSeek R1 стала однією з головних причин обвалу акцій компаній, так чи інакше пов’язаних з ШІ-індустрією — від виробників обчислювального обладнання, до творців LLM.
Як нейромережі впливають на ринок криптовалют
Штучний інтелект дедалі глибше інтегруються в різні сфери економіки та повсякденного життя, створюючи нові бізнес-моделі та впливаючи на динаміку фінансових та інших у різних галузях. Не стала винятком і криптоіндустрія.
Одним із найяскравіших прикладів макроекономічного впливу АІ-компаній став обвал фондового ринку США 27 січня 2025 року, коли акції Nvidia впали на 17%, а її капіталізація скоротилася на $589 млрд. На тлі цих подій біткоїн опустився нижче за $100 000, а більшість AI-токенів відреагували високою волатильністю, супроводжуваною відтоком капіталу.


Крім того, нейромережі мають і технологічний вплив на блокчейн-проєкти. Ринок ШІ-агентів став ключовим напрямком перетину цих технологій.
Це автономні програми, інтегровані з блокчейном, які можуть аналізувати ринкові дані, управляти цифровими активами й автоматизувати торгові стратегії.
Їхнім ядром є нейронні мережі, що відповідають за обробку інформації та ухвалення рішень, тому ефективність і доступність LLM безпосередньо впливає на розвиток агентів. Після запуску DeepSeek R1 більшість популярних фреймворків для розробки агентів додали підтримку цієї моделі, швидко перетворивши її на частину блокчейн-екосистеми.
Крім цього, ШІ та криптоіндустрія взаємодіють і в інших, менш помітних напрямках:
- аналіз транзакцій і боротьба з шахрайством;
- децентралізовані обчислення і зберігання даних;
- платформи для смартконтрактів на основі ШІ-алгоритмів;
- створення токенізації генеративного контенту;
- прогнозування ринкових тенденцій і аналіз настроїв інвесторів;
- виявлення шахрайства та аномальної поведінки користувачів;
- розробка персоналізованих інвестиційних стратегій та інші.
Докладніше про потенційні напрямки взаємодії ШІ та децентралізованих мереж можна дізнатися в нашій оглядовій статті.
Нові можливості для бізнесу
Головна особливість DeepSeek — відчутне зниження витрат на обчислення. Порівняно з моделями OpenAI, компанія змогла знизити вартість навчання у 20-30 разів, що відкриває нові перспективи для бізнесу.
Якщо раніше розробка і підтримка рішень на базі LLM вимагала величезних інвестицій в обладнання та хмарні обчислення, то, використовуючи DeepSeek R1, навіть стартапи і невеликі підприємства можуть інтегрувати ШІ у свої продукти, а час виведення інновацій на ринок значно скорочується. Для бізнесу це означає:
- зниження витрат на впровадження ШІ;
- доступні персоналізовані рішення;
- ШІ в мобільних і веб-додатках навіть для малопотужних пристроїв;
- можливості для розвитку технічних проєктів у країнах з обмеженими ресурсами.
Потенційно DeepSeek може сформувати альтернативну екосистему в ШІ-галузі, орієнтовану на користувачів із меншим бюджетом або нижчим технологічним рівнем. Крім того, зниження вартості роботи нейромережі може радикально змінити ринок, прискоривши експансію ШІ-рішень у всіх сферах.
На думку Діменка, можливо, бюджетним проєктам вдасться забезпечити кращу якість продукту і користувачі отримають недоступну раніше користь від слабких моделей. Через це попит на ШІ-рішення загалом може зрости.
Ризики та виклики
Поява дешевої та високоефективної AI-моделі може розглядатися як серйозний виклик для наявних лідерів індустрії та для суміжних ринків, а в ширшій перспективі, — цілих країн. Серед основних ризиків, які може спровокувати DeepSeek можна виділити:
- зростаючу конкуренцію серед ШІ-компаній. DeepSeek R1 з її низькою вартістю і високою продуктивністю може забрати частину користувачів у OpenAI, Google і Microsoft. Це ставить перед цими компаніями загрозу втрати ринкової частки, зниження прибутку і необхідності адаптувати цінову політику або шукати нові способи оптимізації своїх рішень;
- наслідки для виробників апаратного забезпечення. DeepSeek довела, що ефективні AI-моделі можна навчати на менш потужних і дешевих чипах, що ставить під сумнів необхідність у високопродуктивних GPU. У результаті попит на преміальні графічні процесори від NVIDIA може скоротитися, що вплине на її фінансові результати;
- вплив на криптовалютну індустрію. Нова LLM може істотно знизити вартість розробки і розгортання ШІ-продуктів у Web3. Дешевші обчислення також дадуть змогу розширити використання алгоритмів у смартконтрактах, що може призвести до нової хвилі AI-інтеграції в блокчейн.
Однак зниження вхідного порогу для розробників також означає збільшення конкуренції, що може призвести до перегляду ринкових існуючих проєктів.
- геополітичні виклики для США та західних корпорацій. Розвиток DeepSeek показав, що Китай здатен створювати передові AI-рішення навіть в умовах санкцій, що посилює технологічне суперництво зі США. Це може призвести до фрагментації індустрії та формування незалежних технологічних блоків із власними лідерами.
Загалом же, поява доступних і продуктивних нейромереж знижує бар’єри для входу на ринок, але також загострює цінову конкуренцію. Компанії, які не зможуть адаптувати свої технології та бізнес-моделі до нових рішень, ризикують втратити свої позиції і поступитися місцем новим гравцям. Однак поки складно оцінити потенційний масштаб впровадження DeepSeek.
В Assister вважають, що підхід DeepSeek найімовірніше буде використаний іншими гігантами індустрії. Зараз у новачків є фора, але питання в тому, як вони її використовують і як швидко ринок відреагує. Після анонсу нових моделей від інших розробників (у найближчі місяці) R1 втратить свою сенсаційність.
DeepSeek vs ChatGPT
DeepSeek R1 позиціонується як прямий конкурент GPT, зокрема передової GPT-4o, яка є флагманською LLM на ринку. Обидва рішення мають свої переваги та обмеження, але головна відмінність полягає у філософії розроблення: DeepSeek робить ставку на дешеву та модульну архітектуру, тоді як ChatGPT орієнтований на універсальність та масштабованість. Наведена нижче порівняльна таблиця допоможе краще зрозуміти ключові відмінності між цими рішеннями.
Характеристика | DeepSeek | ChatGPT |
Архітектура | Модульна структура на основі трансформерів (MOE) | GPT (Generative Pre-trained Transformer) |
Масштаб моделі | Оптимізована для конкретних завдань | Велика, орієнтована на універсальне застосування |
Дані для навчання | Відкриті набори даних | Великі закриті набори даних |
Обробка даних | Розділяє завдання між модулями, заощаджуючи ресурси | Обробляє все одночасно, що вимагає більше потужностей |
Продуктивність | Сильніша у вузькоспеціалізованих завданнях | Висока в загальних сценаріях |
Розподіл навантаження | Оптимізує роботу між модулями | Відсутні спеціальні методи |
Прогнозування тексту | Передбачає кілька елементів одразу | Передбачає один елемент за раз |
Швидкість відповіді | Швидше за конкурента | Залежить від складності запиту |
Вартість використання (за 1 млн токенів) | ~$2 | $60 |
Прозорість | Відкритий вихідний код | Обмежений доступ до внутрішніх механізмів |
Мультимодальність | Підтримка тексту та зображень | Текст, голос, зображення |
Безпека даних | Децентралізована модель з упором на приватність | Централізована обробка з високим рівнем захисту |
Як видно, DeepSeek не поступається ChatGPT, однак ключова відмінність полягає у вартості використання, де DeepSeek R1 має суттєву перевагу.
У Business Insider також відзначили високу ефективність у плануванні маршрутів і складанні дієт, однак вказали на слабку роботу функції веб-пошуку при високих навантаженнях. The Atlantic назвав DeepSeek-R1 серйозним конкурентом OpenAI, підкреслюючи, що модель пропонує аналогічні можливості за значно меншу вартість. Особливо виділяється відкритий вихідний код, що приваблює розробників і дослідників.
На думку Діменка DeepSeek перевершує ChatGPT та інші LLM у трьох ключових аспектах:
- ефективність пам’яті та швидкості (MLA). Менше ресурсів — така сама точність;
- масштабованість (MoE). Менше обчислень на запит — більше користувачів одночасно;
- швидкість генерації (MTP). Прогнозує відразу кілька токенів, прискорюючи відповіді.
У підсумку користувачі відчувають це як «швидше, доступніше, стабільніше». Крім того, у R1 набагато менше штучних обмежень (alignment), через що вона краще відповідає на суперечливі питання і теми та, ймовірно, якісніше створює літературно складні тексти.
Однак, незважаючи на низьку вартість і відкриту архітектуру, у DeepSeek є слабкі місця:
- якість генерації тексту все ще поступається ChatGPT у складних діалогах і наукових темах. DeepSeek швидший, але іноді видає менш точні відповіді, особливо якщо запит вимагає детального аналізу;
- юрисдикція Китаю викликає питання про приватність даних і потенційну цензуру;
- ChatGPT, як і раніше, лідирує в мультимодальності — підтримка голосу, складнішої інтеграції з інструментами та API робить його більш універсальним.
Таким чином, DeepSeek дійсно виділяється низькою вартістю і вузькоспеціалізованою оптимізацією, але в універсальності, точності та масштабованості він поки поступається GPT-4o та іншим флагманським LLM.
Що про це думають експерти
Вихід DeepSeek R1 викликав бурхливу реакцію серед експертів і лідерів індустрії, які вже активно обговорюють цей технологічний прорив.
Так, Марк Андріссен, венчурний капіталіст і співзасновник Andreessen Horowitz, вважає DeepSeek R1 одним із найдивовижніших і найбільш вражаючих проривів.
Колишній CEO Intel Пет Гелсінгер зазначив, що успіх DeepSeek демонструє як дешеві технології розширюють ринок, а обмежені ресурси стимулюють інновації, змушуючи розробників шукати більш ефективні рішення. Він також вважає, що відкриті технології мають найбільший потенціал, оскільки впливають на розвиток всієї галузі.
CEO Scale AI Олександр Ванг упевнений, що такі розробки дають змогу Китаю ефективно конкурувати зі США в перегонах за ШІ-домінування. А Сатья Наделла, CEO Microsoft, зазначив, що DeepSeek R1 — це «важливе досягнення, яке вплине на всю технологічну індустрію».
Таким чином, провідні фігури IT-індустрії визнають значущість DeepSeek і зазначають, що його поява може змінити баланс сил у ШІ-галузі, проте деякі експерти вважають, що його вплив не настільки революційний, як може здатися на перший погляд. Так:
- журналісти Business Insider за результатами практичного тесту виокремили обмежені можливості порівняно з конкурентами, зокрема, відсутність підтримки мультимодальності;
- Wired вказують, що DeepSeek R1 не позбувся стандартних недоліків мовних моделей, таких як галюцинації (видача недостовірної інформації) і складнощі з модерацією контенту;
- у Financial Times зазначили, що хоча DeepSeek пропонує дешевший і ефективніший підхід до ШІ-розробки, незрозуміло, чи призведе це до кардинальних змін в індустрії та чи загрожує це монополії техгігантів на кшталт OpenAI і Google.
Таким чином, хоча DeepSeek R1 дійсно є значним досягненням, експерти вказують, що проєкт усуває тільки фінансовий бар’єр розвитку індустрії, але все ще схильний до інших обмежень, характерних для LLM. Тому поки рано говорити про «революцію» в галузі.
В Assister вважають, що DeepSeek дійсно змінила парадигму і стала конкурентом OpenAI. Низька вартість використання R1 стане ключовим фактором її популярності найближчим часом, доки ми не побачимо нового прориву або адаптації великих гравців до нових правил. Водночас Діменко каже, що зараз будь-яка флагманська LLM може перебувати на піку популярності тижні, максимум місяці.
Висновки
Запуск великої мовної моделі DeepSeek R1 струснув індустрію штучного інтелекту, викликавши серйозні зміни на ринку і зниження вартості акцій великих технологічних компаній.
Головною причиною цього стало різке зниження витрат на обчислювальні ресурси — DeepSeek вдалося в десятки разів скоротити витрати на навчання, при цьому не поступаючись ChatGPT за деякими параметрами.
Передбачити, як це вплине на всю ШІ-індустрію, складно, але вже зараз інвестори змушені переглядати свої ставки. Головна перевага DeepSeek — агресивна цінова політика — може привабити частину користувачів OpenAI, а також компанії, які раніше не могли дозволити собі АІ-інтеграцію через високу вартість.
Якоюсь мірою нова LLM може вплинути і на криптоіндустрію, якщо надасть новим проєктам на перетині ШІ та блокчейну конкурентну перевагу порівняно з тими, хто використовує дорожчі моделі OpenAI та інших розробників.
Найчастіші запитання