DeepSeek
DeepSeek | |
---|---|
кіт.: 杭州深度求索人工智能基础技术研究有限公司 англ.: Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. | |
![]() | |
Тып | Стартап і тэхналагічная кампанія[d] |
Заснаванне | май 2023[1] |
Заснавальнікі | Liáng Wénfēng[d] |
Краіна | |
Адрас | |
Галіна | інфармацыйныя тэхналогіі і ШІ |
Матчына кампанія | High-Flyer[d] |
Сайт | deepseek.com (кіт.) (англ.) |
DeepSeek (кіт. спр. 深度求索, піньінь Shēndù Qiúsuǒ) — кітайская кампанія, якая спецыялізуецца на распрацоўцы штучнага інтэлекту, а таксама сямейства вялікіх моўных мадэляў. Кампанія базуецца ў Ханчжоу, заснавана і падтрымліваецца кітайскім хедж-фондам High-Flyer. DeepSeek выпусціла свае мадэлі з адкрытым зыходным кодам. Версія DeepSeek-V3 лічыцца параўнальнай з іншымі моўнымі мадэлямі ў 2024 годзе, такімі як Qwen і ChatGPT.
Выхад мадэлі DeepSeek-R1 у студзені 2025 года выклікаў кароткачасовае, але рэзкае зніжэнне курсаў акцый сусветных тэхналагічных кампаній і дыскусіі пра пераацэнку інвестыцый у ШІ.
Гісторыя
[правіць | правіць зыходнік]У 2015 годзе тры інжынера з Чжэцзянскага ўніверсітэта заснавалі кампанію High-Flyer. Яна выкарыстала машыннае навучанне для гандлю акцыямі. У 2019 годзе створана кампанія High-Flyer AI, якая займалася даследаваннямі алгарытмаў штучнага інтэлекту[2]. Да 2021 года ўсе стратэгіі High-Flyer выкарыстоўвалі ШІ, яе параўноўвалі з Renaissance Technologies.
У красавіку 2023 года High-Flyer абвясціла пра новы праекце для даследавання агульнага штучнага інтэлекту. Ён не будзе выкарыстоўвацца для гандлю акцыямі і аддзеліцца ад фінансавага бізнесу High-Flyer[3][4]. У маі 2023 года кампанія была запушчана пад назвай DeepSeek, яе ўзначаліў адзін з сузаснавальнікаў хедж-фонду High-Flyer Лян Вэньфэн[2][4]. Распрацоўка DeepSeek фінансуецца High-Flyer[4].
Выпуск DeepSeek-V2 у маі 2024 года справакаваў цэнавую вайну мадэляў штучнага інтэлекту ў Кітаі, бо прапаноўвалася высокая прадукцыйнасць па нізкай цане. Яе ахрысцілі «Pinduoduo ШІ», а іншым буйным тэхналагічным гігантам, такім як ByteDance, Tencent, Baidu і Alibaba, прыйшлося пачаць зніжаць цэны на свае мадэлі ШІ. Нягледзячы на нізкую цану DeepSeek, кампанія дала справаздачу пра прыбытак у параўнанні з канкурэнтамі, якія, па-відаць, неслі страты[5].
На канец 2024 года DeepSeek займаецца даследаваннямі і не заяўляе падрабязных планаў камерцыялізацыі[5].
Кітайская газета South China Morning Post піша, што пры найманні новых супрацоўнікаў кампанія DeepSeek аддавала перавагу здольнасцям, а не вопыту, таму большасць распрацоўшчыкаў — гэта альбо нядаўнія выпускнікі, альбо распрацоўшчыкі на ранняй стадыі сваёй кар’еры ў сферы ШІ[4].
Да 2025 года DeepSeek змагла стварыць ШІ з магчымасцямі як у вядучых тэхналагічных кампаній ЗША, але, як заяўлена, на менш магутных чыпах і за малую частку кошту. Супрацоўнікі DeepSeek пішуць, што навучалі мадэль V3 на чыпах Nvidia H800, а яны значна менш магутныя, чым новыя Nvidia Blackwell[6][7]. Незалежныя назіральнікі адзначаюць, што DeepSeek і іншыя кітайскія кампаніі маюць перавагу, бо на кітайскім рынку доступ да ChatGPT і шэрагу іншых мадэляў заблакаваны Вялікім кітайскім фаерволам. DeepSeek, верагодна, цэнзуруе выдачу. Пры гэтым не ўсе далікатныя для Кітая тэмы гэтаму схільныя[8][9].
Рэакцыя рынкаў 27 студзеня 2025
[правіць | правіць зыходнік]Запуск новай мадэлі R1, як мяркуецца распрацаванай нашмат танней кошту канкурэнтаў, справакаваў рэзкае зніжэнне курсаў акцый сусветных тэхналагічных кампаній. Так, 27 студзеня 2025 года акцыі вытворцы абсталявання для вырабу чыпаў ASML Holding NV упалі больш чым на 8 %. Nasdaq 100 знізіўся на 3 %, страціўшы амаль 1 трыльён долараў. У Токіа акцыі ўпалі на 8,5 %. Акцыі Siemens Energy, вытворцы энергетычнага абсталявання для ШІ-інфраструктуры, — на 20 %[10]. Упалі курсы акцый энергетычных кампаній, уключаючы на 21 % у Constellation Energy, бо ў іх раней чакаўся прыбытак ад рэзкага росту попыту з-за ШІ[11][12].
Па словах Вей-Сарна Лінга (Union Bancaire Privée), «DeepSeek паказвае, што можна распрацоўваць магутныя мадэлі ШІ, якія каштуюць танней»[11]. Акцыі карпарацыі Nvidia ўпалі за дзень на 17 %, што прывяло да страты каля $600 млрд капіталізацыі. Такое падзенне стала найбуйнейшым за гісторыю амерыканскага фондавага рынку[13][14]. Многія эксперты прагназуюць скарачэнне закупак чыпаў Nvidia і рост недаверу інвестараў да вядучых тэхналагічных кампаній. Хоць некаторыя спадзяюцца, што даступнасць ШІ вырасце і пашырыцца іх выкарыстанне, што падтрымае попыт на чыпы[15][16]. 500 самых багатых людзей свету страцілі ў агульнай складанасці $108 млрд з-за распродажаў у тэхналагічным сектары[17].
Агульная капіталізацыя крыптавалют, звязаных з ШІ, скарацілася на 22 % за суткі[18].
Пры гэтым па стане на 27 студзеня мабільнае прыкладанне «DeepSeek — AI Assistant» займала першае месца ў App Store у ЗША, ААЭ, Паўднёвай Карэі, Японіі, Вялікабрытаніі і Кітаі, пацясніўшы ChatGPT[11][19].
Прэзідэнт ЗША Дональд Трамп назваў DeepSeek «трывожным званком» для амерыканскіх технакампаній[20].
Далейшыя наступствы
[правіць | правіць зыходнік]Узрушэнні на сусветных рынках праз DeepSeek цягнуліся кароткі час[21]. Пры гэтым аналітыкі Huaxi Securities палічылі тое, што адбылося пераломным момантам, калі ў кітайскіх інвестараў вырасла цікавасць да мясцовых кампаній, якія працуюць з ШІ[22]. 12 лютага 2025 года Financial Times паведаміла, што на фоне поспеху DeepSeek ў Ганконгу індэкс кітайскіх тэхналагічных акцый вырас больш чым на 20 % за месяц[23].
Таоша Ван (Fidelity International) у лютым 2025 года піша, што кошт распрацоўкі вядучых мадэляў ШІ ўжо ўпаў прыкладна на 80 % за апошнія два гады, а DeepSeek, магчыма, паскорыць гэтую тэндэнцыю. На яе думку, «DeepSeek з’яўляецца напамінам, як хутка ўсё можа змяніцца і, хутчэй за ўсё, зменіцца ў эпоху ШІ»[21].
Рэлізы
[правіць | правіць зыходнік]2 лістапада 2023 года DeepSeek прэзентавала сваю першую мадэль Deepseek Coder, якая была бясплатнай, у тым ліку для камерцыйнага выкарыстання[24]. Кампанія DeepSeek робіць мадэлі з так званым «адкрытай вагой» (open-weight), якія трохі адрозніваюцца ад цалкам адкрытага зыходнага кода: мадэль можа свабодна выкарыстоўвацца паўторна па ліцэнзіі MIT, можна вывучаць і развіваць алгарытм, але дадзеныя для навучання не пададзены[25][26].
29 лістапада 2023 года DeepSeek запусціла DeepSeek LLM (вялікую моўную мадэль) з 67 млрд параметраў. Яна была распрацавана, каб канкурыраваць з іншымі LLM таго часу, і па прадукцыйнасці набліжалася да GPT-4. У яе паўсталі праблемы з вылічальнай эфектыўнасцю і маштабаванасцю[24]. Таксама была выпушчаная чат-версія мадэлі пад назвай DeepSeek Chat[27].
V2 і V3
[правіць | правіць зыходнік]У маі 2024 года выйшла DeepSeek-V2. Financial Times паведаміла, што яна была танней аналагаў, каштавала 2 юаня за кожны мільён выпушчаных токенаў. У рэйтынгу LLM лабараторыі Tiger Lab універсітэта Уотэрлоа DeepSeek-V2 заняла сёмае месца.
У снежні 2024 года запушчана DeepSeek-V3. Тэсты прадукцыйнасці паказалі, што версія пераўзышла Llama 3.1 і Qwen 2.5, а таксама адпавядала GPT-4o і Claude 3.5 Sonnet[4][28][29][30]. На студзень 2025 года незалежныя праверкі працягваюцца[8]. Выпадак DeepSeek паказаў, што санкцыі ЗША ў дачыненні да развіцця штучнага інтэлекту ў Кітаі, верагодна, не вельмі эфектыўныя[31][4]. Амерыканскі аналітык Рэй Ванг выказаў здагадку, што праз адсутнасць у Кітая вольнага доступу да перадавых чыпаў ШІ, кітайскія навукоўцы ўкараняюць інавацыі пры абмежаваных рэсурсах[8]. Паводле звестак вытворцы, агульны кошт навучання мадэлі блізу 5,58 млн долараў ЗША, а само навучанне заняло блізу двух месяцаў[4].
DeepSeek-V3 мае 685 мільярдаў параметраў і мульціэкспертную архітэктуру (MoE) з 256 экспертамі, з якіх 8 актывуюцца для кожнага токена. Кожны токен актывуе 37 мільярдаў параметраў.
Этап | Выдаткі (тыс. GPU-гадзін) | Кошт (млн $) |
---|---|---|
папярэдняя падрыхтоўка | 2664 | 5,328 |
пашырэнне кантэксту | 119 | 0,24 |
тонкая налада | 5 | 0,01 |
агульны | 2788 | 5,576 |
R1
[правіць | правіць зыходнік]У лістападзе 2024 года з’явілася DeepSeek-R1-Lite-Preview для вырашэння задач, якія патрабуюць лагічнага вываду, матэматычных разваг і вырашэння праблем у рэальным часе. DeepSeek сцвярджаў, што прадукцыйнасць пераўзышла OpenAI o1 у такіх тэстах, як AIME і MATH[32]. Аднак The Wall Street Journal адзначыла, што пры выкарыстанні 15 задач з тэстаў AIME 2024 года OpenAI o1 знайшоў рашэнні хутчэй, чым DeepSeek R1-Lite-Preview[33].
У студзені 2025 года выйшлі DeepSeek-R1 і DeepSeek-R1-Zero, заснаваныя на V3. Гэтыя мадэлі больш прасунутыя, чым раннія. Яны генеруюць адказы крок за крокам, аналагічна развазе чалавека. Па першых тэстах, пры выкананні пэўных задач па матэматыцы, хіміі і праграмаванні прадукцыйнасць R1 знаходзіцца на адным узроўні з o1[25][34][35].
Крытыка і цэнзура
[правіць | правіць зыходнік]

Назіраецца, што афіцыйная API-версія мадэлі R1 выкарыстоўвае механізмы цэнзуры для адчувальных тэм, асабліва тых, якія лічацца палітычна значнымі ў Кітаі. Напрыклад, мадэль адмаўляецца адказваць на пытанні пра падзеі на плошчы Цяньаньмэнь у 1989 годзе. Часам ШІ першапачаткова генеруе адказ, але неўзабаве выдаляе яго і замяняе паведамленнем: «Прабачце, гэта выходзіць за рамкі маіх магчымасцяў. Давайце пагаворым пра што-небудзь іншае»[36].
Інтэграваныя механізмы цэнзуры і абмежаванні можна часткова абыйсці толькі ў адкрытай версіі мадэлі R1. Як толькі закранаюцца «асноўныя сацыялістычныя каштоўнасці», вызначаныя кітайскімі інтэрнэт-рэгулятарамі, або падымаюцца пытанні, звязаныя з Тайваням, дыскусіі спыняюцца.
Журналіст Энтані Кімеры піша, што сістэма штучнага інтэлекту патэнцыйна можа быць выкарыстана для ўплыву за мяжой: дэзынфармацыі, назірання і распрацоўкі кіберзброі для кітайскіх спецслужб. Або што прыкладанне можа перадаваць персанальныя даныя карыстальнікаў у Кітай[37].
Газета The Indian Express адзначае, што распаўсюджаныя асцярогі з нагоды часу запуску DeepSeek-R1 як сігналу Кітая пра узровень развіцця яго ШІ. R1 з’явілася менавіта ў той момант, калі Дональд Трамп стаў прэзідэнтам ЗША[6].
Аналітыкі брокерскай кампаніі Bernstein мяркуюць, што агульныя выдаткі на навучанне V3 нашмат вышэй, чым заяўленыя $5,58 млн, і не лічаць мадэлі DeepSeek цудам. Таксама яны звяртаюць увагу на тое, што DeepSeek не раскрыла выдаткі на навучанне R1. Генеральны дырэктар кампаніі Scale AI Аляксандр Ван сказаў у інтэрв’ю, што нібыта DeepSeek мае 50 000 чыпаў Nvidia H100, але не прывёў доказаў[38][39]. OpenAI і Дэвід Сакс, спецпрадстаўнік прэзідэнта ЗША па штучным інтэлекце, западозрылі, што DeepSeek выкарыстала мадэлі канкурэнта для навучання[40].
Крыніцы
[правіць | правіць зыходнік]- ↑ All About DeepSeek - The Chinese AI Startup Challenging The US Big Tech // Forbes / S. Forbes — NYC: Forbes, 2025. — ISSN 0015-6914; 2609-1445 Праверана 27 студзеня 2025.
- ↑ а б Ottinger. Deepseek: From Hedge Fund to Frontier Model Maker (англ.). ChinaTalk (9 снежня 2024). Архівавана з першакрыніцы 28 December 2024. Праверана 28 December 2024.
- ↑ Yu. [Exclusive Chinese Quant Hedge Fund High-Flyer Won't Use AGI to Trade Stocks, MD Says] (англ.). Yicai Global (17 красавіка 2023). Архівавана з першакрыніцы 31 December 2023. Праверана 28 December 2024.
- ↑ а б в г д е ё Jiang. Meet DeepSeek: the Chinese start-up that is changing how AI models are trained (англ.). South China Morning Post (1 студзеня 2025).
- ↑ а б Schneider. Deepseek: The Quiet Giant Leading China's AI Race (англ.). ChinaTalk (27 лістапада 2024). Праверана 28 December 2024.
- ↑ а б Liang Wenfeng: The force behind Chinese AI startup DeepSeek that has made US tech giants nervous and put India on edge (англ.). The Indian Express (28 студзеня 2025).
- ↑ DeepSeek hit by cyberattack as users flock to Chinese AI startup (англ.). Reuters (27 студзеня 2025).
- ↑ а б в Dennis Normile. Chinese firm’s faster, cheaper AI language model makes a splash (англ.). Science (15 студзеня 2025). doi:10.1126/science.z18lyzw.
- ↑ DeepSeek: новая языковая модель балансирует между прогрессом и цензурой (руск.). SecurityLab.ru (28 снежня 2024).
- ↑ Запуск ИИ-чат-бота DeepSeek привел к панике на биржах в ЕС (руск.). Deutsche Welle (28 студзеня 2025). Праверана 29 студзеня 2025.
- ↑ а б в AI-Fueled Stock Rally Dealt $1 Trillion Blow by Chinese Upstart (англ.). www.bloomberg.com (27 студзеня 2025).
- ↑ China's DeepSeek sets off AI market rout (англ.). Reuters (27 студзеня 2025).
- ↑ Акции Nvidia теряют в цене более 11% из-за китайской DeepSeek (руск.). Ведомости (27 студзеня 2025). Праверана 27 студзеня 2025.
- ↑ Китай наносит сокрушительный удар в самое сердце корпоративной Америки . ProFinance.Ru (27 студзеня 2025). Праверана 27 студзеня 2025.
- ↑ «Рынки ошибаются»: DeepSeek не угрожает NVIDIA и другим американским IT-гигантам (руск.). ServerNews (28 студзеня 2025).
- ↑ Kahn, Jeremy. Why DeepSeek's R1 may not be the bad news for Nvidia and U.S. export controls that many assume (англ.). Fortune (28 студзеня 2025).
- ↑ World’s Richest People Lose $108 Billion After DeepSeek Selloff . www.bloomberg.com (28 студзеня 2025).
- ↑ ИИ-криптовалюты резко подешевели. При чем здесь китайская нейросеть (руск.). РБК Крипто (27 студзеня 2025). Праверана 27 студзеня 2025.
- ↑ Чат-бот DeepSeek обогнал ChatGPT и возглавил рейтинг приложений в ряде стран (руск.). Российская газета (27 студзеня 2025).
- ↑ MarketScreener. Trump: DeepSeek's AI should be a wakeup call to US industry - 2025-01-27 | MarketScreener (англ.) . www.marketscreener.com (28 студзеня 2025). Праверана 28 студзеня 2025.
- ↑ а б Taosha Wang. Four ways DeepSeek could change everything (англ.). Reuters (12 лютага 2025).
- ↑ DeepSeek fever fuels patriotic bets on Chinese AI stocks (англ.). Reuters (6 лютага 2025).
- ↑ Технологические акции Китая перешли в фазу бычьего рынка после успеха DeepSeek (руск.). Forbes.ru (12 лютага 2025).
- ↑ а б Se. Inside DeepSeek Models (англ.). Turing Post (28 жніўня 2024). Архівавана з першакрыніцы 18 September 2024. Праверана 28 December 2024.
- ↑ а б {{{загаловак}}}(англ.). — 2025-01-23. — ISSN 1476-4687. — DOI:10.1038/d41586-025-00229-6
- ↑ {{{загаловак}}}(англ.). — 2023-10-23.
- ↑ Sharma. Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model (англ.) . VentureBeat (1 снежня 2023). Архівавана з першакрыніцы 23 December 2024. Праверана 28 December 2024.
- ↑ Jiang. Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products (англ.). South China Morning Post (27 снежня 2024). Архівавана з першакрыніцы 27 December 2024. Праверана 28 December 2024.
- ↑ Sharma. DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch (англ.) . VentureBeat (26 снежня 2024). Архівавана з першакрыніцы 27 December 2024. Праверана 28 December 2024.
- ↑ Wiggers. DeepSeek's new AI model appears to be one of the best 'open' challengers yet . TechCrunch (26 снежня 2024).
- ↑ Shilov. Chinese AI company's AI model breakthrough highlights limits of US sanctions (англ.). Tom's Hardware (27 снежня 2024). Архівавана з першакрыніцы 28 December 2024. Праверана 28 December 2024.
- ↑ Franzen. DeepSeek's first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance (англ.) . VentureBeat (20 лістапада 2024). Архівавана з першакрыніцы 22 November 2024. Праверана 28 December 2024.
- ↑ Huang. Don't Look Now, but China's AI Is Catching Up Fast (англ.) . The Wall Street Journal (24 снежня 2024). Архівавана з першакрыніцы 27 December 2024. Праверана 28 December 2024.
- ↑ Chowdhury, Hasan. KI aus China: Überholt dieses Startup jetzt OpenAI? (ням.). Business Insider (25 студзеня 2025).
- ↑ Sharma, Shubham. Open-source DeepSeek-R1 uses pure reinforcement learning to match OpenAI o1 — at 95% less cost (англ.) . VentureBeat (20 студзеня 2025).
- ↑ Steinschaden, Jakob. DeepSeek: This is what live censorship looks like in the Chinese AI chatbot (англ.). Trending Topics (27 студзеня 2025). Праверана 27 студзеня 2025.
- ↑ China’s DeepSeek AI poses formidable cyber, data privacy threats (англ.) . Biometric Update (26 студзеня 2025). Праверана 27 студзеня 2025.
- ↑ What is DeepSeek and why is it disrupting the AI sector? (англ.). Reuters (28 студзеня 2025). Праверана 29 студзеня 2025.
- ↑ Singh, Manish. DeepSeek 'punctures' AI leaders' spending plans, and what analysts are saying (англ.) . TechCrunch (27 студзеня 2025). Праверана 29 студзеня 2025.
- ↑ DeepSeek заподозрили в использовании разработок OpenAI для обучения ИИ (руск.). Интерфакс (29 студзеня 2025).
Спасылкі
[правіць | правіць зыходнік]- deepseek.com — афіцыйны сайт (англ.) (кіт.)
- chat.deepseek.com — чат-бот от DeepSeek
- Nvidia потеряла более $600 млрд капитализации на фоне успеха китайского DeepSeek
- DeepSeek R1: модель с производительностью o1 от OpenAI
- Anthology of DeepSeek papers (англ.)
- Рассуждающие модели первого поколения DeepSeek-R1-Zero и DeepSeek-R1 (англ.)