Deepseek : 알려진 중국의 스타트 업은 AI에 대한 '스푸트니크 순간'을 일으켰습니까?

AI는 단지 “스푸트니크 순간”을 가지고 있었습니까?

그게 뭐야 일부 투자자들은 알려진 중국의 스타트 업 이후 Deepseek이 챗봇을 발표 한 후 전문가들은 돈과 컴퓨팅 능력이 적음에도 불구하고 Openai 및 Google과 같은 업계 리더들에 대한 자체적으로 자체적으로 보유하고 있다고 말합니다.

Deepseek 주변의 Buzz는 월요일에 기술 주식을 망치는 문제의 물결에 내장되었습니다. Chipmaker Nvidia의 시장 가치로부터 거의 600 억 달러를 지우 셨습니다.

반복적이거나 진화론이 아니라 길들임

베를린의 중국 중국 연구소 (Mercator Institute for China Studies)의 수석 분석가 인 안토니아 히 마이 디 (Antonia Hmaidi)는“이것은 미국이 거품 속에 얼마나 많이 살고 있는지 실제로 보여준 것”이라고 말했다.

“OpenAi와 OpenAi와 같은 회사는 실제로 일종의 무한한 스케일링에 베팅했으며 개선을위한 성능을 위해 점점 더 많은 칩을 구입해야했습니다.”

그녀는 Deepseek가 보여준 것은 다른 길이 있다는 것입니다.

이 회사는 봇을 훈련시키기 위해 2,000 개 이상의 NVIDIA H800 GPU를 사용했으며 560 만 달러에 몇 주 만에 그렇게했다고 밝혔다. 다른 사람들은 10,000 명 이상의 GPU를 배치했으며 1 억 달러 이상을 지출했다고합니다. 또는 그 이상 비슷한 결과를 얻으려면.

시드니 대학교 (University of Technology) 시드니의 학자 인 마리나 장 (Marina Zhang)은 Deepseek도 반복적이거나 진화론 적이 아니라 경로가 아닌 중국을위한 새로운 종류의 혁신을 보여 주었다고 말했다.

“그들은 실제로 기존 모델을 따르지 않는다”고 그녀는 말했다. “기본적으로 알고리즘 최적화를 기반으로하며 소프트웨어를 사용하여 계산 능력이 충분하지 않은 제약 조건을 해결합니다.”

미국 칩 수출 제어가 실패 했습니까?

이러한 제약은 미국에 의해 중국에 부과되었습니다. 2022 년에 Biden 행정부는 중국 군대를 향상시키는 데 사용될 수 있다고 주장하면서 최첨단 마이크로 칩의 수출을 금지했습니다.

Zhang은 Deepseek은 칩 봉쇄가 지금까지 성공하지 못한다고 밝혔다. 베이징은 몇 년 동안 기술의 자립 운전을 두 배로 늘리고 칩 개발 및 AI를 포함한 다른 부문에 돈을 쏟아 부었습니다.

다른 사람들은 칩 내보내기 제어가 실패했다고 말하기에는 너무 이르다.

워싱턴 전략 및 국제 연구 센터의 Wadhwani AI 센터 소장 인 Gregory Allen은 DeepSeek이 통제의 영향이 느껴지기 전에 모든 칩을 인수 할 수 있다고 말했다.

널리보고 된 2023 년 인터뷰에서 Deepseek 설립자 Liang Wenfeng 은이 회사가 미국 수출 통제 명단에 올린 다양성 인 약 10,000 개의 NVIDIA A100 GPU를 비축했다고 밝혔다. 전문가들은 이것이 DeepSeek 모델의 이전 버전에 배치되었을 수 있다고 생각합니다.

칩 봉쇄가 시작된 후 Nvidia는 해결 방법을 개발하여 중국에 한동안 판매하는 것이 합법적이었던 약간 덜 강력한 H800 GPU를 만들었습니다.

Allen은“우리는 현재 AI 수출 통제의 첫 번째 배치에서 Biden 행정부의 잘못된 영향의 시대에 살고있다”고 말했다.

Deepseek은 H800을 구입할 수있는 창을 가지고있었습니다. 행정부가 결국 중국으로의 판매를 금지하기 전에.

“DeepSeek은 일부 아키텍처 혁신, 일부 알고리즘 혁신을 발견하여 IQ 포인트의 수, 지능의 양을 증가시켜 주어진 AI 모델이 주어진 양의 계산 리소스에서 얻을 수 있습니다.”

그러나 AI 개발에는 컴퓨팅 전력이 필요하며 DeepSeek 또는 다른 중국 회사가 액세스 할 수있는 고급 GPU의 수는 수출 통제에 의해 제한된다고 그는 말했다. 그것은 결국 물을 것입니다.

Allen은 미국이 우위를 가졌다는 것을 의미한다고 말합니다. 제한없이 고급 칩에 액세스 할 수 있습니다.

“우리는 중국의 장점을 복사 할 수있다. 그들은 우리의 장점을 복사 할 수 없다.

Allen은 DeepSeek에 대한 과대 광고가 저렴한 값싼 가장자리 모델을 개발하는 것에 대한 과대 광고의 측면에서, 비용은 의심 할 여지없이보고 된 560 만 달러의 북쪽에 있다고 말했다. 그는 그것을 약물의 발달에 비유했다.

“새로운 약물을 개발하는 데 드는 비용은 효과가있는 임상 시험의 비용이 아니라”라고 그는 말했다. “이것은 효과가없는 모든 임상 시험의 비용입니다. 그리고이 AI 모델 교육 실행과 동일합니다. DeepSeek은 최종 성공적인 교육 운영에 비용이 얼마나 드는지를 발표했습니다.”

그는 회사가 그 시점에 도착하기 위해 얼마나 많은 지출을했는지는 알려져 있지 않다고 말했다.

Hmaidi는 Deepseek은 “중국 공학의 매우 합법적 인 승리”라고 말합니다. 그러나 그녀는 아직 많은 사람들이 그것을 만들고있는 위협이 아니라고 말합니다.

“나는 현재 더 많은 컴퓨팅없이 현재 파이프 라인으로 훨씬 더 나은 모델을 얻는 방법을 모르고있다”고 그녀는 말했다.

“개인적으로, 나는 그것이이 시점에서 미국의 AI 능력에 대한 위협이라고 생각하지 않습니다.”