Der neue Chatbot von Deepseek hat in der KI -Branche einen erheblichen Einfluss erzielt und sich mit dem Versprechen überraschende Antworten auf jede Frage vorgestellt. Dieser mutige Einstieg in den Markt hat sogar zu einem der größten Aktienkurs von NVIDIA beigetragen, was den wachsenden Einfluss von Deepseek signalisiert.
Bild: Ensigame.com
Was das Modell von Deepseek unterscheidet, sind seine innovativen Architektur- und Trainingsmethoden, einschließlich:
Multi-Token Prediction (MTP): Mit dieser Technik kann das Modell mehrere Wörter gleichzeitig vorhergesagt, indem verschiedene Satzsegmente analysiert werden und sowohl die Genauigkeit als auch die Effizienz verbessern.
Mischung von Experten (MOE): Die Verwendung von 256 neuronalen Netzwerken, mit acht aktivierten pro Token, beschleunigt dieser Ansatz die KI -Schulung und steigert die Leistung.
Multi-Head Latent Achtung (MLA): Dieser Mechanismus konzentriert sich auf kritische Satzteile und extrahiert wiederholt wichtige Details, um sicherzustellen, dass wichtige Nuancen nicht übersehen werden.
Deepseek, ein prominentes chinesisches Startup, behauptet, sein wettbewerbsfähiges KI -Modell Deepseek V3 mit nur 2048 Grafikprozessoren zu minimalen Kosten von 6 Millionen US -Dollar entwickelt zu haben.
Bild: Ensigame.com
Ein tieferer Blick von semianalysis zeigt jedoch, dass Deepseek eine riesige Computerinfrastruktur betreibt und rund 50.000 Nvidia Hopper -GPUs verwendet, einschließlich verschiedener Modelle wie H800, H100 und H20. Diese Ressourcen werden in mehreren Rechenzentren verteilt und werden nicht nur für KI -Schulungen, sondern auch für Forschungs- und Finanzmodellierung verwendet. Die Gesamtinvestition des Unternehmens in Server liegt bei rund 1,6 Milliarden US -Dollar mit den operativen Kosten von rund 944 Millionen US -Dollar.
Deepseek ist eine Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer, das 2023 als separate KI-fokussierte Abteilung gegründet wurde. Im Gegensatz zu vielen Startups, die sich auf Cloud Computing verlassen, besitzt Deepseek seine Rechenzentren, die die vollständige Kontrolle über AI-Modelloptimierung und Ermöglichung einer schnellen Innovation. Das Unternehmen bleibt selbst finanziert und verbessert seine Beweglichkeit und Entscheidungsgeschwindigkeit.
Bild: Ensigame.com
Darüber hinaus zieht Deepseek Top -Talente von führenden chinesischen Universitäten an und bietet Gehälter von mehr als 1,3 Millionen US -Dollar pro Jahr, obwohl es keine ausländischen Spezialisten einstellt.
Trotz Deepseeks Behauptung, Deepseek V3 für nur 6 Millionen US-Dollar auszubilden, enthält diese Zahl nur die GPU-Verwendung während der Vorausbildung und umfasst keine Forschung, Modellverfeinerung, Datenverarbeitung oder Infrastrukturkosten. Seit seinem Start hat Deepseek über 500 Millionen US -Dollar in die KI -Entwicklung investiert und seine kompakte Struktur nutzt, um schnell Innovationen umzusetzen.
Bild: Ensigame.com
Der Fall von Deepseek zeigt, dass ein gut finanziertes, unabhängiges KI-Unternehmen Branchenführer herausfordern kann. Experten zeigen jedoch, dass der Erfolg des Unternehmens auf erheblichen Investitionen, technischen Durchbrüchen und einem starken Team und nicht auf ein "revolutionäres Budget" für die KI -Entwicklung beruht. Die Kosten von Deepseek sind jedoch immer noch niedriger als die seiner Konkurrenten, wobei die Ausbildung von R1 5 Millionen US -Dollar im Vergleich zu 100 Millionen US -Dollar von ChatGPT kostet.