ডিপসেকের নতুন চ্যাটবট এআই শিল্পে গুরুত্বপূর্ণ প্রভাব ফেলেছে, যে কোনও প্রশ্নের জন্য অবাক করা উত্তরের প্রতিশ্রুতি দিয়ে নিজেকে পরিচয় করিয়ে দিয়েছে। বাজারে এই সাহসী এন্ট্রি এমনকি এনভিডিয়ার অন্যতম বৃহত্তম শেয়ারের দামের ড্রপগুলিতে অবদান রেখেছে, যা ডিপসিকের ক্রমবর্ধমান প্রভাবকে ইঙ্গিত করে।
চিত্র: ensigame.com
ডিপসিকের মডেলটিকে যা আলাদা করে তা হ'ল এর উদ্ভাবনী স্থাপত্য এবং প্রশিক্ষণের পদ্ধতি, যার মধ্যে রয়েছে:
মাল্টি-টোকেন পূর্বাভাস (এমটিপি): এই কৌশলটি মডেলটিকে একাধিক শব্দের পূর্বাভাস দেওয়ার অনুমতি দেয় যা বিভিন্ন বাক্য বিভাগ বিশ্লেষণ করে, যথার্থতা এবং দক্ষতা উভয়ই বাড়িয়ে তোলে।
বিশেষজ্ঞদের মিশ্রণ (এমওই): টোকেন প্রতি আটটি সক্রিয় করে 256 নিউরাল নেটওয়ার্কগুলি ব্যবহার করে, এই পদ্ধতির এআই প্রশিক্ষণকে গতি বাড়িয়ে তোলে এবং কর্মক্ষমতা বাড়ায়।
মাল্টি-হেডের সুপ্ত মনোযোগ (এমএলএ): এই প্রক্রিয়াটি সমালোচনামূলক বাক্য অংশগুলিতে ফোকাস করে, গুরুত্বপূর্ণ সূক্ষ্মতাগুলি মিস না করে তা নিশ্চিত করার জন্য বারবার মূল বিবরণগুলি বের করে।
বিশিষ্ট চীনা স্টার্টআপ ডিপসেক দাবি করেছেন যে তার প্রতিযোগিতামূলক এআই মডেল, ডিপসেক ভি 3, কেবলমাত্র 2048 গ্রাফিক্স প্রসেসর ব্যবহার করে ন্যূনতম ব্যয়ে 6 মিলিয়ন ডলার ব্যয় করেছে।
চিত্র: ensigame.com
যাইহোক, সেমিয়ানালাইসিসের গভীর চেহারাটি প্রকাশ করে যে ডিপসেক একটি বিশাল গণ্য অবকাঠামো পরিচালনা করে, প্রায় 50,000 এনভিডিয়া হপার জিপিইউ ব্যবহার করে, এইচ 800, এইচ 100, এবং এইচ 20 এর মতো বিভিন্ন মডেল সহ। এই সংস্থানগুলি একাধিক ডেটা সেন্টারে ছড়িয়ে রয়েছে, কেবল এআই প্রশিক্ষণের জন্যই নয় গবেষণা এবং আর্থিক মডেলিংয়ের জন্যও ব্যবহৃত হয়। সার্ভারগুলিতে সংস্থার মোট বিনিয়োগ প্রায় 1.6 বিলিয়ন ডলার, অপারেশনাল ব্যয় প্রায় 944 মিলিয়ন ডলার।
ডিপসেক চীনা হেজ ফান্ড হাই-ফ্লায়ারের একটি সহায়ক সংস্থা, ২০২৩ সালে পৃথক এআই-কেন্দ্রিক বিভাগ হিসাবে প্রতিষ্ঠিত। ক্লাউড কম্পিউটিংয়ের উপর নির্ভর করে এমন অনেক স্টার্টআপের বিপরীতে ডিপসেক তার ডেটা সেন্টারগুলির মালিক, এআই মডেল অপ্টিমাইজেশনের উপর সম্পূর্ণ নিয়ন্ত্রণ সরবরাহ করে এবং দ্রুত উদ্ভাবনকে সক্ষম করে। সংস্থাটি স্ব-অর্থায়িত থাকে, এর তত্পরতা এবং সিদ্ধান্ত গ্রহণের গতি বাড়িয়ে তোলে।
চিত্র: ensigame.com
অধিকন্তু, ডিপসেক শীর্ষস্থানীয় চীনা বিশ্ববিদ্যালয়গুলি থেকে শীর্ষ প্রতিভা আকর্ষণ করে, বার্ষিক $ 1.3 মিলিয়ন ছাড়িয়ে বেতন প্রদান করে, যদিও এটি বিদেশী বিশেষজ্ঞদের নিয়োগ দেয় না।
ডিপসিকের মাত্র million মিলিয়ন ডলারে ডিপসেক ভি 3 প্রশিক্ষণের দাবি সত্ত্বেও, এই চিত্রটি কেবল প্রাক-প্রশিক্ষণের সময় জিপিইউ ব্যবহারের জন্য অ্যাকাউন্ট করে এবং গবেষণা, মডেল পরিশোধন, ডেটা প্রসেসিং বা অবকাঠামোগত ব্যয় অন্তর্ভুক্ত করে না। শুরু হওয়ার পর থেকে, ডিপসেক এআই বিকাশে 500 মিলিয়ন ডলারেরও বেশি বিনিয়োগ করেছে, এর কমপ্যাক্ট কাঠামোটি দ্রুতগতিতে উদ্ভাবনগুলি বাস্তবায়নের জন্য উপার্জন করেছে।
চিত্র: ensigame.com
ডিপসেকের কেসটি চিত্রিত করে যে একটি সু-অর্থায়িত, স্বতন্ত্র এআই সংস্থা শিল্প নেতাদের চ্যালেঞ্জ জানাতে পারে। তবে বিশেষজ্ঞরা হাইলাইট করেছেন যে এআই উন্নয়নের জন্য "বিপ্লবী বাজেট" না করে কোম্পানির সাফল্য যথেষ্ট বিনিয়োগ, প্রযুক্তিগত অগ্রগতি এবং একটি শক্তিশালী দল থেকে উদ্ভূত হয়েছে। তবুও, ডিপসিকের ব্যয়গুলি তার প্রতিযোগীদের তুলনায় এখনও কম, R1 এর প্রশিক্ষণ সহ CATGPT4O এর 100 মিলিয়ন ডলার তুলনায় 5 মিলিয়ন ডলার ব্যয় করে।