Η
DeepSeek παρουσίασε δοκιμαστικές εκδόσεις ενός νέου κορυφαίου μοντέλου
τεχνητής νοημοσύνης, έναν χρόνο μετά την αναστάτωση που προκάλεσε στη Silicon Valley, χαρακτηρίζοντάς το ως την ισχυρότερη open-source πλατφόρμα απέναντι σε ανταγωνιστές όπως η OpenAI και η Anthropic.
Η κινεζική startup αποκάλυψε τις σειρές V4 Flash και V4 Pro, υποστηρίζοντας ότι προσφέρουν
κορυφαίες επιδόσεις σε benchmarks προγραμματισμού, αλλά και σημαντικές βελτιώσεις στις δυνατότητες συλλογισμού και στις agentic λειτουργίες. Όπως ανέφερε η εταιρεία μέσω της πλατφόρμας Hugging Face, τα νέα μοντέλα συνοδεύονται από αναβαθμίσεις στην αρχιτεκτονική και βελτιώσεις βελτιστοποίησης.
Η DeepSeek ξεχώρισε ιδιαίτερα μια τεχνική που ονομάζει «Hybrid Attention Architecture», η οποία —όπως υποστηρίζει— βελτιώνει την ικανότητα ενός AI συστήματος να θυμάται ερωτήματα κατά τη διάρκεια μεγάλων συνομιλιών. Παράλληλα, αύξησε το context window στο 1 εκατ. tokens, εξέλιξη που επιτρέπει την αποστολή ολόκληρων codebases ή πολύ μεγάλων εγγράφων σε ένα μόνο prompt.
Όπως μεταδίδει το Bloomberg, η παρουσίαση του V4 έρχεται περισσότερο από έναν χρόνο μετά την κυκλοφορία του μοντέλου R1 από τη startup με έδρα το Χανγκζού, το οποίο
είχε προκαλέσει sell-off ύψους τρισεκατομμυρίων δολαρίων στις αγορές τεχνολογίας. Το R1 ήταν ένα open-source μοντέλο που μιμείται τη διαδικασία ανθρώπινου συλλογισμού και είχε επιδόσεις αντίστοιχες προηγμένων συστημάτων AI εταιρειών όπως η OpenAI, παρότι —σύμφωνα με την DeepSeek— αναπτύχθηκε με ένα
κλάσμα του κόστους.
Διαβάστε αναλυτικά στο newmoney.gr