Google: Νέο μοντέλο του Gemini καταπίνει κείμενα και βίντεο για να βρει απαντήσεις
08 Απριλίου 2024
O χρήστης μπορεί να εισαγάγει 30.000 γραμμές κειμένου, 11 ώρες ήχου ή μια ώρα βίντεο.
Πόση ώρα θα χρειαζόσασταν για να διαβάσετε το Πόλεμος και Ειρήνη, το μνημειώδες έργου του Λέοντος Τολστόι που ξεπερνά τις 1.000 σελίδες;
Το νέο μοντέλο τεχνητής νοημοσύνης (ΑΙ) της Google χρειάζεται περίπου ένα λεπτό.
Η εταιρεία παρουσίασες την Πέμπτη το Gemini 1.5, μια αναβάθμιση των μοντέλων ΑΙ που είχε ανακοινώσει πριν από δύο μήνες.
Με μια απλή ερώτηση, ο χρήστης μπορεί να ζητήσει από το εργαλείο να αναλύσει πολύ περισσότερα δεδομένα από ό,τι πριν: 30.000 γραμμές κώδικα, 11 ώρες ήχου ή μια ώρα βίντεο.
Τα νούμερα αυτά αφορούν το Pro, το μεσαίο μοντέλο του Gemini 1.5, το οποίο μπορεί πλέον να καταπίνει ένα εκατομμύριο πακέτα δεδομένων, γνωστά ως token.
Αυτό σημαίνει ότι ξεπερνά κατά 5 φορές τις επιδόσεις του Claude 2.1, το μοντέλο της αμερικανικής Anthropic που θεωρείται ο πλησιέστερος ανταγωνιστής, λέει η Google.
Νέος τρόπος αναζήτησης
Οι επενδύσεις της Google στην ΑΙ αναδεικνύουν την κούρσα που έχει ξεκινήσει στη Σίλικον Βάλεϊ για την εμπορική αξιοποίηση της ΑΙ, μετά τη θεαματική επιτυχία της OpenAI με τη μηχανή διαλόγου ChatGPT.
Σε συνέντευξή του στο Reuters, ο Σούνταρ Πίτσαϊ, διευθύνων σύμβουλος του ομίλου Alphabet όπου ανήκει η Google, δήλωσε ότι η νέα τεχνολογία προσφέρει έναν νέο τρόπο με τον οποίο μπορεί κανείς να αναζητά πληροφορίες στο Διαδίκτυο.
Ένα παράδειγμα που συζητήθηκε εσωτερικά στη Google είναι η περίπτωση ενός σκηνοθέτης που ζητά από την τεχνητή νοημοσύνη να αξιολογήσει την ταινία του σαν επαγγελματίας κριτικός.
«Αυτό είναι μόνο μια περίπτωση για την οποία συζητήσαμε ως ομάδας, όμως το όριό μας είναι ο ουρανός» είπε ο Πίτσαϊ.
ΔΕΙΤΕ ΕΔΩ ΟΛΑ ΤΑ ΣΕΜΙΝΑΡΙΑ ΓΙΑ ΤΗ ΤΕΧΝΟΛΟΓΙΑ, ΚΑΙΝΟΤΟΜΙΑ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗ
Σε ένα άλλο παράδειγμα που έδωσε, ο χρήστης μπορεί να πραγματοποιήσει σύνθετες αναζητήσεις που αφορούν τα οικονομικά αποτελέσματα πολλών εταιρειών ταυτόχρονα.
Σε βίντεο που παρουσίασε η Google, το Gemini χρειάζεται 59 δευτερόλεπτα για να αναλύσει ένα βίντεο διάρκειας 44 λεπτών και να εξαγάγει πληροφορίες. Σε άλλα βίντεο, η AI καλείται να αναζητήσει απαντήσεις σε κείμενα και εικόνες ταυτόχρονα.
Εκτός από τους απλούς χρήστες, το νέο μοντέλο απευθύνεται και σε εταιρικούς πελάτες στο cloud.
Από την Πέμπτη, το Gemini Pro θα είναι διαθέσιμο σε μικρό αριθμό εταιρειών, ενώ οι εταιρείες που αναπτύσσουν λογισμικό βασισμένο στο μοντέλο 1.0 θα μπορούν να το αντικαταστήσουν με τη νεότερη γενιά όταν γίνει διαθέσιμη.
Ο Πιτσάι δήλωσε επίσης ότι το αυξημένο κόστος που προκύπτει από τις υψηλές υπολογιστικές απαιτήσεις της ΑΙ δεν ανησυχεί την εταιρεία.
«Είναι επικερδείς δραστηριότητες για εμάς» είπε. «Με τον καιρό, εξάλλου, γινόμαστε όλο και πιο αποδοτική στην εκτέλεση αυτών των μοντέλων».