Aspetti principali
Secondo i test effettuati da Alibaba, QwQ-32B-Preview supera i modelli di OpenAI o1 nei test AIME e MATH. AIME utilizza altri modelli di intelligenza artificiale per valutare le prestazioni di un modello, mentre MATH è una raccolta di problemi di matematica basati su testo.
QwQ-32B-Preview è in grado di risolvere puzzle logici e rispondere a quesiti matematici complessi, grazie alle sue capacità di “ragionamento”.
Punti critici
Come si legge sulla piattaforma di sviluppo Hugging Face, QwQ-32B-Preview non è privo di difetti. Il modello potrebbe cambiare lingua inaspettatamente compromettendo la chiarezza delle risposte; Inoltre, potrebbe entrare in schemi di ragionamento circolari, generando risposte prolisse senza arrivare a una conclusione definitiva. Per quanto riguarda la sicurezza, sono necessarie misure più avanzate per garantire un utilizzo affidabile e sicuro; gli utenti dovrebbero adottare cautela durante il suo impiego. Infine, sebbene il modello brilli in ambiti come matematica e programmazione, necessita di miglioramenti in altre aree, come il ragionamento basato sul senso comune e la comprensione di sfumature linguistiche.
I limiti “politici”
QwQ-32B-Preview, a differenza della maggior parte delle intelligenze artificiali, è progettato per integrare una sorta di “verifica interna” dei fatti. Questa caratteristica gli permette di evitare molti errori tipici dei modelli tradizionali, sebbene ciò comporti tempi di elaborazione più lunghi per giungere a una soluzione. Come il modello o1, QwQ-32B-Preview affronta i compiti attraverso un ragionamento progressivo: pianifica le sue azioni e le esegue in sequenza per arrivare a una risposta accurata.
Scaricabile e utilizzabile sulla piattaforma di sviluppo AI Hugging Face, QwQ-32B-Preview condivide alcune somiglianze con il modello di ragionamento DeepSeek, soprattutto per il modo in cui evita con attenzione temi politici sensibili. Poiché sviluppati da aziende cinesi come Alibaba e DeepSeek, questi modelli sono sottoposti ai controlli dell’autorità cinese, che richiede che le loro risposte aderiscano ai “valori socialisti fondamentali”.
L’articolo Alibaba sfida OpenAI con un nuovo modello di intelligenza artificiale open source è tratto da Forbes Italia.