Noi di HUDI, nel nostro laboratorio di innovazione digitale, contribuiamo attraverso diversi progetti a fornire modelli che alimentano il training model di Codex e aiutiamo gli sviluppatori a generare codice sempre più efficiente grazie anche all’utilizzo dell’IA e del machine learning.

Codex è un modello di intelligenza artificiale, sviluppato da OpenAI, creatrice della prima versione di ChatGPT, modello addestrato su vasti corpus di testo con a disposizione trilioni di informazioni e dati, e l’ambiente di apprendimento è stato organizzato sul Cloud Azure di Microsoft.

Codex utilizza una versione adattata della versione GPT-3 per generare codice informatico in diversi linguaggi di programmazione, tra cui Python, JavaScript, Ruby e molti altri. Utilizzando infatti un’architettura di rete neurale simile a quella di GPT-3, Codex può analizzare il codice esistente e generarne di nuovo in risposta a un’ampia gamma di input e domande. Ciò significa che può aiutare gli sviluppatori a scrivere codice più velocemente, fornendo suggerimenti e completamenti automatici, oltre a generare del nuovo codice a partire da specifici input.

L’ottimizzazione del codice che stiamo sviluppando con l’ausilio di Codex rappresenta, inoltre, un passo significativo a supporto della sostenibilità e contribuisce al raggiungimento dell’ambizioso obiettivo che ci siamo dati, nel Partner Pledge di Microsoft, del carbon negative entro il 2030.

L’ausilio di Codex come strumento ci consente di concentrarci su compiti più complessi e creativi a favore delle crescenti richieste innovative dei nostri clienti.

Aree di Applicazione

OpenAI, in partnership con GitHub e utilizzando Codex come modello e motore, ha creato GitHub Copilot, che fornisce suggerimenti per intere linee o intere funzioni direttamente all’interno dell’editor di codice. Grazie alla stretta integrazione con Codex, GitHub Copilot può convertire i commenti in codice, compilare automaticamente il codice ripetitivo, suggerire test e mostrare alternative. Tutto questo è accompagnato dalla relativa scrittura della documentazione specifica.

Disponibile per Visual Studio Code, tra gli altri ambienti, GitHub Copilot funziona con un’ampia gamma di framework e per alcuni linguaggi di programmazione suggerisce circa il 35% del codice generato da decine di migliaia di sviluppatori che lo utilizzano oggi.

Su HumanEval, un nuovo set di valutazione che viene rilasciato per misurare la correttezza funzionale per la sintesi di programmi da docstring, è emerso che Codex risolve il 28,8% dei problemi, mentre GPT-3 risolve lo 0% e GPT-J risolve l’11,4%. Inoltre, troviamo che il campionamento ripetuto dal modello è una strategia sorprendentemente efficace per produrre soluzioni funzionanti a richieste difficili. Utilizzando questo metodo, risolviamo il 70,2% dei nostri problemi con 100 campioni per problema. Un’attenta indagine del nostro modello rivela i suoi limiti, inclusa la difficoltà con le docstring che descrivono lunghe catene di operazioni e con le operazioni di associazione alle variabili. Infine, discutiamo i potenziali impatti più ampi dell’implementazione di potenti tecnologie di generazione di codice, che coprono la sicurezza, la protezione e l’economia.”

Da: Evaluating Large Language Models Trained on Code, Cornell University

Per i clienti aziendali, il servizio Azure OpenAI di Microsoft offre agli sviluppatori l’accesso a Codex e agli altri modelli, come GPT-3 e supplementi, insieme a funzionalità di livello aziendale integrate in Microsoft Azure.

Alla conferenza Build, Microsoft ha annunciato che il servizio Azure OpenAI, precedentemente accessibile solo su invito, è ora disponibile in un’anteprima ad accesso limitato. Molte sono le possibili e nuove applicazioni del servizio Azure OpenAI e in molti settori verticali.

Share This