I ricercatori della Penn State hanno sviluppato un algoritmo di rinforzo che aiuterà l'Intelligenza Artificiale senziente a progettare edifici sempre più sicuri ed efficienti
Al momento la più famosa Intelligenza Artificiale senziente è DALL-E
(Rinnovabili.it) – Quello dell’Intelligenza Artificiale senziente è un mondo in continua espansione che non smette di affascinare. Dalle suggestive architetture green realizzate da programmi di IA quali DALL-E e MidJourney, alle potenzialità ingegneristiche per la progettazione.
Questa volta il tema è quello dell’apprendimento per rinforzo o Reinforcement learning (RL), una tecnica di apprendimento automatico che punta a realizzare agenti autonomi in grado di scegliere le azioni da compiere per raggiungere determinati obiettivi, con confrontandosi con l’ambiente nel quale sono immerse. In questo caso un edificio.
Ad occuparsi del progetto sono i ricercatori della Penn State, guidati da Greg Pavlak. Lo studio “Constrained Differentiable Cross-Entropy Method for Safe Model-Based Reinforcement Learning“, è stato presentato per la prima volta durante una conferenza a Boston a novembre.
Utilizzando un grattacielo per uffici “simulato”, i ricercatori sono riusciti a sviluppare un algoritmo di apprendimento per rinforzo, che andrà in sostanza a “tarare” l’Intelligenza Artificiale senziente. L’obiettivo è ovviamente quello di massimizzare il risparmio energetico mantenendo sempre elevato il livello di comfort.
Come testare l’IA nel mondo reale senza generare rischi
Il fatto che una Artificial Intelligence riesca a progettare un edificio o a individuare quali soluzioni impiantistiche sono ottimali, è possibile solo grazie ad una progettazione accurata a monte. Ma per arrivare a sistemi di apprendimento automatici ottimale che hanno a che fare con il mondo reale, e non solo con le simulazioni, spesso ci vogliono anni di interazioni. L’altro problema è quello della sicurezza. Sbagliare nel mondo reale potrebbe mettere in pericolo le persone che abitano questi edifici.
Questa preoccupazione ha portato i ricercatori a porsi la domanda: come possiamo sviluppare algoritmi che consentano a questi tipi di agenti di apprendimento per rinforzo di comprendere in modo sicuro nel mondo reale senza prendere decisioni sbagliate che causano la rottura di cose o lesioni alle persone?
Una simulazione per il mondo reale
I ricercatori hanno quindi simulato un grande edificio per uffici a Chicago. Trenta piani da riscaldare e raffrescare con relativi impianti da gestire. L’obiettivo era quello di non uscire mai dal range di comfort degli occupanti, ne tantomeno, esagerare con i consumi o compromettere i motori delle macchine.
L’algoritmo messo a punto dai ricercatori basato su un modello di riferimento, ha appreso 50 volte più veloce dei sistemi tradizionali senza modello. Realizzando in un mese quello che solitamente richiede anni.
“Quando un controller parte da zero, deve imparare tutto”, ha detto Pavlak. “Ma una volta che hai addestrato quel controller per un edificio, puoi provarlo su un edificio simile o riutilizzarne parti nel progetto successivo. Non partire da zero potrebbe potenzialmente portare a un apprendimento più rapido”.
Calibrare un’Intelligenza Artificiale senziente applicata