Link&Think: 2026

giovedì 5 marzo 2026

The big illusion is over: Artificial Intelligence is not replacing software developers

by Enrico Nardelli

(versione italiana qua)

Let me say upfront — to pre-empt the usual hasty comments from those who won't read to the end — that I do believe tools based on generative Artificial Intelligence (GenAI, hereafter) are genuinely useful in software development, as they are in many other fields. But we need to be able to tell dreams from reality.

In 2023, Big Tech CEOs were more or less unanimously declaring that GenAI would replace most software developers by 2025. As recently as March 2025, Dario Amodei, CEO of Anthropic, was claiming that within 3 to 6 months GenAI would be writing 90% of all code.

The story went that the future would be "agentic" — that developers would have digital colleagues who never slept and never complained and would therefore take their jobs.

2024 closed with no fewer than 152,000 employees laid off across the tech sector worldwide, while by December 2025 the number of layoffs had reached 123,000 — all of it justified, according to the executives themselves, as "realigning towards an AI-centric future."

2026 has now begun, and there is no trace of the miraculous transformations that until recently were being touted as certainties — as I had anticipated several months ago. There I cited the Generative AI Gap report from MIT's NANDA project, published in July 2025, which had found that despite $40 billion in global investment, a staggering 95% of GenAI pilot projects had failed to produce any measurable economic return. Most organisations were seeing a net impact of zero on their bottom line.

Here are some updates that help explain why.

The GitClear report of February 2025 examined 211 million lines of code modified in the open source repositories used by Big Tech, finding that between 2020 and 2024 there was a near-doubling (from 3.05% to 5.67%) in the proportion of code that is added and then deleted within two weeks — so-called code churn. This is a clear indicator of a progressive decline in the quality of software being produced. The only technological or organisational change of any significance that occurred over the same period is that the proportion of developers using GenAI tools rose from zero to 63%. Correlation is not causation, of course, but this looks very much like a smoking gun. Furthermore, the report also recorded an increase in duplicated code blocks and a decrease in code reuse. These too are signs of declining quality. A December 2025 study by CodeRabbit, analysing 470 pull requests on the GitHub platform (used by more than 100 million developers worldwide to share and collaboratively develop code), found that GenAI-generated code produces on average 1.7 times more issues than code written by humans.

Stack Overflow, following a survey involving nearly 50,000 developers across 177 countries, reported that the proportion of developers favourably disposed towards GenAI tools fell from over 70% in 2024 to around 60% in 2025. The main source of frustration, cited by 66% of respondents, was that GenAI-produced solutions are "almost right, but not quite" — which leads to wasted time fixing errors in the code generated this way. That said, 69% of them acknowledged that GenAI does increase productivity in software writing. Several studies carried out in 2024 found that this increase ranges from 10–20% for senior developers to 35–40% for junior ones, who are better placed to benefit from a system that has knowledge of virtually all the software ever written in the world.

These findings are corroborated by studies conducted by the Stanford software engineering productivity research group involving more than 100 developers at major technology companies, which showed that the productivity gains in software development achieved through the use of GenAI tools are on average between 10% and 20%. Using them uncritically for software development, however, risks being a very costly mistake in the long run. While the volume of code produced increases by almost 40%, its quality decreases, requiring additional time for correction. And these are just the short-term consequences. Over the medium or long term — that is, in the context of the adaptive maintenance of software systems that have been in operation for some time — the situation risks becoming explosive.

There are no results yet pointing in this direction, given how little time has passed, but two significant findings emerge from the Stanford group's studies. The first is that without strong discipline in keeping a company's codebase structured and organised in a clear and clean manner, productivity gains evaporate or even reverse. The second is that productivity gains are greatest for new, low-complexity projects, while they diminish considerably for mature, high-complexity ones.

Throughout 2025, the wonders of vibe coding were extolled — the approach to software development in which a developer interacts with GenAI in natural language to "materialise" a complex software system by describing its overall vision. The problem is that this approach is fine for a demo but not for production-grade systems, because — like a sandcastle — it does not hold up solidly over time. This is the so-called GenAI technical debt: the future costs that accumulate when, in the rush of software development, one takes advantage of GenAI's code generation speed without bothering with thorough checks and verification.

During 2025, an approach emerged — conceptually known for some time, though now gaining traction — called specification-driven development, in which the developer uses GenAI tools starting from a specification — that is, a high-level description of the desired behaviour of the entire system — defined by the developer and progressively refined in ever greater detail, also with the support of GenAI. In this way, one partially overcomes the main limitation of these tools, which are based on statistics rather than symbolic representation: their inability to represent concepts that abstract away from the literal context under examination. With this approach, the software developer transforms into a specification developer. It is too early to say where this will lead, however, not least because the problems afflicting GenAI systems will not be overcome until the statistical approach is coupled with the symbolic one. The need to review AI-generated code in order to be confident it can be trusted therefore remains, at least until that integration occurs — and no one can reliably say when that will be. Which means that graduates in informatics and informatics engineering will always be in high demand — but that is a separate conversation.

And then there is the ever-present elephant in the room when it comes to informatics systems: security.

The Veracode October 2025 report on the security of GenAI-generated code reveals that 45% of it contains at least one of the ten most critical vulnerabilities identified by OWASP (Open Worldwide Application Security Project). For Java programs the situation is even worse. This sheds light on another important point: since GenAI tools have been trained on all existing code, and Java systems contain — for partly historical reasons — far more vulnerabilities than those written in other languages, the code that GenAI generates for this language is correspondingly more flawed.

Finally, the most damaging effect of all: the decline in hiring for entry-level software development roles. Because companies believed GenAI could handle junior-level tasks, hiring for these profiles collapsed. In 2024, the 15 largest Silicon Valley companies hired 25% fewer people for positions requiring less than one year of experience, while the reduction at start-ups was 11%. In its wake, we will likely also see a decline in enrolments in university degree programmes and upper secondary school diploma courses centred on informatics.

A suicidal choice, at every level. If companies do not hire inexperienced young people, they will never be able to develop experienced leaders. If young people do not learn to develop informatics systems with their own minds, they will never be able to manage those developed by GenAI.

Companies that have understood how to use GenAI are deploying it to help people be more effective in their work, freeing them from repetitive, low-level tasks. Those that are blindly relying on GenAI to get rid of new hires or pay them less will be forced to think again — and it will hurt.

The pendulum always swings back. What do you think?

--
The original version (in italian) has been published by "StartMAG" on 16 February 2026.

La grande illusione infranta: l'Intelligenza Artificiale non sostituisce gli sviluppatori di software

di Enrico Nardelli

(english version here)

Anticipo subito - per evitare i soliti commenti frettolosi di chi non legge fino in fondo - che ritengo che gli strumenti basati sull'Intelligenza Artificiale generativa (IAGen, nel seguito) abbiano certamente un'utilità nello sviluppo del software, così come in molti altri settori. Ma dobbiamo essere in grado di distinguere i sogni dalla realtà.

Nel 2023 i capi delle Big Tech dicevano più o meno tutti che l'IAGen avrebbe sostituito la maggior parte degli sviluppatori software entro il 2025. Ancora a marzo 2025 Dario Amodei, il CEO di Anthropic, dichiarava che nel giro di 3-6 mesi l’IAGen avrebbe scritto il 90% del codice.

Si raccontava che il futuro sarebbe stato "agentico", che chi sviluppa software avrebbe avuto colleghi digitali che non dormivano mai e non si lamentavano mai e che, quindi, gli avrebbero sottratto il lavoro.

Il 2024 si era chiuso con ben 152.000 dipendenti del settore licenziati in tutto il mondo, mentre a dicembre 2025 i licenziamenti erano arrivati a 123.000. Il tutto, secondo le dichiarazioni degli stessi capi "per riallinearsi verso un futuro incentrato sull'IA".

È iniziato il 2026 e dei cambiamenti miracolosi dati per certi fino a poco fa non si vede traccia, come avevo anticipato già qualche mese fa. Lì citavo il rapporto Il Divario dell'IA Generativa del progetto NANDA del MIT, uscito a luglio 2025, che aveva registrato come, nonostante 40 miliardi di dollari di investimenti globali, un incredibile 95% dei progetti pilota di IAGen non era riuscito a produrre un ritorno economico misurabile. La maggior parte delle organizzazioni stava vedendo un impatto netto pari a zero sui propri profitti.

Ecco alcuni aggiornamenti che spiegano il perché.

Il rapporto di GitClear di Febbraio 2025 ha esaminato 211 milioni di linee di codice modificate negli archivi a sorgente aperto (open source repository) usati dalle Big Tech osservando che dal 2020 al 2024 si è verificato un incremento percentuale quasi doppio (da 3,05% a 5,67%) della quantità di codice che viene aggiunto e poi cancellato nel giro di due settimane (code churn). È questo un segno che indica una progressiva diminuzione della qualità del software prodotto. L'unico cambiamento tecnologico o organizzativo di una qualche rilevanza che è accaduto nello stesso intervallo di tempo è che la percentuale di sviluppatori che usa strumenti di IAGen è passata dallo zero al 63%. La correlazione non è causazione, certo, ma questa sembra essere una vera e propria "pistola fumante". Non solo, il rapporto ha registrato anche un aumento di blocchi di codice duplicati e una diminuzione del riutilizzo del codice. Anche questi sono segnali di diminuzione della qualità. Uno studio di CodeRabbit di Dicembre 2025 ha rivelato, analizzando 470 richieste di integrazione (pull request) di nuove parti di codice in programmi esistenti sulla piattaforma GitHub (usata da più di 100 milioni di sviluppatori in tutto il mondo per condividere codice informatico e collaborare al suo sviluppo), che il codice prodotto da IAGen crea mediamente 1,7 più problemi del codice prodotto da esseri umani

Stack Overflow, a seguito di un'indagine che ha coinvolto quasi 50.000 sviluppatori in 177 paesi, ha riportato che la percentuale favorevole all'utilizzo di strumenti di IAGen è calata da più del 70% nel 2024 a circa il 60% nel 2025. Il motivo principale di frustrazione nel loro utilizzo, riportato dal 66% degli sviluppatori, è che le soluzioni prodotte dall'IAGen sono "quasi corrette, ma non completamente", il che conduce a sprecare tempo nelle attività di correzione degli errori del codice ottenuto per questa via. Il 69% di loro ha comunque riconosciuto che l'IAGen aumenta la produttività nella scrittura del software. Diverse ricerche svolte nel 2024 hanno evidenziato che tale aumento va dal 10-20% dello sviluppatore senior al 35-40% di uno junior, che è in grado di trarre maggior vantaggio da un ambiente che conosce tutto il software sviluppato nel mondo.

Questi dati sono confermati anche dagli studi condotti dal gruppo di ricerca sulla produttività dell'ingegneria del software di Stanford su più di 100 sviluppatori delle maggiori aziende tecnologiche, che hanno evidenziato come l'aumento di produttività nello sviluppo di software ottenuto dall'uso di strumenti di IAGen sia mediamente tra il 10% e il 20%. Usarli acriticamente per lo sviluppo del software rischia però di essere un errore molto costoso a lungo termine. Infatti, mentre la quantità di codice realizzato aumenta di quasi il 40%, la sua qualità diminuisce, richiedendo tempo aggiuntivo per per essere corretto. E queste sono le conseguenze sul breve periodo. Nel medio o lungo, ovvero in un contesto di manutenzione adattiva di sistemi software che sono in funzione da parecchio tempo, la situazione rischia di essere esplosiva.

Non ci sono ancora risultati in questa direzione, considerato il poco tempo trascorso, ma dagli studi di questo gruppo di Stanford due elementi rilevanti emergono. Il primo è che in assenza di una forte disciplina nel mantenere il software dell'azienda strutturato e organizzato in modo chiaro e pulito i guadagni di produttività si annullano o addirittura si invertono. Il secondo è che i guadagni di produttività sono maggiori per progetti nuovi e di bassa complessità, mentre si affievoliscono notevolmente per progetti maturi e di alta complessità.

Per tutto il 2025 sono state decantate le meraviglie del vibe coding, l'approccio allo sviluppo del software nel quale uno sviluppare interagisce in linguaggio naturale con l'IAGen per "materializzare" un sistema software complesso di cui si descrive la visione generale. Il problema è che questo approccio va bene per fare una demo ma non per sistemi da usare a regime, perché – come un castello di sabbia – non rimane solidamente in piedi col passare del tempo. È il cosiddetto debito tecnico dell'IAGen, cioè i costi futuri che si accumulano quando nello sviluppo del software si approfitta, per sbrigarsi, delle velocità di generazione del codice di IAGen senza stare a fare tanti controlli e verifiche.

Nel corso del 2025 è emerso un approccio (che a livello concettuale era però noto da molto tempo) chiamato “sviluppo guidato dalla specifica” (specification driven development) nel quale lo sviluppatore usa gli strumenti di IAgen a partire di una specifica (cioè di una descrizione di massima del comportamento desiderato dell’intero sistema) da lui definita e via via precisata in modo sempre più dettagliato, anche con il supporto dell’IAgen. In tal modo si supera in qualche modo il maggior problema di questi strumenti, basati sulla statistica e non sulla rappresentazione simbolica, cioè quello di essere in grado di rappresentare concetti che astraggono rispetto al contesto letterale preso in esame. Lo sviluppatore di software si trasforma con quest’approccio in uno sviluppatore di specifiche. È presto per dire però dove si arriverà con questo approccio, anche perché i problemi che affliggono i sistemi di IAgen non verranno superati fino a che l’approccio statistico non sarà accoppiato a quello simbolico. Rimane quindi ancora in piedi, almeno fino a questa integrazione (che nessuno può dire in modo affidabile quando avverrà) la necessità di controllare il codice prodotto per essere sicuri di potersi fidare. Il che implica che di laureati in informatica e ingegneria informatica ci sarà sempre un gran bisogno, ma questo è un altro discorso.

E poi c'è il solito "convitato di pietra" quando si parla di sistemi informatici: la sicurezza.

Il rapporto Veracode di ottobre 2025 sulla sicurezza del codice generato dall'IAGen rivela che il 45% di questo contiene almeno una delle 10 vulnerabilità più importanti secondo l'OWASP (Open Worldwide Application Security Project = Progetto per la sicurezza mondiale delle applicazioni open source, gestito dall'omonima fondazione no-profit). Per i programmi scritti in Java la situazione è ancora peggiore. Questo getta luce su un altro elemento importante: dal momento che gli strumenti IAGen sono stati addestrati su tutto il codice esistente, e i sistemi in Java contengono, per ragioni anche storiche, molte più vulnerabilità di quelli in altri linguaggi, i programmi che vengono generati dall'IAGen per questo linguaggio sono più difettosi.

Infine l'effetto più dannoso: la diminuzione delle assunzioni nelle posizioni iniziali dello sviluppo software. Siccome le aziende pensavano che l'IAGen potesse gestire compiti di livello junior, le assunzioni per questi profili sono crollate. Nel 2024 le 15 maggiori aziende della Silicon Valley hanno assunto il 25% in meno nelle posizioni con meno di un anno di esperienza, mentre la riduzione è stata dell'11% nelle start-up. A seguire, vedremo probabilmente anche una diminuzione delle iscrizioni ai corsi di laurea universitari e ai corsi di diploma di scuola secondaria superiore centrati sull'informatica.

Una scelta suicida, a tutti i livelli. Se le aziende non assumono giovani inesperti, non saranno mai in grado di formare leader esperti. Se i giovani non imparano a sviluppare sistemi informatici con la propria testa, non saranno mai in grado di gestire quelli sviluppati dall'IAGen.

Le aziende che hanno capito come usare l’IAGen la stanno mettendo in gioco per aiutare le persone a essere più efficaci nel loro lavoro, liberandole da compiti ripetitivi e di basso livello. Quelle che si stanno affidando ciecamente all’IAGen per liberarsi di neo-assunti o pagarli di meno, saranno costrette a ricredersi dolorosamente.

Il pendolo torna sempre indietro. E voi che ne pensate?

--
Versione originale pubblicata su "StartMAG" il 2 marzo 2026.

giovedì 19 febbraio 2026

Four reasons to scale back expectations for generative Artificial Intelligence

by Enrico Nardelli

(versione italiana qua)

«Artificial Intelligence (AI) is going to reproduce human intelligence. AI will eliminate disease. AI is the single biggest, most important invention in human history. You've likely heard it all—but probably none of these things are true».

This is the opening of a special issue titled Hype Correction, subtitled It's time to reset expectations, published in December 2025 by the Technology Review of the Massachusetts Institute of Technology (MIT), one of the most authoritative sources on scientific and technological research in the United States and worldwide.

I had anticipated back in April 2025 that things were heading in this direction, a trajectory now confirmed by the analysis of such a prestigious publication.

You certainly remember how the launch of ChatGPT-3.5 (Generative Pre-trained Transformer) at the end of 2022 captured the world's attention, prompting both private and public entities worldwide to invest heavily in the LLM (Large Language Model) technology that underpins Generative AI (GenAI) systems. Many believed this was the path toward achieving Artificial General Intelligence (AGI), an intelligence similar to human intelligence but even more powerful, versatile, and tireless, which would free us from labor and find solutions to all our problems. However, after three years of continuous promises, the launch of ChatGPT-5 in August 2025 – perceived as merely incremental rather than revolutionary – began to make the exaggeration behind that vision increasingly evident.

In October 2025, I pointed out the first signs of a course correction already underway.

Summarizing what has emerged from various reports and studies conducted in 2025, there are four key elements that explain the current state of affairs.

LLM-based systems are not the path to AGI. This has been stated, among others, by Yann LeCun, who served as Meta’s chief scientist until November 2025 and left the company precisely because he disagreed with its continued insistence on LLMs. Ilya Sutskever, former Chief Scientist and co-founder of OpenAI (the company behind ChatGPT), has observed that LLMs' ability to generalize – that is, to extract general principles and apply lessons learned during training to new situations – is far more limited than that of human beings. In January 2026, The Atlantic (one of the oldest and most prestigious magazines in the US) published an article declaring "Large language models don't ‘learn’ – they copy," based on work by researchers from Stanford and Yale, who succeeded in getting four of the most widely used GenAI systems to reproduce nearly entire books or very large portions of them. A scientific review by researchers from Caltech and Stanford, published in January 2026, highlighted how even the most recent models, even those presented as "capable of reasoning," actually have significant problems reasoning correctly.
GenAI systems remain prone to hallucinations (i.e., making things up) at a rate estimated between 15% and 25% — an unacceptable level for most consequential decisions and interactions, in both personal and professional life. This is especially troubling because, unlike a human being, these systems are incapable of self-correcting through experience. Any ordinary worker may make mistakes at first but usually learns and improves. This does not and cannot happen with GenAI systems, precisely because they are based on an essentially statistical learning of language, namely on how frequently words appear near one another, and they lack causal reasoning capabilities. The special issue cited at the beginning observes how surprising it is that this approach managed to create artificial systems that produce human-like expressions when prompted with any question, but the fact that we perceive them as intelligent is our own projection. See my first two articles on the subject from March 2023 and April 2023.
For routine tasks, GenAI systems can outperform the average person, but because they fail to deliver expert-level performance reliably in real-world contexts, they have not managed to drive meaningful productivity gains at the enterprise level. We were misled when we saw successive versions of these systems pass professional qualification exams, but it later became clear that such performance was largely due to having “memorized” all available test materials in those fields rather than to any genuine understanding of their core concepts. In the words of Andrej Karpathy (inventor of the popular term vibe coding, which we will return to in a future article), these are "versatile but shallow and error-prone" tools capable of helping ordinary people accomplish things they would otherwise need an expert for (such as getting the gist of a legal or medical document), but not easily integrated into a productive workflow.
Certainly, the majority of people now use GenAI systems daily, both personally and professionally, but in most cases they do so free of charge, given that at least a dozen companies make them available. The upshot is that, after a cumulative $600 billion in investment between 2021 and 2025, there is still no viable business model — and this is prompting investors to rethink their positions. It is no coincidence that talk of a bubble began circulating in 2025, including from prominent industry figures such as Sundar Pichai, CEO of Alphabet (Google's parent company), in November of that year. Daron Acemoglu, 2024 Nobel laureate in Economics, analyzed the influence of the entire AI sector on the US economy through 2035 and concluded that only about 5% of tasks will be effectively performed by AI, and GDP will increase by only 1.1% to 1.8%. One capability still lacking is the ability, given a specific work situation, to reliably provide context-dependent information to solve emerging problems. Indeed, in January 2026, a Washington Post article reported that «economic data shows the technology largely has not replaced workers», and the Remote Labor Index analysis, conducted jointly by the Center for AI Safety and Scale AI, confirmed Acemoglu's predictions for now: on average, only 2.5% of jobs posted on a platform offering paid tasks to independent workers were successfully completed by leading GenAI systems. Additionally, also in January 2026, a survey by Apollo Global Management (one of the world's largest investment management firms) of CFOs (Chief Financial Officers) showed that the majority of them in 2025 «are seeing no impact from AI on labor productivity, decision-making speed, customer satisfaction or time spent on high value-added tasks».

None of this means GenAI tools are useless — far from it. They do augment our cognitive capabilities, provided we scrutinize their outputs carefully. They are extremely useful for carrying out routine tasks in areas we already master (so that we can correct any mistakes). A very recent example is their use as evaluators of the scientific rigor of theoretical computer science papers, which according to 81% of authors helped increase clarity and readability. They will certainly continue to improve, although to achieve major leaps in quality, it will be necessary to integrate them with systems based on a symbolic approach, and it is far from clear when this will happen.

There is still a long road ahead. What do you think?

--
The original version (in italian) has been published by "StartMAG" on 16 February 2026.

Quattro motivi per ridimensionare le aspettative sull'Intelligenza Artificiale generativa

di Enrico Nardelli

(english version here)

«L'intelligenza artificiale (IA) riprodurrà l'intelligenza umana. L'IA sconfiggerà le malattie. L'IA è la più grande e più importante invenzione nella storia dell'umanità. Lo avete sentito ripetere mille volte – ma probabilmente nulla di tutto ciò è vero».

Inizia così il numero speciale intitolato Hype Correction, con sottotitolo It’s time to reset expectations, pubblicato a dicembre 2025 dalla Rivista di Tecnologia del Massachussets Institute of Technology (MIT), una delle fonti più attendibili della ricerca scientifica e tecnologica degli Stati Uniti e del mondo.

Avevo anticipato ad aprile 2025 che la situazione si stava evolvendo in tal modo, consistente con quest’analisi di una pubblicazione così autorevole.

Ricordate certamente come il lancio di ChatGPT-3.5 (Generative Pre-trained Transformer) alla fine del 2022 abbia catalizzato l’attenzione generale, spingendo in tutto il mondo sia soggetti privati che pubblici a investire pesantemente nella tecnologia degli LLM (Large Language Model = modelli linguistici di grandi dimensioni) che è alla base dei sistemi di Intelligenza Artificiale generativa (IAgen). Molti pensavano che fosse la strada per arrivare a un’intelligenza artificiale di natura generale (AGI = Artificial General Intelligence), simile a quella dell’uomo e ancora più potente, più versatile e infaticabile, che ci avrebbe liberato dal lavoro e trovato la soluzione a tutti i problemi. Però, dopo tre anni di continue promesse, il lancio di ChatGPT-5, avvenuto ad agosto 2025 e percepito come un semplice miglioramento incrementale e non certo rivoluzionario, aveva iniziato a rendere evidente l’esagerazione che c’era in tale visione.

A ottobre 2025 avevo indicato i primi segnali che mostravano la correzione di rotta in atto.

Sintetizzando adesso ciò che è emerso da diversi rapporti e studi realizzati nel 2025, vi sono quattro importanti elementi che spiegano il perché della situazione attuale.

I sistemi basati sui LLM non sono la strada per arrivare all’AGI. Questo è stato dichiarato, tra gli altri, da Yann LeCun, che è stato fino a novembre 2025 il capo scienziato di Meta, da lui abbandonata proprio perché in disaccordo sull’insistere con gli LLM. Ilya Sutskever, già scienziato capo e co-fondatore di OpenAI (la società che ha realizzato ChatGPT) ha osservato che le capacità degli LLM di generalizzare (cioè di estrarre princìpi generali) e quindi applicare a situazioni diverse quanto appreso durante il loro addestramento sono molto più limitate di quelle degli esseri umani. A gennaio 2026 la rivista The Atlantic (una delle riviste più antiche e prestigiose degli USA) ha pubblicato un articolo che dichiara «I modelli linguistici di grandi dimensioni non “apprendono” – copiano», basandosi su un lavoro svolto da ricercatori di Stanford e Yale, che sono riusciti a far produrre a quattro tra i più usati sistemi di IAgen quasi l’intero testo o porzioni vastissime di molti libri. Una rassegna scientifica svolta da ricercatori di Caltech e Stanford, pubblicata a gennaio 2026, ha evidenziato come anche i più recenti modelli, perfino quelli presentati come “capaci di ragionamento” abbiano in realtà grossi problemi nel ragionare in modo corretto.
I sistemi di IAgen tendono ancora ad essere soggetti ad allucinazioni (cioè, inventare cose che non esistono) in una misura valutata tra il 15% e il 25%, ovvero un livello inaccettabile nella maggior parte delle azioni e interazioni importanti sia nella vita privata che produttiva, soprattutto perché tali sistemi non sono in grado di auto-correggersi con l’esperienza, diversamente da una persona. Qualunque normale lavoratore può sbagliare all’inizio, ma poi, normalmente, impara e migliora. Questo non accade e non può accadere con i sistemi di IAgen, proprio in ragione del fatto che sono basati su un apprendimento essenzialmente di natura statistica del linguaggio, cioè relativo alla frequenza con cui le parole appaiono più o meno vicine e non hanno capacità di ragionamento causale. Il numero speciale citato in apertura osserva come sia sorprendente che quest’approccio sia riuscito a realizzare sistemi artificiali che producono espressioni simili a quelle degli esseri umani quando stimolate con una qualunque domanda, ma il fatto che li percepiamo come intelligenti è una nostra proiezione. Si vedano in proposito i miei primi due articoli sul tema a marzo 2023 e ad aprile 2023.
Per compiti normali i sistemi di IAgen possono essere più efficaci della persona media, ma poiché non raggiungono prestazioni da esperti in modo affidabile in contesti reali non riescono ad essere davvero efficaci per aumentare la produttività a livello aziendale. Su questo ci siamo illusi quando abbiamo visto che le successive versioni di tali sistemi erano in grado di superare gli esami per accedere a professioni complicate, ma poi si è capito che queste prestazioni erano dovute semplicemente all’aver “memorizzato” tutti i test disponibili per le relative discipline, più che a una reale comprensione dei loro concetti fondamentali. Nelle parole di Andrea Karpathy (inventore del popolarissimo termine vibe coding, su cui ritorneremo in un prossimo articolo) si tratta di strumenti «versatili ma di scarsa profondità e soggetti a errori», che quindi possono mettere la persona media in grado di fare cose per le quali sarebbe altrimenti costretta a ricorrere a un esperto (ad esempio, capire il significato di massima di un documento legale o medico), ma che non possono essere così facilmente integrati in un contesto produttivo.
Certamente la maggioranza delle persone usa ormai quotidianamente i sistemi di IAgen, sia a livello personale che professionale, ma nella maggior parte dei casi lo fa gratuitamente, dal momento che ci sono almeno una decina di aziende diverse che li rendono disponibili. Il risultato è che, dopo 600 miliardi di dollari complessivamente investiti dal 2021 al 2025, non c’è ancora un modello di business e questo sta facendo riconsiderare agli investitori le loro scelte. Non a caso, nel 2025 si è cominciato a parlare di bolla, anche da parte di autorevoli leader del settore, come Sundar Pichai, il CEO di Alphabet (la casa madre di Google) a novembre di quell’anno. Daron Acemoglou, premio Nobel per l’economia nel 2024, ha analizzato l’influenza di tutto il settore dell’IA sull’economia USA fino al 2035 e ha concluso che solo circa il 5% dei compiti verrà eseguito in modo efficace dall’IA e il PIL aumenterà solo di un valore compreso tra 1,1 e 1,8%. Una caratteristica che ancora manca è la capacità, data una specifica situazione lavorativa, di fornire in modo affidabile informazioni dipendenti dal contesto per risolvere determinati problemi che sono sorti. Proprio a gennaio 2026, un articolo del Washington Post ha riportato che «i dati economici dimostrano che la tecnologia in gran parte non ha sostituito i lavoratori» e l’analisi Remote Labor Index, svolta congiuntamente dal Center for AI Safety e da Scale AI, ha confermato per il momento le previsioni di Acemoglou: infatti mediamente solo il 2,5% dei lavori proposti su una piattaforma che offre a lavoratori in proprio compiti a pagamento è stato completato con successo dai migliori sistemi di IAgen. In aggiunta, sempre a gennaio 2026, un’indagine della società Apollo Global Management (una delle più grandi al mondo nella gestione di investimenti) sui CFO (Chief Financial Officer = Direttore Finanziario), ha mostrato che la maggioranza di loro nel 2025 «non ha visto alcun impatto sulla produttività del lavoro, velocità nel prendere decisioni, soddisfazione della clientela, tempo speso su compiti ad alto valore aggiunto».

Tutto questo non vuol dire che gli strumenti di IAgen siano inutili, tutt’altro. Potenziano le nostre capacità in ambito cognitivo, purché scrutiniamo con attenzione ciò che producono. Sono utilissimi per svolgere compiti di routine in settori che padroneggiamo (così da poter correggere gli eventuali errori): un recentissimo esempio è l’impiego come valutatori del rigore scientifico di articoli di informatica teorica, che secondo l’81% degli autori ha contribuito ad aumentare chiarezza e leggibilità. Certamente continueranno a migliorare, anche se per avere salti di qualità importanti sarà necessario integrarli con sistemi basati su un approccio simbolico e non è per niente chiaro quando questo accadrà.

La strada quindi è ancora lunga. Voi che ne pensate?

--
Versione originale pubblicata su "StartMAG" il 16 febbraio 2026.

venerdì 6 febbraio 2026

Informatics as a scientific discipline officially enters Italian schools: now the real challenge begins

by Enrico Nardelli

(versione italiana qua)

A historic step has been taken for the Italian school system. With the publication in the Official Gazette of January 27, 2026 of the new National Guidelines, informatics officially enters primary and lower secondary schools as a subject of study. This is no longer a matter of basic digital literacy or learning to use a computer – it marks the introduction of computer science as a fully-fledged scientific discipline.

This reform represents a highly significant milestone in a journey that began twenty years ago with the conference Informatics: Culture and Society. Informatics is being integrated into the curriculum through two complementary channels: the more abstract and conceptual aspects have been woven into Mathematics, while the more concrete and applied elements find their place within Technology. Although this solution does not establish informatics as a standalone subject—which would have required a more complex legislative process—it now provides the legal framework needed to offer students a comprehensive education in the scientific principles underlying the digital world.

The shift in perspective is a radical one. As the official documents make clear, the goal is not to produce passive users of technology, but informed citizens capable of critically understanding how the computing systems that permeate every aspect of contemporary society actually work. The reform aims to develop fundamental skills in young people, not just to use digital technology, but to understand, evaluate, and, when necessary, create it.

This turning point aligns with broader European Union (EU) directives. In November 2023, the Council of the EU published Recommendation C/2024/1030, calling on member states to improve the provision of digital skills training. With this reform, Italy aligns itself with countries such as the United Kingdom, which introduced compulsory computing education as early as 2014, and responds to the strategic need to close the skills gap in an era shaped by artificial intelligence (AI).

The rise of generative AI itself raises new questions. Some might wonder whether, in a world where systems capable of writing software autonomously are already available, teaching this subject still makes sense. The experts' answer is unequivocal: even in the most advanced scenarios, AI tools will only be able to support — not replace — the people involved in developing and managing software systems. Strategic direction, understanding context and objectives, and the ability to adapt systems to changing needs will remain human tasks. These require that symbolic and abstract understanding of the world that only humans possess, and the conceptual and technical ability to develop complex digital systems that only the study of informatics can provide. We will return to this issue in a future article.

The risk, however, is that a lack of public understanding of these dynamics could lead policymakers to withdraw their support for computer science education at the very moment when this competency is becoming most critical. For this reason, cross-party support for this reform is essential to ensure the continuity of a project that will take at least a decade to fully bear fruit.

The new National Guidelines also address the ethical and social challenges associated with technology. The text explicitly stresses the need for students to acquire «an understanding of how systems based on digital technologies function, together with an awareness of their possibilities and limitations, so as to grasp the enormous opportunities for improvement and development they offer society while preventing them from becoming instruments of exclusion or oppression». It reaffirms the fundamental principle that «human beings must maintain control over decisions based on computer systems that can have a significant impact on people».

The real challenge now lies in teacher training. Unlike other disciplines, informatics is not part of the cultural background of most Italian teachers, who studied it neither in school nor at university. The British experience is instructive: after introducing compulsory computing education in 2014, the United Kingdom had to acknowledge in 2017 that much of the curriculum guidance remained unimplemented due to a shortage of adequately trained teachers. The response was the creation, in 2019, of the National Centre for Computing Education, funded with £82 million and continuously refinanced to this day, despite cuts to public spending.

Italy has had access to funds under the National Recovery and Resilience Plan (PNRR), but organizational and time constraints prevented their use in establishing an efficient system for training teachers in informatics education. Strong political will is therefore needed to ensure that this reform does not remain a dead letter. The academic informatics community, which has been bringing the foundations of the field into Italian schools for many years, is ready to contribute. We recall the numerous initiatives already in place, such as the Programma il Futuro project in collaboration with the Ministry of Education and Merit, and the structured research and training activities carried out by the National Laboratory "Informatics and School" of CINI (National Inter-University Consortium for Informatics).

The road will be long and not without obstacles, but the first, fundamental step has been taken. taly has finally recognized that, in an increasingly digital society, the knowledge of the scientific principles of computer science is neither a luxury nor a narrow technical specialization, but rather an essential component of every citizen’s education. Only in this way will it be possible to shape generations capable not only of using technology, but of understanding its implications, assessing its consequences, and maintaining democratic control over systems that profoundly shape our lives.

--
The original version (in italian) has been published by "StartMAG" on 3 February 2026.

L'informatica come disciplina scientifica entra nella scuola: adesso inizia la vera sfida

di Enrico Nardelli

(english version here)

È stato compiuto un passo storico per il sistema scolastico italiano. Con la pubblicazione sulla Gazzetta Ufficiale del 27 gennaio 2026 delle nuove Indicazioni Nazionali, l'informatica fa il suo ingresso ufficiale come materia di studio nella scuola primaria e secondaria di primo grado. Non si tratta più di semplice alfabetizzazione digitale o di imparare a usare il computer, ma dell'introduzione dell'informatica come vera e propria disciplina scientifica.

Questa riforma rappresenta un risultato assai significativo di un percorso intrapreso venti anni fa, con il convegno Informatica: Cultura e Società. L'informatica viene inserita nel curriculum attraverso due canali complementari: gli aspetti più astratti e concettuali sono stati integrati nell'insegnamento della Matematica, mentre quelli più concreti e applicativi trovano spazio nella Tecnologia. Tale soluzione, anche se non introduce l'informatica come materia autonoma – che avrebbe richiesto un iter normativo più complesso – costituisce adesso il quadro legislativo di riferimento per poter fornire agli studenti una formazione completa sui principi scientifici alla base del mondo digitale.

Il cambiamento di prospettiva è radicale. Come evidenziato nei documenti ufficiali, l'obiettivo non è formare utilizzatori passivi di tecnologia, ma cittadini consapevoli, capaci di comprendere criticamente il funzionamento dei sistemi informatici che permeano ogni aspetto della società contemporanea. La riforma si propone di sviluppare nei giovani competenze fondamentali non solo per usare la tecnologia digitale, ma per comprenderla, valutarla e, quando necessario, crearla.

Questa svolta si inserisce nel contesto più ampio delle indicazioni dell'Unione Europea (UE). Nel novembre 2023, il Consiglio dell'UE ha pubblicato la Raccomandazione C/2024/1030 che invita gli Stati membri a migliorare l'offerta formativa in materia di competenze digitali. L'Italia, con questa riforma, si allinea a paesi come il Regno Unito, che già dal 2014 ha introdotto l'insegnamento obbligatorio dell'informatica, e risponde all'esigenza strategica di colmare il divario di competenze in un'epoca dominata dall'intelligenza artificiale (IA).

Proprio l'avvento dell'IA generativa pone nuove questioni. Alcuni potrebbero chiedersi se, in uno scenario in cui sono già disponibili sistemi in grado di scrivere autonomamente programmi informatici, avrà ancora senso insegnare questa materia. La risposta degli esperti è chiara: anche negli scenari più avanzati, gli strumenti di IA potranno solo supportare, non sostituire, le persone coinvolte nello sviluppo e nella gestione dei sistemi software. La direzione strategica, la comprensione del contesto e degli obiettivi, la capacità di adattare i sistemi alle mutevoli esigenze rimarranno compiti umani, che richiedono proprio quella comprensione simbolica e astratta del mondo che solo le persone hanno e quella capacità concettuale e tecnica di sviluppare sistemi digitali complessi che solo lo studio dell'informatica può fornire. Riprenderemo questo tema in un successivo articolo.

Il rischio, tuttavia, è che la scarsa comprensione di queste dinamiche da parte del grande pubblico possa portare i decisori politici a ritirare il sostegno all'insegnamento dell'informatica, proprio nel momento in cui questa competenza diventa sempre più cruciale. Per questo, il supporto bipartisan a questa riforma è fondamentale per garantire la continuità di un progetto che richiederà almeno un decennio per andare a regime.

Le nuove Indicazioni Nazionali affrontano anche le criticità etiche e sociali legate alla tecnologia. Il testo sottolinea esplicitamente la necessità che gli studenti acquisiscano "la comprensione del funzionamento dei sistemi basati sulle tecnologie informatiche contestualmente a quella delle loro possibilità e dei loro limiti, così da cogliere le enormi possibilità di miglioramento e sviluppo offerte alla società evitando che diventino strumento di esclusione o di oppressione". Viene ribadito il principio fondamentale che "siano gli esseri umani a mantenere il controllo sulle decisioni basate su sistemi informatici che possono avere un impatto significativo sulle persone".

La vera sfida, ora, è quella della formazione degli insegnanti. A differenza di altre discipline, l'informatica non fa parte del bagaglio culturale della maggior parte dei docenti italiani, che non l'hanno studiata né a scuola né all'università. L'esperienza britannica è illuminante: dopo aver introdotto l'insegnamento obbligatorio dell'informatica nel 2014, il Regno Unito ha dovuto constatare nel 2017 che le indicazioni curricolari rimanevano in gran parte inattuate per mancanza di insegnanti preparati. La risposta è stata la creazione, nel 2019, del National Centre for Computing Education, finanziato con 82 milioni di sterline e costantemente rifinanziato fino ad oggi, nonostante i tagli alla spesa pubblica.

L'Italia ha avuto accesso ai fondi del PNRR, ma i vincoli organizzativi e temporali hanno impedito di utilizzarli per creare un meccanismo efficiente per la formazione dei docenti all’insegnamento dell’informatica. Servirà quindi una forte volontà politica per garantire che questa riforma non rimanga lettera morta. La comunità accademica degli informatici, che da moltissimi anni porta le basi dell'informatica nelle scuole italiane, è pronta a contribuire: ricordiamo le numerose iniziative già in atto, quali ad esempio il progetto Programma il Futuro in collaborazione col Ministero dell’Istruzione e del Merito, e l’attività a livello di studio, ricerca e formazione esplicata in modo strutturato e organico attraverso il Laboratorio Nazionale “Informatica e Scuola” del CINI (Consorzio Interuniversitario Nazionale per l’Informatica).

Il percorso sarà lungo e non privo di ostacoli, ma il primo, fondamentale passo è stato compiuto. L'Italia ha finalmente riconosciuto che, in una società sempre più digitale, la conoscenza dei principi scientifici dell'informatica non è un lusso né una specializzazione tecnica, ma una componente essenziale della formazione di ogni cittadino. Solo così sarà possibile formare generazioni capaci non solo di utilizzare la tecnologia, ma di comprenderne le implicazioni, valutarne le conseguenze e mantenere il controllo democratico su sistemi che influenzano profondamente le nostre vite.

--
Versione originale pubblicata su "StartMAG" il 3 febbraio 2026.