Vista elenco

The AI Phishing Revolution: From Spray-and-Pray to Autonomous Operations

27 Maggio 2026 ore 21:31

Evolution of AI Phishing

As with most cyber threats, AI has created a fundamental shift in the phishing threat landscape. It has become a precision operation powered by AI systems that research, build, deliver, and adapt campaigns autonomously. AI acts as a force multiplier: it scales targeted techniques that previously required experience and time, while simultaneously lowering the barrier to entry once again. To understand the scope of this shift, consider that AI can now generate a convincing spear-phishing email, without obvious grammatical errors and in many languages, in under 5 minutes. This article maps the technical shifts driving this new era, from vibe-coded criminal infrastructure and AitM authentication attacks to 24/7 autonomous agents and AI-powered interactive scams.

Vibe Coding and Asian PhaaS

“Vibe coding” – the practice of prompting LLMs with natural language to generate functional code without writing a single line manually – has drastically boosted the Phishing-as-a-Service ecosystem. Threat actors now describe desired functionality, like for example “build a reverse proxy that strips CSP headers and logs POST bodies”, and iterate on output until operational. This has turbocharged the PhaaS market, particularly within the Asian threat actor ecosystems where subscription model platforms like Darcula and Lucid have gained a lot of popularity.

Operators use LLMs to rapidly build and test modular kits, credential harvesters, OTP relay panels, and bulletproof hosting deployment scripts, all generated and refined through conversational prompting. Phishing kits can now even automatically check against commercial email security solutions before deployment, and LLMs then iterate the obfuscation layer until the evasion score meets a threshold. All with minimal expertise from buyers. 

Of course cyber criminal already had access to rent fully managed campaign infrastructure before, complete with analytics dashboards, victim management, and Telegram bot alerts for real-time credential notifications, the eco system is now just growing even faster.

Modern MFA Defeat Mechanisms

The adaption of Multi Factor Authentication (MFA) has started a slow shift away from simple password stealing phishing websites. Attacker-in-the-Middle frameworks like Evilginx & Co. remain popular to neutralize MFA. They operate as reverse proxies that sit between the victim’s browser and the legitimate service, transparently relaying traffic while intercepting session cookies and JWTs in real time. A more recent escalation is the weaponization of the OAuth2 device authorization grant flow against Microsoft Entra ID and M365 environments – so-called Device Code phishing. In a Device Code attack, the threat actor initiates a legitimate authentication flow, generating a device code, then socially engineers the victim into entering it at microsoft.com. The victim authenticates normally. No malicious link is clicked, no credential is typed into a fake page – the entire interaction happens on legitimate Microsoft infrastructure, rendering URL reputation tools blind. The use of residential proxies and ORB networks makes it hard to reply on IP reputation alone for conditional access policies. The window between token theft and first malicious action has collapsed from hours to seconds – all through automation scripts.

In May 2026, Google’s Threat Intelligence Group (GTIG) reported the first case of a cybercriminal using an AI-generated zero-day in the wild. The exploit was a bypass for a 2FA system used by various companies. This demonstrates that MFA, and even phishing-resistant methods such as passkeys, will face more pressure from AI-powered vulnerability research if their implementation is flawed.

24/7 Agentic Campaign Automation

The operational model has shifted from campaigns run by humans to campaigns run for humans by autonomous agents operating continuously. The reconnaissance phase is now fully automated: agents scrape LinkedIn for organizational hierarchy, cross-reference data broker records, and query breach dumps to build rich target profiles. This context is fed into an LLM that generates unique, persona-aware email lures – a CFO receives a lure referencing her CFO peer by name, a specific pending acquisition, and a plausible internal process. Traditional signature-based Email security gateways see clean, unique text with no pattern to match.

These agents also handle the entire infrastructure lifecycle. Domain registration, DNS configuration, TLS certificate provisioning, and continuous proxy rotation are orchestrated automatically, with domains being spun up and burned on a cycle that outpaces most threat intelligence feeds. Critically, modern agentic systems maintain persistent memory across victim interactions: if an initial lure goes unclicked, the agent notes the failure, adjusts the pretext, and schedules a follow-up via a different vector – SMS, Teams, calendar invite, or LinkedIn message – referencing prior interactions to build false familiarity. The campaign never sleeps, never forgets, and never gets frustrated.

Multi-Channel and Cross-Vector Chains

Email-based phishing is still the most common attack vector, but depending on the target we have seen an increase in multi-vector delivery. Agentic architectures can coordinate attacks across channels within a single campaign. A target profiled via LinkedIn is first primed with a text message to their mobile phone or a vishing call using a cloned voice of their IT helpdesk. That call references a “security incident” and tells the target to expect an email. Alternatively, the attackers execute a subscription bombing attack, flooding the inbox with legitimate newsletters to create an IT incident.

Minutes later, the phishing email arrives – and because the target was primed, it feels more legitimate. The AI orchestrates timing, channel selection, and persona consistency across email, voice, and SMS, creating a social engineering chain that is qualitatively harder to recognize as an attack than any single-vector lure.

Full deepfake multi-persona video calls are still rare, but probably because other methods remain successful. A 10-second voice sample scraped from a public earnings call or conference recording is sufficient to clone a CEO’s voice for a fraudulent wire transfer authorization call. The asymmetry matters: one successful deepfake BEC attack generating a $25M fraudulent transfer more than justifies the investment, which is why the technique’s rarity should not be confused with low risk. From a technology standpoint, attackers have long learned how to create convincing attacks that require video authenticity tools like Pindrop & Co. to detect.

Interactive Scams and Dynamic LLMs

Once a victim engages – replies to an email, fills a form, or initiates a chat – a second AI system activates. Victim replies are routed via API into an LLM configured with a detailed persona and objective. The model reads prior conversation history, parses the victim’s emotional state and objections, and generates contextual, persuasive responses in real time. For advance-fee fraud and romance scam operations, this means a single threat actor can maintain simultaneous “relationships” with hundreds of victims indefinitely, with each conversation feeling personal and continuous.

The financial ROI is striking. What previously required a team of human operators running shifts is replaced by an API call costing fractions of a cent per response. The model never breaks character, never makes timezone errors, and never gets impatient, consistent failure modes that human operators exhibit and that trained victims sometimes catch.

Evasion and Living Off the Land

Defenders have adapted to detect malicious infrastructure – so attackers increasingly operate from trusted infrastructure. Hosting on hyperscalers, hiding behind Cloudflare’s anti-bot Turnstile protection, or even abusing new agentic AI email services. Google Drawings, SharePoint, Canva, and QR codes are abused to host redirect chains that pass URL reputation checks because the initial link is genuinely legitimate. Calendar invite phishing exploits auto-add behavior in Google Calendar to plant lures that arrive outside the classic email flow entirely.

Weaponizing Offensive AI Research and the Defender Gap

With the number of AI systems deployed in production growing, we expect phishing will soon exploit these attack surfaces as well. Prompt injection, context manipulation, and tool-call hijacking can all be used by cybercriminals to achieve their goal of sending emails and having users follow malicious links. For example, a prompt injection targeting enterprise AI assistants via a malicious document or email containing hidden instructions can manipulate a victim’s Copilot or email summarizer into suppressing security warnings, exfiltrating content, or generating deceptive summaries of legitimate alerts.

Defenders are not keeping pace. Most CISOs don’t even know how well their current email security stack blocks modern attacks, and purely hope that user awareness training prevents an impact. That blind spot is growing rapidly.

Attackers now operate at machine speed across identity, email, and endpoint simultaneously – but most SOC detection pipelines still process these as siloed signals. Closing the gap requires deploying AI detection systems with the same cross-channel memory and correlation capabilities that attackers already exploit. The organizations that will survive this shift are those that recognize the threat is no longer a human criminal using AI as a tool – it is an autonomous system running a persistent, adaptive campaign. Against that, purely human-speed defense is no longer enough.

The post The AI Phishing Revolution: From Spray-and-Pray to Autonomous Operations appeared first on IT Security Guru.

La version 8.2.0 de #PeerTube est désormais disponible ! 🥳Cette version app…

27 Maggio 2026 ore 17:45

La version 8.2.0 de #PeerTube est désormais disponible ! 🥳

Cette version apporte la possibilité de :
⏯️ mettre en pause et visualiser un direct en différé ;
👥 transférer une chaîne à un·e autre utilisateurice ;
✂️ supprimer des sections de vidéo dans le studio ;

De plus, de nombreuses améliorations ont été apportées à l'expérience utilisateurice.

Plus de détails dans la note de blog dédiée : https://joinpeertube.org/news/release-8.2

La fine del bug bounty?

27 Maggio 2026 ore 11:00

Immagine in evidenza rielaborata con intelligenza artificiale (ChatGPT)

L’applicazione dell’intelligenza artificiale nella cybersicurezza genera, da sempre, sentimenti contrastanti. Le potenzialità dell’AI rappresentano, da una parte, un’opportunità per migliorare il livello di automazione nelle attività di rilevamento e risposta agli attacchi dei criminali informatici. L’altra faccia della medaglia è rappresentata dalla possibilità che gli stessi cybercriminali ne sfruttino le capacità per aumentare l’efficacia degli attacchi.

È qualcosa che sta già accadendo e che viene messo nero su bianco, per esempio, nel Global Threat Report 2026 di CrowdStrike. Stando ai dati pubblicati dalla società di cybersecurity, gli attacchi portati utilizzando l’AI sarebbero aumentati dell’89% anno su anno.

Ma l’impatto dell’AI non si esaurisce negli attacchi veri e propri. La stessa tecnologia che li accelera sta mettendo sotto pressione, in particolare, l’ecosistema che fino a oggi ha garantito l’attività di identificazione e analisi delle vulnerabilità software. In altre parole, l’AI sta rompendo gli equilibri che per anni hanno permesso di mitigare il rischio di attacchi informatici. 

Come funziona la vulnerability discovery

Per comprendere l’impatto dell’AI in questo particolarissimo settore è indispensabile comprenderne i meccanismi. La vulnerability discovery è infatti una macchina complicata, in cui si intrecciano interessi diversi e convivono varie contraddizioni. 

Il concetto alla base del sistema è quello di individuare eventuali falle di sicurezza di software e sistemi operativi prima che questi vengano scovati dai cyber criminali. Un’attività che vede impegnate centinaia (migliaia) di aziende e ricercatori indipendenti, spesso all’interno dei cosiddetti programmi di bug bounty, cioè processi controllati attraverso i quali gli sviluppatori ricompensano economicamente chi segnala una nuova vulnerabilità potenzialmente pericolosa, permettendo loro di correggerla attraverso patch di aggiornamento. 

L’importanza del fattore tempo emerge proprio nella fase finale del processo di responsible disclosure, quando vengono rilasciati l’aggiornamento e i dettagli della vulnerabilità. È in questo momento che si apre una finestra temporale particolarmente delicata: quella in cui un cybercriminale può sfruttare la vulnerabilità creando un exploit (la tecnica che permette di portare un attacco) in grado di “bucare” i sistemi non aggiornati. 

Fino a oggi, il tempo necessario per realizzare il codice che sfrutta una falla di sicurezza per portare un attacco era, nella maggior parte dei casi, di settimane o al massimo di qualche giorno. Un margine sufficiente perché gli aggiornamenti venissero distribuiti. Di conseguenza, il rischio che qualcuno rimanesse “scoperto” era relativamente basso.

A causa degli strumenti basati su intelligenza artificiale generativa, però, le cose sono cambiate. Utilizzando l’AI è possibile realizzare un exploit con una velocità prima impensabile. Secondo i ricercatori di sicurezza Efi Weiss e Nahman Khayet, autori di un progetto dedicato, per creare un exploit con l’AI partendo da una vulnerabilità nota sarebbero sufficienti anche solo 15 minuti. 

Un’ondata di segnalazioni

Lo scorso 7 aprile, un comunicato ufficiale di Anthropic ha scosso il settore della cybersecurity. Oggetto dell’annuncio era il nuovo large language model Claude Mythos Preview, che gli sviluppatori dell’azienda californiana hanno sostanzialmente classificato come uno strumento troppo pericoloso per essere distribuito pubblicamente. Il motivo? Il nuovo LLM sarebbe in grado di individuare vulnerabilità all’interno dei software con un’efficacia senza precedenti. Rilasciarlo pubblicamente, di conseguenza, sarebbe troppo rischioso.

L’azienda ha quindi deciso di avviare un progetto, battezzato con il nome di Project Glasswing, che coinvolge un numero limitato di soggetti come Microsoft, Apple, Google, AWS, Cisco, Nvidia e Linux Foundation. Qualche controindicazione, però, è emersa quasi subito. Lo stesso giorno dell’annuncio, il 7 aprile, un gruppo riunito in un forum Discord privato è riuscito ad accedere a Mythos — non con un attacco sofisticato, ma combinando le credenziali del dipendente di un fornitore terzo con un’ipotesi azzeccata sull’URL del modello. La vicenda è emersa pubblicamente circa due settimane dopo, grazie a un’inchiesta di Bloomberg. Considerato che Mythos era stato tratteggiato come una sorta di “arma fine di mondo”, con accesso soggetto a strettissime restrizioni, non si tratta proprio di un esordio rassicurante.

Al netto del sensazionalismo dell’annuncio, che secondo molti rappresenta un marchio di fabbrica del marketing di Anthropic, la vicenda di Claude Mythos Preview si inserisce in un fenomeno più ampio, che gli esperti di sicurezza informatica stanno segnalando da tempo come estremamente problematico: la crescita esponenziale del numero di vulnerabilità segnalate.

In sintesi, il problema non è tanto la possibilità che i gruppi dediti al cyber crimine riescano a sfruttare gli LLM avanzati per individuare nuove vulnerabilità zero-day (falle di sicurezza ancora sconosciute), quanto il fatto che l’implementazione di strumenti automatizzati per l’analisi dei software sta generando troppe segnalazioni rispetto a quelle che gli sviluppatori sono in grado di gestire. 

Una cosa, infatti, è individuare una falla. Un’altra è correggere il codice per eliminare il rischio che la vulnerabilità venga sfruttata per portare un attacco. Qualsiasi aggiornamento di un software o – a maggior ragione – di un sistema operativo richiede infatti una serie di verifiche e test per validarne l’efficacia e, non ultimo, escludere eventuali conflitti o “effetti collaterali” indesiderati nel suo funzionamento. Insomma: rimediare a una vulnerabilità richiede più impegno e più tempo rispetto a sfruttarla per scopi malevoli.

Il fattore tempo

A livello intuitivo, si potrebbe pensare che questo squilibrio tra il numero di segnalazioni e la capacità di elaborarne il contenuto possa avere come conseguenza un semplice rallentamento delle operazioni. Non è così.

Per prassi consolidata, infatti, il processo di responsible disclosure prevede che al destinatario della segnalazione sia concesso un termine – solitamente di 60-90 giorni – entro il quale deve rilasciare l’aggiornamento. Trascorso il termine, chi ha inviato la segnalazione è autorizzato a rendere pubblici i dettagli della vulnerabilità.

Si tratta di un accorgimento che ha un duplice obiettivo. Il primo è quello di evitare che lo sviluppatore possa “snobbare” la segnalazione, anche solo per negare il meritato compenso del ricercatore che l’ha effettuata. La seconda è quella di ridurre il rischio che qualcun altro scopra la falla o che questa diventi pubblica per un qualsiasi motivo prima che l’aggiornamento sia disponibile. 

Anche se piuttosto rari, in passato si sono verificati casi in cui gli sviluppatori non sono riusciti a rispettare la scadenza e si sono trovati di fronte a una pubblicazione dei dettagli di una vulnerabilità quando non avevano ancora preso le dovute contromisure. Nel nuovo scenario, in cui le segnalazioni piovono a una velocità impressionante, rispettare le scadenze rischia di diventare molto più difficile.

I primi scricchiolii

La cronaca recente conferma tutti i timori legati al massiccio impiego dell’AI nell’individuazione delle vulnerabilità. La società di cybersecurity HackerOne ha sospeso il suo programma Internet Bug Bounty (IBB), attività finanziata in crowdfunding che gestisce dal 2013. Il motivo? L’eccessivo numero di segnalazioni stava mettendo in difficoltà chi ha il compito di correggere il codice del software. E questo soprattutto in ambito open source, dove la gestione dei progetti è spesso affidata a programmatori che prestano la loro opera a titolo volontario. 

La pagina web di HackerOne è un perfetto riassunto dei problemi che vive il settore. Nelle sue policy, spiega che ricompenserà solo quelle vulnerabilità che “siano state segnalate in modo responsabile, riconosciute, analizzate (triage), risolte e divulgate tramite un Security Advisory o una CVE (Common Vulnerabilities and Exposures, un sistema di catalogazione pubblico e standardizzato delle vulnerabilità di sicurezza informatica note – ndR). Se una vulnerabilità viene segnalata da più persone ed è riconosciuta all’interno del security advisory, solo il primo segnalatore (come identificato dai maintainer del progetto) avrà diritto alla ricompensa”.

In questo passaggio si leggono tutte le criticità legate a un ecosistema che è ormai andato fuori controllo. Traducendo dal “politically correct” adottato nelle policy, HackerOne ammette di trovarsi in una situazione in cui vengono segnalate vulnerabilità che non sono state sufficientemente approfondite, che in molti casi vengono scovate da più soggetti e per le quali non viene fornita una soluzione. Insomma: si trova ad avere a che fare con troppo “pattume” generato dall’AI. Motivazioni simili hanno indotto la piattaforma Bugcrowd a introdurre una serie di regole e restrizioni per contrastare il fenomeno che hanno battezzato come “sloptimism” (segnalazioni basate su AI inviate con troppa fiducia e poca verifica). 

L’AI trova vere vulnerabilità?

Guardando più nel dettaglio il fenomeno, emerge anche un altro dato. A gennaio 2026 i volontari che gestiscono cURL – software open source che gestisce lo scambio di dati con Internet e che, pur sconosciuto al grande pubblico, è installato in miliardi di dispositivi (telefoni, automobili, TV) – hanno annunciato che dal mese successivo avrebbero smesso di accettare segnalazioni tramite HackerOne. In un aggiornamento pubblicato ad aprile, il creatore Daniel Stenberg ha diffuso un grafico da cui emerge una tendenza abbastanza chiara: nonostante da febbraio non sia stata accettata alcuna segnalazione, il totale del 2026 era già arrivato a 87.

Al di là della crescita esponenziale di segnalazioni, spicca il fatto che nel 2025 sono stati registrati numerosi report classificati come “likely AI slop” (probabile pattume AI), cioè vulnerabilità di bassissimo impatto o inventate dall’intelligenza artificiale. Il loro numero, però, è diminuito percentualmente nel corso dell’anno successivo.

Prima di considerare questi dati come confortanti, è però opportuno considerare un altro aspetto: non tutte le vulnerabilità validate rappresentano un reale rischio di sicurezza. Come spiega Naz Bozdemir in un post sul blog di HackerOne, delle 22 vulnerabilità individuate da Claude Opus 4.6 nel codice di Mozilla Firefox – 14 delle quali ad alta gravità – soltanto due si sono rivelate effettivamente sfruttabili per costruire un exploit. In altre parole: erano tutte difetti reali, ma solo due rappresentavano un rischio imminente e concreto.

L’idea che una maggiore efficienza porti automaticamente a più sicurezza, alla fine, si sta rivelando un’illusione. L’uso intensivo dell’AI sta dimostrando esattamente il contrario: senza la capacità di selezionare, comprendere e intervenire, rischia di generare semplicemente caos.

L'articolo La fine del bug bounty? proviene da Guerre di Rete.

❌