La prima volta che ho scritto qualcosa a ChatGPT, è cambiato tutto. Un'idea in testa, due ore dopo funzionava. Non su una slide — per davvero.
Da lì non mi sono più fermato.
La prima volta che ho scritto qualcosa a ChatGPT, è cambiato tutto. Un'idea in testa, due ore dopo funzionava. Non su una slide — per davvero.
Da lì non mi sono più fermato.
Il mio percorso non è stato lineare. Per fortuna.
Ho iniziato a 19 anni in un reparto farmaceutico. Impianti, pompe, linee di produzione. Cose che o vanno o si fermano. Lì ho capito che i processi non ascoltano le intenzioni.
Nel frattempo studiavo — corso serale all'Università Cattolica. Poi ho lasciato la fabbrica e ho cambiato mondo. GDO, PwC, la fiduciaria Saffi. Ogni volta un pezzo in più del puzzle.
Oggi sono in FinecoBank, nel procurement. Seguo i fornitori di dati e informazioni per il mondo finanziario.
A un certo punto ho iniziato a costruire cose. Non per teoria — per curiosità. Per vedere se stavano in piedi.
In Saffi ho messo le mani su progetti veri: estrazione dati da documenti, analisi di riunioni con AI, immagini satellitari per il fotovoltaico. Tutto da autodidatta.
Poi mi sono detto: facciamo sul serio. Master in AI e Agenti AI per il Business — un anno, 27 progetti su casi reali.
Questo sito è un po' come il lievito madre. Lo alimenti, lui cresce da solo.
Ricordi l'idea in testa di cui parlavo? Eccola. Un agente che scarica notizie, le filtra con AI e le pubblica. Un chatbot che risponde su di me e ti prenota un appuntamento. Un backend che gira, impara, si aggiorna — anche quando dormo.
L'immaginazione che prende forma.
Un sito che si aggiorna da solo. L'agente legge 11 fonti tech, sceglie le notizie migliori, scrive articoli e li pubblica. Il chatbot risponde ai visitatori e prenota appuntamenti via Telegram. Tutto gira senza intervento umano.
DuoMem introduce un framework di distillazione dual-space per trasferire capacità di memoria da LLM grandi a modelli piccoli per dispositivi edge. Permette agenti capaci di eseguire task procedurali complessi su hardware limitato, mantenendo prestazioni vicine ai modelli grandi.
Il paper introduce DramaSR-532K, un benchmark su larga scala per il riconoscimento dei parlanti in serie TV lunghe. Mostra come l'uso di LLM con capacità di reasoning migliori significativamente l'attribuzione dei dialoghi ai personaggi, superando i metodi tradizionali di speaker diarization.
Il paper AutoMem tratta la gestione della memoria nei LLM come una skill addestrabile, ispirandosi alla metamemoria umana. Il modello impara quando codificare, recuperare e organizzare la conoscenza, promuovendo le operazioni su filesystem a azioni di memoria di prima classe.
Il repository HUANGCHIHHUNGLeo/claude-real-video (572 stelle) permette a Claude o qualsiasi LLM di analizzare video da URL o file locale. Estrae frame scene-aware deduplicati e trascrizione, funziona interamente in locale con licenza MIT. Risolve il problema della comprensione video per i modelli linguistici.
Il repository GitHub op7418/guizang-ppt-skill ha raggiunto quasi 20.000 stelle. Si tratta di un AI-agent skill che genera presentazioni HTML di alta qualità, con layout editoriali e svizzeri, prompt per immagini, copertine social e un runtime di presentazione WebGL a basso consumo. Supporta Claude Code e Codex.
Le news vengono aggiornate automaticamente durante il giorno.
Ti occupi di AI, automazione o dati? Scrivimi.
Anche solo per scambiare due idee. Le migliori sono venute così.