fbpx

Il lavoro concreto sui dataset ci accompagna come un filo rosso anche in questo weekend di transizione: venerdì mattina, con il secondo intervento di Oneydata, si chiude infatti il terzo modulo del percorso formativo, mentre nel pomeriggio muoviamo i primi passi nel quarto, dedicato a Data Mining e Text Mining.

Il Dott. Manfroni e il Dott. Coniglio tornano in aula per proseguire il lavoro che guida i partecipanti nello sviluppo di un Project Work che porterà all’erogazione di un premio di studio del valore di 4000€.

Nel tempo trascorso dalla prima lezione curata da Oneydata, anche i docenti hanno lavorato sui dati condivisi contribuendo a una loro revisione, per poter rendere il lavoro dei partecipanti ancora più interessante.

Quali operazioni è possibile e interessante effettuare su questi dataset?

Distribuzione, regressione, analisi fattoriale… dalle mani alzate dei partecipanti prendono vita diversi punti di vista, a seconda degli obiettivi di progetto.

Per preparare al meglio il Project Work, però, è necessario anche approfondire R: un ambiente di sviluppo e anche un linguaggio di programmazione adatto all’analisi statistica dei dati.
Ci impegniamo, quindi, in un esercizio: benché non sarà necessario scrivere codice per portare a termine il nostro lavoro, è sempre utile vedere come esso si generi e capirne grammaticasintassi.

Nel pomeriggio, inauguriamo il quarto modulo del Master con una lezione del Prof. Francesco Della Beffa che ci introduce ai temi principali di questa nuova tappa del percorso.

Affrontiamo, così, i Sistemi di Raccomandazione, ovvero quelle tecniche che consentono di fornire agli utenti consigli personalizzati.

Partiamo dall’Utility Matrix che va popolata e poi ci addentriamo nelle diverse tipologie di algoritmi di raccomandazione:

  • collaborativi
  • content-based
  • ibridi

Come ci hanno insegnato questi mesi di lezione, però, c’è sempre una domanda importante da porsi:

Qual è la ‘scarriolata di problemi’ (sic!) dei Sistemi di raccomandazione?

Insomma, esaminiamo le criticità dei vari approcci per comprendere meglio l’utilità.

Tra le questioni che emergono attraverso le case history troviamo, ad esempio, quella relativa a Popularity bias Filter bubble, ovvero la tendenza a raccomandare sempre gli articoli più popolari o graditi.

Questione superata dal Washington Post che, dal Watergate, ha sempre fatto scuola.
L’algoritmo che distribuisce i contenuti agli utenti del quotidiano online fa sì che una parte venga scelta, in effetti, in base agli interessi del lettore, un’altra invece proprio tra contenuti inusuali o di opinioni politiche contrapposte.

Altre problematiche dei Sistemi di Raccomandazione riguardano la Privacy, la Cold-start, la Profilazione corretta degli articoli, gli Attacchi Informatici o le Novità in catalogo che non hanno ancora uno storico di vendita e valutazione… analizziamo ciascuna attraverso casi di studio in settori diversi: dalla grande distribuzione alla web radio, dalle community di gamers al turismo.

Salutiamo il Prof. Della Beffa con qualche anticipazione sul Text Mining ma la nostra giornata ha dell’altro in programma: un appuntamento conviviale a seguito di un’inaspettata avventura.

Appena usciti dalla lezione ci dedichiamo alla Caccia al Mazzo: sembrano essersi volatilizzate, infatti, le chiavi (macchina + casa) di un partecipante.

Che ci sia un ‘topo d’aula’ all’interno del master DMBA?
Impossibile.

Perché quando lo ‘spirito di corpo‘ chiama, i partecipanti del DMBA rispondono. Eccome!
Qualcuno passa l’aula palmo a palmo; altri accompagnano lo sfortunato in reception, in mensa o al bar; chi offre un passaggio a casa per prendere le chiavi di riserva; altri partecipano telefonicamente; alcuni frugano nelle tasche e nelle sacche con il logo dell’Università… Ecco, sì: le sacche tutte uguali.

Aver frequentato le lezioni per tre weekend di fila lascia il segno anche nei più inossidabili tra noi: abbiamo confuso le sacche e ce ne accorgiamo dopo una mezz’oretta.

Comunque sia… tutto è bene quel che finisce in aperitivo. E infatti così succede.

 

Qualche ora di relax ed è già sabato mattina.
Incontriamo nuovamente il Prof. Bruno Sfogliarini che darà avvio alla prima lezione sul Data Mining e, in particolare, su Nearest Neighbour e Regole associative.

È possibile che in un dataset manchino dei dati e che quindi sia necessario dedurli da altre informazioni, ad esempio quelle che derivano da profilazioni basate su caratteri strutturali come genere, età, titolo di studio… è proprio in questa situazione che utilizziamo i Nearest Neighbour.

Guidati dal Prof. Sfogliarini prendiamo prima in esame il caso più semplice, in cui il ‘vicino più vicino’ è uno solo, dopodiché passiamo a quello in cui i vicini sono un numero ‘k’.

Ma come riuscire a selezionare il numero più utile di vicini?

Le slide parlano chiaro: “Pick K not too large, but not too small” 😀

La seconda parte della lezione è eminentemente pratica e dedicata alle Regole associative.
Detto à la Sfogliarini: com’è che compriamo, nella stessa spesa, più spesso la coppia “pane e Nutella” piuttosto che quella “branzino e Nutella”? (sic!)

Con nostra grande gioia, per l’esercitazione, dobbiamo ficcare il naso nei carrelli della spesa.
Ci immaginiamo subito nel supermercato di in un paese nordico vista la grande popolarità delle aringhe e ci stupiamo del fatto che molti acquistino, contestualmente al pesce, della carne in scatola… ma ricette cucineranno!? 😮

Tra le due parti della lezione, però, c’è spazio per una digressione interessante e appassionante:

Società dei Sogni, Umanità Creativa e Anacronomia. Il futuro della società visto dal CIFS

Ci chiediamo, insomma, dove stiano andando la società dei consumi e, con essa, i consumatori in un’ottica storica e di scenario.

All’interno della storia della società dei consumi è possibile individuare diverse età, ognuna con la sua propria logica:

  • materiale: in cui il bene principale è un prodotto
  • immateriale: il valore fondamentale è quello dell’esperienza che viene generata dal consumo di un prodotto e che poi viene condivisa
  • dell’umanità creativa: la socialità cambia con il web 2.0, il consumatore non è più uno spettatore del mercato e può mostrare se stesso al mondo in un click
E poi?

Domandarsi in quale direzione si stia andando è lecito per chi si occupa di Predictive Analysis e non solo.
L’unica risposta possibile è quella che chiama in causa l’età della trasformazione che, almeno parzialmente, è già in atto.
La personalizzazione è sempre più spinta: la logica sottostante è quella di un’azione su se stessi per puntare alla perfezione di sé e del servizio.
Per fare qualche esempio, parliamo di chirurgia estetica o della possibilità di installare chip che rilasciano insulina.

I partecipanti riflettono sull’intrecciarsi di queste età nel presente, ne nasce una discussione interessante che dimostra quanto, sul serio, lo spirito di gruppo dei partecipanti di questa edizione sia davvero qualcosa di speciale… un po’ come l’Effetto Napoli. 😉

Richiedi la Ricerca

Indagine sul livello di adozione e utilizzo dell'Intelligenza Artificiale in Italia

Privacy Policy

You have Successfully Subscribed!