Reading Time: 5 minutes

Fare impresa e fare ricerca si incontrano nel Progetto di Alta Formazione “artificial INtelligence Text Enrichment foR impROving biG dATa procEssing” (INTERROGATE).

Bando ufficiale del progetto

È disponibile online il documento ufficiale del progetto. Scaricalo per conoscere maggiori dettagli, requisiti e modalità di iscrizione.

“Le idee innovative sono state frutto di percorsi condivisi e della abilità di combinare intuizioni di diversa origine e provenienza” (Enrico Moretti, “La nuova geografia del lavoro”).

Ci sono molti modi di fare ricerca, ed altrettanti luoghi, tempi, strumenti per sviluppare idee brillanti e la storia della innovazione non è stata scritta da ricercatori solitari e da colpi di genio estemporanei e “disruptive”.

Se la mente connessa è il vero motore della innovazione e del trasferimento tecnologico, razionalizzare e fare rete sono le parole d’ordine per ridisegnare i processi di innovazione all’interno del mondo della Ricerca, dell’Università e delle realtà imprenditoriali. Partendo dalla duplice riflessione:

  • sul ruolo che la Ricerca & Sviluppo può avere nel far compiere al sistema Italia il salto di qualità verso un modello economico sostenibile, trainato dalla ricerca e dall’innovazione,
  • sull’impegno necessario al raggiungimento dell’autonomia tecnologica per l’Italia e l’Europa,

oggi è più che mai necessaria una stretta collaborazione tra Imprese, Università e Ricerca per creare una comunità allargata dentro la quale far circolare idee, far germogliare l’innovazione dando linfa anche a progetti di carattere imprenditoriale.

Il binomio sapere è potere è sempre più decisivo per le aziende che, grazie alle tecnologie digitali, devono cavalcare la quarta rivoluzione industriale ed essere capaci di cambiare in modo drastico la loro competitività, produttività ed efficienza.

La disponibilità di informazioni generata dai vari ecosistemi digitali di oggi sembra apportare solo vantaggi, la loro analisi può restituire preziosissimi business insight, ma:

  • i dati nella loro forma grezza non sono di alcuna utilità;
  • l’incremento della quantità di informazioni disponibili aumenta in proporzione anche gli sforzi che occorrono per riuscire a separare l’utile dall’inutile
  • un’importante porzione di questi dati è interamente testuale, non aggregabile e memorizzata spesso solo per motivi di compliance.

Tali difficoltà, soprattutto se si considera la proporzione esistente tra informazioni strutturate e non strutturate, portano alla forte richiesta di software in grado di processare documenti contenenti informazioni non strutturate ma l’offerta di tali software è per ora estremamente limitata.

Il contributo di Seacom a innovazione, ricerca e formazione

Seacom da tempo si muove nell’ecosistema dell’innovazione toscana tra Ricerca/Alta Formazione, offrendo attivamente il proprio contributo per promuovere/innescare il trasferimento tecnologico in un sistema inclusivo e dinamico che coniughi la domanda e l’offerta di conoscenze tecnologiche all’affermazione di buone idee di business ed allo sviluppo della nuova imprenditorialità technology-driven.

Mettiamo regolarmente a disposizione la nostra competenza sulle Architetture di Big Data Management, in questa occasione uniamo il supporto economico alla Ricerca ed all’Innovazione, collaborando all’attivazione del Bando di Ricerca a selezione pubblica per il conferimento di:

n. 1 “Assegno di ricerca Grant” per il progetto dal titolo: “artificial INtelligence Text Enrichment foR impROving biG dATa procEssing” (acronimo INTERROGATE)  e la tematica  “Studio e sviluppo di algoritmi di Intelligenza Artificiale per Text Mining e Big Data Analytics”

Il progetto, di durata biennale, inerente all’Area Scientifica “Cyber Intelligence“, sotto la responsabilità scientifica del Prof./Dott. Maurizio Tesconi, sarà svolto in collaborazione tra CNR – Istituto di Informatica e Telematica e Seacom srl ed è cofinanziato dalla Regione Toscana nell’ambito delle attività GiovaniSì e dalla stessa Seacom.

Si svolgerà presso Seacom e presso l’Istituto di Informatica e Telematica del CNR, sede di Pisa.

Seacom collaborerà al progetto supportando gli assegnisti coinvolti nel percorso formativo-lavorativo (che prevede periodi di lavoro in azienda alternati a momenti di confronto e formazione di tipo accademico) portando il valore aggiunto delle proprie competenze tecniche ed imprenditoriali, sostenendo le capacità di innovazione dei ricercatori senza però tralasciare l’obiettivo di implementare una soluzione che permetta una facile evoluzione ed adattamento ai diversi reali scenari di business che sono interessati a soluzioni software ed architetturali di questo tipo.

Il progetto di ricerca INTERROGATE

Partendo dallo scenario descritto sopra, in cui si muovono le aziende oggi, l’obiettivo del progetto INTERROGATE è definire un’architettura Big Data, basata su soluzioni opensource, che consenta di applicare avanzati modelli di Text Mining a grandi quantità di dati in modo scalabile.

Tali modelli, basati sulle più innovative tecniche di AI (deep learning), arricchiranno le risorse testuali con nuove informazioni strutturate, allo scopo di abilitare inedite e potenti funzionalità di ricerca, aggregazione ed analisi.

Quindi gli obiettivi operativi del progetto sono due:

  1. Progettazione e implementazione dell’Architettura Big Data;
    2. Studio e implementazione dei modelli di Text Mining.

La portata innovativa del progetto, dal punto di vista scientifico e tecnologico, risiede sia nella implementazione di nuovi modelli di:

  1. a) Authorship Attribution, per individuare e caratterizzare gli autori dei documenti;

    b) Zero-Shot Learning, per caratterizzare i documenti in base ai topic di interesse, all’orientamento politico, al sentiment, etc., evitando onerose procedure di annotazione manuale;
    c) Named Entity Recognition & Disambiguation, per caratterizzare i documenti sulla base della pertinenza geografica, o rispetto a specifiche persone, aziende, organizzazioni, etc;

sia nella sfida tecnologica rappresentata dal dover far agire questi modelli con grandi volumi di dati (Big Data).

A questo scopo, la piattaforma sarà sviluppata con standard aperti e componenti opensource secondo uno schema modulare che permetta una facile evoluzione e adattamento a diversi scenari.

 

La domanda di partecipazione dovrà essere inviata entro il 10 giugno 2022 unicamente rispettando le indicazioni e le modalità descritte nel bando sotto linkato.