Il mese scorso l’EUIPO (European Union Intellectual Property Office) ha pubblicato un discussion paper, dal titolo Existing technologies and their impact on IP, nel quale elenca le tecnologie, e relative proprietà, per il riconoscimento di opere dell’ingegno[1].
L’utilizzo (la trasmissione, diffusione e condivisione) di opere protette non è consentito se non dietro pagamento del diritto d’autore e dei diritti connessi ai loro rispettivi titolari, e cioè, oltre agli autori, ai produttori, alle emittenti, agli artisti, agli interpreti e agli esecutori[2]. Tale elementare principio (ovvero la remunerazione della propria attività creativa, artistica o imprenditoriale) è tuttavia continuamente minacciato soprattutto grazie ai dispositivi digitali di cui tutti facciamo continuo uso; da un lato perché le opere circolano e sono accessibili da ciascuno con enorme facilità, dall’altro perché diventa sempre più difficile attribuire correttamente i diritti (i compensi) a coloro cui davvero spettano secondo principi di proporzionalità e trasparenza.
Peraltro, i criteri per remunerare correttamente l’utilizzo di un’opera sono molto articolati e dipendono da una serie di fattori di cui non sempre si ha contezza. Un brano musicale trasmesso su una rete televisiva, per esempio, ha un valore a seconda del giorno e dell’orario di trasmissione, della durata e del contesto in cui è trasmesso (colonna sonora di un varietà, performance di un artista, sottofondo di una sigla, ecc.).
Da quanto precede si comprende perché le soluzioni tecnologiche per il riconoscimento delle opere sono di massima attualità, soprattutto nell’odierna società dell’informazione. Si pensi che il volume di affari legato alla raccolta dei diritti per equo compenso in Italia è di circa 50 Mln l’anno. In Germania, grazie ad un evidente miglior sistema di monitoraggio, è circa otto volte superiore. C’è da credere quindi che con dei buoni sistemi di riconoscimento dei contenuti il mercato nostrano potrebbe crescere in modo ragguardevole.
Cosa vuol dire Automated Content Recognition
L’Automated Content Recognition (d’ora innanzi, ACR) è, come dice la traduzione stessa, il riconoscimento automatico dei contenuti, cioè la capacità di un sistema automatizzato di riconoscere l’opera utilizzata – tipicamente un brano musicale o una sequenza di immagini in movimento – trasmessa su un canale.
Si tratta quindi di una tecnologia, o una combinazione di tecnologie, capace di fare tre cose: (i) percepire un’opera (ascoltarla o vederla, a seconda del tipo); (ii) confrontarla con un catalogo di opere a disposizione, (iii) cogliere elementi di identità o similitudine e, infine, (iv) attribuirle un’identità univoca.
È quindi necessario che un ACR non solo disponga di buone orecchie e occhi, ma anche di una vasta banca dati a cui attingere le opere di confronto, ciascuna di esse corredata con dati di attributo (etichetta, artista, performer, ecc.).
Come accennato, lo scopo dell’ACR è poi quello di associare all’opera così riconosciuta una serie di informazioni circa l’utilizzo (es.: durata, tempo, canale) e il contesto (ambito di trasmissione ed utilizzo) in modo da poter individuare correttamente i soggetti tenuti alla corresponsione dei compensi, determinare l’entità di tali compensi e identificare i soggetti aventi diritto ad essi.
Panoramica delle tecnologie
Il paper in commento espone 4 tecnologie (di cui l’ultima è in realtà un dominio di tecnologie riferibili a soluzioni di IA e riconoscimento avanzato) che non descrivono propriamente altrettante sistemi di ACR, ma solo alcuni elementi sui quali questi fondamentalmente si basano. Ma andiamo con ordine.
Hashing. È una tecnica utilizzata solo per opere digitali. Le opere attraverso l’esecuzione di uno specifico algoritmo vengono “ridotte” ad una stringa alfanumerica univoca (impronta hash, o digest).
- Pro. È di facile gestione poiché non richiede la conservazione delle opere di confronto, ma solo delle loro impronte. Per tale ragione anche l’operazione di comparazione non richiede grandi capacità di calcolo.
- Contro. Non è applicabile ad opere analogiche. Inoltre, piccole variazioni dell’opera impediscono il match delle impronte hash e quindi il riconoscimento. L’hashing è quindi applicabile solo per determinate opere e in determinate circostanze.
Watermarking. È una tecnica utilizzata per opere digitali o analogiche. In ciascuna copia dell’opera è inserito un marker in modo indelebile sicché è sufficiente riconoscere il marker per riconoscere con esso l’opera e altre informazioni di contesto (per esempio il canale di trasmissione e il titolare dei diritti)[3]. Il watermark può essere inserito a livello del network, del server o del singolo device[4].
- Pro. Riconoscere le opere non richiede grande capacità computazionale né di avere a disposizione il catalogo delle opere di confronto.
- Contro. In certi contesti inserire il watermark in ogni singola opera può richiedere l’impiego di grandi risorse. Esistono inoltre diverse tecniche per rendere i watermark irriconoscibili e quindi inutili.
Fingerprinting. È una tecnica simile all’hashing, ma utilizzata per opere sia digitali che analogiche. Si tratta di isolare e associare tra loro alcuni specifici elementi di un’opera che la caratterizzano in modo univoco. Tali elementi costituiscono un’impronta univoca dell’opera che consente il riconoscimento.
- Pro. È utilizzabile anche in caso di differenze tra l’opera comparata e quella di comparazione (un differenza che naturalmente mantiene ancora un’unica identità creativa tra le due copie)[5]. La base dati di referenza può essere ridotta in quanto non deve contenere le opere nella loro interezza, ma solo gli elementi di fingerprinting che le caratterizzano. La capacità computazionale per la comparazione è quindi molto bassa.
- Contro. Il fingerprinting richiede maggiori risorse computazionali rispetto all’hashing o al watermarking. Più il fingerprint à robusto e complesso più le risorse necessarie per generarlo, archiviarlo e verificarlo sono elevate. Per generare un fingerprint si deve solitamente ricorrere ad algoritmi proprietari per cui la costituzione di un catalogo di referenza può essere piuttosto costosa.
AI-Based / Enhanced content recognition. Le tecnologie AI replicano il funzionamento (o il risultato del funzionamento) della mente umana. L’IA non solo vede e ascolta un’opera, ma “comprende” ciò che vede e ascolta e comprime tale comprensione in una forma che può essere facilmente utilizzata per operazioni di comparazione.
- Pro. Le tecnologie AI-based e di enanched recognition riconoscono le opere anche se sono “sporche” o se addirittura assumono una diversa forma espressiva. Esse possono altresì riconoscere i contesti di utilizzo. Non occorre una banca dati di referenza contenente le opere, né occorre marcare ciascuna copia dell’opera (watermarking)[6].
- Contro. L’AI richiede un grande impiego di risorse computazionali. Le soluzioni AI richiedono grandi investimenti per lo sviluppo e sono quindi disponibili solo dietro pagamento di licenze a grandi operatori.
Alcune riflessioni
La tecnologia è senz’altro importante, ma altrettanto importante è disporre delle informazioni riguardanti le opere e il contesto di utilizzo: a nulla serve riconoscere un brano musicale, cioè associarlo ad un titolo e magari ad una etichetta di origine, se non si sa chi sono gli attuali titolari dei diritti e in che occasione l’opera è stata utilizzata. Ma anche queste informazioni sono di poco aiuto se non si conoscono i criteri di remunerazione della collecting a cui è stata affidata la gestione dei diritti in modo da poter sindacare le ripartizioni effettuate.
Per la giusta remunerazione dei diritti serve quindi una ricetta molto complessa. Occorre infatti aver una rete di monitoraggio dei canali, disporre di un repertorio di referenza vasto, ricco di informazioni e soprattutto aggiornato[7]. La tecnologia ACR è solo un complemento di tutto questo, necessario ma niente affatto risolutivo.
EUIPO – Automated Content Recognition: Discussion Paper – Phase 1 ‘Existing technologies and their impact on IP’Francesco Rampone – f.rampone@lascalaw.com
© RIPRODUZIONE RISERVATA
[1] Si tratta della prima di due parti. La seconda sarà pubblicata nel secondo trimestre 2021.
[2] Non è solo questione di remunerazione delle opere, ma anche di loro legittimità intrinseca o nell’uso. Alcune opere infatti non posso essere diffuse o comunque utilizzate per scopi commerciali in quanto costituiscono plagio o contraffazione.
[3] Un watermarker è per esempio il logo del canale televisivo impresso in un angolo del display. Una qualsiasi copia di una trasmissione del canale reca con sé anche l’indicazione dell’emittente titolare dei diritti.
[4] Con il watermarker non serve un catalogo di confronto poiché quantomeno la paternità dell’opera è inscritta direttamente nel watermarker stesso. Tuttavia, un ACR dovrà comunque poi fare riferimento ad un data base per associare il watermark ad un titolare.
[5] Gli ACR con fingerprint pià avanzati possono perfino riconocere una melodia in una versione cover di un altro artista.
[6] Poiché la tecnologia AI-based opera sul piano della semantica essa è utilizzabile anche per i contenuti inediti contrari all’ordine pubblico e buon costume che possono essere filtrati da un ACR AI-based.
[7] Per sua natura, una banca dati prontamente aggiornata contente tali informazioni si presta perfettamente ad una soluzione blockchain. Servirebbe tuttavia che i gestori dei diritti cooperassero per mettere a fattor comune i rispettivi repertori. Cosa che ahimè in Italia, paese che viene da una situazione di monopolio durato oltre un secolo, non pare ancora possibile.