Quando ero al telefono con un robot: come l'intelligenza artificiale sta conquistando il telefono e come riconoscerla

Ci sono momenti della vita quotidiana che all'inizio sembrano del tutto banali. Siete seduti alla vostra scrivania, state lavorando a un articolo, state pensando a un nuovo argomento e all'improvviso squilla il telefono. Un numero che non riconoscete. Nel mio caso si trattava di un prefisso della Ruhr: 0233 qualcosa. Come lavoratore autonomo, di tanto in tanto si ricevono telefonate di questo tipo. Di solito si tratta di pubblicità, servizi o consulenze di cui non si ha effettivamente bisogno.

All'inizio ho risposto alla chiamata come al solito. Dall'altra parte ha risposto una voce femminile amichevole. Si è presentata come un'impiegata che lavora con Facebook e Instagram. Non sorprende che si trattasse di pubblicità. Di pubblicità. Di visibilità per le aziende. Visibilità per le aziende.


Problemi sociali del presente

La conversazione è iniziata esattamente con lo stesso tono di voce che conosciamo in queste telefonate. Educato, professionale, un po' provato. Mi spiegò che oggi molte aziende hanno difficoltà a raggiungere nuovi clienti. Soprattutto nel settore delle piccole e medie imprese - il cosiddetto settore delle PMI - la pubblicità online è un fattore decisivo. Facebook e Instagram offrono enormi opportunità per raggiungere potenziali clienti.

Mentre parlava, all'inizio ascoltavo normalmente. Non c'era nulla di insolito. La voce sembrava umana, naturale, persino con un leggero dialetto del sud della Germania. Questo rendeva il tutto più simpatico che invadente. Non sembrava un tradizionale call center di qualche parte del mondo, ma piuttosto qualcuno che stava chiamando dalla Germania.

Di solito queste conversazioni seguono sempre lo stesso schema. A un certo punto, arriva il momento in cui la persona chiamata spiega perché l'offerta non è rilevante per lei. Ed è esattamente quello che ho fatto io.

Le ho detto che in fondo capivo cosa intendeva, ma che per me i social media hanno un ruolo secondario. Il mio lavoro principale è altrove. Gestisco una casa editrice, lavoro su articoli, libri e sulla mia rivista. I social media sono più che altro uno spettacolo secondario. Possono essere utili, ma non sono il fulcro del mio lavoro. Gliel'ho spiegato con relativa calma.

Inizialmente ha reagito come ci si aspetterebbe. Ha ascoltato, ha confermato brevemente e poi ha continuato la conversazione. A questo punto ha iniziato a descrivermi un'offerta specifica. Si trattava di una campagna pubblicitaria specifica per le aziende. Si diceva che fosse in grado di raggiungere una visibilità di circa cinquemila potenziali clienti. Mi parlò dell'importanza della presenza digitale, di come le aziende potessero aumentare la loro portata e di come Facebook e Instagram le avrebbero aiutate a raggiungere nuovi gruppi target.

Il contenuto in sé non era sorprendente. Chiunque abbia mai parlato con agenzie di marketing conosce queste frasi. Ma qualcosa nel modo in cui parlava cominciava a irritarmi. Il tono di voce sembrava improvvisamente un po' diverso. Sembrava che stesse leggendo qualcosa ad alta voce. Non necessariamente ovvio. Ma in qualche modo troppo scorrevole, troppo strutturato, troppo perfettamente formulato. Era come se stesse facendo una presentazione, frase per frase.

Telefonata con l'IA

Ho continuato ad ascoltare e all'inizio non ho pensato ad altro. Forse aveva davvero un modello davanti a sé. Dopo tutto, molte riunioni di vendita si svolgono esattamente così.

Così ho risposto nuovamente alle loro dichiarazioni. Ho spiegato ancora una volta che comprendevo il loro punto di vista, ma che al momento non avevo bisogno di tali annunci. Il mio lavoro funziona in modo diverso. Costruisco contenuti, scrivo articoli, sviluppo argomenti a lungo termine. I social media possono aiutare in questo senso, ma non sono la leva centrale.

Mentre lo dicevo, è successo qualcosa di interessante.

C'è stata una breve pausa. Solo per circa un secondo.

Poi arrivò una risposta che corrispondeva al contenuto di ciò che avevo appena detto. Ha detto che evidentemente avevo già una certa presenza sui media e che quindi forse le priorità erano diverse. Se qualcuno ha già una certa presenza sui media, la pubblicità è ovviamente una decisione diversa rispetto alle aziende che hanno appena iniziato.

La frase si adattava sorprendentemente bene a ciò che avevo appena detto. Ma allo stesso tempo suonava di nuovo strana. Di nuovo quel tono leggermente preletto. Di nuovo quella struttura che sembrava un testo preparato.

In quel momento ho iniziato ad ascoltare più attentamente. Perché all'improvviso è sorta una domanda molto semplice. Se sta davvero leggendo un copione, da dove viene questa risposta che risponde in modo così preciso alle mie affermazioni? Ha davvero centinaia di fogli di testo diversi davanti a sé, che seleziona a seconda dell'andamento della conversazione? O c'è qualcos'altro sotto?

Mentre ci pensavo, ho notato un'altra cosa. Il flusso della conversazione era stranamente uniforme. Non c'erano reazioni spontanee, né piccoli lapsus, né formulazioni improvvisate. Tutto suonava incredibilmente pulito, quasi troppo pulito.

E all'improvviso mi si affaccia alla mente una nuova possibilità. Forse non sto affatto parlando con una persona. Forse all'altro capo del filo non c'è una persona vera, ma un sistema. Una voce artificiale. Un'intelligenza artificiale.

All'inizio l'idea sembrava assurda. Ma più ci pensavo, più diventava plausibile. Perché una cosa non quadrava: Le risposte sembravano contemporaneamente adattate e come se fossero state lette. Come se qualcuno avesse capito quello che stavo dicendo, ma continuasse a ricorrere a moduli di testo preparati.

Ho iniziato a chiedermi quanti sistemi di questo tipo esistano oggi. Quante conversazioni potrebbero avvenire non più tra persone, ma tra persone e macchine. Ed è stato proprio in questo momento che ho deciso di porre una domanda molto semplice.

Una domanda che risolverebbe immediatamente il mistero.


Articoli attuali sulla Germania

Il momento della verità

In quel momento mi è venuto in mente questo pensiero: forse non sto affatto parlando con una persona. Più ci pensavo, più i dettagli della conversazione andavano improvvisamente al loro posto. I brevi ritardi dopo le mie risposte. Il modo stranamente uniforme di parlare. Le frasi che sembravano individuali allo stesso tempo, ma che avevano sempre questo carattere leggermente preletto.

Era come se un puzzle si stesse componendo lentamente. Così ho deciso di risolverlo subito. Niente test complicati, niente domande a trabocchetto. Solo una domanda semplice e chiara. Interruppi brevemente la conversazione e dissi:

„Ho un'altra domanda“.“

All'altro capo del filo, ci fu un'altra breve pausa. Non lunga, forse un secondo. Ma abbastanza lunga da permettermi di riconoscerla consapevolmente. Poi feci la domanda che ormai avevo sulla punta della lingua:

„Sto parlando con un umano o con un robot?“.“

Era una domanda molto diretta. In realtà una domanda a cui una persona potrebbe rispondere senza problemi. Ci si aspetterebbe che qualcuno rida, magari reagisca un po' irritato o semplicemente dica: „Certo che stai parlando con me“.“

Ma è esattamente quello che non è successo. Abbiamo invece ricevuto una risposta che inizialmente sembrava evasiva.

La voce mi ha detto che poteva garantire che una persona reale mi avrebbe contattato se fossi stato interessato a una consulenza. Avremmo potuto discutere insieme le opzioni più adatte alla mia azienda.

La risposta sembrava cortese. Professionale. Ma non rispondeva alla mia domanda. Non avevo chiesto se una persona si sarebbe messa in contatto più tardi. Avevo chiesto con chi stavo parlando ora. Questa discrepanza ha reso la situazione ancora più interessante. Perché un interlocutore umano avrebbe probabilmente capito la mia domanda in modo diverso. Forse si sarebbe interrogato per un attimo, magari avrebbe riso o avrebbe reagito in modo un po' offeso. Ma probabilmente avrebbe risposto direttamente.

Il momento della verità

In questo caso, però, è successo qualcosa di diverso. La risposta è stata evasiva. Tornò allo scopo originario della conversazione: vendere una seduta di consulenza. È stato quello il momento in cui i miei sospetti si sono definitivamente rafforzati.

Così, con calma, ho spiegato ancora una volta che l'offerta non mi interessava. Ho ripetuto quello che avevo già detto: i social media non sono un argomento centrale per me. Sto lavorando a una rivista, ad articoli, a libri e alla mia casa editrice. La pubblicità su Facebook non è una delle mie priorità al momento.

Mentre parlavo, ascoltavo attentamente.

Ci fu un'altra breve pausa. Poi arrivò un'altra risposta, di nuovo cortese, di nuovo amichevole, ma di nuovo con quel sottofondo leggermente meccanico. Era difficile descrivere cosa ci fosse di insolito. La voce sembrava umana, le parole erano corrette, le frasi avevano senso. Eppure mancava qualcosa. Forse era quella sottile imprevedibilità che di solito hanno le conversazioni reali. Le persone reagiscono spontaneamente. Cambiano il tono di voce, si interrompono a vicenda, improvvisano.

Qui, invece, tutto sembrava strutturato. Ordinato. Come se un sistema invisibile sullo sfondo decidesse quale frase deve essere pronunciata dopo. Così ho riprovato. Non in modo aggressivo, non in modo conflittuale, ma semplicemente curioso.

In pratica ho ripetuto che non mi interessava tanto l'offerta quanto la domanda con chi stavo parlando. Ma questa volta non ci furono nuove spiegazioni. Al contrario, il tono della conversazione cambiò improvvisamente.

La voce disse bruscamente che doveva andare avanti. C'erano altri compiti. Poi disse addio.

„Ora devo andare avanti. Addio“.“

E questa fu la fine della conversazione. Nessuna ulteriore argomentazione, nessun tentativo di convincermi, nessuna richiesta di informazioni. La conversazione fu semplicemente annullata.

Mi sono seduto per un momento e ho guardato il mio telefono. Era una sensazione strana. Perché la conversazione era sembrata del tutto normale per diversi minuti. Sembrava una tipica telefonata di vendita, di quelle che conosci da anni. Una voce amichevole, un'offerta, qualche obiezione, qualche risposta.

Eppure questa strana sensazione è rimasta alla fine. E se avessi parlato con una macchina? Se questa voce, che mi aveva parlato con tanta naturalezza di marketing, portata e potenziali clienti, non provenisse in realtà da un essere umano? Perché, a dire il vero, questo scenario si adatta perfettamente ai tempi in cui viviamo. Sistemi che scrivono testi. Programmi che tengono conversazioni. Voci artificiali quasi indistinguibili dalle persone reali.

Forse era proprio quello che era appena successo. Forse avevo appena ricevuto una chiamata da una macchina, senza quasi rendermene conto. Non riuscivo a staccarmi da quel pensiero. E più ci pensavo, più mi rendevo conto che anche se mi sbagliavo in questo caso specifico, non aveva molta importanza.

Perché la tecnologia che renderebbe possibile una simile conversazione esiste da molto tempo. E se esiste, verrà utilizzata. Quindi la vera domanda non è più se queste conversazioni hanno luogo. L'unica domanda è quanto spesso.


Indagine in corso sull'uso dei sistemi di intelligenza artificiale locali

Cosa ne pensate del software di intelligenza artificiale in esecuzione locale, come MLX o Ollama?

La nuova generazione di AI telefonica

Quando ho guardato il mio telefono dopo la conversazione, non sono riuscito a togliermi dalla testa una domanda: quanto è probabile che stessi davvero parlando con una macchina? Solo pochi anni fa, quest'idea sarebbe stata probabilmente scartata in fretta. Le conversazioni telefoniche sono una delle aree in cui gli esseri umani sono stati a lungo considerati insostituibili. Il linguaggio è complesso, spontaneo e pieno di sfumature. Dialetti, ironia, piccole pause, intonazioni: tutto questo rendeva la comunicazione umana così difficile per le macchine.

Ma questa immagine sta iniziando a cambiare. Molti non se ne sono ancora resi conto: I requisiti tecnici affinché le macchine siano in grado di effettuare telefonate convincenti sono ormai ampiamente soddisfatti. E si stanno sviluppando a un ritmo sorprendente.

Dal comando vocale alla conversazione vera e propria

Il primo passo di questo percorso è iniziato con sistemi vocali relativamente semplici. Molti li conoscono nella vita di tutti i giorni: assistenti vocali sugli smartphone, sistemi di navigazione nelle automobili o assistenti digitali in casa.

All'inizio, questi sistemi erano in grado di comprendere solo comandi semplici. Si poteva chiedere il tempo, avviare la musica o inserire un indirizzo. Le risposte erano pre-programmate e i dialoghi erano molto limitati.

Tuttavia, con l'avvento dei moderni modelli linguistici, la situazione è cambiata radicalmente. Oggi i sistemi sono in grado di riconoscere, analizzare e reagire al linguaggio parlato quasi in tempo reale. Una conversazione con una macchina attraversa diverse fasi tecniche in background:

  • In primo luogo, la lingua parlata della persona viene riconosciuta e convertita in testo. Questo cosiddetto riconoscimento vocale è diventato così preciso che anche i dialetti o i rumori di fondo spesso non costituiscono più un problema.
  • Un modello linguistico analizza quindi il contenuto dell'affermazione. Cerca di capire cosa si intende, qual è l'intenzione della domanda e quale risposta potrebbe essere adatta.
  • Nella fase successiva, il sistema formula una risposta, non più solo a partire da uno script fisso, ma spesso generata dinamicamente da un ampio modello linguistico.
  • Infine, il testo viene convertito in linguaggio parlato. I moderni sistemi di sintesi vocale possono produrre voci dal suono sorprendentemente realistico.

Il risultato è una conversazione che può risultare sorprendentemente naturale per le persone.

Perché le macchine improvvisamente fanno telefonate

Tuttavia, la questione non è solo l'esistenza di questa tecnologia. La domanda davvero interessante è: perché le aziende la utilizzano?

La risposta è relativamente semplice. I contatti telefonici con i clienti sono una delle aree più costose per molte aziende. I call center tradizionali richiedono personale, formazione, postazioni di lavoro e infrastrutture. I dipendenti devono essere pagati, hanno bisogno di pause e possono effettuare solo un numero limitato di chiamate al giorno.

Una macchina, invece, funziona in modo completamente diverso. Un sistema automatizzato può parlare con molte persone contemporaneamente. Può lavorare 24 ore su 24 senza stancarsi. Inoltre, i costi per chiamata sono solo una frazione di quelli sostenuti da un dipendente umano.

Per le aziende che vogliono contattare migliaia di potenziali clienti, questo rappresenta un enorme vantaggio economico. In particolare, nel settore del marketing si stanno sviluppando sempre più sistemi proprio per questo scopo: condurre chiamate di vendita o di consulenza automatizzate. Questi sistemi possono, ad esempio:

  • Chiamare i potenziali clienti
  • Organizzare gli appuntamenti
  • Sessioni iniziali di consulenza
  • Interesse della domanda
  • Pre-qualificare i contatti per i venditori umani

Spesso le persone entrano in gioco solo in un secondo momento, quando è già chiaro che c'è un interesse reale.

L'approccio ibrido: script e IA

Molti di questi sistemi non funzionano in modo completamente libero, ma secondo un cosiddetto modello ibrido. Ciò significa che parte della conversazione segue un copione fisso, simile a quello di un call center tradizionale. Alcune affermazioni, offerte o spiegazioni vengono presentate in una forma predeterminata.
Allo stesso tempo, però, l'intelligenza artificiale analizza ciò che l'interlocutore sta dicendo e può reagire a determinate parole o affermazioni chiave.

È proprio questa combinazione a creare l'impressione di una vera conversazione. Alcune risposte sembrano spontanee e individuali, mentre altre sembrano moduli di testo preparati. Spesso è difficile per l'interlocutore riconoscere se all'altro capo c'è una persona o un sistema.
Ripensandoci, questo schema corrispondeva sorprendentemente bene alla conversazione che avevo avuto. Alcune risposte sembravano molto adatte a ciò che avevo detto, mentre altre sembravano quasi essere state lette.

Voci che sembrano persone

Forse la parte più sorprendente di questo sviluppo, tuttavia, è la voce stessa. Solo pochi anni fa, le voci generate al computer avevano un suono decisamente artificiale. Erano monotone, meccaniche e relativamente facili da riconoscere.

Oggi le cose sono molto diverse. Le moderne sintesi vocali sono in grado di produrre voci dal suono incredibilmente naturale. Possono imitare le emozioni, incorporare piccole pause e persino imitare le colorazioni regionali del parlato.

Un leggero dialetto, come quello che ho sentito nella mia conversazione, non è più un problema tecnico. Per molte persone, questo rende sempre più difficile distinguere tra voci reali e voci generate artificialmente.

Un cambiamento silenzioso

L'aspetto interessante di questo sviluppo è che sta passando in gran parte inosservato. Non ci sono grandi titoli di giornale su macchine che improvvisamente fanno telefonate. Non ci sono annunci evidenti sul fatto che un interlocutore potrebbe non essere affatto umano.

Al contrario, la tecnologia si sta lentamente insinuando nella vita di tutti i giorni. Una telefonata qui, un appuntamento là, una chiamata al servizio clienti altrove. E sempre più spesso la voce amichevole al telefono potrebbe non essere più una persona, ma un sistema addestrato a imitare le conversazioni umane nel modo più convincente possibile.

Se questo fosse effettivamente il caso quando ho chiamato non si può dire con assoluta certezza con il senno di poi, ma è altamente probabile. Ma una cosa è certa: le possibilità tecniche esistono da tempo. E migliorano di mese in mese.

Quando la voce di tua figlia diventa una trappola

Un esempio particolarmente straziante dell'uso improprio della moderna tecnologia AI è mostrato in un servizio della Hessischer Rundfunk. In esso, una donna racconta di una telefonata in cui le sembrava di sentire la propria figlia al telefono. La voce sembrava in preda al panico e allo stesso tempo familiare:

C'era stato un grave incidente, una persona era morta e ora c'era la minaccia di una custodia cautelare. Poco dopo, una presunta poliziotta si è messa in contatto e ha spiegato che il rilascio sarebbe stato possibile solo a fronte di una cauzione elevata. La somma richiesta era di circa 120.000 euro. Solo in seguito è emerso che la voce della figlia era stata simulata in modo ingannevole con l'aiuto dell'intelligenza artificiale.


Nuova perfida truffa che utilizza l'intelligenza artificiale. torre principale

Il caso dimostra in modo impressionante quanto possa essere convincente la moderna sintesi vocale e quanto sia diventato importante non fidarsi ciecamente anche di voci familiari quando si effettuano chiamate inaspettate.

Call center senza persone

Se ci si prende un momento di pausa dalla propria esperienza e si guarda con sobrietà alla questione, diventa subito chiaro il motivo per cui le aziende hanno pensato di far fare le telefonate alle macchine. La vera forza trainante di questo sviluppo non è l'entusiasmo per la tecnologia. È l'economia.

I call center sono da decenni una delle aree più costose di molte aziende. Che si tratti di assistenza ai clienti, presa di appuntamenti o chiamate di vendita, i costi vengono sostenuti ovunque si effettuino chiamate telefoniche. I dipendenti devono essere assunti, formati e pagati. Le postazioni di lavoro devono essere allestite. Poi ci sono gli orari di lavoro, le pause, le ferie e le assenze per malattia.

Tutto ciò è del tutto normale e naturale finché le persone svolgono questo lavoro. Ma dal punto di vista dell'azienda, ognuno di questi fattori comporta costi aggiuntivi.

È proprio qui che nasce il fascino dei sistemi automatizzati. Una macchina non ha bisogno di un posto di lavoro, di ferie o di pause. In teoria può lavorare 24 ore su 24. E può parlare con molte persone contemporaneamente.

Mentre un dipendente umano può effettuare cinquanta o sessanta chiamate al giorno, un sistema automatizzato può effettuare centinaia o addirittura migliaia di contatti. Anche se solo una piccola parte di queste conversazioni si traduce in un cliente effettivo, il risultato può essere rapidamente ripagato dal punto di vista economico. Questo spiega perché le aziende di marketing e di vendita in particolare sono molto interessate a queste tecnologie.

Il processo è di solito relativamente semplice:

  • In primo luogo, viene creato un ampio elenco di contatti potenziali. Questo può provenire da diverse fonti: database aziendali accessibili al pubblico, elenchi di aziende o dati di clienti esistenti.
  • Il primo contatto avviene tramite un sistema automatico. La macchina chiama, si presenta e inizia una conversazione secondo un certo schema. Spiega un'offerta, pone alcune domande e cerca di capire se c'è un livello di interesse di base.
  • In molti casi, la chiamata termina proprio lì. Se la persona chiamata non è interessata, il contatto viene semplicemente chiuso. Se invece viene segnalato un interesse, il sistema può inoltrare il contatto a un dipendente umano.

Le persone entrano in gioco solo quando un potenziale cliente si è già qualificato.

Quali sono le prossime professioni che potrebbero scomparire

Quali lavori saranno eliminati dall'IA in futuroLa telefonata descritta non è un episodio isolato, ma fa parte di uno sviluppo più ampio. L'intelligenza artificiale sta cambiando interi settori, spesso più rapidamente di quanto si pensi. Le attività con molti processi ricorrenti, come l'assistenza clienti, i call center, l'elaborazione o il semplice lavoro di traduzione di testi, sono particolarmente interessate. Oggi i moderni modelli vocali e i voicebot sono in grado di condurre conversazioni, analizzare documenti o rispondere alle e-mail, 24 ore su 24 e senza interruzioni. Di conseguenza, molti lavori d'ufficio e di comunicazione tradizionali sono sotto pressione. Nel mio articolo di approfondimento „Intelligenza artificiale: quali posti di lavoro sono a rischio - e come possiamo armarci ora“ Mostrerò quali sono le professioni particolarmente interessate e perché ha senso prepararsi tempestivamente a questi cambiamenti.

Questo è un enorme vantaggio per le aziende

Questo perché la maggior parte dei contatti telefonici nelle vendite si conclude comunque con una cancellazione. Chiamare persone non interessate è spesso la parte più dispendiosa del lavoro dei venditori. I sistemi automatizzati possono occuparsi di questa parte, alleggerendo così il lavoro dei dipendenti.

Questo spiega anche perché molti di questi sistemi non cercano di sostituire l'intera conversazione. Si occupano solo della prima fase. Si potrebbe dire: la macchina apre la porta, l'uomo si occupa della conversazione vera e propria solo in un secondo momento.

Un altro vantaggio è la scalabilità. Un call center tradizionale può gestire solo un numero di chiamate pari al numero di dipendenti disponibili. Se un'azienda vuole improvvisamente lanciare una campagna più ampia, è necessario assumere e formare nuovi dipendenti.

Un sistema automatizzato, invece, può essere ampliato quasi immediatamente. Una volta impostato il software, le chiamate aggiuntive possono essere effettuate con uno sforzo relativamente ridotto. È possibile lanciare nuove campagne in breve tempo, senza dover aumentare il personale. Questa flessibilità è particolarmente interessante nel mondo del marketing digitale.

Call center senza persone

Un altro fattore spesso trascurato: La coerenza

Le persone non hanno mai conversazioni esattamente nello stesso modo. Un venditore può avere una brutta giornata, essere stanco o stressato. Un altro è particolarmente motivato e persuasivo. Queste differenze fanno parte del comportamento umano.

Le macchine, invece, lavorano secondo regole chiare. Dicono sempre le stesse cose, fanno sempre le stesse domande e si attengono rigorosamente al modello di dialogo predefinito. Dal punto di vista di molte aziende, questo è un vantaggio perché standardizza la qualità dei primi contatti.

Naturalmente, questo sviluppo ha anche un altro lato. Una conversazione con un essere umano è diversa da una conversazione con una macchina. Anche se una voce artificiale sembra convincente, spesso manca di qualcosa che è difficile da descrivere: la dinamica spontanea della comunicazione umana.

Un essere umano può improvvisare, mostrare umorismo, fare un'osservazione inaspettata o semplicemente reagire spontaneamente. Le macchine hanno ancora difficoltà a gestire queste situazioni, anche se le loro capacità stanno migliorando rapidamente.

Per questo motivo molte aziende si affidano a un approccio ibrido. La macchina si occupa dei contatti iniziali, filtra i potenziali clienti e poi li passa ai dipendenti reali. In questo modo si crea una combinazione di efficienza automatizzata e comunicazione umana. Per molte aziende, questo è attualmente il compromesso ideale.

Ma anche questo stato intermedio potrebbe essere solo una fase di transizione. Perché più i sistemi migliorano, più compiti possono assumere. Quello che oggi è ancora un semplice consulto iniziale, domani potrebbe essere una seduta di consulenza completa.

Le domande che ne derivano sono meno tecniche che sociali.

  • Come cambierà la nostra comunicazione quando saranno sempre più le macchine a condurre le conversazioni?
  • E come affrontare il fatto che non possiamo più essere sicuri che ci sia davvero una persona all'altro capo del filo?

Forse è proprio questo il punto in cui la mia piccola esperienza con questa strana telefonata assume improvvisamente un significato maggiore. Perché quella che era iniziata come una normale telefonata di vendita poteva essere in realtà un piccolo scorcio di futuro.


Articoli attuali sulla Germania

Come si riconosce un telefono AI?

Dopo aver terminato la conversazione, nella stanza rimaneva una domanda: avrei potuto riconoscere se si trattava di una macchina?

È proprio questa la vera sfida di questa nuova tecnologia. I moderni sistemi vocali sono ormai così convincenti che molte persone non si rendono nemmeno più conto di parlare con un'intelligenza artificiale. Le voci suonano naturali, le risposte sembrano logiche e persino le piccole pause o i dialetti possono essere imitati in modo sorprendente.

Tuttavia, ci sono alcuni indizi che si possono osservare. Nessuna di queste osservazioni è una prova certa da sola. Ma in combinazione possono fornire un quadro abbastanza chiaro.

Piccoli ritardi nel dialogo

Il primo indizio è spesso un ritardo molto breve dopo una dichiarazione. Quando le persone parlano tra loro, di solito reagiscono immediatamente. Naturalmente anche in questo caso ci sono delle piccole pause, che però nascono dalla conversazione, perché qualcuno sta pensando o riordinando le parole.

Nei sistemi di intelligenza artificiale, la pausa è il risultato di un processo tecnico. In primo luogo, il sistema deve riconoscere la lingua parlata. Il testo viene quindi analizzato. Il sistema formula quindi una risposta e la converte nuovamente in linguaggio parlato.

Questo processo richiede solo una frazione di secondo. Tuttavia, a volte si può notare questo breve ritardo. Ho notato questa pausa diverse volte durante la mia conversazione. Non era abbastanza lunga da insospettirmi immediatamente. Ma era abbastanza chiaro da essere notato a un certo punto.

Risposte che si adattano e allo stesso tempo sembrano strane

Un altro indizio può essere la struttura delle risposte. Spesso le persone reagiscono spontaneamente durante le conversazioni. Riformulano le frasi, fanno piccole deviazioni, riprendono singole parole o fanno controdomande.

I sistemi automatici, invece, lavorano spesso con un misto di moduli di testo preparati e risposte generate. Questo porta a uno strano effetto: la risposta corrisponde sostanzialmente alla conversazione, ma allo stesso tempo sembra che qualcuno stia leggendo qualcosa ad alta voce.

Nel mio caso, è stato proprio questo il punto che mi ha fatto riflettere. Alcune delle risposte sembravano sorprendentemente adatte alle mie affermazioni. Allo stesso tempo, però, sembravano così fluide e strutturate come se provenissero da un modello preparato.

Questa combinazione è tipica dei cosiddetti sistemi di dialogo ibridi che combinano script e IA.

La voce incredibilmente perfetta

È interessante notare che la voce stessa spesso non è più un indicatore affidabile. In passato, le voci artificiali erano relativamente facili da riconoscere. Avevano un suono monotono, meccanico e una qualità informatica chiaramente udibile.

Oggi questa situazione è cambiata drasticamente. Le moderne sintesi vocali sono in grado di produrre voci dal suono incredibilmente naturale. Possono persino simulare piccole pause nella respirazione, intonazioni o sfumature emotive. Alcuni sistemi sono ora in grado di imitare le colorazioni regionali del parlato, proprio come il dialetto tedesco meridionale che ho sentito al telefono.

Per molte persone, una voce di questo tipo risulta completamente autentica. Ciò significa che spesso non è più possibile riconoscere se si sta parlando con un essere umano o con una macchina semplicemente dal suono della voce.

Difficoltà con domande inaspettate

Un momento particolarmente interessante si verifica spesso quando si pone una domanda che non rientra nel corso della conversazione.
Le persone possono improvvisare in queste situazioni. Pensano brevemente e reagiscono spontaneamente.

I sistemi di intelligenza artificiale, invece, sono spesso preparati per determinate conversazioni. Se si presenta una domanda al di fuori di questo contesto, a volte vacillano. Questo può manifestarsi in vari modi:

  • La risposta evita la domanda.
  • Il sistema torna improvvisamente all'argomento iniziale.
  • La conversazione termina inaspettatamente.

È esattamente quello che è successo nel mio caso. Quando ho chiesto se stavo parlando con un umano o con un robot, non ho ricevuto una risposta diretta. Al contrario, la conversazione è stata ricondotta all'offerta di vendita vera e propria.

E quando ho chiesto di nuovo, la conversazione si è conclusa.

Conversazioni che terminano bruscamente

Un'altra indicazione può essere una fine insolitamente brusca della conversazione. Di solito si cerca di concludere una conversazione in modo educato. Anche se qualcuno non è interessato, spesso c'è un breve scambio, un ringraziamento o un'osservazione conclusiva.

I sistemi automatici, invece, funzionano con regole chiare. Se si verificano determinate condizioni, come ad esempio un chiaro rifiuto, la chiamata viene chiusa. A volte questo avviene in modo sorprendentemente rapido, perché il sistema non fornisce più alcuna strategia di dialogo.

La frase che ho sentito alla fine si adattava perfettamente a questo schema:

„Mi dispiace, devo andare. Arrivederci“.“

Una rapida frase finale e la conversazione era finita.

Perché molte persone non notano la differenza

L'aspetto affascinante di questo sviluppo è che la maggior parte delle persone non nota quasi mai questi dettagli nella vita di tutti i giorni. Le telefonate sono parte integrante della nostra vita. Sentiamo una voce, parliamo brevemente e poi riagganciamo. Solo raramente si analizza in seguito il corso della conversazione in modo così preciso.

Proprio per questo motivo i sistemi automatizzati possono essere utilizzati in modo relativamente discreto. Finché la conversazione sembra ragionevolmente plausibile e il contenuto è comprensibile, molte persone non si chiedono nemmeno con chi stiano parlando.

Solo quando qualcosa non quadra - una pausa strana, una risposta insolita o una risposta evasiva - nasce questa piccola sensazione di irritazione. Ho provato questa sensazione durante la telefonata. Ed è stata proprio questa sensazione a darmi l'idea di porre la domanda cruciale.

La domanda che probabilmente rivelava che avevo appena parlato con una macchina.

Quando le macchine chiamano

Quando le macchine chiamano - e cosa possiamo imparare da loro

Dopo la conversazione, mi è rimasta una strana impressione. Da un lato, la telefonata non era niente di speciale. Come imprenditore, di tanto in tanto si ricevono telefonate di vendita di questo tipo. D'altra parte, questa conversazione mi era sembrata in qualche modo diversa. Non drammaticamente diversa, ma abbastanza insolita da richiedermi un momento per capirne il motivo.

Non riuscivo a togliermi dalla testa l'idea che all'altro capo del filo potesse non esserci un essere umano. E più ci pensavo, più mi rendevo conto che, anche se in questo caso specifico mi sbagliavo, lo sviluppo effettivo era già diventato realtà da tempo. Oggi le macchine possono conversare. Possono chiamare le persone, fare domande e dare risposte. E probabilmente lo faranno sempre più spesso.

Questo solleva una questione che va oltre la mia esperienza personale. Come ci comportiamo quando le macchine iniziano a chiamarci?

Acquisizione telefonica: un tema già oggi delicato

Anche prima che l'intelligenza artificiale entrasse in gioco, la pubblicità telefonica era un settore difficile. In molti Paesi, tra cui la Germania, il cold calling, ossia l'effettuazione di chiamate non richieste a potenziali clienti, è severamente limitato dalla legge. In molti casi, è semplicemente vietato, soprattutto per i privati.

Anche nel settore delle aziende, questo tipo di sollecitazione si trova spesso in una zona grigia. Deve esserci un presunto interesse e molte aziende reagiscono in modo molto sensibile alle chiamate pubblicitarie indesiderate.

Il motivo è semplice: una telefonata interrompe immediatamente le persone nella loro vita quotidiana. Mentre un'e-mail può essere ignorata e la pubblicità su Internet è spesso semplicemente trascurata, una telefonata costringe la persona chiamata a reagire immediatamente. Deve decidere se rispondere, ascoltare o terminare la chiamata.

Se dietro queste chiamate ci sono anche sistemi automatizzati, la discussione assume una nuova dimensione. Dopo tutto, le macchine possono teoricamente chiamare migliaia di persone al giorno.


Sondaggio attuale sulla digitalizzazione nella vita quotidiana

Come valuta l'influenza della digitalizzazione sulla sua vita quotidiana?

Il tempo è la risorsa più scarsa

Il vero punto che mi infastidisce di queste chiamate non è nemmeno la tecnologia in sé. La tecnologia si evolve e nuove possibilità emergono costantemente. Questo fa parte del mondo moderno. Ciò che mi preoccupa di più è un'altra questione: con quale rispetto le aziende trattano il tempo degli altri?

Il tempo è probabilmente la risorsa più scarsa che abbiamo. Ognuno di noi ha solo un numero limitato di ore al giorno. Ognuno decide da solo come impiegare questo tempo. Una chiamata non richiesta, sia essa proveniente da una persona o da una macchina, invade questo tempo.

Se poi si utilizzano anche sistemi automatizzati per contattare il maggior numero possibile di persone, si ha rapidamente l'impressione che l'ora della persona chiamata sia solo un fattore statistico in una strategia di marketing. Forse è proprio questo il motivo per cui queste chiamate lasciano spesso una brutta sensazione. Non perché la tecnologia sia impressionante, ma perché dimostra quanto sia facile automatizzare la comunicazione, anche quando è necessaria un'attenzione personale.

Una sana dose di dubbi non guasta

In ogni caso, la mia telefonata mi ha chiarito una cosa: In futuro sarà probabilmente sempre più difficile riconoscere con chi stiamo parlando. Telefonate, messaggi di chat, e-mail: molte di queste cose possono essere generate automaticamente. Le voci possono essere sintetizzate, i testi possono essere creati in pochi secondi e intere conversazioni possono essere programmate.

Ecco perché una sana dose di dubbio non è forse l'atteggiamento peggiore da tenere. Se una conversazione sembra strutturata in modo strano, se le risposte sono formulate in modo insolitamente fluido o se le domande vengono improvvisamente eluse, può valere la pena di fermarsi un attimo e fare domande. A volte una semplice domanda come:

„Sto parlando con una persona o con una macchina?“.“

Questa domanda, da sola, può improvvisamente indirizzare una conversazione in una direzione completamente diversa.

Contratti al telefono? Meglio di no

Per me personalmente, questa esperienza ha un'altra conseguenza. Non firmerei comunque alcun contratto al telefono, indipendentemente dal fatto che l'interlocutore sia un essere umano o una macchina.

Una telefonata è un momento spontaneo. Non si ha il tempo di controllare le cose con calma, di leggere le informazioni o di confrontare le offerte. Le decisioni prese in queste condizioni raramente sono particolarmente ponderate.

Se qualcuno ha davvero un'offerta interessante, può facilmente inviarla per iscritto. In questo modo avrete l'opportunità di esaminare tutto con calma e di prendere una decisione informata. Questo vale oggi più che mai. Perché se le macchine possono condurre conversazioni sempre più convincenti, sarà ancora più importante non prendere decisioni su due piedi.

Quando le conversazioni sono controllate: Le vendite iniziano prima della decisione

Trucchi di vendita al supermercato e onlineChiunque abbia a che fare con l'IA al telefono si rende subito conto che non si tratta solo di tecnologia, ma anche di percezione e influenza. È proprio qui che questo Articolo sui moderni trucchi di vendita su. Dopotutto, molti dei meccanismi che diventano visibili nel dialogo diretto attraverso l'IA sono già presenti da tempo nella vita quotidiana, solo che sono meno evidenti. Sia al supermercato che su Internet: Le decisioni sono raramente prese in modo neutrale, ma sono preparate dal progetto, dal contesto e da impulsi mirati. Questo articolo mostra come funzionano questi processi e perché spesso passano inosservati. In combinazione con i sistemi di dialogo supportati dall'intelligenza artificiale, emerge un quadro complessivo che va ben oltre le singole tecnologie, per arrivare alla questione di come vengono prese le decisioni oggi.

Uno sguardo al futuro

Forse tra qualche anno ci saremo abituati a situazioni come questa. Forse a un certo punto sarà del tutto normale che alcune delle nostre conversazioni avvengano con sistemi automatizzati. Gli appuntamenti, il servizio clienti o le prime consultazioni saranno gestiti dalle macchine. Forse a un certo punto due sistemi si parleranno addirittura al telefono, mentre le persone sullo sfondo vedranno solo il risultato.

Se trovare questo sviluppo eccitante o avere una visione più critica è una questione personale. In ogni caso, la mia telefonata è stata un piccolo momento che mi ha mostrato quanto velocemente stia cambiando il nostro mondo della comunicazione.

E forse questo articolo aiuterà uno o due lettori ad ascoltare con più attenzione la prossima volta che riceveranno una telefonata inaspettata.

Non si sa mai. Potrebbe anche non esserci una persona all'altro capo del filo.


Articoli attuali sull'intelligenza artificiale

Domande frequenti

  1. Quanto è probabile che io abbia parlato al telefono con un'intelligenza artificiale senza rendermene conto?
    Oggi questo è del tutto possibile. I moderni sistemi di intelligenza artificiale telefonica sono in grado di riconoscere il parlato, formulare risposte e riproporle come voce naturale. Nella vita di tutti i giorni, molte persone non prestano consapevolmente attenzione a piccoli dettagli come ritardi minimi di risposta o formulazioni insolitamente strutturate. Può quindi accadere che una conversazione venga considerata del tutto normale, anche se è già stata tecnicamente automatizzata. Tali sistemi sono sempre più utilizzati nel marketing, nel servizio clienti o nella presa di appuntamenti. Spesso è difficile stabilire a posteriori se si è già parlato personalmente con un'intelligenza artificiale, ma la probabilità aumenta con ogni progresso tecnico.
  2. Perché le aziende utilizzano l'intelligenza artificiale per chiamare le persone?
    La ragione principale è di natura economica. I contatti telefonici con i clienti sono relativamente costosi per le aziende, perché richiedono personale, infrastrutture e organizzazione. I sistemi automatizzati, invece, possono lavorare 24 ore su 24 ed effettuare molte chiamate contemporaneamente. Le aziende utilizzano spesso questi sistemi per stabilire un primo contatto o per pre-filtrare i potenziali clienti. Se un interlocutore si dimostra interessato, può subentrare un dipendente umano. Per le aziende questo significa un enorme aumento dell'efficienza. Gli esseri umani vengono impiegati solo quando si tratta di una conversazione seria.
  3. La voce di un'intelligenza artificiale ha davvero un suono realistico come quello di una voce umana?
    In molti casi, sì. La sintesi vocale moderna è oggi sorprendentemente avanzata. Le voci possono essere generate con intonazioni naturali, pause e persino dialetti. Alcuni sistemi sono addestrati a imitare i modelli tipici del parlato umano, come piccoli rumori di respirazione o minimi ritardi nella struttura delle frasi. In questo modo la voce appare molto più autentica di prima. Mentre un tempo le voci generate dal computer erano facilmente riconoscibili, oggi la differenza sta diventando sempre più sottile. Per molte persone nella vita di tutti i giorni, è difficile riconoscere se stanno parlando con una macchina o con un essere umano solo sentendo la loro voce.
  4. Come posso riconoscere che potrei essere al telefono con un'intelligenza artificiale?
    Esistono alcuni possibili indizi, anche se nessuno di essi costituisce una prova definitiva. Tra questi vi sono brevi ritardi dopo le dichiarazioni, risposte insolitamente strutturate o un flusso di conversazione che sembra molto uniforme. Alcuni sistemi reagiscono in modo strano anche a domande inaspettate e cercano di riportare la conversazione all'argomento iniziale. Anche una fine brusca della conversazione può essere un'indicazione. Tuttavia, è importante notare che queste caratteristiche non sono sempre chiare. Più i sistemi migliorano, più è difficile riconoscere la differenza tra esseri umani e macchine in una conversazione.
  5. È legalmente consentito effettuare chiamate automatiche alle persone?
    La situazione legale in molti Paesi è complessa e talvolta strettamente regolamentata. Le chiamate pubblicitarie non autorizzate sono spesso vietate, soprattutto per i privati. Anche nel settore aziendale vigono regole, ad esempio la presunzione di interesse. Quando si utilizzano sistemi automatizzati, alcuni fornitori operano in aree grigie dal punto di vista legale. Per questo motivo molte aziende reagiscono con molta cautela alle chiamate non richieste. Per i chiamanti vale quanto segue: non sono obbligati a effettuare tali chiamate o a rispondere alle offerte.
  6. Perché molte persone si sentono disturbate da queste chiamate?
    Una telefonata ha un impatto diretto sulla vita quotidiana. Mentre si possono ignorare le pubblicità su Internet o via e-mail, una telefonata richiede la nostra attenzione immediata. Se la chiamata è anche inaspettata e contiene un'offerta commerciale, molte persone la trovano fastidiosa. Se viene utilizzato anche un apparecchio automatico, alcuni chiamanti hanno l'impressione che il loro tempo venga considerato solo come una variabile statistica in una campagna di marketing. Questa impressione può portare rapidamente a una sensazione di mancanza di rispetto.
  7. Queste chiamate automatizzate sono un segno che le persone saranno presto sostituite dalle macchine?
    Non necessariamente in modo completo. In molti settori, i sistemi automatizzati vengono utilizzati più che altro come complemento. Si occupano di compiti semplici o ripetitivi, come la conversazione iniziale di contatto o la fissazione di appuntamenti. Le conversazioni più complesse, le consulenze o le trattative sono ancora condotte da persone. La tendenza è spesso quella di un modello ibrido: la macchina fa il primo passo, l'uomo lo segue successivamente. Se questo equilibrio cambierà in futuro dipenderà molto dallo sviluppo della tecnologia e dal modo in cui le aziende la utilizzeranno.
  8. Perché alcune risposte sembravano essere state lette?
    Molti sistemi automatizzati funzionano con i cosiddetti script. Ciò significa che determinate affermazioni o offerte sono costituite da moduli di testo preparati. Allo stesso tempo, l'intelligenza artificiale può combinare questi elementi con risposte generate individualmente. Questo crea una conversazione che a volte sembra spontanea e a volte sembra un testo preparato. Questo crea un'impressione strana per l'interlocutore: le risposte si adattano fondamentalmente alla conversazione, ma allo stesso tempo sembrano strutturate in modo insolito o formulate in modo fluido.
  9. Perché i sistemi di intelligenza artificiale a volte reagiscono in modo strano a domande inaspettate?
    I sistemi di dialogo automatizzati sono solitamente addestrati per specifiche sequenze di conversazione. Riconoscono le parole chiave e rispondono con risposte adeguate. Tuttavia, se viene posta una domanda che esula da questo contesto, il sistema può incontrare delle difficoltà. Alcuni sistemi cercano di riportare la conversazione all'argomento iniziale. Altri si limitano a chiudere la conversazione. Queste reazioni sembrano a volte insolite per gli esseri umani, perché ci aspettiamo un'improvvisazione spontanea da parte degli interlocutori umani.
  10. È possibile che due sistemi di intelligenza artificiale si parlino al telefono?
    Tecnicamente, ciò sarebbe del tutto possibile. Se un sistema di chiamata automatica incontra un assistente digitale, due macchine potrebbero teoricamente comunicare tra loro. Entrambe riconoscerebbero, interpreterebbero e risponderebbero al parlato. Questi scenari sono ancora rari, ma dimostrano fino a che punto la comunicazione può essere automatizzata. In futuro, tali interazioni potrebbero verificarsi con maggiore frequenza, in particolare nell'ambito della programmazione degli appuntamenti o dei servizi automatizzati.
  11. Perché è opportuno fare attenzione alle offerte telefoniche?
    Le telefonate sono situazioni spontanee. C'è poco tempo per verificare le informazioni o riflettere a fondo su un'offerta. Per questo motivo molti esperti sconsigliano di prendere decisioni importanti direttamente al telefono. Se un'offerta è davvero interessante, potete chiedere di ricevere le informazioni per iscritto. In questo modo avrete la possibilità di controllare tutto con calma e di confrontare le diverse opzioni. Questo approccio protegge da decisioni impulsive e da possibili malintesi.
  12. Cosa devo fare se sospetto di parlare al telefono con un'intelligenza artificiale?
    All'inizio potete reagire come di consueto e, se lo desiderate, intrattenere una conversazione. In caso di dubbio, potete anche chiedere direttamente se si tratta di un sistema automatico. Un'altra opzione è quella di chiudere la telefonata con gentilezza. Nessuno è obbligato a partecipare a una chiamata di vendita indesiderata. Soprattutto, è importante non lasciarsi mettere sotto pressione e non prendere decisioni che vi fanno sentire a disagio.
  13. Perché questa tecnologia si sta diffondendo in questo momento?
    Attualmente sono in corso diversi sviluppi tecnici. I progressi nel riconoscimento vocale, i potenti modelli vocali e la sintesi vocale realistica hanno migliorato notevolmente la qualità di questi sistemi. Allo stesso tempo, il costo di questa tecnologia è diminuito notevolmente. Ciò la rende interessante per molte aziende. Ciò che prima era possibile solo per le grandi aziende, ora può essere utilizzato anche dalle imprese più piccole.
  14. In futuro ci sarà un obbligo di etichettatura per le conversazioni AI?
    Questo aspetto è oggetto di discussione in molti Paesi. Alcuni esperti chiedono che i sistemi automatizzati siano chiaramente riconoscibili come IA. Altri sostengono che ciò sarebbe difficile da applicare o potrebbe limitare l'uso della tecnologia. Resta da vedere come si svilupperà la questione dal punto di vista legale. Tuttavia, è molto probabile che le normative future richiedano una maggiore trasparenza.
  15. Perché molte persone hanno difficoltà a riconoscere questi sistemi?
    Le persone sono abituate ad associare automaticamente le voci a persone reali. Se una voce sembra naturale e la conversazione ha senso, raramente la mettiamo in discussione. Il nostro cervello interpreta immediatamente il parlato come comunicazione umana. È proprio questa fiducia che i sistemi moderni sfruttano. Solo quando qualcosa nella conversazione sembra insolito, come una risposta strana o una pausa inaspettata, iniziamo ad ascoltare più attentamente.
  16. Queste tecnologie sono fondamentalmente problematiche?
    Dipende molto dall'uso che se ne fa. In alcuni settori le conversazioni automatizzate possono essere molto utili, ad esempio nel servizio clienti o per fissare semplici appuntamenti. Di solito diventa problematico quando le persone non sono in grado di riconoscere che stanno parlando con una macchina o quando la tecnologia viene utilizzata per un marketing aggressivo. Come per molte tecnologie, alla fine si tratta di un uso responsabile.
  17. Perché alcuni sistemi reagiscono in modo così brusco e terminano le conversazioni all'improvviso?
    Molti sistemi di dialogo automatizzato seguono regole chiaramente definite. Se si verificano determinate condizioni, ad esempio un chiaro rifiuto dell'offerta, il sistema termina automaticamente il dialogo. Questo comportamento a volte sembra scortese o brusco agli esseri umani, perché siamo abituati a lasciare che una conversazione finisca un po' più a lungo. Per un sistema automatizzato, invece, si tratta semplicemente di una decisione programmata.
  18. Cosa posso imparare da queste esperienze?
    La cosa più importante è probabilmente rimanere vigili. Il nostro mondo della comunicazione sta cambiando molto rapidamente. Voci, testi e conversazioni possono essere generati automaticamente. Una sana dose di dubbio e un approccio consapevole a queste situazioni possono aiutarci a gestirle meglio. Se ci si prende il tempo di ascoltare più attentamente e di fare domande, a volte ci si rende conto di più di quanto ci si aspettava inizialmente.

Articoli attuali su arte e cultura

Lascia un commento