Когда я разговаривал по телефону с роботом - как искусственный интеллект завоевывает телефон и как его распознать

В повседневной жизни бывают моменты, которые поначалу кажутся совершенно банальными. Вы сидите за рабочим столом, работаете над статьей, обдумываете новую тему - и вдруг звонит телефон. Номер, который вы не узнаете. В моем случае это был код Рурской области: 0233. Как индивидуальный предприниматель, вы иногда получаете подобные звонки. Обычно речь идет о рекламе, услугах или советах, которые вам на самом деле не нужны.

Сначала я ответил на звонок, как обычно. На другом конце ответил дружелюбный женский голос. Она представилась сотрудником, который работает с Facebook и Instagram. Как и не удивительно, речь шла о рекламе. О рекламе. Об охвате. О видимости для компаний.


Социальные проблемы современности

Разговор начался с той самой интонации, которая знакома нам по таким телефонным разговорам. Вежливый, профессиональный, немного отрепетированный. Она объяснила мне, что сегодня многие компании испытывают трудности с привлечением новых клиентов. Особенно в секторе малых и средних предприятий - так называемом секторе SME - решающим фактором является реклама в Интернете. Facebook и Instagram предлагают огромные возможности для привлечения потенциальных клиентов.

Пока она говорила, я сначала слушал нормально. В ней не было ничего необычного. Голос звучал по-человечески, естественно, даже с легким южнонемецким диалектом. Это делало все происходящее скорее приятным, чем навязчивым. Это не было похоже на традиционный колл-центр, расположенный где-то в мире, а скорее на человека, который действительно звонит из Германии.

Такие разговоры обычно проходят по одной и той же схеме. В какой-то момент наступает момент, когда собеседник объясняет, почему предложение для него неактуально. Именно так я и поступил.

Я сказал ей, что в принципе понимаю, что она имеет в виду, но социальные сети играют для меня скорее второстепенную роль. Моя основная работа находится в другом месте. Я руковожу издательством, работаю над статьями, книгами и своим журналом. Социальные сети - это скорее побочное шоу. Они могут быть полезны, но не являются основной частью моей работы. Я объяснил ей это относительно спокойно.

Поначалу она отреагировала так, как вы и ожидали. Она выслушала, коротко подтвердила, а затем продолжила разговор. В этот момент она начала описывать мне конкретное предложение. Это была некая рекламная кампания, специально разработанная для компаний. Утверждалось, что с ее помощью можно привлечь около пяти тысяч потенциальных клиентов. Она рассказала о важности цифрового присутствия, о том, как компании могут расширить свой охват и как Facebook и Instagram помогут им привлечь новые целевые группы.

Само содержание не удивило. Любой, кто когда-либо общался с представителями маркетинговых агентств, знает подобные фразы. Но что-то в том, как она говорила, начинало меня раздражать. Тон голоса вдруг стал немного другим. Казалось, она читает что-то вслух. Не обязательно очевидное. Но как-то слишком гладко, слишком структурировано, слишком идеально сформулировано. Как будто она читала презентацию, предложение за предложением.

Телефонный разговор с ИИ

Я продолжал слушать и поначалу ни о чем больше не думал. Возможно, перед ней действительно был шаблон. В конце концов, именно так проходят многие встречи по продажам.

Поэтому я снова ответил на их заявления. Я еще раз объяснил, что понимаю их точку зрения, но в данный момент у меня нет необходимости в такой рекламе. Моя работа строится по-другому. Я создаю контент, пишу статьи, разрабатываю темы в долгосрочной перспективе. Социальные медиа могут помочь в этом, но они не являются главным рычагом.

Пока я это говорил, произошло кое-что интересное.

Наступила короткая пауза. Всего на секунду.

Затем последовал ответ, который соответствовал содержанию того, что я только что сказал. Она сказала, что у меня, очевидно, уже есть определенное присутствие в СМИ, и поэтому, возможно, у меня другие приоритеты. Если у кого-то уже есть охват аудитории, реклама, конечно, является другим решением, чем для компаний, которые только начинают свою деятельность.

Это предложение удивительно хорошо сочеталось с тем, что я только что сказал. Но в то же время оно снова прозвучало странно. Снова этот немного заранее вычитанный тон. Снова эта структура, которая ощущалась как подготовленный текст.

В этот момент я стал слушать внимательнее. Потому что внезапно возник очень простой вопрос. Если она действительно просто зачитывает сценарий - откуда берется этот ответ, который так точно отвечает на мое заявление? Неужели у нее перед глазами сотни разных текстов, которые она выбирает в зависимости от хода разговора? Или здесь происходит что-то другое?

Пока я размышлял об этом, я заметил еще кое-что. Течение разговора было странно ровным. Не было ни спонтанных реакций, ни мелких промахов, ни импровизированных формулировок. Все звучало удивительно чисто, почти слишком чисто.

И вдруг в моей голове возникла новая возможность. Может быть, я разговариваю вовсе не с человеком? Может, на другом конце этой линии не настоящий человек, а система. Искусственный голос. ИИ.

Сначала эта идея показалась мне абсурдной. Но чем дольше я думал об этом, тем более правдоподобной она становилась. Потому что одна вещь просто не укладывалась в голове: Ответы казались одновременно адаптированными и в то же время как будто зачитанными. Как будто кто-то понимал, что я говорю, но все равно продолжал опираться на готовые текстовые модули.

Я начал задумываться о том, сколько таких систем уже существует. Сколько разговоров может происходить уже не между людьми, а между людьми и машинами. И именно в этот момент я решил задать очень простой вопрос.

Вопрос, который сразу бы разрешил эту загадку.


Актуальные статьи о Германии

Момент истины

И в тот момент у меня в голове возникла мысль: а может, я вообще не с человеком разговариваю? Чем дольше я думал об этом, тем больше деталей из разговора вдруг вставало на свои места. Короткие задержки после моих ответов. Странно ровная манера говорить. Предложения, которые одновременно казались отдельными, но при этом всегда носили несколько заранее вычитанный характер.

Казалось, что пазл медленно собирается воедино. Поэтому я решил сразу разобраться с этим. Никаких сложных тестов, никаких вопросов с подвохом. Только простой и ясный вопрос. Я ненадолго прервал разговор и сказал:

„У меня есть еще один вопрос“.“

На другом конце линии снова возникла короткая пауза. Недолгая, может быть, секунда. Но достаточно долгая, чтобы осознать это.
Затем я задал вопрос, который вертелся у меня на языке:

„Я действительно разговариваю с человеком или роботом?“

Это был очень прямой вопрос. На самом деле такой, на который человек мог бы ответить без проблем. Вы бы ожидали, что человек либо рассмеется, либо отреагирует немного раздраженно, либо просто скажет: „Конечно, ты говоришь со мной“.“

Но именно этого и не произошло. Вместо этого мы получили ответ, который поначалу показался уклончивым.

Голос сообщил мне, что может гарантировать, что со мной свяжется реальный человек, если я захочу получить консультацию. Затем мы могли бы вместе обсудить, какие варианты имеют смысл для моей компании.

Ответ прозвучал вежливо. Профессионально. Но он не отвечал на мой вопрос. Я не спрашивал, свяжется ли человек со мной позже. Я спросил, с кем я сейчас разговариваю. Это несоответствие сделало ситуацию еще более интересной. Ведь человеческий собеседник, скорее всего, понял бы мой вопрос по-другому. Возможно, он бы на мгновение задумался, может быть, рассмеялся или даже немного обиделся. Но, скорее всего, он бы ответил прямо.

Момент истины

Однако здесь произошло нечто иное. Ответ был уклончивым. Она вернулась к первоначальной цели разговора: продать консультационный сеанс. В этот момент мои подозрения окончательно укрепились.

Поэтому я еще раз спокойно объяснил, что меня действительно не интересует это предложение. Я повторил то, что уже говорил раньше: социальные сети - не главная тема для меня. Я работаю над журналом, статьями, книгами и своим издательством. Реклама в Facebook сейчас не входит в число моих приоритетов.

Пока я говорил, я внимательно слушал.

Последовала еще одна короткая пауза. Затем последовал еще один ответ - снова вежливый, снова дружелюбный, но снова с той слегка механической ноткой. Трудно было описать, что именно в нем было необычным. Голос звучал по-человечески, слова были правильными, предложения осмысленными. И все же чего-то не хватало. Возможно, это была та тонкая непредсказуемость, которой обычно обладают настоящие собеседники. Люди реагируют спонтанно. Они меняют интонацию, перебивают друг друга, импровизируют.

Здесь же, напротив, все выглядело структурированным. Упорядоченным. Как будто невидимая система на заднем плане решала, какое предложение следует произнести следующим. Поэтому я попробовал еще раз. Не агрессивно, не конфронтационно - просто из любопытства.

Я в основном повторил, что предложение меня интересует меньше, чем вопрос о том, с кем я на самом деле разговариваю. Но на этот раз нового объяснения не последовало. Вместо этого тон разговора внезапно изменился.

Голос отрывисто сказал, что ей пора двигаться дальше. Есть и другие задания. Затем она попрощалась.

„Я должен двигаться дальше. Прощай“.“

На этом разговор был окончен. Никаких дальнейших споров, никаких попыток убедить меня в конце концов, никаких расспросов. Разговор был просто прекращен.

Я на мгновение застыл на месте и посмотрел на свой телефон. Это было странное чувство. Ведь в течение нескольких минут разговор казался совершенно нормальным. Он звучал как типичный звонок продавца, с которым вы знакомы уже много лет. Дружелюбный голос, предложение, несколько возражений, несколько ответов.

И все же в конце осталось странное чувство. Что, если я действительно разговаривал с машиной? Что, если этот голос, который так естественно говорил о маркетинге, охвате и потенциальных клиентах, на самом деле исходил не от человека? Ведь, по правде говоря, этот сценарий вполне соответствует времени, в котором мы живем. Системы, которые пишут тексты. Программы, которые ведут беседы. Искусственные голоса, которые почти неотличимы от настоящих людей.

Возможно, именно это и произошло. Может быть, мне только что позвонила машина - и я даже почти не осознал этого. Я не мог отделаться от этой мысли. И чем дольше я думал об этом, тем больше понимал, что даже если я ошибался в данном конкретном случае, это не имело значения.

Потому что технология, позволяющая провести такой разговор, существует уже давно. А раз она существует, значит, ее будут использовать. Так что реальный вопрос уже не в том, происходят ли такие разговоры. Единственный вопрос - как часто.


Текущий обзор использования локальных систем искусственного интеллекта

Что вы думаете о локальном программном обеспечении ИИ, таком как MLX или Ollama?

Новое поколение телефонного искусственного интеллекта

Когда после разговора я посмотрел на свой телефон, у меня не выходил из головы один вопрос: насколько вероятно, что я действительно разговаривал с машиной? Всего несколько лет назад от этой идеи, вероятно, быстро бы отказались. Телефонные разговоры были одной из тех областей, в которых человек долгое время считался незаменимым. Язык сложен, спонтанен и полон нюансов. Диалекты, ирония, небольшие паузы, интонации - все это делало человеческое общение таким сложным для машин.

Но этот образ только начинает меняться. Многие люди еще не осознали этого: Технические требования к машинам, способным совершать убедительные телефонные звонки, уже в значительной степени разработаны. И они развиваются с поразительной скоростью.

От голосовых команд к реальному общению

Первый шаг на этом пути начался со сравнительно простых голосовых систем. Многие знакомы с ними по повседневной жизни: голосовые помощники в смартфонах, навигационные системы в автомобилях или цифровые помощники в доме.

Сначала эти системы понимали только простые команды. Вы могли спросить их о погоде, включить музыку или ввести адрес. Их ответы были заранее запрограммированы, а диалоги очень ограничены.

Однако с появлением современных языковых моделей ситуация в корне изменилась. Сегодня системы способны распознавать, анализировать и реагировать на разговорную речь практически в режиме реального времени. Разговор с машиной проходит несколько технических этапов в фоновом режиме:

  • Сначала распознается разговорный язык собеседника и преобразуется в текст. Так называемое распознавание речи стало настолько точным, что даже диалекты или фоновые шумы уже не являются серьезной проблемой.
  • Затем языковая модель анализирует содержание высказывания. Она пытается понять, что имеется в виду, каково намерение, лежащее в основе вопроса, и какой ответ может подойти.
  • На следующем этапе система формулирует ответ - уже не просто на основе фиксированного сценария, а зачастую динамически генерируя его на основе большой языковой модели.
  • Наконец, этот текст преобразуется в разговорную речь. Современные системы синтеза речи могут создавать голоса, которые звучат удивительно реалистично.

В результате разговор может показаться людям удивительно естественным.

Почему машины вдруг стали звонить по телефону

Однако вопрос не только в том, существует ли эта технология. По-настоящему волнующий вопрос заключается в том, почему компании вообще ее используют?

Ответ относительно прост. Общение с клиентами по телефону - одна из самых затратных областей для многих компаний. Традиционные центры обработки вызовов требуют персонала, обучения, рабочих станций и инфраструктуры. Сотрудникам нужно платить, они нуждаются в перерывах и могут совершать лишь ограниченное количество звонков в день.

С другой стороны, машина работает совершенно иначе. Автоматизированная система может разговаривать со многими людьми одновременно. Она может работать круглосуточно и не уставать. И при этом она несет лишь малую часть тех затрат на один звонок, которые понес бы сотрудник-человек.

Для компаний, которые хотят связаться с тысячами потенциальных клиентов, это является огромным экономическим преимуществом. В частности, в сфере маркетинга все больше и больше систем разрабатываются именно для этой цели: для проведения автоматизированных продаж или консультаций. Эти системы могут, например:

  • Обзвоните потенциальных клиентов
  • Назначайте встречи
  • Проведение первичных консультаций
  • Интерес к запросу
  • Предварительная квалификация контактов для продавцов-людей

Люди часто вступают в игру только потом - когда уже ясно, что есть реальный интерес.

Гибридный подход: сценарий и искусственный интеллект

Многие из этих систем функционируют не совсем свободно, а в соответствии с так называемой гибридной моделью. Это означает, что часть разговора проходит по фиксированному сценарию, как в традиционных колл-центрах. Определенные заявления, предложения или объяснения подаются в заранее установленной форме.
Однако в то же время ИИ анализирует, что говорит собеседник, и может реагировать на определенные ключевые слова или высказывания.

Именно такое сочетание создает впечатление настоящей беседы. Некоторые ответы кажутся спонтанными и индивидуальными, в то время как другие звучат как заготовленные текстовые модули. Собеседнику зачастую сложно понять, кто находится на другом конце - человек или система.
Оглядываясь назад, могу сказать, что эта схема удивительно точно соответствовала разговору, который я вел. Некоторые ответы казались очень адаптированными к тому, что я сказал, в то время как другие звучали почти как зачитанные.

Голоса, похожие на человеческие

Однако, пожалуй, самое удивительное в этой разработке - сам голос. Всего несколько лет назад голоса, сгенерированные компьютером, звучали явно искусственно. Они были монотонными, механическими и относительно легко узнаваемыми.

Сегодня все выглядит совсем иначе. Современный синтез речи позволяет создавать голоса, звучащие удивительно естественно. Они могут имитировать эмоции, включать небольшие паузы и даже подражать региональным особенностям речи.

Небольшой диалект, подобный тому, что я услышал в своем разговоре, больше не является технической проблемой. Многим людям становится все труднее отличать настоящие голоса от искусственно сгенерированных.

Тихие перемены

Самое интересное в этой разработке то, что она проходит практически незамеченной. Нет громких заголовков о том, что машины внезапно начали совершать телефонные звонки. Нет очевидных объявлений о том, что собеседник может оказаться вовсе не человеком.

Вместо этого технологии постепенно проникают в повседневную жизнь. Звонок здесь, встреча там, обращение в службу поддержки в другом месте. И все чаще дружелюбный голос по телефону может быть уже не человеком, а системой, которую обучили как можно более убедительно имитировать человеческие разговоры.

Было ли это на самом деле, когда я звонил, нельзя сказать с абсолютной уверенностью в ретроспективе, но это очень вероятно. Но одно можно сказать точно: технические возможности для этого существуют уже давно. И с каждым месяцем они становятся все лучше.

Когда голос собственной дочери становится ловушкой

Особенно страшный пример неправильного использования современных технологий искусственного интеллекта показан в репортаже Hessischer Rundfunk. В нем женщина рассказывает о звонке, в котором ей показалось, что она слышит в трубке собственную дочь. Голос звучал одновременно панически и знакомо:

Произошла серьезная авария, один человек погиб, и теперь ему грозит заключение под стражу. Вскоре после этого на связь вышла предполагаемая сотрудница полиции и объяснила, что освобождение возможно только под большой залог. Требуемая сумма составляла около 120 000 евро. Только позже выяснилось, что голос дочери был обманчиво смоделирован с помощью искусственного интеллекта.


Новая вероломная афера с использованием искусственного интеллекта | главная башня

Этот случай наглядно демонстрирует, насколько убедительным может быть современный синтез речи - и насколько важно не доверять слепо даже знакомым голосам при совершении неожиданных звонков.

Центры обработки вызовов без людей

Если на минуту отвлечься от собственного опыта и трезво взглянуть на ситуацию, то быстро становится понятно, почему у компаний вообще возникла идея позволить машинам совершать телефонные звонки. Настоящей движущей силой этого развития является не энтузиазм в отношении технологий. Это экономика.

На протяжении десятилетий центры обработки вызовов были одним из самых дорогостоящих направлений деятельности многих компаний. Будь то обслуживание клиентов, назначение встреч или продажи - везде, где совершаются телефонные звонки, возникают расходы. Сотрудников нужно нанимать, обучать и платить им зарплату. Необходимо оборудовать рабочие места. Кроме того, необходимо установить рабочий график, организовать перерывы, отпуск и больничный.

Все это совершенно нормально и естественно, пока люди выполняют эту работу. Но с точки зрения компании каждый из этих факторов означает дополнительные расходы.

Именно в этом и заключается привлекательность автоматизированных систем. Машине не нужно рабочее место, праздники или перерыв. Теоретически она может работать круглосуточно. И она может общаться со многими людьми одновременно.

В то время как сотрудник может сделать пятьдесят или шестьдесят звонков в день, автоматизированная система может совершить сотни или даже тысячи контактов. Даже если лишь небольшая часть этих разговоров приведет к реальному клиенту, это может быстро окупиться с экономической точки зрения. Это объясняет, почему маркетинговые и торговые компании особенно заинтересованы в таких технологиях.

Обычно этот процесс довольно прост:

  • Сначала создается большой список потенциальных контактов. Он может быть получен из различных источников: общедоступных баз данных компаний, бизнес-справочников или данных о существующих клиентах.
  • Затем автоматизированная система устанавливает первый контакт. Машина звонит, представляется и начинает разговор по определенной схеме. Она рассказывает о предложении, задает несколько вопросов и пытается выяснить, есть ли базовый уровень заинтересованности.
  • Во многих случаях звонок заканчивается прямо на этом. Если собеседник не заинтересован, контакт просто завершается. Если же, напротив, интерес проявлен, система может переадресовать контакт сотруднику.

Люди вступают в игру только тогда, когда потенциальный клиент уже квалифицирован.

Какие профессии могут исчезнуть в будущем

Какие рабочие места будут ликвидированы искусственным интеллектом в будущемОписанный выше телефонный звонок - не единичный случай, а часть более масштабного развития. В настоящее время искусственный интеллект меняет целые отрасли - зачастую быстрее, чем многие думают. Особенно пострадали виды деятельности с большим количеством повторяющихся процессов, такие как поддержка клиентов, колл-центры, обработка или просто работа с текстом и переводом. Сегодня современные голосовые модели и голосовые боты могут вести беседы, анализировать документы или отвечать на электронные письма - круглосуточно и без перерыва. В результате многие традиционные офисные и коммуникационные профессии оказываются под угрозой. В моей подробной статье „Искусственный интеллект: какие рабочие места находятся под угрозой - и как мы можем вооружиться уже сейчас“ Я покажу, какие профессии особенно пострадают и почему имеет смысл готовиться к этим изменениям на ранней стадии.

Это огромное преимущество для компаний

Это связано с тем, что большинство телефонных контактов в сфере продаж в любом случае заканчиваются отказом. Обзвон незаинтересованных лиц часто является самой трудоемкой частью работы продавца. Автоматизированные системы могут взять эту часть на себя и тем самым снять нагрузку с сотрудников.

Это также объясняет, почему многие из этих систем не пытаются заменить весь разговор. Они берут на себя только первый шаг. Можно сказать, что машина открывает дверь, а человек берет на себя разговор только потом.

Еще одно преимущество - масштабируемость. Традиционный колл-центр может обрабатывать только столько звонков, сколько сотрудников в нем работает. Если компания вдруг захочет запустить более масштабную кампанию, придется нанимать и обучать новых сотрудников.

С другой стороны, автоматизированная система может быть расширена практически сразу. После настройки программного обеспечения дополнительные звонки могут быть сделаны сравнительно быстро. Новые кампании могут быть запущены в короткие сроки без необходимости увеличивать штат сотрудников. Такая гибкость особенно привлекательна в мире цифрового маркетинга.

Центры обработки вызовов без людей

Еще один фактор, который часто упускают из виду: Последовательность

Люди никогда не ведут беседы одинаково. У одного продавца может быть плохой день, он может устать или испытывать стресс. Другой же особенно мотивирован и убедителен. Эти различия - часть человеческого поведения.

С другой стороны, машины работают по четким правилам. Они всегда говорят одно и то же, задают одни и те же вопросы и строго придерживаются заданной модели диалога. С точки зрения многих компаний, это является преимуществом, поскольку стандартизирует качество первых контактов.

Конечно, у этого развития есть и другая сторона. Разговор с человеком ощущается иначе, чем разговор с машиной. Даже если искусственный голос звучит убедительно, ему часто не хватает того, что трудно описать: спонтанной динамики человеческого общения.

Человек может импровизировать, проявить юмор, сделать неожиданное замечание или просто спонтанно отреагировать. Машинам все еще сложно справляться с такими ситуациями, даже если их навыки быстро совершенствуются.

Именно поэтому многие компании используют гибридный подход. Машина берет на себя первоначальные контакты, отфильтровывает потенциальные перспективы, а затем передает их реальным сотрудникам. Таким образом достигается сочетание автоматизированной эффективности и человеческого общения. Для многих компаний это идеальный компромисс.

Но даже такое промежуточное состояние может быть лишь переходным этапом. Ведь чем лучше становятся системы, тем больше задач они могут на себя взять. То, что сегодня еще является простой первичной консультацией, завтра может превратиться в полноценный сеанс консультирования.

Вопросы, которые возникают в связи с этим, не столько технические, сколько социальные.

  • Как изменится наше общение, когда машины все чаще будут вести беседы?
  • И как нам быть с тем, что мы больше не можем быть уверены в том, что на другом конце линии действительно находится человек?

Возможно, именно в этот момент мой небольшой опыт с этим странным телефонным звонком внезапно приобретает большую значимость. Ведь то, что начиналось как обычный звонок продавца, на самом деле могло быть небольшим проблеском в будущее.


Актуальные статьи о Германии

Как распознать телефонный ИИ?

После того как я закончил разговор, в комнате остался один вопрос: мог ли я вообще понять, была ли это машина?

Именно в этом и заключается настоящая проблема новой технологии. Современные голосовые системы сейчас настолько убедительны, что многие люди уже даже не понимают, что разговаривают с искусственным интеллектом. Голоса звучат естественно, ответы кажутся логичными, и даже небольшие паузы или диалекты теперь можно имитировать удивительно хорошо.

Тем не менее, есть некоторые признаки, на которые вы можете обратить внимание. Ни одно из этих наблюдений само по себе не является определенным доказательством. Но в совокупности они могут дать довольно четкую картину.

Небольшие задержки в диалоге

Первой подсказкой часто является очень короткая задержка после высказывания. Когда люди разговаривают друг с другом, они обычно реагируют сразу. Конечно, и здесь бывают небольшие паузы, но они возникают в процессе разговора - потому что человек думает или подбирает слова.

В системах искусственного интеллекта пауза возникает в результате технического процесса. Сначала система должна распознать разговорный язык. Затем текст анализируется. Затем система формулирует ответ и переводит его обратно в разговорный язык.

Этот процесс занимает лишь долю секунды. Тем не менее иногда вы можете заметить эту небольшую задержку. Я заметил такую паузу несколько раз во время разговора. Она была не настолько длинной, чтобы вызвать у меня немедленные подозрения. Но она была достаточно явной, чтобы в какой-то момент обратить на нее внимание.

Ответы, которые подходят и в то же время кажутся странными

Еще одной подсказкой может быть структура ответов. В разговоре люди часто реагируют спонтанно. Они перефразируют предложения, делают небольшие отступления, придираются к отдельным словам или задают встречные вопросы.

Автоматизированные системы, с другой стороны, часто работают со смесью подготовленных текстовых модулей и сгенерированных ответов. Это приводит к странному эффекту: ответ в основном соответствует разговору, но в то же время звучит так, как будто кто-то читает что-то вслух.

В моем случае это был именно тот момент, который заставил меня задуматься. Некоторые ответы казались удивительно точно подобранными к моим высказываниям. Но в то же время они звучали так гладко и структурированно, как будто были подготовлены по шаблону.

Такая комбинация характерна для так называемых гибридных диалоговых систем, сочетающих в себе сценарий и искусственный интеллект.

Удивительно совершенный голос

Интересно, что сам голос часто перестает быть надежным индикатором. В прошлом искусственные голоса было относительно легко распознать. Они звучали монотонно, механически и имели отчетливо слышимое компьютерное качество.

Сегодня ситуация кардинально изменилась. Современный синтез речи способен создавать голоса, звучащие удивительно естественно. Они даже могут имитировать небольшие паузы в дыхании, интонации или эмоциональные нюансы. Некоторые системы теперь способны имитировать региональные особенности речи - как, например, южнонемецкий диалект, который я услышал по телефону.

Для многих людей такой голос кажется абсолютно подлинным. Это означает, что по звуку голоса уже невозможно определить, с кем вы разговариваете - с человеком или с машиной.

Трудности с неожиданными вопросами

Особенно интересный момент часто возникает, когда вы задаете вопрос, который не вписывается в предполагаемый ход беседы.
В таких ситуациях люди могут импровизировать. Они думают недолго и реагируют спонтанно.

Системы искусственного интеллекта, с другой стороны, часто подготовлены к определенному разговору. Когда возникает вопрос, выходящий за эти рамки, они иногда не выдерживают. Это может проявляться по-разному:

  • Ответ позволяет избежать вопроса.
  • Система внезапно возвращается к исходной теме.
  • Разговор заканчивается неожиданно.

Именно так и произошло в моем случае. Когда я спросил, с кем я разговариваю - с человеком или роботом, - я не получил прямого ответа. Вместо этого разговор был переведен на реальное предложение о продаже.

А когда я переспросил, разговор был окончательно прекращен.

Разговоры, которые внезапно заканчиваются

Другим признаком может быть необычно резкое окончание разговора. Обычно люди стараются завершить разговор вежливо. Даже если кому-то неинтересно, часто происходит краткий обмен мнениями, благодарность или заключительное замечание.

С другой стороны, автоматизированные системы работают по четким правилам. Если выполняются определенные условия - например, явный отказ - звонок завершается. Иногда это происходит удивительно быстро, потому что система больше не предлагает никакой стратегии дальнейшего диалога.

Фраза, которую я услышал в конце, идеально вписалась в эту схему:

„Извините, мне пора идти. До свидания“.“

Быстрая заключительная фраза - и разговор окончен.

Почему многие люди не замечают разницы

Самое интересное в этой разработке то, что большинство людей практически не замечают подобных деталей в повседневной жизни. Телефонные звонки - обычная часть нашей жизни. Мы слышим голос, недолго разговариваем, а затем снова вешаем трубку. Только редко кто так точно анализирует ход разговора впоследствии.

Именно поэтому автоматизированные системы теперь можно использовать относительно ненавязчиво. Пока разговор выглядит достаточно правдоподобно, а содержание понятно, многие люди даже не задаются вопросом, с кем они разговаривают.

Только когда что-то не сходится - странная пауза, необычный ответ или уклончивый ответ, - возникает это небольшое чувство раздражения. У меня было такое чувство во время телефонного разговора. И именно это чувство в конце концов натолкнуло меня на мысль задать решающий вопрос.

Вопрос, который, вероятно, показал, что я только что разговаривал с машиной.

Когда машины звонят

Когда машины звонят - и чему мы можем у них научиться

После разговора у меня осталось странное впечатление. С одной стороны, в звонке не было ничего особенного. Как предприниматель, вы время от времени получаете подобные звонки по продажам. С другой стороны, этот разговор как-то по-другому воспринимался. Не кардинально, но настолько необычно, что мне потребовалось время, чтобы понять причину.

Мысль о том, что на другом конце линии могло не быть человека, не покидала меня. И чем дольше я думал об этом, тем больше понимал, что даже если я ошибался в данном конкретном случае, то разработка, лежащая в его основе, уже давно стала реальностью. Сегодня машины могут вести разговоры. Они могут звонить людям, задавать вопросы и давать ответы. И, вероятно, они будут делать это все чаще и чаще.

В связи с этим возникает вопрос, выходящий за рамки моего личного опыта. Как мы на самом деле справляемся с ситуацией, когда машины начинают звонить нам?

Приобретение телефонов - уже сегодня деликатная тема

Еще до появления искусственного интеллекта реклама по телефону была деликатной темой. Во многих странах, в том числе в Германии, "холодные звонки", то есть нежелательные звонки потенциальным клиентам, строго ограничены законом. Во многих случаях это просто запрещено, особенно для частных лиц.

Даже в корпоративном секторе такая агитация часто находится в серой зоне. Должен быть предполагаемый интерес, и многие компании сейчас очень болезненно реагируют на нежелательные рекламные звонки.

Причина проста: телефонный звонок сразу же отвлекает людей от их повседневной жизни. В то время как электронное письмо можно проигнорировать, а рекламу в интернете часто просто не замечают, телефонный звонок заставляет собеседника реагировать немедленно. Вы должны решить, взять ли трубку, выслушать или завершить разговор.

Если за такими звонками стоят автоматизированные системы, дискуссия приобретает новое измерение. В конце концов, машины теоретически могут обзванивать тысячи людей в день.


Текущий опрос о цифровизации в повседневной жизни

Как вы оцениваете влияние цифровизации на вашу повседневную жизнь?

Время - самый дефицитный ресурс

На самом деле меня беспокоят такие звонки, и дело даже не в самой технологии. Технологии развиваются, и постоянно появляются новые возможности. Это часть современного мира. Меня больше беспокоит другой вопрос: насколько уважительно компании на самом деле относятся к чужому времени?

Время - это, пожалуй, самый дефицитный ресурс, которым мы располагаем. У каждого из нас есть только ограниченное количество часов в день. И каждый сам решает, как ему провести это время. Непрошеный звонок - неважно, от человека или от машины - посягает на это время.

Если при этом еще и используются автоматизированные системы, позволяющие связаться с максимальным количеством людей, то быстро складывается впечатление, что время звонящего - всего лишь статистический фактор в маркетинговой стратегии. Возможно, именно по этой причине такие звонки часто оставляют неприятное ощущение. Не потому, что технология впечатляет, а потому, что она показывает, как легко автоматизировать общение - даже там, где действительно требуется личное внимание.

Здоровая доза сомнений не повредит

Как бы то ни было, мой небольшой звонок прояснил для меня одну вещь: В будущем, вероятно, будет все труднее распознать, с кем мы на самом деле разговариваем. Телефонные звонки, сообщения в чате, электронные письма - многое из этого теперь можно генерировать автоматически. Голоса могут быть синтезированы, тексты созданы за считанные секунды, а целые разговоры могут быть запрограммированы.

Вот почему здоровая доля сомнения - это, возможно, не самое худшее отношение. Если разговор кажется странно построенным, если ответы формулируются необычно гладко или если от вопросов внезапно уклоняются, возможно, стоит сделать паузу и задать вопросы. Иногда простой вопрос, например:

„Я разговариваю с человеком или с машиной?“

Один этот вопрос может неожиданно направить разговор в совершенно другое русло.

Контракты по телефону? Лучше не надо

Для меня лично этот опыт имеет еще одно последствие. Я бы в любом случае не стал подписывать контракты по телефону - независимо от того, кто является моим собеседником: человек или машина.

Телефонный звонок - это спонтанный момент. У вас нет времени, чтобы спокойно все проверить, ознакомиться с информацией или сравнить предложения. Решения, принятые в таких условиях, редко бывают особенно продуманными.

Если у кого-то есть действительно интересное предложение, он может легко отправить его в письменном виде. Тогда у вас будет возможность спокойно все рассмотреть и принять взвешенное решение. Сегодня это актуально как никогда. Ведь если машины могут вести все более убедительные беседы, то тем более важно не принимать решения, основанные на спонтанном разговоре.

Взгляд в будущее

Возможно, через несколько лет мы привыкнем к подобным ситуациям. Возможно, в какой-то момент станет совершенно нормальным, что некоторые наши разговоры будут происходить с помощью автоматизированных систем. Назначение встреч, обслуживание клиентов или первичные консультации будут осуществляться машинами. Возможно, в какой-то момент две системы будут даже разговаривать друг с другом по телефону - а люди на заднем плане будут видеть только результат.

Находите ли вы это развитие захватывающим или относитесь к нему более критично - это ваш личный вопрос. В любом случае, мой собственный звонок был маленьким моментом, который показал мне, как быстро меняется наш мир общения.

И, возможно, эта статья поможет одному или двум читателям в следующий раз внимательнее прислушаться к неожиданному телефонному звонку.

Никогда не знаешь. Возможно, на другом конце линии даже не окажется человека.


Актуальные статьи по искусственному интеллекту

Часто задаваемые вопросы

  1. Насколько вероятно, что я разговаривал с искусственным интеллектом по телефону, не осознавая этого?
    Теперь это вполне возможно. Современные системы телефонного ИИ способны распознавать речь, формулировать ответы и выдавать их снова естественным голосом. В повседневной жизни многие люди не обращают внимания на такие мелочи, как минимальная задержка ответа или необычно построенные формулировки. Поэтому может случиться так, что разговор будет считаться совершенно нормальным, даже если он уже технически автоматизирован. Такие системы все чаще используются в маркетинге, обслуживании клиентов или при назначении встреч. Зачастую задним числом трудно определить, общались ли вы лично с искусственным интеллектом раньше - но вероятность этого возрастает с каждым техническим прогрессом.
  2. Почему компании используют искусственный интеллект для обзвона людей?
    Основная причина - экономическая. Общение с клиентами по телефону обходится компаниям относительно дорого, поскольку требует наличия персонала, инфраструктуры и организации. Автоматизированные системы, с другой стороны, могут работать круглосуточно и совершать множество звонков одновременно. Компании часто используют такие системы для установления первоначального контакта или предварительной фильтрации потенциальных клиентов. Если партнер по диалогу проявляет интерес, им может заняться сотрудник. Для компаний это означает огромный рост эффективности. Люди задействуются только в тех случаях, когда речь идет о серьезном разговоре.
  3. Действительно ли голос ИИ звучит так же реалистично, как человеческий голос?
    Во многих случаях - да. Современный синтез речи сейчас поражает воображение. Голоса могут генерироваться с естественными интонациями, паузами и даже диалектами. Некоторые системы обучены имитировать типичные особенности человеческой речи, такие как небольшие шумы при дыхании или минимальные задержки в структуре предложения. Благодаря этому голос выглядит гораздо более аутентичным, чем раньше. Если раньше сгенерированные компьютером голоса было легко распознать, то сегодня разница становится все более тонкой. Многие люди в повседневной жизни уже не могут определить, с кем они разговаривают - с машиной или с человеком, просто услышав его голос.
  4. Как распознать, что по телефону со мной разговаривает искусственный интеллект?
    Есть несколько возможных подсказок, хотя ни одна из них не является убедительным доказательством. К ним относятся короткие задержки после высказываний, необычно структурированные ответы или очень ровное течение разговора. Некоторые системы также странно реагируют на неожиданные вопросы и пытаются вернуть разговор к первоначальной теме. Резкое завершение разговора также может быть признаком. Однако важно отметить, что эти характеристики не всегда однозначны. Чем лучше становятся системы, тем сложнее распознать разницу между человеком и машиной в разговоре.
  5. Разрешено ли вообще по закону делать автоматические звонки людям?
    Правовая ситуация во многих странах сложна и иногда строго регламентирована. Несанкционированные рекламные звонки часто запрещены, особенно для частных лиц. В корпоративном секторе также действуют правила, например, предполагаемый интерес. При использовании автоматизированных систем некоторые провайдеры действуют в "серой" правовой зоне. Поэтому многие компании очень осторожно реагируют на непрошеные звонки. Основное правило для звонящих заключается в том, что они не обязаны делать такие звонки или отвечать на предложения.
  6. Почему многих людей беспокоят такие звонки?
    Телефонный звонок оказывает непосредственное влияние на повседневную жизнь. Если рекламу в Интернете или по электронной почте можно игнорировать, то телефонный звонок требует немедленного внимания. Если звонок неожиданный и содержит предложение о продаже, многие люди считают его раздражающим. Если при этом используется автоматический аппарат, у некоторых звонящих складывается впечатление, что их время учитывается только как статистическая переменная в маркетинговой кампании. Такое впечатление может быстро привести к чувству неуважения.
  7. Являются ли такие автоматические звонки признаком того, что людей скоро заменят машины?
    Не обязательно полностью. Во многих сферах автоматизированные системы используются скорее как дополнение. Они берут на себя простые или повторяющиеся задачи, такие как первоначальный контакт или назначение встреч. Более сложные беседы, консультирование или переговоры по-прежнему ведутся людьми. Часто наблюдается тенденция к созданию гибридной модели: машина делает первый шаг, а человек следует за ней. Изменится ли этот баланс в будущем, во многом зависит от того, как будут развиваться технологии и как компании будут их использовать.
  8. Почему некоторые ответы звучали так, будто их зачитывали?
    Многие автоматизированные системы работают с так называемыми скриптами. Это означает, что определенные заявления или предложения состоят из готовых текстовых модулей. В то же время искусственный интеллект может комбинировать эти блоки с индивидуально сгенерированными ответами. Таким образом, разговор иногда кажется спонтанным, а иногда звучит как подготовленный текст. Это создает странное впечатление у партнера по диалогу: ответы в основном соответствуют разговору, но в то же время кажутся необычно структурированными или гладко сформулированными.
  9. Почему системы искусственного интеллекта иногда странно реагируют на неожиданные вопросы?
    Автоматические диалоговые системы обычно обучаются на определенные последовательности разговоров. Они распознают ключевые слова и дают подходящие ответы. Однако если задан вопрос, выходящий за эти рамки, система может столкнуться с трудностями. Некоторые системы пытаются вернуть разговор к первоначальной теме. Другие просто прекращают разговор. Такие реакции иногда кажутся необычными для людей, поскольку мы ожидаем от собеседников спонтанной импровизации.
  10. Возможно ли, чтобы две системы искусственного интеллекта разговаривали друг с другом по телефону?
    Технически это вполне возможно. Если система автоматического вызова встретится с цифровым помощником, то теоретически две машины смогут общаться друг с другом. Обе машины будут распознавать, интерпретировать и реагировать на речь. Такие сценарии пока еще редки, но они показывают, до какой степени можно автоматизировать общение. В будущем такое взаимодействие может происходить все чаще, особенно в области планирования встреч или автоматизированных услуг.
  11. Почему стоит быть осторожным с телефонными предложениями?
    Телефонные звонки - это спонтанные ситуации. Времени на проверку информации или тщательное обдумывание предложения практически нет. Поэтому многие эксперты вообще не советуют принимать важные решения непосредственно по телефону. Если предложение действительно интересно, вы можете попросить предоставить вам информацию в письменном виде. Это даст вам возможность проверить все на досуге и сравнить различные варианты. Такой подход защищает от импульсивных решений и возможного недопонимания.
  12. Что делать, если у меня возникли подозрения, что я разговариваю по телефону с искусственным интеллектом?
    Вначале вы можете реагировать на звонок как обычно и вести разговор, если хотите. Если есть сомнения, можно просто напрямую спросить, не автоматическая ли это система. Другой вариант - вежливо завершить разговор. Никто не обязан участвовать в нежелательных звонках. Прежде всего, важно не позволять давить на себя и не принимать решений, которые заставляют вас чувствовать себя неловко.
  13. Почему эта технология получила такое широкое распространение именно сейчас?
    В настоящее время происходит объединение нескольких технических достижений. Достижения в области распознавания речи, мощные речевые модели и реалистичный синтез речи значительно повысили качество таких систем. В то же время стоимость этой технологии значительно снизилась. Это делает ее привлекательной для многих компаний. То, что раньше было доступно только крупным корпорациям, теперь могут использовать и небольшие компании.
  14. Будет ли в будущем введена маркировка для разговоров с помощью искусственного интеллекта?
    Этот вопрос обсуждается во многих странах. Некоторые эксперты призывают к тому, чтобы автоматизированные системы четко распознавались как ИИ. Другие утверждают, что это будет трудно осуществить или может ограничить использование технологии. Как будет развиваться этот вопрос с юридической точки зрения, пока неизвестно. Однако вполне возможно, что будущие нормативные акты будут требовать большей прозрачности.
  15. Почему многим людям трудно распознать такие системы?
    Люди привыкли автоматически ассоциировать голоса с реальными людьми. Если голос звучит естественно и разговор имеет смысл, мы редко задаемся вопросом. Наш мозг сразу же интерпретирует речь как человеческое общение. Именно этим доверием и пользуются современные системы. Только когда что-то в разговоре кажется необычным - например, странный ответ или неожиданная пауза, - мы начинаем прислушиваться внимательнее.
  16. Являются ли такие технологии принципиально проблематичными?
    Это во многом зависит от того, как их использовать. В некоторых областях автоматизированные разговоры могут быть очень полезны, например, при обслуживании клиентов или при назначении простых встреч. Обычно это становится проблематичным, когда люди не могут понять, что разговаривают с машиной, или когда технология используется для агрессивного маркетинга. Как и в случае со многими другими технологиями, в конечном итоге все сводится к ответственному использованию.
  17. Почему некоторые системы реагируют так резко и внезапно завершают беседу?
    Многие автоматизированные диалоговые системы следуют четко определенным правилам. Если выполняются определенные условия - например, явный отказ от предложения, - система автоматически завершает диалог. Человеку такое поведение иногда кажется грубым или резким, потому что мы привыкли, что разговор может затянуться. Однако для автоматизированной системы это просто запрограммированное решение.
  18. Чему я могу научиться на основе такого опыта?
    Самое главное, пожалуй, - не терять бдительности. Наш мир общения меняется очень быстро. Голоса, тексты и разговоры теперь могут генерироваться автоматически. Здоровая доля сомнения и осознанный подход к таким ситуациям могут помочь нам лучше справляться с ними. Если вы найдете время, чтобы прислушаться и задать вопросы, то иногда поймете больше, чем ожидали.

Актуальные статьи об искусстве и культуре

Оставить комментарий