Искусственный интернет

Искусственный интеллект интернета. Как нас заставляют лайкать, кликать и покупать

Кажется, что «интернет становится лучше»

Искусственный интеллект (ИИ) интернета уже, вероятно, залез в вашу голову, а если нет — то в ваш бумажник. Вы когда-нибудь ловили себя на том, что битый час смотрите видео на YouTube, хотя не собирались этого делать? Сайт со сверхъестественной догадливостью предлагает вам один за другим ролики, которые вы просто не можете не посмотреть до того, как вернетесь к работе? А Amazon, похоже, знает, что вы хотите купить, раньше, чем вы успеете об этом подумать? Если да, то вы уже пользуетесь преимуществами ИИ интернета (или уже стали его жертвой, в зависимости от того, как вы оцениваете свое время и деньги).

Кай-Фу Ли

ИИ интернета — это в основном рекомендательные алгоритмы: они изучают наши личные предпочтения, а затем предлагают контент, подобранный специально для нас. Эффективность этих механизмов зависит от данных, к которым у них есть доступ, и именно крупные интернет-компании в настоящее время располагают самыми большими объемами цифровых данных в мире.

Однако эти данные становятся действительно полезными для алгоритмов только после того, как они были «размечены». Но вам, как пользователям, не нужно активно «размечать» что-либо — оценивать контент или привязывать к нему ключевые слова. Ярлыки появляются при сопоставлении части данных с конкретным результатом: «купил» против «не купил», «нажал» против «не нажал», «посмотрел до конца» против «перешел на другое видео». Эти метки — наши покупки, «лайки», просмотры или время пребывания на конкретных страницах — в дальнейшем используются для обучения алгоритмов, чтобы те могли предлагать нам подходящий контент.

У обычного пользователя появляется чувство, что интернет «становится лучше» — то есть дает ему то, чего он хочет, — а его интернет-зависимость усиливается.

Это еще одно доказательство силы ИИ: он использует данные, чтобы узнать нас как можно лучше, а затем оптимизирует свои действия, приспосабливаясь к нашим желаниям. Такая оптимизация приводит к существенному увеличению прибыли для интернет-компаний, зарабатывающих деньги на кликах: Google, Baidu, Alibaba, YouTube и их аналогов со всего мира.

Используя ИИ интернета, Alibaba рекомендует вам продукты, которые вы, скорее всего, купите, Google показывает целевую рекламу, на которую вы обязательно кликнете, а YouTube предлагает видеоролики, которые вам захочется просмотреть. Применив те же методы в другом контексте, компания Cambridge Analytica использовала данные Facebook, чтобы лучше повлиять на американских избирателей во время президентской кампании 2016 года. Кстати, считается, что именно Роберт Мерсер, основатель Cambridge Analytica, первым сказал: «Хорошие данные — это очень много данных».

Алгоритмы и редакторы

Первая волна ИИ породила интернет-компании совершенно нового типа. В Китае лидером среди них является Jinri Toutiao (что означает «Сегодняшние заголовки»). Основанную в 2012 году Toutiao иногда называют китайским BuzzFeed, потому что оба сайта служат агрегаторами, преподносящими пользователю «оптимизированные» под его интересы новости. Но на «оптимизации» под индивидуального пользователя сходство и заканчивается. В BuzzFeed штат молодых редакторов ловко готовит оригинальный контент. «Редакторы» Toutiao — это алгоритмы.

Механизмы ИИ Toutiao ищут в интернете контент, используя инструменты обработки естественного языка и компьютерного зрения для анализа материалов широкой сети партнерских сайтов и утвержденных источников. Затем они, опираясь на прошлое поведение своих пользователей — их клики, данные о прочтении, мнения, комментарии и так далее, — создают персонализированные новости, соответствующие интересам каждого человека.

Алгоритмы приложения даже меняют заголовки, чтобы увеличить число кликов.

И чем больше этих кликов, с тем большей точностью Toutiao будет предлагать им контент, который они хотели бы увидеть. Эта положительная обратная связь позволила создать одну из самых востребованных платформ контента в интернете, в приложении которой пользователи проводят в среднем по 74 минуты в день.

Отчеты роботов и фейковые новости

Toutiao использует машинное обучение не только для сбора контента, но и для создания статей и контроля над их содержанием. Во время летних Олимпийских игр 2016 года в Рио-де-Жанейро эта компания вместе с Пекинским университетом работала над созданием «журналиста», который мог бы писать короткие заметки об итогах спортивных событий за несколько минут после их завершения. Статьи получались не совсем «художественными», но скорость была невероятной: по окончании некоторых соревнований «репортер» выпускал короткие резюме в течение двух секунд и «охватывал» более 30 спортивных событий в день.

Алгоритмы также используются для выявления сфабрикованных новостей. Первоначально читатели обнаруживали вводящие в заблуждение тексты и сообщали о них — это была, по существу, бесплатная разметка данных. Затем Toutiao использовала эти помеченные данные, чтобы научить алгоритм самостоятельно распознавать фальшивые новости. А затем она пошла настолько далеко, что даже научила отдельный алгоритм такие новости создавать. Далее оба алгоритма заставили соревноваться в том, чтобы обмануть друг друга. В процессе этой борьбы они совершенствовались.

Основанный на ИИ подход к контенту принес компании огромную прибыль. К концу 2017 года Toutiao уже оценивалась в 20 млрд долларов и вышла на новый круг финансирования, после которого ее оценка может превысить 30 млрд долларов. Для сравнения, BuzzFeed стоит 1,7 млрд. Прогнозируемые доходы Toutiao на 2018 год составляют сумму между 4,5 и 7,6 млрд долларов. Компания прилагает много усилий, чтобы выйти на зарубежные рынки. После предпринятой в 2016 году неудачной попытки купить Reddit, популярный в США сайт-агрегатор, в 2017 году Toutiao прибрала к рукам французский агрегатор новостей и Musical.ly — китайское приложение для караоке, безумно популярное у американских подростков.

Фото: unsplash

Успех Toutiao наглядно демонстрирует достижения Китая в области ИИ интернета. Имея аудиторию из более чем 700 млн интернет-пользователей, говорящих на одном языке, интернет-гиганты Китая зарабатывают огромные деньги на оптимизации онлайн-услуг с помощью ИИ. Это способствовало и быстрому росту рыночной капитализации Tencent, которая в ноябре 2017 года превысила рыночную капитализацию Facebook, а затем перешагнула показатель в 500 млрд долларов. Прежде этого рубежа не достигала ни одна китайская компания. Оставшиеся позади Alibaba и Amazon теперь были вынуждены соревноваться между собой. Несмотря на сильные позиции Baidu в исследовании ИИ, его мобильные сервисы значительно отстают от продуктов Google. Но эту нишу заполнили быстро выросшие китайские компании вроде Toutiao, которые строят свой бизнес на основе ИИ интернета и уже оцениваются в миллиарды долларов.

И прибыль этих интернет-компаний многократно возрастет, когда они научатся еще лучше и дольше удерживать наше внимание и собирать наши клики. В целом китайские и американские компании примерно одинаково сильны в области ИИ интернета, и их шансы на лидерство составляют приблизительно 50 на 50. Я предвижу, что через пять лет китайские технологические компании добьются небольшого преимущества (60 к 40). Мы ведь помним, что в Китае больше пользователей интернета, чем в Соединенных Штатах и всей Европе, вместе взятых, и эти пользователи легко переводят деньги создателям контента, платформам O2O и другим пользователям. Такая комбинация создает почву для выпуска креативных интернет-приложений на основе ИИ и открывает уникальные возможности для монетизации. Добавьте к этому хватких и хорошо финансируемых предпринимателей, и вот уже есть пусть не решающее, но вполне существенное преимущество Китая перед Кремниевой долиной. <…>

Искусственный интеллект восприятия

До появления ИИ все машины были глухими и незрячими. Конечно, вы и раньше могли делать цифровые фотографии или аудиозаписи, но компьютеры не понимали их смысла. С точки зрения обычного компьютера, фотография — просто хаотический набор пикселей, который ему положено хранить. В понимании iPhone песня — это последовательность нулей и единиц, при воспроизведении которых человек получает наслаждение.

Однако с появлением ИИ восприятия все меняется. Алгоритмы могут теперь объединять пиксели фотографий или видеозаписей в значимые кластеры и распознавать объекты, пользуясь теми же механизмами, что и наш мозг: вот золотой ретривер, вот светофор, а вот твой брат Патрик, и так далее. То же самое касается и аудиоданных. Вместо того чтобы просто хранить звуковые архивы в виде последовательностей битов, алгоритмы теперь научились понимать слова, а зачастую и целые предложения.

…Окружающий нас мир будет оцифровываться благодаря распространению датчиков и интеллектуальных устройств.

Эти устройства превращают реалии физического мира в цифровые данные, которые затем могут быть проанализированы и оптимизированы с помощью алгоритмов глубокого обучения. Amazon Echo оцифровывает звуковую среду в домах. «Умный город» от Alibaba переводит городские транспортные потоки в цифровую форму, наблюдая за ними с помощью камер и применяя средства ИИ для распознавания объектов. Камеры Apple iPhone X и Face++ выполняют ту же самую оцифровку для лиц, используя полученные данные для защиты телефонов или цифровых кошельков.

Размытые границы и слияние миров

ИИ восприятия начинает стирать границы, разделяющие онлайн- и офлайн-миры. Он делает это, резко увеличивая число точек соприкосновения, через которые мы взаимодействуем с интернетом.

До появления ИИ восприятия мы делали это через клавиатуру нашего компьютера или экран смартфона. Эти устройства до сих пор выступают в качестве основных порталов в мир интернета, но они довольно неудобны и для ввода, и для извлечения информации, особенно когда вы делаете покупки или ведете автомобиль в реальном мире.

Фото: unsplash

По мере того как ИИ восприятия начинает лучше распознавать наши лица, понимать нашу речь и видеть мир вокруг нас, он создает миллионы новых точек соприкосновения между онлайн- и офлайн-мирами. Эти узлы со временем окружат нас настолько, что словосочетание «войти в интернет» исчезнет из нашей речи.

ООМ — следующий шаг в эволюции ИИ, которая уже привела нас от чисто электронной коммерции к оказанию услуг O2O (онлайн для офлайна). Каждый из этих шагов означал строительство новых мостов между онлайн-миром и нашим, физическим, но наступление эпохи ООМ будет означать их полную интеграцию. В недалеком будущем ИИ восприятия превратит торговые центры, гастрономы, улицы городов и наши дома в среду ООМ. Некоторые созданные при этом приложения позволят обычным пользователям почувствовать себя так, словно они оказались в фантастическом фильме.

Такие приложения уже есть. Один ресторан KFC в Китае недавно объединился с Alipay и ввел в нескольких своих филиалах оплату через сканирование лица посетителя. Посетитель выбирает на цифровом терминале свой заказ, система сканирует его лицо и находит соответствующую учетную запись Alipay: никаких наличных денег, карт или мобильных телефонов не требуется. В систему входит даже специальный алгоритм проверки, чтобы никто не мог использовать чужую фотографию. Приложения «плати лицом» — это забавно, но они всего лишь верхушка айсберга ООМ.

Политика конфиденциальности

Настоящая Политика конфиденциальности персональных данных (далее – Политика конфиденциальности) действует в отношении всей информации, которую данный сайт, на котором размещен текст этой Политики конфиденциальности, может получить о Пользователе, а также любых программ и продуктов, размещенных на нем.

1. ОПРЕДЕЛЕНИЕ ТЕРМИНОВ

1.1 В настоящей Политике конфиденциальности используются следующие термины:

1.1.1. «Администрация сайта» – уполномоченные сотрудники на управления сайтом, действующие от его имени, которые организуют и (или) осуществляет обработку персональных данных, а также определяет цели обработки персональных данных, состав персональных данных, подлежащих обработке, действия (операции), совершаемые с персональными данными.

1.1.2. «Персональные данные» — любая информация, относящаяся к прямо или косвенно определенному или определяемому физическому лицу (субъекту персональных данных).

1.1.3. «Обработка персональных данных» — любое действие (операция) или совокупность действий (операций), совершаемых с использованием средств автоматизации или без использования таких средств с персональными данными, включая сбор, запись, систематизацию, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передачу (распространение, предоставление, доступ), обезличивание, блокирование, удаление, уничтожение персональных данных.

1.1.4. «Конфиденциальность персональных данных» — обязательное для соблюдения Администрацией сайта требование не допускать их умышленного распространения без согласия субъекта персональных данных или наличия иного законного основания.

1.1.5. «Пользователь сайта (далее Пользователь)» – лицо, имеющее доступ к сайту, посредством сети Интернет и использующее данный сайт для своих целей.

1.1.6. «Cookies-файлы» — небольшой фрагмент данных, отправленный веб-сервером и хранимый на компьютере пользователя, который веб-клиент или веб-браузер каждый раз пересылает веб-серверу в HTTP-запросе при попытке открыть страницу соответствующего сайта.

1.1.7. «IP-адрес» — уникальный сетевой адрес узла в компьютерной сети, построенной по протоколу IP.

2. ОБЩИЕ ПОЛОЖЕНИЯ

2.1. Использование Пользователем сайта означает согласие с настоящей Политикой конфиденциальности и условиями обработки персональных данных Пользователя.

2.2. В случае несогласия с условиями Политики конфиденциальности Пользователь должен прекратить использование сайта.

2.3. Настоящая Политика конфиденциальности применяется только к данному сайту. Администрация сайта не контролирует и не несет ответственность за сайты третьих лиц, на которые Пользователь может перейти по ссылкам, доступным на данном сайте.

2.4. Администрация сайта не проверяет достоверность персональных данных, предоставляемых Пользователем сайта.

3. ПРЕДМЕТ ПОЛИТИКИ КОНФИДЕНЦИАЛЬНОСТИ

3.1. Настоящая Политика конфиденциальности устанавливает обязательства Администрации сайта по умышленному неразглашению персональных данных, которые Пользователь предоставляет по разнообразным запросам Администрации сайта (например, при заполнении заявок и т.п).

3.2. Персональные данные, разрешённые к обработке в рамках настоящей Политики конфиденциальности, предоставляются Пользователем путём заполнения специальных форм на Сайте и обычно включают в себя следующую информацию:

3.2.1. фамилию, имя, отчество Пользователя;

3.2.2. номер учебного класса Пользователя;

3.2.3. контактный телефон Пользователя;

3.2.4. место жительство Пользователя и другие данные.

3.3. Администрация сайта также принимает усилия по защите Персональных данных, которые автоматически передаются в процессе посещения страниц сайта:

IP адрес;
информация из cookies;
информация о браузере (или иной программе, которая осуществляет доступ к сайту);
время доступа;
посещенные адреса страниц;
реферер (адрес предыдущей страницы) и т.п.

3.3.1. Отключение cookies может повлечь невозможность доступа к сайту.

3.3.2. Сайт осуществляет сбор статистики об IP-адресах своих посетителей. Данная информация используется с целью выявления и решения технических проблем, для контроля корректности проводимых операций.

3.4. Любая иная персональная информация неоговоренная выше (используемые браузеры, операционные системы и т.д.) не подлежит умышленному разглашению, за исключением случаев, предусмотренных в п. 6.2. настоящей Политики конфиденциальности.

4. ЦЕЛИ СБОРА ПЕРСОНАЛЬНОЙ ИНФОРМАЦИИ ПОЛЬЗОВАТЕЛЯ

4.1. Персональные данные Пользователя Администрация сайта может использовать в целях:

4.1.1. Идентификации Пользователя, зарегистрированного на сайте, для оформления заявки и (или) заключения Договора.

4.1.2. Установления с Пользователем обратной связи, включая направление уведомлений, запросов, касающихся использования сайта, оказания услуг, обработка запросов и заявок от Пользователя.

4.1.3. Определения места нахождения Пользователя для обеспечения безопасности, предотвращения мошенничества.

4.1.4. Подтверждения достоверности и полноты персональных данных, предоставленных Пользователем.

4.1.5. Предоставления доступа Пользователю на сторонние сайты или сервисы партнеров данного сайта с целью получения их предложений, обновлений или услуг.

5. УВЕДОМЛЕНИЕ ОБ ИСПОЛЬЗОВАНИИ ФАЙЛОВ COOKIE

5.1. Сайт использует файлы cookie, которые помогают оптимизировать процесс использования сайта Пользователем.

5.2. Ряд cookie-файлов веб-сайта используется только во время нахождения Пользователя на нём и удаляется при закрытии браузера. Другие cookie-файлы используются для того, чтобы запомнить, когда Пользователь возвращается на веб-сайт, и у них более продолжительный срок действия.

5.3. Сайт использует cookie-файлы третьих сторон: Яндекс.Метрика, Яндекс.Карты.

5.4. Cookie-файлы, которые сохраняются через веб-сайт, не содержат данных, на основании которых можно идентифицировать личность Пользователя.

5.5. Информацию об отключении возможности хранения cookie-файлов, а также о процедуре удаления cookie-файлов, можно получить в руководстве к браузеру Пользователя.

5.6. При отключении возможности хранения cookie-файлов Администрация сайта не гарантирует корректную работу сайта в браузере Пользователя.

6. СПОСОБЫ И СРОКИ ОБРАБОТКИ ПЕРСОНАЛЬНОЙ ИНФОРМАЦИИ

6.1. Обработка персональных данных Пользователя осуществляется без ограничения срока, любым законным способом, в том числе в информационных системах персональных данных с использованием средств автоматизации или без использования таких средств.

6.2. Персональные данные Пользователя могут быть переданы уполномоченным органам государственной власти только по основаниям и в порядке, установленным действующим законодательством.

7. ОБЯЗАТЕЛЬСТВА СТОРОН

7.1. Пользователь обязуется:

7.1.1. Предоставить корректную и правдивую информацию о персональных данных, необходимую для пользования сайтом.

7.1.2. Обновить или дополнить предоставленную информацию о персональных данных в случае изменения данной информации.

7.1.3. Принимать меры для защиты доступа к своим конфиденциальным данным, хранящимся на сайте.

7.2. Администрация сайта обязуется:

7.2.1. Использовать полученную информацию исключительно для целей, указанных в п. 4 настоящей Политики конфиденциальности.

7.2.2. Не разглашать персональных данных Пользователя, за исключением п. 6.2. настоящей Политики Конфиденциальности.

7.2.3. Осуществить блокирование персональных данных, относящихся к соответствующему Пользователю, с момента обращения или запроса Пользователя или его законного представителя либо уполномоченного органа по защите прав субъектов персональных данных на период проверки, в случае выявления недостоверных персональных данных или неправомерных действий.

8. ОТВЕТСТВЕННОСТЬ СТОРОН

8.1. Администрация сайта несёт ответственность за умышленное разглашение Персональных данных Пользователя в соответствии с действующим законодательством, за исключением случаев, предусмотренных п.п. 6.2. и 8.2. настоящей Политики Конфиденциальности.

8.2. В случае утраты или разглашения Персональных данных Администрация сайта не несёт ответственность, если данная конфиденциальная информация:

8.2.1. Стала публичным достоянием до её утраты или разглашения.

8.2.2. Была получена от третьей стороны до момента её получения Администрацией сайта.

8.2.3. Была получена третьими лицами путем несанкционированного доступа к файлам сайта.

8.2.4. Была разглашена с согласия Пользователя.

8.3. Пользователь несёт ответственность за правомерность, корректность и правдивость предоставленной Персональных данных в соответствии с действующим законодательством.

9. РАЗРЕШЕНИЕ СПОРОВ

9.1. До обращения в суд с иском по спорам, возникающим из отношений между Пользователем сайта и Администрацией сайта, обязательным является предъявление претензии (письменного предложения о добровольном урегулировании спора).

9.2. Получатель претензии в течение 30 календарных дней со дня получения претензии, письменно уведомляет заявителя претензии о результатах рассмотрения претензии.

9.3. При не достижении соглашения спор будет передан на рассмотрение в судебный орган в соответствии с действующим законодательством.

9.4. К настоящей Политике конфиденциальности и отношениям между Пользователем и Администрацией сайта применяется действующее законодательство.

10. ДОПОЛНИТЕЛЬНЫЕ УСЛОВИЯ

10.1. Администрация сайта вправе вносить изменения в настоящую Политику конфиденциальности без согласия Пользователя.

10.2. Новая Политика конфиденциальности вступает в силу с момента ее размещения на Сайте, если иное не предусмотрено новой редакцией Политики конфиденциальности.