Глобальный компьютерный разум

Состояние и перспективы

Антон Колонин, 26 апреля 2013 г.

Позавчера в докладе на сибирском форуме «Индустрия информационных систем» я рассказал о теме, которой активно занимался 10-15 лет назад и которая в течении последнего года получила «взрывообразное» развитие, которое может изменить нашу жизь в течении ближайших лет в такой же степени, как это уже сделали персональные компьютеры и интернет.

Сначала — немного истории. Идея о всемирном разуме берет свои корни в 19 веке, когда было предложено создание всемирной энциклопедии и выдвинута концепция общества как особого «социального организма». В начале 20 века возникло понимание о необходимости «распределенной» модели разума — созданием «Мирового мозга» как системы различных энциклопедий, охватывающих различные области человеческого познания. Тогда же были сформулированы идеи ноосферы как сферы человеческого разума планетарного масштаба.

С развитием кибернетики были сформулированы принципы метасистемных переходов, в частности определившие очередную точку сингулярности развития цивилизации как переход от «социального мозга» человечества к глобальному «кибернетическому» мозгу, действующему на над-человеческом уровне. На рубеже веков образовалась «Группа Глобального Мозга», состоящая из ученых, разрабатывающих теоретические, прикладные, этические и прочие аспекты его возникновения. В практической плоскости, в развитие «всемирной паутины» неструктурированных текстовых документов были предложены принципы глобальной структурированной сети сущностей и понятий - «semantic web», и были разработаны технологии формирования этой сети (RDF, OWL, итд.). Одновременно с этим, прикладные приложения искусственного интеллекта подняли уровень распознавания речи и печатного текста до уровня, когда ошибка распознавания не превышает погрешности при наборе на клавиатуре, а ошибка распознавания лиц - приблизились к этому уровню. На этой основе, в последние 10 лет активно развивается методология так называемого «общего искусственного интеллекта», направленная на создание вычислительной модели реализующей абстрактное мышление и осмысленную целенаправленную деятельность на уровне человеческого мышления. Например, возникшая на рубеже веков американская компания Webmind под руководством Бена Гертзеля ставила именно такую цель. Компания потерпела коммерческую неудачу ввиду невостребованности подобных задач в то время, однако идеи остались и развиваются в рамках проекта OpenCog. Около двух десятков лет назад американская компания Cyc начала формирование фундаментальной базовой онтологии и семантической сети — в известной степени при поддержке оборонного ведомства США. История Google, Wikipedia и Facebook известна всем. Что показательно, около 10 лет назад официальные лица Google «открестились» от практической деятельности в части «semantic web» и использования «семантического поиска», высказавшись в том духе, что простой текстовый поиск вполне обеспечивает задачи компании. И вот теперь, менее чем за год, не только произошел полномасштабный запуск системы «семантического поиска» в виде технологии Google Graph, но и был запущен аналогичный проект конкурирующий проект Facebook Social Graph Search, а также произошел ряд знаковых событий, о которых речь пойдет позже.

Введем некоторые определения. Определим разум как способность достижения сложных целей в сложных средах, используя ограниченные ресурсы (формулировка Бена Гертзеля). Цели свободного разумного существа обычно диктуются окружающей средой. Однако при наличии у обладателя разума хозяина (или оператора, как в случае компьютерного разума) они могут также устанавливаться оператором. Заметим, что средой глобального компьютерного разума является наше человеческое окружение, а его ресурсами - все мировые вычислительные ресурсы. В основе же его лежат алгоритмы, основанные на массированной обработке структурированной информации (или «смысловых или семантических сетей»).

Что интересно, критерий разумности подобного разума совершенно не обязательно должен определяется тестом Тьюринга - способностью искусственного разума имитировать человеческое поведение в разговоре. Ведь цели и среда его существенно отличаются от нашей. Вместо нескольких сот миллионов сенсорных клеток человека, черпающих аудиовизуальные и тактильные ощущения из физического мира, глобальный компьютерный разум может черпать свои ощущения из нескольких миллиардов «живых сенсоров», представленных онлайн-пользователями.

Вообще, в типичных дискуссиях по данному вопросу каждый может сформулировать свое отношение в одном из следующих вариантов: «Глобальный компьютерный разум невозможен», «он возможен при определенном стечении обстоятельств, в том числе при помощи людей, создавших необходимые условия», «его возникновение в скором будущем неизбежно» или «он уже здесь, просто мы его не замечаем (в силу того, что находимся по эту сторону метасистемного перехода)».

Какие же цели он может преследовать? Очевидно, принципиальные цели, задаваемые оператором, требуют в первую очередь выявление угроз и поиск возможностей — для самого оператора или сформулированных этим оператором. Далее, активная целенаправленная деятельность интеллектуальной системы взаимодействия с массовым пользователем может заключаться в воздействии на свою среду — формированием спрос на те или иные товары, услуги или политические векторы.

Наряду с принципиальными целями, есть и техническая цель максимально точного удовлетворения поисковых запросов — достижение которой является условием существования самого разума как системы, которая должна удовлетворять своих пользователей и своих сенсорных клеток одновременно. Для достижения этой цели на сегодняшний день необходимы две вещи.

Прежде всего — глубокий смысловой анализ текста (или анализ естественного языка), с целью формирования запросов на уровне понятий, категорий и концепций, а не просто ключевых слов. И это не вопрос праздного удобства пользователя. 10 лет назад, работая в одной американской компании поставляющей передовой по тем временам движок семантического поиска, я имел длительные диспуты с нашим product manager, объясняя ему как эффективно работает поиск на графах при точном задании исходных концепций. На что получал разъяснения, что когда оператору call-center дается считанное количество секунд на обработку входящего звонка в support, у него физически нет времени выбирать позиции из списков на экране, когда как есть время только на то, чтобы быстро ввести текст запроса в поисковое окно (или произнести его вслух, как это уже можно сделать сегодня). Иными словами, для эффективной поисковой системы налицо — требование прохождения как бы «обратного Тьюринг-теста», когда компьютерная система должна воспринять запрос так, как воспринял бы его человек.

Другое требование — необходимость понимания контекста пользователя. Очевидно, что один и тот же запрос «где найти Яву?» может быть обработан по разному. В одном случае, система может помнить, что предыдущие запросы пользователя были про Таиланд и Бали и сделать вывод, что человека интересует отдых на островах. В другом случае, смартфон может передать координаты офиса софтверной компании и станет понятно, что человека на рабочем месте интересует язык программирования. В третьем случае очки «Google Glass» передадут изображение, на котором можно будет идентифицировать ряды супермаркета и пользователю можно будет сообщить номер ряда с кофейным ассортиментом.

Как это работает? 2.5 миллиона активных пользователей загружают страницы, строки статусов, описания своих желаний, свои координаты — явно адресуя их системе или пропуская через нее в виде электронной почты или чата. В ответ они получают ответы и извещения — как отвечающие их запросам, так и преследующие цели самой системы и ее операторов. Многие из сидящих в этом зале (особенно — пользователи Chrome и Android) имеют шансы обрести частичное интеллектуальное бессмертие — в виде своей ментально-поведенческой модели, ассоциированной с логином в социальной сети (например). Более 10 лет назад в компании Webmind целью лаборатории, в которой я работал, было построение именно такой модели. Несколько дней назад Google в полном составе приняла в штат коллектив компании Behavio, имеющей рабочую версию системы, воссоздающей поведенческую модель пользователя смартфона, используя все имеющиеся датчики и проходящую через него аудиовизуальную информацию.

Итак, мы имеем зачатки негуманоидного компьютерного разума, действующего в среде гуманоидов. Насколько богата эта среда и каковы доступные вычислительные ресуры?

Мы видим, что семантическая сеть Goolge Knowledge Graph и Facebook Social Graph содержат более миллиарда вершин в графе и на пару-тройку порядков больше связей между вершинами. При этом, накопленная компанией Cyc почти за полтора десятка лет (при помощи правительственного финансирования) семантическая сеть — только 2 миллиона вершин. Публичная сеть Wikidata за полгода — 1 миллион. Английский лексикон со всеми научными терминами — 1 миллион. Также, мы видим что около трети населения планеты (1 «золотой» миллиард и 1.5 «серебряных» уже подключено к симбиозу с компьютерной системой. Примечательно, что совокупность 7 социальных сетей одного Китая в полтора-два раза по емкости превышает Facebook и Google, что позволяет ожидать колоссальной капитализации социально-компьютерного интеллекта в Китае, при консолидации этих сетей (что можно себе представить в силу административного ресурса, имеющегося в Китае).

Итак, мы видим, что 99% той реальности, которую «глобальный компьютерный разум» имеет в своем ощущении — описывает нас с вами, и 99% этой информации содержится в коммерческих базах данных всего нескольких компаний. Что может создать у кого-то опасения.

Далее, давайте посмотрим, какие вычислительные ресурсы могут быть вовлечены. Грубые осредненные оценки, которые могут быть собраны в интернете, показывают, что параллельные распределенные вычислительные мощности «супер-облака» Google на несколько порядков превышают возможности даже самого мощного суперкомпьютера. В свою очередь, «вычислительная мощь» имеющаяся на руках «населения» (в виде персональных компьютеров и смартфонов) на те же несколько порядков превышает корпоративное «супер-облако». Что дает основания думать о некоторых имеющихся перспективах.

Наконец, давайте посмотрим на то, как распределяется преобладание тех или иных компаний, контролирующих сегменты IT-рынка, обуславливающие возможности развития «глобального разумного киберпространства» разума. Мы видим, как всего несколько компаний доминируют и насколько только одна из них доминирует во всех сегментах, получая исключительные соревновательные возможности. Мы также видим, что переживания антиглобалистов по поводу всего 100 с лишним транснациональных компаний, контролирующих аж целых 40% мирового рынка просто смехотворны в свете имеющей место централизованной интеллектуальной глобализации — 99% структурированных знаний.

Хорошо это или плохо? Принцип «бесплатного сыра в мышеловке» уже приводил к массовой потере данных пользователей Yahoo Geocities (самого массового олайн-сообщества на рубеже веков), или Google Wave, Connect, Health и Reader в недавнем прошлом. При этом, не всегда имеет место фактическая возможность обеспечить конфиденциальность данных, обрабатываемых «облачным сервисом», тем более — в юрисдикции другого государства. Безусловно, капитализация знаний в одних руках дает колоссальные возможности по эффективному использованию этих знаний в интересах всего сообщества. При этом, драматически повышаются соревновательные возможности компаний, обладающих таким ресурсом, а также государств, на чьей территории расположены эти компании. Также, подобный «интеллектуальный коллапс» может привести к исчезновению конкурентной среды развития информационных систем в отрыве от «компаний — хранителей знания».

Может ли быть другой ход развития событий? Давайте посмотрим на две исторические перспективы. Наверху — предложенная Пьером Леви история того, «кто кого связывает в киберпространстве». Сначала были сети транзисторов, их сменили сети компьютеров, на смену им пришли сети документов и вот грядут сети концепций. Однако, если сети компьютеров и сети документов формировали децентрализованные структуры, то локализация сети концепция в локальной компьютерной системе может быть охарактеризовано как возврат к централизованной кибернетической модели - «одному ящику». С другой стороны, внизу показана перспектива развития вычислительных архитектур. Сначала, централизованная модель хост-терминал сменилась децентрализованной моделью сетей персональных компьютеров с толстыми клиентами и тонкими файловыми серверами. Затем, начался процесс постепенной централизации — через сервера баз данных к толстым серверам приложений и тонким клиентам. И наконец сейчас, идет некоторый обратный откат к децентрализации — перенос вычислений на клиентскую сторону - мобильных приложений и толстых клиентов на AJAX.

Возможно, дальнейший рост «толщины клиентов», в случае сопровождения его наращиванием вычислительных мощностей на руках, даст вектор к переносу и части «смысловой обработки» на периферию. Это может создать возможные условия для реализации модели «децентрализованной интеллектуальной глобализации».

В самом деле, эволюция человеческого разума имела место в результате социальных взаимодействий между человеческими индивидуумами, что было взаимообусловлено возникновением структурированного общества и высокоуровневого языка общения, и получило существенный рывок в связи с глобализацией знаний и появления межнациональных языков общения.

Точно так же, эволюция компьютерного разума, очевидно, требует социальных взаимодействий между компьютерными агентами, что может быть обусловлено формированием “онлайн-обществ” компьютерных агентов и высокоуровнего языка общения между ними, что будет существенно более эффективно в случае формирования глобальной сети компьютерных агентов, использующих унифицированный язык общения.

Более подробно я рассказал об этом вчера на следующем докладе в секции «Наукоемкое программное обеспечение».

Итак, что же, все-таки, произошло за последний год? Google Knowledge Graph был запущен в мае прошлого года и спустя полгода, с участием Google, был запущен проект Wikidata — как место сбора публичной структурированной информации. Наконец, в конце прошлого года в Google пришел на работу Ray Kurzweil — один из пионеров многих прикладных приложений искусственного интеллекта — с миссией, в том числе, создания системы глубокого смыслового анализа естественного языка. И в том же году Facebook, наряду с другими компаниями, поддержал законопроект правительства США о распространении и защите информации, предопределяющей передачу данных компаний (в том числе, тех самых 99% данных о нас с вами) государству в целях обеспечения национальной безопасности. Уже в этом году, в самом начале Facebook выступает со своим конкурирующим проектом. Тут же выходит мобильное приложение Yandex Wonder, консолидируюшее учетные записи Facebook, Twitter и других сетей и тут же Facebook перекрывает Яндексу кислород как соревновательной угрозе — проект Yandex Wonder закрывается. Сам же Facebook в прошлом месяце анонсирует Facebook OS, с целью перекрыть пользовательский интерфейс устройств Android и в перспективе перенаправить «поток сознания» части упомянутого выше миллиарда пользователей в свой собственный «мозг» - ждем реакции Google. Между тем, в этом месяце сам Google поддерживает известный законопроект о передаче информации правительственным органам, а также принимает на работу команду Behavio, обладающую технологией поведенческого анализа и моделирования пользователей смартфонов. И в этом же году, с разрывом в несколько месяцев, европейское сообщество утверждает проект инвестиций в создание полномасштабной компьютерной модели человеческого мозга а правительство США — проект полного картирования мозговой активности, аналогичный ранее успешно завершенному проекту по картированию человеческого генома. Как говорится, кто успеет раньше и кто кому поможет...

Что делать?

Хозяевам веб сайтов — знать, каким образом формировать веб-страницы с «двойным дном» - выглядящие так же привлекательно внешне для пользователей-людей, и одновременно насыщенные невидимой «семантической разметкой», считываемой «интеллектуальными пауками», собирающими информацию для смыслового индексирования Google — чтобы ваш сайт мог вернуться пользователю в качестве единственно верного ответа на поисковый запрос, а не 10-ой строкой на второй странице результатов текстового поиска.

Разработчикам - готовится к буму рынка интеллектуальных агентов (на котором уже одиноко бродят первые участники — Siri, Google Now, Sherpa), при этом либо отчетливо понимая модель «рыбки лоцмана», оперирующей в биоценозе с «Большой Акулой», либо четко представляя себе стратегии выхода из бизнеса в случае конфликтов функциональности с Большим Братом (как это случилось с Yandex Wonder).

Для государства — важно понимать, что способность обеспечить национальные проекты интеллектуальной глобализации может оказаться залогом национальной безопасности в самое ближайшее время. Причем речь даже не идет о необходимости финансирования тех или иных разработок — как мы видели, пользующийся поддержкой государства Cyc за десяток с лишним лет собрал толику того, что было собрано коммерческими и публичными проектами за считанные годы. Видимо, ключевым здесь является создание возможности развития конкурентноспособных коммерческих социально-интеллектуальных IT-проектов — в национальных границах.

Ну, и, для всех нас — добро пожаловать в стремительно надвигающееся так называемое «прозрачное общество», или общество тотального фонового краудсорсинга, где каждое произнесенное или напечатанное слово или каждое движение мышью мгновенно может стать предметом мысли глобального суперорганизма.

Приложения:

Презентация к этому докладу

Следующий доклад «Распределенная инженерия знаний»

Вместо послесловия:

Google Acquires Wavii to Beef Up Web-Search 'Knowledge Graph'

Semantic & Graph-Based Search: The Future Face Of Search

This Is How Google (And Its Advertisers) Will Really Get Inside Your Head