Глобальный компьютерный разум Состояние и перспективы Антон Колонин, 26 апреля 2013 г. Позавчера в докладе на сибирском форуме «Индустрия информационных систем» я рассказал о теме, которой активно занимался 10-15 лет назад и которая в течении последнего года получила «взрывообразное» развитие, которое может изменить нашу жизь в течении ближайших лет в такой же степени, как это уже сделали персональные компьютеры и интернет. Сначала — немного истории. Идея о всемирном разуме берет свои корни в 19 веке, когда было предложено создание всемирной энциклопедии и выдвинута концепция общества как особого «социального организма». В начале 20 века возникло понимание о необходимости «распределенной» модели разума — созданием «Мирового мозга» как системы различных энциклопедий, охватывающих различные области человеческого познания. Тогда же были сформулированы идеи ноосферы как сферы человеческого разума планетарного масштаба.
Введем некоторые определения. Определим разум как способность достижения сложных целей в сложных средах, используя ограниченные ресурсы (формулировка Бена Гертзеля). Цели свободного разумного существа обычно диктуются окружающей средой. Однако при наличии у обладателя разума хозяина (или оператора, как в случае компьютерного разума) они могут также устанавливаться оператором. Заметим, что средой глобального компьютерного разума является наше человеческое окружение, а его ресурсами - все мировые вычислительные ресурсы. В основе же его лежат алгоритмы, основанные на массированной обработке структурированной информации (или «смысловых или семантических сетей»). Что интересно, критерий разумности подобного разума совершенно не обязательно должен определяется тестом Тьюринга - способностью искусственного разума имитировать человеческое поведение в разговоре. Ведь цели и среда его существенно отличаются от нашей. Вместо нескольких сот миллионов сенсорных клеток человека, черпающих аудиовизуальные и тактильные ощущения из физического мира, глобальный компьютерный разум может черпать свои ощущения из нескольких миллиардов «живых сенсоров», представленных онлайн-пользователями. Вообще, в типичных дискуссиях по данному вопросу каждый может сформулировать свое отношение в одном из следующих вариантов: «Глобальный компьютерный разум невозможен», «он возможен при определенном стечении обстоятельств, в том числе при помощи людей, создавших необходимые условия», «его возникновение в скором будущем неизбежно» или «он уже здесь, просто мы его не замечаем (в силу того, что находимся по эту сторону метасистемного перехода)». Какие же цели он может преследовать? Очевидно, принципиальные цели, задаваемые оператором, требуют в первую очередь выявление угроз и поиск возможностей — для самого оператора или сформулированных этим оператором. Далее, активная целенаправленная деятельность интеллектуальной системы взаимодействия с массовым пользователем может заключаться в воздействии на свою среду — формированием спрос на те или иные товары, услуги или политические векторы. Наряду с принципиальными целями, есть и техническая цель максимально точного удовлетворения поисковых запросов — достижение которой является условием существования самого разума как системы, которая должна удовлетворять своих пользователей и своих сенсорных клеток одновременно. Для достижения этой цели на сегодняшний день необходимы две вещи. Прежде всего — глубокий смысловой анализ текста (или анализ естественного языка), с целью формирования запросов на уровне понятий, категорий и концепций, а не просто ключевых слов. И это не вопрос праздного удобства пользователя. 10 лет назад, работая в одной американской компании поставляющей передовой по тем временам движок семантического поиска, я имел длительные диспуты с нашим product manager, объясняя ему как эффективно работает поиск на графах при точном задании исходных концепций. На что получал разъяснения, что когда оператору call-center дается считанное количество секунд на обработку входящего звонка в support, у него физически нет времени выбирать позиции из списков на экране, когда как есть время только на то, чтобы быстро ввести текст запроса в поисковое окно (или произнести его вслух, как это уже можно сделать сегодня). Иными словами, для эффективной поисковой системы налицо — требование прохождения как бы «обратного Тьюринг-теста», когда компьютерная система должна воспринять запрос так, как воспринял бы его человек. Другое требование — необходимость понимания контекста пользователя. Очевидно, что один и тот же запрос «где найти Яву?» может быть обработан по разному. В одном случае, система может помнить, что предыдущие запросы пользователя были про Таиланд и Бали и сделать вывод, что человека интересует отдых на островах. В другом случае, смартфон может передать координаты офиса софтверной компании и станет понятно, что человека на рабочем месте интересует язык программирования. В третьем случае очки «Google Glass» передадут изображение, на котором можно будет идентифицировать ряды супермаркета и пользователю можно будет сообщить номер ряда с кофейным ассортиментом.
Итак, мы имеем зачатки негуманоидного компьютерного разума, действующего в среде гуманоидов. Насколько богата эта среда и каковы доступные вычислительные ресуры? Мы видим, что семантическая сеть Goolge Knowledge Graph и Facebook Social Graph содержат более миллиарда вершин в графе и на пару-тройку порядков больше связей между вершинами. При этом, накопленная компанией Cyc почти за полтора десятка лет (при помощи правительственного финансирования) семантическая сеть — только 2 миллиона вершин. Публичная сеть Wikidata за полгода — 1 миллион. Английский лексикон со всеми научными терминами — 1 миллион. Также, мы видим что около трети населения планеты (1 «золотой» миллиард и 1.5 «серебряных» уже подключено к симбиозу с компьютерной системой. Примечательно, что совокупность 7 социальных сетей одного Китая в полтора-два раза по емкости превышает Facebook и Google, что позволяет ожидать колоссальной капитализации социально-компьютерного интеллекта в Китае, при консолидации этих сетей (что можно себе представить в силу административного ресурса, имеющегося в Китае).
Далее, давайте посмотрим, какие вычислительные ресурсы могут быть вовлечены. Грубые осредненные оценки, которые могут быть собраны в интернете, показывают, что параллельные распределенные вычислительные мощности «супер-облака» Google на несколько порядков превышают возможности даже самого мощного суперкомпьютера. В свою очередь, «вычислительная мощь» имеющаяся на руках «населения» (в виде персональных компьютеров и смартфонов) на те же несколько порядков превышает корпоративное «супер-облако». Что дает основания думать о некоторых имеющихся перспективах.
Может ли быть другой ход развития событий? Давайте посмотрим на две исторические перспективы. Наверху — предложенная Пьером Леви история того, «кто кого связывает в киберпространстве». Сначала были сети транзисторов, их сменили сети компьютеров, на смену им пришли сети документов и вот грядут сети концепций. Однако, если сети компьютеров и сети документов формировали децентрализованные структуры, то локализация сети концепция в локальной компьютерной системе может быть охарактеризовано как возврат к централизованной кибернетической модели - «одному ящику». С другой стороны, внизу показана перспектива развития вычислительных архитектур. Сначала, централизованная модель хост-терминал сменилась децентрализованной моделью сетей персональных компьютеров с толстыми клиентами и тонкими файловыми серверами. Затем, начался процесс постепенной централизации — через сервера баз данных к толстым серверам приложений и тонким клиентам. И наконец сейчас, идет некоторый обратный откат к децентрализации — перенос вычислений на клиентскую сторону - мобильных приложений и толстых клиентов на AJAX.
В самом деле, эволюция человеческого разума имела место в результате социальных взаимодействий между человеческими индивидуумами, что было взаимообусловлено возникновением структурированного общества и высокоуровневого языка общения, и получило существенный рывок в связи с глобализацией знаний и появления межнациональных языков общения. Точно так же, эволюция компьютерного разума, очевидно, требует социальных взаимодействий между компьютерными агентами, что может быть обусловлено формированием “онлайн-обществ” компьютерных агентов и высокоуровнего языка общения между ними, что будет существенно более эффективно в случае формирования глобальной сети компьютерных агентов, использующих унифицированный язык общения. Более подробно я рассказал об этом вчера на следующем докладе в секции «Наукоемкое программное обеспечение». Итак, что же, все-таки, произошло за последний год? Google Knowledge Graph был запущен в мае прошлого года и спустя полгода, с участием Google, был запущен проект Wikidata — как место сбора публичной структурированной информации. Наконец, в конце прошлого года в Google пришел на работу Ray Kurzweil — один из пионеров многих прикладных приложений искусственного интеллекта — с миссией, в том числе, создания системы глубокого смыслового анализа естественного языка. И в том же году Facebook, наряду с другими компаниями, поддержал законопроект правительства США о распространении и защите информации, предопределяющей передачу данных компаний (в том числе, тех самых 99% данных о нас с вами) государству в целях обеспечения национальной безопасности. Уже в этом году, в самом начале Facebook выступает со своим конкурирующим проектом. Тут же выходит мобильное приложение Yandex Wonder, консолидируюшее учетные записи Facebook, Twitter и других сетей и тут же Facebook перекрывает Яндексу кислород как соревновательной угрозе — проект Yandex Wonder закрывается. Сам же Facebook в прошлом месяце анонсирует Facebook OS, с целью перекрыть пользовательский интерфейс устройств Android и в перспективе перенаправить «поток сознания» части упомянутого выше миллиарда пользователей в свой собственный «мозг» - ждем реакции Google. Между тем, в этом месяце сам Google поддерживает известный законопроект о передаче информации правительственным органам, а также принимает на работу команду Behavio, обладающую технологией поведенческого анализа и моделирования пользователей смартфонов. И в этом же году, с разрывом в несколько месяцев, европейское сообщество утверждает проект инвестиций в создание полномасштабной компьютерной модели человеческого мозга а правительство США — проект полного картирования мозговой активности, аналогичный ранее успешно завершенному проекту по картированию человеческого генома. Как говорится, кто успеет раньше и кто кому поможет...
Хозяевам веб сайтов — знать, каким образом формировать веб-страницы с «двойным дном» - выглядящие так же привлекательно внешне для пользователей-людей, и одновременно насыщенные невидимой «семантической разметкой», считываемой «интеллектуальными пауками», собирающими информацию для смыслового индексирования Google — чтобы ваш сайт мог вернуться пользователю в качестве единственно верного ответа на поисковый запрос, а не 10-ой строкой на второй странице результатов текстового поиска. Разработчикам - готовится к буму рынка интеллектуальных агентов (на котором уже одиноко бродят первые участники — Siri, Google Now, Sherpa), при этом либо отчетливо понимая модель «рыбки лоцмана», оперирующей в биоценозе с «Большой Акулой», либо четко представляя себе стратегии выхода из бизнеса в случае конфликтов функциональности с Большим Братом (как это случилось с Yandex Wonder). Для государства — важно понимать, что способность обеспечить национальные проекты интеллектуальной глобализации может оказаться залогом национальной безопасности в самое ближайшее время. Причем речь даже не идет о необходимости финансирования тех или иных разработок — как мы видели, пользующийся поддержкой государства Cyc за десяток с лишним лет собрал толику того, что было собрано коммерческими и публичными проектами за считанные годы. Видимо, ключевым здесь является создание возможности развития конкурентноспособных коммерческих социально-интеллектуальных IT-проектов — в национальных границах. Ну, и, для всех нас — добро пожаловать в стремительно надвигающееся так называемое «прозрачное общество», или общество тотального фонового краудсорсинга, где каждое произнесенное или напечатанное слово или каждое движение мышью мгновенно может стать предметом мысли глобального суперорганизма.
Приложения: Следующий доклад «Распределенная инженерия знаний»
Вместо послесловия: Google Acquires Wavii to Beef Up Web-Search 'Knowledge Graph' Semantic & Graph-Based Search: The Future Face Of Search This Is How Google (And Its Advertisers) Will Really Get Inside Your Head
|