Читать книгу Всё об искусственном интеллекте за 60 минут - Питер Дж. Бентли - Страница 12

02. Выбор верного пути
Хранение знаний

Многие идеи символического ИИ связаны с тем, как лучше всего представлять и использовать информацию. Правила и структурированные фреймы (формы представления знаний) слились с объектно ориентированными языками программирования, и сегодня существует множество способов хранения знаний: например, вкладывание, при котором родительский объект «дерево» содержит дочерние элементы «дуб» и «береза», или передача сообщений, при которой объект «продавец» может отправить аргумент «скидка 10 %», чтобы вызвать действие с объектом «цена». Были созданы языки для представления всех знаний, иногда называемые онтологическими, со своими сложными структурами и правилами. Все они основаны на логике и могут быть объединены с автоматизированными системами формирования рассуждений, для того чтобы логически выводить новые факты, которые затем могут быть добавлены к их знаниям, или проверять соответствие существующих фактов.

Например, ИИ узнал, что «велосипед» – это вид «транспорта с педальным приводом», имеющий «два колеса». Если «тандем» – это вид «транспорта с педальным приводом», который тоже имеет «два колеса», то ИИ легко может вывести новый факт: «тандем – это разновидность велосипеда». Но другой вид «транспорта с педальным приводом», имеющий «ноль колес», не соответствует этому правилу, поэтому ИИ придет к выводу, что «катамаран» не является «велосипедом».

С развитием интернета компилировать обширный набор фактов становится все проще и проще. И одно из основных направлений при разработке общего искусственного интеллекта – это объединение достаточного объема знаний, чтобы ИИ мог начать помогать нам во многих областях. Cyc – один из таких проектов, который в течение нескольких десятилетий собирал факты и взаимосвязи, формируя гигантскую базу.

Уильям Тунсталл-Педо развил эту идею. Он создал True Knowledge («Подлинное знание») – программу, сформировавшую обширную сеть знаний, предоставляемых пользователями интернета. Она насчитывает более 300 миллионов фактов. В 2010 году Тунсталл-Педо решил, поскольку ИИ уже знает так много, задать ему вопрос, на который не сможет ответить ни один человек: «Нам пришло в голову, что, имея дело с более чем 300 миллионами фактов, большой процент которых связывает события, людей и места с определенными точками во времени, мы сможем вычислить объективный ответ на вопрос “Какой день в истории был самым скучным?”».

Программа True Knowledge изучила все дни, о которых знала с начала XX века, и пришла к выводу, что ответ – 11 апреля 1954 года. В этот день, согласно ИИ, состоялись всеобщие выборы в Бельгии, родился турецкий академик Абдулла Аталар и умер футболист Джек Шаффлботэм. Подобных событий оказалось меньше по сравнению со всеми другими днями, поэтому ИИ решил, что это самый скучный день. True Knowledge в конечном итоге стала Evi – ИИ, которому вы можете задать вопросы или просто предложить поговорить. В 2012 году Evi приобрела компания Amazon и превратила ее в Amazon Echo – известный домашний говорящий ИИ.

Символический ИИ развивается вместе с интернетом. В то время как ИИ, такие как Cyc и Evi, полагались на тысячи пользователей, предоставлявших сведения вручную, сэр Тим Бернерс-Ли, создатель Всемирной паутины, давно высказал идею, что WWW (World Wide Web) должна стать GGG (Giant Global Graph) – гигантским глобальным графом[6] данных. То есть помимо того, что веб-сайты стоит делать удобными для пользователей, на них также необходимо хранить данные в форме, понятной компьютерам. Сайты традиционно создавались как документы с текстом, изображениями и видео или как программы со сценариями, которые запускаются при заполнении форм и нажатии кнопок. В мечтах же Бернерса-Ли внутри каждой веб-страницы данные поименованы и имеют уникальные идентификаторы. В семантической паутине веб-сайты становятся базами данных сведений, где каждый элемент является самостоятельным объектом, который может быть найден независимо и имеет четкую текстовую метку или тип. Если вся WWW станет GGG, то наши ИИ смогут искать знания всего мира, рассуждать о них и делать выводы.

Эта великая мечта о символическом ИИ, к сожалению, не была принята большинством веб-разработчиков – они продолжают размещать огромные объемы данных в интернете в форме, которую ИИ с трудом распознает. Но такая необходимость становится насущной. Было подсчитано, что в 2019 году 80 % новых данных оказались неструктурированными, то есть не были представлены в такой форме, которую могут понять компьютеры, – это текстовые документы, изображения и видео. (Подумайте обо всех электронных письмах и отчетах, которые вы пишете в виде «свободного текста», не разбивая его на разделы. Или о фотографиях и видео, что вы снимаете на телефон, – вы не просматриваете и не обозначаете каждую сцену или элемент в кадре.) В то же время объем данных растет с каждым годом. В 2019 году число пользователей интернета составило 4,4 миллиарда, что на 80 % больше чем пятью годами ранее, и ежедневно отправлялось 293 миллиарда электронных писем. Каждую секунду в Google создавалось 40 000 поисковых запросов и публиковалось 7 800 твитов. Все больше и больше компаний использовали интернет в качестве части своего бизнеса и генерировали огромные объемы данных. В 2016 году в день собиралось 44 миллиарда гигабайт данных. Подсчитано, что к 2025 году в день мы будем генерировать 463 миллиарда гигабайт.

У меня есть мечта…[7] Машины смогут анализировать все данные в сети… сегодняшние механизмы торговли, бюрократии и повседневной жизни будут управляться машинами, разговаривающими с машинами, оставив людям вдохновение и интуицию.
ТИМ БЕРНЕРС-ЛИ (2000)

У нас больше нет выбора: ни один человек не сможет осмыслить эти ошеломляющие объемы данных. Наша единственная надежда – использовать ИИ в качестве помощника. К счастью, об этом речь пойдет в следующих главах, другие формы ИИ теперь способны обрабатывать неструктурированные и немаркированные данные и помечать их особыми метками, давая символическим ИИ то, что им необходимо, чтобы оперировать такими данными. В конце концов, пожалуй, не имеет значения, будет ли это истинный интеллект (сильный ИИ) или своего рода притворный (слабый ИИ). Обработка символьных сетей в соответствии с правилами позволяет нашим компьютерам осмысливать обширную вселенную данных. Так что, возможно, мечта Бернерса-Ли однажды все же станет реальностью.

6

Граф – структура данных, состоящая из множества вершин и ребер, соединяющих их.

7

Отсылка к наиболее известной речи Мартина Лютера Кинга I have a dream («У меня есть мечта»).

Всё об искусственном интеллекте за 60 минут

Подняться наверх

Читать книгу Всё об искусственном интеллекте за 60 минут - Питер Дж. Бентли - Страница 12

02. Выбор верного путиХранение знаний

6

7

02. Выбор верного пути
Хранение знаний