Читать книгу Применение элементов искусственного интеллекта в решении прикладных задач - Вадим Николаевич Шмаль - Страница 10
Семантическая неоднородность
ОглавлениеСемантическая неоднородность возникает, когда схема базы данных или наборы данных для одного и того же домена разрабатываются независимыми сторонами, что приводит к различиям в значении и интерпретации значений данных. Чтобы различать базы данных и наборы данных с разными целями и структурами авторства, метаданные в разных хранилищах данных иногда помечаются тегами метаданных, описывающими запрос и точку сбора. Это называется семантической неоднородностью.
Например, схемы базы данных могут быть разработаны для разных приложений с разными семантическими структурами, но с согласованностью. С другой стороны, наборы данных и ресурсы могут извлекаться разными способами и представлять разные информационные ресурсы. Аналитика данных – это процесс сведения информации к ее наиболее релевантной сути, оценки актуальности и интерпретации различных объектов данных и информационных точек на основе их связи с другими данными.
Семантическая неоднородность играет ключевую роль во многих случаях, например:
Эффективное управление знаниями, управление рассредоточенными, сложными и постоянно меняющимися активами знаний.
Создание ориентированной на человека инфографики, веб-приложений или аудиовизуального контента в системах управления знаниями.
Независимо разработанные базы данных знаний и мультимедийные среды (например, веб-сайты, веб-приложения) уже используются многими профессионалами. И теперь быстрорастущий рынок Интернета вещей (IoT) все больше внимания уделяет совершенствованию встроенных устройств, таких как интеллектуальные устройства и датчики, которые являются источниками знаний, а также информации. И хотя самоорганизующиеся и самонастраивающиеся системы все чаще встречаются в динамических промышленных системах, более разнообразные подходы новых поколений экспертов по всему миру вдохновляют на создание совершенно новых концепций в управлении знаниями. Это также проявляется в разработке подходов к базам данных для конкретных приложений, которые специфичны для каждой области или проекта.
Учитывая разные уровни накопления знаний в разных областях, мы не ожидаем, что базы данных для конкретных приложений в системах управления знаниями будут использоваться для всех видов данных. Только представьте, если бы в системе управления знаниями, основанной на данных, можно было бы найти только базу данных или запрос, который подходит для приложения. Это может показаться в некоторых случаях слишком простым, а иногда и слишком наивным. Когда мы имеем дело с несколькими системами данных для управления знаниями, мы ожидаем, что базы данных или механизмы запросов разного уровня сложности смогут работать вместе. Это могло привести к созданию многочисленных баз данных и механизмов запросов, что привело к семантической неоднородности.
В настоящее время, когда все больше и больше баз данных разрабатываются на основе конкретных баз данных по одной и той же теме, может возникнуть необходимость в определении новых наборов данных (образцов) для каждой базы данных или запроса к базе данных. Некоторые решения существуют, например, для классификации полей метаданных в базах данных и базах данных для разных коллекций. Но задача состоит в том, чтобы как можно чаще использовать существующие базы данных, а не создавать новые базы данных с разными целями.
Еще одним хорошим примером семантической неоднородности является множество программных платформ и механизмов обработки данных, используемых для веб-сервисов. У каждой платформы и базы данных есть свой способ отображения данных. Важно не использовать разные источники данных для разных веб-приложений, а найти способ согласовать разные источники данных с разными веб-приложениями. Хотя источники данных, управление данными, приложения и системы неоднородны, нам нужна база данных, которая предоставляет все необходимые данные, когда требуются разные приложения или системы. И по мере разработки новых платформ и баз данных можно ожидать, что семантическая неоднородность останется ключевой особенностью систем анализа данных.