Введение в суперсет
Superset — это инкубационный веб-проект визуализации корпоративных данных, поддерживаемый Apache Software Foundation. Имеет следующие характеристики:
- Включены богатые стили диаграмм данных
- Поддерживает несколько источников данных (Oracle, MySQL, Postgres, MariaDB и т. д.)
- Предоставляет простой в использовании интерфейс для настройки визуальных данных
- Предоставить веб-версию инструмента запросов SQL
- Предоставляет OpenID, LDAP, OAuth и другие методы аутентификации для легкой интеграции.
Основная функция Superset — отображать основные данные в виде интуитивно понятных визуальных диаграмм. Этот документ знакомит с конфигурацией источников данных и пользовательских данных визуализации. Установка Superset выходит за рамки этой статьи, в официальной документации есть руководство по установке в один клик на основе докера.
Чтобы наглядно представить, на что способен Суперсет, самый прямой способ — поместить картинки. Например, он может генерировать следующие диаграммы на основе данных.Вам нужно только настроить источник данных и генерировать визуальные диаграммы без написания строки кода. Фронтенду больше не приходится иметь дело с Echart, а бэкенд добавляет, удаляет, модифицирует и проверяет маленького принца и не пишет код.
Конечно, это только самое основное, а внизу столько прикольных графиков, которые настолько ужасают, что люди не могут сдержать дрожь. В настоящее время я использую в компании только некоторые базовые диаграммы и временно чувствую, что визуализация данных все еще соответствует потребностям проекта.Конфигурация источника данных
Предпосылка визуализации данных заключается в том, что должен быть источник данных, чтобы обеспечить его основными данными. В этом разделе описывается, как настроить надежные источники данных. Superset поддерживает несколько баз данных в качестве источников данных, таких как Oracle, MySQL, Postgres, MariaDB и т. д. В этом разделе в качестве примера используется Oracle.
Прошу меня простить, что все скриншоты ниже на китайском языке, а перевод местами немного корявый. Изначально система была на английском языке, но лидер попросил китайский.
Добавить базу данных
①Нажмите на источник данных, чтобы выбрать базу данных, и после входа на страницу щелкните зеленый значок + в правом верхнем углу, чтобы добавить новую базу данных.
②Заполните соответствующую информацию о конфигурации базы данных, щелкните тестовое соединение и появится сообщение OK! Указывает, что подключение к базе данных выполнено успешно.
Примечание. Установка флажка «Раскрыть в инструменте SQL» означает, что с базой данных разрешено работать в инструменте запросов SQL, предоставляемом Superset, проверьте его при необходимости.
Добавить лист данных
① Щелкните источник данных, чтобы выбрать таблицу данных, а затем щелкните знак + в правом верхнем углу, чтобы добавить новую таблицу данных после входа на страницу.
② В раскрывающемся списке выберите базу данных, которую вы только что настроили, и введите имя таблицы, которая существует в базе данных, нажмите «Сохранить».
③ Щелкните Редактировать таблицу и выберите некоторые атрибуты, которые будут использоваться в последующем анализе данных для каждого столбца на странице в списке столбцов.
Примечание. Группируемые и Фильтруемые проверяются по мере необходимости, указывая, следует ли поддерживать группировку и фильтрацию на основе этого столбца при последующем анализе данных. Атрибут времени поля времени должен быть проверен (обычно Superset проверяет столбец времени по умолчанию).
После вышеперечисленных операций мы предоставляем таблицу данных в качестве источника данных для последующих операций визуализации данных.
Добавить канбан
После настройки источника данных нам также необходимо добавить доску Канбан для сохранения визуальных диаграмм, которые мы создадим позже. Канбан-доску можно представить как папку для хранения серии связанных диаграмм.
①Нажмите «Канбан», войдите на страницу и нажмите знак «+» в правом верхнем углу, чтобы добавить новый «Канбан».
②Заполните имя доски и выберите владельца, нажмите Сохранить
После выполнения вышеуказанных операций мы добавили в систему табло «Индикатор живописных мест» для хранения сгенерированных впоследствии визуальных карт.
пользовательская визуализация
Теперь, когда все приготовления завершены, вы можете официально приступить к созданию визуализаций. Чтобы все развивалось гладко, сначала дайте информацию о структуре новой таблицы данных в предыдущем разделе:
Внимательно следите за полями приведенной выше таблицы, каждая запись в таблице представляет собой общее количество туристов, путешествующих определенным видом транспорта в определенном живописном месте в определенный день. Мы предполагаем, что задача визуализации этих данных состоит в том, чтобы отобразить в визуальной диаграмме схемы передвижения туристов в живописном месте под номером 201_1 на предыдущей неделе.Настройка диаграмм визуализации
Примечание. Несмотря на то, что Superset предоставляет простой в использовании интерфейс конфигурации для настройки диаграмм визуализации, для его работы все же может потребоваться, чтобы пользователи в некоторой степени были знакомы с простым синтаксисом SQL. Итак, если вы не знакомы с синтаксисом SQL, следующее содержимое может показаться вам немного сложным.
① Выберите таблицу данных для анализа
②Настройте диаграмму (в качестве примера возьмем круговую диаграмму) Нажмите на таблицу данных, чтобы перейти на страницу конфигурации. Обратите внимание, что наша цель состоит в том, чтобы отобразить схемы передвижения туристов в живописном месте под номером 201_1 на предыдущей неделе в виде визуальной диаграммы. Настройте параметры конфигурации следующим образом: Шаг 1: выберите тип диаграммы как круговая диаграмма
Шаг 2. Отфильтруйте данные за предыдущую неделю. Шаг 3. Отфильтруйте данные по живописному месту с номером 201_1. Шаг 4: Задайте условия группировки, здесь сгруппированы в соответствии с режимом движения.Шаг 5: Настройте показатели для анализа, здесь количество туристов. (сумма означает сумму количества людей в каждой группе)
Шаг 6: Установите ограничение на количество строк, вы можете оставить это поле пустым.Если вы хотите отображать данные только о 10 основных режимах движения, вы можете установить ограничение на количество строк в 10 Шаг 7: Нажмите кнопку «Выполнить запрос» в левом верхнем углу, чтобы просмотреть результаты рендеринга данных.сохранить визуализацию
С помощью вышеуказанных шагов теперь настроена диаграмма визуализации. Мы можем сохранить его. Как показано на рисунке: сохраните конфигурацию диаграммы и сохраните сгенерированную визуальную диаграмму на доске «Scenic Spot Indicators», настроенной на первом шаге.
Просмотрите полученную визуализацию
Нажмите на эти две записи, чтобы просмотреть только что сохраненную конфигурацию диаграммы и результирующую визуализацию.
Общая проблема
В приведенных выше разделах были полностью представлены этапы работы с диаграммой визуализации конфигурации Superset.В этом разделе перечислены некоторые распространенные проблемы, с которыми сталкиваются пользователи:
Q1: Может ли индикатор быть именем поля вместо агрегатной функции?
О: Это определяется разными типами диаграмм, вообще говоря, это агрегатная функция.
Q2: Разрешены ли запросы на объединение нескольких таблиц?
A: Superset не может напрямую использовать запрос объединения, он может искать данные только из одной таблицы. Но он обеспечивает концепцию представления, вы можете писать SQL представления и, наконец, выполнять операции запросов к одной таблице в представлении. Конфигурация представления показана на следующем рисунке:
1. Нажмите «Редактировать таблицу».
A: Анализ данных, предоставляемый Superset, основан на SQL.На этапе настройки диаграммы визуализации нажмите кнопку списка в правом верхнем углу, чтобы просмотреть фактический SQL, выполненный запросом, и исходные возвращенные данные. Проверьте наличие ошибок, просмотрев SQL и набор результатов.
Q4: Почему нет ответа после нажатия на запуск запроса после настройки диаграммы?
Эта ситуация указывает на проблему с SQL-запросом, сгенерированным системой на основе вашей конфигурации. Проблема может быть проверена в соответствии с Q3, и система предоставляет пользователям веб-версию инструмента запросов SQL для работы с базой данных.
Конфигурация общего типа диаграммы
Круговая диаграмма используется в качестве примера выше, чтобы показать конфигурацию визуальной диаграммы.В этом разделе приведены методы настройки обычных гистограмм и графиков временной шкалы. Надмножество позволяет использовать множество типов диаграмм, а остальные типы должны быть опробованы пользователем. Из-за нехватки места дана только конфигурация, а подробные шаги опущены.
Гистограмма
Цель: Отобразить схемы передвижения туристов накануне живописного места 201_1.
Диаграмма временной шкалы
Цель: Сравнить разные даты для каждого способа передвижения туристов в живописной местности 201_1.