Apache Superset использует совместное использование

визуализация данных

Введение в суперсет

Superset — это инкубационный веб-проект визуализации корпоративных данных, поддерживаемый Apache Software Foundation. Имеет следующие характеристики:

  • Включены богатые стили диаграмм данных
  • Поддерживает несколько источников данных (Oracle, MySQL, Postgres, MariaDB и т. д.)
  • Предоставляет простой в использовании интерфейс для настройки визуальных данных
  • Предоставить веб-версию инструмента запросов SQL
  • Предоставляет OpenID, LDAP, OAuth и другие методы аутентификации для легкой интеграции.

Основная функция Superset — отображать основные данные в виде интуитивно понятных визуальных диаграмм. Этот документ знакомит с конфигурацией источников данных и пользовательских данных визуализации. Установка Superset выходит за рамки этой статьи, в официальной документации есть руководство по установке в один клик на основе докера.

Чтобы наглядно представить, на что способен Суперсет, самый прямой способ — поместить картинки. Например, он может генерировать следующие диаграммы на основе данных.Вам нужно только настроить источник данных и генерировать визуальные диаграммы без написания строки кода. Фронтенду больше не приходится иметь дело с Echart, а бэкенд добавляет, удаляет, модифицирует и проверяет маленького принца и не пишет код.

Конечно, это только самое основное, а внизу столько прикольных графиков, которые настолько ужасают, что люди не могут сдержать дрожь. В настоящее время я использую в компании только некоторые базовые диаграммы и временно чувствую, что визуализация данных все еще соответствует потребностям проекта.

Конфигурация источника данных

Предпосылка визуализации данных заключается в том, что должен быть источник данных, чтобы обеспечить его основными данными. В этом разделе описывается, как настроить надежные источники данных. Superset поддерживает несколько баз данных в качестве источников данных, таких как Oracle, MySQL, Postgres, MariaDB и т. д. В этом разделе в качестве примера используется Oracle.

Прошу меня простить, что все скриншоты ниже на китайском языке, а перевод местами немного корявый. Изначально система была на английском языке, но лидер попросил китайский.

Добавить базу данных

①Нажмите на источник данных, чтобы выбрать базу данных, и после входа на страницу щелкните зеленый значок + в правом верхнем углу, чтобы добавить новую базу данных.

②Заполните соответствующую информацию о конфигурации базы данных, щелкните тестовое соединение и появится сообщение OK! Указывает, что подключение к базе данных выполнено успешно.

Примечание. Установка флажка «Раскрыть в инструменте SQL» означает, что с базой данных разрешено работать в инструменте запросов SQL, предоставляемом Superset, проверьте его при необходимости.

Добавить лист данных

① Щелкните источник данных, чтобы выбрать таблицу данных, а затем щелкните знак + в правом верхнем углу, чтобы добавить новую таблицу данных после входа на страницу.

② В раскрывающемся списке выберите базу данных, которую вы только что настроили, и введите имя таблицы, которая существует в базе данных, нажмите «Сохранить».

③ Щелкните Редактировать таблицу и выберите некоторые атрибуты, которые будут использоваться в последующем анализе данных для каждого столбца на странице в списке столбцов.

Примечание. Группируемые и Фильтруемые проверяются по мере необходимости, указывая, следует ли поддерживать группировку и фильтрацию на основе этого столбца при последующем анализе данных. Атрибут времени поля времени должен быть проверен (обычно Superset проверяет столбец времени по умолчанию).

После вышеперечисленных операций мы предоставляем таблицу данных в качестве источника данных для последующих операций визуализации данных.

Добавить канбан

После настройки источника данных нам также необходимо добавить доску Канбан для сохранения визуальных диаграмм, которые мы создадим позже. Канбан-доску можно представить как папку для хранения серии связанных диаграмм.

①Нажмите «Канбан», войдите на страницу и нажмите знак «+» в правом верхнем углу, чтобы добавить новый «Канбан».

②Заполните имя доски и выберите владельца, нажмите Сохранить

После выполнения вышеуказанных операций мы добавили в систему табло «Индикатор живописных мест» для хранения сгенерированных впоследствии визуальных карт.

пользовательская визуализация

Теперь, когда все приготовления завершены, вы можете официально приступить к созданию визуализаций. Чтобы все развивалось гладко, сначала дайте информацию о структуре новой таблицы данных в предыдущем разделе:

Внимательно следите за полями приведенной выше таблицы, каждая запись в таблице представляет собой общее количество туристов, путешествующих определенным видом транспорта в определенном живописном месте в определенный день. Мы предполагаем, что задача визуализации этих данных состоит в том, чтобы отобразить в визуальной диаграмме схемы передвижения туристов в живописном месте под номером 201_1 на предыдущей неделе.

Настройка диаграмм визуализации

Примечание. Несмотря на то, что Superset предоставляет простой в использовании интерфейс конфигурации для настройки диаграмм визуализации, для его работы все же может потребоваться, чтобы пользователи в некоторой степени были знакомы с простым синтаксисом SQL. Итак, если вы не знакомы с синтаксисом SQL, следующее содержимое может показаться вам немного сложным.

① Выберите таблицу данных для анализа

②Настройте диаграмму (в качестве примера возьмем круговую диаграмму) Нажмите на таблицу данных, чтобы перейти на страницу конфигурации. Обратите внимание, что наша цель состоит в том, чтобы отобразить схемы передвижения туристов в живописном месте под номером 201_1 на предыдущей неделе в виде визуальной диаграммы. Настройте параметры конфигурации следующим образом: Шаг 1: выберите тип диаграммы как круговая диаграмма

Шаг 2. Отфильтруйте данные за предыдущую неделю.

Шаг 3. Отфильтруйте данные по живописному месту с номером 201_1.

Шаг 4: Задайте условия группировки, здесь сгруппированы в соответствии с режимом движения.

Шаг 5: Настройте показатели для анализа, здесь количество туристов. (сумма означает сумму количества людей в каждой группе)

Шаг 6: Установите ограничение на количество строк, вы можете оставить это поле пустым.Если вы хотите отображать данные только о 10 основных режимах движения, вы можете установить ограничение на количество строк в 10

Шаг 7: Нажмите кнопку «Выполнить запрос» в левом верхнем углу, чтобы просмотреть результаты рендеринга данных.

сохранить визуализацию

С помощью вышеуказанных шагов теперь настроена диаграмма визуализации. Мы можем сохранить его. Как показано на рисунке: сохраните конфигурацию диаграммы и сохраните сгенерированную визуальную диаграмму на доске «Scenic Spot Indicators», настроенной на первом шаге.

Просмотрите полученную визуализацию

Нажмите на эти две записи, чтобы просмотреть только что сохраненную конфигурацию диаграммы и результирующую визуализацию.

Общая проблема

В приведенных выше разделах были полностью представлены этапы работы с диаграммой визуализации конфигурации Superset.В этом разделе перечислены некоторые распространенные проблемы, с которыми сталкиваются пользователи:

Q1: Может ли индикатор быть именем поля вместо агрегатной функции?
О: Это определяется разными типами диаграмм, вообще говоря, это агрегатная функция.

Q2: Разрешены ли запросы на объединение нескольких таблиц?
A: Superset не может напрямую использовать запрос объединения, он может искать данные только из одной таблицы. Но он обеспечивает концепцию представления, вы можете писать SQL представления и, наконец, выполнять операции запросов к одной таблице в представлении. Конфигурация представления показана на следующем рисунке:
1. Нажмите «Редактировать таблицу».

2. Напишите операторы SQL и используйте набор результатов SQL в качестве представления.

Q3: Как проверить правильность данных?
A: Анализ данных, предоставляемый Superset, основан на SQL.На этапе настройки диаграммы визуализации нажмите кнопку списка в правом верхнем углу, чтобы просмотреть фактический SQL, выполненный запросом, и исходные возвращенные данные. Проверьте наличие ошибок, просмотрев SQL и набор результатов.

Q4: Почему нет ответа после нажатия на запуск запроса после настройки диаграммы?
Эта ситуация указывает на проблему с SQL-запросом, сгенерированным системой на основе вашей конфигурации. Проблема может быть проверена в соответствии с Q3, и система предоставляет пользователям веб-версию инструмента запросов SQL для работы с базой данных.

Конфигурация общего типа диаграммы

Круговая диаграмма используется в качестве примера выше, чтобы показать конфигурацию визуальной диаграммы.В этом разделе приведены методы настройки обычных гистограмм и графиков временной шкалы. Надмножество позволяет использовать множество типов диаграмм, а остальные типы должны быть опробованы пользователем. Из-за нехватки места дана только конфигурация, а подробные шаги опущены.

Гистограмма

Цель: Отобразить схемы передвижения туристов накануне живописного места 201_1.

Диаграмма временной шкалы

Цель: Сравнить разные даты для каждого способа передвижения туристов в живописной местности 201_1.